Google SoundStorm: ปัญญาประดิษฐ์สำหรับการสร้างเสียงที่มีประสิทธิภาพ

O Google เปิดตัว SoundStorm นวัตกรรมปัญญาประดิษฐ์เพื่อการสร้างเสียงที่มีประสิทธิภาพ

  • SoundStorm สามารถสังเคราะห์บทสนทนาด้วยเสียงต่างๆ และเปิดโอกาสใหม่ๆ เช่น การสร้างเนื้อหาเสียงจากข้อความและพอดแคสต์ที่สมจริง
  • SoundStorm ต่างจากรุ่นก่อนตรงที่สร้างเสียงเป็นช่วง 30 วินาที ซึ่งจะช่วยเพิ่มประสิทธิภาพ
  • เขาเป็น ผ่านการอบรม ด้วยชุดข้อมูลบทสนทนาขนาดใหญ่ ทำให้มั่นใจได้ถึงความเข้าใจภาษาพูดที่แข็งแกร่ง
  • SoundStorm เร็วกว่ารุ่นก่อนหน้าถึงสองเท่า โดยสามารถสร้างเสียง 30 วินาทีในเวลาเพียง 0,5 วินาที
  • เครื่องมือดังกล่าวยังไม่เข้าถึงประชาชนทั่วไปแต่ งานวิจัย นำเสนอว่า AI ควรทำงานอย่างไร
  • เสียงที่สร้างโดย SoundStorm มีคุณภาพเทียบเท่ากับรุ่นก่อนหน้าและรักษาเสียงของผู้พูดได้อย่างแม่นยำ
  • สิ่งสำคัญคือต้องพิจารณาปัญหาด้านจริยธรรมที่อาจเกิดขึ้น เช่น อคติที่เกี่ยวข้องกับสำเนียงและการใช้เสียงเลียนแบบในทางที่ผิด
  • O Google เน้นย้ำถึงความสำคัญของการดำเนินการป้องกันและศึกษาวิธีการตรวจจับการใช้เทคโนโลยีนี้อย่างมีจริยธรรม เช่น ลายน้ำเสียง
  • ฟังตัวอย่างเสียงที่สร้างโดย SoundStorm เป็นภาษาอังกฤษ:

ดูเพิ่มเติมที่:

เลื่อนขึ้น