- SoundStorm สามารถสังเคราะห์บทสนทนาด้วยเสียงต่างๆ และเปิดโอกาสใหม่ๆ เช่น การสร้างเนื้อหาเสียงจากข้อความและพอดแคสต์ที่สมจริง
- SoundStorm ต่างจากรุ่นก่อนตรงที่สร้างเสียงเป็นช่วง 30 วินาที ซึ่งจะช่วยเพิ่มประสิทธิภาพ
- เขาเป็น ผ่านการอบรม ด้วยชุดข้อมูลบทสนทนาขนาดใหญ่ ทำให้มั่นใจได้ถึงความเข้าใจภาษาพูดที่แข็งแกร่ง
- SoundStorm เร็วกว่ารุ่นก่อนหน้าถึงสองเท่า โดยสามารถสร้างเสียง 30 วินาทีในเวลาเพียง 0,5 วินาที
- เครื่องมือดังกล่าวยังไม่เข้าถึงประชาชนทั่วไปแต่ งานวิจัย นำเสนอว่า AI ควรทำงานอย่างไร
- เสียงที่สร้างโดย SoundStorm มีคุณภาพเทียบเท่ากับรุ่นก่อนหน้าและรักษาเสียงของผู้พูดได้อย่างแม่นยำ
- สิ่งสำคัญคือต้องพิจารณาปัญหาด้านจริยธรรมที่อาจเกิดขึ้น เช่น อคติที่เกี่ยวข้องกับสำเนียงและการใช้เสียงเลียนแบบในทางที่ผิด
- O Google เน้นย้ำถึงความสำคัญของการดำเนินการป้องกันและศึกษาวิธีการตรวจจับการใช้เทคโนโลยีนี้อย่างมีจริยธรรม เช่น ลายน้ำเสียง
- ฟังตัวอย่างเสียงที่สร้างโดย SoundStorm เป็นภาษาอังกฤษ:
ดูเพิ่มเติมที่: