Google SoundStorm: ปัญญาประดิษฐ์สำหรับการสร้างเสียงที่มีประสิทธิภาพ

SoundStorm สามารถสังเคราะห์บทสนทนาด้วยเสียงต่างๆ และเปิดโอกาสใหม่ๆ เช่น การสร้างเนื้อหาเสียงจากข้อความและพอดแคสต์ที่สมจริง
SoundStorm ต่างจากรุ่นก่อนตรงที่สร้างเสียงเป็นช่วง 30 วินาที ซึ่งจะช่วยเพิ่มประสิทธิภาพ
เขาเป็น ผ่านการอบรม ด้วยชุดข้อมูลบทสนทนาขนาดใหญ่ ทำให้มั่นใจได้ถึงความเข้าใจภาษาพูดที่แข็งแกร่ง
SoundStorm เร็วกว่ารุ่นก่อนหน้าถึงสองเท่า โดยสามารถสร้างเสียง 30 วินาทีในเวลาเพียง 0,5 วินาที
เครื่องมือดังกล่าวยังไม่เข้าถึงประชาชนทั่วไปแต่ งานวิจัย นำเสนอว่า AI ควรทำงานอย่างไร
เสียงที่สร้างโดย SoundStorm มีคุณภาพเทียบเท่ากับรุ่นก่อนหน้าและรักษาเสียงของผู้พูดได้อย่างแม่นยำ
สิ่งสำคัญคือต้องพิจารณาปัญหาด้านจริยธรรมที่อาจเกิดขึ้น เช่น อคติที่เกี่ยวข้องกับสำเนียงและการใช้เสียงเลียนแบบในทางที่ผิด
O Google เน้นย้ำถึงความสำคัญของการดำเนินการป้องกันและศึกษาวิธีการตรวจจับการใช้เทคโนโลยีนี้อย่างมีจริยธรรม เช่น ลายน้ำเสียง
ฟังตัวอย่างเสียงที่สร้างโดย SoundStorm เป็นภาษาอังกฤษ: