Google SoundStorm: בינה מלאכותית להפקת אודיו יעילה

SoundStorm יכול לסנתז דיאלוגים עם קולות שונים ולפתוח אפשרויות חדשות, כגון יצירת תוכן אודיו מטקסט ופודקאסטים מציאותיים.
בניגוד לקודמו, SoundStorm מייצר אודיו בנתחים של 30 שניות, מה שמגביר את היעילות.
הוא היה מְאוּמָן עם מערך נתונים גדול של דיאלוגים, המבטיח הבנה חזקה של השפה המדוברת.
SoundStorm מהיר פי שניים מהדגם הקודם, מסוגל לייצר 30 שניות של אודיו ב-0,5 שניות בלבד.
הכלי עדיין לא הגיע לקהל הרחב, אבל חוקרת המוצגים מראים כיצד בינה מלאכותית צריכה לעבוד.
האודיו שנוצר על ידי SoundStorm הוא באיכות שווה לדגם הקודם ושומר במדויק על קולו של הדובר.
חשוב לשקול בעיות אתיות אפשריות, כמו הטיות הקשורות להדגשות והתעללות בחיקוי קולות.
O Google מדגיש את החשיבות של יישום הגנות ומחקר דרכים לאיתור השימוש האתי בטכנולוגיה זו, כגון סימון מים אודיו.
האזן, באנגלית, לדוגמא של אודיו שנוצר על ידי SoundStorm: