- SoundStorm יכול לסנתז דיאלוגים עם קולות שונים ולפתוח אפשרויות חדשות, כגון יצירת תוכן אודיו מטקסט ופודקאסטים מציאותיים.
- בניגוד לקודמו, SoundStorm מייצר אודיו בנתחים של 30 שניות, מה שמגביר את היעילות.
- הוא היה מְאוּמָן עם מערך נתונים גדול של דיאלוגים, המבטיח הבנה חזקה של השפה המדוברת.
- SoundStorm מהיר פי שניים מהדגם הקודם, מסוגל לייצר 30 שניות של אודיו ב-0,5 שניות בלבד.
- הכלי עדיין לא הגיע לקהל הרחב, אבל חוקרת המוצגים מראים כיצד בינה מלאכותית צריכה לעבוד.
- האודיו שנוצר על ידי SoundStorm הוא באיכות שווה לדגם הקודם ושומר במדויק על קולו של הדובר.
- חשוב לשקול בעיות אתיות אפשריות, כמו הטיות הקשורות להדגשות והתעללות בחיקוי קולות.
- O Google מדגיש את החשיבות של יישום הגנות ומחקר דרכים לאיתור השימוש האתי בטכנולוגיה זו, כגון סימון מים אודיו.
- האזן, באנגלית, לדוגמא של אודיו שנוצר על ידי SoundStorm:
ראה גם: