Google SoundStorm: בינה מלאכותית להפקת אודיו יעילה

O Google הציג את SoundStorm, חידוש בבינה מלאכותית ליצירת אודיו יעילה.

  • SoundStorm יכול לסנתז דיאלוגים עם קולות שונים ולפתוח אפשרויות חדשות, כגון יצירת תוכן אודיו מטקסט ופודקאסטים מציאותיים.
  • בניגוד לקודמו, SoundStorm מייצר אודיו בנתחים של 30 שניות, מה שמגביר את היעילות.
  • הוא היה מְאוּמָן עם מערך נתונים גדול של דיאלוגים, המבטיח הבנה חזקה של השפה המדוברת.
  • SoundStorm מהיר פי שניים מהדגם הקודם, מסוגל לייצר 30 שניות של אודיו ב-0,5 שניות בלבד.
  • הכלי עדיין לא הגיע לקהל הרחב, אבל חוקרת המוצגים מראים כיצד בינה מלאכותית צריכה לעבוד.
  • האודיו שנוצר על ידי SoundStorm הוא באיכות שווה לדגם הקודם ושומר במדויק על קולו של הדובר.
  • חשוב לשקול בעיות אתיות אפשריות, כמו הטיות הקשורות להדגשות והתעללות בחיקוי קולות.
  • O Google מדגיש את החשיבות של יישום הגנות ומחקר דרכים לאיתור השימוש האתי בטכנולוגיה זו, כגון סימון מים אודיו.
  • האזן, באנגלית, לדוגמא של אודיו שנוצר על ידי SoundStorm:

ראה גם:

לגלול מעלה