- SoundStorm-ը կարող է սինթեզել երկխոսություններ տարբեր ձայների հետ և բացել նոր հնարավորություններ, ինչպիսիք են տեքստից աուդիո բովանդակություն ստեղծելը և իրատեսական փոդքասթերը:
- Ի տարբերություն իր նախորդի՝ SoundStorm-ն աուդիո է ստեղծում 30 վայրկյանանոց հատվածներում, ինչը մեծացնում է արդյունավետությունը:
- Նա եղել է վերապատրաստված երկխոսությունների մեծ շտեմարանով, որն ապահովում է խոսակցական լեզվի կայուն ըմբռնումը:
- SoundStorm-ը երկու անգամ ավելի արագ է, քան նախորդ մոդելը, որը կարող է 30 վայրկյան ձայն ստեղծել ընդամենը 0,5 վայրկյանում:
- Գործիքը դեռ լայն հանրությանը չի հասել, բայց հետազոտություններ ներկայացված ցույց է տալիս, թե ինչպես պետք է աշխատի AI-ն:
- SoundStorm-ի կողմից ստեղծված աուդիոն նախորդ մոդելին համարժեք որակ ունի և ճշգրտորեն պահպանում է բարձրախոսի ձայնը:
- Կարևոր է դիտարկել հնարավոր էթիկական խնդիրները, ինչպիսիք են շեշտադրումների հետ կապված կողմնակալությունը և ձայնը նմանակելու չարաշահումները:
- O Google ընդգծում է պաշտպանության միջոցների ներդրման կարևորությունը և ուսումնասիրում է այս տեխնոլոգիայի էթիկական կիրառումը հայտնաբերելու ուղիները, ինչպիսիք են աուդիո ջրանիշը:
- Անգլերեն լսեք SoundStorm-ի կողմից ստեղծված աուդիոյի օրինակ.
Տես նաև.