Google SoundStorm. արհեստական ինտելեկտը արդյունավետ աուդիո արտադրության համար

SoundStorm-ը կարող է սինթեզել երկխոսություններ տարբեր ձայների հետ և բացել նոր հնարավորություններ, ինչպիսիք են տեքստից աուդիո բովանդակություն ստեղծելը և իրատեսական փոդքասթերը:
Ի տարբերություն իր նախորդի՝ SoundStorm-ն աուդիո է ստեղծում 30 վայրկյանանոց հատվածներում, ինչը մեծացնում է արդյունավետությունը:
Նա եղել է վերապատրաստված երկխոսությունների մեծ շտեմարանով, որն ապահովում է խոսակցական լեզվի կայուն ըմբռնումը:
SoundStorm-ը երկու անգամ ավելի արագ է, քան նախորդ մոդելը, որը կարող է 30 վայրկյան ձայն ստեղծել ընդամենը 0,5 վայրկյանում:
Գործիքը դեռ լայն հանրությանը չի հասել, բայց հետազոտություններ ներկայացված ցույց է տալիս, թե ինչպես պետք է աշխատի AI-ն:
SoundStorm-ի կողմից ստեղծված աուդիոն նախորդ մոդելին համարժեք որակ ունի և ճշգրտորեն պահպանում է բարձրախոսի ձայնը:
Կարևոր է դիտարկել հնարավոր էթիկական խնդիրները, ինչպիսիք են շեշտադրումների հետ կապված կողմնակալությունը և ձայնը նմանակելու չարաշահումները:
O Google ընդգծում է պաշտպանության միջոցների ներդրման կարևորությունը և ուսումնասիրում է այս տեխնոլոգիայի էթիկական կիրառումը հայտնաբերելու ուղիները, ինչպիսիք են աուդիո ջրանիշը:
Անգլերեն լսեք SoundStorm-ի կողմից ստեղծված աուդիոյի օրինակ.