Google СоундСторм: вештачка интелигенција за ефикасно генерисање звука

СоундСторм може синтетизовати дијалоге са различитим гласовима и отворити нове могућности, као што је креирање аудио садржаја од текста и реалистичних подцаста.
За разлику од свог претходника, СоундСторм генерише звук у деловима од 30 секунди, што повећава ефикасност.
Он је био обучени са великим скупом података дијалога, обезбеђујући робусно разумевање говорног језика.
СоундСторм је двоструко бржи од претходног модела, способан да генерише 30 секунди звука за само 0,5 секунди.
Алат још није стигао до шире јавности, али истраживања представљени показују како АИ треба да ради.
Звук који генерише СоундСторм је еквивалентног квалитета као претходни модел и прецизно чува глас говорника.
Важно је размотрити могуће етичке проблеме, као што су пристрасности у вези са акцентима и злоупотребе у имитирању гласова.
O Google наглашава важност имплементације заштите и проучава начине за откривање етичке употребе ове технологије, као што је звучни водени жиг.
Слушајте, на енглеском, пример звука који је генерисао СоундСторм: