Google SoundStorm: tekoäly tehokkaaseen äänentuotantoon

SoundStorm voi syntetisoida dialogeja eri äänillä ja avata uusia mahdollisuuksia, kuten luoda äänisisältöä tekstistä ja realistisia podcasteja.
Toisin kuin edeltäjänsä, SoundStorm tuottaa äänen 30 sekunnin paloina, mikä lisää tehokkuutta.
Hän oli koulutettu suurella tietojoukolla dialogeja, mikä varmistaa puhutun kielen vankan ymmärtämisen.
SoundStorm on kaksi kertaa nopeampi kuin edellinen malli, ja se pystyy tuottamaan 30 sekuntia ääntä vain 0,5 sekunnissa.
Työkalu ei ole vielä saavuttanut suuren yleisön, mutta tutkimuksia esitellään kuinka tekoälyn pitäisi toimia.
SoundStormin tuottama ääni on laadultaan edellistä mallia vastaavaa ja säilyttää kaiuttimen äänen tarkasti.
On tärkeää ottaa huomioon mahdolliset eettiset ongelmat, kuten aksentteihin liittyvät ennakkoluulot ja väärinkäytökset äänten jäljittelyssä.
O Google korostaa suojausten toteuttamisen tärkeyttä ja tutkii tapoja havaita tämän tekniikan eettinen käyttö, kuten äänivesileima.
Kuuntele englanniksi esimerkki SoundStormin luomasta äänestä: