Spotify patentoi puhesynteesiteknologian

Spotify jätti 20. heinäkuuta patenttihakemuksen uudesta tekniikasta, joka mahdollistaa realistisen puhesynteesin tekstistä.

Mukaan asiakirja Yhdysvaltain patentti- ja tavaramerkkivirastolle (USPTO) toimitettu tekoälyteknologia käyttää kahden mallin järjestelmää, joka ensin muuntaa tekstin ääniesitykseen ja lisää sitten puheen attribuutteja, kuten tunteita, tarkoitusta, aksenttia ja projektiota.

MAINONTA

Teknologiaa voidaan käyttää monissa sovelluksissa, mukaan lukien äänikirjoissa, podcasteissa ja jopa peleissä. On kuitenkin myös tärkeää olla tietoinen tämän tekniikan mahdollisista riskeistä.

Spotifyn patentti on tärkeä askel puhesynteesitekniikan kehityksessä. Tällaisten teknologioiden kehittyessä on mahdollista, että ihmisääntä syntyy yhä realistisemmalla ja todellisesta ihmisäänestä erottamattomalla tavalla. Tämä voi edistää kokonaisia ​​markkinoita ja herättää monia keskusteluja asiaan liittyvistä ongelmista. 

Spotifyn tekniikkaa voidaan käyttää myös kiistanalaisemmissa sovelluksissa, kuten syvällisten väärennösten luomisessa. Syväväärennökset ovat videoita tai ääniä, joita on manipuloitu saamaan joku näyttämään sanovan tai tekevän jotain, mitä hän ei ole koskaan sanonut tai tehnyt. Tätä tekniikkaa voidaan käyttää väärän tiedon levittämiseen tai ihmisten herjaamiseen.

MAINONTA

Työkalun loi yrityksen tutkijoista ja insinööreistä koostuva ryhmä. Järjestelmä toimii syöttämällä tekstiä syntetisaattoriin, joka on rakennettu tekoälyn ennustusverkolla, joka on määritetty muuttamaan tekstiä puhedataksi. Tämä puhedata syötetään sitten hermoverkkopohjaiseen Vocoderiin tai muuhun erityisesti äänidataa varten rakennettuun syntetisaattoriin, joka lisää alkuperäisessä tekstissä välitetyt puheattribuutit, kuten tunteen, tarkoituksen, projektion, rytmin ja aksenttia luodessaan puhetta.

Spotify patentoi puhesynteesiteknologian | Spotify-projektikaavio (kuva otettu Spotifyn lähettämästä asiakirjasta)

Spotifyn teknologia on vielä kehitysvaiheessa, mutta yhtiö aikoo käyttää sitä tuotteissaan ja palveluissaan. Teknologiaa voitaisiin käyttää esimerkiksi luomaan yksilöllisiä äänikirjoja jokaiselle käyttäjälle tai luomaan podcasteja, jotka ovat kuuntelijoille kiinnostavampia ja kiinnostavampia.

Veja também:

* Tämän artikkelin teksti on osittain luotu tekoälytyökaluilla, uusimmilla kielimalleilla, jotka auttavat tekstien valmistelussa, tarkistamisessa, kääntämisessä ja yhteenvedossa. Tekstimerkinnät loi Curto Tekoälytyökalujen uutisia ja vastauksia käytettiin parantamaan lopullista sisältöä.
On tärkeää korostaa, että tekoälytyökalut ovat vain työkaluja, ja lopullinen vastuu julkaistusta sisällöstä on Curto Uutiset. Käyttämällä näitä työkaluja vastuullisesti ja eettisesti tavoitteenamme on laajentaa viestintämahdollisuuksia ja demokratisoida laadukkaan tiedon saatavuutta.
🤖

MAINONTA

Selaa ylöspäin