Spotify patenteia tecnologia de síntese de voz

O Spotify entrou no último dia 20 de julho com um pedido de patente para uma nova tecnologia que permite a síntese de voz realista a partir de texto.

Publicado por

Uesley Durães

25 de julho de 2023 10:32

De acordo com o documento enviado ao Escritório de Marcas e Patentes dos Estados Unidos (USPTO), a tecnologia de inteligência artificial utiliza um sistema de dois modelos que primeiro converte o texto em uma representação de áudio e, em seguida, adiciona atributos de fala, como emoção, intenção, sotaque e projeção.

A tecnologia tem o potencial de ser usada em uma variedade de aplicações, incluindo audiolivros, podcasts e até mesmo jogos. No entanto, também é importante estar ciente dos potenciais riscos dessa tecnologia.

A patente do Spotify é um passo importante no desenvolvimento da tecnologia de síntese de voz. Com o desenvolvimento de tecnologias como essa, é possível que a voz humana seja gerada de forma cada vez mais realista e indistinguível da voz humana real. Isso pode impulsionar todo um mercado e despertar muitas discussões sobre os problemas envolvidos.

A tecnologia do Spotify também tem o potencial de ser usada em aplicações mais controversas, como a criação de deep fakes. Os deep fakes são vídeos ou áudios que foram manipulados para fazer com que alguém pareça dizer ou fazer algo que nunca disse ou fez. Essa tecnologia pode ser usada para espalhar desinformação ou para difamar pessoas.

A ferramenta foi bolada por uma equipe de cientistas e engenheiros da empresa. O sistema funciona alimentando o texto em um sintetizador construído com uma rede de previsão de IA configurada para converter o texto em dados de fala. Em seguida, esses dados de fala são alimentados a um Vocoder baseado em rede neural, ou outro sintetizador construído especificamente para dados vocais, que adiciona atributos de fala veiculados no texto inicial, como emoção, intenção, projeção, ritmo e sotaque, ao criar o dito discurso.

Spotify patenteia tecnologia de síntese de voz | esquema do projeto do Spotify (imagem tirada do documento enviado pelo Spotify)

A tecnologia do Spotify ainda está em desenvolvimento, mas a empresa tem planos de utilizá-la em seus produtos e serviços. Por exemplo, a tecnologia poderia ser usada para criar audiolivros personalizados para cada usuário, ou para gerar podcasts que sejam mais envolventes e interessantes para os ouvintes.

Veja também:

O que é uma IA ‘Speech to Text’? | Glossário do Newsverso

Uma inteligência artificial “Speech to Text” é uma tecnologia que permite a conversão automática e precisa da fala humana em texto escrito.

Web3 Sound arrecada US$ 20 milhões para impulsionar a indústria musical descentralizada, Snoop Dogg está entre investidores

A plataforma de música Web3 Sound levantou um impressionante financiamento de US$ 20 milhões. A iniciativa foi liderada pela renomada empresa de capital de risco Andreessen Horowitz (a16z) e pelo rapper norte-americano Snoop Dogg.

Este post foi modificado pela última vez em 25 de julho de 2023 10:32

Uesley Durães

Próximo ChatGPT já pode ser baixado em aparelhos Android »

Anterior « Delação traz novas informações sobre os assassinatos de Marielle Franco e Anderson Gomes; veja no Curto Flash

Publicado por

Uesley Durães

Tags: inteligência artificialspotify

25 de julho de 2023 10:32

Posts recentes

Inteligência Artificial

PwC se tornará o maior cliente corporativo da OpenAI em meio ao boom da IA; entenda

A PwC se tornará o maior cliente e o primeiro revendedor do produto empresarial da…

30 de maio de 2024

Inteligência Artificial

Regulador de dados da UE diz que gigantes da tecnologia estão cooperando para cumprir as regras de IA

As principais empresas de internet do mundo estão se engajando extensivamente com os reguladores da…

29 de maio de 2024

🤖 guIA

Afforai: Sumarização de documentos e pesquisa otimizada com IA

Afforai é uma plataforma online para a sumarização de documentos, pesquisa e tradução de documentos…

29 de maio de 2024

Inteligência Artificial

Meta identifica redes usando conteúdo enganoso possivelmente gerado por IA

A Meta informou na quarta-feira (29) que encontrou conteúdo "provavelmente gerado por IA" usado de…

29 de maio de 2024

Inteligência Artificial

Arm oferece novos designs e software para IA em smartphones

A Arm Holdings revelou nesta quarta-feira (29) novos projetos de chips e ferramentas de software…

29 de maio de 2024

Inteligência Artificial

Valor de mercado da Nvidia chega mais perto da Apple; entenda

As ações da Nvidia subiram cerca de 6% para atingir um recorde histórico na terça-feira…

29 de maio de 2024

Spotify patenteia tecnologia de síntese de voz

Posts relacionados

Posts recentes

PwC se tornará o maior cliente corporativo da OpenAI em meio ao boom da IA; entenda

Regulador de dados da UE diz que gigantes da tecnologia estão cooperando para cumprir as regras de IA

Afforai: Sumarização de documentos e pesquisa otimizada com IA

Meta identifica redes usando conteúdo enganoso possivelmente gerado por IA

Arm oferece novos designs e software para IA em smartphones

Valor de mercado da Nvidia chega mais perto da Apple; entenda