Spotify patenteia tecnologia de síntese de voz

O Spotify entrou no último dia 20 de julho com um pedido de patente para uma nova tecnologia que permite a síntese de voz realista a partir de texto.

Publicado por
Uesley Durães

De acordo com o documento enviado ao Escritório de Marcas e Patentes dos Estados Unidos (USPTO), a tecnologia de inteligência artificial utiliza um sistema de dois modelos que primeiro converte o texto em uma representação de áudio e, em seguida, adiciona atributos de fala, como emoção, intenção, sotaque e projeção.

A tecnologia tem o potencial de ser usada em uma variedade de aplicações, incluindo audiolivros, podcasts e até mesmo jogos. No entanto, também é importante estar ciente dos potenciais riscos dessa tecnologia.

A patente do Spotify é um passo importante no desenvolvimento da tecnologia de síntese de voz. Com o desenvolvimento de tecnologias como essa, é possível que a voz humana seja gerada de forma cada vez mais realista e indistinguível da voz humana real. Isso pode impulsionar todo um mercado e despertar muitas discussões sobre os problemas envolvidos. 

A tecnologia do Spotify também tem o potencial de ser usada em aplicações mais controversas, como a criação de deep fakes. Os deep fakes são vídeos ou áudios que foram manipulados para fazer com que alguém pareça dizer ou fazer algo que nunca disse ou fez. Essa tecnologia pode ser usada para espalhar desinformação ou para difamar pessoas.

A ferramenta foi bolada por uma equipe de cientistas e engenheiros da empresa. O sistema funciona alimentando o texto em um sintetizador construído com uma rede de previsão de IA configurada para converter o texto em dados de fala. Em seguida, esses dados de fala são alimentados a um Vocoder baseado em rede neural, ou outro sintetizador construído especificamente para dados vocais, que adiciona atributos de fala veiculados no texto inicial, como emoção, intenção, projeção, ritmo e sotaque, ao criar o dito discurso.

Spotify patenteia tecnologia de síntese de voz | esquema do projeto do Spotify (imagem tirada do documento enviado pelo Spotify)

A tecnologia do Spotify ainda está em desenvolvimento, mas a empresa tem planos de utilizá-la em seus produtos e serviços. Por exemplo, a tecnologia poderia ser usada para criar audiolivros personalizados para cada usuário, ou para gerar podcasts que sejam mais envolventes e interessantes para os ouvintes.

Veja também:

Este post foi modificado pela última vez em 25 de julho de 2023 10:32

Uesley Durães

Posts recentes

ADNOC dos Emirados Árabes Unidos irá implantar IA autônoma no setor de energia; veja

A gigante de energia dos Emirados Árabes Unidos, ADNOC, aplicará inteligência artificial (IA) altamente autônoma…

4 de novembro de 2024

Claude ganha novas capacidades de visão de PDF

A Anthropic acabou de lançar o suporte a PDF para seu modelo Claude 3.5 Sonnet…

4 de novembro de 2024

Google integra controles para casa inteligente no Gemini

O Google está adicionando uma extensão do Google Home ao aplicativo Gemini, permitindo que você…

3 de novembro de 2024

Walt Disney forma unidade de negócios para coordenar o uso de IA e realidade aumentada

A Walt Disney está formando um novo grupo para coordenar o uso da empresa de…

1 de novembro de 2024

HOVER: Modelo de IA compacto domina o controle de humanoides

A Nvidia acaba de publicar uma nova pesquisa apresentando o HOVER, uma pequena rede neural…

1 de novembro de 2024

O ChatGPT agora é um mecanismo de busca com IA

O ChatGPT agora é oficialmente um mecanismo de busca com inteligência artificial (IA). A empresa…

31 de outubro de 2024