Google SoundStorm: inteligência artificial para geração eficiente de áudio

O Google apresentou o SoundStorm, uma inovação em inteligência artificial para geração eficiente de áudio.

Publicado por
Uesley Durães
  • O SoundStorm pode sintetizar diálogos com diferentes vozes e abrir novas possibilidades, como criação de conteúdo de áudio a partir de texto e podcasts realistas.
  • Ao contrário do seu antecessor, o SoundStorm gera áudio em blocos de 30 segundos, o que aumenta a eficiência.
  • Ele foi treinado com um grande conjunto de dados de diálogos, garantindo uma compreensão robusta da linguagem falada.
  • O SoundStorm é duas vezes mais rápido que o modelo anterior, podendo gerar 30 segundos de áudio em apenas 0,5 segundo.
  • A ferramenta ainda não chegou ao público geral, mas as pesquisas apresentadas mostram como a IA deve funcionar.
  • O áudio gerado pelo SoundStorm tem qualidade equivalente ao modelo anterior e preserva a voz do locutor com precisão.
  • É importante considerar possíveis problemas éticos, como vieses relacionados a sotaques e abusos na imitação de vozes.
  • O Google destaca a importância de implementar proteções e estuda formas de detectar o uso ético dessa tecnologia, como marca d’água de áudio.
  • Ouça, em inglês, um exemplo de áudio gerado pelo SoundStorm:

Veja também:

Este post foi modificado pela última vez em %s = human-readable time difference 15:15

Uesley Durães

Posts recentes

Google se associa à Apptronik para desenvolver robôs humanoides

O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…

20 de dezembro de 2024

Genesis: Um novo patamar para simulações físicas em IA

Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…

20 de dezembro de 2024

Google lança seu próprio modelo de IA de “raciocínio”

O Google acabou de lançar o que está chamando de um novo modelo de inteligência…

19 de dezembro de 2024

GitHub Copilot agora é gratuito

A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…

19 de dezembro de 2024

ChatGPT ganha um novo número de telefone; veja

A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…

19 de dezembro de 2024

Google lança novo benchmark para testar a factualidade de LLMs

O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…

18 de dezembro de 2024