Google SoundStorm: inteligência artificial para geração eficiente de áudio

O Google apresentou o SoundStorm, uma inovação em inteligência artificial para geração eficiente de áudio.

Publicado por
Uesley Durães
  • O SoundStorm pode sintetizar diálogos com diferentes vozes e abrir novas possibilidades, como criação de conteúdo de áudio a partir de texto e podcasts realistas.
  • Ao contrário do seu antecessor, o SoundStorm gera áudio em blocos de 30 segundos, o que aumenta a eficiência.
  • Ele foi treinado com um grande conjunto de dados de diálogos, garantindo uma compreensão robusta da linguagem falada.
  • O SoundStorm é duas vezes mais rápido que o modelo anterior, podendo gerar 30 segundos de áudio em apenas 0,5 segundo.
  • A ferramenta ainda não chegou ao público geral, mas as pesquisas apresentadas mostram como a IA deve funcionar.
  • O áudio gerado pelo SoundStorm tem qualidade equivalente ao modelo anterior e preserva a voz do locutor com precisão.
  • É importante considerar possíveis problemas éticos, como vieses relacionados a sotaques e abusos na imitação de vozes.
  • O Google destaca a importância de implementar proteções e estuda formas de detectar o uso ético dessa tecnologia, como marca d’água de áudio.
  • Ouça, em inglês, um exemplo de áudio gerado pelo SoundStorm:

Veja também:

Este post foi modificado pela última vez em %s = human-readable time difference 15:15

Uesley Durães

Posts recentes

Gemini recupera o primeiro lugar no ranking de LLM

O mais recente modelo experimental Gemini da Google (1121) acabou de recuperar o primeiro lugar…

22 de novembro de 2024

OpenAI mira no Chrome com planos de desenvolver seu próprio navegador

A OpenAI está considerando desenvolver um navegador web que se integraria ao ChatGPT e aos…

22 de novembro de 2024

DeepMind dá um salto gigante na computação quântica com o AlphaQubit

O Google DeepMind acaba de apresentar o AlphaQubit, um sistema de inteligência artificial (IA) que…

21 de novembro de 2024

ChatGPT está mais perto de lançar sua IA visual

Um código recém-descoberto na última versão beta do ChatGPT sugere que a OpenAI pode estar…

21 de novembro de 2024

DeepSeek revela poderosa IA de raciocínio; veja

A empresa chinesa de pesquisa em inteligência artificial (IA), DeepSeek, acaba de lançar o R1-Lite-Preview,…

21 de novembro de 2024

OpenAI lança curso gratuito de IA para professores

A OpenAI e a parceira sem fins lucrativos Common Sense Media lançaram um curso de…

20 de novembro de 2024