Google SoundStorm: inteligência artificial para geração eficiente de áudio

O Google apresentou o SoundStorm, uma inovação em inteligência artificial para geração eficiente de áudio.

Publicado por
Uesley Durães
  • O SoundStorm pode sintetizar diálogos com diferentes vozes e abrir novas possibilidades, como criação de conteúdo de áudio a partir de texto e podcasts realistas.
  • Ao contrário do seu antecessor, o SoundStorm gera áudio em blocos de 30 segundos, o que aumenta a eficiência.
  • Ele foi treinado com um grande conjunto de dados de diálogos, garantindo uma compreensão robusta da linguagem falada.
  • O SoundStorm é duas vezes mais rápido que o modelo anterior, podendo gerar 30 segundos de áudio em apenas 0,5 segundo.
  • A ferramenta ainda não chegou ao público geral, mas as pesquisas apresentadas mostram como a IA deve funcionar.
  • O áudio gerado pelo SoundStorm tem qualidade equivalente ao modelo anterior e preserva a voz do locutor com precisão.
  • É importante considerar possíveis problemas éticos, como vieses relacionados a sotaques e abusos na imitação de vozes.
  • O Google destaca a importância de implementar proteções e estuda formas de detectar o uso ético dessa tecnologia, como marca d’água de áudio.
  • Ouça, em inglês, um exemplo de áudio gerado pelo SoundStorm:

Veja também:

Este post foi modificado pela última vez em 30 de maio de 2023 15:15

Uesley Durães

Posts recentes

GitHub apresenta Copilot Workspace: Um ambiente de desenvolvimento com IA

O GitHub acaba de lançar o Copilot Workspace, uma nova ferramenta baseada em inteligência artificial…

1 de maio de 2024

ChatGPT em apuros: OpenAI é processada por falhas na detecção de informações falsas

O ChatGPT, chatbot desenvolvido pela OpenAI em parceria com a Microsoft, está sob investigação por…

1 de maio de 2024

Amazon lança Q, assistente de IA para empresas e desenvolvedores

A Amazon acaba de anunciar a disponibilidade do Q, seu assistente corporativo baseado em inteligência…

1 de maio de 2024

Google apresenta Med-Gemini: IA especializada para o setor da saúde

O Google acaba de anunciar o Med-Gemini, um conjunto de modelos de inteligência artificial (IA)…

1 de maio de 2024

Jornais dos EUA processam a OpenAI e a Microsoft por violação de direitos autorais

Um grupo de oito jornais dos Estados Unidos está processando a OpenAI - fabricante do…

1 de maio de 2024

ANÁLISE| Blackout tecnológico: Acabou o fôlego da ‘Corrida por IA’?

Em um texto publicado no dia 17 de abril na Bloomberg, Rene Haas, CEO da…

30 de abril de 2024