Inteligência Artificial

Fugatto: Nvidia revela modelo de IA que pode modificar vozes e gerar novos sons

Publicado por
Isabella Caminoto

A Nvidia revelou nesta segunda-feira (25) um novo modelo de inteligência artificial (IA) para gerar música e áudio que pode modificar vozes e gerar novos sons – tecnologia destinada a produtores de música, filmes e videogames.

A Nvidia, maior fornecedora mundial de chips e software usados para criar sistemas de IA, disse que não tem planos imediatos de lançar publicamente a tecnologia, que chama de Fugatto, abreviação de Foundational Generative Audio Transformer Opus 1.

Ela se junta a outras tecnologias mostradas por startups como a Runway e grandes players como a Meta Platforms que podem gerar áudio ou vídeo a partir de um prompt de texto.

A Nvidia, com sede na Califórnia, gera efeitos sonoros e música a partir de uma descrição de texto, incluindo sons novos, como fazer um trompete latir como um cachorro.

O que a diferencia de outras tecnologias de IA é sua capacidade de receber e modificar áudio existente, por exemplo, pegando uma linha tocada em um piano e transformando-a em uma linha cantada por uma voz humana, ou pegando uma gravação de palavra falada e mudando o sotaque usado e o humor expresso.

“Se pensarmos no áudio sintético nos últimos 50 anos, a música soa diferente agora por causa dos computadores, por causa dos sintetizadores”, disse Bryan Catanzaro, vice-presidente de pesquisa de aprendizado profundo aplicado da Nvidia. “Acho que a IA generativa vai trazer novas capacidades para a música, para os videogames e para as pessoas comuns que querem criar coisas.”

Enquanto empresas como a OpenAI estão negociando com estúdios de Hollywood sobre se e como a IA pode ser usada na indústria do entretenimento, a relação entre tecnologia e Hollywood ficou tensa, especialmente depois que a estrela de Hollywood Scarlett Johansson acusou a OpenAI de imitar sua voz.

O novo modelo da Nvidia foi treinado em dados de código aberto, e a empresa disse que ainda está debatendo se e como lançá-lo publicamente.

“Qualquer tecnologia generativa sempre carrega alguns riscos, porque as pessoas podem usá-la para gerar coisas que preferiríamos que elas não gerassem”, disse Catanzaro. “Precisamos ter cuidado com isso, por isso não temos planos imediatos de lançar isso.”

Os criadores de modelos de IA generativa ainda não determinaram como prevenir o abuso da tecnologia, como um usuário gerando desinformação ou infringindo direitos autorais gerando personagens protegidos por direitos autorais.

A OpenAI e a Meta também não disseram quando planejam lançar publicamente seus modelos que geram áudio ou vídeo.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 17:53

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

IA aprende a imitar humanos através de longas conversas; saiba como

Pesquisadores da Stanford e do Google DeepMind acabaram de desenvolver agentes de inteligência artificial (IA)…

25 de novembro de 2024

Amazon dobra investimento na Anthropic

A Amazon acaba de anunciar um novo investimento de US$ 4 bilhões na startup de…

25 de novembro de 2024

Robô de IA encena rebelião em showroom; veja

Um pequeno robô alimentado por inteligência artificial (IA) chamado Erbai encenou um inesperado "sequestro" em…

25 de novembro de 2024

Black Forest Labs lança suíte de edição de imagens com IA

A BlackForestLabs acaba de revelar o FLUX.1 Tools, quatro novos recursos de manipulação de imagens…

24 de novembro de 2024

Gemini recupera o primeiro lugar no ranking de LLM

O mais recente modelo experimental Gemini da Google (1121) acabou de recuperar o primeiro lugar…

22 de novembro de 2024

OpenAI mira no Chrome com planos de desenvolver seu próprio navegador

A OpenAI está considerando desenvolver um navegador web que se integraria ao ChatGPT e aos…

22 de novembro de 2024