Inteligência Artificial

Audiobox: A nova IA da Meta capaz de clonar vozes

A Meta, empresa controladora do Facebook, anunciou na última segunda-feira (11), o lançamento do Audiobox, uma ferramenta de inteligência artificial (IA) capaz de clonar vozes e reproduzir efeitos sonoros a partir de prompt de texto.

Publicado por
Vinicius Siqueira

O Audiobox utiliza uma tecnologia de aprendizado auto-supervisionado para gerar efeitos sonoros a partir de comandos de texto. A ferramenta, no entanto, chegou ao mercado com uma série de restrições.

As inteligências artificiais cada vez mais se aprofundam no desenvolvimento de ferramentas capazes de replicar estilos vocais, incluindo timbre, sotaque, maneirismos, tom, pronúncias e outras particularidades. Dessa forma, o Audiobox foi apresentado pelo laboratório de desenvolvimento de IA da Meta como um “modelo de pesquisa para criação de áudio”.

O Audiobox permite a geração de efeitos sonoros combinando entradas de voz e prompts de texto. Portanto, a ferramenta permite aos usuários digitar frases ou descrever sons para serem gerados, além de possibilitar a clonagem de vozes por meio de gravações.

A IA utiliza aprendizado auto-supervisionado (SSL), permitindo que algoritmos gerem rótulos para dados não rotulados. E para seu funcionamento a Meta criou modelos separados para imitação de fala, efeitos sonoros e geração de sons ambiente.

Ressalvas da plataforma

Por enquanto, o Audiobox foi lançado apenas para fins de pesquisa e não pode ser usado comercialmente, além de ser restrito a usuários fora dos estados de Illinois e Texas (EUA), por conta das leis locais. 

Além disso, o desenvolvimento da plataforma dependeu de grandes quantidades de dados de áudio, incluindo fala, música e amostras sonoras de várias fontes e em diferentes idiomas. Dessa forma, não foi especificado pela empresa se os dados utilizados eram de domínio público, o que levanta diversos questionamentos sobre o uso de informações protegidas sem consentimento.

A empresa também não abriu mais detalhes sobre a ampla disponibilização da ferramenta ao público, considerando que o mesmo não foi lançado em código aberto.

Leia também:

Este post foi modificado pela última vez em 13 de dezembro de 2023 12:51

Vinicius Siqueira

Posts recentes

Regulador de dados da UE diz que gigantes da tecnologia estão cooperando para cumprir as regras de IA

As principais empresas de internet do mundo estão se engajando extensivamente com os reguladores da…

29 de maio de 2024

Afforai: Sumarização de documentos e pesquisa otimizada com IA

Afforai é uma plataforma online para a sumarização de documentos, pesquisa e tradução de documentos…

29 de maio de 2024

Meta identifica redes usando conteúdo enganoso possivelmente gerado por IA

A Meta informou na quarta-feira (29) que encontrou conteúdo "provavelmente gerado por IA" usado de…

29 de maio de 2024

Arm oferece novos designs e software para IA em smartphones

A Arm Holdings revelou nesta quarta-feira (29) novos projetos de chips e ferramentas de software…

29 de maio de 2024

Valor de mercado da Nvidia chega mais perto da Apple; entenda

As ações da Nvidia subiram cerca de 6% para atingir um recorde histórico na terça-feira…

29 de maio de 2024

OpenAI assina acordos de conteúdo com The Atlantic e Vox Media

A OpenAI disse nesta quarta-feira (29) que assinou acordos de licenciamento com The Atlantic e…

29 de maio de 2024