O grupo de Pesquisa Fundamental em IA (FAIR) da Meta acaba de publicar uma série de novos modelos e técnicas de inteligência artificial (IA) open-source, incluindo soluções para tarefas de linguagem multimodal, conversão de texto em música e áudio, detecção de fala sintética e muito mais.
PUBLICIDADE
Conheça os detalhes
- Chameleon: Revelada em maio, essa família de modelos de linguagem (com 7B e 34B parâmetros) é capaz de processar inputs combinados de imagem, áudio e texto.
- JASCO: O novo modelo de conversão de texto em música controlável da Meta permite que o usuário ajuste parâmetros para guiar a geração musical.
- AudioSeal: Trata-se do primeiro modelo de marca d’água para áudio, especificamente projetado para detectar fala gerada por IA. O AudioSeal será lançado sob licença comercial.
- Modelo de Predição Multi-Token: Esse modelo da Meta visa aprimorar o autocompletar de código ao prever vários tokens simultaneamente, aumentando a velocidade e as capacidades.
Por que isso importa
A Meta acaba de liberar um tesouro de novos recursos open-source, impulsionando o avanço da pesquisa em todo o campo da IA. A detecção de áudio gerado por IA, possibilitada pelo AudioSeal, merece atenção especial, pois a indústria enfrenta dificuldades para identificar com fidedignidade outros tipos de conteúdo sintético, como texto e imagens.
Leia também: