Meta lança arsenal de IA open-source: Novos modelos e técnicas para criadores e pesquisadores

O grupo de Pesquisa Fundamental em IA (FAIR) da Meta acaba de publicar uma série de novos modelos e técnicas de inteligência artificial (IA) open-source, incluindo soluções para tarefas de linguagem multimodal, conversão de texto em música e áudio, detecção de fala sintética e muito mais.

Conheça os detalhes

Chameleon: Revelada em maio, essa família de modelos de linguagem (com 7B e 34B parâmetros) é capaz de processar inputs combinados de imagem, áudio e texto.
JASCO: O novo modelo de conversão de texto em música controlável da Meta permite que o usuário ajuste parâmetros para guiar a geração musical.
AudioSeal: Trata-se do primeiro modelo de marca d’água para áudio, especificamente projetado para detectar fala gerada por IA. O AudioSeal será lançado sob licença comercial.
Modelo de Predição Multi-Token: Esse modelo da Meta visa aprimorar o autocompletar de código ao prever vários tokens simultaneamente, aumentando a velocidade e as capacidades.

Por que isso importa

A Meta acaba de liberar um tesouro de novos recursos open-source, impulsionando o avanço da pesquisa em todo o campo da IA. A detecção de áudio gerado por IA, possibilitada pelo AudioSeal, merece atenção especial, pois a indústria enfrenta dificuldades para identificar com fidedignidade outros tipos de conteúdo sintético, como texto e imagens.

Leia também:

V2A: Google DeepMind cria som para vídeos