Meta revela o maior modelo de IA do Llama 3; saiba mais

Publicado por

Vinicius Siqueira

23 de julho de 2024 14:35

Créditos de Imagem: Curto News/Bing Image Creator

A Meta Platforms lançou na terça-feira (23) a maior versão de seus modelos de inteligência artificial Llama 3, que são em grande parte gratuitos, destacando habilidades multilíngues e métricas de desempenho geral que rivalizam com modelos pagos de concorrentes como a OpenAI.

O novo modelo Llama 3 pode conversar em oito idiomas, escrever códigos de computador de maior qualidade e resolver problemas matemáticos mais complexos do que as versões anteriores, segundo a empresa-mãe do Facebook em postagens no blog e em um artigo de pesquisa que anunciou o lançamento.

Com 405 bilhões de parâmetros, ou variáveis que o algoritmo considera para gerar respostas às consultas dos usuários, o modelo é muito maior do que a versão anterior lançada no ano passado, embora ainda seja menor do que os modelos líderes oferecidos pelos concorrentes. O modelo GPT-4 da OpenAI, por contraste, tem um trilhão de parâmetros, e a Amazon está investindo em um modelo com 2 trilhões de parâmetros.

O lançamento ocorre enquanto as empresas de tecnologia estão correndo para mostrar que seus portfólios crescentes de modelos de linguagem grandes e que consomem muitos recursos podem oferecer ganhos significativos em áreas problemáticas conhecidas, como o raciocínio avançado, para justificar as enormes somas investidas neles.

Além do seu modelo principal de 405 bilhões de parâmetros, a Meta também está lançando versões atualizadas de seus modelos Llama 3 de 8 bilhões e 70 bilhões de parâmetros, introduzidos inicialmente na primavera, disse a empresa. Todos os três novos modelos são multilíngues e podem lidar com solicitações de usuários maiores por meio de uma “janela de contexto” expandida, que, segundo Ahmad Al-Dahle, chefe de IA generativa da Meta, melhorará a experiência de geração de código de computador em particular.

“Esse foi o feedback número um que recebemos da comunidade”, disse Al-Dahle em uma entrevista, observando que janelas de contexto maiores fornecem aos modelos algo semelhante a uma memória mais longa que auxilia no processamento de solicitações de várias etapas.

A Meta disponibiliza seus modelos Llama amplamente gratuitos para uso por desenvolvedores, uma estratégia que o CEO Mark Zuckerberg diz que compensará na forma de produtos inovadores e maior engajamento nas redes sociais principais da empresa. No entanto, alguns investidores levantaram preocupações sobre os custos envolvidos.

A empresa também pode se beneficiar se os desenvolvedores optarem por usar seus modelos gratuitos em vez dos pagos, o que poderia prejudicar os modelos de negócios de seus concorrentes. Com seu anúncio, a Meta destacou ganhos em testes importantes de matemática e conhecimento que podem tornar essa perspectiva mais atraente.

Embora o progresso no desenvolvimento de IA seja notoriamente difícil de medir, os resultados dos testes fornecidos pela Meta parecem sugerir que seu maior modelo Llama 3 está quase igualando e, em alguns casos, superando o Claude 3.5 Sonnet da Anthropic e o GPT-4o da OpenAI, que são amplamente considerados os dois modelos de ponta mais poderosos do mercado.

No benchmark MATH, que avalia problemas matemáticos de nível competitivo, o modelo da Meta obteve uma pontuação de 73,8, em comparação com 76,6 do GPT-4o e 71,1 do Claude 3.5 Sonnet. O modelo obteve 88,6 no MMLU, um benchmark que cobre várias disciplinas, incluindo matemática, ciência e humanidades, enquanto o GPT-4o obteve 88,7 e o Claude 3.5 Sonnet obteve 88,3.

Em seu artigo, os pesquisadores da Meta também mencionaram versões “multimodais” futuras dos modelos que serão lançadas ainda este ano, que adicionarão capacidades de imagem, vídeo e fala ao modelo de texto Llama 3. Experimentos iniciais indicam que esses modelos podem ter um desempenho “competitivo” com outros modelos multimodais, como o Gemini 1.5 do Google e o Claude 3.5 Sonnet da Anthropic, disseram.

Leia também:

Elon Musk e xAI anunciam supercomputador mais poderoso do mundo

Este post foi modificado pela última vez em %s = human-readable time difference 14:35

Vinicius Siqueira