[gtranslate]

Inteligência Artificial

Meta revela o maior modelo de IA do Llama 3; saiba mais

Publicado por
Vinicius Siqueira

A Meta Platforms lançou na terça-feira (23) a maior versão de seus modelos de inteligência artificial Llama 3, que são em grande parte gratuitos, destacando habilidades multilíngues e métricas de desempenho geral que rivalizam com modelos pagos de concorrentes como a OpenAI.

O novo modelo Llama 3 pode conversar em oito idiomas, escrever códigos de computador de maior qualidade e resolver problemas matemáticos mais complexos do que as versões anteriores, segundo a empresa-mãe do Facebook em postagens no blog e em um artigo de pesquisa que anunciou o lançamento.

Com 405 bilhões de parâmetros, ou variáveis que o algoritmo considera para gerar respostas às consultas dos usuários, o modelo é muito maior do que a versão anterior lançada no ano passado, embora ainda seja menor do que os modelos líderes oferecidos pelos concorrentes. O modelo GPT-4 da OpenAI, por contraste, tem um trilhão de parâmetros, e a Amazon está investindo em um modelo com 2 trilhões de parâmetros.

O lançamento ocorre enquanto as empresas de tecnologia estão correndo para mostrar que seus portfólios crescentes de modelos de linguagem grandes e que consomem muitos recursos podem oferecer ganhos significativos em áreas problemáticas conhecidas, como o raciocínio avançado, para justificar as enormes somas investidas neles.

Além do seu modelo principal de 405 bilhões de parâmetros, a Meta também está lançando versões atualizadas de seus modelos Llama 3 de 8 bilhões e 70 bilhões de parâmetros, introduzidos inicialmente na primavera, disse a empresa. Todos os três novos modelos são multilíngues e podem lidar com solicitações de usuários maiores por meio de uma “janela de contexto” expandida, que, segundo Ahmad Al-Dahle, chefe de IA generativa da Meta, melhorará a experiência de geração de código de computador em particular.

“Esse foi o feedback número um que recebemos da comunidade”, disse Al-Dahle em uma entrevista, observando que janelas de contexto maiores fornecem aos modelos algo semelhante a uma memória mais longa que auxilia no processamento de solicitações de várias etapas.

A Meta disponibiliza seus modelos Llama amplamente gratuitos para uso por desenvolvedores, uma estratégia que o CEO Mark Zuckerberg diz que compensará na forma de produtos inovadores e maior engajamento nas redes sociais principais da empresa. No entanto, alguns investidores levantaram preocupações sobre os custos envolvidos.

A empresa também pode se beneficiar se os desenvolvedores optarem por usar seus modelos gratuitos em vez dos pagos, o que poderia prejudicar os modelos de negócios de seus concorrentes. Com seu anúncio, a Meta destacou ganhos em testes importantes de matemática e conhecimento que podem tornar essa perspectiva mais atraente.

Embora o progresso no desenvolvimento de IA seja notoriamente difícil de medir, os resultados dos testes fornecidos pela Meta parecem sugerir que seu maior modelo Llama 3 está quase igualando e, em alguns casos, superando o Claude 3.5 Sonnet da Anthropic e o GPT-4o da OpenAI, que são amplamente considerados os dois modelos de ponta mais poderosos do mercado.

No benchmark MATH, que avalia problemas matemáticos de nível competitivo, o modelo da Meta obteve uma pontuação de 73,8, em comparação com 76,6 do GPT-4o e 71,1 do Claude 3.5 Sonnet. O modelo obteve 88,6 no MMLU, um benchmark que cobre várias disciplinas, incluindo matemática, ciência e humanidades, enquanto o GPT-4o obteve 88,7 e o Claude 3.5 Sonnet obteve 88,3.

Em seu artigo, os pesquisadores da Meta também mencionaram versões “multimodais” futuras dos modelos que serão lançadas ainda este ano, que adicionarão capacidades de imagem, vídeo e fala ao modelo de texto Llama 3. Experimentos iniciais indicam que esses modelos podem ter um desempenho “competitivo” com outros modelos multimodais, como o Gemini 1.5 do Google e o Claude 3.5 Sonnet da Anthropic, disseram.

Leia também:

Este post foi modificado pela última vez em 23 de julho de 2024 14:35

Vinicius Siqueira

Posts recentes

OpenAI ajuda a desvendar doenças raras infantis e dá nova esperança a casos sem diagnóstico

Um dos maiores desafios da medicina moderna está nos chamados "casos sem resposta": pacientes que…

23 de junho de 2026

Argentina quer criar empresas comandadas por IA — e acende debate global sobre responsabilidade e poder

A Argentina deu um passo inédito na corrida global pela inteligência artificial (IA). O governo…

22 de junho de 2026

Data centers no espaço? Musk revela plano para levar a IA à órbita terrestre

A corrida global pela inteligência artificial (IA) acaba de ganhar uma nova fronteira: o espaço.…

14 de junho de 2026

Metade dos norte-americanos teme perder o emprego para a IA — e a ansiedade só aumenta

A inteligência artificial (IA) já deixou de ser uma promessa tecnológica distante para se tornar…

13 de junho de 2026

IA supera professores de Direito em estudo de Stanford e acende debate sobre o futuro da educação jurídica; confira

A inteligência artificial (IA) acaba de alcançar mais um marco simbólico na educação superior. Um…

9 de junho de 2026

IA tem custo ambiental maior do que se imaginava, alerta relatório da ONU

A inteligência artificial (IA) está transformando setores inteiros da economia, impulsionando avanços em saúde, educação,…

9 de junho de 2026