Meta revela o maior modelo de IA do Llama 3; saiba mais

Publicado por

Vinicius Siqueira

23 de julho de 2024 14:35

Créditos de Imagem: Curto News/Bing Image Creator

A Meta Platforms lançou na terça-feira (23) a maior versão de seus modelos de inteligência artificial Llama 3, que são em grande parte gratuitos, destacando habilidades multilíngues e métricas de desempenho geral que rivalizam com modelos pagos de concorrentes como a OpenAI.

O novo modelo Llama 3 pode conversar em oito idiomas, escrever códigos de computador de maior qualidade e resolver problemas matemáticos mais complexos do que as versões anteriores, segundo a empresa-mãe do Facebook em postagens no blog e em um artigo de pesquisa que anunciou o lançamento.

Com 405 bilhões de parâmetros, ou variáveis que o algoritmo considera para gerar respostas às consultas dos usuários, o modelo é muito maior do que a versão anterior lançada no ano passado, embora ainda seja menor do que os modelos líderes oferecidos pelos concorrentes. O modelo GPT-4 da OpenAI, por contraste, tem um trilhão de parâmetros, e a Amazon está investindo em um modelo com 2 trilhões de parâmetros.

O lançamento ocorre enquanto as empresas de tecnologia estão correndo para mostrar que seus portfólios crescentes de modelos de linguagem grandes e que consomem muitos recursos podem oferecer ganhos significativos em áreas problemáticas conhecidas, como o raciocínio avançado, para justificar as enormes somas investidas neles.

Além do seu modelo principal de 405 bilhões de parâmetros, a Meta também está lançando versões atualizadas de seus modelos Llama 3 de 8 bilhões e 70 bilhões de parâmetros, introduzidos inicialmente na primavera, disse a empresa. Todos os três novos modelos são multilíngues e podem lidar com solicitações de usuários maiores por meio de uma “janela de contexto” expandida, que, segundo Ahmad Al-Dahle, chefe de IA generativa da Meta, melhorará a experiência de geração de código de computador em particular.

“Esse foi o feedback número um que recebemos da comunidade”, disse Al-Dahle em uma entrevista, observando que janelas de contexto maiores fornecem aos modelos algo semelhante a uma memória mais longa que auxilia no processamento de solicitações de várias etapas.

A Meta disponibiliza seus modelos Llama amplamente gratuitos para uso por desenvolvedores, uma estratégia que o CEO Mark Zuckerberg diz que compensará na forma de produtos inovadores e maior engajamento nas redes sociais principais da empresa. No entanto, alguns investidores levantaram preocupações sobre os custos envolvidos.

A empresa também pode se beneficiar se os desenvolvedores optarem por usar seus modelos gratuitos em vez dos pagos, o que poderia prejudicar os modelos de negócios de seus concorrentes. Com seu anúncio, a Meta destacou ganhos em testes importantes de matemática e conhecimento que podem tornar essa perspectiva mais atraente.

Embora o progresso no desenvolvimento de IA seja notoriamente difícil de medir, os resultados dos testes fornecidos pela Meta parecem sugerir que seu maior modelo Llama 3 está quase igualando e, em alguns casos, superando o Claude 3.5 Sonnet da Anthropic e o GPT-4o da OpenAI, que são amplamente considerados os dois modelos de ponta mais poderosos do mercado.

No benchmark MATH, que avalia problemas matemáticos de nível competitivo, o modelo da Meta obteve uma pontuação de 73,8, em comparação com 76,6 do GPT-4o e 71,1 do Claude 3.5 Sonnet. O modelo obteve 88,6 no MMLU, um benchmark que cobre várias disciplinas, incluindo matemática, ciência e humanidades, enquanto o GPT-4o obteve 88,7 e o Claude 3.5 Sonnet obteve 88,3.

Em seu artigo, os pesquisadores da Meta também mencionaram versões “multimodais” futuras dos modelos que serão lançadas ainda este ano, que adicionarão capacidades de imagem, vídeo e fala ao modelo de texto Llama 3. Experimentos iniciais indicam que esses modelos podem ter um desempenho “competitivo” com outros modelos multimodais, como o Gemini 1.5 do Google e o Claude 3.5 Sonnet da Anthropic, disseram.

Leia também:

Elon Musk e xAI anunciam supercomputador mais poderoso do mundo

Este post foi modificado pela última vez em 23 de julho de 2024 14:35

Vinicius Siqueira

Próximo Apple pode lançar iPhone dobrável já em 2026 »

Anterior « Elon Musk e xAI anunciam supercomputador mais poderoso do mundo

Publicado por

Vinicius Siqueira

Tags: IA generativainteligência artificialLlama 3Mark ZuckerbergMeta

23 de julho de 2024 14:35

Posts recentes

Inteligência Artificial

IA promete eficiência na saúde, mas Harvard alerta para risco de desumanização do cuidado

A inteligência artificial (IA) já começa a transformar hospitais, consultórios e sistemas de saúde, assumindo…

10 de julho de 2026

Inteligência Artificial

GPT-5.6: OpenAI apresenta sua IA mais poderosa, mas restringe acesso a poucos parceiros

A OpenAI apresentou oficialmente o GPT-5.6, sua mais nova geração de modelos de inteligência artificial…

29 de junho de 2026

Inteligência Artificial

OpenAI entra na guerra dos chips e desafia Nvidia e Google na corrida pela infraestrutura da IA; conheça o Jalapeño

A OpenAI deu um passo que pode redefinir o equilíbrio de poder no setor de…

25 de junho de 2026

Inteligência Artificial

OpenAI ajuda a desvendar doenças raras infantis e dá nova esperança a casos sem diagnóstico

Um dos maiores desafios da medicina moderna está nos chamados "casos sem resposta": pacientes que…

23 de junho de 2026

Inteligência Artificial

Argentina quer criar empresas comandadas por IA — e acende debate global sobre responsabilidade e poder

A Argentina deu um passo inédito na corrida global pela inteligência artificial (IA). O governo…

22 de junho de 2026

Inteligência Artificial

Data centers no espaço? Musk revela plano para levar a IA à órbita terrestre

A corrida global pela inteligência artificial (IA) acaba de ganhar uma nova fronteira: o espaço.…

14 de junho de 2026

Meta revela o maior modelo de IA do Llama 3; saiba mais

Posts relacionados

Posts recentes

IA promete eficiência na saúde, mas Harvard alerta para risco de desumanização do cuidado

GPT-5.6: OpenAI apresenta sua IA mais poderosa, mas restringe acesso a poucos parceiros

OpenAI entra na guerra dos chips e desafia Nvidia e Google na corrida pela infraestrutura da IA; conheça o Jalapeño

OpenAI ajuda a desvendar doenças raras infantis e dá nova esperança a casos sem diagnóstico

Argentina quer criar empresas comandadas por IA — e acende debate global sobre responsabilidade e poder

Data centers no espaço? Musk revela plano para levar a IA à órbita terrestre