[gtranslate]

Meta lança LLaMa-2, um modelo de linguagem de grande escala que promete ser tão bom quanto o GPT

A Meta lançou nesta terça (18) o LLaMa-2-Chat, um modelo de linguagem de grande escala (LLM) projetado para ser amigável ao uso comercial. O LLaMa-2-Chat é o primeiro modelo de seu tamanho a ser ajustado usando o RLHF (Reinforcement Learning from Human Feedback). O modelo está disponível para download gratuitamente no site oficial da Meta.

Publicado por
Uesley Durães

O LLaMa-2-Chat é um modelo de linguagem de grande escala que é tão bom quanto o GPT-3.5 em certos tipos de tarefas. Ele também é eficiente em problemas matemáticos. 

Uma das vantagens do LLaMa-2 é que ele pode ser usado para criar chatbots sem a necessidade de compartilhar dados com a OpenAI, do ChatGPT. Isso significa que os desenvolvedores e pesquisadores podem usar o poder do LLaMa-2-Chat sem ter que se preocupar com a privacidade de seus dados.

LLaMa-2 pode ser usado para diversas tarefas

O modelo de linguagem ainda está em desenvolvimento, mas o modelo já pode ser baixado a partir do site oficial. O modelo tem o potencial de ser usado para uma variedade de tarefas, incluindo geração de texto, tradução de idiomas, escrita de diferentes tipos de conteúdo criativo e respostas às suas perguntas de forma informativa.

“O Llama 2 foi pré-treinado em fontes de dados on-line disponíveis publicamente. O modelo ajustado, Llama-2-chat, utiliza conjuntos de dados de instrução disponíveis publicamente e mais de 1 milhão de anotações humanas”, narra o comunicado oficial.

Confira alguns destaques apontados pela Meta para o modelo:

  • Comercial: O LLaMa-2-Chat é projetado para ser usado por empresas, o que significa que é fácil de instalar e usar.
  • Pré-treinado em tokens 2T: O LLaMa-2-Chat foi treinado em um enorme conjunto de dados de texto, o que significa que pode gerar texto de alta qualidade.
  • Escores fortes de MMLU (calculo sobre o quão boa a ferramenta é em responder perguntas): O Llama é bom em entender e responder às perguntas dos usuários.
  • Contexto: O LLaMa-2-Chat pode entender o contexto de uma conversa e gerar respostas relevantes.
  • Extensíveis: O LLaMa-2-Chat pode aprender e se adaptar ao feedback humano, o que o torna ideal para tarefas de pesquisa e desenvolvimento.
  • Codificação de desempenho: O modelo não é tão bom em codificar como outros modelos de linguagem, mas ainda pode ser usado para tarefas simples.
  • Versões de bate-papo: O LLaMa-2-Chat pode ser usado para criar chatbots que podem se comunicar com os humanos de maneira natural.

Veja também:

Este post foi modificado pela última vez em 18 de julho de 2023 17:25

Uesley Durães

Posts recentes

Copa do Mundo 2026 aposta em IA para proteger jogadores de ataques online

A Copa do Mundo de 2026, que será realizada nos Estados Unidos, Canadá e México,…

6 de junho de 2026

Trump assina ordem executiva para revisar IA antes do lançamento e reacende debate sobre regulação nos EUA

O presidente dos Estados Unidos, Donald Trump, assinou nesta terça-feira (2) uma nova ordem executiva…

3 de junho de 2026

IA na saúde mental herda preconceitos humanos — e pesquisadores alertam para riscos invisíveis

A rápida expansão da inteligência artificial (IA) na saúde mental vem sendo tratada como uma…

28 de maio de 2026

Estudo de Stanford expõe viés racial em ferramentas de IA usadas para contratação

A promessa de neutralidade da inteligência artificial (IA) no mercado de trabalho acaba de sofrer…

27 de maio de 2026

Papa Leão XIV lança manifesto histórico sobre IA e alerta: “Nenhum algoritmo pode substituir a humanidade”

A inteligência artificial (IA) acaba de entrar oficialmente no centro do debate moral da Igreja…

26 de maio de 2026

Google resolve nove problemas matemáticos inéditos com IA e acelera corrida por descobertas científicas

A disputa entre gigantes da inteligência artificial (IA) acaba de atingir um novo patamar —…

25 de maio de 2026