Meta lança LLaMa-2, um modelo de linguagem de grande escala que promete ser tão bom quanto o GPT

A Meta lançou nesta terça (18) o LLaMa-2-Chat, um modelo de linguagem de grande escala (LLM) projetado para ser amigável ao uso comercial. O LLaMa-2-Chat é o primeiro modelo de seu tamanho a ser ajustado usando o RLHF (Reinforcement Learning from Human Feedback). O modelo está disponível para download gratuitamente no site oficial da Meta.

Publicado por
Uesley Durães

O LLaMa-2-Chat é um modelo de linguagem de grande escala que é tão bom quanto o GPT-3.5 em certos tipos de tarefas. Ele também é eficiente em problemas matemáticos. 

Uma das vantagens do LLaMa-2 é que ele pode ser usado para criar chatbots sem a necessidade de compartilhar dados com a OpenAI, do ChatGPT. Isso significa que os desenvolvedores e pesquisadores podem usar o poder do LLaMa-2-Chat sem ter que se preocupar com a privacidade de seus dados.

LLaMa-2 pode ser usado para diversas tarefas

O modelo de linguagem ainda está em desenvolvimento, mas o modelo já pode ser baixado a partir do site oficial. O modelo tem o potencial de ser usado para uma variedade de tarefas, incluindo geração de texto, tradução de idiomas, escrita de diferentes tipos de conteúdo criativo e respostas às suas perguntas de forma informativa.

“O Llama 2 foi pré-treinado em fontes de dados on-line disponíveis publicamente. O modelo ajustado, Llama-2-chat, utiliza conjuntos de dados de instrução disponíveis publicamente e mais de 1 milhão de anotações humanas”, narra o comunicado oficial.

Confira alguns destaques apontados pela Meta para o modelo:

  • Comercial: O LLaMa-2-Chat é projetado para ser usado por empresas, o que significa que é fácil de instalar e usar.
  • Pré-treinado em tokens 2T: O LLaMa-2-Chat foi treinado em um enorme conjunto de dados de texto, o que significa que pode gerar texto de alta qualidade.
  • Escores fortes de MMLU (calculo sobre o quão boa a ferramenta é em responder perguntas): O Llama é bom em entender e responder às perguntas dos usuários.
  • Contexto: O LLaMa-2-Chat pode entender o contexto de uma conversa e gerar respostas relevantes.
  • Extensíveis: O LLaMa-2-Chat pode aprender e se adaptar ao feedback humano, o que o torna ideal para tarefas de pesquisa e desenvolvimento.
  • Codificação de desempenho: O modelo não é tão bom em codificar como outros modelos de linguagem, mas ainda pode ser usado para tarefas simples.
  • Versões de bate-papo: O LLaMa-2-Chat pode ser usado para criar chatbots que podem se comunicar com os humanos de maneira natural.

Veja também:

Este post foi modificado pela última vez em 18 de julho de 2023 17:25

Uesley Durães

Posts recentes

Meta inicia testes de chatbots de IA criados por usuários no Instagram

Mark Zuckerberg, CEO da Meta, anunciou que a empresa vai começar a liberar no Instagram…

29 de junho de 2024

Watson: Saiba mais sobre o analista de dados com IA da IBM

Watson é uma plataforma de IA desenvolvida pela IBM, conhecida por sua capacidade de treinar,…

29 de junho de 2024

Centro de Jornalismo Investigativo processa OpenAI e Microsoft por violação de direitos autorais

O Centro de Jornalismo Investigativo (CJI), organização sem fins lucrativos responsável pelo Mother Jones e…

28 de junho de 2024

Gigantes da tecnologia na mira da Europa: acordos de IA de Microsoft e Google sob investigação

A parceria da Microsoft com a OpenAI e o acordo de inteligência artificial (IA) do…

28 de junho de 2024

EUA, Japão e Coreia do Sul se unem em cooperação estratégica para IA, energia limpa e semicondutores

Os ministros do comércio e da indústria dos EUA, Japão e Coreia do Sul prometeram…

28 de junho de 2024

Nokia se prepara para a Era da IA com aquisição da Infinera

A tentativa da Nokia de comprar a fabricante americana de equipamentos de redes ópticas Infinera…

28 de junho de 2024