Conheça o LLaMA 2 e o que difere o modelo de linguagem de outros já lançados

A Meta anunciou nesta semana o lançamento do LLaMA 2, um grande modelo de linguagem de código aberto. O LLaMA 2 é treinado em um enorme conjunto de dados de texto e código. A empresa de Mark Zuckerberg pretende fazer frente a OpenAI com o lançamento. Entenda as diferenças.

Publicado por
Uesley Durães

De forma geral, o LLaMA pode gerar texto, traduzir idiomas, escrever diferentes tipos de conteúdo criativo e responder perguntas de forma informativa.

O LLaMA 2 foi treinado com 40% mais dados do que o LLaMA 1, e supera outros LLMs como Falcon e MPT quando se trata de testes de raciocínio, codificação, proficiência e conhecimento. 

Para Ricardo Bindi, pesquisador com formação em Ciências Moleculares e Neurociências, o Llama 2 supera outros modelos de linguagem de código aberto em muitos benchmarks externos, incluindo raciocínio, codificação, proficiência e testes de conhecimento. 

O modelo ajustado ao usuário direto, o Llama-2-chat, aproveita conjuntos de dados instrucionais disponíveis publicamente e mais de 1 milhão de anotações humanas.

Para quem deseja usar o modelo em outros projetos, com a API, o código aberto do LLaMA 2 está disponível na plataforma Azure da Microsoft, e também através da AWS, Hugging Face e outros provedores. 

De acordo com a Meta, foram enviados mais de 100 mil pedidos de pesquisadores para usar seu primeiro modelo, no entanto, há a expectativa que o LLaMA 2 de código aberto supere o número.

Como funciona o LLaMA 2?

O LLaMA 2 é um modelo de linguagem factual de grande escala, o que significa que ele é treinado em um enorme conjunto de dados de texto e código. Esse conjunto de dados inclui livros, artigos, códigos e outras formas de texto. 

O modelo é capaz de aprender as relações entre as palavras e os conceitos presentes no conjunto de dados, o que lhe permite gerar texto, traduzir idiomas, escrever diferentes tipos de conteúdo criativo e responder perguntas de forma informativa.

Meta lança LLaMa-2, um modelo de linguagem de grande escala que promete ser tão bom quanto o GPT

O que o LLaMA 2 pode fazer?

Baseado no informativo de imprensa da Meta, o modelo pode fazer uma série de coisas, incluindo:

  • Gerar texto: O LLaMA 2 pode gerar texto que é factualmente preciso e coeso. Ele pode ser usado para gerar diferentes tipos de texto, como artigos, e-mail, cartas, etc.
  • Traduzir idiomas: O LLaMA 2 pode traduzir idiomas de forma precisa e fluida. Ele pode ser usado para traduzir textos, sites, e-mail, etc.
  • Escrever diferentes tipos de conteúdo criativo: O LLaMA 2 pode escrever diferentes tipos de conteúdo criativo, como poemas, código, scripts, peças musicais, e-mail, cartas, etc.
  • Responder às suas perguntas de forma informativa: O LLaMA 2 pode responder às suas perguntas de forma abrangente e informativa, mesmo que sejam abertas, desafiadoras ou estranhas.

Como usar?

O LLaMA 2 é um modelo de código aberto, o que significa que está disponível para qualquer pessoa usar. Você pode usar o LLaMA 2 através da plataforma Azure da Microsoft, ou através de outros provedores como a AWS e a Hugging Face.

O objetivo da Meta oferecendo a ferramenta para desenvolvedores até a partir de plataformas de concorrentes, como a Microsoft, é bater de frente com a OpenAI, que viu seu modelo de linguagem se tornar o mais popular desde o lançamento no fim do ano passado. 

Veja também:

Este post foi modificado pela última vez em 20 de julho de 2023 15:55

Uesley Durães

Posts recentes

Fetch.ai: Desenvolvimento e monetização de aplicativos de IA

Fetch.ai é uma plataforma aberta que visa transformar a economia de inteligência artificial (IA) ao…

20 de junho de 2024

Perplexity enfrenta processo legal por plágio de conteúdo

A Forbes, renomada publicadora de notícias, está ameaçando processar a Perplexity, startup de busca baseada…

20 de junho de 2024

Estreia em Londres de filme com roteiro de IA é cancelada após críticas

Um cinema em Londres cancelou a estreia mundial de um filme com roteiro gerado por…

20 de junho de 2024

Nvidia consolida liderança como empresa mais valiosa do mundo

A Nvidia solidificou sua posição como a empresa mais valiosa do mundo. Na quinta-feira (20),…

20 de junho de 2024

PayPal contrata ex-Walmart como diretor de tecnologia em IA

O PayPal contratou Srini Venkatesan, um dos principais executivos de tecnologia do Walmart, para liderar…

20 de junho de 2024

IA Generativa x IA Preditiva: Entenda as diferenças fundamentais dentro do mundo high tech

No vasto campo da inteligência artificial (IA), dois ramos têm se destacado pelo impacto significativo…

20 de junho de 2024