A Meta anunciou nesta semana o lançamento do LLaMA 2, um grande modelo de linguagem de código aberto. O LLaMA 2 é treinado em um enorme conjunto de dados de texto e código. A empresa de Mark Zuckerberg pretende fazer frente a OpenAI com o lançamento. Entenda as diferenças.
De forma geral, o LLaMA pode gerar texto, traduzir idiomas, escrever diferentes tipos de conteúdo criativo e responder perguntas de forma informativa.
O LLaMA 2 foi treinado com 40% mais dados do que o LLaMA 1, e supera outros LLMs como Falcon e MPT quando se trata de testes de raciocínio, codificação, proficiência e conhecimento.
Para Ricardo Bindi, pesquisador com formação em Ciências Moleculares e Neurociências, o Llama 2 supera outros modelos de linguagem de código aberto em muitos benchmarks externos, incluindo raciocínio, codificação, proficiência e testes de conhecimento.
O modelo ajustado ao usuário direto, o Llama-2-chat, aproveita conjuntos de dados instrucionais disponíveis publicamente e mais de 1 milhão de anotações humanas.
Para quem deseja usar o modelo em outros projetos, com a API, o código aberto do LLaMA 2 está disponível na plataforma Azure da Microsoft, e também através da AWS, Hugging Face e outros provedores.
De acordo com a Meta, foram enviados mais de 100 mil pedidos de pesquisadores para usar seu primeiro modelo, no entanto, há a expectativa que o LLaMA 2 de código aberto supere o número.
O LLaMA 2 é um modelo de linguagem factual de grande escala, o que significa que ele é treinado em um enorme conjunto de dados de texto e código. Esse conjunto de dados inclui livros, artigos, códigos e outras formas de texto.
O modelo é capaz de aprender as relações entre as palavras e os conceitos presentes no conjunto de dados, o que lhe permite gerar texto, traduzir idiomas, escrever diferentes tipos de conteúdo criativo e responder perguntas de forma informativa.
Baseado no informativo de imprensa da Meta, o modelo pode fazer uma série de coisas, incluindo:
O LLaMA 2 é um modelo de código aberto, o que significa que está disponível para qualquer pessoa usar. Você pode usar o LLaMA 2 através da plataforma Azure da Microsoft, ou através de outros provedores como a AWS e a Hugging Face.
O objetivo da Meta oferecendo a ferramenta para desenvolvedores até a partir de plataformas de concorrentes, como a Microsoft, é bater de frente com a OpenAI, que viu seu modelo de linguagem se tornar o mais popular desde o lançamento no fim do ano passado.
Veja também:
Este post foi modificado pela última vez em 20 de julho de 2023 15:55
A OpenAI deu um passo que pode redefinir o equilíbrio de poder no setor de…
Um dos maiores desafios da medicina moderna está nos chamados "casos sem resposta": pacientes que…
A Argentina deu um passo inédito na corrida global pela inteligência artificial (IA). O governo…
A corrida global pela inteligência artificial (IA) acaba de ganhar uma nova fronteira: o espaço.…
A inteligência artificial (IA) já deixou de ser uma promessa tecnológica distante para se tornar…
A inteligência artificial (IA) acaba de alcançar mais um marco simbólico na educação superior. Um…