A Meta lançou nesta terça (18) o LLaMa-2-Chat, um modelo de linguagem de grande escala (LLM) projetado para ser amigável ao uso comercial. O LLaMa-2-Chat é o primeiro modelo de seu tamanho a ser ajustado usando o RLHF (Reinforcement Learning from Human Feedback). O modelo está disponível para download gratuitamente no site oficial da Meta.
O LLaMa-2-Chat é um modelo de linguagem de grande escala que é tão bom quanto o GPT-3.5 em certos tipos de tarefas. Ele também é eficiente em problemas matemáticos.
Uma das vantagens do LLaMa-2 é que ele pode ser usado para criar chatbots sem a necessidade de compartilhar dados com a OpenAI, do ChatGPT. Isso significa que os desenvolvedores e pesquisadores podem usar o poder do LLaMa-2-Chat sem ter que se preocupar com a privacidade de seus dados.
O modelo de linguagem ainda está em desenvolvimento, mas o modelo já pode ser baixado a partir do site oficial. O modelo tem o potencial de ser usado para uma variedade de tarefas, incluindo geração de texto, tradução de idiomas, escrita de diferentes tipos de conteúdo criativo e respostas às suas perguntas de forma informativa.
“O Llama 2 foi pré-treinado em fontes de dados on-line disponíveis publicamente. O modelo ajustado, Llama-2-chat, utiliza conjuntos de dados de instrução disponíveis publicamente e mais de 1 milhão de anotações humanas”, narra o comunicado oficial.
Confira alguns destaques apontados pela Meta para o modelo:
Veja também:
Este post foi modificado pela última vez em %s = human-readable time difference 17:25
O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…
Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…
O Google acabou de lançar o que está chamando de um novo modelo de inteligência…
A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…
A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…
O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…