AI2 lança OLMo 2: Novo modelo de linguagem de código aberto desafia o Llama

AI2 lança OLMo 2: Novo modelo de linguagem de código aberto desafia o Llama

O instituto de pesquisa AI2 acaba de lançar o OLMo 2, uma nova família de modelos de linguagem totalmente de código aberto que iguala o desempenho de concorrentes de tamanho semelhante, como o Llama da Meta.

PUBLICIDADE

Detalhes do lançamento
  • Os modelos 7B e 13B foram treinados em um conjunto de dados de 5T tokens de conteúdo acadêmico de alta qualidade, dados da web filtrados e fontes de instruções especializadas.
  • Os modelos OLMo alcançaram resultados semelhantes ou melhores, usando menos poder de computação do que os concorrentes e sendo menores em tamanho.
  • Os modelos são totalmente abertos, com a AI2 fornecendo acesso ao código-fonte, dados de treinamento e um pacote de desenvolvimento com receitas de treinamento e frameworks de avaliação.
  • O lançamento também inclui variantes ajustadas por instruções, que alcançam resultados competitivos com modelos abertos líderes, como o Qwen 2.5.
Por que isso importa

Enquanto outros modelos de código aberto lançam pesos, mas permanecem fortemente guardados, o OLMo 2 prova que a inteligência artificial (IA) de ponta pode ser desenvolvida e lançada completamente em aberto – potencialmente estabelecendo um novo padrão poderoso para como sistemas futuros são construídos e compartilhados.

Leia também:

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima