AI2 lança OLMo 2: Novo modelo de linguagem de código aberto desafia o Llama

O instituto de pesquisa AI2 acaba de lançar o OLMo 2, uma nova família de modelos de linguagem totalmente de código aberto que iguala o desempenho de concorrentes de tamanho semelhante, como o Llama da Meta.

Detalhes do lançamento

Os modelos 7B e 13B foram treinados em um conjunto de dados de 5T tokens de conteúdo acadêmico de alta qualidade, dados da web filtrados e fontes de instruções especializadas.
Os modelos OLMo alcançaram resultados semelhantes ou melhores, usando menos poder de computação do que os concorrentes e sendo menores em tamanho.
Os modelos são totalmente abertos, com a AI2 fornecendo acesso ao código-fonte, dados de treinamento e um pacote de desenvolvimento com receitas de treinamento e frameworks de avaliação.
O lançamento também inclui variantes ajustadas por instruções, que alcançam resultados competitivos com modelos abertos líderes, como o Qwen 2.5.

Por que isso importa

Enquanto outros modelos de código aberto lançam pesos, mas permanecem fortemente guardados, o OLMo 2 prova que a inteligência artificial (IA) de ponta pode ser desenvolvida e lançada completamente em aberto – potencialmente estabelecendo um novo padrão poderoso para como sistemas futuros são construídos e compartilhados.

Leia também:

Alibaba desafia o o1 com modelo de raciocínio open-source