O instituto de pesquisa AI2 acaba de lançar o OLMo 2, uma nova família de modelos de linguagem totalmente de código aberto que iguala o desempenho de concorrentes de tamanho semelhante, como o Llama da Meta.
PUBLICIDADE
Detalhes do lançamento
- Os modelos 7B e 13B foram treinados em um conjunto de dados de 5T tokens de conteúdo acadêmico de alta qualidade, dados da web filtrados e fontes de instruções especializadas.
- Os modelos OLMo alcançaram resultados semelhantes ou melhores, usando menos poder de computação do que os concorrentes e sendo menores em tamanho.
- Os modelos são totalmente abertos, com a AI2 fornecendo acesso ao código-fonte, dados de treinamento e um pacote de desenvolvimento com receitas de treinamento e frameworks de avaliação.
- O lançamento também inclui variantes ajustadas por instruções, que alcançam resultados competitivos com modelos abertos líderes, como o Qwen 2.5.
Por que isso importa
Enquanto outros modelos de código aberto lançam pesos, mas permanecem fortemente guardados, o OLMo 2 prova que a inteligência artificial (IA) de ponta pode ser desenvolvida e lançada completamente em aberto – potencialmente estabelecendo um novo padrão poderoso para como sistemas futuros são construídos e compartilhados.
Leia também: