Alibaba desafia o o1 com modelo de raciocínio open-source

A equipe Qwen da Alibaba acaba de lançar o QwQ-32B-Preview, um novo e poderoso modelo de inteligência artificial (IA) de raciocínio de código aberto que pode raciocinar passo a passo através de problemas desafiadores e compete diretamente com a série o1 da OpenAI em vários benchmarks.

Os detalhes

O QwQ apresenta uma janela de contexto de 32K, superando o o1-mini e competindo com o o1-preview em benchmarks-chave de matemática e raciocínio.
O modelo foi testado em vários dos benchmarks de matemática e programação mais desafiadores, mostrando grandes avanços no raciocínio profundo.
O QwQ demonstra “introspecção profunda”, discutindo problemas passo a passo e questionando e examinando suas próprias respostas para chegar a uma solução.
A equipe Qwen observou vários problemas no modelo de visualização, incluindo ficar preso em loops de raciocínio, lutar com o senso comum e misturar idiomas.

Por que isso importa

Entre o QwQ e o DeepSeek, os modelos de raciocínio de código aberto estão aqui – e as empresas chinesas estão absolutamente cozinhando com novos modelos que quase igualam os líderes fechados atuais. O fosso da OpenAI secou, ou o líder da IA tem algo especial reservado antes do final do ano?

Leia também:

Mentes por trás do Android criam o futuro dos agentes de IA