A equipe Qwen da Alibaba acaba de lançar o QwQ-32B-Preview, um novo e poderoso modelo de inteligência artificial (IA) de raciocínio de código aberto que pode raciocinar passo a passo através de problemas desafiadores e compete diretamente com a série o1 da OpenAI em vários benchmarks.
PUBLICIDADE
Os detalhes
- O QwQ apresenta uma janela de contexto de 32K, superando o o1-mini e competindo com o o1-preview em benchmarks-chave de matemática e raciocínio.
- O modelo foi testado em vários dos benchmarks de matemática e programação mais desafiadores, mostrando grandes avanços no raciocínio profundo.
- O QwQ demonstra “introspecção profunda”, discutindo problemas passo a passo e questionando e examinando suas próprias respostas para chegar a uma solução.
- A equipe Qwen observou vários problemas no modelo de visualização, incluindo ficar preso em loops de raciocínio, lutar com o senso comum e misturar idiomas.
Por que isso importa
Entre o QwQ e o DeepSeek, os modelos de raciocínio de código aberto estão aqui – e as empresas chinesas estão absolutamente cozinhando com novos modelos que quase igualam os líderes fechados atuais. O fosso da OpenAI secou, ou o líder da IA tem algo especial reservado antes do final do ano?
Leia também: