Alibaba desafia o o1 com modelo de raciocínio open-source

Alibaba desafia o o1 com modelo de raciocínio open-source

A equipe Qwen da Alibaba acaba de lançar o QwQ-32B-Preview, um novo e poderoso modelo de inteligência artificial (IA) de raciocínio de código aberto que pode raciocinar passo a passo através de problemas desafiadores e compete diretamente com a série o1 da OpenAI em vários benchmarks.

PUBLICIDADE

Os detalhes
  • O QwQ apresenta uma janela de contexto de 32K, superando o o1-mini e competindo com o o1-preview em benchmarks-chave de matemática e raciocínio.
  • O modelo foi testado em vários dos benchmarks de matemática e programação mais desafiadores, mostrando grandes avanços no raciocínio profundo.
  • O QwQ demonstra “introspecção profunda”, discutindo problemas passo a passo e questionando e examinando suas próprias respostas para chegar a uma solução.
  • A equipe Qwen observou vários problemas no modelo de visualização, incluindo ficar preso em loops de raciocínio, lutar com o senso comum e misturar idiomas.
Por que isso importa

Entre o QwQ e o DeepSeek, os modelos de raciocínio de código aberto estão aqui – e as empresas chinesas estão absolutamente cozinhando com novos modelos que quase igualam os líderes fechados atuais. O fosso da OpenAI secou, ou o líder da IA tem algo especial reservado antes do final do ano?

Leia também:

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima