Inteligência Artificial

Alibaba desafia o o1 com modelo de raciocínio open-source

Publicado por
Isabella Caminoto

A equipe Qwen da Alibaba acaba de lançar o QwQ-32B-Preview, um novo e poderoso modelo de inteligência artificial (IA) de raciocínio de código aberto que pode raciocinar passo a passo através de problemas desafiadores e compete diretamente com a série o1 da OpenAI em vários benchmarks.

Os detalhes
  • O QwQ apresenta uma janela de contexto de 32K, superando o o1-mini e competindo com o o1-preview em benchmarks-chave de matemática e raciocínio.
  • O modelo foi testado em vários dos benchmarks de matemática e programação mais desafiadores, mostrando grandes avanços no raciocínio profundo.
  • O QwQ demonstra “introspecção profunda”, discutindo problemas passo a passo e questionando e examinando suas próprias respostas para chegar a uma solução.
  • A equipe Qwen observou vários problemas no modelo de visualização, incluindo ficar preso em loops de raciocínio, lutar com o senso comum e misturar idiomas.
Por que isso importa

Entre o QwQ e o DeepSeek, os modelos de raciocínio de código aberto estão aqui – e as empresas chinesas estão absolutamente cozinhando com novos modelos que quase igualam os líderes fechados atuais. O fosso da OpenAI secou, ou o líder da IA tem algo especial reservado antes do final do ano?

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 11:43

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

Mentes por trás do Android criam o futuro dos agentes de IA

Uma equipe de ex-executivos do Google, Meta e Stripe acabou de sair do modo stealth…

27 de novembro de 2024

Zoom aposta tudo na IA com nova marca

A Zoom acaba de anunciar uma mudança de marca de 'Zoom Video Communications' para 'Zoom…

27 de novembro de 2024

Vazamento do Sora expõe tensão entre a OpenAI e artistas; entenda

Um grupo de protesto chamado "Sora PR Puppets" vazou o acesso ao modelo de vídeo…

27 de novembro de 2024

Luma Labs atualiza Dream Machine; veja o que mudou

A Luma AI acaba de lançar uma atualização importante para sua plataforma Dream Machine, apresentando…

26 de novembro de 2024

Anthropic lança sistema universal de conexão de IA

A Anthropic acabou de lançar o Model Context Protocol (MCP), um padrão de código aberto…

26 de novembro de 2024

Runway revela modelo de geração de imagens ‘Frames’

A Runway acaba de revelar um novo modelo de imagem de inteligência artificial (IA) chamado…

26 de novembro de 2024