Qwen 2.5: Novo modelo de IA da Alibaba processa 1 milhão de tokens e supera a concorrência

Qwen 2.5: Novo modelo de IA da Alibaba processa 1 milhão de tokens e supera a concorrência

A equipe Qwen da Alibaba acaba de revelar dois novos modelos de código aberto capazes de processar até 1 milhão de tokens, juntamente com melhorias significativas de velocidade e uma interface de bate-papo reformulada.

PUBLICIDADE

Detalhes do novo modelo
  • A nova série Qwen2.5-1M inclui modelos de 7B e 14B parâmetros, ambos suportando comprimentos de contexto de 1 milhão de tokens enquanto mantêm a precisão.
  • Qwen implanta um framework de inferência vLLM personalizado, oferecendo até 7 vezes mais processamento rápido do que outros sistemas de contexto longo.
  • Em testes, os modelos Qwen-1M superaram outros modelos de contexto longo, como Llama-3, GLM-4 e GPT-4, em tarefas complexas de texto longo.
  • O lançamento também inclui uma nova atualização do Qwen Chat v0.2, adicionando pesquisa na web, geração de texto para vídeo e recursos de imagem aprimorados.
Por que isso importa

Os modelos Qwen de código aberto com 1 milhão de tokens são uma dica do que está por vir em toda a indústria – com o Gemini do Google (2M) e o Flash 2.0 Thinking (1M) já liderando o caminho com capacidades de entrada massivas. O aumento do contexto, aliado ao processamento mais rápido, abre caminho para níveis sobre-humanos de análise de dados e novos casos de uso complexos.

Leia também:

Rolar para cima