Qwen 2.5: Novo modelo de IA da Alibaba processa 1 milhão de tokens e supera a concorrência

A equipe Qwen da Alibaba acaba de revelar dois novos modelos de código aberto capazes de processar até 1 milhão de tokens, juntamente com melhorias significativas de velocidade e uma interface de bate-papo reformulada.

Detalhes do novo modelo

A nova série Qwen2.5-1M inclui modelos de 7B e 14B parâmetros, ambos suportando comprimentos de contexto de 1 milhão de tokens enquanto mantêm a precisão.
Qwen implanta um framework de inferência vLLM personalizado, oferecendo até 7 vezes mais processamento rápido do que outros sistemas de contexto longo.
Em testes, os modelos Qwen-1M superaram outros modelos de contexto longo, como Llama-3, GLM-4 e GPT-4, em tarefas complexas de texto longo.
O lançamento também inclui uma nova atualização do Qwen Chat v0.2, adicionando pesquisa na web, geração de texto para vídeo e recursos de imagem aprimorados.

Por que isso importa

Os modelos Qwen de código aberto com 1 milhão de tokens são uma dica do que está por vir em toda a indústria – com o Gemini do Google (2M) e o Flash 2.0 Thinking (1M) já liderando o caminho com capacidades de entrada massivas. O aumento do contexto, aliado ao processamento mais rápido, abre caminho para níveis sobre-humanos de análise de dados e novos casos de uso complexos.

Leia também:

Aposta alta: Perplexity AI quer comprar o TikTok e dividir os lucros com o governo dos EUA