O Tongyi Lab do Alibaba acaba de lançar o Wan2.1, uma suíte de código aberto de modelos poderosos de geração de vídeo que superam modelos de ponta de código aberto e fechados, como o Sora, em benchmarks chave — enquanto geram vídeos 2,5 vezes mais rápido.
PUBLICIDADE
Detalhes do Wan2.1
- O Wan2.1-T2V-14B lidera a tabela de classificação do VBench, destacando-se em áreas como dinâmica de movimento complexa, simulação de física do mundo real e geração de texto.
- Todos os modelos suportam texto para vídeo, imagem para vídeo e vídeo para áudio, e são os primeiros com a capacidade de renderizar texto em inglês e chinês.
- As ferramentas de edição do Wan incluem inpainting e outpainting de vídeo, referenciamento de múltiplas imagens e a capacidade de manter estruturas e personagens existentes.
- O lançamento também inclui uma versão leve de 1,3 bilhão capaz de rodar em hardware de consumo — ele pode gerar um clipe de 5 segundos em 480P em uma RTX 4090 em 4 minutos.
Por que isso é importante
Mais um dia, mais um lançamento de código aberto surpreendente vindo da China. Wan é uma continuação da qualidade crescente que temos visto em lançamentos recentes como o Veo 2 do Google — com sinais reveladores de IA (movimento instável, artefatos, etc.) quase completamente eliminados. Entre o Qwen e o Wan, o Alibaba está trazendo o calor do código aberto em 2025.
Leia também: