A Tencent acaba de lançar o HunyuanVideo, um novo modelo de geração de vídeo de inteligência artificial (IA) de código aberto com 13B de parâmetros que supera os principais rivais fechados em testes – com o lançamento também o tornando o maior modelo do tipo disponível publicamente.
PUBLICIDADE
Detalhes do lançamento
- O HunyuanVideo ficou acima de concorrentes comerciais como Runway Gen-3 e Luma 1.6 nos testes, particularmente em qualidade de movimento e consistência de cena.
- Além de saídas de texto para vídeo, o modelo também pode lidar com imagem para vídeo, criar avatares animados e gerar áudio sincronizado para conteúdo de vídeo.
- A arquitetura combina compreensão de texto, processamento visual e movimento avançado para manter sequências de ação e transições de cena coerentes.
- A Tencent lançou os pesos e o código abertos do HunyuanVideo, tornando o modelo prontamente disponível para uso tanto de pesquisadores quanto de uso comercial.
Por que isso importa
Um modelo de vídeo de código aberto e de pesos abertos agora é tão bom (ou melhor) que as principais opções fechadas, proporcionando uma base impressionante para construir. O vídeo de IA está tendo um momento, e é difícil imaginar o quão bons esses modelos serão em 2025, dada a aceleração que já estamos vendo.
Leia também: