A empresa chinesa de inteligência artificial (IA) ShengShu acaba de apresentar o Vidu, um modelo de IA de texto para vídeo que, segundo relatos, rivaliza em capacidade e desempenho com o Sora não lançado da OpenAI.
PUBLICIDADE
🇬🇧 Subscribe to the best newsletter about AI (in English 🇬🇧) 🇧🇷 Assine a melhor newsletter sobre IA (em português 🇧🇷)
- O Vidu pode gerar vídeos de alta qualidade, de 16 segundos e resolução 1080p, a partir de prompts de texto.
- O desenvolvimento do Vidu começou em 2022 com uma arquitetura proprietária anterior ao fluxo de trabalho DiT do Sora.
- Uma demonstração ao vivo em Pequim mostrou a capacidade do modelo de simular detalhes do mundo real, como iluminação precisa, sombras, expressões faciais e muito mais.
Por que isso importa?
Embora pareça um exagero chamá-lo de um verdadeiro “rival” do Sora (a geração de vídeos de 16 segundos contra 60 segundos parece uma grande diferença), os modelos de IA da China continuam a se aproximar dos líderes dos EUA. Com o Sora ainda não lançado ao público, sua promessa ainda não foi totalmente concretizada – abrindo caminho para a competição.
Além disso, vale ressaltar que a limitação de 16 segundos pode ser temporária. É importante ficar de olho em como o Vidu evolui e se a ShengShu consegue alcançar durações maiores.
Leia também: