Pesquisadores da NVIDIA e de Stanford acabam de apresentar o “Test-Time Training” (Treinamento em Tempo de Teste), uma técnica de inteligência artificial (IA) que permite a geração de vídeos mais longos do que era possível anteriormente – com demonstrações produzindo clipes de desenho animado de um minuto com consistência e narrativa aprimoradas.
PUBLICIDADE
Detalhes do Test-Time Training
- O sistema gera animações completas de um minuto com consistência entre as cenas, superando significativamente os métodos existentes em avaliações humanas.
- As camadas TTT funcionam usando redes neurais como memória, permitindo que o modelo se lembre e mantenha a consistência em sequências muito mais longas.
- A equipe demonstrou a tecnologia usando desenhos animados de Tom e Jerry, mostrando histórias com múltiplas cenas, movimento dinâmico e interações entre personagens.
- Essa abordagem modifica modelos de vídeo existentes, adicionando camadas TTT e permitindo que eles processem vídeos significativamente mais longos do que sua capacidade original.
Por que isso é importante
O vídeo gerado por IA passou por algumas atualizações impressionantes no último ano, mas uma das maiores limitações ainda é a duração dos clipes e a manutenção da consistência entre as tomadas. Essa nova abordagem pode, eventualmente, desbloquear a capacidade de contar histórias mais longas e coerentes – sem a necessidade de juntar centenas de gerações.
Leia também: