V2A: Google DeepMind cria som para vídeos
A DeepMind, laboratório de pesquisa do Google, publicou um novo estudo sobre seu sistema de IA V2A (vídeo para áudio). O V2A gera trilhas sonoras detalhadas e sincronizadas para vídeos, incluindo música, efeitos sonoros, diálogos e muito mais.
O V2A combina pixels brutos de vídeo com descrições textuais para produzir áudio realista que corresponda ao que se vê na tela e ao tom do vídeo. O modelo foi treinado em vídeo, áudio, anotações de efeitos sonoros e transcrições de fala para aprender a associar eventos visuais e sonoros.
A DeepMind afirma estar testando o V2A com renomados cineastas e planeja realizar mais testes de segurança antes de disponibilizá-lo ao público.
Enquanto a geração de vídeo por inteligência artificial (IA) avança rapidamente, os resultados geralmente são perturbadoramente silenciosos. A integração do V2A com modelos como o Veo (também do Google) pode levar a capacidades criativas a um novo patamar, permitindo que diálogos, efeitos sonoros e música sejam facilmente combinados com a produção de vídeo.
Leia também:
Este post foi modificado pela última vez em 18 de junho de 2024 12:34
Um dos maiores desafios da medicina moderna está nos chamados "casos sem resposta": pacientes que…
A Argentina deu um passo inédito na corrida global pela inteligência artificial (IA). O governo…
A corrida global pela inteligência artificial (IA) acaba de ganhar uma nova fronteira: o espaço.…
A inteligência artificial (IA) já deixou de ser uma promessa tecnológica distante para se tornar…
A inteligência artificial (IA) acaba de alcançar mais um marco simbólico na educação superior. Um…
A inteligência artificial (IA) está transformando setores inteiros da economia, impulsionando avanços em saúde, educação,…