Os pesquisadores do Google acabaram de desenvolver o VLOGGER, um novo modelo de IA que pode gerar vídeos fotorrealistas de avatares falantes com movimentos completos da parte superior do corpo a partir de apenas uma imagem estática e um clipe de áudio.
VLOGGER é uma plataforma inovadora que permite a criação de avatares controláveis capazes de capturar com precisão semelhanças e movimentos. Para alcançar esse nível de realismo, o modelo por trás do VLOGGER foi treinado em um vasto conjunto de dados multimídia, composto por 800 mil vídeos de pessoas conversando.
Cada vídeo foi meticulosamente rotulado, identificando cada parte do rosto e do corpo em movimento. Essa abordagem detalhada permitiu ao VLOGGER aprender e reproduzir com precisão uma ampla gama de expressões faciais e gestos corporais.
As aplicações potenciais dessa tecnologia são diversas e empolgantes. Uma delas é a dublagem automática de vídeos em diferentes idiomas, aproveitando a capacidade da ferramenta de criar avatares realistas que podem sincronizar os movimentos labiais com o áudio.
Além disso, o VLOGGER pode ser utilizado na criação de avatares para jogos ou assistentes virtuais, oferecendo uma interação mais imersiva e personalizada para os usuários.
Outra aplicação interessante é a capacidade de ativar chats de vídeo com baixa largura de banda, onde o VLOGGER pode representar os usuários de forma realista, mesmo em condições de conexão limitada. Essas possibilidades destacam o potencial transformador da ferramenta em várias áreas, desde entretenimento até comunicação.
Leia também:
Este post foi modificado pela última vez em %s = human-readable time difference 17:26
O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…
Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…
O Google acabou de lançar o que está chamando de um novo modelo de inteligência…
A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…
A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…
O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…