Os pesquisadores do Google acabaram de desenvolver o VLOGGER, um novo modelo de IA que pode gerar vídeos fotorrealistas de avatares falantes com movimentos completos da parte superior do corpo a partir de apenas uma imagem estática e um clipe de áudio.
VLOGGER é uma plataforma inovadora que permite a criação de avatares controláveis capazes de capturar com precisão semelhanças e movimentos. Para alcançar esse nível de realismo, o modelo por trás do VLOGGER foi treinado em um vasto conjunto de dados multimídia, composto por 800 mil vídeos de pessoas conversando.
Cada vídeo foi meticulosamente rotulado, identificando cada parte do rosto e do corpo em movimento. Essa abordagem detalhada permitiu ao VLOGGER aprender e reproduzir com precisão uma ampla gama de expressões faciais e gestos corporais.
As aplicações potenciais dessa tecnologia são diversas e empolgantes. Uma delas é a dublagem automática de vídeos em diferentes idiomas, aproveitando a capacidade da ferramenta de criar avatares realistas que podem sincronizar os movimentos labiais com o áudio.
Além disso, o VLOGGER pode ser utilizado na criação de avatares para jogos ou assistentes virtuais, oferecendo uma interação mais imersiva e personalizada para os usuários.
Outra aplicação interessante é a capacidade de ativar chats de vídeo com baixa largura de banda, onde o VLOGGER pode representar os usuários de forma realista, mesmo em condições de conexão limitada. Essas possibilidades destacam o potencial transformador da ferramenta em várias áreas, desde entretenimento até comunicação.
Leia também:
Este post foi modificado pela última vez em 18 de março de 2024 17:26
A Meta acaba de anunciar que disponibilizará seus modelos de inteligência artificial (IA) Llama para…
A Amazon Prime Video está recebendo um novo recurso alimentado por IA generativa para ajudá-lo…
A empresa de busca com inteligência artificial (IA) Perplexity está testando a ideia de usar…
A gigante de energia dos Emirados Árabes Unidos, ADNOC, aplicará inteligência artificial (IA) altamente autônoma…
A Anthropic acabou de lançar o suporte a PDF para seu modelo Claude 3.5 Sonnet…
O Google está adicionando uma extensão do Google Home ao aplicativo Gemini, permitindo que você…