Inteligência Artificial

Google VLOGGER: converse com uma foto usando sua voz

A nova ferramenta de IA do Google, chamada VLOGGER, permite transformar fotos em avatares que você controla com a voz. Ela foi treinada com o dataset MENTOR, contendo 800.000 vídeos de pessoas falando.

Publicado por
Isabella Caminoto

Principais recursos do VLOGGER

  • Cria vídeos animados a partir de imagens estáticas e trechos de áudio.
  • Gera avatares realistas com expressões faciais e movimentos.
  • Permite controlar personagens virtuais por voz, bastando falar para interagir com o avatar.
  • Prediz movimentos faciais, corporais, posturais, oculares e de expressão ao longo do tempo.

Comparação com Alibaba EMO

Alibaba também lançou sua própria IA, chamada EMO, similar ao VLOGGER do Google. Essa IA pode dar vida a uma foto estática criando um avatar animado.

Ambas plataformas possuem pontos fortes únicos. O VLOGGER é voltado para criar avatares personalizáveis para comunicação e interação. Por outro lado, o EMO se destaca em transformar imagens em vídeos expressivos, aprimorando a narrativa digital e o entretenimento.

Por que isso importa

O VLOGGER transforma imagens estáticas em avatares dinâmicos, aumentando a personalização e a interação do usuário online. A tecnologia simplifica a criação de avatares, tornando-a mais fácil e acessível, eliminando a necessidade de grandes recursos ou expertise.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 12:10

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

Google se associa à Apptronik para desenvolver robôs humanoides

O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…

20 de dezembro de 2024

Genesis: Um novo patamar para simulações físicas em IA

Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…

20 de dezembro de 2024

Google lança seu próprio modelo de IA de “raciocínio”

O Google acabou de lançar o que está chamando de um novo modelo de inteligência…

19 de dezembro de 2024

GitHub Copilot agora é gratuito

A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…

19 de dezembro de 2024

ChatGPT ganha um novo número de telefone; veja

A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…

19 de dezembro de 2024

Google lança novo benchmark para testar a factualidade de LLMs

O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…

18 de dezembro de 2024