Inteligência Artificial

Google VLOGGER: converse com uma foto usando sua voz

A nova ferramenta de IA do Google, chamada VLOGGER, permite transformar fotos em avatares que você controla com a voz. Ela foi treinada com o dataset MENTOR, contendo 800.000 vídeos de pessoas falando.

Publicado por
Isabella Caminoto

Principais recursos do VLOGGER

  • Cria vídeos animados a partir de imagens estáticas e trechos de áudio.
  • Gera avatares realistas com expressões faciais e movimentos.
  • Permite controlar personagens virtuais por voz, bastando falar para interagir com o avatar.
  • Prediz movimentos faciais, corporais, posturais, oculares e de expressão ao longo do tempo.

Comparação com Alibaba EMO

Alibaba também lançou sua própria IA, chamada EMO, similar ao VLOGGER do Google. Essa IA pode dar vida a uma foto estática criando um avatar animado.

Ambas plataformas possuem pontos fortes únicos. O VLOGGER é voltado para criar avatares personalizáveis para comunicação e interação. Por outro lado, o EMO se destaca em transformar imagens em vídeos expressivos, aprimorando a narrativa digital e o entretenimento.

Por que isso importa

O VLOGGER transforma imagens estáticas em avatares dinâmicos, aumentando a personalização e a interação do usuário online. A tecnologia simplifica a criação de avatares, tornando-a mais fácil e acessível, eliminando a necessidade de grandes recursos ou expertise.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 12:10

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

Gemini recupera o primeiro lugar no ranking de LLM

O mais recente modelo experimental Gemini da Google (1121) acabou de recuperar o primeiro lugar…

22 de novembro de 2024

OpenAI mira no Chrome com planos de desenvolver seu próprio navegador

A OpenAI está considerando desenvolver um navegador web que se integraria ao ChatGPT e aos…

22 de novembro de 2024

DeepMind dá um salto gigante na computação quântica com o AlphaQubit

O Google DeepMind acaba de apresentar o AlphaQubit, um sistema de inteligência artificial (IA) que…

21 de novembro de 2024

ChatGPT está mais perto de lançar sua IA visual

Um código recém-descoberto na última versão beta do ChatGPT sugere que a OpenAI pode estar…

21 de novembro de 2024

DeepSeek revela poderosa IA de raciocínio; veja

A empresa chinesa de pesquisa em inteligência artificial (IA), DeepSeek, acaba de lançar o R1-Lite-Preview,…

21 de novembro de 2024

OpenAI lança curso gratuito de IA para professores

A OpenAI e a parceira sem fins lucrativos Common Sense Media lançaram um curso de…

20 de novembro de 2024