Inteligência Artificial

Microsoft dá vida a fotos com a VASA-1

Publicado por
Isabella Caminoto

A Microsoft acaba de revelar a VASA-1, um novo modelo de inteligência artificial (IA) capaz de gerar vídeos incrivelmente realistas de pessoas falando a partir de uma única imagem estática e um clipe de áudio.

Como funciona

  • A VASA-1 precisa apenas de uma foto e um arquivo de áudio com a fala para criar um vídeo realista da pessoa falando, com sincronização labial e animações expressivas.
  • O modelo pode gerar expressões faciais complexas, movimentos naturais da cabeça e até performances de canto realistas, indo além da simples sincronização labial.
  • Os usuários podem controlar aspectos do vídeo gerado por meio de barras deslizantes, como a direção do olhar, a distância da cabeça e o tom emocional.

Por que isso é importante

  • A VASA-1 representa um grande salto tecnológico, com potenciais aplicações em áreas como avatares virtuais, jogos e animação por computador.
  • No entanto, apesar de ser apenas uma demonstração de pesquisa, a capacidade de gerar deepfakes incrivelmente realistas já está aqui – o que tem implicações significativas para as próximas eleições e para o mau uso por pessoas mal-intencionadas.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 10:19

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

Google se associa à Apptronik para desenvolver robôs humanoides

O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…

20 de dezembro de 2024

Genesis: Um novo patamar para simulações físicas em IA

Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…

20 de dezembro de 2024

Google lança seu próprio modelo de IA de “raciocínio”

O Google acabou de lançar o que está chamando de um novo modelo de inteligência…

19 de dezembro de 2024

GitHub Copilot agora é gratuito

A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…

19 de dezembro de 2024

ChatGPT ganha um novo número de telefone; veja

A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…

19 de dezembro de 2024

Google lança novo benchmark para testar a factualidade de LLMs

O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…

18 de dezembro de 2024