Pesquisadores da Stanford desenvolveram um modelo de inteligência artificial (IA) que permite que avatares digitais produzam gestos naturais e apropriados ao contexto enquanto falam, marcando avanços na criação de personagens virtuais mais realistas e expressivos.
PUBLICIDADE
Confira os detalhes
- Os dados de treinamento incluíram 1.000 horas de audiolivros e 60 horas de captura de movimento para entender as relações entre fala, texto e linguagem corporal.
- O sistema pode gerar gestos apropriados a partir de entrada de texto ou áudio, enquanto detecta emoções apenas com padrões de movimento.
- Usando uma nova abordagem de pré-treinamento, a IA requer menos dados de treinamento do que modelos anteriores, enquanto alcança melhor desempenho em benchmarks de geração de gestos.
- O modelo mostra particular força em combinar gestos com padrões de fala, como enfatizar palavras específicas por meio de movimentos corporais correspondentes.
Por que isso importa
O CEO do Zoom, Eric Yuan, disse que em breve enviaremos avatares para reuniões em nosso lugar. Ter movimento e gestos realistas é um passo crucial para criar personagens verdadeiramente imersivos. Os avatares digitais estão prestes a se tornar onipresentes em todas as indústrias, e esses avanços podem abrir um mundo totalmente novo de aplicações.
Leia também: