O Google DeepMind anunciou o Genie 3, um novo modelo de mundo de propósito geral. Ele é capaz de gerar ambientes interativos em tempo real a partir de um único comando de texto, mantendo a consistência de cenários e personagens.
PUBLICIDADE
Detalhes do Genie 3
- Com o Genie 3, usuários podem gerar ambientes únicos em resolução 720p, com física realista e explorá-los em tempo real, com novas imagens surgindo a 24 quadros por segundo (fps).
- A memória visual do modelo vai até um minuto, permitindo que ele simule a próxima cena enquanto garante consistência com as anteriores.
- Para atingir esse nível de controle, o Google afirma que o Genie calcula informações relevantes de trajetórias passadas várias vezes por segundo.
- Ele também permite que os usuários alterem os mundos durante a exploração, inserindo novos personagens ou objetos, ou até mesmo mudando completamente a dinâmica do ambiente.
Por que isso é importante
Os mundos consistentes do Genie 3, gerados quadro a quadro em resposta à ação do usuário, não representam apenas um avanço para jogos e entretenimento. Eles também lançam as bases para o treinamento escalável de IAs corporificadas.
Essas IAs seriam capazes de lidar com cenários hipotéticos — como um caminho desaparecendo — adaptando-se em tempo real, exatamente como humanos.
Leia também:



