Inteligência Artificial

Lumiere: IA de vídeo do Google é capaz produzir imagens em alta resolução

A Lumiere, nova inteligência artificial (IA) do Google para produção de vídeos, consegue realizar a produção de imagens com maior qualidade de movimentos e alta precisão.

Publicado por
Vinicius Siqueira

O Google Lumiere encontra-se atualmente em estágio de desenvolvimento e foi revelado pela Big Tech por meio de um artigo pré-impresso. De acordo com as informações fornecidas pela empresa, o Lumiere destaca-se em relação a outros modelos de inteligência artificial no setor ao adotar um modelo de difusão denominado Space-Time-U-Net. Esse método inovador implica na geração de vídeos por meio de um processo específico, marcando diferenças substanciais em comparação com abordagens convencionais.

O software do Google Lumiere adota uma abordagem inovadora no processo de geração de vídeos. Inicialmente, identifica a localização dos elementos na imagem ou texto (espaço) e, em seguida, analisa como esses elementos se movem e evoluem ao longo do tempo. Posteriormente, realiza uma aproximação entre as imagens de forma contínua, proporcionando uma transição suave e natural.

De acordo com o Google, essa metodologia contrasta com outros modelos de inteligência artificial para vídeos, os quais muitas vezes compilam partes fragmentadas, como quadros distantes e estáticos, para formar o todo. Essa diferença fundamental resulta em uma qualidade de geração de vídeo mais próxima da realidade, destacando a eficácia do Lumiere em relação aos seus concorrentes.

Conforme divulgado pelo site Ars Technica, o Lumiere demonstra sua capacidade gerando 80 quadros a 16 quadros por segundo (fps) em vídeos com resolução de 1024×1024 pixels e cinco segundos de duração, ainda em baixa resolução.

Em comparação, a ferramenta de inteligência artificial Stable Video Diffusion, já utilizada para criar vídeos, gera 25 quadros. Esta ferramenta representa uma evolução do próprio Google, pois, no modelo anterior chamado Imagen Video, conseguia gerar vídeos curtos com 24 quadros.

A empresa revelou que treinou o Lumiere usando um conjunto de dados composto por 30 milhões de vídeos e legendas de texto, mas não divulgou a origem desses dados.

O Lumiere tem a capacidade de gerar vídeos a partir de prompts de texto, conversão de imagens estáticas ou imagens de referência. Além disso, o Google afirma que é possível realizar edições nos vídeos ou criar animações específicas em uma foto estática, como, por exemplo, simular o movimento de um vestido.

O Google já realizou demonstrações práticas do desempenho do Lumiere, incluindo exemplos envolvendo animais adoráveis.

Apesar da natureza artificial evidente nos vídeos, identificável como sendo produzida por inteligência artificial, eles conseguem imitar movimentos semelhantes aos reais tanto de animais quanto de humanos, proporcionando uma fluidez notável.

Até o momento não há uma previsão de quando a ferramenta estaria disponível para o consumidor final.

Leia também:

Este post foi modificado pela última vez em %s = human-readable time difference 14:13

Vinicius Siqueira

Posts recentes

Gemini recupera o primeiro lugar no ranking de LLM

O mais recente modelo experimental Gemini da Google (1121) acabou de recuperar o primeiro lugar…

22 de novembro de 2024

OpenAI mira no Chrome com planos de desenvolver seu próprio navegador

A OpenAI está considerando desenvolver um navegador web que se integraria ao ChatGPT e aos…

22 de novembro de 2024

DeepMind dá um salto gigante na computação quântica com o AlphaQubit

O Google DeepMind acaba de apresentar o AlphaQubit, um sistema de inteligência artificial (IA) que…

21 de novembro de 2024

ChatGPT está mais perto de lançar sua IA visual

Um código recém-descoberto na última versão beta do ChatGPT sugere que a OpenAI pode estar…

21 de novembro de 2024

DeepSeek revela poderosa IA de raciocínio; veja

A empresa chinesa de pesquisa em inteligência artificial (IA), DeepSeek, acaba de lançar o R1-Lite-Preview,…

21 de novembro de 2024

OpenAI lança curso gratuito de IA para professores

A OpenAI e a parceira sem fins lucrativos Common Sense Media lançaram um curso de…

20 de novembro de 2024