🤖 guIA

Veo: Crie vídeos ultrarrealistas com a IA do Google

Veo é o modelo de geração de vídeo mais avançado da DeepMind, capaz de criar vídeos de alta qualidade com resolução 1080p e duração superior a um minuto. Ele entende nuances e tons dos prompts, oferecendo um nível inédito de controle criativo. Veo é útil para cineastas, criadores de conteúdo e educadores, tornando a produção de vídeo acessível para todos. Suas funcionalidades incluem edição baseada em comandos, edição mascarada, e geração de vídeos a partir de imagens e prompts textuais.

Publicado por

Vinicius Siqueira

18 de junho de 2024 18:20

guIA	Veo: Crie vídeos ultrarrealistas com a IA do Google
CATEGORIA	Vídeos
PARA QUE SERVE?	Criação de vídeos ultrarrealistas com mais de 1 minuto
QUANTO CUSTA?	Acesso limitado a poucos criadores de conteúdo
ONDE ENCONTRO?	deepmind.google/technologies/veo/
VALE A PENA?	Sim, mas a ferramenta está está em acesso limitado para poucos usuários.

Google I/O

O Veo foi anunciado e lançado em 14 de maio de 2024, como parte dos novos modelos e ferramentas de mídia generativa desenvolvidos pela Google DeepMind. A ferramenta foi anunciada durante o Google I/O 2024, juntamente com o Imagen 3 (outra ferramenta de IA especializada em imagem), em um movimento concorrendo diretamente com a Sora da OpenAI.

As plataformas estão disponíveis no ImageFX e VideoFX apenas para um grupo selecionado de criadores. Ainda não há previsão de lançamento para o público geral, mas é possível se inscrever na lista de espera.

Um destaque do Veo é a capacidade de adicionar imagens aos comandos de geração de vídeos. Basta inserir a foto e o prompt detalhando os elementos a serem gerados.

O Google também menciona que, no futuro, alguns recursos do Veo estarão disponíveis para o YouTube Shorts.

Tecnologias que influenciaram o Veo

O desenvolvimento do Veo foi influenciado por várias tecnologias anteriores da DeepMind, incluindo:

Generative Query Network (GQN)
DVD-GAN
Imagen-Video
Phenaki
WALT
VideoPoet
Lumiere
Arquitetura Transformer
Gemini

Essas tecnologias contribuíram para aprimorar a compreensão de linguagem natural e semântica visual, bem como para melhorar a qualidade e eficiência na geração de vídeos.

Diferenciais do VEO

Alta Qualidade de Vídeo: Veo gera vídeos em resolução 1080p que podem durar mais de um minuto, com uma ampla variedade de estilos visuais e cinematográficos.
Controle Criativo Inédito: O modelo compreende e responde a nuances e tons dos prompts, permitindo um nível elevado de controle criativo. Ele pode gerar efeitos cinematográficos específicos, como time lapses ou vistas aéreas.
Consistência Visual Entre Frames: Utilizando transformadores de difusão latente, Veo minimiza inconsistências visuais, como flickering ou mudanças inesperadas entre frames, mantendo a estabilidade de personagens, objetos e estilos ao longo do vídeo.
Edição Precisa: Veo permite a edição de vídeos a partir de comandos textuais, incluindo a adição de elementos específicos a cenas já existentes. Suporta edição mascarada para alterar áreas específicas de um vídeo.
Geração Baseada em Imagens e Prompts Textuais: Pode criar vídeos a partir de uma imagem de referência combinada com um prompt textual, seguindo o estilo da imagem e as instruções do usuário.
Extensão de Vídeo: Capaz de criar e estender videoclipes para 60 segundos ou mais, seja a partir de um único prompt ou de uma sequência de prompts que contam uma história.
Responsabilidade e Segurança: Veo utiliza SynthID para marcação e identificação de conteúdo gerado por IA, além de passar por filtros de segurança e verificações de memorização para mitigar riscos de privacidade, direitos autorais e preconceitos.
Eficiência e Qualidade Melhoradas: Com uso de representações de vídeo comprimidas de alta qualidade, Veo é mais eficiente e gera vídeos de melhor qualidade de forma mais rápida.

Acesso (limitado) da ferramenta:

Para acessar o Veo, você pode seguir estes passos:

Inscrição no VideoFX: Veo está disponível através do VideoFX, uma ferramenta experimental do Google Labs. Você pode se inscrever na lista de espera para testar o VideoFX visitando o site do VideoFX.
Disponibilidade Futura no YouTube Shorts: Algumas funcionalidades do Veo serão integradas ao YouTube Shorts no futuro. Fique atento às atualizações e anúncios sobre essa integração.
Feedback de Criadores Selecionados: No início, algumas das funcionalidades do Veo serão disponibilizadas para criadores selecionados. Caso você seja um criador de conteúdo, pode ser uma boa ideia acompanhar as comunicações do Google DeepMind para oportunidades de feedback e testes.

Observações: Veo, a nova ferramenta de geração de vídeo da DeepMind, apresenta inovações significativas no mercado de criação de conteúdo digital. Entre os pontos positivos, destaca-se a alta qualidade dos vídeos em 1080p, o controle criativo detalhado sobre os elementos do vídeo e a consistência visual entre frames, garantida por transformadores de difusão latente. Veo é versátil, suportando edição baseada em comandos textuais, edição mascarada e geração de vídeos a partir de imagens e textos. Além disso, aborda questões de privacidade e direitos autorais com o uso de SynthID para marcação de conteúdo gerado por IA e filtros de segurança.

No entanto, a disponibilidade inicial limitada através do VideoFX e para criadores selecionados pode restringir o acesso a uma base mais ampla de usuários. A geração de vídeos de alta qualidade pode exigir uma infraestrutura tecnológica robusta, e há o risco de uso indevido de tecnologias de geração de vídeo, como deepfakes, apesar das medidas de segurança.

Teste também:

Dream Machine: Crie vídeos realistas usando prompts de IA

O Dream Machine é uma ferramenta de inteligência artificial (IA) da Luma Labs que permite a criação de vídeos realistas e de alta qualidade a partir de descrições textuais simples. A ferramenta se destaca por sua capacidade de gerar vídeos em apenas alguns minutos, utilizando um modelo de transformador altamente escalável e eficiente treinado diretamente em vídeos. Isso a torna capaz de produzir imagens fisicamente precisas, consistentes e dinâmicas.

Este post foi modificado pela última vez em %s = human-readable time difference 18:00

Vinicius Siqueira