🤖 guIA

Veo: Crie vídeos ultrarrealistas com a IA do Google

Veo é o modelo de geração de vídeo mais avançado da DeepMind, capaz de criar vídeos de alta qualidade com resolução 1080p e duração superior a um minuto. Ele entende nuances e tons dos prompts, oferecendo um nível inédito de controle criativo. Veo é útil para cineastas, criadores de conteúdo e educadores, tornando a produção de vídeo acessível para todos. Suas funcionalidades incluem edição baseada em comandos, edição mascarada, e geração de vídeos a partir de imagens e prompts textuais.

Publicado por
Vinicius Siqueira
guIAVeo: Crie vídeos ultrarrealistas com a IA do Google
CATEGORIAVídeos
PARA QUE SERVE?Criação de vídeos ultrarrealistas com mais de 1 minuto
QUANTO CUSTA?Acesso limitado a poucos criadores de conteúdo
ONDE ENCONTRO?deepmind.google/technologies/veo/
VALE A PENA?Sim, mas a ferramenta está está em acesso limitado para poucos usuários.

Google I/O

O Veo foi anunciado e lançado em 14 de maio de 2024, como parte dos novos modelos e ferramentas de mídia generativa desenvolvidos pela Google DeepMind. A ferramenta foi anunciada durante o Google I/O 2024, juntamente com o Imagen 3 (outra ferramenta de IA especializada em imagem), em um movimento concorrendo diretamente com a Sora da OpenAI.

As plataformas estão disponíveis no ImageFX e VideoFX apenas para um grupo selecionado de criadores. Ainda não há previsão de lançamento para o público geral, mas é possível se inscrever na lista de espera.

Um destaque do Veo é a capacidade de adicionar imagens aos comandos de geração de vídeos. Basta inserir a foto e o prompt detalhando os elementos a serem gerados.

O Google também menciona que, no futuro, alguns recursos do Veo estarão disponíveis para o YouTube Shorts.

Tecnologias que influenciaram o Veo

O desenvolvimento do Veo foi influenciado por várias tecnologias anteriores da DeepMind, incluindo:

  • Generative Query Network (GQN)
  • DVD-GAN
  • Imagen-Video
  • Phenaki
  • WALT
  • VideoPoet
  • Lumiere
  • Arquitetura Transformer
  • Gemini

Essas tecnologias contribuíram para aprimorar a compreensão de linguagem natural e semântica visual, bem como para melhorar a qualidade e eficiência na geração de vídeos.

Diferenciais do VEO

  1. Alta Qualidade de Vídeo: Veo gera vídeos em resolução 1080p que podem durar mais de um minuto, com uma ampla variedade de estilos visuais e cinematográficos.
  2. Controle Criativo Inédito: O modelo compreende e responde a nuances e tons dos prompts, permitindo um nível elevado de controle criativo. Ele pode gerar efeitos cinematográficos específicos, como time lapses ou vistas aéreas.
  3. Consistência Visual Entre Frames: Utilizando transformadores de difusão latente, Veo minimiza inconsistências visuais, como flickering ou mudanças inesperadas entre frames, mantendo a estabilidade de personagens, objetos e estilos ao longo do vídeo.
  4. Edição Precisa: Veo permite a edição de vídeos a partir de comandos textuais, incluindo a adição de elementos específicos a cenas já existentes. Suporta edição mascarada para alterar áreas específicas de um vídeo.
  5. Geração Baseada em Imagens e Prompts Textuais: Pode criar vídeos a partir de uma imagem de referência combinada com um prompt textual, seguindo o estilo da imagem e as instruções do usuário.
  6. Extensão de Vídeo: Capaz de criar e estender videoclipes para 60 segundos ou mais, seja a partir de um único prompt ou de uma sequência de prompts que contam uma história.
  7. Responsabilidade e Segurança: Veo utiliza SynthID para marcação e identificação de conteúdo gerado por IA, além de passar por filtros de segurança e verificações de memorização para mitigar riscos de privacidade, direitos autorais e preconceitos.
  8. Eficiência e Qualidade Melhoradas: Com uso de representações de vídeo comprimidas de alta qualidade, Veo é mais eficiente e gera vídeos de melhor qualidade de forma mais rápida.

Acesso (limitado) da ferramenta:

Para acessar o Veo, você pode seguir estes passos:

  1. Inscrição no VideoFX: Veo está disponível através do VideoFX, uma ferramenta experimental do Google Labs. Você pode se inscrever na lista de espera para testar o VideoFX visitando o site do VideoFX.
  2. Disponibilidade Futura no YouTube Shorts: Algumas funcionalidades do Veo serão integradas ao YouTube Shorts no futuro. Fique atento às atualizações e anúncios sobre essa integração.
  3. Feedback de Criadores Selecionados: No início, algumas das funcionalidades do Veo serão disponibilizadas para criadores selecionados. Caso você seja um criador de conteúdo, pode ser uma boa ideia acompanhar as comunicações do Google DeepMind para oportunidades de feedback e testes.

Observações: Veo, a nova ferramenta de geração de vídeo da DeepMind, apresenta inovações significativas no mercado de criação de conteúdo digital. Entre os pontos positivos, destaca-se a alta qualidade dos vídeos em 1080p, o controle criativo detalhado sobre os elementos do vídeo e a consistência visual entre frames, garantida por transformadores de difusão latente. Veo é versátil, suportando edição baseada em comandos textuais, edição mascarada e geração de vídeos a partir de imagens e textos. Além disso, aborda questões de privacidade e direitos autorais com o uso de SynthID para marcação de conteúdo gerado por IA e filtros de segurança.

No entanto, a disponibilidade inicial limitada através do VideoFX e para criadores selecionados pode restringir o acesso a uma base mais ampla de usuários. A geração de vídeos de alta qualidade pode exigir uma infraestrutura tecnológica robusta, e há o risco de uso indevido de tecnologias de geração de vídeo, como deepfakes, apesar das medidas de segurança.

Teste também:

Este post foi modificado pela última vez em %s = human-readable time difference 18:00

Vinicius Siqueira

Posts recentes

Google se associa à Apptronik para desenvolver robôs humanoides

O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…

20 de dezembro de 2024

Genesis: Um novo patamar para simulações físicas em IA

Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…

20 de dezembro de 2024

Google lança seu próprio modelo de IA de “raciocínio”

O Google acabou de lançar o que está chamando de um novo modelo de inteligência…

19 de dezembro de 2024

GitHub Copilot agora é gratuito

A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…

19 de dezembro de 2024

ChatGPT ganha um novo número de telefone; veja

A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…

19 de dezembro de 2024

Google lança novo benchmark para testar a factualidade de LLMs

O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…

18 de dezembro de 2024