Avaliação do Editor
guIA | Veo: Crie vídeos ultrarrealistas com a IA do Google |
---|---|
CATEGORIA | Vídeos |
PARA QUE SERVE? | Criação de vídeos ultrarrealistas com mais de 1 minuto |
QUANTO CUSTA? | Acesso limitado a poucos criadores de conteúdo |
ONDE ENCONTRO? | deepmind.google/technologies/veo/ |
VALE A PENA? | Sim, mas a ferramenta está está em acesso limitado para poucos usuários. |
Google I/O
O Veo foi anunciado e lançado em 14 de maio de 2024, como parte dos novos modelos e ferramentas de mídia generativa desenvolvidos pela Google DeepMind. A ferramenta foi anunciada durante o Google I/O 2024, juntamente com o Imagen 3 (outra ferramenta de IA especializada em imagem), em um movimento concorrendo diretamente com a Sora da OpenAI.
PUBLICIDADE
As plataformas estão disponíveis no ImageFX e VideoFX apenas para um grupo selecionado de criadores. Ainda não há previsão de lançamento para o público geral, mas é possível se inscrever na lista de espera.
Um destaque do Veo é a capacidade de adicionar imagens aos comandos de geração de vídeos. Basta inserir a foto e o prompt detalhando os elementos a serem gerados.
O Google também menciona que, no futuro, alguns recursos do Veo estarão disponíveis para o YouTube Shorts.
PUBLICIDADE
Tecnologias que influenciaram o Veo
O desenvolvimento do Veo foi influenciado por várias tecnologias anteriores da DeepMind, incluindo:
- Generative Query Network (GQN)
- DVD-GAN
- Imagen-Video
- Phenaki
- WALT
- VideoPoet
- Lumiere
- Arquitetura Transformer
- Gemini
Essas tecnologias contribuíram para aprimorar a compreensão de linguagem natural e semântica visual, bem como para melhorar a qualidade e eficiência na geração de vídeos.
Diferenciais do VEO
- Alta Qualidade de Vídeo: Veo gera vídeos em resolução 1080p que podem durar mais de um minuto, com uma ampla variedade de estilos visuais e cinematográficos.
- Controle Criativo Inédito: O modelo compreende e responde a nuances e tons dos prompts, permitindo um nível elevado de controle criativo. Ele pode gerar efeitos cinematográficos específicos, como time lapses ou vistas aéreas.
- Consistência Visual Entre Frames: Utilizando transformadores de difusão latente, Veo minimiza inconsistências visuais, como flickering ou mudanças inesperadas entre frames, mantendo a estabilidade de personagens, objetos e estilos ao longo do vídeo.
- Edição Precisa: Veo permite a edição de vídeos a partir de comandos textuais, incluindo a adição de elementos específicos a cenas já existentes. Suporta edição mascarada para alterar áreas específicas de um vídeo.
- Geração Baseada em Imagens e Prompts Textuais: Pode criar vídeos a partir de uma imagem de referência combinada com um prompt textual, seguindo o estilo da imagem e as instruções do usuário.
- Extensão de Vídeo: Capaz de criar e estender videoclipes para 60 segundos ou mais, seja a partir de um único prompt ou de uma sequência de prompts que contam uma história.
- Responsabilidade e Segurança: Veo utiliza SynthID para marcação e identificação de conteúdo gerado por IA, além de passar por filtros de segurança e verificações de memorização para mitigar riscos de privacidade, direitos autorais e preconceitos.
- Eficiência e Qualidade Melhoradas: Com uso de representações de vídeo comprimidas de alta qualidade, Veo é mais eficiente e gera vídeos de melhor qualidade de forma mais rápida.
Acesso (limitado) da ferramenta:
Para acessar o Veo, você pode seguir estes passos:
- Inscrição no VideoFX: Veo está disponível através do VideoFX, uma ferramenta experimental do Google Labs. Você pode se inscrever na lista de espera para testar o VideoFX visitando o site do VideoFX.
- Disponibilidade Futura no YouTube Shorts: Algumas funcionalidades do Veo serão integradas ao YouTube Shorts no futuro. Fique atento às atualizações e anúncios sobre essa integração.
- Feedback de Criadores Selecionados: No início, algumas das funcionalidades do Veo serão disponibilizadas para criadores selecionados. Caso você seja um criador de conteúdo, pode ser uma boa ideia acompanhar as comunicações do Google DeepMind para oportunidades de feedback e testes.
Observações: Veo, a nova ferramenta de geração de vídeo da DeepMind, apresenta inovações significativas no mercado de criação de conteúdo digital. Entre os pontos positivos, destaca-se a alta qualidade dos vídeos em 1080p, o controle criativo detalhado sobre os elementos do vídeo e a consistência visual entre frames, garantida por transformadores de difusão latente. Veo é versátil, suportando edição baseada em comandos textuais, edição mascarada e geração de vídeos a partir de imagens e textos. Além disso, aborda questões de privacidade e direitos autorais com o uso de SynthID para marcação de conteúdo gerado por IA e filtros de segurança.
PUBLICIDADE
No entanto, a disponibilidade inicial limitada através do VideoFX e para criadores selecionados pode restringir o acesso a uma base mais ampla de usuários. A geração de vídeos de alta qualidade pode exigir uma infraestrutura tecnológica robusta, e há o risco de uso indevido de tecnologias de geração de vídeo, como deepfakes, apesar das medidas de segurança.
Teste também: