Genmo lança modelo de vídeo de IA de código aberto

A startup de inteligência artificial (IA) Genmo acaba de lançar Mochi 1, um novo modelo de geração de vídeo de código aberto que afirma rivalizar com concorrentes fechados como Runway, Pika e Kling – enquanto está livremente disponível para desenvolvedores e pesquisadores.

PUBLICIDADE

Os detalhes

Mochi é construído em uma nova arquitetura de 10 bilhões de parâmetros chamada AsymmDiT, tornando-o o maior modelo de geração de vídeo de código aberto já lançado.

O modelo se concentra fortemente na qualidade do movimento e na adesão ao prompt, gerando vídeos de 480p a 30fps por até 5,4 segundos.

Mochi superou modelos top como Kling, Runway Gen-3, Luma’s Dream Machine e Pika em qualidade de movimento e adesão ao prompt durante os testes.

PUBLICIDADE

Uma versão de alta definição, Mochi 1 HD, com suporte a 720p e capacidades de imagem para vídeo, está planejada para ser lançada ainda este ano.

A Genmo também anunciou que garantiu US$ 28,4 milhões em financiamento da Série A, com Mochi-1 sendo o primeiro passo da empresa para construir “simuladores mundiais”.

Por que isso importa

O vídeo de IA de código aberto está oficialmente competindo com o topo do mercado. O Mochi da Genmo é um lançamento extremamente impressionante que mostra como o cenário de geração de vídeo está prestes a se tornar competitivo – especialmente com os grandes dominós (Sora, Midjourney) ainda por vir.

PUBLICIDADE

Leia também:

Rolar para cima