Genmo lança modelo de vídeo de IA de código aberto

Publicado por

Isabella Caminoto

23 de outubro de 2024 16:00

A startup de inteligência artificial (IA) Genmo acaba de lançar Mochi 1, um novo modelo de geração de vídeo de código aberto que afirma rivalizar com concorrentes fechados como Runway, Pika e Kling – enquanto está livremente disponível para desenvolvedores e pesquisadores.

Os detalhes

Mochi é construído em uma nova arquitetura de 10 bilhões de parâmetros chamada AsymmDiT, tornando-o o maior modelo de geração de vídeo de código aberto já lançado.

O modelo se concentra fortemente na qualidade do movimento e na adesão ao prompt, gerando vídeos de 480p a 30fps por até 5,4 segundos.

Mochi superou modelos top como Kling, Runway Gen-3, Luma’s Dream Machine e Pika em qualidade de movimento e adesão ao prompt durante os testes.

Uma versão de alta definição, Mochi 1 HD, com suporte a 720p e capacidades de imagem para vídeo, está planejada para ser lançada ainda este ano.

A Genmo também anunciou que garantiu US$ 28,4 milhões em financiamento da Série A, com Mochi-1 sendo o primeiro passo da empresa para construir “simuladores mundiais”.

Por que isso importa

O vídeo de IA de código aberto está oficialmente competindo com o topo do mercado. O Mochi da Genmo é um lançamento extremamente impressionante que mostra como o cenário de geração de vídeo está prestes a se tornar competitivo – especialmente com os grandes dominós (Sora, Midjourney) ainda por vir.

Leia também:

Genmo lança modelo de vídeo de IA de código aberto

Este post foi modificado pela última vez em %s = human-readable time difference 13:43

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.