A startup de inteligência artificial (IA) Genmo acaba de lançar Mochi 1, um novo modelo de geração de vídeo de código aberto que afirma rivalizar com concorrentes fechados como Runway, Pika e Kling – enquanto está livremente disponível para desenvolvedores e pesquisadores.
Mochi é construído em uma nova arquitetura de 10 bilhões de parâmetros chamada AsymmDiT, tornando-o o maior modelo de geração de vídeo de código aberto já lançado.
O modelo se concentra fortemente na qualidade do movimento e na adesão ao prompt, gerando vídeos de 480p a 30fps por até 5,4 segundos.
Mochi superou modelos top como Kling, Runway Gen-3, Luma’s Dream Machine e Pika em qualidade de movimento e adesão ao prompt durante os testes.
Uma versão de alta definição, Mochi 1 HD, com suporte a 720p e capacidades de imagem para vídeo, está planejada para ser lançada ainda este ano.
A Genmo também anunciou que garantiu US$ 28,4 milhões em financiamento da Série A, com Mochi-1 sendo o primeiro passo da empresa para construir “simuladores mundiais”.
O vídeo de IA de código aberto está oficialmente competindo com o topo do mercado. O Mochi da Genmo é um lançamento extremamente impressionante que mostra como o cenário de geração de vídeo está prestes a se tornar competitivo – especialmente com os grandes dominós (Sora, Midjourney) ainda por vir.
Leia também:
Este post foi modificado pela última vez em %s = human-readable time difference 13:43
A BlackForestLabs acaba de revelar o FLUX.1 Tools, quatro novos recursos de manipulação de imagens…
O mais recente modelo experimental Gemini da Google (1121) acabou de recuperar o primeiro lugar…
A OpenAI está considerando desenvolver um navegador web que se integraria ao ChatGPT e aos…
O Google DeepMind acaba de apresentar o AlphaQubit, um sistema de inteligência artificial (IA) que…
Um código recém-descoberto na última versão beta do ChatGPT sugere que a OpenAI pode estar…
A empresa chinesa de pesquisa em inteligência artificial (IA), DeepSeek, acaba de lançar o R1-Lite-Preview,…