A Meta lançou o V-JEPA 2, um “modelo de mundo” que capacita sistemas de inteligência artificial (IA) a compreender a física e prever resultados no mundo real. Isso permite que robôs naveguem em ambientes desconhecidos e manipulem objetos que nunca viram antes.
PUBLICIDADE
Detalhes do V-JEPA 2
- O modelo de 1,2 bilhão de parâmetros foi treinado com mais de 1 milhão de horas de vídeo, aprendendo como os objetos se movem, interagem e respondem a ações no mundo físico.
- O V-JEPA 2 alcançou taxas de sucesso de 65-80% na seleção e posicionamento de objetos desconhecidos em novos ambientes, usando metas visuais para planejar tarefas em várias etapas.
- A Meta afirma que o modelo roda 30 vezes mais rápido que o modelo Cosmos da Nvidia, enquanto alcança o desempenho de ponta (SOTA) em benchmarks de compreensão de vídeo.
- A empresa também divulgou três novos benchmarks revelando que, enquanto os humanos atingem 85-95% em tarefas de raciocínio físico, os modelos atuais de IA ainda enfrentam dificuldades.
Por que isso importa
Aterrar a IA na realidade física, em vez de apenas no raciocínio baseado em texto, é um desenvolvimento importante, já que tanto os agentes de IA quanto os robôs se tornam cada vez mais utilizados em tarefas do mundo real. A abordagem da Meta pode ajudar a IA a se adaptar a ambientes reais desordenados e imprevisíveis em tempo real, sem a necessidade de grandes conjuntos de dados de treinamento específicos para cada tarefa.
Leia também:



