A MetaAI, braço de inteligência artificial da Meta, apresentou um algoritmo que promete que os robôs aprendam e repliquem ações humanas ao assistir vídeos do YouTube.
Essa nova iniciativa promete preencher a lacuna entre conjuntos de códgios e a aplicação prática de robôs, abrindo caminho para a execução de tarefas complexas ou, como muitos gostam de chamar, a “revolução das máquinas”.
Os pesquisadores da Meta exploraram o potencial dos vídeos de interações humanas para treinar os robôs. Diferente dos modelos anteriores, que se limitavam a conjuntos de dados estáticos, esse algoritmo utiliza vídeos de comportamento humano disponíveis na internet como fonte de aprendizado para os robôs.
O conceito-chave dessa abordagem é conhecido como “concordâncias”, se referindo às ações e interações possíveis entre objetos e ambientes. Ao compreender essas possibilidades por meio dos vídeos humanos, o robô adquire uma representação versátil, permitindo a execução de tarefas complexas em diferentes situações, segundo a pesquisa.
Os pesquisadores integraram seu modelo de acessibilidade com quatro tipos de aprendizado de robôs: aprendizado de imitação offline, exploração, aprendizado condicionado a objetivos e parametrização de ação para reforço do aprendizado. Esses nomes parecem complexos, mas dizem respeito a repetição de movimentos orientada por um comando.
Nos vídeos, os pesquisadores adicionaram detectores de interação mão-objeto para identificar a região de contato e rastrear a trajetória das mãos.
Ao contrário dos robôs anteriores, que eram limitados a imitar ações em ambientes específicos, esse novo algoritmo permitiu progressos significativos na generalização das ações dos robôs. Agora, eles podem aplicar seu conhecimento adquirido em ambientes desconhecidos, representando um avanço notável em direção à Inteligência Geral Artificial, como narra o paper do projeto. Veja no vídeo a representação do projeto:
Os pesquisadores ainda explicam que, com o objetivo de impulsionar as pesquisas, planejam compartilhar os códigos e mais detalhes do projeto, para que mais desenvolvedores tenham acesso e possam otimizar o processo.
E aí, já pensou dar o link de uma receita publicada no YouTube e o robô reproduzir o prato para você?
Veja também:
Este post foi modificado pela última vez em %s = human-readable time difference 10:37
A empresa chinesa de pesquisa em inteligência artificial (IA), DeepSeek, acaba de lançar o R1-Lite-Preview,…
A OpenAI e a parceira sem fins lucrativos Common Sense Media lançaram um curso de…
Brett Adcock, CEO da Figure, postou uma atualização sobre os robôs humanoides da empresa trabalhando…
A Microsoft acaba de apresentar uma suíte de novos agentes de inteligência artificial (IA) especializados…
O Google Gemini agora pode “lembrar” certas coisas sobre você, como seus interesses e preferências…
Um novo estudo do UVA Health System revelou que o ChatGPT-4 alcançou uma precisão diagnóstica…