A MetaAI, braço de inteligência artificial da Meta, apresentou um algoritmo que promete que os robôs aprendam e repliquem ações humanas ao assistir vídeos do YouTube.
Essa nova iniciativa promete preencher a lacuna entre conjuntos de códgios e a aplicação prática de robôs, abrindo caminho para a execução de tarefas complexas ou, como muitos gostam de chamar, a “revolução das máquinas”.
Os pesquisadores da Meta exploraram o potencial dos vídeos de interações humanas para treinar os robôs. Diferente dos modelos anteriores, que se limitavam a conjuntos de dados estáticos, esse algoritmo utiliza vídeos de comportamento humano disponíveis na internet como fonte de aprendizado para os robôs.
O conceito-chave dessa abordagem é conhecido como “concordâncias”, se referindo às ações e interações possíveis entre objetos e ambientes. Ao compreender essas possibilidades por meio dos vídeos humanos, o robô adquire uma representação versátil, permitindo a execução de tarefas complexas em diferentes situações, segundo a pesquisa.
Os pesquisadores integraram seu modelo de acessibilidade com quatro tipos de aprendizado de robôs: aprendizado de imitação offline, exploração, aprendizado condicionado a objetivos e parametrização de ação para reforço do aprendizado. Esses nomes parecem complexos, mas dizem respeito a repetição de movimentos orientada por um comando.
Nos vídeos, os pesquisadores adicionaram detectores de interação mão-objeto para identificar a região de contato e rastrear a trajetória das mãos.
Ao contrário dos robôs anteriores, que eram limitados a imitar ações em ambientes específicos, esse novo algoritmo permitiu progressos significativos na generalização das ações dos robôs. Agora, eles podem aplicar seu conhecimento adquirido em ambientes desconhecidos, representando um avanço notável em direção à Inteligência Geral Artificial, como narra o paper do projeto. Veja no vídeo a representação do projeto:
Os pesquisadores ainda explicam que, com o objetivo de impulsionar as pesquisas, planejam compartilhar os códigos e mais detalhes do projeto, para que mais desenvolvedores tenham acesso e possam otimizar o processo.
E aí, já pensou dar o link de uma receita publicada no YouTube e o robô reproduzir o prato para você?
Veja também:
Este post foi modificado pela última vez em %s = human-readable time difference 10:37
O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…
Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…
O Google acabou de lançar o que está chamando de um novo modelo de inteligência…
A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…
A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…
O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…