Pesquisadores da Meta apresentam algoritmo que faz um robô aprender com vídeo do YouTube

A MetaAI, braço de inteligência artificial da Meta, apresentou um algoritmo que promete que os robôs aprendam e repliquem ações humanas ao assistir vídeos do YouTube.

Publicado por
Uesley Durães

Essa nova iniciativa promete preencher a lacuna entre conjuntos de códgios e a aplicação prática de robôs, abrindo caminho para a execução de tarefas complexas ou, como muitos gostam de chamar, a “revolução das máquinas”.

Os pesquisadores da Meta exploraram o potencial dos vídeos de interações humanas para treinar os robôs. Diferente dos modelos anteriores, que se limitavam a conjuntos de dados estáticos, esse algoritmo utiliza vídeos de comportamento humano disponíveis na internet como fonte de aprendizado para os robôs.

O conceito-chave dessa abordagem é conhecido como “concordâncias”, se referindo às ações e interações possíveis entre objetos e ambientes. Ao compreender essas possibilidades por meio dos vídeos humanos, o robô adquire uma representação versátil, permitindo a execução de tarefas complexas em diferentes situações, segundo a pesquisa. 

Os pesquisadores integraram seu modelo de acessibilidade com quatro tipos de aprendizado de robôs: aprendizado de imitação offline, exploração, aprendizado condicionado a objetivos e parametrização de ação para reforço do aprendizado. Esses nomes parecem complexos, mas dizem respeito a repetição de movimentos orientada por um comando.

Nos vídeos, os pesquisadores adicionaram detectores de interação mão-objeto para identificar a região de contato e rastrear a trajetória das mãos. 

Ao contrário dos robôs anteriores, que eram limitados a imitar ações em ambientes específicos, esse novo algoritmo permitiu progressos significativos na generalização das ações dos robôs. Agora, eles podem aplicar seu conhecimento adquirido em ambientes desconhecidos, representando um avanço notável em direção à Inteligência Geral Artificial, como narra o paper do projeto. Veja no vídeo a representação do projeto:

Os pesquisadores ainda explicam que, com o objetivo de impulsionar as pesquisas, planejam compartilhar os códigos e mais detalhes do projeto, para que mais desenvolvedores tenham acesso e possam otimizar o processo. 

E aí, já pensou dar o link de uma receita publicada no YouTube e o robô reproduzir o prato para você?

Veja também:

Este post foi modificado pela última vez em %s = human-readable time difference 10:37

Uesley Durães

Posts recentes

Google se associa à Apptronik para desenvolver robôs humanoides

O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…

20 de dezembro de 2024

Genesis: Um novo patamar para simulações físicas em IA

Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…

20 de dezembro de 2024

Google lança seu próprio modelo de IA de “raciocínio”

O Google acabou de lançar o que está chamando de um novo modelo de inteligência…

19 de dezembro de 2024

GitHub Copilot agora é gratuito

A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…

19 de dezembro de 2024

ChatGPT ganha um novo número de telefone; veja

A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…

19 de dezembro de 2024

Google lança novo benchmark para testar a factualidade de LLMs

O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…

18 de dezembro de 2024