Pesquisadores da Meta apresentam algoritmo que faz um robô aprender com vídeo do YouTube

A MetaAI, braço de inteligência artificial da Meta, apresentou um algoritmo que promete que os robôs aprendam e repliquem ações humanas ao assistir vídeos do YouTube.

Publicado por
Uesley Durães

Essa nova iniciativa promete preencher a lacuna entre conjuntos de códgios e a aplicação prática de robôs, abrindo caminho para a execução de tarefas complexas ou, como muitos gostam de chamar, a “revolução das máquinas”.

Os pesquisadores da Meta exploraram o potencial dos vídeos de interações humanas para treinar os robôs. Diferente dos modelos anteriores, que se limitavam a conjuntos de dados estáticos, esse algoritmo utiliza vídeos de comportamento humano disponíveis na internet como fonte de aprendizado para os robôs.

O conceito-chave dessa abordagem é conhecido como “concordâncias”, se referindo às ações e interações possíveis entre objetos e ambientes. Ao compreender essas possibilidades por meio dos vídeos humanos, o robô adquire uma representação versátil, permitindo a execução de tarefas complexas em diferentes situações, segundo a pesquisa. 

Os pesquisadores integraram seu modelo de acessibilidade com quatro tipos de aprendizado de robôs: aprendizado de imitação offline, exploração, aprendizado condicionado a objetivos e parametrização de ação para reforço do aprendizado. Esses nomes parecem complexos, mas dizem respeito a repetição de movimentos orientada por um comando.

Nos vídeos, os pesquisadores adicionaram detectores de interação mão-objeto para identificar a região de contato e rastrear a trajetória das mãos. 

Ao contrário dos robôs anteriores, que eram limitados a imitar ações em ambientes específicos, esse novo algoritmo permitiu progressos significativos na generalização das ações dos robôs. Agora, eles podem aplicar seu conhecimento adquirido em ambientes desconhecidos, representando um avanço notável em direção à Inteligência Geral Artificial, como narra o paper do projeto. Veja no vídeo a representação do projeto:

Os pesquisadores ainda explicam que, com o objetivo de impulsionar as pesquisas, planejam compartilhar os códigos e mais detalhes do projeto, para que mais desenvolvedores tenham acesso e possam otimizar o processo. 

E aí, já pensou dar o link de uma receita publicada no YouTube e o robô reproduzir o prato para você?

Veja também:

Este post foi modificado pela última vez em %s = human-readable time difference 10:37

Uesley Durães

Posts recentes

DeepSeek revela poderosa IA de raciocínio; veja

A empresa chinesa de pesquisa em inteligência artificial (IA), DeepSeek, acaba de lançar o R1-Lite-Preview,…

21 de novembro de 2024

OpenAI lança curso gratuito de IA para professores

A OpenAI e a parceira sem fins lucrativos Common Sense Media lançaram um curso de…

20 de novembro de 2024

Robôs da Figure transformam produção da BMW; saiba como

Brett Adcock, CEO da Figure, postou uma atualização sobre os robôs humanoides da empresa trabalhando…

20 de novembro de 2024

Microsoft revela agentes de IA especializados e ferramentas de automação

A Microsoft acaba de apresentar uma suíte de novos agentes de inteligência artificial (IA) especializados…

20 de novembro de 2024

Google Gemini agora pode lembrar coisas sobre você; entenda

O Google Gemini agora pode “lembrar” certas coisas sobre você, como seus interesses e preferências…

19 de novembro de 2024

ChatGPT supera médicos em desafio de diagnóstico; veja

Um novo estudo do UVA Health System revelou que o ChatGPT-4 alcançou uma precisão diagnóstica…

19 de novembro de 2024