Pesquisadores da Meta apresentam algoritmo que faz um robô aprender com vídeo do YouTube

A MetaAI, braço de inteligência artificial da Meta, apresentou um algoritmo que promete que os robôs aprendam e repliquem ações humanas ao assistir vídeos do YouTube.

Publicado por
Uesley Durães

Essa nova iniciativa promete preencher a lacuna entre conjuntos de códgios e a aplicação prática de robôs, abrindo caminho para a execução de tarefas complexas ou, como muitos gostam de chamar, a “revolução das máquinas”.

Os pesquisadores da Meta exploraram o potencial dos vídeos de interações humanas para treinar os robôs. Diferente dos modelos anteriores, que se limitavam a conjuntos de dados estáticos, esse algoritmo utiliza vídeos de comportamento humano disponíveis na internet como fonte de aprendizado para os robôs.

O conceito-chave dessa abordagem é conhecido como “concordâncias”, se referindo às ações e interações possíveis entre objetos e ambientes. Ao compreender essas possibilidades por meio dos vídeos humanos, o robô adquire uma representação versátil, permitindo a execução de tarefas complexas em diferentes situações, segundo a pesquisa. 

Os pesquisadores integraram seu modelo de acessibilidade com quatro tipos de aprendizado de robôs: aprendizado de imitação offline, exploração, aprendizado condicionado a objetivos e parametrização de ação para reforço do aprendizado. Esses nomes parecem complexos, mas dizem respeito a repetição de movimentos orientada por um comando.

Nos vídeos, os pesquisadores adicionaram detectores de interação mão-objeto para identificar a região de contato e rastrear a trajetória das mãos. 

Ao contrário dos robôs anteriores, que eram limitados a imitar ações em ambientes específicos, esse novo algoritmo permitiu progressos significativos na generalização das ações dos robôs. Agora, eles podem aplicar seu conhecimento adquirido em ambientes desconhecidos, representando um avanço notável em direção à Inteligência Geral Artificial, como narra o paper do projeto. Veja no vídeo a representação do projeto:

Os pesquisadores ainda explicam que, com o objetivo de impulsionar as pesquisas, planejam compartilhar os códigos e mais detalhes do projeto, para que mais desenvolvedores tenham acesso e possam otimizar o processo. 

E aí, já pensou dar o link de uma receita publicada no YouTube e o robô reproduzir o prato para você?

Veja também:

Este post foi modificado pela última vez em 27 de junho de 2023 10:37

Uesley Durães

Posts recentes

Prime Video lança recurso de resumo automático com IA

A Amazon Prime Video está recebendo um novo recurso alimentado por IA generativa para ajudá-lo…

4 de novembro de 2024

Election Information Hub: Perplexity lança central de informações eleitorais com IA

A empresa de busca com inteligência artificial (IA) Perplexity está testando a ideia de usar…

4 de novembro de 2024

ADNOC dos Emirados Árabes Unidos irá implantar IA autônoma no setor de energia; veja

A gigante de energia dos Emirados Árabes Unidos, ADNOC, aplicará inteligência artificial (IA) altamente autônoma…

4 de novembro de 2024

Claude ganha novas capacidades de visão de PDF

A Anthropic acabou de lançar o suporte a PDF para seu modelo Claude 3.5 Sonnet…

4 de novembro de 2024

Google integra controles para casa inteligente no Gemini

O Google está adicionando uma extensão do Google Home ao aplicativo Gemini, permitindo que você…

3 de novembro de 2024

Walt Disney forma unidade de negócios para coordenar o uso de IA e realidade aumentada

A Walt Disney está formando um novo grupo para coordenar o uso da empresa de…

1 de novembro de 2024