Inteligência Artificial

Nvidia faz pedido de patente para máquina que permite modelos de IA treinarem uns aos outros

A Nvidia, gigante dos chips, registrou um pedido de patente para uma máquina que permite modelos de IA treinarem uns aos outros. O sistema, apresentado no mês passado e chamado de "call and response" (chamada e resposta), promete transformar o cenário da tecnologia.

Publicado por
Uesley Durães

O sistema de “chamada e resposta”, de acordo com o documento, funciona da seguinte forma:

  • Um modelo de IA de uso geral é treinado em um grande conjunto de dados.
  • Esse modelo então recebe uma série de entradas, como perguntas ou solicitações, para as quais ele fornece respostas.
  • O sistema armazena esses pares de chamada e resposta e os utiliza como dados de treinamento para um modelo diferente.
  • O novo modelo é treinado apenas em pares de chamada e resposta que sejam relevantes para a tarefa em questão.

A tecnologia da Nvidia tem vários atrativos para desenvolvedores. Em primeiro lugar, ela pode ajudar a contornar o tedioso processo de obtenção e anotação de grandes conjuntos de dados. Em segundo lugar, ela evita o uso de modelos de uso geral para tarefas específicas, o que pode levar a resultados insatisfatórios. Por fim, ela pode ajudar a criar modelos que oferecem os mesmos benefícios dos de uso geral, sem consumir tanta energia.

Aqui estão alguns exemplos específicos de como a tecnologia da Nvidia poderia ser usada:

  • Um modelo de IA de uso geral poderia ser treinado em um grande conjunto de dados de texto e código. Esse modelo poderia então ser usado para treinar um modelo específico para a tarefa de escrever código.
  • Um modelo de IA de uso geral poderia ser treinado em um grande conjunto de dados de imagens. Esse modelo poderia então ser usado para treinar um modelo específico para a tarefa de reconhecer objetos em imagens.
  • Um modelo de IA de uso geral poderia ser treinado em um grande conjunto de dados de dados de sensores. Esse modelo poderia então ser usado para treinar um modelo específico para a tarefa de controlar um robô.

A proposta da empresa vai em direção do objetivo de se manter como líder na corrida da IA. A firma domina o cenário com suas GPUs e kits de desenvolvimento. No trimestre passado a Nvidia conseguiu US$ 10,3 bilhões em receita de data center, que está diretamente ligado ao trabalho com IA, relatando um aumento de 171% ano a ano. 

O pedido, registrado no Escritório de Marcas e Patentes dos Estados Unidos (USPTO), pode tranformar toda a cadeia de treinamento de novos modelos. Questões envolvendo problemáticas sobre a reprodução de conteúdos sensíveis por parte desses modelos não foram pontuadas. Detalhes de como seria disponibilizado o sistema também não, mas esse pode ser um passo importante no desenvolvimento de modelos de IA. Ela pode facilitar o desenvolvimento de modelos de IA específicos para tarefas específicas, sem a necessidade de grandes conjuntos de dados ou modelos de IA de uso geral.

Veja também:

Este post foi modificado pela última vez em %s = human-readable time difference 19:46

Uesley Durães

Posts recentes

Google se associa à Apptronik para desenvolver robôs humanoides

O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…

20 de dezembro de 2024

Genesis: Um novo patamar para simulações físicas em IA

Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…

20 de dezembro de 2024

Google lança seu próprio modelo de IA de “raciocínio”

O Google acabou de lançar o que está chamando de um novo modelo de inteligência…

19 de dezembro de 2024

GitHub Copilot agora é gratuito

A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…

19 de dezembro de 2024

ChatGPT ganha um novo número de telefone; veja

A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…

19 de dezembro de 2024

Google lança novo benchmark para testar a factualidade de LLMs

O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…

18 de dezembro de 2024