Inteligência Artificial

Nvidia faz pedido de patente para máquina que permite modelos de IA treinarem uns aos outros

A Nvidia, gigante dos chips, registrou um pedido de patente para uma máquina que permite modelos de IA treinarem uns aos outros. O sistema, apresentado no mês passado e chamado de "call and response" (chamada e resposta), promete transformar o cenário da tecnologia.

Publicado por
Uesley Durães

O sistema de “chamada e resposta”, de acordo com o documento, funciona da seguinte forma:

  • Um modelo de IA de uso geral é treinado em um grande conjunto de dados.
  • Esse modelo então recebe uma série de entradas, como perguntas ou solicitações, para as quais ele fornece respostas.
  • O sistema armazena esses pares de chamada e resposta e os utiliza como dados de treinamento para um modelo diferente.
  • O novo modelo é treinado apenas em pares de chamada e resposta que sejam relevantes para a tarefa em questão.

A tecnologia da Nvidia tem vários atrativos para desenvolvedores. Em primeiro lugar, ela pode ajudar a contornar o tedioso processo de obtenção e anotação de grandes conjuntos de dados. Em segundo lugar, ela evita o uso de modelos de uso geral para tarefas específicas, o que pode levar a resultados insatisfatórios. Por fim, ela pode ajudar a criar modelos que oferecem os mesmos benefícios dos de uso geral, sem consumir tanta energia.

Aqui estão alguns exemplos específicos de como a tecnologia da Nvidia poderia ser usada:

  • Um modelo de IA de uso geral poderia ser treinado em um grande conjunto de dados de texto e código. Esse modelo poderia então ser usado para treinar um modelo específico para a tarefa de escrever código.
  • Um modelo de IA de uso geral poderia ser treinado em um grande conjunto de dados de imagens. Esse modelo poderia então ser usado para treinar um modelo específico para a tarefa de reconhecer objetos em imagens.
  • Um modelo de IA de uso geral poderia ser treinado em um grande conjunto de dados de dados de sensores. Esse modelo poderia então ser usado para treinar um modelo específico para a tarefa de controlar um robô.

A proposta da empresa vai em direção do objetivo de se manter como líder na corrida da IA. A firma domina o cenário com suas GPUs e kits de desenvolvimento. No trimestre passado a Nvidia conseguiu US$ 10,3 bilhões em receita de data center, que está diretamente ligado ao trabalho com IA, relatando um aumento de 171% ano a ano. 

O pedido, registrado no Escritório de Marcas e Patentes dos Estados Unidos (USPTO), pode tranformar toda a cadeia de treinamento de novos modelos. Questões envolvendo problemáticas sobre a reprodução de conteúdos sensíveis por parte desses modelos não foram pontuadas. Detalhes de como seria disponibilizado o sistema também não, mas esse pode ser um passo importante no desenvolvimento de modelos de IA. Ela pode facilitar o desenvolvimento de modelos de IA específicos para tarefas específicas, sem a necessidade de grandes conjuntos de dados ou modelos de IA de uso geral.

Veja também:

Este post foi modificado pela última vez em %s = human-readable time difference 19:46

Uesley Durães

Posts recentes

Gemini recupera o primeiro lugar no ranking de LLM

O mais recente modelo experimental Gemini da Google (1121) acabou de recuperar o primeiro lugar…

22 de novembro de 2024

OpenAI mira no Chrome com planos de desenvolver seu próprio navegador

A OpenAI está considerando desenvolver um navegador web que se integraria ao ChatGPT e aos…

22 de novembro de 2024

DeepMind dá um salto gigante na computação quântica com o AlphaQubit

O Google DeepMind acaba de apresentar o AlphaQubit, um sistema de inteligência artificial (IA) que…

21 de novembro de 2024

ChatGPT está mais perto de lançar sua IA visual

Um código recém-descoberto na última versão beta do ChatGPT sugere que a OpenAI pode estar…

21 de novembro de 2024

DeepSeek revela poderosa IA de raciocínio; veja

A empresa chinesa de pesquisa em inteligência artificial (IA), DeepSeek, acaba de lançar o R1-Lite-Preview,…

21 de novembro de 2024

OpenAI lança curso gratuito de IA para professores

A OpenAI e a parceira sem fins lucrativos Common Sense Media lançaram um curso de…

20 de novembro de 2024