Modelos de linguagem grandes (LLMs) podem raciocinar por analogia mesmo sem treinamento, aponta estudo

Um estudo realizado pelo Laboratório de Visão e Aprendizagem Computacional da Universidade da Califórnia descobriu que os modelos de linguagem grandes (LLMs) são capazes de raciocínio por analogia. A pesquisa foi divulgada na revista Nature Human Behavior no fim do mês passado.

Publicado por
Uesley Durães

O raciocínio analógico é a capacidade de comparar duas coisas e identificar semelhanças entre elas. Esta é uma habilidade cognitiva essencial que os humanos usam para aprender e resolver problemas.

O estudo descobriu que os LLMs podem usar o raciocínio analógico para aprender novas tarefas, mesmo quando não são diretamente treinados para essas tarefas. Por exemplo, o estudo mostrou que um modelo de linguagem pode aprender a jogar o jogo de damas, mesmo que não tenha sido treinado especificamente para jogar damas. 

O que é um modelo de linguagem grande (LLM)? | Glossário do Newsverso

O LLM fez isso observando como os humanos jogam damas e identificando semelhanças entre o jogo de damas e outros jogos que o LLM já havia aprendido.

O estudo também descobriu que os LLMs podem usar o raciocínio analógico para resolver problemas que são novos ou desafiadores. Por exemplo, um modelo pode ser usado para diagnosticar doenças, mesmo que não tenha sido treinado especificamente para diagnosticar doenças. O modelo fez isso observando os sintomas de pacientes e identificando semelhanças entre os sintomas dos pacientes e os sintomas de doenças que o LLM já havia aprendido.

Este estudo é um marco importante no desenvolvimento da inteligência artificial. Ele sugere que os LLMs podem ser usados para automatizar tarefas que atualmente são realizadas por humanos e que eles podem ser usados para resolver problemas que são novos ou desafiadores. 

Além disso, o estudo também tem implicações importantes para o campo da inteligência artificial. Ele sugere que os LLMs podem ser usados para criar sistemas de IA que são capazes de aprender e resolver problemas de uma forma semelhante aos humanos. Isso pode levar ao desenvolvimento de sistemas de IA que podem ser usados para uma ampla gama de tarefas, desde a tomada de decisões até o diagnóstico médico. Para conferir detalhes levantados pelos pesquisadores, clique aqui.

Veja também:

Este post foi modificado pela última vez em %s = human-readable time difference 18:17

Uesley Durães

Posts recentes

OpenAI mira no Chrome com planos de desenvolver seu próprio navegador

A OpenAI está considerando desenvolver um navegador web que se integraria ao ChatGPT e aos…

22 de novembro de 2024

DeepMind dá um salto gigante na computação quântica com o AlphaQubit

O Google DeepMind acaba de apresentar o AlphaQubit, um sistema de inteligência artificial (IA) que…

21 de novembro de 2024

ChatGPT está mais perto de lançar sua IA visual

Um código recém-descoberto na última versão beta do ChatGPT sugere que a OpenAI pode estar…

21 de novembro de 2024

DeepSeek revela poderosa IA de raciocínio; veja

A empresa chinesa de pesquisa em inteligência artificial (IA), DeepSeek, acaba de lançar o R1-Lite-Preview,…

21 de novembro de 2024

OpenAI lança curso gratuito de IA para professores

A OpenAI e a parceira sem fins lucrativos Common Sense Media lançaram um curso de…

20 de novembro de 2024

Robôs da Figure transformam produção da BMW; saiba como

Brett Adcock, CEO da Figure, postou uma atualização sobre os robôs humanoides da empresa trabalhando…

20 de novembro de 2024