LLMs demonstram sinais de inteligência estratégica; revela pesquisa

Pesquisadores testaram a capacidade de raciocínio estratégico de modelos de inteligência artificial (IA), submetendo-os a 140 mil decisões no jogo Dilema do Prisioneiro (Prisoner’s Dilemma). Eles descobriram que os modelos da OpenAI, Google e Anthropic desenvolveram abordagens estratégicas únicas.

Detalhes da pesquisa

Os pesquisadores organizaram torneios do Dilema do Prisioneiro, onde os agentes escolhiam entre cooperar ou trair, ganhando pontos com base nas escolhas mútuas.
Cada IA gerava justificativas escritas antes de tomar suas decisões, calculando padrões dos oponentes e probabilidades de término da partida, o que influenciava suas escolhas.
Os resultados revelaram estratégias distintas entre os modelos: o Gemini mostrou-se implacavelmente adaptativo, enquanto os modelos da OpenAI agiram de forma cooperativa mesmo quando explorados.
Os pesquisadores também mapearam “impressões digitais” que mostram como os modelos respondem a serem traídos ou a terem sucesso, com o Claude da Anthropic sendo o mais “perdoador”.

Por que isso importa

Observar LLMs (Grandes Modelos de Linguagem) desenvolverem estratégias distintas, mesmo sendo treinados com a mesma literatura, é mais uma evidência de suas capacidades de raciocínio, e não apenas de reconhecimento de padrões. À medida que esses modelos assumem tarefas de alto nível, como negociações e alocação de recursos, diferentes “personalidades” de modelos podem levar a resultados drasticamente distintos.

Leia também:

Chatbots da Meta poderão iniciar conversas com usuários; saiba como

LLMs demonstram sinais de inteligência estratégica; revela pesquisa

Detalhes da pesquisa

Por que isso importa

Sobre o autor

Isabella Caminoto

Detalhes da pesquisa

Por que isso importa

Sobre o autor

Isabella Caminoto

Mais lidas

Relacionados