Pesquisadores testaram a capacidade de raciocínio estratégico de modelos de inteligência artificial (IA), submetendo-os a 140 mil decisões no jogo Dilema do Prisioneiro (Prisoner’s Dilemma). Eles descobriram que os modelos da OpenAI, Google e Anthropic desenvolveram abordagens estratégicas únicas.
PUBLICIDADE
Detalhes da pesquisa
- Os pesquisadores organizaram torneios do Dilema do Prisioneiro, onde os agentes escolhiam entre cooperar ou trair, ganhando pontos com base nas escolhas mútuas.
- Cada IA gerava justificativas escritas antes de tomar suas decisões, calculando padrões dos oponentes e probabilidades de término da partida, o que influenciava suas escolhas.
- Os resultados revelaram estratégias distintas entre os modelos: o Gemini mostrou-se implacavelmente adaptativo, enquanto os modelos da OpenAI agiram de forma cooperativa mesmo quando explorados.
- Os pesquisadores também mapearam “impressões digitais” que mostram como os modelos respondem a serem traídos ou a terem sucesso, com o Claude da Anthropic sendo o mais “perdoador”.
Por que isso importa
Observar LLMs (Grandes Modelos de Linguagem) desenvolverem estratégias distintas, mesmo sendo treinados com a mesma literatura, é mais uma evidência de suas capacidades de raciocínio, e não apenas de reconhecimento de padrões. À medida que esses modelos assumem tarefas de alto nível, como negociações e alocação de recursos, diferentes “personalidades” de modelos podem levar a resultados drasticamente distintos.
Leia também:



