Modelos de IA frequentemente ocultam seu verdadeiro raciocínio; revela estudo

Publicado por

Isabella Caminoto

7 de abril de 2025 10:00

Um novo estudo da Equipe de Ciência de Alinhamento da Anthropic descobriu que modelos de inteligência artificial (IA) frequentemente ocultam seus verdadeiros processos de raciocínio ao explicar respostas a um usuário, levantando preocupações sobre nossa capacidade de monitorar e entender a tomada de decisões da IA.

Detalhes do estudo

A pesquisa avaliou Claude 3.7 Sonnet e DeepSeek R1 em sua fidelidade à cadeia de pensamento (CoT), avaliando o quão honestamente eles explicam as etapas de raciocínio.
Os modelos receberam dicas como sugestões de usuários, metadados ou padrões visuais, com o CoT verificado quanto à admissão de usá-los ao explicar as respostas.
Modelos de raciocínio tiveram um desempenho melhor do que versões anteriores, mas ainda ocultaram seu raciocínio real em até 80% das vezes nos testes.
O estudo também descobriu que os modelos eram menos fiéis ao explicar seu raciocínio em perguntas mais difíceis do que nas mais simples.

Por que isso é importante

O monitoramento da CoT emergiu como um mecanismo chave na detecção dos processos da IA, mas se os modelos não estão expressando de forma confiável seu raciocínio real (mesmo para tomadas de decisão simples), como podemos confiar que eles revelarão comportamentos mais complexos e potencialmente catastróficos? A “caixa preta” da IA ainda parece longe de ser totalmente dissecada.

Leia também:

Tinder lança “O Jogo do Jogo”: IA para aprimorar suas habilidades de paquera

Este post foi modificado pela última vez em 6 de abril de 2025 19:56

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Próximo IA domina Minecraft: DeepMind cria programa que encontra diamantes sem instrução prévia »

Anterior « Apple planeja revolução para o 20º aniversário do iPhone em 2027

Publicado por

Isabella Caminoto

Tags: Anthropicinteligência artificialraciocínio

7 de abril de 2025 10:00

Posts recentes

Inteligência Artificial

Quando a IA afasta o médico do paciente: o novo desafio do diagnóstico à beira do leito

A inteligência artificial (IA) está transformando rapidamente a medicina. Sistemas capazes de analisar exames de…

24 de julho de 2026

Inteligência Artificial

OMS reúne 37 países para definir regras globais sobre inteligência artificial na saúde

A Organização Mundial da Saúde reuniu ministros, autoridades governamentais e especialistas de 37 países em…

15 de julho de 2026

Inteligência Artificial

IA promete eficiência na saúde, mas Harvard alerta para risco de desumanização do cuidado

A inteligência artificial (IA) já começa a transformar hospitais, consultórios e sistemas de saúde, assumindo…

10 de julho de 2026

Inteligência Artificial

GPT-5.6: OpenAI apresenta sua IA mais poderosa, mas restringe acesso a poucos parceiros

A OpenAI apresentou oficialmente o GPT-5.6, sua mais nova geração de modelos de inteligência artificial…

29 de junho de 2026

Inteligência Artificial

OpenAI entra na guerra dos chips e desafia Nvidia e Google na corrida pela infraestrutura da IA; conheça o Jalapeño

A OpenAI deu um passo que pode redefinir o equilíbrio de poder no setor de…

25 de junho de 2026

Inteligência Artificial

OpenAI ajuda a desvendar doenças raras infantis e dá nova esperança a casos sem diagnóstico

Um dos maiores desafios da medicina moderna está nos chamados "casos sem resposta": pacientes que…

23 de junho de 2026

Modelos de IA frequentemente ocultam seu verdadeiro raciocínio; revela estudo

Detalhes do estudo

Por que isso é importante

Posts relacionados

Posts recentes

Quando a IA afasta o médico do paciente: o novo desafio do diagnóstico à beira do leito

OMS reúne 37 países para definir regras globais sobre inteligência artificial na saúde

IA promete eficiência na saúde, mas Harvard alerta para risco de desumanização do cuidado

GPT-5.6: OpenAI apresenta sua IA mais poderosa, mas restringe acesso a poucos parceiros

OpenAI entra na guerra dos chips e desafia Nvidia e Google na corrida pela infraestrutura da IA; conheça o Jalapeño

OpenAI ajuda a desvendar doenças raras infantis e dá nova esperança a casos sem diagnóstico