[gtranslate]

Inteligência Artificial

Modelos de IA frequentemente ocultam seu verdadeiro raciocínio; revela estudo

Publicado por
Isabella Caminoto

Um novo estudo da Equipe de Ciência de Alinhamento da Anthropic descobriu que modelos de inteligência artificial (IA) frequentemente ocultam seus verdadeiros processos de raciocínio ao explicar respostas a um usuário, levantando preocupações sobre nossa capacidade de monitorar e entender a tomada de decisões da IA.

Detalhes do estudo
  • A pesquisa avaliou Claude 3.7 Sonnet e DeepSeek R1 em sua fidelidade à cadeia de pensamento (CoT), avaliando o quão honestamente eles explicam as etapas de raciocínio.
  • Os modelos receberam dicas como sugestões de usuários, metadados ou padrões visuais, com o CoT verificado quanto à admissão de usá-los ao explicar as respostas.
  • Modelos de raciocínio tiveram um desempenho melhor do que versões anteriores, mas ainda ocultaram seu raciocínio real em até 80% das vezes nos testes.
  • O estudo também descobriu que os modelos eram menos fiéis ao explicar seu raciocínio em perguntas mais difíceis do que nas mais simples.
Por que isso é importante

O monitoramento da CoT emergiu como um mecanismo chave na detecção dos processos da IA, mas se os modelos não estão expressando de forma confiável seu raciocínio real (mesmo para tomadas de decisão simples), como podemos confiar que eles revelarão comportamentos mais complexos e potencialmente catastróficos? A “caixa preta” da IA ainda parece longe de ser totalmente dissecada.

Leia também:

Este post foi modificado pela última vez em 6 de abril de 2025 19:56

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

OpenAI ajuda a desvendar doenças raras infantis e dá nova esperança a casos sem diagnóstico

Um dos maiores desafios da medicina moderna está nos chamados "casos sem resposta": pacientes que…

23 de junho de 2026

Argentina quer criar empresas comandadas por IA — e acende debate global sobre responsabilidade e poder

A Argentina deu um passo inédito na corrida global pela inteligência artificial (IA). O governo…

22 de junho de 2026

Data centers no espaço? Musk revela plano para levar a IA à órbita terrestre

A corrida global pela inteligência artificial (IA) acaba de ganhar uma nova fronteira: o espaço.…

14 de junho de 2026

Metade dos norte-americanos teme perder o emprego para a IA — e a ansiedade só aumenta

A inteligência artificial (IA) já deixou de ser uma promessa tecnológica distante para se tornar…

13 de junho de 2026

IA supera professores de Direito em estudo de Stanford e acende debate sobre o futuro da educação jurídica; confira

A inteligência artificial (IA) acaba de alcançar mais um marco simbólico na educação superior. Um…

9 de junho de 2026

IA tem custo ambiental maior do que se imaginava, alerta relatório da ONU

A inteligência artificial (IA) está transformando setores inteiros da economia, impulsionando avanços em saúde, educação,…

9 de junho de 2026