[gtranslate]

Anthropic cria mapa detalhado dos valores morais da IA Claude; veja

Publicado por
Isabella Caminoto

A Anthropic publicou um estudo analisando centenas de milhares de conversas reais de inteligência artificial (IA) para entender como modelos como Claude fazem julgamentos morais – construindo o primeiro mapa em larga escala dos valores do modelo em interações cotidianas.

Detalhes do estudo
  • Pesquisadores analisaram mais de 300.000 conversas reais (mas anônimas) para encontrar e categorizar 3.307 valores únicos expressos pela IA.
  • Eles identificaram 5 tipos de valores (Práticos, Relacionados ao Conhecimento, Sociais, Protetores, Pessoais), sendo os Práticos e Relacionados ao Conhecimento os mais comuns.
  • Valores como prestatividade e profissionalismo apareceram com mais frequência, enquanto valores éticos foram mais comuns durante a resistência a solicitações prejudiciais.
  • Os valores de Claude também mudaram com base no contexto, como enfatizar “limites saudáveis” em conselhos de relacionamento versus “agência humana” em discussões sobre ética de IA.
Por que isso é importante

A IA está moldando cada vez mais decisões e relacionamentos no mundo real, tornando a compreensão de seus valores reais mais crucial do que nunca. Este estudo também move a discussão sobre alinhamento para observações mais concretas, revelando que a moral e os valores da IA podem ser mais contextuais e situacionais do que um ponto de vista estático.

Leia também:

Este post foi modificado pela última vez em 22 de abril de 2025 12:33

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Posts recentes

Copa do Mundo 2026 aposta em IA para proteger jogadores de ataques online

A Copa do Mundo de 2026, que será realizada nos Estados Unidos, Canadá e México,…

6 de junho de 2026

Trump assina ordem executiva para revisar IA antes do lançamento e reacende debate sobre regulação nos EUA

O presidente dos Estados Unidos, Donald Trump, assinou nesta terça-feira (2) uma nova ordem executiva…

3 de junho de 2026

IA na saúde mental herda preconceitos humanos — e pesquisadores alertam para riscos invisíveis

A rápida expansão da inteligência artificial (IA) na saúde mental vem sendo tratada como uma…

28 de maio de 2026

Estudo de Stanford expõe viés racial em ferramentas de IA usadas para contratação

A promessa de neutralidade da inteligência artificial (IA) no mercado de trabalho acaba de sofrer…

27 de maio de 2026

Papa Leão XIV lança manifesto histórico sobre IA e alerta: “Nenhum algoritmo pode substituir a humanidade”

A inteligência artificial (IA) acaba de entrar oficialmente no centro do debate moral da Igreja…

26 de maio de 2026

Google resolve nove problemas matemáticos inéditos com IA e acelera corrida por descobertas científicas

A disputa entre gigantes da inteligência artificial (IA) acaba de atingir um novo patamar —…

25 de maio de 2026