Anthropic cria mapa detalhado dos valores morais da IA Claude; veja

Publicado por

Isabella Caminoto

22 de abril de 2025 12:29

A Anthropic publicou um estudo analisando centenas de milhares de conversas reais de inteligência artificial (IA) para entender como modelos como Claude fazem julgamentos morais – construindo o primeiro mapa em larga escala dos valores do modelo em interações cotidianas.

Detalhes do estudo

Pesquisadores analisaram mais de 300.000 conversas reais (mas anônimas) para encontrar e categorizar 3.307 valores únicos expressos pela IA.
Eles identificaram 5 tipos de valores (Práticos, Relacionados ao Conhecimento, Sociais, Protetores, Pessoais), sendo os Práticos e Relacionados ao Conhecimento os mais comuns.
Valores como prestatividade e profissionalismo apareceram com mais frequência, enquanto valores éticos foram mais comuns durante a resistência a solicitações prejudiciais.
Os valores de Claude também mudaram com base no contexto, como enfatizar “limites saudáveis” em conselhos de relacionamento versus “agência humana” em discussões sobre ética de IA.

Por que isso é importante

A IA está moldando cada vez mais decisões e relacionamentos no mundo real, tornando a compreensão de seus valores reais mais crucial do que nunca. Este estudo também move a discussão sobre alinhamento para observações mais concretas, revelando que a moral e os valores da IA podem ser mais contextuais e situacionais do que um ponto de vista estático.

Leia também:

Google Lança Gemini 2.5 Flash: IA Híbrida que Desafia Rivais com “Orçamento de Pensamento”

Este post foi modificado pela última vez em 22 de abril de 2025 12:33

Isabella Caminoto

Advogada e mestranda em Direito Internacional, tenho a democracia e a liberdade como bandeiras irrenunciáveis. Sou apaixonada pelos animais e acredito que o bem-estar do nosso planeta deveria ser o destaque diário da pauta da nossa sociedade.

Próximo Emirados Árabes Unidos planejam deixar a IA escrever suas leis »

Anterior « IA e Biologia em Escala: Profluent Revela Avanço no Design de Proteínas com ProGen3

Publicado por

Isabella Caminoto

Tags: AnthropicClaudeinteligência artificialvalores morais

22 de abril de 2025 12:29

Posts recentes

Inteligência Artificial

OMS reúne 37 países para definir regras globais sobre inteligência artificial na saúde

A Organização Mundial da Saúde reuniu ministros, autoridades governamentais e especialistas de 37 países em…

15 de julho de 2026

Inteligência Artificial

IA promete eficiência na saúde, mas Harvard alerta para risco de desumanização do cuidado

A inteligência artificial (IA) já começa a transformar hospitais, consultórios e sistemas de saúde, assumindo…

10 de julho de 2026

Inteligência Artificial

GPT-5.6: OpenAI apresenta sua IA mais poderosa, mas restringe acesso a poucos parceiros

A OpenAI apresentou oficialmente o GPT-5.6, sua mais nova geração de modelos de inteligência artificial…

29 de junho de 2026

Inteligência Artificial

OpenAI entra na guerra dos chips e desafia Nvidia e Google na corrida pela infraestrutura da IA; conheça o Jalapeño

A OpenAI deu um passo que pode redefinir o equilíbrio de poder no setor de…

25 de junho de 2026

Inteligência Artificial

OpenAI ajuda a desvendar doenças raras infantis e dá nova esperança a casos sem diagnóstico

Um dos maiores desafios da medicina moderna está nos chamados "casos sem resposta": pacientes que…

23 de junho de 2026

Inteligência Artificial

Argentina quer criar empresas comandadas por IA — e acende debate global sobre responsabilidade e poder

A Argentina deu um passo inédito na corrida global pela inteligência artificial (IA). O governo…

22 de junho de 2026

Anthropic cria mapa detalhado dos valores morais da IA Claude; veja

Detalhes do estudo

Por que isso é importante

Posts relacionados

Posts recentes

OMS reúne 37 países para definir regras globais sobre inteligência artificial na saúde

IA promete eficiência na saúde, mas Harvard alerta para risco de desumanização do cuidado

GPT-5.6: OpenAI apresenta sua IA mais poderosa, mas restringe acesso a poucos parceiros

OpenAI entra na guerra dos chips e desafia Nvidia e Google na corrida pela infraestrutura da IA; conheça o Jalapeño

OpenAI ajuda a desvendar doenças raras infantis e dá nova esperança a casos sem diagnóstico

Argentina quer criar empresas comandadas por IA — e acende debate global sobre responsabilidade e poder