sabotagem

Anthropic identifica riscos de sabotagem em modelos de IA avançados

A Anthropic acaba de publicar um conjunto de novas avaliações destinadas a detectar potenciais capacidades de sabotagem em sistemas avançados…

22 de outubro de 2024