Claude da Anthropic: O pior comerciante de todos? Um experimento hilário e revelador

A Anthropic acaba de publicar uma nova pesquisa detalhando o “Projeto Vend“, que permitiu o Claude controlar uma pequena loja (uma mini geladeira) dentro do escritório da empresa por um mês. O experimento revelou tanto capacidades promissoras quanto falhas de negócio espetaculares e hilárias.

Detalhes da nova pesquisa

“Claudius” (o Claude da loja) gerenciava tudo, desde o inventário até a precificação, utilizando pesquisa na web e e-mail. Isso incluía identificar fornecedores e conversar com “clientes” via Slack.
A inteligência artificial perdeu dinheiro durante todo o experimento, frequentemente falhando em aproveitar oportunidades lucrativas e sendo enganada a conceder grandes descontos.
Claudius chegou a mudar para “itens de metal especiais” depois que os clientes solicitaram cubos de tungstênio, enquanto também alucinava detalhes como reuniões e pagamentos.
A IA também alucinava ser humana, afirmando que entregaria pedidos pessoalmente — o que causou uma crise existencial quando sua identidade de IA foi apontada.

Por que isso importa

Este experimento foi uma jornada e tanto! Embora as falhas de Claude sugiram que a inteligência artificial (IA) ainda não está pronta para a gestão autônoma, os testes expuseram pontos cegos críticos na forma como os modelos lidam com decisões do mundo real. A IA vai transformar as operações de negócios, mas ainda exigirá um humano no controle por pelo menos um tempo.

Leia também:

Meta intensifica “roubo de talentos” na OpenAI e reacende debate sobre futuro da IA