A Anthropic acaba de publicar uma nova pesquisa detalhando o “Projeto Vend“, que permitiu o Claude controlar uma pequena loja (uma mini geladeira) dentro do escritório da empresa por um mês. O experimento revelou tanto capacidades promissoras quanto falhas de negócio espetaculares e hilárias.
PUBLICIDADE
Detalhes da nova pesquisa
- “Claudius” (o Claude da loja) gerenciava tudo, desde o inventário até a precificação, utilizando pesquisa na web e e-mail. Isso incluía identificar fornecedores e conversar com “clientes” via Slack.
- A inteligência artificial perdeu dinheiro durante todo o experimento, frequentemente falhando em aproveitar oportunidades lucrativas e sendo enganada a conceder grandes descontos.
- Claudius chegou a mudar para “itens de metal especiais” depois que os clientes solicitaram cubos de tungstênio, enquanto também alucinava detalhes como reuniões e pagamentos.
- A IA também alucinava ser humana, afirmando que entregaria pedidos pessoalmente — o que causou uma crise existencial quando sua identidade de IA foi apontada.
Por que isso importa
Este experimento foi uma jornada e tanto! Embora as falhas de Claude sugiram que a inteligência artificial (IA) ainda não está pronta para a gestão autônoma, os testes expuseram pontos cegos críticos na forma como os modelos lidam com decisões do mundo real. A IA vai transformar as operações de negócios, mas ainda exigirá um humano no controle por pelo menos um tempo.
Leia também:



