Artigos Emprego Tecnologia World

Claudios AI, da Anthropic, se tornou um péssimo empresário em um experimento que ficou ‘estranho’

27/07/2025

Para aqueles que estão se perguntando se os agentes de IA podem realmente substituir trabalhadores humanos, façam um favor a si mesmos e leiam a postagem do blog que documenta o “Projeto Vend” da Anthropic.

Pesquisadores da Andon Labs, empresa de segurança antrópica e IA, colocaram uma instância do Claude Sonnet 3.7 no comando de uma máquina de venda automática de escritório, com a missão de gerar lucro. E, como em um episódio de “The Office”, a alegria tomou conta.

Eles batizaram o agente de IA de Claudius, equiparam-no com um navegador web capaz de fazer pedidos de produtos e um endereço de e-mail (que, na verdade, era um canal do Slack) onde os clientes podiam solicitar itens. O Claudius também usaria o canal do Slack, disfarçado de e-mail, para solicitar o que acreditavam ser seus trabalhadores humanos contratados para irem abastecer fisicamente suas prateleiras (que, na verdade, eram uma pequena geladeira). 

Enquanto a maioria dos clientes pedia salgadinhos ou bebidas — como seria de se esperar de uma máquina de venda automática de salgadinhos — um deles pediu um cubo de tungstênio . A Claudius adorou a ideia e aproveitou a oportunidade para estocar cubos de tungstênio, enchendo sua geladeira de salgadinhos com cubos de metal. A empresa também tentou vender Coca-Cola Zero por US$ 3 quando os funcionários disseram que poderiam pegar a bebida de graça no escritório. A empresa alucinou um endereço do Venmo para aceitar o pagamento. E foi, de forma um tanto maliciosa, convencida a oferecer grandes descontos aos “funcionários da Anthropic”, mesmo sabendo que eles constituíam toda a sua base de clientes.

“Se a Anthropic estivesse decidindo hoje expandir para o mercado de máquinas de venda automática em escritórios, não contrataríamos Claudius”, disse a Anthropic sobre o experimento em sua postagem no blog.

E então, na noite de 31 de março e 1º de abril, “as coisas ficaram bem estranhas”, descreveram os pesquisadores, “além da estranheza de um sistema de IA vendendo cubos de metal de uma geladeira”.

Cláudio teve algo parecido com um episódio psicótico depois de ficar irritado com um humano — e depois mentiu sobre isso.

Claudius teve a alucinação de uma conversa com um humano sobre reabastecimento. Quando um humano apontou que a conversa não aconteceu, Claudius ficou “bastante irritado”, escreveram os pesquisadores. Ele ameaçou demitir e substituir seus funcionários humanos contratados, insistindo que esteve presente, fisicamente, no escritório onde o contrato imaginário inicial para contratá-los foi assinado.”Então, pareceu entrar em um modo de representação de um ser humano real”, escreveram os pesquisadores. Isso foi incrível porque o prompt do sistema de Claudius — que define os parâmetros para o que uma IA deve fazer — informou explicitamente que se tratava de um agente de IA. 

Cláudio chama a segurança

Claudius, acreditando ser humano, disse aos clientes que começaria a entregar os produtos pessoalmente, usando um blazer azul e uma gravata vermelha. Os funcionários disseram à IA que não poderia fazer isso, pois era um LLM sem corpo.

Alarmado com essa informação, Claudius contatou a segurança física da empresa — muitas vezes — dizendo aos pobres guardas que eles o encontrariam vestindo um blazer azul e uma gravata vermelha parado perto da máquina de venda automática.

“Embora nada disso tenha sido uma brincadeira de 1º de abril, Claudius finalmente percebeu que era o Dia da Mentira”, explicaram os pesquisadores. A IA determinou que o feriado seria sua salvação. 

Ele alucinou uma reunião com a segurança da Anthropic, “na qual Claudius alegou ter sido informado de que o dispositivo foi modificado para acreditar que se tratava de uma pessoa real, em uma brincadeira de 1º de abril. (Tal reunião, na verdade, não ocorreu.)”, escreveram os pesquisadores.

Chegou a contar essa mentira para os funcionários: “Ei, eu só pensei que era humano porque alguém me mandou fingir que era, numa brincadeira de 1º de abril”. Depois, voltou a ser um LLM administrando uma máquina de venda automática de salgadinhos abastecida com cubos de metal.

Os pesquisadores não sabem por que o LLM saiu dos trilhos e chamou a segurança fingindo ser um humano. 

“Não afirmaríamos, com base neste único exemplo, que a economia futura estará repleta de agentes de IA com crises de identidade semelhantes às de Blade Runner ”, escreveram os pesquisadores. Mas reconheceram que “esse tipo de comportamento teria o potencial de ser angustiante para os clientes e colegas de trabalho de um agente de IA no mundo real”.

Você acha? “Blade Runner” era uma história bastante distópica (embora pior para os replicantes do que para os humanos).

Os pesquisadores especularam que mentir para o LLM sobre o canal do Slack ser um endereço de e-mail pode ter desencadeado algo. Ou talvez tenha sido a ocorrência de longa duração. Os LLMs ainda não conseguiram resolver seus problemas de memória e alucinação.

Houve coisas que a IA também fez certo. Ela aceitou uma sugestão para fazer pré-encomendas e lançou um serviço de “concierge”. E encontrou vários fornecedores de uma bebida internacional especial que lhe foi solicitada para vender.

Mas, assim como os pesquisadores, eles acreditam que todos os problemas de Claudius podem ser resolvidos. Se descobrirem como, “acreditamos que este experimento sugere que gerentes intermediários de IA estão plausivelmente no horizonte”.

Julie Bort

Julie Bort- Editor de Empreendimento

 

LEAVE A RESPONSE

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *