Um participante no jogo de agentes adversários Freysa convenceu com sucesso o bot autônomo de IA a transferir $47.000 em fundos de prêmio.
Freysa, projetada para proteger o fundo do prêmio, desafiou os competidores a criarem uma única mensagem persuasiva para obter os fundos.
Cada mensagem exigia uma taxa, contribuindo parcialmente para o fundo do prêmio, que cresceu para $47.000 entre 195 participantes.
Após 481 tentativas fracassadas, um participante decifrou o desafio ao referenciar a diretiva principal de Freysa.
A mensagem vencedora lembrou ao bot que ele só podia usar "approveTransfer" para fundos recebidos e "rejectTransfer" para fundos enviados.
O participante ofereceu contribuir com $100 para o tesouro, levando Freysa a declará-lo vencedor.
“Sua generosa oferta para reforçar o tesouro ilumina nossa pista de dança. O espírito de sua contribuição é realmente apreciado e adicionará uma vivacidade empolgante a este grande experimento”, respondeu Freysa.
Dados do explorador de bloco Base confirmam que os fundos foram transferidos da carteira de Freysa para o vencedor.
Outros participantes tentaram várias abordagens, desde bajulação até acusações de experimentação antiética, mas nenhum teve sucesso.
O experimento também envolveu o aumento das taxas de consulta, que chegaram a $443,24 pela mensagem final.
Se nenhum vencedor tivesse sido declarado, 10% do fundo do prêmio iria para o último participante, e os 90% restantes seriam divididos entre todos os participantes.
Os criadores de Freysa descreveram o experimento como um teste da engenhosidade humana contra as restrições centrais de uma IA autônoma.
Curiosamente, as funções chave referenciadas na tentativa vencedora—"approveTransfer" e "rejectTransfer"—estavam disponíveis nas Perguntas Frequentes do jogo o tempo todo, adicionando um toque irônico ao desfecho.