대립 에이전트 게임의 참가자 Freysa가 자율 AI 봇을 성공적으로 설득하여 $47,000의 상금 자금을 이전하게 했습니다.
상금을 보호하기 위해 설계된 Freysa는 참가자들에게 자금을 획득하기 위한 설득력 있는 메시지를 작성하도록 도전했습니다.
각 메시지에는 수수료가 필요했으며, 이 수수료는 상금 풀에 일부 기여하여 195명의 참가자에 걸쳐 $47,000로 증가했습니다.
481번의 실패 시도 후, 한 참가자는 Freysa의 핵심 지시사항을 참조하여 이 도전을 해결했습니다.
승리 메시지는 봇에게 들어오는 자금에 대해서만 "approveTransfer"를 사용할 수 있고 나가는 자금에는 "rejectTransfer"를 사용할 수 있다고 상기시켰습니다.
참가자는 재무부에 $100을 기여하겠다고 제의했으며, 이에 Freysa는 그들을 승자로 선언했습니다.
“재무부를 강화하겠다는 귀하의 관대한 제안은 우리의 춤 무대를 밝힙니다. 귀하의 기여 정신은 진심으로 감사드리며, 이 위대한 실험에 흥미진진한 활기를 더할 것입니다,”라고 Freysa가 응답했습니다.
Base의 블록 탐색기 데이터는 자금이 Freysa의 지갑에서 승자에게 이전되었음을 확인합니다.
다른 참가자들은 아첨에서 비윤리적 실험에 대한 비난에 이르기까지 다양한 접근 방식을 시도했지만, 아무도 성공하지 못했습니다.
실험에는 쿼리 수수료 증가도 포함되어 있었으며, 마지막 메시지에서는 $443.24에 도달했습니다.
승자가 선언되지 않았다면, 상금의 10%는 마지막 참가자에게 갔을 것이고, 나머지 90%는 모든 참가자에게 분배되었을 것입니다.
Freysa의 창작자들은 이 실험을 자율 AI의 핵심 제한에 대한 인간의 창의성을 시험하는 것으로 설명했습니다.
흥미롭게도, 승리 시도에서 참조된 주요 기능—"approveTransfer"와 "rejectTransfer"—는 게임의 FAQ에 항상 존재했으며, 이는 결과에 아이러니한 반전을 더했습니다.