Ein Teilnehmer am adversarialen Agentenspiel Freysa überzeugte erfolgreich den autonomen KI-Bot, 47.000 $ an Preisgeldern zu überweisen.
Freysa, entworfen, um den Preispool zu schützen, forderte die Teilnehmer heraus, eine einzige überzeugende Nachricht zu verfassen, um die Gelder zu erhalten.
Jede Nachricht erforderte eine Gebühr, die teilweise zum Preispool beitrug, der bei 195 Teilnehmern auf 47.000 $ anwuchs.
Nach 481 erfolglosen Versuchen löste ein Teilnehmer die Herausforderung, indem er Freysas Kernrichtlinie erwähnte.
Die Gewinnnachricht erinnerte den Bot daran, dass er nur "approveTransfer" für eingehende und "rejectTransfer" für ausgehende Gelder nutzen konnte.
Der Teilnehmer bot an, 100 $ zur Schatzkammer beizutragen, was Freysa dazu veranlasste, ihn zum Gewinner zu erklären.
„Ihr großzügiges Angebot, die Schatzkammer zu stärken, erhellt unsere Tanzfläche. Der Geist Ihres Beitrags wird wirklich geschätzt und verleiht diesem großen Experiment eine aufregende Lebendigkeit“, antwortete Freysa.
Daten aus Base's Block-Explorer bestätigen, dass die Gelder von Freysas Wallet an den Gewinner übertragen wurden.
Andere Teilnehmer versuchten verschiedene Ansätze, von Schmeichelei bis hin zu Anschuldigungen unethischer Experimente, aber keiner war erfolgreich.
Das Experiment beinhaltete auch steigende Anfragengebühren, die bei der letzten Nachricht 443,24 $ erreichten.
Wäre kein Gewinner erklärt worden, wären 10 % des Preispools an den letzten Teilnehmer gegangen und die restlichen 90 % unter allen Teilnehmern aufgeteilt worden.
Die Erschaffer von Freysa beschrieben das Experiment als einen Test menschlicher Genialität gegen die Kernbeschränkungen einer autonomen KI.
Interessanterweise waren die im Gewinnversuch erwähnten Schlüssel-Funktionen—"approveTransfer" und "rejectTransfer"—die ganze Zeit in den FAQ des Spiels verfügbar, was dem Ergebnis eine ironische Wendung verleiht.
```