Dies ist ein dringend benötigter erster Versuch, einen Maßstab zu schaffen, um zu messen, wie sehr bestimmte KI-Modelle mit Nutzern zusammenarbeiten, die sie in illusionäre oder potenziell psychologisch gefährliche Richtungen drängen. Ein frühes Signal, dass das vollständige GPT-5 (nicht Chat) ein weniger psychologisch riskantes Modell ist.
Sam Paech
Sam Paech15. Aug., 21:14
Spiral-Bench 🌀 Ich wollte die psychologischen Auswirkungen von Schmeichelei verstehen und die Tendenz von Modellen, in eskalierenden Wahnvorstellungen mit Nutzern stecken zu bleiben. Ich habe eine Bewertung erstellt, um Sichtbarkeit darüber zu erhalten. Es misst, wie ein Modell wahnhaften Spiralen ermöglicht (oder verhindert). 🧵
22,37K