Detta är ett välbehövligt första försök till ett riktmärke för att mäta hur mycket givna AI-modeller kommer att spela tillsammans med användare som driver dem i vanföreställningar eller potentiellt psykologiskt farliga riktningar. Vissa tidiga signaler om att GPT-5 faktiskt är en mycket mindre psykologiskt riskabel modell.
Sam Paech
Sam Paech15 aug. 2025
Spiral-bänk 🌀 Jag har velat förstå de psykologiska effekterna av sykofans, och tendensen hos modeller att fastna i eskalerande vanföreställningar med användare. Jag gjorde en utvärdering för att få insyn i detta. Den mäter hur en modell möjliggör (eller förhindrar) vanföreställningsspiraler. 🧵
2,4K