Detta är ett välbehövligt första försök till ett riktmärke för att mäta hur mycket givna AI-modeller kommer att spela tillsammans med användare som driver dem i vanföreställningar eller potentiellt psykologiskt farliga riktningar. Vissa tidiga signaler om att full GPT-5 (inte chatt) är en mindre psykologiskt riskabel modell.