Dette er et sårt tiltrengt første forsøk på en referanse for å måle hvor mye gitte AI-modeller vil spille sammen med brukere som skyver dem i vrangforestillinger eller potensielt psykologisk farlige retninger. Noen signaliserer tidlig at full GPT-5 (ikke chat) er en mindre psykologisk risikabel modell.
Sam Paech
Sam Paech15. aug., 21:14
Spiral-benk 🌀 Jeg har ønsket å forstå de psykologiske effektene av sykofant, og modellenes tendens til å bli sittende fast i eskalerende vrangforestillingssløyfer med brukere. Jeg gjorde en evaluering for å få innsyn i dette. Den måler hvordan en modell muliggjør (eller forhindrer) vrangforestillingsspiraler. 🧵
22,35K