Dette er et sårt tiltrengt første forsøk på en referanse for å måle hvor mye gitte AI-modeller vil spille sammen med brukere som skyver dem i vrangforestillinger eller potensielt psykologisk farlige retninger. Noen tidlige signaler om at GPT-5 faktisk er en mye mindre psykologisk risikabel modell.
Sam Paech
Sam Paech15. aug., 21:14
Spiral-benk 🌀 Jeg har ønsket å forstå de psykologiske effektene av sykofant, og modellenes tendens til å bli sittende fast i eskalerende vrangforestillingssløyfer med brukere. Jeg gjorde en evaluering for å få innsyn i dette. Den måler hvordan en modell muliggjør (eller forhindrer) vrangforestillingsspiraler. 🧵
2,3K