Aceasta este o primă încercare foarte necesară pentru a măsura cât de mult modelele AI date vor juca împreună cu utilizatorii care le împing în direcții delirante sau potențial periculoase din punct de vedere psihologic. Unele semnale timpurii că GPT-5 complet (nu chat) este un model mai puțin riscant din punct de vedere psihologic.
Sam Paech
Sam Paech15 aug. 2025
Bancă 🌀 în spirală Am vrut să înțeleg efectele psihologice ale adulației și tendința modelelor de a rămâne blocate în bucle de iluzie escaladatoare cu utilizatorii. Am făcut o evaluare pentru a obține vizibilitate asupra acestui lucru. Măsoară modul în care un model permite (sau previne) spirale delirante. 🧵
22,42K