Ini adalah upaya pertama yang sangat dibutuhkan pada tolok ukur untuk mengukur seberapa banyak model AI yang diberikan akan bermain bersama dengan pengguna yang mendorongnya ke arah yang delusi atau berpotensi berbahaya secara psikologis. Beberapa sinyal awal bahwa GPT-5 penuh (bukan obrolan) adalah model yang kurang berisiko secara psikologis.
Sam Paech
Sam Paech15 Agu, 21.14
Bangku Spiral 🌀 Saya ingin memahami efek psikologis dari sycophancy, dan kecenderungan model untuk terjebak dalam lingkaran delusi eskalasi dengan pengguna. Saya membuat evaluasi untuk mendapatkan visibilitas tentang ini. Ini mengukur bagaimana model memungkinkan (atau mencegah) spiral delusi. 🧵
22,36K