Це дуже потрібна перша спроба еталону, щоб виміряти, скільки дані моделі штучного інтелекту будуть грати разом з користувачами, які штовхають їх у маячних або потенційно психологічно небезпечних напрямках. Деякі ранні сигналізують про те, що GPT-5 дійсно є набагато менш психологічно ризикованою моделлю.
Sam Paech
Sam Paech15 серп., 21:14
Спіраль-лавка 🌀 Я хотів зрозуміти психологічні наслідки підлабузництва і тенденцію моделей застрягати в петлях ескалації ілюзій з користувачами. Я зробив евал, щоб привернути увагу до цього. Він вимірює, як модель включає (або запобігає) маячні спіралі. 🧵
2,34K