Đây là một nỗ lực đầu tiên rất cần thiết để thiết lập một tiêu chuẩn nhằm đo lường mức độ mà các mô hình AI nhất định sẽ tương tác với người dùng, khi người dùng đẩy chúng theo những hướng ảo tưởng hoặc có thể gây nguy hiểm về tâm lý. Một số tín hiệu ban đầu cho thấy GPT-5 hoàn chỉnh (không phải chat) là một mô hình ít rủi ro về tâm lý hơn.
Sam Paech
Sam Paech21:14 15 thg 8
Ghế xoắn ốc 🌀 Tôi đã muốn hiểu những tác động tâm lý của sự nịnh bợ, và xu hướng của các mô hình bị mắc kẹt trong những vòng lặp ảo tưởng leo thang với người dùng. Tôi đã tạo một bài đánh giá để có cái nhìn rõ hơn về điều này. Nó đo lường cách mà một mô hình cho phép (hoặc ngăn chặn) những vòng xoáy ảo tưởng. 🧵
22,41K