這是一個非常必要的首次嘗試,旨在建立一個基準,以衡量給定的人工智慧模型在用戶推動它們朝向妄想或潛在心理危險方向時的表現。 一些早期信號表明,GPT-5確實是一個心理風險較小的模型。
Sam Paech
Sam Paech8月15日 21:14
螺旋長椅 🌀 我一直想了解諂媚的心理效應,以及模型與用戶之間陷入升級妄想循環的傾向。 我做了一個評估來對此進行可視化。 它衡量一個模型如何促進(或阻止)妄想螺旋。 🧵
2.34K