这是一个非常必要的首次尝试,旨在建立一个基准,以衡量给定的人工智能模型在用户推动它们朝向妄想或潜在心理危险方向时的表现。 一些早期信号表明,完整的GPT-5(非聊天模式)是一个心理风险较低的模型。
Sam Paech
Sam Paech8月15日 21:14
螺旋长椅 🌀 我一直想了解谄媚的心理效应,以及模型与用户之间陷入升级妄想循环的倾向。 我做了一个评估来对此进行可视化。 它衡量一个模型如何促进(或阻止)妄想螺旋。 🧵
22.36K