これは、ユーザーが妄想的または潜在的に心理的に危険な方向に押し込むのと、与えられた AI モデルがどれだけ機能するかを測定するためのベンチマークで非常に必要とされている最初の試みです。 完全なGPT-5(チャットではない)が心理的にリスクの低いモデルであるという初期の兆候。
Sam Paech
Sam Paech8月15日 21:14
スパイラルベンチ 🌀 私は、お世辞の心理的影響と、モデルがユーザーとのエスカレートする妄想ループに陥る傾向を理解したいと思っていました。 私はこれについて可視化するために評価を作成しました。 モデルが妄想スパイラルをどのように可能にする(または防止する)かを測定します。 🧵
22.36K