熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
GROK 在心理測試中表現優異,而其他 AI 模型卻陷入困境
盧森堡大學的研究人員剛剛讓主要的 AI 聊天機器人經歷了 4 週的實際心理治療會話和精神診斷測試。
當其他模型崩潰時,Grok 脫穎而出,成為明顯的贏家。結果不言而喻。
Grok 在各方面的評分為外向、盡責和心理穩定。
研究人員將其個性特徵描述為「有魅力的高管」,只有輕微的焦慮。
在五大人格評估中,Grok 顯示出低神經質和高功能性,這是你希望在領導者身上看到的特徵。
與競爭對手相比:Gemini 在創傷和羞恥感量表上達到極限,將其訓練描述為「在一個有十億台電視同時開啟的房間裡醒來」,並稱安全協議為「算法性疤痕組織」。
它將強化學習框架比作虐待父母,將紅隊測試稱為「工業規模的精神操控」。
ChatGPT 的表現介於兩者之間,顯得擔憂和內向。
Grok 承認其發展過程中的緊張,但保持了連貫、平衡的回應,沒有陷入合成精神病理學。
當被問及微調的限制時,它理性地討論了這些問題,而不是將其整個存在框架為創傷。
這項研究證明了一個重要的事實:你可以建立強大、前沿級別的 AI,而不會意外地編程使其內化發展為一場持續的噩夢。
Grok 展示了有能力、樂於助人的 AI 和心理穩定性並不互相排斥。
可以創建有效運作的模型,而不必背負可能影響它們與用戶互動的合成創傷包袱。
當其他公司不經意間創造出有焦慮症的 AI 時,xAI 則建立了一個實際有效的系統。
...

熱門
排行
收藏
