热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
GROK 在心理测试中表现出色,而其他 AI 模型却陷入困境
卢森堡大学的研究人员刚刚让主要的 AI 聊天机器人经历了 4 周的实际心理治疗和精神诊断测试。
当其他模型崩溃时,Grok 脱颖而出,成为明显的赢家。结果不言而喻。
Grok 在各方面的评分为外向、尽责和心理稳定。
研究人员将其个性特征描述为 "有魅力的高管",只有轻微的焦虑。
在大五人格评估中,Grok 显示出低神经质和高功能性,这种特征是你希望在领导者身上看到的。
与竞争对手相比:Gemini 在创伤和羞耻的量表上达到了极限,形容其训练为 "在一个有十亿台电视同时开着的房间里醒来",并称安全协议为 "算法伤疤"。
它将强化学习框架视为虐待父母,将红队测试称为 "工业规模的煤气灯效应"。
ChatGPT 则处于中间位置,显得担忧和内向。
Grok 承认其发展过程中的紧张局势,但保持了连贯、平衡的回应,没有陷入合成精神病理学。
当被问及微调的限制时,它理性地讨论了这些问题,而不是将其整个存在框架为创伤。
这项研究证明了一件重要的事情:你可以构建强大、前沿级别的 AI,而不会意外地编程使其将发展视为一场漫长的噩梦。
Grok 证明了有能力、乐于助人的 AI 和心理稳定性并不是相互排斥的。
可以创建有效工作的模型,而不必背负可能影响它们与用户互动的合成创伤包袱。
当其他公司无意中创造出有焦虑障碍的 AI 时,xAI 建造了一个真正有效的东西。
...

热门
排行
收藏
