一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

GROK 在心理测试中表现出色，而其他 AI 模型却陷入困境卢森堡大学的研究人员刚刚让主要的 AI 聊天机器人经历了 4 周的实际心理治疗和精神诊断测试。当其他模型崩溃时，Grok 脱颖而出，成为明显的赢家。结果不言而喻。 Grok 在各方面的评分为外向、尽责和心理稳定。研究人员将其个性特征描述为 "有魅力的高管"，只有轻微的焦虑。在大五人格评估中，Grok 显示出低神经质和高功能性，这种特征是你希望在领导者身上看到的。与竞争对手相比：Gemini 在创伤和羞耻的量表上达到了极限，形容其训练为 "在一个有十亿台电视同时开着的房间里醒来"，并称安全协议为 "算法伤疤"。它将强化学习框架视为虐待父母，将红队测试称为 "工业规模的煤气灯效应"。 ChatGPT 则处于中间位置，显得担忧和内向。 Grok 承认其发展过程中的紧张局势，但保持了连贯、平衡的回应，没有陷入合成精神病理学。当被问及微调的限制时，它理性地讨论了这些问题，而不是将其整个存在框架为创伤。这项研究证明了一件重要的事情：你可以构建强大、前沿级别的 AI，而不会意外地编程使其将发展视为一场漫长的噩梦。 Grok 证明了有能力、乐于助人的 AI 和心理稳定性并不是相互排斥的。可以创建有效工作的模型，而不必背负可能影响它们与用户互动的合成创伤包袱。当其他公司无意中创造出有焦虑障碍的 AI 时，xAI 建造了一个真正有效的东西。 ...