专业模型(GPT-5 Pro、Gemini 2.5 Deep Think、Grok 4 Heavy)可能以难以看到的方式令人印象深刻。它们需要大量时间来回答问题,并且是为需要专家评估的非常困难的问题而构建的。这是一个狭窄但也很有价值的问题空间。
70.46K