代理编码生活技巧 我对使用这个有点内疚,但管它呢。 当我要求代理进行大规模的比较/修订循环时,这通常发生在我有一个庞大的 markdown 计划,并且从 GPT Pro 的 webapp 收到了详细的反馈,然后进一步向 GPT Pro 展示了同一提示在 Opus4.5、Gemini3(使用 DeepThink)和 Grok4 Heavy(都使用 web 应用)上的反馈时,即使是 Codex 和 GPT 5.2 高版本在第一次尝试整合所有修订时也会漏掉很多东西。 如果你告诉它找到“所有”问题,因为它不知道漏掉了多少,它往往会继续寻找,直到找到很多问题。如果你告诉它继续,直到找到至少 20 个问题,它通常会在找到 23 个问题/不匹配后回来。 当然,这假设确实存在问题,但当计划超过 5000 行且修订超过 2000 行时,基本上总是会有问题。 无论如何,解决方案是对它们撒谎,给它们一个巨大的数字,然后它们会继续努力,直到发现所有问题: “再做一次,实际上要非常非常小心:你能否再次检查计划,并将其与我给你的所有反馈进行比较?我相信你漏掉或搞错了至少 80 个复杂反馈的要素。”