代理編碼生活小技巧 我對使用這個有點內疚,但管它呢。 當我要求代理進行大規模的比較/修訂循環時,這通常發生在我有一個龐大的 markdown 計劃,並且從 GPT Pro 的網頁應用中獲得了詳細的反饋,然後進一步向 GPT Pro 展示了來自同一提示的反饋,該提示顯示給 Opus4.5、Gemini3 與 DeepThink 和 Grok4 Heavy(都使用網頁應用),即使是 Codex 與 GPT 5.2 高版本在第一次整合所有修訂時也會漏掉很多東西。 如果你告訴它找出 "所有" 的問題,因為它不知道漏掉了多少,它往往會一直找,直到找到很多問題。如果你告訴它找出至少 20 個問題,它通常會在找到 23 個問題/不匹配後回來。 這當然假設確實存在問題,但當計劃超過 5000 行且修訂超過 2000 行時,基本上總是會有問題。 無論如何,解決方案是對它們撒謊,給它們一個巨大的數字,然後它們會繼續努力,直到揭示所有問題: "再做一次,並且要特別小心:你能否再次檢查計劃並將其與我給你的所有反饋進行比較?我確信你漏掉或搞錯了至少 80 個複雜反饋的要素"