Claude Code称霸后,我把Cursor和Copilot都扔了:实测Token从120万砍到4万

上周,Graphon AI 低调完成 830 万美元融资,推出 “pre-model intelligence layer” 来解决企业多模态数据关联难题;几乎同一时间,Anthropic 发布了 Dreaming 机制,让 Agent 能够在 session 间自我审视和迭代行为。

这两件事叠加在一起,让我这个带队做 AI 测试和企业级 Agent 落地的老兵忍不住把 coding 工具栈又全部重测了一遍。过去半年,我们团队在内部推进 Agentic workflow,代码相关任务占比超过 60%。以前靠提示词 + 简单 RAG 硬刚,现在玩法完全变了。

真实痛点任务

我选了一个典型的遗留系统重构任务: 一个约 2.8 万行 的 Java Spring Boot 服务,涉及 6 个微服务调用、老旧 JPA 查询和手写缓存逻辑。要求重构成支持 Agentic payment、现代 observability、添加 guardrails,并输出完整迁移报告。

第一轮:Cursor 3.1 + Composer 2(4月版本)

使用 Cursor 并行 Agent 模式,喂完整 repo + AGENTS.md。 耗时约 45 分钟 交互,模型在 Sonnet 4.x 和 Opus 间切换。 完成度约 70%,但 payment 抽象层与 guardrails 出现明显冲突,observability 也漏了核心 metric。 总 Token 消耗约 120 万,后续人工修复花了 2.5 小时。

核心问题是:Cursor 在跨文件规划上深度不够,遇到跨服务一致性问题时容易陷入局部最优,需要持续人工纠偏。

第二轮:Claude Code(Opus 4.7 + Dreaming preview)

同一任务,直接扔 repo + 详细指令,先让它 plan 再执行。关键是用上了刚发布的 Dreaming 能力——它会在子任务间主动暂停、自我 review,寻找 pattern 和潜在 bug。

整个过程有效交互仅 18 分钟。 Payment 抽象层处理得非常合理,guardrails 和 temporal memory 也更干净。 总 Token 消耗约 4.2 万,人工介入仅 40 分钟,整体质量明显高出一个档次。

真实差距就这么大。不是单纯模型更强,而是 Claude Code 的 long-running task handling + self-verification loop,大幅压缩了“提示词拉扯”环节。

Copilot 也测了。在 inline 补全和小重构上依然流畅,但面对这种跨服务、带 Agentic 语义的任务就力不从心,需要手动管理多个 chat,上下文全靠人脑。

我的核心观点

提示词工程在 Agentic Coding 时代确实正在快速过时。

过去我们把 80% 的精力花在写完美 prompt 上,现在更重要的是设计 Agent 的“操作系统”:清晰的 AGENTS.md、合理的 repo 结构、工具暴露方式,以及完整的 feedback loop。Claude Code 的 Dreaming 本质上就是把“人类反思”这个环节工程化了。

当然,不是说 Cursor 和 Copilot 没价值:

  • Cursor 的 IDE 集成依然顶级,适合日常小修小补;

  • Copilot 适合团队协作的 autocomplete。

我现在的生产栈是:Claude Code 主力负责复杂 Agent 任务 + Cursor 辅助编辑 + Copilot 保留在轻量流水线。

随着 Agentic AI 从实验走向生产(Gartner 预测 2026 年 40% 企业应用将嵌入 task-specific agents),coding 工具的胜负手已经不是“谁的模型更强”,而是谁能真正把 规划-执行-验证 闭环做好。

传统 RAG 在长上下文模型(Claude 百万 token 级别)面前被削弱,但 Agentic RAG(带 critic、reflection 和 graph memory)反而变得更加重要。Graphon AI 推的 pre-model intelligence layer,很可能就是下一块关键拼图。

你现在主力用哪个 coding Agent? 欢迎在评论区分享你的真实体验,尤其是 Claude Code Dreaming 在实际项目中的表现,以及你在企业落地中踩过的坑。

声明:图片由AI辅助生成

Logo

openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目,面向数字基础设施四大核心场景(服务器、云计算、边缘计算、嵌入式),全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构

更多推荐