核心观点:编程十几年,最近几个月我一直在刻意训练自己「不写一行代码完成目标」。实践中遇到的挑战让我更加坚定:当前工具链的爆发不是智能的初衷,模型能力才是真正的护城河。Harness、Agent、Loop这些概念本质上是模型智能化不足的权宜之计。这是黎明前的黑夜,但光明终将到来。
从实践者视角看AI编程的演进
过去几个月,我尝试了各种AI编程工具和工作流。从IDE补全到Agent自动写代码,从手动prompt到Harness框架,我深刻体会到一个事实:工具的复杂度在增加,但真正的突破始终依赖模型能力的提升。
工具链爆发背后的无奈
今天的AI编程工具链呈现爆炸式增长:各种Harness框架、Agent编排工具、Loop调度系统层出不穷。但仔细想想,这些工具的出现恰恰说明:模型还不够聪明。
如果模型能自动理解上下文、自我验证代码、自动修复bug,我们还需要这么多外部机制吗?
Boris的洞见印证了我的判断
Claude Code创建者Boris在Sequoia访谈中的观点,与我几个月的实践感悟不谋而合:
- “模型能做所有这些事,只是还没有产品把它捕捉下来”
- “随着模型变强,harness的重要性会下降”
- “一年以后,很多今天围绕安全和权限搭出来的外壳会变得没那么重”
这不是预言,而是正在发生的事实。
为什么模型才是终极护城河
深入实践后,我对AI编程的本质有了更深的理解。
Harness是"模型不足补偿器"
当前所有围绕prompt、权限、验证搭建的复杂机制,都是模型不够智能时的过渡方案。
举个例子:
- Prompt injection防护 → 模型理解能力不足
- 静态验证命令 → 模型自我验证能力不足
- 权限模式 → 模型对齐能力不足
- Human-in-the-loop → 模型决策可靠性不足
当模型真正理解代码的语义、能够自我验证、自动对齐人类意图时,这些外部机制都会变得多余。
真正的竞争在模型层
Anthropic能做出Claude Code,核心不是Harness设计得有多精巧,而是他们有强大的模型能力。真正决定AI编程未来的,是模型的:
- 深度理解能力:理解大型代码库架构、追踪变更影响
- 自我验证能力:生成代码后自动检查、修复bug
- 多模态能力:结合文档、测试、上下文做出最优决策
- 持续学习能力:从错误中学习、快速适应新技术
AI编程的下一步竞争
基于我的实践和判断,未来的竞争会集中在三个维度:
1. 模型的"代码理解力"跃迁
当前模型能写代码,但还做不到"理解"代码。真正的突破在于:
- 理解代码的业务意图和架构设计
- 在更高抽象层次进行设计决策
- 自动发现潜在问题和优化空间
2. 从"辅助"到"自主"的跨越
Boris提到的Loop是方向,但真正的自主编程需要:
- 模型能自动拆解任务、规划执行路径
- 端到端交付无需人类干预
- 自我发现问题、自我修复、自我优化
3. 组织级AI原生能力
大公司和创业公司的差距将在于:
- 谁能把PR、CI、反馈拆成Agent可处理的任务
- 谁能从第一天就按AI native方式搭建组织
- 谁能建立有效的验证标准和治理体系
我的实践经验:不写代码完成目标
这几个月的实践让我有了深刻体会:
从"写代码"到"定义问题"
我不再关注如何写代码,而是关注如何把业务需求转化为模型能理解的指令。这要求:
- 清晰定义目标和约束
- 建立验证标准
- 设计反馈循环
工具只是手段,模型才是核心
我尝试过各种Harness框架,但最终发现:与其花时间优化工具,不如花时间理解模型能力的边界,找到最适合当前模型的工作方式。
对AI从业者的建议
不要迷信工具,要理解模型
很多人在研究Harness架构、prompt工程,但真正的护城河是对模型能力的深度理解。要知道模型能做什么、不能做什么、边界在哪里。
关注模型演进的节奏
Boris说他们按周规划,这个节奏很重要。今天花很多工程力做的权限、验证、提示词结构,几个月后可能被新模型能力吃掉。
培养"定义问题"的能力
未来的工程师价值不再是写代码,而是:
- 定义正确的问题
- 组织Agent解决问题
- 建立验证标准
结语
实践告诉我:AI编程的终局不是工具的胜利,而是模型的胜利。
Harness、Agent、Loop这些概念都是过渡阶段的产物。当模型足够强大时,很多今天复杂的工程设计都会变得多余。
黎明前的黑夜并不可怕,可怕的是在黑夜中迷失方向。与其纠结工具的细节,不如把目光投向模型能力的本质。真正的机会,永远在最核心的地方。
我相信,当模型能力再上一个台阶,我们会迎来真正的智能编程时代。那时,“不写一行代码完成目标"将成为常态,而不是刻意训练的结果。