模型为王:AI编程的终局判断
核心观点:编程十几年,最近几个月我一直在刻意训练自己「不写一行代码完成目标」。实践中遇到的挑战让我更加坚定:当前工具链的爆发不是智能的初衷,模型能力才是真正的护城河。Harness、Agent、Loop这些概念本质上是模型智能化不足的权宜之计。这是黎明前的黑夜,但光明终将到来。 从实践者视角看AI编程的演进 过去几个月,我尝试了各种AI编程工具和工作流。从IDE补全到Agent自动写代码,从手动prompt到Harness框架,我深刻体会到一个事实:工具的复杂度在增加,但真正的突破始终依赖模型能力的提升。 工具链爆发背后的无奈 今天的AI编程工具链呈现爆炸式增长:各种Harness框架、Agent编排工具、Loop调度系统层出不穷。但仔细想想,这些工具的出现恰恰说明:模型还不够聪明。 如果模型能自动理解上下文、自我验证代码、自动修复bug,我们还需要这么多外部机制吗? Boris的洞见印证了我的判断 Claude Code创建者Boris在Sequoia访谈中的观点,与我几个月的实践感悟不谋而合: “模型能做所有这些事,只是还没有产品把它捕捉下来” “随着模型变强,harness的重要性会下降” “一年以后,很多今天围绕安全和权限搭出来的外壳会变得没那么重” 这不是预言,而是正在发生的事实。 为什么模型才是终极护城河 深入实践后,我对AI编程的本质有了更深的理解。 Harness是"模型不足补偿器" 当前所有围绕prompt、权限、验证搭建的复杂机制,都是模型不够智能时的过渡方案。 举个例子: Prompt injection防护 → 模型理解能力不足 静态验证命令 → 模型自我验证能力不足 权限模式 → 模型对齐能力不足 Human-in-the-loop → 模型决策可靠性不足 当模型真正理解代码的语义、能够自我验证、自动对齐人类意图时,这些外部机制都会变得多余。 真正的竞争在模型层 Anthropic能做出Claude Code,核心不是Harness设计得有多精巧,而是他们有强大的模型能力。真正决定AI编程未来的,是模型的: 深度理解能力:理解大型代码库架构、追踪变更影响 自我验证能力:生成代码后自动检查、修复bug 多模态能力:结合文档、测试、上下文做出最优决策 持续学习能力:从错误中学习、快速适应新技术 AI编程的下一步竞争 基于我的实践和判断,未来的竞争会集中在三个维度: 1. 模型的"代码理解力"跃迁 当前模型能写代码,但还做不到"理解"代码。真正的突破在于: 理解代码的业务意图和架构设计 在更高抽象层次进行设计决策 自动发现潜在问题和优化空间 2. 从"辅助"到"自主"的跨越 Boris提到的Loop是方向,但真正的自主编程需要: 模型能自动拆解任务、规划执行路径 端到端交付无需人类干预 自我发现问题、自我修复、自我优化 3. 组织级AI原生能力 大公司和创业公司的差距将在于: 谁能把PR、CI、反馈拆成Agent可处理的任务 谁能从第一天就按AI native方式搭建组织 谁能建立有效的验证标准和治理体系 我的实践经验:不写代码完成目标 这几个月的实践让我有了深刻体会: 从"写代码"到"定义问题" 我不再关注如何写代码,而是关注如何把业务需求转化为模型能理解的指令。这要求: 清晰定义目标和约束 建立验证标准 设计反馈循环 工具只是手段,模型才是核心 我尝试过各种Harness框架,但最终发现:与其花时间优化工具,不如花时间理解模型能力的边界,找到最适合当前模型的工作方式。 对AI从业者的建议 不要迷信工具,要理解模型 很多人在研究Harness架构、prompt工程,但真正的护城河是对模型能力的深度理解。要知道模型能做什么、不能做什么、边界在哪里。 ...