Coding Agents 正在重塑工程、产品与设计的分工逻辑

原文:Harrison Chase, How Coding Agents Are Reshaping Engineering, Product and Design, LangChain Blog, 2026 年 3 月。以下为编译,保留原文结构与论点,部分段落做了压缩和意译。 软件公司里的 EPD——工程(Engineering)、产品(Product)、设计(Design)——存在的目的只有一个:造出能用的软件。角色分得再细,最终交付物也只是代码。 认清这一点很重要,因为 Coding Agents 突然让写代码变得极其廉价。那么,EPD 的角色会怎么变? PRDs 已死 在 Coding Agent 出现之前,PRD(产品需求文档)是软件开发的起点。标准流程是一条清晰的瀑布: 有人(通常是 PM)冒出一个想法 PM 写 PRD 设计师根据 PRD 画 Mock 工程师把 Mock 变成代码 这不是铁律——创业公司里这些步骤经常混在一起,最好的 Builder 能一个人跨好几个环节。但之所以还有这条「标准流程」,是因为写软件和画 Mock 都需要大量时间。于是产生了专业分工,也产生了跨分工沟通的需求。PRD 就是这个沟通的起点,一切从这里瀑布到设计,再瀑布到工程。 Coding Agents 改变了这一切。它们可以把一个想法直接变成能跑的软件。所以当我(和其他人)说「PRDs 已死」,真正的意思是:这种以写 PRD 为起点的传统软件开发方式已死。 瓶颈从实现转向审查 任何人现在都能写代码,也就意味着任何人都能做东西。但这不代表做出来的东西架构良好,不代表解决了正确的问题,也不代表好用。 工程、产品和设计应该成为这些维度的审查者和仲裁者。生成的代码并不总是「好的」,EPD 的角色变成了审查并确保它是「好的」。「好的」意味着: 工程视角:架构是否可扩展、高性能、健壮? 产品视角:是否真正解决了用户痛点? 设计视角:界面是否易用、直观? 由于生成初版代码的成本极低,原型数量大幅增加。这些原型成为焦点,EPD 围着它们审查。 问题在于——生成代码太容易了。以前写代码需要时间,审查者桌上同时摆的项目有限。现在任何人都能写代码,在做的项目数量在膨胀。我们在三个职能中看到的瓶颈都是同一个:审查——拿着原型,确保它们是「好的」。 PRDs 万岁 以写 PRD 为起点的旧流程死了,但描述产品需求的文档依然必不可少。 假设有人冒出一个想法,快速生成了一个原型。这个原型怎么进生产?它需要 EPD 其他成员审查。审查时,一份书面文档总是有帮助的,甚至是必需的——别人看代码时,怎么知道某段代码是手误还是有意为之?这取决于意图,而意图需要被传达。 ...

ZHANG.z | March 12, 2026 | 17 min | Shanghai

A Good Company Everyday - Waymo One

真正伟大的产品从不纠结于"它能做什么",而是追问"它能为生活带来什么改变"。Waymo One在App Store拿下满分,本质上不是因为它是全球首个商用无人驾驶网约车服务,而是它用AI撕开了传统出行的边界,把"必须有人驾驶"的固有认知,变成了"人人可自由支配的出行时间"。它到底是什么?是从谷歌2009年自动驾驶项目孵化而来,用十六年时间打磨出的"移动自由空间",更是未来智能交通的基础设施雏形。 这种对出行本质的重构,从来不是突发奇想。Waymo的起点是谷歌内部一个看似不切实际的目标:让出行更安全、更平等。2009年,当大多数公司还在纠结辅助驾驶功能时,他们已经开始搭建完整的自动驾驶系统。2016年从谷歌独立成为Alphabet子公司,Waymo的使命更清晰——做"世界上最值得信任的司机"。2018年Waymo One应用推出,从凤凰城的小规模测试,到如今覆盖旧金山、洛杉矶、凤凰城等多座城市,甚至通过与Uber合作进入奥斯汀、亚特兰大,每一步都不是为了抢占市场,而是用真实场景打磨技术,建立用户信任。这种长期主义的打磨,让它积累了1.55亿英里安全行驶里程,完成超2000万次付费出行,周订单量突破45万单。这些数据不是炫耀的资本,而是支撑"永远不疲劳、永远不分心"承诺的基石。 真正用过Waymo One,才会明白它的聪明之处从不是"无人"这个标签,而是把技术彻底融入体验的细节里。打开App叫车,你不用像传统网约车那样反复确认位置,系统会自动选择最安全的上下车点。车辆到达前,车顶会亮起你在App里设置的专属字母,再加上可以通过App让车辆鸣笛或播放旋律的设计,在停车场找车变成了一件轻松的事。坐进车内,没有司机的局促感,宽敞的全电动Jaguar I-PACE车厢每天都会细致清洁,你可以通过屏幕连接Spotify播放音乐,调整到自己舒服的温度,甚至随时添加中途停靠点。最关键的是那份安全感。车内屏幕会实时显示Waymo Driver看到的路况,行人和车辆都被清晰标记,你能直观感受到它的决策逻辑,这种"透明化"的设计,比任何宣传都能打消对无人驾驶的顾虑。而技术层面,它没有走纯视觉的捷径,而是用激光雷达+摄像头+雷达的三重感知方案,在旧金山停电导致信号灯失效时,依然能稳定运行,这种冗余设计不是技术堆砌,而是对生命的敬畏。更难得的是它的包容性,为视障用户优化的屏幕阅读器、可预约的无障碍车辆,让出行自由不再是少数人的特权,这才是技术应有的温度。 至于Waymo One的未来,绝不止于"更大的网约车公司"。它刚刚获得内华达州的全面运营许可,计划2026年引入极氪RT平台把单车成本从12万美元降到8万美元以下,还将与丰田合作进军东京市场,这些动作都是在为规模化铺路。但规模化的终极目标,是让无人驾驶成为像水电一样的基础设施。当单车成本足够低,覆盖范围足够广,改变的就不只是个人出行。更少的交通事故会减轻社会负担,更高效的路线规划能缓解拥堵,全电动车队会推动环保,甚至城市规划都会因为"无需大量停车场"而重新设计。未来的Waymo One,可能不再只是一个叫车App,而是智能出行管家,提前预判拥堵,联动目的地的服务,把"出行"和"生活"无缝衔接。更重要的是,它积累的每一公里路况数据、每一次AI决策经验,都会成为智能交通的核心资产,推动整个行业从"有人驾驶"向"智能出行"跃迁。 说到底,Waymo One的5分好评,是用户对"技术向善"的投票。它证明了最先进的AI技术,不该用来制造焦虑,而是要帮人们摆脱负担。最伟大的产品,不是颠覆世界的口号,而是让每个人的生活都变得更自由、更平等。这也是所有伟大产品的共通之处:用技术读懂人性,用体验改变生活。

ZHANG.z" | January 8, 2026 | 7 min | Shanghai

【ChatGPT时刻09】GPT-3:少样本学习的突破与涌现能力

本文解读的是Tom Brown等人于2020年发表的划时代论文《Language Models are Few-Shot Learners》,该论文提出了GPT-3模型,以1750亿参数的前所未有规模,首次展示了大语言模型的上下文学习(In-context Learning)和涌现能力(Emergent Abilities)。GPT-3证明了一个惊人的事实:足够大的语言模型无需更新参数,仅通过在输入中提供少量示例,就能执行从未见过的任务——这一发现彻底改变了AI的发展轨迹,直接催生了ChatGPT的诞生。 从零样本到少样本的飞跃 问题一:零样本学习的局限 GPT-2展示了零样本学习的可能性,但性能仍然有限: 任务 零样本GPT-2 微调SOTA 差距 CoQA 55 F1 82 F1 -27 翻译(法英) 11.5 BLEU 45.6 BLEU -34 摘要 21.6 ROUGE 44.2 ROUGE -23 零样本学习虽然证明了概念,但实用性不足。 问题二:微调的代价 传统微调方法虽然有效,但存在显著问题: 数据需求:每个任务需要数千到数十万标注样本 过拟合风险:在小数据集上容易过拟合 分布偏移:微调数据与测试数据分布不一致 计算成本:大模型微调需要大量计算资源 灵活性差:每个任务需要单独模型 问题三:人类学习的启示 人类可以从极少量示例中学习新任务: “看一个例子:‘狗’的复数是’dogs’。那’猫’的复数是什么?” 人类不需要数千个训练样本,仅需要任务描述和少量示例就能泛化。GPT-3的目标是:让机器具备类似的学习能力。 GPT-3的核心创新 前所未有的规模 GPT-3将规模推向极致: 参数 GPT-2 GPT-3 Small GPT-3 Medium GPT-3 Large GPT-3 XL GPT-3 175B 层数 48 12 24 24 32 96 隐藏维度 1600 768 1024 1536 2048 12288 注意力头数 25 12 16 16 24 96 参数量 1.5B 125M 350M 760M 1.3B 175B 最大的GPT-3模型参数量达到1750亿,是GPT-2的100倍以上。 ...

ZHANG.z | December 15, 2025 | 14 min | Shanghai

OpenAI的12天发布会:生成式AI的终极形态,还是营销噱头?

OpenAI的12天发布会终于结束了,我全程追完了所有直播。当演示者用自然语言和视频交互时,我突然有种穿越到未来的感觉——这可能就是生成式AI的终极形态了。 表层:AI视频的技术突破 Sora的视频生成能力又提升了,现在能生成5分钟高清视频,连人物微表情都能模拟。视频交互模式也落地了,直接对视频内容提问,AI会实时回答。上周跟做内容创作的朋友聊天,他说:“以前拍短视频要2000块,现在用AI只要200块,效果还不差。“已经不用请摄影师了。 深层:中美视频AI的竞争格局 中美在生成式视频领域的竞争很激烈:谷歌发布了Veo 2大模型,腾讯也开源了视频大模型。美国在技术前沿领先,中国在落地应用更快——抖音已经在测试AI生成视频功能了。但冷静下来想,深度伪造的风险也不容忽视:生成的人物和真实几乎一模一样,要是用来制作虚假视频,后果不堪设想。 终局:GPT-o3的营销噱头? 最让我感慨的是OpenAI预测的GPT-o3,2025年发布,据说能实现真正的多模态交互,甚至理解人类情感。但这会不会是又一个营销噱头?毕竟,GPT-4o刚发布时,也有很多承诺没兑现。 生成式AI的终极形态到底是什么?是理解和创造任何内容的超级智能,还是人类想象力的延伸? 2025年的GPT-o3会给我们答案。但无论如何,OpenAI的12天发布会已经展示了AI的未来——更加智能、自然的人机交互时代。我已经迫不及待想看到那一天了。

ZHANG.z" | December 28, 2024 | 2 min | Shanghai