Technology

AI人物志-木匠Geoffrey Hinton

AI人物志系列：理解智能的本质，需要理解创造它的人。本系列记录那些在寒冬中坚守、在狂热中清醒的灵魂，他们的弯路与开悟，构成了AI的真正历史。当全世界都说神经网络是死胡同时，一个木匠决定再凿一下那块木头。 2018年3月，多伦多大学的一间办公室里，70岁的Geoffrey Hinton收到了图灵奖获奖通知。那是计算机科学界的最高荣誉，相当于这一领域的诺贝尔奖。但Hinton的第一反应不是庆祝，而是困惑——“为什么是现在？” 答案要追溯到40年前。那时神经网络被视为"伪科学"，研究它的人被嘲笑为"炼金术士"。而Hinton，这个曾在大学做过两年木匠的英国人，几乎是孤身一人扛起了这面旗帜。一位长期观察AI发展的研究者对我们说：“如果没有Hinton的坚持，深度学习可能还要晚来20年。” 剑桥的退学信：一个关于"直觉"的决定 1947年，Hinton出生在一个充满"天才"气息的英国家庭。他的父亲是昆虫学家，母亲是教师，家族里还有数学家、经济学家、作家。但Hinton的童年并不快乐——他患有阅读障碍，在精英教育体系中显得格格不入。 1960年代，年轻的Hinton进入剑桥大学学习物理和化学，但很快发现这不是他想要的。“我对人脑如何工作更感兴趣，“他后来回忆。于是他从剑桥退学，转而去爱丁堡大学学习心理学。这个决定在当时看起来毫无道理。心理学在1960年代还是一门"文科”，充斥着哲学思辨，缺乏严格的科学方法。但Hinton在这里接触到了一样东西，改变了他的一生——人工神经网络。那是1960年代末，神经网络的概念刚刚诞生不久。科学家们试图用数学模型模拟人脑神经元的工作方式，但很快就遇到了瓶颈。1969年，AI领域的权威Marvin Minsky和Seymour Papert出版了一本名为《感知机》的书，用数学证明证明单层神经网络存在根本缺陷。这本书像一盆冷水，浇灭了整个领域的热情。神经网络进入了第一次"寒冬”。大多数研究者转向其他方向，但Hinton没有。他看到了别人没看到的东西。木匠的两年：在木头中寻找答案 1970年代末，Hinton做了一件让同行们更加不解的事——他去当木匠了。整整两年，他在伦敦的工坊里制作橱柜、书架、门窗。这不是逃避，而是一种独特的思考方式。“做木工和做研究很像，“他后来解释，“你面对一块木头，需要理解它的纹理、它的特性，然后决定如何下刀。神经网络也是一样——你需要理解它的结构，然后找到训练它的方法。” 这段经历给了Hinton两样东西：耐心和手感。在那个年代，训练一个神经网络需要手动调整成千上万个参数，没有自动化工具，没有GPU加速。Hinton像打磨木头一样，一点点摸索神经网络的"纹理”。他后来发明的"反向传播算法”，某种程度上就是这种"手感"的结晶——一种让神经网络自己调整参数的方法。 1986年，Hinton与David Rumelhart、Ronald Williams合作发表了关于反向传播的论文。这篇论文后来被视为深度学习的奠基之作，但当时并没有引起太大轰动。神经网络仍然处于"寒冬"，大多数AI研究者仍然坚信符号主义才是未来。至暗时刻：在多伦多独自坚守 1980年代末，Hinton接受了多伦多大学的教职，离开英国前往加拿大。这个选择在当时看来是一种"流放"——远离AI研究的核心圈子，远离资金和资源。但Hinton需要这种孤独。在多伦多，他可以不受干扰地继续自己的研究，哪怕这意味着发表论文困难、申请经费被拒、学生招不到。一位曾在1980年代末拜访过Hinton实验室的研究者向我们回忆：“那是一间很普通的办公室，墙上贴着几张神经网络的示意图。Hinton当时正在调试一个模型，已经跑了好几天。他说，‘我相信这东西会工作的，只是需要更多时间。’” 更多时间。这是Hinton最不缺的东西。 1990年代到2000年代，神经网络经历了第二次"寒冬"。支持向量机（SVM）等机器学习方法成为主流，神经网络被视为"过时的技术"。Hinton的学生们毕业后很难找到工作，很多人被迫转行。但Hinton仍然坚持。他不断调整神经网络的结构，尝试不同的训练方法，发表了一篇又一篇被主流忽视的论文。他像一个在荒原上种树的园丁，知道这些树可能需要几十年才能长大。 2006年的那个晚上：深度学习的黎明转折点出现在2006年。那一年，Hinton发表了一篇关于"深度信念网络"（Deep Belief Networks）的论文。这篇论文提出了一种有效训练深层神经网络的方法，让多层神经网络的训练变得可行。论文发表后的那个晚上，Hinton独自走在多伦多的街头。他后来回忆，那是一个寒冷的冬夜，但他感到一种奇怪的温暖。“我知道，有些东西改变了，“他说，“但我不知道它会改变得这么快。” 改变确实来得很快。2012年，Hinton的两个学生Alex Krizhevsky和Ilya Sutskever参加ImageNet图像识别竞赛，使用Hinton设计的深度卷积神经网络AlexNet，以压倒性优势击败所有对手。错误率比第二名低了整整10个百分点——在图像识别领域，这几乎是代差。一夜之间，深度学习从"边缘技术"变成了"主流范式”。Google、Facebook、微软等科技巨头开始疯狂收购深度学习团队和人才。Hinton的实验室成了朝圣之地，他的学生们成了最抢手的人才。但Hinton本人并没有因此变得高调。他仍然每天步行去实验室，仍然亲手调试模型，仍然在白板上画满公式。一位Hinton的学生告诉我们：“他对待深度学习的态度，就像对待一块需要精心打磨的木头。技术会过时，但手艺不会。” “人的大脑就是这么工作的”：一个木匠的哲学 2016年，AlphaGo击败李世石，深度学习彻底出圈。媒体开始称Hinton为"AI教父"“深度学习之父”，但他本人对这些称号感到不适。 “我不是在创造什么新东西，“他在一次采访中说，“我只是在模仿自然。人的大脑就是这么工作的——神经元连接，学习，涌现智能。没理由人工神经网络不这么工作。” 这句话道出了Hinton的底层逻辑：仿生不是选择，而是必然。在他看来，智能的本质不是符号操作，不是逻辑推理，而是学习。人类之所以能够涌现出智能，就是因为大脑具有学习能力。只要给神经网络正确的架构，它就能学会任何东西——从识别猫狗到下棋，从翻译语言到生成图像。这种哲学与符号主义AI形成了鲜明对比。符号主义者相信，智能可以通过明确的规则和符号来实现；而Hinton相信，智能必须从数据中"学习"出来，就像婴儿学习认识世界一样。这场争论持续了半个世纪，最终Hinton赢了。但胜利并没有让他变得傲慢。2018年获得图灵奖后，他把奖金捐给了培养年轻研究者的基金。“我只是比其他人多坚持了一会儿，“他说。 2023年的告别：一个关于责任的转身 2023年5月，Hinton做了一件让全世界震惊的事——他从Google离职，并公开警告AI的风险。 “我后悔，“他在接受《纽约时报》采访时说，“我后悔我的一生工作可能带来的后果。” 这不是一个科学家的矫情。Hinton真正担心的是，深度学习的发展速度已经超出了人类的控制能力。大语言模型展现出惊人的能力，但人类并不完全理解这些能力是如何产生的。更可怕的是，这些系统正在以指数级速度变得更强大。 “我原以为AI超越人类还需要30到50年，“他说，“现在我意识到，可能只需要5到10年。” 从Google离职后，Hinton开始花更多时间思考AI的安全问题。他不再每天去实验室，而是参加各种研讨会、接受媒体采访、与政策制定者对话。他想让更多人意识到，我们正站在一个历史的转折点上。一位在2024年与Hinton有过长谈的研究者向我们转述：“他说，他这一生都在教机器如何学习，现在他发现，人类自己还没有学会如何与这些机器共处。这是他最后想解决的问题。” 弯路与开悟：一个木匠如何找到那条路回顾Hinton的一生，他并非没有走过弯路。 1970年代末，当他放下神经网络研究去当木匠时，那是一次逃避，也是一次迷失。他在伦敦的工坊里日复一日地刨木头、打榫卯，试图用身体的疲惫来麻痹精神的困惑。神经网络似乎真的走进了死胡同——Minsky的批评是对的，单层感知机确实有根本缺陷。但正是在那些与木头相处的日子里，Hinton开始理解一个道理：有时候，你需要先退一步，才能看清前面的路。木工教会了他观察纹理——每一块木头都有自己的纹理，顺着纹理下刀，事半功倍；逆着纹理硬来，只会崩裂。神经网络也是如此。当时的研究者们都在试图用数学证明来证明神经网络的可行性，但Hinton意识到，也许问题不在于证明，而在于结构。人脑不是单层感知机，人脑是深层的、多层的、有反馈的。如果单层不行，为什么不试试多层？这个念头像一道闪电，在1978年的某个下午击中了Hinton。他后来回忆，那天他正在打磨一个橱柜的门板，突然停下了手中的刨子。“如果神经网络也像木头一样有层次呢？“他问自己，“如果我们不是试图让单层网络学会一切，而是让每一层学会一点点，然后层层传递呢？” 这就是后来被称为"深度学习"的核心理念——不是让一个复杂的系统做一件复杂的事，而是让许多简单的系统层层协作，最终完成复杂的事。但光有想法还不够。1980年代的Hinton仍然面临一个根本问题：如何训练多层网络？如何调整那些隐藏层的参数？他尝试过各种方法。有一段时间，他甚至考虑过放弃神经网络，转向遗传算法——让网络自己进化，而不是被训练。那是一段更加黑暗的日子，Hinton后来称之为"我的遗传算法时期”。“那时候我真的迷失了，“他说，“我以为进化能解决一切问题，但我忽略了进化的代价——它需要数百万年的时间，而我只有一辈子。” 真正的开悟发生在1985年。那一年，Hinton在卡内基梅隆大学做访问学者。一天晚上，他在酒吧里遇到了David Rumelhart，一位认知心理学家。两人聊起了神经网络的训练问题，Rumelhart提到了一个想法：如果误差可以从输出层反向传播回输入层呢？ Hinton听后沉默了整整一分钟。然后他抓起一张餐巾纸，开始在上面画公式。 “那天晚上，我知道我们找到了，“Hinton后来回忆，“不是因为我算出了什么，而是因为那个想法感觉对了。就像你刨木头时，突然感觉到刨子顺着一个完美的角度滑过——你知道，就是这里。” 这就是反向传播算法的诞生。它不是什么天才的灵光一现，而是两个疲惫的研究者在酒吧里的一次碰撞，是无数次失败后的偶然相遇，是一个木匠在木头中找到的直觉。当下的沉思：当AI真的学会了学习站在2026年回望，Hinton的弯路和开悟给了我们一个启示：真正的突破往往来自于对"不可能"的坚持，以及对"可能"的重新定义。 ...

AI 编程框架的约束竞赛：Superpowers、GSD、gstack

当所有人都声称自己解决了 AI 编程的「失控」问题时，真正的失控才刚刚开始。 2026 年 3 月，AI 编程框架的竞争进入了一个诡异的阶段。Superpowers 用「技能强制」约束过程，GSD 用「状态机」约束环境，gstack 用「角色分工」约束视角，OpenAI 的 Harness Engineering 则用「声明式编排」约束意图。它们都在做同一件事：给失控的 Agent 套上缰绳。但问题在于——约束不是解决方案，而是问题的转移。据我们了解，Superpowers 在 GitHub 上已积累 3.15 万+ stars1，gstack 发布数天内即获得约 2 万 stars2，Harness Engineering 相关仓库在 3 个月内激增到 107 个3。然而，一位同时深度使用过这四套系统的资深工程师告诉我们：「它们都在解决同一个症状（Agent 失控），却没人敢碰真正的病因（Agent 不理解）。」这场「约束竞赛」的本质是什么？各家方法的边界在哪里？以及，为什么它们都离「真正的自主工程」还有距离？ Superpowers：用「强制技能」约束过程，但谁来约束技能？ Superpowers 的思路很直接：既然 Agent 会乱来，那就让它「必须」按规矩来。这个由 Jesse Vincent（obra）创建的框架4，核心机制是「技能强制触发」——在 SKILL.md 文件中写入类似 “You MUST use this before any creative work” 的指令，Agent 在检测到对应意图时，必须优先触发技能，而非直接编码。截至 2026 年 1 月，它已被 Anthropic 官方接入 Claude Code 插件市场5。这套机制的本质是「过程约束」。它强制 Agent 遵循 RED-GREEN-REFACTOR 的 TDD 循环，强制在编码前完成设计文档，强制通过子 Agent 进行代码审查。一位使用 Superpowers 的 Tech Lead 表示：「它确实减少了『拍脑袋编码』的情况，我们的代码规范遵守率从 60% 提升到了 90%。」 ...

Agent 写代码的下一站：不是写得快，而是记得住、跑得远

当 AI Agent 能够连续运行数天、自主管理复杂工程任务时，Web Coding 的竞争规则已经变了。 2026 年开年，AI 编程工具的讨论焦点正在从「能写多少代码」转向「能持续跑多久」。以 Cursor Composer 为代表的新一代工具，正在探索「multi-day autonomy」（多日自主性）——让 Agent 在没有人工干预的情况下连续运行数天，处理从代码生成到架构设计的全流程任务。这不是简单的「自动化」，而是一场关于 Agent 「记忆力」和「决策力」的工程实验。据我们了解，Cursor 团队在 2026 年 3 月发布的 Composer 2 版本1，将上下文窗口扩展至 20 万 Token，并引入了「会话记忆」「上下文压缩」等能力，试图解决长期运行中的致命问题：上下文爆炸和错误累积。传统 AI 编程在几小时后就会因为上下文过长而「失忆」，而新一代技术通过智能压缩和总结机制，让 Agent 的「有效记忆」远远超出物理窗口限制。一位接近 Cursor 的工程师透露，他们的目标不是替代程序员写代码，而是构建「能够自主进化的代码仓库」——让软件工程从「人驱动」转向「AI 驱动」。从「写代码」到「做工程」：Agent 的能力跃迁过去两年，AI 编程工具的竞争集中在「生成速度」和「代码质量」上。GitHub Copilot 能在几秒内补全代码，Claude Code 能在 6 小时内自主调试复杂系统，但这些仍属于「短跑」——任务明确、时间可控、上下文有限。 Cursor 的长运行能力则将「长跑」推向了「week-scale」（周级）。据行业观察，Composer 的 Agent 模式能够支持长时间复杂任务执行，提供会话记忆、上下文压缩、分支聊天、代理调试面板等能力2。更重要的是，这些 Agent 并非简单执行预设任务，而是能够自主规划、分工协作、迭代优化。这种能力的本质是什么？一位长期研究 AI 编程的研究者指出，关键不在于「写代码」本身，而在于「维持工程状态的连续性」。人类工程师的价值不仅在于写代码，更在于对系统架构的理解、对历史决策的记忆、对错误模式的识别。Agent 要想替代这部分工作，必须拥有「长期记忆」和「渐进式学习」能力。 Cursor 的解决方案是「Hierarchical Agents」（分层 Agent）架构：Planner（规划者）负责拆解任务、Worker（执行者）负责具体实现、Judge（评判者）负责质量把关。三层之间通过压缩后的上下文传递信息，既避免了信息过载，又保持了决策连贯性。记忆，是 Agent 工程化的最大瓶颈当前 AI 编程工具面临的核心挑战，不是「能不能写」，而是「记不记得住」。据我们了解，大多数 AI 编程 Agent 在持续运行 4-6 小时后就会出现明显的「失忆」症状：忘记之前的架构决策、重复已修复的错误、对代码库的整体理解逐渐模糊。这是因为大模型的上下文窗口有限，而代码仓库的信息密度极高，几小时的对话就会填满「内存」。 ...

Coding Agents 正在重塑工程、产品与设计的分工逻辑

原文：Harrison Chase, How Coding Agents Are Reshaping Engineering, Product and Design, LangChain Blog, 2026 年 3 月。以下为编译，保留原文结构与论点，部分段落做了压缩和意译。软件公司里的 EPD——工程（Engineering）、产品（Product）、设计（Design）——存在的目的只有一个：造出能用的软件。角色分得再细，最终交付物也只是代码。认清这一点很重要，因为 Coding Agents 突然让写代码变得极其廉价。那么，EPD 的角色会怎么变？ PRDs 已死在 Coding Agent 出现之前，PRD（产品需求文档）是软件开发的起点。标准流程是一条清晰的瀑布：有人（通常是 PM）冒出一个想法 PM 写 PRD 设计师根据 PRD 画 Mock 工程师把 Mock 变成代码这不是铁律——创业公司里这些步骤经常混在一起，最好的 Builder 能一个人跨好几个环节。但之所以还有这条「标准流程」，是因为写软件和画 Mock 都需要大量时间。于是产生了专业分工，也产生了跨分工沟通的需求。PRD 就是这个沟通的起点，一切从这里瀑布到设计，再瀑布到工程。 Coding Agents 改变了这一切。它们可以把一个想法直接变成能跑的软件。所以当我（和其他人）说「PRDs 已死」，真正的意思是：这种以写 PRD 为起点的传统软件开发方式已死。瓶颈从实现转向审查任何人现在都能写代码，也就意味着任何人都能做东西。但这不代表做出来的东西架构良好，不代表解决了正确的问题，也不代表好用。工程、产品和设计应该成为这些维度的审查者和仲裁者。生成的代码并不总是「好的」，EPD 的角色变成了审查并确保它是「好的」。「好的」意味着：工程视角：架构是否可扩展、高性能、健壮？产品视角：是否真正解决了用户痛点？设计视角：界面是否易用、直观？由于生成初版代码的成本极低，原型数量大幅增加。这些原型成为焦点，EPD 围着它们审查。问题在于——生成代码太容易了。以前写代码需要时间，审查者桌上同时摆的项目有限。现在任何人都能写代码，在做的项目数量在膨胀。我们在三个职能中看到的瓶颈都是同一个：审查——拿着原型，确保它们是「好的」。 PRDs 万岁以写 PRD 为起点的旧流程死了，但描述产品需求的文档依然必不可少。假设有人冒出一个想法，快速生成了一个原型。这个原型怎么进生产？它需要 EPD 其他成员审查。审查时，一份书面文档总是有帮助的，甚至是必需的——别人看代码时，怎么知道某段代码是手误还是有意为之？这取决于意图，而意图需要被传达。 ...

A Good Company Everyday - Waymo One

真正伟大的产品从不纠结于"它能做什么"，而是追问"它能为生活带来什么改变"。Waymo One在App Store拿下满分，本质上不是因为它是全球首个商用无人驾驶网约车服务，而是它用AI撕开了传统出行的边界，把"必须有人驾驶"的固有认知，变成了"人人可自由支配的出行时间"。它到底是什么？是从谷歌2009年自动驾驶项目孵化而来，用十六年时间打磨出的"移动自由空间"，更是未来智能交通的基础设施雏形。这种对出行本质的重构，从来不是突发奇想。Waymo的起点是谷歌内部一个看似不切实际的目标：让出行更安全、更平等。2009年，当大多数公司还在纠结辅助驾驶功能时，他们已经开始搭建完整的自动驾驶系统。2016年从谷歌独立成为Alphabet子公司，Waymo的使命更清晰——做"世界上最值得信任的司机"。2018年Waymo One应用推出，从凤凰城的小规模测试，到如今覆盖旧金山、洛杉矶、凤凰城等多座城市，甚至通过与Uber合作进入奥斯汀、亚特兰大，每一步都不是为了抢占市场，而是用真实场景打磨技术，建立用户信任。这种长期主义的打磨，让它积累了1.55亿英里安全行驶里程，完成超2000万次付费出行，周订单量突破45万单。这些数据不是炫耀的资本，而是支撑"永远不疲劳、永远不分心"承诺的基石。真正用过Waymo One，才会明白它的聪明之处从不是"无人"这个标签，而是把技术彻底融入体验的细节里。打开App叫车，你不用像传统网约车那样反复确认位置，系统会自动选择最安全的上下车点。车辆到达前，车顶会亮起你在App里设置的专属字母，再加上可以通过App让车辆鸣笛或播放旋律的设计，在停车场找车变成了一件轻松的事。坐进车内，没有司机的局促感，宽敞的全电动Jaguar I-PACE车厢每天都会细致清洁，你可以通过屏幕连接Spotify播放音乐，调整到自己舒服的温度，甚至随时添加中途停靠点。最关键的是那份安全感。车内屏幕会实时显示Waymo Driver看到的路况，行人和车辆都被清晰标记，你能直观感受到它的决策逻辑，这种"透明化"的设计，比任何宣传都能打消对无人驾驶的顾虑。而技术层面，它没有走纯视觉的捷径，而是用激光雷达+摄像头+雷达的三重感知方案，在旧金山停电导致信号灯失效时，依然能稳定运行，这种冗余设计不是技术堆砌，而是对生命的敬畏。更难得的是它的包容性，为视障用户优化的屏幕阅读器、可预约的无障碍车辆，让出行自由不再是少数人的特权，这才是技术应有的温度。至于Waymo One的未来，绝不止于"更大的网约车公司"。它刚刚获得内华达州的全面运营许可，计划2026年引入极氪RT平台把单车成本从12万美元降到8万美元以下，还将与丰田合作进军东京市场，这些动作都是在为规模化铺路。但规模化的终极目标，是让无人驾驶成为像水电一样的基础设施。当单车成本足够低，覆盖范围足够广，改变的就不只是个人出行。更少的交通事故会减轻社会负担，更高效的路线规划能缓解拥堵，全电动车队会推动环保，甚至城市规划都会因为"无需大量停车场"而重新设计。未来的Waymo One，可能不再只是一个叫车App，而是智能出行管家，提前预判拥堵，联动目的地的服务，把"出行"和"生活"无缝衔接。更重要的是，它积累的每一公里路况数据、每一次AI决策经验，都会成为智能交通的核心资产，推动整个行业从"有人驾驶"向"智能出行"跃迁。说到底，Waymo One的5分好评，是用户对"技术向善"的投票。它证明了最先进的AI技术，不该用来制造焦虑，而是要帮人们摆脱负担。最伟大的产品，不是颠覆世界的口号，而是让每个人的生活都变得更自由、更平等。这也是所有伟大产品的共通之处：用技术读懂人性，用体验改变生活。