AI | Zhang's Blog

H200发布：NVIDIA赢了性能战，但可能输了未来

今天早上收到加州朋友Mike的邮件，附件是NVIDIA H200的内部评测报告。他在NVIDIA做架构师，每次有新品都会偷偷给我发点料。我盯着性能测试图看了半小时，H200比H100提升了35%，但真正让我倒吸凉气的，不是性能数字，而是CUDA生态的数据。 “全球95%以上的AI训练任务都跑在CUDA上，“Mike在微信里说，“我们刚更新了CUDA 12.5，专门优化了H200。那些想用AMD或其他芯片的公司，光是迁移代码就得花半年。“我回他：“所以NVIDIA已经不是芯片公司了，是AI时代的Windows？“他发了个笑脸：“差不多吧。” 但我心里在想：Windows当年也以为自己无敌，结果被移动互联网时代抛弃了。NVIDIA的CUDA生态，会不会也面临同样的命运？从表面看：性能数字背后的生态霸权表面上看，这是"H200性能提升35%“的技术突破。但真正让NVIDIA无敌的，不是芯片性能，而是CUDA生态。芯片性能可以追上——AMD的MI300X在某些场景已经接近H100，中国的昇腾910B在推理场景甚至超过H100。但生态壁垒一旦形成，几乎无法突破。全球95%的AI训练任务都跑在CUDA上，这意味着：即使你的芯片性能更强，开发者也不会用，因为迁移成本太高。 NVIDIA已经从一家芯片公司，变成了AI时代的Windows。Windows当年靠操作系统垄断PC市场，NVIDIA靠CUDA生态垄断AI市场。关键洞察：这不是芯片战争，是生态战争。性能可以追赶，生态难以复制。从深层看：中国芯片的差异化突围想起上周去华为上海研究所拜访的场景。负责昇腾910B的李工带我参观实验室，指着一台堆满芯片的服务器说：“我们不跟NVIDIA在训练芯片正面死磕，昇腾910B专门优化推理场景。在智慧城市视频分析上，我们的性能已经超过了H100。” 不仅华为，寒武纪的思元590芯片正在给智能加油站做边缘计算，实时监控油枪状态、预测库存；地平线的征程6芯片在自动驾驶领域也有不错的表现。中国芯片公司选择了一条差异化的突围路径：不拼通用性能，而是深耕垂直场景，把特定领域的AI芯片做到极致。去年在深圳参加AI峰会，看到一家创业公司用昇腾芯片做工业机器人实时控制，延迟比NVIDIA的方案低40%。美国的技术封锁反而成了中国芯片产业的催化剂——以前大家都觉得买NVIDIA的芯片就行，现在不得不自己搞研发。翻出三年前的笔记，当时我判断"中国芯片10年内赶不上美国”。现在看来，我错了——不是赶不上，而是走了一条完全不同的路。NVIDIA在通用计算领域狂飙，中国芯片则在垂直场景深耕。关键洞察：芯片战争的终局，不是谁的性能更强，而是谁能更好地服务用户。NVIDIA赢了通用性能，中国芯片可能赢了垂直场景。从未来看：生态与场景的终极博弈晚上刷朋友圈，看到Mike发了张NVIDIA总部的照片，配文：“H200发布，我们赢了。“我给他点了个赞，心里却在想：这场芯片战争，才刚刚开始。 NVIDIA赢了性能战，但可能输了未来。因为未来的AI应用，不是"一个模型跑遍所有场景”，而是"每个场景都有专属芯片”。当自动驾驶、智慧城市、工业机器人这些垂直场景成为主流时，NVIDIA的通用芯片优势还能保持多久？ 2025年，我判断会看到更多融合：NVIDIA会加强垂直场景优化（比如推出专门的自动驾驶芯片），中国芯片会加强生态建设（比如推出自己的开发框架）。芯片战争的终局，不是谁的性能更强，而是谁能更好地服务用户。NVIDIA赢了性能战，中国芯片却可能赢了未来的场景战。 2025年，我期待看到NVIDIA的场景化，也期待看到中国芯片的生态化。

AI医疗：99%的准确率在实验室，95%的准确率在村寨

上周从杭州飞回上海，行李箱里装着阿里健康的AI乡村医生项目资料。前一天刚在北京参加完中美AI医疗研讨会，脑子里还在回放斯坦福教授和阿里工程师的发言。晚上在酒店，Dr. Wang给我看他们团队最新的GPT-5驱动CT诊断系统：17种肺部疾病实时标注，连早期肺癌的微小结节都能揪出来，准确率超过99%，刚在Nature Medicine发了论文。“这技术太牛了！什么时候能临床应用？“我问他。他叹了口气：“至少等3年，FDA的审批流程你懂的。” 第二天，阿里健康的张工给我看了一组数据：他们的"AI乡村医生"已经覆盖了全国1.2万个偏远村落，累计看了超过1000万次门诊。“上个月我们在云南一个苗族村寨做调研，一个70多岁的老奶奶拉着我的手说，活了一辈子第一次能在家门口看专家，“张工的语气里带着自豪，“虽然我们的AI准确率只有95%左右，但解决了最基本的看病问题。” 我突然想起去年冬天陪外婆去县城医院看病的场景——凌晨三点就去排队挂号，上午十点才看上医生，结果还没说两句话就被打发走了。如果当时有AI乡村医生，外婆是不是就不用遭这份罪了？从数字看：准确率的数字游戏表面上看，这是"99% vs 95%“的准确率差距。斯坦福的CT诊断系统能识别17种肺部疾病，连微小结节都不放过；阿里的AI乡村医生只能做基础诊断，准确率还低了4个百分点。但数字背后是完全不同的逻辑：一个在实验室里追求极致，一个在村寨里解决刚需。美国科学家说"我们需要更高的准确率”，中国工程师则说"我们需要更快的覆盖速度”。关键洞察：这不是技术差距，是应用场景的错位。一个瞄准"未来5年的医疗突破”，一个瞄准"今天就能用的医疗服务”。往深里想：医疗资源的时空错配 AI医疗的本质不是技术竞赛，而是资源分配。斯坦福的技术代表了AI医疗的未来，准确率99%的CT诊断系统能拯救更多生命。但它的代价是：至少3年的审批周期，高昂的研发成本，只有顶级医院才能用得起。这是典型的"技术驱动"路径：先突破技术，再找应用。阿里的AI乡村医生代表了AI医疗的现在，它已经在服务千万级的患者，解决了最迫切的医疗资源不均衡问题。虽然准确率只有95%，但它让偏远地区的老人不用凌晨三点去县城排队，让农村孩子也能看"专家门诊”。这是典型的"需求驱动"路径：先解决实际问题，再优化技术。去年冬天陪外婆看病，我深刻体会到医疗资源不均衡的痛苦。如果当时有AI乡村医生，外婆是不是就不用遭这份罪了？这个问题，比"准确率能否再提升1%“更重要。关键洞察：医疗资源的时空错配，比技术准确率更重要。一个在实验室里等待审批，一个在村寨里服务患者。看未来：从实验室到田间地头的融合今天刷朋友圈，看到Dr. Wang发了条动态：“刚和一家中国医疗科技公司签了合作协议，他们帮我们加速临床试验，我们提供技术支持。” 这个信号很明确：美国的技术突破和中国的落地速度，正在走向融合。斯坦福的99%准确率+中国的快速落地，或许能创造出真正普惠的AI医疗。 2025年的AI医疗，会是一场从"实验室到田间地头"的革命。不是技术替代技术，而是技术+场景的深度融合。 AI医疗的终极目标，从来不是发表Nature论文，而是让每个人都能享受到更好的医疗服务。99%的准确率在实验室，95%的准确率在村寨——但村寨里的95%，可能比实验室里的99%更有价值。 2025年，我期待看到斯坦福的技术走进村寨，也期待看到阿里的经验走向世界。

OpenAI的12天发布会：生成式AI的终极形态，还是营销噱头？

OpenAI的12天发布会终于结束了，我全程追完了所有直播。当演示者用自然语言和视频交互时，我突然有种穿越到未来的感觉——这可能就是生成式AI的终极形态了。表层：AI视频的技术突破 Sora的视频生成能力又提升了，现在能生成5分钟高清视频，连人物微表情都能模拟。视频交互模式也落地了，直接对视频内容提问，AI会实时回答。上周跟做内容创作的朋友聊天，他说：“以前拍短视频要2000块，现在用AI只要200块，效果还不差。“已经不用请摄影师了。深层：中美视频AI的竞争格局中美在生成式视频领域的竞争很激烈：谷歌发布了Veo 2大模型，腾讯也开源了视频大模型。美国在技术前沿领先，中国在落地应用更快——抖音已经在测试AI生成视频功能了。但冷静下来想，深度伪造的风险也不容忽视：生成的人物和真实几乎一模一样，要是用来制作虚假视频，后果不堪设想。终局：GPT-o3的营销噱头？最让我感慨的是OpenAI预测的GPT-o3，2025年发布，据说能实现真正的多模态交互，甚至理解人类情感。但这会不会是又一个营销噱头？毕竟，GPT-4o刚发布时，也有很多承诺没兑现。生成式AI的终极形态到底是什么？是理解和创造任何内容的超级智能，还是人类想象力的延伸？ 2025年的GPT-o3会给我们答案。但无论如何，OpenAI的12天发布会已经展示了AI的未来——更加智能、自然的人机交互时代。我已经迫不及待想看到那一天了。

小数据与优质数据：AI从"拼规模"到"拼质量"的转折点？

中科院发布AI前沿趋势那天，我正在实验室调试小样本学习模型。看到"小数据与优质数据成AI核心引擎"这句话，我差点从椅子上跳起来——终于有人认可我们的方向了！表层：小数据的商业化突破作为做了5年小样本学习的研究者，我太懂传统AI的痛点：需要海量数据，标注成本高，泛化能力差。最让我兴奋的是，小数据技术终于开始商业化了。腾讯开源的AI生成3D模型，就是用小数据训练的，效果不比百万级数据模型差。深层：中美小数据的路径分歧中美在小数据领域的研究路径截然不同：美国是"算法驱动"，比如OpenAI的few-shot learning；中国是"数据驱动"，比如百度的知识增强小样本学习。上周跟医疗AI公司CTO聊天，他说：“以前有100万张X光片，标注质量参差不齐；现在只有10万张，但每张经过三个医生审核，模型性能反而提升30%。” 终局：优质数据的成本难题但问题也存在：优质数据的获取成本还是太高了，尤其是垂直领域的数据。法律文档、医疗记录，获取和标注成本都非常高。AI从"拼规模"到"拼质量"，这是重要转折点，但如何降低优质数据获取成本，让小数据技术真正普及？大数据是AI的过去，小数据是AI的未来。但这个未来，需要先解决优质数据的成本问题。真正的AI革命，不是用更多的数据，而是用更聪明的方法使用更少的数据。

乌镇峰会的AI治理共识：全球协同，还是各说各话？

乌镇峰会结束后，我在茶馆坐了一下午整理笔记。这次主题是"AI技术创新与治理"，来了很多全球AI专家和企业家。表层：中美欧治理的撕裂最让我印象深刻的是圆桌论坛，中美欧专家各执一词：欧洲强调"监管先行"，美国主张"行业自律"，中国提出"包容审慎"。马斯克在峰会上展示Cybercab和Tesla Bot，依然乐观：“AI好处远大于风险，不应过度监管。“但台下伦理学家显然不这么认为。深层：全球治理的利益博弈我当然希望看到全球协同的治理框架，但现实是各国利益诉求差异太大。发达国家想主导规则制定，发展中国家希望有更多发展空间。上周跟联合国官员聊天，他说联合国正推动全球AI治理框架，但进展缓慢：“每个国家都有自己的算盘，很难达成一致。” 终局：监管碎片化的隐忧最让我担忧的是"监管碎片化”。如果每个国家都制定自己的AI规则，跨国企业合规成本会直线上升，最终受伤的还是中小企业和普通用户。AI是全球的，治理也应该是全球的，但在民族国家体系下，全球协同谈何容易？乌镇峰会虽然没达成实质性协议，但至少开启了对话——这已经是好的开始。 AI治理的终极挑战，不是技术，而是如何在不同国家的利益之间找到平衡。