H200发布:NVIDIA赢了性能战,但可能输了未来

今天早上收到加州朋友Mike的邮件,附件是NVIDIA H200的内部评测报告。他在NVIDIA做架构师,每次有新品都会偷偷给我发点料。我盯着性能测试图看了半小时,H200比H100提升了35%,但真正让我倒吸凉气的,不是性能数字,而是CUDA生态的数据。 “全球95%以上的AI训练任务都跑在CUDA上,“Mike在微信里说,“我们刚更新了CUDA 12.5,专门优化了H200。那些想用AMD或其他芯片的公司,光是迁移代码就得花半年。“我回他:“所以NVIDIA已经不是芯片公司了,是AI时代的Windows?“他发了个笑脸:“差不多吧。” 但我心里在想:Windows当年也以为自己无敌,结果被移动互联网时代抛弃了。NVIDIA的CUDA生态,会不会也面临同样的命运? 从表面看:性能数字背后的生态霸权 表面上看,这是"H200性能提升35%“的技术突破。但真正让NVIDIA无敌的,不是芯片性能,而是CUDA生态。 芯片性能可以追上——AMD的MI300X在某些场景已经接近H100,中国的昇腾910B在推理场景甚至超过H100。但生态壁垒一旦形成,几乎无法突破。全球95%的AI训练任务都跑在CUDA上,这意味着:即使你的芯片性能更强,开发者也不会用,因为迁移成本太高。 NVIDIA已经从一家芯片公司,变成了AI时代的Windows。Windows当年靠操作系统垄断PC市场,NVIDIA靠CUDA生态垄断AI市场。 关键洞察:这不是芯片战争,是生态战争。性能可以追赶,生态难以复制。 从深层看:中国芯片的差异化突围 想起上周去华为上海研究所拜访的场景。负责昇腾910B的李工带我参观实验室,指着一台堆满芯片的服务器说:“我们不跟NVIDIA在训练芯片正面死磕,昇腾910B专门优化推理场景。在智慧城市视频分析上,我们的性能已经超过了H100。” 不仅华为,寒武纪的思元590芯片正在给智能加油站做边缘计算,实时监控油枪状态、预测库存;地平线的征程6芯片在自动驾驶领域也有不错的表现。中国芯片公司选择了一条差异化的突围路径:不拼通用性能,而是深耕垂直场景,把特定领域的AI芯片做到极致。 去年在深圳参加AI峰会,看到一家创业公司用昇腾芯片做工业机器人实时控制,延迟比NVIDIA的方案低40%。美国的技术封锁反而成了中国芯片产业的催化剂——以前大家都觉得买NVIDIA的芯片就行,现在不得不自己搞研发。 翻出三年前的笔记,当时我判断"中国芯片10年内赶不上美国”。现在看来,我错了——不是赶不上,而是走了一条完全不同的路。NVIDIA在通用计算领域狂飙,中国芯片则在垂直场景深耕。 关键洞察:芯片战争的终局,不是谁的性能更强,而是谁能更好地服务用户。NVIDIA赢了通用性能,中国芯片可能赢了垂直场景。 从未来看:生态与场景的终极博弈 晚上刷朋友圈,看到Mike发了张NVIDIA总部的照片,配文:“H200发布,我们赢了。“我给他点了个赞,心里却在想:这场芯片战争,才刚刚开始。 NVIDIA赢了性能战,但可能输了未来。因为未来的AI应用,不是"一个模型跑遍所有场景”,而是"每个场景都有专属芯片”。当自动驾驶、智慧城市、工业机器人这些垂直场景成为主流时,NVIDIA的通用芯片优势还能保持多久? 2025年,我判断会看到更多融合:NVIDIA会加强垂直场景优化(比如推出专门的自动驾驶芯片),中国芯片会加强生态建设(比如推出自己的开发框架)。 芯片战争的终局,不是谁的性能更强,而是谁能更好地服务用户。NVIDIA赢了性能战,中国芯片却可能赢了未来的场景战。 2025年,我期待看到NVIDIA的场景化,也期待看到中国芯片的生态化。

ZHANG.z" | February 20, 2025 | 6 min | Shanghai

AI医疗:99%的准确率在实验室,95%的准确率在村寨

上周从杭州飞回上海,行李箱里装着阿里健康的AI乡村医生项目资料。前一天刚在北京参加完中美AI医疗研讨会,脑子里还在回放斯坦福教授和阿里工程师的发言。 晚上在酒店,Dr. Wang给我看他们团队最新的GPT-5驱动CT诊断系统:17种肺部疾病实时标注,连早期肺癌的微小结节都能揪出来,准确率超过99%,刚在Nature Medicine发了论文。“这技术太牛了!什么时候能临床应用?“我问他。他叹了口气:“至少等3年,FDA的审批流程你懂的。” 第二天,阿里健康的张工给我看了一组数据:他们的"AI乡村医生"已经覆盖了全国1.2万个偏远村落,累计看了超过1000万次门诊。“上个月我们在云南一个苗族村寨做调研,一个70多岁的老奶奶拉着我的手说,活了一辈子第一次能在家门口看专家,“张工的语气里带着自豪,“虽然我们的AI准确率只有95%左右,但解决了最基本的看病问题。” 我突然想起去年冬天陪外婆去县城医院看病的场景——凌晨三点就去排队挂号,上午十点才看上医生,结果还没说两句话就被打发走了。如果当时有AI乡村医生,外婆是不是就不用遭这份罪了? 从数字看:准确率的数字游戏 表面上看,这是"99% vs 95%“的准确率差距。斯坦福的CT诊断系统能识别17种肺部疾病,连微小结节都不放过;阿里的AI乡村医生只能做基础诊断,准确率还低了4个百分点。 但数字背后是完全不同的逻辑:一个在实验室里追求极致,一个在村寨里解决刚需。美国科学家说"我们需要更高的准确率”,中国工程师则说"我们需要更快的覆盖速度”。 关键洞察:这不是技术差距,是应用场景的错位。一个瞄准"未来5年的医疗突破”,一个瞄准"今天就能用的医疗服务”。 往深里想:医疗资源的时空错配 AI医疗的本质不是技术竞赛,而是资源分配。 斯坦福的技术代表了AI医疗的未来,准确率99%的CT诊断系统能拯救更多生命。但它的代价是:至少3年的审批周期,高昂的研发成本,只有顶级医院才能用得起。这是典型的"技术驱动"路径:先突破技术,再找应用。 阿里的AI乡村医生代表了AI医疗的现在,它已经在服务千万级的患者,解决了最迫切的医疗资源不均衡问题。虽然准确率只有95%,但它让偏远地区的老人不用凌晨三点去县城排队,让农村孩子也能看"专家门诊”。这是典型的"需求驱动"路径:先解决实际问题,再优化技术。 去年冬天陪外婆看病,我深刻体会到医疗资源不均衡的痛苦。如果当时有AI乡村医生,外婆是不是就不用遭这份罪了?这个问题,比"准确率能否再提升1%“更重要。 关键洞察:医疗资源的时空错配,比技术准确率更重要。一个在实验室里等待审批,一个在村寨里服务患者。 看未来:从实验室到田间地头的融合 今天刷朋友圈,看到Dr. Wang发了条动态:“刚和一家中国医疗科技公司签了合作协议,他们帮我们加速临床试验,我们提供技术支持。” 这个信号很明确:美国的技术突破和中国的落地速度,正在走向融合。斯坦福的99%准确率+中国的快速落地,或许能创造出真正普惠的AI医疗。 2025年的AI医疗,会是一场从"实验室到田间地头"的革命。不是技术替代技术,而是技术+场景的深度融合。 AI医疗的终极目标,从来不是发表Nature论文,而是让每个人都能享受到更好的医疗服务。99%的准确率在实验室,95%的准确率在村寨——但村寨里的95%,可能比实验室里的99%更有价值。 2025年,我期待看到斯坦福的技术走进村寨,也期待看到阿里的经验走向世界。

ZHANG.z" | January 15, 2025 | 6 min | Shanghai

OpenAI的12天发布会:生成式AI的终极形态,还是营销噱头?

OpenAI的12天发布会终于结束了,我全程追完了所有直播。当演示者用自然语言和视频交互时,我突然有种穿越到未来的感觉——这可能就是生成式AI的终极形态了。 表层:AI视频的技术突破 Sora的视频生成能力又提升了,现在能生成5分钟高清视频,连人物微表情都能模拟。视频交互模式也落地了,直接对视频内容提问,AI会实时回答。上周跟做内容创作的朋友聊天,他说:“以前拍短视频要2000块,现在用AI只要200块,效果还不差。“已经不用请摄影师了。 深层:中美视频AI的竞争格局 中美在生成式视频领域的竞争很激烈:谷歌发布了Veo 2大模型,腾讯也开源了视频大模型。美国在技术前沿领先,中国在落地应用更快——抖音已经在测试AI生成视频功能了。但冷静下来想,深度伪造的风险也不容忽视:生成的人物和真实几乎一模一样,要是用来制作虚假视频,后果不堪设想。 终局:GPT-o3的营销噱头? 最让我感慨的是OpenAI预测的GPT-o3,2025年发布,据说能实现真正的多模态交互,甚至理解人类情感。但这会不会是又一个营销噱头?毕竟,GPT-4o刚发布时,也有很多承诺没兑现。 生成式AI的终极形态到底是什么?是理解和创造任何内容的超级智能,还是人类想象力的延伸? 2025年的GPT-o3会给我们答案。但无论如何,OpenAI的12天发布会已经展示了AI的未来——更加智能、自然的人机交互时代。我已经迫不及待想看到那一天了。

ZHANG.z" | December 28, 2024 | 2 min | Shanghai

小数据与优质数据:AI从"拼规模"到"拼质量"的转折点?

中科院发布AI前沿趋势那天,我正在实验室调试小样本学习模型。看到"小数据与优质数据成AI核心引擎"这句话,我差点从椅子上跳起来——终于有人认可我们的方向了! 表层:小数据的商业化突破 作为做了5年小样本学习的研究者,我太懂传统AI的痛点:需要海量数据,标注成本高,泛化能力差。最让我兴奋的是,小数据技术终于开始商业化了。腾讯开源的AI生成3D模型,就是用小数据训练的,效果不比百万级数据模型差。 深层:中美小数据的路径分歧 中美在小数据领域的研究路径截然不同:美国是"算法驱动",比如OpenAI的few-shot learning;中国是"数据驱动",比如百度的知识增强小样本学习。上周跟医疗AI公司CTO聊天,他说:“以前有100万张X光片,标注质量参差不齐;现在只有10万张,但每张经过三个医生审核,模型性能反而提升30%。” 终局:优质数据的成本难题 但问题也存在:优质数据的获取成本还是太高了,尤其是垂直领域的数据。法律文档、医疗记录,获取和标注成本都非常高。AI从"拼规模"到"拼质量",这是重要转折点,但如何降低优质数据获取成本,让小数据技术真正普及? 大数据是AI的过去,小数据是AI的未来。但这个未来,需要先解决优质数据的成本问题。 真正的AI革命,不是用更多的数据,而是用更聪明的方法使用更少的数据。

ZHANG.z" | November 20, 2024 | 2 min | Shanghai

乌镇峰会的AI治理共识:全球协同,还是各说各话?

乌镇峰会结束后,我在茶馆坐了一下午整理笔记。这次主题是"AI技术创新与治理",来了很多全球AI专家和企业家。 表层:中美欧治理的撕裂 最让我印象深刻的是圆桌论坛,中美欧专家各执一词:欧洲强调"监管先行",美国主张"行业自律",中国提出"包容审慎"。马斯克在峰会上展示Cybercab和Tesla Bot,依然乐观:“AI好处远大于风险,不应过度监管。“但台下伦理学家显然不这么认为。 深层:全球治理的利益博弈 我当然希望看到全球协同的治理框架,但现实是各国利益诉求差异太大。发达国家想主导规则制定,发展中国家希望有更多发展空间。上周跟联合国官员聊天,他说联合国正推动全球AI治理框架,但进展缓慢:“每个国家都有自己的算盘,很难达成一致。” 终局:监管碎片化的隐忧 最让我担忧的是"监管碎片化”。如果每个国家都制定自己的AI规则,跨国企业合规成本会直线上升,最终受伤的还是中小企业和普通用户。AI是全球的,治理也应该是全球的,但在民族国家体系下,全球协同谈何容易? 乌镇峰会虽然没达成实质性协议,但至少开启了对话——这已经是好的开始。 AI治理的终极挑战,不是技术,而是如何在不同国家的利益之间找到平衡。

ZHANG.z" | October 12, 2024 | 2 min | Shanghai