AI | Zhang's Blog

马斯克的超级计算机：算力军备竞赛的开始？

马斯克的xAI团队只用四个月就建成全球最大超级计算机"巨像"，这个消息让我下巴都掉了。传统超算建设周期至少2-3年，这速度太疯狂了。表层：算力军备竞赛的加速算力是AI发展的核心驱动力，这点我当然兴奋。但冷静下来想，这会不会引发全球算力军备竞赛？“巨像"用了3万多块H100 GPU，一年电费得多少钱？上周跟AI创业公司CTO聊天，他说算力成本占公司开支60%，“跑个大模型训练得等半个月排算力”。深层：中美超算的技术博弈中美在超算领域的竞争早已开始。中国的神威·太湖之光和天河二号多次登TOP500榜首，美国通过AMD、英伟达技术优势反超。马斯克这次直接用GPU堆出超算，绕过了传统超算的建设周期，是另一种路径突破。终局：算力集中的隐忧更让我担忧的是，高端算力正集中在少数科技巨头手中，中小企业根本用不起。而且，算力竞争会不会像核武器竞赛一样，最终变成资源浪费？毕竟，AI发展的瓶颈从来都不只是算力，还有算法和数据。马斯克总喜欢搞大新闻，这次的超级计算机到底是进步利器，还是烧钱游戏？算力不是AI的全部，就像核武器不是战争的全部。真正的AI革命，需要的是算力、算法和数据的平衡，而不是单一维度的军备竞赛。

生成式AI系统应用员：AI时代的新职业，还是过渡岗位？

人力资源部把"生成式AI系统应用员"纳入新职业那天，我正在给企业做AI培训。教室里30多个学员，一半是传统行业从业者，都在担心被AI替代。表层：新职业的短暂红利作为IT博士，我知道这个新职业的意义——官方终于认可了AI对就业市场的重构。但它能存在多久？会不会像当年的"打字员"一样，被技术进步淘汰？上周跟做职业教育的朋友聊天，他说已经在开发相关培训课程，但教材还没编好——技术发展太快，昨天的知识今天可能就过时了。深层：中美人才培养的路径差异中美在AI人才培养上截然不同：美国是"高校+企业"联合培养，比如斯坦福和OpenAI的合作，侧重前沿研究；中国是"政府主导+职业培训"，比如各地的AI技能提升计划，侧重应用落地。技能鸿沟也在扩大：AI新职业主要集中在一线城市，传统产业集中的地区，就业转型压力更大。终局：技术变革的包容性难题最让我感慨的是40多岁的文案学员，他说：“要是不学习AI工具，明年可能就找不到工作了。“这句话戳中了我——技术进步从来不是均匀分布的，总有一部分人会被落下。 AI重构职业生态是必然趋势，但如何让所有人分享红利，而不是被淘汰？新职业不是终点，而是中转站。真正的竞争力，不是掌握某个AI工具，而是保持学习的能力和适应变化的勇气。

萝卜快跑武汉运营：无人驾驶的春天来了？

上周去武汉出差，特意体验了百度的萝卜快跑。在光谷马路上，看着方向盘自己转，油门刹车自己控制，感觉很科幻。表层：无人驾驶的规模化突破百度在武汉投放了上万辆无人驾驶车，覆盖主要交通区域。作为研究5年自动驾驶的人，我知道这意味着什么——无人驾驶从试点走向了规模化商业运营。实际体验下来，遇到闯红灯电动车会急刹车，复杂环岛反应有点慢，但总体比想象中稳定。深层：中美自动驾驶的路径分歧中美玩法截然不同：百度是"车路协同+Robotaxi"，靠政府支持和基础设施建设；特斯拉是"纯视觉+私人汽车"，靠算法和芯片。百度走得更快，但特斯拉的技术更通用。上周跟出租车司机聊天，他说武汉出租车生意已受影响：“无人驾驶越来越多，我们怎么办？” 终局：技术与就业的两难特斯拉的擎天柱机器人发布了原型，能做简单动作，但成本太高，短期内难商业化。相比之下，自动驾驶的商业化路径更清晰，冲击也更直接。技术进步总会淘汰职业，也会创造新机会。但淘汰是立竿见影的，创造机会却需要时间。无人驾驶的春天来了，但不是每个人都能感受到温暖。技术的温度，取决于我们如何对待被它改变的人。

Apple Intelligence：设备端AI的终局之战？

WWDC发布Apple Intelligence那天，我在加州咖啡馆写代码，旁边几个程序员看到演示时发出惊叹声。表层：隐私优先的设备端革命苹果把AI直接整合到iOS、iPadOS和macOS，主打设备端处理——数据不上传云端，隐私更安全。作为用了十年苹果的人，我知道它的生态闭环有多强：Apple Intelligence能在不同设备间无缝切换，这是谷歌微软做不到的。用iPhone 15 Pro测试了几个功能，确实比以前快，但复杂多模态任务还是会卡顿。深层：中美设备端AI的路径博弈中美路径截然不同：苹果是"设备端优先+云端协同"，华为是"全栈自研+硬件软件一体化"。上周跟芯片设计师聊天，他说苹果神经引擎已迭代到第五代，算力提升10倍，但跑GPT-4级别模型还是吃力。华为的昇腾芯片则是从底层自研，走的是另一条路。终局：设备端AI的融合未来设备端AI的终局是什么？是每台设备有自己的AI大脑，还是云端大脑的延伸？我觉得是两者结合。苹果没说透的是，复杂任务还是需要云端协同——这才是真实的技术妥协。隐私和性能，永远是AI的两难。苹果选择了先保隐私，再拼性能。设备端AI的终极战场，不在参数表上，而在用户感知到的流畅度和安全感之间。

GPT-4o：多模态时代的开始，还是噱头？

OpenAI发布GPT-4o那天，我熬夜看了发布会直播。当演示者用语音、图像、文本同时和AI交互时，突然意识到：单一文本交互的时代，可能真的要结束了。表层：交互效率的革命作为每天跟AI打交道的人，我早受够了只能打字的限制。想让AI分析图表，得手动输数据；想让AI看照片，得文字描述半天。测试GPT-4o时，响应速度比GPT-4快2倍，基本秒回。上周跟做教育的朋友聊，他说正用GPT-4o做在线辅导：学生上传错题照片，AI马上讲解，效率高多了。深层：中美多模态的垂直竞争谷歌DeepMind也发布了AlphaFold 3，在蛋白质预测方面又进了一步。中美在多模态领域的竞争，已经从通用场景延伸到垂直领域。GPT-4o主打通用交互，AlphaFold 3深耕科学计算，各有侧重。终局：多模态的两面性但多模态也有问题：上传复杂电路图，AI会解读错误；语音提问，口音重就识别不准。更关键的是隐私——上传的照片和语音会不会被滥用？还有成本，处理多模态数据的算力消耗，比文本高多了。技术总是解决旧问题，带来新问题。GPT-4o到底是多模态时代的开始，还是噱头？单一模态的AI是工具，多模态的AI才是伙伴。但成为真正的伙伴，还需要跨过隐私、准确性和成本的三道坎。