萝卜快跑武汉运营:无人驾驶的春天来了?

上周去武汉出差,特意体验了百度的萝卜快跑。在光谷马路上,看着方向盘自己转,油门刹车自己控制,感觉很科幻。 表层:无人驾驶的规模化突破 百度在武汉投放了上万辆无人驾驶车,覆盖主要交通区域。作为研究5年自动驾驶的人,我知道这意味着什么——无人驾驶从试点走向了规模化商业运营。实际体验下来,遇到闯红灯电动车会急刹车,复杂环岛反应有点慢,但总体比想象中稳定。 深层:中美自动驾驶的路径分歧 中美玩法截然不同:百度是"车路协同+Robotaxi",靠政府支持和基础设施建设;特斯拉是"纯视觉+私人汽车",靠算法和芯片。百度走得更快,但特斯拉的技术更通用。上周跟出租车司机聊天,他说武汉出租车生意已受影响:“无人驾驶越来越多,我们怎么办?” 终局:技术与就业的两难 特斯拉的擎天柱机器人发布了原型,能做简单动作,但成本太高,短期内难商业化。相比之下,自动驾驶的商业化路径更清晰,冲击也更直接。 技术进步总会淘汰职业,也会创造新机会。但淘汰是立竿见影的,创造机会却需要时间。 无人驾驶的春天来了,但不是每个人都能感受到温暖。技术的温度,取决于我们如何对待被它改变的人。

ZHANG.z" | July 22, 2024 | 2 min | Shanghai

Apple Intelligence:设备端AI的终局之战?

WWDC发布Apple Intelligence那天,我在加州咖啡馆写代码,旁边几个程序员看到演示时发出惊叹声。 表层:隐私优先的设备端革命 苹果把AI直接整合到iOS、iPadOS和macOS,主打设备端处理——数据不上传云端,隐私更安全。作为用了十年苹果的人,我知道它的生态闭环有多强:Apple Intelligence能在不同设备间无缝切换,这是谷歌微软做不到的。用iPhone 15 Pro测试了几个功能,确实比以前快,但复杂多模态任务还是会卡顿。 深层:中美设备端AI的路径博弈 中美路径截然不同:苹果是"设备端优先+云端协同",华为是"全栈自研+硬件软件一体化"。上周跟芯片设计师聊天,他说苹果神经引擎已迭代到第五代,算力提升10倍,但跑GPT-4级别模型还是吃力。华为的昇腾芯片则是从底层自研,走的是另一条路。 终局:设备端AI的融合未来 设备端AI的终局是什么?是每台设备有自己的AI大脑,还是云端大脑的延伸?我觉得是两者结合。苹果没说透的是,复杂任务还是需要云端协同——这才是真实的技术妥协。 隐私和性能,永远是AI的两难。苹果选择了先保隐私,再拼性能。 设备端AI的终极战场,不在参数表上,而在用户感知到的流畅度和安全感之间。

ZHANG.z" | June 15, 2024 | 2 min | Shanghai

GPT-4o:多模态时代的开始,还是噱头?

OpenAI发布GPT-4o那天,我熬夜看了发布会直播。当演示者用语音、图像、文本同时和AI交互时,突然意识到:单一文本交互的时代,可能真的要结束了。 表层:交互效率的革命 作为每天跟AI打交道的人,我早受够了只能打字的限制。想让AI分析图表,得手动输数据;想让AI看照片,得文字描述半天。测试GPT-4o时,响应速度比GPT-4快2倍,基本秒回。上周跟做教育的朋友聊,他说正用GPT-4o做在线辅导:学生上传错题照片,AI马上讲解,效率高多了。 深层:中美多模态的垂直竞争 谷歌DeepMind也发布了AlphaFold 3,在蛋白质预测方面又进了一步。中美在多模态领域的竞争,已经从通用场景延伸到垂直领域。GPT-4o主打通用交互,AlphaFold 3深耕科学计算,各有侧重。 终局:多模态的两面性 但多模态也有问题:上传复杂电路图,AI会解读错误;语音提问,口音重就识别不准。更关键的是隐私——上传的照片和语音会不会被滥用?还有成本,处理多模态数据的算力消耗,比文本高多了。 技术总是解决旧问题,带来新问题。GPT-4o到底是多模态时代的开始,还是噱头? 单一模态的AI是工具,多模态的AI才是伙伴。但成为真正的伙伴,还需要跨过隐私、准确性和成本的三道坎。

ZHANG.z" | May 18, 2024 | 2 min | Shanghai

Meta Llama 3开源:AI的普惠革命还是商业陷阱?

Meta发布Llama 3那天,我第一时间下载了8B版本测试。不得不说,效果超出预期——某些任务甚至超过GPT-3.5。 表层:大模型的端侧革命 作为开发者,我太懂开源的力量了。以前玩大模型,要么花大价钱买API,要么要有超算。现在普通服务器甚至高端PC就能跑Llama 3。微软也凑热闹,开源了Phi-3-mini,3.8B参数连手机都能装。AI正在从云端被拉到端侧。 深层:中美开源的路径差异 中美玩法截然不同:中国是"开源+生态",比如百度文心一言开放API让开发者做应用;美国是"纯粹开源",直接放模型权重。上周跟做企业服务的朋友聊,他说客户都在问私有大模型部署,不想把数据放云端。Llama 3正好满足需求。 终局:开源的双刃剑 但开源也有风险。上周看到有人用Llama 3生成诈骗短信模板,要是被坏人利用,后果不堪设想。AI普惠革命来了,但革命的代价是什么? 开源让AI不再是巨头专属,普通人也能玩得起。但权力下放的同时,责任也在分散。 技术普惠从来不是免费午餐,它考验的是整个社会的技术素养和道德底线。

ZHANG.z" | April 10, 2024 | 2 min | Shanghai

欧洲AI法案:监管的红线,还是创新的枷锁?

欧洲议会通过AI法案那天,我在布鲁塞尔参加AI论坛。会场两派:一派欢呼终于有了全球第一个AI监管框架,另一派愁眉苦脸,担心监管杀死创新。 表层:分级监管的现实冲击 欧洲把AI分成不同风险等级,高风险AI(医疗、教育)要严格审查。这听起来合理,但一家美国AI公司想进欧洲,得遵守欧洲法律;欧洲公司到美国,却没同样约束。这不是"监管套利"吗? 深层:中美欧监管的全球博弈 中美态度截然不同:中国"包容审慎",美国"行业自律为主",欧洲直接上法律。上周跟一个欧洲AI创业公司CEO聊天,他说考虑把研发中心搬到新加坡:“欧洲监管成本太高,玩不起。” 终局:创新与监管的平衡难题 我其实挺矛盾的。AI发展太快,确实需要规则约束;但欧洲的监管向来严格,会不会像GDPR那样,成为企业沉重负担? 监管和创新从来都是冤家。AI法案到底是好事还是坏事?现在下结论太早。但全球AI治理的拼图,又多了一块重要碎片。 创新需要自由,发展需要规则。真正的智慧,是在红线内跳舞。

ZHANG.z" | March 25, 2024 | 2 min | Shanghai