OpenAI的12天发布会：生成式AI的终极形态，还是营销噱头？

OpenAI的12天发布会终于结束了，我全程追完了所有直播。当演示者用自然语言和视频交互时，我突然有种穿越到未来的感觉——这可能就是生成式AI的终极形态了。

表层：AI视频的技术突破

Sora的视频生成能力又提升了，现在能生成5分钟高清视频，连人物微表情都能模拟。视频交互模式也落地了，直接对视频内容提问，AI会实时回答。上周跟做内容创作的朋友聊天，他说：“以前拍短视频要2000块，现在用AI只要200块，效果还不差。“已经不用请摄影师了。

深层：中美视频AI的竞争格局

中美在生成式视频领域的竞争很激烈：谷歌发布了Veo 2大模型，腾讯也开源了视频大模型。美国在技术前沿领先，中国在落地应用更快——抖音已经在测试AI生成视频功能了。但冷静下来想，深度伪造的风险也不容忽视：生成的人物和真实几乎一模一样，要是用来制作虚假视频，后果不堪设想。

终局：GPT-o3的营销噱头？

最让我感慨的是OpenAI预测的GPT-o3，2025年发布，据说能实现真正的多模态交互，甚至理解人类情感。但这会不会是又一个营销噱头？毕竟，GPT-4o刚发布时，也有很多承诺没兑现。

生成式AI的终极形态到底是什么？是理解和创造任何内容的超级智能，还是人类想象力的延伸？

2025年的GPT-o3会给我们答案。但无论如何，OpenAI的12天发布会已经展示了AI的未来——更加智能、自然的人机交互时代。我已经迫不及待想看到那一天了。