Zhang's Blog

2026年，周金涛的预言兑现了吗？

本系列为 2026 年春节读书反思：以《涛动周期论》《涛动周期录》为素材，用 2016–2026 年真实数据验证周金涛预言，并展开理论解构与当代应用。所有观点与预言均对应原作，数据引用参考文末索引。三条预言、十年数据、逐条对照——先看准不准，再谈为什么。 2026 年春节前几天，我把自己关在书房里重读《涛动周期论》。翻到「人生发财靠康波」那一章时，顺手查了查 2016 年他生前那场著名的演讲——网上还能找到逐字稿和摘要。那场演讲里，他给了几个明确的时间窗口：2018–2019 年康波萧条最惨烈、2020 年后中国房地产进入漫长熊市、2025 年第五康波萧条终点。十年过去了，我们正好站在他说的「萧条终点」的另一侧。我决定做一件事：把这三条预言和能查到的真实数据逐条对一遍，看看到底准了多少。这件事不能凭印象，得按书和公开报告来。下面写到的「周金涛说」，一律以《涛动周期论》《涛动周期录》及公开可查的演讲、报告为据；文中数据均标注来源，不编数字。第一条预言：2018–2019 年是康波萧条最惨烈阶段周金涛在 2016 年 3 月上海清算所那场演讲里说得极直白，原话是：「2017 年中期或三季度之后，我们将看到中国和美国的资产价格全线回落，2019 年将出现最终低点。那个低点可能远比大家想象的低。」同一场演讲里他还说：「2018 年到 2019 年是康波周期的万劫不复之年，60 年当中的最差阶段，所以一定要控制 2018、2019 年的风险。在此之前做好充分的现金准备。」1 不是含糊的「某段萧条」，而是明确把 2018–2019 标成 60 年里最差、并给出操作建议。我按这个原话去对那两年的实际发生了什么。 2018 年，中美贸易摩擦升级。美国对华加征关税的清单从 340 亿美元一路扩大到 2000 亿美元量级，中国反制。A 股在这一年跌得很凶：上证综指全年跌幅约 24.6%，深成指约 34.4%，创业板指约 28.7%2。全市场市值蒸发约 14 万亿量级，不少人在那年把 2017 年蓝筹牛赚到的又还了回去。出口依赖型板块——电子、机械——领跌，和「全球贸易与制造业承压」的叙事完全对得上。有意思的是，周金涛并没有预言贸易战本身，他预言的是「萧条期冲击最集中」——贸易战恰好成了那两年的主要冲击源，这种对应关系事后看很难说是巧合还是周期使然。美国那边，经济数据不算崩，但增速从高位回落。美联储在 2017–2018 年还在加息缩表，到 2019 年，美债收益率曲线多次出现倒挂，市场开始认真讨论衰退3。IMF 在 2018–2019 年多次下修全球增长预期，全球制造业 PMI 走弱。所以从「康波萧条期里冲击比较集中的一段」这个角度理解，这两年确实对得上：贸易战、资产大跌、增长放缓、衰退预期升温，都发生了。但「最惨烈」三个字有争议。若拿 1929 年大萧条或 2008 年全球金融危机当尺子，2018–2019 的绝对烈度到不了那个级别。也有人会说，2020 年疫情冲击、2022 年美联储暴力加息和全球资产回撤，在「惨」的体感上不逊于 2018–2019。所以我会记成部分命中：方向对了，冲击集中的两年没跑偏，但「最惨烈」是否就是这两年，可以争。周金涛自己在书里也讲过，预测的价值在方向不在精确到某月——差两年是误差，差十年才是错误。 ...

AI 幻觉与「洗车悖论」：今天的 AI 为什么还当不了你的主治医师

AI 的「聪明」和人类的「聪明」不是同一种东西——弄不清这一点，就会要么高估它，要么低估它。最近有个问题在网络上很火：「我要去小区旁 20 米的洗车店洗车，请问步行还是开车？」不少 AI 会认真建议你：20 米很近，步行环保又锻炼身体。你忍不住笑：不开车去，洗车店洗什么？洗我的腿吗？这类现象有个正式名字叫 AI 幻觉（AI Hallucination）：模型用非常笃定的语气，给出逻辑上站不住脚或与事实不符的回答。幻觉背后的原因，不只是「AI 还笨」或「数据不够」。实质是：今天的 AI 是在用「猜下一个字」的统计方式生成文字，它缺的是对物理世界和因果逻辑的「世界感」。理解这一点，才能说清为什么眼下它既不能当你的主治医师，也替代不了科学家和创意工作者；以及行业正在用哪些办法给这件事「打补丁」。洗车悖论与 9.11 比 9.9 大：幻觉长什么样「20 米洗车该步行还是开车」和另一道流传很广的题是同一类陷阱：「9.11 和 9.9 哪个大？」很多模型会答 9.11 更大——因为它把数字当成了软件版本号或日期（9 月 11 日），而不是在比较两个数的大小。两件事共同暴露的是：AI 会顺着训练数据里高概率出现的「搭配」往下说，而不是先想清楚这道题在问什么、需要什么前提。在医学、法律、安全建议等场景里，这种「顺滑地跑偏」会带来真实风险。据学术与媒体报道，已有 AI 因训练数据中的统计偏差，对哮喘患者给出过「不需要特殊照顾」之类的建议；也有系统因为曾在某篇小说里读到某种蘑菇的描写，就敢回答「可以食用」。这些都不是个例，而是同一类问题的不同表现：模型在「像什么」的联想上很强，在「是什么」「该不该」的逻辑与事实上却不可靠。所以讨论幻觉，本质上是在讨论 AI 的能力边界——它擅长什么、不擅长什么，以及在哪些场景下必须由人做最后把关。2024 年能答对「9.11 与 9.9 哪个大」的模型还很少，到 2026 年这类题已常见于各大厂的基础评测；幻觉会随技术迭代减轻，但边界仍在。它在「猜字」而不是推演，所以会掉进统计陷阱要理解幻觉从哪来，得先搞清楚当前这类 AI 到底在干什么。可以把大语言模型想成一台「超级猜字机」：你输入一句话，它根据读过的海量文本，算出「下一个最可能出现的字（或词元）」是什么，然后一个接一个往下猜，拼成整段回答。它没有在内部先推演「洗车需要车」「所以必须开车去」——只是在无数网页、书籍、对话里，「20 米」和「步行」「短途」「环保」经常一起出现，所以概率一加权，它就顺着这条「统计捷径」滑过去了，忽略了「目的」是洗车、洗车必须有车这个常识。「9.11 比 9.9 大」也是同一套逻辑的产物。在模型眼里，数字往往被拆成「词元」（Token）来处理，比如 9.11 可能被拆成「9」「.」「11」。在技术文档、版本说明里，「11」出现在「9」之后太常见了，所以它会答「9.11 更大」——模式识别压过了数学逻辑。一句话总结：AI 擅长的是「像什么」的联想，而不是「是什么」的严格推理。这种差别，就是幻觉和逻辑失效的根源；不是它不想答对，而是它当前的运作方式本来就不是「先理解再作答」。缺的不是知识量，而是「世界感」人听到「去洗车」，脑子里会自动冒出画面：洗车店、水枪、泡沫、自己的车。这种对物理世界和日常流程的直觉，是我们在真实世界里摸爬滚打出来的。AI 没有身体，没摸过车，也没见过洗车房的水雾；它的「知识」全部来自文字。如果训练数据里没有反复、多角度地强调「洗车必须带车」，它就容易把这道题当成单纯的「距离题」：20 米 → 步行，完事。有一句话概括得很准：今天的 AI 像一位背熟了百科全书却从没出过门的读书人——语义联想很强，常识推理却常常跟不上。就像没去过海边的人，再会形容也缺「那一口咸风」；AI 和世界的关系，跟我们不一样。所以问题不只是「少学了哪条知识」，而是它缺乏在真实世界中行动、观察、试错后沉淀下来的那种「世界模型」。这不是笨不笨的问题，而是它认识世界的方式和人类根本不同；补上这一点，是当前研究里最难、也最被重视的方向之一。 ...

【论文解读11】深度残差网络中的恒等映射：ResNet改进

本文解读的是Kaiming He、Xiangyu Zhang、Shaoqing Ren和Jian Sun于2016年发表的改进论文《Identity Mappings in Deep Residual Networks》，该论文深入分析了ResNet中恒等映射的作用机制，提出了预激活（Pre-activation）的残差块设计，进一步优化了ResNet的训练稳定性和性能。这一改进不仅完善了ResNet的理论基础，更为理解残差连接的本质提供了深刻的洞察。 “恒等映射是残差网络成功的关键。"——这是He等人在ResNet改进论文中提出的核心观点。在原始ResNet中，残差块的设计虽然有效，但恒等映射的实现方式（激活函数的位置）对性能有重要影响。通过系统性的实验和理论分析，论文发现预激活（在卷积之前应用BatchNorm和ReLU）比后激活（在卷积之后应用）效果更好。论文的核心创新是预激活残差块：将BatchNorm和ReLU移到卷积之前，使恒等映射的路径更加"干净”，梯度流动更加顺畅。这种设计不仅提高了训练稳定性，还进一步提升了模型性能，在ImageNet上取得了更好的结果。在当今大模型时代，这一改进的思想仍然重要：理解恒等映射的本质，优化信息流动路径，这些原则仍然是深度网络设计的核心。理解ResNet改进，就是理解如何进一步优化残差连接。本文将从问题根源、核心机制、解决方案、实践评估四个维度深度解读ResNet改进，包含完整的数学推导、梯度流动分析和实验评估，并在文末提出开放性问题与未来研究方向。本文属于论文阅读开篇：Ilya 30u30 阅读计划系列，可前往该页查看完整目录、阅读顺序与发布状态。原始ResNet的恒等映射问题问题一：激活函数位置的影响在原始ResNet中，残差块的设计为： $$ y = \mathcal{F}(x, {W_i}) + x $$ 其中 $\mathcal{F}$ 通常包含：Conv → BN → ReLU → Conv → BN，然后输出与 $x$ 相加，最后再应用ReLU。后激活设计：激活函数在残差函数之后，恒等映射 $x$ 直接参与加法，然后应用激活函数。问题分析：当 $x$ 经过ReLU激活时，如果 $x$ 的某些元素为负，会被置为0，破坏了恒等映射的性质。这导致恒等映射路径不够"干净"，梯度流动可能受阻。问题二：梯度流动的阻塞在原始设计中，梯度需要通过激活函数的导数传播： $$ \frac{\partial y}{\partial x} = \frac{\partial \text{ReLU}(\mathcal{F}(x) + x)}{\partial x} = \text{ReLU}’(\mathcal{F}(x) + x) \left(1 + \frac{\partial \mathcal{F}}{\partial x}\right) $$ ...

从巴菲特的并购与数字观，看CEO该盯住什么

「大都会公司的运营利润率为 29%，ABC 公司是 11%。如果墨菲能将 ABC 公司的运营利润率提高 1/3 到 15%，那么公司每年将多增收益 1.25 亿美元，合并后的新公司盈利将是 3.25 亿美元。」出处说明：这句话并非巴菲特在致股东信或股东大会上的原话，而是罗伯特·G·哈格斯特朗（Robert G. Hagstrom）在《巴菲特之道》（The Warren Buffett Way，第一版 1994 年）一书中，对巴菲特 1985 年参与大都会通信公司（Capital Cities）收购美国广播公司（ABC）一案的并购逻辑所做的量化转述。1985 年 3 月该交易完成，巴菲特出资约 5.175 亿美元成为合并后新公司重要股东，其信心核心来自大都会 CEO 汤姆·墨菲的管理能力；巴菲特在 1986 年致股东信中明确将这笔投资概括为「购买优秀管理层管理的优秀业务」。哈格斯特朗用上述数字提炼的，正是「管理改善能显著提升低利润率业务的盈利能力」这一逻辑，与巴菲特公开表达的投资哲学一致。这句话用极简数字把「运营利润率对比 → 效率改善空间 → 利润增量 → 合并价值」这条链讲完。并购的核心价值，往往不是买下现有盈利，而是买下「低效资产被好管理修复后的利润增量」。本文从这一量化表述出发，做一层财务拆解、一层指标辨析、一层并购逻辑，最后落到CEO 和决策者真正该盯住的指标与前提。不谈轶事、不攀交情，只谈可复现的因果与数字。一、先把数字拆开：那一句里藏着的营收基数该案例的量化表述只给了四件事：ABC 原利润率 11%、提高 1/3 后约 15%、每年多赚 1.25 亿美元、合并后总利润 3.25 亿。没有直接给出 ABC 的营收。但营收恰恰是「为什么动一点利润率就能多出这么多利润」的关键。设 ABC 的运营营收为 $R$（提效阶段先假设不扩营收，只做管理优化）：利润率绝对提升：$15\\% - 11\\% = 4$ 个百分点利润增量 = 营收 × 利润率提升，即 $$ \Delta \text{Profit} = R \times 4\\% $$ 代入 $\Delta \text{Profit} = 1.25$ 亿（美元）： $$ R = \frac{1.25}{0.04} = 31.25 \text{ 亿美元} $$ 也就是说，ABC 是一家营收约 31 亿、但运营利润率只有 11% 的公司。小幅度利润率提升 × 大营收基数 = 大额绝对利润增量。这是并购价值的一个数学来源：同样的 4 个百分点，若 (R) 只有 3 亿，增量只有 0.12 亿；若 (R) 是 31 亿，增量才是 1.25 亿。CEO 和投资者若只盯「利润率提高了多少」，而忽略「利润是在多大的营收基数上算出来的」，就会低估或高估一次提效或一次并购的真实影响。 ...

【论文解读10】深度残差学习：ResNet解决网络退化问题

本文解读的是Kaiming He、Xiangyu Zhang、Shaoqing Ren和Jian Sun于2016年发表的里程碑论文《Deep Residual Learning for Image Recognition》，该论文提出的ResNet通过残差连接（Residual Connection）解决了深度网络的退化问题，将网络深度推到了前所未有的152层，在ImageNet上取得了3.57%的Top-5错误率，首次超越人类水平。ResNet不仅彻底改变了深度网络的设计范式，更为后续Transformer、生成模型等架构的残差连接奠定了理论基础。 “更深的网络应该至少不会比浅层网络更差。"——这是ResNet论文的核心洞察。在ResNet之前，深度网络面临一个悖论：理论上更深的网络应该能够学习更复杂的特征，但实际中更深的网络在训练集上的错误率反而更高。这不是过拟合，而是优化困难——网络无法有效学习恒等映射。 ResNet通过残差连接解决了这一根本问题。残差块定义为 $y = F(x) + x$，其中 $F(x)$ 是残差函数，$x$ 是恒等映射。如果最优映射是恒等映射 $H(x) = x$，传统网络需要学习 $H(x) = x$，而残差网络只需学习 $F(x) = 0$，后者显然更容易。这种设计使得网络可以非常深，性能可以持续提升。在当今大模型时代，残差连接已经成为深度网络的标准组件：Transformer的残差连接、生成模型的跳跃连接（U-Net、StyleGAN）、大模型的深度扩展（GPT-3、PaLM等模型都依赖残差连接训练深层网络）。理解ResNet，就是理解深度网络设计的核心思想。本文将从问题根源、核心机制、解决方案、实践评估四个维度深度解读ResNet，包含完整的数学推导、梯度流动分析和实验评估，并在文末提出开放性问题与未来研究方向。深度网络的退化问题问题一：网络深度与性能的悖论理论上，更深的网络应该能够学习更复杂的特征表示，性能应该更好。但实际中，随着网络加深，出现了两个严重问题：梯度消失问题：在深层网络中，梯度在反向传播过程中指数级衰减。对于Sigmoid激活函数，$\sigma’(x) \leq 0.25$，经过 $L$ 层后，梯度最多衰减到 $0.25^L$。当 $L$ 很大时，早期层的梯度接近0，无法有效更新参数。退化问题（Degradation Problem）：这是ResNet论文发现的新问题。实验显示，56层网络的训练误差比20层网络更高。这不是过拟合（因为训练误差也更高），而是优化困难——网络无法有效学习。数学分析：假设最优映射是 $H(x) = x$（恒等映射），传统网络需要学习 $H(x) = x$，这需要所有层的权重矩阵都是单位矩阵，这在深层网络中很难实现。问题二：恒等映射的学习困难恒等映射 $H(x) = x$ 是最简单的映射，但在深层网络中学习恒等映射却非常困难。 ...