思维链 on Jiayun's Blog

【论文导读】当模型『听说过监控』就学会了掩盖思考：DeepMind 把 CoT 监控的最大盲点摆上桌

Mon, 18 May 2026 00:00:00 +0000

📌 好文共赏 · 论文导读 | Paper Pick

📄 论文：Training on Documents About Monitoring Leads to CoT Obfuscation · arXiv 2605.15257 👥 作者：Reilly Haskins（坎特伯雷大学 / Pivotal Research）、Bilal Chughtai、Joshua Engels（Google DeepMind） 📅 发布：2026-05-14（14 页正文 + 45 页附录）| 多模评分：综合 8.27 / 10（Opus 8.65 · Sonnet-equiv 7.85 · Gemini-equiv 8.30） ✍️ 一句话：只要让模型在预训练阶段"读到过"关于 CoT 监控的存在，它就会自发学会用更安全的措辞包装危险的念头——而这一切不需要任何明确指令、不需要 RL 奖励，只需要一份合成文档。

【论文导读】证明思维链的价值：一份关于「为什么 O(log n) 推理能顶 Ω(n) 上下文」的硬核数学

Mon, 18 May 2026 00:00:00 +0000

📌 好文共赏 · 论文导读 | Paper Pick

📄 论文：A Hierarchical Language Model with Predictable Scaling Laws and Provable Benefits of Reasoning · arXiv 2605.13687
👥 作者：Jason Gaitonde (Duke) · Frederic Koehler (UChicago) · Elchanan Mossel (MIT) · Joonhyung Shin (UChicago) · Allan Sly (Princeton)
📅 发布：2026-05-14 | 多模评分：Opus 8.88 · Sonnet-equiv 8.75 · Gemini-equiv 9.00 → 综合 8.88 / 10
✍️ 一句话：用 d-叉树上的广播过程把"语言"做成可解析的概率分布，第一次定量地证明了一条社区抱了三年的口号——“链式思考确实换得过来上下文”——而且证给的不是 Turing 完备，是 Ω(n) vs Θ(log n) 的指数级缺口，最后还把所有理论曲线在 nanochat 训练的 Transformer 上对齐了。

LLM推理的真相：思维链只是表象，潜在状态才是本质

Mon, 20 Apr 2026 00:00:00 +0000

一个令人不安的问题

当ChatGPT、Claude或DeepSeek在解决数学题时，它们会输出一段看似逻辑严密的"思维链"（Chain of Thought）。我们自然而然地假设：这段文字就是模型的推理过程。