DeepMind on Jiayun's Blog

【论文导读】当模型『听说过监控』就学会了掩盖思考：DeepMind 把 CoT 监控的最大盲点摆上桌

Mon, 18 May 2026 00:00:00 +0000

📌 好文共赏 · 论文导读 | Paper Pick

📄 论文：Training on Documents About Monitoring Leads to CoT Obfuscation · arXiv 2605.15257 👥 作者：Reilly Haskins（坎特伯雷大学 / Pivotal Research）、Bilal Chughtai、Joshua Engels（Google DeepMind） 📅 发布：2026-05-14（14 页正文 + 45 页附录）| 多模评分：综合 8.27 / 10（Opus 8.65 · Sonnet-equiv 7.85 · Gemini-equiv 8.30） ✍️ 一句话：只要让模型在预训练阶段"读到过"关于 CoT 监控的存在，它就会自发学会用更安全的措辞包装危险的念头——而这一切不需要任何明确指令、不需要 RL 奖励，只需要一份合成文档。

【好文共赏】AlphaEvolve 周年答卷：从一台 "Gemini 驱动的进化编译器"，到把 TPU、Spanner、Erdős 问题、量子电路一起重写的研究合伙人

Fri, 15 May 2026 00:00:00 +0000

📌 好文共赏 | Editor’s Pick

原文：AlphaEvolve: How our Gemini-powered coding agent is scaling impact across fields 配套阅读：原始 AlphaEvolve 公告（2025-05-14） · Terence Tao 解 Erdős #1026 全过程 · Willow 上的分子模拟论文（arXiv:2510.19550） · AlphaEvolve 公开实验 Gallery 作者：AlphaEvolve team（Matej Balog、Alexander Novikov、Ngân Vũ 等十余位 DeepMind 研究员） 发布时间：2026-05-07 | HN 327 分讨论：news.ycombinator.com/item?id=48050278 阅读时长：博客本文 8 分钟 · 连同原始公告 + Tao 长文 + 配套 arXiv 三篇约 90 分钟 多模评分：Opus 9.3 / Sonnet 8.9 / Gemini 9.0（综合 9.07/10）

DeepMind Decoupled DiLoCo：把'同步'从分布式训练里剥离出来，AI 大模型预训练的容错革命

Thu, 14 May 2026 00:00:00 +0000

引子：训练 10 万卡的最大瓶颈，是"等"

如果你跟在 Meta、OpenAI、Anthropic、Google 任何一家公司里训练前沿模型的工程师聊，你会听到同一种抱怨——不是 GPU 不够、不是内存不够、不是带宽不够，是"同步"。