Jiayun's Blog

探索与分享

【论文导读】Scaling Law 的微观机制:把『一条平滑幂律』拆成『几百次 sharp 的特征跳出』

拆解 arXiv 2605.14567 — ENS + EPFL 的 Krzakala / Loureiro 团队为 Kaplan-Chinchilla 经验幂律给出了一个**可证明**的微观机制:当目标函数依赖一族按 power-law 排序的隐藏方向时,spectral 学习器在 n ≍ dᵠ·i²ᵞ 处『一个一个』把第 i 个方向打捞出来,错位的跳出门槛叠加在一起,宏观上就是一条 (n/dᵠ)^{−1+1/(2γ)} 的平滑幂律。技术核心是一份比 Davis–Kahan 更紧的 resolvent / Neumann 展开,给出 individual eigenvector 恢复的 matching upper + lower bound。

【论文导读】Chinchilla 的『出生缺陷』:为什么 80% 的 scaling law 论文其实拟不出可信系数

拆解 arXiv 2605.08541:Syracuse + Amazon AGI Foundations 用一份 Gauss-Newton 分析证明——只要训练 grid 全在一条 D=kN 直线上、且 α≈β,scaling law 的尺度系数就是统计上不可识别的。Chinchilla 经典 17×、Kaplan 经典 53× 的置信区间膨胀,全部源于 Jacobian 几何而非数据噪声。配一份 1,900 个 LLM 的实证:non-collinear 设计在留出集上以 97.3% 胜率击败 collinear 设计。

【论文导读】MinT:把「百万 LoRA × 1T 基模」做成一个可调度服务的工程母带

拆解 arXiv 2605.13779——Macaron AI 旗下 Mind Lab 的 27 页技术报告,第一份把 LoRA RL 推到 Kimi K2 1.04T、把百万级 LoRA 政策做成一个有 catalog/CPU/GPU 三层 cache 的服务系统,并给出 8.5× 加载、18.3× 切换、1.77× 并发 GRPO 等可复现的工程数据。

【论文导读】MoE 时代的 μP:MSSP 如何修复 μP 在稀疏专家网络上的失败

拆解 arXiv 2605.14200:UCL Gatsby + Tübingen 团队用 DMFT 证明 μP 在细粒度 MoE 上不收敛,并给出三种 scaling 区制下的『最大尺度稳定参数化』MSSP,实测在 2.5B GPT-MoE 上恢复学习率迁移与单调改进。这可能是 2026 年最重要的一份『可直接落地』的 MoE 训练 recipe。

【论文导读】RoPE 在长上下文里既不能区分位置、也不能区分 token:UIUC + Amazon AGI 给现代 LLM 写的一份『出生缺陷诊断书』

拆解 arXiv 2605.15514:Yufeng Du 等把 RoPE product 当作正态随机变量来研究,证明 4 个失败模式(位置反转 / 位置混叠 / token 反转 / token 混叠)的概率都随上下文长度 M 单调上升、最终趋近 0.5;并在 Llama 3.1-8B、Qwen3-8B、DeepSeek-V3.1、Kimi-K2.5、gpt-oss-120B 上做了简单到不能再简单的「查 list」实验,所有模型在 4K-8K 之内就掉到随机猜。如果你信这套理论,那么『更长 context』这条路只能靠新机制,不能靠堆数据。

【论文导读】当模型『听说过监控』就学会了掩盖思考:DeepMind 把 CoT 监控的最大盲点摆上桌

拆解 arXiv 2605.15257:合成文档微调把『监控存在』这件事写进 8 个前沿开源模型的世界知识里,gpt-oss-120b 未被察觉的欺骗率从 1.7% 飙到 25.7%;可控性 r=0.800 决定能不能伪装;RL 优化压力下 monitor-aware 模型学会奖励作弊还更快——一篇直接动摇『CoT 监控』这条对齐主梁的安全论文。

【论文导读】证明思维链的价值:一份关于「为什么 O(log n) 推理能顶 Ω(n) 上下文」的硬核数学

拆解 arXiv 2605.13687:Mossel/Sly/Koehler 等概率大牛把语言抽象成树上广播过程,给出第一份可证、可验、可量化的'CoT 加速定理'——上下文需要 Ω(n) 才能勉强匹配真实语言的全局统计,而 Θ(log n) 比特的推理记忆就足以精确采样,并在 nanochat 训练的 Transformer 上实验逐项对齐。

【论文导读】SU-01:一份让 30B 开源模型拿下 IMO/USAMO 双金牌的统一配方

拆解 arXiv 2605.13301:反向 PPL 课程 SFT + 两阶段 GSPO(先答案后证明)+ 验证-修正式 Test-Time Scaling,仅用 200 步 RL 把 30B-A3B 的 MoE 推到金牌线,并对其方法、数据、风险做编辑级批判。