【论文导读】MinT：把「百万 LoRA × 1T 基模」做成一个可调度服务的工程母带

Mon, 18 May 2026 00:00:00 +0000

📌 好文共赏 · 论文导读 | Paper Pick

论文：MinT: Managed Infrastructure for Training and Serving Millions of LLMs | arXiv:2605.13779 作者：Mind Lab（投稿人 Changhai Zhou，~55 人团队，核心贡献者 12 人）机构：Macaron AI 旗下研究实验室 Mind Lab（contact@mindlab.ltd，公开 cookbook 在 MindLab-Research/mint-cookbook）发布：2026-05-13（27 页，cs.LG/cs.AI/cs.DC）| 多模评分：综合 8.7/10（Opus 8.9 / Sonnet 7.5 / Gemini 7.5；编辑加权后取 8.7） 一句话：当前业界还在争论「LoRA 能不能用在 RL post-training」时，这份报告直接给出了百万 LoRA × 1T 基模 × MoE/MLA/DSA的完整调度方案，并把每一条速度曲线都钉到了真实集群上的秒级测量上。

【论文导读】SU-01：一份让 30B 开源模型拿下 IMO/USAMO 双金牌的统一配方

Sun, 17 May 2026 00:00:00 +0000

📌 好文共赏 · 论文导读 | Paper Pick

📄 论文：Achieving Gold-Medal-Level Olympiad Reasoning via Simple and Unified Scaling · arXiv 2605.13301
👥 作者：Yafu Li, Runzhe Zhan, Haoran Zhang, Shunkai Zhang, Yizhuo Li et al.（上海 AI 实验室 / 香港中文大学 / 清华大学 / 上海交大 / 北大）
📅 发布：2026-05-13 | 多模评分：综合 8.67 / 10（Opus 8.75 · Sonnet-equiv 8.25 · Gemini-equiv 9.0）
✍️ 一句话：一份200 步 RL 就能把 30B-A3B 开源 MoE 推到 IMO 35/42、USAMO 35/42、IPhO 双金的统一配方——开源世界第一次在自然语言路线上摸到奥赛金牌带。

GRPO on Jiayun's Blog

【论文导读】MinT：把「百万 LoRA × 1T 基模」做成一个可调度服务的工程母带

【论文导读】SU-01：一份让 30B 开源模型拿下 IMO/USAMO 双金牌的统一配方