<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>分布式系统 on Jiayun's Blog</title><link>https://xiejiayun.github.io/tags/%E5%88%86%E5%B8%83%E5%BC%8F%E7%B3%BB%E7%BB%9F/</link><description>Recent content in 分布式系统 on Jiayun's Blog</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Fri, 15 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://xiejiayun.github.io/tags/%E5%88%86%E5%B8%83%E5%BC%8F%E7%B3%BB%E7%BB%9F/index.xml" rel="self" type="application/rss+xml"/><item><title>PolitePaxos 与 SysMoBench：分布式共识的'第三波'，与 AI 写形式化模型的真实水平</title><link>https://xiejiayun.github.io/post/politepaxos-sysmobench-consensus-formal-modeling-2026/</link><pubDate>Fri, 15 May 2026 00:00:00 +0000</pubDate><guid>https://xiejiayun.github.io/post/politepaxos-sysmobench-consensus-formal-modeling-2026/</guid><description>&lt;blockquote>
&lt;p>&lt;strong>核心观点&lt;/strong>：分布式共识研究在过去 25 年（Paxos 1998 → Raft 2014 → 各种变体）形成了一套相对稳定的范式。Murat Demirbas 团队 2026 年提出的 &lt;strong>PolitePaxos&lt;/strong> 把一个长期被忽视的角度 —— &amp;ldquo;proposer 不强行获取多数派承诺，而是先礼貌询问&amp;rdquo; —— 重新挖出来，在某些 workload 下有可观的延迟收益。但更有意思的是同一团队的 &lt;strong>SysMoBench&lt;/strong>：他们把&amp;quot;用 AI 帮人类做 TLA+ / 形式化建模&amp;quot;这件事第一次系统性地评测了。结果是：今天最强的 AI 在系统建模上只是&amp;quot;中等本科生水平&amp;quot;，但这条赛道是未来 5 年最值得跟踪的&amp;quot;AI 进入硬科学&amp;quot;指标之一。&lt;/p></description></item><item><title>DeepMind Decoupled DiLoCo：把'同步'从分布式训练里剥离出来，AI 大模型预训练的容错革命</title><link>https://xiejiayun.github.io/post/deepmind-decoupled-diloco-fault-tolerant-distributed-pretraining-2026/</link><pubDate>Thu, 14 May 2026 00:00:00 +0000</pubDate><guid>https://xiejiayun.github.io/post/deepmind-decoupled-diloco-fault-tolerant-distributed-pretraining-2026/</guid><description>&lt;h2 id="引子训练-10-万卡的最大瓶颈是等">引子：训练 10 万卡的最大瓶颈，是&amp;quot;等&amp;quot;&lt;/h2>
&lt;p>如果你跟在 Meta、OpenAI、Anthropic、Google 任何一家公司里训练前沿模型的工程师聊，你会听到同一种抱怨——&lt;strong>不是 GPU 不够、不是内存不够、不是带宽不够，是&amp;quot;同步&amp;quot;&lt;/strong>。&lt;/p></description></item><item><title>AI Agent 正在压垮整个开发者基础设施：从 GitHub 故障到 'Be Right' 时代</title><link>https://xiejiayun.github.io/post/ai-agent-load-breaks-dev-infrastructure/</link><pubDate>Fri, 01 May 2026 00:00:00 +0000</pubDate><guid>https://xiejiayun.github.io/post/ai-agent-load-breaks-dev-infrastructure/</guid><description>&lt;h2 id="一个被忽视的事实ai-正在压垮整个软件工程的地基">一个被忽视的事实：AI 正在压垮整个软件工程的&amp;quot;地基&amp;quot;&lt;/h2>
&lt;p>2026 年 10 月底，GitHub 经历了一次罕见的多小时大规模降级：仓库 clone 超时、Actions 排队、API 限流到肉眼可见。事后官方更新说得很克制——&amp;ldquo;availability incident&amp;rdquo;。但 The Pragmatic Engineer 对此追问出了一个更尖锐的问题：&lt;strong>为什么 GitHub 比 GitLab、Bitbucket、Codeberg 更容易在 AI 浪潮中崩溃？&lt;/strong>&lt;/p></description></item></channel></rss>