【好文共赏】把 2000 秒砍成 50 秒：Modal 五年工程账本，从 LP 求解器到 CUDA Checkpoint 的『真·无服务器 GPU』栈

Tue, 19 May 2026 00:00:00 +0000

📌 编辑推荐框

好文共赏 | Editor’s Pick

原文：Cutting inference cold starts by 40x with LP, FUSE, C/R, and CUDA-checkpoint · 作者：Charles Frye / Jonathan Belotti / Erik Bernhardsson / Akshat Bubna（Modal） · 发布：2026-05-12 · 阅读时长：~20 分钟

Cloudflare Dynamic Workflows 全解析：300 行 TypeScript 如何让持久化执行'跟着租户走'

Fri, 08 May 2026 00:00:00 +0000

引言：当「每个租户一个容器」的成本曲线崩溃

构建多租户 SaaS 平台时，最棘手的架构决策之一是工作流隔离。传统方案是每个租户分配独立的容器或进程——但当租户数量从数千增长到数百万时，这种方案的成本曲线从线性变成超线性：每个空闲容器仍然消耗内存、占用 IP 地址、需要健康检查。

Serverless on Jiayun's Blog

【好文共赏】把 2000 秒砍成 50 秒：Modal 五年工程账本，从 LP 求解器到 CUDA Checkpoint 的『真·无服务器 GPU』栈

📌 编辑推荐框

Cloudflare Dynamic Workflows 全解析：300 行 TypeScript 如何让持久化执行'跟着租户走'

引言：当「每个租户一个容器」的成本曲线崩溃