<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Serverless on Jiayun's Blog</title><link>https://xiejiayun.github.io/tags/serverless/</link><description>Recent content in Serverless on Jiayun's Blog</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Tue, 19 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://xiejiayun.github.io/tags/serverless/index.xml" rel="self" type="application/rss+xml"/><item><title>【好文共赏】把 2000 秒砍成 50 秒：Modal 五年工程账本，从 LP 求解器到 CUDA Checkpoint 的『真·无服务器 GPU』栈</title><link>https://xiejiayun.github.io/post/good-read-modal-serverless-gpu-cold-starts/</link><pubDate>Tue, 19 May 2026 00:00:00 +0000</pubDate><guid>https://xiejiayun.github.io/post/good-read-modal-serverless-gpu-cold-starts/</guid><description>&lt;h2 id="-编辑推荐框">📌 编辑推荐框&lt;/h2>
&lt;blockquote>
&lt;p>&lt;strong>好文共赏 | Editor&amp;rsquo;s Pick&lt;/strong>&lt;/p>
&lt;p>原文：&lt;a href="https://modal.com/blog/truly-serverless-gpus">Cutting inference cold starts by 40x with LP, FUSE, C/R, and CUDA-checkpoint&lt;/a> · 作者：Charles Frye / Jonathan Belotti / Erik Bernhardsson / Akshat Bubna（Modal） · 发布：2026-05-12 · 阅读时长：~20 分钟&lt;/p></description></item><item><title>Cloudflare Dynamic Workflows 全解析：300 行 TypeScript 如何让持久化执行'跟着租户走'</title><link>https://xiejiayun.github.io/post/cloudflare-dynamic-workflows-multitenant-durable-execution/</link><pubDate>Fri, 08 May 2026 00:00:00 +0000</pubDate><guid>https://xiejiayun.github.io/post/cloudflare-dynamic-workflows-multitenant-durable-execution/</guid><description>&lt;h2 id="引言当每个租户一个容器的成本曲线崩溃">引言：当「每个租户一个容器」的成本曲线崩溃&lt;/h2>
&lt;p>构建多租户 SaaS 平台时，最棘手的架构决策之一是工作流隔离。传统方案是每个租户分配独立的容器或进程——但当租户数量从数千增长到数百万时，这种方案的成本曲线从线性变成超线性：每个空闲容器仍然消耗内存、占用 IP 地址、需要健康检查。&lt;/p></description></item></channel></rss>