<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>AI基础设施 on Jiayun's Blog</title><link>https://xiejiayun.github.io/tags/ai%E5%9F%BA%E7%A1%80%E8%AE%BE%E6%96%BD/</link><description>Recent content in AI基础设施 on Jiayun's Blog</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Fri, 01 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://xiejiayun.github.io/tags/ai%E5%9F%BA%E7%A1%80%E8%AE%BE%E6%96%BD/index.xml" rel="self" type="application/rss+xml"/><item><title>AI Agent 正在压垮整个开发者基础设施：从 GitHub 故障到 'Be Right' 时代</title><link>https://xiejiayun.github.io/post/ai-agent-load-breaks-dev-infrastructure/</link><pubDate>Fri, 01 May 2026 00:00:00 +0000</pubDate><guid>https://xiejiayun.github.io/post/ai-agent-load-breaks-dev-infrastructure/</guid><description>&lt;h2 id="一个被忽视的事实ai-正在压垮整个软件工程的地基">一个被忽视的事实：AI 正在压垮整个软件工程的&amp;quot;地基&amp;quot;&lt;/h2>
&lt;p>2026 年 10 月底，GitHub 经历了一次罕见的多小时大规模降级：仓库 clone 超时、Actions 排队、API 限流到肉眼可见。事后官方更新说得很克制——&amp;ldquo;availability incident&amp;rdquo;。但 The Pragmatic Engineer 对此追问出了一个更尖锐的问题：&lt;strong>为什么 GitHub 比 GitLab、Bitbucket、Codeberg 更容易在 AI 浪潮中崩溃？&lt;/strong>&lt;/p></description></item><item><title>AI Flame Graphs：GPU性能分析的革命性突破，如何将AI计算成本砍半</title><link>https://xiejiayun.github.io/post/ai-flame-graphs-gpu-profiling-2026/</link><pubDate>Wed, 29 Apr 2026 00:00:00 +0000</pubDate><guid>https://xiejiayun.github.io/post/ai-flame-graphs-gpu-profiling-2026/</guid><description>&lt;h2 id="引言ai的真正瓶颈不是算法而是算力账单">引言：AI的真正瓶颈不是算法，而是算力账单&lt;/h2>
&lt;p>2026年，AI行业面临一个尴尬的现实：模型越来越强大，但大多数公司的AI项目却在亏钱。404 Media近期报道指出，AI算力危机已经开始波及整个经济体——不仅是科技公司，连传统企业的AI转型都因为GPU成本而踩刹车。&lt;/p></description></item><item><title>AI计算经济学的临界点：当Cost-per-Token成为唯一重要的指标</title><link>https://xiejiayun.github.io/post/ai-compute-economics-cost-per-token-2026/</link><pubDate>Mon, 27 Apr 2026 00:00:00 +0000</pubDate><guid>https://xiejiayun.github.io/post/ai-compute-economics-cost-per-token-2026/</guid><description>&lt;h2 id="硅谷的新口头禅不是更快而是更便宜">硅谷的新口头禅：不是更快，而是更便宜&lt;/h2>
&lt;p>2026年春天，AI行业正在经历一场悄无声息但影响深远的范式转移。不是模型架构的突破，不是参数量的军备竞赛——而是&lt;strong>经济学&lt;/strong>。&lt;/p>
&lt;p>NVIDIA在最新的技术白皮书中提出了一个简洁而激进的论断：&amp;ldquo;Cost per Token is the Only Metric That Matters&amp;rdquo;（每Token成本是唯一重要的指标）。与此同时，404 Media在一篇深度报道中揭示了一个令人不安的现实：AI计算紧缩正在从科技行业蔓延到整个经济体。多家创业公司公开表示，他们在AI计算（Token消费）上的支出已经超过了人力成本。&lt;/p></description></item><item><title>核聚变与数据中心：AI算力饥渴如何加速人类终极能源的商业化</title><link>https://xiejiayun.github.io/post/nuclear-fusion-data-center-energy-2026/</link><pubDate>Mon, 27 Apr 2026 00:00:00 +0000</pubDate><guid>https://xiejiayun.github.io/post/nuclear-fusion-data-center-energy-2026/</guid><description>&lt;h2 id="两条曲线的交汇">两条曲线的交汇&lt;/h2>
&lt;p>两条看似不相关的曲线正在加速交汇：&lt;/p>
&lt;p>&lt;strong>曲线一：AI数据中心的能源消耗&lt;/strong>正在以每年40-50%的速度增长。一个训练前沿模型的数据中心集群，其能耗可以匹敌一座中型城市。NVIDIA最近与能源行业领导者的合作——推进&amp;quot;电力灵活AI工厂&amp;quot;——正是对这一挑战的直接回应。&lt;/p></description></item></channel></rss>