<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>GPU on Jiayun's Blog</title><link>https://xiejiayun.github.io/tags/gpu/</link><description>Recent content in GPU on Jiayun's Blog</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Mon, 27 Apr 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://xiejiayun.github.io/tags/gpu/index.xml" rel="self" type="application/rss+xml"/><item><title>AI计算经济学的临界点：当Cost-per-Token成为唯一重要的指标</title><link>https://xiejiayun.github.io/post/ai-compute-economics-cost-per-token-2026/</link><pubDate>Mon, 27 Apr 2026 00:00:00 +0000</pubDate><guid>https://xiejiayun.github.io/post/ai-compute-economics-cost-per-token-2026/</guid><description>&lt;h2 id="硅谷的新口头禅不是更快而是更便宜">硅谷的新口头禅：不是更快，而是更便宜&lt;/h2>
&lt;p>2026年春天，AI行业正在经历一场悄无声息但影响深远的范式转移。不是模型架构的突破，不是参数量的军备竞赛——而是&lt;strong>经济学&lt;/strong>。&lt;/p>
&lt;p>NVIDIA在最新的技术白皮书中提出了一个简洁而激进的论断：&amp;ldquo;Cost per Token is the Only Metric That Matters&amp;rdquo;（每Token成本是唯一重要的指标）。与此同时，404 Media在一篇深度报道中揭示了一个令人不安的现实：AI计算紧缩正在从科技行业蔓延到整个经济体。多家创业公司公开表示，他们在AI计算（Token消费）上的支出已经超过了人力成本。&lt;/p></description></item><item><title>全球内存危机与半导体变局：一场可能持续到2027年的供应链风暴</title><link>https://xiejiayun.github.io/post/ram-crisis-semiconductor-2026/</link><pubDate>Sun, 19 Apr 2026 00:00:00 +0000</pubDate><guid>https://xiejiayun.github.io/post/ram-crisis-semiconductor-2026/</guid><description>&lt;h2 id="被忽视的危机">被忽视的危机&lt;/h2>
&lt;p>当科技媒体铺天盖地报道AI大模型的新突破时，一个更基础、更紧迫的问题正在酝酿：&lt;strong>全球正在经历严重的内存芯片短缺，而且这个问题可能要持续到2027年&lt;/strong>。&lt;/p></description></item></channel></rss>