<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>推理优化 on Jiayun's Blog</title><link>https://xiejiayun.github.io/tags/%E6%8E%A8%E7%90%86%E4%BC%98%E5%8C%96/</link><description>Recent content in 推理优化 on Jiayun's Blog</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Wed, 29 Apr 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://xiejiayun.github.io/tags/%E6%8E%A8%E7%90%86%E4%BC%98%E5%8C%96/index.xml" rel="self" type="application/rss+xml"/><item><title>从Prompt Engineering到Context Engineering：AI Agent时代的新范式</title><link>https://xiejiayun.github.io/post/context-engineering-agent-memory/</link><pubDate>Wed, 29 Apr 2026 00:00:00 +0000</pubDate><guid>https://xiejiayun.github.io/post/context-engineering-agent-memory/</guid><description>&lt;h2 id="一prompt-engineering已死">一、Prompt Engineering已死？&lt;/h2>
&lt;p>2023年，&amp;ldquo;Prompt Engineering&amp;quot;是AI行业最热门的技能。2026年，一个新术语正在取代它的位置：&lt;strong>Context Engineering&lt;/strong>（上下文工程）。&lt;/p></description></item><item><title>推理工程革命：异构计算、KV缓存突破与硅光子互连的三重奏</title><link>https://xiejiayun.github.io/post/inference-engineering-revolution-2026/</link><pubDate>Mon, 20 Apr 2026 00:00:00 +0000</pubDate><guid>https://xiejiayun.github.io/post/inference-engineering-revolution-2026/</guid><description>&lt;h2 id="推理工程三年前训练是什么今天推理就是什么">推理工程：三年前训练是什么，今天推理就是什么&lt;/h2>
&lt;p>The Pragmatic Engineer最近的深度分析一针见血：2023年，AI行业的核心挑战是&amp;quot;如何训练更大的模型&amp;quot;；2026年，核心挑战变成了**&amp;ldquo;如何让模型更快更便宜地推理&amp;rdquo;**。&lt;/p></description></item></channel></rss>