<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>模型架构 on Jiayun's Blog</title><link>https://xiejiayun.github.io/tags/%E6%A8%A1%E5%9E%8B%E6%9E%B6%E6%9E%84/</link><description>Recent content in 模型架构 on Jiayun's Blog</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Sun, 19 Apr 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://xiejiayun.github.io/tags/%E6%A8%A1%E5%9E%8B%E6%9E%B6%E6%9E%84/index.xml" rel="self" type="application/rss+xml"/><item><title>2026 LLM架构演进全景：从注意力变体爆发到推理时扩展的新范式</title><link>https://xiejiayun.github.io/post/llm-architecture-evolution-2026/</link><pubDate>Sun, 19 Apr 2026 00:00:00 +0000</pubDate><guid>https://xiejiayun.github.io/post/llm-architecture-evolution-2026/</guid><description>&lt;h2 id="七年之变从gpt到gpt-oss">七年之变：从GPT到gpt-oss&lt;/h2>
&lt;p>2018年，OpenAI发布了初代GPT。七年后的2026年，他们发布了gpt-oss-120b和gpt-oss-20b——自GPT-2以来的首个开源权重模型。&lt;/p></description></item><item><title>开放权重LLM架构演进全景：从GPT-2到Gemma 4的七年革命</title><link>https://xiejiayun.github.io/post/open-weight-llm-architecture-evolution-2026/</link><pubDate>Sun, 19 Apr 2026 00:00:00 +0000</pubDate><guid>https://xiejiayun.github.io/post/open-weight-llm-architecture-evolution-2026/</guid><description>&lt;p>Sebastian Raschka在2026年4月更新了他的标志性文章《The Big LLM Architecture Comparison》，加入了Gemma 4的分析。这篇文章已经覆盖了从GPT-2到最新模型的23种架构。与此同时，Simon Willison发现Qwen3.6-35B-A3B在他的笔记本上画的鹈鹕竟然比Claude Opus 4.7还好。&lt;/p></description></item></channel></rss>