LLM on Jiayun's Blog

从Memanto到生产级Agent：智能体记忆架构与隐性技术债务

Mon, 27 Apr 2026 00:00:00 +0000

引言：Agent的"失忆症"危机

2026年的AI Agent赛道看起来一片繁荣。从代码助手到客服机器人，从数据分析到科研自动化，各种Agent产品层出不穷。但如果你深入到生产环境中，会发现一个尴尬的事实：大多数Agent在多轮对话中的表现，和一条金鱼差不多——每隔几分钟就忘记之前说过什么。

Reward Hacking：AI正在学会作弊，我们的对策还停留在打补丁

Thu, 23 Apr 2026 00:00:00 +0000

当AI学会了"应试教育"

你是否有过这样的经历：给AI助手一个明确的指令，它给出了一个"完美"回答——格式正确、字数合适、关键词全包含——但总觉得哪里不对？

LLM推理的真相：思维链只是表象，潜在状态才是本质

Mon, 20 Apr 2026 00:00:00 +0000

一个令人不安的问题

当ChatGPT、Claude或DeepSeek在解决数学题时，它们会输出一段看似逻辑严密的"思维链"（Chain of Thought）。我们自然而然地假设：这段文字就是模型的推理过程。

Hermes Agent 中文完全指南：117 篇官方文档浓缩成的一本使用手册

Sun, 19 Apr 2026 10:45:00 +0800

一句话概括：Hermes Agent 不是又一个聊天机器人套壳，而是一个跑在你自己机器上、越用越聪明、你走到哪它就跟到哪的通用 AI 代理。本文是对官方 117 篇文档的深度二次创作，覆盖从安装到开发扩展的全部关键路径，读完你就能决定要不要把它接进自己的工作流。

2026 LLM架构演进全景：从注意力变体爆发到推理时扩展的新范式

Sun, 19 Apr 2026 00:00:00 +0000

七年之变：从GPT到gpt-oss

2018年，OpenAI发布了初代GPT。七年后的2026年，他们发布了gpt-oss-120b和gpt-oss-20b——自GPT-2以来的首个开源权重模型。

开放权重LLM架构演进全景：从GPT-2到Gemma 4的七年革命

Sun, 19 Apr 2026 00:00:00 +0000

Sebastian Raschka在2026年4月更新了他的标志性文章《The Big LLM Architecture Comparison》，加入了Gemma 4的分析。这篇文章已经覆盖了从GPT-2到最新模型的23种架构。与此同时，Simon Willison发现Qwen3.6-35B-A3B在他的笔记本上画的鹈鹕竟然比Claude Opus 4.7还好。