Jiayun's Blog

探索与分享

开放权重LLM架构演进全景:从GPT-2到Gemma 4的七年革命

深度梳理开放权重大模型的架构创新脉络,从稀疏注意力到混合推理模式,开源正在缩小与闭源模型的差距

全球内存危机与半导体变局:一场可能持续到2027年的供应链风暴

DRAM供应仅能满足60%需求、GPU价格持续飙升、数据中心建设大面积延迟——AI繁荣背后的硬件瓶颈正在显现

中国人形机器人爆发:从半马夺冠到万台量产的产业跃迁

当机器人跑完半程马拉松、京东推出机器人救护车、智元喊出平台化战略,中国机器人产业正在经历什么?

前沿模型三国杀:Claude Mythos、Muse Spark与GPT-Rosalind的差异化突围

Anthropic、Meta和OpenAI在2026年Q1的模型发布揭示了一个关键趋势——通用智能竞赛正在让位于垂直领域深耕

Hermes Agent 架构深度解剖:从23万行Python看自我进化AI代理的设计哲学

深入 Nous Research 开源的 Hermes Agent 源码,从 Gateway-Agent 分层、工具注册表、技能学习闭环到20+平台适配器,全面剖析这个'会学习的通用Agent'的架构设计与工程智慧

n8n 架构深度解剖:从250万行TypeScript看工作流引擎的设计哲学

深入 n8n 源码,从 Monorepo 治理、执行引擎、节点抽象到扩展性架构,全面剖析这个开源工作流自动化平台的设计哲学与工程智慧

RAG系统的三次进化:从向量搜索到Graph-RAG的架构革命

深度解析检索增强生成的技术演进——向量检索、重排序模型、图结构知识库,以及为什么Graph-RAG将重新定义企业知识系统

TSMC与芯片制造的地缘博弈:当CC Wei告诉Musk'建晶圆厂没有捷径'

从TSMC 2026年财报电话会到Intel CPU刷新,深度分析全球半导体制造格局的最新变化与AI算力供应链的真实瓶颈

多智能体系统的工程化挑战:竞态条件、测试框架与设计模式的实战指南

当多个AI Agent同时操作共享资源,软件工程中最经典的并发问题以全新的形式回归——如何设计、测试和调试多Agent系统

C++26反射与内存安全、投机执行的硅片浪费:编程语言和芯片架构正在同步进化

C++26引入反射、内存安全和合约机制,SemiWiki揭示投机执行浪费了大量晶体管,新异步模型对标Rust——从语言到硅片,一场关于效率的革命正在两个层次同时展开。