Jiayun's Blog

探索与分享

人形机器人半马拉松:2026年具身智能的iPhone时刻

从Honor机器人50分26秒破纪录到Tesla上海工厂量产计划,人形机器人正在从实验室走向赛道和工厂

中国AI算力大爆发:日均140万亿Token背后的产业重构

从日均Token消耗量暴增40%到字节跳动利润暴跌70%,中国AI产业正经历一场前所未有的规模化转型

Cerebras IPO与AI芯片战争:350亿美元估值背后的晶圆级野心

从Cerebras天价IPO到SambaNova异构推理,AI芯片格局正在经历GPU单一霸权的终结

LLM推理的真相:思维链只是表象,潜在状态才是本质

三篇重磅论文揭示大模型推理的底层机制——我们对AI思考的理解可能从根本上就错了

Pull Request已死,Harness Engineering万岁:软件开发的范式革命

GitHub首次允许关闭PR功能,Tokenmaxxing成为大厂怪象,Harness Engineering作为新学科崛起。从代码审查到Token编排,软件工程正经历21世纪以来最深刻的变革。

WhatsApp的隐私AI实验:当端到端加密遇上大模型推理

Trail of Bits对WhatsApp Private Inference的安全审计揭示了AI时代隐私架构的核心矛盾与创新解法

前沿模型竞速:Gemma 4、Opus 4.7、GPT-Rosalind与OpenClaw的四面博弈

2026年4月,前沿模型格局剧变——Google开源Gemma 4追赶闭源水平,Anthropic的Opus 4.7实现阶梯式超越,OpenAI推出垂直领域模型GPT-Rosalind,而OpenClaw面临开源安全危机。一场关于开放与封闭、通用与垂直的深层博弈正在展开。

推理工程革命:异构计算、KV缓存突破与硅光子互连的三重奏

当AI Agent无处不在,推理(Inference)成为最关键的工程瓶颈。SambaNova-Intel异构架构、突破Shannon极限的KV缓存压缩、硅光子互连——三大技术正在同时重塑推理基础设施。

Hermes Agent 中文完全指南:117 篇官方文档浓缩成的一本使用手册

从 0 到 1 吃透 Nous Research 开源的自改进 AI 代理 Hermes Agent——安装、配置、47+ 内置工具、三层记忆、技能自学、15+ 消息平台、MCP、语音、Cron、委派、沙箱、Provider 路由全链路解读。

2026 LLM架构演进全景:从注意力变体爆发到推理时扩展的新范式

七年过去,Transformer架构走向何方?从MoE到GQA,从gpt-oss到Gemma 4,深度解析大模型架构的技术演进与趋势判断