Jiayun's Blog

探索与分享

Cerebras IPO与AI芯片战争:350亿美元估值背后的晶圆级野心

从Cerebras天价IPO到SambaNova异构推理,AI芯片格局正在经历GPU单一霸权的终结

LLM推理的真相:思维链只是表象,潜在状态才是本质

三篇重磅论文揭示大模型推理的底层机制——我们对AI思考的理解可能从根本上就错了

Pull Request已死,Harness Engineering万岁:软件开发的范式革命

GitHub首次允许关闭PR功能,Tokenmaxxing成为大厂怪象,Harness Engineering作为新学科崛起。从代码审查到Token编排,软件工程正经历21世纪以来最深刻的变革。

WhatsApp的隐私AI实验:当端到端加密遇上大模型推理

Trail of Bits对WhatsApp Private Inference的安全审计揭示了AI时代隐私架构的核心矛盾与创新解法

前沿模型竞速:Gemma 4、Opus 4.7、GPT-Rosalind与OpenClaw的四面博弈

2026年4月,前沿模型格局剧变——Google开源Gemma 4追赶闭源水平,Anthropic的Opus 4.7实现阶梯式超越,OpenAI推出垂直领域模型GPT-Rosalind,而OpenClaw面临开源安全危机。一场关于开放与封闭、通用与垂直的深层博弈正在展开。

推理工程革命:异构计算、KV缓存突破与硅光子互连的三重奏

当AI Agent无处不在,推理(Inference)成为最关键的工程瓶颈。SambaNova-Intel异构架构、突破Shannon极限的KV缓存压缩、硅光子互连——三大技术正在同时重塑推理基础设施。

2026 LLM架构演进全景:从注意力变体爆发到推理时扩展的新范式

七年过去,Transformer架构走向何方?从MoE到GQA,从gpt-oss到Gemma 4,深度解析大模型架构的技术演进与趋势判断

AI Agent基础设施大战:从模型服务到智能体托管的范式转移

Cloudflare、AWS、Kubernetes、NVIDIA四大阵营如何重新定义AI基础设施,从服务模型到托管智能体的战略转型深度解析

Anthropic vs OpenAI:企业AI市场的路线之争

OpenAI收购媒体公司激进扩张,Anthropic深耕安全与企业级部署——两种截然不同的AI商业哲学,谁将赢得企业市场?

开放权重LLM架构演进全景:从GPT-2到Gemma 4的七年革命

深度梳理开放权重大模型的架构创新脉络,从稀疏注意力到混合推理模式,开源正在缩小与闭源模型的差距