Toggle navigation
Jiayun's Blog
All Posts
ai
前沿科技
开源
归档
关于
Jiayun's Blog
探索与分享
2026 LLM架构演进全景:从注意力变体爆发到推理时扩展的新范式
七年过去,Transformer架构走向何方?从MoE到GQA,从gpt-oss到Gemma 4,深度解析大模型架构的技术演进与趋势判断
Posted by Jiayun's Blog on Sunday, April 19, 2026 00:00 UTC
开放权重LLM架构演进全景:从GPT-2到Gemma 4的七年革命
深度梳理开放权重大模型的架构创新脉络,从稀疏注意力到混合推理模式,开源正在缩小与闭源模型的差距
Posted by Jiayun's Blog on Sunday, April 19, 2026 00:00 UTC
Developer & Blogger
FEATURED TAGS
agentic ai
ai agent
ai基础设施
ai安全
ai硬件
ai算力
ai编程
ai芯片
anthropic
apple
chiplet
claude
cloudflare
copilot
deepseek
discord bot
dram
gemini
gemma
github
github copilot
google
gpu
hermes agent
ios
kubernetes
llm
nvidia
openai
python
rag
rust
saas
tee
token经济
tsmc
typescript
中国ai
云原生
云计算
产业分析
人形机器人
供应链
具身智能
半导体
基础设施
多智能体
大模型
安全
密码学
开发工具
开发者工具
开源
开源ai
开源分析
强化学习
推理优化
数据中心
机器人
架构设计
模型架构
版权
硬件
端到端加密
编程语言
编译器
网络安全
芯片制造
芯片设计
软件工程
量子计算
零日漏洞