Toggle navigation
Jiayun's Blog
All Posts
ai
前沿科技
好文共赏
开源
育儿
归档
关于
Jiayun's Blog
探索与分享
【论文导读】RoPE 在长上下文里既不能区分位置、也不能区分 token:UIUC + Amazon AGI 给现代 LLM 写的一份『出生缺陷诊断书』
拆解 arXiv 2605.15514:Yufeng Du 等把 RoPE product 当作正态随机变量来研究,证明 4 个失败模式(位置反转 / 位置混叠 / token 反转 / token 混叠)的概率都随上下文长度 M 单调上升、最终趋近 0.5;并在 Llama 3.1-8B、Qwen3-8B、DeepSeek-V3.1、Kimi-K2.5、gpt-oss-120B 上做了简单到不能再简单的「查 list」实验,所有模型在 4K-8K 之内就掉到随机猜。如果你信这套理论,那么『更长 context』这条路只能靠新机制,不能靠堆数据。
Posted by Jiayun's Blog on Monday, May 18, 2026 00:00 UTC
【论文导读】证明思维链的价值:一份关于「为什么 O(log n) 推理能顶 Ω(n) 上下文」的硬核数学
拆解 arXiv 2605.13687:Mossel/Sly/Koehler 等概率大牛把语言抽象成树上广播过程,给出第一份可证、可验、可量化的'CoT 加速定理'——上下文需要 Ω(n) 才能勉强匹配真实语言的全局统计,而 Θ(log n) 比特的推理记忆就足以精确采样,并在 nanochat 训练的 Transformer 上实验逐项对齐。
Posted by Jiayun's Blog on Monday, May 18, 2026 00:00 UTC
Developer & Blogger
FEATURED TAGS
agentic ai
ai agent
ai 安全
ai基础设施
ai安全
ai推理
ai硬件
ai算力
ai编程
ai芯片
android
anthropic
antirez
app 横评
apple
apple silicon
ar
arxiv
cerebras
chiplet
claude
cloudflare
conway定律
copilot
cpython
cuda
ddos
deepmind
deepseek
demoscene
discord bot
dram
duckdb
eda
fuzzing
gemini
gemma
gguf
github
github copilot
google
gpt
gpt-5.5
gpu
grpo
hbf
hbm
hermes agent
interpretability
ios
ipo
kubernetes
linux
linux 内核
linux内核
llm
llm推理
lpddr5x
mcp
moe
mythos
npm
nvidia
openai
pixel
pqc
project zero
python
quic
rag
redis
risc-v
rlhf
rust
saas
scaling laws
scratchjr
serverless
socamm2
spacex
sre
tee
tesla
token经济
transformer
tsmc
typescript
ucie
vllm
中国ai
云原生
云计算
产业分析
人形机器人
代码审计
估值
供应链
供应链安全
侧信道
先进制程
先进封装
具身智能
内存安全
内核安全
内核漏洞
分布式系统
制造业
前沿模型
半导体
变现策略
可穿戴设备
可观测性
可解释性
后量子密码
商业模式
图形学
基础模型
基础设施
处理器架构
复古计算
外骨骼
多智能体
大模型
好文推荐
学术前沿
安全
安全研究
实时渲染
密码学
对齐
嵌入式
工具链
工程文化
平台工程
幼儿教育
开发工具
开发者工具
开源
开源ai
开源分析
开源安全
开源治理
异构集成
异步运行时
强化学习
形式化验证
思维链
性能优化
性能工程
推理
推理优化
政治经济学
教育app
教育科技
数学启蒙
数据中心
数据库
数据结构
机器人
架构设计
模型架构
模糊测试
注意力机制
洪恩数学
消费电子
深度研究
漏洞利用
版权
物理ai
独立开发
独立开发者
理论机器学习
硬件
硬件安全
硬件考古
硬件逆向
移动安全
端到端加密
算力经济
算力经济学
算法
系统设计
编程启蒙
编程哲学
编程猫
编程语言
编译器
缩放定律
网络协议
网络安全
育儿app
能源
芯片制造
芯片架构
芯片设计
订阅制
论文导读
软件供应链
软件工程
软件架构
边缘计算
逆向工程
都都数学
量子计算
长上下文
隐私
隐私计算
零日漏洞
零知识证明