一、为什么这次审计值得拆开看
WhatsApp 在 2025 年底悄悄推出 Private Inference,把 Meta AI 的回答从云端常规推理迁到一个号称"端到端可验证"的可信执行环境(TEE) 集群。Trail of Bits 在 2026 年 4 月发布的审计报告,是迄今为止针对消费级 LLM 隐私推理基础设施最全面的第三方评估。报告本身只有 30 多页,但它撬开的几个问题足以颠覆当下大厂"我们用了 Confidential Computing,所以你的数据是安全的"这套话术。
这篇文章不打算复述报告细节,而是想顺着它的脉络回答三个更尖锐的问题:
- TEE 在 LLM 推理场景下,到底防住了什么、防不住什么?
- 远程证明(Remote Attestation) 这条信任链,最薄弱的环节在哪里?
- 当 20 亿月活用户的隐私推理只能由两三家芯片厂商承载,“隐私"是不是已经被重新定义为"对供应商的信任”?
二、WhatsApp Private Inference 的架构骨架
按照 Meta 工程博客和 Trail of Bits 报告交叉印证,整体结构大致如下:
| |
三个关键设计:
- Oblivious HTTP:把"谁问了什么"拆成两段,谁也凑不齐用户身份与请求内容。
- NVIDIA Confidential Computing GPU:H100 的 CC 模式让 GPU 显存与 CPU 之间的 PCIe 流量加密,且 GPU 内部计算受 enclave 边界保护。
- 远程证明锚定到客户端:客户端在拿到响应前,会校验来自 NVIDIA NRAS 与 AMD KDS 的双层证书链,确认推理跑在指定固件版本的 enclave 中。
听起来无懈可击。但 Trail of Bits 把审计重点放在了三个被普遍低估的角落。
三、第一个深坑:TEE 不防侧信道,而 LLM 是侧信道天堂
可信执行环境的"机密性"承诺,从来不包括侧信道。SGX、SEV-SNP、TDX 在白皮书里都明确写着 “out of scope: side-channel attacks”。问题在于,LLM 推理是当今计算负载里最容易泄露侧信道信息的一类。
为什么?因为:
| 侧信道维度 | 传统加密计算 | LLM 推理 |
|---|---|---|
| 内存访问模式 | 数据无关(constant-time) | 高度依赖 token、prompt 长度 |
| 计算时长 | 通常固定 | 与输出长度线性相关 |
| 缓存命中 | 可控 | KV cache 命中率随上下文变化 |
| 显存带宽 | 平稳 | MoE 专家激活模式直接暴露语义 |
Trail of Bits 报告里有一段被低估的描述:他们在受控环境里仅通过观测 GPU SM 占用率的时间序列,就能以 78% 的准确率分辨用户问的是"医疗类问题"还是"代码类问题"。这不是攻破加密,但对一个号称"连 Meta 都看不到内容"的系统来说,已经构成隐私语义层面的塌方。
更糟的是,MoE 架构让侧信道更廉价。当 DeepSeek V4、Llama 4 这样的模型把 1.6T 参数切成几十个专家,每个 token 路由到的专家组合本身就是一种特征指纹——不需要解密任何密文,只需要观察专家激活模式的功耗,就足以重建一部分上下文主题。
这是为什么我倾向认为:TEE 加 MoE 这条技术路线,在隐私语义上是退化而非进化。除非未来的 CC GPU 在硬件层加入访问模式扁平化(oblivious memory access),否则当前的"机密计算 LLM"只能保证密文不被读取,无法保证语义不被推断。
四、第二个深坑:远程证明的信任根,正在被悄悄收缩
远程证明的核心承诺是:客户端可以独立验证"我对话的对端确实是某段公开可审计的代码"。整个 WhatsApp Private Inference 的隐私模型都建立在这个假设上。
但 Trail of Bits 揭示了一个令人不安的现实——整条信任链的根,最终汇聚在三个非常具体的私钥上:
| |
WhatsApp 的客户端没有也不可能内置"NVIDIA 私钥泄露撤销列表"的实时检查机制。NVIDIA 自身的 NRAS(NVIDIA Remote Attestation Service)虽然可以下线某个固件版本,但这意味着用户必须完全信任 NVIDIA 不会被胁迫签发恶意固件证书。
这就是为什么我把这种结构称为 “司法管辖单点故障"。在过去十年端到端加密的进步里,密码学社区花了大量精力把信任分散到用户的本地设备。而 TEE 推理的兴起,正在把刚刚分散的信任重新集中到三家芯片巨头手里——而这三家都在同一个司法辖区。
Trail of Bits 在报告中谨慎措辞,建议"考虑多供应商证明融合”,但实际操作上没有任何 LLM 推理芯片能替代 H100/H200 的角色。我的判断是:未来三年内,TEE LLM 的"信任根多元化"基本不可能实现。这是产业格局而不是技术问题。
五、第三个深坑:Prompt 注入会撕碎机密性边界
这是审计报告里最具前瞻性也最少被外界讨论的部分。Private Inference 的隐私边界是:用户的请求不离开 enclave。但 LLM 推理的本质决定了它会把输出写进上下文,再喂给下一轮。
考虑下面这个攻击链:
| |
这是 TEE 完全防不住的攻击:所有数据都在 enclave 内被合法处理,密码学层面没有任何破绽,但信息流策略被语言模型的可塑性绕过。Trail of Bits 把这一类问题归为 “Confidentiality through Composition Failure”,并指出这是当前所有 LLM 隐私推理产品共同的盲区——包括 Apple Intelligence 的 Private Cloud Compute。
我的预测是:2026 年下半年会出现第一起公开披露的 TEE LLM 注入攻击 PoC,目标很可能就是 WhatsApp 或 Apple PCC,并且会引发监管层重新定义"端到端加密"的范围。
六、对行业的几个判断
- TEE 不是隐私推理的终点,而是 v0.1。它解决了"云厂商内部员工偷看"的低阶威胁,没解决侧信道、信任根集中和组合性泄露这三大结构性问题。
- 隐私 AI 推理的下一战场是同态加密(FHE) 和函数秘密共享(FSS),但性能差距仍在 1000x 以上。短期看不到取代 TEE 的可能,TEE 会是未来 3–5 年的过渡形态。
- 真正的隐私 AI 部署,最终会回归端侧。Apple 在 M4/M5 上推 38B 本地模型、高通 X3 推动 70B 端侧、华为 Mate 80 系列支持 32B 本地推理——这些路线在结构上比"信任 NVIDIA + 信任 AMD + 信任 Meta + 信任 Cloudflare"更干净。
- 第三方持续审计将成为合规要件。GDPR、欧盟 AI Act、加州 SB-1047 后续修订都在向"用户有权要求审计推理路径"的方向收紧。Trail of Bits 这次的报告会成为模板。
七、写在最后:信任的转移而不是消除
WhatsApp Private Inference 是一次工程上的重要尝试,但它本质上把"信任 Meta 不滥用数据"换成了"信任 NVIDIA + AMD + Cloudflare + Meta 都不被胁迫、不被攻破、不被注入"。从信任面的总和来看,新方案并没有显著缩小。
真正的隐私不来自更复杂的密码学堆栈,而来自更少的信任关系。当我们对一个 AI 系统说"它能访问我的所有聊天记录"时,无论加密层多厚,这句话本身就已经决定了隐私的上限。
参考资料
- Trail of Bits — What we learned about TEE security from auditing WhatsApp’s Private Inference, 2026-04-07. https://blog.trailofbits.com/2026/04/07/whatsapp-private-inference-audit/
- Meta Engineering — Private Processing in WhatsApp, 2025. https://engineering.fb.com/2025/private-processing-whatsapp/
- NVIDIA — Confidential Computing on H100 GPUs Whitepaper, 2024. https://docs.nvidia.com/confidential-computing/
- Apple — Private Cloud Compute Security Guide, 2024. https://security.apple.com/documentation/private-cloud-compute/
- Hugging Face Blog — AI and the Future of Cybersecurity: Why Openness Matters, 2026-04-21. https://huggingface.co/blog/ai-cybersecurity-openness