Physical AI 的'边缘优先'拐点：当 Figure 与 1X 把人形机器人推上量产线，云端推理的延迟正在杀死可用性

一、量产爬坡的真问题：不是手指够不够灵巧，而是 50ms 够不够用

IEEE Robotics 与 The Robot Report 同一周内发了三件事：

Video Friday: Figure, 1X Ramp Up Humanoid Robot Production —— Figure 02 进入第二个量产工厂，1X NEO 开始月产千台爬坡；
Closing the latency gap: Why physical AI requires edge-first architectures —— 一篇罕见地把控制工程语言和深度学习语言放在一起讲的工程文章；
Boston Dynamics and Google DeepMind Teach Spot to Reason —— Spot 上线第一个具备多步推理能力的策略模型。

把这三件事按工程逻辑串起来，能看到一个极其具体的工业现实：人形机器人量产爬坡的卡点已经从机械、电池转移到了"延迟预算"。

人形机器人控制回路的硬约束是这样的：

控制层	周期	数据来源	决策位置
电机/伺服	1ms	编码器	关节 MCU（必须本地）
平衡/姿态	5–10ms	IMU + 力传感器	主控板（必须本地）
步态/全身协调	20–50ms	深度+力觉融合	板载 GPU（必须本地）
操作策略	100–300ms	视觉+语义	板载 NPU 或边缘节点
任务规划	1–10s	多模态+LLM	可云可边
知识/对话	1–30s	LLM	可云

注意 前 4 层都必须在毫秒到百毫秒级闭环内完成。任何走云端的方案都会在网络抖动下立刻失败——一台跌倒的人形机器人维修成本约 3000–8000 美元，量产场景下这是无法接受的良率冲击。

这就是 edge-first architectures 文章背后的真实驱动力。它不是技术品味问题，是 量产经济学问题。

二、边缘优先架构的三个关键设计反转

传统云原生 AI 架构的几个核心信条，在物理 AI 这里全部要反过来：

反转 1：模型不能"按需加载"，必须"预热常驻"

云端服务可以做模型懒加载、按 QPS 弹性伸缩。物理 AI 不行——一个 200ms 的冷启动就足以让机器人跌倒。这意味着：

边缘节点的内存必须能装下所有候选策略（操作、行走、避障、对话）；
模型切换必须 < 5ms；
必须放弃"用更大模型一统天下"的简洁，转而维护一组小模型 + 一个 router。

这正好是过去两年云端 AI 在反向做的事——大模型一统天下。物理 AI 倒推回了 MoE 思想，但是出于工程约束而非性能优化。

反转 2：数据采集和模型推理必须共址

云端架构的标准做法是 “数据采集 → 上传 → 训练 → 下发”。物理 AI 的现实是：

采集到的传感器数据带宽 30–200Mbps 持续流，全量上传不可行；
对边缘场景的策略改进必须在边缘做"在线适配"（online adaptation），等不及云端的 weekly retrain；
隐私合规要求大量传感器数据不能离开物理空间（家庭、工厂）。

The Robot Report 的文章给出了一个具体数字：Figure 02 的产线测试单元每台每天产生 ~14TB 多模态数据，全部上传到 AWS 一年的成本超过 $80K/台——直接抹掉所有商业模型。所以"边缘训练 + 联邦聚合"成了唯一可行路径。

反转 3：调度从"任务调度"变成"延迟预算调度"

云端 Kubernetes 调度的目标是最大化吞吐和资源利用率。机器人主控板的调度目标是 保证关键控制回路的延迟尾部不超过预算。这两套目标根本不兼容。

这意味着边缘 AI 栈需要 类似实时操作系统（RTOS）的硬实时调度 + 神经网络推理。NVIDIA Jetson Thor、Qualcomm RB7、华为 MDC 在 2026 年的卖点不再是 TOPS 数字，而是 保证 99.99% tail latency 的能力。

三、Spot 的"推理能力"为什么是分水岭

Boston Dynamics × DeepMind 的 Spot 升级在工程层面其实很克制——它不是把 Gemini 塞进机器狗，而是：

一个本地的小型策略模型负责实时控制；
一个边缘节点上的中型模型（~7B 参数）负责"5 秒内的中期推理"——比如"前面是楼梯，下楼之前先把电池模块拿稳"；
一个云端的大模型仅在任务规划级别介入（“巡检完三号变电站再回充电站”）。

这是第一次在商用机器人上看到 三层时间尺度的推理被严格分离并工程化。它对行业的意义不是"机器狗会推理了"，而是 “边缘优先 + 分层推理"是物理 AI 的标准架构而非可选项。

四、产业链影响：谁赢谁输

这个范式转移会重新分配价值链利润。

赢家：

边缘 AI 芯片厂商：英伟达 Jetson 线、Qualcomm 机器人平台、华为 MDC、地平线 J6——他们的 ASP 会在未来 24 个月翻倍。
实时操作系统厂商：QNX、VxWorks、ROS 2 商业发行版、华为鸿蒙工业版——RTOS + AI 的稀缺组合让他们重新获得溢价权。
机器人本体公司中能自研控制栈的：Figure、1X、Boston Dynamics、Unitree、宇树科技——他们能内化"边缘优先架构"的组织能力，构成护城河。

输家：

试图用纯云端 AI 服务机器人的 SaaS：他们的延迟和带宽假设被现实击穿。
缺乏实时工程能力的纯 AI 模型公司：把 LLM API 卖给机器人厂商的故事不成立——延迟无法满足。
没有低功耗高算力路线图的传统机器人公司：他们必须采购上游 AI 芯片，沦为整合商。

五、与人形机器人量产爬坡的耦合

回到 Figure 与 1X 的量产爬坡。两家公司在 2026 年都遇到了同一个问题：良率瓶颈不是机械装配，而是控制策略的边缘部署稳定性。

具体表现：

同一批硬件、同一份策略权重，在不同工厂的 Wi-Fi 环境下表现差异 > 10%；
模型在工厂 A 训练好，部署到工厂 B 出现"分布漂移”——光照、地板反光、空气湿度都会引入差异；
一个看似无害的策略更新（OTA 推送）会让 0.3% 的机器人出现新的失败模式，量产下意味着每天数十台需要现场调试。

边缘优先架构不解决所有这些问题，但它把 可调试范围从云端转移到本地——工程师可以在产线现场对单台机器人做策略微调而不污染主模型。这是 1X 和 Figure 在 2026 Q2 共同采用的工艺。

六、判断：未来 18 个月的三个赛点

边缘 AI 芯片的"能效 + 延迟"双指标会成为标准评估维度，TOPS 数字将被淡化。投资人应该重点看 TOPS/W × 99.99% tail latency 的乘积，而不是孤立的算力。
机器人本体公司会出现"垂直整合 vs 水平协作"的二次分化。Figure、1X、特斯拉 Optimus 走垂直整合（自研控制栈+训练栈），波士顿动力走与 DeepMind 的水平协作。两条路线都能成功，但成功条件不同——垂直整合需要 50+ 人的实时系统团队，水平协作需要极强的合作治理。
“边缘 AI 操作系统"会成为新一代基础设施战场。今天没有事实标准——ROS 2 不够实时，QNX 不够 AI 友好，鸿蒙工业版还在早期。第一个把 RTOS 调度 + AI 推理 + OTA 安全更新做到生产级的玩家，会拿走未来十年最大的边缘软件红利。

物理 AI 进入量产时代的真正挑战，是把云原生十年积累的工程范式 几乎全部反过来重做一遍。这不是因为云原生错了，而是因为 物理世界的延迟预算从一开始就拒绝远场决策。理解这一点的玩家会拿走未来十年的话语权；继续把机器人当作"会动的 SaaS"的玩家，会被产线良率数据无情教育。

Jiayun's Blog