一、量产爬坡的真问题:不是手指够不够灵巧,而是 50ms 够不够用
IEEE Robotics 与 The Robot Report 同一周内发了三件事:
- Video Friday: Figure, 1X Ramp Up Humanoid Robot Production —— Figure 02 进入第二个量产工厂,1X NEO 开始月产千台爬坡;
- Closing the latency gap: Why physical AI requires edge-first architectures —— 一篇罕见地把控制工程语言和深度学习语言放在一起讲的工程文章;
- Boston Dynamics and Google DeepMind Teach Spot to Reason —— Spot 上线第一个具备多步推理能力的策略模型。
把这三件事按工程逻辑串起来,能看到一个极其具体的工业现实:人形机器人量产爬坡的卡点已经从机械、电池转移到了"延迟预算"。
人形机器人控制回路的硬约束是这样的:
| 控制层 | 周期 | 数据来源 | 决策位置 |
|---|---|---|---|
| 电机/伺服 | 1ms | 编码器 | 关节 MCU(必须本地) |
| 平衡/姿态 | 5–10ms | IMU + 力传感器 | 主控板(必须本地) |
| 步态/全身协调 | 20–50ms | 深度+力觉融合 | 板载 GPU(必须本地) |
| 操作策略 | 100–300ms | 视觉+语义 | 板载 NPU 或边缘节点 |
| 任务规划 | 1–10s | 多模态+LLM | 可云可边 |
| 知识/对话 | 1–30s | LLM | 可云 |
注意 前 4 层都必须在毫秒到百毫秒级闭环内完成。任何走云端的方案都会在网络抖动下立刻失败——一台跌倒的人形机器人维修成本约 3000–8000 美元,量产场景下这是无法接受的良率冲击。
这就是 edge-first architectures 文章背后的真实驱动力。它不是技术品味问题,是 量产经济学问题。
二、边缘优先架构的三个关键设计反转
传统云原生 AI 架构的几个核心信条,在物理 AI 这里全部要反过来:
反转 1:模型不能"按需加载",必须"预热常驻"
云端服务可以做模型懒加载、按 QPS 弹性伸缩。物理 AI 不行——一个 200ms 的冷启动就足以让机器人跌倒。这意味着:
- 边缘节点的内存必须能装下所有候选策略(操作、行走、避障、对话);
- 模型切换必须 < 5ms;
- 必须放弃"用更大模型一统天下"的简洁,转而维护一组小模型 + 一个 router。
这正好是过去两年云端 AI 在反向做的事——大模型一统天下。物理 AI 倒推回了 MoE 思想,但是出于工程约束而非性能优化。
反转 2:数据采集和模型推理必须共址
云端架构的标准做法是 “数据采集 → 上传 → 训练 → 下发”。物理 AI 的现实是:
- 采集到的传感器数据带宽 30–200Mbps 持续流,全量上传不可行;
- 对边缘场景的策略改进必须在边缘做"在线适配"(online adaptation),等不及云端的 weekly retrain;
- 隐私合规要求大量传感器数据不能离开物理空间(家庭、工厂)。
The Robot Report 的文章给出了一个具体数字:Figure 02 的产线测试单元每台每天产生 ~14TB 多模态数据,全部上传到 AWS 一年的成本超过 $80K/台——直接抹掉所有商业模型。所以"边缘训练 + 联邦聚合"成了唯一可行路径。
反转 3:调度从"任务调度"变成"延迟预算调度"
云端 Kubernetes 调度的目标是最大化吞吐和资源利用率。机器人主控板的调度目标是 保证关键控制回路的延迟尾部不超过预算。这两套目标根本不兼容。
这意味着边缘 AI 栈需要 类似实时操作系统(RTOS)的硬实时调度 + 神经网络推理。NVIDIA Jetson Thor、Qualcomm RB7、华为 MDC 在 2026 年的卖点不再是 TOPS 数字,而是 保证 99.99% tail latency 的能力。
三、Spot 的"推理能力"为什么是分水岭
Boston Dynamics × DeepMind 的 Spot 升级在工程层面其实很克制——它不是把 Gemini 塞进机器狗,而是:
- 一个本地的小型策略模型负责实时控制;
- 一个边缘节点上的中型模型(~7B 参数)负责"5 秒内的中期推理"——比如"前面是楼梯,下楼之前先把电池模块拿稳";
- 一个云端的大模型仅在任务规划级别介入(“巡检完三号变电站再回充电站”)。
这是第一次在商用机器人上看到 三层时间尺度的推理被严格分离并工程化。它对行业的意义不是"机器狗会推理了",而是 “边缘优先 + 分层推理"是物理 AI 的标准架构而非可选项。
四、产业链影响:谁赢谁输
这个范式转移会重新分配价值链利润。
赢家:
- 边缘 AI 芯片厂商:英伟达 Jetson 线、Qualcomm 机器人平台、华为 MDC、地平线 J6——他们的 ASP 会在未来 24 个月翻倍。
- 实时操作系统厂商:QNX、VxWorks、ROS 2 商业发行版、华为鸿蒙工业版——RTOS + AI 的稀缺组合让他们重新获得溢价权。
- 机器人本体公司中能自研控制栈的:Figure、1X、Boston Dynamics、Unitree、宇树科技——他们能内化"边缘优先架构"的组织能力,构成护城河。
输家:
- 试图用纯云端 AI 服务机器人的 SaaS:他们的延迟和带宽假设被现实击穿。
- 缺乏实时工程能力的纯 AI 模型公司:把 LLM API 卖给机器人厂商的故事不成立——延迟无法满足。
- 没有低功耗高算力路线图的传统机器人公司:他们必须采购上游 AI 芯片,沦为整合商。
五、与人形机器人量产爬坡的耦合
回到 Figure 与 1X 的量产爬坡。两家公司在 2026 年都遇到了同一个问题:良率瓶颈不是机械装配,而是控制策略的边缘部署稳定性。
具体表现:
- 同一批硬件、同一份策略权重,在不同工厂的 Wi-Fi 环境下表现差异 > 10%;
- 模型在工厂 A 训练好,部署到工厂 B 出现"分布漂移”——光照、地板反光、空气湿度都会引入差异;
- 一个看似无害的策略更新(OTA 推送)会让 0.3% 的机器人出现新的失败模式,量产下意味着每天数十台需要现场调试。
边缘优先架构不解决所有这些问题,但它把 可调试范围从云端转移到本地——工程师可以在产线现场对单台机器人做策略微调而不污染主模型。这是 1X 和 Figure 在 2026 Q2 共同采用的工艺。
六、判断:未来 18 个月的三个赛点
边缘 AI 芯片的"能效 + 延迟"双指标会成为标准评估维度,TOPS 数字将被淡化。投资人应该重点看 TOPS/W × 99.99% tail latency 的乘积,而不是孤立的算力。
机器人本体公司会出现"垂直整合 vs 水平协作"的二次分化。Figure、1X、特斯拉 Optimus 走垂直整合(自研控制栈+训练栈),波士顿动力走与 DeepMind 的水平协作。两条路线都能成功,但成功条件不同——垂直整合需要 50+ 人的实时系统团队,水平协作需要极强的合作治理。
“边缘 AI 操作系统"会成为新一代基础设施战场。今天没有事实标准——ROS 2 不够实时,QNX 不够 AI 友好,鸿蒙工业版还在早期。第一个把 RTOS 调度 + AI 推理 + OTA 安全更新做到生产级的玩家,会拿走未来十年最大的边缘软件红利。
物理 AI 进入量产时代的真正挑战,是把云原生十年积累的工程范式 几乎全部反过来重做一遍。这不是因为云原生错了,而是因为 物理世界的延迟预算从一开始就拒绝远场决策。理解这一点的玩家会拿走未来十年的话语权;继续把机器人当作"会动的 SaaS"的玩家,会被产线良率数据无情教育。
引用来源
- Video Friday: Figure, 1X Ramp Up Humanoid Robot Production — IEEE Spectrum
- Closing the latency gap: Why physical AI requires edge-first architectures — The Robot Report
- Why physical AI is the real manufacturing revolution — The Robot Report
- Boston Dynamics and Google DeepMind Teach Spot to Reason — IEEE Spectrum
- Top 10 robotics stories of April 2026 — The Robot Report
- NVIDIA Jetson Thor Product Brief
- QNX Real-Time Operating System