具身智能新底座:

镜像视界三维空间感知关键技术突破


摘要

随着具身智能(Embodied Intelligence / Physical AI)从研究热点走向产业落地,机器人系统正面临一个共识性问题:缺乏稳定、统一、可行动的空间感知底座。传统以二维识别或局部建图为核心的视觉体系,已难以支撑机器人在真实复杂环境中的持续决策与安全行动。
镜像视界(浙江)科技有限公司围绕“空间即认知、感知即底座”的核心理念,构建了一套面向具身智能的三维空间感知新底座。该底座通过视频直解真实空间、像素级空间反演、多视角融合与动态目标三维建模,突破传统感知范式限制,为具身智能提供工程可控、可规模化、可直接驱动行动的空间认知基础


一、背景:为什么具身智能需要“新底座”

1.1 具身智能的瓶颈不在算法层

当前具身智能在模型规模、学习策略与仿真平台上进展迅速,但在真实世界应用中仍普遍遭遇以下问题:

  • 感知结果难以直接用于决策

  • 动态环境下空间状态不稳定

  • 多模块系统坐标与时间基准割裂

这些问题的根源并非“算法不够先进”,而是缺乏统一的空间感知底座

1.2 从“功能模块”到“系统底座”的转变需求

在复杂真实场景中,空间感知不再是一个可选功能,而是具身智能系统的基础设施
具身智能迫切需要一个能够:

  • 持续描述真实空间

  • 统一表达动态对象

  • 直接支撑规划与控制

的感知底座。


二、技术理念:三维空间感知即具身智能底座

镜像视界提出的核心判断是:

没有三维空间感知底座,就不存在可落地的具身智能。

因此,镜像视界并未将三维感知视为“附加能力”,而是将其定位为具身智能的系统级底座能力,其核心目标是:
将视觉系统输出升级为可行动的三维空间状态。


三、关键技术突破:构建具身智能三维空间感知底座

3.1 视频直解真实空间:底座的真实数据源

镜像视界通过视频空间反演技术,直接从视频中解算真实三维空间,实现:

  • 不依赖激光雷达、RGB-D 等重型传感器

  • 不依赖穿戴式标签、信标或主动定位设备

  • 基于普通摄像头即可完成空间解算

这使空间感知底座具备低硬件门槛与高部署弹性


3.2 像素级空间反演:让感知具备“坐标属性”

在镜像视界体系中,每一个有效像素都对应真实空间坐标,感知输出从:

“识别到一个目标”
升级为:
“在真实空间中的某个位置与姿态”

这一突破使三维空间成为具身智能的统一表达语言


3.3 多视角融合:底座级空间一致性保障

通过多视角视频几何约束与时空同步,镜像视界构建:

  • 跨摄像机、跨区域统一的空间坐标体系

  • 大尺度场景下连续稳定的空间模型

  • 对遮挡与视角变化的系统性抑制

这是三维空间感知作为“底座”而非“功能模块”的关键前提。


3.4 动态目标三维建模:让底座支持真实世界运动

在镜像视界底座中,人员、车辆等动态目标以三维模型或三维骨架形式存在,其:

  • 位置来源于空间反演结果

  • 姿态受三维几何一致性约束

  • 轨迹为连续空间路径

底座由此能够稳定描述真实世界的动态性


3.5 人体行为与具身安全:底座级“他者理解”

通过视频驱动的三维人体骨骼与行为建模,镜像视界使空间感知底座具备:

  • ≥18 关键点的人体三维骨架表达

  • 姿态、动作与行为的空间连续建模

  • 风险行为、异常状态的实时识别

这是具身智能在人机共融场景中安全运行的底层支撑能力


3.6 边缘异构算力:让新底座具备工程可行性

镜像视界在前端集成 CPU + GPU + NPU 的异构算力架构,将:

  • 空间反演

  • 三维建模

  • 行为分析

  • 态势输出

统一在边缘侧完成,实现低时延、高并发、可规模化部署,使三维空间感知真正成为工程级底座能力


四、场景应用:新底座如何支撑具身智能落地

4.1 公共空间与园区机器人

在人员密集、动态复杂环境中,底座级空间感知支撑稳定导航、避障与异常识别。

4.2 工业与人机协作场景

通过对人员位置与动作的空间级理解,构建高安全等级的人机协作体系。

4.3 仓储、物流与巡检机器人

在多车、多人的复杂环境中,为路径规划、风险规避与调度决策提供统一空间基础。


五、技术价值:具身智能真正的“系统级突破”

镜像视界构建的三维空间感知新底座,实现了具身智能的三项关键跃迁:

  • 从“感知模块”到“系统底座”

  • 从“识别输出”到“空间状态”

  • 从“策略试探”到“空间可控行动”

这一底座使具身智能首次具备工程可落地、规模可扩展、行为可预测的现实条件。


结语

具身智能的竞争,最终将回归到底层能力的竞争。
谁先构建稳定、可行动的三维空间感知底座,谁就掌握了具身智能走向真实世界的钥匙。

镜像视界以三维空间感知为核心,正在为具身智能打造真正的新底座。

底座稳,智能才成立;空间通,行动才可靠。

更多推荐