什么是 EST(具身空间理论)?

EST(Embodied Space Theory,具身空间理论)是 EICPS 的理论原创贡献,也是整个框架的本体论基础——它回答的问题是:用什么几何语言来描述一个具身智能体的状态?

为什么需要新的几何语言

经典机器人学用关节角 qRnq \in \mathbb{R}^n 描述状态,控制论用状态向量 xRnx \in \mathbb{R}^n,语言模型用 token 嵌入向量。这三套语言互不相容——“机械臂抬高 30°“和”把螺栓拧紧”活在两个不同的数学空间里,它们之间如何转换、耦合程度如何、什么时候会失控,没有统一的形式化描述。

EST 的出发点是:具身智能体在同一时刻同时生活在三种性质根本不同的空间里,需要一个能把它们统一起来的几何框架。

三流形乘积空间

EST 的核心定义:

M=Msem×Mphy×Mlat\mathcal{M} = \mathcal{M}_{sem} \times \mathcal{M}_{phy} \times \mathcal{M}_{lat}

三个流形各有其角色:

  • Msem\mathcal{M}_{sem}(语义流形):承载自然语言指令、任务意图、VLA 输出——“高层含义”的数学居所
  • Mphy\mathcal{M}_{phy}(物理流形):承载关节位姿 SE(3)、力矩、速度——机器人与物理世界接触的数学居所
  • Mlat\mathcal{M}_{lat}(隐流形):承载环境状态、人的意图估计等不可直接观测量——传感器感知不到、但对行为有影响的隐变量

“乘积”不是随意拼凑,而是说三个流形在几何上独立演化,但通过算子相互耦合——这个耦合关系本身就是 EICPS 要设计和控制的核心对象。

四个原创概念

具身变换算子 ET

ET:MsemTxMphy\text{ET}: \mathcal{M}_{sem} \to T_x\mathcal{M}_{phy}

ET 算子将语义意图(“靠近螺栓”、“施加夹紧力”)投影到物理流形的切空间(关节速度方向),量化了语义指令如何转化为物理运动。这就是接口 A 的数学本质——Brain 层的 VLA 输出经 ET 算子投影后,才能进入 Spine 层的控制律。没有 ET,语义意图和物理执行之间的转换是隐式的、不可形式化验证的。

结构谱 Σ

Σ(x)={λi(x)}\Sigma(x) = \{\lambda_i(x)\}

通过分析系统 Jacobian 的特征值分布,刻画具身系统在当前构型 xx 下的局部可控性。λi0\lambda_i \to 0 意味着该方向趋于奇异——机械臂接近奇异构型、系统失去部分自由度。结构谱把”快要失控”变成一个可以实时监控的数字,是 EICPS 诊断奇异构型的数学基础。

Flow-Jump 动力学

x˙F(x,u)(连续执行)x+G(x)(离散切换)\dot{x} \in F(x, u) \quad \text{(连续执行)} \qquad x^+ \in G(x) \quad \text{(离散切换)}

用混合系统语言重新诠释具身执行:机器人大多数时候沿连续轨迹运动(Flow),偶尔发生模态突变(Jump)——任务切换、安全触发、人工接管。这个框架把”突发事件”纳入正式数学描述,而不是作为异常处理。STL 可以覆盖 Jump 触发条件,CBF 在 Flow 过程中持续保证安全集不逸出。

三流形的时间尺度对应

Msem\mathcal{M}_{sem} 演化慢(秒级)、Mphy\mathcal{M}_{phy} 演化快(毫秒级)、Mlat\mathcal{M}_{lat} 介于两者之间。这个时间尺度分离不是设计选择,是物理约束——它直接推导出 EICPS 的三层架构为什么必须是三层,而不是两层或一层。

EST 与 EICPS 的关系

EST 是本体论(用什么语言描述世界),EICPS 是方法论(用什么工具解决问题)。

没有 EST,七项工程选型就是七个孤立工具的堆砌,不知道它们在同一个几何空间里处于什么位置;有了 EST,SE(3) 是 Mphy\mathcal{M}_{phy} 的坐标系,HTN 在 Msem\mathcal{M}_{sem} 上做分解,CBF 在 TxMphyT_x\mathcal{M}_{phy} 的切空间里画安全边界——每个工具都找到了自己在几何图景中的位置。

EST 的四个原创概念(三流形乘积空间、ET 算子、结构谱、Flow-Jump 动力学)在现有机器人学、控制论文献中没有直接对应,是本书的理论原创点,与七项工程选型的性质完全不同。

→ 数学讲义主线 A 是 EST 的系统性展开:第一讲:流形是什么 · 第七讲:EICPS 完整数学图谱