
01|空间智能。
过去十年,AI 的核心突破主要发生在“语言”和“图像”。真正决定 AI 能否进入现实世界的,是它能否理解三维空间,持续建模环境,并在其中做出决策。从学术到工程,全球都在向这一方向收敛:AI 正在走向“在真实空间中预测变化、规划行动”。
继「认知与心理技术平台底座」聚焦人的认知与心理状态建模、「脑与运动平衡平台」打通意图到动作的多模态执行中枢之后,夏禹空间智能平台要回答的问题是:当人与这些智能外设共同与真实世界互动时,如何以“人”为参照物,在统一三维座标系下连接外部机器人、人体内部的内窥 / 超声设备以及 AR 眼镜等虚实交互终端,完成从标定、感知、计算到执行与反馈的空间闭环。
02|构建下一代AI空间底座:空间智能平台。
在这样的技术演进背景下,夏禹空间智能平台要解决的是:如何把真实世界转化为可计算、可调用的三维空间底座。
概括来说,夏禹的空间智能平台围绕三项核心能力展开:
• 统一座标体系将结构光、RGB阵列等视觉传感器、以及IMU运动传感器的数据,与 CT、MRI、超声、内窥等多源医学影像,映射到同一个三维座标系中,为配准与计算提供共同的“空间语言”。
• 世界模型式空间地图在这一座标系内,持续构建和更新空间地图,让“内部影像世界”和“外部物理世界”在几何与语义上准确对齐。
• 平台化输出能力通过标准化接口,将上述空间能力开放给协作机器人、手术导航、内窥系统、AR 眼镜等终端,使不同设备在同一张三维世界上协同工作。
因此,夏禹空间智能平台的本质,是一个面向未来的空间能力中枢:为所有需要在三维空间中做决策的系统,提供一张被持续重建、被智能理解、可以被反复调用的空间底图。
03|机器人与虚实融合应用。
基于上述空间能力中枢,夏禹空间智能平台可落地在“机器人 + 虚实融合”的三类场景中。
1.现实空间中的机器人:在同一张三维地图上行动
在真实世界里,医疗机器人、室内服务机器人、巡检机器人,都面临同一个问题:不仅要知道“前方有什么”,还要知道“我此刻在空间中的哪儿”。基于统一的三维座标系和世界模型,夏禹空间智能平台为机器人提供:
• 稳定的空间定位与姿态解算;• 基于真实几何的路径规划与安全边界;• 面向医疗场景的禁入区域、关键解剖结构与风险区域标注。
机器人不再只是“按指令移动的机械臂”,而是在一张被持续更新的三维地图上,做出有约束、有边界的行动决策。
2.虚拟空间中的数字孪生与仿真机器人
在虚拟世界中,我们用同一套空间智能能力,构建真实场景的数字孪生:
• 将结构光、RGB 阵列等空间感知传感器数据,与CT、MRI、超声、内窥等医学影像数据一并映射到虚拟环境中,重建手术间、患者解剖与设备布局;• 在仿真环境中部署“虚拟机器人”,进行手术路径推演、操作训练、算法调参与安全性验证。
对于医生,这是一个可以反复演练的虚拟手术室;对于工程师,这是一个可以快速迭代策略和算法的试验场。
3.虚实一体:从仿真到落地的闭环
夏禹空间智能平台的关键,不只是“有虚、有实”,而是让两者共享同一套世界模型:
• 在虚拟空间中,机器人先基于数字孪生场景完成学习、规划与验证;• 通过统一的座标体系和接口,将验证过的路径与策略,迁移到真实机器人上执行;• 真实手术 / 运行过程中的数据,再反向写入虚拟世界,更新数字孪生模型和算法。
这样,机器人应用形成了一个完整的闭环:在虚拟世界里学习,在真实世界里执行,再回到虚拟世界中迭代。在医疗机器人之外,空间智能平台同样面向精密工业与服务机器人应用:在局部精密装配与检测场景中,追求接近微米级/ 亚毫米级的几何精度;在大范围工业与生活场景中,则提供稳定的毫米级全局重建与导航能力,加速机器人系统从工厂走向真实生活空间。
04|医疗级空间智能。
在所有机器人与虚实融合应用中,医疗机器人与手术场景,是对空间智能要求最高、也是夏禹最优先落地的主战场。在医疗领域,空间智能是直接决定手术安全与疗效的系统能力,对应的空间重建精度,也必须实现从病灶级微米量级到术野级毫米量级的全尺度覆蓋。这其中的难点在于:如何让体内影像世界与体外物理世界,对齐到同一个三维座标系中。
过去,医生面对的是 CT、超声、内窥图像等二维 / 三维影像,而病灶实际存在于复杂的三维组织结构里;医疗机器人可以精准执行动作,但并不真正“理解”自己此刻在患者身体中的位置;内窥系统提供高清画面,却难以直接对应到真实空间的几何关系。
夏禹的空间智能平台,首先在医疗级场景中落地,聚焦三类核心应用:医疗机器人、超声 / 内窥系统与 AI 手术导航,并通过结构光将“内部影像座标系”和“外部机器人 / 患者座标系”统一到同一张三维世界模型中。
1.医疗机器人:从执行精度到座标对齐
在颅脑等高风险手术中,术前 CT 提供的是脑部内部结构的三维体数据,它有自己独立的“影像座标系”;而手术机器人运行在手术间的“物理座标系”中,患者头位、头架固定方式、机器人基座位置,都与 CT 扫描当时的姿态不同。夏禹的空间智能平台,以结构光为基准,对患者头部外形进行高精度 3D 扫描,重建实时的外表面几何;再将这一路径与 CT 中的头骨 / 皮层表面进行配准,把“CT 空间”精确映射到“机器人空间”。
对医生而言,CT 里标注的病灶点,不再只是屏幕上的一个座标,而是机器人在现实空间中可以被准确抵达的目标。机器人不再只是“照指令移动”,而是基于统一的三维座标系进行路径规划、避障与安全边界判断。
2.超声 / 内窥系统:从画面观察到三维定位
在超声和腔镜场景中,超声图像和内窥画面同样有各自的影像座标系:
• 超声只给出某一切面上血管、器官的灰度分布;• 内窥镜呈现的是沿腔道前进过程中的局部视野。
关键问题在于:这些图像在患者身体的真实三维座标系中“对应哪里”?
夏禹通过结构光,对皮肤 / 腔体表面及超声探头、内窥镜位置进行三维建模,实时解算探头与人体表面的姿态;结合事先完成的几何标定,我们把超声每一帧图像、内窥每一段画面,都锚定到统一的三维座标系中:
• 血管分布不再只是黑白图像,而是在三维空间中具有具体位置的“目标网络”;• 腔道路径不再只是视觉记忆,而是可被重建、可被导航的空间通路。
这让穿刺、介入、微创手术可以在真实三维空间中进行精确进针与靶向抵达,而不是仅凭经验在二维影像上“估计”。
3.AI 手术导航:从显示工具到决策系统
在统一的三维世界模型上,AI 手术导航不再只是“显示影像 + 提示方向”的工具,而是一个实时决策引擎:
• 将 CT / MRI / 超声 / 内窥等多模态影像,与结构光重建的外部空间持续对齐;• 随着手术推进,动态更新器械位置、组织形变与潜在风险区域;• 为医生与机器人提供路径规划、风险预警、禁入区域提示等高价值决策信息。
空间智能,让医学第一次真正回到“有座标、有结构、有约束”的真实三维世界中:医生看到的是一整套可推理、可执行的手术空间系统。
05|技术底座。
夏禹空间智能是一套从光学层 → 重建层 → 计算层 → 平台层的完整工程体系。夏禹的空间智能平台,以医疗级要求重新定义了这四层能力,尤其将结构光确立为内外座标对齐的几何基准。
1.空间采集:结构光作为几何基准与物理锚点
在最底层,是空间采集体系。夏禹以结构光为核心,结合多视角视觉,构建稳定、高精度的空间输入系统:
• 结构光提供主动测距能力,在弱光、纹理单一、组织反光等复杂条件下,依然保持高质量深度信息;• 更重要的是,在医疗场景中,结构光承担了“几何基准”的角色:同时对患者表面、手术器械、超声探头、内窥镜、甚至 AR 眼镜参考标记进行统一建模;为后续的座标系对齐、多模态配准提供一个共同的物理锚点。
多视角视觉则补足被遮挡区域与复杂几何结构,提升对手术腔体、空间狭窄区域的完整建模能力。两者协同,让手术腔体、人体表面与手术室内设备,共同落在一套可重建、可对齐、可追踪的三维几何框架之中。
2.三维建模与重建:从几何到语义,从表面到内部
在采集之上,是三维建模与重建系统。夏禹的空间智能重建系统,在不同尺度下可提供从数微米到毫米级的空间精度:在器官与手术场景中保障病灶级别的定位精度,在机器人与室内导航等场景中提供稳定的毫米级全局重建能力。
• 我们将结构光输出的深度数据与多视角图像进行融合,完成点云生成、曲面拟合与几何关系构建;• 通过鲁棒性算法处理真实医疗环境中的典型噪声:血液反光、软组织形变、镜头抖动、器械遮挡等,确保重建在长时间手术过程中的稳定性;• 在此几何框架上,引入深度学习模型进行深度补全、语义分割与器官 / 器械识别,让空间模型不仅“有形状”,还具备清晰的语义与功能标签。
更关键的是,在这一层,我们完成了内部影像与外部几何的耦合:
• 将 CT / MRI / 超声中的表面结构,与结构光重建的外部表面进行精确配准;• 让影像座标与物理座标在同一套几何模型中对齐,为后续的空间计算与导航提供统一底图。
3.空间计算:在同一世界模型中推理与决策
在已重建的三维空间中,空间计算层负责把“可视化的三维”变成“可推理的三维”:
• 完成多设备、多传感器的位姿解算与统一标定;• 建立器械与组织、器官与腔体之间的空间关系模型;• 根据手术进程进行路径规划、碰撞检测与动态安全边界计算;• 将时间维度引入空间模型,持续更新组织形变、器械移动轨迹等信息。
通过将多源传感器数据统一到同一个时空座标系中,我们不断迭代一个世界模型式的空间地图:这张地图既承载着静态解剖结构,也记录着手术过程中的动态变化,成为 AI 进行风险评估、动作预测与路径决策的基础。
4.平台化输出:跨设备、跨场景复用的空间基础设施
最上层,是平台化输出。我们将上述空间能力封装为统一接口与服务:
• 对上,支持医疗机器人、超声 / 内窥系统、AI 手术导航、AR 眼镜等多种设备快速接入;• 对下,兼容既有 PACS / HIS / EMR 等医疗信息系统,避免重复建模、重复标定与重复开发;• 对侧,通过标准化的座标与场景协议,使第三方设备与应用也能运行在同一套空间模型之上。
一句话概括夏禹的技术底座:结构光打下几何基准,重建系统连接内外世界,空间计算构建实时世界模型,平台把这套能力开放给所有需要在三维空间中做决策的医疗系统。
06|空间,下一代智能的边界。
当语言被理解,当图像被识别,最后剩下的命题只有一个:AI 是否理解它所处的世界。这个世界不是标签集合,而是在时间序列中,通过尺度、结构、路径与约束构成的真实空间。
未来所有智能系统,都将运行在统一空间模型之上。夏禹发布空间智能平台,是构建下一代智能系统的底层能力。
当空间开始被理解,智能才真正拥有世界。




