首份空间智能研究报告来了!一文全面获得空间智能认知、要素、玩家图谱

2025-04-26ASPCMS社区 - fjmyhfvclm

分析师 Xuanhao

量子位智库 | 公众号 AI123All

AI的未来,绝不仅限于聊天机器人和数字世界。

物理世界的AI推进,已经开始。而且定义正在被包括李飞飞在内的大牛明确——

️空间智能

空间智能是什么?包含哪些应用领域?如何系统性地看待空间智能?随着技术的不断进步,虚实融合边界持续消融,空间智能的阶段性成果、当前的认知和格局,正在愈发清晰。

在大量桌面研究、调研访问、数据分析之后,为了更好把握空间智能现状和未来发展方向,量子位智库在️《空间智能研究报告》(以下简称《报告》)中回答如上问题,同时系统性梳理了各应用领域重要玩家,并对产业迭代影响要素作出研判。

这也是 国内首份明确以空间智能为对象,提供空间智能产业图谱的报告。

首份空间智能研究报告和产业玩家图谱

《报告》认为,️空间智能是主要基于3D视觉信息进行理解、推理、生成、交互的AI系统

aspcms.cn

以具体应用领域划分,按不同的成熟度,空间智能可分为以下三种应用领域:

  • 自动驾驶

  • 3D生成

  • 具身智能

自动驾驶

3D生成

具身智能

此外, 扩展现实(XR,Xtended Reality)是空间智能的原生交互方式,而准确的世界模型是空间智能发展的终局状态。

根据上面的应用领域划分,结合目前的格局、发展等多方要素,量子位智库在《报告》中详细梳理了当下全球空间智能玩家的首份图谱:

重点关注数据体系的成熟度

针对空间智能的不同应用领域,可以从数据成熟度、算法成熟度、算力支撑、普及便捷度、经济性等维度进行观察。

综合不同维度来看, 三个应用领域中自动驾驶成熟度最高,3D生成位居其次,最后是具身智能。

其中 最值得重点关注的是「数据体系的成熟度」这一维度。

对比得出,相比语言、图片和视频等,空间智能现存的数据规模更少。这就可以解释为什么空间智能的成熟度更低——尤其具身智能,高质量的真机数据数量稀少。

文字、图片及视频等数据的成熟支撑了以大语言模型为核心的AI浪潮爆发,《报告》认为,未来待3D、物理AI相关数据成熟后,空间智能也将迎来爆发时刻。

作为观察空间智能进展最重要的维度,除上述数据积累规模外,数据体系成熟度具体还包括数据构成精简度、数据分布多样性以及数据闭环成熟度4个部分。

️数据构成精简度主要指该领域数据模态、数据类型的复杂度,例如具身智能需要融合多种传感器数据,成熟度更低、更复杂;️数据分布多样性主要指该领域数据分布是否足够丰富以支持模型的泛化;️数据闭环成熟度主要指能否构建数据飞轮的正反馈加速模型迭代。

自动驾驶领域已出现Scaling Law

《报告》表示,️自动驾驶是空间智能目前规模最大、最成熟的应用,已经接近人类水平。

其技术前沿开始从模仿学习转向强化学习,以保持性能增长。

目前,自动驾驶领域️已经出现属于空间智能的Scaling Law:可接管里程随底层算力扩展和强化学习新进展快速增加。

数据显示,2026年以后,当背后算力支持超过百万卡集群时,预计自动驾驶水准将超过人类驾驶水准。

在空间智能的三大具体应用赛道,自动驾驶的数据体系目前最为成熟。

  • 从 数据积累规模来看,驾驶里程积累在百亿英里级别;

  • 从 数据构成精简度上来看,目前主要以视觉信息为核心,辅以激光雷达等少量信息;

  • 从 数据分布多样性来看,可以覆盖多样的驾驶场景 (受益于发达的道路交通系统);

  • 从 数据闭环来看,自动驾驶构建了规模最大、最成熟的空间智能数据闭环。

从 数据积累规模来看,驾驶里程积累在百亿英里级别;

从 数据构成精简度上来看,目前主要以视觉信息为核心,辅以激光雷达等少量信息;

从 数据分布多样性来看,可以覆盖多样的驾驶场景 (受益于发达的道路交通系统);

从 数据闭环来看,自动驾驶构建了规模最大、最成熟的空间智能数据闭环。

3D生成已有千万级别数据积累

3D生成是数字世界的空间智能,由图形学和AI共同驱动,️处于技术快速进步阶段

当前,3D生成的最大瓶颈是难以找到具有良好扩展性的3D数据表征。

️数据积累规模来看,3D生成有千万级别的数据积累,足以支撑可以商业化的产品;从️数据构成上看,目前有多种数据表示形式,较复杂,技术方向尚未收敛;从️数据分布多样性来看,可以覆盖3D资产生成的大部分应用场景;从️数据闭环来看,尚未形成闭环模式。

具身智能整体成熟度尚且较低

《报告》认为,️可以和物理世界深度交互的具身智能,是空间智能未来规模最大的应用

但就目前而言,具身智能整体成熟度较低,不过头部玩家即将开始生产环境实验。

️数据积累规模来看,需要厂商从零做起采集真机数据,存量积累规模小;从️数据构成精简度来看,具身智能涉及多种数据模态的融合,十分复杂,且面临跨本体的泛化性问题;从️数据分布多样性来看,目前真机数据的分布也较为单一,以常见的运动和抓取场景为主;从️数据闭环成熟度来看,机器人落地应用较为早期,尚未构建有效的数据飞轮

XR可实现3D类内容的原生消费

扩展现实(XR)的硬件基础正在成熟,可实现3D类内容的原生消费,未来随着3D原生内容和相关应用生态的成熟,将打开更大的市场。

XR是目前训练具身智能的关键数据采集方式,可以加速真机数据增长推动空间智能发展。英伟达、特斯拉、Meta等领先机构已有相关探索实践。

精确完备的世界模型是空间智能发展的终局状态

️世界模型是从大量数据中构建理解世界运作方式的内部表征,可以推理行动后果预测未来,精确完备的世界模型是空间智能发展的终局状态

《报告》认为世界模型可以通过各种技术路径逼近,但不同路径的精度和效率各异。

其中,侧重3D和物理AI的空间智能,可能是建模真实世界的最佳方式。

全部评论