最近,在硅谷火爆数月的AI新概念“空间智能”有了最新进展:World Labs推出一个AI系统,仅凭1张图,就能生成一个可交互的3D世界。用户能够像玩一样,自由地移动,探索这个3D世界。
让人惊叹的是,之前大多数生成模型预测的是像素,而这个AI系统直接预测3D场景。这些生成的场景在用户移开视线再回来时不会发生变化,并且遵循基本的3D几何物理规则。此番首秀在业内掀起巨浪,官方则表示“这仅仅是3D原生生成AI未来的一个缩影”。
那么,究竟什么是空间智能?它为何如此重要?又将如何改变我们的未来?
这一新概念由“AI教母”、斯坦福大学教授李飞飞提出。在温哥华举行的2024年TED大会上,她发表了题为《有了空间智能,AI将会理解现实世界》的演讲,将空间智能描述为AI发展的下一个重要里程碑。“看见世界远远不够。”李飞飞说,“行动的冲动是所有具有空间智能的生物的天性。”
李飞飞将空间智能的出现比作生物进化史上的寒武纪大爆发。李飞飞的这番话揭示了空间智能的核心目标——不仅要让AI能够“看见”世界,还要让它能够理解三维空间,并在其中进行互动和学习,这是从单纯的视觉识别到真正理解、操作现实世界的跨越。
如今,我们似乎正站在数字世界的类似转折点上。空间智能可能成为推动AI突破当前能力限制的关键。正如视觉能力催生了生物智能,空间智能或许将引领AI进入一个全新的发展阶段,但必须让人看到落到实处的可能。
除了首次亮相的“图生3D世界”系统,空间智能的潜在应用范围很广。在医疗领域,李飞飞的团队正在开发能够检测医务人员洗手情况、跟踪手术器械、预防患者跌倒的智能系统,甚至能够通过脑机接口帮助瘫痪患者完成日常任务。
在领域,空间智能也有望带来革命性变化。乐聚创始人兼董事长冷晓琨告诉记者:“空间智能更接近于人的认知方式……这是一个必然的发展趋势。”
数字华夏CEO沈健则指出了空间智能与现有AI技术的本质区别:“现在的通用大模型主要处理文本、语音、图片、视频这四类数据。但需要理解空间坐标,需要知道自己在哪里,如何移动和抓取物体。这就是空间智能的概念。”他告诉记者,国内在做的极客们已经在尝试开发空间智能了。
空间智能的前景确实令人兴奋,但能够走到哪一步还是个问题。开发真正的空间智能系统还需要突破种种技术难关,例如,要让AI在复杂、动态的环境中进行实时决策。