主打空间智能!“AI教母”李飞飞发布首款商用世界模型

World Labs正式发布首款商用世界模型Marble,将李飞飞提出的"空间智能"理论转化为商业产品,通过多模态输入生成可交互3D环境。该产品不仅是实现"从语言到世界"终极愿景的关键突破,更为游戏、影视等行业提供全新创作工具,推动AI从文本理解迈向物理世界交互的新纪元。

“AI教母”李飞飞的创业公司在“世界模型”赛道上迈出了关键的商业化一步。其公司World Labs正式发布首款商业产品Marble,标志着人工智能从抽象的语言文本理解,向模拟和交互物理世界的空间智能领域拓展,意图在下一代AI技术竞争中抢占先机。

11月12日,由斯坦福大学教授李飞飞联合创办的World Labs宣布,其首款由多模态世界模型驱动的产品Marble正式向公众开放。该模型能够利用文本、照片、视频或3D布局等多种输入形式,生成可编辑和下载的3D交互环境,使World Labs在与谷歌等科技巨头的竞争中取得了先发优势。

与两个月前的限量预览版相比,正式版Marble在功能上实现了重要扩展,包括支持更大规模的多模态输入,并推出了一个名为Marble Labs的创意中心。商业模式上,该产品采用免费增值与付费订阅结合的模式,旨在快速推向市场并建立用户基础。

Marble的推出,直接瞄准了游戏开发、影视特效(VFX)和虚拟现实(VR)等对3D内容有巨大需求的行业。它为创作者提供了一种全新的资产生成工具,但同时也引发了行业对AI将如何重塑创意工作流程、以及其对就业岗位潜在影响的深入讨论。

抢先商业化,在竞争中建立差异

在方兴未艾的世界模型赛道,Marble的商业化发布使其从众多研究项目和技术演示中脱颖而出。

目前,包括谷歌的Genie模型仍处于有限的研究预览阶段,而Decart和Odyssey等初创公司的产品则停留在免费演示版。据彭博社报道,Marble是该赛道首个投入商业应用的产品。其核心差异化在于,它能生成持久化、可供下载的3D环境,而非像World Labs自家的实时模型RTFM(Real-Time Foundation Model)那样在用户探索时动态生成世界。

公司表示,这种设计能显著减少场景变形和不一致性,并允许用户将成果导出为高斯泼溅(Gaussian splats)、网格(meshes)或视频等专业格式,以便整合进现有工作流。

Marble 的输入输出管道图片来源: World Labs

主打创意控制与多模态输入

为解决AI生成内容“不可控”的痛点,Marble将“创意控制权”作为产品核心。World Labs联合创始人Justin Johnson在接受TechCrunch采访时表示:“我们不希望机器完全接管,剥夺创作者的创造力。”

为此,Marble在输入和编辑两端都提供了高度灵活性。

  • 输入端:正式版支持用户上传多张图片或短视频,从不同角度展示一个空间,从而生成更逼真的数字孪生体。这解决了预览版仅支持单张图片输入时,模型需自行“想象”大量细节的局限。
  • 编辑端:产品推出了名为“Chisel”的实验性3D编辑器。该功能允许用户先搭建粗略的空间结构(如墙壁、方块),再通过文本提示填充视觉风格,实现了结构与风格的分离。Johnson解释道:“我可以进入场景,直接抓取代表沙发的3D块并移动它。”

此外,用户还可以对已生成的世界进行“扩展”,或在“作曲家模式”下将多个独立世界拼接成一个更大的空间,进一步增强了创作的自由度。

使用 Marble 创建的太空飞船环境,并叠加了文字提示(请注意灯光是如何真实地反射在枢纽墙壁上的)。
图片来源: World Labs/TechCrunch

商业模式明确,瞄准三大应用场景

Marble的商业路径清晰,通过分层订阅满足不同用户需求。其订阅方案共分四档:免费版提供每月4次生成;标准版(20美元/月)和专业版(35美元/月)提供更多生成次数与高级功能;而旗舰版(95美元/月)则解锁全部功能,并包含75次生成及商业使用权。

短期内,World Labs将目标市场锁定在三大领域:

  • 游戏开发:Johnson认为,开发者可使用Marble生成背景环境和氛围空间,再将这些资产导入Unity或Unreal等游戏引擎进行后续开发,作为现有管线的补充而非替代。
  • 影视特效:相较于AI视频生成器,Marble生成的3D资产为艺术家提供了精确的场景控制和运镜能力,避免了画面不一致的问题。
  • 虚拟现实(VR):尽管VR并非当前首要重点,但Johnson指出,该行业对高质量内容“极度渴求”。Marble生成的所有世界均已兼容Vision Pro和Quest 3等主流头显设备。

然而,市场对该技术的接受度并非全然乐观。根据游戏开发者大会(GDC)最近的一项调查,三分之一的受访者认为生成式AI对游戏行业有负面影响,担忧主要集中在知识产权、内容质量下降等方面。

李飞飞的终极愿景:迈向“空间智能”

在Marble发布的背后,是李飞飞对AI未来发展的宏大构想——实现“空间智能”(Spatial Intelligence)。

李飞飞在近期发表的一篇文章中阐述,当前的大语言模型虽擅长处理抽象知识,但缺乏对物理世界的真实理解,如同“在黑暗中行走”。她认为,赋予机器理解、导航并与三维世界交互的能力,即空间智能,将是实现真正通用人工智能的关键。而世界模型,正是通往这一目标的核心技术。

根据她的设想,具备空间智能的世界模型将分阶段变革多个行业:

  • 短期:赋能创意产业,为电影、游戏和建筑领域的创作者提供强大工具。
  • 中期:推动具身智能机器人发展,通过在模拟环境中进行大规模训练,使其成为人类的协作伙伴。
  • 长期:在科学、医疗和教育等领域引发革命,通过模拟实验、辅助诊断等方式增强人类专家的能力。

“若没有空间智能,我们对真正智能机器的梦想将是不完整的,”李飞飞写道。这一愿景获得了资本市场的有力支持。World Labs自2024年创立以来,已迅速完成约2.3亿美元融资,估值突破10亿美元,跻身“独角兽”行列。其投资方包括a16z、英伟达NVentures、AMD Ventures和Intel Capital等行业巨头与顶级风投机构。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
相关文章