解码“杭州AI六小龙”首个IPO:群核科技的“物理正确”含金量几何

摸着石头过河

DeepSeek的异军突起之际,“杭州AI六小龙”持续出圈。

如今,“杭州AI六小龙”中首个IPO项目已然问世——日前,Manycore Tech Inc.(下称“群核科技”)向港交所递交了IPO申请。

作为全球最大空间设计平台,群核科技主要为家装等行业客户提供设计生成等服务,并通过酷家乐、Coohom等软件向用户收取订阅费。

群核科技的业绩已经初具规模,2023年收入达到6.64亿元。

整体来看,群核科技的重要护城河在于庞大且物理正确的数据集,这可以有力地支撑其所开发的平台SpatialVerse,用于训练具身智能等在虚拟环境中的认知能力,降低真实世界训练成本。

但用于实时演算的游戏开发引擎同样可以达到物理正确效果,例如虚幻4引擎可以实现游戏中摆锤之间力的相互作用等。

经过信风(ID:TradeWind01)多方调研,二者仍存在较大的差异。

例如虚幻4引擎更侧重于视觉意义的拟真效果,游戏场景下形成的数据落地到现实中存在不符合人类现实需求的情况。而拥有高质量数据积淀的SpatialVerse可以更好地支撑机器人等展开仿真环境训练。

但不可忽略的因素是,随着DeepSeek为代表强化学习方法论的渗透,未来的拟真训练对于高质量数据的依赖度是否会降低,仍具有不确定性。

新兴行业的发展充满着未知与变数,群核科技未来商业化前景,备受瞩目。

已落地的商业

头顶“杭州AI六小龙”光环,冲刺IPO群核科技吸引着市场的目光。

其实早在2021年6月,群核科技就曾赴美上市,但最终选择终止。

“关于关键时间的市场状况及投资者情绪,我们已终止拟议美国上市的申请。”群核科技解释称。

乘着DeepSeek的东风,此番冲刺港股市场的群核科技所面临的市场环境似乎已有所好转。

群核科技的MANYCORE解決方案是以GPU集群为基础,以多模态AI模型、GPU渲染和参数化模型为技术引擎,为用户提供从设计、可视化、实施和协作的服务,主要应用于空间设计。

以GPU集群为基础,通过AI赋能空间设计在市场间仍较为少见,群核科技此番IPO亦被视为未来“全球空间智能第一股”的存在。

具体来看,设计功能的数据库涵盖数亿个3D模型和几乎所有空间设计元素,例如家具、电线、管道、照明、墙壁、天花板和装饰配件等。

在该平台,用户只需将CAD图纸等放进平台上即可开始设计,自动生成设计方案;

可视化则是向用户提供具有高度现实效果的即时渲染,使用户可以在修改设计时查看渲染效果;

实施则是指将设计方案转化为全面、准确且可兼容的数据集,以备进行制造工作;

协作是将设计项目时支持在线共享编辑等。

2024年,群核科技的平台平均月活跃访客数为0.86亿名,平均月活跃用户数达到了0.03亿名,每天处理数百万次渲染及数十亿次应用程序编程接口(API)调用。

目前群核科技已经初步实现了商业化,主要通过向用户收取软件订阅费创收。

2022年、2023年、2024年前三季度分别创收4.9亿元、5.63亿元和4.64亿元,占比均在8成以上。

同期,平均每名企业客户的订阅费为1.48万元、1.37万元和1.36万元,同期净收入留存率分别可达到112.3%、106%和104.2%。

发端于地产

在规模化的收入和较高的客户留存率同时,群核科技已经表现出较高的毛利率。2022年、2023年和2024年前三季度分别达到72.7%、76.8%和80.4%。

当前高毛利率的背后,不可忽视的是群核科技的主要业务场景大多聚焦于室内设计领域,这导致其主要客户源自房地产的上下游企业。

“我们的客户涵盖整个设计及可视化价值链,主要包括设计师、室内设计及建筑公司、家具制造商和零售商、定制家具生产商、房地产开发商及空间设计材料提供商。”群核科技指出。

通俗理解,设计师等可以通过群核科技所提供的MANYCORE解決方案更高效、逼真地渲染生成设计方案。

高毛利现象,在类似的3D设计企业中也并不鲜见。

作为同样面向企业提供三维设计软件服务的企业Autodesk,2022财年到2024财年Autodesk毛利率均在90%以上。

但Autodesk与群核科技在业务形态上也存在区别。

Autodesk主要以传统的CAD等软件为核心,结合AI提升效率;但群核科技则借助高性能GPU集群的快速渲染生成图像,2024年已经可以在1.2秒内处理一张2K图像。

从账期来看,群核科技已在地产行业形成一定的话语权。

尽管是一项ToB端的生意,且房地产行业往往存在拖欠、拉长供应商款项的情形,但群核科技凭借软件订阅服务却实现了对资金的预收,并计入“递延收入”,随着服务的完成再进行确认。

截至2024年9月末,群核科技的递延收入达到5.72亿元。

不过持续的研发投入,导致群核科技仍处于亏损状态。

2022年、2023年、2024年前三季度的研发开支分别为4.38亿元、3.91亿元和2.63亿元,占收入的比例分别为73%、58.89%和47.56%。

2022年至2024年第三季度末累计净亏损额为17.72亿元。

稀缺的数据

让群核科技IPO备受市场关注的,并不是当下贡献主要收入的地产相关业务,而是其所坐拥的智能空间数据集的资源禀赋,以及AI浪潮下所带来的想象空间。

群核科技针对下一代室内环境AI开发的SpatialVerse拥有庞大且物理正确的数据集库,使开发者能够在虚拟环境中训练AIGC模型,增强智能机器人、AR/VR系统及具身人工智能的认知能力。

“所谓物理正确,就是符合物理世界的真实规律,包括对光的模拟、材料的性质(比如金属的光泽、布料的柔软度等)、物体之间的物理交互(碰撞、摩擦力等)、几何与空间的关系。”北京一位大厂AI工程师向信风(ID:TradeWind01)解释称。

发展理解物理世界的AI,已然成为行业共识。

去年10月,黄仁勋就曾经指出:“我们未来要做的,是物理AI,教会AI物理法则,理解物理定律。”

今年1月,英伟达推出的首个Nvidia Cosmos平台,核心是世界基础模型(World Foundation Models, WFM),旨在通过生成逼真的物理感知视频等,加速机器人和自动驾驶汽车等物理 AI 系统的开发。

Cosmos的理想状态之一就是AI可以理解现实世界的环境情况。例如未来Cosmos通过摄像头看到“桌子旁有一群人在看书”后,就可以输出对画面的语言描述。

这离不开大量数据的积累。

以Cosmos为例,其正是基于2000万小时的真实世界数据进行训练,涵盖了自动驾驶、机器人开发、合成环境等多个领域的数据。

群核科技的SpatialVerse积累了海量的三维数据。

创始人黄晓煌接受采访时曾指出其有3.2亿个3D模型、不计其数的物理正确的三维场景、月活接近8000万,服务了200多个国家和地区的数据。

“这种物理正确数据集库应该是通过渲染引擎仿真出来的,虽然数据不来自线下真实世界采集,但建立在无数个物理正确的场景下,符合物理规律,这也是重要的优势。”上海一位AI领域投资人向信风(ID:TradeWind01)解释称。

算力、算法和数据是AI的三驾马车。前两者相关公司较为丰富,但目前市场鲜有以数据为核心卖点的热门公司。

上海一位科技行业投资人士向信风(ID:TradeWind01)表示,目前群核科技的数据仍主要集中在室内场景中。

基于高质量数据集,群核科技的AI平台可以高效地读取CAD等各种格式的图纸,并将其转换为3D设计方案,内置参数模型还能即时生成工程图和材料清单。

“真实”的价值

SpatialVerse对光、材料性质、物体交互等现实环境细节的仿真,仍然可能有不少挑战者出现。

例如常见用于实时演算的游戏开发引擎,同样可以在一定程度上实现模型数据的物理正确。

当下最典型的,莫过于由Epic Games开发,并集成了PhysX物理引擎的虚幻4引擎(Unreal Engine 4),其形成的3D数据,在特定参数条件下同样可以模拟现实世界的物理规则,包括物体的真实物理碰撞、布料等柔软物体的摆动等效果。

但信风(ID:TradeWind01)多方调研发现,致力于物理真实的空间模拟与侧重于游戏开发的物理引擎在AI训练领域存在显著差异。

一般来说,虚幻4引擎主要为游戏场景服务,所考虑的视觉效果与现实世界存在较大的差异。

“虚幻4(Unreal Engine 4)的物理引擎是为游戏等娱乐领域的渲染引擎服务,可以做到视觉逼真,但不一定能达到物理正确。SpatialVerse不是渲染引擎,是基于群核科技本身渲染引擎和过程中沉淀的数据,来为具身智能等提供数据训练服务,核心是正确的模拟物理世界。”上海一家中小互联网公司的AI工程师向信风(ID:TradeWind01)解释称。

该人士进一步举例,游戏地图和现实生活环境存在较大的差异。

例如衣柜把手放置位置、物体的纹理、开关与地面的距离、家具的力学支撑基础等各种三维空间数据的差异,都有可能成为机器人的训练关键。

虚幻4引擎的游戏应用场景所产生的数据更多服务于视觉意义上的拟真,但应用于现实世界会存在大小、质量等不符合生活、工业等场景的具体参数限制。

图源:信风结合AI工具制作

“Sim2Real”的星辰大海

近年来,大模型的涌现式发展,正在提高AI在各领域的渗透效率,而自动驾驶、人形机器人为代表的具身智能的发展,正在迎来历史性的发展“奇点”。

在AI训练领域,打造具身智能最主要训练方向正是Sim2Real(Simulation-to-Real)。

即通过与现实环境相似的仿真虚拟环境训练,将具身智能在虚拟环境中学到的技术迁移至现实环境,是被业内视为是最有可能且更高高效、低成本实现具身智能的路径。

例如英伟达所开发的Isaac Sim,正是实现Sim2Real技术的重要工具和平台。

通过Isaac Sim平台,开发者可以在虚拟环境中进行大规模的机器人训练和算法验证,从而减少在现实世界中进行昂贵且耗时的实验。

算法、平台等要素基本一应俱全,但通过Sim2Real的技术能否发展具身智能的一大关键,还在于需要拟真与现实世界近乎一致的训练数据。

正是这个痛点,让群核科技与SpatialVerse站在了具身智能的风口之上。

招股书显示,SpatialVerse通过与Isaac Sim的OpenUSD框架连接,可实现高保真的渲染效果。

“还是有很多畅想的空间。例如当前家电行业正在朝着智能化方向发展,自动扫地机器人等等都是需要类似SpatialVerse的产品来进行虚拟环境训练,可以对于障碍物有更好的识别等;还有工业场景下,训练生产线上的自动机器人等。”深圳一位科技行业投资人士指出。

目前群核科技已经与智元机器人展开合作,后者正在采用SpatialVerse作为机器人训练数据的平台。

不过随着具身智能算法维度对进一步进化,是否有可能弥补、减少对于高质量数据的依赖,未来可能也会成为群核科技为代表的高质量数据企业所需直面的风险。

在大模型领域,算法优化来减少高质量数据依赖已经成为可能。

去年以来,火爆全球的DeepSeek,正是通过强化学习的方法论,降低了高质量标注的成本。

再如2024年11月,来自英伟达、卡内基梅隆大学和加州大学伯克利分校的全华人团队所推出的HOVER(Humanoid Versatile Controller),是一款仅需1.5M参数的小型模型,其模拟人类的“潜意识”,可以在面对不同的运动任务时,有效协调身体各部分的运动。

该模型的核心是,全身运动模仿可以作为所有这些任务的常见抽象,并为学习多种全身控制模式提供通用运动技能,而无需对每个控制模式进行再培训,进而降低对数据的要求。

但无论如何,“Sim2Real”的星辰大海,确实正迎来更多中国选手。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
相关文章