“杭州AI六小龙”群核科技CEO访谈:物理AI只是新时代刚开始,创业是先造锤子,再改变世界

物理AI只是一个新时代刚开始。未来的世界,包括家里、办公环境,工厂全是具身机器人或者人形机器人;创业是拿着锤子找钉子,但你要先把锤子造出来;只有中国能沉淀这些数字资产,美国它没有这么庞大的工业体系,全世界可能找不到第二个国家有这么庞大的规模。这规模大到他靠人工去生产不行,而得靠无人工厂自动去生产。

在杭州未来科技城的一隅,一家从阁楼里成长起来的科技公司,正以 “数字孪生 + 物理 AI” 为画笔,勾勒着全球机器人产业的新图景。它是群核科技 —— 被誉为 “杭州六小龙” 之一的空间智能领域隐形冠军。

公司联合创始人兼董事长黄晓煌日前接受央视《面对面》节目的深度采访,透露他从 “拿着锤子找钉子” 到 “定义空间智能基础设施” 的创业心路历程。

以下是对谈要点:

物理AI只是一个新时代刚开始。未来的世界,比如十年后或二十年后,设备全是智能化,包括家里、办公环境,工厂全是具身机器人或者人形机器人。

科技赛道里面,大家不是零和博弈的。大家一起合作,可能这个蛋糕会突然100倍、1000倍大。

我其实在英伟达工作的时候,他整个公司的方法论都是先把很牛的技术做出来,然后花各种成本去找应用。所以我受的熏陶也是大概这种方法论,说白了就是拿着锤子找钉子。你先把锤子造出来。

我们得判断这个赛道是有很多家,就是成千上万家在做,还是就一两家。如果就给一两个大客户服务的话,就变成做项目了。我们还是希望梦想还是做一个产品型公司,而不是项目型公司。

我把他原来这种物理正确的渲染,从原来要半小时一小时才能出一张图,变到10秒。

推动这个事情往前发展比赚多少钱更重要。我们相信有产生价值之后,未来一定赚得到钱。但是这个事情如果我们不去推动的话,全世界其他地方可能没有这个资源,那永远就卡在那边了。

(为什么你能沉淀下来找到这些数据而美国公司不行)这个是我们当时做到工业4.0时候实现的。所以这就让我们在数字世界里沉淀的所有数字资产,都是跟物理世界是一一对应的,而且能够生产制造出来的。这个是是一个很重要的里程碑。

而美国它没有这么庞大的工业体系,我觉得全世界可能找不到第二个国家有这么庞大的规模。然后这规模大到他靠人工去生产不行,而得靠无人工厂自动去生产。

以下是对谈全文:

黄晓煌:
你可以看到就是这边是模拟一个地震,你要训练你的机器人在地震中不会摔跤,还能够继续工作。

董倩:
为什么要用这么极端的场景训练它呢?

黄晓煌:
因为这个场景你是不太好在物理世界里面模拟出来的,你又得确保这个机器人在地震的时候还能干活或者不会出问题。你只能在这种数字世界里面训练,然后训练完。

画外音:
浙江杭州,这个看似平凡的办公空间,隐藏着另一个世界机器人的数字训练场。这里是群核科技创业 14 年,因在空间智能领域积累了不容忽视的优势,不仅跻身杭州六小龙之列,在国际上也有着举足轻重的地位。

黄晓煌:
我们觉得这只是这个新时代刚开始。

董倩:
什么新时代?

黄晓煌:
就是物理 AI。

物理AI新时代,刚刚开始

画外音:
物理AI 可以理解为懂物理规则的人工智能。只有懂了物理规则,自主机器如机器人、自动驾驶汽车等,才能在真实的物理世界中进行感知、理解和执行复杂操作。

黄晓煌:
我说通俗一点,比如说你家里面未来买了一个机器人替你干活,他先要到你家里面摔一个几十跤,然后才能够替你干活。你怕不怕?你肯定很怕的那肯定是他需要在一个数字世界里面先把该摔的跤,犯的错误都弄完了,然后再到你家去认真干活。

董倩:
你能做什么?在这个过程中。

黄晓煌:
第一我们得帮机器人做好训练。我们就围绕着这个未来世界在做提前布局,让人跟机器看到的是同样一个东西。你现在看到的图片是…… 人看到的对对,这下面的是机器人看到的,就是颜色比较深的地方是离你比较近的,颜色比较浅的是离你比较远的地方。

画外音 :
黄晓煌作为群核科技的联合创始人兼董事长,解释物理 AI 空间智能以及如何训练机器人时,需要不断通俗一点、举例说明。在杭州六小龙爆火之前,他很少在媒体上露面,本质上他是一个技术痴迷者。

黄晓煌:
通俗一点就是未来的世界,比如十年后、20 年后,你身边的设备全是智能化,包括你家里,你的办公环境,你的工厂全是巨型机器人或者人形机器人,包括你的摄像机等等的,它是有一天都会智能化。

董倩:
什么叫摄像机的智能化?

黄晓煌:
比如说今天摄像机后面还得坐了一个同事,过两天他自己长了一个 “大脑”,自己在干活,自己在拍、在对话。

董倩:
你是要拆我的队伍?

黄晓煌:
那不会,他们可能一个人就管着十台相机,他有更高端的活要做了。

你可以想象你周围所有的设备现在可能都是死的,之后都是活的,他们在替你服务,每个机器人都需要训练,他都需要感知这个环境。他们都需要在一个共同的数字化的物理世界里面先做推演才能够协作。不然你身边有十个机器人天天 “乱干” 你也不行。

董倩:
这个和你刚才描述的这个训练有什么关系?

黄晓煌:
我们发布的 Special LM 是用来帮设备去理解你的空间。

画外音 :
相比于理解训练机器人这件事,理解群核科技的创业过程要简单很多。

董倩:
为什么?这三个词是你们的公司文化,简单、专注、开放。

黄晓煌:
这也是当时提炼出来的,主要提的简单,大家工作沟通上要简单一些,就不要搞很多官僚。然后我可能提到专注,然后陈航可能觉得就是开放,后面大家都很认可,就这个公司的 DNA 后面就一直记下来了。

画外音 :
2007 年,黄晓煌从浙江大学竺可桢学院毕业,赴美国伊利诺伊大学厄巴纳香槟分校攻读博士学位,研究方向是用GPU图形处理器做高性能计算。还没完成学业,他就加入了英伟达,主要工作是给 GPU 芯片开发并行计算的编程框架以及生态的开发。但仅仅一年后,他做出了离开英伟达的决定。

董倩:
这件事情你感兴趣吗?

黄晓煌:
那很感兴趣。

董倩:
既然很感兴趣,为什么一年就离开了?

黄晓煌:
因为当时英伟达它整个体系还是给台式机做的。

你回到十年前,你可以想象当时所有媒体都在说未来是移动的时代,然后云的时代。但是谁还会想着台式机可能笔记本都要消失了。然后我当时就跟组里老板说,为什么不做云计算,就是把 GPU 做到云端去。为什么还给台式机在做这些研究?那……

董倩:
为什么这样的一个想法英伟达没有想到呢?

黄晓煌:
我一开始也觉得很纳闷,我觉得这个公司当时股价也很低。然后我当时觉得是不是有点老套了。

董倩:
你觉得英伟达在当时是限制住了你的这个想法。对,在你决定离开的时候,你要做出多少准备你才能离开。

黄晓煌:
我其实那时候年轻气盛,也没做太多准备。

董倩:
你有什么……

黄晓煌:
当时啥都没有,就是当时可能我觉得年轻人就是那样子。有想法跟 Manager 聊完,他说公司暂时不打算往这方向做,这个云计算也不做,Mobile 也不做,那还有未来吗?那还是我自己做。

先造锤子,再改变世界

画外音:
2011 年,在主流观点中英伟达仍是一家消费电子硬件公司。尽管当时杰弗里・辛顿已经在用英伟达的 GPU 训练深度神经网络,但大多数人尚未意识到 GPU 的并行计算能力将成为未来人工智能爆发的算力基石。

在这样一个时间节点上,黄晓煌看到的是 GPU 的超级算力和云端部署相结合的潜力。

他邀请一样来自浙江大学的陈航,以及来自清华大学的朱浩共同创业。创业方向是用 GPU 做云端的图形图像快速渲染。渲染指的是通过算法将三维模型或场景转换为二维图像或视频的过程。

黄晓煌:
当时我把英伟达的股票也卖了,然后自己跟合伙人凑了几十万人民币,够吗?那个年纪对钱不是特别有概念。

董倩:
哪个年纪?

黄晓煌:
我大概 25 岁。当时觉得几十万挺多的了,因为你看十多年前在国内几十万能买套房了。

画外音:
在很短的时间里,年轻的创始团队用低价显卡集合成一个端云协同的高性能 GPU 集群,算力成本大幅降低,并实现了更快的计算速度。但那时投资圈热门的概念仍是移动互联网。黄晓煌在硅谷融资时,无一例外都遭到了拒绝。在最困难的时期,恰逢浙江省到硅谷招商引资,黄晓煌和伙伴们决定回国创业。

黄晓煌:
然后这回国之后,我们就在了一个阁楼里面创业。

董倩:
怎么回来还是阁楼?

黄晓煌:
对,因为当年觉得比如说车库创业,在阁楼里创业很酷。后面觉得这环境完全不适合中国的这个生态。就是你员工来面试,你带到一个卧室里面是太奇怪了。

画外音:
2012 年,辛顿带领学生在图像识别大赛中用深度卷积神经网络碾压传统算法,开启了 AI 革命的新篇章,GPU 也因此一战成名。通过与亚马逊的合作,英伟达开始进入云服务的战场。彼时群核科技的年轻团队正奔跑在用锤子找钉子的路上,他们的锤子是利用 GPU 实现物理正确的渲染引擎。物理正确是指渲染出的图在各种参数上与真实的物理世界相一致。

黄晓煌:
我把他原来这种物理正确的渲染,从原来要半小时一小时才能出一张图,变到 10 秒。

董倩:
为什么你坚持要物理正确这一点?

黄晓煌:
因为物理正确它的通用性更强,稳定性更强。

董倩:
对于你一个沉浸在技术中去研究的人,你有没有想过这个技术和现实世界有什么关联?

黄晓煌:
我当时其实没想那么多,也没想那么多,我其实在英伟达工作的时候,他整个公司的方法论都是先把很牛的技术做出来,然后花各种成本去找应用。所以我受的熏陶也是大概这种方法论,说白了就是拿着锤子找钉子。你先把锤子造出来。

画外音:
这把锤子可以用来做电影特效渲染,但收回成本的时间太长,也可以用于游戏行业,但当时的手游对画质的要求并不高,最终他们的技术落垂在了家装行业。

黄晓煌:
我们得判断这个赛道是有很多家,就是成千上万家在做,还是就一两家。

董倩:
这有什么区别?

黄晓煌:
如果就给一两个大客户服务的话,就变成做项目了。我们还是希望梦想还是做一个产品型公司,而不是项目型公司。

董倩:
那为什么家装的企业他们需要你呢?而且他们成气候呢?

黄晓煌:
当时正好是中国房产的快速崛起的时候。所以他们签单的时候,之前做一张效果图可能要一星期,一星期可能早就被抢走了。所以但是快这个事情对他们来说就是时间,就是竞争力。

董倩:
所以你们的出现恰好满足了他们的需求。

黄晓煌:
我记得我们第一次搞了一个线下活动,就拿着我们Demo去宣讲,然后全场沸腾,然后就刷 POS 机,就烧坏了两台机器。

董倩:
刷POS机这件事儿听起来都很美好,那就意味着日进斗金。你看重的是钱进来了,还是说市场出现了。

黄晓煌:
市场出现了,有人真的为愿意为此买单,说明这是真的需求,而不是嘴巴说说。

画外音:
然而随着用户规模的扩大,对黄晓煌他们来说,技术挑战也成指数级上升。

黄晓煌:
我印象中最尴尬的是我去给客户现场演示,结果演示到一半服务器挂了,然后整个集群挂了。然后只能说要上厕所,躲在厕所里一直发信息,修好了没有,等修好了我再出来。

董倩:
这个洋相出的背后是什么问题呢?

黄晓煌:
背后它其实还是要技术积累。我们遇到最典型的就是动不动温度会到100度以上,显卡就开始罢工了。然后我们得想各种方案去帮他降温。作为这种探索者,确实有很多意料不到的问题,对于当时我们挑战还是非常大的。

画外音:
2013 年,群核科技推出了主打产品酷家乐,这款空间设计软件凭借其 10 秒快速渲染的能力一炮而红,吸引了大量的设计师,成为大家居行业首选的设计软件。

董倩:
在这个过程中,你坚持物理正确的话,是不是也可以收集千家万户的数据到你这儿来?

黄晓煌:
我觉得我们更多的应该不叫收集,是沉淀。沉淀是他用我们的产品去做设计,然后他的工作就会在这边不断的累积下来。

董倩:
它沉淀下来都是些什么样的数据?举个例子。

黄晓煌:
包括里面的每一个零件,甚至哪里要有一个钉子,就是哪里要有一个铰链,都是有这些数据的。

画外音:
家装行业背后的产业链和数据规模的扩大,让黄晓煌和团队很自然的把技术优势延伸到工业4.0。物理正确的数据让设计图能直接对接工厂生产,而这一步又带来更多的数据沉淀。

黄晓煌:
我当时就隐隐约约觉得这东西一定有我们没有发现的价值,我们就也一直组了一个科研团队在里面,一直在研究,也在发论文。

董倩:
你在沉淀数据的同时,你也在对这些数据进行自己进行研究。

黄晓煌:
研究看怎么用。我们其实在18年之前内部也在讨论,我明明躺着一个金矿是吧?但是就黄金提炼不出来,就是这个感觉。

拥抱开放,才能跑赢时代

画外音:
2018 年,基于自身业务海量的室内空间数据积累,群核科技联合国内外几所高校共同推出 Interior Net 数据集。

在此之前,国际上已经有不少知名数据集存在,但多数为静态或不可交互数据。Interior Net 是少有的由可交互三维数据构成的数据集,也是全球最大的室内场景认知深度学习数据集,最重要的是它是免费开源的数据集。

黄晓煌:
就18年之前,我们完全不知道怎么去训练这个事情。那要不就把数据开放出来。

董倩:
那你得到什么?

黄晓煌:
我们公司当时现金流是正的,就挺赚钱,也没想那么多赚钱的事情。然后第二,因为我们已经内部摸索了两三年了,实在是没有头绪。与其烂在自己手里,还不如大家一起来试试。也许某一刻就会有人脑子灵光一现,就把这事情发现。

董倩:
为什么你有这样的想法?我宁愿给别人用,也不愿意烂在锅里。

黄晓煌:
平心而论,我觉得就感兴趣对我来说就是推动这个事情往前发展比赚多少钱更重要。我们相信有产生价值之后,未来一定赚得到钱。但是这个事情如果我们不去推动的话,全世界其他地方可能没有这个资源,那永远就卡在那边了。

董倩:
就是我自己做不到,那么就汇聚全世界最优秀的大脑。从我这里。

黄晓煌:
得到是我觉得这些东西应该属于全人类的一些财富。大家一起来把这事情突破了,然后后面谁能赚到钱,那就看你的命了,不然连机会都没有。但是你如果藏着掖着,你自己也研究不出来,别人也没有条件去研究,那不就是这个赛道就死了吗?

董倩:
有没有可能你在藏着掖着的过程中,人家也开出矿来,甚至还比你大,你反而没用了。

黄晓煌:
是有可能,这风险也是存在的。你手里至少还有矿,你知道别人能提炼出来,大不了合作,对吧?所以我们企业的价值观一直都是开放,我们觉得特别是这种科技赛道里面,大家不是零和博弈的。是的,就是大家一起合作,可能这个蛋糕会突然100倍、1000倍大。你这都不合作,大家可能啥都没有。

画外音:
数据集开放后不久,群核科技就收到了一封来自硅谷某科技巨头的电子邮件,希望和他们进行合作。

黄晓煌:
一开始以为是个骗子。

董倩:
怎么会有这种想法呢?

黄晓煌:
因为根本就没想过这种大个头会找我们合作。

董倩:
如果当时做一个对比的话,如果把它比大象,那你是什么呢?

黄晓煌:
可能蚂蚁都算不上吧。

董倩:
其实开源的作用马上显现。是的,当你贡献了你自己的能力之后,人家就开始搭台阶,你就可以一层一层就顺着上去。

黄晓煌:
是的,那肯定因为对于这种大个头,他们的研究院那是比我们强大太多了。合作了之后他们发了论文,然后我们就看论文就知道,原来是可以这么做的。这些实际上靠你自己的力量,就我们当时评估靠我们自己的力量是不可能实现的。

画外音:
当时该科技巨头正苦于缺乏大量物理正确的合成数据做机器人训练。这次合作让群核科技的数据集第一次应用在了空间智能训练上。

黄晓煌:
慢慢的大家也都发现这条路行得通。

董倩:
嗯哪条路行得通。

黄晓煌:
就空间训练,就对于空间的理解,这条路是行得通的,而且对于合成数据是管用的。这个就意味着你未来所有的设备,它在物理世界里面都产生智能。

我不知道你十年前没用过扫地机器人,原来他只能在家里面按照某一个折线盲目的整个扫一遍。但是当时我看有一些学术里的论文,就是说扫地机器人也可以像人一样的,就是去理解你的环境。你叫他扫哪里,他就知道去扫哪里。比如说你让他帮我那个桌子底下打扫一下,他总得知道哪是桌子。

那这时候他理解这个环境就很重要了当你周围的设备能够理解他眼前的世界之后,他可以有很多的新功能。我们首先得让它变成一个蓬勃发展的一个巨大的生态,我们在里面才能够分到 “蛋糕”。

董倩:
所以你一己之力能把它变蓬勃,能把它变巨大吗?

黄晓煌:
我们不叫一己之力,我是为整个产业贡献一己绵薄之力。不光是我们在做,应该整个产业都在做。就包括自动驾驶,其实也是这种机器智能的一部分,可能自动驾驶那个赛道的力量更大。

画外音:
在现实世界中,训练机器人成本高昂,难以扩展,而使用数据训练机器人则面临高质量 3D 数据稀缺的瓶颈。

合成数据因此是一种性价比更高且潜力无限的训练数据来源。群核科技推出的数据集被帝国理工学院、南加州大学、浙江大学等多所高校采用,成为室内 AI 视觉训练中具有代表性的基础设施之一。

董倩:
我有一个问题,为什么你能够找到沉淀下来这些物理正确的这些数据,而包括美国在内的一些公司他们没有沉淀出来。

黄晓煌:
这个是我们当时做到工业 4.0 时候实现的。所以这就让我们在数字世界里沉淀的所有数字资产,都是跟物理世界是一一对应的,而且能够生产制造出来的。这个是是一个很重要的里程碑。

而美国它没有这么庞大的工业体系,所以之前他们做的这种公司也没什么用。我觉得全世界可能找不到第二个国家有这么庞大的规模。然后这规模大到他靠人工去生产不行,而得靠无人工厂自动去生产。

董倩:
所以说时代造就人,是有的时候你说你拿着这个锤子,你要没赶上这个时代,可能就找不着这样的一个钉子给你捶。

黄晓煌:
是的,从某一方面来说也是比较幸运的。但是从另外一方面,我们就内心里一直觉得这种技术是有价值的。

画外音:
2025 年 3 月,钧和科技发布并开源了自主研发的空间理解模型 Special LM。结合之前发布的空间智能平台 Special Words,可以让机器人完成从认知理解到行动交互的完整闭环训练。随着具身智能的爆发式增长,群核科技有了新的可能,就是成为空间智能训练的云端基础设施巨头之一。

董倩:
如果我们打一个比方,就是你的这个 Special LM 和 Special vers 加起来,它相当于我们现在大语言模型中的哪一个?

黄晓煌:
Special verse 相当于说大语言模型的语料库,Special LM 相当于说大语言模型的本身,目前应该还是比较初级的,我觉得差不多就属于 GPT2.5—3.0 大概这个阶段,我觉得。

董倩:
但是你是独一无二做这件事的对。

黄晓煌:
所以我们后面会持续迭代下去。

董倩:
那也就某种程度上,你就像 ChatGPT 这样的公司。

黄晓煌:
是的,但他们是封闭的,我们是开放的。

董倩:
你的开放和他们的封闭会带来什么样的不一样

黄晓煌:
我看中的是未来十年、20 年后我们的业务,我们先把基础设施铺好,然后我们真正的能力才能得到发挥。我觉得对于中国这一代的企业家来说,就是拥抱开源可能是能够发挥更大价值的。

董倩:
所以这又回到你创业的初衷是什么?哪怕到现在你的驱动力是什么?

黄晓煌:
我们一直坚信你知道你的技术有价值,然后这个赛道蓬勃发展,你在里面一定能够分到一杯羹,而且做这东西你得感兴趣,就即使失败了,这个过程你也会很开心、很兴奋,也很有成就感。最终即使没赚到钱,那你也会觉得不枉此行。

 

 

 

 

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
相关文章