智谱AI CEO张鹏:中国大模型,从拥挤走向分层

腾讯科技
张鹏:中国大模型已进入第二场,坚持做通用基座模型,年底可能达到对标GPT-4的水平。

中国大模型已进入第二场角逐中。整个生态走向分化,而智谱AI仍然希望做提供基座大模型的人。

智谱AI是目前市场受关注最高的大模型创业公司之一。它2023年截至目前的总计融资额达25亿元人民币,投后估值超过140亿元。消息显示,他们还在进行新一轮融资。

该项目由清华大学计算机系科研成果转化而来,是很早开始发力做大模型的公司之一。智谱AI CEO张鹏之前所在的知识工程实验室,有既做科研又做工程落地项目的传统。

智谱AI则脱胎于此前尝试的业务:科技情报系统。正是做这套系统期间,他们找准大模型赛道,于2020年开始投入。

这家公司的气质偏学院派和技术理想主义,张鹏对内有一句名言:“我们现在不管融多少、挣多少钱,都是我们通向AGI这条路上的盘缠。”

该公司的最新投资方集纳了一众巨头和知名财务投资机构,包括社保基金中关村自主创新基金(君联资本为基金管理人)、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss直聘、好未来、红杉、高瓴等机构及包括君联资本在内的部分老股东跟投。据了解,按照国家知识成果转化的相关规定,清华大学也在该项目占一部分股份。

2023年10月,智谱AI CEO张鹏在与腾讯新闻《潜望》作者对话时谈到,大模型相比上一代人工智能公司来说,给了我们一个机会:“它的能力是横向的,通用性的,泛化能力很强。”因此,这让新一代人工智能公司有机会做成“技术平台化公司”,而不是像之前那样,成为“顶天立地”式的垂直公司。

现在,中国大模型赛道正在从拥挤到分层。张鹏认为,大部分技术进步大抵如此:新技术产生,大家一拥而上;当技术发展到一定程度,自然而然地会沉淀,会分层——有些人解决底层的问题,有些人解决中间的问题,有些人解决上层的问题——这是自然而然形成的。“变成相对稳固而不是混乱的生态,大家互相促进。”

以下为对话节选。

01 久违的大佬牌局:这是我们通往AGI的盘缠

腾讯新闻《潜望》:你跟我讲了一句话,我印象很深。你说,融资的钱是你们通往AGI道路上的“盘缠”。

张鹏:是我们内部开玩笑说的一句话。

腾讯新闻《潜望》:你们融了25亿人民币,现在“盘缠”够吗?

张鹏:25亿是累加起来。当然不够啊。算力涨这么厉害,怎么可能够?

腾讯新闻《潜望》:你们的股东有很多,既包括战略股东——美团、阿里、腾讯;又包括财务投资方——红杉、高瓴等。在互联网时代,这些人很难坐在一张牌桌的同一边。怎么把他们笼络进来?

张鹏:我们没有特别笼络,也没有挑。

我们一直秉持两件事:第一,认清自己的目标,做自己。第二,开放,我们跟谁都可以谈。如果大家认可我们做的事、我们的目标和理念,就可以合作。

大厂们大部分也有大模型的布局,但他们仍愿意出来投。一是因为,他们体量足够大,也很开放。二是我们愿意接受——我们认为这个生态未来会足够大,容得下。这个阶段开始考虑这些有点早。

腾讯新闻《潜望》:他们的态度会有一方说我要进;另一方说,他在,我就不愿意?

张鹏:还好。大家对我们团队比较包容。我们聊的更多是技术和对未来的想法,以及怎么去做的规划。

大家能坐到一起聊,也是因为不管是财投还是战投,打心底有一个愿望——我们赶上这样一个时代,希望为未来添点砖、加点瓦、加把劲。聊着聊着,大家就找到了共同点,然后一起看怎么把共同点放大。其他方面,business to business去聊好了。

腾讯新闻《潜望》:预计整体要花多少钱?

张鹏:我们计划是50到100亿。但很难预估。人最擅长的是做线性外推预测。但是线性外推你能考虑的因素有多少?它又不像大模型,你说你能把所有东西都整合到一起来做预测。我们没这个能力。

02 第二场角逐:其他人在分层,我们为什么留下来做基础大模型

腾讯新闻《潜望》:中国大模型已进入第二场,你同意这个定义吗?

张鹏:我同意。

腾讯新闻《潜望》:一部分人认为,在第二场角逐中竞争的维度变了,上半年在追赶技术,现在很多人说他们要做应用、抢客户,怎么看这个变化?

张鹏:我不觉得大家“卷的事情”变了。本质是,原来大家卷或者关注的问题,基本达成了共识,没有太多分歧。

大家之前的分歧包括,是不是都要去做通用模型、模型是不是越大越好、是不是开源会影响到商业等。所有这些问题存在于初期的混沌阶段,是大家认知不一致时的反应。

现在大家逐渐达成共识,认为以上这些问题虽然重要,还是需要有人持续做,只是不一定每个人都去做同样的事——这样才会进入到第二阶段。觉得不想做这个事的人,他该干嘛?也因为第一阶段卷完,大家觉得基座模型能力已经OK,我们把它当作“锤子”去砸砸“钉子”看,因此进入第二阶段。

并不代表第一阶段的问题没了,它会沿着轨道继续前进,甚至加速前进。

腾讯新闻《潜望》:你们呢?要继续解决没有解决的问题吗?

张鹏:我们从来没变过,坚持去做通用基座模型。

通用智能水平的提升,是我们坚持的一个目标。除非我们某一天做不动这件事了,或者看不到它的目标了。现在远不到那个阶段。

进入第二阶段,衡量这件事的标准,就需要加上一些实用性指标——比如通用智能能力的标准、在实际应用场景中的效果、服务过多少客户等等。并不是大调头。

腾讯新闻《潜望》:其他人太急了吗?

张鹏:所有技术进步规律一样:新技术产生,大家会一拥而上搞技术。当技术发展到一定程度,自然而然地会沉淀,会分层。

有些人解决底层的问题,有些人解决中间的问题,有些人解决上层的问题。是自然而然形成的。解决这些中上层问题,尤其是接近用户真正现实需求的人,会把解决问题碰到的困难下沉到底下,做底层的人去解决——变成相对稳固而不是混乱的生态,大家互相促进。

腾讯新闻《潜望》:为什么你们持续做基座大模型?

张鹏:我们坚持做这件事情和最初的期许有关系,我们的slogan叫“让机器像人一样思考”,就是AGI。你很难想象把它放到特定垂直场景实现,这个事情(上一代AI公司)证明过不可行了。比如用AI人脸识别、下国际象棋、下围棋,so what?

03 中国最像OpenAI的公司?

腾讯新闻《潜望》:你们是中国最像OpenAI的公司之一?

张鹏:这是大家给我们贴的标签。我们更愿意说,我们是有跟OpenAI同样目标的公司。

腾讯新闻《潜望》:你怎么看OpenAI的一些现状?比如ChatGPT用户量下滑。

张鹏:前段时间有文章预测OpenAI今年营收大概12亿到13亿美金,50%以上来自API。这些API用户哪儿来的?是从原来ChatGPT的网页端应用转过去的。

为什么会这样?跟生成式AI从第一阶段到第二阶段的转变有关。大量的用户在使用过ChatGPT这种轻量级的应用后,体验到了大模型的能力,会产生更多想法。他们也会由此想要尝试做上层应用。大家从看热闹、试试看的心态,转变成投入其中去做一些事情。

相比之下,如果我们去观察ChatGPT用户还在大幅上升阶段的时候,他们的API收入就很少,大概几千万美金。

腾讯新闻《潜望》:我们上次聊是今年的四五月,当时团队才两百人,现在四百多。目前团队是怎样的构成?

张鹏:目前跟研发相关的大概占百分之六七十。研发人员里包含数据、产品、解决方案等等,这些也跟技术产品相关,还有一小部分是职能部门。最近我们在市场方面投入了一些资源,市场人员后续会增加多一些。销售几十个人,百分之十几的样子。但整体上,我们还是保持研发人员占大比例。

腾讯新闻《潜望》:怎么思考商业模式?

张鹏:我们很早就想得比较清楚。因为确实是B端的付费意愿比C端好很多,所以从一开始,我们就推出了商业化落地方案,主要面向B端。

腾讯新闻《潜望》:预计多久可以盈亏平衡?

张鹏:早期做过一些预测,后来发现变化太快,包括算力大幅度涨价、竞争加剧。你很难做到精确预测。早期我们预估可能在2026年、2027年左右。现在需要调整。

腾讯新闻《潜望》:中国to B环境惨烈,一个赛道有N家公司做,会出现从卖技术、卖产品,变成卖本地化、定制化服务——这是大家不愿意看到的,又走回上一代AI公司的老路。

张鹏:上一代AI公司给我们的教训是,当你把自己投入到垂直化,“顶天立地”做这样一件事情,成本和收益很难平衡。

大模型给了我们一个机会——它的能力是横向的,通用性的,泛化能力很强。因此,大家有希望做成上一代AI公司没有做成的“技术平台化公司”。这也是为什么我们会坚持做通用基座模型。

通用基座和平台是一个概念。我们提供一个通用底座,跟大家采用合作的方式去构建生态。我们希望合作伙伴能在基座之上做更多事情,创造更大的用户价值。他们有自己的生存之道,知道怎么服务客户、降低成本、获取更大利润空间。我们希望可以与合作伙伴一起发展。

腾讯新闻《潜望》:短期算力问题怎么解决?

张鹏:这是个大问题,幸好我们动得比较早一点,初步做了一些准备工作。

腾讯新闻《潜望》:长期会是个问题吗?

张鹏:我们倒不担心长期。最怕的是什么呢?围三阙一。

就是说,我不把你彻底封死,因为兔子急了还要咬人呢。如果把你所有的生路都堵死,你自然而然地就会想起来反抗,你就要搏命。围三阙一意思就是我让你很难受,但是又给你留一条生路,你又死不掉。这时候,你是最难的时候。

04 做CEO的快乐与烦恼:商业环境的残酷超出我想象

腾讯新闻《潜望》:从实验室到创业环境,觉得自己有什么变化吗?

张鹏:挺大的。学校比较单纯、简单,做的是科研、工程、转化,还没那么大压力。

走出来做企业要考虑更多,围绕的不再是兴趣和崇高的研究目标。做商业,你可以有宏大的愿景和目标,但也要考虑脚下。你得追求商业利益,否则没法继续往前发展。

腾讯新闻《潜望》:做CEO,喜欢的部分是哪些?讨厌的是哪些?

张鹏:喜欢跟各种各样的人聊。人的思考,是在跟人交流过程中产生的。

今天早上听了一位院士的报告,他提到所谓以意识为基础的智能,指的是具有一定基本智能的智能体,在交流过程中产生的一种事物,这是意识。

我们现在研究的问题,归结到最后是哲学思考。认知是什么?认知的下一步是什么?有一种说法,认为认知的下一步是意识。

跟人交流,要慢慢把自己的想法整理得更清晰,必须要表达出来给大家听。当你说出来,对方给你反馈——听到的人或者眼睛一亮,或者皱皱眉头,或者看着你半天不说话,这是正反馈和负反馈。正反馈会告诉你“这样挺好”,负反馈告诉你“这样不对”,这是不断在磨合、调整你大脑的模型。只有不断地用、输出、反馈、输出、反馈,不断地接受输入,才最有效。

腾讯新闻《潜望》:讨厌的呢?

张鹏:睡觉时间变少。最近每天只睡5小时不到。

腾讯新闻《潜望》:走出实验室,商业世界极大超出你预期的是什么?

张鹏:商业环境里的残酷,超出我的想象。

我的导师做知识图谱、知识工程相关的研究。以前一大波企业做知识图谱,现在很少有人提起。这件事技术还在演进,没那么完美,很多问题等待解决,但市场已经卷得太厉害,只能用价格战。这就是一个饮鸩止渴、恶性循环的情况了。

腾讯新闻《潜望》:大模型会不会同样迈入这样的困境中?

张鹏:大模型有一些不一样的地方,在于全民先洗了一波脑。洗脑把想象空间拓到足够大。风险是,预期太高。我们始终认为,怎么样尽快把技术水平提升上去是关键;而不是停在原地,去想更多商业化的事情。

05 中美AI发展的最大差异:硅谷生态的磨合,不像国内损耗这么大

腾讯新闻《潜望》:对明年有什么预期?

张鹏:最核心的是,要把技术先做上去,对标GPT-4不是靠喊的,要靠做。

腾讯新闻《潜望》:预计什么时候能对标达到GPT-4的水平?

张鹏:可能到年底,初步达成一定的效果,不像现在这样差距这么大。

我们的技术升级目前瞄向了GPT-4V。我们最新发布的ChatGLM3具备了多模态理解能力、代码增强模块以及网络搜索增强能力,性能也大幅提升。但会继续向前走。

腾讯新闻《潜望》:预计基座大模型能活下来几家?包括大公司。

张鹏:我很干脆地举了一只手——5个——不负责任的猜测嘛。

第一,这个事做起来太耗钱,从资源的角度,也不太可能撑得起特别多。第二,从需求程度看,也不是每个大厂或创业企业都会选择这件事。

腾讯新闻《潜望》:创业公司会有几家?

张鹏:至少会有两家。

腾讯新闻《潜望》:从去年到今年,中美AI发展有什么特别大不同吗?

张鹏:8月初去了一趟美国参加学术会议,作报告也有同台竞技的大模型专家,包括OpenAI的研究人员。有可能是OpenAI较早地占据了市场,美国很快就进入了各就各位的状态。

美国大模型的生态磨合,不像是中国大模型发展那么剧烈,损耗那么大。大家很快速就走入了——做模型的去做模型,做应用的去做应用的阶段,其中有很多细分方向。不会说大家卷成一锅乱粥。

第一个感受就是他们特别快速地就决定了模型做不做,如果要做应用,做什么应用,想得比较清楚。

第二个感受是,脑洞挺大的,特别活跃,想法天马行空。

腾讯新闻《潜望》:国内摩擦体现在哪?

张鹏:太挤了。有一种说法是,国内如果有一个人发现一件事可以做,大家就全都去做,很少有人去思考,有没有第二件、第三件、第四件可以去做。

但这种说法是不成立的,更像是一种潜意识里的自我PUA。投资人在说,老百姓在说,创业者在说,大家都在说,说着说着自己就相信了。实际情况不一定如此,我们也可以去做创新的事情。

我的另一个感受是,美国创业者格局不一样,美国人国内的一个体育联赛冠军,他取名字叫World Champion;开一个什么公司,或者做什么事情,就Universal什么。所有人认为全世界是我的,他们确实是比较自信。

腾讯新闻《潜望》:面对拥挤的赛道,智谱AI显著性优势是什么?

张鹏:本质问题是我们对这件事情的认知和目标的设定。你心有多大,舞台就有多大。

本文作者:张小珺,来源:腾讯科技 (ID:qqtech),原文标题:《智谱AI CEO张鹏:中国大模型,从拥挤走向分层》

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。