智谱AI CEO张鹏：中国大模型，从拥挤走向分层

腾讯科技

2023/11/14 10:58

张鹏：中国大模型已进入第二场，坚持做通用基座模型，年底可能达到对标GPT-4的水平。

中国大模型已进入第二场角逐中。整个生态走向分化，而智谱AI仍然希望做提供基座大模型的人。

智谱AI是目前市场受关注最高的大模型创业公司之一。它2023年截至目前的总计融资额达25亿元人民币，投后估值超过140亿元。消息显示，他们还在进行新一轮融资。

该项目由清华大学计算机系科研成果转化而来，是很早开始发力做大模型的公司之一。智谱AI CEO张鹏之前所在的知识工程实验室，有既做科研又做工程落地项目的传统。

智谱AI则脱胎于此前尝试的业务：科技情报系统。正是做这套系统期间，他们找准大模型赛道，于2020年开始投入。

这家公司的气质偏学院派和技术理想主义，张鹏对内有一句名言：“我们现在不管融多少、挣多少钱，都是我们通向AGI这条路上的盘缠。”

该公司的最新投资方集纳了一众巨头和知名财务投资机构，包括社保基金中关村自主创新基金（君联资本为基金管理人）、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss直聘、好未来、红杉、高瓴等机构及包括君联资本在内的部分老股东跟投。据了解，按照国家知识成果转化的相关规定，清华大学也在该项目占一部分股份。

2023年10月，智谱AI CEO张鹏在与腾讯新闻《潜望》作者对话时谈到，大模型相比上一代人工智能公司来说，给了我们一个机会：“它的能力是横向的，通用性的，泛化能力很强。”因此，这让新一代人工智能公司有机会做成“技术平台化公司”，而不是像之前那样，成为“顶天立地”式的垂直公司。

现在，中国大模型赛道正在从拥挤到分层。张鹏认为，大部分技术进步大抵如此：新技术产生，大家一拥而上；当技术发展到一定程度，自然而然地会沉淀，会分层——有些人解决底层的问题，有些人解决中间的问题，有些人解决上层的问题——这是自然而然形成的。“变成相对稳固而不是混乱的生态，大家互相促进。”

以下为对话节选。

01 久违的大佬牌局：这是我们通往AGI的盘缠

腾讯新闻《潜望》：你跟我讲了一句话，我印象很深。你说，融资的钱是你们通往AGI道路上的“盘缠”。

张鹏：是我们内部开玩笑说的一句话。

腾讯新闻《潜望》：你们融了25亿人民币，现在“盘缠”够吗？

张鹏：25亿是累加起来。当然不够啊。算力涨这么厉害，怎么可能够？

腾讯新闻《潜望》：你们的股东有很多，既包括战略股东——美团、阿里、腾讯；又包括财务投资方——红杉、高瓴等。在互联网时代，这些人很难坐在一张牌桌的同一边。怎么把他们笼络进来？

张鹏：我们没有特别笼络，也没有挑。

我们一直秉持两件事：第一，认清自己的目标，做自己。第二，开放，我们跟谁都可以谈。如果大家认可我们做的事、我们的目标和理念，就可以合作。

大厂们大部分也有大模型的布局，但他们仍愿意出来投。一是因为，他们体量足够大，也很开放。二是我们愿意接受——我们认为这个生态未来会足够大，容得下。这个阶段开始考虑这些有点早。

腾讯新闻《潜望》：他们的态度会有一方说我要进；另一方说，他在，我就不愿意？

张鹏：还好。大家对我们团队比较包容。我们聊的更多是技术和对未来的想法，以及怎么去做的规划。

大家能坐到一起聊，也是因为不管是财投还是战投，打心底有一个愿望——我们赶上这样一个时代，希望为未来添点砖、加点瓦、加把劲。聊着聊着，大家就找到了共同点，然后一起看怎么把共同点放大。其他方面，business to business去聊好了。

腾讯新闻《潜望》：预计整体要花多少钱？

张鹏：我们计划是50到100亿。但很难预估。人最擅长的是做线性外推预测。但是线性外推你能考虑的因素有多少？它又不像大模型，你说你能把所有东西都整合到一起来做预测。我们没这个能力。

02 第二场角逐：其他人在分层，我们为什么留下来做基础大模型

腾讯新闻《潜望》：中国大模型已进入第二场，你同意这个定义吗？

张鹏：我同意。

腾讯新闻《潜望》：一部分人认为，在第二场角逐中竞争的维度变了，上半年在追赶技术，现在很多人说他们要做应用、抢客户，怎么看这个变化？

张鹏：我不觉得大家“卷的事情”变了。本质是，原来大家卷或者关注的问题，基本达成了共识，没有太多分歧。

大家之前的分歧包括，是不是都要去做通用模型、模型是不是越大越好、是不是开源会影响到商业等。所有这些问题存在于初期的混沌阶段，是大家认知不一致时的反应。

现在大家逐渐达成共识，认为以上这些问题虽然重要，还是需要有人持续做，只是不一定每个人都去做同样的事——这样才会进入到第二阶段。觉得不想做这个事的人，他该干嘛？也因为第一阶段卷完，大家觉得基座模型能力已经OK，我们把它当作“锤子”去砸砸“钉子”看，因此进入第二阶段。

并不代表第一阶段的问题没了，它会沿着轨道继续前进，甚至加速前进。

腾讯新闻《潜望》：你们呢？要继续解决没有解决的问题吗？

张鹏：我们从来没变过，坚持去做通用基座模型。

通用智能水平的提升，是我们坚持的一个目标。除非我们某一天做不动这件事了，或者看不到它的目标了。现在远不到那个阶段。

进入第二阶段，衡量这件事的标准，就需要加上一些实用性指标——比如通用智能能力的标准、在实际应用场景中的效果、服务过多少客户等等。并不是大调头。

腾讯新闻《潜望》：其他人太急了吗？

张鹏：所有技术进步规律一样：新技术产生，大家会一拥而上搞技术。当技术发展到一定程度，自然而然地会沉淀，会分层。

有些人解决底层的问题，有些人解决中间的问题，有些人解决上层的问题。是自然而然形成的。解决这些中上层问题，尤其是接近用户真正现实需求的人，会把解决问题碰到的困难下沉到底下，做底层的人去解决——变成相对稳固而不是混乱的生态，大家互相促进。

腾讯新闻《潜望》：为什么你们持续做基座大模型？

张鹏：我们坚持做这件事情和最初的期许有关系，我们的slogan叫“让机器像人一样思考”，就是AGI。你很难想象把它放到特定垂直场景实现，这个事情（上一代AI公司）证明过不可行了。比如用AI人脸识别、下国际象棋、下围棋，so what？

03 中国最像OpenAI的公司？

腾讯新闻《潜望》：你们是中国最像OpenAI的公司之一？

张鹏：这是大家给我们贴的标签。我们更愿意说，我们是有跟OpenAI同样目标的公司。

腾讯新闻《潜望》：你怎么看OpenAI的一些现状？比如ChatGPT用户量下滑。

张鹏：前段时间有文章预测OpenAI今年营收大概12亿到13亿美金，50%以上来自API。这些API用户哪儿来的？是从原来ChatGPT的网页端应用转过去的。

为什么会这样？跟生成式AI从第一阶段到第二阶段的转变有关。大量的用户在使用过ChatGPT这种轻量级的应用后，体验到了大模型的能力，会产生更多想法。他们也会由此想要尝试做上层应用。大家从看热闹、试试看的心态，转变成投入其中去做一些事情。

相比之下，如果我们去观察ChatGPT用户还在大幅上升阶段的时候，他们的API收入就很少，大概几千万美金。

腾讯新闻《潜望》：我们上次聊是今年的四五月，当时团队才两百人，现在四百多。目前团队是怎样的构成？

张鹏：目前跟研发相关的大概占百分之六七十。研发人员里包含数据、产品、解决方案等等，这些也跟技术产品相关，还有一小部分是职能部门。最近我们在市场方面投入了一些资源，市场人员后续会增加多一些。销售几十个人，百分之十几的样子。但整体上，我们还是保持研发人员占大比例。

腾讯新闻《潜望》：怎么思考商业模式？

张鹏：我们很早就想得比较清楚。因为确实是B端的付费意愿比C端好很多，所以从一开始，我们就推出了商业化落地方案，主要面向B端。

腾讯新闻《潜望》：预计多久可以盈亏平衡？

张鹏：早期做过一些预测，后来发现变化太快，包括算力大幅度涨价、竞争加剧。你很难做到精确预测。早期我们预估可能在2026年、2027年左右。现在需要调整。

腾讯新闻《潜望》：中国to B环境惨烈，一个赛道有N家公司做，会出现从卖技术、卖产品，变成卖本地化、定制化服务——这是大家不愿意看到的，又走回上一代AI公司的老路。

张鹏：上一代AI公司给我们的教训是，当你把自己投入到垂直化，“顶天立地”做这样一件事情，成本和收益很难平衡。

大模型给了我们一个机会——它的能力是横向的，通用性的，泛化能力很强。因此，大家有希望做成上一代AI公司没有做成的“技术平台化公司”。这也是为什么我们会坚持做通用基座模型。

通用基座和平台是一个概念。我们提供一个通用底座，跟大家采用合作的方式去构建生态。我们希望合作伙伴能在基座之上做更多事情，创造更大的用户价值。他们有自己的生存之道，知道怎么服务客户、降低成本、获取更大利润空间。我们希望可以与合作伙伴一起发展。

腾讯新闻《潜望》：短期算力问题怎么解决？

张鹏：这是个大问题，幸好我们动得比较早一点，初步做了一些准备工作。

腾讯新闻《潜望》：长期会是个问题吗？

张鹏：我们倒不担心长期。最怕的是什么呢？围三阙一。

就是说，我不把你彻底封死，因为兔子急了还要咬人呢。如果把你所有的生路都堵死，你自然而然地就会想起来反抗，你就要搏命。围三阙一意思就是我让你很难受，但是又给你留一条生路，你又死不掉。这时候，你是最难的时候。

04 做CEO的快乐与烦恼：商业环境的残酷超出我想象

腾讯新闻《潜望》：从实验室到创业环境，觉得自己有什么变化吗？

张鹏：挺大的。学校比较单纯、简单，做的是科研、工程、转化，还没那么大压力。

走出来做企业要考虑更多，围绕的不再是兴趣和崇高的研究目标。做商业，你可以有宏大的愿景和目标，但也要考虑脚下。你得追求商业利益，否则没法继续往前发展。

腾讯新闻《潜望》：做CEO，喜欢的部分是哪些？讨厌的是哪些？

张鹏：喜欢跟各种各样的人聊。人的思考，是在跟人交流过程中产生的。

今天早上听了一位院士的报告，他提到所谓以意识为基础的智能，指的是具有一定基本智能的智能体，在交流过程中产生的一种事物，这是意识。

我们现在研究的问题，归结到最后是哲学思考。认知是什么？认知的下一步是什么？有一种说法，认为认知的下一步是意识。

跟人交流，要慢慢把自己的想法整理得更清晰，必须要表达出来给大家听。当你说出来，对方给你反馈——听到的人或者眼睛一亮，或者皱皱眉头，或者看着你半天不说话，这是正反馈和负反馈。正反馈会告诉你“这样挺好”，负反馈告诉你“这样不对”，这是不断在磨合、调整你大脑的模型。只有不断地用、输出、反馈、输出、反馈，不断地接受输入，才最有效。

腾讯新闻《潜望》：讨厌的呢？

张鹏：睡觉时间变少。最近每天只睡5小时不到。

腾讯新闻《潜望》：走出实验室，商业世界极大超出你预期的是什么？

张鹏：商业环境里的残酷，超出我的想象。

我的导师做知识图谱、知识工程相关的研究。以前一大波企业做知识图谱，现在很少有人提起。这件事技术还在演进，没那么完美，很多问题等待解决，但市场已经卷得太厉害，只能用价格战。这就是一个饮鸩止渴、恶性循环的情况了。

腾讯新闻《潜望》：大模型会不会同样迈入这样的困境中？

张鹏：大模型有一些不一样的地方，在于全民先洗了一波脑。洗脑把想象空间拓到足够大。风险是，预期太高。我们始终认为，怎么样尽快把技术水平提升上去是关键；而不是停在原地，去想更多商业化的事情。

05 中美AI发展的最大差异：硅谷生态的磨合，不像国内损耗这么大

腾讯新闻《潜望》：对明年有什么预期？

张鹏：最核心的是，要把技术先做上去，对标GPT-4不是靠喊的，要靠做。

腾讯新闻《潜望》：预计什么时候能对标达到GPT-4的水平？

张鹏：可能到年底，初步达成一定的效果，不像现在这样差距这么大。

我们的技术升级目前瞄向了GPT-4V。我们最新发布的ChatGLM3具备了多模态理解能力、代码增强模块以及网络搜索增强能力，性能也大幅提升。但会继续向前走。

腾讯新闻《潜望》：预计基座大模型能活下来几家？包括大公司。

张鹏：我很干脆地举了一只手——5个——不负责任的猜测嘛。

第一，这个事做起来太耗钱，从资源的角度，也不太可能撑得起特别多。第二，从需求程度看，也不是每个大厂或创业企业都会选择这件事。

腾讯新闻《潜望》：创业公司会有几家？

张鹏：至少会有两家。

腾讯新闻《潜望》：从去年到今年，中美AI发展有什么特别大不同吗？

张鹏：8月初去了一趟美国参加学术会议，作报告也有同台竞技的大模型专家，包括OpenAI的研究人员。有可能是OpenAI较早地占据了市场，美国很快就进入了各就各位的状态。

美国大模型的生态磨合，不像是中国大模型发展那么剧烈，损耗那么大。大家很快速就走入了——做模型的去做模型，做应用的去做应用的阶段，其中有很多细分方向。不会说大家卷成一锅乱粥。

第一个感受就是他们特别快速地就决定了模型做不做，如果要做应用，做什么应用，想得比较清楚。

第二个感受是，脑洞挺大的，特别活跃，想法天马行空。

腾讯新闻《潜望》：国内摩擦体现在哪？

张鹏：太挤了。有一种说法是，国内如果有一个人发现一件事可以做，大家就全都去做，很少有人去思考，有没有第二件、第三件、第四件可以去做。

但这种说法是不成立的，更像是一种潜意识里的自我PUA。投资人在说，老百姓在说，创业者在说，大家都在说，说着说着自己就相信了。实际情况不一定如此，我们也可以去做创新的事情。

我的另一个感受是，美国创业者格局不一样，美国人国内的一个体育联赛冠军，他取名字叫World Champion；开一个什么公司，或者做什么事情，就Universal什么。所有人认为全世界是我的，他们确实是比较自信。

腾讯新闻《潜望》：面对拥挤的赛道，智谱AI显著性优势是什么？

张鹏：本质问题是我们对这件事情的认知和目标的设定。你心有多大，舞台就有多大。

本文作者：张小珺，来源：腾讯科技 (ID:qqtech)，原文标题：《智谱AI CEO张鹏：中国大模型，从拥挤走向分层》

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。