李彦宏：没有应用，AI模型一文不值

李笑寅

2024-07-04 15:38

643

李彦宏在WAIC 2024上呼吁，不要卷模型，要去卷应用，超级能干的应用比只看DAU的超级应用更重要，最简单的就是智能体。

7月4日周四，2024年世界人工智能大会（WAIC 2024）在上海正式开幕。本届大会以“以共商促共享，以善治促善智”为主题，将聚焦全球人工智能领域的前沿技术和创新应用，致力于展示人工智能如何改变世界、塑造未来。

下午13:30开始的产业发展主论坛上，百度创始人、董事长兼CEO李彦宏出席发表主题演讲。本文整理出核心观点如下：

1、同样参数规模之下，闭源模型的能力比开源模型要更好。当你处在一个激烈竞争的市场环境当中的时候，你需要使让自己的业务的效率比你的同行更高、成本比你的同行更低，这个时候，商业化的闭源模型是最能打的。

2、没有应用，光有一个基础模型，不管是开源还是闭源，一文不值。所以我从去年下半年开始讲，大家不要卷模型了，要去卷应用。

3、文心大模型的日调用量最近超过了5亿，代表了真实的需求，说明有人在用、是有人真的从大模型当中获益了，并得到了价值。

4、超级能干的应用比只看DAU的超级应用恐怕要更重要，只要对产业、对应用场景能产生大的增益，整体的价值就比移动互联网要大多了。

5、随着基础模型的日益强大，开发应用也越来越简单了，最简单的就是智能体，这也是我们最看好的AI应用的发展方向。

6、AI不是人类的竞争对手，更多的是在扮演副驾的角色，还要人来把关。目前，AI已经创造了一些全新的工作机会。

以下是李彦宏演讲的主要内容：

各位下午好，非常高兴再次来到上海参加世界人工智能大会。我是这个会议的常客，但是去年因为出国没有来，所以我上一次来参加WAIC是2022年，我记得当时大会的主题是元宇宙，我当时讲的主题是AIGC，就是AI Generated Content（生成式人工智能），我认为AI的技术发展路线发生了方向性的改变，就是从过去的辨别式人工智能转向了未来的生成式人工智能。

这番话当时发表于2022年的夏天，五个月之后，大家都知道，ChatGPT发布了。

后来的事情大家就更清楚，所以两年的时间其实恍若隔世，就是感觉整个世界都变了，人工智能可以说颠覆了绝大多数人的认知。

商业化的闭源模型“最能打”

2023年国内出现了百魔大战，造成了社会资源的巨大浪费，尤其是算力的浪费，但是也使得我们追赶世界上最先进的基础模型的能力得到了建立。去年10月我宣布文心4.0发布的时候，我说文心4.0的能力跟GPT-4相比毫不逊色，好多的同行还不以为然。

今天大家可以看到，国内已经有多款闭源模型声称他们已经追平或者是超越了GPT-4的水平。注意，我这里说的是闭源大模型，不是开源大模型。

这也是今年以来就是争议比较多的一个话题，有些个外行甚至混淆了模型开源和代码开源这两个概念。模型开源你拿到的是一大堆的参数，你还是要去做SFT，还是要去做安全对齐，你不知道这些参数是怎么来的，你是无法做到“众人拾柴火焰高”的，即使你拿到对应的源代码，你也不知道他用了多少数据，用了什么比例的数据去训练这些个参数，所以拿到这些东西并不能够让你站在巨人的肩膀上去迭代和开发。

所以同样参数规模之下，闭源模型的能力就比开源模型要更好。而如果开源想要能力追平闭源，那么它就需要有更大的参数，这就意味着推理成本会更高，反应速度会更慢。

很多人拿开源模型来改款，以为这样可以更好地服务自己的个性化的应用，殊不知这样你就创造了一个孤本的模型，既无法从基础模型的持续升级当中获益，也没办法跟别人去共享算力。

当然我也承认开源模型在某些场景下是有它的价值的，比如说一些学术研究，或者说在教学领域，大家想要研究大模型的工作机制形成理论，这个时候可能是有价值的。

因为大家可能也经常听到，就是我们觉得大模型能力很强，但是不知道为什么能力强，因为背后没有理论来支持他，所以研究领域用开源的我觉得没问题，但是大多数的应用场景开源模型并不合适。

当你处在一个激烈竞争的市场环境当中的时候，你需要使让自己的业务的效率比你的同行更高、成本比你的同行更低，这个时候，商业化的闭源模型那是最能打的。

没有应用，AI模型一文不值

当然这些都不是最重要的，没有应用，光有一个基础模型，不管是开源还是闭源，一文不值。所以我从去年下半年开始讲，大家不要卷模型了，要去卷应用。

但是我看到我们的媒体仍然是把主要的关注点放在了基础模型身上，一天到晚到处去关注跑分、刷榜，谁又超越GPT-4了？OpenAI又出来GPT-4o了等等，今天这个震撼发布，明天那个史诗级更新，但是我要问：应用在哪里？谁从中获益了？

应用其实离我们并不遥远，基于基础模型的应用在各行各业各个领域都已经开始了逐步的渗透。

两个多月前，我们宣布文心大模型的日调用量超过了2亿，最近又超过了5亿。其实仅仅是两个多月的时间，调用量发生了这么大的变化，它背后是代表了真实的需求，是有人在用、是有人真的从大模型当中获益了，得到了价值。

比如在快递领域，让大模型帮助处理订单，做到了一张图、一句话，寄快递不再需要其他的繁琐流程，时间从3分多钟缩短到19秒，而且90%以上的售后问题也都是由大模型来解决，效率提升非常的明显。

再比如在小说的创作领域，一开始我们用开源模型做出过一些效果，后来改用文心的轻量级模型，经过10轮上万组数据的SFT和Post-pretraining（后期预训练），结果有了明显的提升。

最近，我们又转到文心4.0的版本，那么仅用了数百条的数据，生成的内容无论是可用率还是优质率，都大大超过了文心的轻量级模型。网文作者们如虎添翼。

超级能干的应用比只看DAU的超级应用更重要

其实更通用的领域，比如说代码生成功能，文心、快马这样的软件在各个领域也在逐步地渗透。

百度内部的话，我们有30%左右的代码已经是用AI生成的，代码的采用率超过了44%。

不过我们要避免掉入超级应用陷阱，觉得一定要出一个日活用户10亿的APP才叫成功。我认为这是移动时代的思维，AI时代的规律很可能不是这样。超级能干的应用比只看DAU的超级应用恐怕要更重要，只要对产业、对应用场景能产生大的增益，整体的价值就比移动互联网要大多了。

看好智能体的应用发展方向

随着基础模型的日益强大，开发应用也越来越简单了，最简单的就是智能体，这也是我们最看好的AI应用的发展方向。

制作一个好的智能体通常并不需要编码，只要用人话，把这个智能体的工作流说清楚，再配上专有的知识库，一般就是一个很有价值的智能体了，这比互联网时代制作一个网页还要简单。

未来，在医疗、金融、教育、制造、交通、农业等等领域，都会依据自己的场景，自己特有的经验、规则、数据等等做出各种各样的智能体，将来会有数以百万量级的智能体出现，形成庞大的智能体生态。

而搜索是智能体分发的最大的入口。刚刚过去的高考季，很多大模型公司热衷于去写高考作文：我用AI写一个作文能得多少分儿？其实这个实用价值是不大的，人家不会允许你带一个大模型进去参加高考。

真正的需求是大量的考生在考完之后要报志愿，要选择学校、选择专业。他们对一所大学一个专业会有各种各样的问题，而每一个考生的情况又是不一样的。这个时候就是需要有一个智能体来回答每一个考生专有的问题。

在高峰时期，百度的高考智能体每天要回答超过200万个考生的问题，而我们总共只有1000万的考生。在一天当中，有这么大比例的人在利用这个智能体，说明AI正在以前所未有的速度向各行各业渗透。

AI只是辅助，相关工作机会正大量诞生

很多人担心，如果我们日常的工作都让AI去做了，人是不是就没有工作机会了？

这种担心不是没有道理，但是过去这段时间，我听到的担心、听到的抱怨很多，听到的建设性的意见比较少，很少有人去致力于发掘生成式AI带来的新的工作机会，我在这儿算是抛砖引玉吧。

我觉得，一方面AI更多的是在扮演副驾的角色，还要人来把关，AI只是辅助人工作，而不是替代人工作，它让人的工作效率更高，质量更好。另外一方面，我们也看到有一些全新的工作机会开始冒出来了。

比如数据标注师，过去几年我们帮助全国20多个城市落地了数据标注中心，提供了大量的新的就业岗位；再比如提示词工程师，以后不用编程了，但是做好一个智能体还需要把工作流说清楚，这里头要有很强的逻辑性，要用提示词对模型进行调校。

随着智能体的大量涌现，这种工作需求也会飙升。这些个工作机会通常门槛并不高，你做的一般也能够养家活口，做得好的话，那上限可以年薪百万。

自人类文明诞生以来，永不停止的创新，就是刻在我们DNA当中的，从石器时代的手斧，到移动时代的手机，再到AI时代的大模型，人类不断创造各种工具来改善生活、提高生产力，但是它们永远只是工具，只有在被人类所使用的时候才有价值。

我们坚定地相信，AI不是人类的竞争对手，构建和应用人工智能技术是为了满足人的需求，增强人的能力，让人类的生活更美好。谢谢。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。