“AI春晚”智源大会首日：最重要的公司们谈论最关键的AI话题

2024/06/15 15:58

李开复对话张亚勤，百川智能 CEO 王小川、智谱 AI CEO 张鹏、月之暗面 CEO 杨植麟、面壁智能 CEO 李大海展开探讨。

一年一度的中国“AI春晚”智源大会于昨日启幕，成为本周最受关注的AI盛事。

大会首日，多位大模型大佬亮相。零一万物李开复与清华大学智能产业研究院的院长张亚勤炉边对话，百川智能 CEO 王小川、智谱 AI CEO 张鹏、月之暗面 CEO 杨植麟、面壁智能 CEO 李大海等关键人物就目前AI界最关键的问题开启了一场大型探讨会。

【以下为华尔街见闻整理的要点】

关于Scaling Law：一段时间内仍然有效

李开复：应该用压缩的理念去评估。大模型的智慧来自于接近无损的压缩，这点非常重要。上世代的人工智能从业者很难想到今天会把压缩和智能连接在一起。因为Scaling Law过程中不能盲目堆更多的GPU，所以需要有一个方法评估我们有没有越做越好或者哪个方法做得更好。零一万物内部有严谨的方法论，用压缩的理念去评估，让以往漫无目的“炼丹”训模过程变得更系统也更有科学和数学根据。

张亚勤：5年内仍是主要方向。规模定律的实现，主要得益于对海量数据的利用以及算力的显著提升。再加上现在的Diffusion和Transformer架构能够高效地利用算力和数据，使得“飞轮效应”得以正循环。尽管有人质疑Scaling Law在2到3年后是否仍然有效，但我个人认为至少在未来5年里，它仍将是产业发展的主要方向。

杨植麟：scaling law没有本质问题。未来3到4个数量级的提升是非常确定的，关键是如何高效地扩大规模，以及应该扩展什么。如果只是继续使用当前的方法和数据，可能无法解决推理能力等问题。所以我们需要重新定义scaling law。只要有更多的算力和数据，模型参数变大，智能会持续增加，但这不一定局限于当前的方法。比如，模型可以有不同的模态、数据和loss function。所以他认为scaling law会持续演进，只是扩展的方法会发生变化。

王小川：scaling law目前没有看到边界，它会持续发挥作用。比如，Elon Musk计划购买30万片B200芯片，这表明美国在这方面的投入和认真程度远高于中国。因此，我们在scaling law之外还需要寻找新的范式转化，不仅是简单的预测token和压缩模式。只有走出这样的体系，才能有机会走向AGI，并与最前沿的技术较量。

张鹏：目前为止，人类认识的所有规律都有可能被推翻。只是看它的有效期有多长。到目前为止，我们还没有看到scaling law失效的预兆，所以在未来相当一段时间内，它仍然会有效。

李大海：扩展法则是一种经验公式，是行业对大模型这个复杂系统的观察和总结。随着实验的增多，我们对模型训练过程的认知越来越清晰，细节也会越来越多。训练方法本身对扩展法则的影响也很显著。一旦我们固定了参数规模，数据质量和训练方法的重要性就会显现出来。

关于AGI的定义和标准

李开复：AGI的定义是因人而异的。如果把AGI定义为能做人所能做的一切事情，那么我今天没有办法定义，因为它还有太多未知的东西还没有被解。但是这种定义只把人当作金标准，似乎就是问车什么时候能跟人跑的一样快，但是车在很多场景已经比人跑得快很多了，只是有些场景没法胜任。我个人会说：只要Scaling Law继续，只要AI一年比一年更聪明，它会多做比如5倍的事情，IQ会提升20个点。

在虚拟世界里，Agent还是非常重要的，因为人的Intelligence不只是回答问题，是要知道“怎么把事情做出来”。而且如果是谈创造商业价值，Agent帮你把东西买了，帮你把事情解决了，这个是有很大的商业价值，也是贴近AGI的重要一步。

张亚勤：我刚才讲的20年实现AGI，不包括拥有意识或情感。我对AGI的定义有三点，第一是要有巨大的能力，要能在大部分的任务要比人类强，而不是所有任务均超越人类。第二，它是必须要是通用的，过去每个任务都要用不同的模型，但是AGI是要有一个通用的大底座，当然可以有小的垂直模型，但它本身具有通用性。第三是不断升级、学习、进化，就像人类一样。我不认为现在的Scaling Law，或者我们现在做的研究会让AI产生意识，并且我也不认为我们应该从事这方面的研究。

杨植麟：首先，AGI的定义是重要的，但并不一定现在需要精确的、有量化的定义，它可能是一个定性的、感性的东西，它最重要的作用是能让这个社会或者所有人能够对接下来要发生什么事情有一个准备。因为也许这个技术节奏非常快，我们如果能够知道AGI是什么样的，如果能够定义，可以更好的准备这件事情，不管是每个人职业，还是接下来这个行业怎么发展，首先这个是重要的。

第二个，也一定程度上在短期内需要一些量化，因为如果没有完全量化，没有办法衡量AGI开发进度是什么样的，所以短期来说这个是很难的问题，也是很大的挑战。

王小川： AGI的定义，在全球里很难有完整的共识。之前我们谈AGI，一种理解是把它当成工具来看，我认为这次AGI的第一个变化是它开始有思考能力、学习能力、沟通能力、共情能力，甚至多模态图片处理能力。从它的学习范式要求里，我反而觉得我们就是像在看人一样看它的，一种做法是跟人差异化看。

李大海：我会尝试从经济学的角度来定义AGI。从经济学的角度讲，如果我们去执行任何一个任务，边际成本都为零，这就是我们理想中的AGI。回到我刚才说的，为什么我认为大模型能够走得最远，就是我相信大模型能够把边际成本一直往下降，可能会逼近于零。就像植麟刚才讲的，很多时候需要我们在各行各业的数据产生一个飞轮，逐步让模型持续训练、持续学习，让整体的成本降下去。

张鹏：在我们看AGI这件事，要说它有一个很严格定义的定义，还是另外的什么东西，其实我更愿意相信它是我们的一种信念，是一个符号，它的内涵外延是在不断变化的。刚才提到的早期定义AI的时候，怎么来检测系统是否是AI系统，图灵测试。现在大家已经觉得这个过时了，就是因为随着我们对技术的不断演进，对事情的认知越来越多、越来越深，本质在同样的三个字母所代表的含义是不断在变化，是个动态的刚才。刚才杨植麟也讲，它是一个balance的事情，如果你能把一个事情说得非常量化、非常清晰，内涵是什么，外延是什么，这件事情也就那样了，估计天花板在哪儿大家都能看得到了。现在的问题就在于，没有人能够说清楚。反过来讲是一个好事，这个事情还有很多未知空间等待我们探索。

AGI对于我们来说，可以把它定义成我们的目标。我们一直相信，当前我们的目标是以人为参照，让机器像人一样思考。这是我们的愿景。当然，机器的能力远不止人的水平，我们期待它可以出现超越人的能力，所以AGI里边我们会提到有super intelligence。下一步它是否能产生超过人的水平，我们会不断更新AGI的内涵和外延。

关于大模型价格战：对行业很好

杨植麟：如果我们把时间线拉足够长的话，最终还是会回归价值本身。我自己有三个判断。第一，在某个时间点之后应该可以显著超过训练的算力。我觉得这个标志价值开始得到释放，用来训练的成本是可以很大程度上被覆盖。第二，如果从C端的角度来说，推理成本可能会显著低于获客成本，所以从商业本质上来讲，可能不会跟之前的各种商业模式有非常本质的区别。我觉得这两个是很重要的。第三，AI本身做的事情，可能会在某个时间点超过人做的事情。这个时候，它就可能会产生新的商业模式，它可能不是像今天说的在B端用API做价格战，可能是一个普惠的AI，同时根据它产生的价值从这里面去分成产生的商业模式。

这三个点，可能会是改变商业模式本身或者ROI这个问题很重要的方式。

王小川：我先说结论，今天的价格战对中国发展大模型是非常特别的事。我是积极看待这个事情。

首先，好不好，得看对单个公司还是对一个群体整个市场。因为价格战通常是个市场行为，是个竞争的导向，至少带来两个好的后果：第一个，更多公司、更多人用上大模型了，很多企业之前是不懂这个的，很多公司开始免费用POC，使得大模型在中国有个迅速的普及。不管是个人还是企业就入场了，这对市场是第一个好处。第二个，之前还有很多浪费，因为大家恐慌的时候不知道大模型为何物。我观察到，很多企业但凡有点技术能力都要自己训点大模型，甚至来找我们怎么联合训练。明明它该是大模型的用户、消费者、大模型的使用方，但都想转型成为大模型的供给方。我到这个行业做大模型，一个企业变成所谓的行业。这种情况下，带来很多人才、资金和社会的浪费。有了价格战之后，很多企业开始清醒了，我干嘛非得做，我到底在干嘛，我的竞争优势在什么地方，它就退回来成为大模型的用户，这个浪费也会减少很多。既能带来启蒙，也能带来对社会资源减少消耗。更多的企业在里面能够有自己的定位，把自己做好。我们不需要一千、一万个大模型。在没有价格战的时候，中国可能真的是上百、上千个大模型在进行，市场的分层就能做好，每家都能受益，竞争力就能起来。

张鹏：我们一直秉持的概念就是ROI，给用户带来最大的收益价值，用我们的技术、用我们的创新降低使用成本，就是为了让技术能够更多的普及，让更多人能够享受这个收益。我们当时推出的，在很长一段时间，我们的价格都是行业内极低的。因为我们的技术确实能做到那一步，能把中间的成本空间释放出来当作大家的收益，帮助大家把ROI算出一个大于一的数字。

这件事情对整体是有好处的，但是也要注意，不要过多地关注这件事情，过多的宣扬这件事情。商业上，你去牺牲企业短期的成本，亏本做买卖不是正常的商业逻辑，只能持续很短的时间，真正还是要回归最终的用户价值、生产力价值。

李大海：会继续有价格战，但也需要有利润。当前所谓的价格战，多多少少有一些营销的成分在，但是我相信未来一定会比现在还要比，并且大家都有利润，这才是健康的方式，并且才真的能让千行百业的应用往下落地。

关于AI落地路径：To C短期更快

张亚勤：具身智能To B可能会比To C更快落地

在应用和服务层面，先面向消费者（To C）再面向企业（To B）。To B的周期相对较长，而To C的应用产品则可以迅速推出，这与过去的PC互联网和移动互联网的发展路径基本一致。在基础设施层，目前真正盈利的主要集中在To B领域，特别是在芯片、硬件、服务器等。像英伟达、AMD等芯片制造商，以及服务器、HBM存储、InfiniBand和NVLink等相关技术的提供商，他们目前是盈利最多的。

关于AI路径，我在过去十年中一直强调三个关键领域：首先是信息智能，其次是物理智能（现在流行的术语是具身智能），最后是生物智能。在具身智能阶段，To B的应用可能会比To C更快落地。然而，在生物智能阶段，情况可能相反，To C的应用可能会先于To B出现。尽管每个领域的具体情况可能有所不同，但总体来看，无论是To C还是To B，都将存在开源模型、商业闭源模型、基础大模型，以及针对垂直行业模型和边缘模型。

李开复：中国To C 短期更有机会，具身智能路途遥远

简单来说，在中国To C 短期更有机会，国外两者都有机会。To C方面，就像移动互联网、PC时代里，一个新技术、新平台带来新应用，大模型同样如此，这是巨大的机会，但是这些应用的出现一定是按部就班的。

零一万物坚决做To C，不做赔钱的To B，而是做能赚钱的To B。所以零一万物在To B方面精挑细选，找那种公司上下都愿意拥抱新概念的公司，也为它们设计了 RAG 知识检索、专有云、微调等方案，在国内国外都有尝试。

无论To C还是To B，API都很重要，最近国内很多模型降价了，零一万物也推出了接入国际SOTA成绩Yi-Large大模型的API，也希望有机会可以跟各位合作。这个API背后的模型能力接近GPT-4o，但是价格是GPT-4的四分之一，我相信这可以帮助更多公司或者创业者达到所谓的TC-PMF。

大模型是非常适合虚拟世界的，在金融公司的后台、客服等等场景，大模型很快就可以落地产生价值。如果你的需求是软件，直接对接大模型就好了。一旦大模型接入物理世界，就需要面临各种问题，有安全问题、机器问题、机械问题、故障问题等等，难度会大很多倍。

从创业者的角度来说，虽然现在具身智能一时比较热，有一些创业者涌入了，但是对于大部分创业者来说，如果希望短期落地产生价值、能赚钱，肯定还是做虚拟世界要远远容易很多。具身智能是重要的，它可以很好地结合大模型多模态能力，而且一旦具身后就可以产生数据，形成数据飞轮闭环，有很大的想象空间。但是短期要做好，难度很大。

具身智能肯定要走很漫长的道路，而且对于人形机器人我有一些特别的看法。绝大多数应用场景并不需要人形机器人，炒菜机器人应该长得像锅，吸尘器也长得并不像人，没有必要。像是波士顿动力那种很酷的、跳来跳去的机器人，真的会有很多应用场景吗？绝大多数场景几个轮子不是更容易移动吗？很多科学家和创业者都是从小热爱科技，希望能复制一个人，这无可厚非。但是如果你很简单地问VC，VC给出的恐怕是更务实更理性的判断。

关于开源：带来正收益

李大海：开源力量很强大，这里面是多层次的，不光有做原创工作的人，还有很参与者在里面贡献需求、贡献反馈，这也是开源生态重要组成部分。让我们觉得持续做开源贡献能够给公司带来正向收益。

王小川：开源有需求，也会形成很好的影响力，同时，并不会影响竞争力。因为在模型生态里，可能今天是最好的，明天就是一个不够好的模型了，所以我们从商业竞争里也没什么大的损失。因此，这是一件既有贡献，又没有降低我们竞争力的事情，我们就毅然决然做了这样一个决定，符合市场预期，也给公司带来了声誉，这个事情是做得蛮成功、挺对的一件事情。今天有各种公司在里面做各种各样的开源，使得中国的生态在追赶美国、在保护知识产权里共同做这个贡献，我也希望这个生态能够大家越做越好。

【以下为李开复对话张亚勤实录】

黄铁军：我先提问，近期关于大模型的讨论特别热门，从刚才的报告大家也感受到了大模型的能量以及其在各领域的应用潜力，可以说大模型是至今为止人工智能发展最成功的一个技术方向。想请问两位，是什么原因使得大模型如此成功？还有哪些欠缺的地方需要进一步发展？开复老师先。

李开复： AI 2.0是有史以来最伟大的科技革命和平台革命，大模型Scaling Law 的重要性在这个时代得以凸显——人类能够用更多计算和数据不断增加大模型的智慧，这条被多方验证的路径还在推进中，还远没有触达天花板，这点也让大家非常振奋。

第二，大模型的智慧来自于接近无损的压缩，这点也非常重要。上世代的人工智能从业者很难想到今天会把压缩和智能连接在一起。因为Scaling Law过程中不能盲目堆更多的GPU，所以需要有一个方法评估我们有没有越做越好或者哪个方法做得更好。零一万物内部有严谨的方法论，用压缩的理念去评估，让以往漫无目的“炼丹”训模过程变得更系统也更有科学和数学根据。

大模型正面临着一些挑战。比方说，如果“仅仅用更多算力就能把它往前推动”是主要方向的话，就会导致只有那些GPU资源丰富的公司和国家能够在这方面胜出。但话说回来，我们已经验证了，很多国内大模型在部分案例里接近或者打平、或者偶尔超过美国的大模型。所以我认为需要专注的是算法和工程创新一体化的推进，以及怎么以这种能力避免进入“盲目堆算力推动模型性能提升”的状态。

当然，目前大模型还直面许多挑战。就像每个技术刚诞生都会有问题，起初大模型也不知道最近一年发生了什么。还有记忆的问题、窗口构成的问题、幻觉问题等等，但我们可以看到的是，当全球如此多聪明的大脑涌入这个领域后，大部分问题不能说被完美地解决，但是都在逐步被攻克的过程中，所以我对大模型的未来相当乐观。

张亚勤：我讲“三个做对了”的和“三个需要改进”的。

一、三个做对了

首先，规模定律Scaling Law。规模定律的实现，主要得益于对海量数据的利用以及算力的显著提升。再加上现在的Diffusion和Transformer架构能够高效地利用算力和数据，使得“飞轮效应”得以正循环。尽管有人质疑Scaling Law在2到3年后是否仍然有效，但我个人认为至少在未来5年里，它仍将是产业发展的主要方向。

其次是“Token-Based”统一表述方式。在大模型中，“Token”是一个基本元素。无论是文本、语音、图像、视频，还是自动驾驶中的激光雷达信号，甚至是生物领域的蛋白质和细胞，最终都可以抽象为一个Token。Token之间的训练、学习和生成是核心环节，这与我们大脑中的神经元工作原理相似，无论执行何种任务，其基础机制都是相同的。

最后是通用性。这与Token紧密相关。现在的通用性不仅体现在文本处理上，还扩展到了多模态领域，甚至可以生成如蛋白质等复杂结构。此外，它在物理世界（如具身智能）和生物世界（如生物智能）中也有着广泛的应用前景。

以上这三个是大模型做对的。

二、现阶段主要问题

第一个，效率较低。特别是大模型的计算效率低下问题，与人类大脑的高效性形成了鲜明的对比。人类大脑拥有860亿个神经元，每个神经元又有数千个突触连接，却只需要20瓦的能量，重量还不到三斤；而GPT4这个万亿参数模型则需要巨大的算力和能源，与人脑相比相差1,000倍之多。此外，人脑能够根据不同的情境灵活调用不同区域的神经元，而大模型却每次输入一个问题都要调用和激活几乎大量参数。因此，如何借鉴人类大脑的计算方法，在降低计算耗能、提高效率方面进行探索和创新，是一个值得关注的方向。

第二个，大模型目前还未能真正理解物理世界，相关的推理能力、透明性以及开复刚才提到的幻觉等问题都还在深入研究中。有一个重要的问题是，即使我们的大模型做得再好，它在生成式表述与对真实世界的描绘之间仍存在矛盾。因此，我们需要探索如何将生成式的概率大模型与现有的“第一性原理”或真实模型、知识图谱相结合。目前，虽然已经有了一些尝试，如采用RAG技术或进行微调，并取得了一定的进展，但我认为这些方法并非根本解决方案。我预测，在未来五年内，将会有一个全新的架构出现，这个架构有望取代目前的Transformer和Diffusion模型。

第三个欠缺的地方是边界问题。现在大模型无法知道“我不知道什么”，这是目前要解决的问题，是它的边界效应。

黄铁军：谢谢亚勤的“三个做对了”和“三个不足”。

刚才开复老师没讲，我想再追加问一下，有些人认为大模型是一个实践、是一个工程，是经验主义做的东西，没有理论基础，说得不好听叫“不靠谱”，不知道你怎么看这个问题？

李开复：我觉得科学和工程缺一不可。如果只做工程，不了解“第一性原理”，没有数学的根据、没有办法评估不同方法的效果，考虑到高昂的算力成本，这样的摸索肯定是做不出一个好模型的。但是如果只是在实验室里雕花，然后写一些不错的论文，期待有工程人才把论文做成产品，这肯定也是不行的。

零一万物的经验是，每个做AI、做模型的Researcher要懂Infrastructure、都要懂推理、都要知道成本的问题，所以当你需要面对科研问题时，就知道在产品里需要的反应速度有多快，要怎么实现，做完实验就可以确保模型可以得到令人满意的工程结果。训练模型的过程中绝对不只是写Paper，还要同时考虑怎样系统化、工程化地做数据工程，因为数据的训练、数据的筛选是非常重要的。还有底层的AI Infrastructure，GPU这么昂贵，如果把一张当成两张、三张使用，任何公司都会得到好处，所以科技和工程这两方面缺一不可。

黄铁军：谢谢。大家关心AI2.0，大模型产业化最大的场景在哪里？移动互联网这么多年，To B、To C ，这两个大赛道哪个更有机会？为什么？

李开复：简单来说，在中国To C 短期更有机会，国外两者都有机会。To C方面，就像移动互联网、PC时代里，一个新技术、新平台带来新应用，大模型同样如此，这是巨大的机会，但是这些应用的出现一定是按部就班的。

我认为AI 2.0 时代会和PC、移动互联网时代一样，第一个阶段应该是生产力工具，包括信息获取；第二个阶段可能会是娱乐、音乐、游戏，第三个阶段可能会是搜索；再下一个阶段可能会是电商；然后可能会有社交、短视频、O2O的应用出现。

一个理由就是刚开始应用要能够赚钱、能够解决问题，所以第一波潮流会是生产力工具，但越往后，难度越高——高用户量的应用商业模式往往是先堆积用户再找变现模式，所以应用成本一定要很低，试错难度很大、所需要的投资也更多。

我认为递进的模式不会有特别大的改变，To C应用会从生产力工具一步步走向短视频类应用。To C确实会产生大量的用户，但这不是说不能用大模型来做产品，只是在普及顺序上会按照这六个阶段进行。

当然，这个过程中也有挑战，在大模型领域做应用跟PC、互联网时代不一样，因为推理成本还太贵。最近零一万物提出了TC-PMF概念（技术成本✖️产品市场契合度），这个概念是指，当你考虑PMF时，还要把技术的需求、实现难度和成本考虑进去。

做应用一定要考虑到刚才这六个阶段谁先谁后、什么时候做、提早做。第二，做应用的时候还要综合考虑到当时的技术够不够好，成本是否足够低，所以大模型To C应用不像过去移动互联网时代，产品经理一个人就可以做主，它需要做Infrastructure、做推理引擎的人、一起打磨TC-PMF。这件事难度高，但是回报也高，机会也更大。

最后我想讲，在To C方面，我不相信技术可以永久领先，事实上技术带来的领先窗口非常短暂，一旦巨头看到你验证了PMF，他们会有很多方法超越你。一旦你验证了TC-PMF，要把握时间窗口把品牌打出来，最终胜出的To C应用不只是需要有技术优势，还需要在时间窗口内打造持续优势，比如品牌优势，比如社交链，比如用户数据，让用户不能离开你这个平台。在微信强大的时代里抖音能被做出来，就是因为它抓住了这个时间窗口。

再讲一下To B的应用。大模型有可能在To B方向上带来更大价值，而且能够比To C更快实现，但是To B这个领域有几个挑战。

第一个挑战是大公司、传统公司不是很敢采取颠覆式技术，大公司会习惯每年增长5%预算，做和去年一样的事情。

第二个挑战在中国比较严重，许多大公司没有认识到软件的价值，为软件付费意的意识有待进一步提高。现在有许多大模型公司在竞标时越竞越低，做到最后做一单赔一单，都没有利润。我们在AI 1.0时代曾见过这个现象，现在它在AI 2.0时代又重现了。这种心态导致部分大公司只愿支付很低的价格，大模型公司也只能给出折中的方案，达到惊艳效果的寥寥无几。

零一万物坚决做To C，不做赔钱的To B，而是做能赚钱的To B。所以零一万物在To B方面精挑细选，找那种公司上下都愿意拥抱新概念的公司，也为它们设计了 RAG 知识检索、专有云、微调等方案，在国内国外都有尝试。

无论To C还是To B，API都很重要，最近国内很多模型降价了，零一万物也推出了接入国际SOTA成绩Yi-Large大模型的API，也希望有机会可以跟各位合作。这个API背后的模型能力接近GPT-4o，但是价格是GPT-4的四分之一，我相信这可以帮助更多公司或者创业者达到所谓的TC-PMF。

黄铁军：谢谢开复老师对To B、To C的分析，很透彻。亚勤，刚才关于To B的观点，大家还有一个非常关心的问题，大模型产业的最大场景会在哪里？To B、To C在什么地方能够落地发挥作用？

张亚勤：在应用和服务层面，先面向消费者（To C）再面向企业（To B）。To B的周期相对较长，而To C的应用产品则可以迅速推出，这与过去的PC互联网和移动互联网的发展路径基本一致。在基础设施层，目前真正盈利的主要集中在To B领域，特别是在芯片、硬件、服务器等。像英伟达、AMD等芯片制造商，以及服务器、HBM存储、InfiniBand和NVLink等相关技术的提供商，他们目前是盈利最多的。

关于AI路径，我在过去十年中一直强调三个关键领域：首先是信息智能，其次是物理智能（现在流行的术语是具身智能），最后是生物智能。在具身智能阶段，To B的应用可能会比To C更快落地。然而，在生物智能阶段，情况可能相反，To C的应用可能会先于To B出现。尽管每个领域的具体情况可能有所不同，但总体来看，无论是To C还是To B，都将存在开源模型、商业闭源模型、基础大模型，以及针对垂直行业模型和边缘模型。

黄铁军：具身智能今年特别热，关注度特别高。讲到具身，通常像机器人，人形机器人、轮式机器人是一大类，第二大类是车，也是一个驾驶场景上的具身智能。还有无人机，在空中飞将来也是一种形态。甚至于大家可以想象出更多的身体形态，更多的具身智能可能性。我想请问，你们认为，具身智能这么多可能性里面，到底是热门的人形机器人会先有机会，还是已经有相当多积累的自动驾驶会有机会？

张亚勤：从百度阿波罗开始有七年、八年时间我一直在从事无人驾驶研究，无人驾驶L4+是具身智能第一个、最大的应用，也会是第一次实现新图灵测试的应用。无人驾驶它本身就是一个开车的特殊机器人。无人驾驶最近有很多好消息，它的安全性已经比人类驾驶要高至少10倍，不管是Waymo在旧金山的结果，还是百度阿波罗在武汉大范围的商业运营。最早在阿波罗开始的时候我就要求，自动驾驶安全性一定要比人类驾驶高出10倍。

尽管安全性很好，当前无人驾驶仍存在一些挑战，就是它虽然开得安全但不够老练，不够老司机，驾驶太守规矩了，不会超速或压线。无人驾驶要变成主流，要通过新图灵测试的话，需要是好司机，也需要是老司机。我认为无人驾驶在明年会成为第一个真正实现具身智能或者物理智能的AGI。

另外再讲一点，大模型的推出，帮助无人驾驶解决了很多原来的问题。比如长尾问题、数据生成问题，百度已经积累了1亿公里的驾驶数据，1亿公里虽然已经很多但数据仍然不够，生成式人工智能可以生成很多数据。大模型的应用使得无人驾驶系统能够实现端到端的智能化，同时也意味着无人驾驶会有更高的智能性，还将加速其在实际场景中的落地应用。

李开复：我同意亚勤的分析。在创新工场，我们也投了大概6家左右的无人驾驶公司，发展都不错。现在无人驾驶面临的一个巨大机会，就是终于可以落地了。在L2、L3阶段，包含城市自动小巴等等场景，无人驾驶都可以真正创造价值，这是很让人欣慰的。到L4、L5阶段，要无限制地开到开放场景，全球都面临着挑战。我在美国的时候看到了Waymo进展是不错的，依然在往前推进。特斯拉推出的FSD，虽然不是完全的大模型，但是是用了类似end to end（端到端）的概念。至于不用FSD方案能产生多少产业价值，我希望我们投的5、6家公司和亚勤的前公司都能够证明，中国能做得很好，也许这就是很大的市场。

过去这一年我专注于零一万物，我没有做自动驾驶的研究，但是我确定FSD会带来新的机会。把大模型的概念放到无人驾驶里面，这是我非常期待能够在下一阶段看到的事。但是这需要巨大的投资，不见得适合初创公司来做。

讲到具身智能，它跟亚勤说的一样，是物理世界跟AI的结合，这是很重要的。但是我也必须说，大模型是非常适合虚拟世界的，在金融公司的后台、客服等等场景，大模型很快就可以落地产生价值。如果你的需求是软件，直接对接大模型就好了。一旦大模型接入物理世界，就需要面临各种问题，有安全问题、机器问题、机械问题、故障问题等等，难度会大很多倍。

从创业者的角度来说，虽然现在具身智能一时比较热，有一些创业者涌入了，但是对于大部分创业者来说，如果希望短期落地产生价值、能赚钱，肯定还是做虚拟世界要远远容易很多。具身智能是重要的，它可以很好地结合大模型多模态能力，而且一旦具身后就可以产生数据，形成数据飞轮闭环，有很大的想象空间。但是短期要做好，难度很大。

具身智能肯定要走很漫长的道路，而且对于人形机器人我有一些特别的看法。绝大多数应用场景并不需要人形机器人，炒菜机器人应该长得像锅，吸尘器也长得并不像人，没有必要。像是波士顿动力那种很酷的、跳来跳去的机器人，真的会有很多应用场景吗？绝大多数场景几个轮子不是更容易移动吗？很多科学家和创业者都是从小热爱科技，希望能复制一个人，这无可厚非。但是如果你很简单地问VC，VC给出的恐怕是更务实更理性的判断。

张亚勤：我补充一点，最近经常有人问我，通用人工智能到底什么时候可以实现？我比较乐观，我认为15-20年内可以实现，并通过新图灵测试。0至5年内，在信息智能领域，对语言、图像、声音和视频的理解、生成等方面通过新图灵测试。0至10年内，在物理智能领域，实现大模型在物理环境中的理解与操作能力，通过新图灵测试。0至20年内，在生物智能领域，聚焦人体、脑机接口、生物体、制药和生命科学，实现大模型与生物体连结的生物智能，通过图灵测试。要是三年前问我这个问题，我可能会说50年实现AGI，这几年随着大模型的发展，我认为除以2,20年能实现。

黄铁军：这个通用人工智能，包括今天的大模型或者未来几年能实现的，在信息空间里大模型的认知能力通常的评测水平，比如说到了大学、到了博士、到了专家、到了学者，甚至于科学家，这是一个通用性，不管什么学科都可以做，这是一种理解。但是刚才亚勤讲到，有了身体进入物理世界，甚至进入物理世界的具身智能，跟我们今天讲的通用人工智能又有所不同。也就是大家讲的AGI。GAI、具有通用性的人工智能和AI领域说了这么多年的AGI是不一样的。AGI是要超越人类的，AGI是有自我意识的，AGI不仅仅是智能水平超过了人类，而且有自我意识，要有自己的目标、做出自己的判断。你们刚才谈到的是指这样的AGI吗，还是只是说前面一种？

李开复：AGI的定义是因人而异的。如果把AGI定义为能做人所能做的一切事情，那么我今天没有办法定义，因为它还有太多未知的东西还没有被解。但是这种定义只把人当作金标准，似乎就是问车什么时候能跟人跑的一样快，但是车在很多场景已经比人跑得快很多了，只是有些场景没法胜任。我个人会说：只要Scaling Law继续，只要AI一年比一年更聪明，它会多做比如5倍的事情，IQ会提升20个点。

但是，它聪明的方向，能做的事情也许是人从来都不能做的，不见要能做人做的每件事。因为我是做投资和创业的，我想看到的是巨大的商业价值。从这个角度来说，我们不会太纠结是不是能够百分之一百做到人类能做的事。如果世界上有一万件事情，AI在9000件上做得比人好，有1000件人做得比较好，这样也挺好的，要给人留一点空间嘛。

谈到虚拟跟物理世界，我还想再补充一点。在虚拟世界里，Agent还是非常重要的，因为人的Intelligence不只是回答问题，是要知道“怎么把事情做出来”。而且如果是谈创造商业价值，Agent帮你把东西买了，帮你把事情解决了，这个是有很大的商业价值，也是贴近AGI的重要一步。

张亚勤：我刚才讲的20年实现AGI，不包括拥有意识或情感。我对AGI的定义有三点，第一是要有巨大的能力，要能在大部分的任务要比人类强，而不是所有任务均超越人类。第二，它是必须要是通用的，过去每个任务都要用不同的模型，但是AGI是要有一个通用的大底座，当然可以有小的垂直模型，但它本身具有通用性。第三是不断升级、学习、进化，就像人类一样。我不认为现在的Scaling Law，或者我们现在做的研究会让AI产生意识，并且我也不认为我们应该从事这方面的研究。我们还是要解决真正的问题，把人工智能作为我们的工具、我们的延伸、我们的Agent，而不是另外一种物种。

黄铁军：从工程、从应用、从商业、从所有的角度，可能没人想去做一个超越人类的、有自我意识的AGI。但是最近OpenAI发生的事情，从去年年底开始，IIya和Altman的争论观点就是两点：你不想做但是它们可能就要出来了，出来之后我们就面临着失控的巨大风险。你们认为这种风险存在还是不存在？

李开复：我觉得存在的，但概率不会很高。如果我们越来越依赖Reward model完全让AI自己找路径的话，发生的概率或许会增高。当然，当前大模型的训练方法还不至于让大家担忧过度。不管在哪个时代，我认为技术是中性的，每个科技时代有技术带来的“电车难题”，最后人类都用了有效的方法解决了。所以，我对此是持谨慎乐观的态度，短期最担忧是坏人用它去做坏事。中长期看，我仍然建议尝试用“以子之矛攻子之盾”——用更好的技术解决技术带来的挑战，让“AI for Good”，真正造福全人类。

张亚勤：随着AI的能力不断扩大，风险也在不断扩大，所以现在考虑到未来的风险是很重要的。我不担心所谓的AGI会出现意识，会掌控人类。我担心的是如果现在不重视AI的治理，当AGI达到一定的能力并被大规模部署，那么可能会有失控风险。目前AI仍存在可解释性问题，未来机器人数量可能会比人要多，那么当大模型被用到基础物理设施、金融系统，包括国家安全，军事系统等方面，就可能会有失控的风险。因此我主张一定要现在开始把AI治理重视起来。对于技术发展我永远持乐观态度，我认为我们人类有两种智慧，一种是发明技术的智慧，一种是引导技术走向的智慧。我认为我们会达到平衡，但前提是现在要采取行动。

【以下为月之暗面、百川智能、智谱AI、面壁智能四家大模型独角兽会议实录】

王仲远：再次欢迎杨植麟、小川、张鹏、大海来到现场，这一环节是巅峰对话环节，讨论通往AGI之路。

各位是头部大模型公司的CEO，请教各位大模型是否是通往AGI之路的基石？有人说它依然是数据的压缩，对产业界非常有价值，但并不一定能够通往AGI。

杨植麟：我们认为大模型是第一性原理，需要不断提升模型的规模。就像仲远刚刚说的，它确实本质上是一个压缩，但这个压缩可以产生智能，随着不断规模化这个模型，不断做更好的压缩，它能产生越来越多的智能。

当然，这个过程中会有很多挑战，比如最大的挑战是有一些数据并不一定有那么多，在数据没有那么多的领域或者假设你在最后要做出来一个比人类更好的AI，你可能根本不存在这样的数据，因为你现在所有的数据都是人产生的，所以最大的问题是怎么解决这些比较稀缺甚至有一些不存在的数据，但是规模化定律或者大模型本身可能是没有太本质上的问题。

王小川：刚才一直在提大模型通往AGI是否是基石，我认为“基石”这个词是没有问题的。今天我们看到了带来提升，它只是在逼近AGI，今天大家看到了Scaling Law是第一件事。今天还有一件忽略的是把语言放到大模型里，把语言变成数学，我们往前走，语言把这个符号主义跟连接主义之间产生一个突破，除了规模以外，符号（主义）和联结（主义）的融合是中间的一件事情。

再往后走还必须有范式改变，比如大模型靠数据驱动学习能够做压缩。之前像AlphaGo那种自我思考的系统也会有这样的作用。所以我的结论是，一个是我们到了AGI的时代，这个时代里我们能够有足够科学家进来、更多资源进来，能够走向AGI。但是以现在公开大家看到的Scaling Law这个事情是做不到AGI的。

张鹏：要说大模型是不是一个基石，同意小川说的，它肯定是基石，是不是“之一”？这是另外一个问题，这个问题涉及怎么定义AGI。刚才开复和亚勤聊到AGI到底怎么定义，也跟这个定义有关。

站在我们现在看到的角度，我觉得做人工智能这波人挺实用主义的，所谓的实用主义就是咱们“不看广告，看疗效”，这个东西能不能解决问题，能不能真的向我们每个人心中定义的AGI路径上帮我们推进一步，大模型目前在很有效的推进这件事情，我们的Scaling Law还在有效、还在往前前进。至于它是不是能够帮助我们推到顶峰上去，我们现在找不到一个确切的答案，但是我们相信它在这个阶段是有效的，所以我认为它肯定是基石，至少是基石之一，这个没问题。

李大海：我个人是数学专业毕业的，所以我会比较严谨地去表达，我认为大模型一定是通往AGI这个方向上当前所有技术里能走得最远的，它能不能直接达到，现在还有很多未知因素，包括刚才提到的定义是什么。

我提一个大家没有提到的点，现在的大模型作为知识压缩，主要是在处理人的大脑系统1的工作，这种“慢思考的系统2的做各种各样推理，搜索空间去做搜索、组合，来完成一个任务，这样的能力是未来大模型通过agent技术外部化或者把它内化为自己的能力，这是需要大家去探索的。

仲远：关于AGI的定义，似乎没有广泛的共识。各位心里认为什么叫AGI？

杨植麟：首先，AGI的定义是重要的，但并不一定现在需要精确的、有量化的定义，它可能是一个定性的、感性的东西，它最重要的作用是能让这个社会或者所有人能够对接下来要发生什么事情有一个准备。因为也许这个技术节奏非常快，我们如果能够知道AGI是什么样的，如果能够定义，可以更好的准备这件事情，不管是每个人职业，还是接下来这个行业怎么发展，首先这个是重要的。

第二个，也一定程度上在短期内需要一些量化，因为如果没有完全量化，没有办法衡量AGI开发进度是什么样的，所以短期来说这个是很难的问题，也是很大的挑战。

王仲远：我们需不需要图灵测试？

杨植麟：传统的测试现在不完全适用了，即使它通过了图灵测试，但是还有很多事情是人可以做得非常好，但是AI基本没法做的，现在有大量这样的事情。我觉得这不是一个很容易的问题，你需要对里面评估维度做很多拆分。比如会有不同的能力，知识能力、推理能力、创造能力，评估的方式完全不一样，这是大家很多人在关注的问题，是非常重要的。

王仲远：小川咱们上次在央视对话栏目提到去年是智能纪元的元年，这个智能纪元是对AGI的元年吗？

王小川：大家以前讲图片识别很厉害、无人驾驶很厉害，我特别喜欢你刚才的这个问题，就是什么是AGI的定义，在全球里很难有完整的共识。大家都是学数学的，通过变换，把它从一个空间换成另一个空间来判断。在我看来，我用一个大家可以评测的指标来看，在我心中是接近等价的，是什么？是能不能造医生。为什么出这么奇怪的一个题目？之前我们谈AGI，一种理解是把它当成工具来看，我认为这次AGI的第一个变化是它开始有思考能力、学习能力、沟通能力、共情能力，甚至多模态图片处理能力。从它的学习范式要求里，我反而觉得我们就是像在看人一样看它的，一种做法是跟人差异化看。

但是从我们今天大家共识的评价指标或者学习范式里，就是在向人学习，数据来自人类社会产生的数据，所以我是拿人的职业跟它比较。医生在所有的职业里是智力密度最高的一个行业，既需要多模态，也需要少幻觉，也需要记忆，看70万字的病历，有推理能力、查文献能力等等。所以把医生跟AGI做比较时，做到医生是否就算做到AGI了？这可能有一种声音：医生只是一个Vertical，医生比这个低。人造医生太难了！这里面有太多幻觉问题，有太多推理能力不可靠。如果医生比AGI低，医生造不了，咱们就别谈AGI这件事情。但是如果医生比AGI高，医生只是造人的各个种类中的一种。在我的逻辑里，医生和AGI可以基本划等号。

数学上有个题目，就是自然数和偶数哪个多？我们第一反应是偶数比自然数少，偶数是自然数的子集，数学上应该知道它们是一样多的。因为每个自然数乘以2就是个偶数，它们两个是可以映射的。把自然数的偶数做一个映射，把今天行业上能共识的能力，都可以映射到对于医生的要求里去，因此拿这个作为一个标准。人造医生就是AGI。

王仲远：谢谢小川。大海，你被cue到了。作为数学家，你对AGI怎么去理解？

李大海：我会尝试从经济学的角度来定义AGI。从经济学的角度讲，如果我们去执行任何一个任务，边际成本都为零，这就是我们理想中的AGI。回到我刚才说的，为什么我认为大模型能够走得最远，就是我相信大模型能够把边际成本一直往下降，可能会逼近于零。就像植麟刚才讲的，很多时候需要我们在各行各业的数据产生一个飞轮，逐步让模型持续训练、持续学习，让整体的成本降下去。

我们去年看到行业里面大家去做大模型落地的时候，很多的场景都还需要做微调，这个边际成本就很高。我们相信，随着模型能力的提升，慢慢从微调逐步地只需要做Promot generate，慢慢地连Promot generate都不需要做，模型直接就问你到底有什么需求。如果你讲不清楚，我来问你。通过这种方式，我相信未来的门槛会越来越低，成本会越来越低。低到接近于零的时候，我觉得AGI基本就到来了。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。