自动驾驶的GPT时刻,来了吗?

腾讯研究院
端到端的方法在自动驾驶中显示出其优势,能够更好地处理交通环境中的复杂交互,提供更顺滑的驾驶体验。

近日,多家大厂都放出了在自动驾驶领域的最新进展。特斯拉最近推出了V12版本的FSD,在驾驶体验上有很大的提升。“萝卜快跑”在武汉上路测试刷屏全网,无人驾驶出租车订单量激增。Robotaxi已经成为自动驾驶落地的一个重要场景。那么,自动驾驶行业开始进入快速发展的阶段了吗?无人驾驶出租车(Robotaxi)距离真正的商业化还有多远,将面临哪些挑战?

7月19日,腾讯研究院联合腾讯科技,邀请AI及无人驾驶行业专家发起《AGI路线图:自动驾驶的GPT时刻来了吗?》直播。

本期嘉宾

肖仰华 上海市数据科学重点实验室主任/复旦大学计算机系教授

王琦 腾讯自动驾驶决策规划控制团队负责人

大卫 惠尔智能 CEO 百万粉丝播客《大小马聊科技》主理人

张俊伟 美国硅谷大厂工程师/天使投资人

观点速读

1.自动驾驶技术进步显著:过去几年中,无人驾驶技术取得了显著进步,尤其是大规模神经网络的端到端学习技术变得成熟,这对无人驾驶行业的发展至关重要。

2.技术与商业化的结合:自动驾驶技术的商业化不仅依赖于技术进步,还受到资本市场反应和商业模式的影响。不同公司在技术路线选择和商业化策略上存在差异。

3.端到端学习的重要性:端到端的方法在自动驾驶中显示出其优势,能够更好地处理交通环境中的复杂交互,提供更顺滑的驾驶体验。

4.特斯拉的独特优势:特斯拉在自动驾驶领域具有独特的优势,主要体现在其数据体系和算力的整合,以及其车型平台的统一性。

5.Robotaxi的商业化挑战:Robotaxi的商业化不仅面临技术挑战,还涉及成本、法规和社会接受度等多方面因素。

6.人与车辆的关系:人在开车时不仅是完成驾驶任务,还是整个车辆的管理者。

7.无人驾驶的安全性问题:自动驾驶的安全性仍然是一个关键问题,特别是在处理长尾场景和特殊情况时,需要结合端到端和传统专家系统的方法来提高安全性。

8.未来自动驾驶的愿景:未来自动驾驶可能会改变城市交通和停车模式,减少城市拥堵和停车需求,提高城市空间的利用效率。

9.人机共存的未来:自动驾驶技术的发展不一定会完全取代人类司机,未来可能会是一个人机共存的局面,无人驾驶系统可以作为“机器外脑”,提高驾驶的安全性和效率。

10.技术成熟与社会适应:无人驾驶技术的成熟速度可能会比预期更快,但社会结构和关系的适应是一个缓慢的过程,这可能会影响无人驾驶技术的大规模普及。

自动驾驶的发展现状

徐思彦:对于自动驾驶,很多人是既熟悉又陌生,自动驾驶的热潮比这一轮大模型要早开始好几年。但是在过去的几年当中,也遇到过很多的低谷,但随着这一次Robotaxi再次进入大家视野,我们惊喜地发现,在过去的几年,无人驾驶已经进步了很多。今天我们也非常开心请到了四位行业内的专家来跟我们共同探讨无人驾驶的进展。大卫作为自动驾驶领域的亲历者,你怎么看过去几年自动驾驶行业发展状况?

大卫:我觉得自动驾驶的发展可以从三个角度看:技术、资本市场的反应和商业化进程。

首先,技术上,如果我们继续采用车顶装激光雷达和相机的方案,这种方法和特斯拉的无图方案有很大区别,直接影响商业化进程,因为成本不同。国内很多创业公司,包括百度,都是用类似的方法,无论是大模型还是小模型,技术底层都差不多。

第二点,资本市场,自动驾驶经历了多次波动。从2017-2018年的创业潮,到疫情初期的冷却,再到2021年的重新升温,以及最近又因其他新技术的出现而降温。资本市场的反应对自动驾驶公司非常重要,直接影响公司能否长期发展。因为技术还难以通过商业化自我维持。

第三点,自动驾驶的商业化程度。萝卜快跑最近很火,但它的商业化数据有水分,只是覆盖了单车的运营成本,离真正盈利还有距离。传统做L4的公司如果转向L2、L2+或L3的项目,已经看到一些商业化的曙光。尤其在国内激烈竞争的电动车市场,技术发展远超北美。例如,我现在开的韩国现代IONIQ 5在自动驾驶和辅助驾驶上很弱,但价格接近6万美元。在中国,这个价格的车体验完全不同。

我先讲这三点。

徐思彦:从技术上的角度,现在自动驾驶主流的发展路径是什么样的?

肖仰华:从人工智能的发展历程来看,无人驾驶技术已经发展了很多年。最近,大家觉得无人驾驶的落地速度在加快,一个重要原因是大规模神经网络的端到端学习技术变得成熟了。特别是在Sora出现后,它强大的世界建模能力对无人驾驶行业非常重要。

这是一个重要的转折点。之前的大多数无人驾驶方案是非端到端的,各个模块堆叠在一起。即使每个模块的准确率达到99%,整个方案的准确率还是无法接受。所以,端到端的环境建模和还原是无人驾驶技术能够落地的重要原因。这主要得益于近年来深度人工智能的发展。因此,现在谈人工智能的落地,都离不开这个大背景,这与以往的AI技术有本质区别。

王琦:这两年最大的一个变化就是从传统方法向端到端的过渡。传统方法现在遇到了一些瓶颈。传统方法把各个模块分开,比如感知、决策规划和控制,特别是感知和决策规划之间。传统方法有一个清晰的定义,即比较显式的定义。感知的输出是一些物体,比如车辆、行人等,通常是以物理量输出的,比如边界框及其方向、加速度等。

我们在测试过程中发现,交通环境中的元素、人和车之间的互动不是那么简单。我举一个例子,我们的一辆测试车发生了接管事件。它是在一个很小的路口发生的,我们在后台查看接管后,分析为什么会接管。看所有的物理量和数据时,无法理解为什么会接管。因为分析不出来,所以我们问了安全员司机,司机说,当时车在行驶时,对面来了一辆车,想要左转,对面的司机提前打了一个手势示意他要左转,希望让一下,但从车辆的物理量上看不出任何变化,所以司机停下来让他过去。

这是一个例子,包括在平时测试中经过人行横道时,路边有行人,其实也有交流,但不能体现在物理量的变化上。如果希望通过传统方法去定义这些人的姿态甚至头的朝向,太复杂了,几乎无法想象。

端到端的方法可能是实现更高级自动驾驶的好方案。比如,当有交互时,可以提前停车,减速度更小,行车体验更好。如果等到物理量变化时再响应,时间很短,可能会产生急刹。

从这个角度来看,我觉得未来端到端可能是提高驾驶体验的好方法。从交通环境的复杂程度来看,人和人之间的交互不是冷冰冰的。传统的模块化方案,比如感知,定义好了接口,感知输出什么样的对象,就要对这些对象进行标注,训练人工标注成本很高。希望模块化最终实现单一模块化,输入一张图像,输出司机的行驶轨迹或油门刹车,省去中间所有环节的标注成本。

传统的模块化感知和PNC,或感知和控制,中间有灰色地带,经常有技术上的沟通问题。如果是端到端,都可以省掉。谢谢。

徐思彦:在硅谷体验了几个不同的无人驾驶的产品,你自己的体验是什么样的?

张俊伟:我觉得开起来很顺滑。旧金山的路况跟重庆有点像,高低起伏很多,所以在那运营是个挑战。我和之前的同事聊过,他们觉得在旧金山达到现在的表现已经很好了。Waymo在正式上线前,大多数情况下已经达到了这个水平。这说明他们在推广时并不激进,法规可能也走在前面。其次,特斯拉的FSD(完全自动驾驶)确实很顺滑,特别是在简单的道路上,基本可以不用管。

这件事的发生有很多原因。过去十年里,很多人做CV或现在做ARP。大家不断改进技术,终于有了一个统一的CVARP transformer模型,结合了sales attention和cross attention,再加上黄教主的算力支持。现在有终端和云端的协同,国内的地平线也有芯片制造经验。各方面共享资源,加上资本和学界的推动,transformer相比于之前的rule-base有很多优势。

举个例子,如果在夏天,一个人打转向时突然雨刷动了,self attention能知道这只是按错了,而以前的工程师写的代码无法处理这种情况。

由于transformer的自适应机制和算力提升,很多以前隐藏的问题现在都可以描述出来,让驾驶体验更像人开车一样顺滑。现在我们有大模型language LLM和VLM。在自动驾驶中,安全性要求很高,不能有任何差错。以前的传统算法无法处理很多长尾场景,比如Waymo曾经被驴撞的事故,这是很难预料的。

多模态输入,比如图像和点云,可以通过一个架构处理,VLM可以帮助识别长尾场景。比如前面货车掉下一个BBQ架子,你要躲避,而掉下一个塑料袋则可以继续前行。以前用点云检测只能识别21个物体,现在VLM能提升自动驾驶技术的长尾场景识别。我们可以看到,资本、学术和工程各方面不断努力,终于有了突破。

徐思彦:听了各位的分析,我们或许可以推断,端到端在技术上是一种更合理的进化方向。那么现在除了特斯拉以外,其他的厂商会不会考虑用端到端的解决方案?

大卫我觉得大部分公司现在很难转型到端到端。为什么这么说,因为自动驾驶可以分成两个方面。一个是像我们知道的Waymo。在国内就是百度的萝卜快跑,或者像文远、小马这些公司提供的服务。这些公司提供的是出行服务,而不是技术。你不关心车顶上的雷达和相机,或背后的算法。

Waymo车后备箱里用了两块A100显卡,每块显卡价格接近2万美元,光显卡就快4万美元。整个Waymo车成本至少15万美元。你开一台奔驰S600在路上就是这个概念。在国内,这个成本基本上是人民币50多万。所以出行服务公司为了提供良好的体验,必须用大量传感器和强大算力来支撑算法和车辆,以确保足够的冗余,把你从A点送到B点。

对于大部分汽车公司来说,比如特斯拉或小鹏,它们的目标不是提供出行服务,而是卖车。卖多少车直接影响股价。我们要把这分成两个世界来看:卖车的公司对成本非常敏感,每增加100块人民币对主机厂来说都很重要,因为这直接影响利润率和消费者是否愿意购买大模型这套体系,或者说以视觉加无图和大模型为主的体系,不用激光雷达这些贵的传感器,也不用高精地图。这套体系省钱,因为大模型的训练成本长期来说小于传统的基于规则的系统。

我觉得出行服务公司已经无法转型了,或者说已经在这条路上走得太远,无法回头。现在要做基于大模型的东西,可能要推翻之前的工作。市场和资本是否能支持推倒重来是一个问题。

对于主机厂来说,我觉得它们还是有一个窗口期,特别是那些数据平台做得比较好的公司。体系已经搭建起来了,有不少车在路上跑,可以实现数据闭环,再做算法闭环。这是可行的。如果车卖得不多,还要搞大模型就很难,因为差距太大。

徐思彦那我们是不是可以推断,现在世界上只有特斯拉有这个能力去做端到端的模型,甚至在未来变成一家提供运力的公司?

大卫这个问题非常好,说实话,我觉得特斯拉确实在这方面独步天下。他们用了车载硬件,现在叫HW4.0,当然HW5.0也有了。相比之下,和用Nvidia的公司比,从数据层面来看,HW4.0的绝对算力远低于英伟达,甚至和地平线的J5差不多。为什么表现这么好?因为它还有一个庞大的体系,就是它的数据体系和算力都是自己的。无论是DO有没有出来,这么多显卡都是他的资产,另外还有百万的车在路上跑,源源不断地提供数据。实际上,特斯拉做的最正确的一件事就是没有推出特别多的SKU。不像蔚来、小鹏或其他国内造车新势力疯狂推新车。

特斯拉说到底,Model 3和Model Y是同一个平台,你甚至可以理解Model Y就是Model 3,只是高度增加了,前向相机的Z轴稍微高了一点。大部分BEV的数据在这一个平台都可以共用。从创业至今,特斯拉一款车型在路上跑,有几百万车主给它源源不断地贡献数据。在这个级别,特斯拉在全世界是没有对手的。丰田和本田虽然车卖得多,但那些车大多是非智能化的车。国内可能卖得比较好的像理想这些公司,一个问题是SKU有点多,比如L9和L6甚至是Mega并不在同一个数据平台。虽然这些车每个月销量过万,在中国算是不错的销量,但和Model Y这款“神车”比,量还是太小了。所以,如果在这个节点回答思彦的问题,可能只有特斯拉有独步天下的技术和前瞻性。

Robotaxi的商业化之路

徐思彦:刚刚第一个部分,大家已经回顾了一下自动驾驶整个的发展历程,并且我觉得嘉宾们都有一个比较一致的判断,端到端的这个架构在自动驾驶上是非常领先的,而且是未来的一个发展方方向,第二个部分,我们就想讨探讨一下robotaxi现在的发展情况和商业化之路。

徐思彦:如何看待之前的无人自驾驶出租车试运营?

肖仰华:从商业模式的角度来看,现在还很难说,因为大家都在试点阶段。大家提到技术路线时,说到一种方法是端到端,但投入大成本高,只有像特斯拉这样的巨头才有资源。另一种是传统的堆叠式方案,基于专家系统和规则,但隐性成本也高。我认为这两种路线的结合才能使无人驾驶最终安全可靠。99%的情况下,端到端驾驶就够了,但1%的特殊情况还是需要传统专家系统。哪怕只有1%的情况出问题,也会对生命安全造成重大影响。尤其在我国的路况下,车与车、车与路、人与人之间的关系都很复杂。端到端模型只考虑车路环境和人的控制,但人为什么采取某些动作,涉及到社会认知。大模型在这方面能力有限,远不如人类。所以,做好与人的协同和传统专家系统的协同很关键。技术和安全的问题,需要时间解决。无人驾驶落地需要安全可靠,可以先尝试在一些受限场景中探索,比如固定路线的货运或者小开放城镇。

徐思彦:大卫最早就是从特殊场景切入来做无人车的,可以分享一下你的经历?

大卫:最早我们做的是无人配送,叫最后一公里配送。从仓库或饭店把外卖或产品送到家门口,而不是做机器人出租车。我们发现机器人出租车并不是一个好生意,但我并不是反对同行做这个。我仍然非常尊敬那些公司,只是分享我的感受。

在美国情况是,因为运力不足且客单价高。美国一英里大约一块多美元,而中国的差距在于汇率。美国的出租车行业可能更容易盈利。而在日本,因为老龄化,出租车司机多为老年人,无人驾驶出租车会是一个增量市场。

还有一个误区是把L4等同于无人出租车。L4是对车自动化的一种分级,满足一定条件就是L4。特斯拉的FSD在宣传上有一点误导,虽然在L2上做得很好,但不能完全满足L4的要求。所以特斯拉用户经常会有惊喜,但这并不代表技术已经很成熟。

最后,L4不等于无人出租车服务。无人出行服务涉及车内外的多个维度。车内的舒适度和服务质量也很重要。例如,你在手机APP上定了一个位置,但车不能准确到达,这会影响用户体验。所以我认为L4技术还有很长的路要走。

徐思彦我们的无人出租车服务到底需要什么级别的自动化?未来的安全员和自动驾驶系统应该如何配合?

大卫:萝卜快跑的无人出租车背后有一个实时控制系统。遇到问题时,比如前面有个老人摔倒了,你可以用这个方向盘来控制车。车会实时响应你的操作。这个控制模块连接到车的can bus,通过5G或4G连接到服务器,再到你的方向盘。就像直播一样,是实时的。不过这很危险,一旦信号中断,控制车就会有问题。

美国公司有两种技术路线。一种是半依赖车的自动驾驶。在高精地图上重新规划路线。如果你不熟悉这个技术,我可以解释一下。车在高精地图上有一条规划线,基于高清地图和语义地图,每个点都标记好,车沿着这些点前进。

一种技术路线是像美国的zoox,他们会帮你重新连接这些点。比如前面有个三角锥或老人挡住了,远程控制的人不是实时控制方向盘,而是重新连接点。车不会从自动驾驶模式切换到人工驾驶模式,而是继续在自动驾驶模式下,从新连接的点开始走。另一种方法是我们的客户使用的,车有自动驾驶能力。你确认后给一个指令,比如往左或往右拐,拐完后车会继续自动驾驶。这两种方法都不是萝卜快跑的实时控制。在我看来,实时控制车非常危险。

王琦:我比较同意大卫的说法,就是如果Robotaxi和L4本身这个技术,其实在它的实现层面是有一定差的。我们现在要讨论的一个问题是,人对于一辆车到底意味着什么。在我看来,人开车的时候,不只是完成驾驶任务,他其实是整辆车的管理者。就像一辆列车一样,它有一个列车长。列车长的作用不仅仅是开车,他还要负责关注车的行驶,以及管理很多其他的任务。车上的各种状况他都要管理。

比如说你今天接了一个乘客,这个乘客晚上喝了酒,上车就开始睡觉。在下车的时候,如果没有人在,你能仅仅用语音把他叫醒吗?你可能得推他一下吧,如果推完他,他还没醒,他的呼吸不正常,那你可能得把他送到医院去。作为一个车的管理者,我们看到的有些场景是在路口发生拥堵时,交警过来指挥。如果没有人,你就无法与交警进行有效的交互。甚至有一些情况,比如两边的路都堵了,只有一个单行道能通过,对面也来车了。这时候如果有人的话,你可能会把车窗摇下来,跟对方说话,甚至下车与对方交涉,设计一个方案,让出空位,才能通过。

人是车辆的管理者,驾驶只是他所有工作的一部分,虽然是最重要的任务,但除此之外,还有很多其他任务。就像刚才举的喝酒的例子,发生的概率非常小,可能你开一两个月才能遇上一次,但如果遇上了,你就必须解决,不能不管。这些事情是我们目前技术的发展还没有很好解决的问题。我对Robotaxi的看法是,如果你真的想替代现有的出租车业务,这些问题必须有一个合理的解决办法。

徐思彦:未来可能出现没有方向盘的无人出租车吗?

王琦:我们在深圳有一个在建的办公园区,腾讯总部园区是一个半岛,主要用于办公和商业。我们的目标是实现园区内的接驳服务,方便员工通勤和游客观光。企鹅岛未来可能会成为一个旅游景点,所以周末会有游客。我们计划推出自动驾驶的观光车,并在观光车上应用一些现有的技术。

在研发过程中,我们遇到了一个有趣的场景。我们的车是独立设计的,与普通车不同。它没有前后之分,可以正着开,也可以倒着开,而且没有方向盘。要实现端到端,首先需要人机共驾。而人机共驾的前提是需要方向盘和司机的输入。现在的问题是,我认为未来自动驾驶会发展到一个阶段,与我们遇到的问题类似。你的自动驾驶已经非常好,不需要再和人类学习。那时你会移除方向盘。这样技术如何迭代就变得遥远了。目前我们主要解决端到端的问题。未来没有司机的输入,移除方向盘后,它就不迭代了吗?肯定会迭代,而且要比人做得更好。

还有一个问题。现在评价端到端时,大家常用一个词:“他的驾驶行为更像人”。但像人就意味着更好吗?当然,人驾驶时往往是比较合理的,但人在车内关注时有盲区。学车时教练常说:“让速不让路”。为什么?因为人在同一时间只能关注一个方向,比如前面突然发生事故,你要急刹车。这时不能打方向盘跑到另一个车道,因为你关注前面时,无法关注左后方或右后方。这是人的注意力局限。

对于自动驾驶,这种情况成立吗?不成立。为什么?因为自动驾驶是360度的,装了许多传感器,全部都能看到。我认为端到端能学到人的优秀驾驶行为,但人的驾驶局限性也可能会体现在端到端的模型里面。肖老师刚才提到,我们未来可能要结合这两种方法,才能得到最优的驾驶体验!

徐思彦:对于这个自动驾驶来说,端到端现在能让它更快的像人一样去驾驶,但是这并不是最终的一个解决方案。马斯克自己也说,他希望他的Robotaxi是没有方向盘,没有后视镜的。它的设计应该跟现在的汽车是完全不一样的,这样子的未来离我们大概有多远?

张俊伟:马老板之前说8月8号,但现在推到十月。他不知道原因,可能是技术不成熟,或者他自己想推迟。他说要基于robot taxi,打造自己的原型车。马老板每次都会提出大计划,虽然有限交付,但已经比很多人强。他当时说到100的时候,我们可以给他打一个折扣。

刚才王琦博士虽然举了很多酒驾的例子,但我们不得不承认,在正常驾驶情况下,技术确实有帮助。比如,工程师写代码时,大家担心大模型会导致失业,初级工作会减少。比如在东南亚,我们公司以前有100个客服写手,现在可以减少到50个。驾驶方面也是这样,技术进步后,人们可以把时间和精力用在其他地方。这是一个事实,不管我们愿不愿意。我们需要不断进步,而不仅仅是讨论问题。明年我们在技能上总要比今年有所进步。自从进入农业社会,人类就一直在进步,这是不可避免的。

徐思彦:我同意俊伟的看法,因为这件事的发展,有各方面在推动。除了特斯拉这样的车厂,还有新的运营公司,他们都会在这个方向努力。不仅是中美,其他国家也会参与。当越来越多的公众觉得Robotaxi的成本低于传统出租车时,他们会在正常情况下尝试Robotaxi的服务。它不一定要现在取代所有的出租车服务,而是可能先从取代10%到20%开始。

Robotaxi的社会影响

徐思彦:但是我们接下来要讨论的第三个部分也是Robotaxi的社会影响和面临的问题。现在除了技术,还有很多其他问题,比如政策和法律。在美国,大家一直认为卡车是一个很好的应用场景,因为长途卡车司机容易疲劳,事故率也很高。但是到目前为止,我们还没有看到自动驾驶在卡车司机群体中的大规模应用。是不是有工会或者其他因素的影响?

大卫:任何一个AI技术,不仅是自动驾驶,都可能影响人力。它是补充还是替代?首先,美国是一个资本主义社会,工会力量大并不代表不可取代。比如,美国卡车司机的平均工资约为16万美元。这是因为他们花了很多时间在路上,远离家庭,而且一天不能工作超过一定里程。对沃尔玛、可口可乐等依赖卡车运力的公司来说,如果新技术更便宜,他们肯定会采用。

另外,我想强调为什么美国没有出现冲突。百度的萝卜快跑在展示时采用了高补贴。一方面吸引普通消费者,另一方面挤占市场。而中国公司在商业逻辑上和美国公司不同。比如,旧金山的Waymo和Uber价格一样。Waymo背靠Google,却没有采用低价补贴,因为这不符合商业逻辑。美国公司不愿意这样做,因为这会提高压力阈值,长期来说伤害市场。

这是一个商业逻辑问题。过去,人类发展中,有电话接线员和打字员的工作消失了,但这些人并没有饿死,而是去做了别的工作。每次产业革命都是增量市场,不是存量市场博弈。

肖仰华:我认为整个社会要考虑如何安置被新技术代替的劳动力。我们应该抓住这波人工智能的发展机遇,但是不能再走互联网的老路。当年互联网的发展,比如电商,不管线下商店需不需要,我们直接代替了很多线下工作,看似提高了效率,但也带来很多问题。比如现在很多学生喜欢点外卖,身体素质下降,吃外卖的时间并没有用来锻炼身体,而是做了其他事,虽然效率提升了,但也带来了社会问题。

我认为大模型或者人工智能的to C应用要考虑社会成本和治理代价。但在工业、制造业、航天航空等领域,可以大规模推动AI的生产力提升。在面向普通消费者的应用,尤其是涉及大量岗位的领域,我们要慎重。

徐思彦:最后,我想请大家畅想一下未来。五到十年后,如果自动驾驶技术安全性超过了基准,它有可能大规模普及,甚至改变汽车的定义。马斯克畅想过他的Robotaxi可以在空闲时间为车主带来额外收益,成为一个生产力工具。这样的未来有可能实现吗?

王琦:我觉得很难预测实现的时间。虽然我们有很大进步,但还有一些现实问题。但从十年的跨度来看,还是有可能实现的。

我在视频网站上看到一个国外专家分享未来自动驾驶的愿景。他说了很多,但有一点很吸引我。如果城市里所有的车都是自动驾驶的,不管是出租车还是私家车,就不需要在办公区或家周围停车了。这样城市里就不需要再有停车场了。大家可以想象,城市里很多地方被停车场占据。尤其是像北京的一些狭窄小区,路边到处都是车。如果实现自动驾驶,车可以停在郊区的停车场,早上来接你,送到办公区后就离开,不需要停在办公区周围。这样城市里会有很多空闲区域,可以变成公园或活动场所,活动空间会变大。这是我觉得很吸引人的一点,城市环境会有很大变化。

还有一个问题是马斯克的共享出租车。我的理解是车空闲时可以替你跑出租。但我很难想象怎么操作,因为私家车是私人空间,像手机和电脑。你能想象把空闲的手机或电脑租给别人用吗?大部分人做不到。同样,车对很多人来说是第二个家,尤其有孩子后,后备箱可能有尿布或帐篷。如果要在空闲时租出去,这些事情怎么解决?

徐思彦:可能就像滴滴刚出现时,大家谈论的是共享经济的概念,就是你有空时可以去跑滴滴。但后来你会发现,大多数还是专业司机在开车。无人出租车也许也会这样演变,一开始是共享的概念,最后变成大家把它当作理财产品去投资,可能不是买一辆,而是买十辆。如果这个东西有利可图的话,这是我的猜测。

大卫:我觉得在一定范围内,我们可以实现纯商业化运营。比如在旧金山的市中心,或深圳的南山区和福田区,这些高附加值区域,从技术层面是可行的,尽管可能会牺牲一些效率。比如说,robot taxi 可能需要20分钟完成一个原本15分钟的路程,但价格会便宜一些。我不确定具体哪年能实现商业化,之前我们说2018年或2020年是自动驾驶的元年,但现在是2024年了,所以具体哪一年并没有意义。

但是我们会看到,L4级别的技术会大幅度提升乘用车和商用车辆的安全性。现在很多车都有高级辅助驾驶,你可以在车上做更多事情,比如聊天或看短视频,而不用一直盯着路面。这也是一种驾驶体验的提升。同时,L4级别的技术也会大幅度提高安全性,因为高级辅助驾驶可以将每个车主的驾驶行为数据化和可视化,这甚至会改变保险行业。

汽车保险业之前是通过统计数据来估算保险费率,比如丰田凯美瑞的事故率和车主画像。但特斯拉已经开始根据车主的具体行为来定制保险,这是一种更精准的方法。高级辅助驾驶能提高车辆的安全性,同时根据具体车主的行为定制保险。这些都是未来会出现的变化,但不会一下子就实现Robotaxi的全面普及。

徐思彦:谢谢,我觉得大卫的总结非常好。我们不用站在这个事物的两个对立面,并不是说Robotaxi成熟了就一定取代司机了。我们首先面对的未来可能是人机共存的。之前WAIC上我们提了一个概念叫”机器外脑“,无人驾驶系统也是我们开车的时候的外脑,可以使我们的驾驶过程变得更安全。

徐思彦:最后,我们请这个肖老师给我们这次的线上圆桌做一个简单的总结吧!

肖仰华:无人驾驶是一种先进的技术和生产力,它迟早会实现。从技术角度来看,我认为技术成熟的速度可能会比预期更快。最近几年的技术进展远超需求。关键在于谁能把现有技术融合成成熟的产品,并利用大规模数据找到有效的落地模式。我相信技术很快会成熟。我认为不需要十年。

真正阻碍无人驾驶大规模使用的更多是社会因素,比如保险业。无人驾驶推广后,保险行业和出行行业都会发生变化。这些变化是社会问题,需要缓慢有序地调整和过渡,否则会带来社会震荡。未来的问题更多是该不该,而不是能不能。社会结构和关系需要慢慢适应这种先进生产力,这可能是未来的重要问题。这种考虑可能会让无人驾驶的大规模普及成为一个十年周期的现象。

本文作者:腾讯研究院,来源:腾讯研究院,原文标题:《自动驾驶的GPT时刻,来了吗?》

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。