99%依赖神经网络!特斯拉FSD重大更新,V12到底有什么不一样?

特斯拉FSD V12的推出将实现全新的“端到端自动驾驶”,第一次开始使用神经网络进行车辆控制,不再需要此前超过30万行的代码,减少了对硬编码编程的依赖,或将成为特斯拉在AI和自动驾驶方面的关键时刻。

11月25日,媒体报道,特斯拉已开始向员工推出全自动驾驶(FSD)V12版本,更新版本号为 2023.38.10。很快,特斯拉CEO马斯克也在X上确认了这一消息。

本月早些时候,马斯克宣布特斯拉FSD V12自动驾驶将在2周内上线试用,但市场普遍对这一时间点表示怀疑。现在看来,FSD V12版本正步入面向客户前的最后一步,或许能够在今年问世。

为何大家会如此期待特斯拉的FSD V12?

最为重要的原因便是,特斯拉反复强调的,FSD V12将实现全新的“端到端自动驾驶”,第一次开始使用神经网络进行车辆控制,包括控制转向、加速和制动,不再需要此前超过30万行的代码,而是进一步依赖神经网络,减少了对硬编码编程的依赖。

马斯克在此前的试驾直播中表示,FSD Beta V12是有史以来第一个端到端AI自动驾驶系统(Full AI End-to-End),从头到尾都是通过AI实现。我们没有编程,没有程序员写一行代码来识别道路、行人等概念,全部交给了神经网络自己思考。V12的C++代码只有2000行,而V11有30万行。

简单理解就是,V12把摄像头获取的图像数据输入到神经网络,网络能够直接输出车辆控制指令(如转向、加速、制动等),更像是一个人类的大脑,99%的决策都是由神经网络给出的,不需要高精地图、不需要激光雷达,仅仅依靠车身的摄像头视觉输入,就能分析思考,输出控制策略。

媒体分析认为,FSD V12版本的推出将成为特斯拉在AI和自动驾驶方面的关键时刻。这不仅仅是技术实力,还关乎将AI与人类行为如何更好融合。

对于新架构的技术细节和潜在影响,市场仍有较多疑惑和分歧。根据特斯拉对外披露的信息及马斯克在X上发布的信息,中信证券认为,特斯拉内部目前有两条“端到端”路线同步在研:1)级联式端到端神经网络;2)World Model,而FSD V12是前者的可能性较大,有望于明年初落地,以更好地实现L3能力。

"端到端自动驾驶"有何不同?

在FSD V12之前,特斯拉的自动驾驶系统一直依赖于规则判断。

靠着汽车的摄像头识别车道、行人、车辆、标志和交通信号灯等,然后通过特斯拉工程师们手动编写的数十万行C++代码来应对各种情况,比如红灯停、绿灯行、在没有足够快的车辆冲撞时才通过十字路口等等。

但现在,作为特斯拉自动驾驶系统最重要的一次升级,FSD v12只是通过给神经网络“喂”视频,让它不断学习,优化参数,在分析数十亿帧人类如何驾驶汽车的视频自学了驾驶。

中信证券指出,从技术本质来看,级联式端到端神经网络,系统从输入到输出,全程使用神经网络算法,无需任何人工规则介入。当前,自动驾驶模型多为模块化架构,感知预测、规划、控制等不同任务分属于多个不同的小模型,且下游规控环节普遍仍以规则为主。

而“端到端”神经网络在输入图像后,可直接输出转向、刹车、加速等控制指令。为提升训练效果,“端到端”的大神经网络可能由多个小的子神经网络级联而成。

但与传统模块化架构用“规则”连接模块不同,级联式神经网络的子模块是以“神经网络”的方式自行训练堆叠,因此可通过数据驱动优化整个端到端模型,避免“局部最优,而非全局最优”的困境。

端到端/神经网络的核心好处在于模型迭代的关键由“工程师”变为了更易于规模化的“数据和算力”,因而训练效率和性能上限有望得到显著提升。落到实处,中信证券认为,端到端方案所展示出的性能潜力有望大幅提升自动驾驶系统的接管水平,从而实现真正无可争议的L3能力(例如达到每周接管1次)

但端到端模型的“黑盒”问题目前产业界尚未有十分成熟的解决方案,因此中信证券认为,其最终能否迈向追求极致安全性的L4全无人驾驶仍待观望。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
相关文章