“去美国体验了特斯拉FSD,上限很高,但下限很低。AI有20%-30%的错误率,一次错误就有可能导致车毁人亡。”在享界S9发布会上,华为车BU董事长余承东如是说。
发布会上,华为ADS 3.0首发,实现端到端类人智驾,叫板特斯拉。不过,特斯拉的作业可不好抄。
不是优化,是颠覆
自动驾驶最怕的就是碰到coner case(边缘场景)。在美国,就有整活老哥穿着“STOP”T恤,成功干蒙了Waymo的无人驾驶出租车。
以前,一旦出现一个 Corner Case,开发人员就需要敲下相应的代码来应对。但是,这些边缘场景是无穷无尽的,需要耗费大量人力来应对。现在,端到端来了,就不需要这些代码了。你要做的就是将老司机驾驶数据喂给大模型,让它凭借学习到的经验来处理这些Corner Case。
具体剖析来看,以前自动驾驶的流程是感知、识别、决策、执行。感知到环境后,先要用大量的模型去识别画面中有哪些内容,然后再根据既定的规则进行决策。但是,现在传感器感知到的画面并不需要一个个识别出来,直接拿这个画面用大模型去匹配,让大模型自己去学习、选择,形成决策。这就是所谓的端到端,省去了其中的识别和决策,由感知端直接到执行端,只要一个模型就够了。
相比V11的30万行代码,特斯拉FSD V12的C++代码仅有2000行。其中,V12.3版本用数百万个视频片段替代了超30万行C++代码。至此,特斯拉坚持“纯视觉”路线的真相浮出水面,在为端到端铺路。更可怕的是迭代速度,“小鹏汽车端到端模型能够做到‘2天迭代一次’,在未来18个月内,智驾能力提升30倍。”小鹏汽车董事长何小鹏表示,2024年第三季度,小鹏汽车的智驾即可实现“全国都能开,每条路都能开”;到2025年实现城区智驾比肩高速公路智驾体验。
特斯拉的上下限
余承东感叹,特斯拉的上限很高,成长得很快。
要训练大模型,就需要大量的数据和足够的算力。这就是特斯拉的上限,国内车企目前很难做到。
根据特斯拉的规划,今年10月,Dojo智算中心总算力将达到100E FLOPs,相当于约30万块英伟达 A100的算力总和。
正如余承东所说,特斯拉的上限很高,但是下限也很低。最大的问题就是端到端由于决策过程不够透明,难以解释其行为,一旦出现问题,无法对症下药,容易产生黑箱难题。
所以,一方面需要保证喂的数据不会有下限低的驾驶习惯。另一方面,需要有安全规则来兜底下限。比如,可以选择端到端与传统方案并行,端到端网络后接一些后处理模块或者强安全的代码。华为ADS 3.0有“本能安全网络”保底。
严格来讲,华为、理想、小鹏这三家车企推出的所谓端到端,更准确的叫法是“分段式端到端”,或者叫“模块化端到端”,将感知网络、规划网络分开,中间用规则串联。相比一张网的激进,分段式端到端具有更高的解释性。
不过,端到端终究只是手段,最终还要看智驾体验好不好。