上海汽车报电子报

2023年5月21星期日
国内统一刊号:CN31-0035

上海汽车报他山之石 智驾进城,一场陆地上的“登月竞赛”

按日期检索

12 2017
3
4

上海汽车报

电子报刊阅读器
放大 缩小 默认

智驾进城,一场陆地上的“登月竞赛”

2021年4月,一段极狐阿尔法S华为HI定制版在城区复杂场景中自行驾驶的视频刷爆全网。视频中,车辆灵活地穿梭于路况复杂的城市道路,司机全程没有接管。

对大多数行业外的中国人来说,这是他们第一次感受到自身能力被智能驾驶汽车挑战。

而在行业内,城市NoA(城市高阶智驾)的暗战已经打响,包括华为、小鹏在内的多个国内团队立项,尝试将其落地成为一个可以交付的产品。近两年内,不断有造车新势力、传统车企的智能电动汽车品牌、智能驾驶供应商等企业加入战局。

今年,城市NoA的竞逐在极短时间内从水下进入白热化阶段。十余家车企与供应商齐声宣布,将在今年开启城市NoA功能量产。

这背后,一场行业的集体共谋、一次技术范式的全面革新、一个史无前例的超级工程已然接连拉开序幕。

进城:从拼算力到卷无图

在智能汽车的叙事中,城市NoA被认为是通往自动驾驶的最后一块拼图,也是技术与商业的高地。

在此之前,冲向高地的最短路径是硬件堆料。高阶智驾的硬件军备竞赛在去年达到顶峰。

然而,拼硬件参数,行业风风火火;讲功能落地,大家唯唯诺诺。

去年,仅有华为(极狐/阿维塔)、小鹏在少数城市开通了具有试点性质的城市NoA,无论是车企还是消费者,对这样的进度都难言满意。

高精地图在今年被推到台前,充当罪魁祸首。

4月中旬,在问界M5智驾版发布会上,余承东透露,如果要做有高精地图的城市智驾全域覆盖,上海需要采集3.6万公里道路高精地图数据,但截至目前,只采集了2.2万公里数据,并且道路还在持续变化。

随着上海车展的临近,这场竞赛陡然提速。

随后1个月里,小鹏、华为、理想相继公开城市NoA规划。在行业集体奔涌的热潮中,乐观的声浪一波接着一波:今年将是城市NoA大规模量产元年。

冷静的声音显得稀缺而寂寞。

在3月底召开的电动汽车百人会上,地平线创始人余凯劝诫行业保持理性:“目前,L2++城区NOA还存在技术挑战,基本上每几十公里就需要接管一次,在研发上至少需要三年时间才会取得较好的进展,因此到2025年,高速NOA仍会是量产主力。”

但没人愿意克制,包括余凯的合作伙伴和客户们。

无论是面对生存难题的L4级智能驾驶公司,还是期望获得差异优势的车企都选择咬牙跟进。竞争压力不仅来自国内,也来自大洋彼岸。

今年,伴随ChatGPT的大火,泛人工智能领域的竞争再度升级,具体到智能驾驶行业,所有人都在关注特斯拉的节奏。今年年初,特斯拉向北美用户全量推送了FSD(Full Self-drving,实为高级辅助驾驶)。“FSD入华在即”的传言随即频繁响起。没人愿意赌FSD是否会涌现,成为智能驾驶的ChatGPT。在一定程度上,目前ChatGPT与城市NoA的技术栈同源,它们都采用了眼下让整个AI行业沸腾的神经网络模型——Transformer,名为变形金刚。

而在汽车行业,特斯拉最先将Transformer应用于量产车智能驾驶,比其他车企早一到两年。

升维:“变形金刚”的威力

2021年8月,特斯拉举办了第一届AI Day,打响了城市NoA竞速赛的发令枪。

在那届AI Day上,特斯拉发布了基于Transformer的BEV(智驾车辆在鸟瞰视角下的环境感知建模)。这项技术使智驾汽车的感知能力“脱胎换骨”,如今几乎被所有无图城市NoA方案采纳。

在此之前,量产车辅助驾驶的感知算法模块主要运行卷积神经网络CNN。作为商业化应用超过10年的神经网络,CNN成熟、易用,但构筑在CNN基础上的智驾感知“天花板”十分明显:在它的世界里,空间是二维的(缺少“距离/深度”维度),时间是断裂的(感知系统缺乏上下文记忆),各个传感器是各自为政的(各传感器的时空坐标系不同,导致数据融合困难)。如果以人类作比,这将是一位双眼散焦、“声画不同步”且注意力时刻涣散的糟糕驾驶员。这是辅助驾驶之前只能胜任简单场景的重要原因。

2021年夏天,特斯拉团队在连续试错后,选择了这样一条技术路径:

设计更庞大、更复杂、参数更多的感知算法模块,利用Transformer的注意力机制,将各个传感器统一到同一个连续的四维(三维空间+一维时间)时空。车辆进行驾驶决策的基础,不再是健忘症患者看二维图像,而是正常人看流畅的三维视频。智能驾驶迎来了一次“时空观”的飞跃。

2022年,特斯拉在新一届AI Day上推出了能够检测通用障碍物的Occupancy Network占用网络。同年,国内新势力车企相继完成了激光雷达的批量装车,智驾车辆的感知能力变得前所未有地强大,近乎成年人。众所周知,人类开车并不需要高精地图。由此,伴随着Transformer+BEV、占用网络的声名渐响,系统感知能力的史诗级提升,智能驾驶摸索出一条可以大规模、批量化进城的道路——大模型。

代价:大模型的门槛

无论是对特斯拉还是其他企业而言,大模型是一枚沉甸甸的硬币。

正面,是智驾系统上限的提升;反面,则是智驾整个体系架构的更改,形式上不能完全说推倒重来,但工作量与难度绝对是超级加倍。

原因并不难理解:基于相对轻量的CNN二维感知,升维到了基于Transformer的四维感知。升维的条件是,需求的数据与算力呈指数级增长,智驾数据收集、云端算法训练、车端算法部署三个重点环节需要全面革新。

在海量数据中训练海量参数的大模型需要大量算力,只有大型云计算中心才能胜任。并且,目前车端的智能驾驶芯片并不是为Transformer准备的。

算法快速演进的结果是,“针对Orin,英伟达在软件层面做了大量的优化与弥补,但本质上并没有解决硬件加速的问题。”理想汽车自动驾驶副总裁郎咸朋告诉我们。同样的情况对其他智驾芯片企业而言,大致成立。

这些芯片量产上车的时间将在2025年乃至更晚,但车企们等不及。今年,大疆车载表示,有能力在80T算力平台上实现城市NoA。而此前行业传闻称,大疆车载已经获得比亚迪城市NoA项目定点。

如果要保证体验领先,对一家车企的要求会是:在台前,有一个强大的产品与销售团队,打造并卖出了一大批智驾功能保持常驻的车队,以收集有效数据;幕后,需要一个质量极高的智驾团队,一边自行打造部分不成熟的工具,一边搭建起一条高度自动化的数据管线,对算法快速迭代。这将是一场名副其实的销金游戏。当然,这考验的不仅仅是资金,还有智驾团队和公司最高层领导的毅力与信仰。

活在物理世界的人类对活在赛博空间的ChatGPT仍有极大的宽容度。相比之下,人们对智能驾驶汽车的要求严格得多,不对等的责任与前景,使行业出现了AIGC吸引智能驾驶人才转行的迹象。

当下的现实是,人们对城市NoA需求最确切、最能减负的场景,如复杂十字路口通行(含转弯、掉头)、早晚高峰/节假日拥堵仍然是智驾系统的弱势场景。特斯拉在这条道路上一马当先。目前,特斯拉的FSD算法中,绝大多数已经实现神经网络化。根据马斯克画下的饼,FSD V12将更进一步实现端到端的智能驾驶,但具体时间尚未可知。

更多企业对端到端仍然充满顾虑,这将把智能驾驶整个系统“黑盒化”,缺乏可解释性,对问题的追溯与修正将变得更加困难。

对所有城市NoA的参与者来说,坏消息是,他们将要挑战的,很可能是民用工业有史以来复杂度最高、约束条件最苛刻、实现难度最大的超级工程。

而一个尚不知好坏的消息是,眼下,他们闷头向前,并不认为这是个坏消息。(文章来源:远川汽车评论 作者:熊宇翔)

放大 缩小 默认
关于我们 | 企业公示 | 手机版
主办单位:上海汽车报社有限公司 备案号:沪ICP备16052313号-2