在围绕智能网联汽车电子与软件创新发展展开深入研讨和交流合作的一场峰会上,小鹏汽车自动驾驶负责人李力耘发表演讲,以下为演讲实录。
非常高兴来到美丽的滴水湖,向各位领导和嘉宾介绍小鹏汽车在“AI定义汽车”新时代做出的探索。
如果说新能源汽车革命的上半场是电动化,那么新能源革命的下半场则是我们的智能化。小鹏汽车从成立之初就矢志不渝的投入汽车智能化的研究,从2019-2023年我们按部就班持续不懈的不断推出我们在智能网联汽车上新的成果。
2021年1月份,我们推出了行业首个基于高精地图高速导航辅助驾驶,并且融合了导航显示的一个虚拟SR。在2022年9月份,我们小鹏汽车率先在全国推出了基于高精地图的城市导航辅助驾驶。在之后几个月里面我们不断迭代,在2023年的7月份,我们完成了首个BEV架构下的导航辅助驾驶融合,在北京首发了覆盖北京各个环线和高架的导航辅助驾驶。非常高兴和大家分享在11月29日,我们小鹏汽车全量推送了XOS 4.4.0软件,这是我们向全国25个城市开放了我们不依赖于高精地图的城市导航辅助驾驶能力,这也是我们一次里程碑式的推动,也是行业内率先首个大规模不依赖于高精地图大范围导航辅助驾驶的量产软件的推送。
在这里想和大家分享的是,智能驾驶我把它叫作是“旦用难回”的体验,从今年国庆期间的数据来看,城市导航辅助驾驶的渗透率到达了82.6%,整个国庆期间我们的用户使用导航辅助驾驶以及辅助驾驶功能跑了一千多万公里,整个自主泊车被使用了31万次。很多时候智能辅助驾驶的使用是有一些门槛,但是一旦当用户习惯于双击拨杆或者按摩按钮进入我们导航辅助驾驶的功能后,智能驾驶是一个一旦用上了,就会非常喜欢用,很难回头的一个功能。
智能驾驶的挑战我们认为有以下三点。
中国有535万公里广阔的开放道路,这些开放道路有多少能够被导航辅助驾驶功能覆盖,是我们面临的第一个挑战,目前全国高速高架的高精地图是一个开放的状态,但是不同城市对于自己城市的高精地图的制作都有自己的审批,所以535万公里的导航辅助驾驶覆盖是我们辅助驾驶能够做到真正普惠全民重要的指标。
智能辅助驾驶的体验,我们做过一个统计,70%的驾驶里程其实都是在日常常用的通勤线路上,如何做好通勤线路上整个驾驶的体验是智能辅助驾驶需要解决的第二个重要问题。当然安全和信任始终是辅助驾驶的基石,如何解决好各种各样的问题,给用户建立起安心感、可靠感,也是辅助驾驶要面临解决的第三个挑战。
应对这些挑战,我们小鹏汽车提出了两个产品线,首先是不依赖于高精地图,使用轻地图XNGP导航辅助驾驶系统。其次基于用户高频通勤路线推出的AI代驾,我们立志于打造一个全国都能开、全城都好开的智能辅助驾驶系统。我们的XNGP事实上已经具备了全国泛化的道路可以驾驶的能力,我们已经在祖国广阔的天南海北进行测试,这是我们在新疆乌鲁木齐、内蒙古乌兰察布以及广西北海,在中国各个地方展开的泛化性智能辅助驾驶的测试,我们会有序的来确保开放的城市是经过充分测试,有着良好的体验和质量。但是泛化性上来说,整个基于纯视觉的XNGP已经具备了相当的,哪里都能开的能力。
基于轻地图不依赖高精地图的XNGP试驾系统,相比于以前高精地图方案具有非常大的优势,首先道路的渗透率提高了73%,这是因为高精地图制作具有很高的成本,使用轻地图方案的XNGP可以很好的提高我们对小路的渗透,不仅如此,我们开放城市的速度也比以前提高了20倍,并且整个维护的成本降低到原来的1/10,这也是为什么我们能够按部就班不停开放更多的城市给我们用户的支撑。
在将来即使在没有开放的城市我们也会使用影子模式,希望我们朋友越来越多,帮我们跑的路也越来越广,开放城市的速度也会越来越快。我们AI代驾产品打造的一个核心就是体验,我们希望一次学习就可以可用,并且不限城市,持续根据用户的通勤路线来迭代我们的体验越来越好。
支撑XNGP跟AI代驾的底层系统架构,就是我们提出Xbrain,这样一个面向全场景的智能辅助架构。Xbrain的核心由两大部分组成,首先是新一代具有空间理解能力的XNet,另外是具有推理能力的规划和控制系统XPlaner,在这个基础上我们也会持续的叠加对于通用模型和大语言模型的能力,让我们的车越来越聪明。打一个比方,一套强大的智能辅助驾驶系统需要一个非常强的眼睛和大脑,这就是我们下一代超强空间感知系统XNet 2.0,在这个基础上还需要非常灵活和聪明的小脑和手脚,这就是下面要和大家分享的XPlaner。
我们XNet 2.0是一个具备空间理解能力的下一代感知系统,它最大的核心是已经融合了这样一个叫作三网合一的概念,包括我们的动态网络、动态XNet、静态网络、静态XNet。动态网络主要是对路面上可以移动的动态参与者,包括车辆、行人、自行车的识别和跟踪,静态网络其实更难,它是对整个道路的结构,车道线、标线、红绿灯这样一个识别和检测。在这些需要监督学习训练的数据之外,其他任何有可能阻碍车辆行为的都是我们的占据网络,把这三个网络合在一块会给我们很大的优势,能够给我们提供一个对世界非常完备的充分理解。这里的技术挑战就在于我们真正实现了一个三网合一的架构,从网络设计上,数据标注、数据训练上,都是一个三网合一的状态,这样一个三网合一给我们带来的整个感知范围提高200%,相当于1.8个足球场的感知范围。
不仅如此,我们感知的类别也是丰富多彩,包括了儿童、小动物,甚至警察或者特种车辆、减速带等等各种各样的识别类型。作为一个辅助驾驶系统,可能总有一些路上不在我们训练范围内的物体,我们基于最新科研成果的纯视觉的占据网络,能够很好的来应对我们没有鲜艳信息的物体。不仅如此,我们的XNet还具备了一个初步的时空理解能力,比如说在我们路测过程中会发现例如天津这个城市,它的红绿灯很多是进度条类型的,我们最新XNet2.0可以使用时空理解能力,来赋能我们动态和静态网络,让他们更加聪明,能够去更加广泛的识别更多交通元素。
说完了聪明的眼睛和大脑,下面想和大家汇报一下我们灵敏的小脑和手脚,也就是基于神经网络的控制和规划系统。
最初基于高精地图落地的时候,传统决策规划系统往往是基于很多鲜艳的规则或者是建模,具有很多不够自然或者看似决策不够长、不够自然的特点,其实我们细称为这个感觉叫作铁轨感。但如果我们使用了最新的,基于长序列的一个神经网络,来学习人类的驾驶行为,我们就可以做到分钟级别较长的决策,并且具有多对象同时决策的能力。作为一家量产的OEM,我们永远会以规则作为一个兜底,所以我们永远会保证规划系统既能够拟人,也能够安全。
在我们XNet和XPlaner的背后,达到很强的泛化能力智能驾驶系统,背后我们更注重的是全站数据闭环能力,这也是能够支撑我们快速迭代一个重要的后台系统。这里我强调的是一个全站闭环的重要性,不管是模型更新还是代码改动,甚至是标定改动,甚至是原始数据采集的感动,我称作打通任督二脉,从感知到融合到规划到控制,来评估整个系统的行为。这样一个高效的数据处理,保证了效率极高,如果单点数据返回的问题,往往可以在小于24小时之内做出简单的修复,在这样闭环能力的支撑下,我们基于XNGP这样一个无图城市导航辅助驾驶接管率不仅没有上升,还下降了38%。
大家都说新的时代是AI定义汽车的时代,其实AI不仅定义了汽车,AI也在后台不停去帮助我们汽车来进行迭代,我们会利用AI生成极限的场景,来确保我们用户数据返回的任何一个反馈都会体现在下一版软件的所有车上。
最后和大家汇报一下小鹏在智能辅助驾驶上未来的计划。其实到现在是11月底,我们已经支持了全国25个城市的导航辅助驾驶,在12月底我们会在此基础上开通到全国50个城市的导航辅助驾驶,我们的目标是在2024年底实现全国的导航辅助驾驶,真正做到与我们XNGP和AI代驾能力,给每一个用户能够使得全国都好开,全程都好用,不仅仅是一句口号,更多是扎扎实实的体验,来赋予我们的用户。
(本文根据现场速记整理,未经演讲嘉宾审阅,仅供参考。)