(报告出品方/作者:华鑫证券,林子健、谢孟津)

  01 特斯拉视角:智驾历史复盘

  智能驾驶设计理念分类:模块化vs端到端

  模块合成式驾驶方法:包含感知、规划决策,执行控制三大模块,通过分别调试每个模块的参数来适应各种各样的驾驶场景。(1)感知模块:利用各种传感器来实现对静止环境、行车相关信息及移动障碍物的全面检测和跟踪,进而将场景图像转化为关键感知指标。 (2)决策模块:在完成道路交通场景的感知后,从感知模块获取全局和局部信息,对起点到终点的行驶路线进行分析和规划,确定车辆的行 驶路线并最终输入执行模块以实现车辆控制。(3)控制模块:负责将来自决策模块的行驶策略转化为具体的车辆控制指令,实现车辆的实际运动。 端到端智能驾驶方法:端到端智能驾驶方法本质上是使用一个独立系统进行驾驶,通过训练一个深度神经网络从感官输入(如摄像头采集的 道路信息)直接映射到驾驶动作。

  感知侧走向端到端历程

  端到端的设计理念是输入原始数据后,直接反应输出结果,最早可追溯到上世纪80年代。1988 年,第一辆端到端驱动的陆军救护车 ALVINN ,当时还没有出现卷积神经网络 CNN,只构建了一个三层可反向传播的全连接神经网络,并在卡内基梅隆大学的校园内以 0.5m/s 的速度准确的行驶了 400 米。相比规则驱动,端到端的框架更为简洁,应用潜力更大,但受制于神经网络模型的发展,一直未在产业中大规模落地使用。

  2014-2016年以规则驱动为主:由Mobileye提供智驾解决方案。早年的特斯拉并没有自研自动驾驶芯片,从2014年开始特斯拉与 Mobileye合作,在其量产车型上一直采用Mobileye的EyeQ3技术方案。Mobileye届时的算法主要由规则驱动,以单目相机成像测距为例 ,通过物体在图像中的像素高度h和焦距f,即可计算出前方车距。 2016年特斯拉和Mobileye终止合作:①导火索:2016年5月第一起配备 Autopilot 的Model S发生致命事故,无法识别白色拖车和天空; ②核心原因:Mobileye提供的车企的是一个封闭的黑盒方案,车企不仅不能修改其中的算法,而且还不能与Mobileye共享车辆数据。

  CNN极大提高了机器视觉的识别效率,让机器视觉走向深度神经网络结合的端到端架构成为可能。从机器认识一只狗的过程来类比,此前的 DNN网络依赖于先认识狗的每个“细胞”,而CNN则从认识狗的一个部位开始,例如眼睛、耳朵,来判断一只图像为狗,其中涉及到三个 主要的不同: (1)不需要认识图像的全部,识别难度降低;(2)通过局部特征训练出来的神经元,能更好的迁移到其他图像(从认识狗的专家,变成认 识耳朵的专家);(3)卷积过程降低了图像特征的维度,减少数据量。

  深入来看,CNN神经网络的效率核心在于卷积+池化的过程。相比全连接DNN神经网络,CNN需要训练的参数数量明显减少。举例来说, 一幅像素为1K*1K的图像作为输入,Hidden layer有1M节点,仅一层就有10^12个权重需要训练,如果使用CNN网络,采用100*100的卷 积核,共使用100个卷积核,输入到Hidden layer的参数便降低到了100*100*100=10^6个。 如果说CNN将管理100人的工作变成管理10个组长,那卷积核就像不同的组长 :不同的卷积核代表了不同的特征提取能力。该结构上下层 不再直接全部连接,同一层将共用单个或一定数量的卷积核,因此大大减少了训练权重的数量。

  规控侧2021-2023走向端到端

  2021年,特斯拉开始在路径规划层面部分加入神经网络的元素,推出蒙特卡罗树与神经网络结合的算法。在2021年的Tesla AI Day上 ,特斯拉用寻找停车场的路径规划作为案例,对比了传统的两种人工规则代码和结合神经网络的第三种算法:推出的Monte-Carlo Tree 结 合神经网络的算法,可以将潜在路径的可扩展次数从传统A*算法的接近40万次降低到288次,但这个阶段并非全部都使用了神经网络, 大部分依然是人工规则代码。

  2022年特斯拉在规划层将BEV空间融入神经网络结合的蒙特卡罗算法,进一步实现规控端的端到端。特斯拉推出的交互搜索网络 ,将结合神经网络的蒙特卡罗算法应用到Occupancy网络中,用轻量级的问询网络替代了传统的优化方法,可以将每个动作计算 耗时从1到5毫秒降低到100微秒。同时,计算出的每个轨迹都会有一个成本函数,这一部分仍然是基于规则的代码,该函数取决 于 4 个因素:碰撞概率、舒适度、干预可能性和人类操作相似性。

  特斯拉的数据引擎进化史

  数据引擎的核心在于提高模型的泛化能力。现实驾驶情景中存在大量的conner case,特斯拉建立数据引擎通过车端的影子模式发现特定 问题>数据挖掘:自有车队或仿真模拟获取类似数据>数据标注:自动标注+人工标注>数据训练:在线训练+离线训练>重新车端部署。特斯拉在2019年首先提出数据引擎闭环,2022年对三个方面实现改进:(1)仿真模拟;(2)自动标注;(3)云端算力。

  改进一:现实车队数据+模拟仿真数据。 (1)车队的数据:特斯拉的数据可以通过现实车队获取。通过14000+个视频就显著降低将“静止车辆”视作“待行车辆”而误停的概率。 (2)模拟仿真数据:提供现实车队中难以获得的数据来源,进一步提升获取相同场景数据的效率。一般来说,首先会从真实世界获取初步的 标注数据,基于此获得基本的道路情况,进而可以对情景进行不同的路标、天气、道路线等条件的模拟。

  改进二:自建千人团队,从2D人工标注到4D自动标注。获取大量数据之后,需要有一个标注“清洁”的过程,符合条件之后才能使用。 数据的标注需要涵盖深度、速度、加速度信息。特斯拉2016年开始,仍是通过第三方外包数据标注,但存在响应慢,标注质量不够等问 题,到2019年开始自建1000人团队,从2D人工标注发展到4D自动标注。特斯拉自动标注系统可以取代 500 万小时的人工作业量,人工 仅需要检查补漏。

  02 从特斯拉历史出发, 看未来落地的研判框架

  感知侧算法逐渐走向收敛,特斯拉领先0.5-1.5年

  从算法架构来看,各厂商跟随特斯拉走向收敛,感知侧大模型普遍走向BEV+Transfomer+占用网络的架构。 从感知侧算法的推出时间来看,特斯拉领先国内0.5-1.5年时间,华为和小鹏相对靠前。

  数据竞赛:特斯拉里程数据加速积累,降价提高渗透率

  FSD V12推出以来,里程数呈加速向上趋势,4月累积里程突破13亿英里:特斯拉总的FSD行驶里程自2021年3月起稳步增长,初始阶 段增长相对平稳,2023Q4开始呈现出加速上升的趋势。FSD V12版本上线后,特斯拉的行驶里程迅速突破13亿英里。 全球渗透率从2024Q1出现回升趋势:从2016第四季度至2019年第三季度,特斯拉的市场渗透率呈现出上升趋势,从约10%增长到超 过40%。随后在2018年第四季度到2022年第三季度,由于价格的迅速上涨,渗透率迅速下降至约7%(侧面说明届时消费者为FSD买单 意愿仍不强),从2022年第四季度开始,渗透率迎来了另一轮的显著上升。FSD价格Q1进一步降低至8000美元买断,订阅价格从199美元降低至99美元/月:2023年推出端到端以来,特斯拉将数据获取放在首 位,推出首月免费及推荐积分等制度,同时进一步采取以价换量策略,将价格不断压低换取渗透率的提升。

  算法竞争落幕,数据驱动的时代下,工程化能力是竞争核心要素

  能力新高,干预里程数创FSD推出以来的新高:城区的干预里程数创下新高达203英里。根据FSD Community Tracker 的数据,特斯拉 的Miles to Critical Disengagement在V12.3版本后达到了新高203英里(平均每隔203英里才需要一次严重干预)。 无需干预比例提升显著。 根据FSD Community Tracker 的数据统计,从进入V12.3版本后,特斯拉无需干预(包括严重干预CriticalDE 和普通干预DE)的司机比例从11.4版本的47%提高到了12.3版本的72%,提升程度显著。

  硬件降本:模型升级的减配

  参考华为和特斯拉,在模型迭代升级的情况下减少了传感器的配置。华为 从ADS1.0升级至华为ADS2.0,减少了2个前视摄像头,3个毫米波雷达, 考虑车端算力等其他配置,综合成本预计下降1-2万元。特斯拉从HW2.0 走向HW3.0的过程中,将部分车型毫米波雷达和超声波去掉。

  政策法规两个趋势:事故定责+数据安全

  事故责任方面,参考海外有望进一步降低消费者事故成本,明确简化智驾提供商的定责方法。参考海外经验,在定责流程中呈现出更为 保护消费者的立场和趋势,明确特定条件下,智驾提供商应该更多或者无条件承担责任。 数据安全方面,特斯拉4月28日获批符合数据安全4项合规要求,有望加速落地入华。早在2021年,特斯拉CEO埃隆·马斯克就公开表示 ,特斯拉不会向美国政府提供在中国收集的数据,并强调公司在中国建立了数据中心,以确保所有在中国市场产生的数据本地化存储。 马斯克在4月28日访华,在北京与中国高级官员会面后,获得中汽协的数据处理安全4项安全检测的合规批准。

  03 国内各车企智驾能力分析

  维度一:数据积累能力理想较为领先,华为增长潜力较显著

  从数据积累能力看,特斯拉具备量级优势,每日新增里程2992公里,主要体现在北美的路况数据。 国内方面,理想凭借过去一年较高的销量,单日智驾里程数据排名第一,单日累计里程为247.8万公里。从未来增长潜力来看,华为凭借 智选和供应商模式,未来在数据增长方面更为突出。

  维度二:智驾好用维度,华为和小鹏靠前

  从智驾体验的总结四个核心指标来看:特斯拉的接管里程数上百公里,国内华为和小鹏领先,智驾使用的里程比例分别为22.1%和 20.4%。具体来看,小鹏和理想的数据皆为五一采集,直接可比的情况下,小鹏用户愿意使用智驾的比例显著更高。蔚来和华为的数据 皆为3月数据,直接可比情况下,华为更为领先。 特斯拉在海外路况可以实现326的城区接管里程。根据FSD Community Tracker跟踪数据,FSDV12版本的城区NOA接管里程显著提高。

  维度三:驾驶舒适度

  从驾驶体验的舒适度来看,问界M5表现突出,加速减速平稳丝滑。汽车平顺性是衡量车辆行驶舒适性的重要指标之一,对于提高乘坐体 验和保障行车安全至关重要。现有的汽车测试结果显示,问界M5的平均加速度与最大加速度均压到最低值,行车更“稳”,提升用户出 行体验感。

  维度四:安全性能

  从太平洋的AEB测试来看,华为智驾安全性能靠前。对安全性能关注度从L2开始就一直较高,太平洋智驾AEB测试结果显示,问界M9、 阿维塔12和智界S7均取得G级评级。在行人横穿、倒车遇人等情境下,能够自动触发紧急干预;项目最高通过车速均达到行业最高水平 ,应急情况更广泛。

  04 智驾拐点何时来临?

  智驾未来预演

  我们认为,汽车的下半场是智能化,智能化的下半场是城区NOA。 方法上,我们复盘高速NOA发展历史,认为城区NOA落地时间预计拐点2.5年,头部车企有望在2025年H1实现拐点。

  2023年高速NOA成为消费者考虑的主要参考因素

  2023年成为消费者考虑的必需功能条件之一,66.1%以上的用户的100公里接管次数降到1-2次以内。 2023年8月,亿欧智库招募样本量N=400的消费者调查,发现长期高速NOA功能每100公里的用户接管频率多为1-2次,占比62.5%。 2023年75%消费者表示需要高速公路和城市高架的智驾功能,其中约有41.1%的消费者表示高速NOA为消费者购买决策考虑主要的参考因素,90%以上的消费者都会考虑高速NOA作为购买决策之一。

  高速NOA与城区NOA第一个不同:驱动方式

  高速NOA时代背后是高精地图下的算法驱动,城区NOA时代是重感知下的数据驱动。之所以有这个转变,主要是因为如下原因:(1)高昂成本:促使智能驾驶选择“重感知,轻地图”路线。根据《智能网联汽车高精度地图白皮书》,实现厘米级地图精度的日成本高达千万元。而轻地图 对地图精度要求较低,运用感知硬件通过算法升级和适度减少地图元素的方式大幅降低了制作成本。(2)覆盖率低:城市复杂路况限制高精地图覆盖率,轻地图更具灵活性。城市路况复杂度高且变化较快,高精地图覆盖率较低导致Corner case问题频发。轻 地图可以通过传感器实时感知周围环境,及时更新地图信息,提供更准确的导航和路径规划,更灵活地适应各种突发道路因素。(3)安全性:高精地图的安全隐患,轻地图成为提升安全性的有效方案。高精地图标记错误、地图数据拼接不准确等问题会导致车辆莫名减速、被迫接管等, 而重感知、轻地图不依赖于高精度地图等外部信息,在地图数据缺失或不准确的情况下仍能提供较为安全可靠的自动驾驶体验。

  高速NOA与城区NOA第二个不同:事故成本不同

  当进入城区NOA,低速情景居多,消费者主要关心点从高速的“事故发生”本身走向事故发生后的” 责任划分”。对于消费者而言,我 们认为事故成本主要可以归为三类:安全成本+时间成本+经济成本。安全成本指的是事故本身对自己和其他人造成的危险,时间和经济 成本指消费者需要处理事故的时间和财力。城区NOA的事故成本有望降低,主要由以下几个因素: (1)安全成本由低速情景缓和:由高速NOA走向城区NOA,高速情景居多走向低速情景居多,人身安全后果的严重性和损害程度有望 降低。(2)经济成本和时间成本将由政策法规补偿:未来随着政策法规的完善,参考海外政策趋势,对消费者的保护逐渐加深会成为政 策未来主要走向之一,有望逐渐降低时间和经济成本。