车载测试之数据驱动+车云一体的关键作用

lsekfe 发表于 2023-6-30 10:58:06

前言
　　受技术发展、市场和政策等因素影响，主机厂和Tier1对布局高阶智能驾驶量产落地能力异常迫切。
　　技术驱动因素
　　随着AI芯片以及激光雷达、毫米波雷达、摄像头等传感器性能的持续提升，再加上成本的逐渐降低，行泊一体方案逐渐开始规模化量产落地。在未来，便会有大量搭载行泊一体方案的新车上路，可以采集到更多有价值的数据，然后通过数据驱动的方式推动NOA、AVP等高阶智能驾驶功能不断地完善和进化。
　　法规政策驱动因素
　　我国一直高度重视自动驾驶产业发展，国内相关法规政策不断推进自动驾驶测试和运营的相关立法，大力支持发展相关技术和产业。2022年8月1日，国内首部L3法规在深圳开始落地实施，开放L3准入，明确事故权责认定，该法规的实施对于高级智能驾驶功能上车而言是重大利好。
　　市场驱动因素
　　在国内乘用车市场，高阶智能驾驶辅助功能渗透率不断提升。据工信部相关数据显示，2021年中国L2级辅助驾驶乘用车新车市场渗透率达到23.5%，2022年上半年其渗透率增加至30%，并且渗透率还在持续不断提升。有机构预测，到2025年，中国L2级以上智能汽车的销量将突破1000万台，渗透率将达到50%。
　　据麦肯锡调研报告显示，智能驾驶功能对于消费者购买汽车决策的影响已处于前位。显而易见，在现阶段，没有丰富的智驾配置和良好的智驾功能体验的汽车已经丧失了部分竞争力。在未来，尤其是对于中高端电动汽车品牌，如果不具备高阶智能驾驶功能量产能力，很有可能将完全失去竞争力。因此，决胜自动驾驶下半场，车企和Tier1必须提前做好高阶智能驾驶系统的量产研发布局。
　　规模化量产与数据闭环
　　1.1 规模化量产与数据闭环相辅相成
　　当前，高阶智能驾驶功能落地的最大阻碍就是无穷无尽的Corner Case所带来的安全隐患。解决这些“长尾问题”便需要建立数据闭环体系，不断收集数据，丰富场景库，通过以道路测试为辅，仿真测试为主的测试方式，不断地去发现和攻克一些平时很难遇到的“极端工况”场景。
　　实现数据闭环是具备高阶智能驾驶量产能力的前提，而高阶智能驾驶量产后，可以进一步获取更多有价值的数据，有了这些数据的“喂养”，才能推动数据闭环体系持续不断地高效运转。
　　1.2 数据闭环的构成
　　通常来讲，一个完整的自动驾驶研发数据闭环包括数据采集、数据回传、数据标注、模型训练和仿真测试等几个关键的环节。
　　首先，企业通过专业采集车、测试车或者量产车进行数据采集，然后将本地数据进行归类、脱敏、压缩和打包，通过4G/5G上传至云端服务器。在云端，进行数据标注，把标注好的数据放入到训练平台进行模型训练去获得相应的模型，模型持续优化迭代之后，经过嵌入平台移植到量产车中。
http://www.51testing.com/attachments/2023/06/15326880_202306291602011tkM6.png
数据闭环流程示意图
　　1）数据采集
　　当量产车达到一定规模后，采集的数据量会很大。有专业人士测算：如果按照10万辆车，每年累计采集300天估算，未来车企所面临的数据总量将会达到ZB级。如此多的数据如果不进行有效筛选全部上传到云端，对传输带宽、云端的数据存储和处理也会带来很大的压力。那么，如何从海量数据中筛选出有价值的数据进行高效回传，是影响高阶智能驾驶系统迭代速度的关键。
　　有以下几种常见的智能化数据采集方式：
　　A.车端设置Trigger层
　　根据模型失效分析以及模型决策边界分析，提前设定要采集的场景并制定采集逻辑，然后，在车端设置trigger层（数据回传触发器），再根据场景算法检测，自动化获取所需要的场景数据集。
　　B.针对特定场景通过智能化打标签进行数据采集
　　对于一些需要在云端主动积累数据进行学习的场景，比如隧道、环岛、无保护左转等复杂工况场景，开发人员可以上传需要车辆获取的图片，通过云端下发指令，车端会采取类似“以图搜图”的方式，遇到类似的场景自动截取下来。
　　2）数据回传
　　车端采集完数据，需要将数据进行归类、脱敏、压缩和打包，通过4G/5G上传至云端服务器。但是，数据传输的上下行链路比较长，并且车联网的链路通常不太稳定，汽车在快速行驶的过程中可能会跨不同的基站，存在4G-5G切换的情况，会导致信号在传输过程中存在丢失和乱序的情况发生。那么，该如何保证各链路节点的数据传输速度和质量呢？
　　针对数据传输的一些问题，部分企业已采取车云一体传输方案，例如智协慧同通过云端数据管理的SDK vCloud进行数据切片的组合，对切片采取校验和补传机制，对丢失的数据切片进行补传，等数据补传完整之后再进行存储，保证了数据传输的完整性。
　　3）数据标注
　　车端数据回传到云端后，还需要经过数据标注，这些数据才能变成算法模型能够使用的样本数据。标注就是将编码值分配给原始数据的过程，从而将标注好的数据作为AI练习认知的训练数据。编码值包括但不限于分配类标签、绘制边界框和标记对象边界等。
　　随着智能驾驶技术的不断迭代，智能驾驶系统对感知模型精度的要求也越来越高。因此，提升车辆感知模型的精度需要大规模且高质量的数据集去训练。传统人工标注在效率和成本方面已经难以满足模型训练对海量数据集的需求，需要采用新的标注方法来提高标注质量和效率。
　　预标注算法可以大幅减少每框数据标注所需的时间。百度自动驾驶云技术专家曾对外讲道：“在标注前，我们会先用算法做一遍预标注，这样可以大大提高标注员单帧标注的效率。在标注过程中，我们引入了很多智能算法去辅助我们的标注员，比如做区域分割的时候，会借鉴类似于 photoshop 的贴边算法，通过算法去达到更好的贴合效果，并且也提升了标注效率。”
　　4）模型训练
　　在完成数据标注之后，需要对打好标签的数据进行训练、参数调优等。高阶智能驾驶所使用大模型的训练对算力有较高的需求。有些车企专门打造了自己的智算中心，比如特斯拉的Dojo、吉利的星睿智算中心、小鹏的“扶摇”、毫末的雪湖·绿洲（MANA OASIS）等。
　　模型训练是通过分析手段和方法对数据进行探索分析，从中发现因果关系、数据逻辑和业务规律。在模型训练环节，可以借助Auto ML 等工具，设计一套自动化训练引擎，将模型训练的部分工作自动化。
　　另外，从数据运营的角度也可以提升模型训练的效率和质量，百度采取了如下措施：
　　在模型训练环节帮助客户构建最有效的数据集 —— 在前期帮助客户去规划哪些数据需要去做标注，标注什么样的类别，它的分布是什么样的。
　　针对标注完的数据，百度智能云会根据已有的庞大评测样本集来帮助企业去评测它的模型，以及去发掘当前模型的bad case、或者存在的不足。针对当前模型的不足，去补充足够的训练集，帮助企业去提升它的模型指标以及对模型进行调优。
　　5）仿真测试
　　自动驾驶仿真测试主要是指以数学建模的方式将自动驾驶的应用场景进行数字化还原，建立尽可能接近真实世界的系统模型，无需实车直接通过软件进行仿真测试便可达到对自动驾驶系统及算法的测试验证目的。
　　但是，自动驾驶在不同阶段对仿真测试的需求也不同。
　　A.低阶智能驾驶仿真测试：驾驶任务的主要控制者依旧是人，系统所需要独自应对工况的范围较小，复杂度相对较低。
　　算法以感知和控制为主，属于重感知、轻决策的方案；
　　算法的测试验证所使用的场景集主要是以手动编辑为主；
　　以基于用例的测试方法为主。
　　B.高阶智能驾驶仿真测试：驾驶任务的主要控制者是机器，系统需要独立面对车上路以后可能会遇到的所有工况。因此，系统需要处理的工况极其复杂且不可预测。
　　算法的应用不仅要考虑感知和控制，还要考虑诸如如何避障、如何绕路等路径规划算法；
　　算法的测试验证需要丰富的场景库，需要考虑交通流的真实性和完整性以及复杂的交互博弈等；
　　以基于场景的测试方法为主。

低阶与高阶智能驾驶仿真测试特点对比
　　数据闭环与上云
　　有业内专家表示，云是汽车产业的新生产力，车云一体化的数据驱动模式将成为汽车产业竞争的关键。
　　随着智能驾驶功能渗透率的不断提升，车辆产生的数据会越来越多，最终将超出本地的数据处理能力，必需要上传至云端。通过上云，利用云计算和大数据处理技术在资源管理调度、数据批处理、工作流管理、分布式计算、数据库存储等方面的优势为数据闭环提供坚实的基础设施支持，最后通过车云一体的数据闭环驱动智能驾驶系统的迭代升级。
　　未来，云端将成为汽车软件持续迭代的基础。车云一体驱动的数据闭环对上云的需求，不仅仅是在数据存储环节，在感知模型训练、仿真测试等环节也有强烈需求。
　　2.1 感知模型训练对上云的需求
　　自动驾驶感知模型训练所需的数据体量大、算法精度和训练效率要求高，适合上云，采用云服务的方式进行数据处理。
　　小鹏汽车CEO何小鹏曾在对外采访中谈道：“任何一家智能汽车公司对算力的要求都极高，尤其是自动驾驶模型训练，在视觉检测、轨迹预测以及行车规划等算法模型上都很‘吃’算力。”
　　在之前，CNN是智能驾驶感知中常用的深度学习模型，它的设计基本都是针对INT8；而对于Transformer模型架构，BF16是最适合的格式。有业内人士坦言：“Transformer属于暴力美学，相比于CNN，它的模型更大，参数量动辄十亿百亿，千亿万亿也不罕见，层数动辄上千层，根本不是老旧数据训练中心能支撑的。”
　　自动驾驶的开发对云计算有非常强的依赖性。百度梳理了自动驾驶感知算法对云计算技术的需求，可供大家作为参考：
http://www.51testing.com/attachments/2023/06/15326880_20230629160207183PI.png
自动驾驶感知算法开发对云计算技术的需求
（图片来源：百度智能云技术站）
　　参看上图，可以看出：
　　对于L2、L3级别，如果做 L2、L3 级别的 Demo，只需要百万级的图片和几张GPU卡训练即可实现。由于数据量很小且使用范围有限，从合规角度来讲，要求也不是很高，大概需要几百万的费用投入。如果做 L2、L3 级别的量产，需要上亿级的图片和100+张GPU卡进行训练调度，资金投入可达几千万。
　　对于L4 级别，如果做L4级别的Demo，所需存储的数据量超过1PB，需要100+张 GPU卡进行训练调度，投资规模达到0.5亿~2亿级别。如果要实现 L4 级别的量产，所需存储的数据量将超过50PB，需要500+张GPU卡进行训练调度，相关的投入将超过5亿级别。
　　2.2 仿真测试对于上云的需求
　　对于L2及以下的ADAS功能，所需要的测试场景有限，仿真测试的场景库也比较小，传统的单机测试完全能够搞定，但后续高阶智能驾驶则需要海量的测试场景，并且对仿真测试的要求也越来越高。
　　在此情形下，传统的单机仿真测试呈现出算力不足、且无法实现加速测试等问题，存在测试周期长，效率低等问题；而云平台仿真凭借其分布式架构以及并行加速计算能力，可大大提升仿真测试的效率，是实现自动驾驶大规模仿真场景的有效解决方案。
　　虽然云仿真可以有效提升仿真测试的效率，但业内对仿真测试仍存在以下质疑：仿真场景真不真、仿真场景全不全、迭代速度快不快、仿真评价准不准等问题。
　　对于这些问题，百度云仿真平台进行了针对性的改进和解决：
　　在场景的真实度上，按照合规标准集成了高精地图，1:1刻画物理世界的道路拓扑。针对动态的交通参与元素，基于真实路采数据进行挖掘，并对动态元素的交互进行精准刻画。
　　在场景生成模式上，手动场景编辑模式和基于真实路采数据的场景挖掘相结合，据百度内部人士透露，目前已经覆盖了 98% 的场景（包括城市、高速、停车场、封闭园区等）。
　　在迭代速度方面，依赖百度智能云的技术支撑和算力优势，百度的云仿真平台可实现数十万任务的并发运行，做到日行千万公里的仿真里程。
　　在仿真评价标准方面，百度经过数年的经验积累，总结了六大类共200 多项评价指标。除了安全、交规之外，还将舒适性、智能性等通过规则加入到评判标准中。
http://www.51testing.com/attachments/2023/06/15326880_202306291602101KLLF.png
智能驾驶测试核心痛点问题与解决方案
（内容参考：百度智能云技术站）
　　提起上云，对于国内的云服务厂商，大家首先想到的多半是“BATH”（百度、阿里、腾讯、华为）这四家企业，其中百度又是其中最早投入做自动驾驶研发的公司。
　　2023年4月，百度发布了新一代的自动驾驶云产品——Apollo Cloud 2.0（Apollo自动驾驶云2.0版本）。基于百度积累10余年的自动驾驶研发技术和丰富的测绘数据处理经验，再加上百度自身的AI云基础设施，Apollo Cloud 2.0能够为车企提供自动驾驶量产研发的能力框架构建，赋能车企进行高效的自动驾驶研发。
　　详解百度Apollo Cloud 2.0
　　在2023年中国电动汽车百人会论坛上，百度相关负责人曾表示：“自动驾驶在量产阶段还面临合规、效率、体验、成本等多方面问题的挑战。Apollo Cloud 2.0 的推出，将助力车企用户攻坚关键的长尾难题，开启智能驾驶量产时代。”
http://www.51testing.com/attachments/2023/06/15326880_202306291602131HUn9.png
Apollo自动驾驶云不同发展阶段
http://www.51testing.com/attachments/2023/06/15326880_202306291602161F7fi.png
Apollo Cloud 2.0面向量产全面升级
　　Apollo Cloud2.0从研发域的工具链升级到量产域的云服务，是一款助力车企和Tier1智能驾驶系统量产的全流程云服务产品。
　　那么，“工具链”和“云服务”两者有什么区别呢？百度自动驾驶云技术专家解释道：“云服务是工具链的一种新形态。如果企业直接购买相关工具链去用，投入比较高。而云服务可以做到轻量化部署，随时可用、用完即走。比如，在云上，客户可以直接调用我们的工具和数据来做模型训练和仿真测试，避免了他们搭建复杂的物理环境和过高的研发投入，云服务的形式直接降低了企业使用工具链的门槛。”
　　3.1 Apollo Cloud2.0 的三大核心能力
　　Apollo Cloud 2.0具有精准合规、多模态大模型、城市级仿真三大核心能力。
　　1）精准合规
　　关于合规方面，目前还存在两种不太合理的现象：
　　第一种是“过度合规”：这种做法看似“面面俱到”，实则上是因为经验少，不仅造成资源浪费，也会影响研发效率。
　　第二种是“按需合规”：哪里出问题，哪里做合规，有点“亡羊补牢”的感觉，虽然企业具备了一定经验，实则并没有从根本上解决问题。
　　对于合规，最完美的做法是能够做到“恰到好处”的精准合规，实现合规需求与业务发展之间的平衡，避免“只顾合规”带来的效率降低。也就是说，既要能保障地理信息数据安全，还要能很好匹配智能驾驶业务快速发展的需求。
　　而Apollo Cloud2.0要实现的就是精准合规。为什么Apollo Cloud2.0可以做到精准合规？
　　首先，百度具有丰富的测绘地理信息数据处理经验 —— 拥有甲级电子导航测绘资质，深度参与多项国家法规、标准的制定，深刻理解合规要求的初衷和底线。
　　其次，百度拥有专业和丰富自动驾驶数据合规经验的合规团队，内部组建了测绘安全团队、信息安全团队以及自动驾驶合规业务团队。
http://www.51testing.com/attachments/2023/06/15326880_202306291602191VGOl.png
“精准合规”流程
　　2）多模态大模型
　　过去执行一次特殊场景挖掘任务，需要先对海量数据进行人工标注，然后再进行挖掘。由于传统的人工标注工序复杂，效率低，进行一次挖掘任务大概需要一周左右的时间。
　　Apollo Cloud 2.0的“多模态大模型”，让数据服务从“流程式”升级为“检索式”，运用文心大模型较强的泛化和语义理解等能力，极大提升了数据标注和数据挖掘的效率。
　　a. 精准筛选有价值数据，避免无效数据标注
　　做数据标注前需要准备数据，数据准备这个阶段往往会耗费大量的时间和精力。如果前期数据没有准备好，后面可能会带来更大的时间和成本浪费。
　　多模态大模型可以帮助企业在数据准备阶段做数据筛选工作，比如，在什么样道路，在什么样的交通环境下 —— 是否含车道线、环岛、信号灯、环境天气、施工状态、车辆类型、行人行为等。多模态大模型可以准确的挑选出符合条件的“价值”数据，然后再去送标。据估计，利用文心大模型可以帮助企业节省大约80%的数据标注量。
　　b. 提升数据挖掘效率
　　百度自动驾驶云技术专家举例说：“比如定义行人的某个事件，如果按照传统的方式，需要开发一系列算子去匹配道路、行人、车辆以及周边环境，通过多种组合条件去寻找到这样的特定场景，过程很繁杂。如果换了条件，把行人换成动物或非机动车，又需要重新去开发一套算子。现实中，我们需要挖掘的场景千千万，按照传统的挖掘方式，开发周期长，成本也高。
　　“我们这套模型是基于文心大模型的自动驾驶‘数据智能搜索引擎’，具备语义理解的识别能力，相当于多了一个AI助手，用户可以一键调用自动驾驶数据。比如，我们打算找‘车辆在十字路口通行时行人突然切入’的场景，通过大模型就能很容易从我们的数据库寻找到全部符合要求的场景。它可以支持以文搜图、以图搜图、图文结合等多种方式，类似于搜索一样，只需要输入条件，自动帮我们找到结果，极大提高了数据利用率和便捷度。”
　　3）城市级仿真
　　通过城市级云仿真的大规模测试，可以帮助客户快速寻找到自动驾驶算法处理不好的场景，来进行针对性的算法完善和测试。
　　因为虚拟城市仿真是一种随机的、不确定性的测试。所以在跑测试之前，谁也不清楚车辆会遇到什么样的状况。一旦车辆在不停地行驶过程中遇到一个处理不了的场景，系统会识别出来，并把这段数据录下来，转成一个场景文件，自动补充到场景库里来。
　　Apollo Cloud 2.0推出端到端的城市级仿真：
　　基于百度地图大规模路网自动构建孪生城市；
　　通过Apollo千万公里路测里程积累了千万量级的场景。
　　据百度对外透露，目前，Apollo Cloud 2.0 已经达到上百个城市的道路覆盖里程，可以基于这些数据和数字孪生技术打造高精度仿真还原的数字孪生城市，帮助用户在云端去验证不同城市场景下的自动驾驶能力。
　　这种仿真测试方法不仅可以加快自动驾驶测试验证的速度，还可以避免实道路测试所面临的测试周期长、成本高、效率低以及遇到极端危险情况下存在安全隐患等问题。
http://www.51testing.com/attachments/2023/06/15326880_202306291602221bkBi.png
百度Apollo Cloud 2.0 城市级仿真
　　3.2 灵活的合作模式
　　不同类型的企业或者企业在不同发展阶段的需求也不尽相同。一个合适的解决方案，不仅要满足企业当前需求，还要兼顾后续扩展和弹性能力。
　　目前多数云服务商提供的自动驾驶解决方案主要集中在软件应用层，并且多为端到端的服务，这与部分车企的模块化需求产生冲突。相比于为每个客户去做定制方案，打造一套标准化的平台解决方案更为合适：底层统一，上层开放，让自动驾驶行业内的企业各取所需。
　　Apollo Cloud 2.0采用产品+服务的方式，面向不同客户群体，提供不同组合的产品形态。既提供标准化产品，也提供技术服务；既可以帮助客户部署完整的平台工具链，也可以提供单模块工具；同时，支持私有云、公有云、混合云多种部署模式。
　　标准化：支持行业通用性的OpenX系列、FMI、PB、ROS等接口标准，便于用户做集成适配或者调用。
　　兼容性：兼容CarSim、Sumo、VTD、RoadRunner等常用软件，支持windows和Linux系统环境，支持传统HIL仿真测试；
　　二次开发：底层架构标准化，支持自定义开发数据处理流程，用户可以通过百度WebIDE或者自己的编码环境来开发算法。
　　百度自动驾驶云技术专家介绍说：“我们在标准化和产品兼容性上做了很多工作，并且支持用户二次开发，产品上可灵活拆解，满足客户不同的研发需求，服务更多的客户。针对客户关心的部署环境、调度优化、系统集成、性比价、二次开发、团队协作、数据安全等问题，我们提供了差异化的解决方案，以满足不同阶段、不同规模的业务需求，可以先从点到面分阶段建设应用”。
　　结语
　　“在2023年，自动驾驶行业将进入深水区，留下来的都是有实力的玩家。”某自动驾驶企业负责人认为，经历2022年的资本寒冬之后，2023年仍将是“内卷”之年，高阶智能驾驶的量产交付将成为车企和Tier1在自动驾驶发展到下半场的角逐焦点。
　　高阶智能驾驶的量产化交付能力显然已成为车企或Tier1之间竞争的关键。除了成本管控、供应链管理、质量管控以外，是否具备高效的数据闭环体系也是评判量产交付能力的重要参考指标。

页: [1]

51Testing软件测试论坛 's Archiver

车载测试之数据驱动+车云一体的关键作用