基于Pegasus场景分层体系,提出场景复杂度量化方法,评价场景数据质量。该方法确定每层元素的行列式,根据行列式确定每层元素的复杂度,通过计算每层元素的复杂度之和得到场景数据的总复杂度。此外,为了防止“过度复杂”现象,提出了“母子库”方法和“系统场景概率”方法,将场景元素的复杂度乘以该元素的出现概率以获得修正的复杂性。研究结果表明,该方法可以构建合理可用的场景库。自动驾驶汽车安全问题引发的危害主要包括两个方面:(1)电子电气故障或软件系统故障引发的危害。为此,ISO提出了ISO26262《道路车辆—功能安全标准》,我国提出了相应的GB/T34590《道路车辆—功能安全标 准》。(2)系统性能不足或可合理预见的人为误操作造成的危害。为此,ISO提出了ISO/PAS21448SafetyoftheIntendedFunctionality,简称SOTIF标准。在SOTIF标准中,自动驾驶汽车面临的场景分为四类:已知安全场景、已知不安全场景、未知安全场景和未知不安全场景,如图1所示。对于已知安全场景和未知安全场景,SOTIF标准中没有给出任何注意事项。对于已知的危险场景,SOTIF标准提出了一种方法。其目的是提高自动驾驶汽车相关系统的性能或减少相关系统的运行区域,并基于相关场景库进行测试和验证,即将已知的危险场景转化为已知的安全场景.对于未知的危险场景,可以基于场景库进行大量的实验,发现和检测相关系统中的安全隐患,即将未知的危险场景转化为已知的危险场景。最后,基于上述方法,将已知的危险场景转化为已知的安全场景。简而言之,SOTIF标准的目标是尽可能扩大自动驾驶车辆相关系统在运行过程中面临的已知和未知安全场景的范围,从而尽可能缩小已知和未知的危险场景范围,如图2所示。要实现上述目标,关键因素之一是构建高质量的预期功能安全场景库。目前,许多企业和组织已经建立了自己的预期功能安全场景库。例如:Kitti场景库、NuScenes[6]场景库、Lyft自动驾驶汽车场景库等。大部分企业和组织在场景库建设过程中将重点放在了场景库数据的采集上,而对于采集到的场景数据质量缺乏合理的量化指标。这无疑带??来了两个问题:(1)场景库中可能包含大量重复、低质量的场景数据,导致基于场景库的测试时间过长,甚至会导致自动驾驶的性能缺陷找不到汽车,这会降低测试性能。结果可靠性。(2)无法比较不同场景数据库的优劣,导致无法为自动驾驶车辆场景数据库测试选择最优的场景数据库数据。因此,有必要采用科学合理的方法对场景库的质量进行量化。场景数据越复杂,对相关系统的挑战就越大,检测出相关系统性能缺陷的可能性就越大。因此,可以认为场景数据的复杂度是影响场景库质量的关键因素之一。本文提出了一种量化场景数据复杂度的方法。该方法基于德国Pegasus项目的场景分层系统,对场景中的元素进行分类统计,计算场景数据中元素的复杂度,评价场景数据的质量。1Pegasus场景分层系统Pegasus项目由德国汽车行业的相关企业和研究机构联合发起,旨在制定一系列与自动驾驶汽车相关的测试标准。本项目提出场景分层体系,即根据场景元素的不同将场景分为六层场景,如表1所示。场景数据如图3所示。基于Pegasus场景分层体系,场景数据可以分层,如表2所示。2场景数据复杂度量化方法Pegasus场景分层系统对场景元素进行分层。本文进一步分析每一层要素,量化每一层要素的复杂度。道路层的复杂度主要由车道线的可见性决定,见表3。对于清晰的车道线,复杂度设置为1;车道线被遮挡或磨损会影响车道线的识别,其复杂度为2;路面积水、冰雪覆盖车道线不仅影响车道线识别,还会造成行驶困难,其复杂度为3;不规则的车道线可能导致车道线的错误识别,导致车辆行驶方向错误,其复杂度为4;没有车道线的场景可能会影响车辆的行驶方向,其复杂度为5。交通设施层的复杂度主要由交通设施的可见度决定,见表4。没有交通设施场景的复杂度为1;交通设施畅通的场景复杂度为2;难以识别的场景复杂度为4;交通设施复杂度为5,容易造成误识别和闯红灯等危险行为。临时交通事件层的复杂性主要由事件的偶然性和可预测性决定,见表5。没有临时交通事件,其复杂度为1;交通管制等有专人维护现场的临时交通事件,其复杂度为2;道路施工等带有警示标志的临时交通事件,其复杂度为3;交通事故等。对驾驶影响较大的临时性交通事件复杂度为4;落石、落轮等偶发不可预测的临时交通事件的复杂度为5。交通参与者层的复杂度由参与者的共性和合规性决定,见表6。没有交通参与者,其复杂度为1;只包含车辆的场景,复杂度为2;包括行人、自行车等普通参与者,且位于法规规定的位置(如人行道、自行车道等),其复杂度为3;包含行人、自行车等普通参与者且不在法规规定的位置(行人过马路、自行车在机动车道上行驶等),其复杂度为4;不常见的交通参与者(如拖着大象的卡车、骑马的行人等),其复杂度为5。环境条件层的复杂度主要由能见度决定,见表7。晴天能见度高,其复杂度为1;雨天和傍晚能见度,其复杂度为2;有环境光的夜晚,其复杂度为3;没有环境光的夜晚,能见度低,复杂度为4;浓雾天空能见度极低,其复杂度为5。信息层的复杂度主要由是否有交通信息决定,见表8。如果有高精度地图或V2X提供交通信息,复杂度为1;如果没有高精地图或者V2X提供交通信息,那么复杂度就是2。通过上面的分层方法和每一层的复杂度量化方法,可以计算出单个场景数据的复杂度,就是总和每层的复杂性。例如:图3场景数据的复杂度为18(各层复杂度见表9)。对于整个场景库,将每个场景数据的复杂度相加除以场景库中场景数据的总数,得到整个场景库的复杂度。可以根据场景库的复杂程度来比较不同场景库的好坏。值得注意的是,由于篇幅限制,上面的复杂性表中并未列出和涵盖所有元素。对于未列出或未涵盖的元素,其复杂性应根据层的复杂性的决定因素来确定。例如:环境条件层复杂度的决定因素是能见度,所以对于未列出的低浓度大雾天,其能见度相当于夜间环境光的能见度,所以其复杂度为3。3场景数据复杂度修正当采用上述复杂度量化方法构建场景库时,容易出现“过度复杂”的现象,即场景库为了追求场景库的复杂度,只采集高-复杂的场景,导致出现概率极低的Scenarios,最终导致无法发现系统性能缺陷。为了避免“过于复杂”的现象,本文提出了“亲子数据库”和“系统场景概率”两个概念。3.1实景数据库采集过程中,随机地点、随机时间段、随机气候等采集的数据构成“主数据库”。然后,根据相关系统的特点和运行领域,从“母库”中提取出“子库”。例如:对于只适用于高速公路的自动驾驶系统,从“父库”中提取高速公路的场景数据,形成“子库”。例如:针对特定城市开发的自动驾驶系统,从“母库”中提取该城市的场景数据,形成系统的“子库”。值得注意的是:理论上,既可以先建“母库”再解压“子库”,也可以先建“子库”再组装成“母库”。但本文推荐“先母后子”的方法。因为“母库”的构建是随机的,所以从“母库”中抽取出来的“子库”也具有随机性。如果先构建“分库”,由于“分库”是系统特定的,构建过程中很难做到完全随机。3.2系统场景概率对于从“母库”中提取出来的“子库”,进一步分析场景中各个元素在系统运行过程中出现的概率,即系统场景概率。例如:对于只适用于高速公路的自动驾驶系统,交通参与者层(复杂度2)只有车辆的概率远高于行人和自行车(复杂度3)的概率。因此,在评估本层元素的复杂度时,也需要将复杂度乘以一个概率系数,得到本层最终的复杂度。公式为:其中:C为场景数据的最终复杂度;是第一层场景元素的复杂度;为相关系统运行时第一层场景元素的概率系数。3.3防止“过于复杂”现象通过“亲子库”和“系统场景概率”可以避免“过于复杂”现象。主要原因如下:(1)建设“母行”时采用随机地点、随机时间段、随机气候等随机催收方式,减少了“母行”催收过程中的人为因素。”。(2)针对特定系统,从“母库”中提取相关的“子库”,间接避免了“子库”的人为因素。(3)根据系统运行时场景出现概率及其复杂度计算最终的场景复杂度。结合复杂性和概率性的客观因素,避免了人为因素的影响。例如:对于高复杂度、低概率的场景元素或者对于低复杂度、高概率的场景元素,最终场景复杂度的值可能较低。3.4概率系数的值对于不同的系统是不同的。例如,对于仅限于高速公路使用的系统,交通参与层只有车辆的概率系数大于行人和自行车的概率系数;对于可用于城市交通场景的系统,行人和自行车出现在交通参与者层的概率系数大于仅包括车辆的概率系数。另外,对于同一个系统,在无人驾驶发展过程的不同阶段,其概率系数可能不同。例如:在这个阶段,信息层有高分辨率地图或V2X的系统比没有高分辨率地图或V2X的系统具有更低的概率系数。在无人驾驶发展的后期,有高精地图或V2X系统的概率系数可能会高于没有高精地图或V2X系统的概率系数。因此,对于不同的系统,需要综合考虑其运行范围、地点、时间、目标市场、整体市场水平,确定其不同场景要素的概率系数。4结论为了满足ISO/PAS21448的要求,需要建立一个预期的功能安全场景库。然而,场景库的建设质量缺乏相应的量化指标。本文基于Pegasus场景分层系统,量化每层元素的复杂度来评价场景库的质量。同时,为了避免出现“过于复杂”的现象,提出了“母子库”和“系统场景概率”两个概念,以及如何构建“母子库”以及如何计算对“系统场景概率”进行了阐述,并最终给出了复杂度的计算方法。本文提到的量化方法和防止“过度复杂化”的方法,对预期功能安全场景库的建立和推进具有指导作用。
