基于网联车辆驾驶数据的典型与极限场景划分与提取方法与流程

文档序号:23156524发布日期:2020-12-04 13:51阅读:167来源:国知局
基于网联车辆驾驶数据的典型与极限场景划分与提取方法与流程

本发明属于智能车路系统交通领域,具体涉及一种基于网联车辆驾驶数据的典型与极限场景划分与提取方法,进而为智能车路系统的设计和测试提供依据。



背景技术:

随着智能网联车技术和5g通信技术的发展,智能车路系统成为了研究的重点。完整配套的测试评价体系是推动智能车路系统发展的必要条件,而智能车路系统的测试通常依赖于智能网联车,如何对智能车路系统和智能网联车进行功能和安全性能测试是行业内的一大难点。由于传统的道路场地测试已经无法满足智能车路系统的测试需求,而各种智能传感器设备和通信技术的应用使得大量高分辨率的驾驶数据变得可用,因此,可以从大量的驾驶数据资源中提取出场景并建立测试场景库。目前,在国内外的各种场景提取研究中,主要有两个研究方向:一种是使用场景分类和时间序列分割的分类算法,把驾驶数据中的特征参数作为输入,进而将驾驶数据分类到相关的场景;另一种是使用机器学习算法和深度学习算法对给定的必要测试场景进行学习,通过学习算法来自动生成随机的测试场景。

但是现有技术尚没有通过对自然驾驶数据进行划分来提取得到典型与极限场景的方法。



技术实现要素:

本发明的目的在于针对上述现有技术中智能车路系统测试场景难以获取的问题,提供一种基于网联车辆驾驶数据的典型与极限场景划分与提取方法,能够比较准确的将自然驾驶数据集分割为典型与极限驾驶数据集,并提取出对应的典型与极限驾驶场景。

为了实现上述目的,本发明有如下的技术方案:

一种基于网联车辆驾驶数据的典型与极限场景划分与提取方法,包括:

步骤一、对网联车辆自然驾驶数据集中的缺失、异常和重复数据进行预处理,并对同一个采样周期内的数据进行归一化处理;

步骤二、将步骤一处理后的数据集分割为典型与极限驾驶行为数据集并提取驾驶事件;

步骤三、利用自编码网络对驾驶事件的数据进行降维和特征数据的提取;

步骤四、使用k-means聚类算法对步骤三提取出的特征数据进行驾驶事件分类;

步骤五、对步骤四得到的驾驶事件进行特征参数统计分析,得出每个场景的数据特点;

步骤六、通过对数据特点进行提取与分析,得出典型与极限场景。

优选的,所述的步骤一对缺失数据进行删除处理,或者在采样时间内利用前一时刻的数据进行填充,具体的填充计算表达式如下:

其中,ki为缺失数据,{k1+k2+…+kn-1+kn}为采样时间内前一时刻的数据之和,数据的采集频率为10hz。

优选的,所述的步骤一在同一个采样周期内,对同一个时间点的重复数据进行删除,对车辆基本信息与雷达数据内联生成新的数据时的重复数据进行删除。

优选的,所述的步骤一对异常数据采用3σ准则进行剔除,具体计算方法如下:

对于原始数据序列{x1,x2,…,xn},求出每个采样频率内的算术平均值和每个数据的误差:

对于序列中的所有数据:

如果则判定误差过大,将该条数据删除;

如果则判定没有误差,将该条数据保留。

优选的,所述的步骤一采用min-max归一化处理方法对同一个采样周期内的数据进行单独的归一化处理,具体的计算表达式如下:

其中,x*是归一化的值,minx是一个采样周期的最小值,maxx是一个采样周期的最大值,x是需要进行归一化处理的值。

优选的,所述的步骤二将分割后的数据集中超过5个连续周期的驾驶数据表示为一个驾驶事件,并分别从典型与极限驾驶行为数据集中提取出驾驶事件。

优选的,所述的步骤三利用去噪自编码网络对驾驶事件的数据进行降维和特征数据的提取;使用tensorflow进行去噪自编码网络的模型构建,在提取的原始数据中加入噪声作为去噪自编码网络的输入数据,未加入噪声的数据作为网络的标签数据,利用tensorflow内核的权值提取功能对训练好的权值进行提取,并且对新的数据和提取的权值做矩阵乘法运算,得到高维数据特征的压缩特征并且对压缩特征进行可视化处理。

优选的,所述的步骤四使用“手肘法”确定聚类的簇数k,选取不同的k值分别对特征数据进行聚类,计算出对应的dk值,将不同的k值作为横坐标,dk值作为纵坐标绘制曲线,在曲线明显拐点处的k值则为最佳k值,dk的计算公式如下:

其中,ci为第i个聚类中心,x为输入的数据,mi为聚类的中心点;

空间中数据与聚类中心点的欧式距离计算公式为:

其中,x为输入数据;ci为第i个聚类中心;m为数据对象的维度,xj,cij为输入数据的x和ci的第j个属性值;

整个数据集的簇内误差平方和计算公式为:

其中,sse的大小表示聚类结果的好坏;当sse的值没有变化时,聚类结束。

优选的,当k∈q,其中q∈z+时,通过计算和观察“手肘图”若得到dk在k=m,m∈q时出现明显拐点,据此将极限驾驶事件数据集分为m类;同理,将典型驾驶数据集分为n类。

优选的,步骤五通过对所得的m类极限驾驶事件数据集和n类典型驾驶事件数据集进行统计分析,得出主车的速度、加速度、方向盘转角和周围交通参与者类型的占比数据特点。

相较于现有技术,本发明具有如下的有益效果:通过采集网联车辆自然驾驶数据集,将数据集中的缺失数据进行填补或删除,采用孤立森林算法将处理后的数据集划分为典型与极限驾驶行为数据集并提取驾驶事件,采用自编码网络对驾驶事件数据进行降维和特征提取,再利用k-means聚类算法对典型与极限驾驶行为数据集中的驾驶事件进行分类,然后通过对分类后的驾驶事件进行特征参数统计分析和gps地图投影,提取出了典型与极限驾驶场景,并对提取出的典型与极限场景做了分析,结果表明,通过本发明能够对交通环境中的典型和极限场景进行提取。本发明能够比较准确的将自然驾驶数据集分割为典型与极限驾驶数据集,并提取出对应的典型与极限驾驶场景,可以为智能车路系统的设计和测试提供依据。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1本发明典型与极限场景划分与提取方法的流程图;

图2加速度的典型-极限数据分割图;

图3速度的典型-极限数据分割图;

图4转向角的典型-极限数据分割图;

图5横向速度的典型-极限数据分割图;

图6横向距离的典型-极限数据分割图;

图7极限特征聚类“手肘图”;

图8典型特征聚类“手肘图”;

图9极限场景道路情况gps投影图:

(a)极限场景1;(b)极限场景2;(c)极限场景3;(d)极限场景4;

图10典型场景道路情况gps投影图:

(a)典型场景1;(b)典型场景2;(c)典型场景3;(d)典型场景4;(e)典型场景5:

(f)典型场景6。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。

基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提还可以进行若干简单的修改和润饰,所获得的所有其他实施例,都属于本发明保护的范围。

在本发明中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施方案中。在说明书中的各个位置展示该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,在本发明所描述的实施例还可以与其它实施例相结合。

参见图1,本发明基于网联车辆驾驶数据的典型与极限场景划分与提取方法,包括:

步骤1、对自然驾驶数据集进行预处理,对缺失、重复及异常数据进行相应的处理,并对预处理后的数据做归一化处理。其具体步骤为:

步骤1-1,对大量的连续多个周期的数据缺失,进行删除处理。

对连续的少量数据缺失,在很小的采样时间内利用前一时刻的数据进行填充,具体的填充公式如下:

其中,ki为缺失数据,{k1+k2+…+kn-1+kn}为很小采样时间内前一时刻的数据,数据的采集频率为10hz。

步骤1-2,对离散型变量的少量缺失值采用对相邻的状态进行判断,然后根据车辆运动状态进行填充的方法,对由于传输信号中断和其他故障原因导致的大量缺失数据,认为可信度严重不足,进行删除处理。

步骤1-3,在一个采样周期内,对同一个时间点的重复数据进行删除,对车辆基本信息与雷达数据内联生成新的数据时的重复数据进行删除。

步骤1-4,在对明显有异常的数据,进行删除处理。对于非明显异常数据,采用3σ准则对异常数据进行剔除,具体计算方法如下:

对于原始数据序列{x1,x2,…,xn},首先求出每个采样频率内的算术平均值和每个数据的误差:

对于序列中的所有数据:

如果则认为误差过大,将该条数据删除。

如果则认为没有误差,将该条数据保留。

步骤1-5,利用特殊的时间窗口,将一个采样周期的数据进行单独的归一化处理。根据数据特点,采用min-max归一化处理方法,具体计算方法和公式如下:

其中,x*是归一化的值,minx是一个采样周期的最小值,maxx是一个采样周期的最大值,x是需要进行归一化处理的值。

步骤2、将预处理后的数据集分割为典型与极限驾驶行为数据集并提取驾驶事件,其具体步骤如下:

步骤2-1,将整个数据集分割为典型-极限数据集;

选取了数据集中8个与汽车运动学和周围驾驶环境相关的连续变量作为分割的输入数据,采用无监督的孤立森林算法将主车辆的速度、加速度、转向角以及距离变化较大的区间的数据判定为极限数据,将整个数据集分割为典型-极限数据集。

步骤2-2,提取驾驶事件;

将分割后的数据集中超过5个连续的驾驶数据(>0.5s)表示为一个驾驶事件,并分别从典型与极限数据集中提取出了驾驶事件。

步骤3、利用自编码网络对驾驶事件数据进行降维和特征的提取;

步骤3-1、使用普通自编码网络进行数据特征提取;

使用tensorflow进行普通自编码网络的模型构建,然后将数据分批次输入普通自编码网络中进行数据特征的提取,利用tensoflow内核的权值提取功能对训练好的权值进行提取,并且对新的数据和提取的权值做矩阵乘法运算,得到高维数据特征的压缩特征并且对压缩特征进行可视化处理;

步骤3-2、使用去噪自编码网络进行数据特征提取;

使用tensorflow进行去噪自编码网络的模型构建,其中模型的参数选择和使用的训练数据与普通自编码网络相同。然后在提取的原始数据中加入一定比例的噪声作为去噪自编码网络的输入数据,未加入噪声的数据作为网络的标签数据,利用tensorflow内核的权值提取功能对训练好的权值进行提取,并且对新的数据和提取的权值做矩阵乘法运算,得到高维数据特征的压缩特征并且对压缩特征进行可视化处理;

步骤3-3、使用变分自编码网络进行数据特征提取;

使用tensorflow进行变分自编码网络的模型构建,其中模型的参数选择中除损失函数与以上自编码网络不同,其余的参数均相同,使用的训练数据也相同。然后将数据分批次输入变分自编码网络中进行数据特征的提取,利用tensorflow内核的权值提取功能对训练好的权值进行提取,并且对新的数据和提取的权值做矩阵乘法运算,得到高维数据特征的压缩特征并且对压缩特征进行可视化处理;

步骤3-4、对三种自编码网络进行对比并选取特征提取效果最好的自编码网络;

对三种自编码网络从收敛步数\收敛损失、sdct和拟合误差方面进行对比,选择去噪自编码网络作为特征提取网络;

步骤4、对典型与极限驾驶事件数据进行聚类,其具体步骤如下:

步骤4-1、聚类算法的选取;

在同样的数据和实验流程下对k-means、dbscan、minibatch-k-means和birch四种聚类算法进行聚类,得出极限特征数据聚类和典型特征数据聚类的指标结果。同时基于聚类时间、ch分数、轮廓系数和dcg分数四项聚类评价指标对聚类性能评估,其中k-means算法在ch分数和轮廓系数方面有较好表现,因此选择k-means算法作为场景聚类算法。

步骤4-2、特征数据选取;

聚类的数据输入对象即为步骤三中去噪自编码网络提取出的极限驾驶行为数据集中的特征数据;

步骤4-3、使用k-means进行聚类;

使用“手肘法”确定聚类的簇数k。在k值选取2-5和4-7时分别对特征数据进行聚类,计算出对应的dk值,将不同的k值作为横坐标,dk值作为纵坐标绘制曲线,在曲线明显拐点出的k值则为最佳k值;dk的计算公式如下:

其中,ci为第i个聚类中心,x为输入的数据,mi为聚类的中心点。

空间中数据与聚类中心点的欧式距离计算公式为:

其中,x为输入数据;ci为第i个聚类中心;m为数据对象的维度,xi,cij为输入数据的x和ci的第j个属性值;

整个数据集的簇内误差平方和(sse)计算公式为:

其中,sse的大小表示聚类结果的好坏;当sse的值没有变化时,聚类结束。

步骤5、对典型与极限驾驶行为数据集中的每个类进行速度、加速度和方向盘转角等重要特征参数进行统计分析,得出每个场景的数据特点;

步骤6、通过对数据特点进行提取与分析,分别提取出典型与极限场景;

实施例

实验得到的加速度、速度、转向角、横向速度与横向距离的典型与极限数据集的分割结果如图2,图3,图4,图5,图6所示,可以看出离群点都处在每个变化区间峰值附近,可以判断在车辆的以上特征数据变化过大时,孤立森林将其判定为极限数据。同时对分割后的数据集中超过5个连续周期的驾驶数据(>0.5s)的驾驶事件进行了提取,提取出来典型与极限驾驶事件。利用去噪自编码网络对驾驶事件数据进行特征压缩和提取,通过绘制极限特征的“手肘图”将极限数据分为4类,这4类极限场景在googleearth上的gps投影图如图10所示,对4类场景进行每一类数据的相关特征指标进行统计可得表1:

表1极限场景聚类分析统计结果

分析可得,由四个极限场景的速度占比可认为场景1为中速场景,场景2和4为高速场景,场景3为低速场景。四个场景中的加速度均在四级标准范围占比最大,且均值和标准差数值都接近于0,表示驾驶相对平稳。场景1和场景2的加速度在一级标准中的占比值也相对较大,说明虽然驾驶平稳,但存在急减速和急加速情况。对四个场景周围交通参与者的类型占比进行分析,可看出轻型车辆在四个场景中的占比均为最高,对于场景2中重型车辆的占比相对较高,说明场景2中部分事件场景中包含重型车辆。对方向盘转角数据进行分析可知四个场景的方向盘转角都有一定程度的左右偏转,初步判断四个场景均为转弯场景。

由上述聚类结果及统计分析情况,对以上场景特征参数进行总结,提取出网联汽车的极限场景,如表2所示四种极限测试场景:

表2极限场景提取

以上结合具体特征及其实施例对本发明进行了描述,显而易见的,在不脱离本发明的精神和范围的情况下,还可以对其进行各种修改和组合。相应地,本说明书和附图仅仅是所附权利要求所界定的本发明的示例性说明,且视为已覆盖本发明范围内的任意和所有修改、变化、组合或等同物。显然,本领域技术人员可以对本发明进行各种改动和变型,这些不脱离本发明的精神和范围的修改和变型也属于本发明权利要求及其等同技术的范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1