基于数据驱动的智能汽车拟人化决策规划系统及方法与流程

文档序号:31864844发布日期:2022-10-19 08:28阅读:182来源:国知局
基于数据驱动的智能汽车拟人化决策规划系统及方法与流程

1.本发明属于智能驾驶决策规划领域,尤其是涉及基于数据驱动的智能汽车拟人化决策规划系统及方法。


背景技术:

2.随着智能驾驶辅助系统配置率逐年攀升,智能车辆与驾驶员驾驶车辆构成的异质交通流将会长期存在。针对现有智能驾驶系统,多基于单一逻辑或规则约束输出决策规划路线并对车辆进行控制,未考虑驾驶风格差异性。但就驾驶员而言,驾驶风格多种多样,驾驶水平参差不齐,在跟驰、换道、转弯等具体场景所表现的驾驶行为存在较大差异。传统交通流中驾驶员能够通过主观意图表达及识别形成一定默契,进行适当让行及先行,但针对异质交通流,单一风格的智能驾驶决策规划系统很难与各种驾驶风格驾驶员达成默契一致性,由此带来的通过性、稳定性及安全性等相关问题开始凸显。
3.决策规划在智能驾驶中处于核心地位,目前已经打通了许多关键技术,但在某些领域还存在瓶颈及问题亟需突破,具体表现为决策切换迟滞、规划轨迹质量不符合预期、车速超过驾乘人员期望、换道避障质量不高等。这表明当前智能驾驶决策规划系统还不能满足驾乘人员的个性化需求。此外,当前智能驾驶辅助系统,如acc(自适应巡航控制)、aeb(自动紧急制动系统)、lka(车道保持辅助系统)等产品在快速量产普及,但是这些系统或功能更多的倾向于为营销服务,对驾驶员而言,仍存在不会用、不敢用及不好用的情况。基于以上问题,主要原因是目前的自动驾驶功能适用性较差,适用场景非常有限,且自动驾驶决策控制在满足驾乘人员预期方面还有较大差距,没有做到拟人化驾驶。
4.现阶段,之所以没有拟人化决策规划相关技术落地,一方面是针对不同驾驶员的实车驾驶行为数据积累较少,无法推行有效的数据驱动方法;另一方面,没有完善的闭环数据驱动拟人化决策规划系统及方法支撑。因此,迫切需要构建基于数据驱动的智能汽车拟人化决策规划系统及方法,提高智能驾驶决策规划系统拟人化程度,突破智能驾驶决策规划技术瓶颈。


技术实现要素:

5.有鉴于此,本发明旨在提出基于数据驱动的智能汽车拟人化决策规划系统及方法,以数据采集车辆为载体,基于车端多源传感器及控制器、车端供电系统、车端数据采集系统、车端大容量存储系统实现开放道路数据采集及存储,基于多源异构数据预处理模块、行为场景挖掘模块、关联特征筛选及提取模块、行为风格化分类及评估模块、拟人化模型参数辨识模块及拟人化网络训练模块实现原始采集数据预处理、行为场景数据挖掘、场景特征数据提取、行为风格化及优劣性评估标注、决策规划模型参数辨识及拟人化网络模型数据训练,能够基于数据驱动方法构建面向驾驶行为的拟人化决策规划系统,突破智能驾驶决策规划技术,真正从人的驾驶行为习惯和个性化需求出发,研发更符合用户驾驶需求的智能驾驶车辆。
6.为达到上述目的,本发明的技术方案是这样实现的:
7.第一方面本方案公开了基于数据驱动的智能汽车拟人化决策规划方法,包括自然驾驶数据采集、多源异构数据预处理、驾驶行为场景挖掘、行为特征筛选提取、行为风格化分类及优劣性评估、拟人化模型参数辨识及拟人化网络模型训练;
8.以数据流的形式进行表征,分别对应原始数据、预处理数据、行为场景数据、行为特征数据、规范标注数据、拟人化规则数据、拟人化模型数据;
9.对应各功能模块分别为多源异构数据预处理模块、行为场景挖掘模块、关联特征筛选及提取模块、行为风格化分类及评估模块、拟人化模型参数辨识模块、拟人化网络训练模块。
10.进一步的,多源异构数据预处理模块用于对车端采集的原始数据进行预处理,其中所采集原始数据包含整车数据、目标物数据、车道线数据、交通标识数据及车身姿态数据文本类数据以及不同视角的高清视频数据。
11.进一步的,行为场景挖掘模块用于对生成的预处理数据进行场景挖掘,包括跟驰、换道、转弯、掉头、通过十字路口、上下匝道、通过隧道常规行为场景,以及下陡坡、高速避障、高速过弯、紧急避险危险行为场景。
12.进一步的,关联特征筛选及提取模块用于对挖掘得到的行为场景关联特征数据进行筛选及提取。
13.进一步的,行为风格化分类及评估模块用于对提取到行为特征数据进行风格化分类及优劣性评估,风格化分类指基于各类无监督学习方法对行为风格进行聚类标注,优劣性评估针对各类驾驶行为,制定评估准则,对行为的优劣性进行标注。
14.进一步的,拟人化模型参数辨识模块用于通过各类寻优算法对行为规则模型代辨识参数进行辨识,规则模型即指含有大量代辨识参数的以规则为基准的模型,拟人化模型参数辨识模块能够将规范标注数据转换为拟人化规则数据。
15.进一步的,拟人化网络训练模块用于将各类规范标注数据输入搭建的神经网络模型中,通过模型训练构建拟人化网络,可用于直接对具体行为进行预测。
16.第二方面本方案公开了一种基于数据驱动的智能汽车拟人化决策规划系统,包括数据采集车辆、车端多源传感器及传感器控制器、车端数据采集系统、车端大容量存储系统、车端供电系统、多源异构数据预处理模块、行为场景挖掘模块、关联特征筛选及提取模块、行为风格化分类及评估模块、拟人化模型参数辨识模块、拟人化网络训练模块及各类配套软硬件设备。
17.进一步的,数据采集车辆作为基础,在采集车辆上配装多源传感器及控制器、车端数据采集系统、车端大容量存储系统及车端供电系统;
18.传感器控制器包括各类传感器对应的控制器。
19.进一步的,车端多源传感器包括功能摄像头、激光雷达、毫米波雷达、gnss惯导设备、高清摄像头;
20.功能摄像头包括前视、后视功能摄像头,可采集试验车前向及后向的目标物信息、交通标识信息及车道线信息,目标物信息包括目标类型、目标与本车相对横纵向距离及相对横纵向速度;交通标识信息包括限速标志、交通信号灯、斑马线、停止线距自车相对距离信息;车道线信息包括车道线类型、车道线颜色及自车与车道线距离;
21.激光雷达包括左前、右前、左后、右后向激光雷达,用于采集车辆侧前及侧后向目标物信息,包括目标物与本车的相对横纵向距离、相对横纵向速度及相对横纵向加速度;
22.毫米波雷达包括左前、左后、右前、右后向毫米波雷达,用于采集侧前及侧后向目标物信息,包括目标与本车的相对横纵向距离、相对横纵向速度、相对横纵向加速度,通过毫米波雷达、激光雷达及功能摄像头对目标物信息进行融合表征;
23.gnss惯导设备用于采集试验车定位、航向角、道路曲率信息;
24.高清摄像头包括前向、后向、侧向及车内驾驶员摄像头,分别采集前向、后向、侧向及车内驾驶员同步高清视频;
25.车端数据采集系统包括软硬件,硬件为多接口高性能工控机及车内用于实时监控的高清显示屏,软件包括能够接入各类传感器信号的数据采集软件,采集软件用于实现各类传感器标定、摄像头配置、信号监控显示、多源数据融合及自动保存;
26.车端大容量数据存储系统包括车端部署的nas设备及交换机,nas设备通过交换机与多接口高性能工控机连接,对采集数据进行存储;
27.车端供电系统由电源转换模块、逆变器组成,用于对车内的各类传感器及控制器、车端数据采集系统硬件及车端大容量存储系统供电,逆变器与车载蓄电池相连,用于给多接口高性能工控机、nas设备及交换机进行供电;
28.电源转换模块与车载蓄电池相连,用于给各类传感器及控制器进行供电。
29.相对于现有技术,本发明所述的基于数据驱动的智能汽车拟人化决策规划系统及方法具有以下有益效果:
30.基于数据驱动的智能汽车拟人化决策规划系统及方法,能够通过对驾驶员自然驾驶行为进行分析,构建拟人化决策规划模型,提高各类行为关联的常用adas功能拟人化程度,提升用户使用体验,帮助驾乘人员与智能驾驶车辆建立足够的信任关系;通过对驾驶员行为分析建立的拟人化决策规划系统也能够提高智能驾驶系统与传统驾驶员的驾驶相似性,促进异质交通流下车-车和谐交互,降低事故发生率,提升整体稳定性,最终能够突破智驾关键技术瓶颈,推进高等级、拟人化智能驾驶系统快速落地应用,为智能网联车辆发展赋能。
附图说明
31.构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
32.图1为车端各组件位置关系图;
33.图2数据闭环驱动拟人化处理流程图;
34.图3为各模块数据处理流程图;
35.图4为跟驰行为场景描述示意图;
36.图5为部分典型指标参数聚类分布图。
37.附图标记说明:
38.1-nas设备;2-交换机;3-显示屏;4-多接口高性能工控机;5-gnss惯导设备;6-功能摄像头;7-激光雷达;8-高清摄像头;9-逆变器;10-电源转换模块;11-毫米波雷达。
具体实施方式
39.需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
40.下面将参考附图并结合实施例来详细说明本发明。
41.一种基于数据驱动的智能汽车拟人化决策规划系统主要由数据采集车辆、车端多源传感器及控制器、车端数据采集系统、车端大容量存储系统、车端供电系统、多源异构数据预处理模块、行为场景挖掘模块、关联特征筛选及提取模块、行为风格化分类及评估模块、拟人化模型参数辨识模块、拟人化网络训练模块及各类配套软硬件设备组成。
42.其中,如图1所示,以数据采集车辆作为基础,在采集车辆上配装多源传感器及控制器、车端数据采集系统、车端大容量存储系统及车端供电系统。
43.其中,车端多源传感器包括功能摄像头6、激光雷达7、毫米波雷达11、gnss惯导设备5、高清摄像头8。传感器控制器包括各类传感器对应的控制器。
44.其中,功能摄像头6分为前视、后视功能摄像头,可采集试验车前向及后向的目标物信息、交通标识信息及车道线信息。目标物信息包括目标类型、目标与本车相对横纵向距离及相对横纵向速度;交通标识信息包括限速标志、交通信号灯、斑马线、停止线距自车相对距离信息等;车道线信息包括车道线类型、车道线颜色及自车与车道线距离等。
45.激光雷达7分为左前、右前、左后、右后向激光雷达,主要用于采集车辆侧前及侧后向目标物信息,包括目标物与本车的相对横纵向距离、相对横纵向速度及相对横纵向加速度等。
46.毫米波雷达11分为左前、左后、右前、右后向毫米波雷达。主要采集侧前及侧后向目标物信息,包括目标与本车的相对横纵向距离、相对横纵向速度、相对横纵向加速度等,通过毫米波雷达11、激光雷达7及功能摄像头6对目标物信息进行融合表征。
47.gnss惯导设备5主要采集试验车定位、航向角、道路曲率等信息。
48.高清摄像头8分为前向、后向、侧向及车内驾驶员摄像头,分别采集前向、后向、侧向及车内驾驶员同步高清视频。
49.车端数据采集系统由软硬件组成,硬件为多接口高性能工控机4及车内用于实时监控的高清显示屏3。软件为能够接入各类传感器信号的数据采集软件,采集软件可实现各类传感器标定、摄像头配置、信号监控显示、多源数据融合及自动保存等功能。
50.车端大容量数据存储系统包括车端部署的nas(网络附属存储)设备1及交换机2,nas设备1通过交换机2与多接口高性能工控机4连接,对采集数据进行存储。
51.车端供电系统由电源转换模块10、逆变器9组成,用于对车内的各类传感器及控制器、车端数据采集系统硬件及车端大容量存储系统供电。逆变器9与车载蓄电池相连,用于给多接口高性能工控机4、nas设备1及交换机2进行供电;电源转换模块10与车载蓄电池相连,给各类传感器及控制器进行供电。
52.一种基于数据驱动的智能汽车拟人化决策规划方法流程主要包含自然驾驶数据采集、多源异构数据预处理、驾驶行为场景挖掘、行为特征筛选提取、行为风格化分类及优劣性评估、拟人化模型参数辨识及拟人化网络模型训练。以数据流的形式进行表征,如图2所示,分别对应原始数据、预处理数据、行为场景数据、行为特征数据、规范标注数据、拟人化规则数据、拟人化模型数据。对应各功能模块分别为多源异构数据预处理模块、行为场景
挖掘模块、关联特征筛选及提取模块、行为风格化分类及评估模块、拟人化模型参数辨识模块、拟人化网络训练模块。各模块数据处理流程如图3所示。
53.多源异构数据预处理模块用于对车端采集的原始数据进行预处理,所采集原始数据包含整车数据、目标物数据、车道线数据、交通标识数据及车身姿态数据等文本类数据以及不同视角的高清视频数据。首先对文本类数据进行预处理,由于不同传感器数据采集频率及采集初始时间戳各不相同,所以需要对所有原始文本数据进行同频同步处理。完成同步同频后还需要对文本数据进行清洗处理,包括异常点去除、缺失点补充、空值填充、数据滤波,将清洗后的数据合并成为一个数据表格,完成从原始数据到预处理数据的转换;针对视频类数据,需进行与文本类数据时间戳同步的处理,还需进行多路视频拼接合并,方便与文本类数据进行同步查看。此模块主要用于将原始数据转换为预处理数据。
54.行为场景挖掘模块用于对生成的预处理数据进行场景挖掘,包括但不限于跟驰、换道、转弯、掉头、通过十字路口、上下匝道、通过隧道等常规行为场景,也包含下陡坡、高速避障、高速过弯、紧急避险等危险行为场景。此模块主要实现从预处理数据生成行为场景数据。主要步骤包括(1)定义行为起止点;(2)定义过程约束条件;(3)编写提取程序批量挖掘;(4)人工结果标注校验;(5)优化场景批量挖掘程序。
55.(1)首先定义行为起止点,起点是指自车信息、目标车信息、交通环境信息满足行为场景触发条件的时刻点。其中,自车信息主要面向自车运动状态,包括横纵向车速、横摆角速度、加减速度,约束条件为:
[0056][0057]
式中,v
min_x
、v
ego_x
、v
max_x
分别表示满足行为场景触发条件的自车纵向车速最小值、自车纵向车速实际值、满足行为场景触发条件的自车纵向车速最大值;v
min_y
、v
ego_y
、v
max_y
分别表示满足行为场景触发条件的自车横向车速最小值、自车横向车速实际值、满足行为场景触发条件的自车横向车速最大值;ω
min
、ω
ego
、ω
max
分别为满足行为场景触发条件的自车横摆角速度最小值、自车横摆角速度实际值、满足行为场景触发条件的自车横摆角速度最大值;a
min_x
、a
ego_x
、a
max_x
分别为满足行为场景触发条件的自车纵向加速度最小值、自车纵向加速度实际值、满足行为场景触发条件的自车纵向加速度最大值;a
min_y
、a
ego_y
、a
max_y
分别表示满足行为场景触发条件的自车横向加速度最小值、自车横向加速度实际值、满足行为场景触发条件的自车横向加速度最大值。
[0058]
目标物信息主要面向完成目标追踪后的6个主目标物(包含正前、正后、左前、左后、右前、右后),通过目标物类型、自车与各目标物的相对横纵向速度及相对横纵向距离进行判断:
[0059][0060]
式中,obj
type_i
为目标物的类型;v
ri_x min
、v
ri_x
、v
ri_x max
分别表示满足行为场景触发条件的自车与目标物相对纵向速度最小值、自车与目标物相对纵向速度实采值、满足行为场景触发条件的自车与目标物相对纵向速度最大值;v
ri_y min
、v
ri_y
、v
ri_y max
分别表示满足行为场景触发条件的自车与目标物相对横向速度最小值、自车与目标物相对横向速度实采值、满足行为场景触发条件的自车与目标物相对横向速度最大值;s
ri_x min
、s
ri_x
、s
ri_x max
分别表示满足行为场景触发条件的自车与目标物相对纵向距离最小值、自车与目标物相对纵向距离实采值、满足行为场景触发条件的自车与目标物相对纵向距离最大值;s
ri_y min
、s
ri_y
、s
ri_y max
分别表示满足行为场景触发条件的自车与目标物相对横向距离最小值、自车与目标物相对横向距离实采值、满足行为场景触发条件的自车与目标物相对横向距离最大值。
[0061]
环境信息主要面向道路交通标识及车道线,针对道路交通标识的约束包括标识(限速、红绿灯或指示牌等)类别判断及自车与交通标识的相对横纵向距离。针对车道线约束主要指车道线类型及自车与车道线的相对距离:
[0062][0063]
式中,ts
type
表示交通标识的类型;s
ts_x min
、s
ts_x
、s
ts_x max
分别为满足行为场景触发条件的自车与交通标识的相对纵向距离最小值、自车与交通标识相对纵向距离实采值、满足行为场景触发条件的自车与交通标识的相对纵向距离最大值;s
ts_y min
、s
ts_y
、s
ts_y max
分别表示满足行为场景触发条件的自车与交通标识的相对横向距离最小值、自车与交通标识的相对横向距离实采值、满足行为场景触发条件的自车与交通标识的相对横向距离最大值;line
type
表示车道线的类型;s
ego_llmin
、s
ego_ll
、s
ego_llmax
分别为满足行为场景触发条件的自车与左侧车道线距离最小值、自车与左侧车道线距离实采值、满足行为场景触发条件的自车与左侧车道线距离最大值;s
ego_rlmin
、s
ego_rl
、s
ego_rlmax
分别为满足行为场景触发条件的自车与右侧车道线距离最小值、自车与右侧车道线距离实采值、满足行为场景触发条件的自车与右侧车道线距离最大值。
[0064]
当满足上述条件时定义为行为场景起点,行为场景终止点结合场景特征定义为不满足上述一项或多项条件时认定场景结束。
[0065]
(2)定义过程约束条件,主要约束包括自车信息约束、目标物信息约束、交通环境
信息约束、持续时间约束。其中自车信息约束、目标物信息约束、交通环境信息约束与上述约束一致,持续时间约束则是针对行为持续时间,即从行为起点到终止点间持续的总时间,需满足最低时间要求。
[0066]
t
min
≤t
[0067]
式中,t
min
为行为场景满足要求的最低持续时间;t为行为场景实际持续时间。
[0068]
(3)完成行为场景约束后,对行为提取算法进行编程,编程工具包括但不限于vs、matlab、pycharm等,编程语言包括但不限于c语言、python等。对所采集预处理数据进行批量挖掘,定义命名规则,每个行为片段均具有时间戳、行为隶属类型的命名。
[0069]
(4)完成提取后,通过人工标注对挖掘结果进行校验,输出准确率指标。
[0070]
(5)通过标注结果,优化上述行为提取定义的边界约束条件及阈值,提高行为场景挖掘准确率。
[0071]
关联特征筛选及提取模块用于对挖掘得到的行为场景关联特征数据进行筛选及提取。得到行为场景片段数据后,需要对该行为场景下的自车信息、与周围目标物、车道线、交通标识相对位置关系及运动状态信息进行详细表征,因此需要筛选提取行为场景数据中的关键特征向量和参数。关联特征筛选及提取模块能够用于行为场景数据转换为行为特征数据。主要步骤包括(1)行为场景分类;(2)特征向量筛选;(3)特征参数获取;(4)参数特征选择;(5)参数特征提取。
[0072]
(1)考虑车辆运动主要分为三大类,包含横向行为、纵向运动及耦合运动,故首先将具体驾驶行为进行分类,若该类行为侧重点为横向运动,则主要考虑车辆的横向运动特征,若该类行为侧重点为纵向运动则主要考虑车辆的纵向运动特征,若该类行为分类为耦合运动则需综合关联横纵向耦合的运动特征。
[0073]
(2)若行为场景分类为横向,则需筛选出横向运动特征,包括自车横向运动速度、自车横向运动加速度、与车道线相对距离、与目标物的横向距离、与目标物横向相对速度等。若为纵向运动则主要考虑车辆的纵向运动特征,包括自车纵向运动速度、自车纵向运动加速度、与目标物纵向距离、与目标物纵向相对速度等。若为耦合运动则要综合考虑横纵向的关联特征,包括自车横纵向速度、自车横纵向加速度、与目标物横纵向距离、与目标物横纵向速度、横摆角速度、距车道线距离等。
[0074]
(3)提取特征向量后获取特征参数,特征参数包括针对特征向量的各类统计量,包括但不限于最小值、最大值、标准差、方差、平均值、中位数、起点值、终点值、行为关键时刻点数值及各时刻点求和数值等,提取主要参数如下:
[0075][0076]
(4)针对获取的参数进行特征选择,选择方法包括但不限于相关性分析、单变量特征选择、方差法等,通过特征选择方法剔除相关性高、方差较小的各类参数,实现特征降维。
[0077]
(5)针对获取的参数进行特征提取,提取方法包括但不限于主成分分析、独立成分分析、线性判别式分析,通过各类特征提取方法获取与该行为关联的主成分因子,实现特征降维。
[0078]
行为风格化分类及评估模块用于对提取到行为特征数据进行风格化分类及优劣性评估,风格化分类指基于各类无监督学习方法对行为风格进行聚类标注,优劣性评估针对各类驾驶行为,制定评估准则,对行为的优劣性进行标注。行为风格化分类及评估模块能
够用于将行为特征数据转换为规范标注数据。主要步骤包括(1)行为无监督聚类;(2)行为风格化标注;(3)构建行为评估体系;(4)参数最优区间判断;(5)行为优劣性标注。
[0079]
(1)由于各行为片段无先验风格化标签,故基于无监督学习聚类进行驾驶风格化标注。通用型聚类方法包括但不限于均值聚类、层次聚类、模糊聚类。为评估行为聚类结果,引入聚类评价度量指标,已知本样本集无成熟外部标注,故选择内部度量方法,以类内距离最小及类间距离最大作为评价目标,以内部指标作为主要评价指标,内部指标包括但不限于轮廓系数。
[0080]
(2)首先定义风格类别,常规可参考激进型、保守型、冷静型三个梯度。已知所采用聚类方法为无监督学习,生成的各簇无明确标签属性,故还需对具体参数进行分析,明确聚类生成的簇分别对应哪类驾驶风格,通过绘制各类特征参数的统计分布情况,将风格标签与各聚类簇进行一一对应。
[0081]
(3)行为优劣性评估针对各类典型驾驶行为,以安全性、通过性、舒适性、节能性为主要准则,安全性指标包含但不限于碰撞时间(ttc)、车头时距(thw),通过性指标包含但不限于平均车速、加速度、交通流量,舒适性指标包括加速度和急动度,节能性指标包括动力性和制动性,例如加速度、减速度、急加速次数、急减速次数等。判断该行为中的各类准则权重,将驾驶行为分为常规驾驶行为和危险驾驶行为,常规驾驶行为包括但不限于跟驰、换道、转弯、掉头、起停,主要考虑驾驶风格因素,适当降低安全性权重,提高舒适性、通过性或节能性需求准则权重。危险驾驶行为包括但不限于下陡坡、高速避障、紧急制动、通过急弯,主要考虑安全性因素,提高安全性准则的权重。
[0082]
(4)确定各类指标最优区间,通过一段时间数据积累后,绘制各类指标参数的统计分布图线,定义符合交规行驶、不发生交通事故且符合多数驾驶员行为规律的参数区间为最优区间。
[0083]
(5)通过评估体系设定的指标权重及对应指标的最优区间给出针对每个行为场景片段的优劣性评估,结合评测结果对具体行为添加优劣性标签。
[0084]
拟人化模型参数辨识模块用于通过各类寻优算法对行为规则模型代辨识参数进行辨识,规则模型即指含有大量代辨识参数的以规则为基准的模型,拟人化模型参数辨识模块能够将规范标注数据转换为拟人化规则数据。主要步骤包括(1)构建规则模型;(2)参数辨识寻优;(3)规则模型评估;(4)生成拟人化规则模型。
[0085]
(1)结合具体行为特点引用或构建规则模型,包括但不限于基于动力学约束的半经验物理模型或以多项式、样条曲线等为基准的各类数学模型。所构建的规则模型能够表征行为特征,且模型中包含一部分代辨识参数,需要通过数据输入进行参数辨识。
[0086]
(2)考虑模型中均存在大量代辨识参数,将前述获得的规范标注数据中带有优秀行为标签的数据按照对应风格化分类输入(1)构建的规则模型中,通过各类寻优辨识算法对参数进行拟人化寻优辨识,寻优辨识的算法包括但不限于遗传算法、粒子群优化算法、模拟退火算法等。
[0087]
(3)完成风格化参数化辨识后,会生成带有风格分类属性的拟人化规则模型,例如前述分为激进型、保守型和冷静型,则此处会生成激进型拟人化规则模型、保守型拟人化规则模型和冷静型拟人化规则模型。以各类误差函数为评价准则,对所辨识的拟人化规则模型进行评估,误差函数包括但不限于平均绝对误差(mae)、均方误差(mse)。完成评估后结合
评估结果对辨识参数进行优化。
[0088]
(4)定义精度阈值,当辨识结果通过评估满足定义的精度阈值后,则认为该拟人化规则模型效果较好,可使用这一组辨识参数构建并生成对应的拟人化规则模型。
[0089]
拟人化网络训练模块用于将各类规范标注数据输入搭建的神经网络模型中,通过模型训练构建拟人化网络,可用于直接对具体行为进行预测。拟人化网络训练模块能够将规范标注数据转换为拟人化模型数据。主要步骤包括(1)构建网络模型;(2)模型训练;(3)模型评估;(4)生成拟人化网络模型。
[0090]
(1)构建神经网络模型,结合行为特点,构建神经网络模型框架对行为进行训练,网络框架包括但不限于单层前馈、多层前馈、rnn、cnn及其对应的变种网络结构。对网络模型参数进行初定义,参数包括但不限于隐含层个数、神经元个数、batch_size、time_step。
[0091]
(2)将带有风格化标注的优秀规范数据作为输入,对神经网络模型进行训练,当迭代到一定次数时中止,按照前述定义激进、保守、冷静三类驾驶风格,可获取激进型拟人化网络模型、保守型拟人化网络模型及冷静型拟人化网络模型。
[0092]
(3)对模型预测结果进行评估及优化,输入对应风格的测试集数据对模型进行测试,通过各类误差函数进行评估,并结合结果对模型进行进一步优化及迭代。
[0093]
(4)定义一定精度阈值,当网络模型预测结果能够满足定义的精度阈值后,则认为该拟人化网络模型效果较好,满足最终应用需求。
[0094]
配套软硬件设备包含硬件及软件两部分,其中,软件包含能够实现上述数据分析处理及模型训练功能的软件;硬件包含能够支撑数据处理及模型训练的各类硬件设备,包括但不限于高性能计算机、gpu、线缆、接头、网线、电源适配器等。
[0095]
下面以跟驰行为场景为例,对本发明所述基于数据驱动的智能汽车拟人化决策规划系统及方法详细进行介绍:
[0096]
当完成车端大规模数据采集后,通过多源异构数据预处理模块对采集数据进行统一预处理,包括文本类及视频类数据同频与同步,异点滤除及缺失点补充。完成数据预处理后通过行为场景挖掘模块对预处理数据进行跟驰行为提取,跟驰行为场景描述如图4所示,定义约束条件为:
[0097][0098]
式中:d
ego
为自车宽度;w为车道宽度;l
l
、lr为坐标原点至左右侧车道线距离;v
ego
为自车车速;xn为与自车在同车道内的目标物相对纵向距离;x
obj
,y
obj
分别为跟驰目标物相对
纵向距离及相对横向距离;d
obj
为目标物宽度;v
obj
为目标物车速;x
max
,x
min
分别为自车与目标物相对纵向距离阈值;thw为车头时距;thw
min
为车头时距阈值。当满足上述约束条件时定义跟驰开始,设定持续时间大于20s的片段为所需跟驰片段。完成约束条件及起止点定义后基于python在pycharm中编写跟驰行为场景挖掘批处理程序对预处理数据进行提取,针对提取数据进行人工校验并对各约束条件及定义阈值进行优化。
[0099]
完成跟驰行为场景挖掘及校验后得到大量有效跟驰行为场景片段,基于关联特征筛选及提取模块对跟驰行为场景关键特征进行提取,已知跟驰行为分类为纵向运动,故取自车纵向速度、纵向加速度、纵向急动度、与跟驰目标物的纵向距离、偏离车道中线距离、与目标物相对纵向速度六个时域指标作为特征向量,取各向量对应标准差、平均值、最大值、最小值作为统计特征参数,添加行为场景片段时长、加速时长占比、匀速时长占比、减速时长占比、与目标渐近时长占比、与目标渐远时长占比、与目标相对稳定时长占比及跟驰目标物类型八个宏观数理统计参数,共计32维参数作为跟驰行为关联特征参数。
[0100]
针对32维特征存在种类繁多、部分参数相关性强等问题,首先对全部参数进行特征选择,采用方差法可得“偏离车道中线距离最小值”这一指标基本均为0,方差较小,故进行筛除。完成特征参数选择后进行特征提取,采用主成分分析(pca)方法,定义目标贡献率为90%,计算每个成分贡献率可得,前8个主成分累加超过90%,故最终提取前8个主成分,实现原始样本集从32维降至8维。
[0101]
完成关键特征提取后基于行为风格化分类及评估模块对所提取的跟驰行为片段进行风格化及优劣性的标注,定义划分风格为激进型、保守型及冷静型,由于各跟驰片段针对驾驶风格划分无先验标签,故基于无监督学习聚类进行驾驶风格化标注。考虑通用性选择k均值无监督聚类方法。针对降维后样本集进行k均值聚类,设置初始迭代中心并观测迭代记录,最终能够实现聚类收敛,通过对全样本轮廓系数进行计算可知聚类结果较好。为确定聚类簇分别对应哪类驾驶风格,还需对具体的参数进行分析,基于数理统计方法获取部分典型指标参数分布,如图5所示,簇1与目标物相对速度平均值多为负值,与目标物渐近时长占比多大于0.5;簇2与目标物相对速度平均值多为正值,且与目标物渐近时长占比多小于0.5;簇3与目标物相对速度平均值多保持在-2m/s~2m/s之间,相对比较稳定,跟随性较好。综合分析可判断:簇1为激进型,簇2为保守型,簇3为冷静型。完成风格化标注后基于跟驰行为评价准则(安全性、舒适性、高效性及节能性)对每个跟驰行为片段进行优劣性评估,考虑跟驰为常规驾驶行为,故提高舒适性、高效性及节能性所占权重,适当降低安全性权重,定义好各准则权重后,确定跟驰相关联参数的最优区间,通过对所采集片段进行统计,可得参数最优区间分布,以此为依据结合各准则指标权重最终获取到带有风格化标签及优劣性标注的行为场景数据。
[0102]
将无监督聚类得到的优秀激进型、冷静型及保守型跟驰行为数据作为理论模型输入,选取gipps跟驰半经验模型,通过拟人化参数辨识模块进行参数寻优。gipps模型综合考虑加减速度及防撞距离约束,是一种安全距离类跟驰模型。理论表达为前车紧急制动,后车控制车速避免碰撞,表达式如下:
[0103][0104]
式中:

t为驾驶员反应时间;am,bm分别为驾驶员期望加、减速度;vm为驾驶员期望速度;为驾驶员对所跟驰前车减速度估计值;l
n-1
为前车车长;

x(t)为两车在t时刻间距;vn(t)为自车在t时刻速度;vn(t+

t)为t+

t时刻预测速度。由于该规则模型中存在大量待辨识参数,故基于遗传算法(ga)对该理论跟驰模型待辨识参数进行标定,设定初始种群为100,选择交叉算子及变异算子,定义变异率及交叉率,引入均方根百分比误差(rmspe)作为目标函数,经多次迭代后,最终误差趋于稳定,选择此时种群均值作为辨识结果,取测试集激进、保守及冷静型跟驰片段,基于拟人化跟驰规则模型预测下一时刻自车车速并进行对比。当对比结果满足初始定义的偏差阈值时,生成对应的跟驰拟人化规则模型。
[0105]
考虑跟驰行为是一种基于时序的连续行为,基于拟人化网络训练模块构建拟人化数据驱动模型,将带有风格化标签及优劣性标注的跟驰片段对应特征向量作为输入,以自车下一时刻运动状态预测作为输出,基于长短期记忆网络(lstm)构建学习模型,学习率设置为1e-3,迭代次数为20000次,取mse作为误差函数,对模型进行训练。设定当误差<5e-6后满足条件,结束迭代,完成训练后对网络模型参数进行锁定,通过测试集进行测试,当满足定义的误差要求时,生成对应的跟驰拟人化网络模型。
[0106]
通过一种基于数据闭环驱动的拟人化系统及方法能够实现原始采集数据最终生成跟驰拟人化模型数据。所生成的拟人化模型能够用于acc(自适应巡航)的功能拟人化优化提升。
[0107]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0108]
在本技术所提供的几个实施例中,应该理解到,所揭露的方法和系统,可以通过其它的方式实现。例如,以上所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。上述单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
[0109]
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。
[0110]
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1