一种基于车联网数据的商用车驾驶行为风险等级辨识方法与流程

文档序号:27426771发布日期:2021-11-17 20:33阅读:245来源:国知局
一种基于车联网数据的商用车驾驶行为风险等级辨识方法与流程

1.本发明涉及车联网交通安全的技术领域,尤其涉及一种基于车联网数据的商用车驾驶行为风险等级辨识方法。


背景技术:

2.随着国民经济的快速发展和城市化进程的加快,我国的物流业快速发展,公路的货运量和周转量正在逐渐上升,货运安全问题成为重中之重。已有研究表明,驾驶员因素是导致交通事故的主要原因,集中体现为驾驶员积极和消极情绪状态,从而对车辆的操控行为失去合理性和规范性,出现急加速、急刹车等不安全驾驶行为,导致追尾、刮碰、侧翻等交通事故,对驾驶员和其他道路交通参与者的生命财产安全造成了极大的威胁。
3.驾驶员的驾驶风险等级不同,对交通事故的贡献也就不同,低风险等级的驾驶员可能引发较少的甚至避免交通事故,而风险等级越高的驾驶员引发的交通事故可能越严重。通常来说,传统方法是通过驾驶员的静态统计数据,例如驾驶员年龄、性别、车型等,并应用广义线性模型对驾驶员驾驶车辆时的风险行为进行预测,该种方法存在数据获取难度大、驾驶场景复杂度低以及预测精度差等问题。随着车联网技术、大数据技术的快速发展,使得海量车联网数据的获取成为可能,而基于机器学习算法的驾驶行为风险等级预测模型将带来更高的预测精度。
4.对商用车驾驶行为风险等级的辨识有助于实时监控驾驶员驾驶风险等级,帮助高风险驾驶员养成良好的驾驶习惯,降低其驾驶风险,从而降低事故发生率,创造更加安全、高效的运输环境,保障驾驶员和货物运输安全。


技术实现要素:

5.本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本技术的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
6.鉴于上述现有存在的问题,提出了本发明。
7.因此,本发明提供了一种基于车联网数据的商用车驾驶行为风险等级辨识方法,能够现有技术中的方法数据获取难度大、场景单一和数据量小导致预测精度低的问题。
8.为解决上述技术问题,本发明提供如下技术方案:包括,获取商用车辆不同路段的车辆行驶数据;将所述商用车辆不同路段的车辆行驶数据传输至云端,并对所述商用车辆不同路段的车辆行驶数据进行数据预处理,获得风险驾驶行为特征数据;基于聚类算法对所述风险驾驶行为特征数据进行驾驶风险聚类分析,获取聚类结果;结合所述风险驾驶行为特征数据和聚类结果,建立基于机器学习算法的驾驶风险预测模型;利用所述驾驶风险预测模型识别驾驶行为风险等级。
9.作为本发明所述的基于车联网数据的商用车驾驶行为风险等级辨识方法的一种优选方案,其中:所述商用车辆不同路段的车辆行驶数据包括,车辆行驶数据:车辆属性,如
底盘号、车辆vin码和车辆类型;gps数据:经纬度、gps海拔、gps车速、gps加速度、gps里程和gps方向;车辆状态数据:ecu车速、加速度、转速、油门开度、档位状态、仪表车速累积里程、变速箱输出轴转速、发动机负荷百分比、发动机扭矩百分比、扭矩、车辆行驶时间、机油压力、终端电池电量和水温。
10.作为本发明所述的基于车联网数据的商用车驾驶行为风险等级辨识方法的一种优选方案,其中:所述数据预处理包括车辆行驶数据的清洗、驾驶风险特征工程的建立、数据的降维处理;所述车辆行驶数据的清洗包括:缺失值的填补、异常值的检测以及跳变数据的删除与修正;利用因子分析法进行所述数据的降维处理,满足下式:
[0011][0012]
其中,x
i
(i=1,2,

,p)为原始特征变量,u
i
为特征变量x
i
所在列数据的均值,f1,f2,

,f
m
为公共因子,ε
i
(i=1,2,

,p)为特殊因子,所有的a
ij
可视为一个因子载荷矩阵。
[0013]
作为本发明所述的基于车联网数据的商用车驾驶行为风险等级辨识方法的一种优选方案,其中:所述缺失值的填补包括,利用均值填补策略进行所述缺失值的填补,满足下式:
[0014][0015]
其中,v
null
为缺失的速度信息,v
i
为第i条信息的车速,n为采集的总的车速信息帧数。
[0016]
作为本发明所述的基于车联网数据的商用车驾驶行为风险等级辨识方法的一种优选方案,其中:所述聚类算法为k

means聚类。
[0017]
作为本发明所述的基于车联网数据的商用车驾驶行为风险等级辨识方法的一种优选方案,其中:所述机器学习算法为决策树算法。
[0018]
作为本发明所述的基于车联网数据的商用车驾驶行为风险等级辨识方法的一种优选方案,其中:所述驾驶风险特征工程包括构建急加速、急刹车、怠速运行、超速行驶以及提取原始特征;建立急加速、急刹车特征时需先计算加速度a:
[0019][0020]
其中,前一秒的时间为t
i
,前一秒的速度为v
i
,后一秒的时间为t
i+1
,后一秒的速度为v
i+1

[0021]
作为本发明所述的基于车联网数据的商用车驾驶行为风险等级辨识方法的一种优选方案,其中:还包括,所述急加速:若所述加速度大于或等于0.4m/s2,持续时间大于或等于2秒,且速度差大于或等于2.88km/h,判定为所述急加速;所述急刹车:若所述加速度小于或等于

1.17m/s2,且减速末期车速小于20km/h,判定为所述急刹车;所述怠速运行:若所述行驶车速为0,且发动机转速位于区间600~800rpm,判定为所述怠速运行;所述超速行
驶:若所述车速大于90km/h且持续时间大于等于2秒,则判定为所述超速行驶。
[0022]
作为本发明所述的基于车联网数据的商用车驾驶行为风险等级辨识方法的一种优选方案,其中:所述原始特征包括行驶里程、行驶时长、行驶车速、加速度。
[0023]
本发明的有益效果:本发明的海量车联网数据,具有采集下载简便、数据量大、数据准确性高等特点;同时通过合理划分驾驶行为风险等级,采用机器学习算法模型训练学习,具备较高的预测精度。
附图说明
[0024]
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
[0025]
图1为本发明第一个实施例所述的一种基于车联网数据的商用车驾驶行为风险等级辨识方法的流程示意图;
[0026]
图2为本发明第一个实施例所述的一种基于车联网数据的商用车驾驶行为风险等级辨识方法的流程示意图;
[0027]
图3为本发明第一个实施例所述的一种基于车联网数据的商用车驾驶行为风险等级辨识方法的流程示意图。
具体实施方式
[0028]
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
[0029]
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
[0030]
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
[0031]
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
[0032]
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
[0033]
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例
如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
[0034]
实施例1
[0035]
参照图1~图3,为本发明的第一个实施例,该实施例提供了一种基于车联网数据的商用车驾驶行为风险等级辨识方法,包括:
[0036]
s1:获取商用车辆不同路段的车辆行驶数据。
[0037]
其中需要说明的是,一般车企或物流公司采用前装技术采集车联网信息,即在汽车生产时就已经将智能车载终端设备置入车内,以确保获得真实可靠的车联网数据;该智能车载终端设备由微控制单元(mcu)、车载诊断系统(obd

ii)、gps全球定位系统、无线通信(gprs)模块、存储模块和电源管理模块等组成,用户可通过车联网管理系统下载所需数据。
[0038]
获取的商用车辆不同路段的车辆行驶数据包括车辆行驶数据、gps数据和车辆状态数据,具体的,车辆行驶数据包括:车辆属性,如底盘号、车辆vin码和车辆类型;gps数据包括:经纬度、gps海拔、gps车速、gps加速度、gps里程和gps方向;车辆状态数据包括:ecu车速、加速度、转速、油门开度、档位状态、仪表车速累积里程、变速箱输出轴转速、发动机负荷百分比、发动机扭矩百分比、扭矩、车辆行驶时间、机油压力、终端电池电量和水温。
[0039]
s2:将商用车辆不同路段的车辆行驶数据传输至云端,并对商用车辆不同路段的车辆行驶数据进行数据预处理,获得风险驾驶行为特征数据。
[0040]
传输商用车辆不同路段的车辆行驶数据,即将获取的数据传输至云端,可从车联网系统下载该数据;
[0041]
数据预处理包括车辆行驶数据的清洗、驾驶风险特征工程的建立、数据的降维处理;
[0042]
具体的,(1)车辆行驶数据的清洗包括:缺失值的填补、异常值的检测以及跳变数据的删除与修正,其中,异常值的检测采用孤立森林算法(isolation forest);利用python编程实现缺失值的填补、异常值的检测以及一些跳变数据的删除与修正。
[0043]
其中,利用均值填补策略进行缺失值的填补,满足下式:
[0044][0045]
其中,v
null
为缺失的速度信息,v
i
为第i条信息的车速,n为采集的总的车速信息帧数。
[0046]
(2)驾驶风险特征工程的建立
[0047]
其中需要说明的是,选取特征、构造特征等一系列过程称为特征工程,因为急加速、急刹车、怠速运行、超速行驶这些特征无法直接采集,需要从采集的车速、加速度等数据计算得到,因此需进行特征工程建立这些特征。
[0048]
建立的驾驶风险特征工程包括急加速、急刹车、怠速运行、超速行驶;
[0049]
具体的,建立急加速、急刹车特征时需先计算加速度a:
[0050][0051]
其中,前一秒的时间为t
i
,前一秒的速度为v
i
,后一秒的时间为t
i+1
,后一秒的速度为v
i+1

[0052]
若加速度大于或等于0.4m/s2,持续时间大于或等于2秒,且速度差大于或等于2.88km/h,判定为急加速;若加速度小于或等于

1.17m/s2,且减速末期车速小于20km/h,判定为急刹车;怠速运行:若行驶车速为0,且发动机转速位于区间600~800rpm,判定为怠速运行;超速行驶:若车速大于90km/h且持续时间大于等于2秒,则判定为超速行驶。
[0053]
驾驶风险特征中能直接采集的特征包括行驶里程、行驶时长、行驶车速和加速度;不能直接采集的特征:怠速时长、超速行驶时长、超速行驶里程、单位里程急加速次数、单位里程急刹车次数,这些特征由于不能直接采集,需构建。
[0054]
最终从影响驾驶风险最关键的三要素(里程、车速、加速度)出发确定的所有用于建模的特征为:行驶里程、行驶时长、加速度均值、减速度均值、车速均值、车速标准差、怠速时长、超速行驶时长、超速行驶里程、单位里程急加速次数、单位里程急刹车次数。
[0055]
(3)数据的降维处理
[0056]
利用因子分析法进行数据的降维处理,满足下式:
[0057][0058]
其中,x
i
(i=1,2,

,p)为原始特征变量,u
i
为特征变量x
i
所在列数据的均值,f1,f2,

,f
m
为公共因子,ε
i
(i=1,2,

,p)为特殊因子,所有的a
ij
可视为一个因子载荷矩阵。
[0059]
对数据的降维处理后的特征提取4个主因子(分别为“变速”因子、“里程

时长”因子、“超速”因子、“怠速”因子),其总的方差贡献率为85.742%,具体的,方差贡献率如表1所示。
[0060]
表1:方差贡献率。
[0061][0062]
s3:基于聚类算法对风险驾驶行为特征数据进行驾驶风险聚类分析,获取聚类结果。
[0063]
本实施例采用k

means聚类进行聚类分析,图2为本实施例提供的基于k

means聚类的驾驶行为风险等级聚类图,下面简述k

means聚类算法的步骤:
[0064]
(1)指定需要划分的簇的个数(驾驶行为风险等级的个数),本实施例将其划分为高风险、中风险和低风险;
[0065]
(2)随机地选择k个数据对象作为初始的聚类中心;
[0066]
(3)计算其余的各个数据对象到这k个初始聚类中心的距离,把数据对象划归到距离它最近的那个中心所在的簇中;
[0067]
(4)调整新的簇并且重新计算新簇的中心;
[0068]
(5)循环步骤(3)和(4),看聚类中心是否收敛,如果收敛或达到迭代次数则停止循环;
[0069]
(6)聚类结束。
[0070]
表2:图2的驾驶行为风险等级聚类结果
[0071] 高风险中风险低风险总行程数/占比行程数596163221204348占比13.7%37.5%48.8%100%
[0072]
总的驾驶行程数为4348,其中高风险行程596个,占比13.7%;中风险行程1632个,占比37.5%;低风险行程2120个,占比48.8%。可见聚类结果符合金字塔结构,即高风险行程数最少,低风险行程数最多,因此聚类结果是合理的。
[0073]
s4:结合风险驾驶行为特征数据和聚类结果,建立基于机器学习算法(cart决策树算法)的驾驶风险预测模型;
[0074]
本实施例基于决策树算法建立驾驶风险预测模型,图3为本实施例提供的不同
max_depth(最大深度)下的数据对驾驶风险预测模型的拟合图,下面简述建立驾驶风险预测模型的步骤:
[0075]
(1)对于当前节点的数据集为d,如果样本个数小于阈值或者没有特征,则返回决策子树,当前节点停止递归;
[0076]
(2)计算样本集d的基尼系数,如果基尼系数小于阈值,则返回决策子树,当前节点停止递归;
[0077]
(3)对每个特征a,对其可能的每个取值a,根据样本点对a=a的测试为“是”或者“否”将d分割成d1,d2,利用以下公式:
[0078][0079][0080]
(4)选择基尼系数最小的特征及其对应的切分点作为最优特征和最优切分点;
[0081]
(5)对左右子节点调用步骤(1)~(4)生成驾驶风险预测模型。
[0082]
由图3可见,当驾驶风险预测模型的max_depth达到4以后,训练集、测试集以及交叉验证对模型的拟合准确度都达到90%以上,模型不仅在训练集上表现优异,在测试集以及10次交叉验证均表现出较好的效果,使得本方法更具备说服力;此外,采用网格搜索对驾驶风险预测模型进行参数优化,避免因传统经验确定参数所致局部最优解的弊端,最终确定的最优参数组合如下表所示。
[0083]
表3:最终确定的最优参数组合。
[0084]
参数值参数值criterionentropymin_samples_leaf1random_state25min_samples_split2spliterbestmax_featurenonemax_depth7min_impurity_decrease0
[0085]
进一步的,利用优化后的驾驶风险预测模型识别驾驶行为风险等级。
[0086]
实施例2
[0087]
为进一步检验该算法模型的性能,本实施例对驾驶风险预测模型的训练样本和测试样本进行训练和测试,并采用精确率、召回率、f1值以及kappa系数等对模型性能进行评价。
[0088]
f1值是精确率和召回率的加权调和均值,相当于精确率和召回率的综合评价指标,可以更好地反映模型的识别性能;kappa系数是一种用来测试分类器的分类结果与随机分类器的分类结果之间的差异程度的评价指标,取值范围为[

1,1];kappa系数取值越大,分类器的分类精度越高。
[0089]
获得的驾驶风险预测模型的识别结果表4所示。
[0090]
表4:识别结果。
[0091][0092]
由上表可知,该决策树模型识别率达96%,并且其kappa系数非常接近于1,为0.93,说明采用本方法对商用车驾驶行为风险等级进行辨识能具备较高的精度。
[0093]
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1