一种移动互联时代下网约车乘客安全监测方法

文档序号:29799488发布日期:2022-04-23 19:44阅读:73来源:国知局
一种移动互联时代下网约车乘客安全监测方法

1.本发明涉及一种移动互联时代下网约车乘客安全监测方法,用于网约车不正当行为概率预测及不正当行为预警,属于智能交通和不正当行为风险预警领域。


背景技术:

2.随着“互联网+”的兴起,网约车逐渐成为了大众的主要出行方式。然而,网约车侵权案件时有发生。完善相关监测技术,实现不正当行为预警,可以及时防范、发现并制止不正当行为行为。
3.目前,监管路径的研究尚处于摸索阶段,短时间内难以建立并完善相应的监管体系。并且网约车安全监测更多地聚焦在异常轨迹判别,忽略乘客风险或司机不正当行为概率计算。此外,不正当行为概率模型更多地关注静态地理环境因素,忽视了动态地理环境、不正当行为心理和已有案件统计规律。因此,考虑司机特征、地理环境因素、时空条件及乘客特征,采用核密度分析法、熵值法和贝叶斯定理,实现网约车司机不正当行为概率预测并完善不正当行为实时监测技术有着重要意义。


技术实现要素:

4.本发明的目的在于提供一种移动互联时代下网约车乘客安全监测方法,本发明的基本思想是融合多维时空数据,计算网约车不正当行为概率并进行网约车风险四级预警。
5.为实现上述目的,本发明提出的监测技术方法包括:基于 k-means算法的司机特征聚类、基于核密度分析法的地理环境风险计算、时空条件的提取及建模、基于熵值法的先验不正当行为概率计算、基于贝叶斯理论的后验不正当行为概率计算和建立不正当行为预警机制。
6.本发明的基本步骤如下:
7.c1、基于k-means算法的司机特征聚类;
8.c2、基于核密度分析法的地理环境风险计算;
9.c3、时空条件的提取及建模;
10.c4、基于熵值法的先验不正当行为概率计算;
11.c5、基于贝叶斯理论的后验不正当行为概率计算;
12.c6、建立不正当行为预警机制。
13.步骤c1中基于k-means算法的司机特征聚类过程包括,
14.c11、获取某一城区网约车司机的基础数据,包括每个司机的性别、年龄、接单数、综合评分、差评比例、投诉比例,得到任意司机 i的6维属性xi={x
i1
,x
i2
,x
i3
,x
i4
,x
i5
,x
i6
},具体如下:
15.c111,设置虚拟变量:性别男则x
i1
=0,性别女则x
i1
=1;
16.c112,标准化处理:年龄、接单数、综合评分,即x
ij
=(x
ij
’‑
μ
ij
)/σ
ij
。式中,x
ij’是司机i第j个属性的原始值,x
ij
是x
ij’的标准化结果,μ
ij
和σ
ij
分别是司机i第j个属性原始值的
平均值和方差。
17.c12、利用k-means算法对样本集合r6进行聚类分析, r6={x1,

xm}。将k值取为3,并将类别名称定义为稳重资深型、稳步上升型、冲动兼职型。主要步骤有两个:
18.c121,随机选取3个聚类质心点为μ1,μ2,μ3∈r6;
19.c122,分别利用下列公式重复迭代类别划分和质心计算,直至质心不变或者变化很小。
[0020][0021][0022]
式中,ci表示第i个司机与3个聚类质心点中距离最近的类,xi表示第i个司机的6维属性,μk表示第k个聚类质心点,μ
kj
表示第k 个聚类质心点的第j个特征值,m表示司机的样本数。
[0023]
步骤c2中基于核密度分析法的地理环境风险计算过程包括,
[0024]
c21、利用百度地图api获取了同一城区表征地理环境的基础数据点,并将生活服务、美食、购物数据点的权重p赋值为1,将树林和工地的权重p赋值为-1。利用arcmap和python对所有数据点进行核密度分析,得到核密度计算结果。任意位置(x,y)处的核密度f(x,y) 的计算公式如下,
[0025][0026][0027][0028]
式中,r表示搜索半径/带宽,di表示数据点i(xi,yi)与任意位置(x, y)之间的距离,sd表示标准距离,dm表示所有数据点到平均中心的距离的中值,pi为数据点i的权重,n为数据点个数。
[0029]
c22、每间隔100m选取一个采集点,根据区域核密度分析计算结果,确定出行路线上任意一采集点的核密度值。依据所有采集点的核密度平均值计算整体出行风险,依据实时定位处的核密度值计算实时风险,利用min-max标准化方法对二者进行归一化处理。
[0030][0031]
[0032]
式中,rf表示整体出行风险,即路线沿线j个采集点核密度平均值的归一化结果,f(xj,yj)为第c个采集点处的核密度值,f(x
t
,y
t
)为实时定位(x
t
,y
t
)处的核密度值,rr表示出行实时风险,即实时定位(x
t
,y
t
) 处核密度值的归一化结果,f
min
表示当前区域核密度最小值,f
max
表示当前区域核密度最大值。
[0033]
步骤c3中时空条件的提取及建模过程包括,
[0034]
c31、以22:00作为时间起点,以10:00作为时间终点,对出发时刻进行归一化处理。将100km作为出行距离最大值,对出行距离进行归一化处理,大于100km的取值为1。
[0035]
c32、当司机偏航且并非切换至常用路线时,被认为是异常偏航。根据出行od,利用百度地图api获取历史最优出行路线,包括不同工作日、非工作日下不同时段(早高峰、平峰、晚高峰、低峰)内时间最短、距离最短、躲避拥堵等常用路线,得到常用路线集合l={l1, l2,

,ln}。设置异常偏航距离初始值为0(ds=0),可能切换路线集合l’={l1,l2,

,le},可能切换路线数的初始值为e(e=n-1),则异常偏航的判别方法和步骤如下:
[0036]
c321,依据公式计算当前定位(x
t
,y
t
)与点(xd,yd)之间的距离d
dt
、上一定位(x
t’,y
t’)与(xd,yd)之间的距离d
dt’及二者之差δd
dt

[0037][0038]
c322,当δd
dt
》0时,跳至c323;否则返回结果为正常行驶,βd=0,跳至c321。
[0039]
c323,依据公式,依次计算当前定位(x
t
,y
t
)与各个常用路线的最短距离及其变化δd
ft

[0040]
δd
ft
=d((x
t
,y
t
),lf)-d((x
t'
,y
t'
),lf),f=1,2,...,e
[0041]
式中,δd
dt
表示当前定位(x
t
,y
t
)与点(xd,yd)之间的距离与上一定位 (x
t’,y
t’)与(xd,yd)之间的距离之差,f表示第f个常用路线,f=1,2,...,e。
[0042]
c324,f=1,2,

,e,依次判别δd
ft
;当δd
ft
≥0时,e=e-1,在l’中剔除lf。
[0043]
c325,若e》0,则返回至c321;否则跳至c326。
[0044]
c326,令异常偏航距离ds=δd
dt
,异常偏航距离比(归一化值) βd=δd
dt
/s,t=t+10,返回c321。
[0045]
c33、当实时路况为畅通,而车辆速度小于5km/h时,被认为是异常停车。若行驶时间大于预计行程时间,则利用危险系数对异常停车时间进行扩大。利用百度地图api和gps终端,可以获取车辆的实时信息,包括速度v
t
,行驶时间t,预计行程时间t0,车辆所处路段的实时路况s
lt
:拥堵(0)、缓慢(1)、畅通(2)。具体步骤如下:
[0046]
c331,计算异常停车危险系数η,公式如下:
[0047]
η=max(t
t
/t0,1)
[0048]
式中,t
t
所获取到的车辆实时行驶时间,t0表示预计行程时间。
[0049]
c332,实时判别路况和车速,当s
lt
=2且v
t
《5km/h时,ts=ts+10,令异常停车时间ts’=η
·
ts,异常停车时间比(归一化值)β
t
=ts’/t0。
[0050]
c333,t=t+10,返回c331。
[0051]
步骤c4中基于熵值法的先验不正当行为概率计算过程包括:
[0052]
c41、通过计算3类稳重资深型、稳步上升型、冲动兼职型司机熵值,依次来判断不同类别司机的整体出行风险rf、出行实时风险 rr、出发时刻t0、出行距离s、异常偏航距离比
βd、异常停车时长比β
t 6个因素的随机性及无序程度。分析m个出行样本,6项评价指标,形成原始指标数据矩阵:
[0053][0054]
式中,x
mj
表示第m个出行样本第j项评价指标的数值。
[0055]
c42、对各指标进行标准化处理,公式如下,
[0056][0057]
式中,x
mj
是出行m第j个属性的原始值,x’mj
是x
mj
的标准化结果,μ
mj
和σ
mj
分别是出行m第j个属性原始值的平均值和方差。
[0058]
c43、计算第j个指标中,第m个样本标志值的比重,并建立数据的比重矩阵。
[0059][0060][0061]
式中,h
mj
表示第j个指标中,第m个样本标志值的比重,h表示数据的比重矩阵。
[0062]
c44、计算第j个指标的熵值。
[0063][0064][0065]
0≤ej≤1
[0066]
式中,ej表示第j个指标的熵值,k为常数,m表示出行的样本数。
[0067]
c45、定义第j个指标的差异程度和权重。
[0068]dj
=1-ej[0069][0070]
式中,dj和wj分别表示第j个指标的差异程度和权重,ej表示第j个指标的熵值。
[0071]
c46、综合评价第m个样本的数值,即为网约车司机不正当行为概率先验值p(c)。
[0072][0073]
步骤c5中基于贝叶斯理论的后验不正当行为概率计算过程包括:
[0074]
c51、按照年龄、性别和人数将乘客分为五类,每类乘客在正常出行中和司机具有不正当行为出行中的比例如下表所示,分别对应已知出行正常时每类乘客的条件概率p(p|n)和已知司机具有不正当行为时每类乘客的条件概率p(p|c)。
[0075][0076]
c52、提取乘客信息,主要包括性别、年龄和人数,对乘客类别进行判断。根据网约车司机不正当行为概率先验值和该类别乘客的条件概率,利用贝叶斯定理,计算网约车司机不正当行为概率的后验值。
[0077][0078]
式中,p表示乘客类别,p=1、2、3、4、5;p(c|p)表示已知乘客为类别p时,网约车司机不正当行为概率值,p(n)表示司机正当行为的概率。
[0079]
步骤c6中建立不正当行为预警机制过程包括:
[0080]
c61、自动向乘客发出预警提醒和确认消息,提醒乘客注意司机驾驶行为,并确认司机是否有可疑行为,正常反馈为1,无反馈或有问题时为0。
[0081]
c62、当反馈为1时,返回步骤c61;当反馈为0时,自动向乘客紧急联系人发出预警提醒和确认消息,把车辆信息发送给乘客紧急联系人,并向其确认乘客是否安全,正常反馈为3,无反馈或有问题时为2。
[0082]
c63、当反馈为3时,返回步骤c61;当反馈为2时,自动向网约车平台发出预警提醒和确认消息,向其确认司机和乘客当前状态,正常反馈为5,无反馈或有问题时为4。
[0083]
c64、当反馈为5,返回步骤c61;当反馈为4时,自动向管理部门发送车辆及司机信息,管理部门利用卡口数据确认司机和乘客当前状态,直至乘客安全到达目的地。
[0084]
本发明的有益效果:本发明基于聚类算法、核密度分析和判别算法,将司机特征、地理环境、时空条件等时空多维数据转换为影响不正当行为概率的主要因素;再运用熵值法,将司机特征、地理环境、时空条件对不正当行为概率的影响进行分析,并建模;最后根据贝叶斯理论,挖掘并利用乘客信息,计算后验不正当行为概率。全面考虑多种因素,并针对不同因素的不同影响、不同时空数据的不同特点,采用不同的分析方法,能够提高不正当行为概率计算结果的科学合理性,从而实现在保证及时预警的基础上,减少无效预警。
附图说明
[0085]
图1风险预警系统流程图
具体实施方式
[0086]
下面结合附图1对本发明进行详细阐述,本发明具体步骤是:
[0087]
步骤一、提取司机各方面特征,利用k-means算法对司机进行聚类分析:
[0088]
(1)获取某一城区网约车司机的基础数据,包括每个司机的性别、年龄、接单数、综合评分、差评比例、投诉比例等。由于不同量纲的特征处于不同数值量级,为减少方差大的特征的影响、加快收敛速度,需对数据进行处理,得到任意司机i的6维属性xi={x
i1
,x
i2
,
x
i3
,x
i4
,x
i5
, x
i6
},具体方法如下:
[0089]

虚拟变量:性别男则x
i1
=0,性别女则x
i1
=1。
[0090]

标准化处理:年龄、接单数、综合评分,即x
ij
=(x
ij
’‑
μ
ij
)/σ
ij
。式中,x
ij’是司机i第j个属性的原始值,x
ij
是x
ij’的标准化结果,μ
ij
和σ
ij
分别是司机i第j个属性原始值的平均值和方差。
[0091]
(2)利用k-means算法对样本集合r6进行聚类分析, r6={x1,

xm}。由于分类过多会造成专家打分困难,准确度降低,因此,根据实际经验将k值取为3,并将类别名称定义为稳重资深型、稳步上升型、冲动兼职型。算法主要步骤有两个:
[0092]

随机选取3个聚类质心点为μ1,μ2,μ3∈r6;
[0093]

分别利用下列公式重复迭代类别划分和质心计算,直至质心不变或者变化很小。
[0094][0095][0096]
式中,ci表示第i个司机与3个聚类质心点中距离最近的类,xi表示第i个司机的6维属性,uk表示第k个聚类质心点,μ
kj
表示第k 个聚类质心点的第j个特征值,m表示司机的样本数。
[0097]
步骤二、根据生活服务、美食餐饮、购物场所、山林/公园等场所不同的权重,运用核密度分析法计算整体风险和实时风险:
[0098]
(1)利用百度地图api获取了同一城区表征地理环境的基础数据点,并将生活服务、美食、购物数据点的权重p赋值为1,将树林和工地的权重p赋值为-1。利用arcmap和python对所有数据点进行核密度分析,得到核密度计算结果。任意位置(x,y)处的核密度f(x,y)的计算公式如下:
[0099][0100][0101][0102]
式中,r表示搜索半径/带宽,di表示数据点i(xi,yi)与任意位置(x,y) 之间的距离,sd表示标准距离,dm表示所有数据点到平均中心的距离的中值,pi为数据点i的权重,n为数据点个数。
[0103]
(2)每间隔100m选取一个采集点,根据区域核密度分析计算结果,可以确定出行路线上任意一采集点的核密度值。本文依据所有采集点的核密度平均值计算整体出行风险,
依据实时定位处的核密度值计算实时风险,利用min-max标准化方法对二者进行归一化处理。
[0104][0105][0106]
式中,rf表示整体出行风险,即路线沿线j个采集点核密度平均值的归一化结果,f(xj,yj)为第c个采集点处的核密度值,f(x
t
,y
t
)为实时定位(x
t
,y
t
)处的核密度值,rr表示出行实时风险,即实时定位(x
t
,y
t
) 处核密度值的归一化结果,f
min
表示当前区域核密度最小值,f
max
表示当前区域核密度最大值。
[0107]
步骤三、运用判别算法,根据出行特征、偏航、停车等数据建模:
[0108]
(1)由于网约车司机发生不正当行为的时间一般多发于夜晚,因此,以22:00作为最大值,以10:00作为最小值,对出发时刻进行归一化处理。由于大部分网约车出行为城市内部出行,因此,将100km 作为出行距离最大值,对出行距离进行归一化处理,大于100km的取值为1。
[0109]
(2)当司机偏航且并非切换至常用路线时,被认为是异常偏航。根据出行od,利用百度地图api获取历史最优出行路线,包括不同工作日、非工作日下不同时段(早高峰、平峰、晚高峰、低峰)内时间最短、距离最短、躲避拥堵等常用路线,得到常用路线集合l={l1, l2,

,ln}。设置异常偏航距离初始值为0(ds=0),可能切换路线集合l’={l1,l2,

,le},可能切换路线数的初始值为e(e=n-1),则异常偏航的判别方法和步骤如下:
[0110]

依据公式计算当前定位(x
t
,y
t
)与d点(xd,yd)之间的距离d
dt
、上一定位(x
t’,y
t’)与(xd,yd)之间的距离d
dt’及二者之差δd
dt

[0111][0112]

当δd
dt
》0时,跳至

;否则返回结果为正常行驶,βd=0,跳至


[0113]

依据公式,依次计算当前定位(x
t
,y
t
)与各个常用路线的最短距离及其变化δd
ft

[0114]
δd
ft
=d((x
t
,y
t
),lf)-d((x
t'
,y
t'
),lf)
[0115]
f=1,2,...,e
[0116]

f=1,2,

,e,依次判别δd
ft
;当δd
ft
≥0时,e=e-1,在l’中剔除 l
p

[0117]

若e》0,则返回至

;否则跳至


[0118]

令异常偏航距离ds=δd
dt
,异常偏航距离比(归一化值)βd=δd
dt /s,t=t+10,返回


[0119]
(3)当实时路况为畅通,而车辆速度过低(小于5km/h)时,被认为是异常停车。若行驶时间大于预计行程时间,则利用危险系数对异常停车时间进行扩大。利用百度地图api和gps终端(如手机),可以获取车辆的实时信息,包括速度v
t
,行驶时间t,预计行程时间t0,车辆所处路段的实时路况s
lt
:拥堵(0)、缓慢(1)、畅通(2)。具体步骤如下:
[0120]

计算异常停车危险系数η,公式如下:
[0121]
η=max(t
t
/t0,1)
[0122]

实时判别路况和车速,当s
lt
=2且v
t
《5km/h时,ts=ts+10,令异常停车时间ts’=η
·
ts,异常停车时间比(归一化值)β
t
=ts’/t0。
[0123]

t=t+10,返回


[0124]
步骤四、基于熵值法的先验不正当行为概率计算:
[0125]
(1)通过计算3类稳重资深型、稳步上升型、冲动兼职型司机熵值,依次来判断不同类别司机的整体出行风险rf、出行实时风险rr、出发时刻t0、出行距离s、异常偏航距离比βd、异常停车时长比β
t
这6个因素的随机性及无序程度。分析m个出行样本,6项评价指标,形成原始指标数据矩阵:
[0126][0127]
式中,x
mj
表示第m个出行样本第j项评价指标的数值。
[0128]
(2)为消除因量纲不同对评价结果的影响,需要对各指标进行标准化处理,公式如下:
[0129][0130]
式中,x
mj
是出行m第j个属性的原始值,x’mj
是x
mj
的标准化结果,μ
mj
和σ
mj
分别是出行m第j个属性原始值的平均值和方差。
[0131]
(3)计算第j个指标中,第m个样本标志值的比重,并建立数据的比重矩阵。
[0132][0133][0134]
式中,h
mj
表示第j个指标中,第m个样本标志值的比重,h表示数据的比重矩阵。
[0135]
(4)计算第j个指标的熵值。
[0136][0137][0138]
0≤ej≤1
[0139]
式中,ej表示第j个指标的熵值,k为常数,m表示出行的样本数。
[0140]
(5)定义第j个指标的差异程度和权重。
[0141]dj
=1-ej[0142][0143]
式中,dj和wj分别表示第j个指标的差异程度和权重,ej表示第j个指标的熵值。
[0144]
(6)综合评价第m个样本的数值,即为网约车司机不正当行为概率先验值p(c)。
[0145][0146]
步骤五、基于贝叶斯理论的后验不正当行为概率计算:
[0147]
(1)按照年龄、性别和人数将乘客分为五类,每类乘客在正常出行中和司机具有不正当行为出行(50个案例)中的比例如下表所示,分别对应已知出行正常时每类乘客的条件概率p(p|n)和已知司机具有不正当行为时每类乘客的条件概率p(p|c)。
[0148][0149]
(2)提取乘客信息,主要包括性别、年龄和人数,对乘客类别进行判断。根据网约车司机不正当行为概率先验值和该类别乘客的条件概率,利用贝叶斯定理,计算网约车司机不正当行为概率的后验值。
[0150][0151]
式中,p表示乘客类别,p=1、2、3、4、5;p(c|p)表示已知乘客为类别p时,网约车司机不正当行为概率值,p(n)表示司机正当行为的概率。
[0152]
步骤六、建立不正当行为预警机制:
[0153]

自动向乘客发出预警提醒和确认消息,提醒乘客注意司机驾驶行为,并确认司机是否有可疑行为,正常反馈为1,无反馈或有问题时为0。
[0154]

当反馈为1时,返回步骤

;当反馈为0时,自动向乘客紧急联系人发出预警提醒和确认消息,把车辆信息发送给乘客紧急联系人,并向其确认乘客是否安全,正常反馈为3,无反馈或有问题时为 2。
[0155]

当反馈为3时,返回步骤

;当反馈为2时,自动向网约车平台发出预警提醒和确认消息,向其确认司机和乘客当前状态,正常反馈为5,无反馈或有问题时为4。
[0156]

当反馈为5,返回步骤

;当反馈为4时,自动向管理部门发送车辆及司机信息,管理部门利用卡口数据确认司机和乘客当前状态,直至乘客安全到达目的地。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1