考虑动态交通流的城市快速路交通事故风险量化评估方法

文档序号:31834709发布日期:2022-10-18 20:47阅读:96来源:国知局
考虑动态交通流的城市快速路交通事故风险量化评估方法

1.本发明属于交通事故风险评估领域,具体的说是一种考虑动态交通流的城市快速路交通事故风险量化评估方法。


背景技术:

2.我国城市道路交通事故率居高不下,严重影居民出行安全。相较于事故发生后的被动式管理,事前风险主动评估在提升道路交通安全方面更加有效。交通事故风险主动评估是提升道路交通安全的有效手段,该方法通过融合不同时空尺度的历史事故数据与交通流数据预测事故风险,从而辨识事故前兆。传统交通事故风险评估研究多集中在事故发生与否预测和事故影响因素预测方面,缺乏对实时事故风险的量化表征,难以有效评估事故风险的实时可能性。因此,交通事故风险管控无法根据事故发生的时间与空间量化值进行动态调整,导致交通安全管控策略提升缺乏精细化支撑。


技术实现要素:

3.本发明是为了解决上述现有技术存在的不足之处,提出一种考虑动态交通流的城市快速路交通事故风险量化评估方法,以期能实现对快速路交通事故风险的实时量化表征,并能提高交通事故风险评估的准确性,进而提高城市快速路交通事故风险精准化管控水平。
4.本发明为达到上述发明目的,采用如下技术方案:
5.本发明一种考虑动态交通流的城市快速路交通事故风险量化评估方法的特点是按照如下步骤进行:
6.步骤1:交通数据采集与处理;
7.步骤1.1:将研究道路划分为当前事故路段k、事故上游路段k-1、事故下游路段k+1;
8.步骤1.2:获取每条路段的历史事故数据、流量数据、速度数据;
9.步骤1.3:针对第a周第b天发生的一起事故样本,以事故发生前h时段为基准,将h时段按照间隔c分成d个时间切片,并根据步骤1.2所获取的数据,分别统计d个时间切片内当前事故路段k、事故上游路段k-1、事故下游路段k+1的平均流量、平均速度、流量标准差、速度标准差;
10.步骤1.4:从交通数据库中筛选出第a周第b天中d个时间切片内所有n个事故样本y={y1,y2,

,yi,...,yn},并统计n个事故样本y在对应的当前事故路段k、事故上游路段k-1、事故下游路段k+1的平均流量、平均速度、流量标准差、速度标准差,从而构造事故组数据集;其中,所述事故组数据集中的因变量为n个事故样本y,且第i个事故样本yi=1表示第i次观测到事故发生;所述事故组数据集中的解释变量集合x为d个时间切片内n个事故样本y在当前事故路段k、事故上游路段k-1、事故下游路段k+1的平均流量、平均速度、流量标准差、速度标准差;
11.步骤1.5:筛选出第a+o周第b天d个时间切片内所有g个非事故样本y

,并统计g个非事故样本y

在对应的当前事故路段k、事故上游路段k-1、事故下游路段k+1的平均流量、平均速度、流量标准差、速度标准差,从而构造非事故组数据集;在所述非事故组数据集中的因变量为g个非事故样本y

,且任意第g个非事故样本y
′g=0表示第g次观测到事故未发生;所述非事故组数据集中的解释变量集合x

为第a+o周第b天d个时间切片内g个非事故样本y

在对应的当前事故路段k、事故上游路段k-1、事故下游路段k+1的平均流量、平均速度、流量标准差、速度标准差;其中,o为正整数;
12.由所述事故组数据集和非事故组数据集组成融合数据集;
13.步骤2:利用式(1)建立二元logit回归模型;
[0014][0015]
式(1)中,pi表示第i次观测到交通事故发生的概率,α为截距项;β为回归系数向量;xi为第i个事故样本yi的解释变量集合;
[0016]
步骤3:对所述融合数据集进行二元logit回归分析,得到二元logit归回模型显著性检验结果,将检验结果中的显著性评价指标p-值与所设定的置信度水平进行比较,从而筛选出对事故风险具有显著影响的解释变量集其中,表示第i次观测的对事故风险具有显著影响的解释变量,l表示观测次数,l=n+g;
[0017]
步骤4:对所述二元logit回归模型进行参数估计;
[0018]
根据第i次观测到交通事故发生的概率pi计算第i次观测到非交通事故的概率为1-pi,从而利用式(2)计算总观测次数中发生事故的概率pi:
[0019][0020]
利用式(3)对所述二元logit回归模型进行极大似然估计,得到似然函数l(θ):
[0021][0022]
式(4)中,θ为估计参数;
[0023]
步骤5:计算二元logit回归模型的相对优势比;
[0024]
步骤5.1:利用式(4)计算当前事故路段k第i次观测到的事故发生条件下的解释变量x
ki
相对于第j次观测到的事故未发生条件下的解释变量x

kj
的优势比的优势比
[0025]
式(4)中,β1,β2,β3,...,β
l
为二元logit回归模型的l个参数估计系数;p(x
ki
),p(x

kj
)分别表示在当前事故路段k第i次观测的事故发生概率和第j次观测的事故不发生概率;
[0026]
步骤5.2:利用式(5)计算当前事故路段k在解释变量x
ki
作用下交通事故发生概率p(x
ki
)与解释变量x
ki
,x

kj
共同作用下交通事故发生概率p(x-kij
)的相对优势比
[0027][0028]
式(5)中,x-kij
表示当前事故路段k第i次观测的事故发生条件下的解释变量x
ki
与第j次观测到的事故未发生条件下的解释变量x

kj
的平均值;
[0029]
步骤6:利用式(6)构建当前事故路段k的交通事故风险量化表征模型log(ck):
[0030][0031]
式(6)中,ck表示当前事故路k的交通事故风险量化值;
[0032]
步骤7:对交通事故风险进行实时量化评估:
[0033]
根据对当前事故路k具有显著影响的解释变量集获取所述解释变量集的实时动态数据,并将所述实时动态数据输入所述事故风险量化表征模型log(ck)中,从而得到当前事故路k交通事故风险的量化评估值。
[0034]
与现有技术相比,本发明的有益效果在于:
[0035]
本发明基于历史交通事故数据与动态交通流数据的融合数据集量化分析快速路交通事故风险,首先运用二元逻辑回归分析方法预测城市快速路交通事故风险影响因素;其次对二元logit模型进行参数估计并计算模型相对优势比;最后根据相对优势比及参数评估得到的交通事故风险影响因素,构建城市快速路交通事故风险实时量化表征模型,从而只需要输入实时变化的交通流数据,即可实现对快速路不同时空尺度下交通事故风险的实时量化评估,克服了现有技术中快速路交通事故风险难以实时量化的问题,提高了城市快速路交通事故风险精准化管控水平,降低了交通事故率。
附图说明
[0036]
图1为本发明方法的流程图;
[0037]
图2为本发明交通事故风险量化评估结果图;
[0038]
图3为本发明模型结果外部验证的roc曲线图。
具体实施方式
[0039]
如图1所示,本实施例中,一种考虑动态交通流的城市快速路交通事故风险量化评估方法,包括如下步骤:
[0040]
步骤1:交通数据采集与处理;
[0041]
步骤1.1:将研究道路划分为当前事故路段k、事故上游路段k-1、事故下游路段k+1;
[0042]
步骤1.2:获取每条路段的历史事故数据、流量数据、速度数据;
[0043]
步骤1.3:针对第a周第b天发生的一起事故样本,以事故发生前h时段为基准,将h时段按照间隔c分成d个时间切片,并根据步骤1.2的数据,分别统计d个时间切片上当前事
故路段k、事故上游路段k-1、事故下游路段k+1的平均流量、平均速度、流量标准差、速度标准差;
[0044]
本实施例中,事故发生前h时段需要选择合适的时间,这是因为选择时间范围过长会高估某些变量的作用,而选择较短时间又会遗漏某些重要变量的影响。事故发生前30分钟的动态交通流能较好地解释动态交通流特性对事故的影响,因此步骤1.3中的h时段选择为30分钟。为了消除数据中随机扰动对交通流数据的影响,通常将短时间采集的交通流数据集记到较长的时间间隔,本发明将短时间采集的交通流数据集记成6分钟统计一次,即间隔c为6分钟,最终得到d个时间切片为5个时间切片。例如,对于第一周第一天10:37发生的某起交通事故,将该事故发生前30分钟时间尺度按照6分钟统计间隔分成5个时间切片进行数据统计,分别为:事故发生前0-6分钟(即10:31-10:37),事故发生前6-12分钟(10:25-10:31),事故发生前12-18分钟(10:19-10:25),事故发生前18-24分钟(10:13-10:19)和事故发生前24-30分钟(10:07-10:13)。
[0045]
步骤1.4:筛选出第a周第b天中d个时间切片内所有n个事故样本y={y1,y2,

,yi,

,yn},并统计n个事故样本y在对应的当前事故路段k、事故上游路段k-1、事故下游路段k+1的平均流量、平均速度、流量标准差、速度标准差,从而构造事故组数据集;其中,事故组数据集中的因变量为n个事故样本y,且第i个事故样本yi=1表示第i次观测到事故发生;解释变量集合x为d个时间切片内n个事故样本y在当前事故路段k、事故上游路段k-1、事故下游路段k+1的平均流量、平均速度、流量标准差、速度标准差;
[0046]
具体实施中,事故组数据集构造过程中,每一起事故样本(即每一个因变量)共对应5
×3×
4个解释变量,其中5代表5个时间切片(事故发生前0-6分钟、事故发生前6-12分钟、事故发生前12-18分钟、事故发生前18-24分钟、事故发生前24-30分钟),3代表3条路段(当前事故路段k、事故上游路段k-1、事故下游路段k+1),4代表4个变量(平均流量、平均速度、流量标准差和速度标准差)。
[0047]
步骤1.5:筛选出第a+o周第b天d个时间切片内所有g个非事故样本y

,并统计g个非事故样本y

在对应的当前事故路段k、事故上游路段k-1、事故下游路段k+1的平均流量、平均速度、流量标准差、速度标准差,从而构造非事故组数据集;在非事故组数据集中,因变量为g个非事故样本y

,且任意第g个非事故样本y
′g=0表示第g次观测到事故未发生;解释变量集合x

为第a+o周第b天d个时间切片内g个非事故样本y

在对应的当前事故路段k、事故上游路段k-1、事故下游路段k+1的平均流量、平均速度、流量标准差、速度标准差;o为正整数;
[0048]
将事故组数据与非事故组数据进行融合。
[0049]
具体实施中,非事故组数据集样本数按照与事故组数据集样本数的比值为1:4的原则构造,同时非事故组数据集的采集与事故组数据集采用相同路段不同的时间。例如,事故组数据选择第一周第一天10:37发生的某起交通事故及其对应时间(10:31-10:37、10:25-10:31、10:19-10:25、10:13-10:19、10:07-10:13)与空间(当前事故路段k、事故上游路段k-1、事故下游路段k+1)范围的平均流量、平均速度、流量标准差和速度标准差。非事故组数据分别选择第二周第一天、第三周第一天、第四周第一天、第五周第一天相同路段10:37的非事故数据及其在10:31-10:37、10:25-10:31、10:19-10:25、10:13-10:19、10:07-10:13的平均流量、平均速度、流量标准差和速度标准差数据。因此最终事故组和非事故组融合数
据集中,事故因变量(yi=1)及其对应的解释变量占总数据的20%,非事故因变量(y
′g=0)及其对应的解释变量占总数据的80%。
[0050]
步骤2:利用式(1)建立二元logit回归模型;
[0051][0052]
式(1)中,pi表示第i次观测到交通事故的概率,α为截距项;β为回归系数向量;xi为第i个事故样本yi的解释变量;
[0053]
步骤3:对所述融合数据集进行二元logit回归分析,得到二元logit归回模型显著性检验结果,将检验结果中的显著性评价指标p-值与所设定的置信度水平进行比较,从而筛选出对事故风险具有显著影响的解释变量集其中,表示第i次观测的对事故风险具有显著影响的解释变量,l表示观测次数,l=n+g。
[0054]
本实施例中,当回归分析得到的解释变量的显著性评价指标p-值小于等于0.05时,认为该解释变量对事故风险具有显著性影响,否则,不具有显著性影响。
[0055]
步骤4:对二元logit回归模型进行参数估计;
[0056]
首先根据第i次观测到交通事故的概率pi计算第i次观测到非交通事故的概率为1-pi,利用式(2)计算总观测次数中发生事故的概率pi:
[0057][0058]
利用式(3)对二元logit回归模型进行极大似然估计,得到似然函数l(θ),l(θ)推导过程如下:
[0059][0060]
式(3)中,θ为估计参数;
[0061]
分别将似然函数的截距项和解释变量的回归系数求偏导,令其等于0,通过迭代计算最终可以获得似然函数最大的总体参数。
[0062]
步骤5:计算二元logit回归模型的相对优势比;
[0063]
步骤5.1:计算优势比;
[0064]
传统logit模型参数评估采用的是极大似然估计方法,但极大似然估计评估随机影响参数的过程是相互独立的,该情况下,事故组数据和非事故组数据配对变量对模型的影响得不到有效评估。优势比(log odds ratio)在交通事故配对研究中常用于预测交通事故率,因此本发明采用优势比分析交通事故率。
[0065]
根据当前事故路段k第i次观测到的事故发生条件下的解释变量x
ki
和第j次观测到的事故未发生条件下的解释变量x

kj
,利用式(16)计算当前事故路段k,x
ki
相对于x

kj
发生
交通事故的优势比
[0066][0067]
式(4)中,β1,β2,β3,


l
为二元logit回归模型的l个参数估计系数;p(x
ki
),p(x

kj
)分别表示在当前事故路段k第i次观测的事故发生概率和第j次观测的事故不发生概率。式(16)等号的右侧部分主要取决于参数β
l
,因此对于优势比的分析可以通过评估参数β
l
得到。
[0068]
步骤5.2:计算相对优势比;
[0069]
在常规交通运行条件下,可以基于相对优势比预测交通事故风险,对于每一个变量可以使用所有事故发生条件下的解释变量与事故未发生条件下的解释变量的平均值代替,例如,如果x-kij
表示当前事故路段k第i次观测的事故发生条件下的解释变量x
ki
与第j次观测到的事故未发生条件下的解释变量x

kj
的平均值,那么在当前事故路段k发生事故相对于不发生事故的优势比表示为:
[0070][0071]
步骤6:利用式(6)构建交通事故风险量化表征模型log(ck):
[0072][0073]
式(6)中,ck表示当前事故路k的交通事故风险量化值;
[0074]
步骤7:对交通事故风险进行实时量化评估;
[0075]
根据对当前事故路k具有显著影响的解释变量集获取所述解释变量集的实时动态数据,并将所述实时动态数据输入所述事故风险量化表征模型log(ck)中,从而得到当前事故路k交通事故风险的量化评估值。
[0076]
进一步,对步骤6中建立的交通事故风险量化表征模型进行验证:
[0077]
模型验证包括内部验证和外部验证。内部验证的数据集采用bootstrapping抽样方法从步骤1.5构造的融合数据集进行有放回抽样,重复抽取1000次,得到新的事故组和非事故组融合数据集。外部验证数据集选取另一条快速路的数据进行分析,运用与步骤1同样的方法构造该快速路事故组数据和非事故组数据融合数据集。内部验证和外部验证均采用一致性指数c
统计量
评估所交通事故风险量化表征模型有效性,c
统计量
计算方式如式(7)所示:
[0078][0079]
式(7)中,ranki为量化的事故风险结果中第i个样本的序号,i∈发生事故表示对事故样本序号进行求和。
[0080]c统计量
是评价回归模型有效性的重要指标,c
统计量
通常在0.5-1之间,值越大表示模型
评估确率越高。
[0081]
为进一步展示本发明方法对城市快速路交通事故风险量化评估的可靠性,利用以下实例进行举例说明。
[0082]
选取上海市延安高架快速路进行分析,将研究区域划分成6条路段,包括延安高架虹井路至虹许路路段、虹许路至娄山关路路段、娄山关路至西立交路段、凯旋路至江苏路路段、江苏路至华山路路段、华山路至茂名路路段。本发明提取如上研究区域一天的平均流量、平均速度、流量标准差和速度标准差数据,将该数据输入构建的交通事故风险量化表征模型中,从而对不同路段事故风险进行量化评估。在时间尺度上,以早高峰(7:00-10:00)和晚高峰(16:00-19:00)为例,对不同路段早晚高峰期间每6分钟的交通事故风险进行量化评估,如图2所示。
[0083]
对如上模型评估结果分别进行内部验证和外部验证。内部验证选择bootstrapping方法。根据bootstrapping方法原理,本发明在模型验证时首先利用原始数据建立交通事故风险量化表征模型,从原始融合数据集中抽取u个个体进行替换,生成bootstrap样本,重复抽样1000次,对生成的bootstrap样本进行验证分析,计算c
统计量
为0.75。表明构建的交通事故风险量化表征模型在bootstrap样本中具有较好的区分能力。进一步,利用杭州中河高架快速路的数据对模型结果进行外部验证,计算的c
统计量
为0.7,对应的roc曲线及auc结果如图3所示,表明该模型结果在外部数据集中仍具有良好的校准能力,模型具有一定的可靠性。
[0084]
由此表明,本发明提出的一种城市快速路交通事故风险量化评估方法具有可行性,是一种可靠的交通事故风险量化评估手段。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1