一种交通事件相关性分析方法及系统与流程

文档序号:26090583发布日期:2021-07-30 17:59阅读:147来源:国知局
一种交通事件相关性分析方法及系统与流程

本发明属于智能交通工程技术领域,具体涉及一种交通事件相关性分析方法及系统。



背景技术:

针对交通事件的时空演化规律进行预测,对提升城市公共安全与紧急处置能力,有着重要的意义。然而,交通事件的产生,可能涉及到复杂的多种特征(例如天气、道路形态、实时交通流等)。传统的交通事件相关性分析,多为交通事件预测模型,往往基于决策树等机器学习模型,根据这些特征的组合或者是取值,来预测交通事件的发生与否。交通事件的发生往往具有时间、空间上的相关性,这种空间相关性是地理上的,举例来说,地理上的临近区域,其交通特征有强关联性(例如,某一路段发生严重事故,导致路段上下游也容易发生事故)。

然而,交通数据还有一种空间相关性,而这种相关性是远距离的,称之为语义相关性。举例来说,区域a和区域b可能在地理上相隔较远,然而它们均有着类似的poi(兴趣点)布局。在区域a中存在着1个医院与1所学校,而区域b中同样存在着1个医院与1所学校。在这种情况下,区域a与区域b就会有较为相关的事件发生规律。目前,针对事件发生规律的语义相关性,还没有进行广泛的探讨,存在着研究与应用的价值。



技术实现要素:

针对上述背景技术介绍中存在的问题,本发明的目的在于提供了一种提高事故预测能力的交通事件相关性分析方法及系统。

本发明采用的技术方案是:

一种交通事件相关性分析方法,其具体步骤包括:

在交通历史数据中提取t个时段n个空间的m1个交通第一特征、m2个交通第二特征;其中交通第一特征为与交通事件相关的具有时段非可变性的特征交通,第二特征为与交通事件相关的具有时段可变性的特征,且m1个交通第一特征与m2个交通第二特征在时段、空间上相对应;

构建t个时段s个交通特征相似图,其中交通特征相似图包括空间、邻接矩阵、交通第二特征,邻接矩阵为两个空间的交通第一特征的相似性;

基于t个时段s个交通特征相似图,利用图学习算法提取t个时段n个空间m3个第三交通特征;

基于t个时段n个空间m3个第三交通特征,计算n个空间第三交通特征相关性,即可得到目标交通特征相关性。

进一步,还包括:

在交通历史数据中提取t个时段n个空间m2’个交通第二特征;

基于t个时段n个空间m2’个交通第二特征,提取t个时段n个空间m4个第四交通特征,计算n个空间第四交通特征相关性;

融合第三交通特征相关性和第四交通特征相关性,得到目标交通特征相关性。

进一步,还包括:

将目标交通特征相关性映射到t+i阶段n个空间的目标交通特征,预测交通事件。

进一步,还包括:

利用样本数据,提取时间注意力分配向量;

基于时间注意力分配向量,修正n个空间第三交通特征相关性和第四交通特征相关性。

进一步,t个时段的时段处理方法为将不同时间间隔的时段映射到时段向量。

进一步,利用循环神经网络算法,基于所述t个时段n个空间m3个第三交通特征,计算所述n个空间第三交通特征相关性。

进一步,利用卷积神经网络算法,基于所述t个时段n个空间m2’个交通第二特征,提取所述t个时段n个空间m4个第四交通特征。

一种交通事件相关性分析系统,包括:

交通历史数据处理模块,用于提取t个时段n个空间m1个交通第一特征、m2个交通第二特征、m2’个交通第二特征;

时空语义相关性处理模块,用于基于交通第一特征构建交通特征相似图,从交通特征相似图和交通第二特征中提取第三交通特征相关性。

进一步,还包括:

时空地理相关性处理模块,用于从交通第二特征中提取第四交通特征相关性;

相关性综合处理模块,用于融合第三交通特征相关性和第四交通特征相关性,计算目标交通特征相关性。

进一步,还包括:

交通事件预测模块,用于将目标交通特征相关性映射到t+i阶段n个空间的目标交通特征,预测交通事件。

进一步,还包括:

时间处理模块,用于将时间信息编码为稠密的时间向量。

本发明与现有技术相比,其显著优点包括:通过构建相似图的方式,从时段非可变性的交通特征提取空间相关性,从时段可变性的交通特征提取时间相关性,两者融合提取交通事件相关性。从而比传统的只使用卷积神经网络的方法,应用于交通事故预测领域,更能捕捉远距离的区域相似性,从而提高事故预测能力。

附图说明

图1是本发明的系统框架结构示意图。

图2是本发明的时间处理模块的处理示意图。

图3是本发明的时空地理相关性处理模块的处理示意图。

图4是本发明的时空语义相关性处理模块的处理示意图。

具体实施方式

下面结合具体实施例来对本发明进行进一步说明,但并不将本发明局限于这些具体实施方式。本领域技术人员应该认识到,本发明涵盖了权利要求书范围内所可能包括的所有备选方案、改进方案和等效方案。

专业术语解释:

rnn(循环神经网络):一种用于处理(编码)序列数据的神经网络网络架构。该网络可以捕获时间序列数据中的时间相关性。

gcn(图卷积网络):一种用于处理不规则结构化数据(图信号数据)的神经网络,通过图卷积层的不断堆砌,gcn可以从图信号数据中提取更深层次的数据特征。

cnn(卷积神经网络):一种用于处理规则化数据(栅格图像数据)的神经网络,通过卷积层的不断堆砌,cnn可以从图像数据中提取更深层次的特征。

实施例一

本实施例提供了一种交通事件相关性分析方法,其具体步骤包括:

s1,在交通历史数据中提取t个时段n个空间的m1个交通第一特征、m2个交通第二特征;其中交通第一特征为与交通事件相关的具有时段非可变性的特征交通,第二特征为与交通事件相关的具有时段可变性的特征,且m1个交通第一特征与m2个交通第二特征在时段、空间上相对应;

交通事件,交通运行过程中偶发的事件,包括下面一种或几种类型的组合:交通事故、交通突发事件、交通拥堵事件、交通异常拥堵事件、交通违法事件、交通报警事件。

交通第一特征,与交通事件相关的具有时段非可变性的特征,如针对交通事故这一类交通事件,交通第一特征包括但不限于:路网结构特征、poi特征,路网结构为路段总数、路口总数、车道总数,poi为路网中的学校、医院、银行、餐饮、娱乐、公交站等标注点。如针对交通异常拥堵事件,交通第一特征包括但不限于:路网结构特征、poi特征、地面特征(泥地、水泥地、柏油地)。

交通第一特征,在较短的时间尺度下,路网结构特征几乎不随时间变化。但是在较长的时间尺度下,路网结构可能会不断有微小变化(比如新的道路被开通了)。与交通事件相关的具有时段非可变性的特征,是指在时段这一时间粒度上的非可变性,不排除路网在其他的时间粒度下具有空间可变性的特征。

交通第二特征,与交通事件相关的具有时段可变性的特征,如针对交通事故这一类交通事件,交通第二特征包括但不限于:速度、流量、天气、事故等级、交通事故类型,其中交通事故类型分为轻微伤亡事故、中等伤亡事故、严重伤亡事故的数量。如针对交通异常拥堵事件,交通第二特征包括但不限于:速度、流量、占有率、天气、工程施工、道路管理、拥堵指数、od数。

以交通事故为实施例,m1=3个交通第一特征分别为:地面特征、路网结构、poi,m2=5个交通第二特征分别为速度、流入流量、流出流量、天气、事故等级。

s2,构建t个时段s个交通特征相似图,其中交通特征相似图包括空间、邻接矩阵、交通第二特征,邻接矩阵为两个空间的交通第一特征的相似性;

两个空间的交通第一特征的相似性,可以采用两个空间的交通第一特征之间的距离进行计算,距离小,则相似性大;距离大,则相似性小。距离计算包括但不限于:欧几里得距离、曼哈顿距离、明可夫斯基距离、余弦相似度、jaccard系数、皮尔逊相关系数。

邻接矩阵可以为初始邻接矩阵:地面特征、路网结构、poi邻接矩阵,也可以是基于初始邻接矩阵的组合邻接矩阵。举例如下:

ak、ad、ap,分别表示地面特征、路网结构、poi邻接矩阵

ak、mix(ad、ap)

mix(ak、ad、ap)

mix()表示组合邻接矩阵,矩阵中的对应项进行组合,组合形式可以为加权、相乘、指数等数学计算方式。

一个实施方式,s=3个交通特征相似图(v,ak,f)、(v,ad,f)、(v,ap,f)其中,空间v、邻接矩阵a、交通第二特征f。

s3,基于t个时段s个交通特征相似图,利用图学习算法提取t个时段n个空间m3个第三交通特征;

利用图学习算法提取,如gnn、deepwalk、node2vec、line、harp、graphgan、gcn、gat、rgcn等方法。

s=3个交通特征相似图,利用gcn方法分别运算后,进行组合,形成第三交通特征,这第三交通特征为n*m3维度。

利用矩阵运算提取,具体地,邻接矩阵a、交通第二特征f、预设的参数w、b,进行矩阵运算。n个空间的交通第一特征,形成邻接矩阵为n*n维度的矩阵,n个空间的交通第二特征f为n*m2维度,第三交通特征=afw+b。

s4,基于t个时段n个空间m3个第三交通特征,计算n个空间第三交通特征相关性。计算方法有:利用基于循环自回归模型的深度学习算法提取,如rnn,lstm,gru,双向lstm等方法。传统时序建模方法,arma/arima、var等线性模型。

s5,在交通历史数据中提取t个时段n个空间m2’个交通第二特征;

以交通事故为例,m2’=5个交通第二特征分别为速度、流入流量、流出流量、天气、事故等级。m2’可以与m2数量不同,也可以相同。

s6,基于t个时段n个空间m2’个交通第二特征,提取t个时段n个空间m4个第四交通特征,计算n个空间第四交通特征相关性;

提取方法有:采用机器学习方法,如cnn神经网络、bp神经网络等方法。也可以是(1)待定线性组合自回归过程模型;(2)待定线性组合偏自回归过程模型;(3)自相关—判别分析模型;(4)地层垒积序列分析法。

计算方法有:利用基于循环自回归模型的深度学习算法提取,如rnn,lstm,gru,双向lstm等方法。也可以是传统时序建模方法,arma/arima等线性模型。

s7,融合第三交通特征相关性和第四交通特征相关性,得到目标交通特征相关性。

s8,将目标交通特征相关性映射到t+i阶段n个空间的目标交通特征,预测交通事件。

本实施例还包括:

s9,利用样本数据,提取时间注意力分配向量;

以交通事故为例,

假设有{t1,t2,t3,…,t10}这10个过去的连续时刻的历史数据。现在要预测接下来紧邻的时刻,也就是t11时刻的数据。

rnn的作用是提取t1到t10之间的时间相关性。比如数据在t1到t10之间有没有某种周期性的变化规律等等。

而时间注意力机制,则是看t1到t10,每一个时刻的中间特征,对预测t11时刻的数据的贡献。(历史中不同时期的数据,对未来目标时刻的影响是不同的)。

可以采用的提取方法:基于自注意力机制的时间注意力分配函数:

利用对应的权重矩阵(wh,wz,we,w′z),以及偏置(bα,bβ),配合非线性激活函数(relu)对数据矩阵(h,e)进行非线性变化,获得每一个时间t对应的注意力得分。然后利用softmax函数对注意力得分重新缩放,也就是使得所有时间的注意力得分总和1,得到注意力分配向量。s10,基于时间注意力分配向量,修正n个空间第三交通特征相关性和第四交通特征相关性。

本实施例t个时段的时段处理方法为将不同时间间隔的时段映射到时段向量。以月、周、天、小时、分钟等时间间隔切分时间,形成时段。如1小时为1时段,1分钟为另1时段。将不同时间间隔的时段映射到时段向量采用的方法:机器学习,如神经网络、卷积神经网络等方法,也可以采用其他降维方法,高相关滤波,随机森林,因子分析,主成分分析,t-sne等方法。

实施例二

参见图1,本实施例提供了一种实现实施例一所述一种交通事件相关性分析方法的交通事件相关性分析系统,包括:

交通历史数据处理模块,用于提取t个时段n个空间m1个交通第一特征、m2个交通第二特征、m2’个交通第二特征;

时空语义相关性处理模块,用于基于交通第一特征构建交通特征相似图,从交通特征相似图和交通第二特征中提取第三交通特征相关性;

时空地理相关性处理模块,用于从交通第二特征中提取第四交通特征相关性;

相关性综合处理模块,用于融合第三交通特征相关性和第四交通特征相关性,计算目标交通特征相关性;

交通事件预测模块,用于将目标交通特征相关性映射到t+i阶段n个空间的目标交通特征,预测交通事件;

时间处理模块,用于将时间信息编码为稠密的时间向量。

以交通事故预测为例:n个空间对应于n个区域。区域i的定义:通过预先给定的边长(比如2km),将整个城市划分成i×j个大小相等的正方形区域(比如1个区域大小为2km×2km)。用n来表示区域的总数(n=i×j),而i表示单个区域的编号。

m2个交通第二特征,包括速度、进入流量、流出流量、天气状况、事故等级。事故类型与区域事故等级的定义:针对交通事故的严重程度,设定三种事故类型,分别为1(轻微伤亡事故),2(中等伤亡事故),3(严重伤亡事故)。那么对于区域i,给定一个时间段t(比如1小时),可以统计出发生在该区域内的所有事故。将这些事故的事故类型相加,得到区域i在t的事故等级例如对一个区域i而言,在时间段t内共发生了5起事故,其中2起事故等级1,2起事故等级2,1起事故等级3,那么为9。如果没有发生任何事故,则为0。

区域交通特征与城市交通特征xt的定义:给定时间t,定义区域i的交通特征也就是说是一个长度为dr的向量,对应m2个交通第二特征。其中dr为特征的维度,一般会考虑至少5维特征,如下表所示:

表1.区域交通特征中每一维的具体定义

需要说明的是,针对某一交通特征进行归一化的过程,会用到该交通特征历史最小值与最大值。以速度的归一化为例,假设区域i在t时间段下的平均车速为(归一化前),而归一化后变为而用cmax与cmin代表历史上,所有区域的平均车速的最大值和最小值,那么归一化的过程可以表示为:

基于的定义,可以进一步定义整个城市在时间段t下的交通状态也就是说,可以将xt视作一张尺寸为i×j的栅格图像,而图像的通道数(channel)为dr。

基于交通第一特征构建交通特征相似图,m1个交通第一特征:地面特征、路网结构、poi。

相似图定义:定义三种不同类型的图(graph),用以描述在时间段t下,区域与区域间的空间语义相似度,这三种图的定义如下:

表2.三种不同的相似图的定义

对于三种相似图中的每个图来说,图中的节点都与城市中的一个区域对应,也就是说每张图都有n个节点,或者说|v|=n。对于任意一个邻接矩阵而言(其中★表示k,d,或p),用来表示的第i行第j列的元素,定义两个区域间的相关性存在与否及其强度:

以地面特征相似图为例,当且仅当不为0,说明区域i与区域j在时间段t下关于地面特征具有相关性,且相关性的大小为该数值越大,说明相关性越强。

而为了计算将用到相关性函数这里使用js散度(jensen-shannondivergence)来计算其中★表示k,d,或p中的一种:

其中分别代表区域i与区域j在时间段t下的(关于地面特征,路网结构或者poi)的分布向量,而该向量维度为q,也就是说对于一个分布向量而言,其各维度的分量总和为1。而代表的第l维的分量。

以poi为例,假设区域i与区域j,区域i与区域j在时间段t下poi(学校,商场,写字楼)的数量分别为(2,2,1)与(3,1,0)。而分布向量的维度q=3,那么分布向量dtp,i=(0.4,0.4,0.2),而dtp,j=(0.75,0.25,0)。那么simtp(i,j)的结果为:

对于相似图而言,计算其邻接矩阵用到的分布向量的说明如下表所示。

表3.不同相似图所使用的分布向量的说明

交通事故预测问题定义:定义那么交通事故预测的任务是,已知最近的过去t个连续时间段的城市交通特征{x1,x2,x3,...,xt},以及过去t个连续时间段的相似图{s1,s2,s3,...,st},预测接下来一个时间段(也就是t+1)的城市交通特征yt+1。或接下来i个时间段的城市交通特征yt+i。

时间处理模块:对于一个时间段(以一小时长度为例),其包含了三种时间信息:该时段对应的是一个星期中的星期几,该时段是一天中的第几个小时,以及时段来自于平日还是假日。以2021年3月15日早上10:00–10:59为例,三种时间信息为:星期一,第10个小时,平日。根据此信息,可以构建3个独热向量(one-hotvector),ts1,ts2,ts3分别为7维,24维,2维:

ts1={1,0,0,0,0,0,0}

ts2={0,0,0,…,1,...0,0,0}

ts3={1,0}

其中ts2中的第10位为1,然后其余位都为零。进一步地,可以将ts1,ts2,ts3拼接起来得到一个33维的新向量ts。时间处理模块的目的就是为了将ts∈r33重新映射到一个

dt维的稠密向量具体来说,时间模块有一个隐藏层的全连接层神经网络,见图2所示。其中sigmoid(·)为非线性激活函数sigmoid,而w0与w1是对应的可学习的权重矩阵。

w0·ts+b0=h0

h0=sigmoid(h0)

w1·h0+b1=h1

z=sigmoid(h1)

使用one-hotvector的方式,生成一个33维的向量,而这个33维的向量包含了“今天是星期几”,“现在是几点”,以及“今天是否是节假日”这些信息。但这个向量本质上是稀疏的,换句话说,33维的向量中,其中有3个维度的取值是1,而剩下30个维度的取值是0。同时,输入数据维度越大,深度学习模型的训练速度越慢。因此用时间处理模块,将这个33维度的时间向量,压缩成一个低维度(比如5维)的稠密向量,从而加快模型的训练。时空地理相关性处理模块的工作过程如图3所示,其目的是根据最近t个连续的时间段的城市交通特征{x1,x2,x3,...,xt},以及接下来一个时间段的向量表示zt+1,生成最终预测结果yt+1的一部分(关于地理相关性的部分),称之为

由于每一个时间段t下,可以被视为一张图像,因此使用一个卷积神经网络(cnn),用于提取图像中的深层次信息。某一层卷积层的具体操作可以表现为:

其中k表示当前卷积层的层数,而*代表卷积操作,wk与bk是第k层卷积层可以被学习的参数矩阵,而是第k层卷积层的输出。而且第k层的参数矩阵wk与bk,对于不同时间段t来说是共用的(因此它们没有针对t的下标)。初始输入最终层的输出为一般来说采用2层的卷积神经网络(亦即k=2)已经足够提取特征。

为方便起见,将每一个时间段t下的xt经过cnn而生成的最终输出重命名为x′t,其中dk为最后一个卷积层的卷积核的数量。由此可知,仍然可以将x′t视作为一张栅格为i×j的图像(每个栅格对应于城市中的一个区域i)。那么,用

来代表第i个区域对应的分量。

接下来,循环神经网络rnn将会对每一个进行编码,生成对应的隐藏层向量(hiddenvector)其中dh为隐藏层向量的维度:

对于某一个时间段t而言,不同区域i对应的隐藏层向量可以组合到一起,形成进一步地定义h={h1,h2,...,ht}。

最后使用一个全连接层神经网络,并基于注意力机制,计算注意力得分向量α:

a=softmax(relu(h·wh+zt+1·wz+bα))

其中以及bα∈rt为需要被训练的权重矩阵。而α∈rt为一个注意力得分向量,该注意力得分向量的目的是,衡量不同时间段(从1到t)对最终产生的的影响,其中αc表示α的第c维分量:

时空地理相关性处理模块获取的最终结果为其包含了最终预测结果yt+1的一部分。

时空语义相关性模块的工作过程如图4所示,其目的是根据最近t个连续时间段的图信号数据{s1,s2,...,st},以及接下来一个时间段的向量表示zt+1,生成最终预测结果yt+1的一部分(关于语义相关性的部分),称之为

对于每一个时段t下的图信号数据st,由3个图组成,分别是对这3个图,利用3个图卷积神经网络(事故gcn,道路gcn以及poigcn),分别做图卷积(也就是基于图的权重矩阵进行运算),然后加和,生成s′t。

其中是可以被学习的权重矩阵,dg指代图中的特征数。而卷积的结果也是一个图信号。

在卷积之后,得到{s′1,s′2,...,s′t}一系列结果,用指代图中的节点i(对应于城市的实际区域i)的信号。然后利用循环神经网络rnn,提取其时间相关性,其中

定义也就是说以及定义e={e1,e2,...,et},同时基于时间向量zt+1,那么计算时间注意力得分向量β:

β=softmax(relu(e·we+zt+1·wz+bβ))

其中bβ∈rt为可以被训练的权重,β∈rt为时间注意力得分向量,

最终预测结果:在获取之后,最终的预测结果由两者经过权重矩阵的调整以及求和得到:

其中是可以被学习的权重矩阵,最终预测结果yt+1∈ri×j。而整个模型的训练,使用到了平方损失函数,其中代表了第i个区域在t+1时间段下的交通事故等级的真实值:

本发明通过构建相似图的方式,从时段非可变性的交通特征提取空间相关性,从时段可变性的交通特征提取时间相关性,两者融合提取交通事件相关性。从而比传统的只使用卷积神经网络的方法,应用于交通事故预测领域,更能捕捉远距离的区域相似性,从而提高事故预测能力。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1