一种基于图嵌入的交通道路事件预测方法与流程

文档序号:22503071发布日期:2020-10-13 09:37阅读:154来源:国知局
一种基于图嵌入的交通道路事件预测方法与流程

本发明属于智能交通技术领域,涉及一种基于图嵌入的交通道路事件预测方法。



背景技术:

城市化进程推进的过程中,城市车辆的快速增长,使得城市交通的压力日趋增大,尤其是重大的道路交通事件的发生,对于交通路况有较大的干扰,影响了城市居民的正常出行,严重的交通事件也会直接或间接给城市带来人员伤亡以及经济财产损失。城市交通事件的分析存在的难点,首先,交通事件的发生具有不确定性,其次,交通事件可以分为多种类型,不仅产生的原因复杂多样,而且对于交通事件产生影响程序也不一致,最后,发生交通事件的数据,相较道路交通量信息来说较为稀疏,对于交通事故的历史数据,通过传统的统计学习方法难以产生较好的预测效果。

图嵌入(graphembedding)是一种将图数据映射为数据向量的过程,采用图嵌入的方法,可以将图结构的数据转为向量数据的同时,较好地保留图模型的结构信息和潜在的特性。目前图嵌入的算法主要有三种方法:(1)基于因式分解的方法;(2)基于游走的方法;(3)基于深度学习的方法。graphsage(graphsampleandaggregate)在是一种能够利用顶点的属性信息高效产生未知顶点embedding的一种归纳式(inductive)学习的框架,其核心思想是通过学习一个对邻居顶点进行聚合表示的函数来产生目标顶点的embedding向量。但目前对于交通道路路网的数据嵌入方法的研究中,大多只基于道路的路网结构,没有结合交通事件以及其他的数据属性信息进行分析探索。

核密度估计(kde,kerneldensityestimation)是非参数统计检验中的重要方法之一,常用于估计未知的密度函数。



技术实现要素:

为了解决现有技术中存在的上述技术问题,本发明提供一种基于图嵌入的交通道路事件预测方法,其具体技术方案如下:

一种基于图嵌入的交通道路事件预测方法,包括如下步骤:

步骤1,获取历史交通数据集中发生交通事件的道路前2小时间内的道路速度数据和统计该道路的基本属性特征数据并进行归一化处理,作为图嵌入模型的输入数据;

步骤2,将实际路网映射为图结构的数据,采用基于graphsage的图嵌入方法进行图嵌入模型的训练,利用道路的属性特征数据以及空间结构将每条发生交通事件的道路嵌入成一条向量;

步骤3,使用从步骤2中得到的发生交通事件的道路的嵌入向量进行降维处理,获取降至二维的数据结果作为样本点,再采用高斯核函数作为核密度估计的核函数来拟合输入的样本点,获得拟合好的概率密度模型;

步骤4,统计需要预测发生交通事件的道路前2小时间内的道路的属性特征数据,使用训练好的图嵌入模型,嵌入得到数据向量,降维后输入到拟合好的概率密度模型中,得到这些道路上交通事件发生的概率,并绘制核密度估计图进行可视化展示。

进一步的,所述步骤1的具内容如下:

步骤1.1.获取历史交通数据集中各道路发生交通事件的前2小时间内的速度数据,以30分钟为时间粒度,统计出每个时段内的平均速度,并使用min-max标准化方法将每个时段的平均速度进行归一化处理,计算公式如下:

其中,vvalue表示对应时段内的目标道路的实际速度,vmax表示对应时段内所有统计道路速度中的最大值,vmin表示对应时段内所有统计道路速度中的最小值,表示为对应时段内的目标道路速度的归一化的结果;

步骤1.2.统计每个事件发生道路的道路长度和各条道路相连的道路数量,也使用min-max标准化方法进行归一化处理;其次,统计交通事件发生时的时间特征,所述时间特征,是通过对发生事件时间是否处于06:00至09:00以及16:00至19:00的早晚高峰时段内进行判断,若处于该时段内,则时间特征的数据值设置为1,否则为0;

步骤1.3.将每条道路中的各项数据项进行拼接,作为各自道路的属性特征数据。

进一步的,所述步骤2的具内容如下:

步骤2.1.将实际路网中的道路路段作为图网络结构g=(v,e)中的节点v,对于实际路网中道路的交点作为图网络的边e,将实际路网映射为一个图网络结构g;

步骤2.2.对目标节点的2阶邻居节点使用随机重采样的方法进行采样;

步骤2.3.对于收集到目标节点的相邻节点的集合,将邻居节点特征通过平均聚合的方式聚合到目标节点上,即先对邻居节点特征的每个维度取平均值,然后与目标节点的特征拼接,拼接后进行一次非线性变换,计算公式如下:

其中,v是目标节点u随机采样的到达的邻居节点,表示顶点的当前特征,mean表示为取平均值操作,表示第k层邻居聚合的特征,σ表示激活函数sigmoid函数,wk表示优化参数,concat表示为特征拼接操作;

步骤2.4.得到节点的局部领域信息特征的表示向量后,通过无监督的方式进行训练,初始化设置学习率为0.00001,设置最大节点的度为7,设置嵌入的向量维度大小为256维,每次训练所选取的样本数为20,采用的无监督函数的损失函数表示为:

其中,zu表示为目标节点σ通过graphsage的图嵌入算法生成的嵌入向量,σ表示激活函数sigmoid函数,v是目标节点u随机采样的到达的邻居节点,pn(v)是负采样的概率分布,vn~pn(v)表示为节点vn从目标节点u的负采样分布pn采样的,q为采样的样本数量;通过前向传播得到目标节点u的嵌入向量zu,然后通过梯度下降算法,进行反向传播优化参数wk和聚合函数内参数。

进一步的,所述步骤3的具内容如下:

使用从所述步骤2中得到的发生交通事件的道路通过图嵌入算法获得的向量,通过t-sne方法将维度降至二维,再将二维的数据作为样本点,通过核密度估计方法,采用平滑的核函数来拟合输入的样本点,获得拟合好的概率密度模型,最后通过拟合好的概率密度模型对真实的概率分布进行模拟,计算公式如下:

其中f为概率密度函数,x1,x2,x3,…xi,为独立同分布的n个样本点,kernelfunction表示核函数,使用高斯核密度估计作为密度估计的核函数;h为控制拟合曲线的平滑程度的平滑系数。

进一步的,所述步骤4的具内容如下:统计需要预测发生交通事件概率的道路前2小时内的道路的属性特征数据,使用训练好的图嵌入模型,嵌入得到这些道路的数据向量并将维度降至二维,输入到拟合好的概率密度模型中,得到这些道路点交通事件发生的概率值,并将结果以核密度估计图的方式进行可视化展示。

进一步的,所述核密度估计图的横坐标上的刻度标签“+”表示每个样本道路在横坐标轴上的投影,核密度估计图上用圆点表示对应的道路,圆点的对应的纵坐标高度表示该点对应道路上发生交通事故的概率值。

本发明可为城市的相关管理部门提供参考,以辅助提高他们对于交通管理的决策效率,对于城市交通生态环境的建设与发展有着重要的实际意义。

附图说明

图1是本发明的基于图嵌入的交通道路事件预测方法的流程示意图;

图2是本发明的基于图嵌入的交通道路事件预测方法的概率密度可视化结果示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图对本发明进行进一步详细说明。

如图1、图2所示,一种基于图嵌入的交通道路事件预测方法,包括如下步骤:

步骤1,获取历史交通数据集中发生交通事件的道路前2小时间内的道路速度数据和统计该道路的基本属性特征数据并进行归一化处理,作为图嵌入模型的输入数据;

步骤2,将实际路网映射为图结构的数据,采用基于graphsage的图嵌入方法进行图嵌入模型的训练,利用道路的属性特征数据以及空间结构将每条发生交通事件的道路嵌入成一条向量;

步骤3,使用从步骤2中得到的发生交通事件的道路的嵌入向量进行降维处理,获取降至二维的数据结果作为样本点,再采用高斯核函数作为核密度估计的核函数来拟合输入的样本点,获得拟合好的概率密度模型;

步骤4,统计需要预测发生交通事件的道路前2小时间内的道路的属性特征数据,使用训练好的图嵌入模型,嵌入得到数据向量,降维后输入到拟合好的概率密度模型中,得到这些道路上交通事件发生的概率,并绘制核密度估计图进行可视化展示。

所述步骤1的具内容如下:

步骤1.1.获取历史交通数据集中各道路发生交通事件的前2小时间内的速度数据,以30分钟为时间粒度,统计出每个时段内的平均速度,并使用min-max标准化方法将每个时段的平均速度进行归一化处理,计算公式如下:

其中,vvalue表示对应时段内的目标道路的实际速度,vmax表示对应时段内所有统计道路速度中的最大值,vmin表示对应时段内所有统计道路速度中的最小值,表示为对应时段内的目标道路速度的归一化的结果;

步骤1.2.统计每个事件发生道路的道路长度和各条道路相连的道路数量,也使用min-max标准化方法进行归一化处理;其次,统计交通事件发生时的时间特征,所述时间特征,是通过对发生事件时间是否处于06:00至09:00以及16:00至19:00的早晚高峰时段内进行判断,若处于该时段内,则时间特征的数据值设置为1,否则为0;

步骤1.3.将每条道路中的各项数据项进行拼接,作为各自道路的属性特征数据。

所述步骤2的具内容如下:

步骤2.1.将实际路网中的道路路段作为图网络结构g=(v,e)中的节点v,对于实际路网中道路的交点作为图网络的边e,将实际路网映射为一个图网络结构g;

步骤2.2.对目标节点的2阶邻居节点使用随机重采样的方法进行采样;

步骤2.3.对于收集到目标节点的相邻节点的集合,将邻居节点特征通过平均聚合的方式聚合到目标节点上,即先对邻居节点特征的每个维度取平均值,然后与目标节点的特征拼接,拼接后进行一次非线性变换,计算公式如下:

其中,v是目标节点u随机采样的到达的邻居节点,表示顶点的当前特征,mean表示为取平均值操作,表示第k层邻居聚合的特征,σ表示激活函数sigmoid函数,wk表示优化参数,concat表示为特征拼接操作;

步骤2.4.得到节点的局部领域信息特征的表示向量后,通过无监督的方式进行训练,初始化设置学习率为0.00001,设置最大节点的度为7,设置嵌入的向量维度大小为256维,每次训练所选取的样本数为20,采用的无监督函数的损失函数表示为:

其中,zu表示为目标节点u通过graphsage的图嵌入算法生成的嵌入向量,σ表示激活函数sigmoid函数,v是目标节点u随机采样的到达的邻居节点,pn(v)是负采样的概率分布,vn~pn(v)表示为节点vn从目标节点u的负采样分布pn采样的,q为采样的样本数量;通过前向传播得到目标节点u的嵌入向量zu,然后通过梯度下降算法,进行反向传播优化参数wk和聚合函数内参数。

所述步骤3的具内容如下:

使用从所述步骤2中得到的发生交通事件的道路通过图嵌入算法获得的向量,通过t-sne方法将维度降至二维,再将二维的数据作为样本点,通过核密度估计方法,采用平滑的核函数来拟合输入的样本点,获得拟合好的概率密度模型,最后通过拟合好的概率密度模型对真实的概率分布进行模拟,计算公式如下:

其中f为概率密度函数,x1,x2,x3,…xi,为独立同分布的n个样本点,kernelfunction表示核函数,使用高斯核密度估计作为密度估计的核函数;h为控制拟合曲线的平滑程度的平滑系数。

所述步骤4的具内容如下:统计需要预测发生交通事件概率的道路前2小时内的道路的属性特征数据,使用训练好的图嵌入模型,嵌入得到这些道路的数据向量并将维度降至二维,输入到拟合好的概率密度模型中,得到这些道路点交通事件发生的概率值,并将结果以核密度估计图的方式进行可视化展示。所述核密度估计图的横坐标上的刻度标签“+”表示每个样本道路在横坐标轴上的投影,核密度估计图上用圆点表示对应的道路,圆点的对应的纵坐标高度表示该点对应道路上发生交通事故的概率值。

实际应用中,本发明的一种基于图嵌入的交通道路事件预测方法,应用道路交通事件的多属性图嵌入的方法,通过结合核密度估计方法拟合概率密度模型从而输出交通事件发生的概率值,用于道路发生交通事件概率的预测,为城市的相关管理部门提供参考,以辅助提高他们对于交通管理的决策效率,维持交通运行秩序稳定,在缓解城市交通压力的同时,让城市居民出行更加便捷,对于城市交通生态环境的建设与发展有着重要的实际意义。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1