一种基于时空分布特征预测城市交通事故的方法与流程

文档序号:11655109阅读:695来源:国知局
一种基于时空分布特征预测城市交通事故的方法与流程

本发明涉及交通事故分析领域,特别是一种基于时空分布特征预测城市交通事故的方法。



背景技术:

目前,国外学者们对交通事故案件地理学的研究较为深入,在交通事故的时空分布形成机制和时空分布特征研究等方面成果颇丰。对交通事故案件的时空分布当下主要技术是采用相关性分析法来研究。该方法需事先限制具体的几个因素,通过不断的收集某个具体路段事故数据,人为拟合各因素间的相关性,进而进行对所得数据进行分析来预测各个路段不同时空的分布情况。

传统的方法具有如下不足之处:首先,采集数据后进行处理,在相关拟合中的因素受到限制,可能导致结果具有局限性;其次,传统的拟合的数据相关性结果不能自主随变化因素而改变,实时性偏低;最后,传统技术的预测是偏向人为而得,主观性较严重,误差偏大。总结该方法存在误差大、时效性差、准确性低,仪器成本高、反馈信息不丰富等不足。为解决传统技术方法问题,利用当下大数据技术,可以改进时空分布的特征分析法,同时采用数据挖掘法增加预测的实时性与可靠性。当下时空分布形成机制和实际交通事故案件分布情况的有机互动,逐渐形成两大经典理论时空分布特征的研究主要涉及了时间分布研究、空间分布研究与时空分布研究,尽管这些研究所采用的理论和分析方法有所不同,但是这三者之间还是存在相互关联的。随着遥感高清影像普及和信息技术的发展,大数据的预测分析法,尤其是bp神经网络法也得到充分发展。

在综合考虑交通事故案件分布的空间和时间两方面信息的研究中,目前国外研究人员提出一些新的研究方法。如townsley等人提出了热点图法,该方法能够更直观地帮助研究人员分析交通事故发生的时空分布模式。该方法包含了三个部分:第一,该方法以核密度估算结果来表示的交通事故案发分布在空间上的聚集状况;第二,以平行坐标法来充当图例的功能,表示案件数量的变化趋势;第三,该方法以柱状图的形式统计每天案件数量变化情况。虽然热点图法采用柱状图、平行坐标法可以体现案件数量随时间的变化情况,从某种程度上突出变化的趋势,但是,此方法更多的还是空间聚集情况和随时间变化这两方面的拼凑。本质上仍然是空间分析结果加上时间变化趋势,仍无法解决研究交通事故案件分布时空分布特征的存在的核心问题。

随着经济发展,车子已经是人们必不可少的交通工具,交通方式多种多样,交通环境也日益复杂,交通事故形势令人堪忧。在交警人员有限的情况,根据已有的时空分布特征,更好的预防交通事故,降低事故率、死亡率、受伤率,具有重要的意义。



技术实现要素:

有鉴于此,本发明的目的是提出一种基于时空分布特征预测城市交通事故的方法,从分析不同区域的数据到案发点数据,从分析现阶段案件时空规律到预测未来案件数量的整体思路,实现对案件时空分布特征清晰、准确的识别和表达,为交警人员提供参考,为现实中提前预防、降低交通事故具有重要意义。

本发明采用以下方案实现:

(1)基于面域统计数据进行交通事故的时空分布与可视化法。采用空间自相关和自组织映射等方法,研究各区域交通事故案件的时空分布特征。先利用全局空间自相关方法分析案件是否为聚集状态,若为聚集,再利用局部空间自相关方法分析各区域交通事故具体的聚集情况。然后不同的区域的交通事故案发的数据,采用自组织映射和u型矩阵方法进行时空多维可视化分析。

(2)基于案发点数据进行层次聚类分析、核密度估算。利用最邻近指数法和ripley'k函数讨论案件的邻近模式,最邻近指数法利用距离最相近的案发点数据来表达分布模式,研究交通事故的局部聚集情况;ripley'k函数是一种基于多阶的分析方法,它把案发点数据的次邻近情况也计算在内,研究交通事故的整体研究聚集情况。

(3)基于案发点数据的交通事故热点识别。首先进行交通事故点模式描述,其目的是先从总体上研究交通事故的分布趋势,主要通过中心点法与标准差椭圆法描述案发点数据的集中情况和离散趋势,中心点法以中心点的位置表达案件分布模式,标准差椭圆法以椭圆的覆盖面及长短轴方向表达案件分布模式;然后进行交通事故热点分析,利用层次聚类法和核密度估计法,通过层次聚类分析能够分层级地表达案件分布规律,通过核密度估算表达交通事故分布的连续变化和精确的集聚中心,并对两种分析结果进行比较。

(4)交通事故预测分析。采用bp神经网络,利用已发案件的数量分布预测未来的交通事故数量。采用数据挖掘算法中的决策树与神经网络等方法,利用以往的交通事故时空分布特征结论为数据源,采用模糊量化法对影响交通事故的因素进行评级评分,构建预测模型,科学地对交通事故进行预测。

本发明具体包括以下步骤:

步骤s1:结合案件信息和空间信息建立案件空间数据库并进行数据预处理;

步骤s2:基于面域数据进行空间自相关分析,先利用全局空间自相关方法分析案件是否为聚集状态,若为聚集状态,再利用局部空间自相关方法分析区域范围交通事故具体的聚集情况;

步骤s3:基于公安局交警大队中记录的城市不同区域交通事故案件数据,采用自组织映射和u型矩阵方法进行时空多维可视化分析;

步骤s4:基于案发点数据进行层次聚类分析、核密度估算;

步骤s5:采用bp神经网络预测算法,利用已发案件的时空分布特征预测未来的交通事故时空分布区。

进一步地,步骤s2中,所述全局空间自相关方法的检验指标采用moran'si指数,采用下式表示:

其中,n是区域总量,表示第i个区域中对应变量的观测值,wij的数值表示地区间的邻近关系;

所述局部空间自相关方法的检验指标采用moran指数,采用下式表示:

其中,z′i和z′j为经过标准化处理得到的观察值,z值说明空间相关性的类型,若z值小于0,说明区域间存在空间负相关的分布模式,表明数据属性较相似的区域趋于分散分布;如果z值大于0,说明区域间存在空间正相关的分布模式,表明数据属性较相似的区域趋于聚集分布;如果z值等于0,说明在空间中是随机分布的。

进一步地,所述步骤s4具体包括以下步骤:

步骤s41:进行交通事故案件聚类情况分析,采用最近邻指数法进行局部聚类情况分析,采用ripley’k方法进行整体聚类情况分析;

步骤s42:判断是否存在聚类,若存在,进而进行交通事故案件热点识别。

进一步地,步骤s5具体包括以下步骤:

训练部分:

步骤s51:对每个区域交通事故各个影响因素进行5分制模糊评分,并且设置网络初始的权值和阈值:

步骤s52:在输入层进行训练数据集的输入,在中间层经过规则学习计算处理后,将结果传递到输出层,计算中间层与输入层各单元的输入、输出以及校正误差;

步骤s53:判断所述校正误差是否小于设置的阈值,并返回中间层到输出层以及输入层到中间层调整后所得的连接权值,同时返回中间层与输出层每个单元所定义的输出阈值;

步骤s54:通过调整网络学习速率或学习次数,当校正误差小于学习次数时构建完成训练模型;

预测部分:输入待预测区域交通事故时空分布特征的各个影响因素的模糊量化评分,设置训练中的校正误差与学习次数,根据完全训练好的网络进行交通事故时空分布的预测,并将预测结果输出至浏览器。

进一步地,所述影响因素包括交通事故人员的数目、交通事故人员的文化程度、交通事故的地点、交通事故的次数、交通事故区域的居住人口、上下班时间、交通事故区域居民文化程度、交通事故车流量、交通事故的时间、交通事故区域的居民职业。

与现有技术相比,本发明有以下有益效果:本发明从分析不同区域的数据到案发点数据,从分析现阶段案件时空规律到预测未来案件数量的整体思路,实现对案件时空分布特征清晰、准确的识别和表达,为交警人员提供参考,为现实中提前预防、降低交通事故具有重要意义。

附图说明

图1为本发明实施例中的技术结构总框图;

图2本发明实施例中的交通事故数据立方体示意图;

图3本发明实施例中的som网络结构;

图4本发明实施例中的层次聚类基本原理图;

图5本发明实施例中的bp神经网络预测交通事故流程图。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

如图1所示,本实施例提供一种基于时空分布特征预测城市交通事故的方法,具体包括以下步骤:

第一步,本发明需要对研究的数据进行采集与预处理。交通事故发生区域有:城市交通、农村道路、高速公路、铁路等,其中交通事故又包含以下几种类型:财产损失事故、伤人事故、死亡事故等。选择城市交通事故情况进行时空分布特征研究,原因在于城市车流量较多,其交通道路较复杂,需要考虑的因素更多,不同区域路况不一,同时,不同时间交通量情况也不一致。交通事故案件的数据为公安局交警大队数据库中具有详细交通信息的点数据,包括案发时间的年、月、日和发生的时刻、交通事故发生的地点、交通事故的类型和伤亡人数等字段,将这些案件数据导入arcgis的所要研究的地点的地图上。具体交通事故数据立方体示意图如图2所示。

第二步进行基于面域数据进行空间自相关分析,先利用全局空间自相关方法分析案件是否为聚集状态,若为聚集,再利用局部空间自相关方法分析区域范围交通事故具体的聚集情况。其中,空间自相关(spatialautocorrelation)以特定区域内的某一目标变量为研究对象,专门研究该变量相应观测值之间的相互关联性。将空间自相关的理念引入到交通事故分布研究中,主要是用来研究统计区内相邻区域交通事故发生率的相互影响性。按照研究区域的范围的不同,空间自相关的主要检验指标有:全局指标和局部指标。前者以整个研究区域为基础,往往以单一值来表达该区域内空间分布的自相关程度,这类指标中具有代表性的有moran'si指数、广泛g统计等,本实施例采用moran'si指数。而后者主要是以各个空间单元的为基础,研究该单元与其相邻单元某一属性的相关性,常用的检验指标有gi指数和moran'si指数,本实施例采用moran'si指数。

1.全局moran'si指数

在全局聚类检验的研究方法中,全局moran'si指数是应用最早的。该指数主要用来检验和分析研究区域内各邻近区域的相异、相似以及独立性。具体可以表示为:

其中,n是区域总量,xi表示第i个区域中对应变量的观测值,wij的数值表示地区间的邻近关系,区域相邻近权数矩阵单元就用它表示,采用的形式通常为距离标准或者邻接标准。其中,邻接标准的wij为:

式中i,j=1,2...,n。

分析结果的取值范围为[-1,1],如果该指数小于0,说明区域间存在空间负相关的分布模式,如果该指数大于0,说明区域间存在空间自相关的分布模式,并且此空间相关性强度随着指数的绝对值增大而增大。

正态分布形式的全局moran’si指数期望值可以依据所分析的空间数据进行计算,公式为:方差为:

公式(3)中,其中wi·和w·i的取值是矩阵的第i行之和与第i列之和。分析中可以把全局moran'si指数的相关性检验转变为标准正态检验:

z值即能说明空间相关性的类型,在z值显著的情况下,如果z值小于0,说明区域间存在空间负相关的分布模式,表明数据属性较相似的区域趋于分散分布;如果z值大于0,说明区域间存在空间正相关的分布模式,表明数据属性较相似的区域趋于聚集分布;如果z值等于0,说明在空间中是随机分布的。

2.局部moran指数

局部moran指数的分析指标可以表示研究区周边相似区域间的空间聚集强度。其定义为:

上式中的z′i和z′j为经过标准化处理得到的观察值。该检验的统计量表达式为:

局部moran指数与其他分析方法不同之处在于,它们不仅可以识别出交通事故高发的聚集区域,还能识别出交通事故低发的聚集区域。

第三步,进行宏观时空分布特征分析后,基于公安局交警大队记录的城市不同区域交通事故案件数据,采用自组织映射和u型矩阵方法进行时空多维可视化分析,分析结果能够帮助交警管理人员理解复杂的多维案件数据中隐含的案件分布特征。其中,自组织映射(self-organizingmaps,som)算法是一种通过模拟人体大脑对信息的处理过程来实现聚类和高维可视化的人工神经网络。其网络结构如图3所示,它的一个特点是能够把高维数据用可视化的方法在低维数据中表达,其目的是挖掘高维数据中隐含的复杂信息,并将其在低维空间中以简单的几何关系展现出来。从图中可以看出,该网格整体分为两层:输入层和竞争层。其中输入层中包含n个神经元,每个神经元构成一个输入结点。而竞争层又称之为输出层,它是由m个神经元构成的一个网状平面阵列。由于每个输入结点与所有的输出结点都形成连接关系,所以整个网络是全连接的。并且,u矩阵是一种典型的数据可视化方法,它主要是根据数据的空间节点的距离关系,借助于灰度图把不同状态的输入向量映射到二维平面,使得所分析的数据得到可视化表达。

第四步,基于案发点数据进行层次聚类分析、核密度估算。首先进行交通事故案件聚类情况分析,采用最近邻指数法进行局部聚类情况分析,采用ripley’k方法进行整体聚类情况分析。判断是否存在聚类,若存在,进而进行交通事故案件热点识别。本实施例采用核密度估算和最近邻层次聚类法进行交通事故热点识别,其中最近邻层次聚类法的层次原理如图4所示,根据每个案事件点的最邻近距离,通过定义一个“极限距离或阈值”、“聚集单元”和每个聚集单元的最小数目,然后计算聚集单元与每个点对的最邻近距离,当最邻近距离小于该极限距离时,将该点计入聚集单元,据此将案事件点数据聚类为若干区域,称为一阶聚类;同理,对一阶聚类利用同样方法,得到二阶聚类,以此类推得到更高阶交通事故热点区。

第五步根据前面已有的信息,利用bp神经网络预测交通事故流程图,如图5所示,该预测方法包括包括训练部分与预测部分。所述训练部分具体为:首先对每个区域交通事故各个影响因素进行5分制模糊评分,并且设置网络初始的权值和阈值;在输入层进行训练数据集的输入,在中间层经过规则学习计算处理后,将结果传递到输出层,计算中间层与输入层各单元的输入、输出以及校正误差;再判断所述校正误差是否小于设置的阈值,并返回中间层到输出层以及输入层到中间层调整后所得的连接权值、同时返回中间层与输出层每个单元所定义的输出阈值;通过调整网络学习速率或学习次数,当校正误差小于学习次数时构建完成训练模型;所述预测部分具体为:输入待预测区域交通事故时空分布特征的各个影响因素的模糊量化评分,设置训练中的校正误差与学习次数,根据完全训练好的网络进行交通事故时空分布的预测与在将预测结果输出至浏览器。

较佳的,所述bp神经网络预测交通事故方法中的影响因素包括交通事故人员的数目、交通事故人员的文化程度、交通事故的地点、交通事故的次数、交通事故区域的居住人口、上下班时间、交通事故区域居民文化程度、交通事故车流量、交通事故的时间、交通事故区域的居民职业。

以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1