基于深度学习和密度聚类的城市道路交通事故黑点预测方法及系统

文档序号:37889448发布日期:2024-05-09 21:33阅读:18来源:国知局
基于深度学习和密度聚类的城市道路交通事故黑点预测方法及系统

本发明涉及智能交通和深度学习技术,具体涉及一种基于深度学习和密度聚类的城市道路交通事故黑点预测方法及系统。


背景技术:

1、随着社会的发展,城市的人口、车辆和建筑设施不断增加,导致城市道路越加拥堵和复杂,也增加了交通事故的发生风险。据统计,每年全球有超过一百万人死于交通事故,其中大部分发生在城市道路上。事实上,城市道路上存在着一些交通事故的高发区域,也就是交通事故黑点,这些地方的交通状况和环境因素都容易引发事故,造成人员伤亡和财产损失。交通事故黑点是城市发展的一大障碍,对城市的各个方面都有着不利的影响,需要引起社会的高度重视和有效的治理。通过采用交通事故黑点预测等技术,可以有效地识别和预防交通事故黑点,从而提高城市的交通安全水平和保障居民的出行安全,为城市的可持续发展创造有利的条件。

2、针对交通事故黑点的研究,相关的专家学者进行了长时间系统的研究,主要包括以下几个阶段。首先,传统的统计方法基于事故频数、频率、严重程度等指标,通过设定临界值或阈值,对比目标路段于相似路段或整个路段的事故水平,从而识别事故黑点。虽然这类方法计算方便,数据处理简单,但是容易忽略事故的随机性和时空特性等,使得识别精度不高,适用范围有限。其次,利用地理信息系统(gis)等工具对事故数据进行空间分析和聚类分析,从而识别事故密集的区域或路段。通常使用核密度估计法、聚类方法、空间自相关等方法,能够从复杂无规律的事故数据中挖掘隐含信息,揭示交通事故的空间分布特征。但是对数据的质量和数量要求较高,计算量较大并且忽略事故的时序特征。最后,利用人工智能、数据挖掘、深度学习等技术对交通事故发生的概率或严重程度进行预测,进而识别事故黑点。这些方法的优势是能够利用大量数据进行事故预测,提高模型的预测精度。


技术实现思路

1、发明目的:本发明的目的在于解决现有技术中存在的不足,提供一种基于深度学习和密度聚类的城市道路交通事故黑点预测方法及系统;

2、本发明利用深度学习能有效利用海量数据且预测精度高的优点,再结合dbscan基于密度聚类的能力,能够识别任意形状的交通事故黑点。本发明提出基于cnn、lstm、dbscan的城市道路交通事故黑点的预测方法。利用cnn从空间数据学习事故的空间分布和影响因素,通过lstm的序列建模能力从时序数据中学习事故的时间变化趋势,捕捉交通事故的长期依赖和周期性,提高预测的准确性和鲁棒性。利用cnn-lstm预测城市道路未来交通事故数量,然后通过dbscan基于密度进行聚类,识别事故密集的区域或路段,发现任意形状的交通事故黑点。

3、技术方案:本发明的一种基于深度学习和密度聚类的城市道路交通事故黑点预测方法,包括以下步骤:

4、步骤1、获取研究区域内的历史的交通事故数据、道路结构数据、交通流数据以及气象数据;

5、交通事故历史数据能够帮助模型学习交通事故在不同时间段、地点和条件下的趋势和模式;道路结构数据和交通流数据能够提供时空信息,有效捕捉不同地点和时间的交通事故关联性;气象数据可以使模型更全面地考虑天气对交通事故的影响;

6、步骤2、从交通事故历史数据中提取每起事故的伤亡人数以及对应事故地点的经纬度,所得每起事故的伤亡人数以及对应事故地点的经纬度用于后续获取城市道路线形图像数据时来匹配该线形图像属于哪一类事故数据图像集,同时预测结果也需要通过经纬度匹配到对应位置,并且通过dbscan进行聚类时,寻找事故核心点、边界点和噪声点时也需要经纬度数据匹配预测数据的位置;

7、步骤3、将交通事故划分为四种类型,依次为轻微事故、一般事故、重大事故、特大事故,然后计算每种类型事故对应的数量,分别为n1、n2、n3、n4;

8、步骤4、利用arcgis提取城市道路线形图像(例如在导入arcgis后人工进行操作分割,从而获得不同事故类型所属区域的道路线形图像),得到城市道路线形图像集p,并按照对应交通事务类型分类,依次划分为轻微事故图像集p1、一般事故图像集p2、重大事故图像集p3和特大事故图像集p4;

9、步骤5、构建基于cnn-lstm模型的预测模型,所述基于cnn-lstm模型的预测模型依次包括cnn网络模块、lstm网络模块和输出层;

10、cnn网络模块通过卷积-池化操作对城市道路线形图像进行特征提取,捕捉交通事故的空间分布关系,与不同类型事故的数量、交通流数据和气象数拼接得到特征x't;lstm网络模块从交通流数据、交通事故数据和气象数据中学习事故的时间变化趋势;输出层输出其所预测的交通事故数量预测结果yt;

11、步骤6、对步骤5所得交通事故数量预测结果yt进行评估,并更新模型参数,提升预测效果;

12、步骤7、使用基于dbscan算法的密度聚类模块对交通事故黑点进行聚类,形成不同的事故黑点;

13、步骤8、将输出的簇结合经纬度数据在arcgis中将事故黑点进行可视化展示。

14、进一步地,所述cnn网络模块对道路线形图像集p中的空间数据进行多层卷积池化操作,提取对应事故区域的空间特征;

15、

16、p=[p1,p2,p3,p4];

17、其中,z(l)为第l个卷积核的输出,w(l)为第l个卷积核的权重矩阵,b(l)为第l个卷积核的偏置向量,σ为激活函数,*为卷积运算符;

18、然后将所得输出z(t)与其他时序数据进行拼接;

19、xt=[zt,nt,qt,wt];

20、nt=[n1,t,n2,t,n2,t,n2,t];

21、其中,zt表示卷积神经网络cnn在时间步为t时的输出,nt,qt,wt表示时间步为t时不同类型事故的数量、交通流数据和气象数据;

22、最后,为消除数据中量纲和数量级的影响,对zt进行标准化处理;

23、

24、其中,x′为标准化后的数据集,xj表示xt数据集中第j列数据。

25、进一步地,所述cnn网络模块包括卷积层、池化层、激活函数和dropout层;所述卷积层通过卷积操作能够有效地提取城市道路线形数据中的局部特征。具体方法为通过卷积核在输入数据上进行滑动,对每个局部区域执行加权求和,生成特征图。由于此处主要是提取道路线形的空间特征,为在保持较低的参数量和计算量的同时,仍然能够提供较好的特征提取能力和非线性能力,因此本发明卷积核设为3×3,步长为1。所述池化层(下采样层)对卷积操作之后的特征图进行3×3的平均池化的操作,步长为1,实现特征降维以及数据大小和数量压缩,还能够在减小数据量的同时保持原始数据的特征不变性,防止模型过拟合。所述激活函数采用relu函数,收敛速度快,保持梯度不会衰减,从而缓解梯度消失问题。所述dropout层在训练过程中,每次随机选择一些神经元不参与模型得到训练,可以尽量避免模型的过拟合,使得模型的鲁棒性更强。dropout值设置为0.2,即神经元的失活比例为20%。

26、进一步地,所述lstm网络模块对特征x't中的时序特征进行学习;

27、it=σ(wix't+uiht-1+bi)

28、ft=σ(wfx't+ufht-1+bf)

29、ot=σ(wox't+uoht-1+bo)

30、

31、

32、ht=ot⊙tanh(ct)

33、其中,it、ft、ot、ct、ht分别为lstm中的输入们、遗忘门、输出门、候选记忆细胞、记忆细胞、隐藏状态,w,u为lstm的权重矩阵,b为偏置向量,⊙为逐元素乘法。

34、进一步地,所述lstm网络模块包括激活函数、优化函数和正则化层:

35、所述激活函数采用为tanh函数,其dropout值为0.2;考虑到本发明的数据量和参数规模较大,采用adam作为优化函数。为有效避免模型对训练数据的噪声过度拟合,本发明选择l2正则化避免模型的过拟合。

36、进一步地,所述基于cnn-lstm模型的预测模型的输出层的预测结果yt计算公式为:yt=wyht+by

37、其中,yt为时间步为t时的输出,wy是权重矩阵,by是偏置矩阵。

38、进一步地,所述步骤6的具体评估和更新方法为:

39、首先,利用损失函数对yt进行评估:

40、

41、其中,yi为第i个样本的真实值,为第i个样本的预测值;

42、然后,利用自适应梯度算法(adam)更新模型参数,减小损失;

43、当评估结果达到预期效果,保留模型参数,输出交通事故数量预测结果用于下面的交通事故黑点聚类。

44、进一步地,所述步骤7交通事故黑点进行聚类的详细方法为:

45、步骤7.1、设置相关权重;

46、为不同类型交通事故设置权重,其中轻微事故权重为α1,一般事故权重为α2,重大事故权重为a3,特大事故权重为α4,且α1<α2<α3<α4;

47、为根据数据的密度分布来估计合适的邻域半径ε和最小点数min pts,本发明采用k-distance函数自适应的确定邻域半径ε和最小点数min pts。

48、步骤7.2、寻找交通事故核心点;

49、选择任意事故点p并统计其邻域半径ε内的交通事故个数|nε(p)|,计算其领域半径ε内所有事故的平均道路损失m并与黑点阈值m比较,只有|nε(p)|≥min pts且m≥m时才将点p标记为交通事故核心点。

50、步骤7.3、寻找边界点和噪声点;

51、如果一个未被标记的事故点其邻域半径ε内包含至少一个核心点,则将该点标记为边界点,与核心点属于相同的簇。如果其邻域半径ε不含核心点,则将其标记为噪声点,不属于任何簇。

52、步骤7.4、形成簇,也就是形成不同的事故黑点;

53、将核心点和其直接密度可达的点归为同一个簇。边界点根据其邻居的簇分配情况,可以被分配到相应的簇。最后删除所有噪声点。

54、进一步地,所述寻找交通事故核心点的具体过程为:

55、(1)、选择任意交通事故点p,统计p邻域半径ε内的交通事故个数|nε(p)|,且|nε(p)|≥min pts;

56、(2)、计算事故点p邻域半径ε内的所有事故的平均道路损失m;

57、m=(i1×α1+i2×α2+i3×α3+i4×α4)/d

58、

59、其中,d为事故点p邻域半径ε内所占的道路距离,fi和gi为任意两个事故点的经纬度,i1、i2、i3、i4,α1、α2、α3、α4分别为事故点p邻域半径ε内的轻微、一般、重大、特大事故的数量和权重,d为交通事故点之间所占道路的距离。

60、(3)、比较事故点p邻域半径ε内的所有事故的平均道路损失m与黑点阈值m;

61、(4)、只有|nε(p)|≥min pts且m≥m时才将点p标记为交通事故核心点;

62、(5)、重复上述步骤,依次寻找标记所有交通事故核心点。

63、本发明还公开一种基于深度学习和密度聚类的城市道路交通事故黑点预测系统,包括空间卷积模块,时序数据学习模块和密度聚类模块。空间卷积模块主要利用卷积神经网络(cnn)中的卷积-池化操作对城市道路线形图像进行特征提取,捕捉交通事故的空间分布关系。时序数据学习模块利用lstm从交通流数据、历史事故数据和气象数据中学习事故的时间变化趋势。cnn与lstm模块旨在预测未来城市道路的交通事故数量。密度聚类模块采用了dbscan基于数据密度对事故黑点进行聚类,能够发现不同形状的事故黑点。

64、有益效果:与现有技术相比,本发明具有以下优点:(1)、本发明利用cnn和lstm结合空间数据和时序数据,充分挖掘了交通事故发生的时空相关性。其中为了保持较低的参数量和计算量的同时,仍然能够提供较好的特征提取能力和非线性能力,本发明选取3×3的卷积核和池化操作,有效提取道路线形对交通事故发生的空间影响。通过多次卷积-池化操作有效降低空间数据的维度和复杂度,增加网络的深度和表达能力。由于本发明采用的数据量较大,为了避免模型在训练过程中过拟合,在lstm模块中增加了l2正则化操作。

65、(2)、为了确保预测结果的准确性采用损失函数和adam优化函数结合的方式,自适应调整模型参数。这种综合考虑可以更全面地理解交通系统的运行状况,提高了未来交通事故数量预测的准确性。

66、(3)、本发明根据交通事故的空间分布和密度,利用dbscan自动的划分出不同的事故黑点,找出事故发生频率高的区域。其中采用k-distance函数自适应寻找dbscan中的邻域半径和最小点数;并且划分交通事故核心点时采用双重限制条件从而避免邻域半径内只有1-2起特大事故或重大事故等造成的平均道路损失大于黑点阈值从而错误识别为事故黑点的情况。

67、总的来说,本发明结合深度学习和聚类分析的方法,能够实现对交通事故数量和分布的有效预测和识别。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1