基于图神经网络的风险因子关联数据挖掘方法与流程

文档序号:37896902发布日期:2024-05-09 21:40阅读:10来源:国知局
基于图神经网络的风险因子关联数据挖掘方法与流程

本发明涉及图神经网络,尤其涉及一种基于图神经网络的风险因子关联数据挖掘方法。


背景技术:

1、随着城市化进程的加速,城市交通问题日益严重,交通拥堵和交通事故频发已经成为困扰城市居民的重要问题,为了提高城市道路的通行能力和安全性,交通管理部门和研究人员需要对交通路口进行风险评估和分类,以便采取针对性的措施降低交通事故和拥堵的发生。

2、近年来,图神经网络(graph neura l network,gnn)作为一种强大的机器学习方法,已经在许多领域取得了显著的成功,例如社交网络分析、生物信息学和推荐系统等,gnn具有很好的表征能力,可以捕捉图结构中的复杂关系,因此在交通路口风险数据的挖掘中具有很大的潜力。

3、然而,为了使gnn能够有效地应用于交通路口风险数据的挖掘,需要对交通路口的历史交通数据进行合理的处理和表示,这包括计算交通路口的风险因子、确定交通路口的标签、构建适当的图结构以及确定节点特征向量和边权重等,此外,还需要将这些信息组织成合适的数据集,并在训练和测试过程中对模型进行调整和优化,以提高预测准确性。

4、中国专利公开号:cn115147790a公开了一种基于图神经网络的车辆未来轨迹预测方法,包括步骤1:数据采集:获取交通参与者、周边交通参与者的视觉感知信息、传感定位信息以及高精地图信息,并对获取的信息进行处理;步骤2:制作训练数据:根据传感定位信息和高精地图构建道路图,然后构建周边交通参与者和自车轨迹的时间序列,生成真值未来轨迹和多模态轨迹;步骤3:神经网络搭建:基于自车、周边交通参与者的时间序列,以及道路图中包含的每个节点中的空间序列,使用循环神经网络lstm进行编码,并用lstm中的隐向量来表征整个序列特征;步骤4:进行模型训练:构建关于多模态分类和元素偏移量准确性的负对数似然损失函数:式中,m表示模态数量、h表示预测的时间步数,n表示二维高斯分布、s表示真实轨迹点、a表示静态轨迹anchor、μ表示高斯分布均值、σ表示二维高斯分布的协方差矩阵、x表示输入样本、θ表示网络参数;神经网络模型通过梯度反向传播优化模型参数,使损失函数逐步下降、性能指标逐步提升;步骤5:将测试集输入训练完成的图神经网络模型,得到轨迹预测的结果。

5、由此可见,现有技术存在以下问题:由于对交通路口的风险因子、标签以及图结构进行确定地精确度低,从而影响数据集的精确性以及可解释性,导致图神经网络的分类准确率低,从而影响风险因子关联数据挖掘的准确率。


技术实现思路

1、为此,本发明提供一种基于图神经网络的风险因子关联数据挖掘方法,用以克服现有技术中数据集的精确性低以及可解释性差,导致图神经网络的分类准确率低,从而影响风险因子关联数据挖掘的准确率的问题。

2、为实现上述目的,本发明提供一种基于图神经网络的风险因子关联数据挖掘方法,包括:

3、获取预设区域内所有交通路口的历史交通数据,计算交通路口的风险因子,以确定交通路口的标签;

4、将所有交通路口设置为透明节点,将连接相邻两个透明节点的道路设置为边,确定透明节点的特征向量,以及包含了透明节点的聚类系数和所述边的初始权重的图参数;

5、将所有交通路口的特征向量、标签以及图参数存储至数据集中,将数据集按照预设比例划分为训练集与测试集;

6、构建图神经网络并将所述图神经网络在训练集上训练;

7、根据准确率大于预设准确率的图神经网络对预设区域以外的交通路口进行分类;

8、其中,透明节点的聚类系数根据透明节点的度数确定,所述边的初始权重根据所述道路历史一年的车流量确定。

9、进一步地,根据以下公式计算交通路口的风险因子,设定

10、

11、其中,f表示交通路口的风险因子,a表示交通路口历史一年的交通事故数量,a0表示交通路口历史五年的平均交通事故数量,b表示交通路口历史一年的拥堵次数,b0表示交通路口历史五年的平均拥堵次数。

12、进一步地,所述确定交通路口的标签包括根据所述风险因子与预设风险因子的比对结果确定交通路口的标签。

13、进一步地,所述确定透明节点的聚类系数包括根据所述透明节点的度数确定的第一聚类系数以及第二聚类系数其中d表示透明节点的度数。

14、进一步地,所述根据道路历史一年的车流量确定的初始权重包括所述车流量小于等于第一预设车流量时确定的第一初始权重,所述车流量大于第一预设车流量且小于等于第二预设车流量时确定的第二初始权重以及所述车流量大于第二预设车流量时确定的第三初始权重。

15、进一步地,当确定所述边的初始权重完成时,根据所述道路的长度大于预设长度确定对所述图参数的调整。

16、进一步地,所述确定对所述图参数的调整包括根据所述长度与预设长度的第一相对差确定对所述图参数进行调整的调整方式,所述调整方式包括根据调整系数调整所述初始权重以及根据调整系数调整所述初始权重并根据调节系数对聚类系数进行调节。

17、进一步地,根据以下公式计算调整系数k,设定

18、

19、根据以下公式计算调节系数t,设定

20、

21、其中,k表示调整系数,t表示调节系数,△c表示所述第一相对差。

22、进一步地,当图神经网络训练完成时,根据训练完成的图神经网络对测试集中的透明节点进行分类的准确率小于等于预设准确率确定对所述调节系数进行修正。

23、进一步地,所述确定对所述调节系数进行修正包括根据所述准确率与预设准确率的第二相对差确定对所述调节系数进行修正的修正系数。

24、与现有技术相比,本发明的有益效果在于,本发明综合考虑了交通路口历史一年的交通事故数量和历史五年的平均交通事故数量,以及历史一年的拥堵次数和历史五年的平均拥堵次数,全面评估了交通路口的风险状况,使得评估结果更加准确。

25、进一步地,本发明通过比较风险因子与预设风险因子以直观地将交通路口分为低风险和高风险两类,更精确地确定交通路口的标签,以提高图神经网络的分类效果。

26、进一步地,本发明通过将透明节点的度数与预设度数进行比较,以更精确地确定透明节点的聚类系数,从而更准确地分析交通网络的结构,从而提高图神经网络分类的的精确性。

27、进一步地,本发明通过将车流量与预设车流量进行比对,以更精确地反映出道路的实际交通状况,初始权重的设定直观地反映了车流量对交通路口的影响,提高了图神经网络的解释性。

28、进一步地,本发明通过将道路长度与预设长度进行比对,以更精确地反映出道路的实际情况,从而提高图神经网络分类的精确性和适应性。

29、进一步地,本发明通过将第一相对差与第一预设相对差进行比较以反映出道路的实际情况,更精确的调整图参数,提升图神经网络的分类的准确性,从而更精确地挖掘风险因子的关联数据。

30、进一步地,本发明通过调整系数和调节系数的计算,以更精确地调整图参数,优化图神经网络的结构,以使数据集对于交通路口以及道路的实际情况进行精确反应,从而提高图神经网络的分类准确率。

31、进一步地,本发明通过比较模型的分类准确率与预设准确率,以更精确地评估图神经网络的性能,并据此对调节系数进行修正,从而提高图神经网络的分类准确率。

32、进一步地,本发明根据第二相对差来确定修正系数,以更精确地调整调节系数,以使数据集对于交通路口以及道路的实际情况进行精确反应,从而提高图神经网络的分类准确率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1