一种基于GNN-GRU的时空关联预测方法与流程

文档序号:31116741发布日期:2022-08-12 22:07阅读:316来源:国知局
一种基于GNN-GRU的时空关联预测方法与流程
一种基于gnn-gru的时空关联预测方法
技术领域
1.本发明涉及事件预测技术领域,具体涉及一种基于gnn-gru的时空关联预测方法。


背景技术:

2.袭击事件,或称暴力事件,通常指通过暴力、破坏等手段,实现其政治、经济等方面的目的与诉求的行为。随着世界经济的稳步增长,暴力事件、涉恐活动也呈现出逐年上升的趋势,如何防范此类袭击事件的发生,考验着各国社会治理的智慧和战略的持续力。如何构建有效刻画暴力袭击活动特征内在规律模型,可以为预防暴力袭击活动提供参考意见,一定程度上降低社会治理成本,因此其在相关研究领域正逐步得到重视。
3.现有技术中,针对袭击事件通常是从文化、政治、历史等角度进行判断,其聚焦于社会学、经济学视角、围绕政治经济、宗教文化、国际关系等方面进行定性的分析,从而获得袭击事件发展的内在驱动力。但是,在实际实施过程中,发明人发现,上述现有技术通常仅是针对单一变量,比如袭击事件中的伤亡人数进行分析,或是结合多个单变量分析模型的结果综合评判袭击事件的发展态势,并不能真正地针对某一时间段内的袭击事件中,融合多个变量在时间维度上的变化,及对袭击事件产生的影响进行揭示。


技术实现要素:

4.针对现有技术中存在的上述问题,现提供一种基于gnn-gru的时空关联预测方法。
5.具体技术方案如下:
6.一种基于gnn-gru的时空关联预测方法,包括:
7.步骤s1:获取过去一时间段内的多个所述袭击事件;
8.步骤s2:自所述袭击事件中以时间顺序依次提取多对关联于所述袭击事件的空间特征和时间特征;
9.每一个所述袭击事件中所述的空间特征作为下一时刻所述时间特征的隐状态进行提取;
10.步骤s3:根据所述时间特征和所述空间特征生成预测结果。
11.优选地,所述步骤s2包括:
12.步骤s21:自所述袭击事件中生成对应于所述袭击事件的邻接矩阵;
13.步骤s22:对多个所述邻接矩阵以时间顺序依次进行提取,以获取所述空间特征和时间特征。
14.优选地,所述步骤s21包括:
15.步骤s211:生成一对应于所述袭击事件的关联矩阵;
16.步骤s212:根据所述关联矩阵生成所述邻接矩阵。
17.优选地,所述关联矩阵为:
18.r
t
=[ev],[eu],其中r
t
为所述关联矩阵,ev为受袭击地区,eu为袭击发起组织,t 为所述袭击事件的发生时间;
[0019]
所述邻接矩阵为:其中,a
t
为所述邻接矩阵,r
t
为对应于所述袭击事件的所述关联矩阵,为所述关联矩阵的转置矩阵,t为所述袭击事件的发生时间。
[0020]
优选地,预先输入一初始值作为第一个隐状态,则所述步骤s22包括:
[0021]
步骤s221:根据输入的所述隐状态生成所述空间特征;
[0022]
步骤s222:根据所述空间特征和所述邻接矩阵生成所述时间特征;
[0023]
步骤s223:将所述时间特征作为下一个所述隐状态,随后返回所述步骤s221,直至所述邻接矩阵均被提取完成。
[0024]
优选地,所述空间特征的生成方法包括:
[0025]
其中,为第i个节点的输出的所述空间特征,h
t,j
为输入的所述隐状态,σ(*) 为求和函数,为所述袭击事件在多个所述袭击事件组成的图结构中的邻接节点,α
ij
为注意力系数,w为模型可学习参数;
[0026]
所述注意力系数α
ij
的生成方法包括:其中,α
ij
为所述注意力系数,e
i,j
为所述邻接节点h
t,i
与所述隐状态h
t,j
的相似系数, leakrelu(*)为激活函数,exp(*)为指数函数,为所述袭击事件在多个所述袭击事件组成的图结构中的邻接节点;
[0027]
所述相似系数e
i,j
的生成方法为:e
i,j
=a(w1h
t,i
,w1h
t,j
),其中,e
i,j
为所述相似系数,w1和a为模型可学习参数。
[0028]
优选地,所述时间特征的生成方法包括依次计算的:
[0029][0030]
其中,h
t
为所述时间特征,wr、br、wz、bz、wh、uh及bh为关联于上一个所述隐状态的模型可学习参数,r
t
为时间特征提取过程中的重置门,z
t
为时间特征提取过程中的更新门。
[0031]
优选地,所述步骤s3包括:
[0032]
步骤s31:根据所述空间特征和所述时间特征产生预测过程信息;
[0033]
步骤s32:根据所述预测过程信息生成所述预测结果。
[0034]
优选地,所述步骤s31中所述预测过程信息的生成方法包括:p
t
= w2(tanh(w1h
t
+b1))+b2,其中,p
t
为所述预测过程信息,h
t
为最近的所述袭击事件的时间特征,w2、b2、w3和b3作为模型的可学习参数。
[0035]
优选地,所述步骤s32包括:采用一目标函数对所述预测过程信息进行处理以生成所述预测结果;
[0036]
所述目标函数包括:l=l2+βl
reg
,其中,
[0037]at
为所述袭击事件的邻接矩阵,p
t
为所述袭击事件的关联矩阵;l
reg
=||θ||2,β为正则化项的权重参数,θ为所有的可学习参数。
[0038]
上述技术方案具有如下优点或有益效果:通过对袭击事件提取时间特征和空间特征,进而有效地得出预测结果,避免了现有技术中,针对袭击事件进行单一特征提取,无法对袭击事件进行有效预测的问题,进而为袭击事件的事前预防提供了可靠的依据。
附图说明
[0039]
参考所附附图,以更加充分的描述本发明的实施例。然而,所附附图仅用于说明和阐述,并不构成对本发明范围的限制。
[0040]
图1为本发明实施例的整体示意图;
[0041]
图2为本发明实施例中步骤s2子步骤示意图;
[0042]
图3为本发明实施例中步骤s21子步骤示意图;
[0043]
图4为本发明实施例中步骤s22子步骤示意图;
[0044]
图5为本发明实施例中空间特征与事件特征提取过程示意图;
[0045]
图6为本发明实施例中步骤s3子步骤示意图;
[0046]
图7为本发明实施例中gat-gru模型的性能测试图;
[0047]
图8为本发明实施例中graphsage-gru模型的性能测试图;
[0048]
图9为本发明实施例中chebyshev-gcn-gru模型的性能测试图。
具体实施方式
[0049]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0050]
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
[0051]
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
[0052]
本发明包括:
[0053]
一种基于gnn-gru的时空关联预测方法,如图1所示,包括:
[0054]
步骤s1:获取过去一时间段内的多个袭击事件;
[0055]
步骤s2:自袭击事件中以时间顺序依次提取多对关联于袭击事件的空间特征和时间特征;
[0056]
每一个袭击事件中的空间特征作为下一时刻时间特征的隐状态进行提取;
[0057]
步骤s3:根据时间特征和空间特征生成预测结果。
[0058]
具体地,针对现有技术中,仅通过单一变量对暴力袭击事件进行研究无法准确预测出暴力袭击事件的发展趋势的问题,本发明通过提取暴力袭击事件的时间特征与空间特征进而刻画出过去一时间段内袭击发起组织与受袭击地区时空关联的内在规律,进而在时间维度上从袭击发起组织和受袭击地区角度分析暴力袭击活动的演变趋势。
[0059]
在一种较优的实施例中,如图2所示,步骤s2包括:
[0060]
步骤s21:自袭击事件中生成对应于袭击事件的邻接矩阵;
[0061]
步骤s22:对多个邻接矩阵以时间顺序依次进行提取,以获取多对空间特征和时间特征。
[0062]
具体地,针对现有技术中无法针对多个变量进行融合处理的问题,本实施例选择了通过生成对应于暴力袭击事件的邻接矩阵,进而提取时间特征与空间特征对该暴力袭击事件相关的属性进行提取、融合以实现较好的处理效果,进而实现了对暴力袭击事件在时间维度上较好的预测效果。
[0063]
在实施过程中,本发明将暴力袭击事件视作在图结构中存在有一定关联的多个节点,其关联矩阵为r
t
,t∈{t-q+1,t-q+2,

,t},则对应于t-q+1至t这一时间段内存在有一对应于暴力袭击事件的序列(r
t-q+1
,r
t-q+2


,r
t
)。通过提取该序列的时间和空间特征对下一时刻t+1时受袭击地区与袭击发起组织的关联矩阵r
t+1

[0064]
在一种较优的实施例中,如图3所示,步骤s21包括:
[0065]
步骤s211:生成一对应于袭击事件的关联矩阵;
[0066]
步骤s212:根据关联矩阵生成邻接矩阵。
[0067]
具体地,为实现较好的提取效果,本实施例通过对关联矩阵进行处理以生成邻接矩阵,进而实现了对袭击事件的袭击发起组织和受袭击地区的关联。其中,关联矩阵r
t
为在t时刻发生的暴力袭击事件,包括有受袭击地区ev,袭击发起组织eu。通过建立关联矩阵能够有效地表征暴力袭击事件的发生时间、受袭击地区和袭击发起组织,进而为进一步提取特征并预测出后续的暴力袭击事件提供依据。
[0068]
在一种较优的实施例中,关联矩阵为:
[0069]rt
=[ev],[eu],其中r
t
为关联矩阵,ev为受袭击地区,eu为袭击发起组织,t为袭击事件的发生时间;
[0070]
邻接矩阵为:其中,a
t
为邻接矩阵,r
t
为对应于袭击事件的关联矩阵,为关联矩阵的转置矩阵,t为袭击事件的发生时间。
[0071]
具体地,通过设置邻接矩阵a
t
实现了在图结构中以袭击发起组织和受袭击地区作为顶点,进而可以通过提取其隐状态实现对暴力袭击事件的预测,实现了对暴力袭击事件在时间维度上较好的预测效果。
[0072]
在一种较优的实施例中,预先输入一初始值作为第一个隐状态,则步骤s22 包括:
[0073]
步骤s221:根据输入的隐状态生成空间特征;
[0074]
步骤s222:根据空间特征和邻接矩阵生成时间特征;
[0075]
步骤s223:将时间特征作为下一个隐状态,随后返回步骤s221,直至邻接矩阵均被提取完成。
[0076]
具体地,在步骤s22中,采用一循环过程对具有时空关联性的暴力袭击事件进行空间特征提取与时间特征提取。如图5所示,a
t-q+1
,a
t-q+2


,a
t
是对应时刻t由受袭击地区ev,袭击发起组织eu作为顶点的邻接矩阵,gcn表示空间特征提取过程,用于对结构中节点信息的消息传递,消息聚合及更新,gru表示时间特征提取过程,h
t-q+1
,h
t-q+2


,h
t
为对应时刻输
入时间特征的隐状态,为提取时间特征后的隐状态。通过上述过程可以有效地根据时间序列对暴力袭击事件的空间特征和事件特征进行有效提取。
[0077]
在实施过程中,空间特征的提取过程通常采用图神经网络变体模型提取空间结构中节点状态的隐藏状态信息,比如gcn网络。但是,该提取过程并不仅限于通过gcn网络实现,比如在另一实施例中,发明人选用了gat(graphattention network,注意力机制图神经网络)实现了对空间特征的提取。在另外的实施例中,发明人采用了顶点局部邻居采样聚合机制图神经网络(graphsage) 实现了对空间特征的提取。
[0078]
在一种较优的实施例中,空间特征的生成方法包括:
[0079]
其中,为第i个节点的输出的空间特征,h
t,j
为输入的隐状态,σ(*)为求和函数,为暴力袭击事件在多个暴力袭击事件组成的图结构中的邻接节点,α
ij
为注意力系数,w为模型可学习参数;
[0080]
注意力系数α
ij
的生成方法包括:其中,α
ij
为注意力系数,e
i,j
为邻接节点h
t,i
与隐状态h
t,j
的相似系数,leakrelu(*)为激活函数,exp(*)为指数函数,为暴力袭击事件在多个暴力袭击事件组成的图结构中的邻接节点;
[0081]
相似系数e
i,j
的生成方法为:e
i,j
=a(w1h
t,i
,w1h
t,j
),其中,e
i,j
为相似系数, w1和a为模型可学习参数。
[0082]
在一种较优的实施例中,时间特征的生成方法包括依次计算的:
[0083][0084]
其中,h
t
为时间特征,wr、br、wz、bz、wh、uh及bh为关联于上一个所述隐状态的模型可学习参数,r
t
为时间特征提取过程中的重置门,z
t
为时间特征提取过程中的更新门。
[0085]
具体地,通过设置重置门r
t
和更新门z
t
可以决定上一个输入的隐状态h
t-1
,即提取空间特征后的隐状态在提取时间特征h
t
的过程中遗忘和保留的特征信息。进而由关于状态h
t-1
新生成的特征状态和z
t
,确定在此时刻时间提取过程的输出状态中上一时刻状态h
t-1
所能保留的特征信息。因为r
t
和z
t
的计算过程涉及邻接矩阵的计算部分,所以此时刻节点间关联的信息传递至隐藏状态h
t
中。在以t
‑ꢀ
q+1为起始,t-1为终止,长度为q-1的序列中,最终以h
t
作为提取了发起组织与受袭击地区时空关联特征的隐藏状态。
[0086]
在一种较优的实施例中,如图6所示,步骤s3包括:
[0087]
步骤s31:根据空间特征和时间特征产生预测过程信息;
[0088]
步骤s32:根据预测过程信息生成预测结果。
[0089]
具体地,为实现较好的预测效果,在本实施例中通过步骤s31采用一全连接层由h
t
获得t时刻的关联可能性矩阵p
t
,进而实现了对下一个受袭击地区的预测。同时,通过步骤s32中采用目标函数进行进一步地预测,实现了更高的准确性,并且避免了过拟合的问题。
[0090]
在一种较优的实施例中,步骤s31中预测过程信息的生成方法包括:p
t
= w2(tanh(w1h
t
+b1))+b2,其中,p
t
为预测过程信息,h
t
为最近的袭击事件的时间特征,w2、b2、w3和b3作为模型的可学习参数。
[0091]
具体地,在基于上述空间特征提取以及时间特征提取获得隐状态h
t
后,在分析后续时刻发起组织与受袭击地区的关联可能性时,可采用一全连接层生成可能性矩阵p
t
以作为预测结果输出。
[0092]
进一步地,由于可能性矩阵p
t
是对邻接矩阵a
t
的预测,而后者是由袭击发起组织与受袭击地区的关联矩阵r
t
通过获得,所以在关注后续时刻袭击发起组织与受袭击地区的关联可能性时,只需关注矩阵p
t
右上部分或左下部门与r
t
的同等区域,而对应区域的取值范围属于[0,1],表示袭击发起组织与受袭击地区在下一时刻关联的可能性,即袭击发起组织在此时刻发动对此受袭击地区袭击活动的可能性。
[0093]
在一种较优的实施例中,步骤s32包括:采用一目标函数对预测过程信息进行处理以生成预测结果;
[0094]
目标函数包括:l=l2+βl
reg
,其中,
[0095]at
为暴力袭击事件的邻接矩阵,p
t
为暴力袭击事件的关联矩阵;l
reg
=||θ||2,θ为最终模型中所有的可学习参数,||θ||2表示这些参数的平方和,而最终目标函数为l=l2+βl
reg
,这里β为正则化项的权重参数。
[0096]
下面围绕实施例对本技术方案作进一步说明:
[0097]
实施例一:
[0098]
在本实施例中,通过对全球恐怖主义数据库(global terrorism database,记为gtd)中的1994年至2019年的暴力袭击事件的数据进行提取以生成数据集。
[0099]
gtd是收录了全球袭击活动事件记录的数据库,记录的起始时间为1970年,目前更新至2019年,共有约20万次袭击活动的时间记录。针对每条事件记录利用武器类型、目标类型、袭击行为类型、伤亡情况、经纬度、袭击发生的时间、袭击发起组织等多属性对袭击活动事件记录进行详细描述。
[0100]
以袭击记录中确定的袭击发起组织和国家作为研究对象,首先将全部袭击事件记录按照袭击发起组织和国家中所有类别划分,筛选以各自类别下袭击事件次数按序排列中数目最多的前299个袭击发起组织和前100个国家,以作为分析模型中袭击发起组织和受袭地区。
[0101]
利用299个袭击发起组织和100个受袭地区构建在时间维度上的关联矩阵时,以季度作为时间刻度进行划分,共有104个时刻。若在此季度内袭击发起组织袭击某受袭地区,则关联矩阵对应的元素值为1,否则为0,所以共产生104 个关联矩阵,以此作为模型训练中关联矩阵r
t
的来源。在训练模型时,以连续时刻长度为21的关联矩阵作为一个样本,时刻长度前20为q-1作为模型的输入,最后一个时刻作为模型的输出。将样本集划分为大小为73的训练集,大小为11的测试集。
[0102]
在本实施例中,发明人分别选用了不同的网络模型进行空间特征的提取,包括gat、graphsage及chebyshev-gcn(切比雪夫卷积核图神经网络),进而构建出了gat-gru模型、graphsage-gru模型和chebyshev-gcn-gru模型,并采用上述测试集对于不同的模型进行预测,其结果如下表1及如图7所示的gat-gru 模型性能测试图、如图8所示的graphsage-gru模型的性能测试图以及如图9 所示的chebyshev-gcn-gru模型的性能测试图所示:
[0103][0104]
表1
[0105]
由此可见,上述三种模型在预测过程中均取得了较好的预测效果,可以用于预测袭击事件的发生地区及袭击发起组织。若模型返回预测数值为0,则反映恐怖组织较大可能不会发动针对此受袭地区的袭击活动;由召回率和精确率说明,模型在预测存在关联的恐怖组织与受袭地区时也有着较好的性能。
[0106][0115]
本发明的有益效果在于:利用基于图神经网络和循环神经网络变体方法gru 构建袭击组织与受袭击地区时空关联特征分析模型,通过刻画袭击活动中发起组织与受袭地区间的时空关联特征的变化规律评估未来时刻发起组织与受袭地区的关联关系,以预测未来时刻发起组织将在某地区发动袭击活动的可能性,实验表明模型具有较好性能,对预防暴力袭击活动具有参考价值与指导意义。
[0116]
以上仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1