一种基于开源事件高阶表征的国家行为预测方法与系统

文档序号:37821746发布日期:2024-04-30 17:31阅读:9来源:国知局
一种基于开源事件高阶表征的国家行为预测方法与系统

本发明属于基于神经网络的深度学习,尤其涉及一种基于开源事件高阶表征的国家行为预测方法与系统。


背景技术:

1、对国家行为进行分析预测具有重要的现实意义,但是与之相关的事件样本通常较难获取,一般研究人员仅可通过互联网查找有关开源信息(如新闻报道、社交平台等),并在此基础上开展分析。因此,面对诸如文本信息来源复杂、内容噪声较高、分析机理显著依赖于领域专家知识等现实挑战,亟需提出一种准确、高效的国家行为预测方法。

2、目前业界关于国家行为预测的技术研究相对较少,大多数从业者都聚焦于特定国家行为事件的后验分析及解释,而缺乏对行为预测的考量。该研究的技术难点在于基于传统研判方式从海量文本信息中抽取所关心的事件信息需要花费大量的时间和人力成本,同时所获取的事件信息噪声较高,导致研判准确率受限。虽然本发明所针对的分析任务在本质上属于文本分类范畴,但其使用的数据样本以及构造方式和传统文本分类差异较大,目前暂未发现类似针对国家行为预测的具体技术方案。此外,传统基于文本信息的事件预测方案大多采用一阶表征完成分析预测,但这种简单的特征提取方法难以有效利用情报信息在时间、空间上的事件相关性,从而导致预测精度有限。

3、如何设计一种端到端的国家行为预测方法与系统,利用特定时间窗口内的国家开源事件信息,尽可能准确地预测该国家潜在动向。这一问题的难点可进一步分解为如下两个部分:1)如何在不过度依赖专家知识的前提下,设计扩展性良好的国家行为因子库,提升开源事件检测模型的可复用性;2)如何充分利用大量开源事件之间时域和空间域共现信息,尽可能地提升国家行为趋势预测准确率。


技术实现思路

1、为解决上述技术问题,本发明提出一种基于开源事件高阶表征的国家行为预测技术方案。

2、本发明第一方面公开了一种基于开源事件高阶表征的国家行为预测方法;该方法包括:

3、依据构建的国家行为因子库(k表示国家行为因子集合中的第k项因子,δk表示国家行为因子集合中第k项因子指标),因子总数为k,对开源历史报道中所包含的与国家行为因子对应的各类征候事件进行关联检索,获得相关开源报道it(对于第t个历史时间窗口而言,it为该时间窗口内的相关开源报道),获得事件实例集合其中,为δk在it中出现的频次,表示在第t个历史时间窗口对应的事件实例,j表示δk在it中出现的频次变量,相关开源报道的历史时间窗口对应范围为t∈{t1...tm};

4、使用预训练自然语言处理模型来获取事件实例集合的一阶深度表征,获得事件实例集合的一阶深度表征:

5、将该事件实例集合的一阶深度表征沿词频维度进行池化操作,将降维至其中d表示深度表征维度,将各因子降维后的一阶深度表征拼接聚合,形成降维聚合后的一阶深度表征φt∈rk×d,k∈{1...k},t∈{t1...tm},将各项因子δk的归一化频率作为标记位,置于降维聚合后的一阶深度表征向量的末位,形成作为事件实例集合的归一化频率标记的降维聚合后的一阶深度表征,其中的每一行对应不同国家行为因子相关事件的特征原型;

6、基于所提取的事件实例集合的归一化频率标记的降维聚合后的一阶深度表征,进一步通过高阶池化操作获取各项征候事件间的时空共现信息,获得开源事件的高阶表征时空共现信息;

7、将生成的开源事件的高阶表征时空共现信息馈送至异常行为预测器,输出最终的国家行为趋势预测结果pt。

8、根据本发明第一方面的方法,获得开源事件的高阶表征时空共现信息的方法如下:

9、基于单个历史时间窗口t∈{t1...tm}内的开源事件高阶表征时空共现信息的方法,对m个历史时间窗口内的事件开展跨时域高阶融合,将历史事件高阶表征的维度扩充至ψt∈rmk×mk,将ψt作为开源事件的高阶表征时空共现信息,其中表示的第k列,g(x,γ)表示的第k列,表示的第k列,表示的第k列,g(x,γ)为的转置,g(x,γ)为幂正则化函数,g(x,γ)用于调整高阶共现表征中的特征能量分布,实现事件共现信息的均衡表达,其中γ为其超参数,用于调节幂正则化函数的函数曲率。

10、根据本发明第一方面的方法,异常行为预测器以浅层(2层至6层)卷积神经网络为基本架构,以交叉熵作为损失函数。

11、根据本发明第一方面的方法,在该损失函数中,通过随机梯度下降算法对该卷积神经网络网络参数进行迭代拟合,当损失函数值不再下降时,保存当前神经网络网络参数作为预测器的最优参数,对国家行为趋势进行推理预测。

12、根据本发明第一方面的方法,获得事件实例集合的同时获得yt,yt表示在第t个历史时间窗口内的国家行为异常程度标签。

13、根据本发明第一方面的方法,交叉熵损失函数为l=-∑tytlogpt,其中pt表示输出最终的国家行为趋势预测结果,yt表示在第t个历史时间窗口内的国家行为异常程度标签。

14、根据本发明第一方面的方法,用fθ(·)表示所使用的预训练自然语言处理模型,其中θ为其模型参数,获得事件实例集合的一阶深度表征:

15、

16、根据本发明第一方面的方法,将该事件实例集合的一阶深度表征沿词频维度进行池化操作为平均池化。

17、本发明第二方面公开了一种基于开源事件高阶表征的国家行为预测系统;该系统包括:

18、第一处理模块,被配置为,依据构建的国家行为因子库(k表示国家行为因子集合中的第k项因子,δk表示国家行为因子集合中第k项因子指标),因子总数为k,对开源历史报道中所包含的与国家行为因子对应的各类征候事件进行关联检索,获得相关开源报道it(对于第t个历史时间窗口而言,it为该时间窗口内的相关开源报道),获得事件实例集合其中,为δk在it中出现的频次,表示在第t个历史时间窗口对应的事件实例,j表示δk在it中出现的频次变量,相关开源报道的历史时间窗口对应范围为t∈{t1...tm};

19、第二处理模块,被配置为,使用预训练自然语言处理模型来获取事件实例集合的一阶深度表征,获得事件实例集合的一阶深度表征:

20、第三处理模块,被配置为,将该事件实例集合的一阶深度表征沿词频维度进行池化操作,将降维至其中d表示深度表征维度,将各因子降维后的一阶深度表征拼接聚合,形成降维聚合后的一阶深度表征φt∈rk×d,k∈{1...k},t∈{t1...tm},将各项因子δk的归一化频率作为标记位,置于降维聚合后的一阶深度表征向量的末位,形成作为事件实例集合的归一化频率标记的降维聚合后的一阶深度表征,其中的每一行对应不同国家行为因子相关事件的特征原型;

21、第四处理模块,被配置为,基于所提取的事件实例集合的归一化频率标记的降维聚合后的一阶深度表征,进一步通过高阶池化操作获取各项征候事件间的时空共现信息,获得开源事件的高阶表征时空共现信息;

22、第五处理模块,被配置为,将生成的开源事件的高阶表征时空共现信息馈送至异常行为预测器,输出最终的国家行为趋势预测结果pt。

23、根据本发明第二方面的系统,用于实现本公开第一方面中任一项的一种基于开源事件高阶表征的国家行为预测方法中的步骤。

24、本发明第三方面公开了一种电子设备。电子设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时,实现本公开第一方面中任一项的一种基于开源事件高阶表征的国家行为预测方法中的步骤。

25、本发明第四方面公开了一种计算机可读存储介质。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,实现本公开第一方面中任一项的一种基于开源事件高阶表征的国家行为预测方法中的步骤。

26、综上,本发明提出的方案具备如下技术效果:1)通过扩展性良好的国家行为因子库,提升了开源事件检测模型的可复用性;2)充分利用大量开源事件之间时域和空间域共现信息,尽可能地提升国家行为趋势预测准确率;3)将各项因子δk的归一化频率作为标记位,置于降维聚合后的一阶深度表征向量的末位,形成作为事件实例集合的归一化频率标记的降维聚合后的一阶深度表征,能够通过降维表征不同国家行为因子相关事件的特征原型,还能够通过归一化频率的标记,形成更为准确的一阶深度表征。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1