一种基于金字塔式因果网络的耦合信息流长期预测方法

文档序号:33505321发布日期:2023-03-18 00:01阅读:64来源:国知局
一种基于金字塔式因果网络的耦合信息流长期预测方法

1.本发明涉及一种预测方法,具体涉及一种基于金字塔式因果网络的耦合信息流长期预测方法,属于预测耦合信息流术领域。


背景技术:

2.随着网络信息平台的不断发展,信息流在现代管理、市场营销、舆情监测、交通等领域都有所体现。信息流预测的目标是通过给出网络结构和历史数据,预测未来一段时间内信息流变化的总体趋势。由于近年来信息流数据类型和数量的爆炸性增长,人们对有效稳定的信息流预测方法有着强烈的需求。一般来说,信息流预测模型大致可以分为两类:经典统计方法和数据驱动方法。
3.当网络系统不复杂,即检测器单元较少时,利用统计方法预测耦合信息流是可行的。历史均值模型(ha)通过最小二乘法进行估计,一定程度内解决不同时间、时段的信息流变化问题;时间序列算法(arima)等传统统计方法利用时间序列观测值之间的依赖关系和相关性,从而进行动态预测。然而,受统计方法处理高维时间序列数据能力的限制和网络规模和数据量的增加,越来越多的研究人员开始关注基于数据驱动的预测方法。由于神经网络算法在处理人类活动、社会关系、空气质量等复杂数据方面的显著优势,深度神经网络为解决耦合信息流预测问题提供了新的思路。目前已有许多神经网络方法用于信息流预测,如深度置信网络(dbn)、堆叠式自编码器(sae)等,它们能够有效地学习高维数据的特征。最近提出的t-gcn模型是利用图卷积方法提取图信息,结合循环神经网络(rnn)预测信息流,可以获得良好的预测结果。但是,基于数据驱动的交通流预测方法数据仍面临两个困难:(1)由于受卷积神经网络接收域的限制,t-gcn模型不能有效地总结网络的全局信息。网络具有长距离依赖性,基于网络的t-gcn模型不能保证长期交通流预测的稳定性;(2)受rnn方法性能的限制,t-gcn模型在处理长期预测任务时不能有效地聚合数据的长期依赖性,会导致预测结果不准确。因此,这些基于数据驱动的预测方法仍然不能提取网络的全球空间信息,不能把握时间序列数据的长期依赖性。因此,迫切的需要一种新的方案解决上述技术问题。


技术实现要素:

4.本发明正是针对现有技术中存在的问题,提供一种金字塔时空网络模型(pstn)来进行耦合信息流的预测,特别是交通流的长期预测。根据上述分析,网络不能很好地提取数据的长距离依赖性。因此,我们引入因果网络来重新构建交通流网络。通过因果网络构建,每个节点的父节点,即影响该节点产生变化的节点,将是该节点的一阶邻居,然后通过图卷积网络(gcn)获得网络空间的因果关系,利用多种提取方法提取时间序列数据的时间特征。本发明可以更有效地获取耦合信息流网络的时空信息,特别是在长期预测方面有较好的效果。
5.为了实现上述目的,本发明的技术方案如下,一种基于金字塔式因果网络的耦合
信息流长期预测方法,所述方法包括以下步骤:步骤1:因果网络重构;步骤2:金字塔时空网络模型建立。
6.其中,步骤1:因果网络重构,包括以下两个步骤步骤11:构建复杂的因果网络,具体如下:我们采用基于因果性指标的因果推理方法来构建复杂的因果网络,对于事件,我们可以通过信息熵来反映信息的不确定性,其公式为:,其中是变量的概率,而对于两个事件可以通过定义联合熵和条件熵来确定信息之间的关系,其公式为:,其中是变量的联合概率和条件概率,互信息描述两个事件之间的共享信息,当的关系越密切,互信息越大,其公式为:;此时若有另一事件作为发生条件时,事件的条件互信息为,条件互信息反应在条件下两个事件的关系,不能描述信息流的方向,而传递熵解决这一问题,其公式为:,设计了一个因果熵指标,通过确定延迟时间,可以得到两个时间序列之间信息流的方向,定义为:,这一指标反映在给定的条件且明确的信息和方向时,能提供的信息量。
7.步骤12:计算因果熵,因果熵等价于互信息,通过一种基于knn的互信息估计方法来估计两个事件的互信息:,其中,表示所有样本的平均值,表示为近邻点个数,是一个digamma函数,表示样本大小,表示在方向上满足knn的点数。
8.当条件集为多维随机变量时,将互信息公式推广为。
9.其中,步骤2:金字塔时空网络模型建立,该阶段包括三个步骤:步骤21:预处理;步骤22:时空块;步骤23:解码输出。
10.其中,步骤21:预处理,具体如下:将时间数据进行预处理并改变数据的维数,分为两个部分:1、学习每个时间段的权重,从而找到最重要的时间段,并通过赋予更高的权重来强调该时间段,设输入,其中为时间段的个数,衡量时间段权重的公式如下:,其中,是全局平均池化,将每个时间段的信息汇总成为标量;是可学习的权值;分别是relu函数和sigmoid函数,由此本发明可以生成权值,这里的权值是强调时间段后得到的,然后点乘于输入;2、增加维度,由于节点特征维度为1,与时间段维数不同,因此特征维度需要增加,增加维度的公式如下:;其中分别对特征维数和时间段维数进行线性变换,是经过处理后的数据。
11.其中,步骤22:时空块,具体如下:时空块(stblock)。每个时空块包含一个可以双向提取时间序列数据的时间金字塔模块和一个可以总结因果网络和地理网络信息的残差多图卷积网络模块。
12.步骤22-1、时间模块,本发明通过金字塔式时间模型提取时间序列信息,具体如下:步骤22-1.1金字塔时间模型的主体由时间维度上的一维卷积组成,通过一维卷积,以金字塔结构逐步提取输入数据的时间信息,卷积公式如下:,其中,为第个stblock的层的输入,为一维卷积核,随着金字塔
层的增加,输入数据的时间维度将被提取出来;步骤22-1.2通过金字塔结构提取数据后,每一层都会得到不同长度的的时间序列数据。然后将门控循环神经网络(gru)分别应用于每个金字塔层,模型如下:,其中为隐藏层,为随机参数,由此,金字塔的每一层都会得到经过处理的时间序列数据,步骤22-1.3本发明使用每一层的最后一个时间段来汇总信息,汇总信息过程如下:,其中是第个stblock的提取结果,为金字塔层数,提取结果将作为空间模块的输入。
13.步骤22-2、空间模块;具体如下:步骤22-2.1由于交通地理网络是非欧几里德网络,通过gnn的谱域方法进行提取,设为信号,是图的邻接矩阵,卷积描述为:,其中为卷积输出,为滤波器,为参数,是归一化laplacian 矩阵的特征向量,是其特征值,用chebyshev多项式近似滤波器得到:,其中,多项式,为特征值的缩放:,其中,为矩阵的最大特征值,由此可以得到的表达式为:,本发明设定chebyshev多项式阶为1,并逼近最大特征值为2,由此得到gcn模型为:,
其中,是加权邻接矩阵,是卷积输出,步骤22-2.2为了保证stblock不改变数据维数,空间模块的输出维数将增加,公式如下:,其中,表示第个stblock的输出。
14.其中,步骤23:解码输出,具体如下,根据一系列线性变换,本发明对提取的信息进行解码,使输出特征维数为1,模型如下:其中,输出为模型预测结果。
15.相对于现有技术,本发明具有如下优点,1)该技术方案本发明利用数据驱动的方法,结合了网络和因果网络,可以通过提取分布式空间特征来捕捉更深层的网络关系;2)本发明对于耦合信息流预测工作有显著的改善,明显优于其他模型;3)本发明在pemsd7(m)数据集上取得了出色的预测性能,其长期预测精度比其他广泛应用的时空预测模型有较好的提升。
附图说明
16.图1为本发明整体流程图;图2为stblock流程图;图3 为预处理流程图。
具体实施方式
17.为了加深对本发明的理解,下面结合附图对本实施例做详细的说明。
18.实施例1:参见图1-图3,一种基于金字塔式因果网络的耦合信息流长期预测方法,所述方法包括以下步骤:步骤1:因果网络重构;步骤2:金字塔时空网络模型建立。
19.其中,步骤1:因果网络重构,包括以下两个步骤:步骤11:构建复杂的因果网络,具体如下:我们采用基于因果性指标的因果推理方法来构建复杂的因果网络,对于事件,我们可以通过信息熵来反映信息的不确定性,其公式为:,其中是变量的概率,而对于两个事件可以通过定义联合熵和条件熵来确定信息之间的关系,其公式为:
,其中是变量的联合概率和条件概率,互信息描述两个事件之间的共享信息,当的关系越密切,互信息越大,其公式为:,此时若有另一事件作为发生条件时,事件的条件互信息为,条件互信息反应在条件下两个事件的关系,不能描述信息流的方向,而传递熵解决这一问题,其公式为:,设计了一个因果熵指标,通过确定延迟时间,可以得到两个时间序列之间信息流的方向,定义为:,这一指标反映在给定的条件且明确的信息和方向时,能提供的信息量。
20.以交通流为例,为了根据探测器获得的车辆速度信息重构网络结构,本发明选择将每个探测器视为一个节点,从而组成一个节点集,并假设两个节点的因果熵大于0时,连接两个节点的边归入集合中,矩阵为以因果熵为权值的矩阵。则其因果网络图为,可以描述每一个探测器之间的交通流信息传递情况。
21.任一节点,所有方向指向它且因果熵大于0的节点被称之为父节点,归于父节点集,因果性指标假设节点的父节点形成了使因果熵最大化的最小节点集。
22.因果性指标判断可分为两个部分:因果节点的聚合和非因果节点的移除。
23.1、聚合算法:由于变量在时刻对其在时刻的状态有因果影响,该指标可将初始条件集设为。任一节点,将节点的最大因果熵节点记为,并将它添加到条件中。重复上述步骤,直到没有节点能使因果熵大于0,这样我们就可以获得条件集。
24.2、移除算法:对于每个节点,如果因果熵等于0,则从条件集中删除,最终得到节点的父节点集。
25.对每个节点进行因果性指标判断,从而得到两两节点之间的因果熵,从而得到因果网络图。
26.步骤12:计算因果熵,因果熵等价于互信息,因此,我们通过一种基于knn的互信息
估计两个事件的互信息:,其中,表示所有样本的平均值,表示为近邻点个数,是一个digamma函数,表示样本大小,表示在方向上满足knn的点数。
27.当条件集为多维随机变量时,将互信息公式推广为。
28.其中,步骤2:金字塔时空网络模型建立,该阶段包括三个步骤:步骤21:预处理;步骤22:时空块;步骤23:解码输出。
29.其中,步骤21:预处理,具体如下:将时间数据进行预处理并改变数据的维数,分为两个部分:1、学习每个时间段的权重,从而找到最重要的时间段,并通过赋予更高的权重来强调该时间段,设输入,其中为时间段的个数。衡量时间段权重的公式如下:,其中,是全局平均池化,将每个时间段的信息汇总成为标量;是可学习的权值;分别是relu函数和sigmoid函数,由此本发明可以生成权值,这里的权值是强调时间段后得到的,然后点乘于输入;2增加维度,由于节点特征维度为1,与时间段维数不同,因此特征维度需要增加,增加维度的公式如下:,其中分别对特征维数和时间段维数进行线性变换,是经过处理后的数据。
30.其中,步骤22:时空块,具体如下:时空块(stblock)。每个时空块包含一个可以双向提取时间序列数据的时间金字塔模块和一个可以总结因果网络和地理网络信息的残差多图卷积网络模块。
31.步骤22-1、时间模块,本发明通过金字塔式时间模型提取时间序列信息,
步骤22-1.1金字塔时间模型的主体由时间维度上的一维卷积组成,通过一维卷积,以金字塔结构逐步提取输入数据的时间信息,卷积公式如下:,其中,为第个stblock的层的输入,为一维卷积核,随着金字塔层的增加,输入数据的时间维度将被提取出来;步骤22-1.2通过金字塔结构提取数据后,每一层都会得到不同长度的的时间序列数据。然后将门控循环神经网络(gru)分别应用于每个金字塔层,模型如下:,其中为隐藏层,为随机参数,由此,金字塔的每一层都会得到经过处理的时间序列数据,步骤22-1.3本发明使用每一层的最后一个时间段来汇总信息,汇总信息过程如下:,其中是第个stblock的提取结果,为金字塔层数,提取结果将作为空间模块的输入。
32.步骤22-2、空间模块;具体如下:步骤22-2.1由于交通地理网络是非欧几里德网络,通过gnn的谱域方法进行提取,设为信号,是图的邻接矩阵,卷积描述为:,其中为卷积输出,为滤波器,为参数,是归一化laplacian 矩阵的特征向量,是其特征值,用chebyshev多项式近似滤波器得到:,其中,多项式,为特征值的缩放:,其中,为矩阵的最大特征值,由此可以得到的表达式为:
,本发明设定chebyshev多项式阶为1,并逼近最大特征值为2,由此得到gcn模型为:,其中,是加权邻接矩阵,是卷积输出,步骤22-2.2为了保证stblock不改变数据维数,空间模块的输出维数将增加,公式如下:,其中,表示第个stblock的输出。
33.其中,步骤23:解码输出,具体如下,根据一系列线性变换,本发明对提取的信息进行解码,使输出特征维数为1,模型如下:其中,输出为模型预测结果。
34.该发明以交通流为例,首先采用因果性指标判断,以检测器获取的车辆速度时间序列数据为基础构建因果网络,通过基于knn的互信息估计方法来计算因果熵,完成因果网络的构建。接着,该发明利用金字塔时空网络模型,从输入预处理层到时空块层(stblock),最后得到结果。其中每个时空块包含一个可以双向提取时间序列数据的时间金字塔模块和一个可以总结因果网络和地理网络信息的残差多图卷积网络模块。本发明利用时空数据的邻域信息进行分布式特征提取,保证长期预测的稳定性;所提出的金字塔时空网络模型比其他广泛使用的时空预测模型具有更好的预测效果。
35.实施例2:一种基于金字塔式因果网络的耦合信息流长期预测方法,所述方法包括以下步骤:步骤一:以交通流为例,如图1,将节点设为初始条件集,其中为探测器节点集。任一节点,从而组成一个将节点的最大因果熵节点记为,并将它添加到条件中。重复上述步骤,直到没有节点能使因果熵大于0,这样我们就可以获得条件集;步骤二:对于每个节点,如果因果熵等于0,则从条件集中删除,最终得到节点的父节点集;步骤三:对每个节点进行上述两步,从而得到两两节点之间的因果熵,从而得到因果网络图,步骤四:通过互信息公式,从而得到因果熵的值,构建出因果网络;步骤五:如图3,学习每个时间段的权重,从而找到最重要的时间段,并通过赋予更高的权重来强调该时间段。设输入,公式如下:
;步骤六:对特征维数和时间段维数进行线性变换,从而增加维度。是经过处理后的数据;步骤七:如图2,通过一维卷积,以金字塔结构逐步提取输入数据的时间信息;步骤八:将门控循环神经网络(gru)分别应用于每个金字塔层,从而得到每一层经过处理的时间序列数据;步骤九:使用每一层的最后一个时间段来汇总信息,从而得到每一个stblock的提取结果;步骤十:输入到gcn模型中,通过模型:,其中,是加权邻接矩阵,得到卷积输出。
36.步骤十:为了保证stblock不改变数据维数,增加空间模块的输出维数,得到每个stblock的输出;步骤十一:对提取的信息进行解码,使输出特征维数为1,得到输出。
37.对比了本发明与其他时空预测模型在pemsd7(m)数据集上30分钟和60分钟的预测效果。为了方便用数据表示,我们定义平均绝对误差,,其中,是准确位置,通过该公式我们可以进行对比,数值越小,预测精度越高。具体数据如下:;表1 本发明与其他时空预测模型预测效果对比;通过表1数据,我们可以发现本发明在pemsd7(m)数据集上取得了较为出色的预测性能,其长期预测精度比其他时空预测模型更高。
38.需要说明的是上述实施例,并非用来限定本发明的保护范围,在上述技术方案的基础上所作出的等同变换或替代均落入本发明权利要求所保护的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1