基于STL分解法的符号化有向加权复杂网络建网方法与流程

文档序号:17693841发布日期:2019-05-17 21:17阅读:364来源:国知局
基于STL分解法的符号化有向加权复杂网络建网方法与流程

本发明涉及一种复杂网络建网方法。特别是涉及一种基于stl分解法的符号化有向加权复杂网络建网方法。



背景技术:

复杂网络分析法是将复杂系统的基本基元抽象为节点,基元之间相互作用的关系抽象为连边的方法。自从复杂网络的小世界特性和无标度特性被揭示以来,复杂网络分析方法被普遍应用到了各类复杂系统的研究当中。将复杂系统抽象为由点和连边组成的网络,通过分析该网络的拓扑特征挖掘系统的信息。

近年来,运用复杂网络建模方法挖掘时间序列的内部信息越来越多地受到各领域研究者的关注。目前,经典的时间序列建网方法有:相空间重构法和可视图算法。相空间重构法是通过嵌入维数和推迟时间将一维时间序列划分为一组特定长度的多维向量,以向量为节点,向量之间的相关关系为连边,将原始时间序列映射为一个无权无向的复杂网络。可视图算法是将时间序列的每个时刻数据抽象为节点,柱状图展示的数据频率之间的可视关系抽象为连边的一种建网方法。这两种建网方法忽略了时间的不可逆性和节点之间不同的关联性强度,在精准刻画系统特性方面表现较弱。

随着电子技术、计算机技术的高速发展,大数据时代已经来临。经济、交通、通讯、教育等各个领域记录和存储了海量具有时空特征的数据。经典时间序列建网方法的计算复杂度较高,面对大数据时,其分析能力较差,时间序列符号化建网方法应运而生。主要的时间序列符号化建网方法有:基于pearson相关性的符号化建网方法,基于伏动模式的符号化建网方法和符号模式表征的建网方法。基于pearson相关性的符号化建网方法可以分析具有相关性的多维时间序列。基于伏动模式的符号化建网方法根据时间序列的变化率建网,更多地应用于金融领域的时间序列数据。符号模式表征的建网方法针对具有跳跃性特征的时间序列数据。



技术实现要素:

本发明所要解决的技术问题是,对于具有周期性特征的时间序列,提供一种能够精准刻画时间序列数据点之间关联的基于stl分解法的符号化有向加权复杂网络建网方法。

本发明所采用的技术方案是:基于stl分解法的符号化有向加权复杂网络建网方法,包括如下步骤:

1)依据时间序列加法模型yn=sn+tn+rn,采用stl分解法将周期性时间序列分解为季节项,趋势项和随机项,其中,sn表示季节项,tn表示趋势项,rn表示随机项,n表示时间序列的长度,即:原时间序列yn={yi,i=1,2,…,n}通过stl分解法分解为sn={si,i=1,2,…,n},tn={ti,i=1,2,…,n},rn={ri,i=1,2,…,n};

2)将每个分解项看做一个变量,每个时间序列数据值表示为三个分解变量组成的数据向量;

3)用粗粒化过程将一组点转化为符号模式,粗粒化过程:选用符号化阶数m对时间序列{xi,i=1,2,…,n}进行层次划分和符号模式转化,令:

其中,a,b,…,m表示m阶符号;

4)根据步骤3),对原始时间序列的三个分解项分别做层次划分和符号模式转化,然后将每个时间序列数据用符号向量表示;

5)将互不相同的时刻符号模式作为复杂网络的节点,不同模式之间的转换关系作为节点之间的连边,转换频次和转换的方向作为复杂网络连边的权重和连边的方向,如此,将时间序列映射为以符号模式为基元的有向加权复杂网络;

6)借助gephi软件实现有向加权复杂网络的可视化;

7)计算有向加权复杂网络的网络拓扑特性,包括度分布p(k)、节点强度gi、加权聚类系数c和加权有向平均路径长度wdpl,

上式中,n表示网络的节点总数,nk表示网络中度为k的节点的数量,

上式中,wij是从节点i到节点j的边的权重,neighbori表示由节点i指出的所有邻居节点构成的集合,

上式中,n表示网络的节点总数,ci是节点i的聚类系数,gi如式(4),ki是节点i的度,wij是从节点i到节点j的边的权重,类似地,wik是从节点i到节点k的边的权重,aij是邻接矩阵中的元素,表示节点i和j的连接关系,类似地,ajk和aik是邻接矩阵中的元素,

l(i,j)=minwij(6)

上式中,n表示网络的节点总数,l(i,j)表示由节点i到节点j的最小加权有向路径长度,wij是由节点i指向节点j的边的权重。

步骤2)是由于每个时间数据值包含的信息量有周期态,趋势态和随机态,同时这些信息量可以有效地表示该时刻的数据,记

yi=(si,ti,ri)(7)

步骤4)中,根据三个分解变量对原时间序列的影响程度选用不同权重的符号化阶数,令m1为季节项的符号化阶数,m2为趋势项的符号化阶数,m3为随机项的符号化阶数,根据步骤3),得到三组符号序列

其中,p(si),p(ti),p(ri)∈{a,b,…},根据公式(7),每个时间序列数据值表示为如下符号化模式

modei={p(si),p(ti),p(ri)}(9)

对每个时刻的数据都以同样的方式进行符号化处理,最终达到对原始时间序列数据的符号化模式转化。

步骤5)中,确定节点之间的连边以及连边的权重和方向的具体方法为:对于相邻两个时刻的符号化模式modei和modei+1,如果modei=modei+1,则网络状态保持不变,如果modei≠modei+1,i时刻的符号模式与i+1时刻的符号模式之间存在连边;连边的方向从i时刻的符号模式指向i+1时刻的符号模式,并且连边的权重加1。

本发明的基于stl分解法的符号化有向加权复杂网络建网方法,采用stl分解法和粗粒化过程,对原始时间序列做加法模型分解、层次划分和符号模式转化,所建立的网络的拓扑结构可以精准地体现时间序列时间数据状态间的关系。本发明的优点特色体现在以下几个方面:

1、本发明提出的有向加权复杂网络可以很准确地反映时间序列数据状态之间的关联,网络拓扑特性可以区分平稳时间序列和非平稳时间序列。

2、本发明提出的有向加权复杂网络中的节点是由该节点所对应的时间序列数据的状态符号化向量表示的。因此,网络不仅可以体现时间序列数据状态的变化而且能够反映时间序列的长期趋势性。符号化过程使得网络规模受时间序列长度的影响较小,适用于具有周期性的大数据时间序列分析。

3、本发明提出的有向加权复杂网络针对周期性时间序列,并且软件编程易于实现、算法效率高。因此,可以广泛应用于具有周期性的时间序列,如:气象数据、通信数据、互联网吞吐时序数据,交通领域旅客吞吐时序数据等。

附图说明

图1是本发明基于stl分解法的符号化有向加权复杂网络建网方法的流程图;

图2是本发明基于stl分解法的符号化有向加权复杂网络建网方法的原理图;

图3是航空旅客吞吐量时间序列stl分解图;

图4是对应于图3的有向加权复杂网络图;

图5是网络话务量时间序列stl分解图;

图6是对应于图5的有向加权复杂网络图。

具体实施方式

下面结合实例和附图对本发明的基于stl分解法的符号化有向加权复杂网络建网方法做出详细说明。

本发明的基于stl分解法的符号化有向加权复杂网络建网方法,如图1所示,包括如下步骤:

步骤1:依据时间序列加法模型yn=sn+tn+rn,采用stl分解法将周期性时间序列分解为季节项,趋势项和随机项。其中,sn表示季节项,tn表示趋势项,rn表示随机项,n表示时间序列的长度。即,原时间序列yn={yi,i=1,2,…,n}通过stl分解法分解为sn={si,i=1,2,…,n},tn={ti,i=1,2,…,n},rn={ri,i=1,2,…,n}。

步骤2:将每个分解项看做一个变量,每个时间序列数据值表示为三个分解变量组成的数据向量。由于每个时间数据值包含的信息量有周期态,趋势态和随机态,同时这些信息量可以有效地表示该时刻的数据,记

yi=(si,ti,ri)(1)

步骤3:用粗粒化过程将一组点转化为符号模式,粗粒化过程:选用符号化阶数m对时间序列{xi,i=1,2,…,n}进行层次划分和符号模式转化,令:

其中,a,b,…,m表示m阶符号。

步骤4:根据步骤3,对原始时间序列的三个分解项分别做层次划分和符号模式转化,然后将每个时间序列数据用符号向量表示。具体依据如下方法进行:

首先,根据三个分解变量对原时间序列的影响程度选用不同权重的符号化阶数,令m1为季节项的符号化阶数,m2为趋势项的符号化阶数,m3为随机项的符号化阶数,根据步骤3,得到三组符号序列

其中,p(si),p(ti),p(ri)∈{a,b,…}。其次,根据公式(1),每个时间序列数据值表示为如下符号化模式

modei={p(si),p(ti),p(ri)}(5)

最后,对每个时刻的数据都以同样的方式进行符号化处理,最终达到对原始时间序列数据的符号化模式转化。

依据这种方法,原始时间序列可以表示成由一系列符号化模式组成的序列,如图2所示为本发明基于stl分解法的符号化有向加权复杂网络建网方法的原理图。

步骤5:将互不相同的时刻符号模式作为复杂网络的节点,不同模式之间的转换关系作为节点之间的连边,转换频次和转换的方向作为复杂网络连边的权重和连边的方向,如此,将时间序列映射为以符号模式为基元的有向加权复杂网络。确定复杂网络节点之间的连边以及连边的权重和方向的具体方法为:对于相邻两个时刻的符号化模式modei和modei+1,如果modei=modei+1,则网络状态保持不变,如果modei≠modei+1,i时刻的符号模式与i+1时刻的符号模式之间存在连边;连边的方向从i时刻的符号模式指向i+1时刻的符号模式,并且连边的权重加1。

步骤6:借助gephi软件实现有向加权复杂网络的可视化。

步骤7:计算有向加权复杂网络的网络拓扑特性,包括度分布p(k)、节点强度gi、加权聚类系数c和加权有向平均路径长度wdpl,

上式中,n表示网络的节点总数,nk表示网络中度为k的节点的数量;

上式中,wij是从节点i到节点j的边的权重,neighbori表示由节点i指出的所有邻居节点构成的集合;

上式中,n表示网络的节点总数,ci是节点i的聚类系数,gi如式(7),ki是节点i的度,wij是从节点i到节点j的边的权重,类似地,wik是从节点i到节点k的边的权重,aij是邻接矩阵中的元素,表示节点i和j的连接关系,类似地,ajk和aik是邻接矩阵中的元素;

l(i,j)=minwij(9)

上式中,n表示网络的节点总数,l(i,j)表示由节点i到节点j的最小加权有向路径长度,wij是由节点i指向节点j的边的权重。

实施例1

本案例使用的初始数据为航空旅客月吞吐量时间序列数据,时间跨度从1996年1月到2017年12月。图3所示是航空旅客吞吐量时间序列数据的stl分解结果,其中季节项为周期是12的时间序列,趋势项呈现近似上升趋势。经过adf检测可知该时间序列满足周期性和非平稳性。分别选取季节项的符号化阶数为6,趋势项的符号化阶数为10,随机项的符号化阶数为4,将原时间序列进行符号化转化。以不同的符号化模式为节点,相邻时间序列数据的符号模式之间的转换关系为连边,并且连边的方向从前一时刻指向后一时刻,模式的转换频次为连边的权重,得到有向加权复杂网络。如图4所示为图3的时间序列所对应的有向加权复杂网络图。由非平稳周期时间序列映射得到的复杂网络的拓扑特征为:网络的聚类系数较小,网络中节点的强度较小。

实施例2

本案例使用的初始数据为网络话务量时间序列数据,时间跨度从2005年1月20日00时到2005年1月26日23时,每五分钟记录一次话务量数据。图5所示为网络话务量时间序列数据的stl分解结果,其中季节项为周期是24的时间序列,趋势项呈现近似上升趋势,adf检测结果显示该时间序列满足周期性和平稳性。分别选取季节项的符号化阶数为6,趋势项的符号化阶数为10,随机项的符号化阶数为4,将原时间序列进行符号化转化和构建有向加权复杂网络。如图6所示是图5的时间序列所对应的有向加权复杂网络图。由平稳周期时间序列映射得到的复杂网络的拓扑特征为:网络的聚类系数较大,网络中节点的强度较大。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1