一种基于韦布尔分布的网络流量建模方法和系统的制作方法

文档序号:10615834阅读:352来源:国知局
一种基于韦布尔分布的网络流量建模方法和系统的制作方法
【专利摘要】本发明涉及一种基于韦布尔分布的网络流量建模方法和系统,包括以下步骤:步骤1:产生预定数量的韦布尔噪声时间序列at;步骤2:对产生的韦布尔噪声时间序列at进行预处理,剔除异点,并进行零均值化处理得到韦布尔时间序列εt;步骤3:采用搜索法估计分数差分系数d;步骤4:根据分数差分系数d对步骤2的韦布尔时间序列εt应用分数差分公式进行差分滤波得到时间序列Wt;步骤5:对时间序列Wt进行ARMA过程,得FARIMA时间序列Xt;步骤6:验证产生的FARIMA时间序列Xt能够描述网络流量的自相似性和突发性。该网络流量建模方法用韦布尔分布代替高斯分布生成的FARIMA模型比传统的网络流量模型更精确,更符合实际的网络流量的波形图,自相似的程度更好。
【专利说明】
-种基于韦布尔分布的网络流量建模方法和系统
技术领域
[0001] 本发明设及网络通信领域,尤其设及一种基于韦布尔分布的网络流量建模方法和 系统。
【背景技术】
[0002] 在计算机网络的设计、评价和优化中,网络流量建模起着非常重要的作用。其中, W统计分布理论作为研究网络业务的基础,促进了网络流量业务的发展,网络业务的自相 似性和突发性对网络的分析、设计、控制和管理产生了巨大影响,对网络的服务质量提出了 更严峻的挑战。网络性能评价就成为网络设计与控制的重要研究部分,尤其随着网络的发 展,网络上承载的业务也由语音扩展到视频,多媒体等,运一切都对网络性能和网络业务建 模提出了更高的要求,因此建立出合理的网络流量模型对于网络的发展起着至关重要的作 用。
[0003] 实际的网络数据在绝大部分时间尺度范围内具有统计的自相似性,在小尺度范围 内具有突发性。统计分布理论作为研究网络业务的工具为建模研究提供了便利。传统的网 络流量模型在描述实际网络业务时,认为网络模型具有Markov性,并在此基础上建立了 W 泊松过程为主的数学描述模型。但此模型只可W描述突发的特征,并不能很好得描述出实 际网络业务自相似性的特点;随后,科学家又进行了大量的仿真实验,应用了大量的数学模 型,比如:Markov过程、AR、M、ARMA和ARIMA过程等,同样运些模型不能很好地描述网络业务 的自相似的特性,因此建立可W同时描述自相似性和突发性的网络业务模型是很有必要 的。随着科学研究的发展,FARIMA(分数差分自回归滑动平均过程)被用作为网络业务模型, 该模型W统计分布理论中的高斯噪声为基础成功地得到了可W描述网络流量的自相似性 和突发性质的模型。但是,运种模型在某种程度上是有缺陷的,比如:在一个单一的化rst参 数下,运种模型很难去描述整个时间序列的相关性,况且,在实际的网络流量建模时,运类 的自相似过程是比较片面的。

【发明内容】

[0004] 本发明所要解决的技术问题是提供一种基于韦布尔分布的网络流量建模方法和 系统,用韦布尔分布代替高斯分布生成的FARIMA模型比传统的网络流量模型更精确,更符 合实际的网络流量的波形图,自相似的程度更好。
[0005] 本发明解决上述技术问题的技术方案如下:一种基于韦布尔分布的网络流量建模 方法,包括W下步骤:
[0006] 步骤1:产生预定数量的韦布尔噪声时间序列at;
[0007] 步骤2:对产生的韦布尔噪声时间序列at进行预处理,剔除异点,并进行零均值化 处理得到韦布尔时间序列Et;
[000引步骤3:采用捜索法估计分数差分系数d;
[0009]步骤4:根据分数差分系数d对步骤2的韦布尔时间序列n应用分数差分公式进行 差分滤波得到时间序列Wt;
[0010] 步骤5:对时间序列Wt进行ARMA过程,得FARIMA时间序列Xt;
[0011] 步骤6:验证产生的FARIMA时间序列Xt能够描述网络流量的自相似性和突发性。
[0012] 本发明的有益效果:用韦布尔分布代替高斯分布生成的FARIMA模型准确地描述了 实际网络流量业务的自相似性和突发性,比传统的网络流量模型更精确,更符合实际的网 络流量的波形图,自相似的程度更好。
[0013] 在上述技术方案的基础上,本发明还可W做如下改进。
[0014] 进一步,所述步骤1中的韦布尔分布噪声序列由韦布尔分布的概率密度公式产生, 所述概率密度公式为:
[0015]
[0016] 其中,A>〇是尺度参数,k>0是形状参数,t是为韦布尔噪声时间点。
[0017] 进一步,所述步骤4的分数差分公式为:
[001 引
[0019] 其中,dG(-0.5,0.5),0<|z|<l,et是韦布尔时间序列,a-z^)d表示分数差分算 子,Wt是对韦布尔序列Et做分数差分滤波后得到的序列,0《t《1000。
[0020] 进一步,所述步骤5具体包括W下步骤:
[00別]步骤5. 1 :由Yule-Walker方程计算出AR模型的自回归参数向量(()帖|, (p2,:…,斯,]和M模型的滑动平均参数向量目[目1,目2,…,目q];
[0022] 步骤5.2:根据AIC准则求得AR模型和MA模型的自回归系数P与滑动平均系数q;
[0023] 步骤5.3:将步骤5.1中得到的取[(pl,恥,...,(pp]和0[0l,02,…,0q]W及步骤 5.2得到的P和q的值代入如下公式:
[0024]
[002引 Xt为FARIMA时间序列,巫(Z-I)和0 (Z-I)分别是P阶自回归多项式和q阶移动平均 多项式,Wt是根据差分系数d差分滤波后的时间序列,t为韦布尔噪声时间点,0《t《1000。 [00%]进一步,所述AIC准则的计算式为:
[0027]
[002引
[0029] 其中,N为FARIMA时间序列的时间点容量,P和q为ARMA模型阶数,:沪为差分过后得 到的时间序列Wt的残差方差。
[0030] 进一步,所述步骤6具体包括W下步骤:
[0031] 步骤6.1:对FARIMA时间序列Xt应用R/S公式来描述Xt自相似的程度,公式为:
[0032]
[0033] 其中,R(n)为FARIMA时间序列Xt的极差,S(n)为FARIMA时间序列Xt的标准差,0《n 《1000,X(t)为FARIMA时间序列Xt;
[0034] 步骤6.2:根据R/S统计的计算式,在对数坐标下,绘制R/S曲线;
[0035] 步骤6.3:对R/S曲线进行最小二乘拟合,得到化rst指数的估计值H;
[0036] 步骤6.4:当0《H《0.5时,认为时间序列不具有自相似性质;0.5<H<1时,说明时间 序列有自相似性,并且H的值越接近1,表示自相似程度越好。
[0037] 步骤6.5:根据FARIMA时间序列Xt波形图观察每个顶端突出部分的差异性判断突 发性强弱。
[0038] -种基于韦布尔分布的网络流量建模系统,其特征在于,包括数据获取单元、零均 值处理单元、估算单元、分数差分单元、ARMA单元及验证单元,
[0039] 所述数据获取单元,用于产生韦布尔噪声时间序列;
[0040] 所述零均值处理单元,用于对产生的韦布尔噪声时间序列进行预处理,剔除异点 并进行零均值化得到韦布尔时间序列;
[0041 ]所述估算单元,用于采用捜索法估计分数差分系数;
[0042] 所述分数差分单元,根据分数差分系数对韦布尔时间序列进行分数差分滤波得到 差分时间序列;
[0043] 所述ARMA单元,用于对差分时间序列进行ARMA过程,得FARIMA时间序列;
[0044] 所述验证单元,用于验证产生的FARIMA时间序列能够描述网络流量的自相似性和 失发性。
[0045] 进一步,所述数据获取单元通过概率密度公式产生韦布尔噪声时间序列,所述概 率密度公式为:
[0046]
[0047] 其中,A>〇是尺度参数,k>0是形状参数,t是韦布尔噪声时间点。
[004引进一步,所述分数差分单元通过分数差分公式对韦布尔时间序列进行分数差分, 所述分数差分公式为:
[0049]
[(K)加]
[0051] 其中,(l-z-i)d表示分数差分算子,Et是韦布尔时间序列,Wt是根据差分系数d差分 后的时间序列,〇《t《1000。
【附图说明】
[0052] 图1是本发明的方法流程图;
[0053] 图2是本发明的韦布尔噪声图;
[0054] 图3是基于韦布尔分布的FARIMA模型波形图;
[0055] 图4是基于韦布尔分布自相似性化rst指数图;
[0056] 图5是高斯噪声图;
[0057] 图6是基于高斯分布的FARIMA模型波形图;
[005引图7是基于高斯分布的自相似性化rst指数图。
【具体实施方式】
[0059] W下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并 非用于限定本发明的范围。
[0060] 如图1所示,一种基于韦布尔分布的网络流量建模方法,包括W下步骤:
[0061] 步骤1:由韦布尔分布的概率密度公式产生1000点布尔噪声序列at,如图2所示,用 W作为FARIM模型的基础序列,所述概率密度公式为:
[0062]
[0063] 其中,A>〇是尺度参数,k>0是形状参数,t是韦布尔噪声时间点。
[0064] 步骤2:对产生的韦布尔噪声时间序列进行预处理,剔除异点及零均值化得到韦布 尔时间序列Et;
[0065] 步骤3:采用捜索法估计分数差分系数d;
[0066] 步骤4:应用分数差分系数d对步骤2的韦布尔时间序列Et进行分数差分得到 FARIMA(0,d,0)时间序列Wt,分数差分过程就是将一个时间序列转化为平稳序列所进行的 过程,差分系数用d表示,针对韦布尔分布时间序列,我们用捜索法进行估计得到d = 0.15。
[0067] 其分数差分公式为:
[006引
[0069]
[0070] 其中,(l-z-i)d表示分数差分算子,Et是韦布尔时间序列,Wt是根据差分系数d差分 后的时间序列,〇《t《1000。
[0071] 步骤5:根据ARMA模型对FARIMA(0,d,0)时间序列Wt进行预测,得到FARIMA(p,d,q) 时间序列Xt,其具体过程如下:
[0072] (1)由化1 e-Wa 1 ker方程计算出AR模型的自回归参数向量帮协1,悼卿]和MA 模型的滑动平均参数向量0[01,02,…,0q];
[0073] (2)根据AIC准则求得AR模型和MA模型的自回归系数P与滑动平均系数q的值,其 AIC准]/>11故A锋味击-
[0074]
[0075]
[0076] 其中,N为FARIM( 0,d,0)时间序列的时间点容量,P和q为ARMA模型阶数,护为差分 过后得到的FARIMA(0,d, 0)时间序列Wt的残差方差。
[0077] (3)将步骤(1)中得到的取协1,:恥,...,:牺巧口目[目1,目2,…,目q]W及步骤(2)得到 的P和q的值代入公式:
[007引
[0079] 其中O (Z-I)和0 (Z-I)分别是P阶自回归(AR)多项式和q阶滑动平均(M)多项式,Xt 为FARIMA(p,d,q)时间序列,Wt是根据差分系数d差分后的序列,t为韦布尔噪声时间点,0《 t《1000,如图3所示。
[0080] 步骤6:验证产生的基于韦布尔分布的FARIMA(p,d,q)时间序列能够描述网络流量 的自相似性和突发性。
[0081 ] 对击驢5产牛的FARTMA(n . f]. n)时间序列欣巧R/SA析方诀.if算公式如下:
[0082]
[0083] 其中,R(n)为FARIM(p,d,q)时间序列Xt的极差,S(n)为FARIMA(p,d,q)时间序列Xt 的标准差,n为样本点容量,X(n)为FARIMA(p,d,q)时间序列Xt;
[0084] (2)根据R/S统计的计算式,在对数坐标下,绘制R/S曲线,如图4所示;
[0085] (3)对R/S曲线进行最小二乘拟合,得到化rst指数的估计值H,经计算H=O. 8079;
[0086] (4)当0.5<H< 1时,说明时间序列有自相似性;当0《H《0.5时,认为时间序列不 具有自相似性质,H = O.8079,说明模型产生了自相似程度较好的时间序列,可W描述网络 流量业务的自相似特性。
[0087] (5)根据步骤5产生的FARIMA(p,d,q)时间序列Xt波形图观察波形图每个顶端突出 部分的差异性判断突发性强弱,观察发现波形图的尖端部分差异性较大,故该模型可W描 述网络流量的突发性。
[0088] 将基于韦布尔噪声的FARIMA模型与传统的基于高斯噪声的FARIM模型对比,如图 5所示为产生的1000点高斯分布噪声图,基于高斯分布的FARIMA模型如图6所示,其自相似 性化rst指数图如图7所示,经计算H = O.7452,该值小于基于本发明提出模型的化rst参数 值,所W本发明提出的模型产生了高度的自相似时间序列;对比图3与图6,本发明提出的模 型波形图比基于高斯分布的模型波形图突发更加明显,因此,本发明提出的网络流量建模 方法弥补了传统模型在描述网络流量业务时存在的不足,可W应用到实际的网络评价、优 化领域中。
[0089] -种基于韦布尔分布的网络流量建模系统,其特征在于,包括数据获取单元、零均 值处理单元、估算单元、分数差分单元、ARMA单元及验证单元,
[0090] 所述数据获取单元,用于产生韦布尔噪声时间序列;
[0091] 所述零均值处理单元,用于对产生的韦布尔噪声时间序列进行预处理,剔除异点 并进行零均值化得到韦布尔时间序列;
[0092] 所述估算单元,用于采用捜索法估计分数差分系数;
[0093] 所述分数差分单元,根据分数差分系数对韦布尔时间序列进行分数差分滤波得到 差分时间序列;
[0094] 所述ARMA单元,用于对差分时间序列进行ARMA过程,得FARIMA时间序列;
[00%] 所述验证单元,用于验证产生的FARIMA时间序列能够描述网络流量的自相似性和 突发性。
[0096] W上所述仅为本发明的较佳实施例,并不用W限制本发明,凡在本发明的精神和 原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【主权项】
1. 一种基于韦布尔分布的网络流量建模方法,其特征在于,包括W下步骤: 步骤1:产生预定数量的韦布尔噪声时间序列at; 步骤2:对产生的韦布尔噪声时间序列at进行预处理,剔除异点,并进行零均值化处理得 到韦布尔时间序列Et; 步骤3:采用捜索法估计分数差分系数d; 步骤4:根据分数差分系数d对步骤2的韦布尔时间序列ε*应用分数差分公式进行差分滤 波得到时间序列Wt; 步骤5:对时间序列Wt进行ARMA过程,得FARIM时间序列Xt; 步骤6:验证产生的FARIM时间序列Xt能够描述网络流量的自相似性和突发性。2. 如权利要求1所述的一种基于韦布尔分布的网络流量建模方法,其特征在于,所述步 骤1中根据韦布尔分布的概率密度公式产生韦布尔分布噪声序列at,所述概率密度公式为:其中,λ〉〇是尺度参数,k〉0是形状参数,t是韦布尔噪声时间点。3. 如权利要求1所述的一种基于韦布尔分布的网络流量建模方法,其特征在于,所述步 骤4的分数差分公式为:其中H,j = 0,l,2,. . .,°〇,de(-0.5,0.5),0< |z| <1,ε*是韦布尔 时间序列,(l-z^i)d表示分数差分算子,Wt是对韦布尔序列ε*做分数差分滤波后得到的序列, 0《t《1000。4. 如权利要求1所述的一种基于韦布尔分布的网络流量建模方法,其特征在于,所述步 骤5具体包括W下步骤: 步骤5.1:由化le-Walker方程计算出AR模型的自回归参数向量φ[φ?,巧2,...,q)p]和 Μ模型的滑动平均参数向量目[目1,目2,…,目q]; 步骤5.2:根据AIC准则求得A財莫型和Μ模型的自回归系数P与滑动平均系数q; 步骤5.3:将步骤5.1中得到的辆(f)I,(p,,…,φp巧PΘ[θl,θ2,…,θq]W及步骤5.2得到 的P和q的值代入如下公式:Xt为FARIMA时间序列,Φ(ζ-1)和Θ(ζ-1)分别是P阶自回归多项式和q阶移动平均多项 式,Wt是根据差分系数d差分滤波后的时间序列,t为韦布尔噪声时间点,0《t《1000。5. 如权利要求4所述的一种基于韦布尔分布的网络流量建模方法,其特征在于,所述 AIC准则的计算式为:其中,N为Wt时间序列的时间点容量,p和q为ARMA模型阶数,冷2为差分滤波过后得到的 时间序列Wt的残差方差。6. 如权利要求1所述的一种基于韦布尔分布的网络流量建模方法,其特征在于,所述步 骤6具体包括W下步骤: 步骤6.1:对FARIM时间序列Wt应用R/S公式来描述Xt自相似的程度,公式为:其中,R(n)为FARIMA时间序列Xt的极差,S(n)为FARIMA时间序列Xt的标准差,0《n《 1000,X(t)为 FARIMA 时间序列 Xt; 步骤6.2:根据ΚΛ统计的计算式,在对数坐标下,绘制ΚΛ曲线; 步骤6.3:对ΚΛ曲线进行最小二乘拟合,得到化rst指数的估计值Η; 步骤6.4:当0《Η《0.5时,认为时间序列不具有自相似性质;0.5<Η< 1时,说明时间序列 有自相似性,并且Η的值越接近1,表示自相似程度越好。 步骤6.5:根据FARIMA时间序列Xt波形图观察每个顶端突出部分的差异性判断突发性强 弱。7. -种基于韦布尔分布的网络流量建模系统,其特征在于,包括数据获取单元、零均值 处理单元、估算单元、分数差分单元、ARMA单元及验证单元, 所述数据获取单元,用于产生韦布尔噪声时间序列; 所述零均值处理单元,用于对产生的韦布尔噪声时间序列进行预处理,剔除异点并进 行零均值化得到韦布尔时间序列; 所述估算单元,用于采用捜索法估计分数差分系数; 所述分数差分单元,根据分数差分系数对韦布尔时间序列进行分数差分滤波得到差分 时间序列; 所述ARM单元,用于对差分时间序列进行ARM过程,得FARIMA时间序列; 所述验证单元,用于验证产生的FARIMA时间序列能够描述网络流量的自相似性和突发 性。8. 如权利要求7所述的一种基于韦布尔分布的网络流量建模系统,其特征在于,所述数 据获取单元通过概率密度公式产生韦布尔噪声时间序列,所述概率密度公式为:其中,λ〉〇是尺度参数,k〉0是形状参数,t是韦布尔噪声时间点。9. 如权利要求7所述的一种基于韦布尔分布的网络流量建模系统,其特征在于,所述分 数差分单元通过分数差分公式对韦布尔时间序列进行分数差分,所述分数差分公式为:其中,(l-z-i)d表示分数差分算子,et是韦布尔时间序列,Wt是根据差分系数d差分后的 时间序列,〇《t《1000。
【文档编号】H04L12/24GK105978733SQ201610481911
【公开日】2016年9月28日
【申请日】2016年6月27日
【发明人】孙晓川, 李莹琦, 耿大猛, 张明辉
【申请人】华北理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1