网络流量的一种混合预测方法

文档序号:9618571阅读:417来源:国知局
网络流量的一种混合预测方法
【技术领域】
[0001] 本发明属于计算机网络技术领域,具体涉及一种网络流量的预测方法。
【背景技术】
[0002] 网络流量是目前网络管理的一个重要参数,在网络资源有限的情况下设计网络的 拥塞控制策略时,网络流量的准确预测对于减少网络拥塞、合理分配资源、提高网络服务质 量以及发现网络异常行为等具有非常重要的作用。近年来的研究发现,网络流量即使在流 量突变时也呈现出一定的变化规律,这使得对网络流量序列进行分析、预测成为可能。
[0003] 目前一些研究成果将网络流量看作线性模型的,分别采用自回归滑动平 均(ARMA)模型(参见 Laner M,Svoboda P,Rupp M. Parsimonious fitting of long-range dependent network traffic using ARMA models[J]. IEEE Communications Letters, 2013, 17 (12) : 2368-2371)、差分自回归滑动平均(ARIMA)模型(参见 Yadav R K, Balakrishnan M. Comparative evaluation of ARIMA and ANFIS for modeling of wireless network traffic time series[J] · Eurasip Journal on Wireless Communications and Networking, 2014 (1) : 15),以及差分自回归求和滑动平均(FARIMA) 模型(参见董春玲.一种结合DWT和FARIMA的网络拥塞控制机制[J].小型微型计算机系 统,2011,32 (5) :931-934)等线性模型进行预测。但是随着网络复杂度的增加,网络流量特 性已经超出传统意义上认为的泊松或者马尔可夫分布了,因此利用线性模型进行预测存在 理论上的不足,很难保证预测的精确性。而非线性模型的预测主要包括了支持向量机(参 见 Liao ff J, Balzen Z.LSSVM network flow prediction based on the self-adaptive genetic algorithm optimization[J]. Journal of Networks, 2013,8 (2):507-512)、 人工神经网络(参见 Wang J S, Wang J K, Zhang Μ Z. Prediction of internet traffic based on Elman neural network[C]//Chinese Control and Decision Conference, 2009:1248-1252)以及灰色模型(参见孙韩林,金跃辉,崔毅东等.粗粒度网 络流量的灰色模型预测[J].北京邮电大学学报,2010, 33(1) :7-11)等,虽然非线性模型的 预测精度较线性模型有了一定程度的提高,但是神经网络存在易陷于局部最优值、网络结 构难以确定的缺点。支持向量机虽然需要样本数小,但是其关键参数很难确定.而灰色模 型只适合数据变化不是剧烈的情况下,因此网络流量的非线性模型预测也很难保证预测的 精度。

【发明内容】

[0004] 本发明提供了网络流量的一种混合预测方法,即基于ELM与ARIMA混合模型的网 络流量预测方法,其目的是解决以往所存在的问题。
[0005] 技术方案:
[0006] 网络流量的一种混合预测方法,其特征在于:该方法通过对网络流量序列自相似 性分析,提出一种ARIMA补偿ELM的网络流量预测方法,即差分自回归移动平均模型补偿极 限学习机的网络流量预测方法;首先利用ELM对网络流量序列进行预测,然后对网络流量 预测的误差序列通过ARIMA模型进行修正,最后将ELM预测值与ARIMA模型修正值进行叠 加得到最终的预测值。
[0007] 该方法对网络流量数据进行Hurst参数分析可知原始网络流量具有长相关性,因 此利用ELM对网络流量数据进行拟合,而通过对ELM预测值与网络流量实际值之间的误差 序列的Hurst参数分析可知误差序列具有短相关,因此利用ARIMA模型对预测误差数据进 行拟合,将ELM的预测值与ARIMA预测的残差进行叠加得到最终的预测值,通过ARIMA模型 进行残差补偿来有效提高预测的精度。
[0008] 本发明的预测方法为如下步骤:
[0009] 步骤1 :采集网络流量数据,将网络流量数据分为训练集以及测试集,训练集用于 ELM与ARIMA预测模型的建立,测试集用于预测模型预测精度的验证,同时由于网络流量变 化范围比较大,因此需要将网络流量序列进行归一化,预测结果则需要反归一化处理,恢复 真实预测值;
[0010] 步骤2:利用训练样本序列进行ELM预测模型的训练,采用实验的方法确定网络流 量的嵌入维数m也即ELM输入层数,通过实际值与ELM预测值的误差均方根值确定合适的 嵌入维数m;
[0011] 步骤3:将原始网络流量序列减去ELM模型预测值得到网络流量的误差序列,利用 该误差序列进行ARIMA模型的训练,首先对网络流量误差序列进行差分处理,当序列平稳 时可确定差分次数参数d,然后计算平稳的序列的自相关函数ACF与偏相关函数PAC,结合 AIC准则确定最佳的预测模型参数p、d、q,完成ARIMA预测模型的建立;
[0012] 步骤4 :当ELM与ARIMA预测模型确定后,利用ELM模型预测未来时刻的网络流量 值,利用ARIMA模型预测流量的误差值,将二者相加得到最终的预测值;
[0013] 步骤5 :通过滑动窗口机制,利用当前时刻实测流量值更新流量与流量误差序列, 将最旧的一组数移除,形成新的预测输入数据,返回步骤4进行下一时刻的网络流量预测。
[0014] 步骤2中ELM预测过程如下:
[0015] 设网络流样本集为:
[0017] 式中:i为采样时刻,Sk为网络流量样本集,Di为用于预测的网络流量时间序列,也 艮P ELM的输入,ELM的输出,也即ELM预测的网络流量值。
[0018] 山为1时刻网络流量,m为嵌入维数,j为预测步长,一个包含L个隐层神经元函 数f( ·)的ELM回归模型可表示为
[0020] t# ELM的输出,k为训练样本的数量,a i为第i个神经元的输入权值,即α 1 =
[a u α ι2 · · · a J,β为连接第i个神经元的输出权值,b i为第i个神经元的偏差,L 为隐层神经元的个数,将上式写成矩阵形式
[0021] Hk0k= Tk
[0022] 式中仏为神经元矩阵,f( ·)为非线性映射函数
[0024] 求解上式可得输出权值,下式中:β k为神经元的输出权值矩阵,Η ,为神经元矩阵, Τ代表矩阵的转置,-1代表矩阵的求逆。
[0026] 由此训练后的ELM网络流量序列预测模型为
[0028] 其中DiS输入,t为ELM预测的下一时刻网络流量。
[0029] 步骤3中ARIMA预测过程如下:
[0030] 模型识别与定阶:
[0031] 平稳化网络流量时间序列后,首先计算原始序列的自相关函数ACF,偏相关函数 PAC,对于网络流量时间序列yt,有自协方差
[0033] 上式中,yt代表t时刻的网络流量,y t+k代表t+k时刻的网络流量,N为序列的长 度。
[0034] 自相关函数
[0036] 其中Yk代表上式定义的自协方差。
[0037] 偏相关函数为
[0039] 其中P 自相关函数,a kj为偏相关函数。可通过P k,α ^勺截尾性初步确定模型 的阶数。时间序列的参数辨识可通过最小二乘估计得到,即估计参数约,?,…為,病.為,···》鳥 使下式最小
[0040]
[0041] 上式中,0q为q阶滑动平均算子,为p阶自回归算子,z为后移算子,vd为后 向差分算子,N为序列长度,d为差分阶数,p为自回归系数,q为滑动平均系数。
[0042] 模型检验:
[0043] 对不同的p、d、q参数进行组合,通过AIC准则可得到最优的参数模型。AIC准则 即赤池信息量准则,其特点为"吝啬原理"的具体化,定义如下:
[0044] AIC = -21n L+2g
[0045] 其中In为自然对数值,L为模型的极大似然参数,g为模型的独立参数,AIC代表 AIC准则函数值。
[0046] 优点效果:
[0047] 从目前研究成果看,单一预测模型很难实现更准确地要求、预测误差比较大,因此 组合预测模型可弥补单独预测模型的缺点,可以更准确地描述网络流量的特性。通过对网 络流量序列的自相似性分析,本发明利用运算速度快、具有良好非线性预测能力的ELM进 行网络流量的预测,同时利用ARIMA模型对预测误差进行修正以提高预测精度。
[0048] Legend和Paxson指出网络流量具有自相似特征(参见Legend W E, Taqqu M S. On the self-similar nature of Ethernet traffic[J]. IEEE/ACM Trans on Networking, 1994, 2 (1) : 1-15),相似性可用Hurst参数H来衡量,当H = 0· 5时说明网络 流量序列是随机游动的,事件之间不相关,当H e [0, 0. 5)时说明序列是反持久性的,当 He [0.5, 1)时表示序列是持久性的,也即具有自相似性,Η越大则序列的自相似性越大。 因此Hurst参数越大说
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1