基于信号分解和周期特性的网络流量特征指标预测方法与流程

文档序号:19814306发布日期:2020-01-31 18:52阅读:879来源:国知局
基于信号分解和周期特性的网络流量特征指标预测方法与流程
本发明涉及计算机网络
技术领域
,更具体地说,涉及一种基于信号分解和周期特性的网络流量特征指标预测方法。
背景技术
:随着internet的不断发展,网络规模日益扩大,其承载的网络业务逐渐增多,网络中的流量流向、运行状态已成为人们越来越关心的问题。网络流量特征指标是描述和刻画网络流量流向和运行状态的重要途径,自从netflow标准出现以来,国内外研究机构从流量中提取若干特征指标,用于分析网络流量特征,这些特征指标包括但不限于:流量大小、报文数量、主机数量、会话数量、访问次数等等。对这些特征指标进行分析和预测,不仅仅能够对网络运行状况进行评估和分析,还能对网络用户的行为模式、活动趋势、网络性能、网络安全进行趋势预测。因此,对网络流量特征指标进行准确预测,是网络运行管理和态势分析的重要基础。根据所提取到的流量特征指标历史数据,通过建立适当的预测模型,对将来的流量特征指标值进行预测。由预测的结果,可以得到将来流量的大致趋势,可广泛应用于安全、性能、故障、行为等分析领域。网络流量特征指标的历史数据可在数学上描述为具有非线性非平稳的时间序列。对网络流量特征指标的预测就是对该时间序列的预测。常用预测方法大致分为三类:(1)传统时间序列预测方法,如移动平均、指数平滑、趋势外推、季节指数预测、arma模型、马尔科夫模型等;(2)基于回归分析的预测方法,如线性回归、非线性回归、logistic回归、岭回归、主成分回归等;(3)基于机器学习(machinelearning)的预测方法,机器学习算法能够通过不同的模型处理复杂的数据,使得其预测或者分类达到较高的精度,其中人工神经网络(artificialneuralnetworks,ann)和支持向量机(supportvectormachines,svm)被广泛应用于预测模型中;(4)基于数字信号处理的预测方法,如利用傅里叶变换(fouriertransform)和小波变换(wavelettransform)等方法将原始时间序列信号分解为多个时间序列分量,并分别在各个分量中应用传统预测方法,最后加以合并,该预测方法能够对流量特征指标中的独立成分进行分解预测,提升了预测的精度和对流量不同周期性特征的适应能力。上述方法存在各自的弱点:传统时间序列预测方法、基于回归分析的预测方法准较为老旧、准确率低,不能满足复杂数据预测需求;基于机器学习的预测方法能够适应复杂数据,精度较高,但预测过程时间、空间复杂度高,开销过大;基于数字信号处理的预测方法也存在计算复杂度高、自适应能力不足的问题。在实际应用中,骨干网络流量具有很强的实时性、规模性、复杂性、非平稳性、周期性,网络流量的特征指标预测过程要求算法能够满足非线性、非平稳、周期性强、实时性强、复杂度低等网络流量特征实时预测需求。而现有方法均难以同时满足上述需求。技术实现要素:基于现有方法的不足之处,本发明提出一种基于信号分解和周期特性的网络流量特征指标预测方法,目的是提供一种计算复杂度低、准确率高、自适应能力强的预测机制。经验模态分解(empiricalmodedecomposition,emd)作为一种相对较新的数字信号分析方法,是一种将时间序列数据中周期性成分进行分离的工具,能够广泛的应用于波动信号,将其应用于处理非线性、非平稳数据具有独特的优势。为了解决上述现有技术中存在的问题,本发明是通过下述技术方案实现的:一种基于信号分解和周期特性的网络流量特征指标预测方法,其特征在于:包括以下步骤:信号分解步骤:使用emd信号分解算法,对网络流量特征指标时间序列进行经验模态分解,得到多个分量和一个残余项;周期计算步骤:计算各个分量的周期,利用快速傅里叶变换计算每个分量各自的周期;分量预测步骤:对各个分量进行单独的预测,根据每个分量的周期,对分量中周期点进行重新采样,形成新的采样时间序列,并针对该采样时间序列开展回归预测,最后使用回归方法对残余项进行预测;结果输出步骤:对各分量的预测输出以及残余项输出进行逐项求和,得到最终预测结果。所述信号分解步骤中,使用emd信号分解算法,对网络流量指标时间序列进行经验模态分析,将其按频率高低分解为多个分量。所述周期计算步骤中,利用快速傅里叶变换计算每个信号分量imfi的信号周期ti和比重,而对残余项rm不做周期分析。所述分量预测步骤具体包括:步骤a:根据某个分量imfi的周期ti,对imfi分量中的周期点进行重新采样,形成新的采样时间序列;步骤b:针对新的采样时间序列开展回归预测,从而得到该分量的预测输出outputi;步骤c:针对所有imf分量的预测全部完成后,最后使用回归方法对残余项rm进行预测,获得rm的预测输出output_r。所述结果输出步骤:对各分量的预测输出outputi以及残余项预测输出output_r进行逐项求和得到最终预测结果result。所述分量预测步骤中,回归预测具体是指,根据需要预测的未来时刻t,从imfi中依次选取该分量历史数据中的周期点成员,即距离时刻点t的时间距离为ti整数倍的成员,组成新的时间序列,然后针对未来一段时间所有时刻点,重复上述预测过程,得到针对未来一段时间内所有时刻点的预测结果,从而得到该分量的预测输出outputi。所述结果输出步骤中,求和过程为:将多个outputi以及output_r中相同时刻点的预测值进行分别累加,即将每个时刻点的不同分量预测结果进行累加运算,从而得到针对未来一段时间的最终预测结果时间序列result。本发明涉及相关专业名词定义及变量符号说明如下:表1相关专业名词定义表2变量符号表与现有技术相比,本发明所带来的有益的技术效果表现在:1、本发明组合应用数字信号处理领域的信号分解技术,以及信号周期分析、分量回归预测等技术,实现对网络流量特征指标时间序列的预测。本发明与其他方法最大的不同点在于:本发明不仅仅对各个分量进行预测,还基于各个分量的周期进行周期点的重新采样和预测,具备更强的流量周期性自适应能力。2、采用emd对网络流量进行预处理,将其按频率高低分解为多个imf分量,各分量蕴含不同的物理意义,具有各自不同的变化周期。相对于传统的数据预处理方法,emd能更好地适应网络流量数据非线性非平稳的特征,从而使分解得到的各分量更好地表征原始数据,具有更加明显的周期性。3、利用各个分量的周期特性,针对未来每个时刻点,对各个分量中的历史周期点进行重新采样,形成新的采样时间序列,并针对采样时间序列开展回归预测。该预测过程仅仅使用各个分量中的周期点作为预测依据,能够有效提升预测的准确率。附图说明图1为网络流量特征指标预测方法流程图;图2为网络流量特征指标emd分解示意图。具体实施方式下面结合说明书附图和具体实施例,对本发明的技术方案作出进一步详细地阐述。本发明的基于信号分解和周期特性的网络流量特征指标预测方法,如图1所示,包括如下步骤:步骤1:信号分解步骤:使用emd信号分解算法,对网络流量特征指标时间序列s(t)进行经验模态分解,得到m个imf分量和一个残余项rm。即采用emd方法对网络流量特征指标时间序列s(t)进行分解,分解结果如图2所示,图中tcpout-eemd-original0为待分解的原始时间序列,后续tcpout-eemd-imf1到tcpout-eemd-imf11为分解之后的各个imf分量,其中imf1为最高频的分量,其周期t最小;imf11为最低频的信号,其周期t最大,剩下的残余项为tcpout-eemd-r12,无明显周期特性。如果将各个分量与残余项进行叠加,即可还原出原始时间序列。步骤2:周期计算步骤:计算各个分量的周期。利用快速傅里叶变换(fft)计算每个imf分量各自的周期t,针对每个信号分量imfi,分别获得其信号周期ti。对残余项rm不做周期分析,这是由于rm没有明显的周期性。在本实施例中,各分量的信号周期t计算结果如下表3所示。分量周期timf13.17imf26.53imf313.80imf427.71imf555.00imf6127.08imf7567.00imf8921.37imf91638.00imf107371.00imf117371.00步骤3:分量预测步骤:各个分量的单独预测。根据某个分量imfi的周期ti对imfi分量中的周期点进行重新采样,形成新的采样时间序列,并针对采样时间序列开展回归预测。首先根据需要预测的未来时刻点t,从imfi中依次选取该分量历史数据中的周期点成员(即:距离时刻点t的时间距离为ti整数倍的成员),组成成新的时间序列,然后对这个新的时间序列使用岭回归进行预测,得到针对未来时刻t的预测结果;然后针对未来一段时间所有时刻点,重复上述预测过程,得到针对未来一段时间内所有时刻点的预测结果,从而得到该分量的预测输出outputi。针对所有imf分量的预测全部完成后,最后使用回归方法对残余项rm进行预测,获得rm的预测输出output_r。步骤3的一个实施例:例如,要针对以前n天的某个分量的时间序列,预测后一天的该分量的时间序列,则需要依次对后一天的每个时刻进行预测,针对某个时刻点t,依次查找该分量前n天时间序列,取出时刻t以前,且与t的时间差为t的整数倍的历史数据,形成一个新的时间序列,针对这个新的时间序列,使用回归方法(包括但不限于岭回归等),对时刻t的分量进行预测。步骤3的另一个实施例:某个分量的时间周期正好是一天,如果要预测明天早上8点的某个分量值,则依次取出该分量历史数据中所有早上8点的数据,形成该时刻点的新时间序列,针对新时间序列采用回归方法完成分量预测。步骤3的又一个实施例:某个分量的时间周期是30分钟,如果要预测明天早上8点的某个分量值,则依次取出该分量历史数据中所有与明天早上8点相差30分钟整数倍的数据,形成新时间序列,针对新时间序列采用回归方法完成分量预测。步骤4:对各分量的预测输出outputi以及残余项预测输出output_r进行逐项求和得到最终预测结果result,求和过程为:将多个outputi以及output_r中相同时刻点的预测值进行分别累加,即:将每个时刻点的不同分量预测结果进行累加运算,从而得到针对未来一段时间的最终预测结果时间序列result。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1