自适应的差分自回归移动平均模型的流量预测方法和系统的制作方法

文档序号:7755765阅读:213来源:国知局
专利名称:自适应的差分自回归移动平均模型的流量预测方法和系统的制作方法
技术领域
本发明涉及机房流量的实时监控技术,尤其是利用差分自回归移动平均模型 (Auto Regressive Integrated Moving Average Model,简记为 ARIMA 模型)对流量进行预测的方法和系统。
背景技术
ARIMA模型的基本思想是将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列。这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。ARIMA模型预测的基本程序如图1所示1.根据时间序列的散点图、自相关函数和偏自相关函数图以ACF单位根检验其方差、趋势及其季节性变化规律,对序列的平稳性进行识别。一般来讲,机房流量的时间序列都不是平稳序列。2.对非平稳序列进行平稳化处理。如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,如果数据存在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零。3.根据时间序列模型的识别规则,建立相应的模型。若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合AR模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合MA模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合ARIMA模型。4.进行参数估计,检验是否具有统计意义。5.进行假设检验,诊断残差序列是否为白噪声。6.利用已通过检验的模型进行预测分析。在监控机房流量并进行实时预测时,单纯地寻找一固定模型来进行预测并监控存在两个弊端一是随着时间的推移,数据的分布可能由于外在因素发生改变,故此时模型将不再适用;二是当模型监控到发生异常时,对于当前的异常数据属于脏数据不能带入模型进行拟合,此时也就不能进行预测分析下一时间段的流量值。

发明内容
本发明的目的在于解决上述问题,提供了一种自适应的差分自回归移动平均模型的流量预测方法,一方面对模型进行改进,通过数据本身的特点进行实时的模型修正,可使得模型能够吻合当前的数据特性;另一方面,可通过启动备选方案根据数据本身的特点进行预测分析,监控流量的情况,待数据正常时,再次启动ARIMA模型进行预测分析并监控流量。本发明的另一目的在于提供了一种自适应的差分自回归移动平均模型的流量预测系统,一方面对模型进行改进,通过数据本身的特点进行实时的模型修正,可使得模型能够吻合当前的数据特性;另一方面,可通过启动备选方案根据数据本身的特点进行预测分析,监控流量的情况,待数据正常时,再次启动ARIMA模型进行预测分析并监控流量。本发明的技术方案为本发明揭示了一种自适应的差分自回归移动平均模型的流量预测方法,包括步骤1 通过历史数据的学习,获得初始的差分自回归移动平均ARIMA模型;步骤2 将当前时刻的前m个数据点代入所述ARIMA模型中进行计算,预测出下η 个时刻的流量值及其置信区间,其中m和η均为自然数且!11 > η ;步骤3 判断实际的流量值是否位于预测的所述置信区间内,如果不在所述置信区间内,则进行步骤4,如果位于所述置信区间内,则进行步骤5 ;步骤4:启动备选方案替代所述ARIMA模型,判别当前时刻的实际的流量值与前一时刻的流量值之差的绝对值是否超过一临界值,若超过则报警;步骤5 利用当前时刻的预测值与前一时刻实际的流量值进行比较,若两者之差的绝对值大于所述临界值,则启动所述ARIMA模型的再学习以修改所述ARIMA模型的参数。根据本发明的自适应的差分自回归移动平均模型的流量预测方法的一实施例,在步骤4中,若当前时刻的实际的流量值与前一时刻的流量值之差的绝对值未超过所述预设的临界值,则记录无报警的次数,待连续m个时间点无报警时,提示是否继续进行所述 ARIMA模型的预测。根据本发明的自适应的差分自回归移动平均模型的流量预测方法的一实施例,在步骤4中,在启动备选方案后,将m个时间点的位于所述置信区间内的流量值导入,根据所导入的所述流量值,基于其差分后的数据满足正态分布,计算其均值和标准差,计算出发生小概率事件ρ的所述临界值,其中参数ρ是指事件发生的概率。本发明还揭示了一种自适应的差分自回归移动平均模型的流量预测系统,包括初始模型获取装置,通过历史数据的学习,获得初始的差分自回归移动平均ARIMA 模型;置信区间预测装置,将当前时刻的前m个数据点代入所述ARIMA模型中进行计算, 预测出下η个时刻的流量值及其置信区间,其中m和η均为自然数且m > η ;偏离检测装置,判断实际的流量值是否位于预测的所述置信区间内,如果不在所述置信区间内,则进入备选方案运行装置,如果位于所述置信区间内,则进入模型参数校验
装置;备选方案运行装置,启动备选方案替代所述ARIMA模型,判别当前时刻的实际的流量值与前一时刻的流量值之差的绝对值是否超过一临界值,若超过则报警;模型参数校验装置,利用当前时刻的预测值与前一时刻实际的流量值进行比较, 若两者之差的绝对值大于所述临界值,则启动所述ARIMA模型的再学习以修改所述ARIMA 模型的参数。根据本发明的自适应的差分自回归移动平均模型的流量预测系统的一实施例,在备选方案运行装置中,若当前时刻的实际的流量值与前一时刻的流量值之差的绝对值未超过所述预设的临界值,则记录无报警的次数,待连续m个时间点无报警时,提示是否继续进行所述ARIMA模型的预测。根据本发明的自适应的差分自回归移动平均模型的流量预测系统的一实施例,在备选方案运行装置中,在启动备选方案后,将m个时间点的位于所述置信区间内的流量值导入,根据所导入的所述流量值,基于其差分后的数据满足正态分布,计算其均值和标准差,计算出发生小概率事件P的所述临界值,其中参数P是指事件发生的概率。本发明对比现有技术有如下的有益效果本发明的方案是利用ARIMA模型对流量进行预测,当实际值偏离预测的置信区间时,产生报警;产生报警的同时,启动备选方案来进行监控流量数据,用以防止异常数据进入ARIMA模型预测;在ARIMA模型正常运作时,实时判别ARIMA模型的参数是否还适用,若发现不再适用时,自动进行再学习,通过再学习获得新的模型参数,以此提高模型预测的准确性。对比现有技术,本发明是针对传统的ARIMA 模型存在的两个弊端进行的模型无法实时进行学习及无法自动排除脏数据,改进后自适应的差分自回归移动平均模型的流量预测方法主要是通过实时的模型自学习,让模型更加的吻合当前流量的数据走势,同时,当出现异常时,可根据数据本身的特性,替代ARIMA模型进行流量监控,从而不将异常数据放入ARIMA模型中进行数据拟合。对比传统的模型,本发明可以做到实时自学习,可以在尽可能不增加机器负载的情况下,当模型出现偏差时,立即启动自学习,使得模型更好地拟合当前的数据走势。备选方案是在模型监控到异常数据时,可通过启动备选方案代替模型进行监控,此时异常数据也就不进入模型,待数据回复正常时,正常数据带入模型继续进行预测并监控流量。


图1示出了用ARIMA模型进行预测的流程图。图2示出了本发明的自适应的差分自回归移动平均模型的流量预测方法的实施例的流程图。图3示出了本发明的启动备选方案后的流程示意图。图4示出了本发明的自适应的差分自回归移动平均模型的流量预测系统的实施例的原理图。
具体实施例方式下面结合附图和实施例对本发明作进一步的描述。自i舌应的差分自回15 云力平均樽型的流予页测丨方法的实施例图2示出了本发明的自适应的差分自回归移动平均模型的流量预测方法的实施例的流程。请参见图2,下面是对本实施例的方法中的各个步骤的详细描述。步骤SlOO 通过历史数据的学习,获得初始的差分自回归移动平均ARIMA模型。ARIMA是一种典型的时间序列分析算法,通过历史数据带入模型进行学习,确定模型的参数。对历史数据进行学习是为了确定模型的参数以便于后续实时数据可直接带入有确定参数的ARIMA直接计算,而不需再次去拟合数据计算及确认参数。获得初始ARIMA模型的过程是现有技术,在此不在赘述。步骤SlOl 将当前时刻的前m个数据点代入ARIMA模型中进行计算,其中m为自然数。步骤S102 预测出下η个时刻的流量值及其置信区间,其中η为自然数且111 > η。步骤S103 判断实际的流量值是否位于预测的所述置信区间内,如果不在置信区间内,则判断为异常点,进行步骤S106,如果位于置信区间内,则进行步骤S104。步骤S104 判断当前时刻的预测值与前一时刻实际的流量值的差的绝对值是否超过临界值,如果超过则进入步骤S105。对历史流量作差分,得到一差分序列,发现其满足均值为0的正态分布,故计算其 95%的置信区间(这里可假设95%的置信区间为[_b,b]),从而得到这一临界值b。步骤S105 启动ARIMA模型的再学习,修改ARIMA模型的参数。步骤S106 启动备选方案代替ARIMA模型。备选方案的主要思想是通过对数据特性的分析,发现对机房流量数据做差分后, 其差分后的数据分布近似于正态分布,此时可根据概率论,进行步骤S107。启动备选方案的过程如图3所示,先将m个时间点的位于置信区间内的流量值导入,根据所导入的流量值,基于其差分后的数据满足正态分布,计算其均值和标准差,计算出发生小概率事件P的临界值,其中参数P是指事件发生的概率,一般设置为0. 1,0. 05或 0. 01。步骤S107 判别当前时刻的实际的流量值与前一时刻的流量值之差的绝对值是否大于临界值,若超过则进入步骤S108,如果没有超过则进入步骤S109。看参数是否合理,主要是通过观察其预测值和前一刻的实际值相减的绝对值是否超过了临界值b (也就是用了备选方案里面的临界值来检验模型参数的合理性),备选方案的精确性没有ARIMA高,其不能体现数据的周期性,波动性,趋势性。若大于临界值说明其发生了小概率事件,也就是说这一情况发生的概率小于概率P。步骤S108 报警,流程结束。步骤S109 记录无报警的次数,进入步骤S110。步骤SllO 待连续m个时间点无报警时,提示用户是否继续进行所述ARIMA模型的预测。如果用户选择继续预测则返回至步骤S100。自i舌应的差分图4示出了本发明的自适应的差分自回归移动平均模型的流量预测系统的实施例的原理。请参见图4,本实施例的系统包括初始模型获取装置10、置信区间预测装置11、 偏离预测装置12、备选方案运行装置13以及模型参数校验装置14。初始模型获取装置10通过历史数据的学习,获得初始的差分自回归移动平均 ARIMA模型。置信区间预测装置11将当前时刻的前m个数据点代入ARIMA模型中进行计算,预测出下η个时刻的流量值及其置信区间,其中m和η均为自然数且m > η。偏离检测装置12判断实际的流量值是否位于预测的置信区间内,如果不在置信区间内,则进入备选方案运行装置13,如果位于置信区间内,则进入模型参数校验装置14。备选方案运行装置13启动备选方案替代所述ARIMA模型,判别当前时刻的实际的流量值与前一时刻的流量值之差的绝对值是否超过一临界值,若超过则报警。在备选方案运行装置13中,在启动备选方案后,将m个时间点的位于所述置信区间内的流量值导入,根据所导入的所述流量值,基于其差分后的数据满足正态分布,计算其均值和标准差,计算出发生小概率事件P的临界值,其中参数P是指事件发生的概率。若当前时刻的实际的流量值与前一时刻的流量值之差的绝对值未超过预设的临界值,则记录无报警的次数,待连续m个时间点无报警时,提示是否继续进行所述ARIMA模型的预测。模型参数校验装置14检查ARIMA模型的参数是否合理,是否吻合当前的数据特性。即,利用当前时刻的预测值与前一时刻实际的流量值进行比较,若两者之差的绝对值大于临界值,则启动ARIMA模型的再学习,修改ARIMA模型的参数。上述实施例是提供给本领域普通技术人员来实现和使用本发明的,本领域普通技术人员可在不脱离本发明的发明思想的情况下,对上述实施例做出种种修改或变化,因而本发明的发明范围并不被上述实施例所限,而应该是符合权利要求书所提到的创新性特征的最大范围。
权利要求
1.一种自适应的差分自回归移动平均模型的流量预测方法,包括步骤1 通过历史数据的学习,获得初始的差分自回归移动平均ARIMA模型;步骤2 将当前时刻的前m个数据点代入所述ARIMA模型中进行计算,预测出下η个时刻的流量值及其置信区间,其中m和η均为自然数且m > η ;步骤3 判断实际的流量值是否位于预测的所述置信区间内,如果不在所述置信区间内,则进行步骤4,如果位于所述置信区间内,则进行步骤5 ;步骤4 启动备选方案替代所述ARIMA模型,判别当前时刻的实际的流量值与前一时刻的流量值之差的绝对值是否超过一临界值,若超过则报警;步骤5:利用当前时刻的预测值与前一时刻实际的流量值进行比较,若两者之差的绝对值大于所述临界值,则启动所述ARIMA模型的再学习以修改所述ARIMA模型的参数。
2.根据权利要求1所述的自适应的差分自回归移动平均模型的流量预测方法,其特征在于,在步骤4中,若当前时刻的实际的流量值与前一时刻的流量值之差的绝对值未超过所述预设的临界值,则记录无报警的次数,待连续m个时间点无报警时,提示是否继续进行所述ARIMA模型的预测。
3.根据权利要求1所述的自适应的差分自回归移动平均模型的流量预测方法,其特征在于,在步骤4中,在启动备选方案后,将m个时间点的位于所述置信区间内的流量值导入, 根据所导入的所述流量值,基于其差分后的数据满足正态分布,计算其均值和标准差,计算出发生小概率事件P的所述临界值,其中参数P是指事件发生的概率。
4.一种自适应的差分自回归移动平均模型的流量预测系统,包括初始模型获取装置,通过历史数据的学习,获得初始的差分自回归移动平均ARIMA模型;置信区间预测装置,将当前时刻的前m个数据点代入所述ARIMA模型中进行计算,预测出下η个时刻的流量值及其置信区间,其中m和η均为自然数且m > η ;偏离检测装置,判断实际的流量值是否位于预测的所述置信区间内,如果不在所述置信区间内,则进入备选方案运行装置,如果位于所述置信区间内,则进入模型参数校验装置;备选方案运行装置,启动备选方案替代所述ARIMA模型,判别当前时刻的实际的流量值与前一时刻的流量值之差的绝对值是否超过一临界值,若超过则报警;模型参数校验装置,利用当前时刻的预测值与前一时刻实际的流量值进行比较,若两者之差的绝对值大于所述临界值,则启动所述ARIMA模型的再学习以修改所述ARIMA模型的参数。
5.根据权利要求4所述的自适应的差分自回归移动平均模型的流量预测系统,其特征在于,在备选方案运行装置中,若当前时刻的实际的流量值与前一时刻的流量值之差的绝对值未超过所述预设的临界值,则记录无报警的次数,待连续m个时间点无报警时,提示是否继续进行所述ARIMA模型的预测。
6.根据权利要求4所述的自适应的差分自回归移动平均模型的流量预测系统,其特征在于,在备选方案运行装置中,在启动备选方案后,将m个时间点的位于所述置信区间内的流量值导入,根据所导入的所述流量值,基于其差分后的数据满足正态分布,计算其均值和标准差,计算出发生小概率事件P的所述临界值,其中参数P是指事件发生的概率。
全文摘要
本发明公开了自适应的差分自回归移动平均模型的流量预测方法和系统,让模型更加的吻合当前流量的数据走势。其技术方案为利用ARIMA模型对流量进行预测,当实际值偏离预测的置信区间时,产生报警;产生报警的同时,启动备选方案来进行监控流量数据,用以防止异常数据进入ARIMA模型预测;在ARIMA模型正常运作时,实时判别ARIMA模型的参数是否还适用,若发现不再适用时,自动进行再学习,通过再学习获得新的模型参数,以此提高模型预测的准确性。
文档编号H04L12/26GK102355381SQ20111023761
公开日2012年2月15日 申请日期2011年8月18日 优先权日2011年8月18日
发明者刘成彦, 洪珂, 洪远芳 申请人:网宿科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1