基于模式融合的cpu负载多步预测方法

文档序号：6545494阅读：789来源：国知局

基于模式融合的cpu负载多步预测方法
【专利摘要】一种基于模式融合的CPU负载多步预测方法，首先，把一个时间序列数据切分成多个数据模式的集合，统计各个数据模式的个数；之后对得到的所有模式与个数，设定一个过滤因子过滤一些不常出现的模式；然后，对于一些相差不大的模式，合并成一些通用的趋势模式，并根据这些通用的趋势模式进行匹配，匹配过程中采用汉明距离度量模式与模式之间的方向距离，使用欧几里得距离度量实际距离；找到一些近似模式后，采用平均规则策略或均匀下降策略根据这些模式的后面的值来进行多步预测；最后，采用多个模式长度来指导预测，并根据每个模式长度的预测值进行融合，采用Adaboost算法进行合成，得到最终结果。本发明具有准确性高、可靠性高的优点。
【专利说明】基于模式融合的CPU负载多步预测方法
【技术领域】
[0001]本发明涉及服务器CPU负载预测【技术领域】，具体涉及一种基于模式融合的CPU负载多步预测方法。
【背景技术】
[0002]在分布式系统中，可用的资源是随时间变化的，同时调度系统也需要做出相应的变化。由于地理上的分布情况，在现实中监控和采集资源的数据分布存在延迟，难以实时的获取当前的可用资源，因此通过性能预测能够方便资源管理与调度。
[0003]CPU负载的监控与预测是应用程序的成功运行的必要条件，CPU负载能够显示机器的性能状态。如果CPU负载过高，服务器的性能将会严重降低。高负荷的CPU负载的服务器异常状态会引起系统崩溃，有效地监控与预测CPU负载可以帮助管理员采取相应的对策，如关闭或重启应用程序，升级硬件等。
[0004]以往的研究证明CPU负载可以记录成一个时间序列数据，通过时间序列预测算法对CPU负载进行预测，但是这些模型不能有效的支持多步预测。多步预测比单步预测更具有挑战性，也更有意义。多步预测能够知道将来更长时间内CPU负载的趋势，能够给管理员和调度系统足够的时间去处理异常事件。
[0005]现有的多步预测方法是基于迭代单步预测，这种方法对步数较少的预测比较适用，但是如果步数较大，会出现预测结果偏移越来越大的问题。如前面几步预测结果已经出现误差，那么后面的预测将难以估计准确值。
[0006]近年来，在预测过程中，基于模式匹配的方式也有流行，它们是通过计算模式与模式之间的欧几里得距离来度量数据之间相似性。这种匹配方式过于拟合，无法估计模式的方向性或者趋势性，存在一定匹配误差，无法准确估计预测结果。

【发明内容】

[0007]本发明的目的在于提供一种基于模式融合的CPU负载多步预测方法，本发明提供了对服务器CPU负载进行长期预测的方法，该方法预测精度高，具有准确性高、可靠性高的优点。
[0008]为达到上述目的，本发明提供一种基于模式融合的CPU负载多步预测方法，包括以下步骤:
[0009]步骤1:模式抽取
[0010]把一个时间序列数据切分成多个数据模式的集合，并统计各个数据模式的个数；
[0011]步骤2:模式过滤
[0012]经过步骤I得到所有的模式与个数，过滤一些不常出现的模式，对这些模式统计，根据个数从大到小进行排序，给定一个过滤因子α，使过滤后的模式能够覆盖大部分模式；
[0013]步骤3:模式融合、匹配[0014]对于一些模式相差不大的模式，合并成一些通用的趋势模式，并根据这些通用的趋势模式进行匹配，在匹配过程中，采用汉明距离来度量模式与模式之间的方向距离，然后使用欧几里得距离来度量实际距离；
[0015]步骤4:模式加权预测
[0016]经过步骤3找到一些近似模式后，采用平均规则策略或均匀下降策略根据这些模式的后面的值来进行多步预测；
[0017]步骤5:预测结果融合
[0018]采用多个模式长度来指导预测，并根据每个模式长度的预测值进行融合，采用机器学习Adaboost算法进行合成，得到最终结果。
[0019]依照本发明较佳实施例所述的基于模式融合的CPU负载多步预测方法，步骤I中:
[0020]时间序列数据是一系列数据X1, X2, X3,…，Xn,这些数据之间存在有序性；
[0021]数据模式是给定一个时间序列数据，从时间序列数据中找打一个子序列Cp =Xp, xp+1,…，Xp^这个子序列在历史数据中经常出现。
[0022]依照本发明较佳实施例所述的基于模式融合的CPU负载多步预测方法，步骤2中，过滤因子α满足以下条件:
【权利要求】
1.一种基于模式融合的CPU负载多步预测方法，其特征在于，包括以下步骤: 步骤1:模式抽取把一个时间序列数据切分成多个数据模式的集合，并统计各个数据模式的个数；步骤2:模式过滤经过步骤I得到所有的模式与个数，过滤一些不常出现的模式，对这些模式统计，根据个数从大到小进行排序，给定一个过滤因子α，使过滤后的模式能够覆盖大部分模式；步骤3:模式融合、匹配对于一些模式相差不大的模式，合并成一些通用的趋势模式，并根据这些通用的趋势模式进行匹配，在匹配过程中，采用汉明距离来度量模式与模式之间的方向距离，然后使用欧几里得距离来度量实际距离；步骤4:模式加权预测经过步骤3找到一些近似模式后，采用平均规则策略或均匀下降策略根据这些模式的后面的值来进行多步预测；步骤5:预测结果融合采用多个模式长度来指导预测，并根据每个模式长度的预测值进行融合，采用机器学习Adaboost算法进行合成，得到最终结果。
2.根据权利要求1所述的基于模式融合的CPU负载多步预测方法，其特征在于，步骤I中: 所述时间序列数据是一系列数据X1, X2, X3,…，Xn，这些数据之间存在有序性；所述数据模式是给定一个时间序列数据，从时间序列数据中找打一个子序列Cp =Xp, xp+1,…，Xp^这个子序列在历史数据中经常出现。
3.根据权利要求2所述的基于模式融合的CPU负载多步预测方法，其特征在于，步骤2中，过滤因子α满足以下条件:
4.根据权利要求2所述的基于模式融合的CPU负载多步预测方法，其特征在于，步骤3中模式匹配包括以下步骤: 步骤31:趋势匹配通过度量汉明距离计算模式之间的趋势距离，采用参数λ来进行评估:
5.根据权利要求4所述的基于模式融合的CPU负载多步预测方法，其特征在于，步骤4中所述平均规则策略为:从历史中找到一些近似模式后，从这些近似模式后续值直接加权平均后作为预测的结果值，预测结果值如下:
6.根据权利要求4所述的基于模式融合的CPU负载多步预测方法，其特征在于，步骤4中所述均匀下降策略为:在分析过程中，发现数据的相关性随时间的长度而变化，有些最近的模式对预测的可信度更高，则采用对每个模式给一个权重作为预测的结果值，预测结果值如下:

7.根据权利要求5或6所述的基于模式融合的CPU负载多步预测方法，其特征在于，步骤5得到的最终结果为:

【文档编号】G06F9/50GK104021045SQ201410183205
【公开日】2014年9月3日申请日期:2014年5月4日优先权日:2014年5月4日
【发明者】曹健, 杨定裕, 顾骅, 沈琪骏, 王烺申请人:上海交通大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：曹健;杨定裕;顾骅;沈琪骏;王烺
技术所有人：上海交通大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。