基于模式匹配的分布式计算环境性能预测方法及系统的制作方法

文档序号:6620201阅读:173来源:国知局
基于模式匹配的分布式计算环境性能预测方法及系统的制作方法
【专利摘要】本发明涉及一种基于模式匹配的分布式计算环境性能预测方法及系统,通过采集服务器的性能数据,把当前性能数据模式与历史数据的数值一一对比以及当前的性能数据变化率模式与历史数据的变化率一一对比,从历史数据中找到相似的模式,从历史数据中找到相似模式截止时间点后的性能数据值作为预测结果或乘以权重加权作为预测结果,提高服务器对资源调度的准确性与可靠性,使得分布式计算环境下对处于不稳态情况的性能数据进行长期预测的预测效果更理想。
【专利说明】基于模式匹配的分布式计算环境性能预测方法及系统

【技术领域】
[0001]本发明涉及一种性能预测方法及系统,尤其涉及一种基于模式匹配的分布式计算环境性能预测方法及系统。

【背景技术】
[0002]随着计算机网络的迅速发展,各种服务器越来越难以满足用户的需求。负载均衡集群的出现,在一定程度上解决了这个问题。负载均衡算法作为影响负载均衡的三大要素之一,在很大程度上决定了负载均衡集群的性能。但由于当前的算法没有考虑到服务器的当前和将来的负载情况,很难做到真正的负载均衡。
[0003]在服务器的负载均衡中,需要采集系统中各种资源的相关信息以确定资源是否可用,然后调度算法根据资源的可用性、任务的运行时间等来确定任务的优先级并分配给它们可用的资源。然而随着任务的运行,各种资源的状态,如CPU负载、剩余内存、硬盘剩余空间等会随时发生改变,因此需要对CPU负载的预测来指导服务器的负载均衡与调度算法。
[0004]对性能数据的预测可以采取时间序列算法,也就是基于历史数据做出预测。该方法的简单步骤:1)按时间序列周期性地采集性能数据;2)基于这些历史数据,建立一个关于性能数据与时间变量之间的关系模型;3)采用这个模型来计算指定时间所对应的性能数据的值,并把该值作为性能数据的预测值。使用这种类型的模型,可以对性能数据进行预测,从而帮助调度程序更好地分配资源、管理任务,提高整个分布式系统的工作效率。
[0005]但是对性能数据采用时间序列的方法来进行预测,如通过时间序列自回归模型AR模型,滑动平均模型MA模型进行预测,这些模型主要对一些稳态的数据能够准确的进行预测,但是如果数据不是处于稳态情况,预测结果就不够理想,而且这些模型不能够很好的进行长期预测。


【发明内容】

[0006]本发明的目的在于提供一种基于模式匹配的分布式计算环境性能预测方法及系统,解决在分布式计算环境下对不处于稳态情况的性能数据进行长期预测不理想的问题。
[0007]为了解决上述问题,本发明涉及了一种基于模式匹配的分布式计算环境性能预测方法,包括以下步骤:
[0008]S1:取分布式计算环境中当前时间点h到过去时间点t^L这时间段内的性能数值作为当前性能数据模式,计算当前时间点以及当前时间点之前的所有时间点上的变化率,将时间h-L到h之间的变化率作为当前性能数据变化率模式;
[0009]S2:将当前性能数据模式与历史性能数据的每个时间点的数值一一对比,若有某一段长度为L的历史性能数据与当前性能数据模式的平均标准方差SDrap小于等于性能数据标准方差阈值,则该段历史性能数据为当前性能数据模式的相似模式;
[0010]S3:再将当前性能数据变化率模式与历史性能数据的变化率一一对比,若有某一段长度为L的历史性能数据的数值与当前性能数据模式的平均标准方差SDai大于性能数据标准方差阈值且小于等于标准方差宽限值,且当前性能数据变化率模式与此段历史性能数据的变化率的平均标准方差小于等于变化率标准方差阈值,则该段历史性能数据为当前性能数据模式的相似模式;
[0011]S4:将S2与S3中得到的相似模式的截止时间点后续时间的性能数据数值,或S2与S3中得到的相似模式的截止时间点后续时间的性能数据数值乘以相应的权重作为预测值。
[0012]较佳地,SI中设定每个时间点上的变化率为:
V-V
[0013]CR(t.)=」^ * 100%
Vt +b


11-1
[0014]i = O, I,…,n,式中K,为&时刻的性能数据数值;匕一为ti_l时刻的性能数据数值,b为小于等于0.01的常数;
[0015]且设定性能数据的历史数据中的第一个点的变化率CR(O) = I。
[0016]较佳地,S4中还包括:
[0017]S41:按当前性能数据模式的相似模式中SDeup与SDai之和由大到小对所得到的相似模式进行排序,将当前性能数据模式的相似模式中SDeup与SDai之和最小的一段历史性能数据作为当前性能数据模式的最相似模式;
[0018]S42:当最相似模式截止时间点与当前时间点之间的间隔大于预测时长时,将最相似模式截止时间点后的数据作为当前性能数据模式的未来预测数值;
[0019]当最相似模式截止时间点与当前时间点之间的间隔小于预测时长时,将最相似模式截止时间点与当前时间点时间点之间的数值作为接下来的预测值,依次选择排列在最相似模式后的相似模式的截止时间点后的数值作为后续预测值,直至获得所有为当前性能数据模式的未来预测数值。
[0020]较佳地,S4中还包括:






η
[0021]设定所有相似模式对应的权重ai使得= Σ % * pCPuiti)其中P (t )为距当前性能数据模式的第i个相似模式,其中ti为第i个相似模式的截止时间点,i = O时,Potj (O表示当前性能数据模式,i = 0,1,…,η ; a i为Pmj (tj所对应的权重,a j随着i值增大而增大;
[0022]依次遍历所有相似模式,对与截止时间点与当前时间点之间的间隔大于预测时长的相似模式,对这些相似模式截止时间点之后的npMdic;t个时间点上的数值依次乘以其所在相似模式的权重作为这些相似模式的预测分量;
[0023]对于截止时间点与当前时间点之间的间隔小于预测时长的相似模式,对这些相似模式截止时间点之后到当前时间点之间的数值依次乘以其所在相似模式的权重作为这些相似模式的预测分量;
[0024]将所有相似模式的预测分量按其所在相似模式的截止时间点的距离进行叠加,并将叠加结果按距离其所在相似模式的截止时间点的距离由小到大排列,作为当前性能数据模式的未来预测数值。
[0025]为了解决上述问题,本发明还涉及了一种基于模式匹配的分布式计算环境性能预测系统,包括:
[0026]数据模式生成模块,取分布式计算环境中当前时间点h到过去时间点t^L这时间段内的性能数值作为当前性能数据模式,计算当前时间点以及当前时间点之前的所有时间点上的变化率,将时间h-L到h之间的变化率作为当前的性能数据变化率模式;
[0027]第一相似模式判别模块,与数据模式生成模块相连,将当前性能数据模式与历史性能数据的每个时间点的数值一一对比,若有某一段长度为L的历史性能数据与当前性能数据模式的平均标准方差SDrap小于等于性能数据标准方差阈值,则该段历史性能数据为当前性能数据模式的相似模式;
[0028]第二相似模式判别模块,再将当前性能数据变化率模式与历史性能数据的变化率一一对比,若有某一段长度为L的历史性能数据的数值与当前性能数据模式的平均标准方差SDai大于性能数据标准方差阈值且小于等于标准方差宽限值,且当前性能数据变化率模式与此段历史性能数据的变化率的平均标准方差小于等于变化率标准方差阈值,则该段历史性能数据为当前性能数据模式的相似模式;以及预测模块,将第一相似模式判别模块与第二相似模式判别模块中得到的相似模式的截止时间点后续时间的性能数据数值,或第一相似模式判别模块与第二相似模式判别模块中得到的相似模式的截止时间点后续时间的性能数据数值乘以相应的权重作为预测值。
[0029]较佳地,所述数据模式生成模块中设定每个时间点上的变化率为:
V-V
[0030]CRiti)=』^ * 100%
r Vt +b


H-1
[0031]i = O, I,…,n,式中K为ti时刻的性能数据数值;I1为t1-Ι时刻的性能数据数值,b为小于等于0.01的常数;
[0032]且设定性能数据的历史数据中的第一个点的变化率CR(O) = I。
[0033]较佳地,预测模块中还包括:
[0034]相似模式排序模块,与第一相似模式判别模块和第一相似模式判别模块相连,按当前性能数据模式的相似模式中SDeup与SDra之和由大到小对所得到的相似模式进行排序,将当前性能数据模式的相似模式中SDeup与SDai之和最小的一段历史性能数据作为当前性能数据模式的最相似模式;以及
[0035]预测值排序模块:与相似模式排序模块的输出端相连接,当最相似模式截止时间点与当前时间点之间的间隔大于预测时长时,将最相似模式截止时间点后的数据作为当前性能数据模式的未来预测数值;当最相似模式截止时间点与当前时间点之间的间隔小于预测时长时,将最相似模式截止时间点与当前时间点之间的数值作为接下来的预测值,依次选择排列在最相似模式后的相似模式的截止时间点后的数值作为后续预测值,直至获得所有为当前性能数据模式的未来预测数值。
[0036]较佳地,预测模块中还包括:
[0037]权重生成模块,设定所有相似模式对应的权重a i使得
[0038]

【权利要求】
1.一种基于模式匹配的分布式计算环境性能预测方法,其特征在于,包括以下步骤: 51:取分布式计算环境中当前时间点h到过去时间点h-L这时间段内的性能数值作为当前性能数据模式,计算当前时间点以及当前时间点之前的所有时间点上的变化率,将时间h-L到h之间的变化率作为当前性能数据变化率模式; 52:将当前性能数据模式与历史性能数据的每个时间点的数值一一对比,若有某一段长度为L的历史性能数据与当前性能数据模式的平均标准方差SDrap小于等于性能数据标准方差阈值,则该段历史性能数据为当前性能数据模式的相似模式; 53:再将当前性能数据变化率模式与历史性能数据的变化率一一对比,若有某一段长度为L的历史性能数据的数值与当前性能数据模式的平均标准方差SDai大于性能数据标准方差阈值且小于等于标准方差宽限值,且当前性能数据变化率模式与此段历史性能数据的变化率的平均标准方差小于等于变化率标准方差阈值,则该段历史性能数据为当前性能数据模式的相似模式; S4:将S2与S3中得到的相似模式的截止时间点后续时间的性能数据数值,或S2与S3中得到的相似模式的截止时间点后续时间的性能数据数值乘以相应的权重作为预测值。
2.如权利要求1所述的一种基于模式匹配的分布式计算环境性能预测方法,其特征在于,SI中设定每个时间点上的变化率为:
V-V CR(t) = ]^*100%
1 Vt +b

H-1 i = 0,1,一,n,式中P力h时刻的性能数据数值V为'-1时刻的性能数据数值,b为小于等于0.01的常数; 且设定性能数据的历史数据中的第一个点的变化率CR(O) = I。
3.如权利要求1或2所述的一种基于模式匹配的分布式计算环境性能预测方法,其特征在于,S4中还包括: 541:按当前性能数据模式的相似模式中SDeup与SDai之和由大到小对所得到的相似模式进行排序,将当前性能数据模式的相似模式中SDeup与SDai和最小的一段历史性能数据作为当前性能数据模式的最相似模式; 542:当最相似模式截止时间点与当前时间点之间的间隔大于预测时长时,将最相似模式截止时间点后的数据作为当前性能数据模式的未来预测数值; 当最相似模式截止时间点与当前时间点之间的间隔小于预测时长时,将最相似模式截止时间点与当前时间点时间点之间的数值作为接下来的预测值,依次选择排列在最相似模式后的相似模式的截止时间点后的数值作为后续预测值,直至获得所有为当前性能数据模式的未来预测数值。
4.如权利要求1或2所述的一种基于模式匹配的分布式计算环境性能预测方法,其特征在于,S4中还包括: 设定所有相似模式对应的权重a i使得,-(tO) = Ta^其中Pmi(ti)为距当







,前性能数据模式的第i个相似模式,其中ti为第i个相似模式的截止时间点,i = O时,Pcpu(t0)表示当前性能数据模式,i = 0,1,…,η ; a i为Pepu(ti)所对应的权重,a i随着i值增大而增大; 依次遍历所有相似模式,对与截止时间点与当前时间点之间的间隔大于预测时长的相似模式,对这些相似模式截止时间点之后的npralic;t个时间点上的数值依次乘以其所在相似模式的权重作为这些相似模式的预测分量; 对于截止时间点与当前时间点之间的间隔小于预测时长的相似模式,对这些相似模式截止时间点之后到当前时间点之间的数值依次乘以其所在相似模式的权重作为这些相似模式的预测分量; 将所有相似模式的预测分量按其所在相似模式的截止时间点的距离进行叠加,并将叠加结果按距离其所在相似模式的截止时间点的距离由小到大排列,作为当前性能数据模式的未来预测数值。
5.一种基于模式匹配的分布式计算环境性能预测系统,其特征在于,包括: 数据模式生成模块,取分布式计算环境中当前时间点h到过去时间点t^L这时间段内的性能数值作为当前性能数据模式,计算当前时间点以及当前时间点之前的所有时间点上的变化率,将时间h-L到h之间的变化率作为当前的性能数据变化率模式; 第一相似模式判别模块,与数据模式生成模块相连,将当前性能数据模式与历史性能数据的每个时间点的数值一一对比,若有某一段长度为L的历史性能数据与当前性能数据模式的平均标准方差SDrap小于等于性能数据标准方差阈值,则该段历史性能数据为当前性能数据模式的相似模式; 第二相似模式判别模块,再将当前性能数据变化率模式与历史性能数据的变化率一一对比,若有某一段长度为L的历史性能数据的数值与当前性能数据模式的平均标准方差SDai大于性能数据标准方差阈值且小于等于标准方差宽限值,且当前性能数据变化率模式与此段历史性能数据的变化率的平均标准方差小于等于变化率标准方差阈值,则该段历史性能数据为当前性能数据模式的相似模式;以及 预测模块,将第一相似模式判别模块与第二相似模式判别模块中得到的相似模式的截止时间点后续时间的性能数据数值,或第一相似模式判别模块与第二相似模式判别模块中得到的相似模式的截止时间点后续时间的性能数据数值乘以相应的权重作为预测值。
6.如权利要求5所述的一种基于模式匹配的分布式计算环境性能预测系统,其特征在于,所述数据模式生成模块中设定每个时间点上的变化率为:
i = O, 1,…,n,式中匕为&时刻的性能数据数值;^^为b-Ι时刻的性能数据数值,b为小于等于0.01的常数; 且设定性能数据的历史数据中的第一个点的变化率CR(O) = 1。
7.如权利要求5或6所述的一种基于模式匹配的分布式计算环境性能预测系统,其特征在于,预测模块中还包括: 相似模式排序模块,与第一相似模式判别模块和第一相似模式判别模块相连,按当前性能数据模式的相似模式中SDeup与SDai和由大到小对所得到的相似模式进行排序,将当前性能数据模式的相似模式中SDeup与SDai之和最小的一段历史性能数据作为当前性能数据模式的最相似模式;以及 预测值排序模块:与相似模式排序模块的输出端相连接,当最相似模式截止时间点与当前时间点之间的间隔大于预测时长时,将最相似模式截止时间点后的数据作为当前性能数据模式的未来预测数值;当最相似模式截止时间点与当前时间点之间的间隔小于预测时长时,将最相似模式截止时间点与当前时间点之间的数值作为接下来的预测值,依次选择排列在最相似模式后的相似模式的截止时间点后的数值作为后续预测值,直至获得所有为当前性能数据模式的未来预测数值。
8.如权利要求5或6所述的一种基于模式匹配的分布式计算环境性能预测系统,其特征在于,预测模块中还包括:







η 权重生成模块,设定所有相似模式对应的权重a i使得=其中
μ,Pcpu(ti)为距当前性能数据模式的第i个相似模式,其中ti为第i个相似模式的截止时间点,i = O Bi,Pcpu(t0)表示当前性能数据模式,i = O, 1,…,η ; a i为Potj(t)所对应的权重,ai随着i值增大而增大; 预测分量生成模块,与权重生成模块的输出端相连,依次遍历所有相似模式,对与截止时间点与当前时间点之间的间隔大于预测时长的相似模式,对这些相似模式截止时间点之后的npralic;t个时间点上的数值依次乘以其所在相似模式的权重作为这些相似模式的预测分量;对于截止时间点与当前时间点之间的间隔小于预测时长的相似模式,对这些相似模式截止时间点之后到当前时间点之间的数值依次乘以其所在相似模式的权重作为这些相似模式的预测分量;以及 预测分量叠加模块,将预测分量生成模块中得到的所有相似模式的预测分量按其所在相似模式的截止时间点的距离进行叠加,并将叠加结果按距离其所在相似模式的截止时间点的距离由小到大排列,作为当前性能数据模式的未来预测数值。
【文档编号】G06F9/50GK104135510SQ201410337251
【公开日】2014年11月5日 申请日期:2014年7月16日 优先权日:2014年7月16日
【发明者】曹健, 杨定裕, 梁建煌, 顾骅, 沈琪骏, 王烺 申请人:上海交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1