基于回归方程的服务器扩容计算方法及装置与流程

文档序号:16246836发布日期:2018-12-11 23:39阅读:213来源:国知局
基于回归方程的服务器扩容计算方法及装置与流程

本发明涉及一种服务器扩容计算方法及装置,尤其是指一种基于回归方程的服务器扩容计算方法及装置。

背景技术

企业中的系统运维工作都会涉及服务器扩容,因为随着业务的发展,原有的服务器资源可能会不足以继续支撑起用户的访问,这时就会涉及到服务器扩容工作。在传统的运维概念中,并没有办法对服务器进行一个科学的扩容计算方法,而仅仅只是通过大致估算得到一个扩容结果,这样意味着评估的准确性基本靠经验,只有丰富经验的系统维护人员才能给出较准确的预估。

有鉴于此,为了能改善系统运维中服务器扩容的准确性,有必要提供一个能科学量化扩容需求的方案。



技术实现要素:

本发明所要解决的技术问题是:一种基于回归方程的服务器扩容计算方法及装置。

为了解决上述技术问题,本发明采用的技术方案为:一种基于回归方程的服务器扩容计算方法,包括训练流程及预测流程,所述预测流程包括步骤,

s10、从服务器上收集历史访问量数据以及对应的服务器cpu使用率数据;

s20、对历史访问量数据及对应的服务器cpu使用率数据进行预处理;

s30、将预处理后的历史访问量数据及对应的服务器cpu使用率数据输入一元多项方程训练模型进行训练;

s40、训练完成后,得到一元多项式方程待预测模型;

所述预测流程包括步骤,

s50、加载一元多项式方程待预测模型;

s60、将待预测的访问量数据输入一元多项式方程待预测模型;

s70、输出一元多项式方程待预测模型计算得到的容量预测结果。

优选地,所述步骤s30具体包括,

s31、将预处理后的历史访问量数据及对应的服务器cpu使用率数据通过一元三阶多项式方程进行回归分析;

s32、将预处理后的历史访问量数据及对应的服务器cpu使用率数据使用最小二乘法优化。

优选地,所述步骤s20具体包括,对历史访问量数据及对应的服务器cpu使用率数据进行去噪音、补充数据缺失值以及规范化数据格式。

优选地,所述步骤s10具体包括,

s11、以一固定的采样时间对历史访问量数据及对应的服务器cpu使用率数据进行采样;

s12、按时间顺序对历史访问量数据及对应的服务器cpu使用率数据进行排序。

优选地,步骤s11中的采样时间为30秒或1分钟。

为了解决上述技术问题,本发明采用的另一个技术方案为:一种基于回归方程的服务器扩容计算装置,包括训练子装置及预测子装置,所述预测子装置包括,

数据收集模块,用于从服务器上收集历史访问量数据以及对应的服务器cpu使用率数据;

数据预处理模块,用于对历史访问量数据及对应的服务器cpu使用率数据进行预处理;

数据训练模块,用于将预处理后的历史访问量数据及对应的服务器cpu使用率数据输入一元多项方程训练模型进行训练;

模型存储模块,用于训练完成后,得到一元多项式方程待预测模型,并将其进行存储;

所述预测子装置包括,

模型加载模块,用于加载一元多项式方程待预测模型;

数据预测模块,用于将待预测的访问量数据输入一元多项式方程待预测模型;

预测结果输出模块,用于输出一元多项式方程待预测模型计算得到的容量预测结果。

优选地,所述模型训练模块具体包括,

回归分析单元,用于将预处理后的历史访问量数据及对应的服务器cpu使用率数据通过一元三阶多项式方程进行回归分析;

数据优化单元,用于将预处理后的历史访问量数据及对应的服务器cpu使用率数据使用最小二乘法优化。

优选地,所述数据预处理模块具体用于,对历史访问量数据及对应的服务器cpu使用率数据进行去噪音、补充数据缺失值以及规范化数据格式。

优选地,所述数据收集模块具体包括,

数据采样单元,用于以一固定的采样时间对历史访问量数据及对应的服务器cpu使用率数据进行采样;

数据排序单元,用于按时间顺序对历史访问量数据及对应的服务器cpu使用率数据进行排序。

优选地,所述数据采样单元的采样时间为30秒或1分钟。

本技术方案通过回归方程实现服务器扩容大小的预测判断,它克服了传统运维中仅仅靠经验和直觉进行容量预测的缺点,本方法通过历史访问量数据及对应的服务器cpu使用率数据训练出一个预测模型,提供一个科学的有依据的扩容方案。

附图说明

下面结合附图详述本发明的具体结构。

图1为本发明的基于回归方程的服务器扩容计算方法流程框图;

图2为本发明的基于回归方程的服务器扩容计算装置的功能模块框图;

图3为本发明的服务器的cpu使用率与访问量关系图;

图4为本发明的历史访问量数据以及对应的服务器cpu使用率数据图。

具体实施方式

为详细说明本发明的技术内容、构造特征、所实现目的及效果,以下结合实施方式并配合附图详予说明。

请参阅图1,一种基于回归方程的服务器扩容计算方法,包括训练流程及预测流程,所述预测流程包括步骤,

s10、从服务器上收集历史访问量数据以及对应的服务器cpu使用率数据;

s20、对历史访问量数据及对应的服务器cpu使用率数据进行预处理;

s30、将预处理后的历史访问量数据及对应的服务器cpu使用率数据输入一元多项方程训练模型进行训练;

s40、训练完成后,得到一元多项式方程待预测模型;

所述预测流程包括步骤,

s50、加载一元多项式方程待预测模型;

s60、将待预测的访问量数据输入一元多项式方程待预测模型;

s70、输出一元多项式方程待预测模型计算得到的容量预测结果。

本技术方案中,需要找出cpu使用率与访问量之间的关系,假设对于某台服务器的cpu使用率和访问量之间的关系如图3所示,其中横坐标是cpu的使用率,而纵坐标是访问量,将收集到的历史访问量数据及对应的服务器cpu使用率数据通过一元多项式方程进行回归分析。假设方程为y=ax3+bx2+cx+d,根据数据样本集,并通过最小二乘法来优化方程,求解过程主要通过迭代算法实现,首先初始化参数,然后确定迭代方向,最后不断向迭代方向寻找最优解,直到满足条件;得到方程的确切表达式后,就能够通过访问量来预测容量大小了,此方法计算能够准确计算出扩容服务器的大小,使服务器的扩容更加合理。服务器扩容大小的计算具体为,可以先根据方程式计算最大的访问量a,然后用扩容后要达到的访问量b除于a并取整再加1,得到的结果即为扩容的服务器大小。例如:a=1000,b=3500,则(int)(b/a)+1=(int)(3500/1000)+1=4。

在一具体实施例中,所述步骤s30具体包括,

s31、将预处理后的历史访问量数据及对应的服务器cpu使用率数据通过一元三阶多项式方程进行回归分析;

s32、将预处理后的历史访问量数据及对应的服务器cpu使用率数据使用最小二乘法优化。

本实施例中,通过将历史访问量数据及对应的服务器cpu使用率数据通过一元三阶多项式方程进行回归分析,能够得到历史访问量与cpu使用率的相关关系,然后再使用最小二乘法对数据进行拟合,从而获得优化后的访问量与cpu使用率的关系,能够准确地获得服务器扩容的预测模型。

在一具体实施例中,所述步骤s20具体包括,对历史访问量数据及对应的服务器cpu使用率数据进行去噪音、补充数据缺失值以及规范化数据格式。

本实施例中,数据在传输过程中会受到各种干扰,因此需要对数据去噪音处理,将干扰进行排除;对缺失的数据进行补充,能够保证输入数据的完整性,以此保证计算出的模型的准确性;将数据的格式进行统一化处理,有利于数据的一致性和完整性。

在一具体实施例中,所述步骤s10具体包括,

s11、以一固定的采样时间对历史访问量数据及对应的服务器cpu使用率数据进行采样;

s12、按时间顺序对历史访问量数据及对应的服务器cpu使用率数据进行排序。

本实施例中,从服务器上收集历史访问量数据以及对应的服务器cpu使用率数据,比如一周或一个月的数据作为数据样本,使用近期的数据作为样本能更准确地体现整体的水平。另外,该数据样本的采样时间间隔为30秒或1分钟,将其按照时间先后顺序排列起来,比如某一天的数据,请参阅图4,每一天的第一分钟认为是第一时刻,第二分钟认为是第二时刻,以此类推,一天一共有1440个时刻,假如采样了一周的数据则有1440*7个样本。

请参阅图2,一种基于回归方程的服务器扩容计算装置,包括训练子装置及预测子装置,所述预测子装置包括,

数据收集模块,用于从服务器上收集历史访问量数据以及对应的服务器cpu使用率数据;

数据预处理模块,用于对历史访问量数据及对应的服务器cpu使用率数据进行预处理;

数据训练模块,用于将预处理后的历史访问量数据及对应的服务器cpu使用率数据输入一元多项方程训练模型进行训练;

模型存储模块,用于训练完成后,得到一元多项式方程待预测模型,并将其进行存储;

所述预测子装置包括,

模型加载模块,用于加载一元多项式方程待预测模型;

数据预测模块,用于将待预测的访问量数据输入一元多项式方程待预测模型;

预测结果输出模块,用于输出一元多项式方程待预测模型计算得到的容量预测结果。

本技术方案中,需要找出cpu使用率与访问量之间的关系,假设对于某台服务器的cpu使用率和访问量之间的关系如图3所示,其中横坐标是cpu的使用率,而纵坐标是访问量,将收集到的历史访问量数据及对应的服务器cpu使用率数据通过一元多项式方程进行回归分析。假设方程为y=ax3+bx2+cx+d,根据数据样本集,并通过最小二乘法来优化方程,求解过程主要通过迭代算法实现,首先初始化参数,然后确定迭代方向,最后不断向迭代方向寻找最优解,直到满足条件;得到方程的确切表达式后,就能够通过访问量来预测容量大小了,此方法计算能够准确计算出扩容服务器的大小,使服务器的扩容更加合理。服务器扩容大小的计算具体为,可以先根据方程式计算最大的访问量a,然后用扩容后要达到的访问量b除于a并取整再加1,得到的结果即为扩容的服务器大小。例如:a=1000,b=3500,则(int)(b/a)+1=(int)(3500/1000)+1=4。

在一具体实施例中,所述模型训练模块具体包括,

回归分析单元,用于将预处理后的历史访问量数据及对应的服务器cpu使用率数据通过一元三阶多项式方程进行回归分析;

数据优化单元,用于将预处理后的历史访问量数据及对应的服务器cpu使用率数据使用最小二乘法优化。

本实施例中,回归分析单元通过将历史访问量数据及对应的服务器cpu使用率数据通过一元三阶多项式方程进行回归分析,能够得到历史访问量与cpu使用率的相关关系,数据优化单元使用最小二乘法对数据进行拟合,从而获得优化后的访问量与cpu使用率的关系,能够准确地获得服务器扩容的预测模型。

在一具体实施例中,所述数据预处理模块具体用于,对历史访问量数据及对应的服务器cpu使用率数据进行去噪音、补充数据缺失值以及规范化数据格式。

本实施例中,数据在传输过程中会受到各种干扰,因此数据预处理模块需要对数据去噪音处理,将干扰进行排除;对缺失的数据进行补充,能够保证输入数据的完整性,以此保证计算出的模型的准确性;将数据的格式进行统一化处理,有利于数据的一致性和完整性。

在一具体实施例中,所述数据收集模块具体包括,

数据采样单元,用于以一固定的采样时间对历史访问量数据及对应的服务器cpu使用率数据进行采样;

数据排序单元,用于按时间顺序对历史访问量数据及对应的服务器cpu使用率数据进行排序。

本实施例中,数据收集模块从服务器上收集历史访问量数据以及对应的服务器cpu使用率数据,比如一周或一个月的数据作为数据样本,使用近期的数据作为样本能更准确地体现整体的水平。另外,该数据样本的采样时间间隔优选为30秒或1分钟,将其按照时间先后顺序排列起来,比如某一天的数据,请参阅图4,每一天的第一分钟认为是第一时刻,第二分钟认为是第二时刻,以此类推,一天一共有1440个时刻,假如采样了一周的数据则有1440*7个样本。

此处第一、第二……只代表其名称的区分,不代表它们的重要程度和位置有什么不同。

此处,上、下、左、右、前、后只代表其相对位置而不表示其绝对位置

以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1