利用相关性的it运维指标预测方法

文档序号:7772795阅读:524来源:国知局
利用相关性的it运维指标预测方法
【专利摘要】本发明公开了利用相关性的IT运维指标预测方法,通过对历史数据做必要的预处理,计算协方差矩阵确定指标间的相关性关系,同时,通过特征值分解处理确定指标间的协方差波动范围;通过相关性关系和测试协方差得到线性方程组,解之进行指标预测,具有较高的预测精度。
【专利说明】利用相关性的IT运维指标预测方法
【技术领域】
[0001]本发明涉及IT运维管理领域,尤其是IT运维的指标间的监测和管理领域,具体为一种利用相关性的IT运维指标预测方法。
【背景技术】
[0002]IT运维管理,即IT企业或部门采用相关的方法、手段、技术、制度、流程和文档等,对IT运行环境(包括物理环境、软硬件环境等)、IT业务系统和IT运维人员进行的综合管理。随着IT建设的不断深入和完善,计算机硬软件系统的运行维护已经得到了重视,由于这是一个随着计算机信息技术的深入应用而产生的新课题,因此研究如何进行有效的IT运维管理,将具有广阔的发展前景和巨大的现实意义。
[0003]概括地讲,IT运维的管理内容都可以经抽取成指标来进行管理和维护。指标,也即描述某一对象特征的数据。IT运维的管理行为,本质上都可以抽象成数据的变更。因此,研究IT运维指标的管理很有意义。在本发明中,提出的是一种利用相关性的IT运维指标智能预报方法、预测方法、预测装置、预报装置。
[0004]智能化预报与预测,即通过非人工检测的方式对某指标值进行告警或估测的过程。智能化的例子很多,如将模式识别的聚类算法应用于手机或终端手写输入法的功能,可以提高输入效率;再如有些音乐软件提供自动推荐歌曲的功能,通过记录听众历史记录来进行预测,这种启发式的方式可以进一步满足听众的心愿;再如360安全卫士对操作系统的程序更新和维护提供自动预报的功能,可以优化系统,提高系统使用寿命。
[0005]智能化的理论体系已经发展得比较成熟,目前应用的智能化理论方法和手段主要包括:(1)自适应理论体系,该理论本质上是一种反馈理论,包括人工神经网络体系,通过学习训练样本,预测未来数据;(2)模式识别领域,通过构造不同模式体系达到识别的目的;(3)最优化理论体系,该理论包括支持向量机模型、蚁群算法、遗传算法,线性以及非线性约束模型,通过建模达到优化目标数据的目的;(4)现代信号处理领域理论与方法,信号处理方法如滑动平均自适应回归模型,以及滤波方法如维纳滤波、卡尔曼滤波模型,通过建模对未来时间量进行预测、平滑或估计。
[0006]在本发明中,将不直接使用以上所述的智能方法,而是利用相关性。
[0007]IT运维某些指标间必然存在相关性。以WLAN指标检测为例,WLAN信号的场强信噪比强度直接影响网络数据带宽,甚至如网络的连通性如Ping包成功率,网络的拥塞程度则可能会影响WEB认证指标,因为当网络负载过重时,WEB认证接入时延时间可能会增长。在实际的应用场景中,因成本问题,有些WLAN指标是不宜时刻监测的,如场强信噪比,而有些数据可以通过软件监控的方式时刻获得,而这两种指标间或更多指标间却存在着联系,在这种情形下,利用指标间的相关性便可以克服其它智能化方案无法预测或预测准确率下降的问题,因为不论数据知道与否,指标间的相关性是时刻存在的,只需要如采用本发明中的方法就可以达到预测的效果。除此之外,相关性还可以在某些指标未知数据动态范围时,预报其是否超标。[0008]相关性的数学依据如下:
对于两个向量Xi=[Xi (I),...,Xi(N)], Xj = [Xj(I),..., Xj(N)]那么两者之间的协方差可以表示为


?
【权利要求】
1.利用相关性的IT运维指标预测方法,其特征在于,所述方法包含三个主要步骤:更新数据来源、训练和预测; 更新数据来源,具体包含用初始化的历史数据作为训练数据,同时不断并入测试数据,更新历史数据库; 训练,具体包含数据预处理和数据计算步骤,数据预处理,输入训练数据,消除毛刺数据进行平滑处理;所述数据计算步骤,计算协方差矩阵,确定指标间的相关性关系,对其进行特征值分解处理确定波动范围; 协方差矩阵利用协方差公式可得到,协方差的计算公式是:若Xi= [Xl,...,XN], Xj= [χ'..., χ' ν]表示第i和第j个指标数据,那么两者的协方差可以表示
t ?
χ.χ.N χ.N x * 为conv(x.,x.) ――—— — ^ Y」,该值越接近于零,两个指标越不相关,反之则
1 J N ,.=I N N'越相关,从而确定指标相关性关系;当计算好协方差矩阵后,对其进行特征值分解,将所有特征值中绝对值较大保留,剔除接近于零的部分,再重新恢复成新的协方差矩阵,设经过去特征值处理后恢复出的新的协方差矩阵中第i和第j个指标的协方差大小为corw’ (xi; Xj),设其为波动范围一个界,那么另一个界为conv’’ (xi; Xj) =2*conv (xi; Xj) -conv' (Xi, x」),从而得到任意两指标协方差波动范围为conv’(Xi, χ」)~conv’ ’(Xi, Xj)。 所述数据预测,通过相关性关系及相关指标值联立方程组解得预测结果。
2.根据权利要求1所述利用相关性的IT运维指标预测方法,其特征在于,所述的数据预处理步骤的消除毛刺的算法是:对于某一个指标,初始化,从其历史数据库中挑选极大极小的三个数据,组成毛刺集,以其他数据的均值来填充其位置;当更新历史数据后,比较新加入的数据,看其是否大于毛刺集的均值,若大于,则加入毛刺集,否则,作为正常数据,进入数据计算步骤。
3.根据权利要求1所述利用相关性的IT运维指标预测方法,其特征还在于,所述数据预测的条件是:该数据由于故障或其他原因无法通过直接的方式检测得到,且与之相关的其余指标可测得且都未超出动态范围。
4.根据权利要求3所述利用相关性的IT运维指标预测方法,其特征还在于,所述预测的方法是:先找到与待测指标i最相关的一个指标j,然后找到与j最相关的指标k,则可以认为Convij-Convik=CONVij-CONVik,等式左边是未知的测试协方差,右边是已知训练协方差,也即令测试协方差与训练协方差相等,作为方程I ;然后利用协方差得到i和j,以及i和k的协方差计算方程cawH = —孓子与—翁-jpxJTyf,从而得到含三个参数的三个方程,解之即得预测结果。
【文档编号】H04L12/24GK103546338SQ201310462076
【公开日】2014年1月29日 申请日期:2011年5月4日 优先权日:2011年5月4日
【发明者】不公告发明人 申请人:成都勤智数码科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1