一种it系统运行指标动态阈值分析方法

文档序号:8223392阅读:487来源:国知局
一种it系统运行指标动态阈值分析方法
【技术领域】
[0001] 本发明涉及IT运维领域,主要是一种IT系统运行指标动态阈值分析方法。
【背景技术】
[0002]IT系统运行状态监测是现代信息化建设发展中不可或缺的组成部份,它为运维人 员提供7x24小时的IT系统运行状态信息,实时监测存在故障的点提供及时准确的预警,对 于降低IT系统运维成本,实现其长期稳定运行有极大的帮助。
[0003] IT系统运行状态往往反映于其各类软硬件运行指标上,包含底层的网络流量到高 层的业务交易量。对这些运行指标进行收集后,需要进行进一步的分析,以判断IT系统的 运行健康状态。
[0004] 传统运行指标分析技术往往使用人为建立若干静态阈值来进行监测分析,其存在 人为经验误差。并且一个大规模的IT系统包含的各类软硬件指标可多达数万个,因此使用 静态规则人为为这些指标配置合理的静态规则更不可能。

【发明内容】

[0005] 本发明的目的在于克服现有技术存在的不足,而提供一种IT系统运行指标动态 阈值分析方法,通过人工智能算法,实现大规模IT系统运行状态的自动化监测。
[0006] 本发明的目的是通过如下技术方案来完成的。这种IT系统运行指标动态阈值分 析方法,利用性能指标运行规律特征计算当前时间点正常值区间,生成动态阈值基线,以判 断当前运行状态是否正常,步骤如下:
[0007]1)、查询运行指标历史变化情况;
[0008] 2)、基于正态分布的原理计算当前时间粒度下的指标正常值区间R,其上限标记为 RU,下限标记为RD ;
[0009] 3)、将各时间粒度的RU连接作为动态阈值上基线,RD连接作为动态阈值下基线;
[0010] 4)、判断当前时间粒度下新采集到的运行指标,如〉RU则为值过高异常,如〈RD则 为值过低异常。
[0011] 本发明的有益效果为:解决静态阈值存在的不足,通过智能学习运行指标的历史 运行规律,计算不同时间点运行指标正常取值范围,来生成动态阈值基线,以用于运行指标 的监测分析。由于本发明无需大量人为操作,计算量小,且分析准确,因此可大量减少运维 人力成本,提高监测覆盖面与准确率。
【附图说明】
[0012] 图1为本发明的动态阈值分析流程不意图;
[0013]图2为本发明所涉及的指标正态分布规律示意图;
[0014] 图3为本发明的阈值计算流程示意图;
[0015] 图4为本发明生成的动态阈值基线示意图。
【具体实施方式】
[0016] 下面将结合附图和实施例对本发明做详细的介绍:
[0017] 实施例:本发明所述的这种IT系统运行指标动态阈值分析方法,利用性能指标运 行规律特征计算当前时间点正常值区间,生成动态阈值基线,以判断当前运行状态是否正 常。本发明可有效判断IT环境中一些性能指标的运行状态,并实现自动学习能力,减少实 施大规模IT监测时的人为配置与分析工作。
[0018]图1为下述各模块的运行流程图,描述了数据流向;本发明共涉及4个模块:指标 接收模块、动态阈值分析模块、监测展现模块、告警通知模块。1.指标接收模块提供标准的 数据接口,完成对各IT系统最新上报运行指标的接收预处理,并保存为历史数据;2.动态 阈值分析模块,即本发明算法实现模块,根据指标历史情况与当前情况,计算动态阈值基线 与发送指标运行异常事件;3.监测展现模块通过趋势图实现运行指标变化轨迹以及动态 基线的显示,提供对比分析;4.告警通知模块根据指标运行状态变更,给用户发送告警。
[0019] 图2为IT运行指标的正态分布示意图,由于IT运行指标往往与具体信息系统业 务吞吐量有关,而用户的业务吞吐量则具备峰谷特征,因此从某个同周期的历史时间段来 看,其指标实际值总是处于某个特定的区间范围,体现出正态分布的特征。
[0020] 图3为本发明计算动态阈值的过程;具体步骤如下:
[0021] 1)、接收到IT资源产生的新指标P ;
[0022] 2)、查询指标P过去历史数据,如下:
[0023](1)、前小时平均值尋与标准差
[0024] (2)、前一天同小时平均值PMd与标准差PSD d
[0025] (3)、过去8周同一天同小时平均值PMW1? PM吧与标准差PSD W1?PSD ws
[0026]3)、计算正常值平均值:
【主权项】
1. 一种IT系统运行指标动态阈值分析方法,其特征是:利用性能指标运行规律特征计 算当前时间点正常值区间,生成动态阈值基线,以判断当前运行状态是否正常,步骤如下: 1) 、查询运行指标历史变化情况; 2) 、基于正态分布的原理计算当前时间粒度下的指标正常值区间R,其上限标记为RU, 下限标记为RD ; 3) 、将各时间粒度的RU连接作为动态阈值上基线,RD连接作为动态阈值下基线; 4) 、判断当前时间粒度下新采集到的运行指标,如〉RU则为值过高异常,如〈RD则为值 过低异常。
2. 根据权利要求1所述的IT系统运行指标动态阈值分析方法,其特征在于:该方法的 具体步骤如下: 1) 、接收到IT资源产生的新指标P ; 2) 、查询指标P过去历史数据,如下: (1) 、前小时平均值PMk与标准差PSD h; (2) 、前一天同小时平均值PMd与标准差PSD d (3) 、过去8周同一天同小时平均值PMW1? PM we与标准差PSD W1?PSD W8;
3) 、计算正常值平均值 4) 、计算正常值标准差 5) 、计算当前小时正常值区间上阈值RU = RM+RSDX3 ; 6) 、计算当前小时正常值区间下阈值RD = RM-RSDX3 ; 7) 、计算当天动态基线,将当天生成的所有小时RU作为上基线,所有小时RD作为下基 线; 8) 、如果指标P > RU则为超上阈值异常,如果指标P < RD则为超下阈值异常,其它则 为正常情况。
【专利摘要】本发明涉及一种IT系统运行指标动态阈值分析方法,步骤如下:1、查询运行指标历史变化情况;2、基于正态分布的原理计算当前时间粒度下的指标正常值区间R,其上限标记为RU,下限标记为RD;3、将各时间粒度的RU连接作为动态阈值上基线,RD连接作为动态阈值下基线;4、判断当前时间粒度下新采集到的运行指标,如>RU则为值过高异常,如<RD则为值过低异常。本发明的有益效果为:解决静态阈值存在的不足,通过智能学习运行指标的历史运行规律,计算不同时间点运行指标正常取值范围,生成动态阈值基线,以用于运行指标的监测分析。本发明有益的效果:本发明无需大量人为操作,计算量小,且分析准确,因此可大量减少运维人力成本,提高监测覆盖面与准确率。
【IPC分类】G06F11-30
【公开号】CN104536868
【申请号】CN201410697138
【发明人】蒋君伟, 刘东海, 张宜凡
【申请人】北京广通信达科技有限公司
【公开日】2015年4月22日
【申请日】2014年11月26日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1