一种基于基线的运维管理健康分析方法_2

文档序号:9911753阅读:来源:国知局
“间隔”的时间范围内的历史记录点,采用四分位算法计算出该范围内的平均值。
[0038]4、将上述步骤中每个时刻前后半个间隔内按照数据点的值连接成直线,这条线就是基线的基准线。
[0039]步骤S3:以所述基准线为中心,根据历史记录数据点在上下偏离幅度内的百分比来设置合理偏离幅度的大小;
[0040]所述步骤S3以所述基准线为中心,根据历史记录数据点在上下偏离幅度内的百分比来设置合理偏离幅度的大小【具体实施方式】可为:我们认为在IT环境稳定、业务使用稳定的前提下,未来正常的业务开展过程中,某具体对象的重要管理指标实时值的波动应在是围绕基准线的一个合理的波动范围内,以基准线为中心,上下合理的波动范围我们称为上下偏离幅度,具体是根据历史记录数据点在上下偏离幅度内的百分比来进行合理偏离幅度大小的设置。
[0041]在实际应用中,所述历史记录数据点在上下偏离幅度内的百分比由用户进行设置。而偏离幅度的百分比等参数由用户设置,简单易懂,能够让用户从宏观上对基线监测的严格程度有个比较准确的把握;判断标准更加准确,判断更精确。
[0042]在实际应用中,所述上下偏离幅度加基准线后形成上下偏离门限,其设置方法可如下:
[0043]首先偏离门限的分三种类型,用户可以任意指定其中一种:上下偏离门限、上偏离门限、下偏离门限。
[0044]如果指标仅需要通过基线判断不超过某个值,如“内存使用率”指标,用户只关心有没有超过某阈值,那么这种阈值就是上偏离门限,应先计算出上偏离幅度,上偏离门限=基准线+上偏离幅度。
[0045]如果指标仅需要通过基线判断不低于某个值,如“连接数”指标,用户只关心有没有低于某阈值,那么这种阈值就是下偏离门限,应先计算出下偏离幅度,下偏离门限=基准线-下偏离幅度。
[0046]如果指标及需要判断在某个区间内,如“温度”指标,用户关心是否在某个温度区间内,那么这种阈值就是上下偏离门限,应先计算出上下偏离幅度,上偏离门限=基准线+上偏离幅度,下偏离门限=基准线-下偏离幅度。
[0047]步骤S4:若所述管理对象指标数据在合理偏离幅度内进行波动,则判断为正常状态,否则为越界状态;
[0048]所述步骤S4若所述管理对象指标数据在合理偏离幅度内进行波动,则判断为正常状态,否则为越界状态的【具体实施方式】可为:上下偏离幅度间的数据波动是正常的,称为健康,而超出偏离幅度的波动,我们称为越界。
[0049]例如,用户关心服务器“CPU使用率”指标是否在某个区间内,那么我们需要计算出上偏离幅度和下偏离幅度,可通过如下步骤进行:
[0050]1、用户选择偏离门限的类型:上下偏离门限、上偏离门限、下偏离门限。
[0051]2、用户设置偏离门限的参数:偏离门限在恰好保证这些指标越界次数不超过采集总数的Pl %的前提下再增加放宽一定余量,余量为偏离幅度的P2%。
[0052]其中用户应设置Pl,P2的值。
[0053]3、系统根据用户设置的参数,计算出上偏离幅度、下偏离幅度,确保使用这个偏离幅度后,和历史记录的数据点比较后的越界次数满足用户的设置,其中历史记录的数据点的范围同计算基准线选择的范围一致。
[0054]4、基准线、上偏离门限、下偏离门限已经确定,后续采集的指标值使用上偏离门限或下偏离门限进行越界判断。
[0055]例如2015年11月18日19点30分30秒,服务器“CPU使用率”采集到的值为80%,那么根据“日基线”进行判断时,首先确定在19点30分30秒时,基线对应的上偏离门限值、下偏离门限值,假设其分别为23%、11%,很显然80%不在偏离区间内,那么认定指标值越界。
[0056]步骤S5:通过统计越界的频繁度来判断运维管理系统的健康趋势。
[0057]所述步骤S5通过统计越界的频繁度来判断运维管理系统的健康趋势的【具体实施方式】可为:越界约频繁,预示着业务运行的隐患越大,越不健康,则可以通过统计越界的频繁度来判断运维管理系统的健康趋势。
[0058]本发明实施的优点:本发明所述的基于基线的运维管理健康分析方法,通过预置的管理规则连续地、周期性地采集管理对象指标的实时状况,并加以保存以形成历史数据;根据所述历史数据通过四分位算法运算得到所述管理对象指标按时间变化的数据曲线一健康运行基准线;所述基准线为中心,根据历史记录数据点在上下偏离幅度内的百分比来设置合理偏离幅度的大小;若所述管理对象指标数据在合理偏离幅度内进行波动,则判断为正常状态,否则为越界状态;通过统计越界的频繁度来判断运维管理系统的健康趋势;采集持续一段时间后,运用四分位算法提炼出“与时段维度”关联的每个管理对象的“健康标准”也就是健康运行基准线,使得基准线更加接近某指标运行的正常值;而偏离幅度的百分比等参数由用户设置,简单易懂,能够让用户从宏观上对基线监测的严格程度有个比较准确的把握;判断标准更加准确,判断更精确。不断收集各个监测点运行数据,与该时段健康标准做比对,得出健康状况偏差值,当偏差值越过许可范围时,则触发处理;可得到系统运行健康度趋势,发现问题征兆进行提示,防患于未然,提高了运维管理质量和效率。
[0059]以上所述,仅为本发明的【具体实施方式】,但本发明的保护范围并不局限于此,任何熟悉本领域技术的技术人员在本发明公开的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
【主权项】
1.一种基于基线的运维管理健康分析方法,其特征在于,所述基于基线的运维管理健康分析方法包括以下步骤: 通过预置的管理规则连续地、周期性地采集管理对象指标的实时状况,并加以保存以形成历史数据; 根据所述历史数据通过四分位算法运算得到所述管理对象指标按时间变化的数据曲线---健康运行基准线; 以所述基准线为中心,根据历史记录数据点在上下偏离幅度内的百分比来设置合理偏离幅度的大小; 若所述管理对象指标数据在合理偏离幅度内进行波动,则判断为正常状态,否则为越界状态; 通过统计越界的频繁度来判断运维管理系统的健康趋势。2.根据权利要求1所述的基于基线的运维管理健康分析方法,其特征在于,所述通过预置的管理规则连续地、周期性地采集管理对象指标的实时状况,并加以保存以形成历史数据具体可为:通过监测模板预置的管理规则对每个管理对象和每个监测点进行连续、大量的数据采集,对采集到的实时状况信息加以保存以形成历史数据。3.根据权利要求2所述的基于基线的运维管理健康分析方法,其特征在于,所述管理规则根据所述监测模板上的针对管理对象和监测点的监测规则进行制定。4.根据权利要求1所述的基于基线的运维管理健康分析方法,其特征在于,所述根据所述历史数据通过四分位算法运算得到所述管理对象指标按时间变化的数据曲线一健康运行基准线中历史数据具体可为:在管理对象正常运转周期内采集和保存的历史数据。5.根据权利要求1至4之一所述的基于基线的运维管理健康分析方法,其特征在于,所述历史记录数据点在上下偏离幅度内的百分比由用户进行设置。6.根据权利要求5所述的基于基线的运维管理健康分析方法,其特征在于,所述基于基线的运维管理健康分析方法包括:通过发现越界实时调用智能处理策略。7.根据权利要求6所述的基于基线的运维管理健康分析方法,其特征在于,所述智能处理策略基于所述健康趋势进行分析,以决定是否需要采取措施及采取什么样的措施。
【专利摘要】本发明公开了一种基于基线的运维管理健康分析方法,通过预置的管理规则连续地、周期性地采集管理对象指标的实时状况,并加以保存以形成历史数据;根据所述历史数据通过四分位算法运算得到所述管理对象指标按时间变化的健康运行基准线;以所述基准线为中心,根据历史记录数据点在上下偏离幅度内的百分比来设置合理偏离幅度的大小;若所述管理对象指标数据在合理偏离幅度内进行波动,则判断为正常状态,否则为越界状态;通过统计越界的频繁度来判断运维管理系统的健康趋势;运用四分位算法提炼出健康运行基准线,使得基准线更加接近某指标运行的正常值;而偏离幅度的百分比等参数由用户设置,简单易懂,判断标准更加准确,判断更精确。
【IPC分类】G06Q10/00
【公开号】CN105678388
【申请号】CN201610012262
【发明人】王俊, 郑剑
【申请人】上海北塔软件股份有限公司
【公开日】2016年6月15日
【申请日】2016年1月8日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1