一种用于运维管理的健康分析方法

文档序号:9754289阅读:392来源:国知局
一种用于运维管理的健康分析方法
【技术领域】
[0001]本发明涉及运维管理技术领域,尤其涉及一种用于运维管理的健康分析方法。
【背景技术】
[0002]随着信息化建设的深入发展,IT系统日益成为核心业务处理的关键基础设施;为了保证网络、服务器、数据库等IT资源的正常运行,需要对其进行维护;当系统出现异常时能够及时产生告警并通知到运维人员,运维人员根据告警对异常进行定位,诊断,并完成相应的维护操作。在运维的管理上,有很多的管理对象是不一样的,因而它们需要监视的指标是不同的,监视的密度是不同的,指标正常与否的判断标准是不同的,发现指标偏离后的处置分析、处置操作也是不同的。但又有很多管理对象一般是相同或近似的,目前,针对所有管理对象,通常是通过完全不同的监视指标、监视密度、判断标准、处置分析和处置操作来进行运维管理,因而在碰到相同或近似的时,很多就是在重复进行运维管理,使得运维管理变得复杂化。
[0003]而在运维管理过程中,怎么针对指标的状态进行分析及判断是一个关键的问题,关系到运维管理系统的管理质量和管理效率,所以,需要一个比较好的分析方法来提高运维管理系统的管理质量和管理效率。

【发明内容】

[0004]鉴于目前运维管理技术领域存在的上述不足,本发明提供一种用于运维管理的健康分析方法,能够得到系统运行健康度趋势,发现问题征兆进行提示,防患于未然,提高了运维管理质量和效率。
[0005]为达到上述目的,本发明的实施例采用如下技术方案:
[0006]—种用于运维管理的健康分析方法,所述用于运维管理的健康分析方法包括以下步骤:
[0007]通过预置的管理规则连续地、周期性地采集管理对象指标的实时状况;
[0008]对采集到的实时状况信息加以归并保存以形成历史数据;
[0009]选取在管理对象正常运转周期内采集和保存的历史数据;
[0010]根据选取的历史数据计算得到所述管理对象指标按时间变化的数据曲线---健康运行基线;
[0011]以所述基线为中心,设置该指标数据上下合理的波动范围---上下门限;
[0012]若所述管理对象指标数据在上下门限间进行波动,则判断为正常状态,否则为越界状态;
[0013]通过统计越界的频繁度来判断运维管理系统的健康趋势。
[0014]依照本发明的一个方面,所述通过预置的管理规则连续地、周期性地采集管理对象指标的实时状况具体可为:通过监测模板预置的管理规则对每个管理对象和每个监测点进行连续、大量的数据采集。
[0015]依照本发明的一个方面,所述管理规则根据所述监测模板上的针对管理对象和监测点的监测规则进行制定。
[0016]依照本发明的一个方面,所述选取在管理对象正常运转周期内采集和保存的历史数据具体为:基于所述的历史数据,取一个系统正常运转的工作周期,读取所述工作周期内所有历史数据。
[0017]依照本发明的一个方面,所述用于运维管理的健康分析方法包括:通过发现越界实时调用智能处理策略。
[0018]依照本发明的一个方面,所述智能处理策略基于所述健康趋势进行分析,以决定是否需要采取措施及采取什么样的措施。
[0019]本发明实施的优点:本发明所述的用于运维管理的健康分析方法,通过对采集到的实时状况信息加以归并保存以形成历史数据;选取在管理对象正常运转周期内采集和保存的历史数据;根据选取的历史数据计算得到所述管理对象指标按时间变化的数据曲线一健康运行基线;以所述基线为中心,设置该指标数据上下合理的波动范围一上下门限;若所述管理对象指标数据在上下门限间进行波动,则判断为正常状态,否则为越界状态;通过统计越界的频繁度来判断运维管理系统的健康趋势,针对每个管理对象、每个监测点连续、自动、大量地进行数据采集,并加以归并存储。采集持续一段时间后,运用算法提炼出“与时段维度”关联的每个管理对象的“健康标准”也就是健康运行基线,不断收集各个监测点运行数据,与该时段健康标准做比对,得出健康状况偏差值,当偏差值越过许可范围时,则触发处理;可得到系统运行健康度趋势,发现问题征兆进行提示,防患于未然,提高了运维管理质量和效率。
【附图说明】
[0020]为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0021]图1为本发明所述的一种用于运维管理的健康分析方法示意图。
【具体实施方式】
[0022]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0023]如图1所示,一种用于运维管理的健康分析方法,所述用于运维管理的健康分析方法包括以下步骤:
[0024]步骤S1:通过预置的管理规则连续地、周期性地采集管理对象指标的实时状况;
[0025]所述步骤SI通过预置的管理规则连续地、周期性地采集管理对象指标的实时状况的【具体实施方式】可为:通过监测模板预置的管理规则对每个管理对象和每个监测点进行连续、大量的数据采集。例如,若监测模板预置的管理规则为“采集CPU的使用率”,则通过监测模板对CPU的使用率进行连续、周期、大量的采集。
[0026]在实际应用中,所述管理规则根据所述监测模板上的针对管理对象和监测点的监测规则进行制定。
[0027]步骤S2:对采集到的实时状况信息加以归并保存以形成历史数据;
[0028]所述步骤S2对采集到的实时状况信息加以归并保存以形成历史数据的【具体实施方式】可为:将所述步骤S I通过预置的管理规则连续地、周期性地采集管理对象指标的实时状况采集到的对应管理对象指标的实时状况数据进行归并保存,以时间为轴形成大量的历史数据,这是未来我们进行系统分析的“数据”基础。
[0029]步骤S3:选取在管理对象正常运转周期内采集和保存的历史数据;
[0030]所述步骤S3选取在管理对象正常运转周期内采集和保存的历史数据的【具体实施方式】可为:基于这些历史数据,取一个系统正常运转的工作周期,比如I周或I月,将该时间段内的监测模板采集到的所有实时状况信息归并保存形成的历史数据提取出来。
[0031]步骤S4:根据选取的历史数据计算得到所述管理对象指标按时间变化的数据曲线一健康运行基线;
[0032]所述步骤S3根据选取的历史数据计算得到所述管理对象指标按时间变化的数据曲线一健康运行基线的【具体实施方式】可为:基于步骤S3选取出来的正常运转周期内的历史数据,用数学方法处理后得到一条某管理对象关键指标按时间变化的数据曲线一健康运行基线。例如,根据一月内正常运行的CPU的使用率得到了一条随时间变化的数据曲线。
[0033]在实际应用中,所述基线还可包括日基线和周
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1