一种基于基线的运维管理健康分析方法

文档序号:9911753阅读:572来源:国知局
一种基于基线的运维管理健康分析方法
【技术领域】
[0001]本发明涉及运维管理技术领域,尤其涉及一种基于基线的运维管理健康分析方法。
【背景技术】
[0002]随着信息化建设的深入发展,IT系统日益成为核心业务处理的关键基础设施;为了保证网络、服务器、数据库等IT资源的正常运行,需要对其进行维护;当系统出现异常时能够及时产生告警并通知到运维人员,运维人员根据告警对异常进行定位,诊断,并完成相应的维护操作。在运维的管理上,有很多的管理对象是不一样的,因而它们需要监视的指标是不同的,监视的密度是不同的,指标正常与否的判断标准是不同的,发现指标偏离后的处置分析、处置操作也是不同的。但又有很多管理对象一般是相同或近似的,目前,针对所有管理对象,通常是通过完全不同的监视指标、监视密度、判断标准、处置分析和处置操作来进行运维管理,因而在碰到相同或近似的时,很多就是在重复进行运维管理,使得运维管理变得复杂化。
[0003]而在运维管理过程中,怎么针对指标的状态进行分析及判断是一个关键的问题,关系到运维管理系统的管理质量和管理效率,所以,需要一个比较好的分析方法来提高运维管理系统的管理质量和管理效率。

【发明内容】

[0004]鉴于目前运维管理技术领域存在的上述不足,本发明提供一种基于基线的运维管理健康分析方法,通过基线的基准线和上下偏离幅度来进行健康分析判断,判断标准更加准确,判断更精确。
[0005]为达到上述目的,本发明的实施例采用如下技术方案:
[0006]—种基于基线的运维管理健康分析方法,所述基于基线的运维管理健康分析方法包括以下步骤:
[0007]通过预置的管理规则连续地、周期性地采集管理对象指标的实时状况,并加以保存以形成历史数据;
[0008]根据所述历史数据通过四分位算法运算得到所述管理对象指标按时间变化的数据曲线一健康运行基准线;
[0009]以所述基准线为中心,根据历史记录数据点在上下偏离幅度内的百分比来设置合理偏离幅度的大小;
[0010]若所述管理对象指标数据在合理偏离幅度内进行波动,则判断为正常状态,否则为越界状态;
[0011]通过统计越界的频繁度来判断运维管理系统的健康趋势。
[0012]依照本发明的一个方面,所述通过预置的管理规则连续地、周期性地采集管理对象指标的实时状况,并加以保存以形成历史数据具体可为:通过监测模板预置的管理规则对每个管理对象和每个监测点进行连续、大量的数据采集,对采集到的实时状况信息加以保存以形成历史数据。
[0013]依照本发明的一个方面,所述管理规则根据所述监测模板上的针对管理对象和监测点的监测规则进行制定。
[0014]依照本发明的一个方面,所述根据所述历史数据通过四分位算法运算得到所述管理对象指标按时间变化的数据曲线一健康运行基准线中历史数据具体可为:在管理对象正常运转周期内采集和保存的历史数据。
[0015]依照本发明的一个方面,所述历史记录数据点在上下偏离幅度内的百分比由用户进行设置。
[0016]依照本发明的一个方面,所述基于基线的运维管理健康分析方法包括:通过发现越界实时调用智能处理策略。
[0017]依照本发明的一个方面,所述智能处理策略基于所述健康趋势进行分析,以决定是否需要采取措施及采取什么样的措施。
[0018]本发明实施的优点:本发明所述的基于基线的运维管理健康分析方法,通过预置的管理规则连续地、周期性地采集管理对象指标的实时状况,并加以保存以形成历史数据;根据所述历史数据通过四分位算法运算得到所述管理对象指标按时间变化的数据曲线一健康运行基准线;所述基准线为中心,根据历史记录数据点在上下偏离幅度内的百分比来设置合理偏离幅度的大小;若所述管理对象指标数据在合理偏离幅度内进行波动,则判断为正常状态,否则为越界状态;通过统计越界的频繁度来判断运维管理系统的健康趋势;采集持续一段时间后,运用四分位算法提炼出“与时段维度”关联的每个管理对象的“健康标准”也就是健康运行基准线,使得基准线更加接近某指标运行的正常值;而偏离幅度的百分比等参数由用户设置,简单易懂,能够让用户从宏观上对基线监测的严格程度有个比较准确的把握;判断标准更加准确,判断更精确。不断收集各个监测点运行数据,与该时段健康标准做比对,得出健康状况偏差值,当偏差值越过许可范围时,则触发处理;可得到系统运行健康度趋势,发现问题征兆进行提示,防患于未然,提高了运维管理质量和效率。
【附图说明】
[0019]为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1为本发明所述的一种基于基线的运维管理健康分析方法示意图。
【具体实施方式】
[0021]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0022]如图1所示,一种基于基线的运维管理健康分析方法,所述基于基线的运维管理健康分析方法包括以下步骤:
[0023]步骤S1:通过预置的管理规则连续地、周期性地采集管理对象指标的实时状况,并加以保存以形成历史数据;
[0024]所述步骤SI通过预置的管理规则连续地、周期性地采集管理对象指标的实时状况,并加以保存以形成历史数据的【具体实施方式】可为:通过监测模板预置的管理规则对每个管理对象和每个监测点进行连续、大量的数据采集。例如,若监测模板预置的管理规则为“采集CHJ的使用率”,贝Ij通过监测模板对CPU的使用率进行连续、周期、大量的采集。将采集到的对应管理对象指标的实时状况数据进行保存,以时间为轴形成大量的历史数据,这是未来我们进行系统分析的“数据”基础。
[0025]在实际应用中,所述管理规则根据所述监测模板上的针对管理对象和监测点的监测规则进行制定。
[0026]步骤S2:根据所述历史数据通过四分位算法运算得到所述管理对象指标按时间变化的数据曲线一健康运行基准线;
[0027]在实际应用中,所述步骤S2根据所述历史数据通过四分位算法运算得到所述管理对象指标按时间变化的数据曲线一健康运行基准线的【具体实施方式】可为:基于这些历史数据,取系统正常运转的工作周期,比如某几日或某几周,将该时间段内的监测模板采集到的所有实时状况信息保存形成的历史数据提取出来,用数学方法四分位算法处理后得到一条某管理对象关键指标按时间变化的数据曲线一健康运行基准线。例如,根据某个时间段内正常运行的CPU的使用率得到了一条随时间变化的数据曲线。通过四分位算法使得基准线更加接近某指标运行的正常值。
[0028]在实际应用中,所述基准线可包括日基线和周基线。
[0029]日基线:从该指标的历史记录中选择最近某几日正常运行的数据进行综合判断;
[0030]周基线:从该指标的历史记录中选择最近某几周正常运行的数据进行综合判断。
[0031]在实际应用中,所述健康运行基准线是一根曲线,其横坐标是时间轴,纵坐标是指标的值。
[0032]例如,日基线类型,基准线的横坐标的范围是一天,从O点到24点。
[0033]例如,周基线类型,基准线的横坐标的范围是一周,从周一的O点到周日的24点。
[0034]在实际应用中,以某台服务器“CPU使用率”指标的“日基线”为例,其形成过程可如下:
[0035]1、取一段正常运行的周期,如:2015年9月6日到9月9日,共四天。将这段周期内所有该指标的历史记录点映射到一个二维坐标中,横坐标是时间,纵坐标是指标的历史记录值。
[0036]2、将二位坐标中所有历史记录点合并到“一天”中显示,如原某个历史记录点(时间:2015年9月7日9点30分30秒指标的值:65 % ),合并后时间去除年月日信息,保留时分秒,形成新的二维坐标。
[0037]3、将“一天”按某个“间隔”等分成N个点,间隔可以是5分钟、10分钟、I小时等等,若以I小时为例,那么一天可以平均分成24个时刻。计算出每个时刻指标的平均值:将每个时刻前后各1/2
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1