一种动态阈值告警方法及装置与流程

文档序号:11147589
一种动态阈值告警方法及装置与制造工艺

本发明涉及业务监控技术领域,更具体地说,涉及一种动态阈值告警方法及装置。



背景技术:

随着互联网的飞速发展,大规模的数据中心越来越成为现代社会发展的需要,数据中心内的业务数量越来越多、业务规模也越来越庞大;这就为数据中心的业务监控告警带来巨大挑战。

对于业务的监控告警主要包括对于业务的资源的监控告警,目前对于业务的资源的监控告警通常是预先设定资源的各监测指标的阈值,进而在获取到资源的各监测指标的实时值时,将该实时值与阈值进行比对,如果实时值不大于阈值,则说明此时资源运行是正常的,否则则说明资源运行出现了问题,需要进行告警。但是在不同的时间资源运行的状态是不同的,而上述方案中对于资源的监测指标的实时值的比对阈值是固定,因此,其并不能同时适用资源运行的不同时间,进而会导致告警不准确。

综上所述,现有技术中实现业务资源监控的技术方案存在告警不准确的问题。



技术实现要素:

本发明的目的是提供一种动态阈值告警方法及装置,以解决现有技术中实现业务资源监控的技术方案存在的告警不准确的问题。

为了实现上述目的,本发明提供如下技术方案:

一种动态阈值告警方法,包括:

实时监测资源库中各资源对应的监测指标,并获取每个所述监测指标的实时值;

确定与所述监测指标实时值的获取时刻对应的动态阈值策略,所述动态阈值策略包括与所述获取时刻对应的所述各项监测指标的指标阈值;

将所述各项监测指标的实时值与所述动态阈值策略中对应的指标阈值进行比对,如果存在其实时值大于对应指标阈值的监测指标,则生成对应的告警信息。

优选的,还包括:

基于所述资源库中各资源之间的依赖关系将各资源组织成对应的业务;

基于各资源对应其监测指标的实时值确定该资源的子业务负载,并基于各资源的子业务负载确定所述业务的业务负载;

将所述业务负载与负载阈值进行比对,如果所述业务负载大于所述负载阈值,则生成对应的告警信息;其中,所述负载阈值为所述动态阈值策略中包含与所述获取时刻对应的负载阈值。

优选的,基于各资源对应其监测指标的实时值确定该资源的子业务负载,包括:

对于任一资源,确定该资源对应的各监测指标的实时值以及各监测指标的监测权重,确定各监测指标的实时值与对应监测权重的乘积的总和为该资源的子业务负载。

优选的,基于各资源的子业务负载确定所述业务的业务负载,包括:

确定各资源的子业务负载与对应负载权重的乘积的总和为所述业务的业务负载。

优选的,还包括:

将各资源的监测指标的实时值及对应业务负载进行显示。

一种动态阈值告警装置,包括:

实时监测模块,用于实时监测资源库中各资源对应的监测指标,并获取每个所述监测指标的实时值;

策略确定模块,用于确定与所述监测指标实时值的获取时刻对应的动态阈值策略,所述动态阈值策略包括与所述获取时刻对应的所述各项监测指标的指标阈值;

第一比对模块,用于将所述各项监测指标的实时值与所述动态阈值策略中对应的指标阈值进行比对,如果存在其实时值大于对应指标阈值的监测指标,则生成对应的告警信息。

优选的,还包括:

业务组织模块,用于基于所述资源库中各资源之间的依赖关系将各资源组织成对应的业务;

负载计算模块,用于基于各资源对应其监测指标的实时值确定该资源的子业务负载,并基于各资源的子业务负载确定所述业务的业务负载;

第二比对模块,用于将所述业务负载与负载阈值进行比对,如果所述业务负载大于所述负载阈值,则生成对应的告警信息;其中,所述负载阈值为所述动态阈值策略中包含与所述获取时刻对应的负载阈值。

优选的,所述负载计算模块包括:

第一计算单元,用于对于任一资源,确定该资源对应的各监测指标的实时值以及各监测指标的监测权重,确定各监测指标的实时值与对应监测权重的乘积的总和为该资源的子业务负载。

优选的,所述负载计算模块包括:

第二计算单元,用于确定各资源的子业务负载与对应负载权重的乘积的总和为所述业务的业务负载。

优选的,还包括:

显示模块,用于将各资源的监测指标的实时值及对应业务负载进行显示。

本发明提供了一种动态阈值告警方法及装置,其中该方法包括:实时监测资源库中各资源对应的监测指标,并获取每个所述监测指标的实时值;确定与所述监测指标实时值的获取时刻对应的动态阈值策略,所述动态阈值策略包括与所述获取时刻对应的所述各项监测指标的指标阈值;将所述各项监测指标的实时值与所述动态阈值策略中对应的指标阈值进行比对,如果存在其实时值大于对应指标阈值的监测指标,则生成对应的告警信息。本申请公开的技术方案中,实时监测各资源的各监测指标并获取各监测指标的实时值,确定出与实时值的获取时刻对应的动态阈值策略,以将动态阈值策略中包含的与获取时刻对应的指标阈值与对应实时值进行比对,并在任一实时值大于对应指标阈值时生成对应告警信息。可见,本申请中考虑不同时间资源运行是动态变化的,因此对应不同时间确定出对应该时间的指标阈值,进而基于该指标阈值对对应的资源监测指标的实时值进行比对和/或告警等,从而大大提高了告警准确性及有效性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的一种动态阈值告警方法的流程图;

图2为本发明实施例提供的一种动态阈值告警装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,其示出了本发明实施例提供的一种动态阈值告警方法的流程图,可以包括:

S11:实时监测资源库中各资源对应的监测指标,并获取每个监测指标的实时值。

其中,各资源的监测指标可以根据实际需要进行设定,如资源为数据库,则对应监测指标可以包括连接响应时间、索引命中率、表空间利用率等,资源为虚拟机,对应监测指标可以包括CPU利用率、网络流量、内存利用率、分区利用率等,资源为web服务,对应监测指标可以包括当前连接数、连接响应时间、内存使用量等,以及其他根据实际需要进行的设定,均在本发明的保护范围之内。实时监测各资源的监测指标并获取各监测指标当前时刻实时值,以供后续对各监测指标的实时值进行比对告警等。

S12:确定与监测指标实时值的获取时刻对应的动态阈值策略,动态阈值策略包括与获取时刻对应的各项监测指标的指标阈值。

需要说明的是,由于资源不同时间的运行状态不同,资源不同时间的监测指标的实时值也不同,对应的,对于资源不同时间的监测指标的要求也不同,也即监测指标对应于不同时间具有对应不同或相同的指标阈值,因此,本申请中获取的动态阈值策略中包含的指标阈值是与获取的监测指标的实时值的获取时刻相对应的。

S13:将各项监测指标的实时值与动态阈值策略中对应的指标阈值进行比对,如果存在其实时值大于对应指标阈值的监测指标,则生成对应的告警信息。

将各项监测指标的实时值与对应指标阈值进行比对,如果实时值大于对应指标阈值,则说明对应监测指标存在问题,此时生成对应的告警信息,告警信息中可以包括出现问题的监测指标、对应实时值及对应指标阈值等,否则,则不做任何处理。

本申请公开的技术方案中,实时监测各资源的各监测指标并获取各监测指标的实时值,确定出与实时值的获取时刻对应的动态阈值策略,以将动态阈值策略中包含的与获取时刻对应的指标阈值与对应实时值进行比对,并在任一实时值大于对应指标阈值时生成对应告警信息。可见,本申请中考虑不同时间资源运行是动态变化的,因此对应不同时间确定出对应该时间的指标阈值,进而基于该指标阈值对对应的资源监测指标的实时值进行比对和/或告警等,从而大大提高了告警准确性及有效性。

本发明实施例提供的一种动态阈值告警方法,还可以包括:

基于资源库中各资源之间的依赖关系将各资源组织成对应的业务;

基于各资源对应其监测指标的实时值确定该资源的子业务负载,并基于各资源的子业务负载确定业务的业务负载;

将业务负载与负载阈值进行比对,如果业务负载大于负载阈值,则生成对应的告警信息;其中,负载阈值为动态阈值策略中包含与获取时刻对应的负载阈值。

将各资源按照其依赖关系组织成对应的业务,如Web服务依赖于数据库、数据库依赖于所在的虚拟机、虚拟机依赖于其所在的服务器、……、依此类推形成多层的依赖关系,这种依赖关系及依赖关系对应的各资源就组成业务。具体来说,不同的资源由于业务层次的不同会不存在不同程度的依赖关系,通过这种依赖关系能够使业务中的各资源组成的资源集合真正成为一个整体。进而基于各资源的监测指标的实时值按照上述方式计算出业务负载,业务负载是业务的整体体现,如果业务负载不大于对应的负载阈值,则说明业务整体表现是正常的,否则,则需要输出对应的告警信息,可以包括业务负载及对应负载阈值等。由此,通过业务负载实现对业务整体状态的判断,供管理人员作出对应的措施,且负载阈值也是与业务负载对应的时间相对应的,从而保证了告警准确性及有效性。

另外需要说明的是,动态阈值策略具体可以是按照下列方式生成的:基于不同时间对各监测指标及业务负载设定对应的阈值,然后生成与不同时刻对应的业务-时间-负载阈值-监测指标A的指标阈值-监测指标B的指标阈值-……-监测指标N的指标阈值,N为监测指标的总数量;并将生成的动态阈值策略存储至对应的策略库中,以在需要时直接获取。

本发明实施例提供的一种动态阈值告警方法,基于各资源对应其监测指标的实时值确定该资源的子业务负载,可以包括:

对于任一资源,确定该资源对应的各监测指标的实时值以及各监测指标的监测权重,确定各监测指标的实时值与对应监测权重的乘积的总和为该资源的子业务负载。

各监测指标的监测权重可以依据实现需要进行设定,如任一资源的监测指标包括两项时,可以按照下列公式进行计算:S=A1*a+B1*b。其中,S表示任一资源的子业务负载,A1表示该资源的一个监测指标的实时值,a为该监测指标A1的监测权重,B1表示该资源的另一个监测指标的实时值,b为该监测指标B1的监测权重。由此,对应于监测指标的监测权重计算上述子业务负载,能够使得得出的子业务负载更加准确。

本发明实施例提供的一种动态阈值告警方法,基于各资源的子业务负载确定业务的业务负载,可以包括:

确定各资源的子业务负载与对应负载权重的乘积的总和为业务的业务负载。

各资源的负载权重可以依据实现需要进行设定,如资源包括两项时,可以按照下列公式进行计算:L=C1*c+D1*d。其中,L表示业务负载,C1表示任一资源的子业务负载,c为子业务负载C1的负载权重,D1表示另一资源的子业务负载,d为该子业务负载D1的负载权重。由此,对应于各资源的负载权重计算上述业务负载,能够使得得出的业务负载更加准确。

本发明实施例提供的一种动态阈值告警方法,还可以包括:

将各资源的监测指标的实时值及对应业务负载进行显示。

将各资源的监测指标的实时值及对应业务负载进行显示,能够使得管理人员及时获知上述相关信息,进而实现对应的管理操作。

本发明实施例还提供了一种动态阈值告警装置,如图2所示,可以包括:

实时监测模块11,用于实时监测资源库中各资源对应的监测指标,并获取每个监测指标的实时值;

策略确定模块12,用于确定与监测指标实时值的获取时刻对应的动态阈值策略,动态阈值策略包括与获取时刻对应的各项监测指标的指标阈值;

第一比对模块13,用于将各项监测指标的实时值与动态阈值策略中对应的指标阈值进行比对,如果存在其实时值大于对应指标阈值的监测指标,则生成对应的告警信息。

本发明实施例提供的一种动态阈值告警装置,还可以包括:

业务组织模块,用于基于资源库中各资源之间的依赖关系将各资源组织成对应的业务;

负载计算模块,用于基于各资源对应其监测指标的实时值确定该资源的子业务负载,并基于各资源的子业务负载确定业务的业务负载;

第二比对模块,用于将业务负载与负载阈值进行比对,如果业务负载大于负载阈值,则生成对应的告警信息;其中,负载阈值为动态阈值策略中包含与获取时刻对应的负载阈值。

本发明实施例提供的一种动态阈值告警装置,负载计算模块可以包括:

第一计算单元,用于对于任一资源,确定该资源对应的各监测指标的实时值以及各监测指标的监测权重,确定各监测指标的实时值与对应监测权重的乘积的总和为该资源的子业务负载。

本发明实施例提供的一种动态阈值告警装置,负载计算模块可以包括:

第二计算单元,用于确定各资源的子业务负载与对应负载权重的乘积的总和为业务的业务负载。

本发明实施例提供的一种动态阈值告警装置,还可以包括:

显示模块,用于将各资源的监测指标的实时值及对应业务负载进行显示。

本发明实施例提供的一种动态阈值告警装置中相关部分的说明请参见本发明实施例提供的一种动态阈值告警方法中对应部分的详细说明,在此不再赘述。

对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

再多了解一些
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1