一种数据监控的多因素组合分析告警方法及系统与流程

文档序号:17640716发布日期:2019-05-11 00:39阅读:293来源:国知局
一种数据监控的多因素组合分析告警方法及系统与流程

本发明涉及数据监控技术领域,尤其涉及一种用于数据中心监控系统中数据监控的多因素组合分析告警方法及系统。



背景技术:

在信息化时代,数据中心机房是业务的支撑平台和保障系统,运维人员要管理的设备越来越多,尤其需要及时了解到设备的告警信息便于及时处理,以便保障数据中心运行的安全。监控系统通过与设备的通讯实现对设备的有效监控,实现预警和准确告警。

传统告警方法是根据单一测点的采集值与设定上下限判断是否告警、或者通过数字量测点的0/1值来判断是否告警。但是这种方法面临了一个挑战,即设备多样性和测点关联性等。一个原因可能同时引起多个告警,造成告警风暴,从而引起运维人员忽略掉重要告警、或者不易查到告警原因、或者造成重要告警被延迟通知等等;另一种情况是,由于某个传感器异常,带来的测点数据异常引起的告警,也会导致运维人员造成误判。

因此,现有技术还有待进一步提升和改进。



技术实现要素:

针对上述技术问题,本发明实施例提供了一种数据监控的多因素组合分析告警方法及系统,解决现有数据中心监控系统中数据监控告警的误报警和报警不智能的技术问题。

本发明实施例的第一方面提供一种数据监控的多因素组合分析告警方法,包括步骤:根据预定规则创建测点字典、因素字典和告警条件字典,所述测点字典包含测点对象,所述因素字典包含告警因素和与所述告警因素相绑定的测点对象,所述告警条件字典包含由多个告警因素组合形成的多因素告警条件;获取测点的实时值,并在所述测点字典中更新测点对象;遍历所述因素字典,调用执行所述测点对象所对应每个告警因素的因素分析方法,并将执行结果保存入告警因素;遍历所述告警条件字典,将告警条件中的多个告警因素进行and或or运算,并根据运算结果触发告警。

可选的,所述根据预定规则创建测点字典、因素字典和告警条件字典的步骤具体包括:读取测点数据,生成测点对象,并将所述测点对象存入测点字典;读取告警因素,生成因素对象,将所述因素对象绑定对应的测点对象,并将所述因素对象存入因素字典;读取多个告警因素组合形成的多因素告警条件,并绑定关联的告警因素,存入告警条件字典。

可选的,所述遍历所述告警条件字典,将告警条件中的多个告警因素进行and或or运算,并根据运算结果触发告警的步骤具体还包括:当告警条件中的多个告警因素进行and或or的运算结果为true时,若当前未处于告警状态则触发告警并保存告警状态为true;当告警条件中的多个告警因素进行and或or的运算结果为false时,若当前已处于告警状态则解除告警并保存告警状态为false。

可选的,所述告警因素的属性包括关联的测点对象、因素分析方法和时间,所述因素分析方法包括上限对比、下限对比、相等对比、递增趋势分析、递减趋势分析和维持时长分析。

可选的,所述方法还包括步骤:更新测点字典、因素字典和告警条件字典,增加、变更和删除因素分析方法、告警因素和多因素告警条件。

本发明实施例第二方面提供了一种数据监控的多因素组合分析告警系统,其特征在于,所述系统包括:配置模块,用于根据预定规则创建测点字典、因素字典和告警条件字典,并保存在配置数据库中;测点监测模块,用于获取测点的实时值,并在所述测点字典中更新测点对象;告警因素分析模块,用于遍历所述配置数据库中的因素字典,调用执行所述测点对象所对应每个告警因素的因素分析方法,并将执行结果保存入告警因素;告警模块,用于遍历所述配置数据库中的告警条件字典,将告警条件中的多个告警因素进行and或or运算,并根据运算结果触发告警。

可选的,所述配置模块具体还包括:测点字典配置模块:用于读取测点数据,生成测点对象,并将所述测点对象存入测点字典;因素字典配置模块:用于读取告警因素,生成因素对象,将所述因素对象绑定对应的测点对象,并将所述因素对象存入因素字典;告警条件字典配置模块:用于读取多个告警因素组合形成的多因素告警条件,并绑定关联的告警因素,存入告警条件字典。

可选的,所述告警模块具体还用于:当告警条件中的多个告警因素进行and或or的运算结果为true时,若当前未处于告警状态则触发告警并保存告警状态为true;当告警条件中的多个告警因素进行and或or的运算结果为false时,若当前已处于告警状态则解除告警并保存告警状态为false。

可选的,所述系统还包括:更新模块,用于更新测点字典、因素字典和告警条件字典,增加、变更和删除因素分析方法、告警因素和多因素告警条件。

本发明实施例第三方面提供一种数据中心监控系统,所述监控系统包括上述的多因素组合分析告警系统。

本发明实施例提供的技术方案中,告警触发逻辑不再是基于单一测点值和阀值的比较,而是将多个测点、多种因素、多样的分析方法进行组合,以及将多个因素组合成一个告警条件,当满足多因素组合条件时就触发告警,不满足就不触发告警,因此相对于现有技术,本发明实施例的多因素组合分析告警方法能够对关联告警和对单一测点偶然异常告警进行过滤,提升数据监控中告警的准确性和智能性。

附图说明

图1为本发明实施例中数据监控的多因素组合分析告警方法的一个实施例示意图;

图2为本发明实施例中数据监控的多因素组合分析告警方法的另一个实施例示意图;

图3为本发明实施例中数据监控的多因素组合分析告警系统的一个实施例示意图;

图4为图3中配置模块的组成示意图;

图5为本发明实施例中数据监控的多因素组合分析告警系统的另一个实施例示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,本发明实施例中数据监控的多因素组合分析告警方法一个实施例,包括步骤:

s100、根据预定规则创建测点字典、因素字典和告警条件字典,所述测点字典包含测点对象,所述因素字典包含告警因素和与所述告警因素相绑定的测点对象,所述告警条件字典包含由多个告警因素组合形成的多因素告警条件。

其中,本实施例所创建的测点字典、因素字典和告警条件字典,均保存在配置数据库中,以便对各个字典进行有效访问,而且配置数据库中还存储有测点数据、告警因素等等。测点字典、因素字典和告警条件字典的具体创建过程如下:

从配置数据库中读取测点数据,生成测点对象,并将该测点对象存入测点字典。从配置数据库中读取告警因素,告警因素的属性包括有关联的测点、分析方法和时间等,并生成因素对象,将该因素对象绑定对应的测点对象,然后将因素对象存入因素字典。从配置数据库中读取由多个告警因素组合形成的多因素告警条件和多因素之间的组合关系,生成告警条件对象分析模型,并绑定对应的因素对象,将告警条件对象分析模型存入条件字典。

在本实施例,多因素可以是数据的阀值,也可是时间,也可以是数据趋势。而根据可能情况进行因素组合形成一个告警条件,组合之间可以是and、or、或者满足其中几个因素等条件的关系。

s200、获取测点的实时值,并在所述测点字典中更新测点对象;获取测点的实时值即为监控测点的实时状态。在监测时可以单一测点监测,也可以多个测点同时监测。

s300、遍历所述因素字典,调用执行所述测点对象所对应每个告警因素的因素分析方法,并将执行结果保存入告警因素。

其中,在本实施例中,遍历因素字典,执行每个告警因素的因素分析方法。因素分析方法根据对比方法,调用不同的处理函数并综合测点的实时值和时间进行运算,返回true表示符合因素条件,否则返回false。执行结果保存在告警因素对象中。

s400、遍历所述告警条件字典,将告警条件中的多个告警因素进行and或or运算,并根据运算结果触发告警。

其中,在本实施例中,当告警条件中的多个告警因素进行and或or的运算结果为true时,若当前处于告警状态则触发告警并保存告警状态为true;当告警条件中的多个告警因素进行and或or的运算结果为false时,若当前处于告警状态则解除告警并保存告警状态为false,并且上一次计算结果为true则解除告警。然后测点当前数据输入到告警条件对象分析模型中,调用告警条件的分析方法进行相应处理。

在本实施例中,告警因素的属性包括关联的测点对象、因素分析方法和时间等,而因素分析方法包括有又上限对比、下限对比、相等对比、递增趋势分析、递减趋势分析和维持时长分析等。当然,本实施例的告警因素的属性以及因素分析方法并不限于上述几种,后续可以根据需要相应增减。而多因素告警条件可以包含条件名称,两个或两个以上的告警因素,多个告警因素之间的组合方式可以配置and或者or的计算方法,保存在配置数据库和告警条件字典中。

因此,本实施例可以根据需要更新测点字典、因素字典和告警条件字典,增加、变更和删除因素分析方法、告警因素和多因素告警条件。所以,本实施例的因素分析方法、告警因素和多因素告警条件均可以扩充配置。

具体的,在因素分析方法扩充时,从因素分析方法所在的因素分析库中搜索,如果已有则不新增,如果没有则扩充分析方法库,加入新的因素分析方法到因素分析库中,将tag标识设为“生效”,并更新日志。当已有因素分析方法需要变更时,把变更内容更新到分析库中并更新日志,分析方法名称和入口保持不变;对需删除的方法,把tag标识设为“作废”,并更新日志。

在告警因素扩充时,把新的告警因素增加到配置库并增加到告警因素字典,tag标识设为“生效”,同时记录新增日期到日志,并增加到告警因素字典。当原有告警因素需要,需要变更,则修改告警因素的关联配置项,并记录变更时间到日志。对需删除的告警因素,直接从告警因素配置库和告警因素字典中删除,并更新日志。

在多因素告警条件扩充时,如新增多因素告警条件,从配置库中搜索,如果已有则不新增,如果没有,新增一个多因素告警条件到配置数据库和相应字典,并记录新增日期。更新已有多因素告警条件,搜索配置库读取,然后修改对应的属性并更新到配置和对应字典中,并记录变更时间到日志。对需多因素告警组合条件,直接从配置库和对应字典中删除,并更新日志。

结合上述方法,下面以一个完整的实施过程进行示例描述。参见图2,具体如下步骤:

s1、开始;

s2、读取配置数据库;

s3、生成测点对象存入测点字典;

s4、读取告警因素,并绑定关联测点,存入因素字典;

s5、读取告警条件,并绑定关联告警因素,存入告警条件字典;

s6、获取测点实时值,并更新测点对象;

s7、遍历告警因素字典,调用因素分析方法;

s81、执行分析方法1,返回true或者false;

s82、执行分析方法2,返回true或者false;

s83、执行分析方法3,返回true或者false;

s84、执行分析方法4,返回true或者false;

s9、遍历告警条件字典,对绑定因素根据配置进行and或者or运算;

s10、计算结果若为true则执行s11、计算结果若为false则执行s12;

s11、判断是否处于告警状态,若为true则执行s15,若为false则执行s13;

s12、判断是否处于告警状态,若为true则执行s14,若为false则执行s15;

s13、触发告警,告警状态更新为true;

s14、解除告警,告警状态更新为false;

s15、判断是否终止,若为true则执行s16,若为false则返回执行s6;

s16、结束。

因此,本发明实施例的多因素组合分析告警方法,由于告警触发逻辑不再是基于单一测点值的和阀值的比较,可以实现多个测点、多种因素、多样的分析方法进行组合,多个因素可以组合成一个告警条件,而且因素分析方法具有多样性和扩充性,能够有效对关联告警和对单一测点偶然异常告警进行过滤,提升数据监控中告警的准确性和智能性。

基于上述多因素组合分析告警方法,本发明实施例第二方面提供了一种数据监控的多因素组合分析告警系统,如图3所示,该系统包括:配置模块10、测点监测模块20、告警因素分析模块30和告警模块40。

具体的,配置模块10:用于根据预定规则创建测点字典、因素字典和告警条件字典,并保存在配置数据库中;

测点监测模块20:用于获取测点的实时值,并在该测点字典中更新测点对象;

告警因素分析模块30:用于遍历该配置数据库中的因素字典,调用执行该测点对象所对应每个告警因素的因素分析方法,并将执行结果保存入告警因素;

告警模块40:用于遍历该配置数据库中的告警条件字典,将告警条件中的多个告警因素进行and或or运算,并根据运算结果触发告警。

优选的,如图4所示,本实施例的配置模块10具体还包括:测点字典配置模块11:用于读取测点数据,生成测点对象,并将所述测点对象存入测点字典;因素字典配置模块12:用于读取告警因素,生成因素对象,将所述因素对象绑定对应的测点对象,并将所述因素对象存入因素字典;告警条件字典配置模块13:用于读取多个告警因素组合形成的多因素告警条件,并绑定关联的告警因素,存入告警条件字典。

本实施例的告警模块40具体还用于:当告警条件中的多个告警因素进行and或or的运算结果为true时,若当前未处于告警状态则触发告警并保存告警状态为true,若当前处于告警状态则解除告警并保存告警状态为false。

优选的,如图5所示,本实施例的报警系统还包括:更新模块50,用于更新测点字典、因素字典和告警条件字典,增加、变更和删除因素分析方法、告警因素和多因素告警条件。

应当说明的是,上述实施例中提供的多因素组合分析告警方法和多因素组合分析告警系统均是基于相同的发明构思。因此,多因素组合分析告警方法中各个具体实施例的步骤均可以由对应的功能模块所执行,功能模块中具体的功能也可以在多因素组合分析告警系统中具有对应的方法步骤,在此不再赘述。

基于上述方法和系统,本发明实施例第三方面提供一种数据中心监控系统,该数据中心监控系统包括上述的多因素组合分析告警系统,并执行上述实施例的多因素组合分析告警方法。

需要指出的是,以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

通过以上的实施方式的描述,本领域普通技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1