一种告警处理方法、系统、设备以及介质与流程

文档序号:28118000发布日期:2021-12-22 14:53阅读:67来源:国知局
一种告警处理方法、系统、设备以及介质与流程

1.本发明涉及服务器领域,具体涉及一种告警处理方法、系统、设备以及存储介质。


背景技术:

2.在网络管理领域,故障被定义为产生功能异常的原因,是产生告警事件的原因。告警是在特定事件发生时被管对象发出的通报构成的一种事件报告,用于传递告警信息。它是生产厂商定义好的,并且是通过网络中的设备产生的,是一个系统发出的消息,表示其发生了某种事情或异常,最终被网络管理人员观察到。
3.理想的告警信息应包含有关故障设备名称、故障症状、发生部位、发生时间、发生原因等信息。但绝大部分告警都只有有关经历故障的设备名称、故障症状、发生时间等数据域,而没有提供识别故障必须的故障发生的详细地点和发生原因等数据域。
4.时延是指一个报文或分组从一个网络的一端传送到另一个端所需要的时间。它包括了发送时延,传播时延,处理时延,排队时延。(时延=发送时延+传播时延+处理时延+排队时延)一般,发送时延与传播时延是我们主要考虑的。对于报文长度较大的情况,发送时延是主要矛盾;报文长度较小的情况,传播时延是主要矛盾。
5.在实际中,机器本身的状态值随着bmc(baseboard management controller,基板管理控制器)的重启等活动发生变化,影响告警的准确度。而在bmc重启期间,节点监测到传感器异常,产生无效告警某些阈值类告警无法用简单的级别来概括,需要更灵活的告警策略。又比如某业务重启,导致cpu占用率短暂提高,节点刚好捕捉到高点后产生无效告警。
6.由于监控节点和受控节点之间,可能存在较大的网络延迟或网络波动,导致网络请求丢失、数据采集响应缓慢等问题,导致告警不准确,空耗人力物力。


技术实现要素:

7.有鉴于此,为了克服上述问题的至少一个方面,本发明实施例提出一种告警处理方法,包括以下步骤:
8.接收业务节点触发告警规则后生成的告警信息;
9.根据所述告警信息确定告警类型;
10.根据所述告警类型确定对所述告警信息进行验证的若干个验证者节点;
11.分别利用每一个验证者节点对所述告警信息进行验证并基于验证结果生成对应分值;
12.将每一个验证者节点生成的分值进行相加后作为所述告警信息的最终得分;
13.根据所述告警类型和所述最终得分确定所述告警信息对应的处理优先级。
14.在一些实施例中,分别利用每一个验证者节点对所述告警信息进行验证并基于验证结果生成对应分值,进一步包括:
15.每隔预设时间段利用其中一个所述验证者节点对所述告警信息进行验证以基于验证结果生成对应分值。
16.在一些实施例中,还包括:
17.对所述每一个验证者节点针对所述告警类型分别设置不同的权重;
18.判断当前已对所述告警信息进行验证的验证者节点的权重之和是否大于预设值;
19.响应于大于预设值,停止利用剩余的验证者节点继续对所述告警信息进行验证。
20.在一些实施例中,将每一个验证者节点生成的分值进行相加后作为所述告警信息的最终得分,进一步包括:
21.将已进行验证的每一个验证者节点对应的权重乘以对应的分值后相加作为所述告警信息的最终得分。
22.在一些实施例中,还包括:
23.响应于接收到调整验证者节点的权重的指令,根据所述指令将每一个验证者节点的权重进行更新。
24.在一些实施例中,根据所述告警类型确定对所述告警信息进行验证的若干个验证者节点,进一步包括:
25.判断告警类型是否是预设的告警类型;
26.响应于所述告警类型是预设的告警类型,确定与预设的告警类型对应的预设验证者节点。
27.在一些实施例中,接收业务节点触发告警规则后生成的告警信息,还包括:
28.创建告警池;
29.对接收到的告警信息进行格式转换后放入所述告警池中。
30.基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种告警处理系统,包括:
31.接收模块,配置为接收业务节点触发告警规则后生成的告警信息;
32.第一确定模块,配置为根据所述告警信息确定告警类型;
33.第二确定模块,配置为根据所述告警类型确定对所述告警信息进行验证的若干个验证者节点;
34.验证模块,配置为分别利用每一个验证者节点对所述告警信息进行验证并基于验证结果生成对应分值;
35.计算模块,配置为将每一个验证者节点生成的分值进行相加后作为所述告警信息的最终得分;
36.第三确定模块,配置为根据所述告警类型和所述最终得分确定所述告警信息对应的处理优先级。
37.基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种计算机设备,包括:
38.至少一个处理器;以及
39.存储器,所述存储器存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时执行以下步骤:
40.接收业务节点触发告警规则后生成的告警信息;
41.根据所述告警信息确定告警类型;
42.根据所述告警类型确定对所述告警信息进行验证的若干个验证者节点;
43.分别利用每一个验证者节点对所述告警信息进行验证并基于验证结果生成对应分值;
44.将每一个验证者节点生成的分值进行相加后作为所述告警信息的最终得分;
45.根据所述告警类型和所述最终得分确定所述告警信息对应的处理优先级。
46.在一些实施例中,分别利用每一个验证者节点对所述告警信息进行验证并基于验证结果生成对应分值,进一步包括:
47.每隔预设时间段利用其中一个所述验证者节点对所述告警信息进行验证以基于验证结果生成对应分值。
48.在一些实施例中,还包括:
49.对所述每一个验证者节点针对所述告警类型分别设置不同的权重;
50.判断当前已对所述告警信息进行验证的验证者节点的权重之和是否大于预设值;
51.响应于大于预设值,停止利用剩余的验证者节点继续对所述告警信息进行验证。
52.在一些实施例中,将每一个验证者节点生成的分值进行相加后作为所述告警信息的最终得分,进一步包括:
53.将已进行验证的每一个验证者节点对应的权重乘以对应的分值后相加作为所述告警信息的最终得分。
54.在一些实施例中,还包括:
55.响应于接收到调整验证者节点的权重的指令,根据所述指令将每一个验证者节点的权重进行更新。
56.在一些实施例中,根据所述告警类型确定对所述告警信息进行验证的若干个验证者节点,进一步包括:
57.判断告警类型是否是预设的告警类型;
58.响应于所述告警类型是预设的告警类型,确定与预设的告警类型对应的预设验证者节点。
59.在一些实施例中,接收业务节点触发告警规则后生成的告警信息,还包括:
60.创建告警池;
61.对接收到的告警信息进行格式转换后放入所述告警池中。
62.基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时执行以下步骤:
63.接收业务节点触发告警规则后生成的告警信息;
64.根据所述告警信息确定告警类型;
65.根据所述告警类型确定对所述告警信息进行验证的若干个验证者节点;
66.分别利用每一个验证者节点对所述告警信息进行验证并基于验证结果生成对应分值;
67.将每一个验证者节点生成的分值进行相加后作为所述告警信息的最终得分;
68.根据所述告警类型和所述最终得分确定所述告警信息对应的处理优先级。
69.在一些实施例中,分别利用每一个验证者节点对所述告警信息进行验证并基于验证结果生成对应分值,进一步包括:
70.每隔预设时间段利用其中一个所述验证者节点对所述告警信息进行验证以基于验证结果生成对应分值。
71.在一些实施例中,还包括:
72.对所述每一个验证者节点针对所述告警类型分别设置不同的权重;
73.判断当前已对所述告警信息进行验证的验证者节点的权重之和是否大于预设值;
74.响应于大于预设值,停止利用剩余的验证者节点继续对所述告警信息进行验证。
75.在一些实施例中,将每一个验证者节点生成的分值进行相加后作为所述告警信息的最终得分,进一步包括:
76.将已进行验证的每一个验证者节点对应的权重乘以对应的分值后相加作为所述告警信息的最终得分。
77.在一些实施例中,还包括:
78.响应于接收到调整验证者节点的权重的指令,根据所述指令将每一个验证者节点的权重进行更新。
79.在一些实施例中,根据所述告警类型确定对所述告警信息进行验证的若干个验证者节点,进一步包括:
80.判断告警类型是否是预设的告警类型;
81.响应于所述告警类型是预设的告警类型,确定与预设的告警类型对应的预设验证者节点。
82.在一些实施例中,接收业务节点触发告警规则后生成的告警信息,还包括:
83.创建告警池;
84.对接收到的告警信息进行格式转换后放入所述告警池中。
85.本发明具有以下有益技术效果:本发明提出的方案通过多个验证者节点对告警信息进行验证,可以提高监控的准确度和灵活性。即多个验证者节点可以交叉验证,满足确认次数后,告警即可生效,这样通过多验证者多次确认,避开bmc重启或升级等异常状态,提高了告警的准确度。
附图说明
86.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
87.图1为本发明的实施例提供的告警处理方法的流程示意图;
88.图2为本发明的实施例提供的告警处理方法的流程框图;
89.图3为本发明的实施例提供的告警处理系统的结构示意图;
90.图4为本发明的实施例提供的计算机设备的结构示意图;
91.图5为本发明的实施例提供的计算机可读存储介质的结构示意图。
具体实施方式
92.为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照
附图,对本发明实施例进一步详细说明。
93.需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
94.根据本发明的一个方面,本发明的实施例提出一种告警处理方法,如图1所示,其可以包括步骤:、
95.s1,接收业务节点触发告警规则后生成的告警信息;
96.s2,根据所述告警信息确定告警类型;
97.s3,根据所述告警类型确定对所述告警信息进行验证的若干个验证者节点;
98.s4,分别利用每一个验证者节点对所述告警信息进行验证并基于验证结果生成对应分值;
99.s5,将每一个验证者节点生成的分值进行相加后作为所述告警信息的最终得分;
100.s6,根据所述告警类型和所述最终得分确定所述告警信息对应的处理优先级。
101.本发明提出的方案通过多个验证者节点对告警信息进行验证,可以提高监控的准确度和灵活性。即多个验证者节点可以交叉验证,满足确认次数后,告警即可生效,这样通过多验证者多次确认,避开bmc重启或升级等无效异常状态,提高了告警的准确度。
102.在一些实施例中,接收业务节点触发告警规则后生成的告警信息,还包括:
103.创建告警池;
104.对接收到的告警信息进行格式转换后放入所述告警池中。
105.在一些实施例中,分别利用每一个验证者节点对所述告警信息进行验证并基于验证结果生成对应分值,进一步包括:
106.每隔预设时间段利用其中一个所述验证者节点对所述告警信息进行验证以基于验证结果生成对应分值。
107.在一些实施例中,还包括:
108.对所述每一个验证者节点针对所述告警类型分别设置不同的权重;
109.判断当前已对所述告警信息进行验证的验证者节点的权重之和是否大于预设值;
110.响应于大于预设值,停止利用剩余的验证者节点继续对所述告警信息进行验证。
111.在一些实施例中,将每一个验证者节点生成的分值进行相加后作为所述告警信息的最终得分,进一步包括:
112.将已进行验证的每一个验证者节点对应的权重乘以对应的分值后相加作为所述告警信息的最终得分。
113.具体的,如图2所示,当告警产生后,告警产生后,可以经过预处理器进入告警池。预处理器的作用为负责将各种协议的告警统一转换成监控系统定义的告警,其还可以根据告警的类型指定该告警被两个验证者进行两次验证之间的最小时间间隔。并且不同的验证者节点在不同的告警上可以配置不同的权重,每一个告警均需要其验证者们的权重累加大于等于100%,因此将经历一段时间的验证期,在此期间,若传感器恢复正常,告警就将得到极低的打分,从而被识别出来。
114.这样通过将不同渠道的告警经过预处理器进入告警池,验证者对告警池中的告警进行验证并进行打分,不同类的告警具有不同的打分策略,使得告警就将变得更加精确。举
例说明,硬盘是否在位等状态类告警只有是和否两种答案,因此只有0分和100分;对于cpu占用率或时延等阈值类告警而言,不同的数值具有不同的分数,具体根据规则而定。当告警被累计权重大于100%的验证者打过分后,就将得到最终分数,并进入持久化层。持久化层的作用是将确认后的告警进行持久化存储,并且确认后的告警将出现在前端,提供给运维人员使用。
115.在一些实施例中,还包括:
116.响应于接收到调整验证者节点的权重的指令,根据所述指令将每一个验证者节点的权重进行更新。
117.具体的,如图2所示,不同的业务可以组装和配置自己的验证者,制作针对特定告警的验证逻辑。当部署验证者节点后,可以向协调者节点请求,重新分配特定告警的验证权重,协调者节点则审批权重,下发到各验证者,调整特定告警权重。
118.在一些实施例中,根据所述告警类型确定对所述告警信息进行验证的若干个验证者节点,进一步包括:
119.判断告警类型是否是预设的告警类型;
120.响应于所述告警类型是预设的告警类型,确定与预设的告警类型对应的预设验证者节点。
121.具体的,特定的告警可以在特定的验证者上拥有更高的权重,其打分更具有针对性。
122.本发明提出的方案通过多个验证者节点对告警信息进行验证,可以提高监控的准确度和灵活性。即多个验证者节点可以交叉验证,满足确认次数后,告警即可生效,这样通过多验证者多次确认,避开bmc重启或升级等无效异常状态,提高了告警的准确度。
123.基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种告警处理系统400,如图3所示,包括:
124.接收模块401,配置为接收业务节点触发告警规则后生成的告警信息;
125.第一确定模块402,配置为根据所述告警信息确定告警类型;
126.第二确定模块403,配置为根据所述告警类型确定对所述告警信息进行验证的若干个验证者节点;
127.验证模块404,配置为分别利用每一个验证者节点对所述告警信息进行验证并基于验证结果生成对应分值;
128.计算模块405,配置为将每一个验证者节点生成的分值进行相加后作为所述告警信息的最终得分;
129.第三确定模块406,配置为根据所述告警类型和所述最终得分确定所述告警信息对应的处理优先级。
130.在一些实施例中,分别利用每一个验证者节点对所述告警信息进行验证并基于验证结果生成对应分值,进一步包括:
131.每隔预设时间段利用其中一个所述验证者节点对所述告警信息进行验证以基于验证结果生成对应分值。
132.在一些实施例中,还包括:
133.对所述每一个验证者节点针对所述告警类型分别设置不同的权重;
134.判断当前已对所述告警信息进行验证的验证者节点的权重之和是否大于预设值;
135.响应于大于预设值,停止利用剩余的验证者节点继续对所述告警信息进行验证。
136.在一些实施例中,将每一个验证者节点生成的分值进行相加后作为所述告警信息的最终得分,进一步包括:
137.将已进行验证的每一个验证者节点对应的权重乘以对应的分值后相加作为所述告警信息的最终得分。
138.在一些实施例中,还包括:
139.响应于接收到调整验证者节点的权重的指令,根据所述指令将每一个验证者节点的权重进行更新。
140.在一些实施例中,根据所述告警类型确定对所述告警信息进行验证的若干个验证者节点,进一步包括:
141.判断告警类型是否是预设的告警类型;
142.响应于所述告警类型是预设的告警类型,确定与预设的告警类型对应的预设验证者节点。
143.在一些实施例中,接收业务节点触发告警规则后生成的告警信息,还包括:
144.创建告警池;
145.对接收到的告警信息进行格式转换后放入所述告警池中。
146.本发明提出的方案通过多个验证者节点对告警信息进行验证,可以提高监控的准确度和灵活性。即多个验证者节点可以交叉验证,满足确认次数后,告警即可生效,这样通过多验证者多次确认,避开bmc重启或升级等无效异常状态,提高了告警的准确度。
147.基于同一发明构思,根据本发明的另一个方面,如图4所示,本发明的实施例还提供了一种计算机设备501,包括:
148.至少一个处理器520;以及
149.存储器510,存储器510存储有可在处理器上运行的计算机程序511,处理器520执行程序时执行以下步骤:
150.s1,接收业务节点触发告警规则后生成的告警信息;
151.s2,根据所述告警信息确定告警类型;
152.s3,根据所述告警类型确定对所述告警信息进行验证的若干个验证者节点;
153.s4,分别利用每一个验证者节点对所述告警信息进行验证并基于验证结果生成对应分值;
154.s5,将每一个验证者节点生成的分值进行相加后作为所述告警信息的最终得分;
155.s6,根据所述告警类型和所述最终得分确定所述告警信息对应的处理优先级。
156.在一些实施例中,分别利用每一个验证者节点对所述告警信息进行验证并基于验证结果生成对应分值,进一步包括:
157.每隔预设时间段利用其中一个所述验证者节点对所述告警信息进行验证以基于验证结果生成对应分值。
158.在一些实施例中,还包括:
159.对所述每一个验证者节点针对所述告警类型分别设置不同的权重;
160.判断当前已对所述告警信息进行验证的验证者节点的权重之和是否大于预设值;
161.响应于大于预设值,停止利用剩余的验证者节点继续对所述告警信息进行验证。
162.在一些实施例中,将每一个验证者节点生成的分值进行相加后作为所述告警信息的最终得分,进一步包括:
163.将已进行验证的每一个验证者节点对应的权重乘以对应的分值后相加作为所述告警信息的最终得分。
164.在一些实施例中,还包括:
165.响应于接收到调整验证者节点的权重的指令,根据所述指令将每一个验证者节点的权重进行更新。
166.在一些实施例中,根据所述告警类型确定对所述告警信息进行验证的若干个验证者节点,进一步包括:
167.判断告警类型是否是预设的告警类型;
168.响应于所述告警类型是预设的告警类型,确定与预设的告警类型对应的预设验证者节点。
169.在一些实施例中,接收业务节点触发告警规则后生成的告警信息,还包括:
170.创建告警池;
171.对接收到的告警信息进行格式转换后放入所述告警池中。
172.本发明提出的方案通过多个验证者节点对告警信息进行验证,可以提高监控的准确度和灵活性。即多个验证者节点可以交叉验证,满足确认次数后,告警即可生效,这样通过多验证者多次确认,避开bmc重启或升级等异常状态,提高了告警的准确度。
173.基于同一发明构思,根据本发明的另一个方面,如图5所示,本发明的实施例还提供了一种计算机可读存储介质601,计算机可读存储介质601存储有计算机程序指令610,计算机程序指令610被处理器执行时执行以下步骤:
174.s1,接收业务节点触发告警规则后生成的告警信息;
175.s2,根据所述告警信息确定告警类型;
176.s3,根据所述告警类型确定对所述告警信息进行验证的若干个验证者节点;
177.s4,分别利用每一个验证者节点对所述告警信息进行验证并基于验证结果生成对应分值;
178.s5,将每一个验证者节点生成的分值进行相加后作为所述告警信息的最终得分;
179.s6,根据所述告警类型和所述最终得分确定所述告警信息对应的处理优先级。
180.在一些实施例中,分别利用每一个验证者节点对所述告警信息进行验证并基于验证结果生成对应分值,进一步包括:
181.每隔预设时间段利用其中一个所述验证者节点对所述告警信息进行验证以基于验证结果生成对应分值。
182.在一些实施例中,还包括:
183.对所述每一个验证者节点针对所述告警类型分别设置不同的权重;
184.判断当前已对所述告警信息进行验证的验证者节点的权重之和是否大于预设值;
185.响应于大于预设值,停止利用剩余的验证者节点继续对所述告警信息进行验证。
186.在一些实施例中,将每一个验证者节点生成的分值进行相加后作为所述告警信息的最终得分,进一步包括:
187.将已进行验证的每一个验证者节点对应的权重乘以对应的分值后相加作为所述告警信息的最终得分。
188.在一些实施例中,还包括:
189.响应于接收到调整验证者节点的权重的指令,根据所述指令将每一个验证者节点的权重进行更新。
190.在一些实施例中,根据所述告警类型确定对所述告警信息进行验证的若干个验证者节点,进一步包括:
191.判断告警类型是否是预设的告警类型;
192.响应于所述告警类型是预设的告警类型,确定与预设的告警类型对应的预设验证者节点。
193.在一些实施例中,接收业务节点触发告警规则后生成的告警信息,还包括:
194.创建告警池;
195.对接收到的告警信息进行格式转换后放入所述告警池中。
196.本发明提出的方案通过多个验证者节点对告警信息进行验证,可以提高监控的准确度和灵活性。即多个验证者节点可以交叉验证,满足确认次数后,告警即可生效,这样通过多验证者多次确认,避开bmc重启或升级等无效异常状态,提高了告警的准确度。
197.最后需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。
198.此外,应该明白的是,本文的计算机可读存储介质(例如,存储器)可以是易失性存储器或非易失性存储器,或者可以包括易失性存储器和非易失性存储器两者。
199.本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。
200.以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
201.应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
202.上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
203.本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
204.所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非
旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1