告警处理方法、装置、系统、电子设备及计算机存储介质与流程

文档序号:28048907发布日期:2021-12-17 19:47阅读:106来源:国知局
告警处理方法、装置、系统、电子设备及计算机存储介质与流程

1.本发明实施例涉及计算机技术领域,尤其涉及一种告警处理方法、装置、系统、电子设备及计算机存储介质。


背景技术:

2.随着云计算技术的发展和广泛应用,云计算服务作为上层应用的基石,其稳定性和可靠性越来越重要。以原生云(cloud native)为例,原生云中包含了底层物理设施,如服务器和实现服务器间通信的交换机等设备,如果要保证云系统的稳定,那么就需要保证底层物理设施的稳定、可靠运行和故障及时处理。
3.以交换机故障为例,为及时发现交换机故障并对其告警消息进行处理,一个或多个交换机与单个告警服务节点连接,在交换机上配置告警消息发送策略。在交换机需要发送告警消息时,按照配置的策略将告警消息发送给告警服务节点,由告警服务节点进行处理。这种方式中,交换机上的配置较为简单,但是一旦告警服务节点故障或者负载过大,就会导致整个告警服务不可用,使得可靠性不足。
4.为了提升可靠性,另一种方式是,使用多台告警服务节点与一个或多个交换机连接,在交换机上配置较为复杂的告警消息发送策略。交换机需要发送告警消息时,按照告警消息发送策略将告警消息发送到一个或多个告警服务节点。这种方式可以提升可靠性,但是交换机需要配置复杂的告警消息发送策略,且在多台告警服务节点之间还需要从服务角度考虑多台告警服务节点处理同一条告警消息的主备消息同步,使得告警服务整体不够简洁高效。同时,在告警服务节点变更或扩缩容场景下,需要再次针对所有的交换机进行二次配置修改操作,增加了稳定性风险。
5.综上所述,亟需一种配置简单、运行可靠、可用性高的告警处理方案。


技术实现要素:

6.有鉴于此,本发明实施例提供一种告警处理方案,以解决上述部分或全部问题。
7.根据本发明实施例的第一方面,提供了告警处理方法,包括:接收交换机发送的告警消息,所述告警消息携带的目标地址为所述交换机配置的域名指向的虚拟ip地址;基于转发配置信息,从多个告警服务节点确定处理所述告警消息的目标告警服务节点;将所述告警消息发送到所述目标告警服务节点进行处理。
8.根据本发明实施例的第二方面,提供了一种告警处理方法,包括:接收交换机发送的告警消息,其中,所述交换机用于在多个服务器之间进行数据传输,交换机通过配置的域名向与所述域名对应的虚拟ip地址发送告警消息;基于转发配置信息,从多个告警服务节点确定处理所述告警消息的目标告警服务节点;将所述告警消息发送到所述目标告警服务节点进行处理,并通过目标告警服务节点将处理结果发送至运维终端。
9.根据本发明实施例的第三方面,提供了一种告警处理装置,包括:获取模块,用于接收交换机发送的告警消息,所述告警消息携带的目标地址为所述交换机配置的域名指向
的虚拟ip地址;确定模块,用于基于转发配置信息,从多个告警服务节点确定处理所述告警消息的目标告警服务节点;转发模块,用于将所述告警消息发送到所述目标告警服务节点进行处理。
10.根据本发明实施例的第四方面,提供了一种告警处理系统,所述告警处理系统包括负载均衡节点和多个告警服务节点,所述负载均衡节点,用于接收交换机发送的告警消息,其中,所述告警消息携带的目标地址为所述交换机配置的域名指向的虚拟ip地址;基于转发配置信息,从多个告警服务节点确定处理所述告警消息的目标告警服务节点;将所述告警消息发送到所述目标告警服务节点进行处理;所述多个告警服务节点,与负载均衡节点通信连接,用于对获取的所述告警消息进行处理。
11.根据本发明实施例的第五方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存储至少一可执行指令,所述可执行指令使所述处理器执行如第一方面或第二方面所述的告警处理方法对应的操作。
12.根据本发明实施例的六方面,提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面或第二方面所述的告警处理方法。
13.根据本发明实施例提供的告警处理方案,由于负载均衡节点配置了虚拟ip地址以与交换机中配置的域名对应,这样,即使存在多个交换机,都只需在这些交换机中配置该域名,就可以使这些交换机发送的告警消息经过域名解析(dns)到达配置有虚拟ip地址的负载均衡节点,一方面,不管后台告警服务节点如何变换,交换机只需根据该域名发送告警消息即可;另一方面,交换机上也无需配置复杂的告警消息发送策略,使得在告警服务节点有变化(如扩容、缩容时)也无需更改交换机上的配置,从而使得交换机上配置简单。而且,告警服务节点为多个,根据转发配置信息确定对告警消息进行处理的目标告警服务节点,可以提升整个告警服务的可用性,避免单个告警服务节点失效时导致的服务不可用情况,使告警服务具有高可用性。
附图说明
14.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
15.图1a为根据本发明实施例一的一种告警处理方法的步骤流程图;
16.图1b为根据本发明实施例一的一种使用场景中的告警处理系统与交换机连接的结构示意图;
17.图2a为根据本发明实施例二的一种告警处理方法的步骤流程图;
18.图2b为根据本发明实施例二的一种使用场景中的告警处理系统与交换机连接的结构示意图;
19.图2c为根据本发明实施例二的一种使用场景中告警服务节点a失效时的告警处理系统与交换机连接的结构示意图;
20.图3为根据本发明实施例三的一种告警处理方法的步骤流程图;
21.图4为根据本发明实施例四的一种运维平台与交换机通信连接的结构框图;
22.图5为根据本发明实施例五的一种告警处理装置的结构框图;
23.图6为根据本发明实施例六的一种告警处理装置的结构框图;
24.图7为根据本发明实施例七的一种电子设备的结构示意图。
具体实施方式
25.为了使本领域的人员更好地理解本发明实施例中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明实施例一部分实施例,而不是全部的实施例。基于本发明实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本发明实施例保护的范围。
26.下面结合本发明实施例附图进一步说明本发明实施例具体实现。
27.实施例一
28.参照图1a,示出了根据本发明实施例一的一种告警处理方法的步骤流程图。在本实施例中,该告警处理方法可以由负载均衡节点(server load balancer)执行,但不限于此,其它适当设备或节点也可参照本实施例实现本发明的告警处理方案。
29.本实施例的告警处理方法包括以下步骤:
30.步骤s102:接收交换机发送的告警消息,所述告警消息携带的目标地址为所述交换机配置的域名指向的虚拟ip地址。
31.在本实施例中,通过网络连接负载均衡节点与一个或多个交换机,由负载均衡节点获取交换机发送的告警信息,并将其转发到多个告警服务节点中的至少一个告警服务节点。
32.负载均衡节点可以配置于服务端(服务端包括服务器和/或云端),本实施例中,以负载均衡节点配置于云端(例如原生云)为例进行说明。
33.虚拟ip地址可以实现为负载均衡节点基于dnat(destination network address translation,目的地址转换)工作模式的vip地址(virtual_serverip)。
34.该虚拟ip地址用于与一个或多个(本实施例中的多个可以是两个或两个以上)交换机交互,这样多个交换机均通过该虚拟ip地址与负载均衡节点通信,对于交换机而言,其根据域名与一个负载均衡节点通信,负载均衡节点通过该虚拟ip地址对其屏蔽了告警消息转发细节,从而简化了交换机的配置。
35.采用这种方式,对于交换机而言,在交换机初始部署阶段,如果配置了固定的用于发送告警消息服务的域名,那么在配置负载均衡节点时,将负载均衡节点的虚拟ip地址和交换机上配置的域名进行dns服务注册,使该域名指向虚拟ip地址,就可以实现交换机的告警消息顺利发送到负载均衡节点。
36.由此,交换机只需配置该虚拟ip地址对应的域名即可,从而减少了交换机上的配置复杂度,使得后续告警服务节点进行扩容、缩容或者故障切换时可对交换机保持透明,从而减少了交换机的配置压力和运维压力、提高了告警消息处理效率。
37.基于此,当交换机出现故障,需要发送告警消息时,交换机根据其配置可以向域名发送告警消息,通过dns服务对域名进行解析,获得到虚拟ip地址,从而将告警消息发送到虚拟ip地址,实现将告警消息发送到负载均衡节点。
38.在一种可行方式中,该告警消息可以为交换机的snmp trap消息,该snmp trap消息用于当被监控端(如交换机)出现异常或故障时,比如性能问题导致的异常或故障,甚至是网络设备接口宕掉等情况时,携带相应的异常或故障信息,以告知告警服务节点。
39.步骤s104:基于转发配置信息,从多个告警服务节点确定处理所述告警消息的目标告警服务节点。
40.负载均衡节点中预先设置有针对告警消息的转发配置信息,该转发配置信息可以是根据需要配置的任何适当形式的信息,例如,转发配置信息为预置的转发表,转发表中存储了转发策略以及告警服务节点信息。其中,所述告警服务节点信息中包括各告警服务节点的ip地址、状态标记和节点权重值等。
41.转发策略可以由本领域技术人员根据需要适当配置,本实施例对此不作限制。例如,转发策略可以指示通过主备策略进行告警消息的转发,即,将告警消息全部转发到当前可用的主告警服务节点。
42.本实施例中,告警服务节点包括多个,以提升告警服务的鲁棒性,确保告警服务的高可用性。告警服务节点用于对告警消息进行处理,例如,解析告警消息,将告警消息中的信息记录到日志中等。基于此,负载均衡节点可以根据转发配置信息从多个告警服务节点中确定目标告警服务节点,以及时对告警消息进行转发和处理,且该过程对交换机无感知。
43.步骤s106:将所述告警消息发送到所述目标告警服务节点进行处理。
44.在确定了目标告警服务节点后,本领域技术人员可以采用任何适当的方式将告警消息发送给目标告警服务节点,本实施例对此不作限制。
45.例如,负载均衡节点通过udp协议与目标告警服务节点连接,并通过udp协议将告警消息发送给目标告警服务节点,以使目标告警服务节点对告警消息进行处理。
46.下面结合一种具体的提供告警处理服务的告警处理系统对上述过程进行说明如下:如图1b所示,所述告警处理系统包括负载均衡节点和多个告警服务节点,所述负载均衡节点与所述多个告警服务节点通信连接。
47.在本实施例中,所述负载均衡节点用于执行上述的告警处理方法的步骤s102~步骤s106,以将告警消息发送到目标告警服务节点。
48.具体地,一个或多个交换机发出的告警消息向统一域名所指示的地址发送,该统一域名被解析后发送到与该统一域名对应的虚拟ip地址(即负载均衡节点配置的虚拟ip地址),负载均衡节点通过该虚拟ip地址接收所述一个或多个交换机发送来的告警消息,进而在根据转发配置信息确定目标告警服务节点后,将告警消息转发到目标告警服务节点。目标告警服务节点接收到告警消息后对告警消息进行解析处理,并获取其中的源地址(即发送该告警消息的交换机的地址)等内容记录到日志中。
49.通过本实施例,由于负载均衡节点配置了虚拟ip地址以与交换机中配置的域名对应,这样,即使存在多个交换机,都只需在这些交换机中配置该域名,就可以使这些交换机发送的告警消息经过域名解析(dns)到达配置有虚拟ip地址的负载均衡节点,一方面,不管后台告警服务节点如何变换,交换机只需根据该域名发送告警消息即可;另一方面,交换机上也无需配置复杂的告警消息发送策略,使得在告警服务节点有变化(如扩容、缩容时)也无需更改交换机上的配置,从而使得交换机上配置简单。而且,告警服务节点为多个,根据转发配置信息确定对告警消息进行处理的目标告警服务节点,可以提升整个告警服务的可
用性,避免单个告警服务节点失效时导致的服务不可用情况,使告警服务具有高可用性。
50.实施例二
51.参照图2a,示出了根据本发明实施例二的一种告警处理方法的步骤流程图。
52.本实施例中,仍以由负载均衡节点执行本实施例的告警处理方法为示例,本实施例的告警处理方法包括以下步骤:
53.步骤s200:设置用于统一接收告警消息的虚拟ip地址。
54.虚拟ip地址可以为负载均衡节点基于dnat模式(目标地址转换)的vip地址。交换机通过统一的域名将告警消息发送到该虚拟ip地址,再由该虚拟ip地址对应的负载均衡节点对告警消息进行转发。
55.为了保证交换机能够将告警消息发送到负载均衡节点,对虚拟ip地址进行dns服务注册,使交换机上配置的域名与虚拟ip地址对应。
56.注册后,交换机在需要向域名对应的地址发送告警消息时,通过dns对该域名进行解析,以将告警消息发送到负载均衡节点的虚拟ip地址。这样,交换机只需在部署阶段配置域名,该域名指向虚拟ip地址即可,后续负载均衡节点和告警服务节点的扩容、缩容、故障切换和态势感知等操作均对交换机透明,无需改变交换机的配置,极大降低运维压力和告警消息的处理效率。
57.步骤s202:通过虚拟ip地址接收交换机发送的告警消息,所述告警消息携带的目标地址为所述交换机配置的域名指向的虚拟ip地址。
58.负载均衡节点通过虚拟ip地址接收交换机发送的告警消息。
59.在本实施例中,告警消息携带有源地址和目标地址,所述源地址为发送所述告警消息的交换机的ip地址,所述目标地址为虚拟ip地址。由于交换机可能存在多个,因此,在本实施例中,以源地址作为交换机的唯一标识,使得后续在进行告警消息处理时可以方便地确定出现故障的交换机,便于工作人员维修。而负载均衡节点通过虚拟ip地址与多个交换机通信,使得各交换机发送的告警消息均可以到达负载均衡节点,确保在有多个交换机时其配置也较为简单,而且可以对交换屏蔽负载均衡节点分配告警服务节点的逻辑。
60.步骤s204:基于转发配置信息,从多个告警服务节点确定处理所述告警消息的目标告警服务节点。
61.如前所述,负载均衡节点的转发配置信息包括转发策略和告警服务节点信息。
62.在本实施例中,转发策略可以包括主备策略、第一负载策略、和/或第二负载策略等。
63.主备策略指示将全部告警消息转发到主告警服务节点,主备策略适用于多个告警服务节点组成主备节点的形式。在一种可行方式中,告警服务节点信息中还包括节点权重值,用于指示告警服务节点是否为主告警服务节点。
64.第一负载策略指示按照负载权重值转发,且多个告警服务节点的负载权重值相等,可选地,告警服务节点的负载权重值由其处理性能确定,如多个告警服务节点的处理性能相同或相近,则其负载权重值相同。
65.第二负载策略指示按照负载权重值转发,且多个告警服务节点的负载权重值不相等,可选地,告警服务节点的负载权重值由其处理性能确定,如多个告警服务节点的处理性能不同,则其负载权重值不相同。
66.告警服务节点信息中记载有告警服务节点的地址信息、和状态标记等。
67.地址信息用于指示本告警服务节点的ip地址,在本实施例中也用于唯一标识对应的告警服务节点。
68.状态标记用于确定告警服务节点的可用状态。当某个告警服务节点不可用时,可以将其状态标记置为某个设定值(例如为“0”),从而实现故障告警服务节点的自动剔除,这样不需要在转发配置信息中实际删除故障的告警服务节点,避免了频繁地更新转发配置信息,降低了负载均衡节点的负载。
69.在本实施例中,为了确保高可用性,步骤s204包括以下子步骤:
70.子步骤s2041:基于转发配置信息中用于指示告警服务节点状态的状态标记,确定多个告警服务节点中的可用告警服务节点。
71.在本实施例中,告警服务节点信息中的状态标记用于指示告警服务节点的可用状态,该状态标记可以通过下述方式确定:对多个告警服务节点进行可用性探测;根据探测结果,设置转发配置信息中的状态标记。
72.例如,负载均衡节点通过向各告警服务节点的服务端口发送心跳报文的方式,确定各告警服务节点是否可以正确响应,进而确定各告警服务节点的可用性,根据可用性确定告警服务节点的状态标记。通过这种方式,使得告警服务节点无需进行保活,实现了告警服务节点与保活服务的解耦合,简化了数据交互通路。
73.以告警服务节点为3个,记作告警服务节点a~c为例,默认状态下,告警服务节点a~c的状态标记为第一标记(例如为“1”),指示这3个告警服务节点均可用。若通过可用探测,确定告警服务节点a故障失效、不可用,则将告警服务节点a的状态标记置为第二标记(例如为“0”),指示告警服务节点a不可用。
74.可选地,除了能够根据可用探测的探测结果更新状态标记外,如果多个告警服务节点形成主备节点,还可以根据探测结果设置告警服务节点信息中的节点权重值。
75.如:根据所述探测结果和所述转发配置信息中的、告警服务节点信息中的节点权重值,确定是否存在失效的主告警服务节点;若存在失效的主告警服务节点,则从失效的主告警服务节点对应的备告警服务节点中,确定新的主告警服务节点;更新转发配置信息中与失效的主告警服务节点和新的主告警服务节点对应的节点权重值。
76.仍以前述的3个告警服务节点为例,若告警服务节点a为主告警服务节点,其节点权重值为90,告警服务节点b和c为备告警服务节点,节点权重值均为5。在可用探测确定告警服务节点a失效时,将告警服务节点a的状态标记置为“0”,告警服务节点a的节点权重值为0,告警服务节点b成为新的主告警服务节点,节点权重值设置为90,告警服务节点c的节点权重值设置为10。可见,通过设置节点权重值,还可有效区分主备节点。
77.子步骤s2042:从可用告警服务节点中确定目标告警服务节点。
78.在第一种情况中,多个告警服务节点形成主备节点时,子步骤s2042可以实现为:根据所述转发配置信息,获得所述可用告警服务节点的节点权重值,其中,所述节点权重值用于指示告警服务节点是否为主告警服务节点;基于所述节点权重值,确定所述可用告警服务节点中的主告警服务节点为目标告警服务节点。
79.如,根据各告警服务节点的节点权重值,确定节点权重值最高的可用告警服务节点(即主告警服务节点)为目标告警服务节点。
80.在第二种情况中,多个告警服务节点根据负载权重值进行转发,此种情况中,若多个告警服务节点的负载权重值相等,则子步骤s2042可以实现为:根据转发配置信息中的转发策略,确定按照第一负载策略转发所述告警消息,其中,第一负载策略对应的多个可用告警服务节点的负载权重值相等;获得告警消息的散列值,和所述多个可用告警服务节点对应的负载状态信息;根据散列值和对应的负载状态信息,从可用告警服务节点中确定目标告警服务节点。
81.多个可用告警服务节点的负载权重值相等,表示这些可用告警服务节点的数据处理性能相同或相近,因此告警消息可均分到多个告警服务节点中。为了实现此目的,针对某个告警消息,通过计算其散列值,再根据散列值和各可用告警服务节点的负载状态信息(如硬件计算资源的占用率,硬件计算资源包括但不限于cpu、内存、gpu,当前处理负载等等)确定目标告警服务节点。基于告警消息的散列值并结合告警服务节点的负载状态信息,进一步提升了上述多个告警服务节点的负载均衡度。
82.在本情况的另一种实现中,也可以仅根据散列值确定目标告警服务节点,如在计算获得告警消息的散列值后,使用散列值除以可用告警服务节点的数量,得到余数,并将告警消息发送到与余数对应的可用告警服务节点。此种方式同样可实现多个告警服务节点的负载均衡,且可有效确定目标告警服务节点。
83.在第三种情况中,若多个告警服务节点的负载权重值不相等,则子步骤s2042可以实现为:根据转发配置信息中的转发策略,确定按照第二负载策略转发所述告警消息,其中,第二负载策略对应的多个可用告警服务节点的负载权重值不相等;获得所述多个可用告警服务节点对应的负载权重值,和所述多个可用告警服务节点对应的负载状态信息;根据的所述负载权重值和所述负载状态信息,从多个可用告警服务节点中,确定所述目标告警服务节点。
84.多个可用告警服务节点的负载权重值不相等表示可用告警服务节点的数据处理性能不同,因此可以使数据处理性能更高的可用告警服务节点处理更多的告警消息,反之性能较低的处理较少的告警消息。为此,针对某个告警消息,可以先根据负载状态信息确定负载低于负载设定值(负载设定值可以根据需要确定,如50%、70%等)的可用告警服务节点,再从确定的这些可用告警服务节点中选取负载权重值最高的作为目标告警服务节点。这样既能够保证数据处理性能更高的可用告警服务节点处理的告警消息更多,又能够避免一些告警服务节点过于空闲,实现较好的负载均衡效果。
85.可选地,在将告警消息发送到目标告警服务节点后,可以更新目标告警服务节点的所述负载权重值和所述负载状态信息,以保证后续负载均衡的可靠性。
86.例如,在向目标告警服务节点发送一个告警消息后,就将目标告警服务节点的负载权重值减1,直至所有可用告警服务节点的负载权重值均为0时,对可用告警服务节点的负载权重值进行重新赋值。目标告警服务节点的负载状态信息可以通过对目标告警服务节点进行实时检测的方式更新。
87.在本情况的另一种实现中,也可以仅根据负载权重值确定目标告警服务节点,例如设告警服务节点a的负载权重值为7,告警服务节点b的负载权重值为2,告警服务节点c的负载权重值为1,则针对第一个告警消息,根据负载权重值,告警服务节点a为目标告警服务节点,后续将告警消息发送给告警服务节点a,并将告警服务节点a的负载权重值减1。
88.再接收到告警消息时,告警服务节点a的负载权重值为6,其仍为目标告警服务节点,并将告警服务节点a的负载权重值减1。直至告警服务节点a的负载权重值为1后,告警服务节点b的负载权重值最高,将其确定为目标告警服务节点,并将其负载权重值减1。在告警服务节点的负载权重值均为0之后,重置所有可用告警服务节点的负载权重值。
89.步骤s206:将所述告警消息发送到所述目标告警服务节点进行处理。
90.在一具体实现中,步骤s206实现为:将所述告警消息携带的虚拟ip地址转换为所述目标告警服务节点的地址信息;将告警消息发送到所述地址信息对应的目标告警服务节点进行处理。
91.这种通过目标地址转换的方式对告警消息进行转换,就可以使告警消息的目标地址从虚拟ip地址转换为目标告警服务节点的地址信息,从而将其发送到目标告警服务节点,而且可以保持告警消息中的源地址不变,从而很好地指示出现告警的交换机,从而很好地适应原生云场景。
92.下面结合图2b所示的告警处理系统,针对多个告警服务节点中存在失效节点和不存在失效节点两种情况,分别对确定目标告警服务节点的过程进行说明:
93.如图2b所示,所述告警处理系统包括负载均衡节点和多个告警服务节点,所述多个告警服务节点形成主备节点,所述负载均衡节点分别与多个所述告警服务节点通信连接。
94.负载均衡节点用于执行前述的步骤s200~步骤s206。告警服务节点用于对获取的所述告警消息进行处理。
95.设定在本使用场景中,告警处理系统的告警服务节点为n个,分别为告警服务节点a~n,其中,告警服务节点a为主告警服务节点,剩余为备告警服务节点。
96.第一种情况中,在不存在失效节点情况下,对告警服务节点进行可用探测的探测结果指示n个告警服务节点均可用,则可用告警服务节点为告警服务节点a~n。负载均衡节点接收到告警消息后,转发策略确定按照主备策略转发,则告警服务节点a为目标告警服务节点。
97.第二种情况中,如图2c所示,在存在失效节点的情况下,对告警服务节点进行可用探测,探测结果确定告警服务节点a不可用,则将告警服务节点a的状态标记更新为第二标记,根据主告警服务节点的切换规则(即根据状态标记进行切换)将告警服务节点b作为主告警服务节点,告警服务节点a被剔除。可用告警服务节点为告警服务节点b~n。负载均衡节点接收到告警消息后,确定告警服务节点b为目标告警服务节点。
98.通过本实施例,由于负载均衡节点配置了虚拟ip地址用于与域名对应,这样只需在交换机中配置该域名,就可以使交换机发送的告警消息经过域名解析(dns)到达配置有该虚拟ip地址的负载均衡节点,这样使得交换机上只需要配置域名,就可以将告警消息发送到虚拟ip地址,从而使得交换机上配置简单。
99.告警服务节点为多个,负载均衡节点能根据预设的转发配置信息确定对告警消息进行处理的目标告警服务节点,这样通过多个告警服务节点提升了整个告警服务的可用性,避免单个告警服务节点失效时导致整个服务不可用的情况。
100.此外,由于交换机的配置简单且使用域名与负载均衡节点的虚拟ip地址对应,实现了负载均衡节点对外抽象成唯一dns域名,对交换机屏蔽告警消息转发细节,做到对交换
机侧的透明无感知,而且针对用户差异化的需求,无需变更交换机配置,只需调整负载均衡节点的转发配置信息即可,可以减少交换机配置频次,降低因人工介入配置导致误操作的概率。
101.除此之外,利用负载均衡节点的dnat(目标地址转换)工作模式的负载均衡特性,实现多个告警服务节点可以采用集群工作模式,确保告警服务节点之间对告警消息能够分担处理,确保高可用,而且使得告警服务节点的扩展性更好,进行扩容或者缩容时对交换机透明。
102.告警服务节点之间采用主备模式,工作正常时,告警消息直接转发至主节点;当主节点失效时,告警消息将转发至备节点,而且通过主备权重值可以实现自动切换,依靠主备节点可避免服务中断,提高了健壮性,解决单个告警服务节点的故障风险,确保不间断告警服务。
103.另一方面,负载均衡节点具有的可用性探测功能(即健康检查机制),能够对每个告警服务节点的服务端口进行可用性探测,在检测到告警服务节点异常失效后,可以自动剔除,并自动将告警消息发送到其他告警服务节点,保证了服务连续性。
104.而且采用负载均衡节点进行可用性探测,使得告警服务节点不需要自身进行保活,实现了告警服务节点与保活服务之间的解耦合,简化了数据交互通路,且降低了告警服务节点对中间件的依赖。
105.通过此种方式,克服了现有的使用单独的dns域名配置解析多台告警服务节点ip地址的方案,缺少针对告警服务节点健康检查机制,调度策略只有rr轮询一种策略。而且避免了由于dns服务本身存在缓存机制,因此在故障的告警服务节点恢复后,整体服务还需等待dns恢复,存在一定的滞后性的问题,以及避免了受制于单个dns response数据报文的大小,单个dns解析支持配置的告警服务节点数量有限,不利于横向弹性扩展的问题。
106.实施例三
107.参照图3,示出了本发明实施例三的一种告警处理方法的流程示意图。
108.在本实施例中,告警处理方法包括以下步骤:
109.步骤s302:接收交换机发送的告警消息。
110.其中,所述交换机用于在多个服务器之间进行数据传输,交换机通过配置的域名向与所述域名对应的虚拟ip地址发送告警消息。
111.本实施例中,该告警处理方法可以以负载均衡节点作为执行主体。其通过虚拟ip地址接收告警消息的实现方式可以如实施例一或二所述,本实施例不再赘述。
112.步骤s304:基于转发配置信息,从多个告警服务节点确定处理所述告警消息的目标告警服务节点。
113.转发配置信息可以配置在负载均衡节点中,其也可以实现为转发表。本领域技术人员可以采用任何适当的方式从告警服务节点中确定目标告警服务节点,例如,采用实施例一或二所述的方式,故不再赘述。
114.步骤s306:将所述告警消息发送到所述目标告警服务节点进行处理,并通过目标告警服务节点将处理结果发送至运维终端。
115.在确定告警服务节点后,通过dnat处理(目标地址转换)将告警消息携带的目标地址转换为目标告警服务节点的地址信息,从而实现将转换后的告警消息发送到目标告警服
务节点。
116.目标告警服务节点在接收到告警消息后,对告警消息进行处理,如对其进行解析,获取其中的源地址,进而根据源地址确定发生故障的交换机。目标告警服务节点可以将解析获得的数据作为处理结果发送至运维终端,以便于运维人员查看,以及及时对交换机进行维修等。
117.通过本实施例,可以通过虚拟ip地址接收交换机发送的告警消息,再将告警消息转发到多个告警服务节点中的一个,从而使交换机可以只与负载均衡节点通信,简化了交换机的配置,而且可以对交换机屏蔽告警服务节点的变化(如扩容、缩容等),避免频繁更改交换机的配置,并确保告警服务的高可用性。而通过目标告警服务节点将处理结果发送至运维终端,可以使运维人员及时获知交换机情况,从而进行及时处理。
118.实施例四
119.参照图4,示出了根据本发明实施例四的一种运维平台与交换机通信连接的结构框图。
120.本实施例的运维平台,包括运维服务端和运维终端,运维服务端包括前述的告警处理系统,运维服务端分别与运维终端和交换机通信连接,并将对交换机发送的告警消息进行处理的处理结果发送至运维终端。
121.本实施例的运维平台可以用于对交换机网络进行维护,例如,应用于接收和处理交换机发送的告警消息。交换机可以与多个服务器进行数据传输。
122.在交换机工作过程中,如果交换机出现异常或故障事件(如设备接口宕掉等),则交换机会发出告警消息,以通知运维人员存在故障。本实施例的运维平台的告警处理系统具有一个用于接收告警消息的虚拟ip地址,通过该虚拟ip地址和对应的域名与交换机通信连接,以接收告警消息。
123.在接收到告警消息后,通过转发配置信息确定目标告警服务节点,并将告警消息发送到目标告警服务节点,以指示其进行处理。
124.告警服务节点进行的处理例如为:将告警消息保存至日志中、将告警消息转发至对应的运维人员的运维终端(图中未示出)等等。
125.可选地,在本实施例中,转发配置信息中包括告警服务节点信息。其中,包括但不限于节点权重值和状态标记等。
126.负载均衡节点在确定目标告警服务节点时,可以根据状态标记确定可用的告警服务节点,再从可用的告警服务节点中确定节点权重值最高的主告警服务节点作为目标告警服务节点。之后,通过目标地址转换的方式,将告警消息中的目标地址由虚拟ip地址替换为目标告警服务节点的ip地址,从而实现将告警消息发送到目标告警服务节点的目的。
127.通过本实施例,实现了在交换机工作的过程中,利用运维系统对其运行进行维护,能够可靠地接收交换机发送的告警消息,并分配对应的告警服务节点对告警消息进行处理,从而保证了运维人员能够及时获知交换机的告警,并进行相应的处理,保证了交换机运行的可靠性,从而保证了服务端运行的可靠性。
128.实施例五
129.参照图5,示出了根据本发明实施例五的一种告警处理装置的结构框图。
130.本实施例的告警处理装置包括:
131.获取模块502,用于接收交换机发送的告警消息,所述告警消息携带的目标地址为所述交换机配置的域名指向的虚拟ip地址;
132.确定模块504,用于基于转发配置信息,从多个告警服务节点确定处理所述告警消息的目标告警服务节点;
133.转发模块506,用于将所述告警消息发送到所述目标告警服务节点进行处理。
134.可选地,所述确定模块504包括:
135.可用确定模块5041,用于基于转发配置信息中用于指示告警服务节点状态的状态标记,确定多个告警服务节点中的可用告警服务节点;
136.目标确定模块5042,用于从所述可用告警服务节点中确定所述目标告警服务节点。
137.可选地,所述装置还包括:
138.检测模块508,用于对所述多个告警服务节点进行可用性探测;
139.标记更新模块510,用于根据探测结果,设置所述转发配置信息中的所述状态标记。
140.可选地,所述装置还包括:
141.失效确定模块512,用于根据所述探测结果和所述转发配置信息中的节点权重值,确定是否存在失效的主告警服务节点,所述节点权重值用于指示告警服务节点是否为主告警服务节点;
142.主备切换模块514,用于若存在失效的主告警服务节点,则从失效的主告警服务节点对应的备告警服务节点中,确定新的主告警服务节点;
143.信息更新模块516,用于更新所述转发配置信息中与失效的主告警服务节点和新的主告警服务节点对应的节点权重值。
144.可选地,所述目标确定模块5042用于根据所述转发配置信息,获得所述可用告警服务节点的节点权重值,其中,所述节点权重值用于指示告警服务节点是否为主告警服务节点;基于所述节点权重值,确定所述可用告警服务节点中的主告警服务节点为目标告警服务节点。
145.可选地,所述目标确定模块5042用于根据所述转发配置信息中的转发策略,确定按照第一负载策略转发所述告警消息所述第一负载策略指示多个可用告警服务节点的负载权重值相等;获得所述告警消息的散列值,和所述多个可用告警服务节点对应的负载状态信息;根据所述散列值和对应的负载状态信息,从所述可用告警服务节点中确定所述目标告警服务节点。
146.可选地,所述目标确定模块5042用于根据所述转发配置信息中的转发策略,确定按照第二负载策略转发所述告警消息,其中,所述第二负载策略指示多个可用告警服务节点的负载权重值不相等;获得所述多个可用告警服务节点对应的负载权重值,和所述多个可用告警服务节点对应的负载状态信息;根据的所述负载权重值和所述负载状态信息,从多个可用告警服务节点中,确定所述目标告警服务节点。
147.可选地,所述装置还包括:负载更新模块518,用于更新所述目标告警服务节点的所述负载权重值和所述负载状态信息。
148.可选地,转发模块506用于将所述告警消息携带的所述虚拟ip地址转换为所述目
标告警服务节点的地址信息;将所述告警消息发送到所述地址信息所对应的目标告警服务节点进行处理。
149.可选地,所述装置还包括:设置模块500,用于在接收交换机发送的告警消息之前,设置用于统一接收告警消息的虚拟ip地址;获取模块502用于通过所述虚拟ip地址接收交换机发送的告警消息。
150.本实施例的告警处理装置用于实现前述多个方法实施例中相应的告警处理方法,并具有相应的方法实施例的有益效果,在此不再赘述。此外,本实施例的告警处理装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述,在此亦不再赘述。
151.实施例六
152.参照图6,示出了根据本发明实施例五的一种告警处理装置的结构框图。
153.在本实施例中,告警处理装置包括:
154.接收模块602,用于接收交换机发送的告警消息,其中,所述交换机用于在多个服务器之间进行数据传输,交换机通过配置的域名向与所述域名对应的虚拟ip地址发送告警消息;
155.节点匹配模块604,用于基于转发配置信息,从多个告警服务节点中,确定处理所述告警消息的目标告警服务节点;
156.发送处理模块606,用于将所述告警消息发送到所述目标告警服务节点进行处理,并通过目标告警服务节点处理结果发送至运维终端。
157.本实施例的告警处理装置用于实现前述多个方法实施例中相应的告警处理方法,并具有相应的方法实施例的有益效果,在此不再赘述。此外,本实施例的告警处理装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述,在此亦不再赘述。
158.实施例七
159.参照图7,示出了根据本发明实施例七的一种电子设备的结构示意图,本发明具体实施例并不对电子设备的具体实现做限定。
160.如图7所示,该电子设备可以包括:处理器(processor)702、通信接口(communications interface)704、存储器(memory)706、以及通信总线708。
161.其中:
162.处理器702、通信接口704、以及存储器706通过通信总线708完成相互间的通信。
163.通信接口704,用于与其它电子设备如终端设备或服务器进行通信。
164.处理器702,用于执行程序710,具体可以执行上述告警处理方法实施例中的相关步骤。
165.具体地,程序710可以包括程序代码,该程序代码包括计算机操作指令。
166.处理器702可能是中央处理器cpu,或者是特定集成电路asic(application specific integrated circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个cpu;也可以是不同类型的处理器,如一个或多个cpu以及一个或多个asic。
167.存储器706,用于存放程序710。存储器706可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
168.程序710具体可以用于使得处理器702执行以下操作:接收交换机发送的告警消
息,所述告警消息携带的目标地址为所述交换机配置的域名指向的虚拟ip地址;基于转发配置信息,从多个告警服务节点确定处理所述告警消息的目标告警服务节点;将所述告警消息发送到所述目标告警服务节点进行处理。
169.在一种可选的实施方式中,程序710还用于使得处理器702在所述基于转发配置信息,从多个告警服务节点确定处理所述告警消息的目标告警服务节点时,基于转发配置信息中,用于指示告警服务节点状态的状态标记,确定多个告警服务节点中的可用告警服务节点;从所述可用告警服务节点中确定所述目标告警服务节点。
170.在一种可选的实施方式中,程序710还用于使得处理器702对所述多个告警服务节点进行可用性探测;根据探测结果,设置所述转发配置信息中的所述状态标记。
171.在一种可选的实施方式中,程序710还用于使得处理器702根据所述探测结果和所述转发配置信息中的节点权重值,确定是否存在失效的主告警服务节点,所述节点权重值用于指示告警服务节点是否为主告警服务节点;若存在失效的主告警服务节点,则从失效的主告警服务节点对应的备告警服务节点中,确定新的主告警服务节点;更新所述转发配置信息中与失效的主告警服务节点和新的主告警服务节点对应的节点权重值。
172.在一种可选的实施方式中,程序710还用于使得处理器702在从所述可用告警服务节点中确定所述目标告警服务节点时,根据所述转发配置信息,获得所述可用告警服务节点的节点权重值,其中,所述节点权重值用于指示告警服务节点是否为主告警服务节点;基于所述节点权重值,确定所述可用告警服务节点中的主告警服务节点为目标告警服务节点。
173.在一种可选的实施方式中,程序710还用于使得处理器702在从所述可用告警服务节点中确定所述目标告警服务节点时,根据所述转发配置信息中的转发策略,确定按照第一负载策略转发所述告警消息,其中,所述第一负载策略指示多个可用告警服务节点的负载权重值相等;获得所述告警消息的散列值,和所述多个可用告警服务节点对应的负载状态信息;根据所述散列值和对应的所述负载状态信息,从所述可用告警服务节点中确定所述目标告警服务节点。
174.在一种可选的实施方式中,程序710还用于使得处理器702在从所述可用告警服务节点中确定所述目标告警服务节点时,根据所述转发配置信息中的转发策略,确定按照第二负载策略转发所述告警消息,其中,所述第二负载策略指示多个可用告警服务节点的负载权重值不相等;获得所述多个可用告警服务节点对应的负载权重值,和所述多个可用告警服务节点对应的负载状态信息;根据的所述负载权重值和所述负载状态信息,从多个可用告警服务节点中,确定所述目标告警服务节点。
175.在一种可选的实施方式中,程序710还用于使得处理器702更新所述目标告警服务节点的所述负载权重值和所述负载状态信息。
176.在一种可选的实施方式中,程序710还用于使得处理器702在将所述告警消息发送到所述目标告警服务节点进行处理时,将所述告警消息携带的所述虚拟ip地址转换为所述目标告警服务节点的地址信息;将所述告警消息发送到所述地址信息所对应的目标告警服务节点进行处理。
177.在一种可选的实施方式中,程序710还用于使得处理器702在接收交换机发送的告警消息之前,设置用于统一接收告警消息的虚拟ip地址;所述接收交换机发送的告警消息,
包括:通过所述虚拟ip地址接收交换机发送的告警消息。
178.和/或,
179.程序710具体可以用于使得处理器702执行以下操作:接收交换机发送的告警消息,其中,所述交换机用于在多个服务器之间进行数据传输,交换机通过配置的域名向与所述域名对应的虚拟ip地址发送告警消息;基于转发配置信息,从多个告警服务节点确定处理所述告警消息的目标告警服务节点;将所述告警消息发送到所述目标告警服务节点进行处理,并通过目标告警服务节点将处理结果发送至运维终端。
180.程序710中各步骤的具体实现可以参见上述告警处理方法实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
181.需要指出,根据实施的需要,可将本发明实施例中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本发明实施例的目的。
182.上述根据本发明实施例的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如cd rom、ram、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如asic或fpga)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,ram、rom、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的告警处理方法。此外,当通用计算机访问用于实现在此示出的告警处理方法的代码时,代码的执行将通用计算机转换为用于执行在此示出的告警处理方法的专用计算机。
183.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明实施例的范围。
184.以上实施方式仅用于说明本发明实施例,而并非对本发明实施例的限制,有关技术领域的普通技术人员,在不脱离本发明实施例的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明实施例的范畴,本发明实施例的专利保护范围应由权利要求限定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1