告警消息传输方法及系统、网管服务器和网元设备的制作方法

文档序号:7894961阅读:177来源:国知局
专利名称:告警消息传输方法及系统、网管服务器和网元设备的制作方法
技术领域
本发明涉及网络通信技木,尤其涉及一种告警消息传输方法及系统、网管服务器和网兀设备。
背景技术
电信网络管理系统通常分为网管侧和网元侧两部分。其中,网管侧的网管服务器往往管理成百上千个网元,分析网元的性能数据,处理网元上报的告警消息。网元侧有多个网元,各个网元直接或者若干网元组成ー组通过网元代理的方式,将网元产生的告警消息发送给网管侧的网管服务器,网管侧的网管服务器接收并处理这些告警消息,一个网管服务器可能对应多个网元或网元代理。由于网元或网元代理只是不同组网方式下的概念,在本发明中功能是相同的,以下将网元以及网元代理统称为网元设备。一般来说,网管侧的告警接收和处理能力能够应对正常情况的网元告警,但是在ー些特殊情况下会产生告警风暴,导致网元侧的告警发送与网管侧的告警接收和处理会严重不对称。例如,网元侧由于某些原因出现大面积的故障,导致告警数量急剧增加,网元设备发送的告警消息也随之大量増加。这就很容易导致网路的堵塞、告警的丢失,以及网管侧缓存中积累的告警消息量过大,从而影响了告警处理的及时性,尤其是对程度严重的重要告警处理的及时性;再比如,网管侧部分设备出现故障,告警消息接收和处理的任务转移到尚能正常运行的网管设备上,导致网管侧的某些网管服务器处理任务大大增加,众多的告警消息拥堵在网路上,或者已接收待处理的告警消息积累和排列过多,也会导致重要告警处理的及时性得不到保证。为了解决上述问题,现有技术中公开了ー种网元对其告警消息进行优先级分类,按照优先级规则顺序向网管服务器发送告警消息的技木。虽然该方法中每个网元设备可以保证本网元设备中优先级高的告警消息被优先发送,但是仍然解决不了在ー些特殊情况下产生告警风暴时,导致网路堵塞、告警丢失的问题,从而仍会导致重要告警处理的及时性得不到保证。具体原因分析如下各网元分别根据自己当前已有的告警消息进行优先级排序,并依据优先级进行告警消息的先后发送。假设有ー个网元设备A的告警消息严重程度很高,则该告警消息的优先级也高,该网元设备安排该优先级高的告警消息优先发送。然而,在其它网元设备中可能存在许多严重程度较低的告警消息需要发送,这些严重程度较低的告警消息被其所属网元设备进行优先级排序后,也将被其所属的网元设备优先发送。这时,网元设备A的严重程度很高的告警信息(高优先级的告警消息)将与其它网元设备所发送的严重程度较低的告警消息(低优先级的告警消息)争抢网络传输资源,尤其是在产生告警风暴的时候,仍然可能会导致严重程度很高的告警信息(高优先级的告警消息)丢失或得不到及时处理。因此,存在对能够在网管服务器接收和处理告警能力暂时相对的严重不足吋,优先保证优先级别高的告警消息的发送和传输的告警消息传输和处理技术的需要。

发明内容
本发明的实施例提供了一种告警消息传输方法及系统、网管服务器和网元设备,用以缓解网路堵塞、告警丢失的问题,并更为及时地处理优先级较高的告警消息。根据本发明的ー个方面,提供了一种告警消息传输系统,包括网管侧的网管服务器以及网元侧的向所述网管服务器发送告警消息的网元设备;所述网管服务器用于定时监测从所述网元设备接收的待处理的告警消息的数量,若监测到所述待处理的告警消息的数量超过设定的数量阈值时,将优先级阈值向所述网元设备发送;
网元侧的网元设备用于在接收到优先级阈值后,对于本网元设备中优先级低于所述优先级阈值的告警消息暂停发送,对于本网元设备中优先级不低于所述优先级阈值的告警消息正常发送。进ー步,所述网元设备还用于在接收到优先级阈值后,若在设定时间段内没有再接收到所述网管服务器发送的优先级阈值,则对之前暂停发送的告警消息恢复正常发送;或者,所述网元设备还用于在接收到优先级阈值后,若接收到所述网管服务器发送的过滤发送停止信息,则对之前暂停发送的告警消息恢复正常发送;其中,过滤发送停止信息为所述网管服务器将优先级阈值向所述网元设备发送后,在监测到所述待处理的告警消息的数量小于等于所述数量阈值吋,向所述网元设备发送的。其中,所述优先级阈值为预先设置的固定值;或者,所述优先级阈值根据所述网管服务器中各待处理的告警消息的优先级计算得到。较佳地,所述优先级阈值具体是根据所述网管服务器中各待处理的告警消息的优先级的平均值确定的。根据本发明的另ー个方面,还提供了ー种网管服务器,包括监测模块,用于定时监测从所述网元设备接收的待处理的告警消息的数量;网元设备通知模块,用于在所述监测模块监测的数量超过设定的数量阈值时,将优先级阈值向所述网元设备发送。较佳地,所述网管服务器还包括优先级阈值确定模块,用于根据所述网管服务器中各待处理的告警消息的优先级确定所述优先级阈值。较佳地,所述优先级阈值确定模块具体用于根据所述网管服务器中各待处理的告警消息的优先级的平均值确定所述优先级阈值。进ー步,所述网元设备通知模块还用于在将优先级阈值向所述网元设备发送后,若所述监测模块监测的数量小于等于所述数量阈值时,向所述网元设备发送过滤发送停止信息。根据本发明的另ー个方面,还提供了ー种网元设备,包括优先级阈值获取模块,用于获取接收网管服务器发送的优先级阈值;告警消息发送模块,用于在所述优先级阈值获取模块接收到所述优先级阈值后,对于本网元设备中优先级低于所述优先级阈值的告警消息暂停发送,对于本网元设备中优先级不低于所述优先级阈值的告警消息正常发送。
进ー步,所述告警消息发送模块还用于在接收到优先级阈值后,若在设定时间段内没有再接收到所述网管服务器发送的优先级阈值,则对之前暂停发送的告警消息恢复正常发送。根据本发明的另ー个方面,还提供了一种告警消息传输方法,包括网管服务器用于定时监测从所述网元设备接收的待处理的告警消息的数量;若所述网管服务器监测到所述待处理的告警消息的数量超过设定的数量阈值吋,将优先级阈值向所述网元设备发送;其中,所述优先级阈值用于指示所述网元设备对于本网元设备中优先级低于所述优先级阈值的告警消息暂停发送,对于本网元设备中优先级不低于所述优先级阈值的告警消息正常发送。其中,所述优先级阈值为预先设置的固定值;或者,
所述优先级阈值根据所述网管服务器中各待处理的告警消息的优先级计算得到。较佳地,所述优先级阈值根据所述网管服务器中各待处理的告警消息的优先级计算得到,具体包括计算所述网管服务器中各待处理的告警消息的优先级的平均值,将所述平均值作为所述优先级阈值。根据本发明的另ー个方面,还提供了一种告警消息传输方法,包括网元设备接收网管服务器发送的优先级阈值;并对于本网元设备中优先级低于所述优先级阈值的告警消息暂停发送,对于本网元设备中优先级不低于所述优先级阈值的告警消息正常发送;其中,所述优先级阈值为所述网管服务器在监测到所述待处理的告警消息的数量超过设定的数量阈值时发送的。进ー步,在所述网元设备接收网管服务器发送的优先级阈值之后,还包括若所述网元设备在设定时间段内没有再接收到所述网管服务器发送的优先级阈值,则对之前暂停发送的告警消息恢复正常发送;或者,若所述网元设备接收到所述网管服务器发送的过滤发送停止信息,则对之前暂停发送的告警消息恢复正常发送;其中,过滤发送停止信息为所述网管服务器将优先级阈值向所述网元设备发送后,在监测到所述待处理的告警消息的数量小于等于所述数量阈值时发送的。其中,所述优先级阈值为预先设置的固定值;或者,所述优先级阈值根据所述网管服务器中各待处理的告警消息的优先级计算得到。较佳地,所述优先级阈值根据所述网管服务器中各待处理的告警消息的优先级计算得到,具体包括计算所述网管服务器中各待处理的告警消息的优先级的平均值,将所述平均值作为所述优先级阈值。本发明实施例的网管服务器由于在待处理的告警消息的数量超过设定的数量阈值时,通过向网元设备发送优先级阈值来通知网元设备启动过滤发送机制对于本网元设备中优先级低于所述优先级阈值的告警消息暂停发送,对于本网元设备中优先级不低于所述优先级阈值的告警消息正常发送,从而在网管服务器接收和处理告警能力暂时相对的严重不足时,优先保证优先级别高的告警消息的发送和传输,防止或缓解网路堵塞、告警丢失的问题,从而使得网管服务器及时地处理优先级较高的告警消息。


图I为本发明实施例的电信网络管理系统示意图;图2为本发明实施例的网管服务器与网元设备之间告警消息传输方法流程图;图3为本发明实施例的网管服务器和网元设备的内部结构框图。
具体实施例方式为使本发明的目的、技术方案及优点更加清楚明白,以下參照附图并举出优选实施例,对本发明进ー步详细说明。然而,需要说明的是,说明书中列出的许多细节仅仅是为了使读者对本发明的ー个或多个方面有一个透彻的理解,即便没有这些特定的细节也可以 实现本发明的这些方面。本申请使用的“模块”、“系统”等术语g在包括与计算机相关的实体,例如但不限于硬件、固件、软硬件组合、软件或者执行中的软件。例如,模块可以是,但并不仅限干处理器上运行的进程、处理器、对象、可执行程序、执行的线程、程序和/或计算机。举例来说,计算设备上运行的应用程序和此计算设备都可以是模块。ー个或多个模块可以位于执行中的一个进程和/或线程内,一个模块也可以位于一台计算机上和/或分布于两台或更多台计算机之间。本发明通过为网管侧的网管服务器与网元设备之间建立一种告警通信协调机制,在网管服务器接收和处理告警能力暂时相对的严重不足时,在包括多个网元设备的整个网络上,优先保证优先级别高的告警消息的发送和传输,从而使得网管服务器及时地处理优先级较高的告警消息。网管侧的网管服务器监测本服务器所接收的待处理的告警消息数量,根据待处理的告警消息数量来判定网管服务器接收和处理告警的能力。当监测到待处理的告警消息数量急剧增加时,说明可能网元大面积发生故障或者有其它网管设备出现问题将告警处理转移至本设备上,而导致发生了告警风暴,有可能使得网管服务器接收和处理告警能力出现严重不足的情況。网管服务器随即通知网元设备,网元设备启动过滤发送机制暂保留某个优先级以下的告警信息不进行发送,仅发送该优先级或该优先级以上的告警消息,以防止或缓解网路堵塞、告警丢失的问题,并同时使得各网元设备中某个优先级或该优先级以上的告警信息得以优先发送到网管侧的网管服务器被进行处理。下面结合附图详细说明本发明实施例的技术方案。在如图I所示的电信网络管理系统中,网管侧的网管服务器102接收网元侧的网元设备102发送的告警信息,并将接收的告警消息缓存在告警消息列表中,作为待处理的告警消息。网管服务器102按顺序处理告警消息列表中的待处理的告警消息,处理完毕的告警记录被存放到数据库中。在ー些特殊情况下若产生告警风暴,导致网元侧的告警发送与网管侧的告警接收和处理会严重不对称。例如,网元设备发送的告警消息大量増加,或者网管侧部分设备出现故障,网管侧的其它设备的处理任务,如待处理的告警消息被转移到网管服务器102,从而导致网管服务器102的告警消息列表中的待处理的告警消息的数量大大增加。为了防止、缓解网路堵塞、告警丢失的问题,以及重要告警处理的及时性得不到保证的问题,本发明提供了一种告警消息传输方法,如图2所示。在步骤S201,网管服务器101定时监测待处理的告警消息的数量。具体地,网管服务器101定时监测从网元设备102接收的、缓存在告警消息列表中的待处理的告警消息的数量。具体地,网管服务器101具有ー监测定时器。当监测定时器的计时达到设定时间段值,如5分钟,网管服务器101检测告警消息列表中待处理的告警消息的数量,之后监测定时器清零。监测定时器清零后,在下次到达设定 时间段值时,再次触发网管服务器101执行步骤S201检测告警消息列表中待处理的告警消息的数量。本领域技术人员可以根据实际情况设定定时监测的间隔时间段(即监测定时器的设定时间段值),比如,设置每隔5分钟监测统计一次告警消息列表中的待处理的告警消息的数量 。接下来,网管服务器101判断待处理的告警消息的数量是否超过设定的数量阈值(S202)。若网管服务器101判断待处理的告警消息的数量超过设定的数量阈值,执行步骤S203。本领域技术人员可以根据具体情况设置数量阈值。例如,设置的数量阈值为200,若监测到待处理的告警数量为263条,高于预设的数量阈值200,则执行如下步骤S203。在步骤S203,网管服务器101将优先级阈值发送到网元侧的各网元设备102。具体地,网管服务器101将优先级阈值封装在消息中发送到网元侧的各网元设备102,例如,网管服务器101可以将优先级阈值封装在告警阀值消息中发送到网元侧的各网元设备102。优先级阈值用于指示网元设备102对于本网元设备中优先级低于所述优先级阈值的告警消息暂停发送,对于本网元设备中优先级不低于所述优先级阈值的告警消息正常发送。优先级阈值可以是预先设定的固定值。例如,告警消息的优先级从低到高分别定义为1、2、3、4、5,那么,优先级阈值可以预先设定为3。一种较佳的方案是,根据网管服务器101中各待处理的告警消息的优先级计算得到优先级阈值。例如,计算网管服务器中各待处理的告警消息的优先级的平均值,将计算出的平均值作为优先级阈值。接下来,网元设备102在接收到优先级阈值后,启动过滤发送机制(S204)。通常,网元设备102会将产生的告警形成告警消息,并且将告警消息暂存在一个告警消息发送列表中。告警消息的内容包含告警编号、告警优先级、告警产生时间、告警对象ID、告警对象类型等。告警消息在告警消息发送列表中的排列顺序是按照告警产生的时间先后或者其它策略生成的顺序。在本发明实施例的网元设备102中,网元设备102可以采用两种不同的发送机制对告警消息发送列表中的告警消息进行发送。一种发送机制为正常发送机制;另一种发送机制为过滤发送机制。正常发送机制下,网元设备102对告警消息的发送方式与现有技术的相同网元设备按照告警消息在告警消息发送列表中的顺序逐个将告警消息发送出去。表I示出了一个网元设备的告警消息发送列表。可以看出该告警消息发送列表中告警消息的排列是按照告警产生的时间先后顺序自上而下的排列的。正常发送机制下,该网元设备将按照告警消息发送列表中告警消息的先后排列顺序将各条告警消息逐个发送给网管服务器,即序号为sdqd20120311370245961的第一条告警消息被发送出去以后,该条消息即在列表中消失,然后发送下一条消息,即序号为sdqd20120311370245962的告警消息。网兀设备新产生的告警消息则不断的被顺序添加在告警消息发送列表的下面。表I

权利要求
1.一种告警消息传输系统,包括网管侧的网管服务器以及网元侧的向所述网管服务器发送告警消息的网元设备; 所述网管服务器用于定时监测从所述网元设备接收的待处理的告警消息的数量,若监测到所述待处理的告警消息的数量超过设定的数量阈值时,将优先级阈值向所述网元设备发送; 网元侧的网元设备用于在接收到所述优先级阈值后,对于本网元设备中优先级低于所述优先级阈值的告警消息暂停发送,对于本网元设备中优先级不低于所述优先级阈值的告警消息正常发送。
2.如权利要求I所述的系统,其特征在于,所述网元设备还用于在接收到优先级阈值后,若在设定时间段内没有再接收到所述网管服务器发送的优先级阈值,则对之前暂停发送的告警消息恢复正常发送;或者, 所述网元设备还用于在接收到优先级阈值后,若接收到所述网管服务器发送的过滤发送停止信息,则对之前暂停发送的告警消息恢复正常发送;其中,所述过滤发送停止信息为所述网管服务器将优先级阈值向所述网元设备发送后,在监测到所述待处理的告警消息的数量小于等于所述数量阈值吋,向所述网元设备发送的。
3.如权利要求2所述的系统,其特征在于,所述优先级阈值是根据所述网管服务器中各待处理的告警消息的优先级的平均值确定的。
4.ー种网管服务器,包括 监测模块,用于定时监测从所述网元设备接收的待处理的告警消息的数量; 网元设备通知模块,用于在所述监测模块监测的数量超过设定的数量阈值时,将优先级阈值向所述网元设备发送。
5.如权利要求4所述的服务器,其特征在于,还包括 优先级阈值确定模块,用于根据所述网管服务器中各待处理的告警消息的优先级的平均值确定所述优先级阈值。
6.如权利要求5所述的服务器,其特征在于,所述网元设备通知模块还用于在将优先级阈值向所述网元设备发送后,若所述监测模块监测的数量小于等于所述数量阈值时,向所述网元设备发送过滤发送停止信息。
7.一种告警消息传输方法,包括 网管服务器用于定时监测从所述网元设备接收的待处理的告警消息的数量; 若所述网管服务器监测到所述待处理的告警消息的数量超过设定的数量阈值时,将优先级阈值向所述网元设备发送;其中,所述优先级阈值用于指示所述网元设备对于本网元设备中优先级低于所述优先级阈值的告警消息暂停发送,对于本网元设备中优先级不低于所述优先级阈值的告警消息正常发送。
8.如权利要求7所述的方法,其中,所述优先级阈值为预先设置的固定值;或者,所述优先级阈值是通过计算所述网管服务器中各待处理的告警消息的优先级的平均值,将所述平均值作为所述优先级阈值得到的。
9.一种告警消息传输方法,包括 网元设备接收网管服务器发送的优先级阈值;并 对于本网元设备中优先级低于所述优先级阈值的告警消息暂停发送,对于本网元设备中优先级不低于所述优先级阈值的告警消息正常发送; 其中,所述优先级阈值为所述网管服务器在监测到所述待处理的告警消息的数量超过设定的数量阈值时发送的。
10.如权利要求9所述的方法,其中,在所述网元设备接收网管服务器发送的优先级阈值之后,还包括 若所述网元设备在设定时间段内没有再接收到所述网管服务器发送的优先级阈值,则对之前暂停发送的告警消息恢复正常发送;或者, 若所述网元设备接收到所述网管服务器发送的过滤发送停止信息,则对之前暂停发送的告警消息恢复正常发送;其中,所述过滤发送停止信息为所述网管服务器将优先级阈值向所述网元设备发送后,在监测到所述待处理的告警消息的数量小于等于所述数量阈值时发送的。
全文摘要
本发明公开了一种告警消息传输系统及方法、网管服务器和网元设备,所述系统包括网管服务器以及网元设备;网管服务器定时监测从网元设备接收的待处理的告警消息的数量,若监测到的数量超过设定的数量阈值时,将优先级阈值向网元设备发送;网元设备在接收到优先级阈值后,对于优先级低于优先级阈值的告警消息暂停发送,对于优先级不低于优先级阈值的告警消息正常发送。由于在待处理的告警消息的数量超过设定的数量阈值时,通过向网元设备发送优先级阈值来通知网元设备启动过滤发送机制,从而在网管服务器接收和处理告警能力暂时相对的严重不足时,优先保证优先级别高的告警消息的发送和传输,使得网管服务器及时地处理优先级较高的告警消息。
文档编号H04L12/26GK102694678SQ20121013671
公开日2012年9月26日 申请日期2012年5月4日 优先权日2012年5月4日
发明者杨恒, 胡桂娇, 高仁忠 申请人:青岛海信传媒网络技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1