网络告警的处理方法、告警服务器和网络告警处理系统的制作方法

文档序号:9306568阅读:537来源:国知局
网络告警的处理方法、告警服务器和网络告警处理系统的制作方法
【技术领域】
[0001]本发明涉及网络应用领域,特别涉及网络告警的处理方法、告警服务器和网络告警处理系统。
【背景技术】
[0002]随着网络应用的发展,网络变得越来越复杂,功能也越来越强大,这也就对网络管理功能提出了越来越高的要求。
[0003]处理告警功能是网络管理功能中很重要的一部分,很多网络故障和事件都可以通过告警查看到。图1示出了传统的网络告警处理机制,传统的网络告警处理系统通过包括一台或多台网管主机。该网络告警处理系统进而与设备进行通信,通过在设备端设置一个或多个网管主机的地址,使得当该设备产生告警信号时,该告警信号通过socket通信被逐个儿传输至与该设备相连的每一台网管主机进行处理。
[0004]然而,在传统的网络告警处理机制中,存在着维护困难、效率和可靠性较低、负荷较重等缺点。例如,每当增加一台网管主机,都需要在设备端设置的地址列表中增加相应的网管主机IP地址,增加了维护的工作量。又例如,每增加一台网管主机,设备都要检测所设置的地址列表中,并将同样的告警信号发送给列表中的每一台网管主机,这对于设备而言,效率低下,也增加了设备的负担。再例如,设备采用简单网络管理协议(SNMP),与网管主机之间通过trap进行通信,然而trap是一种UDP报文,可靠性较低,若UDP报文发送的数量越多,那么其报文丢失的数量也会越多。还有,有时告警非常多,而且告警信号重复率较高,重复地发送同样的告警信号会造成网络负荷比较重。
[0005]考虑到上述因素,有必要提供一种更为高效和可靠的网络告警处理机制。

【发明内容】

[0006]本发明要解决的技术问题在于,提供一种更为高效和可靠的网络告警的处理方法、告警服务器和网络告警处理系统。
[0007]根据本发明的一个方面,本发明提供了一种网络告警处理方法,适于将设备发出的告警信号发送至网管主机,包括:获取设备告警信号;对所述告警信号的报文内容进行编辑,获取编辑后的告警信号,其中,所述编辑后的告警信号包含分析辅助信息;将所述编辑后的告警信号发送至网管主机。
[0008]根据本发明的另一个方面,本发明提供了一种网络告警处理系统,与设备相连接,适于将所述设备发出的告警信号发送至网管主机,包括:告警服务器,适于从所述设备获取告警信号并对告警信号进行编辑后,传输编辑后的告警信号;以及一个或多个网管主机,适于接收所述编辑后的告警信号,并根据所述编辑后的告警信号进行处理。
[0009]根据本发明的又一个方面,本发明提供了一种告警服务器,适于将设备发出的告警信号发送至网管主机,包括:告警获取模块,适于接收设备发来的告警信号并传递至转换模块;转换模块,适于从所述告警信号提取报文内容并对所述报文内容进行编辑,以形成编辑后的告警信号,并进行传输;发送模块,适于将编辑后的告警信号发送给网管主机。
[0010]与现有技术相比,本发明具有以下有益效果:一方面,通过在设备和网管主机之间设置告警服务器,专门用于接收网元设备的告警信号,在设备端仅需保存告警服务器的地址,网管主机数目的增减并不会对其造成影响,方便了用户操作,降低了设备的压力。另一方面,通过对接收到的告警信号进行编辑,使编辑后的告警信号包含告警源信息和重复告警信号数目等分析辅助信息,降低了设备发送告警的频率,也减轻了网管主机的负荷。另夕卜,通过TCP协议将编辑后的告警信号发送至网管主机,在一定程度上提高了告警信号传输的可靠性。
【附图说明】
[0011]图1是传统的网络告警处理系统的框图示意图;
[0012]图2是本发明网络告警处理系统的一种实施方式的框架示意图;
[0013]图3是本发明告警服务器的一种实施方式的框架示意图;
[0014]图4是根据本发明对告警信号进行编辑后封装获得的报文结构示意图;
[0015]图5是本发明告警服务器的另一种实施方式的框架示意图;
[0016]图6是本发明网络告警处理方法的一种实施方式的流程示意图;
[0017]图7是如图6所示步骤S200的另一种实施方式的流程示意图;
[0018]图8是本发明网络告警处理方法的一种具体实施例的流程示意图。
【具体实施方式】
[0019]以下将参考附图对示例实施方式进行更为全面的描述。附图中相同的附图标记将用来指示相同或相似的部件。尽管以下描述了本发明的若干示例性实施例和特征,但是在不背离本发明的发明思路的情况下,对本发明进行的修改、调整以及其它替换实现,例如,对附图所示部件进行等同替换、添加或修改,或通过替换、重新排序或添加步骤,不应造成对本发明的限制。本发明的适当范围应由所附权利要求所界定。
[0020]根据本发明的实施例,术语“告警信号”被宽泛地使用以描述程序运行过程中产生的警告信息,其可用于描述计算机程序的运行状态或相关参数。根据本发明的实施例,告警信号可包括但不限于,告警发生的原因、告警的级别、告警的编码、告警的名称、告警的类型、告警产生/恢复时间、告警状态等。
[0021]根据某些实施例,本发明提出一种网络告警的处理机制,在设备和网管主机之间设置告警服务器,专门用于接收网元设备的告警信号,并对该告警信号进行编辑,使其包含告警源信息和重复告警信号数目等分析辅助信息,将编辑后的告警信号通过TCP方式发送至网管主机,从而方便了用户操作,降低了设备发送告警的频率,也减轻了网管主机的负荷,在一定程度上也提高了告警信号传输的可靠性。
[0022]参考图2,在本发明网络告警处理系统100的一种实施方式中,网络告警处理系统100与设备200相连接,设备200将告警信号传输至网络告警处理系统100。该网络告警处理系统100包括:告警服务器110,适于从设备200获取告警信号并对告警信号进行编辑后,传输编辑后的告警信号;以及一个或多个网管主机120,适于接收所述编辑后的告警信号,并根据所述编辑后的告警信号进行处理。其中,网管主机120通过TCP长连接的方式与告警服务器110相连接。
[0023]参考图3,在一种【具体实施方式】中,告警服务器110包括:告警获取模块101,适于将从设备获取的告警信号并传递至转换模块102 ;转换模块102,适于从所述告警信号提取报文内容并对所述报文内容进行编辑,以形成编辑后的告警信号,并进行传输;发送模块103,适于将编辑后的告警信号发送给网管主机120。
[0024]具体来说,告警获取模块101通过与设备进行通信,从设备处获取告警信号。其中,告警获取模块101可通过以太网与各设备进行数据的传输,获取告警信号。根据一些实施方式,告警信号可由设备主动向告警服务器110上报;在另一些实施方式中,也可由告警获取模块101对设备进行监听,主动获取设备的各种告警信号。
[0025]在某些实施例中,告警信号可包括,例如告警发生的原因、告警的编码、告警的名称、告警产生/恢复时间等。进一步的,还可根据告警严重程度、或告警发生的原因、或告警产生/恢复时间对告警信号进行划分,获得告警等级、或告警类别,或告警状态,并将其包含在告警信号中,一起进行传输。例如,可根据告警严重程度将告警信号分为紧急告警、重要告警、次要告警、提示告警四级;又例如,可根据告警发生的原因将告警信号分为设备告警、性能超限告警、网络通信告警三类;又例如,可根据告警产生/恢复时间将告警信号分为当前告警和历史告警。
[0026]根据某些实施方式,告警获取模块101还可进一步包含对报文进行归并,以减少重复报文的发送。
[0027]具体来说,告警获取模块101可将接收到的告警信号存放到缓存中,并标注时间,当接收到另一个告警信号时,将其与存放于缓存中的告警信号进行比较,判断是否存在相同的告警信号。当存在相同的告警信号时,判断相同告警信号之间的时间间隔是否在设定的时间阈值内。当在设定时间阈值内时,将这些告警信号合并为一个告警信号,并进行发送;当不存在相同的告警信号或相同的告警信号不在设定时间阈值内时,则分别发送这些告警信号。当告警获取模块101发送了告警信号之后,进一步还包括,从缓存中清除所发送的告警信号。
[0028]在某些实施方式中,设定的时间阈值可为2秒。通过判断设定时间阈值内是否存在相同的告警信号,可有效减少重复报文的发送量,减轻网络告警处理系统100的负荷,降低对网络带宽的需求。
[0029]其中,判断告警信号是否相同可包括,计算并存储每个告警信号的hash值,通过比较每个告警信号的hash值以判断是否存在相同的告警信号。
[0030]当获取到告警信号之后,转换模块102进一步对其进行编辑,以获得编辑后的告警信号。其中,所述编辑后的告警信号可包含与所述告警信号对应的告警源信息、告警信号数量等分析辅助信息,以便进行告警信号的分析。
[0031]在某些实施方式中,例如,设备通常采用SNMP trap报文形式传递告警信号,其中,该SNMP trap报文至少包括告警事件类型和事件的值。当转换模块102接收到该SNMP trap报文之后,将SNMP trap报文中的告警信号内容提取出来,对报文进行编辑,例如在报文中增加用于标识告警源信息的信息,例如设备IP地址等,然后,再将编辑后的报文进行封装,接着再将封装后的内容发送给发送模块103。
[0032]参考图4,在一种具体实施例中,封装后的报文中增加了告警信号对应设备的的IP地址,以及从相同告警源所获取的相同告警的数量。通过对告警信号的编辑,使得经由转换模块102发送的告警信号中包含分析辅助信息,便于对告警信号进行统计和分析,也便于对重复发送的告警信号进行管理。
[0033]当接收经由转换模块102传递的告警信号之后,发送模块103与每台网管主机120建立连接,并将编辑后的告警信号发送给每台连接至告警服务器110的网管主机120。其中,发送模块103与网管主机120之间可采用TCP协议进行通信,TCP协议相较于SNMP更为稳定和可靠,从而能在一定程度上提高告警信号传输的可靠性。
[0034]参考图5,在另一种实施方式中,告警服务器110还可包括:记录模块104。其中,记录模块104对每条告警信号的发送状态,例如已发送、待发送、未发送等,进行记录,并将告警信号的发送结果生成日志文件,以便在告警服务器110存在发送故障时能够调试查看。
[0035]参考图6,在本发明网
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1