一种snmp协议下采用确认机制实现告警管理的方法

文档序号:7620433阅读:204来源:国知局
专利名称:一种snmp协议下采用确认机制实现告警管理的方法
技术领域
本发明涉及SNMP协议下采用确认机制实现告警管理的方法,尤其涉及通讯网络管理领域的接入系统中,在SNMP(V2)协议下网元代理实体对于告警的管理方法。
背景技术
SNMP(Simple Network Management Protocol,简单网络管理协议)是由于标准网络管理协议的需要而产生的一个临时解决方案,在其发展过程中出现了三个主版本,分别是SNMPV1,SNMPV2和SNMPV3。其中SNMPV2又分为几个子版本,子版本中SNMPV2c在通讯领域的网络管理中应用最为广泛。
SNMP协议运行在管理者-代理的管理模型上,提供了管理者实体和代理实体之间交换管理信息的一个直接的、基本的方法。管理者实体和代理实体之间交换的管理信息有多种,不同的版本提供的消息类型种类不同,对于SNMPV2c版本来说一个重要的消息类型就是Trap(陷阱消息),该消息在代理实体需要将重要的事件向管理者实体主动上报时才产生,同管理者实体发出请求,代理实体做出响应的消息类型不同,管理者实体对于接收到的陷阱消息并不响应。因此,陷阱消息是一个从代理实体到管理者实体的无确认的访问。
一般SNMP被设计为在无连接用户数据报协议上运行。因此,在UDP/IP发送陷阱消息的典型情况下,代理实体不能确保一个关键的消息已经到达管理者实体。
在接入系统中,网络设备上运行的网元代理实体通过SNMP(V2c)协议与网管的管理者实体进行信息的交互,其中网元代理发送的陷阱消息反映了当前被管理的网络设备的运行状况,以便用户根据这些信息采取相应的措施。但是,由于陷阱消息是一种采用UDP/IP发送的无确认的访问,因此,无法保证管理者实体能够及时、准确的获得代理实体发送的陷阱消息,从而无法保证对于网络设备进行及时、有效的管理。
由于采用SNMP(V2c)协议的接入系统的网元代理实体对于产生的陷阱消息并不保留,因此,当网管由于某些原因离开一段时间,重新返回后就无法得知离开时间段内网络设备发生了何种变化,或是产生了何种故障。

发明内容
本发明要解决的技术问题是为了克服SNMP协议中无确认的访问所导致网络设备上管理的告警信息无法及时、正确送到管理者的缺点,提出了一种采用确认机制实现告警管理的方法。可以保证网络设备上的网元代理在UDP/IP上传送的陷阱消息能够及时、准确的送达到管理者实体,同时,又提供了管理者实体的查询功能。
本发明具体是这样实现的一种SNMP协议下采用确认机制实现告警管理的方法,其特征在于所述告警管理模块进行如下处理向产生告警消息的告警源提供统一接口;在注册表中注册不同类型的告警消息以及其他组装MIB对象值对的信息;对接收告警源产生的不同类型的告警消息进行处理;调用统一接口向网管发送处理过的不同类型的告警消息;对于需要确认的告警消息,等待网管的确认消息,如果收到确认,进行确认操作,如果没有收到确认,进行超时的处理。
所述对不同类型告警消息进行的处理包括创建存储区;对产生的告警消息获取告警识别码,组成告警存储记录进行存储;对产生的恢复和告警撤销消息,修改存储的告警记录标记;根据告警消息的类型,从注册表中读取需要绑定的MIB对象,进行MIB对象标识符和MIB对象值对的绑定;对于标记为告警或恢复的存储记录,设置重新发送的时间计数和重新发送的次数计数。
所述网管确认消息之后的确认操作包括根据接收到的网管通过代表确认的MIB对象设置的告警识别码,查找存储区,找到对应的告警存储记录;根据保存的存储记录标记所代表的告警消息存储类型,进行确认操作;取消存储记录中设置的重新发送时间计数和重新发送次数计数。
所述进行的超时处理包括遍历存储区,对于保存的未被确认的告警和恢复的告警存储记录,检查时间发送计数和发送次数计数;对于发送时间到,发送次数满足条件的未被确认告警或恢复进行确认操作;对于发送时间未到,发送次数满足条件的未被确认的告警或者恢复减少等待的发送时间,继续等待;对于发送时间到,发送次数未满足条件的未被确认的告警或恢复向网管重新发送,减少重新发送次数,设置重新发送时间;对于发送时间未到,发送次数未满足条件的未被确认的告警或者恢复减少等待的发送时间,继续等待。
所述告警管理模块在接收到告警消息后,根据告警消息的内容参数判断存储区中是否有重复的告警消息存在;如果存在,不进行任何处理;如果不存在,则获取告警识别码组成告警存储记录保存,发送网管告警;发送后设置告警存储记录中的重新发送时间计数和次数计数。
所述告警管理模块在接收到恢复消息后,根据恢复消息的内容参数判断存储区中是否有对应的告警消息存在;如果不存在,不进行任何处理;如果存在,则修改告警存储记录的标记为未确认恢复,发送给网管恢复;发送后再设置这个恢复的重新发送时间计数和次数计数。
所述告警管理模块在接收到告警撤销消息后,根据告警撤销内容参数在存储区查找匹配的告警消息;如果某个告警存储记录不满足条件,不进行任何处理;如果该记录是内容参数所表示的告警源所产生的告警,那么修改告警存储记录的标记为未确认恢复,发送网管恢复;发送后再设置这个恢复的重新发送时间计数和次数计数。
所述告警管理模块进一步包括对未被确认的告警和恢复消息的处理周期定时扫描存储区,根据每个告警存储记录中保留的发送时间计数和发送次数计数,决定或是向网管发送告警或是做确认处理;定时时间到,如果发送次数计数为最大次数且发送时间计数为0,对未被确认的恢复进行清除,未被确认的告警进行确认;在还没有到达最大次数发送前,判断发送时间是否到达,如果到达,那么重新发送未被确认的告警和恢复,如果发送时间没有到,不做任何处理,等待发送时间的到来,在还没有达到最大发送次数的限定时间内如果收到网管的确认,进行正常的确认处理。
所述网管通过对代表告警确认的MIB对象进行设置告警识别码操作,表示对于相应的告警消息进行确认;
在接收到告警确认后,告警管理模块查找存储区中是否有该告警识别码表示的告警记录存在,如果存在,修改记录标记为确认告警,然后,清除重新发送时间计数,次数计数;如果不存在,不做任何处理。
所述网管通过对代表恢复确认的MIB对象进行设置告警识别码操作,表示对于相应恢复进行确认;在接收到恢复确认后,告警管理模块查找存储区中是否有该告警识别码表示的存储记录存在,如果存在,删除这个存储记录;如果不存在,那么不做任何处理。
所述告警管理模块还包括告警同步的处理第一步,获取所有保存的告警记录的告警识别码,网管通过对代表获取告警识别码的MIB对象进行读取操作,表示获取;接收到读取操作后,告警管理模块将存储区中所有保存的未确认告警或确认告警中的告警识别码收集起来,赋给该MIB对象;第二步,请求发送指定告警识别码组表示的告警记录,在完成第一步后,网管将自身保存的告警识别码同获取到的MIB对象数值组中包含的告警识别码逐一进行比较;如果网管的告警识别码不在MIB对象数值组中存在,网管认为该告警识别码代表的告警已经恢复,按照恢复处理,否则,按照告警处理;如果MIB对象数值组中的告警识别码不在网管保存的告警识别码组中存在,进行告警同步的第二步,否则,按照告警处理;第三步,网管通过对代表请求指定告警的MIB对象进行设置告警识别码组操作,表示请求指定的告警;在接收到告警识别码组后,告警管理模块从组中逐一取出告警识别码,对每一个告警识别码,查找该告警识别码对应的告警存储记录是否存在,如果存在,那么向网管发送告警,继续下一个告警识别码的处理;如果不存在,则进行下一个告警识别码的处理。
所述告警管理模块还包括告警刷新的处理网管通过对代表请求刷新告警的MIB对象进行设置操作,表示请求指定的告警;在告警管理模块接收到告警刷新请求后,告警管理模块开始搜索存储区,如果存储记录是告警记录,那么向网管发送告警;如果不是告警记录,那么不作任何处理;继续操作,直至存储区搜索结束。
采用本发明所述方法,与现有技术相比,由于采取了确认机制技术措施,能够保证SNMP协议下管理者实体及时、准确的接收到代理实体发送的陷阱消息,从而达到了及时掌握设备运行状况的效果。同时,由于代理实体对发送的Trap进行了存储,从而能够提供管理者的实时查询,提高了系统对于网络设备的监控能力。


图1是Trap(陷阱消息)PDU(协议数据单元)格式内容说明;图2是注册表元素格式内容说明;图3是存储区中保存的存储记录的格式内容说明;图4是告警消息类型产生-存储-网管之间不同阶段的转换说明;图5是发送给网管的通知Trap的MIB对象标识符和值对的组成说明;图6是发送给网管的告警Trap的MIB对象标识符和值对的组成说明;图7是发送给网管的恢复Trap的MIB对象标识符和值对的组成说明;图8是采用确认机制实现告警管理的整体流程;图9是通知消息处理流程;图10是告警消息处理流程;图11是恢复消息处理流程;图12是告警撤销消息处理流程;图13是重新发送功能处理流程;图14是告警确认流程;图15是恢复确认流程;图16是网管获取所有保存的告警记录的告警识别码流程;图17是网管同步指定告警识别码的告警记录流程;图18是网管请求告警刷新流程。
具体实施例方式
在本发明所述方法中,通过告警管理模块提供给产生告警消息的网络设备(告警源)一个统一的接口,告警源将告警消息的种类以及其他组装MIB(Management Information Base)对象值对的信息注册到告警管理模块的注册表中,然后,再调用告警管理模块所提供的接口,发送各种不同类型的告警消息。告警管理模块在发送Trap前,对于告警源产生的告警消息依据类别进行不同的管理。发送后,对于那些需要确认的Trap,会等待网管的确认消息,如果等待到确认,那么进行确认操作。如果没有收到网管确认,那么进行超时的处理。
所述告警管理模块对于各种告警消息的管理、发送包括
1、申请并初始化存储区,申请信号量,启动告警管理模块的管理任务,准备接收告警源发来的消息。
2、根据接收到的告警消息类型,分别进行存储处理。
产生的告警需要获取告警识别码,组成存储记录进行存储。
产生的恢复和告警撤销需要修改存储的告警记录标记。
产生的通知并不进行任何存储处理。
3、根据告警消息类型,从注册表中读取需要绑定的MIB对象,进行MIB对象标识符和MIB对象值对的绑定,通过UDP/IP发送Trap到网管。
4、对于保存的标记为告警或恢复的存储记录,设置重新发送的时间计数和重新发送的次数计数。
5、对于需要确认的Trap,等待网管的确认。
所述告警管理模块的确认处理包括1、根据接收到的网管通过代表确认的MIB对象设置的告警识别码,查找存储区,找到对应的存储记录。
2、根据保存的存储记录标记所代表的存储类型,进行确认操作。
3、取消存储记录中设置的重新发送时间计数和重新发送次数计数。
所述告警管理模块的超时处理,即重新发送包括遍历存储区,对于保存的未被确认的告警和恢复,检查时间发送计数和发送次数计数。对于下列条件进行判定,分别进行处理。
1)对于发送时间到,发送次数满足条件的未被确认告警或恢复进行确认操作。
2)对于发送时间未到,发送次数满足条件的未被确认的告警或者恢复减少等待的发送时间,继续等待。
3)对于发送时间到,发送次数未满足条件的未被确认的告警或恢复向网管重新发送,减少重新发送次数,设置重新发送时间。
4)对于发送时间未到,发送次数未满足条件的未被确认的告警或者恢复减少等待的发送时间,继续等待。
下面结合附图,基本按照附图的顺序对技术方案的实施作进一步的详细描述图1介绍了SNMP(V2及以上)协议中Trap PDU格式及包含的内容。告警管理模块更多关注的是其中的一列MIB对象名和值对部分,这部分代表了Trap所带有的信息,这些信息反映了当前被管理设备的运行状况。
图2介绍了Trap注册表中每个元素具有的格式及包含的内容。在告警源发出告警消息前,需要在注册表中将Trap PDU相关的告警种类及一列MIB对象标示符对应的对象名填入到注册表中。其中1、使用标记表示Trap是否已经注册。在注册完成后,需要置为使用状态。
2、Trap标识符含义同Trap对象标识符一致,同Trap对象标识符一一对应,作为Trap对象标识符的替身,方便存储、比较。
3、Trap对象标识符表示Trap所代表是何种类的告警。
4、Trap对象标识符的长度表示Trap对象标识符中的元素个数。
5、Trap中MIB对象的个数给出了在图1中一列MIB对象标识符和值对部分代表告警内容的那些MIB对象的个数。
6、Trap中一列对象名给出了与图1中一列MIB对象标识符和值对部分代表告警内容的那些MIB对象具有的名字。
图3介绍了在存储区中保存的存储记录的格式及包含的内容。存储区的大小受到被管理的网络设备内存容量的限制,可以根据设备的整体性能或者告警种类的多少,告警源产生告警消息的频率来定义它的大小。存储记录记载了某一时刻产生告警消息的告警源的位置,告警消息中包含的内容参数值等重要的Trap带有的信息。其中1、Trap标识符含义同图2中的说明。
2、告警识别码主要用于告警管理模块同网管的交互,是二者之间信息交换的手段,唯一的识别出某一条告警。
3、存储记录的类型标记主要有3种,在图3中有标示。用来表示存储记录所代表的Trap是否被确认。
4、存储记录的内容参数值保存告警源产生的告警消息的内容参数值。
5、存储记录的位置参数计数保存了描述产生告警消息的告警源位置参数的个数。
6、存储记录的位置参数值描述了产生告警消息的告警源的位置。
7、重新发送时间计数控制未确认告警或恢复重新发送的时间间隔。
8、重新发送次数计数控制未确认告警或恢复重新发送的次数。
图4介绍了告警消息产生时,所带有的告警消息类型,存储区中存储记录的标记类型,最后发送给网管的Trap类型,以及各个不同阶段类型之间的转换。
图5介绍了发送给网管的通知Trap带有的一列MIB对象标识符和值对的组成结构。
图6介绍了发送给网管的告警Trap带有的一列MIB对象标识符和值对的组成结构。
图7介绍了发送给网管的恢复Trap带有的一列MIB对象标识符和值对的组成结构。
图8介绍了采用确认机制进行告警管理的整体流程。
告警管理模块在系统设备启动过程中完成如下初始化操作1、创建存储区,设置它的大小,并初始化存储区。
2、创建一个信号量,用来控制对于存储区的并发访问。
3、创建一个全局的告警识别码资源,并初始化。
4、创建一个告警管理模块处理任务。
5、在系统控制检测系统工作正常后,通知网管系统冷启动。
告警管理模块处理任务接收来自于告警源的不同类型告警消息以及自身的超时消息。
同时网管通过特定的MIB对象要求告警管理模块完成确认、告警的同步和告警的刷新等操作。
告警管理模块完成的主要确认操作有告警的确认、恢复的确认。
为了利用有限的资源以及保证最好的通讯实时性,告警管理模块设计了对未确认的告警定时重发,对未被确认的恢复定时清除的功能。
为了同网管进行交互,告警管理模块使用告警识别码表示唯一的告警,告警源产生的每一个告警都会有一个告警识别码分配给它。当告警源产生恢复时,如果告警识别码资源定义的足够大,那么资源并不需要回收,因为足够大的资源定义保证了它的使用时间远远大于系统设备的平稳运行时间,因此,通过系统设备的重新启动,可以避免产生资源不足的情况。
图9介绍了类型为通知的告警消息的处理流程。告警源产生的通知类型的告警消息,只是负责告知网管系统中一些设备的开始启动、启动完成、链路状态变化等。非常类似于SNMP中的无确认机制Trap。告警管理模块并不将通知内容放入存储区,而是直接发送给网管,网管不需要对接收到的通知Trap进行确认。
图10介绍了类型为告警的告警消息处理流程。告警负责告知网管系统设备出现的一些重要的故障或是系统出现的重大问题。告警管理模块在接收到告警后,首先根据告警的内容参数判断存储区中是否有重复的告警存在,如果存在,那么不进行任何处理。如果不存在,则获取告警识别码组成存储记录保存,然后发送网管告警。告警源产生的告警都是未确认的告警,发送后需要设置存储记录中的重新发送时间计数和次数计数。网管如果接收到告警Trap就会对于告警进行确认。
图11介绍了类型为恢复的告警消息处理流程。恢复是和告警一一对应的,它表示已经产生故障的修复,目前设备运行正常。告警管理模块在接收到恢复后,首先根据恢复的内容参数判断存储区中是否有对应的告警存在,如果不存在,那么不进行任何处理。如果存在,则修改存储记录的标记为未确认恢复,然后发送给网管恢复,再设置这个恢复的重新发送时间计数和次数计数。网管如果接收到恢复Trap就会对于恢复进行确认。
图12介绍了类型为告警撤销的告警消息处理流程。告警撤销表示告警源丢失或者是告警源产生的部分告警的恢复。当告警源丢失时,需要恢复该告警源产生的所有告警。告警管理模块在接收到告警撤销后,首先根据告警撤销内容参数在存储区查找匹配的告警,如果某个告警存储记录不满足条件,那么不进行任何处理。如果该记录是内容参数所表示的告警源所产生的告警,那么修改告警存储记录的标记为未确认恢复,然后发送网管恢复,再设置这个恢复的重新发送时间计数和次数计数。网管如果接收到恢复Trap就会对于恢复进行确认。
图13介绍了如何处理存储区未确认告警或恢复即重新发送功能。在系统设备运行过程中,网管与被管理的网络设备之间的通讯异常可能导致网管的一些确认不能够及时送达到告警管理模块,在告警管理模块的存储区中就会存在一些未被确认的告警和恢复。虽然通过网管的告警刷新和告警同步,这些未被确认的告警,可以得到确认,但是这样的确认并没有体现出通讯设备告警的实时性。对于那些未被确认的恢复,会作为永久的数据保留下来,占用了系统有限的存储区资源,造成浪费。因此,为了更好的体现告警的实时性以及清除这些占用资源的数据,在告警管理模块中存在一个周期定时器,它会周期定时扫描一下存储区,根据每个存储记录中保留的发送时间计数和发送次数计数,决定或是向网管发送Trap或是做确认处理。定时时间到,如果发送次数计数为最大次数且发送时间计数为0,说明在既定的时间内,发送了n(n>=2)次未被确认的告警和恢复,但是因为通讯异常或者其他原因没有收到网管的确认,因此对未被确认的恢复进行清除,未被确认的告警进行确认。否则,在还没有到达n次发送前,判断发送时间是否到达,如果到,那么重新发送未被确认的告警和恢复。如果发送时间没有到,那么不做任何处理,等待发送时间的到来。在还没有达到最大发送次数的限定时间内如果收到网管的确认,那么会进行正常的确认流程处理。周期定时处理只是处理未被确认的告警和恢复,对于已经确认的告警和恢复并不处理。
图14介绍了如何处理网管的告警确认。网管通过对代表告警确认的MIB对象进行设置告警识别码操作,表示对于哪一个告警进行确认。在接收到告警确认后,告警管理模块查找存储区中是否有该告警识别码表示的告警记录存在,如果存在,那么,修改记录标记为确认告警。然后,清除重新发送时间计数,次数计数。如果不存在,那么不做任何处理。
图15介绍了如何处理网管的恢复确认。网管通过对代表恢复确认的MIB对象进行设置告警识别码操作,表示对于哪一个恢复进行确认。在接收到恢复确认后,告警管理模块查找存储区中是否有该告警识别码表示的存储记录存在,如果存在,那么删除这个存储记录。如果不存在,那么不做任何处理。
图16介绍了网管的告警同步操作中的第一步获取所有保存的告警记录的告警识别码。网管通过对代表获取告警识别码的MIB对象进行读取操作,表示获取。接收到读取操作后,告警管理模块将存储区中所有保存的未确认告警或确认告警中的告警识别码收集起来,赋给该MIB对象。
图17介绍了网管的告警同步操作中的第二步请求发送指定告警识别码组表示的告警记录。系统设备运行一段时间后,由于通讯的异常或者系统业务流量的限制等原因,导致网管无法接收发送的告警或恢复。当系统运行正常后,网管发起同步告警操作保证告警的及时显示。在完成第一步的操作后,网管将自身保存的告警识别码同获取到的MIB对象数值组中包含的告警识别码逐一进行比较,如果,网管的告警识别码不在MIB对象数值组中存在,那么,网管认为该告警识别码代表的告警已经恢复,按照恢复处理。否则,按照告警处理。如果MIB对象数值组中的告警识别码不在网管保存的告警识别码组中存在,那么进行告警同步的第二步操作。否则,按照告警处理。
网管通过对代表请求指定告警的MIB对象进行设置告警识别码组操作,表示请求指定的告警。在接收到告警识别码组后,告警管理模块从组中逐一取出告警识别码,对每一个告警识别码做如下操作查找该告警识别码对应的告警存储记录是否存在,如果存在,那么向网管发送告警,然后继续下一个告警识别码的处理。如果不存在,则进行下一个告警识别码的处理。
图18介绍了如何处理网管的告警刷新请求。网管通过对代表请求刷新告警的MIB对象进行设置操作,表示请求指定的告警。在告警管理模块接收到告警刷新请求后,告警管理模块开始搜索存储区,如果存储记录是告警记录,那么向网管发送告警。如果不是告警记录,那么不作任何处理。继续如此操作,直至存储区搜索结束。
权利要求
1.一种SNMP协议下采用确认机制实现告警管理的方法,其特征在于,所述告警管理模块进行如下处理向产生告警消息的告警源提供统一接口;在注册表中注册不同类型的告警消息以及其他组装MIB对象值对的信息;对接收告警源产生的不同类型的告警消息进行处理;调用统一接口向网管发送处理过的不同类型的告警消息;对于需要确认的告警消息,等待网管的确认消息,如果收到确认,进行确认操作,如果没有收到确认,进行超时的处理。
2.如权利要求1所述SNMP协议下采用确认机制实现告警管理的方法,其特征在于所述对不同类型告警消息进行的处理包括创建存储区;对产生的告警消息获取告警识别码,组成告警存储记录进行存储;对产生的恢复和告警撤销消息,修改存储的告警记录标记;根据告警消息的类型,从注册表中读取需要绑定的MIB对象,进行MIB对象标识符和MIB对象值对的绑定;对于标记为告警或恢复的存储记录,设置重新发送的时间计数和重新发送的次数计数。
3.如权利要求1所述SNMP协议下采用确认机制实现告警管理的方法,其特征在于所述网管确认消息之后的确认操作包括根据接收到的网管通过代表确认的MIB对象设置的告警识别码,查找存储区,找到对应的告警存储记录;根据保存的存储记录标记所代表的告警消息存储类型,进行确认操作;取消存储记录中设置的重新发送时间计数和重新发送次数计数。
4.如权利要求1所述SNMP协议下采用确认机制实现告警管理的方法,其特征在于所述进行的超时处理包括遍历存储区,对于保存的未被确认的告警和恢复的告警存储记录,检查时间发送计数和发送次数计数;对于发送时间到,发送次数满足条件的未被确认告警或恢复进行确认操作;对于发送时间未到,发送次数满足条件的未被确认的告警或者恢复减少等待的发送时间,继续等待;对于发送时间到,发送次数未满足条件的未被确认的告警或恢复向网管重新发送,减少重新发送次数,设置重新发送时间;对于发送时间未到,发送次数未满足条件的未被确认的告警或者恢复减少等待的发送时间,继续等待。
5.如权利要求1或2或3或4所述SNMP协议下采用确认机制实现告警管理的方法,其特征在于所述告警管理模块在接收到告警消息后,根据告警消息的内容参数判断存储区中是否有重复的告警消息存在;如果存在,不进行任何处理;如果不存在,则获取告警识别码组成告警存储记录保存,发送网管告警;发送后设置告警存储记录中的重新发送时间计数和次数计数。
6.如权利要求1或2或3或4所述SNMP协议下采用确认机制实现告警管理的方法,其特征在于所述告警管理模块在接收到恢复消息后,根据恢复消息的内容参数判断存储区中是否有对应的告警消息存在;如果不存在,不进行任何处理;如果存在,则修改告警存储记录的标记为未确认恢复,发送给网管恢复;发送后再设置这个恢复的重新发送时间计数和次数计数。
7.如权利要求1或2或3或4所述SNMP协议下采用确认机制实现告警管理的方法,其特征在于所述告警管理模块在接收到告警撤销消息后,根据告警撤销内容参数在存储区查找匹配的告警消息;如果某个告警存储记录不满足条件,不进行任何处理;如果该记录是内容参数所表示的告警源所产生的告警,那么修改告警存储记录的标记为未确认恢复,发送网管恢复;发送后再设置这个恢复的重新发送时间计数和次数计数。
8.如权利要求1或2或3或4所述SNMP协议下采用确认机制实现告警管理的方法,其特征在于所述告警管理模块进一步包括对未被确认的告警和恢复消息的处理周期定时扫描存储区,根据每个告警存储记录中保留的发送时间计数和发送次数计数,决定或是向网管发送告警或是做确认处理;定时时间到,如果发送次数计数为最大次数且发送时间计数为0,对未被确认的恢复进行清除,未被确认的告警进行确认;在还没有到达最大次数发送前,判断发送时间是否到达,如果到达,那么重新发送未被确认的告警和恢复,如果发送时间没有到,不做任何处理,等待发送时间的到来,在还没有达到最大发送次数的限定时间内如果收到网管的确认,进行正常的确认处理。
9.如权利要求1或2或3或4所述SNMP协议下采用确认机制实现告警管理的方法,其特征在于所述网管通过对代表告警确认的MIB对象进行设置告警识别码操作,表示对于相应的告警消息进行确认;在接收到告警确认后,告警管理模块查找存储区中是否有该告警识别码表示的告警记录存在,如果存在,修改记录标记为确认告警,然后,清除重新发送时间计数,次数计数;如果不存在,不做任何处理。
10.如权利要求1或2或3或4所述SNMP协议下采用确认机制实现告警管理的方法,其特征在于所述网管通过对代表恢复确认的MIB对象进行设置告警识别码操作,表示对于相应恢复进行确认;在接收到恢复确认后,告警管理模块查找存储区中是否有该告警识别码表示的存储记录存在,如果存在,删除这个存储记录;如果不存在,那么不做任何处理。
11.如权利要求1或2或3或4所述SNMP协议下采用确认机制实现告警管理的方法,其特征在于所述告警管理模块还包括告警同步的处理第一步,获取所有保存的告警记录的告警识别码,网管通过对代表获取告警识别码的MIB对象进行读取操作,表示获取;接收到读取操作后,告警管理模块将存储区中所有保存的未确认告警或确认告警中的告警识别码收集起来,赋给该MIB对象;第二步,请求发送指定告警识别码组表示的告警记录,在完成第一步后,网管将自身保存的告警识别码同获取到的MIB对象数值组中包含的告警识别码逐一进行比较;如果网管的告警识别码不在MIB对象数值组中存在,网管认为该告警识别码代表的告警已经恢复,按照恢复处理,否则,按照告警处理;如果MIB对象数值组中的告警识别码不在网管保存的告警识别码组中存在,进行告警同步的第二步,否则,按照告警处理;第三步,网管通过对代表请求指定告警的MIB对象进行设置告警识别码组操作,表示请求指定的告警;在接收到告警识别码组后,告警管理模块从组中逐一取出告警识别码,对每一个告警识别码,查找该告警识别码对应的告警存储记录是否存在,如果存在,那么向网管发送告警,继续下一个告警识别码的处理;如果不存在,则进行下一个告警识别码的处理。
12.如权利要求1或2或3或4所述SNMP协议下采用确认机制实现告警管理的方法,其特征在于所述告警管理模块还包括告警刷新的处理网管通过对代表请求刷新告警的MIB对象进行设置操作,表示请求指定的告警;在告警管理模块接收到告警刷新请求后,告警管理模块开始搜索存储区,如果存储记录是告警记录,那么向网管发送告警;如果不是告警记录,那么不作任何处理;继续操作,直至存储区搜索结束。
全文摘要
本发明涉及一种SNMP协议下采用确认机制实现告警管理的方法,通过告警管理模块提供给告警源统一的接口,告警源将告警消息的种类以及其他组装MIB象值对的信息在注册表中注册,调用所提供的接口,发送各种不同类型的告警消息。告警管理模块在发送前,对于告警源产生的告警消息依据类别进行不同的管理。发送后,对于那些需要确认的消息,等待网管的确认消息,进行确认操作或者超时处理。本发明能够保证SNMP协议下管理者实体及时、准确的接收到代理实体发送的陷阱消息,达到了及时掌握设备运行状况的效果。由于代理实体对发送的消息进行了存储,能够提供管理者的实时查询,提高了系统对于网络设备的监控能力。
文档编号H04L12/24GK1893424SQ20051008265
公开日2007年1月10日 申请日期2005年7月8日 优先权日2005年7月8日
发明者韩影 申请人:中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1