告警处理方法、装置及系统的制作方法

文档序号:7926272阅读:115来源:国知局
专利名称:告警处理方法、装置及系统的制作方法
技术领域
本发明涉及通信技术领域,尤其涉及一种告警处理方法、装置及系统。
背景技术
通信设备的运行状态可以受自身硬件质量的影B向,也容易受外界环境的变化影 响,例如,供电电压,温度,湿度,震动,电磁干扰等因素均可作用于通信设备,使得通信设备 可能产生各种各样的故障。然而由于故障具有不稳定的特性,往往检测到的故障信息会随 时间的变化而变化,相应的,故障告警也随时间的变化而变化。故障可能持续时间很短,也 可能持续时间很长,可能出现的次数很少,也可能出现的次数很多。例如由于接插件故障, 单板通信就此彻底中断,这样就可能会使得单板无法正常工作;然而也有可能由于接插件 接触不良而频繁发生板间通信告警,从而影响单板正常工作,甚至使得单板根本无法工作。
持续时间短的故障称为闪断故障,相应的故障告警也称为闪断告警;在一定的时 间内反复出现多次且满足一定的规律的故障称为振荡故障,相应的告警也称为振荡告警。 闪断和振荡告警,由于其持续时间很短,或者在短时间内出现的次数很多,会给通信网络的 监控带来负面影响,降低监控人员的效率,所以,要对告警进行筛选,按照对用户的价值来 判断告警是否要上报。 现有技术一般采用以下3种方法对告警进行处理 1、对于相似告警(Alike Alarm),即由相同的对象实例产生且告警类型、告警级
别、告警原因和告警具体故障都相同的告警,对单次相似告警的持续时间进行度量并设置
闪断门限,当单次相似告警持续时间超过闪断门限时,发送告警产生通知消息; 2、对指定的时间内出现的相似告警次数进行计数,并设置阈值门限,当计数超过
阈值门限时,发送告警产生通知消息; 3、对指定的时间内出现的相似告警次数进行计数,并设置振荡产生门限和振荡恢 复门限。当振荡未产生且指定的时间内出现的相似告警次数低于振荡产生门限时,对每个 相似告警都发送告警产生通知消息;如果大于振荡产生门限,则产生振荡且发送告警产生 通知消息。振荡产生后,只要在规定的时间内,相似告警的数量高于振荡恢复门限,则忽略 后面的相似告警,否则,发送告警清除通知消息。 通信设备的故障模式是时变的,即同样的设备可能在某一时刻发生不稳定的故障 (故障时而产生时而消失),而在另外时刻发生稳定的故障(故障产生后长时间不消失); 此外故障持续的时间也可以长可以短。发明人在实现本发明的过程中发现,现有技术提供 的告警处理方法不能解决由于相似告警时变性所带来的问题,导致对于相似告警信息不能 进行准确及时有效的筛选与处理,造成有价值的告警信息的丢失,甚至造成故障隐患。

发明内容
本发明实施例提供一种告警处理方法、装置及系统,能够准确及时的筛选出有价 值的告警信息,保障设备的平稳运行。
—方面,本发明实施例提供了一种告警处理方法,包括 进行故障检测,当检测到故障时上报告警信息; 根据接收的告警信息获取指定时间段内的相似告警持续时间累计信息; 当所述指定时间段内的相似告警持续时间累计信息满足上报条件时,发送告警通知。
另一方面,本发明实施例还提供了一种告警处理装置,包括
接收单元,用于接收上报的告警信息; 获取单元,用于从所述接收单元接收的告警信息中获取指定时间段内的相似告警持续时间累计信息; 发送单元,用于当所述获取单元获取的指定时间段内的相似告警持续时间累计信息满足上报条件时,发送告警通知。 另一方面,本发明实施例还提供了一种告警处理系统,包括故障检测装置和告警处理装置 所述故障检测装置用于进行故障检测,当检测到故障时向所述告警处理装置上报告警信息; 所述告警处理装置包括 接收单元,用于接收上报的告警信息; 获取单元,用于从所述接收单元接收的告警信息中获取指定时间段内的相似告警持续时间累计信息; 发送单元,用于当所述获取单元获取的指定时间段内的相似告警持续时间累计信息满足上报条件时,发送告警通知。 本发明实施例提供的告警处理方法、装置及系统,通过接收上报的告警信息,从中获取指定时间段内相似告警持续时间累计信息,并在所述相似告警持续时间累计信息满足上报条件时发送告警通知,因而能够适应时变特性的故障模式,准确及时地筛选出有价值的告警信息,保证了通信设备的平稳运行。


图1为本发明实施例的告警处理方法的流程 图2为本发明实施例的告警处理方法的示意 图3为本发明实施例的告警处理装置结构示意图一 ;
图4为本发明实施例的告警处理装置结构示意图二。
具体实施例方式
下面结合附图对本发明的实施方式做出具体的说明。 如图1所示,本发明实施例提供了一种告警处理方法,包括 S101,进行故障检测,当检测到故障时上报告警信息; S102,根据接收的告警信息获取指定时间段内的相似告警持续时间累计信息;
S103,当所述指定时间段内的相似告警持续时间累计信息满足上报条件时,发送
告警通知。
本发明实施例提供的告警处理方法,通过获取指定时间段内相似告警持续时间累计信息,并在所述相似告警持续时间累计信息满足上报条件时发送告警通知,能准确及时地筛选出有价值的告警信息,保证了通信设备的平稳运行。同时,本发明实施例所述方法获取的是指定时间段内相似告警持续时间的累计信息,因此也能够有效地降低告警信息数量,在告警数量和告警准确性、及时性上取得很好的平衡。 本发明提供另一实施例,以详细说明告警处理方法的具体实现过程。该方法具体包括 1)进行故障检测并上报告警信息; 故障检测装置对被检测的通信设备进行故障检测,判断该通信设备是否存在故障,以及存在故障的性质和是否需要上报等等,例如,故障检测装置可以采用如下方式进行故障检测 方式一 主动查询方式 主动对被检测的通信设备的状态进行检查,即故障检测装置定时检测通信端口的状态,当发现端口的状态为不可用而且持续一段时间后,则上报该端口故障告警产生消息;当此端口从不可用转变为可用状态时,并且可用状态持续一段时间后,上报故障告警清除消息。 方式二 告警数据上报方式 当被检测的通信设备在E1/T1的接收端收到的信号是全"l"时,进入AIS(AlarmIndication Signal,El/Tl告警指示信号)状态。当检测到链路进入AIS状态持续一段时间时,产生AIS故障信息并上报给故障检测装置;当链路退出AIS状态且持续一段时间时,产生AIS故障恢复信息并上报给故障检测装置。 在检测完毕后,故障检测装置将检测到的故障告警信息上报给告警处理装置。
2)接收所述上报的告警信息,获取指定时间内的相似告警持续时间累计信息
对于每次相似告警而言,从该次相似告警产生到该次相似告警清除前的这段持续
时间,称为该次相似告警产生持续时间;从该次相似告警清除到下一次相似告警产生前的这段持续时间,称为该次相似告警清除持续时间。 告警处理装置接收故障检测装置上报的告警信息后,所述上报的告警信息中包含有相似告警;告警处理装置从所述接收的告警信息中获取指定时间内的相似告警持续时间累计信息,所述指定时间内的相似告警持续时间累计信息可以包括指定时间内出现的各次相似告警产生持续时间的累计之和,也可以包括指定时间内出现的各次相似告警清除持续时间的累计之和,也可以包括对所述相似告警产生持续时间或清除时间的累计之和的数学处理结果,例如进行归一化处理、求极值或者求对数等等,本发明实施例并不对此做出限定,只要能够实现使得该数学处理结果亦能反映上述累计持续时间的目的即可。本实施例中所提到的各次包括零次到多次的多种情形。 3)根据获取的指定时间内的相似告警持续时间累计信息判断是否满足上报条件,如果满足,则向其它网络设备发送告警通知 根据所述获取的指定时间内的相似告警持续时间累计信息判断是否满足上报条件,如果满足条件,则向其它网络设备,例如其它网元、网元管理系统或者网络管理系统发送告警通知。具体的,可以包括以下几种情况
方式一 所述相似告警持续时间累计信息可以为指定时间内的相似告警产生持续 时间累计信息,所述相似告警产生持续时间累计信息可以是指定时间内的发生的各次相似 告警产生持续时间的累计之和,也可以是指定时间内的发生的各次相似告警产生持续时间 的累计之和的数学处理结果。当判定所述指定时间内的相似告警产生持续时间累计信息满 足告警产生通知上报条件时,例如,该条件可以是一个门限值,本发明实施例不限定上报条 件的具体表现形式,则发送告警产生通知。 方式二 所述相似告警持续时间累计信息也可以为指定时间内的相似告警清除持 续时间累计信息,所述相似告警清除持续时间累计信息可以是指定时间内的发生的各次相 似告警清除持续时间的累计之和,也可以是指定时间内的发生的各次相似告警清除持续时 间的累计之和的数学处理结果。当判定所述指定时间内的累计相似告警清除持续时间信 息满足告警产生通知上报条件时,例如,该条件可以是一个门限值,也可以是其它的表现形 式,则发送告警产生通知。 方式三所述相似告警持续时间累计信息可以为指定时间内的累计相似告警产生 持续时间信息,所述累计相似告警产生持续时间信息可以是指定时间内的发生的各次相似 告警产生持续时间的累计之和,也可以是指定时间内的发生的各次相似告警产生持续时间
的累计之和的数学处理结果。当判定所述指定时间内的累计相似告警产生持续时间信息满 足告警清除通知上报条件时,例如,该条件可以是一个门限值,也可以是其它的表现形式,
则发送告警清除通知。 方式四所述相似告警持续时间累计信息也可以为指定时间内的相似告警清除持 续时间累计信息,所述相似告警清除持续时间累计信息可以是指定时间内的发生的各次相 似告警清除持续时间的累计之和,也可以是指定时间内的发生的各次相似告警清除持续时 间的累计之和的数学处理结果。当判定所述指定时间内的累计相似告警清除持续时间信 息满足告警清除通知上报条件时,例如,该条件可以是一个门限值,也可以是其它的表现形 式,则发送告警清除通知。 本实施例所提到的指定时间段,可以是缺省值,也可以人工设置,该指定时间段的 起止时间也可以是动态变化的。 为了叙述的方便,可以将这个可以动态变化的指定时间段称为滑动时间窗,用于 判断是否发送告警产生通知的滑动时间窗称为前滑动时间窗;用于判断是否发送告警清除 通知的滑动时间窗称为后滑动时间窗。 下面结合附图对上述方式一、三的具体实现过程进行详细说明。如图2所示,图2 中所示横轴表示时间,时间轴上的各方块表示各次相似告警,如图2所示,按时间顺序分别 为相似告警1、相似告警2、相似告警3、相似告警X、相似告警4和相似告警5。每个方块垂 直于时间轴的两条边分别表示针对该次相似告警的告警产生与告警清除,因此方块1在时 间轴上的跨度即表示相似告警1产生持续时间,方块1与方块2在时间轴上的间隔即表示 相似告警1的告警清除持续时间。 TW1表示前滑动时间窗的宽度,TW2表示后滑动时间窗的宽度,Tupedge表示滑动时间 窗的上边沿,TlMrerate表示滑动时间窗的下边沿,TT1表示告警产生通知发送门限,TT2表示 告警清除通知发送门限,F(t)表示一次相似告警的告警产生持续时间,F(f)表示一次相似 告警的告警清除持续时间。
如图2所示,以相似告警X的告警产生时刻tx为前滑动时间窗TW1的上边沿时刻T,dge,以T,^-TW工为前滑动时间窗TW1的下边沿时刻1\ ^^。获取所述前滑动时间窗所确定的指定时间段内的相似告警持续时间累计信息,即获取TW1内出现的相似告警1、相似告警2和相似告警3的告警产生持续时间之和E F(t),如果E F(t) > TT1,则表明相似告警持续时间累计信息满足告警产生通知发送条件,则上报告警产生通知。本实施例中选取相似告警X的告警产生时刻为前滑动时间窗TW1的上边沿仅是示例性的,也可以选取其他相似告警的产生时刻,或者相似告警的清除时刻,或者在相似告警的产生持续时间内的某个时间点,或者在相似告警的清除持续时间内的某个时间点进行,本发明实施例并不对此进行限定。 当在tx获取的相似告警持续时间累计信息不满足告警产生通知发送条件时,则进一步的,移动前滑动时间窗,并重新获取相似告警持续时间累计信息。例如,将前滑动时间窗的上边沿时刻移动到时间点ty,以ty为前滑动时间窗的上边沿时刻T申一,以T,^-TW工为前滑动时间窗的下边沿时刻T^,^,获取移动后的前滑动时间窗的TW1内出现的累计相似告警产生持续时间信息,即E F(t),如果E F(t) > TT1,则表明相似告警持续时间累计信息满足告警产生通知发送条件,则上报告警产生通知。 以相似告警X的告警清除时刻tz为后滑动时间窗TW2的下边沿时刻TlOTCTedge,以Tlmredge+TW2为后滑动时间窗TW2的上边沿时刻T,dge,获取所述后滑动时间窗所确定的时间段内的累计相似告警产生持续时间信息,例如,TW2内的出现的各次相似告警的产生持续时间累计之和E F(t),如果E F(t)《TT2,则表明相似告警持续时间累计信息满足告警清除通知发送条件,则发送告警清除通知。特别的,也可以以相似告警X的告警清除时刻t,为后滑动时间窗TW2的下边沿时刻TlOTreredge,以TlOTredge+TW2为后滑动时间窗TW2的上边沿时刻T,^,若所述后滑动时间窗所确定的时间段内没有发生相似告警,即相似告警产生持续时间累计为O,则发送告警清除通知。 当在tz获取的相似告警持续时间累计信息不满足告警清除通知发送条件时,则进一步的,可以移动后滑动时间窗,并重新获取相似告警持续时间累计信息。当在移动后的后滑动时间窗内的相似告警持续时间累计信息满足告警清除通知发送条件时,则发送告警清除通知。 移动滑动时间窗的方法可以是随着时间的推移进行的等间距的移动,比如每次移动l秒,计算移动后的时间窗内的相似告警持续时间累计信息。移动滑动时间窗的方法也可以是不等间距的移动,当然也可以是上述两种方式的结合,比如第一步就从相似告警的产生时间点t,向后移动一个差值At(该At为告警通知产生门限与TWl内相似告警累计时间的差值),进行相似告警持续时间累计信息的计算,如果不满足上报告警通知的门限,则再以l秒的步长均匀移动等等。上述提到的移动滑动时间窗的方法仅是示例性的,本发明实施例并不对此进行限定。 方式二、四的具体实现过程与方式一、三类似,不同的是获取的是指定时间段内的
相似告警清除持续时间累计信息,并与相应的门限进行比较,此处就不再赘述。 本发明实施例所提到的门限值和上报条件,仅是示例性的,本发明实施例并不对
此进行限定,可根据实际情况设置合理的门限值作为上报条件。 本发明实施例提供的告警处理方法,通过接收故障检测装置上报的告警信息,从中获取指定时间段内相似告警持续时间累计信息,并在所述相似告警持续时间累计信息满 足上报条件时发送告警通知,因而能够适应时变特性的故障模式而独立实施,对于不稳定 故障、稳定故障、持续时间长或者短的故障所产生的告警,都能准确及时地筛选出有价值的 告警信息,保证了通信设备的平稳运行。同时,本发明实施例所述方法获取的是指定时间段 内相似告警持续时间的累计信息,因此也能够有效地降低告警信息数量,在告警数量和告 警准确性、及时性上取得很好的平衡。 本发明实施例还提供了一种告警处理系统,所述系统包括故障检测装置和告警 处理装置, 所述故障检测装置用于进行故障检测,当检测到故障时向所述告警处理装置上报 告警信息; 所述告警处理装置如图3所示,包括
接收单元301,用于接收上报的告警信息; 获取单元302,用于从所述接收单元接收的告警信息中获取指定时间段内的相似 告警持续时间累计信息; 发送单元303,用于当所述获取单元获取的指定时间段内的相似告警持续时间累 计信息满足上报条件时,发送告警通知。 所述指定时间段可以为滑动时间窗的上下边沿时刻确定的时间段,所述滑动时间 窗随时间进行移动。所述指定时间段内的相似告警持续时间累计信息包括指定时间段内 的相似告警产生持续时间累计信息或者指定时间段内的相似告警清除持续时间累计信息。
具体的,结合图4所示,所述发送单元303可以包括 告警产生通知模块3031,用于当所述指定时间段内的相似告警持续时间累计信息 满足告警产生通知发送条件时,发送告警产生通知;和/或 告警清除通知模块3032,用于当所述指定时间段内的相似告警持续时间累计信息 满足告警清除通知发送条件时,发送告警清除通知。
具体的,所述获取单元302可以包括
确定模块3021,用于确定所述指定时间段; 获取模块3022,用于获取所述确定模块确定的时间段内的相似告警持续时间累计信息。 应用本发明实施例提供的装置及系统实现告警处理的具体过程与前述方法实施 例基本相似,此处不再赘述。 本发明实施例提供的告警处理装置及系统,通过获取指定时间段内相似告警持续
时间累计信息,并在所述相似告警持续时间累计信息满足上报条件时发送告警通知,因而
能够适应时变特性的故障模式而独立实施,对于不稳定故障、稳定故障、持续时间长或者短
的故障所产生的告警,都能准确及时地筛选出有价值的告警信息,保证了通信设备的平稳
运行。同时,本发明实施例获取的是指定时间段内相似告警持续时间的累计信息,因此也能
够有效地降低告警信息数量,在告警数量和告警准确性、及时性上取得很好的平衡。 通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借
助软件加必需的硬件平台的方式来实现,当然也可以全部通过硬件来实施,但很多情况下
前者是更佳的实施方式。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
以上所述,仅为本发明的具体实施方式
,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
权利要求
一种告警处理方法,其特征在于,包括进行故障检测,当检测到故障时上报告警信息;根据接收的告警信息获取指定时间段内的相似告警持续时间累计信息;当所述指定时间段内的相似告警持续时间累计信息满足上报条件时,发送告警通知。
2. 如权利要求1所述的方法,其特征在于,所述当指定时间段内的相似告警持续时间累计信息满足上报条件时,发送告警通知包括当所述指定时间段内的相似告警持续时间累计信息满足告警产生通知发送条件时,发送告警产生通知;或者当所述指定时间段内的相似告警持续时间累计信息满足告警清除通知发送条件时,发送告警清除通知。
3. 如权利要求2所述的方法,其特征在于,所述告警产生通知发送条件或告警清除通知发送条件为门限值。
4. 如权利要求2所述的方法,其特征在于,所述获取指定时间段内的相似告警持续时间累计信息包括确定所述指定时间段;获取所述确定的时间段内的相似告警持续时间累计信息。
5. 如权利要求4所述的方法,其特征在于,所述确定指定时间段包括确定滑动时间窗的上下边沿,所述滑动时间窗的上下边沿时刻之间的时间段为所述指定时间段。
6. 如权利要求5所述的方法,其特征在于,确定所述滑动时间窗的下边沿时刻为相似告警的清除时刻。
7. 如权利要求5所述的方法,其特征在于,所述滑动时间窗随时间进行移动。
8. 如权利要求1至7中任意一项所述的方法,其特征在于,所述指定时间段内的相似告警持续时间累计信息包括指定时间段内的相似告警产生持续时间累计信息;或者指定时间段内的相似告警清除持续时间累计信息。
9. 一种告警处理装置,其特征在于,包括接收单元,用于接收上报的告警信息;获取单元,用于从所述接收单元接收的告警信息中获取指定时间段内的相似告警持续时间累计信息;发送单元,用于当所述获取单元获取的指定时间段内的相似告警持续时间累计信息满足上报条件时,发送告警通知。
10. 如权利要求9所述的告警处理装置,其特征在于,所述发送单元包括告警产生通知模块,用于当所述指定时间段内的相似告警持续时间累计信息满足告警产生通知发送条件时,发送告警产生通知;和/或告警清除通知模块,用于当所述指定时间段内的相似告警持续时间累计信息满足告警清除通知发送条件时,发送告警清除通知。
11. 如权利要求9所述的告警处理装置,其特征在于,所述获取单元包括确定模块,用于确定所述指定时间段;获取模块,用于获取所述确定模块确定的时间段内的相似告警持续时间累计信息。
12. 如权利要求9所述的告警处理装置,其特征在于,所述指定时间段为滑动时间窗 的上下边沿时刻确定的时间段。
13. 如权利要求12所述的告警处理装置,其特征在于,所述滑动时间窗随时间进行移动。
14. 如权利要求9所述的告警处理装置,其特征在于,所述指定时间段内的相似告警持 续时间累计信息包括指定时间段内的相似告警产生持续时间累计信息;或者 指定时间段内的相似告警清除持续时间累计信息。
15. —种告警处理系统,其特征在于,包括故障检测装置和如权利要求9至14中任意一 项所述的告警处理装置,所述故障检测装置用于进行故障检测,当检测到故障时向所述告 警处理装置上报告警信息。
全文摘要
本发明实施例公开了一种告警处理方法、装置及系统,通过接收上报的告警信息,从中获取指定时间段内相似告警持续时间累计信息,并在所述相似告警持续时间累计信息满足上报条件时发送告警通知,因而能够适应时变特性的故障模式,准确及时地筛选出有价值的告警信息,保证了通信设备的平稳运行。
文档编号H04L12/26GK101741991SQ20081021780
公开日2010年6月16日 申请日期2008年11月18日 优先权日2008年11月18日
发明者朱健, 李凯 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1