一种告警应对系统的制作方法

文档序号:7728309阅读:102来源:国知局
专利名称:一种告警应对系统的制作方法
技术领域
本实用新型涉及无线通信领域,尤其涉及一种告警应对系统。
背景技术
在目前的无线网络通信系统中,当基站产生一条告警后,会将该告警上报给基站 维护人员,维护人员会根据上报的告警进行相应的处理,处理方式包括重新配置参数、复位 单板、更换硬件甚至联系设备制造商等。简言之,只要产生了一条告警,就需要维护人员通 过手动操作进行恢复。但有时因为维护人员的疏忽或其它原因使得需要立刻恢复的告警 未能得到及时恢复,从而使得问题越来越严重,甚至导致基站崩溃,以致造成极大的经济损 失。因此建立一种能主动应对基站告警的系统已成为迫切需要解决的问题。

实用新型内容本实用新型的解决的技术问题在于提供一种告警应对系统,以解决当前基站告警 系统中缺乏主动性应对告警的问题。一种告警应对系统,包括告警提取应对子系统,该子系统中包括告警接收模块、告 警提取模块及告警应对模块;所述告警接收模块与所述告警提取模块相连,其接收从外界传来的告警信息;所述告警提取模块还与所述告警应对模块相连,其从所述告警接收模块接收到的 告警信息中选取出优先要处理的告警;所述告警应对模块与所述告警提取模块相连,其根据所述告警提取模块提取出的 告警选取对应的应对方法,并对所述告警进行应对。进一步地,上述告警应对系统还可具有以下特征所述优先要处理的告警为所述告警接收模块接收到的所有告警信息中告警级别
最高的告警。进一步地,上述告警应对系统还可具有以下特征所述优先要处理的告警为所述告警接收模块接收到的所有告警信息中产生时间
最早的告警。进一步地,上述告警应对系统还可包括信息反馈子系统,该子系统中包括应对结 果接收模块和记录模块;所述告警应对模块与所述应对结果接收模块相连,其在对所述告警应对完成后, 将是否应对成功的消息发送给所述应对结果接收模块;所述应对结果接收模块与所述记录模块相连,其判断所述消息为应对成功消息 后,发送给记录模块;所述记录模块记录与所述应对结果接收模块相连,其记录下所述告警相关信息。进一步地,上述告警应对系统还可具有以下特征所述信息反馈子系统中还包括上报模块;[0018]所述应对结果接收模块与所述上报模块相连,其判断所述消息为应对失败消息 后,通知所述上报模块;所述上报模块与所述应对结果接收模块相连,其在收到所述通知后,提醒用户处
理该条告警。通过该系统,可以不用人为的干预而直接解决基站中由软件引起的一些告警以及 部分硬件告警,从而减轻了维护人员的负担,同时在恢复后,还会将产生告警的原因以及恢 复的过程通过日志的形式保留下来供用户查看;当遇到无法恢复的告警时会尽可能保持小 区内用户的连接以及尽力保持高需求业务,维持系统的稳定性,同时会以紧急呼叫的方式 来提醒维护人员,提高了产品的竞争力。

图1为本实用新型实施例中告警应对系统结构框图;图2为本实用新型实施例中包含第二子系统的告警应对系统的结构框图;图3为本实用新型实施例中告警应对方法的流程图。
具体实施方式
下面将结合附图及实施例对本实用新型的技术方案进行更详细的说明。告警应对是指对某一种或某一类告警提出一种解决方法从而能恢复这个告警。而 告警应对的关键在于(1)能准确提取出需要紧急处理的告警。基站产生的告警按级别来分可分为严重、 重要、一般、轻微等。低级别的告警(如级别为轻微或一般的告警)一般只是提醒用户,该 告警可能会轻微影响系统,但其影响也可能是暂时的;而高级别的告警(如级别为严重或 重要的告警)则是告诉用户,该告警会影响系统的正常运行,需要用户尽快解决。因此,对 于维护人员来说,告警级别越高则越需要优先处理。(2)能提出解决一条告警的应对方法。本实用新型提出了一个告警应对系统,如图1所示,包括第一子系统。该第一子 系统为告警提取应对子系统,其中又包括依次相连的告警接收模块、告警提取模块和告警 应对模块。告警接收模块用于接收外界传来的告警信息;告警提取模块用于在告警接收模 块所接收到的所有告警中提取出一个优先要处理的告警,而该优先要处理的告警可以是当 前所有告警中级别最高的告警,也可以是产生时间最早的告警;当需优先处理的告警不止 有一条时,可从中任选一条,其它的稍后再处理;告警应对模块中保存有多种告警的应对方 法,其用于根据提取模块提取出的告警信息选取对应的应对方法,并对该告警信息加以应 对。该第一子系统系统能解决绝大部分的软件问题以及部分硬件问题。软件问题包括进程 挂起、软件运行状态错误、处理模块过载、软件异常等,对应的应对方法可以包括屏蔽、复 位某个DSP (Digital SignalProcessor,数字信号处理器),阻塞、复位某个单板,将一些业 务转移到其它处理模块。硬件问题主要是相关硬件有备份的,例如主控板,一条物理链路及 冗余资源等等。而对应的应对方法可以包括删除并重新建立链路、主备倒换以及使用冗余 资源等。此外,如图2所示,该告警应对系统中还可以包括第二子系统,该第二子系统为信息反馈子系统,其可以实现两方面的功能,一是反馈告警应对结果,二是保存应对记录及结上述第二子系统可包括以下几个模块应对结果接收模块接收上述告警应对模块发来的结果信息,如果为应对成功,则 发给记录模块;否则,发给上报模块。记录模块在告警应对成功后,将产生告警的可能原因以及应对方法保存到一个 文件中,供用户查看。上报模块在告警应对失败后,将该条告警上报给用户,通知用户来处理。上述第一子系统接收到的告警可携带如下基本信息{告警码,告警级别}其中,告警码用来标识该条告警的名称,告警应对模块依据该标识来选取对应的 应对方法加以应对;告警级别用来说明这条告警产生后对系统影响的严重程度。此外,还可 以携带告警影响范围信息和/或告警类型,告警影响范围信息可以说明这条告警产生后会 影响一块单板,还是影响一个DSP、CPU、FPGA,或者是影响整个系统等等,而告警类型可以进 一步明确该条告警是硬件告警还是软件告警。当告警类型属于硬件告警时,还可以在上述 信息中增加冗余资源标识,该标识用于表示产生该告警的硬件是否有备份资源。现举例如下l、{UPB(User Plane Board,用户面板)单板状态异常,严重告警,单板,软件告警}本实例说明了一个UPB单板状态异常的告警,它的告警级别是严重告警,这种告 警的优先级是最高的,影响范围为整个单板,表示该产生了该告警后整个单板都无法正常 运行,告警类型为软件告警。2、{CC(Center Control,中控)单板硬件故障,严重告警,系统,硬件告警,是}本实例说明了一个CC单板硬件故障的告警,它的告警级别是严重告警,影响范围 是整个系统,告警类型为硬件告警,它的是否存在冗余资源标识为是,表示存在冗余资源。 对于硬件类告警,是否存在冗余资源决定是否能恢复告警。根据上述信息,告警应对模块的应对流程如图3所示,可包括如下步骤301、查看要应对的告警信息的告警类型,如果为硬件告警,则执行步骤302 ;否则 执行步骤303 ;302、判断是否有冗余资源,如果有,则使用冗余资源进行应对,结束,否则,应对失 败,结束;303、查看该告警的影响范围,根据影响范围采用恰当的应对方法加以应对。在第一子系统中的告警应对模块对一条告警信息完成应对后,其向第二子系统发 送的应对结果通知消息中可携带如下基本信息;{告警码,告警应对标志}该告警码为已经应对过的告警信息的标识;而告警应对标志用来标识该条告警是 被应对成功还是失败。应对成功表示告警应对模块已用恰当的方法使得该条告警得到恢 复;而应对失败则表示告警应对模块采用了应对方法,但告警依然没能得到恢复,或者告警 应对模块无法找到合适的方法对该告警进行应对。此外,还可以包括告警产生原因和/或 应对方法标识。
5[0049]产生原因就是描述该告警产生的可能原因,应对方法标识用于表示恢复该告警采 用的实际方法。第一子系统发送给第二子系统的数据结构体举例如下{UPB单板状态异常,应对成功,软件异常,阻塞+复位}该实例说明,一个UPB单板状态异常告警产生原因是软件异常,经过应对后已经 恢复了,恢复的方法就是首先阻塞单板,然后复位单板。下面对技术方案的实施作进一步的详细描述。首先介绍第一子系统,该子系统首先要提取出优先处理的告警。具体步骤是首先 遍历所有告警,获取优先要处理的告警,这里获取优先要处理的告警依据为告警级别,对于 具有相同告警级别的多个告警,则任取其中一个进行处理,处理完这个再处理另外一个告 警。提取出优先要处理的告警后,查看是否有对应的应对方法对该告警加以应对,如有,则 对该条告警信息加以对应,应对的方法包括阻塞某个DSP,复位某个DSP,阻塞某块单板,复 位某块单板,使用备用单板,使用冗余资源等。第二子系统主要负责判别告警应对结果,即查看告警是否应对成功,如果应对成 功则将引起该告警的原因和处理方法以日志的方法保存下来,供用户查看,如果没有应对 成功,则认为应对方法有误或无法处理,则以紧急告警的方式发送该消息给维护人员,由维 护人员来处理。下面以LTE系统为例,描述本系统的具体应用。实例1 假设在某个时刻该告警应对系统中的告警接收模块接收到如下5条告警, 分别为UUPB单板状态异常,严重告警,单板,软件告警;2、参考时钟源降质,重要告警,单板,软件告警;3、AIF异常,一般告警,DSP,软件告警;4、SNMP (Simple Network Management Protocol,简单网络管理协议)对时失败, 轻微告警,单板,软件告警;5、RRU (Radio Remote Unit,远端射频模块)时钟偏差大,一般告警,单板,软件告警。首先由第一子系统中的告警提取模块提取优先要处理的告警,在这里是指告警级 别最高就是优先要处理的告警,因此最后提取出来的告警是UPB单板状态异常。然后告警应对模块对提取出来的告警进行应对。首先查看告警类型软件告警,然 后判断其影响范围整块单板,然后根据应对方法,首先将产生告警的这块单板进行阻塞, 即将其置为不可用状态,这样做的目的是告诉其它和这块单板存在交互的各个系统,本单 板处于不可用状态,不能再进行业务数据交互。由于单板之间进行交互时,首先需要查看要 交互的单板是否可用,如果可用则进行正常交互,如果不可用则不会发生交互,因此可以制 止其他单板跟本块单板进行交互。然后将该单板复位,复位完成后,将应对结果发给第二子 系统。应对结果为IUPB单板状态异常,应对成功,软件异常,阻塞+复位}。如果没有应对 成功,则将该单板的阻塞标志位置为1 (1表示单板被阻塞,0表示单板未阻塞),同时该告警 应对标志位置为应对失败。第二子系统接收到应对结果后,首先查看该告警是否已应对成功,如果成功,则将发生告警产生的可能原因及恢复方法以日志的形式保存起来。因此上述告警最后保存下来 的就是{UPB单板状态异常,软件异常,阻塞+复位}。如果应对结果是失败,则通知用户对 该告警进行处理。用户可以通过FTP方式下载到后台并查看,这时告警为1、参考时钟源降质,重要告警,单板,软件告警;2、AIF异常,一般告警,DSP,软件告警;3、SNMP对时失败,轻微告警,单板,软件告警;4、RRU时钟偏差大,一般告警,单板,软件告警。上面描述的是当基站产生一个软件类的告警后,我们可以通过阻塞、复位的方法 来解决,实际上解决软件类的告警也不一定是复位,也可以包含其它方法,但复位是解决软 件类告警很有效也很普遍的方法。实例2 假设在某个时刻基站产生了如下5条告警,分别为1、CC单板硬件故障,严重告警,系统,硬件告警,是;2、参考时钟源降质,重要告警,单板,软件告警;3、AIF异常,一般告警,DSP,软件告警;4、SNMP对时失败,轻微告警,单板,软件告警;5、RRU时钟偏差大,一般告警,单板,软件告警。流程和上面的类似,提取模块提取出优先级最高的告警,即CC单板硬件故障,应 对模块查看其告警的类型硬件告警,查看是否有冗余资源是。因此只需要将单板进行切 换,将备用的CC单板切换成主用单板,这样单板硬件故障就可以暂时的解决了,同时没有 对基站的运行造成很大的影响。同时发送给第二子系统的结果是{CC单板硬件故障,应对 成功,硬件异常,同步切换}第二子系统收到第一子系统的处理结果后,首先查看告警是否恢复恢复,则保存 日志{CC单板硬件故障,硬件异常,同步切换}此时,该告警应对系统中的告警为1、参考时钟源降质,重要告警,单板,软件告警;2、AIF异常,一般告警,DSP,软件告警;3、SNMP对时失败,轻微告警,单板,软件告警;4、RRU时钟偏差大,一般告警,单板,软件告警。上述方法是一种解决硬件告警的方法,能自动恢复硬件告警的前提是需要存在一 些必要的冗余资源,当某个硬件发生故障时,可以使用冗余资源来代替原有的资源。我们也可以为这个应对系统设置一个应对开关,通过网管后台来控制这个应对开 关,当网管不想要系统自动应对则关闭应对开关,反之则打开应对开关。同时我们也可以为 通过用户在后台自行配置一个告警的应对方法,从而达到灵活配置一条告警的应对效果。 但这只是对于一些特定的告警。当然,本实用新型还可有其它多种实施例,在不背离本实用新型精神及其实质的 情况下,熟悉本领域的技术人员当可根据本实用新型作出各种相应的改变和变形,但这些 相应的改变和变形都应属于本实用新型所附的权利要求的保护范围。
权利要求一种告警应对系统,其特征在于,包括告警提取应对子系统,该子系统中包括告警接收模块、告警提取模块及告警应对模块;所述告警接收模块与所述告警提取模块相连,其接收从外界传来的告警信息;所述告警提取模块还与所述告警应对模块相连,其从所述告警接收模块接收到的告警信息中选取出优先要处理的告警;所述告警应对模块与所述告警提取模块相连,其根据所述告警提取模块提取出的告警选取对应的应对方法,并对所述告警进行应对。
2.如权利要求1所述的告警应对系统,其特征在于,所述告警提取模块为从所述告警接收模块接收到的所有告警信息中提取出告警级别 最高的告警的模块。
3.如权利要求1所述的告警应对系统,其特征在于,所述告警提取模块为从所述告警接收模块接收到的所有告警信息中提取出产生时间 最早的告警的模块。
4.如权利要求1所述的告警应对系统,其特征在于,还包括信息反馈子系统,该子系统 中包括应对结果接收模块和记录模块;所述告警应对模块与所述应对结果接收模块相连,其在对所述告警应对完成后,将是 否应对成功的消息发送给所述应对结果接收模块;所述应对结果接收模块与所述记录模块相连,其判断所述消息为应对成功消息后,发 送给记录模块;所述记录模块记录与所述应对结果接收模块相连,其记录下所述告警相关信息。
5.如权利要求4所述的告警应对系统,其特征在于, 所述信息反馈子系统中还包括上报模块;所述应对结果接收模块与所述上报模块相连,其判断所述消息为应对失败消息后,通 知所述上报模块;所述上报模块与所述应对结果接收模块相连,其在收到所述通知后,提醒用户处理该条告警。
专利摘要一种告警应对系统,包括告警提取应对子系统,该子系统中包括告警接收模块、告警提取模块及告警应对模块;告警接收模块与告警提取模块相连,其接收从外界传来的告警信息;告警提取模块还与告警应对模块相连,其从告警接收模块接收到的告警信息中选取出优先要处理的告警;告警应对模块与告警提取模块相连,其根据告警提取模块提取出的告警选取对应的应对方法,并对该告警进行应对。通过该系统,可以不用人为的干预而直接解决基站中由软件引起的一些告警以及部分硬件告警,从而减轻了维护人员的负担。
文档编号H04W24/04GK201663697SQ200920155960
公开日2010年12月1日 申请日期2009年5月27日 优先权日2009年5月27日
发明者山海丰, 胡成冈, 郝军强 申请人:中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1