一种多设备集中维护方法和系统的制作方法

文档序号:7961809阅读:247来源:国知局
专利名称:一种多设备集中维护方法和系统的制作方法
技术领域
本发明涉及网络通讯技术领域,具体涉及一种多设备集中维护方法和系统。
背景技术
随着移动通讯业务的发展,移动通讯的网络规模越来越大,越来越复杂。移动通讯网络的管理和维护也变得越来越重要。
移动通讯网络中网元设备的告警是网络管理和维护的重要观测对象,网元设备的告警直接反映了网元设备的运行健康情况,是网元设备的晴雨表,是日常设备运行维护的主要依据。
在很多协议中,如ITU-T(国际电信联盟-电信标准化部门)协议、GSM(全球移动通信系统)协议、CDMA(码分多路)协议、WCDMA(宽带码分多路)协议等都对告警进行了相关描述,这些协议主要描述了告警的产生条件、处理方式等。
目前,通讯网络主要采用多设备集中维护系统对各网元设备进行管理,多设备集中维护系统如附图1所示。
图1中,多设备集中维护系统包括多个系统设备即网元设备如系统设备1至系统设备N、告警采集系统和集中维护中心。每个网元设备都是由多个单板构成的复杂系统,网元设备及其单板的告警通过告警采集系统传输至近端维护终端和远端的集中维护中心。告警采集系统可以是固定的物理实体,也可以没有固定的物理实体。集中维护中心接收各告警信息,并显示各告警信息。
移动通信系统中的多网元集中维护系统也适用于图1所示的模型。
由于通信系统中存在的多个网元设备之间、各单板之间彼此依赖,相互影响,共同或协作完成系统功能,所以,多网元设备之间、单板之间存在紧密或松散耦合的关系,单一网元设备、单一单板的故障可能会引发其它单板或其它网元设备、甚至系统功能的异常,即一个单板出现告警会使其它单板、网元设备等也产生告警,从而,导致集中维护中心的告警数量巨大。
由于目前主要采用单一告警处理机制来对告警信息进行分析,所以,在集中维护中心的告警数量多时,重要的告警信息常常被淹没,无法及时发现,使通信系统的可维护性、可管理性差。

发明内容
本发明的目的在于,提供一种多设备集中维护方法和系统,利用预定告警筛选条件能够快速确定出有价值的告警,使集中维护中心能够对各系统设备进行有效的维护管理,提高了系统设备的可维护性。
为达到上述目的,本发明提供的一种多设备集中维护方法,包括a、告警采集系统将各系统设备的告警均传输至集中维护中心;b、集中维护中心根据预定告警筛选条件对其接收的告警进行筛选;c、集中维护中心根据筛选后得到的告警对系统设备进行维护。
所述预定筛选条件包括根据不同告警之间的基于时间相关性和参数相关性的逻辑关联关系设置的告警初始关联分析信息,且所述步骤b具体包括b1、集中维护中心根据告警初始关联分析信息将其接收的告警组建为至少一个告警关联关系树。
所述告警初始关联分析信息包括告警标识、关联告警标识、告警时间关联上限、告警时间关联下限、相互关联告警的参数对应关系。
所述告警初始关联分析信息还包括告警产生原因、恢复建议、告警产生的影响中的一个或多个。
所述预定筛选条件包括根据不同告警之间的基于数据挖掘的逻辑关联关系设置的告警特殊关联分析信息,且所述步骤b包括b2、集中维护中心根据告警特殊关联分析信息将其接收的告警组建为至少一个告警关联关系树。
当所述预定筛选条件包括告警初始关联分析信息和告警特殊关联分析信息时,告警初始关联分析信息还包括特殊关联分析指示信息,且所述步骤b具体包括b3、集中维护中心根据告警初始关联分析信息中的特殊关系分析指示信息利用告警初始关联分析信息和告警特殊关联分析信息将其接收的告警组建为至少一个告警关联关系树。
所述预定告警筛选条件包括重复告警压缩条件、忽略告警条件、告警置换条件、告警概括条件中的一个或多个,且所述步骤b包括b4、集中维护中心根据重复告警压缩条件将其在预定时间间隔内多次接收到的相同告警作为一次告警;和/或b5、集中维护中心根据忽略告警条件选取告警;和/或b6、集中维护中心将其接收的满足告警置换条件的告警置换为预定告警;和/或b7、集中维护中心根据告警概括条件将其接收的告警概括为至少一个告警类型。
所述忽略告警条件包括过滤条件、抑制条件和时间窗提取条件,且所述步骤b5具体包括集中维护中心从其接收的告警中选取满足过滤条件的告警;集中维护中心根据抑制条件对其接收的、在预定的上下文中的告警进行抑制;
集中维护中心根据时间窗提取条件提取其在预定时间窗内接收的告警;所述告警置换条件包括升级置换条件、子类置换条件,且所述步骤b6具体包括集中维护中心根据升级置换条件确定其在预定时间间隔内接收到的相同告警的次数,并在所述次数达到预定次数时,将所述各相同告警置换为一条高级别的告警;集中维护中心将其接收的、满足子类置换条件的告警置换为子类告警。
本发明还提供一种多设备集中维护系统,包括多个系统设备、告警采集系统和集中维护中心,告警采集系统将系统设备的告警传输至集中维护中心,所述集中维护中心还设置有告警管理单元根据预定告警筛选条件对集中维护中心接收的告警进行筛选,并将筛选后得到的告警传输至集中维护单元;集中维护单元根据其接收的告警对系统设备进行维护。
所述告警管理单元包括初始逻辑关联关系存储模块根据不同告警之间的基于时间相关性和参数相关性的逻辑关联关系设置的告警初始关联分析信息,并存储;逻辑关联分析模块1根据初始逻辑关联关系存储模块中存储的告警初始关联分析信息将集中维护中心接收的告警组建为至少一个告警关联关系树,并将其传输至集中维护单元。
所述告警管理单元包括特殊逻辑关联关系存储模块根据不同告警之间的基于数据挖掘的逻辑关联关系设置的告警特殊关联分析信息,并存储;逻辑关联分析模块2根据特殊逻辑关联关系存储模块中存储的告警初始关联分析信息将集中维护中心接收的告警组建为至少一个告警关联关系树,并将其传输至集中维护单元。
所述告警管理单元包括告警压缩分析模块、忽略告警分析模块,置换告警分析模块和告警概括分析模块中的一个或多个;告警压缩分析模块根据重复告警压缩条件将集中维护中心在预定时间间隔内多次接收到的相同告警作为一次告警传输至集中维护单元,并将所述相同告警的接收次数传输至集中维护单元;忽略告警分析模块根据忽略告警条件选取告警,并将选取的告警传输至集中维护单元;置换告警分析模块根据告警置换条件将集中维护中心接收的满足置换条件的告警置换为预定告警,并将预定告警传输至集中维护单元;告警概括分析模块根据告警概括条件将集中维护中心接收的告警概括为至少一个告警类型,并将告警类型信息传输至集中维护单元。
所述忽略告警分析模块包括告警过滤分析子模块将集中维护中心接收的满足过滤条件的告警传输至集中维护单元;告警抑制分析子模块对集中维护中心接收的满足抑制条件的告警进行抑制,并将不满足抑制条件的告警传输至集中维护单元;时间关联分析子模块将集中维护中心接收到的、在预定时间窗内的告警传输至集中维护单元;所述置换告警分析模块包括告警计数分析子模块根据升级置换条件确定其在预定时间间隔内接收到的相同告警的次数,并在所述次数达到预定次数时,将所述各相同告警置换为一条高级别的告警,并所述高级别的告警传输至集中维护单元;告警细化分析子模块将集中维护中心接收的、满足子类置换条件的告警置换为子类告警,并将子类告警传输至集中维护单元。
通过上述技术方案的描述可知,本发明通过设置预定告警筛选条件,使集中维护中心能够快速的确定出有价值的告警;预定告警筛选条件可以为物理关联关系信息,如重复告警压缩条件、忽略告警条件、告警置换条件、告警概括条件等,不但避免了不必要的冗余的告警信息,使集中维护中心能够将告警信息清晰、有条理的呈现出来,从而提供不同的告警观测纬度,有效把握各系统设备的运行情况;预定告警筛选条件也可以为逻辑关联关系信息,本发明的逻辑关联关系信息引入了告警初始关联分析信息和告警特殊关联分析信息,通过利用告警特殊关联分析信息进一步挖掘了不同告警之间的逻辑关联关系,告警使集中维护中心能够将其接收的告警组建为逻辑关联关系树,使集中维护中心能够快速确定出告警的根源,避免了对与根源告警相关联的告警的处理过程,使集中维护中心能够快速准确的进行故障定位,使集中维护中心能够对各系统设备进行有效的维护管理;从而通过本发明提供的技术方案实现了提高系统设备的可维护性的目的。


图1是多设备集中维护系统示意图;图2是本发明的多设备集中维护系统示意图;图3是本发明的告警关联关系树示意图一;图4是本发明的告警关联关系树引擎处理流程图;图5是本发明的逻辑关联关系树示意图二。
具体实施例方式
本发明的多设备集中维护方法和系统的核心均在于告警采集系统将各系统设备的告警传输至集中维护中心,集中维护中心根据预定告警筛选条件对其接收的告警进行筛选,并根据筛选后得到的告警对各系统设备进行维护。
下面基于本发明的核心思想对本发明提供的技术方案做进一步的描述。
由系统设备的告警会存在反复上报、告警级别存在差异、告警之间存在引发告警等等现象,所以,本发明需要对多设备集中维护系统中集中维护中心接收的告警进行筛选,使筛选后的告警能够分层次、分类别的呈现出来。本发明的集中维护中心对告警的筛选过程可以包括两层,即物理关联分析处理和逻辑关联分析处理。通过物理关联分析处理,使集中维护中心能够过滤掉一些冗余的告警信息,通过逻辑关联分析处理,使集中维护中心能够快速准确的确定出主告警和从告警,从而能够快速准确的进行故障定位,使集中维护中心能够对各系统设备进行有效的维护管理。
下面结合附图1对本发明提供的多设备集中维护系统和方法进行说明。
图1中,告警采集系统采集各系统设备的告警,并将其传输至集中维护中心,集中维护中心可以将告警采集系统传输来的告警以告警序列的形式实时显示出来。
传输到集中维护中心的告警序列需要首先经过物理关联分析处理,物理关联分析处理的功能由告警管理单元实现。告警的物理关联的特点是告警的关联关系不依赖于网络模型,且不需要了解各种告警之间的相互依赖关系,只对告警的参数、属性、类别进行分析,从而使集中维护中心能够提供不同的告警观测纬度,有效把握各系统设备的运行情况。
物理关联分析的方法主要包括告警压缩分析,告警过滤分析,告警抑制分析,告警计数分析,告警概括分析,告警细化分析和告警时间关联分析,即告警管理单元的功能主要由告警压缩分析模块、忽略告警分析模块,置换告警分析模块和告警概括分析模块来实现,其中,忽略告警分析模块主要包括告警过滤分析子模块、告警抑制分析子模块、时间关联分析子模块,置换告警分析模块主要包括告警计数分析子模块和告警细化分析子模块。
各物理关联分析方法和模块、子模块的功能如表1所示。
表1

从表1可以看出,集中维护中心通过物理关联分析有效减少了告警的冗余信息,且能够将告警进行分类统计,使告警信息能够清晰、有条理的展现在集中维护中心。
集中维护中心需要对物理关联分析处理后的告警信息继续进行逻辑关联分析,告警的逻辑关联分析能够在物理关联分析的基础上进行深入的告警关联分析,获得各告警中的根告警即主告警,从而确定系统设备的故障根源。
逻辑关联分析方法可以通过生成告警关联关系树的方式来实现。集中维护中心可以根据告警初始关联分析信息和告警特殊关联分析信息生成告警关联关系树。
集中维护中心可以根据不同告警之间的基于时间相关性和参数相关性的逻辑关联关系来设置告警初始关联分析信息,初始关联分析信息存储于初始逻辑关联关系存储模块中。
初始逻辑关联关系和下面介绍的特殊逻辑关联关系可统称为图1中的专家知识库。
专家知识库中的告警初始关联分析信息主要包括告警标识、关联告警标识、告警时间关联上限、告警时间关联下限、相互关联告警的参数对应关系和特殊关联分析指示信息,为便于故障的排除,专家知识库中的告警初始关联分析信息还可以包括告警产生原因、恢复建议、告警产生的影响等信息。
告警标识代表的告警和关联告警标识代表的告警在告警的产生时间满足告警时间关联上限和告警时间关联下限、且这两个告警的参数同时满足参数对应关系时,即可以确定这两个告警为相互关联的告警。
特殊关联分析指示信息用于指示告警标识代表的告警还可以存在与其有进一步深层次关联的告警。
相互关联告警的参数对应关系可以为两个相互关联告警的参数之间存在的相等关系,也可以为两个相互关联告警的参数之间存在的计算关系。
表2是一个具体的专家知识库中的初始关联分析信息的例子。
表2


表2中,告警1分别与告警2、告警3、告警5存在逻辑关联关系,以告警1和告警2之间的逻辑关联关系为例对不同告警之间的逻辑关联关系进行说明。告警1和告警2分别包括4个参数,且告警1的参数1与告警2的参数1相等、告警1的参数2与告警2的参数2相等、告警1的参数3与告警2的参数3相等、告警1的参数4与告警2的参数4相等。告警1与告警2的时间关联上限、时间关联下限均为1,即告警1和告警2的产生时间应相同。
表2中告警1的参数1与告警3的参数1存在计算关系,计算关系为公式F1。
逻辑关联分析模块1可根据专家知识库中的初始关联分析信息通过告警关联关系树分析引擎将经过物理关联分析后的告警生成至少一个告警关联关系树。初始关联分析信息和告警关联关系树分析引擎在集中维护中心中相对独立。本发明根据初始关联分析信息生成的告警关联关系树可以为只有一个根节点的树,即该告警没有与其有逻辑关系的告警,该告警没有引发其它告警,此时,这个根节点可以称为独立节点。
在不同告警之间的关联关系中,有些告警之间的逻辑关系很复杂,不能简单地通过告警时间和告警参数的逻辑关联分析出来,这部分逻辑关系很复杂的告警如网元外部接口设备引发的告警,网元内部通讯单元引发的告警,不同传输介质的信号关系等,具体分类如下外部接口分析如MSC的局向信令链路相关性分析,局向电路相关性分析;设备管理上下级管理层次故障关系分析;话路系统告警关联分析包括光路和话路的转换关系等;内部通信系统告警关联分析;业务逻辑关联分析。
对这部分告警进行逻辑关联分析时,除了需要采用基于时间关联性和参数关联性的初始关联分析信息,还需要包括统筹学的方法,其参数关联性分析也复杂得多,要把两种告警的多个属性进行交叉分析,如对某个MSC局向,该局向的电路/链路/中继群/中继设备都是这个局向的属性,都要进行关联分析。
为进一步发现不同告警之间的进一步的逻辑关联关系,集中维护中心还可以根据不同告警之间的基于数据挖掘的逻辑关联关系来设置告警的特殊关联分析信息。特殊关联分析信息存储于特殊逻辑关联关系存储模块中。初始关联分析信息和特殊关联分析信息是专家知识库中的重要组成部分。特殊关联分析信息主要包括告警标识、关联告警标识、关联表数、系统配置表名称、输入参数、输入字段、输出参数、输出字段等。
特殊关联分析是基于专家知识库中定义的公式和算法,通过对系统配置库中告警参数的关系分析判断其关联关系的。关联表数表示对告警进行特殊关联分析时,需要查询的系统配置表数。输入字段和输出字段一般为算法公式,输入参数表示其对应的告警参数,如输入参数为N,则表示其对应告警的第N个参数。输出参数表示其对应的告警参数,如输出参数为M,则表示其对应告警的第M个参数。输入参数需要代入输入字段并在系统配置表名称对应的表中查询,输出字段需要代入输出字段,当输入字段查询结果获得的记录与输出字段符合一定的算法时,则表示两个告警标识对应的告警有特殊告警关联关系。如果输出字段缺省,则表示当输入字段查询结果获得的记录与输出参数M相同时,两个告警标识对应的告警有特殊告警关联关系。如果输出字段中只有字段名称,则表示当输入字段查询结果获得的记录中的输出字段字段名称的内容与输出参数M相同时,两个告警标识对应的告警有特殊告警关联关系。输入参数可以有一个或多个,输出参数也可以有一个或多个。
专家知识表中可以定义多次查表的复杂逻辑关系。当关联表数大于1时,表示需要进行多次查表。
表3是一个具体的专家知识库中的特殊关联分析信息的例子。下面以表3为例对利用特殊关联分析信息进行特殊告警关联分析的过程进行描述。
表3

表3中,每条记录代表一对需要判断特殊关联关系的告警,如表中第1条记录,就是判断告警ID为471的告警与告警ID为302的告警是否具有关联关系,具体判断特殊关联关系的过程为由于输入参数1为1,所以,需要将471告警的第1个参数P1作为输入IModuleNo=P1条件查询数据表SpmBoardModule,获得的匹配记录中iLogicalBoardNo的值如果等于302告警的第5个参数P5,则302告警是471告警的子节点,也就是说,471告警和302告警有特殊关联关系。
逻辑关联分析模块1和逻辑关联分析模块2一起根据专家知识库中的初始关联分析信息、特殊关联分析信息通过告警关联关系树分析引擎将经过物理关联分析后的告警生成至少一个告警关联关系树。特殊关联分析信息和告警关联关系树分析引擎在集中维护中心中相对独立。本发明根据初始关联分析信息、特殊关联分析信息生成的告警关联关系树可以为只有一个根节点的树,即该告警没有与其有逻辑关系的告警,该告警没有引发其它告警,此时,这个根节点可以称为独立节点。
附图3是通过逻辑关联分析得到的告警关联关系树的具体例子。
图3中,告警2是根告警,与告警2逻辑关联的告警为告警21和告警22,即告警2引发告警21和告警22。与告警21逻辑关联的告警为告警211和告警212,即告警21引发告警211和告警212。
逻辑关联分析模块1和逻辑关联分析模块2可以将生成的告警关联关系树传输至集中维护单元,或者直接将根告警传输至集中维护单元,使集中维护单元能够迅速、准确根据根告警或告警关联关系树判断出故障所在,以便对故障进行迅速排除。
由于有些关联告警节点可能在系统中不存在告警标识,即不存在告警ID,如同一局向的电路或链路异常,或同一号码的紧急呼叫等,在建立告警关联关系树时可能会引起麻烦、或者导致无法建立关系树,因此,本发明引入了虚拟节点的概念,以便使逻辑关联分析模块1和逻辑关联分析模块2能够通过告警关联关系树分析引擎根据专家知识库生成告警关联关系树。
虚拟节点由虚拟告警构成,虚拟告警是由正常告警衍生而来的,具有虚拟告警标识信息如虚拟告警ID,虚拟告警ID在正常的告警ID范围之外,以便区分。虚拟告警由正常告警分析获得,如某个局向中继E1故障等告警。
上述告警关联关系树也可以表述为如下形式虚拟根结点(0层)|---告警1(1层)||--------可能引起告警2(2层)|| |--------时间相关性描述|| |--------参数相关性描述|| |--------其他描述||--------可能引起告警3(2层)|| |--------时间相关性描述|| |--------参数相关性描述|| |--------其他描述|---告警2(1层)|---告警3(1层)
其中,0层虚拟根节点是指用户根据自己的经验或专家知识库自定义的告警。1层为所有告警ID按顺序排列,2层为1层的告警可能引起的告警ID,3层为相互关联的告警的参数描述、时间描述和其他相关描述,3层的内容为相互关联告警的判断条件,独立告警分布在1层的没有子节点的结点。
从上述描述可以看出,本发明的专家知识库可以分为两部分,一部分为初始关联分析信息,一部分为特殊关联分析信息,这两部分是专家知识库的核心。专家知识库中的信息是由系统专家经过对系统告警的严格分析验证制定的,是告警的逻辑关联分析的重要依据。告警初始关联信息定义了两个不同告警之间的在告警时间、告警参数等上面的关联关系。特殊关联分析信息是在两个告警之间的参数关系复杂,不能通过简单的算法表达,而需要系统的配置数据库支持时使用的,是一种通过数据挖掘方法建立的信息,通过特殊关联分析信息对系统配置库的参数的表间关系进行分析,可以得到两个告警之间是否有告警引发关系。
通过根据专家知识库对各系统设备产生的告警进行逻辑关联关系分析,将各告警加入告警关联关系树中分级显示,即可将各系统设备的告警组建为一个或多个告警关联关系树,每一个告警关联关系树的根告警即为主告警,与该根告警有逻辑关联关系的告警应该为该根告警下面的分支告警或叶子告警,集中维护中心可以不对叶子节点告警进行任何处理,仅对根告警进行处理,只需要恢复了根节点上的根源告警,叶子节点告警自然会恢复,从而使集中维护中心能够迅速、准确的找到故障所在,同时提供有效的恢复建议,以便排除故障,恢复设备运行。
专家知识库可以实时修改、更新,可以根据不同的系统定制不同的专家知识库。
下面结合附图4对本发明根据专家知识库通过告警关联关系树分析引擎生成告警关联关系树的流程进行描述。
图4中,在步骤400,需要将告警序列An中的n个告警告警A1至告警An生成告警关联关系树。设置i的初始值为0,k的初始值为0。k表示告警关联关系树的分支节点的个数。
到步骤410,判断i是否小于n,如果不小于,到步骤411,生成告警关联关系树的过程结束,输出生成的告警关联关系树。
在步骤410,如果i小于n,到步骤420,从告警序列An中取一条没有进行过告警关联关系树处理的告警。
到步骤430,根据专家知识库从告警序列An中选取可能与该告警有逻辑关联关系的告警,根据这些可以有逻辑关联关系的告警建立关联告警系列Bm,该序列中包括m个告警,即告警B1至告警Bm,设置j的初始值为0。
到步骤440,判断m的取值是否为0,即判断关联告警序列中是否有关联告警,如果m为0,到步骤441,将从An中选取的告警作为独立节点,到步骤442,i的取值增加1。到步骤410。
在步骤440,如果m的取值不为0,到步骤450,判断j是否小于m,即判断关联告警序列中的关联告警是否都已经处理完成了,如果j不小于m,表示关联告警序列中的关联告警都已经处理完成了,到步骤451,判断k的取值是否为0,即判断告警关联关系树是否存在分支节点,如果k的取值为0,表示告警关联关系树不存在分支节点,到步骤441,将从An中选取的告警作为独立节点,到步骤442,i的取值增加1。到步骤410。
在步骤451,如果k的取值不为0,表示告警关联关系树存在分支节点,不需要创建独立节点,到步骤442,i的取值增加1。到步骤410。
在步骤450,如果j的取值小于m,到步骤460,从关联告警序列中取一条没有处理过的关联告警。
到步骤470、480,根据专家知识库分别判断两个告警的告警参数、告警时间是否满足相关关联的条件,如果都满足,则可以直接到步骤490,判断i的取值是否为0,如果i的取值为0,表示还没有创建根节点,到步骤491,将从An告警序列中选取的告警设置为根节点,将从Bm中选取的告警设置为分支节点,k的取值增加1。到步骤493,j的取值增加1。到步骤450。
在步骤490,如果i的取值不为0,表示已经创建了逻辑关联关系树的根节点,到步骤492,将Bm序列中选取的告警设置为分支节点,k的取值增加1。到步骤493,j的取值增加1。到步骤450。
在步骤470、480,如果两个告警的告警参数、告警时间都满足相关关联的条件,也可以到步骤481,判断专家知识库中的An序列中选取的告警对应的初始关联分析信息中是否设置了特殊关联分析指示信息,如果没有设置特殊关联分析指示信息,到步骤493,j的取值增加1。到步骤450。
在步骤481,如果设置了特殊关联分析指示信息,到步骤482,根据专家知识库中的特殊关联分析信息对从An和Bm中选取的两个告警进行特殊关联分析,如果确定存在特殊关联分析时,到步骤490;如果确定不存在特殊关联分析时,到步骤493,j的取值增加1。到步骤450。
根据上述流程可以将告警序列An中的告警组建为一个或多个告警关联关系树。下面以一个具体的告警序列为例、结合表2对本发明建立的告警关联关系树进行说明。
设定传输至集中维护中心的告警序列为{告警1,告警2,告警3,告警4,告警5}。
集中维护中心从告警序列中选取告警1,根据表1确定告警序列中的告警2、告警3和告警5可能会与告警1存在逻辑关联关系。
集中维护中心根据表1中的参数、告警时间上限、告警时间下限、告警1、告警2、告警3、告警5的参数、告警时间确定告警2、告警3、告警5与告警1存在逻辑关联关系时,将告警2、告警3、告警5作为告警1的叶子节点,由于表1中告警1与告警4不存在逻辑关联关系,所以告警4为独立节点,即告警4为一个仅有根节点的逻辑关联关系树。告警1、告警2、告警3、告警4、告警5生成的两个逻辑关系树如附图5所示。
虽然通过实施例描绘了本发明,本领域普通技术人员知道,本发明有许多变形和变化而不脱离本发明的精神,本发明的申请文件的权利要求包括这些变形和变化。
权利要求
1.一种多设备集中维护方法,包括a、告警采集系统将各系统设备的告警均传输至集中维护中心;b、集中维护中心根据预定告警筛选条件对其接收的告警进行筛选;c、集中维护中心根据筛选后得到的告警对系统设备进行维护。
2.如权利要求1所述的一种多设备集中维护方法,其特征在于,所述预定筛选条件包括根据不同告警之间的基于时间相关性和参数相关性的逻辑关联关系设置的告警初始关联分析信息,且所述步骤b具体包括b1、集中维护中心根据告警初始关联分析信息将其接收的告警组建为至少一个告警关联关系树。
3.如权利要求2所述的一种多设备集中维护方法,其特征在于,所述告警初始关联分析信息包括告警标识、关联告警标识、告警时间关联上限、告警时间关联下限、相互关联告警的参数对应关系。
4.如权利要求3所述的一种多设备集中维护方法,其特征在于,所述告警初始关联分析信息还包括告警产生原因、恢复建议、告警产生的影响中的一个或多个。
5.如权利要求1所述的一种多设备集中维护方法,其特征在于,所述预定筛选条件包括根据不同告警之间的基于数据挖掘的逻辑关联关系设置的告警特殊关联分析信息,且所述步骤b包括b2、集中维护中心根据告警特殊关联分析信息将其接收的告警组建为至少一个告警关联关系树。
6.如权利要求1至5中任一权利要求所述的一种多设备集中维护方法,其特征在于,当所述预定筛选条件包括告警初始关联分析信息和告警特殊关联分析信息时,告警初始关联分析信息还包括特殊关联分析指示信息,且所述步骤b具体包括b3、集中维护中心根据告警初始关联分析信息中的特殊关系分析指示信息利用告警初始关联分析信息和告警特殊关联分析信息将其接收的告警组建为至少一个告警关联关系树。
7.如权利要求1所述的一种多设备集中维护方法,其特征在于,所述预定告警筛选条件包括重复告警压缩条件、忽略告警条件、告警置换条件、告警概括条件中的一个或多个,且所述步骤b包括b4、集中维护中心根据重复告警压缩条件将其在预定时间间隔内多次接收到的相同告警作为一次告警;和/或b5、集中维护中心根据忽略告警条件选取告警;和/或b6、集中维护中心将其接收的满足告警置换条件的告警置换为预定告警;和/或b7、集中维护中心根据告警概括条件将其接收的告警概括为至少一个告警类型。
8.如权利要求7所述的一种多设备集中维护方法,其特征在于所述忽略告警条件包括过滤条件、抑制条件和时间窗提取条件,且所述步骤b5具体包括集中维护中心从其接收的告警中选取满足过滤条件的告警;集中维护中心根据抑制条件对其接收的、在预定的上下文中的告警进行抑制;集中维护中心根据时间窗提取条件提取其在预定时间窗内接收的告警;所述告警置换条件包括升级置换条件、子类置换条件,且所述步骤b6具体包括集中维护中心根据升级置换条件确定其在预定时间间隔内接收到的相同告警的次数,并在所述次数达到预定次数时,将所述各相同告警置换为一条高级别的告警;集中维护中心将其接收的、满足子类置换条件的告警置换为子类告警。
9.一种多设备集中维护系统,包括多个系统设备、告警采集系统和集中维护中心,告警采集系统将系统设备的告警传输至集中维护中心,其特征在于,所述集中维护中心还设置有告警管理单元根据预定告警筛选条件对集中维护中心接收的告警进行筛选,并将筛选后得到的告警传输至集中维护单元;集中维护单元根据其接收的告警对系统设备进行维护。
10.如权利要求9所述的一种多设备集中维护系统,其特征在于,所述告警管理单元包括初始逻辑关联关系存储模块根据不同告警之间的基于时间相关性和参数相关性的逻辑关联关系设置的告警初始关联分析信息,并存储;逻辑关联分析模块1根据初始逻辑关联关系存储模块中存储的告警初始关联分析信息将集中维护中心接收的告警组建为至少一个告警关联关系树,并将其传输至集中维护单元。
11.如权利要求9所述的一种多设备集中维护系统,其特征在于,所述告警管理单元包括特殊逻辑关联关系存储模块根据不同告警之间的基于数据挖掘的逻辑关联关系设置的告警特殊关联分析信息,并存储;逻辑关联分析模块2根据特殊逻辑关联关系存储模块中存储的告警初始关联分析信息将集中维护中心接收的告警组建为至少一个告警关联关系树,并将其传输至集中维护单元。
12.如权利要求9或10或11所述的一种多设备集中维护系统,其特征在于,所述告警管理单元包括告警压缩分析模块、忽略告警分析模块,置换告警分析模块和告警概括分析模块中的一个或多个;告警压缩分析模块根据重复告警压缩条件将集中维护中心在预定时间间隔内多次接收到的相同告警作为一次告警传输至集中维护单元,并将所述相同告警的接收次数传输至集中维护单元;忽略告警分析模块根据忽略告警条件选取告警,并将选取的告警传输至集中维护单元;置换告警分析模块根据告警置换条件将集中维护中心接收的满足置换条件的告警置换为预定告警,并将预定告警传输至集中维护单元;告警概括分析模块根据告警概括条件将集中维护中心接收的告警概括为至少一个告警类型,并将告警类型信息传输至集中维护单元。
13.如权利要求12所述的一种多设备集中维护系统,其特征在于所述忽略告警分析模块包括告警过滤分析子模块将集中维护中心接收的满足过滤条件的告警传输至集中维护单元;告警抑制分析子模块对集中维护中心接收的满足抑制条件的告警进行抑制,并将不满足抑制条件的告警传输至集中维护单元;时间关联分析子模块将集中维护中心接收到的、在预定时间窗内的告警传输至集中维护单元;所述置换告警分析模块包括告警计数分析子模块根据升级置换条件确定其在预定时间间隔内接收到的相同告警的次数,并在所述次数达到预定次数时,将所述各相同告警置换为一条高级别的告警,并所述高级别的告警传输至集中维护单元;告警细化分析子模块将集中维护中心接收的、满足子类置换条件的告警置换为子类告警,并将子类告警传输至集中维护单元。
全文摘要
本发明提供一种多设备集中维护方法和系统,其核心均在于告警采集系统将各系统设备的告警均传输至集中维护中心,集中维护中心根据预定告警筛选条件对其接收的告警进行筛选,集中维护中心根据筛选后得到的告警对系统设备进行维护。本发明通过设置预定告警筛选条件,使集中维护中心能够快速的确定出有价值的告警;预定告警筛选条件可以分为多个层次,如物理关联关系信息、初始关联分析信息和告警特殊关联分析信息等,本发明避免了不必要的冗余的告警信息,使集中维护中心能够快速确定出告警的根源,快速准确的进行故障定位,从而使集中维护中心能够对各系统设备进行有效的维护管理,实现了提高系统设备的可维护性的目的。
文档编号H04L12/28GK101047556SQ200610083830
公开日2007年10月3日 申请日期2006年6月1日 优先权日2006年6月1日
发明者高小宏, 卢惠莉, 钟文堂 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1