一种故障定位方法及其系统的制作方法

文档序号:7717583阅读:304来源:国知局
专利名称:一种故障定位方法及其系统的制作方法
技术领域
本发明涉及通信领域的故障定位技术,尤其涉及一种故障定位方法及其系统。
背景技术
随着网络规模的不断扩大,使得网络的维护和操作变得相当复杂,如何保证网络 安全、稳定和可靠地运行,一直是网络维护领域的热门课题。由于网络固有的复杂性、不确 定性,通常情况下无法获得所有与网络故障相关的信息,如何尽快定位故障仍然是一个棘 手的问题。现有的网络故障定位技术主要采用人工方式实现。在进行网络故障定位的时候, 需要故障解决者人为地根据经验和相关的知识来根据故障现场来推测故障原因,并且通过 不停的测试来验证推测的正确性以及定位的故障原因。该种方式存在如下缺陷人工判断存在着低效、不可靠和效率低,从而导致网络问题解决时间较长,在很大 程度上降低了网络服务质量。另外,人工进行故障判断和故障原因定位对解决者人为的依 赖性太大,很多时候故障准确定位和快速解决的时间依赖于解决人技术水平和工作经验, 而且目前靠人工来进行故障定位和解决还不能实现知识共享,在故障定位、解决中长期积 累的知识不能很好的传承,使得对技术专家的依赖越来越大,这样会造成技术的垄断和断 层,不利于人才培养和知识传递。

发明内容
本发明实施例提供了一种故障定位方法及其系统,用以解决现有故障定位技术效 率低的问题。本发明实施例提供的技术方案包括一种故障定位方法,包括如下步骤化简故障集和症状集的关联关系矩阵;当监控到网络或设备发生故障症状时,根据化简后的故障集与症状集的关联关系 矩阵,确定与监控到的故障症状具有关联关系的故障。一种故障定位系统,包括矩阵化简模块,用于化简故障集和症状集的关联关系矩阵;故障定位模块,用于当监控到网络或设备发生故障症状时,根据所述矩阵化简模 块化简后的故障集与症状集的关联关系矩阵,确定与监控到的故障症状具有关联关系的故障。本发明的上述实施例,通过对故障集和症状集的关联关系进行化简,以得到相对 简化的关联关系矩阵,并使用化简后的关联关系矩阵进行故障定位,一方面,由于采用故障 集和症状集的关联关系矩阵进行故障定位,与现有技术相比提高了故障定位效率;另一方 面,由于采用的是化简后的故障集和症状集的关联关系矩阵进行故障定位,因此可以进一 步提高故障定位的效率。


图1为本发明实施例提供的故障定位流程的矩阵化简阶段流程示意图;图2为本发明实施例提供的故障定位流程的故障定位阶段流程示意图;图3为本发明实施例提供的故障定位系统结构示意图。
具体实施例方式本发明实施例提供的故障定位方法,包括两个阶段对故障集和症状集的关联关 系矩阵的化简阶段,以及利用化简后的矩阵对监控到的故障进行定位的阶段。其中,矩阵化 简阶段相对独立,在每次更新故障集(如增加或删除元素)、更新症状集(如增加或删除元 素),或更新故障与症状的关联关系时,可以及时对更新后的故障集和症状集的关联关系矩 阵进行化简,以便在网络或设备运行时,可利用更新后的矩阵进行故障定位。参见图1,为本发明实施例提供的故障定位流程的矩阵化简阶段流程示意图,包括 如下步骤步骤101、将故障集F和症状集E按照逻辑关系进行矩阵排列,排列后形成二维 矩阵,矩阵的行对应故障集、列对应症状集,矩阵中的元素值表示症状和对应故障的关联关 系,可用两个不同的参数值表示关联关系的有与无。故障集F = {f0, fl,. . .,fm-1}和症 状集E = {e0, el,..., en-1}所形成的矩阵FE [m,η]可如表1所示,其中,若故障和症状有 关联关系,则在矩阵中该故障和症状的对应位置上(表1中该故障和症状的交叉位置的表 格中)填1,没有关联关系则填0。表1、故障集和症状集矩阵
权利要求
1.一种故障定位方法,其特征在于,包括如下步骤 化简故障集和症状集的关联关系矩阵;当监控到网络或设备发生故障症状时,根据化简后的故障集与症状集的关联关系矩 阵,确定与监控到的故障症状具有关联关系的故障。
2.如权利要求1所述的方法,其特征在于,还包括当故障集或症状集,或者故障集和症状集的关联关系发生变化时,根据变化后的故障 集和症状集,或者变化后的故障集和症状集的关联关系,化简故障集和症状集的关联关系 矩阵,并用该次化简得到的关联关系矩阵更新以前的关联关系矩阵;当更新故障集和症状集的关联关系矩阵后,若监控到网络或设备发生故障症状,则根 据更新后的关联关系矩阵,确定与监控到的故障症状具有关联关系的故障。
3.如权利要求1或2所述的方法,其特征在于,所述关联关系矩阵的行对应故障集、列 对应症状集,矩阵元素用第一参数和第二参数对应表示关联关系的有与无;化简故障集和症状集的关联关系矩阵,包括将故障集和症状集的关联关系矩阵的每一列列向量,分别与其他列向量进行逻辑与运 算,以及分别与其他列向量中所有组合形式的多个列向量进行逻辑与运算;若逻辑与运算得到的结果向量中仅包含一个值为1的元素,则根据该结果向量确定出 对应的故障以及与该故障具有关联关系的症状,其中,所述故障为该结果向量中值为1的 元素所在的行对应的故障,所述症状为参与本次逻辑与运算的所有列向量对应的症状; 根据确定出的故障以及与该故障具有关联关系的症状,确定化简后的关联关系矩阵。
4.如权利要求3所述的方法,其特征在于,在进行列向量逻辑与运算之前,还包括 根据所述关联关系矩阵中仅包含一个值为1的元素的列向量,确定出对应的故障以及与该故障具有关联关系的症状,其中,所述故障为该列向量中值为1的元素所在的行对应 的故障,所述症状为该列向量对应的症状;将该确定出的故障以及与该故障具有关联关系的症状,包括在化简后的关联关系矩阵中。
5.如权利要求3所述的方法,其特征在于,如果确定出的故障以及与该故障具有关联 关系的症状中,针对同一故障对应有多组症状,则选取其中症状数量最少的一组症状作为 与该故障具有关联关系的症状。
6.如权利要求1所述的方法,其特征在于,确定出与监控到的症状具有关联关系的故 障之后,还包括对确定出的故障进行诊断,若诊断结果为该故障已消除或故障程度低于设定阈值,则 从确定出的故障所形成的故障集中将该故障删除。
7.如权利要求1所述的方法,其特征在于,确定出与监控到的症状具有关联关系的故 障之后,还包括对于确定出的所有故障,计算其中每个故障针对监控到的症状所形成的症状集的发生 概率,其中,每个故障针对该症状集的发生概率为该故障针对该症状集中的每个症状的发 生概率之和;按照发生概率从高到低的顺序对故障进行诊断,并当诊断结果为当前被诊断的故障 确实发生时,从确定出的故障所形成的故障集中删除除该当前被诊断的故障以外的其他故障。
8.如权利要求7所述的方法,其特征在于,确定出与监控到的故障症状具有关联关系 的故障之后,还包括将所述故障针对所述症状的发生概率更新为J 1 Cei + n + \其中,。表示所述故障,e,表示所述症状;Cf j表示ei发生的初始次数,Cei表示确定 出。的初始次数;η表示在本次确定出与ei具有关联关系的。之前,e,被监控到并且确定 出与。具有关联关系的次数。
9.如权利要求1所述的方法,其特征在于,确定出与监控到的故障症状具有关联关系 的故障之后,还包括确定监控到的每个症状的故障严重程度;按照故障严重程度从高到低的顺序对故障进行诊断,并当诊断结果为当前被诊断的故 障确实发生时,从确定出的故障所形成的故障集中删除除该当前被诊断的故障以外的其他故障。
10.如权利要求1所述的方法,其特征在于,监控网络或设备发生的故障症状,具体为 通过监控到的信令、设备告警、性能指标、自动拨测数据之一或任意组合,确定出网络或设备发生的故障症状。
11.一种故障定位系统,其特征在于,包括矩阵化简模块,用于化简故障集和症状集的关联关系矩阵;故障定位模块,用于当监控到网络或设备发生故障症状时,根据所述矩阵化简模块化 简后的故障集与症状集的关联关系矩阵,确定与监控到的故障症状具有关联关系的故障。
12.如权利要求11所述的系统,其特征在于,所述矩阵化简模块还用于,当故障集或症 状集,或者故障集和症状集的关联关系发生变化时,根据变化后的故障集和症状集,或者变 化后的故障集和症状集的关联关系,化简故障集和症状集的关联关系矩阵,并用该次化简 得到的关联关系矩阵更新以前的关联关系矩阵;所述故障定位模块还用于,当所述矩阵化简模块更新故障集和症状集的关联关系矩阵 后,若监控到网络或设备发生故障症状,则根据更新后的关联关系矩阵,确定与监控到的故 障症状具有关联关系的故障。
13.如权利要求11或12所述的系统,其特征在于,所述关联关系矩阵的行对应故障集、 列对应症状集,矩阵元素用第一参数和第二参数对应表示关联关系的有与无;所述化简模块化简故障集和症状集的关联关系矩阵的过程,包括 将故障集和症状集的关联关系矩阵的每一列列向量,分别与其他列向量进行逻辑与运 算,以及分别与其他列向量中所有组合形式的多个列向量进行逻辑与运算;若逻辑与运算得到的结果向量中仅包含一个值为1的元素,则根据该结果向量确定出 对应的故障以及与该故障具有关联关系的症状,其中,所述故障为该结果向量中值为1的 元素所在的行对应的故障,所述症状为参与本次逻辑与运算的所有列向量对应的症状; 根据确定出的故障以及与该故障具有关联关系的症状,确定化简后的关联关系矩阵。
14.如权利要求13所述的系统,其特征在于,所述矩阵化简模块进一步用于,在进行列向量逻辑与运算之前,根据所述关联关系矩阵中仅包含一个值为1的元素的列向量,确定 出对应的故障以及与该故障具有关联关系的症状,其中,所述故障为该列向量中值为1的 元素所在的行对应的故障,所述症状为该列向量对应的症状;将该确定出的故障以及与该 故障具有关联关系的症状,包括在化简后的关联关系矩阵中。
15.如权利要求13所述的系统,其特征在于,所述化简模块进一步用于,如果确定出的 故障以及与该故障具有关联关系的症状中,针对同一故障对应有多组症状,则选取其中症 状数量最少的一组症状作为与该故障具有关联关系的症状。
16.如权利要求11所述的系统,其特征在于,还包括故障诊断模块,用于在所述故障定位模块确定出与监控到的症状具有关联关系的故障 之后,对于确定出的所有故障,计算其中每个故障针对监控到的症状所形成的症状集的发 生概率,其中,每个故障针对该症状集的发生概率为该故障针对该症状集中的每个症状的 发生概率之和;以及,按照发生概率从高到低的顺序对故障进行诊断,并当诊断结果为当前 被诊断的故障确实发生时,从确定出的故障所形成的故障集中删除除该当前被诊断的故障 以外的其他故障。
17.如权利要求16所述的系统,其特征在于,还包括概率更新模块,用于在所述故障定位模块确定出与监控到的故障症状具有关联关系的 故障之后,将所述故障针对所述症状的发生概率更新为
18.如权利要求11所述的系统,其特征在于,还包括故障监控模块,用于通过监控到的信令、设备告警、性能指标、自动拨测数据之一或任 意组合,确定出网络或设备发生的故障症状。
全文摘要
本发明公开了一种故障定位方法及其系统,该方法包括化简故障集和症状集的关联关系矩阵;当监控到网络或设备发生故障症状时,根据化简后的故障集与症状集的关联关系矩阵,确定与监控到的故障症状具有关联关系的故障。该系统包括矩阵化简模块,用于化简故障集和症状集的关联关系矩阵;故障定位模块,用于当监控到网络或设备发生故障症状时,根据所述矩阵化简模块化简后的故障集与症状集的关联关系矩阵,确定与监控到的故障症状具有关联关系的故障。采用本发明可提高故障定位效率。
文档编号H04W24/04GK102055604SQ200910210098
公开日2011年5月11日 申请日期2009年11月5日 优先权日2009年11月5日
发明者刘松森, 王强, 陈刚 申请人:中国移动通信集团山东有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1