基于贝叶斯网络的核心网故障诊断方法及系统的制作方法

文档序号:7758323阅读:186来源:国知局
专利名称:基于贝叶斯网络的核心网故障诊断方法及系统的制作方法
技术领域
本发明涉及通信网络技术,尤其涉及基于贝叶斯网络的核心网故障诊断方法及系 统。
背景技术
随着网络规模的不断增大,相应地,网络中的告警数量也会不断增多。核心网故障 可能发生在终端接入设备层、网络传输层、核心控制层以及综合业务层等,这些故障会引发 一系列告警,故障是产生告警的原因,告警是当检测到错误或异常状态时产生的特定类型 的通知,并不是所有告警都表明故障原因,所以需要对网络中发生的告警事件进行关联分 析,诊断产生故障的原因。核心网发生故障时,告警之间的关联,以及告警和故障之间的关 系是隐性的、不确定的。面对核心网中产生的大量告警信息,网络管理员往往很难从中找 出故障的真正原因,从而快速实施故障修复和障碍排除,因此,对于故障管理来讲,其难点 就在于故障诊断和定位。为了更好地解决故障诊断定位问题,需要对所接收的告警信息进 行分析和处理,以便能更好地完成故障管理的任务。故障诊断是网络管理系统的一个重要 组成部分,故障诊断的智能化是故障管理追求的目标,也是保证复杂、高速的核心网高可靠 性、高适应性的必然要求。因此,如何从海量的告警数据中发现核心网中的相关告警信息,帮助网络管理人 员诊断网络故障,是当前网络故障管理所面临的主要问题。

发明内容
本发明所要解决的技术问题是解决网络故障诊断系统快速诊断和定位核心网告 警的问题。为了解决上述技术问题,本发明所采用的技术方案是提供一种基于贝叶斯网络的 核心网故障诊断方法,包括以下步骤从核心网的故障受理中心采集包含有告警信息和故障类型的原始数据,将所述原 始数据分别映射为与告警信息和故障类型相对应的正整数集合从而生成样本数据,将样本 数据转换为包含故障类型分类结果的多维正整数数组存储到后备训练数据集中进行积累, 当后备训练数据集中的样本数据达到设定的阈值后放入训练数据集中;运用贝叶斯网络算法对训练数据集中的样本数据进行计算,获得故障类型与各组 告警信息之间的关联,构建告警信息相对于故障类型按照一定概率关联的图形,该图形经 过多次迭代达到最优从而获得贝叶斯网络分类器;从核心网的网络管理系统采集含有告警信息的原始数据,并预处理生成待诊断数 据,将待诊断数据作为贝叶斯网络分类器定位故障类型的输入,经贝叶斯网络分类器计算 获得告警信息对应的故障类型。在上述方法,在构建贝叶斯网络分类器之前对训练数据集中的样本数据进行数据 优化。
在上述方法中,如果环境发生变化对训练数据集中的样本数据进行数据优化。在上述方法中,所述数据优化包括以下步骤将训练数据集中的样本数据个数P划分为N等份,N >= 2,然后从后备训练数据 集的样本数据集合Q中按顺序选择最新的P/N条信息,再由贝叶斯网络分类器通过N+1迭 交叉运算计算出每一等份的贡献度,再用Q集合中选出的等份数据替换P集合中贡献度最 低的等份数据,所述N+1迭交叉运算是指,将N+1等份数据编号,然后依次选择一等份数据作为被 验证数据,其余N等份数据作为训练数据构建贝叶斯网络分类器,用分类器对被验证的等 份数据做分类,再跟实际的分类结果比较,如果分类精度越低,表明被验证这组数据和其它 N组数据关联度越低,被验证的这组数据对构建分类器的贡献度越低。在上述方法中,训练数据集的大小为每类故障50-100条。本发明还提供了一种基于贝叶斯网络的核心网故障诊断系统,包括数据处理中心 和贝叶斯网络分类器,所述数据处理中心包括数据采集模块、数据预处理模块和训练数据 集,所述数据采集模块从网络管理系统采集含有告警信息的原始数据,这些原始数据经过 数据预处理模块处理后生成待诊断数据;从故障受理中心采集包含有告警信息和故障类型 的原始数据,它们经过数据预处理模块处理后生成样本数据,所述样本数据经贝叶斯网络 算法计算,获得故障类型与各组告警信息之间的关联,构建告警信息相对于故障类型按照 一定概率关联的图形,该图形经过多次迭代达到最优从而获得贝叶斯网络分类器;所述待 诊断数据作为贝叶斯网络分类器定位故障的输入,经贝叶斯网络分类器计算获得告警信息 对应的故障类型。在上这系统中,所述数据处理中心还包括数据优化模块,所述数据优化模块对训 练数据集中的样本数据进行数据优化。本发明,利用贝叶斯网络分类器构建故障诊断系统,实现了对错综复杂的核心网 故障进行智能化的系统诊断功能,提高了诊断的准确性和灵活性,并且该系统构建于网络 管理系统之上,易于实施,对核心网综合信息处理具有广泛的适应性。


图1是本发明提供的基于贝叶斯网络的核心网故障诊断系统的结构框图;图2是数据处理中心结构框图;图3是本发明提供的基于贝叶斯网络的核心网故障诊断方法中贝叶斯网络分类 器的构建流程图;图4是贝叶斯网络分类器的应用流程图;图5是简化后的告警信息和故障类型之间的概率关系有向无环图。
具体实施例方式故障诊断是数据挖掘中典型的分类问题,即通过采集告警信息来定位故障类型, 由于告警信息受多种因素的影响,具有不确定性,要弄清楚复杂因素之间的关系以及对结 果的影响是非常困难的,但是,受复杂因素影响的不确定数据一般是服从正态分布的,因 此,基于这种原理,本发明提出了一种基于贝叶斯网络的核心网故障诊断方法及系统,通过一定量的样本数据积累,构建训练数据集,再通过贝叶斯网络算法来构建贝叶斯网络分类 器,从而预测将来发生的告警信息所反映的故障类别。下面结合附图对本发明作出详细的说明。如图1、图2所示,本发明提供的基于贝叶斯网络的核心网故障诊断系统600是运 行在网络管理系统500之上的应用程序,该故障诊断系统600包括数据处理中心610和贝 叶斯网络分类器620两个组成部分。网络管理系统500属于现有技术,通过运行支撑网200、 综合业务系统400、核心控制系统300实现对接入设备群100的管理。数据处理中心610主要由数据采集模块611、数据预处理模块612、数据优化模块 616和训练数据集617四部分组成。数据采集模块611采集两方面的原始数据,一是从网络管理系统500采集含有告 警信息的原始数据,这些原始数据经过数据预处理模块612处理后生成待诊断数据614;二 是从故障受理中心700采集包含有告警信息和故障类型的原始数据,它们经过数据预处理 模块612处理后生成样本数据613。告警信息可以抽象为一组离散的数据,数据预处理模 块612将所有的告警信息都映射为正整型数据并作为输入数据存储到多维数组中,将故障 类型也映射为正整型数据并作为输出存储到一维数组中。贝叶斯网络分类器620由贝叶斯网络算法模块621、分类器622和故障诊断报表模 块623组成。样本数据613存储到训练数据集617中作为基准数据供分类器622学习,经 贝叶斯网络算法模块621的计算,获得故障类型与各组告警信息之间的关联,构建告警信 息相对于故障类型按照一定概率关联的图形,该图形经过多次迭代达到最优从而获得贝叶 斯网络分类器620,待诊断数据614作为分类器622定位故障的输入,经贝叶斯网络分类器 620计算获得告警信息对应的故障类型。为了清楚表述贝叶斯网络分类器620的建立过程,特选7组典型样本数据加以举 例说明,当然7组数据量在实际应用中是肯定不够的,这里仅为示例性的说明。核心网告警定义Al. SIP注册失败告警,数据预处理后,产生为1/未产生为0A2.呼叫中断告警,数据预处理后,产生为1/未产生为0A3.自动计费异常告警,数据预处理后,产生为1/未产生为0A4.网管配置代理失败告警,数据预处理后,产生为1/未产生为0A5.计费进程中断告警,数据预处理后,产生为1/未产生为0A6.数据审计完成通知,数据预处理后,产生为1/未产生为0A7. SIP链路中断告警,数据预处理后,产生为1/未产生为0核心网故障定义El. SIP网关进程DOWN,数据预处理后映射为1E2. AGENT主进程DOWN,数据预处理后映射为2E3.网关插槽物理异常,数据预处理后映射为3E4.网关内部逻辑异常,数据预处理后映射为4E5. M3UA异常,数据预处理后映射为5以A2呼叫中断告警为例,告警信息与故障类型之间的关系如表1所示表1
对表1说明如下如第1组数据,当同时发生AlSIP注册失败告警、A2呼叫中断告警时,认为是因为 ElSIP网关进程DOWN故障。告警信息和故障类型之间是7维数组和1维数组的映射关系, 但映射关系并非固定的,或者说用户自己也不确定哪些告警产生就一定是何故障,比如说 第1组和第6组数据既是如此,但当前发生的系列告警和某种故障之间又存在关联,这些隐 藏的关联可以通过贝叶斯网络621算法来发现并构建分类器622。贝叶斯网络分类器620是通过贝叶斯网络算法进行构建的,最终生成诊断报告。 在构建分类器622之前,数据优化模块616从后备训练数据集615中选择样本数据613,完 成训练数据集617的初始化;在构建分类器622之后,当分类准备度不高或者下降时,数据 优化616模块结合贝叶斯网络621算法计算各样本数据613的贡献度来优化训练数据集 617,从而达到优化分类器622的目的。贝叶斯网络分类器620是基于训练数据集617建立起来的,它是分类器622自学 习的知识库,也就是说,训练数据集617直接关系到分类器622的准确度。训练数据集617 大小以每类故障50-100条为最佳,太小会影响到分类器622的分类精度;太大会影响到能 分类器622的性能;训练数据集617在应用中不断地更新,当出现新告警或者新故障类型 时,都需要即时更新训练数据集617。贝叶斯网络算法基于统计中的贝叶斯定理,通过后验概率来预测各种分类的概率 大小,概率最大的就是最可能的预测结果,依此类推。 贝叶斯网络算法采用联合概率分布发掘各变量之间的关联度;
贝叶斯网络算法通过对训练数据集合做循环推理,构建起贝叶斯网络,这个网络 是由各个变量之间的关联度连接起来的。一组变量Ix1, χ2,χ3,…,χη},贝叶斯网络算法可 计算出Xl、X2发生时Χ3、…、Xn发生的概率,或者是Χ3、Χ4同时发生时出现1的概率是多少等。贝叶斯网络模型构建的关键在于两点⑴、构建各变量之间的概率关系图;⑵、 计算各变量之间概率大小。下面结合表1、表2和图5来具体解释。图5是简化后的告警和 故障之间的概率关系的有向无环图,如图5中Al和A3之间是条件独立的,所以它们之间没 有依赖关系,Α1、Α3是Α2的双亲节点,Al和A3告警同时产生时,出现Α2的概率是0. 95,只 产生A3告警时,出现Α2的概率是0.2,依次可以推出最终各种故障发生的概率各是多少,如 表2所示。 分类器622对告警信息做出分类,给出发生每类故障的概率,概率大小作为定位 故障的依据;对于多个故障同时发生情况,告警信息隐含了这些故障原因,分类器622能够 对多个故障做出区分,并分别给出发生的概率。分类器622具有自学习能力和很强的适应 性,当环境发生改变,影响到定位故障准确率时,可以通过数据优化616模块,优化分类器 622以适应新的环境。分类器622提取少数几组大概率的故障诊断结果,并按照概率大小生 成故障诊断报表623,报告给故障受理中心700。本发明提供的基于贝叶斯网络的核心网故障诊断方法,包括以下步骤Α10、构建贝叶斯网络分类器620。结合图1、图2和图3所示,故障受理中心700将告警信息和故障类型提交给故障 诊断系统600,数据采集模块611采集上述告警信息和故障类型,由于告警信息和故障类型 都是离散数据,数据预处理模块612将这些告警信息和故障类型分别映射为正整数集合并 生成样本数据613,该样本数据613转换为包含故障类型分类结果的多维正整数数组存储 到后备训练数据集615中。最初,训练数据集617是空的,分类器622还未构建。当后备训 练数据集615中的样本数据613达到设定的阈值后,阈值设定为20ΧΝ,Ν为故障类别数目, 数据优化模块616从后备训练数据集615中挑选样本数据613到训练数据集617中,条件 是每类故障样本数据613不少于20条可设置条且故障类别个数超过5种可设置种类,不满 足条件的返回到后备训练数据集615中继续积累。运用贝叶斯网络621算法在训练数据集617上做运算,计算各组合变量之间的关 联,构建这些变量按照一定概率关联起来的图形,这个图形经过多次迭代达到最优,即得到 了分类器622模型。
7
Al,A3Al,-A3-Al,A3 Al 广A3
0.950.70.20.10.050.30.80.9
表2
A20、应用贝叶斯网络分类器620。再结合图4所示,分类器622模型构建起来后,即可对告警信息做分析、诊断故障, 步骤如下B10、网络管理系统500监测到上报的告警信息后,通知数据采集611模块采集告 警数据并送到数据预处理模块612中,生成待诊断数据614,该待诊断数据614为多维数组 格式;B20、将多维数组输入到分类器622模型中,得到一维数组输出,数组大小和故障 类别个数一致。一维数组中按顺序存储了设定故障类型发生的概率,然后按照概率大小,生 成故障诊断报表623,提交给故障受理中心700 ;B30、故障受理中心将报表生成工单,下发给工程人员,工程人员现场排除故障。故 障排除后,工程人员将信息反馈到故障受理中心700 ;B40、如果故障定位有误,故障受理中心(700)将处理结果和最初诊断记录一并提 交给故障诊断系统600,数据优化616模块将修正的信息转存到后备训练数据集615中;A30、贝叶斯网络分类器620的优化。再参见图3,分类器622模型建立后,并不代表着以后可以适应一切,它还需要不 断地优化达到当前阶段的最优。初始化时,为了尽快创建分类器622模型,设定的条件一般 都不苛刻,也可以理解为此时创建的分类器622模型并未达到最优,需要在随后的应用中 累积样本数据量,然后再做模型优化。不仅样本数据613量不足可能影响分类器622模型, 如果环境发生变化,以前的样本数据613也并不能够反映新的情况,所以还需要累积新环 境下的样本数据613,并做模型优化。优化步骤数据优化616模块将数据训练集617中数据个数P划分为N等份(N > =2),然后从后备训练数据集615的数据集合Q中按顺序选择最新的P/N条信息,再由贝叶 斯网络分类器620通过N+1迭交叉运算(P/N个数据为一等份,原来P集合中的N等份+Q 集合中选出的一等份,即为N+1等份数据,对N+1等份数据做交叉运算,即为N+1迭交叉运 算),计算出每一等份的贡献度,再用Q集合中选出的等份数据替换P集合中贡献度最低的 等份数据,运行该方法还可对Q集合中次新信息做运算,这样就可以保证P集合中始终是贡 献度高的数据。N+1迭交叉运算是指,将N+1等份数据编号,然后依次选择一等份数据作为被验证 数据,其余N等份数据作为训练数据构建贝叶斯网络分类模型,然后用分类模型对被验证 的等份数据做分类,再跟实际的分类结果比较,即可得到分类精度,如果分类精度越低,表 明被验证这组数据和其它N组数据关联度越低,反向也说明被验证的这组对构建分类模型 贡献度越低。值得注意的是,数据优化616可能会消耗大量的系统资源,一般是在系统负荷较 小的时间段进行。本发明比常规故障诊断工具有着明显的优势(1)、智能化贝叶斯网络分类器的理论基础是数理统计中的贝叶斯定理,具备循 环推理能力,也就是自学习能力;贝叶斯网络分类器能够从样本数据中推理各告警之间的 关联,以及这些告警和故障之间的概率关系,也就是说它可以从以往的经验数据中学习知 识,构建模型,预测未来,充分体现了智能化。
(2)、系统性贝叶斯网络分类器是基于数据挖掘的专家系统,建立在网络管理系 统之上,可对整个核心网的告警信息做综合分析,体现出全局性和系统性;(3)、准确率高核心网告警信息具有较强的特定性,即特定的一些告警组合暗含 着特定的故障信息,贝叶斯网络分类器处理这些告警信息时,准确率很高,通过以往经验, 可以达到95%以上;(4)、适应性强贝叶斯网络分类器可以通过优化训练数据集,不断地自学习来适 应变化中的核心网环境。本发明不局限于上述最佳实施方式,任何人应该得知在本发明的启示下作出的结 构变化,凡是与本发明具有相同或相近的技术方案,均落入本发明的保护范围之内。
权利要求
基于贝叶斯网络的核心网故障诊断方法,其特征在于包括以下步骤从核心网的故障受理中心采集包含有告警信息和故障类型的原始数据,将所述原始数据分别映射为与告警信息和故障类型相对应的正整数集合从而生成样本数据,将样本数据转换为包含故障类型分类结果的多维正整数数组存储到后备训练数据集中进行积累,当后备训练数据集中的样本数据达到设定的阈值后放入训练数据集中;运用贝叶斯网络算法对训练数据集中的样本数据进行计算,获得故障类型与各组告警信息之间的关联,构建告警信息相对于故障类型按照一定概率关联的图形,该图形经过多次迭代达到最优从而获得贝叶斯网络分类器;从核心网的网络管理系统采集含有告警信息的原始数据,并预处理生成待诊断数据,将待诊断数据作为贝叶斯网络分类器定位故障类型的输入,经贝叶斯网络分类器计算获得告警信息对应的故障类型。
2.如权利要求1所述的基于贝叶斯网络的核心网故障诊断方法,其特征在于在构建贝 叶斯网络分类器之前对训练数据集中的样本数据进行数据优化。
3.如权利要求1所述的基于贝叶斯网络的核心网故障诊断方法,其特征在于,如果环 境发生变化对训练数据集中的样本数据进行数据优化。
4.如权利要求2或3所述的基于贝叶斯网络的核心网故障诊断方法,其特征在于所述 数据优化包括以下步骤将训练数据集中的样本数据个数P划分为N等份,N> = 2,然后从后备训练数据集的 样本数据集合Q中按顺序选择最新的P/N条信息,再由贝叶斯网络分类器通过N+1迭交叉 运算计算出每一等份的贡献度,再用Q集合中选出的等份数据替换P集合中贡献度最低的 等份数据,所述N+1迭交叉运算是指,将N+1等份数据编号,然后依次选择一等份数据作为被验证 数据,其余N等份数据作为训练数据构建贝叶斯网络分类器,用分类器对被验证的等份数 据做分类,再跟实际的分类结果比较,如果分类精度越低,表明被验证这组数据和其它N组 数据关联度越低,被验证的这组数据对构建分类器的贡献度越低。
5.如权利要求1所述的基于贝叶斯网络的核心网故障诊断方法,其特征在于,训练数 据集的大小为每类故障50-100条。
6.基于贝叶斯网络的核心网故障诊断系统,包括数据处理中心和贝叶斯网络分类器, 其特征在于所述数据处理中心包括数据采集模块、数据预处理模块和训练数据集,所述数据采集 模块从网络管理系统采集含有告警信息的原始数据,这些原始数据经过数据预处理模块处 理后生成待诊断数据;从故障受理中心采集包含有告警信息和故障类型的原始数据,它们 经过数据预处理模块处理后生成样本数据,所述样本数据经贝叶斯网络算法计算,获得故 障类型与各组告警信息之间的关联,构建告警信息相对于故障类型按照一定概率关联的图 形,该图形经过多次迭代达到最优从而获得贝叶斯网络分类器;所述待诊断数据作为贝叶 斯网络分类器定位故障的输入,经贝叶斯网络分类器计算获得告警信息对应的故障类型。
7.如权利要求6所述的基于贝叶斯网络的核心网故障诊断系统,其特征在于所述数据 处理中心还包括数据优化模块,所述数据优化模块对训练数据集中的样本数据进行数据优 化。
全文摘要
本发明公开了一种基于贝叶斯网络的核心网故障诊断方法及系统,该方法从核心网的故障受理中心采集包含有告警信息和故障类型的原始数据并生成样本数据,之后存储到后备训练数据集中进行积累,达到设定的阈值后放入训练数据集中;运用贝叶斯网络算法对训练数据集中的样本数据进行计算,构造贝叶斯网络分类器;从核心网的网络管理系统采集含有告警信息的原始数据,经贝叶斯网络分类器计算获得告警信息对应的故障类型。本发明,利用贝叶斯网络分类器构建故障诊断系统,实现了对错综复杂的核心网故障进行智能化的系统诊断功能,提高了诊断的准确性和灵活性,并且该系统构建于网络管理系统之上,易于实施,对核心网综合信息处理具有广泛的适应性。
文档编号H04L12/24GK101917297SQ20101026547
公开日2010年12月15日 申请日期2010年8月30日 优先权日2010年8月30日
发明者张玮, 郑学智 申请人:烽火通信科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1