一种基于qoe的故障定位方法和系统的制作方法

文档序号:7762674阅读:630来源:国知局
专利名称:一种基于qoe的故障定位方法和系统的制作方法
技术领域
本发明涉及通信领域,具体涉及一种基于用户体验OiOE)的故障定位方法和系统。
背景技术
电信运营系统在故障定位方面一般分前台和后台,前台是客服系统,根据用户投诉生成工单再转到维护部门以定位问题。维护部门通常根据故障现象手工排除故障,有些电信设备商也提供简单的故障定位功能,根据用户故障的时间和用户ID来查询与用户地址、账号相关的故障信息或错误码等,以协助排查,但最终都需要人工定位故障,产生浪费时间、操作繁杂等问题;并且,需要维护人员有较强的定位故障经验,否则故障定位效率会很低,明显降低了用户满意度。

发明内容
有鉴于此,本发明的主要目的在于提供一种基于QOE的故障定位方法和系统,实现基于QOE的故障定位自动化,提高故障定位效率和用户满意度。为达到上述目的,本发明的技术方案是这样实现的一种基于QOE的故障定位方法,该方法包括建立面向业务的规则库,并据此建立面向业务的决策树;收集决策树在故障定位中用到的用户关键信息;根据用户关键信息找到QOE对应的决策树,触发决策树上节点的检查过程并生成诊断结果。所述规则库由规则组成,建立所述规则库的过程为针对特定业务以规则的方式建立解决故障的细节;其中,每个规则就是针对一个故障解决单步骤的定位过程;所述规则分简单规则和复杂规则;规则的外部数据输入方式至少包括系统内关键性能指标KPI或KPI组合;规则的输出方式包括正常、异常、无判断;其中,所述无判断指本规则跟随的子节点不需要根据本规则节点的输出匹配。建立所述决策树的过程为针对特定业务的用户Q0E,针对QOE建立对应的故障定位决策树;所述决策树是典型的N叉树结构,决策树的叶子节点即为所述规则;所述决策树的叶子节点的组成逻辑和实际定位QOE故障的逻辑相同。该方法进一步包括收集全网终端上报的服务记录,并从中获取终端基本的性能信息和服务拓扑路径,以供故障定位使用。所述用户关键信息包括以下内容至少之一故障时间、用户ID、服务内容、服务路径、故障QOE类型。一种基于QOE的故障定位系统,该系统包括决策树维护单元、用户关键信息收集单元、故障定位单元;其中,所述决策树维护单元,用于建立面向业务的规则库,并据此建立面向业务的决策树;所述用户关键信息收集单元,用于收集决策树在故障定位中用到的用户关键信息,并将收集到的用户关键信息通知给故障定位单元;所述故障定位单元,用于根据用户关键信息找到QOE对应的决策树,触发决策树上节点的检查过程并生成诊断结果。所述规则库由规则组成,所述决策树维护单元在建立所述规则库时,用于针对特定业务以规则的方式建立解决故障的细节;其中,每个规则就是针对一个故障解决单步骤的定位过程;所述规则分简单规则和复杂规则;规则的外部数据输入方式至少包括系统内关键性能指标KPI或KPI组合;规则的输出方式包括正常、异常、无判断;其中,所述无判断指本规则跟随的子节点不需要根据本规则节点的输出匹配。所述决策树维护单元在建立所述决策树时,用于针对特定业务的用户Q0E,针对 QOE建立对应的故障定位决策树;所述决策树是典型的N叉树结构,决策树的叶子节点即为所述规则;所述决策树的叶子节点的组成逻辑和实际定位QOE故障的逻辑相同。所述用户关键信息收集单元,进一步用于收集全网终端上报的服务记录,并从中获取终端基本的性能信息和服务拓扑路径,以供故障定位使用。所述用户关键信息包括以下内容至少之一故障时间、用户ID、服务内容、服务路径、故障QOE类型。本发明方法和系统,实现了基于用户体验的故障定位自动化,提高了故障定位效率和用户满意度。


图1为故障定位在服务质量管理体系中的位置;图2为点播故障决策树的结构示意图;图3为规则节点输出类型示意图;图4为本发明实施例的基于QOE的故障定位流程简图;图5为本发明实施例的基于QOE的故障定位系统图。
具体实施例方式随着电信 ICT(Information and Communication Technology,信息及通讯技术) 进程的不断推进,电信的组网变的非常复杂,端到端的故障定位往往涉及众多网元和设备、 链路等,因而定位过程比较复杂,定位手段相对缺乏。端到端故障定位在服务质量管理体系中的位置见图一。考虑到传统故障定位的不足,基于知识可维护、可积累等思想的新一代专家故障定位系统应运而生。专家系统故障定位功能不但提供系统端到端的自动故障定位解决方
5案,还能从用户经验积累的角度出发,提供专家系统功能,以便将日常维护的经验积累起来,满足复杂系统故障的定位需求。专家系统是人工智能的一个分支,专家系统的概念是通过积累专家知识,通过推理机推导出专家级的结论。在故障定位系统中,定位问题的手段可以理解为专家知识,但现实中定位手段不但多而且复杂,需要把最有效果的知识作为专家知识录入;这样才能组成有效果的专家系统,同时专家系统支持知识的可积累。并且,专家系统通过决策树的方式保存用户定位故障的知识,定位故障过程中可以展示决策树,进而直观反映故障定位的过程, 方便用户查看定位细节。在专家系统中,根据用户投诉应用QOE作为故障定位的起点,把故障类型和QOE挂钩,而以往的故障定位都没有关注QOE的指标。这样,对用户而言,专家系统解决的不仅仅是设备的故障,而是针对用户的QOE进行诊断和反馈,提高用户的满意度。基于上述思路,提出由设备厂商提供后台的基本定位手段,在故障定位服务器中尽可能收集到有用的相关数据,特别是终端的数据,然后通过制定规则来实现故障点的排查,最终通过规则组成决策树的方式,来实现对故障现象或QOE故障的排查方法集。同时本系统支持手工维护规则和决策树,可以修改检查内容和检查点的前后顺序,方面维护人员的维护。这样,通过本系统自动定位故障不但大大节约了时间,同时把定位故障的知识录入到系统中,也大大减少了对人工经验的依赖。为了实现专家故障定位系统,主要需要执行以下几个部分的操作1.在终端放置代理软件;该代理软件负责产生终端的服务内容。在能够上报服务路径时需要上报对应服务产生的设备路径,比如iptv业务等;在不能上报路径时,在故障定位服务器上可以通过静态配置的方式获取终端对应的归属位置,从而获取服务产生的设备路径。2.收集并分析终端上报的业务数据;收集全网终端上报的服务记录,并从中获取终端基本的性能信息和服务拓扑路径供故障定位使用。3.建立面向业务的规则库;针对特定业务以规则的方式建立解决故障的细节,每个规则就是针对一个故障解决单步骤的定位过程,每个规则也可以理解为专家系统的知识点,系统启动时可以将规则录入到专家系统中。通常,规则存放在数据库中,规则分简单规则和复杂规则。其中,简单规则可以体现为标准的数学比较公式,逻辑如下{外部数据比较符号判断门限输出结果};上述数学比较公式中,外部数据为外部输入的数据,判断门限为预先配置的门限值。在实际应用时,可以结合比较符号对外部数据和判断门限进行比较,最后输出比较结果,输出的比较结果可能为正常或异常。每个规则的外部数据输入方式有两种,一种是系统内关键性能指标(KPI)或KPI 组合;另一种是人工手工输入。规则的输出方式有三种,分为正常、异常、无判断。其中,无判断指本规则跟随的子节点不需要根据本规则节点的输出匹配。通常,简单规则建立在界面上操作,需要配置公式的输入和输出,以及比较符、规
6则名称、检查目的描述等。复杂规则是相对简单规则而言的。由于逻辑仅靠一维的比较公式无法实现,因此需要编写java代码来实现。复杂规则同样遵守简单规则的规范,实现输出的定义,并能够在java代码系统启动时动态加载。4.建立面向业务的决策树;针对特定业务的用户Q0E,在决策树管理中针对每种QOE建立对应的故障定位决策树。决策树可以是典型的N叉树结构,决策树的叶子节点即为规则。实际应用时,可以通过选择已经建立的规则来组成树,节点的输出可以控制定位方向,其中一个节点的示意图可以表示如图3所示。决策树叶子节点的组成逻辑和实际定位该QOE故障的逻辑相同,建立完决策树后就可以调用这颗树来对故障进行定位。5.收集全网设备有用的性能数据根据所建立的决策树,收集决策树在故障定位过程中要用到的设备数据,如果特定设备没有输出,可以根据终端的性能数据通过拓扑推导得出。6.定位过程当用户投诉故障时,可以获取用户关键信息(如故障时间、用户ID、服务内容、月艮务路径、故障QOE类型等)并输入到专家系统中。其中,服务路径是指从产生该服务的端到端设备清单,由上报的数据或静态配置来提供。接下来,可以找到QOE对应的决策树,触发决策树上每个节点的检查过程。其中, 节点的检查顺序可以按决策树在建立时组织的顺序来进行,并且应该和故障实际解决过程一致。当某个节点在系统中不能自动获取到数据时,可以请求用户手工输入;并且,决策树诊断流程结束后,客户端可以通过决策树展示诊断过程并保存诊断结果。根据上述技术方案的说明,以IPTV业务为例,可以将具体的实施方式细化成如下几个步骤1、通过内置到STB (机顶盒)中的代理模块,能够接受故障定位服务器下发的控制命令,结合上报周期和上报协议方式,上报STB用户服务记录和网络质量KPI ;2、故障定位服务器和全网的STB通过IP网络建链;3、故障定位服务器收到STB的握手消息后下发上报周期和上报协议命令;4、收到故障定位服务器下发的命令后,STB中的代理模块周期上报数据到故障定位服务器指定的IP地址;5、故障定位服务器收集全网的STB所产生的用户服务信息;6、建立IPTV业务点播节目不顺畅故障的规则;7、建立QOE为点播节目不顺畅的故障定位决策树。具体而言,可以利用步骤6所建立的规则建立决策树;8、具体定位过程,具体效果见图2。图2中,首先录入IPTV领域检查故障的规则方法,每个规则对应一个检查手段,规则内容包括定义外部数据来源(KPI或人工输入等方式)、正常门限值、比较符号等,以及规则输出类型(正常、异常、无判断)。如果是复杂规则,只要定义输出即可。
接下来,根据IPTV业务领域的故障类型,针对每个QOE故障类型建立决策树,决策树内容由录入的规则组成,树节点的判断顺序可以根据实际应用场景制定。选择IPTV业务,QOE故障类型选择点播频道不顺畅的决策树,并进行如下判断过程首先会根据当前用户的播放记录确定⑶N(媒体服务器)地址,然后发送出口检测命令到对应⑶N上以判断是否是⑶N出口故障。⑶N设备通过自检后返回没有故障,接下来可以应用STB(机顶盒)数据判断网络质量KPI (丢包、时延、抖动等)是否正常。当判断网络指标有异常时,会触发承载网检查流程,通过STB分布和承载网组网信息判断DSLAM、BAS等节点是否有故障。最终判断是BAS设备故障,通过决策树直观地展示给用户全部定位过程。将诊断结果保存到数据库中。当新故障出现时,可以灵活建立、编辑故障决策树,以应对不断变化的故障解决过程。结合以上技术描述可知,本发明基于QOE的故障定位技术包含如图4所示的操作思路。参见图4,图4为本发明实施例的基于QOE的故障定位流程简图,该流程包括以下步骤步骤410 建立面向业务的规则库,并据此建立面向业务的决策树。步骤420 收集决策树在故障定位中用到的用户关键信息。步骤430 根据用户关键信息找到QOE对应的决策树,触发决策树上节点的检查过程并生成诊断结果。为了保证上述技术描述能够顺利实现,可以进行如图5所示的设置。参见图5,图 5为本发明实施例的基于QOE的故障定位系统图,该系统包括相连的决策树维护单元、用户关键信息收集单元、故障定位单元,这些操作单元组成了专家故障定位系统的主要部分,并且可以设置于故障定位服务器中。在实际应用时,决策树维护单元可以建立面向业务的规则库,并据此建立面向业务的决策树;用户关键信息收集单元可以收集决策树在故障定位中用到的用户关键信息, 并将收集到的用户关键信息通知给故障定位单元;故障定位单元可以根据用户关键信息找到QOE对应的决策树,触发决策树上节点的检查过程并生成诊断结果。另外,决策树维护单元在建立规则库时,用于针对特定业务以规则的方式建立解决故障的细节;所述规则最终组成了规则库。决策树维护单元在建立所述决策树时,用于针对特定业务的用户Q0E,针对QOE建立对应的故障定位决策树。并且,用户关键信息收集单元,能够进一步收集全网终端上报的服务记录,并从中获取终端基本的性能信息和服务拓扑路径,以供故障定位使用。所述用户关键信息包括以下内容至少之一故障时间、用户ID、服务内容、服务路径、故障QOE类型等。综上所述可见,无论是方法还是系统,本发明基于QOE的故障定位技术具有如下有益效果全网端到端的故障定位自动化完成,满足复杂系统故障的定位需求;
故障定位手段可维护,规则和决策树提供维护功能,这样定位故障的知识就保存在系统中,实现了知识可传递;端到端定位过程能够直观显示细节;故障定位以用户的QOE为中心,故障分类清楚;不仅解决了设备故障,对用户而言,以QOE为中心,从用户经验积累的角度出发,让用户能把日常维护的经验积累起来,极大的方便了维护人员对网络的维护和对用户投诉的处理,用户的满意度得到了明显提高;对电信服务质量管理水平的保持具有广泛的适用性和实用价值。以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
权利要求
1.一种基于用户体验QOE的故障定位方法,其特征在于,该方法包括 建立面向业务的规则库,并据此建立面向业务的决策树;收集决策树在故障定位中用到的用户关键信息;根据用户关键信息找到QOE对应的决策树,触发决策树上节点的检查过程并生成诊断结果。
2.根据权利要求1所述的方法,其特征在于,所述规则库由规则组成,建立所述规则库的过程为针对特定业务以规则的方式建立解决故障的细节;其中,每个规则就是针对一个故障解决单步骤的定位过程; 所述规则分简单规则和复杂规则;规则的外部数据输入方式至少包括系统内关键性能指标KPI或KPI组合; 规则的输出方式包括正常、异常、无判断;其中,所述无判断指本规则跟随的子节点不需要根据本规则节点的输出匹配。
3.根据权利要求1所述的方法,其特征在于,建立所述决策树的过程为针对特定业务的用户Q0E,针对QOE建立对应的故障定位决策树;所述决策树是典型的N叉树结构,决策树的叶子节点即为所述规则; 所述决策树的叶子节点的组成逻辑和实际定位QOE故障的逻辑相同。
4.根据权利要求1至3任一项所述的方法,其特征在于,该方法进一步包括收集全网终端上报的服务记录,并从中获取终端基本的性能信息和服务拓扑路径,以供故障定位使用。
5.根据权利要求1至3任一项所述的方法,其特征在于,所述用户关键信息包括以下内容至少之一故障时间、用户ID、服务内容、服务路径、故障QOE类型。
6.一种基于QOE的故障定位系统,其特征在于,该系统包括决策树维护单元、用户关键信息收集单元、故障定位单元;其中,所述决策树维护单元,用于建立面向业务的规则库,并据此建立面向业务的决策树; 所述用户关键信息收集单元,用于收集决策树在故障定位中用到的用户关键信息,并将收集到的用户关键信息通知给故障定位单元;所述故障定位单元,用于根据用户关键信息找到QOE对应的决策树,触发决策树上节点的检查过程并生成诊断结果。
7.根据权利要求6所述的系统,其特征在于,所述规则库由规则组成,所述决策树维护单元在建立所述规则库时,用于针对特定业务以规则的方式建立解决故障的细节;其中,每个规则就是针对一个故障解决单步骤的定位过程;所述规则分简单规则和复杂规则;规则的外部数据输入方式至少包括系统内关键性能指标KPI或KPI组合; 规则的输出方式包括正常、异常、无判断;其中,所述无判断指本规则跟随的子节点不需要根据本规则节点的输出匹配。
8.根据权利要求6所述的系统,其特征在于,所述决策树维护单元在建立所述决策树时,用于针对特定业务的用户Q0E,针对QOE 建立对应的故障定位决策树;所述决策树是典型的N叉树结构,决策树的叶子节点即为所述规则; 所述决策树的叶子节点的组成逻辑和实际定位QOE故障的逻辑相同。
9.根据权利要求6至8任一项所述的系统,其特征在于,所述用户关键信息收集单元, 进一步用于收集全网终端上报的服务记录,并从中获取终端基本的性能信息和服务拓扑路径,以供故障定位使用。
10.根据权利要求6至8任一项所述的系统,其特征在于,所述用户关键信息包括以下内容至少之一故障时间、用户ID、服务内容、服务路径、故障QOE类型。
全文摘要
本发明公开了一种基于用户体验的故障定位方法和系统,均可建立面向业务的规则库,并据此建立面向业务的决策树;收集决策树在故障定位中用到的用户关键信息;根据用户关键信息找到用户体验对应的决策树,触发决策树上节点的检查过程并生成诊断结果。本发明方法和系统,实现了基于用户体验的故障定位自动化,提高了故障定位效率和用户满意度。
文档编号H04L12/24GK102457390SQ20101051379
公开日2012年5月16日 申请日期2010年10月15日 优先权日2010年10月15日
发明者韩殿罡 申请人:中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1