异常处理方法、自动巡检控制台和知识库系统的制作方法

文档序号:7979680阅读:95来源:国知局
异常处理方法、自动巡检控制台和知识库系统的制作方法
【专利摘要】本发明提供了一种异常处理方法、自动巡检控制台和知识库系统,其中,异常处理方法包括:知识库系统接收自动巡检控制台发送的携带巡检结果的触发请求;所述知识库系统根据所述触发请求定位异常原因和提供异常解决方案。采用本发明的技术方案,知识库系统可以根据自动巡检控制台发送的异常巡检结果分级检查,完成定位异常原因和提供异常解决方案,较好地克服了现有巡检不能有效地解决绝大部分异常定位和提供异常解决方案的缺陷。
【专利说明】异常处理方法、自动巡检控制台和知识库系统
【技术领域】
[0001]本发明涉及数据通信领域,尤其涉及一种异常处理方法、自动巡检控制台和知识库系统。
【背景技术】
[0002]当前电信系统模块众多,结构复杂,对稳定性和异常及时处理的要求非常严格,当前通常的做法是通过网管系统和巡检两种方式。
[0003]通过网管系统上报异常的方法,不能全面地定位异常和提供最有效的异常解决方案和异常原因分析,网管系统通过建模的方式,预先定义系统连接关系去检测哪些模块出现异常,不能实现动态地搜索其他模块,一起综合定位异常提高最终的异常解决方法。
[0004]现有的巡检仅仅是提供异常现象的结果显示,或者提供一些简单的异常处理建议,没有综合整个局点的其他模块和实时状况进行全面地分析,不能有效地解决绝大部分异常定位和异常解决方案。

【发明内容】

[0005]本发明实施例提供了一种异常处理方法、自动巡检控制台和知识库系统,以克服现有的巡检不能有效地解决绝大部分异常定位和异常解决方案的缺陷。
[0006]本发明实施例提供了一种异常处理方法,该方法包括:
[0007]自动巡检控制台向被巡检设备下发巡检任务并触发执行对应的巡检任务,接收所述被巡检设备返回的巡检结果;
[0008]所述自动巡检控制台确定巡检到异常,则触发知识库系统完成定位异常原因和提供异常解决方案。
[0009]优选地,所述自动巡检控制台触发知识库系统完成定位异常原因和提供异常解决方案之前,所述方法还包括:
[0010]所述自动巡检控制台加载所述知识库系统。
[0011]本发明实施例还提供了一种异常处理方法,该方法包括:
[0012]知识库系统接收自动巡检控制台发送的携带巡检结果的触发请求;
[0013]所述知识库系统根据所述触发请求定位异常原因和提供异常解决方案。
[0014]优选地,所述知识库系统根据所述触发请求定位异常原因和提供异常解决方案,包括:
[0015]所述知识库系统进行初步检查,根据初步检查结果直接定位异常原因,根据所述异常原因和异常原因与异常解决方案之间的对应关系提供异常解决方案;或者,
[0016]所述知识库系统根据所述初步检查结果未定位出异常原因,则获得与所述初步检查结果对应的故障模块的上下文模块,通知所述自动巡检控制台巡检所述上下文模块,并接收所述自动巡检控制台返回的检查结果,根据所述初步检查结果和所述检查结果联合定位异常原因,根据所述异常原因和所述对应关系提供异常解决方案;或者,[0017]所述知识库系统根据所述初步检查结果和所述检查结果未定位出异常原因,则获得所述故障模块的所有相关模块,并通知所述自动巡检控制台巡检所述所有相关模块及其所在服务器的公共环境项,并接收所述自动巡检控制台返回的检查报告,根据所述初步检查结果、所述检查结果和所述检查报告联合定位异常原因,根据所述异常原因和所述对应关系提供异常解决方案。
[0018]优选地,所述知识库系统根据所述触发请求定位异常原因和提供异常解决方案包括:
[0019]所述知识库系统根据保存的知识库异常解决报告输出模板输出对应不同异常原因的异常解决方案。
[0020]本发明实施例提供了一种自动巡检控制台,该自动巡检控制台包括:
[0021]巡检模块,用于向被巡检设备下发巡检任务并触发执行对应的巡检任务,接收所述被巡检设备返回的巡检结果;
[0022]触发模块,用于确定所述巡检模块巡检到异常,则触发知识库系统完成定位异常原因和提供异常解决方案。
[0023]优选地,该自动巡检控制台还包括:加载模块,用于加载所述知识库系统。
[0024]本发明实施例还提供了一种知识库系统,该系统包括:
[0025]接口模块,用于接收自动巡检控制台发送的携带巡检结果的触发请求;
[0026]知识库控制模块,用于根据所述触发请求触发不同级别的异常处理过程,并向知识库异常分析模块发送处理结果;
[0027]知识库存储模块,用于保存异常原因与异常解决方案之间的对应关系;
[0028]知识库异常分析模块,用于根据所述处理结果和所述对应关系,定位异常原因和提供异常解决方案。
[0029]优选地,所述知识库异常分析模块,具体用于:
[0030]根据所述触发请求进行初步检查,根据初步检查结果直接定位异常原因,根据所述异常原因和异常原因与异常解决方案之间的对应关系提供异常解决方案;或者,
[0031]根据所述初步检查结果未定位出异常原因,则获得与所述初步检查结果对应的故障模块的上下文模块,通知所述自动巡检控制台巡检所述上下文模块,并接收所述自动巡检控制台返回的检查结果,根据所述初步检查结果和所述检查结果联合定位异常原因,根据所述异常原因和所述对应关系提供异常解决方案;或者,
[0032]根据所述初步检查结果和所述检查结果未定位出异常原因,则获得所述故障模块的所有相关模块,并通知所述自动巡检控制台巡检所述所有相关模块及其所在服务器的公共环境项,并接收所述自动巡检控制台返回的检查报告,根据所述初步检查结果、所述检查结果和所述检查报告联合定位异常原因,根据所述异常原因和所述对应关系提供异常解决方案。
[0033]优选地,所述知识库存储模块,还用于存储知识库异常解决报告输出模板;所述知识库异常分析模块,具体用于根据所述知识库异常解决报告输出模板输出对应不同异常原因的异常解决方案。
[0034]采用本发明的技术方案,知识库系统可以根据自动巡检控制台发送的异常巡检结果分级检查,完成定位异常原因和提供异常解决方案,较好地克服了现有巡检不能有效地解决绝大部分异常定位和提供异常解决方案的缺陷。
【专利附图】

【附图说明】
[0035]图1是本发明异常处理方法实施例的流程图;
[0036]图2是本发明自动巡检控制台实施例的结构示意图;
[0037]图3是本发明知识库系统实施例的结构示意图;
[0038]图4是本发明异常处理系统实施例的结构示意图。
【具体实施方式】
[0039]为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
[0040]本发明实施例基于自动巡检的异常结果为依据,设计异常处理知识库系统,快速全面的定位异常,提供异常解决方案。自动巡检控制台集成此异常处理知识库系统,当巡检到异常后启动知识库控制模块,根据现场状况自动定位问题点和提供异常解决方案。本发明实施例的关键点为:分为多种级别动态地识别被检查模块,以及综合所有被检查模块的巡检结果定位异常和提供异常解决方法。
[0041]本发明实施例提供了一种异常处理方法,该实施例从自动巡检控制台角度进行描述,该方法包括:
[0042]步骤11、自动巡检控制台向被巡检设备下发巡检任务并触发执行对应的巡检任务,接收所述被巡检设备返回的巡检结果;
[0043]步骤12、自动巡检控制台确定巡检到异常,则触发知识库系统完成定位异常原因和提供异常解决方案。
[0044]其中,所述自动巡检控制台触发知识库系统完成定位异常原因和提供异常解决方案之前,所述方法还包括:所述自动巡检控制台加载所述知识库系统。
[0045]上述方法中,自动巡检控制台根据巡检到的异常触发知识库系统,由知识库系统完成定位异常原因和提供异常解决方案,较好地克服了现有巡检不能有效地解决绝大部分异常定位和提供异常解决方案的缺陷。
[0046]本发明实施例还提供了一种异常处理方法,该实施例从知识库系统角度进行描述,该方法包括:
[0047]步骤21、知识库系统接收自动巡检控制台发送的携带巡检结果的触发请求;
[0048]步骤22、所述知识库系统根据所述触发请求定位异常原因和提供异常解决方案。
[0049]其中,所述知识库系统根据所述触发请求定位异常原因和提供异常解决方案,包括:
[0050]所述知识库系统进行初步检查,根据初步检查结果直接定位异常原因,根据所述异常原因和异常原因与异常解决方案之间的对应关系提供异常解决方案;或者,所述知识库系统根据所述初步检查结果未定位出异常原因,则获得与所述初步检查结果对应的故障模块的上下文模块,通知所述自动巡检控制台巡检所述上下文模块,并接收所述自动巡检控制台返回的检查结果,根据所述初步检查结果和所述检查结果联合定位异常原因,根据所述异常原因和所述对应关系提供异常解决方案;或者,所述知识库系统根据所述初步检查结果和所述检查结果未定位出异常原因,则获得所述故障模块的所有相关模块,并通知所述自动巡检控制台巡检所述所有相关模块及其所在服务器的公共环境项,并接收所述自动巡检控制台返回的检查报告,根据所述初步检查结果、所述检查结果和所述检查报告联合定位异常原因,根据所述异常原因和所述对应关系提供异常解决方案。
[0051]另外,所述知识库系统根据所述触发请求定位异常原因和提供异常解决方案包括:所述知识库系统根据保存的知识库异常解决报告输出模板输出对应不同异常原因的异常解决方案。
[0052]上述方法中,知识库系统根据自动巡检控制台发送的异常巡检结果分级检查,完成定位异常原因和提供异常解决方案,较好地克服了现有巡检不能有效地解决绝大部分异常定位和提供异常解决方案的缺陷。
[0053]下面从自动巡检控制台和知识库系统交互的角度对本发明实施例进行详细的描述:
[0054]如图1所示,是本发明异常处理方法实施例的流程图,该过程包括:
[0055]步骤101、定义自动巡检控制台与异常处理知识库的控制与消息接口,其中包括:定义知识库系统触发巡检控制台检查具体模块和检查公共信息的消息结构,定义上报知识库检索结果的消息接口,定义巡检控制台启动知识库接口。基于自动巡检控制台加载异常处理知识库,待下一步发现异常后实现异常定位;
[0056]步骤102、自动巡检控制台管理自动巡检任务,触发定时自动巡检。确定每个模块的巡检项,在安装该模块的时候同步完成;
[0057]基于自动巡检控制台管理自动巡检任务,其中增加,修改,删除定时自动巡检任务,以及设置定时器触发每个巡检任务。在安装具体模块时,同时加载对应的巡检包,定义了对应模块的巡检内容和巡检程序;
[0058]步骤103、巡检控制台下发巡检程序到目标机器,控制巡检程序执行,完成对应模块的巡检并上报巡检结果;
[0059]巡检控制台通过文件传输协议(ftp)的形式控制下发巡检程序到目标机器,当定时时间到的时候通过代理(例如:SSh/telnet)下发控制命令触发巡检程序执行,完成对应模块的巡检并上报巡检结果;
[0060]步骤104、如果巡检到异常,启动异常处理知识库开始检查级别I的步骤实现最简单的异常定位,解析对应有异常模块的巡检结果,判断是否能直接可以定位异常和提供异常解决方案,如果能,则直接反馈异常处理结果,如果不能则进入步骤105对应的检查级别2。所有巡检结果都会有特定的关键字和格式来描述是否能直接定位异常和提供解决方案;
[0061]步骤105、检查级别I无法定位问题,则知识库进入检查级别2,通过查看规范的日志和与异常模块建链的信息,动态的得到与异常模块相关的上下文模块。通知巡检控制台触发上下文模块的巡检,综合上下文模块的检查结果定位异常和提供解决方案。如果仍然没有定位到异常,则依次再查找相对与此次确定的上下文模块的上下文模块,循环重复判断。规范的日志信息中会打印出与异常模块通信的所有模块,以及通信链路信息。如果最终没有定位异常,则进入检查级别3 ;[0062]步骤106、检查级别2未定位问题知识库进入检查级别3,启动更进一步的异常检查,依据当前全局的部署信息,知识库控制模块获取所有与异常模块有一定关系的模块(称为:利益相关模块)。然后触发所有利益相关模块的进一步巡检,还包括所有利益相关模块所在服务器的公共环境项检查,依据这些全部的检查结果,知识库异常分析模块定位异常和提供异常解决方案。级别3巡检的范围包括:cpu占用率,内存,1/0,磁盘空间,带宽,以及被检查模块本身的日志,进程和链路,数据库等;
[0063]动态的确定上下文模块与确定全部的利益相关模块,这两种级别的异常定位,实现了快速全面的获得异常处理解决方案和问题原因分析,极大地对现场自动巡检异常问题的后续处理做了补充;
[0064]步骤107、步骤106里说明的知识库异常分析模块,结合模块的检查结果,公共项环境检查结果,以及知识库异常解决报告输出模板,分析定位异常与处理解决方案,以及形成最终的异常分析报告。知识库异常分析模块依据被巡检模块的结果,跟踪问题源,最终定位异常。
[0065]步骤101描述的加载异常处理知识库,定位巡检到的异常原因和提高异常解决方法,在巡检控制台部署的时候,就会加载异常处理知识库系统,并且支持后续的随意丰富知识库和修改异常检索规则;步骤106中描述的利益相关模块的界定包括:有消息交互和建链的模块、同时部署在一个服务器上的模块和有一定的业务逻辑关系的模块。
[0066]综上所述,上述高效、快捷的异常问题解决方法,利用知识库系统,全面迅速地对巡检到的异常问题提供解决方法和异常分析,实现高效的现场异常处理,应用性强。
[0067]相应地,本发明实施例还提供了 一种自动巡检控制台,如图2所示,该自动巡检控制台包括巡检模块201和触发模块202,其中:
[0068]巡检模块,用于向被巡检设备下发巡检任务并触发执行对应的巡检任务,接收所述被巡检设备返回的巡检结果;
[0069]触发模块,用于确定所述巡检模块巡检到异常,则触发知识库系统完成定位异常原因和提供异常解决方案。
[0070]另外,该自动巡检控制台还包括:加载模块203,用于加载所述知识库系统。
[0071]上述自动巡检控制台,根据巡检到的异常触发知识库系统,由知识库系统完成定位异常原因和提供异常解决方案,较好地克服了现有巡检不能有效地解决绝大部分异常定位和提供异常解决方案的缺陷。
[0072]本发明实施例还提供了一种知识库系统,如图3所示,该系统包括接口模块301、知识库控制模块302、知识库存储模块303和知识库异常分析模块304,其中:
[0073]接口模块,用于接收自动巡检控制台发送的携带巡检结果的触发请求;
[0074]知识库控制模块,用于根据所述触发请求触发不同级别的异常处理过程,并向知识库异常分析模块发送处理结果;
[0075]知识库存储模块,用于保存异常原因与异常解决方案之间的对应关系;
[0076]知识库异常分析模块,用于根据所述处理结果和所述对应关系,定位异常原因和提供异常解决方案。
[0077]其中,所述知识库异常分析模块,具体用于:
[0078]根据所述触发请求进行初步检查,根据初步检查结果直接定位异常原因,根据所述异常原因和异常原因与异常解决方案之间的对应关系提供异常解决方案;或者,根据所述初步检查结果未定位出异常原因,则获得与所述初步检查结果对应的故障模块的上下文模块,通知所述自动巡检控制台巡检所述上下文模块,并接收所述自动巡检控制台返回的检查结果,根据所述初步检查结果和所述检查结果联合定位异常原因,根据所述异常原因和所述对应关系提供异常解决方案;或者,根据所述初步检查结果和所述检查结果未定位出异常原因,则获得所述故障模块的所有相关模块,并通知所述自动巡检控制台巡检所述所有相关模块及其所在服务器的公共环境项,并接收所述自动巡检控制台返回的检查报告,根据所述初步检查结果、所述检查结果和所述检查报告联合定位异常原因,根据所述异常原因和所述对应关系提供异常解决方案。
[0079]另外,所述知识库存储模块,还用于存储知识库异常解决报告输出模板;所述知识库异常分析模块,具体用于根据所述知识库异常解决报告输出模板输出对应不同异常原因的异常解决方案。
[0080]上述知识库系统根据自动巡检控制台发送的异常巡检结果分级检查,完成定位异常原因和提供异常解决方案,较好地克服了现有巡检不能有效地解决绝大部分异常定位和提供异常解决方案的缺陷。
[0081]本发明实施例还提供了一种异常处理系统,该系统包括巡检设备、上述自动巡检控制台和上述知识库系统,如图4所示。
[0082]上述自动巡检控制台触发定时巡检任务巡检到异常后,知识库控制模块首先进入检查级别1,依据异常类型,解析异常模块的所有巡检结果,判断是否能直接可以定位异常和提供异常解决方案;如果能则直接反馈异常处理结果,如果不能,则知识库控制模块进入检查级别2,动态地得到与异常模块相关的上下文模块。检查上下文模块的检查结果定位异常和提供解决方案。如果仍然没有定位到异常,则依次再查找相对与此次确定的上下文模块的上下文模块,循环重复判断。知识库异常分析模块依据被巡检模块的结果,跟踪问题源,最终定位异常。
[0083]如果检查级别2仍然没有定位到异常,进入检查级别3,启动更进一步的异常检查,依据当前全局的规划部署信息,知识库控制模块获取异常模块的所有利益相关模块,即与异常模块有共享点的模块。然后触发所有利益相关模块的进一步巡检,还包括所有利益相关模块所在服务器的公共环境项检查,依据这些全部的检查结果,知识库异常分析模块来定位异常和提供异常解决方案。
[0084]依据消息内容、规范的日志信息和链路配置信息,动态的确定异常出现模块的上下文模块,方便了系统在添加新模块后,知识库系统能动态的识别上下文相关模块,为问题定位提供保证。
[0085]本实施例的另一个关键点为,规范所有日志格式,打印所有消息的上下文模块定位信息,并依据知识库存储模块定义的知识库异常解决报告输出模板,为异常分析模块在综合多个被检查模块的返回信息时,定位出最终的结果。
[0086]上述异常处理系统,依据全局信息和异常类型,通过异常处理检索知识库系统,快速的获得异常处理解决方案,方便现场维护人员对异常问题的及时处理。
[0087]本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成,上述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。
[0088] 以上实施例仅用以说明本发明的技术方案而非限制,仅仅参照较佳实施例对本发明进行了详细说明。本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围当中。
【权利要求】
1.一种异常处理方法,其特征在于,该方法包括: 自动巡检控制台向被巡检设备下发巡检任务并触发执行对应的巡检任务,接收所述被巡检设备返回的巡检结果; 所述自动巡检控制台确定巡检到异常,则触发知识库系统完成定位异常原因和提供异常解决方案。
2.根据权利要求1所述的方法,其特征在于: 所述自动巡检控制台触发知识库系统完成定位异常原因和提供异常解决方案之前,所述方法还包括: 所述自动巡检控制台加载所述知识库系统。
3.一种异常处理方法,其特征在于,该方法包括: 知识库系统接收自动巡检控制台发送的携带巡检结果的触发请求; 所述知识库系统根据所述触发请求定位异常原因和提供异常解决方案。
4.根据权利要求3所述的方法,其特征在于: 所述知识库系统根据 所述触发请求定位异常原因和提供异常解决方案,包括: 所述知识库系统进行初步检查,根据初步检查结果直接定位异常原因,根据所述异常原因和异常原因与异常解决方案之间的对应关系提供异常解决方案;或者, 所述知识库系统根据所述初步检查结果未定位出异常原因,则获得与所述初步检查结果对应的故障模块的上下文模块,通知所述自动巡检控制台巡检所述上下文模块,并接收所述自动巡检控制台返回的检查结果,根据所述初步检查结果和所述检查结果联合定位异常原因,根据所述异常原因和所述对应关系提供异常解决方案;或者, 所述知识库系统根据所述初步检查结果和所述检查结果未定位出异常原因,则获得所述故障模块的所有相关模块,并通知所述自动巡检控制台巡检所述所有相关模块及其所在服务器的公共环境项,并接收所述自动巡检控制台返回的检查报告,根据所述初步检查结果、所述检查结果和所述检查报告联合定位异常原因,根据所述异常原因和所述对应关系提供异常解决方案。
5.根据权利要求3或4所述的方法,其特征在于: 所述知识库系统根据所述触发请求定位异常原因和提供异常解决方案包括: 所述知识库系统根据保存的知识库异常解决报告输出模板输出对应不同异常原因的异常解决方案。
6.一种自动巡检控制台,其特征在于,该自动巡检控制台包括: 巡检模块,用于向被巡检设备下发巡检任务并触发执行对应的巡检任务,接收所述被巡检设备返回的巡检结果; 触发模块,用于确定所述巡检模块巡检到异常,则触发知识库系统完成定位异常原因和提供异常解决方案。
7.根据权利要求6所述的自动巡检控制台,其特征在于,该自动巡检控制台还包括: 加载模块,用于加载所述知识库系统。
8.一种知识库系统,其特征在于,该系统包括: 接口模块,用于接收自动巡检控制台发送的携带巡检结果的触发请求; 知识库控制模块,用于根据所述触发请求触发不同级别的异常处理过程,并向知识库异常分析模块发送处理结果; 知识库存储模块,用于保存异常原因与异常解决方案之间的对应关系; 知识库异常分析模块,用于根据所述处理结果和所述对应关系,定位异常原因和提供异常解决方案。
9.根据权利要求8所述的系统,其特征在于: 所述知识库异常分析模块,具体用于: 根据所述触发请求进行初步检查,根据初步检查结果直接定位异常原因,根据所述异常原因和异常原因与异常解决方案之间的对应关系提供异常解决方案;或者, 根据所述初步检查结果未定位出异常原因,则获得与所述初步检查结果对应的故障模块的上下文模块,通知所述自动巡检控制台巡检所述上下文模块,并接收所述自动巡检控制台返回的检查结果,根据所述初步检查结果和所述检查结果联合定位异常原因,根据所述异常原因和所述对应关系提供异常解决方案;或者, 根据所述初步检查结果和所述检查结果未定位出异常原因,则获得所述故障模块的所有相关模块,并通知所述自动巡检控制台巡检所述所有相关模块及其所在服务器的公共环境项,并接收所述自动巡检控制台返回的检查报告,根据所述初步检查结果、所述检查结果和所述检查报告联合定位异常原因,根据所述异常原因和所述对应关系提供异常解决方案。
10.根据权利要求8或9所述的系统,其特征在于: 所述知识库存储模块,还用于存储知识库异常解决报告输出模板; 所述知识库异常分析模块,具体用于根据所述知识库异常解决报告输出模板输出对应不同异常原因的异常解决方案。
【文档编号】H04L12/24GK103475531SQ201210187731
【公开日】2013年12月25日 申请日期:2012年6月8日 优先权日:2012年6月8日
【发明者】牛犇, 王显光, 戴立伟 申请人:中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1