单板故障定位装置及方法

文档序号:7629111阅读:145来源:国知局
专利名称:单板故障定位装置及方法
技术领域
本发明涉及通 信领域,具体而言,涉及一种单板故障定位装置及方法。
背景技术
随着 DWDM (Dense Wavelength Division Multiplexing,密集型光波复用)的飞速发展,业务容量不断扩大,单板数量随之剧增,这就给后期的设备运行维护人员带来了更大的压力,工程现场经常会出现各种各样的单板故障。当前处理这些问题的方法,一般都是由售后和研发人员在工程现场依据故障现象分析、定位和解决。定位故障的效率与当事工程运维人员自身素质有密切关系,而且人为不确定因素在故障定位中显得尤为突出。这就导致单板故障很难按照较固定的程式去定位,使得定位单板故障效率较低且成本较高。如何能够让维护人员轻松、迅速定位和解决这些故障就成为亟待解决的问题。

发明内容
本发明的主要目的在于提供一种单板故障定位装置及方法,以至少解决上述问题之一。根据本发明的一个方面,提供了一种单板故障定位装置,包括主诊断模块及位于一个或多个单板上的一个或多个从诊断模块,其中,主诊断模块包括主从通信单元,用于与上述一个或多个从诊断模块建立数据链接;策略下发单元,用于制定故障诊断策略并下发给上述一个或多个从诊断模块;故障定位单元,用于接收上述一个或多个从诊断模块上报的诊断结果并根据该诊断结果进行故障定位;上述一个或多个从诊断模块中的每个从诊断模块均包括从主通信单元,用于与主诊断模块建立数据链接;策略执行单元,用于接收并执行主诊断模块下发的故障诊断策略,并上报诊断结果。根据本发明的另一方面,提供了一种单板故障定位方法,包括主诊断模块与位于一个或多个单板上的一个或多个从诊断模块建立数据链接;主诊断模块制定故障诊断策略并下发给上述一个或多个从诊断模块;上述一个或多个从诊断模块接收并执行主诊断模块下发的故障诊断策略,并上报诊断结果;主诊断模块接收上述一个或多个从诊断模块上报的诊断结果并根据该诊断结果进行故障定位。通过本发明,采用设置主、从诊断模块,由主诊断模块制定故障诊断策略并下发给从诊断模块,从诊断模块执行该故障诊断策略并上报诊断结果,主诊断模块根据从诊断模块上报的诊断结果最终定位故障的方案,解决了现有技术中定位单板故障效率较低且成本较高的问题,进而达到了提高单板故障定位效率、节约单板故障定位成本的效果。


此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中图1是根据本发明实施例的单板故障定位装置的结构框图2是根据本发明优选实施例的单板故障定位装置的结构框图;图3是使用根据本发明优选实施例的单板故障定位装置进行故障定位的流程图;图4是根据本发明实施例的单板故障定位方法的流程
图5是根据本发明优选实施例的单板故障定位方法的流程图;图6是根据本发明优选实施例的单板故障定位方法的时序示意图。
具体实施例方式下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。图1是根据本发明实施例的单板故障定位装置的结构框图。如图1所示,根据本发明实施例的单板故障定位装置包括主诊断模12及从诊断模块14,从诊断模块14位于单板上,对应于单板的数量可以为一个或多个(图1中为多个),其中,主诊断模块12包括主从通信单元122,用于与从诊断模块14建立数据链接;策略下发单元124,与主从通信单元122相连,用于制定故障诊断策略并下发给从诊断模块14 ;故障定位单元126,与策略下发单元124相连,用于接收从诊断模块14上报的诊断结果并根据该诊断结果进行故障定位;从诊断模块14包括从主通信单元142,用于与主诊断模块12建立数据链接;策略执行单元144,与从主通信单元142相连,用于接收并执行主诊断模块12下发的故障诊断策略,并上报诊断结果。在上述装置中,从诊断模块14位于各个单板上,主诊断模块12的设置则可以根据不同情况进行选择,优选地可以设置在上述单板对应的Server (服务器)上,也可以设置在其他可以进行故障定位的设备上。当单板发生故障后,主诊断模块12会通过主从通信单元 122主动与Client端(即客户端,或者说单板端)上的从诊断模块14建链,从诊断模块14 中的从主通信单元142可以认为是主从通信单元122的延伸或者说一部分,二者共同建立起主诊断模块12与从诊断模块14之间的数据链接。在数据链接建立完成后,策略下发单元124就会给从诊断模块14发送故障诊断策略,从诊断模块14中的策略执行单元144接收并按照诊断策略进行故障诊断,并报告诊断结果,故障定位单元126分析该诊断结果,最终定位故障(原因),至此故障定位就完成了。整个过程排出了人为的不确定因素,快速、高效、成本低。优选地,从诊断模块14可以由主诊断模块12在故障发生时,设置到各个单板上。上述装置的实现可以通过硬件方式也可以通过软件方式。当主诊断模块12、从诊断模块14是通过硬件实现时,需按要将它们预先设置在相应的单板和设备上。但是,当诊断模块12、从诊断模块14是通过软件实现时,选择的余地就大了很多。当设备发生故障时,可以通过远程控制台实时的将主诊断模块12、从诊断模块14下载到故障设备的Server 上,Server自动加载运行主诊断模块12,并通过主诊断模块12将从诊断模块14分发到各 Client单板上,各个Client单板收到从诊断模块14后,即刻加载运行,待Server和Client上的主从诊断模块均运行起来后,再执行后续的处理。当然,即使主诊断模块12、从诊断模块14是通过软件实现的,也可以选择将它们预先设置在相应的单板和设备上。可见。软件的实现方式大大增加了应用的灵活性,而灵活的应用方式可以使上述装置适应各种各样的情况,进而增加了其实用性。优选地,主诊断模块12还可以进一步包括故障解决单元128,与故障定位单元126相连,用于根据故 障定位的结果给出相应的故障解决办法。在故障定位单元126定位出故障以后,故障解决单元128即可以给出相应的故障解决办法。其实现的方法是多种多样的,例如可以建立一张故障及对应解决办法的列表以供查询,或者链接到相关的数据库查询解决办法,甚至还可以直接在互联网上搜索解决办法。故障解决单元128的设置,为维护人员进行工作提供了方便,提高了用户体验。优选地,策略下发单元124,还可以用于在故障定位单元126进行故障定位失败后,调整故障诊断策略并再次下发,直至故障定位单元126成功进行故障定位。故障定位单元126在根据从诊断模块14上报的诊断结果进行故障定位时是有可能失败的,但这并不一定意味着不存在故障,在大多数情况下可能是由于故障诊断策略不当造成的。因此,在故障定位失败后,不应当停止故障定位而是应该调整故障诊断策略继续进行故障定位,直至定位成功。需要说明的是,这里所说的直至定位成功是一种趋向性的说法,在具体实施过程中,一般要设定停止故障定位的条件,例如尝试了所有故障诊断策略或尝试了一定的次数,以免发生无限循环。优选地,策略下发单元124可以根据各个单板的不同特点制定不同的故障诊断策略;故障定位单元126可以通过比对预置的单板标准参数和诊断结果中的单板反馈参数进行故障定位。对于不同类型的单板,根据其特点采用不同的故障诊断策略,可以大大加快故障定位的效率,缩短故障定位时间。而对于故障定位本身来说,其方法是多种多样,但是一般来说单板故障都会相应的导致一些参数的异常,因此通过比对正常单板的参数(即单板标准参数)和故障单板的参数(即单板反馈参数)就可以定位出绝大多数的单板故障(原因),这种方法简单易行。下面结合实例及图3对上述优选实施例进行详细说明。以图2所示的装置结构为例,假设Client单板3产生风扇故障。如图3所示,使用根据本发明优选实施例的单板故障定位装置进行故障定位的流程包括以下步骤步骤S302,利用telnet (因特网远程登录服务的标准协议和主要方式)工具登陆到故障单板所在网管;步骤S304,通过网管FTP (File Transfer Protocol,文件传输协议)工具将保存在网管上的主、从诊断模块传送到网元代理Agent (Server)上;步骤S306,Agent对收到数据包进行比对,根据数据包中标志位识别出主诊断模块和从诊断模块,均存储到RAM中;步骤S308,Agent独起线程运行主诊断模块;步骤S310,该线程按照现有 Server-Client 链路 RUDP 协议(Reliable User Datagram Protocol,可靠用户数据报协议)顺序将从诊断模块按顺序分发给各个Client单板;步骤S312,单板(Client)采用与Agent同样的方法(根据标志位)识别出从诊断模块,并给Agent发出已经接收应答;步骤S314,判断是否所有单板都收到了从诊断模块,若果是,转至步骤S316,如果否,转至步骤S310 ;步骤S316,单板单 独起线程加载运行从诊断模块;步骤S318,主、从诊断通信模块之间建链;步骤S320,判断主诊断模块是否与所有的从诊断模块都建立了连接,如果是,转至步骤S322,如果否,转至步骤S314 ;步骤S322,主诊断模块根据各个单板不同的特点制定不同的诊断策略,并按照顺序向单板1、2. . . N等上的从诊断模块发送诊断策略。诊断策略中包含从诊断模块需要运行的程序组合,该组合由Agent上的主诊断模块进行动态搭配。例如对单板3,发送的诊断策略是(1)报告CPU温度值(2)报告风扇转速;步骤S324,各个从诊断模块收到诊断策略后,会按照诊断策略执行诊断程序,并将诊断结果报告给Agent端主诊断模块。对于单板3来说,就是(1)运行CPU温度测量程序 (2)运行风扇测速程序,并将这两个参数值反馈给主诊断模块;步骤S326,Agent端主诊断模块收到各个从诊断诊断模块的诊断结果后,会将这些结果存储到“单板反馈参数表”中;步骤S328,主诊断模块运行的故障定位算法,比对“单板反馈参数表”和“单板标准参数表”;步骤S330,判断“单板反馈参数表”和“单板标准参数表”是否一致,如果是,即当前诊断结果没有异常,而实际上是存在单板故障的,就说明当前诊断策略不成功。此时,主诊断模块会动态组合新的诊断策略,然后转至步骤S322,直到定位出故障的原因,给出具体解决方法,若果否,则转至S332 ;步骤S332,根据不一致的参数,定位出单板的故障(原因),最终给出具体解决方法。如果除单板3之外所有单板诊断结果都正常,则主诊断模块中记录这些单板的“单板反馈参数表”与“单板模板参数表”就不会产生差异,表明这些单板没有故障。如果单板3上标识“单板温度性能项参数”出现异常,则主诊断模块会定位出“单板3温度异常”,并给出 “需要更换风扇”等具体建议。图4是根据本发明实施例的单板故障定位方法的流程示意图。如图4所示,根据本发明实施例的单板故障定位方法包括步骤S402,主诊断模块与位于一个或多个单板上的一个或多个从诊断模块建立数据链接;步骤S404,主诊断模块制定故障诊断策略并下发给从诊断模块;步骤S406,从诊断模块接收并执行主诊断模块下发的故障诊断策略,并上报诊断
结果;步骤S408,主诊断模块接收从诊断模块上报的诊断结果并根据该诊断结果进行故
障定位。使用上述方法,在设备发生故障后,主诊断模块会主动与Client端(即客户端,或者说单板端)上的从诊 断模块建链,然后给从诊断模块发送故障诊断策略,从诊断模块按照故障诊断策略运行诊断程序,并报告诊断结果,主诊断模块最终定位故障(原因)。整个故障定位过程排出了人为的不确定因素,快速、高效、成本低。优选地,如图5所示,根据本发明优选实施例的单板故障定位方法还可以进一步包括步骤S504,在故障发生时,主诊断模块将一个或多个从诊断模块设置到上述一个或多个单板上。当主、从诊断模块的功能是通过软件实现时,其实现起来就较为灵活,例如,就可以在设备发生故障时,通过远程控制台实时的将主诊、从诊断模块下载到故障设备的 Server上(参见步骤S502),Server自动加载运行主诊断模块,并将从诊断模块分发到各 Client单板上,各个Client单板收到从诊断模块后,即刻加载运行,待Server和Client上的主从诊断模块均运行起来后,再执行后续的处理,其时序如图6所示。在后续步骤中,步骤S508相当于上述步骤S402,步骤S512-步骤S516相当于上述步骤S404-步骤S408。需要说明的是,在分发从诊断模块和主、从诊断模块建连时还可以添加相应的判断步骤,以保证所有的单板都分发了从诊断模块,以及所有从诊断模块都与主诊断模块建立了连接,如图5所示的步骤S506及步骤S510。优选地,如图5所示,在步骤S516之后,还可以进一步包括步骤S518,判断故障定位是否成功,如果主诊断模块进行故障定位失败,则主诊断模块可以调整故障诊断策略并再次下发(即转至步骤S512),直至故障定位成功。主诊断模块在根据从诊断模块上报的诊断结果进行故障定位时是有可能失败的, 但这并不一定意味着不存在故障,在大多数情况下可能是由于故障诊断策略不当造成的。 因此,在故障定位失败后,不应当停止故障定位而是应该调整故障诊断策略继续进行故障定位,直至故障定位成功。优选地,如图5所示,在定位出故障之后还可以进一步包括步骤S520,主诊断模块根据故障定位的结果给出相应的故障解决办法。其实现的方法是多种多样的,例如可以建立一张故障及对应解决办法的列表以供查询,或者链接到相关的数据库查询解决办法,甚至还可以直接在互联网上搜索解决办法。 故障解决办法的提供,为维护人员进行工作提供了方便,提高了用户体验。优选地,在步骤S512中,主诊断模块可以根据各个单板的不同特点制定不同的故障诊断策略;在步骤S516中,主诊断模块通过比对预置的单板标准参数和诊断结果中的单板反馈参数进行故障定位。对于不同类型的单板,根据其特点采用不同的故障诊断策略,可以大大加快故障定位的效率,缩短故障定位时间。而对于故障定位本身来说,其方法是多种多样,但是一般来说单板故障都会相应的导致一些参数的异常,因此通过比对正常单板的参数(即单板标准参数)和故障单板的参数(即单板反馈参数)就可以定位出绝大多数的单板故障(原因),这种方法简单易行。从以上的描述中,可以看出,本发明提供的技术方案借助于Server和Client上运行的主、从诊断模块能够远程、快速、高效地分析定位出是哪一块Client单板出了故障,以及该单板出现了何种故障,并提供解决方案,提高了单板故障定位的效率,节约了单板故障定位的成本,具有良好的应用前景和使用价值。 显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
权利要求
1.一种单板故障定位装置,其特征在于,包括主诊断模块及位于一个或多个单板上的一个或多个从诊断模块,其中,所述主诊断模块包括主从通信单元,用于与所述一个或多个从诊断模块建立数据链接; 策略下发单元,用于制定故障诊断策略并下发给所述一个或多个从诊断模块; 故障定位单元,用于接收所述一个或多个从诊断模块上报的诊断结果并根据所述诊断结果进行故障定位;所述一个或多个从诊断模块中的每个从诊断模块均包括 从主通信单元,用于与所述主诊断模块建立数据链接;策略执行单元,用于接收并执行所述主诊断模块下发的故障诊断策略,并上报诊断结 果。
2.根据权利要求1所述的装置,其特征在于,所述一个或多个从诊断模块由所述主诊断模块在故障发生时,设置到所述一个或多个单板上。
3.根据权利要求2所述的装置,其特征在于,所述主诊断模块还包括 故障解决单元,用于根据故障定位的结果给出相应的故障解决办法。
4.根据权利要求3所述的装置,其特征在于,所述策略下发单元,还用于在所述故障定位单元进行故障定位失败后,调整所述故障诊断策略并再次下发,直至所述故障定位单元成功进行故障定位。
5.根据权利要求1-4任一项所述的装置,其特征在于,所述策略下发单元根据所述一个或多个单板中各个单板的不同特点制定不同的故障诊断策略;所述故障定位单元通过比对预置的单板标准参数和所述诊断结果中的单板反馈参数进行故障定位。
6.一种单板故障定位方法,其特征在于,包括主诊断模块与位于一个或多个单板上的一个或多个从诊断模块建立数据链接; 所述主诊断模块制定故障诊断策略并下发给所述一个或多个从诊断模块; 所述一个或多个从诊断模块接收并执行所述主诊断模块下发的故障诊断策略,并上报诊断结果;所述主诊断模块接收所述一个或多个从诊断模块上报的诊断结果并根据所述诊断结果进行故障定位。
7.根据权利要求6所述的方法,其特征在于,在所述主诊断模块与位于一个或多个单板上的一个或多个从诊断模块建立数据链接之前,还包括在故障发生时,所述主诊断模块将所述一个或多个从诊断模块设置到所述一个或多个单板上。
8.根据权利要求7所述的方法,其特征在于,在所述主诊断模块接收所述一个或多个从诊断模块上报的诊断结果并根据所述诊断结果进行故障定位之后,还包括所述主诊断模块根据故障定位的结果给出相应的故障解决办法。
9.根据权利要求8所述的方法,其特征在于,在所述主诊断模块进行故障定位失败后, 所述主诊断模块调整所述故障诊断策略并再次下发,直至故障定位成功。
10.根据权利要求6-9任一项所述的方法,其特征在于,所述主诊断模块制定故障诊断策略包括所述主诊断模块根据所述一个或多个单板中各个单板的不同特点制定不同的故障诊断策略;所述主诊断模块根据所述诊断结果进行故障定位包括所述主诊断模块通过比对预置的单板标准参数和所述诊断结果中的单板反馈参数进行故障定位。
全文摘要
本发明公开了一种单板故障定位装置及方法,上述装置包括主诊断模块及位于一个或多个单板上的一个或多个从诊断模块,其中,主诊断模块包括主从通信单元,用于与上述一个或多个从诊断模块建立数据链接;策略下发单元,用于制定故障诊断策略并下发给上述一个或多个从诊断模块;故障定位单元,用于接收上述一个或多个从诊断模块上报的诊断结果并根据该诊断结果进行故障定位;上述一个或多个从诊断模块中的每个从诊断模块均包括从主通信单元,用于与主诊断模块建立数据链接;策略执行单元,用于接收并执行主诊断模块下发的故障诊断策略,并上报诊断结果。通过本发明提供的技术方案,达到了提高单板故障定位效率、节约单板故障定位成本的效果。
文档编号H04L12/24GK102158359SQ20111008226
公开日2011年8月17日 申请日期2011年4月1日 优先权日2011年4月1日
发明者李汉宇 申请人:中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1