通信设备中故障定位方法及其系统的制作方法

文档序号:7649183阅读:190来源:国知局

专利名称::通信设备中故障定位方法及其系统的制作方法
技术领域
:本发明涉及通信领域,特别涉及故障定位技术。技术背景在通信领域,MPC860,MPC82xx,MPC85xx等系列微处理器(嵌入式处理器)被大量使用。此系列嵌入式处理器中,都集成了通信处理模快(CommunicationsProcessorModule,简称"CPM")。CPM模块主要用于处理各种通信协议,例如,通用异步收/发器(UniversalAsynchronousReceiver/Transmitter,简称"UART"),高级数据链路控制(High-LevelDataLinkControl,简称"HDLC,,),异步传输模式(AsynchronousTransferMode,简称"ATM")等。CPM模块处理各种通信协议时,可根据用户需要进行配置,灵活多变,同时具有高集成度,处理能力强等优点,在通信领域等场合得到了广泛的应用。在实际应用中,多种协议的处理集中在CPM模块中时,容易相互干扰,而且CPM模块的鲁棒性不强,用户在处理某种协议时的不当操作很可能导致CPM模块工作不正常,但表现出来很可能是其他协议类型处理不当,给嵌入式系统下定位问题带来诸多不便。同时由于MPC860,MPC82xx,MPC85xx等系列嵌入式处理器内部是由CPU内核才莫块和CPM;f莫块两部分协同工作的,在CPM模块工作不正常时,CPU内核冲莫块还可以正常工作,并且CPU内核模块并不知道CPM模块是否正常工作。极端的情况下,可能出现CPU内核模块长时间工作正常,而CPM模块工作不正常的情况,此时并不符合嵌入式系统设计的初衷。由于CPU内核模块与CPM模块之间缺乏有效的通信手段,导致CPU内核模块并不清楚当前CPM模块的工作状态,因而可能出现CPM模块发生故障,而CPU内核上运行的嵌入式操作系统长时间运行正常的情况。现有技术方案一般是通过检测CPM模块处理的某种协议是否工作正常,如果某种类型的协议超过一定时间处理不正常,则认为CPM模块发生故障,考虑复位系统。以MPC8260来举例,其内部结构如图1所示,其中G2内核模块和CPM模块具有处理功能。G2内核模块通过解析机器码负责处理用户指令,而CPM模块通过解析微码负责通信协议的处理。G2内核模块通常也称为CPU内核,嵌入式操作系统就是运行在CPU内核上面。正常运行过程中,G2内核和CPM模块可以通过双端口RAM(DPRAM)或者共享内存等手段完成数据的交互,但是两者的运行状态都是相对独立的。CPU内核可以通过CPM模块提供的命令操作接口,通过不同的操作码,完成一些状态的控制,例如初始化、启动、停止特定协议的处理等。但在运行过程中,CPU内核还是没法获知CPM模块的运行状态,特别是CPM模块已经工作不正常时,CPU内核一般是通过判断某种协议是否长时间处理不正常,来判定CPM模块是否发生故障,如果判定CPM模块故障则通过复位单板来解决问题。然而,本发明的发明人发现,现有技术方案是根据现象去定位问题,准确性较差。因为多种协议都在CPM模块中处理,并且会相互影响,对其中某种协议操作不当,可能表现出来的现象会是另一种协议超时处理不正常,因此通过判断某种协议是否长时间处理不正常,来判定CPM模块是否发生故障,准确性较差。此外,某种协议超时处理不正常,也可能是因为硬件或者其它软件问题,而并不是对CPM模块的操作不当。另外现有技术会导致业务恢复时间比较长
发明内容本发明实施方式要解决的主要技术问题是提供一种通信设备中故障定位方法及其系统,使得能够方便地定位CPM模块的故障。为解决上述技术问题,本发明的实施方式提供了一种通信设备中故障定位方法,包括以下步骤调用嵌入式处理器中的通信处理模块产生随机数;如果连续N次从通信处理模块得到的随机数相同,则判定该通信处理模块故障,其中N大于1。本发明的实施方式还提供了一种通信设备中故障定位系统,包括随机数产生单元,用于调用嵌入式处理器中的通信处理模块产生随机数;第一判断单元,用于判断从通信处理模块得到的连续N次随机数是否相同,如果相同则判定通信处理模块故障,其中N大于1。本发明实施方式与现有技术相比,主要区别及其效果在于调用CPM模块产生的随机数,根据其产生的随机数是否连续多次相同,来判断该CPM模块是否故障;由于随机数由CPM模块硬件产生,从而随机数产生功能发生故障能够直接被定位为CPM模块发生故障,而不会与其它软件或硬件的故障相混淆,能够方便准确地进行CPM模块的故障定位。图1是根据现有技术的MPC8260内部结构图;图2是根据本发明第一实施方式的通信设备故障定位方法流程图;图3是根据本发明第二实施方式的通信设备故障定位系统结构图。具体实施方式为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明的实施方式作进一步地详细描述。本发明的第一实施方式涉及一种通信设备中故障定位方法,在本实施方式中,通过调用嵌入式处理器中的CPM模块产生随机数,根据连续产生的随机数是否相同来判定该CPM模块是否发生故障。具体流程如图2所示。为了使流程更清楚,详尽,在图2所示的流程中,除了上述产生随机数的步骤和判断是否故障的步骤外,还包括了其它步骤,需要说明的是所包括的其它步骤均是可选的,即可省略的。在本实施方式中,设定一个定时器,定时器的周期可以设置为50毫秒、80毫秒、IOO毫秒等,具体设置为多少并不限于以上数值,可以根据实际情况进行设定。在步骤210中,系统根据定时器周期,周期性调用嵌入式处理器中的CPM模块产生随机数。具体地说,是通过周期性调用嵌入式处理器中的CPM模块提供的命令操作码来产生随机数。因为在CPM模块提供的命令操作接口中,存在一个特殊的操作码,命令操作码,如表l中阴影部分所示。通过执行该命令操作码,可以使CPM模块产生随机数。操作信道码<table>tableseeoriginaldocumentpage7</column></row><table><table>tableseeoriginaldocumentpage8</column></row><table>表1另外,还可以设置一个计数器,通过设置计数器的计数上限来限定产生随机数的个数。随机数产生的具体过程可分为下面几个部分1)构造随机数产生命令Opcode=(OxA26);Opcode|=(0xE《21);Opcode|=(OxA《6);Opcode|=OxC;2)检测命令执行条件是否满足,即检测CPM模块命令寄存器(CPCommandRegister,简称"CPCR")标志位(FLAG)是否置位,如果置位则表明CPM模块当前正在执行其它命令,不满足命令执行条件;如果没有置位则表明CPM模块满足命令执行条件,进入3)。3)执行随机数产生命令将随机数产生命令写入CPCR寄存器;将CPCR寄存器中FLAG标志置位,开始执行随机数产生命令。在步骤220中,判断是否超时未产生随机数,即判断执行随机数产生命令是否超时,如果超时,则进入步骤260,否则进入步骤230。具体地说,CPM模块在每次执行随机数产生命令,产生一个随机数后,会清除CPCR寄存器中FLAG标志,所以系统可以通过检测FLAG标志是否超时未被清除,来判断是否超时未产生随机数,如果是,则进入步骤260;否则进入步骤230。在步骤230中,判断当前产生的随机数的次数是否满足指定次数N,其中,N大于l,如果达到指定次数,则进入步骤240,如果未达到指定次数则返回步骤210,继续产生随机数。需要说明的是,在第二次进入步骤210之后,可以无需重新构造随机数产生命令,直接使用之前构造的随机数产生命令产生随机数。上述步骤对应的伪代码如下所示While(CPCR寄存器中FLAG标志没有置位&&计数器未超过N)计数器加l;将FLAG标志置位;执行随机数产生命令;if(超时未产生随机数)返回命令执行超时,跳出while循环;else输出随机数,清除FALG标志;需要说明的是,步骤230主要用于控制CPM模块产生的随机数个数,该步骤是可选步骤,在实际应用中,可以不包括该步骤,任由CPM模块周期性产生随机数,在步骤240中直接从所产生的随机数中选择连续的N个随机数进行判断。接着,进入步骤240,读取所产生的随机数,判断是否连续N次得到相同的随机数,如果连续N次得到相同的随机数,则表示CPM模块发生故障,进入步骤260;否则进入步骤250。在步骤250中,判定CPM模块没有发生故障。在步骤260中,判定CPM模块发生故障,记录故障信息,进行故障处理,故障处理方式可以是将CPM模块对应的单板进行复位。在本实施方式中,通过连续N次从CPM模块得到随机数,若N次随机数相同,则判定该CPM模块故障,其中N大于1。为了较准确地判断CPM模块是否出现故障,通常将N的值设置为3,因为连续3次产生的随机数相同的概率为(1/0xffffffff)x(1/0xffffffff),即5.42x10-20,从而可以认为在未发生故障的情况下,随机数连续3次或3次以上相同的概率为零。另外,由于随机数由CPM模块硬件产生,从而随机数产生功能发生故障能够直接被定位为CPM模块发生故障,而不会与其它软件或硬件的故障相混淆,能够方便准确地进行CPM模块的故障定位。而且,该方法对设备几乎没有额外负担,所以可以在几毫秒或几十毫秒内完成一次检测,通常在100毫秒以内就可以知道CPM模块是否出现故障;而现有技术中在某种类型的协议超过一定时间处理不正常的情况下才会发现故障,此时通常已经过了几秒甚至几分钟;可见,与现有技术相比,本发明能够更迅速地定位CPM模块的故障。需要说明的是,在本实施方式中,为了提高故障判断的准确性,参与故障判断的随机数个数大于1,即在连续2次或2次以上产生的随机数相同时,判定CPM模块故障;而在实际应用中,通常在连续3次产生的随机数相同时,就判定CPM模块故障。本发明的第二实施方式涉及一种信设备中故障定位系统,其结构图如图3所示,包含随机数产生单元,用于调用嵌入式处理器中的CPM模块产生随机数;定时器,用于定时指示随机数产生单元调用CPM模块产生随机数,该定时器为周期性定时器,且该定时器的周期小于或等于100毫秒;计数器,用于对随机数产生单元所产生的随机数进行计数;第一判断单元,用于判断从该CPM模块得到的连续N次随机数是否相同,如果相同则判定该CPM模块故障,其中N大于或等于1。该系统还可以包括第二判断单元,用于在随机数产生单元调用通信处理模块产生随机数后的预定时限内,判断是否得到该通信处理模块产生的随机数,如果超时未得到随机数,则判定该通信处理模块故障。该系统还可以包括记录单元,用于在第一或第二判断单元判定通信处理模块故障时,记录该CPM模块故障的信息;故障处理单元,用于在第一或第二判断单元判定该CPM模块故障时,进行故障处理。该故障处理单元可以包括复位子单元,用于将通信处理模块对应的单板进行复位。通过本系统,能定时监测CPM模块工作状态,在CPM模块工作状态不正常时,第一时间记录日志并告警,并进行相应的处理。方便定位CPM模块工作状态不正常导致系统复位的问题,能在尽量短的时间内通知单板复位,恢复正常业务。需要说明的是,在本实施方式中,为了提高故障判断的准确性,参与故障判断的随机数个数大于1,即在连续2次或2次以上产生的随机数相同时,判定CPM模块故障;而在实际应用中,通常在连续3次产生的随机数相同时,就判定CPM模块故障。综上所述,在本发明的实施方式中,定时调用CPM模块产生的随机数,根据其产生的随机数是否连续多次相同,来判断该CPM模块是否故障;由于随机数由CPM模块硬件产生,从而随机数产生功能发生故障能够直接被定位为CPM模块发生故障,而不会与其它软件或硬件的故障相混淆,能够方便准确地进行CPM模块的故障定位。由于随机数由CPM模块硬件产生,对设备几乎没有额外负担,所以可以在几毫秒或几十毫秒内完成一次检测,通常在100毫秒以内就可以知道CPM模块是否出现故障;而现有技术中在某种类型的协议超过一定时间处理不正常的情况下才会发现故障,此时通常已经过了几秒甚至几分钟;可见,本发明的实施方式与现有技术相比,能够更迅速地定位CPM模块的故障。在得到的随机数连续2次或2次以上相同时,判定CPM模块故障。通常在得到的随机数连续3次相同时则判定CPM模块出现故障。因为连续3次产生的随机数相同的概率为(1/0xffffffff)x(1/0xffffffff),即5.42x10-20,从而可以认为在未发生故障的情况下,随机数连续3次或3次以上相同的概率为零。虽然通过参照本发明的某些优选实施方式,已经对本发明进行了图示和描述,但本领域的普通技术人员应该明白,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。权利要求1.一种通信设备中故障定位方法,其特征在于,包括以下步骤调用嵌入式处理器中的通信处理模块产生随机数;如果连续N次从所述通信处理模块得到的随机数相同,则判定该通信处理模块故障,其中N大于1。2.根据权利要求1所述的通信设备中故障定位方法,其特征在于,所述调用通信处理模块产生随机数的步骤中,周期性调用所述通信处理模块产生随机数。3.根据权利要求2所述的通信设备中故障定位方法,其特征在于,所述周期小于或等于100毫秒。4.根据权利要求1所述的通信设备中故障定位方法,其特征在于,所述调用通信处理模块产生随机数的步骤之后,还包括以下步骤如果超过预定的时间未从所述通信处理模块得到所述随机数,则判定所述通信处理模块故障。5.根据权利要求1至4中任一项所述的通信设备中故障定位方法,其特征在于,所述判定该通信处理模块故障的步骤之后,还包括以下步骤记录所述通信处理模块故障的信息,并进行故障处理;所述进行故障处理的步骤中,包括以下子步骤将所述通信处理模块对应的单板进行复位。6.—种通信设备中故障定位系统,其特征在于,包括随机数产生单元,用于调用嵌入式处理器中的通信处理模块产生随机数;第一判断单元,用于判断从所述通信处理模块得到的连续N次随机数是否相同,如果相同则判定所述通信处理模块故障,其中N大于1。7.根据权利要求6所述的通信设备中故障定位系统,其特征在于,还包括定时器,用于定时指示所述随机数产生单元调用所述通信处理模块产生随机数;该定时器的周期小于或等于100毫秒。8.根据权利要求6所述的通信设备中故障定位系统,其特征在于,还包括第二判断单元,用于在所述随机数产生单元调用通信处理模块产生随机数后的预定时限内,判断是否得到该通信处理模块产生的随机数,如果超过所述预定的时限未得到所述随机数,则判定该通信处理模块故障。9.根据权利要求6至8中任一项所述的通信设备中故障定位系统,其特征在于,还包括记录单元,用于在所述笫一或第二判断单元判定所述通信处理模块故障时,记录该通信处理模块故障的信息。10.根据权利要求6至8中任一项所述的通信设备中故障定位系统,其特征在于,还包括故障处理单元,用于在所述第一或第二判断单元判定所述通信处理模块故障时,进行故障处理;所述故障处理单元包括以下子单元复位子单元,用于将所述通信处理模块对应的单板进行复位。全文摘要本发明涉及通信领域,公开了一种通信设备中故障定位方法及其系统,使得能够方便地定位CPM模块的故障。本发明中,定时调用CPM模块产生的随机数,根据其产生的随机数是否连续多次相同,来判断该CPM模块是否故障。在得到的随机数连续3次或3次以上相同时,判定CPM模块故障。文档编号H04L1/20GK101123543SQ20071007694公开日2008年2月13日申请日期2007年9月5日优先权日2007年9月5日发明者张剑波申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1