基站内部硬件接口的故障检测方法

文档序号:7959682阅读:184来源:国知局
专利名称:基站内部硬件接口的故障检测方法
技术领域
本发明涉及通信技术,尤其涉及基站内部硬件接口的故障检测方法。
背景技术
NodeB(基站)在WCDMA(宽带码分多址)系统中是一个非常重要的实体,其主要是用于对WCDMALAY1(宽带码分多址物理层)的处理。
NodeB内部硬件极其复杂,大致可分为射频、数字中频、基带、传输等若干单元,各单元又可再细分为多个模块,以上行基带处理单元为例,其可分为上行公共信道处理模块、上行专用信道处理模块、各种接口FPGA逻辑模块、上行数据面处理模块以及一些控制模块等。各模块间均通过例如串行接口等通用硬件接口或自定义硬件接口完成数据的通信。
由于NodeB内部的硬件接口较多,NodeB在运行时,就不可避免的会发生由于硬件接口的故障而导致的运行不稳定的现象,所以,如何有效的对硬件接口进行故障检测进而快速的排除故障是一个值得关注的问题。目前,为了简化检测硬件接口的过程,通常的方法是在硬件单板入库前,利用单独设计的硬件接口测试软件对硬件接口进行测试。实现这种方法的流程如图1所示,在步骤S101中,计算机中的测试软件向硬件单板发送相应的接口测试命令;进入步骤S102,硬件单板中的CPU接收到命令后,对指定的某个或某些接口进行测试;进入步骤S103,CPU将测试结果上报给测试软件;最后进入步骤S104,测试软件通过用户界面显示所述测试结果。这种方法具有简单、效率高、检测集中的优点,能够确保入库单板的质量,但是,这种方法只是在单板入库前对其接口进行检测,而单板正式在基站中运行时就无法对其接口进行检测,在实际应用中,硬件接口在运行时出现器件老化或接口之间的通信中断等现象都是有可能的,而上述方法明显无法进行实时带业务的在线检测。

发明内容
本发明要解决的技术问题在于提供一种基站内部硬件接口的故障检测方法,以实现对基站内部硬件接口的实时在线检测。
为解决上述问题,本发明提供了一种基站内部硬件接口的故障检测方法,包括A.数据发送端定时向数据接收端发送具有特殊标识的接口检测数据帧;B.所述数据接收端通过判断在统计周期内接收到接口检测数据帧的次数是否超过第一统计门限,确定所述数据接收端与所述数据发送端之间的接口是否发生故障。
其中,所述接口检测数据帧的帧结构与所述接口正常数据帧的帧结构至少可以在一个比特域中具有不同的字段范围,所述不同的字段范围作为所述接口检测数据帧的特殊标识。
如果所述数据接收端在统计周期内接收到所述接口检测数据帧的次数超过了第一统计门限,则确定所述接口未发生故障,否则,确定所述接口已发生故障。
所述数据接收端还可在所述统计周期内判断接收到内容正确的所述接口检测数据帧的次数是否超过第二统计门限,如果是,确定所述接口未发生故障,否则,确定所述接口已发生故障。
所述数据接收端在所述统计周期内判断接收到内容错误的所述接口检测数据帧的次数是否超过数据接收端在所述统计周期内应该接收到接口检测数据帧的次数与第二统计门限之差或单独设置的接收内容错误次数统计门限,如果是,确定所述接口已发生故障,否则,确定所述接口未发生故障。
所述数据接收端确定所述接口发生故障后,可以告警方式表明所述接口已发生故障。
如果所述数据接收端确定所述接口未发生故障,还可以返回步骤A。
本发明的数据发送端可向数据接收端定时发送具有特殊标识的接口检测数据帧,数据接收端通过在统计周期内判断接收到接口检测数据帧的次数是否超过了第一统计门限,进而确定数据发送端与数据接收端之间的接口是否发生了故障,特殊标识就说明了接口检测数据帧与正常发送的接口正常数据帧是有区别的,进一步说,由于接口检测数据帧与接口正常数据帧具有明显的区别,所以,数据发送端发送接口正常数据帧的同时,还可发送接口检测数据帧,数据接收端通过这个明显的区别,识别接收到的数据是接口检测数据帧还是接口正常数据帧,并在一定时间内判断接收到所述接口检测数据帧的次数是否超过了一定的次数,进而确定数据发送端与数据接收端之间的接口是否发生了故障,利用这种方法可以解决基站运行过程中对硬件接口进行实时检测的问题。
本发明的检测方法不但可以通过在一定的时间内判断接收到接口检测数据帧的次数是否超过第一统计门限来判断接口是否发生了故障,还可以进一步通过判断接收的内容正确的接收接口检测数据帧的次数是否超过第二统计门限来判断接口是否发生了故障,这种做法有助于提高判断接口故障的准确性。
本发明的检测方法是对正在运行的接口进行检测,而不是现有技术中提到的对单板进行检测,对单板检测可以检测单板内部器件之间的接口,但不能检测单板之间的接口,这是现有技术存在的一个检测盲点,利用本发明的检测方法完全可以解决这一问题。
此外,现有技术的检测方法需要开发一套检测软件,而本发明的检测方法只需增加一种数据,而且数据的帧结构可以与正常发送数据的帧结构接近,所以,相比于现有技术,本发明的检测方法节省了检测成本。
由于本发明的检测方法是对正在运行的接口进行检测,而不是现有技术中提到的在基站运行前单独对硬件单板进行检测,单板在仓库的存储过程中存在由于受到温度、湿度或搬运过程中无意的碰触而导致器件的破损的可能,所以本发明的在线实时检测的方法可以避免现有技术中对单板检测完成后出现破损失效的情况的发生。


图1为现有的基站内部硬件接口的故障检测方法的流程图;图2为本发明第一实施例的流程图;图3为本发明第一优选实施例的流程图;图4为本发明第二优选实施例的流程图。
具体实施例方式
下面我们将结合附图,对本发明的最佳实施方案进行详细描述。首先要指出的是,本发明中用到的术语、字词及权利要求的含义不能仅仅限于其字面和普通的含义去理解,还包括进而与本发明的技术相符的含义和概念,这是因为我们作为发明者,要适当地给出术语的定义,以便对我们的发明进行最恰当的描述。因此,本说明和附图中给出的配置,只是本发明的首选实施方案,而不是要列举本发明的所有技术特性。我们要认识到,还有各种各样的可以取代我们方案的同等方案或修改方案。
首先,结合图2,对本发明的第一实施例进行说明。在步骤S201中,数据发送端定时向数据接收端发送具有特殊标识的接口检测数据帧。从逻辑的角度来看,数据发送端与数据接收端可以指基站内部的各个单元,例如射频单元、基带单元等,也可以指各个单元内部的模块,从实际的物理载体来看,数据发送端与数据接收端可以指各个硬件单板或者单板内部的各个器件,其中,一块单板可以集成多个模块,这时,模块的物理载体就是单板内部的器件。数据发送端向数据接收端发送数据的方式可以是直接发送,也可以是间接发送,直接发送是指数据发送端通过与数据接收端之间的硬件连线向数据接收端发送数据,间接发送是指数据发送端通过多个单元或模块、以及这些单元或模块之间的硬件连线向数据接收端发送数据。定时的时间可以根据实际的情况合理确定,但最好可以保证数据接收端在一定的时间范围内能够多次接收到接口检测数据帧,这是因为数据发送端向数据接收端发送正常的数据一般都是不定时的,前一次发送的正常数据与后一次发送的正常数据的时间间隔可能很长,如果在这个时间间隔内数据发送端与数据接收端之间的接口发生了故障,而前后两次发送接口检测数据帧的时间间隔却不小于前后两次发送正常数据的时间间隔,数据接收端就不会及时发现故障,从而导致接口持续故障状态的时间较长,甚至会影响整个基站的正常运行,同时,定时的时间也要保证数据发送端在一定的时间范围内发送接口检测数据帧的次数不超过整个基站或单元等所能承受的次数,如果数据发送端过于频繁的向数据接收端发送接口检测数据帧,则可能在客观上造成接口的负荷过重而导致接口发生故障。
另外,特殊标识是接口检测数据帧与其他正常数据的区别标志,一般来说,数据发送端发送的所有的接口检测数据帧的特殊标识都应该相同,以便于数据接收端进行识别。
完成步骤S201后,进入步骤S202,所述数据接收端通过判断在统计周期内接收到接口检测数据帧的次数是否超过第一统计门限,确定所述数据接收端与所述数据发送端之间的接口是否发生故障。在这个步骤中,数据接收端可以在每接收一次接口检测数据帧时计数一次,在统计周期结束时判断接收接口检测数据帧的次数是否超过了第一统计门限,这种情况下,数据接收端无需判断接收到的每两次接口检测数据帧的时间间隔是否为数据发送端发送接口检测数据帧的定时时间,而只需在接收到接口检测数据帧时计数一次,在统计周期结束后判断计数结果是否超过了第一统计门限即可,这对于数据接收端来说,操作简单,工作量也比较小。此外,数据接收端也可以在每个定时时间内判断是否接收到了接口检测数据帧并记录结果,在统计周期结束时判断接收接口检测数据帧的次数是否超过了第一统计门限,例如,数据接收端可在每个定时时间内判断是否未接收到接口检测数据帧,如果是,记录一次,当记录的未接收到接口检测数据帧的次数超过在统计周期内应该接收的次数与第一统计门限之差,就可判断接口已发生了故障,如果统计周期还未结束,则可提前判断接口是否发生故障,这种统计方式虽然比前一个统计方式操作复杂,但有可能提前判断接口是否发生故障,而无需等到统计周期结束时再判断。如果数据接收端判断在统计周期内接收到接口检测数据帧的次数超过第一统计门限,则确定接口未发生故障,否则,确定接口发生了故障。需要说明的是,由于接口检测数据帧从数据发送端到达数据接收端需要一定的时间,所以统计周期应该从接口检测数据帧正常到达数据接收端时开始计时。
另外,数据接收端还可在统计周期结束时判断定时接收到内容正确的接口检测数据帧的次数是否超过了第二统计门限,如果是,确定接口未发生故障,否则,确定接口已发生了故障。相应的,数据接收端在计数过程中,就要对每次接收的接口检测数据帧判断其内容是否正确,如果是,计数一次,另外,数据接收端也可进一步判断在统计周期结束前接收到内容错误的接口检测数据帧的次数是否超过在统计周期内应该接收到接口检测数据帧的次数与第二统计门限之差,如果是,可提前确定接口发生了故障。一般来说,接口检测数据帧的标识都是固定的,可以先判断标识是否正确,再判断小区号或模块号等其他内容是否正确,当然,判断的方法不限于此。
此外,数据接收端如果确定接口已发生了故障,则可以告警的方式表明接口已发生了故障,告警的方式有很多种,例如,数据接收端的CPU通过各种连线向网管发出告警,或数据接收端以异常的光、声等形式告警。数据接收端如果确定接口未发生故障,则可继续执行步骤S201,即,整个故障的检测过程可以是循环的,而且,在继续执行步骤S201之前,可以重新对数据发送端或接收端进行设置,例如调整定时时间或接口检测数据帧的内容等。
现在结合上述内容,对本发明的第一优选实施例进行说明。请参照图3,在步骤S301中,数据发送端定时向数据接收端发送具有特殊标识的接口检测数据帧。进入步骤S302,数据接收端在统计周期内对每次接收到内容正确的接口检测数据帧进行计数。在步骤S303中,统计周期结束时,数据接收端判断所述次数是否超过了第二统计门限,如果是,进入步骤S304,否则进入步骤S305。在步骤S304中,数据接收端确定数据发送端与数据接收端之间的接口未发生故障。在步骤S305中,数据接收端确定数据发送端与数据接收端之间的接口已发生了故障。完成步骤S304后,返回步骤S301。完成步骤S305后,进入步骤S306,数据接收端以告警的方式表明数据发送端与数据接收端之间的接口发生了故障。
此外,需要说明的是,接口检测数据帧的帧结构与接口正常数据帧的帧结构至少在一个比特域中具有不同的字段范围,不同的字段范围可以作为所述接口检测数据帧的特殊标识,这里的接口正常数据帧是指数据发送端发送的正常数据。下面结合表1和表2,分别对接口检测数据帧和接口正常数据帧的帧结构进行说明。
由于接口检测数据帧一般都是在接口正常数据帧的基础上设置的,所以,首先结合表1,对接口正常数据帧的帧结构进行说明。

表1
表1所示的为某硬件接口接口正常数据帧的帧结构。由表1可知,这个帧结构的长度是32比特,其中,第0位表示偶校验位,第1-7为保留位,字段范围为0,第8-15位表示模块号,字段范围为0-255,第16-23位表示PCB板号,字段范围为0-255,第24-27位表示小区号,字段范围为0-5,第28-31位表示消息编号,字段范围为0-15。
为了识别相应接口的检测数据帧,设置的接口检测数据帧的帧结构如表2所示。

表2由表2的内容可知,接口检测数据帧的帧结构的长度与接口正常数据帧的帧结构的长度相同,都是32比特,当然,长度也可以不同。两种帧结构的数据位所代表的含义也相同,但字段范围是有区别的,接口正常数据帧的小区号的字段范围是0-5,而接口检测数据帧的小区号则可固定一个0-5范围之外的数字,例如表2的15,这个小区号15可以成为有别于接口检测数据帧的特殊标识,表示这个数据为接口检测数据帧,当然,接口检测数据帧小区号的字段范围可以取6-15中的任意一个值,此外,为了使接口检测数据帧的内容固定,PCB板号和模块号可以取特殊值,例如0xa5和0x5,当然也可以取其他值,其中,0x代表十六进制。
上述第一优选实施例着重强调的是数据接收端统计接收到内容正确的接口检测数据帧的次数,在统计周期结束时判断统计的次数是否超过了第二统计门限,进而确定接口是否发生了故障,实际上,数据接收端也可统计接收到内容错误的接口检测数据帧的次数,如果在统计周期结束前,接收到内容错误的接口检测数据帧的次数已经超过了统计周期内应该接收到接口检测数据帧的次数与第二统计门限之差,或者超过了单独设置的接收内容错误次数统计门限,则数据接收端可不必对后续接收的接口检测数据帧进行内容正确与否的判断,就可确定接口已发生了故障,进而可在统计周期结束前提前告警,这种处理方式可以缩短故障持续时间,也可使故障尽快的被排除。为此,本发明还提供了第二优选实施例。现在结合图4,对本发明第二优选实施例进行说明。在步骤S401中,数据发送端定时向数据接收端发送具有特殊标识的接口检测数据帧。进入步骤S402,数据接收端对每次接收到内容错误的接口检测数据帧计数一次。在步骤S403中,数据接收端判断在统计周期结束前统计的次数是否超过统计周期内应该接收到接口检测数据帧的次数与第二统计门限之差或者单独设置的接收内容错误次数统计门限,如果是,进入步骤S404,否则,进入步骤S405。在步骤S404中,数据接收端确定数据发送端与数据接收端之间的接口已发生故障。在步骤S405中,数据接收端确定数据发送端与数据接收端之间的接口未发生故障,返回步骤S401。完成步骤S404后,数据接收端以告警的方式表明数据发送端与数据接收端之间的接口发生了故障。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
权利要求
1.一种基站内部硬件接口的故障检测方法,其特征在于包括A.数据发送端定时向数据接收端发送具有特殊标识的接口检测数据帧;B.所述数据接收端通过判断在统计周期内接收到所述接口检测数据帧的次数是否超过第一统计门限,确定所述数据接收端与所述数据发送端之间的接口是否发生故障。
2.如权利要求1所述的基站内部硬件接口的故障检测方法,其特征在于所述接口检测数据帧的帧结构与所述接口正常数据帧的帧结构至少在一个比特域中具有不同的字段范围,所述不同的字段范围作为所述接口检测数据帧的特殊标识。
3.如权利要求1所述的基站内部硬件接口的故障检测方法,其特征在于如果所述数据接收端在所述统计周期内接收到所述接口检测数据帧的次数超过了所述第一统计门限,则确定所述接口未发生故障,否则,确定所述接口已发生故障。
4.如权利要求3所述的基站内部硬件接口的故障检测方法,其特征在于还包括所述数据接收端在所述统计周期内判断接收到内容正确的所述接口检测数据帧的次数是否超过第二统计门限,如果是,确定所述接口未发生故障,否则,确定所述接口已发生故障。
5.如权利要求3所述的基站内部硬件接口的故障检测方法,其特征在于还包括所述数据接收端在所述统计周期内判断接收到内容错误的所述接口检测数据帧的次数是否超过数据接收端在所述统计周期内应该接收到接口检测数据帧的次数与第二统计门限之差或单独设置的接收内容错误次数统计门限,如果是,确定所述接口已发生故障,否则,确定所述接口未发生故障。
6.如权利要求1所述的基站内部硬件接口的故障检测方法,其特征在于还包括所述数据接收端确定所述接口发生故障后,以告警方式表明所述接口已发生故障。
7.如权利要求1所述的基站内部硬件接口的故障检测方法,其特征在于还包括如果所述数据接收端确定所述接口未发生故障,返回步骤A。
全文摘要
本发明公开了一种基站内部硬件接口的故障检测方法,包括数据发送端定时向数据接收端发送具有特殊标识的接口检测数据帧;所述数据接收端通过判断在统计周期内接收到接口检测数据帧的次数是否超过了第一统计门限,确定所述数据接收端与所述数据发送端之间的接口是否发生故障。本发明的检测方法是对正在运行的接口进行检测,而不是现有技术中提到的对单板进行检测,对单板检测可以检测单板内部器件之间的接口,但不能检测单板之间的接口,这是现有技术存在的一个检测盲点,利用本发明的检测方法完全可以解决这一问题。
文档编号H04W88/08GK1968481SQ200610073188
公开日2007年5月23日 申请日期2006年4月12日 优先权日2006年4月12日
发明者赵建荣 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1