一种单总线主备保护设备串行总线故障检测方法

文档序号:7643032阅读:196来源:国知局
专利名称:一种单总线主备保护设备串行总线故障检测方法
技术领域
本发明涉及电子设备的故障处理技术,尤其涉及提供主备热备份保护功 能且主备模块共用一组串行总线的设备的总线故障检测和处理技术。
背景技术
在骨干网络、医疗设备、工业控制等领域,对于电子设备的可靠性要求 非常高, 一般要求设备能整体保持长时间稳定运行,发生故障时能够自动隔 离故障或自动启动主备保护。 一旦这些领域的设备突发故障,将会造成很大 的经济损失,甚至危及人身安全。对于可靠性要求较高的领域,常用的一种 解决方法是采用冗余设计技术,对于关键电路单板或模块进行冗余设计,提供主备保护功能设备正常运行时,主用电路模块正常工作,备用模块处于 待机状态。当主用电路模块出现故障时,系统会检测到主用电路模块的故障, 然后启动主备保护倒换操作,关断当前主用电路模块,启动备用电路模块工 作。从而大大缩短了设备出现故障的时间,降低了设备出现故障所造成的影 响。随着技术的发展,目前很多设备已经能够做到在进行主备保护时,在一 定的条件下,不会影响设备正常运行。对于某些采用主备保护的小型化电子设备,由于条件或成本所限,主用 的电路模块和备用的电路模块并不是完全独立的,有些设备会采用主备模块 共用一组串行总线的设计方案。如图l所示。串行总线用于系统内主备模块 与其他各模块之间进行通信。在正常工作时,系统打开主用模块的各输出信 号的输出,而关闭备用模块的输出信号的输出,从而主用模块和其他模块间 通过串行总线正常传送数据,而不会引起总线沖突。但主备模块不能同时工 作,否则就会造成总线冲突。标准的串行总线通信方式有很多,比如RS-232总线,PC总线等,均 可实现设备内各模块间通信的要求。但对于某些设备对总线传输的速率要求 较高,或者不便于处理这些标准串行总线较复杂协议的情况,则需要较好的 方法来满足设备内部模块间通信的要求。对于主要模块或总线出现故障,需 要系统具有快速响应能力,避免设备因总线上的错误数据而发生误动作,目 前判别总线故障的方法大都实现复杂、不够灵活。发明内容本发明所要解决的技术问题是提供一种单总线主备保护设备的串行总 线故障检测方法,简单、灵活、高效的实现对总线的故障检测。为了解决上述技术问题,本发明提供了一种单总线主备保护设备串行总 线故障检测方法,所述总线传输的数据帧中包括一故障指示字节,所述方法包括以下步骤(a)系统接收由主用模块或备用模块发送到总线上的数据帧,判断所 述数据帧中的故障指示字节与预先设定的值是否相同,如果是,执行步骤 (b),否则,执行步骤(c);(b )对接收到的数据进行正常处理;(c)丟弃所述数据帧,上报总线故障告警,返回步骤(a)。进一步地,上述方法还可具有以下特点在所迷步骤(b)中进一步包 括,继续接收总线上的数据帧,判断每一数据帧中的故障指示字节是否与预 先设定的值是否相同,如果是,则对接收到的数据进行正常处理,否则,执 行步骤(c)。进一步地,上述方法还可具有以下特点由系统其他模块接收总线数据 帧,并对接收到的数据进行判断和处理。进一步地,上述方法还可具有以下特点在所述步骤(c)中,系统接 收到总线故障告警后,启动主备模块倒换。进一步地,上述方法还可具有以下特点在所述步骤(b)中,在对接 收到的数据进行正常处理的同时,消除总线故障告警。进一步地,上述方法还可具有以下特点所述数据帧字节总数目《主备 强制倒换总时间x串行总线速率/8。进一步地,上述方法还可具有以下特点依据串行总线的各物理信号线 上传送的相邻比特互不相同的原则,预设所述故障指示字节数值。进一步地,上述方法还可具有以下特点所述故障指示字节的位置固定不变。进一步地,上述方法还可具有以下特点所述方法应用于光传输设备, 所述主备模块为交叉板。进一步地,上述方法还可具有以下特点所述其他模块为各光线路处理 板及各支路处理板之一。对于采用主备热备份保护且主备模块共用 一组总线的设备,本发明提供 了一种筒单、快速检测主要模块故障或总线故障的方法,根据系统的需要自 定义帧结构,设置故障指示字节、业务数据的位置等,可提高系统对设备出 现故障的快速响应能力,并避免设备因总线上传送的错误数据而发生误动作的情况。


图1为本实施例单总线主备热备份系统工作示意图; 图2为本实施例单总线帧结构示意图; 图3为本实施例串行总线故障检测字节处理流程图; 图4为一款传输i殳备内部各单板信号连接示意图。
具体实施方式
定义帧结构,添加适当的开销字节,从而灵活的满足设备内部模块间通信的 要求。串行总线数据的帧结构如图2所示,在帧结构中,添加一个位置和数值
均固定不变的字节,当然也可利用已有的帧头字节或其他位置和彰:值均固定 不变的字节,定义为总线故障指示字节,通过检测该字节的值是否正确从而 判定总线是否工作正常。故障指示字节不限于图2所示位置,可设置在帧结 构的任意时隙处。帧结构中的字节总数目受到设备发生强制倒换的总时间长度的限制。这 是因为,若设备发生主备强制倒换的总时间小于串行总线传送一帧所需要的 时间,就有可能产生总线故障指示字节检测不到总线故障的隐患。帧结构字 节总数目的选择条件为帧结构字节总数目《主备强制倒换总时间x串行总线速率/8注串行总线速率的单位为bit/s。在总线的发送侧,主用模块在总线的故障指示字节时隙处发送某一固定 数值,例如值为"A5H"或"5AH";在总线的接收側,下游模块接收总线 上的数据,并对接收到的总线故障指示字节进行检测,如果接收到的值是"A5H"或"5AH,,,则认为总线正常,把已接收到的数据进行正常处理; 如果主用模块发生故障,系统启动主备倒换时,在关断主用设备输出后,备 用设备的正常工作之前,或当串行总线出现物理故障,比如短路、断路时, 串行总线上一根或全部信号线的电平状态就是随机的,或者固定为0或1。 当下游模块检测到总线上的故障指示字节的数值与设定值不 一致,就会识别 出串行总线出现故障,从而上报告警,丟弃从总线上所接收到的数据。在主备倒换期间,由于关断了主要模块串行总线的输出,各串行总线的 信号线上的电平值是随机的,且各信号线的电平由于噪声干扰等因素的影 响,还有可能会发生变化。针对这种情况,最好的解决办法就是优化电路设 计,保证串行总线各信号线在无输出驱动的情况下其电平值是稳定不变的, 比如对各信号线进行上拉或下拉;对于难以实现串行总线在无输出时其电平 值的确定性的情况,可通过适当的设置故障指示字节的数值,以降低漏判的 概率当只使用1根信号线(或1组差分线)作为串行总线时,在主备倒换期 间,或总线出现物理故障时,信号线的电平状态尽管是随机的且可能会发生 变化,但根据数字电路的相关知识可知,其电平值的变化是比较緩慢的,而 串行总线的速率一般都在Kb/s级别以上。因此可设置故障指示字节中的相 邻比特互不相同,比如设置故障指示字节16进制值为"55H" 、 "AAH", 从而显著降低漏判的概率;当使用两根或多根信号线(两组或多组差分线)作为串行总线时,同理 可依据各信号线上传送的相邻比特互不相同的原则,设置相应的故障指示字 节数值。当下游模块接收到总线上的故障指示字节与设定值不相符合时,就会上 报告警,丢弃所接收到的数据,并继续检测、比对每一帧的故障指示字节。 只有当连续两帧接收到的故障指示字节是正确的情况下,才会认为总线上的 数据是有效的。这是因为,当主备切换或总线故障在第一帧的总线故障指示 字节时隙之后,第二帧的故障指示字节时隙之前这段时间内恢复正常时,就 有可能出现虽然第二帧故障指示字节是正确的,但对于第二帧故障指示字节 之前所接收到的数据的正确性无法保证。对于总线故障指示字节的检测和处 理,可采用软件或可编程逻辑予以实现。本实施例串行总线故障检测和处理流程如图3所示,包括以下步骤步骤110,系统接收总线上来自主用模块或备用模块的数据帧;步骤120,判断接收到的数据帧中的故障指示字节与预先设定的值是否 相同,如果是,执行步骤140,否则,执行下一步;可以由系统其他模块/单元对数据帧进行接收、判断及处理,防止由于 主备模块故障或者都在使用而造成误操作。步骤130,丢弃从总线上接收的数据,并上报总线故障告警,返回步骤110;步骤140,继续接收数据帧,判断其中的故障指示字节是否与预先设定 的值相同,如果是,执行步骤150,否则,上报总线故障告警,返回步骤110;系统接收总线故障告警后,可根据告警启动主备模块倒换。 如果连续两帧检测到故障指示字节与预先设定的值相同,则对接收到的 数据进行正常处理,消除总线故障告警。步 110继续接收数据帧。当系统串行总线上传送关键数据时,可根据故障指示字节是否正确来判 定关键数据是否可用,从而避免设备发生误动作。以一款光传输设备为例说明,各单元单板间的联系如图4所示(图中仅 画出主用交叉板,备用交叉板各业务信号连接关系与主用交叉板完全相同)。 交叉板与各光线路处理板、各支路处理板是以AU-4单元为单位进行处理。 交叉板主要完成对各线路处理板、各支路处理板上送入的AU-4数据进行交 叉、交换的功能。由于这款设备为小型化设备,因条件所限只能主用交叉板、备用交叉板 共用两组总线(交叉板收、发方向各一组)。交叉单板与各光线路处理单板、 各支路处理单板之间的AU-4数据通过背板总线相连。信号线上传输的速率 为155.520Mb/s,每帧可传送的字节数目为2430( 9行x 270列)。由于AU-4 每帧只有2358个字节(9行x261列+9个八11指针字节),因此总线上空 余的时隙可用于交叉板与光线路处理板、支路处理板进行通讯用。在本方案 中,Kl、 K2开销字节是通过空余的时隙进行传送的Kl、 K2字节是SDH帧结构中规定的开销字节,用于SDH光网络上提 供自动保护倒换功能,Kl、 K2是由主用交叉板或者备用交叉板通过串行 总线发送到其他业务单板(光线路处理板)上的,业务单板把从总线上接收 到的K1、 K2字节插入标准的STM-l/4/16/64帧中对应的开销字节处,然后 发送到其他通信设备上。进行强制主备保护的过程是当拔除主用交叉板或者系统检测到主用交 叉板出现故障时,首先关断主用交叉板上驱动总线的芯片,使背板上的总线 为高阻,然后打开备用交叉板与总线相连的驱动芯片,从而使数据通过备用 交叉板来传输。在关断主用交叉板的驱动芯片,备用交叉板的驱动芯片还没 有开始工作期间内,总线上的数据没有输出,总线上的数值为随机值。由于在光线路处理单板的发送侧,通过总线接收来自交叉板的AU-4数 据以及K1、 K2字节。光线路处理单板对接收到的AU-4数据进行复用,然
后把接收到K1、 K2字节连同其他开销字节插入相应的时隙,转化为标准的 STM-1/4/16信号送出。在主、备交叉板强制切换期间,光线路处理板从总 线上提取的K1、 K2字节就不正确,如果插入到对应的开销位置再送入下游 设备时,就有可能导致下游设备根据错误的K1、 K2字节发生复用段倒换, 影响传输网络的正常运行。为了消除上述故障,我们采取的措施是由于交叉单板与其他单板进行 通讯的数据帧中总字节数目为2430个字节,而业务数据只占用了 2358个字 节,则其余字节可根据系统需要来应用。我们把数据帧中的首字节定义为故 障指示字节,其十六进制值为55H。 Kl、 K2字节也放在其他字节处。设备 运行时,各线路处理单板检测由交叉单板发送到总线上每一帧的帧头字节 (故障指示字节)数值是否正确,并由此判别串行总线上的数据是否可用。 当检测到故障指示字节与预设值相同时,线路处理单板对接收到的AU-4业 务数据、Kl、 K2字节及其他字节正常处理;当^r测到故障指示字节与预设 值55H不相同时,丟弃当前总线上所接收到的数据帧,并上冲艮总线故障告 警。当检测到总线出现故障时,光线路处理板不再采用从总线上接收到的 Kl、 K2字节内容,而是仍保持原来的K1、 K2字节内容不变,这样就避免 了插拔主用交叉单板或总线出现故障时导致下游设备触发错误的保护倒换 动作。帧头字节数值的检测、总线故障告警上报、Kl、 K2字节值的选择功 能是通过FPGA (现场可编程逻辑)进行处理的。
权利要求
1、 一种单总线主备保护设备串行总线故障检测方法,所述总线传输的数据帧中包括一故障指示字节,所述方法包括以下步骤(a)系统接收由主用模块或备用模块发送到总线上的数据帧,判断所 述数据帧中的故障指示字节与预先设定的值是否相同,如果是,执行步骤 (b),否则,执行步骤(c);(b )对接收到的数据进行正常处理;(c)丢弃所述数据帧,上报总线故障告警,返回步骤(a)。
2、如权利要求1所述的方法, 步包括,继续接收总线上的数据帧, 与预先设定的值是否相同,如果是, 执行步骤(c)。其特征在于,在所述步骤(b)中进一 判断每一数据帧中的故障指示字节是否 则对接收到的数据进行正常处理,否贝1],
3、 如权利要求1所述的方法,其特征在于,由系统其他模块接收总线 数据帧,并对接收到的数据进行判断和处理。
4、 如权利要求1或2所述的方法,其特征在于,在所述步骤(c)中, 系统接收到总线故障告警后,启动主备模块倒换。
5、 如权利要求1或2所述的方法,其特征在于,在所述步骤(b)中, 在对接收到的数据进行正常处理的同时,消除总线故障告警。
6、 如权利要求l所述的方法,其特征在于,所述数据帧字节总数目《 主备强制倒换总时间x串行总线速率/8。
7、 如权利要求l所述的方法,其特征在于,依据串行总线的各物理信 号线上传送的相邻比特互不相同的原则,预设所述故障指示字节数值。
8、 如权利要求l所述的方法,其特征在于,所述故障指示字节的位置 固定不变。
9、 如权利要求l所述的方法,其特征在于,所述方法应用于光传输设 备,所述主备模块为交叉板。
10、如权利要求3所述的方法,其特征在于,所述其他模块为各光线路 处理板及各支路处理板之一。
全文摘要
本发明公开了一种单总线主备保护设备串行总线故障检测方法,简单、灵活、高效的实现对总线的故障检测,所述总线传输的数据帧中包括一故障指示字节,所述方法包括以下步骤(a)系统接收由主用模块或备用模块发送到总线上的数据帧,判断所述数据帧中的故障指示字节与预先设定的值是否相同,如果是,执行步骤(b),否则,执行步骤(c);(b)对接收到的数据进行正常处理;(c)丢弃所述数据帧,上报总线故障告警,启动主备模块倒换,返回步骤(a)。
文档编号H04L12/24GK101145942SQ20071000020
公开日2008年3月19日 申请日期2007年1月4日 优先权日2007年1月4日
发明者石鸿斌, 闫树军 申请人:中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1