交换机的主备倒换方法及其实现装置的制作方法

文档序号:7595033阅读:549来源:国知局
专利名称:交换机的主备倒换方法及其实现装置的制作方法
技术领域
本发明涉及一种通信技术,确切地说,涉及一种为提高ATM交换机可靠性而使用的主备倒换方法及其实现装置,属于电话自动交换局使用的设备技术领域。
在电信网络中使用的通信设备,必须具备长期运行的工作可靠性,这也是考核设备的一个极为重要的性能指标。使用单一某个设备,通常很难满足规定的可靠性要求。从提高可靠性的角度出发,对关键的核心设备进行冗余备份是提高其工作可靠性的重要手段。通常进行冗余备份时,备份设备的种类与数量越多,则该系统的可靠性越高,但是所花费的代价也越大,所以从整个系统角度出发,要达到最佳性价比,综合各方面的考虑,通常只对关键的设备作1+1的冗余备分。
从整个系统考虑,主备技术主要有冷备份与热备份两种。冷备份的特点是在主用部分工作时,备用部分不工作,处于休眠状态;当主用设备部分出现故障时,备用设备部分才开始工作。其优点是技术简单,成本较低;缺点是由主到备的过渡时间过长,而且由主到备的切换会影响原有的通路。热备份的特点是主用部分与备用部分保持同步运行,只是备用部分不进行输出而已;在主用部分出现故障时,只要关闭其输出,同时打开备用部分的输出即可。其优点是过渡平滑,不影响原有通路,可靠性高;缺点是技术复杂,成本相对要高些。目前使用的主备倒换的实现技术可以分为中央控制式、主备相互监测与控制式、主备各自监测与相互控制式等多种方式。但是,采用上述各种主备倒换的技术进行设计的试验结果,发现都不同程度地存在着一些可靠性问题,当出现意外干扰或某些特殊情况时,就会出现控制失误,并且不能自行纠正。ATM交换机作为宽带数据交换机,其工作的可靠性极为重要,所以,如何对ATM交换机实现冗余备份,成为人们关心的一个课题。
本发明的目的是提供一种用于ATM交换机的主备倒换方法及其实现装置,采用本发明的方法,当其中任何一板出现故障时,均能迅速、安全可靠地切换到备用板上,保证交换机的正常运行,并能通过网管及时上报故障信息;而且,在保障交换机完成各项功能的同时,其硬件结构设计简单,构思巧妙,降低了系统成本,工作可靠性高。
本发明的另一目的是提供一种用于各种电话交换机的主备倒换方法及其实现装置。
本发明的主备倒换方法是这样实现的对交换机的主控板及交换网板进行1+1的冗余备分;其中主控板的主备两板之间保持实时通信,在备板上也保持一份与主板上同样的数据作为备份,实现热备份;主控板的切换是采用主备相互监测与控制的方式主控板的主备两板均发出各自的“心跳”信号,并同时监视对方的“心跳”信号,当一方出现故障时,另一方则将根据自己的状态(是主板还是备板?)决定是否进行切换,并上报网管当主用板发现在某段时间内备用板的心跳没有了,便认为备用板出现故障,通知网管处理;当备用板发现某段时间内主用板的心跳没有了,便认为主用板出现故障,并启动主备切换,将自己升为主板,同时禁用出故障的原主板;其中交换网板的主备两板处于同步运行状态,通常备用交换网板的数据不输出,一旦主用交换网板出现问题时,则由备用交换网板接替工作,从而实现热备份;交换网板是由主控板进行监测与切换控制的主控板实时对交换网板的状态寄存器进行轮询,一旦发现主用交换网板有问题,则进行切换,并上报网管;主控板和交换网板在各项操作执行后都要进行检查,防止因干扰或其它故障引起的失控,并根据检测的结果决定下一步的操作。
上述“心跳”信号是为反映电路板是否处于正常工作状态而专门设计的一个以适中频率输出的脉冲信号。
上述“心跳”信号可以采用由软件控制向硬件的特定寄存器里写入数据而得到的脉冲信号。
上述用来监测特定的“心跳”脉冲是否在预定的时间间隔内出现的装置,在预定的时间间隔内没有收到CPU发送过来的脉冲,就对CPU进行复位,以避免CPU装置长期处于故障状态。
本发明的主备倒换装置是这样实现的在交换机的背板的两个相邻槽位上插装有两块相同的、用于主备倒换的主控板,该两板之间的各个控制线通过背板互相连接;在每个主控板中都分别设有一个专门用于传递主用板和备用板之间数据的存储单元,即通信缓冲区(又称“邮箱”)、一个主备状态寄存器(M/S Status Reg)和用来监测特定的“心跳”脉冲信号是否在预定的时间间隔内出现的装置(俗称为硬件狗);还设有三对用于主备切换时的控制线表示本板处于开还是关的状态信号OE、关闭对方(主用板)的控制信号(DisableOE)、复位对方主控板的控制信号。
上述通信缓冲区(即“邮箱”)可以采用一个双端口静态随机存储器SRAM实现之;工作时,只使用备用主控板中的“邮箱”,主用主控板则通过远端访问与该“邮箱”通信,通过定时检查“邮箱”的中断信号,可以判断对方主控板是不是工作正常。
上述“邮箱”通信的中断信号、主控板的主备两板之间互相监视的“心跳”信号,以及主控板的复位电路的“喂狗”信号复合为一个信号,从而简化设计,提高系统工作的可靠性。
上述主备状态寄存器M/S Status Reg用于保存本板所处的槽位信息、本板处于开还是关的OE状态信号以及对方主控板处于开还是关的的OE状态信号,系统启动时根据上述状态信号来完成主备竞争本发明的特点是对ATM交换机上的主控板与交换网板采用热备份技术,提高了系统切换的稳定性,可保持交换机的长期稳定工作。为了保证工作无误,对关闭主用板的信号不仅要进行滤波,还对其进行严格的条件限制,以提高主备系统抗干扰的能力。在各项操作执行后均进行检查,并根据检测的结果决定下一步的操作,防止了因干扰或其它故障引起的失控,大大提高系统主备倒换的可靠性。对交换网板的切换还考虑了器件的延迟时间,以便消除和器件的信号冲突,提高系统稳定性。采用本发明的方案,对于热拔插的各种组合状态和各种死机状态,均能安全可靠地进行倒换,不会死锁在错误的状态。此外,本发明将通信用的中断信号、“心跳”信号和系统的单板复位电路的“喂狗”信号结合在一起,在顺利完成各项功能的同时,简化系统设计,降低了系统成本。在软件上,对主备竞争、心跳机制和数据备份等均进行了创新设计。
下面结合附图和实施例对本发明的实现方法和装置作具体的说明

图1是本发明的硬件系统的结构示意图。
图2是本发明的软件处理过程的示意图。
图3是本发明的主控板上电启动过程的示意图。
图4是本发明的主控板实现主备切换过程的流程示意图。
参见图1所示,图中列出了本发明是在交换机的背板的两个相邻槽位上插装有两块相同的、用于主备倒换的主用主控板1和备用主控板2,该两个主控板1、2之间的主要连线也是通过背板互相连接的;其中包括有三对用于主备切换时使用的控制线表示本板处于开启还是关闭的状态信号OE(输出使能)、关闭对方(主用板)的控制信号Disable OE(禁止输出使能)和复位对方主控板的控制信号。在每个主控板1、2中都分别设有一个专门用于传递主用板和备用板之间数据的存储单元,即通信缓冲区11、21(又称“邮箱”,如图中所示)、一个主备状态寄存器12、22(M/S Status Reg)和用来监测特定的“心跳”脉冲信号是否在预定的时间间隔内出现的装置(俗称为硬件狗,图中未示)。上述通信缓冲区11、21(即“邮箱”)可以采用一个双端口静态随机存储器SRAM实现之;工作时,只使用备用主控板中的“邮箱”,主用主控板则通过远端访问与备用主控板中的“邮箱”通信。当主用主控板将数据送到远端邮箱时,通过中断通知备用主控板,备用主控板再从邮箱中读取数据,不需要定时查询邮箱。同时,该“邮箱”中断信号可以复用作为该主控板的心跳信号,通过定时检查邮箱的中断信号,可以判断对方主控板是不是工作正常。上述主备状态寄存器M/S Status Reg用于保存本板所处的槽位、本板的板选OE状态以及对方主控板的OE状态等信息,系统启动时则根据这些信号完成主备竞争的判断。
两个主控板之间的相互控制是通过Disable OE信号来进行的。而且,只有备用板能够对主用板的OE状态信号进行关闭操作;同时,备用板能够打开进入工作的前提是主板的OE信号必须已经关闭。本发明通过在可编程逻辑中设计的互锁逻辑实现对两个主控板OE的控制,并对输入信号进行滤波,从而将由意外干扰可能造成的误操作降到最低。两个主备板相互之间的数据通信及心跳监测是通过设在备板上的邮箱来进行,主板上的邮箱不使用。
由于“心跳”信号是在给定时间内出现的脉冲,而“邮箱”的中断信号在正常情况下,也会在一定时间内出现,且其出现与否能很好地反映主控板是否处于正常工作状态,故可以充当心跳信号使用。将“邮箱”的通信中断信号兼做心跳信号可以简化主备倒换的技术实现和软件操作。本发明中采用心跳信号、邮箱通信的中断信号与喂狗信号三者相结合,既简化了技术实现,又提高了主备倒换的可靠性。当主用主控板1将数据送到远端“邮箱”时,通过中断通知备用主控板2,备用主控板2再从邮箱中读取数据,不需要定时查询邮箱。同时邮箱中断信号可以复用作为心跳信号,通过定时检查邮箱的中断,可以判断对方主控板1是不是工作正常。
本发明进行主备倒换的工作原理简述如下当ATM交换机正常工作时,主备两个主控板1、2都发出各自的心跳信号并同时监视对方的心跳信号。当主用板1发现某段时间内备用板2的心跳没有了,便认为备用板2已经出现故障,就及时通知网管处理;当备用板2发现某段时间内主用板1的心跳没有了,便认为主用板1已经出现故障,于是启动主备切换,将自己升为主板,同时把故障的原主用板1禁止使用。这里,有三个重要的概念需要介绍1)心跳信号即专门为反映电路板是否处于正常工作状态而设计的一个以适中频率输出的脉冲信号。本发明是采用由软件控制向硬件的特定寄存器写入数据而得到的脉冲。其具体的软件控制可参看后面介绍。
2)邮箱亦即通信缓冲区,是为传递主用板和备用板之间的数据而设立的一种存储单元,本发明采用的是一个双端口静态随机读写存储器SRAM。
3)硬件狗用来监测特定的脉冲是否在预定的时间间隔内出现的装置。一般应用于CPU的硬件技术中。当硬件狗在预定的时间间隔内没有收到CPU发送过来的脉冲,则对CPU进行复位,可以避免CPU装置长期处于故障状态。该硬件狗技术在许多产品中应用,并经过长期验证,是一种简单而可靠的技术。
本发明的硬件提供通信通道与环境,其数据备份与主备倒换的具体操作则由软件执行。
本发明软件的具体流程与实现方式参见图2和图3所示。
首先参见图2在软件上,整个系统先经历启动时的主备竞争判断,然后进入相互之间的心跳监听阶段。在监听阶段,任何一板出现问题均会被检测到,如是主用板出现故障,则系统进入主备切换过程。在故障板的故障被排除,并重新装入后,系统又进入到相互监听阶段。
参见图3所示的主控板上电启动过程的流程框图,系统一开始上电初始化时,并不打开板OE,系统中断也是关闭的;主备竞争完成后,如果本板为主用时,才在硬件初始化中开板OE、系统中断等;应用程序的数据加载是根据本板的主备状态来决定是否加载数据的。如果本板为备用,在最后备用板系统启动后会向主用板发送一个备用在线通知帧,主用板收到该帧后会做一些再同步的工作。再同步的主要目的是将主用板上的当前配置全部备份到刚刚上线的备用板,为了做到这一点,主用的备份板的任务是将每个备份数据的位表根据当前的配置全部重新设置,一次性备份给备用板。
数据备份的目的是保持主备两个主控板上所配置的数据具有高度一致性,这样一旦需要主备切换,备用板升为主用板后,就能保持系统的一致性和连续性,做到平滑切换。数据备份是由备份任务来完成实现的。备份任务有一个定时器定时(数秒一次)检查各个备份控制表的位表,如果某一个位置被置位了,就调用该备份控制表的数元获取函数,将要备份的数据收集起来,然后将这些数据连同备份控制表ID等打包成数据帧,写到位于备用板的远端邮箱,之后写邮箱中断通知备用板。备用板接受到邮箱中断,从邮箱中读取数据,根据随同传过来的控制表ID、位表索引、操作等调用数元设置函数将数据恢复到指定的位置。
为了保证主控板从邮箱读取的数据的可靠性,在发送方会将传送数据的循环冗余校验CRC码随同数据一起写入邮箱;接受方受到数据后,进行CRC验证,并将验证结果打包为验证帧回传给发送方;发送方受到回应帧,如果验证结果是错误的,则重传数据帧;如果是正确的,则继续下一次数据收集。
下面简单介绍一下数据备份的方案数据备份的高层软件部分采用增量式的位表方式和函数方式相结合的方法。其中大部分进程都采用增量式的位表方式备份数据,即当该进程的重要数据(将其视作一个数组)发生变化时,就将其索引值记录在一张位表上,到时根据位表决定哪些数据应该备份。有些进程只需要备份一个较大的数据结构中的一部分域,这时就要用到函数方式的数据备份即由这些进程提供将该数据结构映射为较小结构的函数,以节省空间,加快备份速度。
底层通过邮箱方式进行通讯。采用邮箱方式,可大大提高传送的可靠性与速度,同时简化处理。在主板与备板上各设有一邮箱,平时主板将备份数据存放在备用板的邮箱中;备用板读取邮箱中的数据,并进行处理。
主备倒换很重要的一点是备用主控板是如何及时发现主用板的故障,本发明采用的机制是所谓的心跳监听工作的主控板在运行过程中,系统在向任何任务转发消息时,都会产生一次心跳,另一侧的备用主控板则每过一段时间检查心跳并计数,如果心跳数字没有增长,就认为主用板已经出现了故障,则启动主备切换将备用升为主用。为了防止系统长时间处于IDLE状态而导致在相当长时间里没有心跳,备份任务启动一个专用定时器,它每过一段时间超时会导致系统向备份任务转发一次消息,以此保证心跳的不间断。
主用主控板向备用主控板发送心跳信号是通过备份邮箱的中断来实现的,主用板写心跳信号实际上就是向备份邮箱写中断。为了将心跳中断与备份数据的中断区别开来,在邮箱数据区中保留了一个字节单元(WORD)存储中断标记—心跳中断及备份中断。备用主控板收到邮箱中断,首先根据中断标记判断该中断类型,如果是备份中断,则恢复备份数据,同时也将心跳计数加1;如果是心跳中断,则简单地将心跳计数加1。
备用主控板一旦发现主用主控板出现故障,就开始主备切换,其流程如图4所示。参见图4所示的主备切换流程图,当倒换开始后,首先判断备板是否可能切换,如备板不能切换,则将重启系统。如可以进行切换,则备用板将关闭出故障的主用板,并打开自己的输出。然后复位原主用板,同时将自己的状态置为主用板。系统切换后能不能正常、平滑地运行,与切换中各部分的平滑好坏关系极大,为了保证各种资源的分配情况符合实际,本发明的做法是先将动态资源清除,然后根据配置重新分配数据。各部分数据的平滑一般由各自的模块负责,几个主要的平滑函数分别是槽位信息平滑,硬件平滑,资源平滑,系统平滑。
为了防止意外的干扰信号串入主备倒换的控制信号,导致主用板被错误关闭,本发明不仅对备用板关主用板的控制信号进行了滤波,还对其进行严格的条件限制。只有满足严格条件的信号才能进行操作。此外,还对主用板与备用板采用互锁逻辑进行控制,任何时刻最多只能有一板处于开放状态。同时在软件中对两板操作后的状态进行判断,从而有效地避免了两板在主备竞争中可能出现的同时打开的非法状态,大大提高主备系统抗干扰的能力。
交换网板板的备份相对主控板板来说较为简单,其方法是交换网板板在主控板的控制下,任何时候只有一块板处于工作状态,另一块处于备用状态。主控板不断地轮询交换网板的工作状态寄存器,当监测到不正确的状态时,若是主用板则切换到备用板并告警;若是备用板,则告警。
本发明已经在申请人研制的ATM交换机上进行试验实施,取得了预期的发明目的,对于热拔插的各种组合状态和各种死机状态,该机都能够安全可靠地进行倒换,不会死锁在错误的状态,可以保证交换机的正常工作。
权利要求
1.一种用于交换机的主备倒换方法,其特征在于对交换机的主控板及交换网板进行1+1的冗余备分;其中主控板的主备两板之间保持实时通信,在备板上也保持一份与主板上同样的数据作为备份,实现热备份;主控板的切换是采用主备相互监测与控制的方式主控板的主备两板均发出各自的“心跳”信号,并同时监视对方的“心跳”信号,当一方出现故障时,另一方则将根据自己的状态(是主板还是备板?)决定是否进行切换,并上报网管当主用板发现在某段时间内备用板的心跳没有了,便认为备用板出现故障,通知网管处理;当备用板发现某段时间内主用板的心跳没有了,便认为主用板出现故障,并启动主备切换,将自己升为主板,同时禁用出故障的原主板;其中交换网板的主备两板处于同步运行状态,通常备用交换网板的数据不输出,一旦主用交换网板出现问题时则由备用交换网板接替工作,从而实现热备份;交换网板是由主控板进行监测与切换控制的主控板实时对交换网板的状态寄存器进行轮询,一旦发现主用交换网板有问题,则进行切换,并上报网管;主控板和交换网板在各项操作执行后都要进行检查,防止因干扰或其它故障引起的失控,并根据检测的结果决定下一步的操作。
2.如权利要求1所述的用于交换机的主备倒换方法,其特征在于上述“心跳”信号是为反映电路板是否处于正常工作状态而专门设计的一个以适中频率输出的脉冲信号。
3.如权利要求1所述的用于交换机的主备倒换方法,其特征在于上述“心跳”信号可以采用由软件控制向硬件的特定寄存器里写入数据而得到的脉冲信号。
4.如权利要求1所述的用于交换机的主备倒换方法,其特征在于上述用来监测特定的“心跳”脉冲是否在预定的时间间隔内出现的装置,在预定的时间间隔内没有收到CPU发送过来的脉冲,就对CPU进行复位,以避免了CPU装置长期处于故障状态。
5.一种用于交换机的实现主备倒换的装置,其特征在于在交换机的背板的两个相邻槽位上插装有两块相同的、用于主备倒换的主控板,该两板之间的各个控制线通过背板互相连接;在每个主控板中都分别设有一个专门用于传递主用板和备用板之间数据的存储单元,即通信缓冲区,即“邮箱”、一个主备状态寄存器M/S Status Reg用来监测特定的“心跳”脉冲信号是否在预定的时间间隔内出现的装置,即“硬件狗”;还设有三对用于主备切换时的控制线表示本板处于开还是关的状态信号OE、关闭对方主用板的控制信号Disable OE和复位对方主控板的控制信号。
6.如权利要求5所述的实现主备倒换的装置,其特征在于上述通信缓冲区,即“邮箱”,可以采用一个双端口静态随机存储器SRAM实现之;工作时,只使用备用主控板中的“邮箱”,主用主控板则通过远端访问与该“邮箱”通信,通过定时检查“邮箱”的中断信号,可以判断对方主控板是不是工作正常。
7.如权利要求5所述的实现主备倒换的装置,其特征在于上述“邮箱”通信的中断信号、主控板的主备两板之间互相监视的“心跳”信号,以及主控板的复位电路的“喂狗”信号复合为一个信号。
8.如权利要求5所述的实现主备倒换的装置,其特征在于上述主备状态寄存器M/S Status Reg用于保存本板所处的槽位信息、本板处于开还是关的OE状态信号以及对方主控板处于开还是关的的OE状态信号,系统启动时根据上述状态信号来完成主备竞争
全文摘要
一种用于交换机的主备倒换方法及其实现装置,是对其主控板及交换网板进行1+1的冗余备分;其中主控板的主备两板保持实时通信,在备板上保持一份与主板上同样的数据而实现热备份;主控板的切换是采用主备相互监测与控制的方式。交换网板的主备两板处于同步运行状态,一旦主用板出现问题时则由备用板接替工作而实现热备份。采用本发明方法,其中任何一板出现故障时,均能迅速、安全可靠地切换到备用板上,保证交换机的正常运行,并能通过网管及时上报故障信息。
文档编号H04B1/74GK1321004SQ0010611
公开日2001年11月7日 申请日期2000年4月25日 优先权日2000年4月25日
发明者涂尧, 乔明 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1