通讯系统备份方法和设备的制作方法

文档序号:70940阅读:256来源:国知局
专利名称:通讯系统备份方法和设备的制作方法
技术领域
本发明涉及计算机通讯技术,具体地说,涉及实现电信行业高可靠性局域网通讯链路冗余备份的一种通讯系统备份方法和设备。
背景技术
从可靠性来看,网络的通讯链路备份是提高网络可靠性、降低网络失效率的方法之一。通讯备份的思想是针对网络通讯的链路提供冗余的线路和设备,以确保网络通讯的正常进行。除了通讯链路备份,还有路径冗余、设备冗余等。这些方面的设计已经有许多方法实现。如《计算机工程与应用》杂志上的论文“容错冗余网络适配器的实现”(1999,11,105-107页)提出了一种冗余网络适配器的实现方法,《舰船电子工程》的“一种高可用容错服务器的设计”(1998,1,30-37)以及以下专利文献也提出一些类似的解决方案。
中国发明专利公开CN1136250A“在严格实时条件下容错通讯方法”提出一种总线冗余备份方式,它主要是通过对通讯链路的备份实现对局域网的链路备份。但该方式通过专用的CPU通讯控制器来实现主备链路的控制,增加了系统的额外开销,同时该系统不能提供从客户端到服务器通讯的全备份。中国发明专利公开CN1192094A“可扩展电信系统冗余度、交换容量扩展和故障隔离设备”提出一种对电信交换系统的备份方法,但没有涉及对其维护系统的备份,对于要求实现无人值守的客户端的备份也没有提出解决方案。专利号为05227330A、名称为“通信线路的备份”(BACKUP SYSTEM FORCOMMUNICATION LINE)的美国专利提出了一种针对通讯线的备份方式,也没有提出针对整个系统的解决方法。
以上现有技术的方法都只是对路径冗余或服务器设备冗余或通讯设备本身的冗余中的一种提出解决方法。另外,现实中,有时客户端也需要具备高可靠性,具体地说,在通讯故障发生时,希望迅速检测到故障并自动切换,从而实现无人值守。这样就要求整个系统都具备高可靠性。目前尚没有发现有文献对这一实现提出一个可行的可靠的解决方案。

发明内容
本发明的目的在于提出一种通讯系统备份方法和设备,利用这种方法和设备,可以克服现有技术存在的冗余备份死角,针对高可靠性实时系统的通讯链路备份系统,提出一种解决方案,能够实现软件侦测倒换,服务器、客户端及通讯链路的实时的全备份,当三者中任一个出现故障时均可快速恢复系统功能,从而使备份的可靠性达到进一步提高。
本发明的目的是这样实现的,构造一种高可靠性的通讯系统备份方法,包括以下步骤由主用服务器的第一网络检测模块检测是否曾经与主用客户机建立连接,如是则设置第一超时T1较小,即T1=2.5*T,否则设置第一超时T1较大,即T1=20*T;如果经过当前第一超时T1,主用服务器还不能与主用客户机建立连接,则进行服务器主备份切换;在第二超时T2时间内,其中T2=2.5*T,由备份服务器中的第二服务器主备状态检测模块检测是否与主用服务器建立“心跳”连接,如果未能建立连接则进行服务器主备份切换;由主用客户机的第五网络检测模块检测是否曾经与主用服务器建立连接,如未建立连接则设置第三超时T3较大,即T3=20*T,否则设置第三超时T3较小,即T3=2*T<T1;如果经过当前第三超时T3不能与主用服务器建立连接,则进行客户机主备份切换;在较小第四超时T4时间内,其中T4=2*T,由备份客户机中的第二客户端主备状态检测模块检测是否与主用客户机建立“心跳”连接,如果未能建立则进行客户机主备份切换;无论备份服务器还是备份客户机,只要检测到主用服务器或者主用客户机主动要求主备切换,则将建立连接标志置为“未曾连接”标记;其中,T=20s。
本发明的另一目的是这样实现的,构造一种通信系统备份设备,包括主用客户机和备份客户机,分别通过网络适配器接到集线器和备份集线器上,还包括主用服务器和备份服务器,所述服务器及备份服务器上分别有两个网络适配器,分别通过各个连线连接到集线器和备份集线器上,所述主备份客户机之间有双向通信链路,所述服务器和所述备份服务器分别连接到一个共享数据库共享数据库是一个磁盘阵列柜,具备磁盘的冗余能力,两个集线器构成双备份,两台客户机构成对客户机的双备份,两个服务器构成双备份,同时网络连线、服务器的网络适配器也是双备份的,整个系统都构成了一个全备份的架构。
本发明提供的设备,其中所述主用服务器中包括服务器主机管理模块、第一服务器主备状态检测模块、第一网络检测模块和第二网络检测模块,在所述备份服务器中包括服务器备份机管理模块、第二服务器主备状态检测模块、第三网络检测模块和第四网络检测模块,其中,所述第一网络检测模块、第三网络检测模块用于检测主用服务器、备份服务器与主用客户机的连接,所述第二网络检测模块、第四网络检测模块分别用于检测主用服务器、备份服务器与备份客户机的连接,所述主机管理模块通过所述第一服务器主备状态检测模块指示第一或第二网络检测模块进行链路连接检测;所述服务器备份机管理模块通过所述第二服务器主备状态检测模块指示第三或第四网络检测模块进行链路连接检测。其中,在主用客户机中有客户端服务器管理模块、第一客户端主备状态检测模块以及第五网络检测模块,在备份客户机中有备份客户服务器管理模块、第二客户端主备状态检测模块以及第六网络检测模块。
实施本发明提供的高可靠性通讯系统备份方法和设备,首先,能够通过软件方式及时发现链路或系统故障,并可定位故障发起源,并做出判断,其故障判断机制是通过驻留在服务器与客户端的监测程序判断系统通讯故障来实现的。其次,本发明的方法和设备,可以实现从客户端到服务器的全备份通讯链路。保证了系统的完全的备份。最后,利用本发明的方法和设备,在通讯系统出现故障时能迅速恢复正常状态,根据设计在系统故障发生后,系统一般可以在1分钟以内恢复运行,从而满足目前电信行业对通信设备的高可靠性的要求。



结合附图和实施例,进一步说明本发明的特点。附图中
图1是本发明提供的备份设备的硬件实现连接图。
图2是基于图1硬件实现本发明方法的软件实现模块图。
图3是本发明系统中服务器上双网卡驱动程序设计框架。
图4是第一网路断处理流程。
图5是服务器崩溃处理流程图。
图6是客户机崩溃处理流程图。
图7是服务器两条网络线均出现故障的处理流程图。
具体实施方式
在图1示出的实现本发明方法的硬件实现结构示意图中,设置有客户机101和备份客户机102,它们分别通过网络适配器103、104接到集线器105和备份集线器106上。同样,主用服务器107及备份服务器108上分别有两个网络适配器109、110和111、112,也分别通过网络接到集线器105和备份集线器106上。这两个集线器分别构成两个网络并互为备份。此处,两个网络互不相干,相互独立。且对应的网卡适配器的IP的网段是相同的。但主用服务器107和备份服务器108共享一个数据库113。图中的虚线114、115、116、117、118、119表示连接消息通路,其中虚线114表示主用服务器与主用客户机的消息通路;虚线115表示主用服务器与备份服务器的第一握手消息通路;虚线116表示主用服务器与备份客户机的消息通路;虚线117表示备份服务器与主用客户机的消息通路;虚线118表示主用服务器与备份服务器的第二握手消息通路;虚线119表示备份服务器与备份客户机的消息通路,双向信号线120表示主备份客户机之间的通信双链路。
在图2示出的本发明方法的软件实现框图中,在主用服务器107中包括服务器主机管理模块201、服务器主备状态检测模块202、第一网络检测模块203和第二网络检测模块204,在备份服务器108中包括服务器备份机管理模块205、服务器主备状态检测模块206、第一网络检测模块207和第二网络检测模块208,在客户机101中有客户端服务器管理模块209、客户端主备状态检测模块210以及网络检测模块211,在客户机102中有客户端服务器管理模块212、客户端主备状态检测模块213以及网络检测模块214。图2中还示出,主用服务器107、备份服务器108分别有线连接到主用集线器105、备用集线器106,而主用集线器105连接到主用客户机101,备用集线器106连接到备用客户机102。
结合以上设备组织的说明,进一步说明本发明的通信系统的备份方法。此处,主用服务器107软件通过网络TCP/IP与主用客户机101实现程序相互收发测试帧,注意在TCP/IP连接实现上,主用服务器107的网络模块是主动进行网络连接,主用客户机101的网络模块是建立连接端口等待连接。起初,备份客户机102与备份服务器108都是不工作的即不提供应用服务的,但随时通过主备状态检测模块213检测主机的运行状态。主用客户机101和备份客户机102通过通用的通讯链路120进行连接,如通过两个串口,建立双串口链路连接。服务器端通过线114、线116、主用集线器105、线115、线116、备用集线器106建立两个通讯链路连接(也可以采用双串口进行连接)。
主用服务器107端通过网络检测模块203和204检测与客户机的连接。每个服务器上都有两个检测模块,如203、204和207、208。备份服务器上的网络检测模块207和208不工作。主用客户机和备份客户机分别有一个网络检测模块211和214,用于检测与服务器的连接,备份客户机上的检测模块214不工作。
服务器主机管理模块201对两个网络检测模块203、204和服务器主备状态检测模块202进行综合管理。根据以下判据来决定是否进行主备份切换、告警等,其中的时间设置,及参数可以根据实际需要进行改动。下列数字只是举例说明。(所涉及的T,T1,T2,T3,T4适用下面所有的图例),下面,设置基本时间T=20s,备份机从开始切换至切换完成时间<0.2*T,则根据以下判据进行主备份切换如果主用服务器的网络检测模块尚未与客户机建立连接设置,那么超时设置为T1=20*T,一旦网络检测模块与客户机建立连接,那么设置超时为T1=2.5*T。如果经过T1不能与客户机建立连接,则进行切换。此时主机变成备机,备机变成主机。
备份服务器发现超过T2=2.5*T时间,主备状态检测模块无法与主用服务器建立“心跳”连接,则自动切换成主用服务器。
客户机网络检测模块尚未与服务器建立连接,设置超时为T3=20*T,否则T3=2*T<T1.如果经过T1不能与服务器建立连接,则进行切换。此时主机变成备机,备机变成主机。
备份客户机发现经过超时T4=2*T时间,主备状态检测模块无法与主用客户机建立“心跳”连接,则自动切换成主用客户机。
无论备份服务器还是备份客户机,只要检测到主用服务器或者主用客户机主动要求主备切换,则将曾经建立连接标志置为未曾连接的标记。
设置尚未连接超时时间相当大(20T)的原因在于防止主备份服务器,客户机来回反复切换。
在图3示出的服务器上双网卡驱动模块的结构中,双网卡驱动程序采用两个线程对两个网卡分别检测,网络接口通路状况检测模块对两个网卡进行管理。
图4在正常工作时,第一条网络通路114断,图中,出现的4个“X”表示故障点。其他的线路及备份机一切正常。
客户机经过T3时间后进行切换。切换时间为0.2*T,从链路断至切换完成备份客户机102切换,共2.2*T<T1,主用服务器107不会切换。在备份客户机102完成切换后,通过图2的网络检测模块204、网络检测模块214以及备用集线器106,使得主用服务器107与客户机重新建立连接,接管工作,同时告警。
在图5示出主用服务器出现死机(图5中用主用服务器方框中的“X”表示死机)的情况下,主用客户机101在T3时间后先将曾经与服务器连接标记置为尚未连接标记,然后自动切换至备份客户机,备份客户机102成为主机后进入20*T时间的等待状态。备份服务器108(图1)的服务器主备状态检测模块206(图2)在T2时间发现无法与主用服务器连接,则自动切换成为主用服务器,此时备份服务器108与备份客户机102通过图2中的网络检测模块208、网络检测模块214及备用集线器106,连线219和221重新建立连接。
在图6示出的主用客户机101出现死机(图中,用方框中的“X”表示死机)情况下,备份客户机102经过T4时间后进行切换。切换时间为0.2*T,从链路断至切换完成备份客户机切换,共2.2*T<T1,主用服务器107不会切换。在备份客户机完成切换后,通过图2的网络检测模块204、网络检测模块214、及备用集线器106、连线217和221,主用服务器107与备份客户机重新建立连接,接管工作,同时告警。
图7示出主用服务器107的两条网络线均出现故障的处理过程。如图7所示,主用客户机101如经过T3时间发现无法与主用服务器107建立连接后,先将曾经与主用服务器107连接标记置为“尚未连接”标记,然后自动切换至备份客户机102,备份用客户机102成为当前主用客户机后进入20*T时间的等待状态。如果服务器是通过两条网络建立状态的相互检测,那么随后备份服务器108的主备状态检测软件206在T2时间发现无法与主用服务器连接,(如果服务器是通过串口或其他通讯链路进行状态检测,在经过T1时间后发现无法与客户机连接主动通过串口通知备份服务器要求切换)则自动切换成为当前主用服务器,此时备份服务器108与备份客户机102通过图2中的网络检测模块208、网络检测模块214及备用集线器106,连线219和221重新建立连接。
从上可见,无论是一个网络通路发生故障(图4),还是主用服务器发生死机(图5),或者是主用客户机出现死机(图6)还是两个网络通路发生故障(图7),利用本发明提供的备份方法,均可方便快捷地实现主备份切换。
权利要求
1.一种通信系统备份方法,其特征在于,包括以下步骤,由主用服务器(107)的第一网络检测模块(203)检测是否曾经与主用客户机建立连接,如是则设置第一超时T1较小,即T1=2.5*T,否则设置第一超时T1较大,即T1=20*T;如果经过当前第一超时T1,主用服务器还不能与主用客户机建立连接,则进行服务器主备份切换;在第二超时T2时间内,其中T2=2.5*T,由备份服务器(108)中的第二服务器主备状态检测模块(206)检测是否与主用服务器建立“心跳”连接,如果未能建立连接则进行服务器主备份切换;由主用客户机(101)的第五网络检测模块(211)检测是否曾经与主用服务器建立连接,如未建立连接则设置第三超时T3较大,即T3=20*T,否则设置第三超时T3较小,即T3=2*T<T1;如果经过当前第三超时T3不能与主用服务器建立连接,则进行客户机主备份切换;在较小第四超时T4时间内,其中T4=2*T,由备份客户机(102)中的第二客户端主备状态检测模块(213)检测是否与主用客户机建立“心跳”连接,如果未能建立则进行客户机主备份切换;无论备份服务器还是备份客户机,只要检测到主用服务器或者主用客户机主动要求主备切换,则将建立连接标志置为“未曾连接”标记;其中,T=20s。
2.根据权利要求
1所述方法,其特征在于,所述第一超时T1较小值等于所述第二超时T2,所述第三超时T3较小值小于所述第一超时T1较小值,所述第三超时T3较大值等于所述第一超时T1较大值,所述第三超时T3较小值小于所述第一超时较小值,所述第三超时T3较小值远小于完成主备切换所需时间。
3.根据权利要求
1所述方法,其特征在于,所述第一超时T1较大值远大于所述第一超时T1较小值,所述第三超时T3较大值远大于所述第三超时T3较小值。
4.一种实现权利要求
1所述方法的备份设备,其特征在于,包括主用客户机(101)和备份客户机(102),分别通过网络适配器(103)、(104)接到集线器(105)和备份集线器(106)上,两个集线器构成双备份,两台客户机构成对客户机的双备份,还包括主用服务器(107)和备份服务器(108),所述主用服务器(107)及备份服务器(108)上分别有两个网络适配器(109)-(110)和(111)-(112),两个服务器构成双备份,同时服务器的网络适配器也是双备份的,所述主用服务器(107)上的两个网络适配器(109)-(110)分别通过连线(216)-(217)链接到集线器(105)和备份集线器(106)上,所述备份服务器(108)上的两个网络适配器(111)-(112)分别通过连线(218)-(219)链接到集线器(105)和备份集线器(106)上,所述主备份客户机之间有双向通信链路(120),网络连线都是双备份的,所述主用服务器(107)和所述备份服务器(108)分别连接到一个共享数据库(113),共享数据库是一个磁盘阵列柜,具备磁盘的冗余能力,整个系统都构成了一个全备份的架构。
5.根据权利要求
4所述设备,其特征在于,在所述主用服务器(107)中包括服务器主机管理模块(201)、第一服务器主备状态检测模块(202)、第一网络检测模块(203)和第二网络检测模块(204),在所述备份服务器(108)中包括服务器备份机管理模块(205)、第二服务器主备状态检测模块(206)、第三网络检测模块(207)、第四网络检测模块(208),其中,所述第一网络检测模块(203)、第三网络检测模块(207)用于检测主用服务器、备份服务器与主用客户机(101)的连接,所述第二网络检测模块(204)、第四网络检测模块(208)分别用于检测主用服务器、备份服务器与备份客户机(102)的连接,所述服务器主机管理模块(201)通过所述第一服务器主备状态检测模块(202)指示第一或第二网络检测模块进行链路连接检测;所述服务器备份机管理模块(205)通过所述第二服务器主备状态检测模块(206)指示第三或第四网络检测模块进行链路连接检测。
6.根据权利要求
4所述设备,其特征在于,在主用客户机(101)中有客户端服务器管理模块(209)、第一客户端主备状态检测模块(210)以及第五网络检测模块(211),在备份客户机(102)中有备份客户服务器管理模块(212)、第二客户端主备状态检测模块(213)以及第六网络检测模块(214)。
专利摘要
一种高可靠性通讯系统备份方法和设备,可通过软件方式及时发现链路或系统故障,并可定位故障发起源,并做出判断,其故障判断机制是通过驻留在服务器与客户端的监测程序判断系统通讯故障来实现的。可以实现从客户端到服务器的全备份通讯链路,保证了系统的完全的备份,在通讯系统出现故障时能迅速恢复正常状态,根据设计在系统故障发生后,系统一般可以在短时间内恢复运行,从而满足目前电信行业对通信设备的高可靠性的要求。
文档编号H04B1/74GKCN1198406SQ00125043
公开日2005年4月20日 申请日期2000年9月2日
发明者丁贵祥, 杜元光 申请人:中兴通讯股份有限公司导出引文BiBTeX, EndNote, RefMan
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1