保证集群系统中配置信息一致的方法

文档序号:6557541阅读:305来源:国知局
专利名称:保证集群系统中配置信息一致的方法
技术领域
本发明涉及一种计算机集群技术,尤其是一种保证集群系统中配置信息一致的方法。
背景技术
集群(Cluster)技术就是在网络中将一组相互独立的服务器作为单一系统的模式进行管理,来实现高的可用性、可管理性和优越的可伸缩性,以实现服务的并行处理、负载均衡功能,以及系统的容错、容灾功能。集群是一种松散耦合的计算机节点集合,通过集群管理器(Cluster Administrator)一个图形化的管理员工具,通过它可执行维护、监视和故障转移管理,实现对群集实体(如节点、资源、资源组)和群集自身的管理。一个集群包含多台(至少两台)拥有共享数据存储空间的服务器,任何一台服务器运行一个应用时,应用数据被存储在共享的数据空间内,每台服务器的操作系统和应用程序文件存储在其各自的本地储存空间上,集群内各节点服务器通过一内部局域网相互通讯。当一台节点服务器发生故障时,这台服务器上所运行的应用程序将在另一节点服务器上被自动接管。当一个应用服务发生故障时,应用服务将被重新启动或被另一台服务器接管。图1所示为包含两台拥有共享数据存储空间的服务器的集群系统的组网结构示意图。主机与备机互相备份,通常情况下,由主机提供应用服务,当主机出现故障无法正常提供应用服务的时候,备机接管主机的工作,此称为active/standby(主动/备份)模式;应用程序的一部分进程运行在主机上,另一部分进程运行在备机上,当主机出现故障不能正常提供应用服务的时候,备机接管主机的工作,反之相同,此称为active/active(主动/主动)模式。
现有技术中,无论是在active/standby或active/active工作模式下,主机与备机均为一个单独的个体,所有的配置信息在每一台机器上都单独保存,因此存在以下缺陷与不足当A节点服务器上的配置信息被更新时,作为A节点服务器的备份的B节点服务器上的配置信息却不能被及时更新,无法保证配置信息的同步性与一致性,这样,当提供应用服务的A节点服务器出现故障时,B节点服务器因为配置信息的滞后无法正确接管A节点服务器上的服务,可靠性低,给用户带来损失。

发明内容
本发明所要解决的技术问题在于针对现有的集群系统存在的缺陷与不足,提供一种集群系统及保证集群系统中配置信息一致的方法,以保证集群系统中各节点服务器上的配置信息的同步性与一致性,提高机群系统的可靠性。
本发明的一种保证集群系统中配置信息一致的方法,执行以下步骤步骤1、集群资源备份管理模块(Watchman Cluster Server Back,WMCSB)对集群系统中各节点服务器的工作情况进行监测;步骤2、当节点服务器中的应用程序信息发生变化时,更新所述集群资源备份管理模块中存储的配置信息,更新该集群资源备份管理模块中的令牌信息,所述令牌信息用于标识配置信息的更新情况;步骤3、集群资源管理模块重新启动后,根据所述的令牌信息更新集群资源管理模块(Watchman Cluster Server,WMCS)或集群资源备份管理模块中的配置信息。
上述技术方案中,所述步骤1之前还执行以下操作在集群资源管理模块与集群资源备份管理模块中分别设置初始信息相同的令牌信息,该令牌信息包括令牌组标识信息与令牌更新信息。
所述步骤2中对令牌更新信息进行更新是对令牌号信息进行更新。
所述步骤3包括步骤301、集群资源管理模块重新启动后,与集群资源备份管理模块建立连接,并与该集群资源备份管理模块相互获取令牌信息;步骤302、所述集群资源管理模块与所述集群资源备份管理模块比较接收到的令牌信息中的令牌号是否与自己保存的令牌信息中的令牌号相等,若相等,执行步骤303;否则,执行步骤305;步骤303、向所述管理工具发出报警信息;步骤304、用户制订数据源并利用该数据源对所述集群资源管理模块与所述集群资源备份管理模块中的配置信息进行更新,然后执行步骤306;步骤305、根据预先设定的参数,由令牌号大的或者小的集群资源管理模块或集群资源备份管理模块对对方的配置信息进行更新;步骤306、结束。
其中,在步骤301与步骤302之间包括所述集群资源管理模块与所述集群资源备份管理模块对接收到的令牌信息中的令牌组标识信息进行分析,判断该令牌组标识信息中的令牌组标识是否与自己保存的令牌信息中的令牌组标识相等,是,则相应执行步骤302;否则,执行步骤306。所述步骤305中对对方的配置信息进行更新包括所述集群资源管理模块或所述集群资源备份管理模块向对方发送配置信息及更新请求信息;所述集群资源备份管理模块或所述集群资源管理模块利用接收到的配置信息对自己保存的配置信息进行更新。
另外,所述步骤2中对令牌更新信息进行更新是对令牌更新时间信息进行更新。相应的,所述步骤3包括步骤311、集群资源管理模块重新启动后,与集群资源备份管理模块建立连接,并与该集群资源备份管理模块相互获取令牌信息;步骤312、所述集群资源管理模块与所述集群资源备份管理模块比较接收到的令牌信息中的令牌更新时间与自己保存的令牌信息中的令牌更新时间的大小是否相等,或者二者的差值是否小于预先规定的数值,是,执行步骤313;否则,执行步骤315;步骤313、向所述管理工具发出报警信息;步骤314、用户制订数据源并利用该数据源对所述集群资源管理模块与所述集群资源备份管理模块中的配置信息进行更新,然后执行步骤316;步骤315、由令牌更新时间晚的集群资源管理模块或集群资源备份管理模块对对方的配置信息进行更新;步骤316、结束。
在步骤311与步骤312之间包括所述集群资源管理模块与所述集群资源备份管理模块对接收到的令牌信息中的令牌组标识信息进行分析,判断该令牌组标识信息中的令牌组标识是否与自己保存的令牌信息中的令牌组标识相等,是,则相应执行步骤312;否则,执行步骤316。
同时,所述步骤2中对令牌更新信息进行更新是同时对令牌号信息与令牌更新时间信息进行更新。相应的,所述步骤3包括步骤321、集群资源管理模块重新启动后,与集群资源备份管理模块建立连接,并与该集群资源备份管理模块相互获取令牌信息;步骤322、所述集群资源管理模块与所述集群资源备份管理模块对接收到的令牌信息中的权重信息进行分析,判断是否由令牌号决定更新控制权,是,执行步骤323;否则,执行步骤325;步骤323、所述集群资源管理模块与所述集群资源备份管理模块比较接收到的令牌信息中的令牌号是否与自己保存的令牌信息中的令牌号相等,若不相等,执行步骤324;否则,执行步骤327;步骤324、根据预先设定的参数,由令牌号大的或者小的集群资源管理模块或集群资源备份管理模块对对方的配置信息进行更新,然后执行步骤329;步骤325、所述集群资源管理模块与所述集群资源备份管理模块比较接收到的令牌信息中的令牌更新时间与自己保存的令牌信息中的令牌更新时间的大小是否相等,或者二者的差值是否小于预先规定的数值,否,执行步骤326;是,执行步骤327;步骤326、由令牌更新时间晚的集群资源管理模块或集群资源备份管理模块对对方的配置信息进行更新,然后执行步骤329;步骤327、向所述管理工具发出报警信息;步骤328、用户制订数据源并利用该数据源对所述集群资源管理模块与所述集群资源备份管理模块中的配置信息进行更新;在步骤321与步骤322之间包括所述集群资源管理模块与所述集群资源备份管理模块对接收到的令牌信息中的令牌组标识信息进行分析,判断该令牌组标识信息中的令牌组标识是否与自己保存的令牌信息中的令牌组标识相等,是,则相应执行步骤322;否则,执行步骤329。
在上述任意一项方法中,所述步骤2中更新所述集群资源备份管理模块中存储的配置信息具体为所述集群资源备份管理模块利用变化后的应用程序更新信息更新所述集群资源备份管理模块中存储的配置信息。
另外,在上述任意一项方法中,还包括更新集群管理代理模块(WatchmanC1uster Agent,WMCA)中的配置信息的操作。更新集群管理代理模块中的配置信息的操作具体为集群资源备份管理模块接收到集群管理代理模块发送的连接请求信息时,从该连接请求信息中获取所述集群管理代理模块的地址信息,从该集群资源备份管理模块中存储的配置信息中提取出与所述地址信息对应的信息,并利用该信息更新所述集群管理代理模块中的配置信息。
基于上述技术方案,本发明采用令牌信息保持WMCS与WMCSB中的配置信息的一致性,从而保证了集群系统中的所有WMCA、WMCS与WMCSB中配置信息的一致性与自动同步,提高了配置信息在灾难情况下的生存性与可恢复性,增强了系统的可靠性。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。


图1为现有技术集群系统的组网结构示意图;图2为实现本发明保证集群系统中配置信息一致的方法的一集群系统的物理分布示意图;图3为实现本发明保证集群系统中配置信息一致的方法的集群系统的另一物理分布示意图;图4为本发明保证集群系统中配置信息一致的方法的一流程图;
图5为本发明保证集群系统中配置信息一致的方法的另一流程图;图6为本发明保证集群系统中配置信息一致的方法的又一流程图;图7为本发明保证集群系统中配置信息一致的方法的再一流程图。
具体实施例方式
由于集群系统中的各个节点服务器上分别设置对所在的节点服务器上的本地资源进行管理的WMCA,在其中的一个节点服务器上设置对集群系统的资源进行管理的WMCS,在另一个节点服务器上设置对集群系统的资源进行备份管理的WMCSB。正常情况下,本发明由WMCS对集群系统的资源进行管理,当集群系统中一个节点服务器上的应用程序信息发生变化时,例如用户通过WMCS在一个节点服务器中添加了进程、删除了进程或修改了进程属性信息,WMCS便更新该节点服务器上的WMCA以及WMCSB中的配置信息。当WMCS出现故障时,由WMCSB代替WMCS对集群系统中所有节点服务器的资源进行管理。当WMCA因故障重启并与WMCS建立连接后,WMCS便重新配置WMCA中的配置信息,消除WMCA因为离线后导致的配置信息的差异性。
参见图2,图2所示为实现本发明保证集群系统中配置信息一致的方法的一集群系统的物理分布示意图,该集群系统包括n(n为大于1的整数)个节点服务器(图中未标出),在各节点服务器中分别设有对所在的节点服务器上的资源进行管理的WMCA10、WMCA20、……WMCAn0(n为大于1的整数),在其中的两个节点服务器例如节点服务器1与节点服务器2中分别设有对集群中所有节点服务器上的资源进行管理的WMCS11,以及当集群资源管理模块发生故障时,对集群中所有节点服务器上的资源进行备份管理的WMCSB21,WMCS11与WMCSB21相互通信连接,并且均与WMCA10、WMCA20、……WMCAn0通信连接。正常情况下,集群系统中配置信息保存在WMCS11中,WMCSB21对WMCS11中的配置信息进行实时的同步备份。具体的,WMCS11与WMCSB21之间及WMCS11、WMCSB21与WMCA10、WMCA20、……WMCAn0之间通过TCP/IP通信连接。
WMCA10、WMCA20、……WMCAn0与WMCS11以及WMCSB21之间都建立了连接,并且WMCSB21对WMCS11中的配置信息进行实时的同步备份,二者具有相同的配置信息,这样,当WMCSB21与WMCS11中的之一发生故障例如由于网卡等物理故障导致的通讯故障时,还可通过未发生故障的WMCSB21或WMCS11实现对集群系统的资源管理;而当任何一个WMCA发生故障时,因其与WMCSB21及WMCS11都连接,而WMCSB21与WMCS11同时发生故障的概率很低,因此,当WMCA故障恢复以后,可被WMCSB21或WMCS11及时更新配置信息,保证了集群系统中的WMCA10、WMCA20、……WMCAn0与WMCS11以及WMCSB21中配置信息的一致性与自动同步,提高了集群系统的安全性与可靠性,有效避免了因节点服务器的故障导致的WMCS、WMCSB与WMCA之间的配置信息差异。
图3所示为实现本发明保证集群系统中配置信息一致的方法的另一集群系统的物理分布示意图,该集群系统在图2所示的集群系统的基础上,还增设了一个可视化的管理装置(Cluster Administrator,CA)0,该CA0分别与WMCS11及WMCSB21连接,用于对WMCS11与WMCSB21进行管理,尤其是当WMCS11与WMCSB21的配置信息发生冲突时,可通过CA0对WMCS11与WMCSB21进行强制管理,提高了集群系统的安全性、可靠性以及对系群系统维护的效率。
为了明确WMCS11或者WMCSB21中配置信息较新,本发明在WMCS11与WMCSB21中设置初始信息相同的令牌信息,该令牌信息用于标识在后续的流程中,WMCS11与WMCSB21对各自的配置信息的更新情况,包括令牌组ID与令牌更新信息。由于在设置令牌信息的同一时刻,WMCS11与WMCSB21中的配置信息是相同的,因此其令牌信息相同;令牌组ID标识集群系统,因WMCSB21用于WMCS11的备份,因此,WMCS11与WMCSB21应该属于同一集群系统,其令牌组ID相同,并且一旦设定,不会因为配置信息的更新发生变化。
另外,令牌更新信息可以是令牌号信息,也可以是令牌更新时间信息或者二者的结合。当令牌更新信息为令牌号信息时,以令牌号的大小标识配置信息的更新情况,例如,设置该令牌号的初始值为0,当WMCS11或WMCSB21中的配置信息每发生一次变化,便相应的将其令牌信息中的令牌号加1,因此,通过令牌号的大小即可获知WMCS11还是WMCSB21中的配置信息被最后更新,即配置信息最新,这样,令牌号大的WMCS11或WMCSB21便具有对对方的配置信息更新的更新控制权。同样,若以令牌更新时间信息表示令牌更新信息,则令牌更新时间晚的即数值大的表示其配置信息较新,相应的WMCS11或WMCSB21便具有对对方的配置信息更新的控制权。若令牌更新信息同时包括令牌号信息与令牌更新时间信息,则还需在令牌信息设置由令牌号或令牌更新时间决定更新控制权的权重信息,例如,权重信息可以为0或1,当权重信息为0时,表示由令牌号决定更新控制权,当权重信息为1时,表示由令牌更新时间决定更新控制权。
图4所示为本发明保证集群系统中配置信息一致的方法的一具体流程,其执行以下步骤步骤1、当WMCS11发生故障时,WMCSB21便对集群系统中各节点服务器上的工作情况进行监测。
正常情况下,由WMCS11对集群系统的资源进行管理,WMCSB21与WMCS11之间存在Socket(套接口)连接,对WMCS11中的配置信息进行实时的同步备份,并且对WMCS11的工作情况进行监测。
步骤2、当系群系统中节点服务器上的应用程序信息发生变化时,WMCSB21利用变化后的应用程序更新信息更新WMCSB21上存储的配置信息,同时,更新令牌信息中的令牌更新信息,例如,将令牌号加1,或者将令牌更新时间修改为更新WMCSB21上存储的配置信息的时间。节点服务器上的应用程序信息发生变化,可以是该节点服务器上因增加或删除了进程引起的进程信息的变化,也可以是进程属性信息的变化。步骤3、当WMCS11的故障消除重新启动后,与WMCSB21建立Socket连接,WMCS11与WMCSB21相互获取对方的令牌信息,并对其中的令牌更新信息进行分析,根据令牌更新信息决定配置信息的更新控制权由谁掌握,获得更新控制权的WMCS11或WMCSB21利用自己当前的配置信息更新对方的配置信息,实现配置信息的同步。
通过令牌更新信息确定配置信息更新控制权,由新配置信息代替旧的配置信息,确保了WMCSB21与WMCS11中配置信息的实时同步,因此,提高了集群系统的安全性与可靠性,有效避免了因节点服务器的故障导致的WMCS与WMCSB之间的配置信息差异。
在上述实施例的步骤2中,另外,若应用程序信息发生变化的节点服务器上的WMCA为WMCAn0,则WMCSB21还利用应用程序更新信息更新WMCAn0的配置信息。更新WMCAn0的配置信息的具体操作为WMCSB21将应用程序更新信息发送给WMCAn0,WMCAn0利用该应用程序更新信息更新其配置信息。
当WMCA因故障重启后,会与WMCS21建立Socket连接,当WMCSB21监测到WMCA与其建立Socket连接时,获取其地址信息,WMCSB21对自己保存的配置信息进行分析,从中提取出与所述地址信息对应的配置信息,并将该配置信息发送给WMCA,重新配置WMCA上的配置信息,有效避免了WMCA因发生故障与WMCSB21产生的配置信息的差异。
当令牌信息中令牌更新信息的内容不同时,对WMCS11与WMCSB21中配置信息进行更新的具体方法也会有所不同。图5所示为当令牌更新信息为令牌号信息时,本发明保证集群系统中配置信息一致的方法的另一实施例的流程图,该实施例中的步骤1-步骤2与图4所示实施例相同,步骤3的操作为步骤301、当MCS11的故障被消除后,MCS11与WMCSB21建立Socket连接,之后,WMCS11与WMCSB21相互向对方发送请求信息获取对方的令牌信息;步骤302、WMCS11与WMCSB21同时对接收到的令牌号信息进行分析,比较该信息中的令牌号是否与自己保存的令牌信息中的令牌号相等,是,执行步骤304;否则,执行步骤305;步骤303、WMCS11与WMCSB21向CA0发出报警信息;步骤304、用户通过CA0制订数据源,利用该数据源对WMCS11与WMCSB21中的配置信息进行更新,然后执行步骤306;当通过令牌信息无法确定WMCS11与WMCSB21对配置信息的更新控制权时,可向用户发出告警信息,由用户制定数据源,通过直观的、图形化的管理工具实现对WMCS11与WMCSB21中配置信息的强制更新,提高了对集群系统的维护效率。
步骤305、根据预先设定的参数,由令牌号大或小的WMCS11或WMCSB21掌握配置信息的更新控制权,并向另一方发送配置信息及利用该配置信息对接收方的配置信息进行更新的更新指示信息,WMCSB21或WMCS11利用接收到的配置信息更新自己保存的配置信息;步骤306、结束。
图6所示为当令牌更新信息为令牌更新时间信息时,本发明保证集群系统中配置信息一致的方法的又一实施例的流程图,该实施例中的步骤1-步骤2与图4所示实施例相同,步骤3的操作为步骤311、当WMCS11的故障被消除后,WMCS11与WMCSB21建立Socket连接,之后,WMCS11与WMCSB21相互向对方发送请求信息获取对方的令牌信息;步骤312、WMCS11与WMCSB21同时对接收到的令牌更新时间信息进行分析,比较该信息中的令牌更新时间是否与自己保存的令牌更新时间信息中的令牌更新时间的大小相等,或者二者的差值是否小于预先规定的数值例如1分钟,是,执行步骤313;否则,执行步骤315;步骤313、WMCS11与WMCSB21向CA0发出报警信息;步骤314、用户通过CA0制订数据源,利用该数据源对WMCS11与WMCSB21中的配置信息进行更新,然后执行步骤316;步骤315、根据预先设定的参数,由令牌更新时间晚的即表示该时间的数据大的WMCS11或WMCSB21掌握配置信息的更新控制权,并向另一方发送配置信息及利用该配置信息对接收方的配置信息进行更新的更新指示信息,WMCSB21或WMCS11利用接收到的配置信息更新自己保存的配置信息,然后执行步骤316;步骤316、结束。
图7所示为当令牌更新信息包括令牌号信息与令牌更新时间信息时,本发明保证集群系统中配置信息一致的方法的再一实施例的流程图,该实施例中的步骤1一步骤3与图4所示实施例相同,步骤3的操作为步骤321、当WMCS11的故障被消除后,WMCS11与WMCSB21建立Socket连接,之后,WMCS11与WMCSB21相互向对方发送请求信息获取对方的令牌信息;步骤322、WMCS11与WMCSB21同时对接收到的令牌更新信息中的权重信息进行分析,判断是否由令牌号决定更新控制权,是,执行步骤323;否则,执行步骤325。例如,若事先预定该权重信息为1时,由令牌号决定更新控制权,该权重信息为0时,由令牌更新时间决定更新控制权,则WMCS11与WMCSB21需要判断权重信息是否为1;步骤323、WMCS11与WMCSB21进一步对接收到的令牌号信息进行分析,比较该信息中的令牌号是否与自己保存的令牌信息中的令牌号相等,否,执行步骤324;是,执行步骤327;步骤324、根据预先设定的参数,由令牌号大或小的WMCS11或WMCSB21掌握配置信息的更新控制权,并向另一方发送配置信息及利用该配置信息对接收方的配置信息进行更新的更新指示信息,WMCSB21或WMCS11利用接收到的配置信息更新自己保存的配置信息,然后执行步骤329;步骤325、WMCS11与WMCSB21进一步对接收到的令牌更新时间信息进行分析,比较该信息中的令牌更新时间是否与自己保存的令牌更新时间信息中的令牌更新时间的大小相等,或者二者的差值是否小于预先规定的数值例如1分钟,否,执行步骤326;是,执行步骤327;步骤326、根据预先设定的参数,由令牌更新时间晚的即表示该时间的数据大的WMCS11或WMCSB21掌握配置信息的更新控制权,并向另一方发送配置信息及利用该配置信息对接收方的配置信息进行更新的更新指示信息,WMCSB21或WMCS11利用接收到的配置信息更新自己保存的配置信息,然后执行步骤329;步骤327、WMCS11与WMCSB21向CA0发出报警信息;步骤328、用户通过CA0制订数据源,利用该数据源对WMCS11与WMCSB21中的配置信息进行更新;步骤329、结束。
在上述各实施例中,通过令牌信息有效确定了配置信息更新控制权,由掌握更新控制权的一方对另一方的配置信息进行更新,进一步保证了配置信息更新的准确性。
另外,为了确保集群系统中配置信息更新的准确性,在图5-图7所示的各实施例中WMCS11与WMCSB21对接收到的令牌更新信息进行分析之前,即在步骤301与步骤302之间,或者步骤311与步骤312之间,或者步骤321与步骤322之间,还可以先分析接收到的令牌信息中的令牌组ID是否与自己保存的令牌信息中的令牌组ID相同,在步骤301与步骤302之间该操作具体为WMCS11与WMCSB21对接收到的令牌信息进行分析,比较该信息中的令牌组ID是否与自己保存的令牌信息中的令牌组ID相同,是,则相应执行步骤302;否则,执行步骤306。在步骤311与步骤312之间,以及步骤321与步骤322之间的操作相同,不再赘述。
通过上述实施例可知,本发明采用令牌信息保持WMCS与WMCSB中的配置信息的一致性,从而保证了集群系统中的所有WMCA、WMCS与WMCSB中配置信息的一致性与自动同步,提高了配置信息在灾难情况下的生存性与可恢复性,增强了系统的可靠性。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围。
权利要求
1.一种保证集群系统中配置信息一致的方法,其特征在于,执行以下步骤步骤1、集群资源备份管理模块对集群系统中各节点服务器的工作情况进行监测;步骤2、当节点服务器中的应用程序信息发生变化时,更新所述集群资源备份管理模块中存储的配置信息,更新该集群资源备份管理模块中的令牌信息,所述令牌信息用于标识配置信息的更新情况;步骤3、集群资源管理模块重新启动后,根据所述的令牌信息更新集群资源管理模块或集群资源备份管理模块中的配置信息。
2.根据权利要求1所述的方法,其特征在于,所述步骤1之前还执行以下操作在集群资源管理模块与集群资源备份管理模块中分别设置初始信息相同的令牌信息,该令牌信息包括令牌组标识信息与令牌更新信息。
3.根据权利要求2所述的方法,其特征在于,所述步骤2中对令牌更新信息进行更新是对令牌号信息进行更新。
4.根据权利要求3所述的方法,其特征在于,所述步骤3包括步骤301、集群资源管理模块重新启动后,与集群资源备份管理模块建立连接,并与该集群资源备份管理模块相互获取令牌信息;步骤302、所述集群资源管理模块与所述集群资源备份管理模块比较接收到的令牌信息中的令牌号是否与自己保存的令牌信息中的令牌号相等,若相等,执行步骤303;否则,执行步骤305;步骤303、向所述管理工具发出报警信息;步骤304、用户制订数据源并利用该数据源对所述集群资源管理模块与所述集群资源备份管理模块中的配置信息进行更新,然后执行步骤306;步骤305、根据预先设定的参数,由令牌号大的或者小的集群资源管理模块或集群资源备份管理模块对对方的配置信息进行更新;步骤306、结束。
5.根据权利要求4所述的方法,其特征在于,在步骤301与步骤302之间还包括所述集群资源管理模块与所述集群资源备份管理模块对接收到的令牌信息中的令牌组标识信息进行分析,判断该令牌组标识信息中的令牌组标识是否与自己保存的令牌信息中的令牌组标识相等,是,则相应执行步骤302;否则,执行步骤306。
6.根据权利要求4所述的方法,其特征在于,所述步骤305中对对方的配置信息进行更新包括所述集群资源管理模块或所述集群资源备份管理模块向对方发送配置信息及更新请求信息;所述集群资源备份管理模块或所述集群资源管理模块利用接收到的配置信息对自己保存的配置信息进行更新。
7.根据权利要求1所述的方法,其特征在于,所述步骤2中对令牌更新信息进行更新是对令牌更新时间信息进行更新。
8.根据权利要求7所述的方法,其特征在于,所述步骤3包括步骤311、集群资源管理模块重新启动后,与集群资源备份管理模块建立连接,并与该集群资源备份管理模块相互获取令牌信息;步骤312、所述集群资源管理模块与所述集群资源备份管理模块比较接收到的令牌信息中的令牌更新时间与自己保存的令牌信息中的令牌更新时间的大小是否相等,或者二者的差值是否小于预先规定的数值,是,执行步骤313;否则,执行步骤315;步骤313、向所述管理工具发出报警信息;步骤314、用户制订数据源并利用该数据源对所述集群资源管理模块与所述集群资源备份管理模块中的配置信息进行更新,然后执行步骤316;步骤315、由令牌更新时间晚的集群资源管理模块或集群资源备份管理模块对对方的配置信息进行更新;步骤316、结束。
9.根据权利要求8所述的方法,其特征在于,在步骤311与步骤312之间还包括所述集群资源管理模块与所述集群资源备份管理模块对接收到的令牌信息中的令牌组标识信息进行分析,判断该令牌组标识信息中的令牌组标识是否与自己保存的令牌信息中的令牌组标识相等,是,则相应执行步骤312;否则,执行步骤316。
10.根据权利要求1所述的方法,其特征在于,所述步骤2中对令牌更新信息进行更新是同时对令牌号信息与令牌更新时间信息进行更新。
11.根据权利要求10所述的方法,其特征在于,所述步骤3包括步骤321、集群资源管理模块重新启动后,与集群资源备份管理模块建立连接,并与该集群资源备份管理模块相互获取令牌信息;步骤322、所述集群资源管理模块与所述集群资源备份管理模块对接收到的令牌信息中的权重信息进行分析,判断是否由令牌号决定更新控制权,是,执行步骤323;否则,执行步骤325;步骤323、所述集群资源管理模块与所述集群资源备份管理模块比较接收到的令牌信息中的令牌号是否与自己保存的令牌信息中的令牌号相等,若不相等,执行步骤324;否则,执行步骤327;步骤324、根据预先设定的参数,由令牌号大的或者小的集群资源管理模块或集群资源备份管理模块对对方的配置信息进行更新,然后执行步骤329;步骤325、所述集群资源管理模块与所述集群资源备份管理模块比较接收到的令牌信息中的令牌更新时间与自己保存的令牌信息中的令牌更新时间的大小是否相等,或者二者的差值是否小于预先规定的数值,否,执行步骤326;是,执行步骤327;步骤326、由令牌更新时间晚的集群资源管理模块或集群资源备份管理模块对对方的配置信息进行更新,然后执行步骤329;步骤327、向所述管理工具发出报警信息;步骤328、用户制订数据源并利用该数据源对所述集群资源管理模块与所述集群资源备份管理模块中的配置信息进行更新;步骤329、结束。
12.根据权利要求11所述的方法,其特征在于,在步骤321与步骤322之间还包括所述集群资源管理模块与所述集群资源备份管理模块对接收到的令牌信息中的令牌组标识信息进行分析,判断该令牌组标识信息中的令牌组标识是否与自己保存的令牌信息中的令牌组标识相等,是,则相应执行步骤322;否则,执行步骤329。
13.根据权利要求1至12中任意一项所述的方法,其特征在于,所述步骤2中更新所述集群资源备份管理模块中存储的配置信息具体为所述集群资源备份管理模块利用变化后的应用程序更新信息更新所述集群资源备份管理模块中存储的配置信息。
14.根据权利要求1至12中任意一项所述的方法,其特征在于,还包括更新集群管理代理模块中的配置信息的操作。
15.根据权利要求14所述的方法,其特征在于,更新集群管理代理模块中的配置信息的操作具体为集群资源备份管理模块接收到集群管理代理模块发送的连接请求信息时,从该连接请求信息中获取所述集群管理代理模块的地址信息,从该集群资源备份管理模块中存储的配置信息中提取出与所述地址信息对应的信息,并利用该信息更新所述集群管理代理模块中的配置信息。
全文摘要
本发明提供了保证集群系统中配置信息一致的方法,包括集群资源备份管理模块对集群系统中各节点服务器的工作情况进行监测;当节点服务器中的应用程序信息发生变化时,更新所述集群资源备份管理模块中存储的配置信息,更新该集群资源备份管理模块中的令牌信息,所述令牌信息用于标识配置信息的更新情况;集群资源管理模块重新启动后,根据所述的令牌信息更新集群资源管理模块或集群资源备份管理模块中的配置信息。采用本发明提供的方法,有效保证了集群系统中各节点服务器上配置信息的一致性,提高了配置信息在灾难情况下的生存性与可恢复性,增强了集群系统的可靠性。
文档编号G06F11/00GK1874267SQ20061006515
公开日2006年12月6日 申请日期2006年3月21日 优先权日2006年3月21日
发明者黄西华 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1