Atca刀片服务器双机系统、连接方法及测试方法

文档序号:7755424阅读:234来源:国知局
专利名称:Atca刀片服务器双机系统、连接方法及测试方法
技术领域
本发明涉及通讯技术领域,尤其涉及一种ATCA(Advanced Telecom Computing Architecture,先进的电信计算机架构)刀片服务器双机系统、连接方法及测试方法。
背景技术
双机系统(通常也称作HA系统,HA是High Available (高可用性)单词的缩写) 是指通过集群软件控制的互为主备的两个服务器,每个服务器通常称作节点,其功能是在 其中一个节点出现故障时能够把发生故障节点上运行的业务进程自动切换到另个正常运 行的节点上,从而达到系统的高可靠性。ATCA是一种高效节能的电信业新一代的环保绿色的服务器设备架构,目前被广泛 采用,而且在电信业以外的其它领域也逐渐推广。每个ATCA机框包括若干个交换节点板和 服务器刀片节点板,根据ATCA的相关规范任何元件都必须提供主备结构,所以通常ATCA的 机框采用两个交换板,刀片服务器一般在12片(服务器单板)左右。而在容量大的系统中, 往往要配置的刀片服务器超过12片,所以要配置两个或两个以上的ATCA机框;而在多个机 框中的系统中,需要配置双机的关键部件通常都是配置在同一机框中,这里存在一个很大 的隐患,一旦其中一个布置双机的机框出现故障或者需要停机维护,则该双机系统则崩溃 或造成业务中断,无法发挥双机的主备切换避免单点故障的功能和系统的可维护性。如电 信业中的增值业务系统中的计费,通常采用一对双机配置,如果这对双机配置在同一个机 框中,万一其中一个机框故障,那就造成计费系统就崩溃,而无法达到双机预期的起到切换 和保护作用;或者机框需要进行正常维护时,不得不中断业务,系统的可维护性较差。

发明内容
针对上述现有技术的缺陷,本发明的目的在于提供一种ATCA刀片服务器双机系 统、连接及测试方法,通过优化双机配置,在不增加设备和成本的情况下,提高双机系统的 抗单点故障的能力和可维护性。本发明的基本思想是通过把构成双机系统的两个服务器节点分别布置在两个机 框中,在不增加设备和成本的条件下,从服务器级的主备冗余提高到网络层面的主备冗余, 提高双机系统的抗单点故障的能力,从而提高整个系统的可维护性、稳定性和健壮性。为保证上述双机系统正常运行,进一步采用IP组播技术作为双机节点健康检查 (即通常说的双机心跳)技术,来监控双机各节点的运行状态;对ATCA机框的交换板的 交换平面进行合理规划,把作为双机健康检测的交换端口划分在一个独立的逻辑区域网中 (即Vlan),作为双机的专用交换区以同业务交换区相隔离,两个机框的交换板都做同样 的划分,以便两个在不同交换板的Vlan进行级联通讯。具体的说,本发明的目的通过以下技术方案实现一种ATCA刀片服务器双机系统,包括两个相互连接并互为主备的服务器节点,每 个服务器节点由两块交换板和若干块刀片节点板构成,其特征在于,构成双机系统的两个服务器节点分布在两个机框中;每块交换板中用于双机心跳的端口与用于业务数据交换的 端口分别划分在两个相互独立的逻辑区域网中;两机框交换板的对应端口之间相互连接。本发明技术方案中,两个机框交换板的双机健康检查的端口可以采用两种方法连 接,一种是采用网线直接把两个机框交换板的对应端口互连;另一种方法是通过外部配置 的交换机进行连接,即把两个交换板作为双机心跳端口通过网线连接到外部交换机,实现 在两个不同机框交换板的端口进行通信,这种方法建议对交换机上的端口同其他端口进行 隔离,即在交换机上单独划分一个Vlan作为双机的连接使用。其中,采用网线直接连接两个机框交换板的对应端口的方法十分简单,此处不再 赘述;通过外部配置的交换机连接具体可按照以下步骤进行A、将每个机框交换板的心跳端口与业务端口分别划分在两个相互独立的逻辑区 域网中;B、分别将两个外置交换机的端口划分为心跳端口和业务端口,且心跳端口与业务 端口处于相互独立的逻辑区域网中;C、通过网线将一台外置交换机与两个机框的交换板分别通过相互对应的端口连 接,另一台的外置交换机与两个机框通过也分别通过相互对应的端口连接,形成双网双平 面结构,即其中一个交换机或交换板出现故障,另一交换机或交换板会保证通讯链路正常, 而不会造成通讯中断。按照上述方法连接好双机系统后,即可对系统进行正常配置,在正常配置前,建议 按照如下方法测试检查两个机框交换板的心跳端口是否正常通讯在准备作为双机节点刀片上的端口配置临时IP地址,然后互相ping,检查是否可 以正常通讯。如采用本方法进行检查,则在进行系统配置前,一定要删除为该端口配置的临 时IP地址,因为双机配置时心跳的IP地址是双机自动选择配置的,以免影响双机的心跳IP 的自动配置。配置完成后,进行双机切换测试,检查两个分布在不同的两个框中节点是否能根 据双机配置的规则进行切换。至少要进行如下三种场景的测试1)在双机一个节点上启动相应的进程资源后,在另一个节点上也尝试启动相应的 进程,如果双机一个资源组只能在一个节点上启动,则系统正常;否则,系统异常;2)在双机进程资源启动正常的情况下,进行手工切换,检查能否正常切换,如可正 常切换,则系统正常;否则,系统异常;3)模拟异常测试,检查双机系统能否完成正常切换,如是,则系统正常;如否,则 系统异常。其中,模拟异常测试至少包括以下两种情况在当前正在运行进程资源的双机主节点上杀死进程,或者采用其他方法造成进程 异常退出,检查双机系统是否能够自动切换;将进程资源正在运行的双机主节点从机框中拔出模拟该节点异常故障的情况下, 检查双机系统是否能自动切换。如以上三个场景测试全部成功则说明双机运行正常,当然,也可以根据具体配置 的需要,进行其他更加细致的测试。相比现有技术将双机系统两个节点在同一机框布置,本发明对双机系统进行了优化,将两个节点分开布置在两个机框,在不增加设备和成本的条件下,从服务器级的主备冗 余提高到网络层面的主备冗余,提高了双机系统的抗单点故障的能力,从而提高了整个系 统的可维护性、稳定性和健壮性。


图1为ATCA机框内部网络结构示意图;图2为本发明双机框互连系统的网络结构示意图;图3为本发明具体实施方式
外接交换机的双机框互连系统的网络结构示意图。
具体实施例方式下面结合附图对本发明的技术方案进行详细说明首先对ATCA机框内部网络结构进行简单介绍如附图1所示,Switchl/2表示两个数据交换模块,通常称为交换板,为可互为主 备,或负载分担;Slidel-Slidel2表示刀片服务器中的刀片节点板,每个刀片节点板都跟 两个交换板相连,构成双网双平面结构;双网双平面通常分别命名为Fabric平面和Base平 面(以下具体实施方式
也按照这样的命名方式),根据ATCA规范,Base网络平面负责管理 维护网络,Fabric网络平面提供高速的网络通信;在默认情况下Base网络平面与Fabric 网络平面并没隔离,通常是互通的。 本具体实施方式
具体按照如下各步骤进行步骤1)如附图2所示,把两个机框的两个网络平面进行隔离把交换板的网络端 口划分为两个虚拟区域网(Vlan),并分别名为为Base和Fabric,以便双机心跳和业务网络 隔离开来,以避免网络风暴。步骤2)向Base和Fabric网络平面分配端口,把编号为PI、P2用于双机心跳的 端口分配在Base Vlan (虚拟区域网),把编号为P3、P4用于业务的端口分配给Fabric Vlan(虚拟区域网)。步骤3)在外部连接的两个对应的交换机也分别进行相应的网络设置,分别独立 划分出两个Vlan做为双机心跳Vlan和业务Vlan,以实现心跳网络通业务网络数据交换的 分离,并把用于连接刀片的心跳端口和业务端口分别分配在各自对应的Vlan中,然后通过 网线将一台外置交换机与两个机框的交换板通过相互对应的端口连接,剩余的外置交换机 也与两个机框通过相互对应的端口连接。连接完成的双机框互连系统的结构如附图3所
7J\ ο步骤4)对两个心跳端口配置临时IP地址,进行测试网络是否正常通讯。步骤5)如心跳网络通信正常,则在删除临时IP地址后进行双机配置。步骤6)分别在作为双机的刀片节点Blade-Nodel和Blade-N0de2上安装双机系 统,并把两个节点上的端口 P1、P2分别设置为双机心跳的两个组播成员,即组播1 =Blade-Nodel-Pl, Blade-Node2_Pl组播2 :Blade-Nodel-P2, Blade-Node2_P2步骤7)根据具体业务要求配置双机资源组,双机系统的具体配置请则根据所选 择的双机软件和操作手册进行具体配置。
步骤8)在双机其它资源等配置好后,进行双机切换测试,检查两个分布在不同的 两个框中节点是否能根据双机配置的规则进行切换。至少要进行如下三种场景的测试1)在双机一个节点上启动相应的进程资源后,在另一个节点上也尝试启动相应的 进程,如果双机一个资源组只能在一个节点上启动,则系统正常;否则,系统异常;2)在双机进程资源启动正常的情况下,进行手工切换,检查能否正常切换,如可正 常切换,则系统正常;否则,系统异常;3)模拟异常测试,检查双机系统能否完成正常切换,如是,则系统正常;如否,则 系统异常。其中,模拟异常测试至少包括以下两种情况在当前正在运行进程资源的双机主节点上杀死进程,或者采用其他方法造成进程 异常退出,检查双机系统是否能够自动切换;将进程资源正在运行的双机主节点从机框中拔出模拟该节点异常故障的情况下, 检查双机系统是否能自动切换。如以上三个场景测试全部成功则说明双机运行正常,当然,也可以根据具体配置 的需要,进行其他更加细致的测试。
权利要求
一种ATCA刀片服务器双机系统,包括两个相互连接并互为主备的服务器节点,每个服务器节点由两块交换板和若干块刀片节点板构成,其特征在于,所述两个服务器节点分布在两个机框中。
2.如权利要求1所述的ATCA刀片服务器双机系统,其特征在于每块交换板中用于双 机心跳的端口与用于业务数据交换的端口分别划分在两个相互独立的逻辑区域网中;两机 框交换板的对应端口之间相互连接。
3.如权利要求2所述的ATCA刀片服务器双机系统,其特征在于所述两机框交换板的 对应端口之间相互连接是通过两台相互连接的外置交换机实现;所述每一台外置交换机的 端口均分为心跳端口和业务端口且分别处于两个相互独立的逻辑区域网中;每台外置交换 机的心跳端口和业务端口均通过网线与两个机框交换板的相应端口分别连接。
4.一种如权利要求1所述ATCA刀片服务器双机系统的连接方法,其特征在于包括以 下各步骤A、将每个机框交换板的心跳端口与业务端口分别划分在两个相互独立的逻辑区域网中;B、分别将两个外置交换机的端口划分为心跳端口和业务端口,且心跳端口与业务端口 处于相互独立的逻辑区域网中;C、通过网线将一台外置交换机与两个机框的交换板分别通过相互对应的端口连接, 另一台的外置交换机与两个机框通过也分别通过相互对应的端口连接,形成双网双平面结 构,即其中一个交换机或交换板出现故障,另一交换机或交换板会保证通讯链路正常,而不 会造成通讯中断。
5.一种如权利要求1所述ATCA刀片服务器双机系统的测试方法,其特征在于,至少包 括以下三种场景的测试1)在双机一个节点上启动相应的进程资源后,在另一个节点上也尝试启动相应的进 程,如果双机一个资源组只能在一个节点上启动,则系统正常;否则,系统异常;2)在双机进程资源启动正常的情况下,进行手工切换,检查能否正常切换,如可正常切 换,则系统正常;否则,系统异常;3)模拟异常测试,检查双机系统能否完成正常切换,如是,则系统正常;如否,则系统 异常。
6.如权利要求5所述ATCA刀片服务器双机系统的测试方法,其特征在于所述模拟异 常测试至少包括以下两种情况在当前正在运行进程资源的双机主节点上杀死进程,或者采用其他方法造成进程异常 退出,检查双机系统是否能够自动切换;将进程资源正在运行的双机主节点从机框中拔出模拟该节点异常故障的情况下,检查 双机系统是否能自动切换。
全文摘要
本发明公开了一种ATCA刀片服务器双机系统、连接方法及测试方法,属于通讯技术领域。构成本发明双机系统的两个服务器节点分别布置在两个机框中,并采用IP组播技术进行双机节点健康检查;作为双机健康检查的交换端口划分在一个独立的逻辑区域网中,作为双机的专用交换区以同业务交换区相隔离,两个机框的交换板都做同样的划分,以便两个在不同交换板的Vlan进行级联通讯。本发明在不增加设备和成本的条件下,从服务器级的主备冗余提高到网络层面的主备冗余,提高双机系统的抗单点故障的能力,从而提高了整个系统的可维护性、稳定性和健壮性。本发明还相应地提供了一种刀片服务器双机系统连接方法及测试方法,以构建本发明的ATCA刀片服务器双机系统。
文档编号H04L12/24GK101895444SQ20101023912
公开日2010年11月24日 申请日期2010年7月28日 优先权日2010年7月28日
发明者吴亚娟 申请人:南京信息工程大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1