一种主备倒换的仲裁方法、装置和系统的制作方法

文档序号:7892627阅读:231来源:国知局
专利名称:一种主备倒换的仲裁方法、装置和系统的制作方法
技术领域
本发明涉及小型机技术领域,尤其涉及一种主备倒换的仲裁方法、装置和系统。
背景技术
在小型机领域中,管理系统对各个BMC (Baseboard Management Controller,基板管理控制器)进行统一管理,并保证系统的可靠性、可用性以及稳定性。目前的服务处理器(Service Processor, SP)采用主SP与备SP共同管理系统,并保证主备的快速切换甚至是无缝切换,而且为了防止网络的单点失效,一般采用双网双平面的架构。在现有技术中,一种方式是着眼于主备SP倒换的稳定性以及倒换速度,同时专门设计了一个仲裁电路进行主备SP倒换的仲裁;另一种方式是为管理系统增加了冗余的第三方仲裁,来关注SP是否在位,从而决定是否需要进行主备倒换。发明人经过研究发现,现有技术方案主要涉及主备倒换的稳定性以及速度,将主备SP是否在位、是否有故障作为主备切换的仲裁条件,而没有关注主备SP的管理能力,系统的可用性不高,而且由于在管理系统中添加了专门的第三方仲裁者,额外增加了系统的成本。

发明内容
本发明的实施例提供一种主备倒换的仲裁方法、装置和系统,避免增加额外的设施充当仲裁者,降低了系统的成本,同时将服务处理器的管理能力也作为仲裁条件,提高了系统的可用性。为达到上述目的,本发明采用如下技术方案一种主备倒换的仲裁方法,包括主用服务处理器SP检测并统计与自身通信连接正常的基板管理控制器BMC的个数,当检测到存在至少一个BMC与所述主用SP之间的通信连接存在异常时,向备用SP发送通信连接检测指令,以触发所述备用SP检测自身与各个BMC之间的通信连接是否正常,并统计与所述备用SP通信连接正常的BMC的个数;当与所述主用SP通信连接正常的BMC个数小于与所述备用SP通信连接正常的BMC个数,且与所述主用SP通信连接正常的BMC均与所述备用SP存在正常通信连接时,所述主用SP向所述备用SP发送主备倒换指令,以指示所述备用SP将自身的IP地址修改为所述主用SP的IP地址。本发明实施例还提供另一种主备倒换的仲裁方法,包括第一 SP检测与之相连的第二 SP发送的心跳信号,所述心跳信号用于表明所述第二 SP的状态正常;当所述第一 SP检测不到所述第二 SP发送的心跳信号时,向与所述第二 SP连接的各个BMC发送通信连接检测指令,以触发所述各个BMC检测各自与所述第二 SP之间的通信连接是否正常;
当所述第一 SP为备用SP,所述第二 SP为主用SP,且所述各个BMC与所述第二 SP之间的通信连接均不正常时,所述第一 SP将自身的IP地址修改为所述主用SP的IP地址。本发明实施例还提供一种主用服务处理器SP,用于对与之相连的基板管理控制器BMC进行管理,该主用SP包括第一处理单元,用于检测并统计与所述主用SP通信连接正常的BMC的个数,当检测到存在至少一个BMC与所述主用SP之间的通信连接存在异常时,向与所述主用SP连接的备用SP发送通信连接检测指令,以触发所述备用SP检测自身与各个BMC之间的通信连 接是否正常,并统计与所述备用SP通信连接正常的BMC的个数;第二处理单元,用于当与所述主用SP通信连接正常的BMC个数小于与所述备用SP通信连接正常的BMC个数,且与所述主用SP通信连接正常的BMC均与所述备用SP存在正常通信连接时,向所述备用SP发送主备倒换指令,以指示所述备用SP将自身的IP地址修改为所述主用SP的IP地址。本发明实施例还提供一种服务处理器SP,包括检测单元,用于检测与所述SP相连的另一 SP发送的心跳信号,所述心跳信号用于表明所述另一 SP的状态正常;发送单元,用于当检测不到所述另一 SP发送的心跳信号时,向与所述另一 SP连接的各个BMC发送通信连接检测指令,以触发所述各个BMC检测各自与所述另一 SP之间的通信连接是否正常;处理单元,用于当所述SP为备用SP,所述另一 SP为主用SP,且所述各个BMC与所述另一 SP之间的通信连接均不正常时,将所述SP自身的IP地址修改为所述另一 SP的IP地址。本发明实施例还提供一种小型机系统,包括主用服务处理器SP、备用SP、以及与所述主用SP和所述备用SP分别连接的多个BMC ;所述主用SP用于对所述各个BMC进行管理,所述主用SP,还用于检测并统计与自身通信连接正常的BMC的个数,当检测到存在至少一个BMC与所述主用SP之间的通信连接存在异常时,向所述备用SP发送通信连接检测指令;所述备用SP,用于在接收到所述主用SP发送的通信连接检测指令之后,检测自身与各个BMC之间的通信连接是否正常,并统计与自身通信连接正常的BMC的个数;所述主用SP,还用于当与所述主用SP通信连接正常的BMC个数小于与所述备用SP通信连接正常的BMC个数,且与所述主用SP通信连接正常的BMC均与所述备用SP存在正常通信连接时,所述主用SP向所述备用SP发送主备倒换指令;所述备用SP,还用于在接收到所述主用SP发送的主备倒换指令后,将自身的IP地址修改为所述主用SP的IP地址。本发明实施例还提供另外一种小型机系统,包括第一服务处理器SP、第二 SP、以及与所述第一 SP和所述第二 SP分别连接的多个基板管理控制器BMC,所述第一 SP与所述第二 SP通过互相发送心跳信号来告知对方自身的状态正常,所述第一 SP和所述第二 SP可以在主用状态和备用状态之间切换,当所述第一 SP为主用SP时,所述第二 SP为备用SP ;当所述第一 SP为备用SP时,所述第二 SP为主用SP ;所述第一 SP,用于在检测不到所述第二 SP发送的心跳信号时,向与所述第二 SP连接的各个BMC发送通信连接检测指令;
所述BMC,用于在接收到所述第一 SP发送的通信连接检测指令后,检测自身与所述第二 SP之间的通信连接是否正常;所述第一 SP,还用于当所述第一 SP为备用SP,所述第二 SP为主用SP,且所述各个BMC与所述第二 SP之间的通信连接均不正常时,所述第一 SP将自身的IP地址修改为所述第二 SP的IP地址。本发明实施例提供的方案,当检测到存在至少一个BMC与该主用SP之间的通信连接存在异常时,通过比较主用SP和备用SP对各个BMC的管理能力,来决定是否进行主备倒换,不需要引入第三方仲裁者,降低了系统的成本,同时在主备双方都存在心跳且健康的情况下,考虑受管者的可管理性作为主备切换的仲裁条件,主备双方根据自己的管理能力进行主备切换,提高系统的可用性。


图I为本发明实施例I提供的一种主备倒换的仲裁方法的流程图;图2为现有技术中管理系统采用双网双平面的架构示例图;图3为本发明实施例I提供的所述主用SP与所述至少一个BMC之间的通信链路存在故障的示例图;图4为本发明实施例I提供的主备倒换的示例图;图5为本发明实施例I提供的另一种主备倒换的仲裁方法的流程图;图6为本发明实施例I提供的一个BMC存在异常的示例图;图7为本发明实施例I提供的一种主备倒换的仲裁装置结构图;图8为本发明实施例2提供的一种主备倒换的仲裁方法的流程图;图9为本发明实施例2提供的所述主用SP状态异常的示例图;图10为本发明实施例2提供的主备倒换的示例图;图11为本发明实施例2提供的又一种主备倒换的仲裁方法的流程图;图12为本发明实施例2提供的另一种主备倒换的仲裁方法的流程图;图13为本发明实施例2提供的主用SP和备用SP之间的通信链路存在异常的示例图;图14为本发明实施例2提供的再一种主备倒换的仲裁方法的流程图;图15为本发明实施例2提供的备用SP状态异常的示例图;图16为本发明实施例2提供的一种主备倒换的仲裁装置的结构图;图17为本发明实施例3提供的一种小型机系统的结构图;图18为本发明实施例3提供的另一种小型机系统的结构图。
具体实施例方式下面结合附图对本发明实施例一种主备倒换的仲裁方法、装置和系统进行详细描述。
实施例I本发明实施例提供的一种主备倒换的仲裁方法,如图I所示,具体包括101、主用SP检测并统计与自身通信连接正常的BMC的个数,当检测到存在至少一个BMC与所述主用SP之间的通信连接存在异常时,向备用SP发送通信连接检测指令,以触发所述备用SP检测自身与各个BMC之间的通信连接是否正常,并统计与所述备用SP通信连接正常的BMC的个数;102、当与所述主用SP通信连接正常的BMC个数小于与所述备用SP通信连接正常的BMC个数,且与所述主用SP通信连接正常的BMC均与所述备用SP存在正常通信连接时,所述主用SP向所述备用SP发送主备倒换指令,以指示所述备用SP将自身的IP地址修改为所述主用SP的IP地址。 本发明实施例提供的一种主备倒换的仲裁方法,当主用SP检测到存在至少一个BMC与所述主用SP之间的通信连接存在异常时,通过比较主用SP和备用SP对各个BMC的管理能力,来决定是否进行主备倒换。本发明实施例提供的方案,不需要引入第三方仲裁者,降低了系统的成本,同时在主备双方都存在心跳且健康的情况下,考虑受管者的可管理性作为主备切换的仲裁条件,主备双方根据自己的管理能力进行主备切换,提高系统的可用性。在小型机领域,通过小型机管理系统对各个BMC进行统一的管理,而且为了防止网络的单点失效,管理系统一般会采用双网双平面的架构,如图2所示,图中实线与虚线代表两个网络平面。BMC是整个小型机管理系统的一个有机组成部分,负责管理各个节点,对于不同的级别的小型机系统,系统中BMC的个数会不一样,例如32路系统中可能会存在16个BMC,而16路的系统中,可能只有8个BMC。所有的BMC会组成一个仲裁集团。在图2所述的架构中,主用SP会将一些必要的同步信息同步到备SP上。只有主用SP会对BMC进行管理,备用SP处于“待命”状态,只有在升主后,它才会接手对BMC的管理。在图2所示的管理系统中,用户会预先对主用SP和备用SP设置各自的IP地址,同时会将所述主用SP的IP地址通知所述备用SP,所述主用SP在工作过程中会将其管理的BMC的IP信息同步到备用SP上。当主要SP检测到存在至少一个BMC与所述主用SP之间的通信连接存在异常时,向备用SP发送通信连接检测指令,以触发所述备用SP检测自身与各个BMC之间的通信连接是否正常,备用SP通过ping的方式来检测自身能够ping通的BMC的个数。在具体应用时,如图3所示,由于所述主用SP与所述至少一个BMC之间的通信链路存在故障,导致所述主用SP与所述至少一个BMC失去通信,但是备用SP可以和所述至少一个BMC通信,在这种情况下,所述检测结果指示与所述备用SP存在正常通信连接的BMC个数大于与所述主用SP存在正常通信连接的BMC个数,且与所述备用SP存在正常通信连接的BMC,除了包含所有与所述主用SP存在正常通信连接的BMC之外,还包含与所述主用SP不能正常通信连接的其他BMC,则表明此时所述备用SP更适合当所述主用SP,所以所述主用SP向所述备用SP发送主备倒换指令,以指示所述备用SP将自身的IP地址修改为主用SP的IP地址。如图4所示,所述各个BMC只需要不停的去连接192. 168. 51.5这个IP地址,主备倒换的过程对于所述各个BMC是并不可见,所述主备倒换过程就是一个修改IP地址的过程。可选的,本发明实施例提供的一种主备倒换的仲裁方法,如图5所示,具体还包括
103、当与所述主用SP通信连接正常的BMC个数大于或者等于与所述主用SP通信连接正常的BMC个数时,所述主用SP保持现有状态不变。当所述检测结果中指示与所述备用SP存在正常通信连接的BMC个数小于或等于所述主用SP存在正常通信连接的BMC个数,说明所述主用SP仍然更适合作为主用SP。如图6所示,当一个BMC存在异常时,导致所述备用SP也与所述BMC失去通信,则所述主用SP保持现有状态继续运行。相应地,本发明实施例提供的一种主用服务处理器SP,如图7所示,该主用SPlO包括第一处理单元11和第二处理单元12。 其中,所述第一处理单元11,用于检测并统计与所述主用SP通信连接正常的BMC的个数,当检测到存在至少一个BMC与所述主用SP之间的通信连接存在异常时,向与所述主用SP连接的备用SP发送通信连接检测指令,以触发所述备用SP检测自身与各个BMC之间的通信连接是否正常,并统计与所述备用SP通信连接正常的BMC的个数;;第二处理单元12,用于当与所述主用SP通信连接正常的BMC个数小于与所述备用SP通信连接正常的BMC个数,且与所述主用SP通信连接正常的BMC均与所述备用SP存在正常通信连接时,向所述备用SP发送主备倒换指令,以指示所述备用SP将自身的IP地址修改为所述主用SP的IP地址。本发明实施例提供的主用SP,当检测到存在至少一个BMC与该主用SP之间的通信连接存在异常时,通过比较主用SP和备用SP对各个BMC的管理能力,来决定是否进行主备倒换。本发明实施例提供的方案,不需要引入第三方仲裁者,降低了系统的成本,同时在主备双方都存在心跳且健康的情况下,考虑受管者的可管理性作为主备切换的仲裁条件,主备双方根据自己的管理能力进行主备切换,提高系统的可用性。其中,所述主用SP的第二处理单元,还用于当与所述主用SP通信连接正常的BMC个数大于或者等于与所述备用SP通信连接正常的BMC个数时,所述主用SP保持现有状态不变。上述的实施例中,主备倒换的仲裁触发条件是主用SP检测到存在至少一个BMC与所述主用SP之间的通信连接存在异常,然后通过比较主用SP和备用SP能够正常通信连接的BMC的个数,以及与所述备用SP存在正常通信连接的BMC是否包含所有与所述装置存在正常通信连接的BMC,来判断谁更适合作为主用SP,通过管理系统内的自有装置作为仲裁方,降低了系统的成本,更加关注服务处理器的管理能力,提高系统的可用性。实施例2本发明实施例提供的一种主备倒换的仲裁方法,如图8所示,具体包括201、第一服务器SP检测与之相连的第二 SP发送的心跳信号,所述心跳信号用于表明所述第二 SP的状态正常;在本发明实施例提供的方法的操作过程中,第一 SP与第二 SP之间通过周期性发送心跳信号,判断设备的健康状况,判断对方是否“存活”,如果在指定的时间内仍没有收到设备的心跳信号,就可以判断此设备发生故障。202、当第一 SP检测不到第二 SP发送的心跳信号时,向与所述第二 SP连接的各个BMC发送通信连接检测指令,以触发所述各个BMC检测各自与所述第二 SP之间的通信连接是否正常;
203、当所述第一 SP为备用SP,所述第二 SP为主用SP,且所述各个BMC与所述第二 SP之间的通信连接均不正常时,所述第一 SP将自身的IP地址修改为所述主用SP的IP地址。需要说明的是, 上述步骤203完成了主备切换的过程;BMC通过TCP连接到主用SP上,接受主用SP的管理,同时备用SP可以通过UDP的方式向BMC发送命令请求。BMC会不停的去连接主用SP的IP,直至连接上为止,本领域技术人员可以理解的是,主备切换的过程就是一个修改IP的过程,且主备切换的过程对BMC并不可见。本发明实施例提供的一种主备倒换的仲裁方法,当第一 SP检测不到第二 SP发送的心跳信号时,询问与所述第二 SP存在连接的各个BMC,由所述各个BMC检测各自与所述第二 SP之间的通信连接是否正常,通过检测结果决定是否进行主备倒换。本发明实施例提供的方案,不需要引入第三方仲裁者,降低了系统的成本,同时在主备双方都存在心跳且健康的情况下,考虑受管者的可管理性作为主备切换的仲裁条件,主备双方根据自己的管理能力进行主备切换,提高系统的可用性。在本发明实施例提供的方法的操作过中,主用SP与备用SP之间通过周期性发送心跳信号,判断设备的健康状况,判断对方是否“存活”,如果在指定的时间内仍没有收到设备的心跳信号,就可以判断此设备发生故障。当所述备用SP检测不到所述主用SP的心跳信号时,所述备用SP向各个BMC发送通信连接检测指令,以触发所述各个BMC检测各自与所述主用SP之间的通信连接是否正常,当所述各个BMC与所述主用SP之间的通信连接均不正常时,如图9所示,表明网络中所述主用SP挂死,所述主用SP不能管理所述各个BMC,则所述备用SP将自身的IP地址修改为所述主用SP的IP地址。如图10所示,所述各个BMC只需要不停的去连接192. 168. 51. 5这个IP地址,主备倒换的过程对于所述各个BMC是并不可见,所述主备倒换过程就是一个修改IP地址的过程。可选的,本发明实施例提供的一种主备倒换的仲裁方法,如图11所示,所述第一SP将自身的IP地址修改为所述主用SP的IP地址之后,还包括204、发出第一告警信息,以显示所述第二 SP的状态异常。在本发明的一个实施例中,当主用SP检测不到备用SP的心跳时,它首先会去询问各个被管理的BMC能否ping通备用SP’如果有一个BMC能ping通,则说明备用SP在位,则主用SP产生主备之间通信链路存在问题的告警;如果所有BMC都不能ping通备用SP,则主用SP会发出第一告警信息,以提示备用SP状态异常,当前不在位。具体应用时,本发明实施例提供的另一种主备倒换的仲裁方法,如图12所示,第一 SP为备用SP,第二 SP为主用SP,具体包括301、当备用SP检测不到主用SP发送的心跳信号时,向与所述主用SP连接的各个BMC发送通信连接检测指令,以触发所述各个BMC检测各自与所述主用SP之间的通信连接是否正常,所述心跳信号用于表明所述第二 SP的状态正常;302、当存在至少一个BMC与所述主用SP之间的通信连接为正常时,所述备用SP发出第二告警信息,以显示所述主用SP与所述备用SP之间的通信链路存在异常。如图13所示,当所述检测结果中指示存在至少一个BMC与所述主用SP之间的通信连接为正常时,表明所述至少一个BMC被所述主用SP所管理,说明网络中所述主用SP正常工作,则所述主用SP和所述备用SP都保持当前状态,所述备用SP发出第二告警信息,以显示所述主用SP与所述备用SP之间的通信链路存在异常。具体应用时,本发明实施例提供的另一种主备倒换的仲裁方法,如图14所示,第一 SP为主用SP,第二 SP为备用SP,具体包括401、当主用SP检测不到备用SP发送的心跳信号时,向与所述备用SP连接的各个BMC发送通信连接检测指令,以触发所述各个BMC检测各自与所述备用SP之间的通信连接是否正常,所述心跳信号用于表明所述备用SP的状态正常;402、当存在至少一个BMC与所述备用SP之间的通信连接为正常时,所述主用SP发出第三告警信息,以显示所述主用SP与所述备用SP之间的通信链路存在异常。当主用SP检测不到备用SP发送的心跳信号时,所述主用SP会去询问与所述备用 SP连接的各个BMC能否ping通备用SP,如图13所示,当存在至少一个BMC能够ping通所述备用SP时,表明网络中所述备用SP正常工作,则所述主用SP和所述备用SP都保持当前状态,所述主用SP发出第三告警信息,以显示所述主用SP与所述备用SP之间的通信链路存在异常。403、当所述各个BMC与所述备用SP之间的通信连接均不正常时,所述主用SP发出第四告警信息,以显示所述备用SP的状态异常。如图15所示,当所述各个BMC都不能ping通所述备用SP时,表明所述网络中所述备用SP不能正常工作,则所述主用SP发出第四告警信息,以显示所述备用SP的状态异

巾O相应地,本发明实施例提供的一种服务处理器SP,如图16所示,所述SP20包括检测单元21、发送单元22和第一处理单元23。其中,检测单元21,用于检测与所述SP相连的另一 SP发送的心跳信号,所述心跳信号用于表明所述另一 SP的状态正常;发送单元22,用于当检测不到另一 SP发送的心跳信号时,向与所述另一 SP连接的各个BMC发送通信连接检测指令,以触发所述各个BMC检测各自与所述另一 SP之间的通信连接是否正常,所述心跳信号用于表明所述另一 SP的状态正常;处理单元23,用于当所述SP为备用SP,所述另一 SP为主用SP,且所述各个BMC与所述另一 SP之间的通信连接均不正常时,将所述SP自身的IP地址修改为所述另一 SP的IP地址。本发明实施例提供的服务处理器SP在检测不到与之连接的另一 SP发送的心跳信号时,询问与所述第二 SP存在连接的各个BMC,由所述各个BMC检测各自与该另一 SP之间的通信连接是否正常,通过检测结果决定是否进行主备倒换。本发明实施例提供的方案,不需要引入第三方仲裁者,降低了系统的成本,同时在主备双方都存在心跳且健康的情况下,考虑受管者的可管理性作为主备切换的仲裁条件,主备双方根据自己的管理能力进行主备切换,提高系统的可用性。可选的,本发明实施例提供的一种服务处理器SP还包括报警单元24,用于在所述处理单元将所述SP的IP地址修改为所述另一 SP的IP地址之后,发出第一告警信息,以显示所述另一 SP的状态异常。可选的,所述报警单元,还用于当存在至少一个BMC与所述另一 SP之间的通信连接为正常时,发出第二告警信息,以显示所述SP与所述另一 SP之间的通信链路存在异常。
相应地,当本发明实施例提供的服务处理器SP处于主用状态,而与该SP相连的另一 SP处于备用状态时,所述报警单元24,用于当存在至少一个BMC与所述另一 SP之间的通信连接为正常时,发出第三告警信息,以显示所述SP与所述另一 SP之间的通信链路存在异常;或者,当所述各个BMC与所述另一 SP之间的通信连接均不正常时,发出第四告警信息,以显示所述第二 SP的状态异常。上述的实施例中,主备倒换的 仲裁触发条件是主备双方失去通信,即主用SP检测不到备用SP发送的状态信号,或者备用SP检测不到主用SP发送的状态信号时,根据各个BMC作为仲裁方来判断谁更适合作为主用SP,降低了系统的成本,更加关注服务处理器的管理能力,提高系统的可用性。实施例3本发明实施例提供一种小型机系统,如图17所示,包括主用SP、备用SP、以及与所述主用SP和所述备用SP分别连接的多个BMC ;所述主用SP用于对所述各个BMC进行管理,所述主用SP,还用于检测并统计与自身通信连接正常的BMC的个数,当检测到存在至少一个BMC与所述主用SP之间的通信连接存在异常时,向所述备用SP发送通信连接检测指令;所述备用SP,用于在接收到所述主用SP发送的通信连接检测指令之后,检测自身与各个BMC之间的通信连接是否正常,并统计与自身通信连接正常的BMC的个数;所述主用SP,还用于当与所述主用SP通信连接正常的BMC个数小于与所述备用SP通信连接正常的BMC个数,且与所述主用SP通信连接正常的BMC均与所述备用SP存在正常通信连接时,所述主用SP向所述备用SP发送主备倒换指令;所述备用SP,还用于在接收到所述主用SP发送的主备倒换指令后,将自身的IP地址修改为所述主用SP的IP地址。本发明实施例提供的一种小型机系统,当主用SP检测到存在至少一个BMC与所述主用SP之间的通信连接存在异常时,通过比较主用SP和备用SP对各个BMC的管理能力,来决定是否进行主备倒换。本发明实施例提供的方案,不需要引入第三方仲裁者,降低了系统的成本,同时在主备双方都存在心跳且健康的情况下,考虑受管者的可管理性作为主备切换的仲裁条件,主备双方根据自己的管理能力进行主备切换,提高系统的可用性。可选的,所述主用SP,还用于当与所述备用SP存在正常通信连接的BMC个数小于或等于所述主用SP存在正常通信连接的BMC个数时,保持现有状态不变。本发明实施例还提供一种小型机系统,如图18所示,包括第一 SP、第二 SP、以及与所述第一 SP和所述第二 SP分别连接的多个BMC,所述第一 SP与所述第二 SP通过互相发送心跳信号来告知对方自身的状态正常,所述第一 SP和所述第二 SP可以在主用状态和备用状态之间切换,当所述第一 SP为主用SP时,所述第二 SP为备用SP ;当所述第一 SP为备用SP时,所述第二 SP为主用SP ;所述第一 SP,用于在检测不到所述第二 SP发送的心跳信号时,向与所述第二 SP连接的各个BMC发送通信连接检测指令;所述BMC,用于在接收到所述第一 SP发送的通信连接检测指令后,检测自身与所述第二 SP之间的通信连接是否正常;
所述第一 SP,还用于当所述第一 SP为备用SP,所述第二 SP为主用SP,且所述各个BMC与所述第二 SP之间的通信连接均不正常时,所述第一 SP将自身的IP地址修改为所述第二 SP的IP地址。本发明实施例提供的一种小型机系统,当第一 SP检测不到第二 SP发送的心跳信号时,询问与所述第二 SP存在连接的各个BMC,由所述各个BMC检测各自与所述第二 SP之间的通信连接是否正常,通过检测结果决定是否进行主备倒换。本发明实施例提供的方案,不需要引入第三方仲裁者,降低了系统的成本,同时在主备双方都存在心跳且健康的情况下,考虑受管者的可管理性作为主备切换的仲裁条件,主备双方根据自己的管理能力进行主备切换,提高系统的可用性。可选的,所述第一 SP,还用于当所述第一 SP为主用SP,所述第二 SP为备用SP,且 存在至少一个BMC与所述第二 SP之间的通信连接为正常时,所述第一 SP发出告警信息,以显示所述第一 SP与所述第二 SP之间的通信链路存在异常。以上所述,仅为本发明的具体实施方式
,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
权利要求
1.一种主备倒换的仲裁方法,其特征在于,包括 主用服务处理器SP检测并统计与自身通信连接正常的基板管理控制器BMC的个数,当检测到存在至少一个BMC与所述主用SP之间的通信连接存在异常时,向备用SP发送通信连接检测指令,以触发所述备用SP检测自身与各个BMC之间的通信连接是否正常,并统计与所述备用SP通信连接正常的BMC的个数; 当与所述主用SP通信连接正常的BMC个数小于与所述备用SP通信连接正常的BMC个数,且与所述主用SP通信连接正常的BMC均与所述备用SP存在正常通信连接时,所述主用SP向所述备用SP发送主备倒换指令,以指示所述备用SP将自身的IP地址修改为所述主用SP的IP地址。
2.根据权利要求I所述的方法,其特征在于,还包括 当与所述主用SP通信连接正常的BMC个数大于或者等于与所述备用SP通信连接正常 的BMC个数时,所述主用SP保持现有状态不变。
3.—种主备倒换的仲裁方法,其特征在于,包括 第一 SP检测与之相连的第二 SP发送的心跳信号,所述心跳信号用于表明所述第二 SP的状态正常; 当所述第一 SP检测不到所述第二 SP发送的心跳信号时,向与所述第二 SP连接的各个BMC发送通信连接检测指令,以触发所述各个BMC检测各自与所述第二 SP之间的通信连接是否正常; 当所述第一 SP为备用SP,所述第二 SP为主用SP,且所述各个BMC与所述第二 SP之间的通信连接均不正常时,所述第一 SP将自身的IP地址修改为所述主用SP的IP地址。
4.根据权利要求3所述的方法,其特征在于,在所述第一SP将自身的IP地址修改为所述主用SP的IP地址之后,还包括 发出第一告警信息,以显示所述第二 SP的状态异常。
5.根据权利要求3所述的方法,其特征在于,还包括 当所述第一 SP为备用SP,所述第二 SP为主用SP,且存在至少一个BMC与所述第二 SP之间的通信连接为正常时,所述第一 SP发出第二告警信息,以显示所述第一 SP与所述第二SP之间的通信链路存在异常。
6.根据权利要求3所述的方法,其特征在于,还包括 当所述第一 SP为主用SP,所述第二 SP为备用SP,且存在至少一个BMC与所述第二 SP之间的通信连接为正常时,所述第一 SP发出第三告警信息,以显示所述第一 SP与所述第二SP之间的通信链路存在异常; 当所述各个BMC与所述第二 SP之间的通信连接均不正常时,所述第一 SP发出第四告警信息,以显示所述第二 SP的状态异常。
7.—种主用服务处理器SP,用于对与之相连的基板管理控制器BMC进行管理,其特征在于,所述主用SP,包括 第一处理单元,用于检测并统计与所述主用SP通信连接正常的BMC的个数,当检测到存在至少一个BMC与所述主用SP之间的通信连接存在异常时,向与所述主用SP连接的备用SP发送通信连接检测指令,以触发所述备用SP检测自身与各个BMC之间的通信连接是否正常,并统计与所述备用SP通信连接正常的BMC的个数;第二处理单元,用于当与所述主用SP通信连接正常的BMC个数小于与所述备用SP通信连接正常的BMC个数,且与所述主用SP通信连接正常的BMC均与所述备用SP存在正常通信连接时,向所述备用SP发送主备倒换指令,以指示所述备用SP将自身的IP地址修改为所述主用SP的IP地址。
8.根据权利要求7所述的主用服务处理器,其特征在于, 所述第二处理单元,还用于当与所述主用SP通信连接正常的BMC个数大于或者等于与所述备用SP通信连接正常的BMC个数时,所述主用SP保持现有状态不变。
9.一种服务处理器SP,其特征在于,包括 检测单元,用于检测与所述SP相连的另一 SP发送的心跳信号,所述心跳信号用于表明所述另一 SP的状态正常; 发送单元,用于当检测不到所述另一 SP发送的心跳信号时,向与所述另一 SP连接的各个BMC发送通信连接检测指令,以触发所述各个BMC检测各自与所述另一 SP之间的通信连接是否正常; 处理单元,用于当所述SP为备用SP,所述另一 SP为主用SP,且所述各个BMC与所述另一SP之间的通信连接均不正常时,将所述SP自身的IP地址修改为所述另一 SP的IP地址。
10.根据权利要求9所述的SP,其特征在于,还包括 报警单元,用于在所述处理单元将所述SP的IP地址修改为所述另一 SP的IP地址之后,发出第一告警信息,以显示所述另一 SP的状态异常。
11.一种小型机系统,包括主用服务处理器SP、备用SP、以及与所述主用SP和所述备用SP分别连接的多个BMC;所述主用SP用于对所述各个BMC进行管理,其特征在于, 所述主用SP,还用于检测并统计与自身通信连接正常的BMC的个数,当检测到存在至少一个BMC与所述主用SP之间的通信连接存在异常时,向所述备用SP发送通信连接检测指令; 所述备用SP,用于在接收到所述主用SP发送的通信连接检测指令之后,检测自身与各个BMC之间的通信连接是否正常,并统计与自身通信连接正常的BMC的个数; 所述主用SP,还用于当与所述主用SP通信连接正常的BMC个数小于与所述备用SP通信连接正常的BMC个数,且与所述主用SP通信连接正常的BMC均与所述备用SP存在正常通信连接时,所述主用SP向所述备用SP发送主备倒换指令; 所述备用SP,还用于在接收到所述主用SP发送的主备倒换指令后,将自身的IP地址修改为所述主用SP的IP地址。
12.如权利要求11所述的系统,其特征在于,所述主用SP,还用于当与所述主用SP通信连接正常的BMC个数大于或者等于与所述备用SP通信连接正常的BMC个数时,保持现有状态不变。
13.—种小型机系统,包括第一服务处理器SP、第二 SP、以及与所述第一 SP和所述第二SP分别连接的多个基板管理控制器BMC,所述第一 SP与所述第二 SP通过互相发送心跳信号来告知对方自身的状态正常,所述第一 SP和所述第二 SP可以在主用状态和备用状态之间切换,当所述第一 SP为主用SP时,所述第二 SP为备用SP ;当所述第一 SP为备用SP时,所述第二 SP为主用SP ;其特征在于, 所述第一 SP,用于在检测不到所述第二 SP发送的心跳信号时,向与所述第二 SP连接的各个BMC发送通信连接检测指令; 所述BMC,用于在接收到所述第一 SP发送的通信连接检测指令后,检测自身与所述第二SP之间的通信连接是否正常; 所述第一 SP,还用于当所述第一 SP为备用SP,所述第二 SP为主用SP,且所述各个BMC与所述第二 SP之间的通信连接均不正常时,所述第一 SP将自身的IP地址修改为所述第二SP的IP地址。
14.如权利要求13所述的系统,其特征在于,所述第一 SP,还用于当所述第一 SP为主用SP,所述第二 SP为备用SP,且所述检测结果中指示存在至少一个BMC与所述第二 SP之间的通信连接为正常时,所述第一 SP发出告警信息,以显示所述第一 SP与所述第二 SP之间的通信链路存在异常。
全文摘要
本发明公开了一种主备倒换的仲裁方法、装置和系统,涉及小型机技术领域,解决了在主备倒换时因为没有关注主备SP的管理能力,而导致系统可用性不高的问题,同时也解决了由于添加第三方仲裁者而带来额外成本的问题。所述方法包括主用SP向备用SP发送通信连接检测指令;当与所述主用SP通信连接正常的BMC个数小于与所述备用SP通信连接正常的BMC个数,且与所述主用SP通信连接正常的BMC均与所述备用SP存在正常通信连接时,所述主用SP向所述备用SP发送主备倒换指令。本发明实施例主要用于主备倒换的过程中。
文档编号H04L12/24GK102638369SQ201210088019
公开日2012年8月15日 申请日期2012年3月29日 优先权日2012年3月29日
发明者吴登奔, 张羽, 石峰 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1