服务器的控制方法和服务器的控制设备的制造方法

文档序号:9673006阅读:484来源:国知局
服务器的控制方法和服务器的控制设备的制造方法
【技术领域】
[0001]本发明涉及信息技术领域,尤其涉及一种服务器的控制方法和服务器的控制设备。
【背景技术】
[0002]服务器是网络环境中的高性能计算机,能够侦听网络上的其他计算机(客户机)提交的服务请求,并提供相应的服务。按照体系架构来区分,服务器主要分为两类:非X86服务器和X86服务器。X86服务器又称复杂指令集架构服务器,即通常所讲的PC服务器,它是基于PC机体系结构,使用Intel或其它兼容x86指令集的处理器芯片的服务器。
[0003]随着信息化技术的进一步发展,服务器在日常的IT(Informat1n Technical,信息技术)应用中变得越来越重要。在服务器上承载的业务也越来越多。由于服务器的异常或者宕机,往往会给客户带来非常大的损失。因此,不管是在通用的服务器上,还是在关键应用服务器上,服务器的RAS(Reliability,Availability and Serviceability,可靠性、可用性和可服务性)特性都变得越来越重要。
[0004]所谓的RAS,即所谓的可靠性、可用性、可服务性,是服务器的重要指标。如何实现服务器具有很高的RAS特性,同时又具有较好的性价比,是服务器开发当中重点关注的。特别是对于中高端服务器,完整的RAS特性是衡量一台服务器是否高端的主要指标。
[0005]在通常的中高端X86服务器或者更高端的小型机中,一般都会要求服务器能够支持硬分区。所谓的硬分区,就是将一个服务器分隔为几个完全独立的子服务器。这些子服务器是一个完整的服务器系统,它们拥有自己的B10S(Basic Input Output System,基本输入输出系统)和操作系统,与通常所说的单台服务器类似。例如,一个8路的X86服务器硬分区成2个4路服务器,或者是4个2路服务器,这种通过硬分区分隔出来的服务器是可以独立运行、独立上电、独立下电、独立管理。
[0006]一般的X86服务器主要有CPU(Central Processing Unit,中央处理器)、PCH(Platform Controller Hub,平台控制器集线器)、内存、硬盘、插卡等多个部件组成。对于支持硬分区功能的X86服务器,需要配置多个PCH芯片,一般来说是系统支持几个硬分区就需要配置多个PCH芯片。如图1(a)所示是一个8路服务器的系统框架,图1(b)是一个8路服务器硬分区成2个4路服务器的系统框架。
[0007]在图1(a)中,是8P独立模式,与CPU1相连的PCH为主用PCH,与其他处理器相连的PCH为从PCH。从PCH有两种工作模式,第一种是该PCH被禁止,对外不能提供任何功能,第二种是该PCH处于部分功能可用状态,比如该PCH上的USB、SATA功能还是可用的,但不能参与整个服务器的管理功能。
[0008]在图1 (b)中,是8P分区模式,上面4个CPU及PCH组成一个独立的系统,下面4个CPU及PCH组成一个独立的系统,两个系统之间的QPI(Quick Path Interconnect,快速路径互联)连接被断开,彼此之间没有任务的交互。
[0009]在现有技术中,系统的RAS存在着较大的缺点:当服务器未进行分区时,如果CPU1所连的主用PCH异常(例如芯片损坏),或主用PCH所连的FLASH出现异常(例如芯片损坏,FLASH所在的B1S被异常擦除),整个服务器就处于宕机状态。此时运行在该服务器上的业务将被中断。

【发明内容】

[0010]本发明实施例提供一种服务器的控制方法和服务器的控制设备,实现在服务器启动异常时,保证业务的正常运行。
[0011]本发明实施例提供了一种服务器中的控制设备,所述服务器包括至少两个中央处理器CPU和至少两个平台控制集线器PCH,每个所述PCH与至少一个所述CPU相连,所述控制设备包括:
[0012]配置单元,用于配置所述CPU的标号,并将其中一个CPU标记为主用CPU;在所述服务器启动异常时,将与正常PCH连接的CPU配置为主用CPU,所述服务器启动异常包括与主用CHJ连接的PCH或与主用CPU连接的PCH相连的Flash异常导致的基本输入输出系统B1S启动异常;
[0013]重启单元,用于在所述服务器启动异常时,触发所述服务器重新启动,并触发所述配置单元将与正常PCH连接的CPU配置为主用CPU。
[0014]作为一种可选的实现方式,所述配置单元包括:
[0015]管脚配置单元,用于配置所述至少两个CPU的管脚,通过配置所述管脚的值将其中一个CPU配置为主用CPU;
[0016]信息接收单元,用于接收所述重启单元发送的所述服务器启动异常的信息,触发所述管脚配置单元将与正常PCH连接的一个CPU配置为主用CPU。
[0017]作为一种可选的实现方式,所述重启单元包括:
[0018]判断单元,用于判断在预设时间内所述服务器是否启动异常;
[0019]触发单元,用于在所述判断单元判断所述服务器启动异常时,触发所述服务器重新启动,并触发所述配置单元将与正常PCH连接的一个CPU配置为主用CPU。
[0020]作为一种可选的实现方式,所述触发单元包括:
[0021]第一触发单元,用于在所述服务器启动异常时,通过所述B1S预先设置的寄存器触发所述服务器重新启动;
[0022]第二触发单元,用于在所述服务器重新启动过程中,判断是否存在导致所述服务器启动异常的异常信息,在存在所述异常信息时,触发所述配置单元将与正常PCH连接的一个CPU配置为主用CPU,所述异常信息是在所述服务器重启前由所述B1S触发记录的信息。
[0023]作为一种可选的实现方式,所述服务器是支持硬分区功能的服务器,所述服务器中的CPU的管脚连接到所述控制设备中。
[0024]作为一种可选的实现方式,所述控制设备在所述服务器的复杂可编程逻辑器件CPLD或现场可编程门阵列FPGA中实现。
[0025]本发明实施例还提供了一种服务器控制方法,所述方法应用于服务器中,所述服务器包括至少两个中央处理器CPU和至少两个平台控制集线器PCH,每个所述PCH与至少一个所述CPU相连,所述方法包括:
[0026]配置所述CPU的标号,并将其中一个CPU标记为主用CPU;
[0027]判断所述服务器是否启动异常,如果启动异常则记录异常信息,并触发所述服务器重新启动;所述异常信息包括与主用CPU连接的PCH或与主用CPU连接的PCH相连的F1 a sh异常导致的基本输入输出系统B1S启动异常;
[0028]在所述服务器重新启动过程中,根据所述记录的异常信息,将与正常PCH连接的CHJ配置为主用CPU。
[0029]作为一种可选的实现方式,所述配置CPU的标号具体是配置所述CPU的管脚,所述将其中一个CHJ标记为主用CPU,是通过配置所述管脚的值将其中一个CPU配置为主用CPU。
[0030]作为一种可选的实现方式,判断所述服务器是否启动异常包括:
[0031]设定定时器,所述定时器的时长小于所述服务器看门狗的定时器时长;
[0032]在所述服务器启动过程中,如果在所述定时器设定时间内所述看门狗未被禁止,则判定所述服务器启动异常。
[0033]作为一种可选的实现方式,所述方法是由复杂可编程逻辑器件CPLD或现场可编程门阵列FPGA实现。
[0034]作为一种可选的实现方式,所述触发服务器重新启动是通过设置在所述CPLD或所述FPGA中的重启寄存器触发所述服务器重新启动。
[0035]作为一种可选的实现方式,服务器是支持硬分区功
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1