一种控制服务器风扇的方法及装置与流程

文档序号:13512415阅读:194来源:国知局
一种控制服务器风扇的方法及装置与流程

本发明涉及信息技术领域,特别是涉及一种控制服务器风扇的方法及其装置。



背景技术:

服务器具较高的稳定性、安全性、运算效率高,广泛应用于各个领域。很多公司对服务器的需求量非常大,需要服务器集群来完成庞大的数据运算或事务处理。随着服务器所用芯片的频率越来越高,服务器集群的数目越来越大,同时客户对于服务器的稳定性方面的要求越来越高。在目前的服务器集群系统中,对服务器主板的管理采用的芯片大多可以实现对服务器温度以及服务器风扇转速的实时监测及控制,从而实现对服务器的更好维护。在服务器集群环境下中,芯片会受到干扰,比如电磁辐射,会导致芯片失效。一旦芯片失效,服务器所用风扇失去控制,服务器所用芯片会产生大量的热,如不及时散热,整个服务器有工作异常的风险,进而导致整个服务器集群出现风险。

现有的服务器风扇管理设计中,一旦芯片失效之后,使用固定方式控制风扇,使服务器风扇维持固定的全速转动状态,因此,采用固定方式不能很好的控制风扇的功耗,造成资源浪费。

基于上述原因,亟需一种控制服务器风扇的方法。



技术实现要素:

本申请实施例中提供了一种控制服务器风扇的方法,能够合理的进行集群服务器中失效服务器的风扇控制。

第一方面,提供一种控制服务器风扇的方法,第一服务器包括第一服务器的温度控制芯片和第一风扇,所述第一服务器的温度控制芯片包括第一自适应协处理和第一处理器包括:第一自适应协处理器确定第一处理器失效;所述第一自适应协处理器向第二服务器的温度控制芯片发送请求报文,所述报文请求用于请求所述第二服务器的温度控制芯片接管所述第一服务器关联的第一风扇,其中,所述第一服务器的温度控制芯片和所述第二服务器的温度控制芯片之间通过can总线互联;所述第一自适应协处理器接收所述第二服务器的温度控制芯片返回的响应报文,并根据所述响应报文确定所述第二服务器的温度控制芯片是否接管所述第一风扇。

结合第一方面,在第一方面的第一种可能的实现方式中,所述自适应处理器确定第一服务器芯片失效,包括:当所述自适应处理器未接收到所述第一处理器的喂狗信号,则确定所述第一处理器失效。

结合第一方面及其上述实现方式,在第一方面的第二种可能的实现方式中,所述方法还包括:当确定所述第一处理器失效后,所述自适应处理器接收策略选择模块发送的所述第一风扇的温度参数;

所述第一自适应协处理器向所述第二服务器的温度控制芯片发送数据报文,所述数据报文中包括所述第一风扇的温度参数。

结合第一方面及其上述实现方式,在第一方面的第三种可能的实现方式中,在所述第一自适应协处理器向所述第二服务器的温度控制芯片发送数据报文后,所述方法还包括:所述第一自适应协处理器接收所述第二服务器的温度控制芯片发送的风扇参数,所述风扇参数与所述温度参数存在映射关系;将所述风扇参数转发至所述策略选择模块,所述风扇参数用于所述策略选择模块根据所述风扇参数控制所述第一风扇。

结合第一方面及其上述实现方式,在第一方面的第四种可能的实现方式中,所述根据响应报文确定所述第二服务器的温度控制芯片是否接管所述第一风扇,包括:当所述响应报文中携带的为确认接管消息时,确定所述第二服务器的温度控制芯片接管所述第一风扇;当所述响应报文中携带的为放弃接管消息时,确定所述第二服务器的温度控制芯片不接管所述第一风扇,其中,所述响应报文中携带所述第二服务器芯片的标识。

第二方面,提供一种网络设备,包括:确定单元,所述确定单元用于确定第一处理器失效;发送单元,所述发送单元用于向第二服务器的温度控制芯片发送请求报文,所述报文请求用于请求所述第二服务器的温度控制芯片接管所述第一服务器关联的第一风扇,其中,所述第一服务器的温度控制芯片和所述第二服务器的温度控制芯片之间通过can总线互联;所述第一自适应协处理器接收所述第二服务器的温度控制芯片返回的响应报文,并根据所述响应报文确定所述第二服务器的温度控制芯片是否接管所述第一风扇。

结合第二方面,在第二方面的第一种可能的实现方式中,所述确定单元具体用于:当所述自适应处理器未接收到所述第一处理器的喂狗信号,则确定所述第一处理器失效。

结合第二方面及其上述实现方式,在第二方面的第二种可能的实现方式中,所述接收单元用于当确定所述第一处理器失效后,接收策略选择模块发送的所述第一风扇的温度参数;所述发送单元还用于向所述第二服务的温度控制器芯片发送数据报文,所述数据报文中包括所述第一风扇的温度参数。

结合第二方面及其上述实现方式,在第二方面的第三种可能的实现方式中,所述接收单元还用于:接收所述第二服务器的温度控制芯片发送的风扇参数,所述风扇参数与所述温度参数存在映射关系;所述发送单元还用于将所述风扇参数转发至所述策略选择模块,所述风扇参数用于所述策略选择模块根据所述风扇参数控制所述第一风扇。

结合第二方面及其上述实现方式,在第二方面的第三种可能的实现方式中,所述确定单元具体用于:当所述响应报文中携带的为确认接管消息时,确定所述第二服务器的温度控制芯片接管所述第一风扇;当所述响应报文中携带的为放弃接管消息时,确定所述第二服务器的温度控制芯片不接管所述第一风扇,其中,所述响应报文中携带所述第二服务器芯片的标识。

第三方面,提供一种受控终端,包括:处理器;用于存储处理器的执行指令的存储器;

其中,所述处理器被配置为执行上述第一方面或第一方面的任一种可能的实现方式。

因此,本申请实施例提供的方法,通过将不同服务器的温度控制芯片进行互联,可以在某个服务器的温度控制芯片失效后,服务器集群中的其他温度控制芯片接替失效温度控制芯片,接管控制失效芯片原先控制的风扇的运行及温度检测。这样,可以大大降低整个服务器集群出问题的风险,同时有利于降低散热的功耗。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1示出了本申请一个实施例的服务器集群风扇控制系统的示意图

图2示出了本申请一个实施例的方法的示意性流程图。

图3示出了本申请一个实施例的请求报文的示意性格式图。

图4示出了本申请一个实施例的响应报文的示意性格式图。

图5示出了本申请一个数据报文的示意性格式图。

图6示出了本申请一个实施例的装置的示意性结构图。

图7示出了本申请另一实施例的装置的示意性结构框图。

图8示出了本申请一个实施例的受控终端的示意性结构图。

具体实施方式

为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

应理解,温度控制芯片都是指进行温度控制的芯片,例如该芯片可以为基板管理控制器(baseboardmanagementcontroller,bmc),本申请不限于此。

如图1所示,图中示出了从c0到c16这样16个服务器芯片,每个服务器芯片存在一条控制器局域网络(controllerareanetwork,can)总线,以便于各个服务器芯片质检的互联,这些can总线用于互相传输每个服务器的温度参数和风扇参数。

图2示出了本申请一个实施例的方法的示意性流程图。图2实施例的方法的执行主体可以为包括第一自适应协处理器的网络设备,例如,可以为服务器。

如图2所示,该方法200包括:

步骤210,第一自适应协处理器确定第一处理器失效。

可选地,在步骤210中,第一自适应协处理器确定第一处理器失效,包括:当所述自适应处理器未接收到所述第一处理器的喂狗信号,则确定所述第一处理器失效。

例如,具体的,第一服务器的处理器发送的喂狗信号格式如下:处理器周期发送20组编码为0x55aa的脉冲信号,第一自适应协处理器检测脉冲数据,每20组脉冲信号只要检测到18组及以上完整的0x55aa数据,就认为第一芯片没有失效;反之,认为第一芯片失效,进入自适应处理流程。

应理解,上述喂狗信号仅仅是示例性的,本申请不限于此。

其中,第一处理器、第二处理器可以为arm处理器,本申请不做限定。

应理解,第一服务器包括第一服务器的温度控制芯片和第一风扇,所述第一服务器的温度控制芯片包括第一自适应协处理和第一处理器;第二服务器包括第二服务器的温度控制芯片和第一风扇,所述第二服务器的温度控制芯片包括第二自适应协处理和第二处理器。在下述实施例中的第一、第二仅仅为了区分不同的消息、参数或者服务器风扇等,例如第一服务器芯片和第二服务器芯片仅仅是为了区分两个不同的服务器芯片,本申请不做限定。

应理解,第一服务器的温度控制芯片和第二服务器的温度控制芯片都是指进行温度控制的芯片,例如该芯片可以为基板管理控制器(baseboardmanagementcontroller,bmc),本申请不限于此。

步骤220,第一自适应协处理器向第二服务器的温度控制芯片发送请求报文,该报文请求用于请求第二服务器的温度控制芯片接管第一服务器关联的第一风扇,其中,第一服务器的温度控制芯片和第二服务器的温度控制芯片之间通过can总线互联。

可选地,在步骤220中,第二服务器的温度控制芯片可以为编号可以为比第一服务器的温度控制芯片编号低一位的芯片,如:本bmcid为5,那么请求报文的目的id为4,如果响应报文确认,则选择id为4的bmc芯片托管,以此类推。

如图3所示,图3示出了本申请一个实施例的请求报文的示意性格式图。如图3所示,其中,以bmc芯片为例,mes为报文类型00:表示请求报文。

:表示选择哪个bmc芯片作为托管bmc。选择范围为0-31。

:表示哪个bmc芯片发出的请求。选择范围为0-31。

:为保留位。

应理解,上述请求报文的格式仅仅是示例性的,本申请不做限定。

步骤230,第一自适应协处理器接收所述第二服务器返回的响应报文,并根据该响应报文确定第二服务器的温度控制芯片是否接管第一风扇。

可选地,作为本申请一个实施例,所述根据响应报文确定所述第二服务器的温度控制芯片是否接管所述第一风扇,包括:当所述响应报文中携带的为确认接管消息时,确定所述第二服务器的温度控制芯片接管所述第一风扇;当所述响应报文中携带的为放弃接管消息时,确定所述第二服务器的温度控制芯片不接管所述第一风扇,其中,所述响应报文中携带所述第二服务器芯片的标识。

如图4所示,图4示出了本申请一个实施例的响应报文的示意性格式图。如图3、4所示,其中,mes为报文类型11:表示响应报文,也可以称之为确认报文。

:表示哪个bmc芯片发出的托管请求。选择范围为0-31。

:表示哪个bmc芯片发出的响应。选择范围为0-31。

:为状态位。000:标志确认托管,111:表示放弃托管。

可选地,作为本申请一个实施例,上述方法还包括:当确定第一服务器芯片失效后,自适应处理器接收策略选择模块发送的第一风扇的温度参数;自适应处理器想第二服务器芯片发送数据报文,该数据报文中包括第一风扇的温度参数。

具体地,当第一服务芯片失效后,第一服务器芯片的失效位置置高,当自适应处理器检测到确定第一服务器芯片失效的喂狗信号后,该第一服务器的策略选择模块将第一风扇的温度参数发送给第一自适应协处理器,自适应处理器接收该第一风扇的温度参数并携带在数据报文中发送至第二芯片,第二芯片根据风扇控制策略和收到的第一风扇的温度参数,通过数据报文向自适应处理器发送第一风扇的风扇参数,其中,风扇参数和温度参数存在映射的关系。

第一自适应协处理器发送风扇参数到策略选择模块,以脉冲宽度调制技术(pulsewidthmodulation,pwm)的形式作用于第一风扇,从而实现对第二芯片对第一风扇的接管控制。

具体地,图5示出了本申请一个数据报文的示意性格式图。

其中,数据报文,主要完成两个芯片之间数据的发送,分为请求数据报文和控制数据报文两种。数据请求报文,包含温度检测的信息,由第一服务器芯片的第一自适应协处理器发出;数据控制报文包含风扇控制参数,由第二服务器芯片的第一自适应协处理器发出。

数据报文格式如图5所示。

其中,mes为报文类型01:表示数据请求报文。10:表示为数据控制报文。

:mes为01表示选择哪个bmc芯片作为托管bmc;mes为10表示哪个bmc芯片发出的请求。选择范围为0-31。

:mes为01表示哪个bmc芯片发出的请求;mes为10表示选择哪个bmc芯片作为托管bmc。选择范围为0-31。

:为保留位。

:为温度数据/控制参数。

因此,本申请实施例提供的方法,通过将不同服务器的温度控制芯片进行互联,可以在某个服务器的温度控制芯片失效后,服务器集群中的其他温度控制芯片接替失效温度控制芯片,接管控制失效芯片原先控制的风扇的运行及温度检测。这样,可以大大降低整个服务器集群出问题的风险,同时有利于降低散热的功耗。

图6示出了本申请一个实施例的装置的示意性结构图。如图6所示,其中,

图中示出的第一自适应协处理器可以执行图2至图5实施例中由第一自适应协处理器执行的方法。具体地,例如,完成对can控制器的控制、风扇与温度参数信息的传输,内部包含wdt,监测温度控制芯片发送的喂狗信号,控制策略选择模块通路的选择。完成被托管温度控制芯片的信息发送。

进一步地,其中,can收发器,用于完成差分信号的收发;can控制器,完成串并信息的转换,存储信息;策略选择模块,根据温度控制芯片的失效标志选择风扇控制参数及温度参数的发送。

图7示出了本申请另一实施例的装置的示意性结构框图。如图7所示,该网络设备700包括:

确定单元710,所述确定单元710用于确定第一处理器失效;

发送单元720,所述发送单元720用于向第二服务器的温度控制芯片发送请求报文,所述报文请求用于请求所述第二服务器的温度控制芯片接管所述第一服务器关联的第一风扇,其中,所述第一服务器的温度控制芯片和所述第二服务器的温度控制芯片之间通过can总线互联;

接收单元730,所示接收单元730用于接收所述第二服务器的温度控制芯片返回的响应报文,并根据所述响应报文确定所述第二服务器的温度控制芯片是否接管所述第一风扇。

可选地,作为本申请一个实施例,所述确定单元710具体用于:

当所述自适应处理器未接收到所述第一处理器的喂狗信号,则确定所述第一处理器失效。

可选地,作为本申请一个实施例,接收单元730用于当确定所述第一处理器失效后,接收策略选择模块发送的所述第一风扇的温度参数;所述发送单元720还用于向所述第二服务的温度控制器芯片发送数据报文,所述数据报文中包括所述第一风扇的温度参数。

可选地,作为本申请一个实施例,所述接收单元730还用于:接收所述第二服务器的温度控制芯片发送的风扇参数,所述风扇参数与所述温度参数存在映射关系;所述发送单元720还用于:将所述风扇参数转发至所述策略选择模块,所述风扇参数用于所述策略选择模块根据所述风扇参数控制所述第一风扇。

可选地,作为本申请一个实施例,所述确定单元710具体用于:当所述响应报文中携带的为确认接管消息时,确定所述第二服务器的温度控制芯片接管所述第一风扇;当所述响应报文中携带的为放弃接管消息时,确定所述第二服务器的温度控制芯片不接管所述第一风扇,其中,所述响应报文中携带所述第二服务器芯片的标识。

图8为本发明实施例提供的一种受控终端的结构示意图,如图8所示,所述受控终端800可以包括:处理器810、存储器820及通信单元830。这些组件通过一条或多条总线进行通信,本领域技术人员可以理解,图中示出的服务器的结构并不构成对本申请的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

图8所示的受控终端能够实现图1至图6实施例中示出的方法,为了简洁起见,在此不再赘述。

其中,所述通信单元830,用于建立通信信道,从而使所述存储设备可以与其它设备进行通信。接收其他设备发送的用户数据或者向其他设备发送用户数据。

所述处理器810,为存储设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器820内的软件程序和/或模块,以及调用存储在存储器内的数据,以执行电子设备的各种功能和/或处理数据。所述处理器可以由集成电路(integratedcircuit,简称ic)组成,例如可以由单颗封装的ic所组成,也可以由连接多颗相同功能或不同功能的封装ic而组成。举例来说,处理器810可以仅包括中央处理器(centralprocessingunit,简称cpu)。在本申请实施方式中,cpu可以是单运算核心,也可以包括多运算核心。

所述存储器820,用于存储处理器810的执行指令,存储器820可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。

当存储器820中的执行指令由处理器810执行时,使得终端800能够执行以下上述方法实施例中的部分或全部步骤。

具体实现中,本申请还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本申请提供的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-onlymemory,简称:rom)或随机存储记忆体(英文:randomaccessmemory,简称:ram)等。

本领域的技术人员可以清楚地了解到本申请实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。

以上所述的本申请实施方式并不构成对本申请保护范围的限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1