整机柜服务器的散热调控方法、装置、设备及存储介质与流程

文档序号:14725207发布日期:2018-06-19 05:53阅读:134来源:国知局
本发明涉及计算机
技术领域
,特别是涉及一种整机柜服务器的散热调控方法、装置、设备以及计算机可读存储介质。
背景技术
:随着用户对服务器性能需求的提高,用户对服务器计算节点的需求数量也越来越多。整机柜服务器在对节点的集成和管理上,与传统服务器相比具有很大的优势,并且整机柜服务器在实际应用上也越来越广泛。整机柜服务器采用集中供电,集中散热,统一管理计算节点,以及计算资源、存储资源模块化的设计。根据整机柜计算节点在工作中温度的变化,散热系统通过风扇的转速大小来稳定整个机柜的温度,以提供一个良好的环境来支持服务器的运转。在现有的整机柜服务器的散热策略中,风扇的散热仅与开关机、计算节点的温度变化、环境温度、传感器温度变化等有关。整机柜服务器在长期使用中,难免会遇到计算节点异常的情况。在计算节点异常的情况下,服务器监控管理模块对交换机、风扇、电源和节点等设备进行的监控操作将会产生误差。现有技术中,散热系统中风扇的潜力尚未被激发出来。若服务器计算节点宕机或发生系统性异常,温度已经失控,风扇对其的控制也将失去意义。并且鉴于整机柜服务器多计算节点的特点,用户无法快速的定位异常节点,使得问题无法立刻解决。失去控制的风扇无法调节温度也使得计算节点的故障被加重。综上所述可以看出,如何高效快速地排查异常计算节点是目前有待解决的问题。技术实现要素:本发明的目的是提供一种整机柜服务器的散热调控方法、装置、设备以及计算机可读存储介质,已解决现有技术中排查异常计算节点的效率较低的问题。为解决上述技术问题,本发明提供一种整机柜服务器的散热调控方法,包括:依据预设的整机柜服务器计算节点与风扇的对应关系,判断各个计算节点与所述各个计算节点对应的风扇是否全部在位;当所述各个计算节点与所述各个计算节点对应的风扇全部在位时,以实时轮寻的方式依次判断所述整机柜服务器的各个计算节点是否出现异常;将出现异常的计算节点所对应风扇的转速由当前转速提高至预设的警示转速,以便于依据风扇转速的变化得知计算节点的异常状况。优选地,所述整机柜服务器的各个计算节点分别对应预设个数的风扇。优选地,所述以实时轮寻的方式依次判断所述整机柜服务器的全部计算节点是否出现异常包括:若当前所判断的计算节点出现:计算节点与所述整机柜服务器之间通信失败、计算节点自身传感器异常、计算节点处于升级过程的状态中至少一种状态时,则当前判断的计算节点出现异常。优选地,所述将出现异常的计算节点所对应风扇的转速由当前转速提高至预设的警示转速包括:将出现异常的计算节点所对应风扇的转速由当前转速提高至全速。优选地,所述将出现异常的计算节点所对应风扇的转速由当前转速提高至预设的警示转速后还包括:实时检测所述整机柜服务器的各个计算节点,当检测到某个异常的计算节点排除异常时,将与当前排除异常的计算节点所对应的风扇恢复为正常调控状态,其中,所述风扇的正常调控状态为依据预设的散热策略以及与各个风扇对应的计算节点的温度大小对所述风扇的转速进行控制的状态。本发明还提供了一种整机柜服务器的散热调控装置,包括:第一判断模块,用于依据预设的整机柜服务器计算节点与风扇的对应关系,判断各个计算节点与所述各个计算节点对应的风扇是否全部在位;第二判断模块,用于当所述各个计算节点与所述各个计算节点对应的风扇全部在位时,以实时轮寻的方式依次判断所述整机柜服务器的各个计算节点是否出现异常;预警模块,用于将出现异常的计算节点所对应风扇的转速由当前转速提高至预设的警示转速,以便于依据风扇转速的变化得知计算节点的异常状况。优选地,所述第二判断模块具体用于:若当前所判断的计算节点出现:计算节点与所述整机柜服务器之间通信失败、计算节点自身传感器异常、计算节点处于升级过程的状态中至少一种状态时,则当前判断的计算节点出现异常。优选地,所述预警模块具体用于:将出现异常的计算节点所对应风扇的转速由当前转速提高至全速。本发明还提供了一种整机柜服务器的散热调控设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现上述一种整机柜服务器的散热调控方法的步骤。本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述一种整机柜服务器的散热调控方法的步骤。本发明所提供的整机柜服务器的散热调控方法,依据预设的整机柜服务器计算节点与风扇的对应关系,判断各个计算节点与所述各个计算节点对应的风扇是否全部在位;当各计算节点槽位对应的风扇全部在位时,依次遍历各个计算节点,判断各个计算节点是否异常;将异常的计算节点的风扇的转速由当前转速提高至警示转速,以便于根据风扇转速的变化得知计算节点的异常状况。在整机柜服务器的计算节点正常的情况下,计算节点所对应的风扇根据计算节点温度大小对转速进行调控;因此,在计算节点异常的情况下,将计算节点所对应的风扇的转速由正常转速提高至可以达到预警效果的转速,工作人员便可以通过风扇异常高的转速快速排除异常的计算节点;并且,提高异常计算节点对应风扇的转速,进一步加快了异常计算节点的散热,从而对整机柜服务器的异常节点起到了预警效果的同时保证了系统的稳定性。附图说明为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本发明所提供的整机柜服务器的散热调控方法的第一种具体实施例的流程图;图2为整机柜服务器的计算节点的一种排列示意图;图3为整机柜服务器的风扇的一种排列示意图;图4为本发明所提供的整机柜服务器的散热调控方法的第二种具体实施例的流程图;图5为本发明实施例提供的一种整机柜服务器的散热调控装置的结构框图。具体实施方式本发明的核心是提供一种整机柜服务器的散热调控方法、装置、设备以及计算机可读存储介质,可以快速高效的排除整机柜服务器的异常计算节点。为了使本
技术领域
的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。请参考图1,图1为本发明所提供的整机柜服务器的散热调控方法的第一种具体实施例的流程图;具体操作步骤如下:步骤S101:依据预设的整机柜服务器计算节点与风扇的对应关系,判断各个计算节点与所述各个计算节点对应的风扇是否全部在位;所述整机柜服务器的计算节点槽位与风扇的对应关系是依据散热要求预先定义的;在计算节点正常的情况下,风扇和刀片按照散热工程师给的散热策略正常散热。如图2所示,一台整机柜服务器的正面槽位上可以包括多个计算节点,如8个计算节点、10个计算节点。计算节点的类型也可以包括全宽计算节点和半宽计算节点;且计算节点的排列方式不限于图2中计算节点依次由下到上的方式。如图3所示,整机柜服务器的背面槽位上可以安装有多个风扇,如8个,10个等,且各个风扇的排列方式不限于图3中的方式。一个计算节点可以对应多个风扇,如:一个计算节点对应4个风扇,或一个计算节点可以对应与计算节点相距距离最近的6个风扇;如表1所示,表1为整机柜服务器的计算节点与风扇的一种对应关系表:表1计算节点风扇对应配置11,2,3,6,7,821,2,3,6,7,831,2,3,6,7,842,3,4,7,8,952,3,4,7,8,962,3,4,7,8,973,4,5,8,9,1083,4,5,8,9,10步骤S102:当所述各个计算节点与所述各个计算节点对应的风扇全部在位时,以实时轮寻的方式依次判断所述整机柜服务器的各个计算节点是否出现异常;若当前所判断的计算节点出现:计算节点与所述整机柜服务器之间通信失败、计算节点自身传感器异常、计算节点处于升级过程的状态中至少一种状态时,则当前判断的计算节点出现异常。步骤S103:将出现异常的计算节点所对应风扇的转速由当前转速提高至预设的警示转速,以便于依据风扇转速的变化得知计算节点的异常状况。所述整机柜的计算节点在正常情况下,各个计算节点所对应的风扇的转速大约为全转速的20%到30%,因此,根据不同的异常情况适当提高异常计算节点的转速,可以保证系统的稳定性并达到预警效果。本实施例中所提供的整机柜服务器的散热调控方法,将异常的计算节点所对应的风扇的转速由正常转速提高至可以达到预警效果的转速,工作人员便可以通过风扇异常高的转速快速排除异常的计算节点,提高了排查异常节点的效率,并且通过提高异常节点对应风扇的转速,确保了系统的散热要求及稳定性。图4为本发明所提供的整机柜服务器的散热调控方法的第二种具体实施例的流程图;在上述实施例的基础上,本实施例将异常计算节点所对应的风扇的转速由当前转速提高至全速,以便更好的达到预警效果。本实施例的具体操作步骤如下:步骤S401:判断各个计算节点与所述各个计算节点对应的风扇是否全部在位;步骤S402:当所述各个计算节点与所述各个计算节点对应的风扇全部在位时,以实时轮寻的方式依次判断所述整机柜服务器的各个计算节点是否出现异常,并记录出现异常的计算节点;步骤S403:将出现异常的计算节点所对应风扇的转速由当前转速提高至全速;步骤S404:判断异常的计算节点是否排除异常;步骤S405:当某个异常的计算节点排除异常时,将与当前排除异常的计算节点所对应的风扇恢复为正常调控状态。实时检测所述整机柜服务器的各个计算节点,当检测到某个异常的计算节点排除异常时,将与当前排除异常的计算节点所对应的风扇恢复为正常调控状态,其中,所述风扇的正常调控状态为依据预设的散热策略以及与各个风扇对应的计算节点的温度大小对所述风扇的转速进行控制的状态。在本实施例中,整机柜服务器统一规范化管理计算节点和风扇模块,首先查看计算节点和风扇的在位状态,判断当前节点数目对应的风扇是否全部在位;实时节点状态轮寻,当有计算节点出现异常,非正常工作时,异常的计算节点适当拉高其对应风扇的转速,以保证系统的稳定性并达到预警效果。在实时计算节点轮寻中排除了计算节点的异常后,相应的将排除异常的计算节点对应的风扇恢复为正常调控状态,解除节点报警。本实施例所提供的散热调控方法能够智能的管理各计算节点的散热情况,提高了整机柜服务器的稳定性和可控性。当出现故障告警时,风扇立刻高速运转快速高效的反映异常,有助于更快的排查问题,提高了整机服务器的性能。请参考图5,图5为本发明实施例提供的一种整机柜服务器的散热调控装置的结构框图;具体装置可以包括:第一判断模块100,用于依据预设的整机柜服务器计算节点与风扇的对应关系,判断各个计算节点与所述各个计算节点对应的风扇是否全部在位;第二判断模块200,用于当所述各个计算节点与所述各个计算节点对应的风扇全部在位时,以实时轮寻的方式依次判断所述整机柜服务器的各个计算节点是否出现异常;预警模块300,用于将出现异常的计算节点所对应风扇的转速由当前转速提高至预设的警示转速,以便于依据风扇转速的变化得知计算节点的异常状况。本实施例的整机柜服务器的散热调控装置用于实现前述的整机柜服务器的散热调控方法,因此整机柜服务器的散热调控装置中的具体实施方式可见前文中的整机柜服务器的散热调控方法的实施例部分,例如,第一判断模块100,第二判断模块200,预警模块300,分别用于实现上述整机柜服务器的散热调控方法中步骤S101,S102,和S103,所以,其具体实施方式可以参照相应的各个部分实施例的描述,在此不再赘述。本发明具体实施例还提供了一种整机柜服务器的散热调控设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现上述一种整机柜服务器的散热调控方法的步骤。本发明具体实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述一种整机柜服务器的散热调控方法的步骤。本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或
技术领域
内所公知的任意其它形式的存储介质中。以上对本发明所提供整机柜服务器的散热调控方法、装置、设备以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本
技术领域
的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1