工作频率调节方法、装置及服务器与流程

文档序号:16245277发布日期:2018-12-11 23:31阅读:285来源:国知局
工作频率调节方法、装置及服务器与流程

本公开涉及计算机设备技术领域,具体而言,涉及一种工作频率调节方法、装置及服务器。

背景技术

电子设备通常需要在一个较为合适的温度环境中运行,对于较为大型的电子设备,例如服务器,通常发热量较大,如果温度控制不到位可能影响设备的正常工作,严重超温还可能导致设备宕机或导致设备的电子器件因高温损毁。在现有技术中,通常采用风扇系统进行散热,当风扇系统散热能力不足时,cpu自身可以被动地根据检测到的温度值降低工作频率以减少cpu的发热,但是这种方式仅靠温度进行被动触发,触发条件过于单一,在实际复杂的设备运行环境中,难以将设备温度控制在较佳状态。



技术实现要素:

第一方面,本公开提供一种工作频率调节方法,应用于服务器的基板管理控制器,所述方法包括:

持续获取所述服务器多个硬件的硬件参数,并检测获取到的硬件参数是否满足对应的预设降频条件;

在检测到多个所述硬件参数满足所述对应的预设降频条件时,向所述服务器的处理芯片发送降频指令,以降低所述处理芯片的发热量。

第二方面,本公开提供一种工作频率调节装置,应用于服务器的基板管理控制器,所述装置包括:

状态检测模块,用于持续获取所述服务器多个硬件的硬件参数,并检测获取到的硬件参数是否满足对应的预设降频条件;

降频模块,用于在检测到多个所述硬件参数满足所述对应的预设降频条件时,向所述服务器的处理芯片发送降频指令,以降低所述处理芯片的发热量。

第三方面,本公开提供一种服务器,其特征在于,所述服务器包括基板管理控制器,所述基板管理控制器包括存储器和处理器,所述存储器中存储有机器可执行的指令,所述指令在被所述处理器执行时,促使所述处理器本公开提供的所述工作频率调节方法。

相对于现有技术而言,本公开具有以下有益效果:

本公开提供的工作频率调节方法、装置及服务器,由服务器的基板管理控制器根据服务器多个硬件参数综合判断的结果主动触发处理芯片进行降频,从而减少服务器的发热。如此,通过结合多个因素主动触发cpu降频动作,触发条件更全面的,能够更有效地主动触发降频,防止服务器过多地发热。

附图说明

为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本公开实施例提供的服务器的结构框图;

图2为本公开实施例提供的工作频率调节方法的流程示意图;

图3为本公开实施例提供的可配置文件的内容示意图;

图4为本公开实施例提供的工作频率调节装置的功能模块示意图。

图标:10-服务器;100-bmc;110-bmc存储器;120-bmc处理器;130-工作频率调节装置;131-状态检测模块;132-降频模块;200-处理芯片;300-其他硬件。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。

因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

在本公开的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本公开中的具体含义。

请参照图1,图1为本实施例提供的一种服务器10的方框示意图,该服务器10除了包括常规的处理芯片200及其他硬件300外,还包括基板管理控制器100(baseboardmanagementcontroller,简称bmc)。

bmc100是服务器10中一种可以相对其他硬件300(例如,处理芯片、内存等)独立运行的控制器,bmc100的运行不用依赖服务器10的bios或操作系统,这使得bmc100可以独立地对服务器10的硬件进行监控,例如监控服务器10硬件的温度、电压、风扇状态、电源状态等,并可以执行相应的调节动作,以保证服务器10处于健康的运行状态。

bmc100作为一个相对独立的硬件,可以包括用于存储器(本实施例中称为“bmc存储器”)及处理器(本实施例中称为“bmc处理器”)。bmc存储器110存储有机器可执行指令,例如,存储bmc100固件代码或其他数据。bmc处理器120执行或调用bmc存储器110中的机器可执行执行,以实现硬件监控逻辑,例如,实现本实施例中与工作频率调节相关的逻辑。其中,bmc存储器110可以为flash存储器,bmc处理器120可以为arm结构的处理器。

在本实施例中,提供一种应用于图1所示bmc100,根据多种触发条件主动触发处理芯片200降低工作频率从而减少发热的方案,下面对该方案进行详细阐述。

请参照图2,本实施例提供一种应用于图1所示bmc100的工作频率调节方法,下面对该方法的各步骤进行详细阐述。

步骤s110,持续获取服务器10多个硬件的硬件参数,并检测获取到的硬件参数是否满足对应的预设降频条件。

例如,可以通过bmc100中配置的动态风扇控制(dynamicfancontrol,简称dfc)模块在其轮询线程中周期性地获取服务器10的风扇工作状态参数、主板上多个硬件芯片的温度参数等。

然后bmc100将获取到的各硬件参数与其对应的预设降频条件进行比对,判断这些硬件参数是否满足其对应的预设降频条件。

例如,针对数据类型为布尔量的硬件参数,其本身的值可以表示该硬件参数是否满足预设降频条件,例如,风扇的工作状态参数中1表示风扇工作状态异常,0表示风扇工作状态正常,则bmc100在检测到风扇的工作状态参数为1时判定为满足预设降频条件。

针对数据类型为数值的硬件参数,将获取到的硬件参数与其对应的预设阈值做比较来判断该硬件参数是否达到预设降频条件。例如,某硬件芯片的温度参数为一个数值量,且该硬件参数对应的预设阈值为35,则该当bmc100检测到该硬件芯片的温度参数的值大于35时,判定为该硬件参数满足预设降频条件。

可选地,在本实施例的一个例子中,需要与预设降频条件进行比对判断的硬件参数项目可以为bmc100固件代码中的一部分,存储在bmc存储器110中。

在一些情况中,根据服务器10不同的应用场景,用户可能需要配置不同的硬件参数作为触发条件,为了方便用户对不同的触发条件进行选择配置,在本实施例的另一个例子中,bmc100可以根据一个可配置文件获得需要进行状态检测的硬件参数项目。

例如,用户可以将需要作为触发条件的多个状态检测项写入一个可配置文件。bmc100接收可配置文件,并将可配置文件存入bmc存储器110中。其中,该可配置文件可以为xml格式的文件,bmc存储器110可以为flash存储器。

请参照图3,在这个例子中,可配置文件中记录了多个硬件参数项目,其中,标识为“true”的硬件参数项目为需要与对应的预设降频条件进行比对判断的状态检测项,标识为“false”的硬件参数项目为不需要与对应预设降频条件进行比对的非状态检测项。

可选地,针对数据类型为数值的硬件参数,可配置文件中还可以记录与该硬件参数相关的预设阈值。例如,可配置文件中记录了某个芯片的温度参数标识为“true”,并且可配置文件中还记录了该芯片的温度参数对应的阈值为35,则在检测到该芯片的温度参数超过35时,判定该硬件参数满足预设降频条件。

可选地,在本实施例中,bmc100可以在初始化时加载该可配置文件,并在后续执行步骤中根据该可配置文件中记录的状态检测项获取需要进行比对判断的硬件参数。bmc100也可以在每次需要执行比对判断时才加载该可配置文件,并根据该可配置文件中记录的状态检测项获取需要进行比对判断的硬件参数。

基于上述设计,在这个例子中,多个触发条件是可配置的,如此,针对不同的实际需求可以灵活地设置判断条件的组合。

步骤s120,在检测到多个硬件参数满足对应的预设降频条件时,向服务器10的处理芯片200发送降频指令,以降低处理芯片200的发热量。

在一个例子中,bmc100在检测到任意一个硬件参数满足对应的预设降频条件时,向处理芯片200发送降频指令。例如,若bmc100检测到风扇的工作状态参数为1(表示风扇工作异常),则向处理芯片200发送降频指令,使处理芯片200根据降频指令降低工作频率,以减少发热量。

相应地,在本实施例中,还可以根据实际需要配置不同的触发条件,例如综合考虑不同硬件芯片的温度或不同硬件的工作状态。这样,相较于现有技术仅通过温度被动的触发cpu降频的方案,本实施例提供的方案可以考虑更多的条件,使温度控制更加准确。

例如,经发明人研究发现,在一些情况下,一旦风扇运行异常无法散热,就意味着服务器10温度会开始逐渐提高了,但是在现有技术采用的根据温度被动触发处理芯片200降频方案中,风扇运行异常后可能还需要等到温度上升到处理芯片200的降频温度阈值才开始触发处理芯片200被动降频。然而,在执行降频后,温度实际上还会持续上升一端时间,可能很快就达到温度极限导致宕机或损货器件。

故这个例子中,可以将风扇的工作状态参数作为一个判断条件,一旦检测到风扇运行异常就主动触发处理芯片200降频。这样,不需要等到温度上升到处理芯片200降频温度阈值就提前主动触发了处理芯片200降频,可以更好地抑制处理芯片200的发热。

在一个例子中,bmc100在检测到多个硬件参数同时满足对应的预设降频条件时,向处理芯片200发送降频指令。例如,bmc100检测到风扇工作异常且其中一个硬件芯片温度达到其预设阈值时,向处理芯片200发送降频指令。其中,当处理芯片200本身的温度参数作为触发主动降频的参数之一时,其对应的预设降频条件的温度阈值小于处理芯片200自身根据温度被动执行降频的降频温度阈值。

这样,通过多个条件的组合,使得bmc100可以根据硬件状态更准确地触发主动处理芯片200主动降频。

例如,经发明人研究发现,在一些情况下,服务器10中的硬件可能当前负载不是很高,发热量不大,即使风扇工作异常,服务器10的硬件芯片有可能可以通过自然散热的形式保持温度,还不需要立即触发处理芯片200进行降频。但是,当有些硬件芯片负载较高,发热量已经很大时,如果风扇工作异常,服务器10就会立即升温,这是就需要触发处理芯片200降频。

故在这个例子中,可以将风扇的工作状态参数及多个硬件芯片的温度参数作为触发条件,在风扇工作异常且某一个硬件芯片温度达到其预设阈值时,向处理芯片200发送降频指令,这样可以在进行温度控制的同时尽可能地维持服务器10的处理性能。

可选地,在一些场景中,根据实际需求可能仅需要对处理芯片200中的某些子系统进行降频,故在本实施例中,bmc100可以记录有目标子系统,例如,在可配置文件中记录了目标子系统的信息。

bmc100在需要触发处理芯片200进行降频时,根据记录的目标子系统,向处理芯片200发送相应的降频指令,使处理芯片200根据降频指令降低目标子系统的工作频率。其中,目标子系统可以为处理芯片200的cpu子系统、dimm子系统等或整个处理芯片200所有系统。

例如,当处理芯片200为intel芯片时,该处理芯片200可以包括相对cpu独立运行管理引擎(intelmanagementengine,简称me),bmc100可以向处理芯片200的me发送针对目标子系统的智能平台管理接口(intelligentplatformmanagementinterface,简称ipmi)降频指令。如此,在本实施例中,通过ipmi指令向处理芯片200发送降频指令,不需要对服务器10的硬件环境做出改动。

可选地,由于bmc100主动触发处理芯片200降频后,处理芯片200通常不会自发地回复被降低的工作频率,故在本实施例中,bmc100向处理芯片200发送过降频指令之后,若bmc100检测到所有硬件参数均不满足对应的预设降频条件了,则向处理芯片200发送恢复指令,以使处理芯片200根据恢复指令恢复工作频率。

请参照图4,本实施例还提供一种应用于图1所示bmc100的工作频率调节装置130,工作频率调节装置130包括状态检测模块131及降频模块132。

状态检测模块131用于持续获取服务器10多个硬件的硬件参数,并检测获取到的硬件参数是否满足对应的预设降频条件。

本实施例中,状态检测模块131可用于执行图2所示的步骤s110,关于状态检测模块131的具体描述可参对步骤s110的描述。

降频模块132用于在检测到多个硬件参数满足对应的预设降频条件时,向服务器10的处理芯片200发送降频指令,以降低处理芯片200的发热量。

本实施例中,降频模块132可用于执行图2所示的步骤s120,关于降频模块132的具体描述可参对步骤s120的描述。

可选地,在本实施例中,硬件参数包括风扇的工作状态参数及服务器10至少一个硬件的温度参数。

可选地,在本实施例中,工作频率调节装置130还包括配置模块。

配置模块用于接收并存储可配置文件,其中,所述可配置文件中记录有由用户配置的多个状态检测项。

状态检测模块131具体用于根据可配置文件中记录的多个状态检测项,周期性地获取对应硬件的硬件参数,并检测获取到的硬件参数是否满足对应的预设降频条件。

可选地,在本实施例中,bmc100记录有目标子系统。降频模块132具体用于根据记录的目标子系统,向处理芯片200发送相应的降频指令,使处理芯片200根据降频指令降低目标子系统的工作频率。

可选地,在本实施例中,工作频率调节装置130还包括恢复模块。

恢复模块用于在向服务器10的处理芯片200发送降频指令之后,若检测到所有硬件参数均不满足对应的预设降频条件,则向处理芯片200发送恢复指令,以使处理芯片200根据恢复指令恢复工作频率。

可选地,在本实施例中,处理芯片200为intel处理芯片,降频模块132具体用于向处理芯片200的me模块发送ipmi降频指令。

在本公开所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本公开的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本公开各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1