一种运算设备温度调配的方法及装置与流程

文档序号:18898670发布日期:2019-10-18 21:37阅读:138来源:国知局
一种运算设备温度调配的方法及装置与流程

本发明人工智能技术领域,特别涉及一种运算设备温度调配的方法及装置。



背景技术:

目前,大量复杂计算往往需要数目庞大的运算设备。运算设备的频率和电压配置越高表示其计算能力越强,同时,也意味着运算设备所消耗的电量越高,其温度、散出的热量也就越高,反之则温度和散出的热量越低。一般的情况下,运算设备散发的热量会通过散热装置排出到场地外,但该种方法没有充分利用资源。实际上,如果大量运算设备散发的热量能够被利用,则该部分热量是较为可观的。



技术实现要素:

(一)要解决的技术问题

鉴于上述问题,本发明的主要目的在于提供一种运算设备温度调配的方法及装置,以便解决上述问题的至少之一。

(二)技术方案

根据本发明的一个方面,提供了一种运算设备温度调配的方法,包括:

将多个运算设备置于待进行温度调配的封闭空间;

获取运算设备运行的温度参数及所述封闭空间的当前环境温度;

根据所述运算设备运行的温度参数,确定是否降低或提升所述运算设备的频率和/或电压;

根据当前环境温度与目标环境温度、调配比率确定温度调配所需配置的运算设备的数量及频率值,所述调配比率为当前环境温度与目标环境温度的差值相对于基准值的比值;

根据所述所需配置的运算设备的数量,选择被配置的运算设备,对所述被配置的运算设备的频率进行配置,并将配置信息存入数据库中。

进一步的,所述基准值通过先前运行过程中数据获取,或者所述基准值为程序预存值。

进一步的,所述基准值为先前运行过程中配置预定数量的运算设备以预定频率运行所得到的预定时间内的温度变化差值,或者为预存的配置预定数量的运算设备以预定频率运行所得到的预定时间内的温度变化差值。

进一步的,所述根据所述运算设备运行的温度参数,确定是否降低所述运算设备的频率和/或电压,包括:

将所述获取运算设备运行的温度参数与温度保护阈值进行比较,若所述运算设备运行的温度参数大于温度保护阈值,则降低所述运算设备的频率和/或电压。

进一步的,所述运算设备运行的温度参数包括每台运算设备的芯片温度最高值和/或每台运算设备的进风口温度。

进一步的,根据当前环境温度与目标环境温度、调配比率确定温度调配所需配置的运算设备的数量及频率值包括:

若当前环境温度高于目标环境温度,则根据调配比率确定需配置的运算设备的数量及其降低的电压或频率;

若当前环境温度等于目标环境温度,则当前运算设备的电压及频率保持不变;

若当前环境温度低于目标环境温度,则根据调配比率确定需配置的运算设备的数量及其增加的电压或频率。

进一步的,所述配置信息存入数据库后,返回所述获取运算设备运行的温度参数及所述封闭空间的当前环境温度的步骤,进行循环运行,所述循环运行为按照固定时间周期循环运行,即周期性获取运算设备运行的温度参数及所述封闭空间的当前环境温度,并进行运算设备的温度调配。

进一步的,所述基准值为前一个进行了配置的周期的当前环境温度与目标环境温度的差值,初始周期内所述调配比率为一默认值。

进一步的,所述调配比率=(t1n-t2n)/(t1n-1-t2n-1)

其中,t1n为当前环境温度,t2n为目标环境温度,t1n-1为上一个进行配置的周期的当前环境温度,t2n-1为上一个进行配置的周期的目标环境温度。

进一步的,当所述调配比率大于等于1时,所述被配置的运算设备的数量不变,所述被配置的运算设备的频率值比上一周期的频率增加:频率步进值*int(调配比率+0.5);

当所述调配比率小于1时,所述被配置的运算设备的频率值不变,所述被配置的运算设备的数量为:int(上一周期的被配置的运算设备数量*调配比率)。

进一步的,所述封闭空间内的多个运算设备具有多个不同的控制单元,每个控制单元对应一个静态ip,其中,每个ip对应至少一个运算设备,所述确定温度调配所需配置的运算设备的数量,包括确定所需配置的ip数量,对同一ip对应的所有运算设备进行配置。

进一步的,所述每个ip对应的运算设备数量相同。

进一步的,当所述调配比率大于等于1时,所述被配置的ip数量不变,所述被配置的运算设备的频率值比上一周期的频率增加:频率步进值*int(调配比率+0.5);

当所述调配比率小于1时,所述被配置的运算设备的频率值不变,所述被配置的ip的数量为:int(上一周期的被配置的ip数量*调配比率)。

进一步的,对所述被配置的运算设备的频率进行配置包括:通过socket连接需要被配置的运算设备的ip,调用该ip对应的控制中心提供的更改配置的api,完成配置。

进一步的,所述将配置信息存入数据库中包括:将本周期配置的运算设备数量或ip数量、频率值及是否调整了频率的状态值存入数据库。

根据本发明的的另一个方面,提供一种运算设备温度调配的装置,包括:

参数获取单元,用于获取运算设备运行的温度参数及所述封闭空间的当前环境温度;

防重启单元,根据所述运算设备运行的温度参数,确定是否降低所述运算设备的频率和/或电压,从而防止由于运算设备温度过高导致重启;

调配策略单元,根据所述当前环境温度、目标环境温度及调配比率,确定温度调配所需配置的运算设备的数量及频率值;

配置单元,根据所述运算设备的数量,选择被配置的运算设备,对所述被配置的运算设备的频率进行配置,并将配置信息存入数据库中。

进一步的,所述的装置还包括:至少一个控制中心,每个控制中心具有一个静态ip,并连接到多个运算设备。

(三)有益效果

从上述技术方案可以看出,本发明一种运算设备温度调配的方法及装置至少具有以下有益效果其中之一:

(1)提供将运算设备的散出热量利用起来,使其输出热量和温度保持在某种范围内,则可以将运算设备应用到更多的应用场景中,满足更多需求;

(2)可以对封闭空间的温度进行持续的控制,并以前一次的调整为参考进行下一次调整,通过实时调整,可以有效精确控制温度。

附图说明

为了更清楚地说明本发明技术方案和实施例,下面将对现有技术方案和实施案例所需要使用的附图进行说明,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为为本发明实施例运算设备温度调配的方法的流程图。

图2为本发明实施例运算设备温度调配的方法的流程图。

图3为本发明实施例运算设备温度调配装置的框图。

具体实施方式

在本发明第一个示意性实施例中,提供了一种运算设备温度调配的方法。图1为本发明实施例运算设备温度调配的方法的流程图。

如图1所示,本实施例运算设备温度调配的方法包括:

s0,将多个运算设备置于待进行温度调配的封闭空间,程序开始,运算设备按照默认参数运行。

s1,获取运算设备运行的温度参数及所述封闭空间的当前环境温度;

s2,根据所述运算设备运行的温度参数,确定是否降低所述运算设备的频率和/或电压;

s3,根据当前环境温度与目标环境温度、调配比率确定温度调配所需配置的运算设备的数量及频率值,所述调配比率为当前环境温度与目标环境温度的差值相对于基准值的比值;

s4,根据所述运算设备的数量,选择被配置的运算设备,对所述被配置的运算设备的频率进行配置,并将配置信息存入数据库中,返回步骤s2循环运行,实现对温度的持续控制。

本实施例中,为了实现对封闭空间的温度的持续控制,所述步骤s4中所述配置信息存入数据库后,返回所述步骤s2的循环运行为按照固定时间周期循环运行,即周期性获取运算设备运行的温度参数及所述封闭空间的当前环境温度,并进行运算设备的温度调配,从而可以持续对封闭空间的文件进行控制。

所述步骤s2中,通过将所述获取运算设备运行的温度参数与温度保护阈值进行比较,若所述运算设备运行的温度参数大于温度保护阈值,则降低所述运算设备的频率和/或电压,从而防止运算设备由于温度过高导致重启。其中,所述运算设备运行的温度参数包括每台运算设备的芯片温度最高值和/或每台运算设备的进风口温度。

在所述步骤s3中,若当前环境温度高于目标环境温度,则根据调配比率确定需配置的运算设备的数量及其降低的电压或频率;若当前环境温度等于目标环境温度,则当前运算设备的电压及频率保持不变;若当前环境温度低于目标环境温度,则根据调配比率确定需配置的运算设备的数量及其增加的电压或频率。

根据调配比率进行配置时,所述基准值为先前运行过程中配置预定数量的运算设备以预定频率运行所得到的预定时间内的温度变化差值,或者为预存的配置预定数量的运算设备以预定频率运行所得到的预定时间内的温度变化差值。根据当前环境温度与目标环境温度、调配比率确定温度调配所需配置的运算设备的数量及频率值。

具体地,在循环运行过程中,所述基准值通过先前运行过程中数据获取:

所述调配比率=(t1n-t2n)/(t1n-1-t2n-1)

其中,t1n为当前环境温度,t2n为目标环境温度,t1n-1为上一周期调配时的当前环境温度,t2n-1为上一周期的目标环境温度。当所述调配比率大于等于1时,说明本周期所需的温度改变量比上个周期还要大,因此所述被配置的运算设备的数量不变,所述被配置的运算设备的频率值比上一周期的频率增加频率步进值*int(调配比率+0.5),即调配比率四舍五入取整后乘以频率步进值;当所述调配比率小于1时,说明本周期需要的温度改变量小于上一周期。所述被配置的运算设备的频率值不变,所述被配置的运算设备的数量为:int(上一周期的被配置的运算设备数量*调配比率),即上一周期的被配置的运算设备数量*调配比率后取整。通过以前一次的调整为参考进行下一次调整,通过实时调整,可以有效精确控制温度。

由于运算设备的频率改变一般按照频率步进进行增减,因此本实施例中根据调配比率确定所需配置的运算设备的频率值即确定每次改变几个频率步进值。特别地,初始周期内所述调配比率为一默认值。在一实施例中,在初始周期进行温度调配时,所述被配置的运算设备为封闭空间内全部运算设备,根据目标温度相对于当前温度的高低进行增减,若目标温度高于当前温度,则运算设备的频率值增加一个频率步进值;若目标温度低于当前温度,则运算设备的频率值减少一个频率步进值。

所述步骤s4中,通过socket连接需要被配置的运算设备的ip,调用该ip对应的控制中心提供的更改配置的api,完成对运算设备频率的配置。配置完成后,将本周期配置的运算设备数量、频率值及是否调整了频率的状态值存入数据库。

需要说明的是,本实施例中,循环运行的周期为时间固定的周期,若每个循环的时间并非固定值,则所述调配比率还与本周期的时间及上一周期的时间有关。

本发明的运算设备的温度调配方法能够使成百上千台运算设备的输出热量控制在一定温度范围内,通过将该些运算设备的散出热量利用起来,使其输出热量和温度保持在某种范围内,从而将运算设备应用到更多的应用场景中,满足更多需求。

在本发明第二个示意性实施例中,提供了一种运算设备温度调配的方法。图2为本发明实施例运算设备温度调配的方法的流程图。

本实施例中,通过所述运算设备温度调配的方法用于相对封闭的烘干室,使得烘干室的温度保持在一定范围内。具体地,本实施例中,设置有10个树莓派,每个树莓派都有一个静态ip、且每个树莓派连接有80台运算设备。将运算设备出风口对向封闭环境中,使环境温度保持在某一范围下,如67-71度。

如图2所示,在程序开始后,运算设备按照默认参数运行,pll设置为500mhz,同时通过socket连接所有树莓派的ip,周期性地获取所有运算设备的运行状态参数,包括每台运算设备的芯片温度最高值tmax,并确定本周期调配的ip数量与频率。

由于在相对封闭的环境下,运算设备的芯片温度极易接近温度保护值,因此首要前提是需要保证运算设备正常运行。在进行温度调配时,首先获取每台运算设备的芯片温度最高值tmax,假设温度保护值是107℃,遍历每台机器的芯片温度最高值tmax,如果超过107℃,则将该运算设备连接的树莓派所在的ip下面所有的运算设备的频率和/或电压降低到某一固定值。

然后获取封闭环境中的实际温度。本实施例中封闭环境中设置多个采样点,要求环境温度为67℃-70℃之间。其中,采样点1的采样温度为第一实际温度;采样点2的采样温度为第二实际温度。如果第一实际温度与第二实际温度均高于所要求的温度范围的上限,即第一实际温度阈值则需要降低运算设备频率以减少散热,本实施例中,所述第一实际温度阈值为70℃;如果第一实际温度与第二实际温度均低于所要求的温度范围的下限,即第二实际温度阈值则需要升高运算设备频率以增加散热,调整的ip数量和调整频率大小需要对比上一个周期中调配过后的温度变化来决定,本实施例中,所述第二实际温度阈值为67℃。本实施例中,运算设备可配频率50-850,25为一频率步进值。在第一次调配时,默认全部ip调整一个步进25(升高或者降低),然后存入数据库,供下次调配作参考。

通过封闭环境的实际温度和目标环境温度得到一个当前目标环境温度差值,读数据库获得上个周期调配后的在前温度变化,用当前目标环境温度差值除以在前温度变化,得到调配比率。如果大于1则保持ip数量不变,用调配比率的整数部分作为频率步进数,乘以每一步进的步数25。如果小于1则频率步进不变,ip数量乘以调配比率再取整数。由此就得到了此次需要调整的ip数量和频率的值,通过socket连接这些ip,调用该树莓派提供的更改配置的api,完成配置。在将此次配置信息存入数据库中,还同时会保存这一次是否调整了频率的状态值。目的是如果上一次并没有配置,则没有参考价值,只需按照最近一次的调配方式进行配置。

在其他一些实施例中,与所述第一实施例不同的是,所述周期性地获取所有运算设备的运行状态参数为每台运算设备的进风口温度temp,在进行温度调配时,首先获取每台运算设备的进风口温度temp,假设温度保护值是83℃,遍历每台运算设备的进风口温度temp,如果超过83℃,则将该运算设备连接的树莓派所在的ip下面所有的运算设备的频率和/或电压降低到某一固定值。

在其他一些实施例中,与所述第一实施例不同的是,所述周期性地获取所有运算设备的运行状态参数为每台运算设备的进风口温度temp,在进行温度调配时,首先获取每台运算设备的芯片温度最高值tmax,以及每台运算设备的进风口温度temp,假设运算设备的芯片温度保护值为107℃,运算设备的进风口温度保护值为83℃,遍历每台运算设备的芯片温度最高值tmax、运算设备的进风口温度temp,如果运算设备的芯片温度最高值tmax超过107℃或者运算设备的进风口温度temp超过83℃,则将该运算设备连接的树莓派所在的ip下面所有的运算设备的频率和/或电压降低到某一固定值。

在本发明第三个示意性实施例中,提供了一种运算设备温度调配的装置。图3为本发明实施例运算设备温度调配装置的框图。如图3所示,所述装置包括:

参数获取单元,用于获取运算设备运行的温度参数及所述封闭空间的当前环境温度;

防重启单元,根据所述运算设备运行的温度参数,确定是否降低所述运算设备的频率和/或电压,从而防止由于运算设备温度过高导致重启;

调配策略单元,根据所述当前环境温度、目标环境温度及调配比率,确定温度调配所需配置的运算设备的数量及频率值;

配置单元,根据所述运算设备的数量,选择被配置的运算设备,对所述被配置的运算设备的频率进行配置,并将配置信息存入数据库中。

其中,所述防重启单元通过将所述获取运算设备运行的温度参数与温度保护阈值进行比较,若所述运算设备运行的温度参数大于温度保护阈值,则降低所述运算设备的频率和/或电压,从而防止运算设备由于温度过高导致重启。其中,所述运算设备运行的温度参数包括每台运算设备的芯片温度最高值和/或每台运算设备的进风口温度。

在所述调配单元中,所述调配比率根据上一个周期的温度变化、当前环境温度及目标环境温度确定。根据当前环境温度与目标环境温度、调配比率确定温度调配所需配置的运算设备的数量及频率值。

具体地,所述调配比率=(t1n-t2n)/(t1n-1-t2n-1)

其中,t1n为当前环境温度,t2n为目标环境温度,t1n-1为上一周期的当前环境温度,t2n-1为上一周期的目标环境温度。当所述调配比率大于等于1时,说明本周期所需的温度改变量比上个周期还要大,因此所述被配置的运算设备的数量不变,所述被配置的运算设备的频率值比上一周期的频率增加频率步进值*int(调配比率+0.5);当所述调配比率小于1时,说明本周期需要的温度改变量小于上一周期。所述被配置的运算设备的频率值不变,所述被配置的运算设备的数量为:int(上一周期的被配置的运算设备数量*调配比率)。

由于运算设备的频率改变一般按照频率步进进行增减,因此本实施例中根据调配比率确定所需配置的运算设备的频率值即确定每次改变几个频率步进值。特别地,初始周期内所述调配比率为一默认值。在一实施例中,在初始周期进行温度调配时,所述被配置的运算设备为封闭空间内全部运算设备,根据目标温度相对于当前温度的高低进行增减,若目标温度高于当前温度,则运算设备的频率值增加一个频率步进值;若目标温度低于当前温度,则运算设备的频率值减少一个频率步进值。

所述配置单元中,通过socket连接需要被配置的运算设备的ip,调用该ip对应的控制中心提供的更改配置的api,完成对运算设备频率的配置。配置完成后,将本周期配置的运算设备数量、频率值及是否调整了频率的状态值存入数据库。

优选的,本实施例中,运算设备温度调配的装置还包括:

至少一个控制中心,每个控制中心具有一个静态ip,并连接到多个运算设备。当需要对运算设备进行数量选择时,以每个ip对应的控制中心连接的运算设备为一个数量单位进行选择,即同一个ip下,所有运算设备均进行频率调配。由此,可以更加方便地控制选择ip的数量。

至此,已经结合附图对本发明进行了详细描述。依据以上描述,本领域技术人员应当对本发明有了清楚的认识。

需要说明的是,在附图或说明书正文中,未绘示或描述的实现方式,均为所属技术领域中普通技术人员所知的形式,并未进行详细说明。此外,上述对各元件的定义并不仅限于实施例中提到的各种具体结构、形状或方式,本领域普通技术人员可对其进行简单地更改或替换。

当然,根据实际需要,本发明基于级联的深层卷积神经网络的人脸识别方法及系统还可以包含其他的部分,由于同本发明的创新之处无关,此处不再赘述。

类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该发明的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面发明的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中发明的所有特征以及如此发明的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中发明的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的相关设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

再者,说明书与权利要求中所使用的序数例如“第一”、“第二”、“第三”等的用词,以修饰相应的元件,其本身并不意含及代表该元件有任何的序数,也不代表某一元件与另一元件的顺序、或是制造方法上的顺序,该些序数的使用仅用来使具有某命名的一元件得以和另一具有相同命名的元件能作出清楚区分。

以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1