一种高能效比多核微处理器的动态热管理方法

文档序号:26003882发布日期:2021-07-23 21:21阅读:214来源:国知局
一种高能效比多核微处理器的动态热管理方法

本发明属于信息控制技术领域,特别涉及一种基于模型预测控制结合任务迁移及动态电压频率调节的针对高能效比多核微处理器的动态功率预算估计方法。



背景技术:

随着现代集成电路技术的高速发展,集成电路的特征尺寸缩小和性能需求增加,其功率密度也随之不断增加。从90纳米开始,半导体制造工艺已经发展到了纳米阶段,现在,更已经达到7纳米,5纳米。在这一阶段,硅基芯片上的漏电流大幅度增加,且受温度影响严重,在此基础上产生的静态功耗和温度呈非线性关系且在总功耗中占有相当一部分的比重。在多核芯片中,一旦芯片内部出现温度升高的核心,该核内的漏电流也会迅速增加,导致漏电功耗的增加,并进一步导致核心温度的上升。总之,片上的高功率密度引起的高温降低芯片可靠性的同时,也限制了处理器的性能,因此成为了制约微处理器发展的最主要限制之一。

目前来看,在芯片的应用领域,有两个主要的衡量指标,第一就是多核芯片的总体性能:由于功率墙的限制,如何在安全温度下提高处理器性能。近年来,动态热管理技术被广泛采用以减轻过热引起的有效性问题,有效的动态热管理方法包括了任务迁移技术和动态电压频率调节。任务迁移技术通过将高温核心上的高功率重负荷任务与低温核心上的低功耗轻负荷任务相迁移来最小化片上的温度差异。该策略可以保持处理器的高性能,减小热空间梯度,降低温度峰值,但如果没有其他的温度调节技术参与,任务迁移并不能保证片内核心的温度处于安全的温度范围之内。而动态电压频率调节技术则可以通过降低核内的工作电压与频率来降低功耗,从而保证核心处于安全的温度范围,但与此同时可能会导致相当严重的性能损失;

第二则是多核微处理芯片的能效比,即如何在消耗同样的攻略的情况下执行更多的指令数,过去传统的能效比优化管理方法在处理静态功耗时由于静态功耗和温度的非线性关系,出于简便计算的考虑,往往忽略不计或者按常数计,但这类近似在如今线宽7纳米甚至5纳米的半导体工艺中是行不通的,因为在这种工艺下,mos晶体管的静态功耗将近占了总功耗的1/4,甚至随着温度的升高占有更高的比重。

通过对现有技术文献检索发现,在解决安全温度下最佳性能的问题上haiwang和diyatang在ieeetransactionsoncomputers(ieee计算机汇刊)中发表文章《gdp:agreedybaseddynamicpowerbudgetingmethodformulti/many-coresystemsindarksilicon》(gdp:基于贪心算法的一种应用于多核暗硅芯片的功率预算动态管理方法),该文章通过贪心算法迭代找出最优解,局部最优化的方法最大化安全温度下多核暗硅芯片的总体性能;而在解决能效比优化的方法上,vinayhanumaiah和sarmavrudhula在ieeetransactionsoncomputers(ieee计算机汇刊)中发表文章《energey-efficientoperationofmulticoreprocessorsbydvfs,taskmigration,andactivecooling》(通过dvfs技术,任务调度技术和主动制冷技术对多核处理器实现高能效比优化)中通过梯度下降算法实现能效比最佳的最优解递归查找,然而这种方法具有的问题是时间复杂度高,且对于暗硅芯片缺少优化。



技术实现要素:

本发明的目的在于针对现有技术中算法复杂度高,且对于暗硅芯片缺少优化,提出一种高速的(甚至可以通过查找表实现),根据任务负载(alpha)不同主动调整的微处理器动态热管理方法,该方法基于模型预测控制结合任务迁移及动态电压频率调节,利用模型预测控制方法,根据操作系统载入的工作负载按照其alpha值计算能效比最优的建议工作频率。然后通过执行任务迁移与动态电压频率调节来对现有的功率分布进行校正。本发明成功综合了任务迁移,动态电压频率调节以及模型预测控制方法的优势,能够高效地使处理器以高能效比的方式运行当前的工作负载。

附图说明

图1.单个核心能效比随频率变化趋势

图2.本发明门特卡罗扫描结果

图3.本发明仿真结果

图4.本发明一个管理周期流程图

具体实施方案

为使本发明的目的,技术方案及优点更加清楚明白,下面参照附图并举实例,对本发明进一步详细说明。

本发明提供了一种基于模型预测控制结合任务迁移及动态电压频率调节的针对高能效比多核微处理器的功率估计方法,如图1所示,具体步骤包括:

步骤一、建立微处理器的热模型,获取相应的模型参数;

具体而言,在本发明实施例中,需要建立其一个与多核/众核微处理其相对应的热模型,在提供出微处理器的相关物理参数下(例如芯片tim的散热能力,芯片的封装面积,各层之间的散热系数,各芯片之间的距离等),利用相关软件hotspot计算出热模型的各个参数,在后续的步骤中,利用该热模型来练习温度和功耗。具体表示为:

gt(t)+cdt/dt=bp;(公式一)

对于一个n个核心的处理器,g是一个(4n+12)*(4n+12)的矩阵,c的维度和g相同,不同的是,g矩阵存储的是芯片之间电导和跨导关系,c矩阵则存储的是芯片之间的电容关系,在稳态关系中,c矩阵系数为0,主要是在瞬态分析中影响温度和功率的关系。b矩阵是一个(4n+12)*n的选择矩阵,其目的在于把n*1代表功率的p向量投影到(4n+12)这个维度上,而t是表示温度的一个(4n+12)*1的矩阵,其表示了包含封装在内的芯片每一层的温度。在这个公式关系中,我们的输入是功率,则可以计算出对应瞬态和稳态的相应的温度,即输入功率输出温度,输入温度,输出功率,这样我们就建立除了温度和功率的关系。通过对频率进行扫描,我们可以得到频率与能效比的关系,如图一所示。观察图一我们可以发现,能效比最高的时候既不是频率的最低点也不是频率的最高点,而是处于中间某个位置,我们可以按照本发明计算出该位置。

步骤二、根据操作系统分配的任务数,按照选核算法进行任务调度;

具体而言,在本实施例中,包括构建多核微处理器架构,通过微处理器性能仿真软件在该芯片架构上仿真标准测试程序,并在此基础上集成功耗分析模块来计算芯片上各个核心的功耗数据。

进一步的,构建基于alpha21264多核微处理器架构,是通过wattch软件在需要进行动态热管理设计的微处理器架构上仿真spec标准测试程序,并计算微处理器芯片上各核心的功耗数据。例如对于一个n个核心数的多核微处理器,当spec运行了na个基准测试时,其当前功率集合为[p1p2p3……pna];而我们的目标是通过确定开核位置,得到平均温度最低的分布。

为了说明这个问题,我们需要将含有静态功率的表达式列出来以便进一步说明。

gt+cdt/dt=b(p_d+p_s)(公式二)

其中pd表示动态功率,ps表示静态功率,其中我们需要将建立静态功率和温度的关系我们在实例中是通过hspice仿真得到的静态功耗是温度和vdd的二维函数关系。此时可以通过线性近似(或多端线性近似)进行拟合。则

p_s=as*t+bs*v+p0(公式三)

其中as,bs是线性近似常数,p0是零点常数。将公式三带入公式二进行校园,我们既可以得到某动态功率下能得到的温度。通过贪心算法我们可以多次迭代选出目标开核位置以及他们所应该对应的任务。

步骤三、根据被选中的核心上当前工作负载(alpha)计算其高能效比的建议工作频率;

具体而言,在本实例发明中,我们需要根据任务负载和其所在位置并通过其当前任务状态预测下一个时刻的任务状态并计算达到能效比最优的工作频率。

为了说明我们的计算方法,在此导出公式进行进一步说明。

target=(alpha*f)/(p_d+p_s)(公式四)

我们的目标是最大化target,此时我们将pd用含有f的功率模型替换掉,将ps用公式三种的静态功率模型替换,表示为t和v的关系,而温度t和总功率又可以通过公式二联系起来,至此我们可以全部表示为f的一种关系,对f求导就可以求出最大值。图二和图三展示了本发明的效果,通过对确定的核心上的工作负载进行频率蒙特卡洛扫描,我们得到了图二,本发明的能效比处于最顶点的位置,证明本发明是有效且优的,进一步得,我们与固定频率1.5ghz和梯度下降(精准求解,但是时间复杂度高)的方法进行对比(图三),可以发现本发明和梯度下降效果无二,并且比固定在1.5ghz的时候高出3倍。

综上所述,本发明以极低的代价实现了一种高能效比多核微处理器的动态热管理方法,以上实例对本发明进行了详细的说明,但是并不局限于此,之后依然可以对之前实例所记载的技术方案进行修改,这并不会是相应技术方案的本质脱离本发明各实例技术方案的精神和范畴。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1