用于具有非同构性能状态的多核处理器的热扼制的自适应算法

文档序号:9547024阅读:328来源:国知局
用于具有非同构性能状态的多核处理器的热扼制的自适应算法
【技术领域】
[0001] 多个实施例涉及系统的功率管理和热管理,更具体而言,涉及多核处理器的功率 管理和热管理。
【背景技术】
[0002] 半导体处理和逻辑设计的进步已允许可存在于集成电路器件上的逻辑数量的增 长。结果,计算机系统配置已从系统中的单个或多个集成电路演进到单个集成电路上的多 个硬件线程、多个核、多个设备和/或多个完整系统。另外,随着集成电路的密度增长,对计 算系统(从嵌入式系统到服务器)的功率要求也逐步升高。此外,软件的低效率以及其对 硬件的要求也已导致计算设备能耗的增加。事实上,一些研究指出,计算设备消耗了诸如美 国之类的国家的全部电力供应中相当大的百分比。结果,具有与集成电路相关联的能效和 节能的迫切需求。随着服务器、台式计算机、笔记本、超极本?、平板、移动电话、处理器、嵌 入式系统等变得越来越流行(从被包括在典型的计算机、汽车和电视机中到生物技术中), 这些需求将增长。
【附图说明】
[0003] 图1是根据本发明的一个实施例的系统的框图。
[0004] 图2是根据本发明的实施例的配置方法的流程图。
[0005] 图3A是根据实施例的用于执行自适应热控制技术的方法的流程图。
[0006] 图3B是根据另一实施例的自适应热控制方法的流程图。
[0007] 图4是根据本发明实施例的热控制逻辑的框图。
[0008] 图5是根据本发明的实施例的处理器的框图。
[0009] 图6是根据本发明的另一实施例的多域处理器的框图。
[0010] 图7是根据本发明的实施例的包括多个核的处理器的框图。
[0011] 图8是根据本发明的实施例的系统的框图。
[0012] 图9是根据本发明的另一实施例的处理器的框图。
[0013] 图10是根据本发明的实施例的代表性SoC的框图。
[0014] 图11是根据本发明的另一实施例的另一示例系统SoC的框图。
[0015] 图12是可利用其来使用多个实施例的示例系统的框图。
[0016] 图13是可利用其来使用多个实施例的另一示例系统的框图。
【具体实施方式】
[0017] 在各实施例中,诸如多核处理器、片上系统(SoC)或其他此类处理器之类的处理 器可提供一个或多个热机制的自适应控制。结果,可独立地对处理器的每个处理逻辑(例 如,处理器核、图形处理器和/或其他此类处理引擎)进行热控制。按此方法,多个实施例可 避免处理器中热点的创建,并且/或者可对此类热点的发生快速反应以维持高性能等级, 同时减少可能导致性能降级的热事件。
[0018] 每个核的性能状态(P状态)使多核处理器的不同核能够在不同的操作电压/ 频率点运行,这具有导致在不同的核中发生不同等级的硅加热的副作用。由于由有效地 将功率预算分配给不同的核的机制动态地调节各个核的操作点,因此,当给定的核升温并 且受到热扼制(throttle)时,功率预算的增长对其他核可用,从而潜在地导致其他核升 温并扼制。在这段时间期间,首先受到热扼制的核已冷却,并且随后可能产生P状态(和 功率)的提升,并且再次过热。取决于每个核的工作负荷,当多个核全都以混乱的方式 升温,热扼制并再次升温时,该情形可能横跨这些核发生。将这类情形通俗地称为"打鼹 鼠"("whack-a-mole")问题,因为不同核的温度"突然升高"("pop up"),需要热扼制, 却使其他核突然升高,并且可能导致利用多核处理器的系统性能不稳定。
[0019] 使用本文中所述的自适应热扼制技术,实现了提升的性能,因为每个核的P状态 并不严格地受最热的核的限制;经由使其响应适应于处理器的总体温度轮廓的协调算法来 管理核温度。处理器的较热的热轮廓导致较激进的扼制,最剧烈的扼制用于最热的核。反 过来,具有较冷的热轮廓的处理器(但是其中仍然有至少一个核在最低的温度阈值之上) 导致较不激进的扼制,但是较剧烈的扼制仍用于最热的核。相反,当所有核低于最低的温度 阈值时,温和地退出扼制以避免快速返回到热扼制状态。此类行为通过改动扼制等级而不 是调节温度阈值提供了滞后(hysteresis)。
[0020] 由此,在多个实施例中,可独立地扼制微处理器的所有核,并且当任何核高于热阈 值时,至少轻微地扼制微处理器的所有核。反过来,可较激进地扼制较热的核,这可有效抑 制其中多个核突然进入或脱离扼制状态的不稳定的固有响应。
[0021] 根据各实施例,可至少部分地基于多个核或其他处理引擎中的每一个的热状态来 执行多遍的(multi-pass)自适应技术以确定这些引擎中的一个或多个是否已超出多个热 阈值中的一个。如果是,则可在冒犯性(offending)引擎(即超出给定热阈值的那些引擎) 和非冒犯性(non-offending)引擎(即不超出任何热阈值的那些引擎)两者上执行独立的 以及潜在不同的扼制技术。注意,对非冒犯性引擎的扼制因此是抢先式(preemptive)扼 制。此外,相比不超出任何热阈值的较冷的引擎,可更激进地扼制较热的引擎。
[0022] 现在参考图1,所示是根据本发明的实施例的系统的部分的框图。如图1所示,系 统100可以包括各种组件,其包括所示为多核处理器的处理器110。处理器110可经由外部 电压调节器160耦合至电源150,该外部电压调节器160可执行第一电压转换以将主调节电 压提供给处理器110。
[0023] 如所看到的那样,处理器110可以是包括多个核1203_120"的单管芯处理器。每一 个核120可包括用于使温度或其他热信息用于如本文中所述的热控制的一个或多个对应 的热传感器122。-122"。此外,每一个核可与集成的调压器(IVR)125 a-125n相关联,这些集 成的调压器接收主调节电压,并生成操作电压,以提供给与IVR相关联的处理器的一个或 多个代理。相应地,可提供IVR实现以允许对每一个单个核的电压进而对功率和性能进行 细粒度的控制。由此,每一个核都可在独立的电压和频率下操作,从而允许极大的灵活性, 并提供平衡功耗与性能的广泛机会。
[0024] 仍参考图1,附加的组件可存在于处理器内,包括输入/输出接口 132、另一接口 134以及集成存储器控制器136。如所看到的那样,这些组件中的每一个都可以由另一集成 的电压调节器125x来供电。在一个实施例中,接口 132可符合英特尔快速路径互连(QPI) 协议,该协议在包括多个层的高速缓存一致性协议中提供点对点(PtP)链路,多个层包括 物理层、链路层和协议层。接口 134转而可符合外围组件互连快速(PCIe?)规范,例如,PCI 快速?规范基础规范版本2. O (2007年1月17日发布)。
[0025] 还示出了功率控制单元(P⑶)138,其可包括用于针对处理器110执行功率管理操 作的硬件、软件和/或固件。如所看到的那样,PCU 138经由数字接口将控制信息提供给外 部电压调节器160以使该电压调节器生成合适的经调节电压。P⑶138也经由另一数字接 口将控制信息提供给多个IVR 125以控制所生成的操作电压(或使对应的IVR在低功率模 式下被禁用)。在各实施例中,PCU 138可包括热控制逻辑,该热控制逻辑用于独立地且自 适应地控制对具有不同性能状态的一个或多个核的扼制。
[0026] 尽管为了易于说明,没有示出诸如非核(uncore)逻辑和其他组件(诸如,内部存 储器(例如,一个或多个层级的高速缓存存储器层次结构等))之类的附加组件可存在于处 理器110内,但可理解这一点。此外,尽管在图1的实现中示出为具有集成的调压器,但是, 多个实施例不限于此。
[0027] 虽然参考在诸如计算平台或处理器之类的特定集成电路中的节能和能效描述了 以下多个实施例,但是其他实施例也适用于其他类型的集成电路和逻辑设备。可将本文中 所描述的多个实施例的类似技术和教导应用于也可受益于更佳的能效和节能的其他类型 的电路或半导体器件。例如,所公开的多个实施例不限于任何特定类型的计算机系统,并且 也可用于诸如手持式设备、SoC和嵌入式应用之类的其他设备中。手持式设备的一些示例 包括,蜂窝电话、网际协议设备、数码相机、个人数字助理(PDA)和手持式PC。嵌入式应用通 常包括微控制器、数字信号处理器(DSP)、网络计算机(NetPC)、机顶盒、网络集线器、广域 网(WAN)交换机,或能够执行以下所教导的功能和操作的任何其他系统。此外,本文中描述 的装置、方法和系统不限于物理计算设备,而也可涉及用于节能和能效的软件优化。如将在 以下描述变得显而易见的那样,本文中描述的方法、装置和系统的多个实施例(无论是关 于硬件、固件、软件还是它们的组合)对于"绿色技术"的未来(诸如,对于涵盖美国经济大 部分的产品的节能和能效)是至关重要的。
[0028] 注意,本文中所描述的自适应热控制可独立于基于操作系统(OS)的机制(诸如, 高级配置和平台接口(ACPI)标准(例如,2006年10月10日发布的Rev. 3.0b)),并与其互 补。根据ACPI,处理器可在各种性能状态或等级(所谓的P状态,即从PO到PN)上操作。 一般而言,Pl性能状态可对应于可由OS请求的最高保证的性能状态。除此Pl状态之外, OS可进一步请求更高的性能状态,即,PO状态。该PO状态因此可以是机会型状态或超频模 式状态,在该状态中,当功率和/或热预算是可用的时候,处理器硬件可配置处理器或其至 少多个部分,以便以高于保证频率的频率进行操作。在许多实现中,处理器可包括高于Pl 保证的最大频率的多个所谓的元(bin)频率,该频率超出特定处理器的最大峰值频率,在 制造期间融合或以其他方式写入到处理器中。此外,根据ACPI,处理器也可在各种功率状态 或等级上进行操作。对于功率状态,ACPI指定不同的功耗状态,一般将其称为C状态(C0、 Cl到Cn状态)。当核是活动的时候,它以CO状态运行,而当该核是空闲的时候,可将其置 于核低功率状态,也将其称为核非零C状态(例如,C1-C6状态),每一个C状态都处于更低 的功耗等级(使得C6是比Cl更深的低功率状态,等等)。当处理器受约束(例如,功率和 /或热约束)时,可采用附加的功耗等级。在实施例中,此类状态可包括具有最小操作频率 和/或电压的CO状态(在本文中被称为Pn或Pm状态)。
[0029] 多个实施例可监测对横跨处理器或SoC的核或其他处理引擎的热轮廓的总体评 估,并且采取合适的扼制动作,其中扼制的严重度是总体热轮廓的函数。热核是被最剧烈地 扼制的,但是一旦任何核已超出温度阈值,则抢先地稍微扼制所有核。如果热轮廓继续升 温,则对已超出所指定的热阈值的最热的核采取更激进的动作,但是也更多地稍微扼制较 冷的核以防止它们越过热阈值并需要激进的扼制,那样当然降低了性能。通过抢先地稍微 扼制不超过任何热阈值的多个核扼制,多个实施例可将最高可能的性能维持在热预算或热 包络下。
[0030] 在实施例中,可使用多遍(multiple-pass)的方法,按此方法,可分配多个核或基 于它们的温度和/或最热核的温度对这些核估值。然后,基于该经评估的值,可热扼制一 个或多个核,经由性能状态降低使经扼制的核实现冷却的益处。取决于温度,可产生不同 等级的扼制,其中,在一个实施例中,一个P状态的降低对应于使操作频率减少一个频率元 (bin),并且将操作电压减少到电压/频率表中对应的电压。取决于配置值的值,如果指示 了更高等级的扼制,则可将P状态降低到Pn(最小电压(V_)处的最大频率)或Pm(最小 频率)。
[0031] 现在参考图2,所示为根据本发明的实施例的配置方法的流程图。如图2中所示, 在实施例中,可由可以是诸如PCU之类的功率控制器的部分的热控制逻辑来执行方法200。 当然会理解,在其他实施例中,可由硬件、软件和/或
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1