用于实施热完整性筛选的方法和装置的制作方法

文档序号:6561984阅读:151来源:国知局
专利名称:用于实施热完整性筛选的方法和装置的制作方法
技术领域
本发明一般地涉及数据处理领域,具体来说涉及用于实施热完整性筛选(heat integrity screening)的方法、装置和计算机程序产品。
背景技术
为了提供了改善的可靠性,需要一种用于测试处理器模块的有效机制。非常期望提供一种有效的机制来验证散热片对于处理器模块间隙的热完整性。
通常,用于验证散热片对于处理器模块间隙的热完整性的唯一方式需要手工测量和计算。

发明内容
本发明的主要方面是提供一种用于实施处理器模块的热完整性筛选的方法、装置和计算机程序产品。本发明的其他重要方面是提供这样的一种方法、装置和计算机程序产品,其用于实施基本上无副作用的、并且克服现有技术配置的许多缺点的热完整性筛选。
简而言之,提供了一种方法、装置和计算机程序产品,用于实施处理器模块的热完整性筛选。预定义的处理器模块温度数据被获得和处理。在不向处理器模块供电的情况下执行初始热校准以记录预定义的处理器电阻。在加电时进行极限检验,以检测热结合(bond)操作温度并与处理器模块的识别的门限温度比较。响应于大于所识别的门限温度的识别的热结合操作温度,所述处理器模块被关闭,并且所述处理器模块没通过。
按照本发明的特征,使用被处理的处理器的模块温度数据和参数数据来进行间隙检验,以确定热间隙正确。为了获得处理器的参数数据,识别处理器的电子芯片标识(ECID)。而且,所述间隙检验验证向印刷电路卡附加了正确的处理器模块。
按照本发明的特征,将数据采集单元耦合到处理器模块,以测量模块电源电压和管芯上(on-die)的热值。对于所述处理器芯片提供在管芯上的电热调节器(thermistor)或热二极管。进口空气温度传感器(诸如用于测量进口空气温度的、在进入冷却空气路径中的电热调节器)耦合到所述数据采集单元。电子芯片标识(ECID)被从处理器读取,并且被用于获得芯片制造商记录。在运行时自动选择特定印刷电路板处理器模块组件的预定义的常数,以验证正确的处理器模块附加到所述印刷电路卡,并且热间隙是正确的。


通过在附图中图解的本发明的优选实施例的下面的详细说明,可以最好地理解本发明以及上述和其他目的和优点,在附图中图1是图解按照所述优选实施例的用于实施热完整性筛选的示例性计算机测试系统的方框示;图2是图解按照所述优选实施例的用于实施热完整性筛选的示例性被测试系统装置的方框示;图3、4、5、6A和6B是图解按照所述优选实施例的用于实施热完整性筛选的方法的示例性步骤的流程图;图7是图解按照所述优选实施例的计算机程序产品的方框图。
具体实施例方式
按照本发明的特征,提供了一种方法,用于自动化散热片对于处理器模块间隙的热完整性筛选的处理。这使得可以由具有很少或没有训练的操作员按下按钮测试多个不同处理器模块系统的热间隙。
按照本发明的特征,在识别处理器的电子芯片标识(ECID)之前,进行极限检验(check)。所述极限检验使用一般常数来验证所述处理器不足够热得损坏其本身,例如小于115℃,但是因为所述计算是一般的和有意近似的,所以不使用所述极限检验来验证所述间隙的长期热稳定性。所述极限检验提供了总火灾检验(gross fire check),以便当处理器在加电变热时,例如当存在火灾的可能时,所述处理器模块系统马上关闭。
按照本发明的特征,一旦知道了ECID,则进行间隙检验。使用ECID来获得对于被测试处理器模块特定的热完整性(TI)数据。使用这种特定数据,以例如比使用极限检验方法好100倍的精度,执行间隙检验,以验证所述结合的完整性。如果在被测试处理器模块加电之前ECID数据已知,则可以消除极限检验。但是因为需要被测试处理器模块系统的加电来读取ECID,所以极限检验有益地用于在损坏发生之前识别大多数未组装的部分。
现在参照附图,在图1中,示出了按照所述优选实施例的一种示例性计算机测试系统,它一般地被指定为附图标号100,用于实现热完整性筛选。计算机系统100包括主处理器102或中央处理器单元(CPU)102,它由系统总线106耦合到存储器管理单元(MMU)108和系统存储器,所述系统存储器包括动态随机存取存储设备(DRAM)110、非易失性随机存取存储器(NVRAM)112和快闪存储器114。耦合到系统总线106和MMU108的海量存储接口116将直接存取存储器(DASD)118和CD-ROM驱动器120连接到主处理器102。计算机系统100包括连接到显示器124的显示接口122和耦合到系统总线106的测试接口126。被测试系统128耦合到测试接口126。被测试系统128包括例如单个芯片模块(SCM)、双芯片模块(DCM)或四芯片模块(QCM)。计算机系统100包括操作系统130、所述优选实施例的热筛选测试程序132和在存储器136中驻留的所述优选实施例的芯片参数和测试数据134。
以足够明白本发明的简化形式示出了计算机测试系统100。所图解的计算机测试系统100不意欲暗示架构或功能限制。本发明可以用于各种硬件实现和系统以及各种其他的内部硬件器件,诸如多个主处理器。
现在参照图2,示出了按照所述优选实施例的被测试示例性系统128,它包括用于实施热完整性筛选的装置。测试系统128包括散热片200,它由结合材料202耦合到处理器芯片204。向处理器芯片204提供了在管芯(die)上的温度传感器206,诸如在管芯上的电热调节器或热二极管。所述处理器模块包括衬底208,用于支持在印刷电路板210上安装的处理器芯片204。数据采集单元212经由连接器214而耦合到处理器模块,以获得预定义的测量的处理器模块数据,诸如模块电源电压和在管芯上的热值。为了获得其他专有印刷电路板处理器模块数据,在系统引导期间从一个或多个处理器204读取电子芯片标识(ECID),并且可以从数据库得到由ECID索引的信息。
例如,为单个芯片模块(SCM)、双芯片模块(DCM)或四芯片模块(QCM),经由连接器214向每个处理器芯片204提供多个通用接口总线(GPIB)通道或连接216,以测量例如中心电热调节器电阻和模块干线电压(rail voltage)VDD。对于SCM或DCM,每个模块提供一个电热调节器206。对于QCM,每个模块提供具有公共端的两个电热调节器206。用于测量进口空气温度的进口空气温度传感器218(诸如位于来自系统风扇220的进入的冷却空气路径中的电热调节器)被耦合到数据采集单元212。
现在参照图3、4、5、6A和6B,示出了按照所述优选实施例的用于实现热完整性筛选的方法的示例性步骤。
参照图3,示出了由测试计算机系统100运行的示例性概况测试流程,包括在块300开始的独特的初始热校准、极限检验、间隙检验的步骤;和数据记录步骤。如在块302中所示,当对于被测试处理器模块断电时,执行初始的热校准。参照图4图解和说明了初始热校准。然后,如在方框304中所示的那样,提供了片刻延迟(delay minutes),直到大批电力(bulk power)接通。
如在判定块306中所示那样执行极限检验热结合。参照图5图解和说明极限检验。如果处理器模块通过极限检验,则向所述被测试系统提供延迟,以达到系统充沛(flush),如在块308中所示。然后,从一个或多个处理器204读取电子芯片标识(ECID),如在块310中所示。然后,使用所述ECID来获得芯片制造商记录。接着,如在判定块312中所示,执行间隙检验热结合。如果处理器模块在判定块312通过间隙检验,则将初始程序装载(IPL)延续到试验器(exerciser)HTX,如在块314中所示。
然后,所述试验器HTX运行设置的时段,如在块316中所示。然后,如在判定块318中所示,执行延续间隙检验热结合。参照图6A和6B,图解和说明了间隙检验。如果处理器模块在判定块318通过了所述间隙检验,则所述被测试系统关闭,如在块320中所示,如在块322中所示,记录测试数据,并且如在块323中所示,返回通过结果。否则,如果处理器模块在判定块318未能通过所述间隙检验,则所述被测试系统被关闭,如在块324中所示,并且如在块326中所示,记录测试数据,并且如在块328中所示,返回通过结果。在块322或块324记录的测试数据包括例如通过/没通过结果、测试日期、版本公式(formula)、版本常数、GPIB地址或通道、一个或多个ECID、测试器类型、模块类型、处理器类型、TI字段、VDD引脚、一个或多个芯片电热调节器电阻和空气电热调节器电阻。
参照图4,示出了以读取和记录空气温度开始的示例性初始温度校准,如在块400中所示。接着,读取特定的GPIB通道,以检验电阻,如在块402中所示。将所述电阻与诸如20K欧姆的预定值相比较,如在判定块404中所示,以识别模块类型。对于SCM或DCM,则如在块406中所示,读取特定的GPIB通道,以测量并向文件记录在室温下的芯片内核的电热调节器电阻,以用于以后的步骤。对于QCM,如在块408中所示,读取特定的一对GPIB通道,以测量和向文件记录在室温下的芯片内核的两个电热调节器电阻,以用于以后的步骤。然后,向所述文件存储印刷电路卡的条形码,如在块410中所示。如在块412中所示,返回通过结果。
参照图5,示出了在加电后执行的示例性极限检验,用于检测热结合操作温度并与处理器模块的识别的门限温度比较,首先,读取所述特定的GPIB通道以检查电阻,如在块500中所示。将所述电阻与预定值(诸如在判定块502中所示的20K欧姆)相比较,以识别模块类型。对于SCM或DCM,则如在块504中所示,读取特定的GPIB通道,以测量和记录热结合操作温度。然后,将所述热结合操作温度与处理器模块的识别的门限温度相比较,如在判定块506中所示。对于QCM,如在块508中所示,读取特定的一对GPIB通道,以测量和记录两个热结合操作温度。然后,将每个热结合操作温度与处理器模块的识别的门限温度相比较,如在判定块510中所示。当所述热结合操作温度小于识别的门限温度时,返回通过结果,如在块512中所示。响应于大于识别的门限温度的热结合操作温度,则返回没通过结果,如在块514中所示。
参照图6A和6B,示出了示例性间隙检验。首先,读取所述特定的GPIB通道,以检验电阻,如在块600中所示。将所述电阻与预定值(诸如在判定块602中所示的20K欧姆)相比较,以识别模块类型。然后,对于SCM或DCM,所述序列步骤进行到读取预定义的测量值,包括模块电源电压VDD、在管芯上的电热调节器电阻值和进口空气温度电热调节器电阻值,如在块604中所示。所述空气电热调节器电阻值被转换为入口空气温度,如在块606中所示。然后,使用ECID和其他的识别的各个ECC位,预定义的处理器和模块数据被识别,并且预定变量被提取和存储,如在块608中所示。在运行时自动选择用于特定印刷电路板处理器模块组件的预定义的常数,用于验证正确的处理器模块被附加到所述印刷电路卡以及热间隙是正确的。接着,识别处理器模块版本,如在判定块610中所示。如果需要识别的处理器模块版本,则从热校准步骤读取数据,并且将其用于覆盖电热调节器数据,如在块612中所示。然后,使用特定的元件编号数据,确定处理器类型、模块类型和内核(core)良好,诸如1个内核或2个内核良好芯片,如在块614中所示。接着,使用特定的元件编号数据,然后验证指定的模块,以允许用于所述卡上,如在块616中所示。然后,继图6B中所示的进入点A后,示例性步骤继续。
参照图6B,接着,将到所述卡的ERIF测量电流标准化,如在块618中所示。然后,对于负载线和实际卡电压VDD进行调整,如在块620中所示。接着,如在块622中所示,计算模块功率。接着,将ECID数据与所述卡元件编号数据相比较,如在判定块624中所示。如果需要的话,则应用校正因子,如在块626中所示。然后,提供对于DCM的模块类型的检验,如在判定块628中所示。响应于识别的模块类型,计算散热片基底温度,如在块630和块632之一中所示。然后,计算在所述卡中的热间隙温度极限(Tj LIMIT),如在块634中所示。在所述卡中的实际热间隙温度(Tj ACTUAL)被计算,如在块636中所示。将识别的间隙温度Tj ACTUAL与所识别的门限温度极限Tj LIMIT相比较,如在判定块638中所示。当每个实际间隙温度Tj ACTUAL小于或等于识别的门限温度Tj LIMIT时,返回通过结果,如在块640中所示。如果实际间隙温度Tj ACTUAL大于识别的门限温度Tj LIMIT,则返回没通过结果,如在块642中所示。
再次返回到用于QCM的图6A,在有一些微小的变化的情况下,将所有的上述计算进行两次,然后将每个识别的间隙温度与识别的门限温度极限相比较,如在判定块644中所示。当每个实际间隙温度小于或等于识别的门限温度时,返回通过,如在块646中所示。如果实际间隙温度大于识别的门限温度,则返回没通过,如在块648中所示。
现在参照图7,图解了本发明的制造物品或计算机程序产品700。所述计算机程序产品700包括记录介质702、诸如软盘、光学读取致密盘形式的高容量只读存储器或CD-ROM、磁带、诸如数字或模拟通信链路之类的传输型媒体或类似的计算机程序产品。记录介质702在介质702上存储程序装置704、706、708、710,用于执行用于实现在图1的系统100中的优选实施例的热完整性筛选的方法。
由记录的程序装置704、706、708、710定义的一个或多个相关的模块的逻辑组件或程序指令序列,导向用于实现所述优选实施例的热完整性筛选的计算机系统100。
虽然已经参照在附图中所示的本发明的实施例的细节,说明了本发明,但是这些细节不意欲限制在权利要求中要求保护的本发明的范围。
权利要求
1.一种用于实施处理器模块的热完整性筛选的方法,包括获得和处理预定义的处理器模块温度数据;在不向处理器模块供电的情况下执行初始的热校准,以记录预定义的处理器电阻;在加电时进行极限检验,以检测热结合操作温度;将所述热结合操作温度与处理器模块的识别的门限温度相比较;响应于大于识别的门限温度的识别的热结合操作温度,断电和判断所述处理器模块没通过。
2.按照权利要求1的用于实施热完整性筛选的方法,包括识别处理器的参数数据;并且使用所述被处理的所述处理器的模块温度数据和所述识别的参数数据,执行间隙检验,以识别热间隙。
3.按照权利要求2的用于实施热完整性筛选的方法,其中,识别处理器的参数数据包括识别处理器的电子芯片标识(ECID)以获得处理器的参数数据。
4.按照权利要求2的用于实施热完整性筛选的方法,其中,执行所述间隙检验包括验证正确的处理器模块被附加到印刷电路卡。
5.按照权利要求1的用于实施热完整性筛选的方法,其中,获得和处理预定义的处理器模块温度数据包括测量芯片上温度。
6.按照权利要求5的用于实施热完整性筛选的方法,包括在处理器芯片管芯上提供管芯上电热调节器和热二极管中的所选择的一个。
7.按照权利要求5的用于实施热完整性筛选的方法,包括测量进口空气温度。
8.按照权利要求1的用于实施热完整性筛选的方法,包括测量模块电源电压。
9.按照权利要求1的用于实施热完整性筛选的方法,包括自动选择识别的特定电路板处理器模块组件的预定义的常数;并且,使用所述选择的预定义的常数和所述处理的模块温度数据,执行间隙检验。
10.一种用于实施处理器模块的热完整性筛选的装置,包括数据采集单元,其耦合到处理器模块以获得预定义的处理器模块数据;热筛选测试程序,用于接收和处理所述预定义的处理器模块数据;用于在不向处理器模块供电的情况下执行初始的热校准,以记录预定义的处理器电阻;用于在加电时进行极限检验以检测热结合操作温度,并且将所述热结合操作温度与处理器模块的识别的门限温度相比较;以及用于响应于大于识别的门限温度的识别的热结合操作温度,断电和判断所述处理器模块没通过。
11.按照权利要求10的用于实施处理器模块的热完整性筛选的装置,其中,所述热筛选测试程序还识别处理器的参数数据;并且使用所述被处理的模块数据和所述处理器的识别的参数数据,执行间隙检验,以识别热间隙。
12.按照权利要求10的用于实施处理器模块的热完整性筛选的装置,其中,所述数据采集单元被耦合到进口空气温度传感器,该进口空气温度传感器被置于到处理器模块的进入冷却空气路径中,用于测量进口空气温度,并且所述数据采集单元被耦合到管芯上的热传感器,用于测量在芯片上的温度。
13.按照权利要求10的用于实施处理器模块的热完整性筛选的装置,其中,所述热筛选测试程序还识别处理器的电子芯片标识(ECID),并且获得处理器的预定义的参数数据。
全文摘要
提供了一种方法、装置和计算机程序产品,用于实施热完整性筛选。预定义的处理器模块温度数据被获得和处理。在不向处理器模块供电的情况下执行初始热校准以记录预定义的处理器电阻。在加电时进行极限检验,以检测热结合操作温度并与处理器模块的识别的门限温度比较。响应于大于所识别的门限温度的识别的热结合操作温度,所述处理器模块被关闭,并且处理器模块被判断没通过。
文档编号G06F11/22GK1959650SQ20061013607
公开日2007年5月9日 申请日期2006年10月20日 优先权日2005年11月3日
发明者彼得·J·沙必诺, 特伦斯·W·库珀 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1