用于延长另一系统的有用寿命的方法和系统的制作方法

文档序号:6562769阅读:79来源:国知局
专利名称:用于延长另一系统的有用寿命的方法和系统的制作方法
技术领域
本发明一般地涉及影响功能系统的性能退化(degration)和恢复(recovery)性质,并特别涉及用于通过优化与包含在第二系统中的器件相关联的恢复性质来延长所述第二系统的有用寿命的第一系统和方法。
背景技术
在负偏置温度不稳定性(NBTI)现象中,加电的深亚微米互补金属氧化物半导体(CMOS)器件随着时间表现出性能退化(即性能退化性质、老化机制等)。例如,NBTI能够在p型CMOS器件中导致阈值电压偏移(threshold voltage shift)。这种阈值电压偏移潜在地是器件按比例缩小到更小的几何尺寸的重大障碍,因为更小的几何尺寸要求更小的阈值电压。NBTI现象另外的方面是断电的器件将相反地随着时间表现出性能恢复(即恢复性质)。存在着对适于优化这种恢复性质以便减轻老化机制对功能器件以及使用了这些器件的系统的有用寿命和可靠性的影响的电路和逻辑设计的需求。

发明内容
考虑到前述内容,这里公开了用于通过优化恢复性质对第二系统内的器件的影响以便减轻老化性质的效应来延长所述第二系统的有用寿命的方法和第一系统的实施例。
本发明的第一系统的实施例包含多个被包含在所述第二系统中并适于在所述第二系统内独立地执行相同的功能的重复(duplicate)器件。联合工作的参考信号发生器、参考信号比较器、功率控制器和状态机适于在重复器件之间切换第二系统内相同功能的执行,以便允许器件恢复。根本上,在重复器件之间切换是基于可被状态机访问的预定策略。这个策略规定了用于确定何时一个或更多个重复器件应该进入恢复期以及用于确定何时重复器件准备好退出恢复期的标准。这个策略还提供了用于做出这种确定的计划(schedule),并且作为选择,还指示可以由系统同时应对的负载分布管理目标和容错目标。
更具体地说,第一系统的实施例包含多个被包含在第二系统中并适于在所述第二系统内独立地执行相同的功能的重复器件。参考信号发生器被包含在每一个重复器件中。而且,如上面所述,被包含在系统中的是预定策略,所述预定策略储存在存储器中。比较器与每一个参考信号发生器相连,并适于按照状态机指示的那样并基于所述预定策略规定的计划来开始产生参考信号。具体来说,比较器能够在状态机的指示下,通过独立于所述重复器件地控制所述发生器的加电和断电,开始从全部或被选择的重复器件产生参考信号。一旦加电,参考信号发生器就产生指示与其对应重复器件中的性能退化相关联的值的信号。比较器适于接收并比较参考信号(例如确定与全部或被选择重复器件相关联的性能退化值之间的差别)。比较结果被传递回状态机。
状态机与每一个重复器件以及比较器均相通信。状态机适于通过功率控制系统控制重复器件的加电和断电。具体来说,状态机适于按照预定策略的规定,基于参考信号之间的最小差别,交替地对重复器件加电和断电。除了参考信号之间的最小差别以外,状态机在命令将给定的重复器件加电之前,也可以考虑重复器件从断电到加电所需要的最小恢复时间。被连接到状态机的计数器可以适于跟踪每一个器件的恢复时间,并在做出决策过程期间将该信息提供给状态机。交替地将重复器件加电和断电允许每一个器件在性能退化之后恢复,从而在整体上延长了第二系统的有用寿命和并提高了可靠性。因此,状态机还适于基于重复器件的数量和所允许的各自的恢复期,来预测被延长的有用寿命。还是如策略规定的那样,这种预测可以按需要显示,或者作为在距所预测的有用寿命终点预先选择的时段的自动警告。
额外的目标也可以被编程到策略中,并由状态机控制。例如,状态机可以适于通过在由预定策略中的负载管理目标规定的时间将多于一个的重复器件加电,在重复器件之间平衡负载分布。类似地,状态机可以适于基于预定策略中的容错目标来限制重复器件的加电。例如,系统可以包含适于检测重复器件内的错误的错误检测系统,并且状态机可以适于基于由所述检测系统检测并传递到所述状态机的特定类型的错误来禁止器件的加电。状态机还适于基于对第二系统内所述相同功能的执行的要求,如预定策略所规定的那样将所有重复器件断电。
本发明的用于延长系统的有用寿命的方法的实施例包含将多个适于执行系统内相同的功能的重复器件包含在系统中。建立规定了用于在重复器件之间切换相同功能的执行以便允许器件恢复的标准的策略。具体来说,建立了设置用于确定何时一个或更多个重复器件应该进入恢复期以及用于确定何时重复器件准备好退出恢复期的标准的策略。这个策略还提供了用于做出这种确定的计划,并且作为选择,还指示负载分布管理目标和容错目标,所述系统可以同时应对负载分布管理目标和容错目标。
所述方法还包括使用比较器开始从重复器件产生参考信号。如上面详细描述的那样,每一个参考信号均可以从包含于对应的重复器件中的参考信号发生器发出。具体来说,每一个参考信号均可以指示与其对应重复器件相关联的性能退化值。通过按照状态机所指示的并基于预定策略规定的计划,独立于重复器件地控制发生器的加电和断电,比较器能够开始从全部或被选择的参考信号发生器的信号产生。一旦产生了信号,则它们被接收并被比较(例如由比较器),以便确定全部或被选择的信号之间的差别(即确定信号所指示的性能退化值之间的差别)。
然后,为了允许重复器件在性能退化之后恢复,按照预定策略的规定,重复器件被基于参考信号之间的最小差别交替地加电和断电(例如,如上所述,由状态机结合功率控制系统)。在确定是否将特定器件加电时,状态机可以考虑重复器件从断电到加电的所需要的最小恢复时间。这可以通过跟踪每一个器件的恢复时间(例如通过使用计数器)并在确定过程期间将此信息提供给状态机实现。允许重复器件在性能退化之后恢复延长了系统的有用寿命。因此,所述方法还可以包含基于重复器件的数量和所允许的各自的恢复期,预测被延长的有用寿命。还是如策略规定的那样,这种预测可以按要求向用户显示,或者作为在距所预测的有用寿命终点某个预先选择的时段的自动警告。
通过本发明的实施例还可以实现额外的目标。这些额外的目标可以被包含在所述策略中并由例如状态机控制。具体来说,所述方法可以包含通过在由预定策略中的负载管理目标规定的时间将多于一个重复器件加电,在系统中的重复器件之间平衡负载分布。所述方法还可以包含检测重复器件中的错误(例如通过使用与状态机相通信的错误检测系统)并基于预定策略中的容错目标限制重复器件的加电。最后,所述方法可以包含确定何时系统要求执行由重复器件提供的功能并在不要求该功能时(例如在延长的非活动期期间),按照预定策略的规定,将全部重复器件断电。
当结合下面的描述和附图考虑本发明的实施例的这些以及其他方面时,将更好地理解它们。但是应该理解,下面的描述虽然指示了本发明的优选实施例及其许多具体细节,但却是为了说明而非限制而给出。不偏离本发明的精神,可以在本发明实施例的范围内做出许多改变和修改,并且本发明应该包括这些修改。


参考附图,从下面的详细描述将更好地理解本发明的实施例,在附图中图1是示出本发明的系统的实施例的示意性框图;和图2是示出本发明的方法的实施例的示意性流程图。
具体实施例方式
本发明的实施例及其各种特征和有益细节被参考附图中示出的非限制性实施例更充分地说明,并在下面的描述中被详细阐述。应该注意,在附图中示出的特征不一定按比例绘制。省略了公知部件和处理技术的描述,以便不要不必要地模糊本发明的实施例。这里所使用的例子仅仅旨在辅助对其中可以实践本发明的实施例的方法的理解,并进一步使得本领域技术人员能够实践本发明的实施例。因此,不应该将这些例子理解为限制本发明的范围。
如上所述,例如负偏置温度不稳定性(NBTI)的现象能够导致加电的器件随着时间表现出性能退化(例如阈值电压偏移)。这种现象相反地也将导致断电的器件随着时间表现出性能恢复,如在“NBTIA Growing Threat to Device Reliability”中所示(LauraPeters,Semiconductor International,2004年3月1日,通过引用被包含于此)。因此,已经知道存在导致器件在使用时表现出性能退化性质并在休止时表现出恢复性质的现象。但是,存在着对适于优化恢复性质以便减轻性能退化性质的影响,从而延长功能器件以及使用了功能器件的系统的有用寿命和提高其可靠性的电路和逻辑设计的需求。
这里公开的是能够在存在例如NBTI的在器件中既导致性能退化也导致恢复性质的现象时延长另一系统(即第二系统)的产品寿命的方法和系统(即第一系统)的实施例。通过在所述第二系统内电路的冗余实例(即适于执行相同功能的重复器件)之间周期性地切换实现了产品寿命延长(例如多达10倍),所述切换不是因为故障或仅因为时间的推移,而是因为器件在故障之前休止和恢复的确定需要(例如基于测得的每一个重复器件的退化的比较)。根据预先确定的计划,基于最小退化差别能够确定对休止和恢复的需要,以便防止在重复器件之间过快的切换。因此,所述切换主要是基于防止故障的需要,而不是基于容错。但是,如果检测到错误(例如通过集成错误检测系统),则切换到给定器件的决策能够被额外地基于容错的目的。
更具体地说,这里公开的是用于通过优化恢复性质对第二系统内的器件的影响以便减轻老化性质的效应来延长另一系统(即第二系统)的有用寿命的方法和系统(即第一系统)和方法的实施例。
参考图1,本发明的第一系统100的实施例适于和第二系统50(例如包含电子和/或其他类型部件的系统、包含多个集成电路的系统、包含片上系统(SOC)集成电路的系统,等等)一起使用。第二系统50要求包含至少一个器件101(例如分立的电路单元、单个处理器,等等)以执行特定功能。所要求的器件是既表现出性能退化也表现出恢复性质的类型。
第一系统100包含所要求的被包含在第二系统50(例如在使用现有总线设计的共享总线180上,现有总线设计例如工业标准总线)中的器件101a-c的多个实例(例如冗余的处理器、冗余的电路单元,等等)。这些重复器件101a-c适于在第二系统50内独立地执行相同的功能。加电的器件被施以负荷,并经受性能退化(例如阈值偏移)。断电的器件处于休止状态(即恢复期)。第一系统100可以被构建为使得每一个重复器件101a-c均能被无缝地加电和断电而不在第二系统50内导致故障或者性能中断。因此,对于总线上的其他重复器件,每一个重复器件101a-c均能起到缓解装置(reliever)的作用。联合工作的参考信号发生器102a-c、参考信号比较器120、功率控制器112和状态机110适于基于性能退化的度量(例如阈值退化),在重复器件101a-c之间切换第二系统内相同功能的执行,以便允许器件恢复。根本上,在重复器件101a-c之间的切换是基于预定策略130,策略130储存在存储器中并可被状态机110访问。策略130规定了用于确定何时一个或更多个重复器件101a-c应该进入恢复期以及用于确定何时重复器件准备好退出恢复期的标准。此策略130还提供了用于做出这种确定的计划,并作为选择,还指示了可以由系统100同时应对的负载分布管理目标和容错目标。
参考退化信号发生器102a-c被包含在每一个重复器件中。可以用任何适当的用于独立地跟踪其对应的重复器件101a-c的退化的机制配置每一个发生器102a-c。具体来说,每一个发生器102a-c均可以包含适于确定或估计与其对应重复器件中的性能退化相关联的某个值并产生指示该值的模拟、数字或混和信号122的一个电路或多个电路。
例如,如在2005年6月23日公开的公开号为2005/0134394的No.10/745,427号美国专利申请中所示,每一个发生器均可以包含一对相同的用于监视器件性能退化的环形振荡器,所述专利申请被通过引用包含于此。无论何时对应的重复器件加电,都可以使能环形振荡器中的一个,以使其与器件一起被施以负荷。而另一个只有在需要比较时才被选择性地使能。被选择性地使能的环形振荡器提供了用于与老化或退化的环形振荡器输出比较的参考输出。通过比较这两个输出,能够获得被施以负荷的环形振荡器的频率退化值。该频率退化值代表对应的重复器件的性能退化的度量,并能够被发信号通知给所述比较器。
或者,每一个发生器均可以包含用于监视器件性能退化的p型金属氧化物半导体(PMOS)晶体管。无论何时对应的重复器件被加电,该PMOS晶体管都能够被加电(即被施以负荷),并且无论何时对应的重复器件被断电,该PMOS晶体管都能够被断电(即休止)。该PMOS晶体管阈值电压偏移的度量能够代表对应的重复器件的性能退化的度量,并能够被发信号通知给所述比较器。
在上述任意一种机制中,发生器102a-c在对应的重复器件101a-c未加电时被加电的唯一时间是在重复器件处于休止并且需要多个重复器件之间的参考信号122的比较时。因此,从环形振荡器的比较得出的测得的频率退化值或者测得的PMOS晶体管的阈值偏移值将指示对应的重复器件101a-c的最坏情况性能退化值。
如上所述,包含在系统100中的预定策略130可以是通用的(例如,由制造商提供,供与各种重复器件类型一起使用)或定制的(例如依据应用用户确定),并被储存在存储器中(例如片上存储器)。该策略可以随着器件101a-c的寿命改变,并且可从外部编程。
比较器120(即参考信号比较器、参考退化信号测量和比较子系统,等等)与每一个参信号发生器102a-c均相连,并且适于基于由预定策略130规定的计划,按照状态机110所指示的那样开始产生所述参考信号。具体来说,比较器120能够在状态机110的指示下,通过使用一个或更多个模拟、数字或混和信号电路经功率控制系统112来独立于重复器件地控制发生器102a-c的加电和断电,开始从全部或者被选择的重复器件101a-c产生参考信号。一旦加电,参考信号发生器102a-c就产生指示与对应重复器件101a-c中的性能退化相关联的某个值(例如阈值电压偏移度量、频率退化值,等等)的信号,比较器120适于接收参考信号122,并适于有区别地测量和比较参考信号122(例如确定全部或被选择重复器件的诸如阈值偏移度量值或频率退化值这样的值之间的差别)。比较结果被传递回状态机110。
状态机110(即恢复控制状态机)与每一个重复器件101a-c以及比较器120相通信。状态机110适于确定采用哪一个重复器件101a-c,并且适于与功率控制系统112一起,无缝地将重复器件101a-c使能和禁用(即加电和断电)。例如,为了实现切换,可以发信号通知一个器件(例如101a)保存其状态、清空其高速缓存并关闭,而同时另一个器件(例如101b)可以被加电、被加载所述状态,并被发信号通知继续执行任务(即执行功能)。具体来说,状态机110适于按照预定策略的规定,基于从每一个发生器102a-c发出的参考信号122之间的最小差别,交替地将重复器件101a-c加电和断电。除了参考信号122之间的最小差别以外,状态机110在命令将给定的重复器件加电之前,也可以考虑重复器件从断电到加电所需要的最小恢复时间。被连接到状态机110并可由其复位的计数器115(即自从上次切换起的时间(time-since-last-switch)计数器)可以适于跟踪每一个器件101a-c的恢复时间,并在做出决策过程期间将该信息提供给状态机110,以防止过早切换。交替地将重复器件101a-c加电和断电允许每一个器件在性能退化之后恢复,从而延长了第二系统50自身的有用寿命并提高了可靠性。具体来说,在一个重复器件相对于另一个器件的性能退化之后将该器件断电,允许所述被断电的器件恢复。如果基于相对性能退化给予每一个器件恢复的机会,系统的有用寿命将被延长。因此,状态机110或者其子系统还可以适于基于重复器件的数量和所允许的各自的恢复期,预测第二系统50的被延长的有用寿命。还是如策略130规定的那样,这种预测可以按需要在外部显示(见显示器140),或者作为在距所预测的有用寿命终点预先选择的时段的自动警告。
额外的目标也可以被编程到策略130中,并由状态机110控制。例如,状态机110可以适于通过在由预定策略130中的负载管理目标规定的时间将多于一个器件加电、在重复器件101a-c之间平衡负载分布(例如按需要的冲击)。类似地,状态机110可以适于基于预定策略130中的容错目标,限制重复器件的加电。例如,第一系统100可以包含适于检测重复器件内的错误的错误检测系统145,并且状态机可以适于基于由所述检测系统检测并传递到所述状态机的特定类型的错误禁止器件的加电。本领域技术人员将理解,错误检测系统145在本领域中是公知的,并且预期可以将各种不同的系统包含在本发明的系统100中。状态机110还可以适于基于第二系统50内对器件所提供的功能的执行的要求,如预定策略所规定的那样将所有重复器件断电(即开始全休止状态)。作为选择,第一系统100可以包含与每一个重复器件101a-c相关联的计步器103a-c,以便监视每一个器件的总开启时间,并在做出切换决策时考虑这些时间。
本领域技术人员将理解,虽然图1示出了第一系统100的被包含于单个控制器160中的各种部件(例如状态机110、比较器120、策略存储器130、计数器115,等等),但是预期也可以使用多个控制器和/或分立部件来实施如上所述的本发明的第一系统100。
下面是一种用于选择性地控制给重复器件(即冗余的电路实例)和参考信号发生器(即参考退化信号产生子电路)的加电和休止顺序并用于比较参考信号的示范性实施机制。本领域技术人员将理解,虽然将这种实施机制示为供与被构建为测量PMOS晶体管的阈值电压偏移的参考信号发生器一起使用,但是类似的实施机制也可以与被构建为使用环形振荡器比较确定频率退化值的参考信号发生器一起使用。
恢复控制状态机110能够执行下列步骤序列
BEGINIf exiting_reset OR comparison_timer_expriedThenIf(not exiting_reset)ThenPrevious_instance=current_instanceEndifFor instance I(1 to N)Measure_VTD(I)If(VTD(I))<min_instance_VTD)ThenIf(exiting_reset)ThenCurrent_instance=IElse if(VTD(previous_instance)-VTD(i)>threshold_to_swithc)ThenCurrent_instance=IEndifMin_instance_VTD=VTD(I)EndifEndforIf min_instance_VTD>impending_failure_VTDThenSet impending_failure_waring_signalEndifIf(exing_reset OR previous_instance!=current_instance)
ThenPower up current instanceLoad core state and enable current instanceIf(not exiting reset)ThenPowerdown previous instanceEndifEndifInitialize comprison_timerEndifGo to BEGIN比较器120(即参考退化信号测量和比较子系统)在被状态机触发时能够执行下列步骤。这些步骤实际上是子程序,并且在上面的流程中用度量VTD(I)指示。
伪码实例I的度量VTDBEGIN将实例I的未被施以负荷的VT参考晶体管加电将实例I的被施以负荷的VT参考晶体管加电(如果I是当前实例,则已经加电)将实例I的VT差别测量信号产生电路加电读取并捕获VTD(I)=实例I的被施以负荷的参考晶体管VT-实例I的未被施以负荷的参考晶体管VT将实例I的未被施以负荷的VT参考晶体管断电除非I是当前实例,否则将实例I的被施以负荷的VT参考晶体管断电将实例I的VT差别测量信号产生电路断电完成现在结合图1参考图2,本发明的用于延长系统50(例如包含电子和/或其他类型部件的系统、包含多个集成电路的系统、包含片上系统(SOC)集成电路的系统,等等)的有用寿命的方法的实施例包含将重复器件101a-c(例如冗余的处理器、冗余的电路单元,等等)包含在系统50内,所述重复器件101a-c表现出性能退化和恢复性质,并适于在集成电路内执行相同的功能(202)。建立策略130,策略130规定了用于在重复器件101a-c之间切换相同功能的执行以便允许器件恢复而同时允许功能的无缝执行的标准(204)。具体来说,建立了设置用于确定何时一个或更多个重复器件101a-c应该进入恢复期以及用于确定何时重复器件准备好退出恢复期(例如参考信号之间的最小差别205、最小恢复时间207、全休止前提条件210,等等)的标准的策略。策略130还提供了用于做出这种确定的计划206,并且作为选择,还指示负载分布管理目标208和容错目标209,系统100可以同时应对负载分布管理目标208和容错目标209。
所述方法还包括使用比较器120开始从重复器件产生参考信号(212)。如上面详细描述的那样,每一个参考信号122均可以从包含于对应的重复器件101a-c中的参考信号发生器102a-c发出(214)。具体来说,每一个参考信号122均可以指示与其对应重复器件101a-c相关联的性能退化值(例如阈值偏移度量、频率退化度量,等等)。通过按状态机110所指示的并基于预定策略130规定的计划,独立于将重复器件101a-c加电地来控制发生器的加电和断电(例如通过功率控制系统112),比较器120能够开始从全部或被选择的参考信号发生器的信号产生。一旦产生了信号122(在过程214),则它们被接收并被比较(例如由比较器120),以便确定全部或被选择的信号之间的差别(即确定信号所指示的性能退化值之间的差别)(220)然后,为了允许重复器件在性能退化之后恢复,按照预定策略130的规定,重复器件101a-c被基于参考信号122之间的最小差别交替地加电和断电(例如,如上所述,由状态机110结合功率控制系统112)(222)。具体来说,在一个重复器件相对于另一个器件的性能退化之后将该重复器件断电,允许该重复器件恢复。如果每一个器件均被基于相对性能退化给予恢复的机会,则系统的有用寿命将被延长。在确定是否将特定器件加电时,状态机110可以考虑重复器件从断电到加电的所需要的最小恢复时间(见207)。这可以通过跟踪每一个器件101a-c的恢复时间(例如通过使用计数器115)并在确定过程期间将此信息提供给状态机110实现(218)。允许重复器件在性能退化之后恢复延长了系统50的有用寿命。因此,所述方法还可以包含基于重复器件的数量和所允许的各自的恢复期,来预测延长的有用寿命。还是如策略130规定的那样,这种预测可以由状态机110或其子系统完成,并且可以在显示器140上按要求向用户显示,或者作为距所预测的有用寿命终点某个预先选择的时段的自动警告。
通过本发明的实施例还可以实现额外的目标。这些额外的目标可以被包含在策略130中(见208-209),并由例如状态机110控制。具体来说,所述方法可以包含通过在由预定策略130中的负载管理目标208规定的时间将一个或更多个重复器件加电,在集成电路中的重复器件101a-c之间平衡负载分布(224)。所述方法还可以包含检测重复器件中的错误(例如通过使用与状态机110相通信的错误检测系统145)并基于预定策略130中的容错目标209限制重复器件的加电(226)。最后,所述方法可以包含确定何时集成电路要求执行由重复器件提供的功能并在不要求该功能时(例如在延长的非活动期期间),按预定策略130的规定,将全部重复器件断电(228)。
如上所述的本发明的系统和计算机实施的方法的实施例可以具有完全硬件实施例的形式或者既包括硬件也包括软件的实施例的形式。在一个实施例中,使用软件实施本发明,所述软件包括但不限于固件、驻留软件、微码,等等。此外,实施例可以具有可从计算机可用或计算机可读介质访问的计算机程序产品的形式,所述介质提供了供与计算机或任何指令执行系统使用或与其结合使用的程序代码。就本描述来说,计算机可用或计算机可读介质可以是任何能够包含、储存、传递、传播或者传输供指令执行系统、装置或设备使用或与其一起使用的程序的装置。介质可以是电、磁、光学、电磁、红外或者半导体系统(或装置或设备)或传播介质。计算机可读介质的例子包括半导体或固态存储器、磁带、可移动计算机磁盘、随机访问存储器(RAM)、只读存储器(ROM)、硬磁盘和光盘。当前光盘的例子包括紧制盘-只读存储器(CD-ROM)、紧制盘-读/写存储器(CD-R/W)和DVD。适合储存和/或执行程序代码的数据处理系统将包括至少一个通过系统总线直接或间接地耦合到存储器元件的处理器。存储器元件可以包括在代码的实际执行期间采用的本地存储器、大容量储存器,以及高速缓存存储器,高速缓存存储器提供至少一些程序代码的临时储存,以便减少在执行期间必须从大容量储存器取回代码的次数。
上述本发明的方法和系统是相对于其他包含冗余电路实例并基于容错或时间推移(例如基于加电小时的计划维护)在这些实例之间切换的技术的改进,因为这些技术导致了电路不均衡的耗损和较低的总的有用寿命延长。此外,本发明的系统是相对于其他技术的改进,因为它是无状态的。具体来说,不要求所述系统记忆将器件加电之前的任何事情。因此,为了运转它不需要片上或片外的非易失性储存元件。
因此,上面公开的是用于在存在例如NBTI的导致在系统器件中既表现出性能退化也表现出恢复性质的现象时延长第二系统的产品寿命的方法和相关联的第一系统的实施例。本发明的第一系统包含多个被包含在共享总线上的第二系统中的重复器件。这些重复器件适于在第二系统内独立地执行相同的功能。联合工作的参考信号发生器、参考信号比较器、功率控制器和状态机适于基于性能退化的度量,在重复器件之间无缝地切换第二系统内相同功能的执行。这种切换过程允许每一个重复器件在性能退化之后恢复。根本上,在重复器件之间切换是基于可被状态机访问的预定策略。当决定何时以及是否在器件之间切换功能的执行时,作为选择,可以考虑容错目标和负载管理目标。
前述具体实施例的描述将如此充分地展示本发明的一般本质,所以其他人通过应用当前的知识,能够针对各种应用很容易地修改和/或改造这些具体实施例而不偏离一般性概念,因此,这些改造和修改应该并且被确定为包含在所公开的实施例的等同物的意思和范围内。要理解,这里采用的措词和术语是为了说明而不是限制的目的。因此,虽然已经从实施例的角度描述了本发明,但是本领域技术人员将发现,可以利用所附权利要求的精神和范围以内的修改实践本发明。
权利要求
1.一种用于延长第二系统的有用寿命的第一系统,所述第一系统包含适于在所述第二系统内独立地执行相同功能的重复器件;被包含在每一个所述重复器件中、并适于产生指示与每一个所述重复器件的性能退化相关联的值的参考信号的参考信号发生器;适于接收并比较所述参考信号的比较器;和与所述比较器以及每一个所述重复器件相通信的状态机,其中,所述状态机适于按照预定策略的规定并基于所述重复器件之间的相对性能退化,交替地将所述重复器件加电和断电,所述相对性能退化由所述参考信号之间的最小差别指示,并且其中,交替地将所述重复器件加电和断电允许所述重复器件在性能退化之后恢复。
2.如权利要求1所述的第一系统,其中,所述比较器还适于基于由所述预定策略规定的计划,按照所述状态机的指示开始产生所述参考信号。
3.如权利要求1所述的第一系统,其中,所述比较器还适于通过独立于所述重复器件来控制所述参考信号发生器的加电和断电,开始产生所述参考信号。
4.如权利要求1所述的第一系统,其中,允许所述重复器件恢复延长了所述第二系统的所述有用寿命,并且其中,所述状态机还适于预测被延长的所述有用寿命。
5.如权利要求1所述的第一系统,其中,所述预定策略还规定了所述重复器件从断电到加电所需要的最小恢复时间,并且其中,所述第一系统还包含计数器,所述计数器连接到所述状态机并适于跟踪恢复时间。
6.一种用于延长第二系统的有用寿命的第一系统,所述第一系统包含适于在所述第二系统内独立地执行相同功能的重复器件;被包含在每一个所述重复器件中,并适于产生指示与每一个所述重复器件的性能退化相关联的值的参考信号的参考信号发生器;适于接收并比较所述参考信号的比较器;和与所述比较器以及每一个所述重复器件相通信的状态机,其中,所述状态机适于按照预定策略的规定并基于所述重复器件之间的相对性能退化,交替地将所述重复器件加电和断电,所述相对性能退化由所述参考信号之间的最小差别指示,其中,交替地将所述重复器件加电和断电允许所述重复器件在性能退化之后恢复,并且其中,所述状态机还适于按照所述预定策略中的负载管理目标的规定,通过将多于一个所述重复器件加电来平衡负载分布。
7.如权利要求6所述的第一系统,还包含适于检测所述重复器件中的错误的错误检测系统,其中,所述状态机与所述错误检测系统相通信,并且还适于基于所述预定策略中的容错目标来限制所述重复器件的加电。
8.如权利要求6所述的第一系统,其中,所述状态机还适于按照所述预定策略的规定,基于在所述第二系统内执行所述相同功能的要求,将全部所述重复器件断电。
9.如权利要求6所述的第一系统,其中,所述比较器还适于基于由所述预定策略规定的计划,按照所述状态机的指示开始产生所述参考信号。
10.如权利要求6所述的第一系统,其中,所述比较器还适于通过独立于所述重复器件来控制所述参考信号发生器的加电和断电,开始产生所述参考信号。
11.如权利要求6所述的第一系统,其中,允许所述重复器件恢复延长了所述第二系统的所述有用寿命,并且其中,所述状态机还适于预测被延长的所述有用寿命。
12.如权利要求6所述的第一系统,其中,所述预定策略还规定了所述重复器件从断电到加电所需要的最小恢复时间,并且其中,所述第一系统还包含计数器,所述计数器连接到所述状态机并适于跟踪恢复时间。
13.一种用于延长系统的有用寿命的方法,所述方法包含接收指示与多个重复器件的性能退化相关联的值的参考信号,所述重复器件适于在所述第二系统内独立地执行相同的功能;比较所述参考信号;和按照预定策略的规定并基于所述重复器件之间的相对性能退化,交替地将所述重复器件加电和断电,以便允许所述重复器件在性能退化之后恢复,所述相对性能退化由所述参考信号之间的最小差别指示。
14.如权利要求13所述的方法,还包含按照所述预定策略中的负载管理目标的规定,通过将多于一个所述重复器件加电来平衡所述系统中的负载分布。
15.如权利要求13所述的方法,还包含检测所述重复器件中的错误;和基于所述预定策略中的容错目标来限制所述重复器件的加电。
16.如权利要求13所述的方法,还包含确定所述系统何时需要所述相同功能;和按照所述预定策略的规定,当不需要所述相同的功能时,将全部所述重复器件断电。
17.如权利要求13所述的方法,还包含基于由所述预定策略规定的计划,开始从被包含在所述重复器件中的参考信号发生器产生所述参考信号。
18.如权利要求13所述的方法,还包含通过独立于所述重复器件来控制所述参考信号发生器的加电和断电,开始从被包含在所述重复器件中的参考信号发生器产生所述参考信号。
19.如权利要求13所述的方法,其中,所述预定策略还规定了所述重复器件从断电到加电所需要的最小恢复时间,并且其中,所述方法还包含跟踪恢复时间。
20.如权利要求13所述的方法,其中,允许所述重复器件恢复延长了所述系统的所述有用寿命,并且其中,所述方法还包含预测所述被延长的有用寿命。
全文摘要
所公开的是用于在存在导致系统器件内既表现出性能退化也表现出恢复性质的现象时延长第二系统的产品寿命的方法和相关联的第一系统的实施例。所述第一系统包括多个被包含在第二系统中(例如在共享总线上)的重复器件。这些重复器件适于在第二系统内独立地执行相同的功能。联合工作的参考信号发生器、参考信号比较器、功率控制器和状态机可以适于基于性能退化的测量,在重复器件之间无缝地切换第二系统内相同功能的执行,以便允许器件恢复。可被状态机访问的预定策略规定了何时以及是否开始切换。
文档编号G06F11/00GK1975686SQ20061014465
公开日2007年6月6日 申请日期2006年11月14日 优先权日2005年11月30日
发明者肯尼斯·J.·古德瑙, 安德鲁·S.·维耶尼克, 马克·S.·斯迪杜哈, 奥斯卡·C.·斯特罗哈克, 保罗·S.·祖乔夫斯基, 彼德·A.·陶姆布利, 斯蒂芬·G.·叔马 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1