闭环软错误率灵敏度控制的制作方法

文档序号:6768863阅读:448来源:国知局
专利名称:闭环软错误率灵敏度控制的制作方法
闭环软错误率灵敏度控制
背景技术
现代数字集成电路可能具有受阿尔法粒子或中子冲击形式的辐射干扰的内部逻 辑。一种破坏被称为单事件翻转(Single Event Upset, SEU)。当在例如存储器、锁存器、 触发器以及电荷耦合器件等存储元件中出现SEU时,SEU是持续性的。这种持续性特别麻 烦。SEU出现的比率被称为软错误率(Soft Error Rate, SER)。控制逻辑或状态机中的持 续SEU可能导致电路进入不希望的状态。这可能导致系统故障。辐射(例如,阿尔法粒子和中子粒子)通量随物理环境和位置而变化。例如,宇宙 辐射水平与高度相关,因此可能在飞机飞行时显著变化。在另一个示例中,自由中子倾向于 跟随磁极。因此,中子通量在世界各地可能显著不同。因此,SER也随系统或集成电路的物 理环境和位置而不同。

发明内容
由此,本发明的实施例可包括一种设备,该设备包括软错误率监视器,其产生对 在传感器中出现的软错误率的指示,所述传感器接收影响在所述传感器中出现的所述软错 误率的电源电压;以及电源电压控制装置,其接收对所述软错误率的所述指示并设置所述 电源电压,所述电源电压控制装置将所述电源电压设置为满足在所述传感器中出现标准软
错误率。由此,本发明的实施例可以进一步包括一种操作电子装置的方法,该方法包括从 传感器接收对软错误率的指示信号(indicator),所述传感器的灵敏度基于输入电压;以 及响应于来自所述传感器的对所述软错误率的所述指示信号的变化调节所述输入电压以 改变所述传感器的所述灵敏度。由此,本发明的实施例可以进一步包括一种设备,该设备包括软错误率传感器, 所述软错误率传感器的灵敏度基于输入电压;电压调整器,其基于所述软错误率传感器的 输出确定所述输入电压;以及系统电路,其接收与所述输入电压相对应的电源电压,对软错 误的系统灵敏度基于所述电源电压。


图1是闭环软错误灵敏度控制系统的框图。图2是软错误灵敏度控制系统的框图。图3是软错误控制系统的框图。图4是操作电子装置的方法的流程图。图5是控制软错误的方法的流程图。图6是软错误率传感器的框图。图7是计算机系统的框图。
具体实施例方式图1是闭环软错误灵敏度控制系统的框图。在图1中,软错误灵敏度控制系统100 包括软错误传感器110和电压控制装置120。传感器110输出软错误率指示信号111,所 述软错误率指示信号111被耦合到电压控制装置120。电压控制装置120基于软错误率指 示信号111产生控制电压121,控制电压121被输入到传感器110。控制电压121影响传感 器110对入射到传感器110上的辐射130的灵敏度。这样,传感器110、软错误率指示信号 111、电压控制装置120和控制电压121形成闭环反馈系统,该闭环反馈系统调节对传感器 110的控制电压121,使得软错误率指示信号111对于不同量的入射辐射130保持大致恒定 的水平。在一个实施例中,电压控制装置120可以调节控制电压121以将软错误率指示信 号111保持在阈值水平或者低于阈值水平。在一个实施例中,控制电压121是传感器110中辐射敏感电路的电源电压。随着控 制电压121升高,传感器110中的辐射敏感电路变得对辐射130的冲击较不敏感。例如,传 感器110的额定电源电压附近士5%的范围可以在2 1的范围上改变传感器110的灵敏 度。当辐射130的水平低时,电压控制装置120将较低的控制电压121输出给传感器110。 这使传感器110对辐射130更敏感。通过电压控制装置120(通过控制电压121)将软错误 率指示信号111保持在大致恒定的值来达到平衡。在另一个实施例中,当电压控制装置120 将软错误率指示信号保持在阈值水平或低于阈值水平时达到平衡。在一个实施例中,软错误率指示信号111对应于在传感器110中出现的软错误的 比率。因此,保持软错误率指示信号111处于恒定值对应于保持传感器110中出现的软错 误的比率处于近似恒定的值。同样地,保持软错误率指示信号111处于阈值水平或低于阈 值水平对应于保持传感器110中出现的软错误的比率处于阈值水平或低于阈值水平。在一个实施例中,控制电压121可被用于控制其它电路的软错误率。例如,控制电 压121可被用于设置系统电源电平。因此,当传感器110接收高水平的辐射130时,系统电 源电平升高,以便使系统电路对辐射冲击较不敏感。图2是软错误灵敏度控制系统的框图。在图2中,软错误灵敏度控制系统200包 括传感器210、电压控制装置220和系统250。如前面所讨论的,传感器210、软错误率指示 信号211、电压控制装置220和控制电压221形成闭环反馈系统,该闭环反馈系统调节对传 感器210的控制电压221,使得软错误率指示信号221对于不同量的入射辐射230保持大致 恒定的水平。这样,传感器210的灵敏度被操控,以将在传感器210中出现软错误的比率保 持处于(或低于)恒定值(或阈值)。在图2中,系统250也接收控制电压221。系统250对辐射231的灵敏度受控制电 压221影响。在一个实施例中,对于特定的控制电压221的电平,系统250对辐射231的灵 敏度对应于传感器210对辐射230的灵敏度。这样,在系统250中出现的软错误率对应于 在传感器210中出现的软错误率(或者随其一起变化)。假定辐射230和辐射231彼此成 比例地跟随(即,当辐射230加倍时,辐射231也加倍),则利用控制电压221控制系统250 对辐射231的灵敏度可导致在系统250中出现恒定的软错误率。保持系统250中的这种恒 定的软错误率,而不管冲击系统250的辐射231的水平变化。这样,可以在冲击系统250的 辐射231的各种水平的范围上在系统250中保持稳定的(或者低于阈值)软错误水平。在 一个实施例中,控制电压221是电源电压。
5
图3是软错误控制系统的框图。在图3中,软错误灵敏度控制系统300包括传感器 310、电压控制装置320和系统350。如前面所讨论的,传感器310、软错误率指示信号311、 电压控制装置320和控制电压321形成闭环反馈系统,该闭环反馈系统调节对传感器310 的控制电压321,使得软错误率指示信号311对于不同量的入射辐射330保持大致恒定的水 平。这样,传感器310的灵敏度被操控,以便将由辐射330导致的在传感器310中出现的软 错误率以及由辐射331导致的在系统350中出现的软错误的比率保持处于(或低于)恒定 比率(或阈值)。在一个实施例中,控制电压321是电源电压。在图3中,系统350包括容错(fault tolerant,FT)控制装置351和容错块352。 容错控制装置351耦合到容错块352。容错控制装置351接收软错误率指示信号311。基 于软错误率指示信号311,容错控制装置351可以启用(或启动)使用容错块352的容错方 案。例如,如果闭环反馈系统不能将系统350内的软错误率保持处于阈值水平或低于阈值 水平,则容错控制装置351可以通过使启动系统350使用容错方案以确保不受由辐射331 引起的软错误的影响,来作出响应。容错控制装置351可以启用以确保不受由辐射331引 起的软错误的影响的容错方案的示例包括但不限于检测错误的奇偶性算法;保护数据的 错误校正代码;冗余电路;冗余电路和表决方案;以及由系统350运行的容错或错误校正软 件算法。最后,如果软错误率指示信号311超过第二阈值,则系统350可以停机或警告用户 该系统正在超规格运行并且不应被使用。可以通过错误消息或一些其它类型的指示信号 (例如,错误灯)将该信息通知给用户。应该理解,上述系统适合通过使用软错误率监视器(也叫作软错误率传感器)或 其它辐射通量传感器来控制影响系统(或芯片)的软错误率的硬件和/或软件从而满足期 望的(或要求的)软错误率水平。在一个实施例中,软错误率反馈系统可以全部在一个集 成电路上。在另一个实施例中,反馈系统(或被控系统)的一个或多个部分可以在另一个 芯片上。例如,由反馈系统产生的控制电压可以被芯片外系统电源用以调整该集成电路的 电源。这样,该电压控制装置(例如,120、220和320)在芯片外,而该系统的剩余部分(例 如,传感器210和系统250)在该芯片上。在另一个示例中,传感器可以在与该系统的其它 部件分开的集成电路上。图4是操作电子装置的方法的流程图。图4中所示的步骤可以由系统100、200或 300的一个或多个元件来执行。从灵敏度可变的软错误率传感器接收软错误率指示信号 002)。例如,电压控制装置120可以从传感器110接收软错误率指示信号111。传感器110 对入射辐射130的灵敏度基于控制电压121而变化。响应于软错误率指示信号的变化,调节软错误率传感器的灵敏度(404)。例如,响 应于来自传感器110的软错误率指示信号111的变化,电压控制装置120通过调节控制电 压121来调节传感器110对入射辐射130的灵敏度。图5是控制软错误的方法的流程图。图5中所示的步骤可以由系统300的一个或 多个元件来执行。将输入的电源电压施加给软错误率传感器和系统(502)。例如,控制电压 321可以是(或控制)由传感器310和系统350使用的电源电压。基于软错误率传感器的 变化的输出调节输入的电源电压(504)。例如,可以响应于传感器310输出的变化(软错误 率指示信号311)通过电压控制装置320调节控制电压321 (或者它控制的电源电压)。
当软错误率传感器的输出满足一标准时启动系统容错方案(506)。例如,容错控制 装置351可以响应于软错误率指示信号311超过阈值启动容错352。容错控制装置351可 以启动基于硬件或软件的容错方案351。当软错误率指示信号311回落到低于阈值时,容错 控制装置351可以关掉基于硬件或软件的容错方案352。容错控制装置351可以启动的容 错方案包括但不限于检测错误的奇偶性算法;保护数据的错误校正代码;冗余电路;冗余 电路和表决方案以及容错或错误校正软件算法。图6是软错误率传感器的框图。图6中所示的软错误率传感器600是可作为传感 器110、210或310中的任一个使用的示例SER传感器。SER传感器600执行所谓的辐射影 响自测电路(Circuit for RadiationEffects Self-Test, CREST)算法。SER 传感器 600 包 括模式发生器602、串行移位寄存器604和错误检测器611。串行移位寄存器604 —般是针 对软错误(以及由此而来的软错误率)执行测试的电路。串行移位寄存器具有N的整数倍 个级(即,N*M个级,其中N和M是整数)。这些级中的每一个对辐射的灵敏度受输入电压 621影响。在一个实施例中,输入电压621是对串行移位寄存器604的各级的电源电压。模式发生器602输出重复数据模式。重复数据模式在串行移位寄存器604的每N 个移位周期重复其本身。串行移位寄存器604的输入接收来自模式发生器602的重复数据 模式。错误检测器606接收串行移位寄存器604的输出。错误检测器606还接收来自模式 发生器602的重复数据模式。因为串行移位寄存器604是重复数据模式的长度(即,N)的 整数倍(M),所以如果在串行移位寄存器604中没有出现软错误,则在错误检测器606的两 个输入接收到的数据模式将匹配。然而,如果该重复数据模式的一个或多个位被辐射冲击 改变,则错误检测器606将作为其两个输入之间的差检测到这一点。因此,错误检测器606 可以产生软错误率611的指示信号。在一个实施例中,模式发生器602可以是来回切换输出(例如,10101010)的简单 触发器。在另一个实施例中,模式发生器602可以实现线性反馈移位寄存器以产生更复杂 的重复模式。错误检测器606可以是简单的比较器(例如,XOR门)和计数器。在一个实 施例中,模式发生器602和/或错误检测器606可以被构造为与串行移位寄存器604相比 对辐射冲击更不敏感。以上描述的方法、系统、装置和功能可以由一个或多个计算机系统来实现或通过 一个或多个计算机系统来执行。上述方法还可以存储在计算机可读介质中。控制系统100、 软错误灵敏度控制系统200和软错误灵敏度控制系统300中的一些或全部元件可以包含或 者包括在计算机系统、集成电路、片上系统(SoC)或者它们的部件中。其包括但不限于控制 系统100、软错误传感器110、电压控制装置120、软错误灵敏度控制系统200、传感器210、电 压控制装置220、系统250、软错误灵敏度控制系统300、传感器310、电压控制装置320和系 ^ 350 ο图7示出计算机系统的框图。计算机系统700包括通信接口 720、处理系统730、 存储系统740和用户接口 760。处理系统730操作耦合到存储系统740。存储系统740存 储软件750和数据770。处理系统730操作耦合到通信接口 720和用户接口 760。计算机 系统700可以包括程序化的通用计算机。计算机系统700可以包括微处理器。计算机系统 700可以包括可编程的或者专用的电路。计算机系统700可以分布在共同包括元件720-770 的多个装置、处理器、存储装置和/或接口中。
通信接口 720可以包括网络接口、调制解调器、端口、总线、链路、收发器或其它通 信装置。通信接口 720可以分布在多个通信装置中。处理系统730可以包括微处理器、微 控制器、逻辑电路或其它处理装置。处理系统730可以分布在多个处理装置中。用户接口 760可以包括键盘、鼠标、语音识别接口、麦克风和扬声器、图形显示器、触摸屏或其它类型 的用户接口装置。用户接口 760可以分布在多个接口装置中。存储系统740可以包括盘、 带、集成电路、RAM、ROM、网络存储器、服务器或其它存储功能。存储系统740可以是计算机 可读介质。存储系统740可以分布在多个存储器装置中。处理系统730从存储系统740获取并执行软件750。处理系统可以获取并存储数 据770。处理系统还可以通过通信接口 720获取并存储数据。处理系统750可以创建或修 改软件750或数据770以实现有形结果。处理系统可以控制通信接口 720或用户接口 770 以实现有形结果。处理系统可以通过通信接口 720获取并执行远程存储的软件。软件750和远程存储的软件可以包括操作系统、应用程序、驱动程序、网络软件 以及典型地由计算机系统执行的其它软件。软件750可以包括应用程序、小应用程序 (applet)、固件或者典型地由计算机系统执行的其它形式的机器可读处理指令。当被处理 系统730执行时,软件750或者远程存储的软件可以指示计算机系统700按本文所描述的 进行操作。为了示例和说明的目的给出了对本发明的以上描述。该描述不是穷举性的,也不 意图将本发明局限于所公开的确切形式,并且鉴于上述教导可以进行其它修改和变型。选 择并描述实施例是为了最佳地解释本发明的原理及其实际应用,从而使本领域技术人员能 够以适合于预期的特定用途的各种实施例和各种变型最佳地使用本发明。意图将所附权利 要求解释为包括由现有技术所限定之外的本发明的其它可供选择的实施例。
权利要求
1.一种设备,包括软错误率监视器,其产生对在传感器中出现的软错误率的指示,所述传感器接收影响 在所述传感器中出现的所述软错误率的电源电压;以及电源电压控制装置,其接收对所述软错误率的所述指示并设置所述电源电压,所述电 源电压控制装置将所述电源电压设置为满足在所述传感器中出现的标准软错误率。
2.根据权利要求1所述的设备,还包括 系统电路,所述系统电路接收所述电源电压。
3.根据权利要求1所述的设备,其中所述传感器和所述系统电路在同一集成电路上。
4.根据权利要求2所述的设备,还包括响应于对所述软错误率的所述指示的控制装置,所述控制装置指示所述系统电路的第 一部分实施容错方案。
5.根据权利要求4所述的设备,其中所述容错方案包括使用错误校正代码ECC。
6.根据权利要求4所述的设备,其中所述容错方案包括使用冗余电路。
7.根据权利要求6所述的设备,其中所述容错方案包括逻辑表决方案。
8.根据权利要求4所述的设备,其中所述容错方案包括系统软件算法。
9.一种操作电子装置的方法,包括从传感器接收对软错误率的指示信号,所述传感器的灵敏度基于输入电压;以及 响应于来自所述传感器的所述软错误率的所述指示信号中的变化调节所述输入电压 以改变所述传感器的所述灵敏度。
10.根据权利要求9所述的方法,其中响应于表明所述软错误率增加的所述软错误率 的所述指示信号调节所述输入电压以减小所述传感器的所述灵敏度。
11.根据权利要求9所述的方法,其中所述输入电压对应于提供给系统电路的电源电压。
12.根据权利要求11所述的方法,还包括 促使在所述系统电路中使用容错方案。
13.根据权利要求12所述的方法,其中所述容错方案包括错误校正代码、奇偶性和冗 余逻辑中的至少一个。
14.一种设备,包括软错误率传感器,所述软错误率传感器的灵敏度基于输入电压; 电压调整器,其基于所述软错误率传感器的输出确定所述输入电压;以及 系统电路,其接收与所述输入电压相对应的电源电压,对软错误的系统灵敏度基于所 述电源电压。
15.根据权利要求14所述的设备,包括响应于所述软错误率传感器的所述输出的容错电路。
16.根据权利要求15所述的设备,其中所述容错电路响应于软件控制。
17.根据权利要求15所述的设备,其中所述软错误率传感器和所述系统电路在所述同 一集成电路上。
18.根据权利要求15所述的设备,其中所述容错电路和所述系统电路在所述同一集成 电路上。
19.根据权利要求18所述的设备,其中所述容错电路包括实施表决方案的冗余电路。
20.根据权利要求18所述的设备,其中所述容错电路启动错误校正代码数据保护方案。
全文摘要
本发明涉及闭环软错误率灵敏度控制。公开了一种用于控制由对电子电路的辐射冲击导致的软错误率(SER)的闭环反馈系统。灵敏度可变的软错误率检测器提供对应于软错误率的输出。该输出被提供到电压控制装置。该电压控制装置的输出反馈到传感器的灵敏度控制装置—由此形成反馈环。电压控制装置的输出可以是软错误率传感器的电源。软错误率传感器的输出还可以被用于启动和停用容错方案或警告用户。
文档编号G11C29/42GK102087882SQ20101014344
公开日2011年6月8日 申请日期2010年3月17日 优先权日2009年12月2日
发明者J·S·布朗, M·F·唐纳 申请人:Lsi公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1