具有用于存储器的故障监测的电子设备及相关联的方法与流程

文档序号:12552446阅读:169来源:国知局
具有用于存储器的故障监测的电子设备及相关联的方法与流程

本发明涉及存储器的领域,并且更具体而言,涉及在存储器中的高效的故障监测及相关方法。



背景技术:

在被突然地中断之前,应用可以容忍某种程度上的存储器故障。在执行应用期间可能发生永久故障和瞬态故障。永久故障通常被定义为永久的并且当应用关闭时不消失的故障。永久故障通常是由存储器的物理缺陷导致的。瞬态故障是在执行应用期间发生的并且当应用关闭时消失的故障。瞬态故障通常是在存储器没有物理缺陷的情况下由数据值的改变导致的,并且可以由于环境条件而发生。

通常,瞬态故障比永久故障发生得更加频繁得多并且是存储器在使用周期之上使故障显现的结果。在存在纠错机制的情况下,应用可能需要了解这类故障的范围以评估存储器的物理缺陷的严重性。例如,一个应用可以用于在汽车上使用的存储器。



技术实现要素:

一种电子设备可以包括具有经受瞬态故障和永久故障的多个存储器位置的存储器以及耦接于该存储器的故障检测电路。该故障检测电路可以被配置成用于:在第一时间读取该多个存储器位置,并且在该第一时间基于读取该多个存储器位置确定包括这些瞬态和永久故障的第一故障计数和故障映射签名,并且存储该第一故障计数和故障映射签名。该故障检测电路还可以:在第二时间读取该多个存储器位置,并且在该第二时间基于读取该多个存储器位置确定包括这些瞬态和永久故障的第二故障计数和故障映射签名,并且将该存储的第一故障计数和故障映射签名与该第二故障计数和故障映射签名进行比较以确定永久故障计数。因此,该故障检测电路可以在存储器中检测故障的范围,如在故障达到应用被突然地中断的阈值点之前。

故障检测设备还可以包括用于基于永久故障计数超过阈值而生成指示的指示器电路。此外,故障检测电路可以包括被配置成用于读取该多个存储器位置的存储器控制器以及耦接于存储器控制器的存储器错误处置器。存储器控制器可以包括循环冗余校验(CRC)电路和错误计数器,该CRC电路被配置成用于检测瞬态和永久故障,而该错误计数器耦接于该CRC电路并且被配置成用于确定瞬态和永久故障的第一和第二计数。

故障检测电路可以进一步包括处理器,该处理器耦接于CRC电路和错误计数器以将存储的第一故障计数和故障映射签名与第二故障计数和故障映射签名进行比较从而基于存储的第一故障计数和故障映射签名与第二故障计数和故障映射签名之间的改变确定永久故障计数。存储器控制器可以被配置成用于在存储器内的不同块之上以三重复制存储第一故障计数和故障映射签名以及永久故障计数并且CRC电路可以被配置成用于从每个瞬态和永久故障计算故障映射签名。

用于确定故障计数和故障映射签名的第一时间可以对应于存储器的掉电事件而第二时间可以是存储器的上电事件,其中,每个瞬态和永久故障可以具有与其相关联的存储器地址和校正子。此外,每个瞬态故障可以是单比特或双比特可校正的错误,而每个永久故障可以是三比特不可校正的错误。存储器可以是非易失性存储器。

另一方面涉及一种监测存储器中的故障的方法,该方法可以包括:在第一时间读取多个存储器位置、在第一时间基于读取该多个存储器位置确定包括这些瞬态和永久故障的第一故障计数和故障映射签名、并且存储第一故障计数和故障映射签名。该方法还可以包括:在第二时间读取该多个存储器位置、在第二时间基于读取该多个存储器位置确定包括这些瞬态和永久故障的第二故障计数和故障映射签名、并且将存储的第一故障计数和故障映射签名与第二故障计数和故障映射签名进行比较以确定永久故障计数。此外,该方法可以包括基于永久故障计数超过阈值而生成指示并且可以在存储器内的不同块之上以三重复制存储第一和第二故障计数以及故障映射签名。

附图说明

图1是根据本发明的实施例的电子设备的框图;

图2是图1的电子设备的更详细的框图;并且

图3是根据本发明的实施例的一种监测故障的方法的流程图。

具体实施方式

现在将参照附图在下文中更为全面地描述本发明,在附图中示出了本发明的优选实施例。然而,本发明可以用许多不同的形式来体现,并且不应当被解释为限于在此所列出的实施例。相反,提供了这些实施例从而使得本披露将是全面和完整的,并且将向本领域技术人员完全传达本发明的范围。贯穿全文相似的数字指代相似的元件,并且上撇号符号用于指示在替代实施例中的类似元件。

首先参照图1,电子设备100被展示具有耦接于存储器104的故障检测电路102。存储器104可以具有经受瞬态故障和永久故障的多个存储器位置。故障检测电路102可以被配置成用于在第一时间(例如,掉电)处读取存储器104并且在该第一时间处基于读取存储器104确定包括这些瞬态和永久故障的第一故障计数和故障映射签名。存储第一故障计数和故障映射签名。在具体实施例中,还可以在第二时间(例如,上电)处读取存储器104并且在该第二时间处基于读取该多个存储器位置确定包括这些瞬态和永久故障的第二故障计数和故障映射签名。故障检测电路102可以将对应于掉电事件的存储的第一故障计数和故障映射签名与对应于上电事件的第二故障计数和故障映射签名进行比较以确定永久故障计数。

电子设备100能够在启动(例如,上电)时并且在关机(例如,掉电)之前管理并读取存储器102、将故障信息存储在可检索的位置中、对存储的故障信息和最近的测试执行评估、并且读取结果从而评估永久和瞬态故障的范围。

如以上所解释的,读取存储器104(例如,闪存或其他非易失性存储器)并且可以在测试期间检测可校正的错误。例如,可校正的错误可以是单比特、双比特或三比特的。对应于每种类型的可校正的错误的地址和校正子可以用于计算对应的可校正的错误的唯一签名。

此外,在存储器104中每种类型的可校正的错误的数量由故障检测电路102计数。此计数可以与上一次上电和掉电测试的存储的计数结果进行比较并且可以相应地关于每种类型的永久和瞬态故障更新这些记录。

例如,在上电时未被检测到但在上一次掉电时被检测到的可校正的错误被认为是瞬态故障,而在上电和掉电时都被检测到的可校正的错误被认为是永久故障。每种类型的可校正的错误的签名和计数被存储在存储器104(例如,数据闪存)内部并且可以由分布在不同的存储块之上的三重复制和纠错方案保护。

现在参照图2,故障检测电路102可以包括存储器控制器106。存储器控制器可以被配置成用于读取存储器104的多个存储器位置。存储器控制器106耦接于系统/测试总线104。如将由本领域技术人员认识到的是,存储器控制器106还可以具有循环冗余校验(CRC)108,该CRC被配置成用于检测瞬态和永久故障。CRC 108还可以针对每个瞬态和永久故障使用对应可校正的错误的地址和校正子计算签名。

存储器控制器106的错误计数器110可以用于确定瞬态和永久故障的第一和第二计数。存储器控制器106可以包括处理器112,该处理器可以用软件编程或者可以是专用集成电路(ASIC)。例如,存储器控制器106的处理器112可以被配置成用于将第一故障计数和故障映射签名与第二故障计数和故障映射签名进行比较以基于对应于掉电事件的第一故障计数和故障映射签名与对应于上电事件的第二故障计数和故障映射签名之间的改变确定永久故障计数。在特定实施例中,每个瞬态故障可以例如被定义为单比特或双比特可校正的错误,而每个永久故障可以例如被定义为三比特不可校正的错误。可校正的错误比特计数基于纠错方案是可扩展的。

故障检测电路102的存储器错误处置器114可以耦接于存储器104并且被配置成用于接收永久和瞬态故障。存储器错误处置器114可以被配置成用于存储(n)个可校正的和(m)个不可校正的错误。尽管安全和高保险系统可以实现用于在电子设备100的寿命期间处置错误的纠错方案,在故障达到应用116被突然地中断的临界点之前故障在存储器104中的范围现在可以由故障检测电路102指示。

例如,如将由本领域技术人员认识到的是,纠错方案可以校正多达(x)个比特。存储器错误处置器114接收所有错误指示,即,具有相应的地址和校正子的可校正的和不可校正的错误。存储器错误处置器114可以存储最多(n)个可校正的和(m)个不可校正的错误。将多达(x-1)个比特校正的可校正的错误转发至存储器错误处置器114可以由寄存器掩模,实现针对在存储器控制器106内部的随机/瞬态故障的保护方案。例如,单比特错误可以被掩模为不重要的。

在存储器104的启动测试之后,将针对每种类型的可校正的错误的由CRC 108计算的签名和错误计数器110的计数与之前存储的记录进行比较以检测每种类型的可校正的错误的数量中的任何改变。针对每种类型的可校正的错误的计数的增加可以指示应用116可能更近乎被突然地中断。故障检测电路进一步包括耦接于处理器112以基于永久故障计数超过阈值而生成指示的指示器电路或指示器118。

如以上所解释的,在正常操作期间,可校正的错误掩模(CE-MASK)可以活跃的并且阻止将特定的可校正的错误(单比特)转发至存储器错误处置器114。出于用于诊断失效的调试目的,CE-MASK可以被取消激活。

直到没有(x)比特可校正的错误被报告时,针对(x-1)比特或更少比特的校正不被故障检测电路102(可配置的)考虑在内。在第一个(x)比特校正被报告后,在每次上电时执行测试,其中,存储器104的所有位置被读取并且错误的签名由CRC 108计算连同由错误计数器110执行对每个可校正的错误的计数。在运行时期间,瞬态(x-1)比特可校正的错误不被报告给存储器控制器106。

在硬件/软件控制之下在不同的闪存块之上分布的存储器104(例如,数据闪存)中以三重复制存储针对每种类型的错误的签名和计数。

在每次测试之后,将针对每种类型的可校正的错误(单比特、双比特、三比特……)的计算的签名和计数与之前存储的计数(例如,来自上电或掉电)进行比较以检测每种类型的可校正的错误的数量中的任何改变并且记录因此针对瞬态和永久类型的故障被更新。在掉电时,存储器104被再次读取并且每个可校正的错误的签名和错误计数可以被存储。因此,在从之前的上电事件到掉电事件处可校正的错误没有改变指示没有附加的瞬态故障。如果在从上一次掉电事件到下一个上电事件处可校正的错误的计数没有改变,那么没有附加的永久故障被检测到。

在正常操作期间,单错误校正掩模(SEC-MASK)可以是活跃的并且阻止将SEC事件转发至存储器错误处置器114。出于用于诊断失效的调试目的,SEC-MASK可以被取消激活。

现在参照图3,现在描述并且总体上指定一种监测存储器中的故障的方法200的流程图。以上所描述的故障检测电路102可以实现方法200。例如,在202在第一时间读取多个存储器位置,并且在204在第一时间(例如,对应于掉电事件)并且基于读取该多个存储器位置确定包括瞬态和永久故障的第一故障计数。移至206,在存储器内的不同存储器块之上以三重复制存储永久和瞬态故障的第一故障计数和故障映射签名。

在208在第二时间处读取该多个存储器位置并且在210在该第二时间(例如,对应于上电事件)处基于读取该多个存储器位置确定包括这些瞬态和永久故障的第二故障计数和故障映射签名。在212,将存储的第一故障计数和故障映射签名(例如,对应于掉电事件)与第二故障计数和故障映射签名(例如,对应于上电事件)进行比较以确定永久故障计数。在214,基于永久故障计数超过阈值而生成指示。在216,可以在存储器中的不同块之上以三重复制存储第二故障计数和故障映射签名。在204,该方法可以通过再次读取存储器位置并且重复以上所描述的处理而继续监测永久和瞬态故障。

本发明的许多修改和其他实施例对于受益于前面的描述和相关附图中呈现的教导的本领域技术人员来说将是显而易见的。因此,应当理解本发明不限于所披露的具体实施例,并且那些修改及实施例旨在被包括于所附权利要求书的范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1