作为传统大容量存储设备的替代的非易失性随机存取存储器(NVRAM)的制作方法

文档序号:15462367发布日期:2018-09-18 18:28阅读:290来源:国知局

技术领域

本发明的实施例涉及计算机系统;并且更具体来说,涉及使用非易失性随机存取存储器作为传统大容量存储设备的替代。



背景技术:

A.当前的存储器和存储设备配置

当今计算机创新的限制因素之一是存储器和存储设备技术。在常规计算机系统中,系统存储器通常由动态随机存取存储器(DRAM)来实现。基于DRAM的存储器甚至在不进行存储器读取或写入时也会消耗功率,因为它必须不断对内部电容器充电。基于DRAM的存储器是易失性的,这意味着一旦移除电源,存储在DRAM存储器中的数据就会丢失。

关于大容量存储设备,常规的大容量存储装置通常包括非易失性磁介质(例如,硬盘驱动器)和/或闪速存储器(又称为“闪存”)(例如,固态驱动器(SSD))。这些存储装置可块寻址,这意味着不能个别地存取存储设备的单个字节。而是,作为多字节(例如,16字节或更大的)数据块来读取和写入字节。一般,这些存储装置视为是I/O装置,因为它们由处理器通过实现各种I/O协议的各种I/O适配器来存取。这些I/O适配器和I/O协议消耗大量功率,并且可以对管芯面积和平台的形状因子具有显著影响。另外,对于具有有限电池寿命的便携式或移动装置(例如,平板计算机、相机和移动电话),它们的存储装置(例如,嵌入式多媒体卡(eMMC)和安全数字(SD)卡)通常经由低功率互连和I/O控制器耦合到处理器以便满足活动和空闲功率预算。这些互连和I/O控制器无法持续地递送令人满意的用户体验所需的带宽。

关于固件存储器,常规的计算机系统通常使用闪速存储器装置来存储经常读取但很少(或从不)写入的持久性系统信息。例如,基本输入和输出系统(BIOS)图像通常存储在闪速存储器装置中。当前市场上可用的闪速存储器装置一般具有有限的速度(例如,50MHz)。该速度还会因为读取协议的开销(例如,2.5MHz)而进一步减小。为了加快BIOS执行速度,常规处理器一般在引导过程的可预扩展固件接口(PEI)阶段期间缓存BIOS代码的一部分。但是,处理器高速缓存具有非常有限的容量。因此,可用于初始系统配置的BIOS代码的量也非常有限。处理器高速缓存的大小限制对在PEI阶段中所使用的BIOS代码(又称为“PEI BIOS代码”)的大小施加了显著限制。因此,PEI BIOS代码无法轻易地扩展以便支持存储器配置和多个处理器族的大混合。随着对处理器、处理器互连、利用各种技术和多个处理器族实现的存储器和存储设备的初始化的日益增加的需求,对更多用途的PEIBIOS代码的需要也逐渐增长。一个解决方法是构建更大的处理器高速缓存来缓存代码。但是,处理器高速缓存的大小无法在不对系统的剩余部分产生不利影响的情况下轻易增加。

B.相变存储器(PCM)和相关技术

相变存储器(PCM)有时又称为PCME、PRAM、PCRAM、双向统一存储器、硫化物RAM和C-RAM,它是一种利用硫化物玻璃的独特行为的非易失性计算机存储器。作为通过使电流流过而产生热量的结果,该材料可以在两种状态之间切换:晶态和非晶态。最近版本的PCM可以实现两种额外的不同状态,从而有效地使存储器存储容量加倍。PCM是在非易失性作用中与闪速存储器竞争的多种新存储器技术之一。闪速存储器有多个这些替代希望解决的实际问题。

例如,PCM可以在快速写入非常重要的应用中提供高得多的性能,这部分是因为存储器元件可以更加快速地切换,并且还因为各个位可以变为1或0,而无需首先擦除整个单元块(闪存中是这样的)。PCM的高性能使得它在当前性能受到存储器存取定时限制的非易失性存储器作用中潜在地非常有益。

另外,尽管PCM装置随着使用降级(像闪存一样),但是它们的降级速度缓慢得多。PCM装置可以存活大约1亿次写入循环。PCM寿命受到各种机制的限制,例如由于编程过程中的GST热膨胀引起的降级、金属(及其它材料)迁移和其它机制。

附图说明

通过参考以下描述以及用于说明本发明的实施例的附图,可以最好地理解本发明。图中:

图1示出根据本发明一个实施例在平台存储层级的一个或多个阶层中使用非易失性存储器随机存取(NVRAM)的计算机系统。

图2示出根据本发明一个实施例使用NVRAM作为传统非易失性大容量存储设备和固件存储器的替代的计算机系统。

图3示出根据本发明一个实施例解码输入地址的解码逻辑。

图4示出根据本发明一个实施例在NVRAM装置内配置分区的方法。

图5示出根据本发明第一实施例在软件和由图2的NVRAM提供的存储设备之间的接口。

图6A示出根据本发明的备选实施例的存储器和存储设备子系统。

图6B示出根据本发明的备选实施例的存储器和存储设备子系统。

图7示出根据本发明第二实施例在软件和由NVRAM提供的存储设备之间的接口。

图8A示出根据本发明第三实施例在软件和由NVRAM提供的存储设备之间的接口。

图8B以进一步细节示出图8A的实施例。

图9示出根据本发明第四实施例在软件和由NVRAM提供的存储设备之间的接口。

具体实施方式

在以下描述中,阐述了众多具体细节。但是,将了解,没有这些具体细节也可以实践本发明的实施例。在其它情况下,没有详细示出公知的电路、结构和技术,以免使本描述模糊。

本说明书中对“一个实施例”、“实施例”、“实例实施例”等的提及指示所描述的实施例可以包括特定特征、结构或特性,但每个实施例可能不一定包括所述特定特征、结构或特性。此外,这些短语不一定都指同一个实施例。另外,当结合实施例描述特定特征、结构或特性时,认为结合无论是否明确描述的其它实施例来实现这样的特征、结构或特性是在本领域技术人员的知识范围内。

在以下描述和随附权利要求书中,可以使用术语“耦合”和“连接”及其派生词。应了解,这些术语不是意图作为彼此的同义词。“耦合”用于指示两个或两个以上元件彼此协作或交互,它们可以或者可以不直接彼此物理或电接触。“连接”用于指示在彼此耦合的两个或两个以上元件之间建立通信。

本文中有时使用括入括弧的文字和带虚线边界(例如,大虚线、小虚线、点划线、点)的方框来说明对本发明的实施例增加额外特征的可选操作/组件。但是,不应将这些符号视为表示它们是唯一选项或可选的操作/组件,和/或在本发明的某些实施例中具有实线边界的方框不是可选的。

下文描述的本发明的实施例定义了使得层级存储器子系统组织能够使用NVRAM的平台配置。在存储器层级中使用NVRAM还使能了诸如扩展的引导空间和大容量存储设备实现的新用途,如下文所详细描述。

图1是示出在平台存储层级的一个或多个阶层中使用可字节寻址的非易失性随机存取存储器(NVRAM)130的计算机系统100的框图。术语“平台存储层级”在这里是指供计算机系统100用于存储数据、指令、状态以及其它持久和非持久信息的整个存储介质。在一个实施例中,计算机系统100中的所有持久性存储设备可以按可配置的方式合并到一个NVRAM 130中。另外,可以分派NVRAM 130的某个部分以作为系统存储器的DRAM替代。NVRAM 130的多用途便于从具有在持久性面向块的文件系统上操作的操作系统(OS)的常规平台到理解完全持久的可字节寻址的单级数据存储的OS的技术迁移。

在一个实施例中,NVRAM 130可以配置成在典型的平台存储层级中作为以下中的一个或多个实现所述作用:高速缓存,系统存储器(又称为主存储器、主要存储器、可执行存储器),存储设备(又称为次级存储设备和大容量存储设备),以及固件存储器(例如,引导存储器(又称为BIOS闪存)、可信平台模块(TPM)存储器、用于存储其媒体接入控制(MAC)地址的千兆位以太网网络完整性控制器(NIC)等)。还设想具有不同作用的平台存储层级,并且NVRAM 130的应用不限于上文所描述的作用。

NVRAM(例如,NVRAM 130)可以在其特性和/或其在平台存储层级中的应用方面区别于其它指令和数据存储器/存储设备技术。例如,NVRAM不同于:

1)作为专用于处理器核或由多个处理器核共享的高速缓存应用的静态随机存取存储器(“SRAM”);

2)作为处理器内部(例如,在与处理器相同的管芯上)和/或处理器外部(例如,在与处理器相同或不同的封装上)的一个或多个高速缓存应用的更高速存储器(例如,动态随机存取存储器(“DRAM”));

3)作为驱动存储设备应用的闪速存储器/磁盘/光盘;以及作为引导只读存储器(ROM)应用的存储器,例如闪速存储器或ROM。

在本发明的一个实施例中,NVRAM具有以下特性:

1)非易失性(即使移除电源,它仍维持其内容,这与固态盘(“SSD”)中所使用的闪速存储器类似,但不同于易失性的SRAM和DRAM);

2)比诸如SRAM和DRAM的易失性存储器更低的功率消耗;

3)随机存取(又称为可随机寻址);

4)以比SSD中所发现的闪存更低的粒度级(例如,字节级)可重写和可擦除(闪存一次只可重写和擦除一个“块”,对于NOR闪存最小为64K字节大小,而对于NAND闪存,最小为16K字节);

5)可用作系统存储器并且被分配系统地址空间的所有或一部分;以及

6)能够通过总线利用事务协议(支持事务标识符(ID)区分不同事务以便那些事务可以无序完成的协议)耦合到处理器,并允许以小至足以支持NVRAM作为系统存储器操作的粒度级(例如,高速缓存行大小,如64或128字节)进行存取。例如,总线可以是存储器总线(例如,诸如DDR3、DDR4等的DDR总线),与正常使用的非事务性协议相反,在该总线上运行事务协议。又如,总线可以是其上通常运行事务协议(本地事务协议)的总线,例如PCI express(PCIE)总线、桌面管理接口(DMI)总线或利用事务协议和足够小的事务有效载荷大小(例如,高速缓存行大小,如64或128字节)的任何其它类型的总线;

7)以下中的一个或多个:

a)比当前的非易失性存储器/存储设备技术(例如,闪存)更快的写入速度;

b)非常高的读取速度(比闪存快且接近或等于DRAM读取速度);

c)可直接写入(而不是像SSD中所使用的闪速存储器那样在写入数据之前需要擦除(以1s覆写));和/或

d)在故障之前更高的写入耐久的数量级(例如,2或3个)(多于在SSD中所使用的引导ROM和闪存)。

如上所述,与必须一次重写和擦除完整“块”的闪速存储器相比,在任何给定实现中存取NVRAM的粒度级可以取决于特定存储器控制器以及与NVRAM耦合的特定存储器总线。例如,在使用NVRAM 130作为系统存储器的一些实现中,尽管固有能力是以字节的粒度进行存取,但是可以以高速缓存行(例如,64字节或128字节高速缓存行)的粒度存取NVRAM,因为高速缓存行是存储器子系统存取存储器的级别。因此,当在存储器子系统中部署NVRAM时,可以以与相同存储器子系统中所使用的DRAM(例如,“附近存储器”)相同的粒度级对它进行存取。即使如此,存储器控制器和存储器总线或其它类型的总线存取NVRAM的粒度级仍小于闪存所使用的块大小以及I/O子系统的控制器和总线的存取大小的粒度级。

NVRAM 130可以用作具有足够短以便对处理器造成较小影响的存取时间要求的指令和数据存储设备。这里,可以先将程序指令和数据从较深的闪速/磁/光大容量存储设备152加载到NVRAM 130中,然后再由处理器执行。此外,如下文所详细地描述,NVRAM 130可以放置在存储器总线上,并且可以与存储器控制器直接通信,而存储器控制器又与处理器直接通信。

NVRAM 130的新存储器技术的存在提供了很多新可能性。尽管下文将以长得多的篇幅进行了论述,但是下文立即快速地强调这些可能性中的一些可能性。

根据一个可能实现,NVRAM 130充当系统存储器中的传统DRAM技术的总体替代或补充。在一个实施例中,NVRAM 130代表引入二级系统存储器(例如,系统存储器是作为DRAM 140和NVRAM中130的一些或全部的组合)。因此,系统存储器可以视作具有附近存储器部分NM 141A和远距离存储器部分FM 142。将明白,在不同实施例中,附近存储器可以用作存储器侧高速缓存(例如,附近存储器高速缓存141B)、便签式存储器和不同于系统存储器的其它角色。在本文所描述的实施例中,NVRAM 130的NM 141A部分只用作系统存储器以便简化论述。

根据一些实施例,NVRAM 130提供NVRAM存储设备,它充当传统大容量存储设备(例如,闪速/磁/光大容量存储设备152)的总体替代或补充。在本申请中,术语“传统大容量存储设备”是指基于光、磁和/或闪存技术的大容量存储设备,例如盘和闪速存储器。为了简化论述,闪速/磁/光大容量存储设备152又称为传统大容量存储设备152。因此,可以利用NVRAM、闪速存储器、磁存储设备或其任何组合来实现计算系统100的非易失性大容量存储设备。在NVRAM存储设备150充当传统大容量存储设备152的总体替代的实施例中,对于可块寻址的存储设备存取无需使用存储设备驱动器。从存储设备存取中去除存储设备驱动器开销可以增大存取速度并节省功率。在期望NVRAM存储设备150对于OS和/或应用看起来像是可块存取且与传统大容量存储设备152不可区分的备选实施例中,可以使用仿真的存储设备驱动器来暴露到用于存取NVRAM存储设备150的软件的可块存取的接口(例如,通用串行总线(USB)仅批量传递(BOT)1.0、串行高级技术附件(SATA)3.0等)。在一些实施例中,最低级存储设备驱动器可以使用NVRAM 130的可字节寻址性来移动NVRAM存储设备150的块并仿真可块存取的大容量存储设备,而不会带来I/O接口的成本。稍后将参考图5更加详细地描述利用采用最低级存储设备驱动器NVRAM 130的可字节寻址性的实施例。

根据一些实施例,NVRAM 130提供BIOS NVRAM 160和TPM NVRAM 170,它们充当诸如BIOS闪存162和TPM闪存172的固件存储器的总体替代或补充。固件存储器普遍利用闪存技术来实现,并且普遍存储由处理器执行以便在引导过程期间初始化关键系统组件的初始指令(例如,BIOS)。固件存储器还可以存储由TPM 134使用以便保护敏感系统信息(例如,加密密钥)的系统持久状态。在一个实施例中,对于固件存储器使用NVRAM 130去除了第三方闪存部分存储对于系统操作而言关键的代码和数据的需要。

存储器和存储装置的选择可以取决于在其上使用所述装置的平台的类型。例如,在个人计算机、平板计算机、笔记本计算机、移动装置(例如,智能电话或PDA)中,非易失性大容量存储设备可以单独使用NVRAM存储设备150来实现,或者可以使用NVRAM存储设备150结合闪速/磁存储设备来实现。在其它实现(例如,大规模服务器)中,非易失性大容量存储设备可以使用磁存储设备(例如,硬驱动器)或磁存储设备、闪存和NVRAM存储设备150的任何组合来实现。在这种情形下,负责存储的计算机系统硬件和/或软件可以实现各种智能的持久存储分配技术以便以有效或其它有用的方式在FM 142/NVRAM存储设备150与传统大容量存储设备152之间分配持久程序代码和数据的块。在一些实施例中,NVRAM 130可以变成芯片外(即,处理器芯片外)的单独存储器/存储装置。在一些实施例中,取代芯片外DRAM 140,可以使用DRAM来提供芯片上高速缓存(例如,附近存储器高速缓存141B)。这些实施例可以特别有关于非常小的平台(例如,智能电话或PDA),其中多个存储器类/技术可能受成本抑制,并且可以在芯片上放置更多晶体管(包括存储设备)。

NVRAM 130可以合并“耗损均衡”算法以便解释以下事实:远距离存储器级处的存储单元在太多写入存取之后开始耗损。由于高循环计数块最有可能以这种方式耗损,所以耗损均衡通过将高循环计数块的地址与低循环计数块交换来在远距离存储器单元间扩展写入。注意,大多数的地址交换对于最终用户通常都是透明的,因为它由硬件、软件(例如,低级驱动器或操作系统)或其组合来处理。

在一个实施例中,NVRAM 130可以用非易失性随机存取存储器(NVRAM)来实现,例如PCM、或更具体来说是PCMS(又称为(PRAM或PCRAM))、双向统一存储器(OUM)、(CRAM)。远距离存储器的其它可能的技术选择包括但不限于可字节寻址的持久存储器(BPRAM)、存储级存储器(SCM)、通用存储器、Ge2Sb2Te5、可编程金属化单元(PMC)、电阻型存储器(RRAM)、RESET(非晶)单元、SET(晶态)单元、PCME、Ovshinsky、铁电存储器(又称为聚合物存储器和聚N乙烯咔唑)、铁磁存储器(又称为自旋电子(Spintronics)、SPRAM(自旋转移矩RAM)、STRAM(自旋隧穿RAM)、磁阻、磁存储器和磁随机存取存储器(MRAM))以及半导体-氧化物-氮化物-氧化物-半导体(SONOS,又称为介质存储器)。

为了便于说明,应用的大多数剩余部分有时将把“PCM”或“PCMS”称为NVRAM 130的技术选择。因此,在以下论述中,术语NVRAM、PCM和PCMS可以互换使用。但是,如上文所论述,应当意识到,对于NVRAM 130,还可以使用不同的技术。

然后,继续论述图1的系统,尽管为了简单起见,图1中示出单个处理器110,但是在一些实施例中,计算机系统100的体系结构可以包括多个处理器。处理器110可以是任何类型的数据处理器,包括通用或专用中央处理单元(CPU)、专用集成电路(ASIC)或数字信号处理器(DSP)。例如,处理器110可以是通用处理器,如CoreTM i3、i5、i7、2Duo和Quad、XeonTM或ItaniumTM处理器,所有这些都可自加利福尼亚圣克拉拉的Intel公司获得。或者,处理器110可以来自其它公司,例如加利福尼亚桑尼维尔的ARM控股有限公司、加利福尼亚桑尼维尔的MIPS Technologies等。处理器110可以是专用处理器,例如,诸如网络或通信处理器、压缩引擎、图形处理器、协处理器、嵌入式处理器等。处理器110可以在包含在一个或多个封装内的一个或多个芯片上实现。处理器110可以是一个或多个衬底的一部分,和/或可以在一个或多个衬底上利用例如,诸如BiCMOS、CMOS或NMOS的多种工艺技术中的任一种来实现。

在一个实施例中,处理器110包括集成式图形单元111,它包括用于执行诸如3D或2D图形命令的图形命令的逻辑。在一个实施例中,图形单元111能够执行行业标准图形命令,例如由Open GL和/或Direct X应用编程接口(API)(例如,OpenGL 4.1和Direct X 11)指定的命令,但是本发明的实施例不限于任何特定的集成式图形单元111。

尽管同样为了清楚起见,图1中示出单个核112,但是处理器110也可以包括一个或多个核112。在许多实施例中,核112包括内部功能块,例如一个或多个执行单元、引退单元、通用和特定寄存器集合等。如果核112是多线程或超线程的,那么每个硬件线程也可以视为是“逻辑的”核。在体系结构和/或指令集方面,核112可以是同质或异质的。例如,一些核可以有序,而其它核则无序。又如,核中的两个或两个以上可能能够执行相同指令集,而其它核只能够执行该指令集的子集或执行不同的指令集。

处理器110还可以包括一个或多个高速缓存,例如可以作为SRAM和/或DRAM实现的高速缓存113。在未示出的许多实施例中,实现不同于高速缓存113的额外高速缓存,以使得在核112中的执行单元与存储器装置141A和142之间存在多个高速缓存级。例如,共享型高速缓存单元的集合可以包括:诸如1级(L1)高速缓存的上级高速缓存,诸如2级(L2)、3级(L3)、4级(L4)或其它级高速缓存的中级高速缓存,最后级高速缓存(LLC),和/或其不同组合。在不同实施例中,可以按不同方式分派高速缓存113,并且在不同实施例中,高速缓存113可以是许多不同大小之一。例如,高速缓存113可以是8兆字节(MB)高速缓存、16MB高速缓存等。另外,在不同实施例中,高速缓存可以是直接映射的高速缓存、全关联高速缓存、多向集合关联高速缓存或具有另一类型的映射的高速缓存。在包括多个核的其它实施例中,高速缓存113可以包括在所有核中共享的一个大部分,或者可以划分为若干个功能独立的片段(例如,每个核一个片段)。高速缓存113还可以包括在所有核中共享的一个部分以及作为每个核的功能独立片段的若干个其它部分。在一个实施例中,高速缓存113可以包括DRAM附近存储器高速缓存141B。

处理器110还可以包括归属代理114,它包括协调和操作核112的那些组件。例如,归属代理单元114可以包括功率控制单元(PCU)和显示单元。PCU可以是或者可以包括用于调节核112和集成式图形单元111的功率状态所需的逻辑和组件。显示单元用于驱动一个或多个外部连接的显示器。

在一些实施例中,处理器110包括集成式存储器控制器(IMC)131,以便提供用于与存储器和存储设备子系统180通信的接口。更具体来说,在一个实施例中,IMC 131包含用于对DRAM装置140进行读取、写入和刷新所必需的逻辑。IMC 131可以在与处理器110相同的芯片上,或者在连接到处理器110的独立芯片和/或封装上。

在一些实施例中,处理器110包括耦合到IMC 131的I/O子系统115。I/O子系统115使得能够在处理器110与以下串行或并行I/O装置之间通信:一个或多个网络136(例如,局域网、广域网或互联网),存储I/O装置(例如,传统大容量存储设备152、BIOS闪存162、TPM闪存172),以及一个或多个非存储I/O装置137(例如,显示器、键盘、扬声器等)。I/O子系统115可以包括平台控制器集线器(PCH)(未示出),PCH进一步包括用于提供对存储和非存储I/O装置和网络的存取的若干个I/O适配器138和其它I/O电路。为了实现此,I/O子系统115对于所使用的每个I/O协议可以具有至少一个集成式I/O适配器138。I/O子系统115可以在与处理器110相同的芯片上,或者在连接到处理器110的独立芯片和/或封装上。

I/O适配器138将处理器110内所使用的主机通信协议转译为与特定I/O装置兼容的协议。对于传统大容量存储设备152,I/O适配器138可以转译的协议中的一些协议包括外围组件互连(PCI)-Express 3.0、通用串行总线(USB)3.0、串行高级技术附件(SATA)3.0、小型计算机系统接口(SCSI)、廉价盘冗余阵列(RAID)和1394“火线”等。对于BIOS闪存162,I/O适配器138可以转译的协议中的一些协议包括串行外围接口(SPI)、微线等。另外,可以有一个或多个无线协议I/O适配器。无线协议的实例是蓝牙4.0、基于IEEE 802.11的无线协议和蜂窝协议等。

在一些实施例中,I/O子系统115还包括管理引擎(ME)135,它是允许系统管理员监测、维护、更新、升级和修理计算机系统100的微处理器。在一个实施例中,系统管理员可以通过ME 135经由网络136远程配置计算机系统100。在一个实施例中,配置可以存储在处理器110内的解码表133中。IMC 131和I/O子系统115可以读取解码表133,然后决定应当将数据存取请求引导到哪里。

在一些实施例中,处理器110包括可信平台模块(TPM)134,它用于控制对系统持久状态(例如,安全数据、加密密钥、平台配置信息等)的存取。在一个实施例中,这些系统持久状态存储在可以用诸如PCMS的基于PCM的存储器实现的TPM NVRAM 170中。在如图1所示的实施例中,TPM NVRAM 170是NVRAM 130的一部分。

在一个实施例中,TPM 134是具有密码功能性的安全微控制器。TPM 134具有多个信任相关的能力,例如用于确保受到TPM保护的数据只对于相同TPM可用的“密封”能力。TPM 134可以利用它的加密能力来保护数据和密钥(例如,秘密)。在一个实施例中,TPM 134具有唯一和秘密的RSA密钥(它基于由Ron Rivest,Adi Shamir和Leonard Adleman开发的RSA算法生成),这允许它认证硬件装置和平台。例如,TPM 134可以验证寻求对存储在计算机系统100中的数据的存取的系统是预期系统。TPM 134还能够报告平台(例如,计算机系统100)的完整性。这允许外部资源(例如,网络上的服务器)确定平台的可信赖性,而不会妨碍用户存取平台。

应理解,计算机系统可以利用NVRAM 130用于系统存储器、大容量存储设备、固件存储器和/或其它存储器和存储设备目的,即使它的处理器不具有处理器110的上述所有组件或者具有比处理器110更多的组件。

在一个实施例中,计算机系统100包括用于控制对NVRAM 130的数据存取的NVRAM控制器132。NVRAM控制器132耦合到IMC 131和I/O子系统115。NVRAM控制器132可以从解码表133读取配置数据,或者备选地,可以依赖于从IMC 131和I/O子系统115传递的解码结果。在利用PCMS实现NVRAM 130的实施例中,NVRAM控制器132是利用与PCMS技术一致的协议执行字节级存取的PCMS控制器。尽管IMC 131和NVRAM控制器132可以是两个离散控制器(如图1所示,其中虚线隔开这两个控制器),但是在一些实施例中,这两个控制器可以作为一个组合控制器来实现以便控制对存储器和存储设备的存取。

在图1中,将NVRAM控制器132示为利用三条独立的线连接到FM 142、NVRAM大容量存储设备150和BIOS NVRAM 160。但是,这不一定意味着,有三条独立的物理总线或通信信道将NVRAM控制器132连接到NVRAM 130的这些部分。而是,在一些实施例中,使用共同的存储器总线或其它类型的总线来在通信上将NVRAM控制器132耦合到FM 142、NVRAM大容量存储设备150和BIOS NVRAM 160。例如,在一个实施例中,图1中的这三条线代表DDR总线,例如存储器总线(例如,DDR3、DDR4等),通过该总线,NVRAM控制器132实现事务协议以便与NVRAM 130通信。NVRAM控制器132还可以通过支持本地事务协议的总线与NVRAM 130通信,所述总线例如PCI express(PCI-E)总线、桌面管理接口(DMI)总线或利用事务协议的任何其它类型的总线。

图2是示出根据本发明一个实施例的计算机系统200的框图,计算机系统200使用NVRAM 130作为传统大容量存储设备152和固件存储器(例如,BIOS闪存162和TPM闪存172)的总替代。计算机系统200包括耦合到存储器和存储设备子系统280的处理器210。在该实施例中,存储器和存储设备子系统280只包括DRAM装置140和NVRAM 130。如上所述,NVRAM 130具有包括系统存储器(FM 142)、大容量存储设备(NVRAM存储设备150)和固件存储器(BIOS NVRAM 160和TPM NVRAM 170)的可配置分区。处理器210可以与图1的处理器110相同,除了I/O适配器238不一定包括用于存取传统大容量存储设备和闪速存储器的图1的适配器138的全部。在这样的情况下,负责存储器和存储设备存取的计算机系统硬件和/或软件可以实现各种智能技术以便得益于NVRAM 130的低等待时间、高吞吐量和鲁棒性(与诸如传统大容量存储设备152、BIOS NVRAM 162和TPM NVRAM 172的传统闪速/磁存储设备相比)。

NVRAM的可配置分区

如之前描述的,NVRAM 130可以分为在平台存储层级中具有不同作用的多个分区。如上文所论述,术语“平台存储层级”是指服务于不同目的的高速缓存、系统存储器、大容量存储设备和固件存储器(例如,BIOS存储设备和TPM存储设备)。在一个实施例中,将存取导向NVRAM 130的不同分区的手段是经由解码逻辑。例如,在制造时或者在现场,计算机系统100可以将解码表133编程为将NVRAM 130的不同区域标记为系统存储器、大容量存储设备、固件等。

在图1和图2的实施例中,将NVRAM 130分区为FM 142、NVRAM存储设备150、BIOS NVRAM 160和TPM NVRAM 170。可以在解码表133中定义每个分区的地址范围。在一个实施例中,当IMC 131接收存取请求时,将请求的目标地址解码以便揭露将请求引导向存储器还是I/O。如果它是存储器请求,那么IMC 131从目标地址进一步确定将请求引导向NM 141A还是FM 142。对于FM 142存取,IMC 131将请求转发给NVRAM控制器132。如果该请求指向I/O(例如,非存储和存储I/O装置),那么IMC 131将请求传递给I/O子系统115。I/O子系统115进一步将地址解码以便确定地址是指向NVRAM存储设备150、BIOS NVRAM 162还是其它非存储和存储I/O装置。如果该地址指向NVRAM存储设备150或BIOS NVRAM 162,那么I/O子系统115将请求转发给NVRAM控制器132。如果该地址指向TPM NVRAM 170,那么I/O子系统115将请求传递给TPM 134以便执行安全存取。在一个实施例中,转发给NVRAM控制器132的每个请求伴随有指示存取类型的属性(又称为“事务类型”)。在一个实施例中,NVRAM控制器132可以仿真所请求的存取类型的存取协议,以使得平台的剩余部分保持不知道平台存储层级中的NVRAM 130所执行的多个作用。在备选实施例中,NVRAM控制器132可以执行对NVRAM 130的存储器存取,而不管它是哪个事务类型。理解的是,解码路径可以不同于上文所描述的解码路径。例如,IMC 131可以解码存取请求的目标地址,并确定它是否指向NVRAM 130。如果它指向NVRAM 130,那么IMC 131根据解码表133生成属性。然后,基于所述属性,IMC 131将请求转发给合适的下游逻辑(例如,NVRAM控制器132和I/O子系统115)以便执行所请求的数据存取。在又一实施例中,如果没有从上游逻辑(例如,IMC 131和I/O子系统115)传递对应属性,那么NVRAM控制器132可以解码目标地址。可以实现其它解码路径。

图3示出根据本发明一个实施例的解码逻辑330,它将输入地址解码并生成指示NVRAM分区之一的输出。在一个实施例中,输入地址是指向NVRAM 130内的位置(例如,字节位置)的物理地址。在一个实施例中,可以通过转译逻辑320从系统地址(例如,由核113生成的地址)转译物理地址。解码逻辑330的输出指示输入地址所指向的NVRAM 130的分区。在一个实施例中,输出通过其对应属性指示NVRAM分区;例如,00指示FM 142,01指示NVRAM存储设备150,10指示BIOS NVRAM 160,而11指示TPM NVRAM 170。理解的是,属性可以由任何数字或模拟指示符表示,并且不受本文所描述和示出的实例的限制。此外,解码逻辑330可以将输入地址映射到比图3中示出的实施例更多或更少的分区。例如,如果将NVRAM 130配置成(根据解码表133)只包含两个分区,那么解码逻辑330可以将输入地址映射到这两个分区。

在一个实施例中,解码逻辑330基于存储在解码表133中的配置数据来解码输入地址。在一个实施例中,解码表133存储NVRAM 130中的每个分区的属性311、基地址312和长度313。解码表133可以由BIOS在引导时间构建。例如,BIOS可以在引导时间读取存储在控制状态寄存器(CSR)310中的配置数据。CSR 310可以包括将在NVRAM 130中配置的每个分区的范围(例如,大小)。然后,BIOS相应地构建解码表133。

应注意,解码逻辑330是在平台(例如,图1的计算机系统100或图2的计算机系统200)内执行的解码操作的逻辑表示。实现解码逻辑330的硬件可以驻留在单个功能单元(例如,IMC 131)或多个功能单元(例如,IMC 131、I/O子系统115和/或NVRAM控制器132的任何组合)中。类似地,转译逻辑320可以由单个功能单元(例如,IMC 131)、由多个功能单元(例如,IMC 131、I/O子系统115和/或NVRAM控制器132的任何组合)或由软件和硬件的组合来实现。解码逻辑330和/或转译逻辑320也可以驻留在IMC 131、I/O子系统115和NVRAM控制器132的外部并耦合到它们。为了简单图示,图1和图2的实施例示出,IMC 131、I/O子系统115和NVRAM控制器132中的每个都具有到解码表133的连接以指示它们所有都可以从解码表133读取以便执行解码逻辑330的功能的可能性。但是,应理解,在备选实施例中,只有IMC 131、或IMC 131和I/O子系统115连接到解码表133以执行解码逻辑330的功能。

在一个实施例中,CSR 310可以由硬件熔丝(例如,只可一次编程的可编程只读存储器(PROM))、可再编程ROM(例如,电可擦除可编程ROM(EEPROM))或其它可编程硬件实现。在解码表133可再编程的实施例中,解码表133中的那些地址范围可以如图4的实施例中所描述的通过授权服务器来远程编程。

图4是示出根据本发明一个实施例在NVRAM内配置分区的方法400的流程图。为了简单论述,将参考图1的实施例来描述图4的流程图的操作。但是,应了解,流程图的操作可以由图2的实施例以及与这些图中示出的实施例不同的实施例来执行。另外,参考图1和图2论述的实施例可以执行与参考图4的流程图论述的操作不同的操作。

参考图1和图4,在一个实施例中,计算机系统100经由网络连接从授权服务器请求配置数据用于对NVRAM 130配置分区(方框410)。授权服务器可以由计算机系统100的制造商、第三方权威机构或拥有配置NVRAM 130的权利的任何权威机构控制或拥有。经由网络连接,计算机系统100(例如,ME 135)可以将它的证书(例如安全地存储在TPM NVRAM 170中的加密密钥)发送给授权服务器(方框420)。在授权服务器认证计算机系统100之后,它发送回包括所请求的配置数据的签名消息(方框430)。一旦接收到签名消息,MC 135便可以根据所接收的地址范围设置CSR 310(方框440),以便可以在引导时间对解码表133进行编程。然后,计算机系统100重新引导(方框450)。在引导时间期间,计算机系统100的BIOS对解码表133进行编程(方框460)。BIOS还将配置传给OS;例如,BIOS可以构建包含供OS读取的配置数据的多个表(方框470)。

在计算机系统100完全引导之后,并且一旦接收到具有NVRAM物理地址的数据存取请求,解码逻辑330便基于解码表133中的配置数据来解码请求中所指示的地址(方框480)。解码逻辑330生成指示NVRAM 130中的分区之一的属性(方框490)。基于该属性,解码逻辑330将请求转发给合适的下游逻辑(例如,I/O适配器138、TPM 134等)(方框495)。可以与请求一起转发指示NVRAM分区的属性的事务类型。在一个实施例中,下游逻辑可以基于属性确定用于存取分区的合适协议。

在一个实施例中,在方框470创建的这些表之一是亲和表,它存储每个基本存储器装置的逻辑距离。亲和表允许内核级OS代码区分利用不同技术实现的系统存储器的不同分区,例如DRAM(NM 141A)和NVRAM(FM 142),以及相应地划拨OS页面迁移策略。例如,NM 141A可用于频繁存取的数据以便在计算机系统100的常规操作过程中吸收一些写入。

在一个实施例中,亲和表包括存储器地址的范围的逻辑距离,其中逻辑距离指示实际物理距离、域、存取速度/时间或代表本地存储器的存取时间或距离的任何其它度量。基于亲和表中的信息,OS可以将存储器存取引导至不同的存储器位置。例如,OS可以基于本地存储器的逻辑距离对操作做出线程调度决定和资源分配。可以使用诸如操作的时间关键性的众多考量来确定利用哪个本地存储器。例如,可以调度时间极其关键的操作以利用DRAM(NM 141A),因为它在亲和表中由比FM 141A短的逻辑距离所表示。在备选中,将在背景中运行的线程不是时间密集型的,可以被调度以便使用FM 141A,从而确保NM 142可用于其它操作。在确定利用哪个本地存储器时可以使用其它考量,例如本地存储器的大小、即将运行或执行的线程或操作的类型、或用于基于存取距离或速度选择存储器的任何其它已知的考量。

去除存储设备存取中的存储设备驱动器开销

如上所述,NVRAM 130是非易失性且可随机存取的。它可以以字节的粒度进行存取,并且它的存取等待时间接近于当今的易失性RAM。由于这种非易失性存储器提供更接近传统存储介质的高容量,所以它可以替代平台中的传统的I/O附连的非易失性大容量存储装置。

如图2所示,对于系统存储器(例如,FM 142)和NVRAM存储设备150使用NVRAM 130可以模糊平台存储层级中的这两个不同阶层的作用之间的界线。因为FM 142和NVRAM存储设备150驻留在相同的NVRAM 130中,所以它们可以视为是一个连续分区,并且可以经由相同的存储器互连以相同的方式存取。因此,使用NVRAM存储设备150可以去除传统I/O数据存取的负担。即,诸如SATA、PCI-E等的I/O协议不再是存储设备存取所必需的。因此,在一些实施例中,可以在无需执行I/O操作的存储设备驱动器的情况下,而是通过使用CPU存储器指令以便从存储设备复制到存储器缓冲器,来对NVRAM存储设备150进行存取,从而仿真OS和应用软件的块存取。备选地,OS文件系统可以知道存储器可寻址存储设备(即,NVRAM存储设备150),并将NVRAM存储设备150地址空间直接映射到应用地址空间。这节省了复制的成本以及系统中所使用的存储器的量。NVRAM存储设备150在本文中称为“存储器可寻址”,因为它在物理存储器地址空间中可直接寻址,并且使用存储器地址作为操作数的所有指令都将用NVRAM存储设备150的地址工作。

但是,遗留软件(例如,OS和应用)仍可以在以下假设的基础上操作:存储设备驱动器在计算机系统中存在以便执行块存取。例如,典型的传统操作系统将位于大容量存储设备中而不是位于系统存储器中的数据视为是非驻留数据,并且当存取该数据时将触发页面故障。然后,页面故障处理程序发信号通知存储设备驱动器以便将数据带入到系统存储器中。这可以在存储设备驱动器中通过仿真块存储来处理。备选地,在文件系统知道存储器可寻址存储设备的OS中,页面故障处理可以是存储器映射操作而不是存储器复制或I/O操作。

由于功率节省和存储设备存取速度的增加,去除I/O接口和I/O控制器、以及减小存取成本的益处一般胜过软件修改的成本。本发明的实施例使用PCMS作为平台中的高性能存储设备,从而利用其低功率、高容量、非易失性和存储器模式的性质。本发明的实施例去除了传统存储堆栈I/O路径,并使得存储设备可以由处理器寻址和缓存以便以最低功率实现最快性能。

本发明的实施例以多个级别提供软件和存储设备(由诸如PCMS的NVRAM实现)之间的接口,这将在下文参考图5、7、8A、8B和9加以描述。这些图中示出的软件(例如,OS和应用)和硬件操作可以由图1和图2的处理器110和210的实施例以及与这些图中示出的实施例不同的实施例来执行。另外,参考图1和图2论述的实施例可以执行与参考图5、7、8A、8B和9的图论述的操作不同的操作。

图5示出根据本发明第一实施例在软件和由图2的NVRAM 130提供的存储设备之间的接口。在该实施例中,IMC 131具有将NVRAM 130抽象为软件的传统非易失性大容量存储设备(例如,盘或闪速存储器)的额外能力。IMC 131耦合到可以用软件实现的存储设备驱动器513。对于存储设备驱动器513,IMC 131用作可块寻址的传统非易失性大容量存储设备。计算机系统200使用该存储设备驱动器513作为最低级盘驱动器。在该实施例中,软件(OS 512和应用)可以利用NVRAM 130中的数据,而不必对软件进行修改。即,对非驻留页面(不在系统存储器中的页面)的数据存取将触发页面故障,并且将执行盘I/O。

在如图5所示的实施例中,当OS 512发起存储I/O时(例如,响应于带入不是驻留在诸如NM 141A和FM 142的系统存储器中的页面的页面故障),它调用存储设备驱动器513并提供存储器地址、存储设备地址、长度和操作类型(例如,读取或写入)(方框510)。存储设备驱动器513利用不同于标准I/O接口/协议的接口(例如,SATA 3.0、PCI-E 3.0等)将这些参数传送到IMC 131(方框520)。存储器地址指示用于与由存储设备地址指定的存储设备位置交换页面的存储器位置(在NM 141A或FM 142中)。IMC 131将存储设备地址转译为NVRAM 130中的物理地址(方框530)。然后,NVRAM控制器132(或者如果IMC 131实现用于存取NVRAM 130的协议,则为IMC 131)将来自存储器地址的数据复制到存储设备地址(如果操作是读取的话),或者将来自存储设备地址的数据复制到存储器地址(如果操作是写入的话)(方框540)。

在一个实施例中,存储器地址落在FM 142的地址空间内。在该实施例中,IMC 131还将存储器地址转译为NVRAM 130中的物理地址。然后,NVRAM控制器132(或者如果IMC 131可以直接存取NVRAM 130,则为IMC 131)通过在相同NVRAM内执行存储器到存储器复制来在存储器地址和存储设备地址之间复制数据。在存储器地址落在NM 141A的地址空间内的另一个实施例中,复制涉及两个存储器装置(例如,NVRAM 130和DRAM 140)之间的存储器到存储器复制。在复制完成之后,IMC 131发信号通知存储设备驱动器513(方框550),存储设备驱动器513又发信号通知OS 512以指示I/O完成。

图6A示出根据本发明一个备选实施例的存储器和存储设备子系统680。在该实施例中,存储器和存储设备子系统680利用由OS创建的RAM盘650来取代NVRAM存储设备150(图2)。RAM盘650用作文件系统660的存储设备。下文将关于图7的流程图进一步详细地描述使用RAM盘650作为存储设备。NVRAM 130可以包括比图6A中示出的分区更多或更少的分区(例如,BIOS NVRAM 162和/或TPM NVRAM 172可以缺少)。在一个实施例中,在OS安装过程中配置和格式化RAM盘650,并且RAM盘650在系统引导间一直存留(就像常规盘)。

图7示出根据本发明第二实施例在软件和由NVRAM 130提供的存储设备之间的接口。该第二实施例是指图6A的存储器和存储设备子系统680,其中“存储设备”是FM 142内由OS 712标为RAM盘650(又称为“RAMDisk”)的分区。OS 712将RAM盘650作为传统非易失性大容量存储装置(例如,盘或固态驱动器)对待。对RAM盘650的存取由内核级驱动器控制,内核级驱动器称为RAM盘驱动器713,它将标准盘驱动呈现给OS 712并用作最低级盘驱动器。在该实施例中,软件(OS 712和应用)可以利用NVRAM 130中的数据,而无需对软件进行修改。即,对非驻留页面(不在系统存储器中的页面)的数据存取将触发页面故障,并且将执行盘I/O。

在如图7所示的实施例中,当OS 712发起盘I/O时(例如,响应于进入不是驻留在诸如图6A的NM 141A和FM 142的系统存储器中的页面的页面故障),它调用RAM盘驱动器713并提供存储器地址、存储设备地址、长度和操作类型(例如,读取或写入)(方框710)。存储器地址指示用于与由存储设备地址指定的存储设备位置交换页面的存储器位置(在NM 141A或FM 142中)。IMC 131将存储设备地址转译为NVRAM 130中的物理地址(方框720)。然后,NVRAM控制器132(或者如果IMC 131实现用于存取NVRAM 130的协议,则为IMC 131)将来自存储器地址的数据复制到存储设备地址(如果操作是读取的话),或者将来自存储设备地址的数据复制到存储器地址(如果操作是写入的话)(方框730)。

在一个实施例中,存储器地址落在FM 142的地址空间内。在该实施例中,RAM盘驱动器713还将存储器地址转译为NVRAM 130中的物理地址。然后,NVRAM控制器132(或者如果IMC 131可以直接存取NVRAM 130,则为IMC 131)通过在相同NVRAM装置内执行存储器到存储器复制来在存储器地址和存储设备地址之间复制数据。在存储器地址落在NM 141A(它充当系统存储器)的地址空间内的另一个实施例中,复制涉及两个存储器装置(例如,NVRAM 130和DRAM 140)之间的存储器到存储器复制。在复制完成之后,IMC 131发信号通知RAM盘驱动器713(方框740),RAM盘驱动器713又发信号通知OS 712以指示I/O完成。

图8A和图8B示出根据本发明一个实施例在软件和由参考图6B的NVRAM 130提供的存储设备之间的接口的第三实施例。图6B示出根据本发明一个实施例的存储器和存储设备子系统682。在如图6B所示的实施例中,在NVRAM 130内没有区分大容量存储设备与系统存储器。OS(图8B的OS 850)创建存储器映射的文件系统,其中FM 142用作文件系统660的存储设备。应了解,NVRAM 130可以包括比图6B中示出的分区更多或更少的分区(例如,BIOS NVRAM 162和/或TPM NVRAM 172可以缺少)。

在存储器映射的文件系统中,应用810所使用(并且因此在分配给应用810的虚拟地址空间820中)的文件可以直接映射到NVRAM装置地址空间840。NVRAM装置地址空间840中的每个地址位置可以由处理器直接寻址,并且因此“驻留”在存储器中。无需触发带入来自存储设备的页面的页面故障,因为OS 850了解存储设备与存储器相同。在该实施例中,OS 850需要进行修改以便利用NVRAM 130,但是应用810可以在不进行修改的情况下使用。相比之下,在非存储器映射的文件系统中,应用的每次读取/写入都是系统调用。如果读取/写入指向已经不在存储器中的页面,那么对该页面的存取将涉及由存储设备驱动器执行的存储I/O存取,这比存储器存取慢得多。

图8B以进一步的细节示出图8A的实施例。参考图8A和图8B,当应用810请求对文件的页面821进行读取存取时(方框860),OS 850将请求传递给存储器存取硬件,因为页面821已经作为页面841映射在存储器中(方框870)。存储器存取硬件(例如,IMC 131或IMC 131和NVRAM控制器132的组合)从NVRAM 130检索页面841,并将页面转发给高速缓存830(例如,SRAM或DRAM高速缓存)以便减少未来存取等待时间(方框880)。然后,存储器存取硬件发信号通知OS 850,而OS 850又发信号通知应用810取出已经完成。如果尚未取出页面,那么可以采用与读取相同的方式执行对页面的写入存取。另外,当应用810修改已经取出的页面821时,可以执行写时复制以便在虚拟地址空间820中创建页面821的写入复本822。该写入复本可以存储在高速缓存830中以用于未来存取,并且可以在稍后的时间写回到NVRAM 130(例如,当高速缓存830已满并且需要腾出空间给新取出的页面时)。

图9示出根据本发明第四实施例在软件和由NVRAM 130提供的存储设备之间的接口。该第二实施例是指图6B的存储器和存储设备子系统682,其中OS和应用(例如,应用910)均需要修改以便利用NVRAM 130。存储设备的概念在该实施例中消失。在该实施例中,应用910可以利用存储器存取指令来管理NVRAM装置地址空间930。例如,应用910可以调用OS应用编程接口(API)920的集合以便执行memory_allocation、memory_deallocation、memory_read、memory_write等的等效指令。这些指令中的每个指令可以指向NVRAM 130中的特定地址位置。因此,应用910拥有管理写入到NVRAM 130的数据的持久性和最佳写入管理的责任。

图4、5、7、8A、8B和9的图中示出的技术可以利用存储在非暂时性机器可读或计算机可读介质上的指令和数据来实现,非暂时性机器可读或计算机可读介质例如非暂时性机器可读或计算机可读存储介质(例如,磁盘、光盘、随机存取存储器、只读存储器、闪速存储器装置和相变存储器)。

本发明的实施例还可以作为计算机程序产品来提供,计算机程序产品可以包括其上存储有指令的非暂时性机器可读介质,这些指令可用于对计算机(或其它电子装置)进行编程以便执行过程。非暂时性机器可读介质可以包括但不限于软盘、光盘、CD-ROM和磁光盘、ROM、RAM、EPROM、EEPROM、磁或光卡、传播介质或适于存储电子指令的其它类型的介质/机器可读介质。本发明的实施例还可以作为计算机程序产品下载,其中可以通过在载波或其它传播介质中实施的数据信号经由通信链路(例如,调制解调器或网络连接)将程序从远程计算机(例如,服务器)传送到请求计算机(例如,客户端)。

尽管就若干个实施例描述了本发明,但是本领域技术人员将意识到,本发明不限于所描述的实施例,并且可以利用在随附权利要求的精神和范围内的修改和改变来实践。因此,本描述视为是说明性而不是限制性的。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1