辅助式一致共享存储器的制造方法

文档序号:8430689阅读:329来源:国知局
辅助式一致共享存储器的制造方法
【技术领域】
[0001]本公开总体上涉及多节点系统。更具体地,本公开涉及在多节点系统内共享存储器。
【背景技术】
[0002]多节点系统可包括多个节点。系统的类型包括但不限于网络、机架服务器系统、刀片服务器等等。在某些情况下,每个节点可以是跨在节点内的处理或输入/输出(I/o)设备之间具有硬件高速缓存一致性的一个或多个机架的大部分的大型对称多处理(SMP)节点。高速缓存一致性的结果是,大型SMP系统能够应用足够的计算资源来解决计算设备之间的细粒度负载均衡问题,同时具有大型存储器印迹来存储可通过存储器加载和存储语义由任何计算设备直接访问的应用数据。该系统还可以是松耦合(LC)系统,由多个较小的SMP系统组成,其中,节点能够在粗糙粒度水平上协调任务。
【附图说明】
[0003]通过参照包含所公开的主题的许多目标和特征的特定示例的附图可更好地理解以下详细描述。
[0004]图1是多节点系统模型的框图;
[0005]图2是部分一致系统的示图;
[0006]图3是全局存储器映射的示图;
[0007]图4是用于跨多个集群的一致共享存储器的过程流程图;以及
[0008]图5是可访问汇集存储器资源的节点500的框图。
[0009]贯穿本公开和附图使用相同的编号来引用相同的组件和特征。100系列中的编号指代最初在图1中发现的特征;200系列中的编号指代最初在图2中发现的特征,以此类推。
【具体实施方式】
[0010]SMP系统包括单个故障域,其中,系统的任何组件或软件的故障致使整个系统失效。例如,如果SMP节点失效,包括该SMP节点的整个系统失效。相反,LC系统将包含通过独立故障域的任何组件或软件的失效。因此,LC系统中受影响的服务器或组件可崩溃,但是其他服务器或组件将继续操作,就像失效从未发生似的。然而,LC系统中的存储器不通过加载/存储语义共享。而是,通过I/O驱动器发送消息以便完成LC系统中的存储器共享。当与SMP系统相比较时,由于与I/O驱动器相关联的更高延迟,使用I/O驱动器来实现存储器共享会降低LC系统的性能。
[0011]在此描述的实施例涉及跨多个集群的一致共享存储器。在实施例中,结构存储器控制器耦合到一个或多个节点。结构存储器控制器使用加载存储语义管理对每个节点内的存储器模块的访问。每个节点上的存储器模块可被包括在每个节点的共享存储器区域内。即便当节点已经失效时,共享存储器区域是可访问的。而且,结构存储器控制器管理全局存储器并且多个节点的每个共享存储器区域可被结构存储器控制器映射到全局存储器。结果,提供了可高速缓存的全局存储器。可高速缓存的全局存储器能够跨多个节点和集群递送数据一致性,同时维护每个节点或集群的独立故障域。进一步地,使用加载-存储语义可作为本地存储器访问和高速缓存全局存储器,同时每个集群维护其单独的故障域。附加地,共享存储器能够提供可靠性、可用性、以及可服务性(RAS)功能,包括全部独立盘冗余阵列(RAID)方案。本技术还可与任何高密度机架规模架构(RSA) —起使用。
[0012]在实施例中,每个节点包括一个或多个处理设备(例如,CPU)、可高速缓存的以及不可高速缓存的和易失性的以及非易失性的存储器、以及运行一个B1S映像以及一个操作系统/虚拟机监控器映像的一个或多个I/O设备。以此方式,每个节点是所包含的故障域。节点中的任何硬件组件的或在节点上运行的软件的任何失效在最坏情况下仅击倒该节点。
[0013]在以下说明书和权利要求书中,可使用术语“耦合”和“连接”及其衍生词。应当理解的是这些术语不旨在作为彼此的同义词。相反,在具体实施例中,“连接”可用于指示两个或更多个元件彼此直接物理或电接触。“耦合”可意指两个或更多个元件直接物理或电接触。然而,“耦合”还可意指两个或更多个元件不彼此直接接触,但是仍可彼此合作或交互。然而,术语“松耦合”是指具有独立故障域的系统。结果,术语“耦合”的使用不改变或修改被称为松耦合的系统。
[0014]某些实施例可在一个硬件、固件、和软件或其组合中实现。某些实施例还可被实现为存储在机器可读介质上的指令,这些指令可由计算平台读取并执行以便执行在此描述的操作。机器可读介质可包括用于存储或传输机器(例如,计算机)可读形式的信息的任何机制。例如,机器可读介质可包括只读存储器(ROM)、随机存取存储器(RAM)、磁盘存储介质、光学存储介质、闪存设备等等。
[0015]实施例是实现方式或示例。贯穿本说明书对“实施例”、“一个实施例”、“某些实施例”、“各实施例”、或“其他实施例”的参考是指在此结合这些实施例所描述的特定特征、结构或特性包括在本发明的至少某些实施例但无需全部实施例中。“实施例”、“一个实施例”、或“某些实施例”的各种出现并非必须全部指代相同的实施例。实施例的元素或方面可与另一个实施例的元素或方面组合。
[0016]不是所有在此描述和示出的组件、特征、结构、特性等等需要被包括在一个或多个特定实施例。如果说明书陈述组件、特征、结构、或特性“可”、“可能”、“能够”或“可以”被包括,例如不要求包括该特定特征、结构、或特性。如果说明书或权利要求书参考“一”、“一个”元件,这不意味着仅存在一个这种元件。如果说明书或权利要求书参考“附加”元件,这不排除存在多于一个这种附加元件。
[0017]注意,尽管已经参照具体实现方式描述了某些实施例,其他实现方式根据某些实施例是可能的。附加地,在附图中示出和/或在此描述的电路元件或其他特征的安排和/或顺序无需以所示出和描述的特定方式安排。许多其他安排根据某些实施例是可能的。
[0018]在附图中示出的每个系统中,在某些情况下,元素可各自具有相同的参考标号或不同的参考标号,以便指示所表示的元素可不同和/或类似。然而,元素可足够灵活以便具有不同的实现方式并且与在此示出或描述的某些或所有系统一起工作。在附图中示出的各个元素可相同或不同。将哪一个称为第一元素以及将哪一个称为第二元素是任意的。
[0019]图1是多节点系统模型的框图100。多节点系统模型包括部分一致系统102、SMP系统104、以及LC系统106。尽管在每个系统中示出了若干服务器,每个系统可被认为是一个服务器。在SMP系统104中,每个节点108连接到节点控制器(NC) 110。NC 110能够使得每个节点108连接到扩展互连112。扩展互连112可用于实现SMP系统104的每个NC 110之间的通信。相应地,SMP系统104是基于节点控制器的,具有共享存储器。SMP系统是完全一致的,并且包括快速分布式锁定管理器。然而,SMP系统104是单个故障域。换言之,任何节点108或节点控制器110内出现的单个故障将致使整个系统失效、崩溃、或以其他方式不可用。
[0020]在LC系统106中,每个节点114连接到网络接口卡(NIC) 116。在某些情况下,NIC 116是能够进行远程直接存储器访问(RDMA)的以太网设备或另一个I/O控制器,诸如InfiniBand主机总线适配器(IB HBA)。NIC 116能够使得每个节点114连接到RDMA互连118。RDMA互连118使得每个NIC 116能够传递消息,以便实现跨LC系统106的存储器共享。相应地,LC系统106包括独立故障域。然而,不在LC系统106中共享存储器。进一步地,难以跨LC系统106均衡负载并且LC系统106具有分布式锁定管理器扩展性。
[0021]部分一致系统102包括多个节点120,每个节点连接到多个增强型节点控制器(eNC)122之一。每个eNC 122将其对应的节点120连接到扩展互连124。部分一致系统102跨具有独立故障域的多节点系统共享存储器。通过使用以下描述的软件辅助,部分一致系统102是部分一致的。附加地,部分一致系统102包括快速分布式锁定管理器。
[0022]图2是部分一致系统102的示图。部分一致系统102包括节点202和节点204。节点202包括结构存储器控制器(FMC) 206,并且节点204包括FMC 208。附加地,节点202包括节点存储器214以及本地存储器218。节点204包括节点存储
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1