可动态构建的计算机系统的制作方法_5

文档序号：8344593阅读：来源：国知局

到不受其他本地节点影响的地址空间，或者它们可以是全局的。这将DirCC、RMA和LCC结合为一个方案。
[0164]参见图32，示出了 64核CPU，分区为八个块以及在核外部控制丽交换机127的丽124。外部的丽124调度将被核125使用的进程。八个核的每个块都包含指令和数据缓存，并通过MM 126指导，即每个块都包括块元信息，块MM存储器用作用于指令和数据缓存、块指导器域处理器和块指导器交换机的虚拟化L2缓存，如前面关于图31描述的；然而，与管理核的CPU内其他的MM 126协调允许核一级的容错。协调在两个层级上进行。图31示出的第一信息KAC 121允许与图39示出的类似的丽126设备之间的通信，这允许通过128总线在丽126之间交换检查点和处理信息。第二丽126设备与丽124通信以进行调度、硬件能力和验证、二进制兼容性和处理效率。例如，MM 124可以选择定义MM 126提供的最优化单个处理和线程的性能的缓存一致性的类型。MM 126设备从MM 124请求数据和指令信息，并可以被偏置为通过总线129从DID存储器(Mem-l-Mem-6)预取信息。
[0165]图32示出的系统的特点在于，核不限制于特定类型或二进制兼容、控制流或数据流。这种异质环境可以在图26中看到，还可以扩展为多异质核CPU。优选地，如图31所示，每个块的L2缓存都通过块指导器域处理器配合块指导器交换机根据块元信息虚拟化为每个块的至少多个分区。此外，该实施例包括一组DID存储器(Mem-l-Mem-6)，通过MM 124虚拟化，MM 124包括与所有块相关的整体元信息、具有对整体元信息访问的整体指导器域处理器(未示出)、提供所有块和一组DID存储器(129)之间通信的整体指导器交换机127以及MM 126和整体指导器交换机(128)之间的通信链路。
[0166]参见图33，示出了被包括在GPU背景中的MM。在该配置中，MM正在服务和虚拟化多个L2缓存，标记为MH2至MH7。在传统的GPU模型中，每个SP/TP阵列都加载有提供可以在进程中运行的预定的一组函数的操作系统。通过纳入MM，GPU不限制为一个操作系统，或者预定的一组函数。每个SP/TP阵列都可以具有独特的操作系统和可以动态改变的函数功能。在异质环境中，MM还可以放置在LI缓存(标记为Tex LI)和TPC进程模块中的TPC之间，将MM系统简化为图32。这种异质环境可以包括例如SP/SPU/TP/GPU和标记令牌系统的组合。将帧缓冲器地址空间放置在MM下连同被纳入的MM的所有其他特点一起提供对帧缓冲器的容错。可以证明，将MM插入到该系统内的不同位置定义系统对故障如何反应，以及其功能的灵活性如何。作为灵活性的示例，MM-CH加倍为相关规则执行器，其规则包括如何作为图10中示出的“线程处理器”工作。
[0167]网格计算
[0168]参见图34、35和36，每张图都示出了将根据该发明的元指导器纳入网格计算系统。前面提到的云系统类型对丽的功能没有限制；此外，使用丽的云系统也可以与非丽云系统交互。如前面描述的，网格系统通常可以分为前端系统和后端系统。MM可以用作前端或后端系统，或者它可以在前端和后端系统两者中工作。图34示出了前端MM系统，具有非丽后立而O
[0169]参见图34，示出了非丽云和丽系统之间的通信过程，该丽系统包括丽130和MM交换机131，指定为节点A。假设从节点A MM系统外部的系统产生的电子信号，称为数据电文发送消息到节点A的I/O端口，例如10-2。数据电文的到达触发节点A的可编程中断定时器(未示出)以通过上面结合图21描述的相同或相似的过程步骤中断MM。例如，通信可以来自web浏览器应用程序。有关如何处理该类型的可用的相关规则集位于存储在节点A的MM-应用程序进程规则集63中。相关规则集之前通过MM 130，例如通过MM-CPU (未示出)存储在相关规则缓存，例如MHb (未示出)中，如结合图21说明的。为了该特定的参与(engagement)，相关规则集信息使得抽象/虚拟化处理器，例如MM_CH(未示出)能够虚拟化计算系统的非MM部分。非MM系统组件的web浏览器服务例程的地址放置在位于存储单元M1-M6中合适的虚拟化存储位置。web浏览器进程通过中断CPU-1或CPU-2开始，例如CPU-2，web浏览器服务例程在CPU-2上开始，遵循MM进程参与规则。
[0170]通信继续，直到web浏览器进程试图开始子进程。节点A MM通过咨询MM进程参与规则确定是否可以开始进程。如果规则集允许处理，那么处理虚拟化，通过开始在预定的进程开始地址的虚拟化子进程继续来自CPU-2的信息。如果MM规则集不允许处理或在请求地址的处理，那么web浏览器处理停止。这可能由应用程序错误引起。可能有几次再次尝试，但如前面描述的，最终父进程，web浏览器应用程序终止，CPU-2可以中断以处理其他任务。执行错误函数，来自上一个检查点(为故障点)的状态信息传输到更持久的位置。该信息可以在CPU-2上调度，并开始、停止和重现从上一个检查点到故障的状态，超越直到父进程终止。从分析这些状态获得的信息将提供有关故障的取证信息。
[0171]如果故障是由软件引起；那么发出报警信号，如有需要并将该软件列入黑名单。如果故障是由硬件故障引起，那么通过任何数量的算法隔离故障的组件，系统使用提供与故障的组件或软件相同功能的其他组件继续正常工作。这些组件和软件不一定要与故障的零件二进制兼容，唯一的要求是它们提供相同的功能。
[0172]MM系统发送到云中的进程与其域中的任何其他进程类似地进行处理，并且该进程可以在云故障的情况下重启。当工作在非MM云环境中时，MM保持对其域和其容错性质的控制。
[0173]参见图35，示出了基于元指导器的云系统。虽然对非MM和MM系统两者作为云网络的一部分没有限制，但所有的系统都是MM系统。MM云系统有几个优势。一个优势是安全性和云身份。节点A是前端节点，并从云请求后端资源。该请求采用用于给后端节点的盘存储资源的广播电文的形式。最少两个节点响应，例如节点B和C。节点E和F用作授权/认证服务器。有对MM架构来说独特的几种场景，以下是示例。
[0174]当节点A广播以获取云内的资源时，授权/认证节点E接收广播，并分配B和C响应以及动态分配标头序列给数据电文流，并在节点A上放置唯一的密钥以进行该进程。这创建了唯一识别密钥和通过算法E排序的信息序列。该密钥和序列信息在私有MM KAC(保持活跃控制器)网络上从节点E发送到节点B、节点C和节点A。由于MM域与DID分离，因此DID中的用户或进程不能影响MM域密钥或序列。类似地，MM域不能改变DID的数据和指令。节点A调度器执行将要通过网络连接发送的序列例程。节点E的KAC与节点A的KAC联系，并通信以期待来自节点B的序列。同时，节点F与节点C联系，并指定用于在节点C和节点A之间发送的序列。这些可以是不同的序列，并可以在标准通信端口上加密发送。因此，在这点上，节点B和C与节点A通信是机密的，超越所有各方之间的证书交换。
[0175]节点A使用两条路径和来自节点E和F的算法进行身份验证。节点A与节点B和C通过独特的序列通信。在处理期间的任何时刻都可以修改序列，可以动态分配IP号码，并交换令牌以进行检验。节点B和C可以通过节点E和F的排队处理确定节点A身份可靠。类似地，节点B和C可以使用节点A进行排队服务器处理。
[0176]使用Raid 5、Raid 6或去除(stripping)的云节点防止一个节点包含可能损害信息的信息。如果节点A正在请求进程，那么这些进程将会被分配到扩展频谱布置中，使得没有一个节点有足够的信息猜出进程或结果。这些都是局部容错系统，如果节点A故障，那么进程和数据可以存储到节点C或D。
[0177]参见图36，示出了使用非元指导器前端的元指导器后端云。该配置的功能与图35示出的系统相同，除了与前端的通信受单一域的限制。这意味着节点A的通信序列和认证信息只通过I/O端口传送。节点A检验云中其他节点身份可靠性的通信限制到一个域和静态I/O端口。丽后端云的通信与图35中的相同，私有网络KAC和1通道的组合确定云中每个节点的排序和身份可靠性。
[0178]节点A的检验通过后端节点之一完成，即节点D请求节点F检验节点A的身份可靠性。节点F的算法检验通信通路和节点A的证书，并将信息序列发送给节点A。算法继续，将检验和信息序列顺序通信给节点D，节点D然后直接与节点A通信。
[0179]相同类型的进程可以在元指导器后端云中使用扩展频谱方法继续。扩展频谱上的序列和韵律由符合规定的丽节点定义，该丽节点将信息中继给计算节点和前端节点。类似地，数据存储由包含有关数据去除和时序的信息的、符合规定的节点定义。该信息由前端节点或符合规定的节点保留，以用于进一步的存储信息通信。
[0180]在全部的情形中，如上面结合图21更全面说明地，元指导器根据预先存储在MM的指导器交换机中相关规则缓存中的相关规则集，保持对它自己的域内的虚拟化和进程调度的控制，并只允许进程从预先批准的地址区域和设备开始。MM可以通过与使用I/O通信的网络分离的私有网络与其他的MM通信。元指导器架构的容错方面允许与上面描述的过程类似地从检查点开始重启进程，或在一系列故障后暂停进程。
[0181]集群计算
[0182]参见图37，如上所述，集群计算可以被配置为并行或分布式存储模型，并示出了使用普通存储模型的元指导器集群，包括MM 136，MM 137，进程表62和规则集存储器63。该模型与图13类似，然而，执行普通任务所需的信息通过MM和它的算法分配。MM可以允许处理器间的通信或要求通过控制每个处理器的虚拟化地址空间将每个处理器隔离成单独的域。这可能涉及将某处理器专用于某单独的任务和存储空间，或动态分配组件给多个进程和操作系统。
[0183]参见图38，示出了并行配置的元指导器。该场景与MM云计算类似，然而在集群计算中，节点之间的网络是本地化的，并不在整个广域网上分布。图38中的MM配置与图14和15中的集群配置、图34、35和36的网格配置类似。
[0184]参见图39，示出了两个分布式处理器系统，A和B，每个由相互通信的相应的丽140和141控制。系统A包括四个CPU，A-CPU-O至A-CPU-3，通过MM交换机142与系统A的存储单元，A-Mem-1至A-Mem_6通信，系统B包括四个CPU，B-CPU-O至B-CPU-3，通过MM交换机143与系统B的存储单元，B-Mem-1至B-Mem_6通信。这是同时被配置为并行和分布式模型(PDM)的单独的计算机系统的示例。在PDM中，指令信息和数据通过标记为IDT的域间传输连接在系统A的DID和系统B的DID之间传输，调度和I/O信息，如中断信息通过提供A和B的相应丽域之间通信的KAC连接144传输。为了简单起见，未示出位于丽外部的联网交换机，虽然MM系统域之间可以插入任何类型的网络交换机。
[0185]由于丽域调度进程，并定义地址空间，因此被分配给一个系统，例如A-CPUUi用在系统存储器，例如A-Mem-1中找到的指令信息的进程能够将数据信息存储在其他系统上，例如存储器B-Mem-4。一种替代性的场景是，被分配给A-CPU-1，使用在A-Mem-1中找到的指令信息的进程能够从设备A-Mem-3和B_Mem-5或任何设备组合复制和获取数据信息。另一种组合可以在两个系统上同时开始两个或更多相同的进程，一个在系统A上，一个在系统B上；然后测量并比较每个系统的性能。使用该技术，可以通过排列组合系统中的组件来分析硬件和软件组件的性能。
[0186]如前面说明地，MM域可以动态地将存储区域定义为指令区域或数据区域。该动态定义存储区域的能力根据具体应用程序可扩展为按其他类别和定义来对存储器和进程分类。在经典的冯?诺依曼、哈佛和数据流架构中，存储器类型限制为指令和数据。尽管指令信息可以将存储器定义为输入/输出端口，但它也可以将同一存储器定义为常规存储器，或将常规存储器定义为输入/输出端口。在单一域中，由于定义存储地址空间的算法的循环逻辑，定义不变的存储空间是不可能的。在MM域中，指令信息不定义地址空间。这意味着MM定义不能通过指令信息改变的特定类型的输入/输出端口。MM可以记录存储访问，并应用规则和条件到哪些进程可以读取或写入信息到存储器。
[0187]例如，一种常见的输入/输出端口称为通用串行总线端口(USB)。USB设备被设计为在外部源和系统DID之间双向传输信息。该设备有执行不想其被执行的指令信息的历史。这可以通过执行来自设备自身的指令或从设备传输指令信息到系统DID中来实现。
[0188]在执行来自设备的指令信息的情况下，阻止这点发生可以是丽规则集不允许连接或调度从USB设备发出的进程这样简单的事。由于MM定义了地址空间，因此可以有这样的规则??从USB设备执行的任何设备只可以访问输出设备，如显示器；该进程只可以访问存储器的限制区域，并且不能开始另一进程或子进程。这种规则可以很简单或相当宽泛。
[0189]从USB设备传输信息到丽域可以分类为四种类型。类型I是将USB数据信息作为数据信息传输到MM域。MM将该存传输类型存储到数据存储地址。类型2将USB指令信息伪装作为数据信息传输。该情况可以在单一域系统中采用以执行称为恶意软件的恶意的指令信息。然而，在MM域中，该信息被指定为数据，并不被调度用于执行。如果进程或设备试图使用数据信息开始任何类型的进程，那么将产生错误，并发出报警。相反地，类型3将指令信息从USB设备传输到该MM系统内的指令存储位置。如果某一进程试图将指令信息作为数据使用，那么MM规则集将阻止该操作，将其识别为错误，并发出报警。类型4是从USB向MM域内的指令存储位置传输指令信息。在类型4传输中，指令信息可以在与来自USB设备本身的指令相同的规则集下执行。传输的类型4进程可以提升为另一规则集。提升可以限制为通过元指导器调度的构造(conformat1n)，如从非系统源，例如键盘或指纹阅读器接收信息的硬件设备输入的加密和密码。这些设备不能在MM域中模仿(spoofed)，因为MM调度设备并定义在系统内传输的所有信息。
[0190]传输信息到USB设备受MM规则集的约束。该规则集可以定义数量、类型和/或传输到USB设备的信息的所有者。改变该规则集可能要求通过元指导器调度的使用加密和密码的相同的构造过程。
[0191]如前面说明地，MM域中的元素定义存储地址，并为DID调度进程，DID中的元素使用由MM域定义的指令和数据地址空间执行进程。该特点允许MM域排列组合并分析单独的组件和系统的进程。
[0192]参见图40，示出了与公共组件P-O至P-4，S-O和显示器_1至显示器_4的两个丽系统。该两个MM通过它们相应的保持活跃控制器(KAC)连接。组件P-0，P-1, P-2和S-O是传感器单元，称为传感器，分别在显示器-1，显示器_2，显示器-3，显示器-4上显示它们的输出。这些组件是MM系统的代表性组件。来自传感器P-O，P-1，P-2的原始读数通过使用驻留在数据信息存储设备A-Mem-O至A-Mem_7和B-Mem-O至B-Mem_7中的查找表转换为有意义的、准备显示的数值。传感器单元S-O使用的采用指令信息存储器将原始读数转化为有意义显示的算法标记为A-S-算法和B-S-算法。组件性能将在不与系统内其他组件交互的情况下使用欧拉方阵和希腊-拉丁方阵比较数值。尽管该分析使用方阵，但该分析也可以被配置为使用系统内的可替换组件的矩形形式。
[0193]使用传感器P-X (其中X代表0，1，2) ;CPU_y (其中y代表A-CPU-0至A-CPU-3和B-CPU-O至B-CPU-3)；以及XX是任意数量0，I，2，3，4，5，6，7的基本方法。
[0194]a.分配CPU-y以开始P_x的模数转换(A-D)
[0195]b.读取输出
[0196]c.使用查找表以转换数值
[0197]d.显示数值
[0198]使用传感器S-O的基本方法是:
[0199]a.分配CPU-y以开始S_0传感器上新的读取
[0200]b.读取输出
[0201]c.使用S-算法以计算数值
[0202]d.显示数值
[0203]第一循环(1-1)以元指导器A分配A-CPU-O开始P-O的A-D开始。元指导器B分配 B-CPU-O 开始 P-O 的 A-D。
[0204]步骤1-2 ；MM-A 分配 A-CPU-2 开始 P_2 的 A_D，MM-B 分配 B-CPU-1 开始 S-O 转换。在此步骤中，A-CPU-O还读取P-O的输出，B-CPU-O读取P-1的输出。
[0205]步骤1-3 ；A-CPU-0进行查找以使用存储器A-Mem-χχ将P_0的原始输出转换成有意义的数量。B-CPU-O进行查找以使用B-Mem-xx将P-1的原始输出转换成有意义的数量。A-CPU-2读取P-2的输出，B-CPU-1读取S-O的原始输出。
[0206]步骤1-4 ；A-CPU-0在显示器_1上显示它的结果。这完成分配给A_CPU_0的进程，A-CPU-O置为等待状态。B-CPU-1在显示器-2上显示它的结果。这完成分配给B-CPU-1的进程，B-CPU-1置为等待状态。A-CPU-2进行查找以将P-2的输出转换成有意义的数量。B-CPU-1开始B-S

完整全部详细技术资料下载

当前第5页1 2 3 4 5 6