用于基于已删除命令确定命令速率的系统和方法

文档序号:8402761阅读:387来源:国知局
用于基于已删除命令确定命令速率的系统和方法
【技术领域】
[0001] 本公开一般地涉及数据处理,更具体地说,涉及多处理器数据处理系统中的通信。
【背景技术】
[0002] -般地说,可以通过以下各项维护对称多处理(SMP)系统中的存储一致性:基于 目录的一致性协议,其中通过参考一个或多个存储目录解决一致性,或者基于窥探的一致 性协议,其中通过在缓存代理之间传递消息解决一致性。随着SMP系统扩展到越来越大的 η路系统,窥探一致性协议变得受到至少两个设计约束,即,有关缓存代理中用于跟踪请求 和关联的一致性消息的排队结构的深度的限制,以及可用于消息传递的通信带宽方面的限 制。
[0003] 为了解决有关缓存代理中排队结构的深度的限制,某些设计采用非阻塞窥探协 议,其不需要缓存代理来实现诸如消息队列之类的消息跟踪机制。相反,在非阻塞窥探协 议中,缓存代理的请求具有时间限制(意味着窥探器将在固定时间内响应)并且对源节流 (以便确保公平划分可用通信带宽)。例如,可以在系统中的所有可能处理节点之间平均划 分总系统带宽(例如,经由时分多路复用),以便在所有处理节点都发出请求的最坏情况下 确保一致性总线具有足够的带宽。但是,以这种方式平均划分一致性总线带宽将可用于任 何特定处理节点的一致性带宽限制为不多于整体可用一致性带宽的预定子集。此外,当只 有几个处理节点需要高带宽时,可以未充分使用系统的一致性带宽。

【发明内容】

[0004] 在一个或多个实施例中,所描述的一个或多个系统、设备、方法和/或过程可以: 经由互连将速率主节点命令发送到多个处理节点中的至少一个;确定接收到与所述速率 主节点命令关联的指示已删除命令的消息;确定与已删除命令关联的计数满足阈值;以及 响应于确定所述计数满足所述阈值,经由所述互连向所述处理节点提供指示命令速率的信 号。此外,可以响应于确定接收到所述消息,递增所述计数。多个处理节点中的所述至少一 个可以经由所述互连接收指示所述命令速率的所述信号,并且可以在经由所述互连发出推 测命令中使用所述命令速率。
【附图说明】
[0005] 当阅读以下详细描述并且参考附图时,各实施例将变得显而易见,这些附图是:
[0006] 图1提供根据一个或多个实施例的示例性数据处理系统;
[0007] 图2提供根据一个或多个实施例的示例性处理器单元;
[0008] 图3A-3D提供根据一个或多个实施例的数据处理系统中的命令和响应数据流;
[0009] 图3Ε提供根据一个或多个实施例的耦合到互连的多处理系统的示例性图;
[0010] 图4提供根据一个或多个实施例的示出命令、一致性响应和数据传送序列的示例 性计时图;
[0011] 图5A-ro提供根据一个或多个实施例的过度使用(overcommit)协议的示例性计 时图;
[0012] 图6提供根据一个或多个实施例的过度使用系统的示例性框图;
[0013] 图7提供根据一个或多个实施例的过度使用队列的示例性框图;
[0014] 图8提供根据一个或多个实施例的操作过度使用系统的示例性方法;
[0015] 图9提供根据一个或多个实施例的操作动态速率节流器的示例性方法;
[0016] 图10提供根据一个或多个实施例的操作动态速率节流的另一个示例性方法;
[0017] 图11提供根据一个或多个实施例的操作命令优先级超控主节点的示例性方法;
[0018] 图12提供根据一个或多个实施例的操作命令优先级超控客户机的示例性方法;
[0019] 图13提供根据一个或多个实施例的示例性计时系统,该系统可以确定在基于动 态系统工作负载最大化性能和能源效率的同时处理器单元能够支持的最大命令数量;以及
[0020] 图14提供根据一个或多个实施例的在计时系统中确定命令阈值的示例性方法。
【具体实施方式】
[0021] 在一个或多个实施例中,在此描述的系统、方法和/或过程可以提供和/或实现结 构控制器(FBC) (fabric controller),该控制器可以与可伸缩高速缓存一致多处理器系统 一起使用。例如,FBC可以提供一致和非一致的存储器访问、输入/输出(I/O)操作、中断 通信和/或系统控制器通信等。例如,FBC可以在存储系统和存储子系统等的一个或多个 中提供命令和数据操作的接口、缓冲和排序。
[0022] 在一个或多个实施例中,FBC链路可以是或者包括分离事务、多路复用命令和数据 总线,其可以为多个处理节点(例如,多个多处理器单元的硬件实现)提供支持。例如,FBC 链路可以为多个处理器单元提供支持。
[0023] 在一个或多个实施例中,可以通过使用基于非阻塞窥探的一致性协议维护和/或 获得高速缓存一致性。例如,起始处理节点(例如,多处理器单元的硬件实现)可以将命 令广播到窥探器,窥探器可以将一致性响应(例如,按顺序)返回到起始处理节点,并且可 以将组合窥探响应广播回到窥探器。在一个或多个实施例中,可以支持多个级别(例如,范 围)的窥探过滤(例如,节点、组、远程组、系统等),以便利用数据和/或处理线程的本地 性。例如,这种方法可以减少所需的互链带宽量,可以减少系统范围命令广播需要的带宽, 和/或可以维护使用基于窥探的一致性协议的硬件实施的一致性。
[0024] 在一个或多个实施例中,所谓的"节点范围"是范围限于单个集成电路芯片(例 如,单个处理器单元或处理节点)中的窥探器的事务,并且所谓的"组范围"是范围限于在 一组物理处理节点上发现的窥探器的命令广播范围的事务。如果使用更有限的广播范围 (例如,节点或组)不能一致地完成事务,则基于窥探的一致性协议可以强迫将命令重新发 给系统的其它处理节点(例如,包括系统的所有处理节点的组或系统)。
[0025] 现在转到图1,示出根据一个或多个实施例的示例性数据处理系统100。如图所 示,数据处理系统100包括处理节点110A-110D,它们可以用于处理数据和/或指令。在一 个或多个实施例中,数据处理系统100可以是或者包括高速缓存一致对称多处理器(SMP) 数据处理系统。如图所示,处理节点110A-110D耦合到系统互连120(例如,互连结构),系 统互连120可以用于传送地址、数据和控制信息。系统互连120例如可以实现为总线互连、 交换互连和/或混合互连等。
[0026] 在一个或多个实施例中,每个处理节点110A-110D可以实现为包括多个处理器 单元112的多芯片模块(MCM),其中每个处理器单元112A1-112D4可以实现为集成电路芯 片。如图所示,处理节点IlOA可以包括处理器单元112A1-112A4和系统存储器114A;处 理节点IlOB可以包括处理器单元112B1-112B4和系统存储器114B ;处理节点IlOC可以包 括处理器单元112C1-112C4和系统存储器114C ;以及处理节点IlOD可以包括处理器单元 112D1-112D4和系统存储器114D。在一个或多个实施例中,系统存储器114A-114D包括共 享系统存储器,并且通常可以由数据处理系统100的任何处理器单元112读取和写入。
[0027] 如图所示,每个处理节点110A-110D可以包括相应的互连116A-116D,它们可以以 通信方式直接或间接耦合到互连120。如图所示,处理器单元112A1-112A4和系统存储器 114A可以耦合到互连116A (例如,互连结构),处理器单元112B1-112B4和系统存储器114B 可以耦合到互连116B (例如,互连结构),处理器单元112C1-112C4和系统存储器114C可以 耦合到互连116C (例如,互连结构),并且处理器单元112D1-112D4和系统存储器114D可以 耦合到互连116D (例如,互连结构)。
[0028] 在一个或多个实施例中,包括在相应的处理节点110中的处理器单元 112A1-112D4可以耦合以便彼此通信。在一个实例中,处理器单元112A1-112A4可以经由互 连116A和/或互连120与其它处理器单元通信。在第二实例中,处理器单元112B1-112B4 可以经由互连116B和/或互连120与其它处理器单元通信。在第三实例中,处理器单元 112C1-112C4可以经由互连116C和/或互连120与其它处理器单元通信。在另一个实例 中,处理器单元112D1-112D4可以经由互连116D和/或互连120与其它处理器单元通信。
[0029] 在一个或多个实施例中,互连(例如,互连116八、1168、116(:、1160、120等)可以包 括网络拓扑,其中节点可以经由网络交换机、纵横式交换机等耦合到彼此。例如,互连可以 确定物理广播,其中处理
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1