分层且并行分区网络的制作方法

文档序号:9932649阅读:382来源:国知局
分层且并行分区网络的制作方法
【技术领域】
[0001]本发明总体上涉及具有多个互连的处理器和存储器的设备。
【背景技术】
[0002]诸如微处理器之类的集成电路设备可以具有多个处理器和耦合到处理器的多个存储器。处理器(常常被称为处理引擎或内核)可以被再分成多个群(常常被称为块、群集或岛)。每个块可以具有多个处理器以及一个或多个存储器,该存储器通过总线或其他网络紧紧连接到各处理器中的每一个。块接着可以通过网络彼此连接并连接到系统存储器。以这种方式,每个块的每个处理器可以通过网络与同一块的处理器或存储器、或者另一块的处理器或存储器、或者系统存储器自身通信。网络可以采用多个缓冲器来缓冲等待访问网络或网络区段的数据分组。
【附图说明】
[0003]图1是根据本描述的一个方面的采用分层且并行分区网络的计算机架构设备的一个实施例的示意图。
[0004]图2是图1的计算机架构设备的分层且并行分区网络的层次方面的一个示例的示意图。
[0005]图3是图1的分层且并行分区网络的块层次级别的一个实施例的更详细示意图。
[0006]图4是图1的分层且并行分区网络的一个分区的单元层次级别的一个实施例的更详细示意图。
[0007]图5是图1的分层且并行分区网络的一个分区的单元到单元层次级别的一个实施例的更详细示意图。
[0008]图6是图1的分层且并行分区网络的一个示例的更详细示意图。
[0009]图7是图1的分层且并行分区网络的一部分的更详细示意图。
[0010]图8是图1的分层且并行分区网络的一部分的更详细示意图。
[0011]图9是根据本描述的一个实施例的采用并行分区网络ID标签的分组的示意图。
[0012]图10a、10b描绘根据本描述的一个方面的分层且并行分区网络控制逻辑的操作的一个实施例。
【具体实施方式】
[0013]如下面更详细地解释的,根据本描述的一个方面,对于在小块(也被称为集群或岛)中组织的紧紧耦合的处理器和存储器,提供层次交换机来以相信会改进这些块之间以及块与系统存储器之间这二者的通信的能量效率的方式来互连这些块。在一个实施例中,提供交换机来在某一层次级别(在这里被称为单元层次级别或简单地称为单元级别)互连被组织为“单元”的一组块以及用于该单元的本地存储器控制器。此外,交换机(在这里被称为单元级别交换机)可以具有到其他单元级别交换机以及其他非本地存储器控制器(其也可以被组织为层次交换机)的链路。
[0014]在一个实施例中,用于块到块通信的单元级别交换机可能不具有缓冲以便降低该单元级别交换机所耗费的能量成本。作为代替,例如,在微处理器管芯和存储器控制器管芯之间的管芯到管芯通信通道的终点处提供缓冲器用于中间存储。
[0015]相信根据本描述的分层网络架构可以提供从每个块到分配给单元的本地存储器控制器的通信延迟的改进的可预测性和均匀性。此外,相信就来自中央交换机(诸如单元级别交换机或在一些实施例中单元到单元级别交换机)的延迟来说,非本地存储器控制器可以类似地更等距。更进一步,本地块到块通信可以具有增加的能量效率并且可能受限于本地交换机(诸如单元级别交换机)。此外,相信根据本描述的分层网络架构可以提供改进的可扩展性。例如,当添加更多块或存储器控制器时,可以添加额外的级别或层次以维持本地级别的能量高效通信。
[0016]在本描述的另一方面中,具有交换机(诸如单元级别交换机和单元到单元级别交换机)的网络例如可以被划分成多个单元级别并行分区网络,每一个都各自具有并行分区交换机和单元到单元级别并行分区交换机。相信这样的布置可以通过交换机进一步降低能量遍历成本。例如,通过针对降低的能量消耗更换降低的带宽,可以将能量耗费降低与单片交换机被划分成的并行分区交换机的数目相同或类似的倍数。
[0017]图1图示根据本描述的一个方面的采用分层且并行分区网络通信的计算机架构设备100的一个实施例。该计算机架构设备100可以包括任何计算设备,诸如大型机、服务器、个人计算机、工作站、电话设备、网络设施、虚拟设备、存储控制器、便携式或移动设备(例如膝上型计算机、上网本、平板计算机、个人数字助理(PDA)、便携式媒体播放器、便携式游戏设备、数字照相机、移动电话、智能电话、功能手机等等)或部件(例如片上系统、处理器、桥接器、存储器控制器、存储器等等)。该架构设备100可以包括微处理器管芯上的多个处理器102、一个或多个存储器管芯上的系统存储器104(例如易失性或非易失性存储器设备)、以及一个或多个存储器控制器管芯上的存储器控制器106。存储器控制器106控制去到和来自存储器104的输入和输出操作。
[0018]如下面更详细解释的那样,处理器102和存储器控制器106每个都分别包括分层且并行分区网络108、110。分层且并行分区网络108、110可以改进例如在设备100的各个处理器和存储器之间的通信的能量效率。要认识到可以实现其他特征和优点,这取决于特定的应用。
[0019]在所图示的实施例中,分层且并行分区网络108被构建到处理器102的一个或多个管芯中,并且分层且并行分区网络110被构建到存储器控制器106的一个或多个管芯中。然而,要认识到分层且并行分区网络108、110可以被构建到计算机架构设备100的其他电路中,这取决于特定应用。
[0020]计算机架构设备100还可以包括存储装置116(例如非易失性存储装置,诸如磁盘驱动器、光盘驱动器、磁带驱动器、闪速存储器等)。存储装置116可以包括内部存储设备或附接的或网络可访问的存储装置。存储装置116中的程序被加载到存储器104中并且被处理器102的一个或多个处理器以本领域中已知的方式执行。计算机架构设备100还包括网络控制器或适配器118以实现与外部网络(诸如以太网、光纤通道仲裁环路等等)的通信。此外,在某些实施例中,该架构可以包括视频控制器120以在显示监控器上呈现信息,其中视频控制器120可以被体现在视频卡上或集成在安装于母板或其他衬底上的集成电路部件上。输入设备122被用来向处理器102提供输入,并且可以包括键盘、鼠标、钢笔型触控笔、麦克风、触摸敏感显示屏、输入引脚、插座或本领域中已知的任何其他激活或输入机构。输出设备124能够呈现从处理器102、或其他部件(诸如显示监控器、打印机、存储装置、输出引脚、插座等等)传送的信息。网络适配器118可以被体现在网络卡(诸如外围部件互连(PCI)卡、高速PCI或某种其他I/O卡)上或体现在安装于母板或其他衬底上的集成电路部件上。
[0021]设备100的部件中的一个或多个可以被省略,这取决于特定应用。例如,网络路由器可以缺少例如视频控制器120 O而且,计算机架构设备100的部件的任何一个或多个可以包括采用根据本描述的一个方面的分层且并行分区网络通信的一个或多个集成电路。
[0022]图2示出多个块20(^、20013、."20011,2023、2021^"20211等等。每个块限定第一层次级别的块级别,在这里被称为块层次级别或简单地称为块级别。如下面更详细描述的,各块200a、200b、…200n,202a、202b、…202n等等中的每个块包括由块网络互连的多个处理器和多个存储器。
[0023]多个块200a、200b、…200η由单元级别交换机208a来组织和互连以形成第一单元210a。类似地,多个块202a、202b、…202η由第二单元级别交换机208b来互连以形成第二单元210b。可以利用在图2中没有单独示出的额外的块和单元级别交换机以类似的方式形成图2中如被示意性地表示为单元210η的额外单元。
[0024]多个单元210a、210b、210n中的每个单元限定比块级别的层次级别更高的第二层次级别的单元级别。第二层次级别的单元级别在这里被称为单元层次级别或简单地称为单元级别。
[0025]包括单元210a、210b‘"210n的多个单元通过单元到单元级别交换机220a组织和互连。包括通过单元到单元级别交换机220a互连的单元210a、210b、…210η的多个单元限定比单元级别的层次级别更高的第三层次级别的单元到单元级别。第三层次级别的单元到单元级别在这里被称为单元到单元层次级别或简单地称为单元到单元级别。
[0026]图3示出针对块(诸如图2的块200a)的块级别网络互连的一个示例。针对图3的块200a的网络互连代表针对单元210a的块200a、200b、...200n、单元210b的块202a、202b、…202n以及包括单元n的剩余单元的各块中的每一个的块级别网络互连。
[0027]块200a包括通过块网络320(例如其可以是串行或并行总线、或者纵横式或者矩阵交换机网络)互连的多个处理引擎、内核或其他处理器310a、310b、…310η和多个共享存储器314a、314b、-_314n。其他类型的网络可以被用来互连块的部件,这取决于特定应用。每个处理器310a、310b、…310η可以通过块网络320与块200a的其他处理器310a、310b、…310η中的任一个和块200a的共享存储器314a、314b、…314η中的任一个本地通信。控制逻辑324准许对块网络320的访问,该控制逻辑324仲裁对块网络320进行访问的互相冲突的请求。一旦被准许访问,处理器31Oa、310b、…31On就可以通过块网络320分别地从块200a的其他处理器310a、310b、…310η中的任一个和块200a的共享存储器314a、314b、…314η中的任一个读取数据分组或将该数据分组分别地写入到块200a的其他处理器310a、310b、…310η中的任一个和块200a的共享存储器314a、314b、…314η中的任一个。在所图示的实施例中,块网络320缺少缓冲器以降低能量耗费。然而,要认识到,在一些实施例中,块网络320或者一个或多个块可以在耦合到块网络320的本地缓冲器中缓冲分组。
[0028]根据本描述的另一方面,块(诸如块200a)与设备100的其他块、以及与设备100的存储器控制器106的互连被划分成多个并行分区分组网络,即并行分区分组网络1、并行分区分组网络2、…并行分区分组网络η。每个并行分区分组网络1、2、...η都独立于多个并行分区分组网络的中的其他并行分区分组网络。因此,块200a的处理器(诸如例如处理器310a)例如可以通过所选并行分区分组网络(诸如例如并行分区分组网络I)将数据分组传送到另一块或存储器106,而不会通过其他并行分区分组网络2、...η来整体或部分地传送分组。
[0029]在一个实施例中,可以针对特定并行分区分组网络来为通过块网络320互连的处理器310a、310b、…310η和共享存储器314a、314b、…314η分配优先级。因此,可以为例如处理器310a和共享存储器314a分配用于例如通过并行分区分组网络I传送或接收分组的优先级。以类似的方式,可以为例如处理器310b和共享存储器314b分配用于例如通过并行分区分组网络2传送或接收分组的优先级。块网络320的控制逻辑324包括并行分区分组网络控制逻辑,其选择分配给特定处理器或共享存储器的多个并行分区分组网络1、2、...η中的并行分区分组网络,并通过独立于其他并行分区分组网络的所选并行分区分组网络为该处理器或共享存储器传送分组。因此,公用总线或纵横式网络上的分组可以被多路分解并且引导到所分配的并行分区分组网络。特定分配可能根据处理器、共享存储器和并行分区分组网络的数目、或者其他因素而改变,这取决于特定应用。
[0030]相信将块到块以及块到系统存储器控制器互连划分成独立的并行分区网络可以降低能量使用。例如,每个独立的并行分区网络可以由于较低的带宽而具有降低的能量使用,因为对于每个块而言分组业务被分布在其他独立的并行分区分组网络上。
[0031]根据本描述的另一方面,每个并行分区分组网络1、2、...η都具有多个层次级别。图3描绘对于每个并行分区分组网络的块级别层次级别,例如其中每个并行分区分组网络(并行分区分组网络1、并行分区分组网络2、…并行分区分组网络η)被耦合到设备100的每个块的块网络320,如例如针对块200a所描绘的那样。如图3中进一步所描绘的,块200a的每个并行分区分组网络(并行分区分组网络1、并行分区分组网络2、…并行分区分组网络η)分别通过并行分区分组网络连接350aa、350ab、-_350an耦合到下一较高层次级别(在所图示的实施例中,其是单元级别)。以类似的方式,设备100的每一个剩余块的每个并行分区分组网络(并行分区分组网络1、并行分区分组网络2、…并行分区分组网络η)通过去到下一较高层次级别(在所图示的实施例中,其是单元级别)的并行分区分组网络连接被类似地耦合。
[0032]图4示出处于图2的例如单元210a的单元级别的并行分区分组网络I的一个示例。针对图4的单元210a的单元级别并行分区分组网络I代表单元210a的单元级别并行分区分组网络2、3、….η中的每一个。单元210a的单元级别并行分区分组网络1、2、….η代表单元210b的单元级别并行分区分组网络1、2、.._.η,和包括单元η的剩余单元的单元级别并行分区分组网络1、2、….η。
[0033]如图4中所示,并行分区分组网络I的并行分区分组网络连接350aa(图3、4)被耦合到并行分区分组网络I的单元级别并行分区交换机410a。单元级别并行分区交换机410a是图2和6的单元级别交换机208a的独立并行分区。如图4中所示,单元210a的剩余块200lv..200η中的每一个(图2)也分别通过并行分区分组网络I的并行分区网络连接350ba‘"350na(类似于并行分区分组网络I的网络连接350aa(图3、4))耦合到并行分区分组网络I的单元级别并行分区交换机410a。
[0034]也耦合到并行分区分组网络I的单元级别并行分区交换机410a的是并行分区分组网络I的并行分区网络连接420aa和多个共享存储器414a、"_414n。单元级别并行分区交换机410a可以是例如纵横式或矩阵交换机网络。可以使用其他类型的交换机网络来互连单元210a(图2)的部件,这取决于特定应用。单元210a(图2)的每个块200a、200b、…200η的处理器可以通过单元级别并行分区交换机410a在单元级别与其他块200a、200b、…200η中的任一个以及单元块200a的共享存储器共享存储器414a、"_414n中的任一个通信。由控制逻辑424来准许对单元级别并行分区交换机410a的访问,该控制逻辑424仲裁针对访问单元级别并行分区交换机410a的互相冲突的请求。一旦被准许访问,单元210a(图2)的块200a、200b、…200η的处理器可以通过单元级别并行分区交换机410a分别地从单元210a(图2)的块200a、200b、…200η的处理器或存储器读取数据分组或将该数据分组分别地写入到单元210a的块200a、200b、…200η的处理器或存储器。
[0035]在所图示的实施例中,单元级别并行分区交换机410a缺少缓冲器以便降低能量耗费。于是,单元级别并行分区交换机410a的控制逻辑424和单元210a(图2)的块200a、200b、…200η中的每一个的每个块网络320的控制逻辑324合作来准许对分组源的源块网络320、以及对分组目的地的目的地块网络320、以及对中间单元级别并行分区交换机410a的访问,以使得可以在没有缓冲的情况下经由单元级别并行分区交换机410a将分组从其源块传送到其目的地块。因此,在一个实施例中,单元级别并行分区交换机410a的控制逻辑424和单元210a(图2)的块200a、200b、…200η中的每一个的每个块网络320的控制逻辑324合作来准许对分组源的源块网络320、以及对分组目的地的目的地块网络320、以及对中间单元级别并行分区交换机410a的同时访问。在另一实施例中,缓冲可以被添加在块网络320级别或单元级别并行分区交换机410a级别或二者处,这取决于特定应用。因此,例如,要认识到在一些实施例
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1