计算机系统设备中的全光学快速分布式仲裁的制作方法

文档序号:6925473阅读:206来源:国知局
专利名称:计算机系统设备中的全光学快速分布式仲裁的制作方法
技术领域
本发明的实施例涉及计算机系统设备中的资源仲裁,并且更特别地涉及在提供计 算机系统设备中的计算机系统部件之间的通信的光子互连中的光学信道仲裁。
背景技术
在二十世纪六十年代中期,半导体制造商观察到,在集成电路上制作的电路(诸 如晶体管)的密度大约每18个月翻一番。这种趋势已延续并且现在被称作“摩尔定律”。 晶体管密度被看作是计算机处理能力的粗糙度量,所述计算机处理能力又对应于数据处理 速度。尽管最初摩尔定律是作为观察结果而得出的,但是随着时间的推移摩尔定律已被半 导体工业广泛地接受作为提高计算机处理能力背后的基本驱动力。结果,半导体制造商已 研发了用于将芯片部件的大小减小到微尺度乃至纳米尺度尺寸的技术。计算机系统(其一 些示例是存储器模块系统、单核处理器设备或多核处理器设备)的计算机系统架构在试图 跟上摩尔定律的同时正面临限制。多核系统示例说明所面临的一些问题。近年来,半导体工业已研发了包括两个或 更多被称为“核”的子处理器的处理器。例如,双核处理器包含两个核,而四核处理器包含 四个核。典型地,这些核被集成,共享到系统的其余部分的相同互连,并且可以独立地操作。 尽管半导体制造商可以提高单个核的晶体管密度,但是半导体制造商由于功耗效率低而未 朝这个方向前进。替代方案是提高单个管芯上封装的核的数量。管芯是其上制作集成电路 (“芯片”)的单层半导体材料。然而,芯片上和芯片外通信已成为针对需要这些多核芯片 的、苛刻的数据密集型应用保持性能增长的关键问题。计算带宽随核数量的增长而线性地 缩放,但是可以使用顶级金属线横跨多核芯片传送数据的速率正以慢得多的速度在提高。 另外,数据可以通过沿着芯片边缘定位的管脚而传送到芯片外的速率也比计算带宽更慢地 增长,并且芯片上和芯片外通信的能量成本明显限制可获得的带宽。结果,计算机架构现在 处于十字路口并且物理学家和工程师正在寻找对使用金属线进行芯片上和芯片外通信的 替代方案。计算机系统部件(诸如芯片上的核)通过共同互连而彼此通信并且共享资源。一 种避免冲突或碰撞的机制是通过使用仲裁机制,这些部件可以通过该仲裁机制确定在任何 给定的时间哪个获得对资源的访问。对共享资源的仲裁对于许多系统的性能是关键的,然而在许多请求器间对资源的 高效仲裁相对于处理器时钟周期而言往往是很慢的。而且,在高处理器时钟频率下,给定适 度复杂的电实施方式,仲裁可能消耗大量的功率。控制N输入N输出交叉开关(crossbar)以把唯一发送器分配给每个输出端口是 计算机联网中的标准问题。通常的硬件解决方案被设计用于带有虚拟输出队列(VOQ)的系 统,其中每个发送器具有每接收器一个V0Q。可能的最佳解决方案可以通过脱机顺序算法 在0(N2. 5)时间内被计算出来,即通过Hopcroft-Karp算法针对二分图中的最大匹配进行 计算,但这对于用作交叉开关仲裁方案而言将太慢。相反,对于电子控制的网络交换结构,
3使用联机、并行迭代方案。在多回合迭代过程的每个回合中,发送器请求向接收器发送的权 利,仲裁器响应于这些请求中的一些而发送回准予,并且一些准予然后被接受。最大匹配在 0(log2(N))回合中被实现。所需的时间典型地以数十微秒来测量。期望的仲裁方案可以以与它正在其中操作的系统相称的速度执行它的任务以避 免成为瓶颈并且是低功率的。低复杂度也是仲裁系统的期望特征。

发明内容
本发明的各个实施例涉及用于计算机系统设备中的经由光子互连而通信耦合的 计算机系统部件的全光学分布式仲裁的系统和方法。计算机系统中的光学仲裁的实施例提 供带有固定优先级和不固定优先级的仲裁方案。不固定优先级方案实施例可以提供仲裁的 公平性。在一些实施例中,组合仲裁和光功率的传送。


图1示出依据本发明实施例的层叠计算设备的横截面图。图2示出依据本发明实施例的计算设备的部件的示意表示。图3示出依据本发明实施例的图1所示的计算设备的四个管芯层的分解等距视 图。图4A示出依据本发明实施例的处理器管芯集群(cluster)。图4B示出依据本发明实施例的存储器管芯的块片(tile)。图5示出依据本发明实施例的图4A-4B所示的块片和集群的部件之间的相互作用 的示意表示。图6示出依据本发明实施例的图1所示的计算设备的四个管芯层的放大分解等距 视图。图7A示出依据本发明实施例的光学管芯的示意表示。图7B示出依据本发明实施例的图7A所示的光学管芯的区的放大图。图7C示出依据本发明实施例的图7B所示的沿着线7C-7C的芯片上脊波导的一部 分的横截面图。图7D示出依据本发明实施例的两个近似平行的光子晶体波导的一部分的顶视 图。图8示出依据本发明实施例的电磁辐射源的示意表示。图9A-9B示出依据本发明实施例的两个光电子转换器的示意表示。图10示出依据本发明实施例的光电子转换器的转换器块的部件的示意表示。图11示出依据本发明实施例的光电子转换器的数据/控制块的示意表示。图12示出依据本发明实施例的三个数据/控制块的示意表示。图13示出依据本发明实施例的放大的成束波导调制器/检测器的示意表示。图14示出依据本发明实施例的芯片外通信集线器(hub)。图15示出依据本发明实施例的广播。图16A示出依据本发明实施例的用于在未编码信道中编码数据的波导微环系统。图16B示出依据本发明实施例的用于从波导中提取编码信道的波导微环系统。
图17示出依据本发明实施例的微环的示意表示。图18A示出依据本发明实施例的示例性四集群、层叠计算设备的示意表示。图18B示出依据本发明实施例的图18A所示的仲裁系统的示意表示。图19示出依据本发明实施例的仲裁系统。图20A说明依据本发明另一个实施例的其中优先级方案是固定(不公平)的全光 学仲裁系统的示意图。图20B说明仲裁系统实施例的另一个版本,其中到光子互连的另一个功能部分 (诸如数据传输)的光功率传送与仲裁耦合或组合。图21是可以采用这样的仲裁方案的仲裁系统的示意图,在所述仲裁方案中多个 计算机系统部件可以被准予对多个接收部件的访问而不用提高所使用的波导数量。图22示出依据本发明实施例的另一个仲裁系统的示意图。
具体实施例方式本发明的各个实施例涉及在提供计算机系统部件之间的通信的光子互连的背景 下的全光学仲裁系统和方法。这些光子互连比其电对等物更快,因此仲裁系统不应成为瓶 颈。期望全光学仲裁系统,以便可以与通信的速度相称地执行仲裁。为了说明性目的,描述 计算机系统设备实施例以提供用于说明本发明的仲裁系统的各个方面的背景。然而,依据 本发明的全光学仲裁系统不限于如所描述的光子互连的实施例的具体细节。光子互连这些光子互连提供计算机系统部件(例如,核、集群、存储器控制器)之间的芯片 上光子互连。另外,光子互连的一些实施例也提供到外部设备上的计算机系统部件的芯片 外光子互连。本发明的实施例也包括具有纳米光子部件的光子互连,所述纳米光子部件包 括具有典型地小于波长或小于微米的尺寸的部件。这些光子互连提供比沿着芯片边缘定位的常规管脚更快的、可以把数据传送到芯 片外的速率,提供更大的计算带宽,提供比常规金属线更低的芯片上和芯片外通信的能量 成本,并且可以被扩大或缩小以适应附加部件,例如具有任何数量的核的处理器。光子互连 的架构可以用非阻挡、低等待时间、可重配置的纳米光子微环来实施,从而提供即使在峰值 计算带宽下也非常低的功耗、适中的等待时间以及高带宽。另外,计算机系统设备的架构可 以被配置成使得所有存储器紧密接近存储器控制器或甚至处理器。依据本发明实施例配置 的采用光学管芯的基于多核的计算设备可以以大约20太字节/秒操作。在以下描述中,术语“光子”和“光子地”指的是用经典和/或量子化ER操作的设 备,所述ER的波长不限于电磁频谱的仅可见光部分。在下面描述的各个光子交换机和交换 结构实施例中,若干结构上类似的包括相同材料的部件已被提供相同的附图标记,并且为 了简明起见不重复这些部件的结构和功能的解释。多核层叠计算设备图1示出依据本发明实施例的示例性计算机系统设备(“计算设备”)100的横 截面图,该计算机系统设备是采用光子互连的多核层叠计算设备。该计算设备100包括层 叠在封装116中的四个层叠存储器管芯110-113、处理器管芯102、存储器控制器/目录 (directory)/L2管芯(“存储器-控制器管芯”)104、模拟电子管芯106、和光学管芯108。该层叠存储器管芯110-113可以是易失性存储器(如动态随机存取存储器(“DRAM”)),非易 失性存储器,或易失性和非易失性存储器的任意组合。特别地,该层叠存储器管芯110-113 可以是8千兆字节(“GB”)DRAM。该计算设备100也包括定位在处理器管芯102的顶表 面上的散热器118、以及由四个贯通孔(through via) 120-123表示的大量通孔(例如几百 个),所述通孔从存储器_控制器管芯104穿过模拟电子管芯106和光学管芯108延伸到四 个存储器管芯110-113。管芯102、104、106、108和110-113的厚度可以在大约25微米到大约50微米之间 变化。散热器118耗散由处理器管芯102的计算操作而产生的热量,并且贯通孔120-123 可以是金属化的或硅填充的通孔,它们将存储器管芯中的存储器控制器电互连到四个存储 器管芯110-113中的每一个。位于存储器-控制器管芯104内的存储器控制器管理去往和 来自存储器管芯110-113的数据流以及去往和来自外部设备(未示出)的数据流。光学管 芯108比其它管芯更大以便包括外部光子互连-诸如外部光子互连124和126,所述外部光 子互连可以用来将数据编码的电磁辐射传输到计算设备100以及从计算设备100传输数据 编码的电磁辐射。光学管芯可以是大约24mmX24mm,但是这些尺寸可以根据实施方式而改 变。金刚石层130也可被包括在光学管芯108的底表面与存储器管芯110的顶表面之间。 金刚石层130的厚度可以为大约1-10 μ m,并且可以被用来扩散和耗散由处理器管芯102和 存储器_控制器管芯104产生的热量。图1所示的三维管芯层叠允许光学管芯108与电子管芯102和104的紧密耦合, 以低等待时间提供存储器管芯110-113的可访问性,以及通过将集群逻辑和存储器散布在 层叠的邻近管芯102、104和110-113上,集群内的电布线相对于常规设备被缩短。特别地, 将存储器管芯层叠成紧密接近存储器控制器并使用穿过存储器层的通孔提供了比用于将 常规存储器连接到存储器控制器的显著更长、电阻更高的互连长度更短、电阻更低的互连。 结果,在计算设备100的管芯之间传输电信号所需的功率或负荷明显低于常规存储器到存 储器控制器所需要的功率。图2示出依据本发明实施例互连的计算设备100的管芯102、104和108的部件的 示意表示。处理器管芯102是多核处理器,其中这些核可以被布置成如由集群202-204表示 的集群,每个集群有四个核。每个核具有下面参考图4描述的专用第一级(“Li”)指令高速 缓存(未示出)和专用Ll数据高速缓存(未示出)。集群202-204每个具有由L2高速缓 存206-208表示的专用共享的第二级(“L2”)高速缓存、以及由存储器控制器210-212表 示的相关存储器控制器。存储器控制器210-212分别控制去往和来自集群202-204的数据 流。L2高速缓存和存储器控制器位于邻近处理器管芯102的存储器-控制器管芯104中。 如图2所示,光学管芯108的光子互连214提供使得与集群202-204相关联的L2高速缓存 206-208能够彼此光子通信以及与存储器控制器210-212光子通信的光子互连。此外,图2 揭示了存储器控制器210-211可以与外部存储器模块(诸如芯片外双列直插式存储器模块 (“DIMM”)216-218)光子地通信。集群202-204分别可以与DIMM 216-218电子地或光子 地通信。处理器管芯102的每个集群具有设置在存储器控制器管芯104上的对应存储器控 制器,每个存储器控制器对接到层叠存储器管芯110-113或驱动到芯片外存储器的光子连 接以提供随处理器管芯102性能缩放的带宽。这些集群也通过光学管芯108而彼此光子地
6耦合,从而提供高带宽、适中的等待时间以及非常低的功耗。因此,层叠计算设备100归其 支配的程序员可以以高的水平表达并行性,并且不会被局部性(locality)问题所困扰,这 极大地减小了并行程序开发的难度。此外,计算设备100架构可提供每浮点运算一个字节 (one byte per flop)的带宽至Ij DRAM。当为每个存储器管芯110-113选择8GB DRAM时,叠层上存储器提供32G字节的 DRAM,其通过穿过DRAM的多个通孔(例如通孔120-123)直接连接到存储器控制器。该DRAM 由四个存储器堆叠层提供,所述存储器堆叠层被变薄到大约25到50微米以最小化这些通 孔的负荷或使用这些通孔所需要的功率量。该DRAM叠层的每个层包括映射到上面的处理 器管芯102中的集群上的64个几乎等同的区。每个DRAM区可被进一步细分为多个存储体 (bank),所述存储体减小了行访问时间,并允许多个并发访问。例如,使用20nm DRAM技术, 每个区可提供IG比特的纠错码保护的存储空间,从而使得存储器-控制器管芯104中的每 个存储器控制器电子地连接到存储器的0. 5G字节。多个信道提供到存储器中的增加的带 宽。通过提供增加的带宽,DRAM中的存储体冲突被减少。每个存储器信道由72个数据比特 和大约30个地址和控制比特组成。使用25微米间距的贯通孔,假设每存储器控制器4个 信道,则贯通孔的面积开销可以小于存储器层的3%。细间距的贯通孔允许DRAM被构造成 从单个行访问提供整个高速缓存线。当期望512GB DRAM时,其可以被布置成64个分离的光学连接存储器模块 (“0CM”)。这些OCM利用与上面描述的8GB DRAM相同的基础技术。光学管芯108执行两 个功能。第一,光学管芯108提供到光纤连接(诸如外部光子互连124和126)的接口。第 二,光学管芯108为DRAM的叠层提供低功率的全局互连。这些OCM和处理器通过光纤连接, 所述光纤提供多达48个信道,这些信道可以被用于命令或其它专用数据交换。多核层叠计算设备的总体操作为简化起见,下面参考计算设备100来描述本发明的光子互连实施例,其中处理 器管芯102包括64个四核集群。本领域的技术人员会显而易见,本发明的光子互连实施例 不限于这样的设备并且这些实施例可以被修改并实施成为具有任何数量的集群的多核计 算设备提供光子互连,所述集群具有各种布置的任何数量的核。图3示出依据本发明实施例的光子管芯102、存储器-控制器管芯104、模拟电子 管芯106和光学管芯108的分解等距视图。如图3所示,处理器管芯102和存储器-控制 器管芯104被划分为64个块片。处理器管芯102中的每个块片表示称作“集群”的四个核, 并且在存储器-控制器管芯104中的每个块片表示与处理器管芯102中近似位于直接上方 的对应集群进行电子通信的L2高速缓存、集线器、存储器控制器和其它设备。例如,存储 器_控制器管芯104的块片302表示位于相关集群304下面并与该相关集群304电子通信 的L2高速缓存、集线器、存储器控制器和其它设备。这些集群和块片可以是大约3mmX 3mm, 但是可以根据实施方式被制得更大或更小。本发明的实施例并不限于具有四个核的集群。 在其他实施例中,集群可包括两个、三个和四个或更多核。下面参考图4A-4B来描述集群和 块片的示例。光学管芯108包括16个近似均勻间隔开的光电子转换器(诸如光电子转换 器306)、270个分离的且近似平行(非交叉)的具有蛇形配置的波导(由带308表示),和 16个由8个近似平行的波导组成的束,其中蛇形配置的波导穿过16个均勻间隔开的光电子 转换器的每一个而蜿蜒延伸,每个束从对应的光电子转换器发出,诸如束310从光电子转换器306发出。270个蛇形波导被称作“芯片上波导”,其在光电子转换器之间提供光子通 信;而包括16个波导束的这些波导被称作“芯片外波导”,其提供与位于计算设备100外部 的设备的光子通信。这16个光电子转换器中的每个由四个光电子转换器块(未示出)组 成。每个光电子转换器块(“转换器块”)与存储器-控制器管芯104中的四个相关块片之 一进行电子通信。下面参考图6和7更详细地描述转换器块。模拟电子管芯106包括16 个片(patch),每个片位于存储器_控制器管芯104中的四个块片和光学管芯108中的光电 子转换器之间。每个片包括若干金属化的或硅填充的贯通孔,所述贯通孔提供存储器-控 制器管芯104中的四个块片与对应光电子转换器之间的模拟电子通信。数据以电子模拟信 号(“电信号”)的形式通过这些片进行传输,因为产生模拟信号典型地比产生数字电信号 耗费少得多的功率。下面的描述是对可以如何使用光学管芯108来在处理器管芯102上的集群之间传 输数据并且在集群与外部设备之间传输数据的概述。由处理器管芯102的集群(诸如集群 304)产生的数据或从存储器-控制器管芯104的块片(诸如块片302)提取的数据作为数 据编码的电信号通过片312中的通孔而被传输到光电子转换器306的对应转换器块(未示 出)。该转换器块将电信号编码到在一个或多个芯片上波导308中传播的一个或多个波长 的电磁辐射(称作“信道”)中。将数据编码到未调制信道中可通过调制信道的强度来实 现,这在下面参考图14进行更详细的描述。承载数据的信道被称作“编码信道”。编码信道 的目的地可以是⑴相邻的集群314,其也与相同的光电子转换器306进行电子通信,⑵ 位于处理器管芯102中其它位置的集群,诸如集群315,或(3)外部设备(未示出)。当该 编码信道的目的地为相邻的集群314时,该集群314的位于光电子转换器306内的对应转 换器块接收该编码信道并将其转换回编码电信号,所述编码电信号通过片312被传输回到 集群314。当该数据编码信道的目的地是集群315时,这些编码信道沿着适当的芯片上波 导被传输到位于光电子转换器316内的对应于集群315的转换器块。该编码信道被转换回 编码电信号,所述编码电信号通过片318被传输到集群315。当这些编码信道的目的地是 外部设备时,光电子转换器306的转换器块将编码信道置于束310的芯片外波导上,在那里 这些编码信道离开光学管芯108。当外部设备产生目的地为四个集群314之一的编码信道 时,这些编码信道可以沿着束310中的芯片外波导被传输到光电子转换器306,在那里这些 编码信道被转换为编码电信号,所述编码电信号通过片312被传输到四个集群314以用于 处理。下面参考图7提供对光学管芯108的操作和部件的更详细描述。集群和存储器控制器图4A示出依据本发明实施例的处理器管芯102的集群402。集群402包括四个 核。每个核与Ll指令高速缓存和Ll数据高速缓存进行电通信。Ll指令高速缓存和Ll数 据高速缓存是高速随机存取存储器,其暂时存储频繁或最近访问的指令和数据。图4B示出 依据本发明实施例的存储器-控制器管芯104的块片404。该块片404包括L2高速缓存和 部件区406,该部件区406包括集线器、存储器控制器、目录、网络接口、自身交叉开关连接 和对等交叉开关连接。这些交叉开关连接可被配置成与光电子转换器的对应部分对接。L2 高速缓存被集群402的四个核共享。L1-L2接口 408被定位在集群402和块片404的近似 中央,并提供集群402与块片404之间的电子通信。小型高功率效率的核和高速缓存实现每单位能量近似最佳的可能性能。因此,被选择用于本发明的核可以使用5GHz时钟,并且这些核可以是双指令执行(dual-issue)、顺 序执行(in-order)以及多线程的并且可被配置成提供单指令多数据(“SIMD”)指令以允 许4乘法累加和4字宽加载/存储操作。SIMD可以是为加速浮点性能而设计的低级功能的 集合。SIMD过程使得一个指令能够对多片数据执行相同的功能,从而减小了为处理数据所 需的循环数量。利用如上面参考图3所描述的依据5GHz时钟操作的仅仅64个四集群,计 算设备100的计算带宽可为10万亿次浮点运算/秒(Tflops/s)。每个集群可以在被称作 “时期(印och),,的24个时钟周期期间发送至少一个高速缓存线,诸如64到128字节。图5示出依据本发明实施例的图4A-4B所示的块片和集群的部件之间的相互作用 的示意表示。集线器502把编码电信号分布到L2高速缓存504、目录506、存储器控制器 508和网络接口 510。集线器502也负责传输去往和来自光学管芯108的光电子转换器的 编码电信号,如上面参考图3所描述的。网络接口 510提供到外部网络的连接,并且存储器 控制器508管理去往和来自L2高速缓存504、图1所示的存储器110-113以及外部存储器 (诸如图2所示的DMM 216-218)的数据流。图6示出依据本发明实施例布置的处理器管芯102的四个集群602、存储器-控制 器管芯104的四个对应块片604、模拟电子管芯106的片606和光学管芯108的光电子转 换器608的放大分解等距视图。如图6所示,光电子转换器608包括四个单独的光电子转 换器块610-613。每个转换器块经由片606与四个块片604之一进行电子通信。特别地, 块片615与转换器块610电子通信,块片616与转换器块611电子通信,块片617与转换 器块612电子通信,以及块片618与转换器块613电子通信。转换器块610-613将从块片 615-618输出的编码电信号分别地转换为编码信道,所述编码信道可以在芯片上波导308 的一部分上传输以供其它集群处理,或在波导束620上被传输到外部设备以用于处理。转 换器块610-613也将在束620和芯片上波导308中传输的编码信道转换为编码电信号,所 述编码电信号可被四个集群602分开处理。光学管芯图7A示出依据本发明实施例的光学管芯108的示意表示。如图7A所示且如上面 参考图3所描述的,光学管芯108包括270个分离的、近似平行、非交叉的芯片上波导308、 16个近似均勻间隔开的光电子转换器和16个由8个芯片外波导组成的束。芯片上波导308 可以被设置成蛇形配置从而使得所有270个芯片上波导308可以光子耦合到16个光电子 转换器的每一个。图7A揭示了每个光电子转换器包括四个转换器块。换言之,光学管芯108 包括64个转换器块,每个转换器块与存储器_控制器管芯104的64个块片之一通信。图 7A还揭示了定位在蛇形芯片上波导308的相对端部的两个基本等同的信道源702和704。 源702和704的每个被配置成以相反的方向输出64个不同信道的相同组到每个芯片上波 导上。方向箭头706表示从源702输出的信道被传输的方向,而方向箭头708表示从源704 输出的信道被传输的方向。蛇形芯片上波导308具有大约1900微米的宽度。本发明的实施例不限于具有图7A所示的蛇形形状的芯片上波导。芯片上波导的 配置可采取任意合适的形状,所述形状可取决于光电子转换器的数量、光电子转换器的布 局以及在光学管芯上可用的空间量。图7B示出依据本发明实施例的光学管芯108的图7A所示的区710的放大图。如 图7B所示,为了简化说明起见,仅显示270个蛇形芯片上波导308中的8个。图7B揭示了
9这些波导不交叉并且近似平行,诸如波导714和716。芯片上波导308可以是脊波导或光子晶体波导,其横截面尺寸的范围从大约0. 25 微米到大约0. 5微米。图7C示出依据本发明实施例的图7B所示的沿着线7C-7C的芯片上 脊波导308的一部分718的横截面图。为了简化说明起见,芯片上脊波导的部分718表示 设置在光学管芯108的表面上的270个芯片上脊波导中的20个。如图7C所示,脊波导被 设置成束,每个束具有4个波导,诸如束720。图7D示出依据本发明实施例的两个近似平行的光子晶体波导的一部分的顶视 图。在图7D中,圆圈-诸如圆圈722-表示光学管芯108的介电或半导体衬底层中的开口的 规则点阵。没有开口的区是光子晶体波导724和726。这些开口可以用空气或具有比衬底 层的折射率更低的折射率的合适介电材料进行填充。开口的规则点阵创建围绕波导724和 726的二维布拉格光栅。这个二维布拉格光栅将适当波长的ER约束到波导724和726。光子 晶体波导是众所周知的,并且教科书Fundamentalsof Optical Waveguides,由Katsunari Okamoto 编写,Elsevier Inc. 2005 ;Optical Waveguide Theory,由 Snyder 禾口 Love 编写, Chapman and HalljLondoruigss^fPPhotonic Crystals, |il Jean_Michel Lourtioz ^m^, Springer-Verlag, Berlin 2005仅仅是这个领域中的许多参考文献中的三个。图8示出依据本发明实施例的源702的示意表示。源702包括激光器802以及两 个星型耦合器804和806。激光器802可以是发射64个不同波长的未调制电磁辐射的跑
道型(racetrack)锁模激光器。每个波长或“信道”由ApX^X3.....λ 64表示,并且每
个信道具有相对恒定的强度。星型耦合器804和806每个包括以把64个信道放置到270 个芯片上波导308中的258个的每个上的树形结构配置的分束器,如图8所示。在本发明 的某些实施例中,激光器802可以是生成Μ+1个激光波长的混合III-V族半导体/Si锁模 激光器。(例如参见 Α. W. Fang 等人的"Integrated AlGalnAs—silicon evanescent race track laser andphotodetectors,,,Optics Express 15,2315(2007)。)光学管芯108在24个时钟周期的时期中同步操作。可用的未编码信道被成组为 可以在单个时期中发送高速缓存线、或广播消息或控制消息的逻辑信道。一个逻辑信道在 一个时期中可以传送一个高速缓存线或控制消息。把信道成组为逻辑信道是以容许集群每 4个(24个时钟周期/6个信道)时钟周期接收和发送多达一个高速缓存线的方式完成的, 从而产生10太字节/秒[64集群X (128字节/4时钟)X 5GHz]的总带宽。光电子转换器图9A-9B示出依据本发明实施例的两个类型的光电子转换器的示意表示。在图9A 中,第一光电子转换器900包括光子耦合到四个芯片外通信集线器905-908的四个转换器 块901-904。通信集线器905-908每个光子耦合到束911-914,其中每个束包括8个芯片外 波导。在图9B中,第二光电子转换器920包括相同的四个转换器块901-904,这四个转换器 块901-904光子耦合到成组为单个设备922的芯片外通信集线器。束911-914经由串行化 /反串行化设备924而光子耦合到设备922。图10示出依据本发明实施例的转换器块1000的部件的示意表示。转换器块1000 包括广播系统1002、数据/控制块1004、仲裁系统1006和芯片外通信集线器1008。下面 参考图18和19更详细地描述仲裁系统1600的操作和架构。广播系统1002允许相关集群 大约同时发送数据到所有其它集群。数据/控制块1004专用于存储器-控制器管芯104
10的特定块片并且将编码信道转换成被传输到该特定块片的编码电信号并且将从该块片输 出的编码电信号转换成被传输到计算设备中的另一个集群的编码信道。下面参考图11-13 更详细地描述数据/控制块1004的架构实施例。仲裁系统1006给予集群在给定的时期中 使用波导束或集群的权利。如图10所示,270个芯片上波导308中的两个专用于广播系统 1002,芯片上波导308中的十二个专用于仲裁系统1006,以及芯片上波导308中的256个专 用于数据/控制块1004。这256个芯片上波导被布置成64个束。该64个束中的每束包括 专用于存储器管芯102中的特定块片的4个芯片上波导。图10也包括表示转换器块1000的部件的尺寸的参数Wl、w2, w3> W4和w5。在某些 实施例中,W1的范围可以近似为2100-2400微米,W2的范围可以近似为1700-2100微米,W3 的范围可以近似为32-44微米,W4的范围可以近似为80-120微米,而W5的范围可以近似为 500-600微米。优选地,W1可以近似为2290微米,W2可以近似为1900微米,W3可以近似为 38微米,W4可以近似为100微米,而W5可以近似为530微米,但这些尺寸和范围可以根据实 施方式而改变。图11示出依据本发明实施例的数据/控制块1100的示意表示。数据/控制块 1100表示光学管芯102中的64个数据/控制块的第N个。水平线1101-1109表示与64个 数据/控制块的每个相关联的64个由4个芯片上波导组成的束中的仅9个束(未示出其 余55个束)。这些束从上到下也被标记成1到64,每个标记对应于特定的数据/控制块。 每个数据/控制块使用特定束来接收从其它63个数据/控制块输出的编码信道。其余63 个束被数据/控制块用来发送编码信道到其它63个数据/控制块。例如,如图11所示,数 据/控制块1100具有光子耦合到束1到N-I和束N+1到64的63个成束波导调制器,诸如 成束波导调制器1110。数据/控制块1100也具有光子耦合到第N束1105的两个成束波导 检测器1112和1114。数据/控制块1100在第一到N-I束和N+1到第64束的每个芯片上 波导中接收来自源702和704的64个未编码(即未调制)信道。如图11所示,数据/控制块1100被配置成使用由源702提供的未编码信道来生 成目的地为数据/控制块N+1到第64的编码信道并且使用由源704提供的未编码信道来 生成目的地为数据/控制块1到N-I的编码信道。例如,如图11所示,数据/控制块1100 在束1101-1104上接收发自源704的未编码信道,如由方向箭头1116-1120所指示的,并且 使用光子耦合到束1101-1104的成束波导调制器来在这些未编码信道1116-1120中编码 目的地为数据/控制块1到N-I的数据。另一方面,数据/控制块1100也在束1106-1109 上接收发自源702的未编码信道,如由方向箭头1121-1125所指示的,并且使用光子耦合到 束1106-1109的成束波导调制器来在未编码信道1112-1125中编码目的地为数据/控制块 N+1到64的数据。数据/控制块1100使用成束波导检测器1112和1114来接收由其它63 个数据/控制块发送的编码信道1120和1121。图12示出依据本发明实施例的三个数据/控制块的示意表示。如图12所示,第 二数据/控制块1202被配置成在第二束1102上接收编码信道,而第63数据/控制块1204 被配置成在第63束1108上接收编码信道。数据/控制块1100和1204以及其它未示出的 数据与控制块使用束1102来发送编码信道到第二数据/控制块1202。这些编码信道未受 干扰地通过位于其间的数据/控制块。数据/控制块1100和1202以及其它未示出的数据 与控制块使用束1108来发送编码信道到第63数据/控制块1204。这些编码信道未受干扰地通过位于其间的数据/控制块。下面参考图13和14更详细地描述成束波导调制器和检 测器的操作和架构。注意,在本发明的其它实施例中,数据/控制块1100也可以被配置成使用由源702 提供的未编码信道来生成目的地为数据/控制块1到N-I的编码信道并且使用由源704提 供的未编码信道来生成目的地为数据/控制块N+1到64的编码信道。成束波导调制器和成束波导检测器是近乎等同配置的设备。图13示出依据本发 明实施例的放大的成束调制器/检测器1300的示意表示。如上面参考图11-12描述的,成 束波导调制器/检测器1300在由四个芯片上波导1301-1304组成的束上接收信道。成束 波导调制器/检测器1300包括四个波导微环系统,诸如波导微环系统1306。这四个波导 微环系统包括近似平行的波导1301-1304,但是波导1301-1304之间的间距的范围可以近 似为10-14微米,其大于在成束波导调制器/检测器1300外部的成束波导1301-1304之间 的间距。每个波导微环系统包括64个微环,诸如微环1308。这64个微环邻近每个波导并 且分布在沿着每个波导长度的相对侧上。每个微环被配置成与沿着光子耦合的波导传输的 64个信道之一谐振。下面参考图17描述微环的配置。图13也包括表示波导微环系统1300的部件的尺寸的参数、、t2、t3和t4。在某些 实施例中,、的范围可以近似为45-65微米,t2的范围可以近似为200-300微米,t3的范围 可以近似为0. 5-5微米,而t4的范围可以近似为1-10微米。优选地,、可以近似为57. 5 微米,t2可以近似为255微米,t3可以近似为2微米,而t4可以近似为5微米,但是本发明 不限于这些尺寸或尺寸范围。这些尺寸和尺寸范围可以根据实施方式而改变。图14示出依据本发明实施例的芯片外通信集线器1400。芯片外通信集线器1400 包括芯片外波导调制器1401和芯片外波导检测器1402,其总尺寸为大约200-300微米X 大约100-200微米,但是这些尺寸可以根据实施方式而改变。芯片外波导调制器1401包括 四个波导微环系统1403-1406。波导微环系统1403-1406的每个包括64个微环和芯片外波 导的一部分。波导微环系统1403-1406的波导分别经由四个分束器1408-1411而光子耦合 到芯片上波导1407。波导1407承载64个未编码信道,所述未编码信道被分束器1408-1411 放置到波导微环系统1403-1406中,所述波导微环系统1403-1406然后被用来把数据编码 到由四个对应块片生成的64个未编码信道中,如下面参考图15A所描述的。芯片外波导检 测器1402包括四个波导微环系统1412-1415,所述波导微环系统1412-1415也包括用于从 外部设备-诸如芯片外存储器-接收编码信道的四个芯片外波导。波导微环系统1412-1415 被用来把编码信道转换成被传输到四个电子耦合块片的对应编码电信号。图15示出依据本发明实施例的广播系统1500。广播1500包括广播调制器1502 和广播检测器1504,其面积尺寸近似为400-600微米X 20-40微米,但是这些尺寸可以根据 实施方式而改变。广播调制器1502包括分别光子耦合到两个芯片上波导1510和1512的 两个波导微环系统1506和1508。广播检测器1504包括分别经由分束器1518和1520而光 子耦合到波导1510和1512的两个波导微环系统1514和1516。广播系统1500被用来近似 同时地发送数据到所有其它集群和接收来自所有其它集群的数据。注意,尽管上面参考图9-15针对64集群计算设备描述了本发明的光电子转换器 实施例,但是本发明的实施例不受此限制。本领域的技术人员会立即意识到,这些实施例可 以被扩大或缩小以适应具有任何数量的集群的计算设备。
波导微环系统的操作图16A示出依据本发明实施例的可以用来在64个未编码信道中编码数据的波导
微环系统。在图16A中,64个未编码(即未调制)信道λ^ λ2、λ3.....λ64由波导1602
承载。64个微环的每个被配置成与信道之一谐振从而使得可以经由到相关邻近微环的渐 逝耦合来提取每个信道。例如,微环1604被配置成与信道入工谐振。当信道入工沿着波导 1602传输时,信道λ i的大部分被渐逝耦合到微环1604中。可以通过对微环施加“导通” 和“断开”电压的模式而以信道的强度编码信息。电压使微环的折射率偏移,这进而调制沿 着波导1602传输的信道的强度。电压的模式可对应于从存储器-控制器管芯104中的对 应块片输出的数据串。例如,由存储器-控制器管芯104的块片产生的适当“导通”电压可 对应于二进制数“1”,而“断开”电压可对应于二进制数“0”。当“导通”电压被施加到微环 时,微环的谐振被偏移并且沿着邻近波导传输的对应信道不会渐逝耦合到该微环中。换言 之,当施加“导通”电压时,信道的强度在信道通过微环时保持相对不变。然而,一旦电压被 “关断”,信道就被渐逝耦合到微环中并且通过微环的信道的强度下降。结果,以“导通”和 “断开”电压的模式编码的相同数据可以以信道的强度被编码,其中相对高的强度对应于二 进制数“ 1,,而相对低的强度对应于二进制数“ 0 ”。图16B示出依据本发明实施例的可以用来从波导中提取64个编码信道的波导微 环系统。在图16B中,64个编码信道不,I2, X3,..石4被输入到检测器块的波导1606。 这64个微环的每个被配置成与64个信道之一谐振从而使得每个信道可以经由到邻近微环 中的渐逝耦合而被提取。例如,当沿着波导1606传输编码信道$时,与信道$相关联的高 和低强度被渐逝耦合到微环1608中。与信道^;相关联的相对高和低强度的模式创建横跨 微环1608的高和低电压的对应模式。这种电压模式然后作为编码相同信息的电信号被传 输到存储器_控制器管芯104中的相关块片。微环图17示出依据本发明实施例的微环1700的示意表示。微环1700被定位成紧密 接近波导1702。在某些实施例中,微环1700包括本征半导体,在微环1700内部的半导体衬 底中形成有P型半导体区1704,以及在围绕微环1700外部的以及在波导1702的相对侧的 半导体衬底中形成有η型半导体区1706。这些区1704、1706和微环1700形成可以用作光 电二极管或调制器的p-i-n结,如上面参考图16所描述的。波导1702可以是如上面参考 图13-15所描述的芯片上或芯片外波导。波导1702的传输可对信道波长敏感并且可在该 信道处于与微环1700谐振时极大地减小,因为信道渐逝耦合到微环1700中。微环1700的 谐振可以通过对区1704和1706施加适当的电压或电流而被电子调制。微环1700可以被 配置成使得当没有电压或电流被施加到微环时,特定信道与微环1700谐振并且渐逝耦合 到微环1700中。当适当的电压或电流被施加到微环1700时,微环1700的谐振被偏移并且 相同信道不受干扰地传播经过波导1702。另一方面,微环1700也可以被配置成使得当电压 或电流被施加到微环1700时,特定信道与微环1700谐振并且渐逝耦合到微环1700中。当 电压或电流被“关断”时,微环1700的谐振被偏移并且相同信道不受干扰地传播经过波导 1702。对于微环调制器的示例,参见Q. Xu等人的“12. 5Gbit/s carrier-injection-based silicon microring siliconmodulators,,,Optics Express 15,430(2007)。
仲裁这些集群可以作为资源以及对其它资源的请求器而操作。然而,情况可能是两个 或更多集群在相同时期期间请求对相同资源(诸如特定集群)的访问。本发明的每个集群 被电子耦合到对应的仲裁系统以便避免这些种类的冲突。为了简明和简化起见,执行仲裁 的以下描述是使用依据本发明实施例的仅包括四个集群的示例性计算设备的示意表示来 描述的。随后,下面参考图19来描述仲裁系统实施例的描述。图18A示出依据本发明实施例的示例性四集群、层叠计算设备1800的示意表 示。计算设备1800包括与四个对应的数据/控制块1805-1808电子通信的四个集群 1801-1804。计算设备1800也包括第一源1810和第二源1812。这些源1810和1812可以
被配置成发射64个未编码信道\ λ、\ 2、\......λ 64到四个波导束1814-1817的每个波
导上,如上面参考图8所描述的。每个数据/控制块在特定束上接收数据和控制信道并且 使用其余信道来发送数据和控制信道到其它集群。例如,数据/控制块1806包括如上面对 于图11-12所描述的那样被配置和操作的三个成束波导调制器1821-1823和成束波导解调 器1820。集群1801-1804每个与仲裁系统1830电子通信。图18Β示出依据本发明实施例的仲裁系统1830的示意表示。仲裁系统1830包括 光子耦合到源1834的功率波导1832、与功率波导1832光子通信的环形波导1836以及四个 光转移器(diverter),在这个实施例中所述光转移器是波长选择元件1837-1840。在这个 示例性讨论中,波长选择元件被实施为微环。源1834是光源。光源的示例包括激光源,发 光二极管或从另一个系统接收的光。仲裁系统1830也包括位于环形波导1836内的4组4 个内部微环1841-1844。源1834发射四个未调制信道λ,^ λ,2、λ,3和λ,4到功率波 导1832上。微环组1841-1844的每个与四个集群1801-1804之一电子通信。特别地,微环 组1841的微环与集群11801电子通信,微环组1842的微环与集群21802电子通信,微环组 1843的微环与集群31803电子通信,而微环组1844的微环与集群41804电子通信。内部微 环被配置为如上面参考图17所描述的p-i-n结光电二极管。注意,对于64集群计算设备 100,不需要分离的源1834,如下面参考图19所描述的。如图18B所示,四个微环1837-1840和内部微环1841-1844每个用信道名称λ \、 λ ’ 2、λ ’ 3和λ ’ 4进行标记。这些名称标识每个微环与其谐振的并且可以从邻近波导渐 逝耦合的信道。例如,微环1837-1844每个被单独地配置成分别与信道λ,工、λ,2、λ,3和 λ,4的仅仅之一谐振。特别地,微环1837-1840分别把信道λ,ρ λ,2、λ,3和λ,4从功 率波导1832中的顺时针方向1846渐逝耦合到环形波导1836中的逆时针方向1848上。以相同的方式,内部微环1841-1844也渐逝耦合来自环形波导1836的特定信道, 但是内部微环必须被对应集群激活或“导通”。例如,微环1841所有都可以被配置为信道 λ,” λ,2、λ,3和 λ,4 的模截止谐振频率的 l/2(l/2a mode off of the resonance frequency)。结果,信道λ,^ λ,2、λ ’ 3和λ ’ 4沿着环形波导1836不受干扰地通过微 环1841。然而,对应集群11801可以发送适当的电流以激活特定微环从而使该微环偏移成 与相关信道谐振。微环然后可以渐逝耦合来自环形波导1836的信道以在微环内谐振。例 如,集群11801可以“导通”微环1850从而使得信道λ ’ 3被从环形波导1836渐逝耦合以 在微环1850内谐振。除非组1841内的其它微环被“导通”,否则信道λ \、λ ’2和λ ’4不 受干扰地通过。
14
现在参考图18A和18B来描述使用仲裁系统1830来确定四个集群1801-1804之 一是否可用于接收数据。恰好在每个时期之前,每个集群被分配从源1834发射的四个信道 之一,并且集群1801-1804知晓集群到信道的分配。这些分配可以是随机的或者是基于确 保集群的公平利用的方法,并且可以在新时期开始之前的时期(在示例性实施方式中为时 期的1/3)期间进行。这些集群到信道的分配被集群用来确定哪些集群可用于接收数据以 进一步处理。在一个实施例中,每时期的信道分配初始可以被预定并且存储于在每个集群 处可访问的查找表中,并且计算机逻辑用来依据方案更新每时期的集群到信道的分配。这 种方案的示例是循环方案。在一个实施例中,仲裁器分散在若干管芯上。存储器控制器管芯104上的交叉开 关(x-bar)连接确定从仲裁器请求什么。该请求通过模拟管芯106被传递到环状调制器 (ring modulator)和波导所处于的光学管芯108。该请求尝试在光学管芯108上转移信道 并且该信道要么被转移并被检测要么没有。所得到的电信号使其向下回到交叉连接,所述 交叉连接把电信号解释为要或不要通过在下一时期上向调制器发送数据来使用逻辑信道。例如考虑在时期开始之前表I所示的集群到信道的分配 如表I所显示的,集群11801被分配信道λ \,集群21802被分配信道λ’2,等等。 假设集群11801和集群41804两者都想要使用集群31803来处理数据。返回到图18Β,集群 11801 “导通”微环1850并且集群41804也导通微环1852。信道λ,3从功率波导1832经 由微环1839渐逝耦合到环形波导1836上,其中信道λ ’ 3然后正好在微环1839之后沿着 环形波导1836以逆时针方向1848传播。在信道λ ’ 3可以到达微环1852之前,微环1850 从环形波导1836中提取信道λ ’ 3。在微环1850中谐振的信道λ ’ 3生成被发送到集群 11801的电信号。返回到图18Α,当这个电信号超过阈值时,该电信号在集群11801中被检 测到。检测到这个信号后,集群11801在后续的时期期间传输数据到调制器1856,该调制器 1856在从源1810输出的未调制信道中编码数据。这些编码(即调制)信道然后沿束1816 被流传送到检测器1858并且由集群31803处理,如上面参考图12所描述的。在这个特定 的时期中,集群11801获得对集群31803的访问而集群41804不得不等待后续的时期。现在假设集群11801和集群41804两者都想要再次使用集群31803来处理数据。 但在这种情况下,假设在时期开始之前集群到信道的分配是如表II所示表 II 如表II所显示的,集群31803现在已被分配信道λ,4。返回到图18Β,集群 11801 “导通”微环1860并且集群41804也“导通”微环1862。信道λ,4从功率波导1832 经由微环1840渐逝耦合到环形波导1836上,其中信道λ ’ 4然后正好在微环1840之后沿 着环形波导1836以逆时针方向1848传播。然而,在这个时期之前,微环1862从环形波导 1836中提取信道λ ’ 4,之后信道λ ’ 4可以到达微环1860。信道λ ’ 4在微环1862中谐振 并且生成被发送到集群41804的电信号。现在返回到图18Α,当这个电信号超过阈值时,集 群41804检测到这个信号。检测到这个信号后,集群41804在后续的时期期间传输数据到 集群31803以进行处理,如上面所描述的。在这个特定的时期中,集群41804获得对集群 31803的访问而集群11801不得不等待后续的时期。图19示出依据本发明实施例的对应于相关集群N的仲裁系统1900。仲裁系统包 括八个仲裁器1901-1908。每个仲裁器包括波导微环系统以及光子耦合到四个中央波导 1911-1914之一的微环。例如,仲裁器1901包括波导微环系统1916以及光子耦合到中央波 导1911的微环1918。仲裁器1901可以被集群N用来确定所请求的集群M是否可用于接收 数据,并且连接到相同波导1920的其它仲裁器(未示出)为其相关集群做同样的事情。为简化起见,假定仲裁系统1900表示计算机设备100的64个仲裁系统之一,诸 如图10所示的仲裁系统1006。假定所有64个集群使用连接到波导1920的仲裁器来确定 哪个集群可用于接收数据。诸如源702或源704的源以方向1922把64个信道λ ρ λ 2、
λ3.....λ 64放置到波导1911中。每个仲裁器包括微环-诸如微环1918,其从功率波导
1911中提取信道λ^ λ2、λ3.....λ 64之一并且将对应的信道放置到波导1920上以沿方
向1924传播。例如,微环1918可以被配置成从功率波导1911中提取信道λΝ。波导微环 系统1916的64个微环每个被配置成当施加适当的电流时提取由波导1920承载的64个未
调制信道λ:、入2、入3.....X64之一。现在假设集群N想要发送数据到集群M以在下一时
期期间进行处理。在先前时期的该最后1/3期间,集群N确定在集群到信道的分配中已给 集群M分配了信道λ63。集群N通过“导通”微环1922做出响应。因为微环1918被配置 成仅提取信道λΝ,所以信道λ63由连接到波导I920的不同仲裁器(未示出)从功率波导 1911中提取并且信道λ63以方向1924沿着波导1920被传输回来。假若信道λ 63不被也 想使用集群M来处理数据的集群的仲裁器拦截,则经由到微环1922中的渐逝耦合提取信道 入63,该微环1922生成在阈值之上的电信号。集群N通过如上面参考图12所描述的那样传 输数据到集群M来做出响应。如果在信道λ 63到达微环1922之前信道λ 63被另一个集群 K提取,则该集群K可以传输数据到集群M进行处理,并且集群N等待下一集群到信道的分 配和下一时期。注意,尽管已描述了八个仲裁器1901-1908之一的操作,但是若干其它仲裁器可以用来确定其它集群是否可用并且可以用来确定外部设备是否可用。这些确定可以在时期 期间的不同时间做出。如上面所讨论的,除了多核计算设备的说明性示例之外,光子互连和仲裁系统实 施例可以被实施在其它的计算机系统设备(例如也可以具有三维层叠且多个存储器控制 器的存储器系统设备)中。上面在图18A到图19的背景下讨论的全光学仲裁系统实施例说明了一种组合仲 裁与功率传送的系统并且也说明了与不同资源(例如计算机系统设备中的集群)相关联的 逻辑光学信道的变化或不固定的分配。这提供如上面所讨论的公平性。图20A说明依据本发明另一个实施例的其中优先级方案是固定(不公平)的全光 学仲裁系统的示意图。仲裁系统2000可为光子互连的一部分或者可应用于光学互连的整 个部分。示出了示例性仲裁光学部分2002,并且也图解了数据路径光学部分2004以示出与 接收方计算机系统部件相关联的光学接收器2016的相对位置,在时间段窗口(例如时期) 中请求将数据发送到所述接收方计算机系统部件。在这个示例中,数据部分使其自己的光 输入用要从赢得仲裁的相关计算机系统部件发送到与216相关联的期望接收方部件的数 据进行调制。光输入2003可以是从自激光源2006产生的信号中转移或分离的一部分光, 在这种情况下光输入将是未调制的。然而,用于数据路径光学部分2004的光功率2003不 是从与仲裁系统相关联的光转移器(例如“0a”、“la”或“2a”)接收或传送的。激光源2006沿着功率波导2008提供作为光的功率。每个光转移器0a、la、Ib在 依据仲裁方案或协议被允许时耦合来自功率波导2008的光。对于这个示例,第零光转移器 Oa最靠近来自激光源2006的光路,第一光转移器Ia次最靠近(next closest)激光源2006 的光路,而第二光转移器2a光学上离激光源2006最远。仲裁系统2000由仲裁部分2002 表示,该仲裁部分2002包括光转移器0a、Ia和2a以及相应的检测器,所述相应的检测器包 括耦合在第零光转移器Oa和仲裁器0逻辑之间的第零检测器2018、耦合在第一光转移器 Ia和仲裁器1逻辑之间的第一检测器2022以及耦合在第二光转移器2a和仲裁器2逻辑之 间的第二检测器2026。每个仲裁器逻辑单元与计算机系统设备的计算机系统部件相关联。 在一个实施例中,光转移器(0a、la、2a)可以是无源光学分接头(tap)或无源分光器,相应 的光学检测器(2018、2022、2026)耦合到所述无源光学分接头或无源分光器以接收任何转 移的光。每个光转移器也可以被实施为如在上面介绍的多核示例中的波长选择元件,诸如 环状调制器。当光转移器环状调制器也可以生成其自己的电通知信号时,可以不需要附加 的检测器2018、2022和2026。如果与光转移器0a、la和2a相关联的任一计算机系统部件 请求传输信号到与接收器216相关联的部件,则相关计算机系统部件的仲裁器逻辑(0、1、 2)发送激活信号到其相应的环状调制器光转移器0a、la和2a。在说明的示例中,仲裁器1 激活光转移器la,该光转移器Ia将来自激光源2006的光转移到第一检测器2022,该第一 检测器2022发送电信号以向仲裁器1逻辑通知转移器Ia成功地转移了来自功率波导2008 的光并且部件1可以在下一指定的时间段(例如时期)上发送其数据到与光学接收器2016 相关联的部件。可以使用的另一种类型的调制器是信道捷变调制器。仲裁器1逻辑可以向请求部件(例如存储器控制器或核或网络接口)通知其请求 接着可以被满足。仲裁器1逻辑可以激活调制器Ib以将该请求或请求的数据编码到光输入2003的光学信号上从而在一个或多个波长信道中发送到数据波导2030上,所述一个或 多个波长信道可以构成可以被光学接收器2016接收的逻辑信道。在这个示例中,来自激光 源2006的光可以被调制(例如,通知赢得仲裁),因为其未被用作仲裁系统部分2002之外 的功率源。功率传送不与仲裁光源耦合的独立仲裁可以支持其中一个仲裁可以导致使用多 个波导或逻辑信道的情况。用于仲裁信号的一个或多个特定波长表示逻辑信道可用但是不 表示接收方部件需要通过那些相同的特定波长进行通信。在这个示例中,计算机系统部件1赢得了仲裁。光转移器Ia对光的转移也防止来 自激光源2006的光到达光转移器2a。仲裁器2逻辑确定其仍然未被准予访问并且必须至 少等待下一指定的时间段以便发送其数据。这个示例例证了仲裁系统2000具有固定的优 先级仲裁方案并且其不一定公平,因为在被给予对与光学接收器2016相关联的部件的访 问方面部件0总是比部件1优先,而部件1又总是比部件2优先。图20A(和下面的20B)说明了包括光学仲裁模块的仲裁模块的三个示例。每个仲 裁模块包括仲裁器逻辑单元(仲裁器0、1和2),通过仲裁器逻辑单元,一组计算机系统部 件可以相互作用以访问光子互连;以及相关光学仲裁模块,其可以转移来自功率波导2008 的光以指示已经依据仲裁方案准予了访问。图20B说明仲裁系统实施例的另一个版本2001,其中到光子互连的另一个功能部 分(诸如数据传输)的光功率传送与仲裁耦合或组合。其中调制器“0b”、“lb”和“2b”被 定位成接收分别由光转移器0a、Ia和2a转移的来自激光器2006的未调制光功率。来自被 准予访问的计算机系统部件的数据或请求被编码到未调制光上从而通过波导2030上的在 仲裁中赢得的所分派的一个或多个光子互连数据信道进行传输。为便于说明起见,一个或多个仲裁信道被描绘成穿过与光子互连的数据信道部分 分离的波导。然而,构成仲裁和数据信道的波长可以被波分复用并且可以由相同的光学波 导承载。图21是可以采用这样的仲裁方案的仲裁系统2001的示意图,在所述仲裁方案中 多个计算机系统部件可以被准予对多个接收部件的访问而不用提高所使用的波导数量。在这个示例中,激光源2006不仅如图20B中所描述的传送未调制的光功率而且输 出被波分复用(WDM)或密集波分复用(DWDM)的离散波长的未调制光。第零光转移器0a、第 一光转移器Ia和第二光转移器2a每个可以用可调谐调制器(例如信道捷变调制器)或固 定调制器(例如环状调制器)组来实施。类似地,第零调制器Ob、第一调制器Ib和第二调 制器2b每个可以用可调谐调制器或固定调制器组来实施。接收器2016优选地是固定频率 接收器。在这种情况下,如果部件想要与特定接收器通信,则相应的仲裁器逻辑将其相应 转移器和其相应调制器并行地(如果速度很重要)或顺序地(如果对功率或可靠性存在约 束的话)调谐到与接收器对应的波长。这种方案允许部件针对多个接收器进行仲裁而不用 提高波导的数量。作为这个示例的更详细描述,第零光转移器Oa转移来自功率波导2008的第零波 长未调制光2102并且第一光转移器Ia转移第一波长未调制光2104。第零检测器2018和 第一检测器2022成功检测到对其相应相关部件的仲裁。第零调制器Ob和第一调制器Ib 可以分别接收第零波长未调制光2102和第一波长未调制光2104,并且分别输出第零波长
18调制光2106和第一波长调制光2108到数据波导2030上。现在参考图22,其中示出依据本发明实施例的另一个仲裁系统2200的示意图。仲 裁协议具有可以被权衡和优化的若干属性,包括简单性、速度、集中式对分布式、公平性和 优先化。如图20A中所描述的,图20A的仲裁系统2000具有固定优先级并因而其是不公平 的。该仲裁系统提供光学实施的令牌协议。在这个示例中,存在试图针对单个资源进 行仲裁的十个模块0到9。令牌的概念由如下事实表示模块具有将来自功率波导2204的 光转移到仲裁波导2206上的能力,并且哪个模块转移光可以在仲裁之间改变。通过每次改 变优先级,仲裁以使得每个模块具有相同的平均优先级的方式发生,从而导致公平的仲裁 机制。在仲裁系统2200中,第一模块2208使用被描绘为“la”的第一光转移器2210而 将来自功率波导2204的光转移到仲裁波导2206。第一光转移器2210可以用环状调制器来 实施。仲裁波导2206上的仲裁以图20A中描述的类似方式发生。在这个示例中,第三模块2212、第四模块2214、第七模块2216和第八模块2218被 分别描绘为模块3、4、7和8,试图转移来自仲裁波导2206的光。第八模块2218成功地转移 光并检测到它,因为光首先通过第八模块,并且从而赢得仲裁和使用资源的权利。第一、第 三、第四、第七和第八的记法表示模块2202到驱动功率波导2204的激光源2220的接近性, 其中较小的编号在光学上更靠近激光源2220。在下一仲裁阶段的开始时,除了第一模块2208或模块1之外的模块将把光转移到 仲裁波导2206上从而改变该回合的优先级。接下来哪个模块转移光取决于期望的协议。一 种可能的仲裁方案是简单的循环方案,其中最高优先级恰好依次循环通过每个模块。在循环方案中,被描绘为模块2的第二模块2222将在下一阶段中转移光,之后是 第三模块2212或模块3在接着的阶段中转移光,等等。当多个波长被复用在功率波导2206 上时,在循环方案中在每个模块处也可以转移特定波长或波长组。例如,如果存在十个波 长,则第一波长可以由模块Oa在初始的第一时期中转移。在下一时期中,仅模块2208 (Ia) 可以激活其光转移器以转移第一波长。仲裁仍可以是分布式的,因为每个模块仅需要经由 同步时钟信号知道其处于其能够访问不同波长所在期间的那些时期中的哪个时期,所述不 同波长可以由仲裁器逻辑本地存储。仲裁模块不需要知道哪个模块先前被准予访问,因而 使仲裁保持分布式而不是要求计算机系统设备内的全局通信。通过以此方式改变每个回合 的优先级,与针对图20A的仲裁系统2000描述的固定优先级方案相比可以显著地改进公平 性。仲裁系统2200的另一种仲裁方案可包括优先级被重新布置成使得资源的当前占有者 在下一个仲裁循环中变成最低优先级模块。然而,这确实引入了全局信息交换要求。光不是瞬间行进的,因此在这些方案中必须顾及定时考虑因素。当新的阶段开始 时,新的转移器可能不得不等待光到达功率波导。另外,模块需要确信其使用来自当前转移 器的光而不是从先前阶段剩下的光。在其中每个阶段使下一较高模块变成转移器(并从最高编号模块回卷到0)的循 环方案中,模块必须等待光在功率波导2204上行进到下一转移器,并且在获胜者尽可能远 离转移器的情况下然后等待环的一个完整渡越(transit)的时间。一个完整渡越也是确保 每个模块2202看到来自新阶段而不是先前阶段的光所需的时间量。
如果存在N个模块和N个仲裁器(经过复制或WDM来实施)并且如果在每个阶段 中所有N个模块都希望以均勻随机的分布传输到选择的接收器,则这种方案随着N增大将 接近Ι-e—1 (大约0.632)的利用率。我们可以通过执行若干回合的仲裁来改进利用率,其中 每个回合在先前回合的失败者之间仲裁。如果存在R个回合,则随着N增大利用率将接近
1 -R
l_e ο如上面所描述的,令牌协议不是如上面所描述的那样组合仲裁和功率传送。这可 以通过在功率波导2204和仲裁波导2206之间的中部添加另一组调制器和另一个波导来完 成。如果图22中的仲裁波导2206用作图20B的功率波导2008,并且存在带有每个检测器 的环状调制器以把光传递到图20B的数据波导2030上,则这将导致组合的功率传送和令牌 仲裁协议。实施这些仲裁协议所需的光学功率可以显著小于电实施方式,如果在长距离上进 行或以很高的速度进行的话尤其如此。而且,根据仲裁波导2206的环的大小,这种解决方 案具有以很短的时间量做出决策的潜能。与往往是巨大量级或更慢的电解决方案相比,芯 片上环可以在仅仅几纳秒内做出决策。为了解释的目的,前面的描述使用具体术语以提供对本发明的完整理解。然而,本 领域的技术人员显而易见的是,为了实践本发明不需要这些具体细节。本发明的具体实施 例的前面描述是为了说明和描述的目的而给出的。它们不打算穷尽本发明或将本发明限制 为所公开的精确形式。显然,鉴于上面的教导,许多修改和变型是可能的。这些实施例是为 了最佳解释本发明的原理及其实际应用而示出和描述的,从而使得本领域的其它技术人员 能够最佳利用本发明以及带有适合于所考虑的特定使用的各种修改的各种实施例。本发明 的范围旨在由所附权利要求及其等效物限定。
20
权利要求
一种与提供计算机系统中的通信的光子互连一起使用的光学仲裁系统(1830、2001),包括第一波导(1832,2008);光源(1834,2006),用于通过所述第一波导(1832,2001)发送光;与所述第一波导耦合的第一光转移器(1837,1838,1839,1840,2010,2012,2014),用于转移光;与所述第一光转移器耦合的第一检测器(1841,1842,1843,1844,2018,2022,2026),用于检测光;第一调制器(1841,1842,1843,1844,0b,1b,2b),用于响应于所述第一检测器检测到光而调制光以承载数据;以及耦合到所述第一调制器的数据波导(1814,1815,1816,1817,2030),用于承载所调制光。
2.权利要求1所述的系统,其中第一波导是承载未调制光的功率波导(1832,2008);且 其中第一调制器耦合到第一检测器以调制所述未调制光。
3.权利要求1所述的系统,其中第一光转移器包括环状调制器(1700)。
4.权利要求2所述的系统,还包括耦合到功率波导(1832,2008)的第二光转移器 (1838,2012)以及第一光转移器(1837,2010)在光源和第二光转移器之间。
5.权利要求1所述的系统,其中光源(1834,2006)用于发送第一波长未调制光和第二 波长未调制光;第一光转移器(1837,2010)用于转移所述第一波长未调制光;且还包括与功率波导耦合的第二光转移器(1838,2012),用于转移所述第二波长未调制光。
6.权利要求1所述的光学仲裁系统,其中该系统提供固定优先级仲裁方案(2000)。
7.权利要求1所述的光学仲裁系统,其中该系统提供不固定优先级仲裁方案(1830, 2200)。
全文摘要
本发明的各个实施例涉及用于计算机系统设备中的经由光子互连而通信耦合的计算机系统部件(1801-1804)的全光学分布式仲裁的系统和方法。计算机系统中的光学仲裁的实施例提供带有固定优先级(2000)以及不固定优先级(1830,2200)的仲裁方案。不固定优先级方案实施例可以提供仲裁的公平性。在一些实施例中,仲裁和光功率传送被组合(1830,2001)。
文档编号H01L23/52GK101911288SQ200880122362
公开日2010年12月8日 申请日期2008年10月23日 优先权日2007年10月23日
发明者M·菲奥伦蒂诺, N·L·宾克特, N·P·茹皮, Q·徐, R·G·博索莱尔, R·S·施雷伯 申请人:惠普开发有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1