基于无源光学的数据中心网络的制作方法

文档序号:11290740阅读:258来源:国知局
基于无源光学的数据中心网络的制造方法与工艺

本发明的各方面涉及数据中心和数据中心网络。特别地,实施例涉及能量高效的数据中心和数据中心设计。



背景技术:

近年来经历了容纳在现代数据中心中的服务和应用(诸如网络搜索、科学计算、社交网络、文件存储和分布式文件系统)的空前增长。现在的数据中心可以托管经由交换机、路由器和高速链路互连的数十万个服务器,使得数据中心内的联网架构的选择非常重要,因为其影响数据中心可缩放性、成本、容错、灵活性和功率消耗。

过去的十年已经对设计高效的数据中心网络投入了大量的研究努力。然而,最近出现了关于数据中心的功率消耗及其对全球变暖和对数据中心的电力帐单的影响的较大问题。美国环境保护局(epa)已经报告美国的数据中心的功率使用在2000年与2006年之间已加倍至接近610亿千瓦小时,占美国总电力需求的1.5%。

考虑到服务器的数目不断稳定增加和数据中心内部的业务呈指数增长,常规数据中心联网架构遭受性能限制,诸如链路过度订阅和低效的负荷平衡。



技术实现要素:

根据一方面,一种数据中心网络包括第一光学端口群组,其用于连接到第一服务器群组中的相应服务器;第二光学端口群组,其用于连接到第二服务器群组中的相应服务器;第一下无源光学路由元件,其被配置成在第一光学端口群组与第一下光学通信路径之间路由光学通信信号;第二下无源光学路由元件,其被配置成在第二光学端口群组与第二下光学通信路径之间路由光学通信信号;上无源光学路由元件,其被布置成:(i)在第一下光学通信路径与上光学通信路径之间路由光学通信信号,以及(ii)在第二下光学通信路径与上光学通信路径之间路由光学通信信号。

所述数据中心网络还可以包括第一群组内无源光学网络,所述第一群组内无源光学网络形成第一服务器群组中的服务器之间的无源光学通信路径;以及第二群组内无源光学网络,所述第二群组内无源光学网络形成第二服务器群组中的服务器之间的无源光学通信路径,其中,所述第一群组内无源光学网络和第二群组内无源光学网络不包括上无源光学路由元件。

数据中心网络可以使得第一群组内无源光学网络包括星形反射器,其被布置成从第一服务器群组中的任何服务器接收光信号并将该光信号广播到第一服务器群组中的每个其它服务器。

数据中心网络可以使得第一群组内无源光学网络包括第一下光学通信路径中的光纤布拉格光栅,该光纤布拉格光栅被布置成:从第一服务器群组接收第一波长和第二波长的信号,沿着第一下光学通信路径发送第一波长的信号,以及将第二波长的信号反射回到第一服务器群组中的服务器。

数据中心网络可以使得第一群组内无源光学网络包括无源聚合物光学背板。

数据中心网络可以使得第一、第二和第三无源光学路由元件中的每一个选自由星形分离器/耦合器或阵列波导路由器组成的群组。

数据中心网络可以使得经由第一下光学通信路径、第二下光学通信路径和上光学通信路径中的每一个路由的信号将被进行时分复用和频分复用中的至少一个。

数据中心网络可以使得第一下通信路径是第一下无源光学路由元件与上无源光学路由元件之间的直接连接,并且第二下通信路径是第二下无源光学路由元件与上无源光学路由元件之间的直接连接。

数据中心网络可以使得将由第一下光学通信路径、第二下光学通信路径和上通信路径中的每一个载送的信号将被时分复用。

数据中心网络可以使得将由第一和第二下光学通信路径中的每一个载送的信号被时分复用,并且将由上通信路径载送的信号被时分复用并频分复用。

数据中心网络还可以包括第一组的服务器与第二组的服务器之间的群组间无源光学通信路径,其中,群组间无源光学通信路径包括第一和第二无源光学路由元件,但不包括第三无源光学路由元件。

所述数据中心网络可以包括n个光学端口群组,其用于连接至n个服务器群组中的相应服务器,所述n个光学端口群组包括第一光学端口群组和第二光学端口群组,并且所述n个服务器群组包括第一服务器群组和第二服务器群组,第一和第二中间无源光学路由元件,第一和第二中间无源光学路由元件每个具有用于光信号的n个输入端口和用于光信号的n个输出端口,第一和第二中间无源光学路由元件被布置成使得在输入端口处接收到的每个信号基于信号的波长被路由到输出端口,其中,针对每个输入端口,n个不同波长的输入信号被路由到n个输出端口中的不同输出端口,并且第一中间无源光学路由元件的每个输入端口和每个输出端口被连接至与服务器群组中的一个相关联的下无源光学路由元件、上无源光学路由元件或第二中间无源光学路由元件中的一个,第二中间无源光学路由元件的每个输入和每个输出被连接至与服务器群组中的一个相关联的下无源光学路由元件、上无源光学路由元件或第一中间无源光学路由元件中的一个,并且第一和第二下光学通信路径包括第一和第二中间无源光学路由元件中的至少一个。

所述数据中心网络可以使得第一下光学通信路径包括:第一路由服务器,其将经由第一下无源光学路由元件从第一服务器群组中的服务器接收光信号并基于信号的相应目的地以相应波长重传该信号,以及第一中间无源光学路由元件,其与所述第一路由服务器相关联以将信号从第一路由服务器路由至上无源光学路由元件或者与除第一路由服务器之外的路由服务器相关联的第二无源光学路由元件。

所述数据中心网络可以使得第二光学通信路径包括:第二路由服务器,其将经由第二下无源光学路由元件从第二服务器群组中的服务器接收光信号并基于信号的相应目的地以相应波长重传该信号,以及第二中间无源光学路由元件,其与第二路由服务器相关联以将信号从第二路由服务器路由至上无源光学路由元件或与除第二路由服务器之外的路由服务器相关联的中间无源光学路由元件。

所述数据中心网络可以使得第一路由服务器经由相应下无源光学路由元件从至少两个服务器群组接收信号。

所述数据中心网络还可以包括第一光学端口集合,其用于连接到相应服务器,包括第一多个光学端口群组,所述第一多个光学端口群组包括所述第一光学端口群组;第二光学端口集合,其用于连接至相应服务器,包括第二多个光学端口群组,所述第二多个光学端口群组包括所述第二光学端口群组,其中,第一光学端口集合包括光学端口的第一集合链接群组,光学端口的第一集合链接群组中的每个光学端口与集合间通信路径进行光学通信,第二光学端口集合包括光学端口的第二集合链接群组,光学端口的第二集合链接群组中的每个光学端口与集合间通信路径进行光学通信,所述数据中心网络还包括第一集合内通信路径,其被配置成在连接至第一光学端口群组中的光学端口的服务器与连接至光学端口的第一集合链接群组中的光学端口的服务器之间路由信号,并且所述数据中心网络还包括第二集合内通信路径,其被配置成在连接至第二光学端口群组中的光学端口的服务器与连接至光学端口的第二集合链接群组中的光学端口的服务器之间路由信号。

根据一方面,一种数据中心网络系统包括光学线路终端开关,包括多个光学线路终端卡,所述光学线路终端卡每个具有多个光学线路终端端口;多个子网络,其被连接至所述多个光学线路终端端口中的相应光学线路终端端口,其中,所述子网络中的至少一个是如上所述的网络。

附图说明

下面进一步参考附图来描述本发明的实施例,在所述附图中:

图1图示出根据某些实施例的网络或子网络。

图2图示出根据某些实施例的网络或子网络。

图3a-图3c图示出根据某些实施例的用于群组内通信的布置。

图4a-图4b图示出根据某些实施例的网络或子网络。

图5图示出根据某些实施例的网络或子网络。

图6图示出由适合于在根据图5的实施例中使用的无源光学路由元件进行的路由。

图7a图示出根据某些实施例的网络或子网络。

图7b图示出由适合于在根据图7a的实施例中使用的无源光学路由元件进行的路由。

图8图示出根据某些实施例的网络或子网络。

图9图示出根据某些实施例的网络或子网络。

图10图示出根据某些实施例的网络。

图11图示出根据某些实施例的网络或子网络。

图12图示出根据某些实施例的网络或子网络。

图13a图示出根据某些实施例的网络或子网络。

图13b图示出由适合于在根据图13a的实施例中使用的无源光学路由元件进行的路由。

图14图示出根据某些实施例的网络。

图15a图示出具有n=4的胖树数据中心拓扑。

图15b图示出具有n=4和k=1的bcube数据中心拓扑(bcube1)。

图15c图示出用于根据图11和图12的示例性布置针对胖树和bcube拓扑的成本基准分析(benchmarking)。

图15d图示出用于根据图11和图12的示例性布置针对胖树和bcube拓扑的功率消耗基准分析。

具体实施方式

图1示出了根据某些实施例的数据中心网络。图1的数据中心网络100包含用于连接至第一服务器群组中的相应服务器的第一光学端口群组110a、用于连接至第二服务器群组的第二光学端口群组110b和第一下无源光学路由元件(firstlowerpassivieopticalroutingelement)120a。第一下无源光学路由元件120a被布置成在第一光学端口群组110a与第一下光学通信路径130a之间路由光学通信信号。第二下无源光学路由元件120b被配置成在第二光学端口群组110b与第二下光学通信路径130b之间路由光学通信信号。上无源光学路由元件170被布置成:

1在第一下光学通信路径130a与上光学通信路径180之间路由光学通信信号,以及

2在第二下光学通信路径130b与上光学通信路径180之间路由光学通信信号。

如本文所使用的术语“上”和“下”指的是分级结构或网络拓扑,并且并不涉及元件的物理位置。

可以由与第一光学端口群组110a中的每一个相关联的相应第一数据连接111a在第一光学端口群组110a与第一下无源光学路由元件120a之间载送信号。同样地,可以提供第二数据连接111b以在第二光学端口群组110b与第二下无源光学路由元件之间载送信号。在某些实施例中,数据连接111a、111b可以是无源光学连接,使得第一/第二光学端口群组与第一/第二下无源光学路由元件之间的数据连接是完全光学的,并且仅包括无源元件。数据连接111a、111b可以包括光纤。例如,相应光线可以在第一光学端口群组110a中的每个光学端口与第一下无源光学路由元件120a之间延伸。

如在以上描述中使用的“之间”可以表示通信可以是在上行链路、下行链路或两者中,例如从上光学路径180至服务器端口110、从服务器端口110至上光学路径180或两者。可以经由相同通信路径或者经由单独通信路径来发送用于上行链路和下行链路的传输。在具有单独上行链路和下行链路通信路径的某些示例中,可以提供相应上行链路和下行链路网络。该单独上行链路和下行链路网络可以具有类似或相同结构,诸如图1中所示的结构。

上通信路径180可以连接到另一开关元件,允许信号的进一步分布。此另一开关元件可以是无源或非无源的。上光学通信路径180可以连接到光学线路终端(olt)端口。在某些实施例中,olt卡可以包括多个olt端口,每个连接至单独光学网络。每个光学网络可以具有与图1中所示的类似的结构,每个光学网络的相应上光学通信路径180被连接至olt卡的相应olt端口。此外,olt机箱(chassis)可以包括多个olt卡,并且olt交换机可以包括多个olt机箱。此布置可以允许olt交换机内的相同或不同olt卡上的olt端口之间的通信。在此类布置中,连接至图1的第一光学端口群组110a中的光学端口的服务器可以经由第一下无源光学元件120a和上无源光学元件170连接至olt交换机的第一olt卡,并且可以与经由olt交换机连接至olt交换机的第二olt卡的另一服务器和服务器的相应光学网络通信。

图1的布置提供适合于在数据中心中使用的分级网络。该布置允许使用无源光学元件在第一服务器群组中的服务器与上光学通信路径之间路由信号,并且要求很少的有源元件或者不要求有源元件。常规数据中心架构是基于昂贵且功耗大的装置,诸如接入交换机、聚合交换机和核心交换机,占数据中心的总功率消耗的20%。根据图1的布置的实施例允许用光学和无源交换机来替换功耗大的接入交换机和聚合交换机。此外,根据某些示例,可以改善网络的连接,因为群组内和群组间通信不必在高级交换机之间行进。

可以将光学端口群组110a、110b中的每个端口连接至服务器。每个群组内的服务器可以形成机架(rack)的一部分、整个机架或一组机架。在本文中,一服务器群组是连接至同一光学端口群组内的光学端口的服务器。不应认为端口的数目受到图1中所示的数目限制,因为群组可以具有比所示的更多、更少或相同数目的端口。从光学端口110a、110b至无源光学路由元件120a、120b的连接111a、111b可以是光纤或另一形式的波导。可以存在图1上未示出的附加波导,例如端口可以具有单独的上行链路和下行链路连接,或者可以具有额外连接以实现冗余。

光学通信路径130a、130b、180中的每一个可以是光纤,诸如单模光纤或多模光纤。根据某些实施例,可以将光纤设计成与波长~1.55μm、1.30μm一起使用或与大于2μm的波长一起使用,但是在这方面不受特别限制。光学通信路径130a、130b、180可以直接地连接在路由元件之间,其中,直接连接是其中没有连接其它光学装置的连接。连接至两个元件的单个光纤是直接连接的示例。替换地,连接可以是非直接的,其中可以在端点之间连接一个或多个无源光学装置或有源装置。在某些实施例中,第一和第二下光学通信路径以及上光学通信路径中的每一个可以是无源光学路径(即仅包括无源光学元件,在路径中没有有源元件)。

可以将无源光学路由元件120a、120b、170与有源交换机的mux/demux相比较,因为其将多个信号/路径组合成一个信号/路径或者将一个信号/路径分离成多个信号/路径。无源光学路由元件120a、120b、170可以是单向的。在这种情况下,可以针对上行链路和下行链路通信提供单独网络以允许双向通信;上行链路和下行链路网络可以具有类似的结构,在下行链路网络中将元件分离和/或在上行链路网络中将元件组合/耦合。无源光学路由元件120a、120b、170可以是适合于以所需方式引导信号的任何无源光学元件。例如,每个无源光学路由元件可以是星形耦合器、星形反射器或阵列波导引导路由器(awgr)。

可以使用时分复用(tdm)来实现图1的无源光学网络。在这种情况下,可以为与群组110a-b内的相应端口的通信分配时间段。在上行链路方向(即从服务器朝向上通信路径170的通信)上,服务器竞争接入共享传输信道,诸如上和/或下通信路径120a、120b、170。可以使用各种带宽分配算法来增强网络中的媒体访问。例如,在静态带宽分配算法,可以为服务器分配预定义带宽,无论是否存在使用该预定义带宽的需要。在另一示例中,动态带宽分配算法基于需求、服务质量要求以及资源可用性来分配动态地分配带宽。tdm的使用可以避免在相应下光学通信路径130a-b上从同一群组内的服务器传送多个竞争信号。此外,tdm的使用可以允许将信号发送到特定服务器,使得每个服务器只需要在分配给该服务器以接收信号的时间段内侦听(即接收并处理)信号,允许服务器或服务器的通信组件睡眠,并且因此提供节能机会。同样地,tdm可以避免来自上光学通信路径180上的相同或不同群组的不同服务器的竞争信号。当使用tdm时,无源光学路由元件120a、120b、170可以是光学分离器和/或光学耦合器(例如星形耦合器或星形反射器)。

tdm的替换方案是波分复用(wdm)。在某些实施例的光学网络中可以实现wdm,并且其可以通过使用多个波长来避免服务器之间的资源共享。在这种情况下,基于信号的源和/或目的地来选择光信号的波长。如同tdm一样,wdm允许不同的信号共享公共通信路径,并且还提供用于对信号进行“寻址”的手段。在使用wdm的情况下,无源光学路由元件120a、120b、170可以是阵列波导光栅路由器(awgr),其根据信号的波长将信号路由到不同的路径。

根据另一替换方案,可以使用tdm和wdm的组合。这在本文中称为混合式tdm-wdm,并且在混合式tdm-wdm布置中,可以使用光学分离器/耦合器和awgr的组合。在某些示例中,可以动态地分配波长并被位于不同网络中或同一网络的不同部分中的多个服务器共享。动态地调谐至不同波长的能力可以允许服务器加入其它tdm-pon,这可以增强低负荷下的带宽利用率,并且还可以避免高负荷下的拥塞。

根据依照图1的布置的某些实施例,网络可以是混合式tdm-wdm光学网络,并且可以使用多载波发生器。在服务器末端处,可以采用低成本多模收发机来直接地调制从olt接收到的载波信号以用于上游传输。这允许减少olt处的昂贵激光二极管的数目,并且消除了对服务器处的激光二极管的需要。

图2图示出根据某些实施例的布置。此布置类似于图1的布置。除图1的元件之外,服务器/光学端口110a、110b的每个群组具有关联的群组内无源光学网络190a、190b。群组内无源光学网络190a、190b允许群组中的服务器之间的通信,而不经由上无源光学路由元件170来路由通信。在某些示例中,群组内无源光学网络190a、190b允许群组中的服务器之间的通信,而不经由与该群组相关联的下无源光学元件来路由通信。这改善了用于群组内通信的效率。

数据中心内的机架间和机架内业务的百分比通常可以根据数据中心的类型和运行的应用而在20-80%之间不等。在某些实施例中,群组可以与机架相对应。因此,提供不依赖于经由olt交换机的群组内通信可以帮助避免使olt超负荷,其否则可能变成用于所有类型的业务的瓶颈。因此,根据图2的实施例可以避免由光学/电/光学转换、排队、缓冲和处理引起的非期望的延迟和功率消耗。

图2图示出网络中的第一和第二服务器群组140a、140b中的服务器。

在图3a-图3c中图示出群组内无源光学网络的实施例。这些实施例可以允许针对每个机架的较高带宽,并且减少拥塞。

为了改善群组内通信,在没有经由olt或上无源光学路由元件进行路由的情况下,可以使用各种方法。图3a-图3c图示出提供此类群组内通信的布置的示例。在图3a-图3c中的每一个中,提供了用于连接至相应服务器140的一组光学端口110。端口110使用光学连接111而连接至下路由元件120。路由元件120被设计成经由光学路径130将信号路由至另一路由元件,诸如先前描述的上路由元件,并且其进而可以将信号路由至olt端口。

图3a示出了其中每个服务器具有用于与光学端口110的光学连接的第一收发机以及用于经由光学路径351连接至组件350的第二收发机的布置。组件350被布置成将来自群组中的一个服务器的信号反射至群组中的所有服务器,在某些实施例中此装置是无源星形反射器。这允许每个服务器向同一群组中的所有其它服务器进行广播。可以根据媒体接入控制(mac)协议来控制经由光学路径351和组件350的群组内通信以协调和仲裁信道接入。某些实施例可以将时分多址(tdma)用于经由组件350的通信。

在图3b的布置中,在下光学路径130中连接光纤布拉格光栅(fbg)360。fbg360反射选定波长,但是允许所有其它波长通过。反射波长使得能够实现机架内通信,并且透射波长可以与olt及其它群组通信。根据某些布置,可以分配用于每个服务器群组的专用波长,其中,一个波长被用于群组内通信,而其它的被用于与olt和/或其它群组的通信。可以将同一波长分配为用于超过一个群组的群组内通信,因为具有该波长的信号不在该群组外面传播。在所有群组针对群组内通信具有相同波长的情况下,跨网络的均匀性得到改善,并且可用于信令的波长被高效地使用。

在某些实施例中,每个服务器140被布置成使用至少两个波长经由下无源光学路由元件120进行通信,一个波长被fbg360反射并被用于群组内通信,并且一个波长被fbg360透射并被用于与在群组外面的端点(例如,与olt端口或另一群组中的服务器)的通信。还可以使用附加波长,每个被分配给群组内通信或与群组外面的元件的通信。在某些布置中,可以使用两个或更多fbg360,以便反射不同的相应波长。

在某些布置中,可以使用ofdm技术来允许单个收发机产生多个载波(例如一个用于群组内通信且一个用于与群组外面的元件的通信)。

在某些布置中,群组中的每个服务器140可以装配有将生成用于以被fbg360透射的波长与群组外面的元件通信的信号的第一收发机以及将生成用于被fbg360反射的波长下的群组内通信的信号的第二多波长收发机。可以使用tdma来实现此通信。可以在不使用ofdm收发机的情况下实现这些布置,并且因此可以降低成本。

已将图3b描述为使用fbg360。然而,可以替换地使用基于信号的波长而选择性地反射或透射接收信号的任何无源光学元件。

在图3c的布置中,每个端口/服务器群组110包括背板370,在某些实施例中,此背板370是无源聚合物背板,并且可以是具有多模聚合物波导的无源背板(诸如j.bealsiv、n.bamiedakis、a.wonfor、r.penty、i.white,j.degrootjr等人在appliedphysicsa,vol.95,pp.983-988,2009中的“aterabitcapacitypassivepolymeropticalbackplanebasedonanovelmeshedwaveguidearchitecture”中所述的)。在某些实施例中,此类背板可以提供具有每个波导10gb/s速率的非阻塞、全网连接,展示出1tb/s的总容量。背板可以与服务器集成或者与服务器分开。

在图3c的布置中,不要求mac,这相对于要求mac的布置而言可以降低复杂性。

在某些实施例中,可以实现再生以允许大型群组中(例如大型机架中)的通信。可以使用背板本身上的专用再生器(例如使用光学至电转换、后面是电信号再生和最终的电至光学转换)来执行再生。在某些实施例中,可以使用服务器中的收发机和处理电子装置来执行再生以执行再生。将服务器中的收发机用于再生与具有安装在背板上的专用再生器的布置相比可以降低成本。在某些实施例中,可以以纯粹光学方式(例如通过使用光学放大器)执行再生。

图4a描绘了根据本发明的某些实施例的布置。提供了用于连接至四个相应服务器群组的四个光学端口群组110a-d,其中,每个光学端口群组110a-d通过光学连接111a-d连接至相应下无源光学路由元件120a-d。每个下无源光学路由元件120a-d经由光学通信路径130a-d连接至上无源光学路由元件170。上无源光学路由元件170进而经由上光学通信路径180连接至组件300。

图4a图示出四个端口群组110a-d,但是可以提供更多或更少的端口群组。在某些实施例中,四个光学端口群组110a-d具有用于分布在四个群组之中的128个服务器的连接。这些服务器可以是均匀分布的(每个群组中32个),或者替换地可以以另一方式分布,例如取决于空间限制和/或网络要求。实施例可以具有更多或更少的光学端口群组。

在某些实施例中,光学组件300可以是olt端口,例如在olt卡中。在某些实施例中,连接是基于其中使用一对波长(一个用于上游通信且一个用于下游通信)的tdm架构。在本实施例中,不要求无源光学路由元件的波长选择性,并且无源光学路由元件120a-d和170可以是无源星形分离器和/或星形耦合器。此布置可以在不要求多波长收发机的情况下实现,因此可以降低成本和复杂性。

在某些实施例中,连接是基于如用图4b举例说明的混合式tdm-wdm架构,其中,使用4对波长来与4个服务器群组通信,每对波长与相应的端口群组110a-d相关联,并且具有用于上行链路的波长和用于下行链路的波长。用不同的线型来举例说明每对波长。在本实施例中,无源光学路由元件170可以是awgr,其沿着相应光学路径130a-d路由相应的每对波长,并且每个光学路径进而经由无线光学路由元件120a-d(其可以是无源星形耦合器和/或分离器)将成对波长路由至用于连接至服务器的一组端口。针对向/从每个服务器群组内的特定服务器进行的通信,可以使用tdm。全部的四对波长可以由上通信路径180载送。

图4b的布置可以减少拥塞并促进用于每个服务器群组的更多带宽。如相对于图1所述,可以使用多载波发生器来避免对服务器处的激光二极管的需要。

根据图4a和图4b的实施例可以包括群组内无源光学网络,如相对于图2和图3a-图3c所述。这可以避免经由olt端口300来转送群组内业务的需要。

可以在不要求可调谐激光器的情况下实现图4a和图4b的布置,因此降低成本。在根据图4b的某些实施例中,每个服务器具有用于产生与其群组相关联的波长的单波长激光器。

可以用相对简单的布线布置来实现图4a和图4b的布置,促进网络的设立和维护。

根据图5的实施例允许群组间通信,其包括在任何服务器群组110a-d与以分级方式在上无源光学路由元件170下面的任何其它服务器群组110a-d之间进行路由的群组间通信路径。根据图5中的布置500,这些群组间通信路径可以是无源通信路径。根据图5的布置的实施例提供并非经由上无源光学路由元件170路由的群组间通信路径,这可以减少上无源光学路由元件连接到的光学组件300(例如olt交换机)处的功率消耗和负荷,因为不需要经由上无源光学路由元件170和光学组件300来路由群组间通信。在根据图5的布置的某些实施例中,上无源光学路由元件170可以是awgr。

群组间通信路径是经由与发送和接收服务器所属的服务器110a-d相关联的相应下无源光学路由元件120a-d以及经由一个或多个中间无源光学路由元件540a-b。图5的布置示出了两个中间无源光学路由元件540a-b;这些可以将光信号从多个输入端口路由到多个输出端口,输出取决于输入信号的波长和接收到输入信号的输入端口。中间无源光学路由元件540a-b可以是例如awgr。

中间无源光学路由元件540a-b可以经由用图5中的连接元件530a-d示意性地图示出的相应连接元件连接至下无源光学路由元件120a-d。来自服务器群组110a-d的业务(光信号)是连接至中间无源光学路由元件540a-b(例如awgr)的输入端的下无源光学路由元件120a-d(例如星形耦合器)的输出端口。可以通过在端口处放置无源隔离器550a-d来阻止来自服务器群组110a-d的业务经历连接至中间无源光学路由元件540a-b的输出端的另一星形耦合器端口。

在图5的实施例中,每个服务器(例如服务器的网络接口卡)具有用于波长检测和选择的固定已调谐接收机和可调谐激光器。在其它实施例中,可以使用除激光器之外的多波长源,诸如频谱分割led。图5的布置利用四个波长,并且因此接收机被布置成接收至少四个不同波长,并且可调谐激光器被布置成输出至少四个不同波长的信号。

在图5的布置中,经由两个中间无源光学路由元件540a-d来连接四个服务器群组110a-d。在本示例中,每个中间无源光学路由元件540a-b从服务器群组110a中的两个接收输入。更具体地,第一中间无源光学元件540a经由相应下无源光学路由元件120a、120b从第一110a和第二110b服务器群组接收输入。在图5中,在第一中间无源光学路由元件540a的第一输入端口i1处接收来自第一服务器群组110a的输入,并且在第一中间无源光学路由元件540a的第四输入端口i4处接收来自第二服务器群组110b的输入。同样地,第二中间无源光学路由元件540b分别地在第二i2和第四i4输入端口处经由相应下无源光学路由元件120c从第三110c和第四110d服务器群组接收输入。

第一和第二中间无源光学路由元件540a、b中的每一个还具体地在第二i2和第三i3输入端口处分别地从上无源光学路由元件170接收输入。第一和第二中间无源光学路由元件540a-b中的每一个还从另一中间无源光学路由元件540a-b接收输入。具体地,第一中间无源光学路由元件540a在第三输入端口i3处从第二中间无源光学路由源540b接收输入,并且第二中间无源光学路由元件540b在第一输入端口i1处从第一中间无源光学路由元件540a接收输入。

因此,在图5的实施例中,每个服务器群组被连接至中间无源光学路由元件540a-b中的一个的输入端口。此外,上无源光学路由元件170被连接至中间无源光学路由元件540a-b中的每一个的输入端口。中间无源光学路由元件540a-b每个被连接至中间无源光学路由元件540a-b中的另一个的输入端口。

在图5的布置中,每个中间无源光学路由元件540a-b具有连接至两个服务器群组110a-d的相应输入端口、连接至上无源光学路由元件170的输入端口和连接至中间无源光学路由元件540a-b中的另一个的输入端口。

每个中间无源光学路由元件540a-b具有连接至服务器群组110a-d的两个输出端口;连接至输出端口的服务器群组110a-d不同于连接至输入端口的服务器群组110a-d。每个中间无源光学路由元件540a-b还具有连接至上无源光学路由元件170的输出端口和连接至中间无源光学路由元件540a-b中的另一个的一个输出端口。

在图5的实施例中,第一中间无源光学路由元件540a具有分别地连接至第三110c和第四110d服务器群组(不同于连接至第一中间无源光学路由元件540a的输入端口的第一110a和第二110b服务器群组)的输出端口o1、o4。第一中间无源光学路由元件540a还具有连接至上无源光学路由元件170的输出端口o3和连接至第二中间无源光学路由元件540b的输出端口o2。

同样地,第二中间无源光学路由元件540b具有分别地连接至第一110a和第二110b服务器群组(不同于连接至第二中间无源光学路由元件540b的输入端口的第三110c和第四110d服务器群组)的输出端口o1、o4。第二中间无源光学路由元件540b还具有连接至上无源光学路由元件170的输出端口o3和连接至第一中间无源光学路由元件540a的输出端口o2。

图6图示出图5的布置中的输入信号到第一和第二中间无源光学路由元件540a-b中的输出端口的路由。

图6示出了到相应端口的波长输入以及相应输出。下标指示波长,并且上标指示输入端口。请注意,第二中间无源光学路由元件540b的输入端口在图6中被示为在左侧,但是在图5中在右侧。用连接输入端和输出端的线示出了信号通过中间无源光学路由元件540a、540b的示意性路径。使用不同线型来表示每个波长,用实线示出了λ1,用短划线示出了λ2,用点线示出了λ3,并且用具有短的密集短划的线示出了λ4。在图6中在对应于每个波长的输入列下面指示表示该波长的线型。

每个输出端口处的信号取决于信号的波长(下标)和接收到该信号处的输入端口(上标)。例如,在第一中间无源光学路由元件540a的输入端口i1处接收到的波长1的信号表示为λ11并在输出端口o1处输出。同样地,在输入端口i3处接收到的波长2的信号表示为λ23并在输出端口o4处输出。根据图6的布置,每个输出端口与四个不同的输入信号相关联,每个输入信号表示波长和输入端口的特定、唯一组合。每个输出端口与来自每个输入端口的一个信号相关联,每个信号与不同波长相关联,使得输出端口处的四个信号中的每一个处于不同波长,并且与不同于该输出端处的其它信号的输入端口相关联。因此,针对任何输出端口,在关联输出信号中不存在重复下标且不存在重复上标。

针对图6中的每个输入端口,四个不同波长(或者等价地频率)的输入信号被路由到相应的不同输出端口。

图5和图6中的布置允许仅使用n个不同波长对n+1个信号目的地进行寻址,其中n在本示例中为4。这是可能的,因为信号的源不需要对其本身进行寻址。在这里,将信号的源和目的地视为服务器群组110a-d和上无源光学路由元件170(或者上光学通信路径180和光学组件300,超过上无源光学路由元件170)。

例如,为了从第一服务器群组110a向第二服务器群组100b发送信号,第一群组110a中的发送服务器应调谐至波长2。这将经由第一下无源光学路由元件120a在第一中间无源光学路由元件540a的第一输入端口i1处被接收到,对应于λ21。如从图6可以看到的,这是从第一中间无源光学路由元件540a的输出端口o2输出的,并且然后被路由到第二中间无源光学路由元件540b的输入端口i1,对应于λ21。该信号然后被从第二中间无源光学路由元件540b的输出端口o4输出,并且然后经由第二下光学路由元件120b传递至第二服务器群组110b。

作为另一示例,第一群组110a中的服务器可以通过调谐至波长3与光学组件330通信。这将在输入端口i1处被第一中间无源光学路由元件540a接收到,对应于λ31,并且将从输出端口o3显现。从输出端o3,信号被路由到上无源光学路由元件170,并且经由上光学通信路径180到光学组件300上。

表1图示出根据图5和图6的布置的用来从源向目的地发送信号的波长。使用粗体下划线来指示通过第一和第二中间无源光学路由元件540a-b两者的路线。在本实施例中,每个群组间路径包括中间无源光学路由元件540a-b中的至少一个。此外,在本实施例中,只有当源和目的地是两者被连接至同一中间无源光学路由元件540a-b的输入端的服务器群组110a-d时路线才通过中间无源光学路由元件540a-b两者(例如,第一和第二服务器群组110a、110b两者被连接至第一中间无源光学路由元件540a的输入端,并且从第一服务器群组110a至第二服务器群组110b或者相反的信号通过中间无源光学路由元件540a-b两者)。

表1

相应下无源光学路由元件120a-d与上无源光学路由元件170之间的光学路径称为下光学通信路径130a-d。在图5中,标记了最接近相应下无源光学路由有元件的下光学通信路径130a-d的部分,但是该路径还包括中间无源光学路由元件540a-b(在图5的实施例中,在每个下光学通信路径130a-d中存在一个中间无源光学路由元件540a-b)以及下无源光学路由元件130a-d、中间无源光学路由元件540a-b与上无源光学路由元件170之间的连接和中间光学元件。因此,某些元件(诸如中间无源光学路由元件540a-b)可以在两个或更多下光学通信路径130a-d之间被共享。

根据图5的布置可以提供每个服务器群组110a-d与上无源光学路由元件170之间的相应通信路径。在以分级方式连接在上光学路由元件170之上的光学组件300是olt卡或类似开关组件的情况下,可以经由上无源光学路由元件170和光学组件300来提供附加群组间通信路径。因此,在某些实施例中,可以经由光学组件300(例如olt交换机)或者在基于目的地服务器的位置选择波长以用于传输的情况下直接地通过(一个或多个)中间无源光学路由元件来提供机架间通信。替换路线(例如经由olt交换机)促进高业务负荷下的多路径路由和负荷平衡,这可以是有利的,尽管有与经由olt交换机的路由相关联的延迟和功率消耗。

在图5的布置中,上无源光学路由元件170可以是awgr。

可以提供mac以向服务器群组110a-d中的服务器分配资源以避免中间无源光学路由元件540a-b中的冲突。

可以用任何适当方法来促进群组内通信。无源方法提供较低功率消耗,但是还可以使用非无源方法。可以将相对于图3a、图3b和图3c所述的布置用于图5的布置中的群组内通信。

在光学组件300是olt交换机(例如,连接至其它光学网络)的情况下,可以在无源网络之间再使用波长,因为连接至第一olt端口的第一网络中的光信号不会被直接地传递至连接到第二olt端口的第二网络。

在根据图5的实施例的某些示例中,每个服务器群组110a-d可以是机架或服务器。

图5和图6的描述涉及具有四个不同波长、四个服务器群组110a-d和两个中间无源光学路由元件540a-b的特定实施例。然而,具有更多或更少波长、服务器群组110a-d和/或中间无源光学路由元件540a-b的其它布置是可能的。同样地,中间无源光学路由元件540a-b的输入和输出端口的数目可以大于四个或少于四个,并且在中间无源光学路由元件540a-b之间可以不同。图7a和7b图示出使用附加波长且具有附加服务器的实施例。

图7a图示出其中每个服务器被布置成使用八个不同波长以允许八个服务器群组110a中的服务器以及上无源光学路由元件170之间的通信的网络。组件类似于图5中的那些,并且在这里并未再次详细描述。可以仅使用无源光学路由元件来实现图7a中的各群组之间的信号的路由。

如图5中所示,图7a的布置包括两个中间无源光学路由元件540a-b,其中的每一个具有八个输入端口(标记为i1至i8)和八个输出端口(标记为o1至o8)。第一中间无源光学路由元件540a具有与四个相应服务器群组110a-d相连的四个输入端口、与上无源光学路由元件170相连的一个输入端口和与第二中间无源光学路由元件540b的输出端口相连的三个输入端口。第一中间无源光学路由元件540a具有与四个相应服务器群组110e-h(不同于连接至输入端口的服务器群组110a-d)相连的四个输出端口、与上无源光学路由元件170相连的一个输出端口和与第二中间无源光学路由元件540b相连的三个输出端。

第二中间无源光学路由元件540b与第一中间无源光学路由元件540a同样地布置,具有与相应服务器群组110e-h(与第一中间无源光学路由元件540a的输出端口相连的服务器群组)相连的四个输入端口以及与相应服务器群组110a-d(与第一中间无源光学路由元件540a的输入端口相连的服务器群组)相连的四个输出端口。第二中间无源光学路由元件540b还具有与上无源光学路由元件170相连的一个输入端和一个输出端及与第一中间无源光学路由元件540a相连的三个输入端和三个输出端。

图7b图示出图7a的布置中的输入信号到第一和第二中间无源光学路由元件540a-b中的输出端口的路由。类似于图6,图7b示出了到相应端口的波长输入以及相应输出端口。下标指示波长,并且上标指示输入端口。第二中间无源光学路由元件540b的输入端口在图7b中被示为在左侧,但是在图7a中在右侧。

表2图示出根据图7a和图7b的布置的用来从源向目的地发送信号的波长。使用粗体下划线来指示通过第一和第二中间无源光学路由元件540a-b两者的路线,粗体双下划线指示通过第一和第二中间无源光学路由元件540a-b超过一次的路线。在本实施例中,每个群组间路径包括中间无源光学路由元件540a-b中的至少一个。此外,在本实施例中,只有当源和目的地是两者被连接至同一中间无源光学路由元件540a-b的输入端的服务器群组110a-h时路线才通过中间无源光学路由元件540a-b两者(例如,第一和第二服务器群组110a、110b两者被连接至第一中间无源光学路由元件540a的输入端,并且从第一服务器群组110a至第二服务器群组110b或者相反的信号通过中间无源光学路由元件540a-b两者)。

表2

与图5类似,用120a-h来指示下无源光学路由元件,并且将下无源光学路由元件120a-h与中间无源光学路由元件540a-b之间的连接标记为530a-h。为了明了起见,在图7a中未示出下光学通信路径130。

如在图5的实施例中一样,可以在到下无源光学路由元件120a-h的输入端处使用无源隔离器,但是为了明了起见在图7a处未示出。

图8图示出根据另一实施例的布置700。根据所示的此布置,提供了用于连接至相应服务器的十二个光学端口群组110a-1、110a-2、110b-1、110b-2、110c-1、110c-2、110d-1、110d-2、110e-1、110e-2、110f-1、110f-2。在本文中,将所有这些参考符号一起缩写为110x-y,使得在图8中所示的布置中,x∈{a,b,c,d,e,f}且y∈{1,2}。对图8的其它参考符号使用类似缩写。每个端口群组与相应下无源光学路由元件120x-y相关联。下无源光学路由元件120x-y被连接至路由服务器730x。在图8的布置中,两个下无源光学路由元件120x-y被连接至每个路由服务器730x(与其相关联)。连接至同一路由服务器的下无源光学路由元件120x-y形成一组下无源光学路由元件120x-y,并且类似地,相应服务器群组110x-y形成服务器群组集合110x-y(在本文中也称为服务器集合)。

在下无源光学路由元件120x-y中的每一个与关联路由服务器730x之间,可以提供光纤布拉格光栅720x-y(在本文中,服务器与其经由相应下无源光学路由元件120x连接到的路由服务器730a“相关联”,因此群组110a-1和110a-2中的服务器与图8中的路由服务器730a相关联)。如相对于图3b所述,fbg反射特定波长(或窄波长范围)的光并允许其它波长的光通过。被fbg反射的光被透射到与发送服务器同一群组中的每个服务器。因此,fbg在不使用路由服务器730x的情况下(即,在不经由路由服务器730x来路由信号的情况下)允许群组内通信,其可以减少路由服务器730x上的负担。

由于被fbg720x-y反射的波长仅被与发起服务器同一群组中的服务器接收到,并且不会传播到群组之外或进入其它群组,所以可以将同一波长用于所有群组。这允许针对所有服务器的收发机的简化且统一的设计。可以将同一波长用于发送和接收,因为其对于反射波长而言是单向通信。

可以将替换布置用于群组内通信,诸如相对于图3a或图3b描述的布置。在光学元件300是开关元件的情况下,可以另外或替换地经由上无源光学路由元件170和光学元件300来路由群组内通信。然而,这将增加光学元件300上的负担,并且将增加下无源光学路由元件120x和上无源光学路由元件170之间的网络上的业务。

针对群组间通信,服务器向关联路由服务器730x发送消息以获得使用群组间通信波长的许可,以避免冲突并管理关于信道接入的竞争。路由服务器730x从其与之相关联的服务器接收控制消息。控制消息指定发送控制消息的服务器想要连接到的目的地。路由服务器730x装配有可调谐发送机以将其它服务器群组110x-y连接至上无源光学路由元件170(经由与目的地服务器群组110x-y相关联的路由服务器730x)。路由服务器还可以在其与之相关联的服务器群组110x-y之间传递信号(例如路由服务器730a可以在群组110a-1和110a-2中的服务器之间传递信号)。

群组间通信通过服务器经由下无源光学路由元件120x以及fbg720x-y向与该服务器的群组相关联的路由服务器730x发送信号实现。该信号被以由fbg720x-y透射的波长发送,以便到达路由服务器730x处。路由服务器接收信号并将其重传至与路由服务器730x相关联的中间无源光学路由元件740x(可能具有例如对报头或地址字段等的改变)。中间无源光学路由元件740x可以基于信号的波长来路由从路由服务器730a接收到的信号。中间无源光学路由元件740x可以是awgr。

在图8的布置中,每个路由服务器730x具有一个关联中间无源光学路由元件740x,但是在其它实施例中,每个路由服务器可以与多个中间无源光学路由元件740x相关联,或者多个路由服务器730x可以与单个中间无源光学路由元件740x相关联。

中间无源光学路由元件740x中的每一个被连接至每个其它中间无源光学路由元件740x,并且另外连接至上无源光学路由元件170。在图8中,使用不同线型示出了中间无源光学路由元件740x与上无源光学路由元件170之间的连接以改善清晰度;不同线型的使用不具有任何特定意义。由中间无源光学路由元件740x从关联路由服务器730x接收到的信号基于信号的波长被路由。因此,在图8的布置中,每个路由服务器提供有能够产生至少六个不同波长的信号的可调谐激光器,每个波长被关联中间无源光学路由元件740x不同地路由。

由第一中间无源光学路由元件740x发送的信号被另一中间无源光学路由元件740x或上无源光学路由元件170接收到。

在信号的目的地是上光学通信路径180和光学元件300的情况下,路由服务器170x确定与上无源光学路由元件170相关联的波长并经由关联中间无源光学路由元件740x以该波长向上无源光学路由元件170以及向上光学通信路径180和光学元件300上发送信号。例如,针对第一群组110a-1中的服务器与上光学通信路径180之间的通信,下光学通信路径130a-1在下无源光学路由元件120a-1与上无源光学路由元件170之间,并且包括路由服务器730a和中间无源光学路由元件740a。在根据图8的布置的某些实施例中,上无源光学路由元件170可以是awgr。

在信号的目的地是与发送服务器不同的集合中的服务器的情况下,发送服务器经由关联下无源光学路由元件720x-y将信号发送到其关联路由服务器730x。路由服务器730x然后确定与目的地服务器集合相关联的波长,并且经由其关联中间无源光学路由元件740x以该波长向与目的地服务器集合相关联的无源光学路由元件740x发送信号。该信号然后被提供给与目的地服务器集合相关联的路由服务器720x。路由服务器720x然后确定目的地服务器的群组110x-y,并且经由与目的地服务器群组110x-y相关联的下无源光学路由元件720x-y向目的地服务器发送信号。

例如,如果发送服务器在第一群组110a-1中且目的地服务器在第二群组110b-1中,发送服务器经由关联的第一下无源光学路由元件120a-1向关联第一路由服务器730a发送信号。路由服务器730a确定目的地服务器在与第二路由服务器730b相关联的集合中,并且确定向第二中间无源光学路由元件740b发送信号所需的波长。该波长的信号被发送到第一中间无源光学路由元件740a,其基于波长将信号路由到第二中间无源光学路由元件740b,该第二中间无源光学路由元件740b将信号路由到第二路由服务器730b,其确定目的地服务器在第二群组110b-1中,并且经由第二下无源光学路由元件120b-1向第二群组110b-1发送信号。

在信号的目的地是在不同群组、但与发送服务器相同的集合中的服务器的情况下,发送服务器经由关联下无源光学路由元件720x-y将信号发送到其关联路由服务器730x。路由服务器730x然后确定目的地服务器群组110x,并向与目的地服务器群组110x-y相关联的下无源光学路由元件120x-y发送信号。例如,在发送服务器在群组110a-1中且目的地服务器在群组110a-2中的情况下,发送服务器经由关联第一下无源光学路由元件120a-1向关联第一路由服务器730a发送信号。路由服务器730a确定目的地服务器在群组110a-2中并经由关联的下无源光学路由元件120a-2向群组110a-2的服务器发送信号。

路由服务器730x中的每一个可以保持群组和/或集合中的服务器的地址的数据库以及分配给每个集合的波长,以促进向与另一服务器集合相关联的路由服务器730x发送信号。路由服务器730x可以执行波长转换以促进机架间通信。机架间通信可以经由中间无源光学路由元件740x无源地发生(在路由服务器730x之间),因为在图8的布置中的路由服务器730x之间存在全网连接。替换地,可以经由光学元件300来执行机架间通信,其中光学元件300是开关元件,诸如olt交换机。因此,可以提供冗余路由,并且可以改善与网络的各部分的拥塞或故障相关联的问题。

根据某些实施例,每个路由服务器730x被布置成针对每个目的地(即另一路由服务器或上无源光学路由元件)产生相应波长,与每个目的地相关联的波长是不同的。每个目的地将从每个其它信号源(即其它路由服务器或上无源光学路由元件)接收信号。在目的地处接收到的信号的波长对于每个源而言是不同的。表2图示出适合于在图8的布置中的源与目的地之间使用的波长分配的示例,其中将六个波长用于七个源与七个目的地之间的通信,这些波长被指示为1、2、3、4、5和6。其它波长分配也是可能的。此外,可以使用附加波长。

表2

如可以看到的,在图8的布置中,用于不同集合中的服务器之间的群组间通信的通信路径是经由两个中间无源光学路由元件740x。针对同一集合中的两个服务器之间的群组间通信,通信路径是经由与该集合相关联的路由服务器730x,但是不包括任何中间无源光学路由元件740x。针对在一种服务器和所述上无源光学路由元件170之间的通信,所述通信路径包括一个中间无源光学路由元件740x。针对群组内通信,通信路径不包括任何中间无源光学路由元件740x或任何路由服务器730x。

可以为每个服务器群组110x-y分配两个波长,一个用于群组的服务器和与群组110x-y相关联的路由服务器730x之间的上行链路传输且一个用于下行链路传输。路由服务器可以保持群组中的服务器的地址的数据库和分配给每个群组的波长。在某些示例中,每个服务器可以保持路由服务器730x与之相关联的群组110x-y中的服务器的数据库,另外,服务器可以保持其它服务器位于其中的集合的数据库,使得可以向与目的地服务器集合相关联的路由服务器730x发送信号,并且与该集合相关联的路由服务器730x可以负责识别正确群组并将信号转送到正确的群组110x-y。

在某些示例中,服务器群组110x-y中的服务器可以将与其它集合中的服务器相同的一对波长用于服务器与关联路由服务器730x之间的通信。这可以改善服务器群组110x-y之间的均匀性,并且可以导致可用波长的高效使用。在某些示例中,路由服务器730x-y可以针对其与之相关联的每个服务器群组110x-y具有不同的端口,并且在这种情况下,服务器群组100x-y与路由服务器之间的通信可以在与该路由服务器370x相关联的群组集合内的每个群组110x-y中使用同一对波长,因为路由服务器370x与每个服务器群组110x-y之间的网络被光学分离(即光信号不会从一个此类网络传播至另一个)。

在某些实施例中,路由服务器可以周期性地交换其连接的更新和状态以更新其数据库。可以使用上文所述的通信路径(使用或避免上无源光学路由元件170)在路由服务器730x之间交换此类更新。

每个路由服务器可以提供有不同的上行链路(输出)和下行链路(输入)通信路径。上行链路和下行链路通信路径可以具有类似或基本上相同的布置。例如,中间无源光学路由元件740x可以包括两个awgr,一个用于上行链路通信且一个用于下行链路通信。

还可以以超集来布置服务器集合,并且图8的布置示出了超集710a、710b、710c,每个具有两个服务器集合(即四个服务器群组110x-y)。在图8的布置中,以超集710a、710b、710c布置服务器在示意性层级不影响服务器与服务器群组之间的连接,但是可以便于在物理上布置服务器。例如,每个超集可以对应于服务器机架。在以超集来布置服务器集合的情况下,每个超集中的集合的数目不受特别限制。

在图8的布置中,每个服务器集合包括两个服务器群组110x-y,但在每个集合中可以包括更多或更少的服务器群组。

根据图8的布置的实施例可以通过使用路由服务器730x来管理群组间通信而允许减少可调谐激光器的数目。

出于群组内通信的目的,每个群组110x-y可以是包括n个服务器的tdmpon,其中,n是用于tdmpon的分割比。根据示例性实施例,每个服务器群组110x-y可以包括八个服务器,并且每个集合可以包括两个群组110x-y。此外,每个超集可以包括两个集合。在此类布置中,超集包括32个服务器。在超集具有机架的情况下,每个机架将包括32个服务器。

在另一示例中,每个集合中的群组的数目可以是两个,并且超集每个仅具有一个集合(即集合和超集是相同的)。在每个群组具有18个服务器的情况下,结果再次地将是32个服务器的超集,仅一个路由服务器730x与每个超集相关联。再次地,在超集对应于机架的情况下,结果将是32个服务器的机架。相对于在每个超集中具有两个集合且在每个群组中具有四个服务器的示例,此布置可以导致布线复杂性的降低和组件(诸如中间无源光学路由元件)数目的减少,但是可以导致路由服务器730x上的增加的负荷。在其它实施例中,每个机架可以具有更多或更少的服务器。

在某些示例中,每个群组具有相同数目的服务器,每个集合具有相同数目的群组且每个超集具有相同数目的集合。此类布置改善了网络中的均匀性。然而,在其它实施例中,群组集合和超集可以具有变化数目的服务器/群组/集合。

在可以置于每个群组/集合/超集中的服务器的数目的上述示例中,路由服务器730x未被计算在服务器的总数内。路由服务器730x可以是本质上仅执行路由操作的专用装置。然而,在其它布置中,路由服务器730x可以执行其它功能,并且在某些实施例中,除执行上文所述的路由功能之外,路由服务器730x还执行与群组110x-y中的服务器类似的功能。

根据图8的实施例,服务器群组110x-y中的每个服务器只需要产生两个波长,一个用于下行链路且一个用于下行链路。这可以通过不要求能够在群组110x-y中的服务器处以超过两个波长进行发射的可调谐激光器而允许降低成本。

图9示出了另一实施例。根据图9的实施例,提供了光学端口/服务器的两个或更多个集合810a-d。在图9中图示出端口/服务器的四个集合810a-d。每个集合包括端口/服务器的两个或更多群组110a-d、820a-d、830a-d、840a-d,在图9中每个集合中四个群组。在第一服务器集合810a中提供了第一服务器群组110a。在图9的布置800中,在第一服务器集合中提供了三个附加服务器集合820a、830a、840a。同样地,在第二服务器集合810b中提供了第二服务器群组110b。在图9中的第二服务器集合810b中还示出了三个附加服务器集合820b、830b、840b。

根据图9的实施例,提供了集合内通信路径370a-d。集合内通信路径370a-d允许同一集合内的任何一对服务器之间的通信。该对服务器可以是在同一群组中或者在同一集合内的不同群组中。以下描述假设集合内通信路径370a-d是光学背板,例如图3c中所示。然而,其它布置是可能的,例如可以使用图3a的布置来实现集合内通信。在某些实施例中,还可以将集合内通信路径370a-d用于群组内通信。在某些实施例中,可以提供单独的群组内通信路径。例如,可以使用光学背板来执行集合内通信(如在图3c中),并且群组内通信可以另外或替换地利用星形反射器或fbg(如在图3a和图3b中)。

第一服务器群组110a通过数据连接111a而光学连接至第一下无源光学路由元件120a。第一下无源光学路由元件120a通过第一下光学通信路径130而连接至上无源光学路由元件170。上无源光学路由元件170被光学连接至上光学通信路径180。因此,可以经由数据连接111、第一下无源光学路由元件120a、第一下光学通信路径130和上无源光学路由元件170在上光学通信路径180与第一服务器群组中的服务器之间发送光信号。同样地,第二服务器群组110b通过数据连接、第二下无源光学路由元件120b、第二下光学通信路径130b和上无源光学路由元件170而光学连接至上光学通信路径180。提供了将第三和第四服务器群组110c和110d与上光学通信路径180相连的类似布置。提供到上光学通信路径180的链路的服务器群组110a-d在本文中可以称为外部链接服务器群组,因为其允许与以分级方式在上无源光学路由元件170下面的网络蜂窝外面的网络元件通信。

外部链接服务器群组110a-d中的每一个与上光学通信路径180之间的通信路径可以与相对于图1所描述的那个类似。

根据某些实施例,到/来自上无源光学路由元件170的信号可以具有相同波长,使得该波长并不取决于作为信号的源或目的地的服务器群组。在某些布置中,上无源光学路由元件170可以是星形耦合器和/或星形分离器。可以使用tdm在上光学通信路径180与外部链接服务器群组110a-d之间载送信号。根据此类布置,可以使用两个波长,一个用于来自服务器的上行链路且一个用于到服务器的下行链路,对所有服务器集合810a-d使用相同波长。

根据某些实施例,由上无源光学路由元件170接收到的信号可以具有取决于发送信号的外部链接服务器群组110a-d的波长。亦即,每个外部链接服务器群组可以在向上无源光学路由元件170发送信号时使用不同的光波长。同样地,从上光学通信路径180到达上无源光学路由元件170的信号可以具有取决于目的地服务器群组110a-d的波长。在某些布置中,上无源光学路由元件170可以基于信号的波长而无源地路由信号。在某些实施例中,上无源光学路由元件170可以是awgr。在此类布置中,可以使用wdm在上光学通信路径180与外部链接服务器群组110a-d之间载送信号。这可以导致可用带宽的增加。根据此布置,可以将两个不同波长用于每个集合810a-d(图9的布置中的8个波长),针对每个集合810a-d,一个波长被用于上行链路且一个用于下行链路。根据某些实施例,某些外部链接服务器群组110a-d可以在经由上无源光学路由元件170进行通信时利用同一波长,而其它外部链接服务器群组110a-d可以利用不同的波长,亦即,某些波长可以在外部链接群组110a-d之间被共享。在此类实施例中,可以使用wdm和tdm的混合体。

第一下无源光学路由元件120a可以将来自第一群组110a中的每个服务器的信号组合并沿着第一下光学通信路径130a路由信号。第一下无源光学路由元件120a可以是星形耦合器。同样地,由第一下无源光学路由元件120a从第一下光学通信路径130a接收到的信号可以被路由到第一服务器群组110a中的每个服务器,并且在某些实施例中,第一下无源光学路由元件120a可以是星形分离器。第二、第三和第四下无源光学路由元件120b-d可以类似于第一下无源光学路由元件120a。

根据某些布置,第一、第二、第三或第四服务器群组110a-d中的服务器与上光学通信路径180之间的通信可以是完全无源的。

根据图9的布置,每个服务器集合810a-d中的一个服务器群组110a-d具有到/来自上光学通信路径180的通信路径。其它服务器群组820a-d、830a-d、840a-d(在本文中称为集合链接群组)提供集合间通信路径850ab、850ac、850ad、850bc、850bd、850cd(在本文中共同地称为850xy)。

每个集合链接群组820a-d、830a-d、840a-d与不同服务器集合810a-d中的另一集合链接群组820a-d、830a-d、840a-d光学相连。例如,第一服务器集合810a中的集合链接群组820a被链接至第四服务器集合810d中的集合链接群组840d。这些集合链接群组中的服务器之间的连接是经由数据连接821a、集合连接无源光学路由元件822a(与服务器群组820a相关联)、集合间光学通信路径850ad、另一集合链接无源光学路由元件(与服务器群组840d相关联)以及群组840d的单独服务器和与群组840d相关联的集合链接无源光学路由元件之间的数据连接。因此,集合链接群组820a被与集合链接群组840d链接。成对的已链接集合链接群组之间的通信可以是无源光学通信。

同样地,在图9的布置中,第一服务器集合810a中的集合链接群组830a被与第三服务器集合810c中的集合链接群组830c链接,并且第一服务器集合810a的集合链接群组840a被与第二服务器集合810b中的集合链接群组820b链接。

集合链接服务器群组中的集合链接无源光学路由元件和数据连接的布置可以类似于第一服务器群组110a的下无源光学路由元件110a和数据连接111a的布置,集合间通信路径850xy连接不同集合中的一对集合链接无源光学路由元件,而不是连接下无源光学路由元件120a-d和上无源光学路由元件170。集合链接无源光学路由元件822a可以是星形耦合器。

根据某些实施例,针对任何一对服务器集合810a-d,在被链接的成对集合810a-d中的每个集合810a-d中存在至少一个集合链接群组850xy,使得针对每一对服务器集合810a-d存在相应链路。

根据图9的布置,每个服务器集合810a-d经由相应集合间通信路径850xy和与集合间通信路径850xy相关联的相应的一对集合链接群组而链接至每个其它服务器集合810a-d。根据某些实施例,可以经由连接至上通信路径180的开关元件来提供用于集合间通信的替换路径。

根据图9的布置,来自第一集合810a中的第一服务器群组110a和第二集合810b中的第二服务器群组的通信可以通过第一群组110a中的发送服务器经由集合内通信路径370a向被链接至第二集合810b的第一集合810a(即第二集合中的集合链接群组820b)中的集合链接服务器群组840a中的服务器发送信号来执行。该信号被群组840a中的服务器接收到,并且服务器经由集合间通信路径850xy将该信号重传到第二集合的群组820b中的服务器。该信号是经由与该群组840a相关联的数据连接和集合链接无源光学路由元件、集合间通信路径850ab以及链接无源光学路由元件及与第二服务器集合810b中的群组820b相关联的数据连接发送的。信号经由第二服务器集合810b的集合内通信路径370b被重传到第二群组110b中的目的地服务器。同样地,可以使用类似方法从第一集合810a的第一群组110a中的服务器向第二集合810b的任何群组110b、820b、830b或840b中的任何服务器发送信号,但是改变第二集合810b的集合内通信路径730b上的寻址。在目的地服务器是在群组820b中的情况下,可以使用相同的路由,但是可以不需要第二集合810b的集合内通信路径370b的使用,其中目的地服务器能够直接地从与群组820b相关联的集合链接无源光学路由元件接收信号。在信号的源是链接群组820a或830a中的服务器的情况下可以使用类似方法。在信号的源是链接群组840a中的服务器的情况下,可以使用相同方法,但是可以不需要利用第一群组的集合内通信路径370a。可以使用类似方法来提供任何不同集合810a-d中的任何一对服务器之间的通信路径。

在图9的布置中,每个集合810a-d中的群组110a-d、820a-d、830a-d、840a-d的数目等于集合810a-b的数目;在每个集合中存在一个外部链接群组110a-d,并且其余群组是集合链接群组820a-d、830a-d、840a-d。每个集合链接群组820a-d、830a-d、840a-d被链接至不同集合810a-d中的一个其它集合链接群组820a-d、830a-d、840a-d。使用与具有与目的地服务器的集合810a-d的直接连接的源服务器相同集合810a-d的集合链接群组820a-d、830a-d、840a-d中的服务器来执行来自不具有与目的地服务器的集合810a-d的直接连接的服务器的集合间通信。

在服务器从同一集合中的另一服务器接收到信号并将信号重传到集合外面(例如到不同集合或者到上无源光学路由元件)或者相反(其中从集合外面接收信号并重传到与重传服务器同一集合内的另一服务器)的情况下,重传服务器充当中继器。从群组110a-d、820a-d、830a-d、840a-d内进行的中继服务器的选择可以是基于群组110a-d、820a-d、830a-d、840a-d内的服务器利用率或业务负荷。

根据某些实施例,每个服务器集合可以包括4个服务器群组,并且每个服务器群组110a-d、820a-d、830a-d、840a-d可以包括8个服务器。在某些实施例中,每个服务器集合810a-d可以对应于服务器机架。

在根据图9的某些实施例中,可以消除使服务器具有可调谐激光器的需要。特别地,每个服务器可以使用单个波长进行通信(针对经由其关联下无源光学路由元件120a-d或集合链接无源光学路由元件发送的信号)。针对经由集合内通信路径370a-d的集合内通信可能需要附加激光器。根据某些实施例,此附加激光器可以是单波长激光器。因此,实施例可以通过避免或减少昂贵的可调谐激光器的使用而导致降低的成本。

根据图9的布置的实施例可以促进服务器集合810a-d之间的高速互连。

根据某些实施例,被链接的集合链接群组中的服务器之间的通信路径可以是完全无源光学通信路径。根据某些实施例,外部链接群组中的服务器与上无源光学路由元件之间的通信路径可以是完全无源光学通信。

图9的实施例包括四个服务器集合和每个集合中的四个服务器群组,但是其它布置是可能的。

根据某些实施例,可以在某些或所有集合中提供一个或多个非链接服务器群组。非链接服务器群组被布置成经由集合内通信路径370a-d与同一集合中的其它服务器群组通信,但是未被链接至其它服务器集合810a-d或上无源光学路由元件170。非链接群组中的服务器可以通过经由集合内通信路径370a-d将通信路由到集合链接群组或者与非链接群组同一集合中的外部链接群组来与其它集合810a-d中的服务器或上无源光学路由元件170通信。

根据某些实施例,集合内的多个群组可以与同一目的地(例如另一集合810a-d或上无源光学路由元件180)链接。这可以例如改善路由的冗余并减少拥塞的影响。

根据某些实施例,某些集合未被链接到所有集合。例如,在图9的布置中,可以省略集合间通信路径850ad、850ac和850bd(还可以省略连接至这些通信路径的服务器群组820a、830a、830b、830c、830d、840d)。在这种情况下,可以经由除源和目的地集合之外的各集合来路由通信。例如,可以经由群组840a、820b、840b、820c和840c来路由从第一集合810a中的群组110a到第四集合810d中的群组110d的信号,利用集合内通信路径370a-d和其余集合间通信路径850ab、850bc、850cd。同样地,在某些实施例中,一个或多个集合可能不具有与上无源光学路由元件170的直接链路,经由具有外部链接群组的集合来路由此类集合与上无源路由元件170之间的通信。

图10图示出根据某些实施例的布置,特别地,图10示出了适合于在具有许多子网络或蜂窝910的数据中心网络中使用的系统,子网络910中的至少一个具有如相对于图1至图9所述的结构。

在图10的布置中,提供了多个子网络910。子网络910可以是光学网络,并且可以包括无源光学网络和/或具有无源和有源组件的混合体的网络。在图10中,为了明了起见,示出了连接至仅一个olt卡920的子网络。然而,子网络可以是连接至每个olt卡920。

子网络910可以经由上光学通信路径180连接至olt卡920的olt端口925。可以在olt交换机900中提供多个olt卡920。可以将olt卡布置在许多机箱930中,在每个机箱930中具有多个olt卡920。olt卡可能能够与同一机箱930中的其它olt卡且与同一olt交换机900中的其它机箱中的olt卡通信。此外,olt交换机还可以促进与其它olt交换机的通信。

图10的olt交换机900可以具有与在光纤到家、路边或宅基地接入网中使用的olt交换机类似的结构。

根据某些实施例,每个olt卡920具有8个olt端口925,每个olt端口被连接至光学子网络或蜂窝910。每个olt机箱可以包含16个olt卡,并且olt交换机可以包括8个机箱。在每个子网络中具有128个服务器的布置中,每个olt交换机连接131,072个服务器。因此,在此类布置中,5个olt交换机足以连接655,360个服务器。

根据某些实施例,每个olt端口可以提供达到10gb/s的传输速率。用128的分割比,单个此类卡端口可以连接128个服务器,并且一个卡可以连接1024个服务器。根据此类布置,16个olt卡的单个机箱可以提供到16,384个服务器的连接。

在某些应用中,在128个服务器之间共享10gb/s端口速率可能为服务器中的某些提供不足的容量。在这种情况下,可以将架构布置成使得较少的服务器共享每个端口的带宽。这可以要求更大数目的olt卡。在较低的活动比下,光学网络协议可以执行弹性带宽分配以满足业务突发的需要。在某些布置中,可以将数据中心负荷分布在不同子网络之间以实现负荷平衡,或者可以在较少的子网络中合并以通过甩电力而允许省电,例如响应于长期的每日负荷变化,后面是响应于在几小时/分钟内的较短不活动时段的睡眠。

图10的布置可以用来提供大型连接,并且可以适合于各种应用中的数据中心(诸如云估计),以便递送服务,诸如基础设施即服务(iaas)、平台即服务(paas)以及软件即服务(saas)。

图10的布置可以用来减少或消除对接入和聚合交换机的需要,这可以导致功率消耗的减少。图10的布置还可以提供服务器之间的资源分配和互连速度方面的良好性能。

图11图示出图7a的布置,但是示出了连接元件530的结构的示例。根据图11的布置,经由上行链路下无源光学路由元件121a-h来路由从服务器群组110至中间无源光学路由元件540的信号,并且经由下行链路下无源光学路由元件122a-h来路由从中间无源光学路由元件540至服务器群组110的信号。上行链路下无源光学路由元件121a-h中的每一个可以是星形分离器。下行链路下无源光学路由元件122a-h中的每一个可以是星形耦合器。可以将上行链路下无源光学路由元件121a-h和下行链路下无源光学路由元件122a-h视为下无源光学路由元件120a-h的组件。

图11的布置中的到第一和第二中间无源光学路由元件540a-b中的输出端口的输入信号的路由可以如图7b中所示。这将导致表2的路由表。

根据依照图11的某些示例,八个服务器群组110a-h中的每一个可以包括8个服务器,使得蜂窝912具有64个服务器。在蜂窝912中也具有64个服务器的根据图5的布置的示例将在四个服务器群组中的每一个中要求16个服务器(假设每个群组中的服务器数目相同)。图11的布置中的此相对较大的群组数目减少了每个群组110中的竞争资源的服务器的数目,并且因此可以减少用于点到点蜂窝内通信的每个波长过度订阅。

可以使用混合整数线性规划(milp)模型来优化图11中描绘的架构中的无源光学路由元件的互连。根据某些示例,蜂窝912由布置成8个服务器群组的64个服务器组成。图11呈现了从milp模型获得的针对具有用于8个服务器群组的可调谐激光器的蜂窝912的结构互连设计,图7b示出了针对中间无源光学路由元件540a-b(例如awgr)互连获得以实现波长路由和分配的配置,并且表2示出了用于群组间和群组至光学组件300通信的波长分配表。

根据波长路由表,如果第一群组110a中的服务器将与第四群组110d中的服务器通信,则使用通过第一中间无源光学路由元件540a从输入端口1路由到输出端口5的波长1向光学组件300(例如olt交换机)发送控制消息。此输出端口(经由上无源光学路由元件170)与光学组件300相连。如果请求得到许可,则光学组件300用分别地使用波长4和5到第一服务器群组110a和第四服务器群组110d的控制消息进行回复。第四群组110d中的目的地服务器将其接收机调谐至波长2以从第一群组110a中的源服务器接收数据。作为默认,可以将空闲服务器调谐至将其与olt相连的波长。

图12图示出根据某些示例的服务器群组110与光学元件300(例如olt)之间的连接。可以经由连接为clos拓扑的2层的无源路由元件175、177(诸如awgr)来建立连接。为了避免与示出许多链路相关联的复杂性,图12示出了从蜂窝912到公共无源路由元件177(例如上无源路由元件170)的上行链路连接而未示出蜂窝912的细节。图12示出了下层无源光学路由元件177与光学元件300之间的上行链路连接;可以将类似布置用于下行链路连接。本示例假设每个蜂窝912与图11中所示的蜂窝912相对应,然而,可以使用其它蜂窝912布置,诸如相对于图1至图9描述的任何其它布置。应注意的是蜂窝912不同于图10的蜂窝910,因为蜂窝912不包括上无源光学路由元件170。图12的布置允许提供丰富的连接。在服务器装配有可调谐激光器的情况下,设计可灵活地允许服务器通过将其收发机调谐至适当波长来加入任何olt端口。

根据某些示例,可以经由光学元件300(例如olt)来协调所有通信。具有需求的服务器将请求控制消息连同目的地地址和资源要求一起发送到光学元件300。如果光学元件300许可该请求,则其用选通消息答复源和目的地服务器,将两个服务器需要调谐到的波长分配和时隙告知服务器。最初,可以将所有服务器的发送机和接收机调谐至将其与光学元件300相连的指定波长。每个服务器的网络接口卡可以装配有分别地用于波长检测和选择的固定已调谐接收机阵列和可调谐激光器。用于蜂窝912中的每个服务器的固定翼调谐接收机的数目可以由服务器群组的数目和连接蜂窝912的光学元件300的端口的数目的控制。到下层无源路由元件177中的每一个的输入端口的数目可以等于来自蜂窝912的输出的数目。来自下层无源路由元件177中的每一个的输出端口的数目可以等于相应蜂窝912(经由上层无源路由元件175)被连接到的光学组件300的数目。每个上层175无源路由元件可以具有与每个蜂窝912被连接到的光学组件300端口的数目相等的数目的输入端口。同样地,每个上层175无源路由元件可以具有与每个蜂窝912被连接到的光学组件300端口的数目相等的数目的输入端口。针对图12中所示的特定布置,如果我们考虑到8个光学组件300端口的连接和具有最多8个服务器群组的蜂窝912,则8×8awg将足够了。

在蜂窝921内,可以经由光学组件300或者直接地经由蜂窝内通信路径(例如经由图11的布置中的中间无源路由元件540a-b)来提供群组间通信,其中可以基于目的地服务器的位置来选择用于传输的波长。替换路线促进高业务负荷下的多路径路由和负荷平衡,然而,在可能的情况下可以避免通过光学组件300来转送业务,以减少延迟和功率消耗。服务器可以通过基于波长路由映射表将其收发机调谐至适当波长来与其它群组110中的服务器通信。此设计类似于蜂窝无线网络,因为可以再使用波长来连接被连接至光学组件300的不同端口的其它服务器群组110。

图12的布置提供灵活性,这可以允许服务器加入光学元件300的不同端口。这可以增强资源供应方面的性能。然而,根据某些示例,所有服务器装配有可调谐收发机,这可以增加成本。

根据图12的布置可以是具有将相互通信的n+k个实体(n个服务器群组110和光学组件300的k个端口)的波长路由网络(wrn)。针对图12中描绘的特定布置,并且在每个蜂窝912如11中所示的情况下,k=4且n=8,并且因此可以使用n+k-1=11个(不同)波长。在这种情况下,下层和上层光学路由元件177和175之间的每个连接可以载送8个不重叠的(不同)波长。同样地,上层光学路由元件175和光学组件920之间的每个连接可以载送8个不重叠波长。上层光学路由元件175与光学组件920之间的每个连接可以在光学组件920的不同端口处终止。可以使用milp模型来确定(例如优化)不重叠波长的分配。

在其中蜂窝912是根据图11的布置的图12的布置的某些示例中,可以将蜂窝912布置成使用超过八个波长,使得针对每个服务器群组,多个波长将指向关联的下层光学路由元件177。在这种情况下,可以用由服务器群组发送的波长来控制下层光学路由元件与光学组件920之间的信号的路由。

接入网中的当前无源光学网络(pon)(例如,如j.baliga、r.w.a.ayre、w.v.sorin、k.hinton以及r.tucker在opticalfibercommunication/nationalfiberopticengineersconference,2008.ofc/nfoec2008.conferenceon,2008,pp.1-3中的“energyconsumptioninaccessnetworks”中研究的)针对在1gb/s以上的速率(其中点到点光纤链路可以变得比pon更加能量高效)并未表现很好。然而,图11的蜂窝架构例如可以避免baliga等人描述的pon的某些限制。根据图11的布置,(i)在服务器群组110(例如服务器机架)内,背板或fbg可以提供全波长速率,(ii)在连接至特定上光学路由元件170的服务器群组110a-110h(例如机架的蜂窝912)内,中间无源光学路由元件540a、540b提供全波长连接,并且因此服务器至服务器通信可以表现为点到点的,并且(iii)蜂窝之间(即在连接至第一上光学路由元件170的服务器与连接至第二上光学路由元件170的服务器之间)的通信可以是经由光学组件300。根据图12的布置,其中每个蜂窝912对应于图11中所示的蜂窝912,群组内通信和群组间通信(在蜂窝内)是根据上文的(i)和(ii)。然而,蜂窝间通信可以不同于上文的(iii)。特别地,在图12的布置中,可以经由两层的上光学路由元件来路由蜂窝间通信(第一蜂窝910-1中的服务器与第二蜂窝910-2中的服务器之间的通信),第一(上)层的上光学路由元件175-1至175-n在第二(下)层的上光学路由元件177-1至177-n与多个光学组件905-1至905-4(例如olt交换机/olt卡/olt端口)之间路由信号。第二(下)层的上光学路由元件177-1至177-n在特定蜂窝912的服务器群组与第一(上)层的上光学路由元件175-1至175-n之间路由信号。

根据图12的布置由于在蜂窝间通信中由服务器通过tdmmac(时分复用媒体接入控制)共享波长而不太可能(例如与其中每个蜂窝912被连接至单个光学组件300的布置(例如,如图11中所示)相比)遭受无源光学网络限制。例如,在图12的布置中可以减少过度订阅。在某些布置中,第一175和第二177层的上光学路由元件中的每个光学路由元件可以是awgr。

光学组件905可以是光学开关元件(例如olt交换机)。每个光学组件可以具有用于接收和/或发送光信号的两个或更多光学端口。图12的每个蜂窝912可以是子网络。每个子网络可以包括分别地用于与第一和第二服务器群组通信的第一端口群组和第二端口群组。根据某些示例,子网络中的一个或多个可以是无源光学网络,使得例如第一子网络的第一和第二光学端口群组与第一下层光学路由元件之间的通信的路由是无源的。

上175和下177层光学路由元件中的每一个可以基于信号的波长和在该处接收到信号的输入端口来路由光信号。可以将每个子网络(即其中的端口/服务器群组110)布置成与相应下层光学路由元件177通信。可以将每个下层光学路由元件177布置成在其相应子网络与上层光学路由元件175中的每一个之间路由信号。可以将上层光学路由元件中的每一个布置成在下层光学路由元件中的每一个与有源光学开关元件中的每一个之间路由信号。

上层光学路由元件和下层光学路由元件可以形成每个网络的群组与有源光学开关元件中的每一个之间的相应无源光学通信路径。

第一子网络中的第一光学端口群组与有源光学开关元件中的每一个之间的每个无源光学通信路径可以与波长相关联,该波长不同于与第一光学端口群组与每个其它有源光学开关元件之间的每个其它无源光学通信路径相关联的波长。

图13a图示出提供群组间通信的布置,其包括在任何服务器群组110a-f与以分级方式在上无源光学路由元件170下面的任何其它服务器群组110a-d之间进行路由的群组间通信路径。根据图13a中的布置1300,这些群组间通信路径可以是无源通信路径。根据图13a的布置的实施例提供并非经由上无源光学路由元件170路由的群组间通信路径,这可以减少上无源光学路由元件连接到的光学组件300(例如olt交换机)处的功率消耗和负荷,因为不需要经由上无源光学路由元件170和光学组件300来路由群组间通信。在根据图13a的布置的某些实施例中,上无源光学路由元件170可以是awgr。

群组间通信路径是经由与发送和接收服务器所属的相应服务器群组110a-f相关联的相应下无源光学路由元件121a-f、122a-f以及经由一个或多个中间无源光学路由元件540a-b。图13a的布置示出了两个中间无源光学路由元件540a-b;这些可以将光信号从多个输入端口路由到多个输出端口,输出取决于输入信号的波长和接收到输入信号的输入端口。中间无源光学路由元件540a-b可以是例如awgr。

可以用上行链路下无源光学路由元件121a-f和下行链路下无源光学路由元件122a-f将中间无源光学路由元件540a-b连接至服务器群组,类似于图11中的布置。来自服务器群组110a-f的业务(光信号)到达连接至中间无源光学路由元件540a-b(例如awgrs)的输入端的上行链路下无源光学路由元件121a-f(例如星形耦合器)的输出端口。

在图13a的实施例中,每个服务器(例如服务器的网络接口卡)具有用于波长检测和选择的固定已调谐接收机和可调谐激光器。在其它实施例中,可以使用除激光器之外的多波长源,诸如频谱分割led。图13a的说明性布置利用八个波长,并且因此接收机被布置成接收至少八个不同波长,并且可调谐激光器被布置成输出至少八个不同波长的信号。

在图13a的布置中,经由两个中间无源光学路由元件540a-b来连接六个服务器群组110a-f。在本示例中,每个中间无源光学路由元件540a-b从服务器群组110a中的三个接收输入。更具体地,第一中间无源光学元件540a经由相应上行链路下无源光学路由元件121a、121b、121c从第一110a和第二110b和第三110c服务器群组接收输入。在图13a中,来自第一服务器群组110a的输入在第一中间无源光学路由元件540a的第一输入端口i1处被接收到,来自第二服务器群组110b的输入在第一中间无源光学路由元件540a的第六输入端口i6处被接收到,并且来自第三服务器群组110c的输入在第一中间无源光学路由元件540a的第三输入端口i3处被接收到。同样地,第二中间无源光学路由元件540b分别地经由第七i7、第六i6和第四i4输入端口处的相应上行链路下无源光学路由元件121d、121e、121f从第四110d、第五110e和第六110f服务器群组接收输入。

第一和第二中间无源光学路由元件540a、b中的每一个还具体地在第二i2和第五i5输入端口处分别地从上无源光学路由元件170接收输入。第一和第二中间无源光学路由元件540a-b中的每一个还从另一中间无源光学路由元件540a-b接收输入。具体地,第一中间无源光学路由元件540a在第四i4、第五i5和第七i7输入端口处分别地从第二中间无源光学路由元件540b的第三o3、第四o4和第一o1输出端口接收输入。第二中间无源光学路由元件540b在第一i1、第二i2和第三i3输入端口处分别地从第一中间无源光学路由元件540a的第七i7、第六i6和第三i3输出端口接收输入。

因此,在图13a的实施例中,每个服务器群组被连接至中间无源光学路由元件540a-b中的一个的输入端口。此外,上无源光学路由元件170被连接到中间无源光学路由元件540a-b中的每一个的输入端口。中间无源光学路由元件540a-b的一个或多个输出端口每个被连接到中间无源光学路由元件540a-b中的另一个的相应输入端口。

在图13a的布置中,每个中间无源光学路由元件540a-b具有连接至三个服务器群组110a-f的相应输入端口、连接至上无源光学路由元件170的输入端口和连接至中间无源光学路由元件540a-b中的另一个的至少一个(在图13a中三个)输入端口。

每个中间无源光学路由元件540a-b具有连接至服务器群组110a-f的三个输出端口;连接至输出端口的服务器群组110a-f不同于连接至输入端口的服务器群组110a-f。每个中间无源光学路由元件540a-b还具有连接至上无源光学路由元件170的输出端口和连接至中间无源光学路由元件540a-b中的另一个的至少一个(在图13a中三个)输出端口。

在图13a的实施例中,第一中间无源光学路由元件540a具有分别地连接至第四110d,第五100e和第六110f服务器群组(不同于连接至第一中间无源光学路由元件540a的输入端口的第一110a,第二110b和第三110c服务器群组)的输出端口o2、o5、o1。第一中间无源光学路由元件540a还具有连接至上无源光学路由元件170的输出端口o4和分别地连接至第二中间无源光学路由元件540b的输入端口i3、i2和i1的输出端口o3、o6和o7。

同样地,第二中间无源光学路由元件540b具有分别地连接至第一110a、第二110b和第三110c服务器群组(不同于连接至第二中间无源光学路由元件540b的输入端口的第四110d、第五110e和第六110f服务器群组)的输出端口o2、o6、o7。第二中间无源光学路由元件540b还具有连接至上无源光学路由元件170的输出端口o5和分别地连接至第一中间无源光学路由元件540a的输入端口i7、i4和i5的输出端口o1、o3、o4。

图13b图示出图13a的布置中的输入信号到第一和第二中间无源光学路由元件540a-b中的输出端口的路由。

图13b示出了到相应端口的波长输入以及相应输出。下标指示波长,并且上标指示输入端口。请注意,第二中间无源光学路由元件540b的输入端口在图13b中被示为在左侧,但是在图13a中在右侧。

每个输出端口处的信号取决于信号的波长(下标)和接收到该信号处的输入端口(上标)。例如,在第一中间无源光学路由元件540a的输入端口i1处接收到的波长1的信号表示为λ11,并在输出端口o1处输出。同样地,在输入端口i3处接收到的波长2的信号表示为λ23,并且在输出端口o5处输出。

表3图示出根据图13a和图13b的布置的用来从源向目的地发送信号的波长。

表3

相应下无源光学路由元件121a-f、122a-f和上无源光学路由元件170之间的光学路径称为下光学通信路径。在图13a中,未标记下光学通信路径130。

图13a和图13b的布置与图5、图6、图7a和图7b的布置具有某些相似性。图13a和图13b的布置与先前描述的布置的不同之处在于经由中间无源光学路由元件540a-b来提供路径以用于群组内通信。亦即,第一服务器群组110a中的服务器可以经由上行链路下无源光学路由元件121a、中间无源光学路由元件540a和540b中的每一个以及下行链路下无源光学路由元件122a与同一群组110a中的另一服务器通信。如从表3可以看到的,这可以使用波长5来执行,波长5被从第一中间无源光学路由元件540a的第一输入端i1路由到第一中间无源光学路由元件540a的第七输出端o7。该信号然后被路由到第二中间无源光学路由元件540b的第一输入端i1和第二中间无源光学路由元件540b的第二输出端o2。信号然后经由相应下行链路下无源光学路由元件122a被路由到第一服务器群组110a。

作为群组间通信的示例,从第一服务器群组110a至第六服务器群组110f的信号将被以波长1从第一群组中的服务器发送,并且将经由上行链路下无源光学路由元件121a被路由到第一中间无源光学路由元件540a的第一输入端,在第一中间无源光学路由元件540a的第一输出端处离开第一中间无源光学路由元件540a。该信号然后到达下行链路下无源光学路由元件122f处且然后到达第六服务器群组110f处。

根据此布置,不必提供光学背板、fbg或用于群组内通信的其它单独机构。因此,可以简化群组的结构。在根据图13a和图13b的布置中提供了用于群组内通信的单独机构的情况下,经由中间无源光学路由元件540a-b来提供群组内通信路径提供用于群组内通信的冗余,其可以改善系统的稳健性和/或允许有增加的群组内带宽。

根据图13a和图13b的布置的示例允许使用n+1个不同波长对n+1个信号目的地进行寻址。根据某些示例,可能需要(n+1)2-1个光纤(即不同路径)。图13a和图13b的示例不包括从上无源光学路由元件170返回至上无源光学路由元件170(在某些示例中,诸如olt的光学组件不需要经由网络910与其本身进行通信)的路径,因此路径的数目比(n+1)2少一个,如在表3中可以看到的。在所示示例中参数n是6。在所示示例中,将信号的源和目的地视为服务器群组110a-f和上无源光学路由元件170(或上光学通信路径180和光学组件300,超过上无源光学路由元件170)。根据此类示例,具有6个服务器群组(n=6)的布置使用7个波长并具有48个连接/路径。

如在图5和图7a的布置中,可以在到下无源光学路由元件121a-h、122a-h的输入端处使用无源隔离器,但是在图13a中未示出。

图14图示出根据某些示例的网络。关于蜂窝/子网络912(其在图14上示意性地示出)以及下177和上175层路由元件的布置,此布置与在图12中的那个类似。图14示出了下层无源光学路由元件177与光学元件305之间的上行链路连接;可以将类似布置用于下行链路连接。上层路由元件175中的每一个与多个光学组件305相连。光学组件305中的每一个可以包括第一组光学开关元件307和第二组光学开关元件308,其中,第一组光学开关元件307具有比第二组308更高的开关速度。例如,第一组光学开关元件307可以是olt交换机,并且第二组光学开关元件308可以是光学交换机。

第一组光学交换机和第二组光学交换机可以通过商用交换机1415连接至控制管理系统1410。核心路由器1420提供光学组件305之间的通信。商用交换机1415、核心路由器1420和控制器1410可以促进连接许多服务器的光学组件305(例如olt交换机)之间的通信。控制器1410可以被布置成将蜂窝间流分类并基于数据流模式(例如相对于流尺寸和流的持续时间)为其分配路径以及资源。例如,在流被确定为是老鼠流的情况下(例如在流少于c个分组的情况下,其中c是预定参数),控制器将分配资源并选择通信服务器需要调谐到的适当波长,使得其可以被分组以通过高效的推荐加入同一olt端口/交换机。因此,可以避免或减少用于流穿过核心路由器1420的通信开销,并且可以实现节能。针对大象流(例如其中流在一定时间段内占总业务的大于1%,或者其中流在一定时间段内具有大于业务的平均值加三个标准偏差的尺寸),诸如其中服务器需要使用全波长的情况,控制器可以通过光学交换机建立电路以在不同pon蜂窝中的通信实体之间建立路径,其避免olt业务转送。

控制器1410可以被布置成通过向第一组有源光学开关元件307或第二组有源光学开关元件308中的光学开关元件分配数据流来控制数据流的信号在子网络之间的路由。该分配可以是基于流的尺寸和/或持续时间。

控制器1410可以将流分类为老鼠流或大象流,并且基于该分类来执行分配。

子网络912的结构不受特别限制。例如,每个子网络可以具有如相对于图1至图9中的任何一个概述的结构。在子网络是无源光学网络的情况下,每个服务器群组中的每个服务器可能需要具有可调谐激光器/收发机,以便选择性地与特定光学组件305通信。在子网络912包括有源元件的情况下(诸如图8的布置),某些服务器可以不要求可调谐激光器/收发机。

(从上层光学路由元件)到第一组有源光学开关元件的连接可以与到第二组有源光学开关元件的连接分离。然而,为了简单起见在图14中并未单独地示出这些。

根据依照图14的布置的某些示例,每个蜂窝/子网络912可以将n-1个不同波长用于蜂窝内通信,其中n是服务器群组110的数目。如果上层光学路由元件被连接到的第一和第二组有源光学开关元件307中的端口的数目分别地是s和k,则所使用的波长的总数可以是(n-1)+k+s。针对第一307和第二308组有源光学开关元件中的端口,可以使用(n-1)+k+s个波长中的仅n个波长来与蜂窝912中的服务器群组110通信。例如,如果在每个蜂窝中存在4个服务器群组,其与第一和第二组有源光学开关元件中的每一个中的4个开关元件相连,则可以使用3+4+4=11个波长。这可以独立于蜂窝912的数目。

已经执行了基准分析,其将根据与图11和图12中所示的一致的架构布置的数据中心的功率消耗和成本与最常见的数据中心架构:胖树和bcube相比较(a.hammadiandl.mhamdi:review:asurveyonarchitecturesandenergyefficiencyindatacenternetworks,computercommunication,vol.40,pp.1-21,2014)。

针对不同的结构配置,针对图15a中所示的胖树架构以及图15b中所示的bcube架构评估功率消耗和成本。我们认为具有24和48个pod的胖树架构将分别地提供到3,456和27,648个服务器的连接。针对n=8用k=2、3和4来评估bcube架构以分别地提供到512、4096和32768个服务器的连接。用针对每个蜂窝910以8个支架布置的64的服务器来评估图11和图12的架构的功率消耗。

表4示出了被用于基准评估的设备的功率消耗和成本。本发明人不知道已提供用于支持10gb/s的速率的oltpon的功率消耗规范的任何研究或供应商。gponneccm7700solt(j.baliga,r.w.a.ayre,w.v.sorin,k.hinton,andr.tucker,“energyconsumptioninaccessnetworks,”inopticalfibercommunication/nationalfiberopticengineersconference,2008.ofc/nfoec2008.conferenceon,2008,pp.1-3)针对接入网中的pon架构的典型距离(20km)支持1g数据速率,并且每个端口消耗12.5w。出于此评估的目的,采取线性功率分布来估计10gb/solt端口的功率消耗(请注意功率分布最近在线性趋势下面已增加)。因此,估计10gb/solt端口将消耗125w。作为保守估计,不考虑由于数据中心中的有限传输距离而引起的功率消耗的减少。图15c和图15d示出了与胖树和bcube架构相比可以通过根据图11和图12的布置的某些示例来部署架构而实现的功率消耗和成本节省。bcube和胖树架构的高能耗和成本主要是由于被用于互连的大量交换机而引起的。在根据本文中的示例的某些布置中可以消除并用无源光学装置来替换这些交换机。因此,示例性pon架构与分别地用于3,456和32,768个服务器的胖树和bcube架构相比可以将功率消耗减少45%和80%并将成本降低35%和72%。

表4

*c.bhagat,k.raje,r.shetyeanda.vaity,"technologicalandcost-basedcomparisonofnextgenerationpontechnologies:10gponandwdmpon,"inacapstonepapersubmittedaspartialfulfilmentoftherequirementsfordegreeofmastersininterdisciplinarytelecommunicationsattheuniversityofcolorado,boulder,universityofcolorado,usa,2012.

**k.grobe,m.roppelt,a.autenrieth,j.p.elbers,andm.eiselt,"costandenergyconsumptionanalysisofadvancedwdm-pons,"communicationsmagazine,ieee,vol.49,pp.s25-s32,2011.

***"intelpro/1000ptserveradapterdatasheet,”[online].available:http://ark.intel.com/products/50497/intel-pro1000-pt-server-adapter.

[online]avaiablehttp://www.3anetwork.com/.

"cisco:datasheetofcisco-2960-8tc-ldatasheet,”[online].available:http://www.cisco.com/c/en/us/support/switches/catalyst-2960-8tc-l-compact-switch/model.html.

"cisco:datasheetofcisco-2960-24tc-ldatasheet,”[online].available:http://www.cisco.com/c/en/us/support/switches/catalyst-2960-24tc-l-switch/model.html.

"cisco:datasheetofcisco-2960-48tc-ldatasheet,”[online].availablehttp://www.cisco.com/c/en/us/support/switches/catalyst2960g-48tc-l-switch/model.html#datasheets.

bcube架构具有最高功率消耗和成本,因为其是服务器中心架构,其中服务器装配有与所有层级建立连接所需的多个收发机。随着层级的增加,可以将架构按比例增加以一直到操控多服务器,并且收发机的数目增加,因为每个服务器需要与每个层级中的交换机具有连接,因此功率消耗增加。

胖树架构是交换机中心架构,并且图15c和图15d中的节省较低(与bcube架构相比),因为其被设计成具有带有单个收发机以连接至机架顶端(tor)交换机的服务器。与胖树架构相比由示例性pon架构实现的节省随着服务器数目的增加而减少。这是因为用来构建24pod和48pod胖树架构的交换机的功率消耗和成本不会随着pod的数目增加而不线性地增加。

如上所述,某些实施例提供用于群组内通信的完全无源互连,某些实施例提供用于群组间通信的完全无源互连,并且某些实施例提供用于群组内和群组间通信的完全无源互连。实施例可以提供可缩放、低成本、能量高效以及高容量互连基础设施以适应数据中心中的不同业务模式。

在以上描述中,已可互换地提及端口群组和服务器群组110a-d。应理解的是向端口发送信号或从其接收信号等价于向被附着到该端口的服务器发送信号或从其接收信号。此外,应注意的是可以在没有就位的服务器的情况下提供网络,使得网络能够在服务器已被连接至端口时操作。

如本文所使用的术语“收发机”描述了能够发送和接收信号/数据的组件或组件集合。收发机可以是光学收发机,并且可以使用光来载送信号/数据。

如本文所使用的术语“无源开关元件”是可以向定义地点路由信号而不需要向装置供应电力的装置。

术语“有源”在本文中用来表示使用电力或者要求电源以进行操作的组件。非无源在本文中用来包括并非无源的所有东西,包括有源组件及有源和无源组件的混合体。

遍及本说明书的描述和权利要求,单词“包括”和“包含”及其变体意指“包括但不限于”,并且其并不意图(且并不)排除其它组成部分、附加物、组件、整体或步骤。遍及本说明书的描述和权利要求,单数包含复数,除非上下文另外要求。特别地,在使用不定冠词的情况下,应将本说明书理解为设想复数以及单数,除非上下文另外要求。

应将结合本发明的特定方面、实施例或示例描述的特征、整体、特性、复合体或群组理解为适用于本文所述的任何其它方面、实施例或示例,除非与其不相容。在本说明书(包括任何所附权利要求、摘要和附图)中公开的所有特征和这样公开的任何方法或过程的所有步骤可以以任何组合的方式组合,除其中此类特征和/或步骤中的至少某些互相排斥的组合之外。本发明不限于任何前述实施例的细节。本发明扩展至在本说明书(包括任何所附权利要求、摘要和附图)中公开的特征中的任何新型特征或任何新型组合或者这样公开的任何方法或过程的步骤中的任何新型的一个或任何新型组合。

读者的注意力放在结合本申请与本说明书同时地或在其之前提交并与本说明书一起对公众查阅开放的所有文件和文献,并且所有此类文件和文献的内容被通过引用结合到本文中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1