用于服务器和存储区网络之间的光学连网的方法和架构的制作方法

文档序号:7609460阅读:398来源:国知局
专利名称:用于服务器和存储区网络之间的光学连网的方法和架构的制作方法
技术领域
本发明的领域一般涉及存储和/或服务器区域网络(SAN),且尤其涉及用于使用光交换网络在SAN之间传输数据的技术。
背景技术
商业活动所产生和采集的数据量近些年呈指数增长,且这种增长被预计会在将来持续下去。数据是商业计算处理所依据的基础资源。为确保商业处理递交期望的结果,就必须访问数据。商业数据的管理和保护对于商业处理的可用性来说是至关重要的。管理覆盖诸如配置、执行和保护的多个方面,其范围从如果存储介质故障该怎么办到完成灾难恢复过程。
在大型机的环境中,集中了存储管理。存储装置连接到大型机主机并直接由其中系统程序员(存储管理员)完全专注该任务的IT部门管理。按此方式管理存储是相对直接和容易的。
客户机/服务器计算的出现产生了新的一组问题,诸如对台式机的管理成本迅速上升,以及新的存储管理问题。大型机环境中被集中的信息现在分散于一个或多个网络上并常被不佳地管理和控制。存储装置被分散并连接到各个机器;必须逐机器地安排容量增加;一个操作系统平台所需的存储常不能用于其它平台上。
数十年来,计算产业已认识到表达、处理和数据存储之间的割裂。客户机/服务器架构基于这三分层模型。顶层将台式机用于数据表达。台式机通常基于个人计算机(PC)。包括应用程序服务器的中间层进行处理。诸如电子邮件服务器或web服务器的应用服务器由台式机访问并使用底层上存储的数据,底层包括包含数据的存储装置。
为解决以上问题,关于存储区域网络和服务器区域网络(这里都称作“SAN”)连网的技术和存储解决方案已且正在开发。SAN是允许网络连接基础结构所支持的距离内建立在存储装置和处理器(服务器)之间的直接连接的高速网络,所述网络最普通地包括光纤信道(FC)基础结构。在现今的SAN环境中,底层中的存储装置被集中和互连,它实际上表示后退到主机或大型机的中央存储模型。
SAN可被认为是对存储总线概念的扩展,它使存储装置和服务器能使用与局域网(LAN)和广域网(WAN)中类似的元件路由器、集线器、交换机、导向器和网关进行互连。SAN可在服务器之间共享和/或专用于一个服务器。它可以支持同类(例如,共同平台)和异类(混合平台)架构两者。
图1中示出了一对异类SAN架构100A和100B的示例。每个架构都根据上述常规三层架构配置,包括客户机层、应用服务器层和存储层。客户机层包括各种类型的客户机计算机102,诸如工作站、个人计算机、膝上计算机等。客户机层中的客户机计算机经由LAN(局域网)或WAN(广域网)106(对各自架构100A和100B中标记为106A和106B)连接到应用服务器层中的服务器104。而服务器层中的服务器104经由各自的SAN110A和110B连接到存储层中的存储装置108。
异类架构支持各种服务器硬件和平台类型,并独立于平台分销商和操作系统类型。存储层106中的存储装置108用于存储可经由SAN110A和110B被访问的数据。一般,大多数类型的大容量存储装置可部署于SAN存储层中,只要该装置与SAN架构兼容。
商业实体与更大企业的合并一般导致其中表示存储岛的各个SAN相互隔离的出现。为便于不同SAN之间的连续通信,必须采用有效的传输机制。在一种常规方案下,传输机制使用具有IP(以太网协议)的以太网接口和交换机来做到,诸如图1所示的。为了在SAN110A和SAN110B之间接口,在IP网络114之间使用SAN网关112A和112B。SAN网关便于根据具体协议的数据再配置,以帮助跨网关的数据交换。
虽然SAN一般被认为是高效网络,但SAN上发送的通信远不同于IP网络被设计成处理的通信。IP网络以路由为基础,并通常服务大量客户并且可以包括几百或甚至几千的路由器、交换机、网桥等。在IP协议下,通过将数据封装入包括首部的相对较小的分组来发送数据,所述首部在沿着数据源和数据目的地之间(诸如图1的SAN110A和110B之间)的路径的每个路由中继段(hop)处被检查。这包括量开销。相反,SAN通信通常包括很短的路径上发送的较大的有效负荷,通常是点对点。因此,SAN被设计用于处理块通信,其中路由考虑是次要的。当使用IP网络在SAN之间发送数据时,这些较大的有效负荷必须在源SAN网关处被分成许多小得多的分组,分别地在IP网络上常沿着不同的路径被发送,并在目的地SAN网关处被再汇集。结果,使用常规传输机制(诸如IP网络)的经由SAN的数据传输是非常低效的且消耗有价值的带宽和网络资源。


本发明的前述各方面和许多优点将变得更易于理解,因为它们通过以下详细描述并结合附图将得到更好的理解,其中除非另外指明否则相同的标号贯穿各附图表示相同的部分图1是说明典型存储区域网络(SAN)的组件和使用IP网络在SAN岛之间发送通信的常规技术的示意图。
图2是示出根据本发明实施例的具有可变时隙的光子脉冲串交换(PBS)网络的简化框图,该网络连接到多个SAN和LAN网络。
图3是示出根据本发明一个实施例的光子脉冲串交换(PBS)网络的操作的简化流程图。
图4是示出根据本发明一个实施例的光子脉冲串交换(PBS)网络中使用的交换节点模块的框图。
图5是示出根据本发明一个实施例的交换节点模块的操作的流程图。
图6是示出根据本发明一个实施例的PBS网络中节点之间的PBS光脉冲串流的示图。
图7是示出根据本发明一个实施例的PBS光脉冲串的一般PBS成帧格式的示图。
图8是示出根据本发明一个实施例的图7的PBS成帧格式的进一步细节的示图。
图9a是根据本发明一个实施例的包括边缘节点处共同定位的PBS接口和SAN网关的一网络架构的示意图,在该网络架构下用PBS网络组件连网多个SAN。
图9b是根据本发明一个实施例的包括用作边界网关协议(BGP)路由器的共同定位的PBS交换/边缘节点的网络架构的示意图,在该网络架构下用PBS网络组件连网多个SAN。
图9c是从BGP路由器看的图9b的网络架构的示意图。
图10是示出光纤信道如何被结构化为分层功能的分层集的示图。
图11是示出光纤信道帧(FC-2)的格式的示图。
图12是示出在可以封装一个或多个光纤信道帧的PBS成帧格式的细节的示图。
图13是示出根据本发明一个实施例的共同定位的SAN网关/PBS边缘节点单元的示图。
图14a是示出根据本发明一个实施例的图13中描述的光学PBSI/O卡的框图。
图14b是更详细地示出根据本发明一个实施例的图17a中描述的网络处理器单元和排列单元的框图。
图15是示出根据本发明一个实施例的出口操作流程的流程图。
图16是示出根据本发明一个实施例的出口操作流程的流程图。
图17是示出BGP更新消息中的各种字段的示图。
图17a是示出与常规BGP更新消息的通路属性相对应的各种字段的示图。
图17b是示出根据本发明一个实施例的附加字段的示图,这些附加字段被添加到图17a的BGP更新消息的通路属性,它们使得外部路由能扩展到光脉冲串交换网络。
图18是示出用于配置和初始化PBS网络以使能与该PBS网络耦合的多个SAN之间的基于PBS的数据传输的操作的流程图。
具体实施例方式
这里将描述使能使用光交换网络在SAN之间传输数据的技术的实施例。在以下描述中,阐述了许多特定细节,诸如使用用于光子脉冲串交换(PBS)网络的实施例的描述,以提供本发明实施例的透彻理解。但相关领域的熟练技术人员将认识到,本发明可以在没有一个或多个这些特定细节或者用其它方法、组件、材料等的情况下实施。在其它实例中,未详细示出或描述公知的结构、材料或操作以使本发明的各方面更清晰。
贯穿说明书对“一个实施例”或“一实施例”的引用表示联系该实施例描述的特殊特点、结构或特征包含于本发明的至少一个实施例中。因此,在整个说明书各处短语“在一个实施例中”或“在一实施例中”的出现不必都表示同一实施例。此外,在一个或多个实施例中,特殊的特点、结构或特征可按任何合适的方式组合。
根据这里描述的本发明的各方面,通过光交换网络便于在两个或更多不同SAN之间以及任选的其它传统网络类型(包括LAN和WAN)的网络间通信。在以下的详细描述中,参考它们在光子脉冲串交换(PBS)网络中的使用来揭示本发明的实施例。PBS网络是一种类型的光交换网络,通常包括高速中继段和跨度约束网络,诸如企业网。术语“光子脉冲串”这里用于表示具有类似路由要求的统计多路复用的分组(例如,因特网协议(IP)分组、因特网帧、光纤信道(FC)帧)。虽然概念上类似于基于主干的光学脉冲串交换(OBS)网络,但这些高速中继段和跨度约束网络的设计、操作约束和性能要求可以是不同的。但,可以理解,这里揭示的教示和原理也可应用于其它类型的光交换网络。
常规光交换网络通常使用波长路由技术,该技术需要在光交换节点处进行光学信号的光-电-光(O-E-O)转换。光学网络中每个交换节点处的O-E-O转换不仅是很慢的操作(通常约10毫秒),而且是很昂贵且功耗大的操作,它潜在地形成了光交换网络的通信瓶颈。此外,当前的光交换技术不能有效地支持分组通信应用(例如因特网)中常发生的“猝发”通信。
图2示出了示例性架构,在该架构下采用PBS网络200以便于SAN106A、106B和106C,LAN202A和202B,以及WAN204之间的网络间通信。PBS网络200包括多个节点,包括边缘节点2151-215M以及交换节点2171-217L。PBS网络200可进一步包括与图2所示的交换节点互连的附加的边缘和交换节点(未示出)。在所示实施例中,边缘节点同时用作入口和出口节点。在任选的配置中,入口和出口节点可包括分开的节点。因此,以下分开描述入口和出口节点功能;可以理解,对入口或出口节点的参考也可应用于边缘节点。实际上,边缘节点提供“外部”网络(即PBS网络以外;图2实施例中的SAN 106A-C,LAN202A和202B,以及WAN204)和PBS网络的交换节点之间的接口。在该实施例中,用智能模块实现入口、出口和交换节点功能。
在一些实施例中,入口节点执行接收光信号的光-电(O-E)转换,并包括电子存储器以缓冲接收信号直到它们被发送给合适的外部网络。此外,在一些实施例中,入口节点也在接收的电信号被发送给PBS网络200的交换节点2171-217L前执行该电信号的电-光(E-O)转换。
出口节点用光交换单元或模块实现,它们可配置成从PBS网络200的其它节点接收光信号并随后将它们路由到外部网络。出口节点也可从外部网络接收光信号并将它们发送到PBS网络200内的合适目的地节点,因此用作入口节点。在一个实施例中,出口节点执行所接收的光信号的O-E-O转换,并包括电子存储器来缓冲接收到的信号直到它们被发送给PBS网络200的合适节点。入口和出口节点也可从电域中实现的一个网络链接(例如,有线的以太网链接等)接收信号并将信号发送出去。
交换节点2171-217L用光交换单元或模块实现,它们各自被配置成从其它交换节点接收光信号并适当地将接收到的光信号路由到PBS网络200的其它交换和边缘节点。如下所述,交换节点执行光控制脉冲串和网络管理控制脉冲串信号的O-E-O转换。在一些实施例中,这些光控制脉冲串和网络管理控制脉冲串仅在预选的波长上传播。在这种实施例中,这些预选的波长不传播光“数据”脉冲串(与控制脉冲串和网络管理控制脉冲串相反)信号,尽管控制脉冲串和网络管理控制脉冲串可包括用于特殊一组光学数据脉冲串信号的必要信息。在一些实施例中,控制和数据信息在分开的波长上发送(这里也称作带外(OOB)信号发送)。在其它实施例中,控制和数据信息可在相同的波长上发送(这里也称作带内(IB)信号发送)。在另一实施例中,光控制脉冲串、网络管理控制脉冲串和光数据脉冲串信号使用不同的编码方案(诸如不同的调制格式等)在相同波长上传播。
虽然交换节点2171-217L可执行光控制信号的O-E-O转换,但在此实施例中交换节点不执行光数据脉冲串信号的O-E-O转换。相反,交换节点2171-217L纯粹地执行光数据脉冲串信号的光交换。因此,交换节点可包括电子电路以存储和处理被转换为电子形式的进入的光控制脉冲串和网络管理控制脉冲串并使用该信息来配置光子脉冲串交换设定,并正确地路由与光控制脉冲串相对应的光数据脉冲串信号。基于新的路由信息替换先前的控制脉冲串的新控制脉冲串被转换成光控制信号,并被发送到下一个交换或出口节点。
用于示例性PBS网络200的元件如下互连。SAN106A、106B和106C,LAN202A和202B,以及WAN204连接到PBS边缘节点2151-215M中的相应一些。在所示实施例中,各SAN网关206A、206B和206C被用于便于SAN106A、106B和106C的通信接口。如以下详细描述的,在一个实施例中,SAN网关和PBS边缘节点之间的“连接”发生于同一“单元”内,因此共同定位SAN网关和PBS边缘节点的功能。在另一实施例中,基于光缆或电缆的链接可用于将SAN网关连接到PBS边缘节点。
PBS网络200内,边缘节点2151-215M经由光纤连接到交换节点2171-217L中的一些。交换节点2171-217L也经由光纤互相互连以形成包括边缘节点之间的多个光通路或光学链路的网状架构。理想地,有多个光通路以将交换节点2171-217L连接到PBS网络200的每个端点(即,边缘节点是PBS网络200内的端点)。当一个或多个节点故障时,交换节点和边缘节点之间的多个光通路使能保护交换,或者可以使能诸如到目的地的主要和次要路径的特点。
如以下结合图3所述的,PBS网络200的边缘和交换节点被配置为发送和/或接收被波长多路复用的光控制脉冲串、光数据脉冲串和其它控制信号,以在预选波长上传播光控制脉冲串和控制标签并在不同的预选波长上传播光数据脉冲串或有效负荷。此外,PBS网络200的边缘节点可发送光控制脉冲串信号同时从PBS网络200发送出数据(光或电的)。
图3示出了根据本发明实施例的在LAN和WAN之间发送数据时PBS网络200的操作流程。该流程图反映了PBS网络所执行的一般传输操作。特别是,内部交换对于SAN和LAN、WAN或另一SAN之一之间的数据传输是一致的。以下描述用于SAN对接的附加措施。
参考图2和3,过程开始于框300,其中PBS网络200从外部网络接收IP分组或以太网帧等。在一个实施例中,PBS网络200在边缘节点2151-215M之一处接收IP分组。接收到的分组可以是电子形式而非光学形式,或者按光学形式接收并随后转换成电子形式。在该实施例中,边缘节点以电形式存储接收到的分组。
为清楚起见,PBS网络200的操作流程的其余描述集中于从边缘节点2152(用作入口节点)到边缘节点2153(用作出口节点)的信息传输。其它边缘节点之间的信息传输基本类似。
光脉冲串标签(即,光控制脉冲串)和光有效负荷(即,光数据脉冲串)从接收到的IP分组形成,如框302所描述的。在一个实施例中,边缘节点2151使用统计多路复用技术来从边缘节点2152中存储的接收到的IP分组形成光数据脉冲串。例如,由边缘节点2152接收并在它们的路径上通过边缘节点2153传递到目的地的分组可被组装成一个光数据脉冲串有效负荷。
接着,在框304中,特殊光学信道和/或光纤上的带宽被保留以通过PBS网络200传输光数据脉冲串。在一个实施例中,边缘节点2152保留通过PBS网络200的光数据信号路径中的时隙(即时分多路复用(TDM)系统的时隙)。该时隙可以是固定持续时间和/或可变持续时间,其中相邻时隙之间有均匀或不均匀的时间间隔。此外,在一个实施例中,为足以将光脉冲串从入口节点传输到出口节点的时间周期保留带宽。例如,在一些实施例中,边缘和交换节点维持所有使用的和可用的时隙的更新列表。时隙可在多个带宽和光纤上分配和分布。这些保留的时隙这里也称作TDM信道。
当边缘节点保留带宽时或当在传输光数据脉冲串后释放带宽时,网络控制器(未示出)更新该列表。在一个实施例中,网络控制器和边缘节点基于可用网络资源和通信模式使用各种脉冲串或分组调度算法执行该更新处理。周期性向所有边缘和交换节点广播的可用的可变持续时间TDM信道在相同波长上作为光控制脉冲串发送或在整个光学网络的不同共用预选波长上发送。网络控制器功能可驻留于边缘节点之一中,或者可以分布于两个或更多边缘节点上。
光控制脉冲串、网络光缆控制标签和光数据脉冲串随后通过光子脉冲串交换网络200在保留的时隙或TDM信道中传输,如框306所述。在一个实施例中,边缘节点2152沿着网络控制器确定的光学标签交换路径(OLSP)将控制脉冲串发送到下一个节点。在该实施例中,网络控制器在一个或多个波长上使用基于约束的路由协议(例如,多协议标签交换(MPLS))以确定对出口节点的最佳可用OLSP。
在一个实施例中,控制标签(这里也称作控制脉冲串)在光子数据脉冲串之前在不同的波长和/或不同的光纤上被异步发送。控制脉冲串和数据脉冲串之间的时间偏差允许每个交换节点处理该控制脉冲串并配置光子脉冲串交换机以在相应的数据脉冲串到达前正确地进行交换。术语光子脉冲串交换机这里用于表示不使用O-E-O转换的快速光交换机。
在一个实施例中,边缘节点2152随后沿着路由器(例如,交换节点2171)异步发送光学数据脉冲串到交换节点,其中光数据脉冲串经历很少的时间延迟或不经历时间延迟且在每个交换节点内不作O-E-O转换。光控制脉冲串在发送相应的光数据脉冲串前被发送。
在一些实施例中,交换节点可执行控制脉冲串的O-E-O转换,使得该节点能提取和处理标签中包含的路由信息。此外,在一些实施例中,TDM信道以用于传播标签的相同的波长传播。或者,标签和有效负荷可利用不同的调制格式在同一光纤的相同波长上调制。例如,光学标签可利用不归零(NRZ)调制格式发送,同时光学有效负荷在相同波长上使用归零(RZ)调制格式被发送。光学脉冲串按类似方式从一个交换节点发送到另一交换节点,直到光控制和数据脉冲串终止于边缘节点2153。
其余操作组属于出口节点操作(例如,边缘节点2153处执行的出口操作)。框308中,在接收到数据脉冲串后,出口节点分解它以提取被封装的数据(例如,IP分组,以太网帧,光纤信道(FC)帧,等等)。在一个实施例中,出口节点将光数据脉冲串转换为出口节点可以处理以恢复每个分组的数据段的电子信号。这点处的操作流程取决于目标网络是光学WAN还是LAN,如判断框310所述的。
如果目标网络是光学WAN,则在框312中形成新的光控制和数据脉冲串信号。在该实施例中,边缘节点2153准备新的光学标签和有效负荷信号。随后,在框314中,将该新的控制和数据脉冲串发送给目标网络(即,这种情况中的WAN)。在本实施例中,出口节点包括光学接口以将控制和数据脉冲串发送到光学WAN。
但如果框310中目标网络被判定为是LAN,则逻辑进行到框316。因此,提取的数据分组或帧被处理,与相应的IP标签组合,并随后被路由到目标网络(即,这种情况中的LAN)。本实施例中,边缘节点2153形成这些新IP分组。新IP分组随后被发送给目标LAN,如框318所示。
图4示出了根据本发明实施例的用作PBS网络200中的交换节点的模块217。模块217包括一组光学波分多路分解器4001-400A,其中A表示用于传播有效负荷、标签和其它网络资源到该模块的输入光纤的数量。例如,在本实施例中,每个输入光纤都可以承载一组C个波长(即,WDM波长),尽管在其它实施例中输入光纤可承载不同数量的波长。模块217还包括一组N×N光子脉冲串交换机4021-402B,其中N是每个光子脉冲串交换机的输入/输出端口的数量。因此,在该实施例中,每个光子脉冲串交换机处波长的最大数量是A·C,其中N≥A·C+1。对于其中N大于A·C的实施例,额外的输入/输出端口可用于回送光信号用于缓冲。
此外,尽管光子脉冲串交换机4021-402B被示作分开的单元,它们可以用任何合适的交换机架构实现为N×N光子脉冲串交换机。模块217还包括一组光学波分多路复用器4041-404A,一组光电信号转换器406(例如,光电检测器),控制单元407,和一组电光信号转换器408(例如,激光器)。控制单元407可具有一个或多个处理器以执行软件或固件程序。
模块217的该实施例中的元件如下互连。光学多路分解器4001-400A连接到一组A个输入光纤,这些光纤传播来自光子脉冲串交换网络200的其它交换节点的输入光信号。光学多路分解器的输出引线连接到一组B个核心光交换机4021-402B以及连接到光信号转换器406。例如,光学多路分解器4001具有连接到光子脉冲串交换机4021-402B的B条输出引线(即,光学多路分解器4001的一条输出引线连接到每个光子脉冲串交换机的一条输入引线)以及连接到光信号转换器406的至少一条输出引线。
光子脉冲串交换机4021-402B的输出引线连接到光学多路复用器4041-404A。例如,光子脉冲串交换机4021具有连接到光学多路复用器4041-404A的输入引线的A条输出引线(即,光子脉冲串交换机4021的一条输出引线到每个光学多路复用器的一条输入引线)。每个光学多路复用器还具有连接到电光信号转换器408的输出引线的输入引线。控制单元407具有与光电信号转换器406的输出引线或端口相连的输入引线或端口。控制单元407的输出引线连接到光子脉冲串交换机4021-402B的控制引线以及电光信号转换器408。如以下结合图5的流程图所述的,模块217用于接收和发送光控制脉冲串、光数据脉冲串和网络管理控制脉冲串。
图7示出了根据本发明一个实施例的模块217的操作流程。参考图4和5,模块217如下操作。
模块217接收具有TDM控制和数据脉冲串信号的光信号。在本实施例中,模块217在一个或两个光学多路分解器处接收光学控制信号(例如,光控制脉冲串)和光数据信号(即,本实施例中的光数据脉冲串)。例如,可以在光学多路分解器400A接收的光信号的第一波长上调制光控制信号,而在光学多路分解器400A接收的光信号的第二波长上调制光数据信号。在一些实施例中,光控制信号由第一光学多路分解器接收而光数据信号由第二光学多路分解器接收。此外,在一些情况中,仅接收光控制信号(例如,网络管理控制脉冲串)。框500表示该操作。
模块217将光控制信号转换成电信号。在该实施例中,光控制信号是光控制脉冲串信号,它由光学多路分解器从接收到的光数据信号中分离并被发送到光电信号转换器406。在其它实施例中,光控制信号可以是网络管理控制脉冲串。光电信号转换器406将光控制信号转换成电信号。例如,在一个实施例中,TDM控制信号的每个部分都被转换成电信号。由控制单元407接收的电控制信号被处理以形成新的控制信号。在该实施例中,控制单元407存储并处理控制信号中包含的信息。框502表示该操作。
随后,模块217将处理后的电控制信号转换成新的光控制脉冲串。在该实施例中,控制单元407提供TDM信道校准,从而在期望的波长和TDM时隙模式中生成再转换的或新的光控制脉冲串。该新的控制脉冲串可在与框500中接收的控制脉冲串的波长和/或时隙不同的波长和/或时隙上被调制。框504表示该操作。
随后,模块217发送光控制脉冲串到路径中的下一个交换节点。在该实施例中,电光信号发生器408发送新的光控制脉冲串到光学多路复用器4041-404A的合适光学多路复用器以实现路由。框506表示该操作。
随后,模块217根据控制信号中包含的路由信息将光数据信号(即,本实施例中的光数据脉冲串)路由到光学多路复用器4041-404A之一。在该实施例中,控制单元407处理控制脉冲串以提取路由和计时信息,并将合适的PBS配置信号发送给一组B个光子脉冲串交换机4021-402B以再配置每个光子脉冲串交换机来切换相应的光数据脉冲串。框508表示该操作。
图6示出了根据本发明一个实施例的在示例性PBS架构600下节点之间的PBS光脉冲串流。架构600包括入口节点610、交换节点612、出口节点614和其它节点(出口、交换和入口,它们未被示出以使光脉冲串流的描述更清晰)。在本实施例中,示出的入口、交换和出口节点610、612和614的组件是使用机器可读指令实现的,这些指令使得机器(例如,处理器)执行允许节点将信息传递到PBS网络中的其它节点的操作并从其它节点将信息传入。本例中,光脉冲串流的光通路是从入口节点610到交换节点612再到出口节点614。
入口节点610包括入口PBS MAC(媒体访问信道)层组件620,它具有数据脉冲串汇编器621、数据脉冲串调度器622、偏差时间管理器624、控制脉冲串构建器626和脉冲串成帧器628。在一个实施例中,数据脉冲串汇编器621汇编数据脉冲串以便在PBS网络200上光学传送。在一个实施例中,根据许多不同的网络参数确定数据脉冲串的大小,所述参数诸如服务质量(QoS)、可用光学信道的数量、入口节点处电子缓冲的大小、特殊的脉冲串汇编算法等等。
数据脉冲串调度器622调度PBS网络200上的数据脉冲串传输。入口PBSMAC层组件610生成用于插入与正形成的数据脉冲串相关联的控制脉冲串的带宽请求。在一个实施例中,数据脉冲串调度器622还生成调度,以包括偏差时间(来自于以下所述的偏差管理器624)从而允许PBS网络200中的各种节点在相关数据脉冲串到达前处理控制脉冲串。
在一个实施例中,偏差时间管理器624根据各种网络参数确定偏差时间,这些参数诸如沿选定光通路的中继段的数量,每个交换节点处的处理延迟,用于特殊光通路的通信负荷,以及服务要求的等级。随后,控制脉冲串构建器626使用诸如所需带宽、脉冲串调度时间、带内或带外信号发送、脉冲串目的地地址、数据脉冲串长度、数据脉冲串信道波长、偏差时间、优先级等的信息构建控制脉冲串。
脉冲串成帧器628使控制和数据脉冲串(在一些实施例中使用以下结合图7、8和12所述的成帧格式)成帧。脉冲串成帧器628随后在PBS网络200上经由物理光学接口(未示出)发送控制脉冲串,如箭头650所示。在该实施例中,控制脉冲串在带外(OOB)发送到交换节点612,如图6中的光控制脉冲串656和PBS TDM信道657所指示的。随后,脉冲串成帧器628根据脉冲串调度器622所生成的调度在PBS网络上经由物理光学接口发送数据脉冲串到交换节点612,如图6中的光学脉冲串658和PBS TDM信道659所指示的。光学脉冲串656(控制脉冲串)和658(数据脉冲串)之间的时间延迟在图6中被指示为OFFSET1。
交换节点612包括PBS交换控制器630,它具有控制脉冲串处理组件632、脉冲串成帧器/去成帧器634和硬件PBS交换机(未示出)。光控制脉冲串656经由物理光学接口(未示出)和光交换机(未示出)被接收并被转换成电信号(即,O-E转换)。控制脉冲串成帧器/去成帧器634使控制脉冲串信息去成帧并将控制信息提供给控制脉冲串处理组件632。控制脉冲串处理组件632处理该信息,确定相应数据脉冲串的目的地、带宽保留、下一个控制中继段、控制标签交换等等。
PBS交换控制器组件630使用该信息中的一些以控制和配置光交换机(未示出),从而在合适持续时间处将光数据脉冲串交换到合适信道处的下一个节点(即,本例中的出口节点614)。在一些实施例中,如果保留带宽不可用,PBS交换控制器组件630可采取合适的行动。例如,在一个实施例中,PBS交换控制器630可以(a)确定不同的光通路以避免不可用的光学信道(例如,偏转路由);(b)使用PBS交换机结构内集成的缓冲元件(诸如光纤延迟线)延迟数据脉冲串;(c)使用不同的光学信道(例如,通过使用可调波长转换器);和/或(d)仅去掉同期数据脉冲串。PBS交换控制器组件630的一些实施例也可发送否定的确认消息回到入口节点610以再发送去掉的脉冲串。
但是,如果可以找到和为数据脉冲串保留带宽,则PBS交换控制器组件630提供硬件PBS交换机(未示出)的适当控制。此外,PBS交换控制器组件630根据来自控制脉冲串处理组件632的更新保留带宽和可用PBS网络资源生成新的控制脉冲串。控制脉冲串成帧器/去成帧器634随后使再构建的控制脉冲串成帧,它随后经由物理光学接口(未示出)和光交换机(未示出)被光学发送到出口节点614,如图6中PBS TDM信道664和光学控制脉冲串666所指示的。
此后,当与接收/处理的控制脉冲串相对应的光学数据脉冲串由交换节点612接收时,硬件PBS交换机已被配置为将光数据脉冲串交换到出口节点614。在其它情况中,交换节点612可以将光数据脉冲串交换到不同的节点(例如,图6中未示出的另一交换节点)。来自入口节点610的光数据脉冲串随后被交换到出口节点614,如PBS TDM信道667和光学数据脉冲串658A所指示的。在该实施例中,光数据脉冲串658A仅仅是由硬件PBS交换机(未示出)再路由但可能在不同的TDM信道中发送的光数据脉冲串658。光控制脉冲串666和光数据脉冲串658A之间的时间延迟由图6中的OFFSET2指示,它小于OFFSET1,例如是因为交换节点612中的处理延迟和其它计时错误。
出口节点614包括PBS MAC组件940,它具有数据多路分解器642、数据脉冲串再汇编器644、控制脉冲串处理组件646以及数据脉冲串去成帧器648。出口节点614接收光控制脉冲串,如图6中的箭头670所指示的。脉冲串去成帧器648经由物理O-E接口(未示出)接收并去成帧控制脉冲。在该实施例中,控制脉冲串处理组件646处理被去成帧的控制脉冲串以提取相关的控制/地址信息。
在接收到控制脉冲串后,出口节点614接收与接收到的控制脉冲串相对应的数据脉冲串,如图6中的箭头672所示。本例中,相对于控制脉冲串的末端,出口节点614在延迟OFFSET2后接收光数据脉冲串。按与以上针对接收到的控制脉冲串所述的相类似的方式,脉冲串去成帧器648接收并去成帧数据脉冲串。数据脉冲串再汇编器644随后处理被去成帧的数据脉冲串以提取数据(且如果数据脉冲串是分段的数据脉冲串,则再汇编该数据)。数据多路分解器642适当地多路分解提取的数据,用于发送到合适的目的地(它可以是PBS网络以外的网络)。
图7示出了根据本发明一个实施例的用于PBS光脉冲串的一般PBS成帧格式700。一般PBS帧700包括PBS一般脉冲串首部702和PBS脉冲串有效负荷704(它可以是控制脉冲串或数据脉冲串)。图7还包括PBS一般脉冲串首部702和PBS脉冲串有效负荷704的展开图。
PBS一般脉冲串首部702对于所有类型的PBS脉冲串是共同的,并包括版本号(VN)字段710、有效负荷类型(PT)字段712、控制优先级(CP)字段714、带内信号发送(IB)字段716、标签表现(LP)字段718、首部纠错(HEC)表现(HP)字段719、脉冲串长度字段722和脉冲串ID字段724。在一些实施例中,PBS一般脉冲串首部还包括保留字段720和HEC字段726。以下针对具有32位字的成帧格式描述特殊字段大小和定义;但在其它实施例中,大小、顺序和定义可以是不同的。
在该实施例中,PBS一般脉冲串首部702是4字首部。第一个首部字包括VN字段710、PT字段712、CP字段714、IB字段716以及LP字段718。该示例性实施例中的VN字段710是4位字段(例如,位0-3),定义了用于使PBS脉冲串成帧的PBS成帧格式的版本号。该实施例中,VN字段710被定义为第一个字的前4位,但在其它实施例中,在第一个字中,不需要是前4位,或限制于4位。
PT字段712是定义有效负荷类型的四位字段(位4-7)。以下示出了示例性有效负荷类型。
CP字段714是定义脉冲串的优先级的2位字段(位8-9)。例如,二进制“00”可表示正常优先级且二进制“01”表示高优先级。
IB字段716是表示PBS控制脉冲串是正在带内还是OOB发送信号的1位字段(位10)。例如,二进制“0”可表示OOB信号发送而二进制“1”表示带内信号发送。LP字段718是用于表示是否已建立用于传送该首部的光通路的标签的1位字段(位11)。
HP字段719是用于表示首部纠错是否正用于该控制脉冲串中的1位(位12)。不使用的位(位13-31)形成当前不使用并保留用于将来使用的保留字段720。
PBS一般脉冲串首部702的第二个字包含PBS脉冲串长度字段722,它用于存储与PBS脉冲串有效负荷704中字节数的长度相等的二进制值。在该实施例中,PBS脉冲串长度字段是32位。
PBS一般脉冲串首部702的第三个字包含PBS脉冲串ID字段724,它用于存储用于该脉冲串的标识号。在该实施例中,PBS脉冲串ID字段724是由入口节点(例如,图6中的入口节点610)生成的32位。
PBS一般脉冲串首部702的第四个字包括一般脉冲串首部HEC字段726,它用于存储纠错字。在该实施例中,一般脉冲串首部HEC字段726是使用任何合适的已知纠错技术生成的32位。如图7所示,一般脉冲串首部HEC字段726是任选的,这在于如果不使用纠错,该字段可用全部零来填充。在其它实施例中,一般脉冲串首部HEC字段726不包含于PBS一般脉冲串首部702中。
PBS脉冲串有效负荷704对于所有类型的PBS脉冲串都是共同的并包括PBS特定有效负荷首部字段732、有效负荷字段734和有效负荷帧检查序列(FCS)字段736。
在该示例性实施例中,PBS特定有效负荷首部732是PBS脉冲串有效负荷704的第一部分(即,一个或更多字)。通常,特殊有效负荷首部字段732包括用于与数据脉冲串相关的信息的一个或多个字段,它可以是该脉冲串本身或包含于与该脉冲串相关联的另一脉冲串中(即当该脉冲串是控制脉冲串时)。
有效负荷数据字段734是PBS脉冲串有效负荷704的下一个部分。在一些实施例中,控制脉冲串没有有效负荷数据,所以该字段可被省去或全部包含零。对于数据脉冲串,有效负荷数据字段734可以相对较大(例如,包含多个数据分组或帧)。
有效负荷FCS字段736是PBS脉冲串有效负荷的下一部分。在该实施例中,有效负荷FCS字段736是检错和/或纠错中使用的一个字的字段(即,32位)。如图7所示,有效负荷FCS字段736是任选的,这在于如果不使用检错/纠错,则该字段全部用零填充。在其它实施例中,有效负荷FCS字段736不包含于PBS脉冲串有效负荷704中。
图8示出了根据本发明一个实施例的PBS光控制脉冲串成帧格式800。为了更加清楚起见,图8包括PBS一般脉冲串首部702和PBS脉冲串有效负荷704的展开图(先前结合图7描述的),其中当为控制脉冲串的一部分时带有PBS有效负荷首部字段732的进一步扩展(以下描述)。本例中,PT字段被设定为“01”以表示该脉冲串是控制脉冲串。CP字段被设定为“0”以表示该脉冲串具有正常优先级。IB字段被设定为“0”以表示该脉冲串正使用OOB发送信号。LP字段被设定为“0”以表示没有用于该控制脉冲串的标签。
在PBS控制脉冲串的示例性实施例中,PBS有效负荷首部字段732包括PBS控制长度字段802;扩展首部(EH)字段806;地址类型(AT)字段808;有效负荷FCS出现(PH)字段810;控制信道波长字段820;数据信道波长字段822;PBS标签字段824;PBS数据脉冲串长度字段826;PBS数据脉冲串开始时间字段830;PBS数据脉冲串使用期限(time-to-live)(TTL)字段832;数据脉冲串优先级字段834;PBS数据脉冲串目的地地址字段838;以及任选的扩展首部字段840。
该实施例中,PBS有效负荷首部732的第一个字包括PBS控制长度字段802,它用于存储控制首部按字节的长度。在该实施例中,PBS控制长度字段802是通过控制脉冲串构建器626(图6)或控制脉冲串处理器632(图6)计算的16位字段(位0-15)。在其它实施例中PBS控制长度字段802不需要是第一个字中的前16个位,或者不需要限于16位。在该实施例中,保留字段804(位16-27)包含于PBS有效负荷首部732内。在其它实施例中,这些位可用于其它字段。
PBS有效负荷首部732的第一个字还包括EH字段806,它在本实施例中用于指示扩展首部是否存在于脉冲串中。在该实施例中,EH字段806是1位字段(位28)。在其它实施例中,EH字段806不需要是位28或者在第一个字中。
PBS有效负荷首部732的第一个字还包括AT字段808,它在本实施例中用于表示相关联的PBS数据脉冲串的目的地的地址类型。例如,地址类型可以是IP地址(例如,IPv4,IPv6)、网络服务存取点(NSAP)地址、以太网地址或其它类型的地址。在一个实施例中,AT字段808是2位字段(位29-30)。
PBS有效负荷首部732的第一个字还包括PH字段810,它用于表示有效负荷FCS是否存在于该脉冲串中。在该实施例中,PH字段810是1位字段(位31)。
PBS有效负荷首部732的第二个字包括控制信道波长字段820,它用于表示控制脉冲串被假定在其中被调制的WDM波长。在该实施例中,控制信道波长字段820是16位字段(位0-15)。
PBS有效负荷首部732的第二个字还包括数据信道波长字段822,它被用于表示数据脉冲串被假定在其中被调制的WDM波长。在该实施例中,数据信道波长字段822是16位字段(位16-31)。
PBS有效负荷首部732的第三个字包括PBS标签字段824,它用于存储用于正由脉冲串使用的光通路的标签(如果有)。在该实施例中,该标签是由标签管理组件生成的32位字。
PBS有效负荷首部732的第四个字包括PBS数据脉冲串长度字段826。本实施例中,PBS数据脉冲串长度是32位字。
PBS有效负荷首部732的第五个字包括包括PBS数据脉冲串开始时间字段83-。在该实施例中,PBS数据脉冲串开始时间是由脉冲串调度器622(图6)生成的32位字。
PBS有效负荷首部732的第六个字包括PBS数据TTL字段832。在该实施例中,PBS数据TTL字段932是由入口PBS MAC组件620(图6)生成的16位(位0-15)字段。例如,在一个实施例中,入口PBS MAC组件620的脉冲串调度器622(图6)可以生成TTL值。
PBS有效负荷首部732的第六个字还包括数据脉冲串优先级字段832。在该实施例中,数据脉冲串优先级字段832是入口PBS MAC组件620(图6)生成的8位字段(位16-23)。例如,在一个实施例中,入口PBS MAC组件620的脉冲串调度器622(图6)可生成数据脉冲串优先级值。此外,在该实施例中,PBS有效负荷首部732的第六个字包括可在将来用于其它字段的保留字段836(位24-31)。
PBS有效负荷首部732的第七个字还包括PBS数据脉冲串目的地地址字段838。在该实施例中,PBS数据脉冲串目的地地址字段838是可变长度字段,为清楚起见,示作单个32位字。地址的实际长度可根据AT字段808中指示的地址类型而变化。
PBS有效负荷首部732的第八个字可以包括任选的扩展首部字段840。该首部可用于保存将来使用的其它首部数据。在使用该首部时,EH字段806被设定为1。在该实施例中,以上已描述了有效负荷数据字段734和有效负荷FCS字段736。
图9A描述了示例性网络架构900A,它支持经由光学脉冲串交换连网组件(在所示的实施例中PBS组件)的多个SAN岛之间的网络通信。网络架构900包括六个SAN,分别标记为9021-6,它们经由多个PBS交换节点2171-3和光学链路9041-26而互连。在所示的实施例中,每个SAN都包括各自的SAN网关906N以及共同定位的PBS接口908O。SAN网关和PBS接口共同提供了一SAN和PBS连网架构的内部PBS交换节点之间的接口。因此,这些共同定位的组件对于PBS交换节点表现为PBS边缘节点9101-6。
为说明目的,光学链路9041-26成对示出,表示经由同时经由单根光纤在多个不同波长上或者经由多根光纤在单个波长上传送数据的能力。可以理解,单条光学链路在合适的WDM实现下可支持1-N个并存的波长。此外,一条以上光纤链路可用于连接一对节点,从而在链路故障的情况下或者为支持增加的通信提供了冗余。
网络架构900A使得SAN9021-6能经由PBS结构相互通信。为支持该能力,有必要提供合适的通信接口以支持每个SAN和PBS网络架构的内部工作。如上所述,这是通过SAN网关和PBS接口的组合来使能的。为更好地理解该接口的SAN侧的基础操作,现在讨论基本SAN操作。有许多SAN资源对于连网技术领域的熟练技术人员方便可用,它们提供了以下讨论的SAN各方面的进一步细节。
SAN操作被设计成支持各种不同的平台和连网技术。已开发了开放的标准以使各种供应商组件之间的网络能互操作,而不是使SAN成为限制性网络。用于SAN的基础数据传输是基于光纤信道(FC)标准。尽管名称意味着光纤链路的使用,但可以使用各种类型的光学和铜链路,包括同轴和双绞线链路。光纤信道是由美国国家标准协会(ANSI)开发的标准的集合组的一般名称(X3T9.3Task Group ofANSIFibre Channel Physical and Signaling Interface(FC-PH));最后的FC-PH草案可在http//www.t11.org/index.htm获得。
在光纤信道术语中,连接终端装置(即,服务器和存储装置)的网络基础结构称作织构(Fabric)。光纤信道包括以相反方向发送并具有相关联的发送器和接收器的两个单向光纤,其中每个光纤都附着到一端处的一个端口的发送器以及另一端处的另一端口的接收器。当织构存在于配置中时,光纤可附着到节点端口(N_Port)以及织构的端口(F_Port)。
参考图10,光纤信道被构成为分层结构功能的分层集。最底层(FC-0)定义系统中的物理链路,包括光纤、连接器、用于各种不同数据率的光学和电学参数。由于光纤链路中的光功率水平会超过由可应用的激光安全标准所定义的极限,还规定了安全系统—开放光纤控制系统—用于短波激光数据链路。本质上,破损光纤的检测造成激光器工作周期被自动减少以满足安全需要。
FC-1层定义了包括串行编码和解码规则、特殊字符和错误控制的传输协议。光纤上传送的信息被每次地8位编码成10位传输字符。传输代码使用的主要原理是改善光纤上信息的传输特性。
信号发送协议(FC-2)层用作光纤信道的传输机制。FC-2定义了端口间要传递的数据的成帧规则、用于控制三个服务等级的不同机制以及用于管理数据传递序列的装置。为帮助链路上数据的传输,标准定义了以下构建块有序集、帧、序列、交换和协议。这些是本领域熟练技术人员已知的。为了这里的实施例,FC帧是FC-2的最重要方面,因此以下仅简要描述有序集、序列、交换和协议;它们每一个都是SAN领域中公知的。
有序集是用于获得位和字同步的四字节传输字,它可以形成字边界校准。信号发送协议定义了三种主要类型的有序集,包括帧定界符、原始信号和原始序列。
FC链接的基本构建块是帧。帧包含要发送的信息(即有效负荷)、源和目的地端口的地址以及链接控制信息。帧被广泛地分类为数据帧和链接控制(Link_control)帧。数据帧可用作链接数据(Link_Data)帧以及装置数据(Device_Data)帧,链接控制帧可分类为确认(ACK)和链接响应(Link_Response)(忙和拒绝)帧。织构的主要功能是从源端口接收帧并将它们路由到目的地端口。FC-2层的责任是将要发送的数据分解成帧大小,并再汇编这些帧。
FC帧1100的格式在图11中示出。每个帧都以帧定界符开始和结束。帧定界符(帧开始(SOF)定界符1101和帧结束(EOF)定界符1112)是紧邻帧内容之前或之后的有序集。帧首部1102紧接着SOF定界符1101。帧首部用于控制链接应用,控制装置协议传递,以及检测丢失或故障帧。最大2112字节长的数据字段1104包含要从源N_Port传递到目的地N_Port的信息。有效负荷可包括包含有附加链接控制信息的任选首部1106,并包括最大2048字节的数据有效负荷1108。4字节的循环冗余码校验(CRC)1110在EOF定界符1112之前。CRC用于检测传输错误。
帧首部1102的进一步细节在图11的下半部处示出。帧首部包括控制CTL字段1114,继之以源和目的地地址字段1116和1118以及类型字段1120。包括序列计数(seq_cnt)字段1122和序列标识(seq_ID)字段1124的下两个字段包含序列信息。通过从一个N_Port单向发送到另一个的一个或多个有关帧的集合形成一序列。序列内的每个帧都用序列计数唯一地编号。通常在序列边界处进行较上协议层控制的错误恢复。
交换_ID(exchange_ID)字段1126是最后一个帧首部字段。交换包括用于单个操作的一个或多个非并存序列。交换可以是两个N_Ports之间单向或双向的。在单个交换内,在任何一刻仅一个序列可以是活动的,但不同交换的序列可并发活动。
协议关系到光纤信道提供的服务。协议可以是针对较高层服务的,尽管光纤信道提供其自身的一组协议以管理用于其数据传递的操作环境。协议由前述ANSI标准加以规定。
流控制是用于调步多个N_Ports之间以及一N_Port和织构之间的帧流动的FC-2层控制过程以防止接收器处的超时运行。流控制取决于服务等级。等级1帧使用端对端流控制,等级3仅使用缓冲到缓冲,等级2帧使用这两种类型的流控制。
FC-3等级的FC标准旨在提供高级特点所需的共同服务。这些包括分条(Striping)—用于并行使用多个N_Ports以在多条链路上发送单个信息单元来倍增带宽;查寻(hunt)组—一个以上端口响应于同一别名地址的能力。这通过减少到达忙N_Port的机会改善了效率;和多播一多播将单个发送提交到多个目的地端口。这包括发送给织构上的所有N_Ports(广播)或者仅发送给织构上N_Ports的一个子集。
FC-4是FC结构中的最高层,它定义了可以在FC上执行的应用程序接口。它规定了使用以下FC级的上层协议映射规则。FC同样擅长于传输网络和信道信息两者并允许在同一物理接口上并发地传输这两种协议类型。
当前规定或提出了以下的网络和信道协议小型计算机系统接口(SCSI)智能外围接口(IPI);高性能并行接口(HIPPI)成帧协议;因特网协议(IP);用于计算机数据的ATM适应层(AAL5);链路封装(FC-LE);单字节命令代码集映射(SBCCS);以及IEEE 802.2。
为有效地适应SAN到PBS网络接口上的数据传送,提供了在PBS有效负荷内嵌入光纤信道帧的格式化机制。图12示出了根据一个实施例的包含多个FC帧的PBS数据脉冲串有效负荷1200的细节。PBS一般脉冲串首部702A包括图7和8中示出的用于PBS一般脉冲串首部702的许多上述字段。更详细地,有效负荷类型字段712A可用于标识不同的有效负荷类型。在一个实施例中,使用以下的4位值0000无有效负荷0001控制脉冲串0010网络管理脉冲串0100保留1XXX数据有效负荷诸如1111IP分组1001以太网帧1101FC帧1011MPEG-1/2/4视频帧PBS有效负荷首部732A包括20位保留字段1202,以及段ID(S-ID)字段1204,它用于存储再汇编分段数据脉冲串的标识符(ID)。在该实施例中,段ID字段704是由控制脉冲串构建器626(图6)或控制脉冲串处理器632计算出的8位字段(位20-27)。
PBS有效负荷首部732A还包括段脉冲串指示器(SB)字段1208、串联有效负荷指示器(CPI)字段1210和有效负荷PCS(PH)字段1212。这些字段分别用于表明PBS数据脉冲串是否被分段;脉冲串有效负荷是否被串联;以及有效负荷FCS是否存在。在所示实施例中,字段1208、1210和1212是1位字段(分别为位29、30和31)。在其它实施例中,这些字段可映射到不同的位,或者在与PBS有效负荷首部732A的第一个字不同的字中。与用于PBS控制脉冲串的PBS有效负荷首部不同,数据脉冲串的PBS有效负荷首部的该实施例仅具有一个32位字。但是,在其它实施例中用于PBS数据脉冲串的PBS有效负荷首部可以在长度上大于字。
有效负荷数据734A被配置为一个或多个FC帧1100,其中每个各自的帧都包括PBS脉冲串有效负荷长度1214A。例如,所示实施例包括有效负荷中的三个FC帧1100A、1100B和1100C,具有各自的PBS脉冲串有效负荷长度1214A、1214B和1214C。每个FC帧都具有类似于以上参考图11所述的配置。PBS脉冲串有效负荷长度1214A、1214B或1214C中的每一个都包含与各FC帧1100A/B/C的长度相对应的值。
如上所述,在一个实施例中,由SAN网关和PBS接口提供的功能可共同定位于单个单元中。例如,图13示出了根据本发明一个实施例的模块可再配置SAN网关/PBS边缘节点单元1300。在该实施例中,单元1300包括各自具有光学端口13041和13042的一对光学PBS I/O卡或模块13021和13022,具有传统网络端口1308的传统接口卡或模块1306,多个可配置服务器模块13101-1310N(仅示出其中两个),包括FC端口1314的一个或多个光纤信道接口卡1312,底板1316,连接器13181-1318M(图13中仅连接器13161-13163可见),以及机架1320。在一些实施例中,单元1300可包括两个以上或以下的可配置服务器模块,以及两个以上或以下的PBS I/O卡。在其它实施例中,单元1300可不同于图13所示的实施例进行配置。以下结合图14a和14b描述光学PBS I/O模块1302的一个实施例。在一个实施例中,各种模块和卡包括位于刀片服务器机架上的刀片服务器。在一个实施例中,单元1300根据高级电信计算架构(高级TCA或ATCA)标准(PICMG 3.0)(PCI工业计算机制造组)进行配置。
在该实施例中,传统接口卡1306是用于利用GbE以太网协议与前缘路由器(LER)或其它LAN/WAN网络通信的千兆位以太网(GbE)卡。在其它实施例中,可以使用不同的传统协议。
在该实施例中,服务器模块13101-1310N是自包含高速服务器刀片,其中单个或多个服务器功能被作为单个集成刀片服务器实现。
在一些实施例中,底板1316包括电子交换织构,它具有缓冲器并具有与商业上可得到的刀片服务器系统中所使用的那些相类似的电子总线(参见图14a的交换织构1430)、电源和控制等。在一个实施例中,电子底板织构支持多个交换拓扑,诸如星形或双星形拓扑,以切换到合适的电接口,例如服务器模块中的外围组件互连(PCI)(例如,1999年1月25日的PCI规范v2.2)或快速PCI(PCI-Express)(例如,1999年9月27日的PCI-X规范v.1.0)、InfiniBand(例如,2000年10月24日的InfiniBand1.0规范)接口。在其它实施例中,底板可包括其它类型的布线交换织构。这里使用的布线交换织构也可表示光交换织构或光学和电学交换织构的组合。
单元1300的元件如下地互连。光学I/O模块13021和13022、传统接口模块1306、服务器模块13101-1310N以及光纤信道接口卡1312经由连接器13181-1318M连接到底板1316(以及前述电交换织构1430)。光学端口13041-13042连接到各PBS网络交换节点217(例如,图2中的PBS网络200的)。传统端口1308连接到传统网络(LAN或WAN)或LER(例如,参见图2)。机架1320容纳并物理支持这些模块、连接器和底板。机架1320还包括其它组件(例如,电源、一个或多个冷却风扇等),它们在图13中未示出以避免模糊本发明。
操作中,单元1300可以用作SAN网关并使能通过给定SAN与各种存储装置主机的连接性。例如,在一个实施例中,经由本领域公知的常规SAN网关操作方便了SAN外的客户机与SAN内的数据主机之间的数据通信。支持这种类型的功能的SAN网关模块由若干供应商提供,包括,但不限于,IBM公司,White Plains,New York。例如,一个或多个服务器模块13101-1302N可方便SAN网关操作。
此外,单元1300可经由PBS网络以及光学I/O模块13021和13022向客户机提供服务。但是,与常规网络协议不同,光学I/O模块13021和13022从客户机接收光学PBS控制和数据脉冲串,它们随后如下所述地被O-E转换、去成帧、多路分解和路由。在一个实施例中,光学I/O模块13021和13022提供信息以按与服务器模块在底板1316上传递信息相同的方式经由底板1316将输入通信路由到正确的服务器模块。
类似地,单元1300的服务器模块经由底板1316以及光学PBS I/O模块1302将信息传递给PBS网络。不同于常规网络协议装置,在一个实施例中,按与先前针对PBS网络200(图2)的入口节点描述的基本相同的方式,光学PBS I/O模块1302统计多路复用来自一个或多个服务器模块的输入通信流(例如,FC帧),以形成PBS控制和数据脉冲串。PBS脉冲串随后被成帧、调度、E-O转换和经由PBS网络发送到客户机,如先前针对PBS网络200所描述的。
从用于通过PBS网络传送到目的地的传统网络进入到单元1300的通信在传统端口1308处由单元1300接收。如上所述,传统的网络可使用诸如TCP/IP或以太网协议的常规网络协议。在此实施例中,传统的网络是电GbE网络,虽然在其它实施例中可使用其它有线或无线网络。传统的接口模块1306以与服务器模块通过底板1316传送信息一样的方式将在传统端口1308接收的信息通过底板1316发送到光I/O PBS模块1302。光PBS I/O模块1302以与上面对PBS网络200的入口节点描述基本上相同的方式将来自传统接口模块1308的信息构造成PBS脉冲串。然后,该PBS脉冲串如以前对PBS网络200描述地被调度、E-O转换、并通过PBS网络发送到客户机。
从PBS网络进入单元1300并用于传到SAN目的地的通信由PBS光学端口1304处的单元1300以光控制和数据PBS脉冲串的形式接收。光学PBS I/O模块1302O-E转换PBS光学端口1304处接收的光控制和数据脉冲串,去成帧该PBS脉冲串,并将PBS数据脉冲串多路分解为例如构成FC帧1100的各个流。随后,将这些各个流经由底板1316传送到服务器模块中的合适一个。然后,用作SAN网关的该服务器模块将这些各个通信流经由光纤信道卡1312上的合适FC端口1314传送到SAN。
图14a示出了根据本发明一个实施例的光学PBS I/O模块1302。在该实施例中,光学PBS I/O模块1302包括网络处理器单元1402(该模块可具有多个网络处理器)、总线桥路1404、队列单元1406、成帧器单元1408(具有提供框14081和14082所指示的成帧器和去成帧器功能)、E-O接口1410、O-E接口1416、网络处理器缓冲器1420、通信整形器(shaper)1424以及通信整形器缓冲器1426。在一个实施例中,底板交换织构1430包括快速PCI总线,尽管在其它实施例中可使用任何其它的合适的总线。因此,可以使用商业上可得到的PCI桥路装置或芯片组实现总线-桥路1404。
在该实施例中,光学PBS I/O单元1302的前述元件如下互连。总线桥路1404连接到底板交换织构1430以支持经由互连1438的并行双向通信。总线桥路1404还经由电互连1439连接到通信整形器1424。为了清楚起见,将图14a中的电互连1438、1439和其它信号互连描绘为单个互连线路(尽管连接可包括若干信号互连线路)。
通信整形器1424分别经由互连1440和1441连接到网络处理器单元1402和缓冲器1426。网络处理器单元1402分别经由互连1442和1443连接到队列单元1406和缓冲器1420。接着,队列单元1406经由互连1444连接到PBS成帧器/去成帧器1408。
如图14b所示,在一些实施例中,网络处理器单元1402包括入口网络处理器1460和出口网络处理器1462。因此,在光学PBS I/O模块1302的一些实施例中,互连1440和1442连接到入口网络处理器1460。
此外,如图14b所示,在一些实施例中,队列单元1406可包括数据队列1470和1472、控制队列1474和1475,以及与队列1470、1472、1474和1475的输出端口耦合的电交换机或多路分解器1476。因此,在一些实施例中,队列1470、1472、1474和1475的输入端口经由交换机或多路复用器(未示出)连接到互连1442。此外,在一些实施例中,交换机1476的输出端口可连接到互连1444。
在其它实施例中,网络处理器单元1402中可以使用不同数量的处理器(例如,单个处理器)。此外,在一些实施例中,可以在队列单元1406中使用不同数量的队列。例如,队列单元不需要包括一专用控制队列和/或两个数据队列。多个队列可用于提供用于构建具有不同属性(诸如不同优先级)的多个脉冲串的存储。
再参考图14a,PBS成帧器单元1408经由互连1446连接到E-O接口1410。E-O接口1410接着经由互连1448连接到PBS网络的其余部分。O-E接口1416经由互连1450连接到PBS网络的其余部分。一般,O-E接口1416可在一个互连的SAN上接收所有发送的波长—或者它具有可调光学脉冲串接收器或者具有多个固定波长的光学脉冲串接收器。O-E接口1416还经由互连1452连接到成帧器单元1408。成帧器单元1408还经由互连1454连接到网络处理器单元1402。在一个实施例中,互连1464连接到网络处理器1462(图14b)。网络处理器单元1402经由互连1456连接到总线桥路1404。以下结合图15和16描述从PBS网络和向PBS网络传递信息过程中光学PBS I/O模块1302的操作。
参考图14a-b以及图15的流程图1500,光学PBS I/O模块1302执行如下的PBS出口操作(即,将信息从PBS网络传递到常规网络和/或单元1300的服务器模块)。光学PBS I/O模块1302将经由互连1450从PBS网络接收的光学PBS脉冲串转换成电信号。在该实施例中,O-E接口1416执行O-E转换。该操作流程由框1502表示。
随后,将接收到的O-E转换的PBS脉冲串去成帧和多路分解。在该实例中,成帧器单元1408从O-E接口1416经由互连1452接收O-E转换的PBS脉冲串并去成帧该PBS脉冲串。例如,在一个实施例中,如以上参考图7和8所描述的,可使PBS脉冲串成帧。在其它实施例中,可使用不同的成帧格式。多路分解使得能将每个成帧的数据脉冲串分成相应的IP分组、以太网帧、FC帧等。该操作流程由框1504表示。
随后,处理PBS脉冲串中包含的信息。在该实施例中,网络处理器单元1402经由互连1454从成帧器单元1408接收去成帧和多路分解的PBS脉冲串并执行该处理。例如,在一些实施例中,网络处理器单元1402可提取地址和有效负荷信息,对首部和/或有效负荷信息进行纠错,连接有效负荷,再汇编分段的有效负荷等等。网络处理器单元1402可使用缓冲器1420,以在以上处理操作期间临时存储信息。在一个实施例中,出口网络处理器1462(图14b)处理去成帧的脉冲串。该操作流程由框1506表示。
随后,在底板交换织构1430上发送处理后的信息。在该实施例中,总线桥路1404从网络处理器单元1402经由互连1456接收处理后的信息并在底板交换织构1430上以合适的格式并用合适的总线控制信号(例如,根据PCI协议)将该信息发送到合适的目的地。该信息的目的地例如可以是与传统网络相连的装置(这种情况中信息被发送到传统接口模块1306)或服务器模块(即,服务器模块13101-1310N之一)。该操作流程由框1508表示。
流程图1500包括专用于转发要存储于SAN存储装置上的数据的框1510-1514中的附加操作。框1508中在底板上发送的数据由服务器模块15101-1510N之一接收。提供SAN网关功能的服务器模块随后标识数据要向其转发以便存储的SAN目的地。这些操作由框1510表示。根据框1512和1514,数据被分组到FC帧,且该FC帧使用可应用的SAN数据传输技术被发送到目的地SAN存储装置。
参考图14a-b以及图16的流程图16,光学PBS I/O模块1302执行PBS入口操作;即如下地将信息从单元1300的传统网络和/或服务器模块传递到PBS网络。光学PBS I/O模块1302以电信号形式接收要在PBS网络上传送的信息。在该实施例中,总线桥路1404经由互连1438从底板交换织构接收信息。在该实施例中,该信息可经由传统接口1306来自于传统网络或者来自于服务器模块15101-1510N之一。该操作由框1602表示。
然后,将接收到的信息整形以帮助改善PBS网络(例如,图3的PBS网络300)中的通信流。在该实施例中,通信整形器1424经由互连1439从总线桥路1404接收信息并整形该信息。例如,在一个实施例中,通信整形器1424对该信息执行操作以减少由于自相似效果引起的输入通信流的相关结构和长期依赖性。通信整形器1424可配置为执行任何合适的通信整形算法或本领域已知的技术。通信整形器1424可使用缓冲器1426以在执行通信执行操作的同时临时存储信息。该操作流程由框1604表示。
随后,将整形后的信息多路复用入PBS控制和数据脉冲串。在该实施例中,网络处理器单元1402经由互连1440从通信整形器1424接收整形后的信息。随后,网络处理器单元1402处理该信息以形成并调度PBS控制和数据脉冲串,如以上针对PBS网络300中的入口节点所描述的。在其它实施例中,基于选定的脉冲串汇编算法将该信息汇编入合适的脉冲串大小以便在光学脉冲串网络(不必是PBS网络)上传送。在一个实施例中,入口网络处理器1460(图14b)处理通信整形信息。此外,在此实施例中,在控制和数据脉冲串正被形成时,网络处理器单元1402使用队列单元1406存储这些控制和数据脉冲串且直到它们被调度用于在PBS网络上传输。该操作流程由框1606表示。
随后,将脉冲串封装入帧,用于在PBS网络上传输。在该实施例中,成帧器1408经由互连1444从队列单元1406接收脉冲串并执行成帧操作。在一个实施例中,如以上参考图7和10描述的那样使脉冲串成帧。在其它实施例中,可用使用不同的成帧格式。该操作流程由框1608表示。
随后,将成帧的脉冲串转换成光信号并在调度的时间在PBS网络上传送。在该实施例中,E-O接口1410经由互连1446从成帧器单元1408接收成帧的脉冲串(即PBS控制和数据脉冲串)。接着,E-O接口1410执行E-O转换并在调度的时间并在PBS网络的保留的PBS TDM信道中发送光信号。该操作流程由框1610和1612表示。
根据本揭示内容的其它方面,PBS边缘、交换和路由设备可在SAN网关处共同定位。例如,图9B示出了一网络架构900B,它包括了与图9A示出并在以上讨论的那些相类似的组件。但是,在该实施例中,PBS交换模块2171-6在各SAN网关9061-6处共同定位。各种交换PBS交换模块2171-6经由光学链路9041-6被通信链接。
尽管与图9A的实施例相比使用共同定位的PBS交换模块会需要附加的模块,但它消除了对孤立PBS交换节点的需要,形成了具有较低网络实现成本的更灵活的网络架构。通过与其共同定位的SAN网关的交互,PBS交换模块动态地提供所请求的光通路,提前保留必要的带宽并根据通信优先级、其自身的分配资源和可用带宽调度要发送到其它SAN和/或其它LAN/WAN的SAN通信。结果,对SAN内基于FC的数据通信的影响最小。
在一个实施例中,通过修改外部网关协议(EGP)来使能较大企业网络内SAN到SAN网络路由,当多个光通路可用时该外部网关协议用于确定到特定SAN网络的最佳可用路径。EGP进行的路径选择是通过特殊SAN的相关属性来进行的。因此,不同SAN之间的每条光通路都被映射到给定的路径或交换连接。在一个实施例中,EGP在专用控制光通路上运行但也可以在互连装置的分开的电(例如以太网)网络上运行。
一方面,路由方案类似于用于因特网路由的方案,其中每个网络域作为一自主系统(AS)操作,且外部路由被用于通过使用仅意识到不同域之间的互连而不意识到关于每个域内互连的任何信息的域间路由协议将数据路由到并通过各种AS。特别是,用于因特网的路由域被称作边界网关协议(BGP),且本发明的实施例实现BGP协议的扩展版本,它包括便于基于PBS网络的路由的规定。
在一个实施例中,PBS网络的一个或多个共同定位的交换节点被指定为“外部网关协议”路由器,它们在它们与其它相邻PBS节点的接口连接上运行修改的BGP协议。因此,所有输出和输入数据通信到这些共同定位的交换节点通过PBSBGP路由器所指定的一个SAN。在一个实施例中,每个外部网关协议路由器选择性地将其所有可能的路由器通告给相邻BGP路由器中的一些或全部。在另一实施例中,每个BGP路由器都被允许根据相关属性以及其它标准(诸如带宽使用或端对端等待时间)将它发送的各种路由通告排列或定优先级。因此,在所有可用路径中的最佳路径选择中,SAN/PBS网关可容易地影响BGP判断过程。跨PBS网络通告光通路路径的可用性是使用BGP更新(UPDATE)消息进行的。PBS到PBS网络连接性不限于全光网络,也可以包括其它类型的光学物理链路,诸如SONET/SDH或10Gb/s以太网。
图9C示出了从共同定位的BGP路由器方面观察的网络架构900B,它包括用“BGPn”标签示出的所有路由器。特别是,交换节点2171-6中的每一个都用作一BGP路由器,出于说明目的,它们通过各种路径段9121-8连接。在常规BGP路由下,每个路由器维护包括路径段的串联的一个路由表,其中每一个都共同地包括经过该路由器的一路径。但是,常规BGP路由不涉及基础传输机制,且不考虑路径段的调度使用。
如上所述,在控制脉冲串从入口节点中继段到中继段地发送到出口节点用于具有可变时间供应的端对端单向带宽保留之后,数据脉冲串沿着与控制脉冲串相同的光通路被发送到出口节点(在某一时间差后)。但是,数据脉冲串透明地通过交换节点发送而不检查其内容。PBS交换织构在动态保留的持续时间内提供输入和输出端口之间的连接,因此允许数据脉冲串被发送通过,其中保留的光通路构成耦合入口和出口节点的“虚拟光学回路”。从PBS边缘节点BGP路由器观察,该虚拟光学回路表现为BGP路由器端点之间的直接连接,如BGP路由器BGB1和BGP4之间的虚拟链路9141-3所描绘的。
从路由的观点,在确认形成因特网的AS的数量远大于典型的企业网所使用的数量的情况下,BGP路由网络架构900B粗略地类似于因特网上的BGP路由。但是,路由原理是类似的。这样,使用公知的设置和配置方法,许多路由实现将类似于常规BGP路由所遇到的。
BGP是当前的实际标准域间路由协议。BGP首先于1989年变成因特网标准并且最初在RFC(请求注释)1105中被定义。随后,它被采纳作为域间路由选择的EGP。当前版本,BGP-4,于1995年被采纳并于RFC1771中定义。
BGP是通过发送路由通告进行工作的通路矢量(path-vector)协议。路由信息存储于每个BGP路由器处作为目的地和到达该目的地的通路的属性的组合。路由通告指示网络可达性(即,表示连续IP地址的块的网络地址和网络掩码)。除了可达网络和用于达到该网络的路由器的IP地址之外(称作下一个中继段),路由通告还包含AS通路属性,它包含了可用于达到所宣告的网络的所有转接AS的列表。AS通路的长度可被认为是路由度量。
BGP更新(UPDATE)消息用于在网络内出现变化时提供路由更新。为了设置不同PBS“岛”或网络之间的光通路,需要扩展标准BGP以传送必要的光通路路由信息给BGP路由器。目的是充分利用现有的BGP属性,但将它们扩展以满足PBS网络的路由需要。
PBS LER(标签边缘路由器)被指定为主要的PBS BGP路由器以支持不同光学域之间的路由。如图9C所示,BGP路由器BGP1-6中的每一个都是PBS LER候选,尽管任何数量的BGP路由器BGP1-6可实际作为PBS LER操作。PBS BGP路由器将负责通过将光通路属性通告给其相邻BGP路由器来设置光通路,并构建和维护用于所有可能路径的路由信息库(RIB,即路由表)。一般,PBS BGP路由器和PBS LER可共同定位于同一网络节点处。
图17示出了具有其相应字段的更新(UPDATE)消息的格式。更新消息包括不可能路由长度字段1700、撤回路由字段1702、通路属性长度字段1704、通路属性字段1706和网络层可达性信息(NLRI)字段1708。在更新消息中,在一对BGP广播器(speaker)(即,经由单个中继段彼此连接的BGP路由器)之间通告路由目的地是在NLRI字段1708中报告其IP地址的系统,且通路是同一更新消息的通路属性字段1706中报告的信息。
不可能路由长度字段1700包括2个八位字节的无符号整数,它指示八位字节中撤回路由字段的总长度。其值必须允许如以下规定地确定网络层可达性信息字段1708的长度。0值指示没有路由正从服务中撤回,并撤回路由字段不存在于该更新消息中。
撤回路由字段1702是可变长度字段,它包含了用于正从服务中撤回的路由的IP地址前缀的列表。每个IP地址前缀被编码为2字节组,它包括单个八位字节长度字段后面跟着可变长度前缀字段。长度字段以位数指示IP地址前缀的长度。零长度指示匹配所有IP地址的前缀(其中前缀本身是零八位字节)。前缀字段包含IP地址前缀后面跟着足够的拖尾位,以使得该字段的末端落到一八位字节的边界。
总通路属性长度字段1704包括2个八位字节的无符号整数,它以八位字节表示通路属性字段1706的总长度。0的值表示该更新消息中没有网络层可达性信息字段。
常规通路属性字段1706的细节在图17a的1706A处示出。通路属性的可变长度序列存在于所有更新(UPDATE)中。每个通路属性都是三倍可变长度。属性类型是两个八位字节的字段,它包括属性标记八位字节1710A后面跟着属性类型代码八位字节1712。属性标记八位字节的高位位(位0)是任选位1714。它定义属性是任选的(如果设定为1)还是公知的(如果设定为0)。
属性标记八位字节的第二高位位(位1)是过渡位(transitive bit)1716。它定义任选属性是过渡的(如果设定为1)还是非过渡的(如果设定为0)。对于公知属性,过渡属性必须设定为1。
属性标记八位字节的第三高位位(位2)是部分位1718。它定义任选过渡属性中包含的信息是部分的(如果设定为1)还是完整的(如果设定为0)。对于公知属性且对于任选非过渡属性,部分位必须设定为0。
属性标记八位字节的第四高位位(位3)是扩展长度位1720。它定义属性长度是一个八位字节(如果设定为0)还是两个八位字节(如果设定为1)。只有当属性值长度大于255个八位字节时,可使用扩展长度位1720。
属性标记八位字节的低位的四个位不使用,如保留字段1722所描绘的。它们必须是零(且在被接收到时必须被忽略)。
属性类型代码八位字节1712包含属性类型代码。当前定义的属性类型代码在RFC 1771的部分5中讨论。
如果属性标记八位字节1710的扩展长度位1720被设定为0,通路属性的第三个八位字节包含以八位字节计的属性数据的长度。如果属性标记八位字节的扩展长度位被设定为1,则通路属性的第三和第四八位字节包含以八位字节计的属性数据的长度。属性长度代码1724描述了这两种情况。通路属性的其余八位字节表示属性值1726并根据属性标记1710和属性类型代码1712进行解释。
其中,更重要的属性类型代码中有ORIGIN(类型代码1)、AS_PATH(类型代码2)和NEXT_HOP(类型代码3)。ORIGIN是定义通路信息的来源的公知强制属性。AS_PATH是由AS通路段的序列构成的公知强制属性。每个AS通路段都由三个一组表示。通路段类型是1个八位字节长的字段,而通路段长度是包含通路段值字段中AS数量的1个八位字节长的字段。通路段值字段包含一个或多个AS数,每个都被编码为2个八位字节长的字段。NEXT_HOP是公知强制属性(RFC1771),它定义应用作到达更新消息的网络层可达字段中列出的目的地的BGP下一个中继段的路由器的IP地址。路由器进行递归查找以找出路由表中的BGP下一个中继段。
根据将BGP路由扩展到光交换网络的各方面,按照一个实施例,图17b示出了包含附加信息(在粗体线的框中所示)的一组修改通路属性1706B的细节,所示附加信息用于指明光传输属性以便将BGP协议扩展到光交换网络。这些扩展包括PBS连接(PC)字段1726、可用波长属性字段1728和可用光纤属性字段1730。PC字段1726对应于属性标记八位字节1710B的位4。0值指示PBS连接不可用。1值指示PBS连接可用。
可用波长属性字段1728中的值指示相邻PBS网络(光域)之间当前波长可用性的状态。如果该值为0,则无波长可用于所请求的光通路。任何包含的值都对应于可用于所请求的光通路的一个或多个波长。这意味着与PBS LER共同定位的BGP路由器可开始到特定目的地的光通路设置处理。
可用光纤属性字段1730中的值指示相邻PBS网络之间当前光纤可用性的状态。0值指示该光纤不可用于所请求的光通路。这意味着该光纤由其它波长使用或者该光纤链路关闭。在任一情况中,必须选择备用路径。非零值指示光纤可由所请求的到达目的地地址的光通路使用。
返回到图17,网络层可达性信息字段1708包括包含IP地址前缀列表的可变长度字段。网络层可达性信息的以八位字节计的长度不是明确地编码,但可以计算为可达性信息被编码为长度(Length)(1八位字节)、前缀(Prefix)(可变长度)的形式的一个或多个2元组。长度字段指示IP地址前缀的位的长度。零长度表示匹配所有IP地址的前缀(本身为零八位字节的前缀)。前缀字段包含IP地址前缀,继之以足够的尾位以使得字段的末端落到一个八位字节的边界,其中尾位的值是不相关的。
BGP中的更新消息最相关于PBS BGP的设计和操作,因为它们将新的路由可用性信息从一个路由器传到另一路由器。例如,网络拓扑(从BPG路由器的立场)可通过经由相应的更新消息对相邻BPG路由器作出的通告表达。这些原理是网络路由领域内的熟练技术人员公知的。
图18示出了概括前述设置和网络更新操作的流程图。设置过程开始于框1800,其中共同定位于各SAN网关的多个PBS交换/边缘节点模块被配置成使能相互之间的数据传输通路,因此在使能PBS连网基础结构上各SAN之间基于PBS的数据传输。一般,通信链路可包括各光线I/O模块1302之间的一个或多个光纤链路。
接着,在框1802中,从沿着跨多个BGP路由器的路径路由数据的立场,每个SAN都被建模为自主系统(AS)。随后,选定的共同定位PBS交换/边缘模块被设计成起用于SAN之间外部路由的BGP路由器的作用,如框1804所述。
框1806中,每个BGP路由器指定模块接收PBS网络内其它节点的路由可用性信息,它标识该节点和网络内的其它BGP路由器之间可用于传输数据的路径。这么作是提供标识给定PBS网络内入口和出口BGP路由器之间的可用路径的路由信息。随后,在框1808中生成包含用于这些路径的通告的相应BGP更新消息,其中BGP更新消息具有图17b所示的通路属性格式。
在这点上,在BGP路由器近邻之间交换包括光交换网络路由支持扩展的BGP更新消息,以更新每个BGP路由器中的外部路由表。这些操作在框1810和1812中执行。每个外部路由表都包含多个路由记录,每一个都指明到目的地网络的路径。特别地,每个路由记录都包括将顺序遇到以达到具有目的地地址的SAN处的入口节点BGP路由器的段中继段(即,BGP路由器地址)的列表。该外部路由数据不包括AS内使用的内部路由的任何细节。
一旦企业网被配置和初始化(即,建立BGP路由表),就可以通过将扩展BGP路由用于外部路由操作并将IGP路由机制用于给定PBS网络内的内部路由而在不同PBS网络之间以及不同PBS网络和非PBS网络之间传输数据。因此,路由类似于因特网所采用的路由,区别在于除常规的外部路由通告外在更新它们的路由表时现在路由器考虑光交换网络可用性信息。
当用作沿着给定路径的中间节点时,PBS交换/边缘节点模块将提供类似于以上讨论的PBS交换模块217的PBS交换机功能。同时,源SAN处的PBS交换/边缘节点模块将用作BGP路由器和PBS出口节点,其中目的地SAN处的PBS交换/边缘节点模块将用作PBS入口节点。
返回到图9a,在一个实施例中,前述BGP路由器功能可以在一个或多个PBS边缘节点910中实现,如通过BGP路由器模块916所描述的。在该实施例中,PBS边缘节点910将提供EGP路由功能,并提供PBS边缘节点和共同定位的SAN网关操作。
一般,BGP路由器功能可由分开的服务器模块提供,或者可以集成于单元1300的现有组件上,诸如集成于光学PBS I/O模块1302。如同前述PBS交换节点和边缘节点功能,路由器功能可通过硬件(例如编程逻辑)、软件或两者的组合而实现。更特别地,用于实现PBS交换节点、边缘节点、SAN网关和/或BGP路由器功能的软件可体现为一组或多组指令或包含在某种形式的处理器核心(诸如网络处理器、服务器或I/O模块的处理器或其它类型的处理器)上执行的指令的模块。
因此,本发明的实施例可用作或支持在某种形式的处理核心上执行或另外地在机器可读媒介之上或之内执行或实现的软件程序。机器可读媒介包括用于存储或传送可由机器(例如计算机)读取的形式的信息的任何机制。例如,机器可读媒介可包括诸如只读存储器(ROM);随机存取存储器(RAM);磁盘存储媒体;光学存储媒体;以及闪存装置等等。此外,机器可读媒介可包括传播信号,诸如电、光、声或其它形式的传播信号(例如,载波、红外线信号、数字信号等)。
在前述说明书中,已描述了本发明的实施例。但显然,可对其进行各种修改和变化而不背离所附权利要求书中所阐述的较宽精神和范围。因此,说明书和附图被认为是说明性而非限制性的。
包含摘要中所描述的内容的所述本发明实施例的以上描述不被认为是穷尽性或者将本发明限制于所揭示的精确形式。虽然这里出于说明目的描述了本发明的实施例和示例,但各种等效修改也在本发明的范围之内,如相关领域的熟练技术人员能认识到的。
可以根据以上的详细描述对本发明进行这些修改。以下权利要求书中所使用的术语不应认为将本发明限制于说明书和权利要求书中所揭示的特定实施例,相反,本发明的范围完全由以下的权利要求书确定,它是根据所建立的权利要求说明原则进行解释的。
权利要求
1.一种用于在多个SAN(存储区域网络和/或服务器区域网络)之间传递数据的方法,包括经由光脉冲串交换(OBS)网络基础结构将第一SAN耦合到第二SAN;从所述第一SAN接收数据,所述数据根据第一SAN格式被配置;将所述数据封装入一个或多个OBS数据脉冲串;经过所述OBS网络将所述一个或多个OBS数据脉冲串从所述第一SAN发送到第二SAN;以及在所述第二SAN处提取所封装的数据。
2.如权利要求1所述的方法,其特征在于,所述OBS网络包括光子脉冲串交换(PBS)网络。
3.如权利要求2所述的方法,其特征在于,所述OBS网络包括波分复用(WDM)PBS网络。
4.如权利要求1所述的方法,其特征在于,所述数据的第一SAN格式包括光纤信道(FC)帧,且将所述数据封装入一个或多个OBS数据脉冲串包括在所述一个或多个OBS数据脉冲串中的每一个中封装至少一个FC帧。
5.如权利要求2所述的方法,其特征在于,经由(OBS)网络基础结构将第一SAN耦合到第二SAN包括在用于第一和第二SAN中的每一个的各自SAN网关处共同定位各自PBS边缘节点模块;以及将各自PBS边缘节点模块光耦合到至少一个PBS交换节点以形成一光通路,所述光通路包括在所述第一和第二SAN之间的至少两个光通路段。
6.如权利要求5所述的方法,其特征在于,由SAN网关和PBS边缘节点执行的各自操作由多模块单元中所包含的至少一个模块提供。
7.如权利要求6所述的方法,其特征在于,所述至少一个模块包括经由模块化可再配置通信平台中的共用底板耦合的多个服务器刀片。
8.如权利要求5所述的方法,其特征在于,还包括在用于第一和第二SAN的至少一个的各自SAN网关处共同定位至少一个外部网关协议路由器模块;以及使用外部网关协议路由器确定一路径,其中所述一个或多个OBS数据脉冲串经由所述路径在第一和第二SAN之间传送。
9.如权利要求2所述的方法,其特征在于,经由(OBS)网络基础结构将第一SAN耦合到第二SAN包括在用于第一和第二SAN中的每一个的各自SAN网关处共同定位各自PBS交换/边缘节点模块;以及相互光耦合各自PBS交换/边缘节点模块。
10.如权利要求9所述的方法,其特征在于,由SAN网关和PBS交换/边缘节点执行的各自操作由多模块单元中包含的至少一个模块提供。
11.如权利要求10所述的方法,其特征在于,所述至少一个模块包括经由服务器刀片单元中的共用底板耦合的多个服务器刀片。
12.如权利要求9所述的方法,其特征在于,还包括将第三和第四SAN光耦合到第一和第二SAN,第三和第四SAN中的每一个在共同定位的SAN网关和PBS交换/边缘节点处被光耦合;以及确定一路径以光传送所述一个或多个光脉冲串,所述路径包括至少两个路径段的串联,每个路径段在各自SAN对之间耦合。
13.如权利要求12所述的方法,其特征在于,还包括将共同定位的PBS交换/边缘节点中的至少一个配置为外部网关协议路由器;以及使用外部网关协议路由器确定所述路径。
14.如权利要求13所述的方法,其特征在于,所述外部网关协议包括对包含PBS网络的规定的边界网关协议的扩展,且确定所述路径包括确定要用于每个路径段的光波长。
15.一种系统,包括多个SAN(存储区域网络和服务器区域网络),它们每一个都包括各自的SAN网关;多个光脉冲串交换(OBS)网络边缘节点,它们每一个与各自的SAN网关通信耦合;以及多个OBS网络交换节点,它们按网状配置光耦合到OBS边缘节点的多个OBS。
16.如权利要求15所述的系统,其特征在于,还包括与多个OBS网络交换节点中的至少一个耦合的一个OBS网络边缘节点;到包括局域网(LAN)和广域网(WAN)之一的传统网络的一个接口,它与OBS网络边缘节点通信耦合。
17.如权利要求15所述的系统,其特征在于,所述OBS网络包括光子脉冲串交换(PBS)网络,OBS网络交换节点包括PBS交换节点,且OBS边缘节点包括PBS边缘节点。
18.如权利要求17所述的系统,其特征在于,每个OBS网络都包括波分复用(WDM)PBS网络。
19.如权利要求17所述的系统,其特征在于,PBS边缘节点的至少一个包括与相应SAN网关共同定位的模块。
20.如权利要求17所述的系统,其特征在于,PBS边缘节点的至少一个包括与相应的边缘网关协议路由器模块共同定位的模块。
21.一种系统,包括多个SAN(存储区域网络和服务器区域网络),它们每一个都包括各自的SAN网关;以及多个光脉冲串交换(OBS)网络交换/边缘节点,它们每一个都与各自的SAN网关通信耦合并光耦合到至少一个其它OBS网络交换/边缘节点。
22.如权利要求21所述的系统,其特征在于,所述多个OBS交换/边缘节点的至少一个在各自的SAN网关处被共同定位。
23.如权利要求21所述的系统,其特征在于,所述光脉冲串交换网络包括光子脉冲串交换(PBS)网络。
24.如权利要求23所述的系统,其特征在于,所述光脉冲串交换网络包括波分复用(WDM)PBS网络。
25.一种系统,包括包括具有布线通信信道的交换织构的底板,所述布线通信信道用于提供传播信息的媒介;存储区域网络(SAN)网关模块,用于提供与耦合到所述布线通信信道的SAN的接口以便在所述布线通信信道上传送数据;以及与所述布线通信信道耦合的光输入/输出(I/O)模块,所述光I/O模块包括耦合到光脉冲串交换(OBS)网络的端口,所述光I/O模块从SAN网关接收SAN格式的数据,在一个或多个数据脉冲串内封装所述数据,并在所述OBS网络上光传送所述一个或多个数据脉冲串。
26.如权利要求25所述的系统,其特征在于,还包括经由底板与所述布线通信信道耦合的传统接口模块,所述传统接口模块包括耦合到包括局域网(LAN)或广域网(WAN)之一的传统网络的端口。
27.如权利要求25所述的系统,其特征在于,所述光脉冲串交换网络包括光子脉冲串交换(PBS)网络。
28.如权利要求27所述的系统,其特征在于,所述I/O模块被配置成提供实现PBS边缘节点的操作。
29.如权利要求27所述的系统,其特征在于,所述I/O模块被配置成提供操作以实现PBS交换节点和PBS边缘节点的组合。
30.如权利要求29所述的系统,其特征在于,所述I/O模块被配置成提供实现外部网关协议路由的操作。
31.如权利要求29所述的系统,其特征在于,所述外部网关协议路由包括对边界网关协议的扩展,所述边界网关协议包括对波分复用(WDM)光脉冲串交换网络的规定。
32.如权利要求25所述的系统,其特征在于,所述光I/O模块包括与所述布线通信信道耦合的总线桥路,以便从所述布线通信信道接收分组;与所述总线桥路耦合的网络处理器单元,所述网络处理器单元将经由所述总线桥路接收的分组聚集成一脉冲串;与所述网络处理器单元耦合的成帧器单元,其中所述成帧器用于将所述数据脉冲串封装入光脉冲串交换网络帧;以及与所述成帧器单元和光学网络耦合的光输出接口,其中光输出接口用于在光脉冲串交换网络上发送包括所述光网络帧的光信号。
33.如权利要求32所述的系统,其特征在于,还包括与所述总线桥路和网络处理单元耦合的通信整形器。
34.如权利要求32所述的系统,其特征在于,还包括与所述成帧器单元和网络处理单元耦合的队列单元,其中所述队列单元用于存储数据脉冲串直到它们被调度为在光脉冲串交换网络上被发送。
35.如权利要求32所述的系统,其特征在于,所述网络处理器单元形成控制脉冲串和数据脉冲串,其中所述控制脉冲串包括用于路由数据脉冲串通过光脉冲串交换网络的信息。
36.如权利要求32所述的系统,其特征在于,还包括与所述成帧器单元和光脉冲串交换网络耦合的光输入接口,其中所述光输入接口用于将包括从光学网络接收的光脉冲串交换网络帧的光脉冲串信号转换成包括光脉冲串交换网络帧信息的电信号。
37.如权利要求32所述的系统,其特征在于,所述成帧器单元也用于将来自光输入接口的光脉冲串交换网络帧信息去成帧。
38.如权利要求25所述的系统,其特征在于,所述系统根据PICMG(PCI工业计算机制造组)3.0所定义的高级电信计算架构(ATCA)标准或最近的ATCA规范被配置。
39.一种用于提供指令的机器可读媒介,所述指令在由光输入/输出(I/O)模块中的处理器执行时使得该模块执行一些操作,包括接收多个光纤信道帧;将所述多个光纤信道帧封装入一个或多个光脉冲串交换(OBS)网络数据脉冲串;以及将所述一个或多个OBS网络数据脉冲串发送到OBS边缘节点或交换节点之一。
40.如权利要求39所述的机器可读媒介,其特征在于,所述光脉冲串交换网络包括光子脉冲串交换(PBS)网络。
41.如权利要求39所述的机器可读媒介,其特征在于,还提供其它指令,所述指令使光I/O模块执行一些操作,包括经由OBS网络接收OBS数据脉冲串帧;将所述OBS数据脉冲串帧去成帧以提取一个或多个封装的FC帧;以及将所述FC帧提供给SAN网关。
42.如权利要求39所述的机器可读媒介,其特征在于,提供其它指令以使光I/O模块执行一些操作,包括从一FC帧中提取路由数据,所述路由数据标识所述数据要路由到的目的地地址;从一路由表中存储的路径中选择可用于达到所述目的地地址的一路径;以及将其中封装所述FC帧的数据脉冲串转发到所选路径中的下一个中继段。
43.如权利要求42所述的机器可读媒介,其特征在于,光I/O模块包括接收数据的入口节点,且所述数据将被转发到OBS网络的出口节点,所述机器可读媒介用于提供其它指令以使光I/O模块执行一些操作,包括保留在入口节点和出口节点之间跨越的光通路;以及在被保留的所述光通路上发送数据脉冲串。
全文摘要
一种用于经由光脉冲串交换(OBS)网络与SAN(存储区域网络和服务器区域网络)路由高速数据的方法和系统。包括边缘节点和交换节点的OBS网络组件耦合于SAN岛之间。在一个实施例中,OBS网络包括光子脉冲串交换(PBS)网络。在一种方案下,PBS边缘节点和SAN网关共同定位于与SAN的接口处,同时多个PBS交换节点部署于PBS边缘节点之间。在另一方案下,PBS交换/边缘节点共同定位于各自的SAN处。该方案采用用于经由选定的路径段路由数据的外部网关协议(EGP)。到达SAN和从SAN接收的数据被封装为光纤信道帧。经由PBS网络传送的数据被转换成具有封装的光纤信道帧的PBS帧。该方案还支持与诸如LAN和WAN的传统网络的接口。
文档编号H04Q11/00GK1890943SQ200480036871
公开日2007年1月3日 申请日期2004年12月3日 优先权日2003年12月19日
发明者S·奥瓦德亚 申请人:英特尔公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1