用于无损耗以太网的基于端口和优先级的流控制机制的制作方法

文档序号:7989736阅读:487来源:国知局
用于无损耗以太网的基于端口和优先级的流控制机制的制作方法
【专利摘要】一种包括聚合/核心交换机的设备,所述聚合/核心交换机用于耦合到边缘交换机并接收与所述边缘交换机的多个面向终端系统的端口相关的信息,其中与所述面向终端系统的端口相关的信息用于使所述面向终端系统的端口与所述聚合/核心交换机处的多个对应队列相关联。还揭示了一种网络组件,所述网络组件包括:接收器,其用于接收与边缘交换机的多个面向终端系统的端口相关的信息;处理器,其用于为所述面向终端系统的端口建立多个对应队列并使所述面向终端系统的端口与所述多个对应队列相关联;以及发射器,其用于返回与相关联的面向终端系统的端口相关的信息。
【专利说明】用于无损耗以太网的基于端口和优先级的流控制机制
相关申请案的交叉参考
[0001]本发明要求2011年12月23日递交的发明名称为“用于无损耗以太网的基于端口和优先级的流控制机制(Port and Priority Based Flow Control Mechanism forLossless Ethernet)” 的第 13/336, 260 号非美国临时专利申请案(Non-U.S.ProvisionalPatent Applicationl3/336, 260)的在先申请优先权,并且要求熊(Y.Xiong)在2011年4月29日递交的发明名称为“对以太网承载光纤通道进行集中控制和管理的方法和系统(Method and System of Centralized Control and Management for Fiber Channel overEthernet Networks)”的第61/480,671号美国临时专利申请案的在先申请优先权,这两项在先申请的内容以引入的方式并入本文本中,如同全文转载一般。
关于联邦政府所资助的研发的声明
[0002]不适用。
参考缩微胶片附录
[0003]不适用。
【技术领域】

【背景技术】
[0004]以太网承载光纤通道(Fiber Channel over Ethernet, FCoE)是一项用于经由以太网传输光纤通道(FC)帧的技术,该项技术当前正在通过国际信息技术标准委员会(INCITS)的光纤通道技术委员会(Tll)实现标准化。所传输FC帧的使用是基于用于存储组网(storage networking)的FC架构。FCoE技术在不改变FC成巾贞(FC-2)层和较高层的情况下,采用以太网架构的以太网物理层和媒体接入控制(MAC)层来替代FC架构的FC物理(FC-O)层和FC编码(FC-1)层。通过使用FCoE技术,FC帧和标准以太网帧可在网络中独立传输。因此,FC帧映射到以太网帧上,并且随后在以太网链路上发射,这样能在基于FC的网络与基于以太网的网络之间实现大体上无缝的集成。FCoE技术可用于基于FC的存储区域网络(SAN)的服务器输入/输出(1/0)合并,并且有可能用于为基于以太网的数据中心建立统一的网络基础设施,其中所述基于FC的存储区域网络(SAN)在企业数据中心内得到广泛使用。

【发明内容】

[0005]在一个实施例中,本发明包含一种包括聚合/核心交换机的设备,所述聚合/核心交换机用于耦合到边缘交换机并接收与所述边缘交换机的多个面向终端系统的端口相关的信息,其中与所述面向终端系统的端口相关的信息用于使所述面向终端系统的端口与所述聚合/核心交换机处的多个对应队列相关联。
[0006]在另一个实施例中,本发明包含一种网络组件,所述网络组件包括:接收器,其用于接收与边缘交换机的多个面向终端系统的端口相关的信息;处理器,其用于为所述面向终端系统的端口建立多个对应队列并使所述面向终端系统的端口与所述多个对应队列相关联;以及发射器,其用于返回与相关联的面向终端系统的端口相关的信息。
[0007]在另一种实施例中,本发明包含一种由网络组件实施的方法,所述方法包括:从数据中心内的边缘交换机接收与所述边缘交换机的多个面向终端系统的端口相关的信息;以及使耦合到所述边缘交换机的聚合/核心交换机处的多个数据转发队列与所述边缘交换机的面向终端系统的端口相关联。
[0008]在又一个实施例中,本发明包含一种包括边缘交换机的设备,所述边缘交换机包括多个面向终端系统的端口,并且用于经由所述面向终端系统的端口而耦合到多个终端系统且耦合到聚合/核心交换机,并且用于将与所述面向终端系统的端口有关的信息发送到所述聚合/核心交换机,其中与面向终端系统的端口相关的信息用于使面向终端系统的端口与聚合/核心交换机处的多个对应队列相关联。
[0009]从结合附图和权利要求书进行的以下详细描述中将更清楚地理解这些和其他特征。
【专利附图】

【附图说明】
[0010]为了更完整地理解本发明,现在参考以下结合附图和【具体实施方式】进行的简要描述,其中相同参考标号表不相同部分。
[0011]图1是基于优先级的流控制(PFC)系统的一个实施例的示意图。
[0012]图2是基于优先级和端口的流控制(PPFC)系统的一个实施例的示意图。
[0013]图3是队列关联方案的一个实施例的示意图。
[0014]图4是队列关联方案的另一个实施例的不意图。
[0015]图5是队列关联方案的另一个实施例的示意图。
[0016]图6是队列关联方案的另一个实施例的不意图。
[0017]图7是队列关联方案的另一个实施例的示意图。
[0018]图8为PPFC队列缩放架构的另一个实施例的示意图。
[0019]图9是PPFC包数据单元(PDU)的一个实施例的示意图。
[0020]图10是PPFC方法的一个实施例的流程图。
[0021]图11是网络单元的一个实施例的示意图。
[0022]图12是通用计算机系统的一个实施例的示意图。
【具体实施方式】
[0023]首先应理解,尽管下文提供一个或多个实施例的说明性实施方案,但所揭示的系统和/或方法可使用任何数目的技术来实施,无论该技术是当前已知还是现有的。本发明决不应限于下文所说明的说明性实施方案、附图和技术,包含本文本所说明并描述的示例性设计和实施方案,而是可在所附权利要求书的范围以及其等效物的完整范围内进行修改。
[0024]在包交换网络(packet switched network)中,可能因业务拥塞而引起交换机缓冲区溢流,因此可能发生丢包。一些网络业务,例如,使用FCoE的FC业务,不能容许任何实质性的丢包。为了支持此类业务,例如,在以太网中支持,提出了 PFC以保证无损耗的包通信,这在以下标准中有所描述,即,电气和电子工程师协会(IEEE) P802.lQbb/D2.3标准,2010年5月25日,标题为“基于优先级的流控制(Priority-based Flow Control)”,该标准的内容以引入的方式并入本文本中。图1图示了可在数据中心内使用的PFC系统100的一个实施例。PFC系统100可包括:一个或多个聚合/核心交换机110,耦合到聚合/核心交换机110的至少一个边缘交换机120,以及耦合到边缘交换机120的多个终端系统130。PFC系统100的组件可如图1所示进行布置。
[0025]聚合/核心交换机110和边缘交换机120可以是用于以包或帧的形式传送以太网数据等数据中心内数据的任何网络组件或节点。聚合/核心交换机110和边缘交换机120可基于因特网协议(IP)地址和/或MAC地址等网络地址将数据转发到数据中心内的目的组件,其中所述网络地址可在数据中指示出来。还可使用转发表来转发数据,例如,保存在聚合/核心交换机110以及边缘交换机120中的转发表。边缘交换机120可对应于数据中心内的机柜顶部(top-of-raCk,T0R)交换机。终端系统130可以是经耦合且经配置以与服务器和/或存储装置等数据中心交换数据的任何系统、组件或节点。
[0026]每个聚合/核心交换机110可包括用于不同优先级业务的多个队列(例如,用于高优先级业务Q(Hi)的队列以及用于低优先级业务Q(Lo)的队列)。所述队列可位于聚合/核心交换机110中的数据缓冲区(未示出)中。每个聚合/核心交换机110中的每个端口的队列数目可大致相同(例如,如果支持两个业务优先级,那么每个聚合/核心交换机110中的每个端口具有约两个队列)。每个聚合/核心交换机110还可包括可经由调度程序(S)耦合到所述队列的输出或传出(outgoing)端口 112 (标签为TX)。
[0027]边缘交换机120可包括:一个或多个入端口 122 (标签为RX);耦合到每个入端口122的内部交换逻辑单元123 ;包分类单元124、队列和缓冲区管理单元125以及数据缓冲区126,以上各者均耦合到内部交换逻辑单元123 ;以及耦合到数据缓冲区126的一个或多个出端口 128 (标签为TX)。入端口 122中的每一者可耦合到聚合/核心交换机110中的一者,并且出端口 128中的每一者可稱合到终端系统130中的一者。边缘父换机120中入端口 122的数目可与出端口 128的数目相同或不同。边缘交换机120的组件可如图1所示进行布置。
[0028]每个入端口 122可经由聚合/核心交换机110的传出端口 112耦合到聚合/核心交换机Iio中的一者,并且可用于从对应聚合/核心交换机110接收数据(例如,包)。内部交换逻辑单元123、包分类单元124以及队列和缓冲区管理单元125可彼此通信以确定:在入端口 122中接收的包中哪个包需要发送,以及所述需要发送的包将发送到数据缓冲区126中多个队列中的哪个队列。包分类单元124可例如通过使用包中的数据来确定所接收包的优先级(例如,高优先级或低优先级)以及出端口。队列和缓冲区管理单元125可确定数据缓冲区126中适于接收由包分类单元124进行分类的包的队列。内部交换逻辑单元123可按照队列和缓冲区管理单元125的指示,将包从入端口 122交换到数据缓冲区126中的
合适队列。数据缓冲区126可包括多个队列(例如,Ql.....Qk.....Qn,其中k和n是整数
并且k〈n),这些队列可耦合到对应出端口 128 (例如,TX1、...、TXk、...、TXn)。
[0029]每个出端口 128可与数据缓冲区126中可具有不同优先级(例如,低(Lo)和高(Hi)优先级)的至少两个对应队列耦合并关联。每个出端口 128可耦合到单独的一组队列(例如,针对低优先级包和高优先级包的约两个队列)。耦合到同一出端口 128的队列的业务可由对应调度程序(S)来调度,所述对应调度程序(S)位于组中队列与相关联出端口 128之间。指配给每个出端口 128的队列的数目可与指配给其他TX128的队列的数目大致相同(例如,约两个队列)。每个TX128可将接收自队列的包转发到一个对应终端系统130。终端系统130可接收并使用来自出端口 128的数据。从聚合/核心交换机110发送到边缘交换机120并且随后发送到对应终端系统130的数据或包据称是在下游方向上进行转发。边缘交换机120还可在上游方向上转发数据或包,即从终端系统130转发到聚合/核心交换机110 (未示出)。
[0030]在一些情况下,业务拥塞可能在边缘交换机120中发生,例如,在下游方向上发生,即从聚合/核心交换机110中任一者到边缘交换机120。当边缘交换机120与转发聚合/核心交换机(forwarding aggregation/core switch) 110之间的链路带宽可能实质上大于边缘交换机120与接收终端系统(receiving end system) 130之间的链路带宽时,贝Ij可能发生这种拥塞,至少会在局部发生。通常,数据缓冲区126的内存或存储容量可能实质上小于聚合/核心交换机110的内存或存储容量,这归因于,例如,对边缘交换机120的以下约束:较高端口密度、较小物理大小(例如,约一到两个机柜单元)和/或较低成本。在运载不容许实质性丢包的FC业务的情况下,如果边缘交换机120中发生业务拥塞,那么可将反压(backpressure)请求发送到转发聚合/核心交换机110。反压请求可使聚合/核心交换机110拖延包的转发,并因此避免FCoE丢包。
[0031]此反压程序可在PFC系统100中使用并且可保证无损耗的包通信。然而,在某些情况下,拖延或阻塞(blocking)聚合/核心交换机110中的包可能使转发聚合/核心交换机110发生队头(head-Of-line,H0L)阻塞。HOL阻塞是以下状况:响应于来自边缘交换机120的反压请求,所述反压请求针对一个(或多个)出端口但非全部出端口,聚合/核心交换机110停止将某一优先级上的业务发送到边缘交换机120处的所有出端口。当边缘交换机120判定高优先级队列Ql(Hi)以及对应出端口(TXl)符合在入端口 122或出端口 128处声明反压的标准时,便可能发生HOL阻塞。在此情况下,边缘交换机120可使用PFC帧将针对业务Hi的反压请求发送到对应聚合/核心交换机110 (例如,图1中的聚合/核心交换机A)。因此,聚合/核心交换机110—旦从边缘交换机120接收到所述PFC帧,便可停止将高优先级包从Q(Hi)发送到边缘交换机120。即使Q(Hi)中存在指定给边缘交换机120中可能未发生业务拥塞的其他出端口(例如,TXk或TXn)的高优先级包,聚合/核心交换机110也可停止包的发送。由于发送到其他未经历拥塞的出端口的业务也停止或被阻塞,这称作HOL阻塞,因此PFC方案不能有效地控制拥塞的业务,例如,在不使数据中心内的其他非拥塞业务进一步产生不必要延迟的情况下进行控制。
[0032]本文本中揭示了一种用于实施PPFC方案的系统和方法,所述系统和方法可解决HOL阻塞问题,例如,因使用PFC方案而引起的HOL阻塞问题。在PPFC方案中,聚合/核心交换机可获得与耦合到聚合/核心交换机的边缘交换机的出端口相关的信息。聚合/核心交换机还可获得出端口可到达的(终端系统的)地址。此类信息可通过使用FCoE系统的FCoE初始化协议(FIP)来获得。基于此信息,聚合/核心交换机可建立多个队列,例如,针对同一业务优先级的队列,所述队列对应于边缘交换机的多个出端口。边缘交换机还可在反压请求中向聚合/核心交换机指示所述出端口和优先级。因此,聚合/核心交换机可仅仅阻塞与所指示出端口和优先级相关联的队列,并允许其他队列将业务发送到其他出端口。PPFC方案在FcoE等要求业务无损耗的系统中具有优势。
[0033]图2图示了 PPFC系统200的一个实施例,PPFC系统200可在不引起(转发聚合/核心交换机所发生的)HOL阻塞的情况下支持数据中心内的无损耗业务。PPFC系统200可包括:一个或多个聚合/核心交换机210,耦合到聚合/核心交换机210的至少一个边缘交换机220,以及耦合到边缘交换机220的多个终端系统230。PFC系统200的组件可如图2所示进行布置。边缘交换机220和终端系统230的配置大体上可分别类似于边缘交换机120和终端系统130。
[0034]边缘交换机220可包括:一个或多个入端口 222 (标签为RX);耦合到每个入端口222的内部交换逻辑单元223 ;包分类单元224、队列和缓冲区管理单元225以及数据缓冲区226,以上各者均耦合到内部交换逻辑单元223 ;以及耦合到数据缓冲区126的一个或多个出端口 228 (标签为TX)。入端口 222中的每一者可耦合到聚合/核心交换机210中的一者,并且出端口 228中的每一者可耦合到终端系统230中的一者。边缘交换机220可包括η个出端口 228 (面向终端系统230的下游端口)以及m个入端口 222 (面向聚合/核心交换机210的上游端口),其中η和m为相等的或不等的整数。边缘交换机220的组件可配置成大体类似于边缘交换机120的对应组件,并且可如图2所示进行布置。
[0035]聚合/核心交换机210可配置成类似于聚合/核心交换机110。每个聚合/核心交换机210可包括针对不同优先级业务的多个队列(针对高优先级业务和低优先级业务的队列)。所述队列可位于聚合/核心交换机210中的数据缓冲区(未示出)中。然而,不同于聚合/核心交换机110,聚合/核心交换机210可在每个端口处包括针对高优先级业务(PQl(Hi),...、PQi(Hi)、...,PQn(Hi), i为整数并且i〈n)的多个队列,所述多个队列对应于边缘交换机220处的不同出端口 228 (例如,TX1、...、TXk、...、TXn)。这样,聚合/核心交换机210中每个端口的高优先级队列数目可约等于出端口 228的数目(并且约等于设定于数据缓冲区226中的相关联队列的数目)。另外,聚合/核心交换机210中的队列可包括针对低优先级业务Q(Lo)的队列。每个聚合/核心交换机210中的队列的总数目也可大致相同。每个聚合/核心交换机210还可包括传出或输出端口 212 (标签为TX),传出或输出端口 212可经由一个或多个调度程序(S)耦合到本地队列,例如,以分级结构或树状拓扑的方式进行耦合,如图2中所示。
[0036]聚合/核心交换机210可执行从队列到输出端口 212的分级调度。可在调度分级结构的每一级上使用不同调度算法或这些算法的组合,例如,在位于聚合/核心交换机210中的输出端口 212与队列之间的不同级调度程序(S)(例如,两个调度程序)处使用。例如,可在每一优先级/服务种类(CoS)级上(例如,在两个调度程序S的每个调度程序处)使用加权赤字轮循(weighted deficit round-robin, WDRR)调度算法。也可在优先级/CoS内
使用同一算法,例如,在直接耦合到高优先级队列(PQl (Hi).....PQi (Hi).....PQn(Hi))的
调度程序S中使用同一算法。
[0037]如上文所述,聚合/核心交换机210可具有分级结构,即不同级调度程序,例如,用于调度高(Hi)和低(Lo)两个业务优先级的约两个调度程序,如上文所述。低优先级业务能容许丢包,然而高优先级业务可以是无损耗的(不能容许丢包)。如上文所述,对于高优先级业务,聚合/核心交换机210可包括针对边缘交换机220中每个出端口 228的队列。例如,待从聚合/核心交换机210发送到一个例如TXk的出端口 228的具有高优先级的包,可发送到聚合/核心交换机210中的对应队列,例如,PQk(Hi)。当聚合/核心交换机210 (例如,聚合/核心交换机A)接收到队列PQl (Hi)的反压信息时,聚合/核心交换机210可停止对包进行调度以避免按下游方向将该包从PQl (Hi)发送出去。聚合/核心交换机210可经由对应入端口 222从边缘交换机220接收PPFC帧形式的反压信息。然而,聚合/核心交换机210可继续对包进行调度以从其他高优先级队列(例如,PQk(Hi),k=2、3、--?、!!)发送包,此类发送可不因PQl (Hi)的反压而中止或不受PQl (Hi)的反压的影响。因此,PPFC系统200可避免可能发生于PFC系统100中的HOL阻塞。
[0038] 在不同实施例中,输入列队、输出列队、输入和输出列队、共享缓冲区输出列队或以上各者的组合所用的不同交换机架构可在边缘交换机220中使用。对于边缘交换机210,未设想特定的交换机架构和缓冲区管理方案。针对所接收的每个包,业务分类单元224可确定包优先级并(在边缘交换机210中)识别所接收包的队列。队列和缓冲区管理单元225可确定是否可将所接收包列队或丢弃所接收包,以及是否可以针对接收包的入端口 222开始实施反压。尽管针对边缘交换机220未设想特定的缓冲区管理方案,但是,如果使用可在各边缘交换机间共用的共享缓冲区架构,那么数据缓冲区226中可存在针对每个优先级上的每个入端口 222的一些专用内存,以防止由其他入端口 222引起的内存缺少。数据缓冲区226中还可存在针对每个优先级上的每个出端口 228的一些专用内存。数据缓冲区的内存的其余部分可在不同优先级间或给定优先级内的业务间共享(例如,在某种程度上共享),例如,根据所使用的缓冲区管理方案的决定来进行共享。
[0039]终端系统230可包括服务器、存储装置和/或其他客户端类型节点。例如,通过使用服务器虚拟化,每个终端系统230可包括至少两个虚拟服务器(未示出)。这样,为了实现上述PPFC方案,聚合/核心交换机210可能需要知道以下信息:边缘交换机220中面向终端系统的端口(出端口 228)的数目、每个端口的ID以及每个终端系统230中可接收高优先级业务的的地址。所述地址可以是MAC地址、IP地址、FC N端口 ID、其他类型的网络地址或以上各者的组合。聚合/核心交换机210可使用所获得的地址作为业务分类输入数据的一部分以确定在聚合/核心交换机210处接收的每个包所使用的队列。
[0040]聚合/核心交换机210可使用多种方法中的一种方法来获得上述信息。例如,在一个实施例中,边缘交换机220可用显式的方式将上述信息发送到聚合/核心交换机210。在另一个实施例中,聚合/核心交换机210可用其他方式得到上述信息。在又一个实施例中,上述信息可由不同于边缘交换机220的交换机或服务器传达至聚合/核心交换机210。或者,边缘交换机210可用显式的方式将面向终端系统的端口(出端口 228)的信息发送到聚合/核心交换机210。然而,终端系统230中的地址可由单独的交换机或服务器传达至聚合/核心交换机210。下文将更详细地描述不同方法。
[0041]图3图不了队列关联方案(queue association scheme) 300的一个实施例,队列关联方案300可用在PPFC系统中,例如,PPFC系统200。队列关联方案300可用于将面向终端系统的端口(例如,出端口 228)的数目、每个终端系统(例如,终端系统230)中的地址发送到一个或多个相关联的聚合/核心交换机(例如,聚合/核心交换机210),并且可选择将边缘交换机(例如,边缘交换机220)中的其他相关信息发送到所述一个或多个相关联的聚合/核心交换机。聚合/核心交换机可使用所述信息来建立面向终端系统的端口的队列。具体而言,聚合/核心交换机可相当于FCoE交换机或FC转发器(FC Forwarder, FCF),并且边缘交换机可相当于FCoE交换机与终端系统之间的FCoE中继交换机或FIP侦听桥(FIPSnooping Bridge,FSB)。队列关联方案300可包括聚合/核心FCoE交换机310、FCoE中继交换机320以及终端节点(end node) (E节点)330,所包括的三者可分别对应于聚合/核心交换机210、边缘交换机220以及终端系统230。
[0042]队列关联方案300可用在FCoE网络中(例如,用在数据中心内),其中聚合/核心FCoE交换机310可用作FCF,例如,这在以下公开案中有所描述,S卩INCITS Tll公开案,标题为“光纤通道中枢(FC-BB-5) (Fibre Channel Backbone (FC-BB-5))”,修订版 2.0,2009年6月4日,该公开案的内容以引入的方式并入本文本中。FCoE业务可指配为高优先级。当E节点330执行针对E节点330中虚拟N端口(VN端口)的FIP结构注册(FIP fabriclogin) (FLOGI)请求时,聚合/核心FCoE交换机310 (例如,FCF A)可在接收到FIP FLOGI请求之后创建虚拟F端口(VF端口)并创建队列(例如,PQk(Hi)),所述队列可对应于E节点的MAC地址(MACX)。聚合/核心FCoE交换机310还可将端口 ID (N端口 ID)(例如,Z)指配给VN端口,并将FIP FLOGI LS-ACC (链路服务接受(Link Service Accept))回复发送到E节点MAC地址。
[0043]FCoE中继交换机320可以是FSB,所述FSB侦听在E节点330与聚合/核心FCoE交换机310之间交换的FIP消息,并且因此可知道,E节点MAC地址(MAX X)附接到FCoE中继交换机的出端口 k。FCoE中继交换机320还可知道,具有N端口 ID Z和MAC地址MAP | | Z的VN端口驻留在E节点MAC X中,并且可经由FCoE中继交换机的端口 k到达。FCoE中继交换机320还可知道,目的MAC (DMAC)是MAP | | Z的业务来自聚合/核心FCoE交换机310。VN端口 MAC地址可对应于MAC地址前缀(MAC Address Prefix, MAP)与N端口 ID Z的级联。可使用对应于OE-FC-OOh的默认MAP。针对随后经由E节点MAC X进行的VN端口结构注册,E节点330可使用FIP FDISC (发现F端口服务参数(Discover F_Port ServiceParameter))请求。聚合/核心FCoE交换机310可使指配给E节点MAC X中的VN端口的所有N端口 ID与队列PQk (Hi)相关联。例如,VN端口 I的N端口 ID Zl和VN端口 2的N端口 ID Z2均可与PQk(Hi)相关联。类似地,FCoE中继交换机320可使所有根据指配给E节点MAC X中的VN端口的N端口 ID得到的MAC地址与队列Qk (Hi)相关联,队列Qk (Hi)反过来又可与FCoE中继交换机的出端口 k相关联。
[0044]当聚合/核心FCoE交换机310接收包括目的ID (D-1D)Z的FCoE帧时,聚合/核心FCoE交换机310可将所述帧列入队列PQk (Hi)中,队列PQk (Hi)可与E节点MAC X相关联。当FCoE中继交换机320接收到DMAC为MAP I I Z且具有高优先级的以太网帧时,FCoE中继交换机320可将所述帧列入队列Qk (Hi)中,其中所述帧可以是FCoE帧,所述队列Qk (Hi)可与出端口 k相关联并因此与E节点MAC X相关联。如果FCoE中继交换机320决定针对指定给E节点MAC X的FCoE业务向聚合/核心FCoE交换机310实施反压,那么FCoE中继交换机320可向E节点MAC X发送PPFC巾贞,例如,指示端口 ID长度为约六个八比特字节并且指示端口 ID设定的PPFC帧。下文将更详细地描述所述PPFC帧。一旦接收到所述PPFC帧,聚合/核心FCoE交换机310便可使用E节点MAC X和高优先级作为索引而找到PQk(Hi),并因此停止对来自PQk(Hi)的帧的调度。
[0045]FCoE中继交换机320的出端口 k和队列Qk (Hi)以及聚合/核心FCoE交换机310中的队列PQk(Hi)均可与E节点MAC X相关联。因此,FCoE中继交换机320不需要将有关出端口和/或队列的信息传达至聚合/核心FCoE交换机310。FCoE中继交换机320和聚合/核心FCoE交换机310可包括多个表,所述表使E节点MAC地址与端口 ID、虚拟局域网ID (VID)和/或其他信息相关联。例如,FCoE中继交换机320可包括MAC转发表321,MAC转发表321可包括与对应VID、(FCoE中继交换机320处的)输出端口和/或队列ID (QID)相关联的一个或多个MAC地址。聚合/核心FCoE交换机310还可包括FC转发表311,FC转发表311可包括与(聚合/核心FCoE交换机310处的)对应输出端口、优先级、QID、下一跳MAC地址、VID或以上各者的组合相关联的一个或多个D-1D。
[0046]在队列关联方案300中,FCoE中继交换机320不需要将与面向终端系统的端口相关的信息发送到聚合/核心FCoE交换机310。然而,如果无需进行手动配置,那么可能需要数据中心桥接功能交换(Data Center Bridging Capabilities Exchange,DCBX)协议扩展来保证FCoE中继交换机320和聚合/核心FCoE交换机310均支持PPFC。DCBX协议在以下标准中有所描述,即IEEE P802.lQaz/D2.5标准,2011年3月28日,标题为“针对业务种类间带宽共享的增强发射选择(Enhanced Transmission Selection for Bandwidth Sharingbetween Traffic Classes)”,所述标准的内容以引入的方式并入本文本中。
[0047]图4图示了另一个队列关联方案400的一个实施例,队列关联方案400可用在PPFC系统中,例如,PPFC系统200。队列关联方案400可用于将面向终端系统的端口(例如,出端口 228)的数目、每个终端系统(例如,终端系统230)中的地址发送到一个或多个相关联的聚合/核心交换机(例如,聚合/核心交换机210),并且可选择将边缘交换机(例如,边缘交换机220)中的其他相关信息发送到所述一个或多个相关联的聚合/核心交换机。聚合/核心交换机可使用所述信息来建立面向终端系统的端口的队列。具体而言,聚合/核心交换机可相当于FCoE交换机或FCF,并且边缘交换机可相当于FCoE交换机与终端系统之间的N端口标识符虚拟化(NPIV)网关。队列关联方案400可包括聚合/核心FCoE交换机410,NPIV网关420以及E节点430,所包括的三者可分别对应于聚合/核心交换机210、边缘交换机220以及E节点230。
[0048]队列关联方案400可用在FCoE网络中(例如,用在数据中心内),其中聚合/核心FCoE交换机410可用作FCF。在NPIV网关420中,面向E节点的端口 k可相当于针对E节点430的FCF-MAC,并且面向FCF的端口 n+1可相当于针对聚合/核心FCoE交换机410(FCF A)的E节点。NPIV网关420可停止接收来自E节点430的FIP帧,并且可重新生成待发送到聚合/核心FCoE交换机410的FIP帧。NPIV网关420可在相反方向上(从聚合/核心FCoE交换机410到E节点430)实施同一方案。
[0049]当NPIV网关420在端口 k处从E节点430接收到FIP FLOGI请求时,NPIV网关420可创建VF端口和队列(例如,Qk (Hi)),所述VF端口和队列可对应于端口 k以及E节点430的E节点MAC X。NPIV网关420随后可将新FIP FDISC请求发送到聚合/核心FCoE交换机410 (FCF A)。新FIP FDISC请求可包括与E节点430的原始E节点MAC X相关的信息。聚合/核心FCoE交换机410对FIP FDISC请求进行处理时可类似于如上文所述的聚合/核心FCoE交换机310。然而,聚合/核心FCoE交换机410可使用(E节点430处的)原始E节点MAC X而非(NPIV网关420处的)真实E节点MAC N2,使得地址与队列PQk(Hi)和N端口 ID Z相关联。对于E节点430中的不同端口,可重复同一过程。例如,VN端口 I的N端口 ID Zl和VN端口 2的N端口 ID Z2均可与PQk (Hi)相关联。一旦从聚合/核心FCoE交换机410接收到FIP FDISC LS-ACC回复,NPIV网关420便可使VN端口 MAC地址(=MAP |Z)与出端口 k相关联(当NPIV网关420从端口 k接收FIP FLOGI请求时),并因此与Qk(Hi)和E节点MAC X相关联。
[0050]当NPIV网关420决定针对指定给E节点MAC X (例如,指定给队列Qk (Hi))的业务向聚合/核心FCoE交换机410实施反压时,NPIV网关420可向原始E节点MAC X发送PPFC帧,例如,指示端口 ID长度为约六个八比特字节并且指示端口 ID设定的PPFC帧。一旦接收到所述PPFC帧,聚合/核心FCoE交换机410便可使用E节点MAC X和高优先级作为索引而找到PQk(Hi),并停止对来自该队列的包的调度。在队列关联方案400中,NPIV网关420不需要将与面向E节点的端口相关的信息发送到聚合/核心FCoE交换机410。然而,如果无需进行手动配置,那么可能需要DCBX协议扩展来保证NPIV网关420和聚合/核心FCoE交换机410均支持PPFC。此外,聚合/核心FCoE交换机410还可包括FC转发表(未示出),例如,类似于FC转发表311的FC转发表,并且NPIV网关420也可包括FC转发表。
[0051]图5图不了另一个队列关联方案500的一个实施例,队列关联方案500可用在PPFC系统中,例如,PPFC系统200。队列关联方案500可用于将面向终端系统的端口(例如,出端口 228)的数目、每个终端系统(例如,终端系统230)中的地址发送到一个或多个相关联的聚合/核心交换机(例如,聚合/核心交换机210),并且可选择将边缘交换机(例如,边缘交换机220)中的其他相关信息发送到所述一个或多个相关联的聚合/核心交换机。聚合/核心交换机可使用所述信息来建立面向终端系统的端口的队列。具体而言,聚合/核心交换机可相当于FCoE交换机或FCF,并且边缘交换机可相当于FCoE交换机与终端系统之间的FCoE数据转发器(FDF)。队列关联方案500可包括聚合/核心FCoE交换机510、FDF520以及E节点530,所包括的三者可分别对应于聚合/核心交换机210、边缘交换机220以及终立而系统230。
[0052]队列关联方案500可类似于队列关联方案400。然而,FDF520可停止接收来自E节点530的FIP帧并且它不需要将与面向E节点的端口相关的信息发送到聚合/核心FCoE交换机510。DCBX协议扩展也可应用于队列关联方案500。不同于NPIV网关420,FDF520不能重新生成待发送到聚合/核心FCoE交换机510的FIP帧。事实上,FDF520可将N端口 ID分配请求发送到聚合/核心FCoE交换机510,所述N端口 ID分配请求可包括与队列关联方案400中的FIP帧类似的信息。聚合/核心FCoE交换机510可返回N端口 ID以及分区访问控制列表(ACL)分布信息,所返回的信息类似于上文所述的FIP FLOGI LS-ACC信息。聚合/核心FCoE交换机510还可包括FC转发表(未不出),例如,类似于FC转发表311的FC转发表,并且FDF520还可包括MAC转发表。
[0053]在队列关联方案500中,FDF520不需要将与面向E节点的端口相关的信息发送到聚合/核心FCoE交换机510。然而,如果无需进行手动配置,那么可能需要DCBX协议扩展来保证FDF520和聚合/核心FCoE交换机510均支持PPFC。
[0054]图6图不了另一个队列关联方案600的一个实施例,队列关联方案600可用在PPFC系统中,例如,PPFC系统200。队列关联方案600可用于将面向终端系统的端口(例如,出端口 228)的数目、每个终端系统(例如,终端系统230)中的地址发送到一个或多个相关联的聚合/核心交换机(例如,聚合/核心交换机210),并且可选择将边缘交换机(例如,边缘交换机220)中的其他相关信息发送到所述一个或多个相关联的聚合/核心交换机。所述信息可用于针对不同面向终端系统的端口建立队列,这与上文方案中相同。队列关联方案600可包括聚合/核心交换机610、边缘交换机620以及终端系统630,所包括的三者可分别对应于聚合/核心交换机210、边缘交换机220以及终端系统230。
[0055]边缘交换机620可用显式的方式通过消息将PPFC队列关联信息(面向终端系统的端口以及每个终端系统中的地址)发送到聚合/核心交换机610,发送时使用了 DCBX协议扩展并且可选择使用额外的信息交换。例如,包括新的对应子类型的新类型长度值(TLV)可在DCBX协议中定义,以便传达与边缘交换机的面向终端系统的端口相关的信息。新TLV可包括的TLV类型可设定为约127以及以下信息中的至少一些信息:IEEE802.1子类型ID、端口ID类型(例如,数值、MAC地址等)、端口 ID的长度、面向终端系统的端口的数目以及一列端口 ID。与面向终端系统的端口(端口 k)相关联(或耦合)的地址信息还可由边缘交换机620传达至聚合/核心交换机610,传达时使用了 IP,例如,使用传输控制协议(TransmissionControl ProtocoI,TCP)或用户数据报协议(UDP)。聚合/核心交换机610还可包括FC转发表(未示出),例如,类似于FC转发表311的FC转发表,并且边缘交换机620可包括FC转发表(未不出),例如,类似于FCoE应用条件下的FC转发表(图4中)的FC转发表。
[0056]在队列关联方案600中,边缘交换机620不需要将与面向E节点的端口相关的信息发送到聚合/核心交换机610。然而,如果无需进行手动配置,那么可能需要DCBX协议扩展来保证边缘交换机620和聚合/核心交换机610均支持PPFC。
[0057]图7图示了另一个队列关联方案700的一个实施例,队列关联方案700可用在PPFC系统中,例如,PPFC系统200。队列关联方案700可用于将面向终端系统的端口(例如,出端口 228)的数目、每个终端系统(例如,终端系统230)中的地址发送到一个或多个相关联的聚合/核心交换机(例如,聚合/核心交换机210),并且可选择将边缘交换机(例如,边缘交换机220)中的其他相关信息发送到所述一个或多个相关联的聚合/核心交换机。具体而言,聚合/核心交换机可相当于FDF或者可以是以太网交换机,并且边缘交换机可相当于聚合/核心交换机与终端系统之间的包括FIP代理的边缘FDF。队列关联方案700可包括FDF或以太网交换机710、包括FIP代理721的边缘FDF720、E节点730,所包括的三者可分别对应于聚合/核心交换机210、边缘交换机220以及终端系统230。另外,队列关联方案700可包括用于与FDF或以太网交换机710以及边缘FDF720进行通信的FCoE/FC控制和管理(FCM)节点740。
[0058]FCM节点740可如第61/480,671号美国临时专利申请案中所述进行配置。边缘FDF720以及FDF或以太网交换机710可用于转发FCoE帧,例如,使用FDF转发表来进行转发。FDF转发表可由FCM节点740来计算并且可下载到边缘FDF720以及FDF或以太网交换机710中的每一者。
[0059]一旦从(E节点730的)E节点MAC接收到FIP FL0GI/FDISC请求,边缘FDF720中的FIP代理721便可通过新消息将结构注册请求转发到FCM节点740。FCM节点740还可用于N端口 ID指配。在将N端口 ID指配给(E节点730的)VN端口之后,FCM节点740可将所指配N端口 ID通知到边缘FDF的上游聚合/核心交换机(FDF或以太网交换机710)。FCM节点740还可将耦合到VN端口和下一跳端口 ID的出端口 ID通知到FDF或以太网交换机710。下一跳端口 ID可以是端口的MAC地址,例如,端口(n+1)的MAC地址。当FDF或以太网交换机710在端口 k处接收到第一 N端口 ID时,FDF或以太网交换机710可创建该端口的队列PQk(Hi)。
[0060]可选择地,在链路发现阶段中,边缘FDF720可将与相关联的面向终端系统的端口相关的信息发送到FDF或以太网交换机710 (例如,通过使用DCBX协议)。这样,当FDF或以太网交换机710接收到N端口 ID更新时,FDF或以太网交换机710可检查或确定边缘交换机出端口 ID是否存在。DCBX协议扩展也可应用于队列关联方案700。可使用DCBX协议以将面向终端系统的端口的信息从边缘FDF720发送到FDF或以太网交换机710。
[0061]在队列关联方案700中,边缘FDF720不需要将与面向E节点的端口相关的信息发送到FDF或以太网交换机710。然而,如果无需进行手动配置,那么可能需要DCBX协议扩展来保证边缘FDF720以及FDF或以太网交换机710均支持PPFC。
[0062]图8 图不了 PPFC 队列缩放架构(PPFC queue scaling architecture) 800 的一个实施例的一个实施例,PPFC队列缩放架构800可用在PPFC系统中,例如,PPFC系统200。PPFC系统可包括:多个聚合/核心交换机810,耦合到聚合/核心交换机810的多个边缘交换机820,以及耦合到边缘交换机820的多个E节点830。聚合/核心交换机810、边缘交换机820以及E节点830可分别对应于聚合/核心交换机210、边缘交换机220以及E节点230。
[0063]队列缩放架构800可包括多个队列,所述多个队列可保存在聚合/核心交换机810中,以便计算(边缘交换机820中)面向终端系统的端口的数目以及业务优先级的数目。每个聚合/核心交换机810可包括保存有队列分级结构或树状结构的数据缓冲区814,所述队列分级结构或树状结构可包括约两个调度级(例如,使用两个调度程序S)。第一调度级可用于从聚合/核心交换机810调度来自所有可用业务优先级的业务。业务优先级可包含不同高优先级(例如,针对无损耗业务)与较低优先级(例如,针对容许损耗的业务)的组合。第二较高调度级可用于在多个队列(或子队列)之间调度高优先级业务,所述多个队列对应于边缘交换机820中面向终端系统的不同端口。在第二调度级处,当从边缘交换机820接收到反压请求时,对应于面向终端系统的任一端口的队列(或子队列)可能被阻塞,因而不能发射出去,然而其余的同级队列或子队列,即面向终端系统的其他端口所用的同级队列或子队列,可继续接收数据、将数据列队以及发射数据。边缘交换机820可发送指示出一个面向终端系统的端口的反压请求,例如,发送条件为边缘交换机820处的对应队列发生拥塞或已满。聚合/核心交换机810还可包括FC转发表811,例如,类似于FC转发表311的FC转发表。
[0064]例如,业务可分成八个不同优先级。因此,数据缓冲区814中的第一交换级可用于
在以下八个队列之间进行调度:Q(0).....Q(3).....Q(7)。较高优先级队列中的至少一个
队列,例如,Q(3)(—种逻辑结构),可用于无损耗业务。此外,边缘交换机820中面向终端系统的端口的数目可等于出端口的数目n,所述η个出端口可耦合到η个对应E节点830 (图中示出了 N端口 ID为Zl和Ζ40的VN端口,所述两个VN端口分别驻留在MAC地址为MACl和MAC40的E节点830中)。因此,数据缓冲区814中的第二调度级可用于在以下η个子队
列之间进行调度=PQl (3).....PQi (3).....PQn⑶。所述分级结构可用于容纳任何数目个
面向终端的端口(并因此容纳任何数目个高优先级队列或子队列)以及任何数目个业务优先级。如果另一个优先级队列也用于无损耗业务,例如,Q(7),那么该优先级的另一组数目为n的子队列(未示出)可用于(在第二调度级处)接收指定给n个面向终端系统的端口的业务并将所述业务列队。每一组子队列可使用(第二调度级处的)对应调度程序来进行调度。
[0065]在一个实施例中,聚合/核心交换机810的每个输出端口可包括(在数据缓冲区814内)最多约320 (或8X40)个队列,所述约320个队列对应于约八个优先级并且每个优先级具有约40个队列。如果所述八个优先级中仅两个优先级(指定为高优先级)要求业务无损耗,那么队列数目可显著减少,例如,减少至约86 (或6+2X40)个队列,所述约86个队列对应于约两个高优先级,每个高优先级具有约40个队列,以及其余优先级的约六个额外队列。通过使用业务管理器(TM)芯片或网络处理器(NPU)和TM芯片,具有此数目的队列可得到支持。可进一步使用片外内存(通过支付额外费用)来增大单位端口大小的缓冲区(例如,缓冲时间为约100毫秒)。在一些情况下,可能需要限制(数据缓冲区814中的)队列的数目。因此,可使用基于轮循或散列法的方法来将物理内存位置共享为多个队列(针对不同端口和/或不同优先级)。例如,可使用基于E节点MAC地址的散列法,例如,在进行结构注册时使用。
[0066]图9图示了 PPFC PDU900的一个实施例,PPFC PDU900可用于将反压信息从边缘交换机发送到聚合/核心交换机。反压信息可详细说明边缘交换机处的出端口 ID以及与反压请求相关的业务优先级。PPFC rou900可由聚合/核心交换机来接收,响应于反压请求,所述聚合/核心交换机随后可使用所述出端口 ID以及所述业务优先级来识别对应队列并阻塞该队列中的业务。PPFC HXraOO可包括操作代码(operation code或opcode)字段910、端口 ID长度字段920、端口 ID字段930、优先级启用矢量(priority-enable-vector)字段940以及多个时隙950。操作代码字段910、优先级启用矢量字段940以及时隙950可配置成类似于IEEEP802.lQbb/D2.3标准中所描述PFC帧中的对应字段。
[0067]操作代码字段910可包括指示PPFC roU900类型或格式的值(例如,01-02),并且操作代码字段910的大小为约两个八比特字节。所述操作代码值可由接收器使用以将rou识别为PPFC PDU0端口 ID长度字段920可指示端口 ID字段930的长度并且端口 ID长度字段920的大小可为约两个八比特字节。端口 ID字段930可指示边缘交换机的面向终端系统的端口并且端口 ID字段930可具有可变大小。所指示端口 ID可对应于所述端口的MAC地址或仅识别所述端口的任何其他ID。
[0068]优先级启用矢量字段940可指示所指示端口 ID的业务优先级。优先级启用矢量字段940可包括矢量,所述矢量包含对应于不同优先级的多个时隙或子字段。例如,在八个
业务优先级的情况下,所述矢量可包括对应于八个优先级的八个子字段或时隙(e[0].....e[n].....e[7],其中n〈7)。可设定与端口 ID的优先级对应的时隙(例如,设定为约一),并
且不可设定其余时隙(例如,可设定为约零)。当聚合/核心交换机接收到端口 ID以及一个(或多个)被指示优先级时,聚合/核心交换机可阻塞数据缓冲区中的一个(或多个)对应队列。优先级启用矢量字段940的大小可为约两个八比特字节。
[0069]时隙950可针对每个优先级指示出队列中应被阻塞以避免继续发射数据或帧的长度。例如,阻塞时间可按毫秒来指示。在八个业务优先级的情况下,时隙950的数目可等
于八(时间[0].....时间[n].....时间[7],其中n〈7),所述八个时隙950可对应于八个优
先级。时隙950中对应于优先级启用矢量字段940中所设定时隙的值可以是有效的,而其余时隙950可被接收器(聚合/核心交换机)丢弃。例如,如果仅设定了 e[7],那么只有时间[7]的值可以是有效的。每个时隙950的大小可为约两个八比特字节。在一些情况下,针对不同优先级的多个队列可大致在同一时间阻塞。例如,e[3]和e[7]均可设定为约一,并且因此时间[3]和时间[7]可以是有效的。
[0070]图10图示了 PPFC方法1000的一个实施例,PPFC方法1000可在PPFC系统中实施,例如,在PPFC系统200中实施。PPFC方法1000可由聚合/核心交换机来实施,所述聚合/核心交换机与边缘交换机、终端系统、另一个网络组件或以上各者的组合进行通信。PPFC方法1000可包括使聚合/核心交换机中的多个队列与边缘交换机的多个面向终端系统的端口(出端口)相关联。所述队列可指配给同一业务优先级。PPFC方法1000还可包括,阻塞所述队列中对应于所指示的面向终端系统的端口以及业务优先级的一个队列(以实施反压),但不阻塞针对其他面向终端系统的端口的其余队列。因此,PPFC方法1000可在不造成HOL阻塞的情况下提供对拥塞业务的有效控制,这可以有益于无损耗FCoE业务。
[0071]PPFC方法1000可从框1010处开始,在框1010处,可接收与多个面向终端系统的端口相关的信息。聚合/核心交换机可例如通过使用上文所述的任一队列关联方案,从边缘交换机、终端系统、另一个组件或以上各者的组合接收信息。所述信息可包括面向终端系统的端口的数目以及终端系统处的相关联MAC地址。还可接收额外信息,例如,与每个端口相关联的业务优先级以及/或者可用于使数据转发队列与面向终端系统的端口相关联的其他息。
[0072]在框1020处,可针对所述面向终端系统的端口建立多个数据转发队列并使所述多个数据转发队列与所述面向终端系统的端口相关联。可通过使用聚合/核心交换机的数据缓冲区中的专用内存来建立所述队列。可通过使用FC转发表811等转发表而使所述队列与所述面向终端系统的端口相关联。在框1030处,可接收指示出面向终端系统的端口中的一个端口以及业务优先级的反压请求。例如,反压请求可由边缘交换机通过使用PPFC帧900等PPFC帧发送到聚合/核心交换机。边缘交换机处被指示的终端系统端口可能在所指示业务优先级上发生拥塞,并且因此可能不需要接收业务或接收较少的业务。
[0073]在框1040处,对应于所述面向终端系统的端口以及所述业务优先级的数据转发队列可被阻塞以避免继续转发业务。聚合/核心交换机可阻塞与所指示的面向终端系统的端口以及业务优先级相关联(在转发表中)的队列以避免继续转发业务。这样可使边缘交换机处的所述面向终端系统的端口不能从聚合/核心交换机接收业务或从聚合/核心交换机接收到较少业务,例如,直到解决业务拥塞才接收到业务。然而,边缘交换机处面向终端系统的其余端口可继续从聚合/核心交换机接收业务(例如,在同一业务优先级上进行接收)。随后,PPFC方法1000可结束。
[0074]图11图示了网络单元1100的一个实施例,网络单元1100可以是通过网络传输和处理数据的任何装置。例如,网络单元1100可位于数据中心内,并且可对应于聚合/核心交换机、边缘交换机和/或终端系统(或E节点)。网络单元1100可包括一个或多个入端口或单元1110,入端口或单元1110耦合到用于从其他网络组件接收信号和帧/数据的接收器(Rx)1112。网络单元1100可包括逻辑单元1120,逻辑单元1120用于确定将数据发送到哪些网络组件。逻辑单元1120可通过使用硬件、软件或这两者来实施。网络单元1100还可包括一个或多个出端口或单元1130,出端口或单元1130耦合到用于将信号和帧/数据发射到其他网络组件的发射器(Tx)1132。接收器1112、逻辑单元1120以及发射器1132还可实施或支持上文中的任一种队列关联方案和/或PPFC方法1000。网络单元1100的组件可如图11所示进行布置。
[0075]上文所述的组件和/或方法可在任何通用网络组件上实施,例如,具有足够的处理能力、内存资源以及网络吞吐能力以处理所承受的必要工作量的计算机或网络组件。图12图示了典型的通用网络组件1200,其适用于实施本文本所揭示组件的一个或多个实施例。网络组件1200包含处理器1202 (可称为中央处理器单元或CPU),处理器1202与包含以下项的存储装置进行通信:辅助存储器1204、只读存储器(ROM) 1206、随机存取存储器(RAM) 1208、输入/输出(I/O)装置1210,以及网络连接装置1212。处理器1202可作为一个或多个CPU芯片来实施,或者可以是一个或多个专用集成电路(ASIC)和/或数字信号处理器(DSP)的一部分。
[0076]辅助存储器1204通常由一个或多个磁盘驱动器或磁带驱动器组成并用于数据的非易失性存储,并且如果RAM1208的大小不足以保存所有工作数据,那么辅助存储器1204被用作溢流数据存储装置。辅助存储器1204可用于存储程序,当选择执行这些程序时,所述程序将加载到RAM1208中。R0M1206用于存储在执行程序期间读取的指令,且可能存储所读取的数据。R0M1206为非易失性存储装置,其存储器容量相对于辅助存储器1204的较大存储器容量而言通常较小。RAM1208用于存储易失性数据,还可能用于存储指令。访问ROMl206和RAM1208通常比访问辅助存储器1204要快。
[0077]本文本揭示至少一个实施例,且所属领域的技术人员对所述实施例和/或所述实施例的特征所进行的改变、组合和/或修改在本发明的范围内。因组合、合并和/或省略所述实施例的特征而产生的替代实施例也在本发明的范围内。在明确说明数值范围或限制的情况下,此类表达范围或限制应被理解为在明确说明的范围或限制内具有相同大小的迭代范围或限制(例如,从约I 到约10包含2、3、4等;大于0.10包含0.11,0.12,0.13等)。例如,只要揭示具有下限R1和上限Ru的数值范围,则特别揭示落入所述范围内的任何数字。具体而言,特别揭示所述范围内的以下数字A=Rfk* (Ru-R1),其中k为从1%到100%范围内
以 1% 递增的变量,即,k 为 1%、2%、3%、4%、7%、......、70%、71%、72%、......、97%、96%、97%、98%、
99%或100%。此外,还特定揭示由上文所定义的两个R数字界定的任何数值范围。对权利要求的任一元素使用术语“可选择地”意味着需要所述元素,或者并不需要所述元素,两种替代方案均在所述权利要求的范围内。应将使用“包含”、“包括”和“具有”等范围较大的术语理解为支持“由……组成”、“基本上由……组成”以及“大体上由……组成”等范围较窄的术语。因此,保护范围不受上文所陈述的描述限制,而是由所附权利要求书界定,所述范围包含所附权利要求书的标的物的所有等效物。每一和每项权利要求作为进一步揭示内容并入说明书中,且权利要求书是本发明的实施例。本发明中对参考的论述并不是承认其为现有技术,尤其是
【公开日】期在本申请案的在先申请 优先权日:期之后的任何参考。本发明中所引用的所有专利、专利申请案和公开案的揭示内容以引入的方式并入本文本中,其提供补充本发明的示例性、程序性或其他细节。
[0078]虽然本发明中已提供若干实施例,但应理解,在不脱离本发明的精神或范围的情况下,所揭示的系统和方法可用许多其他具体形式来实施。本发明的实例应被视为说明性的而非限制性的,且本发明不限于本文本所给出的细节。例如,各种元件或组件可在另一系统中组合或合并,或者某些特征可省略或不实施。[0079]另外,在不脱离本发明的范围的情况下,各种实施例中描述和说明为离散或单独的技术、系统、子系统和方法可与其他系统、模块、技术或方法组合或合并。展示或讨论为彼此耦合或直接耦合或通信的其他项也可用电气方式、机械方式或其他方式通过某一接口、装置或中间组件间接地耦合或通信。改变、替代和更改的其他实例可由所属领域的技术人员确定,且可在不脱离本文本所揭示的精神和范围的情况下作出。
【权利要求】
1.一种设备,包括: 聚合/核心交换机,用于耦合到边缘交换机并接收与所述边缘交换机的多个面向终端系统的端口相关的信息, 其中与所述面向终端系统的端口相关的所述信息用于使所述面向终端系统的端口与所述聚合/核心交换机处的多个对应队列相关联。
2.根据权利要求1所述的设备,其中使所述面向终端系统的端口与多个对应队列相关联包括:针对与所述边缘交换机的所述面向终端系统的端口相关联的同一业务优先级而建立多个队列。
3.根据权利要求 2所述的设备,其中所述聚合/核心交换机包括: 第一调度程序,其耦合到与所述同一业务优先级相关联的多个第一级队列,所述同一业务优先级与所述面向终端系统的端口相关联,并且所述第一调度程序指配给高优先级业务级; 第二调度程序,其耦合到所述第一调度程序以及与所述面向终端系统的端口相关联的额外队列,并且所述第二调度程序指配给低优先级业务级;以及 输出端口,其耦合到所述第二调度程序和所述边缘交换机。
4.根据权利要求2所述的设备,其中所述聚合/核心交换机用于:从所述边缘交换机接收反压请求,所述反压请求所具有的信息指示出所述面向终端系统的端口中的至少一者以及相关联的业务优先级;阻塞所述队列中与所指示的面向终端系统的端口以及所述业务优先级相关联的一个队列;以及允许所述多个队列中的其他队列服务于其他面向终端系统的端口。
5.根据权利要求2所述的设备,其中所述多个队列通过使用转发表而与所述面向终端系统的端口相关联,所述转发表包括以下各者中的至少一者:对应于媒体接入控制(MAC)地址的目的标识符(ID)、所述聚合/核心交换机的相关联输出端口 ID、相关联业务优先级、相关联队列ID(QID)、对应于所述目的ID的相关联下一跳MAC地址以及相关联虚拟局域网ID (VID)0
6.根据权利要求1所述的设备,其中所述边缘交换机经由所述面向终端系统的端口耦合到多个终端系统。
7.根据权利要求6所述的设备,其中与所述面向终端系统相关的端口的所述信息包括所述终端系统的多个媒体介入控制(MAC)地址。
8.一种网络组件,包括: 接收器,其用于接收与边缘交换机的多个面向终端系统的端口相关的信息; 处理器,其用于为所述面向终端系统的端口建立多个对应队列并使所述面向终端系统的端口与所述多个对应队列相关联;以及 发射器,其用于返回与相关联的面向终端系统的端口相关的信息。
9.根据权利要求8所述的网络组件,其中所接收的信息指示面向终端系统的端口的数目以及耦合到所述边缘交换机的多个终端系统的多个媒体接入控制(MAC)地址,并且其中所返回的信息指示指配给所述终端系统的多个端口标识符(ID)。
10.根据权利要求9所述的网络组件,其中当所述终端系统包括多个FCoE节点(E节点)时,所述MAC地址和所述端口 ID对应于所述E节点。
11.根据权利要求10所述的网络组件,其中当所述E节点包括多个虚拟端口时,所述MAC地址和所述端口 ID对应于所述虚拟端口。
12.根据权利要求8所述的网络组件,其中所述网络组件是光纤通道(FC)转发器(FCF),并且所述边缘交换机是以太网承载光纤通道(FCoE)初始化协议(FIP)侦听桥(FSB),并且其中所述FCF从终端系统接收与所述面向终端系统的端口相关的所述信息,并通过使用FIP经由所述FSB将与所述相关联的面向终端系统的端口相关的所述信息返回给所述终端系统。
13.根据权利要求8所述的网络组件,其中所述网络组件是光纤通道(FC)转发器(FCF),并且所述边缘交换机是N端口标识符虚拟化(NPIV)网关,其中所述FCF从所述NPIV网关接收与所述面向终端系统的端口相关的所述信息,并通过使用以太网承载光纤通道(FCoE)初始化协议(FIP)将与所述相关联的面向终端系统的端口相关的所述信息返回给所述NPIV网关,并且其中所述NPIV网关接收、重新生成且转发来自终端系统的与所述面向终端系统的端口相关的所述信息,并通过使用FIP而接收、重新生成且转发来自所述FCF的与所述相关联的面向终端系统的端口相关的所述信息。
14.根据权利要求8所述的网络组件,其中所述网络组件是光纤通道(FC)转发器(FCF),并且所述边缘交换机是数据平面转发器(FDF),其中所述FDF从终端系统接收与所述面向终端系统的端口相关的所述信息,并通过使用以太网承载光纤通道(FCoE)初始化协议(FIP)将与所述相关联的面向终端系统的端口相关的所述信息返回给所述终端系统,并且其中所述FDF将与所述面向终端系统的端口相关的所述信息发送到所述FCF,并在不使用FIP的情况下接收来自所述FCF的与所述相关联的面向终端系统的端口相关的所述信肩、O
15.根据权利要求8所述的网络组件,其中与所述面向终端系统的端口相关的所述信息是从所述边缘交换机接收,并且与所述相关联的面向终端系统的端口相关的所述信息是通过使用数据中心桥接功能交换(DCBX)协议、因特网协议(IP)或两者而返回给所述边缘交换机。
16.根据权利要求8所述的网络组件,其中所述网络组件是FCoE数据转发器(FDF),并且所述边缘交换机是包括了以太网承载光纤通道(FCoE)初始化协议(FIP)代理的边缘FDF,其中所述FDF从所述边缘FDF接收与所述面向终端系统的端口相关的所述信息,并通过使用数据中心桥接功能交换(DCBX)协议、经由耦接到所述FDF和所述边缘FDF的FCoE控制和管理(FCM)节点而将与所述相关联的面向终端系统的端口相关的所述信息返回给所述边缘FDF,并且其中所述边缘FDF从终端系统接收与所述面向终端系统的端口相关的所述信息,并通过使用FIP将与所述相关联的面向终端系统的端口相关的所述信息返回给所述终端系统。
17.一种由网络组件实施的方法,包括: 从边缘交换机接收与所述边缘交换机的多个面向终端系统的端口相关的信息;以及 使耦合到所述边缘交换机的聚合/核心交换机处的多个数据转发队列与所述边缘交换机的所述多个面向终端系统的端口相关联。
18.根据权利要求17所述的设备,其中使所述面向终端系统的端口与所述多个数据转发队列相关联包括:针对与所述边缘交换机的所述多个面向终端系统的端口相关联的同一业务优先级而建立多个队列。
19.根据权利要求18所述的设备,其进一步包括: 从所述边缘交换机接收反压请求,所述反压请求所具有的信息指示出所述面向终端系统的端口中的至少一者以及相关联业务优先级, 阻塞所述数据转发队列中与所指示的面向终端系统的端口以及所述业务优先级相关联的一个队列;以及 允许所述多个队列中的其他数据转发队列服务于其他面向终端系统的端口。
20.根据权利要求19所述的由网络组件实施的方法,其中允许所述多个队列中的其他数据转发队列服务于所述其他面向终端系统的端口包括:不阻塞对应于其余数据的队列,所述对应于其余数据的队列与所述边缘交换机的其余面向终端系统的端口以及所述同一业务优先级相关联。
21.根据权利要求19所述的由网络组件实施的方法,其中所述反压请求以基于优先级和端口的流控制(PPFC)系统包数据单元(PDU)的形式发送出去,所述基于优先级和端口的流控制(PPFC)系统包数据单元(PDU)包括操作代码字段、端口标识符(ID)长度字段、端口ID字段、优先级启用矢量字段以及多个时间字段。
22.根据权利要求21所述的由网络组件实施的方法,其中所述操作代码字段指示所述PPFC PDU的格式和/或类型,所述端口 ID长度字段指示在所述端口 ID字段中指示的端口ID的长度,所述端口 ID 字段中的所述端口 ID指示所述面向终端系统的端口,所述优先级启用矢量字段指示所述业务优先级,并且所述时间字段指示所述数据转发队列中与所述所指示的面向终端系统的端口相关联的一个数据转发队列的列队时间。
23.根据权利要求22所述的由网络组件实施的方法,其中所述优先级启用矢量字段包括对应于多个所支持业务优先级的多个子字段,并且所述时间字段对应于同一所支持业务优先级,并且其中所述子字段中只有一个子字段设定为指示所述业务优先级,并且时隙中只有一个时隙是有效的,所述一个时隙对应于所述同一业务优先级。
24.一种设备,包括: 边缘交换机,其包括多个面向终端系统的端口,并且用于经由所述面向终端系统的端口而耦合到多个终端系统且耦合到聚合/核心交换机,并且用于将与所述面向终端系统的端口相关的信息发送到所述聚合/核心交换机, 其中与所述面向终端系统的端口相关的所述信息用于使所述面向终端系统的端口与所述聚合/核心交换机处的多个对应队列相关联。
25.根据权利要求24所述的设备,其中所述边缘交换机进一步包括: 入端口,其耦合到所述聚合/核心交换机; 一个或多个第二入端口,其耦合到一个或多个第二聚合/核心交换机; 内部交换逻辑单元,其耦合到所述入端口和所述第二入端口 ; 包分类单元,其耦合到所述内部交换逻辑单元; 队列和缓冲区管理单元,其耦合到所述内部交换逻辑单元;以及 数据缓冲区,其耦合到所述内部交换逻辑单元以及所述面向终端系统的端口。
26.根据权利要求24所述的设备,其中当所述终端系统包括指配有多个MAC地址的多个虚拟端口时,所述边缘交换机包括媒体接入控制(MAC)转发表,所述媒体接入控制(MAC)转发表包括至少一种MAC地址,所述MAC地址包括以下各者中的一者:第二 MAC地址、相关联虚拟局域网ID (VID)、所 述边 缘交换机的相关联输出端口 ID以及相关联QID。
【文档编号】H04L12/863GK103534997SQ201280020181
【公开日】2014年1月22日 申请日期:2012年1月4日 优先权日:2011年4月29日
【发明者】熊义君 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1