基于前置反馈的两级交换结构工作方法

文档序号：7759526阅读：294来源：国知局

专利名称：基于前置反馈的两级交换结构工作方法
技术领域：
本发明属于互联网信息传输技术领域。
背景技术：
互联网用户的迅猛增长和多媒体业务流的激增使Internet面临越来越大的数据传输压力，虽然密集波分复用技术使单个波长的数据传输率高达160Gbps，但中继系统的交换速率却远远低于光域内的数据传输率，这就使中继系统因交换速率过低而成为Internet 的瓶颈。此外，长期的流量监测表明Internet数据流具有自相似性，其典型特征是数据具有突发性。因此，能够适应自相似业务流的高速交换结构就成为下一代Internet的核心技术之一。传统的交换结构因为复杂度或加速比等原因均无法满足未来的交换需求。近年来，张正尚教授等人提出的负载均衡结构LB-BvN(Load Balanced Birkhoff-von Neumann switch architecture)因非常接近未来的交换需求而备受关注。LB-BvN由两级crossbar 组成，其第一级crossbar将到达的数据流均勻散布到中间缓存，这使得该结构能够较好地适应自相似业务流；此外其两级crossbar均采用确定的、周期性的连接模式，这种复杂度为0(1)的crossbar连接模式排除了算法调度时间对时槽长度的影响，在信元长度一定的情况下，时槽长度仅与端口速率有关。这就意味着，端口速率可以提高到微电子技术甚至是光传输技术所能达到的极限。但该结构可能导致信元失序，国内外现有解决失序问题的方案都在性能和复杂度之间取舍。文献YEUNGK L, HU B, LIU N H A novel feedback mechanism for load balanced two-stage switches[C]IEEE International Conference on Communications Glasgow, Scotland, United kingdom Institute of Electrical and Electronics Engineers Inc.，2007，6193-6198.提出的FTSA利用输入端口 i和输出端口 i位于同一线卡这一特性，通过一种错列对称特性(staggered symmetry)的crossbar连接模式将中间缓存的队列信息反馈到输入端，输入端基于该反馈信息选择一个信元传输至中间缓存，这种“有的放矢”的工作模式可以有效降低中间缓存的下溢(underflow)问题，从而获得了极其优异的时延性能。但该结构所允许的调度算法的执行时间过于短暂，现有微电子和存储技术必然会导致时槽长度的增加，进而损害FTSA的高速交换能力和可扩展性。对该问题的详细介绍如下为便于表达，本文约定交换结构的输入输出端口数均为N，定义到达输入端口 i且目的端口为k的信元集合为数据流Fi, k，记Ci, k泛指Fi, k的任意一个信元。两级crossbar 分别记为XBl和XB2，XBl前的VOQ (Virtual Output Queue)缓冲称为输入缓存，记为V0Q1， XB2前的VOQ缓冲称为中间缓存，记为V0Q2。VOQl (i，k)用于缓存Ciik, V0Q2(j, k)用于缓存到达中间端口 j且目的端口为k的信元。在不引起混淆的前提下，文中的“输入端口”均指XBl的输入端口，“中间端口，，指XB2的输入端口，“输出端口，，指XB2的输出端口。输入端口 i通过中间端口 j与输出端口 i_l相连简记为Ii—Mj-—Oi^10
(I)FTSA结构和错列对称连接模式FTSA结构由XBUXB2和VOQU V0Q2组成，如图1所示。任意V0Q2(j, k)都只有1 个信元的缓存空间(本文称之为单信元缓冲模式)，两级crossbar采用图2所示的错列对称连接模式，其关键特性在于若t时槽％—0k，则在t+Ι时槽Ik--MpFTSA采用图3所示的后置反馈模式，即中间端口 j在转发信元之后继续向输出端口 k传输记录V0Q2(j，k) (k = 0,1,2, -,N-1)状态的缓存信息。由于输入端口 k和输出端口 k位于同一线卡，故可方便地将到达输出端口 k的N位缓存信息反馈至输入端口 k。错列对称的crossbar连接模式又恰恰使得下一个时槽Ik-Mj,这样输入端口 k即可根据目的端口(Mj)的缓存状态信息进行“有的放矢”的信元转发以降低中间缓存的underflow问题，从而获得十分优异的时延性能。图2所示错列对称模式具有以下特性①若t时槽Ii-—Mj则同时必有Mj-—Oh
②若t时槽Ii-—Mj则t+Ι时槽Mj—0卜2注端口号的加减操作最终都需要对N取模，即i-Ι实质上是(i-l)mod N，下同。(2)FTSA对调度算法的时间限制从图3可知FTSA中信元传输和算法调度严格串行，为避免在XBl转发阶段因信元传输等待调度结果而增加时槽长度，FTSA要求调度算法必须在crossbar重配置时间内完成(算法的时域空间用格子纹理显示)。然而FTSA中的三种算法=RR(Roimd-Robin)、EDF 和Longest Queue First (LQF)最坏情况下均需搜索N次。首先，LQF算法性能最优但寻找最长队列的复杂度为O(IogN)，而且最长队列并不一定是符合条件的(目标位置已有信元)，最坏情况下LQF算法需要搜索所有N个队列才能获得符合条件的最大队长。EDF选择能在最短时间内离开交换机的信元，对于图2所示的错列对称连接模式，输入端口 i 总按照 VOQl (i，i-2)，VOQl (i，i_3)，-,VOQl (i，N)，VOQl (i， 0)，…，V0Ql(i，i-l)的次序搜索第一个符合条件的队列，最坏情况下也需要搜索N次。尽管RR算法相对易于实现，但事实上轮询的下一个队列同样不一定符合要求，故最坏情况下也需要搜索N次。另一方面，crossbar重配置所消耗的时间本质上取决于crossbar交叉点的开关速度，随着微电子技术的发展，目前成熟的商用芯片的工作频率可达4GHz以上，即元器件开关的周期约为0. 25nS(lS/4GHZ)。但存储技术的发展却相对滞后，目前高速存储器的存取周期约为0. 5ns。虽然N-bit缓存信息的反馈过程因输入输出端口位于同一线卡的原因耗时较少，但对最坏情况下要搜索N次且需多次比较运算的算法而言，在crossbar重配置时间内完成反馈和调度是无法实现的。由上可知虽然FTSA在仿真中表现出十分优异的交换性能，但该结构中信元传输与调度算法的串行工作模式要求调度算法在极短的时间内完成，对最坏情况下要搜索N次且需多次比较运算的算法而言，在crossbar重配置时间内完成反馈和调度是无法实现的，这种时间限制必然导致调度算法耗时远远超出crossbar重配置时间，信元传输不得不等待调度结果，时槽长度势必因调度算法而增加，进而限制端口速率的提升，降低FTSA的高速交换能力和可扩展性。

发明内容
鉴于FTSA的这种缺陷，本发明的目的是使调度算法与信元传输并行工作，从而拓展调度算法的时域空间(为调度算法提供更长的时间区间)，避免时槽长度因信元传输需等待调度结果而被拉长，提高交换结构的高速交换能力和可扩展性。本发明的目的是通过如下的手段实现的。基于前置反馈的两级交换结构工作方法FFTS (Front-Feedback-based Two-stage Switch architecture)，包含两级crossbar和三级缓存第一级crossbar之前的输入缓存、两级crossbar之间的中间缓存和第二级crossbar之后的重排序缓存；输入缓存采用 VOQ缓冲模式，中间缓存采用双信元空间的VOQ缓冲模式，重排序缓存采用VIQ缓冲模式；中间端口在每个时槽之初预测本时槽结束时的缓存状态信息并将其反馈至输入端口，输入端口在进行信元传输的同时，根据反馈得到的信息选择下一时槽要转发的信元，被选中的信元携带其理论路径到达中间缓存等待转发，信元到达输出端后根据其所携带的理论路径值完成重排序过程。

图1现有技术基于反馈(后置)的两级交换结构FTSA结构图。图2是现有技术错列对称的crossbar连接模式示意图。图3是现有技术后置反馈模式示意图。图4是本发明前置反馈的两级交换结构FFTS结构图。图5是本发明前置反馈操作示意6是本发明与现有技术在均勻流量模型环境中的时延比较图。图7是本发明与现有技术突发环境(长度为32)中的时延比较图。图8是本发明与现有技术在Hot-spot流量模型环境中的时延比较图。
具体实施例方式下面结合附图和实施例对本发明作进一步说明。本发明方法FFTS是针对FTSA结构对调度算法的时间限制问题所做的改进方案，故FFTS具有FTSA结构的基本元素，如①FFTS和FTSA结构中均包含两级crossbar (XBl和XB2)和VOQl及V0Q2。②XBl和XB2同采用错列对称连接模式。③在输入端口均可选择RR、EDF或LQF算法调度。FFTS与FTSA的不同之处在于①前置反馈模式。FFTS在每个时槽之初预测本时槽结束时中间缓存的状态信息并将其反馈至对应输入端口，是为前置反馈，这使得信元传输可以与调度算法并行工作。而FTSA在每个时槽之末向对应输入端口反馈，是为后置反馈，信元传输必须与调度算法严格串行。②双信元缓冲模式。FFTS中任意V0Q2(j，k)设置2个信元的缓存空间，是为双信元缓冲模式。而FTSA 中任意V0Q2(j，k)设置1个信元的缓存空间，是为单信元缓冲模式。
5
③前置反馈信息的预测。FFTS在时槽之初所反馈的N-bit信息并不是该时刻中间缓存状态的简单复制，而是预测该时槽结束时的缓存状态信息。该预测规则需综合考虑双信元缓冲的应用环境和错列对称的crossbar连接模式。④基于理论路径的重排序策略。FFTS在输出端设置VIQ缓冲；每个离开XBl的信元都被赋予一个“理论路径”，信元到达输出端口后依据自身携带的理论路径值在VIQ中完成重排序过程。以上手段的具体描述如下①前置反馈模式FFTS结构由两级crossbar (XBl及XB2)和三级缓冲(V0Q1、V0Q2及VIQ)组成，如图4所示。前置反馈模式的核心思想在于中间端口 j在每个时槽之初(信元传输之前)预测本时槽结束时的缓存状态，并将预测结果反馈至输入端口。前置反馈模式使得调度算法可与信元传输并行工作，这一策略必然会赋予调度算法更长的执行时间，图5中格子纹理所覆盖的时间区间表示算法经拓展后的时域空间。由于前置反馈的信息是基于预测的，且预测时无法获知本时槽内的信元到达情况，故前置反馈的N-bit缓存信息并不能准确反映本时槽结束时中间端口的缓存状态，即具有非完备性。②双信元缓冲模式。在单信元缓冲模式下，前置反馈信息的非完备性可能导致信元冲突，为此FFTS采用双信元缓冲模式，中间缓存任意子队列缓存容量均设置为两个信元空间，当且仅当发生信元冲突时才将冲突信元缓存于第二信元空间。即将任意V0Q2(j，k)的缓存容量设为两个信元空间，仅在发生信元冲突时将冲突信元缓存于第二个信元空间，否则第二信元空间不使用。③前置反馈信息的预测规则基于图2所示的错列对称连接模式，令t时槽Ii—Mj—Oi^10 FFTS中t时槽中间端口 j前置反馈信息(记为V)的生成规则如下A:gV0Q2(j，i-1)的第二个信元空间为空，则 V[i_l] = 1，否则 V[i_l] = 0。B 若V0Q2(j，i_2)的第二个信元空间为空，则V[i_2] = 1，否则V[i_2] = 0。C 对于所有 r(r = 0，1，2，…，N-1 且 r 乒 i_l，r 乒 i_2)，若 V0Q2 (j，r)为空则 V[r] = 1，否则 V[r] = 0。④基于理论路径的重排序策略。FFTS所采用的双信元缓冲模式虽然解决了信元冲突问题，但同时却导致了信元失序。FFTS通过为每个信元赋予一个理论路径及在输出端设置VIQ来解决该问题。首先，FFTS在每个输入端口 i均设置N个指针GiikGi = O, 1，2，…，N-1)，分别指示流Fi, k的下一个信元的理论路径值。若Ci, k被调度算法选中，则将Gi, k和Ci, k组合在一起转发至中间端口，之后将Gi,k更新为(Gu+Dmod N。这里所谓“理论路径”是相对于信元的真实路径而言的。若流Fi, k某个信元Cf通过中间端口 _r(_r = o，i，2，-,N-D到达目的端口 k，则称其真实路径为_r。在实践中，不妨设流Fi,k的第一个信元C°的理论路径为0 (不管其真实路径如何)，则其同一个流的下一个信元C1的理论路径必为1( (0+1) mod N)。这种工作模式决定了同一个流的相邻信元必然具有相邻的理论路径，从而可以在输出端通过信元的理论路径值来恢复其原有顺序，保证信元的有序转发。此外，FFTS在每个输出端都设置N个VIQ队列分别存储来自不同输入端口的信元。每个VIQ包含N个子队列分别存储具有不同理论路径的信元，如理论路径为e的Ci, k置于 VIQ(i，e，k)中缓存；任意输出端口 k均设置N个指针Pi,k(i = 0，1，2，…，N-1)分别指示流Fi, k的下一个信元所应到达的VIQ队列。双信元缓冲模式决定了任意信元为避免失序而需等待的最大时槽数不超过N。这就意味着若Pi, k所指队列非空，则表示Fi, k “最老的”信元已到达，直接将其转发即可保证信元不失序地离开交换机。转发完毕后，Pu同样更新为(Pu+Dmod N。本发明FFTS方法带来的优点可由以下两方面验证①理论分析FFTS对算法执行时间的拓展效果。②仿真验证FFTS的时延性能。以下予以分述①FFTS对算法执行时间的拓展。若记一个时槽的时间为T，crossbar的重配置时间为Τκ，信元传输时间为Tc， N-bit反馈信息的传输时间为TN，缓存信息从输出端反馈至输入端的时间为TF，信元在经 crossbar到达目的缓存的传播时延记为TP，则T = TE+TN+TC+TP如图5所示，XB2在一个时槽内需要传输一个信元和N-bit的反馈信息，而XBl在一个时槽内只需传输一个信元，于是可将XBl上的信元传输时间向后推迟TN，从而为调度算法拓展更多的时域空间。故FFTS中算法的执行时间Tffts TFFTS = TE+TN+TC-TF考虑相同的分析方法，图3所示FTSA中算法的调度时间Tftsa为Tftsa = Te-Tf易见，相对于FTSA，本发明所提出的FFTS结构将调度算法的执行时间延长了 TN+T。，考虑到T。>> Tk，很明显，FFTS为算法提供了相对较大的时域空间，这一特性使得交换结构能够支持较大规模的交换模块和较高的交换速率。②FFTS的时延性能。我们分别从传统(iSLIP)、同类型(Byte-Focal、CR switch和FTSA)及最优结构 (0Q(Output Queuing))的角度在均勻流量、突发流量和Hot-spot流量模型环境中仿真分析，仿真采用32X32的交换模型，仿真结果越小越好。(1)均勻流量模型所谓均勻流量是指信元以Bernoulli i. i. d.过程到达且以等概率到达各输出端口。仿真结果如图6所示。(2)突发流量模型突发流量用0N-0FF模型来产生，平均突发长度ABL (average burst length)设为 32,同一突发块内的信元具有相同的目的端口，仿真结果如图7所示。(3) Hot-spot 流量模型
Hot-spot流量模型中cell以Bernoulli i. i. d.过程到达输入端口 i，但cell以 2/3的概率到达目的端口 i，以等概率到达其余端口。仿真结果如图8所示。仿真所选六种结构中，iSLIP算法广泛应用于现有各类型IQ交换机，但复杂的集中式调度制约了其高速交换能力和可扩展性；OQ需要N倍的加速比，在实际应用中是无法实现的(除非N极小)，其理论时延常被视为交换结构性能的上限。Byte-FocalXR switch、FTSA和本发明所提出的FFTS同属于负载均衡结构，而负载均衡结构在未来的高速交换和自相似业务流环境中具有特殊的优势，从以上三种环境的仿真结果可以看出，FFTS的时延性能远优于Byte-Focal和CR switch而稍逊于FTSA，但考虑到FTSA的理论性能是无法实现的，故本发明方法FFTS仍具有优异的应用价值。
权利要求
基于前置反馈的两级交换结构工作方法，包含两级crossbar和三级缓存第一级crossbar之前的输入缓存、两级crossbar之间的中间缓存和第二级crossbar之后的重排序缓存；输入缓存采用VOQ缓冲模式，中间缓存采用双信元空间的VOQ缓冲模式，重排序缓存采用VIQ缓冲模式；中间端口在每个时槽之初预测本时槽结束时的缓存状态信息并将其反馈至输入端口，输入端口在进行信元传输的同时，根据反馈得到的信息选择下一时槽要转发的信元，被选中的信元携带其理论路径到达中间缓存等待转发，信元到达输出端后根据其所携带的理论路径值完成重排序过程。
2.根据权利要求1所述之基于前置反馈的两级交换结构工作方法，其特征在于，中间缓存任意子队列缓存容量均设置为两个信元空间，当且仅当发生信元冲突时才将冲突信元缓存于第二信元空间。
3.根据权利要求1所述之基于前置反馈的两级交换结构工作方法，其特征在于，任意输入端口i均设置N个指针Gi,k(k = 0，l，2，…，N-1)，分别指示流Fi,k下一个信元的理论路径值；若信元Ci, k被调度算法选中，则将Gi, k和Ci, k组合在一起转发至中间端口，同时将 Giik更新为(Gu+Dmod Hk到达输出端口 k后，取出其所携带的理论路径值e并将其缓存于VIQ(i，e，k)；任意输出端口 k均设置N个指针PiJi = 0，1，2，…，N-1)分别指示流 Fi,,的下一个信元所应到达的VIQ队列；若Pi,k所指队列非空，即可将其队首信元转发。
全文摘要
本发明公开了一种基于前置反馈的两级交换结构工作方法，输入缓存采用VOQ缓冲模式，中间缓存采用双信元空间的VOQ缓冲模式，重排序缓存采用VIQ缓冲模式；中间端口在每个时槽之初预测本时槽结束时的缓存状态信息并将其反馈至输入端口，输入端口在进行信元传输的同时，根据反馈得到的信息选择下一时槽要转发的信元，被选中的信元携带其理论路径到达中间缓存等待转发，信元被转发至输出端后根据其所携带的理论路径值完成重排序过程。本发明有效拓展了调度算法的时域空间，提高了交换结构的高速交换能力和可扩展性。
文档编号H04L12/56GK101964747SQ20101027826
公开日2011年2月2日申请日期2010年9月10日优先权日2010年9月10日
发明者曾华燊, 申志军申请人:西南交通大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：申志军;曾华燊
技术所有人：西南交通大学
我是此专利的发明人

上一篇：一种控制多设备的授权方法、通信设备和服务器的制作方法
上一篇：无线通信系统、中继装置及移动终端的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。