用于弹性无线分组通信的系统和方法

文档序号:7807025阅读:201来源:国知局
用于弹性无线分组通信的系统和方法
【专利摘要】为了满足电信级以太网传输信道标准等,需要无线通信网络中的快速故障检测和恢复。因此,利用硬件辅助的快速传输信道故障检测算法(500)和具有相应配置的引擎的千兆以太网数据接入卡来提供弹性无线分组通信。在具有各种拓扑的网络中,该弹性无线分组通信分别与其现有协议(例如快速生成树协议和链路聚合协议)相组合地被提供。
【专利说明】用于弹性无线分组通信的系统和方法
[0001]本申请是国际申请日为2006年2月24日、名称为:“用于弹性无线分组通信的系统和方法”的中国专利申请200680054187.7的分案申请。
【技术领域】
[0002]本发明涉及无线数据通信,更具体地,涉及各种网络拓扑中的弹性无线分组通信。【背景技术】
[0003]网络拓扑是网络中给定节点具有到其它节点的一个或多个链路的情况下的节点之间的链路形态。网络的物理拓扑包括生成树型、环型、网状型和总线型,并且其中的环型网络是这样的网络:节点在闭环配置中被连接,并且数据在相邻节点之间顺序地从节点向节点传送。逻辑拓扑是信号从节点到节点所沿路径的本质,并且在许多实例中逻辑和物理拓扑是类似的。在逻辑环形拓扑中,数据在闭环中以顺时针或逆时针方向流动。
[0004]光纤环常常被配置作为城域网(MAN)和广域网(WAN)两者的一部分。弹性分组环(RPR)是这样的有线网络拓扑:其被配置用于光纤环,并被设计以使用RPR接入协议和物理层接口来产生高速数据传输。具有RPR拓扑的网络有双重反向旋转环(顺时针、逆时针),其中多个节点可以同时在两个环上进行传输。
[0005]针对日益增加的带宽、负载平衡和节点(例如,交换机和站台)之间的通信信道的可用性,根据IEEE标准802.3ad的链路聚合或中继(aggregation or trunking)是一种将物理网络链路组合为单个逻辑链路的方法。利用链路聚合,可以通过使用其快速以太网和千兆(Gigabit)以太网技术来增加节点之间的通信信道的容量。可以将两个或多个千兆以太网连接组合以增加带宽,并创建弹性和冗余链路。标准局域网(LAN)技术提供10Mbps、IOOMbps和IOOOMbps的数据率,并且为了获得更大的容量(例如10000Mbps)链路聚合允许组合10个链路;并且在系数10过大的情况下,链路聚合可以通过组合不同速率的链路来提供中间速率。
[0006]有线网络被设计以满足RPR标准(IEEE802.17),并且为了满足分组交换网络的需要,致力于改进光纤环的可测性、带宽分配以及吞吐量。典型的RP R支持S ONE Y/SDH(155Mbps到IOGbps)标准和以太网PHY(满足IGbps到IOGbps速率的以太网物理层接口)。RPR网络在与数据反向的环上承载控制消息,并且如果光纤或节点发生了故障,那么RPR标准(IEEE802.17)需要满足50毫秒的恢复时间。
[0007]例如,快速生成树协议(RSTP,标准IEEE802.1D-2004)依赖于活动的生成树拓扑,并且是在发生故障的情况下网络可以快速重新配置其拓扑的协议。利用RSTP,生成树重新分配端口并获悉端口的新的MAC地址。

【发明内容】

[0008]考虑到上述内容,本发明部分地基于如下的观察:前述配置和协议对无线通信而言并不是最优的,因为它们需要过大的开销并且提供较慢的故障检测和恢复响应。利用所提出的用于改进通信网络的方法,本发明试图通过稳定且快速的故障检测和恢复(例如,低于50ms的无线链路故障检测和低于50ms的无线环愈合(恢复))来提供针对故障的弹性。利用链路聚合或环形拓扑的、例如根据本发明的原理实现的弹性无线分组网络,还为无线操作提供错误弹性(error resiliency)、对吞吐量的最小影响以及经优化的第2层网络
重新配置。
[0009]采用具有为了提供这些益处而设计的功能的经改进的千兆以太网卡来实现这种弹性无线分组网络。并且,虽然可以采用诸如路由设备之类的外部装置来实现这种解决方案,但是由于检测和恢复信号是本地可用的并且无须额外的开销,因此优选经改进的千兆以太网卡实现。换言之,优选经改进的千兆以太网卡实现是因为它提供了更好的结果以及对吞吐量更少的影响。
[0010]因此,为了所示出的和在此概述的本发明的目的,一种用于无线网络中的弹性分组通信的方法包括实例化千兆以太网数据接入卡中的硬件辅助(hardware-assisted)的快速传输信道故障检测算法,以及将此快速传输信道故障检测算法与适合于重新配置无线网络所具有的拓扑的第2层网络优化协议相组合。该组合是响应于网络中的故障的并且提供对网络的自动故障恢复,以使得通过网络进行的分组通信对这种故障具有弹性。该组合还在无线操作中提供对吞吐量有最小影响的错误弹性。弹性通过对经过网络的数据流量流具有最小或基本上没有影响的稳定且快速的故障检测、校正和恢复测量而被提供。
[0011]还根据本发明的目的,一种用于无线网络中的弹性无线分组通信的系统包括经由无线链路连接的多个节点,以及多个客户端数据接入端口。客户端数据接入端口中的至少一个被连接到在网络一端处的节点中的一个,且第二接入端口被连接到在网络另一端处的节点中的另一个。每个节点具有千兆以太网数据接入卡,这种千兆以太网数据接入卡可操作以执行硬件辅助的快速传输信道故障检测算法,并将该快速传输信道故障检测算法与适合于重新配置无线网络所具有的拓扑的第2层网络优化协议相组合。再一次地,该组合是响应于网络中的故障的并且提供对网络的自动故障恢复,以使得通过网络进行的分组通信对这种故障具有弹性;并且,另外,快速传输信道故障检测算法可操作以提供无线网络端到端故障检测和恢复,以及提供具有错误弹性和对吞吐量的最小影响的无线操作。
[0012]从这里的描述、下面所描述的附图和所附权利要求可以更好地理解本发明的这些以及其它特性、方面和优点。
【专利附图】

【附图说明】
[0013]被并入且组成了本说明书的一部分的附图图示出了本发明的各方面并与说明书一起用于说明本发明的原理。在任何方便的情况下,将在整个附图中使用相同的标号来表示相同或相似的元件。
[0014]图1A至ID分别示出了具有千兆以太网数据接入卡的现有技术无线网络、基于FPGA的接口处理引擎以及其双信道分组处理组件。
[0015]图2A至2B示出了其中节点具有经修改的千兆以太网数据接入卡(DAC-GE)的无线网络中的经链接的节点。
[0016]图3图示出了增强的分组封装。
[0017]图4A示出了经修改的接口引擎的一个实施例。[0018]图4B图示出了分组校准。
[0019]图5是示出保活(keep-alive)消息插入的状态图。
[0020]图6是根据本发明的原理的故障检测和恢复的流程图。
[0021]图7是故障检测等待时间示例表。
[0022]图8是具有链路聚合配置的无线网络。
[0023]图9是链路聚合密钥重新分发和重新指定的状态图。
[0024]图10是结合了快速传输信道故障检测算法的链路聚合的流程图。
[0025]图11是弹性无线分组环形网络。
[0026]图12是弹性无线分组环形网络中的链路故障和恢复的状态图。
【具体实施方式】
[0027]如所注意到的,无线通信中的一个难题是快速故障检测和恢复。图1A图示出了环愈合(恢复)示例,其中在具有至少3个节点的环中,链路14接管发生故障的链路12(将数据流的方向从发生故障的路径移开)。在具有被布置在环形拓扑中的三个或更多个节点的无线通信网络中,节点之间的链路是无线的。链路经由户外单元(ODU)被设置在诸如Eclipse?之类的系统中。图1B图示出了现有无线环形网络,其中在发生故障的链路被修复以前,通过切换到健全链路来完成从节点(称为20)的故障或链路(称为12)的故障的恢复。
[0028]作为又一个比较点,图1C是示出现有数据接入卡(DAC)的设计的框图。DAC中的构建块为第2层提供了切换能力、有效载荷(payload)传输和配置、监控和控制功能。客户端千兆以太网端口 101所接收的有效载荷由物理层数字处理组件102以及然后由交换机(第2层交换机)111进行处理。交换机分析源和目的介质访问控制(MAC)地址并确定输出端口,有效载荷将通过该输出端口被递送(例如,P0...3)。顺便提及,针对每种物理设备类型,OSI模型中的数据链路层(DLC,第2层)的介质访问控制(MAC)子层使用MAC地址,并且DLC层中的其它子层是逻辑链路控制(LLC)子层。在局域网(LAN)或其它网络中,MAC地址是节点唯一的硬件标识符,其相应的表格与节点的IP地址相关;并且在以太网LAN上,MAC地址与节点的以太网地址相同。针对有效载荷递送,除了上述的信息之外,内部和外部虚拟LAN(VLAN)信息、流量优先权、经配置的吞吐量以及缓冲能力也起了作用。利用这些信息,交换机111应用策略、调度和整形算法以确定每个分组应该采用的路径和优先权,并且判断每个分组是否应该被使用(consumed)、转发或丢弃。
[0029]当分组通过端口 P6/P7被递送到传输信道TC1/TC2时,处理引擎108,例如基于FPGA、ASIC或CPLD的处理引擎,将分组转换到适当的块(具有相关联的时隙)中以由底板接口 110以及附加在其上的无线电链路60来承载。注意,虽然传输信道和载波时隙(具有独立定时)的数目在DAC中是可配置的,但是现有实现方式采用开销(overhead)信息来解析载波间可能的时钟变化。
[0030]图1D图示出了现有DAC (例如,来自Stratex网络公司的现有Eclipse?平台中的千兆以太网卡)内部的基于FPGA的处理引擎中的开销的使用。如所示的,在无线发送(TX)方向中,当以太网分组到达TCl或TC2时,HDLC之类的封装被基于FPGA的处理引擎108中的开销插入模块202应用。所添加的开销允许随后对分组将被划分到其中的具有时隙的多个段进行同步。由反向复用器210执行分段处理,反向复用器210将分组划分为将被用于传输的、具有时隙(链路)的、经配置的段数(带宽分配)。这些段通过底板接口被转发到通过无线链路将它们发送的无线电接入卡(RAC35,37)。当不存在有效载荷时,字节同步的空闲填充(idle fill)被插入206到传输信道流中。
[0031]在无线接收(RX)方向,RAC将从天线接收包含被用于传输以太网有效载荷的多个段(具有时隙的链路)的巾贞。这些段经由底板接口 Iio被转发到DAC。DAC中的复用器(Mux) 212基于来自存储器222的时间至数据索引信息从多个段中重新装配原始的以太网分组。为了保证分组的完整性,需要字节同步阶段。开销信息被用来补偿被用于传输的每个独立的段可能具有的任何时钟偏差,从而有效地将其排列回原始的分组布置。由于在传输信道中存在的任何空闲填充被移除208,因此其不会到达第2层交换机111 (项111,图1C)。开销(封装)随后被移除204,并且利用TCl和TC2接口将分组转发到第2层交换机111。
[0032]基于前面所述的,为了实现更快的故障检测和恢复,当前被用在图1B的节点中的上述DAC被图2A所示的经修改的接口卡代替。经修改的数据接口卡可以被配置在新的无线通信平台以及诸如Eclipse?之类的现有无线通信平台中。经修改的数据接口卡的各种实施例是可能的,而不会脱离本发明的范围和精神,并且我们接着对这种实施例之一的结构和功能性进行描述。但是,在此示例中,我们专注于称作“DAC-GE”的经修改的千兆以太网卡。
[0033]在图2A的示例中,DAC-GE41、43被配置在节点30、32、34、36、38中的至少两个的INU(智能节点单元)中。DAC-GE包括增强故障检测和恢复的功能,而无须损失吞吐量,从而例如提供低于50ms的故障响应时间。DAC-GE在一侧与客户端数据系统27、29连接,在另一侧与无线电接入卡(RAC) 33、35、37、39连接。来自各个RAC的数据流向各自的一个户外单元(0DU45、47、49、51 ;在诸如Eclipse?之类的分离的安装系统中)并经过无线链路60、62、64、66。
[0034]注意,图2A中的示图未示出完整的环,该完整的环除了需要至少三个节点之外,还需要网络通过例如组合无线链路60和66从而使其成为一个并且相同的链路来提供闭环。还应注意,第三节点34由点划线示出以图示出这样的事实:节点34实际上可能表示一个节点或多个节点34、36、38等;并且如果节点32和34之间存在多个节点,则这样的节点中的每一对将被无线链接。换言之,节点30和32之间可以存在多个跳。然而,DAC-GE的故障检测和恢复操作与跳数目无关,并且它们有利于辅助实现网络的端到端故障检测和恢复。
[0035]另外,不同于在其中故障检测和恢复的路由和切换在开放系统互连(OSI)模型的数据链路层(第2层)或更高层发生的现有系统,在根据本发明配置的系统中,在物理层(第I层)执行故障检测操作,在数据链路层(第2层)执行恢复操作。虽然数据链路层对环中的各个段的完整性负责,但是物理层更好地用于实现监控物理信道完整性的更快的机制,并检测来自网络的端到端的任何故障。例如,一旦到达预定的时间阈值,物理层可以快速地检测输入数据流的缺少,并且可以重新限定系统的拓扑(获悉可替换的端口的MAC地址)。这不同于但有点类似于快速生成树协议。
[0036]图2B中的框图图示出了与节点(例如,30)相关联的其它组件和DAC-GE之间的接口。在INU中,TDM总线110提供主干(backbone),通过该主干将诸如节点控制卡(NCC) 21、DAC-GE41和RAC37之类的各种卡连接起来。NCC包括处理器,并且用作控制各种卡的接入的总线主控。通过客户端接口端口(千兆以太网端口)101,DAC-GE与客户端数据系统进行通信,并且RAC35在DAC-GE41和无线前端(0DU37和天线23)之间进行连接。
[0037]每个DAC-GE被设计以执行由快速无线分组环(RWPR?)应用的快速传输信道故障检测算法。快速传输信道故障检测被设计以用于在千兆以太网卡中存在的传输信道中的一个或两者中进行快速且可靠的故障检测。有利地,硬件辅助的协议实现快速传输信道故障检测算法,并且,如将在后面所详细描述的,这种算法被使用在两种应用中:链路聚合和弹性无线分组环操作。
[0038]对快速传输信道故障检测算法的设计包括多种可能的考虑(consideration),其中一些考虑比其它考虑更重要。一种这样的设计考虑向后兼容于现有的千兆以太网卡框架。还期望将该算法设计为对噪声以及突发的小错误具有弹性。例如,如果无线链路发送出不可改正的帧,则不应该改变传输信道的状态,即,单个分组错误不应该触发状态的改变。
[0039]使快速传输信道故障检测算法成为端到端的解决方案也很重要。即是说,算法应当不知道(agnostic)传输信道所需要的以使有效载荷通过无线电链路(存在转发器)的跳数目。另外,快速传输信道故障检测算法应该能够独立地解析任一方向上的故障(即,单向故障)。
[0040]虽然由于自然条件会发生无线电链路衰落和损耗,并且它们一般是双向的,但是硬件故障可能不是双向的。功率放大器或者发送(TX)或接收(RX)合成器的故障,例如可能导致单向故障。算法应该能够独立地检测并指示何时发生故障以及故障是发生在发送方向上还是接收方向上。一些应用可以从使得单向流量仍然流过的可能性中受益。例如,链路聚合可以受益于使得两 个信道在一个方向上发送且仅一个回来。
[0041]另外,由于快速传输信道故障检测算法不依赖于系统中可用的其它报警或信号来确定故障,所以其在检测故障中最好是自治(autonomous)的。这种算法也独立于有效载荷流量的存在。
[0042]除了是自治的之外,快速传输信道故障检测算法最好被设计为自动地从故障中恢复。例如,如果用于实现故障检测的协议在发生故障后仍然处于工作中(试图与远端重新建立通信),则当链路被恢复时,能够自动地复原。
[0043]除了前面所述的之外,一种典型的设计需求是快速的,优选的低于50ms的故障检测能力。为了达到此目的,配置和管理处理器最好不涉及快速传输信道故障检测算法,并且它不使用无线链路中存在的超出频带的网络管理系统(^S)开销信道来传输决定信息或状态。另外,算法被设计以利用可能的最少量的带宽(开销)来执行其功能。这种协议最好还表现为硬件辅助的协议实现方式。
[0044]因此设计以太网帧封装来适应这些要求。在现有系统中,DAC将在TCl或TC2上接收到的以太网帧的封装设置为用于同步目的的“类HDLC”分组结构。但是,根据本发明的设计标准和原理,提出了具有附加的头部字段扩展的不同分组结构,以使得无须太多的附加开销即可传输冗余和状态信息。额外的头部字段传送RX状态,而CRC(校验和)保证头部信息的完整性。图3示出了所提出的在有效载荷字段298旁边的CRC字段303和头部字段扩展301。经扩展的头部字段310包括接收和发送(TX,RX)状态信息。
[0045]图4A图示出了经修改的基于FPGA的处理引擎,其被设计来实现快速传输信道故障检测算法。注意,虽然优选的设计采用了基于FPGA、CPLD、ASIC的处理引擎或其它逻辑电路中硬件辅助的实现方式(我们将这些实现方式总的称作“基于FPGA的处理引擎”或简单地称作“处理引擎”),但是处理引擎的其它配置也是可以的。
[0046]具有RX和TX状态信息的经扩展的头部被处理引擎保持在每个节点(即,在无线通信链路的每个端)的DAC-GE中。基于从流量校准(alignment)指示符314和接收到的分组及其完整性获得的信息来计算RX状态。流量校准意欲维持已经被划分为多个段并且需要适当地被重新构建的分组的完整性。图4B图示出了流量校准。回到图4A,TX状态是对在所接收的分组的头部中所传送的远端节点的RX状态指示符的反射(reflection)。在此设计中,一组可配置的寄存器允许调整系统行为以满足特定电信级(carrier class)规范。
[0047]这些寄存器是:保活插入速率、分组接收超时、CRC确认阈值和CRC错误阈值。保活分组插入速率寄存器304表示在插入保活分组以前分组插入引擎将等待的速率(以微秒计)(在空闲流量的条件下)。分组接收超时寄存器310表示接收引擎在宣告空闲RX超时以前将要等待分组的微秒数。CRC确认阈值寄存器311表示为了将RX状态从差改为好而必需接收的连续的好的CRC分组数。CRC错误阈值寄存器309表示为了将RX状态从好改为差而必需接收的差的CRC分组数。两个可配置的CRC寄存器提供了滞后以避免差-好状态关于小数目的错误而波动。
[0048]如所提到的,对算法的要求之一是独立于信道中有效载荷流量的存在。为了能够满足此要求,设计算法以检测有效载荷流量的缺少(空闲),并插入将维持链路状态的保活分组。保活分组的格式基本上与正常的有效载荷分组格式相同,但是没有有效载荷段,并且其传送相同的状态和完整性信息。
[0049]图5是示出插入保活分组的操作的状态图。如图所示,在检测到信道空闲条件以后,算法从稳定状态402转换到空闲状态404。当在空闲状态404且在保活定时器超时406以前,分组填充继续。当有效载荷准备好以再次发送时,算法转换到稳定状态402。
[0050]由于仅在信道空闲时插入保活分组,因此由于这些分组导致的开销量是最小的。由于这些分组的大小如此小,所以由这些分组引入的延时足够小并且几乎是不可检测的。在最坏情况的情景中,假设在空闲流量条件下,新的分组的到达与保活插入定时器的期满相匹配,则准备好并等待发送的新的分组将由仅仅一个保活分组的插入而被延时。
[0051]图6是图示出故障检测和恢复算法的流程图。此示图示出了包括TX和RX状态更新和恢复条件的快速传输信道故障检测算法。
[0052]如所提到的,由于快速传输信道故障检测算法能够独立于RX故障来检测TX故障,因此其能够发现单向上的链路断裂。在接收方向中,存在引导算法判定是否存在故障的若干线索。在此示例中,使用了三个主要的指示:流量校准错误、分组接收超时和超出CRC错误阈值。流量校准错误是指示本地接收机尚未与远端发射机同步的警报504。分组接收超时条件512指示已经存在未预料到的的长时间段,在此期间没有分组被接收到508。超出CRC错误阈值条件524指示所接收到的最后η个连续分组具有CRC错误516,因此信道是不可靠的。在这种情况中,η是根据传输信道容量而改变的可配置参数。
[0053]上述三个条件中的任一个将指示差的接收(RX)状态,并且为了宣告好的RX状态三个条件缺一不可。RX状态(好或差)将被添加到与其传输信道相关联的所有分组头部中,从而以这种方式通知远端节点当前的接收条件。因此TX状态是对通过好的CRC经由分组而报告的远端节点RX状态的反射。包含在差的CRC分组中的远端节点RX状态将被忽略。
[0054]为了满足电信级故障检测的期望,可以根据分配给传输信道的不同容量来调节算法的可配置阈值和参数。例如,可以调节错误中的连续分组数以过滤出错误突发并为错误检测提供置信等级。还可以根据所期望的流量负载来调节保活分组插入速率,以获得更好的响应时间。对于高的利用百分比,对保活消息的使用将具有低的发生概率,而在低的利用百分比中,这些消息将基于正常概率被插入。为了论证这种算法的效果,图7中的表格提供了一些针对155和311Mbps传输信道容量的检测等待时间示例。
[0055]当然,一旦检测到故障算法就持续工作是有利的且优选的。为了达到这个目的,即使有效载荷已经停止在受影响的传输信道中流动,也需要维持对用于恢复链路状态的保活消息的插入。一旦导致故障的缺陷被移除,这些保活消息将承载恢复到好的链路状态所需要的所有信息。
[0056]但是,在宣告链路状态为好以前,具有好的CRC的连续分组数需要超过CRC确认阈值。这种行为防止了波动,并为转换的发生提供了好的置信等级。使CRC确认阈值成为可配置参数,使得系统用户能够为了好的链路状态来选择其想要的置信等级。
[0057]上述算法和DAC-GE在链路聚合和弹性分组环中有应用。下面将探讨这些应用中的每一个。
[0058]我们从链路聚合开始。作为示例,图8示出了 Ι+lEclipse?微波无线电链路(可配置用于链路聚合)的体系结构。典型的受保护的(1+1)微波无线电系统工作在正常和备用操作模式。无线数据流量在正常模式中使用顶部无线电路径812,而另一路径814处于备用状态;并且在装置故障或衰落环境的情况中,无线数据流量使用冗余无线电路径814。
[0059]当链路聚合组(LAG)被创建时,一组否则为独立的物理链路(成员)812、814被组合在一起以作为单个虚拟链路(单个逻辑链路)工作。链路聚合密钥(LAGK)相应地被指定并分发给各个LAG成员(LAGM)。这些密钥通常被以太网交换机(第2层交换机,类似于在图1C中示出的交换机,项111)用来基于流量源和目的MAC地址将以太网流量转发到相关的物理链路中。
[0060]注意,这种使用多个物理链路来在两个以太网交换机之间传输以太网流量的方法通常被用来实现增加的链路可用性和带宽,同时避免形成循环。但是,现有系统中的检测和交换通常在IOOms内完成;并且使用标准的发送消息的方法则故障检测会花费数秒。因此,为了达到或超过电信级以太网传输信道标准,链路聚合取决于快速故障检测和恢复。
[0061]根据本发明的原理,链路聚合结合优选的硬件辅助的快速传输信道检测算法(如上所述)使得能够在数百个微妙内进行故障响应和恢复,而不是像使用标准的发送消息方法那样通常会花费数秒。具体而言,利用安装在INU804、806中的DAC-GE,RWPR无线电系统能够以两倍于使用无线电链路812、814并在各个信道上发送分组的速度进行工作。算法对于错误传播是有弹性的,并消除了不必要的切换。由于对链路故障或衰落环境的快速检测,系统将快速地切换到单个链路(812或814)。LAG的冗余特性结合快速传输信道检测算法来操作以使流量在剩余的可靠物理链路间重新定向。由驻留在存在于DAC-GE(未示出)中的以太网交换机中的链路聚合控制任务重新组织分组的交换和列队。
[0062]另外,利用算法的单向故障检测能力,通过使全部链路吞吐量在一个方向可用同时在另一方向仅使用限定吞吐量(由于单向链路故障),链路聚合系统可以具有非对称行为。这就是大量使用广播或多播传输或实质上非对称的视频广播系统或其它应用的情况。
[0063]图9是图示出在链路聚合成员发生故障或恢复时的动态链路聚合密钥重新分发的状态图。当发生链路故障时902,状态图中所示的行为通过将2+0链路转换为1+0操作来提高整个链路的可用性。注意,利用密钥重新分发,所有流量被转移到剩余的LAGM中。即是说,一旦检测到故障,则状态从稳定状态904进行切换以将LAGK分发给剩余的LAGM902。换言之,利用这种方法,通过用剩余的链路(LAGM)临时接管发生故障的链路直到其恢复为止,而使发生故障的链路的流量流被重新分发而不是被中止,以使得恢复很快且整个流量流可以继续。这种方法超过传统技术的重要优点在于:仅仅维持与剩余LAGM的指定密钥相关联的流量流,而与发生故障的LAGM的密钥相关联的流量流被中止(使缺乏(starved))直到发生故障的链路恢复为止。实际上,当链路发生故障时,虽然如果在剩余LAGM中重新分发密钥总数则整个链路聚合吞吐量会减少,但是整个流量会继续流动;并且如果到达了拥塞的环境,则流量优先顺序和流控制会接管以维持流。
[0064]当故障环境消失后,链路聚合结合快速传输信道故障检测和恢复算法来恢复链路的总吞吐量,并将原始的LAGK组重新指定给新近被恢复的LAGM906。如果需要任何另外的重新分发,则以这种相同的重复方式进行。
[0065]为了实现前面的状态图,链路聚合结合快速传输信道故障检测算法来工作,例如如图10中的流程图所示。对于每个LAGM,密钥被指定给该LAGM1006,并且检查RX或TX状态1012。如果RX或TX状态已经改变1012,则算法判定LAGM状态的改变是故障还是恢复1016。在基于FPGA的处理引擎中的DAC-GE中实现对故障或恢复的检测以及复原(即,硬件辅助的检测和复原)。一旦检测到链路故障或链路恢复(TX或RX状态改变),则LAGM被标记以在故障的情况下重新分发密钥1018而在恢复的情况下重新指定密钥1020。对于先前没有考虑到的各个链路(没有被指定密钥),则经组合的链路聚合和快速传输信道故障检测算法判定LAGM是否被标记1022,如果是,则在故障时为其重新分发密钥1028,或者在恢复时为原始LAGM重新指定密钥1026。
[0066]现在我们转回来描述先前提到的弹性无线分组环(RWPR),针对快速传输信道故障检测算法的第二应用。通常,环形拓扑结合SONET和SDH已经在第2层中被广泛应用,在第2层中由网桥和L2交换机作出分组路由决定。一般地,还为了避免混淆通过以被控制的方式打断它们的以太网循环,系统使用了生成树协议(STP)以及其后继快速生成树协议(RSTP)。因此,如果环中的链路发生故障,则RSTP算法使用快速发送消息系统来重新配置该链路。
[0067]当利用传统的链路聚合时,现有环配置采用发送消息协议来执行RSTP。这种环配置使用外部交换机来检测链路故障并传送将被RSTP使用以重新配置链路的信息。
[0068]通常,传统的RSTP使用基于网桥协议数据单元(BroU)的快速发送消息协议,BTOU用于在网络中参与的网桥之间进行通信。这些BPDU帮助每个参与的网桥端口判定端口角色(根、被指定、可替换和备份)和端口状态(丢弃、获悉和转发)。BPDU还被用来检测端口之间的链路故障以及相应地重新配置网络。BPDU由所有网桥在网络中所有参与的端口中、在指定的时间间隔(hello-时间间隔)处被发送。这些时间间隔常常用数秒来衡量(例如,默认的指定值是2秒)。[0069]因此,如果在三个连续的时间间隔内没有接收到Brou,则在给定端口检测到链路故障。如果网桥在一行中丢失了三个BPDU,则网桥判定其已经失去了到其直达根或邻近网桥的连接。如果活动的网络拓扑中的端口检测到链路故障,则需要重新配置网络。临近故障的桥接元件将发送BPDU给它们的邻居以通知邻居相关的故障,并且将根据它们所接收到的BPDU来改变剩余端口的状态和角色。网络中的所有参与的网桥将采取类似的动作,它们将不得不检查并更新其端口状态和角色以有效地实现所需要的网络重新配置。但是,考虑到电信级传输要求,传统的故障检测(平均地以数秒来衡量,并且在最好情况的情形中以数百毫秒来衡量)仍然很慢。
[0070]但是,甚至利用RSTP时发送消息协议也相对较慢,并且其在故障后的收敛可以以数秒量级来衡量。电信级应用需要50ms或更低的故障收敛,这在使用RSTP而无附加的辅助的情况下是不可能达到的。因此,本发明考虑结合硬件辅助的快速传输信道故障检测算法的类RSTP方法。换言之,在此实施例中,本发明考虑将快速传输信道检测算法应用到RSTP中,以由此实现响应时间上的改进,所述改进在使用现有(Brou)故障检测技术的情况下是不可行的。具有这种功能的环形拓扑在此称作弹性无线分组环(RWPR)。
[0071]图11提供了用Eclipse?平台无线电实现时的RWPR的拓扑。设计RWPR?使能的Eclipse无线电系统来检测故障并切换流量流,而无需使用外部的交换机或路由设备,因为此系统被设计为直接在DAC-GE中执行RSTP。利用如上所述的提供了硬件辅助的算法的每个节点1102卜4中的DAC-GE,故障的检测快于传统的设计。故障检测时间从数秒减少到数百微秒,并且环重新配置立即向参与的RSTP节点进行传输。这种实现方式使实现电信级以太网传输信道标准所需要的低于50ms故障收敛是可行的。
[0072]实际上,通过无线链路(或一组链路)1105^的硬件辅助的故障检测被设计为与在以太网物理层的故障检测表现一样好或更好。由网络中的活动端口进行的故障检测将触发RWPR网络中的所有参与的网桥(在此示例中是RSTP使能的DAC-GE)立即进行故障信息的传播以及端口状态和角色的快速转换。虽然用于电信级类型的服务的故障检测和相关网络重新配置具有非常苛刻的反应时间要求,但是由于链路恢复而用于恢复原始网络拓扑的要求没有如此苛刻。
[0073]存在于DAC-GE中的处理器负责执行RSTP算法,并将持续监控传输信道链路状态。由于各个DAC-GE作为RSTP可用的网桥而工作,因此其与网络拓扑中其它的DAC-GE通信。当检测到故障时,处理器将简单地向RSTP算法应用链路状态信息,而无须等待丢失的BH)U(不必等待判定连接丢失)。类似地,处理器将立即(不必等到下一个hello-时间间隔)通知其邻居相关故障并将继续评估和更新其自己的端口状态和角色。网桥中不直接涉及链路故障检测的动作将保持如由RSTP(802.1w)标准所限定的那样。这些动作将有效地加速RSTP算法的收敛,从而使其适合于电信级类型的服务。
[0074]图12是图示出由检测网络拓扑的活动端口之一中的链路故障的网桥来执行RWPR?链路故障和恢复的状态图。另外,状态图还示出了当发生故障的链路被恢复时所执行的步骤。提到如下点是非常重要的:在一些网络中,检测到链路恢复之后,将不恢复原始拓扑。
[0075]总之,虽然已参考其某些优选版本相当仔细地描述了本发明,但是也可以有快速传输故障检测算法和DAC-GE的其它版本和应用。因此,所附权利要求书的精神和范围不应 被限制为对在此所包含的优选版本的描述。
【权利要求】
1.一种用于弹性无线分组通信的系统,包括: 用于在数据接入卡中实例化硬件辅助的快速无线传输信道故障检测算法的装置;以及 用于将所述快速传输信道故障检测算法与适用于重新配置无线网络所具有的拓扑的第2层网络优化协议相组合的装置,其中,所述组合是响应于所述网络中的故障的并且提供对所述网络的自动故障恢复,以使得通过所述网络进行的分组通信对这种故障具有弹性。
2.一种用于无线网络中的弹性无线分组通信的系统,包括: 多个经由无线链路连接的节点,每个节点具有数据接入卡,所述数据接入卡可操作以执行硬件辅助的快速无线传输信道故障检测算法并且将所述快速传输信道故障检测算法与适合于重新配置所述无线网络所具有的拓扑的第2层网络优化协议相组合,其中,所述组合是响应于所述网络中的故障的并且提供对所述网络的自动故障恢复,以使得通过所述网络进行的分组通信对这种故障具有弹性;以及 多个客户端数据接入端口,所述多个客户端数据接入端口中的至少一个被连接到在所述网络一端处的节点中的一个,并且另一个被连接到在所述网络另一端处的节点中的另一个,其中所述快速传输信道故障检测算法可操作以提供无线网络端到端故障检测和恢复。
3.如权利要求2所述的系统,其中,每个数据接入卡是具有可操作用于管理所述组合的引擎的千兆以太网数据接入卡。
4.如权利要求3所述的系统,其中,所述引擎是逻辑电路、FPGA即现场可编程门阵列或ASIC即专用集成电路。
5.如权利要求2所述的系统,其中,每个数据接入卡可操作以在OSI即开放系统互连模型的物理层检测故障。
6.如权利要求2所述的系统,其中,每个节点包括无线电接入卡和户外单元,该户外单元在一侧经由天线被连接到无线链路中的相应的一个并且在另一侧经由所述无线电接入卡被连接到所述数据接入卡。
7.如权利要求2所述的系统,其中,每个数据接入卡包括字节同步阶段。
8.如权利要求2所述的系统,其中,所述引擎包括可操作用于维持分组完整性的流量校准指示符。
9.如权利要求3所述的系统,其中,所述引擎具有其内容被用作调节所述快速传输信道故障检测算法的标准的寄存器,包括保活插入速率寄存器、分组接收超时寄存器、完整性即CRC确认阈值寄存器和完整性即CRC错误速率寄存器。
10.如权利要求3所述的系统,其中,在每个数据接入卡中,所述引擎在发送侧经由以任何顺序被串联连接的反向复用器、空闲填充部分、CRC计算器和头部插入部分与以太网通信信道连接,在接收侧经由以任何顺序被串联连接的复用器、空闲填充移除部分、CRC确认部分和开销移除部分与以太网通信信道连接。
11.如权利要求2所述的系统,其中,所述快速传输信道故障检测算法在故障检测中是自治的,因为其独立于其它无线网络系统故障指示。
12.如权利要求2所述的系统,其中,所述快速传输信道故障检测算法对通过所述无线网络传输有效载荷所需要的跳数是不可知的。
13.如权利要求2所述的系统,其中,所述快速传输信道故障检测算法可操作以提供无线网络端到端故障检测和恢复。
14.如权利要求2所述的系统,其中,所述快速传输信道故障检测算法可操作以提供具有错误弹性的无线操作。
15.一种用于无线网络中的快速故障检测和恢复的方法,包括: 获得包含接收状态或发送状态的状态指示; 判定分组流量校准是否被锁定,并且如果为否,则设置所述接收状态为差; 判定分组是否曾被接收到,并且如果没有,则判定所述接收状态是否应该被设置为差; 计算包含接收状态的分组头部字段的有效性值以判定所述分组头部字段是否有效以及所述接收状态是否应该被设置为好; 如果接收到分组,则从分组的所述接收状态来判定所述发送状态;并且 如果所述发送状态和/或所述接收状态为差,则促使快速传输信道故障检测算法发起对所述无线网络的自动故障恢复或自动错误恢复。
16.如权利要求15所述的方法,其中,所述接收状态被设置在扩展的分组头部字段中,所述扩展的分组头部字段与头部有效性值一起被设置在每个分组中。
17.如权利要求15所述的方法,其中,针对设置所述接收状态为差或好的所述判定包括分别判定在其期间未接收到分组的时间间隔是否超过了预定时间阈值,以及判定所接收到的具有有效扩展头部字段的分组数是否超过了预定阈值。
18.如权利要求15所述的方法,其中,在实现自动恢复时,所述快速传输信道故障检测算法结合适合于所述无线网络所具有的拓扑的第2层网络优化协议来工作。
19.如权利要求18所述的方法,其中,所述拓扑是链路聚合或环形网络拓扑。
20.如权利要求15所述的方法,其中,所述无线网络包括多个节点之间的无线链路,每个节点具有与其相关联的发送状态和接收状态,并且其中,特定节点处的所述发送状态是对在无线地链接到该特定节点的另一远端节点处的所述接收状态的反射。
21.如权利要求20所述的方法,其中,从中得到所述发送状态的所述接收状态的所述反射是从接收自所述远端节点的分组的所述接收状态获得的,并且其中,该特定节点中的故障是基于与之相关联的接收和/或发送状态是否为差来判定的。
22.如权利要求15所述的方法,其中,所述快速传输信道故障检测算法可操作以满足与通过所述无线网络而传输的分组中的有效载荷的存在与否无关的要求,并在没有有效载荷时其插入保活分组以维持链路状态。
23.如权利要求15所述的方法,其中,所述快速传输信道故障检测算法在故障检测中是自治的,因为其独立于其它无线网络系统故障指示。
24.如权利要求15所述的方法,其中,所述快速传输信道故障检测算法对通过所述无线网络传输有效载荷所需要的跳数是不可知的。
25.如权利要求15所述的方法,其中,所述快速传输信道故障检测算法可操作以提供无线网络端到端故障检测和恢复。
【文档编号】H04L12/703GK104022906SQ201410286879
【公开日】2014年9月3日 申请日期:2006年2月24日 优先权日:2006年2月10日
【发明者】阿莱恩·霍顿, 瑟吉奥·里卡尔迪, 曾超明 申请人:哈里斯施特拉特克斯网络运行公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1