一种扩展网桥及其上线控制方法与流程

文档序号:16741356发布日期:2019-01-28 13:02阅读:285来源:国知局
一种扩展网桥及其上线控制方法与流程

本发明涉及网络通信技术领域,尤其涉及一种扩展网桥及其上线控制方法。



背景技术:

802.1br是在数据中心接入层面的一种应用级协议,其定义了扩展桥的操作、交互协议、管理对象和算法,可以为多个物理服务器连接、刀片服务器提供桥的多端口扩展能力,或是为虚拟机提供独立的桥接口实现逻辑连接。

扩展网桥是基于802.1br协议的一种技术实现,其在形成一台逻辑虚拟设备的基础上,把一台盒式设备作为一块远程接口板加入主设备系统,以达到扩展i/o(input/output,输入/输出)端口能力和进行集中控制管理的目的。

扩展网桥中设备按角色分为cb(controllingbridge,控制桥)设备和pe(portextender,端口扩展)设备。cb设备和pe设备之间的级联聚合口up之后,通过lldp(linklayerdiscoveryprotocol,链路层发现协议)发现对端设备;pe设备主动向cb设备发送cspopenmessage;cb设备接收到cb设备发送的cspopenmessage后,向pe设备发送cspopenmessage;pe设备接收到cb设备发送的cspopenmessage后,向cb设备发送注册报文;cb设备接收到pe设备发送的注册报文时,记录pe设备的状态为上线状态。

然而实践发现,当cb设备上连接pe设备的级联聚合口出现异常后恢复时,即该级联聚合口的状态由up(工作)状态变为down(非工作)状态后,又恢复为up状态时,对于该级联聚合口异常前上线的pe设备,cb设备上记录的该pe设备的状态为下线状态,而该pe设备可能会由于未感知到cb设备上的级联聚合口状态发生,仍然认为自身为上线状态,从而导致两端记录的pe设备的状态不一致,pe设备一直无法上线,进而导致业务中断。



技术实现要素:

本发明提供一种扩展网桥及其上线控制方法,以解决现有扩展网桥中cb设备上连接pe设备的级联聚合口出现异常后恢复,导致两端记录的pe设备的状态不一致,pe设备一直无法上线,进而导致业务中断的问题。

根据本发明实施例的第一方面,提供一种扩展网桥,包括控制桥设备和端口扩展设备;其中:

所述控制桥设备,用于当存在连接端口扩展设备的级联聚合口出现异常后恢复时,查询自身记录的所述端口扩展设备的状态;当自身记录的所述端口扩展设备的状态为下线状态时,向所述端口扩展设备发送上线通知报文;

所述端口扩展设备,用于当接收到所述上线通知报文时,响应所述上线通知报文进行上线。

根据本发明实施例的第二方面,提供一种上线控制方法,应用于扩展网桥,所述方法包括:

当所述控制桥设备上存在连接端口扩展设备的级联聚合口出现异常后恢复时,查询自身记录的所述端口扩展设备的状态;

当自身记录的所述端口扩展设备的状态为下线状态时,所述控制桥设备向所述端口扩展设备发送上线通知报文;

当所述端口扩展设备接收到所述上线通知报文时,响应所述上线通知报文进行上线。

根据本发明实施例的第三方面,提供一种上线控制方法,应用于控制桥设备,所述方法包括:

当所述控制桥设备上存在连接端口扩展设备的级联聚合口出现异常后恢复时,查询自身记录的所述端口扩展设备的状态;

当自身记录的所述端口扩展设备的状态为下线状态时,向所述端口扩展设备发送上线通知报文,以触发所述端口扩展设备进行上线。

应用本发明实施例,当控制桥设备上存在连接端口扩展设备的级联聚合口出现异常后恢复时,查询自身记录的该端口扩展设备的状态;当自身记录的该端口扩展设备的状态为下线状态时,向该端口扩展设备发送上线通知报文,以触发该端口扩展设备进行上线,避免了由于pe设备未感知到cb设备侧的级联聚合口的状态变化而导致的两端记录的pe设备的状态不一致,提高了业务可靠性。

附图说明

图1是本发明实施例提供的一种上线控制方法的流程示意图;

图2是本发明实施例提供的一种具体应用场景的示意图;

图3a是本发明实施例提供的一种基于图2所示场景的协议报文交互的示意图;

图3b是本发明实施例提供的一种基于图2所示场景的上线控制方法的流程示意图;

图4a是本发明实施例提供的另一种基于图2所示场景的协议报文交互的示意图;

图4b是本发明实施例提供的另一种基于图2所示场景的上线控制方法的流程示意图;

图5是本发明实施例提供的一种扩展网桥的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明实施例中的技术方案,并使本发明实施例的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明实施例中技术方案作进一步详细的说明。

请参见图1,为本发明实施例提供的一种上线控制方法的流程示意图,其中,该上线控制方法可以应用于扩展网桥中的cb设备,如图1所示,该上线控制方法可以包括以下步骤:

步骤101、当cb设备上存在连接pe设备的级联聚合口出现异常后恢复时,查询自身记录的该pe设备的状态。

本发明实施例中,当cb设备上存在级联聚合口出现异常后恢复时,cb设备可以判断该级联聚合口是否存在802.1br配置;若存在802.1br配置,且配置正确,cb设备可以进一步查询自身记录的该级联聚合口连接的pe设备的状态。

其中,在本发明实施例中,pe设备的状态包括上线状态或下线状态。

需要说明的是,在本发明实施例中,当cb设备确定出现异常后恢复的级联聚合口不存在802.1br配置,或存在802.1br配置但不正确时,可以按照现有技术中的相关流程进行处理,本发明实施例对此不做赘述。

步骤102、当自身记录的该pe设备的状态为下线状态时,向该pe设备发送上线通知报文,以触发该端口扩展设备进行上线。

本发明实施例中,为了避免由于pe设备未感知到cb设备侧的级联聚合口的状态变化而导致的两端记录的pe设备的状态不一致,当cb设备查询到的该pe设备的状态为下线状态时,可以主动向该pe设备发送上线通知报文,以触发该pe设备进行上线。

其中,pe设备进行上线的处理可以参照现有扩展网桥中的相关实现,即pe设备向cb设备发送cspopenmessage,并在接收到cb设备回应的cspopenmessage时,向cb设备发送注册报文,进行上线;或者,

pe设备可以在向cb设备发送cspopenmessage之后,直接向cb设备发送注册报文,进行上线。

可见,在图1所示方法流程中,通过cb设备在出现连接pe设备的级联聚合口异常后恢复时,主动向pe设备发送上线通知报文,触发pe设备进行上线,避免了由于pe设备未感知到cb设备侧的级联聚合口的状态变化而导致的两端记录的pe设备的状态不一致,提高了业务可靠性。

进一步地,在本发明实施例中,考虑到cb设备上存在连接pe设备的级联聚合口出现异常后恢复时,pe设备可能会感知到该情况,并主动重新上线,而在该情况下,cb设备主动向pe设备发送上线通知报文会增加资源浪费,且当级联聚合口出现异常后恢复的情况出现比较频繁的情况下,cb设备会需要发送大量的上线通知报文,导致cb设备负荷过大,因此,当cb设备上存在连接pe设备的级联聚合口出现异常后恢复时,cb设备可以等待一定时间,并在确定pe设备未重新上线时,再主动触发pe设备上线。

相应地,在本发明其中一个实施例中,上述向该pe设备发送上线通知报文,可以包括:

启动定时器;

当定时器超时,且自身记录的该pe设备的状态为下线状态时,向该pe设备发送上线通知报文。

在该实施例中,当cb设备上存在连接pe设备的级联聚合口出现异常后恢复,且自身记录的该pe设备的状态为下线状态时,cb设备可以启动一个定时器,并当该定时器超时时,再次查询自身记录的该pe设备的状态;若仍为下线状态,则向该pe设备发送上线通知报文。

需要说明的是,在该实施例中,当定时器超时时,若cb设备查询到该pe设备的状态为上线状态,即该pe设备感知到cb设备上的级联聚合口的状态变化,并重新上线,则cb设备可以不需要再向pe设备发送上线通知报文。

相应地,在该实施例中,上述启动定时器之后,还可以包括:

当定时器超时之前,接收到该pe设备发送的cspopenmessage时,向该pe设备发送cspopenmessage;

当接收到该pe设备发送的注册报文时,将自身记录的该pe设备的状态设置为上线状态。

在该实施例中,cb设备启动启动器之后,若cb设备接收到该pe设备发送的cspopenmessage,即pe设备感知到cb设备上的级联聚合口的状态变化,并进行重新上线,则cb设备可以向该pe设备回应cspopenmessage报文。

pe设备接收到cb设备回应的cspopenmessage报文时,向cb设备发送注册报文。

cb设备接收到pe设备发送的注册报文时,将自身记录的该pe设备的状态设置为上线状态。

进而,当定时器超时时,cb设备查询自身记录的该pe设备的状态,发现其为上线状态,此时,cb设备可以不需要再向pe设备发送上线通知报文。

进一步地,在本发明实施例中,考虑到当cb设备上连接pe设备的级联聚合口频繁震荡时,即反复出现up状态变化down状态,然后恢复为up状态的情况,cb设备在定时器超时时,触发pe设备重新上线后,会再次出现由于级联聚合口异常后恢复而导致自身记录的该pe设备的状态为下线状态的情况,从而,cb设备需要反复重新启动定时器,并按照上述流程进行处理,导致资源浪费,且加剧cb设备的负荷,因此,cb设备可以在级联聚合口频繁震荡的情况下延长定时器的定时时长。

相应地,在本发明其中一个实施例中,上述向该pe设备发送上线通知报文,还包括:

当cb设备上连接该pe设备的级联聚合口在第一时间阈值内出现异常后恢复的次数超过预设数量阈值时,将该定时器的定时时长由第一时间阈值延长至第二时间阈值;

当定时器超时时,且自身记录的该pe设备的状态为下线状态时,向该pe设备发送上线通知报文。

在该实施例中,cb设备确定存在连接pe设备的级联聚合口出现异常后恢复,且该pe设备的状态为下线状态时,cb设备可以启动定时器,并将该定时器的定时时长设置为第一时间阈值(可以根据实际场景设定,如3分钟)。

cb设备启动定时器之后,cb设备可以统计该级联聚合口在第一时间阈值内出现异常后恢复的次数,并当该次数超过预设数量阈值(可以根据实际场景设定,如5次、10次等)时,cb设备可以将该定时器的定时时长由第一时间阈值延长至第二时间阈值(可以根据实际场景设定,如5分钟),并当定时器超时时,查询自身记录的该pe设备的状态,若自身记录的该pe设备的状态为下线状态时,向该pe设备发送上线通知报文。

需要说明的是,在本发明实施例中,cb设备延长定时器的定时时长之后,可以再次进行级联聚合口的异常后恢复次数的统计,并当该次数超过另一数量阈值(该另一数量阈值大于上述预设数量阈值)时,再次延长定时器的定时时长,其具体实现在此不做赘述。

为了使本领域技术人员更好地理解本发明实施例提供的技术方案,下面结合具体应用场景对本发明实施例提供的技术方案进行说明。

请参见图2,为本发明实施例提供的一种扩展网桥的示意图,如图2所示,该扩展网桥可以cb设备110和cb设备120、pe设备210、pe设备220和pe设备230,其中,cb设备110分别通过级联聚合口111~113和pe设备210~230连接,cb设备120分别通过级联聚合口121~123和pe设备210~230连接。pe设备210~230分别在cb设备110和cb设备120上正常上线,即cb设备110和cb设备120记录的pe设备210~230的状态均为上线状态。

基于图2所示的扩展网桥,本发明实施例提供的上线控制方案实现流程如下(以上线通知报文为cspopenmessage为例):

实施例一

在该实施例中,以cb设备110的级联聚合口111出现异常后恢复为例。

如图3a和图3b所示,该实施例提供的上线控制方法可以包括如下步骤:

步骤301、cb设备110检测到级联聚合口111出现异常后恢复,查询自身记录的pe设备210的状态;

步骤302、当cb设备110记录的pe设备210的状态为下线状态时,cb设备110启动定时器;

其中,若cb设备110查询到pe设备210的状态为上线状态,则直接结束流程。

步骤303、当定时器超时时,再次查询自身记录的pe设备210的状态;若为下线状态,则转至步骤304;否则,结束当前流程;

在该实施例中,若pe设备210感知到cb设备110的级联聚合口111的状态变化,则pe设备210会向cb设备110发送cspopenmessage,并当接收到cb设备110响应的cspopenmessage时,向cb设备110发送注册报文;cb设备110接收到pe设备210发送的注册报文时,将自身记录的pe设备210的状态设置为上线状态;

若pe设备210未感知到cb设备110的级联聚合口111的状态变化,则pe设备210不会主动重新上线,则cb设备110记录的pe设备210的状态会保持为下线状态。

步骤304、cb设备110向pe设备210发送cspopenmessage300a;

步骤305、pe设备210接收到cb设备110发送的cspopenmessage300a,向cb设备110回应cspopenmessage300b;

步骤306、pe设备210向cb设备110发送注册报文;

步骤307、cb设备110接收到pe设备210发送的注册报文,将自身记录的pe设备210的状态设置为上线状态。

实施例二

在该实施例中,以cb设备120的级联聚合口123出现异常后恢复为例。

如图4a和4b所示,该实施例提供的上线控制方法可以包括如下步骤:

步骤401、cb设备120检测到级联聚合口123出现异常后恢复,查询自身记录的pe设备230的状态;

步骤402、当cb设备120记录的pe设备230的状态为下线状态时,cb设备120启动定时器,并将定时时长设置为3分钟;

其中,若cb设备110查询到pe设备210的状态为上线状态,则直接结束流程。

步骤403、cb设备120统计级联聚合口123在3分钟内出现异常后恢复的次数,并当级联聚合口123在3分钟内出现异常后恢复的次数超过10次时,转至步骤404;否则,转至步骤405;

步骤404、cb设备将定时器的定时时长延长至5分钟,并转至步骤405;

步骤405、当定时器超时时,再次查询自身记录的pe设备230的状态;若为下线状态,则转至步骤406;否则,结束当前流程;

在该实施例中,若pe设备230感知到cb设备120的级联聚合口123的状态变化,则pe设备230会向cb设备120发送cspopenmessage,并当接收到cb设备120响应的cspopenmessage时,向cb设备120发送注册报文;cb设备120接收到pe设备230发送的注册报文时,将自身记录的pe设备230的状态设置为上线状态;

若pe设备230未感知到cb设备120的级联聚合口123的状态变化,则pe设备230不会主动重新上线,则cb设备120记录的pe设备230的状态会保持为下线状态。

步骤406、cb设备120向pe设备230发送cspopenmessage400a;

步骤407、pe设备230接收到cb设备120发送的cspopenmessage400a,向cb设备120回应cspopenmessage400b;

步骤408、pe设备230向cb设备120发送注册报文;

步骤409、cb设备120接收到pe设备230发送的注册报文,将自身记录的pe设备230的状态设置为上线状态。

通过以上描述可以看出,在本发明实施例提供的技术方案中,当控制桥设备上存在连接端口扩展设备的级联聚合口出现异常后恢复时,查询自身记录的该端口扩展设备的状态;当自身记录的该端口扩展设备的状态为下线状态时,向该端口扩展设备发送上线通知报文,以触发该端口扩展设备进行上线,避免了由于pe设备未感知到cb设备侧的级联聚合口的状态变化而导致的两端记录的pe设备的状态不一致,提高了业务可靠性。

请参见图5,为本发明实施例提供的一种扩展网桥的结构示意图,如图5所示,该扩展网桥可以包括cb设备510和pe设备520;其中:

cb设备510,用于当存在连接pe设备520的级联聚合口出现异常后恢复时,查询自身记录的该pe设备520的状态;当自身记录的该pe设备520的状态为下线状态时,向该pe设备520发送上线通知报文;

pe设备520,用于当接收到上线通知报文时,响应上线通知报文进行上线。

在可选实施例中,cb设备510,具体用于启动定时器;当定时器超时,且自身记录的pe设备520的状态为下线状态时,向该pe设备520发送上线通知报文。

在可选实施例中,cb设备510,还用于当在定时器超时之前接收到pe设备520发送的cspopen报文时,向该pe设备520发送cspopen报文;

pe设备520,还用于当接收到cb设备510发送的cspopen报文时,向该cb设备510发送注册报文;

cb设备510,还用于当接收到pe设备520发送的注册报文时,将自身记录的该pe设备520的状态设置为上线状态。

在可选实施例中,cb设备510,还用于当连接pe设备520的级联聚合口在第一时间阈值内出现异常后恢复的次数超过预设数量阈值时,将定时器的定时时长由第一时间阈值延长至第二时间阈值;当定时器超时,且自身记录的该pe设备520的状态为下线状态时,向该pe设备520发送上线通知报文。

上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。

对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

由上述实施例可见,当控制桥设备上存在连接端口扩展设备的级联聚合口出现异常后恢复时,查询自身记录的该端口扩展设备的状态;当自身记录的该端口扩展设备的状态为下线状态时,向该端口扩展设备发送上线通知报文,以触发该端口扩展设备进行上线,避免了由于pe设备未感知到cb设备侧的级联聚合口的状态变化而导致的两端记录的pe设备的状态不一致,提高了业务可靠性。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。

应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1