通信连接控制系统和方法

文档序号:7958216阅读:230来源:国知局
专利名称:通信连接控制系统和方法
技术领域
本发明通常涉及通信,尤其是数据通信连接的控制。
背景技术
在网络节点间使用控制平面信令建立数据平面连接的通信协议,诸如X.25、X.76以及专用网间接口(PNNI),通常提供了用于在检测到协议故障时释放连接的过程。例如,如果特定的节点重启它的控制平面,则它的相邻节点控制平面将通过检测没有接收到来自信令链路上的重启控制平面的消息的时间段来检测该重启。
现有协议指出,针对这种NO RESPONSE事件的过程是释放呼叫并且因而断开与重启控制平面相关联的数据平面连接。然而,在许多实现中,控制和数据平面之间存在间隔。因此,控制平面的故障不总是意味着数据平面也有故障。这种情况下断开数据平面连接导致终端用户数据流的不必要的中断。如果在受到控制平面重启影响的节点中发起或终止的呼叫被相邻节点中断,则直到控制平面已经完全重启并且信令链路已经返回至“打开(up)”状态才重新建立数据路径。
一些因特网协议(IP)交换机支持在相邻交换机之间连续广播“Hello”分组的过程。每个交换机在接收到“Hello”分组时重启保持计时器(hold timer)。一般说来,如果保持计时器届满,则交换机假定其相邻交换机的控制平面已经出现故障并且将该相邻交换机从其选路表中删除并停止向该相邻交换机转发分组。根据修改的重启过程,检测到相邻交换机的控制平面重启的交换机在控制平面中断(outage)过程中继续将分组路由至该相邻交换机。当重启相邻交换机的控制平面重新设置并广播另一个“Hello”分组时,该交换机重新发送路由信息到该相邻交换机。
然而,这个IP重启过程完全依赖于重启交换机的相邻交换机以向该重启交换机提供所有需要的选路信息。这是不期望的,因为例如在一些情况下不是所有需要的信息都在相邻交换机可用。
另外,通常针对使用同一接口的所有连接或没有连接,基于每个接口而提供现有的技术。这些技术因此没有规定用于实现这种过程的连接级选择性。
因而,需要用于处理诸如控制平面重启的控制器故障的改进的技术。

发明内容
本发明的一些实施例能够实现在控制器故障期间维持数据通信连接,例如在连接的源或目的处的控制平面重启。
提供一种技术,用于解决信令数据连接的问题,该连接是利用控制信令建立的并且在出现控制平面重启时中断。根据一个实施例,这通过指出在最初建立数据通信连接时要利用专门的控制故障处理能力创建该数据通信连接来完成,假设在该连接路径上的每个节点都支持这种能力。一旦出故障的控制平面从故障中恢复,受影响的节点就内部恢复所有连接,并且然后发起与其相邻节点的再同步过程。这个过程使得数据连接返回正常状态并且清除由邻居在控制平面故障期间释放的任何恢复的连接。
这样,受故障影响的控制器自己执行连接恢复操作,并且完全不依赖于相邻节点或它们的控制器来内部恢复连接。
根据本发明的一个方面,提供了一种通信连接控制器,该通信连接控制器包括功能确定模块,其被配置用于确定控制故障恢复功能是否被启动以用于通过与远程控制器传送控制信息而建立的数据通信连接;和控制故障恢复模块,其有效耦合到所述功能确定模块,并且被配置用于在与远程控制器传送的控制信息中包括关于在控制器支持控制故障恢复功能的指示,其中所述控制故障恢复功能要被启动以用于数据通信连接。
所述控制故障恢复模块可以被配置用来通过在影响远程控制器的故障期间维持数据通信连接并在校正故障后向远程控制器提供与该数据通信连接相关联的控制信息,来支持所述控制故障恢复功能。
在一些实施例中,所述功能确定模块被配置用于通过确定控制故障恢复功能是否已经被请求用于数据通信连接,来确定控制故障恢复功能是否要被启动。
数据通信连接可以是数据通信连接的多个段中的一段。这种情况下,所述功能确定模块可以被配置用于通过确定接收自另一远程控制器的、用于建立另一个数据通信连接段的控制信息是否包括控制故障恢复功能请求,来确定控制故障恢复功能是否已经被请求,并且用于在与远程控制器传送的控制信息中包括控制故障恢复功能请求,其中接收自所述另一远程控制器的控制信息包括控制故障恢复功能请求。
所述故障恢复模块可以在与远程控制器和另一远程控制器中的至少一个所传送的控制信息中,包括关于它支持维持数据连接的功能的指示,其中接收自所述另一远程控制器的控制信息包括控制故障恢复功能请求。
所述功能确定模块可以被配置用于通过确定远程控制器是否在影响控制器的故障期间支持维持数据通信连接的功能,来确定控制故障恢复功能是否要被启动。可以通过确定接收自远程控制器的控制信息是否包括指出远程控制器能够执行维持功能的功能指示符来进行所述确定。
一种通信设备可以包括有效耦合到所述控制故障恢复模块的检测器和控制器。所述检测器被配置用于检测远程控制器的故障并校正该故障,并且所述控制故障恢复模块被配置用于在由所述检测器检测到故障之后的预定时期内维持数据通信连接,并且仅在由该检测器在预定时期内检测到故障校正的情况下才释放该数据通信连接。
在所述数据通信连接是源通信设备和目的通信设备之间的数据通信连接的多个段中的一段的情况下,所述功能确定模块可以通过确定数据通信连接段是连接到源通信设备还是目的通信设备,来确定所述控制故障恢复功能是否要被启动以用于该数据通信连接段。
在一些实施例中,该控制故障恢复模块还被配置用于存储与数据通信连接相关联的控制信息,和在控制器从故障中恢复之后取回(retrieve)所存储的信息,其中所述控制故障恢复功能要被启动以用于数据通信连接。
一种通信系统可以包括多个通信设备。该多个通信设备可以包括各自的控制器,所述控制器被配置用以传送控制信息用于在该多个通信设备之间建立数据通信连接。所述多个通信设备的至少一个子集中的每个通信设备可以包括上述控制器。所述子集的通信设备的控制器使得控制故障恢复功能可以基于每连接而被启动以用于该子集的通信设备之间的数据通信连接,从而从影响该子集的通信设备的控制器的故障中恢复。
本发明的另一方面提供一种方法,该方法包括在与通信设备相关联的控制器之间传送控制信息,所述控制信息由所述控制器使用以建立所述通信设备之间的数据通信连接;确定控制故障恢复功能是否要被启动以用于通信设备之间的数据通信连接;和在与数据通信连接相关联的通信设备之间所传送的控制信息中包括关于每个关联的通信设备是否支持数据通信连接的控制故障恢复功能的指示,其中所述控制故障恢复功能要被启动以用于数据通信连接。
在所述数据通信连接包括连接多个通信设备的各个段的情况下,传送控制信息的操作包括对于多个通信设备中的每个通信设备,确定与该通信设备相关联的控制器是否支持再同步功能和控制信息取回功能中的一个或多个;和在与该通信设备相关联的控制器和另一控制器之间所传送的控制信息中包括关于与该通信设备相关联的控制器是否支持再同步功能和控制信息取回功能中的一个或多个的指示。
所述控制故障恢复功能包括在影响与通信设备之一相关联的控制器的故障期间维持通信设备之间的数据通信连接,和在预定时期内未校正故障的情况下释放该数据通信连接。
在一些实施例中,所述控制故障恢复功能包括在影响与通信设备之一相关联的控制器的故障期间维持通信设备之间的数据通信连接、从该控制器接收对控制信息的请求,和响应于所接收的请求向该控制器提供控制信息。
如果所述数据通信连接是源通信设备和目的通信设备之间的数据通信连接的多个段中的一段,则传送控制信息的操作包括对于包括源通信设备、目的通信设备和经由数据通信连接的一段连接到源通信设备或目的通信设备的任何通信设备的通信设备子集中的每个通信设备,确定与该通信设备相关联的控制器是否支持再同步功能和控制信息取回功能中的一个或多个;和在与该通信设备相关联的控制器和与该子集中另一通信设备相关联的控制器之间所传送的控制信息中,包括关于与该通信设备相关联的控制器是否支持再同步功能和控制信息取回功能中的一个或多个的指示。
在一些实施例中,所述控制故障恢复功能包括在控制器本地存储与数据通信连接相关联的控制信息,和在校正影响控制器的故障之后取回本地存储的控制信息。
还提供一种通信连接控制器,该通信连接控制器包括功能确定模块,其被配置用于确定控制故障恢复功能是否要被启动以用于通过与远程控制器传送控制信息而建立的数据通信连接;和控制故障恢复模块,其有效耦合到所述功能确定模块,并且被配置用于存储与数据通信连接相关联的控制信息并在校正影响控制器的故障之后取回所存储的信息,其中所述控制故障恢复功能要被启动以用于所述数据通信连接。
所述控制故障恢复模块还被配置用于在校正故障之后从远程控制器请求控制信息,并且协调所取回的控制信息和响应于该请求从远程控制器接收的控制信息。
在一些实施例中,所述远程控制器被配置用于检测故障、在检测到故障和从控制器接收到控制信息请求之间的预定时期内维持数据通信连接,并且响应于该请求向该控制器提供控制信息。
所述控制故障恢复模块还被配置用于在与远程控制器传送的控制信息中包括关于已经启动数据通信连接的控制故障恢复功能的指示,其中该控制故障恢复功能要被启动以用于该数据通信连接。
根据本发明的另一方面的相关方法包括在与通信设备相关联的控制器之间传送控制信息,该控制信息由所述控制器使用以建立所述通信设备之间的数据通信连接;确定控制故障恢复功能是否要被启动以用于数据通信连接;和在所述控制故障恢复功能要被启动以用于数据通信连接的情况下,在控制器本地存储与该数据通信连接相关联的控制信息;和在校正影响控制器的故障之后取回本地存储的控制信息。
还提供了一种存储数据结构的机器可读介质。所述数据结构包括数据通信连接的标识符和指示,所述数据通信连接是通过在与通信设备相关联的控制器之间传送控制信息而在所述通信设备之间被建立的,所述指示指出已经启动了所述数据通信连接的控制故障恢复功能,该控制故障恢复功能用于从影响一个或多个控制器的故障中恢复。
所述数据结构还包括与数据通信连接或链路相关联的控制信息,以控制与该数据通信连接相关联的信息。
通过阅读下面的描述,本发明实施例的其他方面和特征对于本领域的技术人员将变得显而易见。


现在参考附图详细描述本发明实施例的例子,其中图1是通信系统的框图;图2是通信设备的框图;图3是说明方法的流程图;图4是说明数据结构的框图。
具体实施例方式
图1是其中可实现本发明实施例示例性通信系统10的框图。通信系统10包括通信网络12和网络管理系统(NMS)24。通信网络12包括网络单元14、16、18、20、22,它们之间可以建立经由网络12的通信网络连接。通信网络12中的网络单元包括可连接到例如终端用户设备的接入设备、其他通信网络和/或其他外部设备的边界或边缘网络单元14、22,和互连的核心网络单元16、18、20。
可在通信网络内提供的或结合通信网络操作的其他设备,例如终端用户设备和其他用户、管理或控制设备,没有在图1中明确示出以避免附图繁复。因此应当认识到,图1的系统以及其他图中的内容仅用于说明。本发明的实施例决不限于任何特定类型的网络、设备、互连或通信。
网络单元14、16、18、20、22可以是交换机、路由器或可通过其建立数据通信连接的常用的任何通信设备。数据通信连接可以是其上交换通信信号的任何类型的连接。如本领域的技术人员认识到的,连接可以包括有线连接、无线连接或其任意组合。例如可以为电话呼叫和数据通信会话建立连接。通信网络12中可用的特定类型的连接可以取决于例如网络单元14、16、18、20、22的类型、网络中使用的协议、服务提供商使用网络提供的服务、为其建立连接的终端用户设备的类型、以及可能的其他因素。
这里使用对“数据”连接的参考以使得用于传送通信业务的连接区别于用于传送控制信息的连接。数据连接可以用于传送任何不同类型的通信业务,包括语音、多媒体等。还应当认识到,通信业务和控制信息可以通过分离的专用介质或经由同一共享物理介质上的不同逻辑连接而被传送。这里对数据和控制连接的参考应当被相应地解释。
在操作中,网络单元14、16、18、20、22可以生成、接收和处理例如控制消息或命令的控制信息,来建立和/或释放或拆除通信网络连接。几种不同机制中的任一种都可以被用于通信网络12中的连接管理。例如,可在NMS 24的控制下建立异步传输模式(ATM)交换永久虚连接(SPVC)。利用ATM信令和从源节点到目的节点的选路(典型地是PNNI)、跨越网络12建立SPVC。这种情况下,例如,NMS 24可以在网络单元14上配置源以及可选地在网络单元22上配置目的地,并且PNNI将被用于建立它们之间的连接。
本领域技术人员所熟知的这种类型的连接,代表与其结合实现本发明实施例的连接类型的说明性实例。应当认识到,本发明决不限于SPVC。也设想了可能包含或不包含NMS 24的其他类型的连接。ATM网络连接还包括例如永久虚连接(PVC)和/或交换虚连接(SVC)。在其他实施例中,这里公开的连接控制技术结合非ATM网络和连接而被使用,例如利用用于控制信令的标签分配协议(LDP)所建立的MPLS标签交换路径(LSP)。
在系统10中,网络单元14、22之间的连接可以通过通信网络12经由不同的路由而被建立。这些路由包括网络单元16、20,网络单元18,网络单元18、20或所有这三个核心网络单元16、18、20。用于这个示例性网络连接的一个路由是基于选路准则而被选择的,并且因此通过所选路由中的网络单元建立网络连接。本领域的技术人员熟知许多可能的路由选择和连接建立技术(例如PNNI)。
一旦已经建立了数据通信连接,它就可以保持可用于传送数据而不管随后的控制平面故障。在这种情况下,仅因为已经出现控制故障也可能不需要释放数据连接。
尽管一些IP交换机可以在控制平面故障期间支持数据转发,然而基于IP的解决方法完全依赖于相邻节点来在出故障的节点从故障中恢复之后发送所有需要的选路信息给任何那些出故障的节点。然而,根据本发明的一个方面,使用不同的方法。当通过相邻节点检测到一个节点的控制平面故障时,例如当在计时器届满之前没有从该节点接收到期望的控制消息时,相邻节点将维持所选择的连接,特别是那些在控制平面故障期间指定要被维持的连接。一旦校正了控制平面故障,受影响的节点就内部恢复同样在受影响节点处被指定的连接,并且然后发起与其相邻节点的同步过程,从而协调恢复的连接与实际的当前连接。
如下面进一步详细描述的那样,在此公开的技术可以选择性地基于一个连接接一个连接而被应用,或甚至是在连接内基于逐跳而被应用。考虑网络单元14和网络单元22之间两个数据连接的实例。一个连接可以利用被启动的改进的连接控制过程来建立,而另一个连接可以在控制平面故障时使用常规过程来释放数据连接。可以替代地为每一跳或连接段进行连接控制技术的确定。这例如使得支持不同连接控制技术的通信设备可以被部署在同一通信系统中。
将参考图2详细描述本发明实施例的所述和其他特征,图2是通信设备的框图。网络单元是通信设备30的一个实例,尽管也设想了其他实现。
通信设备30包括一个或多个控制/数据收发信机32、有效耦合到收发信机32的控制器34、有效耦合到控制器34和收发信机32的检测器36、有效耦合到控制器34的存储器38和有效耦合到检测器36的计时器40、42。在控制器34内,功能确定模块35有效耦合到收发信机32,而故障恢复模块37有效耦合到收发信机32、功能确定模块35、检测器36和存储器38。
通信设备可以包括图2中未示出的附加部件。例如,图2中涉及通信业务处理部件,但为了避免图的繁复而未明确示出。还应当认识到,图2中示出的部件所代表的功能的指定区分仅用于说明而不限制本发明的范围。本发明的其他实施例可以包括以相同或不同方式互连的更多、更少或附加的部件。
设备30的部件可以通过物理连接而彼此有效耦合,所述物理连接例如是在通信设备的电子电路卡上提供部件的基片上的导电线路和/或在相同设备的多个卡之间分布部件的底板导体。例如,可以在控制卡上提供至少一个控制收发信机32、控制器34、检测器36、存储器38和计时器40、42,而在一个或多个线路卡上提供数据收发信机32和通信业务处理部件。
也设想了逻辑互连,其中利用由一个或多个处理元件执行的软件来实现设备30的任一部件。在这种情况下,例如,部件可以访问存储于存储器38的公共存储位置中的信息,并且因而可被看作是通过逻辑连接而彼此耦合。
控制/数据收发信机32可以包括用于传送控制信息和数据的单个收发信机或分离的专用收发信机。在后一情况中,控制器34至少有效耦合到控制收发信机,并且通信业务处理部件至少有效耦合到数据收发信机。
控制和数据格式和协议的各种实例以及支持这些格式和协议的收发信机,对于本领域的技术人员来况是显而易见的。本发明的实施例不限于任何指定的格式或协议。
控制器34的模块35和37、检测器36、计时器40、42以及在某种程度上收发信机32,可以利用硬件、软件、固件或其任意组合来被实现。本领域的技术人员将熟知可用于实现这些部件的许多设备,例如微处理器、微控制器、专用集成电路(ASIC)、可编程逻辑电路(PLD)和/或现场可编程门阵列(FPGA)。
然而,存储器38通常作为硬件部件而被提供,并且可以包括一个或多个存储设备。固态存储设备在通信设备中是常用的,尽管存储器38也可以或替代地包括存储设备用于活动的或甚至可拆卸的存储介质。
考虑到图2中示出的功能部件的许多可能的实现,这里主要就其操作而描述了这些部件。基于操作描述,技术人员能够以任何不同的方式实现本发明的实施例。
控制器34用于与另一通信设备的控制器交换控制信息,以建立通信设备30和另一通信设备之间的数据连接。或许最好也参考图1并考虑利用PNNI通过核心网络单元16、18、20、沿网络单元14和网络单元22之间的一系列信令链路的数据连接的实例,来描述上述过程。
通过在控制信息中包括关于每个网络单元14、16、18、20、22是否支持能够在控制平面故障的情况下维持数据连接的一个或多个功能,可以建立这个实例中的数据连接。数据连接控制故障恢复功能,包括根据本发明实施例的控制平面故障处理,在下文中主要称为信令平面无损重启(SPGR,Signaling Plane GracefulRestart)。然而,“SPGR”的使用仅是出于方便的目的。本发明可以用来处理除信令/控制平面重启之外的其他故障。
前述网络单元中的控制器34,特别是控制故障恢复模块37,可以包括例如PNNI建立消息中的通用应用传输(GAT,Generic Application Transport)信息元素(IE)中的“SPGR Capable”指示符,同时禁用pass-along。这个指示符通知随后的网络单元的控制器在前的网络单元支持SPGR。SPGR可以包括再同步功能和控制信息取回功能中的一个或二者,这将在下面进一步详细描述。
当随后的节点接收这个指示符时,其功能确定模块35确定启动控制故障恢复功能以用于数据连接。故障恢复模块37指定该连接为在影响在前的网络单元的控制器的故障期间要维持的连接,而不是释放或拆除,如下面进一步详细描述的那样。随后的网络单元的模块37可以在存储器38中存储例如数据连接的标识符和“SPGR Supported”或类似的指示符。在其他实施例中,功能确定模块35有效耦合到存储器38并且指定连接为“SPGR Supported”。如前面所指出的,图中示出且在此描述的功能的任何区分是说明性的并且不限制本发明的范围。
当建立消息从控制器传输到控制器以建立数据连接的每一段时,每个网络单元16、18、20都可以以类似的方式将“SPGR Capable”指示符插入该建立消息的GATIE中。
能力指示符可以以相反的方向在控制器之间所传送的连接消息的GATIE中被传送。这使得每个在前的网络单元的控制器能够确定其随后的网络单元的SPGR能力,并且如果合适的话,指定其数据连接段的本地侧为“SPGRSupported”。
上面的实例假定所有网络单元14、16、18、20、22都支持SPGR。然而,在所有的实现中并不一定都是这种情况。同一通信网络中的网络单元可能具有不同的能力。假设网络单元14支持SPGR,“SPGR Capable”指示符被添加到被传送到网络单元16的控制器34的控制信息中。根据其自己的能力,网络单元16的控制器34可以指定或不指定网络单元14的连接段为“SPGR Supported”。例如,如果网络单元16不支持SPGR,则它不将该连接标记为“SPGRSupported”,并且在已经完成数据连接建立之后也不将“SPGR Capable”指示符插入它将返回给网络单元14的连接消息中。
其他网络单元18、20、22和它们的控制器可以类似地进行操作以确定数据连接段是否应当被指定为“SPGR Supported”或根据常规控制和释放技术被处理。
如果IE被用于例如上述“SPGR Capable”指示符的能力指示符,则优选地为该IE禁用pass-along。能力指示符对于每个信令链路和数据连接或段来说是本地指示符,并且因此不应当通过不支持SPGR的网络单元而被传递。另外,支持SPGR的网络单元会错误地确定其相邻网络单元支持SPGR,并且有SPGR能力的网络单元将错误的指定关联的数据连接为“SPGR Supported”。如果不支持的网络单元的控制器随后出现故障,则支持SPGR的网络单元在它不应该维持数据连接时维持该数据连接,这是因为不支持的网络单元不能够内部重建连接,如下文所述。
如果提供端到端SPGR,则支持SPGR的每个网络单元生成它自己的“SPGRCapable”指示符。
为了实现在单独的每连接的基础上选择地启动SPGR能力,另一个指示符,说明性地是GAT IE中的“SPGR Requested”指示符,被包含于建立消息中以向每个支持SPGR的网络单元通知应当启动SPGR。将这个IE标记为pass-along确保了将沿数据连接路径的支持SPGR的网络单元之间的连接段指定为“SPGR Supported”。每个支持SPGR的网络单元的控制器34确定作为该实例中的建立或连接消息的控制信令是否包括“SPGR Requested”指示符,将GATIE传递给另一个网络单元,并且将“SPGR Capable”指示符插入建立或连接消息的另一个GAT IE中。
几种机制中的任一种都可以被实现以使得控制器34能够确定其是否支持SPGR。这个确定可以在控制器34的实际操作中是隐含的,这是因为不支持的控制器除了将“SPGR Requested”指示符传递给另一控制器之外不能处理该指示符。这种情况下,不支持的控制器移除包括“SPGR Capable”指示符的任何GATIE,并且不插入它自己的“SPGR Capable”指示符,其中pass-along对于所述GAT IE是禁用的。在其他实施例中,控制器34例如通过访问配置信息来进行关于SPGR支持的明确确定。
SPGR可以包括再同步功能和/或控制信息取回功能,该再同步功能在检测到影响另一设备的控制器的故障后有效地延迟通信设备处的连接释放。在一些实施例中,由每个支持SPGR的控制器提供这些功能,尽管也有可能控制器不一定支持这两个功能。
再同步功能可在任一或所有通过其建立数据连接的通信设备中被支持,但是在故障影响了与另一通信设备相关联的不同控制器时,由通信设备的控制器来执行。如下面进一步详细描述的那样,检测器36用于检测影响远程控制器的故障。如果控制器34的控制故障恢复模块37支持再同步功能,并且至与远程控制器相关联的通信设备的数据连接要被维持,也就是说,在一个实施例中数据连接被指定为“SPGR Supported”,则控制故障恢复模块37维持数据连接并且还提供数据连接控制信息给远程控制器。这样,控制器34参与了用于再同步出故障的远程控制器的过程。
根据本发明的一个方面,出故障的控制器的控制故障恢复模块在校正了故障时自己本地取回存储的控制信息。由控制器34提供的附加信息由远程控制器使用以协调其本地恢复的控制信息。例如,在故障期间在用户结束故障之前可能有进行中的呼叫通过数据连接。尽管在故障期间维持数据连接的控制器34知道呼叫结束时数据连接被释放,然而与该呼叫相关联的控制信息被远程控制器存储并且随后当它从故障中恢复时被远程控制器取回。这种情况下,远程控制器通过将与释放的连接相关联的信息从其数据库中删除来协调取回的控制信息和它从控制器34接收的控制信息。
在另一个实施例中,受影响的控制器可能不执行本地控制信息取回功能,由此减小与数据连接的本地存储控制信息相关联的附加存储空间。例如,假定为源节点与其第一跳相邻节点之间的数据连接提供故障恢复。由于在源节点支持取回功能并且在第一跳相邻节点支持再同步功能,数据连接不受源节点处的临时控制器故障的影响。在没有任何故障恢复功能支持时,源节点控制器的故障将导致故障整个持续期间的数据连接中断。然而,如果源节点不支持取回功能但是支持再同步功能的一些形式的接收侧操作,则源节点仍可以在建立消息中指示“SPGRCapable”。
假定相邻节点支持再同步功能,则数据连接由第一跳相邻节点在源节点控制器故障期间来维持。一旦源节点控制器被恢复,该源节点就发起与其相邻节点的再同步功能。由于现有的连接未被改编,相邻节点将首先拆除现有的“陈旧的”数据连接作为再同步功能的一部分,然后该源节点试图重建原始数据连接。结果是数据连接的相对短暂的数据中断。这种情况下的中断持续时间是在不提供故障恢复情况下的长久中断和完全支持故障恢复功能情况下的无中断之间。
因此,在已经校正影响控制器的故障之后,再同步功能涉及维持数据连接并且向出故障的控制器提供信息。
如上文所指出的,当远程控制器而不是本地控制器34受到故障影响时,执行再同步功能。检测器36可以使用任何不同的方式来检测这种故障。故障计时器40代表规定基于时间的故障检测的实现的一个实例。
根据本发明的一个实施例,故障计时器40是可重置计时器,该可重置计时器在每次从已与之建立数据连接的通信设备的远程控制器接收到期望的控制消息时由检测器36进行重置。如果通信设备30具有到其他通信设备的多个数据连接,则可以使用多个故障计时器。如果故障计时器40届满,则检测器36在预定时期内还没有接收到期望的控制消息,并且检测到影响远程控制器的故障。其他故障检测机制也是可能的。
所检测的故障可以或不可以被立即报告给控制故障恢复模块37。对于非SPGR数据连接,检测器36向控制故障恢复模块37或可能的不同控制器模块通知所检测的远程控制器故障,并且数据连接被释放。检测器36可替代地被配置用于在SPGR连接的情况下延迟向控制器34报告所检测的远程控制器故障,因为这种连接在故障期间要被维持。
另一可能的方法是使得检测器36向控制器34报告所有检测到的远程控制器故障,并且然后控制故障恢复模块37或另一个控制器模块确定合适的动作。当检测到影响远程控制器的故障时释放非SPGR数据连接,然而维持SPGR连接。
影响远程控制器的故障可以是控制器本身的故障,例如控制器的软件或硬件启动的重置或功率损耗,或与另一个部件相关联的状态,其中远程控制器通过该另一个部件与控制器34通信。例如,位于远程通信设备的控制收发信机或通信设备30和远程通信设备之间的物理控制信令介质可能出现故障。因此这里对故障的参考应当被相应地解释。
例如物理控制信令介质的中断的影响控制器的故障,有可能持续相当长的时间。尽管控制器重启可在容许的时期内完成,然而例如在需要修复或替换损坏的电缆的情况下,不期望在长久的控制器故障期间维持数据连接。释放计时器42因而可以被设置为在维持的连接被释放之前和发起可能的其他故障处理过程之前,提供实质上不长于期望的控制器重启时间的时间周期,或可能地其他容许的时间延迟。
因此,在一些实施例中,控制故障恢复模块37被配置用于在检测器36检测到故障之后的预定时期内维持数据连接。维持数据连接的时间量由释放计时器42设置,其在检测器36检测到故障时开始。如同故障计时器40,释放计时器42是可重置的计时器,但是如果在校正了检测的故障之后接着从远程控制器接收到控制信令则进行重置。随后的控制信令可以是对控制信息的请求的形式,如下文进一步详细描述的那样。因此释放计时器42为故障的校正提供了预定的时间量。除非在该时间内校正了故障,否则释放计时器42届满,并且控制故障恢复模块37释放数据连接。
尽管图2中示出的释放计时器42有效耦合到检测器36,然而这个计时器也可以或替代地有效耦合到控制故障恢复模块37,这取决于控制故障恢复模块37和检测器36是如何被配置的。如上面所指出的,检测器36可能延迟向控制故障恢复模块37报告检测到的故障,在这种情况下,检测器36可能在释放计时器42届满时向控制故障恢复模块37报告所检测的故障。在这种情况下,控制故障恢复模块37在预定时期内维持数据连接,但是不知道远程控制器故障。如果检测到的故障在它们被检测到时被报告给控制故障恢复模块37,则控制故障恢复模块37可以直接与释放计时器42交互来确定应当何时释放维持的数据连接。释放计时器42也可以在这种实现中有效耦合到检测器36从而使检测器36能够在校正故障时重置计时器。
根据前述内容,应当清楚例如计时器监控和重置的故障检测功能可以由控制器34、检测器36执行或分布于那些部件之间。图2所示的分离的控制器34和检测器36之间的这些功能的区分仅是用于说明。
根据本发明实施例的连接控制技术也可以包括其本地控制器34受故障影响的通信设备的控制信息取回功能。与上述再同步功能相关联的操作由其邻居受控制器故障影响的通信设备的控制器来执行,而控制信息取回功能使得控制器能够根据本地存储的信息而内部重建它的出故障前的数据连接,而不必首先从其相邻控制器获得该信息。
通过配置控制故障恢复模块37存储与要在控制器故障期间维持的数据连接相关联的控制信息来启动恢复功能。例如,对于任何标记为“SPGR Supported”的数据连接,控制故障恢复模块37可能在存储器38中存储呼叫参考或其它连接标识符和与数据连接相关的控制信息,例如用于到达每个相邻通信设备的端口、虚路径标识符(VPI)、虚电路标识符(VCI),其中它通过数据连接或数据连接段连接到所述相邻通信设备。应当认识到,上述呼叫参考、端口、VPI和VCI信息仅是用于说明。可以存储其他类似的或不同的信息。例如,不同的协议可以针对数据连接使用不同的控制信息。
在控制器34出故障的情况下,当故障被校正时,存储的控制信息可以从存储器38中本地取回。存储器38因而包括关于控制器34的故障的非易失性的存储设备或存储位置。一旦校正了故障,控制器34就可以取回存储的控制信息来内部重建任何SPGR数据连接,并且开始协调过程。这个过程包括从相邻控制器请求控制信息,比较取回的控制信息和响应于请求而接收的控制信息,并执行任何必要的更新。
由控制器存储用于随后故障的信息的量和特定类型,不必与在连接建立期间或再同步期间在控制器之间所传送的信息相同。例如,本地内部交叉连接信息代表可以被存储且以后被控制器取回的控制信息的一个实例,但是所述控制信息不能在控制器之间被传送或不可用于另一通信设备的相邻控制器。这种类型的信息因而可以作为一部分恢复功能而被控制器本地取回,但是不会出现在由控制器从相邻控制器接收的控制信息中。
根据本发明一个实施例的总体连接控制机制,因而可以包括在未受影响的通信设备的再同步功能和在受影响的通信设备的恢复功能。当控制器经历了例如可能是重置的故障时,每个相邻通信设备处的控制器通过它的故障计时器检测该故障。对于其上不支持SPGR的数据连接,可以由未受影响的设备的控制器执行正常的连接拆除过程。对于SPGR数据连接,每个相邻设备控制器启动释放计时器,并且如果在相邻设备接收关于已经校正故障的指示之前释放计时器届满,则释放那些数据连接。这个指示是作为受影响的控制器的恢复功能的一部分而被提供的。
在已经校正故障状态之后,例如当受影响的控制器已经重启时,受影响的控制器从本地存储器中取回先前存储的所有SPGR连接的信息。对于每个SPGR连接,控制器可以内部重建例如连接控制、本地信令链路和连接信息,从而恢复连接而不必生成任何外部信令消息。
一旦SPGR连接由受影响的控制器本地恢复,则控制器针对关联的信令链路执行与相邻设备控制器的再同步功能。这可能需要在信令链路上发送再同步指示,这导致相邻设备控制器针对与信令链路相关联的每个当前数据连接而发送状态查询消息。在这点,相邻设备控制器针对该数据连接而停止它的释放计时器。由受影响的控制器使用现有的状态释放过程来释放任何数据连接,其中受影响的通信设备或相邻通信设备没有针对该数据连接的当前记录,例如故障期间通信网络中在别处被释放的呼叫。
根据前述内容应当清楚,不同的控制器和通信设备可以不同程度地支持SPGR。尽管期望在多数实现中控制器完全支持或者不支持SPGR,然而可以独立地支持再同步功能和恢复功能。
例如,再次参考图1,考虑网络单元14、22之间经由三个核心网络单元16、18、20的数据连接和影响网络单元16的控制器的故障。在一些类型的网络中,由网络单元14建立经由网络单元18至网络单元22的备用路由可能更快,而不是延迟这个动作直到网络单元14的释放计时器届满。然而,由于耦合到网络单元14的接入设备仅能通过该网络单元到达,备用选路不能克服影响网络单元14的控制器的故障。在这种情况中,一种可能方法是在一个“方向”中启动SPGR,这通过启动在网络单元14的恢复功能和在网络单元16的再同步功能或对其提供支持来实现。更一般地,至少恢复功能可以在边界或边缘网络单元14、22处得到支持,并且至少再同步功能可以在核心网络单元16、18、20处得到支持。
数据连接控制故障恢复功能请求和/或能力指示符可以适于规定这种类型的选择性启动。“SPGR Requested”指示符可以具有不同的值用来指示控制器是否应当启动恢复功能、再同步功能或二者。例如“SPGR Capable”指示符和/或“SPGR Supported”指示符的其他指示符,可以类似地适于提供关于SPGR能力级或支持的指示。
如上所述,单向SPGR代表指定段或指定跳的SPGR的特殊情况。SPGR因而可以端到端地被启动来覆盖整个数据连接,逐段地被启动以覆盖指定段,例如从源节点开始的第一跳和/或到目的节点的最后一跳,其中较少的备用路由在通信网络中可用,和/或在一段或多段上的指定“方向”中被启动。
对于指定源/目的地的SPGR,可以启动“SPGR Requested”和“SPGRCapable”指示符的专门处理。“SPGR Request”指示符可能具有用于请求源/目的地SPGR的各个值,其与端到端SPGR相反。支持SPGR的控制器在接收对源/目的地SPGR的请求时,只有当它是源节点控制器、目的节点控制器或与源节点或目的节点的相邻节点相关联时,才将“SPGR Capable”指示符添加到建立或连接消息中。
尽管上面主要描述了通信设备,然而可以以其他形式实现本发明的各个方面。例如,图3是说明方法的流程图,而图4是说明数据结构的框图。
参考图3,方法50开始于52,即接收连接请求或其他发起数据连接建立的控制信息的操作。在PNNI的上述实例中,连接请求可以是建立消息的形式。
在54,进行关于是否要在控制器出故障的情况下为请求的连接启动控制故障恢复功能以维持连接的确定。例如,可以在“SPGR Requested”或“SPGRCapable”指示符以及可能地要启动的SPGR级别的基础上进行所述确定,其包括上述再同步功能和恢复功能中的一个或者二者。
如果没有针对请求的连接而启动控制故障恢复功能,则在56通过在通信设备控制器之间传送控制信息来建立连接。
在至少启动控制信息取回功能的情况下,与控制器相关联的控制信息在58被存储,并且连接在60被建立。再同步功能也可以包括存储控制功能,尽管针对这些功能出于不同的目的而存储信息。对于取回功能,信息被存储以用于本地取回并且被用来内部重建数据连接,而对于再同步功能,信息被存储以用于以后传送到远程控制器。
在56和60的操作已经在图3中被类似地标记,但是对于在56建立的非SPGR连接和在60建立的SPGR连接可能包括不同的操作。如上所述,例如,SPGR连接的建立可能需要生成并传送“SPGR Capable”指示符。
当在62出现控制器故障时,随后在64到66的操作的特性取决于故障是影响本地控制器还是影响远程控制器,并且据此考虑随后的操作。
在由本地控制器在62检测到的远程控制器故障的情况下,SPGR连接在预定时间内被维持或直到远程控制器在64从故障中恢复。为了避免使图3繁复,连接的延迟释放没有明确示出。假定远程控制器在释放SPGR连接之前最终在64从故障中恢复,在66恢复对该连接的控制,并且在68协调用于该连接的控制信息。在未受影响的控制器,这些操作包括从受影响的控制器接收对控制信息的请求,和响应于该请求而发送控制信息给受影响的控制器。
从受影响的控制器的角度来看,在64的操作可以包括重启过程的完成。在66,通过取回先前存储的控制信息而内部重建SPGR连接,如上所述接着在68,受影响的控制器协调取回的控制信息和从其(一个或多个)相邻控制器接收的控制信息。
与图3中明确示出的相比,本发明的其他实施例可以包括以相同或不同顺序执行的、更少、更多或不同的操作。例如,在58的存储操作可以在连接在60被建立之后被执行。其他变型对于本领域的技术人员是显而易见的,包括执行图3示出的操作和/或可在一些实施例中执行的附加操作的不同可能方式。这些变型的其中一些已经在上文就设备而进行了描述。
现在参考图4,数据结构70包括用于存储连接标识符72的数据字段、功能指示符74、控制信息76和其他信息78。
可以例如是呼叫参考的连接标识符72标识了数据连接,并且功能指示符74提供了关于已经启动该数据连接的控制故障恢复功能的指示。在上述一个实施例中,指示符74是“SPGR Supported”指示符。
如果为连接启动了取回功能,则控制信息也在76被存储。数据字段76可以存储至实际控制信息的指针或其他链路,而不是控制信息本身。
如在78所示,数据结构还可以包括其他信息。应当认识到,也设想了数据结构70的其他变型。本发明的其他实施例可以包括以相同或不同顺序安排的更多、更少或不同的数据字段。例如,控制器可以在SPGR表或其它专用存储结构或位置中存储SPGR连接的记录。在这种情况下,功能指示符74尤其是默认的指示符,因为在SPGR表中连接的数据记录的存在指示该数据连接是SPGR连接。
本发明的实施例因而提供了一种机制,通过这种机制,可以在控制平面中断或其他控制器故障期间保持例如源和目的SPVC的数据连接或一部分数据连接。这个特征对于诸如SPVC的某些类型的连接尤其有用。SPVC通常优于PVC并且比PVC容易维持。然而,不像PVC,SPVC易于出现由控制平面故障引起的数据中断。以上述方式,可以针对可恢复控制平面故障而避免SPVC数据中断。
所描述的内容仅用于说明本发明实施例原理的应用。其他安排和方法可以由本领域的技术人员在不背离本发明范围的情况下实现。
例如,通信系统可以包括具有不同SPGR能力的通信设备。本发明实施例的实现因此不排除其他形式的连接控制。如果通信网络中仅有通信设备的子集支持SPGR,则该子集的设备之间的数据连接可以具有启动的SPGR,即使其他连接或连接段不具有。
还应当指出,如果数据平面出故障,则SPGR可以结合数据平面监控能力而被部署,以实现SPGR支持的超越和数据连接的释放。用于检测端口或操作、管理和维护(OAM)中断的公知过程适用于这种类型的监控。
此外,尽管主要描述了方法和系统,然而也可以设想本发明的其他实现,例如作为存储于机器可读介质上的指令。
权利要求
1.一种通信连接控制器,包括功能确定模块,其被配置用于确定控制故障恢复功能是否被启动以用于通过与远程控制器传送控制信息而建立的数据通信连接;和控制故障恢复模块,其有效耦合到所述功能确定模块,并且被配置用于在与所述远程控制器传送的控制信息中包括关于在控制器支持控制故障恢复功能的指示,其中所述控制故障恢复功能要被启动以用于数据通信连接。
2.根据权利要求1的控制器,其中,所述控制故障恢复模块被配置用于通过在影响所述远程控制器的故障期间维持数据通信连接和在校正故障之后向该远程控制器提供与该数据通信连接相关联的控制信息,来支持所述控制故障恢复功能。
3.根据权利要求1或2的控制器,其中,所述功能确定模块被配置用于通过确定所述控制故障恢复功能是否已经被请求用于数据通信连接,来确定该控制故障恢复功能是否要被启动。
4.根据权利要求3的控制器,其中,所述数据通信连接包括数据通信连接的多个段中的一段,其中,所述功能确定模块被配置用于通过确定接收自另一个远程控制器的、用于建立另一个数据通信连段的控制信息是否包括控制故障恢复功能请求,来确定所述控制故障恢复功能是否已经被请求;和其中,所述控制故障恢复模块还被配置用于在与所述远程控制器传送的控制信息中包括所述控制故障恢复功能请求,其中接收自所述另一个远程控制器的控制信息包括控制故障恢复功能请求。
5.根据权利要求1或2的控制器,其中,所述功能确定模块被配置用于通过确定所述远程控制器是否在影响控制器的故障期间支持维持数据通信连接的功能,来确定所述控制故障恢复功能是否要被启动。
6.根据权利要求5的控制器,其中,所述功能确定模块被配置用于通过确定接收自所述远程控制器的控制信息是否包括指示该远程控制器能够执行维持功能的功能指示符,来确定该远程控制器是否支持维持数据通信连接的功能。
7.根据权利要求4的控制器,其中,所述控制故障恢复模块还被配置用于在与所述远程控制器和另一个远程控制器中的至少一个所传送的控制信息中,包括关于它支持维持数据连接的功能的指示,其中接收自所述另一个远程控制器的控制信息包括控制故障恢复功能请求。
8.一种包括根据权利要求1或2的控制器的通信设备,该通信设备还包括检测器,其有效耦合到所述控制故障恢复模块,并且被配置用于检测远程控制器的故障和该故障的校正,其中,所述控制故障恢复模块被配置用于在由所述检测器检测到故障之后的预定时期内维持数据通信连接,并且仅在由该检测器在预定时期内检测到故障校正的情况下才释放该数据通信连接。
9.根据权利要求1或2的控制器,其中,所述数据通信连接包括在源通信设备和目的通信设备之间的数据通信连接的多个段中的一段,和其中,所述功能确定模块被配置用于通过确定该段是连接到所述源通信设备还是连接到所述目的通信设备,来确定所述控制故障恢复功能是否要被启动以用于该数据通信连接段。
10.根据权利要求1或2的控制器,其中,所述控制故障恢复模块还被配置用于存储与所述数据通信连接相关联的控制信息,并且在控制器从故障中恢复之后取回所存储的信息,其中所述控制故障恢复功能要被启动以用于所述数据通信连接。
11.一种通信系统,包括多个通信设备,该多个通信设备包括被配置用于传送控制信息以在该多个通信设备之间建立数据通信连接的各个控制器,其中,所述多个通信设备的至少一个子集中的每个通信设备都包括根据权利要求10的控制器,该子集的通信设备的控制器使得控制故障恢复功能能够基于每连接而被启动以用于该子集的通信设备之间的数据通信连接,从而从影响该子集的通信设备的控制器的故障中恢复。
12.一种方法,其包括下列步骤在与通信设备相关联的控制器之间传送控制信息,所述控制信息由所述控制器使用以建立所述通信设备之间的数据通信连接;确定控制故障恢复功能是否要被启动以用于通信设备之间的数据通信连接;和在与所述数据通信连接相关联的通信设备之间所传送的控制信息中包括关于每个关联的通信设备是否支持数据通信连接的控制故障恢复功能的指示,其中所述控制故障恢复功能要被启动以用于所述数据通信连接。
13.根据权利要求12的方法,其中,所述数据通信连接包括连接到多个通信设备的各个段,并且其中,传送控制信息包括对于所述多个通信设备中的每个通信设备确定与所述通信设备相关联的控制器是否支持再同步功能和控制信息取回功能中的一个或多个;和在与所述通信设备相关联的控制器和另一个控制器之间所传送的控制信息中,包括关于与通信设备相关联的控制器是否支持再同步功能和控制信息取回功能中的一个或多个的指示。
14.根据权利要求12或13的方法,其中,所述控制故障恢复功能包括在影响与所述通信设备之一相关联的控制器的故障期间,维持通信设备之间的数据通信连接;和如果在预定时期内未校正所述故障,则释放所述数据通信连接。
15.根据权利要求12或13的方法,其中,所述控制故障恢复功能包括在影响与所述通信设备之一相关联的控制器的故障期间,维持通信设备之间的数据通信连接;从所述控制器接收对控制信息的请求;和响应于所接收的请求向所述控制器提供控制信息。
16.根据权利要求12的方法,其中,所述数据通信连接包括在源通信设备和目的通信设备之间的数据通信连接的多个段中的一段,并且其中,传送控制信息包括对于包括源通信设备、目的通信设备和经由一个数据通信连接段连接到该源通信设备或该目的通信设备的任何通信设备的通信设备子集中的每个通信设备确定与通信设备相关联的控制器是否支持再同步功能和控制信息取回功能中的一个或多个;和在与所述通信设备相关联的控制器和与该子集中另一个通信设备相关联的控制器之间所传送的控制信息中,包括关于与通信设备相关联的控制器是否支持再同步功能和控制信息取回功能中的一个或多个的指示。
17.根据权利要求12或13的方法,其中,所述控制故障恢复功能包括在控制器本地存储与数据通信连接相关联的控制信息;和在校正影响控制器的故障之后取回本地存储的控制信息。
18.一种存储指令的机器可读介质,所述指令在被执行时实现根据权利要求12或13的方法。
19.一种通信连接控制器,包括功能确定模块,其被配置用于确定控制故障恢复功能是否要被启动以用于通过与远程控制器传送控制信息而建立的数据通信连接;和控制故障恢复模块,其有效耦合到所述功能确定模块,并且被配置用于存储与所述数据通信连接相关联的控制信息并在校正影响控制器的故障之后取回所存储的信息,其中所述控制故障恢复功能要被启动以用于所述数据通信连接。
20.根据权利要求19的控制器,其中,所述控制故障恢复模块还被配置用于在校正故障之后从所述远程控制器请求控制信息,和协调所取回的控制信息和响应于该请求从该远程控制器接收的控制信息。
21.根据权利要求20的控制器,其中,所述远程控制器被配置用于检测故障、在检测到故障和从所述控制器接收到控制信息请求之间的预定时间间隔内维持数据通信连接,以及响应于该请求向该控制器提供控制信息。
22.根据权利要求19至21中任一项的控制器,其中,所述控制故障恢复模块还被配置用于在与所述远程控制器传送的控制信息中包括关于所述控制故障恢复功能已经被启动以用于数据通信连接的指示,其中所述控制故障恢复功能要被启动以用于数据通信连接。
23.一种方法,其包括下列步骤在与通信设备相关联的控制器之间传送控制信息,所述控制信息由所述控制器使用以建立所述通信设备之间的数据通信连接;确定控制故障恢复功能是否要被启动以用于所述数据通信连接;和在所述控制故障恢复功能要被启动以用于所述数据通信连接的情况下在控制器本地存储与所述数据通信连接相关联的控制信息;和在校正影响控制器的故障之后取回本地存储的控制信息。
24.一种存储数据结构的机器可读介质,所述数据结构包括数据通信连接的标识符,该数据通信连接是通过在与通信设备相关联的控制器之间传送控制信息而在所述通信设备之间被建立的;和关于控制故障恢复功能已经被启动以用于数据通信连接的指示,该控制故障恢复功能用于从影响一个或多个控制器的故障中恢复。
25.根据权利要求24的机器可读介质,其中,所述数据结构还包括与所述数据通信连接或链路相关联的控制信息,以控制与该数据通信连接相关联的控制信息。
全文摘要
公开了通信连接控制系统和方法。如果控制故障恢复功能要被启动以用于由通信连接控制器通过与远程控制器传送控制信息而建立的数据通信连接,则在与远程控制器传送的控制信息中包括关于在控制器支持控制故障恢复功能的指示。例如,控制器和远程控制器中每一个都可以支持本地控制信息恢复功能或再同步功能中的一个或二者,以减少在控制器之一出现临时故障期间中断数据连接的时间量。
文档编号H04L29/06GK101043370SQ200610064449
公开日2007年9月26日 申请日期2006年12月13日 优先权日2005年12月13日
发明者J·沃尔顿, P·D·罗伯茨 申请人:阿尔卡特朗讯公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1