一种实现网络网络接口连接的同步和恢复方法

文档序号:7942047阅读:359来源:国知局
专利名称:一种实现网络网络接口连接的同步和恢复方法
技术领域
本发明涉及智能光网络领域,更确切地说是涉及一种实现智能光网络中网络网络接口(NNI,Network Network Interface)连接的同步和恢复方法。
背景技术
在智能光网络中,控制平面控制数据平面中的连接,但是控制平面的失效不能影响数据平面业务的传输,而且控制平面从故障中恢复后,还需要将数据平面存在的连接进行连接状态的同步和恢复,以对数据平面的连接继续进行控制。
现有的光互联网络论坛(OIF)、因特网工程任务组(IETF)有关智能光网络的标准、草案给出了相关的技术方案,以下为具体的技术方案。
在OIF的用户网络接口(UNI,User Network Interface)1.0标准中给出了在UNI接口使用标记分发协议(LDP)进行连接失败检测和恢复的需求因为控制平面的失败不能影响数据平面上数据的传输,所以需要采用一种机制来检测信令通信的失败,并在信令通信恢复后利用同步过程来保证用户节点(UNI-C)和网络边缘节点(UNI-N)上连接状态的一致性。UNI1.0针对这一需求给出了相关的解决方案,其解决方案即为在UNI-N上保存已建立成功的连接的配置和状态等信息;通过LDP保活(LDP Keepalive)机制来检测控制平面信令通信的失败;如果失败发生,则将数据平面中正在建立的连接删除,并保存已经建立好的连接;如果控制平面的信令通信恢复,则UNI-N不发起连接状态的同步过程,而由UNI-C发起同步过程,其同步过程根据UNI-C的不同情况分为以下几种a.控制平面的信令通信失败期间,UNI-C和UNI-N都保存了连接状态信息,则由UNI-C向UNI-N发送概要状态查询信息进行同步;b.控制平面的信令通信失败期间,UNI-C丢失了所有连接的信息,则UNI-C可以向UNI-N发送详细状态查询消息进行同步,也可以决定删除数据平面中所有相关的连接。
只有在所有连接的同步均完成之后才可以建立新的连接。
OIF的NNI需求文档(OIF2001.535.02)也提出了连接状态的同步和恢复的需求,但是还没有给出具体的实现方案。
IETF的相关文档也提出了类似的需求,其中的draft-ietf-mpls-ldp-ft-02中提到了标记交换路由器必须能够通过容错(FT,fault tolerance)过程从本地的硬件或软件故障中恢复。该文档针对这一需求给出了具体的解决方案和时序图,并扩展了与LDP会话有关的消息。
在以上的几种现有方案中,OIF提出的方案仅适合于智能光网络的UNI接口,而智能光网络内部的接口为NNI接口,并不存在UNI-C和UNI-N之分,因此OIF所提出的方案不能在智能光网络的NNI接口中使用,而且该方案不能解决多个网络节点发生故障的问题;IETF提出的方案中的FT是针对传统的标记交换路径的,而智能光网络是以物理时隙作为标记的,因此IETF所提出的方案也不能在智能光网络中使用;OIF2001.535.02中只提出了NNI接口连接状态的同步和恢复的需求,并没有给出具体的实现方案。

发明内容
有鉴于此,本发明的主要目的是提供一种实现NNI接口连接的同步和恢复方法,以实现在智能光网络的NNI接口中进行连接的同步和恢复。
为达到以上目的,本发明的方案具体是这样实现的一种实现网络网络接口连接的同步和恢复方法,适用于智能光网络中,其特征在于,在每个连接成功建立后将该连接的相关信息保存在网络内部节点中,将该连接的全部配置与状态信息保存在网络边缘节点中,当检测到控制平面信令通信失败时,利用网络节点所保存的连接信息完成连接的同步与恢复,该同步与恢复过程进一步包括以下步骤a.通过标记分发协议(LDP)检测控制平面上信令通信失败的原因,如果是链路出现故障,进入步骤b,如果是节点出现故障,则进入步骤c;b.在链路出现故障后链路两端的节点保留原有的连接信息,在链路恢复后链路两端的节点分别向对端节点发起连接的同步和恢复过程,之后结束本流程;c.故障节点恢复后先进行本节点的同步,然后分别建立该故障节点与对应每条连接的相邻节点间的同步,从相邻节点恢复故障节点上每条连接的配置和状态信息,再根据获得的信息恢复或删除该故障节点与每个相邻节点间的连接。
已经建立的连接的标记交换路径标识、连接的上游节点的节点标识、连接的下游节点的节点标识、连接的上游标记请求标识和连接的下游标记请求标识作为连接的相关信息保存在网络内部节点中。
所述步骤b中,链路两端节点分别向对端节点发起的连接同步和恢复过程具体包括以下步骤b1.链路两端的节点根据自身所保存的连接信息分别向对端节点发送概要状态查询消息;b2.如果所查询的连接在对端节点存在,则向发端节点发送包含状态码为连接处于激活态(Connection Active)的概要状态响应消息,否则,发送包含状态码为连接不可用(Connection Unavailable)的概要状态响应消息;b3.发端节点收到的概要状态响应消息中包含的状态码如果是ConnectionActive,则在收到该消息后该发端节点恢复对应的连接,如果是ConnectionUnavailable,则在收到该消息后该发端节点删除对应的连接。
所述步骤a检测到的节点出现故障为单节点出现故障,且故障节点为网络内部节点时,所述步骤c进一步包括以下步骤c11.该故障节点恢复后从自身数据库中读取故障前所保存的连接信息,并根据该连接信息与数据平面的连接进行同步,删除与数据平面上不存在的连接的相关信息;
c12.该故障节点发起LDP的会话建立过程,会话建立成功后根据本节点保存的连接信息建立连接控制块与LDP会话的对应关系;c13.该故障节点分别向每条连接对应的上游和下游节点发送详细状态查询消息,反馈回的详细状态响应消息中如果包含的状态码为Connection Active,则根据消息中的信息恢复对应的连接,如果包含的状态码为ConnectionUnavailable,则删除对应的连接。
所述的步骤c13进一步包括故障节点在发送详细状态查询消息的同时针对每条连接启动定时器,定时器超时且没有收到反馈消息时则删除对应的连接。
所述步骤a检测到的节点出现故障为单节点出现故障,且故障节点是网络边缘节点时,该网络边缘节点恢复后直接从数据库中恢复所有连接的全部信息。
所述步骤a检测到的节点出现故障是多节点失败,所述步骤c进一步包括以下步骤c14.故障节点中的网络内部节点分别进行步骤c11到c12的本节点连接同步恢复过程,网络边缘节点恢复后直接从数据库中恢复所有连接的全部信息;c15.故障节点中的网络内部节点等到其相邻节点恢复后,向其相邻节点发送详细状态查询消息,如果相邻节点恢复后没有连接的全部信息,则相邻节点反馈状态码为连接被挂起(Connection Pending)的概要状态响应消息给该故障节点,如果相邻节点同步后恢复了连接的全部信息,则再向其相邻节点发送状态码为Connection Active的详细状态响应消息,如果相邻节点同步后没有恢复连接的全部信息,则向其相邻节点发送状态码为Connection Unavailable的详细状态响应消息,c16.故障节点如果接收到状态码为Connection Pending的概要状态响应消息,则保存对应连接的相关信息,并等待该故障节点的相邻节点恢复连接,如果相邻节点恢复后反馈给故障节点的响应消息的状态码为Connection Active,则故障节点恢复对应的连接,如果状态码为Connection Unavailable,则故障节点删除对应的连接。
所述步骤c15进一步包括每个故障节点针对每个连接设置定时器,定时器超时且故障节点没有收到反馈消息,则删除对应的连接。
该方法还可进一步包括,故障节点在恢复时从数据平面查询获得标记信息。
本发明方法在UNI-N上保存连接的全部信息,在网络内部节点中只保存连接的部分相关信息,节省了数据库的存储空间。本发明使用LDP进行连接的同步和恢复,当控制平面从故障中恢复后,能够对数据平面中仍然存在的连接继续进行控制,从而在后续过程中可以对连接进行查询和删除,本发明还实现了对于多个网络节点失败这种情况下连接的同步和恢复。


图1为本发明方法实现的流程图;图2为本发明实施例中多节点出现故障的示意图。
具体实施例方式
下面结合附图及具体实施例对本发明方法作进一步详细的说明。
本发明方法基于LDP协议建立,其具体实现步骤参见图1。
将建立成功的所有连接的全部配置和状态信息保存在网络边缘节点(UNI-N)中,而只将与网络内部节点相关的连接信息保存到网络内部节点中,以节省数据库的存储空间,该相关的连接信息包括标记交换路径标识(LSP-ID)、连接的上游节点的节点标识(NodeID)、连接的下游节点的节点标识(NodeID)、连接的上游标记请求标识(Label Request ID)和连接的下游标记请求标识(Label Request ID)。
控制平面信令通信的失败包括三种情况,一种是链路出现故障,一种是单节点出现故障,另一种是多节点出现故障。LDP通过Keepalive消息对控制平面进行检测,根据检测到出现故障的情况采用以下不同的处理方法。
如果检测到是链路出现故障,则采用链路出现故障的处理方案,以下为该处理方案的具体实现步骤
A.保留该链路两端节点连接控制块中所保存的与连接相关的信息。
B.如果LDP检测到该链路恢复,则该链路两端的节点针对其所保存的连接信息分别向对端节点发送概要状态查询消息。
因为节点中保存的信息没有丢失,所以只需要发送概要状态查询消息查询该连接在对端节点是否存在即可。
C.收到对端节点的概要状态查询消息后,如果所查询的连接在本节点存在,则向对端节点发送包含状态码“连接处于激活态(Connection Active)”的概要状态响应消息,否则,向对端节点发送包含状态码“连接不可用(Connection Unavailable)”的概要状态响应消息。
D.节点收到的概要状态响应消息中包含的状态码如果是“ConnectionActive”,则在收到该消息后对应的连接被恢复,控制平面可以对该连接继续进行控制,如果是“Connection Unavailable”,则说明对应连接的恢复失败,本节点应发起连接删除来删除数据平面中这个已经失效的连接。
对于节点来说,可能只有单个节点出现故障,也可能会有多个节点同时出现故障,如果检测到是单个节点出现故障,则采用单个节点出现故障的处理方案。而节点又可以分为网络内部节点和UNI-N,由于其内部存储信息不同,所以同步和恢复连接的方法也不同。下面首先将单个节点出现故障时同步和恢复连接的方法作详细说明。
A.如果LDP通过Keepalive消息检测到某个故障节点恢复,则进一步检测该故障节点是网络内部节点还是UNI-N,如果该故障节点是UNI-N,则进入下一步,如果是网络内部节点,则进入步骤E。
B.由于其内部已经保存了所有连接的全部配置和状态信息,所以在该UNI-N恢复后从数据库中恢复所有连接的全部信息。
C.故障节点首先进行节点自身的同步,其同步的具体步骤是先从数据库中读取出故障前所保存的连接信息,然后与数据平面中的连接进行同步,将故障节点中保存的与数据平面中已经不存在的连接相关信息删除。
D.该故障节点自身的同步完毕后,开始发起LDP的会话建立过程,会话建立成功后,根据该故障节点所保存的与连接对应的相邻节点的信息建立连接控制块与LDP会话的对应关系。相邻节点包括上游节点和下游节点。
E.该故障节点针对每条连接分别向与该连接对应的上游和下游节点发送详细状态查询消息,并针对每条连接启动一个定时器,如果定时器超时后仍然没有收到上游和下游节点反馈的响应消息,则将对应的连接删除。
由于节点所保存的信息会因为节点出现故障而部分或全部丢失,而对于网络内部节点来说,其中只保存了一些必要的连接相关信息,无法自身进行恢复,因此需要向相邻节点发送详细状态查询消息进行信息的查询,以从相邻节点恢复该节点的配置和状态信息。
由于相邻节点没有失效,只是在故障期间与失效节点的通信中断,所以相邻节点在该故障节点恢复后执行的是“链路出现故障”后的同步和恢复过程。上游和下游节点根据接收到的详细状态查询消息对自身保存的信息进行查询,如果有该故障节点所需要的信息,则反馈包含状态码“ConnectionActive”的详细状态响应消息,否则,反馈包含状态码“ConnectionUnavailable”的详细状态响应消息。
F.该故障节点所接收到的上游和下游节点反馈的详细状态响应消息中如果包含状态码“Connection Active”,则该故障节点可以从反馈消息中得到相关信息,因此该消息所对应的连接能够被恢复,即控制平面可以对该连接继续进行控制,如果该详细状态响应消息中包含状态码“ConnectionUnavailable”,则说明相邻节点中没有该故障节点所需要的信息,该消息对应连接的恢复失败,所以该故障节点发起连接删除来删除数据平面中这条已经失效的连接。
执行以上操作即可完成单个节点出现故障后连接的同步和恢复。下面对多个节点出现故障后同步和恢复连接的方法作详细说明。
如果多个节点同时发生故障,每个故障节点恢复后独立执行“单节点失效后连接的同步和恢复”过程,即执行步骤A至步骤F。但由于网络内部节点没有保存连接的全部信息,而其相邻节点可能还没有恢复,所以需要做一些特殊处理如果相邻节点没有恢复,则等到其恢复后再与其建立同步,如果恢复后的相邻节点没有连接的全部信息,则该相邻节点先反馈包含状态码“连接被挂起(Connection Pending)”的概要状态响应消息给该网络内部节点;如果某个故障节点恢复了该连接的全部信息,且检测到该故障节点曾经向其相邻节点发送包含状态码“Connection Pending”的概要状态响应消息,则该故障节点再向该相邻节点发送包含状态码“Connection Active”的详细状态响应消息,以使其得到连接的全部信息,从而恢复连接,如果这个故障节点没有恢复该连接的信息,且检测到该故障节点曾经向其相邻节点发送包含状态码“Connection Pending”的概要状态响应消息,则该故障节点再向该相邻节点发送包含状态码“Connection Unavailable”的详细状态响应消息,以通知相邻节点删除该连接。
对于多个节点失败的情况,同样需要针对同步的连接设置定时器。以上所有步骤均应在连接对应的定时器所设定的时间内完成,如果超时,则删除该连接。
下面以具体实施例对多节点同步与恢复的方法进行举例说明参见图2,有节点A、B、C、D、E、F,依次为一条连接上的六个节点,其中A为UNI-N,该节点保存了该连接的全部配置和状态信息,而B、C、D、E、F均为网络内部节点,只保存了该连接的部分信息。
假设B、C、D、E同时出现了故障,如果一段时间后C节点恢复,则C节点首先会进行本节点同步,但由于其相邻节点B和D都没有恢复,所以没有建立LDP会话,因此没有启动节点间同步过程。又过了一段时间后,D节点恢复,这时C和D之间建立了LDP会话并进行节点间同步过程,互发详细状态查询消息,但由于双方都没有该连接的全部信息,所以只能向对方发送包含状态码“Connection Pending”的概要状态响应消息,收到这个消息后,节点不会删除该连接,但也没有完全恢复成功。
如果过了一段时间后B节点恢复了,那么在B节点自身同步完成后,B-A、B-C之间将建立LDP会话,其中B-C之间的同步和恢复过程和结果与C-D相同。对于B-A,由于A节点保存了该连接的全部信息,所以B节点能够通过B-A之间的同步和恢复过程获得该连接的全部信息,并成功恢复该连接。B节点在恢复后发现以前曾向C节点发送过包含状态码“ConnectionPending”的概要状态响应消息,则向C节点发送包含状态码“ConnectionActive”的详细状态响应消息,C节点收到该消息后即可获得该连接的全部信息,其所对应的连接也就成功恢复。同样,D节点也作如是处理,这样经过一点时间,总能使全部出现故障的节点都成功恢复。
在多个节点出现故障的情况下,节点的标记信息需要从数据平面查询得到。因为每个节点只在内存中保存其自身的出接口和入接口标记信息,如果有多个节点出现故障,则可能无法从相邻节点获取标记信息,而从数据平面可以快速、直接地查询到该信息。比如上例中,A节点只包含了其出接口标记信息,该标记信息同时也是B节点的入接口标记信息,B节点可以从A节点中获取入接口标记信息,但是B节点的出接口标记信息与C节点的出接口和入接口标记信息都无法从相邻节点获得,所以规定节点的标记信息从数据平面查询。
需要注意的是,如果作为UNI-N的A节点也失效了,那么该节点恢复后首先从数据库中恢复所有连接的全部信息,这样就仍然可以通过UNI-N来恢复其他节点。
采用本发明方法实现节点连接的同步和恢复,同时节省了数据库的存储空间。当控制平面从故障中恢复后,能够对数据平面中仍然存在的连接继续进行控制,从而在后续过程中可以对连接进行查询和删除,本发明还实现了对于多个网络节点失败这种情况下连接的同步和恢复。
权利要求
1.一种实现网络网络接口连接的同步和恢复方法,适用于智能光网络中,其特征在于,在每个连接成功建立后将该连接的相关信息保存在网络内部节点中,将该连接的全部配置与状态信息保存在网络边缘节点中,当检测到控制平面信令通信失败时,利用网络节点所保存的连接信息完成连接的同步与恢复,该同步与恢复过程进一步包括以下步骤a.通过标记分发协议(LDP)检测控制平面上信令通信失败的原因,如果是链路出现故障,进入步骤b,如果是节点出现故障,则进入步骤c;b.在链路出现故障后链路两端的节点保留原有的连接信息,在链路恢复后链路两端的节点分别向对端节点发起连接的同步和恢复过程,之后结束本流程;c.故障节点恢复后先进行本节点的同步,然后分别建立该故障节点与对应每条连接的相邻节点间的同步,从相邻节点恢复故障节点上每条连接的配置和状态信息,再根据获得的信息恢复或删除该故障节点与每个相邻节点间的连接。
2.根据权利要求1所述的方法,其特征在于,已经建立的连接的标记交换路径标识、连接的上游节点的节点标识、连接的下游节点的节点标识、连接的上游标记请求标识和连接的下游标记请求标识作为连接的相关信息保存在网络内部节点中。
3.根据权利要求1所述的方法,其特征在于所述步骤b中,链路两端节点分别向对端节点发起的连接同步和恢复过程具体包括以下步骤b1.链路两端的节点根据自身所保存的连接信息分别向对端节点发送概要状态查询消息;b2.如果所查询的连接在对端节点存在,则向发端节点发送包含状态码为连接处于激活态(Connection Active)的概要状态响应消息,否则,发送包含状态码为连接不可用(Connection Unavailable)的概要状态响应消息;b3.发端节点收到的概要状态响应消息中包含的状态码如果是ConnectionActive,则在收到该消息后该发端节点恢复对应的连接,如果是ConnectionUnavailable,则在收到该消息后该发端节点删除对应的连接。
4.根据权利要求1所述的方法,其特征在于,所述步骤a检测到的节点出现故障为单节点出现故障,且故障节点为网络内部节点时,所述步骤c进一步包括以下步骤c11.该故障节点恢复后从自身数据库中读取故障前所保存的连接信息,并根据该连接信息与数据平面的连接进行同步,删除与数据平面上不存在的连接的相关信息;c12.该故障节点发起LDP的会话建立过程,会话建立成功后根据本节点保存的连接信息建立连接控制块与LDP会话的对应关系;c13.该故障节点分别向每条连接对应的上游和下游节点发送详细状态查询消息,反馈回的详细状态响应消息中如果包含的状态码为Connection Active,则根据消息中的信息恢复对应的连接,如果包含的状态码为ConnectionUnavailable,则删除对应的连接。
5.根据权利要求4所述的方法,其特征在于所述的步骤c13进一步包括故障节点在发送详细状态查询消息的同时针对每条连接启动定时器,定时器超时且没有收到反馈消息时则删除对应的连接。
6.根据权利要求1所述的方法,其特征在于,所述步骤a检测到的节点出现故障为单节点出现故障,且故障节点是网络边缘节点时,该网络边缘节点恢复后直接从数据库中恢复所有连接的全部信息。
7.根据权利要求4所述的方法,其特征在于,所述步骤a检测到的节点出现故障是多节点失败,所述步骤c进一步包括以下步骤c14.故障节点中的网络内部节点分别进行步骤c11到c12的本节点连接同步恢复过程,网络边缘节点恢复后直接从数据库中恢复所有连接的全部信息;c15.故障节点中的网络内部节点等到其相邻节点恢复后,向其相邻节点发送详细状态查询消息,如果相邻节点恢复后没有连接的全部信息,则相邻节点反馈状态码为连接被挂起(Connection Pending)的概要状态响应消息给该故障节点,如果相邻节点同步后恢复了连接的全部信息,则再向其相邻节点发送状态码为Connection Active的详细状态响应消息,如果相邻节点同步后没有恢复连接的全部信息,则向其相邻节点发送状态码为Connection Unavailable的详细状态响应消息,c16.故障节点如果接收到状态码为Connection Pending的概要状态响应消息,则保存对应连接的相关信息,并等待该故障节点的相邻节点恢复连接,如果相邻节点恢复后反馈给故障节点的响应消息的状态码为Connection Active,则故障节点恢复对应的连接,如果状态码为Connection Unavailable,则故障节点删除对应的连接。
8.根据权利要求7所述的方法,其特征在于所述步骤c15进一步包括每个故障节点针对每个连接设置定时器,定时器超时且故障节点没有收到反馈消息,则删除对应的连接。
9.根据权利要求7所述的方法,其特征在于该方法进一步包括,故障节点在恢复时从数据平面查询获得标记信息。
全文摘要
本发明公开了智能光网络中的一种实现网络网络接口(NNI)连接的同步和恢复方法,通过标记分发协议(LDP)检测控制平面上信令通信失败的原因,如果是链路出现故障,则链路出现故障后链路两端的节点保留原有的连接信息,在链路恢复后链路两端的节点分别向对端节点发起连接的同步和恢复过程,之后结束本流程;如果是节点出现故障,则故障节点恢复后先进行本节点的同步,然后建立其与相邻节点间的同步和恢复,从相邻节点恢复故障节点上连接的配置和状态信息。本发明解决了原来没有针对NNI中连接的同步和恢复的方案的问题,使用本发明方法进行连接的同步和恢复,使得控制平面从故障中恢复后,能够对数据平面中仍然存在的连接继续进行控制。
文档编号H04L12/28GK1503516SQ0215331
公开日2004年6月9日 申请日期2002年11月27日 优先权日2002年11月27日
发明者孙俊柏, 宋辉, 蔡军州, 陈勇, 石兴华 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1