一种以太网设备链路故障检测的方法及其系统的制作方法

文档序号:7957643阅读:327来源:国知局
专利名称:一种以太网设备链路故障检测的方法及其系统的制作方法
技术领域
本发明涉及以太网技术领域,具体来说,涉及到以太网中设备链路故障检测的技术。
背景技术
以太网技术因其简单易用、价格低廉、且带宽可不断提高,在企业网、城域网以及广域网范围内都已经得到大规模应用。但是传统以太网可维护、可运营能力比较弱,随着以太网推广的范围逐渐扩大,对以太网OAM(Operations,Administration and Maintenance操作、管理和维护)功能的需求也越来越强烈。
以太网OAM的功能主要分为两部分物理链路以太网OAM功能,物理链路级的以太网OAM功能用于实现两个设备之间的以太网物理链路的故障检测和通知功能;业务以太网OAM功能,业务级的以太网OAM主要实现端到端(如用户到用户之间,中间可以通过多个网络设备)的设备之间的链路连通性管理。
业务以太网OAM主要有以下功能故障检测功能用于检测两端的硬件故障(如链路、节点故障)或软件故障(如软件错误、内存崩溃、配置错误等);故障确认功能通过环回(LoopBack)消息对检测出的故障进行确认,以便采取后续的隔离措施;故障定位和隔离功能当故障被确认之后,可以对故障点(如链路、节点)进行定位,然后将其从网络中隔离出来,以便网络能够正常运行,以及对故障进行诊断处理;故障通知和告警抑制功能故障通知用于将故障信息向节点的上、下游告知,告警抑制功能用于防止网络中出现大量的通知消息导致网络崩溃。
以太网OAM的上述功能需要通过一系列OAM消息的交互来实现,所有的消息都是基于维护域来发送和接收的。
维护域(MD Maintenance Domain)是以太网OAM功能所涉及到的网络或网络中的某个部分,它由一系列的DSAP(Domain Service Access Point域服务接入点)组成,它对域的内部提供连通性服务,在MD中称为维护联盟端节点(MEP Maintenance Association End Point),维护域内部还可能存在ISAP(Intermediate Service Access Point中间服务接入点),是从一个DSAP到另一个DSAP的中间节点,在MD中称为维护联盟中间节点(MIPMaintenance Association Intermediate Point),其中MEP和MIP统称为MP,MEP是以太网OAM消息的主要发起者和接收者,MIP主要是用于转发MEP发起的以太网OAM消息。MD指定一个服务实例也就建立了那些MEP之间的无连接的联盟关系,这个关系称作维护联盟MA(Maintenance Association)。
维护域的示意图如图1所示,其中存在5个桥设备以及6个DSAP,这六个DSAP就可以分别定义为MEP,覆盖的区域(图1中灰色部分)就是维护域,中间存在多个ISAP,这多个ISAP就可以分别定义为MIP。
802.1ag(一种链路层协议,提供一种二层链路的管理)支持的以太网OAM机制包括连续性检查(Connectivity Check,cc),链路追踪(Link Trace,LT),环回检测(LoopBack,LB)。
LB用于在MA中定位故障位置,由MEP发送LBM(Loopback Message),经MIP透传到目的MEP,并由目的MEP向源MEP回应应答报文LBR。
LT用于检测两个MP间所通过的MIP路径,由MEP发送LTM(Link TraceMessage),经MIP到达目的MP,沿途MP和目的MP都将往源MEP回送应答报文LTR。
故障检测功能通过连续性检查消息(Connectivity Check Message,CCM)来实现。MA的每个MEP在其相关的服务实例(如S-VLAN)周期性地广播CCM消息,接收到消息的MEP更新所保存的对端MEP的状态,如果一段时间内没有收到对端MEP(每个MEP保存MA相关的所有MEP的信息)发来的CCM消息,则认为对方故障或者链路发生故障,将故障报告给管理员和业务用户,并且自动发起或者由管理员发起故障的确认和定位/隔离过程。
MEP通过一个定时器来检查是否丢失CCM消息,定时器超时还没收到CCM消息,则认为该消息丢失,如果连续丢失了3个CCM消息,则认为发生故障,然后进行后续处理。
现有的CCM报文格式如表一所示,其中MD LevelMD的level值,高Level值的CCM报文能够穿透低Level的MD,相反,低Level的CCM报文将会被高Level的MD丢弃;Version版本号;OpCodeOAM的报文类型,共5种,分别为Continue check message、Loopback message、Loopback reply message、Linktrace message、Linktrace reply message;Flag第一个bit为RDI标志位,最后3个bit为lifetime标志位;First TLV offsetTLV的偏移量;Transaction identifier/Sequence Number事务标识符/序列号Maintenance association end point identifierMEP识别码,其值为发送端的MEPID的值;Maintenance domain name format维护域名称的格式,比如字符串形式的或数字形式的;Maintenance domain name length维护域的长度;Maintenance domain name维护域的名称;Maintenance association name format维护联盟名称的格式,比如字符串形式的或数字形式的;Maintenance domain name length维护域的长度;Maintenance domain name维护域的名称;Short MA Name Format维护联盟格式;Short MA Name Length维护联盟长度;Short MA Name维护联盟名称;remainder of MAID为MAID(MA name+MD name)保留;Reserved for use by Y.1731为Y.1731保留;Additional fields can be added,here,in future versions of the protocol为后面的版本保留,可以添加其他额外的字段;Optional CCM TLVs可选的CCM的所有TLV;End TLVTLV终结符。

表一如表一所示,现有的CCM报文中没有目标MEP的信息,只携带发送端的MEPID(MEP识别码)。对于P2P(point to point点对点)组网,故障通知能够成功到达对端,但对于P2MP(point to multiple point点对多点)组网或者对于一个MA内有多个MEP的情况,当远端MEP收到带RDI(Remote DefectIndication,远端故障检测)的CCM报文时不知道接收端是否是自己,因为CCM是以组播形式发送的,任何在MA内的远端MEP都能够接收到发送过来的带RDI的CCM报文,报文里又没有携带任何的目标MEP的信息,所以接收端无法判断发送过来的带RDI的CCM是否是发给自己的。

发明内容
本发明的目的在于提供一种以太网设备链路故障检测的方法及其系统,以解决P2MP组网或MA内超过2个MEP节点的组网的设备链路故障的检测问题。
为实现上述目的,本发明采用的技术方案如下一种以太网设备链路故障检测的方法,所述的方法包括如下步骤a、维护联盟端点MEP向维护联盟MA中的其他MEP发送目标MEP的故障消息,所述的消息中携带目标MEP信息;b、所述的其他MEP接收所述的故障消息,通过所述的故障消息中携带的目标MEP信息判断是否是本端口MEP故障,如果是,则接收所述的故障消息并进行相关处理。
其中步骤a之前还包括a0、所述的MEP在规定的时间内没有收到所述的目标MEP发送的连续性检测CCM消息。
其中步骤a具体包括a1、所述的MEP向所述的MA中的其他MEP发送远端故障检测RDI的CCM消息,所述的CCM消息中携带目标MEP的MEP识别码MEPID;
其中步骤b具体包括b1、所述的其他MEP提取所述的CCM消息中携带的目标MEPID与本端口的MEPID比较,如果两者一致,则接收所述的CCM消息并进行相关处理。
其中步骤b还包括所述的其他MEP接收所述的故障消息,通过所述的故障消息中携带的目标MEP信息判断是否是本端口MEP故障,如果不是,则将所述的故障消息丢弃。
所述的携带目标MEP的信息是通过在CCM消息中的增加TLV实现的。
所述的增加的TLV的类型Type值为0至4之外的自然数。
通过所述的增加的TLV的子类型subtype值表示单通故障和/或不同故障检测协议之间的转换。
更具体的,其中步骤b具体包括b1、当所述的subtype值表示单通故障时,所述的其他MEP提取所述的CCM消息中携带的目标MEPID与本端口的MEPID比较,如果两者一致,则接收所述的CCM消息并上报告警信息。
所述的携带目标MEP的信息是通过在所述的CCM消息中的增加固定位置的目标MEP的MEPID实现的。
本发明还提供了一种以太网设备链路故障检测的系统,所述的系统包括MA和其中的MEP,所述的系统还包括所述的MEP包括故障消息发送模块,能够向所述MA中的其他MEP发送故障消息,所述的消息中携带目标MEP信息;所述的MEP包括故障检测模块,能够接收其他MEP发送的故障消息并根据所述的故障消息中的目标MEP信息判断是否是本端口MEP故障。
所述的目标MEP的信息为目标MEP的MEPID。
所述的MEP的故障检测模块能够接收其他MEP发送的故障消息并将所述的故障消息中的目标MEPID与本端口的MEPID比较,判断是否是本端口MEP故障。
所述的故障消息发送模块发送的故障信息中的TLV携带目标MEP的信息。
所述的故障消息发送模块发送的故障信息中固定标识符携带目标MEP的信息。
所述的故障消息发送模块发送的故障信息中的TLV子类型subtype值表示单通故障和/或不同故障检测协议之间的转换。
本发明克服现有技术的不足,通过连续性检查消息(CCM)来实现故障检测功能,如果MEP一段时间内没有收到对端MEP发送过来的CCM消息,则认为链路发生故障,MEP发送带RDI的CCM消息到对端,所述的CCM中携带目标MEP的信息,对于P2MP组网或者MA内有多个MEP组网的情况,远端MEP收到CCM消息后根据其中携带的目标MEP的信息判断该CCM消息是否是发送给自己的,如果是则进行上报故障告警等相关处理,如果不是,则将CCM消息丢弃,采用本发明的技术方案,解决了P2MP组网或MA内超过2个MEP节点的组网的设备链路故障的检测问题,可以准确的定位出P2MP内多个链路故障中的具体哪一条链路出现的问题,并且打通各个检测方法之间的协作,通过各种检测方法之间的协作来解决端到端的整网的故障检测和故障定位。


图1为维护域示意图;图2为本发明所述维护域示意图;图3为本发明实施例一流程图。
具体实施例方式
本发明的基本原理是通过连续性检查消息(CCM)来实现故障检测功能,如果MEP一段时间内没有收到对端MEP发送过来的CCM消息,则认为链路发生故障,MEP发送带RDI的CCM消息到对端,所述的CCM中携带目标MEP的信息,对于P2MP组网或者MA内有多个MEP组网的情况,远端MEP收到CCM消息后根据其中携带的目标MEP的信息判断该CCM消息是否是发送给自己的,如果是则进行上报故障告警等相关处理,如果不是,则将CCM消息丢弃。
以下结合附图和具体实施例进行详细说明。
实施例一采用在CCM消息中添加TLV(type length value类型、长度和值)的方式将远端MEP信息携带进去首先需要定义一个携带目标MEPID的TLV(remote MEP TLV),定义如表二所示Remote MFPID TLV Format

表二其中,TLV的类型Type=5(Type1到4已经在协议里分别定义了不同的TLV,因此定义一个Type=5的TLV作为携带目标MEP的MEPID的TLV,MEPID为需要通知的远端MEP的MEPID,将这个Remote MEPID TLV携带在CCM报文中,当远端MEP收到带RDI的CCM时,检测TLV,当检测到Type=5的TLV时取出MEPID,判断该MEPID是否与本端口MEP的MEPID一致,如果是则说明这个带RDI的CCM是发给自己的,最后再根据子类型subtype来区分对端发过来的是什么类型的错误。
为了区分不同类型的告警错误,subtype的定义如下
Subtype=1单通的定义,CCM报文发送端收不到对端发过来的CCM报文;Subtype=2定义为采用802.3ah(一种链路检测的慢协议)检测故障后,采用802.1ag发送给本端CE的故障;Subtype=3定义为采用BFD(用来解决相邻两个转发引擎之间的故障的协议)检测故障后,采用802.1ag发送给远端CE故障;Subtype支持后续协议的扩展。
如图2所示,虚线范围内定义了一个被称做A的MA,对A进行OAM管理。在MA内分别定义了MEPA、MEPB、MEPC、MEPD四个MEP维护点。故障管理时四个维护点上分别会发送组播CCM报文到对端,在正常情况下MEPA能够收到MEPB、MEPC、MEPD发送过来的正常的CCM报文,同时MEPB、MEPC、MEPD也能分别收到对端发送过来的正常的CCM报文。
如果此时MEPA只能收到MEPB和MEPC发送过来的报文,而无法接收MEPD发送过来的CCM报文,说明MEPA到MEPD之间的链路出现了问题。但是MEPD能够正常接收MEPA、MEPB、MEPC发送过来的报文,所以MEPD察觉不到,此时需要MEPA在发送的CCM组播报文中携带RDI标志位来通知MEPD,并且其中需要携带目标MEP(MEPD)的MEPID的信息,发送的报文格式如表三所示

表三当MEPD收到上述的CCM报文时,查找其中的TLV,发现类型为5,则提取其中MEPID的值(其值为4),将提取的MEPID的值与自身的MEPID值比较,如果相等则认为是本端口MEP出现了故障,检查subtype=1,判断是单通的告警,于是上报告警。但是对于MEPB和MEPC来说,收到了该CCM报文后检测其中的TLV,发现类型为5,则提取其中MEPID的值(其值为4),将提取的MEPID的值与自身的MEPID的值比较,两种不相等,则直接丢弃。
具体的消息流程如图3所示,具体包括如下步骤1、MEPA发送携带目标MEP信息的CCM组播报文到MEPB、MEPC和MEPD,其中所携带的目标MEP信息为MEPD的MEPID(其值为4),MEPB、MEPC和MEPD接收所述的CCM报文;2、MEPB、MEPC和MEPD收到所述的CCM报文后,遍历解析其中的TLV类型(Type),查找其中Type=5的TLV;3、提取CCM中MEPID的值(其值为4),将提取的MEPID的值与本端口的MEPID值比较,如果两者相等则认为是本端口MEP出现了故障,转步骤4,否则直接将CCM丢弃;4、MEPD检查CCM组播报文中的TLV,其中的subtype=1,判断是单通的告警,于是上报告警。
本实施例所述的系统包括ME以及其中的MEP,MEP包括故障消息发送模块,能够向MA中的其他MEP发送故障消息,所述的消息中携带目标MEP信息;MEP包括故障检测模块,能够接收其他MEP发送的故障消息并根据所述的故障消息中的目标MEP信息判断是否是本端口MEP故障。
其中,故障消息发送模块通过CCM消息中的TLV携带目标MEP的MEPID(其值为4),MEP的故障检测模块接收故障消息并将所述的故障消息中的目标MEPID与本端口的MEPID比较,判断是否是本端口MEP故障。TLV的subtype值为1,表示单通故障。
实施例二如果MEPA同时不能收到MEPB和MEPD的CCM消息,说明MEPA和MEPB之间,MEPA和MEPD之间都出现了单通现象,此时MEPA发送的报文格式如表四所示

表四当MEPD收到上述的CCM报文时,对该报文进行解析,对TLV进行遍历解析,查找到Type为5时,发现有携带MEPID=4,并且subtype=1,据此发送告警信息,同时MEPB收到这个CCM报文后也发现了MEPID=2的RemoteMEP TLV,检查subtype=1,同时MEPB也会上报告警,但是MEPC收到这个CCM时直接丢弃,不会告警。
本实施例所述的系统包括ME以及其中的MEP,MEP包括故障消息发送模块,能够向MA中的其他MEP发送故障消息,所述的消息中携带目标MEP信息;MEP包括故障检测模块,能够接收其他MEP发送的故障消息并根据所述的故障消息中的目标MEP信息判断是否是本端口MEP故障。
其中,故障消息发送模块通过CCM消息中的TLV携带目标MEP的MEPID(其值为4和2),MEP的故障检测模块接收故障消息并将所述的故障消息中的目标MEPID与本端口的MEPID比较,判断是否是本端口MEP故障。TLV的subtype值为1,表示单通故障。
实施例三除了在CCM组播报文中采用实施例一和实施例二中的TLV来携带目标MEP之外,也可以在CCM消息中采用固定位置来携带目标MEP的信息,通过固定格式的MEPID可以使微码的识别效率变高,如果采用TLV解析,微码需要对报文的偏移量进行计算,如果采用将该字段在CCM报文中固定下来,微码可以固定偏移量获取该标志位,能够提高微码效率,此时CCM报文格式如表五所示,在表中的Additional fields can be added,here,in future versionsof the protocol位置增加Remote MEPID,通过其携带目标MEP的信息。

表五本实施例所述的系统包括ME以及其中的MEP,MEP包括故障消息发送模块,能够向MA中的其他MEP发送故障消息,所述的消息中携带目标MEP信息;MEP包括故障检测模块,能够接收其他MEP发送的故障消息并根据所述的故障消息中的目标MEP信息判断是否是本端口MEP故障。
其中,故障消息发送模块通过CCM消息中的固定标识符携带目标MEP的MEPID,MEP的故障检测模块接收故障消息并将所述的故障消息中的目标MEPID与本端口的MEPID比较,判断是否是本端口MEP故障。TLV的subtype值为1,表示单通故障。
权利要求
1.一种以太网设备链路故障检测的方法,其特征在于,所述的方法包括如下步骤a、维护联盟端点MEP向维护联盟MA中的其他MEP发送目标MEP的故障消息,所述的消息中携带目标MEP信息;b、所述的其他MEP接收所述的故障消息,通过所述的故障消息中携带的目标MEP信息判断是否是本端口MEP故障,如果是,则接收所述的故障消息并进行相关处理。
2.根据权利要求1所述的方法,其特征在于,其中步骤a之前还包括a0、所述的MEP在规定的时间内没有收到所述的目标MEP发送的连续性检测CCM消息。
3.根据权利要求1所述的方法,其特征在于,其中步骤a具体包括a1、所述的MEP向所述的MA中的其他MEP发送远端故障检测RDI的CCM消息,所述的CCM消息中携带目标MEP的MEP识别码MEPID;其中步骤b具体包括b1、所述的其他MEP提取所述的CCM消息中携带的目标MEPID与本端口的MEPID比较,如果两者一致,则接收所述的CCM消息并进行相关处理。
4.根据权利要求1所述的方法,其特征在于,其中步骤b还包括所述的其他MEP接收所述的故障消息,通过所述的故障消息中携带的目标MEP信息判断是否是本端口MEP故障,如果不是,则将所述的故障消息丢弃。
5.根据权利要求1所述的方法,其特征在于,所述的携带目标MEP的信息是通过在CCM消息中的增加TLV实现的。
6.根据权利要求5所述的方法,其特征在于,所述的增加的TLV的类型Type值为0至4之外的自然数。
7.根据权利要求5所述的方法,其特征在于,通过所述的增加的TLV的子类型subtype值表示单通故障和/或不同故障检测协议之间的转换。
8.根据权利要求7所述的方法,其特征在于,其中步骤b具体包括b1、当所述的subtype值表示单通故障时,所述的其他MEP提取所述的CCM消息中携带的目标MEPID与本端口的MEPID比较,如果两者一致,则接收所述的CCM消息并上报告警信息,否则丢弃所述的CCM消息。
9.根据权利要求1所述的方法,其特征在于,所述的携带目标MEP的信息是通过在所述的CCM消息中的增加固定标识符实现的。
10.一种以太网设备链路故障检测的系统,所述的系统包括MA和其中的MEP,其特征在于,所述的MEP包括故障消息发送模块,能够向所述MA中的其他MEP发送故障消息,所述的消息中携带目标MEP信息;所述的MEP包括故障检测模块,能够接收其他MEP发送的故障消息并根据所述的故障消息中的目标MEP信息判断是否是本端口MEP故障。
11.根据权利要求10所述的系统,其特征在于,所述的目标MEP的信息为目标MEP的MEPID。
12.根据权利要求10所述的系统,其特征在于,所述的MEP的故障检测模块能够接收其他MEP发送的故障消息并将所述的故障消息中的目标MEPID与本端口的MEPID比较,判断是否是本端口MEP故障。
13.根据权利要求10所述的系统,其特征在于,所述的故障消息发送模块发送的故障信息中的TLV携带目标MEP的信息。
14.根据权利要求13所述的系统,其特征在于,所述的故障消息发送模块发送的故障信息中的TLV子类型subtype值表示单通故障和/或不同故障检测协议之间的转换。
15.根据权利要求10所述的系统,其特征在于,所述的故障消息发送模块发送的故障信息中固定标识符携带目标MEP的信息。
全文摘要
本发明公开了一种以太网设备链路故障检测的方法及其系统,所述的方法包括如下步骤a.维护联盟端点MEP向维护联盟MA中的其他MEP发送目标MEP的故障消息,所述的消息中携带目标MEP信息;b.所述的其他MEP通过所述的故障消息中携带的目标MEP信息判断是否是本端口MEP故障,如果是,则接收所述的故障消息并进行相关处理。采用本发明的技术方案,解决了P2MP组网或MA内超过2个MEP节点的组网的设备链路故障的检测问题,可以准确的定位出P2MP内多个链路故障中的具体哪一条链路出现的问题,并且打通各个检测方法之间的协作问题,通过各种检测方法之间的协作来解决端到端的整网的故障检测和故障定位。
文档编号H04L12/437GK1968156SQ20061006239
公开日2007年5月23日 申请日期2006年8月30日 优先权日2006年8月30日
发明者于权, 张扬, 子康, 郭俊 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1