一种实现网络故障检测的方法、网络节点和系统的制作方法

文档序号:7915967阅读:242来源:国知局
专利名称:一种实现网络故障检测的方法、网络节点和系统的制作方法
技术领域
本发明涉及通信技术领域,特别是指一种实现网络故障检测的方法、网 络节点和系统。
背景技术
目前,接入网POOL (资源池)的实现方案已经提出。POOL技术是指 一组网元共同为 一个或多个业务分发点提供服务,这些网元之间资源共享, 负荷分担,当其中一个网元故障时,该组内其它网元^^妄管故障网元的用户。 在这里,这样的一组网元就构成了一个POOL,这些网元称为POOL网元。 而一个或多个业务分发点从属于某一个POOL,这些业务分发点所有的业务区 就构成了 POOL AREA (资源池区域)。POOL AREA内的用户由POOL中的 网元共同服务。
POOL技术可以实现POOL网元级的容灾备份;在POOL网元间分担网 络负荷,提升整个POOL中网元的资源利用率,节省设备投资;减少工程临 时割接工作量,提高网络可靠性。其中,要实现POOL网元级的容灾备份, 必须要在POOL网元发生故障时,业务分发点尽快检测到该故障,然后将业 务分发到其他的POOL网元上进行处理。
接入网POOL有个显著的特点在整个POOL区域内,业务分发点数量 巨大,可能会达到数千个。如何实现众多业务分发点对POOL网元的快速故 障检测是实现接入网POOL容灾方案的关4建技术之一。
在现有技术当中,网络的故障检测基本上为点对点的故障检测,这种故 障才全测方法包括BFD (Bidirectional Forwarding Detection,双向转发4企测)、 OAM( Operations, Administration and Maintenance,运行、管理和维护)和SCTP (Stream Control Transmission Protocol,流量控制传输协议)等。以POOL组 网为例,每个POOL网元都与POOL AREA中的所有业务分发点分别建立点 到点的故障检测关系,每个POOL网元与每个业务分发点相互发送周期性检 观'J报文,当某个网元在一定时间内接收不到对端网元的检测报文时,则判断对端网元故障。利用这种检测方法,如果POOL网元的数量为n,业务分发点 的数量为m,则在单位检测周期内, 一个POOL网元需要各收发m个检测报 文,即共处理2xm个检测报文,整个承载网需转发2xnxm个检测报文。
通常,POOL AREA中的业务分发点很多, 一般为1000以上,发明人在 实现本发明的过程中,发现现有技术至少存在以下缺点POOL网元的CPU 处理能力及接口带宽被大量检测报文所占用,同时检测报文也大量地占用了 承载网的带宽;为了降低故障检测对POOL网元及承载网的影响,只能加大 检测报文的发送周期,使得故障检测时间约为十分钟级别,难以满足电信级 快速故障恢复需求,必然会给整个接入网POOL解决方案的竟争力带来较大 的影响。

发明内容
本发明的实施例提供一种实现网络故障检测的方法、网络节点和系统, 以降低故障检测机制对网络节点的CPU占用率及承载网络带宽的影响,缩短
故障;险测时间。
本发明实施例提供如下技术方案
一种实现网络故障检测的方法,包括组播组中的节点判断是否在预先 设定的时间内接收到组播源中的节点发送的组播检测报文;当未在预先设定 的时间内接收到所述组播检测报文时,确定所述组播源中的节点与所述组播 组中的节点之间的链路处于故障状态。
一种网络节点,包括接收单元,用于接收组播源中的节点发送的组播 检测报文;判断单元,用于判断所述接收单元是否在预先设定的时间内接收 到所述组播检测报文,如果否,确定所述组播源中的节点与所述组播组中的 节点之间的链路处于故障状态。
一种网络系统,包括被检测方和检测方,所述被检测方包括由网络中的 至少 一个节点所组成的组播源,所述4企测方包括由网络中的至少 一个节点所 组成的组播组,其中,所述被检测方,用于将组播检测报文发送给所述检测 方;所述检测方,用于判断是否在预先设定的时间内接收到所述被检测方中 的节点发送的所述组播检测报文,如果否,确定所述被检测方中的节点与检 测方中的节点之间的链路处于故障状态。从上述本发明的实施例中可以看出,本发明实施例使用组播4支术对网络 中的节点进行设置,将网络中有故障检测需求的一组节点设置为组播组,将 网络中被组播组检测的 一组节点设置为组播源,当组播源中的某个节点只发 送一份组播检测报文时,组播组中的所有节点都可以接收到同样组播检测报 文的数据拷贝,实现了多点对单点的故障检测,解决了现有技术中由于网络 中的被检测节点需要向对端网络中的每一个节点发送检测报文而占用了该被 检测节点CPU处理能力和接口带宽甚至整个承载网络带宽的问题。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实 施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下 面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲, 在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种网络故障检测的方法的第一实施例流程图; 图2为本发明一种网络故障检测的方法的第二实施例流程图; 图3为本发明 一种网络故障检测的方法的第三实施例流程图; 图4为本发明实现网络故障;险测的方法的第四实施例流程图; 图5为本发明一种网络节点的第一实施例结构图; 图6为本发明一种网络节点的第二实施例结构图; 图7为本发明一种网络系统的一个实施例结构图。
具体实施例方式
为了更清楚地说明本发明实施例的技术方案,下面将结合附图对本发明 的实施例进行详细的介绍,下面的描述仅仅是本发明的一些实施例,对于本 领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些 实施例获得本发明的其他的实施方式。
本发明实施例提供了 一种实现网络故障检测的方法、网络装置和系统, 根据组播技术对待检测的网络进行的设置,组播组中的节点接收组播源中的 节点发送的组播检测报文,并判断是否在预先设定的时间内接收到组播源中 的节点发送的组播检测报文,如果否,确定组播源中的节点与组播组中的节点处于故障状态。
在以下各个实施例中,网络的类型可以是移动网络、固定网络、移动固 定移动融合网络等,可以是局域网、城域网、广域网,可以是接入网、核心
网、传输网,可以是点对点网络(P2P)、客户机/服务器架构的网络(C/S)等。
本发明实施例适用于所有支持组播技术的网络,所有使用组播技术进行
故障检测的应用都属于本发明保护范围,本发明实施例的应用场景包括无 线网POOL应用场景如BSC POOL ( Base Station Controller POOL,基站控制 器资源池)、RNC POOL (Radio Network Controller POOL,无线网络控制器资 源池)、WiMAX GW POOL ( Wordwide Interoperability for Microwave Access GateWayPOOL,全球《敖波互联接入网关资源池)等、核心网POOL应用场景 如MSC POOL (Mobile Switching Centre POOL,移动交换中心资源池)、SGSN POOL (Serving GPRS Support Node,月l务GPRS支持节点资源池)、GGSN POOL ( Gateway GPRS Supporting Node POOL, GPRS网关支持节点资源池)、 IMS P-CSCF/I-CSCF/S-CSCF/AS POOL等、IPTV (Internet Protocol Television, 网络电视)应用场景如CS/ESPOOL等。
下面结合附图对本发明实施例进行详细描述。
请参阅图1,为本发明实施例实现网络故障检测的方法的第一实施例流程 图,在单位检测周期内,包括以下步骤
步骤101:组播组中的节点判断是否在预先设定的时间内接收到组播源中 的节点发送的组播检测报文;
其中,在步骤101之前还应包括将网络中被组播组检测的一组节点设置 为组播源;将网络中对组播源中的节点进行检测的一组节点设置为组播组。
步骤102:当未在预先设定的时间内接收到组播检测报文时,确定组播源 中的节点与組播组中的节点之间的链路处于故障状态。
请参阅图2,为本发明实现网络故障检测的方法的第二实施例流程图,在 本实施例中,POOLAREA中的业务分发点为组播组,POOL中的网元为组播 源,由POOLAREA中的业务分发点对POOLAREA中的业务分发点与POOL 中的网元之间的链路进行检测,单位检测周期内,包括以下步骤
步骤201:按照组播技术,将POOL AREA中的业务分发点设置为组播组,将POOL中的网元设置为组播源;
其中,组^番组可以用 一个组4番地址来标识。
步骤202: POOL中的网元向POOL AREA中的业务分发点发送组播检测 报文;
其中,POOL中的网元向POOL AREA发送一份组播检测报文,这份组播 检测报文的目的地址是组播组的组播地址,之后,POOL AREA中的所有业务 分发点都可以接收到同样的组播组检测报文的数据拷贝,而组播组以外的网 络其它节点不会收到这份组播检测报文。
优选的,POOL中的网元周期性地向POOL AREA中的业务分发点发送一 份组播检测报文。
步骤203: POOL AREA中的业务分发点判断是否在预先设定的时间内接 收到POOL中的被检测网元发送的组播检测报文,如果是,进入步骤204,如 果否,进入步骤205;
步骤204: POOL AREA中的业务分发点判断POOL中的祐j企测网元与 POOLAREA中的业务分发点之间的链路处于正常状态,结束流程;
步骤205: POOL AREA中的业务分发点判断POOL中的被检测网元与 POOLAREA中的业务分发点之间的链路处于故障状态;
步骤206: POOL AREA中的业务分发点记录故障检测结果
步骤207: POOLAREA中的业务分发点根据故障检测结果进行故障处理, 结束流程。
在上述实施例步骤207中,故障处理可以是POOL AREA中的业务分发 点进行故障报警或将业务分发到POOL中的其它网元上进行处理。
上述实施例中,设定POOL中的网元数量为n, POOL AREA中的业务分 发点数量为m,在单位检测周期内,一个POOL网元只需发送一个组播检测报 文,POOLAREA中的所有业务分发点都可以接收到这个组播检测报文的数据 拷贝,整个承载网只需转发n个组播检测报文,利用组播技术解决了单点发 送多点接收的问题,实现了网络中单点对多点的数据传送,这样减少了对 POOL网元的CPU处理能力、接口带宽以及承载网带宽等资源的占用,因此 可以缩短检测报文周期,提高了整个接入网POOL解决方案的竟争力。请参阅图3,以RNC POOL为例,为本发明实现网络故障检测的第三实 施例流程图,在单位检测周期内包括以下步骤
步骤301:按照组播技术,把RNC POOL AREA中的所有NodeB (无线 基站)设置为一个组播组,共用一个组播地址,把RNC POOL中的所有RNC 设置为组播源;
例如,运营商分配一个组播地址A用于对RNC POOL中的RNC进行故 障才全测,承载网的路由器之间使能PIM-SM (Protocol Independent Multicast Sparse Mode,协议无关组播路由协议之稀疏模式),与RNC POOL AREA中的 NodeB相连的3各由器4妄口 4吏能IGMP SNOOPING (Internet Group Management Protocol SNOOPING因特网组管理协议探听)。RNC POOL AREA中的NodeB 申请加入地址为组播地址A的组播组,路由器通过NodeB的申请把该NodeB 的地址添加到组^番组的组4番地址A中。
步骤302:脂C POOL中的所有RNC向RNC POOL AREA中的所有 NodeB周期性发送目标地址为组播地址的组播检测报文;
步骤303: NodeB在接收到某个RNC的第 一个组播;险测报文后启动一个 定时器;
步骤304: NodeB判断是否在一定的定时周期内接收到被;险测RNC发送 的组播检测报文,如果是,进入步骤305,如果否,进入步骤306;
步骤305: NodeB判断被;险测的RNC与NodeB之间的链路处于正常状 态,结束流程;
步骤306:
态;
步骤307: 步骤308: 步骤309:
NodeB判断被检测的RNC与NodeB之间的链路处于故障状
NodeB记录故障检测结果; NodeB向网管进行故障报警;
NodeB把业务分发到POOL中的其它RNC上处理。 上述实施方式实现了网络中单点对多点的数据传送,^v而减少了对RNC POOL中的RNC的CPU处理能力、接口带宽以及承载网带宽等资源的占用, 因此可以缩短检测报文周期,提高了整个接入网POOL解决方案的竟争力。 请参阅图4,为本发明实现网络故障检测的方法的第四实施例流程图,在
9本实施例中,POOL中的网元为组播组,POOL AREA中的业务分发点为组播 源,由POOL中的网元对POOL AREA中业务分发点与POOL中的网元之间 的链路进行检测,单位;险测周期内包括以下步骤
步骤401:按照组播技术,将POOL中的网元设置为组播组,将POOL AREA中的业务分发点设置为组播源;
其中,组、潘组用 一个组^"地址来标识。
步骤402: POOL AREA中的业务分发点向POOL中的网元发送组播4企测 报文;
其中,POOL AREA中的业务分发点向POOL中的网元发送一份组播4企测 报文,这份组播检测报文的目的地址是组播地址,之后,POOL中的所有网元 都可以接收到同样的组播组检测报文的数据拷贝,而组播组以外的网络其它 节点不会收到这份组播检测报文。
优选的,POOLAREA中的业务分发点周期性地向POOL中的网元发送一 份组播检测报文。
步骤403: POOL中的网元判断是否在预先设定的时间内接收到POOL AREA中的被检测业务分发点发送的组播检测报文,如果是,进入步骤404, 如果否,进入步骤405;
步骤404: POOL中的网元判断POOL AREA中的祐j企测业务分发点与 POOL中的网元之间的链路处于正常状态,结束流程;
步骤405: POOL中的网元判断POOL AREA中的被检测业务分发点与 POOL中的网元之间的链路处于故障状态;
步骤406: POOL中的网元记录故障检测结果;
步骤407: POOL中的网元根据故障检测结果进行故障处理,结束流程。 在上述实施例步骤407中,POOL中的网元根据故障检测结果进行的故障 处理为故障报警。
上述实施例中,设定POOL中的网元数量为n, POOL AREA中的业务分 发点数量为m,在单位;险测周期内, 一个POOLAREA业务分发点只需发送一 个组播检测报文,POOL中的所有网元都可以接收到这个组播检测报文的数据 拷贝,整个承载网只需转发m个组播检测^^文,实现了网络中单点对多点的数据传送,减少了网络检测机制对承载网带宽等资源的占用,可以缩短检测 报文周期,提高了整个接入网POOL解决方案的竟争力。
与上述实现网络故障检测的方法相对应,本发明实施例提供了 一种网络
节点。请参阅图5,为本发明实施例的一种网络节点的一个实施例结构图,本
实施例中的网络节点包括接收单元501、判断单元502,下面结合该装置的工
作原理进一步介绍其内部结构以及连接关系。
接收单元501:用于接收组播源中的节点发送的组播检测报文;
其中,可以接收由POOL中的网元组成的组播源发送的组播检测报文,
也可以接收由POOL AREA中的业务分发点组成的组播源发送的组播检测报文。
判断单元502:用于判断接收单元501是否在预先设定的时间内接收到组 播检测报文,如果是,确定组播源中的节点与组播组中的节点之间的链路处 于正常状态。如果否,确定组播源中的节点与组播组中的节点之间的链路处 于故障状态。
上述实施例中,网络中的一个被检测节点只发送一个组播检测报文,则 网络中的所有接收单元都可以接收到这个组播检测报文,减少了网络检测机 制对网络节点CPU处理能力、接口带宽以及整个承载网带宽等资源的占用。
请参阅图6,为上述网络节点的另一个实施例结构图。本实施例中的网络 节点包括接收单元601 、判断单元602、故障记录单元603和故障处理单元604, 下面结合该装置的工作原理进一步介绍其内部结构以及连接关系。
接收单元601:用于接收组播源中的节点发送的组播检测报文;
其中,可以接收由POOL中的网元组成的组播源发送的组播检测报文, 也可以接收由POOL AREA中的业务分发点组成的组播源发送的组播检测报 文。
判断单元602:用于判断接收单元601是否在预先设定的时间内接收到组 播检测报文,如果是,判断组播源中的节点与组播组中的节点之间的链路处 于正常状态。如果否,判断组播源中的节点与组播组中的节点之间的链路处 于故障状态。
故障记录单元603:用于在判断单元602判断组播源中的节点与组播组中的节点之间的链路处于故障状态后记录故障检测结果;
故障处理单元604:用于根据故障记录单元603记录的故障检测结果进行 故障处理。
例如,接收单元接收POOL中的网元发送的组播检测报文,判断单元判 断是否在预先设定的时间内接收到POOL中的网元发送的组播检测报文,如 果是,判断POOL中的该被检测网元与POOL AREA中的业务分发点之间的 链路处于正常状态,如果否,判断POOL中的该祐:;险测网元与POOL AREA 中的业务分发点之间的链路处于故障状态,由故障记录单元记录故障检测结 果,故障处理单元根据这个故障检测结果进行故障处理,如将业务分发到 POOL中的其它网元上进行处理。
其中,接收单元601、判断单元602、故障记录单元603和故障处理单元 604可集成在同一个物理或逻辑网元实体上。
上述实施例中,网络中的一个被检测节点只发送一个组播检测报文,则 '网络中的所有接收单元都可以接收到这个组播检测报文,并且当判断单元判 断网络中的被;险测节点处于故障状态时,系统中的故障记录单元可以将故障 检测的结果记录下来,再由故障处理单元对故障进行处理。减少了网络;险测 机制对网络节点CPU处理能力、接口带宽以及整个承载网带宽等资源的占用, 同时也实现了网络的快速容灾能力。
本发明实施例还提供了一种网络系统,请参阅图7,为本发明实施例的一 种网络系统的一个实施例结构图,本实施例中的网络系统包括被检测方701 和斗企测方702,被;险测方701包括由网络中的至少一个节点所组成的组播源, ;险测方702包括由网络中的至少一个节点所组成的组^番组。
被检测方701:用于将组播检测报文发送给检测方702;
检测方702: 用于判断是否在预先设定的时间内接收到被检测方701中 的节点发送的组播检测报文,如果否,确定被;险测方701中的节点与检测方 702中的节点之间的链路处于故障状态;如果是,确定被检测方701中的节点 与检测方702中的节点之间的链路处于正常状态。
本实施例的系统可以部署在4矣入网、核心网、传输网。
上述实施例中,被检测方中的节点只发送一个组播检测报文,则网络中的所有检测方内的节点都可以接收到这个组播检测报文,减少了网络检测机 制对网络节点CPU处理能力、接口带宽以及整个承载网带宽等资源的占用。
本发明实施例利用组播技术对网络中的节点进行设置,使组播源中的一 个被检测节点只发送一个组播检测报文,而组播组中的所有节点都可以接收 到这个组播检测报文,减少了网络检测机制对被检测节点CPU处理能力、接 口带宽以及整个承载网带宽等资源的占用。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤 是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机
可读取存储介质中,该程序包括如下步骤组播组中的节点判断是否在预先 设定的时间内接收到组播源中的节点发送的组播检测报文;当未在预先设定 的时间内接收到所述组播检测报文时,确定组播源中的节点与所述组播组中 的节点之间的链路处于故障状态。
所述的存储介质,如ROM/RAM、磁碟、光盘等。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普 通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润 饰,这些改进和润饰也应该视为本发明的保护范围。
1权利要求
1、一种实现网络故障检测的方法,其特征在于,包括组播组中的节点判断是否在预先设定的时间内接收到组播源中的节点发送的组播检测报文;当未在预先设定的时间内接收到所述组播检测报文时,确定所述组播源中的节点与所述组播组中的节点之间的链路处于故障状态。
2、 根据权利要求1所述的方法,其特征在于,所述组播组中的节点判断 是否在预先设定的时间内接收到组播源中的节点发送的组播检测报文之前还 包括将网络中至少 一个节点设置为组播源; 将网络中至少 一个节点设置为组播组,
3、 根据权利要求1所述的方法,其特征在于,所述判断组播源中的节点 与所述组播组中的节点之间的链路处于故障状态之后还包括记录故障检测结果;根据所述故障检测结果进行故障处理。
4、 根据权利要求1所述的方法,其特征在于,所述组播组中的节点判断 是否在预先设定的时间内接收到组播源中的节点发送的组播检测报文包括组播组中的节点判断是否在预先设定的时间内接收到组播源中的节点周 期性发送的组播检测报文。
5、 根据权利要求2所述的方法,其特征在于,所述网络中的节点类型包括资源区域POOL AREA中的业务分发点; 或者,资源池POOL中的网元。
6、 根据权利要求5所述的方法,其特征在于,所述将网络中被所述组播 组检测的一组节点设置为组播源;将网络中对所述组播源中的节点进行检测 的 一组节点设置为组播组包括将POOL AREA中的业务分发点设置为组播组;将POOL中的网元设置为组播源;或者,将POOL中的网元设置为组播组; 将POOLAREA中的业务分发点设置为组播源。
7、 一种网络节点,其特征在于,包括接收单元,用于接收来自组播源中的节点的组播检测报文;判断单元,用于判断所述接收单元是否在预先设定的时间内接收到所述组播检测报文,如果否,确定所述组播源中的节点与所述组播组中的节点之间的链路处于故障状态。
8、 根据权利要求7所述的装置,其特征在于,还包括 故障记录单元,用于在所述判断单元确定所述组播源中的节点与所述组播组中的节点之间的链路处于故障状态后,记录故障检测结果;故障处理单元,用于根据所述故障记录单元记录的故障检测结果进行故 障处理。
9、 一种网络系统,其特征在于,包括被检测方和检测方,所述被检测方 包括由网络中的至少一个节点所组成的组播源,所述检测方包括由网络中的 至少一个节点所组成的组播组,其中,所述被检测方,用于将组播检测报文发送给所述检测方;所述检测方,用于判断是否在预先设定的时间内接收到所述被检测方中的节点发送的所述组播检测报文,如果否,确定所述被检测方中的节点与检测方中的节点之间的链路处于故障状态。
10、 如权利要求9所述的网络系统,其特征在于,所述4全测方和净皮;险测 方部署在移动网络、或固定网络、或移动固定融合网络、或传输网、或接入 网、或4亥心网。
全文摘要
本发明实施例公开了一种实现网络故障检测的方法、网络节点和系统。将网络中被所述组播组检测的一组节点设置为组播源;将网络中对所述组播源中的节点进行检测的一组节点设置为组播组。组播组中的节点判断是否在预先设定的时间内接收到组播源中的节点发送的组播检测报文;当未在预先设定的时间内接收到所述组播检测报文时,确定所述组播源中的节点与所述组播组中的节点之间的链路处于故障状态。实现了多点对单点的故障检测,解决了现有技术中由于网络中的被检测节点需要向对端网络中的每一个节点发送检测报文而占用了该被检测节点CPU处理能力和接口带宽甚至整个承载网络带宽的问题。
文档编号H04L12/24GK101616019SQ20081012621
公开日2009年12月30日 申请日期2008年6月26日 优先权日2008年6月26日
发明者山 吴, 恺 张, 申林飞, 韦建威 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1