一种网络设备故障分析方法及装置的制作方法

文档序号:7895807阅读:262来源:国知局
专利名称:一种网络设备故障分析方法及装置的制作方法
技术领域
本发明涉及通信技术领域,更具体地说,涉及一种网络设备故障分析方法及装置。
背景技术
目前,用户在使用网络应用时,在终端发起的数据报文一般要经过多个网络设备 进行转发。以一种典型应用过程为例用户在终端发起数据报文请求,经过基站系统BTS 后,由基站系统BTS转发给PDSN/GGSN,PDSN/GGSN首先向AAA发起PDP会话激活请求,AAA 经过防火墙向WAPGW系统发起计费请求开始,WAPGff给AAA回送计费请求应答消息,AAA给 PDSN/GGSN回PDP会话激活应答消息;然后PDSN/GGSN经防火墙向WAPGW系统发起业务请 求,WAPGW将请求转发给Wfeb Server,中间经过防火墙和核心交换机,Web Server响应按照 原路返回终端。在WAPGW收到用户请求时,有可能向在线计费系统OCS发起计费请求信息, 也有可能向DNS服务器发起DNS查询请求。由上述可知,用户的一次业务请求可能要经过BTS、PDSN/GGSN、AAA、Firewall、 WAPGW、0CS、Switch、DNS等中的多个网络设备。为了能够在网络出现异常时分析故障原因,查找到具体的故障设备,现有技术通 过WAPGW系统将能唯一标识用户的信息注入到数据报文的应用层中,在后续的网络设备中 通过解析应用层中用户标识来关联用户的数据报文。然而,发明人发现,上述方案至少存在以下问题当网络设备发生故障引起网络连接出现异常时,由于用户标识在应用层添加,用 户的一次业务请求每经过一个网络设备时,其IP地址或端口号都有可能发生变化,所以会 出现在某个正常运行的网络设备的两端也无法关联用户请求的IP报文请求的情况,从而 无法准确的定位发生故障的网络设备,进而导致无法准确分析业务故障原因。

发明内容
有鉴于此,本发明实施例提供了一种网络设备故障分析方法,以解决现有技术在 分析网络设备发生故障引起网络连接出现异常时,由于用户标识在应用层添加,所以无法 关联用户请求的IP报文请求,从而无法分析业务故障原因,进而导致无法准确定位发生故 障的网络设备的问题。本发明实施例是这样实现的一种网络设备故障分析方法,包括步骤分别在用户的数据经过的设定网络设备的两侧设置前探点和后探点;在所述前探点和所述后探点分别抓取数据包;分别提取在所述前探点和所述后探点所抓取到数据包中互联网协议IP报文头部 中的用户标识;所述用户标识预先设置在经扩展的Option信息中,用于唯一识别用户;分析在所述前探点和所述后探点是否包括相同的所述用户标识。在本发明实施例中,还提供了一种网络设备故障分析装置,包括
探点设置模块,用于分别在用户的数据经过的设定网络设备的两侧设置前探点和 后探点;数据包抓取模块,用于在所述前探点和所述后探点分别抓取数据包;用户标识提取模块,用于分别提取在所述前探点和所述后探点所抓取到数据包中 互联网协议IP报文头部中的用户标识;所述用户标识设置在经扩展的Option信息中,用于 唯一识别用户;用户标识分析模块,用于分析在所述前探点和所述后探点是否包括相同的所述用 户标识。从上述的技术方案可以看出,本发明实施例通过扩展用户数据中的Option信息, 并在Option信息中预先设置用户标识,从而可以分别在用户的数据经过的设定网络设备 的两侧设置前探点和后探点,并通过在前探点和后探点分别抓取的数据包中,提取所述数 据包中互联网协议IP报文头部中的用户标识,进而可以通过分析在所述前探点和后探点 是否包括相同的所述用户标识来判断网络设备是否为故障。在本发明实施例中,由于用户的数据IP报文属于网络OSI七层模型中的网络层, 作为其头部的Option信息中的用户标识,在经过各种网络设备时不会被更改,从而避免了 现有技术中,通过WAPGW系统将能唯一标识用户的信息注入到数据报文的应用层中后,由 于无法关联用户请求的IP报文请求,而无法分析业务故障原因,进而导致无法准确定位发 生故障的网络设备的问题。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可 以根据这些附图获得其他的附图。图1为本发明实施例中所述网络设备故障分析方法的流程图;图2为本发明实施例中所述网络设备故障分析方法的应用示意图;图3为本发明实施例中所述网络设备故障分析方法的又一应用示意图;图4为本发明实施例中所述网络设备故障分析装置的结构示意图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。为了能够更好的理解本发明实施例,下面首先先将本发明实施例中用到的相关技 术术语做一下解释和说明WAP, (Wireless Application Protocol)无线应用协议;WAP Gff, (WAP gateway) WAP 网关;SP, (Service Provider)服务供应商;
GGSN, (Gateway GPRS Support Node)网关 GPRS 支撑点;OCS, (Online Charging System)在线计费系统;Fff, (Fire Wall)防火墙;DNS,(Domain Name Server)域名服务器;PDSN(Packet Data Serving Node)分组数据服务节点;BTS, (Base Transceiver Station)基立占收发信台;AAA, (Authentication, Authorization and Accounting)认证、授权禾口计费;PDP, (Packet Data Protocol)分组数据协议;NAS, (Network Access Server)网络接入服务器;IP, (Internet Protocol)网络之间互连的协议;IMSI, (International Mobile Subscriber Identification Number) ■云力 用户识别码;MSISDN, (Mobile Subscriber International ISDN/PSTN number)移动用户国际 ISDN/PSTN码Web Server,网页服务器;Switch,交换机;OSI,(Open System Interconnect)开放式系统互联;Firewall,防火墙;Radius, (Remote Authentication Dial In User Service)远禾呈用户拨号认证系 统。本发明实施例公开了一种网络设备故障分析方法,如图1所示,具体步骤如下S11、分别在用户数据流经过的预定网络设备的两侧设置前探点和后探点;在本发明实施例中,所述预设网络设备即为被分析的网络设备,将被分析的网络 设备的两侧设为探点。具体的,所述预设网络设备可以是WAPGW、FireWall、Router或AAA寸。当用户的数据流无法达到目的地时,一般是因为所经过的网络设备中有的网络设 备发生了故障,从而引起网络连接出现异常。为了判断用户的数据流所经过某个网络设备 是否运行正常,首先将此网络设备设为预设网络设备,并在所述预设网络设备的两侧设置 前探点和后探点。在本发明实施例中,所述预设网络设备的两侧是指用户的数据流所经过 的网络路径中,位于所述预设网络设备前侧的数据进入网络链路和位于所述预设网络设备 前侧的数据发送网络链路。S12、在前探点和后探点分别抓取数据包;由于可以通过分析用户的数据是否可以经过预设网络设备来判断所述预设网络 设备是否发生了故障,所以,为了分析进入预设网络设备的用户数据是否可以通过预设网 络设备,本发明实施例中,可以在所述预设网路设备的两侧的探点分别抓取数据包,g卩,在 前探点和后探点分别抓取数据包。具体的,在本发明实施例中,可以以网络设备WAPGW作为预设网络设备为例,在 WAPGff的两端分别抓取数据包,即,进入WAPGW前的数据包,以及由WAPGW发送出的数据包。S13、分别提取在前探点和后探点所抓取到数据包中互联网协议IP报文头部中的用户标识;所述用户标识预先设置在经扩展的Option信息中,用于唯一识别用户;本发明实施例中的网络链路中传输的IP数据包由IP报文头部和IP报文用户数 据组成,其中,IP报文头部的前20个字节中包括有版本、服务类型、总长度等信息,此外,还 可以包括有Option信息,在Option信息项中可以按照需要自定义信息内容。在本发明实施例中,预先将数据流中数据的IP报文的头部Option信息进行了扩 展,并且将能够唯一识别用户身份的用户标识设置到了 Option信息中。具体的,作为一个IP Option,其前两个字节可以按照IP头部约定,定义为字段 Code和字段Length ;可以使用字段Type表示该IP报文关联的用户信息,例如,可以定义为 165 ;使用字段Len表示总长度,例如,可以定义为不超过40字节。在本发明实施例中,用户标识要复制到和该用户相关的所有报文中,如果用户请 求信息发生分片,则每个分片IP报文都要设置有用户标识。在本发明实施例中,所述经扩展的Option信息还可包括用户标识类型和状态信 息。其中,用户标识类型可以用字段Flag表示,状态信息可以用字段Matus来表示;具体 的可以使用字段Flag来标识用户标志信息的类型,如0可以表示用户标识为用户IP 地址;1可以表示用户标识为用户手机号。在本发明实施例中,用来唯一识别用户身份的用户标识可以为多种;除了用户终 端的IP地址或用户手机号以外,还可以使用用户IMSI、用户MSISDN或计费会话ID等。本 发明实施例通过设有字段Flag,可以表明用于作为用户标识的信息的种类,从而方便了后 续步骤中对于用户标识的识别。另外,在本发明实施例中,还可以使用字gMatus来表示状态信息,如,用0来表 示未设置,用户标识无效;1则可以用来表示已设置,用户标识已经生效。在本发明实施例 中,只有当IP报文中字段^atUS的值为0时,才允许设置用户标识,否则不能更新用户标 识。通过上述设置,使得用户标识在第一次被网络设备设置后,其他的网络设备无权对设置 后的用户标识更改。从而保证用户的数据的IP报文中的用户标识一经设置,在以后的网络 路径中保持不变,从而,在分析故障时,可以以追踪用户标识的方法判断被分析的网络设备 是否发生了故障,具体的判断方法为,在没有发生故障的网络设备的前后两侧的数据包的 IP报文的头部Option信息中,应该可以提取到同样的用户标识,否则,被分析的网络设备 就可以被判定为发生了故障。在本发明实施例中,进行Option信息的扩展并设置用户标识的网络设备可以为 WAPGW, GGSN、PDSN 或 AAA。在实际应用中,用户的业务请求产生的数据很可能要经过PDSN/GGSN、AAA、WAPGff 等多个网元设备,所以,上述网络设备均可以对用户的数据的IP报文中的Option信息进行 扩展并设置用户标识。优选的,以由网络设备中的业务处理部件,如WAPGW来对用户的数据的IP报文中 的Option信息进行扩展并设置用户标识为例,具体的比如,可以以用户的手机号码MSISDN分为用户标识;当WAPGW在收到用户请求报 文数据时,先获取该用户的源IP地址;然后,根据源IP地址查询WAPGW网关内部该用户会 话信息(该信息由于GGSN、AAA等设备通过Radius消息上报给WAPGW),获取该用户的唯一标识符,比如,可以是该用户手机号码MSISDN ;接着,对该用户请求报文数据的IP报文中的 Option信息进行扩展并设置用户标识。在本发明的另一实施例中,上述实施例中的用户标识还可以为,加密后的用户终 端IP地址、用户手机号、用户IMSI、用户MSISDN或计费会话ID。由于用户标识只要能够唯一识别用户即可,所以用户终端IP地址、用户手机号、 用户IMSI、用户MSISDN或计费会话ID等可以用来唯一识别用户的每一种信息,在将其加密 后生成的加密后信息也可以用来唯一识别用户,从而,所述加密后信息也就可以作为用户 标识。比如,将用户手机号码哈希取值后生成的哈希码,就可以用作用户标识。本发明实施例中,通过使用加密后的用户唯一识别信息作为用户标识,使得被获 取到的数据包中的用户标识不能直接表示用户的个人信息,从而可以有效地保护用户的信 息不被泄露,保护了用户的隐私。S14、分析在所述前探点和所述后探点是否包括相同的所述用户标识。由于通过设定网络设备前后两侧的数据包中是否包含有相同的用户标识就可以 判断设定网络设备是否发生了故障,所以,在得到所述前探点和后探点所分别抓取的数据 包中所提取的所述用户标识后,对其进行分析;从而可以得出设定网络设备是否发生了故 障的结论,即,如果所述前探点和后探点所分别抓取的数据包中均包含有相同的所述用户 标识,则表示该用户的数据可以通过所述设定网络设备,从而表明所述设定网络设备运行 正常;如果在所述前探点和后探点所分别抓取的数据包中只有一个探点包括有所述用户标 识,则表明用户数据在到达所述设定网络设备后,数据无法通过所述设定网络设备,从而可 以判定所述设定网络设备发生了故障。具体的,如图2所示,以网络设备WAPGWl为例,可以通过故障监控设备2在WAPGWl 设备的两侧分别设有前探点11和后探点12 ;在前探点11和后探点12分别抓取数据包后, 分别提取在前探点11和后探点12所抓取到数据包中互联网协议IP报文头部中的用户标 识。然后,分析前探点11和后探点12中是否包括有相同的用户标识,从而可以判断出 在网络链路中,WAPGWl设备是否发生了故障。同理,网络链路中的网络设备如GGSN、FireWal 1、Switch和SP等网络设备,均可以 采用这种方式来判断网络设备是否发生了故障。在上述所有实施例中,所述设定网络设备还可以为多个。由于在实际应用中,需要在多个网络设备中判断发生故障的网络设备,在多个网 络设备中,数据的传输有先后顺序,在发生故障的网络设备以后所有的网络链路中,将不会 抓取到发生故障的网络设备前的具有同样的用户标识设的IP报文数据。所以,如果经分 析,在多个预设网络设备中,在每个预设网络设备之间均设有探点,即,在网络链路中,同时 设有多个探点,如果某个预设网络设备具有如下特点其前探点具有的用户标识设的IP报 文数据,在经过该预设网络设备后,无法在其后探点抓取到的数据中提取得到;则可以得出 该预设网络设备为故障网络设备。具体的,在分析判断发生故障的网络设备时,可以按照数据传输通过的循序,在多 个网络设备中先判断数据传输先通过的网络设备;这是因为故障网络设备后的所有网络设 备两侧的探点均不包括所述用户标识,从而无法判定该网路设备是否故障。
具体的,如图3所示,以网络链路中包括有网络设备GGSN21、WAPGW22、 FireWall23、Switch24和SP25等网络设备为例。在进行网络中的故障设备查找分析时,首先,故障监控设备沈在各网络设备之间 均设有探点,包括第一探点31、第二探点32、第三探点33和第四探点34。接着,故障监控设备沈在各探点抓取数据包后,分别提取在各探点所抓取到数据 包中互联网协议IP报文头部中的用户标识。然后,分析上述每个设备两侧的探点中的数据中是否包括有相同的用户标识,从 而可以判断出在网络链路中,哪个设备发生了故障。比如,经分析后,发现第二探点32和第三探点33中的数据中没有包括相同的用户 标识,则可以判定网络设备FireWall23出现故障。在上述所有实施例中,还可以包括步骤输出所述判定结果。当需要单独分析一个网络设备是否发生故障时,在对比该网络设备前探点和后探 点所分别抓取的数据包中所提取的用户标识并判定后,可以直接输出判定结果。当需要在多个网络设备中分析出发生故障的设备时,输出判定结果为在多个网络 设备中发生故障的网络设备名称。本发明实施例通过输出直观的判断结果,可以方便故障判断人员的观测和获取结^ ο综上所述,在本发明实施例中,由于IP报文属于网络OSI七层模型中的网络层,作 为其头部的Option信息中的用户标识,在经过各种网络设备时不会被更改,避免了现有技 术中通过WAPGW系统将能唯一标识用户的信息注入到数据报文的应用层中后,用户的一次 业务请求每经过一个网络设备时,其IP地址或端口号都有可能发生变化,所以会出现在某 个正常运行的网络设备的两端也无法关联用户请求的IP报文请求的情况,从而无法分析 业务故障原因,进而导致无法准确定位发生故障的网络设备的问题。本发明实施例中还提供了一种网络设备故障分析装置,包括探点设置模块、数据 包抓取模块、用户标识提取模块和用户标识分析模块;探点设置模块,用于分别在用户的数据经过的设定网络设备的两侧设置前探点和 后探点;数据包抓取模块、用于在前探点和后探点分别抓取数据包;用户标识提取模块,用于分别提取在前探点和后探点所抓取到数据包中互联网协 议IP报文头部中的用户标识;所述用户标识设置在经扩展的Option信息中,用于唯一识别 用户;用户标识分析模块,用于分析在所述前探点和后探点是否包括相同的所述用户标 识。具体的,在本发明实施例中,在需要判断某一网络设备是否发生了故障,首先可以 将其定为设定网络设备。探点设置模块在设定网络设备的前后两侧设置探点,包括前探点 和后探点。所谓探点,即为了分析设定网路设备而抓取数据包的位置。在设置好探点后,数 据包抓取模块在前探点和后探点分别抓取用于分析的数据包。用户标识提取模块在已经获 取到的数据包中提取其IP报文头部中的用户标识。所述用户标识设置在经扩展的Option 信息中,用于唯一识别用户的身份。
在本发明实施例中,进行Option信息的扩展并设置用户标识的网络设备可以为 WAPGW、GGSN、PDSN或AAA。在实际应用中,用户的业务请求产生的数据很可能要经过PDSN/ GGSN、AAA、WAPGW等多个网元设备,所以,上述网络设备均可以对用户的数据的IP报文中的 Option信息进行扩展并设置用户标识。优选的,可以由业务处理部件如WAPGW来对用户的数据的IP报文中的Option信 息进行扩展并设置用户标识,具体的比如,可以以用户的手机号码MSISDN分为用户标识;当WAPGW在收到用户请求报 文数据时,先获取用户的源IP地址;然后,根据源IP地址查询WAPGW网关内部用户会话信 息(该信息由于GGSN、AAA等设备通过Radius消息上报给WAPGW),获取用户的唯一标识符, 比如,可以是用户手机号码MSISDN ;接着,对用户请求报文数据的IP报文中的Option信息 进行扩展并设置用户标识。在本发明实施例中,用来唯一识别用户身份的用户标识可以为多种,除了用户终 端的IP地址或用户手机号以外,还可以使用用户IMSI、用户MSISDN或计费会话ID等或是 上述几种用户标识中的任意组合。此外,为了有效地保护用户的信息不被泄露,保护了用户的隐私。用户标识还可以 为,加密后的用户终端IP地址、用户手机号、用户IMSI、用户MSISDN或计费会话ID。比如, 可以通过对用户的手机号进行哈希取值,并将哈希取值后的数值作为用户标识,从而使得 用户标识不能直接表示出用户的信息,从而可以有效地保护用户的个人信息。在用户标识提取模块分别提取用户标识后,用户标识分析模块比对在所述前探点 和后探点所分别抓取的数据包中是否包括相同的所述用户标识;根据比对结果判定所述设 定网络设备是否故障。具体的,如果所述前探点和后探点所分别抓取的数据包中所提取的 所述用户标识一致,表明所述设定网络设备运行正常;否则,表明所述设定网络设备发生了 故障。上述实施例中,还可以包括有输出模块,用于输出所述判定结果。通过输出直观的 判断结果,可以方便故障判断人员的观测和获取结果。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以 通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质 中,所述程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为 磁碟、光盘、只读存储记忆体(Read-only Memory,ROM)或随机存储记忆体(Random Access Mem0ry,RAM)等。对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本 发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所 定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此, 本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特 点相一致的最宽的范围。
权利要求
1.一种网络设备故障分析方法,其特征在于,包括步骤分别在用户的数据经过的设定网络设备的两侧设置前探点和后探点; 在所述前探点和所述后探点分别抓取数据包;分别提取在所述前探点和所述后探点所抓取到数据包中互联网协议IP报文头部中的 用户标识;所述用户标识预先设置在经扩展的Option信息中,用于唯一识别用户;当所述前探点和所述后探点包括有相同的所述用户标识时,判定所述设定网络设备为 无故障;当所述前探点和所述后探点中只有一个探点包括有所述用户标识时,判定所述设 定网络设备为故障。
2.根据权利要求1所述方法,其特征在于,所述用户标识包括用户终端互联网协议IP 地址、用户手机号、用户IMSI、用户MSISDN或计费会话ID。
3.根据权利要求1所述方法,其特征在于,所述用户标识包括加密后的用户终端互联 网协议IP地址、用户手机号、用户IMSI、用户MSISDN或计费会话ID。
4.根据权利要求1所述方法,其特征在于,由网络设备WAPGW、GGSN、PDSN或AAA进行 Option信息的扩展并设置用户标识。
5.根据权利要求1所述方法,其特征在于,所述经扩展的Option信息还包括用户标识 类型。
6.根据权利要求1所述方法,其特征在于,所述经扩展的Option信息还包括状态信息。
7.根据权利要求1所述方法,其特征在于,所述设定网络设备为多个。
8.根据权利要求7所述方法,其特征在于,按照数据传输通过的循序,在多个设定网络 设备中先判断数据传输先通过的设定网络设备。
9.根据权利要求1所述方法,其特征在于,所述根据比对结果判定所述预定网络设备 是否故障后,还包括,输出所述判定结果。
10.一种网络设备故障分析装置,其特征在于,包括探点设置模块,用于分别在用户的数据经过的设定网络设备的两侧设置前探点和后探占.^ \\\ 数据包抓取模块,用于在所述前探点和所述后探点分别抓取数据包; 用户标识提取模块,用于分别提取在所述前探点和所述后探点所抓取到数据包中互联 网协议IP报文头部中的用户标识;所述用户标识设置在经扩展的Option信息中,用于唯一 识别用户;用户标识分析模块,用于分析在所述前探点和所述后探点是否包括相同的所述用户标识。
11.根据权利要求10所述故障分析装置,其特征在于,还包括输出模块,用于输出所述 判定结果。
全文摘要
本实施例公开了一种网络设备故障分析方法及装置,其中方法包括步骤分别在用户的数据经过的设定网络设备的两侧设置前探点和后探点;在前探点和后探点分别抓取数据包;分别提取在前探点和后探点所抓取到数据包中互联网协议IP报文头部中的用户标识;所述用户标识预先设置在经扩展的Option信息中,用于识别用户;分析在所述前探点和后探点是否包括相同的所述用户标识。本实施例中用户的数据IP报文属于网络OSI七层模型中的网络层,作为其头部的Option信息中的用户标识,在经过各种网络设备时不会被更改,从而避免了由于无法关联用户请求的IP报文请求,而无法分析业务故障原因,进而导致无法准确定位发生故障的网络设备的问题。
文档编号H04W24/04GK102137416SQ20101059225
公开日2011年7月27日 申请日期2010年12月16日 优先权日2010年12月16日
发明者李守平 申请人:华为软件技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1