基于标记回传的大流量R‑P接口数据关联的方法及其装置与流程

文档序号:11965441阅读:326来源:国知局
基于标记回传的大流量R‑P接口数据关联的方法及其装置与流程
基于标记回传的大流量R-P接口数据关联的方法及其装置技术领域本发明涉及CDMA2000网络中R-P接口高速网络流量监控领域,尤其是一种利用数据包在交换单元和解析单元之间标记回传的特性,将信令数据与用户数据关联的方法及其装置。

背景技术:
PCF(PacketControlFunction,分组控制功能)和PDSN(PacketDataServingNode,分组数据服务节点)是CDMA2000核心网络中最重要的两个结点,PCF端往PDSN端通信的链路为上行链路,PDSN端往PCF端通信的链路为下行链路。两者通过R-P接口(又称为A10/A11接口)互联。A11为信令接口,负责连接的建立,维护和删除。A10为数据接口,传输的数据包是GRE(GenericRoutingEncapsulation,通用路由封装协议)封装后的PPP分片数据,且会有包乱序的情况存在。A10数据解封装后的数据有非压缩数据和压缩数据,对于压缩数据还需要进入解压缩流程。3G移动终端的广泛应用为生活带来了便捷,也给传统的流量检测和控制技术提出了挑战。R-P接口数据关联与还原分析,在业务识别、业务统计、流量控制、攻击行为分析等领域有重要的意义。公开号CN103024819A《基于用户终端IP的第三代移动通信核心网数据分流方法》的处理模型中,提供一种能够将所有数据报文按用户IP地址均匀分流到与该IP地址对应的后端分析设备的方法。由于所有3G核心网链路报文都会串行经过数据前端数据处理交换单元中的各个模块,因此每一个模块都可能成为性能的瓶径,所以并不能适应大流量网络(20Gbps-40Gbps)处理情况。公开号CN102497652A《一种码分多址R-P接口大流量数据负载均衡方法及装置》的处理模型中,提出了一种10G交换单元按照IP地域归属将数据均衡发送10G处理板的方法,这种数据均衡的方法粒度较粗,地域流量有显著差异时负载均衡效果必然会大打折扣,并且,在同一地域流量较大超过10G处理设备的处理能力时会有用户数据丢失。

技术实现要素:
本发明所要解决的问题是,在CDMA2000网络中R-P接口流量迅速增加的大趋势下,提供一种基于标记回传的大流量(20G-40G)R-P接口数据关联的装置,该装置能满足大流量下信令和数据的关联需求。该装置所采用的基于标记回传的方法,能够以较细的粒度将A10数据与A11信令均衡分发到中间解析单元,解决现存技术中的负载均衡效果不佳,部署不够灵活的技术问题。为解决上述技术问题,本发明提出一种基于标记回传的大流量R-P接口数据关联的装置,该装置在高速流量的A10/A11网络中,利用前端交换单元将A10的数据按照gre_key字段转发到中间解析单元,将A11的数据按照外层IP地址转发到中间解析单元。中间解析单元会对进入的流量进行进一步的解析,部分不属于本解析单元的流量会标记回传给前端交换单元。解析单元最终会解封装还原用户数据,并将国际移动用户识别码(IMSI:InternationalMobileSubscriberIdentificationNumber)号与gre_key标记在数据包MAC(MediumAccessControl)字段,转发给后端交换单元。本装置输出的数据是原始的用户数据,满足对用户数据流量做出进一步的分析的处理要求。上述一种基于标记回传的大流量R-P接口数据关联的装置,该装置包括:1.前端交换单元前端交换单元只进行二层,三层协议,VLAN(VirtualLocalAreaNetwork)字段以及数据中固定偏移的解析。进入前端交换单元的数据包分为两类:第一类数据包是原始A10/A11数据包,第二类数据包是经过中间解析单元解析过带有Mn标记的数据包(其中n的取值范围最小为1,最大为中间解析单元的个数)。前端交换单元将原始A10/A11数据包进入后在包内容上置T标记,然后将A10,A11数据转发到中间解析单元。前端交换单元收到带有Mn标记的数据包后,解析数据中的VLAN字段,会根据解析结果将包转到相应的中间解析单元。2.中间解析单元中间解析单元的处理过程分为两个阶段。第一阶段主要进行gre_key的解析,根据gre_key的值来判断出该数据包是由哪一个中间解析单元进行处理。第二个阶段进行用户数据的分流,解封装,最后进行用户原始数据的还原。进入中间解析单元的A10/A11数据分为两类,分别可以与处理过程的两个阶段相对应。第一类是带有T标记的A10/A11数据包,即只经过前端交换单元处理过的数据。这类数据主要在中间解析单元的第一个阶段进行,该阶段处理完毕后,会根据解析出的gre_key的内容决定该数据包由哪一个中间解析单元进行下一阶段的解析,然后在数据包内容上置Mn标记。如果该数据包恰巧是由当前的中间解析单元进行解析,则将该数据包直接送到一下阶段。如果数据包是由其他的中间解析单元进行解析,则将数据包回传到前端交换单元。第二类数据包是带有Mn标记的数据,该类数据包的处理主要在第二个阶段进行。第二个阶段解析完成后的用户数据置U标记,用户数据的MAC上带有识别出的IMSI号。有现实网络环境下,设备一开始接入时的未识别出IMSI号的数据,将在MAC上做出另外特定标记以作区分。3.后端交换单元后端交换单元部署在最后方,进入的数据是带有U标记的数据,后端交换单元会解析数据包的MAC地址字段,按照MAC地址的值哈希转发数据包。本发明还提出一种基于标记回传的大流量R-P接口数据关联的方法,该方法包括:对需要处理的数据进行标记,包括对原始数据添加VLAN字段,并对VLAN字段与MAC字段进行修改来达到不同标记的区分。进入前端交换单元的原始的A10/A11数据包置I标记。前端交换单元进入中间解析单元的数据包置T标记。前端交换单元预处理提高转发到正确的中间解析单元的精度。对于原始的A10数据包,解析出数据包中固定偏移内容,根据固定偏移内容的32位数(即大部分包中的gre_key字段)将数据包转发到中间解析单元,转发规则可以按照一定的哈希算法送到中间解析单元上。对于原始的A11数据包,前端交换单元按照外层IP对哈希到中间解析单元。利用回传的方法,确保所有数据包被正确的中间解析单元处理。中间解析单元按照GRE协议规范识别出gre_key字段。根据gre_key字段的值,决定该数据包是由哪一个中间解析单元处理,并将数据包置Mn标记。中间解析单元回传给前端交换单元的数据包置Mn标记。前端交换单元收到带有Mn标记的数据包后,会根据标记内容(即解析VLAN字段中vlan_id的值)直接将包转到相应的中间解析单元。用户数据的分流,解封装,最后进行用户原始数据的还原。并将还原后的用户数据MAC字段置U标记转发给后端交换单元。本发明具有以下优点:本发明将CDMA2000网络中整个R-P数据关联的过程分为前端交换单元处理、中间解析单元处理和后端交换单元处理三个阶段,利用数据包标记回传的功能,实现了一种按照gre_key将不同用户数据负载均衡到不同的解析单元的方法与装置。该发明可实现大流量下多条R-P接口数据的关联,关联过程完成后,数据包的MAC(媒体存取控制)字段会标记上用户的国际移动用户识别码,同一个用户的数据将会从固定的后端交换单元的端口转发出去。该发明将A10数据与A11信令以较细粒度转发到中间解析单元处理,避免了中间解析单元协议解析的瓶颈问题。在运营商重新部署PCF或者PDSNIP时,处理起来更为灵活,能够更好满足实际应用需求。利用对数据包标记的方法,对数据包的每一个阶段进行了区分,并且使得前端交换单元按照gre_key字段来区分出不同用户的流量。最终gre_key相同的数据由同一个中间解析单元处理,粒度更小,在网络环境发生变化时扩展性强。利用回传的方法,确保同一条流的所有A11/A10数据包都被正确的同一个中间解析单元进行处理,提高最终用户数据的完整性。中间解析单元个数的灵活配置,解决了A10数据还原的性能瓶颈。在大流量(20G-40G)汇聚的R-P接口上,可以实现数据的关联。附图说明图1为本发明基于标记回传的大流量R-P接口数据关联的设备结构图,中间解析单元是可扩展的。图2为本发明基于标记回传的大流量R-P接口数据关联的方法流程图。图3为中间解析单元进行数据处理的流程图。图4为标记中的VLAN字段的填充内容图。图5为不同的标记对应数据包中VLAN字段的不同。图6为IMSI号与gre_key在数据包的标记图。具体实施方式下面结合附图对本发明作详细说明。图1为该发明所描述的基于标记回传的大流量R-P接口数据关联的装置结构图。该装置在CDMA2000核心网域R-P接口处,由前端交换单元,中间解析单元和后端交换单元组成。标号101是前端交换单元,标号102是中间解析单元,标号103是后端交换单元。如图1中箭头方向所示,前端交换单元与中间解析单元的数据流向是双向的。中间解析单元与后端交换单元的数据流向是单向的。P[I]表示R-P接口汇聚后的原始数据包,P[T]表示经过前端交换单元处理后,带有T标记的数据包,P[Mn]表示经过中间解析单元第一阶段处理后,带有Mn标记的数据包,n代表目的解析单元,P[U]表示经过中间解析单元第二阶段处理后,带有U标记的数据包。在20Gbps-40Gbps的流量接入的情况下,可采用四个中前解析单元与前后端交换单元相连。图2为该发明的方法的总体流程图。该总体流程的具体步骤如下:标号201表示大流量R-P接口数据进入前端交换单元,数据进入后将被置I标记。标号202表示前端交换单元对进入的数据进行是否带有Mn标记的判断。对于带有Mn标记的流量,前端交换单元将跳转到标号203所示步骤执行。对于不带有Mn标记流量即原始流量,前端交换单元将跳到标号204所示步骤进行。标号203表示前端交换单元将根据vlan_id去转发到正确的中间解析单元。标号204和标号206表示对A10数据的判断,前端交换单元将数据包中IP协议字段为47的数据包认为A10数据包,根据数据包中第38字节至41字节(即R-P接口大部分流量中的gre_key字段)的值,哈希到中间的解析单元上,并置T标记。该哈希算法是前端交换单元与中间解析单元共同知道的。标号205和标号207表示对A11数据的判断,前端解析单元将数据UDP字段的端口号为699判断为A11数据,对于A11数据,前端交换单元将会根据外层的IP地址哈希到中间解析单元上,并置T标记。标号208表示中间解析单元收到前端分流单元转入的数据。标号209表示中间解析单元判断数据是否已经带有Mn标记。对于进入中间解析单元的带有T标记的流量,进入标号为210所示步骤处理。对于进入中间解析单元的带有Mn标记的流量,进入标号为212所示步骤处理。标号210表示中间解析单元收到前端交换单元转入的数据后,按照GRE协议解析A10数据获取gre_key字段,同时也对A11数据解析出gre_key和IMSI字段。根据gre_key的值置Mn标记。标号211对标记Mn进行判断,如果gre_key满足所设定的哈希算法,即该数据包的gre_key正是自己所要处理的gre_key,中间解析单元将直接对该数据包将跳转到标号212所示步骤进行下一步的解析。对于进入中间解析单元的带有T标记的A10流量来说,大部分数据包的第38字节至41字节的数据正好是gre_key字段,是不需要经过再次送回前端交换单元的。如果经过解析单元的解析,发现gre_key并非本解析单元所要处理的值,将通过更改数据包的vlan_id字段,将数据包置Mn标记(1<=n<=4),确保数据包再一次会被正确转发到中间解析单元,该部分数据将跳转到标号202所示步骤。标号212表示A11/A10数据的关联以及用户数据还原,还原的用户数据将置U标记。如果A10数据已经与A11数据已经正确关联,在数据包的MAC字段会填充上该用户的IMSI号和gre_key,然后将数据包转发到后端交换单元。MAC字段填充IMSI的方式,源MAC地址和目的MAC地址各48位,为了避免填入MAC导致地址不合法,IMSI号用52位存储,gre_key为32位,MAC中其他未用到的位皆置为0。MAC字段填充如图6所示。标号213表示数据进入后端交换单元。标号214表示后端交换单元根据转发带有U标记的数据。后端交换单元收到带有U标记的数据后,对于已经识别出IMSI号的数据将会按照IMSI号分流到设备出口。对于未识别出IMSI号的数据,将会根据gre_key分流到设备出口。图3是中间解析单元收到带有T标记和带有Mn标记的数据包后,采取的不同的处理流程,是对中间解析单元流程的进一步细分。具体步骤如下:标号301表示ip分片重组的处理过程。标号302表示gre_key字段提取的处理流程。中间解析单元和前端交换单元有统一给定,由字段决定数据包由哪一个中间解析单元处理。标号303表示判断该数据包是否属于该解析单元进行处理。数据包的划分方法通过把数据包的gre_key字段的值进行运算得到。具体的计算方法为:解析单元号=(key1+key2)%解析单元个数其中key1是将gre_key每次取8比特,顺序分为四部分,这四部分相加得到的和。其中key2是将gre_key每次取8比特,顺序分为四部分,这四部分异或得到的结果。标号304表示中间解析单元回传非当前解析单元要解析的数据。标号305表示中间解析单元继续解析该数据。标号306表示GRE协议解析过程,实现A10与A11数据的关联,完成解封装操作。进入该解析过程的数据都带会有Mn标记。标号307表示PPP分片乱序调整和PPP分片重组的过程。标号308表示对数据是否是压缩数据进行判断。标号309表示进入解压缩模块,对压缩数据进行解压缩处理操作。标号310表示置U标记,并将还原后的用户数据转发到后端交换单元。图4和图5分别说明了数据包中添加的VLAN字段内容以及不同阶段的标记的vlan_id字段的不同。从前端交换单元转出的所有R-P流量作标记的方法大都是在数据包上添加VLAN字段后更改vlan_id来实现的,vlan_id用于不同的阶段的标记以及不同中间解析单元处理的标记。带有T标记的数据包vlan_id设置为2。中间解析单元的vlan_id值从101(16进制数0x65)开始。有四个中间解析单元的情况下,四个中间解析单元的vlan_id分别为101(16进制数0x65),102(16进制数0x66),103(16进制数0x67),104(16进制数0x68)。图6说明了中间解析单元完成R-P接口的数据关联后,将IMSI或者gre_key填在数据包MAC字段中的结构图。图中,带有U标记的数据格式,从头依次是imsi的高4位,4位0,imsi号中间44位,4位0,imsi号低4位,4位0,32位gre_key。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1