一种基于数学建模技术应用于p2p网络的流量识别与控制的方法

文档序号：7920709阅读：276来源：国知局

专利名称：一种基于数学建模技术应用于p2p网络的流量识别与控制的方法
技术领域：
本发明涉及数据通信领域的流量识别和控制技术，尤其涉及一种基于流量数学模型匹配方法识别P2P流量并控制P2P流量的方法。
背景技术：
当前，P2P已经成为互联网应用最广泛的文件传输技术，根据不完全统计，运营商骨干网带宽60%左右是P2P软件产生的流量，大量P2P导致网络拥塞、带宽浪费，造成整个通信网络效率下降。因此，如何识别和控制P2P是当前面临的巨大挑战。
基于P2P技术开发的软件，具有如下几个典型特征
1、软件类型非常繁多，且采用的通信协议不规范，不标准； 2、每一个主机既是服务器，也是客户端，没有明显的中央控制单元，流量具有网状连接特征，很难识别； 3、网络逃避运营商等对P2P业务的控制，普遍采用加密传输、频繁更新协议特征等技术，导致识别控制困难。传统的P2P流量识别，如
公开日期为2006年3月22日，公开号为CN 1750538A 的发明申请，披露了利用特征码(关键字)进行识别P2P流量的技术。但是，一旦出现新的 P2P软件，或者P2P软件特征码更新，或者P2P软件将流量加密，就无法识别P2P流量。

公开日期为2007年10月10日，公开号为CN 101051997A的发明申请，披露了利用大于1024的TCP/UDP端口数进行P2P识别的技术。但是，该方法无法将P2P业务和端口扫描、DdoS攻击等类型的流量区分开来。
公开日期为2006年11月15日，公开号为CN 1863154A的发明申请，披露了利用 IP地址连接的通信对端IP地址的数量进行P2P识别的技术。但是该方法无法区分一个IP 地址是否属于一个为众多用户提供服务器的设备，还是一个用户在大量发起P2P连接。

发明内容
本发明通过对P2P技术特征的分析，得出典型的P2P流量模型，通过模型特征值的提取，能够非常高效便捷的对它们进行识别。本发明提供一种基于数学建模技术应用于P2P网络的流量识别与控制的方法，具体包括以下步骤对网络中的每一个IP地址的通信会话进行数学建模，采集该IP地址活动会话所连接的对端IP地址分布、TCP/UDP端口分布和会话状态信息，利用数学建模技术产生数学模型特征值；将数学模型特征值与预设的P2P流量数学模型参数进行匹配；在与P2P 流量数学模型参数匹配的情况下，判定该IP地址当前正在使用P2P技术进行数据传输；根据预先配置的P2P流量控制策略，对该IP地址的所有符合P2P特征的流量进行控制。
上述预设的P2P流量数学模型参数包括最小IP地址扩散度Cip、最小TCP/UDP端口扩散度Mport、最大会话接通率Cratemax和最小会话接通率Cratemin，上述四个参数被配置到数学模型库中。如上所述的方法，对网络中的每一个活动IP计算它的数学模型特征值，包括每一
个IP地址的连通性扩散度Xip、端口扩散度Xport和会话接通率Xrate。当同时满足Xip > Cip、 Xport > Mport禾口 Cratemin < Xrate < Cratemax时，判
定该IP地址当前正在使用P2P技术，之后利用令牌桶算法(token bucket)将P2P报文进
行报文排队处理，用以限制该IP地址的P2P流量的最高峰值，或者限制该IP地址单位时间
内能够传输的P2P流量的总数据量，或者限制该IP地址的P2P流量的会话数。本发明优于背景技术中举例的三个发明所采用的技术具体体现在 1、本发明不依赖于对报文的内容进行关键字或者特征码识别，因此，本发明的方
法能够对加密的P2P和未知的新出现的P2P流量进行识别； 2、本发明不是仅仅依靠对高于1024的TCP/UDP端口进行统计，识别P2P，它避免了把P2P流量和网络扫描、DdoS攻击等流量混淆起来。因此更精确； 3、本发明不是仅仅依靠对IP地址所连接的对端IP地址数量进行统计，因此避免了把P2P流量和网站服务器的流量混淆。

图1是采用本发明所述方法进行P2P流量数学建模模型匹配分析时的处理流程。
图2是采用本发明所述方法进行P2P流量识别与控制的通信设备处理IP报文的流程图。
具体实施例方式
为了避免背景技术中所述的识别方法带来的弊端，我们研究了P2P业务的通用流量模型，它存在以下特征 1、P2P软件下载的流量，和传统文件服务器下载的流量不同。P2P流量会主动向至少一百个终端发起数据请求； 2、 P2P软件为了逃避防火墙拦截，一般不会使用固定端口，而是动态协商端口；
3、 P2P软件连接的终端不一定处于活跃状态，因此通信接通率没有保障。一方面能够成功一些通信请求，但是也会失败一部分。其接通率大于病毒、攻击产生的会话，小于正常的网络通信。通过综合采用四个参数来共同决定是否P2P流量，能够更加精确的识别出网络中的P2P流量。综合利用Cip、Mport、 Cratemin、 Cratemax这4个参数，能够做到不依赖于P2P流量是否加密、是否修改协议字段、是否新出现的P2P，准确的识别分析网络中的流量。
综合这4个参数，能够非常精确、准确的识别P2P，避免了误判、漏判，从而做到更加精确的流量控制。图1是采用本发明所述方法进行P2P流量数学建模模型匹配分析时的处理流程，具体步骤包括步骤S101、初始化数学模型库；步骤S102、对P2P流量数学模型的各种预设参数进行配置，假设P2P流量数学模型的IP地址扩散度最小为Cip， TCP/UDP端口扩散度最小为Mport，会话接通率最大为 Cratemax、最小为Cratemin，将上述四个参数配置到数学模型库中；步骤S103、采集每一个IP地址通信会话所连接的对端IP地址分布、TCP/UDP端口分布、会话状态信息，进行数学建模，实时计算通信网络中每一个IP地址的连通性扩散度 Xip，端口扩散度Xport，会话接通率Xrate ; 步骤S104、当同时满足Xip > Cip、 Xport > Mport禾口 Cratemin < Xrate < Cratemax的时候，判定该IP地址流量符合P2P流量模型特征，如符合则执行步骤S105，否则进入步骤106 ; 步骤S105、如果是P2P流量，启动预先设置的P2P流量控制策略，利用基于令牌桶算法的队列调度算法，对P2P流量进行限制；步骤S106、如果不符合P2P流量模型特征，按照正常的IP报文转发流程。在一个实际的网络设备中，如在网络中串联接入的网关或者网桥设备，可以利用
图2的软件流程图，来实现对P2P的精准控制步骤S201、进行会话分析，对每一个IP地址计算步骤S103所述的3个数学模型特征值；步骤S202、对步骤S201计算出来的数学模型特征值，和步骤S102配置的参数进行比较，分析每一个IP地址是否存在P2P流量；步骤S203、识别出使用P2P传输数据的IP地址，将它们汇总，形成统一的统计指标；步骤S204、读取流量控制设备中的P2P流量控制策略，决定对这些IP地址的P2P 流量执行何种控制策略，如限制这些IP地址的P2P流量的最高峰值，或者限制这些IP地址单位时间内能够传输的P2P流量的总数据量，或者限制这些IP地址的P2P流量的会话数；
步骤S205、利用令牌桶算法，对P2P流量进行排队，按照确定的P2P流量控制策略实现流量的具体控制。
权利要求
一种基于数学建模技术应用于P2P网络的流量识别与控制的方法，其特征在于对网络中的每一个IP地址的通信会话进行数学建模，采集该IP地址通信会话所连接的对端IP地址分布、TCP/UDP端口分布和会话状态信息，利用数学建模技术产生数学模型特征值；将数学模型特征值与预设的P2P流量数学模型参数进行匹配；在与P2P流量数学模型参数匹配的情况下，判定该IP地址当前正在使用P2P技术进行数据传输；根据预先配置的P2P流量控制策略，对该IP地址的所有符合P2P特征的流量进行控制。
2. 如权利要求1所述的方法，其特征在于如果不匹配预设的P2P流量数学模型参数，执行正常的IP报文转发流程。
3. 如权利要求1或2所述的方法，其特征在于所述预设的P2P流量数学模型参数包括最小IP地址扩散度Cip、最小TCP/UDP端口扩散度Mport、最大会话接通率Cratemax和最小会话接通率Cratemin，上述四个参数被配置到数学模型库中。
4. 如权利要求3所述的方法，其特征在于所述数学模型特征值包括每一个IP地址的连通性扩散度Xip、端口扩散度Xport和会话接通率Xrate。
5. 如权利要求4所述的方法，其特征在于当同时满足Xip > Cip、 Xport 〉Mport和 Cratemin < Xrate < Cratemax时，判定该IP地址当前正在使用P2P技术。
6. 如权利要求5所述的方法，在判定该IP地址当前正在使用P2P技术时，利用令牌桶算法将P2P报文进行报文排队处理，并限制该IP地址的P2P流量的最高峰值，或者限制该 IP地址单位时间内能够传输的P2P流量的总数据量，或者限制该IP地址的P2P流量的会话数。
全文摘要
本发明公开了一种基于数学建模技术应用于P2P网络的流量识别与控制的方法，具体是采用对流量进行数学建模，基于用户行为的方法，识别网络的流量并进行控制的方法。通过在网络中串联接入网关或者网桥设备，对网络中的流量进行分析，分析每一个IP地址活动的会话情况，综合分析IP活动连接的对端IP地址分布情况、活动会话的TCP/UDP端口分布情况、会话状态信息等进行数学建模，通过模型匹配判断用户P2P下载的行为。本发明基于数学模型匹配，不依赖于传统的基于协议解析和关键字匹配的方法识别应用层网络流量，大大提高了流量识别的效率和流量控制设备的处理能力。
文档编号H04L29/08GK101741686SQ20081017180
公开日2010年6月16日申请日期2008年11月13日优先权日2008年11月13日
发明者付天福申请人:天津比蒙新帆信息技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：付天福
技术所有人：天津比蒙新帆信息技术有限公司
我是此专利的发明人

上一篇：一种基于p2p业务识别方法进行多链路负载均衡的方法
上一篇：基于应用层业务分析的网络流量分析方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。