基于流统计特性和模糊模式识别的p2p流量检测系统的制作方法

文档序号:8001639阅读:277来源:国知局
基于流统计特性和模糊模式识别的p2p流量检测系统的制作方法
【专利摘要】本发明涉及P2P流量检测【技术领域】,特别是一种基于流统计特性和模糊模式识别相结合的P2P流量检测系统。具体检测步骤为:第一步,数据包的获取,通过捕获数据包来对收到的数据报文进行统计分析;第二步,利用FCBF算法进行特征选择;第三步,根据最大隶属原则设定模型评判规则,根据所提取的流量特征,按照模糊识别中的最大隶属度原则分类方法对输入的模式进行判别,将其分类。原则设定模型评判规则,根据所提取的流量特征,按照模糊识别中的最大隶属度原则分类方法对输入的模式进行判别,将其分类。本发明将智能系统中的模糊识别模型与网络数据流统计特性相结合应用到P2P流量检测中,有很好的可行性和识别效果。
【专利说明】基于流统计特性和模糊模式识别的P2P流量检测系统

【技术领域】
[0001] 本发明涉及P2P流量检测【技术领域】,特别是一种基于流统计特性和模糊模式识别 相结合的P2P流量检测系统。

【背景技术】
[0002] 随着P2P技术的飞速发展,相关应用已经占据60%-80%,网络中的绝大部分流量 都是P2P流量。为了节约带宽资源,出现了很多种相应的流量检测技术和方法。比如固定 端口号扫描、基于协议特征字扫描以及基于流量特征扫描等。不过,这些技术都有掣肘,例 如无法检测到加密应用,属于粗粒度检测等。
[0003] 模糊数学理论提供了一套比较完备的、从小样本数据中寻找规律的系统方法,可 找到描述正常模型的最小预测规则集,有利于提高检测效率。基于最大隶属度原则建立流 量检测模型,从而达到对网络数据进行二分类的目的。
[0004] 隶属度是描述某特征属于某集合的程度,是0与1之间的一个数值。把一个具体的 元素映射到一个合适的隶属度是由隶属函数来实现的。隶属函数可以是任意形式的曲线, 取什么形状取决于是否让使分类器简单、快速、有效,惟一的约束条件是隶属函数的值域为 [0, 1]。
[0005] FCBF算法是一种属性特征选择算法,属于嵌入方式的算法。在处理数据量较大的 网络数据时很有优势。FCBF算法用对阵不确定性(Symmetrical Uncertainty, SU)作为衡 量指标,利用SU的值来做特征选择。SU取值在[0, 1]之间,1表示两个随机变量可以相互 完全预测对方的值,0则表示两个随机变量彼此独立。SU的值越大,越能代表其特征的优 越性越大。


【发明内容】

[0006] 本发明的目的在于提供一种基于流统计特性和模糊模式识别相结合的P2P流量 检测系统,以合理利用网络资源。
[0007] 实现本发明目的的技术解决方案为:将智能系统中的模糊识别模型与网络数据流 统计特性相结合应用到P2P流量检测中,运用FCBF算法进行特征提取,运用最大隶属度原 则对特征进行分类。
[0008] -种基于流统计特性和模糊模式识别相结合的P2P流量检测系统,其具体检测步 骤如下: 第一步,数据包的获取,通过捕获数据包来对收到的数据报文进行统计分析; 第二步,利用FCBF算法进行特征选择。这一步是流量识别过程中最关键的一步。
[0009] 第三步,根据最大隶属原则设定模型评判规则;根据所提取的流量特征,按照模糊 识别中的最大隶属度原则分类方法对输入的模式进行判别,将其分类。
[0010] 本发明与现有技术相比,其显著优点:将智能系统中的模糊识别模型与网络数据 流统计特性相结合应用到P2P流量检测中,有很好的可行性和识别效果,具有一定的实用 价值。

【专利附图】

【附图说明】
[0011] 图1是流量检测系统结构图。
[0012] 图2是模糊模式识别过程图。

【具体实施方式】
[0013] 下面结合附图对本发明作进一步详细描述。
[0014] 本发明基于流统计特性和模糊模式识别的P2P流量检测系统,该系统包括:数据 包获取模块,用于捕获网络数据包;流量特征提取模块,用于将特征提取整合为特征向量; 模糊检测模块,用于运用模糊模型进行模式识别分类,图1是流量检测系统结构图,其具体 检测步骤如下: 第一步,在PC终端上利用Wireshark软件的WinPcap功能采取被动监听的方式,进行 数据报文截获,对收集到的数据报文进行统计分析并提取流量特征; 第二步,利用FCBF算法进行流量特征属性的提取,以去除不相关和冗余的属性,缩小 流量数据集; 第三步,根据提取的η个流量特妬对呀流量而言,对应于η个隶属度为: uua.....im。对这些隶属度分别给予适当的权系数:αι.?/2.....③1;然后计算 i7 = I £Γ/--?。设定一个阈值W,当F彡W时,即认为所检测的为P2P流量,否则为非P2P流 =1 量,以达到流量分类检测的目的。
[0015] 对于不同的P2P协议,它的阈值是不同的,通过设置不同的阈值即可识别出具体 的P2P流量属于何种应用。
[0016] 针对图2,本系统通过学习传感数据样本进行特征提取以建立模式库,之后系统对 网络数据流进行模式匹配做出决策,从而对数据流分类。
【权利要求】
1. 基于流统计特性和模糊模式识别的P2P流量检测系统,其特征在于步骤如下: 第一步,数据包的获取,通过捕获数据包来对收到的数据报文进行统计分析; 第二步,利用FCBF算法进行特征选择; 第三步,根据最大隶属原则设定模型评判规则,根据所提取的流量特征,按照模糊识别 中的最大隶属度原则分类方法对输入的模式进行判别,将其分类。
2. 根据权利要求1所述的基于流统计特性和模糊模式识别的P2P流量检测系统,其特 征在于:在步骤1中,通过PC终端利用Wireshark软件的WinPcap功能,采取被动监听的方 式进行数据报文截获,对收集到的数据报文进行统计分析。
3. 根据权利要求1所述的基于流统计特性和模糊模式识别的IF流量检测系统 其特征在于:在步骤3中,假设提取n个流量特征对IF流量而言对应于n个隶属度为: HLH2.....坫1,对这些隶属度分别给予适当的权系数:121. £22?.,说;然后计算
设定一个阈值W,当F > W时,即认为所检测的为P2P流量,否则为非P2P流 量,以达到流量分类检测的目的。
【文档编号】H04L12/26GK104283726SQ201310271298
【公开日】2015年1月14日 申请日期:2013年7月1日 优先权日:2013年7月1日
【发明者】李千目, 李嘉, 侯君, 戚湧 申请人:南京理工大学常熟研究院有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1