一种基于行为的p2p流媒体节点识别方法

文档序号:7561414阅读:186来源:国知局
专利名称:一种基于行为的p2p流媒体节点识别方法
技术领域
本发明属于互联网技术领域,具体涉及一种P2P流媒体节点检测方法。
背景技术
随着hternet网络的日趋普及和信息传输技术的快速发展,Internet上的传输 内容已逐渐由单纯的文字传输转变成为包含文本、音频、视频的多媒体数据传输。这样的改 变不仅使hternet使用者能获得更为丰富多样的信息,同时也代表着多媒体网络时代的 来临。面对有限的带宽和拥挤的拨号网络,要实时实现窄带网络的视频、音频传输,最好的 解决方案就是采用流式媒体(streaming media)的传输方式。传统的分布式多媒体系统主要使用客户端/服务器模式,服务器以单播的方式和 每个客户建立连接。由于流媒体服务具有高带宽、持续时间长等特点,随着客户数目的快速 增加,服务器资源如带宽很快就会被消耗殆尽,成为系统瓶颈。为了解决系统的可扩展性问 题,许多研究都提出了相应的解决办法,如IP组播技术、针对服务器提出的缓解负载技术 以及内容分发网络技术,然而由于实现困难或只能有限缓解服务器压力等原因,这些技术 都没有取得显著的效果。P2P模式可以在大规模的网络应用中有效提高系统的可扩展性,因此它与流媒体 技术的结合就成为了必然。基于P2P方式的流媒体传输研究也很快引起了人们的重视,相 关技术或原型系统不断出现,商业运作也日趋完善。据调查显示,近年来P2P流媒体类软件 的月总覆盖用户数的增长率每月都高于所有软件的平均增长率。这说明P2P流媒体技术已 经成为网络流媒体应用发展的根本趋势。随着P2P技术应用的不断扩展,特别是文件共享和流媒体业务不断壮大,P2P网络 本身潜在的安全问题和对资源,特别是网络带宽资源的滥用,已经受到各个网络运营商的
高度重视。P2P应用在近两年内经历着快速变化的过程,由简单到复杂,由低级到高级,其网 络结构也经历了由中心控制到全分布的变化。从流量管理和监控的角度来说,早期的P2P 应用采用固定的端口号,容易检测便于管理。后来逐渐发展到采用动态随机的端口号,一些 传统的检测方法失去了作用。近期涌现的新型P2P应用越来越具有反侦察的意识,采用一 些加密的手法,如伪装成Http协议,进行传输分块等来逃避识别和检测。目前,对各种P2P 应用的识别与检测已形成成熟产品的技术主要是基于深层数据包特征码匹配,而特征码的 提取一般依靠专家人工分析的方法。由于P2P流媒体应用软件更新非常快,新的应用软件 层出不穷,采用各种特征码或端口等特征匹配的技术将是难以应付的。因此必须开展基于 P2P流量网络行为特征模式的识别技术研究,以实现对未知P2P应用和加密后流量的识别, 这是具有非常重要理论意义和实用价值的研究。目前,对P2P文件下载型应用的流量特征识别已经取得了一定的成果,但大多属 于基于简单流统计特征或基于特定程序而非本质的行为特征识别,因而精确度不高。特别是针对P2P流媒体节点行为特征的研究几乎没有,而P2P流媒体应用软件的更新速度及流行度要远比文件共享类型的P2P软件迅速和广泛得多。由于流媒体播放是即 时、连续的,不需要下载完整文件到本地就可观看,任何可播放的源都可以利用这种方式达 到即时和快速传播的目的,这使原来在P2P文件下载应用中就已出现的安全和盗版问题变 得更为严重和难以控制。正是在这样的情况下,P2P流媒体节点识别技术能对这些问题解决起到很好的辅 助作用,例如网络监管人员先从巨大的网络流量中识别出P2P流媒体节点后,然后采集该 节点的完整流量进行重组播放,即可真正实现监管的目的。因此,针对P2P流媒体节点网络 行为特征的识别技术的研究显得尤为重要和紧迫。

发明内容
本发明目的在于克服已有的基于端口及其它数据包特征码匹配的检测方法的不 足,提供一种基于行为的P2P流媒体节点检测方法,填补当前尚无行为特征检测方法的空白。一种大流量环境下基于行为的P2P流媒体节点识别方法,具体为判断下载节点 的断点调度一致性是否位于一致性阈值区间,若是,则该下载节点为P2P流媒体节点;所述下载节点的断点调度一致性G=Ifi^,η为下载节点的连接总数,下载节
η 1=
点与第i个资源节点的连接Li的断点调度一致性LSi =连接Li中的调度续传断点数/连 接Li中的断点总数;所述调度续传断点定义为在节点的连接Li中,数据包传输中断时刻为断点、,数 据包续传时刻为续传点t2,控制信息包出现时刻为调度点t3,若满足、^t3 ^ t2,则断点、 为调度性续传断点。所述一致性阈值区间为0. 8 1。本发明的技术效果体现在利用了 P2P流媒体应用中节点资源暂存性高的特性, 并提出以节点的断点调度一致性值较高的特征来描述这一特性,以此判断P2P流媒体节
点ο1、P2P流媒体应用中节点资源暂存性高的原因分析(1)短暂、随机的用户行为模式由于流媒体播放的连续性、时序性和实时性以及用户不需完整下载到本地的特 点,P2P流媒体系统的动态特征异常显著,特别体现在节点可用资源快速变化上。由于流媒 体是用户参与性很强的应用,在P2P文件共享应用中,用户只要下达了下载命令后即可离 开不再干预程序的运行,所以应用程序可以持续运行很长时间;而用户观看流媒体是至始 至终的,而观看的时间由节目或一部影片的长度决定,一般小于2小时,更重要是由于人的 疲劳感决定了不可能象其它P2P应用可在线几个小时,甚至几天。P2P流媒体应用的用户行 为本质是“不耐心”的,他们会在不同频道和电影中进行切换,选择自己爱看的内容,不象文 件共享系统用户愿意花几小时甚至几天的时间去等待文件下载,这是观看流媒体的即时性 造成的。而在文件下载类型的系统中,文件只有在下载完后,用户才可能评价它的好坏,无 法快速进行下载文件行为的变换。因此P2P流媒体系统节点在线时间和连接时间的平均值 都要小于其它P2P系统。而节点一旦切换频道或下线,则它以前拥有的资源即变为不可用。
(2)应用对存储需求的改变除了节点在线时间较短的特点,节点资源的保存时间也变得更短,由于流媒体是 在线播放,下载的内容播放完之后对用户就不再具有保存价值,所以通常节点不会在硬盘 上存储已下载资源。特别是直播时,节点资源只在下载过程中和被播放前可用,播放完后不 久就会被新的资源覆盖,可用时间极其短暂。即使象某些点播系统那样强制客户端保存下 载的资源,但也仍是在有限的存储空间内,且随着用户继续观看其它影片而会被立刻覆盖 掉原内容。更多情况是在观看中途由于不感兴趣而跳转,这些行为直接导致该频道或电影 的资源从用户主机上消失或仅保存片段,因而流媒体应用中节点资源可用性的变化要比节 点可用性的变化还要快得多,这是其它P2P系统较少出现的。2、P2P流媒体节点连接的断点调度一致性值较高是节点资源暂存性在系统实现技 术上的体现。资源暂存引起节点间数据流传输的调度断流原因分析如下这里的数据流是指某P2P流媒体节点在从其它节点下载流媒体数据时,单条连接 在流入(下载)方向上由大于500字节IP包(不包括传递通讯信息的信息包)组成的流 (注本发明中的识别对象主要针对正在进行流媒体下载并播放的P2P流媒体节点,不包括 在线却没有下载行为的节点)。在其它文件传输系统中,一般都是一次性下载调度机制和数 据大分块机制由于调度产生断流的几率不高。在理想情况下(网络无任何抖动阻塞),这 些系统节点的单条下载数据流不会有频繁的断流出现,特别是数据量传输较大的连接,下 载过程更是一气呵成。而在P2P流媒体系统中,由于节点资源变化很快,为了能及时下载到足够的数据, 必须采用周期性调度下载的机制,即将文件系统的这种一次性下载调度机制运用到了很小 的一段流媒体文件(流媒体播放几分之一秒到数十秒所需的长度大小)下载上,并且不断 重复,直到该流媒体文件的播放结束,形成小周期下载、频繁调度的特点。因此,P2P流媒体 节点的单条数据流会出现明显且频繁的断流现象,这种断流现象不同于由网络抖动引起的 短暂传输停止,它的出现非常有规律,且具有一个不同于其它系统的特点每个断点的续传 都是由一次下载节点发出的调度下载指令所引起的(见

图1),即所谓的调度断流。而网络 抖动引起的断流却是自动恢复的,无需调度。综上所述,数据流的调度断流特性对于P2P流媒体系统是必然和普遍的,对于其 它文件传输系统则是存在出现的可能性。但在一条连接直至一个检点的所有连接中都频繁 出现如此规律一致的调度断流的却只能是P2P流媒体系统。因此,本发明提出一套对节点 断点调度一致性进行测量计算并根据阈值判断P2P流媒体节点的方法。为了验证本发明的效果,表1给出若干P2P流媒体系统与其它各种类型的P2P系 统的断点调度一致性测量值的对比。表1 P2P流媒体流量与其它各种P2P流量断点调度一致性测量对比
(断点长度,调度间隔)其它:P2P流 量(断点长度,调度间隔)流媒体流量a = 1a = 5a = 1a = 5Ppstreaml0.9851BitTorrentl0.320.4权利要求
1.一种大流量环境下基于行为的P2P流媒体节点识别方法,具体为判断下载节点的 断点调度一致性是否位于一致性阈值区间,若是,则该下载节点为P2P流媒体节点;所述下载节点的断点调度一致性
2.根据权利要求1所述的P2P流媒体节点识别方法,其特征在于,所述一致性阈值区间 为0. 8 1。
全文摘要
本发明公开了一种大流量环境下基于行为的P2P流媒体节点识别方法,以在传输过程中数据流出现断点调度高度一致性作为P2P流媒体节点区别于其它应用的行为特征,并建立行为特征的相应测量模型,给出判断阈值实现P2P流媒体节点检测。本发明填补当前尚无行为特征检测方法的空白,并具有较高的检测准确率,具有广泛的应用前景。
文档编号H04L29/06GK102075388SQ20111000624
公开日2011年5月25日 申请日期2011年1月13日 优先权日2011年1月13日
发明者周丽娟, 李芝棠, 柳斌 申请人:华中科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1