利用用于健壮数据监控的交叉对比的bittorrent扫描的制作方法

文档序号:8208040阅读:530来源:国知局
利用用于健壮数据监控的交叉对比的bit torrent扫描的制作方法
【专利说明】利用用于健壮数据监控的交叉对比的BIT TORRENT扫描
[0001]对相关申请的交叉参考
本申请要求由AnjU Chopra等在2012年6月7日提交的关于BIT TORRENT SCAN WITHCROSS COMPARISON FOR ROBUST DATA MONITORING 的美国临时专利申请序列号 61/656,675 和由 Anju Chopra 等在 2012 年 11 月 14 日提交的关于 BIT TORRENT SCAN WITH CROSSCOMPARISON FOR ROBUST DATA MONITORING 的美国临时专利申请序列号 61/726,346 的权利,其中的每个由此通过参考被结合。
技术领域
[0002]本公开大体涉及计算机网络并且更具体地涉及监控BitTorrent网络。
【背景技术】
[0003]BitTorrent协议与文件的可靠传输有关。用户可以使用各种方法来搜索种子文件(torrent file),该种子文件然后被用来通过网络从“群(swarm)”计算机下载感兴趣的内容。例如,用户可以通过搜索索引站点/跟踪器(tracker)站点、通过搜索对等(P2P)网络、通过加入丰富站点摘要(RSS)馈送、或通过利用其它类型的BitTorrent管理页面来寻找具体的种子文件。每个BitTorrent管理页面能够具有它自身的语法和格式。因此,不存在单个或一致的方式来搜寻跨过各种不同的BitTorrent管理网页的上下文。进一步,不存在其中能够可能地经过连接跳跃到达所有参与者的集中式BitTorrent网络。相反,每个种子“群”是封闭的社区,每个跟踪器站点没有到下一个的协议层连接,并且索引站点彼此分开。

【发明内容】

[0004]因此,仍然需要高效地监控与种子文件相关联的内容和共享该内容的群计算机。
[0005]根据一个或多个实施例,诸如索引站点或丰富站点摘要(RSS)馈送的一个或多个BitTorrent管理页面可以针对与一个或多个搜索项相关联的种子文件的标记来扫描。在定位种子文件之后,与种子文件相关联的信息可以被利用来开始通过网络利用BitTorrent协议从群计算机下载由种子文件所指示的内容的一个或多个部分。随着内容从群计算机正被下载,可以获得与每个群计算机相关联的识别信息。
[0006]与种子文件相关联的数据、与种子文件相关联的内容和与每个群计算机相关联的识别信息可以被存储在数据库中。此后,客户端可以搜索存储与种子文件、内容和识别信息相关联的数据的数据库或不同的贮存器结构以定位可能正共享例如未授权的或非法的信息的一个或多个群计算机。
[0007]进一步,使用相同的搜索项目,从新颖的种子监控系统获得的结果可以与其它系统(例如对等网络扫描)交叉对比以根据“威胁”等级来归类或分类组合的结果。
[0008]有利地,种子文件、它们的内容和共享与种子文件相关联的内容的群计算机可以被高效地监控。
【附图说明】
[0009]下面的描述参考附图,其中:
图1图示示例计算机网络;
图2图示可以在图1的计算机网络中利用的示例种子监控系统;
图3图示用于监控BitTorrent的示例简化程序;
图4图示用于搜索与当前应用的种子监控系统相关联的信息的示例简化程序;
图5图示用于将使用相同的搜索项从种子监控系统所获得的信息与从使用其它系统所获得的信息交叉对比的示例系统;以及
图6图示用于将使用相同的搜索项从新颖的种子监控系统所获得的信息与从其它系统所获得的信息交叉对比的示例简化程序。
【具体实施方式】
[0010]图1图示示例计算机网络100,该计算机网络100说明性地包括通过通信链路120互连的客户计算机105、种子监控系统200、数据库110、一个或多个群计算机115、以及BitTorrent管理页面118。本领域技术人员将理解的是,任何数目的客户计算机、种子监控系统、数据库、群计算机和/或链路可以被用在计算机网络中,并且这里示出的视图是为了简单起见。
[0011]客户计算机105和群计算机115可以是任何通用的数据处理器,诸如个人计算机或工作站。数据库110是组织数据集合的常规的结构,如由本领域技术人员所知。
[0012]图2图不不例种子监控系统200,该种子监控系统200可以与在本文中描述的一个或多个实施例一起被使用。种子监控系统200可以包括通过系统总线250互连的多个网络接口 210、一个或多个数据处理器220和存储器240。网络接口 210含有用于在耦合到网络100的物理链路上传送数据的机械、电气和信号电路系统。网络接口可以被配置成使用各种不同的通信协议来发送和/或接收数据,该通信协议尤其包含TCP/IP、UDP、ATM、同步光网络(SONET)、无线协议、帧中继、以太网、光纤分布式数据接口(FDDI)等。特别地,物理网络接口 210也可以被用来实施对于本领域技术人员已知的一个或多个虚拟网络接口,诸如用于虚拟个人网络(VPN)访问。
[0013]存储器240包括通过(一个或多个)处理器220和网络接口 210可寻址的多个位置用于存储与在本文中描述的实施例相关联的软件程序和数据结构。处理器220可以包括适于运行软件程序和操纵数据结构的必要的元件或逻辑。其部分典型地驻留在存储器240中并且由(一个或多个)处理器来运行的操作系统242尤其通过调用支持在节点上运行的软件过程和/或服务的网络操作而在功能上组织节点。这些软件过程和/或服务可以包括调度器238、扫描器244、种子下载器246、DSP匹配器250、和内容下载器252。
[0014]调度器238是负责使扫描器244的运行再发生的过程,其下面被描述。因为索引站点是集中式存储库并且持续反复的探查能够导致调度器238被禁止访问索引站点,所以用于于从BitTorrent管理页面进行种子文件发现的批处理是有利的。照此,调度器238可以通过分批访问BitTorrent管理页面来最小化BitTorrent管理页面上的足迹,从而跨过BitTorrent管理页面交错访问以最大化每个站点访问与每个站点节流(throttling)之间的时间。由调度器238限定的每个进度表可以具有配置项目,诸如递归值(例如,每X小时、开始/停止日期)、扫描的类型(RSS、搜索、走动、输入等)和扫描类型输入源值(例如,对于RSS =RSS馈送的列表;对于搜索:索引站点的列表;对于走动:索引站点的列表;以及对于输入:输入协议源)。调度器238可以由终端用户(例如使用客户端105的管理员)来管理。
[0015](一个或多个)扫描器244是负责从各种BitTorrent“管理页面”类型发现种子文件的过程。这些管理页面提供关于如何寻找种子文件的标记,并且可以包含索引网站、跟踪器站点、RSS馈送等。每个扫描器244被配置成根据BitTorrent管理页面的语法和/或格式来扫描BitTorrent管理页面。例如,索引站点可以具有与RSS馈送不同的语法和/或格式,或甚至可以具有不同于另一个索引站点的格式。照此,扫描器244被配置成与具有不同的语法和/或格式的各种不同的BitTorrent管理页面相互作用。
[0016]每个扫描器244可以例如利用客户端105从用户接收一组感兴趣的搜索项(这里称为数字签名简档(DSP)搜索项)。DSP搜索项然后被用来以下面更详细地描述的方式针对相关联的种子扫描相关联的类型的BitTorrent管理页面。
[0017]扫描器244可以包含“索引扫描器”(IS),IS被设计成扫描具有索引站点类型的BitTorrent管理页面。特别地,IS 244可以使用特定的DSP搜索项在索引站点上搜索种子。IS 244的搜索能力受由索引站点实施和面临(expose)的索引算法约束。例如,更复杂的索引站点允许由普及性、由时间性、由风格等准予(qualify)的搜索,而不太复杂的索引站点仅可以通过上载时间和种子文件名称的查找索引来将结果分类。其它可用的索引准则可以包含种子文件名称、内容文件名称、描述和元数据。IS 244能够形成含有配置的DSP项目的站点特定的URL。每个项目例如可以要求每个索引站点的一个搜索请求。
[0018]扫描器244也可以包含“RSS扫描器”(RSSS),RSSS特别企图发现由RSS馈送公布的可用种子。RSSS接触(一个或
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1