用于识别主网址的方法及装置的制造方法

文档序号:8381022阅读:169来源:国知局
用于识别主网址的方法及装置的制造方法
【技术领域】
[0001]本发明涉及通信技术领域,尤其涉及一种用于识别主网址的方法及装置。
【背景技术】
[0002]在用户访问一个网页时,通常会伴随有大量的http请求(即网址访问请求),每个请求对应一个网址,S卩对应一个URL(Uniform Resoure Locator:统一资源定位符),通常将用户主动访问的URL称为主网址,伴随此主网址的http请求而非主网址的URL称为次网址。在所述大量的http请求中只有一个http请求对应的URL是主网址。比如用户访问www.aaaa.com, www.aaaa.com S^http getiSK W www.aaaa.com是主网址。在很多情况下需要识别出主网址,以便有效执行URL防护、网购保护或恶意流量分析等操作。
[0003]现有的识别主网址的方法是利用IEdnternet Explorer,网页浏览器)流量提供的BH0(Browser Helper Object,浏览器辅助对象)插件机制,获取IE浏览器的主网址,利用BHO获取主网址方法虽然能判别出主网址,但是该技术仅仅针对IE浏览器有效,对其它浏览器无效,也就无法识别出非IE浏览器的主网址。

【发明内容】

[0004]本发明解决的技术问题之一是提供用于识别主网址的方法及装置,在兼容各种浏览器的情况下可准确识别出主网址。
[0005]根据本发明一方面的一个实施例,提供了一种用于识别主网址的方法,包括:
[0006]在接收到网址访问请求情况下,将所述网址加入访问队列;
[0007]判断所述访问队列开头的网址加入所述访问队列的时长是否达到预定时长;
[0008]若达到预定时长,则判断以所述访问队列开头的网址为来源的网址个数是否达到预定数量;
[0009]若达到预定数量,则确定所述访问队列开头的网址为主网址。
[0010]可选地,将所述网址加入访问队列包括:
[0011]以四元组标识所述网址并将其加入到访问队列,其中,所述四元组包括:网址,来源,服务器位置,加入访问队列的时间。
[0012]可选地,将所述网址加入访问队列包括:
[0013]按照由访问队列开头到结尾的顺序依此放置加入的网址。
[0014]可选地,所述预定时长为3秒。
[0015]可选地,所述预定数量为4个。
[0016]可选地,还包括:
[0017]基于网址的后缀,过滤掉非预定后缀的网址。
[0018]可选地,还包括:
[0019]基于预设的非主网址库,过滤掉与所述非主网址库中的网址相同的网址。
[0020]可选地,在执行所述判断以所述访问队列开头的网址为来源的网址个数是否达到预定数量的步骤之后,所述方法还包括:
[0021 ] 从所述访问队列中删除所述开头的网址。
[0022]根据本发明另一方面的一个实施例,提供了一种用于识别主网址的装置,包括:
[0023]用于在接收到网址访问请求情况下,将所述网址加入访问队列的单元;
[0024]用于判断所述访问队列开头的网址加入所述访问队列的时长是否达到预定时长的单元;
[0025]用于在访问队列开头的网址加入所述访问队列的时长达到预定时长情况下,判断以所述访问队列开头的网址为来源的网址个数是否达到预定数量的单元;
[0026]用于在以所述访问队列开头的网址为来源的网址个数达到预定数量情况下,确定所述访问队列开头的网址为主网址的单元。
[0027]可选地,用于在接收到网址访问请求情况下,将所述网址加入访问队列的单元用于:
[0028]以四元组标识所述网址并将其加入到访问队列,其中,所述四元组包括:网址,来源,服务器位置,加入访问队列的时间。
[0029]可选地,用于在接收到网址访问请求情况下,将所述网址加入访问队列的单元用于:
[0030]按照由访问队列开头到结尾的顺序依此放置加入的网址。
[0031]可选地,所述预定时长为3秒。
[0032]可选地,所述预定数量为4个。
[0033]可选地,还包括:
[0034]用于基于网址的后缀,过滤掉非预定后缀的网址的单元。
[0035]可选地,还包括:
[0036]用于基于预设的非主网址库,过滤掉与所述非主网址库中的网址相同的网址的单
J L.ο
[0037]可选地,还包括:
[0038]用于从所述访问队列中删除所述开头的网址的单元。
[0039]本申请实施例利用网址来源引用个数是否达到预定数量来识别是否为主网址,该方法可兼容所有浏览器,在保证对系统性能的影响的情况下准确识别出主网址,为基于主网址执行的相关操作提供条件。
[0040]本领域普通技术人员将了解,虽然下面的详细说明将参考图示实施例、附图进行,但本发明并不仅限于这些实施例。而是,本发明的范围是广泛的,且意在仅通过后附的权利要求限定本发明的范围。
【附图说明】
[0041]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
[0042]图1是根据本发明一个实施例的用于识别主网址的方法的流程图。
[0043]图2是根据本发明一个实施例的网址的referer关系树示意图。
[0044]图3是根据本发明另一个实施例的用于识别主网址的方法的流程图。
[0045]图4是根据本发明一个实施例的用于识别主网址的装置的结构示意图。
[0046]图5是根据本发明另一个实施例的用于识别主网址的装置的结构示意图。
[0047]附图中相同或相似的附图标记代表相同或相似的部件。
【具体实施方式】
[0048]在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
[0049]所述计算机设备包括用户设备与网络设备。其中,所述用户设备包括但不限于电脑、智能手机、PDA等;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,所述计算机设备可单独运行来实现本发明,也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本发明。其中,所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
[0050]需要说明的是,所述用户设备、网络设备和网络等仅为举例,其他现有的或今后可能出现的计算机设备或网络如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
[0051]后面所讨论的方法(其中一些通过流程图示出)可以通过硬件、软件、固件、中间件、微代码、硬件描述语言或者其任意组合来实施。当用软件、固件、中间件或微代码来实施时,用以实施必要任务的程序代码或代码段可以被存储在机器或计算机可读介质(比如存储介质)中。(一个或多个)处理器可以实施必要的任务。
[0052]这里所公开的具体结构和功能细节仅仅是代表性的,并且是用于描述本发明的示例性实施例的目的。但是本发明可以通过许多替换形式来具体实现,并且不应当被解释成仅仅受限于这里所阐述的实施例。
[0053]应当理解的是,虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元,但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说,在不背离示例性实施例的范围的情况下,第一单元可以被称为第二单元,并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。
[0054]应当理解的是,当一个单元被称为“连接”或“耦合”到另一单元时,其可以直接连接或耦合到所述另一单元,或者可以存在中间单元。与此相对,当一个单元被称为“直接连接”或“直接耦合”到另一单元时,则不存在中间单元。应当按照类似的方式来解释被用于描述单元之间的关系的其他词语(例如“处于…之间”相比于“直接处于…之间”,“与…邻近”相比于“与…直接邻近”等等)。
[0055]这里所使用的术语仅仅是为了描述具体实施例而不意图限制示例性实施例。除非上下文明确地另有所指,否则这里所使用的单数形式“一个”、“一项”还意图包括复数。还应当理解的是,这里所使用的术语“包括”和/或“包含”规定所陈述的特征、整数、步骤、操作、单元和/或组件的存在,而不排除存在或添加一个或更多其他特征、整数、步骤、操作、单元、组件和/或其组合。
[0056]还应当提到的是,在一些替换实现方式中,所提到的功能/动作可以按照不同于附图中标示的顺序发生。举例来说,取决于所涉及的功能/动作,相继示出的两幅图实际上可以基本上同时执行或者有时可以按照相反的顺序来执行。
[0057]下面结合附图对本发明作进一步详细描述。
[0058]图1是根据本发明一个实施例的用于识别主网址的方法的流程图。本发明中的方法主要通过计算机设备中的操作系统或处理控制器来完成。将操作系统或处理控制器称为用于识别主网址的装置。该计算机设备包括但不限于以下中的至少一个:用户设备、网络设备。用户设备包括但不限于计算机、智能手机、PDA等。网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算的由大量计算机或网络服务器构成的云,其中,云计算是分布式计
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1