一种统一资源定位符url分类方法及装置的制造方法

文档序号:10553085阅读:231来源:国知局
一种统一资源定位符url分类方法及装置的制造方法
【专利摘要】本发明的实施例提供一种统一资源定位符URL分类方法及装置,涉及互联网技术领域,能够根据访问URL的用户的分类标签获取URL的分类标签。包括:获取访问用户的用户分类标签,访问用户为访问目标URL的用户;根据访问用户的用户分类标签获取目标URL的分类标签。本发明用于统一资源定位符URL分类。
【专利说明】
一种统一资源定位符URL分类方法及装置
技术领域
[0001] 本发明涉及互联网技术领域,尤其涉及一种统一资源定位符URL分类方法及装置。
【背景技术】
[0002] 随着网络的迅速发展,万维网(英文全称:World Wide Web)成为大量信息的载体, 如何有效地提取并利用这些信息成为一个巨大的挑战。资源定位符(英文全称:Uniform Resource Locator,英文简称:URL)是对可以从互联网上得到的资源的位置和访问方法的 一种简洁的表示,是互联网上标准资源的地址,可以用来标示网络资源。在对网络进行访问 的过程中,经常需要对URL进行分类,以便于根据用户的需求提供特定类型的网络资源。由 于网络资源以网页为主,而网页通常以文字信息为主,因此可以通过抽取URL对应网页中的 文字信息,并由人工识别所抽取文字信息的类型,从而对URL进行分类。
[0003] 近年来由于网络技术的进一步发展,网络中网络资源刷新的速度越来越快,需要 进行分类的URL的数量也越来越多,在这种情况下,人工识别的方式进行URL分类的方法成 本与用时增加较多,效率极大降低,已无法满足现有需求。为了解决上述问题,一般通过网 络爬虫(英文全称:web crawler)技术对特定主题的网络资源进行抓取,并进一步对所抓取 网络资源按照预设策略进行分析与处理,从而获取网络资源对应URL的分类,如获取所抓取 网络资源的关键字,并按照一定算法根据关键字获取该网络资源的对应URL的分类。如附图 1所示,本发明的实施例提供了一种统一资源定位符URL分类方法,包括:
[0004] 101、通过网络爬虫技术对特定主题的网络资源进行抓取。
[0005] 102、根据预置算法过滤与特定主题无关的网络资源。
[0006] 103、按照预设策略分析并处理经过滤的网络资源以获取对应URL的分类。
[0007] 但在上述过程中,由于通过网络爬虫技术对URL进行分类的工作流程较为复杂,此 外需要搭建爬虫服务器,并且在对特定主题的网络资源进行抓取后,需要根据预置算法处 理所抓取的网络资源,以过滤与特定主题无关的网络资源,之后还需要按照预设策略分析 并处理经过滤的网络资源,从而获取网络资源对应URL的分类,因此上述技术方案中对URL 进行分类的方法需要对与URL对应的网络资源进行过滤、分析及处理,消耗了较多的处理资 源,从而提高了对URL进行分类的成本。

【发明内容】

[0008] 本申请提供一种统一资源定位符URL分类方法及装置,能够根据访问URL的用户的 分类标签获取URL的分类标签,从而降低了对URL进行分类的成本。
[0009] 第一方面,本发明的实施例提供了一种统一资源定位符URL分类方法,包括:获取 访问用户的用户分类标签,访问用户为访问目标URL的用户;根据访问用户的用户分类标签 获取目标URL的分类标签。
[0010] 第二方面,本发明的实施例提供了一种统一资源定位符URL分类装置,包括:调用 模块,用于获取目标URL,并根据目标URL获取访问用户的用户分类标签,访问用户为访问目 标URL的用户;分析模块,用于根据访问用户的用户分类标签获取目标URL的分类标签。
[0011] 本发明实施例所提供的一种统一资源定位符URL分类方法及装置,通过获取访问 目标URL的用户即访问用户的用户分类标签,从而获取访问目标URL用户对具有哪些分类标 签,并根据该用户分类标签获取目标URL的分类标签,即根据访问用户具有的选定分类标签 的URL存在访问倾向,获取该用户请求访问的目标URL的分类标签,从而对该目标URL进行分 类。因此本发明实施例所提供的一种统一资源定位符URL分类方法在无需对URL对应的网络 资源进行分析或处理的前提下,能够根据访问目标URL的用户的分类标签获取该目标URL的 分类标签,达到对该URL进行分类的目的,从而降低了对URL进行分类的成本,改善了用户体 验。
【附图说明】
[0012] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例描述 中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些 实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附 图获得其他的附图。
[0013] 图1为现有技术提供的一种统一资源定位符URL分类方法的示意性流程图;
[0014]图2为本发明的另一实施例所提供的一种统一资源定位符URL分类方法的示意性 流程图;
[0015] 图3为本发明的另一实施例所提供的一种统一资源定位符URL分类方法的示意性 流程图;
[0016] 图4为本发明的实施例所提供的一种统一资源定位符URL分类装置的示意性结构 图。
【具体实施方式】
[0017] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
[0018] 为了便于清楚描述本发明实施例的技术方案,在本发明的实施例中,采用了"第 一"、"第二"等字样对功能和作用基本相同的相同项或相似项进行区分,本领域技术人员可 以理解"第一"、"第二"等字样并不是在对数量和执行次序进行限定。
[0019] 针对上述问题,如附图2所示,本发明的实施例提供了一种统一资源定位符URL分 类方法,包括:
[0020] 201、获取访问用户的用户分类标签。
[0021]其中,访问用户为访问目标URL的用户。
[0022]具体的,通过监听用户访问目标URL的请求获取访问用户待访问的目标URL,也可 以从其他装置中系统中获取待分类的目标URL,目标URL为需要进行分类的URL,访问用户可 以为正在访问目标URL的用户,也可以为存在对目标URL访问记录的用户。用户分类标签与 用户相对应,并且与用户对应的用户分类标签可以是根据用户访问过URL的分类标签来获 取,也可以是根据用户从系统提供的喜好(或者关注订阅)选项的选择结果得到。
[0023]关于用户对应的用户分类标签可以是根据用户访问过URL的分类标签来获取,示 例性的,第一用户与第二用户均有访问URL的记录。第一用户分类标签包括第一用户访问过 的URL的分类标签,第一用户分类标签包括:财经、体育、影视、购物、汽车。第二用户分类标 签包括第二用户访问过的URL的分类标签,第二用户分类标签包括:财经、体育、影视、出游、 团购。
[0024] 202、根据访问用户的用户分类标签获取目标URL的分类标签。
[0025]其中,根据访问用户的用户分类标签获取目标URL的分类标签,可以为直接将访问 用户的用户分类标签所标识的分类标签作为目标URL的分类标签,也可以按照预置规则从 目标URL的访问用户的用户分类标签中选取一个或多个分类标签作为目标URL的分类标签。 示例性的,根据访问用户的用户分类标签所指示的分类标签集合中筛选出计数值最高的前 M个分类标签或单位时间内访问频率最高的前M个分类标签。
[0026]本发明实施例所提供的一种统一资源定位符URL分类方法,通过获取访问目标URL 的用户即访问用户的用户分类标签,并根据该用户分类标签获取目标URL的分类标签。因此 本发明实施例所提供的一种统一资源定位符URL分类方法在无需对URL对应的网络资源进 行分析或处理的前提下,能够根据访问URL的用户的分类标签获取URL的分类标签,达到对 URL进行分类的目的,从而降低了对URL进行分类的成本,改善了用户体验。
[0027]具体的,如附图3所示,本发明的实施例提供了一种统一资源定位符URL分类方法, 包括:
[0028] 301、获取访问用户的用户分类标签,所述访问用户为访问目标URL的用户。
[0029] 参照上述实施例中步骤201,在此不再赘述。
[0030] 302、判断URL特征基础库是否包括目标URL。
[0031] 其中,URL特征基础库包括URL以及与URL对应的分类标签,获取URL特征基础库可 以通过人工识别或从其他装置处获取指定的URL以及与该指定的URL对应的分类标签,并根 据指定的URL以及与该指定的URL对应的分类标签生成URL特征基础库。
[0032] 当确定URL特征基础库包括目标URL,执行步骤303;
[0033] 当确定URL特征基础库不包括目标URL,执行步骤305。
[0034] 303、根据URL特征基础库以及目标URL获取目标URL的分类标签。
[0035] 当URL特征基础库包括目标URL时,指URL特征基础库已记录有该目标URL的分类标 签信息,从而直接达到对目标URL分类的目的。
[0036] 304、根据目标URL的分类标签更新访问用户的用户分类标签。
[0037]根据步骤303中获取的目标URL的分类标签,更新访问目标URL的用户即访问用户 的用户分类标签。
[0038] 305、判断URL特征库是否包括目标URL。
[0039]具体的,URL特征库包括URL、与URL对应的分类标签以及与URL的分类标签对应的 计数值。URL特征库可以根据访问URL用户的用户分类标签所获取,也可以从其他装置处获 取。其中URL特征库中的URL可以为用户访问过的一个URL,该用户可以为访问用户,与URL对 应的分类标签可以为访问过该URL用户的用户分类标签的集合,与URL的分类标签对应的计 数值可以为访问过该URL的用户对应分类标签重叠次数的计数值。
[0040]示例性的,第一用户与第二用户访问过第一URL。第一用户的用户分类标签包括: 财经、体育、影视、购物、汽车。第二用户的用户分类标签包括:财经、体育、影视、出游、团购。 如下表所示,根据访问第一 URL用户的用户分类标签,URL特征库可以为:
[0042]当确定URL特征库存在并包括目标URL时执行步骤306;当确定URL特征库不包括目 标URL即确定URL特征库不存在或URL特征库存在但该URL特征库中不包括目标URL时,执行 步骤307。
[0043] 306、根据访问用户的用户分类标签更新URL特征库,即在URL特征库中更新目标 URL的分类标签以及与目标URL的分类标签对应的计数值,以获取更新后的URL特征库。 [0044] 其中,当确定URL特征库存在并包括目标URL时,URL特征库中包括目标URL、与目标 URL对应的分类标签以及与目标URL的分类标签对应的计数值,根据访问用户的用户分类标 签在URL特征库中更新目标URL的分类标签以及与目标URL的分类标签对应的计数值。
[0045] 具体的,可以根据访问用户的用户分类标签按照预设计数长度在URL特征库中更 新与目标URL的分类标签对应的计数值。
[0046] 示例性的,目标用户的用户分类标签包括:财经、体育、影视、购物、汽车。URL特征 库中目标URL的分类标签及与目标URL的分类标签对应的计数值如下表所示
[0048]根据目标用户的用户分类标签对URL特征库进行更新,更新后的URL特征库中目标 URL的分类标签及与目标URL的分类标签对应的计数值如下表所示:
[0050] 307、根据访问用户的用户分类标签在URL特征库中添加目标URL,将目标URL的分 类标签设置为访问用户的用户分类标签,并将URL特征库中与目标URL的分类标签对应的计 数值设置为初始值。
[0051 ] 具体的,当确定URL特征库不存在时,或确定URL特征库存在但该URL特征库中不包 括目标URL时,根据访问用户的用户分类标签在URL特征库中添加目标URL、目标URL的分类 标签以及与目标URL的分类标签对应的计数值,其中将与目标URL的分类标签对应的计数值 设置为初始值,以获取更新后的URL特征库,从而将具有访问用户的用户分类标签的用户对 目标URL的访问记录在更新后的URL特征库中。
[0052] 308、根据更新后的URL特征库获取URL选定分类标签。
[0053]其中,URL选定分类标签包括访问用户访问过的URL的分类标签中计数值最多的前 M个分类标签,M为大于0的自然数。
[0054]具体的,当URL特征库中URL对应的分类标签过多时,会造成URL特征库过大或根据 URL特征库所获取的目标URL对应的分类标签超出对URL分类需求,从而在对目标URL分类过 程中消耗过多的储存资源与处理资源,因此在更新后的URL特征库中取访问用户访问过的 URL的分类标签中计数值最多的前M个分类标签作为URL选定分类标签,从而在能够体现访 问对应URL的用户的访问倾向的前提下,降低目标URL分类过程中对储存资源与处理资源的 消耗。
[0055]优选的,当访问用户访问过的URL的分类标签的数量为N,则0<M<N,其中M的值根 据系统或用户需要可以自由设定。
[0056]需要说明的是,当更新后的URL特征库中包括K个计数值相同的分类标签且该K个 分类标签计数值最多,且K>M时,按照预置的优先顺序从K个计数值相同的分类标签中取M个 分类标签作为URL选定分类标签。
[0057]优选的,M=l。
[0058] 309、将URL选定分类标签作为目标URL的分类标签。
[0059]具体的,将在步骤308中获取的URL选定分类标签作为目标URL的分类标签,从而完 成对目标URL的分类。
[0060]本发明实施例所提供的一种统一资源定位符URL分类方法,通过获取目标URL,并 根据目标URL获取访问目标URL的用户即访问用户的用户分类标签,从而获取访问目标URL 用户对具有哪些分类标签的URL存在访问记录;在URL特征基础库包括目标URL时,根据URL 特征基础库以及目标URL获取目标URL的分类标签,并根据目标URL的分类标签更新访问用 户的用户分类标签,从而通过更新用户分类标签标识更新对应用户的访问记录,在URL特征 基础库不包括目标URL时,确定URL特征库是否包括目标URL,并确定URL特征库存在并包括 目标URL时根据访问用户的用户分类标签在URL特征库中更新目标URL的分类标签以及与目 标URL的分类标签对应的计数值,从而将具有访问用户的用户分类标签的用户对目标URL的 访问记录在更新后的URL特征库中;确定URL特征库不存在或URL特征库存在但该URL特征库 中不包括目标URL时根据访问用户的用户分类标签在URL特征库中添加目标URL、目标URL的 分类标签以及与目标URL的分类标签对应的计数值,从而将具有访问用户的用户分类标签 的用户对目标URL的访问记录在更新后的URL特征库中,之后根据更新后的URL特征库获取 URL选定分类标签,从而在能够体现访问对应URL的用户的访问倾向的前提下,降低目标URL 分类过程中对储存资源与处理资源的消耗。最后根据URL选定分类标签获取目标URL的分类 标签,从而根据访问用户对具有哪些分类标签的URL存在访问倾向获取目标URL的分类标 签,从而对目标URL进行分类。因此本发明实施例所提供的一种统一资源定位符URL分类方 法在无需对URL对应的网络资源进行分析或处理的前提下,能够根据访问URL的用户的分类 标签获取URL的分类标签,达到对URL进行分类的目的,从而降低了对URL进行分类的成本, 改善了用户体验。
[0061]如附图4所示,本发明的实施例提供了一种统一资源定位符URL分类装置401,包 括:
[0062]调用模块411,用于获取访问用户的用户分类标签。
[0063]其中,访问用户为访问目标URL的用户。
[0064]具体的,目标URL为需要进行分类的URL,访问用户可以为正在访问目标URL的用 户,也可以为存在对目标URL访问记录的用户。获取目标URL可以通过监听用户访问目标URL 的请求,也可以从其他装置中系统中获取,用户分类标签与用户相对应,并且与用户对应的 用户分类标签包括该用户访问过URL的分类标签,其中该用户访问过URL的分类标签可以包 括该用户访问过的URL对应的分类标签的集合,用户访问过URL的分类标签也可以包括该用 户访问过的URL对应的分类标签以及对应分类标签的计数值,该用户访问过URL的分类标签 也可以包括该用户访问过的URL对应的分类标签以及对应分类标签的单位时间内访问频 率;
[0065]分析模块412,用于根据访问用户的用户分类标签获取目标URL的分类标签。
[0066]其中,根据访问用户的用户分类标签获取目标URL的分类标签,可以为直接将访问 用户的用户分类标签所标识的分类标签作为目标URL的分类标签,也可以按照预置规则从 访问用户的用户分类标签所表示的分类标签中选取一个或多个分类标签作为目标URL的分 类标签。
[0067]本发明实施例所提供的一种统一资源定位符URL分类装置,通过调用模块获取获 取访问目标URL的用户即访问用户的用户分类标签,从而获取访问目标URL用户对具有哪些 分类标签的URL存在访问记录,并通过分析模块根据该用户分类标签获取目标URL的分类标 签,即根据访问用户具有的选定分类标签的URL存在访问倾向,获取该用户请求访问的目标 URL的分类标签,从而对目标URL进行分类。因此本发明实施例所提供的一种统一资源定位 符URL分类装置在无需对URL对应的网络资源进行分析或处理的前提下,能够根据访问URL 的用户的分类标签获取URL的分类标签,达到对URL进行分类的目的,从而降低了对URL进行 分类的成本,改善了用户体验。
[0068]具体的,分析模块412具体用于判断URL特征基础库是否包括目标URL。
[0069] 其中,URL特征基础库包括URL以及与URL对应的分类标签,获取URL特征基础库可 以通过人工识别或从其他装置处获取指定的URL以及与该指定的URL对应的分类标签,并根 据指定的URL以及与该指定的URL对应的分类标签生成URL特征基础库。
[0070] 当确定URL特征基础库包括目标URL,分析模块412根据URL特征基础库以及目标 URL获取目标URL的分类标签,并根据目标URL的分类标签更新访问用户的用户分类标签。
[0071] 当URL特征基础库包括目标URL时,指URL特征基础库已记录有该目标URL的分类信 息,因此可以根据URL特征基础库以及目标URL获取目标URL的分类标签,从而达到对目标 URL分类的目的。之后根据获取的目标URL的分类标签,更新访问目标URL的用户即访问用户 的用户分类标签,从而在访问用户的用户分类标签中体现访问用户对具有目标URL的分类 标签的URL进行过访问。
[0072]当确定URL特征基础库不包括目标URL,分析模块412判断URL特征库是否包括目标 URL〇
[0073]具体的,URL特征库包括URL、与URL对应的分类标签以及与URL的分类标签对应的 计数值。URL特征库可以根据访问URL用户的用户分类标签所获取,也可以从其他装置处获 取。其中URL特征库中的URL可以为用户访问过的一个URL,该用户可以为访问用户,与URL对 应的分类标签可以为访问过该URL用户的用户分类标签的集合,与URL的分类标签对应的计 数值可以为用户访问过对应分类标签的URL的计数值。
[0074]示例性的,第一用户与第二用户访问过第一URL。第一用户的用户分类标签包括: 财经、体育、影视、购物、汽车。第二用户的用户分类标签包括:财经、体育、影视、出游、团购。 如下表所示,根据访问第一 URL用户的用户分类标签,URL特征库中包括的第一 URL信息可以 为:
[0076] URL特征库可以为预先设置,也可以在确定不存在URL特征库后根据访问用户的用 户分类标签生成。
[0077]当确定URL特征库存在并包括目标URL时,根据访问用户的用户分类标签更新URL 特征库,即在URL特征库中更新目标URL的分类标签以及与目标URL的分类标签对应的计数 值,以获取更新后的URL特征库。
[0078] 其中,当确定URL特征库存在并包括目标URL时,URL特征库中包括目标URL、与目标 URL对应的分类标签以及与目标URL的分类标签对应的计数值,即URL特征库中已记载访问 过目标URL用户的用户分类标签,以及与访问过目标URL用户的分类标签对应的计数值。因 此根据访问用户的用户分类标签在URL特征库中更新目标URL的分类标签以及与目标URL的 分类标签对应的计数值,从而将具有访问用户的用户分类标签的用户对目标URL的访问记 录在更新后的URL特征库中。
[0079] 具体的,可以根据访问用户的用户分类标签按照预设计数长度在URL特征库中更 新与目标URL的分类标签对应的计数值。
[0080] 示例性的,目标用户的用户分类标签包括:财经、体育、影视、购物、汽车。URL特征 库中目标URL的分类标签及与目标URL的分类标签对应的计数值如下表所示
[0081]
[0082]根据目标用户的用户分类标签对URL特征库进行更新,更新后的URL特征库中目标 URL的分类标签及与目标URL的分类标签对应的计数值如下表所示:
[0084] 当确定URL特征库不包括目标URL即确定URL特征库不存在或URL特征库存在但该 URL特征库中不包括目标URL时,根据访问用户的用户分类标签在URL特征库中添加目标 URL、目标URL的分类标签以及与目标URL的分类标签对应的计数值,以获取更新后的URL特 征库。
[0085] 具体的,当确定URL特征库中不包括目标URL时,在URL特征库中添加目标URL,并且 将访问用户的用户分类标签设置为目标URL的分类标签,其中将与目标URL的分类标签对应 的计数值设置为初始值(例如1,,也可以是2或者3,具体不作限定),以获取更新后的URL特 征库。
[0086]分析模块412根据更新后的URL特征库获取URL选定分类标签,并将URL选定分类标 签作为目标URL的分类标签,从而完成对目标URL的分类。
[0087]其中,URL选定分类标签包括所述URL特征库中所述目标URL的分类标签中计数值 最高的前M个分类标签,M为大于0的自然数。
[0088]具体的,当URL特征库中URL对应的分类标签过多时,会造成URL特征库过大或根据 URL特征库所获取的目标URL对应的分类标签超出对URL分类需求,从而在对目标URL分类过 程中消耗过多的储存资源与处理资源,因此在更新后的URL特征库中取访问用户访问过的 URL的分类标签中计数值最多的前M个分类标签作为URL选定分类标签,从而在能够体现访 问对应URL的用户的访问倾向的前提下,降低目标URL分类过程中对储存资源与处理资源的 消耗。
[0089] 优选的,当访问用户访问过的URL的分类标签的数量为N,则且0<M<N,其中M的值 根据系统或用户需要可以自由设定;
[0090] 需要说明的是,当更新后的URL特征库中包括K个计数值相同的分类标签且该K个 分类标签计数值最多,且K>M时,按照预置的优先顺序从K个计数值相同的分类标签中取M个 分类标签作为URL选定分类标签。
[0091]优选的,M=l。
[0092]本发明实施例所提供的一种统一资源定位符URL分类装置,通过调用模块获取访 问目标URL的用户即访问用户的用户分类标签,通过分析模块确定URL特征库是否包括目标 URL,并在确定URL特征库存在并包括目标URL时通过分析模块根据访问用户的用户分类标 签在URL特征库中更新目标URL的分类标签以及与目标URL的分类标签对应的计数值,从而 将具有访问用户的用户分类标签的用户对目标URL的访问记录在更新后的URL特征库中;在 确定URL特征库不存在或URL特征库存在但该URL特征库中不包括目标URL时,通过分析模块 根据访问用户的用户分类标签在URL特征库中添加目标URL、目标URL的分类标签以及与目 标URL的分类标签对应的计数值,从而将具有访问用户的用户分类标签的用户对目标URL的 访问倾向在更新后的URL特征库中,之后根据更新后的URL特征库获取URL选定分类标签,从 而在能够体现访问对应URL的用户的访问倾向的前提下,降低目标URL分类过程中对储存资 源与处理资源的消耗。最后通过分析模块根据URL选定分类标签获取目标URL的分类标签, 从而根据访问用户对具有哪些分类标签的URL存在访问倾向获取目标URL的分类标签,从而 对目标URL进行分类。因此本发明实施例所提供的一种统一资源定位符URL分类装置在无需 对URL对应的网络资源进行分析或处理的前提下,能够根据访问URL的用户的分类标签获取 URL的分类标签,达到对URL进行分类的目的,从而降低了对URL进行分类的成本,改善了用 户体验。
[0093]通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可以 用硬件实现,或固件实现,或它们的组合方式来实现。当使用软件实现时,可以将上述功能 存储在计算机可读介质中或作为计算机可读介质上的一个或多个指令或代码进行传输。计 算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一 个地方传送计算机程序的任何介质。存储介质可以是计算机能够存取的任何可用介质。以 此为例但不限于:计算机可读介质可以包括随机存储器(英文全称:Random Access Memory,英文简称:RAM)、只读存储器(英文全称:Read Only Memory,英文简称:ROM)、电可 擦可编程只读存储器(英文全称:Electrically Erasable Programmable Read Only Memory,英文简称:EEPR0M)、只读光盘(英文全称:Compact Disc Read Only Memory,英文 简称:CD-ROM)或其他光盘存储、磁盘存储介质或者其他磁存储设备、或者能够用于携带或 存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质。此 外。任何连接可以适当的成为计算机可读介质。例如,如果软件是使用同轴电缆、光纤光缆、 双绞线、数字用户专线(英文全称:Digital Subscriber Line,英文简称:DSL)或者诸如红 外线、无线电和微波之类的无线技术从网站、服务器或者其他远程源传输的,那么同轴电 缆、光纤光缆、双绞线、DSL或者诸如红外线、无线和微波之类的无线技术包括在计算机可读 介质的定义中。
[0094]通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,当以软件 方式实现本发明时,可以将用于执行上述方法的指令或代码存储在计算机可读介质中或通 过计算机可读介质进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信 介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是计算 机能够存取的任何可用介质。以此为例但不限于:计算机可读介质可以包括RAM、R0M、电可 擦可编程只读存储器(全称:electrically erasable programmable read-only memory, 简称:EEPROM)、光盘、磁盘或者其他磁存储设备、或者能够用于携带或存储具有指令或数据 结构形式的期望的程序代码并能够由计算机存取的任何其他介质。
[0095]以上所述,仅为本发明的【具体实施方式】,但本发明的保护范围并不局限于此,任何 熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵 盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
【主权项】
1. 一种统一资源定位符URL分类方法,其特征在于,包括: 获取访问用户的用户分类标签,所述访问用户为访问目标URL的用户; 根据所述访问用户的用户分类标签获取所述目标URL的分类标签。2. 根据权利要求1所述的URL分类方法,其特征在于,所述根据所述访问用户的用户分 类标签获取所述目标URL的分类标签,包括: 根据所述访问用户的用户分类标签更新URL特征库,所述URL特征库包括URL、URL的分 类标签以及与URL的分类标签对应的计数值; 从更新后的URL特征库获取所述目标URL的分类标签。3. 根据权利要求2所述的URL分类方法,其特征在于,根据所述访问用户的用户分类标 签获取URL特征库,包括: 当所述URL特征库包括所述目标URL时,根据所述访问用户的用户分类标签更新所述 URL特征库中所述目标URL的分类标签,并更新所述URL特征库中与所述目标URL的分类标签 对应的计数值; 当所述URL特征库不包括所述目标URL时,在所述URL特征库中添加所述目标URL,将所 述目标URL的分类标签设置为所述访问用户的用户分类标签,并将所述URL特征库中与所述 目标URL的分类标签对应的计数值设置为初始值。4. 根据权利要求2或3所述的URL分类方法,其特征在于,所述从更新后的URL用户特征 库获取所述目标URL的分类标签,包括: 根据所述更新后的URL特征库获取所述目标URL的选定分类标签,所述目标URL的选定 分类标签包括所述URL特征库中所述目标URL的分类标签中计数值最高的前M个分类标签,M 为大于O的自然数; 将所述URL选定分类标签作为所述目标URL的分类标签。5. 根据权利要求4所述的URL分类方法,其特征在于: 当所述更新后的URL特征库中访问用户访问过的目标URL的分类标签的数量为N时,则O KN06. -种统一资源定位符URL分类装置,其特征在于,包括: 调用模块,用于获取访问用户的用户分类标签,所述访问用户为访问目标URL的用户; 分析模块,用于根据所述访问用户的用户分类标签获取所述目标URL的分类标签。7. 根据权利要求6所述的URL分类装置,其特征在于,所述分析模块具体用于: 根据所述访问用户的用户分类标签更新URL特征库,所述URL特征库包括URL、URL的分 类标签以及与URL的分类标签对应的计数值; 从更新后的URL特征库获取所述目标URL的分类标签。8. 根据权利要求7所述的URL分类装置,其特征在于,所述分析模块具体用于: 当所述URL特征库包括所述目标URL时,根据所述访问用户的用户分类标签更新所述 URL特征库中所述目标URL的分类标签,并更新所述URL特征库中与所述目标URL的分类标签 对应的计数值; 当所述URL特征库不包括所述目标URL时,在所述URL特征库中添加所述目标URL,将所 述目标URL的分类标签设置为所述访问用户的用户分类标签,并将所述URL特征库中与所述 目标URL的分类标签对应的计数值设置为初始值。9. 根据权利要求7或8所述的URL分类装置,其特征在于,所述分析模块具体用于: 根据所述更新后的URL特征库获取所述目标URL的选定分类标签,所述目标URL的选定 分类标签包括所述URL特征库中所述目标URL的分类标签中计数值最高的前M个分类标签,M 为大于O的自然数; 将所述URL选定分类标签作为所述目标URL的分类标签。10. 根据权利要求9所述的URL分类装置,其特征在于: 当所述更新后的URL特征库中访问用户访问过的目标URL的分类标签的数量为N时,则0 KN0
【文档编号】G06F17/30GK105912736SQ201610488352
【公开日】2016年8月31日
【申请日】2016年6月28日
【发明人】朱臣
【申请人】迈普通信技术股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1