一种网页分类方法及装置的制造方法

文档序号:8498684阅读:169来源:国知局
一种网页分类方法及装置的制造方法
【技术领域】
[0001] 本发明涉及网络通信技术领域,尤其涉及一种网页分类方法及装置。
【背景技术】
[0002] 随着万维网的飞速发展,用户对网页访问控制的要求越来越高,导致对网页分类 的需求也在不断提高,然而目前网页域名的分类主要是通过比较各个网站的host字段来 实现,常见的应用场景如:用户要求只能访问163网站,其它网站都不能访问;实现方法是 通过比较host字段是否包含163.com",如果包括,就可以访问;如果不包括,就无法访 问,但是,163网站还包括一些*.126.com和*.netease.com的域名,因此产生了实现效率 低、准确性低的问题,同时也不利于域名的维护。
[0003] 因此,提供一种网页分类方案,能够更准确的对网页进行分类,便于对用户访问页 面的高效控制,已成为亟待解决的问题。

【发明内容】

[0004] 有鉴于此,本发明实施例期望提供一种网页分类方法及装置,能够更准确的对网 页进行分类,便于对用户访问页面的高效控制,提高用户的体验感。
[0005] 为达到上述目的,本发明实施例的技术方案是这样实现的:
[0006] 本发明实施例提供了一种网页分类方法,所述方法包括:
[0007] 将网页的一级域名加入待分析域名列表,解析所述一级域名的跨域策略文件获得 一个或多个第一域名,依据获得的第一域名的级数将获得的第一域名加入所述待分析域名 列表,并依据预设的分类标准对所述一级域名进行分类;
[0008] 依据获得的第一域名的级数依次解析获得的第一域名的跨域策略文件获得一个 或多个第二域名,依据获得的第二域名的级数将获得的第二域名加入所述待分析域名列 表,并依据预设的分类标准对获得的第一域名进行分类,直至依据预设的分类标准对当前 的域名进行分类后,确定所述待分析域名列表中域名的级数不小于约定的级数时,依次对 所述待分析域名列表中待处理的域名进行跨域策略文件的解析及域名的分类,且对解析得 到的域名级数大于所述约定的级数的域名不作处理,得到域名分类关系表。
[0009] 上述方案中,所述依据获得的第一域名的级数将获得的第一域名加入所述待分析 域名列表包括:
[0010] 判断第一域名的父域名是否在所述待分析域名列表中,如果存在,直接依据所述 第一域名的级数将所述第一域名加入所述待分析域名列表;如果不存在,依据所述第一域 名的父域名的级数将所述第一域名的父域名加入所述待分析域名列表,然后依据所述第一 域名的级数将所述第一域名加入所述待分析域名列表。
[0011] 上述方案中,所述依据预设的分类标准对当前的域名进行分类包括:
[0012] 判断当前的域名是否为网页辅助资源域名,如果是,将当前的域名加入网页辅助 资源域名列表;否则,判断当前的域名是否为根域名或所述根域名的别名,如果是根域名, 将当前的域名加入根域名列表,如果是所述根域名的别名,将当前的域名加入所述根域名 的别名列表;如果既非根域名,也非所述根域名的别名,则判断当前的列表中是否存在当前 域名的父域名,如果存在,则将当前的域名加入所述父域名的子域名列表;如果不存在,将 当前的域名加入平级域名列表。
[0013] 上述方案中,所述判断当前的域名是否为根域名或所述根域名的别名之前,所述 方法还包括:
[0014] 依据预设的网页内容分类标准对当前的域名对应的网页内容进行分类。
[0015] 上述方案中,所述得到域名分类关系表之后,所述方法还包括:
[0016] 依据得到的域名分类关系表以及预设的网页访问控制类型,对用户访问的网页数 据执行相应的访问控制。
[0017] 本发明实施例还提供了一种网页分类装置,所述装置包括:解析模块及分类模 块;
[0018] 所述解析模块,用于将网页的一级域名加入待分析域名列表,解析所述一级域名 的跨域策略文件获得一个或多个第一域名,依据获得的第一域名的级数将获得的第一域名 加入所述待分析域名列表;以及依据获得的第一域名的级数依次解析获得的第一域名的跨 域策略文件获得一个或多个第二域名,依据获得的第二域名的级数将获得的第二域名加入 所述待分析域名列表,直至分类模块依据预设的分类标准对当前的域名进行分类后,确定 所述待分析域名列表中域名的级数不小于约定的级数时,依次对所述待分析域名列表中待 处理的域名进行跨域策略文件的解析,且对解析得到的域名级数大于所述约定的级数的域 名不作处理;
[0019] 所述分类模块;用于依据预设的分类标准对所述一级域名及获得的第一域名进行 分类,直至依据预设的分类标准对当前的域名进行分类后,确定所述待分析域名列表中域 名的级数不小于约定的级数时,依次对所述待分析域名列表中待处理的域名进行分类,得 到域名分类关系表。
[0020] 上述方案中,所述解析模块,具体用于判断第一域名的父域名是否在所述待分析 域名列表中,如果存在,直接依据所述第一域名的级数将所述第一域名加入所述待分析域 名列表;如果不存在,依据所述第一域名的父域名的级数将所述第一域名的父域名加入所 述待分析域名列表,然后依据所述第一域名的级数将所述第一域名加入所述待分析域名列 表。
[0021] 上述方案中,所述分类模块,具体用于判断当前的域名是否为网页辅助资源域名, 如果是,将当前的域名加入网页辅助资源域名列表;否则,判断当前的域名是否为根域名或 所述根域名的别名,如果是根域名,将当前的域名加入根域名列表,如果是所述根域名的别 名,将当前的域名加入所述根域名的别名列表;如果既非根域名,也非所述根域名的别名, 则判断当前的列表中是否存在当前域名的父域名,如果存在,则将当前的域名加入所述父 域名的子域名列表;如果不存在,将当前的域名加入平级域名列表。
[0022] 上述方案中,所述分类模块,还用于依据预设的网页内容分类标准对当前的域名 对应的网页内容进行分类。
[0023] 上述方案中,所述装置还包括控制模块,用于依据得到的域名分类关系表以及预 设的网页访问控制类型,对用户访问的网页数据执行相应的访问控制。
[0024] 本发明实施例所提供的网页分类方法及装置,将网页的一级域名加入待分析域名 列表,解析所述一级域名的跨域策略文件获得一个或多个第一域名,依据获得的第一域名 的级数将获得的第一域名加入所述待分析域名列表,并依据预设的分类标准对所述一级域 名进行分类;依据获得的第一域名的级数依次解析获得的第一域名的跨域策略文件获得一 个或多个第二域名,依据获得的第二域名的级数将获得的第二域名加入所述待分析域名列 表,并依据预设的分类标准对获得的第一域名进行分类,直至依据预设的分类标准对当前 的域名进行分类后,确定所述待分析域名列表中域名的级数不小于约定的级数时,依次对 所述待分析域名列表中待处理的域名进行跨域策略文件的解析及域名的分类,且对解析得 到的域名级数大于所述约定的级数的域名不作处理,得到域名分类关系表;如此,能够更准 确、全面的对网页进行分类,便于对用户访问页面数据的高效控制,提高用户的体验感。
【附图说明】
[0025] 图1为本发明实施例一网页分类方法流程示意图;
[0026] 图2为本发明实施例二网页分类方法流程示意图;
[0027] 图3为本发明实施例约定级数为三级的域名分类关系表示意图;
[0028] 图4为本发明实施例网页分类装置组成结构示意图。
【具体实施方式】
[0029] 在本发明实施例中,将网页的一级域名加入待分析域名列表,解析所述一级域名 的跨域策略文件获得一个或多个第一域名,依据获得的第一域名的级数将获得的第一域名 加入所述待分析域名列表,并依据预设的分类标准对所述一级域名进行分类;依据获得的 第一域名的级数依次解析获得的第一域名的跨域策略文件获得一个或多个第二域名,依据 获得的第二域名的级数将获得的第二域名加入所述待分析域名列表,并依据预设的分类标 准对获得的第一域名进行分类,直至依据预设的分类标准对当前的域名进行分类后,确定 所述待分析域名列表中域名的级数不小于约定的级数时,依次对所述待分析域名列表中待 处理的域名进行跨域策略文件的解析及域名的分类,且对解析得到的域名级数大于所述约 定的级数的域名不作处理,得到域名分类关系表。
[0030] 图1为本发明实施例一网页分类方法流程示意图,如图1所示,本发明实施例网页 分类方法包括:
[0031] 步骤101 :将网页的一级域名加入待分析域名列表,解析所述一级域名的跨域策 略文件获得一个或多个第一域名,依据获得的第一域名的级数将获得的第一域名加入所述 待分析域名列表,并依据预设的分类标准对所述一级域名进行分类;
[0032] 这里,所述跨域策略文件(crossdomain,xml)是一种XML文档,旨在为Web客户 端,如Java、AdobeFlashPlayer、AdobeAcrobat、Silverl
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1