一种黑链检测方法、装置和系统的制作方法

文档序号:7986488阅读:316来源:国知局
一种黑链检测方法、装置和系统的制作方法
【专利摘要】本发明实施方式提出了一种黑链检测方法、装置和系统。方法包括:接收针对统一资源定位符(URL)的访问请求,并下载对应该URL的网页文件;解析所述对应该URL的网页文件,以提取出包含于该网页文件中的外部链接URL;提取外部链接URL的域名,并根据所提取出的域名查询预先设置的域名信任度数据库,以确定外部链接URL中是否包含黑链。本发明实施方式实现了黑链的快速和自动检测,提高了黑链检测效率。
【专利说明】一种黑链检测方法、装置和系统【技术领域】
[0001]本发明实施方式涉及信息安全【技术领域】,更具体地,涉及一种黑链检测方法、装置和系统。
【背景技术】
[0002]随着计算机技术和网络技术的飞速发展,互联网(Internet)在人们的日常生活、学习和工作中发挥的作用也越来越大。互联网上的超媒体文档称之为网页(web page)。网页中通常包括有指向其他相关页面或其他节点的指针(超级链接)。在逻辑上将视为一个整体的一系列网页的有机集合称为网站(Website或Site)。
[0003]黑链又称暗链,是搜索引擎优化(Search Engine Optimization, SE0)手法中相当普遍的一种手段,是指用非正常手段获取其他网站的反向链接,最常见的手段就是通过各种网站服务器的漏洞获取其管理权限,进而在被黑网站上链接自己的网站。黑链是针对搜索引擎作弊的最快捷有效的方法之一,一般用于暴利的黑色产业,如各类游戏私服、外挂、医疗、色情、博彩等行业,而且已经逐步产业化。在实际应用中,被黑网站不仅有可能被植入黑链,还经常被植入各类恶意挂马代码,如果用户没有安装任何安全防护软件,那么打开此类被篡改的网页还很容易感染网站上的木马病毒。
[0004]在现有技术中,一般由网站管理人员人工收集篡改关键词和可疑外链,以判断其是否被黑链篡改。然而,这种人工处理方式严重依赖于人工收集的可疑关键词和定期的人工检查,对网站管理人员的专业知识也有较高要求,无法实现黑链的快速和自动检测,因此黑链检测效率不高。
[0005]而且,黑链通常使用一些手段使得黑链对用户不可见,如设定超小字体、字体颜色与背景色一致、位置参数设为网页可见范围之外、置于隐藏的div标签中(如〈divstyle=” display:n0ne”X/diV>)等,因此这也增加了人工鉴别黑链的难度。
【发明内容】

[0006]本发明实施方式提出一种黑链检测方法,从而提高黑链检测效率。
[0007]本发明实施方式还提出一种黑链检测装置,从而提高黑链检测效率。
[0008]本发明实施方式还提出一种黑链检测系统,从而提高黑链检测效率。
[0009]本发明实施方式的具体方案如下:
[0010]一种黑链检测方法,该方法包括:
[0011]接收针对统一资源定位符(URL)的访问请求,并下载对应该ULL的网页文件;
[0012]解析所述对应该URL的网页文件,以提取出包含于该网页文件中的外部链接URL ;
[0013]提取所述外部链接URL的域名,并根据所提取出的域名查询预先设置的域名信任度数据库,以确定所述外部链接URL中是否包含黑链
[0014]一种黑链检测装置,该装置包括访问请求接收单元、外部链接URL提取单元和黑链判定单元,其中:[0015]访问请求接收单元,用于接收针对URL的访问请求,并下载对应该URL的网页文件;
[0016]外部链接URL提取单元,用于解析所述对应该URL的网页文件,以提取出包含于该网页文件中的外部链接URL ;
[0017]黑链判定单元,用于提取所述外部链接URL的域名,并根据所提取出的域名查询预先设置的域名信任度数据库,以确定所述外部链接URL中是否包含黑链。
[0018]一种黑链检测系统,包括客户端和服务器,其中:
[0019]客户端,用于发出针对URL的访问请求,并将所述访问请求发送到服务器;
[0020]服务器,用于解析所述对应该URL的网页文件,以提取出包含于该网页文件中的外部链接URL,提取所述外部链接URL的域名,并根据所提取出的域名查询预先设置的域名信任度数据库,以确定所述外部链接URL中是否包含黑链。
[0021 ] 从上述技术方案可以看出,在本发明实施方式中,接收针对统一资源定位符(URL)的访问请求,并下载对应该URL的网页文件;解析所述对应该URL的网页文件,以提取出包含于该网页文件中的外部链接URL ;提取所述外部链接URL的域名,并根据所提取出的域名查询预先设置的域名信任度数据库,以确定所述外部链接URL中是否包含黑链。由此可见,应用本发明实施方式之后,可以根据页面外连的域名信任度值进行网页的黑链自动判断,从而实现了黑链的快速和自动检测,因此提高了黑链检测效率。
[0022]另外,可以针对黑链判定条件在客户端进行自行设置,因此本发明实施方式的灵活性高,也进一步提高了黑链检测效率。
【专利附图】

【附图说明】
[0023]图1为根据本发明实施方式的黑链检测方法流程图;
[0024]图2为根据本发明实施方式的域名信任度赋值示意图;
[0025]图3为根据本发明实施方式,在网络侧实现黑链检测的方法流程图;
[0026]图4为根据本发明实施方式的黑链检测装置结构图;
[0027]图5为根据本发明实施方式的黑链检测系统结构图。
【具体实施方式】
[0028]为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。
[0029]在本发明实施方式中,优选将外链URL所指网站的域名信任度值作为衡量原网站是否被黑链篡改的依据。具体地,域名信任度值描述了一个域名的安全程度,当一个域名下的恶意URL越多,其域名信任度值就越低。可以预先针对众多域名建立域名信任度数据库,其中可信任网站域名的域名信任度值一般较高,而包含有恶意URL较多的网站域名的域名信任度值一般较低。
[0030]图1为根据本发明实施方式的黑链检测方法流程图。
[0031]如图1所示,该方法包括步骤如下:
[0032]步骤101:接收针对统一资源定位符(URL)的访问请求,并下载对应该URL的网页文件。[0033]在这里,优选地,可以预先由客户端在本地发起针对URL的访问请求,而且客户端将该访问请求发送到位于网络侧的服务器。此时,由位于网络侧的服务器接收该针对URL的访问请求,并下载对应该URL的网页文件。
[0034]具体地,当用户在客户端期望访问某条URL时,比如,当用户在浏览器的地址栏中输入期望访问的URL时,客户端则发出针对该URL的访问请求,此时,安装在客户端上的检测单元(比如安装在客户端上的安全软件)截获到本次访问请求,则将该URL发送到位于云端的服务器进行检测,然后该服务器再下载该URL所对应的网页文件。
[0035]如,客户端可以包括但是不局限于:功能手机、智能手机、掌上电脑、个人电脑(PC)、平板电脑或个人数字助理(PDA),等等。
[0036]在这里,对应该URL的网页文件可以为多种形式的网页文件,比如HTML文件、JS文件或CSS文件,等等。
[0037]以上虽然详细罗列了客户端和网页文件的具体表现形式,本领域技术人员可以意识到,这种罗列仅是示范性的,并不用于对本发明实施方式的保护范围进行限定。
[0038]步骤102:解析所述对应该URL的网页文件,以提取出包含于该网页文件中的外部链接URL。
[0039]在这里,首先解析对应该URL的网页文件,以获取包含于该网页文件中的<a>标签;然后提取所获取的<a>标签的超文本引用(href)属性值;再从所提取的href属性值中剔除与该网页文件的本地域名相同的href属性值,并将剩余的href属性值作为包含于该网页文件中的外部链接URL。
[0040]具体地,可以从网页文件中提取所有外链,包括HTMLl文件中的<a>标签和js代码中通过document, write等方式写入的<a>标签等,并提取其中href属性对应的值,而且排除与当前所访问URL域名相同的href值。
[0041]比如:假设当前访问URL为http://www.a.com/ ;其页面包含以下3个<a>标签:
[0042]<a href =,,http://www.a.com/test, htm,,>
[0043]<a href = ” test, htm” >
[0044]<a href =,,http: //www.b.com/ ” >
[0045]由于〈a href =,,http://www.a.com/test, htm” > 和〈a href =,,test, htm,,>分别以绝对路径和相对路径的方式链接到本地站点的同一文件test.htm,因此最终只有http://www.b.com/被提取出来作为包含于该网页文件中的外部链接URL。
[0046]再比如,假设当前访问URL为http://www.a.com/ ;其页面包含以下5个<a>标签:
[0047]<a href =,,http://www.a.com/test, htm,,>
[0048]<a href = ” test, htm” >
[0049]<a href =,,http: //www.b.com/ ” >
[0050]<a href =,,http://www.c.com/test, htm,,>
[0051]<a href =,,http://www.d.com,,>
[0052]由于〈ahref =”http://www.a.com/test.htm,,> 和〈a href =,,test, htm” > 分别以绝对路径和相对路径的方式链接到本地站点的同一文件test, htm,最终只有http://www.b.com/>http://www.c.com/test, htm,http://www.d.com 这 3 个 URL 被提取出来作为包含于该网页文件中的外部链接URL。
[0053]步骤103:提取所述外部链接URL的域名,并根据所提取出的域名查询预先设置的域名信任度数据库,以确定所述外部链接URL中是否包含黑链。
[0054]在这里,首先从外部链接URL中提取域名。域名是由一串用点分隔的名字组成的Internet上某一台计算机或计算机组的名称,用于在数据传输时标识计算机的电子方位。可以提取的域名分为不同级别,包括顶级域名、二级域名、三级域名等。其中顶级域名又分为两类:一是国家顶级域名(national top-level domainnames, nTLDs),目前200多个国家都按照IS03166国家代码分配了顶级域名,例如中国是cn,美国是us,日本是jp等;二是国际顶级域名(international top-level domain names, iTDs),例如表不工商企业的.Com,表示网络提供商的.net,表示非盈利组织的.0rg等。二级域名是指顶级域名之下的域名,在国际顶级域名下,它是指域名注册人的网上名称,例如ibm, yahoo, microsoft等;在国家顶级域名下,它是表示注册企业类别的符号,例如com, edu, gov, net等;三级域名用字母(A?Z,a?z,大小写等)、数字(O?9)和连接符(一)组成,各级域名之间用实点(.)连接,三级域名的长度不能超过20个字符。
[0055]在域名信任度数据库中保存有域名与其域名信任度值之间的对应关系。优选地,该域名信任度数据库是可以编辑的,从而可以在域名信任度数据库中增加、删除或变更域名及其域名信任度值。
[0056]在建立域名信任度数据库的过程中,可以参考下列原则:
[0057]域名信任度值描述了域名的安全程度,当一个域名下的恶意URL越多,其域名信任度值就越低。通常网站上的正常链接(即明链)指向的都是同类型的安全网站,代表当前网站对其他网站的推荐和信任,以明链方式将用户导向一个恶意站点对网站自身的声誉也会有很大影响。然而,黑链则正好相反,其往往指向各类游戏私服、外挂、医疗、色情、博彩等暴利和恶意网站,而通常也只有这类网站才有动机大量向黑客购买黑链以提高其在搜索引擎的可见度,从而吸引更多用户获取暴利。
[0058]当一个正常网站上出现大量指向恶意网站的外链时,其被篡改的几率则大大增力口。由于被篡改的网站通常还可能植入各类恶意挂马代码,用户应该尽量避免访问此类站点以避免电脑感染网站上的木马病毒。
[0059]优选地,可以根据所提取出的域名查询预先设置的域名信任度数据库,以确定每个域名的域名信任度值;判断所确定的域名信任度值是否满足预先设定的黑链判定条件,如果是,则判定所述外部链接URL中包含黑链,如果不满足,则判定所述外部链接URL中不包含黑链。
[0060]其中:判断所确定的域名信任度值是否满足预先设定的黑链判定条件具体可以包括:判断域名信任度值中低于预先设置的域名信任度门限值的域名个数是否达到预先设置的域名数;或判断各个域名的域名信任度值的平均数是否低于预先设定的黑链门限值,等
坐寸ο
[0061]变更黑链判定条件可以设置/保存在客户端,也可以设置/保存在服务器中。在这里,优选在客户端中设置或变更黑链判定条件。当客户端判定黑链判定条件发生更改时,将最新的黑链判定条件发送到服务器,并由服务器保存。通过在在客户端中设置黑链判定条件,可以便于用户随时更改黑链判定条件,从而提高本发明实施方式的灵活性。[0062]比如:基于查询域名信任度数据库所提取出的有效外链的域名信任度值,可以根据预定的黑链判定条件进行黑链篡改判定。优选地,黑链判定条件可以由用户自定义设置,可能的规则包括:
[0063]a)域名信任度值低于某阈值的外链URL到达某个预定数目;
[0064]b)所有有效外链URL的域名信任度分数平均值低于某预先设置的阈值。
[0065]在本发明实施方式中,优选当判定所述外部链接URL中包含黑链时,阻止对所述URL的访问请求,并向用户发出风险报警消息;当判定所述外部链接URL中不包含黑链时,允许对所述URL的访问请求。
[0066]图2为根据本发明实施方式的域名信任度赋值示意图。
[0067]如图2所示,待分析页面中有3个外链URL,其中第I个外链URL对应的域名信任度值为100、第2个外链URL对应的域名信任度值为80、第3个外链URL对应的域名信任度值为60。
[0068]假设预定义的黑链判定条件为:信任度评分低于90的域名到达2个及以上,则这3个外链URL满足规则,则判定包含该3个外链URL的网页文件所对应的URL被黑链篡改,此时优选阻止用户访问该网页文件所对应的URL,并向用户提示风险。
[0069]假设预定义的黑链判定条件为:所有有效外链的信任度分数平均值低于80,则此URL不满足规则,则判定包含该3个外链URL的网页文件所对应的URL未被黑链篡改,用户可以正常访问该网页文件所对应的URL。
[0070]以上详细罗列了黑链判定条件的一些具体实例,本领域技术人员可以意识到,这种罗列仅仅是示范性的,并不用于限定本发明实施方式的保护范围。
[0071]可以将本发明实施方式应用到多种具体情形中,比如应用到客户端-服务器的模式中,其中服务器位于网络侧,而且优选构成服务器群的表现形式。
[0072]图3为根据本发明实施方式,在网络侧实现黑链检测的方法流程图。
[0073]如图3所示,该流程包括:
[0074]步骤301:客户端在本地浏览器发起对URL的访问请求,安装在该客户端上的插件截获该访问请求,并将用户期望访问的URL发送到位于网络侧的服务器进行检测,而且位于网络侧的服务器优选为云服务器。
[0075]步骤302:服务器获取该用户期望访问的URL之后,下载该用户期望访问的URL所对应的页面文件。
[0076]步骤303:服务器从该页面文件中提取所有的有效外链URL。
[0077]步骤304:服务器查询预先设置的域名信任度数据库,以确定每个外链URL所对应域名的域名信任度值。在这里,基于实际应用环境的需求,可以选择针对各个级别的域名来确定其域名信任度值。
[0078]步骤305:判断外链URL所对应域名的域名信任度值是否满足预先设定的黑链判定条件,如果是则执行步骤306,否则执行步骤307。在这里,黑链判定条件具体可以为:域名信任度值低于某阈值的外链URL到达某个预定数目;或者所有有效外链URL的域名信任度分数平均值低于某预先设置的阈值。
[0079]步骤306:服务器向客户端发出指令,以阻断客户端访问该用户期望访问的URL,并且服务器向客户端发出风险报警消息,提示该期望访问的URL中包含黑链。[0080]步骤307:服务器允许客户端访问该用户期望访问的URL。
[0081]基于上述详细分析,本发明实施方式还提出了一种黑链检测装置。
[0082]图4为根据本发明实施方式的黑链检测装置结构图。如图4所示,
[0083]该装置包括访问请求接收单元401、外部链接URL提取单元402和黑链判定单元403,其中:
[0084]访问请求接收单元401,用于接收针对URL的访问请求,并下载对应该URL的网页文件;
[0085]外部链接URL提取单元402,用于解析所述对应该URL的网页文件,以提取出包含于该网页文件中的外部链接URL ;
[0086]黑链判定单元403,用于提取所述外部链接URL的域名,并根据所提取出的域名查询预先设置的域名信任度数据库,以确定所述外部链接URL中是否包含黑链。
[0087]在一个实施方式中,外部链接URL提取单元402,用于解析对应该URL的网页文件,以获取包含于该网页文件中的<a>标签;提取所获取的<a>标签的超文本引用(href )属性值;从所提取的href属性值中剔除与该网页文件的本地域名相同的href属性值,并将剩余的href属性值作为包含于该网页文件中的外部链接URL。
[0088]优选地,黑链判定单元403,进一步用于当判定所述外部链接URL中包含黑链时,阻止对所述URL的访问请求,并向用户发出风险报警消息;当判定所述外部链接URL中不包含黑链时,允许对所述URL的访问请求。
[0089]优选地,黑链判定单元403,用于根据所提取出的域名查询预先设置的域名信任度数据库,以确定每个域名的域名信任度值;判断所确定的域名信任度值是否满足预先设定的黑链判定条件,如果是,则判定所述外部链接URL中包含黑链,如果不满足,则判定所述外部链接URL中不包含黑链。
[0090]在一个实施方式中,黑链判定单元403,用于判断域名信任度值中低于预先设置的域名信任度门限值的域名个数是否达到预先设置的域名数;或判断各个域名的域名信任度值的平均数是否低于预先设定的黑链门限值。
[0091]基于上述详细分析,本发明实施方式还提出了一种黑链检测系统。
[0092]图5为根据本发明实施方式的黑链检测系统的结构图。
[0093]如图5所示,包括客户端501和服务器502,其中:服务器位于网络侧。
[0094]在本发明实施方式中,客户端501和服务器502之间可以通过多种网络(比如,互联网或者无线通信网络)进行通信连接。比如:按信息传送的方向与时间关系,客户端501与服务器502之间的通信方式优选可分为单工通信、半双工通信及全双工通信,等等。
[0095]在本发明实施方式中,客户端501与服务器502之间可以约定具体的通信协议,在这些通信协议中定义好数据单元使用的格式,信息单元应该包含的信息与含义、连接方式、信息发送和接收的时序,从而确保网络中数据顺利地传送到确定的地方。
[0096]比如,本发明实施方式可以采用的通信协议包括但是不局限于:传输控制协议/网际协议(TCP/IP)、超文本传输协议(HTTP)、简单邮件传输协议(SMTP)、邮局协议的第3个版本(POP3),等等。
[0097]而且,当客户端501通过无线方式与服务器502连接时,本发明实施方式中客户端501可以通过多种通信标准与服务器502执行信息交互。比如:可以采用全球移动通讯系统(GSM)、宽带码分多址(WCDMA)、码分多址2000 (CDMA-2000)、时分同步码分多址(TD-SCDMA)等各种通信标准。而且,客户端501与服务器502之间的信息交互格式可以具有多种形式。
如,信息格式可以包括但是不局限于:短信息(SMS)、电子邮件、即时通讯(IM)信息、多媒体信息(丽S)或语音信息,等等。
[0098]其中:
[0099]客户端501,用于发出针对URL的访问请求,并将所述访问请求发送到服务器;
[0100]服务器502,用于解析所述对应该URL的网页文件,以提取出包含于该网页文件中的外部链接URL,提取所述外部链接URL的域名,并根据所提取出的域名查询预先设置的域名信任度数据库,以确定所述外部链接URL中是否包含黑链。
[0101]优选地,服务器502,用于解析对应该URL的网页文件,以获取包含于该网页文件中的<a>标签;提取所获取的<a>标签的超文本引用(href )属性值;从所提取的href属性值中剔除与该网页文件的本地域名相同的href属性值,并将剩余的href属性值作为包含于该网页文件中的外部链接URL。
[0102]在一个实施方式中,服务器502,进一步用于当判定所述外部链接URL中包含黑链时,阻止客户端501对所述URL的访问请求,并向客户端501发出风险报警消息;当判定所述外部链接URL中不包含黑链时,允许客户端502对所述URL的访问请求。
[0103]优选的,服务器502,用于根据所提取出的域名查询预先设置的域名信任度数据库,以确定每个域名的域名信任度值;判断所确定的域名信任度值是否满足预先设定的黑链判定条件,如果是,则判定所述外部链接URL中包含黑链,如果不满足,则判定所述外部链接URL中不包含黑链。
[0104]其中:服务器502,可以判断域名`信任度值中低于预先设置的域名信任度门限值的域名个数是否达到预先设置的域名数;或判断各个域名的域名信任度值的平均数是否低于预先设定的黑链门限值。
[0105]可以将图4所示装置集成到各种通信网络的硬件实体当中。比如,可以将黑链检测装置集成到:功能手机、智能手机、掌上电脑、个人电脑(PC)、平板电脑或个人数字助理(PDA),等等设备之中。
[0106]实际上,可以通过多种形式来具体实施本发明实施方式所提出的黑链检测装置。比如,可以遵循一定规范的应用程序接口,将黑链检测装置编写为安装到终端中的插件程序,也可以将其封装为应用程序以供用户自行下载使用。当编写为插件程序时,可以将其实施为ocx、dll、cab等多种插件形式。也可以通过Flash插件、RealPlayer插件、MMS插件、MIDI五线谱插件、ActiveX插件等具体技术来实施本发明实施方式所提出的黑链检测
>j-U ρ?α装直。
[0107]可以通过指令或指令集存储的储存方式将本发明实施方式所提出的黑链检测方法存储在各种存储介质上。这些存储介质包括但是不局限于:软盘、光盘、DVD、硬盘、闪存、U 盘、CF 卡、SD 卡、MMC 卡、SM 卡、记忆棒(Memory Stick)、xD 卡等。
[0108]另外,还可以将本发明实施方式所提出的黑链检测方法应用到基于闪存(Nandflash)的存储介质中,比如U盘、CF卡、SD卡、SDHC卡、MMC卡、SM卡、记忆棒、xD卡等。
[0109]综上所述,在本发明实施方式中,接收针对统一资源定位符(URL)的访问请求,并下载对应该URL的网页文件;解析所述对应该URL的网页文件,以提取出包含于该网页文件中的外部链接URL ;提取所述外部链接URL的域名,并根据所提取出的域名查询预先设置的域名信任度数据库,以确定所述外部链接URL中是否包含黑链。由此可见,应用本发明实施方式之后,可以根据页面外连的域名信任度值进行网页的黑链自动判断,从而实现了黑链的快速和自动检测,因此提高了黑链检测效率。
[0110]另外,可以针对黑链判定条件在客户端进行自行设置,因此本发明实施方式的灵活性高,也进一步提高了黑链检测效率。
[0111]以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【权利要求】
1.一种黑链检测方法,其特征在于,该方法包括: 接收针对统一资源定位符(URL)的访问请求,并下载对应该URL的网页文件; 解析所述对应该URL的网页文件,以提取出包含于该网页文件中的外部链接URL ; 提取所述外部链接URL的域名,并根据所提取出的域名查询预先设置的域名信任度数据库,以确定所述外部链接URL中是否包含黑链。
2.根据权利要求1所述的黑链检测方法,其特征在于,所述解析对应该URL的网页文件,以提取出包含于该网页文件中的外部链接URL包括: 解析对应该URL的网页文件,以获取包含于该网页文件中的<a>标签; 提取所获取的<a>标签的超文本引用(href)属性值; 从所提取的href属性值中剔除与该网页文件的本地域名相同的href属性值,并将剩余的href属性值作为包含于该网页文件中的外部链接URL。
3.根据权利要求1所述的黑链检测方法,其特征在于,该方法进一步包括: 当判定所述外部链接URL中包含黑链时,阻止对所述URL的访问请求,并向用户发出风险报警消息;当判定所述外部链接URL中不包含黑链时,允许对所述URL的访问请求。
4.根据权利要求1所述的黑链检测方法,其特征在于,所述接收针对URL的访问请求,并下载对应该URL的网页文件包括: 客户端针对该URL发出访问请求,并将所述访问请求发送到位于网络侧的服务器; 位于网络侧的服务器接收该针对URL的访问请求,并下载对应该URL的网页文件。
5.根据权利要求1所述的黑链检测方法,其特征在于,所述根据所提取出的域名查询预先设置的域名信任度数据库,以确定所述外部链接URL中是否包含黑链包括: 根据所提取出的域名查询预先设置的域名信任度数据库,以确定每个域名的域名信任度值; 判断所确定的域名信任度值是否满足预先设定的黑链判定条件,如果是,则判定所述外部链接URL中包含黑链,如果不满足,则判定所述外部链接URL中不包含黑链。
6.根据权利要求5所述的黑链检测方法,其特征在于,所述判断所确定的域名信任度值是否满足预先设定的黑链判定条件包括: 判断域名信任度值中低于预先设置的域名信任度门限值的域名个数是否达到预先设置的域名数;或 判断各个域名的域名信任度值的平均数是否低于预先设定的黑链门限值。
7.—种黑链检测装置,其特征在于,该装置包括访问请求接收单元、外部链接URL提取单元和黑链判定单元,其中: 访问请求接收单元,用于接收针对URL的访问请求,并下载对应该URL的网页文件; 外部链接URL提取单元,用于解析所述对应该URL的网页文件,以提取出包含于该网页文件中的外部链接URL ; 黑链判定单元,用于提取所述外部链接URL的域名,并根据所提取出的域名查询预先设置的域名信任度数据库,以确定所述外部链接URL中是否包含黑链。
8.根据权利要求7所述的黑链检测装置,其特征在于, 外部链接URL提取单元,用于解析对应该URL的网页文件,以获取包含于该网页文件中的<a>标签;提取所获取的<a>标签的超文本引用(href)属性值;从所提取的href属性值中剔除与该网页文件的本地域名相同的href属性值,并将剩余的href属性值作为包含于该网页文件中的外部链接URL。
9.根据权利要求7所述的黑链检测装置,其特征在于, 黑链判定单元,进一步用于当判定所述外部链接URL中包含黑链时,阻止对所述URL的访问请求,并向用户发出风险报警消息;当判定所述外部链接URL中不包含黑链时,允许对所述URL的访问请求。
10.根据权利要求7所述的黑链检测装置,其特征在于, 黑链判定单元,用于根据所提取出的域名查询预先设置的域名信任度数据库,以确定每个域名的域名信任度值;判断所确定的域名信任度值是否满足预先设定的黑链判定条件,如果是,则判定所述外部链接URL中包含黑链,如果不满足,则判定所述外部链接URL中不包含黑链。
11.根据权利要求10所述的黑链检测装置,其特征在于, 黑链判定单元,用于判断域名信任度值中低于预先设置的域名信任度门限值的域名个数是否达到预先设置的域名数;或判断各个域名的域名信任度值的平均数是否低于预先设定的黑链门限值。
12.一种黑链检测系统,其特征在于,包括客户端和服务器,其中: 客户端,用于发出针对URL的访问请求,并将所述访问请求发送到服务器; 服务器,用于解析所述对应该URL的网页文件,以提取出包含于该网页文件中的外部链接URL,提取所述外部链接URL的域名,并根据所提取出的域名查询预先设置的域名信任度数据库,以确定 所述外部链接URL中是否包含黑链。
13.根据权利要求12所述的黑链检测系统,其特征在于, 服务器,用于解析对应该URL的网页文件,以获取包含于该网页文件中的<a>标签;提取所获取的<a>标签的超文本引用(href)属性值;从所提取的href属性值中剔除与该网页文件的本地域名相同的href属性值,并将剩余的href属性值作为包含于该网页文件中的外部链接URL。
14.根据权利要求12所述的黑链检测系统,其特征在于, 服务器,进一步用于当判定所述外部链接URL中包含黑链时,阻止客户端对所述URL的访问请求,并向客户端发出风险报警消息;当判定所述外部链接URL中不包含黑链时,允许客户端对所述URL的访问请求。
15.根据权利要求12所述的黑链检测系统,其特征在于, 服务器,用于根据所提取出的域名查询预先设置的域名信任度数据库,以确定每个域名的域名信任度值;判断所确定的域名信任度值是否满足预先设定的黑链判定条件,如果是,则判定所述外部链接URL中包含黑链,如果不满足,则判定所述外部链接URL中不包含黑链。
16.根据权利要求15所述的黑链检测系统,其特征在于, 服务器,判断域名信任度值中低于预先设置的域名信任度门限值的域名个数是否达到预先设置的域名数;或判断各个域名的域名信任度值的平均数是否低于预先设定的黑链门限值。
【文档编号】H04L29/08GK103856442SQ201210501415
【公开日】2014年6月11日 申请日期:2012年11月30日 优先权日:2012年11月30日
【发明者】刘健, 张辉 申请人:腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1