一种暗链的检测方法及系统的制作方法

文档序号:9727671阅读:2173来源:国知局
一种暗链的检测方法及系统的制作方法
【技术领域】
[0001]本发明涉及网络安全领域,特别涉及一种暗链的检测方法及系统。
【背景技术】
[0002]随着互联网的快速发展和普及,互联网技术已向社会各个领域进行延伸,网站作为信息的载体向人们展示着丰富的内容。然而如何快速检索人们所感兴趣的内容,搜索引擎的出现解决了这个难题,搜索引擎会将信息搜集和整合后,按优先级将检索的结果依次展示给用户。
[0003]暗链是最有效的搜索引擎优化(SE0)作弊的方式之一,这也是黑客最常用的一种方式,通过批量入侵网站,然后在网页中植入暗链,来提高暗链在搜索引擎中的排名,从中牟取利益。
[0004]随着暗链与其检测技术的对抗,黑客在一些植入的暗链代码中会判断HTTP协议中的UserAgent信息是搜索引擎蜘蛛、还是浏览器访问,如果是浏览器访问,则隐藏暗链;传统采用人工检测暗链的方法,效率极低,而单纯依靠暗链的域名特征去检测,无法对隐藏暗链进行检测。

【发明内容】

[0005]针对上述现有技术中存在的问题,本发明提出了一种暗链的检测方法,解决了暗链检测的局限性,可以对隐藏的暗链进行检测,也解决了人工检测的滞后性问题。
[0006]一种暗链的检测方法,包括:
a.创建搜索引擎蜘蛛的用户代理信息库;
创建暗链特征库,所述暗链特征库中的特征包括暗链名称和暗链URL ;
创建网站基本信息库,所述网站基本信息库包括网站所有页面内容、页面对应URL、页面HASH、超链接名称及URL ;
b.逐一遍历网站基本信息库中的所有网站的所有页面,直至最后一个页面结束;
c.判断当前页面的超链接名称或URL中是否有暗链特征库中的特征,如果是,则判定当前页面存在暗链,并删除页面中的暗链信息,即暗链特征库中的特征;否则,执行步骤d ;
d.模拟搜索引擎蜘蛛的用户代理信息,重新请求上述页面,并计算其页面HASH;
e.判断所述页面HASH值与网站基本信息库中的页面HASH值是否相同,如果是,则所述网站不存在隐藏暗链,返回步骤b ;否则所述网站存在隐藏暗链,执行步骤f ;
f.将重新请求的页面与网站基本信息库比对,删除重新请求的页面中不同的信息。
[0007]所述的方法中,所述步骤f,在删除重新请求的页面中不同的信息之前,还包括:提取重新请求的页面中不同的信息,并进行解析,将解析后得到的暗链名称及暗链URL添加到暗链特征库。
[0008]一种暗链的检测系统,包括:
建模模块:用于创建搜索引擎蜘蛛的用户代理信息库; 创建暗链特征库,所述暗链特征库中的特征包括暗链名称和暗链URL ;
创建网站基本信息库,所述网站基本信息库包括网站所有页面内容、页面对应URL、页面HASH、超链接名称及URL ;
检测模块,用于逐一遍历网站基本信息库中的所有网站的所有页面,直至最后一个页面结束;
判断当前页面的超链接名称或URL中是否有暗链特征库中的特征,如果是,则判定当前页面存在暗链,并删除页面中的暗链信息;否则,模拟搜索引擎蜘蛛的用户代理信息,重新请求上述页面,并计算其页面HASH ;
判断所述页面HASH值与网站基本信息库中的页面HASH值是否相同,如果是,则所述网站不存在隐藏暗链;否则所述网站存在隐藏暗链,进入处置模块;
处置模块,用于将重新请求的页面与网站基本信息库比对,删除重新请求的页面中不同的信息。
[0009]所述的系统中,所述处置模块,在删除重新请求的页面中不同的信息之前,还包括:提取重新请求的页面中不同的信息,并进行解析,将解析后得到的暗链名称及暗链URL添加到暗链特征库。
[0010]本发明的优势在于,提供了一种检测暗链的技术和实现,解决了目前检测暗链的局限性,对暗链基于特征码检测不全面的问题,可对隐藏的暗链进行检测;也解决了人工检测的滞后性问题,比传统检测方式效率更高。本发明基于用户代理模拟,同时采用内容匹配方式,不仅可以检测暗链,还可以恢复黑客植入的暗链,解决了传统检测暗链,只能查不能清除等特点。解决了对暗链处置清除的问题,无需人工参与处置问题。解决了传统特征码检测暗链需要人工参与,处置、添加规则是一个自闭合的过程。且本发明方法易于扩展、易于维护、可全自动运行,没有额外的开发及人工维护的开销,极大的方便了本发明方法的实现与运维。
[0011]本发明提出了一种暗链的检测方法及系统,通过建立搜索引擎蜘蛛用户代理信息库、暗链特征库和网站基本信息库,遍历网站基本信息库中的各网页,并将网页信息与暗链特征库进行对比,如果存在暗链特征库中的特征则所述的页面存在暗链,否则模拟搜索引擎蜘蛛用户代理信息,重新请求所述页面,并比较其HASH值与网站基本信息库中的HASH值是否相同,如果相同则所述页面不存在暗链,否则所述页面存在暗链。本发明的方法无需人为参与,即可对网站中的暗链进行检测并清除。极大提高了对暗链的检测效率。
【附图说明】
[0012]为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0013]图1为本发明一种暗链的检测方法实施例流程图;
图2为本发明一种暗链的检测系统实施例结构示意图。
【具体实施方式】
[0014]为了使本技术领域的人员更好地理解本发明实施例中的技术方案,并使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明中技术方案作进一步详细的说明。
[0015]针对上述现有技术中存在的问题,本发明提出了一种暗链的检测方法,解决了暗链检测的局限性,可以对隐藏的暗链进行检测,也解决了人工检测的滞后性问题。
[0016]一种暗链的检测方法,如图1所示,包括:
5101:创建搜索引擎蜘蛛的用户代理信息库;
创建暗链特征库,所述暗链特征库中的特征包括暗链名称和暗链URL ;
创建网站基本信息库,所述网站基本信息库包括网站所有页面内容、页面对应URL、页面HASH、超链接名称及URL ;
5102:逐一遍历网站基本信息库中的所有网站的所有页面,直至最后一个页面结束;
5103:判断当前页面的超链接名称或URL中是否有暗链特征库中的特征,如果是,则判定当前页面存在暗链,并删除页面中的暗链信息;否则,执行S104 ;
5104:模拟搜索引擎蜘蛛的用户代理信息,重新请求上述页面,并计算其页面HASH;
5105:判断所述页面HASH值与网站基本信息库中的页面HASH值是否相同,如果是,则所述网站不存在隐藏暗链,返回S102 ;否则所述网站存在隐藏暗链,执行S106 ;
5106:将重新请求的页面与网站基本信息库比对,删除重新请求的页面中不同的信息。即两者不同处即为暗链。
[0017]所述的方法中,所述S106中,在删除重新请求的页面中不同的信息之前,还包括:提取重新请求的页面中不同的信息,并进行解析,将解析后得到的暗链名称及暗链URL添加到暗链特征库。
[0018]一种暗链的检测系统,如图2所示,包括:
建模模块201,用于创建搜索引擎蜘蛛
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1