本发明属于网络安全领域,涉及基于环境的漏洞扫描器。
背景技术:
随着计算机网络的高速发展,给社会、生活以及工作带来了巨大的便利。我们能够很方便的使用计算机网络向外界传播消息,能够在网上进行交易等。然而计算机网络也存在一定的漏洞,是计算机系统在硬件、软件以及协议的具体实现或系统安全策略上存在的缺陷。漏洞一旦被发现,就会被外界的入侵者利用,通过非法的、未授权的方式访问或者破坏系统。每个平台无论是硬件还是软件都存在漏洞,而现在大部分常规的漏洞扫描系统,不具备违规内容检测和黑链探测技术。
技术实现要素:
本发明的目的在于:提供了基于环境的漏洞扫描器,能够通过对工作中的实际需求,进行分析,将人工判断思路转换成程序,自动探测并判断当前网页是否包含黑链和违规内容,提高黑链识别率。
本发明采用的技术方案如下:基于环境的漏洞扫描器,包括以下步骤:
步骤a:自定义创建违规特征数据库s1,导入现有黑链违规特征的统一资源定位符urlx;
步骤b:接收外界的访问请求以及该urly,并下载访问请求的网页文件h1;
步骤c:创建网页格式的正则表达式regex;
步骤d:自定义创建网页链接特征数据库s2;
步骤e:获取网页文件h1上的含有链接的urlz,利用正则表达式regex(urlz)检测是否符合网页格式;
步骤f:若通过regex(urlz)检测出该urlz符合网页格式,则将该urlz通过查询违规特征数据库s1,检测该urlz是否存在于违规特征数据库s1,若存在则判断该urlz为黑链,反之则urlz该不为黑链。
进一步地,所述步骤b、步骤c以及步骤d中包括以下步骤:
步骤bcd1:获取已下载的网页文件h1的网页源代码;
步骤bcd2:利用正则表达式regex匹配出具有网页链接的urlz,并存入网页链接特征数据库s2。
步骤bcd3:通过每次从网页链接特征数据库s2中依次获取每一条网页链接的urlz,通过模拟访问该网页链接的urlz;
步骤bcd4:通过访问网页链接urlz,下载当前链接的网页源代码并查找该链接的网页源代码中是否含有违规字符,有违规字符则判断为黑链,反之则判断不为黑链;
步骤bcd4:若判断该网页链接urlz为黑链,则违规特征数据库s1继续保存该urlz;若判断该网页链接urlz不为黑链,则违规特征数据库s1删除该urlz。
进一步地,获取步骤b中网页文件h1,并下载其源代码,检测网页文件h1类型。
进一步地,若检测到网页文件h1的类型是css,则获取每个div中每个标签的属性值,并将属性值转换为字符串,通过正则表达式regex进行检测。若通过regex检测后返回值为true,则将该字符串通过查询违规特征数据库s1,检测该字符串是否存在于违规特征数据库s1。若存在,则判断为黑链;反之,则判断不为黑链。
进一步地,若检测到网页文件h1的类型是html,则依次检测该html的文字、图片、视频所在标签的属性值以及属性为hidden的标签的属性值,通过正则表达式regex的方式,检测其属性值。若通过regex检测后返回值为true,则将该字符串通过查询违规特征数据库s1,检测该字符串是否存在于违规特征数据库s1。若存在,则判断为黑链;反之,则判断不为黑链。
进一步地,通过模拟访问urly,判断其是否为黑链。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1.本发明基于环境的漏洞扫描器,基于实际网络安全检测环境需求,具有其传统方案所不具备的违规内容检测和黑链探测模块。
2.本发明基于环境的漏洞扫描器,本发明能够通过获取网页上为hidden的标签,加强网页检测标准。
3.本发明基于环境的漏洞扫描器,本发明通过方案互补,能够深度搜索判断出来的黑链加入违规特征数据库s1中,可以提高黑链探测的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图,其中:
图1是本发明的逻辑示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,即所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
下面结合实施例对本发明的特征和性能作进一步的详细描述。
实施例一
本发明较佳实施例提供的基于环境的漏洞扫描器,包括以下步骤:
步骤a:自定义创建违规特征数据库s1,导入现有黑链违规特征的统一资源定位符urlx;
步骤b:接收外界的访问请求以及该urly,并下载访问请求的网页文件h1;
步骤c:创建网页格式的正则表达式regex;
步骤d:自定义创建网页链接特征数据库s2;
步骤e:获取网页文件h1上的含有链接的urlz,利用正则表达式regex(urlz)检测是否符合网页格式;
步骤f:若通过regex(urlz)检测出该urlz符合网页格式,则将该urlz通过查询违规特征数据库s1,检测该urlz是否存在于违规特征数据库s1,若存在则判断该urlz为黑链,反之则urlz该不为黑链。
实施例二
本实施例在实施例一的基础上,优选地,所述步骤b、步骤c以及步骤d中包括以下步骤:
步骤bcd1:获取已下载的网页文件h1的网页源代码;
步骤bcd2:利用正则表达式regex匹配出具有网页链接的urlz,并存入网页链接特征数据库s2。
步骤bcd3:通过每次从网页链接特征数据库s2中依次获取每一条网页链接的urlz,通过模拟访问该网页链接的urlz;
步骤bcd4:通过访问网页链接urlz,下载当前链接的网页源代码并查找该链接的网页源代码中是否含有违规字符,有违规字符则判断为黑链,反之则判断不为黑链;
步骤bcd4:若判断该网页链接urlz为黑链,则违规特征数据库s1继续保存该urlz;若判断该网页链接urlz不为黑链,则违规特征数据库s1删除该urlz。
优选地,获取步骤b中网页文件h1,并下载其源代码,检测网页文件h1类型。
优选地,若检测到网页文件h1的类型是css,则获取每个div中每个标签的属性值,并将属性值转换为字符串,通过正则表达式regex进行检测。若通过regex检测后返回值为true,则将该字符串通过查询违规特征数据库s1,检测该字符串是否存在于违规特征数据库s1。若存在,则判断为黑链;反之,则判断不为黑链。
优选地,若检测到网页文件h1的类型是html,则依次检测该html的文字、图片、视频所在标签的属性值以及属性为hidden的标签的属性值,通过正则表达式regex的方式,检测其属性值。若通过regex检测后返回值为true,则将该字符串通过查询违规特征数据库s1,检测该字符串是否存在于违规特征数据库s1。若存在,则判断为黑链;反之,则判断不为黑链。
优选地,通过模拟访问urly,判断其是否为黑链。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明的保护范围,任何熟悉本领域的技术人员在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。