一种网页篡改监测的方法

文档序号：6620932阅读：1098来源：国知局

一种网页篡改监测的方法
【专利摘要】本发明涉及信息安全【技术领域】，旨在提供一种网页篡改监测的方法。该种网页篡改监测的方法包括步骤：过滤标签项配置、敏感字项配置、定级项配置、文件变更配置、模板套用、爬取网页、形成基准、对比改动页面、网页截取、形成报告、产生告警。本发明通过策略配置进行篡改监测，可过滤了一些特殊网页标签，可临时针对特殊项目或者活动进行自定义过滤或自定义策略编辑，使得篡改监测更加精准更加灵活，让工作人员可以轻松地得到更加可信的篡改监测告警。
【专利说明】一种网页篡改监测的方法

【技术领域】
[0001] 本发明是关于信息安全【技术领域】，特别涉及一种网页篡改监测的方法。

【背景技术】
[0002] 随着互联网的发展，各种技术架构层出不穷，极大程度地满足了用户的各种需求。但是，现有的技术架构下网站漏洞却长期存在：
[0003] 1、操作系统复杂性：已经公布超过1万多个系统漏洞；
[0004] 2、漏洞与补丁：系统漏洞从发现到被利用为5天，补丁发布时间为47天；
[0005] 3、应用系统漏洞：各种注入式攻击，多个应用系统不同的开发者。
[0006] 主观原因而言，过于苛刻的安全管理要求，通常网络管理员难以完全实现：
[0007] 1、密码管理：合格密码需要8位以上复杂字符并定期改变；
[0008] 2、漏洞补丁：操作系统、中间件、应用系统的定期更新；
[0009] 3、上网控制：钓鱼、木马、间谍软件。
[0010] 这些原因导致网站网页极容易被篡改，防不胜防。传统的篡改监测，覆盖范围不全，且容易产生误报。例如网站正常的维护，进行图片链接的修改，传统监测方法，会当作是被篡改告警给网站负责人，实际不存在篡改情况，照成网站维护人员时间和精力上的浪费。这些因素还包括：1)很多网页的动态性，造成篡改监测系统的判断错误；2)篡改监测系统本身的判断逻辑不完善；3)目前的应用环境非常复杂，篡改监测系统判断逻辑往往无法覆盖所有可能出现的情况。

【发明内容】

[0011] 本发明的主要目的在于克服现有技术中的不足，提供一种准确率更高、灵活度更高的篡改监测方法和系统。为解决上述技术问题，本发明的解决方案是：
[0012] 提供一种网页篡改监测的方法，用于监测所需监测网站的网页篡改，具体包括下述步骤：
[0013] (1)过滤标签项配置：通过配置需要过滤的标签项，过滤网页中特定的标签，用于避免网页动态性标签所引起的篡改误报；
[0014] 所述标签是指网页浏览器识别符（网页程序中不同的标签有着不同的意义，也代表不同功能和样式，如div标签定义HTML文档中的分隔（division)或部分（section)等），过滤标签包括div标签计数器、选择器、Div名称属性、Div临时属性；
[0015] (2)敏感字项配置：通过增加敏感字的字库或使用内置敏感字库，实现敏感字的监测，用于控制篡改监测范围；
[0016] 所述敏感字是指系统禁止发表的词语，包括黄色、政治、暴力、辱骂方面的词汇；
[0017] (3)定级项配置：通过将篡改内容进行分级分类，用于按照所需进行分级告警，满足用户特殊需求；定级是指对篡改检测内容进行分级分类；
[0018] (4)文件变更配置：用于避免网站正常维护而产生篡改误报；文件变更包括Js文件变更、Css文件变更；
[0019] (5)模板套用：根据不同篡改监测需求，通过上述步骤，配置任意组合形成不同的策略模板，在进行篡改监测网站时，选择相应的策略模板名称进行模板套用，形成网站对应一个策略模板的形式，进行篡改监测；
[0020] (6)爬取网页：抓取所需监测网站的所有页面，抓取方式采用网络爬虫、正则表达式、模拟解析中的任意一种或至少两种方式相结合的方法，或者现有开源的网络爬虫；
[0021] (7)形成基准：将步骤￠)中抓取的网页进行保存，形成基准（通过网络爬虫抓取的网站网页会保存在指定文件夹下，形成基准文件），即为标注，用于作为下一次爬取网页结果的对比对象；
[0022] (8)对比改动页面：通过再一次进行步骤（6)抓取的网页结果进行保存，与步骤 (7)形成的基准进行对比；再将对比结果根据步骤（5)中选择套用的策略模板来进行处理：根据套用的策略模板中的配置内容，过滤掉对比结果的过滤标签项，筛选出对比结果的敏感关键字，对对比结果的定级项进行结果定级，再进行对比结果的文件变更调整，形成最终的比对结果；
[0023] (9)网页截取：根据步骤（8)中检测出的比对结果，截取篡改前和篡改后的网页，并通过界面直观展现；
[0024] (10)形成报告：根据步骤⑶中检测出的比对结果、步骤（9)中获得的截图，（通过velocity组件）形成网站安全报告；
[0025] (11)产生告警：将步骤（10)中形成的网站安全报告发送给用户，用于反馈篡改信肩、。
[0026] 本发明的工作原理：在对一个网站进行篡改监测之前，利用已知的策略进行配置，排除因网站正常维护或计数器类网页动态性因素产生的篡改告警，定级别定分类进行告警，能够很大程度上降低误报给工作人员带来的困惑。
[0027] 与现有技术相比，本发明的有益效果是：
[0028] 通过策略配置进行篡改监测，可过滤了一些特殊网页标签，可临时针对特殊项目或者活动进行自定义过滤或自定义策略编辑，使得篡改监测更加精准更加灵活，让工作人员可以轻松地得到更加可信的篡改监测告警。

【专利附图】

【附图说明】
[0029] 图1为本发明的网页篡改监测的方法流程图。

【具体实施方式】
[0030] 下面结合附图与【具体实施方式】对本发明作进一步详细描述：
[0031] 如图1所示，一种网页篡改监测的方法，用于监测所需监测网站的网页篡改，采用人工干预策略配置方法，提高篡改监测的准确率，产生更加准确可信的篡改告警结果，具体包括下述步骤：
[0032] (1)过滤标签项配置：标签即为网页浏览器识别符，网页程序中不同的标签有着不同的意义，也代表不同功能和样式，如div标签定义HTML文档中的分隔（division)或部分（section)等。过滤标签项是指通过人工配置需要过滤的标签项，从而达到过滤网页中特定的标签的目的，如div标签计数器、选择器、Div名称属性、Div临时属性。进行过滤标签项配置，用于避免网页动态性标签所引起的篡改误报；
[0033] (2)敏感字项配置：敏感字是指一般系统禁止发表的词语，一般包括黄色，政治，暴力，辱骂方面的词汇。通过手工配置增加敏感字项的字库或使用内置敏感字库，达到敏感字检测的目的。通过敏感字项，控制篡改监测范围；
[0034] (3)定级项配置：定级是指对篡改检测内容进行分级分类，通过定级项的配置可达到篡改分级告警的目的，满足用户特殊需求；
[0035] (4)文件变更配置：文件变更包括Js文件变更、Css文件变更，通过对文件变更项的配置，可达到避免网站正常维护而产生篡改误报的目的；
[0036] (5)模板套用：根据不同篡改监测需求，通过上述步骤，配置形成不同策略的模板。在进行下达篡改监测任务时，选择相应的模板名称进行模板套用，形成网站对应一个策略模板的形式，快速进行篡改监测。
[0037] (6)爬取网页：抓取所需监测网站的所有页面，抓取方式采用网络爬虫、正则表达式、模拟解析中的任意一种或至少两种方式相结合的方法，或者现有开源的网络爬虫；
[0038] (7)形成基准：用于通过步骤（6)的抓取的网页进行保存，形成基准。基准即为标注，通过网络爬虫抓取的网站网页会保存在指定文件夹下，形成基准文件，作为下一次爬取网页结果的对比对象。
[0039] (8)对比改动页面：目的是进行与步骤（7)形成的基准进行对比。篡改监测通过再一次进行步骤（6)抓取的网页结果进行保存，与步骤（7)形成的基准进行对比；再将对比结果根据步骤（5)中选择套用的策略模板来进行处理：根据套用的策略模板中的配置内容，过滤掉对比结果的过滤标签项，筛选出对比结果的敏感关键字，对对比结果的定级项进行结果定级，再进行对比结果的文件变更调整，形成最终的比对结果。
[0040] (9)网页截取：通过步骤（8)中的对比改动处，截取篡改前和篡改后的网页，并通过界面直观展现；
[0041] (10)形成报告：通过步骤（8)中获得的对比改动处、步骤（9)中获得的截图，通过 velocity组件形成网站安全报告；
[0042] (11)产生告警：将步骤（10)中形成的网站安全报告发送给用户，用于反馈篡改信肩、。
[0043] 最后，需要注意的是，以上列举的仅是本发明的具体实施例。显然，本发明不限于以上实施例，还可以有很多变形。本领域的普通技术人员能从本发明公开的内容中直接导出或联想到的所有变形，均应认为是本发明的保护范围。
【权利要求】
1. 一种网页篡改监测的方法，用于监测所需监测网站的网页篡改，其特征在于，具体包括下述步骤： (1) 过滤标签项配置：通过配置需要过滤的标签项，过滤网页中特定的标签，用于避免网页动态性标签所引起的篡改误报；所述标签是指网页浏览器识别符，过滤标签包括div标签计数器、选择器、Div名称属性、Div临时属性； (2) 敏感字项配置：通过增加敏感字的字库或使用内置敏感字库，实现敏感字的监测，用于控制篡改监测范围；所述敏感字是指系统禁止发表的词语，包括黄色、政治、暴力、辱骂方面的词汇； (3) 定级项配置：通过将篡改内容进行分级分类，用于按照所需进行分级告警，满足用户特殊需求；定级是指对篡改检测内容进行分级分类； (4) 文件变更配置：用于避免网站正常维护而产生篡改误报；文件变更包括Js文件变更、Css文件变更； (5) 模板套用：根据不同篡改监测需求，通过上述步骤，配置任意组合形成不同的策略模板，在进行篡改监测网站时，选择相应的策略模板名称进行模板套用，形成网站对应一个策略模板的形式，进行篡改监测； (6) 爬取网页：抓取所需监测网站的所有页面，抓取方式采用网络爬虫、正则表达式、模拟解析中的任意一种或至少两种方式相结合的方法，或者现有开源的网络爬虫； (7) 形成基准：将步骤（6)中抓取的网页进行保存，形成基准，即为标注，用于作为下一次爬取网页结果的对比对象； (8) 对比改动页面：通过再一次进行步骤（6)抓取的网页结果进行保存，与步骤（7)形成的基准进行对比；再将对比结果根据步骤（5)中选择套用的策略模板来进行处理：根据套用的策略模板中的配置内容，过滤掉对比结果的过滤标签项，筛选出对比结果的敏感关键字，对对比结果的定级项进行结果定级，再进行对比结果的文件变更调整，形成最终的比对结果； (9) 网页截取：根据步骤（8)中检测出的比对结果，截取篡改前和篡改后的网页，并通过界面直观展现； (10) 形成报告：根据步骤（8)中检测出的比对结果、步骤（9)中获得的截图，形成网站安全报告； (11) 产生告警：将步骤（10)中形成的网站安全报告发送给用户，用于反馈篡改信息。
【文档编号】G06F21/56GK104156665SQ201410350025
【公开日】2014年11月19日申请日期:2014年7月22日优先权日:2014年7月22日
【发明者】葛菲菲, 范渊, 杨永清, 莫金友申请人:杭州安恒信息技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：葛菲菲;范渊;杨永清;莫金友
技术所有人：杭州安恒信息技术有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。