一种网页文件监控方法及系统与流程

文档序号:29310941发布日期:2022-03-19 20:04阅读:149来源:国知局
一种网页文件监控方法及系统与流程

1.本发明涉及门户网站领域,特别是涉及一种网页文件监控方法及系统。


背景技术:

2.随着互联网技术的迅速发展,网站的访问率越来越高。在用户访问网页的过程中,保障网页数据的安全尤为重要,对网页文件有效控制的需求越来越多。
3.现有的网页文件监控技术主要是面向应用层数据的分析,通过拦截系统调用和锁定文件目录方式来实现,诸如打开和关闭文件,读取、删除和编辑等都需要关闭拦截系统进行操作,虽然能提供一定的防护监控,避免了文件信息被修改,但同时也造成了操作很不方便,开发代价高,关闭之后也无法记录应用中的事件信息。另外应用层只能跟踪静态页面,对于动态页面获取不到信息和内容的变化。


技术实现要素:

4.本发明的目的是提供一种网页文件监控方法及系统,通过文件级的监控方式实现动态文件和静态文件的全面监控。
5.为实现上述目的,本发明提供了如下方案:一种网页文件监控方法,包括:利用文件系统的内置函数获取网页文件信息;将所述网页文件信息存储至源文件目录;监控所述网页文件信息确定所述网页文件的变化内容;所述变化内容包括可执行文件、目录、系统配置文件、内容文件、压缩文件和压缩文件夹;将所述变化内容逐条与所述源文件目录的网页文件信息对比,得到对比结果;根据所述对比结果和告警阈值确定告警信息。
6.可选地,所述将所述网页文件信息存储至源文件目录,具体包括:根据所述网页文件信息选择操作路径并新建目录;保存所述操作路径和新建目录至指定目录;根据所述指定目录中的新建目录的个数确定资源保存路径;保存所述资源保存路径至源文件目录。
7.可选地,所述根据所述指定目录中的新建目录的个数确定资源保存路径,具体包括:判断所述指定目录中的新建目录的个数是否小于设定值,得到第一判断结果;若所述第一判断结果表示所述指定目录中的新建目录的个数小于设定值,则将所述新建目录对应的操作路径作为资源保存路径;若所述第一判断结果表示所述指定目录中的新建目录的个数大于或者等于设定值,则新建临时操作路径作为资源保存路径。
8.可选地,所述根据所述对比结果和告警阈值确定告警信息,具体包括:
判断所述对比结果的文件修改时间、文件大小、文件内容和md5校验值中的任意一项是否大于告警阈值,得到第二判断结果;若所述第二判断结果表示所述对比结果的文件修改时间、文件大小、文件内容和md5校验值中的任意一项大于告警阈值,则确定发出告警。
9.一种网页文件监控系统,包括:获取模块,用于利用文件系统的内置函数获取网页文件信息;存储模块,用于将所述网页文件信息存储至源文件目录;监控模块,用于监控所述网页文件信息确定所述网页文件的变化内容;所述变化内容包括可执行文件、目录、系统配置文件、内容文件、压缩文件和压缩文件夹;对比模块,用于将所述变化内容逐条与所述源文件目录的网页文件信息对比,得到对比结果;告警模块,用于根据所述对比结果和告警阈值确定告警信息。
10.可选地,所述存储模块,具体包括:选择和新建单元,用于根据所述网页文件信息选择操作路径并新建目录;第一保存单元,用于保存所述操作路径和新建目录至指定目录;资源保存路径确定单元,用于根据所述指定目录中的新建目录的个数确定资源保存路径;第一保存单元,用于保存所述资源保存路径至源文件目录。
11.可选地,所述资源保存路径确定单元,具体包括:判断子单元,用于判断所述指定目录中的新建目录的个数是否小于设定值,得到第一判断结果;第一资源保存路径确定子单元,用于若所述第一判断结果表示所述指定目录中的新建目录的个数小于设定值,则将所述新建目录对应的操作路径作为资源保存路径;第二资源保存路径确定子单元,用于若所述第一判断结果表示所述指定目录中的新建目录的个数大于或者等于设定值,则新建临时操作路径作为资源保存路径。
12.可选地,所述告警模块,具体包括:判断单元,用于判断所述对比结果的文件修改时间、文件大小、文件内容和md5校验值中的任意一项是否大于告警阈值,得到第二判断结果;告警单元,用于若所述第二判断结果表示所述对比结果的文件修改时间、文件大小、文件内容和md5校验值中的任意一项大于告警阈值,则确定发出告警。
13.根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明提供的一种网页文件监控方法及系统,利用文件系统的内置函数获取网页文件信息;将网页文件信息存储至源文件目录;监控网页文件信息确定网页文件的变化内容;变化内容包括可执行文件、目录、系统配置文件、内容文件、压缩文件和压缩文件夹;将变化内容逐条与源文件目录的网页文件信息对比,得到对比结果;根据对比结果和告警阈值确定告警信息。本发明通过文件级的监控方式实现动态文件和静态文件的全面监控。
附图说明
14.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所
需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
15.图1为本发明提供的网页文件监控方法流程图;图2为本发明提供的网页文件监控方法的流程示意图;图3为本发明提供的根据网页文件信息比对标注的流程图。
具体实施方式
16.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
17.本发明的目的是提供一种网页文件监控方法及系统,通过文件级的监控方式实现动态文件和静态文件的全面监控。
18.为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
19.如图1和图2所示,本发明提供的一种网页文件监控方法,包括:步骤101:利用文件系统的内置函数获取网页文件信息。其中,网页文件信息包括:全项目目录、文件名称、文件存储信息。项目目录和文件是用来监控的网页文件,对应进行的操作和文件访问都是通过这些文件进行的处理。
20.步骤102:将所述网页文件信息存储至源文件目录。根据文件存储信息确定文件的路径信息。将网页文件信息存储于预设的源文件目录中。所述步骤102,具体包括:根据所述网页文件信息选择操作路径并新建目录;保存所述操作路径和新建目录至指定目录;根据所述指定目录中的新建目录的个数确定资源保存路径;保存所述资源保存路径至源文件目录。
21.其中,所述根据所述指定目录中的新建目录的个数确定资源保存路径,具体包括:判断所述指定目录中的新建目录的个数是否小于设定值,得到第一判断结果;若所述第一判断结果表示所述指定目录中的新建目录的个数小于设定值,则将所述新建目录对应的操作路径作为资源保存路径;若所述第一判断结果表示所述指定目录中的新建目录的个数大于或者等于设定值,则新建临时操作路径作为资源保存路径。
22.步骤103:监控所述网页文件信息确定所述网页文件的变化内容;所述变化内容包括可执行文件、目录、系统配置文件、内容文件、压缩文件和压缩文件夹。其中,网页文件包括以htm、html、shtml、xml为后缀的文件。
23.利用系统的文件监控特性,监控上述步骤中获取到目录里文件内容的变化,其中,变化的文件包含:可执行文件、目录、系统配置文件、内容文件、zip压缩文件、zip压缩文件夹及更多文件和目录。系统的文件监控特性,是系统stat机制,通过该机制获取文件内容、属性、权限、所有权、大小等,对文件和目录全面运行检查以确定是否完整。最后利用所述系统的文件监控特性获取的文件信息存储于预设的源文件目录中。stat是服务器操作系统的内置指令,可以用来显示文件的详细信息。下面就是通过stat获取的信息进行一一验证。
24.步骤104:将所述变化内容逐条与所述源文件目录的网页文件信息对比,得到对比结果。
25.根据获取到的内容变化信息,与存储于源文件目录中的文件信息进行比对,其中比对实现方法包括:文件修改时间、比对文件大小、文件内容、md5数字签名验证。
26.使用以上方法依次进行比对。利用文件时间属性,执行时间命令查看最近修改文件内容时间、最近更改文件属性时间。将获取到的时间信息与预设的源文件目录中的第二关联信息进行比对。使用文件系统的块指令以kb级别对比文件大小。以逐行的方式比较文件的内容,并且比较目录下的文件,分析并输出对比文件不同的行。利用md5的加密方法,获取文件的md5值,与原始文件的md5值进行对比。
27.通过以上方法的逐一比对,对不符合任意一项参数的信息进行判断。若相同,则判断网页文件完整无误。若不同,则判断监控路径对应的网页被篡改或受到攻击。
28.步骤105:根据所述对比结果和告警阈值确定告警信息。
29.步骤105,具体包括:判断所述对比结果的文件修改时间、文件大小、文件内容和md5校验值中的任意一项是否大于告警阈值,得到第二判断结果。若所述第二判断结果表示所述对比结果的文件修改时间、文件大小、文件内容和md5校验值中的任意一项大于告警阈值,则确定发出告警。
30.根据比对结果,设定告警条件和告警阈值,将满足告警条件的异常值对应的指定行为作为告警信息,对达到某一阈值状态的判断触发事件,将消息发给运维人员。
31.本发明提供的一种网页文件监控系统,包括:获取模块,用于利用文件系统的内置函数获取网页文件信息。
32.存储模块,用于将所述网页文件信息存储至源文件目录。
33.监控模块,用于监控所述网页文件信息确定所述网页文件的变化内容;所述变化内容包括可执行文件、目录、系统配置文件、内容文件、压缩文件和压缩文件夹。
34.对比模块,用于将所述变化内容逐条与所述源文件目录的网页文件信息对比,得到对比结果。
35.告警模块,用于根据所述对比结果和告警阈值确定告警信息。
36.在实际应用中,所述存储模块,具体包括:选择和新建单元,用于根据所述网页文件信息选择操作路径并新建目录;第一保存单元,用于保存所述操作路径和新建目录至指定目录;资源保存路径确定单元,用于根据所述指定目录中的新建目录的个数确定资源保存路径;第一保存单元,用于保存所述资源保存路径至源文件目录。
37.在实际应用中,所述资源保存路径确定单元,具体包括:判断子单元,用于判断所述指定目录中的新建目录的个数是否小于设定值,得到第一判断结果;第一资源保存路径确定子单元,用于若所述第一判断结果表示所述指定目录中的新建目录的个数小于设定值,则将所述新建目录对应的操作路径作为资源保存路径;第二资源保存路径确定子单元,用于若所述第一判断结果表示所述指定目录中的新建目录的个数大于或者等于设定值,则新建临时操作路径作为资源保存路径。
38.在实际应用中,所述告警模块,具体包括:判断单元,用于判断所述对比结果的文件修改时间、文件大小、文件内容和md5校验值中的任意一项是否大于告警阈值,得到第二判断结果;告警单元,用于若所述第二判断结果表示所述对比结果的文件修改时间、文件大
小、文件内容和md5校验值中的任意一项大于告警阈值,则确定发出告警。
39.本发明通过文件级的监控方式,获取到全部的文件信息,对网页文件的完整性和一致性校验,实现文件的静态文件和动态文件全面监控。本发明还提供一种网页文件监控方法在实际应用中的工作流程,具体如下:利用文件系统内置函数获取进行操作的文件信息。
40.通过指令list()查看网站文件信息。文件信息包括:全项目目录、文件名称、文件存储信息。一般通过文件访问内容的变化只对系统内的部分文件进行操作。
41.选择操作路径,新建目录。
42.将未知路径保存至指定目录下,并对文件名标记。
43.从得到的路径构成文件和数据。
44.一个目录下仅有一个新目录时,该新目录对应的路径作为对应的资源保存路径。
45.一个目录下有两个以上新目录时,新建临时目录路径确定对应的资源保存路径。一个目录下可以有多个新目录,因为每个目录都对应一个路径,目录多的话就不确定资源路径是哪一个,所以新建一个作为资源保存路径。即,将第二个或者更多新目录对应的路径新建一个资源保存路径。
46.将以上确定的对应资源保存路径信息存储于源文件目录信息中。目录对应存储资源信息,信息包括图片、视频等类别。
47.通过以上资源获取对应的url地址信息和mp4、jpg等文件类型信息。
48.执行内置函数获取文件类型、文件字节长度、目录的状态信息和文件最后修改时间。
49.如图3所示,通过以上获取到的信息逐条与监控网页文件比对。
50.执行系统指令stat,显示文件的详细信息,包含访问时间、数据修改时间、状态修改时间。
51.获取到当前的mtime数据修改时间并与源文件目录中的文件时间信息进行比对,判断网页文件信息是否被篡改。通过stat指令可以获得三个时间,atime访问时间,mtime修改时间,ctime执行时间,获取的时间信息是用这三个单词表示的,在本发明中只利用mtime修改时间。
52.执行文件系统的block块指令,记录文件大小信息。
53.执行比较指令
‑‑
suppress-common-lines,获取文件内容信息。其中,
‑‑
suppress-common-lines是操作系统的内置指令,可以通过记录文件内容和行数来比对两个文件内容的差异。
54.页面文件里出现put、delete、patch信息,理解为动态文件。这些信息分别是对数据进行上传、删除、更新操作。当请求页面访问的时候,该页面如果未更新,会反馈一个304状态码,利用这个304状态码进行判断页面是否修改、更新。
55.网页文件存储在磁盘上,第一次访问有个修改时间(即更新这个文件的时间)。
56.再次访问的的时候,会向服务器发送一个if-modified-since的请求,把文件的修改时间带上去。if-modified-since是用户访问网页时,向服务器发送请求时带的信息,包含了最后一次修改的时间,生成缓存记录下来与网页的文件比对。
57.如果这段时间内文件修改了,服务器就会反馈一个修改后的状态码。
58.如果这段时间内文件的内容没有变,服务器就会返回状态码304(不返回文件内容)。
59.利用文件信息属性,记录网页文件最后一次的修改时间last-modified。
60.将这两个变量和上次记录的值的比较,确定网页文件是否修改。
61.取出页面文件,和现在的文件大小进行对比。
62.从每个文件中选择一个或多个待对比的元素节点。
63.将包含指定元素节点的文件作为对比单元。
64.对上述文件元素节点的关键字信息进行判断,在判定所述任一文件的任一对比单元中包含对比的元素节点的关键字信息时,将所述文件添加到待对比列表中。
65.文件中的元素节点可能包含子节点,可能并不存在关键字信息,对于这种不存在关键字信息的对比单元不单独进行比较,只对其上级节点对应的对比单元进行对比。
66.对文件进行加密算法得出文件的md5值,这个值在文件作出任何修改后都会发生改变。
67.将文件的md5值以及签名信息整合为一条完整的信息,并存储到列表中。
68.生成md5数字签名s1,下次同样生成签名s2,比较s2和s1,如果相同,则网页文件没有修改,否则网页文件就有修改。
69.需要说明的是用md5算法对文本签名的速度是极快的,数据可以在毫秒内完成。这种策略虽然也是文件数据传输,但是省掉了i/o操作,对系统性能的提升是很有帮助的。
70.根据上述比对结果,匹配一个或多个技术特征时,按照预先配置的策略形成标准的告警事件流程快速准确的发送给运维人员。
71.预先配置的策略指:当上述信息文件修改时间、文件大小、文件内容、md5校验值任意一项不同时,将具体的不同信息内容发出告警。
72.针对监控文件配置告警规则,包括文件时间、内容、属性、状态。所述文件告警规则包括过滤策略包括任一种或者多种。
73.告警规则对采集到的信息进行过滤匹配,具体包括:当所述文件告警规则包括所述信息时,则与所述过滤字段进行匹配,当匹配时,则触发应用服务器的告警信息。
74.在触发应用服务器的告警信息时,需在监控报警系统提供接收告警信息所需的调用接口。一旦产生告警信息,则将告警信息直接发送到该调用接口。该调用接口接收到请求后,通过触发告警模块会将该消息发送给该项目对应的运维人员,这样项目的运维人员第一时间接收到信息,及时采取有效措施。
75.本方法采用的监控方式,能够监控包括静态文件和动态文件在内的所有文件内容,保证了内容页面的完整创建来源。现有技术对于动态页面无法全面识别,只能跟踪到应用层协议识别技术。通过匹配一套完整的策略,将监控的文件从类型、属性、内容校验三个方面进行操作,比现有技术提供更多维度数据分析方法,通过多数据准确无误的比对判断,提高了对于文件的辨识标注效果。借助于动态化告警分配策略,相比以往单一固定的模板形式,具有灵活、准确、可追溯的优点,实现有效告警。
76.本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说
明即可。
77.本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1