一种文件更新量检测方法及系统与流程

文档序号:11155206阅读:257来源:国知局
一种文件更新量检测方法及系统与制造工艺

本发明涉及计算机技术领域,尤其涉及一种文件更新量检测方法及系统。



背景技术:

文件系统是操作系统用于明确存储设备或分区文件的方法和数据结构,即在存储设备上组织文件的方法。文件系统由三部分组成:文件系统的接口,对对象操纵和管理的软件集合,对象及属性。从系统角度来看,文件系统是对文件存储设备的空间进行组织和分配,负责文件存储并对存入的文件进行保护和检索的系统。具体地说,它负责为用户建立文件,存入、读出、修改、转储文件,控制文件的存取,当用户不再使用时撤销文件等。

传统方法中,用inotify做文件系统检测。inotify是一个Linux内核特性,它监控文件系统,并且及时向专门的应用程序发出相关的事件警告,比如删除、读、写和卸载操作等,还可以跟踪活动的源头和目标等细节。在用inotify做文件系统检测来查找异常更新文件时,把有更新的文件放到队列中,需要对每个更新文件进行记录,再检查文件内容,发现有文件异常后进行报警,但由于每天文件更新量大,当更新量达到并发大几千个文件时,导致要检查的文件数目非常多,运行过程中发现检测到有问题的目标文件需要较长时间,且检测文件更新会对系统负载产生较大压力,可能导致服务器死机。



技术实现要素:

本发明实施例的目的在于:提出一种文件更新量检测方法及系统,来实现检测更新文件中的异常文件时,对文件更新量总和定时检测,降低系统负载量,提高系统整体性能。

为达到上述目的,本发明公开了一种文件更新量检测的方法,包括:

获取文件列表中至少一个待检测文件目录;

在预设时间内检测所述至少一个待检测文件目录中的至少一个业务文件,确定每个待检测文件目录中的更新文件量;

当所述至少一个待检测文件目录的更新文件量总和大于或等于预设阈值时,生成告警信息。

较佳的,在获取文件列表中至少一个待检测文件目录之前,所述文件更新量检测方法还包括:

创建所述文件列表,将所述至少一个待检测文件目录随机存储到所述文件列表中。

较佳的,所述在预设时间内检测所述至少一个待检测文件目录中的至少一个业务文件,确定每个待检测文件目录中的更新文件量,包括:

在预设时间内并发查找所述至少一个待检测文件目录,检测所述至少一个待检测文件目录中的更新文件;

将查找到的所述更新文件记录在记录文档中,生成至少一个记录文档,其中,所述至少一个记录文档与所述至少一个待检测文件目录一一对应;

统计所述至少一个记录文档中记录的所述更新文件量,确定每个待检测文件目录中的更新文件量。

较佳的,所述将查找到的所述更新文件记录在记录文档中,生成至少一个记录文档,包括:

将查找到的所述更新文件的文件名称以及所述更新文件的文件大小记录在记录文档中,生成所述记录文档。

较佳的,所述当所述至少一个待检测文件目录的更新文件量总和大于或等于预设阈值时,生成告警信息,包括:

统计所述至少一个记录文档中所述更新文件的更新文件量总和,确定对应至少一个待检测文件目录的更新文件量总和;

获取所述更新文件量总和与所述预设阈值;

比较所述更新文件量总和与所述预设阈值;

当所述更新文件量总和小于预设阈值时,给所述至少一个记录文档中文件更新量最大的记录文档做标记,所述标记为标识所述记录文档中更新文件存在异常文件隐患的标记;

当所述更新文件量总和大于或等于预设阈值时,生成告警信息。

较佳的,在当所述至少一个待检测文件目录的更新文件量总和大于或等于预设阈值时,生成告警信息之后,包括:

向系统管理人员发送所述告警信息。

为达到上述目的,本发明还公开了一种文件更新量检测系统,其特征在于,包括:

获取模块,用于获取文件列表中至少一个待检测文件目录;

确定模块,用于在预设时间内检测所述至少一个待检测文件目录中的至少一个业务文件,确定每个待检测文件目录中的更新文件量;

告警模块,用于当所述至少一个待检测文件目录的更新文件量总和大于或等于预设阈值时,生成告警信息。

较佳的,所述文件更新量检测系统还包括:

创建模块,用于创建所述文件列表,将所述至少一个待检测文件目录随机存储到所述文件列表中。

较佳的,所述确定模块,具体用于在预设时间内并发查找所述至少一个待检测文件目录,检测所述至少一个待检测文件目录中的更新文件;将查找到的所述更新文件记录在记录文档中,生成至少一个记录文档,其中,所述至少一个记录文档与所述至少一个待检测文件目录一一对应;统计所述至少一个记录文档中记录的所述更新文件量,确定每个待检测文件目录中的更新文件量。

较佳的,所述告警模块,具体用于统计所述至少一个记录文档中所述更新文件的更新文件量总和,确定对应至少一个待检测文件目录的更新文件量总和;获取所述更新文件量总和与所述预设阈值;比较所述更新文件量总和与所述预设阈值;当所述更新文件量总和小于预设阈值时,给所述至少一个记录文档中文件更新量最大的记录文档做标记;或当所述更新文件量总和大于或等于预设阈值时,生成告警信息。

本发明通过把待检测文件目录放到一个文件列表中,通过设定预设时间来查找待检测文件目录中的更新文件,统计所有待检测文件目录中更新文件量总和,比较更新文件量总和与预设阈值,当更新文件量总和大于或等于预设阈值时,生成告警信息。本发明的一种文件更新量检测方法及系统,可以实现定时、有效的检测到文件系统中的更新文件,从而检测出更新文件中的异常文件。比起现有技术中的直接检测文件内容,本发明通过检测文件更新量总和来检测异常文件,有效的降低系统负载的压力,提高报警性能。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例的一种文件更新量检测方法流程图;

图2为本发明实施例的另一种文件更新量检测方法流程图;

图3为本发明实施例的一种文件更新量检测方法中更新文件量总和与预设阈值比较流程图;

图4为本发明实施例的一种文件更新量检测系统图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

下面通过具体的实施例,对本发明进行详细说明。

在计算机系统中,网站页面经常会受到异常文件和大量其他网页文件的入侵,异常文件为用户访问网站时影响用户访问的文件,包括错误文件和与该网站用户访问无关的文件。这些异常文件对该网站造成很大影响,其可能造成对该网站的攻击,例如网站内受到大量非法文件的入侵,造成该网站无法正常访问,影响用户使用,另外,网站内可会有大量其他网页文件信息,虽然不会影响对该网站的正常访问,但是却占用该网站的空间资源,对该网站的网络环境造成影响。因此,需要对网站的更新文件进行检测,查找更新文件中有无异常文件,及时清理异常文件以及和网站无关的更新文件,提高网络资源利用率,优化网络环境是十分有必要的。

传统方法中,利用inotify实现更新文件检测来查找异常更新文件。具体方法是把待检测文件放到队列中,对文件内容进行检测,将检测到的更新文件进行记录,发现更新文件中有异常文件产生报警信息,再告知系统管理人员进行处理。但存在的问题是当更新量达到并发大几千个文件时,导致要检查的文件数目非常多,运行过程中发现检测到有问题的目标文件需要较长时间,且检测文件更新会对系统负载产生较大压力,可能导致服务器死机。基于现有技术中检测更新文件中异常文件的问题,本发明提出了一种文件更新量检测方法及系统。

下面通过具体的实施例,对本发明进行详细说明。

参考图1,图1为本发明实施例的一种文件更新量检测方法流程图,包括:

S101:获取文件列表中至少一个待检测文件目录;

具体的,根据业务文件目录筛选出文件系统中存储的需要检测的文件目录作为待检测文件目录。在实施过程中,将至少一个待检测文件目录存储到文件系统主目录下的一个文件列表中,该至少一个业务文件目录中存储对应的业务文件,首先调用查找命令直接在文件列表中查找至少一个待检测文件目录获取到至少一个待检测文件目录,或者可用自定义查找算法直接在文件列表中查找至少一个待检测文件目录获取到至少一个待检测文件目录都是可取的。需要说明的是,无论用哪种查找算法在文件列表中获取到至少一个待检测文件目录,都属于本专利的保护范围之内。

此处直接在文件列表下获取至少一个待检测文件目录,比起现有技术中在主目录下查找所有文件目录中的至少一个待检测文件目录,本发明的一种文件更新量检测方法可有效提高系统查找效率。

S102:在预设时间内检测至少一个待检测文件目录中的至少一个业务文件,确定每个待检测文件目录中的更新文件量;

具体的,对文件列表设置一个预设时间,该预设时间可根据系统管理人员具体需求来设定。设定预设时间,为检测待检测文件目录中更新文件的异常文件提供更加精准的检测结果,避免实时检测对系统造成的压力,也避免现有技术中对更新文件的异常文件检测不及时导致系统中存储大量异常文件,对网站造成影响,也对系统存储造成压力。

文件列表中存储至少一个待检测文件目录,至少一个待检测文件目录存储对应的至少一个业务文件,在预设时间段内,调用检测命令对文件列表中的至少一个待检测文件目录中的至少一个业务文件进行检测,检测待检测文件目录中的至少一个业务文件的更新文件。对于业务文件内容,如果是二进制的图片、声音、影像文件,可以字节为单位读取文件内容,查找至少一个业务文件的更新文件;如果是文本、数字类型的文件,可以字符为单位读取文件内容,查找至少一个业务文件的更新文件;也可按随机访问的方式读取文件内容,查找至少一个业务文件的更新文件。只要在文件目录下随时间变化实时出现的所有文件都属于更新文件,包括文件目录下原有业务文件大小的更新和文件次数的更新以及新文件的出现都属于更新文件。在检测到更新文件后,统计相应待检测文件目录中的更新文件量,如果更新文件是以更新文件名称记录的,则统计所有更新文件名称即为更新文件量,也可以其它方式统计出更新文件量。统计出更新文件量后便可确定出相应待检测文件目录中的更新文件量。

S103:当至少一个待检测文件目录的更新文件量总和大于或等于预设阈值时,生成告警信息。

具体的,在上述统计出每个待检测文件目录下的更新文件的数量后,统计出至少一个业务文件目录下的更新文件量总和。根据正常情况下文件更新量来对待检测文件目录的更新文件量总和设定一个阈值,比较更新文件量总和与对更新文件量总和设定的阈值大小。如果更新文件量总和大于或等于预设阈值时,说明更新文件中存在异常文件,因为在更新文件中没有异常文件时,更新文件量总和是不会超过设定的阈值的,更新文件中异常文件一般会大量出现导致更新文件量剧增,利用该原理可判断出更新文件中有无异常文件。例如一个门户网站如果受到赌博文件的攻击入侵时,网站内部的更新文件中会出现大量赌博性质的文件影响用户使用,此处的赌博性质的文件可视为异常文件。如果更新文件量总和大于或等于预设阈值时,即更新文件中有异常文件,需要告知系统管理人员进行处理,此时,调用信息生成命令,生成告警信息。

本发明提供的文件更新量检测方法,通过建立一个文件列表,将所有待检测的文件目录存放到文件列表下,在检测更新文件时,直接在文件列表下获取待检测文件目录,提高了查找效率,在待检测文件目录中检测更新文件,统计更新文件量总和,通过判断更新文件量总和和预设阈值的大小关系来检测异常文件。比起现有技术中直接检测更新文件内容来检测异常文件,本发明的文件更新量检测的方法,有效的提高了检测性能,降低了系统负载,以及检测时间,提升整体检测效率。

优选地,本发明实施例的文件更新量检测方法的在获取文件列表中至少一个待检测文件目录之前,包括:

创建文件列表,将至少一个待检测文件目录随机存储到文件列表中。

具体的,在获取文件列表中至少一个待检测文件目录之前,首先调用一个创建函数,该创建函数是用于在主目录下创建一个文件列表的函数。该文件列表的作用是将系统管理人员需要检测的所有待检测文件目录随机存储在该文件列表中,即在一个文件列表中存储至少一个文件目录,一个文件目录中存放至少一个与文件目录内容相关的业务文件。其中,待检测文件目录中存放的是易受恶意信息入侵的业务文件或更新快且更新量大的不相关业务文件,再或者是根据系统管理人员需要重点检测的核心业务文件。在检测时,只需要获取到随机存放在该文件列表中的至少一个文件目录中的更新文件即可。

可见,创建一个文件列表可便于查找待检测的文件目录,节省了需要从所有文件目录中查找需要重点监测的文件目录的时间,同时降低了系统查找的压力,提高查找效率。

优选地,本发明实施例的文件更新量检测方法中一种文件更新量检测方法,可参见图2,图2为本发明实施例的另一种文件更新量检测的方法流程图,包括:

S201:在预设时间内并发查找至少一个待检测文件目录,检测至少一个待检测文件目录中的更新文件;

具体的,对存储在文件列表中的至少一个待检测文件目录设置一个时间,即在预设时间内检测至少一个待检测文件目录,调用查找命令并发查找至少一个待检测文件目录中的更新文件。例如在预设程序中系统查找到待检测文件目录后,计算机服务可直接调用find命令并发查找主目录下至少一个文件目录中的更新文件。当然,使用其他相同或相似功能的查询命令并发查找存储在文件列表中的至少一个待检测文件目录的更新文件也是可取的,也属于本发明的保护范围之内。

S202:将查找到的更新文件记录在记录文档中,生成至少一个记录文档,其中,至少一个记录文档与至少一个待检测文件目录一一对应;

具体的,在查找到存储在文件列表中的至少一个待检测文件目录的更新文件后,建立至少一个记录文档,当文件目录随时间变化出现更新文件时,将对应文件目录中的更新文件记录在记录文档中。例如可以在记录文档按时间先后顺序记录更新文件的文件名称以及该更新文件的文件大小,一条更新文件信息在记录文档中记录一行。建立的记录文档与待检测文件目录对应,即在第一待检测文件目录下建立第一记录文档,在第二待检测文件目录下建立第二记录文档,以此类推。

S203:统计至少一个记录文档中记录的更新文件量,确定对应每个待检测文件目录中的更新文件量。

具体的,根据上述建立的记录文档,例如可以统计记录文档中记录的更新文件行数,一行为一个更新文件量,统计完记录文档中的更新文件行数即可确定出该记录文档中的文件更新量,也可确定出至少一个记录文档对应的每个待检测文件目录中的更新文件量。

可见,通过在文件列表下并发查找文件目录中的更新文件可提高查找效率,另外,将查找到的更新文件记录在记录文档中,只需要统计出记录文档中记录的更新文件量,方便对每个更新文件再次查找,提高查找效率,降低系统负载压力。

优选地,将查找到的更新文件记录在记录文档中,生成至少一个记录文档,包括:

将查找到的更新文件的文件名称以及更新文件的文件大小记录在记录文档中,生成记录文档。

具体的,在查找到更新文件后,将更新文件的文件名称以及更新文件大小记录在记录文档中,该记录文档对应记录相应文件目录下的更新文件。

通过在记录文档中记录更新文件的文件名称以及更新文件的文件大小,系统管理人员可通过查看更新文件的文件名称以及更新文件的文件大小,确定出更新文件的异常文件,节省再去查看更新文件的内容的时间,提高后期系统管理人员查找效率。

优选地,当至少一个待检测文件目录的更新文件量总和大于或等于预设阈值时,生成告警信息,可参见图3,图3为本发明实施例的一种文件更新量检测方法中更新文件量总和与预设阈值比较流程图,包括:

S301:统计至少一个记录文档中更新文件的更新文件量总和,确定对应至少一个待检测文件目录的更新文件量总和;

具体的,在查找到所有的更新文件记录在记录文档后,调用预设统计函数,该统计函数用于统计至少一个记录文档中文件更新量总和,统计出的记录文档中文件更新量总和即对应至少一个文件目录中更新文件量总和。

S302:获取更新文件量总和与预设阈值;

具体的,在统计函数统计到文件目录的文件更新量总和后,调用预设的获取函数,获取到该统计的文件更新量总和以及为文件更新量设定的阈值。

S303:比较更新文件量总和与预设阈值;

具体的,在获取函数获取到文件更新量总和和预设阈值后,设定的比较函数比较这两个值的大小。当更新文件量总和小于预设阈值时,执行步骤S304,否则执行步骤S305。

S304:当更新文件量总和小于预设阈值时,给至少一个记录文档中文件更新量最大的记录文档做标记,标记为标识记录文档中更新文件存在异常文件隐患的标记;

S305:当更新文件量总和大于或等于预设阈值时,生成告警信息。

具体的,在系统中,根据正常情况下对文件更新量设定预设阈值时,即更新文件中没有异常文件时,更新文件量总和是不会超过该预设阈值的,当存在异常文件时,文件更新量总和会远远超过该预设阈值,因此通过预设阈值可很好地判断出更新文件中是否存在异常文件。

当更新文件量总和没有超过预设阈值时,返回到记录文档中,找出记录文档中更新文件量最多的记录文档标记出来,因为该记录文档中的更新文件可能存在异常,避免检测时的遗漏,做出标记为系统管理人员后期查看做参考;如果当更新文件量总和超过预设阈值时,说明更新文档中存在异常文件,此时生成告警信息。

可见,本发明的一种文件更新量检测方法,通过比较文件更新量总和与预设阈值的大小来判断更新文件中有无异常文件,可提高更新文件的检测效率,提升报警性能。

优选地,在当至少一个待检测文件目录的更新文件量总和大于或等于预设阈值时,生成告警信息之后,包括:

向系统管理人员发送告警信息。

具体的,当生成告警信息后,调用预设发送函数将生成的告警信息通过系统的发送信息接口、以短信的形式发送到系统管理人员的手机上。当接收到告警信息后,可查看记录的更新文件量最多的记录文档,此记录文档对应的更新文件为异常文件,在可通过文件内容筛选技术,筛选出需要保留的更新文件,将不需要的更新文件视为异常文件,调用预设删除命令删除异常文件。

本发明实施例还公开了一种文件更新量检测系统,可参见图4,图4为本发明实施例的一种文件更新量检测系统图,包括:

获取模块401,用于获取文件列表中至少一个待检测文件目录;

确定模块402,用于在预设时间内检测至少一个待检测文件目录中的至少一个业务文件,确定每个待检测文件目录中的更新文件量;

告警模块403,用于当至少一个待检测文件目录的更新文件量总和大于或等于预设阈值时,生成告警信息。

本发明提供的文件更新量检测系统,通过建立一个文件列表,将所有待检测的文件目录存放到文件列表下,在检测更新文件时,直接在文件列表下获取待检测文件目录,提高了查找效率,在待检测文件目录中检测更新文件,统计更新文件量总和,通过判断更新文件量总和和预设阈值的大小关系来检测异常文件,比起现有技术中直接检测更新文件内容来检测异常文件,本发明的文件更新量检测方法,有效的提高了检测性能,降低了系统负载,以及检测时间,提升整体检测效率。

需要说明的是,本发明实施例的系统是应用上述文件更新量检测方法的系统,则上述文件更新量检测方法的所有实施例均适用于该装置,且均能达到相同或相似的有益效果。

优选地,本发明实施例的一种文件更新量检测系统中在获取模块之前,文件更新量检测系统还包括:

创建模块,用于创建所述文件列表,将所述至少一个待检测文件目录随机存储到所述文件列表中。

优选地,本发明实施例的一种文件更新量检测系统中的确定模块,具体用于在预设时间内并发查找所述至少一个待检测文件目录,检测所述至少一个待检测文件目录中的更新文件;将查找到的所述更新文件记录在记录文档中,生成至少一个记录文档,其中,所述至少一个记录文档与所述至少一个待检测文件目录一一对应;统计所述至少一个记录文档中记录的所述更新文件量,确定每个待检测文件目录中的更新文件量。

优选地,本发明实施例的一种文件更新量检测系统中的确定模块,具体还用于将查找到的所述更新文件的文件名称以及所述更新文件的文件大小记录在记录文档中,生成所述记录文档。

优选地,本发明实施例的一种文件更新量检测系统中的告警模块,具体用于统计所述至少一个记录文档中所述更新文件的更新文件量总和,确定对应至少一个待检测文件目录的更新文件量总和;获取所述更新文件量总和与所述预设阈值;比较所述更新文件量总和与所述预设阈值;当所述更新文件量总和小于预设阈值时,给所述至少一个记录文档中文件更新量最大的记录文档做标记,所述标记为标识所述记录文档中更新文件存在异常文件隐患的标记;或当所述更新文件量总和大于或等于预设阈值时,生成告警信息。

优选地,在本发明实施例的一种文件更新量检测系统中的告警模块之后,文件更新量检测系统还包括:

发送模块,用于向系统管理人员发送所述告警信息。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1