敏感文件扫描方法、装置、计算机设备和存储介质与流程

文档序号:35967856发布日期:2023-11-09 08:16阅读:57来源:国知局
敏感文件扫描方法、装置、计算机设备和存储介质与流程

本技术涉及信息安全,特别是涉及一种敏感文件扫描方法、装置、计算机设备、存储介质和计算机程序产品。


背景技术:

1、在日常工作中,经常会有需要向同事共享文件的需求。为了方便,员工通常会通过共享目录或文件服务器实现文件共享。但是,有时员工会在不经意间将一些敏感或涉密的文件上传到共享目录或文件服务器中,而共享目录或文件服务器能够被其他人访问到,这会带来信息泄露的风险。

2、现有的方法基本都是对文本或doc文档类型的文件进行扫描,然后显示扫描出的敏感文件,且基本都是将共享目录下的所有文件都进行扫描。然而,这种方法会浪费大量的时间和计算资源,影响扫描的效率。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种敏感文件扫描方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面,本技术提供了一种敏感文件扫描方法。所述方法包括:

3、获取待扫描的共享文件及所述共享文件的文件类型;

4、根据所述文件类型,从所述共享文件中筛选出可存储敏感信息的候选文件;

5、获取所述候选文件的文件索引信息,根据所述文件索引信息查询历史扫描文件索引库,根据查询结果确定出所述候选文件中的增量文件;所述历史扫描文件索引库中存储有历史扫描过的共享文件的文件索引信息;

6、通过预设的敏感条件对所述增量文件进行检测,得到所述增量文件中的敏感文件,作为所述待扫描的共享文件中的敏感文件。

7、在其中一个实施例中,所述文件类型包括第一类文件类型、第二类文件类型和第三类文件类型;其中,所述第一类文件类型为需要进行敏感文件判断的文件类型,所述第二类文件类型为经过加密后的文件类型,所述第三类文件类型为除所述第一类文件类型和所述第二类文件类型之外的其他类型;

8、所述根据所述文件类型,从所述共享文件中筛选出可存储敏感信息的候选文件,包括:

9、若所述共享文件的文件类型为第一类文件类型,则确定所述共享文件为候选文件;

10、若所述共享文件的文件类型为第二类文件类型,则调用文件类型识别命令确定所述共享文件的输出信息,当所述输出信息不包含预设第一内容信息时,确定所述共享文件为候选文件;

11、若所述共享文件的文件类型为第三类文件类型,则调用文件类型识别命令确定所述共享文件的输出信息,当所述输出信息包含预设第二内容信息时,确定所述共享文件为候选文件。

12、在其中一个实施例中,所述文件索引信息包括文件名称、存储路径和文件特征值;

13、所述根据所述文件索引信息查询历史扫描文件索引库,根据查询结果确定出所述候选文件中的增量文件,包括:

14、根据所述候选文件的文件索引信息中的文件名称和存储路径,查询历史扫描文件索引库;

15、在所述历史扫描文件索引库中存在与所述文件名称和所述存储路径均对应的目标共享文件的情况下,获取所述目标共享文件的文件特征值;

16、若所述目标共享文件的文件特征值与所述候选文件的文件索引信息中的文件特征值不相同,则确定所述候选文件为增量文件。

17、在其中一个实施例中,在所述根据所述候选文件的文件索引信息中的文件名称和存储路径,查询历史扫描文件索引库之后,还包括:

18、在所述历史扫描文件索引库中不存在与所述文件名称和所述存储路径均对应的共享文件的情况下,确定所述文件索引信息对应的候选文件为增量文件。

19、在其中一个实施例中,在所述根据查询结果确定出所述候选文件中的增量文件之后,还包括:

20、获取所述增量文件的文件索引信息;

21、在所述历史扫描文件索引库中创建所述增量文件的文件索引信息,或者更新所述增量文件的文件索引信息。

22、在其中一个实施例中,所述获取待扫描的共享文件,包括:

23、获取处于运行状态的共享程序的配置文件;

24、对所述配置文件进行分析,得到所述共享程序对应的共享目录列表;所述共享目录列表中包括多个共享目录,所述共享目录下存在共享文件;

25、将所述共享目录列表中每个共享目录下的共享文件作为待扫描的共享文件。

26、在其中一个实施例中,所述共享程序有多个;

27、所述对所述配置文件进行分析,得到所述共享程序对应的共享目录列表,包括:

28、获取各个共享程序的配置文件的内容格式信息;

29、根据所述内容格式信息,检测对应配置文件中的内容,得到所述各个共享程序各自对应的共享目录;

30、对所述各个共享程序对应的共享目录进行去重处理,得到所述各个共享程序对应的共享目录列表。

31、在其中一个实施例中,在所述通过预设的敏感条件对所述增量文件进行检测,得到所述增量文件中的敏感文件,作为所述待扫描的共享文件中的敏感文件之后,还包括:

32、对所述敏感文件进行加密处理,得到所述敏感文件对应的加密文件;

33、将所述敏感文件替换为所述敏感文件对应的加密文件。

34、第二方面,本技术还提供了一种敏感文件扫描装置。所述装置包括:

35、共享文件获取模块,用于获取待扫描的共享文件及所述共享文件的文件类型;

36、候选文件筛选模块,用于根据所述文件类型,从所述共享文件中筛选出可存储敏感信息的候选文件;

37、增量文件确定模块,用于获取所述候选文件的文件索引信息,根据所述文件索引信息查询历史扫描文件索引库,根据查询结果确定出所述候选文件中的增量文件;所述历史扫描文件索引库中存储有历史扫描过的共享文件的文件索引信息;

38、敏感文件检测模块,用于通过预设的敏感条件对所述增量文件进行检测,得到所述增量文件中的敏感文件。

39、第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

40、获取待扫描的共享文件及所述共享文件的文件类型;

41、根据所述文件类型,从所述共享文件中筛选出可存储敏感信息的候选文件;

42、获取所述候选文件的文件索引信息,根据所述文件索引信息查询历史扫描文件索引库,根据查询结果确定出所述候选文件中的增量文件;所述历史扫描文件索引库中存储有历史扫描过的共享文件的文件索引信息;

43、通过预设的敏感条件对所述增量文件进行检测,得到所述增量文件中的敏感文件,作为所述待扫描的共享文件中的敏感文件。

44、第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

45、获取待扫描的共享文件及所述共享文件的文件类型;

46、根据所述文件类型,从所述共享文件中筛选出可存储敏感信息的候选文件;

47、获取所述候选文件的文件索引信息,根据所述文件索引信息查询历史扫描文件索引库,根据查询结果确定出所述候选文件中的增量文件;所述历史扫描文件索引库中存储有历史扫描过的共享文件的文件索引信息;

48、通过预设的敏感条件对所述增量文件进行检测,得到所述增量文件中的敏感文件,作为所述待扫描的共享文件中的敏感文件。

49、第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:

50、获取待扫描的共享文件及所述共享文件的文件类型;

51、根据所述文件类型,从所述共享文件中筛选出可存储敏感信息的候选文件;

52、获取所述候选文件的文件索引信息,根据所述文件索引信息查询历史扫描文件索引库,根据查询结果确定出所述候选文件中的增量文件;所述历史扫描文件索引库中存储有历史扫描过的共享文件的文件索引信息;

53、通过预设的敏感条件对所述增量文件进行检测,得到所述增量文件中的敏感文件,作为所述待扫描的共享文件中的敏感文件。

54、上述敏感文件扫描方法、装置、计算机设备、存储介质和计算机程序产品,获取待扫描的共享文件及共享文件的文件类型,根据文件类型,从共享文件中筛选出可存储敏感信息的候选文件,去除共享文件不会存储敏感信息的文件,减少敏感文件扫描所占用的资源和时间;接着,获取候选文件的文件索引信息,根据文件索引信息查询历史扫描文件索引库,根据查询结果确定出候选文件中的增量文件,基于历史扫描文件索引库去除已经扫描过的文件,减少最后需要扫描的共享文件数量,提高敏感文件扫描的效率;最后通过预设的敏感条件对增量文件进行检测,得到增量文件中的敏感文件。上述敏感文件扫描方法,根据文件类型和历史扫描文件索引库,分别去除共享文件中不会存储敏感信息的文件和已经扫描过的文件,有效减少了最终需要扫描的共享文件数量,进而减少了敏感文件扫描所占用的资源和时间,有效提高敏感文件扫描的效率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1