一种敏感信息检测方法及系统与流程

文档序号:36167479发布日期:2023-11-23 20:06阅读:79来源:国知局
一种敏感信息检测方法及系统与流程

本发明涉及敏感信息检测,更具体地,涉及一种敏感信息检测方法及系统。


背景技术:

1、现代社会中,网络技术的发展使得人们在信息传递和交流方面有了更大的便利。然而,随着网络的快速发展和普及,网络安全问题也变得越来越突出,个人敏感信息保护问题尤为严重。近几年来,由于个人信息泄露所导致的骚扰、诈骗案件数量不断攀升,个人敏感信息泄露的问题变得日益严重。

2、针对该情况,目前有相关的敏感信息检测技术,通过内置及添加的密级模板、关键字、敏感词库等方式进行检索,通过命中情况进行判断,但存在非常大的缺陷,首先该方式只能检测文件名称或内容包含固定关键字的文件,针对文件内容包含大量个人敏感信息例如身份证号、手机号、银行卡号等非固定内容,没办法通过密级模板、关键字、敏感词库等方式检测出,且通过密级模板、关键字、敏感词库等方式的检测精准性太差,命中的文件大多数并非真正的敏感文件,只是文件内容刚好包含了固定关键字,所以该方式在现实环境中局限性太大。

3、现有技术中提出一种防止敏感信息泄露的方法,该方法调用预设的检测关键词,对各个应用程序app本地存储的文件内容进行特征匹配,判断所述文件内容中是否存在与所述检测关键词相匹配的字段;若所述文件内容中存在与所述检测关键词相匹配的字段,则将所述字段确定为敏感字段;根据所述敏感字段,生成用于提醒用户删除所述敏感字段的提醒消息。该方法的缺陷是,仅检测关键词字段,命中的文件大多数并非真正的敏感文件,只是文件内容刚好包含了固定关键字,检测精确度不足。

4、为此,结合以上需求和现有技术缺陷,本技术提出了一种敏感信息检测方法及系统。


技术实现思路

1、本发明提供了一种敏感信息检测方法及系统,能够对终端电脑违规存储或操作个人敏感信息等符合正则表达式匹配算法规则的敏感信息进行发现,并自动告警且对匹配的敏感文件进行自动加密或自动删除。

2、本发明的首要目的是为解决上述技术问题,本发明的技术方案如下:

3、本发明第一方面提供了一种敏感信息检测方法,本方法包括以下步骤:

4、s1、构建匹配字典库,通过选择匹配字典库内的正则匹配表达式配置敏感信息检测策略。

5、s2、对终端存储及操作的文件进行全文检索及动态监控,根据敏感信息检测策略对文件进行匹配,判断匹配结果是否符合预设的匹配规则,若是,将该文件确定为敏感文件,执行下一步,否则,不对该文件进行任何操作。

6、s3、生成敏感文件日志数据,向管理员发出告警通知,并根据预设的处置措施对敏感文件进行处理。

7、进一步的,所述构建匹配字典库的具体过程为:采用内置或用户手动添加的方式将敏感信息通过正则表达式匹配算法转换为正则匹配表达式并保存至匹配字典库;所述预设的匹配规则包括有:身份证号、银行卡号和手机号。

8、进一步的,所述正则匹配表达式中包括有以下表达形式:

9、^[·]\d{·}(·|·)[\dxx]$

10、其中,^表示匹配字符串的首位,$表示匹配字符串的末位;[·]表示匹配单个数字,数字取值范围为方括号内的数值范围;\d{·}表示匹配若干位数的数字,所述位数由大括号内的数字确定;(·|·)表示匹配具体的数字,符号|表示或关系;[\dxx]表示匹配字符x或是任意数字x。

11、进一步的,所述敏感信息检测策略包括有:检测规则、匹配阈值与处置措施;所述通过选择匹配字典库内的正则匹配表达式配置敏感信息检测策略的具体过程为:通过选择匹配字典库的正则匹配表达式进行组合的形式配置检测规则,设置匹配阈值与处置措施;所述组合的形式包括有:以若干个与符号或者或符号对正则匹配表达式进行组合,得到检测规则;所述匹配阈值为文件内容根据匹配规则命中敏感信息的次数;所述处置措施包括有:通过告警形式通知管理员、自动删除确认的敏感文件或对确认的敏感文件自动加密。

12、进一步的,所述全文检索的具体过程为:对终端的操作系统中的文件系统进行解析,得到文件目录,对文件目录进行查询得到符合预设匹配规则的文件类型,获取该文件的文件控制块,根据文件控制块得到文件的物理地址,通过物理组织方式得到文件在磁盘上的物理位置,启动磁盘驱动程序将该文件读入内存,根据预设的敏感信息检测策略对所有文件的文件头、正文、标题和文件名进行检索。

13、进一步的,所述动态监控的具体过程为:通过操作系统监控文件变更,获取文件的原始操作,通过线程缓存分析方法对所述原始操作进行分析,并还原为二级文件操作,再通过二级缓存将二级文件操作分析还原为用户操作,根据预设的敏感信息检测策略对存在用户操作的文件进行检测,判断该文件是否为敏感文件。

14、进一步的,所述步骤s2的具体过程为:根据匹配检测策略对终端存储及操作的文件进行检测,文件在检索过程中首先判断文件内容是否命中在先配置的检测规则,若有文件内容命中检测规则,则待文件检测完成后判断命中检测规则的次数是否达到预设的匹配阈值,若达到匹配阈值则将该文件判定为敏感文件,否则对该文件不执行任何操作。

15、本发明第二方面提供了一种敏感信息检测系统,该系统用于所述的一种敏感信息检测方法,包括有:匹配字典库模块、检测策略配置模块、敏感文件监测模块和处理模块。

16、所述检测策略配置模块通过选择所述匹配字典库模块内的正则匹配表达式配置敏感信息检测策略;所述敏感文件监测模块对终端存储及操作的文件进行全文检索及动态监控,根据敏感信息检测策略对文件进行匹配,判断匹配结果是否符合预设的匹配规则,输出敏感文件判断结果;所述处理模块生成敏感文件日志数据,向管理员发出告警通知,并根据预设的处置措施对敏感文件进行处理。

17、进一步的,所述匹配字典库模块内存储有个人敏感信息,所述个人敏感信息以正则表达式的形式存储,并通过组合的形式得到正则匹配表达式。

18、进一步的,所述检测策略配置模块通过选择匹配字典库模块内的正则匹配表达式进行组合的形式配置检测规则,设置匹配阈值与处置措施;所述处理模块根据预设的处置措施对敏感文件进行处理,所述处置措施包括有:通过告警形式通知管理员、自动删除确认的敏感文件或对确认的敏感文件自动加密。

19、进一步的,所述敏感文件监测模块对终端存储及操作的文件进行全文检索及动态监控,根据敏感信息检测策略对文件进行匹配,判断匹配结果是否符合预设的匹配规则,输出敏感文件判断结果的具体过程为:根据预设的匹配检测策略对终端存储及操作的文件进行检测,文件在检索过程中首先判断文件内容是否命中在先配置的检测规则,若有文件内容命中检测规则,则待文件检测完成后判断命中检测规则的次数是否达到预设的匹配阈值,若达到匹配阈值则将该文件判定为敏感文件,否则对该文件不执行任何操作。

20、与现有技术相比,本发明技术方案的有益效果是:

21、本发明提供了一种敏感信息检测方法及系统,根据匹配字典库内的正则匹配表达式配置敏感信息检测策略,采用该策略对终端文件进行全文检索及动态监控,根据敏感信息检测策略对文件进行匹配得到敏感文件,能够对终端违规存储或操作个人敏感信息等符合正则表达式匹配算法规则的敏感信息进行发现,并自动告警且对匹配的敏感文件进行处置,具有更高的精确度和更好的适用范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1