数据识别方法、装置、电子设备及存储介质与流程

文档序号:32345748发布日期:2022-11-26 11:17阅读:来源:国知局

技术特征:
1.一种数据识别方法,其特征在于,包括:获取待识别文件;对所述待识别文件进行数据切分,得到多个待识别数据;并行对各所述待识别数据进行敏感数据识别,得到数据识别结果。2.根据权利要求1所述的方法,其特征在于,所述对所述待识别文件进行数据切分,得到多个待识别数据,包括:基于数据切分阈值对所述待识别文件进行数据切分,得到多个待识别数据。3.根据权利要求1所述的方法,其特征在于,所述并行对各所述待识别数据进行敏感数据识别,得到数据识别结果,包括:并行确定各所述待识别数据的数据类型,对于任一待识别数据,基于所述待识别数据的数据类型确定敏感数据识别方法;基于所述敏感数据识别方法对所述待识别数据进行识别,得到数据识别结果。4.根据权利要求3所述的方法,其特征在于,所述并行确定各所述待识别数据的数据类型,包括:在多线程并行处理方式下,对于任一待识别数据,基于所述待识别数据的数据内容信息,和/或所述待识别数据的文件后缀信息,确定所述待识别数据的数据类型。5.根据权利要求3所述的方法,其特征在于,所述基于所述敏感数据识别方法对所述待识别数据进行识别,得到数据识别结果,包括:在所述待识别数据的数据类型为结构化数据的情况下,对所述待识别数据进行随机采样,得到随机采样数据,基于所述敏感数据识别方法对所述随机采样数据进行识别,得到数据识别结果;在所述待识别数据的数据类型为非结构化数据的情况下,对所述待识别数据进行解析,得到解析数据,基于所述数据识别方法对所述解析数据进行识别,得到数据识别结果。6.根据权利要求5所述的方法,其特征在于,所述基于所述敏感数据识别方法对所述随机采样数据进行识别,得到数据识别结,包括:基于正则表达式对所述随机采样数据进行匹配,得到正则匹配结果,基于数据字典对正则匹配结果进行匹配,得到数据识别结果;或者,基于正则表达式对所述随机采样数据进行匹配,得到正则匹配结果,将所述正则匹配结果输入至预先训练完成的敏感数据识别模型,得到数据识别结果。7.根据权利要求1所述的方法,其特征在于,在基于所述数据识别方法对所述待识别数据进行识别,得到数据识别结果之后,还包括:在所述数据识别结果为敏感数据的情况下,获取所述待识别数据中敏感数据的位置信息;基于所述待识别数据中敏感数据的位置信息对所述待识别数据进行脱敏,得到脱敏数据。8.一种数据识别装置,其特征在于,包括:文件获取模块,用于获取待识别文件;数据切分模块,用于对所述待识别文件进行数据切分,得到多个待识别数据;数据识别模块,用于并行对各所述待识别数据进行敏感数据识别,得到数据识别结果。
9.一种电子设备,其特征在于,所述电子设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的数据识别方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的数据识别方法。

技术总结
本发明公开了一种数据识别方法、装置、电子设备及存储介质。该方法包括:获取待识别文件;对所述待识别文件进行数据切分,得到多个待识别数据;并行对各所述待识别数据进行敏感数据识别,得到数据识别结果。通过上述技术方案,实现了数据切分,将切分后的多个待识别数据并行进行敏感数据识别,提高了敏感数据识别的处理速度。的处理速度。的处理速度。


技术研发人员:钟丹东 吕晓彦
受保护的技术使用者:江苏保旺达软件技术有限公司
技术研发日:2022.08.22
技术公布日:2022/11/25
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1