一种数据脱敏方法、系统和电子设备与流程

文档序号:23338757发布日期:2020-12-18 16:32阅读:184来源:国知局
一种数据脱敏方法、系统和电子设备与流程

本发明涉及数据脱敏技术领域,尤其涉及一种数据脱敏方法、系统和电子设备。



背景技术:

数据脱敏,是指对某些敏感数据进行数据变形,能可靠地保护敏感数据,例如,在涉及用户安全数据或一些商业性敏感数据的情况下,需对敏感数据如身份证号、手机号、卡号等个人信息等进行脱敏,以防止身份证号、手机号、卡号等个人信息的泄露,再进行后续处理和分析;例如,在电力行业,电力的各用户的个人信息和电量等均为商业性敏感数据,也需要对各用户的个人信息和电量等敏感数据进行脱敏,再进行后续处理和分析;

目前,数据脱敏的方案为:首先,在多个部门的配合下,得到多个敏感数据,然后根据敏感数据编写用于数据脱敏的脱敏脚本,通过脱敏脚本实现对待脱敏文件中的敏感数据进行脱敏,得到脱敏后的文件,然后再对脱敏后的文件进行后续处理和分析,但是由于程序员编写脱敏脚本时,需要跨数据库,极易出错,并且需要程序员定制脱敏脚本中的脱敏规则,极其繁琐,工作量大,而且对待脱敏文件中的敏感数据进行脱敏时,由于脱敏脚本的可查阅性较低,需专业人员解读后方可查看,因此,需对脱敏脚本进行改写,以便于对用户进行培训,由于对敏感数据进行脱敏,也不便于进行后续处理和分析。



技术实现要素:

本发明所要解决的技术问题是针对现有技术的不足,提供了一种数据脱敏方法、系统和电子设备。

本发明的一种数据脱敏方法的技术方案如下:

从待脱敏文件中获取至少一个目标数据;

分别为每个目标数据随机生成一个秘钥,并对每个秘钥进行处理后得到每个目标数据对应的脱敏目标数据,且所述每个目标数据与其对应的脱敏目标数据的字段属性相同;

在所述待脱敏文件中,将每个目标数据替换为对应的脱敏目标数据,得到脱敏文件。

本发明的一种数据脱敏方法的有益效果如下:

通过分别为每个目标数据随机生成一个秘钥,并对每个秘钥进行处理后得到每个目标数据对应的脱敏目标数据,将待脱敏文件中的每个目标数据替换为对应的脱敏目标数据,得到脱敏文件,可以有效防止目标数据的泄露,降低因目标数据的泄露所造成的危害,而且,本申请不需要跨数据库,不易出错,且流程简单、无技术门槛,不需要对用户进行培训,就能使用户对目标数据进行脱敏,而且,每个目标数据与其对应的脱敏目标数据的字段属性相同,便于进行后续处理和分析。

在上述方案的基础上,本发明的一种数据脱敏方法还可以做如下改进。

进一步,所述分别为每个目标数据随机生成一个秘钥,并对每个秘钥进行处理后得到每个目标数据对应的脱敏目标数据,包括:

分别为每个目标数据随机生成一个数字作为密钥;

判断任一目标数据是否为日期,若是,将所述日期提前与该目标数据对应的数字相同的天数后所得到的日期,作为该目标数据对应的脱敏目标数据;若否,按照用户选择的脱敏方式对该目标数据对应的数字进行处理后,得到该目标数据对应的脱敏目标数据,直至得到每个目标数据对应的脱敏目标数据。

进一步,所述按照用户选择的脱敏方式对该目标数据对应的数字进行处理后,得到该目标数据对应的脱敏目标数据,包括:

根据用户选择的第一公式、第二公式、第三公式、第四公式或第五公式得到该目标数据对应的脱敏目标数据,其中,所述第一公式为n=n×lnn,所述第二公式为n=n×lgn,所述第三公式为所述第四公式为所述第五公式为n=n/1000,n表示该目标数据对应的脱敏目标数据,n表示该目标数据对应的数字。

采用上述进一步方案的有益效果是:通过预设不同的脱敏方式,便于用户进行选择,便于用户个性化、定制化地对目标数据进行脱敏,得到脱敏文件。

进一步,还包括:

生成映射关系文件,所述映射关系文件包括所有的目标数据和所有的脱敏目标数据,及其之间的一一对应的关系;

根据所述映射关系文件对所述脱敏文件进行解密,得到所述待脱敏文件。

采用上述进一步方案的有益效果是:通过映射关系文件能对脱敏文件进行解密,得到待脱敏文件,以便于查看目标数据。

本发明的一种数据脱敏系统的技术方案如下:

包括获取模块、生成模块和替换模块;

所述获取模块用于从待脱敏文件中获取至少一个目标数据;

所述生成模块用于分别为每个目标数据随机生成一个秘钥,并对每个秘钥进行处理后得到每个目标数据对应的脱敏目标数据,且所述每个目标数据与其对应的脱敏目标数据的字段属性相同;

所述替换模块用于在所述待脱敏文件中,将每个目标数据替换为对应的脱敏目标数据,得到脱敏文件。

本发明的一种数据脱敏系统的有益效果如下:

通过分别为每个目标数据随机生成一个秘钥,并对每个秘钥进行处理后得到每个目标数据对应的脱敏目标数据,将待脱敏文件中的每个目标数据替换为对应的脱敏目标数据,得到脱敏文件,可以有效防止目标数据的泄露,降低因目标数据的泄露所造成的危害,而且,本申请不需要跨数据库,不易出错,且流程简单、无技术门槛,不需要对用户进行培训,就能使用户对目标数据进行脱敏,而且,每个目标数据与其对应的脱敏目标数据的字段属性相同,便于进行后续处理和分析。

在上述方案的基础上,本发明的一种数据脱敏系统还可以做如下改进。

进一步,所述生成模块具体用于:

分别为每个目标数据随机生成一个数字作为密钥;

判断任一目标数据是否为日期,若是,将所述日期提前与该目标数据对应的数字相同的天数后所得到的日期,作为该目标数据对应的脱敏目标数据;若否,按照用户选择的脱敏方式对该目标数据对应的数字进行处理后,得到该目标数据对应的脱敏目标数据,直至得到每个目标数据对应的脱敏目标数据。

进一步,所述生成模块具体用于:

根据用户选择的第一公式、第二公式、第三公式、第四公式或第五公式得到该目标数据对应的脱敏目标数据,其中,所述第一公式为n=n×lnn,所述第二公式为n=n×lgn,所述第三公式为所述第四公式为所述第五公式为n=n/1000,n表示该目标数据对应的脱敏目标数据,n表示该目标数据对应的数字。

采用上述进一步方案的有益效果是:通过预设不同的脱敏方式,便于用户进行选择,便于用户个性化、定制化地对目标数据进行脱敏,得到脱敏文件。

进一步,还包括解密模块,所述解密模块用于:

生成映射关系文件,所述映射关系文件包括所有的目标数据和所有的脱敏目标数据,及其之间的一一对应的关系;

根据所述映射关系文件对所述脱敏文件进行解密,得到所述待脱敏文件。

采用上述进一步方案的有益效果是:通过映射关系文件能对脱敏文件进行解密,得到待脱敏文件,以便于查看目标数据。

本发明的一种电子设备的技术方案如下:

包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如上述任一项所述的一种数据脱敏方法的步骤。

本发明的一种电子设备的有益效果如下:

通过分别为每个目标数据随机生成一个秘钥,并对每个秘钥进行处理后得到每个目标数据对应的脱敏目标数据,将待脱敏文件中的每个目标数据替换为对应的脱敏目标数据,得到脱敏文件,可以有效防止目标数据的泄露,降低因目标数据的泄露所造成的危害,而且,本申请不需要跨数据库,不易出错,且流程简单、无技术门槛,不需要对用户进行培训,就能使用户对目标数据进行脱敏,而且,每个目标数据与其对应的脱敏目标数据的字段属性相同,便于进行后续处理和分析。

附图说明

图1为本发明实施例的一种数据脱敏方法的流程示意图;

图2为本发明实施例的一种数据脱敏系统的结构示意图;

图3为本发明实施例的一种电子设备的结构示意图;

具体实施方式

如图1所示,本发明实施例的一种数据脱敏方法,包括如下步骤:

s1、从待脱敏文件中获取至少一个目标数据;

s2、分别为每个目标数据随机生成一个秘钥,并对每个秘钥进行处理后得到每个目标数据对应的脱敏目标数据,且所述每个目标数据与其对应的脱敏目标数据的字段属性相同;

s3、在所述待脱敏文件中,将每个目标数据替换为对应的脱敏目标数据,得到脱敏文件。

通过分别为每个目标数据随机生成一个秘钥,并对每个秘钥进行处理后得到每个目标数据对应的脱敏目标数据,将待脱敏文件中的每个目标数据替换为对应的脱敏目标数据,得到脱敏文件,可以有效防止目标数据的泄露,降低因目标数据的泄露所造成的危害,而且,本申请不需要跨数据库,不易出错,且流程简单、无技术门槛,不需要对用户进行培训,就能使用户对目标数据进行脱敏,而且,每个目标数据与其对应的脱敏目标数据的字段属性相同,便于进行后续处理和分析。

其中,目标数据可根据实际情况进行确认和调整,例如待脱敏文件中包括10000个电力用户的信息,且每个电力用户的信息包括身份证号、手机号、电卡卡号、日期、电量等,首先确定目标数据的类型,假设目标数据的类型为数字,也就是说,首先目标数据类型为身份证号、手机号、电卡卡号、日期、电量,则每个电力用户的身份证号的具体数据、手机号的具体数据、电卡卡号的具体数据、日期的具体数据、电量的具体数据均为目标数据,其中,例如电力用户的身份证号的具体数据指由18位的数字所组成的真实的身份证号,手机号的具体数据指由11位的数字所组成的真实的手机号,并以此类推电卡卡号的具体数据、日期的具体数据、电量的具体数据。

其中待脱敏文件可为xslx格式、xls、txt、csv格式的文件。

其中,以如下三个实例对所述每个目标数据与其对应的脱敏目标数据的字段属性相同进行阐述:

1)对某一电力用户的身份证号进行脱敏后,生成的对应的脱敏目标数据仍然为数字所组成的数字串,同为数字串,可认为是属性相同;

2)对某一电力用户的手机号进行脱敏后,生成的对应的脱敏目标数据仍然为数字所组成的数字串,同为数字串,可认为是属性相同。

3)对某一电力用户的名字进行脱敏后,生成的对应的脱敏目标数据仍然由汉字组成,同为汉字串,也可认为是属性相同。

较优地,在上述技术方案中,s2中所述分别为每个目标数据随机生成一个秘钥,并对每个秘钥进行处理后得到每个目标数据对应的脱敏目标数据,包括:

s20、分别为每个目标数据随机生成一个数字作为密钥;

s21、判断任一目标数据是否为日期,若是,将所述日期提前与该目标数据对应的数字相同的天数后所得到的日期,作为该目标数据对应的脱敏目标数据;若否,按照用户选择的脱敏方式对该目标数据对应的数字进行处理后,得到该目标数据对应的脱敏目标数据,直至得到每个目标数据对应的脱敏目标数据。

假设目标数据为日期,且该日期为2020年01月06日,若为该日期随机生成的一个数字为5,则将2020年01月06日提前5天的日期为2020年01月01日,也就是说,2020年01月06日对应的的脱敏目标数据为2020年01月01日。

较优地,在上述技术方案中,s21中,所述按照用户选择的脱敏方式对该目标数据对应的数字进行处理后,得到该目标数据对应的脱敏目标数据,包括:

s210、根据用户选择的第一公式、第二公式、第三公式、第四公式或第五公式得到该目标数据对应的脱敏目标数据,其中,所述第一公式为n=n×lnn,所述第二公式为n=n×lgn,所述第三公式为所述第四公式为所述第五公式为n=n/1000,n表示该目标数据对应的脱敏目标数据,n表示该目标数据对应的数字。

通过预设不同的脱敏方式,便于用户进行选择,便于用户个性化、定制化地对目标数据进行脱敏,得到脱敏文件。

较优地,在上述技术方案中,还包括:

s4、生成映射关系文件,所述映射关系文件包括所有的目标数据和所有的脱敏目标数据,及其之间的一一对应的关系;

s5、根据所述映射关系文件对所述脱敏文件进行解密,得到所述待脱敏文件。

通过映射关系文件能对脱敏文件进行解密,得到待脱敏文件,以便于查看目标数据。

在另外一个实施例中,还可对每个目标数据的位置添加索引,索引为可为正整数的编号,也可自定义数字和字母混合的编号作为索引,例如,对某一电力用户的身份证号进行脱敏,在该位置生成索引:1,当对该份证号进行脱敏后,生成的对应的脱敏目标数据仍然为由数字所组成的数字串,此时该用户的身份证号会替换为1(索引)+数字(该身份证号对应的脱敏目标数据);

例如,2020年01月06日对应的的脱敏目标数据为2020年01月01日。假设2020年01月06日对应的索引为100,则脱敏文件中2020年01月06日对应:100+2020年01月01日,也就是说,目标数据:2020年01月06日、索引:100和脱敏目标数据:2020年01月01日之间是相互对应的,便于对脱敏文件进行解密;

可以理解的是,不对添加的索引进行脱敏。并将索引也保存进映射关系文件,以便于对脱敏文件进行解密。

例如,当不添加索引时,映射关系文件中包括:目标数据为2020年01月06日时,对应的脱敏目标数据为2020年01月01日,则对脱敏文件进行解密时,将脱敏文件中的“2020年01月01日”替换为2020年01月06日,即可实现对目标数据进行解密,直至得到待脱敏文件;

当添加索引时,映射关系文件中包括:目标数据为2020年01月06日时,对应的脱敏目标数据为2020年01月01日,对应的索引为100,则对脱敏文件进行解密时,可通过检索索引:100,将脱敏文件中的“100+2020年01月01日”替换为2020年01月06日,即可实现对目标数据进行解密,直至得到待脱敏文件。

其中,可以理解的是,在生成脱敏文件时,可将映射关系文件和待脱敏文件保存在同一文件夹中,即通过同一路径保存映射关系文件和待脱敏文件,便于查找;

在对脱敏文件进行解密时,可将待脱敏文件与射关系文件保存在同一路径下,也便于查找。

在上述各实施例中,虽然对步骤进行进行了编号s1、s2等,但只是本申请给出的具体实施例,本领域的技术人员可根据实际情况对调整s1、s2等的执行顺序,此也在本发明的保护范围内。

如图2所示,本发明实施例的一种数据脱敏系统200,包括获取模块210、生成模块220和替换模块230;

所述获取模块210用于从待脱敏文件中获取至少一个目标数据;

所述生成模块220用于分别为每个目标数据随机生成一个秘钥,并对每个秘钥进行处理后得到每个目标数据对应的脱敏目标数据,且所述每个目标数据与其对应的脱敏目标数据的字段属性相同;

所述替换模块230用于在所述待脱敏文件中,将每个目标数据替换为对应的脱敏目标数据,得到脱敏文件。

通过分别为每个目标数据随机生成一个秘钥,并对每个秘钥进行处理后得到每个目标数据对应的脱敏目标数据,将待脱敏文件中的每个目标数据替换为对应的脱敏目标数据,得到脱敏文件,可以有效防止目标数据的泄露,降低因目标数据的泄露所造成的危害,而且,本申请不需要跨数据库,不易出错,且流程简单、无技术门槛,不需要对用户进行培训,就能使用户对目标数据进行脱敏,而且,每个目标数据与其对应的脱敏目标数据的字段属性相同,便于进行后续处理和分析。

较优地,在上述技术方案中,所述生成模块220具体用于:

分别为每个目标数据随机生成一个数字作为密钥;

判断任一目标数据是否为日期,若是,将所述日期提前与该目标数据对应的数字相同的天数后所得到的日期,作为该目标数据对应的脱敏目标数据;若否,按照用户选择的脱敏方式对该目标数据对应的数字进行处理后,得到该目标数据对应的脱敏目标数据,直至得到每个目标数据对应的脱敏目标数据。

较优地,在上述技术方案中,所述生成模块220具体用于:

根据用户选择的第一公式、第二公式、第三公式、第四公式或第五公式得到该目标数据对应的脱敏目标数据,其中,所述第一公式为n=n×lnn,所述第二公式为n=n×lgn,所述第三公式为所述第四公式为所述第五公式为n=n/1000,n表示该目标数据对应的脱敏目标数据,n表示该目标数据对应的数字。

通过预设不同的脱敏方式,便于用户进行选择,便于用户个性化、定制化地对目标数据进行脱敏,得到脱敏文件。

较优地,在上述技术方案中,还包括解密模块,所述解密模块用于:

生成映射关系文件,所述映射关系文件包括所有的目标数据和所有的脱敏目标数据,及其之间的一一对应的关系;

根据所述映射关系文件对所述脱敏文件进行解密,得到所述待脱敏文件。

通过映射关系文件能对脱敏文件进行解密,得到待脱敏文件,以便于查看目标数据。

上述关于本发明一种数据脱敏系统200中的各参数和各个单元模块实现相应功能的步骤,可参考上文中关于一种数据脱敏方法的实施例中的各参数和步骤,在此不做赘述。

如图3所示,本发明实施例的一种电子设备300,包括存储器310、处理器320及存储在所述存储器310上并在所述处理器320上运行的程序330,所述处理器320执行所述程序330时实现上述任一实施的一种数据脱敏方法的步骤。

通过分别为每个目标数据随机生成一个秘钥,并对每个秘钥进行处理后得到每个目标数据对应的脱敏目标数据,将待脱敏文件中的每个目标数据替换为对应的脱敏目标数据,得到脱敏文件,可以有效防止目标数据的泄露,降低因目标数据的泄露所造成的危害,而且,本申请不需要跨数据库,不易出错,且流程简单、无技术门槛,不需要对用户进行培训,就能使用户对目标数据进行脱敏,而且,每个目标数据与其对应的脱敏目标数据的字段属性相同,便于进行后续处理和分析。

其中,电子设备300可以选用电脑、手机等,相对应地,其程序330为电脑软件或手机app等,且上述关于本发明的一种电子设备300中的各参数和步骤,可参考上文中一种数据脱敏方法的实施例中的各参数和步骤,在此不做赘述,其中,当程序330为电脑软件时,可命名为数据脱敏工具,经实际测试表明,该数据脱敏工具达到了四个目标,分别为:能百分之百对目标数据进行加密、解密密匙2个及以上、加密及解密时间不超过10秒、占用空间不大于60m,占用内存更小,且脱敏速度更快,安全性更强。

在本发明中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1