一种数据局部脱敏方法与流程

文档序号:11951630阅读:458来源:国知局

本发明涉及一种数据脱敏方法,具体涉及一种数据局部脱敏方法。



背景技术:

目前,移动经营分析系统存储大量的数据,其中包含了大量的额客户敏感数据,为了有效保护客户的敏感数据需要对数据进行脱敏处理;但是往往还需要对用户数据做一些统计和分析,如何既能满足分析需要又保护数据是目前的一个技术难题;目前数据保护一般采用加密算法,通常对隐私数据计算Hash,然后用得出的Hash值替换原隐私数据来脱敏,例如:隐私数据为Email地址user3@example.com,对上述Email地址计算MD5,得到97d6d9441ff85fdc730e02a6068d267b,用上述值代替Email地址;这种方法使得数据的格式和意义在脱敏后完全丧失,都变成一串16进制数字字符;无法知道数据是Email地址,导致很难做分析和统计;并且保护强度也不够,例如给定一个手机号的MD5值,在当前CPU上很快就能穷举完所有手机号码,从而找出对应的手机号;甚至有不少网站提供查询MD5值对应数据的功能,所以保护强度不够。



技术实现要素:

本发明提供一种能够保留原数据的格式和部分意义方便统计分析,并且无法暴力穷举获取数据的数据局部脱敏方法。

本发明采用的技术方案是:一种数据局部脱敏方法,包括以下步骤:

根据敏感数据格式和意义,确定需要脱敏的局部数据;

确定一个脱敏密钥;

对脱敏密钥和需要脱敏的局部数据,计算HMAC;

用计算结果替换需要脱敏的局部数据,得到脱敏后的数据。

进一步的,所述数据主要包括身份证号、手机号、Email地址、护照、驾驶证、车牌号。

进一步的,所述脱敏密钥为每类敏感数据对应一个固定密钥。

进一步的,所述脱敏密钥为动态密钥。

进一步的,对Email地址进行脱敏,将Email地址用户名作为需要脱敏的局部数据;

确定脱敏密钥;

对脱敏密钥和Email地址的用户名,计算HMAC;

选取计算结果中与Email地址用户名长度相同的一部分替换Email地址的用户名,得到脱敏后的数据。

对身份证号码进行脱敏,将身份证号码后八位作为需要脱敏的局部数据;

将身份证号前六位作为脱敏密钥;

对脱敏密钥和需要脱敏的局部数据,计算HMAC;

选取计算结果中长度身份证号码后八位长度相同的一部分替换身份证号码后八位,得到脱敏后数据。

本发明的有益效果是:

(1)本发明采用HMAC算法,可以抵抗暴力穷举破解,数据保护强度更高;

(2)本发明在提高保护强度的同时,保留了数据的格式和部分意义,使数据易于被分析、统计和处理。

附图说明

图1为本发明结构示意图。

具体实施方式

下面结合附图和具体实施例对本发明做进一步说明。

如图1所示,一种数据局部脱敏方法,包括以下步骤:

根据敏感数据格式和意义,确定需要脱敏的局部数据;

确定一个脱敏密钥;

对脱敏密钥和需要脱敏的局部数据,计算HMAC;

用计算结果替换需要脱敏的局部数据,得到脱敏后的数据。

可以用全部或部分计算结果替换需要脱敏的局部数据;通常HMAC计算结果数据较长,可以采用计算结果的部分代替需要脱敏的局部数据。

进一步的,所述数据主要包括身份证号、手机号、Email地址、护照、驾驶证、车牌号。

进一步的,所述脱敏密钥为每类敏感数据对应一个固定密钥。

进一步的,所述脱敏密钥为动态密钥;例如身份证号码可以采用其前6位作为动态密钥,每个身份证号码动态密钥均不同。

可以用全部或部分计算结果替换需要脱敏的局部数据;通常HMAC计算结果数据较长,可以采用计算结果的部分代替需要脱敏的局部数据。

对Email地址进行脱敏,将Email地址用户名作为需要脱敏的局部数据;

确定脱敏密钥;

对脱敏密钥和Email地址的用户名,计算HMAC;

选取计算结果中与Email地址用户名长度相同的一部分替换Email地址的用户名,得到脱敏后的数据。

对身份证号码进行脱敏,将身份证号码后八位作为需要脱敏的局部数据;

将身份证号前六位作为脱敏密钥;

对脱敏密钥和需要脱敏的局部数据,计算HMAC;

选取计算结果中长度身份证号码后八位长度相同的一部分替换身份证号码后八位,得到脱敏后数据。

使用时,根据数据格式和意义,结合需要确定需要脱敏的局部数据;例如,对Email 地址,仅对“@”之前的用户名脱敏,保留“@”之后的域名部分;对身份证号码,可以保留前10位数字(6位地区码+4位生日年份),对后8位数字脱敏,保留了原身份证号码里的地区码和出生年份;也可以保留身份证号码前14位,对后4位数字脱敏,保留了原地区码和完整的生日;然后确定一个脱敏密钥,可以是一个固定密钥,每类隐私数据对应一个固定密钥,也可以采用一些算法动态生成密钥;对脱敏密钥和需要脱敏的局部数据,计算HMAC;用计算结果替换需要脱敏的局部数据;采用这种方法实现局部脱敏,即保护了数据,又保留了数据的格式和部分意义,使得数据可以被分析、统计和处理。

HMAC(Hash-based Message Authentication Code)是密钥相关的哈希运算消息认证码;利用哈希算法,以一个密钥和一个消息为输入,生成一个消息摘要作为输出。

本发明数据保护强度更高,可以抵抗暴力穷举破解;在提供高强度保护的同时,又保留了数据的格式和部分意义,使数据可以被分析,统计和各种处理。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1