数据共享方法及装置与流程

文档序号:37384403发布日期:2024-03-22 10:36阅读:6来源:国知局
数据共享方法及装置与流程

本发明涉及数据共享,具体而言,涉及一种数据共享方法及装置。


背景技术:

1、目前对电力用户用电数据的隐私脱敏方法,主要限于传统的访问权限控制技术,以及知识图谱的方式。同时也有一系列通用的敏感数据隐私保护的方法,包括:用高粒度数值替换低粒度数值,实现泛化;规范节点联系实现隐藏;节点边的差分隐私(differentialprivacy,dp)隐藏;将数据表准标识符和敏感属性分到两张表泛化;k-匿名基础上增加敏感属性值分布约束;矩阵变换、保距隐藏;利用多方安全计算实现分布子图隐藏;用区域代替具体位置实现泛化。

2、上述脱敏技术为较通用的脱敏方式,这些数据脱敏方式在应用于用户用电数据的敏感数据隐私保护的时候,存在匹配方式不够灵活、不精确,粗粒度等现象,不但不能很好的依据不同的电力数据场景,灵活适配脱敏方式,而且脱敏程度不够完全,对于敏感度较高的数据,无法进行多层次,精确的立体式脱敏。

3、针对上述相关技术中在对电力用户用电数据进行隐私脱敏的过程中,存在脱敏方式与敏感数据的匹配度不高的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本发明实施例提供了一种数据共享方法及装置,以至少解决相关技术中在对电力用户用电数据进行隐私脱敏的过程中,存在脱敏方式与敏感数据的匹配度不高的技术问题。

2、根据本发明实施例的一个方面,提供了一种数据共享方法,包括:在接收到数据共享请求后,根据所述数据共享请求确定目标共享数据,其中,所述数据共享请求是由非本地系统根据数据需求发送的请求;在搜索到所述目标共享数据后,确定所述目标共享数据中的敏感数据;根据所述目标共享数据的数据类型对所述敏感数据进行一次脱敏处理,得到一次脱敏处理后的所述目标共享数据;根据所述敏感数据的敏感等级、一次脱敏处理后的所述目标共享数据、所述数据类型以及场景类型值确定所述目标共享数据的二次脱敏策略,其中,所述场景类型值为所述目标共享数据的应用场景的表示值;通过所述二次脱敏策略对一次脱敏处理后的所述目标共享数据进行二次脱敏处理,得到目标脱敏共享数据;将所述目标脱敏共享数据发送至所述数据共享请求的发送端。

3、可选地,在确定所述目标共享数据中的敏感数据之前,还包括:确定所述目标共享数据的存储位置;对所述存储位置进行搜索,得到所述目标共享数据。

4、可选地,确定所述目标共享数据中的敏感数据,包括:根据所述目标共享数据的数据类型调用对应的敏感数据发现规则,其中,所述敏感数据发现规则为预先设置并用于搜索敏感数据的规则;利用所述敏感数据发现规则对所述目标共享数据进行敏感数据发现,以得到所述目标共享数据中的所述敏感数据。

5、可选地,根据所述目标共享数据的数据类型对所述敏感数据进行一次脱敏处理,得到一次脱敏处理后的所述目标共享数据,包括:确定所述目标共享数据中各部分的数据类型;对所述目标共享数据中所述数据类型为数值型的数值型数据进行去标识处理,以对所述目标共享数据中的所述数值型数据进行一次脱敏处理,得到一次脱敏处理后的所述数值型数据,其中,所述去标识处理是隐藏所述数值型数据中的部分信息;对所述目标共享数据中所述数据类型为字符型的字符型数据进行匿名处理,以对所述目标共享数据中的所述字符型数据进行一次脱敏处理,得到一次脱敏处理后的所述字符型数据,其中,所述匿名处理是对所述字符型数据中的以下至少之一进行隐藏的处理:名字、地址;确定一次脱敏处理后的所述数值型数据和一次脱敏处理后的所述字符型数据为一次脱敏处理后的所述目标共享数据。

6、可选地,在根据所述敏感数据的敏感等级、一次脱敏处理后的所述目标共享数据、所述数据类型以及场景类型值确定所述目标共享数据的二次脱敏策略之前,还包括以下之一:按照预定维度对所述目标共享数据进行分类处理,得到分类处理后的所述目标共享数据,其中,所述预定维度包括以下至少之一:数据类型、业务类型;通过分类模型对所述目标共享数据进行分类处理,得到分类处理后的所述目标共享数据,其中,所述分类模型为适用多组训练数据通过机器学习训练得到的模型,所述多组训练数据中的每一组均包括:样本共享数据和与所述样本共享数据对应的分类结果。

7、可选地,确定所述目标共享数据中的敏感数据,包括:根据分类处理后的所述目标共享数据的数据类型调用对应的敏感数据发现规则,其中,所述敏感数据发现规则为预设设置并用于搜索敏感数据的规则;利用所述敏感数据发现规则对分类处理后的所述目标共享数据进行敏感数据发现;根据所述敏感数据发现的处理结果确定所述目标共享数据中的所述敏感数据。

8、可选地,该数据共享方法还包括:确定分类处理后的所述目标共享数据对应的业务类型,其中,不同业务类型预设设置有对应的敏感等级;根据所述业务类型确定所述敏感数据的敏感等级。

9、可选地,根据所述敏感数据的敏感等级、一次脱敏处理后的所述目标共享数据、所述数据类型以及场景类型值确定所述目标共享数据的二次脱敏策略,包括:通过预定公式确定所述敏感数据的敏感等级、一次脱敏处理后的所述目标共享数据、所述数据类型以及场景类型值对应的中间值,其中,所述预定公式为:z表示所述中间值,nr表示所述敏感等级,wn表示所述敏感等级的权重,uw表示发送所述数据共享请求的用户账号的权限,wu表示所述权限的权重,cd表示所述数据类型,wc表示所述数据类型的权重,sc表示所述场景类型,ws表示所述场景类型的权重;将所述中间值与多个敏感等级区间进行比对,得到比对结果;根据所述比对结果确定所述中间值所对应的目标敏感等级区间;确定所述目标敏感等级区域对应的目标值;根据所述目标值在脱敏策略集合中搜索得到所述二次脱敏策略,其中,所述脱敏策略集合中存储有多条记录,多条所述记录中的每一条均记录有脱敏策略以及所述脱敏策略对应的数值。

10、可选地,通过所述二次脱敏策略对一次脱敏处理后的所述目标共享数据进行二次脱敏处理,得到目标脱敏共享数据,包括以下之一:在所述敏感数据的敏感等级高于敏感等级阈值、发送所述数据共享请求的用户账号的权限低于权限阈值、所述数据类型为数值型数据且所述场景类型为机器学习时,通过同态加密类型的脱敏策略对一次脱敏处理后的所述目标共享数据进行二次脱敏处理,得到目标脱敏共享数据;在所述敏感数据的敏感等级低于敏感等级阈值、发送所述数据共享请求的用户账号的权限低于权限阈值、所述数据类型为数值型数据且所述场景类型为统计分析时,通过差分隐私计算的脱敏策略对一次脱敏处理后的所述目标共享数据进行二次脱敏处理,得到目标脱敏共享数据。

11、根据本发明实施例的另一方面,还提供了一种数据共享装置,包括:第一确定单元,用于在接收到数据共享请求后,根据所述数据共享请求确定目标共享数据,其中,所述数据共享请求是由非本地系统根据数据需求发送的请求;第二确定单元,用于在搜索到所述目标共享数据后,确定所述目标共享数据中的敏感数据;第一获取单元,用于根据所述目标共享数据的数据类型对所述敏感数据进行一次脱敏处理,得到一次脱敏处理后的所述目标共享数据;第三确定单元,用于根据所述敏感数据的敏感等级、一次脱敏处理后的所述目标共享数据、所述数据类型以及场景类型值确定所述目标共享数据的二次脱敏策略,其中,所述场景类型值为所述目标共享数据的应用场景的表示值;第二获取单元,用于通过所述二次脱敏策略对一次脱敏处理后的所述目标共享数据进行二次脱敏处理,得到目标脱敏共享数据;发送单元,用于将所述目标脱敏共享数据发送至所述数据共享请求的发送端。

12、可选地,该数据共享装置还包括:第四确定单元,用于在确定所述目标共享数据中的敏感数据之前,确定所述目标共享数据的存储位置;第三获取单元,用于对所述存储位置进行搜索,得到所述目标共享数据。

13、可选地,所述第二确定单元,包括:第一调用模块,用于根据所述目标共享数据的数据类型调用对应的敏感数据发现规则,其中,所述敏感数据发现规则为预先设置并用于搜索敏感数据的规则;第一获取模块,用于利用所述敏感数据发现规则对所述目标共享数据进行敏感数据发现,以得到所述目标共享数据中的所述敏感数据。

14、可选地,所述第一获取单元,包括:第一确定模块,用于确定所述目标共享数据中各部分的数据类型;第二获取模块,用于对所述目标共享数据中所述数据类型为数值型的数值型数据进行去标识处理,以对所述目标共享数据中的所述数值型数据进行一次脱敏处理,得到一次脱敏处理后的所述数值型数据,其中,所述去标识处理是隐藏所述数值型数据中的部分信息;第三获取模块,用于对所述目标共享数据中所述数据类型为字符型的字符型数据进行匿名处理,以对所述目标共享数据中的所述字符型数据进行一次脱敏处理,得到一次脱敏处理后的所述字符型数据,其中,所述匿名处理是对所述字符型数据中的以下至少之一进行隐藏的处理:名字、地址;第二确定模块,用于确定一次脱敏处理后的所述数值型数据和一次脱敏处理后的所述字符型数据为一次脱敏处理后的所述目标共享数据。

15、可选地,该数据共享装置还包括以下之一:第四获取单元,用于在根据所述敏感数据的敏感等级、一次脱敏处理后的所述目标共享数据、所述数据类型以及场景类型值确定所述目标共享数据的二次脱敏策略之前,按照预定维度对所述目标共享数据进行分类处理,得到分类处理后的所述目标共享数据,其中,所述预定维度包括以下至少之一:数据类型、业务类型;第五获取单元,用于通过分类模型对所述目标共享数据进行分类处理,得到分类处理后的所述目标共享数据,其中,所述分类模型为适用多组训练数据通过机器学习训练得到的模型,所述多组训练数据中的每一组均包括:样本共享数据和与所述样本共享数据对应的分类结果。

16、可选地,所述第二确定单元,包括:第二调用模块,用于根据分类处理后的所述目标共享数据的数据类型调用对应的敏感数据发现规则,其中,所述敏感数据发现规则为预设设置并用于搜索敏感数据的规则;发现模块,用于利用所述敏感数据发现规则对分类处理后的所述目标共享数据进行敏感数据发现;第三确定模块,用于根据所述敏感数据发现的处理结果确定所述目标共享数据中的所述敏感数据。

17、可选地,该数据共享装置还包括:第四确定模块,用于确定分类处理后的所述目标共享数据对应的业务类型,其中,不同业务类型预设设置有对应的敏感等级;第五确定模块,用于根据所述业务类型确定所述敏感数据的敏感等级。

18、可选地,所述第三确定单元,包括:第六确定模块,用于通过预定公式确定所述敏感数据的敏感等级、一次脱敏处理后的所述目标共享数据、所述数据类型以及场景类型值对应的中间值,其中,所述预定公式为:z表示所述中间值,nr表示所述敏感等级,wn表示所述敏感等级的权重,uw表示发送所述数据共享请求的用户账号的权限,wu表示所述权限的权重,cd表示所述数据类型,wc表示所述数据类型的权重,sc表示所述场景类型,ws表示所述场景类型的权重;第四获取模块,用于将所述中间值与多个敏感等级区间进行比对,得到比对结果;第七确定模块,用于根据所述比对结果确定所述中间值所对应的目标敏感等级区间;第八确定模块,用于确定所述目标敏感等级区域对应的目标值;第五获取模块,用于根据所述目标值在脱敏策略集合中搜索得到所述二次脱敏策略,其中,所述脱敏策略集合中存储有多条记录,多条所述记录中的每一条均记录有脱敏策略以及所述脱敏策略对应的数值。

19、可选地,所述第二获取单元,包括以下之一:第六获取模块,用于在所述敏感数据的敏感等级高于敏感等级阈值、发送所述数据共享请求的用户账号的权限低于权限阈值、所述数据类型为数值型数据且所述场景类型为机器学习时,通过同态加密类型的脱敏策略对一次脱敏处理后的所述目标共享数据进行二次脱敏处理,得到目标脱敏共享数据;第七获取模块,用于在所述敏感数据的敏感等级低于敏感等级阈值、发送所述数据共享请求的用户账号的权限低于权限阈值、所述数据类型为数值型数据且所述场景类型为统计分析时,通过差分隐私计算的脱敏策略对一次脱敏处理后的所述目标共享数据进行二次脱敏处理,得到目标脱敏共享数据。

20、根据本发明实施例的另一方面,还提供了一种数据共享系统,所述数据共享系统使用上述任一种所述的数据共享方法。

21、根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,所述程序执行上述任意一种所述的数据共享方法。

22、根据本发明实施例的另一方面,还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述任意一种所述的数据共享方法。

23、在本发明实施例中,在接收到数据共享请求后,根据数据共享请求确定目标共享数据,其中,数据共享请求是由非本地系统根据数据需求发送的请求;在搜索到目标共享数据后,确定目标共享数据中的敏感数据;根据目标共享数据的数据类型对敏感数据进行一次脱敏处理,得到一次脱敏处理后的目标共享数据;根据敏感数据的敏感等级、一次脱敏处理后的目标共享数据、数据类型以及场景类型值确定目标共享数据的二次脱敏策略,其中,场景类型值为目标共享数据的应用场景的表示值;通过二次脱敏策略对一次脱敏处理后的目标共享数据进行二次脱敏处理,得到目标脱敏共享数据;将目标脱敏共享数据发送至数据共享请求的发送端。通过以上技术方案,达到了根据数据共享请求确定目标共享数据,再对目标共享数据中的敏感数据进行两次脱敏处理,以得到目标脱敏共享数据的目的,实现了提高脱敏方式与敏感数据匹配度的技术效果,进而解决了相关技术中在对电力用户用电数据进行隐私脱敏的过程中,存在脱敏方式与敏感数据的匹配度不高的技术问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1