本公开涉及数据安全,具体地,涉及一种数据处理方法、装置、存储介质和电子设备。
背景技术:
1、随着大数据、人工智能和物联网技术的发展,如何保证个人隐私数据、企业敏感数据只提供给获得授权的数据使用方,而不被其他参与方获取是亟待解决的技术问题。
技术实现思路
1、本公开的目的是提供一种数据处理方法、装置、存储介质和电子设备,以至少解决上述部分相关技术问题。
2、为了实现上述目的,根据本公开实施例的第一方面,提供一种数据处理方法,所述方法包括:
3、获取全量原始数据,并将所述全量原始数据存储于区块链所设置的数据沙箱中;
4、针对所述全量原始数据执行脱敏处理,得到样例数据;
5、基于所述全量原始数据获取敏感数据审核指标,所述敏感数据审核指标用于对所述样例数据的脱敏程度进行评估;
6、根据所述敏感数据审核指标对所述样例数据进行审核,得到开放数据。
7、可选地,所述基于所述全量原始数据获取敏感数据审核指标,包括:
8、根据所述全量原始数据获取信息变化率,所述信息变化率是执行所述脱敏处理后信息的损失量;
9、获取第一指标,所述第一指标用于表示执行所述脱敏处理后数据的特征多样性;
10、基于所述信息变化率和所述第一指标获取所述敏感数据审核指标。
11、可选地,所述获取第一指标,包括:
12、获取所述全量原始数据对应的每个特征的权重,以及获取每个所述特征的第一等价类的个数;
13、根据每个所述特征的权重、所述第一等价类的个数以及所述全量原始数据的数据总条数获取所述第一指标。
14、可选地,所述基于所述信息变化率和所述第一指标获取敏感数据审核指标,包括:
15、提取所述全量原始数据中准标识符集合,并根据所述准标识符集合获取所述全量原始数据对应的第二等价类的个数;
16、根据所述第二等价类的个数和所述全量原始数据的数据总条数获取第二指标,所述第二指标用于表示所述全量原始数据的数据多样性;
17、基于所述信息变化率、所述第一指标和所述第二指标获取敏感数据审核指标。
18、可选地,所述根据所述全量原始数据获取信息变化率,包括:
19、获取所述全量原始数据的第一信息熵,所述第一信息熵是所述全量原始数据对应的所有特征所携带的信息的多少;
20、获取脱敏处理后的所述全量原始数据的第二信息熵,所述第二信息熵是脱敏处理后的所述全量原始数据对应的所有特征所携带的信息的多少;
21、基于所述第一信息熵和第二信息熵确定信息变化率。
22、可选地,所述方法还包括:
23、当检测到数据使用方存在数据使用需求时,对所述数据使用方的身份和使用权限进行校验,并在校验通过后向所述数据使用方发送审批通过指示。
24、可选地,所述方法还包括:
25、对所述数据沙箱中各成员的身份进行上链,所述成员包括数据提供方、数据审核方和数据使用方。
26、根据本公开实施例的第二方面,提供一种数据处理装置,包括:
27、数据获取模块,被配置为获取全量原始数据,并将所述全量原始数据存储于区块链所设置的数据沙箱中;
28、脱敏模块,被配置为针对所述全量原始数据执行脱敏处理,得到样例数据;
29、指标获取模块,被配置为基于所述全量原始数据获取敏感数据审核指标,所述敏感数据审核指标用于对所述样例数据的脱敏程度进行评估;
30、审核模块,被配置为根据所述敏感数据审核指标对所述样例数据进行审核,得到开放数据。
31、根据本公开实施例的第三方面,提供一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述第一方面中所述方法的步骤。
32、根据本公开实施例的第四方面,提供一种电子设备,包括:
33、存储器,其上存储有计算机程序;
34、处理器,用于执行所述存储器中的所述计算机程序,以实现上述第一方面中所述方法的步骤。
35、本公开实施例通过敏感数据审核指标在保证脱敏程度足够高的同时可以保证数据的价值特征损失少,具体的,获取全量原始数据,并将该全量原始数据存储于区块链所设置的数据沙箱中,针对全量原始数据执行脱敏处理,以得到样例数据,在此基础上,基于全量原始数据获取敏感数据审核指标,该敏感数据审核指标用于对样例数据的脱敏程度进行评估,最后根据敏感数据审核指标对样例数据进行审核,得到开放数据,如此可以同时兼顾数据特征价值和敏感度。
36、本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
1.一种数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述全量原始数据获取敏感数据审核指标,包括:
3.根据权利要求2所述的方法,其特征在于,所述获取第一指标,包括:
4.根据权利要求2所述的方法,其特征在于,所述基于所述信息变化率和所述第一指标获取敏感数据审核指标,包括:
5.根据权利要求2所述的方法,其特征在于,所述根据所述全量原始数据获取信息变化率,包括:
6.根据权利要求1至5任一所述的方法,其特征在于,所述方法还包括:
7.根据权利要求1至5任一所述的方法,其特征在于,所述方法还包括:
8.一种数据处理装置,其特征在于,包括:
9.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7中任一项所述方法的步骤。
10.一种电子设备,其特征在于,包括: