基于信息熵差的隐私量化评估方法、装置、设备及介质与流程

文档序号：37757254发布日期：2024-04-25 10:43阅读：5来源：国知局

本发明涉及信息安全，具体涉及一种基于信息熵差的隐私量化评估方法、装置、设备及介质。

背景技术：

1、随着大数据技术的不断发展，数据隐私问题越发凸显。例如，在能源供应链、智能电网等具有特殊性和敏感性的场景下，存在能源使用情况、供应商信息、能源价格等隐私信息的泄露问题。隐私保护技术可以为数据提供安全保护和支持，如何对隐私保护技术的保护效果进行评估，判断隐私保护技术是否有效保护了数据是一个值得研究的问题。现有的隐私量化评估方法往往针对某一种隐私保护技术进行保护强度评估，难以再对其他隐私保护技术进行评估。因此，现有技术中存在隐私量化评估方法泛用性较差的问题。

技术实现思路

1、有鉴于此，本发明提供了一种基于信息熵差的隐私量化评估方法、装置、设备及介质，以解决现有技术中隐私量化评估方法泛用性较差的问题。

2、第一方面，本发明提供了一种基于信息熵差的隐私量化评估方法，包括：获取待评估数据表，待评估数据表包括多列属性；根据待评估数据表采用隐私保护技术前后的信息熵差构建隐私强度度量模型；基于隐私强度度量模型确定多列属性对应的隐私属性权重；基于用户隐私偏好统计确定待评估数据表中多列属性对应的基础隐私矩阵；根据隐私属性权重以及基础隐私矩阵的加权和对隐私保护技术的保护效果进行量化评估。

3、在本发明实施例中，根据隐私保护技术前后数据表属性概率分布的信息熵差值构建隐私强度度量模型，使用该模型确定隐私属性权重，利用隐私属性权重与基础隐私矩阵的加权和对隐私保护技术的保护效果进行量化评估。本实施例与现有数据隐私量化评估方法相比，可应用于多种隐私保护技术的隐私量化评估以及数据全生命周期各阶段的隐私量化评估，实现了有效提高隐私量化评估方法泛用性的目的，达到了提升数据保密性、完整性和可用性的效果。解决了相关技术中隐私量化评估方法泛用性较差的问题。

4、在一种可选的实施方式中，待评估数据表包括多行数据，根据待评估数据表采用隐私保护技术前后的信息熵差构建隐私强度度量模型，包括：获取采用隐私保护技术前多行数据的攻击概率分布以及采用隐私保护技术后多行数据的攻击概率分布；利用信息熵根据采用隐私保护技术前多行数据的攻击概率分布确定采用隐私保护技术前的信息熵；利用信息熵根据采用隐私保护技术后多行数据的攻击概率分布确定采用隐私保护技术后的信息熵；将采用隐私保护技术前的信息熵与采用隐私保护技术后的信息熵的差值作为隐私强度度量模型。

5、在本发明实施例中，利用信息熵以及数据的攻击概率分布构建隐私强度度量模型，实现了对数据进行隐私强度度量的目的。

6、在一种可选的实施方式中，任一行数据包括多个属性值，获取采用隐私保护技术前多行数据的攻击概率分布以及采用隐私保护技术后多行数据的攻击概率分布，包括：获取待评估数据表中隐私数据行的数量以及待评估数据表中目标属性值对应的数据行的数量；根据待评估数据表中隐私数据行的数量确定采用隐私保护技术前多行数据的攻击概率分布；根据待评估数据表中目标属性值对应的数据行的数量确定采用隐私保护技术后多行数据的攻击概率分布。

7、在本发明实施例中，通过确定采用隐私保护技术前后数据表中多行数据的攻击概率分布，实现了为隐私强度度量模型的构建提供数据支持的目的。

8、在一种可选的实施方式中，基于隐私强度度量模型确定多列属性对应的隐私属性权重，包括：获取多列属性对应的概率分布；利用隐私强度度量模型根据多列属性对应的概率分布确定多列属性对应的隐私属性权重。

9、在本发明实施例中，通过将多列属性概率分布代入隐私强度度量模型，实现了确定多列属性对应的隐私属性权重的目的。

10、在一种可选的实施方式中，在利用隐私强度度量模型根据多列属性对应的概率分布确定多列属性对应的隐私属性权重之后，方法还包括：对多列属性对应的隐私属性权重进行归一化；根据归一化后的隐私属性权重更新多列属性对应的隐私属性权重。

11、在本发明实施例中，通过对多列属性对应的隐私属性权重进行归一化处理，实现了消除隐私属性权重偏差的目的，达到了提高隐私评估准确性的效果。

12、在一种可选的实施方式中，基于用户隐私偏好统计确定待评估数据表中多列属性对应的基础隐私矩阵，包括：获取用户隐私偏好统计结果以及多列属性占待评估数据表的比重，用户隐私偏好统计结果包括匿名性；基于匿名性根据多列属性占待评估数据表的比重确定基础隐私矩阵。

13、在本发明实施例中，根据用户隐私偏好统计结果确定基础隐私矩阵，实现了进一步提高隐私量化评估方法的灵活性和泛用性的目的。

14、在一种可选的实施方式中，根据隐私属性权重以及基础隐私矩阵的加权和对隐私保护技术的保护效果进行量化评估，包括：根据隐私属性权重以及基础隐私矩阵的加权和确定隐私保护技术的保护效果度量值；根据保护效果度量值对保护效果进行量化评估，保护效果度量值和隐私保护技术的保护效果正相关。

15、在本发明实施例中，根据保护效果度量值进行数据隐私量化评估，实现了为数据隐私安全提供可靠评估机制的目的，达到了为提高数据隐私保护能力提供数据支撑的效果。

16、第二方面，本发明提供了一种基于信息熵差的隐私量化评估装置，包括：数据表获取模块，用于获取待评估数据表，待评估数据表包括多列属性；模型构建模块，用于根据待评估数据表采用隐私保护技术前后的信息熵差构建隐私强度度量模型；权重确定模块，用于基于隐私强度度量模型确定多列属性对应的隐私属性权重；矩阵确定模块，用于基于用户隐私偏好统计确定待评估数据表中多列属性对应的基础隐私矩阵；评估模块，用于根据隐私属性权重以及基础隐私矩阵的加权和对隐私保护技术的保护效果进行量化评估。

17、在一种可选的实施方式中，待评估数据表包括多行数据，模型构建模块包括：概率分布获取单元，用于获取采用隐私保护技术前多行数据的攻击概率分布以及采用隐私保护技术后多行数据的攻击概率分布；第一信息熵确定单元，用于利用信息熵根据采用隐私保护技术前多行数据的攻击概率分布确定采用隐私保护技术前的信息熵；第二信息熵确定单元，用于利用信息熵根据采用隐私保护技术后多行数据的攻击概率分布确定采用隐私保护技术后的信息熵；模型构建单元，用于将采用隐私保护技术前的信息熵与采用隐私保护技术后的信息熵的差值作为隐私强度度量模型。

18、在一种可选的实施方式中，任一行数据包括多个属性值，概率分布获取单元包括：获取子单元，用于获取待评估数据表中隐私数据行的数量以及待评估数据表中目标属性值对应的数据行的数量；第一确定子单元，用于根据待评估数据表中隐私数据行的数量确定采用隐私保护技术前多行数据的攻击概率分布；第二确定子单元，用于根据待评估数据表中目标属性值对应的数据行的数量确定采用隐私保护技术后多行数据的攻击概率分布。

19、在一种可选的实施方式中，权重确定模块包括：获取单元，用于获取多列属性对应的概率分布；权重确定单元，用于利用隐私强度度量模型根据多列属性对应的概率分布确定多列属性对应的隐私属性权重。

20、在一种可选的实施方式中，装置还包括：归一化模块，用于对多列属性对应的隐私属性权重进行归一化；权重更新模块，用于根据归一化后的隐私属性权重更新多列属性对应的隐私属性权重。

21、在一种可选的实施方式中，矩阵确定模块包括：偏好获取单元，用于获取用户隐私偏好统计结果以及多列属性占待评估数据表的比重，用户隐私偏好统计结果包括匿名性；矩阵确定单元，用于基于匿名性根据多列属性占待评估数据表的比重确定基础隐私矩阵。

22、在一种可选的实施方式中，评估模块包括：度量值确定单元，用于根据隐私属性权重以及基础隐私矩阵的加权和确定隐私保护技术的保护效果度量值；量化评估单元，用于根据保护效果度量值对保护效果进行量化评估，保护效果度量值和隐私保护技术的保护效果正相关。

23、第三方面，本发明提供了一种计算机设备，包括：存储器和处理器，存储器和处理器之间互相通信连接，存储器中存储有计算机指令，处理器通过执行计算机指令，从而执行上述第一方面或其对应的任一实施方式的基于信息熵差的隐私量化评估方法。

24、第四方面，本发明提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机指令，计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的基于信息熵差的隐私量化评估方法。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：严莉,黄秀丽,田兵,陈剑飞,张闻彬
技术所有人：国网智能电网研究院有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。