基于目标函数扰动的决策模型隐私保护发布方法

文档序号:26348159发布日期:2021-08-20 20:20阅读:110来源:国知局
基于目标函数扰动的决策模型隐私保护发布方法

本发明涉及一种隐私保护方法,具体涉及一种基于目标函数扰动的决策模型隐私保护发布方法。



背景技术:

当前,人工智能技术已经逐渐进入到人们生产生活的各个方面,其中,智能决策模型作为人工智能技术的一个重要模型,在推荐系统、决策系统等发挥着重要作用。来自各行业大量用户的感知数据,支撑着智能决策模型的准确、高效执行。然而,在第三方服务提供商收集和分析大量感知数据以为用户提供相应的智能决策时,也给参与用户带来了前所未有的隐私泄露风险,可能导致个人隐私严重暴露。例如,一些攻击者基于模型反演攻击、推断攻击等方式,挖掘训练数据集中的用户敏感信息。因此,有必要在训练和发布决策模型时引入隐私保护技术,但直接应用隐私保护技术会导致决策模型的准确性严重降低。



技术实现要素:

为了解决现有的智能决策模型发布时会给参与用户带来隐私泄漏风险,而直接应用隐私保护技术会导致决策模型的准确性严重降低的问题,现提供一种基于目标函数扰动的决策模型隐私保护发布方法。

本发明所采用的技术方案是:

一种基于目标函数扰动的决策模型隐私保护发布方法,其特殊之处在于:首先根据智能决策场景中的用户决策数据构建目标函数,并对目标函数进行分解和泰勒展开,然后基于隐私保护模型计算敏感度上界,最后对目标函数进行扰动并根据扰动后的目标函数计算模型参数,以实现决策模型的隐私保护发布;具体包括以下步骤:

1)构建目标函数

获取每位用户i所拥有的决策数据集di,i∈{1,2,…,n},其中n为用户总数;将决策数据的效用性建模为高斯随机变量,从而构建每位用户i对应的目标函数其中βi为用户i的偏好参数;

2)分解目标函数并进行泰勒展开

对每位用户i对应的目标函数进行分解,将其表示为两个子函数g和r的组合,然后在0处对目标函数进行泰勒展开,构建其近似目标函数

3)计算敏感度上界

基于差分隐私保护模型,计算敏感度上界δupper;

4)扰动目标函数和发布决策模型

根据敏感度上界δupper和隐私预算参数∈i,对近似目标函数的泰勒展开系数进行噪声扰动,得到具有隐私保护的目标函数并计算每位用户i的噪声偏好参数从而计算出具有隐私保护的决策模型参数β*并进行发布。

进一步地,所述步骤1)具体按照以下步骤实施:

1.1)获取每位用户i所拥有的决策数据集di,i∈{1,2,…,n};将每位用户i所拥有的包含有n条记录的决策数据集di表示为:

其中,表示用户i选择选项而不选择选项的一条记录,j∈{1,2,…,n};都是d-维向量,分别代表决策场景中的一个选项,d表示维度;

1.2)定义两个选项的差值为

则基于高斯随机变量进行决策数据效用性建模,得到用户i的决策数据效用性服从高斯分布

将用户i选择而不选择的概率表示为:

其中,pr表示概率,φ表示标准正态分布的累积分布函数,βi表示用户i的偏好参数;

1.3)根据公式(3),利用最大似然估计方法计算每位用户i的偏好参数βi,则每位用户i对应的目标函数构建如下:

进一步地,所述步骤2)具体按照以下步骤实施:

2.1)分别定义两个子函数g和r如下:

g(·)=lnφ(·)(5);

利用公式(5)和(6),对每位用户i对应的目标函数进行分解,将目标函数表示为:

2.2)基于公式(7),对目标函数在0处进行泰勒展开,构建其近似目标函数

其中,k={0,1,2},g(k)(0)表示函数g在0处的k-阶导数,且计算可知g(2)(0)=-2/π。

进一步地,所述步骤3)具体按照以下步骤实施:

3.1)对每位用户i的每条记录进行预处理,使其满足则根据公式(2)和三角不等式性质得到vji为d-维向量且满足||vji||2≤1;

3.2)用v[1],v[2],…,v[d]表示d-维向量vji的d-维数值,进而将||vji||2≤1表示为:

根据公式(9)和柯西-施瓦兹不等式得到

3.3)根据差分隐私保护模型的敏感度定义公式和公式(8),得到近似目标函数的泰勒展开系数的敏感度δ计算公式为:

经过计算得到,

则敏感度上界δupper的值为:

进一步地,所述步骤4)具体按照以下步骤实施:

4.1)根据公式(11)和用户i的隐私预算参数∈i,产生随机的拉普拉斯噪声η,即其中,lap表示拉普拉斯函数;

4.2)向每位用户i对应的近似目标函数的泰勒展开系数添加拉普拉斯噪声η以进行噪声扰动,从而得到具有隐私保护的目标函数

4.3)根据具有隐私保护的目标函数计算每位用户i的噪声偏好参数

则具有隐私保护的决策模型参数β*为n位用户的噪声偏好参数的平均值,即

4.4)发布具有隐私保护的决策模型参数β*

本发明相比现有技术的有益效果是:

本发明提供的基于目标函数扰动的决策模型隐私保护发布方法,基于差分隐私保护技术,通过对决策模型的目标函数进行噪声扰动来实现强隐私保护,避免向模型参数引入过量噪声,有效提高了决策模型的准确性,具有较好的实用性。相关的理论分析和实验分析均表明本发明能够在提供强隐私保护的前提下保证较高的模型准确性。本发明的方法整个过程简单、易于实现,无需复杂的加密解密运算,能够在发布决策模型的同时为参与用户提供强隐私保护,同时保证决策模型的准确性和较低的计算开销。

附图说明

图1是本发明基于目标函数扰动的决策模型隐私保护发布方法的流程图;

图2是本发明方法在不同隐私预算下的准确性随用户记录数量变化的实验结果图;

图3是本发明方法在合成数据集上与已有机制的准确性对比实验结果图;

图4是本发明方法在真实数据集上与已有机制的准确性对比实验结果图。

具体实施方式

下面结合附图和具体实施方式对本发明进行详细说明。

如图1所示,本发明提供的基于目标函数扰动的决策模型隐私保护发布方法,具体包括以下步骤:

step1构建目标函数

首先,获取每位用户i所拥有的决策数据集di,i∈{1,2,…,n},其中n为用户总数;将每位用户i所拥有的包含有n条记录的决策数据集di表示为:

其中,表示用户i选择选项而不选择选项的一条记录,j∈{1,2,…,n};都是d-维向量,分别代表决策场景中的一个选项,d表示维度;

然后,定义两个选项的差值为vji,即

则基于高斯随机变量进行决策数据效用性建模,得到用户i的决策数据效用性服从高斯分布

将用户i选择而不选择的概率表示为:

其中,pr表示概率,φ表示标准正态分布的累积分布函数,βi表示用户i的偏好参数;

根据公式(3),利用最大似然估计方法计算每位用户i的偏好参数βi,则每位用户i对应的目标函数构建如下:

step2分解目标函数并进行泰勒展开

对每位用户i对应的目标函数进行分解;

首先,分别定义两个子函数g和r如下:

g(·)=lnφ(·)(5);

利用公式(5)和(6),将目标函数表示为:

基于公式(7),对目标函数在0处进行泰勒展开,构建其近似目标函数

其中,k={0,1,2},g(k)(0)表示函数g在0处的k-阶导数,且计算可知g(2)(0)=-2/π。

step3计算敏感度上界

首先,对每位用户i的每条记录进行预处理,使其满足则根据公式(2)和三角不等式性质得到vji为d-维向量且满足||vji||2≤1;

用v[1],v[2],…,v[d]表示d-维向量vji的d-维数值,进而将||vji||2≤1表示为:

根据公式(9)和柯西-施瓦兹不等式可以得到

然后,根据差分隐私保护模型的敏感度定义公式和公式(8),得到近似目标函数的泰勒展开系数的敏感度δ计算公式为:

经过计算可知,

因此,可以得到敏感度上界δupper的值为:

step4扰动目标函数和发布决策模型

首先,根据公式(11)和用户i的隐私预算参数∈i,产生随机的拉普拉斯噪声η,即其中,lap表示拉普拉斯函数;

接着,向每位用户i对应的近似目标函数的泰勒展开系数添加拉普拉斯噪声η以进行噪声扰动,从而得到具有隐私保护的目标函数

根据具有隐私保护的目标函数计算每位用户i的噪声偏好参数

则具有隐私保护的决策模型参数β*为n位用户的噪声偏好参数的平均值,即

最终发布具有隐私保护的决策模型参数β*

在合成数据集上进行准确性随用户记录数量n的变化情况验证,实验结果如图2所示,设置用户总数n=100,隐私预算变化范围为∈={0.01,0.02,0.03,0.05,0.07,0.09,0.1,0.2,0.3,0.5,0.7,0.9,1,2,3,5,10},可以看到,本发明所设计的隐私保护机制在整体上具有较高的准确性,且准确性随隐私预算∈的增加而增大。此外,对比三条曲线可知,当每个用户所拥有的记录数量n分别为n=10,n=50,n=100时,本发明所设计的隐私保护机制的准确性随记录数量n的增加而增大。

在合成数据集上进行准确性验证,实验结果如图3所示,设置用户总数n=100,且每个用户拥有的记录数量为n=50,隐私预算变化范围设置为∈={0.01,0.02,0.03,0.05,0.07,0.09,0.1,0.2,0.3,0.5,0.7,0.9,1,2,3,5,10}。可以看到,与直接进行扰动的隐私保护机制相比,本发明所设计的基于目标函数扰动的隐私保护机制具有更高的准确性,说明本发明设计的隐私保护机制具有更好的实用性。

在真实数据集上进行准确性验证,实验结果如图4所示,设置用户总数n=100,且每个用户拥有的记录数量为n=13,隐私预算变化范围设置为∈={0.01,0.02,0.03,0.05,0.07,0.09,0.1,0.2,0.3,0.5,0.7,0.9,1,2,3,5,10}。可以看到,本发明所设计的基于目标函数扰动的隐私保护机制在整体上具有较高的准确性,且准确性随隐私预算∈的增加而增大,证明基于目标函数扰动的隐私保护机制能够在提供隐私保护的同时,有效保证决策模型的准确性,具有较好的实用性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1