一种面向博弈控制的隐私保护方法、系统及可读存储介质

文档序号：26006261发布日期：2021-07-23 21:24阅读：来源：国知局

技术特征：

1.一种面向博弈控制的隐私保护方法，其特征在于，包括：

初始化博弈参与者在初始时刻的策略和局部估计状态信息；

采用基于输入扰动或输出扰动的随机聚合博弈的差分隐私分布式算法对每个参与者的下一时刻的局部估计状态和策略进行更新；

利用更新后的策略完成差分隐私保护。

2.如权利要求1所述的面向博弈控制的隐私保护方法，其特征在于，所述采用基于输入扰动的随机聚合博弈的差分隐私分布式算法对每个参与者的下一时刻的局部估计状态和策略进行更新，包括：

在时刻k，对于参与者定义重复以下更新τk次：

其中，aij，k为参与者i在时刻k分配给邻近参与者的非负权重，为参与者i在时刻k的局部估计状态，博弈参与者之间的通信被建模为无向图其中包含一个非空结点集和一个边集为参与者j在时刻k的局部估计状态；

对于每一个参与者在时刻k+1的局部估计状态进行更新：

其中，xi，k+1为参与者i在时刻k+1的策略，xi，k为参与者i在时刻k的策略，αk为算法的步长，为目标函数的梯度信息，表示在时间k时参与者i的邻域，随机变量ni，k是均值为0，方差为的高斯噪声，为参与者i的动作集合，为参与者j在时刻k的局部估计状态，参与者i在时刻k+1的局部估计状态。

3.如权利要求1所述的面向博弈控制的隐私保护方法，其特征在于，所述采用基于输出扰动的随机聚合博弈的差分隐私分布式算法对每个参与者的下一时刻的局部估计状态和策略进行更新，包括：

在时刻k，对于参与者定义

其中，aij，k为参与者i在第k步分配给邻近参与者的非负权重，为参与者i在时刻k的局部估计状态，博弈参与者之间的通信被建模为无向图其中包含一个非空结点集和一个边集为参与者j在时刻k的局部估计状态；

对于每一个参与者在时刻k+1的局部估计状态进行更新：

其中，sk是第k步使用的采样梯度数，xi，k+1为参与者i在时刻k+1的策略，xi，k为参与者i在时刻k的策略，为目标函数的梯度信息，α为算法的常步长，为随机变量ξi的采样，表示在时间k时参与者i的邻域，随机变量nj，k是均值为0，方差为的高斯噪声，为参与者i的动作集合，为参与者j在时刻k的局部估计状态，参与者i在时刻k+1的局部估计状态。

4.如权利要求3所述的面向博弈控制的隐私保护方法，其特征在于，还包括采用小批量方法对所述基于输出扰动的随机聚合博弈的差分隐私分布式算法的差分隐私进行优化，包括：

令时刻k＝0，对每个参与者有令α＞0，sk为确定性序列；

在时刻k时，对于参与者定义重复以下更新τk次：

对于每一个参与者在时刻k+1的局部估计状态进行更新：

其中，sk是第k步使用的采样梯度数，xi，k+1为参与者i在时刻k+1的策略，xi，k为参与者i在时刻k的策略，为目标函数的梯度信息，α为算法的步长，为随机变量ξi的采样，表示在时间k时参与者i的邻域，ni，k是均值为0，方差为的高斯噪声，为参与者i的动作集合，参与者i在时刻k+1的局部估计状态。

5.如权利要求3所述的面向博弈控制的隐私保护方法，其特征在于，所述基于输出扰动的随机聚合博弈的差分隐私分布式算法在时刻k迭代时的灵敏度满足：

其中，sk-1为第k-1步使用的采样梯度数，c为梯度函数的上界，α为算法的步长。

6.一种面向博弈控制的隐私保护系统，其特征在于，包括：初始化模块、更新模块以及差分隐私保护模块，其中：

初始化模块用于初始化博弈参与者在初始时刻的策略和局部估计状态信息；

更新模块用于采用基于输入扰动或输出扰动的随机聚合博弈的差分隐私分布式算法对每个参与者的下一时刻的局部估计状态和策略进行更新；

差分隐私保护模块用于利用更新后的策略完成差分隐私保护。

7.如权利要求6所述的面向博弈控制的隐私保护系统，其特征在于，所述更新模块包括第一更新单元和第二更新单元，其中：

第一更新单元用于采用基于输入扰动的随机聚合博弈的差分隐私分布式算法对每个参与者的下一时刻的局部估计状态和策略进行更新，包括：

在时刻k，对于参与者定义重复以下更新τk次：

对于每一个参与者在时刻k+1的局部估计状态进行更新：

其中，xi，k+1为参与者i在时刻k+1的策略，xi，k为参与者i在时刻k的策略，αk为算法的步长，为目标函数的梯度信息，表示在时间k时参与者i的邻域，随机变量ni，k是均值为0，方差为的高斯噪声，为参与者i的动作集合，为参与者j在时刻k的局部估计状态，参与者i在时刻k+1的局部估计状态；

第二更新单元用于采用基于输出扰动的随机聚合博弈的差分隐私分布式算法对每个参与者的下一时刻的局部估计状态和策略进行更新，包括：

在时刻k，对于参与者定义

对于每一个参与者在时刻k+1的局部估计状态进行更新：

其中，sk是第k步使用的采样梯度数，xi，k+1为参与者i在时刻k+1的策略，xi，k为参与者i在时刻k的策略，为目标函数的梯度信息，α为算法的步长，为随机变量ξi的采样，表示在时间k时参与者i的邻域，随机变量nj，k是均值为0，方差为的高斯噪声，为参与者i的动作集合，为参与者j在时刻k的局部估计状态，参与者i在时刻k+1的局部估计状态。

8.如权利要求7所述的面向博弈控制的隐私保护系统，其特征在于，还包括差分隐私性能优化模块，用于采用小批量方法对所述基于输出扰动的随机聚合博弈的差分隐私分布式算法的差分隐私进行优化，包括：

令时刻k＝0，对每个参与者有令α＞0，sk为确定性序列；

在时刻k时，对于参与者定义重复以下更新τk次：

对于每一个参与者在时刻k+1的局部估计状态进行更新：

9.如权利要求7所述的面向博弈控制的隐私保护系统，其特征在于，所述基于输出扰动的随机聚合博弈的差分隐私分布式算法在时刻k迭代时的灵敏度满足：

其中，sk-1为第k-1步使用的采样梯度数，c为梯度函数的上界，α为算法的常步长。

10.一种计算机可读存储介质，其特征在于，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行可实现如权利要求1-5中任意一项所述的面向博弈控制的隐私保护方法。

技术总结
本发明公开了一种面向博弈控制的隐私保护方法、系统及可读存储介质，属于机器学习安全技术领域，包括：初始化博弈参与者在初始时刻的策略和局部估计状态信息；采用基于输入扰动或输出扰动的随机聚合博弈的差分隐私分布式算法对每个参与者的下一时刻的局部估计状态和策略进行更新；利用更新后的策略完成差分隐私保护。本发明提出的分布式算法来计算随机聚合博弈中的均衡，同时保持(ε,δ)‑差分隐私性，不会被对手通过访问通信所推测。

技术研发人员：张纪峰;王继民;康宇;赵延龙;吕文君
受保护的技术使用者：中国科学院数学与系统科学研究院;中国科学技术大学
技术研发日：2021.03.30
技术公布日：2021.07.23

完整全部详细技术资料下载

当前第2页1 2