基于高斯过程回归的数据隐私保护方法及相关设备与流程

文档序号:33385746发布日期:2023-03-08 08:06阅读:26来源:国知局
基于高斯过程回归的数据隐私保护方法及相关设备与流程

1.本发明涉及数据处理技术领域,尤其涉及的是一种基于高斯过程回归的数据隐私保护方法、装置、智能终端及计算机存储介质。


背景技术:

2.高斯过程回归(gaussian process regression,gpr)被广泛应用于不同领域,如疾病检测、交通预测等,协助人们提高在该领域上的工作质量或效率。然而在实际应用中,尤其是在金融、医疗健康等重点应用领域,用于gpr模型构建或预测的数据往往被多方所持有,为了个人隐私保护等原因,数据拥有者需要在gpr模型构建和预测阶段实现对多方数据隐私保护。
3.现有技术中,通常利用同态加密(homomorphic encryption,he)算法加密预测数据,并通过服务器和用户之间的交互计算,实现了gpr算法高效的隐私保护预测,但现有技术中通常采用多项式近似计算的方式,实现gpr中的非线性运算,如指数、除法等,进而导致其算法在保护数据隐私时效率低下。
4.因此,现有技术还有待改进和发展。


技术实现要素:

5.本发明的主要目的在于提供一种基于高斯过程回归的数据隐私保护方法、装置、智能终端及计算机存储介质,旨在解决现有技术中现有技术中通常采用多项式近似计算的方式,实现gpr中的非线性运算,如指数、除法等,进而导致其算法在保护数据隐私时效率低下的问题。
6.为了实现上述目的,本发明第一方面提供一种基于高斯过程回归的数据隐私保护方法,所述基于高斯过程回归的数据隐私保护方法包括:
7.获取训练数据和测试数据;
8.计算协方差矩阵,根据所述训练数据进行高斯过程回归的训练;
9.生成指数随机数,通过秘密分享技术,根据所述指数随机数在高斯整数环上进行指数计算;
10.根据乔利斯基分解法将高斯过程回归中的正定矩阵进行分解,通过秘密分享技术,在高斯整数环上对分解后的正定矩阵进行求逆,构建高斯过程回归模型;
11.根据所述高斯过程回归模型对所述测试数据进行预测。
12.可选的,所述生成指数随机数,具体包括:
13.控制协助服务器从所述高斯整数环中产生指数随机数,所述指数随机数包括第一随机数,第二随机数,第三随机数和第四随机数,所述第一随机数、第二随机数,第三随机数和第四随机数满足以下表达式:
14.([r]0+[r]1)modl=r,
[0015]
([er]0+[er]1)modl=er,
[0016]
其中,[r]0表示第一随机数,[r]1表示第二随机数,r表示对([r]0+[r]1)取l的模,[er]0表示第三随机数,[er]1表示第四随机数,er表示自然常数的r的次方,modl表示取模l运算;
[0017]
控制协助服务器将所述第一随机数和所述第三随机数发送给第一计算服务器,将所述第二随机数和所述第四随机数发送给第二计算服务器。
[0018]
可选的,所述通过秘密分享技术,根据所述随机数在高斯整数环上进行指数计算,具体包括:
[0019]
通过秘密分享技术将输入数据拆分成第一输入数据和第二输入数据;
[0020]
控制所述第一计算服务器输入所述第一输入数据,控制所述第二计算服务器输入所述第二输入数据。
[0021]
可选的,所述通过秘密分享技术,根据所述随机数在高斯整数环上进行指数计算,具体还包括:
[0022]
控制所述第一计算服务器计算第一输入数据和第一随机数的第一差值,并将所述第一差值发送给第二计算服务器;
[0023]
控制所述第二计算服务器计算第二输入数据和第二随机数的第二差值,并将所述第二差值发送给第一计算服务器;
[0024]
根据所述第一差值和所述第二差值计算出第三差值;
[0025]
控制所述第一计算服务器根据所述第三差值和所述第三随机数计算出第一输出数据并输出;
[0026]
控制所述第二计算服务器根据所述第三差值和所述第四随机数计算出第二输出数据并输出。
[0027]
可选的,所述根据乔利斯基分解法将高斯过程回归中的正定矩阵进行分解,具体包括:
[0028]
根据第一表达式将高斯过程回归中的正定矩阵进行分解,所述第一表达式为:
[0029]
u=ldl
t

[0030]
其中,u=(u
h,k
),h,k=1,2,...,n,表示对称正定矩阵;u
h,k
表示矩阵u的元素,h和k表示元素的下标,l=(l
h,k
),h,k=1,2,...,n,表示单位下三角矩阵,l
h,k
表示矩阵l的元素,d=(dk),k=1,2,...,n,表示对角矩阵,dk表示矩阵d的元素。
[0031]
可选的,所述通过秘密分享技术,在高斯整数环上对分解后的正定矩阵进行求逆,具体包括:
[0032]
通过秘密分享技术将输入正定矩阵拆分成第一正定矩阵和第二正定矩阵;
[0033]
控制所述第一计算服务器输入所述第一正定矩阵,控制所述第二计算服务器输入所述第二正定矩阵。
[0034]
可选的,所述通过秘密分享技术,在高斯整数环上对分解后的正定矩阵进行求逆,具体还包括:
[0035]
将高斯过程回归中正定矩阵的求逆过程转换为加法运算、乘法运算和除法运算的组合;
[0036]
控制所述第一计算服务器调用加法算法、乘法算法和除法算法对所述第一正定矩阵进行求逆并输出结果;
[0037]
控制所述第二计算服务器调用加法算法、乘法算法和除法算法对所述第二正定矩阵进行求逆并输出结果。
[0038]
本发明第二方面提供一种基于高斯过程回归的数据隐私保护装置,其特征在于,所述基于高斯过程回归的数据隐私保护装置包括:
[0039]
获取模块,用于获取训练数据和测试数据;
[0040]
训练模块,用于计算协方差矩阵,根据所述训练数据进行高斯过程回归的训练;
[0041]
计算模块,用于生成指数随机数,通过秘密分享技术,根据所述指数随机数在高斯整数环上进行指数计算;
[0042]
求逆模块,用于根据乔利斯基分解法将高斯过程回归中的正定矩阵进行分解,通过秘密分享技术,在高斯整数环上对分解后的正定矩阵进行求逆,构建高斯过程回归模型;
[0043]
预测模块,用于根据所述高斯过程回归模型对所述测试数据进行预测。
[0044]
本发明第三方面提供一种智能终端,所述智能终端包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的基于高斯过程回归的数据隐私保护程序,所述基于高斯过程回归的数据隐私保护程序被所述处理器执行时实现如上所述基于高斯过程回归的数据隐私保护方法的步骤。。
[0045]
本发明第四方面提供一种计算机存储介质,所述计算机存储介质上存储有基于高斯过程回归的数据隐私保护程序,所述基于高斯过程回归的数据隐私保护程序被处理器执行时实现如上所述基于高斯过程回归的数据隐私保护方法的步骤。
[0046]
由上可见,本发明方案公开了一种基于高斯过程回归的数据隐私保护方法,所述基于高斯过程回归的数据隐私保护方法包括:获取训练数据和测试数据;计算协方差矩阵,根据所述训练数据进行高斯过程回归的训练;生成指数随机数,通过秘密分享技术,根据所述指数随机数在高斯整数环上进行指数计算;根据乔利斯基分解法将高斯过程回归中的正定矩阵进行分解,通过秘密分享技术,在高斯整数环上对分解后的正定矩阵进行求逆,构建高斯过程回归模型;根据所述高斯过程回归模型对测试数据进行预测。与现有技术中相比,本发明通过秘密分享技术在高斯整数环上进行指数运算,可以提高指数运算的效率,且根据乔利斯基分解法将高斯过程回归中的正定矩阵进行分解,对分解后的正定矩阵进行求逆,可以在不泄露输入矩阵隐私的前提下,实现安全求逆。
附图说明
[0047]
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
[0048]
图1是本发明实施例提供的基于高斯过程回归的数据隐私保护方法的一种流程示意图;
[0049]
图2是本发明实施例提供的高斯过程回归算法模型构建和预测的流程示意图;
[0050]
图3是本发明实施例提供的基于高斯过程回归的数据隐私保护装置的一种结构示意图;
[0051]
图4是本发明实施例提供的智能终端的内部结构原理框图;
[0052]
图5是本发明实施例提供的指数算法精确度对比示意图;
[0053]
图6是本发明实施例提供的正定矩阵求逆精确度对比示意图;
[0054]
图7是本发明实施例提供的正定矩阵求逆效率评估对比示意图。
具体实施方式
[0055]
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况下,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
[0056]
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0057]
还应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
[0058]
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0059]
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当

时”或“一旦”或“响应于确定”或“响应于检测到”。类似的,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述的条件或事件]”或“响应于检测到[所描述条件或事件]”。
[0060]
下面结合本发明实施例的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
[0061]
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其它不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
[0062]
现有技术中,为了在gpr模型构建和预测阶段实现对多方数据隐私保护,通常采用以下几种方法:
[0063]
利用he算法加密预测数据,并通过服务器和用户之间的交互计算,实现了gpr算法高效的隐私保护预测,上述方法的缺点在于:一方面只能实现对模型使用者预测数据的隐私保护,而不能保护gpr模型构建过程种的数据隐私;另一方面,由于采用多项式近似计算的方式,实现gpr中的非线性运算,如指数、除法等,进而导致其算法在保护数据隐私时效率低下。
[0064]
利用差分隐私(differential privacy,dp),通过添加满足条件的噪声,实现对训练数据标签信息的隐私保护,上述方法的缺点在于只能实现对gpr算法标签数据的隐私信息,而无法保护gpr在模型构建和预测过程中的其它隐私信息,如训练数据、预测数据,此外,上述方法在gpr模型构建的过程中需要注入噪声来实现隐私保护,使得算法在保护数据
隐私时性能差。
[0065]
利用联邦学习(federate learning,fl)的方法,通过交换gpr相关参数信息,避免原始隐私数据的直接传输实现gpr的隐私保护模型构建,上述方法的缺点在于:只适用于隐私数据横向划分场景下的gpr的模型构建,且在模型构建过程中所交换的参数信息可能会泄露用户的隐私数据信息。
[0066]
为了解决现有技术中存在的问题,本实施例中,提出一种基于高斯过程回归的数据隐私保护方法、装置、智能终端及计算机存储介质,能够提高指数运算的效率,且在不泄露输入矩阵隐私的前提下,实现安全求逆。
[0067]
示例性方法
[0068]
本实施例中,χ为d维的输入域,对于每个相应的输出为表示一个噪声方差为的函数的噪声观测。函数用高斯过程回归来建模,也就是说,每个有限子集的都遵循一个多变量的高斯分布,其高斯过程回归完全由其先验均值和协方差指定,其中
[0069][0070]
假设协方差由核函数定义,具体的,核函数可以是平方指数(squared exponential,se)核,如表达式(1)所示:
[0071][0072]
其中,l表示长度范围,σs表示符号方差。
[0073]
假设有一个包含n个样本的集合其中gpr模型可以通过对任何测试输入提供预测分布来执行概率回归,令为n
×
d的输入矩阵,为n个噪声输出的列向量,预测分布的后验均值可以用表达式(2)进行计算,预测分布的方差可以用表达式(3)进行计算,
[0074][0075][0076]
其中,为1
×
n矩阵,为n
×
n矩阵。
[0077]
假设是已经训练完成,并可以对计算服务器公开。此时,在高斯过程回归算法的模型构建和预测过程中主要包含的运算有:加法、乘法、指数和正定矩阵求逆,其中基于秘密分享技术的安全加法和安全乘法运算已经在现有技术中实线。
[0078]
为了解决安全指数和正定矩阵求逆的问题,本实施例中,提供一种基于高斯过程回归的数据隐私保护方法,本实施例中采用三方半诚实安全模型,高斯过程回归算法运行在三台两两之间互不共谋的服务器上,三台服务器包含两台计算服务器和一台协助服务器,具体地,如图1所示,所述方法包括如下步骤:
[0079]
步骤s100,获取训练数据和测试数据。
[0080]
步骤s200,计算协方差矩阵,根据所述训练数据进行高斯过程回归的训练。
[0081]
其中,训练数据包括第一训练数据和第二训练数据,控制第一计算服务器根据第一训练数据计算协方差矩阵,控制第二计算服务器根据第二训练数据计算协方差矩阵。
[0082]
步骤s300,生成指数随机数,通过秘密分享技术,根据所述指数随机数在高斯整数环上进行指数计算。
[0083]
在一些实施例中,所述生成指数随机数,具体包括:控制协助服务器从所述高斯整数环中产生指数随机数,所述指数随机数包括第一随机数,第二随机数,第三随机数和第四随机数,所述第一随机数、第二随机数,第三随机数和第四随机数满足以下表达式:
[0084]
([r]0+[r]1)modl=r,
[0085]
([er]0+[er]1)modl=er,
[0086]
其中,[r]0表示第一随机数,[r]1表示第二随机数,r表示对([r]0+[r]1)取l的模,[er]0表示第三随机数,[er]1表示第四随机数,er表示自然常数的r的次方,modl表示取模l运算;即生成的随机数需满足以上表达式;
[0087]
控制协助服务器将所述第一随机数和所述第三随机数发送给第一计算服务器,将所述第二随机数和所述第四随机数发送给第二计算服务器。
[0088]
在一些实施例中,所述通过秘密分享技术,根据所述随机数在高斯整数环上进行指数计算,具体包括:通过秘密分享技术将输入数据拆分成第一输入数据和第二输入数据;控制所述第一计算服务器输入所述第一输入数据,控制所述第二计算服务器输入所述第二输入数据。
[0089]
在一些实施例中,所述通过秘密分享技术,根据所述随机数在高斯整数环上进行指数计算,具体还包括:控制所述第一计算服务器计算第一输入数据和第一随机数的第一差值,并将所述第一差值发送给第二计算服务器;控制所述第二计算服务器计算第二输入数据和第二随机数的第二差值,并将所述第二差值发送给第一计算服务器;根据所述第一差值和所述第二差值计算出第三差值;控制所述第一计算服务器根据所述第三差值和所述第三随机数计算出第一输出数据并输出;控制所述第二计算服务器根据所述第三差值和所述第四随机数计算出第二输出数据并输出。
[0090]
在另一个实施例中,将生成指数随机数,通过秘密分享技术,根据所述指数随机数在高斯整数环上进行指数计算称为安全指数算法,在安全指数算法中,计算服务器输入u的shares[u]0,[u]1,在协助服务器的帮助下,计算得到eu的shares[eu]0,[eu]1,包括如下方法:
[0091]
控制第一计算服务器输入[u]0,第二计算服务器输入[u]1;
[0092]
线下阶段包括:
[0093]
控制协助服务器从整数环z
l
中随机产生[r]0,[r]1,[er]0,[er]1,[r]0,[r]1,[er]0,[er]1满足([r]0+[r]1)modl=r且([er]0+[er]1)modl=er;
[0094]
控制协助服务器将[r]0,[er]0发送给第一计算服务器;将[r]1,[er]1发送给第二计算服务器。
[0095]
线上阶段包括:
[0096]
对于j∈{0,1}:
[0097]
控制计算服务器sj分别计算dj=[u]
j-[r]j=[u-r]j,并将其发送给对方;
[0098]
控制计算服务器sj重构出d=([d]0+[d]1)modl=u-r;
[0099]
控制计算服务器sj本地计算[eu]j=ed·
[er]jmodl;
[0100]
控制计算服务器sj输出[eu]j;
[0101]
控制第一计算服务器输出[eu]0,第二计算服务器输出[eu]1。
[0102]
本实施例中的安全指数算法,只需控制计算服务器花费一轮通信用于重构d=u-r,其总的通信量为2l。利用并行计算,本专利所本实施例中的安全指数算法可以通过一轮2nl比特的通信,完成对n个数据的安全指数运算,提高运算效率。
[0103]
步骤s400,根据乔利斯基分解法将高斯过程回归中的正定矩阵进行分解,通过秘密分享技术,在高斯整数环上对分解后的正定矩阵进行求逆,构建高斯过程回归模型。
[0104]
在一些实施例中,所述根据乔利斯基分解法将高斯过程回归中的正定矩阵进行分解,具体包括:根据第一表达式将高斯过程回归中的正定矩阵进行分解,所述第一表达式为:
[0105]
u=ldl
t

[0106]
其中,u=(u
h,k
),h,k=1,2,...,n,表示对称正定矩阵;u
h,k
表示矩阵u的元素,h和k表示元素的下标,l=(l
h,k
),h,k=1,2,...,n,表示单位下三角矩阵,l
h,k
表示矩阵l的元素,d=(dk),k=1,2,...,n,表示对角矩阵,dk表示矩阵d的元素。
[0107]
对于一个对称正定矩阵u=(u
h,k
),h,k=1,2,...,n,可以通过乔利斯基分解法将其分解为u=ldl
t
。具体地,可通过以下表达式计算l和d:
[0108][0109][0110]
令v=dl
t
u-1
,则有lv=ldl
t
u-1
=uu-1
=i,其中i为单位矩阵。通过以下表达式计算得到v=l-1

[0111][0112]
此时,可以计算u-1
=(ldl
t
)-1
=(l-1
)
t
d-1
l-1
[0113]
在一些实施例中,所述通过秘密分享技术,在高斯整数环上对分解后的正定矩阵进行求逆,具体包括:通过秘密分享技术将输入正定矩阵拆分成第一正定矩阵和第二正定矩阵;控制所述第一计算服务器输入所述第一正定矩阵,控制所述第二计算服务器输入所述第二正定矩阵。
[0114]
在一些实施例中,所述通过秘密分享技术,在高斯整数环上对分解后的正定矩阵进行求逆,具体还包括:将高斯过程回归中正定矩阵的求逆过程转换为加法运算、乘法运算和除法运算的组合;控制所述第一计算服务器调用加法算法、乘法算法和除法算法对所述第一正定矩阵进行求逆并输出结果;控制所述第二计算服务器调用加法算法、乘法算法和除法算法对所述第二正定矩阵进行求逆并输出结果。
[0115]
在另一个实施例中,将根据乔利斯基分解法将高斯过程回归中的正定矩阵进行分解,通过秘密分享技术,在高斯整数环上对分解后的正定矩阵进行求逆称为安全正定矩阵
求逆算法,在安全正定矩阵求逆算法中,计算服务器输入正定矩阵u的shares[u]0,[u]1,在协助服务器的帮助下,计算得到u-1
的shares[u-1
]0,[u-1
]1,包括如下方法:
[0116]
控制第一计算服务器输入[u]0,第二计算服务器输入[u]1;
[0117]
线下阶段包括:
[0118]
控制协助服务器从整数环z
l
中随机产生足量的随机数a,b,c,a,b,c满足a
·
b=c;
[0119]
控制协助服务器将[a]j,[b]j,[c]j发送给sj。
[0120]
线上阶段包括:
[0121]
对于j∈{0,1};控制计算服务器sj分别令[d1]j=[u
1,1
]j;控制计算服务器sj通过调用安全除法算法,计算[l
1:n,1
]j=[u
1:n,1
]j/[u
1,1
]j;
[0122]
对于k∈{2,3,...,n}:控制计算服务器sj通过调用安全乘法算法,计算控制计算服务器sj通过调用安全乘法算法,计算控制计算服务器sj通过调用安全乘法算法,计算
[0123]
控制计算服务器sj得到[l]j,[d]j。
[0124]
令v
1,1

1,对于j∈{0,1}:对于k∈{2,3,...,n}:控制计算服务器sj通过调用安全乘法算法,计算
[0125]
控制计算服务器sj得到[v]j;
[0126]
控制计算服务器sj通过调用安全乘法算法计算得到[u-1
]j=[v
t
d-1
v]j;
[0127]
控制计算服务器sj输出[u-1
]j;
[0128]
控制第一计算服务器输出[eu]0,第二计算服务器输出[eu]1。
[0129]
步骤s500,根据所述高斯过程回归模型对测试数据进行预测。
[0130]
需要说明的是,上述符号表示的含义如表1所示:
[0131]
表1
[0132]
符号含义z
l
,l=2
32
(2
64
)整数环[x]0,[x]1∈z
l
,满足[x]0+[x]1=x环z
l
上的加性share[l:n]从l到n
[0133]
本实施例中采用三方半诚实安全模型,高斯过程回归算法运行在三台两两之间互不共谋的服务器上,三台服务器包含两台计算服务器和一台协助服务器,其中,通过计算服务器进行数据的输入和输出,协助服务器在计算服务器计算过程中产生和发送一些满足预设条件的随机数,协助计算服务器完成隐私保护下的训练和预测过程。具体地,如图2所示,训练数据(训练数据x和标签y)包括第一训练数据([x]0,[y]0)和第二训练数据([x]1,[y]1),控制第一计算服务器输入所述第一输入数据,控制第二计算服务器输入所述第二输
入数据;第一计算服务器和第二计算服务器根据第一输入数据和第二输入数据分别计算协方差矩阵,然后根据本实施例提供的安全指数算法和安全正定矩阵求逆算法构建高斯过程回归模型,并根据所述高斯回归模型对训练数据进行预测。
[0134]
需要说明的是,在高斯过程回归算法模型构建和预测过程中,假设其中一台计算服务器被半诚实敌手a所控制,敌手可以获取该计算服务器在协议执行过程中的内部状态,敌手a在协议执行的过程中不会违反协议的规则,但是会基于所获得的内部状态试图获取更多有利信息。本实施例,设置概率多项式时间的模拟器,可以在高斯过程回归算法模型构建和预测过程中,通过计算服务器的输入、输出信息以及公开参数(已经训练完成的模拟该计算服务器的内部状态,使得敌手无法区分该状态与真实状态的区别,表示该过程在半诚实模型下是安全的。
[0135]
还需要说明的是,对于若b是在上随机均匀分布且与a之间是相互独立的,则有a+b也是在z
l
中随机均匀分布且与a之间是相互独立的。
[0136]
在安全指数算法中,算法的输入信息为[u]0,[u]1,输出信息为[eu]0,[eu]1,其正确性可以以下等式得到验证:
[0137]
[eu]0+[eu]1=ed·
[er]0+ed·
[er]1[0138]
=ed·
([er]0+[er]1)
[0139]
=ed·er
=e
u-r
·er
[0140]
=eu[0141]
因此,本实施例中安全指数算法在半诚实模型下,通过输入[u]0,[u]1计算出[eu]0,[eu]1,满足([eu]0+[eu]1)modl=eu。
[0142]
在安全性方面,在安全指数算法执行过程中,协助服务器仅在线下阶段产生满足公开条件的随机数,因此存在多项式时间模拟器s,可以模拟出协助服务器的视图,且使得半诚实敌手a无法区分其与真实算视图之间的区别。
[0143]
第一计算服务器的视图为{[u]0,[r]0,[er]0,d},其中[u]0是输入信息,而{[r]1,[er]1}对于敌手a来说是在z
l
上随机均匀分布的,d=u-r是在z
l
上随机均匀分布,且与u之间相互独立,因此存在多项式时间模拟器可以模拟出第一计服务器的视图,且使得半诚实敌手a无法区分其与真实视图之间的区别。
[0144]
同理亦可以证明存在多项式时间模拟器可以模拟出第二计算服务器的视图,且使得半诚实敌手a无法区分其与真实视图之间的区别。因此,本实施例中指数函数在半诚实模型下是安全的。
[0145]
由上可见,本发明方案公开了一种基于高斯过程回归的数据隐私保护方法,所述基于高斯过程回归的数据隐私保护方法包括:获取训练数据和测试数据;计算协方差矩阵,根据所述训练数据进行高斯过程回归的训练;生成指数随机数,通过秘密分享技术,根据所述指数随机数在高斯整数环上进行指数计算;根据乔利斯基分解法将高斯过程回归中的正定矩阵进行分解,通过秘密分享技术,在高斯整数环上对分解后的正定矩阵进行求逆,构建高斯过程回归模型;根据所述高斯过程回归模型对测试数据进行预测。与现有技术中相比,本发明通过秘密分享技术在高斯整数环上进行指数运算,可以提高指数运算的效率,且根据乔利斯基分解法将高斯过程回归中的正定矩阵进行分解,对分解后的正定矩阵进行求
逆,可以在不泄露输入矩阵隐私的前提下,实现安全求逆。
[0146]
示例性设备
[0147]
如图3中所示,对应于基于高斯过程回归的数据隐私保护方法,本发明实施例还提供一种基于高斯过程回归的数据隐私保护装置,所述基于高斯过程回归的数据隐私保护装置包括:
[0148]
获取模块301,用于获取训练数据和测试数据;
[0149]
训练模块302,用于计算协方差矩阵,根据所述训练数据进行高斯过程回归的训练;
[0150]
计算模块303,用于生成指数随机数,通过秘密分享技术,根据所述指数随机数在高斯整数环上进行指数计算;
[0151]
求逆模块304,用于根据乔利斯基分解法将高斯过程回归中的正定矩阵进行分解,通过秘密分享技术,在高斯整数环上对分解后的正定矩阵进行求逆,构建高斯过程回归模型;
[0152]
预测模块305,用于根据所述高斯过程回归模型对测试数据进行预测。
[0153]
具体地,本实施例中,上述基于高斯过程回归的数据隐私保护装置及其各个模块的具体功能还可以参照上述基于高斯过程回归的数据隐私保护方法中的对应描述,在此不再赘述。
[0154]
基于上述实施例,本发明还提供了一种智能终端,其原理框图可以如图4所示。所述智能终端包括处理器及存储器。该智能终端的存储器包括基于高斯过程回归的数据隐私保护程序,存储器为基于高斯过程回归的数据隐私保护程序的运行提供环境。该基于高斯过程回归的数据隐私保护程序被处理器执行时针对实现上述任意一种基于高斯过程回归的数据隐私保护方法的步骤。
[0155]
本领域技术人员可以理解,图4中示出的原理框图,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的智能终端的限定,具体地智能终端可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0156]
在一个实施例中,上述基于高斯过程回归的数据隐私保护程序被上述处理器执行时进行以下操作指令:
[0157]
获取训练数据和测试数据;
[0158]
计算协方差矩阵,根据所述训练数据进行高斯过程回归的训练;
[0159]
生成指数随机数,通过秘密分享技术,根据所述指数随机数在高斯整数环上进行指数计算;
[0160]
根据乔利斯基分解法将高斯过程回归中的正定矩阵进行分解,通过秘密分享技术,在高斯整数环上对分解后的正定矩阵进行求逆,构建高斯过程回归模型;
[0161]
根据所述高斯过程回归模型对测试数据进行预测。
[0162]
本发明实施例还提供一种计算机存储介质,上述计算机存储介质上存储有基于高斯过程回归的数据隐私保护程序,上述基于高斯过程回归的数据隐私保护程序被处理器执行时实现本发明实施例提供的任意一种基于高斯过程回归的数据隐私保护方法的步骤。
[0163]
应理解,上述实施例中各步骤的序号大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
[0164]
模型仿真分析:
[0165]
为验证本实施例的有效性,对本专利所提出的安全指数算法和安全矩阵求逆算法计算结果的准确率和计算效率进行测试。
[0166]
具体的测试过程如下:
[0167]
安全指数算法:将本实施例中安全指数算法(pp-exp)分别与明文的指数算法(plaintext)、crypten安全指数算法以及使用6次多项式近似指数算法(poly)的计算结果进行对比,结果如图5所示,由图5可知,本实施例所提出的安全指数算法的计算结果优于其它的安全指数算法。
[0168]
安全矩阵求逆算法:通过随机生成不同维数的协方差矩阵其中x∈[-10,10]
n,2
,对本专利所提出的安全矩阵求逆算法(pp-mi)的计算精确度和计算时间进行测试,具并与明文分解求逆(plaintext-cholesky)和pytorch自带的明文求逆算法(plaintext-inv)进行对比,图6为本实施例中正定矩阵求逆算法的计算精确度的对比示意图,图7为本实施例中正定矩阵求逆算法的计算时间的对比示意图,dimonsion of matrix表示矩阵大小,λ是矩阵求逆算法的计算结果,使用||uλ-i||2衡量该求逆算法的计算误差。由图6和图7可知,本实施例中安全正定矩阵求逆算法在精确度和效率上优于其他算法。
[0169]
具体实现中,训练数据可以是交通数据集或是糖尿病数据集,本实施例中,当训练数据为交通数据集时,使用se核,在交通数据集上的参数设置σs=0.7969,l=0.6276;当训练数据为糖尿病数据集时,使用se核,在糖尿病数据集上其参数设置σs=1.0,l=0.06。
[0170]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将上述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0171]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各实例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟是以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。
[0172]
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,上述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以由另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
[0173]
上述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,上述计算机程序可存储于一计算机存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实
施例的步骤。上述计算机可读介质可以包括:能够携带上述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,上述计算机存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减。
[0174]
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不是相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1