一种面向车联网隐私安全的联邦学习方法

文档序号:34907513发布日期:2023-07-27 19:33阅读:173来源:国知局
一种面向车联网隐私安全的联邦学习方法

本发明涉及车联网和大数据领域,具体涉及一种面向车联网隐私安全的联邦学习方法。


背景技术:

1、移动通信技术的飞速发展,为车联网的通信提供了超低延迟和高可靠性的支持,诞生了自动驾驶和智能交通等智能化服务。但智能化服务需要大量的移动终端提供数据,并且提供的私有数据很可能是敏感且异构。因此,解决车联网场景中私有数据的安全性以及非独立同分布问题至关重要。车联网场景存在移动终端(车辆)、边缘设备(路侧单元rsu)和云端三部分,它们之间不断的通信与交互,为移动终端提供了智能化服务。

2、由于担心个人隐私数据泄露,车主不愿将数据上传数据中心,这阻碍了数据的流通,影响了车联网产业的发展。基于联邦学习数据隐私保护技术具有显著优势。基于联邦学习的车联网技术可以达到数据不出本地的协同训练目的,并且高动态车辆只需将所训练的模型参数传送给路侧单元,不需要共享整个原始数据集,从而避免了隐私泄露风险。因此,基于联邦学习的车联网技术具有重要的实际研究价值。例如,中国专利文献cn112700639a公开了一种基于联邦学习与数字孪生的智能交通路径规划方法。

3、然而,目前大多数联邦学习方案都采用基于梯度空间的聚合方法,这种方法存在许多缺陷。首先,传输的参数量较大,不支持模型异构,无法在车联网等场景广泛应用。其次,该方法容易受到重构攻击、投毒攻击、成员推理攻击等威胁。因此亟需设计一种新的联邦学习方案,既能提高联邦学习整体过程的鲁棒性,又能保证其安全性。


技术实现思路

1、针对上述现有技术的不足,本发明所要解决的技术问题是:如何提供一种面向车联网隐私安全的联邦学习方法,旨在减少联邦学习通信过程传输的参数量、缓解模型异构问题,同时能够通过多密钥的半同态加密算法以及差分隐私中的高斯机制保护联邦学习参与方数据的隐私,从而提高车联网联邦学习的有效性和安全性,进而有助于提升车联网提供的智能化服务的分析处理能力,最终实现智能化交通管理、智能动态信息服务和车辆智能化控制。

2、为了解决上述技术问题,本发明采用了如下的技术方案:

3、一种面向车联网隐私安全的联邦学习方法,包括:

4、s1:生成公私钥,并将私钥分割为对应份数的子密钥,进而将公钥和对应的子密钥分发给参加联邦学习的各个车辆;

5、s2:对于单个车辆:首先获取联邦学习的全局原型向量;然后基于本地数据和全局原型向量训练本地模型,并计算每类数据的局部原形向量;最后通过公钥对局部原形向量进行加密,生成加密局部原形向量;

6、s3:对各个车辆的加密局部原形向量进行同态加法运算,生成加密局部原形向量之和;

7、s4:随机选择预设数量个车辆,并依次向各个车辆发送加密局部原形向量之和,使得各个车辆能够基于自身的子密钥依次对加密局部原形向量之和进行部分解密,直至完全解密得到局部原形向量之和;

8、s5:根据局部原形向量之和计算全局原型向量,并分发给参加联邦学习的各个车辆;

9、s6:重复步骤s2至s5,直至各个车辆的本地模型收敛。

10、优选的,通过如下步骤生成公私钥:

11、s101:选择两个大素数p和q,满足p≠q,计算整数n;

12、公式描述如下:

13、n=p*q;

14、n=n2;

15、s102:计算p-1和q-1的最小公倍数λ;

16、公式描述如下:

17、λ=lcm(p-1,q-1);

18、其中lcm为最小公倍数函数;

19、s103:选择一个小于n的正整数g,使得满足gcd(gλmod n,n)=1;

20、其中gcd为最大公约数函数,且存在

21、s104:生成公私钥;

22、公钥:pk=(n,g);私钥:sk=(λ,μ)。

23、优选的,通过如下步骤对私钥进行分割:

24、s111:设置阈值t,构造一个t次多项式f(x);

25、公式描述为:

26、f(x)=sk+a1*x+a2*x2+…+at-1*xt-1;

27、其中f(0)=sk;a1至at-1为随机整数,满足ai<sk,n>t;

28、s112:定义m个车辆对应的持有者为p1,p2…pm,pi分到的子密钥为ski=f(i)。

29、优选的,车辆的本地数据di=(xi,yi),其中xi=(xi1,xi2,…,xin),yi=(yi1,yi2,…,yin);xi表示车辆i的样本,yi表示车辆i的标签数据,i表示车辆的序号,i=1,2,…,n∈r。

30、优选的,车辆通过如下步骤对本地模型进行训练:

31、s201:样本x与标签y属于本地数据di,即(x,y)∈di;车辆i根据参数φi化的hi函数计算样本x的局部原型向量,并根据参数vi化的gi函数计算预测结果;

32、公式描述为:

33、

34、

35、式中:表示车辆i的局部原型向量;表示预测结果;di,j表示车辆i本地数据的第j类数据;hi表示车辆i本地模型中的降维部分;gi表示车辆i本地模型中的预测部分;

36、s202:车辆i根据损失函数使用反向传播算法优化本地模型的参数φi和参数vi;

37、损失函数表示为:

38、

39、式中:l表示本地模型的损失函数;ls表示监督损失函数;lr表示正则项;表示第j类全局原型向量;|c|表示局部原型向量的种类数;di表示第i个本地数据集;n表示所有本地数据集的样本数量;nj表示所有本地数据集第j类样本的数量。

40、优选的,通过如下步骤生成加密局部原形向量:

41、s211:向车辆i的局部原型向量添加高斯噪声,生成噪声局部原型向量;

42、公式描述为:

43、

44、式中:表示噪声局部原型向量;表示车辆i的局部原型向量;表示期望为0、标准差为的高斯噪声;表示本地模型的敏感度;σ表示噪声方差;t表示参与解密的阀值;

45、s212:通过公钥pk对车辆i的噪声局部原型向量进行加密,生成加密局部原形向量;

46、公式描述为:

47、

48、式中:表示加密局部原形向量;表示噪声局部原型向量;enc表示加密函数。

49、优选的,通过如下公式进行同态加法运算:

50、

51、式中:rj表示加密局部原型向量之和;rmj表示第m个车辆的加密局部原型向量。

52、优选的,随机选择m-t+1个车辆,并依次向各个车辆发送加密局部原形向量之和。

53、优选的,通过如下公式对加密局部原型向量之和进行部分解密:

54、

55、式中:rj表示加密局部原型向量之和;sj表示完全解密后的局部原形向量之和;ski表示车辆i的子密钥;dec表示解密函数。

56、优选的,通过如下公式计算全局原型向量:

57、

58、式中:表示全局原型向量;sj表示完全解密后的局部原形向量之和;m表示参加联邦学习的车辆数量。

59、本发明中面向车联网隐私安全的联邦学习方法与现有技术相比,具有如下有益效果:

60、本发明中,云端(或路侧单元)不直接收集车辆的数据,而仅收集最新的局部原型,参加联邦学习的各个车辆基于本地数据和云端下发的全局原型向量训练本地模型,完成训练后计算每类数据的局部原形向量并上传,用以更新云端存储的全局原型向量。一方面,本发明能够通过联邦学习保证车联网场景中机器学习和模型训练的效果,并且能够打破车辆之间的数据孤岛,进而有助于提升车联网提供的智能化服务的分析处理能力,最终实现智能化交通管理、智能动态信息服务和车辆智能化控制。另一方面,本发明采用了基于原型和允许模型异构的联邦学习聚合方法,减少了通信过程传输的参数量,缓解了联邦学习中的模型异构问题,并且可以使计算资源受限的终端(车辆)也参与联邦学习,从而能够提高车联网联邦学习的有效性。

61、本发明中,云端生成公私钥并将私钥分割为对应份数的子密钥分发给参加联邦学习的各个车辆,车辆计算每类数据的局部原形向量后先对局部原形向量进行加密,云端(或路侧单元)直接对加密后的局部原形向量进行同态加法运算生成加密局部原形向量之和,进而将加密局部原形向量之和依次传递给多个车辆,多个车辆依次使用私钥的子密钥(秘密份额)进行部分解密操作,最终经过多次部分解密,云端能够得到解密的局部原形向量之和并计算全局原形向量用以完成联邦学习。本发明通过多密钥的半同态加密算法以及差分隐私中的高斯机制保护了联邦学习参与方(车辆)数据的隐私,能够解决联邦学习存在的重构攻击、投毒攻击、成员推理攻击等威胁,从而能够提高车联网联邦学习的安全性。同时通过车联网场景进行了实际案例分析,发现本发明的联邦学习方法能够适用于车辆的本地训练以及联合训练过程,能够在不泄漏车辆本地数据的前提下,有效的寻找本地模型收敛方向。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1