恶意和低质量用户场景下安全无线联邦学习方法及系统

文档序号:36161387发布日期:2023-11-23 09:38阅读:45来源:国知局
恶意和低质量用户场景下安全无线联邦学习方法及系统

本发明属于无线通信,尤其涉及一种恶意和低质量用户场景下安全无线联邦学习方法及系统。


背景技术:

1、目前,在大数据时代下,人工智能应用蓬勃发展需要大数据作为基础。然而,事实却是,数据常常既是小规模的,又是碎片化的。例如,任何机构都不能随意收集由终端设备产生的数据,这些数据都以碎片化的形式分散存在。例如,像医院这样的机构,由于行业的特殊性,对用户数据的掌握量往往是有限的。然而,由于用户隐私和数据安全方面的需求,使得不同机构间以简单的方式将所有数据聚合到一处并进行处理变得越来越不可行。在这样的环境下,联邦学习作为一种行之有效的解决方案引起了人们的广泛关注。联邦学习既能帮助多个参与方搭建共享的高性能模型,又符合用户隐私和数据保密性的要求。模型的构建并不需要将数据从任何边缘终端设备传输到一个中心位置(比如云服务器),只传输与局部模型相关的参数,使得每个终端设备的数据均不离开本地,保护了终端设备的隐私性。联邦学习已经成为许多安全敏感任务中的基本技术,如自动驾驶和医学图像分析等。尽管有这样的潜力,但联邦学习本身的安全和隐私问题也引起了广泛的关注。其中一个突出的问题是从梯度中产生的隐私泄露。半诚实的服务器仍然可以从接收到的梯度或权重中恢复一些敏感信息。联邦学习面临的另一个关键的安全威胁是中毒攻击。因为服务器不能访问单个终端设备的数据集和训练过程,因而恶意终端用户可以提交定制的梯度,从而使模型收敛减缓或者损坏模型,比如在测试阶段导致分类错误。这种操作也可能间接侵犯用户的数据隐私。例如,通过上传反向或者放大的梯度,恶意用户可以推断出这些样本是否被用于训练目标模型。由于参与联邦学习的用户本地数据质量参差不齐,使得用户在训练的本地模型性能有较大差异,因此低质量数据用户的存在,进而使得全局模型性能收到影响。

2、联邦学习应用于无线网络又称为无线联邦学习,受制于无线网络,无线联邦学习又会面临新的挑战。无线通信的用户具有移动性,可以在不同区域之间进行移动,从而影响该用户与中心服务器或与其他用户的连接性,导致某些用户失去连接从而退出训练过程;同时由于无线信道具有不稳定性和不可靠性,很难满足局部模型上传的低延迟和高吞吐量的要求;另外,无线通信的传输通道是一个开放的空间,进行无线通信的信息传播中,所有的调制信息都是暴露在公共空间中,容易被恶意用户窃听和遭受各种敌对攻击,具有很大的安全隐患。以上各种问题会使无线联邦学习训练过程受到不利影响,甚至可能导致全局模型训练过程的发散。因此,采取相应措施使得无线联邦学习过程能够增强用户隐私性和抵御恶意攻击,对于提升模型可靠性和收敛速度都具有重要意义。

3、通过上述分析,现有技术存在的问题及缺陷为:

4、(1)无线通信的传输通道容易被恶意用户窃听以及遭受各种敌对攻击,具有很大的安全隐患;

5、(2)现有技术无法区分恶意用户和低质量用户,导致在恶意用户鉴别阶段将具有低质量数据的用户直接划分为恶意用户,极端情况下可能使得参与联邦训练的用户数较少,模型训练的数据较少,进而影响模型性能。


技术实现思路

1、针对现有技术存在的问题,本发明提供了一种恶意和低质量用户场景下安全无线联邦学习方法及系统。

2、本发明是这样实现的,一种恶意和低质量用户场景下安全无线联邦学习方法,所述恶意和低质量用户场景下安全无线联邦学习方法包括:

3、服务器构建用户调度概率表,用户利用本地数据进行训练形成本地模型,并将加密后的本地模型参数发送给服务器;

4、服务器对加密模型进行模糊处理并发送给云平台用于鉴别恶意用户,云平台根据模型相似度对用户侧模型进行加权聚合;

5、经过一定的通信轮次,服务器根据用户调度概率表构建恶意用户集和良性用户集;

6、对恶意用户集中的低质量良性用户进行数据清洗,并最终细粒度划分恶意用户集为恶意用户集和低质量用户集;

7、合并良性用户集进行常规联邦训练。

8、进一步,实现所述恶意和低质量用户场景下安全无线联邦学习方法具体包括:

9、步骤一,服务器构建用户调度概率模型,初始状态下,所有用户的调度概率相同。密钥生成器为用户和云平台生成密钥-私钥对,用户利用云平台的公钥加密本地模型,加密公式表示如下:

10、enc(wk)=paillier.encrypt(wk)

11、步骤二,根据用户调度概率选择用户与服务器进行加密交互;

12、在用户与服务器加密交互的每个通信轮次,服务器依据用户调度概率以及通信资源限制合理选择部分用户进行调度:共有k个用户,无线信道最多允许传输k1个用户模型,则将根据以下策略选择用户:

13、

14、其中,n={1,2,...,k1}是一个长度为k1的向量,ui表示被选择用户的编号,p(ui)表示用户ui的调度概率;

15、服务器接收来自各选择用户的加密模型,经过模糊处理后发送给云平台,模糊处理的公式表示如下:

16、gk=enc(wk)·enc(rk)

17、其中enc(wk)表示第k个用户的加密模型,rk表示一个随机数,·表示乘法或加法操作,gk表示经过掩饰后的第k个用户的加密模型;

18、步骤三,云平台解密模型并计算用户侧模型与全局模型的余弦相似度,用公式表示如下:

19、

20、其中表示第k个用户t+1轮训练形成的用户侧模型,表示第t轮全局模型。

21、以用户侧模型与全局模型的余弦相似度为基础,在每一轮训练中,根据相似度阈值筛选用户集,动态更新概率调度表,更新后的用户调度概率表示如下:

22、

23、云平台运行恶意检测模块,根据相似度阈值判断当前轮次用户行为的性质,低于阈值判定为恶意行为,高于等于阈值判定为良性行为,进而构建当前轮次的良性用户集和恶意用户集,进而更新相应用户集的调度概率,对当前轮次的良性用户集进行加权聚合;

24、步骤四,数据清洗,利用全局模型的预测对恶意用户集中的低质量用户进行数据重标签;

25、步骤五,重置用户调度概率,对用户行为进行二次评估,根据用户侧模型与全局模型的余弦相似度和信道质量动态更新用户调度概率,进而将第一次鉴别为恶意用户的低质量用户筛选出来;

26、步骤六,合并良性用户进行常规联邦训练。

27、进一步,所述步骤三的用户调度概率动态更新准则具体包括:

28、初始状态下,所有用户的调度概率表示如下:

29、

30、其中k表示所有本地用户数,训练开始前所有用户的调度概率相同;

31、在第t个通信轮次中,服务器调度k1个用户云平台运行攻击检测模块将k1个用户划分为恶意用户集um和良性用户集up,并更新用户调度概率表,更新后的用户调度概率表示如下:

32、

33、其中,k表示所有本地用户数,k′表示第t轮通信中鉴别的良性用户集,b′表示第t轮通信中鉴别的恶意用户集,x表示第t轮通信中调度到的用户概率变化量,即恶意用户调度概率的总减小量或良性用户调度概率的总增加量,x为一个可控变量,取则用户调度概率表示如下:

34、

35、由于用户的调度概率必须大于等0,当某用户多次鉴别为恶意用户后导致调度概率小于等于0,则将其概率赋值为0,即之后不再调度该用户。

36、进一步,所述步骤一和步骤三加密和解密流程具体包括:

37、用户侧模型加密,密钥生成中心负责生成用户和云平台的公钥-私钥对,用户利用云平台的公钥对本地模型权重进行加密处理,通过上行链路发送给服务器;

38、服务器模糊处理加密模型,为防止服务器推测用户侧模型信息,采用双服务器架构,即服务器+云平台,服务器与云平台之间无串通,服务器接收到加密用户侧模型后,对用户侧模型执行以下处理:

39、gk=enc(wk)·enc(rk)

40、其中enc(wk)表示第k个用户的加密模型,rk表示一个随机数,·表示乘法或加法操作,gk表示经过掩饰后的第k个用户的加密模型;

41、云平台模型解密,云平台收到服务器传输的掩饰模型后,利用自己的私钥进行解密,并执行相关计算操作。

42、进一步,所述步骤三中的基于云平台的恶意检测模块检测流程包括:

43、计算用户侧模型与全局模型的余弦相似度,计算公式如下:

44、

45、其中表示第k个用户t+1轮训练形成的用户侧模型,表示第t轮全局模型。

46、设定模型相似度阈值sim-threshold作为当前轮次鉴别恶意用户的依据,在当前调度的用户集中,模型相似度小于sim-threshold的用户判定为当前轮次的恶意用户,模型相似度大于等于sim-threshold的用户判定为当前轮次良性用户,并更新当前用户的调度概率;设定调度概率阈值p-threshold作为鉴别恶意用户的依据,最终经过一定的通信轮次后,根据用户调度概率表,选择调度概率大于等于p-threshold的用户作为最终鉴别的良性用户,选择调度概率小于p-threshold的用户作为最终鉴别的恶意用户,从而构建恶意用户集和良性用户集。

47、进一步,所述步骤三中基于模型相似度的模型加权聚合准则具体包括:

48、对于每个通信轮次恶意检测模块鉴别后的良性用户集,云平台根据当前轮次良性用户的模型相似度对用户侧模型重新加权,加权方式如下所示:

49、

50、其中,weightk表示第k个用户的本地模型权重,k′表示当前轮次鉴别的良性用户集,αk,g表示第k个用户的本地模型与全局模型的余弦相似度。

51、进一步,所述步骤四中的数据清洗操作具体包括:基于攻击检测模块最终的鉴别结果,依据全局模型的预测遍历本地用户的数据集,对鉴别的恶意用户集中的低质量用户进行数据重标签。

52、本发明的另一目的在于提供一种实施所述恶意和低质量用户场景下安全无线联邦学习系统,所述恶意和低质量用户场景下安全无线联邦学习系统包括:

53、调度概率构建模块,基于模型余弦相似度构建所有与服务器关联的用户调度概率表,并在每轮通信后根据用户行为更新用户调度概率;

54、本地训练模块,本地用户利用本地数据执行联邦学习训练任务,并形成用户侧模型;

55、通信模块,根据用户调度概率选择部分用户利用无线信道与服务器进行通信;

56、恶意检测模块,用于对本地用户上传的模型参数进行恶意攻击检测,防止恶意用户和低质量用户对全局模型性能产生影响;

57、加密解密模块,用于加密解密模型参数,防止模型参数信息泄露,增强联邦学习隐私性;

58、数据清洗模块,用于对用户低质量数据进行数据重标签,提高本地训练模型性能;

59、全局聚合模块,根据模型相似度对调度用户执行模型加权全局聚合操作,形成全局模型用于用户本地训练。

60、本发明的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述恶意和低质量用户场景下安全无线联邦学习方法。

61、本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述恶意和低质量用户场景下安全无线联邦学习方法。

62、结合上述的技术方案和解决的技术问题,本发明所要保护的技术方案所具备的优点及积极效果为:

63、第一、在恶意用户和低质量用户共存的无线安全联邦学习应用场景中,抵御恶意攻击从而保护联邦训练网络的隐私性以及提高低质量良性用户的数据可用性从而扩充联邦训练网络数据集规模至关重要。为了在这类场景中正确鉴别恶意用户同时实现低质量用户的数据清洗操作,本发明公开了恶意和低质量用户场景下安全无线联邦学习方法,通过加密用户侧模型参数信息防止用户信息泄露,通过衡量用户侧模型与全局模型的余弦相似度并实施自适应调度策略,从而构建联邦训练网络中各用户的调度概率表,进而实现恶意用户和低质量用户的过滤,然后对筛选出的用户集中的低质量用户进行数据重标签,实现低质量用户的本地数据清洗。本发明的恶意用户鉴别和低质量用户数据清洗策略可以有效抵御恶意攻击同时保证参与联邦训练用户数的最大化。

64、通过针对恶意用户和低质量用户共存场景下用户侧模型的加密操作,本发明能够有效地防止用户模型信息泄露和各种敌对攻击,从而提高联邦训练网络的稳定性和模型性能。本发明采用双服务器架构,可以有效防止服务器解密破解用户模型,从而推测用户相关信息,实现了用户隐私性。

65、综上所述,本发明针对恶意用户和低质量用户共存场景提出了有效的隐私保护方法,能够显著提高联邦训练网络的安全性和可靠性,优化了系统性能,这将对无线安全联邦学习相关应用领域产生积极影响。

66、第二,本发明克服了低质量用户和恶意用户对模型性能的影响,同时防止了用户侧模型泄露,合理有效地调度更多良性用户参与联邦训练,避免了无线网络中信道资源浪费的问题,极大提升了联邦学习的效率,优化了全局模型的训练过程。

67、本发明所要保护的技术方案针对恶意用户和低质量用户共存场景下的无线联邦学习隐私保护问题,提供了基于同态加密技术的解决方案。本发明具备以下技术效果和优点:

68、更强的普适性:本发明考虑恶意用户和低质量用户共存场景下的恶意用户鉴别,利用数据清洗操作可以实现低质量良性用户向高质量良性用户的转变,使得本发明既可以应对同时存在恶意用户和低质量用户的复杂场景,也可以应对只存在恶意用户或者低质量用户的简单场景,具有更强的普适性。

69、提高网络安全性和可靠性:本发明通过采用同态加密技术,可以有效防止用户侧模型的泄露,同时采用双服务器架构,既避免了单服务器存在的弊端(如单点故障),也防止了服务器推测用户相关信息的问题,提高了联邦训练网络的安全性和可靠性。

70、第三,作为本发明的权利要求的创造性辅助证据,还体现在以下几个重要方面:

71、(1)本发明的技术方案转化后的预期收益和商业价值为:

72、本发明的技术方案针对恶意用户和低质量用户共存场景下的隐私保护问题,提供了一种基于同态加密技术的解决方案。将本发明的技术方案转化为具体产品后,预期收益和商业价值主要体现在以下几个方面:

73、增强通信安全性和可靠性:本发明通过恶意用户鉴别机制和用户侧模型加密策略,降低了恶意用户和低质量用户对整体联邦学习过程的干扰,提高了模型的准确性和可靠性;

74、推动相关行业的发展:本发明的技术方案在联邦学习和网络安全领域具有创新性,可广泛应用于多种联邦学习场景,如医疗卫生保健系统、网络安全系统、交通运输系统等,有助于推动相关行业的发展,吸引投资和合作机会,为企业创造更多商业价值。

75、(2)本发明的技术方案填补了国内外业内技术空白:

76、本发明的技术方案针对恶意用户和低质量用户共存场景下的隐私保护问题,提供了一种基于同态加密技术的解决方案,有效地填补了国内外业内技术空白,具体体现在以下几个方面:

77、恶意用户和低质量用户共存场景下的无线联邦学习:在无线网络中,恶意用户和低质量用户的存在对联邦学习的性能和安全性提出了挑战。通过采用同态加密的方法,结合恶意用户的鉴别和低质量用户的数据清洗,本发明填补了在该特定场景下的技术空白。

78、用户侧模型相似度作为正负向行为的衡量指标:相较于传统的衡量指标如准确率、召回率和f1分数,本发明采用用户侧模型与全局模型的余弦相似度作为用户正向行为和负向行为的衡量指标,针对全局模型训练前期准确率较低的情况,该方法可以更直观、更合理有效地评判用户侧模型的优劣程度。

79、基于概率调度的自适应用户调度策略:本发明考虑了采用用户侧模型余弦相似度作为用户正负向行为的衡量指标,设计了一种基于概率调度的自适应调度策略,以最小化恶意用户对模型性能的影响。这一策略在恶意用户和低质量用户共存场景下现有技术中尚无类似研究和应用,为无线联邦学习的用户调度提供了一种方法。

80、(3)本发明的技术方案解决了人们一直渴望解决、但始终未能获得成功的技术难题:

81、本发明的技术方案有效的攻克了长期以来在恶意用户和低质量用户共存场景下如何正确鉴别恶意用户的技术问题。这一创新性解决方案将有力地推动联邦学习隐私保护技术的进步,从而提升无线联邦学习网络的性能和安全性。具体体现在以下几个方面:

82、恶意用户和低质量用户共存场景下的无线联邦学习:安全联邦学习场景下,对于抵御恶意攻击有较高的要求。然而,在恶意用户和低质量用户共存的安全联邦学习场景下,如何正确筛选真正的恶意用户同时保证更多的良性用户参与到联邦训练一直是一个技术难题,本发明针对恶意用户和低质量用户共存场景的特点,提出了基于概率调度的自适应用户调度策略的解决方案,同时采用同态加密技术,有效地解决了这一问题。

83、基于概率调度的自适应用户调度策略:现有的以余弦相似度作为用户正负向行为衡量指标的恶意用户鉴别方案中,多数采用“一次鉴别,直接定性”的策略,这对于低质量良性用户不公平。本发明在此方面进行了尝试,提出了恶意用户和低质量用户共存场景下一种基于概率调度的自适应用户调度策略,有效解决了恶意用户错误鉴别的问题。

84、(4)本发明的技术方案克服了技术偏见:

85、本发明的技术方案成功克服了多个技术偏见,为恶意用户和低质量用户共存场景下的无线联邦学习隐私保护提供了一种创新性的解决方案,这将有助于推动联邦学习隐私保护技术的发展,增强无线联邦学习的安全性和可靠性。具体体现在以下几个方面:

86、突破传统用户正负向行为衡量指标的局限:传统的用户正负向行为衡量指标(如准确率和f1分数)在恶意用户和低质量用户场景下无法反映用户行为的连续性。本发明克服了这一技术偏见,将用户侧模型与上一轮全局模型的余弦相似性作为衡量指标,为恶意用户和低质量用户共存场景下的用户行为分析提供了更有效的解决方案。

87、针对恶意用户和低质量用户共存场景的自适应调度策略:现有技术中,缺乏针对恶意用户和低质量用户共存场景的自适应调度策略。本发明克服了这一技术偏见,根据网络中各用户侧模型的余弦相似度,动态调整各用户的调度概率值,实现了恶意用户和低质量用户共存场景下的恶意用户鉴别。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1