一种基于可解释性联邦学习缓解Non-IID影响的方法

文档序号：34088074发布日期：2023-05-07 01:50阅读：283来源：国知局

本发明属于人工智能安全领域，特别涉及了一种基于可解释性的联邦学习方法来缓解在non-iid场景中模型性能下降带来的影响。

背景技术：

1、研究表明，随着人工智能技术的不断进步，数据的好坏，数据量的大小，已经成为制约ai模型发展的一个重要因素。但是传统的集中式机器学习，直接收集各方的数据，会导致严重的隐私安全问题。因此，联邦学习的出现，解决了这一关键问题，它可以保持用户数据分散的同时协作训练出共享的全局机器学习模型。但随着联邦学习应用的增多，其面向的场景也越来越复杂，在现实生活中，由于每个客户端都有自己的偏好，所以不同客户端的数据具有不同的特征，这会导致联邦学习模型精度降低，收敛速度变慢等问题。传统的解决联邦学习中non-iid问题一般是从两个方面入手，一个是对参与聚合的客户端进行权重差异优化，另一个是对于客户端的选择进行优化。但是针对客户端的权重差异进行优化，大多会导致模型的收敛速度下降；针对客户端的选择优化，会增加过多的通信开销与计算开销。

2、随着各种人工智能模型开始代替人类进行决策，支持模型的输出解释是至关重要的。可解释性研究的初衷是通过构建可解释的模型或设计解释方法提高模型的透明性，同时验证和评估模型决策行为和决策结果的可靠性和安全性，消除模型在实际部署应用中的安全隐患。因此本发明利用可解释性，以一种更合理和可解释性的方式去解决联邦学习场景下non-iid所带来模型精度下降的问题，使基于此所提出来的解决方案更具有现实意义和应用价值。

技术实现思路

1、为了解决上述背景技术提到的技术问题，本发明提供了基于可解释性的联邦学习方法，该方法可以有效缓解由non-iid场景引起的联邦学习模型精度下降问题。

2、为了实现上述技术目的，本发明的技术方案为：

3、一种基于可解释性联邦学习缓解non-iid影响的方法，基于本地客户端更新对于聚合模型各类别学习能力的影响，引入验证集可解释机制。通过去刻画验证样本的可解释性结果，也就是去刻画出本地客户端对于全局模型学习能力的影响，再借此判断出模型各类别学习能力的变化情况。利用结构相似指标(ssim)对各类别的代表可解释性结果进行评估，从而推断出数据不均衡的客户端。再对这些数据不均衡的客户端的参数进行调整，利用迭代将客户端参数与上一次更新的聚合模型参数距离缩小，从而达到减弱数据不均衡所带来的负面影响。

4、进一步地，包括以下步骤：

5、(1)构建non-iid场景：针对目标数据集，利用狄利克雷分布，给每个客户端分配不同数量，不同标签的数据，构建出一个non-iid场景；

6、(2)构建验证集：中心服务器中，每个类别放置一张图片作为验证集；

7、(3)选择客户端进行可解释性：根据客户端本地更新方向上一轮聚合的更新方向的余弦相似度进行评分，选取评分较低的top-k个客户端参与可解释性；或者根据客户端的代表梯度对客户端进行聚类，从聚类后的c类中选取m个客户端参与可解释性；

8、(4)筛选数据不均衡的客户端：通过比较参与聚合的每个客户端模型和上一轮聚合的全局模型，对同一验证集进行可解释后的高亮特征图的差别，进行相似度计算，各类相似度变化幅度超过设定的阈值，则被认为该客户端数据不均衡；

9、(5)动态调整客户端模型参数：最小化不均衡客户端模型和上一轮全局聚合模型参数之间的梯度距离，通过梯度距离的收敛纠正客户端模型的参数，并且根据联邦学习聚合的时间灵活的调整最小化梯度的迭代次数。

10、采用上述技术方案带来的有益效果：(1)这是基于可解释性的方法，缓解联邦学习过程中由non-iid引起的模型性能下降问题，可以很明确的知道在聚合过程中由于哪些客户端引起性能下降，有助于帮助我们更好的选择客户端进行聚合(2)该方法有效的提升了联邦学习模型在non-iid场景下模型的性能，在更加严格的数据不平衡情况下，相较于其它方法依旧有很好的提升(3)不会过多的增加联邦学习的通信开销与计算开销。

技术特征：

1.一种基于可解释性联邦学习缓解non-iid影响的方法，其特征在于：基于本地客户端更新对于聚合模型各类别学习能力的影响，引入验证集可解释机制去刻画中心服务器中验证集样本的可解释性结果，利用结构相似指标对各类别的可解释性结果进行评估，从而推断出数据不均衡的客户端；再对这些数据不均衡的客户端的参数进行调整，最小化不均衡客户端模型和上一轮全局聚合模型参数之间的梯度距离，通过梯度距离的收敛纠正客户端模型的参数；从而达到减弱数据不均衡所带来的负面影响。

2.根据权利要求1所述基于可解释性联邦学习缓解non-iid影响的方法，其特征在于，包括以下步骤：

3.根据权利要求2所述基于可解释性联邦学习缓解non-iid影响的方法，其特征在于，步骤(1)具体包括：

4.根据权利要求2基于可解释性联邦学习缓解non-iid影响的方法，其特征在于，步骤(3)中按照评分选择客户端进行可解释性，包括：将客户端本地更新方向与上一轮聚合的更新方向计算出的余弦相似度作为评分，计算公式如下：

5.根据权利要求2基于可解释性联邦学习缓解non-iid影响的方法，其特征在于，步骤(3)中按照代表梯度选择客户端进行可解释性，包括：将客户的本地模型与全局模型的差异作为“代表性梯度”；首先计算每个客户的“代表性梯度”，“代表性梯度”计算如：gradrep＝pi-p0，其中pi与p0分别是第i个客户端本地更新参数和上一次全局更新的参数；再根据“代表性梯度”，通过层次聚类将客户端聚成c个类；从这c个类中依次抽取出参与聚合的m个客户端，再进行后续的可解释性操作。

6.根据权利要求5所述基于可解释性联邦学习缓解non-iid影响的方法，其特征在于，按照代表梯度选择客户端进行可解释性中的层次聚类，包括：

7.根据权利要求2基于可解释性联邦学习缓解non-iid影响的方法，其特征在于，筛选数据不均衡的客户端，包括：将中心服务器上部署的验证集分别输入到上一轮聚合模型与本次进行可解释性操作的客户端模型，再根据模型的分类结果进行可解释性，得到高亮特征图；对两个模型的高亮特征图进行一一对应的相似度计算，相似度计算公式如下：

8.根据权利要求2基于可解释性联邦学习缓解non-iid影响的方法，其特征在于，动态调整客户端模型参数，包括：将表现不均衡的验证集输入不均衡客户端模型，分别计算出每个不均衡的客户端模型和上一轮全局聚合模型之间的梯度距离，梯度距离计算公式如下：

技术总结
本发明公开了一种基于可解释性联邦学习缓解Non‑IID影响的方法。本发明主要基于本地客户端更新对于聚合模型各类别学习能力的影响，引入验证集可解释机制去刻画中心服务器中验证集样本的可解释性结果，利用结构相似指标(SSIM)对各类别的可解释性结果进行评估，从而推断出数据不均衡的客户端。再对这些数据不均衡的客户端的参数进行调整，最小化不均衡客户端模型和上一轮全局聚合模型参数之间的梯度距离，通过梯度距离的收敛纠正不均衡客户端模型的参数。从而达到减弱数据不均衡所带来的负面影响。

技术研发人员：周文杰,李丕绩,刘哲
受保护的技术使用者：南京航空航天大学
技术研发日：
技术公布日：2024/1/12

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周文杰李丕绩刘哲
技术所有人：南京航空航天大学
我是此专利的发明人

上一篇：一种畜牧消毒装置的制作方法
上一篇：一种用于处理屋面钢性层伸缩缝的装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。