一种基于卫星和地面站的半异步联邦学习方法及系统

文档序号：37932887发布日期：2024-05-11 00:11阅读：7来源：国知局

本发明涉及卫星通信，尤其涉及一种基于卫星和地面站的半异步联邦学习方法及系统。

背景技术：

1、近年来卫星技术的进步降低了卫星部署成本，促进了leo(low earth orbit，近地轨道)卫星的大规模发展。卫星互联网已经才能够为空天地网络一体化的重要组成部分。卫星互联网广泛应用于军事、航天、通信、气象等领域，为遥感数据传输、应急通信和全球覆盖提供了关键支持。传统的基于卫星数据的智能服务，通常需要将存储在不同卫星上的数据下载到地面站以训练模型。然而，随着leo卫星数据的增加，将卫星收集的大量原始数据集中处理是不可行的，特别是在leo卫星星座的网络资源有限、卫星与地面站连接高度间歇性等环境约束下。

2、联邦学习是一种分布式机器学习方法。它允许多个数据来源端(例如：卫星)协同学习一个共享的机器学习模型，在训练过程中只需将训练后的模型参数上传到中心化的服务器进行聚合，而无需共享本地私有数据，实现“数据可用而不可见”，提升模型的训练效果。一些学者将同步联邦学习应用于卫星星座。在同步联邦学习方法中，地面站必须等待所有卫星提供局部模型更新之后才进行模型聚合。为了提高灵活性和可拓展性，在同步联邦学习的基础上，地面站一旦从某个卫星接收到本地模型更新，就立即执行模型聚合并将聚合后的全局模型发送给各个卫星。

3、然而，将联邦学习应用于leo卫星网络环境面临许多挑战。首先，卫星与地面站之间的间歇性连接可能导致在同步联邦学习中出现较长的等待时间，这会降低模型的收敛速度。其次，异步联邦学习虽可以降低等待时间，但可能会遇到模型陈旧问题，因为存在部分节点上的模型由于多轮未参与聚合与当前全局模型的偏差大。这种模型陈旧性会影响最终模型性能。

技术实现思路

1、本发明提供一种基于卫星和地面站的半异步联邦学习方法及系统，用以解决由于卫星和地面站之间有限的通信带宽和间歇性连接导致的模型收敛速度慢问题，以及现有的联邦学习中模型陈旧问题。本发明基于延迟感知的模型分发机制实现高效的模型分发，基于自适应半异步聚合算法缩短模型聚合的等待时间，加快模型收敛速度且能缓解子集模型陈旧问题，在提高模型精度的同时显著降低了收敛延迟。

2、本发明提供一种基于卫星和地面站的半异步联邦学习方法，包括：根据地面站待更新的全局模型，基于延迟感知的模型分发机制，优化调度所述卫星和所述地面站之间的分发路径，基于所述分发路径将卫星星座的每个轨道内的多个局部模型聚合到一个局部全局模型中，以确定多个局部全局模型；所述卫星星座包括多个轨道；每个所述轨道内包括多个所述卫星；每个所述卫星对应一个所述局部模型；所述局部模型是所述卫星根据所述全局模型本地训练更新所得的模型；每个所述轨道对应一个所述局部全局模型；基于自适应半异步聚合算法确定多个所述局部全局模型的子集模型，以根据所述子集模型更新所述全局模型；所述子集模型中陈旧模型的数量小于预设数量，所述陈旧模型为模型陈旧值大于预设陈旧值的模型；重复迭代执行所述延迟感知的模型分发机制的步骤和所述自适应半异步聚合算法的步骤，直至所述全局模型收敛。

3、根据本发明提供的一种基于卫星和地面站的半异步联邦学习方法，所述确定多个局部全局模型，包括：基于延迟感知的模型分发机制，优化调度所述卫星和所述地面站之间的分发路径，确定每个所述轨道内的源节点卫星和汇聚节点卫星；所述源节点卫星用于接收所述待更新的全局模型，并将所述待更新的全局模型传递至除所述源节点之外的同轨道的所有卫星；所述汇聚节点卫星用于聚合自本轨道的所有卫星的多个局部模型；基于所述分发路径，根据多个所述局部模型、每个轨道的训练数据集和每个轨道内的每个卫星的训练数据集，确定一个所述局部全局模型；多个所述轨道对应多个所述局部全局模型。

4、根据本发明提供的一种基于卫星和地面站的半异步联邦学习方法，所述确定每个所述轨道内的源节点卫星，包括：在所述轨道内没有卫星与所述地面站可见的情况下，将距离下一个可见窗口时间最短的卫星作为所述源节点卫星；在所述轨道内仅有一个卫星与所述地面站可见的情况下，将仅有的所述卫星作为所述源节点卫星；在所述轨道内有多个卫星与所述地面站可见的情况下，将满足预设源节点选择条件的卫星作为所述源节点卫星；所述预设源节点选择条件为剩余可见窗口时间不小于模型上行链路的传输延迟且所述上行链路的传输延迟与星间链路的传输延迟之和最小。

5、根据本发明提供的一种基于卫星和地面站的半异步联邦学习方法，所述确定每个所述轨道内的汇聚节点卫星，包括：根据模型本地训练的计算延迟检查所述轨道的所有卫星与所述地面站的可见性；在所述轨道内没有卫星与所述地面站可见的情况下，将距离下一个可见窗口时间最短的卫星作为所述汇聚节点卫星；在所述轨道内仅有一个卫星与所述地面站可见的情况下，将仅有的所述卫星作为所述汇聚节点卫星；在所述轨道内有多个卫星与所述地面站可见的情况下，将满足预设汇聚节点选择条件的卫星作为所述汇聚节点卫星；所述预设汇聚节点选择条件为剩余可见窗口时间不小于模型下行链路的传输延迟且所述下行链路的传输延迟与星间链路的传输延迟之和最小。

6、根据本发明提供的一种基于卫星和地面站的半异步联邦学习方法，所述基于自适应半异步聚合算法确定多个所述局部全局模型的子集模型，包括：采用渐进式稀疏模型聚合策略调整多个所述局部全局模型的聚合轨道比例，得到待调节模型；采用延迟补偿策略对所述待调节模型进行延迟补偿，得到所述子集模型；所述延迟补偿用于降低所述待调节模型在全局模型更新时的权重。

7、根据本发明提供的一种基于卫星和地面站的半异步联邦学习方法，所述采用渐进式稀疏模型聚合策略调整多个所述局部全局模型的聚合轨道比例，得到待调节模型，包括：确定所述待更新的全局模型的效用值；根据所述待更新的全局模型的效用值确定当前模型聚合轮次的多个所述局部全局模型的聚合轨道参与率；根据所述聚合轨道参与率，确定聚合轨道和与所述聚合轨道对应的待调节模型。

8、根据本发明提供的一种基于卫星和地面站的半异步联邦学习方法，所述采用延迟补偿策略对所述待调节模型进行延迟补偿，得到所述子集模型，包括：确定所述待调节模型的模型陈旧值；在所述待调节模型的模型陈旧值大于所述预设陈旧值的情况下，通过预设衰减系数对所述待调节模型进行延迟补偿，得到延迟补偿后的模型；根据所述延迟补偿后的模型确定所述子集模型。

9、本发明还提供一种基于卫星和地面站的半异步联邦学习系统，包括：分发模块，用于根据地面站待更新的全局模型，基于延迟感知的模型分发机制，优化调度所述卫星和所述地面站之间的分发路径，基于所述分发路径将卫星星座的每个轨道内的多个局部模型聚合到一个局部全局模型中，以确定多个局部全局模型；所述卫星星座包括多个轨道；每个所述轨道内包括多个所述卫星；每个所述卫星对应一个所述局部模型；所述局部模型是所述卫星根据所述全局模型本地训练更新所得的模型；每个所述轨道对应一个所述局部全局模型；聚合模块，用于基于自适应半异步聚合算法确定多个所述局部全局模型的子集模型，以根据所述子集模型更新所述全局模型；所述子集模型中陈旧模型的数量小于预设数量，所述陈旧模型为模型陈旧值大于预设陈旧值的模型；迭代模块，用于重复迭代执行所述延迟感知的模型分发机制的步骤和所述自适应半异步聚合算法的步骤，直至所述全局模型收敛。

10、本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述基于卫星和地面站的半异步联邦学习方法。

11、本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述基于卫星和地面站的半异步联邦学习方法。

12、本发明提供的一种基于卫星和地面站的半异步联邦学习方法及系统，该方法根据地面站待更新的全局模型，基于延迟感知的模型分发机制，优化调度卫星和地面站之间的分发路径，基于分发路径将卫星星座的每个轨道内的多个局部模型聚合到一个局部全局模型中，以确定多个局部全局模型，从而实现高效的模型分发；基于自适应半异步聚合算法确定多个局部全局模型的子集模型，缩短模型聚合的等待时间，加快模型收敛速度且能缓解子集模型陈旧问题，以根据子集模型更新全局模型；重复迭代执行延迟感知的模型分发机制的步骤和自适应半异步聚合算法的步骤，直至全局模型收敛，在提高模型精度的同时显著降低了收敛延迟。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘君,赵洁洁,李贺武,陈艳
技术所有人：清华大学
我是此专利的发明人

上一篇：一种风险管理用应急装置的制作方法
上一篇：一种香兰素自动化检测装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。