一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法

文档序号：36427135发布日期：2023-12-20 22:38阅读：来源：国知局

技术特征：

1.一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法，其特征在于，包括：

2.根据权利要求1所述的一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法，其特征在于，所述步骤一包括：

3.根据权利要求2所述的一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法，其特征在于，所述用户k和接入点q之间的直射路径信道增益为：

4.根据权利要求3所述的一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法，其特征在于，所述第一次反射路径的信道增益为：

5.根据权利要求1所述的一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法，其特征在于，所述步骤二引入聚类有效性函数e，并确定最优聚类数kopt：

6.根据权利要求1所述的一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法，其特征在于，所述步骤三包括：

7.根据权利要求1所述的一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法，其特征在于，所述(1)中，如果一个用户关于多个接入点具有相同的信道增益，这个用户被随机分配其中一个接入点；如果一个接入点面临qk和qf的关联请求冲突，则再次搜索信道增益矩阵h找到次优先的接入点q′k和q′f，如果高于则接入点与用户k关联；其中以及分别代表信道矩阵h中第k行第qk列、第f行第q′f列、第k行第q′k列以及第f行第qf列的元素。

8.根据权利要求1所述的一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法，其特征在于，步骤四所述在削波失真和功率约束下表述确定调制模式分配与功率分配策略，实现总吞吐量最大化的优化问题，具体包括：

9.根据权利要求1所述的一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法，其特征在于，步骤五所述将优化问题对应于强化学习问题，具体包括：

10.根据权利要求1所述的一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法，其特征在于，所述步骤五采用q学习算法求解强化学习问题，不断训练q表格直到q表格收敛，并利用训练好的q表格，选取最优分配策略，使系统吞吐量最大化；

技术总结
本发明公开了一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法，包括：计算用户终端与接入点之间的信道增益；利用K均值聚类算法对用户分簇；将接入点与用户关联，构建以用户为中心的小区；在削波失真和功率约束下表述确定调制模式分配与功率分配策略，实现总吞吐量最大化的优化问题；将所述优化问题对应于强化学习问题，利用Q学习算法求解强化学习问题，得到分配策略。本发明可达到的吞吐量和中断概率都比传统的以网络为中心的无线光通信系统优越。

技术研发人员：冯斯梦,李念,赵一迪
受保护的技术使用者：南京航空航天大学
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

当前第2页1 2