1.一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法,其特征在于,包括:
2.根据权利要求1所述的一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法,其特征在于,所述步骤一包括:
3.根据权利要求2所述的一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法,其特征在于,所述用户k和接入点q之间的直射路径信道增益为:
4.根据权利要求3所述的一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法,其特征在于,所述第一次反射路径的信道增益为:
5.根据权利要求1所述的一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法,其特征在于,所述步骤二引入聚类有效性函数e,并确定最优聚类数kopt:
6.根据权利要求1所述的一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法,其特征在于,所述步骤三包括:
7.根据权利要求1所述的一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法,其特征在于,所述(1)中,如果一个用户关于多个接入点具有相同的信道增益,这个用户被随机分配其中一个接入点;如果一个接入点面临qk和qf的关联请求冲突,则再次搜索信道增益矩阵h找到次优先的接入点q′k和q′f,如果高于则接入点与用户k关联;其中以及分别代表信道矩阵h中第k行第qk列、第f行第q′f列、第k行第q′k列以及第f行第qf列的元素。
8.根据权利要求1所述的一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法,其特征在于,步骤四所述在削波失真和功率约束下表述确定调制模式分配与功率分配策略,实现总吞吐量最大化的优化问题,具体包括:
9.根据权利要求1所述的一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法,其特征在于,步骤五所述将优化问题对应于强化学习问题,具体包括:
10.根据权利要求1所述的一种以用户为中心的无线光通信网络中基于强化学习的资源分配方法,其特征在于,所述步骤五采用q学习算法求解强化学习问题,不断训练q表格直到q表格收敛,并利用训练好的q表格,选取最优分配策略,使系统吞吐量最大化;