技术特征:
技术总结
本发明实施例提供的Massive MIMO的优化方法、装置、设备及介质,根据专家经验模式对状态信息矩阵的特征进行识别和判断,确定优化策略,在线强化学习生成多个马克可夫决策过程MDP训练序列,并将MDP训练序列存入每个波束扇区的处理缓存中;根据异步优势加权的行动者‑评论家Actor‑Critic深度增强学习网络并行计算MDP训练序列,并将学习到的最优的优化策略函数和状态值函数的权值信息,通过全局共享模式进行更新和复制;根据行动者‑评论家深度增强学习网络学习到的优化策略,确定Massive MIMO系统最优的天线权值和无线参数配置组合,实现优化调整与现网性能评估的在线实时交互,实时采用最优的天线权值和无线参数配置组合,实现网络性能最佳。
技术研发人员:乔勇
受保护的技术使用者:中国移动通信集团江苏有限公司;中国移动通信集团有限公司
技术研发日:2018.09.10
技术公布日:2019.02.22