一种基于智能反射面的MIMO全双工功率分配方法与流程

文档序号：34538373发布日期：2023-06-27 14:10阅读：65来源：国知局

本发明涉及移动通信的，尤其涉及基于智能反射面的mimo全双工功率分配方法的。

背景技术：

1、3gpp（the third generation partnership project）于2021年定稿了5g nr（newradio）的r17版本，目前学术界和工业界正聚焦于r18版本，即5g nr的增强部分。同一时间6g宽带移动通信技术的需求定义、性能指标以及关键候选技术制定也在紧锣密鼓当中。按照当下业界对6g宽带移动通信所达成的共识和愿景看出，6g宽带网络提出了高达1 tb/s的峰值速率，相较5g网络的性能容量提升了1000倍。同时6g宽带网络的能耗效率也较5g网络提升了10倍，并且6g宽带网络可以为每平方公里108数量级用户提供通信连接。可见相较5g通信技术，6g宽带移动通信网络对大通量、高频谱效率、低能耗的性能指标提出了更具挑战性的技术要求。

2、全双工技术因其较传统通信技术可最大提升一倍的频谱效率被作为6g宽带移动通信网络候选技术之一。同时智能反射面因其所包含的单元件具备超原子结构，信号调谐时具有超低功耗并能实现不同离散相位状态。通过外部控制这些超原子状态，能够对信号的反射和散射场景进行有效模拟，从而可协助无线通信系统大幅提升网络覆盖和终端qos（quality of service），并较有源中继能够降低能耗。鉴于智能反射面可赋予网络实体具备可重构属性这一革命性关键技术，因此也被预期应用于6g宽带移动通信网络。可见，将智能反射面与全双工网络结合，能够获得两重性能收益，包括频谱效率提升和有用信号加强。

3、然而全双工与智能反射面结合，会额外引入基站残余自干扰和智能反射面回环干扰，这在一定程度上降低了各自带来的性能增益。已知干扰源于不预期的发射功率，直接降低发射功率就会降低干扰，但根据香农公式知，发射功率降低又会反过来造成信干噪比下降，不利于网络吞吐量提升。因此面向基于智能反射面的mimo（multiple input multipleoutput）全双工网络更加需要设计合理的功率分配方法，以此来保证全双工网络和智能反射面所带来的性能提升。

技术实现思路

1、本发明提供了一种基于智能反射面的mimo全双工功率分配方法，利用深度强化学习网络，使智能处理器学习到最优动作可联合协调智能反射面和基站子载波分配，并在此基础上调控功率资源分配，从而尽可能降低共信道干扰，使得小区内用户总的频谱效率最大。

2、一种基于智能反射面的mimo全双工功率分配方法，包括如下步骤：

3、步骤s1：建立基于智能体反射面的mimo全双工网络模型；

4、步骤s2：定义小区内用户总的频谱效率目标函数优化；

5、步骤s3：构建和初始化ddqn模型；

6、步骤s4：智能处理器与基站和智能反射面之间的动作传递；

7、步骤s5：wmmse算法输出状态；

8、步骤s6：基于深度强化学习的智能处理器参数训练；

9、步骤s7：输出最优动作、状态和奖励。

10、本发明提出的一种基于智能反射面的mimo全双工功率分配方法，适用于全双工基站和用户间的视距链路被障碍物完全阻隔的场景。本发明在障碍物附近放置一个智能反射面，智能反射面与智能处理器相连，智能处理器用于集中控制各个反射元件的相移。同时智能处理器又通过回程链路与全双工基站相连，用于控制基站所服务用户的子载波指示。

11、另外全双基站配备有多根天线，可在同一时域和频域资源上进行发送和接收。每个用户只配备有一根天线，工作于半双工模式，即只能在同一时域和频域资源上进行发送或者接收，不能同时进行。鉴于此，在同一时刻基站所服务的用户可分为上行业务用户和下行业务用户，各个上行业务用户的发送功率可由基站经空口进行闭环控制；下行业务用户的接收功率取决于基站的发送功率，基站的发送功率又通过基站的下行预编码矩阵进行调控。上下行用户功率资源分配策略由智能处理器结合反射元件相移和用户子载波分配计算获得，并将所计算得到的策略通过回程链路直接传递给基站，基站又通过闭环功控将部分调控信息转达给上行业务用户。

12、本发明技术关键点是结合相移状态、子载波分配、功率分配三个关键要素，设计合理的小区内用户总的频谱效率目标函数，并通过深度强化学习算法对数学优化问题进行工程实践。解决了现有技术中如下技术难题：

13、1. 智能处理器联合智能反射面和基站进行相移调控和上下行业务用户子载波分配。

14、2. 智能处理器对上下行用户功率资源进行合理分配。

15、3. 设计有效的深度强化学习算法，使智能处理器能够根据不同传输环境学习到最佳动作，从而可应用于信道条件多变的无线传输环境。

16、本发明采用上述技术方法，与现有技术相比具有如下优点：

17、通过理论证明，本发明基于智能反射面的mimo全双工功率分配方法，根据小区内上下行用户信干噪比的相关影响因子，设计出有效的小区内用户总的频谱效率目标函数。通过智能处理器与基站和智能反射面之间的动作传递，以及智能处理器的状态获取，来构建基于深度强化学习的通信网络模型。通过对神经网络模型的训练，使智能处理器能够选取出最佳动作，从而在最大可能抑制基站残余自干扰和智能反射面回环干扰的基础之上，可充分发挥全双工和智能反射面技术的各自性能优势，以此来保证小区内用户总的频谱效率最大化。本发明可作为6g宽带移动通信的关键模块，部署于无线传输环境多变、视距链路受阻的无线通信场景之中。

技术特征：

1.一种基于智能反射面的mimo全双工功率分配方法，其特征在于包括如下步骤：

2.根据权利要求1所述的基于智能反射面的mimo全双工功率分配方法，其特征在于上述步骤s1中建立基于智能体反射面的mimo全双工网络模型，具体过程为：

3.根据权利要求2所述的基于智能反射面的mimo全双工功率分配方法，其特征在于上述步骤s2中定义小区内用户总的频谱效率目标函数优化，具体过程为：

4.根据权利要求3所述的基于智能反射面的mimo全双工功率分配方法，其特征在于上述步骤s3中构建和初始化ddqn模型，具体过程为：

5.根据权利要求4所述的基于智能反射面的mimo全双工功率分配方法，其特征在于上述步骤s4中智能处理器与基站和智能反射面之间的动作传递，具体过程为：

6.根据权利要求5所述的基于智能反射面的mimo全双工功率分配方法，其特征在于上述步骤s5中wmmse算法输出状态，具体过程为：

7.根据权利要求6所述的基于智能反射面的mimo全双工功率分配方法，其特征在于上述步骤s6中基于深度强化学习的智能处理器参数训练，具体过程为

技术总结
一种基于智能反射面的MIMO全双工功率分配方法，建立基于智能体反射面的MIMO全双工网络模型；定义小区内用户总的频谱效率目标函数优化；构建和初始化DDQN模型；智能处理器与基站和智能反射面之间的动作传递；WMMSE算法输出状态；基于深度强化学习的智能处理器参数训练；输出最优动作、状态和奖励。利用深度强化学习网络，使智能处理器学习到最优动作可联合协调智能反射面和基站子载波分配，并在此基础上调控功率资源分配，从而尽可能降低共信道干扰，使得小区内用户总的频谱效率最大。

技术研发人员：潘坤贝,周斌
受保护的技术使用者：江苏集萃移动通信技术研究所有限公司
技术研发日：
技术公布日：2024/1/13

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：潘坤贝周斌
技术所有人：江苏集萃移动通信技术研究所有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。