本发明涉及移动通信的,尤其涉及基于智能反射面的mimo全双工功率分配方法的。
背景技术:
1、3gpp(the third generation partnership project)于2021年定稿了5g nr(newradio)的r17版本,目前学术界和工业界正聚焦于r18版本,即5g nr的增强部分。同一时间6g宽带移动通信技术的需求定义、性能指标以及关键候选技术制定也在紧锣密鼓当中。按照当下业界对6g宽带移动通信所达成的共识和愿景看出,6g宽带网络提出了高达1 tb/s的峰值速率,相较5g网络的性能容量提升了1000倍。同时6g宽带网络的能耗效率也较5g网络提升了10倍,并且6g宽带网络可以为每平方公里108数量级用户提供通信连接。可见相较5g通信技术,6g宽带移动通信网络对大通量、高频谱效率、低能耗的性能指标提出了更具挑战性的技术要求。
2、全双工技术因其较传统通信技术可最大提升一倍的频谱效率被作为6g宽带移动通信网络候选技术之一。同时智能反射面因其所包含的单元件具备超原子结构,信号调谐时具有超低功耗并能实现不同离散相位状态。通过外部控制这些超原子状态,能够对信号的反射和散射场景进行有效模拟,从而可协助无线通信系统大幅提升网络覆盖和终端qos(quality of service),并较有源中继能够降低能耗。鉴于智能反射面可赋予网络实体具备可重构属性这一革命性关键技术,因此也被预期应用于6g宽带移动通信网络。可见,将智能反射面与全双工网络结合,能够获得两重性能收益,包括频谱效率提升和有用信号加强。
3、然而全双工与智能反射面结合,会额外引入基站残余自干扰和智能反射面回环干扰,这在一定程度上降低了各自带来的性能增益。已知干扰源于不预期的发射功率,直接降低发射功率就会降低干扰,但根据香农公式知,发射功率降低又会反过来造成信干噪比下降,不利于网络吞吐量提升。因此面向基于智能反射面的mimo(multiple input multipleoutput)全双工网络更加需要设计合理的功率分配方法,以此来保证全双工网络和智能反射面所带来的性能提升。
技术实现思路
1、本发明提供了一种基于智能反射面的mimo全双工功率分配方法,利用深度强化学习网络,使智能处理器学习到最优动作可联合协调智能反射面和基站子载波分配,并在此基础上调控功率资源分配,从而尽可能降低共信道干扰,使得小区内用户总的频谱效率最大。
2、一种基于智能反射面的mimo全双工功率分配方法,包括如下步骤:
3、步骤s1:建立基于智能体反射面的mimo全双工网络模型;
4、步骤s2:定义小区内用户总的频谱效率目标函数优化;
5、步骤s3:构建和初始化ddqn模型;
6、步骤s4:智能处理器与基站和智能反射面之间的动作传递;
7、步骤s5:wmmse算法输出状态;
8、步骤s6:基于深度强化学习的智能处理器参数训练;
9、步骤s7:输出最优动作、状态和奖励。
10、本发明提出的一种基于智能反射面的mimo全双工功率分配方法,适用于全双工基站和用户间的视距链路被障碍物完全阻隔的场景。本发明在障碍物附近放置一个智能反射面,智能反射面与智能处理器相连,智能处理器用于集中控制各个反射元件的相移。同时智能处理器又通过回程链路与全双工基站相连,用于控制基站所服务用户的子载波指示。
11、另外全双基站配备有多根天线,可在同一时域和频域资源上进行发送和接收。每个用户只配备有一根天线,工作于半双工模式,即只能在同一时域和频域资源上进行发送或者接收,不能同时进行。鉴于此,在同一时刻基站所服务的用户可分为上行业务用户和下行业务用户,各个上行业务用户的发送功率可由基站经空口进行闭环控制;下行业务用户的接收功率取决于基站的发送功率,基站的发送功率又通过基站的下行预编码矩阵进行调控。上下行用户功率资源分配策略由智能处理器结合反射元件相移和用户子载波分配计算获得,并将所计算得到的策略通过回程链路直接传递给基站,基站又通过闭环功控将部分调控信息转达给上行业务用户。
12、本发明技术关键点是结合相移状态、子载波分配、功率分配三个关键要素,设计合理的小区内用户总的频谱效率目标函数,并通过深度强化学习算法对数学优化问题进行工程实践。解决了现有技术中如下技术难题:
13、1. 智能处理器联合智能反射面和基站进行相移调控和上下行业务用户子载波分配。
14、2. 智能处理器对上下行用户功率资源进行合理分配。
15、3. 设计有效的深度强化学习算法,使智能处理器能够根据不同传输环境学习到最佳动作,从而可应用于信道条件多变的无线传输环境。
16、本发明采用上述技术方法,与现有技术相比具有如下优点:
17、通过理论证明,本发明基于智能反射面的mimo全双工功率分配方法,根据小区内上下行用户信干噪比的相关影响因子,设计出有效的小区内用户总的频谱效率目标函数。通过智能处理器与基站和智能反射面之间的动作传递,以及智能处理器的状态获取,来构建基于深度强化学习的通信网络模型。通过对神经网络模型的训练,使智能处理器能够选取出最佳动作,从而在最大可能抑制基站残余自干扰和智能反射面回环干扰的基础之上,可充分发挥全双工和智能反射面技术的各自性能优势,以此来保证小区内用户总的频谱效率最大化。本发明可作为6g宽带移动通信的关键模块,部署于无线传输环境多变、视距链路受阻的无线通信场景之中。
1.一种基于智能反射面的mimo全双工功率分配方法,其特征在于包括如下步骤:
2.根据权利要求1所述的基于智能反射面的mimo全双工功率分配方法,其特征在于上述步骤s1中建立基于智能体反射面的mimo全双工网络模型,具体过程为:
3.根据权利要求2所述的基于智能反射面的mimo全双工功率分配方法,其特征在于上述步骤s2中定义小区内用户总的频谱效率目标函数优化,具体过程为:
4.根据权利要求3所述的基于智能反射面的mimo全双工功率分配方法,其特征在于上述步骤s3中构建和初始化ddqn模型,具体过程为:
5.根据权利要求4所述的基于智能反射面的mimo全双工功率分配方法,其特征在于上述步骤s4中智能处理器与基站和智能反射面之间的动作传递,具体过程为:
6.根据权利要求5所述的基于智能反射面的mimo全双工功率分配方法,其特征在于上述步骤s5中wmmse算法输出状态,具体过程为:
7.根据权利要求6所述的基于智能反射面的mimo全双工功率分配方法,其特征在于上述步骤s6中基于深度强化学习的智能处理器参数训练,具体过程为