一种基于NOMA的机器通信随机接入方法

文档序号:32255029发布日期:2022-11-19 06:51阅读:125来源:国知局
一种基于NOMA的机器通信随机接入方法
一种基于noma的机器通信随机接入方法
技术领域
1.本发明涉及通信技术领域,尤其涉及一种基于noma的机器通信随机接入方法。


背景技术:

[0002]“万物互联”已成为通信行业的重要发展方向,未来大部分终端设备都将连接网络,逐渐聚合为规模庞大、高度智能的全球物联网;在下一代的移动通信中,越来越多的机器设备将拥有接入网络的能力,实现mtc(machine-type communication,机器通信),即在无人的干预下进行机器与机器(machine to machine,m2m)之间的通信,这使得m2m通信面临一系列的挑战(如造成频繁的传输冲突、导致传输时延增加、甚至网络过载、削弱mtc设备的能量储备等),因此如何高效解决机器通信之间传输效率将成为未来实现mtc快速发展关键之一。
[0003]
目前,现有的机器通信随机接入方法主要通过智能时隙选择策略实现,例如:中国专利号cn109618309a公开了一种基于时隙复用的机器通信随机接入方法,该发明虽然通过将频域资源和时域资源进行了合理的划分降低了能量地消耗,但其无法在在提高能量效率的同时,有效改善过载时系统的吞吐量。
[0004]
因此,亟需发明一种基于noma的机器通信随机接入方法以解决上述问题。


技术实现要素:

[0005]
本发明的目的是为了解决现有技术中存在的缺陷,而提出的一种基于noma的机器通信随机接入方法。
[0006]
为了实现上述目的,本发明采用了如下技术方案:
[0007]
一种基于noma的机器通信随机接入方法,包括如下步骤:
[0008]
步骤1:将每个mtc设备作为一个智能体,并根据其构建一张q表,通过q学习算法选择一个传输策略(t,p)进行一次数据传输;
[0009]
步骤2:在每次传输时,针对所述mtc设备选择最大q值对应的时隙,若存在有多个最大值对应时隙,则随机选择一个对应的时隙;
[0010]
步骤3:依据发射功率和传输结果设计奖励函数,同时根据卫星广播的全局信息改进q学习的学习策略,并将学习速率设计为与迭代次数相关的函数形式,使得一帧中的每个时隙尽量只分配给单一用户;
[0011]
步骤4:获取q值特性并结合负载估计设计一种acb新机制,以解决系统过载问题。
[0012]
进一步地,所述方法还包括采集noma中的sic技术获取低发射功率pl和高发射功率ph,其具体过程如下:
[0013]
使用sic技术先将较低发射功率的所述mtc设备信号作为噪声,解调出信号功率较高的mtc设备信号;
[0014]
然后从当前时隙消除较高功率信号的干扰,解调信号功率较低的mtc设备信号。
[0015]
进一步地,所述改进q学习的奖励函数如下:
[0016][0017]
式中:p
max
和p
min
分别为最高和最低发射功率,p
t
为mtc设备选择的发射功率。
[0018]
进一步地,所述改进q学习的学习速率的公式如下:
[0019][0020]
式中:r
mit
为初始学习速率;δr为衰减因子;β表示最小学习率;t0为mtc设备首次尝试接入的时间,t为迭代轮次,t-t0表示迭代次数。
[0021]
进一步地,所述一种acb新机制的过载控制过程如下:
[0022]
在mtc设备发送数据时,初始化学习次数的阈值n,若mtc设备经过n次学习后满足最大q值小于零,且在q表中出现的次数大于2的条件,则该mtc设备在随后的接入过程将受到限制,否则该mtc设备属于接入允许类。
[0023]
相比于现有技术,本发明的有益效果在于:
[0024]
本技术提出的一种基于noma的机器通信随机接入方法,其主要从能量效率和过载控制两方面进行考虑,通过依据发射功率和传输结果设计奖励函数,同时根据全局信息改进q学习的学习策略,并将学习速率设计为与迭代次数相关的函数形式,使得一帧中的每个时隙尽量只分配给单一用户,从而允许mtc设备尽量以低功率发送数据,实现能效优化;此外通过观察和研究设备在学习过程中的q值特性,结合负载估计,在优化能效的基础上,又加入了一种acb过载控制机制,进而有利于能够在提高能量效率的同时,有效改善过载时系统的吞吐量。
附图说明
[0025]
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
[0026]
图1为本发明提出的一种基于noma的机器通信随机接入方法的整体流程图。
具体实施方式
[0027]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
[0028]
在本发明的描述中,需要理解的是,术语“上”、“下”、“前”、“后”、“左”、“右”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以
特定的方位构造和操作,因此不能理解为对本发明的限制。
[0029]
在一个实施例中,参照图1,本实施例公开了一种基于noma的机器通信随机接入方法,包括如下步骤:
[0030]
步骤1:将每个mtc设备作为一个智能体,并根据其构建一张q表,通过q学习算法选择一个传输策略(t,p)进行一次数据传输;
[0031]
在一个实施例中,所述方法还包括采集noma中的sic技术获取低发射功率pl和高发射功率ph,其具体过程如下:
[0032]
使用sic技术先将较低发射功率的所述mtc设备信号作为噪声,解调出信号功率较高的mtc设备信号;
[0033]
然后从当前时隙消除较高功率信号的干扰,解调信号功率较低的mtc设备信号。
[0034]
步骤2:在每次传输时,针对所述mtc设备选择最大q值对应的时隙,若存在有多个最大值对应时隙,则随机选择一个对应的时隙;
[0035]
步骤3:依据发射功率和传输结果设计奖励函数,同时根据卫星广播的全局信息改进q学习的学习策略,并将学习速率设计为与迭代次数相关的函数形式,使得一帧中的每个时隙尽量只分配给单一用户;
[0036]
具体的,所述改进q学习的奖励函数如下:
[0037][0038]
式中:p
max
和p
min
分别为最高和最低发射功率,p
t
为mtc设备选择的发射功率。
[0039]
具体的,所述改进q学习的学习速率的公式如下:
[0040][0041]
式中:r
mit
为初始学习速率;δr为衰减因子;β表示最小学习率;t0为mtc设备首次尝试接入的时间,t为迭代轮次,t-t0表示迭代次数;
[0042]
在这需要说明一点是:本发明的改进q学习能充分发掘和利用的全局信息,使mt设备在这些信息的协助下,更加“智能”地学习到最优策略,进而有利于在保证传输成功率的前提下,降低传输功耗。
[0043]
步骤4:获取q值特性并结合负载估计设计一种acb新机制,以解决系统过载问题;
[0044]
具体的,所述一种acb新机制的过载控制过程如下:
[0045]
在mtc设备发送数据时,初始化学习次数的阈值n,若mtc设备经过n次学习后满足最大q值小于零,且在q表中出现的次数大于2的条件,则该mtc设备在随后的接入过程将受到限制,否则该mtc设备属于接入允许类;
[0046]
在这需要说明一点的是:当海量mtc设备同时接入网络时,会造成系统过载,此时的吞吐量会迅速下降,因此需要加入过载控制机制来改善其性能,传统过载控制主要基于acb机制,然而传统acb机制无法在在提高能量效率的同时,有效改善过载时系统的吞吐量,因此本发明基于这点提出了一种acb新机制以解决上述问题。
[0047]
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1