认知无线电系统中基于卷积神经网络的频谱预测方法与流程

文档序号:16671238发布日期:2019-01-18 23:35阅读:188来源:国知局
认知无线电系统中基于卷积神经网络的频谱预测方法与流程

本发明涉及信息与通信领域,具体涉及认知无线电系统中频谱感知后的一种空闲信道智能分配算法。



背景技术:

近些年来,无线通信技术飞速发展的同时,用户业务类型和业务需求也在不断地爆炸式增长,这就导致了用户对无线电频谱资源的需求日益增加。然而,目前已授权频谱在时间域、空间域、频率域、能量域的平均占用率都很低,频谱资源利用率普遍不高。频谱资源紧张与频谱资源浪费的矛盾愈发突出。认知无线电技术(cognitiveradio,cr)能够智能地寻找当前频带中的空闲频谱接入,从而有效地提高频谱资源的利用率,受到了广泛的关注并已有诸多相关研究成果。

其中频谱感知是cr系统中的重要基础,其主要功能是,一个处于地理空间中某一位置的次用户(secondaryuser,su)在某一时刻对某一授权频段进行检测,寻找其中各个子频段中是否存在主用户(primaryuser,pu)。频谱感知有两个关键点,其一是当判断出授权频段内不存在pu时接入;其二是当检测到授权频段内已有pu或有pu准备接入,要立刻退让。

一般来说,对于su,一个授权频段是可以被划分为多个可用信道来接入的,通常情况下su频谱感知的最终结果即是这描述些可用信道中是否存在pu,并且从目前pu对于授权频段的占用率来看,这些信道中多数是不存在pu的(空闲)。在cr系统中,最普遍被使用的工作流程是:su首先进行频谱感知,感知出当前频段内的多个空闲信道,之后随机选择一个信道接入传输,当检测到当前信道有pu重新接入时立即停止传输,再重新感知其它空闲信道重传数据包。

但是,这种机制伴随着一个问题:如果当前频段中pu数量较多频繁接入退出信道或存在大功率动态恶意干扰时su有极大可能需要频繁地避让pu,重新频谱感知,重新接入,重传数据包。这就无疑会增加su的资源消耗,降低su的传输速率。另外,一旦对pu重新接入信号发生漏检,还会与pu发生碰撞,干扰到pu通信。

对于上述问题,频谱预测技术是一个较好的解决方案。频谱预测技术的核心思想是su对历史频谱感知结果进行存储和分析,通过一定算法预测出未来一段时间某一信道中被pu占用的可能性,从而通过预测结果更合理的选择信道接入或提前切换信道来避免数据包传输残缺,避免和pu碰撞。可以预见地,如果su能以较高准确率预测出未来一段时间内信道被占用请款并合理的选择信道接入,可以实现降低su通信过程中的碰撞概率(碰撞率),从而缩短su感知用时,减少su资源消耗,提高频谱资源利用率从而实现提升通信系统整体性能。

现今,已有一些频谱预测的相关研究。比较成熟有效的频谱预测方法有3种,分别是基于马尔科夫链的频谱预测,基于回归分析的频谱预测,基于神经网络的频谱预测。勃兰登堡理工大学信息学研究所的tabassam等人使用一阶马尔可夫模型基于当前pu对授权信道的占用情况来预测下一时刻的信道占用信息,预测准确率很低。田纳西科技大学库克维尔电气与计算机工程系制造研究中心的chen等人利用实测wi-fi数据对隐马尔可夫模型进行了仿真,验证了其性能要优于基于一阶马尔可夫模型的频谱预测技术。南佛罗里达大学电气工程系的gorcin等人对自回归频谱预测方法进行了理论推导,并利用自回归方法进行了频谱建模和预测,仿真结果表明,除了时间和频率信息,当加入地理位置信息时,可以进一步提高频谱预测的准确率。基于神经网络的频谱预测方法表现出了优于上述方法的性能并在近些年受到了广泛的研究。目前绝大多数有关神经网络应用于频谱预测的研究使用的神经网络模型大都是bp神经网络或改进的bp神经网络。新加坡南洋理工大学计算机工程学院的tumuluru等人采用了bp神经网络进行了频谱预测的研究,在其仿真实验中bp神经网络表现出了较好的性能。中国科学院软件研究所综合信息系统实验室的bai针对bp神经网络的收敛速度缓慢和其结构具有不确定性等问题提出基于遗传算法和动量算法的改进方案。在其仿真实验中,这种改进的bp神经网络的预测精度总是高于bp神经网络,采用阈值间隔的方法可以进一步提高性能。

但是,现有频谱预测办法存在诸多问题,比如基于马尔科夫链的频谱预测和基于回归分析的频谱预测预测准确率较低,在某些情况下碰撞率甚至要高于随机选择空闲信道接入方法的碰撞率。而基于bp神经网络的频谱预测方法虽然预测准确率高于前两者,但需要训练使用一个全连接的神经网络,训练阶段误差反向传播耗时和预测阶段数据前向传播耗时都很长,且训练容易陷入局部最优,另外为获得较好泛化性还需要较多的训练样本。并且,上述方法参数一旦确定下来不易更改,当频谱环境发生变化或者频段内存在动态恶意干扰时预测准确率会下降,严重时方法可能会失效。



技术实现要素:

针对上述不足,本发明提供一种卷积神经网络经过较短时间的训练即可获得较高预测准确度及实时地更新网络参数以适应环境的动态变化的认知无线电系统中基于卷积神经网络的频谱预测方法。

本发明的认知无线电系统中基于卷积神经网络的频谱预测方法,所述方法包括:

步骤1、以周期t对频带f进行不间断地频谱感知,从t0时刻起记录多个频谱感知的信道环境状态矩阵和它们对应的信道空闲时长矢量将t0+kt记为tk,k=0,1,…;

表示tk时刻频带f所有信道占用情况,表示从tk+t时刻起各信道的空闲的感知周期数;

步骤2、将记录的多个频谱感知结果矩阵和对应的喂入卷积神经网络中,对卷积神经网络进行训练,在训练中,用于制作标签;

步骤3、利用训练完成的卷积神经网络不断地根据各个时刻的信道环境状态矩阵预测出未来空闲概率最大的信道c。

优选的是,所述步骤2中,在卷积神经网络训练过程中,在预测一个感知周期后,在卷积神经网络不断地进行空闲概率最大的信道预测的同时,计算选择所述最优信道接入时的碰撞率,将最优信道接入时的碰撞率与随机选择信道接入时的碰撞率进行比较;当最优信道接入时的碰撞率低于随机选择信道接入时的碰撞率时,改用卷积神经网络作为接入信道选择策略。

优选的是,所述步骤3还包括,在利用卷积神经网络预测时,根据不断获得的信道环境状态矩阵来训练修正卷积神经网络内的参数。

优选的是,所述步骤3还包括:若预测结果中可用频带的宽度超过设定值,将下一段时间的所需感知的频带替换为预测结果中部分大概率空闲频段。

优选实施例中,所述步骤2包括:

步骤2.1、将单个信道环境状态矩阵s输入到未训练的卷积神经网络,进行前向传播,卷积神经网络最终输出o,o用于表征未来一段时间内各信道空闲概率的相对大小;

步骤2.2:使用每个s对应的i制作标签label,标签为一个1×n的矢量且其中的所有元素和为1,标签制作公式:

其中,n=1,2,…,n,label_n是标签矢量中第n个元素的值,表示t时刻第n个信道内存在主用户,否则不存在;当时,label_n=0;n个信道的s所对应的标签l=[label_1,label_2,…,label_n];

在获得每个信道环境状态矩阵s和其对应的标签l后,将s输入卷积神经网络得到输出o,利用l和所述输出o进行比对,获得误差,利用误差选定学习率后使用梯度下降法完成对卷积神经网络内参数的训练。

优选的是,所述步骤2.1包括:

将单个信道环境状态矩阵s输入到未训练的卷积神经网络的卷积层:

conv_output=w*s+b

其中,conv_output是单个信道环境状态矩阵s和卷积核w做卷积后,与对应的偏置项b求和后的矩阵;

之后,将conv_output输入池化层做池化处理:

pool_output=max(s′)or(∑s′)/(p×p)

其中,矩阵s′是由conv_output矩阵划分成的数个不重叠的,大小为p×p的矩阵,再取s′中元素的最大值或平均值,按其原来在conv_output中的相对位置排列成pool_output,称为最大值池化矩阵或平均值池化矩阵;

再之后,将pool_output中的每个元素代入激活函数:

其中x表示一个pool_output矩阵中的某个元素,act_output表示将这个元素带入激活函数后的输出;

将激活函数后的输出按其原来在pool_output矩阵中的位置排列,得到激活函数的输出矩阵activation_output;

而后,将activation_output矩阵输入全连接层,输出为fc_output;

最后,将fc_output输入softmax层进行分类,获得卷积神经网络的最终输出output,output中某一的元素output_n:

o=[output_1,output_2,…,output_n],fc_output_j表示fc_output中某一的元素;

softmax层有将所有输出标准化的作用,使其和为1,且softmax层的输出具有表征未来一段时间内该信道空闲概率的作用。

优选的是,所述步骤2中,对卷积神经网络内参数训练时,学习率为learning_rate,若当前误差不变,则学习率不变,若当前误差增加为迭代前的α倍,α>1,则将学习率调整为λ1×learning_rate,λ1<1,否则,将学习率调整为λ2×learning_rate,λ2>1。

本发明的有益效果,当利用本发明的方法进行频谱预测时,卷积神经网络经过较短时间的训练即可获得较高预测准确度,可以很快投入正式使用。并能实时地更新卷积神经网络中的网络参数以适应环境的动态变化。本发明通过训练一个卷积神经网络(cnn)来实现上述目标。基本流程是,在获得一段时间的频谱感知结果后,利用频谱感知结果训练一个经过设计的神经网络。在完成训练后,将当前的频谱感知结果输入已被训练好的cnn,根据cnn的输出来选择空闲信道接入。仿真实验结果表明,在不同的用户密度下,使用基于cnn的频谱预测技术作为信道选择策略时,拥有比现有主流算法更低的碰撞率,更快的训练速度,并拥有绝大多数现有频谱预测方法所不具备的动态环境适应能力。证实了本发明方法的有效性、高效性和普适性。

附图说明

图1为本发明方法的原理示意图;

图2(a)至图2(d)为不同pu密度λ下本发明与bp神经网络作为信道选择的预测方法、随机选择作为信道选择策略碰撞率对比曲线图;

图3(a)至图3(d)为在不同pu密度λ下本发明与bp神经网络作为信道选择策略,随机选择作为信道选择策略碰撞率降低率对比曲线图;

图4为本发明在对抗恶意动态干扰时的躲避效果图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。

下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。

本实施方式建立系统数学模型。假设在一片地理区域内,有多个pu使用频段f=[f1,f2]进行通信。同时,有一定数量的su欲使用相同的频段f进行通信。这些su不具备频谱感知能力,全部频谱感知任务交由区域内的一个具备认知能力的数据融合中心a集中完成。数据融合中心a以周期t不断地对频段f进行频谱感知,并依据su的通信带宽需求将f分为n个信道分别记为c1,c2,…,cn。在t时刻,数据融合中心a通过一定办法(如:能量检测)对当前频段f进行频谱感知,之后依据一定判决规则判决出信道cn,(n=1,2,…,n)内是否存在pu。若在t时刻,cn内不存在pu,即信道cn可用,记为否则记为并把在t时刻所有信道占用情况定义为t时刻的信道环境状态矢量显然,这个1×n的矢量中的元素只有0或1。把t-(m-1)t时刻至t时刻所有的环境状态矢量依序排列在一起定义为信道环境状态矩阵st:

显然,st是一个m×n的矩阵,其中元素也只有0或1。另外,定义一个1×n的信道空闲时长矢量其中表示信道cn,(n=1,2,…,n)从t+t时刻起空闲的感知周期数(注:若即,若t时刻信道cn内存在pu,则)。定义其值等于在t时刻后,空闲时长最长的信道编号。定义其值等于在t时刻后,空闲时长第二长的信道编号。依此类推。用数学模型表示算法目的是,若将当前时刻记为tc。我们的问题是如何在已知的情况下,预测出并利用这些预测结果合理分配资源,从而尽可能的减少su与pu的碰撞,同时避免资源浪费,最终达到提升系统整体性能的目的。本实施方式使用基于cnn的频谱预测技术可以完成这个任务步骤。

本实施方式的认知无线电系统中基于卷积神经网络的频谱预测方法,所述方法包括:

步骤1、数据融合中心a以周期t对频带f进行不间断地频谱感知,从t0时刻起记录多个频谱感知的信道环境状态矩阵和它们对应的信道空闲时长矢量将t0+kt记为tk,k=0,1,…;

表示tk时刻频带f所有信道占用情况,表示从tk+t时刻起各信道的空闲的感知周期数;

步骤2、加载设计好的未经训练的cnn,其中包括各个卷积层的卷积核和偏置,池化层,激活函数,全连接层,输出层。其中卷积层和全连接层内的参数均是按一定经验预置的随机实数;将记录的多个频谱感知结果矩阵和对应的喂入卷积神经网络中,对卷积神经网络进行训练,在训练中,用于制作标签;

步骤3、利用训练完成的卷积神经网络不断地根据各个时刻的信道环境状态矩阵预测出未来空闲概率最大的信道c。

本实施方式首先通过一段时间的频谱感知获得一段时间内频带内各个信道被占用状态。然后据此获得多个时刻的历史信道环境状态矩阵-未来信道空闲状态矢量对。而后使用多个信道环境状态矩阵作为数据,以及它们对应的未来信道空闲状态矢量作为标签训练cnn。最后获得训练好的cnn后,将当前时刻的信道环境状态矩阵输入训练好的cnn,即可输出有关未来信道空闲状态的预测。通过仿真,验证了本方法的有效性。证实了本方法具有其他频谱预测方法不具备的一些功能以及一定程度上的性能提升。本实施方式的方法应用场景为认知无线电系统内,可用于预测未来信道空闲状态,从而指导资源分配和下一阶段频谱感知。

优选实施例中,本实施方式的步骤2中,在卷积神经网络训练过程中,在预测一个感知周期后,在卷积神经网络不断地进行空闲概率最大的信道预测的同时,计算选择所述最优信道接入时的碰撞率,将最优信道接入时的碰撞率与随机选择信道接入时的碰撞率进行比较;当最优信道接入时的碰撞率低于随机选择信道接入时的碰撞率时,改用卷积神经网络作为接入信道选择策略。

在训练的早期阶段通常碰撞率是要高于随机选择信道接入时的碰撞率的。此时可以选择随机选择作为信道选择策略。当侦测到较长一段时间基于cnn的频谱预测技术作为信道选择策略碰撞率低于随机选择信道接入时的碰撞率后再使用基于cnn的频谱预测技术作为信道选择策略。

优选实施例中,本实施方式的步骤3还包括,在利用卷积神经网络预测时,根据不断获得的信道环境状态矩阵来训练修正卷积神经网络内的参数。一方面可以继续降低碰撞率:另一方面,当环境发生变化或环境内存在恶意干扰时继续训练可以使系统根据环境实时调整参数以获得动态环境适应能力,保证系统的稳定性。

由于是使用带有数据融合中心的信道分配方法,在预测过程中可以按预测出来的未来一段时间的信道空闲概率将信道排序。当有多个不同性质的su申请接入时可以按用户重要等级、业务重要程度或业务耗时合理安排信道资源分配。

除了分配信道躲避干扰,信道预测的结果还可以用于指导下一步的频谱感知,优选实施例中,本实施方式的步骤3还包括:若预测结果中可用频带的宽度超过设定值,将下一段时间的所需感知频带替换为预测结果中部分大概率空闲频段。

当可用频带较宽的时候,宽带频谱感知的耗时是影响系统整体性能的重要因素。可以利用频谱预测预测未来空闲概率较大的频段,将下一段时间的全频带频谱感知替换为部分大概率空闲频段频谱感知,以达到缩短频谱感知环节的耗时的目的,从而提升系统整体性能,降低系统内资源消耗。

优选实施例中,本实施方式的步骤2包括:

步骤2.1、前向传播:

首先,将单个信道环境状态矩阵s输入到未训练的卷积神经网络的卷积层:

conv_output=w*s+b

其中,conv_output是单个信道环境状态矩阵s和卷积核w做卷积后,与对应的偏置项b求和后的矩阵;

之后,将conv_output输入池化层做池化处理:

pool_output=max(s′)or(∑s′)/(p×p)

其中,矩阵s′是由conv_output矩阵划分成的数个不重叠的,大小为p×p的矩阵,再取s′中元素的最大值或平均值,按其原来在conv_output中的相对位置排列成pool_output,称为最大值池化矩阵或平均值池化矩阵;池化层可以起到降采样的作用,从而减小计算量,减轻过拟合,增强神经网络的泛化性;

再之后,将pool_output中的每个元素代入激活函数:

其中x表示一个pool_output矩阵中的某个元素,act_output表示将这个元素带入激活函数后的输出;

将激活函数后的输出按其原来在pool_output矩阵中的位置排列,得到激活函数的输出矩阵activation_output;激活函数的意义在于将非线性因素引入整个神经网络模型中,比起最原始的感知机只能逼近线性模型,cnn能更好地描述实际问题中最常见的非线性模型。

而后,将activation_output矩阵输入全连接层,其公式和卷积层相同,也是输入数据和各个权值的乘累加在补充上偏置,全连接层输出fc_output,它是一个1×n的矢量;

最后,将fc_output输入softmax层进行分类,获得卷积神经网络的最终输出output,output中某一的元素output_n:

n=1,2,…,n,o=[output_1,output_2,…,output_n],fc_output_j表示fc_output中某一的元素;

softmax层有将所有输出标准化的作用,使其和为1,方便和标签对比求误差。且softmax层的输出具有表征未来一段时间内该信道空闲概率的作用;

在预测时,将当前时刻所有空闲信道对应的信道编号记为集合idle_t,找出最大的output_n,(n∈idle_t),此时n即为cnn预测出在未来空闲概率最大的信道c。

步骤2.2、反向传播:

首先,使用每个s对应的i制作标签label,与cnn中所使用的0-1序列型的标签不同。应用于频谱预测的标签应附带每个信道未来空闲时长的信息。根据设计的cnnsoftmax输出层的特性,标签应为一个1×n的矢量且其中的所有元素和为1。将i归一化可以使用线性归一化方法或非线性归一化方法。在实际训练中发现线性归一化方法训练效果很差。若直接使用softmax函数将i归一化后,在i中存在某个信道空闲时长较长时,其所对应的标签近似为0-1序列。故使用下述标签制作公式:

其中,label_n是标签矢量中第k个元素的值,当时,label_n=0;s所对应的标签l=[label_1,label_2,…,label_n];实际应用时可根据空闲时长的差距调整取对数时对数的底;

在获得每个信道环境状态矩阵s和其对应的标签l后,将s输入卷积神经网络得到输出o,利用l和所述输出o进行比对,获得误差,利用误差选定学习率后使用梯度下降法完成对卷积神经网络内参数的训练。

关于cnn的训练,若在实际使用过程中发现神经网络训练耗时很慢或误差陷入震荡,前者极大可能是由于学习率设置的较小,后者极大可能是由于学习率设置的过大。此时可使用自适应学习率设置方法。优选实施例中,步骤2中,对卷积神经网络内参数训练时,学习率为learning_rate,若当前误差不变,则学习率不变,若当前误差增加为迭代前的α倍,α>1,则将学习率调整为λ1×learning_rate,λ1<1,否则,将学习率调整为λ2×learning_rate,λ2>1。其中,参数α,λ1,λ2可根据实际情况自行设置。

图2(a)-(d)和图3(a)-(d)为不同pu用户密度λ情况下,本发明基于cnn的频谱预测信道选择策略和基于bp神经网络的频谱预测信道选择策略,相比于随机选择空闲信道的信道选择策略的碰撞率和碰撞率降低率百分比。考虑到现有频谱预测方法中以基于bp神经网络的频谱预测方法最为成熟效果最好,故选择其与本发明方法进行对比。仿真参数设置为:9个可用信道,根据200个感知周期的感知结果对未来各个信道空闲概率进行预测。pu出现的位置是基于排队模型设计的,最终每次生成的信道状态矩阵中可以保证每一时刻9个信道中存在pu的信道数是服从参数为λ的泊松分布的随机变量。其中基于cnn的频谱预测信道选择策略的碰撞率是从训练过程中开始统计的,而基于bp神经网络的频谱预测信道选择策略的碰撞率是在完成对bp神经网络的训练后进行测试统计的。其中碰撞率的计算公式为:

其中jamming_rate(method)为应用某方法预测(或不预测)时的碰撞率,train_step为cnn训练次数,jamming_times(train_step)为cnn训练次数为train_step时的相应方法的碰撞次数。碰撞率降低率的公式为:

其中δjamming_rate(method)为方法method的碰撞率降低率,jamming_rate_0为不预测时的碰撞率。用与不预测时的碰撞率比较作为性能评估办法。显然,基于bp神经网络的方法性能评估标准要比本专利方法宽松。并且bp神经网络的训练数据量、训练用时和单次预测用时都要远大于基于cnn的方法。即便如此,从100次蒙特卡洛实验的仿真结果来看,在λ=1,2,3,4的条件下本专利方法的碰撞率降低率都要大于基于bp神经网络的频谱预测方法数倍甚至数十倍。

横向对比不同pu密度时,pu密度越大,各种预测方法的碰撞率降低率都有下降。而本专利方法的碰撞率降低率仍能维持在一个相对较高水平。而基于bp神经网络方法的碰撞率降低率在pu密度较大时已经几乎为0,和随机选择信道接入的碰撞率相差较小,算法已基本失去意义。可见,本专利方法在进行频谱预测时预测准确率较高且pu密度越大时本专利方法相对于传统算法优势越大。

图4为本发明在扫频干扰下的干扰躲避效果测试图。仿真条件设置为大功率干扰(图中白色部分为信道被干扰,黑色部分为信道空闲)每个感知周期可以干扰4个信道,每两个感知周期所覆盖信道向固定方向变化一次,14个感知周期可以遍历频带内所有信道一次。用户需要使用9个感知周期的时间传输一个数据包,需要合理预测选择信道以保证传输一个完整数据包期间不被干扰。仿真结果表明基于本专利方法,经过短暂的训练后,可以保证在所设置的仿真条件下达到几乎100%的干扰躲避率。

本发明具有以下特点和显著进步:

(1)更短的训练时长就可以达到远低于现有主流算法的碰撞率。

(2)可以实时训练,从而具有较好的动态环境适应能力,并在此能力的支撑下获得现有主流算法所不具备的应对pu密度变化和躲避恶意动态干扰的能力。

虽然在本文中参照了特定的实施方式来描述本发明,但是应该理解的是,这些实施例仅仅是本发明的原理和应用的示例。因此应该理解的是,可以对示例性的实施例进行许多修改,并且可以设计出其他的布置,只要不偏离所附权利要求所限定的本发明的精神和范围。应该理解的是,可以通过不同于原始权利要求所描述的方式来结合不同的从属权利要求和本文中所述的特征。还可以理解的是,结合单独实施例所描述的特征可以使用在其他所述实施例中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1