一种具有环境适应能力的智能频谱感知方法与流程

文档序号:29081931发布日期:2022-03-02 00:17阅读:307来源:国知局
一种具有环境适应能力的智能频谱感知方法与流程

1.本发明涉及一种无线通信技术,特别是涉及基于数据驱动的频谱感知方法。


背景技术:

2.无线通信技术的快速发展,使得高速率和高质量的无线数据业务需求与趋于饱和的频谱资源之间的矛盾日益突出。然而,现有很多无线系统的频谱资源却在时间和空间上存在不同程度的闲置。频谱感知可以使无线通信设备具备高效的电磁环境感知能力,能动态协调各无线通信设备,为其接入未被利用的空闲频谱资源,从而增加设备和服务接入量以及提高频谱利用率提供一个可行的解决方案。频谱感知的两个关键指标是时效性和准确性,为了保证动态频谱接入的正常工作,必须保证能够快速而准确的得到整个通信系统的感知结果。所以频谱感知性能的好坏是频谱资源能否实现高效利用的前提和必要条件。传统的频谱感知方法有能量检测算法、匹配滤波器检测算法、循环平稳特征检测算法等,这些传统算法主要基于门限来判别,门限计算的不准确是检测性能下降的主要原因。
3.随着物联网、大数据、云计算和智能算法的深度融合,人工智能作为最具颠覆性和变革性的基础技术,展现出极为广阔的发展空间,正赋能科技创新、经济生产和社会生活各个方面。人工智能中的机器学习方法在分类任务中,不但可实现非线性的分类界,同时也能方便地融合具有不同分布或属性的特征进行分类判别,这为频谱感知提供了一种创新的解决思路。在运行参数与电磁环境之间的关系未知的情况下,具备自主学习能力的机器学习方式可从数据中发掘数据与频谱占用状态的映射关系,解决先验信息缺乏背景下的频谱感知问题。它通过数据集来构建统计模型,经过对目标函数进行不断迭代优化,最终训练出与实际系统相匹配的模型,再根据此模型进行频谱状态预测分析,可有效提升特定环境的感知性能。
4.但是机器学习方法线下学习线上工作的工作模式有一个局限性。数据的域特性反应数据的分布特性,数据的域不同,则数据的分布不同。机器学习方法要求线上测试时和线下学习的输入数据要服从同一分布(域),或者线上测试数据的分布属于线下学习训练数据的分布中的一种,否则模型性能将会下降。对于机器学习方法在频谱感知中的应用来说,不同通信环境下数据的分布不同,这要求线上测试时数据所在通信环境是线下训练数据集所采集的通信环境中的一种,否则,模型的感知能力便会大幅下降,然而实际应用的通信环境往往是复杂且多变的,如果在实际应用中对模型进行重训练,对于神经网络来说又需要大量的带标签数据训练模型,很难实施。因此,这一问题严重影响了机器学习方法在频谱感知中的广泛应用。如何在复杂噪声环境下将智能频谱感知有效泛化到未知环境,是智能频谱感知的一个关键要素。


技术实现要素:

5.本发明针对智能频谱感知的环境适应性需求,利用生成对抗网络的对抗学习能力,提供一种具有环境适应能力的智能频谱感知技术,促进智能频谱感知技术的应用落地。
6.本发明采用的技术方案为:
7.一种具有环境适应能力的智能频谱感知方法,包括以下过程:
8.在训练阶段,利用神经网络,从训练数据样本集中,学习同环境解耦合的频谱状态特征;
9.在测试阶段,将测试数据输入训练好的神经网络,获取频谱感知分类结果。
10.进一步的,所述同环境解耦合的频谱状态特征,指频谱状态的特征不随环境变化而变化。
11.进一步的,所述神经网络,利用生成对抗网络的思想,通过对抗学习来提取同环境解耦合的特征。
12.进一步的,所述神经网络,至少包括特征提取器e、频谱状态分类器c和域鉴别器d。
13.进一步的,特征提取器e用于从输入数据中提取携带频谱状态信息的数据特征,频谱状态分类器c用于对数据特征进行频谱状态分类,判断频谱状态是占用或空闲,域鉴别器d用于对数据特征进行域类别鉴别,判断数据特征来自的域。
14.进一步的,输入数据是接收信号原始数据或是经过预处理后的数据。
15.进一步的,特征提取器e由多层卷积层组成;频谱状态分类器c由多个全连接层组成;域鉴别器d由多个全连接层组成。
16.进一步的,频谱状态类别用独热编码来表示;域类别用独热编码来表示。
17.进一步的,特征提取器与域鉴别器是对抗学习的关系;对抗学习的最终目标是使得特征提取器所提取的特征不包含域相关的信息,致使域鉴别器无法判断特征提取器所提取特征的域类别,实现特征提取器所提取的特征同环境解耦。
18.进一步的,神经网络训练时,通过联合最小化e-c的损失函数以及最大化e-d的损失函数更新特征提取器e的参数θe,通过最小化e-c的损失函数更新频谱状态分类器c的参数θc,通过最大化e-d的损失函数更新域鉴别器d的参数θd。
19.进一步的,损失函数基于交叉熵来求得。
20.进一步的,联合最小化e-c的损失函数以及最大化e-d的损失函数,是指通过在特征提取器e和域鉴别器d之间引入梯度反向层,利用控制梯度反向层的超参数来联合优化更新特征提取器的参数。
21.进一步的,训练数据样本集由输入数据、频谱状态标签和环境标签组成,表示为:{ψ,z,t}={(s1,z1,t1),...,(sk,zk,tk)},式中,ψ=(s1,...,sk)表示k个输入数据集合,z=(z1,...,zk),zk∈{0,1}表示频谱状态标签集合,t=(t1,...,tk)表示环境标签集合;
22.进一步的,联合最小化e-c的损失函数以及最大化e-d的损失函数作为神经网络整个模型的损失函数,表达式如下:
23.j(θe,θc,θd)=j(θe,θc)-λj(θe,θd)
24.式中,λ为引入的超参数,λ>0;j(θe,θc)为特征提取器e-频谱状态分类器c的损失函数,j(θe,θd)为特征提取器e-域鉴别器d的损失函数。
25.进一步的,通过构建优化目标函数,来更新特征提取器e、频谱状态分类器c和域鉴别器d的参数;
26.构建的优化目标函数,如下:
[0027][0028]
式中,和分别对应为特征提取器e、频谱状态分类器c和域鉴别器d的优化参数;
[0029]
通过不断迭代优化目标函数,得到特征提取器e、频谱状态分类器c和域鉴别器d的最优参数。
[0030]
本发明相比现有技术的有益效果为:
[0031]
本发明在先验信息缺乏背景下,能够利用有限的已知域的训练样本集,通过线下一次性学习,学习与环境无关的频谱状态特征,进而完成在线自适应、敏捷的频谱感知,实现具有环境适应性的频谱感知能力,有效提升智能频谱感知方法的泛化能力。
附图说明
[0032]
图1为本发明实施例基于对抗学习的频谱感知神经网络模型图。
具体实施方式
[0033]
下面结合附图和具体实施例对本发明作进一步解释说明。
[0034]
实施例:考虑单用户多天线的模型,不同的环境(域)通过考虑不同的信噪比(snr)场景来表现,实施例中神经网络输入数据为预处理后的数据,这里使用接收信号的协方差矩阵。针对多个snr场景下的通信数据,利用本发明方法所提出的基于对抗学习的频谱感知神经网络,实现能适应未知snr场景的智能频谱感知,具体实现方式如下:
[0035]
1、训练数据集
[0036]
收集多个snr下的接收信号和其对应的频谱状态的标签,计算接收信号的采样协方差矩阵作为训练样本。
[0037]
假设所采集的训练数据的snr场景数为v,用参数t表示训练样本对应的snr标签,z表示训练样本对应的频谱状态标签,那么整个训练数据集可以表示为:
[0038][0039]
其中,k表示训练样本数量,表示k个采样协方差矩阵,z=(z1,...,zk),zk∈{0,1}表示频谱状态标签集合,t=(t1,...,tk)表示snr标签集合,tk可用snr值的下标来表示。
[0040]
2、线下训练
[0041]
将训练数据集输入到本发明方法所提出的神经网络,对该神经网络进行线下训练。神经网络如图1所示,包括特征提取器e、频谱状态分类器c和域鉴别器d。e、c和d的模型参数分别用θe、θc和θd表示。
[0042]
特征提取器e,从训练数据样本集中提取数据特征f,该数据特征f携带频谱状态信息;频谱状态分类器c对特征提取器e的输出f进行频谱状态分类,判断频谱状态是处于占用状态(h1)还是空闲状态(h0);域鉴别器d对特征提取器e的输出f进行域类别鉴别,判断f是来自哪一个域。
[0043]
特征提取器e与域鉴别器d是对抗学习的关系。对抗学习的最终目标是使得特征提取器e的输出f不包含域相关的信息,致使d无法判断f的域类别,实现特征提取器e所提取的特征f同环境解耦,从而解除特征f跟环境的关联性。
[0044]
在线下训练阶段,一方面通过最小化e-c的损失函数来确保使用e所提取的特征f可以正确预测频谱状态;另一方面又通过e和d之间的对抗学习来降低特征f对snr的依赖性。具体地,通过联合最小化e-c的损失函数以及最大化e-d的损失函数来更新特征提取器e的参数θe,通过最小化e-c的损失函数去更新频谱状态分类器c的参数θc,通过最小化e-d的损失函数来更新域鉴别器d的参数θd。优化目标函数如下:
[0045][0046][0047]
式中,和分别对应为特征提取器e、频谱状态分类器c和域鉴别器d的优化参数;通过不断迭代优化目标函数,得到特征提取器e、频谱状态分类器c和域鉴别器d的最优参数。
[0048]
j(θe,θc,θd)表示整个模型的损失函数,其表达式如下:
[0049]
j(θe,θc,θd)=j(θe,θc)-λj(θe,θd),
[0050]
式中,j(θe,θc)表示网络e-c的损失函数,j(θe,θd)表示网络e-d的损失函数,参数λ>0是在e和d之间引入梯度反向层的一个超参数,用于平衡两个优化目标,在前向传播时梯度反向层不做任何操作,直接将输入传递到下一层,反向传播时,梯度反向层对传播来的梯度乘上因子-λ,再把它传递到下一层。
[0051]
损失函数由交叉熵来定义,假设tk被编码为独热向量δk=[δ1,δ2,...,δv],网络d的输出用向量来表示,网络e-c和网络e-d的损失函数分别如下:
[0052][0053][0054]
式中,θe、θc和θd分别对应为特征提取器e、频谱状态分类器c和域鉴别器d的参数;表示第k个采样协方差矩阵,表示在频谱处于占用状态h1情况下,输入数据经过网络e-c后对频谱状态的预测输出,表示在频谱处于空闲状态h0情况下,输入数据经过网络e-c后对频谱状态的预测输出,zk表示第k个训练样本(这里即:协方差矩阵)对应的频谱状态标签,表示第i个snr场景下第k个训练样本的snr标签,表示域鉴别器d对第i个snr场景下第k个训练样本的预测输出。
[0055]
梯度反向层的超参数取值为一个随训练过程逐渐变化的自适应因子,具体如下:
[0056][0057]
式中,α是一个随训练进度从0逐渐变化到1的变量。
[0058]
3、在线感知
[0059]
在线检测时,将训练好的网络e-c用来预测频谱状态。检测时首先计算测试数据的采样协方差矩阵,然后输入训练好的模型,获取频谱状态分类器c的分类结果,完成在线实时频谱感知。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1