一种基于深度学习和数据导频辅助的信道估计方法

文档序号:25444478发布日期:2021-06-15 09:12阅读:481来源:国知局
一种基于深度学习和数据导频辅助的信道估计方法

本发明属于无线通信技术领域,具体涉及一种基于深度学习和数据导频辅助的信道估计方法。



背景技术:

近几年来,正交频分复用(orthogonalfrequencydivisionmultiplexing,ofdm)技术,因其能通过频分复用实现高速串行数据的并行传输,而被广泛应用于通信系统设计。然而,在较为复杂的传播环境下,无线信道不仅因为多径和多普勒效应导致频率选择性衰落和时间选择性衰落,而且也可能是非平稳的无线衰落信道,这使得传统的信道估计方法在ofdm系统的有限导频放置下无法得到令人满意的性能。因此,针对双选择性非平稳无线信道为ofdm系统设计一种高效的信道估计方法已成为当务之急。

为了解决导频数量不足的问题,数据导频辅助(datapilot-aided,dpa)方法被广泛采用。dpa方法的主要思想在于,利用解映射过程的纠正能力,对数据符号进行校准,并将校准后的数据符号看作导频重新估计当前信道。然而,如果将该时刻通过dpa方法得到的信道估计值直接用于下一时刻的信号解调,信道噪声以及信道时变性产生的误差会在迭代过程中不断传播,严重影响传输的可靠性。因此,需要设计算法对dpa方法得到的信道值进行补偿,例如文献[a.bourdoux,channeltrackingforfasttime-varyingchannelsinieee802.11psystems,ieeeglobecom,2011]中提到的平滑算法、文献[j.a.fernandez,performanceofthe802.11pphysicallayerinvehicle-to-vehicleenvironments,ieeetransactionsonvehiculartechnology,vol.61,no.1,pp.3-14,2012]中提到的频域时域平均(spectraltemporalaveraging,sta)算法以及文献[z.zhao,channelestimationschemesforieee802.11pstandard,ieeeintelligenttransportationsystemsmagazine,vol.5,no.4,pp.38-49,2013]中提到的结构数据导频(constructeddatapilot,cdp)算法,这些算法会在dpa过程后,用提出的平滑、sta或cdp的方法对得到的信道估计值进行处理,并将处理后的信道值再应用于下一时刻的信号解调,然而这些算法虽然计算复杂度比较低,但是性能提升有限。

深度学习技术因其能从大量数据中提取内在特征的优势被广泛应用于设计不同的无线通信系统。公开号为cn109450830a的中国专利公开了一种可应用于高速移动场景的基于深度学习的信道估计方法,该方法不使用dpa方法而是利用卷积神经网络和循环神经网络构建信道估计网络学习信道时频特征。此外,文献[s.han,adeeplearningbasedchannelestimationschemeforieee802.11psystems,proc.ieeeicc,2019]在dpa方法的基础上应用自编码器(autoencoder,ae)网络学习信道频率相关特性以实现信道频率响应的重建以及噪声的消除,相对于传统的sta和cdp方案有明显的性能提升。文献[a.k.gizzini,deeplearningbasedchannelestimationschemesforieee802.11pstandard,ieeeaccess,vol.8,pp.113751-113765,2020]中提出了一种结合sta算法和深度神经网络(deepneuralnetwork,dnn)的方案,名为sta-dnn,该方案利用dnn改善sta方案的输出信道值,且相比于ae方案,计算复杂度有所减少。

然而,基于ae的方案并未考虑到信道时变性的影响,而sta-dnn方案却受到sta输出准确性的影响。因此,设计一种能同时追踪信道时变性并消除噪声影响的神经网络,并以此提升基于数据导频辅助的信道估计方案的性能,对解决信道估计问题至关重要。



技术实现要素:

鉴于上述,本发明提供了一种基于深度学习和数据导频辅助的信道估计方法,利用dpa方法将解映射过程中纠正后的数据符号作为导频估计当前信道值,同时利用离线训练好的lstm-mlp网络追踪时变信道并消除噪声,补偿由dpa过程带来的误差,为信号解调提供可靠的信道估计。

一种基于深度学习和数据导频辅助的信道估计方法,包括如下步骤:

(1)建立ofdm系统下的传输模型;

(2)构建lstm-mlp网络模型;

(3)对lstm-mlp网络模型进行训练;

(4)利用训练好的lstm-mlp网络模型对ofdm系统下的信道进行估计。

进一步地,所述ofdm系统中的数据帧包含l个ofdm符号,每个ofdm符号利用正交的k个子载波并行传输数据符号和导频符号;若信道在ofdm系统下具有准静态特征即信道在ofdm符号时间内不变,则ofdm系统下的传输模型可表示为:yl(k)=hl(k)xl(k)+wl(k),其中yl(k)表示第l个ofdm符号中第k个子载波上接收的符号(数据符号或导频符号),xl(k)表示第l个ofdm符号中第k个子载波上发送的符号(数据符号或导频符号),hl(k)表示第l个ofdm符号中第k个子载波上的cfr(channelfrequencyresponse,信道频率响应),wl(k)表示第l个ofdm符号中第k个子载波上接收到的高斯白噪声,l和k均为大于1的自然数。

进一步地,所述lstm-mlp网络模型由lstm网络和mlp网络两部分组成,所述lstm网络由l个lstm(longshort-termmemory,长短期记忆)单元级联组成,每个lstm单元均连接了一个mlp(multi-layerperceptron,多层感知机)网络,lstm单元顺序连接并传递历史输入信息使得整个lstm网络能学习信道在时域上的相关性,而mlp网络则抽取信道频域特征并进行重建,使得整个网络模型能有效地学习信道的时频特性并起到信道追踪和消除噪声的作用。

进一步地,对于lstm网络中的第l个lstm单元,其输入向量为xl即第l个ofdm符号的cfr,该向量维度为2k且向量中的元素包含了hl(1)~hl(k)的实部和虚部,输出向量为hl,具体计算表达式如下:

hl=ol⊙tanh(cl)

fl=σ(wfhl-1+vfxl+bf)

il=σ(wihl-1+vixl+bi)

ol=σ(wohl-1+voxl+bo)

其中:ol为第l个lstm单元中的输出门,fl为第l个lstm单元中的忘记门,为第l个lstm单元中的候选门,il为第l个lstm单元中的输入门,cl为第l个lstm单元中的细胞单元向量,cl-1为第l-1个lstm单元中的细胞单元向量,tanh()为双曲正切激活函数,σ()为sigmoid激活函数,⊙表示点乘运算符,wf、wc、wi、wo均为隐藏层权重矩阵,vf、vc、vi、vo均为输入层权重矩阵,bf、bc、bi、bo均为偏置向量。

进一步地,所述mlp网络包含两个全连接层,对于第l个lstm单元对应的mlp网络,其中第一个全连接层用于将向量hl进行压缩,采用relu作为激活函数,得到中间向量h′l;第二个全连接层用于将h′l重建为第l+1个ofdm符号的cfr,其输出向量为该向量维度为2k且向量中的元素包含了hl+1(1)~hl+1(k)的实部和虚部,具体计算表达式如下:

h′l=max(w′hl+b′l,0)

其中:w'和b′l分别为第一个全连接层的权重矩阵和偏置向量,w″和b″l分别为第二个全连接层的权重矩阵和偏置向量。

进一步地,所述步骤(3)的具体实现过程为:首先利用无线信道模型生成多帧数据的信道频率响应作为样本,即通过调整无线信道模型中发射机和接收机的速度,生成具有不同多普勒频移的信道冲激响应,进而通过快速傅里叶变换将其转换为信道频率响应;对于任一样本即任一帧数据的信道频率响应,将其中第1~l-1个ofdm符号的cfr作为lstm-mlp网络模型的输入,将其中第2~l个ofdm符号的cfr作为lstm-mlp网络模型的标签,采用输出结果与标签之间的误差(例如均方误差)作为损失函数,通过梯度下降算法迭代更新网络模型中权重矩阵及偏置向量的参数,直至损失函数收敛。

进一步地,所述步骤(4)的具体实现过程如下:

4.1通过信道估计算法(传统的)利用导频得到初始时刻的cfr估计值即第1个ofdm符号的cfr估计值;

4.2将第1个ofdm符号的cfr估计值输入网络模型中的第1个lstm单元,通过对应的mlp网络输出第2个ofdm符号的cfr重建值,进而利用该重建值进行信道均衡并得到第2个ofdm符号的发送符号估计值,再通过dpa过程得到第2个ofdm符号的cfr估计值;

4.3将第2个ofdm符号的cfr估计值输入网络模型中的第2个lstm单元,根据步骤4.2的过程得到第3个ofdm符号的cfr估计值,依此即可得到各个ofdm符号的cfr估计值和发送符号估计值。

本发明设计了一种结合lstm网络和mlp的lstm-mlp网络,并将该网络和dpa方法结合形成基于深度学习和数据导频辅助信道的估计方法,lstm-mlp网络在离线训练过程中通过大量的信道数据样本学习信道的时间相关性和频率相关性。为了解决导频不足的问题,本发明利用dpa方法将解映射过程中纠正后的数据符号作为导频估计当前信道值,为lstm-mlp网络提供了更多有用的信道信息作为输入;同时,为了解决在dpa过程中由于信道噪声和信道时变性造成的误差,本发明利用离线训练好的lstm-mlp网络追踪时变信道并消除噪声,补偿由dpa过程带来的误差,为信号解调提供可靠的信道估计值。

附图说明

图1为本发明lstm-mlp网络的结构示意图。

图2为本发明网络模型的离线训练及在线应用关系示意图。

图3为本发明信道估计方法的流程示意图。

图4为本发明方法应用在ofdm系统下数据帧结构示意图。

图5为本发明方法在不同调制方式下的仿真示意图。

图6为本发明方法在不同信道下的仿真示意图。

图7为本发明方法在不同数据帧长度下的仿真示意图。

具体实施方式

为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案进行详细说明。

本发明在具体实施过程中主要包括两部分:(1)确定lstm-mlp网络的参数并离线训练神经网络;(2)在ofdm系统中应用训练好的lstm-mlp网络和数据导频方法进行信道估计。

ofdm系统的数据帧中包含l个ofdm符号,每个ofdm符号利用正交的k个子载波并行传输数据符号和导频符号。设l为一帧中ofdm符号的索引,l∈[1,2,…,l],k为子载波索引,其中为传输数据符号和导频的子载波序号构成的集合,k是集合的元素个数;令xl(k)表示第l个ofdm符号中第k号子载波上发送的符号,则第l个ofdm符号上传输的所有符号为假设信道在ofdm系统下具有准静态特征,即信道在ofdm符号时间内不变,则ofdm系统传输模型可表示如下:

其中:yl(k)为第l个ofdm符号中第k号子载波上接收的符号,hl(k)为第l个ofdm符号中第k号子载波上的信道频率响应cfr,wl(k)为第l个ofdm符号中第k号子载波上接收到的高斯白噪声。

如图1所示,本发明lstm-mlp网络由lstm网络和mlp网络两部分组成。其中,lstm网络由参数相同的若干个lstm单元组成,lstm单元的数量和ofdm符号数量l相同,每个lstm单元之后连接一个mlp网络。lstm单元顺序连接并利用结构中的隐藏层向量hl和细胞单元cl传递历史输入信息使得整个lstm网络能学习信道在时域上的相关性,而mlp网络则抽取信道频域特征并进行重建,这样的结构能有效地学习信道的时频特性并起到信道追踪和消除噪声的作用。

lstm网络有l个顺序连接的lstm单元组成;第l个lstm单元输入向量为xl,包含第l个ofdm符号的cfr的实部和虚部,所以输入向量维度为2k。lstm单元则包含四个部分:即忘记门候选门输入门和输出门计算公式如下:

fl=σ(wfhl-1+vfxl+bf)

il=σ(wihl-1+vixl+bi)

ol=σ(wohl-1+voxl+bo)

其中:σ(·)为sigmoid激活函数,tanh(·)为双曲正切激活函数;wf,wc,wi,为隐藏权重矩阵,vf,vc,vi,为输入权重矩阵,bf,bc,bi,为偏置向量,权重矩阵和偏置向量的值由离线训练过程决定;p为lstm网络隐藏层的维度(本实例中p=128),是第l-1个lstm单元的输出向量,也是第l-1个lstm单元向第l个lstm单元传递的隐藏层向量。第l个lstm单元的输出为由输出门ol和相应lstm单元的细胞单元决定,具体计算公式如下:

hl=ol⊙tanh(cl)

其中:为细胞单元向量,用以存储长期信息,由候选门、输入门和上一个lstm单元的细胞单元决定,⊙表示点乘操作。

mlp网络以lstm单元的输出向量hl作为输入,由两层全连接层构成,第一层全连接层将输入向量hl压缩,并采用relu作为激活函数,得到中间向量其中q表示中间向量的维度,第二层全连接层将中间向量重建为cfr的实部和虚部,即mlp的输出向量维度也为2k;本发明设定中间向量的维度小于mlp输入维度和输出维度的最小值,即q<min(p,2k),本实例中q=40。mlp网络的具体计算公式如下:

h′l=max(w′hl+b′l,0)

其中:max(·)表示线性整流单元relu;分别为两个全连接层的权重矩阵,分别为两个全连接层的偏置向量,同样地,权重矩阵和偏置向量通过离线训练确定参数;为mlp网络的输出,表示补偿后的第l+1个ofdm符号的cfr的实部和虚部。

图2为神经网络离线训练和在线应用的关系。在离线训练过程中,首先,通过无线信道模型生成信道数据,并用理想的信道值构成神经网络训练集,以此训练lstm-mlp网络。其中,信道模型可选用基于几何的随机模型,例如文献[s.wu,ageneral3dnon-stationary5gwirelesschannelmodel,ieeetransactionsoncommunications,vol.66,no.7,pp.3065-3078,jul.2018]中提到的3d非平稳5g无线信道模型,通过调整模型中发射机和接收机的速度,生成具有不同多普勒频移的信道冲激响应,并通过快速傅里叶变换将其转换为信道频率响应cfr。设连续l个ofdm符号的真实信道频率响应为h=[h1,…,hl,…,hl],其中hl(k)为第l个ofdm符号的第k号子载波上的理想cfr。通过信道模型,构成具有m帧信道数据值即m个样本的训练集。

在离线训练过程中,采用理想的cfr值作为网络的输入和标签。由于整个lstm-mlp网络的输入为时序数据,即第l个lstm单元的输入xl为相应ofdm符号的cfr,即xl=[re(hl),im(hl)]t,其中re(·)和im(·)表示对复数取实部和虚部的操作,(·)t表示矩阵的转置,则lstm-mlp网络的输入为input=[x1,…,xl,…,xl]。同样地,第l个lstm单元相连的mlp网络的标签yl为第l+1个ofdm符号cfr,即yl=[re(hl),im(hl)]t,则整个lstm-mlp网络的标签label=[y1,…,yl,…,yl]。网络训练过程中,可采用均方误差(meansquarederror,mse)作为损失函数,定义如下:

其中:为实际网络输出的cfr,hl(k)相应的标签。此外,梯度下降算法可选用自适应矩估计(adaptivemomentestimation,adam)算法。每次训练所选取的样本数可设置为128,所有数据的迭代次数可设置为200,初始学习率为0.01,每20次迭代学习率变为前一阶段的0.8倍。

网络训练完成后,在数据传输的在线信道估计过程中应用该网络。如图3所示,本发明信道估计方法在ofdm系统中应用时,主要步骤包括:初始信道估计、误差补偿过程和dpa过程。

以ieee802.11p的数据帧为例,如图4所示,其由三部分组成:前导码、信息域和数据域,其中前导码包括10个短训练符号和2个长训练符号,信息域传输调制方式、编码方式等信息,数据域传输数据符号,本实例只考虑长训练符号和数据域部分。用于估计信道的导频由两部分组成:长训练符号和数据域中四个导频子载波上传输的导频,分别称为块状导频和梳状导频。

步骤1:在ieee802.11p的帧结构下,初始信道估计可由长训练符号进行传统的信道估计得到,例如最小二乘(leastsquare,ls)算法,如以下公式所示:

其中:表示两个长训练符号在第k号子载波上的接收信号,x(k)为发送的导频信号,表示第k号子载波上的初始信道估计值。

步骤2:得到初始信道估计值或者第l-1个ofdm符号的信道估计值后,抽取信道值的实部和虚部,构成输入向量表示经过dpa过程后得到的第l-1个ofdm符号的cfr估计值。当l=1时,为初始信道估计值,将xl输入训练好的lstm-mlp网络中,得到网络输出如以下公式所示:

其中:flstm-mlp(·)为lstm-mlp网络的计算过程,θ表示离线训练过程中所确定的网络系数。

步骤3:将lstm-mlp的网络输出重建为复数向量,将该值称为cfr补偿值然后,将补偿后的信道估计值用于第l个ofdm符号的数据子载波上信号的信道均衡,例如采用迫零均衡,得到相应的数据符号估计值;接着,采用就近原则将数据符号估计值映射到最近的调制星座点上,得到数据符号纠正值,并结合导频子载波上的导频符号,构成第l个ofdm符号上所有符号的集合如以下公式所示:

其中:表示迫零均衡过程,q(·)表示解映射过程中将数据符号估计值映射到最近的调制星座点的操作。将用于估计信道,例如ls算法,如以下公式所示:

最后,将得到的第l个ofdm符号的cfr估计值传递到第l+1个ofdm符号,重复步骤2和3,直至所有ofdm符号的信道估计完成。

图5~图7所示为在ieee802.11p系统下的仿真结果,lstm-mlp离线训练的训练集由3d非平稳5g无线信道模型生成,信道生成参数如表1所示。此外,图5和图6的仿真测试信道也由3d非平稳5g无线信道模型生成,不同的是,测试集中信道的发射机和接收机速度与训练集采取不同的设置。

表1

图5所示为在发射机与接收机相对运动且两者速度均为150km/h的场景下不同dpa方案在0到40db信噪比(signal-to-noiseratio,snr)区间内的误比特率(biterrorrate,ber)性能。可以看到基于深度学习的dpa方案包括ae、sta-dnn和本发明方法都比传统dpa方案(例如sta和cdp)性能更为卓越。图5中实线和虚线分别表示16qam和64qam调制的情况。相对于16qam,64qam在解映射过程中的数据符号纠正能力更弱,因此其误差容许范围更小,误差传播问题更严重。从图5中可以看出,本发明相比于ae和sta-dnn方案的性能增益在64qam下更明显,这是因为lstm-mlp网络的信道追踪功能使得本发明具有卓越的误差补偿效果。此外,lstm-mlp网络还可以在有噪声的环境下进行训练,例如采用30dbsnr环境,其效果如图5中lstm+mlp,30db对应的曲线所示,在较低的snr下展现了更好的性能,但较高的snr下性能不如无噪声环境下训练的网络。

图6所示为在接收机速度为150km/h的场景下使用64qam调制时不同dpa方案ber性能对比,其中实线表示的是发射机速度为72km/h的仿真信道,虚线表示的是发射机速度为150km/h的仿真信道,两者移动方向都和接收机相反。从图6中可以看到,当发射机速度提升时,本发明与其他方案相比具有更少的性能损失,这是因为lstm网络能有效地学习信道的时间相关特性并在较大程度上补偿由于信道时变造成的误差。

图7所示为高速公路移动场景下不同dpa方案的ber性能对比,其中的测试信道与训练集不同,由抽头延迟线模型并结合文献[g.acosta-marum&m.a.ingram,sixtime-andfrequency-selectiveempiricalchannelmodelsforvehicularwireless,ieeevehiculartechnologymagazine,vol.2,no.4,pp.4-11,2007]中高速公路相向而行(vehicle-to-vehicleexpresswaycoming,v2veo)场景的信道参数生成,其中最大多普勒频移设置为1200hz。图7中的实线和虚线分别表示数据帧含有50和100个ofdm符号的情况,从图7中可以看到,每个方案的性能都随着数据帧长度的增加而下降,但是本发明具有更少的性能损失,因为其在每个ofdm符号中都展现了更好的误差补偿效果。

上述对实施例的描述是为便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,对于本发明做出的改进和修改都应该在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1