一种车联网中基于机器学习优化的MIMO信息检测方法

文档序号:26275310发布日期:2021-08-13 19:30阅读:181来源:国知局
一种车联网中基于机器学习优化的MIMO信息检测方法

本发明涉及一种多输入多输出(multipleinputandmultipleoutput,mimo)传输与检测技术,尤其涉及一种mimo线性检测的优化方法,更具体地说,涉及一种基于机器学习反向传播神经网络(backpropagation,bp)算法优化的mimo信息传输检测方法。



背景技术:

大规模mimo是第五代通信系统(fifth-generation,5g)的关键技术,可以在可用无线电频谱中实现非常高的性能。大规模mimo技术是传统小规模mimo的延伸,它利用基站(basestation,bs)中的大量天线为大量用户提供服务,从而实现高数据吞吐量和频谱效率。当基站部署大规模天线阵列时,随着天线数量的增加,用户的信道维度会变大,因此用户信道的差异会更加明显,从而带来更大的空间自由度和空间复用基站增益。因此,部署大规模mimo系统的基站可以使用相同的时频资源服务更多的用户,系统的频谱效率将大大提高。然而,在mimo检测过程中,发射机和接收机上的大量天线会导致计算复杂度高和能耗高,这已成为实际mimo系统中最关键的问题之一。因此,在实际的mimo检测系统中,应该权衡误码率和计算复杂度之间的关系,使它们接近理想的效果。

由于基站中有大量天线,一些用于矩阵求逆的经典线性检测器具有很大的计算复杂度,例如迫零(zeroforcing,zf)算法和最小均方误差(minimummeansquareerror,mmse)算法。因此,一些学者提出了几种低复杂度的方法,如诺依曼级数展开(neumannseriesexpansion,nse)、高斯-赛德尔迭代(gauss-seideliteration,gsi)、雅可比迭代(jacobiiteration,jc)。但是,随着用户数量的增加,它们都出现了严重的性能损失。为了解决这个问题,学界提出了一种基于格基规约(latticereduction,lr)的误差恢复检测器初始化方法。其定义了对角线优势指数,以测量一个矩阵的对角线优势度。研究表明,lr预处理可以在提高正交性的基础上使矩阵具有更好的对角优势,从而为上行大规模mimo系统提供良好的性能。但由于其在信号传输与检测的过程中仍未形成逻辑上的闭环,故系统稳定性较差。

本发明提出的mimo检测方法基于zf/mmse准则和lll预处理,将mimo技术应用于车联网领域,采用机器学习bp神经网络算法对其进行修正与优化。利用信号的前向传播和误差的反向传播,动态调整车载接收端的检测信号,使车路协同检测系统具有自学习功能,以计算复杂度与误码率的均衡为优化目标,使系统可靠性在传统线性检测的基础上得到提升。



技术实现要素:

针对现有技术存在的上述问题,本发明提出车联网中一种基于机器学习优化的mimo传输检测方法,采用lll格基规约预处理技术和zf/mmse线性检测技术,通过构建bp神经网络,采用l2正则化训练bp神经网络,针对线性检测的估计值进行修正。该方法能以较低的计算复杂度实现更低的比特传输误码率。

本发明为解决上述技术问题采用以下技术方案:

在考虑无线信道大尺度衰落及小尺度衰落的情况下,以实现检测过程中计算复杂度与误码率的均衡为目的。我们针对大规模mimo系统上行链路,采用lll格基规约预处理技术,将信道矩阵约减到一个更加正交化的等效信道矩阵,使其更适合符号译码。采用zf/mmse线性检测技术,使传输检测系统在最低计算复杂度的情况下,得到比较接近原发送数据的估计值。通过建立bp神经网络学习模型,将基于lll格基规约预处理和zf/mmse准则检测后的估计值矩阵作为输入集,即训练样本。将原信号矩阵作为准确样本,利用信号的正向传播与误差的反向传播,通过样本数据的训练,不断修正网络权值和阈值使误差函数沿负梯度方向下降,从而逼近期望输出。完成上述发明通过以下技术方案实现:车联网中一种基于机器学习优化的mimo传输检测方法,包括步骤如下:

s1:构建基于车路协同的车联网模型,该模型包括具备移动边缘计算能力的路边单元rbu和搭载车载单元obu的车辆;

s2:建立计算迁移模型,以系统时延最小化作为优化目标,通过深度强化学习模型,优化计算迁移策略,最终决定是在车辆端还是在边缘服务器进行计算检测,其中包括如下具体步骤:

s21,建立包括n个用户迁移j个任务的计算迁移模型;

s22:优化计算迁移策略,通过时延的计算,决定在车端计算检测还是边缘服务器计算检测,以系统时延最小化为计算迁移的目标,构建深度强化学习模型;

s23:利用深度q学习算法优化深度强化学习模型;

s24:根据优化后的深度强化学习模型,得到最优的计算位置;

s3:在rsu和车辆之间建立mimo无线信道传输模型,设置环境参数,随机生成发送矩阵x,信道状态矩阵h,以及高斯白噪声n;

s4:采用qpsk调制方法,将传输比特按调制规则映射到星座点上;

s5:对信道状态矩阵进行lll格基规约预处理,使其约减为一个更加正交化的等效信道矩阵,从而更适合符号译码;

s6:采用线性检测中的zf或mmse准则,利用接收信号矩阵y和信道状态矩阵h,得到发射信号矩阵x的估计值;

s7:对估计值进行bp神经网络训练,根据信号的正向传播和误差的反向传播,利用梯度下降的方法不断逼近理想结果。

进一步的,所述s7包括如下具体步骤:

s71:构建含有多层隐含层的bp神经网络,采用trainlm训练函数,预设训练精度、学习精度为和最大循环次数;

s72:将基于lll格基规约预处理和zf/mmse准则检测后的估计值矩阵作为输入集,即训练样本。将原信号矩阵作为准确样本,并将二者的误差和正则化项作为训练导师以监督神经网络的学习,计算各层神经元的输入和输出:

其中,为输入变量,为隐含层输入变量,为隐含层输出变量,为输出层输入变量,为输出层输出变量,表示权重向量。

(6b)利用网络期望输出和实际输出,计算误差函数对输出层的各神经元的偏导数。e表示误差函数。

采用l2正则化,l2正则化属于正则化技术的一类,称为参数范数惩罚。在这类技术中,特定参数的范数(主要是权重)被添加到被优化的目标函数中。在l2范数中,在网络损失函数中加入一个额外的项,通常称为正则化项。正则化项为:

是正则化参数,与应用的正则化量成正比。如果,则不应用正则化,当时,对网络应用最大正则化。是一个超参数,不是在训练期间学习的,而是由手动调整或使用一些超参数调整技术,如随机搜索。

s74:利用隐含层到输出层的连接权值、输出层的和隐含层的输出计算误差函数与正则化项之和对隐含层各神经元的偏导数

s75:利用输出层各神经元的和隐含层各神经元的输出来修正连接权值

其中,为设置的学习率;

s76:利用隐含层各神经元的和输入层各神经元的输入修正连接权。

s77:计算全局误差:

s78:判断网络误差是否满足要求。当误差达到预设精度或学习次数大于设定的最大次数,则结束算法。否则,选取下一个学习样本及对应的期望输出,返回进入下一轮学习。在设想情况下,其输出结果将使接收信号估计值的误差再次降低,从而达到更低误码率的目标。

本发明的有益效果为:

本发明提出的一种车联网中基于机器学习优化的mimo信息检测方法,bp神经网络针对线性检测的估计值进行修正。该方法能在采用zf/mmse线性准则和lll预处理的情况下,以较低的计算复杂度实现更低的比特传输误码率。通过建立bp神经网络学习模型,利用信号的正向传播与误差的反向传播,通过样本数据的训练,不断修正网络权值和阈值使误差函数沿负梯度方向下降,从而逼近期望输出。本发明使用bp神经网络算法可以有效解决lll预处理下zf/mmse线性检测的优化问题,并且可以在不同发送数据空间与不同隐含层数量中表现稳定。

综上所述,在保证较低的计算复杂度的情况下,本发明提出的一种车联网中基于机器学习优化的mimo信息检测方法在比特传输检测误码率方面是优越的。

附图说明

图1为一种车联网中基于机器学习优化的mimo信息检测方法的流程图。

图2为mimo无线信道传输系统模型示意图。

图3为bp神经网络系统结构示意图。

图4为bp神经网络误差反向传播的自学习模型示意图。

具体实施方式

本发明的核心思想在于:机器学习bp神经网络针对线性检测的估计值进行修正,采用lll格基规约预处理方法,将信道状态矩阵更加正交化,再通过zf/mmse线性准则得到检测估计值,通过建立bp神经网络学习模型,利用梯度下降方法对上述估计值进行不断的修正。根据优化后的mimo检测方法,实现了低计算复杂度和低误码率的均衡。

下面对本发明做进一步详细描述。

s1:构建基于车路协同的车联网模型,该模型包括具备移动边缘计算能力的路边单元rbu和搭载车载单元obu的车辆;

s2:建立计算迁移模型,以系统时延最小化作为优化目标,通过深度强化学习模型,优化计算迁移策略,最终决定是在车辆端还是在边缘服务器进行计算检测,其中包括如下具体步骤:

s21:建立包括n个用户迁移j个任务的计算迁移模型,具体为:

建立通信模型,假设有m个rsu安装在道路两旁,用表示,将rsu的可用带宽分为i个信道,用表示。有n个用户j个计算任务需要迁移,分别用表示。

表示第n个用户到第m个边缘设备的发射功率,第m个边缘设备服务的第n个用户的信噪比sinr可以通过计算得到:

其中表示第n个用户到第m个边缘设备的子信道增益,表示噪声功率,表示第i个信道是否被第n个用户使用,表示用户n使用i信道,表示用户n没有使用i信道。

n个用户向第m个边缘设备的传输速率可以表示为:

是边缘设备m服务用户n所占用的带宽,总的可达传输速率是所有并发传输链路的传输速率之和。

建立计算模型,对于每个移动边缘设备(mobileedgecomputing,mec)均有资源集合,其中表示mec服务器的最大计算资源,表示mec服务器最大可用存储容量,表示mec服务器的计算能力,表示mec服务器cpu每运转一周消耗的能量。

对于车辆n有资源集合,其中表示车辆的最大计算资源,表示车辆最大可用存储容量,表示车辆的计算能力,表示车辆cpu每运转一周消耗的能量。

对于移动边缘设备覆盖范围内的一个用户,其任务可以表示为表示用户n要迁移的任务j的大小,表示用户n对任务j的最大可容忍时延,示用户n完成任务j所需的cpu周期数。表示用户n要计算任务j所需的计算资源。

n个用户将第j个任务上传到第m个边缘服务器的上传时延为:

m个边缘服务器处理第j个任务的计算时延为:

n个用户将第j个任务在车端的计算时延为:

任务在车端计算没有上传时延,但是受到车辆本身的计算能力的限制,其计算时延比任务在移动边缘服务器计算的时延大;

s22:优化计算迁移策略,通过时延的计算,决定在车端计算检测还是边缘服务器计算检测,以系统时延最小化为计算迁移的目标,构建深度强化学习模型,具体为:

具体地定义状态空间s为与计算迁移有关的信息,包括每个mec的资源集合,每个车辆的资源集合,需要执行任务的相关信息,即

将每辆车视为智能体,每次车基于当前状态选择无线接入方式。

定义动作空间a为无线接入方式,表示为

无线接入方式:每辆车有种任务迁移决策,令表示车辆n选择将其计算任务迁移到rsum上的边缘服务器执行,而是车辆n决定计算任务在车辆上执行。

定义奖励函数r,联合计算迁移的目标是车选择无线接入方式,在满足每条计算迁移链路服务质量要求的情况下,以合理高效的计算迁移达到系统时延最小化为目标。因此奖励函数可以表示为:

为了获得长期的良好回报,应同时考虑眼前的回报和未来的回报。因此,强化学习的主要目标是找到一种策略来最大化预期的累积折扣回报,

其中是折扣因子。

依据建立好的s,a和r,在q学习的基础上建立深度强化学习模型,评估函数表示从状态执行动作后产生的折扣奖励,q值更新函数为:

其中为即时奖励函数,γ为折扣因子,为车在t时刻的获取的移动边缘服务器、云服务器和现有任务状态信息,表示车在执行后的状态,a为动作构成的动作空间;

s23:利用深度q学习算法优化深度强化学习模型,具体为:

(a):初始化训练回合数p,随机初始化化策略

(b):用随机权重初始化值函数和目标值网络;

(c):值网络根据输入状态,输出动作,并获取即时的奖励,同时转到下一状态,从而获得训练数据

(d):将训练数据存入经验回放池中;

(e):从经验回放池中随机采样m个训练数据构成数据集,发送给值网络。

(f):定义值网络的损失函数,通过神经网络的梯度反向传播来更新值网络的所有参数θ。

(g):在线训练次数达到目标网络更新频率,根据在线网络参数θ更新目标网络参数θ'。

(h):判断是否满足p<i,i为训练回合数设定阈值,若是,p=p+1,进入步骤b,否则,优化结束,得到优化后的深度强化学习模型。

s24:根据优化后的深度强化学习模型,得到最优的计算位置,具体为:包括如下具体步骤:

(a):利用dqn算法训练好的深度强化学习模型,输入系统某时刻的状态信息

(b):输出最优动作策略得到最优的车无线接入方式

s3:在rsu和车辆之间建立mimo无线信道传输模型,设置环境参数,随机生成发送矩阵x,信道状态矩阵h,添加高斯白噪声n。

s4:采用qpsk调制方法,将传输比特按调制规则映射到星座点上。

s5:对信道状态矩阵进行lll格基规约预处理,使其约减为一个更加正交化的等效信道矩阵,从而更适合符号译码,包括如下具体步骤:

s51:首先,基于lr预处理,我们定义一个信道矩阵为:

s52:我们将实值通道矩阵的列解释为晶格的基础,并暂时假设可能的发射矢量由维的无限整数空间给出。因此,所有可能的不受干扰的接收信号的集合由晶格给出:

s53:当且仅当矩阵是幺模矩阵时,矩阵可以生成与相同的晶格。幺模矩阵的逆始终存在,且只包含整数值,即。显然地,成立。

s54:lr的目的就是将给定的基数转换为具有最短长度向量的新基数,或者等效地转换成由大致正交的基数向量组成的基数。为此,a.k.lenstra,h.w.lenstra和l.lovasz提出了一种有效的方法,即lll格基规约方法,以确定该基数。该算法与其他格基约减算法相比具有更大的灵活性,且复杂度较低。lll算法通过长度规约和列变换使得信道满足以下条件:

其中,分别为施密特正交化前和施密特正交化后的列向量。

s6:采用线性检测中的zf或mmse准则,利用接收信号矩阵y和信道状态矩阵h,得到发射信号矩阵x的估计值。本发明考虑在基站处装有个天线和个单天线用户的mimo系统。

zf检测的基本思想是,假设噪声向量为0,mimo系统检测模型可以被视作线性方程组。既而mimo检测问题可以等价为求个未知变量个线性方程组下的解。如果是一个方阵(=)且是一个满秩的矩阵,则这个线性方程组的解为:

进一步地,如果矩阵满足且列满秩,则:

其中的广义逆矩阵。

zf准则忽略噪声的影响,简单地处理未知的发送信号。它的目标是将信道矩阵造成的干扰降为零。zf准则对发送信号的估计为:

虽然消除了信道间干扰,但是接收端噪声因为与线性加权矩阵的相乘得到了增强。因此,尽管zf准则的计算复杂度低,但以噪声的增加为代价。如果单独使用zf,则检测性能较差。

mmse准则可视为由zf演进而来。它的基本思想是计算天线发送信号和检测输出的估计值之间的差异程度,让它们的均方误差期望值最小化。通过滤波输出而获得的估计信号为:

其中,为mmse准则的滤波矩阵,为匹配滤波输出。

与zf准则相比,mmse准则通过减小信道中干扰和噪声带来的总误差,在干扰消除和噪声增强之间达到了很好的平衡。然而,虽然其性能优于zf准则,但由于受到线性检测的限制,其性能仍无法接近最大似然的最佳表现。

s7:对估计值进行bp神经网络训练,根据信号的正向传播和误差的反向传播,利用梯度下降的方法不断逼近理想结果,包括如下步骤:

s71:构建含有多层隐含层的bp神经网络,采用trainlm训练函数,预设训练精度、学习精度为和最大循环次数。

s72:将基于lll格基规约预处理和zf/mmse准则检测后的估计值矩阵作为输入集,即训练样本。将原信号矩阵作为准确样本,并将二者的误差作为训练导师以监督神经网络的学习,计算各层神经元的输入和输出:

其中,为输入变量,为隐含层输入变量,为隐含层输出变量,为输出层输入变量,为输出层输出变量,表示权重向量。

s73:利用网络期望输出和实际输出,计算误差函数对输出层的各神经元的偏导数。e表示误差函数。

s74:利用隐含层到输出层的连接权值、输出层的和隐含层的输出计算误差函数对隐含层各神经元的偏导数

s75:利用输出层各神经元的和隐含层各神经元的输出来修正连接权值

其中,为设置的学习率。

s76:利用隐含层各神经元的和输入层各神经元的输入修正连接权。

s77:计算全局误差:

s78:判断网络误差是否满足要求。当误差达到预设精度或学习次数大于设定的最大次数,则结束算法。否则,选取下一个学习样本及对应的期望输出,返回进入下一轮学习。在设想情况下,其输出结果将使接收信号估计值的误差再次降低,从而达到更低误码率的目标。

最后,对说明书中的附图进行详细说明。

在图1中,描述了一种车联网中基于bp神经网络优化的mimo信息检测方法的流程,首先建立mimo无线信道模型,lll预处理将信道状态矩阵等效为一个更加正交化的矩阵,通过zf/mmse准则得到检测信号的估计值,再利用bp神经网络对估计值进行修正和优化,以此实现降低误码率的目的。

在图2中,描述了mimo无线信道传输系统模型,其中,基站处天线数为,单天线用户数为

在图3中,描述了bp神经网络系统结构,bp神经网络由输入层,隐含层和输出层构成,其中隐含层数量需要根据输入和输出的维数进行设定。

在图4中,描述了bp神经网络误差反向传播的自学习模型,该模型属于有导师监督式的学习过程,该过程首先将一组训练集送入网络,而后根据网络的实际输出与期望输出间的差别来调整连接权。

根据对本发明的说明,本领域的技术人员应该不难看出,本发明的采用基于机器学习优化的mimo传输检测方法可以有效降低比特传输误码率并且能保证低计算复杂度。

本发明申请书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

以上实施方式仅为说明本发明的技术思想,并不用于限制本发明的保护范围,凡是按照本发明提出的技术思想,在本发明技术方案基础上所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1