一种用于大规模MIMO系统信号检测的通用下降搜索方法与流程

文档序号:15816635发布日期:2018-11-02 22:42阅读:234来源:国知局
本发明涉及无线通信技术,特别是涉及一种用于大规模mimo系统信号检测的通用下降搜索方法。
背景技术
:随着信息产业的发展,无线数据、设备数量和数据速率将会在未来一段时间内持续爆炸式增长。基于这些事实,国际电信联盟(itu)imt-2020(5g)推进组确定了下一代移动通信的一些指标,包括百倍的能量效率、五倍的频谱效率、每平方公里106个连接数密度和用户体验数据速率约1gbps等。为了满足这些性能和效率要求,现有技术提出了未来移动通信的5项关键技术。其中,大规模多输入多输出(mimo)系统引起了研究人员和工程师们的广泛关注。在大规模mimo系统中,基站使用数百个天线在同一频带上服务各种用户。与传统的小规模mimo相比,大规模mimo可以通过提供更稳定的链路连接、更高的频谱效率和更有效的能量利用来继承所有的优点并大大超越。因此,它被认为是数字社会的基础和推动物联网(iot)的动力。然而,大规模mimo的问题之一在于检测的复杂性。信号检测的主要目的是从接收到的符号中恢复原始信号。然而,不幸的是,最优检测方法被证明是非多项式时间复杂度(np-hard)的问题。虽然随着半导体工业的发展,硬件计算能力近年来一直增加,在一些不太极端的情况下,计算复杂性不再是应用的瓶颈,但是,应该注意的是,尽管晶体管越来越快,在现代金属氧化物半导体(cmos)工艺中电源电压并不能显着降低。因此,几乎所有的集成电路(ic)都受限于最大集成密度。换言之,基于最大似然(ml)准则或最大后验概率(map)准则的最优算法对于大规模mimo系统将是无法实际使用的。即使是复杂度适中的检测方法也消耗了太多的功率。这样一来,低复杂度的次优检测器对于实际应用必不可少的。针对实现中存在的问题,文献提出了多种检测方法,大体上可分为线性检测算法和非线性检测算法两类。与非线性方法相比,诸如迫零(zf)和最小均方误差(mmse)的线性方案具有较低的复杂度,且在接收端天线数目较大时可以得到近似于最优的结果。然而,上述两种算法都需要精确的矩阵求逆操作,并且求逆方法,如qr分解和乔里斯基分解将达到o(u3)的复杂度,其中u为单天线用户数。为了避免线性检测器主要复杂度的来源——精确求逆,一些无需求逆的方法被提了出来。近似方法如诺伊曼级数展开(nse)通过级数项代替矩阵求逆。然而,当nse的项数大于2时,其复杂度将恢复到o(u3)。另一种可选择的方案是迭代方法,包括下降搜索(descentsearch,ds)法。这种方法沿目标函数的下降方向搜索和迭代,最陡下降(steepestdescent,sd)法,barzilai-borwein(bb法,共轭梯度(conjugategradient,cg)等都属于这一类。由于这些ds方法只涉及典型的操作,所以它们具有硬件友好特性。此外,现有技术还提出了基于cg算法的用于大规模mimo检测的可重构vlsi架构,对sd算法进行设计以减小检测的复杂度。然而,还存在以下问题待解决:1、ds算法的ber性能随着发射天线配置数量的增加而急剧下降,因此,要关注在大规模系统中提高其性能的办法;2、不同于大多数文献讨论的理想信道,在更接近于实际的相关信道中应用时,ds算法甚至无法保证收敛性。因此,如何维持其在理想信道中的优越性值得研究。总而言之,虽然这些方法试图平衡ber性能和计算复杂度,但收敛性问题和计算困难仍然阻碍了它们的实际应用。技术实现要素:发明目的:本发明的目的是提供一种能够解决现有技术中存在的缺陷的用于大规模mimo系统信号检测的通用下降搜索方法。技术方案:为达到此目的,本发明采用以下技术方案:本发明所述的用于大规模mimo系统信号检测的通用下降搜索方法,包括以下步骤:s1:根据非理想信道下的参数情况构建检测大规模mimo系统发射信号的线性不等式二次优化模型,并构造检测矩阵a;s2:根据步骤s1构建的模型对下降搜索算法增加映射操作;s3:根据ssor预处理算法计算下三角矩阵l;s4:根据矩阵l,采用含映射操作的下降搜索算法对接收端匹配滤波器输出的接收信号矩阵进行检测,得到发射信号估计值。进一步,所述步骤s1具体包括如下过程:s1.1:将发送信号矢量s的定义域由s∈ou扩展为包含s的最小凸包:s∈cou;其中,o是第i个单天线用户发射端调制方式对应的复数星座集,u是用户数,co为包含第i个单天线用户发送信号的最小凸包,si∈co,si为第i个单天线用户发送的信号,i=1,2,…,u,其中co如式(1)所示:式(1)中,θi为si的组合系数;对于qam调制方式,co={(xr,xi)|xr∈[-a,a],xi∈[-a,a]},xr为集合中复数的实部,xi为集合中复数的虚部,a'为第i个单天线用户发射端调制方式对应的复数星座集中的一个点;s1.2:根据非理想信道响应矩阵h、接收信号y、发送信号s和噪声方差σ2,构造检测大规模mimo系统发射信号的licqp模型,如式(2)和(3)所示:其中,q=(1,-1)t,t=(a,-a)t×e2ut,e2u是2u×1的全1向量,是的转置,而是s的实值分解,即s1.3:根据非理想信道的信道响应矩阵h,按照以下公式构造出检测矩阵a:a=hhh+σ2i(4)式(4)中,hh表示h矩阵的共轭转置,ι是单位矩阵。进一步,所述步骤s2具体包括以下过程:将下降搜索方法每一次迭代结果中的每个元素w作如下映射:式(5)中,为映射操作得到的值,x为第i个单天线用户发送信号的最小凸包co中的一个点,co为包含第i个单天线用户发送信号的最小凸包。进一步,所述步骤s3具体包括以下过程:由检测矩阵a通过式(6)计算获得下三角矩阵l:其中,cl表示矩阵a的下三角矩阵,d是对角线元素与a对角线元素相同的对角阵。进一步,所述步骤s4具体包括以下过程:s4.1:初始化:其中,y为接收信号;s4.2:设置迭代总次数j,令第一迭代计数器j=1;s4.3:令第二迭代计数器u=1,按照下式计算:式(7)中,为第j-1次迭代时的中间变量向量的值,z(j-1)为第j-1次迭代时的中间变量向量z的值,为第j-1次迭代时的发射信号矢量估计值,w(j)为第j次迭代时映射前的发射信号矢量估计值,f1为使用的下降搜索算法中步长α的计算函数,f2为使用的下降搜索算法中搜索方向d的计算函数;s4.4:按照下式计算:式(8)中,wu(j)为第j次迭代时映射前的第u个用户发射信号估计值;s4.5:令u=u+1,并返回至步骤s4.4,直至迭代u次为止,u是用户数,获得迭代结果然后进入下一步操作;s4.6:按照下式计算:式(9)中,f3为使用的下降搜索算法中的计算函数,z(j)为第j次迭代时的中间变量向量z的值;s4.7:令j=j+1,并返回至步骤s4.3,直至迭代到预设次数j为止,则为发射信号矩阵估计值。有益效果:本发明公开了一种用于大规模mimo系统信号检测的通用下降搜索方法,与现有技术相比,具有如下的有益效果:1)本发明从提高大规模mimo迭代检测算法的性能出发,提出了在迭代前预先对检测矩阵进行处理的方法,提高了迭代检测在多种mimo场景(信道的相关性和系统规模的扩大时)下的检测性能;2)本发明利用licqp模型分析问题并引入了迭代后的映射操作,在提高算法性能的同时为大规模mimo检测提供了新的思路;3)本发明综合考虑到了性能提高所带来的复杂度的提高,并选用合适的操作减小复杂度,利用简洁的预处理和硬件结构,大大降低了检测复杂性;4)本发明具有统一通用性,设计的算法优化过程(如:映射操作、预处理操作等)对于所有下降搜索类方法或者与之有类似运算过程的算法均适用,硬件架构也具有可重用性;5)本发明与现有迭代检测方法相比适用于更加多变的信道模型和不断扩大的系统规模,在恶劣条件下仍能保持低信噪比下的低误码率,更加满足下一代移动通信对于检测技术的要求。附图说明图1为本发明具体实施方式中各方法在各场景下的误码率表现比较图;图1(a)为b=128,u=8时理想信道下的误码率;图1(b)为b=128,u=16时理想信道下的误码率;图1(c)为b=128,u=32时理想信道下的误码率;图1(d)为b=128,u=8时相关信道下的误码率;图1(e)为b=128,u=16时相关信道下的误码率;图1(f)为b=128,u=32时相关信道下的误码率;图2为本发明具体实施方式中随着用户数与基站天线数的比值增大或者信道相关系数增大,检测矩阵的条件数变化图;图3为本发明具体实施方式中采用预处理后的矩阵的条件数与未经过预处理的检测矩阵的条件数对比图;图4为本发明具体实施方式中采用预处理后的矩阵的条件数与采用sp或ic预处理的检测矩阵的条件数对比图;图5为本发明具体实施方式中sd方法的示意图;图6为本发明具体实施方式中bb方法的示意图;图7为本发明具体实施方式中cg方法的示意图;图8为本发明具体实施方式方法与未使用预处理操作的含映射的下降搜索方法在各场景下的误码率表现比较图;图8(a)为b=128,u=8时理想信道下的误码率;图8(b)为b=128,u=16时理想信道下的误码率;图8(c)为b=128,u=32时理想信道下的误码率;图8(d)为b=128,u=8时相关信道下的误码率;图8(e)为b=128,u=16时相关信道下的误码率;图8(f)为b=128,u=32时理想信道下的误码率;图9为基站端天线数和用户端天线数分别为128和32且信道相关时,本发明具体实施方式方法与ic预处理方法以及乔里斯基直接求逆法的误码率表现比较图;图10为本发明具体实施方式方法与未使用预处理操作的含映射的下降搜索方法、sp预处理方法、ic预处理方法以及乔里斯基直接求逆法的复杂度对比图;图11为本发明具体实施方式中检测矩阵a构造单元的硬件结构示意图;图12为本发明具体实施方式中下三角矩阵求逆单元的硬件结构示意图;图13为本发明具体实施方式中sd方法的完整硬件架构示意图;图14为本发明具体实施方式中通用结构硬件架构示意图;图15基站端天线数和用户端天线数分别为128和32且信道理想时本发明具体实施方式的量化结果、原始结果与未使用预处理操作的含映射的下降搜索方法的误码率表现比较图;图16为本发明具体实施方式中fpga硬件消耗情况图。具体实施方式下面结合具体实施方式对本发明的技术方案作进一步的介绍。本具体实施方式公开了一种用于大规模mimo系统信号检测的通用下降搜索方法,包括以下步骤:s1:根据非理想信道下的参数情况构建检测大规模mimo系统发射信号的线性不等式二次优化模型,并构造检测矩阵a;s2:根据步骤s1构建的模型对下降搜索算法增加映射操作;s3:根据ssor预处理算法计算下三角矩阵l;s4:根据矩阵l,采用含映射操作的下降搜索算法对接收端匹配滤波器输出的接收信号矩阵进行检测,得到发射信号估计值。步骤s1具体包括如下过程:s1.1:将发送信号矢量s的定义域由s∈ou扩展为包含s的最小凸包:s∈cou;其中,o是第i个单天线用户发射端调制方式对应的复数星座集,u是用户数,co为包含第i个单天线用户发送信号的最小凸包,si∈co,si为第i个单天线用户发送的信号,i=1,2,…,u,其中co如式(1)所示:式(1)中,θi为si的组合系数;对于qam调制方式,co={(xr,xi)|xr∈[-a,a],xi∈[-a,a]},xr为集合中复数的实部,xi为集合中复数的虚部,a'为第i个单天线用户发射端调制方式对应的复数星座集中的一个点;s1.2:根据非理想信道响应矩阵h、接收信号y、发送信号s和噪声方差σ2,构造检测大规模mimo系统发射信号的licqp模型,如式(2)和(3)所示:其中,q=(1,-1)t,t=(a,-a)t×e2ut,e2u是2u×1的全1向量,是的转置,而是s的实值分解,即s1.3:根据非理想信道的信道响应矩阵h,按照以下公式构造出检测矩阵a:a=hhh+σ2i(4)式(4)中,hh表示h矩阵的共轭转置,ι是单位矩阵。步骤s2具体包括以下过程:将下降搜索方法每一次迭代结果中的每个元素w作如下映射:式(5)中,为映射操作得到的值,x为第i个单天线用户发送信号的最小凸包co中的一个点,co为包含第i个单天线用户发送信号的最小凸包。通过数学知识发现,下降搜索算法的收敛速度取决于检测矩阵a的条件数。具体来说,条件数越大收敛速度越慢。并且,随着用户数与基站天线数的比值增大,或者信道相关系数增大,矩阵的条件数增大。变化关系详见图2。步骤s3具体包括以下过程:由检测矩阵a通过式(6)计算获得下三角矩阵l:其中,cl表示矩阵a的下三角矩阵,d是对角线元素与a对角线元素相同的对角阵。下面用矩阵l来减少a的条件数,可以将原先下降搜索方法中的矩阵a用a’=l-1al-h处理再做相关计算。图3的仿真结果显示,新得到的矩阵a’的条件数较之前a的条件数在各种情况下均大幅下降,与其他预处理方法相比,图4显示这种ssor预处理的效果更好。数学上可以证明,这种方法可以使矩阵的条件数下降为原先的平方根(条件数永远大于等于1)。步骤s4具体包括以下过程:s4.1:初始化:其中,y为接收信号;s4.2:设置迭代总次数j,令第一迭代计数器j=1;s4.3:令第二迭代计数器u=1,按照下式计算:式(7)中,为第j-1次迭代时的中间变量向量的值,z(j-1)为第j-1次迭代时的中间变量向量z的值,为第j-1次迭代时的发射信号矢量估计值,w(j)为第j次迭代时映射前的发射信号矢量估计值,f1为使用的下降搜索算法中步长α的计算函数,f2为使用的下降搜索算法中搜索方向d的计算函数;s4.4:按照下式计算:式(8)中,wu(j)为第j次迭代时映射前的第u个用户发射信号估计值;s4.5:令u=u+1,并返回至步骤s4.4,直至迭代u次为止,u是用户数,获得迭代结果然后进入下一步操作;s4.6:按照下式计算:式(9)中,f3为使用的下降搜索算法中的计算函数,z(j)为第j次迭代时的中间变量向量z的值;s4.7:令j=j+1,并返回至步骤s4.3,直至迭代到预设次数j为止,则为发射信号矩阵估计值。上面迭代过程中的函数f1,f2,f3等均可根据所选的下降搜索算法具体化,可供选的方法有sd算法,bb算法,cg算法等。具体的算法可以参考图5、图6和图7。采用本方法在所有场景下均有性能上的提高,可以从图1(a)-图1(f)反映出来。图8(a)-图8(f)比较了本发明与未使用预处理操作的含映射的下降搜索算法不同情境中误码率结果。可以发现,在理想信道下,无论用户规模有多大,本发明的2次迭代结果均与乔里斯基直接求逆法较为接近。即使考虑信道相关性,本发明的结果仍然比图1中结果要好的多。图9比较了用户数为32,基站天线为128的相关信道中不同预处理操作的误码率结果,可以看出即使少一次迭代,本发明与ic预处理的算法相比有超过2db的增益,更不用说性能更差的sp预处理算法。如果分析本发明的计算复杂度,以sd这种特定的下降搜索算法为例,表1的计算复杂度(这里只考虑所需要计算的复数乘法)显示,本发明的计算复杂度中由于不含u3项,相较直接求逆和ic预处理(其中icsd算法中的s表示预处理矩阵l中的0元素个数,具体的计算过程可参见参考文献[11])大大降低。(k表示选取的迭代次数)图10在基站端天线数和信噪比分别为128和5db时,对剩余的复杂度进行仿真,在用户数为88时,本发明较ic预处理的算法复杂度减小40%;当用户数接近100时,可以达到超过60%的复杂度优势。实现算法性能与复杂度的平衡。表1根据采用的下降搜索算法,可以选用相应的硬件模块,进行硬件实现,具体包括:分析迭代方法所涉及的运算,适当选取运算模块(单元)加以实现。可供选择的运算模块(单元)包括:(1)预处理模块:(a)检测矩阵a构造单元;可以由(u+1)u/2个处理单元(pe)组成,每个主要完成乘法累加操作。矩阵元素在横向上按对应的行标输入,在纵向上按对应的列标输入。每后一行(列)比前一行(列)延时一个时钟输入。一个时钟内每行(列)输入一个元素,在每个时钟下都有自左与自上两个方向的数据输入进来,非对角线的pe将这两个数据相乘,并与保存在本计算单元内的数据相累加,即完成一次计算操作。行对应hh,列对应h。对角线的除了做相同的乘法累加操作之外,还需要在每一行(列)累加结束后加上σ2。如图11。(b)矩阵l计算单元;根据l的计算公式可以先用查找表获得再用乘法阵列完成相乘(可以借用计算a的单元)。(c)计算(初始化)单元;与计算a的单元相类似,由u个非对角线处理单元组成。行对应hh,列对应y。(2)迭代模块:(a)三角矩阵处理单元;计算时,可以分成两步,先算再算z(j)=l-hu(j)。乘法可以借助计算的单元。l-1可以用图12对应的单元实现。假设ik是单位矩阵的第k列,lx=ik的解是l-1的第k列,根据这样的原理进行计算,需要2u2-u个时钟周期即可后的结果l-1。(b)内积单元;可以由乘法器组和一个u到1的加法树组成。(c)矩阵-向量乘法单元;可以借用计算的计算单元,也可以将其想象成一列内积,用上面的内积单元实现。(d)数乘单元;可以由乘法器组实现。(e)复数加法器;(f)寄存器;(g)查找表(look-uptable,lut);(3)输出模块:(a)映射单元;可以由比较器组和数据选择器组实现。(b)复数加法器;(c)寄存器。图13和14分别给出了sd算法的完整硬件架构和本发明的通用结构可供参考。使用xilinxvirtex-7xc7vx690tfpga对sd算法的实现结果可见图15、16。整个过程用定点仿真,输入和输出的量化长度均为16,对于乘法器输出为32。查找表使用256位地址,8bit输出形式。图15说明,量化的结果对性能损失较小。而图16的硬件比较体现了本发明的高吞吐率和硬件效率。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1