基于gs方法的大规模mimo检测方法及硬件架构的制作方法

文档序号:10555534阅读:1276来源:国知局
基于gs方法的大规模mimo检测方法及硬件架构的制作方法
【专利摘要】本发明公开了一种基于GS方法的大规模MIMO检测方法及硬件架构,信道矩阵和接收信号向量经过预处理模块后分别进入Neumann级数展开模块和GS方法模块;其中,预处理模块进行Gram矩阵计算、MMSE滤波矩阵计算和匹配滤波;Neumann级数展开模块取MMSE滤波矩阵进行2项近似求逆并与匹配滤波输出相乘得到GS迭代方法初始解;GS方法模块取MMSE滤波矩阵和匹配滤波输出分别作为系数矩阵和常数向量进行GS迭代求解线性方程组,每次迭代输出存入寄存器中,即为信号检测结果。本发明算法复杂度较低,所需迭代次数较少,硬件消耗较少,同时大大提高吞吐率。
【专利说明】
基于GS方法的大规模MI MO检测方法及硬件架构
技术领域
[0001] 本发明属于计算机通信领域,涉及一种大规模MMO系统上行链路信号检测方法及 硬件架构。
【背景技术】
[0002] 大规模MIMO(Large_scale Multiple-Input Multiple-Output或Massive ΜΙΜΟ) 系统最早由美国贝尔实验室Thomas L.Marzetta等研究人员提出。研究发现,当小区的基站 天线数目趋于无穷时,加性高斯白噪声和瑞利衰落等负面影响全都可以忽略不计,数据传 输速率能得到极大提高。在大规模MIMO系统中,基站配置大量的天线,天线数目通常有几 十、几百甚至几千根,是现有MMO系统天线数目的1~2个数量级以上,而基站所服务的用户 设备(User EqUipment,UE)数目远少于基站天线数目;基站利用同一个时频资源同时服务 若干个UE,充分发掘系统的空间自由度。
[0003] 虽然大规模MMO有着优越的性能,但是天线量级的巨大增幅带来了计算复杂度的 指数上升。目前已有多篇文章提出了大规模MIMO上行链路信号检测的算法及架构,其主要 的计算复杂度在于一个K XK阶矩阵的求逆,其中K为用户数。精确的矩阵求逆方法,如 ChoIesky分解法复杂度为0(K3)。那么当K的数量极大时,这样的求逆方案带来了巨大的计 算复杂度和硬件消耗。
[0004] 近几年,Linglong Dai等研究人员提出了基于Gauss-Seidel(GS)方法的软输出检 测算法,该算法主要采用GS迭代方法求解线性方程组,从而避免了复杂度较高的矩阵精确 求逆,所需的计算量为(i+l)K 2+4K,其中i为迭代次数。但他们的的方法收敛速度不够快,并 且没有给出基于GS方法的检测算法的具体硬件架构。

【发明内容】

[0005] 发明目的:针对现有技术中的不足,本发明提出一种复杂度低、高效率大规模MIMO 线性检测方法及硬件架构。
[0006] 技术方案:本发明提出一种基于GS方法的大规模MMO线性检测方法,包括以下步 骤:
[0007] 步骤1:将信道矩阵H和接收信号y经过预处理模块,得到匹配滤波器输出yMF = HHy 和MMSE滤波矩阵W=G+NJK,其中Gram矩阵G = HhH,N。为噪声方差,Ik为单位阵,(.)H为共辄转 置操作,注意W=D+L+L H,其中D为对角阵,L为下三角阵;
[0008] 步骤2:将矩阵D和Lh输入Neumann级数展开单元,得到矩阵W的2项近似逆矩阵 W2_i二ITi - U-其中E为W中的非对角阵,以及用于GS迭代的初始解sQ = Wfy%
[0009] 步骤3:将yMF,D,LH和St3输入GS方法模块,进行迭代求解,第i次迭代输出为S 1 = CD+ Lr1 (严-ΙΛΤ1),i = 1,2,…,即为待检测信号的估计结果。
[0010] 进一步,所述步骤3中的迭代次数i为1~4次。
[0011] 本发明还提出一种基于GS方法的大规模MMO线性检测的硬件架构,包括预处理模 块、Neumann级数展开模块和GS方法模块;其中,所述预处理模块用于计算Gram矩阵和匹配 滤波,包括由脉动阵列构成的匹配滤波器阵列、Gram矩阵计算阵列;所述Neumann级数展开 模块用于取MMSE滤波矩阵进行2项近似求逆并与匹配滤波输出相乘得到GS迭代方法初始 解,包括一个基于查找表(LUT)的倒数单元、一个向量加法阵列以及三种不同的乘法器阵列 mull,mU12,mul3;所述GS方法单元用于取MMSE滤波矩阵和匹配滤波输出分别作为系数矩阵 和常数向量进行GS迭代求解线性方程组,并将每次迭代输出存入寄存器中,即为信号检测 结果,包括一个求解三角阵逆矩阵的脉动阵列inv,两个矩阵-向量乘法阵列、一个向量加法 阵列以及一组寄存器,最终经过检测的信号将写入寄存器中,便于进行下一步的译码等操 作。
[0012]进一步,所述乘法器阵列mull包含2K个乘法器,其中K为用户数。
[0013] 进一步,所述乘法器阵列mul2包含4K个乘法器、2K个加法器。
[0014] 进一步,所述脉动乘法器阵列mul3包含2K个寄存器、4K个乘法器和4K个加法器。 [0015] 进一步,所述用于求解三角阵逆矩阵的脉动阵列inv使用2种处理单元(PE),包含 6K个寄存器、4K个乘法器和4K个加法器,以及1个倒数单元。
[0016] 本发明考虑到大规模MMO系统上行链路MMSE检测中滤波矩阵W为Hermitian正定 阵,采用GS迭代方法求解线性方程组作为整体检测算法基础,有效避免了复杂度高的矩阵 求逆过程,非常适合在硬件中的实现,大大降低了硬件复杂度,具体的,算法所需的复数乘 法次数为(i+3)K 2,i通常较小,因此算法复杂度为0(K2)。另一方面,由于初始解对迭代方法 的收敛速度有着明显的影响,本发明采用Neumann级数近似逆矩阵与匹配滤波器输出相乘 得到近似于精确解的初始解,从而显著提高迭代方法收敛速度。
[0017] 有益效果:与现有技术相比,本发明重点考虑了计算复杂度和算法性能,而且本发 明的硬件复杂度较低;同时,迭代计算可以得到任意精度的准确度,迭代次数的改变灵活, 为性能需求不同的场合提供了更好的灵活性,且此时精确度的调整只与迭代次数有关,即 只与吞吐量大小有一定关系,并不影响硬件构架。本发明还大大提高了吞吐率。
【附图说明】
[0018] 图1为本发明的基于GS方法的大规模MBTO检测算法的硬件架构示意图;
[0019]图2为本发明的Neumann级数展开单元向量级的结构示意图;
[0020] 图3为本发明的用于求解三角阵逆矩阵的脉动阵列inv结构示意图;
[0021] 图4为发射天线数为8,接收天线数为128时,本发明信号检测算法和其他检测算法 的误码率曲线对比图;
[0022] 图5为发射天线数为16,接收天线数为128时,本发明信号检测算法和其他检测算 法的误码率曲线对比图;
[0023] 图6为采用本发明初始解的GS迭代方法和其他初始解的GS迭代方法来检测信号的 误码率曲线对比图。
【具体实施方式】
[0024] 下面结合具体实施案例,进一步阐明本发明,应理解这些实施例仅用于说明本发 明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等 价形式的修改均落于本申请所附权利要求所限定的范围。
[0025] 本实施例中建立一个大规模MMO信道模型进行模拟操作。在大规模MMO系统中, 一般有N?K(基站天线数N远大于发射天线数,即用户数K)。首先K个不同用户产生的并行传 输比特流分别通过信道编码进行编码,然后映射到星座符号,并采取星座图集合能量归一 化。设 8=[81,82,83,一,81^表示信号向量, 8中包含了分别从1(个用户产生的传输符号,采用 16-QAM方式映射。H表示维度是NXK信道矩阵,故上行链路基站端的接收信号向量y可以表 示为:
[0026] y = Hs+n
[0027] 其中,y的维度为NX I,n为NX 1维的加性白噪声向量,其元素服从零均值方差为N。 的高斯分布。上行链路多用户信号检测任务就是从接收机接收向量 计传输信号符号S。
[0028] 假设H已知,其元素服从均值为0方差为1的独立同分布,采用最小均方误差(MMSE) 线性检测理论,对传输信号向量的估计表示为:
[0029] s = (Hh:H +.??)-1H1V = W 一繼'
[0030] 其中,矩阵W为Hermi t ian正定,且W = D+L+LH,其中D,L和Lh分别为W的对角线、下三 角和上三角分量。
[0031] 根据GS方法求解线性方程组:
[0032] Ws = yw
[0033] 第i次迭代所得的检测结果为:
[0034] si=(D+L)-1Li = I,2,···,
[0035] 显然迭代的初始解St3对最终的收敛速率有较大影响,为了使初始解足够接近精确 解但同时不提高算法复杂度,我们采用2项的Neumann级数近似W的逆矩阵,从而得到所提出 的初始解:
[0036] s0=w2-Vmf
[0037] 其中,Wf1 = D-1 - D-1ED-1,E为W中的非对角分量。
[0038] 对于天线配置为128 X 8和128 X 16的大规模MMO系统,采用3/4速率Turbo码以及 16-QAM映射,所述基于GS方法的大规模M頂0检测算法的仿真结果见图4、图5和图6。图4为发 射天线数为8,接收天线数为128时,本发明信号检测算法和其他检测算法的误码率曲线对 比图,从图中的结果可以看出,本发明信号检测算法(标记为GS)在迭代次数为1时的性能已 经优于传统Neumann级数近似求逆算法(标记为Neumann)在展开项数为3(对应于迭代次数 为3)时的性能;本发明信号检测算法在迭代次数为2时的性能非常接近基于Cholesky分解 的精确求逆算法(标记为MMSE),显示了GS算法在迭代速度方面的优越性。同样地,图5为发 射天线数为16,接收天线数为128时,本发明信号检测算法和其他检测算法的误码率曲线对 比图,可以观察到此时GS算法在迭代次数为1时的性能和Neumann算法在迭代次数为4时的 性能相近,但在信噪比大于IldB时收敛不明显;但GS算法在迭代次数为2时的性能非常接近 于精确的Cholesky算法。图6为采用本发明初始解的GS迭代方法和其他初始解的GS迭代方 法来检测信号的误码率曲线对比图,可以看出,在不计算初始解的情况下(即S t3为0),传统 的GS算法在迭代次数比较小(如1和2)时,检测效果非常不理想;在由Linglong Dai等人提 出的GS算法中,迭代的初始解被设置为St3 = T1y,此时检测效果获得一定提升;而采用本发 明初始解的GS迭代方法在迭代次数为1时的性能相当于初始解为O的GS方法在迭代次数为2 时的性能,且本发明初始解的GS迭代方法在相同的迭代次数的情况下的检测效果总是优于 上述Linglong Dai等人提出的GS算法,这体现了本发明检测算法在收敛速度方面优于目前 已有的GS方法。
[0039]硬件架构方面,本实施例中采用的基于GS方法的大规模MMO检测的硬件架构示意 图见图1,其中包括预处理模块、Neumann级数展开模块(图2)和GS方法模块。
[0040] 具体来说,在预处理模块中,包含:
[0041] 1)匹配滤波器模块:由K个复数乘法累加器(MAC)组成的脉动阵列,用于计算yMF = HHy ;
[0042] 2)Gram矩阵计算模块:由(1+Κ)Κ/2个MAC组成的下三角脉动阵列,用于计算G = HhH。
[0043] 在Neumann级数展开模块中,包含:
[0044] 1)乘法器阵列mull:包含2K个乘法器;
[0045] 2)乘法器阵列mul2:包含4K个乘法器、2K个加法器,联合mull用于计算-D-1ED 一 S
[0046] 3)乘法器阵列mul3:包含2K个寄存器、4K个乘法器和4K个加法器,用于计算 S0 = W2-1Ymf.
[0047]在GS方法模块中,包含:
[0048] 1)矩阵-向量乘法阵列:由K个MAC组成的脉动阵列;
[0049] 2)求解三角阵逆矩阵的脉动阵列inv:结构图见图3,使用2种PE,包含6K个寄存器、 4K个乘法器和4K个加法器,以及1个倒数单元,用于计算下三角阵(D+L)的逆矩阵。
【主权项】
1. 一种基于GS方法的大规模MIMO线性检测方法,其特征在于,包括如下步骤: 步骤1:将信道矩阵H和接收信号y经过预处理模块,得到匹配滤波器输出/P = HHy和 MMSE滤波矩阵W = G+NdIk,其中Gram矩阵G = hHh,N。为噪声方差,Ik为单位阵,(.)哨共辆转置 操作,注意W=D+L+lH,其中D为对角阵,L为下S角阵; 步骤2:将矩阵D和LH输入Neumann级数展开单元,得到矩阵W的2项近似逆矩阵其中E为W中的非对角阵,W及用于GS迭代的初始縮步骤3:将/^,0,1^呵日3*^输入65方法模块,进行迭代求解,第1次迭代输出为31=(0+1^厂1 (严-lV-1),i = 1,2,…,即为待检测信号的估计结果。2. 根据权利要求1所述的基于GS方法的大规模MIMO线性检测方法,其特征在于,所述步 骤3中的迭代次数i为1~4次。3. -种基于GS方法的大规模MIMO线性检测的硬件架构,其特征在于:包括预处理模块、 化皿ann级数展开模块和GS方法模块; 其中,所述预处理模块用于计算Gram矩阵和匹配滤波,包括由脉动阵列构成的匹配滤 波器阵列、Gram矩阵计算阵列; 所述化umann级数展开模块用于取MMSE滤波矩阵进行2项近似求逆并与匹配滤波输出 相乘得到GS迭代方法初始解,包括一个基于查找表(LUT)的倒数单元、一个向量加法阵列W 及S种不同的乘法器阵列mull ,mul2,mul3; 所述GS方法单元用于取MMSE滤波矩阵和匹配滤波输出分别作为系数矩阵和常数向量 进行GS迭代求解线性方程组,并将每次迭代输出存入寄存器中,即为信号检测结果,包括一 个求解=角阵逆矩阵的脉动阵列inv,两个矩阵-向量乘法阵列、一个向量加法阵列W及一 组寄存器,最终经过检测的信号将写入寄存器中,便于进行下一步的译码等操作。4. 根据权利要求3所述的基于GS方法的大规模MIMO线性检测的硬件架构,其特征在于: 所述乘法器阵列mull包含2K个乘法器,其中K为用户数。5. 根据权利要求3所述的基于GS方法的大规模MIMO线性检测的硬件架构,其特征在于: 所述乘法器阵列mul2包含4K个乘法器、2K个加法器,其中K为用户数。6. 根据权利要求3所述的基于GS方法的大规模MIMO线性检测的硬件架构,其特征在于: 所述脉动乘法器阵列mul3包含2K个寄存器、4K个乘法器和4K个加法器,其中K为用户数。7. 根据权利要求3所述的基于GS方法的大规模MIMO线性检测的硬件架构,其特征在于: 所述用于求解S角阵逆矩阵的脉动阵列inv使用巧巾处理单元(PE),包含6K个寄存器、4K个 乘法器和4K个加法器,W及1个倒数单元,其中K为用户数。
【文档编号】H04L1/00GK105915477SQ201610243953
【公开日】2016年8月31日
【申请日】2016年4月19日
【发明人】张川, 吴至榛, 尤肖虎
【申请人】东南大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1