一种适用于MIMO系统MMSE检测的LDLT分解装置与方法与流程

文档序号:15151478发布日期:2018-08-10 21:08阅读:612来源:国知局
本发明涉及种ldlt分解的硬件电路
技术领域
:,具体是一种适用于mimo系统mmse检测的ldlt分解装置与方法。
背景技术
::多输入多输出(multiple-inputmultiple-output,mimo)技术是现代通信技术的核心技术之一。而mimo系统中的检测算法则是整个系统中非常重要的一环。检测算法是将接收向量还原回发射信号的算法。在众多检测算法中,最小均方差估计方法(minimummeansquareerror,mmse)是非常常见的一种线性检测算法。根据信道矩阵和噪声能量,mmse检测可以保证对发射向量的估计与发射向量之间的均方差最小。但是mmse检测中包含了矩阵求逆,由于矩阵求逆的复杂度是其维度的3次方,这就对硬件实现具有一定的挑战性。在保证性能的情况下,如何设计高吞吐率、低资源消耗的检测器成为了mimo技术研究的一个难点。发射端和接收端的天线数量均较少的一般mimo系统的信道不具有信道硬化的性质,因而在矩阵求逆上通常采用直接法,即利用各种矩阵分解将待求逆矩阵分解为较容易求逆的形式再进行求逆。因此选择高性能、低复杂度的矩阵分解方法对于mimo系统中的mmse检测而言至关重要。由于待求逆矩阵的共轭对称性,在mmse检测中使用ldlt分解可以节省较多的硬件资源。但是传统的ldlt分解算法中包含了除法,不仅硬件资源开销大,而且由于除法器延时过长,而算法本身有数据依赖性,导致系统整体延时过长,寄存器消耗过多等问题,这极大限制了ldlt算法的应用。以上问题的存在,对缩减硬件开销,优化算法,降低延时提出了更高的要求,否则难以满足各类mimo系统对吞吐率,硬件消耗,延时等性能的要求。经检索发现,中国专利公开号为:201710800576.x,名称为:基于ldlt分解的大规模mimo系统预编码实现方法,公开日期为:2017.09.07,该技术提出了一种基于ldlt分解的大规模mimo系统预编码实现方法,用以解决现有技术中系统误码率高、计算复杂度高、资源占用大的问题。但是其着重于将ldlt分解用于预编码技术,仍然采用的是传统的ldlt算法,并且没有给出硬件实现架构,仍然存在硬件开销、系统延时方面问题。还有一些其他专利也同样只是对ldlt进行了应用,并没有给出优化后的硬件架构,同样存在以上问题。技术实现要素:本发明的目的是克服上述现有技术的缺点,提出一种适用于mimo系统mmse检测的ldlt分解方法。为了保证系统的吞吐率,采用脉动阵列结构实现ldlt分解算法,针对分解算法中存在的除法,将其改写为求倒和乘法,避免了直接使用除法器,减少了系统延时。同时对时序进行了安排,将求倒数结构进行分时复用,大大减少了求倒数结构的硬件开销。本发明的技术解决方案如下:一种适用于mimo系统mmse检测的ldlt分解装置,其特点在于,包括:gram矩阵计算模块,用于获取信道矩阵h和噪声能量σ2,并求取hhh+σ2i,其中i是单位矩阵;ldlt分解模块,用于将hhh+σ2i分解得到单位下三角矩阵l和对角矩阵d的逆矩阵d-1;l矩阵求逆模块,用于单位下三角矩阵l求逆;hmem模块,用于存储信道矩阵h;l-1mem模块,用于存储ldlt分解模块输出的d-1和l矩阵求逆模块的输出结果l-1;gmmsey模块,用于将(l-1)hd-1l-1hh与mimo系统的接收信号y相乘,得到对发mimo系统的接收信号y向量x的估计值llr模块,用于对gmmsey模块输出矩阵进行软判决译码。所述的ldlt分解模块包括:边界处理单元,负责对输入矩阵相应列的对角元素求倒数,并将该列其他元素乘以此倒数;内部处理单元,负责对边界处理单元所选列向量右侧的矩阵元素进行更新。所述的边界处理单元包含求倒数结构和复数乘法器,所述的求倒数结构使用查找表求值的方法,利用sbtm减小查找表的大小,并对查找表进行了压缩。所述的内部处理单元包含乘累加结构。一种适用于mimo系统mmse检测的ldlt分解方法,包括以下步骤:步骤一:将信道矩阵h和噪声能量σ2输入gram矩阵计算模块,求取hhh+σ2i,其中i是单位矩阵;步骤二:将信道传递矩阵h存储于hmem模块中;步骤三:将hhh+σ2i输入ldlt分解模块,得到ldlt分解后的单位下三角矩阵l和对角矩阵d的逆矩阵d-1;步骤四:将三角矩阵l输入l矩阵求逆模块,得到逆矩阵l-1,并将l-1与d-1存储在l-1mem中;步骤五:将信道矩阵h与d-1、l-1输入gmmsey模块,求得(l-1)hd-1l-1hhy。步骤六:将步骤五的结果输入llr模块,进行软判决译码。下面将介绍步骤四中的ldlt分解模块,包括其算法及硬件结构。假设a是待分解的n维共轭对称矩阵,ldlt分解的形式为a=ldlh,其中l是单位下三角矩阵,lh是其共轭转置矩阵,d为对角矩阵。由于a本身具有共轭对称性,所以其下三角矩阵已经包含了整个矩阵的信息。因此下述算法的输入为a的下三角矩阵,输出同样为下三角矩阵。输出矩阵的对角线上的元素构成d,其余元素构成l的非对角元素,由于l是单位下三角矩阵,所以其对角元素无需存储。首先需要确定相邻两次求倒数所需的时间t,使得k×n=(m-1)×t没有整数解,其中k是任意整数,m是2到n之间的任意整数。这可以利用缓存器实现。步骤一:利用求倒数结构对矩阵a的第一行第一列进行求倒数操作。步骤二:矩阵a第一列的第二到n行保存到寄存器中。步骤三:利用复数乘法器将矩阵a第一列的第二到n行分别乘以步骤一得到的结果。步骤四:利用复数乘法器求出步骤二保存到寄存器中的矩阵a第一列的第二到n行分别乘以矩阵a第二行第一列元素的共轭的乘积。步骤五:利用减法器将矩阵a第二列的第二到n行分别减去步骤四得到的值。步骤六:重复步骤四,利用复数乘法器求出步骤二保存到寄存器中的矩阵a第一列的第三到n行分别乘以矩阵a第三行第一列元素的共轭的乘积。步骤七:重复步骤五,利用减法器将矩阵a第三列的第三到n行分别减去步骤四得到的值。以此类推,不断重复步骤四和步骤五,直到a的第n列。步骤八:输出矩阵a的第一列。步骤九:将矩阵a剩下的元素看成n-1维矩阵,重复步骤一到步骤八。直到矩阵a全部输出。其伪代码形式的算法如图6所示。下面介绍求倒数结构:求倒数结构使用查找表求值的方法,利用sbtm(symmetricbipartitetablemethod)减小查找表的大小。该算法需要将输入数据x符号位以外的位划分为4个部分x0,x1,x2和x3,其位宽分别为n0,n1,n2和n3。x0,x1和x2构成有效数据,x3是被截掉的尾数。之后,需要将(x0,x1)和(x0,x2)分别作为查找表的输入在两个查找表中查得两个值,最后将两个值相加得到最终结果。两个查找表存储的值分别用以下公式求得:a0(x0,x1)=1/(1+x0+x1+δ2+δ3)(9)a1(x0,x2)=(δ2-x2)/(1+x0+δ1+δ2+δ3)2(10)其中:因此,只需要将a0和a1存入两个查找表。同时由于存放a1的查找表中的数值具有一定的对称性,该查找表的大小还能再压缩一半。在进行存储时,输入位宽可以舍去x2的最高位,查找表大小缩小为一半。在进行查找时,先判断x2的最高位是0还是1,若为0,则直接查找;若为1,则先将x2其余位取补码再查找,将查到的值再取补码作为结果。本发明与现有技术相比的优势是:1.采用脉动阵列,提高了系统吞吐率。2.用求倒数结构代替了除法器,大大降低了系统延时。3.对求倒数结构进行了完全的分时复用,大大降低了硬件开销。附图说明图1基于ldlt分解的mmse检测模块整体架构图2ldlt分解模块架构图3ldlt分解模块的bpe结构图4求倒数结构及利用sbtm算法优化后的查找表细节示意图图5ldlt分解模块的ipe结构图6ldlt分解算法具体实施方式下面首先对基于ldlt分解的mmse检测模块整体架构进行说明,结构框图如图1所示。本发明提出的ldlt分解装置的硬件实现结构并不局限于mimo系统,任何涉及ldlt分解的系统均适用。对于输入矩阵也不局限于共轭对称矩阵,对于非共轭对称矩阵,只需进行相应的拓补即可。以下结合硬件电路结构和算法流程来说明本发明的具体实施方式。本实施例由四部分组成:包含求倒数结构和复数乘法器的bpe、乘累加结构ipe、以及存储单元。设n维共轭对称矩阵a的下三角元素为:步骤一:确定相邻两次求倒数所需的时间t,使得k×n=(m-1)×t没有整数解,其中k是任意整数,m是2到n之间的任意整数。步骤二:将a的第一列输入到bpe结构中,实现图6伪代码中的(2)式与(4)式,得到矩阵a为:bpe结构有两个输出,输出1输出所得矩阵的第一列,输出2输出没有做任何处理的,即原矩阵a的第一列的第2到n行元素,即a21到an1。将输出1保存在存储单元中。步骤三:将步骤二输出1,输出2与矩阵a下三角元素的第二列输入ipe1结构,完成伪代码操作中的(6)式。得到矩阵:步骤四:步骤二的输出1即所求矩阵的第一列。将步骤三所得矩阵的下三角矩阵的二到n列降维成n-1维矩阵,重复以上步骤,直至n列元素全部输出。输出矩阵被保存在存储单元中,其对角线元素构成ldlt分解后的矩阵d,其余元素构成ldlt分解后矩阵l的非对角元素。图3是图2中包含求倒数结构结构和复数乘法器的边界处理单元(boundaryprocessingelement,bpe)模块硬件结构图。图4是图3中求倒数结构及利用sbtm算法优化后的查找表细节示意图。图5是图2中包含复数乘累加结构的内部处理单元(internalprocessingelement,ipe)结构图。最后应当说明的是:以上实施实例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求范围当中。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1