基于伴随矩阵的正定Hermite矩阵求逆的硬件架构及实现方法

文档序号:6368894阅读:253来源:国知局
专利名称:基于伴随矩阵的正定Hermite矩阵求逆的硬件架构及实现方法
技术领域
本发明涉及矩阵求逆的硬件结构及实现方法,具体是指基于伴随矩阵的正定Hermite矩阵求逆的硬件架构及实现方法。
背景技术
MM0,即多输入多输出,是一种用来描述多天线的无线通信系统的抽象数学模型,近年来成为新一代移动通信的研究热点,而MMO的信号检测是MMO中重点突出的问题,其中MMO信号检测算法中,大多数算法需要对信道矩阵H进行伪逆矩阵的计算,H的伪逆矩阵可以表示为
H+ = (HhH) ^1Hh上式中,上标“H”表示矩阵的共轭转置。令A = HhH,则A为正定Hermite矩阵,大部分MMO信号检测算法的硬件实现中,需要寻求快速有效并且复杂程度较低的正定Hermite矩阵求逆方法,即求出A的逆矩阵^1,从而节约硬件成本,提高运算速度,缩短MIMO信号检测分析时间。目前在硬件平台中主要是基于矩阵分解的方法或者基于伴随矩阵的方法对矩阵进行求逆。基于矩阵分解的求逆方法主要有三大类LU分解求逆、QR分解求逆和Cholesky分解求逆。其中LU分解求逆过程中需要进行多次进行除法运算,在实现时会因多次除法的操作而增加硬件开销,而且还将引入较大的处理延时;QR分解求逆过程中计算量较大,在硬件实现上会损耗较高的资源;CholeSky需要进行开方运算,不利于数据的高速处理。所以基于矩阵分解的求逆方法在硬件上耗费资源并且数据处理量较大,不利于数据的高速处理。

发明内容
本发明的目的在于克服通过矩阵分解方法对正定Hermite矩阵进行求逆在硬件上耗费资源并且数据处理量较大,不利于数据高速处理的缺陷,提供一种基于伴随矩阵的正定Hermite矩阵求逆的硬件架构及实现方法。本发明的目的通过下述技术方案实现基于伴随矩阵的正定Hermite矩阵求逆的硬件架构,由如下硬件组成用于调整原矩阵元素结构的输入数据调整模块;接收矩阵并内置有二阶行列式计算器的二阶行列式计算模块;接收矩阵并内置有三阶行列式计算器的三阶行列式计算模块;调节二阶行列式计算模块与三阶行列式计算模块之间通信并向三阶行列式计算模块输出矩阵的二阶行列式调整模块;接收矩阵并内置有四阶行列式计算器的四阶行列式计算模块;调节三阶行列式计算模块与四阶行列式计算模块之间通信并向四阶行列式计算模块输出矩阵的三阶行列式调整模块;内置有逆矩阵计算器并接收四阶行列式计算模块与三阶行列式调整模块输出矩阵的逆矩阵计算模块。进一步的,所述四阶行列式计算模块与逆矩阵计算模块之间还连通有模块选通信号。更进一步的,所述二阶行列式计算模块内置有至少一个二阶行列式计算器,同时所述三阶行列式计算模块内置有至少一个三阶行列式计算器。同时,所述二阶行列式计算器、三阶行列式计算器、四阶行列式计算器以及逆矩阵计算模块中均设置有实数乘法器和/或复数乘法器。再进一步的,所述正定Hermite矩阵为四阶以下矩阵。 基于伴随矩阵的正定Hermite矩阵求逆的实现方法,包括下列步骤(a)输入原矩阵到输入数据调整模块;(b) 二阶行列式计算模块通过对输入数据调整模块输出的矩阵进行归并计算,得到11个二阶行列式;(C)三阶行列式计算模块通过对调整后二阶行列式组成的矩阵与输入数据调整模块输出的矩阵进行归并计算,得到所述原矩阵的伴随矩阵;(d)四阶行列式计算模块通过对调整后伴随矩阵的第一行元素与输入数据调整模块输出的矩阵进行计算,得到所述原矩阵的行列式;(e)逆矩阵计算模块通过接收所述伴随矩阵以及所述行列式计算出逆矩阵。其中步骤(b)具体包括(bl)输入数据调整模块将输入的原矩阵A调整为矩阵D2并输出到二阶行列式计算模块;(b2) 二阶行列式计算模块对二阶行列式的计算按4个为一组进行归并,二阶行列式调整模块将计算出的二阶行列式元素排列结构调整为矩阵D23 ;(b3)将矩阵D23发送到三阶行列式计算模块。进一步的,步骤(C)具体包括(Cl)将D23与输入数据调整模块输出的矩阵D3在时序上对齐,三阶行列式计算模块接收对齐后的矩阵D23与D3并计算;(c2)三阶行列式调整模块将计算出的三阶行列式的元素结构调整为伴随矩阵k*以及A*的第一行,并分别发送至逆矩阵计算模块以及四阶行列式计算模块。更进一步的,所述步骤(d)具体包括(dl)将输入数据调整模块的输出矩阵D4与k*的第一行在时序上对齐,四阶行列式计算模块接收k*的第一行与D4并计算;
Loose] (d2)四阶行列式计算模块将结果|a|发送到逆矩阵计算模块。再进一步的,所述步骤(e)中逆矩阵计算模块接收A*和|A|并计算,输出最终结果A 1。本发明较现有技术相比,具有以下优点及有益效果(I)本发明是基于伴随矩阵的求逆方法对正定Hermite矩阵进行求逆,在硬件上省掉了开方运算器,并且减少了乘法器与除法器,节约了大量成本;
(2)本发明充分利用Hermite矩阵的性质,即A = AH,优化了设计架构,在计算伴随矩阵时只需求其上三角的10个元素,并且将通过寻找规律,将二阶行列式的计算个数减少到11个,只需进行4次延时,提高了数据的处理速度,减少了计算时间;(4)本发明采用原矩阵的4路并行输入以及逆矩阵的4路并行输出,具有较高的并行度,每4个时钟输入一个完整的矩阵,缩短了每次延时时间,并且通过对二阶行列式以及三阶行列式的计算进行归并,实现了并行流水,简化设计结构,大大降低了对硬件的需求,使本发明具有较高的数据吞吐率。(5)本发明设计架构中还连通有模块选通信号,可以使四阶行列式计算模块与逆矩阵计算模块失效,让本发明同时适用于求逆矩阵和求伴随矩阵的两种工程场合。


图I为本发明的整体硬件架构图。图2为本发明的计算过程定点示意图。图3为本发明中矩阵A的调整模块时序图。图4为本发明中二阶行列式计算器的结构图。图5为本发明中二阶行列式计算模块的结构图。图6为本发明中三阶行列式计算器的结构图。图7为本发明中三阶行列式计算模块的结构图。图8为本发明中四阶行列式计算模块的结构图。图9为本发明中逆矩阵计算模块的结构图。图10为本发明中二阶行列式调整模块的时序图。图11为本发明中三阶行列式调整模块的时序图。图12为本发明中Matlab浮点仿真与Verilog HDL定点仿真比较图。图13为本发明的系统流程图。
具体实施例方式下面结合实施例对本发明作进一步的详细说明,但本发明的实施方式不限于此。实施例I本发明-实施例中,使用Matlab仿真正定Hermite矩阵求逆的硬件结构以及实现的过程。当MIMO系统中天线配置为4X4的信道矩阵时,设信道矩阵H是均值为0,方差为I的4阶随机复矩阵,由H生成4阶正定Hermite矩阵A, A = Ah,则写成Matlab代码为n = 4 ;H = (randn (n, n) + lj*randn (n, n)) /sqrt (2);A = H,*H ;用(yl, y2, y3)表不一个定点数,其中yl为符号位,取值为0时表不无符号,取值为I时表示有符号,12表示整数部分的位宽,y3表示小数部分的位宽。当矩阵A以(1,5,9)的定点形式输入时,如图13所示,工作过程如下4阶正定Hermite矩阵A,由Hermite矩阵的性质,矩阵元素% = Uj,,将A表示为
权利要求
1.基于伴随矩阵的正定Hermite矩阵求逆的硬件架构,其特征在于,由如下硬件组成 用于调整原矩阵元素结构的输入数据调整模块; 接收矩阵并内置有二阶行列式计算器的二阶行列式计算模块; 接收矩阵并内置有三阶行列式计算器的三阶行列式计算模块; 调节二阶行列式计算模块与三阶行列式计算模块之间通信并向三阶行列式计算模块输出矩阵的二阶行列式调整模块; 接收矩阵并内置有四阶行列式计算器的四阶行列式计算模块; 调节三阶行列式计算模块与四阶行列式计算模块之间通信并向四阶行列式计算模块输出矩阵的三阶行列式调整模块; 内置有逆矩阵计算器并接收四阶行列式计算模块与三阶行列式调整模块输出矩阵的逆矩阵计算模块。
2.根据权利要求I所述的基于伴随矩阵的正定Hermite矩阵求逆的硬件架构,其特征在于,所述四阶行列式计算模块与逆矩阵计算模块之间还连通有模块选通信号。
3.根据权利要求2所述的基于伴随矩阵的正定Hermite矩阵求逆的硬件架构,其特征在于,所述二阶行列式计算模块内置有至少一个二阶行列式计算器,同时所述三阶行列式计算模块内置有至少一个三阶行列式计算器。
4.根据权利要求3所述的基于伴随矩阵的正定Hermite矩阵求逆的硬件架构,其特征在于,所述二阶行列式计算器、三阶行列式计算器、四阶行列式计算器以及逆矩阵计算模块中均设置有实数乘法器和/或复数乘法器。
5.根据权利要求4所述的基于伴随矩阵的正定Hermite矩阵求逆的硬件架构,其特征在于,所述正定Hermite矩阵为四阶以下矩阵。
6.基于伴随矩阵的正定Hermite矩阵求逆的实现方法,其特征在于,包括下列步骤 (a)输入原矩阵到输入数据调整模块; (b)二阶行列式计算模块通过对输入数据调整模块输出的矩阵进行归并计算,得到11个二阶行列式; (C)三阶行列式计算模块通过对调整后二阶行列式组成的矩阵与输入数据调整模块输出的矩阵进行归并计算,得到所述原矩阵的伴随矩阵; (d)四阶行列式计算模块通过对调整后的伴随矩阵的第一行元素与输入数据调整模块输出的矩阵进行计算,得到所述原矩阵的行列式; (e)逆矩阵计算模块通过接收所述伴随矩阵以及所述行列式计算出逆矩阵。
7.根据权利要求6所述的基于伴随矩阵的正定Hermite矩阵求逆的实现方法,其特征在于,所述步骤(b)具体包括 (bl)输入数据调整模块将输入的原矩阵A调整为矩阵D2并输出到二阶行列式计算模块; (b2) 二阶行列式计算模块对二阶行列式的计算按4个为一组进行归并,二阶行列式调整模块将计算出的二阶行列式元素排列结构调整为矩阵D23 ; (b3)将矩阵D23发送到三阶行列式计算模块。
8.根据权利要求7所述的基于伴随矩阵的正定Hermite矩阵求逆的实现方法,其特征在于,所述步骤(c)具体包括(Cl)将D23与输入数据调整模块输出的矩阵D3在时序上对齐,三阶行列式计算模块接收对齐后的矩阵D23与D3并计算; (c2)三阶行列式调整模块将计算出的三阶行列式的元素结构调整为伴随矩阵A*以及A*的第一行,并分别发送至逆矩阵计算模块以及四阶行列式计算模块。
9.根据权利要求8所述的基于伴随矩阵的正定Hermite矩阵求逆的实现方法,其特征在于,所述步骤(d)具体包括 (dl)将输入数据调整模块的输出矩阵D4与k*的第一行在时序上对齐,四阶行列式计算模块接收A*的第一行与D4并计算; (d2)四阶行列式计算模块将结果|A|发送到逆矩阵计算模块。
10.根据权利要求9所述的基于伴随矩阵的正定Hermite矩阵求逆的实现方法,其特征在于,所述步骤(e)中逆矩阵计算模块接收A*和|A|并计算,输出最终结果A—1。
全文摘要
本发明公开了基于伴随矩阵的正定Hermite矩阵求逆的硬件架构及实现方法,主要由输入数据调整模块,二阶行列式计算模块,二阶行列式调整模块,三阶行列式计算模块,三阶行列式调整模块,四阶行列式计算模块以及逆矩阵计算模块组成,本发明在对三阶行列式进行展开时二阶行列式的求解个数减少到11个,并且实现了二阶行列式与三阶行列式的归并计算方式,缩短了计算时间,耗费硬件资源少,结构简单,非常适合推广使用。
文档编号G06F17/16GK102662918SQ201210132150
公开日2012年9月12日 申请日期2012年4月28日 优先权日2012年4月28日
发明者何春, 吴昌强, 李玉柏, 莫明威 申请人:电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1