一种适用于基带处理系统的矩阵分解方法及实现装置的制作方法

文档序号:7926174阅读:201来源:国知局
专利名称:一种适用于基带处理系统的矩阵分解方法及实现装置的制作方法
技术领域
本发明涉及的是在通信领域中一种适用于基带处理系统的矩阵分解方法及实现 装置,尤其涉及的是在移动通讯领域中一种适用于TD-SCDMA(Time Division-Synchronous Code Division Multiple Access-时分同步的码分多址)基带处理系统的Cholesky矩阵 分解方法及实现装置。
背景技术
在现有技术TD-SCDMA移动通信基带处理系统中,采用联合检测作为基带处理技 术。联合检测的基本思想是充分利用MAI (Multiple AccessInterference-多址干扰)中 的先验信息将所有用户信号进行分离,从而达到消除干扰提取本用户信息的目的。
在联合检测中,使用最小均方误差线性块均衡(匪SE-BLE-MinimumMean-Square Error-Block Linear Equalizer)算法得到用户信号的估计值可以表示为
<formula>formula see original document page 4</formula> ,其中A是由信道估计和激活码道检测得到包含用户有效码道的系统 矩阵,I为单位矩阵,e是接收机接收到的总信号向量,02为噪声功率的估计值,;是接收机 对发送数据的估计值。为了避免对相关矩阵(A"A+o2l,用R表示,为一对称正定矩阵)的 求逆运算,通常先对相关矩阵R进行Cholesky矩阵分解,然后再通过前后向替代来完成J 的计算。 Cholesky矩阵分解作为联合检测中的重要的一步,需要充分考虑其运行时间、 逻辑资源的消耗,以及实现的复杂程度等问题。以16个激活码道的情况为例,需要进行 Cholesky矩阵分解的相关矩阵的大小为352*352。对这么大的一个矩阵如果要进行完全的 Cholesky矩阵分解,则其运算量大,需要消耗的时间长、占用的资源多;因此对于终端设备 功耗与性能一定的情况下,在不显著降低性能的条件下,需要对Cholesky矩阵分解方案进 行优化。 因此,现有技术还有待改进和提高!

发明内容
本发明的目的在于提供一种适用于基带处理系统的矩阵分解方法及实现装置,通 过对Cholesky矩阵进行近似分解及采用相应的实现装置,达到使Cholesky矩阵分解运算 量减小,运算时间縮短,资源节省,产品成本降低之目的。
本发明的技术方案包括 —种适用于基带处理系统的矩阵分解方法,在移动通信基带处理系统中,使用最 小均方误差线性块均衡算法得到接收机对发送数据的估计值;在求解所述估计值时,对所 述估计值的相关矩阵进行Cholesky分解的过程包括 A、在相关矩阵R的左上角取一个小矩阵,所述R为M阶对称正定方阵,所述小矩阵 为2N阶方阵,M与2N的比值为正整数;
B、将所述小矩阵分解为一个2N阶单位下三角方阵L、一个所述L的共轭转置方阵 !^以及一个2N阶对角方阵D;C、获得一个2N阶下三角方阵H,所述H的对角线元素hjj等于所述D的对角线元
素djj,所述H的非对角线元素hu等于所述L的非对角线元素I".; D、根据所述H进行数据重构,获得所述R进行Cholesky分解的下三角阵B。 其中所述步骤C还包括所述H的求解过程为 所述H的第一列元素按下面公式求得 100 = r00 li0 = ri0/r00, i = 1, 2N-1 ;
其它2N-1列元素按下面公式求得
forj = 1 :2N_1{
for k = 1 :j-l{vk = lkk ljk} ^ "力,》,.V: 其中r。。为所述R位于第一行第一列的元素;lij为所述L位于第i-1行第j-1列 的元素;djj为所述D位于第j-1行第j-1列的元素;vk为中间变量,vk*为vk的共轭。
其中所述H的求解过程用装置按下述方法实现对于所述H的第一列元素,不需要 乘累加运算;对于所述H的对角线元素,需要矢量运算、乘累加运算和倒数计算;对于非第 一列位置且不在对角线上的元素,只需要乘累加运算。
其中所述步骤D中的数据重构过程包括以下步骤 Dl、将所述H填充在所述B的左上角,并将所述H的下三角部分的元素分为二个元 素块左上角N行元素构成的三角型元素块以及其下方N行元素构成的直角梯型元素块;
D2、用所述直角梯型元素块作为重复填充模块沿所述B的对角线,从所述H的相邻 下方开始依次填充2N-2个所述直角梯型元素块,所述B的未填充部分的元素为零。
其中所述步骤A中的小矩阵可等分为四个次小方阵,位于左上角N阶次小方阵R。 等于右下角N阶次小方阵;位于左下角为N阶次小方阵&,右上角N阶次小方阵为所述& 的共轭转置方阵R,。 —种适用于基带处理系统的矩阵分解方法的矩阵分解实现装置,其包括用于对 相关矩阵的数据、计算过程中的临时数据以及矩阵分解结果数据进行保存的数据存储单 元,其特征在于,该装置还包括用于产生控制各功能模块的启停信号及控制数据的读写信 号的控制信号生成单元,以及数据计算单元,所述数据计算单元在所述控制信号生成单元 的控制下,对所述数据存储单元中的数据进行读取、计算并将计算结果发送给所述数据存 储单元保存。 其中所述控制信号生成单元包括用于记录所计算之元素在矩阵中行位置的行计 数器,用于记录所计算之元素在矩阵中列位置的列计数器,以及用于记录乘累加运算次数
的k计数器。 其中所述数据存储单元包括用于存储相关矩阵R元素的相关矩阵存储模块,用于存储临时数据的随机存储器RAM,用于保存Cholesky矩阵分解结果的分解结果存储模 块。 其中所述数据计算单元包括用于计算中间变量vk的向量计算模块,负责迭代运 算中乘累加运算的乘累加模块,用于产生Cholesky矩阵分解结果的矩阵分解结果计算模 块,以及用于计算矩阵对角线上元素的倒数之倒数计算模块。 本发明所提供的一种适用于基带处理系统的矩阵分解方法及实现装置,由于采用 了对相关矩阵之左上角的一个小矩阵进行Cholesky矩阵近似分解,其他位置的数据由这 个小矩阵的分解结果构造出来,并通过相应的装置实现,这样与相关矩阵的完全Cholesky 矩阵分解的情况比较,减小了运算量,縮短了运算时间,节省了资源,降低了产品成本。


图1是本发明的较佳实施例的Cholesky矩阵分解重构示意图;
图2是本发明的较佳实施例的Cholesky矩阵分解实现装置的模块框图;
图3是本发明的较佳实施例的Cholesky矩阵分解的矩阵运算方法流程图。
图4是本发明的较佳实施例的Cholesky矩阵分解实现装置的数据流框图。
具体实施例方式以下结合附图,将对本发明的较佳实施例进行详细的说明。 本发明的核心发明点是,在移动通信基带处理系统中,使用最小均方误差线性块 均衡算法得到接收机对发送数据的估计值;在求解所述估计值时,对所述估计值的相关矩 阵进行Cholesky分解的过程包括在相关矩阵的左上角取一个小矩阵,将该小矩阵分解为 一个2N阶单位下三角方阵L、一个所述L的共轭转置方阵L*T以及一个2N阶对角方阵D (小 矩阵=L. D. L*T);接下来获得一个2N阶下三角方阵H,所述H的对角线元素h力.等于所述D 的对角线元素djj,所述H的非对角线元素等于所述L的非对角线元素I".;根据所述H 进行数据重构,获得相关矩阵进行Cholesky分解的下三角阵B, R = B. BT ;BT为B的转置矩 阵。 如图1所示是本发明的较佳实施例的Cholesky矩阵分解重构示意图。所提出的
小矩阵可等分为四个次小方阵,位于左上角N阶次小方阵R。等于右下角N阶次小方阵;位
于左下角为N阶次小方阵R"右上角N阶次小方阵为所述&的共轭转置方阵R,。 所述H的求解过程如下 (1)所述H的第一列元素按下面公式求得 100 = r00 li0 = ri0/r00, i = 1, 2N-1 ; (2)其它2N-1列元素按下面公式求得 <formula>formula see original document page 6</formula> <formula>formula see original document page 6</formula>
其中r。。为所述R的位于第一行第一列的元素;lij为所述L位于第i_l行第j_l 列的元素;djj为所述D位于第j-1行第j-1列的元素;vk为中间变量,vk*为vk的共轭。
在求得H矩阵后,需要根据H矩阵的元素进行数据重构,将数据重构过程描述如 下 将所述H填充在所述B的左上角,并将所述H的下三角部分的元素分为二个元素 块左上角N行元素构成的三角型元素块以及其下方N行元素构成的直角梯型元素块;接 下来用所述直角梯型元素块作为重复填充模块沿所述B的对角线,从所述H的相邻下方开 始依次填充2N-2个所述直角梯型元素块;所述B的未填充部分的元素为零,这样就得到了 下三角阵B。根据相关矩阵的Cholesky矩阵分解结果,并结合匹配滤波的结果进行前后向 替代就可以完成对用户数据的计算。 如图2所示为本发明的较佳实施例的Cholesky矩阵分解实现装置的模块框图。该 装置包括用于对相关矩阵的数据、计算过程中的临时数据以及矩阵分解结果数据进行保 存的数据存储单元,用于产生控制各功能模块的启停信号及控制数据的读写信号的控制信 号生成单元,以及数据计算单元,所述数据计算单元在所述控制信号生成单元的控制下,对 所述数据存储单元中的数据进行读取、计算并将计算结果发送给所述数据存储单元保存。
所述控制信号生成单元包括用于记录所计算之元素在矩阵中行位置的行计数 器,用于记录所计算之元素在矩阵中列位置的列计数器,以及用于记录乘累加运算次数的k 计数器;所述数据存储单元包括用于存储相关矩阵R元素的相关矩阵存储模块,用于存储 临时数据的随机存储器RAM,用于保存Cholesky矩阵分解结果的分解结果存储模块;所述 数据计算单元包括用于计算中间变量vk的向量计算模块,负责迭代运算中乘累加运算的 乘累加模块,用于产生Cholesky矩阵分解结果的矩阵分解结果计算模块,以及用于计算矩 阵对角线上元素的倒数之倒数计算模块。 下面用一个具体例子来说明本发明,以帮助更好理解本发明方法及装置。为使本 发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步的详细描述,但 不应看成是对本发明的限定。 以16个激活码道的情况为例,需要进行Cholesky矩阵分解的相关矩阵的大小为 352*352。要对这样一个相关矩阵进行完全的Cholesky矩阵分解,则其运算量大,花费运算 时间长,占用资源多;如果利用本发明提供之Cholesky矩阵分解的近似解决方案;则仅需 对相关矩阵左上角32*32的一个小矩阵进行Cholesky矩阵近似分解,其他位置数据由该小 矩阵的分解结果构造出来。由于只需要计算一个32*32矩阵的分解结果,因此,资源和时间 消耗将大大减少。 如图3所示为本发明的较佳实施例的Cholesky矩阵分解的矩阵运算方法流程图。 根据所述H的算法描述,其求解过程用装置按下述方法实现对于Cholesky矩阵分解的不 同位置,需要进行的计算是不同的;有下列三种情况
(1)、对于H的第一列元素,则不需要乘累加运算; (2)、对于H的对角线元素,则需要矢量运算、乘累加运算和倒数计算;
(3)、对于H的非第一列位置且不在对角线上的元素,则只需要乘累加运算。
所有计算结果被送到RAM分类保存,也就是说,所有第一列元素的计算结果被存 在一起,所有对角线元素的计算结果被存在一起,所有非对角线元素的计算结果被存在一 起。 下面结合矩阵分解实现装置和数据流框图,对本发明的数据计算实现过程作详细 描述如下 1)控制逻辑的产生 控制信号生成单元产生控制各功能模块的启停信号及控制数据的读写信号,在开 始与使能信号的控制下,通过三个计数器来记录矩阵分解的状态,其中,行计数器记录当前 所计算的元素在矩阵中(对角线为D矩阵,非对角线为L矩阵)行的位置,列计数器记录当 前所计算的元素在L矩阵中(对角线为D矩阵,非对角线为L矩阵)列的位置,k计数器用 于记录乘累加运算的次数。这三个计数器的不同的计数值,就代表了不同的处理状态,从而 相应的产生运算控制信号。 三个计数器在开始信号有效时,全部复位为零,在使能信号有效时,按如下规则进
行计数k计数器每个时钟进行一次计数,当记满一个周期(周期的长度根据行列值而不
同),k计数器清零,同时行计数器加一。如此循环,当行计数器计数到31且k计数器记满
一个周期,列计数器加一,同时将行计数器的值置为和列计数器相同的值,当行计数器,列
计数器以及K计数器都记满一个周期时,则表示该Cholesky分解完成。 k计数器的复位控制信号决定k计数器的计数周期的长度。在计算非对角线元素
时,k计数器的复位控制信号的产生条件是k计数器值等于列计数器减一。在计算对角线
上的元素时,因为必须保证在计算下一个元素的乘累加结果乘以这个倒数之前完成倒数运
算,所以计算完对角线元素之后并不一定立刻开始下一个元素的计数,而需要根据下一个
元素需要的处理时间来决定k计数器的复位时间和开始计算的时间。由于在本发明中,倒
数计算模块的计算时间为18个时钟周期,而且倒数需要存储到RAM中(占用3个时钟周
期),因此当对角线下元素的乘累加需要的时间小于22个时钟周期,就需要让k计数器继续
计数以保证乘累加的结果出来时,倒数已经计算完成。另外,当计算第一列元素时,则不需
要乘累加操作,k计数器的复位控制信号一直有效,k计数器的值一直保持为零。 在三个计数器正确计数以后,就可以根据这三个计数器的状态产生用于控制各个
功能模块工作的控制信号了。 在Cholesky矩阵分解的实现过程中需要读取和写入的数据比较多,读取和写入 的位置也比较多,根据计数器的状态,判断当前处理数据的位置,从而产生相应的读写逻 辑。在控制输入数据读逻辑中,相关矩阵的数据读使能在完成乘累加运算后有效,其读地址 由行计数器和列计数器的后三个比特组合产生,由行计数器和列计数器的最高比特位产生 读取用于存储相关矩阵数据R0,R1的RAM片选信号。为了节约逻辑而计算的中间变量的读 写逻辑为由于中间变量只在一列的最开始的时候即列等于行的时候才计算,因此相应的 写逻辑在行等于列的时候有效。对于对以计算出来的元素的读写逻辑,读入元素与对角线 元素相乘得到v变量或直接从RAM中读取中间变量后在乘以读入元素。对于对角线元素的 写逻辑,其只在行列计数器相等的时候并且分解结果处理模块处理完以后有效。其读逻辑 在计算中间变量时提前一个时钟周期有效。对角线元素的倒数的写逻辑由倒数计算模块产 生,使用倒数计算结束信号作为其写使能。
乘累加模块的使能信号在k计数器小于列计数器的时有效,在乘累加有效时,完 成相应的乘累加运算。之后在累加完成信号的指示下将结果输出给矩阵分解结果计算模 块。 2)数据的处理 如图4所示是本发明的较佳实施例的Cholesky矩阵分解实现装置的数据流框图。
首先,读入对角线元素lkk和非对角线元素lik,进行相乘得到中间变量Vk;对于计 算非对角元素时,则直接从先前保存vk的RAM中读取出来;然后再和lik相乘,相乘后的结 果进行累加;由于第一列元素不需要乘累加运算,所以当处理第一列元素时,乘累加结果直 接输出零到分解结果运算模块进行减法运算;然后将减法结果在乘以对角线元素的倒数就 得到了对应位置的分解结果。如果所计算的元素为对角线元素,则启动倒数运算,并将结算 将保存到RAM中以供后续计算使用。
3)数据的重构 以上分解的结果为32*32矩阵的分解结果,为了得到352*352矩阵的分解结果,需 要根据这个32*32矩阵分解结果进行重构;重构的方法为 (1)、将所述32*32 (H)矩阵的下三角部分的元素分为二个元素块左上角16行元 素构成的三角型元素块以及其下方16行元素构成的直角梯型元素块;
(2)、对大矩阵B左上角的16*16的元素,使用32*32矩阵分解结果的H左上角 16*16的元素填充; (3)、对于其他位置的元素,使用32*32矩阵分解结果的下方16行元素构成的直角 梯型元素块进行数据重构,也就是说,用所述16行直角梯型元素块作为重复填充模块沿所 述352*352 (B)的对角线,从左上角16行元素构成的下三角之相邻下方开始依次填充21个 所述16行直角梯型元素块;所述B352A352(B)的未填充部分的元素为零,这样就得到了下 三角阵B。 本发明以TD-SCDMA中的Cholesky分解为例来说明,但此装置也可以用于实现其 他数字信号处理系统中的Cholesky分解。 综上所述,本发明所提供的一种适用于基带处理系统的矩阵分解方法及实现装 置,由于采用了对相关矩阵之左上角的一个小矩阵进行Cholesky矩阵近似分解,其他位置 的数据由这个小矩阵的分解结果构造出来,并通过相应的装置实现;本发明还采用了改进 的Cholesky矩阵分解算法,避免了开方运算,有效降低了计算的复杂度,同时采用了归一 化数据处理流程,控制逻辑简单,便于实现;与相关矩阵的完全Cholesky矩阵分解的情况 比较,减小了运算量,縮短了运算时间,节省了资源,降低了产品成本。 应当理解的是,上述针对具体实施例的描述较为详细,并不能因此而认为是对本 发明专利保护范围的限制,本发明的专利保护范围应以所附权利要求为准。
9
权利要求
一种适用于基带处理系统的矩阵分解方法,在移动通信基带处理系统中,使用最小均方误差线性块均衡算法得到接收机对发送数据的估计值;在求解所述估计值时,对所述估计值的相关矩阵进行Cholesky分解的过程包括A、在相关矩阵R的左上角取一个小矩阵,所述R为M阶对称正定方阵,所述小矩阵为2N阶方阵,M与2N的比值为正整数;B、将所述小矩阵分解为一个2N阶单位下三角方阵L、一个所述L的共轭转置方阵L*T以及一个2N阶对角方阵D;C、获得一个2N阶下三角方阵H,所述H的对角线元素hjj等于所述D的对角线元素djj,所述H的非对角线元素hij等于所述L的非对角线元素1ij;D、根据所述H进行数据重构,获得所述R进行Cholesky分解的下三角阵B。
2. 根据权利要求1所述的矩阵分解方法,其特征在于,所述步骤C还包括所述H的求解 过程为所述H的第一列元素按下面公式求得 <formula>formula see original document page 2</formula> 其它2N-1列元素按下面公式求得<formula>formula see original document page 2</formula>其中r。。为所述R位于第一行第一列的元素;lij为所述L位于第i-1行第j-1列的元 素;djj为所述D位于第j-1行第j-1列的元素;vk为中间变量,vk*为vk的共轭。
3. 根据权利要求2所述的矩阵分解方法,其特征在于,所述H的求解过程用装置按下述 方法实现对于所述H的第一列元素,不需要乘累加运算;对于所述H的对角线元素,需要 矢量运算、乘累加运算和倒数计算;对于非第一列位置且不在对角线上的元素,只需要乘累 加运算。
4. 根据权利要求1所述的矩阵分解方法,其特征在于,所述步骤D中的数据重构过程包 括以下步骤Dl、将所述H填充在所述B的左上角,并将所述H的下三角部分的元素分为二个元素块左上角N行元素构成的三角型元素块以及其下方N行元素构成的直角梯型元素块;D2、用所述直角梯型元素块作为重复填充模块沿所述B的对角线,从所述H的相邻下方 开始依次填充2N-2个所述直角梯型元素块,所述B的未填充部分的元素为零。
5. 根据权利要求1所述的矩阵分解方法,其特征在于,所述步骤A中的小矩阵可等分为 四个次小方阵,位于左上角N阶次小方阵Ro等于右下角N阶次小方阵;位于左下角为N阶 次小方阵R"右上角N阶次小方阵为所述&的共轭转置方阵R,。
6. —种实现权利要求1所述方法的矩阵分解实现装置,其包括用于对相关矩阵的数 据、计算过程中的临时数据以及矩阵分解结果数据进行保存的数据存储单元,其特征在于, 该装置还包括用于产生控制各功能模块的启停信号及控制数据的读写信号的控制信号生 成单元,以及数据计算单元,所述数据计算单元在所述控制信号生成单元的控制下,对所述 数据存储单元中的数据进行读取、计算并将计算结果发送给所述数据存储单元保存。
7. 根据权利要求6所述的矩阵分解实现装置,其特征在于,所述控制信号生成单元包 括用于记录所计算之元素在矩阵中行位置的行计数器,用于记录所计算之元素在矩阵中 列位置的列计数器,以及用于记录乘累_加运算次数的k计数器。
8. 根据权利要求6所述的矩阵分解实现装置,其特征在于,所述数据存储单元包括用于存储相关矩阵R元素的相关矩阵存储模块,用于存储临时数据的随机存储器RAM,用于保 存Cholesky矩阵分解结果的分解结果存储模块。
9. 根据权利要求6所述的矩阵分解实现装置,其特征在于,所述数据计算单元包括用于计算中间变量Vk的向量计算模块,负责迭代运算中乘累加运算的乘累加模块,用于产生Cholesky矩阵分解结果的矩阵分解结果计算模块,以及用于计算矩阵对角线上元素的倒数 之倒数计算模块。
全文摘要
本发明公开了一种适用于基带处理系统的矩阵分解方法及实现装置,该方法包括在相关矩阵R的左上角取一个小矩阵;将所述小矩阵分解为一个2N阶单位下三角方阵L、一个所述L的共轭转置方阵L*T以及一个2N阶对角方阵D;获得一个2N阶下三角方阵H,所述H的对角线元素hjj等于所述D的对角线元素djj,所述H的非对角线元素hij等于所述L的非对角线元素lij;根据所述H进行数据重构,获得所述R进行Cholesky分解的下三角阵B。该装置包括数据存储单元,用于产生控制各功能模块的启停信号及控制数据的读写信号的控制信号生成单元,以及用于进行预定计算的数据计算单元。本发明的实施,使Cholesky矩阵分解实现装置减小了运算量,缩短了运算时间,节省了资源,降低了产品成本。
文档编号H04B17/00GK101730134SQ20081021751
公开日2010年6月9日 申请日期2008年11月3日 优先权日2008年11月3日
发明者刘志勇, 古艳涛 申请人:中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1