Dtmb中基于三级流水线的高速qc-ldpc编码器的制造方法_2

文档序号:9491572阅读:来源:国知局
特的只读存储器(Read-Only Memory,R0M)。b比特寄存器 R1, R2,...,匕分别用于缓冲向量χ的向量段χ η x2,. . .,xu,b比特寄存器Ru+j用于存储p加 校验段Pj。1个RLA电路计算向量P j需要b个时钟周期。
[0045] 对于DTMB系统,使用2个RLA电路计算px= (p i,p2)是一种合理方案,如图4所 示的高密度矩阵与向量的乘法器。高密度矩阵与向量的乘法器由2个查找表L 1, L2、4个127 比特寄存器R2i1,R2,2, ···,心4和2个127位二输入异或门X 2il,X2i2组成。查找表L丨,L2分别 存储可变的2比特向量与固定的矩阵Φ1; Φ2的所有可能乘积,寄存器R2i1,R2i2分别用于缓 冲向量X的向量段X1, χ2,寄存器R2i3, R2i4分别用于存储P ,的校验段P :,Ρ2。2个RLA电路需 使用127个二输入异或门,1016比特的ROM和254个寄存器。2个RLA电路计算向量 ?:!需 要127个时钟周期。使用高密度矩阵与向量的乘法器计算向量px的步骤如下:
[0046] 第1步,清零寄存器R2,3, R2,4,输入向量段Xl,x2,将它们分别存入寄存器R 2,^ R2i2 中;
[0047] 第2步,寄存器R2il, R2i2同时循环左移1次,异或门X 2il,X2i2分别对查找表L丨,L2 的输出和寄存器仏3, R2i4的内容进行异或,异或结果被循环左移1次后分别存回寄存器 1?, 3, 1?, 4;
[0048] 第3步,重复第2步126次,完成后,寄存器R2,3, R2i4存储的内容分别是校验段 P1, P2,它构成了部分校验向量Px。
[0049] 式(5)隐含了后向迭代操作,必须逐段求解向量q和X。定义[q X]= Cq1, q2, . . .,qn),并初始化为全零。首先M1是矩阵Q的第1块行与向量[a q X] τ之积。其 次,q2是矩阵Q的第2块行与向量[a q X] τ之积。重复上述过程,直到算完qil为止,如图 5所示的I型后向迭代电路。I型后向迭代电路由59个b比特寄存器R 1^ &2, ...,159和 11个多输入模2加法器Alil, Ali2,…,Alill组成。
[0050] 以计算q](l彡j彡11)为例。校验矩阵H中的非零循环矩阵通常是单位矩阵的循 环右移版本。假设矩阵Q的第j块行的前48块列中有M个非零循环矩阵,它们的循环右移位 数分别是s,kl,s jik2,…,s jikM (1彡kl,k2,…,kM彡48),矩阵Q的第j块行的后11块列中有N 个非零循环矩阵,它们的循环右移位数分别是Sjinil, ..., Sj,_ (48〈ml,m2,…,mN〈48+j)。 则
[0052] 其中,上标re(n)和1s(n)分别表示循环右移η位和循环左移η位。因为M和N都很 小,所以式(10)可由一个对输入循环左移的多输入模2法器在1个时钟周期内计算完毕。 因此,计算向量[q X]共需11个时钟周期。既然矩阵Q中共有β = 290个非零循环矩阵, 那么I型后向迭代电路需使用(β - 2c)b = 34036个二输入异或门。
[0053] 矩阵Q是由11X59个bXb阶循环矩阵UK 11,1彡k彡59)构成的阵 列。非零循环矩阵QKk相对于bXb阶单位矩阵的循环右移位数是8 为便于 描述,全零循环矩阵相对于bXb阶循环矩阵的循环右移位数记作S]ik= 在图5中, 当I < k < 48时,Qjik在垂直方向上对应向量段a k,当48〈k〈48+j时,Qjik在垂直方向上对 应向量段qk %。全零循环矩阵〇0在垂直方向上对应的向量段不参与异或运算,非零循环 矩阵Qj1Ii在垂直方向上对应的向量段 a &或q k 被循环左移s Ik位后送入多输入模2加法 器A1^中进行异或运算,A u的计算结果是q ,,存入寄存器R1^中。图6给出了矩阵Q中非 零循环矩阵所在的块位置及其循环右移位数。使用I型后向迭代电路计算向量q和X的步 骤如下:
[0054] 第1步,输入信息段&1,a2, . . .,a4S,将它们分别存入寄存器Rlil2, Rlil3, . . .,Rli59中;
[0055] 第2步,非零循环矩阵Qjik在垂直方向上对应的向量段a肩q k 4S被循环左移s jik 位后送入多输入模2加法器Ali,中进行异或运算,异或结果q ,被存入寄存器R u中,其中, 1彡j彡11,1彡k〈59,0彡Sj,k〈b,当1彡k彡48时,Qjik在垂直方向上对应向量段a k,当 48〈k〈48+j时,Qjik在垂直方向上对应向量段q k 48;
[0056] 第3步,以1为步长递增改变j的取值,重复第2步10次,最终,寄存器 Rlil, Rli2, · · ·,Rlill存储的分别是向量段q η q2, · · ·,qn,它们构成了向量q和X。
[0057] 式(7)也隐含了后向迭代操作,必须逐段求解部分校验向量匕。初始化匕= (p3,p 4,…,P11)为全零。首先,P3是矩阵Y的第1块行与向量[a pxpy]τ之积。其次,P 4是 矩阵Y的第2块行与向量[a px py]T之积。重复上述过程,直到算完P11为止,如图7所示 的II型后向迭代电路。II型后向迭代电路由59个b比特寄存器R 3il, R3,2, ...,R3,59和9个 多输入模2加法器A3il, A3,2, ...,A3i9组成。计算部分校验向量py共需9个时钟周期。既然 矩阵Y中共有ξ =241个非零循环矩阵,那么II型后向迭代电路需使用(ξ - 2c+2u)b = 28321个二输入异或门。矩阵Y是由9 X 59个b X b阶循环矩阵Y,k (1彡j彡9, 1彡k彡59) 构成的阵列。非零循环矩阵Y]ik相对于bXb阶单位矩阵的循环右移位数是s 图8给出了矩阵Y中非零循环矩阵所在的块位置及其循环右移位数。使用II型后向迭代 电路计算部分校验向量Py的步骤如下:
[0058] 第1步,输入信息段B1, a2,…,a4S,将它们分别存入寄存器R3,1q, R3ill,…,R3i57中, 输入校验段P1, P2,将它们分别存入寄存器R3i58, R3i59中;
[0059] 第2步,非零循环矩阵Yjik在垂直方向上对应的向量段a肩p k 48被循环左移s j,k 位后送入多输入模2加法器A3,,中进行异或运算,异或结果p ]+2被存入寄存器R 3,,中,其中, 1彡j彡9, 1彡k〈59,0彡Sj,k〈b,当1彡k彡48时,Yjik在垂直方向上对应向量段a k,当 48〈k〈48+j时,Yjik在垂直方向上对应向量段p k 48;
[0060] 第3步,以1为步长递增改变j的取值,重复第2步8次,最终,寄存器 R3i1,R3,2,. . .,R3i9存储的分别是向量段P 3, p4,. . .,pn,它们构成了部分校验向量py。
[0061] 本发明提供了一种基于三级流水线的高速QC-LDPC编码方法,适用于DTMB系统中 的4/5码率QC-LDPC码,其编码步骤描述如下:
[0062] 第1步,使用I型后向迭代电路计算向量q和X ;
[0063] 第2步,使用高密度矩阵与向量的乘法器计算部分校验向量px;
[0064] 第3步,使用II型后向迭代电路计算部分校验向量py,从而得到校验向量p = (Px,Py)。
[0065] 图9总结了编码器各编码步骤以及整个编码过程所需的硬件资源消耗和处理时 间。
[0066] 从图9不难看出,流水线充满时,整个编码过程共需max (t,u+b) = 129个时钟周 期,远小于基于11个SRAA-I电路的串行编码方法所需的6096个时钟周期。前者的编码速 度是后者的47. 3倍。
[0067] DTMB标准中4/5码率QC-LDPC编码器的现有解决方案需要2794个寄存器、1397个 二输入与门和1397个二输入异或门,还需要67056比特ROM存储循环矩阵的生成多项式。 而本发明需要15240个寄存器、0个二输入与门和62484个二输入异或门,只需要1016比特 ROM。
[0068] 综上可见,与传统的串行SRAA法相比,本发明具有编码速度快、存储器消耗少等 优点。
[0069] 以上所述,仅为本发明的【具体实施方式】之一
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1