深空通信中基于四级流水线的高速qc-ldpc编码器的制造方法_2

文档序号:9379728阅读:来源:国知局
P2,…,p4。4个RLA电路需使用8192个二输 入异或门,131072比特的ROM和16384个寄存器。4个RLA电路计算向量p x需要2048个 时钟周期。使用高密度矩阵与向量的乘法器计算向量Px的步骤如下:
[0051] 第1步,清零寄存器R3,5, R3i6,…,R3i8,输入向量段Xl,X2,…,X 4,将它们分别存入寄 存器 R3il, R3i2,…,R3,4中;
[0052] 第2步,寄存器R3i1,R3,2,…,R 3i4同时循环左移1次,异或门Χ3ι1,X3,2,…,X 3,4分别 对查找表!^,L2,…,1^4的输出和寄存器R 3,5, R3,6,…,R3,s的内容进行异或,异或结果被循环左 移1次后分别存回寄存器R 3,5, R3,6,…,R3,
[0053] 第3步,重复第2步2047次,完成后,寄存器R3,5, R3,6,…,R3i8存储的内容分别是校 验段P1, P2,…,P4,它们构成了部分校验向量px。
[0054] 令 f =况,f2,…,f8)和 w = (f9, 。,…,f12),则[f w] = (f!,f2,…,f12)。由式 (5)可知,&是矩阵F的第j块行与a τ的乘积,即
[0058] 其中,上标和ls(n4)分别表示循环右移η - 1位和循环左移η - 1位。既然任一 循环矩阵生成多项式g]il只有少量的'1'甚至是全零,那么式(13)中的内积可通过对循环 左移寄存器的抽头求和来实现,如图5所示的稀疏矩阵与向量的乘法器。稀疏矩阵与向量 的乘法器由20个2048比特寄存器R 1,^Rli2,…,Rli2。和12个多输入异或门X1,^X li2,…,Xlil2 组成。寄存器R1,^ Rli2,…,Rli8用于加载和循环左移信息段ai,a2,…,a s,寄存器Rli9, R1i1q,… ,Rli2。用于存储[f w]的向量段f D f2,…,f12。图5中的稀疏连接取决于矩阵F中的所有循 环矩阵生成多项式。如果1(1 <m<b),那么信息段ai的第m比特连接到异或门 Xli 因此,寄存器Rli j勺所有抽头取决于矩阵F第i块列中所有循环矩阵生成多项式的非 零元素所在位置,而多输入异或门Xu]的输入取决于矩阵F第j块行中所有循环矩阵生成 多项式的非零元素所在位置。图6给出了稀疏矩阵与向量的乘法器中各个多输入异或门与 寄存器的连接关系。既然F中的所有循环矩阵生成多项式共有α =20个'1',那么稀疏 矩阵与向量的乘法器需要使用(a -c) =8个二输入异或门同时计算fl n,f2 n,…,f12 n。f 和w可在2048个时钟周期内计算完毕。使用稀疏矩阵与向量的乘法器计算向量f和w的 步骤如下:
[0059] 第1步,输入信息段&1,&2,*", &8,将它们分别存入寄存器1?1,1,1?1, 2,*",1?1,8中;
[0060] 第2步,寄存器Rlil, Rli2,…,Rli8同时循环左移1次,异或门X U1,Xli2,…,Xlil^别 将异或结果左移入寄存器R 1i9, R1i1d,…,R1i2d中;
[0061] 第3步,重复第2步2047次,完成后,寄存器R1i9, R1i1q,…,R1i2q存储的内容分别是 向量段4 f2,…,f12,它们构成了向量f和w。
[0062] 式(7)隐含了后向迭代操作,必须逐段求解向量q和X。定义[q X] = Q1, q2,… ,Qi2),并初始化为全零。首先,Qi恰好等于f 1。其次,%是矩阵Q的第2块行与向量[q X] T之积与f 2的模2和。然后,q 3是矩阵Q的第3块行与向量[q X] τ之积与f 3的模2和。重 复上述过程,直到算完q12为止,如图7所示的I型后向迭代电路。I型后向迭代电路由12 个2048比特寄存器R 2, i,R2,2,…,R2,12和11个多输入模2加法器A 2,2, A2,3,…,A2,12组成。
[0063] 以计算q](l彡j彡12)为例。校验矩阵H中的非零循环矩阵通常是单位矩阵的 循环右移版本。假设矩阵Q的第j块行中有N个非零循环矩阵,它们的循环右移位数分别 是 s.j,kl, Sjik2,…,s.j,kN(l 彡 kl,k2,…,kN〈j)。贝 1J,
[0065] 因为N很小,所以式(14)可由一个对输入循环左移的多输入模2加法器在1个时 钟周期内计算完毕。因此,计算向量[q X]共需12个时钟周期。既然矩阵Q中共有β = 20个非零循环矩阵,那么I型后向迭代电路需使用(β _c)b = 16384个二输入异或门。
[0066] 矩阵Q是由12X12个bXb阶循环矩阵&(1彡12, 1彡k彡12)构成的阵 列。非零循环矩阵QKk相对于bXb阶单位矩阵的循环右移位数是8 为便于 描述,全零循环矩阵相对于bXb阶循环矩阵的循环右移位数记作Su= 在图7中,非 零循环矩阵Qjik对应的向量段q k被循环左移s jik位后送入多输入模2加法器A 2ij中与向量 段&进行异或运算,全零循环矩阵对应的向量段不参与异或运算,A 2ι ]的计算结果是q ],存 入寄存器R2i,中。图8给出了矩阵Q中非零循环矩阵所在的块位置及其循环右移位数。使 用I型后向迭代电路计算向量q和X的步骤如下:
[0067] 第1步,输入向量段,将向量段qi= 存入寄存器R 2il中;
[0068] 第2步,输入向量段fj,非零循环矩阵Qik对应的向量段q k被循环左移s jik位后送 入多输入模2加法器Av]中与向量段f ,进行异或运算,异或结果q ,被存入寄存器R u中, 其中,2 彡 j 彡 12, 1 彡 k〈j,0 彡 Sj,k〈2048 ;
[0069] 第3步,以1为步长递增改变j的取值,重复第2步10次,最终,寄存器R2i1,R 2i2,… ,R2il2存储的分别是向量段q i,q2,…,q12,它们构成了向量q和X。
[0070] 式(9)也隐含了后向迭代操作,必须逐段求解向量y。定义y = G1, y2,…,ys),并 初始化为全零。首先,yi是矩阵Y的第1块行与向量[P x y]T之积。其次,y2是矩阵Y的第 2块行与向量[Px y]T之积。重复上述过程,直到算完ys为止,如图9所示的II型后向迭 代电路。II型后向迭代电路由12个2048比特寄存器R4il, R4i2,…,R4,12和8个多输入模2 加法器A4, u A4i2,…,A4i8组成。计算向量y共需8个时钟周期。既然矩阵Y中共有ξ =28 个非零循环矩阵,那么II型后向迭代电路需使用(ξ - 2c+2u)b = 24576个二输入异或门。 矩阵Y是由8X12个bXb阶循环矩阵Yj,k(l彡j彡8, 1彡k彡12)构成的阵列。非零循 环矩阵Y,k相对于bXb阶单位矩阵的循环右移位数是s ]ik,0彡s^b。图10给出了矩阵Y 中非零循环矩阵所在的块位置及其循环右移位数。使用II型后向迭代电路计算向量y的 步骤如下:
[0071] 第1步,输入校验段Pl,P2,…,P4,将它们分别存入寄存器R 4,9, R4il。,…,R4,12中;
[0072] 第2步,非零循环矩阵Y]ik对应的向量段pkSy k被循环左移s ]ik位后送入多输入模 2加法器A4,,中进行异或运算,异或结果y ,被存入寄存器R4,,中,其中,1彡j彡8, 1彡k〈4+j, 0 ^ s jik<b ;
[0073] 第3步,以1为步长递增改变j的取值,重复第2步7次,最终,寄存器R4i1,R 4i2,… ,R48存储的分别是向量段y i,y2,…,y8,它们构成了向量y。
[0074] 本发明提供了一种基于四级流水线的高速QC-LDPC编码方法,适用于深空通信系 统中的1/2码率QC-LDPC码,其编码步骤描述如下:
[0075] 第1步,使用稀疏矩阵与向量的乘法器计算向量f和w ;
[0076] 第2步,使用I型后向迭代电路计算向量q和X ;
[0077] 第3步,使用高密度矩阵与向量的乘法器计算部分校验向量px;
[0078] 第4步,使用II型后向迭代电路计算向量y,y与向量q异或得到部分校验向量 py,从而得到校验向量P = (px, Py)。
[0079] 图11总结了编码器各编码步骤以及整个编码过程所需的硬件资源消耗和处理时 间。
[0080] 从图11不难看出,流水线充满时,整个编码过程共需max(t - c+b,c,u+b) = 2056 个时钟周期,少于基于12个SRAA-I电路的串行编码方法所需的16384个时钟周期。前者 的编码速度是后者的8倍。
[0081] 深空通信标准中1/2码率QC-LDPC编码器的现有解决方案需要49152个寄存器、 24576个二输入与门和24576个二输入异或门,还需要196608比特ROM存储循环矩阵的生 成多项式。而本发明需要106496个寄存器、0个二输入与门和49160个二输入异或门,只需 要 131072 比特 ROM。
[0082] 综上可见,与传统的串行SRAA法相比,本发明具有编码速度快、存储器消耗少等 优点。
[0083] 以上所述,仅为本发明的【具体实施方式】之一,但本发明的保护范围并不局限于此, 任何熟悉本领域的技术人员在本发明所揭露的技术范围内,可不经过创造性劳动想到的变 化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书 所限定的保护范围为准。
【主权项】
1. 一种深空通信中基于四级流水
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1