一种用于高效视频编码反变换运算的并行结构构造方法

文档序号：10492667阅读：472来源：国知局

一种用于高效视频编码反变换运算的并行结构构造方法
【专利摘要】高效视频编码反变换运算的并行结构构造方法，针对HEVC编码中的反变换算法，对反变换进行并行化分析。利用2×4二维处理元上对4×4的TU进行反变换运算的并行处理，2×4二维处理元以并行方式依次完成基于奇偶分解运算垂直和水平反变换运算。本发明可以有效地降低了反变换的计算复杂度，缩短了编解码时间，加快了编解码处理过程。
【专利说明】
-种用于高效视频编码反变换运算的并行结构构造方法
技术领域
[0001] 本发明设及视频编码技术领域，具体设及一种高效视频编码（Hi曲Efficiency Video Coding,简称肥VC)标准中反变换算法的并行化。技术背景
[0002] 随着高清、超高清视频(分辨率达4KX2K、8KX4K)应用正越来越多地充斥着人们的视野，视频应用的多样化和海量的视频数据急需新的编码技术来尽可能去除视频数据中的冗余成分，减少表征视频的数据量。为此，2013年11月国际电信联盟的视频编码专家组 ITU/VCEG和国际运动图像专家组IS0-IEC/MPEG组建的联合工作组（Joint Colkborative Team on Video Coding, JCT-VC)正式发布了新一代视频编码标准一H. 265/肥VC。
[0003] 相比于W往的视频编码标准，H. 265/肥VC的编码性能有了很大的提升。但是， H. 265/肥VC相对于H. 264/AVC标准需要耗费大量的计算代价。提高编码效率的常用方法已经不能满足H. 265/肥VC视频编码标准的要求，所W需要寻找一种可W提高H. 265/肥VC计算速度的方法。
[0004] H. 265/肥VC参考软件还需要进行优化才能达到实时应用的要求，可W通过优化软件代码和优化算法层面实现，除此之外，还可W利用其它硬件或者软件资源来进一步提高运算速度。
[0005] H. 265/肥VC标准中的变换和反变换算法的处理对象是一帖图像中相互独立的 TU，其属于运算密集型算法，处理大量的重复运算，而且数据流之间的依赖关系十分规整，具有大量的并行性。如何快速有效地进行反变换算法对降低其计算复杂度十分重要。

【发明内容】

[0006] 本发明目的是针对上述问题，提出一种用于高效视频编码反变换运算的并行结构构造方法。本发明在不降低编码效率的情况下可W大大降低视频编码计算的复杂度。
[0007] 为实现上述目的，本发明采用的技术方法如下：一种用于高效视频编码反变换运算的并行结构构造方法。其特征在于：在邻接互连的2X4二维处理元阵列（PE00-PE13)上对4X4的TU进行反变换运算的并行处理。
[0008] 将 4X4 的反量化数据（X00 和 X02、X20 和 X22、X10 和 X12、X30 和 X32、X01 和 X03、 X21和X23、Xll和X13、X31和X33)从内存分别加载到处理元阵列（PE00-PE13)的数据寄存器中，W并行方式依次完成基于奇偶分解运算的垂直和水平反变换；其基于奇偶分解运算的垂直反变换计算方法：处理元阵列（PE00-PE13)分别对反量化数据进行加载，等数据加载完成，执行奇偶分解运算，分别对输入数据（X00和X02、X20和 X22、XlO 和 X12、X30 和 X32、XOl 和 X03、X21 和 X23、Xll 和 X13、X31 和 X33)进行逐级移位和加减运算，得到垂直反变换的中间变量（MOO和MOl、M20和M21、MlO和Mil、M30和M31、 M02 和 M03、M22 和 M23、M12 和 M13、M32 和 M33); 垂直方向相邻处理元（阳00和阳10,阳Ol和阳11、阳02和阳12、阳03和阳13)之间对中间变量（M00-M33)通过加减运算得到垂直反变换结果（zoo和ZOl、Z20和Z21、Zio和 Z11、Z30 和 Z31、Z02 和 Z03、Z22 和 Z23、Z12 和 Z13、Z32 和 Z33); 基于奇偶分解运算的水平反变换计算方法：水平方向相邻处理元（阳00和PE01，PE02 和阳03、PElO和阳11、PE12和阳13)之间对垂直反变换结果（Z00-Z33)通过移位和加减运算得到水平反变换的中间变量（N00和N0UN20和N2UN10和N1UN30和N3UN02和N03、 N22 和 N23、N12 和 N13、N32 和 N33); 水平方向间隔处理元（阳00和阳02,阳Ol和阳03、PE10和阳12、PE11和阳13)之间对中间变量（N00-N33)通过加减运算得到最终的反变换结果（Y00-Y33)。
[0009] 本发明提出了一种用于高效视频编码反变换运算的并行结构构造方法，有效缩短反变换算法的处理时间，加快了编解码过程，且可W快速有效的进行反变换，同时降低了计算的复杂度。
【附图说明】
[0010] 图1为邻接互连的2X4二维处理元阵列。
[0011] 图2为4X4反量化系数加载图。
[0012] 图3为垂直反变换的中间变量流程图。
[0013] 图4为垂直反变换的中间变量共享方式图。
[0014] 图5为水平反变换的中间变量流程图。
[0015] 图6为水平反变换的中间变量共享方式图。
【具体实施方式】
[0016] 2X4二维处理元阵列阳00-PE13,运8个处理元通过近邻互连组成二维处理元阵列。
[0017] 变换单元灯ransform化it,简写TU)是H. 265/肥VC中的一个基本概念。一般来说，TU大小可W为4X 4到64X64。在编码的过程中，TU是进行变换量化和反变换反量化的基本单元。
[0018] 本发明提供的一种用于高效视频编码反变换运算的并行结构构造方法，其包含的具体实现步骤为：第一步：由于视频阵列处理器采用邻接互连的数据传输方式，所W考虑到PE间共享数据的传输距离问题，将4X4的反量化系数X加载到PEOO至PE13中的数据寄存器中，其中 XOO和X02存放在阳00中，X20和X22存放在阳Ol中，XlO和X12存放在阳02中，X30和 X32存放在阳03中，XOl和X03存放在阳10中，Xll和X13存放在阳11中，X21和X23存放在阳12中，X31和X33存放在阳13中。
[0019] 第二步：根据公式（1)和公式（2)分别配置阳00、PE01、阳02、阳03和阳10、PE11、阳12、阳13的指令，计算出垂直反变换的各中间变量MO、Ml、M2和M3，其中阳00通过对XOO 和X02进行移位加法和减法运算分别得到MOO和MOl，PEOl通过对X20和X22进行移位加法和减法运算分别得到M20和M21，PE02通过对XlO和X12进行移位加法和减法运算分别得到MlO和M11，PE03通过对X30和X32进行移位加法和减法运算分别得到M30和M31。
[0020] 堪i.
口）第S步：根据公式（3)，通过垂直方向相邻PE之间共享寄存器数据完成反变换中的1 维变换。PEOO和PElO通过对共享数据MOl和M03进行减法和加法运算分别得到ZOO、Z30 和Z10、Z20 ;阳Ol和阳11通过对共享数据M21和M23进行减法和加法运算分别得到Z02、 Z32和Z12、Z22 ;PE02和PE12通过对共享数据Mll和M13进行减法和加法运算分别得到 Z0UZ31和Z1UZ21 ;阳03和阳13通过对共享数据M31和M33进行减法和加法运算分别得到 Z03、Z13 和 Z23、Z33。
[0021]
I議第五步：根据公式（4)和公式（5)分别配置阳00、PE01、阳10、PE11和阳02、PE03、阳12、 PE13的指令，计算出水平反变换的各中间变量NO、N1、N2和N3,其中PEOO和PEOl通过对共享数据Z02和Z30进行移位加法和减法运算分别得到N00、N01和M30、N31，PE02和PE03 通过对共享数据Z03和Z31进行移位加法和减法运算分别得到N02、N03和N32、N33, PElO 和PEll通过对共享数据Z12和Z20进行移位加法和减法运算分别得到N10、Nll和N20、 N21，PE12和PE13通过对共享数据Z13和Z21进行移位加法和减法运算分别得到N12、N13 和 N22、N23。
[0022] 誦f 錢參第六步：根据公式（6)，通过水平方向相邻PE之间共享寄存器数据得到反变换的最终结果，其中PEOO和PE02通过对共享数据N03和NOl进行减法和加法运算分别得到Y00、Y03 和YOU Y02 ;PE01和PE03通过对共享数据N33和N31进行减法和加法运算分别得到Y30、 Y33和Y31、Y32 ;PE10和PE12通过对共享数据N13和Nll进行减法和加法运算分别得到 Y10、Y13和Y1UY12 ;阳11和阳13通过对共享数据N23和N21进行减法和加法运算分别得到 Y20、Y23 和 Y2UY22。
[0023]
'纖穿：最后应说明的是：显然，上述实施仅仅是为清楚地说明本发明所作的举例，而并非对实施方式的限定。对于所述领域的普通技术人员来说，凡是依据本发明的技术实质对W上实施例所做的任何简单修改，等同变化与修饰，均仍属本发明技术方案的保护范围。
【主权项】
1. 一种用于高效视频编码反变换运算的并行结构构造方法，其特征在于：在邻接互连的2X4二维处理元阵列（PE00-PE13 )上对4X4的TU进行反变换运算的并行处理。2. 根据权利要求书1所述的一种用于高效视频编码反变换运算的并行结构构造方法，其特征在于：将4X4的反量化数据（X00和X02、X20和X22、X10和X12、X30和X32、X01和 X03、X21和X23、XII和X13、X31和X33)从内存分别加载到处理元阵列（PE00-PE13)的数据寄存器中，以并行方式依次完成基于奇偶分解运算的垂直和水平反变换。3. 根据权利要求书2所述的一种用于高效视频编码反变换运算的并行结构构造方法，其基于奇偶分解运算的垂直反变换特征在于：处理元阵列（PE00-PE13)分别对反量化数据进行加载，等数据加载完成，执行奇偶分解运算，分别对输入数据（X00和X02、X20和X22、 X10和X12、X30和X32、X01和X03、X21和X23、X11和X13、X31和X33)进行逐级移位和加减运算，得到垂直反变换的中间变量（M00和M01、M20和M21、M10和Mil、M30和M31、M02 和M03、M22和M23、M12和M13、M32和M33);垂直方向相邻处理元（PEOO和PE10, PE01和 PE1UPE02和PE12、PE03和PE13)之间对中间变量（M00-M33)通过加减运算得到垂直反变换结果（ZOO 和 Z0UZ20 和 Z2UZ10 和 Z1UZ30 和 Z3UZ02 和 Z03、Z22 和 Z23、Z12 和 Z13、 Z32 和 Z33)。4. 根据权利要求书2、3所述的一种用于高效视频编码反变换运算的并行结构构造方法，其基于奇偶分解运算的水平反变换特征在于：水平方向相邻处理元（ΡΕ00和PE01，PE02 和PE03、PE10和PE1UPE12和PE13)之间对垂直反变换结果（Z00-Z33)通过移位和加减运算得到水平反变换的中间变量（N00和N0UN20和N2UN10和N1UN30和N3UN02和N03、 N22 和 N23、N12 和 N13、N32 和 N33);水平方向间隔处理元（ΡΕ00 和 PE02，PE01 和 PE03、PE10 和PE12、PE11和PE13)之间对中间变量（N00-N33)通过加减运算得到最终的反变换结果 (Y00-Y33)。
【文档编号】H04N19/436GK105847840SQ201510795422
【公开日】2016年8月10日
【申请日】2015年11月18日
【发明人】刘镇弢, 王杏军, 蒋林, 刘有耀
【申请人】西安邮电大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘镇弢;王杏军;蒋林;刘有耀;
技术所有人：西安邮电大学;
我是此专利的发明人

上一篇：包含量化或逆量化程序的信号处理装置及信号处理方法
上一篇：一种用于阵列结构的多视点视频编码强滤波实现方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。