一种用于高效视频编码反变换运算的并行结构构造方法

文档序号:10492667阅读:472来源:国知局
一种用于高效视频编码反变换运算的并行结构构造方法
【专利摘要】高效视频编码反变换运算的并行结构构造方法,针对HEVC编码中的反变换算法,对反变换进行并行化分析。利用2×4二维处理元上对4×4的TU进行反变换运算的并行处理,2×4二维处理元以并行方式依次完成基于奇偶分解运算垂直和水平反变换运算。本发明可以有效地降低了反变换的计算复杂度,缩短了编解码时间,加快了编解码处理过程。
【专利说明】
-种用于高效视频编码反变换运算的并行结构构造方法
技术领域
[0001] 本发明设及视频编码技术领域,具体设及一种高效视频编码(Hi曲Efficiency Video Coding,简称肥VC)标准中反变换算法的并行化。 技术背景
[0002] 随着高清、超高清视频(分辨率达4KX2K、8KX4K)应用正越来越多地充斥着人们 的视野,视频应用的多样化和海量的视频数据急需新的编码技术来尽可能去除视频数据中 的冗余成分,减少表征视频的数据量。为此,2013年11月国际电信联盟的视频编码专家组 ITU/VCEG和国际运动图像专家组IS0-IEC/MPEG组建的联合工作组(Joint Colkborative Team on Video Coding, JCT-VC)正式发布了新一代视频编码标准一H. 265/肥VC。
[0003] 相比于W往的视频编码标准,H. 265/肥VC的编码性能有了很大的提升。但是, H. 265/肥VC相对于H. 264/AVC标准需要耗费大量的计算代价。提高编码效率的常用方法已 经不能满足H. 265/肥VC视频编码标准的要求,所W需要寻找一种可W提高H. 265/肥VC计 算速度的方法。
[0004] H. 265/肥VC参考软件还需要进行优化才能达到实时应用的要求,可W通过优化软 件代码和优化算法层面实现,除此之外,还可W利用其它硬件或者软件资源来进一步提高 运算速度。
[0005] H. 265/肥VC标准中的变换和反变换算法的处理对象是一帖图像中相互独立的 TU,其属于运算密集型算法,处理大量的重复运算,而且数据流之间的依赖关系十分规整, 具有大量的并行性。如何快速有效地进行反变换算法对降低其计算复杂度十分重要。

【发明内容】

[0006] 本发明目的是针对上述问题,提出一种用于高效视频编码反变换运算的并行结构 构造方法。本发明在不降低编码效率的情况下可W大大降低视频编码计算的复杂度。
[0007] 为实现上述目的,本发明采用的技术方法如下:一种用于高效视频编码反变换运 算的并行结构构造方法。其特征在于:在邻接互连的2X4二维处理元阵列(PE00-PE13)上 对4X4的TU进行反变换运算的并行处理。
[0008] 将 4X4 的反量化数据(X00 和 X02、X20 和 X22、X10 和 X12、X30 和 X32、X01 和 X03、 X21和X23、Xll和X13、X31和X33)从内存分别加载到处理元阵列(PE00-PE13)的数据寄 存器中,W并行方式依次完成基于奇偶分解运算的垂直和水平反变换; 其基于奇偶分解运算的垂直反变换计算方法:处理元阵列(PE00-PE13)分别对反量化 数据进行加载,等数据加载完成,执行奇偶分解运算,分别对输入数据(X00和X02、X20和 X22、XlO 和 X12、X30 和 X32、XOl 和 X03、X21 和 X23、Xll 和 X13、X31 和 X33)进行逐级移位 和加减运算,得到垂直反变换的中间变量(MOO和MOl、M20和M21、MlO和Mil、M30和M31、 M02 和 M03、M22 和 M23、M12 和 M13、M32 和 M33); 垂直方向相邻处理元(阳00和阳10,阳Ol和阳11、阳02和阳12、阳03和阳13)之间 对中间变量(M00-M33)通过加减运算得到垂直反变换结果(zoo和ZOl、Z20和Z21、Zio和 Z11、Z30 和 Z31、Z02 和 Z03、Z22 和 Z23、Z12 和 Z13、Z32 和 Z33); 基于奇偶分解运算的水平反变换计算方法:水平方向相邻处理元(阳00和PE01,PE02 和阳03、PElO和阳11、PE12和阳13)之间对垂直反变换结果(Z00-Z33)通过移位和加减运 算得到水平反变换的中间变量(N00和N0UN20和N2UN10和N1UN30和N3UN02和N03、 N22 和 N23、N12 和 N13、N32 和 N33); 水平方向间隔处理元(阳00和阳02,阳Ol和阳03、PE10和阳12、PE11和阳13)之间对 中间变量(N00-N33)通过加减运算得到最终的反变换结果(Y00-Y33)。
[0009] 本发明提出了一种用于高效视频编码反变换运算的并行结构构造方法,有效缩短 反变换算法的处理时间,加快了编解码过程,且可W快速有效的进行反变换,同时降低了计 算的复杂度。
【附图说明】
[0010] 图1为邻接互连的2X4二维处理元阵列。
[0011] 图2为4X4反量化系数加载图。
[0012] 图3为垂直反变换的中间变量流程图。
[0013] 图4为垂直反变换的中间变量共享方式图。
[0014] 图5为水平反变换的中间变量流程图。
[0015] 图6为水平反变换的中间变量共享方式图。
【具体实施方式】
[0016] 2X4二维处理元阵列阳00-PE13,运8个处理元通过近邻互连组成二维处理元阵 列。
[0017] 变换单元灯ransform化it,简写TU)是H. 265/肥VC中的一个基本概念。一般来 说,TU大小可W为4X 4到64X64。在编码的过程中,TU是进行变换量化和反变换反量化 的基本单元。
[0018] 本发明提供的一种用于高效视频编码反变换运算的并行结构构造方法,其包含的 具体实现步骤为: 第一步:由于视频阵列处理器采用邻接互连的数据传输方式,所W考虑到PE间共享数 据的传输距离问题,将4X4的反量化系数X加载到PEOO至PE13中的数据寄存器中,其中 XOO和X02存放在阳00中,X20和X22存放在阳Ol中,XlO和X12存放在阳02中,X30和 X32存放在阳03中,XOl和X03存放在阳10中,Xll和X13存放在阳11中,X21和X23存 放在阳12中,X31和X33存放在阳13中。
[0019] 第二步:根据公式(1)和公式(2)分别配置阳00、PE01、阳02、阳03和阳10、PE11、 阳12、阳13的指令,计算出垂直反变换的各中间变量MO、Ml、M2和M3,其中阳00通过对XOO 和X02进行移位加法和减法运算分别得到MOO和MOl,PEOl通过对X20和X22进行移位加 法和减法运算分别得到M20和M21,PE02通过对XlO和X12进行移位加法和减法运算分别 得到MlO和M11,PE03通过对X30和X32进行移位加法和减法运算分别得到M30和M31。
[0020] 堪i.
口) 第S步:根据公式(3),通过垂直方向相邻PE之间共享寄存器数据完成反变换中的1 维变换。PEOO和PElO通过对共享数据MOl和M03进行减法和加法运算分别得到ZOO、Z30 和Z10、Z20 ;阳Ol和阳11通过对共享数据M21和M23进行减法和加法运算分别得到Z02、 Z32和Z12、Z22 ;PE02和PE12通过对共享数据Mll和M13进行减法和加法运算分别得到 Z0UZ31和Z1UZ21 ;阳03和阳13通过对共享数据M31和M33进行减法和加法运算分别得 到 Z03、Z13 和 Z23、Z33。
[0021]
I議 第五步:根据公式(4)和公式(5)分别配置阳00、PE01、阳10、PE11和阳02、PE03、阳12、 PE13的指令,计算出水平反变换的各中间变量NO、N1、N2和N3,其中PEOO和PEOl通过对 共享数据Z02和Z30进行移位加法和减法运算分别得到N00、N01和M30、N31,PE02和PE03 通过对共享数据Z03和Z31进行移位加法和减法运算分别得到N02、N03和N32、N33, PElO 和PEll通过对共享数据Z12和Z20进行移位加法和减法运算分别得到N10、Nll和N20、 N21,PE12和PE13通过对共享数据Z13和Z21进行移位加法和减法运算分别得到N12、N13 和 N22、N23。
[0022] 誦f 錢參 第六步:根据公式(6),通过水平方向相邻PE之间共享寄存器数据得到反变换的最终 结果,其中PEOO和PE02通过对共享数据N03和NOl进行减法和加法运算分别得到Y00、Y03 和YOU Y02 ;PE01和PE03通过对共享数据N33和N31进行减法和加法运算分别得到Y30、 Y33和Y31、Y32 ;PE10和PE12通过对共享数据N13和Nll进行减法和加法运算分别得到 Y10、Y13和Y1UY12 ;阳11和阳13通过对共享数据N23和N21进行减法和加法运算分别得 到 Y20、Y23 和 Y2UY22。
[0023]
'纖穿: 最后应说明的是:显然,上述实施仅仅是为清楚地说明本发明所作的举例,而并非对实 施方式的限定。对于所述领域的普通技术人员来说,凡是依据本发明的技术实质对W上实 施例所做的任何简单修改,等同变化与修饰,均仍属本发明技术方案的保护范围。
【主权项】
1. 一种用于高效视频编码反变换运算的并行结构构造方法,其特征在于:在邻接互连 的2X4二维处理元阵列(PE00-PE13 )上对4X4的TU进行反变换运算的并行处理。2. 根据权利要求书1所述的一种用于高效视频编码反变换运算的并行结构构造方法, 其特征在于:将4X4的反量化数据(X00和X02、X20和X22、X10和X12、X30和X32、X01和 X03、X21和X23、XII和X13、X31和X33)从内存分别加载到处理元阵列(PE00-PE13)的数 据寄存器中,以并行方式依次完成基于奇偶分解运算的垂直和水平反变换。3. 根据权利要求书2所述的一种用于高效视频编码反变换运算的并行结构构造方法, 其基于奇偶分解运算的垂直反变换特征在于:处理元阵列(PE00-PE13)分别对反量化数据 进行加载,等数据加载完成,执行奇偶分解运算,分别对输入数据(X00和X02、X20和X22、 X10和X12、X30和X32、X01和X03、X21和X23、X11和X13、X31和X33)进行逐级移位和加 减运算,得到垂直反变换的中间变量(M00和M01、M20和M21、M10和Mil、M30和M31、M02 和M03、M22和M23、M12和M13、M32和M33);垂直方向相邻处理元(PEOO和PE10, PE01和 PE1UPE02和PE12、PE03和PE13)之间对中间变量(M00-M33)通过加减运算得到垂直反变 换结果(ZOO 和 Z0UZ20 和 Z2UZ10 和 Z1UZ30 和 Z3UZ02 和 Z03、Z22 和 Z23、Z12 和 Z13、 Z32 和 Z33)。4. 根据权利要求书2、3所述的一种用于高效视频编码反变换运算的并行结构构造方 法,其基于奇偶分解运算的水平反变换特征在于:水平方向相邻处理元(ΡΕ00和PE01,PE02 和PE03、PE10和PE1UPE12和PE13)之间对垂直反变换结果(Z00-Z33)通过移位和加减运 算得到水平反变换的中间变量(N00和N0UN20和N2UN10和N1UN30和N3UN02和N03、 N22 和 N23、N12 和 N13、N32 和 N33);水平方向间隔处理元(ΡΕ00 和 PE02,PE01 和 PE03、PE10 和PE12、PE11和PE13)之间对中间变量(N00-N33)通过加减运算得到最终的反变换结果 (Y00-Y33)。
【文档编号】H04N19/436GK105847840SQ201510795422
【公开日】2016年8月10日
【申请日】2015年11月18日
【发明人】刘镇弢, 王杏军, 蒋林, 刘有耀
【申请人】西安邮电大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1