视频解码装置、视频解码方法以及程序的制作方法

文档序号:9671197阅读:473来源:国知局
视频解码装置、视频解码方法以及程序的制作方法
【专利说明】视频解码装置、视频解码方法以及程序
[0001 ] 本申请是申请日为2011年7月8日、申请号为201180034498.8、发明名称为“视频编码装置、视频解码装置、视频编码方法、视频解码方法以及程序”的发明专利申请的分案申请。
技术领域
[0002]本发明涉及使用像素比特长度增加和非压缩编码的视频编码装置和视频解码装置。
【背景技术】
[0003]作为旨在用于视频信息的高效传输和积累的视频编码方案,在非专利文献(NPL)2中描述了 IS0/IEC 14496-10高级视频编码(AVC)标准的编码方案。此外,NPL 1通过在视频编码之后扩展(增加)输入图像的像素比特长度以增强帧内预测和运动补偿预测(帧间预测)的运算精度,提出了对视频编码的压缩效率的改进。
[0004]专利文献(PTL)l提出了每个预定的编码单元在熵编码与非压缩编码(PCM编码)之间切换,以保证用于视频编码装置或视频解码装置的固定处理时间。
[0005]引用列表
[0006]专利文献
[0007]PTL 1:日本专利申请公开N0.2004-135251
[0008]非专利文献
[0009]NPL 1:2006年,J-009,Forum on Informat1n Technology 2006,Reiko Noda、Takeshi Chujoh的“Improving Video Coding Efficiency by Pixel Bit-depthIncrease,,
[0010]NPL 2:IS0/IEC 14496-10高级视频编码

【发明内容】

[0011]技术问题
[0012]图16是显示了通过简单地组合NPL1中所述的技术和PTL 1中所述的技术获得的视频编码装置的方框图。在下文中,图16中所示的视频编码装置被称为典型视频编码装置。
[0013]下面参考图16来描述接收数字化视频的每个帧的输入并且输出比特流的典型视频编码装置的结构和操作。
[0014]图16中所示的视频编码装置包括像素比特长度增加单元101、变换器/量化器102、熵编码器103、逆变换器/逆量化器104、缓冲器105、预测器106、PCM编码器107、PCM解码器108、复用的数据选择器109、复用器110、开关121和开关122。
[0015]图16中所示的视频编码装置将每个帧分割成被称为宏块(MB)的16X16像素大小的块,并且从帧的左上角开始顺序地对每个MB进行编码。在NPL 2中所述的AVC中,进一步将每个MB分割成4 X 4像素大小的块,并且对每个4 X 4像素大小的块进行编码。
[0016]图17是显示了在帧具有QCIF(四分之一通用中间格式)的空间分辨率的情况下块分割的示例的说明图。为了简化起见,以下通过仅关注于亮度的像素值来描述每个组件的操作。
[0017]像素比特长度增加单元101基于从外部设置的像素比特长度增加信息,增加经块分割的输入视频的像素比特长度。将bit_depth_luma作为输入视频的像素比特长度,并且将increased_bit_depth_luma作为像素比特长度增加信息(增加的像素比特长度)。像素比特长度增加单元101将输入视频的每个像素值向左移increased_bit_depth_luma个比特。结果,像素比特长度增加单元101的输出数据具有bit_depth_luma+increased_bit_depth_luma个比特的像素比特长度。
[0018]从像素比特长度增加单元101输出的像素比特长度已增加的图像中减去从预测器106提供的预测信号,并且将结果图像输入到变换器/量化器102。存在两种类型的预测信号,即帧内预测信号和帧间预测信号。下面描述每种预测信号。
[0019]帧内预测信号是基于与当前画面具有相同显示时间的重构画面的图像创建的预测信号,并且存储在缓冲器105中。参考NPL2中亮度样本的8.3.1 Intra_4 X 4预测过程,亮度样本的8.3.2Intra_8 X 8预测过程,亮度样本的8.3.3Intra_16 X 16预测过程,三种块大小(即,Intra_4 X 4、Intra_8 X 8和Intra_16 X 16)的帧内预测模式可用于帧内预测。
[0020]如根据图18(A)和18(C)可以理解的,Intra_4X4和Intra_8X8分别是4X4块大小和8X8块大小的帧内预测。图18(A)和18(C)中的每个圆圈(ο)指示用于帧内预测的参考像素,即与当前画面具有相同显示时间的重构画面的像素。
[0021]在Intra_4X4的帧内预测中,直接将重构的周边像素设置为参考像素,并且用于在图18(B)中所示的9个方向中进行填充(外插)以形成预测信号。在Intra_8X8的帧内预测中,将通过图18(C)中的右箭头下方显示的低通滤波器(1/2、1/4、1/2)对重构画面的图像的周边像素进行平滑而获得的像素设置为参考信号,并且用于在图18(B)中所示的9个方向中进行外插以形成预测信号。
[0022]如图19(A)中所示,Intra_16X16是16X16块大小的帧内预测。如图18(A)、18(B)和18(C)中所示的示例,图19(A)中的每个圆圈(ο)指示用于帧内预测的参考像素,即与当前画面具有相同显示时间的重构画面的像素。在Intra_16X 16的帧内预测中,直接将重构图像的周边像素设置为参考像素,并且用于在图19(B)中所示的4个方向中进行外插以形成预测信号。
[0023 ]在下文中,使用帧内预测信号编码的MB被称为帧内MB,帧内预测的块大小被称为帧内预测模式,并且外插的方向被称为帧内预测方向。
[0024]帧间预测信号是根据与当前画面具有不同显示时间的重构画面的图像创建的预测信号,并且存储在缓冲器105中。在下文中,使用帧间预测信号编码的MB被称为帧间MB。可以从例如16X16、16X8、8X16、8X8、8X4、4X8和4X4中选择帧间MB的块大小。
[0025]图20是显示了使用16X16块大小作为示例的帧间预测的示例的说明图。在图20中显示的运动向量MV=(mvx,mvy)是帧间预测的一个预测参数,其指示与要编码的块相关的参考画面的帧间预测块(帧间预测信号)的转换量。在AVC中,帧间预测的预测参数不仅包括表示与要编码的块的要编码的画面相关的帧间预测信号的参考画面的方向的帧间预测方向,而且还包括标识要编码的块的帧间预测的参考画面的参考画面索引。这是因为,在AVC中,存储在缓冲器105中的多个参考画面可用于帧间预测。
[0026]在NPL2中的8.4帧间预测过程中更详细地描述了帧间预测。
[0027]在下文中,使用帧间预测信号编码的MB被称为帧间MB,帧间预测的块大小被称为帧间预测模式,并且帧间预测的方向被称为帧间预测方向。
[0028]仅包括帧内MB的编码画面被称为I画面。不仅包括帧内MB而且还包括帧间MB的编码画面被称为P画面。包括不是使用一个参考画面而是同时使用两个参考画面用于帧间预测的帧间MB的编码画面被称为B画面。在B画面中,与要编码的块的要编码的画面相关的帧间预测信号的参考画面的方向指向过去的帧间预测被称为前向预测,与要编码的块的要编码的画面相关的帧间预测信号的参考画面的方向指向未来的帧间预测被称为后向预测,并且涉及过去和未来二者的帧间预测被称为双向预测。
[0029]变换器/量化器102对已减去预测信号的像素比特长度已增加的图像(预测误差图像)进行频率变换。
[0030]变换器/量化器102利用根据像素比特长度增加单元101的增加的像素比特长度increased_bit_depth_luma的量化步长Qs,进一步量化经频率变换的预测误差图像(频率变换系数)。将Qsi_作为正常量化步长。然后,作为示例,。在下文中,经量化的频率变换系数被称为变换量化值。
[0031]熵编码器103对预测参数和变换量化值进行熵编码。预测参数是与MB预测相关的信息,如上述帧内MB/帧间MB、帧内预测模式、帧内预测方向、帧间MB块大小和运动向量。
[0032]逆变换器/逆量化器104利用根据像素比特长度增加单元101的增加的像素比特长度increased_bi t_depth_luma的量化步长,对变换量化值进行逆量化。逆变换器/逆量化器104进一步对通过逆量化获得的频率变换系数进行逆频率变换。将预测信号添加到通过逆频率变换获得的重构预测误差图像中,并且将结果图像提供给开关122。
[0033]复用的数据选择器109监视到熵编码器103的每个预定编码单元(例如宏块)的输入数据量。在熵编码器103能够在与预定编码单元相对应的处理时间之内对输入数据进行熵编码的情况下,复用的数据选择器109控制开关121选择熵编码器103的输出数据。结果,经由开关121将熵编码器103的输出数据提供给复用器110。复用的数据选择器109进一步控制开关122选择逆变换器/逆量化器104的输出数据。结果,经由开关122将逆变换器/逆量化器104的输出数据提供给缓冲器105。
[0034]在熵编码器103不能在该处理时间之内对输入数据进行熵编码的情况下,复用的数据选择器109控制开关121选择PCM编码器107通过对像素比特长度增加单元101的输出数据进行PCM编码而获得的输出数据。结果,经由开关121将PCM编码器107的输出数据提供给复用器110。复用的数据选择器109进一步控制开关122选择PCM解码器108通过对PCM编码器107的输出数据进行PCM解码而获得的输出数据。结果,经由开关122将PCM解码器108的输出数据提供给复用器110。
[0035]缓冲器105存储经由开关122提供的重构图像。每帧的重构图像被称为重构画面。
[0036]复用器110将像素比特长度增加信息与熵编码器103的输出数据和PCM编码器107的输出数据复用,并且输出复用结果。
[0037]典型的视频编码装置基于上述操作创建比特流。
[0038]在使用上述典型技术的情况下,既能够通过像素比特长度扩展,增强帧内预测或帧间预测的运算精度,又能够保证用于视频编码装置或视频解码装置的固定处理时间。
[0039]但是,在上述典型技术中,对像素比特长度增加的图像进行了PCM编码,这导致了PCM编码的输出数据增加了像素比特长度增加量却没有获得PSNR(峰值信噪比)改进的问题。例如,在bit_depth_luma是8个比特并且increased_bit_depth_luma是8个比特的情况下,PCM编码的输出数据是16个比特,这是8比特输入图像的两倍。
[0040]鉴于此,本发明的一个目的在于在基于像素比特长度增加和PCM编码的视频编码中,抑制PCM编码的输出数据增加。
[0041 ]对问题的解决方案
[0042]根据本发明的一种视频解码装置包括:熵解码单元,其对比特流中包括的图像的已变换数据进行熵解码;非压缩解码单元,其对该比特流中包括的图像的经非压缩编码的数据进行非压缩解码;像素比特长度增加单元,其增加由该非压缩编码单元产生的经解码的图像的像素比特长度;以及解码控制单元,其控制该熵解码单元和该非压缩解码单元,其中该像素比特长度增加单元利用与向该熵解码单元的输入数据相对应的图像的像素比特长度来量化与向该非压缩解码单元的输入数据相对应的图像的像素比特长度。
[0043]根据本发明的一种视频解码方法包括:对比特流中包括的图像的已变换数据进行熵解码;对该比特流中包括的图像的经非压缩编码的数据进行非压缩解码;控制该熵解码和该非压缩解码;以及增加与向该非压缩编码的输入数据相对应的图像的像素比特长度,以使得与向该非压缩解码的输入数据相对应的图像的像素比特长度利用与向该熵解码的输入数据相对应的图像的像素比特长度而被量化。
[0044]根据本发明的一种存储视频解码程序的计算机可读信息记录介质,该视频解码程序在被处理器执行时执行:对比特流中包括的图像的已变换数据进行熵解码的处理;对该比特流中的图像的经非压缩编码的数据进行非压缩解码的处理;控制该熵解码和该非压缩解码的处理;以及增加与向该非压缩编码的输入数据相对应的图像的像素比特长度以使得与向该非压缩解码的输入数据相对应的图像的像素比特长度利用与向该熵解码的输入数据相对应的图像的像素比特长度而被量化的处理。
[0045]本发明的有利效果
[0046]根据本发明,能够在基于像素比
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1