视频解码装置、视频解码方法以及程序与流程

文档序号:12772499阅读:263来源:国知局
视频解码装置、视频解码方法以及程序与流程
视频解码装置、视频解码方法以及程序本申请是申请日为2011年7月8日、申请号为201180034498.8、发明名称为“视频编码装置、视频解码装置、视频编码方法、视频解码方法以及程序”的发明专利申请的分案申请。技术领域本发明涉及使用像素比特长度增加和非压缩编码的视频编码装置和视频解码装置。

背景技术:
作为旨在用于视频信息的高效传输和积累的视频编码方案,在非专利文献(NPL)2中描述了ISO/IEC14496-10高级视频编码(AVC)标准的编码方案。此外,NPL1通过在视频编码之后扩展(增加)输入图像的像素比特长度以增强帧内预测和运动补偿预测(帧间预测)的运算精度,提出了对视频编码的压缩效率的改进。专利文献(PTL)1提出了每个预定的编码单元在熵编码与非压缩编码(PCM编码)之间切换,以保证用于视频编码装置或视频解码装置的固定处理时间。引用列表专利文献PTL1:日本专利申请公开No.2004-135251非专利文献NPL1:2006年,J-009,ForumonInformationTechnology2006,ReikoNoda、TakeshiChujoh的“ImprovingVideoCodingEfficiencybyPixelBit-depthIncrease”NPL2:ISO/IEC14496-10高级视频编码

技术实现要素:
技术问题图16是显示了通过简单地组合NPL1中所述的技术和PTL1中所述的技术获得的视频编码装置的方框图。在下文中,图16中所示的视频编码装置被称为典型视频编码装置。下面参考图16来描述接收数字化视频的每个帧的输入并且输出比特流的典型视频编码装置的结构和操作。图16中所示的视频编码装置包括像素比特长度增加单元101、变换器/量化器102、熵编码器103、逆变换器/逆量化器104、缓冲器105、预测器106、PCM编码器107、PCM解码器108、复用的数据选择器109、复用器110、开关121和开关122。图16中所示的视频编码装置将每个帧分割成被称为宏块(MB)的16×16像素大小的块,并且从帧的左上角开始顺序地对每个MB进行编码。在NPL2中所述的AVC中,进一步将每个MB分割成4×4像素大小的块,并且对每个4×4像素大小的块进行编码。图17是显示了在帧具有QCIF(四分之一通用中间格式)的空间分辨率的情况下块分割的示例的说明图。为了简化起见,以下通过仅关注于亮度的像素值来描述每个组件的操作。像素比特长度增加单元101基于从外部设置的像素比特长度增加信息,增加经块分割的输入视频的像素比特长度。将bit_depth_luma作为输入视频的像素比特长度,并且将increased_bit_depth_luma作为像素比特长度增加信息(增加的像素比特长度)。像素比特长度增加单元101将输入视频的每个像素值向左移increased_bit_depth_luma个比特。结果,像素比特长度增加单元101的输出数据具有bit_depth_luma+increased_bit_depth_luma个比特的像素比特长度。从像素比特长度增加单元101输出的像素比特长度已增加的图像中减去从预测器106提供的预测信号,并且将结果图像输入到变换器/量化器102。存在两种类型的预测信号,即帧内预测信号和帧间预测信号。下面描述每种预测信号。帧内预测信号是基于与当前画面具有相同显示时间的重构画面的图像创建的预测信号,并且存储在缓冲器105中。参考NPL2中亮度样本的8.3.1Intra_4×4预测过程,亮度样本的8.3.2Intra_8×8预测过程,亮度样本的8.3.3Intra_16×16预测过程,三种块大小(即,Intra_4×4、Intra_8×8和Intra_16×16)的帧内预测模式可用于帧内预测。如根据图18(A)和18(C)可以理解的,Intra_4×4和Intra_8×8分别是4×4块大小和8×8块大小的帧内预测。图18(A)和18(C)中的每个圆圈(o)指示用于帧内预测的参考像素,即与当前画面具有相同显示时间的重构画面的像素。在Intra_4×4的帧内预测中,直接将重构的周边像素设置为参考像素,并且用于在图18(B)中所示的9个方向中进行填充(外插)以形成预测信号。在Intra_8×8的帧内预测中,将通过图18(C)中的右箭头下方显示的低通滤波器(1/2、1/4、1/2)对重构画面的图像的周边像素进行平滑而获得的像素设置为参考信号,并且用于在图18(B)中所示的9个方向中进行外插以形成预测信号。如图19(A)中所示,Intra_16×16是16×16块大小的帧内预测。如图18(A)、18(B)和18(C)中所示的示例,图19(A)中的每个圆圈(o)指示用于帧内预测的参考像素,即与当前画面具有相同显示时间的重构画面的像素。在Intra_16×16的帧内预测中,直接将重构图像的周边像素设置为参考像素,并且用于在图19(B)中所示的4个方向中进行外插以形成预测信号。在下文中,使用帧内预测信号编码的MB被称为帧内MB,帧内预测的块大小被称为帧内预测模式,并且外插的方向被称为帧内预测方向。帧间预测信号是根据与当前画面具有不同显示时间的重构画面的图像创建的预测信号,并且存储在缓冲器105中。在下文中,使用帧间预测信号编码的MB被称为帧间MB。可以从例如16×16、16×8、8×16、8×8、8×4、4×8和4×4中选择帧间MB的块大小。图20是显示了使用16×16块大小作为示例的帧间预测的示例的说明图。在图20中显示的运动向量MV=(mvx,mvy)是帧间预测的一个预测参数,其指示与要编码的块相关的参考画面的帧间预测块(帧间预测信号)的转换量。在AVC中,帧间预测的预测参数不仅包括表示与要编码的块的要编码的画面相关的帧间预测信号的参考画面的方向的帧间预测方向,而且还包括标识要编码的块的帧间预测的参考画面的参考画面索引。这是因为,在AVC中,存储在缓冲器105中的多个参考画面可用于帧间预测。在NPL2中的8.4帧间预测过程中更详细地描述了帧间预测。在下文中,使用帧间预测信号编码的MB被称为帧间MB,帧间预测的块大小被称为帧间预测模式,并且帧间预测的方向被称为帧间预测方向。仅包括帧内MB的编码画面被称为I画面。不仅包括帧内MB而且还包括帧间MB的编码画面被称为P画面。包括不是使用一个参考画面而是同时使用两个参考画面用于帧间预测的帧间MB的编码画面被称为B画面。在B画面中,与要编码的块的要编码的画面相关的帧间预测信号的参考画面的方向指向过去的帧间预测被称为前向预测,与要编码的块的要编码的画面相关的帧间预测信号的参考画面的方向指向未来的帧间预测被称为后向预测,并且涉及过去和未来二者的帧间预测被称为双向预测。变换器/量化器102对已减去预测信号的像素比特长度已增加的图像(预测误差图像)进行频率变换。变换器/量化器102利用根据像素比特长度增加单元101的增加的像素比特长度increased_bit_depth_luma的量化步长Qs,进一步量化经频率变换的预测误差图像(频率变换系数)。将Qsluma作为正常量化步长。然后,作为示例,Qs=Qsluma*2increased_bit_depth_luma。在下文中,经量化的频率变换系数被称为变换量化值。熵编码器103对预测参数和变换量化值进行熵编码。预测参数是与MB预测相关的信息,如上述帧内MB/帧间MB、帧内预测模式、帧内预测方向、帧间MB块大小和运动向量。逆变换器/逆量化器104利用根据像素比特长度增加单元101的增加的像素比特长度increased_bit_depth_luma的量化步长,对变换量化值进行逆量化。逆变换器/逆量化器104进一步对通过逆量化获得的频率变换系数进行逆频率变换。将预测信号添加到通过逆频率变换获得的重构预测误差图像中,并且将结果图像提供给开关122。复用的数据选择器109监视到熵编码器103的每个预定编码单元(例如宏块)的输入数据量。在熵编码器103能够在与预定编码单元相对应的处理时间之内对输入数据进行熵编码的情况下,复用的数据选择器109控制开关121选择熵编码器103的输出数据。结果,经由开关121将熵编码器103的输出数据提供给复用器110。复用的数据选择器109进一步控制开关122选择逆变换器/逆量化器104的输出数据。结果,经由开关122将逆变换器/逆量化器104的输出数据提供给缓冲器105。在熵编码器103不能在该处理时间之内对输入数据进行熵编码的情况下,复用的数据选择器109控制开关121选择PCM编码器107通过对像素比特长度增加单元101的输出数据进行PCM编码而获得的输出数据。结果,经由开关121将PCM编码器107的输出数据提供给复用器110。复用的数据选择器109进一步控制开关122选择PCM解码器108通过对PCM编码器107的输出数据进行PCM解码而获得的输出数据。结果,经由开关122将PCM解码器108的输出数据提供给复用器110。缓冲器105存储经由开关122提供的重构图像。每帧的重构图像被称为重构画面。复用器110将像素比特长度增加信息与熵编码器103的输出数据和PCM编码器107的输出数据复用,并且输出复用结果。典型的视频编码装置基于上述操作创建比特流。在使用上述典型技术的情况下,既能够通过像素比特长度扩展,增强帧内预测或帧间预测的运算精度,又能够保证用于视频编码装置或视频解码装置的固定处理时间。但是,在上述典型技术中,对像素比特长度增加的图像进行了PCM编码,这导致了PCM编码的输出数据增加了像素比特长度增加量却没有获得PSNR(峰值信噪比)改进的问题。例如,在bit_depth_luma是8个比特并且increased_bit_depth_luma是8个比特的情况下,PCM编码的输出数据是16个比特,这是8比特输入图像的两倍。鉴于此,本发明的一个目的在于在基于像素比特长度增加和PCM编码的视频编码中,抑制PCM编码的输出数据增加。对问题的解决方案根据本发明的一种视频解码装置包括:提取单元,其从比特流提取亮度的像素比特长度增加信息和色差的像素比特长度增加信息;熵解码单元,其对该比特流中包括的图像的已变换数据进行熵解码;非压缩解码单元,其对该比特流中包括的图像的经非压缩编码的数据进行非压缩解码;以及解码控制单元,其控制该熵解码单元和该非压缩解码单元,其中与该非压缩解码单元的输入数据相对应的图像的像素比特长度不同于与该熵解码单元的输入数据相对应的图像的像素比特长度,并且其中通过该非压缩解码获得的已解码的图像的像素比特长度基于该亮度的像素比特长度增加信息和色差的像素比特长度增加信息而被增加。根据本发明的一种视频解码方法包括:从比特流提取亮度的像素比特长度增加信息和色差的像素比特长度增加信息;对该比特流中包括的图像的已变换数据进行熵解码;对该比特流中包括的图像的经非压缩编码的数据进行非压缩解码;以及控制该熵解码和该非压缩解码,其中与该非压缩解码的输入数据相对应的图像的像素比特长度不同于与该熵解码的输入数据相对应的图像的像素比特长度,并且其中通过该非压缩解码获得的已解码的图像的像素比特长度基于该亮度的像素比特长度增加信息和色差的像素比特长度增加信息而被增加。根据本发明的一种存储视频解码程序的计算机可读信息记录介质,该视频解码程序在被处理器执行时执行:从比特流提取亮度的像素比特长度增加信息和色差的像素比特长度增加信息的处理;对该比特流中的图像的已变换数据进行熵解码的处理;对该比特流中的图像的经非压缩编码的数据进行非压缩解码的处理;以及控制该熵解码和该非压缩解码的处理,其中与该非压缩解码的输入数据相对应的图像的像素比特长度不同于与该熵解码的输入数据相对应的图像的像素比特长度,并且其中通过该非压缩解码获得的已解码的图像的像素比特长度基于该亮度的像素比特长度增加信息和色差的像素比特长度增加信息而被增加。本发明的有利效果根据本发明,能够在基于像素比特长度增加和PCM编码的视频编码中抑制PCM编码的输出数据增加。附图说明图1是示例性实施方式1中的视频编码装置的方框图。图2是显示了序列参数中的像素比特长度增加信息的说明图。图3是显示了示例性实施方式1中的视频编码装置的处理的流程图。图4是示例性实施方式2中的视频编码装置的方框图。图5是显示了示例性实施方式2中的视频编码装置的处理的流程图。图6是另一个示例性实施方式中的视频编码装置的方框图。图7是显示了序列参数中的像素比特长度增加信息的另一个示例的说明图。图8是显示了序列参数中的像素比特长度增加信息的又一个示例的说明图。图9是显示了序列参数中的像素比特长度增加信息的另一个示例的说明图。图10是显示了能够实现根据本发明的视频编码装置和视频解码装置的功能的信息处理系统的结构示例的方框图。图11是显示了根据本发明的视频编码装置的主要部分的方框图。图12是显示了根据本发明的另一个视频编码装置的主要部分的方框图。图13是显示了根据本发明的又一个视频编码装置的主要部分的方框图。图14是显示了根据本发明的视频解码装置的主要部分的方框图。图15是显示了根据本发明的另一个视频解码装置的主要部分的方框图。图16是显示了典型视频编码装置的方框图。图17是显示了块分割的一个示例的说明图。图18(A)、18(B)和18(C)是显示了预测类型的说明图。图19(A)和19(B)是显示了预测类型的说明图。图20是显示了使用16×16块大小作为示例的帧间预测的一个示例的说明图。具体实施方式示例性实施方式1此示例性实施方式中的视频编码装置包括:用于使得与熵编码的输出数据相对应的图像的像素比特长度和与PCM编码的输出数据相对应的图像的像素比特长度彼此不同的装置;用于基于像素比特长度增加信息来增加PCM解码的已解码图像的像素比特长度的装置;以及用于将像素比特长度增加信息复用到比特流中的装置。如图1中所示,此示例性实施方式中的视频编码装置除了图16中所示的典型的视频编码装置中包括的像素比特长度增加单元101、变换器/量化器102、熵编码器103、逆变换器/逆量化器104、缓冲器105、预测器106、PCM编码器107、PCM解码器108、复用的数据选择器109、复用器110、开关121以及开关122之外,还包括用于基于像素比特长度增加信息来增加PCM解码器108的已解码图像的像素比特长度的像素比特长度增加单元111。当将图1和图16进行比较时,可以理解,此示例性实施方式中的视频编码装置向PCM编码器107提供像素比特长度增加之前的输入图像,以便使得与熵编码的输出数据相对应的图像的像素比特长度和与PCM编码的输出数据相对应的图像的像素比特长度彼此不同。与熵编码的输出数据相对应的图像是向变换器/量化器102提供的像素比特长度已增加的输入视频的图像,以及从逆变换器/逆量化器104提供的像素比特长度已增加的输入视频的图像的重构图像。与PCM编码的输出数据相对应的图像是向PCM编码器107提供的像素比特长度未增加的输入视频的图像,以及从PCM解码器108提供的像素比特长度未增加的输入视频的经PCM解码的图像。像素比特长度增加单元101基于从外部设置的像素比特长度增加信息,增加经块分割的输入视频的像素比特长度。将bit_depth_luma作为输入视频的亮度的像素比特长度,并且将increased_bit_depth_luma作为亮度的像素比特长度增加信息(增加的像素比特长度)。像素比特长度增加单元101将输入视频的亮度的每个像素值向左移increased_bit_depth_luma个比特。结果,像素比特长度增加单元101的输出数据具有bit_depth_luma+increased_bit_depth_luma个比特的像素比特长度。同样,对于色差(Cb和Cr分量),将bit_depth_chroma作为输入视频的色差的像素比特长度,并且将increased_bit_depth_chroma作为色差的像素比特长度增加信息。像素比特长度增加单元101将输入视频的色差的每个像素值向左移increased_bit_depth_luma个比特。从像素比特长度增加单元101输出的像素比特长度已增加的图像中减去从预测器106提供的预测信号,并且向变换器/量化器102输入结果图像。变换器/量化器102对已减去预测信号的像素比特长度已增加的图像(预测误差图像)进行频率变换。变换器/量化器102利用根据像素比特长度增加单元101的增加的像素比特长度increased_bit_depth_luma和increased_bit_depth_chroma的量化步长Qs,进一步量化经频率变换的预测误差图像(频率变换系数)。将Qsluma作为亮度的正常量化步长。然后,作为示例,Qs=Qsluma*2increased_bit_depth_luma。在下文中,经量化的频率变换系数被称为变换量化值。熵编码器103对从预测器106提供的预测参数和从变换器/量化器102提供的变换量化值进行熵编码。预测参数是与宏块预测相关的信息,如帧内MB/帧间MB、帧内预测模式、帧内预测方向、帧间MB块大小和运动向量。逆变换器/逆量化器104利用根据像素比特长度增加单元101的增加的像素比特长度increased_bit_depth_luma和increased_bit_depth_chroma的量化步长,对变换量化值进行逆量化。逆变换器/逆量化器104进一步对通过逆量化获得的频率变换系数进行逆频率变换。将预测信号添加到通过逆频率变换获得的重构预测误差图像中,并且将结果图像提供给开关122。PCM编码器107对像素比特长度的增加之前的输入图像进行PCM编码。PCM编码器107的亮度的输出数据pcm_sample_luma[i]具有输入视频的亮度的像素比特长度bit_depth_luma。在这里,i(0≤i≤255)是宏块之中的光栅扫描顺序的索引。同样,PCM编码器107的色差的输出数据pcm_sample_chroma[i](i:0≤i≤127)具有输入视频的色差的像素比特长度bit_depth_chroma。PCM解码器108对pcm_sample_luma[i]和pcm_sample_chroma[i]进行PCM解码。在下文中,PCM解码还被称为PCM数据读取。像素比特长度增加单元111将PCM数据读取pcm_sample_luma[i]向左移increased_bit_depth_chroma个比特。结果,经由PCM解码器108获得的重构图像具有bit_depth_luma+increased_bit_depth_luma个比特,并且提供给开关122。同样,将pcm_sample_chroma[i]向左移increased_bit_depth_chroma个比特,并且提供给开关122。复用的数据选择器109监视到熵编码器103的每个预定编码单元(例如宏块)的输入数据量。在熵编码器103能够在与预定编码单元相对应的处理时间之内对输入数据进行熵编码的情况下,复用的数据选择器109控制开关121选择熵编码器103的输出数据。结果,经由开关121将熵编码器103的输出数据提供给复用器110。复用的数据选择器109进一步控制开关122选择逆变换器/逆量化器104的输出数据。结果,经由开关122将逆变换器/逆量化器104的输出数据提供给缓冲器105。在熵编码器103不能在该处理时间之内对输入数据进行熵编码的情况下,复用的数据选择器109首先使熵编码器103进行编码并且输出指示宏块是PCM的帧内MB的信息。详细地说,当符合NPL2中的7.3.5宏块层句法时,对mb_type进行熵编码并且输出为I_PCM。在此之后,对熵编码器103的输出比特进行比特校准。详细地说,当符合NPL2中的7.3.5宏块层句法时,熵编码器103向复用器110提供预定数量的pcm_alignment_zero_bit。此外,熵编码器103初始化编码引擎以便进行后续的编码。在用于NPL2中的算术编码引擎(富含信息的)的9.3.4.1初始化过程中描述了编码引擎初始化的一个示例。复用的数据选择器109进一步控制开关121选择PCM编码器107的输出数据。结果,经由开关121将PCM编码器107的输出数据提供给复用器110。最后,复用的数据选择器109控制开关122选择像素比特长度增加单元111的输出数据。结果,经由开关122将像素比特长度增加单元111的输出数据提供给缓冲器105。在这里,像素比特长度增加单元111通过将通过读取PCM编码器107的输出数据pcm_sample_luma[i]而获得的PCM解码器108的输出数据pcm_sample_luma[i]向左移increased_bit_depth_luma个比特,来增加比特的数目。同样,像素比特长度增加单元111通过将通过读取PCM编码器107的输出数据pcm_sample_chroma[i]而获得的PCM解码器108的输出数据pcm_sample_chroma[i]向左移increased_bit_depth_chroma个比特,来增加比特的数目。复用器110将像素比特长度增加信息与熵编码器103的输出数据和PCM编码器107的输出数据复用,并且输出复用结果。当符合NPL2中的句法功能、类别和描述符的规范时,可以如图2中示出的列表中所示的,在序列参数的bit_depth_luma_minus8和bit_depth_chroma_minus8之后,复用像素比特长度增加信息(increased_bit_depth_luma和increased_bit_depth_chroma)。在这里,bit_depth_luma_minus8是通过从输入视频的亮度的像素比特长度bit_depth_luma减去8而获得的值,bit_depth_chroma_minus8是通过从输入视频的色差的像素比特长度bit_depth_chroma减去8而获得的值,increased_bit_depth_luma是亮度的增加像素比特长度,并且increased_bit_depth_chroma是色差的增加像素比特长度。图2中所示的列表中的表示(“C”和“描述符”)符合例如NPL2中的句法功能、类别和描述符的7.2规范。在此示例性实施方式中的视频编码装置基于上述操作来创建比特流。在不能在处理时间之内进行熵编码的情况下(这是本发明的特征),以下参考图3中的流程图描述熵编码器103、PCM编码器107、PCM解码器108和像素比特长度增加单元111的操作。如图3中所示,在步骤S101中,熵编码器103将mb_type熵编码为I_PCM并且将其提供给复用器110,以便保证用于视频编码装置或视频解码装置的固定处理时间。在步骤S102中,熵编码器103向复用器110提供pcm_alignment_zero_bit,以对输出比特进行字节校准。在步骤S103中,熵编码器103初始化用于后续熵编码的编码引擎。在步骤S104中,PCM编码器107对像素比特长度增加之前的输入图像进行PCM编码,并且将其提供给复用器110,从而不增加PCM编码的输出数据。在步骤S105中,PCM解码器108对PCM编码结果pcm_sample_luma[i]和pcm_sample_chroma[i]进行PCM解码(PCM数据读取)。在步骤S106中,像素比特长度增加单元111将PCM解码器108进行PCM数据读取的pcm_sample_luma[i]和pcm_sample_chroma[i]分别向左移increased_bit_depth_luma和increased_bit_depth_chroma个比特,以便增强后续的帧内预测和帧间预测的运算精度。因此,在不能在与预定编码单元相对应的处理时间内进行熵编码的情况下,熵编码器103和PCM编码器107如上所述地进行操作。在此示例性实施方式中的视频编码装置中,将像素比特长度增加之前的输入图像提供给PCM编码器107,以便使得与熵编码的输出数据相对应的图像的像素比特长度和与PCM编码的输出数据相对应的图像的像素比特长度彼此不同。该结构在基于像素比特长度增加和非压缩编码的视频编码中,允许抑制PCM编码的输出数据增加。此外,此示例性实施方式中的视频编码装置包括像素比特长度增加单元111,用于基于像素比特长度增加信息来增加PCM解码的已解码图像的像素比特长度。像素比特长度增加单元111可以抑制由于使像素比特长度彼此不同而导致的帧内预测和帧间预测的运算精度的降低。此外,在此示例性实施方式中的视频编码装置中,复用器110将像素比特长度增加信息复用到比特流中,从而在视频解码中等效地增加PCM解码的已解码图像的像素比特长度。该结构有助于增强视频编码装置和视频解码装置的互操作性。即,视频编码装置和视频解码装置彼此协作,能够抑制系统中的PCM编码的增加,并且还能够抑制帧内预测和帧间预测的运算精度的降低。示例性实施方式2此示例性实施方式中的视频解码装置解码这样一种比特流,在该比特流中与熵解码装置的输入数据相对应的图像的像素比特长度和与PCM解码装置的输入数据相对应的图像的像素比特长度彼此不同。与熵解码装置的输入数据相对应的图像是从后文所述的逆变换器/逆量化器206提供的像素比特长度已增加的输入视频的图像的重构图像。与PCM解码装置的输入数据相对应的图像是从后文所述的PCM解码器203提供的像素比特长度未增加的输入视频的经PCM解码的图像。如图4中所示的,此示例性实施方式中的视频解码装置包括解复用器201、解码控制器202、PCM解码器203、熵解码器204、像素比特长度增加单元205、逆变换器/逆量化器206、预测器207、缓冲器208、像素比特长度减少单元209、开关221和开关222。解复用器201对输入比特流进行解复用,以提取像素比特长度增加信息和经熵编码或经PCM编码的视频比特流。当符合NPL2中的句法功能、类别和描述符的规范时,提取如图2示出的列表中所示的序列参数的bit_depth_luma_minus8和bit_depth_chromaminus8之后的像素比特长度增加信息(increased_bit_depth_luma和increased_bit_depth_chroma)。熵解码器204对视频比特流进行熵解码。在宏块的mb_type不是I_PCM(PCM编码)的情况下,熵解码器204对预测参数和宏块的变换量化值进行熵解码,并且将它们提供给逆变换器/逆量化器206和预测器207。逆变换器/逆量化器206利用根据通过解复用提取的像素比特长度增加信息increased_bit_depth_luma和increased_bit_depth_chroma的量化步长,对亮度和色差的变换量化值进行逆量化。逆变换器/逆量化器206进一步对通过逆量化获得的频率变换系数进行逆频率变换。预测器207基于经熵解码的预测参数,使用存储在缓冲器208中的重构画面的图像来创建预测信号。将从预测器207提供的预测信号添加到由逆变换器/逆量化器206通过逆频率变换获得的重构预测误差图像中,并且将结果图像提供给开关222。解码控制器202改变开关222,从而将已添加了预测信号的重构预测误差图像提供给缓冲器208作为重构图像。在宏块的mb_type是PCM编码的情况下,解码控制器202使解复用器201对处于熵解码的中间的视频流进行字节校准。当符合NPL2中的7.3.5宏块层句法时,解码控制器202使解复用器201读取pcm_alignment_zero_bit,直到视频比特流被字节校准为止。解码控制器202然后使熵解码器204初始化解码引擎。在用于NPL2中的算术解码引擎的9.3.1.2初始化过程中描述了解码引擎初始化的一个示例。在此之后,解码控制器202改变开关221,从而将经字节校准的视频比特流提供给PCM解码器203。PCM解码器203对来自经字节校准的视频比特流的经PCM编码的亮度数据pcm_sample_luma[i]和色差数据pcm_sample_chroma[i]进行PCM解码(PCM数据读取)。像素比特长度增加单元205根据通过解复用提取的像素比特长度增加信息increased_bit_depth_luma和increased_bit_depth_chroma,分别将PCM数据读取pcm_sample_luma[i]和pcm_sample_chroma[i]向左移。当符合用于NPL2中的I_PCM宏块的8.3.5样本构建过程的描述时,根据下面的式(8-154’)和式(8-155’)计算经PCM解码的亮度图像S’L和经PCM解码的色差图像S’Cb和S’Cr。解码控制器202改变开关222,从而将像素比特长度已增加的经PCM解码的图像提供给缓冲器208作为重构图像。解码控制器202改变开关221,从而将解复用器201的输出数据提供给熵解码器204以便解码下一个宏块。像素比特长度减少单元209根据通过解复用提取的像素比特长度增加信息increased_bit_depth_luma和increased_bit_depth_chroma,减少存储在缓冲器208中的重构画面的像素比特长度,并且输出结果。此示例性实施方式中的视频编码装置基于上述操作创建解码图像。下面参考图5中的流程图来描述在宏块的mb_type是PCM编码的情况下(这是本发明的特征),解码控制器202、熵解码器204、PCM解码器203和像素比特长度增加单元205的操作。在步骤S201中,解复用器201读取pcm_alignment_zero_bit,以便对处于熵解码的中间的视频比特流进行字节校准。在步骤S202中,熵解码器204初始化解码引擎以便进行后续熵解码。在步骤S203中,PCM解码器203对PCM编码结果pcm_sample_luma[i]和pcm_sample_chroma[i]进行PCM解码(PCM数据读取)。在步骤S204中,像素比特长度增加单元205将PCM数据读取pcm_sample_luma[i]和pcm_sample_chroma[i]分别向左移increased_bit_depth_luma个比特和increased_bit_depth_chroma个比特,以便增强后续的帧内预测和帧间预测的运算精度。因此,在宏块的mb_type是PCM编码的情况下,解码控制器202、熵解码器204、PCM解码器203和像素比特长度增加单元205如上所述地进行操作。此示例性实施方式中的视频编码装置包括像素比特长度增加单元205,用于基于通过解复用提取的像素比特长度增加信息来增加PCM解码的已解码图像的像素比特长度。像素比特长度增加单元205可以抑制由于使与熵解码装置和PCM解码装置的输入相对应的图像的像素比特长度彼此不同而导致的帧内预测和帧间预测的运算精度的降低。此外,可以获得与视频解码中相同的重构图像,这有助于增强视频编码装置和视频解码装置的互操作性。即,视频编码装置和视频解码装置彼此协作,能够抑制系统中的PCM编码的增加,并且还能够抑制帧内预测和帧间预测的运算精度的降低。图1中所示的示例性实施方式1中的视频编码装置是将像素比特长度的增加之前的输入图像提供给PCM编码器107的视频编码装置,以便使得与熵编码的输出数据相对应的图像的像素比特长度和与PCM编码的输出数据相对应的图像的像素比特长度彼此不同。图6是显示了用于实现与图1中所示的视频编码装置相同的有利效果的另一个结构的视频编码装置的方框图。当与图1中所示的视频编码装置进行比较时,图6中所示的视频编码装置另外包括像素比特长度减少单元112。即,图6中所示的视频编码装置具有这样一种结构,在该结构中,接收像素比特长度已增加的图像的像素比特长度减少单元112向PCM编码器107提供基于像素比特长度增加信息的像素比特长度已减少的图像。如示例性实施方式1中所示,图6中所示的视频编码装置可以抑制PCM编码的输出数据的增加,并且还可以抑制由于使像素比特长度彼此不同而导致的帧内预测和帧间预测的运算精度的降低。在每个上述示例性实施方式中,重构画面的像素是像素比特长度已增加的像素。但是,为了减少用于存储重构画面的缓冲器的尺寸,可以设想这样一个示例性实施方式,在该实施方式中上述像素比特长度增加单元和像素比特长度减少单元用于缓冲器的输入/输出。而且,在这种示例性实施方式中,根据本发明可以实现对PCM编码的输出数据增加的抑制以及对由于使像素比特长度彼此不同而导致的帧内预测的运算精度降低的抑制。在每个上述示例性实施方式中,PCM解码器和像素比特长度增加单元是独立的功能块。但是,如根据式(8-154’)和式(8-155’)可以容易地理解的,可以将PCM解码器和像素比特长度增加单元集成为一个功能块。在每个上述示例性实施方式中,视频编码装置将increased_bit_depth_luma和increased_bit_depth_chroma在bit_depth_luma_minus8和bit_depth_chroma_minus8之后复用到比特流中,以便明确地用信号向视频解码装置(见图2)发送像素比特长度增加信息。可替换地,视频编码装置可以将像素比特长度增加之后的像素比特长度作为像素比特长度增加信息复用到比特流中,以便隐含地用信号向视频解码装置发送像素比特长度增加信息(在这里假设在视频编码装置和视频解码装置中输入视频的原始像素比特长度是8个比特)。在此情况下,视频编码装置将图7中所示的像素比特长度增加信息(internal_bit_depth_luma_minus8和internal_bit_depth_chroma_minus8)复用到序列参数而不是序列参数的bit_depth_luma_minus8和bit_depth_chroma_minus8中。在这里,internal_bit_depth_luma_minus8是increased_bit_depth_luma的值,并且internal_bit_depth_chroma_minus8是increased_bit_depth_chroma的值。在将图7中所示的像素比特长度增加信息复用到序列参数中的情况下,PCM编码器107对像素比特长度增加之前的输入图像进行PCM编码。即,PCM编码器107对8比特pcm_sample_luma[i]和pcm_sample_chroma[i]进行PCM编码。PCM解码器108对8比特pcm_sample_luma[i]和pcm_sample_chroma[i]进行解码。像素比特长度增加单元111将经PCM解码的pcm_sample_luma[i]和pcm_sample_chroma[i]分别向左移increased_bit_depth_luma个比特和increased_bit_depth_chroma个比特。与将图7中所示的像素比特长度增加信息复用到序列参数中的情况相对应的视频解码装置从该序列参数解复用像素比特长度增加信息(internal_bit_depth_luma_minus8和internal_bit_depth_chroma_minus8),并且如下计算increased_bit_depth_luma和increased_bit_depth_chroma。increased_bit_depth_luma=internal_bit_depth_luma_minus8increased_bit_depth_chroma=internal_bit_depth_chroma_minus8通过上述计算,视频解码装置可以解复用由视频编码装置隐含地用信号发送的像素比特长度增加信息。在上述视频编码装置隐含地用信号向视频解码装置发送像素比特长度增加信息的情况下,存在当输入视频的原始像素比特长度长于8个比特时由于无畸变而不能执行PCM编码的问题。例如,当输入视频的原始像素比特长度是10个比特时,利用8比特pcm_sample_luma[i]和pcm_sample_chroma[i]来产生量化畸变。当输入视频的原始像素比特长度是N个比特(N>8)时,为了支持无量化畸变的PCM编码,可以向图8中所示的序列参数添加pcm_sample_bit_depth_is_internal_bit_depth_flag,pcm_sample_bit_depth_is_internal_bit_depth_flag是指示PCM的比特长度是否是像素比特长度增加之后的像素比特长度的标志位。在pcm_sample_bit_depth_is_internal_bit_depth_flag是0的情况下,PCM编码器107对像素比特长度的增加之前的输入图像进行PCM编码。即,PCM编码器107对pcm_sample_luma[i]和pcm_sample_chroma[i]进行PCM编码。像素比特长度增加单元111将经PCM编码的pcm_sample_luma[i]和pcm_sample_chroma[i]分别向左移increased_bit_depth_luma(=internal_bit_depth_luma_minus8)个比特和increased_bit_depth_chroma(=internal_bit_depth_chroma_minus8)个比特。在pcm_sample_bit_depth_is_internal_bit_depth_flag是1的情况下,PCM编码器107对像素比特长度已增加的图像进行PCM编码。即,PCM编码器107对N比特(internal_bit_depth_luma_minus8+8个比特)的pcm_sample_luma[i]和N比特(internal_bit_depth_chroma_minus8+8个比特)的pcm_sample_chroma[i]进行PCM编码。PCM解码器108对N比特的pcm_sample_luma[i]和N比特的pcm_sample_chroma[i]进行PCM解码。像素比特长度增加单元111将经PCM解码的pcm_sample_luma[i]和pcm_sample_chroma[i]向左移0比特(即不将经PCM解码的pcm_sample_luma[i]和pcm_sample_chroma[i]向左移)。当输入视频的原始像素比特长度是N个比特(N>8)时,为了支持无量化畸变的PCM编码,如图9中所示,可以向序列参数添加分别作为亮度和色差的PCM的比特长度的pcm_sample_bit_depth_luma_minus8和pcm_sample_bit_depth_chroma_minus8,以代替pcm_sample_bit_depth_is_internal_bit_depth_flag。在向序列参数添加pcm_sample_bit_depth_luma_minus8和pcm_sample_bit_depth_chroma_minus8的情况下,PCM编码器107对pcm_sample_bit_depth_luma_minus8+8个比特的pcm_sample_luma[i]和pcm_sample_bit_depth_chroma_minus8+8个比特的pcm_sample_chroma[i]进行PCM编码。在向序列参数添加pcm_sample_bit_depth_luma_minus8和pcm_sample_bit_depth_chroma_minus8的情况下,PCM解码器108对pcm_sample_bit_depth_luma_minus8+8个比特的pcm_sample_luma[i]和pcm_sample_bit_depth_chroma_minus8+8个比特的pcm_sample_chroma[i]进行PCM解码。像素比特长度增加单元111分别将经PCM解码的pcm_sample_luma[i]和pcm_sample_chroma[i]向左移increased_bit_depth_luma个比特和increased_bit_depth_chroma个比特。在这里,如下计算increased_bit_depth_luma和increased_bit_depth_chroma。increased_bit_depth_luma=internal_bit_depth_luma_minus8–pcm_sample_bit_depth_luma_minus8increased_bit_depth_chroma=internal_bit_depth_chroma_minus8–pcm_sample_bit_depth_chroma_minus8从上述计算清楚看出,在increased_bit_depth_luma大于0并且internal_bit_depth_luma_minus8+8小于N的情况下,视频编码装置隐含地用信号向视频解码装置发送像素比特长度增加信息;并且同样地在internal_bit_depth_chroma_minus8+8小于N的情况下,视频编码装置隐含地用信号向视频解码装置发送像素比特长度增加信息。可以由硬件实现或者可以由计算机程序实现每个上述示例性实施方式。图10中所示的信息处理系统包括处理器1001、程序存储器1002、用于存储视频数据的存储介质1003和用于存储比特流的存储介质1004。存储介质1003和存储介质1004可以是独立的存储介质,或者可以是由相同的存储介质组成的存储区域。可以将磁存储介质(例如硬盘)作为存储介质。在图10中所示的信息处理系统中,将用于实现图1、图4和图6中的每个图中所示的方框(除了缓冲器的方框)的功能的程序存储在程序存储器1002中。处理器1001通过根据程序存储器1002中存储的程序执行处理来实现图1、图4和图6中所示的视频编码装置或视频解码装置的功能。图11是显示了根据本发明的视频编码装置的主要部分的方框图。如图11中所示的,根据本发明的视频编码装置包括:像素比特长度增加装置1(例如图1中所示的像素比特长度增加单元101),用于基于像素比特长度增加信息来增加输入图像的像素比特长度;变换装置2(例如图1中所示的变换器/量化器102),用于变换像素比特长度增加装置1的输出数据;熵编码装置3(例如图1中所示的熵编码器103),用于对变换装置2的输出数据进行熵编码;非压缩编码装置7(例如PCM编码器107),用于对输入数据进行非压缩编码;复用的数据选择装置8(例如开关121),用于选择熵编码装置3的输出数据或非压缩编码装置7的输出数据;以及复用装置10(例如复用器110),用于将像素比特长度增加信息复用到比特流中,其中与熵编码装置3的输出数据相对应的图像的像素比特长度和与非压缩编码装置7的输出数据相对应的图像的像素比特长度彼此不同。为了使得像素比特长度彼此不同,视频编码装置包括例如用于将像素比特长度的增加之前的输入图像提供给非压缩编码装置7的装置。在这种情况下,对像素比特长度未增加的输入图像进行非压缩编码(例如PCM编码)。图12是显示了根据本发明的另一个视频编码装置的主要部分的方框图。如图12中所示,除了图11中所示的结构之外,根据本发明的另一个视频编码装置还包括像素比特长度减少装置9(例如图6中所示的像素比特长度减少单元112),用于基于像素比特长度增加信息来减少像素比特长度,其中非压缩编码装置7的输入数据是像素比特长度减少装置9的输出数据。图13是显示了根据本发明的另一个视频编码装置的主要部分的方框图。如图13中所示,除了图11中所示的结构之外,根据本发明的另一个视频编码装置还包括:用于预测图像的预测装置10(例如图1中所示的预测器106);用于对变换装置2的输出数据进行逆变换的逆变换装置12(例如图1中所示的逆变换器/逆量化器104);以及用于对非压缩编码装置7的输出数据进行解码的非压缩解码装置13(例如图1中所示的PCM解码器108),其中非压缩解码装置13至少基于像素比特长度增加信息来增加通过非压缩解码获得的已解码图像的像素比特长度。图14是显示了根据本发明的一种视频解码装置的主要部分的方框图。如图14中所示的,根据本发明的视频解码装置包括:解复用装置21(例如图4中所示的解复用器201),用于解复用至少包括像素比特长度增加信息的比特流;熵解码装置24(例如图4中所示的熵解码器204),用于对该比特流中包括的图像的已变换数据进行熵解码;逆变换装置26(例如图4中所示的逆变换器/逆量化器206),用于对该图像的经熵解码的已变换数据进行逆变换;非压缩解码装置23(例如图4中所示的PCM解码器203),用于对该比特流中包括的图像的经非压缩编码的数据进行非压缩解码;以及解码控制装置22(例如图4中所示的解码控制器202),用于控制熵解码装置24和非压缩解码装置23,其中与熵解码装置24的输入数据相对应的图像的像素比特长度和与非压缩解码装置23的输入数据相对应的图像的像素比特长度彼此不同。图15是显示了根据本发明的另一个视频解码装置的主要部分的方框图。如图15中所示,除了图14中所示的结构之外,根据本发明的视频解码装置还包括用于预测图像的预测装置27(例如图4中所示的预测器207)。如上所述,本发明在基于像素比特长度增加和非压缩编码的视频编码中提供了用于使得与熵编码的输出数据相对应的图像的像素比特长度和与非压缩编码的输出数据相对应的图像的像素比特长度彼此不同的装置。本发明因此可以解决PCM编码的输出数据增加了像素比特长度增加量的问题,同时既通过像素比特长度扩展增强了帧内预测和帧间预测的运算精度,又保证了用于视频编码装置或视频解码装置的固定处理时间。可以在以下的补充注释中部分地或完整地描述上述示例性实施方式,但是本发明不限于以下结构。(补充注释1)一种视频编码方法,包括:对通过基于像素比特长度增加信息增加输入图像的像素比特长度而获得的数据进行变换;对已变换的数据进行熵编码;对输入数据进行非压缩编码;选择经熵编码的数据或经非压缩编码的数据;以及将像素比特长度增加信息复用到比特流中,其中与经熵编码的数据相对应的图像的像素比特长度和与经非压缩编码的数据相对应的图像的像素比特长度彼此不同,并且其中使用像素比特长度增加之前的输入图像作为要进行非压缩编码的输入数据。(补充注释2)一种视频编码方法,包括:对通过基于像素比特长度增加信息增加输入图像的像素比特长度而获得的数据进行变换;对已变换的数据进行熵编码;对输入数据进行非压缩编码;选择经熵编码的数据或经非压缩编码的数据;以及将像素比特长度增加信息复用到比特流中,其中与经熵编码的数据相对应的图像的像素比特长度和与经非压缩编码的数据相对应的图像的像素比特长度彼此不同,其中该视频编码方法包括基于像素比特长度增加信息来减少像素比特长度已增加的数据的像素比特长度,并且其中使用像素比特长度已减少的数据作为要进行非压缩编码的输入数据。(补充注释3)一种视频编码方法,包括:对通过基于像素比特长度增加信息增加输入图像的像素比特长度而获得的数据进行变换;对已变换的数据进行熵编码;对输入数据进行非压缩编码;选择经熵编码的数据或经非压缩编码的数据;以及将像素比特长度增加信息复用到比特流中,其中与经熵编码的数据相对应的图像的像素比特长度和与将非压缩编码的数据相对应的图像的像素比特长度彼此不同,并且其中该视频编码方法包括:对已变换的数据进行逆变换;对经非压缩编码的数据进行解码;以及在进行解码时,至少基于像素比特长度增加信息来增加通过非压缩解码获得的已解码图像的像素比特长度。(补充注释4)一种视频解码方法,包括:对至少包括像素比特长度增加信息的比特流进行解复用;对该比特流中包括的图像的已变换数据进行熵解码;对该图像的经熵解码的已变换数据进行逆变换;以及对该比特流中包括的图像的经非压缩编码的数据进行非压缩解码,其中与比特流中包括的图像的已变换数据相对应的图像的像素比特长度和与比特流中包括的图像的经非压缩编码的数据相对应的图像的像素比特长度彼此不同,并且其中该视频解码方法包括在进行非压缩解码时,至少基于像素比特长度增加信息来增加通过非压缩解码获得的已解码图像的像素比特长度。(补充注释5)一种视频解码方法包括:对至少包括像素比特长度增加信息的比特流进行解复用;对该比特流中包括的图像的已变换数据进行熵解码;对该图像的经熵解码的已变换数据进行逆变换;以及对该比特流中包括的图像的经非压缩编码的数据进行非压缩解码,其中与比特流中包括的图像的已变换数据相对应的图像的像素比特长度和与比特流中包括的图像的经非压缩编码的数据相对应的图像的像素比特长度彼此不同,并且其中该视频解码方法包括执行用于预测图像的预测处理。(补充注释6)一种视频编码程序,使计算机执行:用于对通过基于像素比特长度增加信息增加输入图像的像素比特长度而获得的数据进行变换的处理;用于对已变换的数据进行熵编码的处理;用于对输入数据进行非压缩编码的处理;用于选择经熵编码的数据或经非压缩编码的数据的处理;以及用于将像素比特长度增加信息复用到比特流中的处理,其中与经熵编码的数据相对应的图像的像素比特长度和与经非压缩编码的数据相对应的图像的像素比特长度彼此不同,并且其中使用像素比特长度增加之前的输入图像作为要进行非压缩编码的输入数据。(补充注释7)一种视频编码程序,使计算机执行:用于对通过基于像素比特长度增加信息增加输入图像的像素比特长度而获得的数据进行变换的处理;用于对变换后的数据进行熵编码的处理;用于对输入数据进行非压缩编码的处理;用于选择经熵编码的数据或经非压缩编码的数据的处理;以及用于将像素比特长度增加信息复用到比特流中的处理,其中与经熵编码的数据相对应的图像的像素比特长度和与经非压缩编码的数据相对应的图像的像素比特长度彼此不同,并且其中该视频编码程序使计算机执行用于基于像素比特长度增加信息来减少像素比特长度已增加的数据的像素比特长度的处理,并且使用像素比特长度已减少的数据作为要进行非压缩编码的输入数据。(补充注释8)一种视频编码程序,使计算机执行:用于对通过基于像素比特长度增加信息增加输入图像的像素比特长度而获得的数据进行变换的处理;用于对已变换的数据进行熵编码的处理;用于对输入数据进行非压缩编码的处理;用于选择经熵编码的数据或经非压缩编码的数据的处理;以及用于将像素比特长度增加信息复用到比特流中的处理,其中与经熵编码的数据相对应的图像的像素比特长度和与经非压缩编码的数据相对应的图像的像素比特长度彼此不同,并且其中该视频编码程序使计算机执行:用于对已变换的数据进行逆变换的处理;用于对经非压缩编码的数据进行解码的处理;以及用于在进行解码时至少基于像素比特长度增加信息来增加通过非压缩解码获得的已解码图像的像素比特长度的处理。(补充注释9)一种视频解码程序,使计算机执行:用于对至少包括像素比特长度增加信息的比特流进行解复用的处理;用于对该比特流中包括的图像的已变换数据进行熵解码的处理;用于对该图像的经熵解码的已变换数据进行逆变换的处理;以及用于对该比特流中包括的图像的经非压缩编码的数据进行非压缩解码的处理,其中与比特流中包括的图像的已变换数据相对应的图像的像素比特长度和与比特流中包括的图像的经非压缩编码的数据相对应的图像的像素比特长度彼此不同,并且其中该视频解码程序使计算机执行用于在进行非压缩解码时至少基于像素比特长度增加信息来增加通过非压缩解码获得的已解码图像的像素比特长度的处理。(补充注释10)一种视频解码程序,使计算机执行:用于对至少包括像素比特长度增加信息的比特流进行解复用的处理;用于对该比特流中包括的图像的已变换数据进行熵解码的处理;用于对该图像的经熵解码的已变换数据进行逆变换的处理;以及用于对该比特流中包括的图像的经非压缩编码的数据进行非压缩解码的处理,其中与比特流中包括的图像的已变换数据相对应的图像的像素比特长度和与比特流中包括的图像的经非压缩编码的数据相对应的图像的像素比特长度彼此不同,并且其中该视频解码程序使计算机执行用于预测图像的预测处理。虽然参考以上示例性实施方式和示例描述了本发明,但是本发明不限于以上示例性实施方式和示例。可以对本发明的结构和细节进行本领域技术人员可理解的落入本发明的范围内的各种改变。本申请要求基于2010年7月13日递交的日本专利申请No.2010-159059和2011年2月25日递交的日本专利申请No.2011-040530的优先权,它们的公开内容整体并入本文。附图标记列表1:像素比特长度增加装置2:变换装置3:熵编码装置7:非压缩编码装置8:复用的数据选择装置9:像素比特长度减少装置10复用装置11预测装置12逆变换装置13非压缩解码装置21解复用装置22解码控制装置23非压缩解码装置24熵解码装置26逆变换装置27预测装置101像素比特长度增加单元102变换器/量化器103熵编码器104逆变换器/逆量化器105缓冲器106预测器107PCM编码器108PCM解码器109复用的数据选择器110复用器111像素比特长度增加单元112像素比特长度减少单元121开关122开关201解复用器202解码控制器204熵解码器205像素比特长度增加单元206逆变换器/逆量化器207预测器208缓冲器209像素比特长度减少单元221开关222开关1001处理器1002程序存储器1003存储介质1004存储介质
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1