用于解码多视图视频的方法和设备的制造方法

文档序号:9872764阅读:265来源:国知局
用于解码多视图视频的方法和设备的制造方法
【技术领域】
[0001]本发明涉及视频编译技术,并且更加具体地,涉及3D视频图像编译技术。
【背景技术】
[0002]近年来,对高分辨率和高质量视频的需要已经在各种应用领域中增长。然而,视频数据的分辨率和质量变得越来越高,视频数据的量变得越来越大。
[0003]因此,当使用诸如现有的有线或者无线宽带线传输数据或者视频数据被存储在现有的存储介质中时,传输成本及其存储成本增加。高效率的视频压缩技术能够被使用以有效地传输、存储和再生高分辨率和高质量的视频数据。
[0004]另一方面,通过处理高分辨率/大容量视频的能力的实现,使用3D视频的数字广播服务已经作为下一代广播服务引起注意。3D视频能够使用多视图信道提供真实感和沉浸感。
[0005]3D视频能够在诸如自由视点视频(FVV)、自由视点TV(FTV)、3DTV、监视以及家庭娱乐的各种领域中使用。
[0006]不同于单个视图视频,使用多视图的3D视频在具有相同的图片顺序计数POC的视图之间具有高的相关性。因为以多个邻近的相机拍摄相同的场景,即,除视差和微小的照度差值之外,多个视图、多视图视频具有几乎相同的信息,并且因此不同的视图在其间具有高的相关性。
[0007]因此,在不同的视图之间的相关性能够被考虑用于编码/解码多视图视频,并且能够获得对于编码和/或解码当前视图的需求的信息。例如,能够参考在不同的视图中的块来预测或者解码在当前的视图中要解码的块。

【发明内容】

[0008]技术问题
[0009]本发明提供一种用于基于另一视图的图片重构当前视图的信息的方法和设备。
[0010]本发明提供一种用于将纹理视图的运动信息继承到用于深度视图中的当前块的运动信息的方法和设备。
[0011]本发明提供一种通过子块单位导出纹理视图的运动信息并且使用被导出的运动信息作为用于深度视图中的当前块的运动信息的方法和设备。
[0012]本发明提供一种通过预测块单元或者通过子预测块单元导出纹理视图的运动信息以导出当前块的预测采样的方法和设备。
[0013]技术方案
[0014]在一个方面中,一种视频解码设备,该视频解码设备解码多视图视频,包括:熵解码单元,该熵解码单元熵解码比特流以输出用于解码深度图片中的当前块所要求的视频信息;存储器,该存储器存储当解码当前块时参考的图片;以及预测单元,该预测单元通过使用相同的视图中的纹理图片的运动信息作为用于当前块的运动信息导出用于当前块的预测采样,其中预测单元决定是否通过子块单元导出纹理图片的运动信息并且基于决定导出用于当前块的运动信息。
[0015]在另一方面中,一种解码多视图视频的视频解码方法,包括:熵解码比特流以导出用于解码深度图片中的当前块所要求的视频信息;基于视频信息决定是否通过子块单元从纹理图片导出用于当前块的运动信息;根据决定从纹理图片导出用于当前块的运动信息;以及通过使用运动向量导出用于当前块的预测采样。
[0016]有益效果
[0017]根据本发明,视图的运动信息被继承到用于深度视图中的当前块的运动信息以有效地编译深度视图。
[0018]根据本发明,通过子块单元导出纹理视图的运动信息以被用作用于深度视图中的当前块的运动信息。
[0019]根据本发明,通过预测块的单元或者通过子预测块单元导出纹理视图的运动信息以被用作用于深度视图中的当前块的运动信息。
【附图说明】
[0020]图1是示意性地描述3D视频的编码和解码过程的图。
[0021 ]图2是示意性地描述视频编码设备的配置的图。
[0022]图3是示意性地描述视频解码设备的配置的图。
[0023]图4是示意性地描述视视图间编译的图。
[0024]图5示意性地描述使用深度图的多视图编译方法。
[0025]图6是示意性地描述DV-MCP块的图。
[0026]图7是示意性地描述当前块的邻近块的一个示例的图。
[0027]图8是示意性地描述用于从纹理图片推导信息的图。
[0028]图9是示意性地描述用于通过MVI推导纹理图片的运动向量的过程的图。
[0029]图10是示意性地描述用于通过以子块为单位应用MVI推导运动向量的方法的图。
[0030]图11是描述根据本发明的解码设备的操作的流程图。
【具体实施方式】
[0031]如在此处使用的,术语“像素”或者“图像元素”意指组成单个图像的最小单元。术语“采样”可以用作表示特定的像素的值的术语。在这一点上,采样可以指示照度分量的像素值和/或色度分量的像素值。
[0032]如在此处使用的,术语“单元”意指用于图像处理和/或在图像中特定的位置的基本单元。单元与诸如“±夬”、“区域”等等的术语可以互换地使用。通常地,MXN块指的是以M列和N行排列的采样或者变换系数的集合。
[0033]在下文中,将参考附图详细地描述本发明的实施例。
[0034]图1是示意性地描述3D视频的编码和解码过程的图。
[0035]参考图1,3D视频编码器编码视频图片和深度图和相机参数以作为比特流输出。
[0036]可以通过相对于对应视频图片(纹理图片)的像素在相机和主题之间的距离信息(深度信息)组成深度图。例如,深度图可以是通过根据比特深度标准化深度信息获得的图片。在这种情况下,可以通过在没有色度表达的情况下记录的深度信息构成深度图。
[0037]通常,因为距主题的距离和视差相互成反比例,所以可以通过使用相机参数从深度图的深度信息中推导指示在视图之间的相关性的视差信息。
[0038]包括深度图和相机信息以及常规的彩色图片,S卩,视频图片(纹理图片)的比特流可以通过网络或者存储介质被发送给解码器。
[0039]解码器接收比特流以重建视频。当3D视频解码器用作解码器时,3D视频解码器可以从比特流解码视频图片,和深度图和相机参数。可以基于经解码的视频图片、深度图和相机参数合成对于多视图显示所要求的视图。在这种情况下,当使用的显示器是立体显示器时,可以通过使用在重建的多视图当中的两个图片显示3D图片。
[0040]当使用立体视频解码器时,立体视频解码器可以从比特流中重建两个图片以在两个眼睛入射。立体显示器可以通过使用视图差异或者在左眼入射的左图片和在右眼入射的右图片之间的视差显示3D图片。当多视图显示器与立体视频解码器一起使用时,可以通过基于两个经重建的图片产生其它的视图显示多视图。
[0041]当使用2D解码器时,2D图片被重建以通过2D显示器输出该图片。2D显示器被使用,但是当3D视频解码器或者立体视频解码器用作解码器时,重建的图片中的一个可以通过2D显示器输出。
[0042]在图1的配置中,视图合成可以通过解码器或者显示器来执行。此外,解码器和显示器可以是一个设备或者分开的设备。
[0043 ] 在图1中,为了容易描述,描述3D视频解码器、立体视频解码器,和2D视频解码器是分开的解码器,但是一个解码设备可以执行所有的3D视频解码、立体视频解码和2D视频解码。此外,3D视频解码设备可以执行3D视频解码,立体视频解码装置可以执行立体视频解码,并且2D视频解码装置可以执行2D视频解码。此外,多视图显示器可以输出2D视频或者立体视频。
[0044]图2是示意地描述视频编码设备的配置的图。参考图2,视频编码设备200包括图片分割单元205、预测单元210、减法单元215、变换单元220、量化单元225、重排单元230、熵编码单元235、去量化单元240、反变换单元245、加法单元250、滤波单元255和存储器260。
[0045]图片分割单元205可以将输入图片分离为至少一个处理单元块。在这种情况下,处理单元块可以是编译单元块、预测单元块,或者变换单元块。可以根据四树结构从最大编译单元块分离作为编译的单元块的编译单元块。作为从编译单元块分割的块的预测单元块可以是采样预测的单元块。在这种情况下,该预测单元块可以被划分为子块。作为编译单元块的变换单元块可以根据四树结构分离,并且可以是推导变换系数的单元块,或者从变换系数推导残留信号的单元块。
[0046]如在此处所使用的,为了说明的方便起见,编译单元块被称为编译块或者编译单元(CU)。预测单元块被称为预测块或者预测单元(PU)。变换单元块被称为变换块或者变换单元(TU)。
[0047]预测块或者预测单元可以意指块状的特定区域或者一批预测采样。此外,变换块或者变换单元可以意指块状的特定区域或者一批变换系数或者残留采样。
[0048]预测单元210可以执行用于处理目标块(在下文中,被称为当前块)的预测,并且产生包括用于当前块的预测采样的预测块。由预测单元210执行的预测的单元可以是编译块、变换块或者预测块。
[0049]该预测单元210可以决定是否内部预测适用于当前块,或者是否中间预测适用于当前块。
[0050]在内部预测的情况下,预测单元210可以基于在当前块属于的图片(在下文中,当前图片)中的邻近块像素推导用于当前块的预测采样。在这种情况下,预测单元210可以(i)基于当前块的邻近参考采样的平均值或者插补推导预测采样,或者(ii)相对于在当前块的邻近块当中的预测目标像素基于存在于特定方向的参考采样推导预测采样。为了容易描述,(i)的情形称为非定向模式,并且(ii)的情形称为定向模式。该预测单元210可以通过使用适用于邻近块的预测模式决定适用于当前块的
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1