对多视点视频数据的深度图进行编码的方法和装置以及对编码的深度图进行解码的方法...的制作方法

文档序号:7992537阅读:179来源:国知局
对多视点视频数据的深度图进行编码的方法和装置以及对编码的深度图进行解码的方法 ...的制作方法
【专利摘要】一种用于对多视点视频数据的深度图进行编码的方法和设备以及对多视点视频数据的深度图进行解码的方法和设备。所述对多视点视频数据的深度图进行编码的方法包括:基于被预测编码并恢复的多视点彩色视频帧的块的像素值,将恢复的多视点彩色视频帧的块划分为至少一个分区;针对恢复的多视点彩色视频帧的块分区中的每个,通过使用多视点彩色视频帧的块分区的外围像素值和与多视点彩色视频帧的块分区相应的深度图帧的块分区的外围像素值,获得指示多视点彩色视频帧的块分区中的每个与深度图帧的块分区中的每个之间的相关性的参数;通过使用获得的参数,从恢复的多视点彩色视频帧的块分区获得深度图帧的相应块分区的预测值。
【专利说明】对多视点视频数据的深度图进行编码的方法和装置以及对编码的深度图进行解码的方法和装置
【技术领域】
[0001]本发明涉及对包括深度图像的多视点视频数据进行编码和解码。
【背景技术】
[0002]近来,随着数字图像处理和计算机图形技术的发展,已积极地对三维(3D)视频技术和多视点视频技术进行了研究,其中,所述三维(3D)视频技术和多视点视频技术使真实世界能够被再现并使用户能够真实地体验被再现的真实世界。使用多视点视频的3D电视(TV)能够通过显示由再现真实世界而获得的内容来向用户提供真实的感受,并因此作为下一代广播技术而备受关注。3D视频编码系统具有支持多视点图像的功能,经由此功能,用户可自由地改变视点或使得3D视频编码系统可应用于各种类型的3D再现设备。然而,由于多视点视频的数据量高,因此需要开发一种有效降低多视点视频的数据量的编码方法。

【发明内容】

[0003]技术问题
[0004]本发明提供一种对用于将3D视频提供给多视点视频数据的深度图图像进行有效编码的方法和设备,以及对深度图进行有效解码的方法和设备。
[0005]技术方案
[0006]根据本发明,获得彩色图像的外围像素与深度图像的外围像素之间的相关性,并使用相应彩色图像的块通过帧内预测来对当前深度图像的块进行编码。
[0007]有益效果
[0008]根据本发明,可通过从多视点彩色视频帧预测相应深度图帧,来对具有大量数据的多视点视频数据进行有效压缩。此外,根据本发明,从先前编码的外围像素值来确定指示相关性的参数,因此不必发送额外的参数。
【专利附图】

【附图说明】
[0009]图1是根据本发明的实施例的多视点视频系统的框图。
[0010]图2示出经由图1的多视点相机获得的多视点视频帧和经由图1的深度相机获得的深度图帧。
[0011]图3是根据本发明的实施例的多视点视频数据编码设备的框图。
[0012]图4是图3的深度图帧编码单元的框图。
[0013]图5A和图5B是用于解释由图4的划分单元420执行的将多视点彩色视频帧的块划分为分区(partition)的方法的示图。
[0014]图6是用于解释由图4的相关性参数获得单元430执行的参数获得处理和由深度图帧预测单元440执行的帧内预测处理的示图。
[0015]图7示出根据本发明的实施例的用于预测深度图帧块的多视点彩色视频帧块。[0016]图8是示出根据本发明的实施例的对多视点视频数据的深度图进行编码的方法的流程图。
[0017]图9是根据本发明的实施例的多视点视频数据解码设备的框图。
[0018]图10是根据本发明的实施例的图9的深度图帧解码单元930的框图。
[0019]图11是示出根据本发明的实施例的对多视点视频数据的深度图进行解码的方法的流程图。
[0020]图12示出根据本发明的实施例的基于对多视点视频进行编码的方法而编码并基于对多视点视频进行解码的方法而解码的多视点彩色视频帧。
[0021]图13是根据本发明的实施例的能够基于具有树结构的编码单元执行视频预测的视频编码设备的框图。
[0022]图14是根据本发明的实施例的能够基于具有树结构的编码单元执行视频预测的视频解码设备的框图。
[0023]图15示出根据本发明的实施例的编码单元的概念。
[0024]图16是根据本发明的实施例的基于编码单元的图像编码器的框图。
[0025]图17是根据本发明的实施例的基于编码单元的图像解码器的框图。
[0026]图18是示出根据本发明的实施例的与深度相应的编码单元以及分区的示图。
[0027]图19是示出根据本发明的实施例的编码单元与变换单元之间的相关性的示图。
[0028]图20是示出根据本发明的实施例的与深度相应的编码信息的示图。
[0029]图21是示出根据本发明的实施例的与深度相应的编码单元的示图。
[0030]图22、图23和图24是示出根据本发明的实施例的编码单元、预测单元和变换单元之间的相关性的示图。
[0031]图25是示出根据表I的编码模式信息的编码单元、预测单元和变换单元之间的相关性的示图。
[0032]图26A示出根据本发明的实施例的存储程序的盘的物理结构。
[0033]图26B示出通过使用盘来记录和读取程序的盘驱动器。
[0034]图27示出提供内容分配服务的内容供应系统的整体结构。
[0035]图28和图29示出根据本发明的实施例的应用了视频编码方法和视频解码方法的移动电话的内部结构和外部结构。
[0036]图30示出根据本发明的实施例的采用通信系统的数字广播系统。
[0037]图31示出根据本发明的实施例的使用视频编码设备和视频解码设备的云计算系统的网络结构。
[0038]最佳实施方式
[0039]根据本发明的一方面,提供了一种对多视点视频数据的深度图进行编码的方法,所述方法包括:获得多视点彩色视频帧和与多视点彩色视频帧相应的深度图帧;对获得的多视点彩色视频帧进行预测编码和恢复;基于恢复的多视点彩色视频帧的块的像素值,将恢复的多视点彩色视频帧的块划分为至少一个分区;针对恢复的多视点彩色视频帧的块分区中的每个,通过使用多视点彩色视频帧的块分区的外围像素值和与多视点彩色视频帧的块分区相应的深度图帧的块分区的外围像素值,获得指示多视点彩色视频帧的块分区中的每个与深度图帧的块分区中的每个之间的相关性的参数;通过使用获得的参数,从恢复的多视点彩色视频帧的块分区获得深度图帧的相应块分区的预测值。
[0040]根据本发明的另一方面,提供了一种用于对多视点视频数据的深度图进行编码的设备,所述设备包括:图像获得单元,获得多视点彩色视频帧和与多视点彩色视频帧相应的深度图帧;彩色视频帧编码单元,对获得的多视点彩色视频帧进行预测编码;恢复单元,恢复编码的彩色视频帧;划分单元,基于恢复的多视点彩色视频帧的块的像素值,将恢复的多视点彩色视频帧的块划分为至少一个分区;相关性参数获得单元,针对恢复的多视点彩色视频帧的块分区中的每个,通过使用多视点彩色视频帧的块分区的外围像素值和与多视点彩色视频帧的块分区相应的深度图帧的块分区的外围像素值,获得指示多视点彩色视频帧的块分区中的每个与深度图帧的块分区中的每个之间的相关性的参数;深度图帧预测单元,通过使用获得的参数,从恢复的多视点彩色视频帧的块分区获得深度图帧的相应块分区的预测值。
[0041]根据本发明的另一方面,提供了一种对多视点视频数据的深度图进行解码的方法,所述方法包括:接收通过对多视点彩色视频帧和与多视点彩色视频帧相应的深度图帧进行编码而获得的比特流;对多视点彩色视频帧进行解码;基于解码的多视点彩色视频帧的块的像素值,将解码的多视点彩色视频帧的块划分为至少一个分区;针对解码的多视点彩色视频帧的块分区中的每个,通过使用多视点彩色视频帧的块分区的外围像素值和与多视点彩色视频帧的块分区相应的深度图帧的块分区的外围像素值,获得指示多视点彩色视频帧的块分区中的每个与深度图帧的块分区中的每个之间的相关性的参数;通过使用获得的参数,从解码的多视点彩色视频帧的块分区获得深度图帧的相应块分区的预测值。
[0042]根据本发明的另一方面,提供了一种用于多视点视频数据的深度图进行解码的设备,所述设备包括:接收单元,接收通过对多视点彩色视频帧和与多视点彩色视频帧相应的深度图帧进行编码而获得的比特流;彩色视频帧解码单元,对从比特流获得的编码的多视点彩色视频帧进行解码;划分单元,基于恢复的多视点彩色视频帧的块的像素值,将恢复的多视点彩色视频帧的块划分为至少一个分区;相关性参数获得单元,针对恢复的多视点彩色视频帧的块分区中的每个,通过使用多视点彩色视频帧的块分区的外围像素值和与多视点彩色视频帧的块分区相应的深度图帧的块分区的外围像素值,获得指示多视点彩色视频帧的块分区中的每个与深度图帧的块分区中的每个之间的相关性的参数;深度图解码单元,通过使用获得的参数,从恢复的多视点彩色视频帧的块分区获得深度图帧的相应块分区的预测值。
【具体实施方式】
[0043]以下,将参照附图详细描述本发明的示例性实施例。
[0044]图1是示出根据本发明的实施例的多视点视频系统100的框图。
[0045]多视点视频系统100包括多视点视频数据编码设备110和多视点视频数据解码设备120。多视点视频数据编码设备110通过对经由至少两个多视点相机130获得的多视点视频帧和经由深度相机140获得的与多视点视频帧相应的深度图帧进行编码,来产生比特流。多视点视频数据解码设备120对比特流进行解码,来获得解码的多视点视频帧,并根据观看者的需要,以任意各种格式提供解码的多视点视频帧。
[0046]至少两个多视点相机130通过将多个不同视点相机进行组合来制造,并可以以帧为单位提供多视点视频。深度相机140提供使用具有256个灰度级别的8比特图像表示场景的深度信息的深度图帧。深度相机140可通过使用红外线,来测量深度相机140本身与对象或背景之间的距离,并可提供与距离成正比或成反比的深度图帧。
[0047]如果多视点视频数据编码设备110对多视点视频数据和与多视点视频数据相应的深度图帧进行编码,并通过比特流发送编码的结果,则多视点视频数据解码设备120可不仅使用现有的立体图像或三维(3D)视频来提供立体效果,还基于比特流中包括的多视点视频帧和深度图帧,从观看者期望的视点对3D视频进行合成。
[0048]将编码的多视点视频数据量与视点的数量成正比地增加,应还对深度图图像进行编码,从而将立体效果添加到多视点视频数据。因此,为了实现如图1所示的多视点视频系统,应有效地对大量的多视点视频数据量进行压缩。
[0049]图2示出经由图1的至少两个多视点相机130获得的多视点视频帧,以及经由图1的深度相机140获得的深度图帧。
[0050]图2示出与从第一视点(视点O)捕捉的彩色视频帧211相应的从第一视点(视点O)捕捉的深度图帧221、与从第二视点(视点I)捕捉的彩色视频帧212相应的从第二视点(视点I)捕捉的深度图帧222,以及与从第三视点(视点2)捕捉的彩色视频帧213相应的从第三视点(视点2)捕捉的深度图帧223。虽然图2示出从三个视点(视点O、视点1、视点2)捕捉的多视点彩色视频帧210和与多视点彩色视频帧210相应的深度图帧220,但是视点的总数不限于此。在图2中,多视点彩色视频帧210可以是亮度分量视频帧或色度分量视频帧。
[0051]参照图2,由于通过使用颜色和深度表示在相同时间点从相同视点捕捉的图像来获得从相同视点捕捉的彩色视频帧和彩色视频帧的深度图帧,因此,彩色视频帧和彩色视频帧的深度图帧之间存在特定相关性。也就是说,当将多视点彩色视频帧210和相应的深度图帧220进行比较时,在它们之间存在特定相关性,例如,对象的轮廓可被识别。因此,根据当前实施例的多视点视频数据编码设备110和多视点视频数据解码设备120可考虑多视点彩色视频帧210和相应的深度图帧220之间的相关性,基于对多视点彩色视频帧210进行编码的结果,对相应的深度图帧220进行预测编码,从而增加多视点视频数据的压缩效率。具体地,根据当前实施例的多视点视频数据编码设备110和多视点视频数据解码设备120基于像素值将多视点彩色视频帧210的块划分为分区,以与多视点彩色视频帧210的块相同的方式将相应的深度图帧220的块划分为分区,通过使用多视点彩色视频帧210的块分区的外围像素值和相应深度图帧220的块分区的外围像素值,来获得指示多视点彩色视频帧210的块分区与相应深度图帧220的块分区之间的相关性的参数,并通过利用使用获得的参数确定的相关性,来从多视点彩色视频帧210的块分区预测相应深度图帧220的块分区。
[0052]图3是根据本发明的实施例的多视点视频数据编码设备300的框图。
[0053]参照图3,多视点视频数据编码设备300包括图像获得单元310、彩色视频帧编码单元320和深度图编码单元330。
[0054]图像获得单元310通过使用多视点视频获得单元(诸如,图1的所述至少两个多视点相机130)来获得多视点彩色视频帧,并通过使用深度图帧获得单元(诸如,深度相机140)来获得与多视点彩色视频帧相应的深度图帧。[0055]彩色视频帧编码单元320对获得的多视点彩色视频帧进行预测编码。具体地,如下面参照图13至图25的描述,根据当前实施例的彩色视频帧编码单元320可基于具有分层结构的编码单元而不是基于普通宏块来对多视点彩色视频帧进行编码。彩色视频帧编码单元320可针对从多视点视频帧划分的至少一个最大编码单元中的每一个,从与深度相应的分层编码单元中,确定包括与编码深度相应的编码单元的具有树结构的编码单元,其中,每个深度都表示至少一个最大编码单元被空间地划分的次数。彩色视频帧编码单元320可确定用于对与编码深度相应的编码单元中的每个进行预测编码的分区,并可通过基于具有分层结构的变换单元执行变换,来确定具有树结构的变换单元。
[0056]深度图帧编码单元330通过使用在被预测编码之后被恢复的多视点彩色视频帧来对相应深度图帧进行帧内预测编码。如上所述,具体地,根据当前实施例的深度图帧编码单元330在深度图帧被编码时考虑深度图帧与相应多视点彩色视频帧之间的相关性,将在被预测编码之后被恢复的多视点彩色视频帧的块划分为分区以确定相关性,考虑邻近外围像素之间的相关性确定指示每个分区的彩色图像和深度图图像之间的相关性的参数,并通过使用确定的参数从在被预测编码之后被恢复的多视点彩色视频帧的块分区预测相应深度图帧的块分区。
[0057]图4是图3的深度图帧编码单元330的框图。
[0058]参照图4,深度图帧编码单元400包括缩放单元410、划分单元420、相关性参数获得单元430、深度图帧预测单元440和减法单元450。
[0059]缩放单元410在深度图帧的块的尺寸与多视点彩色视频帧的块的尺寸不同的情况下,以这样的方式对多视点彩色视频帧的块进行采样:使多视点彩色视频帧的块的尺寸与深度图帧的块的尺寸相同。例如,如果多视点彩色视频帧的块的尺寸是2NX2N (N是整数),相应深度图帧的块的尺寸是NXN,则缩放单元410可通过按1:2的比例对多视点彩色视频帧的块进行下采样来产生多视点彩色视频帧的块。
[0060]划分单元420基于在被编码之后被恢复多视点彩色视频帧的恢复的块的像素值,将恢复的多视点彩色视频帧的块划分为至少一个分区。划分单元420还按与多视点彩色视频帧的块分区相同的方式,将深度图帧的块划分为分区。
[0061 ] 图5A和图5B是用于解释由图4的划分单元420执行的将多视点彩色视频帧的块划分为分区的方法的示图。
[0062]划分单元420可基于多视点彩色视频帧的块的像素值的分布,将多视点彩色视频帧的块划分为分区,使得具有与预定像素值相似的像素值的像素可被包括在相同分区中。划分单元420可分析多视点彩色视频帧的块的像素值的分布,确定作为分区划分的参照的预定像素值,并将在预定像素值的±x (X是整数)的范围内的像素划分到单个分区中。例如,参照图5A,划分单元420可将具有在像素值125的±10的范围内的像素值的像素划分到第一分区510中,将具有在像素值70的±10的范围内的像素值的像素划分到第二分区520中。基于像素值的分布将块划分为分区的方法不限于此。划分单元420可通过应用各种数据聚类方法基于像素值的分布将块划分为多个分区。
[0063]参照图5B,划分单元420可通过应用各种边缘检测方法(诸如索贝尔算法)来检测多视点彩色视频帧的块中存在的边缘,并基于检测的边缘将多视点彩色视频帧的块划分到第一分区530和第二分区540中。[0064]如果通过使用划分单元420将多视点彩色视频帧的块划分为多个分区,则相关性参数获得单元430针对多视点彩色视频帧的块分区中的每个,通过使用多视点彩色视频帧的块分区的外围像素值和与多视点彩色视频帧的块分区相应的深度图帧的块分区的外围像素值,来获得指示多视点彩色视频帧的块分区中的每个与深度图帧的块分区中的每个之间的相关性的参数。
[0065]深度图帧预测单元440通过使用获得的参数,从恢复的多视点彩色视频帧的块分区获得相应深度图帧的块分区的预测值。
[0066]图6是用于解释由图4的的相关性参数获得单元430执行的参数获得处理和由深度图帧预测单元440执行的帧内预测处理的概念图。
[0067]参照图6,假设通过划分单元420将多视点彩色视频帧的块610划分为两个分区Pl和P2。划分单元420将深度图帧的块640划分为两个分区P1’和P2’,使得两个分区P1’和P2’具有与多视点彩色视频帧的块610的两个分区Pl和P2相同的尺寸和形状。
[0068]相关性参数获得单元430针对多视点彩色视频帧的块610的两个分区Pl和P2中的每个来获得指示相关性的参数。更具体地说,相关性参数获得单元430通过使用多视点彩色视频帧的块610的分区Pl的外围像素值620和相应深度图帧的块640的分区P1’的外围像素值650,获得指示多视点彩色视频帧的块610的分区Pl和深度图帧的块640的分区Ρ1’之间的相关性的第一参数。此外,相关性参数获得单元430通过使用多视点彩色视频帧的块610的分区P2的外围像素值630和相应深度图帧的块640的分区2’的外围像素值660,获得指示多视点彩色视频帧的块610的分区P2和深度图帧的块640的分区P2’之间的相关性的第二参数。
[0069]如果多视点彩色视频帧的像素是R,具有与像素R的位置相同的位置的深度图帧的相应像素的预测值是D,则可通过指示多视点彩色视频帧和深度图帧之间的相关性的函数f()(诸如等式:D=f (R))来获得预测值D。如果假设指示相关性的函数是线性函数(诸如等式:f(x)=ax+b (a和b是实数)),则通过使用权重a和偏移量b来定义线性关系。
[0070]根据本发明的实施例的相关性参数获得单元430通过使用在被编码之后被恢复的多视点彩色视频帧的块分区的外围像素值620和630以及深度图帧的外围像素值650和660,来获得每个分区的权重a和偏移量b,使得指示线性关系的权重a和偏移量b可在不单独用信号发送的情况下在接收端被获得。
[0071]相关性参数获得单元430独立地处理多视点彩色视频帧的块分区和深度图帧的块分区,通过使用块分区的外围像素620、630、650和660来获得指示相关性的参数。参照图6,相关性参数获得单元430通过使用多视点彩色视频帧的块分区Pl的外围像素值620来预定相应深度图帧的块分区P1’的外围像素值650。例如,通过等式D’(X,y)=aXR(x, y)+b来获得使用多视点彩色视频帧的块分区Pl的外围像素值R(x,y)621的在相同位置的相应深度图帧的块分区Ρ1’的外围像素值D(x,y)651的预测值D’(x,y)。相关性参数获得单元430通过使用多视点彩色视频帧的块分区Pl的外围像素值620中的每个来预测相应深度图帧的块分区Pr的外围像素值650,并确定权重a和偏移量b使得相应深度图帧的块分区P1’的预测的外围像素值650与相应深度图帧的块分区Ρ1’的原始外围像素值660之间的差(D(x,y)_D’ (x, y))最小化。在这点上,相关性参数获得单元430可针对多视点彩色视频帧的块分区Pl的外围像素值620中的每个来预测相应深度图帧的块分区Ρ1’的外围像素值650,并确定权重a和偏移量b使得差(D(x,y)-D’ (x, y))的平方和最小化(最小二乘解)。
[0072]类似地,相关性参数获得单元430通过使用多视点彩色视频帧的块分区P2的外围像素值630,来预测相应深度图帧的块分区P2’的外围像素值660。相关性参数获得单元430通过使用多视点彩色视频帧的块分区P2的外围像素值630中的每个,来预测相应深度图帧的块分区P2’的外围像素值660,并确定权重a和偏移量b使得相应深度图帧的块分区P2’的预测的外围像素值660和相应深度图帧的块分区P2’的原始外围像素值660之间的差最小化。
[0073]如上所述,相关性参数获得单元430通过使用每个分区的外围像素来独立地预测指示相关性的参数。如果多视点彩色视频帧的块分区的外围像素值是Rec_Y’,深度图帧的块分区的相应外围像素值的预测值是Pred_D,则相关性参数获得单元430通过等式Pred_D=aXRec_Y’ +b预测深度图帧的外围像素,并确定参数a和b使得原始外围像素与预测的外围像素之间的差最小化。虽然上面假设主要线性关系来描述确定参数的处理,但是本发明的思想不限于此,并可被应用到当获得用于定义第η线性关系等式或另一非线性关系等式的参数时使用外围像素获得最佳参数的处理。
[0074]如果相关性参数获得单元430针对每个分区获得指示相关性的参数,则深度图帧预测单元440使用获得的参数,从恢复的多视点彩色视频帧的块分区获得相应深度图帧的块分区的预测值。返回参照图6,假设针对在被编码之后被恢复的多视点彩色视频帧的块分区Pl确定的权重和偏移量分别是al和bl。深度图帧预测单元440使用线性关系等式(诸如等式:D1’ =al X Rl+b I),从多视点彩色视频帧的块分区Pl的像素R1611,产生深度图帧的块分区Ρ1'的相应像素D1’641的预测值。类似地,如果假设针对在被编码之后而被恢复的多视点彩色视频帧的块分区P2而确定的权重和偏移量分别是a2和b2,则深度图帧预测单元440通过使用线性关系等式(诸如等式:D2’=a2XR2+b2),从多视点彩色视频帧的块分区P2的像素R2612,产生深度图帧的分区P2’的相应像素D2’ 642的预测值。如上所述,深度图帧预测单元440通过使用指示在分区单元中确定的指示相关性的参数,从多视点彩色视频帧的块分区预测深度图帧的块分区。
[0075]返回参照图4,减法单元450通过计算深度图帧的原始像素值与深度图帧的预测的像素值之间的差值来产生深度图残差。像普通残差一样,通过变换、量化和熵编码处理来对深度图残差进行编码。
[0076]图7示出根据本发明的实施例的用于预测深度图帧块740的多视点彩色视频帧块。
[0077]参照图7,可通过使用与将被编码的当前深度图帧块740共同观看(相同视点)和共同定位(相同位置)的彩色视频帧块710来预测深度图帧块740。如果与将被编码的当前深度图帧块740共同观看和共同定位的彩色视频帧块710的尺寸与将被编码的当前深度图帧块740的尺寸不同,则可如上所述使用被缩放的块以具有相同尺寸。此外,可通过使用与将被编码的当前深度图帧块共同观看和共同定位的彩色视频帧块710的外围块711和712来预测将被编码的当前深度图帧块740。如果外围块711和712的尺寸与将被编码的当前深度图帧块740的尺寸不同,则可使用被缩放的外围块以具有与将被编码的当前深度图帧块740相同的尺寸。还可使用不同视点的彩色视频帧块730及其外围块731和732来预测将被编码的当前深度图帧块740,其中,通过基于指示多视点视频之间的视点差的视差矢量来移动与将被编码的当前深度图帧块740共同观看和共同定位的彩色视频帧块710来确定所述不同视点的彩色视频帧块730及其外围块731和732。如果不同视点的彩色视频帧块730和外围块731和732的尺寸与将被编码的当前深度图帧块740的尺寸不同,则不同视点的彩色视频帧块730和外围块731和732被缩放以具有与将被编码的当前深度图帧块740相同的尺寸,并且被缩放的不同视点的彩色视频帧块730和外围块731和732可被用于预测将被编码的当前深度图帧块740。
[0078]图8是示出根据本发明的实施例的对多视点视频数据的深度图进行编码的方法的流程图。
[0079]参照图8,在操作810,图像获得单元310获得多视点彩色视频帧和与多视点彩色视频帧相应的深度图帧。
[0080]在操作820,彩色视频帧编码单元320对获得的多视点彩色视频帧进行预测编码和恢复。
[0081]在操作830,深度图帧编码单元330基于恢复的多视点彩色视频帧的像素值,将恢复的多视点彩色视频帧的块划分为至少一个分区。
[0082]在操作840,深度图帧编码单元330针对恢复的多视点彩色视频帧的块分区中的每个,通过使用多视点彩色视频帧的块分区的外围像素值和与多视点彩色视频帧的块分区相应的深度图帧的块分区的外围像素值,获得指示多视点彩色视频帧的块分区和深度图帧的块分区中的每个之间的相关性的参数。
[0083]在操作850,深度图帧编码单元330通过使用获得的参数,从恢复的多视点彩色视频帧的块分区,获得深度图帧的相应块分区的预测值。深度图帧编码单元330通过对残差进行变换、量化和熵编码来对深度图帧进行编码,其中,所述残差是深度图帧的预测值和原始块分区之间的差值。
[0084]图9是根据本发明的实施例的多视点视频数据解码设备900的框图。
[0085]参照图9,多视点视频数据解码设备900包括接收单元910、彩色视频帧解码单元920和深度图帧解码单元930。
[0086]接收单元910接收包含对多视点彩色视频帧和与多视点彩色视频帧相应的深度图帧进行编码的结果的比特流。
[0087]彩色视频帧解码单元920对从比特流获得的编码的多视点彩色视频帧进行解码。具体地,如下面将参照图13至图25所描述的,根据本发明的实施例的彩色视频帧解码单元920可基于分层编码单元对多视点彩色视频帧进行解码。彩色视频帧解码单元920从比特流获得关于以下项的信息:从多视点彩色视频帧划分的至少一个最大编码单元中的每个的尺寸、指示至少一个最大编码单元中的每个被空间划分的次数的深度、用于对根据深度的分层编码单元进行预测编码的分区、以及具有分层结构的变换单元。此外,基于获得的信息,彩色视频帧解码单元920针对从多视点彩色视频帧划分的至少一个最大编码单元中的每个,从与深度相应的分层编码单元确定包括与编码深度相应的编码单元的具有树结构的编码单元,确定用于对与编码深度相应的编码单元中的每个进行预测解码的分区,并确定具有树结构的变换单元,其中,每个深度指示至少一个最大编码单元中的一个被空间划分的次数。
[0088]深度图帧解码单元930基于对多视点彩色视频帧进行解码的结果,对相应深度图帧进行预测解码。特别地,深度图帧解码单元930使用恢复的多视点彩色视频帧对相应深度图帧进行解码。具体地说,根据本发明的实施例的深度图帧解码单元930在深度图帧被解码时考虑深度图帧与相应多视点彩色视频帧之间的相关性,基于像素值将解码的多视点彩色视频帧的块划分为分区以确定相关性,考虑邻近外围像素之间的相关性来针对每个分区确定指示彩色图像和深度图图像的参数,并使用确定的参数从解码的多视点彩色视频帧的块分区预测相应深度图帧的块分区。
[0089]图10是根据本发明的实施例的图9的深度图帧解码单元930的详细结构的框图。
[0090]参照图10,深度图帧解码单元1000包括缩放单元1010、划分单元1020、相关性参数获得单元1030、深度图帧预测单元1040和加法单元1050。
[0091]缩放单元1010在深度图帧的块的尺寸与多视点彩色视频帧的块的尺寸不同的情况下,以这样的方式对多视点彩色视频的块进行采样:使多视点彩色视频帧的块的尺寸与深度图帧的块的尺寸相同。划分单元1020基于解码的多视点彩色视频帧的像素值将多视点彩色视频帧的块划分为至少一个分区。划分单元1020还以与多视点彩色视频帧的块分区相同的方式来将深度图帧的块划分为分区。
[0092]如果通过划分单元1020将多视点彩色视频帧的块划分为多个分区,则相关性参数获得单元1030针对多视点彩色视频帧的块分区中的每个,通过使用多视点彩色视频帧的块分区的外围像素值和与多视点彩色视频帧的块分区相应的先前解码的深度图帧的块分区的外围像素值,来获得指示多视点彩色视频帧的块分区中的每个和深度图帧的块分区中的每个之间的相关性的参数。
[0093]深度图帧预测单元1040通过使用获得的参数,从解码的多视点彩色视频帧的块分区获得相应深度图帧块分区的预测值。与如上所述的通过图4的深度图帧预测单元440执行的预测值获得处理类似,深度图帧预测单元1040通过使用针对解码的多视点彩色视频帧的块分区中的每个而确定的权重和偏移量,从多视点彩色视频帧的块分区预测相应深度图帧的块分区。
[0094]添加单元1050从比特流获得深度图残差,将通过深度图帧预测单元1040获得的预测值与深度图残差相加,并恢复深度图帧的块分区,其中,深度图残差是原始深度图帧的像素值和预测的深度图帧的像素值之间的差值。可像普通残差一样,通过熵解码、反量化和逆变换来恢复深度图残差。
[0095]图11是示出根据本发明实施例的对多视点视频数据的深度图进行解码的方法的流程图。
[0096]参照图11,在操作1110,接收单元910接收并解析通过对多视点彩色视频帧和与多视点彩色视频帧相应的深度图帧进行编码而获得的比特流。
[0097]在操作1120,彩色视频帧解码单元920对多视点彩色视频帧进行解码。如将在下面所描述的,彩色视频帧解码单元920可基于分层结构的编码单元对多视点彩色视频帧进行解码。
[0098]在操作1130,深度图帧解码单元930基于解码的多视点彩色视频帧的块的像素值,将解码的多视点彩色视频帧的块划分为至少一个分区。
[0099]在操作1140,深度图帧解码单元930针对解码的多视点彩色视频帧的块分区中的每个,通过使用多视点彩色视频帧的块分区的外围像素值和与多视点彩色视频帧的块分区相应的深度图帧的块分区的外围像素值,来获得指示多视点彩色视频帧的块分区中的每个与深度图帧的块分区中的每个之间的相关性的参数。
[0100]在操作1150,深度图帧解码单元930通过使用获得的参数,从解码的多视点彩色视频帧的块分区获得深度图帧的相应块分区的预测值。深度图帧解码单元930通过将获得的预测值与深度图残差相加来恢复深度图帧的块分区。
[0101]图12示出根据本发明的实施例的基于对多视点视频进行编码的方法而编码并基于对多视点视频进行解码的方法而解码的多视点彩色视频帧。
[0102]图3的彩色视频帧编码单元320基于间隔视点的相机之间的时间相关性和空间相关性,对多视点视频进行压缩编码。
[0103]在图12中,X轴表示时间,y轴表示视点。在X轴中,“T0”至“T8”表示图像的采样时间。在y轴中,“S0”至“S8”表示不同的视点。在图12中,每一行指示从相同视点捕捉的图像画面组,每一列表示在相同时间点捕捉的多视点视频。
[0104]图3的彩色视频帧编码单元320周期性针对从基本视点捕捉的图像产生帧内画面,并通过基于帧内画面执行时间预测或视点间预测来对其它画面进行预测编码。
[0105]使用从相同视点捕捉的图像(即,图12中的同一行中的图像)之间的时间关系来执行时间预测。对于时间预测,可使用利用分层B画面的预测方案。使用在相同时间点的图像(即,图12中的同一列中的图像)之间空间关系来执行视点间预测。
[0106]在通过使用分层B画面来对多视点视频画面进行预测的预测方案中,当使用来自相同视点的图像(即,同一行中的像素)之间的时间关系来执行预测时,基于锚画面(anchorpicture)将来自相同视点的图像画面组预测编码为双向画面(以下称为“B画面”)。这里,锚画面表不位于图12的列之中的在第一时间点TO的列110和在最后时间点T8的列120中的画面,每个锚画面包括帧内画面。除了帧内画面(以下称为“I画面”)之外,仅通过视点间预测来对位于列110和120中的锚画面进行预测编码。位于除了列110和120之外的其它列中的包括I画面的画面被称为非锚画面(non-anchorpicture)。
[0107]例如,现在将描述使用分层B画面对在预定时间内从第一视点SO捕捉的图像画面进行编码的情况。在从第一视点SO捕捉的图像画面中,将在第一时间点TO捕捉的画面111和在最后时间点T8捕捉的画面121编码为I画面。随后,基于作为锚画面的I画面111和121将在时间点T4捕捉的画面131双向预测编码为B画面。基于I画面111和B画面131将在时间点T2捕捉的画面132双向预测编码为B画面。类似地,基于I画面111和B画面132对在时间点Tl捕捉的画面133双向预测编码,基于B画面132和B画面131对在时间点T3捕捉的画面134双向预测编码。如上所述,由于使用锚画面对从相同视点捕捉的图像序列进行分层和双向预测编码,因此该预测编码方法被称为分层B画面。在图12的“Bn”中,η表示被第η次双向预测的B画面(n=l、2、3和4)。例如,“BI”表示使用作为I画面或P画面的锚画面被第一次双向预测的画面,“ B2 ”表示在BI画面之后被双向预测的画面,“ B3 ”表示在B2画面之后被双向预测的画面,“B4”表示在B3画面之后被双向预测的画面。
[0108]如为对多视点视频帧进行编码,首先,使用上述的分层B画面对从作为基本视点的第一视点SO捕捉的图像画面组进行编码。为了对从其它视点捕捉的图像序列进行编码,首先,通过使用来自第一视点SO的I画面111和121的视点间预测,使用P画面对从列110和120中的奇数视点S2、S4和S6以及最后视点S7捕捉的图像画面进行预测编码。通过视点间预测,使用来自邻近视点的图像画面将从列110和120中的偶数视点S1、S3和S5捕捉的图像画面双向预测为B画面。例如,使用来自视点SI的I画面111和来自视点S2的P画面112来对在时间点TO从第二视点SI捕捉的B画面113进行双向预测,其中,视点SI和视点S2是邻近视点。
[0109]如上所述,当使用I画面、B画面和P画面中的至少一个对来自列110和120中的所有视点的图像画面中的每个进行编码时,通过使用分层B画面的时间预测以及视点间预测,来对非锚画面130进行双向预测编码。
[0110]在非锚画面中,通过使用分层B画面的时间预测,使用来自相同视点的锚画面对从奇数视点S2、S4和S6以及最后视点S7捕捉的画面中的每一个进行双向预测编码。在非锚画面130中,不仅通过使用分层B画面的时间预测,还通过使用来自邻近视点的画面的视点间预测,对从偶数视点S1、S3、S5和S7捕捉的图像画面进行双向预测编码。例如,使用锚画面113和123以及来自邻近视点的画面131和135来对在时间点T4从视点S2捕捉的画面136进行预测。
[0111]如上所述,使用在相同时间点从不同视点捕捉的I画面或者先前P画面,对列110和120中包括的P画面中的每个进行预测编码。例如,使用在最后时间点T8从第一视点SO捕捉的I画面121,将在最后时间点T8从视点S2捕捉的P画面122预测编码为参考画面。
[0112]现在将参照图13至图25详细描述能够基于具有树结构的编码单元对预测单元和分区进行预测编码的视频编码方法和设备以及能够基于具有树结构的编码单元对预测单元和分区进行预测解码的视频解码方法和设备。以下将描述的视频编码方法和设备可被应用到图3的彩色视频帧编码单元320,以下将描述的视频解码方法和设备可被应用到图9的彩色视频帧解码单元920。
[0113]图13是根据本发明的实施例的能够基于具有树结构的编码单元执行视频预测的视频编码设备100的框图。
[0114]能够基于具有树结构的编码单元执行视频预测的视频编码设备100包括最大编码单元划分器110、编码单元确定器120和输出单元130。为了方便解释,将在下文中将能够基于具有树结构的编码单元执行视频预测的视频编码设备100称为“视频编码设备100”。
[0115]最大编码单元划分器110可基于图像的当前画面的最大编码单元,来对当前画面进行划分。如果当前画面大于最大编码单元,则当前画面的图像数据可被划分为至少一个最大编码单元。根据本发明的实施例的最大编码单元可以是具有32 X 32、64 X 64、128 X 128或256X256等尺寸的数据单元,其中,数据单元的形状是宽度和长度为2的若干次方的正方形。图像数据可根据所述至少一个最大编码单元被输出到编码单元确定器120。
[0116]根据本发明的实施例的编码单元可由最大尺寸和深度表征。深度表示编码单元从最大编码单元空间划分的次数,并且随着深度加深,与深度相应的编码单元可从最大编码单元被划分为最小编码单元。最大编码单元的深度可被确定为最高深度,最小编码单元的深度可被确定为最低深度。由于随着最大编码单元的深度加深,与每个深度相应的编码单元的尺寸减小,因此与更高深度相应的编码单元可包括多个与更低深度相应的编码单元。
[0117]如上所述,当前画面的图像数据根据编码单元的最大尺寸被划分为最大编码单元,并且每个最大编码单元可包括根据深度被划分的编码单元。由于根据深度对根据本发明的实施例的最大编码单元进行划分,因此可根据深度对包括在最大编码单元中的空间域的图像数据进行分层地分类。
[0118]可预先确定编码单元的最大深度和最大尺寸,所述最大深度和最大尺寸限制对最大编码单元的高度和宽度进行分层划分的次数。
[0119]编码单元确定器120对通过根据深度对最大编码单元的区域进行划分而获得的至少一个划分区域进行编码,并且根据所述至少一个划分区域来确定用于输出最终编码的图像数据的深度。换句话说,编码单元确定器120以当前画面的最大编码单元为单位,通过对与深度相应的编码单元中的图像数据进行编码,选择具有最小编码误差的深度,来确定编码深度。确定的编码深度和每个最大编码单元中的图像数据被输出到输出单元130。
[0120]根据等于或低于最大深度的至少一个深度,基于与深度相应的编码单元,对每个最大编码单元中的图像数据进行编码,并且将基于与深度相应的编码单元对图像数据进行编码的结果进行比较。在将与深度相应的编码单元的编码误差进行比较之后,可选择具有最小编码误差的深度。可针对每个最大编码单元选择至少一个编码深度。
[0121]随着编码单元根据深度而被分层地划分并且编码单元的数量增加,最大编码单元的尺寸被划分。另外,即使包括在一个最大编码单元中的编码单元与相同的深度相应,也通过测量每个编码单元的图像数据的编码误差来确定是否将每个编码单元划分为更低深度。因此,由于即使包括在一个最大编码单元中的数据根据数据的位置而具有与深度相应的不同编码误差,因此可根据数据的位置而不同地设置编码深度。因此,针对一个最大编码单元可设置至少一个编码深度,并且可根据所述至少一个编码深度的编码单元来对最大编码单元的图像数据进行划分。
[0122]因此,根据本发明的实施例的编码单元确定器120可确定包括在当前最大编码单元中的具有树结构的编码单元。根据本发明的实施例的“具有树结构的编码单元”包括在当前最大编码单元中包括的与深度相应的所有编码单元中的与确定为编码深度的深度相应的编码单元。可根据最大编码单元的相同区域中的深度来分层地确定与编码深度相应的编码单元,并可在最大编码单元的不同区域中独立地确定与编码深度相应的编码单元。类似地,可从另一区域的编码深度独立地确定当前区域中的编码深度。
[0123]根据本发明的实施例的最大深度是与从最大编码单元到最小编码单元的划分次数有关的索引。根据本发明的实施例的第一最大深度可表示从最大编码单元到最小编码单元的总划分次数。根据本发明实施例的第二最大深度可表示从最大编码单元到最小编码单元的深度等级的总数。例如,当最大编码单元的深度是O时,通过对最大编码单元划分一次而获得的编码单元的深度可被设置为1,通过对最大编码单元划分两次而获得的编码单元的深度可被设置为2。如果通过对最大编码单元划分四次而获得的编码单元是最小编码单元,则存在深度O、1、2、3和4的深度等级。因此,第一最大深度可被设置为4,并且第二最大深度可被设置为5。
[0124]可对最大编码单元执行预测编码和变换。类似地,基于与深度相应的编码单元,根据等于或小于最大深度的深度,以最大编码单元为单位执行预测编码和变换。
[0125]由于每当根据深度对最大编码单元进行划分,与深度相应的编码单元的数量均增力口,因此应对随着深度加深产生的与深度相应的所有编码单元执行包括预测编码和变换的编码。为了便于描述,现在将基于包括在至少一个最大编码单元中的当前深度的编码单元来描述预测编码和变换。[0126]视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码,执行诸如预测编码、变换和熵编码的操作。此时,可针对所有操作使用相同的数据单元,或者可针对每个操作使用不同数据单元。
[0127]例如,视频编码设备100不仅可选择用于对图像数据进行编码的编码单元,还可选择不同于编码单元的数据单元,以便对编码单元中的图像数据执行预测编码。
[0128]为了对最大编码单元执行预测编码,可基于与编码深度相应的编码单元(S卩,不再划分到与更低深度相应的编码单元的编码单元)来执行预测编码。以下,不再划分且成为用于预测编码的基本单元的编码单元将被称为“预测单元”。通过划分预测单元获得的分区可通过对预测单元的高度和宽度中的至少一个进行划分而获得的数据单元。分区可以是通过对编码单元的预测单元进行划分而获得的数据单元,预测单元可以是具有与编码单元相同的尺寸的分区。
[0129]例如,当2NX2N (N是正整数)的编码单元不再被划分时,该编码单元成为2NX 2N的预测单元,并且分区的尺寸可以是2NX2N、NXN、NX2N或NXN。分区类型的示例包括通过对预测单元的高度或宽度进行对称地划分而获得的对称分区、通过对预测单元的高度或宽度进行非对称地划分(诸如,I:n或η:1)而获得的分区、通过对预测单元进行几何地划分而获得的分区、以及具有任意形状的分区。
[0130]预测单元的预测模式可以是帧内模式、帧间模式和跳过模式中的至少一个。例如,可对2Ν X 2Ν、2Ν X N、N X 2Ν或N X N的分区执行帧内模式或帧间模式。另外,可仅对2Ν X 2Ν的分区执行跳过模式。可对每个编码单元中的一个预测单元独立地执行编码,可选择具有最小编码误差的预测模式。
[0131]另外,视频编码设备100不仅可基于用于对图像数据进行编码的编码单元还可基于与编码单元不同的数据单元,来对编码单元中的图像数据执行变换。为了对编码单元执行变换,可基于具有小于或等于编码单元的尺寸的尺寸的数据单元,来执行变换。例如,变换单元可包括帧内模式的数据单元和帧间模式的数据单元。
[0132]与根据本发明的实施例的具有树结构的编码单元类似,编码单元中的变换单元可被递归地划分为更小尺寸的变换单元。因此,可基于根据变换深度的具有树结构的变换单元,对编码单元中的残差数据进行划分。
[0133]根据本发明的实施例的变换单元还可被分配变换深度,所述变换深度表示对编码单元的高度和宽度进行划分以获得变换单元的次数。例如,当2ΝΧ2Ν的当前编码单元的变换单元的尺寸是2ΝΧ2Ν时,变换深度可以是0,当2ΝΧ2Ν的当前编码单元的变换单元的尺寸是NXN时,变换深度可以是1,并且当2ΝΧ2Ν的当前编码单元的变换单元的尺寸是Ν/2ΧΝ/2时,变换深度可以是2。也就是说,还可根据变换深度设置具有树结构的变换单
J Li ο
[0134]每个编码深度的编码信息不仅需要关于编码深度的信息,还需要关于与预测编码和变换相关的信息的信息。因此,编码单元确定器120不仅可确定具有最小编码误差的编码深度,还可确定预测单元中的分区类型、每个预测单元的预测模式和用于变换的变换单元的尺寸。
[0135]稍后将详细描述根据本发明的实施例的包括在最大编码单元中的具有树结构的编码单元以及确定预测单元/分区和变换单元的方法。[0136]编码单元确定器120可通过使用基于拉格朗日乘数的率失真优化,来测量与深度相应的编码单元的编码误差。
[0137]输出单元130在比特流中输出最大编码单元的图像数据和关于每个深度的编码模式的信息,其中,所述最大编码单元的图像数据基于由编码单元确定器120确定的至少一个编码深度被编码。
[0138]编码图像数据可以是对图像的残差数据进行编码的结果。
[0139]关于每个深度的编码模式的信息可包括关于编码深度的信息、关于在预测单元中的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。
[0140]可使用根据深度的划分信息来定义关于编码深度的信息,其中,根据深度的划分信息指示是否将对更低深度而不是当前深度的编码单元执行编码。如果当前编码单元的当前深度是编码深度,则使用与当前深度相应的编码单元对当前编码单元进行编码,因此可定义关于当前深度的划分信息,使得可不再将当前深度的当前编码单元划分到更低深度的编码单元。相反地,如果当前编码单元的当前深度不是编码深度,则应对更低深度的编码单元进行编码,并且可因此定义关于当前深度的划分信息,使得可将当前深度的当前编码单元划分为更低深度的编码单元。
[0141]如果当前深度不是编码深度,则对更低深度的编码单元执行编码。由于更低深度的至少一个编码单元存在于当前深度的一个编码单元中,因此对更低深度的每个编码单元重复执行编码,并因此可对具有相同深度的编码单元递归地执行编码。
[0142]由于应在一个最大编码单元中确定具有树结构的编码单元,并且针对编码深度的每个编码单元确定关于至少一个编码模式的信息,所以可针对一个最大编码单元确定关于至少一个编码模式的信息。另外,由于根据深度对图像数据进行分层划分,因此最大编码单元的图像数据可根据它的位置具有不同的编码深度。因此可针对图像数据设置关于编码深度和编码模式的信息。
[0143]因此,根据本发明的实施例的输出单元130可将关于相应的编码深度和编码模式的编码信息分配给包括在最大编码单元中的编码单元、预测单元和最小单元中的至少一个。
[0144]根据本发明的实施例的最小单元是通过将最低深度的最小编码单元划分为4份而获得的矩形数据单元。可选择地,最小单元可以是可被包括在最大编码单元中所包括的所有编码单元、预测单元、分区单元和变换单元中的最大矩形数据单元。
[0145]例如,经由输出单元130输出的编码信息可被分类为与深度相应的每个编码单元的编码信息和每个预测单元的编码信息。与深度相应的每个编码单元的编码信息可包括预测模式信息和分区尺寸信息。每个预测单元的编码信息可包括关于帧间模式的估计方向的信息、关于帧间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息,以及关于帧内模式的插值方法的信息。
[0146]以画面、条带或GOP为单位定义的关于编码单元的最大尺寸的信息和关于最大深度的信息可被插入到比特流的头、序列参数集(SPS)或画面参数集(PPS)。
[0147]另外,可经由比特流的头、SPS或PPS发送关于当前视频中可用的变换单元的最大尺寸和最小尺寸的信息。输出单元130可对关于编码单元的可伸缩性的信息进行编码,并输出该信息。[0148]在根据本发明的实施例的视频编码设备100中,与深度相应的编码单元可以是通过将更高深度的编码单元的高度或宽度划分成两份而获得的编码单元。换言之,当当前深度的编码单元的尺寸是2NX 2N时,更低深度的编码单元的尺寸是NXN。另外,2NX 2N的编码单元可包括最多4个更低深度的编码单元。
[0149]因此,视频编码设备100可基于考虑当前画面的特征而确定的每个最大编码单元的尺寸和最大深度,针对每个最大编码单元确定具有最优形状和最优尺寸的编码单元来形成具有树结构的编码单元。另外,由于可根据不同预测模式和变换方法中的任意一个对每个最大编码单元进行编码,因此可考虑不同图像尺寸的编码单元的特征来确定最优编码模式。
[0150]因此,如果以传统宏块为单位对具有非常高的分辨率或非常大的数据量的图像进行编码,则每个画面的宏块的数量极度增加。因此,针对每个宏块产生的压缩信息量增加,因此难以发送压缩的信息,并且数据压缩效率降低。然而,视频编码设备100能够考虑图像的尺寸,在增加编码单元的最大尺寸的同时,基于图像的特征来控制编码单元,从而增加图像压缩效率。
[0151]图14是根据本发明的实施例的能够基于具有树结构的编码单元执行视频预测的视频解码设备200的框图。
[0152]能够基于具有树结构的编码单元执行视频预测的视频解码设备200包括接收器210、图像数据和编码信息提取器220和图像数据解码器230。为了便于解释,能够基于具有树结构的编码单元执行视频预测的视频解码设备200现将被称为“视频解码设备200”。
[0153]下面用于解释视频解码设备200的解码操作的各种术语(诸如编码单元、深度、预测单元、变换单元和关于不同编码模式的信息)的定义与上面参照图13描述的视频编码设备100的定义相同。
[0154]接收器210接收和解析编码视频的比特流。图像数据和编码信息提取器220从解析的比特流,以最大编码单元为单位提取具有树结构的每个编码单元的编码图像数据,并随后将提取的图像数据输出到图像数据解码器230。图像数据和编码信息提取器220可从关于当前画面、SPS或PPS的头部提取关于当前画面的编码单元的最大尺寸的信息。
[0155]另外,图像数据和编码信息提取器220从解析的比特流,以最大编码单元为单位,提取关于具有树结构的编码单元的编码深度和编码模式的信息。提取的关于编码深度和编码模式的信息被输出到图像数据解码器230。换言之,比特流中的图像数据可被划分为最大编码单元,使得图像数据解码器230可以以最大编码单元为单位对图像数据进行解码。
[0156]可针对关于至少一个编码深度的信息设置关于每个最大编码单元的编码深度和编码模式的信息。关于每个编码深度的编码模式的信息可包括关于与编码深度相应的相应编码单元的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。另外,根据深度的划分信息可被提取为关于编码深度的信息。
[0157]关于由图像数据和编码信息提取器220提取的每个最大编码单元的编码深度和编码模式的信息是关于编码深度和编码模式的信息,其中,所述编码深度和编码模式被确定为在编码端(诸如,视频编码设备100)以最大编码单元为单位对与深度相应的每个编码单元重复地执行编码时,产生最小编码误差。因此,视频解码设备200可通过根据产生最小编码误差的编码深度和编码模式对图像数据进行解码来恢复图像。[0158]由于关于编码深度和编码模式的编码信息可被分配给相应的编码单元、预测单元和最小单元中的数据单元,因此图像数据和编码信息提取器220可以以数据单元为单位,提取关于编码深度和编码模式的信息。如果以数据单元为单位记录了关于每个最大编码单元的编码深度和编码模式的信息,则包括关于相同编码深度和相同编码模式的信息的数据单元可被推断为是包括在相同的最大编码单元中的数据单元。
[0159]图像数据解码器230基于关于每个最大编码单元的编码深度和编码模式的信息,通过对每个最大编码单元中的图像数据进行解码,来恢复当前画面。换言之,图像数据解码器230可基于包括在每个最大编码单元中的具有树结构的每个编码单元的解析的分区类型、预测模式和变换单元,对编码的图像数据进行解码。解码处理可包括预测处理(包含帧内预测和运动补偿)和逆变换处理。
[0160]图像数据解码器230可基于关于根据编码深度的每个编码单元的预测单元的分区类型和预测模式的信息,根据每个编码单元的分区和预测模式,对每个编码单元执行帧内预测或运动补偿。
[0161]另外,为了对每个最大编码单元执行逆变换,图像数据解码器230可对关于每个编码单元的具有树结构的变换单元的信息进行解析,并基于每个编码单元的变换单元,执行逆变换。通过逆变换,可恢复每个编码单元的空间域的像素值。
[0162]图像数据解码器230可基于根据深度的划分信息来确定当前最大编码单元的编码深度。如果划分信息指示图像数据在当前深度中不再划分,则当前深度是编码深度。因此,图像数据解码器230可通过使用关于与编码深度相应的编码单元的预测单元的分区类型、预测模式和变换单元的尺寸的信息,对当前最大编码单元的编码数据进行解码。
[0163]换言之,可通过观察分配给编码单元、预测单元和最小单元中的数据单元的编码信息来收集包含包括相同划分信息的编码信息的数据单元,并且收集的数据单元可被认为是将由图像数据解码器230根据相同编码模式进行解码的一个数据单元。
[0164]视频解码设备200可通过递归地对每个最大编码单元执行编码,来获得关于产生最小编码误差的编码单元的信息,并且可使用所述信息来对当前画面进行解码。换言之,以最大编码单元为单位被确定为最优编码单元的具有树结构的编码单元中的编码图像数据可被解码。
[0165]因此,即使图像数据具有高分辨率和非常大数据量,也可通过使用编码单元的尺寸和编码模式,对图像数据进行有效地解码以恢复图像数据,其中,基于从编码端接收到的关于最优编码模式的信息,根据图像数据的特征自适应地确定所述编码单元的尺寸和编码模式。
[0166]图15示出根据本发明的实施例的编码单元的概念。
[0167]编码单元的尺寸可被表示为宽度X高度,并可以是64X64、32X32、16X16和8X8。64X64的编码单元可被划分为64X64、64X32、32X64或32X32的分区,32X32的编码单元可被划分为32X32、32X16、16X32或16X16的分区,16X16的编码单元可被划分为16X16、16X8、8X16或8X8的分区,8X8的编码单元可被划分为8X8、8X4、4X8或4X4的分区。
[0168]在视频数据310中,分辨率是1920 X 1080,编码单元的最大尺寸是64,最大深度是
2。在视频数据320中,分辨率是1920 X 1080,编码单元的最大尺寸是64,最大深度是3。在视频数据330中,分辨率是352X288,编码单元的最大尺寸是16,最大深度是I。图15中示出的最大深度表示从最大编码单元到最小编码单元的划分总次数。
[0169]如果分辨率高或数据量大,则编码单元的最大尺寸可相对大,从而不仅提高编码效率,而且准确地反映图像的特征。因此,具有比视频数据330更高分辨率的视频数据310和320的编码单元的最大尺寸可以是64。
[0170]由于视频数据310的最大深度是2,因此由于通过对最大编码单元划分两次,深度加深两层,因此视频数据310的编码单元315可包括长轴尺寸为64的最大编码单元和长轴尺寸为32和16的编码单元。同时,由于视频数据330的最大深度是1,因此由于通过对最大编码单元划分一次,深度加深一层,因此视频数据330的编码单元335可包括长轴尺寸为16的最大编码单元和长轴尺寸为8的编码单元。
[0171]由于视频数据320的最大深度是3,因此由于通过对最大编码单元划分三次,深度加深3层,因此视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元和长轴尺寸为32、16和8的编码单元。随着深度加深,详细信息可被精确地表示。
[0172]图16是根据本发明的实施例的基于编码单元的图像编码器400的框图。
[0173]图像编码器400执行视频编码设备100的编码单元确定器120的操作来对图像数据进行编码。具体地,帧内预测器410对当前帧405中的帧内模式下的编码单元执行帧内预测,运动估计器420和运动补偿器425通过使用当前帧405和参考帧495,对当前帧405中的帧间模式下的编码单元执行帧间预测和运动补偿。
[0174]从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过变换器430和量化器440被输出为量化的变换系数。量化的变换系数通过反量化器460和逆变换器470被恢复为空间域中的数据。恢复的空间域中的数据在通过去块单元480和环路滤波单元490后处理之后被输出为参考帧495。量化的变换系数可通过熵编码器450被输出在比特流455中。
[0175]为了将图像编码器400应用于视频编码设备100,图像编码器400的所有元件(SP,帧内预测器410、运动估计器420、运动补偿器425、变换器430、量化器440、熵编码器450、反量化器460、逆变换器470、去块单元480和环路滤波单元490)在考虑每个最大编码单元的最大深度的同时,基于具有树结构的编码单元中的每个编码单元执行操作。
[0176]具体地,帧内预测器410、运动估计器420和运动补偿器425在考虑当前最大编码单元的最大尺寸和最大深度的同时,确定具有树结构的编码单元中的每个编码单元的分区和预测模式。变换器430确定具有树结构的编码单元中的每个编码单元中的变换单元的尺寸。
[0177]图17是根据本发明的实施例的基于编码单元的图像解码器500的框图。
[0178]解析器510对比特流505进行解析,以获得将被解码的编码图像数据和对编码图像数据进行解码所需的编码信息。编码图像数据通过熵解码器520和反量化器530被输出为反量化的数据,反量化的数据通过逆变换器540被恢复为空间域中的图像数据。
[0179]针对空域中的图像数据,帧内预测器550对帧内模式的编码单元执行帧内预测,运动补偿器560通过使用参考帧585对帧间模式下的编码单元执行运动补偿。
[0180]通过帧内预测器550和运动补偿器560的空间域中的图像数据可在通过去块单元570和环路滤波单元580后处理之后被输出为恢复帧595。另外,通过去块单元570和环路滤波单元580后处理的图像数据可被输出为参考帧585。
[0181]为了通过使用视频解码设备200的图像数据解码器230对图像数据进行解码,图像解码器500可执行在解析器510的操作之后执行的操作。
[0182]为了将图像解码器500应用于视频解码设备200,图像解码器500的所有元件(SP,解析器510、熵解码器520、反量化器530、逆变换器540、帧内预测器550、运动补偿器560、去块单元570和环路滤波单元580)以最大编码单元为单位,基于具有树结构的编码单元执行操作。
[0183]具体地,帧内预测器550和运动补偿器560确定具有树结构的每个编码单元的分区和预测模式,逆变换器540确定每个编码单元的变换单元的尺寸。
[0184]图18是示出根据本发明的实施例的与深度相应的编码单元以及分区的示图。
[0185]根据本发明的实施例的视频编码设备100和视频解码设备200使用分层编码单元以考虑图像的特征。可根据图像的特征自适应地确定编码单元的最大高度、最大宽度和最大深度,或可由用户不同地设置编码单元的最大高度、最大宽度和最大深度。可根据编码单元的预定最大尺寸来确定与深度相应的编码单元的尺寸。
[0186]在根据本发明的实施例的编码单元的分层结构600中,编码单元的最大高度和最大宽度均是64最大深度是4最大深度表示从最大编码单元到最小编码单元的划分次数的总数。由于沿着分层结构600的垂直轴深度加深,因此与深度相应的每个编码单元的高度和宽度均被划分。另外,预测单元和分区沿着分层结构600的横轴被示出,其中,所述预测单元和分区是对与深度相应的每个编码单元进行预测编码的基础。
[0187]具体地,在分层结构600中,编码单元610是最大编码单元,并且深度为0,尺寸为64X64 (即,高度乘宽度)。随着深度沿着垂直轴加深,存在尺寸为32X32和深度为I的编码单元620、尺寸为16X16和深度为2的编码单元630、尺寸为8X8和深度为3的编码单元640以及尺寸为4X4和深度为4的编码单元650。尺寸为4X4和深度为4的编码单元650是最小编码单元。
[0188]每个编码单元的预测单元和分区根据每个深度沿着水平轴被排列。如果尺寸为64X64和深度为O的编码单元610是预测单元,则可将预测单元划分成包括在编码单元610中的分区,即,尺寸为64X64的分区610、尺寸为64X32的分区612、尺寸为32X64的分区614或尺寸为32X32的分区616。
[0189]类似地,可将尺寸为32X32和深度为I的编码单元620的预测单元划分成包括在编码单元620中的分区,即,尺寸为32X32的分区620、尺寸为32X16的分区622、尺寸为16X32的分区624和尺寸为16X16的分区626。
[0190]类似地,可将尺寸为16 X 16和深度为2的编码单元630的预测单元划分成包括在编码单元630中的分区,即,尺寸为16X16的分区630、尺寸为16X8的分区632、尺寸为8X16的分区634和尺寸为8X8的分区636。
[0191]类似地,可将尺寸为8X8和深度为3的编码单元640的预测单元划分成包括在编码单元640中的分区,即,尺寸为8X8的分区640、尺寸为8X4的分区642、尺寸为4X8的分区644和尺寸为4X4的分区646。
[0192]尺寸为4X4和深度为4的编码单元650是具有最低深度的最小编码单元。编码单元650的预测单元仅被设置为尺寸为4X4的分区650。[0193]为了确定最大编码单元610的编码深度,视频编码设备100的编码单元确定器120对包括在最大编码单元610中的与每个深度相应的所有编码单元进行编码。
[0194]随着深度加深,与每个深度相应并包括具有相同范围和相同尺寸的数据的编码单元的数量增加。例如,需要四个与深度2相应的编码单元来覆盖包括在与深度I相应的一个编码单元中的数据。因此,为了根据深度比较对相同数据进行编码的结果,与深度I相应的编码单元和四个与深度2相应的编码单元均被编码。
[0195]为了以深度为单位执行编码,可沿着分层结构600的水平轴,通过对与深度相应的每个编码单元中的预测单元执行编码,来将针对每个深度的最小编码误差选为代表编码误差。可选地,随着深度沿着分层结构600的纵轴加深,可通过以深度为单位执行编码,并比较根据深度的最小编码误差,来搜索最小编码误差。在最大编码单元610中的具有最小编码误差的深度和分区可被选为最大编码单元610的编码深度和分区类型。
[0196]图19是示出根据本发明的实施例的在编码单元710和变换单元720之间的关系的示图。
[0197]根据本发明的实施例的视频编码设备100 (或视频解码设备200)基于具有小于或等于最大编码单元的尺寸的编码单元,以最大编码单元为单位对图像进行编码(或解码)。在编码期间,可基于不大于相应的编码单元的数据单元,来选择用于执行变换的每个变换单元的尺寸。
[0198]例如,在视频编码设备100 (或视频解码设备200)中,如果编码单元710的尺寸是64X64,则可通过使用尺寸为32X32的变换单元720来执行变换。
[0199]此外,可通过对小于64X64的尺寸为32X32、16X 16、8X8和4X4的每个变换单元执行变换来编码尺寸为64X64的编码单元710的数据,然后可选择具有最小编码误差的变换单元。
[0200]图20是示出根据本发明的实施例的与深度相应的编码信息的示图。
[0201]视频编码设备100的输出单元130可对与编码深度相应的每个编码单元的关于分区类型的信息800、关于预测模式的信息810以及关于变换单元尺寸的信息820进行编码,并将信息800、信息810和信息820作为关于编码模式的信息来发送。
[0202]信息800指示关于通过划分当前编码单元的预测单元而获得的分区的形状的信息,其中,所述分区是用于对当前编码单元进行预测编码的数据单元。例如,可将尺寸为2NX2N的当前编码单元CU_0划分成以下分区中的任意一个:尺寸为2NX2N的分区802、尺寸为2NXN的分区804、尺寸为NX2N的分区806以及尺寸为NXN的分区808。在这种情况下,信息800被设置来指示尺寸为2NXN的分区804、尺寸为NX 2N的分区806以及尺寸为NXN的分区808中的一个。
[0203]信息810指示每个分区的预测模式。例如,信息810可指示对由信息800指示的分区进行预测编码的模式,即,帧内模式812、帧间模式814或跳过模式816。
[0204]信息820指示当对当前编码单元执行变换时所基于的变换单元。例如,变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二帧内变换单元828。
[0205]视频解码设备200的图像数据和编码信息提取器220可提取并使用用于对与深度相应的编码单元进行解码的信息800、810和820。[0206]图21是示出根据本发明的实施例的与深度相应的编码单元的示图。
[0207]划分信息可用来指示深度的改变。划分信息指示当前深度的编码单元是否被划分成更低深度的编码单元。
[0208]用于对深度为O和尺寸为2N_0X2N_0的编码单元900进行预测编码的预测单元910可包括以下分区类型的分区:尺寸为2N_0X2N_0的分区类型912、尺寸为2N_0XN_0的分区类型914、尺寸为N_0X2N_0的分区类型916和尺寸为Ν_0ΧΝ_0的分区类型918。图9仅示出了通过对称地划分预测单元910而获得的分区类型912至918,但是分区类型不限于此,并且预测单元910的分区可包括非对称分区、具有任意形状的分区和具有几何形状的分区。
[0209]根据每种分区类型,对尺寸为2N_0X2N_0的一个分区、尺寸为2N_0XN_0的两个分区、尺寸为N_0X2N_0的两个分区和尺寸为Ν_0ΧΝ_0的四个分区重复地执行预测编码。可根据帧内模式和帧间模式,对尺寸为2N_0X2N_0、N_0X2N_0、2N_0XN_0和Ν_0ΧΝ_0的分区执行预测编码。可根据跳过模式,仅对尺寸为2N_0X2N_0的分区执行预测编码。
[0210]如果在分区类型912至916中的一个分区类型中编码误差最小,则可不将预测单元910划分到更低深度。
[0211]如果在分区类型918中编码误差最小,则深度从O改变到I以在操作920中划分分区类型918,并对具有深度为2和尺寸为Ν_0ΧΝ_0的分区的编码单元930重复地执行编
码来搜索最小编码误差。
[0212]用于对深度为I和尺寸为2Ν_1Χ2Ν_1 (=Ν_0ΧΝ_0)的编码单元930进行预测编码的预测单元940可包括以下分区类型的分区:尺寸为2N_1X2N_1的分区类型942、尺寸为2N_1XN_1的分区类型944、尺寸为N_1X2N_1的分区类型946以及尺寸为N_1XN_1的分区类型948。
[0213]如果在尺寸为N_1XN_1的分区类型948中编码误差最小,则深度从I改变到2以在操作950中划分分区类型948,并对深度为2和尺寸为N_2XN_2的编码单元960重复执
行编码来搜索最小编码误差。
[0214]当最大深度是d时,与深度相应编码单元可被设置直到深度变成d-1,
[0215]并且划分信息可被设置直到深度是d-2。换句话说,当编码被执行直到在与d-2的深度相应的编码单元在操作970中被划分之后深度是d-Ι时,用于对深度为d-Ι和尺寸为2N_(d-l) X2N_(d-l)的编码单元980进行预测编码的预测单元990可包括以下分区类型的分区:尺寸为2N_(d-l)X2N(d-l)的分区类型992、尺寸为2N_(d-l)XN(d-l)的分区类型994、尺寸为N_(d-1) X 2N(d-Ι)的分区类型996和尺寸为N_(d_l) XN(d_l)的分区类型998。
[0216]可对分区类型992至998中的尺寸为2N_(d_l) X2N_(d_l)的一个分区、尺寸为2N_(d-l) XN_(d-l)的两个分区、尺寸为N_(d-1) X2N_(d-l)的两个分区、尺寸为1(d-1) XN_(d-l)的四个分区重复地执行预测编码,以搜索具有最小编码误差的分区类型。
[0217]即使当分区类型998具有最小编码误差时,由于最大深度是d,因此深度为d-Ι的编码单元cu_(d-l)也不再被划分到更低深度,当前最大编码单元900的编码深度被确定为d-Ι,并且编码单元900的分区类型可被确定为N_(d-1) X N (d-1)。此外,由于最大深度是d,因此不针对深度为d-Ι的编码单元952设置划分信息。[0218]数据单元999可以是用于当前最大编码单元900的“最小单元”。根据本发明的实施例的最小单元可以是通过将具有最低编码深度的最小单元划分成4份而获得的矩形数据单元。通过如上所述重复地执行编码,视频编码设备100可通过比较根据编码单元900的深度的编码误差并选择具有最小编码误差的深度以确定编码深度,并将编码单元900的分区类型和预测模式设置为编码深度的编码模式。
[0219]这样,根据深度(B卩,0、1、…、d-Ι和d的深度)的最小编码误差被彼此比较,并且具有最小编码误差的深度可被确定为编码深度。编码深度、预测单元的分区类型和预测模式可作为关于编码模式的信息被编码并发送。另外,由于编码单元从O的深度被划分到编码深度,因此仅编码深度的划分信息被设置为0,并且除了编码深度以外的其它深度的划分信息被设置为I。
[0220]视频解码设备200的图像数据和编码信息提取器220可提取并使用关于编码单元900的编码深度和预测单元的信息,来对分区912进行解码。视频解码设备200可基于根据深度的划分信息,将与划分信息“O”相应的深度确定为编码深度,并且在解码处理期间,可使用关于编码深度的编码模式的信息。
[0221]图22、图23和图24是示出根据本发明的实施例的编码单元1010、预测单元1060和变换单兀1070之间的关系的不图。
[0222]编码单元1010是与由视频编码设备100确定的最大编码单元的编码深度相应的编码单元。预测单元1060是各个编码单元1010中的预测单元的分区,变换单元1070是各个编码单元1010的变换单元。
[0223]在编码单元1010中,如果最大编码单元的深度是0,则编码单元1012和编码单元1054的深度是1,编码单元1014、1016、1018、1028、1050和1052的深度是2,编码单元1020、1022、1024、1026、1030、1032 和 1048 的深度是 3,编码单元 1040、1042、1044 和 1046 的深度是4。
[0224]在预测单元1060 中,一些分区 1014、1016、1022、1032、1048、1050、1052 和 1054 被划分为从编码单元划分的分区。换句话说,分区1014、1022、1050和1054是2NXN分区类型,分区1016、1048和1052是NX2N分区类型,分区1032是NXN分区类型。编码单元1010的预测单元和分区小于或等于与它们相应的编码单元。
[0225]在变换单元1070中,基于小于编码单元1052的数据单元,对与编码单元1052相应的图像数据执行变换或逆变换。另外,在尺寸和形状方面,变换单元1014、1016、1022、1032、1048、1050、1052和1054是不同于预测单元1060中的相应的预测单元和分区的数据单元。换句话说,根据本发明的实施例的视频编码设备100和视频解码设备200可基于不同的数据单元,对相同的编码单元独立地执行帧内预测、运动估计、运动补偿、变换和逆变换。
[0226]因此,通过以每个最大编码单元的区域为单位,对具有分层结构的编码单元递归地执行编码来确定最优编码单元,从而获得具有递归树结构的编码单元。编码信息可包括关于编码单元的划分信息、关于分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。表1示出可由视频编码设备100和视频解码设备200设置的编码信息的示例。
[0227][表1]
[0228]
【权利要求】
1.一种对多视点视频数据的深度图进行编码的方法,所述方法包括: 获得多视点彩色视频帧和与多视点彩色视频帧相应的深度图帧; 对获得的多视点彩色视频帧进行预测编码和恢复; 基于恢复的多视点彩色视频帧的块的像素值,将恢复的多视点彩色视频帧的块划分为至少一个分区; 针对恢复的多视点彩色视频帧的块分区中的每个,通过使用多视点彩色视频帧的块分区的外围像素值和与多视点彩色视频帧的块分区相应的深度图帧的块分区的外围像素值,获得指示多视点彩色视频帧的块分区中的每个与深度图帧的块分区中的每个之间的相关性的参数; 通过使用获得的参数,从恢复的多视点彩色视频帧的块分区获得深度图帧的相应块分区的预测值。
2.如权利要求1所述的方法,其中,对多视点彩色视频帧进行预测编码的步骤包括:针对从多视点彩色视频帧划分的至少一个最大编码单元中的每个,确定与深度相应的分层编码单元之中的包括编码深度的编码单元的具有树结构的编码单元;确定用于对与编码深度相应的编码单元中的每个进行预测编码的分区;通过基于分层变换单元执行变换来确定具有树结构的变换单元,其中,每个深度表示所述至少一个最大编码单元被空间划分的次数。
3.如权利要求1所述的方法,其中,获得参数的步骤包括:通过使用所述相关性确定所述参数,使得从多视点彩色视频帧的块分区的外围像素值获得的深度图帧的块分区的外围像素值与深度图帧的块分区的原始外围像素值之间的差最小化。
4.如权利要求3所述的方法,其中,所述相关性是线性关系,所述参数包括定义多视点彩色视频帧的块分区的外围像素值与深度图帧的块分区的相应外围像素值之间的线性关系的权重和偏移值。
5.如权利要求4所述的方法,其中,如果多视点彩色视频帧的块分区的外围像素值是Rec_Y’,深度图帧的块分区的相应外围像素值的预测值是Pred_D,权重是a,偏移值是b,则所述相关性被定义为等式Pred_D=aXReC_Y’ +b。
6.如权利要求1所述的方法,其中,获得深度图帧的相应块分区的预测值的步骤包括: 通过使用具有不同颜色分量的恢复的多视点彩色视频帧的块分区,获得深度图帧的相应块分区的预测值; 对从具有不同颜色分量的恢复的多视点彩色视频帧的块分区获得的预测值的代价进行比较,并确定将被用于预测深度图帧的块分区的多视点彩色视频帧的块分区。
7.一种用于对多视点视频数据的深度图进行编码的设备,所述设备包括: 图像获得单元,获得多视点彩色视频帧和与多视点彩色视频帧相应的深度图帧; 彩色视频帧编码单元,对获得的多视点彩色视频帧进行预测编码; 恢复单元,恢复编码的彩色视频帧; 划分单元,基于恢复的多视点彩色视频帧的块的像素值,将恢复的多视点彩色视频帧的块划分为至少一个分区; 相关性参数获得单元,针对恢复的多视点彩色视频帧的块分区中的每个,通过使用多视点彩色视频帧的块分区的外围像素值和与多视点彩色视频帧的块分区相应的深度图帧的块分区的外围像素值,获得指示多视点彩色视频帧的块分区中的每个与深度图帧的块分区中的每个之间的相关性的参数; 深度图帧预测单元,通过使用获得的参数,从恢复的多视点彩色视频帧的块分区获得深度图帧的相应块分区的预测值。
8.一种对多视点视频数据的深度图进行解码的方法,所述方法包括: 接收通过对多视点彩色视频帧和与多视点彩色视频帧相应的深度图帧进行编码而获得的比特流; 对多视点彩色视频帧进行解码; 基于解码的多视点彩色视频帧的块的像素值,将解码的多视点彩色视频帧的块划分为至少一个分区; 针对解码的多视点彩色视频帧的块分区中的每个,通过使用多视点彩色视频帧的块分区的外围像素值和与多视点彩色视频帧的块分区相应的深度图帧的块分区的外围像素值,获得指示多视点彩色视频帧的块分区中的每个与深度图帧的块分区中的每个之间的相关性的参数; 通过使用获得的参数,从解码的多视点彩色视频帧的块分区获得深度图帧的相应块分区的预测值。
9.如权利要求8所述的方法,其中,对多视点彩色视频帧进行解码的步骤包括: 从比特流获得关于以下项 的信息:从多视点彩色视频帧划分的至少一个最大编码单元中的每个的尺寸、指示所述至少一个最大编码单元被空间划分的次数的深度、用于对根据深度分层构造的编码单元进行预测编码的分区、以及具有分层结构的变换单元; 针对从多视点彩色视频帧划分的所述至少一个最大编码单元中的每个,确定与深度相应的分层编码单元之中的包括与编码深度相应的编码单元的具有树结构的编码单元;确定用于对与编码深度相应的编码单元中的每个进行预测解码的分区;基于获得的信息确定具有树结构的变换单元,其中,每个深度表示所述至少一个最大编码单元被空间划分的次数。
10.如权利要求8所述的方法,其中,获得参数的步骤包括:通过使用所述相关性确定所述参数,使得从多视点彩色视频帧的块分区的外围像素值获得的深度图帧的块分区的外围像素值与深度图帧的块分区的原始外围像素值之间的差最小化。
11.如权利要求10所述的方法,其中,所述相关性是线性关系,所述参数包括定义多视点彩色视频帧的块分区的外围像素值与深度图帧的块分区的相应外围像素值之间的线性关系的权重和偏移值。
12.如权利要求11所述的方法,其中,如果多视点彩色视频帧的块分区的外围像素值是Rec_Y’,深度图帧的块分区的相应外围像素值的预测值是Pred_D,权重是a,偏移值是b,则所述相关性被定义为等式Pred_D=aXReC_Y’ +b。
13.如权利要求8所述的方法,其中,获得深度图帧的相应块分区的预测值的步骤包括: 通过使用具有不同颜色分量的恢复的多视点彩色视频帧的块分区,获得深度图帧的相应块分区的预测值; 对从具有不同颜色分量的恢复的多视点彩色视频帧的块分区获得的预测值的代价进行比较,并确定将被用于预测深度图帧的块分区的多视点彩色视频帧的块分区。
14.如权利要求8所述的方法,其中,多视点彩色视频帧的块是以下块之一:具有与深度图帧块相同视点的彩色视频帧块、被缩放为具有与深度图帧块相同尺寸的具有相同视点的彩色视频帧块、具有与深度图帧块相同的视点的彩色视频帧块的外围块、被缩放为具有与深度图帧块相同的尺寸的具有相同视点的彩色视频帧块的外围块、基于指示多视点视频的视点之间的差的视差矢量确定的具有与深度图帧块不同的视点的彩色视频帧块、被缩放为具有与深度图帧块相同的尺寸并基于视差矢量确定的具有不同视点的彩色视频帧块、基于视差矢量确定的具有与深度图帧块不同的视点的彩色视频帧块的外围块、被缩放为具有与深度图帧块相同的尺寸并基于视差矢量确定的具有不同视点的彩色视频帧块的外围块。
15.一种用于多视点视频数据的深度图进行解码的设备,所述设备包括: 接收单元,接收通过对多视点彩色视频帧和与多视点彩色视频帧相应的深度图帧进行编码而获得的比特流; 彩色视频帧解码单元,对从比特流获得的编码的多视点彩色视频帧进行解码; 划分单元,基于恢复的多视点彩色视频帧的块的像素值,将恢复的多视点彩色视频帧的块划分为至少一个分区; 相关性参数获得单元,针对恢复的多视点彩色视频帧的块分区中的每个,通过使用多视点彩色视频帧的块分区的外围像素值和与多视点彩色视频帧的块分区相应的深度图帧的块分区的外围像素值,获得指示多视点彩色视频帧的块分区中的每个与深度图帧的块分区中的每个之间的相关性的参数; 深度图解码单元,通过使用获得的参数,从恢复的多视点彩色视频帧的块分区获得深度图帧的相应块分区的预测值。
【文档编号】H04N19/597GK103918255SQ201280049632
【公开日】2014年7月9日 申请日期:2012年8月9日 优先权日:2011年8月9日
【发明者】郑承洙, 崔秉斗, 朴正辉 申请人:三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1