用于帧间预测的方法及其装置和用于运动补偿的方法及其装置制造方法

文档序号:7993971阅读:239来源:国知局
用于帧间预测的方法及其装置和用于运动补偿的方法及其装置制造方法
【专利摘要】本发明提供一种帧间预测方法和运动补偿方法。所述帧间预测方法包括:通过使用存储在解码画面缓冲器中的长期参考图像对当前图像执行帧间预测;确定经由帧间预测产生的当前图像的残差数据和运动矢量;通过将长期参考图像的画面顺序计数(POC)信息划分为最高有效位(MSB)信息和最低有效位(LSB)信息,来将LSB信息确定为指示长期参考图像的长期参考索引。
【专利说明】用于帧间预测的方法及其装置和用于运动补偿的方法及其装置

【技术领域】
[0001]本发明涉及一种帧间预测方法和运动补偿方法。

【背景技术】
[0002]随着用于再现和存储高分辨率或高质量视频内容的硬件的开发和提供,对于用于有效地对高分辨率或高质量视频内容进行编码或解码的视频编解码器的需求正在增加。根据传统的视频编解码器,基于具有预定尺寸的宏块,根据受限的编码方法来对视频进行编码。
[0003]空间域的图像数据经由频率变换被变换为频率域的系数。根据视频编解码器,将图像划分为具有预定尺寸的块,对每个块执行离散余弦变换(DCT),并在块单元中对频率系数进行编码,以进行频率变换的快速计算。与空间域的图像数据相比,频率域的系数容易被压缩。具体地,由于根据经由视频编解码器的帧间预测或帧内预测的预测误差来表示空间域的图像像素值,因此当对预测误差执行频率变换时,大量数据可被变换为O。根据视频编解码器,可通过使用小量数据来代替连续并重复产生的数据,来减少数据量。


【发明内容】

[0004]技术问题
[0005]本发明提供一种使用长期参考图像的帧间预测方法和帧间预测设备,以及一种使用长期参考图像的运动补偿方法和运动补偿设备。本发明还提供一种涉及使用长期参考图像的帧间预测和运动补偿的视频编码方法和视频编码设备,以及一种涉及使用长期参考图像的运动补偿的视频解码方法和视频解码设备。
[0006]解决方案
[0007]根据本发明的一方面,提供一种帧间预测方法,包括:通过使用存储在解码画面缓冲器中的长期参考图像对当前图像执行帧间预测;确定经由帧间预测产生的当前图像的残差数据和运动矢量;通过将长期参考图像的画面顺序计数(POC)信息划分为最高有效位(MSB)信息和最低有效位(LSB)信息,将LSB信息确定为指示长期参考图像的长期参考索引。
[0008]有益效果
[0009]根据本发明的运动补偿方法,长期参考图像的画面顺序计数(POC)信息的最低有效位(LSB)信息可用作指示用于对图像进行帧间预测的参考图像之中的长期参考图像的参考索引。长期参考图像可通过使用图像的POC信息来指示,而不必使用用于识别长期参考图像的长期参考图像的单独图像编号。因此,可节省用于存储长期参考图像的单独图像编号的存储空间。此外,指示长期参考图像的索引的范围可以是无限的。

【专利附图】

【附图说明】
[0010]图1a是根据本发明的实施例的帧间预测设备的框图;
[0011]图1b是示出根据本发明的实施例的帧间预测方法的流程图;
[0012]图2a是根据本发明的实施例的运动补偿设备的框图;
[0013]图2b是示出根据本发明的实施例的运动补偿方法的流程图;
[0014]图3是示出根据本发明的实施例的长期参考图像的画面顺序计数(POC)信息的最低有效位(LSB)信息和最高有效位(MSB)信息的表;
[0015]图4是根据本发明的实施例的执行帧间预测的视频编码设备的框图;
[0016]图5是根据本发明的实施例的执行运动补偿的视频解码设备的框图;
[0017]图6是根据本发明的实施例的基于根据树结构的编码单元的视频编码设备的框图;
[0018]图7是根据本发明的实施例的基于根据树结构的编码单元的视频解码设备的框图;
[0019]图8是用于描述根据本发明的实施例的编码单元的概念的示图;
[0020]图9是根据本发明的实施例的基于编码单元的图像编码器的框图;
[0021]图10是根据本发明的实施例的基于编码单元的图像解码器的框图;
[0022]图11是示出根据本发明的实施例的根据深度的较深层编码单元以及分区的示图;
[0023]图12是用于描述根据本发明的实施例的编码单元与变换单元之间的关系的示图;
[0024]图13是用于描述根据本发明的实施例的与编码深度相应的编码单元的编码信息的示图;
[0025]图14是根据本发明的实施例的根据深度的较深层编码单元的示图;
[0026]图15至图17是用于描述根据本发明的实施例的编码单元、预测单元和变换单元之间的关系的不图;
[0027]图18是用于描述根据表I的编码模式信息的编码单元、预测单元和变换单元之间的关系的不图;
[0028]图19是根据本发明的实施例的存储程序的盘的物理结构的示图;
[0029]图20是用于通过使用盘来记录和读取程序的盘驱动器的示图;
[0030]图21是用于提供内容分配服务的内容供应系统的整体结构的示图;
[0031]图22和图23分别是根据本发明的实施例的应用了视频编码方法和视频解码方法的移动电话的外部结构和内部结构的示图;
[0032]图24是根据本发明的实施例的应用通信系统的数字广播系统的示图;
[0033]图25是根据本发明的实施例的使用视频编码设备和视频解码设备的云计算系统的网络结构的示图。
[0034]最佳实施方式
[0035]根据本发明的一方面,提供一种帧间预测方法,包括:通过使用存储在解码画面缓冲器中的长期参考图像对当前图像执行帧间预测;确定经由帧间预测产生的当前图像的残差数据和运动矢量;通过将长期参考图像的画面顺序计数(POC)信息划分为最高有效位(MSB)信息和最低有效位(LSB)信息,来将LSB信息确定为指示长期参考图像的长期参考索引。
[0036]确定LSB信息的步骤可包括:将用于当前条带进行帧间预测的长期参考图像的POC信息的LSB信息作为长期参考索引插入到条带头中。
[0037]确定LSB信息的步骤可包括:将当前图像的POC信息和长期参考图像的POC信息之间的差信息划分为MSB信息和LSB信息,来将差信息的LSB信息确定为长期参考索引。
[0038]所述帧间预测方法还可包括:通过使用存储在解码画面缓冲器中的短期参考图像对当前图像执行帧间预测;将短期参考图像的POC信息的LSB信息确定为指示短期参考图像的短期参考索引。
[0039]确定残差数据和运动矢量的步骤可包括:基于根据当前图像的块执行的帧间预测的结果,确定根据当前图像的块的残差数据和运动矢量。
[0040]根据本发明的另一方面,提供一种运动补偿方法,包括:接收编码的图像数据、运动矢量、和长期参考索引;通过对编码的图像数据进行解码来恢复当前图像的残差数据;通过从长期参考索引读取当前图像的长期参考图像的POC信息的最低有效位(LSB)信息,使用长期参考图像的最高有效位(MSB)信息和LSB信息,来确定画面顺序计数(POC)信息;通过基于在存储在解码画面缓冲器中的参考图像之中的与确定的POC信息相应的长期参考图像,使用运动矢量和残差数据执行运动补偿,来恢复当前图像。
[0041]确定POC信息的步骤可包括:在用于当前图像的多个长期参考图像之中,从第一长期参考图像的POC信息的MSB信息预测第二长期参考图像的POC信息的MSB信息;通过将从接收到的长期参考索引读取的第二长期参考图像的POC信息的LSB信息和第二长期参考图像的POC信息的MSB信息组合,来恢复第二长期参考图像的POC信息。
[0042]确定POC信息的步骤可包括:通过将长期参考图像的POC信息的MSB信息和LSB信息组合来恢复在当前图像的POC信息和长期参考图像的POC信息之间的差信息;通过将所述差信息与当前图像的POC信息相加,或从当前图像的POC信息减去所述差信息,来确定长期参考图像的POC编号。
[0043]接收的步骤可包括:从条带头解析长期参考索引,其中,长期参考索引指示用于对当前条带进行运动补偿的长期参考图像。
[0044]所述运动补偿方法还可包括:接收用于对当前图像进行帧间预测的短期参考索引;从短期参考索引读取用于对当前图像进行帧间预测的短期参考图像的POC信息的LSB信息;通过使用读取的短期参考图像的LSB信息和先前短期参考图像的MSB信息,来确定短期参考图像的POC信息;通过使用在存储在解码画面缓冲器中的参考图像之中的与确定的POC信息相应的短期参考图像对当前图像执行运动补偿。
[0045]接收的步骤可包括:接收根据当前图像的块的编码的图像数据,恢复残差数据的步骤可包括:根据所述块恢复残差数据和运动矢量,恢复当前图像的步骤可包括:通过根据所述块执行使用残差数据和运动矢量的运动补偿来恢复当前图像。
[0046]根据本发明的另一方面,提供一种帧间预测设备,包括:帧间预测单元,用于通过使用存储在解码画面缓冲器中的长期参考图像对当前图像执行帧间预测;输出单元,用于通过将长期参考图像的画面顺序计数(POC)信息划分为最高有效位(MSB)信息和最低有效位(LSB)信息,将LSB信息输出为指示长期参考图像的长期参考索引,并用于输出经由帧间预测产生的当前图像的残差数据和运动矢量。
[0047]根据本发明的另一方面,提供一种运动补偿设备,包括:接收单元,用于接收编码的图像数据、运动矢量和长期参考索引;运动补偿单元,用于通过对编码的图像数据进行解码来恢复当前图像的残差数据,从长期参考索引读取当前图像的长期参考图像的画面顺序计数(POC)信息的最低有效位(LSB)信息,通过使用长期参考图像的最高有效位(MSB)信息和LSB信息来确定POC信息,并通过基于在存储在解码画面缓冲器中的参考图像之中的与确定的POC信息相应的长期参考图像,使用运动矢量和残差数据执行运动补偿,来恢复当前图像。
[0048]根据本发明的另一方面,提供一种记录有用于执行所述帧间预测方法的程序的计算机可读记录介质。
[0049]根据本发明的另一方面,提供一种记录有用于执行所述运动补偿方法的程序的计算机可读记录介质。
[0050]根据本发明的另一方面,提供一种视频编码设备,包括:解码画面缓冲器,存储用于对图像进行帧间预测的参考图像;帧间预测单元,通过使用存储在解码画面缓冲器中的长期参考图像对当前图像执行帧间预测来产生残差数据;变换量化单元,通过对残差数据执行变换和量化来产生量化的变换系数;熵编码单元,通过将长期参考图像的画面顺序计数(POC)信息划分为最高有效位(MSB)信息和最低有效位(LSB)信息,对LSB信息和符号执行熵编码,其中,LSB信息是指示长期参考图像的长期参考索引,所述符号包括量化的变换系数和运动矢量。
[0051]根据本发明的另一方面,提供一种视频解码设备,包括:接收单元,接收视频流,并通过对接收到的视频流执行熵解码来解析编码的图像数据、运动矢量和长期参考索引;反量化和逆变换单元,通过对编码的图像数据执行反量化和逆变换来恢复残差数据;解码画面缓冲器,存储用于运动补偿的参考图像;运动补偿单元,通过对编码的图像数据进行解码来恢复当前图像的残差数据,从长期参考索引读取当前图像的长期参考图像的画面顺序计数(POC)信息的最低有效位(LSB)信息,通过使用长期参考图像的最高有效位(MSB)信息和LSB信息来确定POC信息,并基于在存储在解码画面缓冲器中的参考图像之中的与确定的POC信息相应的长期参考图像,使用运动矢量和残差数据来执行运动补偿;环路滤波单元,对经由运动补偿产生的恢复图像执行去块滤波。

【具体实施方式】
[0052]以下,将参照图1至图3描述根据本发明的实施例的使用长期参考图像的帧间预测方法和帧间预测设备以及运动补偿方法和运动补偿设备。此外,将参照图4和图5描述根据本发明的实施例的执行帧间预测的视频编码设备和执行运动补偿的视频解码设备。此夕卜,将参考图6至图18描述根据本发明的实施例的与基于具有树结构的编码单元的帧间预测有关的视频编码技术和视频解码技术。以下,术语“图像”可以指静止图像或视频的运动图像(即,视频本身)。
[0053]首先,将参照图1至图3描述根据本发明的实施例的使用长期参考图像的帧间预测方法和帧间预测设备。然后,将参照图4和图5描述根据本发明的实施例的涉及帧间预测的视频编码方法和视频解码方法。
[0054]图1a是根据本发明的实施例的帧间预测设备10的框图。
[0055]帧间预测设备10包括帧间预测单元12和输出单元14。
[0056]帧间预测使用当前图像和另一图像之间的相似性。从在当前图像之前被恢复的参考图像检测与当前图像的当前区域相似的参考区域。当前区域和参考区域之间的关于坐标的距离被表示为运动矢量,当前区域和参考区域的像素值之间的差被表示为残差数据。因此,可通过对当前区域进行帧间预测来输出指示参考图像的索引、运动矢量和残差数据,而不是直接输出当前区域的图像信息。
[0057]根据实施例的帧间预测设备10可根据视频的每个图像的块执行帧间预测。块可具有正方形形状、矩形形状或任何几何形状,不受限于具有预测尺寸的数据单元。根据实施例的块可以是根据树结构的编码单元之中的最大编码单元、编码单元、预测单元或变换单元。随后将参考图6至图18描述基于根据树结构的编码单元的视频编码和解码方法。
[0058]用于对当前图像进行帧间预测的参考图像必须在当前图像之间被解码。根据实施例的用于帧间预测的参考图像可被分类为短期参考图像和长期参考图像。解码画面缓冲器存储经由对先前图像进行运动补偿而产生的恢复图像。产生的恢复图像可用作用于对其他图像进行帧间预测的参考图像。因此,可从存储在解码画面缓冲器中的恢复图像中选择用于对当前图像进行帧间预测的至少一个短期参考图像或至少一个长期参考图像。短期参考图像可以是根据解码顺序在当前画面之前立即被解码或最近被解码的图像,而长期参考图像可以是解码比当前图像早得多但被选择并被存储在解码画面缓冲器中以用作对其它图像进行帧间预测的参考图像的图像。
[0059]在存储在解码画面缓冲器中的恢复图像中,短期参考图像和长期参考图像被彼此分类。长期参考图像是能够参考以对多个图像进行帧间预测的图像,并在很长一段时间内存储在解码画面缓冲器中。另一方面,可更新短期参考图像,其中,短期参考图像中的每一个被参考以用于对当前图像和后续图像进行帧间预测并且每个图像需要短期参考图像,因此可频繁更新解码画面缓冲器中的短期参考图像。因此,当新的短期参考图像被存储在解码画面缓冲器中时,在预先存储的短期参考图像之中的最早的短期参考图像可被顺序地删除。
[0060]帧间预测单元12可通过使用存储在解码画面缓冲器中的长期参考图像对当前图像执行帧间预测。
[0061]输出单元14可输出经由帧间预测单元12的帧间预测产生的当前图像的残差数据和运动矢量。
[0062]输出单元14可将长期参考图像的画面顺序计数(POC)信息的最低有效位(LSB)信息确定为指示长期参考图像的长期参考索引。输出单元14可将长期参考图像的POC信息划分为最高有效位(MSB)信息和LSB信息,并仅将LSB信息输出为指示长期参考图像的长期参考索引。
[0063]帧间预测单元12可确定每个条带的长期参考图像。因此,输出单元14可将用于对当前条带进行帧间预测的长期参考图像的POC信息的LSB信息作为长期参考索引插入到条带头。用于当前条带的块的参考图像的POC信息的LSB信息可被插入到条带头,然后被发送。
[0064]根据条带确定长期参考图像,并根据条带中的块执行帧间预测。换言之,帧间预测单元12可通过参考长期参考图像根据当前条带的块来执行帧间预测。因此,根据当前条带的块从长期参考图像确定参考块,并根据块针对参考块确定运动矢量和残差数据。因此,输出单元14可根据当前条带的块输出运动矢量和残差数据。
[0065]可选地,输出单元14可将长期参考图像的POC信息和当前图像的POC信息之间的差信息划分为MSB信息和LSB信息,并将差信息的LSB信息输出为长期参考索引。
[0066]帧间预测单元12可通过参考短期参考图像对当前图像执行帧间预测。在此情况下,在短期参考图像的POC信息的MSB信息和LSB信息之中,输出单元14可仅输出LSB信息作为指示短期参考图像的短期参考索引。
[0067]帧间预测设备10可包括总体控制帧间预测单元12和输出单元14的中央处理器(未示出)。可选地,帧间预测单元12和输出单元14可均由自身的处理器(未示出)来操作,并且自身的处理器可互相系统地进行操作以使得对帧间预测设备10进行操作。可选地,可根据帧间预测设备10的外部处理器(未示出)来控制帧间预测单元12和输出单元14。
[0068]帧间预测设备10可包括存储帧间预测单元12和输出单元14的输入数据和输出数据的一个或更多个数据存储单元(未示出)。帧间预测设备10可包括用于控制数据存储单元的数据输入和输出的存储器控制单元(未示出)。
[0069]图1b是示出根据本发明的实施例的帧间预测方法的流程图。
[0070]在操作13,帧间预测设备10可通过使用存储在解码画面缓冲器中的长期参考图像对当前图像执行帧间预测。在操作15,帧间预测设备10可确定根据帧间预测的当前图像的残差数据和运动矢量。在操作17,帧间预测设备10可将长期参考图像的POC信息划分为MSB信息和LSB信息,并将长期参考图像的POC信息的LSB信息确定为长期参考索引。
[0071]可输出当前图像的残差数据和运动矢量,并且可将长期参考图像的POC信息的LSB信息输出为用于指示当前图像的长期参考图像的信息,作为在操作13至17中帧间预测设备10通过使用长期参考图像对当前图像执行帧间预测的结果。
[0072]图2a是根据本发明的实施例的运动补偿设备20的框图。
[0073]运动补偿设备20包括接收单元22和运动补偿单元24。
[0074]接收单元22可接收编码的图像数据、运动矢量和长期参考索引。
[0075]作为帧间预测的结果,当前图像和参考图像之间的运动矢量和残差数据被产生。通过使用参考图像、残差数据和运动矢量来恢复当前图像的处理是运动补偿。运动补偿单元24可通过使用由接收单元22接收的当前图像的残差数据和运动矢量执行运动补偿来恢复当前图像。
[0076]运动补偿单元24可通过对编码的图像数据进行解码来恢复当前图像的残差数据。当编码的图像数据是量化后的变换系数时,运动补偿单元24可通过对编码的图像数据执行反量化和逆变换来恢复当前图像的残差数据,然后对残差数据执行运动补偿。
[0077]详细地讲,运动补偿单元24可根据图像的块执行运动补偿。块可具有正方形形状、矩形形状或任意几何形状,并可以是预测单元的树结构的编码单元。如以上参照图1a所描述的,块不限于具有预定尺寸的数据单元。
[0078]因此,接收单元22可接收根据当前图像的块的编码的图像数据,运动补偿单元24可根据块恢复残差数据和运动矢量以根据所述块执行使用残差数据和运动矢量的运动补偿。可通过对图像中的所有块执行运动补偿来恢复当前图像。
[0079]运动补偿单元24可从长期参考索引中读取当前图像的长期参考图像的POC信息的LSB信息。运动补偿单元24可通过将长期参考图像的POC信息的MSB信息和从长期参考索引读取的LSB信息组合,来确定长期参考图像的POC信息。
[0080]运动补偿单元24可从存储在解码画面缓冲器中的参考图像之中确定与确定的POC信息相应的长期参考图像。运动补偿单元24可基于确定的长期参考图像,通过使用运动矢量和残差数据对当前图像执行运动补偿。当前图像可经由运动补偿被恢复。
[0081]运动补偿单元24可从存储在解码图像缓冲器中的用于当前图像的多个长期参考图像之中的第一长期参考图像的MSB信息,预测第二长期参考图像的MSB信息。
[0082]例如,运动补偿单元24可对第二长期参考图像的POC信息的LSB信息与第一长期参考图像的POC信息的LSB信息进行比较,以确定第二长期参考图像的POC信息的MSB信息是高于、低于还是等于第一长期参考图像的POC信息的MSB信息。因此,可从第一长期参考图像的POC信息的MSB信息预测第二长期参考图像的POC信息的MSB信息。运动补偿单元24可通过将从接收到的长期参考索引读取的第二长期参考图像的POC信息的LSB信息和预测的第二长期参考图像的POC信息的MSB信息组合,来恢复第二长期参考图像的POC信息。
[0083]可选地,运动补偿单元24可接收作为用于当前图像的长期参考索引的长期参考图像的POC信息的LSB信息和长期参考图像的POC信息的MSB信息两者。在此情况下,运动补偿单元24可通过将从接收到的长期参考索引读取的长期参考图像的POC信息的LSB信息和MSB信息组合,来恢复长期参考图像的POC信息。
[0084]运动补偿单元24可从长期参考索引读取在当前图像的POC信息和长期参考图像的POC /[目息之间的差彳目息的LSB彳目息。这里,运动补偿单兀24可通过将MSB彳目息和LSB fg息组合来恢复差信息。运动补偿单元24可通过从当前图像的POC信息减去恢复的差信息或将恢复的差信息添加到当前图像的POC信息来确定长期参考图像的POC编号。
[0085]接收单元22可从条带头解析当前条带的长期参考索引。可从条带头解析用于当前条带的块的参考图像的POC信息的LSB信息。
[0086]可选地,接收单元22可接收用于对当前图像进行帧间预测的短期参考索引。可从短期参考索引读取用于对当前图像进行帧间预测的短期参考图像的POC信息的LSB信息。运动补偿单元24可通过使用读取的短期参考图像的POC信息的LSB信息和短期参考图像的MSB信息来确定短期参考图像的POC信息。运动补偿单元24可通过使用存储在解码画面缓冲器中的参考图像之中的与确定的POC信息相应的短期参考图像对当前图像执行运动补偿。
[0087]图2b是根据本发明的实施例的运动补偿方法的流程图。
[0088]在操作21,运动补偿设备20可接收编码的图像数据、运动矢量和长期参考索引。在操作23,运动补偿设备20可通过对编码的图像数据进行解码来恢复当前图像的残差数据。在操作25,运动补偿设备20可从长期参考索引读取当前图像的长期参考图像的POC信息的LSB信息,并通过使用长期参考图像的POC信息的MSB信息和LSB信息来确定长期参考图像的POC信息。在操作27,运动补偿设备20可通过基于在存储在解码画面缓冲器中的参考图像之中的与在操作25确定的POC信息相应的长期参考图像,使用运动矢量和残差数据执行运动补偿,来恢复当前图像。
[0089]换言之,运动补偿设备20可在存储在解码画面缓冲器中的恢复图像之中选择与在操作25确定的POC信息相应的长期参考图像,并从选择的长期参考图像中确定由运动矢量指示的参考区域。运动补偿设备20可通过将残差数据与确定的参考区域组合来执行运动补偿以确定当前区域。运动补偿设备20可通过根据当前图像的块执行运动补偿来恢复当前图像。
[0090]根据以上参照图1a和图1b描述的帧间预测设备10和以上参照图2a和图2b描述的运动补偿设备20,可将长期参考图像的POC信息的LSB信息用作指示在用于对图像进行帧间预测的参考图像之中的长期参考图像的长期参考索引。长期参考图像可通过使用POC信息来指示,而不必使用用于识别长期参考图像的长期参考图像的单独图像编号。因此,可节省用于存储长期参考图像的单独图像编号的存储空间。此外,指示长期参考图像的索引的范围可以是无限的。
[0091]图3是示出根据本发明的实施例的长期参考图像的POC信息的LSB信息和MSB信息的表。
[0092]帧间预测设备10和运动补偿设备20使用长期参考图像的POC信息来指示长期参考图像。此外,POC信息被划分为MSB信息和LSB信息。可预先设置LSB信息的最大大小。在图3中,LSB信息的范围是从O到15,因此LSB信息的最大大小为16,即,4比特。
[0093]当POC/[目息除以LSB彳目息的最大大小时,商可以是MSB/[目息,余数可以是LSB彳目息。
[0094]因此,当POC信息从O增加到15时,POC信息的MSB信息是0,LSB信息从O增加到15。此外,当POC信息从16增加到31时,MSB信息是1,LSB信息从O增加到15。此外,当POC信息从32增加至IJ 47时,MSB信息是2, LSB信息从O增加到15。此外,当POC信息是48时,MSB f目息是3, LSB f目息是O。
[0095]在图3中,MSB信息O、1、2和3都是十六进制数,并且分别表示十进制数的O、16、32 和 48。
[0096]当POC信息从15增加至IJ 16,从31增加到32,或从47增加到48时,LSB信息从15返回到O。换言之,每当LSB信息在连续增加时增加到最大大小的倍数时,LSB信息可从最大值返转到最小值。
[0097]当LSB信息仅在POC信息的MSB信息被预先检查之后才被另外确定时,可通过将MSB信息和LSB信息组合来确定POC信息。
[0098]因此,帧间预测设备10可仅输出长期参考图像的POC信息的LSB信息,以便输出指示长期参考图像的长期参考索引。运动补偿设备20可从接收自帧间预测设备10的参考索引中,读取长期参考图像的POC信息的LSB信息,并通过将LSB信息与预先获得的MSB信息组合来恢复长期参考图像的POC信息。
[0099]可选地,长期参考索引可表示在当前图像的POC信息和参考图像的POC信息之间的差信息的LSB信息。这里,运动补偿设备20可从长期参考索引中读取在当前图像的POC信息和长期参考图像的POC信息之间的差信息的LSB信息(DeltaPOCLtMlLsb)。运动补偿设备20可通过将预先确定的MSB信息(DeItaPOCLtMlMsb)和读取的LSB信息(DeltaPOCLtMlLsb)组合,来确定在当前图像的POC信息和长期参考图像的POC信息之间的差信息(DeltaPOCLtMl)(DeltaPOCLtMl = DeItaPOCLtMlLsb+DeItaPOCLtMlMsb)。此夕卜,当从当前图像的POC信息(PicOrderCnt)减去确定的差信息(DeltaPOCLtMl)时,可确定当前图像的长期参考图像的POC信息(RefPicSetLtCurr) (RefPicSetLtCurr =P i cOrderCnt-DeItaPOCLtMl)。
[0100]运动补偿设备20可从帧间预测设备10接收长期参考图像的POC信息的MSB信息。这里,运动补偿设备20可通过将接收到的MSB信息和长期参考图像的POC信息的LSB信息,来恢复长期参考图像的POC信息。
[0101]可选地,运动补偿设备20可基于在多个长期参考图像之中的预先确定的先前长期参考图像的POC信息的MSB信息,来确定当前长期参考图像的POC信息的MSB信息。例如,当前长期参考图像的POC信息的MSB信息(POCLtMlMsb)可i)比先前长期参考图像的POC信息的MSB信息(prevPOCLtMlMsb)高LSB信息的最大大小(MaxPOCLtLsb),ii)比先前长期参考图像的POC信息的MSB信息(prevPOCLtMlMsb)低LSB信息的最大大小(MaxPOCLtLsb),或iii)等于先前长期参考图像的POC信息的MSB信息(prevPOCLtMlMsb)。
[0102]例如,运动补偿设备20可将先前长期参考图像的POC信息的LSB信息与当前长期参考图像的POC信息的LSB信息进行比较,以确定当前长期参考图像的POC信息的MSB信息是否高于或等于先前长期参考图像的POC信息的MSB信息。
[0103]根据第一条件,当前长期参考图像的POC信息的LSB信息(POCLtLsbMl)可小于先前长期参考图像的POC信息的LSB信息(prevPOCLtLsbMl),并且当前长期参考图像的POC信息的LSB信息和先前长期参考图像的POC信息的LSB信息之间的距离高于或等于LSB信息的最大大小的一半(MaxPOCLtLsb/2)。当第一条件被满足时,当前长期参考图像的POC信息的MSB信息(POCLtMlMsb)可比先前长期参考图像的POC信息的MSB信息(prevPOCLtMlMsb)高 LSB 信息的最大大小(MaxPOCLtLsb)。
[0104][根据第一条件的关系表达式]
[0105]if ((P0CLtMlLsb<prevP0CLtMlLsb)&&
[0106]((prevPOCLtMlLsb-POCLtMlLsb)> = (MaxP0CLtLsb/2)))
[0107]POCLtMlMsb = prevPOCLtMlMsb+MaxPOCLtLsb
[0108]换言之,在第一条件中,确定LSB信息按从先前长期参考图像的POC信息到当前长期参考图像的POC信息的增加的方向折回(wrap around),并因此可相对地增加当前长期参考图像的POC信息的MSB信息。
[0109]根据第二条件,当前长期参考图像的POC信息的LSB信息(POCLtLsbMl)可高于先前长期参考图像的POC信息的LSB信息(prevPOCLtLsbMl),并且当前长期参考图像的POC信息的LSB信息和先前长期参考图像的POC信息的LSB信息之间的距离高于或等于LSB信息的最大大小的一半(MaxPOCLtLsb/2)。当第二条件被满足时,当前长期参考图像的POC信息的MSB信息(POCLtMlMsb)可比先前长期参考图像的POC信息的MSB信息(prevPOCLtMlMsb)低 LSB 信息的最大大小(MaxPOCLtLsb)。
[0110][根据第二条件的关系表达式]
[0111]if ((P0CLtMlLsb>prevP0CLtMlLsb)&&
[0112]((prevPOCLtMlLsb-POCLtMlLsb)> = (MaxPOCLtLsb/2)))
[0113]POCLtMlMsb = prevPOCLtMlMsb-MaxPOCLtLsb
[0114]换言之,在第二条件中,确定LSB信息按从先前长期参考图像的POC信息到当前长期参考图像的POC信息的减小的方向折回,因此可相对地减小当前长期参考图像的POC信息的MSB信息。
[0115]当无法应用第一条件和第二条件时,应用第三条件。在第三条件中,当前长期参考图像的POC信息的MSB信息(POCLtMlMsb)可等于先前长期参考图像的POC信息的MSB信息(prevPOCLtMlMsb)。
[0116][根据第三条件的关系表达式]
[0117]POCLtMlMsb = prevPOCLtMlMsb
[0118]通过考虑所有的第一条件至第三条件来确定当前长期参考图像的POC信息的MSB信息(POCLtMlMsb),并且可通过将从长期参考索引读取的当前长期参考图像的POC信息的LSB信息(POCLtMlLsb)与确定的MSB信息(POCLtMlMsb)组合,来确定当前长期参考图像的POC 信息(POCLtMl) (POCLtMl = POCLtMlMsb+POCLtMlLsb)。
[0119]即使当以上描述的当前图像的POC信息和长期参考图像的POC信息之间的差信息的LSB信息被用作长期参考索引时,仍可确定当前图像的POC信息和当前长期参考图像的POCf目息之间的差彳目息的LSB彳目息是闻于、低于还是等于当如图像的POC/[目息和预先确定的先前长期参考图像的POC信息之间的差信息的LSB信息。
[0120]图4是根据本发明的实施例的执行帧间预测的视频编码设备40的框图。
[0121]视频编码设备40包括解码画面缓冲器42、帧间预测单元44、变换量化单元46和熵编码单元48。
[0122]解码画面缓冲器42存储先前恢复的图像。可从存储在解码画面缓冲器42中的恢复图像之中确定用于对图像进行帧间预测的参考图像。帧间预测单元44可通过使用从存储在解码画面缓冲器42中的恢复图像之中选择的长期参考图像对当前图像执行帧间预测,来产生残差数据。帧间预测单元44可执行与以上描述的帧间预测设备10相同的操作。
[0123]变换量化单元46可通过对由帧间预测单元44产生的残差数据执行变换和量化来产生量化的变换系数。熵编码单元48可对包括量化的变换系数和运动矢量的符号执行熵编码。
[0124]因此,视频编码设备40可根据视频的图像的块执行帧间预测,通过对经由帧间预测根据块所产生的残差数据执行变换和量化来根据块产生量化的变换系数,并通过对量化的变换系数执行熵编码来输出比特流,从而对视频进行编码。
[0125]熵编码单元48可输出经由帧间预测确定的运动矢量连同量化的变换系数。因此,可对包括量化的变换系数和运动矢量的符号执行熵编码。
[0126]此外,由帧间预测单元44所确定的长期参考索引可被输出为符号。长期参考索引可以是长期参考图像的POC信息的LSB信息。相应地,熵编码单元48可对符号执行熵编码,其中,所述符号包括量化的变换系数、运动矢量和长期参考索引。熵编码单元48可输出根据熵编码产生的比特流。
[0127]此外,视频编码设备40可通过参考存储在解码画面缓冲器42中的恢复图像,使用当前图像的残差数据和运动矢量来执行运动补偿,以产生当前图像的恢复图像,从而产生用于对其他图像进行帧间预测的参考图像。因此,视频编码设备40可执行运动补偿设备20的操作以执行运动补偿。
[0128]换言之,视频编码设备40可从长期参考索引中读取POC信息的LSB信息,并通过使用读取的LSB信息来恢复长期参考图像的POC信息,以便选择用于运动补偿的长期参考图像。视频编码设备40可从存储在解码画面缓冲器42中的恢复图像之中选择与恢复的POC信息相应的长期参考图像,并基于选择的长期参考图像使用当前图像的残差数据和运动矢量来执行运动补偿。
[0129]为了输出视频编码结果,视频编码设备40可与安装在其中的视频编码处理器或外部视频编码处理器协作地进行操作,以便执行包括帧内预测、帧间预测、变换和量化的视频编码操作。视频编码操作不仅可在视频编码设备40包括单独内部视频编码处理器时被执行,而且可在视频编码设备40或用于控制视频编码设备40的中央处理设备或图形处理设备包括视频编码处理模块时被执行。
[0130]图5是根据本发明的实施例的执行运动补偿的视频解码设备50的框图。
[0131]视频解码设备50可包括接收单元52、反量化和逆变换单元54、解码画面缓冲器56、运动补偿单元58和环路滤波单元59。
[0132]接收单元52可接收视频流,并对接收的视频流执行熵解码以解析编码的图像数据。
[0133]反量化和逆变换单元54可通过对经由接收单元52解析的编码的图像数据执行反量化和逆变换来恢复残差数据。
[0134]接收单元52可从视频流中解析运动矢量。解码画面缓冲器56可存储先前恢复的图像,其中,先前恢复的图像可用作用于对其他图像进行运动补偿的参考图像。运动补偿单元58可基于存储在解码画面缓冲器56中的参考图像,使用运动矢量和残差数据来执行运动补偿。
[0135]环路滤波单元59可对由运动补偿单元58恢复并输出的恢复图像执行去块滤波。环路滤波单元59可输出最终的恢复图像。此外,环路滤波单元59的输出图像可存储在解码画面缓冲器56中,并且所述输出图像可用作用于对后续图像进行运动补偿的参考图像。
[0136]视频解码设备50可通过根据视频的图像的块执行解码来恢复视频。接收单元52可根据块解析编码的图像数据和运动矢量,反量化和逆变换单元54可通过根据块执行反量化和逆变换来根据块恢复残差数据。运动补偿单元58可根据块从参考图像之中确定由运动矢量指示的参考块,并通过将参考块和残差数据组合来产生恢复块。
[0137]接收单元52可从视频流解析长期参考索引。运动补偿单元58可执行与以上描述的运动补偿设备20相同的操作。运动补偿单元58可从长期参考索引中读取当前图像的长期参考图像的POC信息的LSB信息,并通过使用长期参考图像的MSB信息和LSB信息来确定长期参考图像的POC信息。运动补偿单元58可基于在存储在解码画面缓冲器56中的恢复图像之中的与POC信息相应的长期参考图像,使用运动矢量和残差数据来执行运动补偿。换言之,运动补偿单元58可在长期参考图像中确定由运动矢量指示的参考块,并通过将参考块和残差数据组合来恢复当前块。
[0138]为了输出视频解码结果,视频解码设备50可与安装在其中的视频解码处理器或外部视频解码处理器协作地进行操作,以执行包括反量化、逆变换、帧内预测和运动补偿的视频解码操作。视频解码操作不仅可在视频解码设备50包括单独内部视频解码处理器时被执行,而且可在视频解码设备50或用于控制视频解码设备50的中央处理设备或图形处理设备包括视频解码处理模块时被执行。
[0139]如以上所描述的,帧间预测设备10可将视频数据的块划分为具有树结构的编码单元,并且用于编码单元的帧间预测的预测单元可被使用。以下,将参照图6至图18描述基于具有树结构的编码单元和变换单元的视频编码方法、视频编码设备、视频解码方法和视频解码设备。
[0140]图6是根据本发明的实施例的基于根据树结构的编码单元的视频编码设备100的框图。
[0141]涉及基于根据树结构的编码单元的视频预测的视频编码设备100包括最大编码单元划分器110、编码单元确定器120和输出单元130。
[0142]最大编码单元划分器110可基于最大编码单元划分当前画面,其中,最大编码单元是具有用于图像的当前画面的最大尺寸的编码单元。如果当前画面大于最大编码单元,则可将当前画面的图像数据划分为至少一个最大编码单元。根据本发明的实施例的最大编码单元可以是尺寸为32X32、64X64、128X128、256X256等的数据单元,其中,数据单元的形状是宽度和长度为2的若干次方的正方形。图像数据可根据至少一个最大编码单元被输出到编码单元确定器120。
[0143]根据本发明的实施例的编码单元可由最大尺寸和深度表征。深度表示编码单元从最大编码单元空间被划分的次数,并且随着深度加深,根据深度的较深层编码单元可从最大编码单元被划分到最小编码单元。最大编码单元的深度为最高深度,最小编码单元的深度为最低深度。由于随着最大编码单元的深度加深,与每个深度相应的编码单元的尺寸减小,因此与更高深度相应的编码单元可包括多个与更低深度相应的编码单元。
[0144]如上所述,当前画面的图像数据根据编码单元的最大尺寸被划分为最大编码单元,并且每个最大编码单元可包括根据深度被划分的较深层编码单元。由于根据深度对根据本发明的实施例的最大编码单元进行划分,因此可根据深度对包括在最大编码单元中的空间域的图像数据进行分层地分类。
[0145]可预先确定编码单元的最大深度和最大尺寸,所述最大深度和最大尺寸限制最大编码单元的高度和宽度被分层划分的总次数。
[0146]编码单元确定器120对通过根据深度对最大编码单元的区域进行划分而获得的至少一个划分区域进行编码,并且根据所述至少一个划分区域来确定用于输出最终编码的图像数据的深度。换言之,编码单元确定器120通过根据当前画面的最大编码单元以根据深度的较深层编码单元对图像数据进行编码,并选择具有最小编码误差的深度,来确定编码深度。确定的编码深度和根据确定的编码深度的被编码的图像数据被输出到输出单元130。
[0147]基于与等于或低于最大深度的至少一个深度相应的较深层编码单元,对最大编码单元中的图像数据进行编码,并且基于每个较深层编码单元比较对图像数据进行编码的结果。在对与较深层编码单元的编码误差进行比较之后,可选择具有最小编码误差的深度。可针对每个最大编码单元选择至少一个编码深度。
[0148]随着编码单元根据深度而被分层地划分并且编码单元的数量增加,最大编码单元的尺寸被划分。另外,即使在一个最大编码单元中编码单元与同一深度相应,也通过分别测量每个编码单元的图像数据的编码误差来确定是否将与同一深度相应的每个编码单元划分为更低深度。因此,即使图像数据被包括在一个最大编码单元中,在一个最大编码单元中编码误差根据区域而不同,因此在图像数据中编码深度可根据区域而不同。因此,可在一个最大编码单元中确定一个或更多个编码深度,并且可根据至少一个编码深度的编码单元来对最大编码单元的图像数据进行划分。
[0149]因此,编码单元确定器120可确定包括在最大编码单元中的具有树结构的编码单元。根据本发明的实施例的“具有树结构的编码单元”包括在最大编码单元中包括的所有较深层编码单元中的与确定为编码深度的深度相应的编码单元。可根据最大编码单元的相同区域中的深度来分层地确定编码深度的编码单元,并可在不同区域中独立地确定编码深度的编码单元。类似地,可从另一区域的编码深度独立地确定当前区域中的编码深度。
[0150]根据本发明的实施例的最大深度是与从最大编码单元到最小编码单元的划分次数有关的索引。根据本发明的实施例的第一最大深度可表示从最大编码单元到最小编码单元的总划分次数。根据本发明实施例的第二最大深度可表示从最大编码单元到最小编码单元的深度等级的总数。例如,当最大编码单元的深度是O时,对最大编码单元划分一次的编码单元的深度可被设置为1,对最大编码单元划分两次的编码单元的深度可被设置为2。这里,如果最小编码单元是对最大编码单元划分四次的编码单元,则存在深度O、1、2、3和4的5个深度等级,并因此第一最大深度可被设置为4,第二最大深度可被设置为5。
[0151]可根据最大编码单元执行预测编码和变换。还根据最大编码单元,基于根据等于或小于最大深度的深度的较深层编码单元来执行预测编码和变换。
[0152]由于每当根据深度对最大编码单元进行划分时,较深层编码单元的数量增加,因此对随着深度加深而产生的所有较深层编码单元执行包括预测编码和变换的编码。为了便于描述,在最大编码单元中,现在将基于当前深度的编码单元来描述预测编码和变换。
[0153]视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码,执行诸如预测编码、变换和熵编码的操作,此时,可针对所有操作使用相同的数据单元,或者可针对每个操作使用不同的数据单元。
[0154]例如,视频编码设备100不仅可选择用于对图像数据进行编码的编码单元,还可选择不同于编码单元的数据单元,以便对编码单元中的图像数据执行预测编码。
[0155]为了对最大编码单元执行预测编码,可基于与编码深度相应的编码单元(即,基于不再被划分为与更低深度相应的编码单元的编码单元)来执行预测编码。以下,不再被划分且成为用于预测编码的基本单元的编码单元现在将被称为“预测单元”。通过划分预测单元获得的分区可包括预测单元以及通过对预测单元的高度和宽度中的至少一个进行划分而获得的数据单元。分区是编码单元的预测单元被划分的数据单元,预测单元可以是具有与编码单元相同尺寸的分区。
[0156]例如,当2NX2N(其中,N是正整数)的编码单元不再被划分,并且成为2NX2N的预测单元时,分区的尺寸可以是2NX 2N、2NX N、NX 2N或NX N。分区类型的示例包括通过对预测单元的高度或宽度进行对称地划分而获得的对称分区、通过对预测单元的高度或宽度进行非对称地划分(诸如,1:11或11:1)而获得的分区、通过对预测单元进行几何地划分而获得的分区、以及具有任意形状的分区。
[0157]预测单元的预测模式可以是帧内模式、帧间模式和跳过模式中的至少一个。例如,可对2N X 2N、2N X N、N X 2N或N X N的分区执行帧内模式或帧间模式。另外,可仅对2N X 2N的分区执行跳过模式。可对编码单元中的一个预测单元独立地执行编码,从而选择具有最小编码误差的预测模式。
[0158]视频编码设备100不仅可基于用于对图像数据进行编码的编码单元还可基于与编码单元不同的数据单元,来对编码单元中的图像数据执行变换。为了对编码单元执行变换,可基于具有小于或等于编码单元的尺寸的数据单元,来执行变换。例如,用于变换的数据单元可包括帧内模式的数据单元和帧间模式的数据单元。
[0159]编码单元中的变换单元可以以与根据树结构的编码单元相似的方式被递归地划分为更小尺寸的区域。因此,可基于根据变换深度的具有树结构的变换单元,对编码单元中的残差数据进行划分。
[0160]还可在变换单元中设置变换深度,其中,变换深度表示通过对编码单元的高度和宽度进行划分以达到变换单元的划分次数。例如,在2NX2N的当前编码单元中,当变换单元的尺寸是2NX2N时,变换深度可以是0,当变换单元的尺寸是NXN时,变换深度可以是1,当变换单元的尺寸是N/2XN/2时,变换深度可以是2。换言之,还可根据变换深度设置具有树结构的变换单元。
[0161]根据与编码深度相应的编码单元的编码信息不仅需要关于编码深度的信息,还需要关于与预测编码和变换相关的信息的信息。因此,编码单元确定器120不仅确定具有最小编码误差的编码深度,还确定预测单元中的分区类型、根据预测单元的预测模式和用于变换的变换单元的尺寸。
[0162]稍后将参照图8至图18详细描述根据本发明的实施例的最大编码单元中的根据树结构的编码单元,以及确定预测单元/分区和变换单元的方法。
[0163]编码单元确定器120可通过使用基于拉格朗日乘数的率失真优化,来测量根据深度的较深层编码单元的编码误差。
[0164]输出单元130在比特流中输出最大编码单元的图像数据和关于根据编码深度的编码模式的信息,其中,所述最大编码单元的图像数据基于由编码单元确定器120确定的至少一个编码深度被编码。
[0165]可通过对图像的残差数据进行编码来获得编码图像数据。
[0166]关于根据编码深度的编码模式的信息可包括关于编码深度的信息、关于在预测单元中的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。
[0167]可通过使用根据深度的划分信息来定义关于编码深度的信息,其中,根据深度的划分信息指示是否对更低深度而不是当前深度的编码单元执行编码。如果当前编码单元的当前深度是编码深度,则对当前编码单元中的图像数据进行编码并输出,因此可定义划分信息以不将当前编码单元划分到更低深度。可选地,如果当前编码单元的当前深度不是编码深度,则对更低深度的编码单元执行编码,并因此可定义划分信息以对当前编码单元进行划分来获得更低深度的编码单元。
[0168]如果当前深度不是编码深度,则对被划分到更低深度的编码单元的编码单元执行编码。由于更低深度的至少一个编码单元存在于当前深度的一个编码单元中,因此对更低深度的每个编码单元重复执行编码,并因此可对具有相同深度的编码单元递归地执行编码。
[0169]由于针对一个最大编码单元确定具有树结构的编码单元,并且针对编码深度的编码单元确定关于至少一个编码模式的信息,所以可针对一个最大编码单元确定关于至少一个编码模式的信息。另外,由于根据深度对图像数据进行分层划分,因此最大编码单元的图像数据的编码深度可根据位置而不同,因此可针对图像数据设置关于编码深度和编码模式的信息。
[0170]因此,输出单元130可将关于相应的编码深度和编码模式的编码信息分配给包括在最大编码单元中的编码单元、预测单元和最小单元中的至少一个。
[0171]根据本发明的实施例的最小单元是通过将构成最低深度的最小编码单元划分为4份而获得的方形数据单元。可选择地,根据实施例的最小单元可以是可包括在最大编码单元中所包括的所有编码单元、预测单元、分区单元和变换单元中的最大方形数据单元。
[0172]例如,通过输出单元130输出的编码信息可被分类为根据较深层编码单元的编码信息和根据预测单元的编码信息。根据较深层编码单元的编码信息可包括关于预测模式的信息和关于分区尺寸的信息。根据预测单元的编码信息可包括关于帧间模式的估计方向的信息、关于帧间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息、以及关于帧内模式的插值方法的信息。
[0173]根据画面、条带或GOP定义的关于编码单元的最大尺寸的信息和关于最大深度的信息可被插入到比特流的头、序列参数集或画面参数集。
[0174]还可经由比特流的头、序列参数集或画面参数集输出关于针对当前视频允许的变换单元的最大尺寸的信息和关于变换单元的最小尺寸的信息。输出单元130可对以上参照图1至图6描述的与预测有关的参考信息、预测信息和条带类型信息进行编码,并输出这些信息。
[0175]在视频编码设备100中,较深层编码单元可以是通过将更高深度的编码单元(更高一层)的高度或宽度划分成两份而获得的编码单元。换言之,当当前深度的编码单元的尺寸是2NX 2N时,更低深度的编码单元的尺寸是NXN。另外,尺寸为2NX 2N的具有当前深度的编码单元可包括最多4个具有更低深度的编码单元。
[0176]因此,视频编码设备100可基于考虑当前画面的特征而确定的最大编码单元的尺寸和最大深度,通过针对每个最大编码单元确定具有最优形状和最优尺寸的编码单元来形成具有树结构的编码单元。另外,由于可通过使用各种预测模式和变换中的任意一个对每个最大编码单元执行编码,因此可考虑各种图像尺寸的编码单元的特征来确定最优编码模式。
[0177]因此,如果以传统宏块对具有高分辨率或大数据量的图像进行编码,则每个画面的宏块的数量极度增加。因此,针对每个宏块产生的压缩信息的条数增加,因此难以发送压缩的信息,并且数据压缩效率降低。然而,通过使用视频编码设备100,由于考虑图像的尺寸,在增加编码单元的最大尺寸的同时,基于图像的特征来调整编码单元,因此可增加图像压缩效率。
[0178]图6的视频编码设备100可执行图1a的帧间预测设备10或图4的视频编码设备40的操作。
[0179]编码单元确定器120和输出单元130可执行帧间预测设备10或帧间预测单元44的操作。可针对每个最大编码单元,根据具有树结构的编码单元确定用于帧间预测的预测单元,并且可对每个预测单元执行帧间预测。
[0180]具体地,当长期参考图像用于在帧间模式下对当前预测单元进行帧间预测时,长期参考图像的POC信息可用作用于识别存储在解码画面缓冲器中的长期参考图像的长期参考索引。输出单元130可将长期参考图像的POC信息的LSB信息输出为参考索引。此外,指示将在当前条带中被参考的长期参考图像的参考索引可被存储在条带头中。因此,输出单元130可通过条带头发送作为参考索引的长期参考图像的POC信息的LSB信息。
[0181]此外,编码单元确定器120可通过参考存储在解码画面缓冲期中的先前恢复图像对当前图像执行运动补偿,以便产生用于对其他图像进行帧间预测的参考图像。因此,编码单元确定器120可执行参照图5描述的视频解码设备50的操作。
[0182]换言之,编码单元确定器120还可从长期参考索引读取POC信息的LSB信息,并通过使用读取的LSB信息恢复长期参考图像的POC信息,以便选择用于运动补偿的长期参考图像。编码单元确定器120可从存储在解码画面缓冲器中的恢复图像之中选择与恢复的POC信息相应的长期参考图像,并基于选择的长期参考图像使用运动矢量和残差数据来执行运动补偿。
[0183]由于编码单元确定器120根据预测单元执行运动补偿,因此编码单元确定器120可从选择的长期参考图像中确定由当前预测单元的运动矢量指示的参考预测单元,并通过将当前预测单元的残差数据与确定的参考预测单元组合来恢复当前预测单元。可通过恢复预测单元来恢复编码单元,可通过恢复编码单元来恢复最大编码单元,并且可通过恢复最大编码单元来恢复图像。
[0184]图7是根据本发明的实施例的基于具有树结构的编码单元的视频解码设备200的框图。
[0185]涉及基于具有树结构的编码单元的视频预测的视频解码设备200包括接收器210、图像数据和编码信息提取器220、图像数据解码器230。
[0186]用于视频解码设备200的解码操作的各种术语(诸如编码单元、深度、预测单元、变换单元和关于各种编码模式的信息)的定义与参照图6和视频编码设备100描述的定义相同。
[0187]接收器210接收和解析编码视频的比特流。图像数据和编码信息提取器220从解析的比特流,针对每个编码单元提取编码图像数据,并将提取的图像数据输出到图像数据解码器230,其中,编码单元具有根据每个最大编码单元的树结构。图像数据和编码信息提取器220可从关于当前画面的头、序列参数集或画面参数集提取关于当前画面的编码单元的最大尺寸的信息。
[0188]另外,图像数据和编码信息提取器220从解析的比特流,根据每个最大编码单元,提取关于具有树结构的编码单元的编码深度和编码模式的信息。提取的关于编码深度和编码模式的信息被输出到图像数据解码器230。换言之,比特流中的图像数据被划分为最大编码单元,使得图像数据解码器230针对每个最大编码单元对图像数据进行解码。
[0189]可针对关于与编码深度相应的至少一个编码单元的信息设置关于根据最大编码单元的编码深度和编码模式的信息,关于编码模式的信息可包括关于与编码深度相应的相应编码单元的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。另外,根据深度的划分信息可被提取为关于编码深度的信息。
[0190]关于由图像数据和编码信息提取器220提取的根据每个最大编码单元的编码深度和编码模式的信息是关于在以下情况下被确定为产生最小编码误差的编码深度和编码模式的信息,即,在编码器(诸如,视频编码设备100)根据最大编码单元对根据深度的每个较深层编码单元重复地执行编码的时候。因此,视频解码设备200可通过根据产生最小编码误差的编码深度和编码模式对图像数据进行解码来恢复图像。
[0191]由于关于编码深度和编码模式的编码信息可被分配给相应的编码单元、预测单元和最小单元中的预定数据单元,因此图像数据和编码信息提取器220可根据预定数据单元,提取关于编码深度和编码模式的信息。如果关于相应最大编码单元的编码深度和编码模式的信息根据预定数据单元被记录,则可将被分配了相同的关于编码深度和编码模式的信息的预定数据单元推断为是包括在同一最大编码单元中的数据单元。
[0192]图像数据解码器230基于关于根据最大编码单元的编码深度和编码模式的信息,通过对每个最大编码单元中的图像数据进行解码,来恢复当前画面。换言之,图像数据解码器230可基于提取出的关于包括在每个最大编码单元中的具有树结构的编码单元之中的每个编码单元的分区类型、预测模式和变换单元的信息,对编码的图像数据进行解码。解码处理可包括预测(包含帧内预测和运动补偿)和逆变换。
[0193]图像数据解码器230可基于关于根据编码深度的编码单元的预测单元的分区类型和预测模式的信息,根据每个编码单元的分区和预测模式,执行帧内预测或运动补偿。
[0194]另外,为了对每个最大编码单元执行逆变换,图像数据解码器230可读取关于每个编码单元的根据树结构的变换单元的信息,从而基于每个编码单元的变换单元执行逆变换。通过逆变换,可恢复编码单元的空间域的像素值。
[0195]图像数据解码器230可通过使用根据深度的划分信息来确定当前最大编码单元的编码深度。如果划分信息指示图像数据在当前深度中不再被划分,则当前深度是编码深度。因此,图像数据解码器230可通过使用关于与编码深度相应的每个编码单元的预测单元的分区类型、预测模式和变换单元的尺寸的信息,对当前最大编码单元中的编码数据进行解码。
[0196]换言之,可通过观察分配给编码单元、预测单元和最小单元中的预定数据单元的编码信息集来收集包含包括相同划分信息的编码信息的数据单元,并且收集的数据单元可被认为是将由图像数据解码器230以相同编码模式进行解码的一个数据单元。因此,可通过获得关于每个编码单元的编码模式的信息对当前编码单元进行解码。
[0197]此外,图7的视频解码设备200的图像数据解码器230可执行图2a的运动补偿设备20或图5的运动补偿单元58的操作。
[0198]图像数据和编码信息提取器220可从接收到的比特流解析长期参考索引。可从条带头解析长期参考索引。
[0199]针对每个最大编码单元,根据具有树结构的编码单元,图像数据解码器230可确定用于帧间预测的预测单元,并对每个预测单元执行帧间预测。
[0200]具体地,图像数据解码器230可从长期参考索引读取长期参考图像的POC信息的LSB信息。图像数据解码器230可通过将长期参考图像的POC信息的预先确定的MSB信息和读取的LSB信息组合来恢复长期参考图像的POC信息。
[0201]由于图像数据解码器230根据预测单元执行运动补偿,因此图像数据解码器230可从长期参考图像中确定由当前预测单元的运动矢量指示的参考预测单元,并通过将当前预测单元的残差数据与参考预测单元组合来恢复当前预测单元。可通过恢复预测单元来恢复编码单元,可通过恢复编码单元来恢复最大编码单元,并通过恢复最大编码单元来恢复图像。
[0202]因此,视频解码设备200可获得关于当对每个最大编码单元迭代地执行编码时产生最小编码误差的至少一个编码单元的信息,并使用所述信息来对当前画面进行解码。换言之,可对在每个最大编码单元中被确定为最佳编码单元的具有树结构的编码单元进行解码。
[0203]因此,即使图像数据具有高分辨率和大数据量,也可通过使用编码单元的尺寸和编码模式,对图像数据进行有效地解码和恢复,其中,通过使用从编码器接收到的关于最优编码模式的信息,根据图像数据的特征自适应地确定所述编码单元的尺寸和编码模式。
[0204]图8是用于描述根据本发明的实施例的编码单元的概念的示图。
[0205]编码单元的尺寸可被表示为宽度X高度,并可以是64X64、32X32、16X16和8X8。64X64的编码单元可被划分为64X64、64X32、32X64或32X32的分区,32X32的编码单元可被划分为32X32、32X16、16X32或16X16的分区,16X16的编码单元可被划分为16X16、16X8、8X16或8X8的分区,8X8的编码单元可被划分为8X8、8X4、4X8或4X4的分区。
[0206]在视频数据310中,分辨率是1920 X 1080,编码单元的最大尺寸是64,最大深度是
2。在视频数据320中,分辨率是1920 X 1080,编码单元的最大尺寸是64,最大深度是3。在视频数据330中,分辨率是352X288,编码单元的最大尺寸是16,最大深度是I。图8中示出的最大深度表示从最大编码单元到最小编码单元的划分总次数。
[0207]如果分辨率高或数据量大,则编码单元的最大尺寸可能较大,从而不仅提高编码效率,而且准确地反映图像的特征。因此,具有比视频数据330更高分辨率的视频数据310和320的编码单元的最大尺寸可以是64。
[0208]由于视频数据310的最大深度是2,因此由于通过对最大编码单元划分两次,深度加深至两层,因此视频数据310的编码单元315可包括长轴尺寸为64的最大编码单元和长轴尺寸为32和16的编码单元。由于视频数据330的最大深度是1,因此由于通过对最大编码单元划分一次,深度加深至一层,因此视频数据330的编码单元335可包括长轴尺寸为16的最大编码单元和长轴尺寸为8的编码单元。
[0209]由于视频数据320的最大深度是3,因此由于通过对最大编码单元划分三次,深度加深至3层,因此视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元和长轴尺寸为32、16和8的编码单元。随着深度加深,详细信息可被精确地表示。
[0210]图9是根据本发明的实施例的基于编码单元的图像编码器400的框图。
[0211]图像编码器400执行视频编码设备100的编码单元确定器120的操作来对图像数据进行编码。换言之,帧内预测器410在帧内模式下对当前帧405中的编码单元执行帧内预测,运动估计器420和运动补偿器425通过使用当前帧405和参考帧495,在帧间模式下对当前帧405中的编码单元分别执行帧间预测和运动补偿。
[0212]从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过变换器430和量化器440被输出为量化后的变换系数。量化后的变换系数通过反量化器460和逆变换器470被恢复为空间域中的数据,恢复的空间域中的数据在通过去块单元480和环路滤波单元490后处理之后被输出为参考帧495。量化后的变换系数可通过熵编码器450被输出为比特流455。
[0213]为了将图像编码器400应用到视频编码设备100中,图像编码器400的所有元件(即,帧内预测器410、运动估计器420、运动补偿器425、变换器430、量化器440、熵编码器450、反量化器460、逆变换器470、去块单元480和环路滤波单元490)在考虑每个最大编码单元的最大深度的同时,基于具有树结构的编码单元中的每个编码单元执行操作。
[0214]具体地,帧内预测器410、运动估计器420和运动补偿器425在考虑当前最大编码单元的最大尺寸和最大深度的同时,确定具有树结构的编码单元中的每个编码单元的分区和预测模式,变换器430确定具有树结构的编码单元中的每个编码单元中的变换单元的尺寸。
[0215]具体地,当运动估计器420使用长期参考帧执行帧间预测时,长期参考帧的POC信息可被输出为长期参考索引。熵编码器450可将长期参考帧的POC信息到的LSB信息编码为长期参考索引,并输出所述LSB信息。用于当前条带的预测单元的长期参考帧的POC信息的LSB信息可被包括在条带头中,然后被发送。
[0216]运动补偿器425还可通过使用从长期参考索引读取的POC信息的LSB信息来确定长期参考帧的POC信息。运动补偿单元425可从存储在解码画面缓冲器中的参考帧中选择与恢复的POC信息相应的长期参考帧,并基于选择的长期参考帧使用当前帧的残差数据和运动矢量来执行运动补偿。
[0217]图10是根据本发明的实施例的基于编码单元的图像解码器500的框图。
[0218]解析器510从比特流505解析将被解码的编码图像数据和解码所需的编码信息。编码图像数据通过熵解码器520和反量化器530被输出为反量化的数据,反量化的数据通过逆变换器540被恢复为空间域中的图像数据。
[0219]针对空间域中的图像数据,帧内预测器550在帧内模式下对编码单元执行帧内预测,运动补偿器560通过使用参考帧585在帧间模式下编码单元执行运动补偿。
[0220]通过帧内预测器550和运动补偿器560的空间域中的图像数据可在通过去块单元570和环路滤波单元580后处理之后被输出为恢复帧595。另外,通过去块单元570和环路滤波单元580后处理的图像数据可被输出为参考帧585。
[0221]为了在视频解码设备200的图像数据解码器230中对图像数据进行解码,图像解码器500可执行在解析器510之后执行的操作。
[0222]为了将图像解码器500应用到视频解码设备200中,图像解码器500的所有元件(即,解析器510、熵解码器520、反量化器530、逆变换器540、帧内预测器550、运动补偿器560、去块单元570和环路滤波单元580)针对每个最大编码单元,基于具有树结构的编码单元执行操作。
[0223]具体地,帧内预测器550和运动补偿器560基于具有树结构的每个编码单元的分区和预测模式来执行操作,逆变换器540基于每个编码单元的变换单元的尺寸来执行操作。
[0224]具体地,解析器510可从比特流505解析长期参考索引。可从条带头解析用于当前条带的预测单元的长期参考图像的POC信息的LSB信息。运动补偿器560通过将当前长期参考图像的POC信息的MSB信息和LSB信息组合来恢复当前长期参考图像的POC信息,并从存储在解码画面缓冲器中的长期参考图像之中确定与恢复的POC信息相应的当前长期参考图像。运动补偿器560可从当前长期参考图像中确定由用于当前预测单元的运动矢量指示的参考预测单元,并通过将参考预测单元和当前预测单元的残差数据组合来恢复当前预测单元。
[0225]图11是示出根据本发明的实施例的根据深度的较深层编码单元以及分区的示图。
[0226]视频编码设备100和视频解码设备200使用分层编码单元以考虑图像的特征。可根据图像的特征自适应地确定编码单元的最大高度、最大宽度和最大深度,或可由用户不同地设置编码单元的最大高度、最大宽度和最大深度。可根据编码单元的预定最大尺寸来确定根据深度的较深层编码单元的尺寸。
[0227]在根据本发明的实施例的编码单元的分层结构600中,编码单元的最大高度和最大宽度均是64,最大深度是4。在这种情况下,最大深度表示编码单元从最大编码单元被划分到最小编码单元的总次数。由于沿着分层结构600的垂直轴深度加深,因此较深层编码单元的高度和宽度均被划分。另外,预测单元和分区沿着分层结构600的水平轴被示出,其中,所述预测单元和分区是对每个较深层编码单元进行预测编码的基础。
[0228]换言之,在分层结构600中,编码单元610是最大编码单元,其中,深度为0,尺寸(即,高度乘宽度)为64X64。随着深度沿着垂直轴加深,编码单元620的尺寸为32X32深度为I,编码单元630的尺寸为16X 16深度为2,编码单元640的尺寸为8X8深度为3。尺寸为8X8和深度为3的编码单兀640是最小编码单兀。
[0229]编码单元的预测单元和分区根据每个深度沿着水平轴被排列。换言之,如果尺寸为64X64和深度为O的编码单元610是预测单元,则可将预测单元划分成包括在编码单元610中的分区,即,尺寸为64X64的分区610、尺寸为64X32的分区612、尺寸为32X64的分区614或尺寸为32X32的分区616。
[0230]类似地,可将尺寸为32X32和深度为I的编码单元620的预测单元划分成包括在编码单元620中的分区,即,尺寸为32X32的分区620、尺寸为32 X 16的分区622、尺寸为16X32的分区624和尺寸为16X16的分区626。
[0231]类似地,可将尺寸为16 X 16和深度为2的编码单元630的预测单元划分成包括在编码单元630中的分区,即,包括在编码度单元630中的尺寸为16X16的分区630、尺寸为16X8的分区632、尺寸为8X16的分区634和尺寸为8X8的分区636。
[0232]类似地,可将尺寸为8X8和深度为3的编码单元640的预测单元划分成包括在编码单元640中的分区,即,包括在编码单元640中的尺寸为8X8的分区、尺寸为8X4的分区642、尺寸为4X8的分区644和尺寸为4X4的分区646。
[0233]为了确定构成最大编码单元610的编码单元的至少一个编码深度,视频编码设备100的编码单元确定器120对包括在最大编码单元610中的与每个深度相应的编码单元执行编码。
[0234]随着深度加深,包括具有相同范围和相同尺寸的数据的根据深度的较深层编码单元的数量增加。例如,需要四个与深度2相应的编码单元来覆盖包括在与深度I相应的一个编码单元中的数据。因此,为了根据深度比较对相同数据进行编码的结果,与深度I相应的编码单元和四个与深度2相应的编码单元均被编码。
[0235]为了针对深度之中的当前深度执行编码,可沿着分层结构600的水平轴,通过对与当前深度相应的编码单元中的每个预测单元执行编码,来针对当前深度选择最小编码误差。可选地,随着深度沿着分层结构600的垂直轴加深,可通过针对每个深度执行编码,比较根据深度的最小编码误差,来搜索最小编码误差。在编码单元610中的具有最小编码误差的深度和分区可被选为编码单元610的编码深度和分区类型。
[0236]图12是用于描述根据本发明的实施例的在编码单元710和变换单元720之间的关系的不图。
[0237]视频编码设备100或视频解码设备200针对每个最大编码单元,根据具有小于或等于最大编码单元的尺寸的编码单元,对图像进行编码或解码。可基于不大于相应的编码单元的数据单元,来选择用于在编码期间进行变换的变换单元的尺寸。
[0238]例如,在视频编码设备100或视频解码设备200中,如果编码单元710的尺寸是64X64,则可通过使用尺寸为32X32的变换单元720来执行变换。
[0239]此外,可通过对小于64X 64的尺寸为32 X 32、16 X 16、8 X 8和4X 4的每个变换单元执行变换,来对尺寸为64X64的编码单元710的数据进行编码,然后可选择具有最小编码误差的变换单元。
[0240]图13是用于描述根据本发明的实施例的与编码深度相应的编码单元的编码信息的示图。
[0241]视频编码设备100的输出单元130可对与编码深度相应的每个编码单元的关于分区类型的信息800、关于预测模式的信息810以及关于变换单元尺寸的信息820进行编码,并将信息800、信息810和信息820作为关于编码模式的信息来发送。
[0242]信息800指示关于通过划分当前编码单元的预测单元而获得的分区的形状的信息,其中,所述分区是用于对当前编码单元进行预测编码的数据单元。例如,可将尺寸为2NX2N的当前编码单元CU_0划分成以下分区中的任意一个:尺寸为2NX2N的分区802、尺寸为2NXN的分区804、尺寸为NX2N的分区806以及尺寸为NXN的分区808。这里,关于分区类型的信息800被设置来指示尺寸为2NXN的分区804、尺寸为NX 2N的分区806以及尺寸为NXN的分区808中的一个。
[0243]信息810指示每个分区的预测模式。例如,信息810可指示对由信息800指示的分区执行的预测编码的模式,即,帧内模式812、帧间模式814或跳过模式816。
[0244]信息820指示当对当前编码单元执行变换时所基于的变换单元。例如,变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二帧内变换单元828。
[0245]视频解码设备200的图像数据和编码信息提取器220可根据每个较深层编码单元,提取并使用用于解码的信息800、810和820。
[0246]图14是根据本发明的实施例的根据深度的较深层编码单元的示图。
[0247]划分信息可用来指示深度的改变。划分信息指示当前深度的编码单元是否被划分成更低深度的编码单元。
[0248]用于对深度为O和尺寸为2N_0X2N_0的编码单元900进行预测编码的预测单元910可包括以下分区类型的分区:尺寸为2N_0X2N_0的分区类型912、尺寸为2N_0XN_0的分区类型914、尺寸为N_0X2N_0的分区类型916和尺寸为Ν_0ΧΝ_0的分区类型918。图14仅示出了通过对称地划分预测单元910而获得的分区类型912至918,但是分区类型不限于此,并且预测单元910的分区可包括非对称分区、具有预定形状的分区和具有几何形状的分区。
[0249]根据每种分区类型,对尺寸为2N_0X2N_0的一个分区、尺寸为2N_0XN_0的两个分区、尺寸为N_0X2N_0的两个分区和尺寸为Ν_0ΧΝ_0的四个分区重复地执行预测编码。可对尺寸为2N_0 X 2N_0、N_0 X 2N_0、2N_0 X N_0和N_0 X N_0的分区执行帧内模式和帧间模式下的预测编码。可仅对尺寸为2N_0X2N_0的分区执行跳过模式下的预测编码。
[0250]如果在分区类型912至916中的一个分区类型中编码误差最小,则可不将预测单元910划分到更低深度。
[0251]如果在分区类型918中编码误差最小,则深度从O改变到I以在操作920中划分分区类型918,并对深度为2和尺寸为Ν_0ΧΝ_0的编码单元930重复地执行编码来搜索最小编码误差。
[0252]用于对深度为I和尺寸为2N_1 X 2N_1 ( = Ν_0ΧN_0)的编码单元930进行预测编码的预测单元940可包括以下分区类型的分区:尺寸为2N_1X2N_1的分区类型942、尺寸为2N_1XN_1的分区类型944、尺寸为N_1X2N_1的分区类型946以及尺寸为N_1XN_1的分区类型948。
[0253]如果在分区类型948中编码误差最小,则深度从I改变到2以在操作950中划分分区类型948,并对深度为2和尺寸为N_2XN_2的编码单元960重复执行编码来搜索最小编码误差。
[0254]当最大深度是d时,根据每个深度的划分操作可被执行直到深度变成d-Ι,并且划分信息可被编码直到深度是O到d-2中的一个。换句话说,当编码被执行直到在与d-2的深度相应的编码单元在操作970中被划分之后深度是d-Ι时,用于对深度为d-Ι和尺寸为2N_(d-l) X2N_(d-l)的编码单元980进行预测编码的预测单元990可包括以下分区类型的分区:尺寸为2N_(d-l)X2N(d-l)的分区类型992、尺寸为2N_(d-l)XN(d-l)的分区类型994、尺寸为N_(d-1) X2N(d-l)的分区类型996和尺寸为N_(d_l) XN(d_l)的分区类型998。
[0255]可对分区类型992至998中的尺寸为2N_(d_l) X2N_(d_l)的一个分区、尺寸为2N_(d-l) XN_(d-l)的两个分区、尺寸为N_(d-1) X2N_(d-l)的两个分区、尺寸为1(d-1) XN_(d-l)的四个分区重复地执行预测编码,以搜索具有最小编码误差的分区类型。
[0256]即使当分区类型998具有最小编码误差时,由于最大深度是d,因此深度为d-1的编码单元cu_(d-l)也不再被划分到更低深度,构成当前最大编码单元900的编码单元的编码深度被确定为d-Ι,并且当前最大编码单元900的分区类型可被确定为N_(d-1) X N (d-1)。此外,由于最大深度是d,并且具有最低深度d-Ι的最小编码单元980不再被划分到更低深度,因此不设置最小编码单元980的划分信息。
[0257]数据单元999可以是用于当前最大编码单元的“最小单元”。根据本发明的实施例的最小单元可以是通过将最小编码单元980划分成4份而获得的方形数据单元。通过重复地执行编码,视频编码设备100可通过比较根据编码单元900的深度的编码误差来选择具有最小编码误差的深度以确定编码深度,并将相应分区类型和预测模式设置为编码深度的编码模式。
[0258]这样,在所有深度I至d中对根据深度的最小编码误差进行比较,并且具有最小编码误差的深度可被确定为编码深度。编码深度、预测单元的分区类型和预测模式可作为关于编码模式的信息被编码并发送。另外,由于编码单元从O的深度被划分到编码深度,因此仅编码深度的划分信息被设置为O,并且除了编码深度以外的深度的划分信息被设置为I。
[0259]视频解码设备200的图像数据和编码信息提取器220可提取并使用关于编码单元900的编码深度和预测单元的信息,来对分区912进行解码。视频解码设备200可通过使用根据深度的划分信息,将划分信息为O的深度确定为编码深度,并且使用关于相应深度的编码模式的信息来进行解码。
[0260]图15至图17是用于描述根据本发明的实施例的编码单元1010、预测单元1060和变换单元1070之间的关系的示图。
[0261]编码单元1010是最大编码单元中的与由视频编码设备100确定的编码深度相应的具有树结构的编码单元。预测单元1060是每个编码单元1010中的预测单元的分区,变换单元1070是每个编码单元1010的变换单元。
[0262]当在编码单元1010中最大编码单元的深度是O时,编码单元1012和编码单元1054的深度是1,编码单元1014、1016、1018、1028、1050和1052的深度是2,编码单元1020、1022、1024、1026、1030、1032 和 1048 的深度是 3,编码单元 1040、1042、1044 和 1046 的深度是4。
[0263]在预测单元1060中,通过划分编码单元1010中的编码单元来获得一些编码单元1014、1016、1022、1032、1048、1050、1052 和 1054。换句话说,编码单元 1014、1022、1050 和1054中的分区类型的尺寸是2NXN,编码单元1016、1048和1052中的分区类型的尺寸是NX2N,编码单元1032的分区类型的尺寸就NXN。编码单元1010的预测单元和分区小于或等于每个编码单元。
[0264]在小于编码单元1052的数据单元中的变换单元1070中,对编码单元1052的图像数据执行变换或逆变换。另外,在尺寸和形状方面,变换单元1070中的编码单元1014、1016、1022、1032、1048、1050 和 1052 不同于预测单元 1060 中的编码单元 1014、1016、1022、1032、1048、1050和1052。换句话说,视频编码设备100和视频解码设备200可对同一编码单元中的数据单元独立地执行帧内预测、运动估计、运动补偿、变换和逆变换。
[0265]因此,对最大编码单元的每个区域中的具有分层结构的每个编码单元递归地执行编码来确定最优编码单元,从而可获得具有递归树结构的编码单元。编码信息可包括关于编码单元的划分信息、关于分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。表I示出可由视频编码设备100和视频解码设备200设置的编码信息。
[0266][表 I]
[0267]

【权利要求】
1.一种帧间预测方法,包括: 通过使用存储在解码画面缓冲器中的长期参考图像对当前图像执行帧间预测; 确定经由帧间预测产生的当前图像的残差数据和运动矢量; 通过将长期参考图像的画面顺序计数(POC)信息划分为最高有效位(MSB)信息和最低有效位(LSB)信息,来将LSB信息确定为指示长期参考图像的长期参考索引。
2.如权利要求1所述的帧间预测方法,其中,确定LSB信息的步骤包括:将当前图像的POC信息和长期参考图像的POC信息之间的差信息划分为MSB信息和LSB信息,来将差信息的LSB信息确定为长期参考索引。
3.如权利要求1所述的帧间预测方法,其中,确定LSB信息的步骤包括:将用于对当前条带进行帧间预测的长期参考图像的POC信息的LSB信息作为长期参考索引插入到条带头中。
4.如权利要求1所述的帧间预测方法,还包括: 通过使用存储在解码画面缓冲器中的短期参考图像对当前图像执行帧间预测; 将短期参考图像的POC信息的LSB信息确定为指不短期参考图像的短期参考索引。
5.如权利要求1所述的帧间预测方法,其中,确定残差数据和运动矢量的步骤包括:基于根据当前图像的块执 行的帧间预测的结果,确定根据当前图像的块的残差数据和运动矢量。
6.—种运动补偿方法,包括: 接收编码的图像数据、运动矢量和长期参考索引; 通过对编码的图像数据进行解码来恢复当前图像的残差数据; 通过从长期参考索引读取当前图像的长期参考图像的POC信息的最低有效位(LSB)信息,使用长期参考图像的最高有效位(MSB)信息和LSB信息,来确定画面顺序计数(POC)信息; 通过基于在存储在解码画面缓冲器中的参考图像之中的与确定的POC信息相应的长期参考图像,使用运动矢量和残差数据执行运动补偿,来恢复当前图像。
7.如权利要求6所述的运动补偿方法,其中,确定POC信息的步骤包括: 在用于当前图像的多个长期参考图像之中,从第一长期参考图像的POC信息的MSB信息预测第二长期参考图像的POC信息的MSB信息; 通过将从接收到的长期参考索引读取的第二长期参考图像的POC信息的LSB信息和第二长期参考图像的POC信息的MSB信息组合,来恢复第二长期参考图像的POC信息。
8.如权利要求6所述的运动补偿方法,其中,确定POC信息的步骤包括: 通过将长期参考图像的POC信息的MSB信息和LSB信息组合来恢复在当前图像的POC信息和长期参考图像的POC信息之间的差信息; 通过将所述差信息与当前图像的POC信息相加,或从当前图像的POC信息减去所述差信息,来确定长期参考图像的POC编号。
9.如权利要求6所述的运动补偿方法,其中,接收的步骤包括:从条带头解析长期参考索引,其中,长期参考索引指示用于对当前条带进行运动补偿的长期参考图像。
10.如权利要求6所述的运动补偿方法,还包括: 接收用于对当前图像进行帧间预测的短期参考索引;从短期参考索引读取用于对当前图像进行帧间预测的短期参考图像的POC信息的LSB信息; 通过使用读取的短期参考图像的LSB信息和先前短期参考图像的MSB信息,来确定所述短期参考图像的POC信息; 通过使用在存储在解码画面缓冲器中的参考图像之中的与确定的POC信息相应的短期参考图像,对当前图像执行运动补偿。
11.如权利要求6所述的运动补偿方法,其中,接收的步骤包括:接收根据当前图像的块的编码的图像数据, 恢复残差数据的步骤包括:根据所述块恢复残差数据和运动矢量, 恢复当前图像的步骤包括:通过根据所述块执行使用残差数据和运动矢量的运动补偿来恢复当前图像。
12.—种帧间预测设备,包括: 帧间预测单元,用于通过使用存储在解码画面缓冲器中的长期参考图像对当前图像执行帧间预测; 输出单元,用于通过将长期参考图像的画面顺序计数(POC)信息划分为最高有效位(MSB)信息和最低有效位(LSB)信息,将LSB信息输出为指示长期参考图像的长期参考索弓丨,并用于输出经 由帧间预测产生的当前图像的残差数据和运动矢量。
13.—种运动补偿设备,包括: 接收单元,用于接收编码的图像数据、运动矢量和长期参考索引; 运动补偿单元,用于通过对编码的图像数据进行解码来恢复当前图像的残差数据,从长期参考索引读取当前图像的长期参考图像的画面顺序计数(POC)信息的最低有效位(LSB)信息,通过使用长期参考图像的最高有效位(MSB)信息和LSB信息来确定POC信息,并通过基于在存储在解码画面缓冲器中的参考图像之中的与确定的POC信息相应的长期参考图像,使用运动矢量和残差数据执行运动补偿,来恢复当前图像。
14.一种记录有用于执行如权利要求1所述的帧间预测方法的程序的计算机可读记录介质。
15.一种记录有用于执行如权利要求6所述的运动补偿方法的程序的计算机可读记录介质。
【文档编号】H04N19/58GK104081779SQ201280065429
【公开日】2014年10月1日 申请日期:2012年10月29日 优先权日:2011年10月28日
【发明者】朴永五, 金壹求, 金赞烈, 崔光杓 申请人:三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1