视频解码方法和视频解码设备的制造方法_4

文档序号：9711955阅读：来源：国知局

息、关于帖内模式的色度分量的信息、W及关于帖内模式的插值方法的信息。
[0234] 根据画面、条带或GOP定义的关于编码单元的最大尺寸的信息和关于最大深度的信息可被插入到比特流的头、SPS或PI^中。
[0235] 还可通过比特流的头、SPS或PI^来输出关于针对当前视频允许的变换单元的最大尺寸的信息、W及关于变换单元的最小尺寸的信息。输出单元130可对与预测相关的参考信息、预测信息和条带类型信息进行编码并输出。
[0236] 在根据最简单的示例性实施例的视频编码设备100中，较深层编码单元可W是通过将更高深度的编码单元(更高一层）的高度或宽度划分成两份而获得的编码单元。换言之，当当前深度的编码单元的尺寸是2NX2N时，更低深度的编码单元的尺寸是NXN。另外，尺寸为2NX2N的具有当前深度的编码单元可包括最多4个具有更低深度的编码单元。
[0237] 因此，视频编码设备100可基于考虑当前画面的特征而确定的LCU的尺寸和最大深度，通过针对每个LCU确定具有最优形状和最优尺寸的编码单元来形成具有树结构的编码单元。另外，由于可通过使用各种预测模式和变换中的任意一个对每个LCU执行编码，因此可考虑各种图像尺寸的编码单元的特征来确定最优编码模式。
[0238] 因此，如果W传统宏块对具有高的分辨率或大数据量的图像进行编码，则每个画面的宏块的数量极度增加。因此，针对每个宏块产生的压缩信息的条数增加，因此难W发送压缩的信息，并且数据压缩效率降低。然而，通过使用根据示例性实施例的视频编码设备 100,由于在考虑图像的尺寸的同时增加编码单元的最大尺寸，并同时在考虑图像的特征的同时调整编码单元，因此可提高图像压缩效率。
[0239] 根据示例性实施例的视频编码设备100确定每个LCU的树结构的编码单元，并产生作为对每个编码单元所执行的编码的结果的符号。根据示例性实施例的视频赌编码设备10 可对每个LCU的符号执行赌编码。具体地，针对通过划分画面而产生的每个并行块或条带段，视频赌编码设备10可根据包括沿水平方向连续排列的LCU的一行LCU对每个LCU执行赌编码。此外，视频编码设备10可同时对两行或更多行LCU执行并行赌编码。
[0240] 视频赌编码设备10可通过对经由对LCU执行编码而确定的符号执行二值化来产生符号的比特串。可确定与LCU的符号相应的语法元素值的每个二进制位索引的上下文变量，并且可基于语法元素的上下文变量来确定指示语法元素值的二进制位串。视频赌编码设备 10可采用由在用于当前语法元素值的上下文表中确定的当前上下文变量所指示的二进制位串。
[0241] 在针对LCU形成所有语法元素的二进制位串之后，视频赌编码设备10可确定是否存储在该LCU中确定的上下文变量。当语法元素是LCU中的最后一个语法元素，非独立条带段可被包括在包括该LCU的画面中，并且该LCU是条带段中的最后一个LCU时，用于该LCU的上下文变量可被存储。
[0242] 当非独立条带段可被包括在画面中时，不论条带段是独立条带段还是非独立条带段，上下文存储单元16可存储用于LCU的上下文变量。
[0243] 当多个条带段被包括在画面中时，可将当前条带段中存储的上下文变量用于对在当前条带段之后紧接着的非独立条带段中的第一个LCU的上下文变量的赌编码。
[0244] 图9是根据本发明的示例性实施例的基于具有树结构的编码单元的视频解码设备 200的框图。
[0245] 根据示例性实施例的设及基于具有树结构的编码单元的视频预测的视频解码设备200包括接收器210、图像数据和编码信息提取器220和图像数据解码器230。为了便于解释，在下文中，根据示例性实施例的设及基于具有树结构的编码单元的视频解码设备200被称为"视频解码设备200"。
[0246] 用于视频解码设备200的解码操作的各种术语(诸如编码单元、深度、预测单元、变换单元和关于各种编码模式的信息）的定义与参照图8和视频编码设备100描述的定义相同。
[0247] 接收器210接收和解析编码视频的比特流。图像数据和编码信息提取器220从解析的比特流，针对每个编码单元提取编码图像数据，并将提取的图像数据输出到图像数据解码器230,其中，编码单元具有根据每个LCU的树结构。图像数据和编码信息提取器220可从关于当前画面的头、SPS或PI^提取关于当前画面的编码单元的最大尺寸的信息。
[0248] 另外，图像数据和编码信息提取器220从解析的比特流，根据每个LCU，提取关于具有树结构的编码单元的编码深度和编码模式的信息。提取的关于编码深度和编码模式的信息被输出到图像数据解码器230。换言之，比特串中的图像数据被划分为LCU，使得图像数据解码器230针对每个LCU对图像数据进行解码。
[0249] 可针对关于与编码深度相应的至少一个编码单元的信息设置关于根据LCU的编码深度和编码模式的信息，关于编码模式的信息可包括关于与编码深度相应的相应编码单元的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。另外，根据深度的划分信息可被提取为关于编码深度的信息。
[0250] 由图像数据和编码信息提取器220提取的关于根据每个LCU的编码深度和编码模式的信息是关于运样的编码深度和编码模式的信息:该编码深度和编码模式被确定为在编码器(诸如，视频编码设备100)根据每个LCU对根据深度的每个较深层编码单元重复地执行编码时产生最小编码误差。因此，视频解码设备200可通过根据产生最小编码误差的编码深度和编码模式对图像数据进行解码来恢复图像。
[0251] 由于关于编码深度和编码模式的编码信息可被分配给相应的编码单元、预测单元和最小单元中的预定数据单元，因此图像数据和编码信息提取器220可根据预定数据单元，提取关于编码深度和编码模式的信息。如果关于相应LCU的编码深度和编码模式的信息根据预定数据单元被记录，则可将被分配相同的关于编码深度和编码模式的信息的预定数据单元推断为是包括在同一 LCU中的数据单元。
[0252] 图像数据解码器230基于关于根据LCU的编码深度和编码模式的信息，通过对每个 LCU中的图像数据进行解码，来恢复当前画面。换言之，图像数据解码器230可基于提取出的关于包括在每个LCU中的具有树结构的编码单元之中的每个编码单元的分区类型、预测模式和变换单元的信息，对编码的图像数据进行解码。解码处理可包括预测(包含帖内预测和运动补偿)和逆变换。
[0253] 图像数据解码器230可基于关于根据编码深度的编码单元的预测单元的分区类型和预测模式的信息，根据每个编码单元的分区和预测模式，执行帖内预测或运动补偿。
[0254] 此外，为了对每个LCU进行逆变换，图像数据解码器230可针对每个编码单元读取关于根据树结构的变换单元的信息，W基于每个编码单元的变换单元来执行逆变换。经过逆变换，可恢复编码单元的空间域的像素值。
[0255] 图像数据解码器230可通过使用根据深度的划分信息来确定当前LCU的编码深度。如果划分信息指示图像数据在当前深度中不再被划分，则当前深度是编码深度。因此，图像数据解码器230可通过使用关于用于与编码深度相应的每个编码单元的预测单元的分区类型、预测模式和变换单元的尺寸的信息，对当前LCU中的编码数据进行解码。
[0256] 换言之，可通过观察被分配给编码单元、预测单元和最小单元中的预定数据单元的编码信息集来收集包含包括相同划分信息的编码信息的数据单元，并且收集的数据单元可被认为是将由图像数据解码器230W相同编码模式进行解码的一个数据单元。因此，可通过获得关于每个编码单元的编码模式的信息来对当前编码单元进行解码。
[0257] 接收器210可包括图2a的视频赌解码设备20。视频赌解码设备20可从接收到的比特流解析多行LCU。
[0258] 当接收器210从比特流提取第一行LCU和第二行LCU时，第一赌解码器24可通过对第一行LCU执行赌解码来顺序地恢复第一行LCU中的LCU的符号。
[0259] 视频赌解码设备20可确定用于从比特流获得的LCU的二进制位串和二进制位索引。视频赌解码设备20可存储关于上下文表的数据，其中，上下文表包含用于每个语法元素的二进制位串与上下文变量之间的相互关系。视频赌解码设备20可通过将可基于上下文表而被分配给当前上下文变量中的语法元素的二进制位串与当前确定的二进制位索引中的二进制位串进行比较来确定由当前二进制位串指示的语法元素的值。
[0260] 当语法元素是LCU中的最后一个语法元素，非独立条带段可被包括在包括该LCU的画面中，并且该LCU是条带段中的最后一个LCU时，视频赌解码设备20可存储用于该LCU的上下文变量。当非独立条带段可被包括在画面中时，不论条带段是独立条带段还是非独立条带段，可存储用于该LCU的上下文变量。
[0261] 当多个条带段被包括在画面中时，可将当前条带段中存储的上下文变量用于对在当前条带段之后紧接着的非独立条带段中的第一 LCU的上下文变量的赌编码。
[0262] 视频赌解码设备20可通过使用每个语法元素的值来恢复LCU的符号。
[0263] 因此，视频解码设备200可通过在编码处理期间对每个LCU递归地执行编码来获得关于具有最小编码误差的编码单元的信息，并可使用所述信息来对当前画面进行解码。换句话说，可对每个LCU的被确定为最优编码单元的具有树结构的编码单元的编码图像数据进行解码。
[0264] 因此，即使当图像具有高分辨率和大数据量时，也可根据编码单元的编码模式和尺寸来有效地对图像数据进行解码和恢复，其中，所述编码单元的编码模式和尺寸是通过使用从编码器发送的关于最优编码模式的信息，根据图像的特性而被自适应地确定的。
[0265]图10是用于解释根据本发明的示例性实施例的编码单元的构思的示图。
[0%6] 编码单元的尺寸可被表示为宽度X高度，并且可W是64 X 64、32 X 32、16 X 16和8 X 8。64 X 64的编码单元可被划分为64 X 64、64 X 32、32 X 64或32 X 32的分区，32 X 32的编码单元可被划分为32 X 32、32 X 16、16 X 32或16 X 16的分区，16 X 16的编码单元可被划分为16 X 16、16 X 8、8 X 16或8 X 8的分区，8 X 8的编码单元可被划分为8 X 8、8 X 4、4 X 8或4 X 4的分区。
[0267] 在视频数据310中，分辨率为1920 X 1080，编码单元的最大尺寸为64，最大深度为 2。在视频数据320中，分辨率为1920 X 1080，编码单元的最大尺寸为64，最大深度为3。在视频数据330中，分辨率为352 X 288,编码单元的最大尺寸为16,最大深度为1。图10中示出的最大深度表示从LCU到最小解码单元的划分总次数。
[0268] 如果分辨率高或数据量大，则编码单元的最大尺寸可能较大，从而不仅提高编码效率，而且准确地反映图像的特征。因此，具有比视频数据330更高分辨率的视频数据310和 320的编码单元的最大尺寸可W是64。
[0269] 由于视频数据310的最大深度是2,因此由于通过对LCU划分两次，深度加深至两层，因此视频数据310的编码单元315可包括长轴尺寸为64的LCU和长轴尺寸为32和16的编码单元。由于视频数据330的最大深度是1，因此由于通过对LCU划分一次，深度加深至一层，因此视频数据330的编码单元335可包括长轴尺寸为16的LCU和长轴尺寸为8的编码单元。
[0270] 由于视频数据320的最大深度是3,因此由于通过对LCU划分S次，深度加深至3层，因此视频数据320的编码单元325可包括长轴尺寸为64的LCU和长轴尺寸为32、16和8的编码单元。随着深度加深，详细信息可被精确地表示。
[0271] 图11是根据本发明的示例性实施例的基于编码单元的图像编码器400的框图。
[0272] 根据示例性实施例的图像编码器400执行视频编码设备100的编码单元确定器120 的操作来对图像数据进行编码。换言之，帖内预测器410对当前帖405中的帖内模式下的编码单元执行帖内预测，运动估计器420和运动补偿器425通过使用当前帖405和参考帖495，对当前帖405中的帖间模式下的编码单元分别执行帖间估计和运动补偿。
[0273] 从帖内预测器410、运动估计器420和运动补偿器425输出的数据通过变换器430和量化器440被输出为量化后的变换系数。量化后的变换系数通过反量化器460和逆变换器 470被恢复为空间域中的数据，恢复的空间域中的数据在通过去块单元480和环路滤波单元 490后处理之后被输出为参考帖495。量化后的变换系数可通过赌编码器450被输出为比特流455。
[0274] 为了将图像编码器400应用于视频编码设备100,图像编码器400的所有元件（即，帖内预测器410、运动估计器420、运动补偿器425、变换器430、量化器440、赌编码器450、反量化器460、逆变换器470、去块单元480和环路滤波单元490)在考虑每个LCU的最大深度的同时，基于具有树结构的编码单元中的每个编码单元执行操作。
[0275] 具体地，帖内预测器410、运动估计器420和运动补偿器425在考虑当前LCU的最大尺寸和最大深度的同时确定具有树结构的编码单元中的每个编码单元的分区和预测模式，变换器430确定具有树结构的编码单元中的每个编码单元中的变换单元的尺寸。
[0276] 具体地，赌编码器450可与根据示例性实施例的视频赌编码设备10相应。
[0277] 图12是根据本发明的示例性实施例的基于编码单元的图像解码器500的框图。
[0278] 解析器510从比特流505解析将被解码的编码图像数据和解码所需的关于编码的信息。编码图像数据通过赌解码器520和反量化器530被输出为反量化的数据，反量化的数据通过逆变换器540被恢复为空间域中的图像数据。
[0279] 针对空间域中的图像数据，帖内预测器550对帖内模式下的编码单元执行帖内预测，运动补偿器560通过使用参考帖585对帖间模式下的编码单元执行运动补偿。
[0280] 通过帖内预测器550和运动补偿器560的空间域中的图像数据可在通过去块单元 570和环路滤波单元580后处理之后被输出为恢复帖595。另外，通过去块单元570和环路滤波单元580后处理的图像数据可被输出为参考帖585。
[0281] 为了在视频解码设备200的图像数据解码器230中对图像数据进行解码，图像解码器500可执行在解析器510之后执行的操作。
[0282] 为了将图像解码器500应用于视频解码设备200,图像解码器500的所有元件（即，解析器510、赌解码器520、反量化器530、逆变换器540、帖内预测器550、运动补偿器560、去块单元570和环路滤波单元580)针对每个LCU基于具有树结构的编码单元执行操作。
[0283] 具体地，帖内预测器550和运动补偿器560针对具有树结构的每个编码单元确定分区和预测模式，逆变换器540针对每个编码单元确定变换单元的尺寸。具体地，赌解码器520 可与根据示例性实施例的视频赌解码设备20相应。
[0284] 图13是示出根据本发明的示例性实施例的根据深度的较深层编码单元W及分区的示图。
[0285] 根据示例性实施例的视频编码设备100和根据示例性实施例的视频解码设备200 使用分层编码单元W考虑图像的特征。可根据图像的特征自适应地确定编码单元的最大高度、最大宽度和最大深度，或可由用户不同地设置编码单元的最大高度、最大宽度和最大深度。可根据编码单元的预定最大尺寸来确定根据深度的较深层编码单元的尺寸。
[0286] 在根据示例性实施例的编码单元的分层结构600中，编码单元的最大高度和最大宽度均是64,最大深度是3。在此情况下，最大深度是指编码单元从LCU到最小编码单元被划分的总次数。由于深度沿着分层结构600的垂直轴加深，因此较深层编码单元的高度和宽度均被划分。另外，预测单元和分区沿着分层结构600的水平轴被示出，其中，所述预测单元和分区是对每个较深层编码单元进行预测编码的基础。
[0287] 换言之，在分层结构600中，编码单元610是LCU，其中，深度为0,尺寸（即，高度乘宽度)为64X64。深度沿着垂直轴加深，存在尺寸为32X32和深度为1的编码单元620、尺寸为 16 X 16和深度为2的编码单元630、尺寸为8X8和深度为3的编码单元640,尺寸为4X4和深度为4的编码单元650。尺寸为4X4和深度为4的编码单元640是最小编码单元。
[0288] 编码单元的预测单元和分区根据每个深度沿着水平轴被排列。换言之，如果尺寸为64 X 64和深度为0的编码单元610是预测单元，则可将预测单元划分成包括在编码单元 610中的分区，即，尺寸为64 X 64的分区610、尺寸为64 X 32的分区612、尺寸为32 X 64的分区 614或尺寸为32 X 32的分区616。
[0289] 类似地，可将尺寸为32X32和深度为1的编码单元620的预测单元划分成包括在编码单元620中的分区，即，尺寸为32 X 32的分区620、尺寸为32 X 16的分区622、尺寸为16 X 32 的分区624和尺寸为16 X 16的分区626。
[0290] 类似地，可将尺寸为16X16和深度为2的编码单元630的预测单元划分成包括在编码单元630中的分区，即，包括在编码度单元630中的尺寸为16X16的分区、尺寸为16X8的分区632、尺寸为8 X 16的分区634和尺寸为8 X 8的分区636。
[0291] 类似地，可将尺寸为8X8和深度为3的编码单元640的预测单元划分成包括在编码单元640中的分区，即，包括在编码单元640中的尺寸为8 X 8的分区、尺寸为8 X 4的分区642、尺寸为4 X 8的分区644和尺寸为4 X 4的分区646。
[0292] 最后，作为最小编码单元的深度为4和尺寸为4 X 4的编码单元650是具有最低深度的编码单元，相应的预测单元可仅被设置为尺寸为4 X 4的分区。
[0293] 为了确定构成LCU 610的编码单元的至少一个编码深度，根据示例性实施例的视频编码设备100的编码单元确定器120必须对包括在LCU 610中的与每个深度相应的编码单元执行编码。
[0294] 随着深度加深，包括具有相同范围和相同尺寸的数据的根据深度的较深层编码单元的数量增加。例如，需要四个与深度2相应的编码单元来覆盖包括在与深度1相应的一个编码单元中的数据。因此，为了根据深度比较对相同数据进行编码的结果，与深度1相应的编码单元和四个与深度2相应的编码单元均必须被编码。
[02%]为了针对多个深度之中的当前深度执行编码，可沿着分层结构600的水平轴，通过对与当前深度相应的编码单元中的每个预测单元执行编码，来针对当前深度，选择最小编码误差。可选地，随着深度沿着分层结构600的垂直轴加深，可通过针对每个深度执行编码来比较根据深度的最小编码误差，W捜索最小编码误差。在编码单元610中的具有最小编码误差的深度和分区可被选为编码单元610的编码深度和分区类型。
[0296] 图14是用于解释根据本发明的示例性实施例的编码单元710和变换单元720之间的关系的示图。
[0297] 根据示例性实施例的视频编码设备100或根据示例性实施例的视频解码设备200 针对每个LCU，根据具有小于或等于LCU的尺寸的编码单元，对图像进行编码或解码。可基于不大于相应编码单元的数据单元，来选择用于在编码期间进行变换的变换单元的尺寸。
[0298] 例如，在根据示例性实施例的视频编码设备100或根据示例性实施例的视频解码设备200中，如果编码单元710的尺寸是64 X 64，则可通过使用尺寸为32 X 32的变换单元720 来执行变换。
[0299] 此外，可通过对小于64 X 64的尺寸为32 X 32、16 X 16、8 X 8和4 X 4的每个变换单元执行变换，来对尺寸为64 X 64的编码单元710的数据进行编码，然后可选择具有最小编码误差的变换单元。
[0300] 图15是用于解释根据本发明的示例性实施例的与编码深度相应的编码单元的编码信息的示图。
[0301] 根据示例性实施例的视频编码设备100的输出单元130可对与编码深度相应的每个编码单元的关于分区类型的信息800、

完整全部详细技术资料下载

当前第4页1 2 3 4 5 6