处理视频数据的方法和装置的制造方法

文档序号：9847205阅读：393来源：国知局

处理视频数据的方法和装置的制造方法
【专利说明】
[00011本申请是2012年10月9日提交的国际申请日为2011年4月9日的申请号为 201180018316.8(PCT/KR2011/002508)的，发明名称为"处理视频数据的方法和装置"专利申请的分案申请。
技术领域
[0002] 本发明涉及一种用于对已经使用帧内预测模式编码的数字视频数据执行帧内预测模式解码的方法和装置。本发明还涉及一种用于将适当的帧内预测模式用信号通知给解码单元的方法和装置。
【背景技术】
[0003] 通常，存在用于实现视频压缩编码以便消除时间和空间冗余的两种方法。消除时间和空间冗余是提高视频信号压缩比以减小视频数据传输的整体大小的重要要求。
[0004] 帧间预测编码方法能够基于在预先编码的图片上找到的类似区域预测当前视频数据块，预先编码的图片时间上领先包括当前视频数据块的当前图片。并且，帧内预测编码方法能够基于预先编码的块预测当前视频数据块，预先编码的块邻近于当前视频数据块并且在相同的图片内。帧间预测方法称为时间预测方法，并且帧内预测方法称为空间预测方法。
[0005] 将由帧间预测的和帧内预测的视频数据图片组成的视频数据发送给接收机，然后被解码以再现所述视频数据。解码单元必须执行适当的预测模式处理以便重建接收到的视频数据。
[0006] 关于编码的帧内预测方法，存在用于实现空间预测(其限定帧内预测方法)的各种模式。并且，在帧间和帧内两种预测方法中，用于亮度(Iuma)采样的预测与色度(chroma)采样的预测分开处理。亮度可以定义为图像的明亮度，而色度可以定义为在图像内色差的表示。虽然亮度和色度两者在任何图片图像中是重要的分量，但由于与色度的变化相比较，人类视觉系统对亮度的变化更加敏感，因此与色度预测模式相比，预测模式通常更多与亮度预测模式有关。

【发明内容】

[0007] 技术问题
[0008] 因此，当前了解的色度预测模式没有想到通过利用内插的亮度采样的线性组合来重建色度采样。通过利用亮度采样的内插的优势，其中亮度采样已经预先重建，可以实现用于有效地预测色度采样的新模式。
[0009] 当将与视频数据一起发送的信息相关的二进制代码字作为整个视频数据信号一部分发送时，还存在节省许多代码字比特的需要。当发送大量的视频数据时，其对节省与视频数据一起发送的代码字比特的数目，以便节省要发送的整个比特的数目说来变得甚至更重要。这允许将视频数据信号作为整体更加有效的压缩。
[0010] 问题的解决方案
[0011] 本发明的一个目的是引入一种用于预测处理帧内色度采样的方法和装置，其能够通过使用已经内插的预先重建的亮度采样的线性组合来重建色度采样。
[0012] 本发明的再一个目的是提供一种通过依赖预先标识的预测模式信息，用于用信号通知和标识适当的当前预测模式的更加有效的方法和装置。通过依赖预先标识的预测模式信息来确定适当的当前预测模式，需要由编码单元发送的整个代码字比特的减小是可以实现的。
[0013] 本发明的有益效果
[0014] 本发明提供一种用于对当前色度采样执行色度预测的新模型，其基于已经内插的预先重建的亮度采样的线性组合。该用于执行色度预测新模型还利用预先重建的亮度采样，其已经内插并且预先重建色度采样，这里，这些采样取自邻近当前色度采样的块。通过利用来自与当前色度采样相同的块的预先重建的亮度采样、已经内插并且来自于邻近当前色度采样的块的预先重建的亮度采样，以及来自邻近当前色度采样的块的预先重建的色度采样的线性组合，可以实现用于色度采样的更高的预测精确度。
[0015] 本发明还实现将被发送的整个代码字比特的减少的需要，从而，减小在比特流中整个比特的传输。当可能的时候，这通过根据在前及时发送的信息使得稍后的信息能够按时发送来实现。
【附图说明】
[0016] 伴随的附图被包括以提供对本发明进一步的理解，并且被结合进和构成本说明书的一部分，图示本发明的实施例，并且与该说明书一起用于解释本发明的原理。
[0017] 图1是按照本发明的编码单元的框图；
[0018] 图2是编码的视频数据的示例性的视图；
[0019] 图3是按照本发明的解码单元的框图；
[0020] 图4图示按照本发明的某些实施例的可用的帧内预测模式；
[0021] 图5图示被分割为条带单元的视频数据图片；
[0022] 图6是从图5中指定的区域的近视图；
[0023] 图7是从图6中指定的区域的近视图；
[0024]图8图示按照本发明一个优选实施例的内插处理的结果；
[0025]图9图示按照本发明另一个实施例的内插处理的结果；
[0026]图10图示按照本发明另一个实施例的内插处理的结果；
[0027] 图11(a)是按照本发明一个优选实施例的可用的亮度预测模式的表格；
[0028] 图11(b)是按照本发明另一个优选实施例的可用的亮度预测模式的表格；
[0029] 图12是按照在本发明中一些实施例的可用的预测模式的图解说明；
[0030] 图13是按照本发明一个优选实施例的预测处理单元的框图；
[0031] 图14(a)是在亮度预测模式信息和色度预测模式信息之间的映射关系的表格； [0032]图14(b)是在图14中的表格的二进制代码字表不；
[0033]图15是将用于帧内色度预测模式的数值与它们的二进制比特代码字值进行比较的表格；
[0034] 图16是图示帧内预测模式值的传输的流程图；
[0035] 图17是图示按照本发明一个实施例用于标识适当的帧内色度预测模式的信号发送方法的流程图；
[0036] 图18是图示按照本发明另一个实施例用于标识适当的帧内色度预测模式的信号发送方法的流程图；
[0037] 图19是图示按照本发明另一个实施例用于标识适当的帧内色度预测模式的信号发送方法的流程图；
[0038] 图20图示按照本发明用于发送变换单元大小信息的方法；
[0039] 图21图示按照本发明用于发送变换单元大小信息的方法。
【具体实施方式】
[0040] 本发明的附加特点和优点将在随后的描述中阐述，并且从该描述中部分地将是显而易见的，或者可以通过本发明的实践习得。通过尤其在著述的说明书及其权利要求以及所附的附图中指出的结构，可以实现和获得本发明的目的和其他的优点。
[0041] 为了实现这些和其他的优点，以及按照本发明的目的，如在此处实施和广泛地描述的，一种用于解码数字视频数据的方法，包括:接收包括视频数据的图片序列，视频数据的每个图片由至少一个条带组成，并且每个条带由至少一个树块(treeblock)组成。每个树块被分割为许多的预测单元，并且按照相应的预测模式对每个预测单元执行预测，以便重建视频数据。相应的预测模式将是用于在传输之前编码预测单元的相同的预测模式。
[0042] 按照本发明，预测模式类型信息与用于标识该视频数据的每个预测单元的预测模式的视频数据一起接收。该预测模式类型信息区别帧间预测模式和帧内预测模式。该预测模式类型信息还区别对应于亮度预测单元的预测模式和对应于色度预测单元的预测模式。
[0043] 按照本发明，当该预测模式类型信息指示线性方法(LM)预测模式将被实现为帧内预测当前色度预测单元以用于重建的时候，LM预测模式包括从在当前色度预测单元的相同的块内获得已经内插的预先重建的亮度采样的线性组合。LM模式进一步包括从邻近当前色度预测单元的块获得预先重建的亮度采样的线性内插，并且从邻近当前色度预测单元的块获得预先重建的色度采样。
[0044] 此外，按照本发明，当预测模式类型信息指示线性方法预测模式将被做成用于帧间预测当前色度预测单元的时候，提供一种用于获得已经内插的预先重建的亮度采样的线性组合的方法，这里亮度采样是从基准图片中获得的，该基准图片不同于包括当前色度预测单元的当前图片。对于LM预测模式的帧间预测方法，使用的重建的色度采样可以从已经从基准图片重建的亮度采样，或者对当前图片预先重建的亮度采样中获得，基准图片不同于当前图片。此外，重建的色度采样可以直接从用于帧间预测的LM预测模式的帧间预测模式的基准图片中获得。用于线性方法预测模式的帧间预测方法也适用于将来重建的B图片基准。
[0045] 本发明的LM预测模式也适用于可以将预测单元分割为帧内预测分割块和帧间预测分割块两者的情形。
[0046] 按照本发明，标识用于色度采样的预测过程的LM预测模式可以以依靠与亮度采样有关的预先用信号通知的预测模式的方式用信号通知。这样做，以便节省标识适当的预测模式需要的二进制代码字比特的量。
[0047]应该明白，上文的概述和下面的详细说明是示范性和说明性的，并且如所要求对本发明提供进一步的说明。
[0048]用于本发明的模式
[0049] 现在将详细地进行介绍本发明的优选实施例，其例子被在伴随的附图中图示。首先，在本说明书和权利要求书中使用的术语或者措词不被解释为局限于常规的或者字典含义，并且应该认为是基于发明人能够恰当地定义该术语的概念以期望的方式描述发明人的发明的原则，匹配本发明的技术思想的含义和概念。在本公开中公开的实施例和在伴随的附图中示出的结构实质上是示范性的，并且实质上不意欲包括在内。该优选的实施例不表示本发明的所有可允许的技术变化。因此，应该明白，本发明覆盖在提交本申请的时间点上落入所附权利要求书及其等效的范围之内提供的对本发明的修改和变化。
[0050] 例如，图片可以称为帧，这里帧或者图片表示单个视频数据的例子。图片或者帧的序列包括视频数据。图片通常由多个条带组成，但是，有可能单个条带包括整个图片。此外，块还可以称为单元。
[0051]每个条带通常被分割为多个树块。树块的大小是可变的，并且可以具有大到64X 64个像素的大小。做为选择，树块可以具有对应于32 X 32、16 X 16、16 X 8、8 X 16、8 X 8、8 X 4、4\8、4\4、4\2、2\4和2\2个像素的任何一个的大小。树块的大小受到各种因素的影响，诸如，但是不局限于视频图片的选择的视频分辩率。编码器也可以贯穿包括视频数据的图片的序列自适应地确定用于树块的最佳大小。用于处理视频图片的另一个基本单位是宏块。宏块具有16 X 16的大小。
[0052]在解码视频数据的传输之前，必须首先对视频数据进行编码。图1图示视频数据来源于视频源，该视频源提供原始视频数据。虽然图1描述视频源是整个传输单元1的一部分，但视频源2可以与传输单元1分离，只要视频源2能够将原始视频数据通信给传输单元1。在视频源不是传输单元1的整体部分的情形下，对于视频源2有可能实际直接与传输单元1通信，或者与传输单元1无线通信。
[0053]由传输单元1的预测处理单元3执行预测处理。原始视频数据的预测处理对于从视频源获得视频数据图片的序列时必需的，视频数据图片表示原始视频数据。虽然视频数据在预测处理单元3中经历各种预测处理，预测模式信息与视频数据的每个预测单元相关。预测模式信息标识在哪个可用的预测模式之下每个预测单元被预测处理。以这种方式，稍后一旦在解码单元接收到视频数据，通过经历与通过预测模式信息标识相同的预测模式处理，每个预测单元可以被成功地重新预测和重建以用于显示。在经历预测处理之后，变换单元4对预测的视频数据执行变换操作。很可能对该预测的视频数据执行离散余弦变换 (DCT)。然后，该视频数据由编码器单元5编码和发送。
[0054]图2是描述按照本发明的视频数据图片的表示。在图2中，该图片对应于该视频数据的4:2:0采样速率。4:2

完整全部详细技术资料下载

当前第1页1 2 3 4 5

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：金郑善;朴胜煜;林宰显;朴俊永;崔瑛喜;成宰源;全柄文;全勇俊
技术所有人：LG电子株式会社
我是此专利的发明人