视频编码方法

文档序号:7737862阅读:161来源:国知局
专利名称:视频编码方法
技术领域
本发明涉及视频压缩领域,例如,更具体地涉及到MPEG系列(MPEG-1,MPEG-2,MPEG-4)和ITU-H.26X系列(H.261,H.263及其扩展,H.26L)的视频标准。所述发明是关于一种视频编码方法,该方法应用于视频帧序列并产生已编码的比特流,在该比特流中,每个数据项通过比特流语法来描述,该比特流语法允许任何解码器识别和解码所述比特流内容的所有片段,所述帧中的每一个都是由三个矩形矩阵组成,即一个亮度矩阵和两个色度矩阵。
本发明还涉及一种用于执行所述编码方法的装置,一种通过这种编码装置递送的可传输视频信号,一种用于解码所述可传输信号的视频解码方法,和一种对应的解码装置。
背景技术
在第一视频标准中,假定该视频是矩形的并以三个独立信道的方式来描述一个亮度信道和两个色度信道。该亮度信号在给定数量的N比特(例如8比特)上携带变化的黑白信息。两个色度信道中的每一个都包含一个数字信号,该数字信号等于在给定数量的M比特(例如8比特对于这种8比特表示,该信号的值可以在0和255之间变化)上由色度表示定义的范围内所包含的值。在只有黑白信号的情况下,每个色度信号都包含一个等于恒定值2M-1的平滑信号。然而,对于上述标准,描述将被传输的信号的语法总是假定该视频是“彩色的”。虽然有许多视频内容是黑白的,但所述语法强制传输该并非必要的色度描述单元。
这种缺乏灵活性的结果是比特的浪费,导致编码效率的损耗,例如在标准MPEG-4和H.26L的情况下举例说明的(a)标准MPEG-4如MPEG-4文件w3056第134页所定义的那样,其也被引用为1999年12月、美国毛伊岛(Maui)、ISO/IEC JTC1/SC29/WG11“InformationTechnology-Coding of audio-visual objects-Part2Visual(信息技术—音频-可视对象的编码—第二部分可视)”,称为dct_dc_size_chrominance的变长码被用作对差分值的大小进行编码的描述单元,该差分值应当从传输的或存储的比特流中读取,以便在所有内部宏块的块中更新最后解码的色度DC系数,从而获得其当前值。当色度信号是一个恒定值时,等于0的此差分值被编码为“不存在要读取的差分值”(即,dct_dc_size_chrominance=0),如所述文件第343页表格B-14第一行所示的那样,这将导致在I图片中每个色度信道的每个宏块有2比特的代码字。对于包含396个宏块、大小为352×288个像素的CIF I图片,这将最终导致至少浪费396×2信道×2比特=1584比特(‘至少’,是因为,实际上,其他语法单元可以进一步降低编码效率,并且必须被考虑到此评估中)。
(b)标准H.26L如2000年8月22-25日美国俄勒冈州波特兰第11次会议ITU-电信标准化部分,H.26L文件Q15-K-59“H.26L Test ModelLong Term Number 5(TML-5)Draft 0”第16页所定义的那样,一种所谓的编码块图案(CBP)被用于为任何给定的16×16像素宏块指示哪些8×8的块(用于亮度和用于色度)包含变换系数,实际上也就是用于指示两种信息哪些8×8亮度块在比特流中被编码(为4比特),色度系数是否被编码(3种可能性,被编码为2比特)。然后此CBP单元被进一步用可变长码来编码利用为彩色序列优化后的VLC表格将亮度和色度块图案一起进行熵编码。然而,此表格并未对黑白序列进行优化在48个值中实际上只用到16个CBP值,最短的VLC字为从未遇到的CBP值预留。要精确地用数量表示这种比特浪费是很困难的,但它显然是存在的。
发明概述因此本发明的目的是提出一种视频编码方法,它使得避免这种比特浪费,从而提高编码效率。
为此,本发明涉及一种如本说明书的引言部分所定义的方法并且其特征在于所述语法包括一个标志,用于以高描述级别指示色度分量是否出现,本发明还涉及一种对应的编码装置。
本发明还涉及一种可传输的视频信号,该视频信号由用这种视频编码方法产生的已编码比特流组成,在该比特流中,每个数据项通过比特流语法来描述,该比特流语法允许任何解码器识别和解码所述比特流内容的所有片段,所述帧中的每一个都是由三个矩形矩阵组成—一个亮度矩阵和两个色度矩阵,所述信号的特征在于它包括一个语法单元,被提供用于以高描述级别指示色度分量是否出现,本发明还涉及一种用于接收和解码这种视频信号的视频解码器。
本发明还涉及一种用于解码所述可传输的视频信号的视频解码方法和对应的解码装置。
附图简介本发明将参照附图以更详细的方式进行说明,其中

图1示出了具有运动补偿的帧间预测的MPEG编码器的一个实例。
发明详述为解决上述的比特浪费问题,提出不管所考虑的标准类型如何都引入一种附加语法单元,该附加语法单元允许在这些标准中引入更多的灵活性。这种引入是通过根据本发明以等价于例如视频对象层(VOL)MPEG-4级别的高描述级别在比特流中加入一个特殊信号、或者一个标志来实现的,该特殊信号或标志是为了以高于MPEG或ITU标准的宏块的级别,或者更一般地说,以高描述级别来提供色度信号是否应当被编码的指示。
例如,此附加的描述步骤是以下述方式被实施的。语法单元在本例中被定义为,例如Video_object_layer_chrom,而此单元的语法含义是“这是一个一比特的标志,若被设定为给定值(例如,一),则指示色度信道出现并且应当被解码,否则,两个色度信道都被设定为相关的单色恒定值”。
本技术方案尤其有利的是,它通过使用上述标准中既没有提到也没有建议过的手段而显著减少了比特的浪费。必须要注意,例如MPEG-4语法中,在上述文件w3056中还有与色度相关的另一个语法单元,该语法单元被称为“chroma_format”并被在VOL级别给出。从该文件第111页的表格6-13中给出的语法描述可以看出,该色度的格式给出为例如,4∶2∶0,或4∶2∶2或4∶1∶1,但是并未提到该色度信道是否出现。
上述视频编码方法可以在例如图1所示的编码装置中实施,图1示出了具有运动补偿帧内预测的MPEG编码器的实例,所述编码器包括编码和预测级。该编码级本身包括模式判定电路11(用于确定MPEG中定义的I,P或B编码模式的选择)、DCT电路12、量化电路13、可变长度编码电路14、缓冲器15和速率控制电路16。该预测级包括运动估计电路21、运动补偿电路22、反向量化电路23、反向DCT电路24、加法器25和减法器26,该减法器用于向编码级发送编码装置的输入信号IS与预测级的输出端(即,运动补偿电路22的输出端)可以得到的预测信号之间的差值。该差值就是被编码的比特流,缓冲器15的输出信号CB就是根据本发明包括一比特标志的已编码比特流,该比特标志用于指示色度是否出现在输入信号中,并且是否必须在解码侧被解码。
编码装置的另一个例子可以是基于MPEG-4标准的规定。在MPEG-4视频框架中,可能由一个或多个视频对象(以及可能地它们的增强层)组成的每个场景被构建为这些对象的一个合成,这些对象被称为视频对象(VO),并利用分离的基本比特流进行编码。因此,首先通过分割电路将输入视频信息分离为多个视频对象,然后将这些VO发送到一个基本编码机构,该基本编码机构包括形状编码、运动编码和纹理编码。鉴于这些编码步骤,每个VO都被划分为多个宏块,该宏块例如以4∶2∶0的格式包括四个亮度块和两个色度块,然后被一个接一个地编码。根据本发明,包含从所述编码步骤得到的已编码信号的该复用的比特流将包含一个比特标志,用于指示色度是否出现在输入信号中,并且是否必须在解码侧被解码。
相对地,传送到解码侧的此标志通过视频解码器中的适当装置被读出,该视频解码器用于接收包含所述标志的已编码比特流。能够识别并解码该已编码比特流内容的所有片段的该解码器读取所述附加语法信息,从而得知色度信道是否出现并且是否将被解码。与编码装置一样,这种解码器可以是任何MPEG类型的,该解码器的基本元件依次是例如接收已编码比特流的输入缓冲器、VLC解码器、反向量化电路和反向DCT电路。在编码和解码装置中都可设置一个控制器,用于管理该编码或解码操作的步骤。
前面已描述了根据本发明的优选实施例,这是为了举例和说明。而并不在于穷举或将本发明限制为上述公开的确定形式,对于本领域的技术人员来说显而易见的是,根据上述教导,明显的修改和变化都是包括在本发明的范围之内的。
例如,应当理解,这里描述的编码和解码装置可以被实施为硬件、软件或硬件和软件的结合,但是并不排除单项的硬件或软件可以执行多种功能,或者是硬件和软件项目的组装或者结合在一起执行单个功能。所描述的方法和装置可以通过任何类型的计算机系统或其他适当装置来实施。硬件和软件的典型结合可以是装载有计算机程序的通用计算机系统,当被装载和执行时,该计算机程序控制该计算机系统执行这里所描述的方法。可替换地,可以使用一个专用的计算机,该计算机包含用于执行本发明的一个或多个功能性任务的专用硬件。
本发明也可以被嵌入一计算机程序产品,该计算机程序产品包括可以实施该方法和所述功能的所有特征,并且当被装载到计算机系统中时,能够执行这些方法和功能。在本发明的背景下,计算机程序、软件程序、程序、程序产品或软件代表任何表达形式、任何语言、代码或符号的一组指令,该指令意欲使具有信息处理能力的一个系统直接执行或在下述功能中的任一个或两个之后执行一个特定功能,即(a)转换为其它语言、代码或符号;和/或(b)以不同的物质形式进行再现。
权利要求
1.一种视频编码方法,可应用于视频帧序列并产生已编码比特流,在该已编码比特流中,每个数据项通过比特流语法来描述,该比特流语法允许任何解码器识别和解码所述比特流内容的所有片段,所述帧中的每一个都由三个矩形矩阵组成,即一个亮度矩阵和两个色度矩阵,所述方法的特征还在于,所述语法包括一个标志,用于以高描述级别指示是否出现色度分量。
2.如权利要求1所述的方法,其中,若所述标志被设定为给定值,则该色度分量出现并必须在解码侧被解码,若所述标志没有被设定为所述给定值,则两个色度分量都被设定为一个单色恒定值并且不必被解码。
3.一种MPEG类型的视频编码装置,包括预测级,用于通过从所述装置的当前输入信号减去由先前输入信号获得的预测信号来定义一个将被编码的差值信号;和一编码级,用于递送根据所述差值信号的已编码比特流,所述编码装置的特征还在于,其包括用于在所述已编码比特流中以高描述级别加入一个标志的装置,该标志用于指示在所述输入信号中是否出现色度分量。
4.一种根据MPEG-4标准的规定而产生MPEG类型的输出已编码比特流的视频编码装置,所述编码装置的特征在于,其包括用于在其输出已编码比特流中以高描述级别加入一个标志的装置,该标志用于指示在所述装置的输入信号中是否出现色度分量。
5.一种可传输的视频信号,由通过实施视频编码方法而产生的已编码比特流组成,该视频编码方法应用于视频帧序列并产生所述已编码比特流,在所述已编码比特流中,每个数据项通过比特流语法来描述,该比特流语法允许任何解码器识别和解码所述比特流内容的所有片段,所述帧中的每一个都是由三个矩形矩阵组成,即一个亮度矩阵和两个色度矩阵,所述信号的特征在于,其包括一个语法单元,被提供用于以高描述级别指示所述已编码比特流中是否出现色度分量。
6.一种用于解码可传输视频信号的视频解码方法,该可传输视频信号由通过实施视频编码方法而产生的已编码比特流组成,该视频编码方法应用于视频帧序列并产生所述已编码比特流,在所述已编码比特流中,每个数据项通过比特流语法来描述,该比特流语法允许任何解码器识别和解码所述比特流内容的所有片段,所述帧中的每一个都是由三个矩形矩阵组成,即一个亮度矩阵和两个色度矩阵,所述信号包括一个语法单元,被提供用于以高描述级别指示所述已编码比特流中是否出现色度分量,而且,所述解码方法还包括解码所述语法单元的步骤,该语法单元用于指示已编码比特流中是否出现色度分量。
7.一种用于解码可传输视频信号的视频解码装置,该可传输视频信号由通过实施视频编码方法而产生的已编码比特流组成,该视频编码方法应用于视频帧序列并产生所述已编码比特流,在所述已编码比特流中,每个数据项通过比特流语法来描述,该比特流语法允许任何解码器识别和解码所述比特流内容的所有片段,所述帧中的每一个都是由三个矩形矩阵组成,即一个亮度矩阵和两个色度矩阵,所述信号包括一个语法单元,被提供用于以高描述级别指示所述已编码比特流中是否出现色度分量,而且,所述解码装置还包括用于解码所述语法单元的装置,该语法单元用于指示已编码比特流中是否出现色度分量。
全文摘要
本发明涉及一种应用于输入信号IS的视频编码方法,该输入信号IS由用一个亮度矩阵和两个色度矩阵所表示的帧序列组成。此方法产生已编码比特流CB,在该已编码比特流CB中,每个数据项通过比特流语法来描述,该比特流语法允许任何解码器识别和解码所述比特流内容的所有片段。根据可在例如MPEG和ITU-H.26X系列的视频压缩标准中得到应用的本发明,该语法包括一个标志,被提供用于以高描述级别指示在所述已编码比特流中色度分量是否出现,从而允许在解码侧递送信息,根据该信息色度描述单元将必须被解码或不被解码。
文档编号H04N7/32GK1537391SQ02815052
公开日2004年10月13日 申请日期2002年7月18日 优先权日2001年8月2日
发明者C·杜福尔, C 杜福尔, G·马匡特, 锾, S·E·瓦伦特, 瓦伦特 申请人:皇家飞利浦电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1