可变比特率视频编码方法和相应的视频编码器的制作方法

文档序号：7579570阅读：357来源：国知局

专利名称：可变比特率视频编码方法和相应的视频编码器的制作方法
技术领域：
本发明涉及可变的比特率视频编码方法和相应的允许执行所述方法的视频编码器。
如由S.R.ELY所著的文献《MPEG视频编码基础指导绪论》的BBC研究和发展报告，编号为BBC-RD-1996/3中1至10页所描述的，起始于1988年的MPEG标准是为了定义用于视频和音频信号数字压缩标准的，第一个目标是定义用于数字存储操作诸如CD-ROM(小型磁盘只读存贮器)的视频规则系统，但最终标准也适合于交互CD系统(CD-I)，允许图像数据以1至15兆比特范围内的比特率传输，此标准是基于通过利用瞬时冗余减少的基块运动补偿和用于空间冗余减少的离散余弦变换来实现的数据压缩。
对于诸如CD-1和CD-ROM的普通CD标准，传输比特率是固定的，且图像仅能够以恒定的比特率编码。新的标准如数字通用磁盘(DVD)可供数据以可变比特率(VBR)传输之用；为了保持恒定的质量，复杂的景物比包含较少信息的景物以较高的比特率编码。
本发明的一个目的是提供一种可以获得这样一种编码序列的恒定质量的VBR视频编码方法，但是在所给出的总的比特预算的限制之下(如按照预置的目标比特率)。
为此本发明涉及一种VBR视频编码方法，其特征在于它包括(a)一个分析步骤，用于编码一个具有恒定量化步骤的图象序列并且生成一个比特流，其序列的平均比特率不需要满足所要求的特定尺寸的限制条件；(b)一个预测步骤，用于预测量化步长，此量化步长必须按照预置的目标比特率来编码比特流。
(c)最后，所述分析和预测步骤的一个重复，目的是为了得到所述步长的更精确的估算。
(d)一个最终控制步骤，依据用于所有前帧的累积比特率和累积的预测比特率的比较，由于调整步长使得与所述目标比特率匹配。
本发明的另一个目的是提供一个用于实现所述编码方法的VBR视频编码器。
为此，本发明涉及一种可变比特率视频编码器，其特征在于包括(a)一个编码支路，包括串联的至少一个量化电路和一个可变长度电路；(b)一个预测支路，包括在所述量化装置的输出端串联至少一个反向量化装置和一个预测子系统并且通过减去由所述编码支路编码的信号来定义。
(c)所提供的一个控制电路用于执行下述操作的实现；--具有恒定量化步长的视频序列的编码操作；--用于允许以特定的目标比特率来编码比特流的量化步长的估算的预测操作；--所述操作的至少一个重复；--为了将在编码操作期间消耗的比特总数与所述比特率匹配的最终控制操作；本发明的优点现将被展示在下面的相关描述和附图中，其中--

图1表示图象组中的一些图象，以及图2和3说明对于这样的典型图象组，图象的显示顺序和它们的传输顺序之差别；--图4和5分别表示按照本发明的编码方法以及对应的允许实现所述方法的视频编码器的设计的主要步骤；--图6表示用于实现所述编码方法的最终控制步骤的控制环路；在描述按照本发明的编码方法之前，MPEG-2视频标准的一些基本原则可能被取消。由于允许适合所有应用要求的轮廓(profiles)和层次(level)的定义，获得了此标准的适应性，意图是支持更宽范围的可能应用，轮廓是用以支持所给出的应用类型所需的唯一特性的MPEG-2标准的子集，同时层定义了施加于比特流参数之上的一组限制条件。
MPEG-2压缩的基本步骤，适合于由三个分量(Y，U，V)组成的彩色图像，相关的帧被划分成小的分段或宏块，它们由亮度和色度块组成。三个步骤是运动估算和校正(基于16像素×16行宏块)，离散余弦变换(基于8像素×8行块)，运行-长度编码。
定义了三种类型的帧或图像。图像内(或I图像)的编码与其它图像无关，预测图像(或P图像)的编码运用了从过去的I或P图像运动补偿预测，并且双向预测(或B图像)的编码利用了过去的或未来的I或P图像作为运动补偿，以执行块匹配搜索获得的运动矢量的形式给出运动信息(其中在编码器中大量的试验性偏移被测试，并且在被编码和预测的块之间的最小误差测量的基础上，选择出一个最好的)。
如图1所示说明，在运动矢量的基础上，P和B图像怎样被定义。不同的图像一般出现在称作一组图像或GOP的重复序列中，且由I图像和所有随后的图像组成直到下一个I图像出现。一个典型的GOP按照图2中的显示顺序显示(黑色箭头对应正向的预测且白箭头对应反向的预测，序列及预测周期性重复)并且按照图3中的传输顺序(P4，P7，110，P13标明排序的帧)，所述在解码反向预测的顺序与未来图像不同。
一个规则的GOP结构能够用两个参数N和M来描述。被定义为GOP尺寸的参数N如图2所示，所述GOP的图像数目，如在两个I图像之间的图像数目加1。参数M是P图像的间距，或者(是同样的情况)相邻B图像的数目加1。在图1至3所说明的实例中，M＝3和N＝9。显然其它的组合是可能的图像显示顺序 NMIPPPPPIPP61IBPBPBPBI82IBBPBBPBBPBBIBBP 12 3所选择的N和M彼此独立。
在关于模块校正种类的判定确定之后，相关宏块的每一个像素的预测误差通过从原始的宏块减去估算的宏块获得。那么关于预测误差的DCT的执行，对于8×8像素的块(从而对于每个宏块确定6个DCT转换4个用于亮度分量，2个用于色度分量)，这样所获得的频率分量被量化了。量化步长决定解码图像的比特率和失真如果量化是不精确的，需较少的比特编码一个图像，但是质量较差，同时，如果量化步骤较好，需要大量的比特编码图像，但质量较高。由于人类的眼睛对较高频率没有较低频率敏感，因此对于高频分量使用粗略的量化是有益的(事实上，为了实现频率独立量化，一个加权矩阵适用于基本宏块量化参数；大量的系数，特别是那些高频，在所述加权量化后等于0)。
这样每个块被Z字形扫描且所获得的列表被编码。运行长度编码通过确定一对(A，NZ)来进行，其中A设定连续零的数目(0到63)且NZ设定下述非零系数的振幅。那么依据此对出现的频率(一个普通的组合(A，NZ)被分配为较短的可变长度编码，而不太经常出现的被分配为较长的编码)。
以上所描述的功能在由C.T.Chen等人所箸的文献《用于普通视频应用的混合扩展MPEG视频编码算法》中的信号处理图像通信5(1993)，第21-37页中的2，4部分，其中包括普通的MPEG-2编码器简图，被简略地作为一个实例。现在所提出的VBR编码方法的目的在于保证最终比特流的大小将非常适合象DVD这样的具有固定容量的存贮媒体。所述方法的示意图在图4中给出，且允许实现所述方法的视频编码器的设计如图5所示。
编码方法被划分为步骤41，42和43。第一步骤41是一个分析步骤，其中图像序列以恒定的步骤Qc(且因此具有恒定的质量)编码。在此步骤的结束，一个依从标准MPEG-2的比特流已经产生，但整个序列的平均比特率这样被处理(如此序列中被编码的比特总数与在那个序列中的图像的总数之比)，在所述步骤结束之前未知，没有达到比特流规定大小的所要求的限制条件。
第二步骤42是预测一个步骤，准备按照规定的目标比特率预测必须用于编码比特流的量化步长Q。一旦所述预测步骤完成，则分析步骤41可以每当需要时就被重复(图4中的箭头)，目的是为了得到关于Q的更精确的估算(然而，一个较好的预测一般经过较少的几次运行之后就可以获得，例如两次)。
当在第二步骤结束时，有效的量化步长Q仅仅只是一个估算值时，如果每个图像用所述预测值编码，那么全部比特预算不是正好匹配。最后的步骤是允许保证全部平均比特率的限制被严格监察的最终过程43。为保证最终输出的比特流有确实精确的所需尺寸，执行量化步长控制处理。此处理是基于依赖预测和实际比特率的比较的控制环路。在最后的步骤中每个图像被编码之后，控制处理将已经消耗的比特数与所允许进行比较。如果所消耗的比特比预算所允许的要多，那么量化步长增加，且下列图像的比特率减少。如果所消耗的比特率比预算所允许的要少，那么Q减少且比特率增加，全部的目标比特率最终被精确地匹配。
所述VBR编码方法在图5中的编码器中执行，其中每一个块对应的都是在控制器55的监控下执行的特定功能。所示编码器包括串联一个输入缓冲器51，一个减法器549，一个DCT电路521，一个量化电路522，一个可变长度编码电路523，和一个输出缓冲器524。电路521到524组成了编码支路52的主要元件，对于预测支路53，包括一个反向量化电路531，一个反向DCT电路532和一个预测子系统组合。此预测子系统其自身包括一个加法器541，一个缓存器542，一个运动估计电路543(所述估计是基于在缓存器51的输出端有效的输入信号的一个分析)，以及减法器549(接收缓存器51的输出信号和运动补偿电路544的输出信号，用于将其之差发送到编码支路)。
所说明的编码器的输出被发送到控制器55，此控制器55包括用于执行最终步骤43的控制环路。用于VBR编码器最终过程的所述控制环路的主要元件如图6所示。已经解释过，在最终编码过程间调整量化步长是必需的，目的是为了确保由操作者所给出的全部的目标比特率精确地匹配。所述环路首先包括一个第一计算电路61，其中环路的输出(如累积预测误差)乘以系数KP。此系数其自身等于恒量QC1(由操作者选择)乘以加权系数Qint/APG，其中Qint是用于GOP(N帧的)的比特总数Q和APG的综合测定。
那么加法电路63将所述电路61的输出Q-prop和在用于产生一个综合测定Q的第二计算电路62输出的有效信号Qint相加。转换电路64提供用于所有前帧的累积比特率，根据关系式R＝fi(Q)(在加法器63输出的量化系数Q和R之间)被存贮在所述电路64。这样获得的累积比特率，在比较器65中与所述比较器的第二输入上有效的累积预测比特率相比较且被使用，在电路66中综合统一之后，因此而修改Q。
如上所述VBR编码策略是关于前述VBR编码器的改进，原因是它实现了被解码的序列的可知质量的更好的量化。分类VBR编码器调整量化参数Q，同时编码帧，以致于预测比特率匹配于每一个图像。因此它们允许改变帧内量化参数Q，并且图像的不稳定空间特性可以实现了。这种质量变化的发生不论帧的比特率预测得正确与否。对于所提出的VBR编码器，Q在帧内保持恒定且视频序列中任何图像的空间质量不改变。如果正确地测定了帧比特率和量化步宽，在自适应量化之前，Q和由此主观上的失真，对于序列的所有宏块一般保持恒定。由于量化步宽和帧比特率仅仅是估算的，所以从帧到帧发生了Q和序列质量的改变，但是在两个分析验定过后，整个帧中的Q的偏移一般低于1％。
除了达到稳定的内帧质量，新的VBR策略的其它几个重要的方面可注意到--通过增加分析过程的次数以一种迭代的方法提高量化系数的测定如果分析运行之后，距所需目标比特率的偏差还太高，那么可以利用先前编码通过的结果计算有关量化系统的更好的估算；--作为新的VBR编码策略预测Q，分析过程以不同于可利用的预测过程的另一帧顺序执行这是不可能利用旧的策略，且是新的编码概念的主要优点；--如果在最终的过程中，Q和质量的变化原来是这样不能接受的高，那么最终的步骤可以作为用于Q和子序列过程的比特率的预测的一个分析过程，利用这一特点，开发一个执行象所需要的那样多的编码过程，直到输出比特率的特性在由操作者定义的某一限制之内的编码器是可能的。
--作为控制环路具有一个综合特性，短期比特率预测误差彼此取消；因而，系统的、依赖帧类型的预测误差不会严重地影响所提出的VBR编码器的性能。
权利要求
1.一种可变比特率视频编码方法，其特征在于它包括(a)一个分析步骤，用于以恒定的量化步长编码图像序列并且生成一个比特流，对于此比特流其序列的平均比特率不需满足所要求的特定尺寸的限制。(b)一个预测步骤，用于预测量化的步长，此步长必须用于按照预置的目标比特率编码比特流；(c)所述分析和预测步骤的至少一个重复，目的是为了得到所述步长的一个更精确的估算；(d)一个最终控制步骤，依据所有前帧的累积比特率和累积预测比特率的比较，由于调整步长以致于目标比特率被匹配。
2.一个可变比特率视频编码器，其特征在于它包括(a)一个编码支路，包括串联至少一个量化电路和一个可变长度电路；(b)一个预测支路，包括在所述量化装置的输出端串联的至少一个反向量化装置和一个预测子系统并且通过减去由所述编码支路编码的信号来定义。(c)所提供的用于执行实现下述操作的控制电路--具有恒定量化步长的视频序列的编码操作；--用于允许以特定目标比特率来编码比特流的估算的量化步长的预测操作；--所述操作的至少一个重复；--最终控制操作，目的为了匹配在对所述目标比特率的编码操作期间所消耗的比特总数。
3.按照权利要求2的一个可变比特率视频编码装置，其特征在于所述控制操作是按照所有前帧的累积比特率和累积预测比特率之间的比较结果，通过修改所述步长的控制环路来执行的。
全文摘要
按照本发明的可变比特率编码方法包括一个包含第一分析过程和第二预测过程的反复处理。分析过程具有恒定量化步长(和质量)序列的图像编码以及允许将步长与所要求的目标比特率匹配的预测过程。在一些重复之后,最后的步骤允许相对于所述目标比特率的所述步长的最后调整。申请:作为具有有限容量的存贮媒体的MPEG－2解码器。
文档编号H04N7/26GK1241336SQ98801443
公开日2000年1月12日申请日期1998年6月25日优先权日1997年7月29日
发明者E·费特, D·凯泽申请人:皇家菲利浦电子有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：E.费特;D.凯泽
技术所有人：皇家菲利浦电子有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。