可变比特率视频编码方法及相应的视频编码器的制作方法

文档序号:6415560阅读:238来源:国知局
专利名称:可变比特率视频编码方法及相应的视频编码器的制作方法
技术领域
本发明涉及一个可变比特率视频编码方法,其中包括一个反复的过程该过程包括第一的分析步骤,利用一个不变的量化步长对相应于一个图象序列的比特流编码;第二的预测步骤,根据一个预先确定的目标比特率预测将用来为上述比特流编码的量化步长;最后的控制步骤,用于调整与上述目标比特率相关的步长。本发明还涉及可以执行上述方法的一个相应的视频编码器。
正如《MPEG视频编码基本指南介绍》(S.R.Ely,BBC研究与发展报告,BBC-RD-1996/3,1-10页)所述,MPEG行为始于1988年,目标是为视频及音频信号的数字化压缩确定标准。第一个目标是为数字存储媒体定义一个视频运算法则,例如CD-ROM(高密盘只读存储器),但是所得标准也应用于交互式CD系统(CD-I)。此标准允许以1至15兆比特/秒的比特率传送并存储图象数据,且此标准基于这样一个数据压缩,这个数据压缩是通过使用用于减少时间冗余的基于块的运动补偿及一个用于减少空间冗余的离散余弦转化(DCT)而获得的。
在常规CD标准中,例如CD-I和CD-ROM,传送比特率是固定的并且因此仅可以对图象以一个不变的比特率编码。新标准例如数字化多功能碟片(DVD)允许以可变比特率(VBR)传送数据为保持一个不变的品质,与对包含较少信息场景的编码相比,可以用一个较高的比特率对复杂的场景编码。
本发明的一个目的是提出一个VBR视频编码方法,采用这种方法可利用编码器输出比特流的最小比特率来获得编码序列的不变品质。
对此,本发明涉及一个在开场白中定义且被进一步描述的视频编码方法,其特征在于在一次反复的分析与预测步骤之间它包含有一个图象重新排列的步骤。
这样一个图象重新排列步骤最好是包含一系列第一是场景变化检测子步骤,第二是分配子步骤,第三是最佳放置子步骤。
在最佳实施例中,所述场景变化检测子步骤包含一个关连操作,此操作在序列的连续图象之间执行和决策操作,以显示一个可能的场景变化的出现。
本发明的另一个目的是提出一个可执行所述编码方法的VBR视频编码器。
对此,本发明涉及一个可变比特率视频编码器,它包含第一编码分支,第二预测分支,及一个为执行以下操作提供的控制电路用不变量化步长对与图象序列相应的一个比特流进行编码操作;一个预测操作,用以估计可根据特定目标比特率对所述比特流编码的量化步长;至少重复一次所述操作;最终的控制操作,用以调整关于所述目标比特率的步长;其特征在于为执行在第一次编码操作及第一次预测操作中的一次图象重新排列操作提供了所述控制电路。
结合以下的描述及附图,现将本发明的优点详细解释如下

图1显示了一组图象中的一些图象图2和图3图示了此典型图象组在图象的放置顺序和它的传送顺序之间的区别;图4和图5分别显示了根据本发明编码方法的主要步骤及可以执行所述方法的视频编码器的相应结构;图6显示了在两个连续的B图象之间场景变化的序列中一些图象及相连的运动矢量。
图7和图8展示了两个检测系数DCR和DCL的值,对其计算是为了定量估计运动矢量统计数,B图象的宏块用此统计数确定关于IBBP和PBBP图象组的两个B图象的场景删节的三个可能位置;图9展示了P图象的一个相似检测系数DCP。
图10图示了仅使用B图象的场景变化检测方法的性能。
图11给出了用来解决图象组(或GOPs)的最佳安置问题的Viterbi算法的决策值。
图12图示了GOP大小的加权函数(加权值被用来评价GOPs的大小)的例子。
图13展示了一个控制回路,它用来执行所述编码方法的最终控制步骤。
在描述按照本发明的编码方法之前,我们先回忆一下MPEG-2标准的一些基本原则。为了支持在广泛领域内的应用,这一标准具有一定弹性。这种弹性的取得是通过对合适于所有应用要求的轮廓及层次加以定义。一个轮廓是MPEG-2标准的一个子集,仅用来支持一个给定的应用类别所需的特征,而一个层次定义对比特流参数施加的一套限制。
应用于包含三个分量(Y,U,V)的彩色图像的MPEG-2压缩的基本步骤涉及一些被分为小部分和宏块的图像,其中包括亮度和色度块。这些步骤是运动估算及补偿(基于16象素×16行宏块),离散余弦变换(基于8象素×8行块),步长编码。
定义了三种图象。对帧内图象(I图象)进行了编码且不涉及其他图象。使用从一个过去I或P图象运动补偿预测对预测图象(或P图象)编码,并且双向预测图象(或B图象)利用过去和未来的I或P图象作运动补偿对。运动信息以运动矢量的形式给出,此运动矢量是通过执行块与块的匹配搜寻得来的(其中大量实验偏差在编码器中被检验,基于在正被编码的块与预测之间最小误差的测量选出最佳者。)图1展示了在运动矢量的基础上P和B图象是怎样被定义的,这些不同的图象通常是以重复序列的形式出现的,如上所述,这些不同图象被称为图象组或GOP,且包含一个I图象及下一个I图象出现前的所有后序图象。一个典型的GOP在图2中以陈列方式展示(黑箭头与前向预测对应,白箭头与后向预测对应,序列及预测周期性重复),在图3中以传送顺序(P4,P7,I10,I13指明重新排列的帧),所述顺序是不同的,以便在解码侧实现根据将来图象作后向预测。
一个规则的GOP结构可用两个参数描述,N和M。被定义为GOP大小的参数N(见图2)是所述GOP图象的数量,即两个I图象之间的图象数加一。参数M是P图象的间距,或(与之相同)相邻B图象数加一。在图1至图3所示的例子中,M=3,N=9。很明显其他组合可能是图象显示次序N MIPPPPPIPP 6 1IBPBPBPBI 8 2IBBPBBPBBPBBIBBP 12 3
N和M互相独立地选择。
决定了采取宏块补偿的种类后,通过从原来的宏块中减去被估算的宏块获得此宏块的每一个象素的预测误差。而后为一个8×8象素的块,对预测误差进行一个DCT操作(因此每一个宏块有六个DCT变换亮度成份有四个,色度成份有两个),由此获得的频率成份被量化。量化步长决定了被解码图像的比特率和失真如果量化是粗糙的,为图象编码只须很少的比特,但最终的质量很低,而如果量化大小精细,为图象编码须很多的比特,但最终的质量很高。由于人眼对高频不象对低频那样敏感,对高频成份使用较粗糙量化具有优越性(实际上,为了获得取决于频率的量化,一个加权矩阵将应用于一个基本宏块量化参数在所述加权量化后许多特别是处于高频的系数等于零。)然后每一个块被锯齿地扫描,对所得的表编码。通过决定一组(A,NZ)进行步长编码,其中A代表连续零的数量(0至63),NZ代表以下非零系数的振幅。
按照此组(A,NZ)的出现频率,此组被赋予一个可变长度编码,(一个普通的组合(A,NZ)将被赋予一个短的可变长度编码,而不时常发生的一组被赋予一个长的可变长度编码。)以上所述功能在以下文献中被归纳《普通视频应用的混合扩展MPEG视频编码算法》,C.T.Chen等,信号处理图像通信5(1993),21至37页,2.4部分,其中包括一个被普通化了的MPEG-2编码器的方案。现提出的VBR编码方法的目标是使用从几个连续的分析路径中执行的先前编码步骤中获得的信息,执行图象类型的适应分配,它可以使最终比特流的大小最小化,以使一个固定的容量恰好符合存储媒介(例如一个DVD)。图4给出了所述方法的图表,图5给出了带有可执行所述方法的图象重组的视频编码器的结构。
编码方法分为四步骤,41,42,43和44。第一步骤41是一个分析步骤,其中用一个不变的量化步长Q为一个图象序列编码(所以有一个不变的品质)。这一步骤的末尾产生一个规则的MPEG-2适应的比特流,但在所述步骤结束前不知道,这样被处理(即该序列中被编码的比特总数除以那一序列中图象总数)的全部序列的平均比特率不能满足对一个比特流特定大小所须的限制。
第二步42是图象重排步骤,在分析步骤41后执行。这一重新排列的步骤可分为三个子步骤110至130。图象分配最优化的任务可分为两部分。第一步是改进I图象的放置,它等同于GOP分配的最优化,而第二步是B与P图象的最有效放置。
第一与第二子步骤110和120构成所述优化任务的第一部分。很清楚不使用一个序列连续图象之间的时间相关性的I图象耗费的比特率最大。另外,他们必须允许随机访问序列,且随机访问对许多应用都很重要。而且,由于通常所须的是快速随机访问,必须注意不可超过I图象间的给定最大距离(例如最多12个图象)。当一个场景变化发生时该剪接处前后的图象(左右图象)是不相关连的。新场景中的第一P图象的运动补偿未被很好的执行,所以它的比特率大约是一个I图象。这样一个I图象可以取代所述P图象在不需额外带宽的情况下被放置了。然后I图象优化放置的策略必须在可能的时候分配I图象在新场景的开始。
第一子步骤110是一个场景变化检测子步骤,可允许这种分配。为了检测场景变化,将检测序列中后序图象的相关性(最好在运动补偿之后)如果两个相邻图象几近无联系,很可能新图象从第二个开始。在基础的MPEG-2编码过程中,几个参数给出了一些关于连续图象间相关性的信息-P或B图象的复杂性然而复杂性与关连性间的连接并不总被验证(低比特率有时是由于与参照图象的高度相关性或由于低帧内复杂性,例如全黑图象);-通过比较图象的宏块MB和其参考宏块(总是由运动补偿单元提供,无论块编码的类型是帧内的还是帧间的)获得了相关性的更好估算值(虽然要花费更多的计算时间)利用平方误差失真d(MB)的计算进行比较,例如可以由以下等式(1)给出d(MB)=1255Σl=0l=255(P(i)-M(i))2---(1)]]>其中P(i)是被分析的宏块MB的像数,M(i)是参考宏块的像数;运动估算是宏块导向的,对一个图象的预测使用几个运动补偿选择
图象类型 运动补偿选择I 帧内(既无运动补偿)P 帧内P 向前的P 不补偿B 帧内B 向前的B 向后的B 内插的运动补偿统计数字可以传递关于图象相关性的信息如果宏块是内部编码的,则与参考图象的相关性是低的,反之亦然。
所执行的实施例用所述运动补偿来检测场景的变化,以仅仅使用B图象的情况为例,图6展示带有场景变化的序列PBBP的图象及运动矢量,此场景变化在两个B图象(断箭表明较少的相关参考图象的宏块被用于预测相关图象,相关性是较低的)之间举例说明。当场景剪接处在两个B图象间出现时,第一个几乎仅用先前P图象作为参考图象,因为它基本上与以后的P图象不相关。同样的,第二个B图象几乎与先前P图象无关,且仅以后面的P图象作为参照。
在一个三个图象的组合中(例如举例说明的(PBB或IBB)),一个场景变化可被放在相邻B图象之前、之间、或之后。下表给出场景剪接处的三个可能位置的运动补偿。第一B图象的大多数宏块及第二图象的大多数宏块使用此运动补偿
(从B图象的角度看运动补偿的方向)为了定量评价上述的运动矢量统计数,将计算两个检测系数DCL和DCR(DC为检测系数,L和R为“左”和“右”,MC为“运动补偿”)
对于P图象,检测系数可以类似地定义为
图7、图8表明了连续B图象的左右检测系数DCR及DCL的值,场景剪接处清楚地与尖峰对应。同样地,P图象的检测系数DCP如图9所示(很明显,P图象的运动矢量提供的信息不如B图象提供的可靠。)例如在两个B图象之后出现的场景变化的情况下,即在第二B图象与后面参考图象之间(在所说第二B图象右侧),分析后的B图象的少数宏块向后被补偿或以内插值替换,因为所述B图象和后续参考图象之间的相关性低并且他们中的大多数是被帧内的或向前的运动补偿所以检测系数DCR的值很高,而检测系数DCR的值并没有被增加(相反地,在第一B图象左侧的场景变化的情况中,在先前参考图象与所述B图象之间,DCL有一个很高的值,DCR维持小值,而如果在M图象的块中没有场景变化出现,DCL及DCR均有一个小的值)。实际上,为了获得一个场景变化的单一的、对称的指示,将对两个检测值之间的差分DDV进行计算,得到DDV=DCL-DCR(5)也就是说
为每个三图象组IBB或PBB的每个B图象计算被称为运动补偿比率的差分DDV。正如所假设的那样,每组有不多于一个的场景变化,测量这种场景变化的可能性的决策值DVL的决定是通过为两个相邻B图象加上DDV的绝对值确定的DVL=|DDV(1)|+|DDV(2)|2---(8)]]>数1和2表明比率是与两个后序图象的第一或第二图象有关。关于双向图象的场景变化的准确位置可以通过看两个比率的标记来决定。-如果DDV(1)和DDB(2)大于0,场景变化在第一B图象之前已出现;-如果DDV(1)大于0,DDV(2)小于0,场景变化出现在两个B图象之间;-如果DDV(1)和DDV(2)小于0,场景变化出现在两个B图象之后。
图10展示了仅使用B图的场景变化检测方法的执行。每一个IBB或PBB组的一个决策值被计算了出来,可以看出-决策值的尖峰与真实场景剪接处处于同一位置;-宏块n°50左右的噪音由序列中的光效应造成,它干扰运动估算算法,进而干扰按照运动补偿的场景剪接处预测;-被检测的视频序列的最后一部分基本上是停滞的图象(图象几乎是同样的)所以未定义使用那一个运动补偿,因为对全部补偿类型,参考宏块是相同的,虽然没有场景变化出现,决策值因此有一个不可忽略的值(为减少误差的场景变化预测的危险,考虑除B图象之外的P图象运动矢量的统计数是很有用的如果P图象的检测系数很低,三个先前图象中没有图象变化出现)。
第二子步骤120是GOP放置子步骤。一个GOP的优化安置由两个相互抵触的目标决定(a)第一个是为GOP选择一个最佳的大小如果一个GOP太小,就会浪费比特,因为对I图象的安置比必须的比特耗费多,而如果一个GOP太大,随机访问被削弱;(b)第二个是将GOP的开始图象与一个场景变化相匹配。
因此GOP安置的问题是以一种最优方式安排GOPs,当遇到限制(a),(b)时(既考虑到一个所述GOP最大及最小尺寸,在新场景的开始处,开始一个新的GOP)。为解决这个最优化问题,使用了一个Viterbi算法对于每一个路径将纠正GOP最佳尺寸的偏移,而将鼓励在一个GOP的开始处包括的一个可能的场景变化。所有决策值的积累数决定着为每一个图象所选择的路径。
此算法检测了序列的GOP的最优开始位置。每一图象有一个所附的场景变化决策值,它描述了在各自位置的场景剪接处的可能性;如果决策值大,就意味着在那一位置场景变化的可能性很高,所以安置一个新的GOP有利可图。然而,由于GOP的尺寸不得太大或太小,在GOP的始点之间的转移(即GOPs的大小)也被加权。
在图11中,垂直线代表图象,参数S描述各自图象的场景变化的可能性(假设一个三图象组中只出现一个场景变化,所以每一个PBB或IBB块中只存在一个决策值Di(N)),W参数是评价GOP尺寸(同最佳尺寸接近的尺寸较合适,例如12)的加权值。以图象结束的路径的决策值被计算如下Di(N)=Ci-N+W(N) (9)N是所考虑GOP的大小,Ci-N是所有权数S的数量,W为从图象“1”到图象“i-N”的GOPs的最优放置。决策值最高的GOP尺寸被选了出来。加权函数W=f(N)是二次方程式,所以W随GOP尺寸与最佳GOP尺寸平方差成比例减少,如图12示例了GOP尺寸的加权函数(所提出的加权函数使两个图象变化之间全部的GOP有大约相同的尺寸因此,如果两个图象变化有16个图象的距离,两个尺寸是8的GOP被放置而不是一个尺寸是10另一个尺寸是6的两个GOP)。
到目前为止,人们并未考虑到图象的传送顺序与显示顺序是不同的。如果认为GOP的开始处被分配在场景变化后的第一个图象,那么GOP中的M图象的第一组也在场景剪接处开始。然而,I图象是要被放置的块中的最后一个图象。若M=3,则GOP中的头两个图象被编码为B图象,且只有第三个图象是I图象。所以,为了保证场景变化后的第一个图象是I图象而不是B图象,GOP的开始可以由一个或两个位置转换到左边。
第三个子步骤130是P与B图象放置子步骤。考虑到取决于时间的参数M的优化,以适应的方式搜寻B和P图象的最佳位置确实允许比特流的最小化,这是在为序列编码时所需的。增加M的值就增加了P图象的比特率,但是使用了更省比特率的B图象而不是P图象。所以后序图象间的相关性是对于优化最重要的参数,他实际上被划分为两个子任务(a)长期优化,为了在几个GOP上找到最佳的M(b)短期优化,当考虑到图象间相关性的局部变化时,将在GOP内部找到B和P图象的最佳位置对于长期优化,必须注意到,如果连续图象之间的相关性系数趋向于一,无论是选择B还是P图象都无所谓,因为在任何情况下都几乎没有系数比特剩余,而如果所述关连很低,运动补偿就不会工作。在这些极端情况下(分别是一个停滞图象和不关连图象),哪一个M是合适的,并不明显。在其他情况下,通常可以说对于低相关性序列,小M较好,对于一个高度相关的序列,大M更好一些。如果对大量场景进行实验,就会取得M长期优化的最好结果。
对于短期优化,M可以在每个GOP内部任意变化,这使得使用图象间相关性的短期变化成为可能,其目的是使比特率最小化。下表给出了一个M短期优化的例子,显示了场景变化之前M的选择场景1 场景2位置 1 2 3 4M=1 P P P IM=2 P P B(同P一样) IM=3 P B(同P一样) B I很明显,场景变化之前的B图象只可以被前向预测。在新场景之前M=1还是2并没有很大区别,因为场景变化之前的B图像的运作象P图象一样;很明显M=3的一个选择是不太好的,因为在位置3的B图象在位置1使用一个参考图象(先前的P图象),从而远离两个位置。由于图象间的相关性随它们间距离的增加而减少,M=3在位置3处的B图象比特率比M=1或2在同一位置的图象比特率高。
第三步43是预测步骤,用以预测量化步长Q,依据明确的目标比特率对比特流编码就必须使用该步骤。预测步骤一完成,如果需要就可以重复分析步骤41(图4中的箭头),以此获得对Q的更准确估算(然而,一个好的预测通常是在几次运转之后获得的,例如二)。
由于第二步末尾中存在的量化步长Q仅是一个估算值,如果使用所说预测值为每一个图象编码,总比特预算就不会被准确匹配。一个最终步骤44确保严格遵守对总平均比特率的限制。为确保最终输出比特流确实是理想大小,执行一个量化步长控制程序。此程序基于一个控制回路,此控制回路依赖于预测的与真实的比特率的比较。在最终步骤中为每一个图象编码后,控制程序对消耗的比特总数与允许数量进行比较。如果消耗了比预算多的比特,量化步长就增加了,随后图象的比特率就减少了。如果消耗了比预算少的比特,Q减少,比特率增加,总目标比特率最终严格匹配。
所说的VBR编码方法可以在一个编码器中执行,此编码器的结构如图5所示,其中每个块与一个在控制器55监视下执行的一个特殊函数对应。所示编码器包括一个输入缓冲器51,一个减法器549,一个DCT电路521,一个量化电路522,一个可变长编码电路523,及一个输出缓冲器524。电路521到524包括与预测分支53相关的编码分支52的主要元素,此预测分支53包括一个反向量化电路531,一个反向的DCT电路532及一个预测子系统。预测子系统本身包括一个加法器541,一个缓冲器542,一个运动估算电路543(此估算基于存在于缓冲器51输出的输入信号的分析),一个运动补偿电路544(其输出信号被向后传递到加法器541的第二输入端),减法器549(为向编码分支传送差分,接收缓冲器51的输出信号及运动补偿电路544的输出信号)。
所示编码器的输出被传送到包括执行最终步骤44的控制回路的控制器55。用于VBR编码器最终路径的所述控制回路的主要元素在图13中显示。正如已解释的那样,必须在这个最终编码路径中调整量化大小,以此保证算子提供的总目标比特率严格匹配。所述回路首先包括一个第一计算电路131,其中回路的输出(即积累预测误差)乘以一个因数KP。因数本身等于一个常数QC(由算子选择)乘以一个加权因数Qint/APG,其中Qint是一个Q及APG(N图象GOP比特的总数)的综合估算。
然后加法器133将电路131的输出Q-prop与在第二计算电路132输出处的信号Qint相加,此电路132用于产生一个Q的综合估算。基于存储在电路134中的等式R=fi(Q)(在加法器63的输出的量化因数Q与比特率R之间),一个反相电路134为所有先前图象给出积累的比特率。将以此所得的积累比特率在比较器135中与在比较器第二个输出端的积累预测比特率比较,且经过在电路136中的综合后被使用,以相应地修改Q。
以上所示的VBR编码策略是对先前VBR编码器的一个改进,因为它获得了解码序列视在参数的一个更好量化。传统的VBR编码器在编码一个图象时调整量化参数,因此预测比特率与每一个图象相匹配。从而它们允许量化参数Q在一个图象内部变化,且无法获得该图象的不变空间品质。无论对图象的比特率的预测正确与否,这种品质的变化都会发生。对于所提出的VBR编码,一个图象的Q是不变的,且视频序列中的任意图象的空间品质都是不变的。如果对图象比特率和量化步骤宽度的估算是正确的,Q在适应性量化及主观变形之前,对序列的所有宏块保持不变。由于量化步骤宽度与图象比特率仅仅是被估算了,Q的一个变化及由此而来的序列品质的变化在图象之间出现,但是在一些分析路径后,图象平均Q的变化通常在1%之下。
除获得不变的帧内图象品质之外,新VBR策略还涉及一些其它重要方面-以重复的方式通过增加分析路径的数量来改进量化因素的预测是可能的在分析过后,如果与所须目标比特率的偏离仍旧很高,可使用先前编码路径中的结果计算量化因素的一个更好的估算;-由于新VBR编码策略预测Q,可以利用以另一个图象顺序执行的分析路径,而不用预测的路径这在旧策略中是不可能的,它是新编码概念的一个主要优点;-如果在最后的路径中,Q的变化及随之而来的质量变化大的不可接受,最终的步骤可作为对Q及相应路径比特率的预测的一个分析路径使用这一特点,就可以发觉一个可执行所有需要编码的路径的一个编码器,直到输出比特流的性能在由算子定义的一定限制之内;-由于控制回路有一个综合的特点,短期比特率预测误差相互抵偿所以系统的图象型的预测误差并不严重影响所建议VBR编码器的性能。
很明显,本发明并不局限于前面所述,在不脱离发明的范围内有一些变化和改进。例如,一个可选择的第四子步骤(图4中的标号140,并用点状线显示)可以被包括到重新排列步骤42。为了在最后一步44的最终路径中以一个给定的比特率R(t)为序列编码,必须预测一个目标量化步骤宽度Q和目标图象比特率R(I)。执行一个分析路径的唯一要求是有一个Q的预测值。由于在第一分析步骤41中没有使用针对Q的控制系统,无须预测图象目标。对于比特率R(I)和步骤宽度Q的估算,需要先前编码路径的量化因素及图象比特率。然而,如果图象类型的顺序在两个路径间变化,在两个路径中的不同图象类型对一个序列的相同图象编码。
如果认为执行分析路径是使用N=12和M=3,而为预测路径编码是使用N=8和N=2,相应的图象放置如下表所示N M 图象显示次序123 BBIBBPBBPBBPBBIB8 2 BIBPBPBPBIBPBBBP其中第二个图象在第一路径中被编码为B图象,在第二路径中被编码为I图象。由于使用比特率预测与第一分析路径中的图象类型相同的图象的目标比特率,如果图象在第一路径中被编码为B图象,就预测第二路径的B图象比特率。在一个被修改了的图象顺序的情况下,预测图象比特率就没有用处了。
由于图象重组后目标图象比特率的预测是不可能的,图象重新排列后并不能直接执行最终编码路径。所以在最终编码路径之前必须执行一个分析路径因此依据本发明,在那种情况下对于VBR编码器至少需要三个编码路径。为了保证最终路径的预测图象比特率不会偏差太大,可以提供一个帧内图象预测附加子步骤,它将估算当分析路径以新的而不是旧的图象顺序执行时图象拥有的比特率。选择性的附加子步骤140使用图象比特率的时间相关性。
权利要求
1.一种可变比特率视频编码方法,包括一个迭代过程,该过程包括第一的分析步骤,利用一个不变的量化步长对与一个图象序列相对应的比特流编码;第二的预测步骤,根据一个预先确定的目标比特率预测将用来对所述比特流编码的量化步长;最后的控制步骤,调整关于上述目标比特率的步长;所述方法其特征在于在一次反复的分析和预测步骤之间,它包含一个图象重新排列的步骤。
2.根据权利要求1的方法,其特征在于所述图象重组步骤顺序地包含第一的场景变化检测子步骤,第二的分配子步骤,第三的最佳放置子步骤。
3.根据权利要求2的方法,其特征在于所述场景变化检测子步骤包含一个在序列的后序图象中执行的相关性操作,以及用于显示一可能的场景变化出现的决策操作。
4.根据权利要求3的方法,其特征在于所说的相关性操作是基于图象复杂性估算。
5.根据权利要求3的方法,其特征在于所说的相关性操作是基于图象块与先前参考图象的参考块的比较。
6.根据权利要求2的方法,其特征在于所述分配子步骤是基于Viterbi算法的执行,该算法允许为图象的持续组选择一个最佳的尺寸,同时将这样一组图象的开始与一个场景变化相匹配。
7.根据权利要求2至6中任何一个的方法,其特征在于所说最佳放置子步骤包括第一长期优化操作,用于在几个图象组之上寻找这些图象组之间的最佳距离;第二短期优化操作,以在几个图象组中寻找预测的且内插的图象的最佳位置。
8.根据权利要求2至7中任何一个的方法,其特征在于在两个连续迭代之间的图象类型的顺序发生变化的情况下提供附加的帧内图象预测步骤。
9.一种可变比特率编码器,包括第一编码分支、预测分支、及一个控制电路,以执行以下操作以一个不变的量化步长对相应于一个图象序列的比特流编码;预测操作,根据一个特定目标比特率估算允许对比特流编码的量化步长;至少一次所述这些操作的重复;最终控制步骤,调整关于所述目标比特率的步长;其特征在于所述的控制电路在第一编码操作与第一预测操作之间执行一个图象重新组合操作。
全文摘要
按照本发明的一种可变比特率视频编码方法,包括一个反复的过程,该过程包括:第一的分析步骤,第二的预测步骤,以及最后的控制步骤,调整关于上述目标比特率的步长;按照本发明所述方法,在一次反复的分析和预测步骤之间,提供一个图象重新排列的步骤。应用:具有有限容量的存储介质的MPEG-2编码器。
文档编号G06T9/00GK1241335SQ98801430
公开日2000年1月12日 申请日期1998年7月6日 优先权日1997年7月29日
发明者E·菲尔特, D·凯瑟 申请人:皇家菲利浦电子有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1