视频编码的制作方法

文档序号:7676132阅读:235来源:国知局
专利名称:视频编码的制作方法
技术领域
本发明涉及视频编码。
技术背景在最近20年中所发展的视频压縮技术已经基于运动补偿变换编码。 其基本思想是对一个图像进行编码,并利用该图像作为下一图像的预测, 进而消除时间冗余,并采用基于块的变换编码技术对预测余量进行编码。 可以根据先前编码的图像预测各后续图像。源图像通常被划分为被称作宏块的16x16的区域。为了更好地匹配 或者预测当前宏块,编码器搜索一个或更多个先前编码并存储的图像。 参考图像中与当前宏块处于同一位置的宏块与用于预测当前宏块的像素 区域之间的位移被称作运动矢量。 一些标准只允许每个宏块一个运动矢 量,然而其他的标准允许宏块被细分,并且针对每个子划分选择和编码 不同的参考图像和不同的运动矢量。作为被称作帧间编码(inter coding)的利用基于先前图像的预测对 宏块进行编码的替代方法是不参考先前编码的图像而对宏块进行编码。 这被称作帧内编码(intra coding)。在早期压縮标准中,这简单地通过略 去减法器并且对源图像进行直接变换和量化来实现。在后期的标准中, 采用当前图像的已编码像素的各种形式的空间预测被用于在变换和量化 处理之前从源宏块消除冗余。源图像和预测之间的差被称作预测误差,或者预测余量,通常采用 基于块的变换来将其变换到频域,然后通过标量量化器进行量化,并且 对所得出的量化系数进行熵编码。为了满足一些预定的比特率限制(例如为了实现在恒定比特率网络 上以恒定比特率传输),标量量化器的范围通常可以用来使得量化处理所引入的失真能够相对于熵编码所产生的比特率被折衷。已经发布了许多视频编码和解码的国际标准,特别是ITU的H系列 标准和ISO/IEC MPEG系列。用于针对给定的预测误差块选择标量量化 器的算法在视频压縮标准的范围之外。发明内容根据本发明,提供了一种对视频信号进行编码的方法,该方法包括:(a) 分析图像,以对于所分析的各个区域获取预测能力的度量,各 个度量取决于该区域与其所作为潜在预测图的另一区域之间的相似度, 以及(b) 采用不同的编码方法,以根据预测能力的度量而变化的分辨率 对所述信号进行编码。本发明的其他方面在权利要求中限定。


通过示例并参考附图,现在将描述本发明的一些实施方式,其中 图1是已知形式的视频编码器的框图,它也用于木发明的实施方式中;图2是已知形式的视频解码器的框图;图3是用于本发明第一实施方式的解码器的框图;图4是用于本发明第二实施方式的替代解码器的框图。
具体实施方式
图1示出了这样的混合运动补偿变换编码器(现有技术)的结构。 在输入端l接收到视频信号(通常以数字形式)。减法器2形成该输入与 来自于预测缓冲器3的预测信号之间的差分,该差分随后进一步被编码。 这里所执行的编码可以包括例如变换编码4、阈值处理(以抑制零或微小 差分的传输)、量化5和/或可变长度编码6。到预测存储器3的输入是在 加法器7中形成的预测和在8、 9处解码的编码差分信号的总和(使得在编码和解码过程中的信息丢失被包括在预测环中)。逆量化器8、逆变换9以及加法器7和存储器3以及运动补偿10 —起构成本地解码器。图2示出了解码器。可变长度解码器11之后是产生帧间差分信号的 逆量化器8,和逆变换9,。然后在7'处在从编码器接收运动矢量的运动补 偿单元10'中进行运动补偿之后将其加到来自帧存储器3'的预测中。加法 器7'的输出形成解码器输出并也被馈给帧存储器3'的输入端。可以在编码器输出端(12)和解码器输入端(未示出)提供缓冲, 以允许在恒定比特率信道上传输。还包括运动估计器13。其将正在被编 码的图像的帧与预测帧进行比较对于当前帧的各个块(看成是图像所 划分成的),其识别该块最近似的先前帧的区域。在已识别区域和所讨论 块之间位置的矢量差被称作运动矢量(由于其通常表示在由电视图像描 述的场景中的对象的运动),并被应用于运动补偿单元10,该单元用于将 先前帧的已识别区域变换到当前帧中相关块的位置,从而得到更好的预 测。这导致了由减法器2形成的差平均起来更小,并允许在4、 5处利用 比其它可能情况的比特率更低的比特率来对图像进行编码。然而,该编码器并不总是采用帧间编码。H.261标准规定了编码器针 对各个宏块判断是否要利用运动补偿帧间差分编码法对该宏块进行编 码,或者对于该宏块采用帧内编码法是否在位数上更经济。该判断由控 制单元14做出如果采用帧内编码,"先前图像"预测不再馈入减法器。 这在图1中由开关15示意性地表示。该判断也被通报给控制类似开关15' 的解码器。根据该标准,帧内编码能够采用根据同一图像内先前解码的 像素得到的预测,调用帧内差分编码,代替简单地对实际像素值进行编 码。但是,这没有在附图中示出。考虑这样的视频场景,其包括静止的或者非常缓慢地变换的详细图 像。选择标量量化器以满足比特率限制的典型途径是采用固定数量的位 来对各个图像进行编码。如果这被应用于该类型的场景,那么起始图像 将被压縮得非常拙劣,因为有许多细节需要被编码,其采用比特率限制 意味着需要粗略的标量量化器。并且后面的图像由于运动预测进行的比 较好,将稳定地具有较高的质量,因为对各图像进行编码的位被用于改进预测误差。
我们观测到起始图像的确为该场景的其他部分提供了较好的预测, 这就是说,其具有高"预测能力"。因此可以注意到在开始编码的图像 的质量上的任何改进都能够被后续的图像继承,而不需要表示待编码的 冗余信息的附加位。换句话说,由于开始图像的"预测能力",用来对 开始图像进行良好地编码的位也使后续的图像受益。
因此,对于用来对场景进行编码的总比特数的给定限制,第一种方 法导致较低质量的初始图像,以及对于场景其他部分的质量的稳定改进, 而通过分配更多的比特给初始图像,可以利用相同总比特数对全部场景 都能够进行较好地编码。
传统上,以显示顺序对视频进行编码,而用于预测的图像的实用性 明显取决于在解码器中还不能够获得的以后的图像。因而,本发明的第 一实施方式采用两道编码技术,其中第一道是后向的。因此其对于存储 的视频进行离线编码是有用的,但是对于存在严格的延迟限制的实时编 码是没有用的。
要注意的是两道编码本身是众所周知的,象多道(multi-pass)编码一 样。例如Fert等人(美国专利第6411738号)对视频序列进行初步分析, 并对量化步长作出全面的调整,从而使得该序列将适合于预定的限制(例 如将适合于标准大小的DVD)。 Yokoyama等人("A rate control method with preanalysis for real-time MPEG-2 video coding", Proceedings of the 2001 International Conference on Image Processing , IEEE , vo) 3 , pp.514-517)讨论了考虑到根据编码复杂度来分配比特而执行的预分析的 现有方案,然后针对在滑动延迟窗口期间进行预分析的实时编码提出提 议。Cougnard等人(美国专利申请公开2003/0031255A)在第一道编码 中计算统计结果,在第二道编码中利用该统计结果来优化比特率分配和 缓存管理。最后,Ruol (美国专利公开2003/0156642A)在第一道编码中 检查"块状"帧,并重新调整比特分配以减少其数量。在现有技术中, 各道编码总是按照前向顺序进行的。
因为第一道编码是后向的,传递给编码器的第一个图像是视频序列中的最后一个图像,而传递给编码器的最后一个图像是视频序列中的第
一个图像;同时第二道编码是传统的前向方向。
通过在第一道编码中后向地处理视频序列,当处理给定图像时,正 常情况下要根据它来预测的图像已经通过了解码器,因此解码器了解这 些图像并且能够确定该给定图像对于正常情况下的后续图像的预测的有 用程度。这可以进行如下解释
源图像顺序P0 PI P2 P3 P4 P5 P6
第一道编码P6P5P4P3P2P1 P0
第二道编码P0P1P2P3P4P5P6
当在第一道编码中对图像P3进行编码时,已经处理了 P6至P4,并 且存储了关于它们的信息。在第二道编码中当对P3进行编码时,可以利 用所存储的关于P4到P6的信息来设置P3的编码参数。
该技术取决于这样的假设如果P4对于P3的编码是良好的参考图 像,那么P3对于P4的编码将是良好的参考图像。该假设通常被发现是 合理的。
图像的"预测能力"是这里引入的一个概念。我们定义它为表示图 像中给定像素对于预测视频序列中其他像素的有用程度的数值。通常这 将是后续图像中的像素,但是该原理也可以被应用于根据后面的图像进 行预测的情况,并且确实可以用于预测同一 图像中的像素。
发明人已经知道了多种在对视频序列进行第一道后向编码的期间确 定"预测能力"的数值的方法。注意这些是计算代表同一基本观念的不 同数值的不同方法。
每种技术的原理如下
当图像在第一道编码中通过编码器时,它们被正常编码,并且存储 编码比特。在该示例中,所使用的编码器是未经改动的H.261编码器, 如图1中所示;然而,为了简单起见,在本方案中,不允许使用B帧。 尤其应注意到,该标准中没有规定这样的精确标准,即确定是否采用运 动补偿帧间差分编码法对宏块进行编码,或者对宏块采用帧内编码是否 在比特数上更经济。在我们优选的实施方式中,通过将从运动估计得到的绝对差的总和与内差的估计进行比较来做出帧内/帧间决定。这实际上 不是真正的差,实际中的做法是计算宏块的平均亮度值,然后将该差作 为宏块中各个像素和该宏块的像素的平均值之间的绝对差的总和。If (best一soad < intra—var + 500)coding—type = inter ;elsecoding—type = intra ;H.264帧内编码为了提高效率规定了空间预测模式的选择。在H.264 中,我们用来选择空间预测模式的算法取决于编码器的配置,尤其是可 用于编码的处理能力大小。在一种情况下,我们将绝对差的帧间总和加 上反映运动矢量和宏块模式比特的速率因子与绝对差的帧内总和加上速 率因子相比较。当可以获得更多的处理能力时,我们用帧内模式以及各 种的帧间模式全面地对宏块进行编码,并选择提供在重建的图像上的实 际失真和所产生的比特的实际数量的最佳组合的模式。在第二道前向编码之前的中间步骤,由解码器对编码比特进行解码。 然而这不是一个标准解码器,它具有类似于H.261解码器的结构,但是 具有明显的改动以使其能够实现"预测能力"计算,并输出"预测能 力"图像。在我们当前的原型实现中,"预测能力"图像是能够利用用来观看 任意未压縮视频文件的同样应用程序来观看的实际视频文件。白色用来 表示良好的预测能力,黑色用来表示较差的预测能力,灰色阴影的值在 该极限之间。这已经证明了对于察看"预测能力"信息是有用的,但不 是必需的"预测能力"信息能够存储为任何合适的文件格式。在第二道编码中,编码器以前向顺序中读出源图像而以反向顺序读 出"预测能力图像",使得两者都指的是同样的实际图像,并利用"预测能力"图像中的信息来设置编码过程中的编码参数以对源图像进行编 码。特别是,其将控制输入提供给量化器5 (图l)以控制量化步长。图3中示出了适于实现上述"中间步骤"的解码器。其接收来自于 第一道编码的编码比特流输出,并且照常执行熵解码(11)以便对各个编码宏块(1646像素区域)推导出编码模式(帧内或者帧间)、运动矢 量(如果存在)以及量化的变换系数。如果对该宏块进行了帧内编码, 则忽略来自比特流的其他信息(开关16设置为零输入),并且将宏块重 建为具有所有的零值像素(黑色像素)。如果对宏块进行了帧间编码,则 忽略量化变换系数,将逆量化逆变换残余像素都设置为值l,并且利用解 码运动矢量以及先前的解码"图像"照常执行帧间预测(开关16设置为 加法器输出)。由该解码过程得出的图像是"预测能力"图像。该算法后的推理是帧内编码表示出预测过程工作得不好,导致相关 像素的预测能力复位为零值。而当帧间编码表示预测过程工作良好时, 导致宏块的像素的预测能力递增为用作参考像素的像素的预测能力。本发明的第二实施方式类似于第一实施方式,但是其采用预测余量 技术代替用于确定图像的预测能力的帧内/帧间技术。然而,因为考虑到 帧内编码不表示预测能力,对第一道编码进行的修改之处在于,仅允许 对初始图像以及场景改变进行帧内编码——它不用于帧间编码图像中的 任何宏块,即使这会导致良好的压缩,因为该阶段的目的是利用着眼于 帧间编码余量的技术确定宏块的预测能力。注意到在最近的压縮标准中, 由于采用了空间预测,对于宏块来说,帧内编码有时是比帧间编码更有 效的编码技术。为了优化该技术,第一道编码应当优先采用精细的量化以避免许多 量化余量为零。实际上,如果该技术被应用于第一道编码而不是中间步 骤,在量化之前会有实际量化余量。现在转向"中间步骤"的实现,其采用图4中所示的解码器来执行。 将第一道编码的编码比特流输出输入到解码器。照常执行熵解码11 以便对各个编码宏块(16xl6像素区域)推导出编码模式(帧内或者帧间)、 运动矢量(如果存在)以及量化的变换系数。如果对该宏块进行了帧内编码,则忽略该比特流的其他信息,并且将该宏块重建为所有像素都具有值128 (中等灰度像素)(开关16处于低位)。如果对该宏块进行了帧 间编码,则利用逆量化和逆变换处理对该量化变换系数照常进行解码(开 关16处于高位)。然后在17处,利用预定的映射处理使所得到的预测余 量像素映射为"预测能力"余量。然后利用这些余量以及解码的运动矢 量和先前解码的图像,照常执行帧间预测。从该解码过程得出的图像是 "预测能力"图像。上面提到的预定映射处理具有很多可能性。在所有情况下,由逆量 化和逆变换处理得到的小余量导致正的"预测能力"余量,而大余量导 致负的"预测能力"余量(或者完全相反,从而对"预测能力"图像进 行相反的解释)。一种可能性是固定映射。下面示出我们已经实现的一种。变量 "real—residual"指的是在逆变换的输出获得的实际余量的幅值。 int fixed_predictivejpower—mapping(int real—residual)int predictive_power—residual;if (real—residual < 4) predictive_power_residual = 2; else if (real_residual < 8) predictive_power—residual = 1; else if (real—residual < 10) predictive_power—residual = 0;else if (real—residual < 20) predictive_power—residual = -10; else if (real_residual < 40) predictivejpower—residual = -20; else
predictive_power—residual = -255;
return predictive_power_residual;
但是这会遇到的问题是,对于给定序列,该映射可能不是最优的, 并且该"预测能力"图像将非常迅速地或者变成几乎是白的(255)或者 几乎是黑的(0),因为没有对该给定图像的映射进行归一化。注意,解 码处理将输出像素修正为0-255之间,而与预测和(映射)余量值无关。
另一种可能性是对各个图像独立地计算映射,使得解码的实际效果 对于平均解码像素值是零变化或者接近于零变化。在帧内图像之后为128 并将保持这个水平,而一些像素变得更亮, 一些像素变得更暗。在我们 的实现中,我们将余量范围划分为五个百分比范围(0-20%, 20-40°/。等), 对于前两个采用固定映射,将中间范围映射为零,而将最后的两个按比 例确定映射从而达到接近于零的平均值。
这以下面的伪代码进行说明。在最低的20%百分比中的实际余量映 射到+4的预测能力余量,20%-40%之间的实际余量映射到+2, 40%-60% 之间的实际余量映射到0, 60%-80%之间的实际余量映射到-1乘以 scale factor (比例因子),80%-100%之间的实际余量映射到-2乘以scale—factor。 scale—factor (比例因子)被选择用来实现预测能力余量接近 于0的平均值。注意到在各个百分比范围中实际余量的数量不必须是 20%。这是因为很多具有同样小的值,例如,对于50%或者更多来说, 其映射值为0是正常的。这就是为什么在伪代码中首先检查中间范围-确保具有在中间20%百分比中的值的实际余量映射到值为0的预测能力
八实际余量值的累加柱状图。
在各个20%百分比范围的边界上存储实际余量值,r20, r40, r60, r80。注意到xn/。的百分比边界rx是这样的值,其使得x。/。的像素的余量小 于或者等于该值。从而当(如经常发生的)50%或者更多的像素余量为0, 则r20和r40都将为零。
求出各个百分比范围内像素的数量,n20, n40, n60, n80, n100。
如下对两个较高的百分比范围计算比例因子
scale—factor = -(4*n20+2*n40)/(n80+2*nl00)
如下将各个实际余量映射到预测能力余量
if ((real—residual >= r40) && (real—residual <= r60))
〃40%至U 60% predictive_power—residual = 0 ;
}
else if ((real— residual >= r20) && (real—residual < r40)) {
〃20%至lj 40% predictivejpower一residual = 2 ;
}
else if (real— residual < r20)
{
〃0%至lj 20%
predictive_power—residual = 4 ;else if ((real— residual > r60) && (real—residual <= r80)) {
〃60%到80%
predictive_power—residual = -1 * scale—factor ; }
else {
〃80%到100%
predictive_power—residual = 2 * scale—factor ;
该图像适应方法遭受的事实是没有获得序列水平信息,因为在处理 任意数量的图像之后,图像的平均"预测能力"没有改变。因此很难或 者不可能将难以预测的序列与容易预测的序列区别开来。
这两种映射的混合可以提供较好的整体性能。
该处理的最后阶段是利用在第二道编码中图像的预测能力。该步骤 除了使用预测能力结果控制量化之外,还使用如图1中所示的标准解码 器。基本思想是如果宏块具有高"预测能力"(通过对其组成像素的预 测能力求平均而形成),则通过精细的量化对其进行编码,由于所得到的 宏块的高质量编码将被根据它所预测的后续图像所继承,则将合理使用 (更大量的)比特。
因此,通常来说,根据预先确定的映射依据组成宏块的像素的"预 测能力"设置宏块的量化参数。
因此,在一个可能的实施方式中,使用"预测能力"和量化参数偏 移之间的固定映射。然后通过将量化参数偏移加到为图像选定的一些基 本量化参数,来确定宏块的量化参数,这些参数可以是固定的值、取决 于图像的值,或者由一些比特率限制确定的值等。注意,原则上,如上 所述所获得的预测能力结果——在逐个像素的基础上——原则上能够用 来分别确定各个像素的量化参数。然而,我们倾向于针对整个宏块对结果求平均,并将其转换为对于整个宏块的单个量化参数。实际上,多数
标准都会允许仅以宏块水平改变量化指标(quantisation index)。
一个可能的映射是,如果平均预测能力超过128,那么量化偏移是 负值(128-averagejp)/16;否则量化偏移为0。该式适合于H.264量化器, H.264量化器的量化指数的范围为0到51 (对于8比特的视频样本),步 长通过幂数与其相关(步长与2A (量化指数/6)成比例,即每6次递增 步长翻倍)。因此在H.264中量化偏移对应于步长的比例。
对于玨264之前的标准(H.261等)不是这样,其中需要不同的关系 实现同样的效果。这些较早的标准的量化指标范围为从1到31,量化器 指数与步长成比例(步长=2*量化器指数)。
独立地将该映射应用于各个图像的实现会引起的困难是,其中在几 个连贯的图像中图像的一些部分具有较高的"预测能力",这些部分在 每一个图像中被良好地编码,由于(较小的)运动预测失败和/或视频源 中的噪声消耗了许多比特,而对其他部分以低质量反复进行编码。这会 使得缓慢的移动/有千扰的背景被良好地编码,而较少的"可预测"前景 对象(特别是人眼和嘴)被较差地编码。
在一些环境中,图像的低"预测能力"区域可能在主观上是最重要 的,并且最好将"预测能力"信息以正好相反的方式应用到最初正视的 图像,并且对那些不用于预测的部分进行良好地编码。
已经发现在实际中相当好地起作用的一个折衷办法是以刚描述的方 式对每隔(n-l)个图像应用"预测能力"信息,而以相反的方式应用到 所有其它图像。因此在再次重复之前,对后续预测有益的图像区域在初 始图像(这就是说,这些像的序列中的第一个)中进行了良好地编码, 但是在接下来的(n-l)个图像中被比平均量化更粗糙地编码;而在全部 序列中的其他区域被均一地编码。可以利用在第一道编码中导出的信息 (例如运动矢量的大小及预测余量的大小)来选择n,缓慢运动和/或小 余量允许n较大。将初始图像中编码良好的区域用于预测后(n-l)个图 像,并且由于在这些图像的相应的宏块中使用了较粗糙的量化,大部分 (希望是所有)的变换系数都能够被量化为0,导致非常有效的编码(例如没有对宏块的信息进行编码时的"跳跃模式")。
这在下面的伪代码中来解释。对于每n个图像,量化偏移如上所述。
对于介于其间的图像,对量化偏移的符号取反。在我们的原型实现中, 我们对于整个图像采用图像数目的单循环。然而如果需要,这个代码能 够针对各个待编码的宏块独立运行,在这种情况下,就所关心的一个宏 块而言,具有高预测能力的序列的初始图像可以不是其他宏块的初始图 像。
针对宏块中各个像素计算"预测能力"值的总和sum^p:
〃把总和修整为相当于单个像素,从而进行归一化
<formula>formula see original document page 16</formula><formula>formula see original document page 17</formula>
变型
上面描述了当前的原型实现,这格外吸引人,因为它在相当程度上 采用了传统的编码器和解码器配置。但是明显地,存在可以从第一道编 码和/或中间阶段(例如熵编码/解码,以及图3中根据没有使用的阶段8', 9,, 11,)中省略的一些阶段。在一个商业实现中,中间步骤不必是独立 的,而可以是第一道编码的一部分。换句话说,第一道编码能够为后续 预测产生正常的解码图像,并利用在编码过程中产生的信息输出"预测 能力"图像。事实上,该方法更一般的是,其允许使用任何编码参数来 产生"预测能力"图像,而中间步骤的使用将"预测能力"图像限制为 仅仅取决于第一道编码比特流中的信息,除非在第一道编码期间存储更 多的信息。
在上述用于确定预测能力的第一实施方式中(帧内/帧间技术),一 种技术实质上采用了现有的编码器判决机制,其决定是采用帧内编码还 是帧间编码,然后在中间步骤中,采用解码器预测图循环仅仅是累加PP 分数。 一种技术能够通过在编码器中记录这些判决而实现同样的预测能 力图,并除去解码步骤。该记录可以是
if decision = INTRA then PP(x,y) = 0
if decision = INTER then PP(x,y) = PP(x+mx, y+my) +1
其中mx, my是相关的运动矢量。
注意在一些应用中,以称为BBP的模式对图像进行编码,其中在时 间较早的B图像之前对P图像进行编码,P图像被用作参考图像而B图 像不被用作参考图像。前面提到的不允许使用B图像的限制不是必需的, 如果需要可以使用B图像。在这样的情况下,由于B图像未被用作参考 图像,它们被排除在预测能力计算之外,该计算仅对P图像(以及任何 被编码的帧内(I)图像)执行。在H,264中,是否对图像(或者图像的一部分)进行双向预测(如传统的B图像中)以及是否将其标志为参考
图像是独立的。因此,当我们釆用H.264时,用于参考的图像不论是否 采用了双向预测,它们都被包括在预测能力计算中。
此外,如果第一道编码前向执行,该方案也能工作。当遇到帧内编 码宏块时,可以累加PP分数直到它们下降为O:该分数能够被传播回去。 因而,对于具体的宏块,可以获得一个帧序列IPPPPPI (其中I或P不是 帧类型而是用于宏块的预测类型),其中对于前向扫描PP分数是(采用 第一种方法)0123450,然后这必须被转换成实际的分数54321X (X是 未知的,因为它取决于随后的内容)。该处理能够用于实时馈送,只要对 该馈送进行充分的缓冲以为此提供足够的窗口。自然地如果作为预测图 的帧应用超出了窗口长度,需要截短该处理。
在允许多个可替换的参考帧的情况下,使用前向第一道编码在简化 预测能力的计算中是非常有价值的。如果允许, 一个像素可以用作两个 甚至多个其他帧的预测图在这种情况下,预测能力将是对这两个或者
更多个预测分别计算的预测能力的组合(例如,和)。
上述描述设想了通过控制量化使得分辨率不同。然而,作为替换(或 者附加),也可以改变空间分辨率,例如通过可变二次抽样或者(在基于 变换的系统中)通过改变所传递的系数的数量。
权利要求
1、一种对视频信号进行编码的方法,该方法包括以下步骤(a)分析图像,以对所分析的各个区域获取预测能力的度量,各个度量取决于该区域与其所要用作为预测图的另一区域之间的相似度,以及(b)采用不同的编码方法,以根据所述预测能力度量而变化的分辨率对所述信号进行编码;其中,对预测能力度量进行累积计算,因为当一个区域类似于其所要用作为潜在预测图的另一区域时,该度量还取决于对于后者所计算的度量。
2、 根据权利要求1所述的方法,其中各区域所要用作为预测图的所 述另一区域是另一帧的区域,并且所述编码步骤包括帧间差分编码。
3、 根据权利要求2所述的方法,其中各区域所要用作为预测图的所 述另一区域是另一帧的运动补偿区域。
4、 根据权利要求l、 2或3所述的方法,其中所述分析步骤包括 对所述信号执行试验性编码;检查所述试验性编码的结果以确定对于各个区域,其是否满足与其 所作为潜在预测图的区域的相似度标准;如果满足该标准,则对于该区域调整至少一个存储值; 如果不满足该标准,将所述至少一个存储值设置为固定量。
5、 根据引用权利要求2时的权利要求4所述的方法,其中由视频编码器执行所述试验性编码,该视频编码器针对各个区域判 断该区域是否是通过帧间差分编码进行的编码,并且在其输出中包含表 示该判断结果的标志;所述相似度标准是关于在所述试验性编码中把所考虑的区域用作为 预测图的区域的标志表示判定为使用帧间编码;增大所存储的值包括使该值增加固定的量。
6、 根据引用权利要求2时的权利要求4所述的方法,其中由视频编码器执行所述试验性编码,该视频编码器针对各个区域判 断该区域是否是通过帧间差分编码进行的编码,并且在其输出中包含表示该判断结果的标志;所述相似度标准是关于在所述试验性编码中把所考虑的区域用作为预测图的区域的标志表示判定为使用帧间编码;增大所存储的值包括对该值调整等于预测余量幅度的量或者预测余 量幅度的单调函数。
7、 根据引用权利要求2时的权利要求4所述的方法,其中按照与最终编码相反的顺序执行所述试验性编码。
8、 根据权利要求7所述的方法,其中由视频编码器执行所述试验性编码,该视频编码器针对各个区域判 断该区域是否是通过帧间差分编码进行的编码,并且在其输出中包含表 示该判断结果的标志;所述相似度标准是关于所考虑的区域的标志表示判定为使用帧间编码;增大所存储的值包括使该值增加固定的量。
9、 根据权利要求7所述的方法,其中由视频编码器执行所述试验性编码,该视频编码器针对各个区域判 断该区域是否是通过帧间差分编码进行的编码,并且在其输出中包含表 示该判断结果的标志;所述相似度标准是关于所考虑的区域的标志表示判定为使用帧间编码;增大所存储的值包括对该值调整等于预测余量幅度的量或者预测余 量幅度的单调函数。
10、 根据前述任一权利要求所述的方法,其中对于个体的图像元素 生成所述预测能力的度量,并对该度量求平均以获取区域的单个度量。
全文摘要
利用预测编码对视频信号进行编码。根据预测能力的度量而改变所应用的量化程度,思想是对作为其他图像的预测图有用的图像值得好好编码。在对这些图像的预分析中形成这些度量,以对于所分析的各个宏块,得到取决于该宏块与其所作为潜在预测图的区域之间的相似度的度量。优选的是,这些度量是累积的。
文档编号H04N7/26GK101411200SQ200780011219
公开日2009年4月15日 申请日期2007年4月3日 优先权日2006年4月3日
发明者斯蒂芬·克利福德·阿普尔比, 迈克尔·埃尔林·尼尔森 申请人:英国电讯有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1