用于降低除法运算要求的数字视频编码的可变准确度图像间定时规定的方法与装置的制作方法

文档序号:6419579阅读:184来源:国知局
专利名称:用于降低除法运算要求的数字视频编码的可变准确度图像间定时规定的方法与装置的制作方法
技术领域
本发明涉及多媒体压缩系统的领域。尤其是,本发明公开了规定可变准确度图像间定时的一些方法和系统,这降低了对处理器密集的除法运算的要求。
背景技术
基于数字的电子媒体格式是大规模地替代模拟电子媒体格式的最后一股潮流。很久以前,数字压缩磁盘(CD)就代替了模拟的乙烯基记录材料。模拟式的卡型盒式磁带正变得越来越少。第二和第三代数字音频系统,如小型磁盘和MP3(MPEG音频-层3)现在正分享第一代数字音频格式的压缩磁盘的市场份额。
在过渡到数字存储和数字传输格式方面,视频媒体格式已经慢于音频媒体。采用数字视频格式的速度较慢的原因很大程度是由于以数字形式准确表示可接受质量的视频所要求的数字信息量太大,以及压缩视频编码所需要的快速处理能力。准确表示视频所需的大量数字信息要求非常高容量的数字存储系统和高带宽传输系统。
但是,现在视频正迅速地过渡到数字存储和传输格式。更快的计算机处理器,高密度存储系统,新的有效压缩和编码算法最终使数字视频传输和存储能以消费者可接受的价格使用。DVD(数字通用光盘),一种数字视频系统,在过去几年已成为最好卖的消费类电子产品之一。DVD已迅速取代视频磁带录像机(VCR)作为预先录制视频重放系统的首选,这是由于其高的视频质量,很高的音频质量,方便性以及其它特点。老的模拟NTSC(国家电视标准委员会)视频传输系统当前正处于被数字ATSC(先进电视标准委员会)视频传输系统所替代的过程中。
计算机系统已使用各种不同的数字视频编码格式好多年。特别是,计算机系统已采用不同的视频编码器/解码器方法,以分别对数字视频进行压缩与编码,或解压缩与解码。在硬件或软件中应用的视频编码器/解码器方法通常被称为“CODEC”。
在计算机系统所使用的最好的数字视频压缩和编码系统中,是由运动图像专家组,通常所称的首字母简略词MPEG所支持的数字视频系统。三个最常见的和广泛使用的MPEG数字视频格式是简单地称为MPEG-1,MPEG-2和MPEG-4。视频CD(VCD)和早期消费级的数字视频编辑系统利用早期的MPEG-1数字视频编码格式。数字通用光盘(DVD)和Dish Network牌的直播卫星(DBS)电视广播系统利用更高质量的MPEG-2数字视频压缩和编码系统。MPEG-4编码系统正迅速地由基于最新的计算机的数字视频编码器和相关数字视频播放器所采用。
MPEG-2和MPEG-4标准压缩了一系列视频帧或视频场,然后将这些压缩的帧或场编码为数字比特流。当用MPEG-2和MPEG-4系统对视频帧或视频场编码时,视频帧或视频场被划分为像素块的矩形网格。每个像素块是独立地被压缩和编码。
当压缩一个视频帧或视频场时,MPEG-4标准可将帧或场压缩为三种类型的压缩帧或场之一帧内(I-帧),单向预测帧(P-帧)或双向预测帧(B-帧)。帧内是完全独立地对一个独立视频帧编码,而不参考其它视频帧。P-帧参照单个先前显示的视频帧来定义一个视频帧。B-帧既参考在当前帧之前显示的视频帧又参考在当前帧之后显示的视频帧来定义一个视频帧。由于其高效利用了冗余视频信息,P-帧和B-帧通常提供最好的压缩。

发明内容
本发明公开了执行视频编解码器中的运动估算的一种方法和装置。特别是,本发明公开了一种系统,它以十分有效的方式迅速计算估计的运动向量,而不要求过多数量的除法运算。
在一个实施例中,第一视频图像与第二视频图像之间的第一显示时间差乘以两个标度值的幂来确定第一被乘数。该步骤成比例放大了一个比率的分子。下面,通过以所述第二视频图像与第三个视频图像之间的第二显示时间差除该成比例的分子,系统确定一个成比例的比率。该成比例的比率然后被存储,在下面用于计算运动向量估算。通过存储该成比例的比率,以良好精确性迅速地计算出所有估算的运动向量,这是因为成比例的比率保存了重要的位数,通过简单移位进行比例的降低,因而消除了费时的除法运算的需要。
结合附图和下文的详述,本发明的其它目标,特点和优点会更加明显。


根据下文中的详细描述,本发明的其它目标,特点和优点对专业人士将是明显的,其中图1表示一个可能的数字视频编码器系统的一个高级框图;图2表示按图像应被显示的顺序的一系列视频图像,其中连接不同图像的箭头指示了利用运动补偿所创建的图像间的相关性;图3表示图2中以图像的优选传输顺序列出的视频图像,其中连接不同图像的箭头指示了利用运动补偿所创建的图像间的相关性;图4图解地表示了一系列的视频图像,其中相互参考的视频图像之间的距离是被选定为2的幂。
具体实施例方式
公开了一种方法和系统,用于规定对除法运算降低了要求的多媒体压缩和编码系统中的可变准确度图像间定时。在下面描述中,为了进行解释的目的,提出了特定的术语,以提供对本发明的全面理解。但是,对专业人士显而易见的是,为实施本发明,并不要求这些特定的细节。例如,参考MPEG多媒体压缩和编码系统来描述本发明。但是,这些同样的技术可容易地应用于其它类型的压缩和编码系统。
多媒体压缩和编码概述图1表示业界广泛熟悉的一个典型数字视频编码器100的一个高级框图。数字视频编码器100在框图的左侧接收一个视频帧105的输入视频流。数字视频编码器100把每个视频帧分成像素块的网格。像素块可被单独地压缩。不同的视频编码系统可使用各种不同大小的像素块。例如,不同像素块分辨率包括8×8,8×4,16×8,4×4,等等。此外,像素块有时被称为“宏块”。本文件将使用术语像素块来表示任何大小的任何像素块。
离散余弦变换(DCT)单元110处理视频帧中的每个像素块。该帧可被独立地处理(帧内)或参考从运动补偿单元接收的其它帧的信息来处理(帧间)。下面,量化器(Q)单元120量化来自离散余弦变换单元110的信息。最后,量化的视频帧利用熵编码器(H)单元180来编码,以产生一个编码比特流。熵编码器(H)单元180可利用可变长度编码(VLC)系统。
由于帧间编码视频帧是参考其它邻近的视频帧被定义,数字视频编码器100需要创建每个解码帧将在数字视频解码器内如何出现的副本,以使帧间可被编码。因而,数字视频编码器100的较低部分实际上是一个数字视频解码器系统。尤其是,反量化器(Q-1)单元130反转视频帧信息的量化,反离散余弦变换(DCT-1)单元140反转视频帧信息的离散余弦变换。在所有DCT系数从反离散余弦变换(DCT-1)单元140被重建后,运动补偿单元将利用该信息,与运动向量一起,来重建编码视频帧。然后重建的视频帧被用作随后帧的运动估算的参考帧。
然后,该解码视频帧可用来对相对解码视频帧中的信息而被定义的帧间(P-帧或B-帧)进行编码。尤其是,运动补偿(MC)单元150和运动估算(ME)单元160被用来确定运动向量和产生用以对帧间编码的差分值。
速率控制器190接收来自数字视频编码器100的多个不同部分的信息,利用该信息为每个视频帧分配比特预算。速率控制器190应该以这样的方式分配比特预算,即产生遵守规定的限制条件的最高质量的数字视频比特流。特别是,速率控制器190试图产生最高质量压缩的视频流,而不溢出缓冲器(通过发送超过可被存储的更多信息使得超过视频解码器中可用的内存量),或不下溢缓冲器(不足够快地发送视频帧,以使视频解码器用完用于显示的视频帧)。
利用像素块的数字视频编码在一些视频信号中,连续视频图像(帧或场)之间的时间可以不是恒定的。(注意本文件将使用术语视频图像来通常表示视频帧或视频场)。例如,一些视频图像因为传输带宽限制而被丢掉。而且,视频定时也由于相机不规则性或特殊效果,如慢动作或快动作而变化。在一些视频流中,通过设计,初始视频流可简单地具有非一致的图像间时间。例如,如计算机图形动画的合成视频可具有非一致的定时,因为没有任意的视频定时是由如视频相机系统的一致的定时视频捕捉系统所利用。一个灵活的数字视频编码系统应能够处理非一致的视频图像定时。
如上所述,多数数字视频编码系统把视频图像分成像素块的矩形网格。视频图像中的每个单独的像素块被独立地压缩和编码。一些视频编码标准,如ISO MPEG或ITU H.264,利用不同类型的预测像素块来对视频图像编码。在一种情况下,像素块可以是下面三种类型之一1、I-像素块——一个内部(I)像素块在其编码中不利用任何其它视频图像的信息(它完全是自定义的);2、P-像素块——一个单向预测(P)像素块指的是来自前一个视频图像的图像信息;或3、B-像素块——一个双向预测(B)像素块利用来自前一个图像和后一个图像的信息。
如果视频图像中的所有像素块是内部像素块,则视频图像是一个帧内。如果一个视频图像只包括单向预测宏块或内部像素块,则视频图像被称为P-帧。如果视频图象包含任何双向预测像素块,则视频图像被称为B-帧。为了叙述的简明,本文件将考虑一个给定图像内的所有像素块都是相同类型的情况。
要被编码的视频图像的一个示例序列可被表示为I1B2B3B4P5B6B7B8B9P10B11P12B13I14…其中字母(I,P或B)表示视频图像分别是I-帧,P-帧或B-帧,数字表示在视频图像的序列中的视频图像的相机顺序。相机顺序是相机记录视频图像的顺序,因而也是视频图像应被显示的顺序(显示顺序)。
上一个视频图像的示例序列被图形化地表示在图2中。参考图2,箭头表示来自一个存储图像的像素块(该情况下是I帧或P帧)被用在其它图像的运动补偿预测中。
在图2的情况下,在帧内视频图像I1的编码中不利用来自其它图像的信息。视频图像P5是一个P帧,在其编码中利用在前的视频图像I1的视频信息,这样箭头是从视频图像I1到视频图像P5。视频图像B2,视频图像B3,视频图像B4在其编码中全都利用了来自视频图像I1和P5的信息,这样箭头是从视频图像I1和视频图像P5到视频图像B2,视频图像B3和视频图像B4。如上所述,图像间时间一般是不相同的。
由于B-图像利用来自后面图像的信息(将在稍后的时间显示的图像),传输顺序通常是不同于显示顺序。特别是,需要构成其它视频图像的视频图像应首先被传输。对于上述顺序,传输顺序可以是I1P5B2B3B4P10B6B7B8B9P12B11I14B13…图3图解地表示了来自图2的视频图像的前述的传输顺序。此外,图中的箭头表示来自一个存储的视频图像的像素块(该情况中是I或P)被用于其它视频图像的运动补偿预测中。
参考图3,系统首先传送不依靠任何其它帧的I-帧I1。下一步,系统传送依靠视频图像I1的P-帧视频图像P5。下一步,系统传送视频图像P5之后的B-帧视频图像B2,尽管视频图像B2将在视频图像P5之前显示。其原因是,当对视频图像B2解码时,解码器将已经收到和存储对视频图像B2解码所必需的视频图像I1和P5中的信息。同理,视频图像I1和P5已准备用于对随后的视频图像B3和视频图像B4解码。接收器/解码器记录视频图像正确显示的顺序。在该操作中,I和P图像常常被称为是存储的图像。
P-帧图像的编码典型地利用了运动补偿,其中为图像中的每个像素块计算一个运动向量。利用计算的运动向量,在上述前面的图像中通过像素的转换,可形成一个预测像素块(P-像素块)。P-帧图像中的实际像素块与预测像素块之间的差别然后可被编码,用于传输。
P-图像P-图像的编码典型地利用了运动补偿(MC),其中为当前图像中的每个像素块计算一个指向前面图像中的一个位置的运动向量(MV)。利用运动向量,通过转换上述前面图像中的像素,可形成一个预测像素块。P-图像中的实际像素块与预测像素块之间的差别然后可被编码,用于传输。
每个运动向量也可通过预测编码而被传输。例如,利用邻近的运动向量可以形成一个运动向量预测。在这样的情况下,实际运动向量与运动向量预测之间的差别则可被编码,用于传输。
B-图像每个B-像素块利用2个运动向量参考上述前面的视频图像的第一运动向量,和参考以后的视频图像的第二运动向量。从这两个运动向量,计算出两个预测像素块。利用一些函数,两个预测的像素块然后合并在一起,形成最后的预测像素块。如上所述,B-帧图像中的实际像素块与最后预测像素块之间的差别则被编码,用于传输。
如同利用P-像素块,B-像素块的每个运动向量(MV)可通过预测编码被传输。特别是,利用邻近的运动向量形成一个预测的运动向量。然后,实际运动向量与预测运动向量之间的差别可被编码,用于传输。
但是,利用B-像素块,存在着从最近存储的图像像素块中的运动向量内插运动向量的机会。这样的运动向量内插可同时在数字视频编码器和数字视频解码器中执行。
该运动向量内插特别适用于相机慢慢摇镜头越过一个静止背景时的视频序列中的视频图像。实际上,这样的运动向量内插可能已足够好地被单独使用。特别是,这意味着不需要为利用内插编码的这些B-像素块运动向量,计算或传输差分信息。
为了更深入地说明,在上面的情况下,让我们把图像i与j之间的图像间显示时间表示为Di,j,即,如果图像的显示时间分别是Ti和Tj,则
Di,j=Ti-Tj从此可得出Di,k=Di,j+Dj,kDi,k=-Dk,i注意,在某些情况下,Di,j可能是负的。
因而,如果MV5,1是参照I1的P5像素块的一个运动向量,则对于B2,B3和B4中的相应像素块,参照I1与P5的运动向量将分别以下列等式被内插,MV2,1=MV5,1*D2,1/D5,1MV5,2=MV5,1*D5,2/D5,1MV3,1=MV5,1*D3,1/D5,1MV5,3=MV5,1*D5,3/D5,1MV4,1=MV5,1*D4,1/D5,1MV5,4=MV5,1*D5,4/D5,1注意,由于显示时间的比率是用于运动向量预测,所以不需要绝对显示时间。因而,相对显示时间可用于Di,j图像间显示时间值。
至于H.264标准中的示例,该情况可被一般化。在进行一般化时,P或B图像可利用任何先前传输的图像,以进行其运动向量预测。因而,在上述情况下,图像B3可在其预测中利用图像I1与图像B2。此外,运动向量可被外插,而不仅仅是内插。因而,在该情况下我们可得到MV3,1=MV2,1*D3,1/D2,1这样的运动向量外插(或内插)也可用于运动向量的预测编码的预测过程中。
图像间显示时间的编码视频序列的可变图像间显示时间应以一种方式被编码和传输,即可以使获得很高的编码效率和具有可选择的准确度成为可能,以满足视频解码器的要求。理想的是,编码系统应简化解码器的任务,以使相对简单的计算机系统能对数字视频进行解码。
在大量不同的视频编码系统中潜在地需要可变图像间显示时间,以计算差分运动向量,直接模式运动向量,和/或隐含B预测块加权(Implicit B Prediction Block Weighting)。
视频序列中可变图像间显示时间的问题是与时间基准的使用相交织。理想的是,视频CODEC中输出的图像中的正确像素值的推导应独立于该图像被解码或显示的时间。因此,定时问题和时间参考应在CODEC层之外被解决。
同时存在着与编码有关的和与系统有关的原因,作为所希望的时间独立的基础。在视频CODEC中,使用时间参考有两个目的(1)建立参考图像选择的一个排序;和(2)在图像间插入运动向量。
为建立参考图像选择的一个排序,可以简单地发送一个相对位置值。例如,解码顺序中的帧位置N与显示顺序中的帧位置M之间的差别,即N-M。在这样的实施例中,将不需要时间标记或其它时间参考。为了插入运动向量,如果瞬时距离与内插距离有关,则瞬时距离将是有用的。但是,如果运动是非线性的,这可能不正确。因此,发送除了运动向量内插的瞬时信息之外的参数似乎更合适。
根据一些系统,人们可以希望典型的视频CODEC是较大系统的一部分,其中视频CODEC与其它视频(和音频)CODEC共存。在这样的多CODEC系统中,良好的系统分层和设计要求通用的功能(这可以在逻辑上独立于CODEC,如定时)是由CODEC之外的层来处理。系统进行的,而不是由每个CODEC独立地进行的定时管理对于获得通用功能的持续处理,如同步是关键的。例如,在同时处理超过一个数据流,如视频/音频的表现的系统中,定时调节通常在这些数据流内需要,以保持不同的数据流同步。同理,在处理具有不同时钟的远程系统的数据流的系统中,可能需要定时调节以保持与远程系统的同步。利用时间标记可获得这样的定时调节。例如,时间标记可用于同步,时间标记通过“发送器报告”与发射器相连,并在每个数据流的RTP层中以RTP来提供。这些发送器报告可采取下列形式视频RTP时间标记X与参考时间标记Y校准音频RTP时间标记W与参考时间标记Z校准其中已知参考时间标记的壁钟速率,允许两个数据流同步。但是,这些时间标记参考可以为两个数据流周期性地到达,又可以单独地到达,这些参考可以引起两个数据流的一些所需要的重新校准。这一般是通过调节视频流来获得,以匹配音频,反过来也如此。时间标记的系统处理应该不影响被显示的像素值。更一般地,瞬时信息的系统处理应在CODEC之外被执行。
一个特殊示例如上段中所述,在非一致的图像间时间的情况下的问题是以有效的方式传送图像间显示时间值Di,j到数字视频接收器。完成这一目标的一种方法是使系统传送第一图像之后每个图像的当前图像与最近传输的存储图像之间的显示时间差。为了错误恢复能力,传输可以在图像内重复几次。例如,显示时间差可以在MPEG或H.264标准的片段头(slice header)中重复。如果全部的片段头丢失,则解码信息依靠丢失图像的其它图像可能也不能被解码。
因而,参考上段中的示例,系统将传送下列图像间显示时间值D5,1D2,5D3,5D4,5D10,5D6,10D7,10D8,10D9,10D12,10D11,12D14,12D13,14…为了进行运动向量估算,图像间显示时间Di,j的准确度要求可能随不同的图像而变化。例如,如果只有单个的B-帧图像B6在两个P-帧图像P5与P7之间的一半,则它只足够发送D7,5=2和D6,7=-1其中图像间显示时间值Di,j是相对时间值。
替换地,如果视频图像B6只在视频图像P5与视频图像P7之间距离的四分之一,则发送的适当的图像间显示时间值Di,j将是D7,5=4和D6,7=-1注意,在上述两个示例中,视频图像B6与视频图像P7之间的显示时间(图像间显示时间D6,7)被用作显示时间“单位”值。在最近的示例中,视频图像P5与视频图像P7之间的显示时间差(图像间显示时间D6,7)是4倍的显示时间“单位”(4*D6,7)。
提高解码效率总之,如果除数是2的幂,运动向量估计计算将极大地简化。如果两个存储图像之间的Di,j(图像间时间)被选择是2的幂,如在图4中所示,这种简化在我们的实施例中可容易地获得。可替代地,估计的过程可被定义为把所有除数舍位或四舍五入成为2的幂。
在图像间时间可以是2的幂的情况下,如果只有(2的)整数幂被传输,而不是图像间时间的全部值,则可降低数据比特的数量。图4图解地表示了图像间距离被选择为2的幂的情况。在这种情况下,视频图像P1与视频图像P3之间的D3,1显示时间值2是作为1(由于21=2)被传输,视频图像P7与视频图像P3之间的D7,3显示时间值4是作为2(由于22=4)被传输。
可替代地,外插操作的运动向量内插可以近似于任何所希望的准确度,这是以分母是2的幂的方法来缩放比例。(利用分母中2的幂,通过简单地在被除的值中移位,来执行除法。)例如,D5,4/D5,1~Z5,4/P其中值P是2的幂,Z5,4=P*D5,4/D5,1被四舍五入或舍位成为最接近的整数。P的值可被周期性地传输,或设定为系统的常数。在一个实施例中,P的值可设定为P=28=256。
该方法的优点的是,解码器对每个图像只需要计算Z5,4一次,或在许多情况下,解码器可以预先计算,和存储Z值。这允许解码器避免不得不为图像中的每个运动向量而被D5,1除,这样,可以更有效率地进行运动向量内插。例如,正常的运动向量计算将是MV5,4=MV5,1*D5,4/D5,1但如果我们计算和存储Z5,4,其中Z5,4=P*D5,4/D5,1,则MV5,4=MV5,1*Z5,4/P但由于P值已被选择是2的幂,被P除的除法只是简单的位移。因而,一旦为视频图像计算出Z值,只需要单次的乘法和单次的移位,来计算以后像素块的运动向量。而且,系统可通过执行最后一次的所有除法来保持高的准确度,这样重要的位在计算过程中将不丢失。以这种方式,解码器可以执行与编码器完全相同的运动向量内插,因而避免了有可能产生的任何不匹配问题。
由于除法(除了2的幂的除法以外)对于数字计算机系统来说,比加法或乘法是一个更加密集的计算任务,该方法可极大地降低利用运动向量内插或外插的图像重建所需要的计算量。
在一些情况下,可以不使用运动向量内插。但是,仍有必需传输视频图像的显示顺序给接收器/播放器系统,以使接收器/播放器系统将以正确的顺序显示视频图像。在这种情况下,Di,j的简单带符号的整数值满足需要,而不管实际的显示时间如何。在一些应用中,只有符号(正或负)可被需要来重建图像顺序。
图像间时间Di,j可以如简单带符号的整数值被传输。但是,可应用许多方法来对Di,j值编码,以获得额外的压缩。例如,后面是可变长度编码数值的一个符号位是相对容易地来执行和提高编码效率。
可以使用的一个这样的可变长度编码系统被称为UVLC(通用可变长度编码)。UVLC可变长度编码系统是由编码字来给定1=12=0103=0114=001005=001016=001107=001118=0001000…对图像间时间编码的另一种方法可以是使用算术编码。典型地,算术编码利用了条件概率,来实现数据位的非常高的压缩。
因而,本发明介绍了一种简单但功能强大的对图像间显示时间的编码和传输方法,以及在运动向量估算中使用的那些图像间显示时间的解码方法。通过利用可变长度编码或算术编码可以使图像间显示时间的编码非常有效。而且,可以选择一个希望的准确度,以满足视频编解码的需要,而不是太高的准确度。
上面描述了一个系统,说明了多媒体压缩和编码系统中的可变准确性图像间定时。可以想象的是,普通的专业人士在不背离本发明范围的情况下可以对本发明的元件材料和配置做出改变和修改。
权利要求
1.一种在数字视频系统中执行运动估算的方法,所述方法包括通过把第一视频图像与第二视频图像之间的第一显示时间差与2的幂相乘,确定第一被乘数;通过所述第二视频图像与第三个视频图像之间的第二显示时间差除所述被乘数,确定一个成比例的比率;和存储所述成比例的比率,用于计算运动向量估算。
2.如权利要求1所述的在数字视频系统中执行运动估算的方法,所述方法进一步包括通过把所述成比例的比率和与所述第一视频图像相关联的运动向量相乘,确定成比例的运动向量。
3.如权利要求2所述的在数字视频系统中执行运动估算的方法,所述方法进一步包括由所述2的幂除所述成比例的运动向量。
4.如权利要求3所述的在数字视频系统中执行运动估算的方法,其中所述除是通过对所述成比例的运动向量移位来执行。
5.如权利要求1所述的在数字视频系统中执行运动估算的方法,其中所述2的幂包括200和56。
6.如权利要求1所述的在数字视频系统中执行运动估算的方法,其中所述2的幂通过通信信道周期性地被传输。
7.如权利要求1所述的在数字视频系统中执行运动估算的方法,其中所述通过除确定所述成比例的比率对每个视频图像只进行一次。
8.如权利要求1所述的在数字视频系统中执行运动估算的方法,其中所述成比例的比率被舍位。
9.如权利要求1所述的在数字视频系统中执行运动估算的方法,其中所述成比例的比率被四舍五入到一个最近似的整数。
10.如权利要求1所述的在数字视频系统中执行运动估算的方法,其中所述2的幂包括一个常数。
11.一种计算机可读介质,所述计算机可读介质包括用来执行运动估算的一组计算机指令,所述的一组计算机指令组实现一组步骤,包括通过把第一视频图像与第二视频图像之间的第一显示时间差与2的幂相乘,确定第一被乘数;通过所述第二视频图像与第三个视频图像之间的第二显示时间差除所述被乘数,确定一个成比例的比率;和存储所述成比例的比率,用于计算运动向量估算。
12.如权利要求11所述的计算机可读介质,其中所述计算机指令进一步执行下列步骤通过把所述成比例的比率和与所述第一视频图像相关联的运动向量相乘,确定成比例的运动向量。
13.如权利要求12所述的计算机可读介质,其中所述计算机指令进一步执行下列步骤由所述2的幂除所述成比例的运动向量。
14.如权利要求13所述的计算机可读介质,其中所述除是通过对所述成比例的运动向量移位来执行。
15.如权利要求11所述的计算机可读介质,其中所述2的幂包括200和56。
16.如权利要求11所述的计算机可读介质,其中所述2的幂通过通信信道周期性地被传输。
17.如权利要求11所述的计算机可读介质,其中所述通过除确定所述成比例的比率对每个视频图像只进行一次。
18.如权利要求11所述的计算机可读介质,其中所述成比例的比率被舍位。
19.如权利要求11所述的计算机可读介质,其中所述成比例的比率被四舍五入到一个最近似的整数。
20.如权利要求11所述的计算机可读介质,其中所述2的幂包括一个常数。
全文摘要
本发明公开了在数字视频系统中执行运动估算的一种方法和装置(图1)。特别是,本发明公开了一个系统,它以十分有效的方式迅速计算估计的运动矢量(图1,160项)。在一个实施例中,通过第一视频图像与第二视频图像之间的第一显示时间差乘以两个标度值的幂来确定第一被乘数(图1,150项,160项)。该步骤成比例放大了一个比率的分子(图1,120项)。下面,通过以所述第二视频图像与第三视频图像之间的第二显示时间差除该放大的分子,系统确定一个成比例的比率。该成比例的比率然后被存储,用于计算运动矢量估算。通过存储该成比例的比率,以良好精确性迅速地计算出所有估算的运动矢量,这是因为成比例的比率保存了重要的位数,通过简单移位进行比例的降低(图1,180项)。
文档编号G06T9/00GK1714572SQ03825565
公开日2005年12月28日 申请日期2003年8月7日 优先权日2002年12月6日
发明者B·G·哈斯克尔, D·W·辛格, A·杜米特拉什, A·帕里 申请人:苹果电脑有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1