运动估计方法

文档序号:7576617阅读:466来源:国知局
专利名称:运动估计方法
技术领域
本发明涉及一种运动估计方法。尤其涉及一种获取运动矢量的运动估计方法,本方法采用变化比特率技术取得更好、更高的图像数据压缩比。
通常,大量的视频数据需要数字化处理以产生数字图像并显示多维特性。因此,为了处理数字图像和相应的大量数据、传输和存储处理过的数字图像,就需要数据压缩.压缩技术的实现依赖于用于传输的通讯线路的带宽和存储数据的存储介质的容量。
运动图像(即,数字图像数据)的压缩标准是国际标准化组织。国际电子技术委员会(IOS-IEC)的JTC1/SC29。它由运动图像专家组(MPEG)开发。另外,国际电信联盟。电信标准分部(ITU-T)正在进行基于为未来B-ISDN上传输图像的ATM协议的视频编码标准的研究,并且最近推荐了几个H.26X标准。H.26X标准中的H.263适用于低比特率通信的视频编码,并可用于如视频会议系统这样的设备。
依据H.263标准,在传输一系列图像时,以预定时间间隔采样图像并将采样的图像同时以帧内模式和帧间模式编码。
为去除时间的冗余,使用了一种块匹配算法的运动估计方法(在时间轴方向上的运动补偿编码)。用这种块匹配算法,每一帧都被分成一些预定大小的宏块,并产生一个与前面的和当前的帧具有相似图像的候选块。然后,对运动矢量和候选块与相应块之间的差进行编码。
通常,在估计最大块匹配性的运动矢量时,用具有最小估计函数值的块作候选块。这里的估计函数可以是绝对差的和函数(SAD)或绝对差的均方函数(MAE)。SAD=ΣxΣy|f(x,y)-fi(x,y)|]]>MAE=1MNΣxMΣyN[f(x,y)-fi(x,y)]2]]>式中f和fi分别代表当前帧和前一帧的信号大小,M和N代表水平方向与垂直方向上块中排列的象素点数。
同时,为了提高运动矢量编码的编码率,减小数据量,仅对由预定的预测方法在相邻块间选出的一块和相应块之间的差进行编码。


图1示出H.263标准推荐的运动矢量预测方法。图1中,MV表示当前块的运动矢量。代表候选的预测项的标号MV1,MV2和MV3分别代表前一块的运动矢量、上方一块的运动矢量,和右上方块的运动矢量。一个预测项是在这些候选预测项中通过使用中值滤波计算中值产生的。只有当前块的运动矢量与预测项之差被编码并传输。所以,由于相邻块运动矢量间的差异很小,即使对于给定象16×16的当前块运动矢量MV的自(-16,0),(0,-16)到(16,-16)形成的范围,经上述的预测编码也能减小变长编码和传输所需的数据量。
图2是一个H.236标准视频信号源编码器的示意图。参考图2,信号源编码器包括如下部分减法器10,用以在输入的视频信号中减去逆DCT变换器20的输出;选择器12,根据量化控制器22产生的控制信号来选择减法器10的输出或逆DCT变换器20的输出;DCT变换器14,对选择器12的输出进行DCT变换;量化器16,量化DCT变换器14的输出并为变换系数生成一个量化指数;逆量化器18,为估计编码对量化器16的输出进行逆量化;逆DCT变换器20,对逆量化器18的输出实施逆DCT变换;量化控制器22,控制量化器16的量化并产生控制信号来控制选择器12;选择器12,选择帧内编码或帧间编码和量化器指数。
逆DCT变换器20的输出连接到加法器26的第一输入。加法器26的另一输入连接第二选择器28的输出。加法器26的输出连接到具有运动补偿可变延迟的图像存储器24的输入。存储器24的另一输入连接输入视频信号。存储器的输出包括运动矢量,且与减法器10和选择器28的输入连接。
控制器22包括控制输出信号,如帧内/帧间编码的标志和指示传输的标志。
然而,基于SAD和MAE函数的块匹配方法有许多问题。如图2所示,假定运动矢量为(-16,-16)时,最小的SAD为N,且在运动矢量为(0,0)时SAD为M,则依据SAD或MAE的块匹配方法当前宏块的运动矢量为(-16,-16)。然而,如果M比N稍大,则选择运动矢量(-16,-16)将导致比选择运动矢量(0,0)更低效的压缩比。
而且,因为传统方法不考虑运动矢量间差的编码率和误差关系,它也是低效的。
因此,针对前述现有技术的问题和缺点,本发明的目的在于提供一种运动估计方法,在采用基于H.263标准的视频编码器的情况下,通过在比特率允许的范围内选择运动矢量来最大限度地提高压缩比,以更高效地压缩数据。
为达到本发明的上述及其它目的,在所提供的运动估计方法中,将每一图像帧分为预定数量的宏块,在前一帧的诸相近宏块中挑一候选宏块,运动矢量和当前宏块与候选宏块的差被编码。具体地,运动估计方法包括以下步骤(a)获取一个使预定误差函数最小的运动矢量(x0,y0),(b)选一个运动矢量(x,y),(c)计算(x0,y0)与(x,y)之差(x-diff,y-diff),(d)计算用以对x-diff和y-diff编码的所需位数,(e)根据位数确定一个基于偏移量模型的偏移量,(f)用偏移量与成本函数值的差计算最终成本函数值,(g)将最终成本函数值与预定的极值比较,(h)如果(g)中的最终成本函数值比预定极值小,则将此成本函数值设为预定极值,并将候选的运动矢量(x,y)设置为当前宏块的运动矢量,(i)如果(g)中的最终成本函数值不小于预定极值,则放弃候选的运动矢量(x,y)。
通过参考附图对本发明的优选实施例的详细描述,将更清楚地了解本发明的上述目的和优点。附图中图1示出H.263标准建议的运动矢量预测方法。
图2为H.263标准的视频源编码器的示意图。
图3为本发明的优选实施例的运动估计方法示意图。
图4为本发明的优选实施例的运动估计方法流程图。
理论上,编码率与误差是相互关联的指标,通常是在一确定的编码率指标下给出误差量,或在一确定的误差量指标下给出可能的编码率。
本发明中,二者关系符合拉格朗日成本函数(1agrangian cost function),如下式J=D+λR=Dλ(Rmv+Rres) ……(2)式中,J表示容许的误差。D表示被编码(包括DCT变换和量化)和被解码(包括逆变换和逆量化)帧的误差。在本发明中,前述SAD或MAE值可作为D。变量Rmv表示用于编码运动矢量的位数,Rres表示计入量化和逆量化后误差而增加的位数。符号λ称作拉格朗日因子(Lagrangian multiplier),对应于编码率-误差曲线的斜率。由于编码率与误差量成反比,λ为负值。
在本发明中,在给定的容许误差J下可得到具有最大压缩比的运动矢量。
下面,参考图3和图4描述一下本发明的优选实施例。图3示意了本发明优选实施例的运动估计方法,图4为本发明的运动估计方法流程图。
在步骤S40中,假定一个最佳运动矢量(x,y),此矢量是在16×16块中于(-16,-16)和(16,16)间任意选出的,并且最好是图1中的MV1,MV2,MV3中的一个。然后,在步骤S42中,根据H.263标准获取一个基于SAD函数的运动矢量(x0,y0)。
在步骤S44中,计算出(x,y)与(x0,y0)的差(x-diff,y-diff)。这些值被送到查询表以确定对这些值进行熵编码(entropy-coding)的所需位数。步骤S46中,查询表输出x-diff和y-diff编码所用的位数预算b-x和b-y。
然后,在步骤48,用b-x和b-y确定加到成本函数J上的偏移量。如图3所示,偏移值是由偏移模型和根据本发明应用而采用的作为偏移模型的高斯函数或平方高斯函数或其它函数(例如,线性函数)的纵轴左边部分或右边部分而得到的。偏移模型的横轴表示位数预算信息,即b-x和b-y,其纵轴表示偏移值。通常,偏移值在50到100间变化,其单位和意义与成本函数值的相同。在步骤S50中,成本函数值J减去偏移量,得到最终的成本函数值J′。
在步骤S52中,确定最终的成本函数值J′是否比预定容限SAD min小。如果成本函数值小于该容限值,则进入步骤S54,当前所选运动矢量(x,y)就作为当前宏块的运动矢量,并且SAD min被更新为J′。如果成本函数值不小于该容限,则进入步骤S56,所选(x,y)被放弃。
重新假定一最佳运动矢量(x,y),重复执行步骤S42到S56。在给定误差量的前提下,重复几次相同程序,比如两次或三次,将得到一个更小的运动矢量。
如上所述,根据本发明的运动估计方法,用试探法选择小的运动矢量,可以在传统H.263标准中的编码率-误差关系所确定的编码率容限内提高压缩比。
既然在ITU-T所推荐的H.263标准中,运动矢量的寻找方法没有确定,而是由使用者自行选择,上文所描述的运动估计方法可与H.263标准兼容。
已在这里展示和描述了一个新的能达到所要求目的与优点的运动估计方法。然而,参照优选实施例的详细说明和附图,对本领域的技术人员而言,很明显可对其做许多变更、修改、变化和其它应用与使用。所有这些不脱离本发明的范围与本质的变更、修改、变化和使用及应用理应仅由下述权利要求书限定的本发明所覆盖。
权利要求
1.一种数据压缩方法,包括以下步骤将每一图像帧分成预定数量的宏块,从前一帧的各相近宏块中选出一个候选宏块,将一运动矢量和所述候选宏块与当前宏块之间的差编码,所述方法还包括一种运动估计方法,该运动估计方法包括以下步骤(a)取得使预定误差函数最小的运动矢量(x0,y0);(b)假定一个最佳运动矢量(x,y);(c)计算(x0,y0)和(x,y)的差(x-diff,y-diff);(d)得到编码所述x-diff和y-diff所需的位数;(e)根据所述位数基于一偏移模型确定一偏移量;(f)用比较成本函数值和偏移量的方法获得最终的成本函数值;(g)比较所述最终成本函数值和预定容限;(h)如果所述步骤(g)中所述的成本函数值小于所述容限值,则用所述成本函数值更新所述容限,并且设置所述假定的运动矢量(x,y)为当前宏块的运动矢量。(i)如果在所述步骤(g)中所述成本函数值不小于所述容限值,则放弃所述假定的运动矢量(x,y)。
2.如权利要求1所述的方法,其中所述步骤(b)包含如下步骤选择前一块、上方一块和右上方一块的运动矢量之一。
3.如权利要求1所述的方法,其中所述误差函数是由下式确定的绝对差的和函数(SAD);SAD=ΣxΣy|f(x,y)-fi(x,y)|]]>这里,f与fi分别代表当前帧与前一帧的信号大小。
4.如权利要求1所述的方法,其中所述误差函数是由下式确定的绝对差的均方函数(MAE);MAE=1MNΣxMΣyN[f(x,y)-fi(x,y)]2]]>这里,f和fi分别代表当前帧和前一帧的信号大小,M和N分别代表每一块中横轴方向和纵轴方向的象素点数。
5.如权利要求1所述的方法,其中所述偏移模型是线性模型。
6.如权利要求1所述的方法,其中所述偏移模型为高斯函数。
7.如权利要求1所述的方法,其中所述偏移模型为平方高斯函数。
全文摘要
一种在图像压缩中使用变化比特率技术确定运动矢量的运动估计方法,可以成功地提高压缩比。它包括步骤:获取使预定误差函数最小的运动矢量(x
文档编号H04N7/26GK1219825SQ9810363
公开日1999年6月16日 申请日期1998年1月7日 优先权日1997年3月5日
发明者朴东植, 约翰·维拉塞纳, 陈风 申请人:三星电子株式会社, 加利福尼亚大学董事会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1