运动图像编码/解码设备及方法

文档序号:7618596阅读:142来源:国知局
专利名称:运动图像编码/解码设备及方法
技术领域
本发明涉及一种运动图像的编码和解码,更具体地讲,涉及一种能够从运动图像中消除编码运动图像时出现的误差的运动图像编码/解码设备和方法。
背景技术
与包括在语音或静止图像中的数据的数量相比,包括在运动图像中的数据的数量很大。因此,需要包括存储器的较大的硬件容量来存储或传输这种大量的数据而不处理这些数据。因此,在运动图像被存储或传输之前需要使用编码器将其压缩,然后由解码器接收并再现。有两种压缩方法有损压缩和无损压缩。由于包括在运动图像中的数据的量很大,因此使用有损压缩方法来减少数据量。这种压缩方法包括MPEG-1、MPEG-2、MPEG-4、H.263、和H.264。
当使用这些压缩方法之一压缩运动图像时,在离散余弦变换(DCT)、逆DCT(IDCT)、和量化处理过程中,一些运动图像丢失(下面,称作误差)。因此,得到的运动图像与原始图像不同。

发明内容
本发明提供一种运动图像编码/解码设备和方法,其中不仅编码和解码运动图像数据而且编码和解码在运动图像数据编码和解码时产生的关于运动图像的误差信息,从而无误差地再现运动图像。
根据本发明的一方面,提供一种运动图像编码器,该编码器包括基础层编码器,接收原始图像并使用预定的有损压缩方法将原始图像编码;和加强层编码器,接收通过将编码的原始图像解码而生成的误差图像,并接收原始图像,对通过从具有误差的图像减去原始图像而得到的误差分量进行无损地熵编码(entropy-encoding)。
根据本发明的另一方面,提供一种运动图像解码器,该解码器包括基础层解码器,接收通过使用预定的有损编码方法将原始图像编码而生成的基础层比特流,并将基础层比特流解码;和加强层解码器,接收加强比特流,并对该加强比特流进行熵解码,该比特流是通过对从具有误差的图像减去原始图像而得到的误差分量进行无损地熵编码而生成的,该具有误差的图像是通过将编码的原始图像解码而生成的。
运动图像解码器还包括减法器,用于从由基础层解码器解码的基础层图像中减去由加强层解码器解码的误差分量,并输出相减的结果。
根据本发明的另一方面,提供一种运动图像编码方法,该方法包括接收原始图像并使用预定的有损编码方法将原始图像编码;和接收通过将编码的原始图像解码而生成的误差图像并接收原始图像,对通过从具有误差的图像中减去原始图像而得到的误差分量进行无损地熵编码。
根据本发明的另一方面,提供一种运动图像解码方法,该方法包括接收通过使用预定的有损编码方法将原始图像编码而生成的基础层比特流,解码该基础层比特流,并输出解码的基础层图像;接收加强比特流,并对该加强比特流进行熵解码,该加强的比特流是通过对从具有误差的图像中减去原始图像而获得的误差分量进行无损地熵编码而生成的,所述的具有误差的图像是通过对编码的原始图像解码而生成的;和从解码的基础层图像中减去熵解码的误差分量,并输出结果。


通过下面结合附图对示例性实施例进行的详细描述,本发明的上述和其他特点和优点将变得更加清楚,其中图1示出包括在运动图像中的运动图像帧;图2是传统的运动图像编码器的框图;图3是另一传统的运动图像解码器的框图;图4是根据本发明实施例的可扩展的运动图像编码器的框图;图5是根据本发明实施例的可扩展的运动图像解码器的框图;图6是根据本发明的可扩展的运动图像编码方法的流程图;和图7是根据本发明的可扩展的运动图像解码方法的流程图。
具体实施例方式
以下,参将参照附图更全面地描述本发明,其中表示了示例性实施例。然而,本发明可以以多种不同的方式实施,不应该被理解为被这里所阐述的实施例所限制,提供这些实施例是为了更彻底和完整地披露本发明,以及将本发明的概念更全面地传达给本领域技术人员。
图1示出包括在运动图像中的运动图像帧。基于运动预测技术来编码和解码运动图像数据。参照基于时间轴的前一帧或者前一帧和下一帧来进行预测。当编码或解码当前帧时所参照的帧称作参考帧。在基于块的运动图像编码中,包括在运动图像中的静止图像(帧)被分为宏块,并且宏块被分为子块。因此,在逐块的基础上预测并编码静止图像的运动。
参照图1,运动图像包括一系列的静止图像。静止图像被以图像组(GOP)分类,并且静止图像的每一个被称作帧。一个GOP包括I帧110、P帧120、和B帧130。编码I帧110不使用参考帧。另一方面,使用参考帧通过运动估计和校正来编码P帧120和B帧130。
图2是传统的运动图像编码器的框图。该运动图像编码器包括运动估计器210、运动补偿器220、离散余弦变换(DCT)执行器230、量化器240、熵编码器250、去量化器260、逆DCT(IDCT)执行器270、参考帧存储单元280、和多路复用器290。
运动估计器210搜索用于宏块的参考帧,并将参考帧的宏块中的图像的位置和当前帧的宏块中的图像的位置之间的差作为运动矢量输出。换句话说,运动估计器210在参考帧的预定搜索区域中搜索期望的宏块,寻找与期望的宏块最相似的宏块,并将图像行进的距离,即参考帧的宏块中的图像的位置与当前帧的宏块中的图像的位置之间的差,作为运动矢量输出。运动补偿器220从参考帧提取与该运动矢量相应的预测宏块,并对参考帧的预测宏块进行运动补偿。
然后,从当前帧的宏块减去被运动补偿的参考帧的预测宏块。DCT执行器230对相减的结果进行DCT变换,并输出DCT系数。量化器240将DCT系数量化,并将量化的DCT系数发送到熵编码器250。熵编码器250将量化的DCT系数编码并输出纹理信息(textual information)。多路复用器290将纹理信息和运动矢量一起多路复用,并输出编码的比特流。当当前帧是I帧时,DCT执行器230对没有运动估计和补偿的当前帧的宏块执行DCT变换,并输出DCT系数。然后,DCT系数分别被量化器240、熵编码器250、和多路复用器290量化、编码、和多路复用,最后输出为编码的比特流。
通过从当前帧的宏块减去被运动补偿的参考图像帧的宏块而获得的值被称为残值(residual value)。当编码时将残值编码以减少数据容量。由于误差出现在量化处理中,因此,生成为比特流的运动图像包含在DCT和量化处理中出现的误差。
为了获得参考帧,量化的残存信号经过去量化器260和IDCT执行器270,与被运动估计的/补偿的图像组合,并被存储在参考帧存储单元280中。当当前帧为I帧时,其经去量化器260和IDCT执行器270而具有运动补偿,然后被存储在参考帧存储单元280中。因此,存储在参考帧存储单元280中的参考帧包括具有在DCT和量化处理中出现的编码的误差的当前帧。
换句话说,假定原始图像(帧)是A,并且运动估计/补偿之后的被预测的图像(帧)是B。DCT执行器230接收原始图像和被预测的图像之间的差A-B,并DCT变换A-B。由于误差分量E在量化处理中生成,从IDCT执行器270输出的比特流是(A-B)+E。然后,被预测的图像B被添加到(A-B)+E。因此,A+E,即具有误差分量E的原始图像作为参考帧被存储在参考帧存储单元280中。
图3是传统的运动图像解码器的框图。
运动图像解码器包括运动补偿器310、IDCT执行器320、去量化器330、熵解码器340、参考帧存储单元350、和去多路复用器360。
从图2的运动图像编码器输出的编码的比特流被去多路复用器360分为运动矢量和纹理信息。运动矢量被发送到运动补偿器310,并且纹理信息被熵解码器340、去量化器330、和IDCT执行器320解码。运动补偿器310从参考帧存储单元350接收参考帧信息和来自图2的运动图像编码器的运动矢量信息,并输出预测的图像。然后,预测的图像与解码的图像组合,并且组合的图像被显示。
图4是根据本发明实施例的可扩展的运动图像编码器的框图。
可扩展的编码方法是一种运动图像编码方法。在该可扩展的编码方法中,原始图像被分为基础层图像和加强层图像并被单独地编码。当将使用可扩展的编码方法编码的比特流解码的可扩展的解码器由于网络状态或可用资源的原因只接收基础层比特流时,其将基础层比特流解码并输出图像质量降低的运动图像流。当可扩展的解码器接收基础层比特流和加强层比特流时,其将通过解码基础层比特流而生成的图像和通过解码加强层比特流而生成的图像组合,并输出高清晰度的运动图像。
参照图4,可扩展的运动图像编码器包括基础层编码器410和加强层编码器420。基础层编码器410使用一般的编码方法将运动图像编码并输出。一般的编码方法指有损编码方法,包括MPEG-1、MPEG-2、MPEG-4、和H.264编码方法。加强层编码器420从由基础层编码器410编码的图像被解码而得到的参考图像中减去原始图像,使用熵编码器编码减得的图像、生成编码的图像作为纹理信息、将纹理信息和运动矢量一起多路复用,并输出编码的比特流。
换句话说,由基础层编码器410编码的图像是A+E,即原始图像A加上误差分量E。加强层编码器420从A+E减去原始图像A,对通过从A+E减去A获得的图像进行熵编码、并仅输出误差分量E。
图5是根据本发明实施例的可扩展的运动图像解码器的框图。参照图5,运动图像解码器包括基础层解码器510、加强层解码器520、和减法器530。基础层解码器510将使用一般的编码方法编码的原始图像解码。一般的解码方法表示有损解码方法并包括MPEG-1、MPEG-2、MPEG-4、和H.264解码方法。加强层解码器520使用熵解码器将接收的误差分量比特流解码。解码的误差分量被传输到减法器530,该减法器然后从由基础层解码器510解码的原始图像中减去解码的误差分量,并仅输出不具有误差分量的原始图像。因此,由于从A+E,即原始图像A加上编码处理中生成的误差分量E,减去误差分量E,即由加强层解码器520解码的误差分量,因此,原始图像可被极好地再现,然后被显示。
图6是示出根据本发明的可扩展的运动图像编码方法的流程图。原始图像基于运动补偿、频率变换、和量化通过使用预定的有损编码方法被编码,并被输出为基础层比特流(操作S610)。所述编码方法包括MPEG-1、MPEG-2、MPEG-4、和H.264编码方法。
解码基础层比特流(操作S620)。解码的基础层比特流包含误差分量。通过从包含误差分量的解码的基础层比特流减去原始图像生成误差图像(操作S630)。仅仅误差分量被无损地熵编码并被输出为加强层比特流(操作S640)。
图7是示出可扩展的运动图像解码方法的流程图。基于运动补偿、频率变换、和量化使用预定的编码方法编码的基础层比特流被接收、解码、并被输出为解码的基础层比特流(操作S710)。接收并解码加强层比特流(操作S720),该加强层比特流是通过对从编码的基础层图像解码得到的参考图像减去原始图像而获得的误差图像进行无损熵编码而生成的。从在操作S710中获得解码的基础层图像中减去通过解码加强层比特流而获得的误差分量,并仅输出得到的不具有误差的图像(操作S730)。
上述描述的可扩展的运动图像编码和解码方法可被写为计算机程序。本领域的普通技术的计算机程序设计者可以容易的得出该计算机程序的代码和代码片段。计算机程序被记录在计算机可读记录介质上。当由计算读取并执行计算机程序时,该可扩展的运动图像编码和解码方法被实现。计算机可读记录介质包括磁记录介质、光学记录介质、和载波介质。
如上所述,本发明基于传统的运动图像编码/解码技术提供无损和可扩展的编码/解码方法,从而,提供具有期望质量的运动图像服务。
尽管已经参照示例性实施例具体表示并描述了本发明,但是本领域的技术人员应该理解,在不脱离由权利要求所限定的本发明的精神和范围的情况下,可对其进行各种形式和细节的改变。
权利要求
1.一种运动图像编码器,包括基础层编码器,接收原始图像,并使用预定的有损编码方法将原始图像编码;和加强层编码器,接收通过将编码的原始图像解码生成的具有误差的图像并接收原始图像,对通过从具有误差的图像减去原始图像而获得的误差分量进行无损地熵编码。
2.如权利要求1所述的运动图像编码器,其中,所述的有损编码方法包括MPEG-1编码方法、MPEG-2编码方法、MPEG-4编码方法、和H.264编码方法。
3.一种运动图像解码器,包括基础层解码器,接收通过使用预定的有损编码方法编码的原始图像而生成的基础层比特流,并将基础层比特流解码;和加强层解码器,接收通过将误差分量无损地熵编码而生成的加强比特流,并对加强比特流进行熵解码,所述的误差分量是通过从具有误差的图像减去原始图像获得的,所述的具有误差的图像是通过将编码的原始图像解码生成的。
4.如权利要求3所述的运动图像解码器,还包括减法器,用于从由基础层解码器解码的基础层图像减去由加强层解码器解码的误差分量,并输出相减的结果。
5.如权利要求3所述的运动图像解码器,其中,所述的有损编码方法包括MPEG-1编码方法、MPEG-2编码方法、MPEG-4编码方法、和H.264编码方法。
6.一种运动图像编码方法,包括接收原始图像,并使用预定的有损编码方法将原始图像编码;和接收通过将编码的原始图像解码而生成的误差图像,并接收原始图像,对通过从具有误差的图像减去原始图像获得的误差分量进行无损地熵编码。
7.如权利要求6所述的方法,其中,所述的有损编码方法包括MPEG-1编码方法、MPEG-2编码方法、MPEG-4编码方法、或H.264编码方法。
8.一种运动图像解码方法,包括接收通过使用预定的有损编码方法将原始图像编码而生成的基础层比特流,将基础层比特流解码,并输出解码的基础层图像;接收加强比特流,并对该加强比特流进行熵解码,该加强比特流是通过对从误差图像减去原始图像获得的误差分量进行无损地熵编码生成的,所述的误差图像是通过将编码的原始图像解码而生成的;和从解码的基础层图像减去熵解码的误差分量,并输出结果。
9.如权利要求8所述的方法,其中,所述的有损编码方法包括MPEG-1编码方法、MPEG-2编码方法、MPEG-4编码方法、或H.264编码方法。
10.一种计算机可读记录介质,记录有在计算机中执行运动图像编码方法的程序代码,该运动图像编码方法包括接收原始图像,并使用预定的有损编码方法将原始图像编码;和接收通过将编码的原始图像解码而生成的误差图像,并接收原始图像,对通过从具有误差的图像减去原始图像获得的误差分量进行无损地熵编码。
11.一种计算机可读记录介质,记录有在计算机中执行运动图像解码方法的程序代码,该运动图像解码方法包括接收通过使用预定的有损编码方法编码原始图像而生成的基础层比特流,将基础层比特流解码,并输出解码的基础层图像;接收加强比特流,并对该加强比特流进行熵解码,该加强比特流是通过对从具有误差的图像减去原始图像获得的误差分量进行无损地熵编码而生成的,该具有误差的图像是通过将编码的原始图像解码而生成的;和从解码的基础层图像减去熵编码的误差分量,并输出结果。
全文摘要
提供一种能够消除当运动图像编码时出现的误差的运动图像编码/解码设备和方法。运动图像编码器包括基础层编码器,接收原始图像,并使用预定的有损编码方法将原始图像编码;加强层编码器,接收通过将编码的原始图像解码生成的误差图像并接收原始图像,对通过从具有误差的图像减去原始图像获得的误差分量进行无损熵编码。因此,基于传统的运动图像编码/解码技术,原始运动图像可以被可扩展地和无损地编码/解码,从而,提供具有期望的质量的运动图像服务。
文档编号H04N7/26GK1703092SQ20051007224
公开日2005年11月30日 申请日期2005年5月27日 优先权日2004年5月27日
发明者金海光 申请人:学校法人大洋学园, 三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1