使用多个扫描图形的编码和解码方法及装置的制作方法

文档序号:7849220阅读:182来源:国知局
专利名称:使用多个扫描图形的编码和解码方法及装置的制作方法
技术领域
本发明涉及一种用于编码和解码图像数据的方法及装置。更具体而言,本发明涉及使用多个扫描图形的编码和解码方法及装置。
背景技术
作为用于可视电话的国际标准,国际电信联盟(ITU-TITU电信标准化部)已经推荐了诸如H.261、H.263、H.263+等的一系列编码技术,并且提出了诸如H.263++修正版、MPEG-4等的附加技术。但是,这样的国际标准不符合新提出的问题,诸如端到端延迟时间、编码效率等。因此,诸如ITU-T和ISO/IEC的国际标准组织正在认真地学习用于下一代可视电话的下一代编码技术。
虽然仅仅逐行扫描图像已经被当作诸如H.261、H.263等传统编码技术的目标,但是下一代技术不仅考虑逐行扫描图像,而且考虑隔行扫描图像。但是,在仅仅将用于逐行扫描图像的编码技术应用到隔行扫描图像并且反之亦然的情况下会降低编码效率,因为用于逐行和隔行扫描图像的图像产生方法是不同的,于是编码图像数据的特征彼此不同。
在图1中示出传统编码装置的方框图。参见图1,所述编码装置包括编码控制器100、第一源编码器200、第二源编码器700、第一源解码器300、存储器400、运动补偿单元500和运动预测单元600。
当接收到输入图像时,编码控制器100确定是否按照用户希望获得的输入图像或运动对象的特征来对输入图像、即编码类型施行运动补偿,并且向第一开关S10输出对应的控制信号。对于运动补偿,第一开关S10接通,因为需要前一个或后一个输入图像。如果不需要运动补偿,则第一开关S10关闭,因为不需要前一个或后一个输入图像。如果第一开关S10接通,则在输入图像和前一个图像之间的差别图像数据被提供到第一源编码器200。如果第一开关S10关闭,则输入图像数据被提供到第一源编码器200。
第一源编码器200将输入的图像数据变换以产生变换系数,并且按照预定的量化处理来量化所述变换系数以产生N×M数据。作为变换的一个示例,可以使用离散余弦变换(DCT)。
由第一源编码器200接收和通过第一源编码器200编码的输入图像数据可以被用作用于运动补偿后一个或前一个输入图像数据的基准数据。因此,这样的编码输入图像数据通过第一源解码器300被反量化和变换,并且随后被存储在存储器400中,所述第一源解码器300与第一源编码器200相反地处理数据。如果通过第一源解码器300提供到存储器400的数据是差别图像数据,则编码控制器100接通第二开关S20,以便将差别图像数据添加到运动补偿单元500的输出,并且随后存储在存储器400中。
运动预测单元600比较输入图像数据与存储在存储器400中的数据,并且搜索最接近当前提供的输入图像数据的数据。在将被搜索的数据与输入的图像数据相比较之后,运动预测单元600输出运动向量。当向存储器400提供运动向量时,存储器400向运动补偿单元500输出对应的数据。根据从存储器400提供的数据,运动补偿单元500产生对应于当前编码的图像数据的补偿值。
第二源编码器700编码和输出从第一源编码器200提供的量化的变换系数。运动向量编码器900从运动预测单元600接收关于运动向量的信息,并且编码和输出这样的信息。编码信息编码器800从编码控制器100接收编码类型信息、量化信息和解码所需要的其他信息,并且编码和输出这样的信息。多路复用器1000复用第二源编码器700、编码信息编码器800和运动向量编码器900的输出,并且输出最后的比特流。
如上所述的传统编码装置一般使用一种编码方法以预定的大小划分输入的图像数据,并且以宏块为单位来编码。
图2是图1中所示的第二源编码器700的更具体的方框图。参见图2,第二源编码器700包括扫描器701和可变长度编码器702。扫描器701接收由量化的变换系数组成的N×M数据,并且以Z图形扫描N×M数据,如图5所示。可变长度编码器702以可变长度编码所扫描的数据。
图3是用于解码由图1所示的编码装置编码的数据的解码装置的方框图。参见图3,解码装置包括多路分离器110、第二源解码器710、第一源解码器210、编码类型信息翻译器120和运动向量翻译器130。
多路输出选择器110将比特流分离为熵编码和量化的变换系数、运动向量信息、编码类型信息等。第二源解码器710熵解码编码的变换系数,并且输出量化的变换系数。第一源解码器210源解码量化的变换系数。即,第一源解码器210与第一源编码器200相反地处理数据。例如,如果第一源编码器200执行离散余弦变换(DCT),则第一源解码器210执行反离散余弦变换(DCT)。结果,还原了图像数据。然后,再现的图像数据被存储在存储器410中用于运动补偿。
编码类型信息翻译器120区分编码类型。如果编码类型是需要运动补偿的中间类型,则编码类型信息翻译器120接通第三开关S30,以便将运动补偿单元510提供的运动补偿值添加到第一源解码器210提供的数据,以便产生再现的图像数据。运动向量翻译器130指示由从运动向量信息获得的运动向量指示的位置,并且运动补偿单元510从运动向量指示的基准图像数据来产生运动补偿值。
图4是图3所示的第二源解码器710的更具体的方框图。参见图4,第二源解码器710包括可变长度解码器703和反向扫描器704。第二源解码器710与图2所示的第二源编码器700相反地处理数据。可变长度解码器703解码以可变长度编码的量化变换系数,并且恢复N×M数据。反向扫描器704使用如图5所示的Z扫描图形反向扫描N×M数据。
如上所述的传统编码和解码装置在编码和解码隔行扫描图像的情况下可能产生问题。因为场之间存在时间差,因此即使在相邻的场中也可以改变图像。在图像具有较大运动的情况下该问题是很严重的。特别是,在以帧为单位而不是以场为单位编码隔行扫描图像的情况下,即,如果作为编码单位的图像格式是隔行扫描帧格式,则可以按照顶部和底部场数据来改变包含在图像中的对象的位置,因此,对象的轮廓会失真并且数据的特征会在垂直方向上大大改变。
图6示出了具有隔行扫描帧格式的图像数据的示例。参见图6,在形成N×M块的第一、第三或其他奇数列的图像数据中存在的数据是来自隔行扫描图像的顶部场的图像数据,在第二、第四或其他偶数列中存在的数据是来自底部场的图像数据。如果在顶部和底部场之间存在时间差别,并且如果对应于时间差的运动大,则在垂直方向上以不正确排列的图像来形成相同的对象。在变换和编码这样的数据的情况下,高频分量在垂直方向上增加,因此即使在由变换系数构成的N×M块的较低的列中也偶尔出现非零的变换系数。而且,在使用图5所示的Z扫描图形扫描这样的数据的情况下,编码效率被降低,因为在垂直方向上偶然出现的非零变换系数的特征没有被充分考虑。同样,在具有较大运动的图像或在垂直方向上具有较大改变的图像的情况下,产生编码效率问题。
如上所述,传统的编码技术具有一个问题不能达到具有不同特征的图像数据的最大编码效率,因为使用单个扫描图形来用于扫描图像。

发明内容
本发明提供了一种编码和解码的方法及装置,它们可以改善具有不同特征的图像数据的编码效率。
本发明也提供了一种编码和解码的方法及装置,它们可以改善具有隔行扫描图像帧格式的图像数据的编码效率。
本发明也提供了一种编码和解码的方法及装置,它们可以改善具有较大运动和在垂直方向上具有较大改变的图像数据的编码效率。
按照本发明的一个方面,提供了一种图像数据的编码方法,包括(a)通过第一次源编码图像数据来获得N×M数据;(b)响应所获得的N×M数据,使用从多个扫描图形选择的预定扫描图形来扫描所述N×M数据;(c)第二次源编码扫描数据。
按照本发明的另一个方面,提供了一种图像数据的编码方法,包括(a)通过第一次源编码图像数据来获得N×M数据;(b)将所获得的N×M数据划分为多个区域;(c)响应被划分的区域,使用从多个扫描图形分别选择的预定扫描图形来扫描N×M数据;(d)第二次源编码扫描数据。
步骤(a)包括(a1)变换图像数据;(a2)量化被变换的图像数据以产生N×M数据。
步骤(c)包括(c1)选择一个扫描图形,其比N×M数据的其他区域更晚地扫描一个实质上具有更多零分量值的区域;(c2)使用所选择的扫描图形来扫描N×M数据。
优选的是,步骤(b)包括(b1)水平地划分N×M数据以产生至少两个子区域;(b2)垂直地划分N×M数据以产生至少两个子区域,或(b3)水平地和垂直地划分N×M数据以产生至少四个子区域。
按照本发明的另一个方面,提供了一种图形数据的解码方法,包括(a)产生扫描图形选择信息以在多个扫描图形中选择预定的扫描图形;(b)使用基于扫描图形选择信息选择的至少一个扫描图形来反向扫描被可变长度解码的图像数据以获得N×M数据;(c)源解码N×M数据。
优选的是,步骤(c)包括(c1)反向量化N×M数据;(c2)反向变换和解码所述反向量化的N×M数据。
按照本发明的另一个方面,提供了一种图像数据的解码方法,包括(a)可变长度解码图像数据;(b)使用从多个扫描图形选择的至少一个扫描图形来反向扫描被可变长度解码的图像数据以获得N×M数据;(c)源解码N×M数据。
优选的是,步骤(b)包括(b11)选择一个扫描图形,所述扫描图形比N×M数据的其他区域更晚地扫描一个实质上具有更多零分量值的区域,;(b2)使用所选择的扫描图形来反向扫描N×M数据。
优选的是,步骤(b)包括(b21)选择一个扫描图形,在N×M数据是基于具有隔行扫描帧格式的图像数据的情况下,所述扫描图形比垂直高频分量值相对较早地扫描水平高频分量值;(b2)使用所选择的扫描图形来反向扫描N×M数据。
优选的是,步骤(b)包括(b22)选择一个扫描图形,在N×M数据是基于具有隔行扫描场格式或逐行扫描帧格式的图像数据的情况下,所述扫描图形以实质相同的顺序来扫描水平高频分量值和垂直高频分量值;(b2)使用所选择的扫描图形来反向扫描N×M数据。
优选的是,步骤(b)包括(b31)选择对应于N×M数据的宏块类型的扫描图形;(b2)使用所选择的扫描图形来反向扫描N×M数据。
优选的是,步骤(b)包括(b41)选择对应于N×M数据的图像格式和宏块类型的扫描图形;(b2)使用所选择的扫描图形来反向扫描N×M数据。
优选的是,步骤(a)包括(a1)将构成图像数据的代码字变换为预定的码元数据(symbol data)。
按照本发明的另一个方面,提供了一种图形数据的解码方法,包括(a)通过可变长度解码图形数据来获得码元数据;(b)从码元数据获得变换系数;(c)产生扫描图形选择信息来从多个扫描图形选择预定的扫描图形;(d)使用根据扫描图形选择信息选择的所述扫描图形来反向扫描变换系数以获得N×M数据;(e)源解码反向扫描的数据。
优选的是,步骤(c)包括(c1)分析所接收的图像格式信息;(c21)在分析的结果是所接收的图像格式是隔行扫描帧格式的情况下,选择一个扫描图形,所述扫描图形比垂直高频分量值更早地扫描水平高频分量值,或者(c1)分析所接收的图像格式信息;(c22)在分析的结果是所接收的图像格式是隔行扫描场格式或逐行扫描帧格式的情况下,选择一个扫描图形,所述扫描图形以实质上相同的顺序扫描水平高频分量值和垂直高频分量值。
按照本发明的另一个方面,提供了一种图像数据的编码装置,包括第一编码器、编码控制器和第二编码器。第一编码器第一次编码图像数据以产生N×M数据。编码控制器响应N×M数据而产生用于选择预定扫描图形的扫描图形选择信息。第二编码器使用根据扫描图形选择信息选择的扫描图形来扫描N×M数据,并且第二次编码N×M数据。
优选的是,第一编码器包括变换和编码图像数据的变换器,和量化由变换器变换的数据并产生N×M数据的量化器。
按照本发明的另一个方面,提供了一种图形数据的解码装置,包括第二解码器、扫描图形选择器和反向扫描器。第二解码器解码图像数据以产生变换系数。扫描图形选择器产生扫描图形选择信息以从多个扫描图形中选择预定的扫描图形。反向扫描器根据扫描图形选择信息使用扫描图形来将变换系数反向扫描为N×M数据。
同时,可以使用计算机可读信息记录介质来实现上述的方面,其中在所述计算机可读信息记录介质上,记录了用于实现上述的编码或解码方法的程序代码。


图1是传统的编码装置的方框图;图2是图1所示的第二源编码器的更具体的方框图;图3是用于解码由图1所示的编码装置编码的数据的解码装置的方框图;图4是图3所示的第二源解码器的更具体的方框图;图5示出了Z形扫描图形的示例;图6示出了具有隔行扫描帧格式的图像数据的示例;图7是按照本发明的一个优选实施例的编码器的方框图;图8是按照本发明的一个优选实施例的、用于编码图像数据的编码装置的方框图;图9是按照本发明的一个优选实施例的解码器的方框图;图10-12示出了图9所示的扫描图形选择器的实施例;图13-15示出了按照本发明的一个实施例的扫描图形;图16-17示出了按照本发明的另一个实施例的扫描图形;图18-21示出了按照本发明的优选实施例的、用于多个扫描图形的划分方式。
具体实施例方式
图7示出了按照本发明的编码器的优选实施例。参见图7,所述编码器用于第二次源编码,并且包括扫描器71和可变长度编码器72。图7所示的开关73按照从外部提供的扫描图形选择信号从多个扫描图形N×M选择至少一个扫描图形。在本发明的优选实施例中,从编码控制器(图7中未示出)提供扫描图形选择信号。扫描图形表示用于确定读取N×M数据的顺序的基准信息。
扫描器71使用由开关73根据扫描图形选择信号选择的至少一个扫描图形来扫描从外部提供的N×M数据。换句话说,扫描器71以预定的顺序读取N×M数据,并且将其变换为码元数据。可变长度编码器72以可变长度编码扫描的数据、即码元数据。
在本发明的优选实施例中的N×M数据指的是通过第一次源编码图像数据而获得的块数据。术语“第一次源编码”指的是将具有多个像素值的二维图像数据变换为另一个域中的数据。例如,由像素值组成的图像数据通过离散余弦变换(DCT)被变换为频域中的数据。通过这样的第一次源编码处理,可以由具有实质上相同信息但较小大小的数据来表示所述图像数据。而且,在本发明的优选实施例中的码元数据指的是使用预定的扫描图形扫描N×M数据而获得的运行水平(run-level)数据。运行水平数据可以是一维(1D)数据,其中运行值和水平值彼此分离;二维(2D)数据,其中运行值和水平值配对;或者三维数据(3D),其中包括最后值、运行值和水平值。可变长度编码器72将2D运行水平数据编码为对应的代码字(Run,Level),或将其中运行分量和水平分量彼此分离的1D运行水平数据编码为对应的代码字(1D可变长度编码)。也可能实施用于将3D运行水平数据(Last,Run,Level)编码为对应代码字的3D可变长度编码。可变长度编码器72可以利用霍夫曼编码器或算术编码器。
虽然在图7中未示出,编码控制器按照预定的扫描图形选择逻辑选择一个扫描图形,并且向开关73提供对应于所选择的扫描图形的扫描图形选择信息。按照所述扫描图形选择逻辑,编码控制器可以提供扫描图形选择信息以选择这样的扫描图形,其比N×M数据的其他区域更迟地读取实质上具有更多零值的区域。特别是,在从具有隔行扫描帧格式的图像数据获得N×M数据的情况下,编码控制器提供这样的扫描图形选择信息,其选择这样的扫描图形,它与Z图形相比较比垂直高频分量值更早地读取水平高频分量值。在从具有隔行扫描场格式或逐行扫描帧格式的图像数据来获得N×M数据的情况下,编码控制器提供适当的扫描图形选择信息,其选择以实质上相同的顺序来读取垂直和水平高频分量值的扫描图形。
或者,编码控制器可以提供扫描图形选择信息以选择对应于N×M数据的宏块类型的扫描图形,或提供扫描图形选择信息以选择对应于N×M数据的图像格式和宏块类型的扫描图形。而且,编码控制器可以产生扫描图形选择信息以选择用于通过水平划分N×M数据而获得的至少两个子区域的不同扫描图形,或选择用于通过垂直划分N×M数据而获得的至少两个子区域的不同扫描图形,或者编码控制器可以产生扫描图形选择信息以选择用于通过垂直和水平划分N×M数据而获得的至少四个子区域的不同扫描图形。而且,有可能将N×M数据区域任意划分为至少两个子区域,并且提供扫描图形选择信息以选择用于每个这样的子区域的不同扫描图形。
图8是按照本发明的一个优选实施例的、用于编码图像数据的编码装置的方框图。对于具有与参照图7所述的块相同功能的块,在图8中使用相同的附图标号,下面省略其多余的说明。
参见图8,编码装置包括第一源编码器2,用于源编码图像数据以获得N×M数据;编码控制器1,用于提供扫描图形选择信息以通知从多个扫描图形选择了一个扫描图形;第二源编码器7,用于根据扫描图形选择信息使用所选择的扫描图形来扫描N×M数据,以便当N×M数据被划分为多个子区域时每个N×M数据对应于每个子区域,所述第二源编码器7还用于熵编码扫描数据。而且,编码装置包括第一源解码器3、存储器4、运动补偿单元5、运动预测单元6、编码信息编码器8、运动向量编码器9和多路复用器10。
输入的图像数据包括从照相机以预定的帧速率提供的帧,或通过使用预定大小划分帧而获得的块。所述帧包括通过逐行扫描获得的逐行扫描帧、通过隔行扫描获得的隔行扫描场或帧。因此,下述的图像数据指的是具有逐行扫描帧格式、隔行扫描帧格式、场格式或块格式的图像。
当提供输入图像时,编码控制器1按照输入图像的特征或用户希望获得的运动目标,根据是否对输入图形实施运动补偿来确定编码类型、即其中编码类型或其间编码类型,并且向第一开关S1输出对应的控制信号。对于运动补偿,第一开关S1接通,因为需要前一个或后一个输入图像。如果不需要运动补偿,则第一开关S1关闭,因为不需要前一个或后一个输入图像。如果第一开关S1接通,则输入图像和前一个图像之间的差别图像数据被提供到第一源编码器2。如果第一开关S1关闭,则输入图像数据被提供到第一源编码器2。
而且,编码控制器1向第二源编码器7提供扫描图形选择信息。所述扫描图形选择信息是已经参照图7所述的相同信息。而且,编码控制器1将所述扫描图形选择信息传送到发送器(未示出)或如果必要的话存储所述信息。
第一源编码器2按照预定的量化处理量化通过变换输入图像数据而获得的变换系数,以便产生作为由量化的变换系数组成的两维数据的N×M数据。作为变换的一个示例,可以使用离散余弦变换(DCT)。按照预定的量化处理执行所述量化。
通过第一源编码器2编码的输入图像数据可以用作用于运动补偿下一个或前一个输入图像数据的基准数据。因此,这样的编码输入图像数据通过与第一源编码器2相反地处理数据的第一源解码器3被反向量化和变换,然后被存储在存储器4中。如果通过第一源解码器3被提供到存储器4的数据是差别图像数据,则编码控制器1接通第二开关S2,以便向运动补偿单元5的输出添加差别图像数据,然后将其存储在存储器4中。
运动预测单元6比较输入图像与存储在存储器4中的数据,并且搜索最接近当前提供的输入图像数据的数据。在比较被搜索数据和当前提供的输入图像数据后,运动预测单元6输出运动向量(MV)。参照至少一个图像来获得运动向量。换句话说,可以参照多个前一个和/或后一个图像来产生运动向量。当向存储器4提供运动向量时,存储器4向运动补偿单元5输出对应的数据。根据从存储器4提供的数据,运动补偿单元5产生对应于当前编码的图像数据的补偿值。
第二源编码器7从第一源编码器2接收量化的变换系数,并且在使用根据从编码控制器1提供的扫描图形选择信息选择的扫描图形扫描N×M数据之后,熵编码N×M数据。运动向量编码器9从运动预测单元6接收关于运动向量的信息,并且编码和输出这样的信息。编码信息编码器8从编码控制器1接收编码类型信息、量化信息和解码所需要的其他信息,并且编码和输出这样的信息。多路复用器10复用第二源编码器7、编码信息编码器8和运动向量编码器9的输出,并且输出最后的比特流。
图9是按照本发明的一个优选实施例的解码装置的方框图。参见图9,解码装置包括反向扫描器91、可变长度解码器92、扫描图形选择器93。图9所示的开关94按照从扫描图形选择器93提供的扫描图形选择信息在多个扫描图形N×M中选择至少一个扫描图形。
可变长度解码器92可变长度解码输入的比特流,并且将输入的比特流变换为码元数据。反向扫描器91根据扫描图形选择信息使用由开关94选择的至少一个扫描图形来反向扫描码元数据,并且重新构造N×M数据。结果,所述N×M数据被获得为第一源编码块数据。在本实施例中的码元数据指的是运行水平数据。可变长度解码器92解码在比特流中包括的预定代码字,以获得对应的运行水平数据。
扫描图形选择器93操作预定的扫描图形选择逻辑,并且自己产生要提供给开关94的扫描图形选择信息。注意,将根据编码流程来描述扫描图形的特征以便于说明。按照扫描图形选择逻辑,扫描图形选择器93可以产生扫描图形选择信息以选择这样的扫描图形,其在要重新构造的N×M数据中较迟地读取实质上具有更多零值的区域。具体地说,在从具有隔行扫描帧格式的图像数据获得要重新构造的N×M数据的情况下,扫描图形选择器93产生这样的扫描图形选择信息,其选择与Z图形相比较比垂直高频分量值相对较早地读取水平高频分量值的扫描图形。在从具有隔行扫描场格式或逐行扫描帧格式的图像数据来获得要重新构造的N×M数据的情况下,扫描图形选择器93产生适当的扫描图形选择信息,它以实质上相同的顺序来读取垂直和水平高频分量值。
或者,扫描图形选择器93可以提供扫描图形选择信息,以选择对应于要重新构造的N×M数据的宏块类型的扫描图形,或提供扫描图形选择信息以选择对应于要重新构造的N×M数据的图像格式和宏块类型的扫描图形。而且,扫描图形选择器93可以产生扫描图形选择信息以选择用于通过水平划分要重新构造的N×M数据而获得的至少两个子区域的不同扫描图形,或选择用于通过垂直划分要重新构造的N×M数据而获得的至少两个子区域的不同扫描图形,或者扫描图形选择器93可以产生扫描图形选择信息以选择用于通过垂直和水平划分要重新构造的N×M数据而获得的至少四个子区域的不同扫描图形。而且,可以将要重新构造的N×M数据区域任意划分为至少两个子区域,并且提供扫描图形选择信息以选择用于每个这样的子区域的不同扫描图形。
必须向解码装置传送表示在编码处理期间输入图像数据的编码单元是帧格式还是场格式、或输入图像数据是逐行扫描图像还是隔行扫描图像的信息,即表示输入图像数据的图像格式的图像格式信息或表示宏块类型的宏块类型信息。因此,如果预定扫描图形选择逻辑以根据这样的信息来选择预定的扫描图形,则有益的是选择一个扫描图形而不向解码装置发送从编码装置选择扫描图形的信息。
图10-12示出了图9所示的扫描图形选择器93的实施例。参见图10,扫描图形选择器93接收图像格式信息,并且按照扫描图形选择逻辑产生对应的扫描图形选择信息,或接收宏块类型信息并且产生对应的扫描图形选择信息。
参见图11,扫描图形选择器93接收图像格式信息和宏块类型信息,并且按照扫描图形选择逻辑来产生对应的扫描图形选择信息。
参见图12,扫描图形选择器93接收多个编码信息N×M,并且按照扫描图形选择逻辑来产生对应的扫描图形选择信息。上述的编码信息是用于编码的条件信息,它是从一个发射器向用于解码的解码装置提供的。
关于图10-12,可以以预定的映射表来实现扫描图形选择逻辑。所述映射表可以包括映射信息,其中预定的扫描图形根据预定的编码信息被映射。例如,可以映射对应于宏块类型信息、图像格式信息等的扫描图形。
图13-15示出了按照本发明的一个实施例的扫描图形,它可以被参照图7-9所述的编码装置或解码装置使用。例如,在图像格式是隔行扫描帧格式的情况下,编码装置的编码控制器1或解码装置的扫描图形选择器93可以选择扫描图形4,它表示水平高频分量值变为0的概率小于垂直高频分量值变为0的概率的情况。否则,可以选择扫描图形3。
图16和17示出了按照本发明的另一个实施例的扫描图形。参见图16和17,其中示出了通过将多个N×M数据作为一个块而同时扫描多个N×M块的扫描图形。具体地说,多个N×M数据1、2、3、4的分量值被作为扫描N×M数据的分量值。可以根据要求不同地确定要被作为一个块的N×M数据的数量和大小,并且可以对应地调整其扫描顺序。
图18-21示出了按照本发明的优选实施例的、用于使用多个扫描图形的划分方式。参见图18-21,其中示出了下述方式划分N×M数据以便参照图7-9所述的编码装置或解码装置可以使用多个扫描图形。例如,编码装置的编码控制器1或解码装置的扫描图形选择器93可以产生扫描图形选择信息,以选择用于通过水平划分图16所示的N×M数据或通过垂直划分图17所示的N×M数据而获得的至少两个子区域的不同扫描图形,或者可以产生扫描图形选择信息,以选择用于通过垂直和水平地划分如图18所示的N×M数据而获得的至少四个子区域的不同扫描图形。而且,也可以产生扫描图形选择信息以选择用于通过对角划分图19所示的N×M数据而获得的至少两个子区域的不同扫描图形。而且,可以产生扫描图形选择信息以选择用于通过任意划分N×M数据而获得的至少两个子区域的不同扫描图形,或产生扫描图形选择信息,以选择用于通过任意划分将N×M数据作为一个块的块而获得的至少两个子区域的不同扫描图形。
同时,与上述实施例相反,解码装置的扫描图形选择器93可以接收从编码装置提供的扫描图形选择信息,或读取在编码装置中存储的扫描图形选择信息,并且根据这样的接收或读取的信息来产生扫描图形选择信息。
上述的编码方法和解码方法可以应用于多维数据而不需要实质的修改或改变。而且,上述的编码方法和解码方法可以组合到计算机程序中。在本发明的领域中的计算机程序员可以容易地写出代码或代码段以构成所述计算机程序。而且,所述程序可以被存储在计算机可读信息记录介质中,并且可以被读取和实施以实现所述编码方法和解码方法。所述计算机可读信息记录介质包括磁记录介质、光记录介质和载波介质。
虽然已经参照本发明优选实施例具体示出和说明了本发明,本领域的技术人员会理解,在不脱离所附的权利要求所限定的本发明的精神和范围的情况下,可以进行形式和细节上的各种改变。
工业实用性如上所述,按照本发明,可以有效地实现编码和解码具有各种特征的图像数据。具体地说,即使对于具有隔行扫描帧格式的图像数据,也可以实现更有效的编码和解码。而且,可以改善对在垂直方向上具有较多运动或较多变化的图像的编码效率。
本发明可以被广泛地应用到多个领域中,包括实时交互应用,诸如可视电话、通过移动网络的音频/视频通信、通过因特网的视频应用服务、用于手语或读唇通信的视频发送、对于视频点播服务的视频存储和检索、用于视频邮件的视频存储和发送应用、通过不同种类网络的多位置通信、数字广播等。
权利要求
1.一种图像数据的编码方法,包括(a)通过第一次源编码图像数据来获得N×M数据;(b)响应于所获得的N×M数据使用从多个扫描图形选择的预定扫描图形来扫描所述N×M数据;(c)第二次源编码所扫描的数据。
2.一种图像数据的编码方法,包括(a)通过第一次源编码图像数据来获得N×M数据;(b)将所获得的N×M数据划分为多个区域;(c)响应于被划分的区域,使用从多个扫描图形分别选择的预定扫描图形来扫描N×M数据;(d)第二次源编码所扫描的数据。
3.按照权利要求2的编码方法,其中步骤(a)包括(a1)变换所述图像数据;(a2)量化被变换的图像数据以产生N×M数据。
4.按照权利要求2的编码方法,其中步骤(c)包括(c1)选择一个扫描图形,所述扫描图形比N×M数据的其他区域更晚地扫描一个实质上具有更多零分量值的区域;(c2)使用所选择的扫描图形来扫描N×M数据。
5.按照权利要求2的编码方法,其中步骤(b)包括(b1)水平划分N×M数据以产生至少两个子区域。
6.按照权利要求2的编码方法,其中步骤(b)包括(b2)垂直划分N×M数据以产生至少两个子区域。
7.按照权利要求2的编码方法,其中步骤(b)包括(b3)水平和垂直划分N×M数据以产生至少四个子区域。
8.一种图像数据的解码方法,包括(a)产生扫描图形选择信息,用于在多个扫描图形中选择预定的扫描图形;(b)使用基于该扫描图形选择信息选择的至少一个扫描图形来反向扫描被可变长度解码的图像数据,以获得N×M数据;(c)源解码该N×M数据。
9.按照权利要求8的解码方法,其中步骤(c)包括(c1)反向量化所述N×M数据;(c2)反向变换和解码该反向量化的N×M数据。
10.按照权利要求8的解码方法,其中根据解码图像数据所需的至少一个编码信息来产生扫描图形选择信息。
11.按照权利要求8的解码方法,其中根据图像格式信息来产生扫描图形选择信息。
12.按照权利要求11的解码方法,其中所述扫描图形选择信息是用于选择这样一个扫描图形的信息,其在所述图像格式信息表示隔行扫描帧格式的情况下比垂直高频分量值更早地扫描水平高频分量值。
13.按照权利要求11的解码方法,其中所述扫描图形选择信息是用于选择这样一个扫描图形的信息,其在图像格式信息表示隔行扫描场格式或逐行扫描帧格式的情况下以实质相同的顺序来扫描垂直高频分量值和水平高频分量值。
14.按照权利要求8的解码方法,其中根据宏块类型信息来产生扫描图形选择信息。
15.一种图像数据的解码方法,包括(a)可变长度解码图像数据;(b)使用从多个扫描图形选择的至少一个扫描图形来反向扫描被可变长度解码的图像数据,以获得N×M数据;(c)源解码该N×M数据。
16.按照权利要求15的解码方法,其中步骤(b)包括(b11)选择这样一个扫描图形,其比N×M数据的其他区域更晚地扫描一个实质上具有更多零分量值的区域;(b2)使用所选择的扫描图形来反向扫描N×M数据。
17.按照权利要求15的解码方法,其中步骤(b)包括(b21)选择这样一个扫描图形,其在所述N×M数据是基于具有隔行扫描帧格式的图像数据的情况下,比垂直高频分量值相对较早地扫描水平高频分量值;(b2)使用所选择的扫描图形来反向扫描所述N×M数据。
18.按照权利要求15的解码方法,其中步骤(b)包括(b22)选择这样一个扫描图形,其在N×M数据是基于具有隔行扫描场格式或逐行扫描帧格式的图像数据的情况下,以实质相同的顺序来扫描水平高频分量值和垂直高频分量值;(b2)使用所选择的扫描图形来反向扫描所述N×M数据。
19.按照权利要求15的解码方法,其中步骤(b)包括(b31)选择对应于N×M数据的宏块类型的一个扫描图形;(b2)使用所选择的扫描图形来反向扫描所述N×M数据。
20.按照权利要求15的解码方法,其中步骤(b)包括(b41)选择对应于N×M数据的图像格式和宏块类型的一个扫描图形;(b2)使用所选择的扫描图形来反向扫描所述N×M数据。
21.按照权利要求15的解码方法,其中步骤(a)包括(a1)将构成图像数据的代码字变换为预定的码元数据。
22.按照权利要求21的解码方法,其中所述码元数据是运行水平数据。
23.一种图形数据的解码方法,包括(a)通过可变长度解码图像数据来获得码元数据;(b)从该码元数据获得变换系数;(c)产生扫描图形选择信息来从多个扫描图形中选择预定的扫描图形;(d)使用根据扫描图形选择信息选择的扫描图形来反向扫描变换系数以获得N×M数据;(e)源解码反向扫描的数据。
24.按照权利要求23的解码方法,其中步骤(c)包括根据解码图像数据所需的至少一个编码信息来产生扫描图形选择信息。
25.按照权利要求23的解码方法,其中步骤(c)包括根据图像格式信息来产生扫描图形选择信息。
26.按照权利要求25的解码方法,其中步骤(c)包括(c1)分析所述图像格式信息;(c21)在分析的结果是所述图像格式是隔行扫描帧格式的情况下,选择这样一个扫描图形,其比垂直高频分量值更早地扫描水平高频分量值。
27.按照权利要求25的解码方法,其中步骤(c)包括(c1)分析所接收的图像格式信息;(c22)在分析的结果是该图像格式是隔行扫描场格式或逐行扫描帧格式的情况下,选择这样一个扫描图形,其以实质上相同的顺序扫描水平高频分量值和垂直高频分量值。
28.按照权利要求23的解码方法,其中步骤(c)包括根据宏块类型信息来产生扫描图形选择信息。
29.一种图像数据的编码装置,包括第一编码器,用于第一次编码图像数据以产生N×M数据;编码控制器,用于响应N×M数据而产生用于选择预定扫描图形的扫描图形选择信息;第二编码器,用于使用根据扫描图形选择信息选择的扫描图形来扫描N×M数据,并且第二次编码该N×M数据。
30.按照权利要求29的编码装置,其中所述第一编码器包括变换和编码图像数据的变换器;以及量化由变换器变换的数据并产生N×M数据的量化器。
31.按照权利要求29的编码装置,其中所述编码控制器提供根据N×M数据的图像格式而产生的扫描格式选择信息。
32.按照权利要求29的编码装置,其中所述编码控制器提供用于选择一个扫描图形的扫描图形选择信息,该扫描图形在从具有隔行扫描帧格式的图像数据获得N×M数据的情况下比垂直高频分量值更早地扫描水平高频分量值。
33.按照权利要求29的编码装置,其中所述编码控制器提供用于选择一个扫描图形的扫描图形选择信息,该扫描图形在从具有隔行扫描场格式或逐行扫描帧格式的图像数据获得N×M数据的情况下以实质相同的顺序来扫描垂直高频分量值和水平高频分量值。
34.一种图像数据的解码装置,包括第二解码器,用于解码图像数据以产生变换系数;扫描图形选择器,用于产生扫描图形选择信息以从多个扫描图形中选择预定的扫描图形;反向扫描器,用于使用根据扫描图形选择信息选择的扫描图形来将变换系数反向扫描为N×M数据。
35.按照权利要求34的解码装置,还包括第一解码器,用于源解码由反向扫描器反向扫描的数据。
36.按照权利要求34的解码装置,其中所述扫描图形选择器根据至少一个用于解码图像数据的编码信息来产生扫描图形选择信息。
37.按照权利要求36的解码装置,其中所述扫描图形选择器根据图像格式信息产生扫描格式选择信息。
38.按照权利要求37的编码装置,其中所述扫描图形选择器分析所述图像格式信息,并且产生用于选择一个扫描图形的扫描图形选择信息,该扫描图形在分析结果是所述图像格式是隔行扫描帧格式的情况下比垂直高频分量值更早地扫描水平高频分量值。
39.按照权利要求37的编码装置,其中所述扫描图形选择器分析所述图像格式信息,并且产生用于选择一个扫描图形的扫描图形选择信息,该扫描图形在分析结果是所述图像格式是隔行扫描场格式或逐行扫描帧格式的情况下以实质相同的顺序来扫描垂直高频分量值和水平高频分量值。
40.按照权利要求36的解码装置,其中所述扫描图形选择器根据宏块类型信息产生扫描图形选择信息。
全文摘要
本发明提供了一种使用多个扫描图形的编码和解码方法及装置。所述用于编码图像数据的方法包括(a)通过第一次源编码图像数据获得N×M数据;(b)响应所获得的N×M数据,使用从多个扫描图形选择的预定扫描图形来扫描所述N×M数据;(c)第一次源编码扫描的数据。因此,可以有效地实现编码和解码具有各种特征的图像数据。具体地说,即使对于具有隔行扫描帧格式的图像数据也可以实现更有效的编码和解码。
文档编号H04N7/50GK1565129SQ03801207
公开日2005年1月12日 申请日期2003年6月25日 优先权日2002年7月16日
发明者全炳宇, 金容帝, 朴正煇 申请人:三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1