使用反离散余弦变换缩放图像的方法

文档序号:7872336阅读:567来源:国知局
专利名称:使用反离散余弦变换缩放图像的方法
技术领域
本发明总的来说涉及一种用于使用反离散余弦变换(IDCT)缩放图像的方法,并且更为具体的,但是不以限定的形式涉及一种用于放大原始图像到任意分辨率的方法。
背景技术
用于放大图像的典型方法是在像素域中处理图像,其中通过基于像素的相关性内插原始图像的像素来增加像素的数目。但是,这个方法具有几个缺点。它需要复杂的算法来计算每个相邻像素值的相关性,并且另外,增加了尺寸的图像的质量可能被内插运算恶化。
用于增大图像的另一方法是使用离散余弦变换(DCT)在空间频域来处理图像。将原始图像划分为二维的图像块,例如,尺寸8×8像素的图像块,并且在每个图像块上执行DCT运算以产生具有低和高的空间频率分量的DCT系数块。
已知DCT和量化的结合使得很多频率分量变为零,特别是对于高空间频率的系数,因为在原始图像中的大多数能量典型的集中在低的空间频率上。利用这个特征的优点的常见方法将零的列和行附加到DCT系数块的高频率区域,用于增加DCT系数块的尺寸到8×8的整数倍,例如,16×16或24×24。在增加了尺寸的DCT系数块上的反DCT运算产生增大的图像块。
预期频域方法越来越多的用于缩放图像,因为算法相对简单并且不恶化放大的图像的质量。用于在空间频域缩放图像的方法在,例如,于1998年4月7日公布的美国专利No.5,737,019,与1999年7月25日提交的韩国专利申请号No.1999-64158以及于2001年6月15日提交的韩国专利申请号No.2001-49039中进行了公开。
虽然在参考专利和申请中公开的方法显示了良好的结果,但其主要限制在于不能将图像放大到任意尺寸而是仅能够放大到它的原始尺寸的整数倍。而且,没有提出在将图像放大到任意尺寸之后防止图像的可能的恶化的方案。

发明内容
因此,本发明的目的是提供用于使用反离散余弦变换(IDCT)放大图像到任意尺寸而不造成放大的图像的可能恶化的方法。
根据本发明的使用反离散余弦变换(IDCT)缩放原始图像的方法的特征在于该方法包括其中将原始图像划分为多个图像块,并且对每个图像块进行离散余弦变换,其步骤为接收尺寸M×N的离散余弦变换的图像块,确定将每个离散余弦变换的图像块放大到的尺寸P×Q,以及附加零的行和列到每个离散余弦变换的图像块的高频区域使得每个离散余弦变换的图像块的尺寸变为确定的尺寸P×Q;对于附加了零的离散余弦变换的图像块计算k系数,并且将每个附加了零的离散余弦变换的图像块乘以k系数;以及在乘以k系数的附加了零的离散余弦变换的图像块上执行IDCT运算以产生尺寸P×Q的放大的图像块。
根据本发明的用于使用IDCT缩放原始图像的另一方法的特征在于其包括,在该方法中将原始图像划分为多个图像块,并且对每个图像块进行离散余弦变换,其步骤为从数字广播接收尺寸M×N的离散余弦变换的图像块;确定将每个离散余弦变换的图像块放大到的尺寸P×Q,并且附加零的行和列到每个离散余弦变换的图像块的高频区域使得每个离散余弦变换的图像块的尺寸变为确定的尺寸P×Q;对于附加了零的离散余弦变换的图像块计算k系数,并且将每个附加了零的离散余弦变换的图像块乘以k系数;在乘以k系数的附加了零的离散余弦变换的图像块上执行IDCT运算以产生尺寸P×Q的放大的图像块;以及通过组合尺寸P×Q的放大的图像块来产生放大的图像。
根据本发明的用于使用IDCT缩放原始图像的再一方法的特征在于其包括,在该方法中将原始图像划分为多个图像块,并且对每个图像块进行离散余弦变换,其步骤为从由存储介质再现的数据流接收尺寸M×N的离散余弦变换的图像块;确定将每个离散余弦变换的图像块放大到的尺寸P×Q,并且附加零的行和列到每个离散余弦变换的图像块的高频区域使得每个离散余弦变换的图像块的尺寸变为确定的尺寸P×Q;对于附加了零的离散余弦变换的图像块计算k系数,并且将每个附加了零的离散余弦变换的图像块乘以k系数;在乘以k系数的附加了零的离散余弦变换的图像块上执行IDCT运算以产生尺寸P×Q的放大的图像块;以及通过组合尺寸P×Q的放大的图像块来产生放大的图像。


在附图中图1示出了根据本发明的图像缩放设备的结构;图2和3是根据本发明的用于缩放图像的过程的图示视图;图4是根据本发明一个实施例的用于缩放图像的过程的图示视图;图5和6是根据本发明的放大的图像的示例性视图;图7和8是用于解释怎样计算k系数的图示视图;图9是根据本发明的一个实施例的数字广播接收器的框图;图10是根据本发明另一实施例的光盘驱动器的框图。
具体实施例方式
为了全面的理解本发明,下面将参考附图描述其优选实施例。
图1示出了根据本发明的图像缩放设备,比如图像定标器的结构。该设备包括离散余弦变换(DCT)单元10,零附加单元11,k系数相乘单元12,以及反离散余弦变换(IDCT)单元13。
DCT单元10将原始图像划分为尺寸m×n像素的多个图像块并且在每个图像块(a1,1~an,m)上执行DCT运算(DCT(m×n))以产生尺寸m×n的相应的DCT系数块(d1,1~dn,m),如图2所示。
零附加单元11将零的行和列附加到每个接收的DCT系数模块(d1,1-dn,m)的高频区域。附加的零的行的数目不需要是图像块(a1,1~an,m)的行的数目的整数倍,并且其仅取决于放大的图像的行的数目。类似的,附加的零的列的数目不需要是图像块(a1,1~an,m)的列的数目的整数倍,并且其仅取决于放大的图像的列的数目。
如图3所示,k系数相乘单元12将附加了零的DCT系数块(a1,1~0q,p)的每个元素乘以k系数,以防止产生的放大的图像失真。通过在附加了零的行和列之前和之后的DCT系数块的行和列的数目来确定k系数。
通过在乘以了k系数的附加了零的DCT系数块(kd’1,1~0q,p)上执行IDCT运算,IDCT单元13最终产生尺寸增加到P×q的图像块(a’1,1~a’q,p)。
上述过程使得图像被放大到任意分辨率而不使得产生的放大图像失真。下面将解释本发明的几个示例性实施例。
考虑如图4所示的实施例,DCT单元10将原始图像划分为像素尺寸8×8的多个图像块,并且在每个图像块(a1,1~a8,8)上执行DCT运算(DCT(8×8)),以产生尺寸8×8的相应DCT系数块(d1,1~d8,8)。
零附加单元11附加5列零到DCT系数块(d1,1~d8,8)的右侧,并且将2两行零附加到DCT系数块的底部。零的行和列的数目仅取决于通过缩放将获得的图像的尺寸。
K系数相乘单元12将附加了零的DCT系数块(a1,1~010,13)的每个元素乘以k系数,并且之后IDCT单元13通过在乘以了k系数的附加了零的DCT系数块(ka’1,1~~k010,13)上执行IDCT运算,产生尺寸增加到13×10像素的放大的图像块(a’1,1~a’10,13)。
结果,将尺寸8×8像素的两维图像块变换为尺寸13×10像素的放大的图像块,如图5所示,其中放大的图像块的行和列的数目分别不是原始图像块的行和列的数目的整数倍。
类似的,通过按照如上所述执行DCT运算、附加零的行和列、乘以k系数以及执行IDCT运算,能够将尺寸8×8像素的两维图像块变换为尺寸15×8像素的增大尺寸的图像块。总的来说,可以将图像块放大到不是它的原始尺寸的整数倍的任意尺寸。
考虑其中尺寸720×480像素的标准清晰度(SD)图像向上转换到具有1920×1080像素的高清晰度(HD)图像的另一实施例。在这种情况下,DCT单元10将原始图像划分为90×60个图像块,每个是8×8像素的尺寸,并且在90×60个图像块的每一个上执行DCT运算。为了获得尺寸1920×1080像素的放大的图像,每个DCT系数块应该被放大到具有18行和21.3列的DCT系数块。因为21.3列不可行的,将21.3近似为最接近的整数21。因此,通过在原始DCT系数块的高频区域附加10行零和13列零,将每个DCT系数块放大到具有18行和21列的增大尺寸的DCT系数块。在放大的21×18 DCT系数块的每一个上的IDCT运算最终产生具有1890×1080像素分辨率的放大的HD图像块。
为将尺寸720×480像素的原始图像向上转换到具有1280×720像素的图像,DCT单元10将原始图像划分为90×60个图像块,每个是8×8像素的尺寸,并且在90×60个图像块的每一个上执行DCT运算。为了获得尺寸1280×720像素的放大的图像,每个8×8像素尺寸的图像块应该被放大到尺寸14.2×12像素的图像块。因为14.2不是整数,采用最接近的整数14代替。结果,通过在原始DCT系数块的高频区域附加4行和6列零,将每个DCT系数块放大到尺寸14×12的DCT系数块。在放大的DCT系数块的每一个上的IDCT运算导致具有1260×720像素分辨率的放大的HD图像。
零附加单元11通过参考原始图像块的尺寸和需要的尺寸的放大的图像块的尺寸来计算应该将多少行和列的零附加到每个DCT系数块。在附加的行或列的零的数目不是整数的情况下,使用最接近的整数代替。
本发明的再一实施例中,DCT单元10可以使用原始图像块的尺寸和产生的缩放的图像块的尺寸的公约数之一。
假定将图像尺寸从1280×720像素增加到1920×1080像素。DCT单元10选择160(1280和1920的公约数之一)和72(720和1080的公约数之一),并且将原始图像划分为尺寸8×10像素的图像块,使得产生的图像块的数目变为160×72。然后,在将4列零和5行零附加到DCT系数块以将图像块的尺寸从8×10像素增加到12×15像素之后,DCT单元10在160×72个图像块的每一个上执行DCT运算。在放大的DCT系数块的每一个上的IDCT运算生成尺寸1920×1080像素的放大的图像。
还可以在作为整体的原始图像上执行DCT运算,并且在附加需要的数目的零的行和列到DCT系数块之后在相应的DCT系数块上执行IDCT运算以获得放大的图像。
下面描述用在k系数相乘单元12中的用于计算k系数的方法。
根据本发明的放大图像的方法使用两维DCT。但是,使用一维DCT描述该方法以使得其更容易理解。因为两维DCT使用一维DCT的基本运算,下面的解释能够容易地扩展到两维DCT的情况。
两维DCT可以被表示为F(u,v)=2c(u)c(v)MNΣm=0M-1Σn=0N-1f(m,n)cos(2m+1)uπ2Mcos(2n+1)vπ2N,u=0,1,ΛM-1v=0,1,ΛN-1]]>其中 在一些处理之后,上述等式可以重写为F(u,v)=2Mc(u)Σm=0M-1{2Nc(v)Σn=0N-1f(m,n)cos(2n+1)vπ2N}cos(2m+1)uπ2M,u=0,1,ΛM-1v=0,1,ΛN-1]]>这表示两维DCT可以被解释为之前的N点一维DCT的结果的M点一维DCT,N点一维DCT被表示为F(k)=2Nc(k)Σn=0N-1f(n)cos(2n+1)kπ2N,k=0,1,Λn-1]]>其中 为了这个原因,将参考一维DCT的实例给出下面的解释。上述一维DCT的等式能够重写为下面的矩阵等式F(0)F(1)··F(N-1)=C(N)11··1cosπ2Ncos3π2N··cos(2N-1)π2N··········cos(2N-1π)π2Ncos(2N-1)3π2N··cos(2N-1)(N-1)π2Nf(0)f(1)··f(N-1)]]>其中C(N)=1N00·002N0·00·2N·0····0000·2N]]>在上述矩阵等式中,通过将f(k)乘以在k=0~N-1的相应的余弦系数,并且将每个相乘的值相加来计算DCT系数F(k)。图7示出了当N=8和N=10时在k=0~N-1上乘以f(k)的余弦系数。
图8示出了用于将N从8增加到10的实例。该图示出了当N增加时以至余弦系数的数目增加时,两种情况的余弦系数的包络相同。换句话说,通过采样相同的余弦函数而不考虑N的值可以获得余弦系数,但是当N增加,采样的数目也增加。
计算DCT系数需要在k=0~N-1将如图8所示的余弦系数乘以f(k)。当N从8增加到10时,很明显在k=0~7的相同斜率的信号乘以相同包络的余弦系数而不用考虑N的值。
在N=8和N=10的情况之间的不同仅在于需要求和的相乘项目的数目,就是说,项目的数目等于N的值。从这方面看,在N=8和N=10的系数之间的关系可以表示为F10(k)∝108F8(k)]]>可以看到,矩阵C(N)的所有非对角线元素是零,并且对角线元素和 成反比。因此,当考虑C(N)时,在F10(k)和F8(k)之间的关系可以写作F10(k)=108F8(k)]]>另外,当输入维数N从n扩展到m时(m>n),在Fm(k)和Fn(k)之间的关系能够表示为Fm(k)=mnFn(k)--0≤k≤n]]>对于k(n≤k<m)的DCT系数Fm(k)被设置为零,其暗示忽略输入数据的高频分量。对于两维DCT系数的等式可以从上述用于一维DCT系数的等式中导出。当将两维图像的尺寸从p×q像素增加到m×n像素时,可以通过下面等式计算用于放大的图像的DCT系数Fmn(u,v)=m×np×qFpq(u,v)0≤u≤p0≤v≤q]]>其中p≤m和q≤n。因此, 是在这个情况下的k系数。
本发明可以实施在比如DVD播放器的光盘驱动器、比如机顶盒的数字广播接收器以及比如HD TV的数字视频设备。下面将描述本发明另外的示例性实施例。
图9示出了根据本发明实施例的数字广播接收器的框图。该广播接收器包括调谐器30、多路分解器31、视频缓存器32、音频缓存器33、数据缓存器34、解码器35和微计算机36。解码器35可以包括如图1所示的零附加单元11、k系数相乘单元12和IDCT单元13。
调谐器30根据由微计算机36发布的命令来接收需要的数字广播信号。多路分解器31分别输出用户选择的节目或子频道的视频、音频和数据流到视频缓存器32、音频缓存器33和数据缓存器34。解码器35将临时存储在视频缓存器32和音频缓存器33中的视频和音频流解码以检索选择的节目或子频道的原始音频和视频信号。
由调谐器30接收的数字广播信号是传输流并且从多路分解器31输出的视频数据是分组基础流(packetized elementary stream)。零附加单元11将零附加到在从视频缓存器32接收的每个宏块中的高频区域。
例如,假定当编码原始图像时,将原始图像划分为尺寸8×8像素的宏块,并且在每个宏块上执行DCT运算以产生相应的DCT系数块。零附加单元11附加每个DCT系数块(d1,1~dn,m)的高频区域需要的零的行和列。
K系数相乘单元12计算k系数,并且将附加了零的DCT系数块(a1,1~aq,p)乘以k系数以防止该放大的图像产生失真,如参考图3所述的。
该IDCT单元13在乘以了k系数的放大的DCT系数块(kd’1,1~0q,p)上执行IDCT运算,以产生放大的图像块(a’1,1~a’q,p)。
因此,数字广播接收器提供放大输入图像到任意尺寸而不造成放大的图像的失真的性能。
图10示出了根据本发明的另一实施例的光盘驱动器的框图,其包括用于从光盘50接收光信号的光拾取器51、数字信号处理单元52、剖析器53、视频缓存器54、音频缓存器55、数据缓存器56、解码器57和微计算机58。解码器57可以包括如图1所示的零附加单元11、k系数相乘单元12和IDCT单元13。
光拾取器51将从光盘50接收的光信息转换为电信号。数字信号处理单元52在将电信号转换为数字二进制信号之后处理该电信号。剖析器53将从数字信号处理单元52接收的数字信号分解为将分别存储在视频缓存器54、音频缓存器55和数据缓存器56中的视频、音频和数据。
解码器57解码临时存储在视频缓存器54和音频缓存器55中的视频和音频数据以检索在光盘50上记录的原始音频和视频信号。由数字信号处理单元52产生的数字信号是节目流,而从剖析器53输出的视频输出是分组基本流。零附加单元11将零附加到从视频缓存器54接收的每个宏块的高频区域。
假定当在光盘50上记录原始视频数据时,将原始图像划分为尺寸8×8像素的图像块并且在每个图像块上执行DCT运算。在光盘50上记录的数据是DCT系数块。零附加单元11附加每个接收的DCT系数块(d1,1~dn,m)的高频区域需要的零的行和列。
K系数相乘单元12计算k系数,并且将放大的DCT系数块(a1,1~aq,p)乘以k系数以防止放大的图像产生失真,如参考图3所述的。
IDCT单元13在乘以了k系数的放大的DCT系数块(kd’1,1~0q,p)上执行IDCT运算,以产生放大的图像块(a’1,1~a’q,p)。将放大的图像块组合以产生放大的完整图像。
因此,光盘驱动器提供放大输入图像到任意尺寸而放大图像不严重失真的性能。
根据本发明的用于缩放图像的方法使得比如DVD播放器的数字视频处理设备、数字广播接收器和HD TV能够放大原始图像到任意尺寸,而不造成放大的图像的失真,由此防止图像质量的恶化。
虽然相对于有限数目的实施例公开了本发明,本领域普通技术人员将从公开中受益,并且将认可多种修改和变更。所附的权利要求意在覆盖所有在本发明的真正精神和范围之中的修改和变更。
权利要求
1.一种用于使用反离散余弦变换IDCT缩放原始图像的方法,其中将该原始图像划分为多个图像块并且对每个图像块进行离散余弦变换,所述方法包括步骤(a)接收尺寸M×N的离散余弦变换的图像块,确定将每个离散余弦变换的图像块将放大到的尺寸P×Q,并且附加零的行和列到每个离散余弦变换的图像块的高频区域,使得每个离散余弦变换的图像块的尺寸变为确定的尺寸P×Q;(b)对于附加了零的离散余弦变换的图像块计算k系数,并且将每个附加了零的离散余弦变换的图像块乘以k系数;以及(c)在乘以k系数的附加了零的离散余弦变换的图像块上执行反离散余弦变换IDCT运算以产生尺寸P×Q的放大的图像块。
2.如权利要求1所述的方法,进一步包括通过组合尺寸P×Q的多个放大的图像块来产生放大的图像的步骤。
3.如权利要求1所述的方法,其中,所述k系数和 成正比,其是附加了零的离散余弦变换的图像块的尺寸除以离散余弦变换的图像块的尺寸的平方根值。
4.如权利要求1所述的方法,其中,该附加的零的行和列的数目取决于产生的放大的图像的尺寸。
5.如权利要求1所述的方法,进一步包括将原始图像划分为尺寸M×N的图像块并且在每个图像块上执行离散余弦变换DCT运算的步骤。
6.如权利要求5所述的方法,其中所述每个图像块的尺寸M×N是由用户选择的。
7.如权利要求1所述的方法,其中每个附加了零的图像块的尺寸P×Q是基于原始图像的尺寸和产生的放大的图像的尺寸来确定的。
8.如权利要求5所述的方法,其中,该每个图像块的行的数目是通过选择原始图像的行的数目和将要产生的放大的图像的行的数目的公约数、并将原始图像的行的数目除以所选的公约数来确定的,以及该每个图像块的列的数目是通过选择原始图像和放大的图像的列的数目的公约数、并将原始图像的列的数目除以所选的公约数来确定的。
9.一种用于使用反离散余弦变换IDCT缩放原始图像的方法,其中将原始图像划分为多个图像块并且对每个图像块进行离散余弦变换,所述方法包括步骤(a)从数字广播接收尺寸M×N的离散余弦变换的图像块;(b)确定将每个离散余弦变换的图像块放大到的尺寸P×Q,并且附加零的行和列到每个离散余弦变换的图像块的高频区域,使得每个离散余弦变换的图像块的尺寸变为确定的尺寸P×Q;(c)对于附加了零的离散余弦变换的图像块计算k系数,并且将每个附加了零的离散余弦变换的图像块乘以k系数;(d)在乘以k系数的附加了零的离散余弦变换的图像块上执行反离散余弦变换IDCT运算以产生尺寸P×Q的放大的图像块;以及(e)通过组合尺寸P×Q的放大的多个图像块产生放大的图像。
10.如权利要求9所述的方法,其中,该每个放大的图像块的行的数目是通过选择原始图像的行的数目和将要产生的放大的图像的行的数目的公约数、并将产生的放大图像的行的数目除以所选的公约数来确定的,且该每个放大的图像块的列的数目是通过选择原始图像和放大的图像的列的数目的公约数、并将放大的图像的列的数目除以所选的公约数来确定的。
11.如权利要求10所述的方法,其中,使得该每个放大的图像块的行和列的数目为最接近由除法运算确定的值的整数。
12.如权利要求9所述的方法,其中,该每个放大的图像块的行的数目是通过将产生的放大的图像的行的数目除以原始图像的行的数目并且将商乘以每个图像块的行的数目来确定的,且该每个放大的图像块的列的数目是通过将产生的放大的图像的列的数目除以原始图像的列的数目并且将商乘以每个图像块的列的数目来确定的。
13.如权利要求9所述的方法,其中,该每个放大的图像块的尺寸P和Q被确定为分别是最接近由放大的图像尺寸除以图像块的数目产生的值的整数。
14.一种用于使用反离散余弦变换IDCT缩放原始图像的方法,其中将原始图像划分为图像块并且对每个图像块进行离散余弦变换,所述方法包括步骤(a)从由存储介质再现的数据流接收尺寸M×N的离散余弦变换的图像块;(b)确定将每个离散余弦变换的图像块放大到的尺寸P×Q,并且附加零的行和列到每个离散余弦变换的图像块的高频区域,使得每个离散余弦变换的图像块的尺寸变为确定的尺寸P×Q;(c)对于附加了零的离散余弦变换的图像块计算k系数,并且将每个附加了零的离散余弦变换的图像块乘以k系数;(d)在乘以k系数的附加了零的离散余弦变换的图像块上执行反离散余弦变换IDCT运算以产生尺寸P×Q的放大的图像块;以及(e)通过组合尺寸P×Q的多个放大的图像块以产生放大的图像。
15.如权利要求14所述的方法,其中,所述步骤(a)将从存储介质再现的节目流转换为分组基本流,并且从分组基本流中提取离散余弦变换的图像块。
16.如权利要求14所述的方法,其中,该每个图像块的行的数目是通过选择原始图像的行的数目和产生的放大的图像的行的数目的公约数、并将原始图像的行的数目除以所选的公约数来确定的,且该每个图像块的列的数目是通过选择原始图像和放大的图像的列的数目的公约数、并将原始图像的列的数目除以所选的公约数来确定的。
17.如权利要求14所述的方法,其中,每个附加了零的图像块的尺寸P×Q是基于原始图像的尺寸和将被产生的放大的图像的尺寸确定的。
18.如权利要求14所述的方法,其中,该每个放大的图像块的行的数目是通过选择原始图像的行的数目和产生的放大的图像的行的数目的公约数、并将产生的放大图像的行的数目除以所选的公约数来确定的,且该每个放大的图像块的列的数目是通过选择原始图像和放大的图像的列的数目的公约数、并将放大的图像的列的数目除以所选的公约数来确定的。
全文摘要
一种用于使用反离散余弦变换(IDCT)缩放图像的方法,该方法使得数字视频处理设备,比如DVD播放器、数字广播接收器或HDTV能够放大原始图像到任意尺寸而不造成放大的图像的失真,由此防止图像质量的恶化。
文档编号H04N7/01GK1698371SQ03824379
公开日2005年11月16日 申请日期2003年1月28日 优先权日2002年10月17日
发明者姜中庸 申请人:数码士有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1