基于方差的自适应块大小dct图像压缩的制作方法

文档序号:7612206阅读:230来源:国知局
专利名称:基于方差的自适应块大小dct图像压缩的制作方法
背景技术
I.发明领域此项发明与图像处理有关。具体的是,此项发明与利用编码离散余弦变换系数数据的自适应大小排列的块和子块的图像信号压缩方案有关。
II.相关技术描述在视频信号传输和接收例如用于放映电影或影片的领域中,对于图像压缩技术正得到不同的改进。许多现有的和提出的视频系统都是用数字编码技术。数字编码为抗减损比如多径衰落和干扰或信号干扰的通信连接提供了健全性,这些减损中的每一个都不同地严重降低图像质量。此外,数字技术促进使用信号加密技术,发现此项技术在政府的和许多新兴发展商业广播应用中是有用的或者甚至是必要的。
高清晰度视频是从改进的图像压缩技术得益的领域。当一开始被提出时,由于过多的带宽需求,高清晰度视频的在空间传输(或甚至通过有线或光纤传输)象是无法实现的。典型的无线或其他设计的传输系统不容易提供足够的带宽。然而,可以意识到的是,数字视频信号的压缩可以使传输达到能利用合理带宽的水平。如此水平的信号压缩与信号的数字传输结合在一起,能使视频系统在占用更理想和更有用的带宽时以对信道减损有更大的抗据性以更小的功率来传输。
一种能提供很高压缩水平而又能保持视频信号质量的理想水平的压缩技术是利用编码离散余弦变换(DCT)系数数据的自适应大小排列的块和子块。这项技术以下被称作为自适应块大小差分余弦变换(ABSDCT)方法。这项技术是在美国专利号5021891题为《自适应块大小图像压缩方法与系统》中提出的,它已分转让此项发明的受让人,通过引用而加入于此。DCT技术也在美国专利号5107345题为《自适应块大小图像压缩方法与系统》中提出,它已转让给此项发明的受让人,通过引用而加入于此。此外,ABSDCT技术与差分四叉树变换技术的结合应用在美国专利号5452104题为《自适应块大小图像压缩方法与系统》中有论述,它也已转让给此项发明的受让人,通过引用而加入于此。在这些专利中提出的系统利用了被称作为帧内编码的技术,在这里图像数据的每一帧都经过编码而无须理会任何其他帧的内容。利用ABSDCT技术,可以达到的数据速度可以从大约15亿比特每秒减少到约5000万比特每秒而没有图像质量的可辨降低。
ABSDCT技术可用来压缩黑白的也可用来压缩彩色的图形或由图像表示的信号。彩色输入信号可以是YIQ格式的,在每个4×4的像素块中,Y是亮度或明亮度样本,而I和Q是色度或色彩样本。其他已知的格式比如YUV或RGB格式也可以利用。由于眼睛对于色彩的低空间敏感度,大多数研究显示通过在横向和纵向上四倍色彩成分的子抽样是合理的。因此,视频信号可以表示为四个亮度成分和两个色度成分。
利用ABSDCT,视频信号一般被分割成处理的像素块。对于每个块,亮度和色度成分被传递到块交织器。例如一个16×16的(像素)块被送进块交织器,它将每个16×16块内的图像抽样进行排序或组织来产生数据的块和合成子块以进行离散余弦变换(DCT)分析。DCT算法是将时间抽样信号转换到相同信号的频率表示的一种方法。通过转换到频率表示,显示DCT技术可以涉及很高水平的压缩,因为量化器可被设计成利用图像的频率分布特性。在一个最佳实施例中,把一个16×16的DCT用于第一阶,把四个8×8的DCT用于第二阶,把16个4×4的DCT用于第三阶,把64个2×2的DCT用于第四阶。
DCT的操作减少了视频来源中固有的空间冗余。在进行DCT之后,大多数视频信号能量都趋向集中于几个DCT系数。可以利用一个附加的变换,差分四叉树变换(DQT)减少DCT系数之间的冗余。
对于16×16的块和每个子块,分析DCT系数值和DQT值(如利用了DQT)确定编码块或子块所需的比特数。然后选择需要最少比特数编码的块或子块的组合来代表图像片断。例如,可以选择两个8×8的子块,六个4×4的子块和八个2×2的块来代表图像片断。
然后适当地把选择的块或子块的组合整齐地排进16×16的块中。接着DCT/DQT的系数值就可以进行频率加权、量化以及编码(比如可变长度编码),以准备传输。
虽然以上所述的ABSDCT技术实现非常良好,但是它在计算上是增强的。这样,技术的小型硬件执行就会变得困难。这就需要一种可选的技术来使硬件执行变得更有效率。通过以下方式描述的此项发明提供一种计算更有效率的图像压缩方法和系统发明概述此项发明是利用离散余弦变换系数数据的自适应大小排列的块和子块进行图像压缩的系统与方法。在一个实施例中,16×16的像素块输入到一个编码器中。编码器包括一块大小分配元件,它分割输入的像素块以进行处理。块大小的分配是根据输入块和子块的方差(variances)。大体上,带有较大方差的区域将在被分成更小的块,反之带有较小方差的区域就不再分割了,倘若块与子块的平均值进入预定的不同区间。这样,首先根据它的平均值从标称值修改块的方差阈值,然后把块的方差与阈值作比较,如果方差比阈值要大,那么就再分割此块。
块大小的分配被提供给变换元件,它把像素数据变换成频域数据。变换只在选择的块和子块上通过块大小分配来完成。变换的数据然后再经过量化和串行化。例如,利用之字形的扫描可以使数据连续产生一数据流。然后把这数据流通过可变大小编码器进行编码以准备传输。编码数据通过传输信道被送到解码器中,那里像素数据在准备显示时被重构。
附图简述当结合在其中全部相应地标注相同符号的图,从以下提出的详细描述中此项发明的特征、目的和优点将会变得更加明显,其中

图1是合并此项发明基于方差的块大小分配系统和方法的图像处理系统的方框图。
图2是说明设计基于方差的块大小分配的处理步骤的流程图。
图3a、3b和3c说明了典型的块大小分配、相应的四叉树分解和相应的PQR数据。
实施例具体描述为了促进数字信号的数字传输并且享受相应的好处,使用一些形式的信号压缩一般是必要的。为了在得到的图像中达到高分辨率,保持图像的高质量也是重要的。此外,也要考虑对于小型硬件执行的计算有效性,它在许多应用中是重要的。
此项发明提供了在实现图像压缩中既考虑图像质量又考虑计算有效性的图像压缩系统或设备和方法。此项发明的图像压缩是根据离散余弦变换技术。通常,在数字域中处理的图像是由分为一列N×N大小无交迭块的像素数据所组成的。可以在每个块上应用二维的DCT。二维的DCT通过以下关系是来确定X(k,l)=α(k)β(l)NΣm=0N-1Σn=0N-1x(m,n)cos[(2m+1)πk2N]cos[(2n+1)πl2N],0≤k,l≤N-1]]>其中, 以及x(m,n)是在N×M块内的像素位置(m,n),以及X(k,l)是相应的DCT系数。
由于像素值是非负的,所以DCT分量X(0,0)已知是正的并且通常有最多的能量。事实上,对于典型的图像,大多数变换能量都集中在分量X(0,0)的周围。这个能量压缩特性使DCT技术成为有吸引力的压缩方法。
此项发明的图像压缩技术使用了对比自适应编码来完成更进一步的比特速率减少。可以发现,大多数自然图像都由单调的相对慢的变化区域和复杂的区域比如物体边界和高对比的结构组成。对比自适应编码方案通过分配更多的比特给复杂的区域而分配更少的比特给不复杂的区域来利用这个因素。
对比自适应编码对于减少抑制效应也是有用的。在其他DCT编码技术的执行中,抑制效应可能是对于图像质量的最重大的损害了。此外,抑制效应在图像的复杂区域趋向于更加显著。然而,可以理解的是,当用更小DCT时,抑制效应就会减少。当使用2×2的DCT时,抑制效应几乎是看不到的,虽然每个像素的比特性能都会受损失。这样,对比自适应编码可以通过给复杂区域分配更小的块(从而有更多比特)及给相对空的区域更大的块来减小抑制效应。
此项发明的又一个特征就是它使用了帧内编码(空间处理)从而代替帧间编码(时空处理)。采用帧内编码的一个理由是需要处理帧间编码信号的接收机的高度复杂性。帧间编码除更复杂的处理电路之外还需要多重帧缓冲。在许多应用中,减少复杂性对于实际执行是需要的。
使用帧内编码的第二个理由是可能存在一种情况或程序设备能使时空编码方案停顿以及很差地执行。例如,每秒24帧的电影由于积分时间就能归于这个范畴,因为机械快门相对较短。短的积分时间就容许了更高程度的空间混叠。帧对帧相关性的假设会为了快速的运动而停顿,因为它变得很急动了。
还有使用帧内编码的理由是对于当50Hz和60Hz的功率线频率都涉及时,时空编码方法是更难以标准化。现在电视传输信号既有50Hz又有60Hz。成为数字途径的帧内方案的利用既能使和50Hz的操作又能适合60Hz的操作,甚至可以通过空间分辨率对帧速率的折衷适应于每秒24帧的电影。
为了图像处理,在被分成一列无交迭块的像素数据上进行DCT操作。值得注意的是,虽然在这里讨论的块大小是N×N的,但是可以想象可以使用不同的块大小。例如,可以使用N×M块大小,在这里M和N都是整数,M可以大于N也可以小于N。另一个重要方面就是块至少可分为一级子块,比如N/i×N/i、N/i×N/j、N/i×M/j等等,这里i和j都是整数。此外,在这里讨论的典型的块大小是有相应DCT系数的块与子块的16×16像素的块。更进一步可以想象的是,也可以使用其他不同的整数比如偶的或奇的整数值,如9×9。
现在参照图1,显示了合并此项发明压缩系统的图像处理系统100。图像处理系统100包含压缩接收的视频信号的编码器102。通过传输信道104传输压缩信号,并由解码器106接收。解码器106把接收的信号解码成图像抽样,然后再显示。
一般,图像被分为像素块来处理。可以把一色彩信号从RGB空间转换到YC1C2空间,Y是亮度或明亮度分量,而C1和C2是色度或色彩分量。由于眼睛对色彩的低空间敏感度,许多系统通过在横向和纵向上四倍子抽样C1和C2分量。然而,子抽样不是必要的。如已知4∶4∶4格式的高清晰度图像在一些诸如被称作为“数字影像”的应用中或是很有用的或是必要的。两个可能的YC1C2表示是YIQ表示和YUV表示,在此技术中这两者都广为所知了。还可以使用称作YCbCr的YUV表示的变形。
在一较佳实施例中,处理Y、Cb和Cr分量中的每一个都无需子抽样。这样,16×16的像素块的输入就提供给编码器102。编码器102包含块大小分配元件108,它在准备视频压缩中进行块大小的分配。块大小分配元件108根据在块中图像的感知特性确定16×16块的分解。块大小分配根据在块内的活动把每个16×16的块以四叉树的形式再分为更小的块。块大小分配元件产生四叉树数据,称作为PQR数据,它的长度可以在1到21比特之间。这样,如果块大小分配确定16×16的块要被分割,那么设定PQR数据的R比特,并紧跟着相应的四个分割后的8×8块的P数据的四个附加比特。如果块大小分配确定8×8块中的任意一块还要再分割,那么就要加上对于每个再分的8×8块的Q数据的四个附加比特。
现在参照图2,提供了显示块大小分配元件108操作细节的流程图。算法用块的方差作为决定再分块的尺度。在步骤202开始,读取一16×16的像素块。在步骤204计算16×16块的方差v16。计算方差如下所示var=1N2Σi=0N-1Σj=0N-1xi,j2-(1N2Σi=0N-1Σj=0N-1xi,j)2]]>在这里N=16,而xi,j是在N×N块内第i行第j列的像素。在步骤206,首先如果块的平均值在两个预定值之间就修改方差阈值T16提供新的阈值T’16,然后比较块的方差和新的阈值T’16。
如果方差v16不比阈值T16大,那么在步骤208就写入16×16块的始地址,而PQR数据的R比特就设定为0表示16×16的块无需再分了。算法然后读取下一个16×16的像素块。如果方差v16比阈值T16大,那么在步骤210,PQR数据的R比特就设定为1表示16×16的块要再分为四个8×8的块。
如步骤212所示,四个8×8的块,i=1∶4,可以考虑继续进一步再分。对于每个8×8的块,在步骤214计算方差v8i。在步骤216,首先如果块的平均值在两个预定值之间就修改方差阈值T8提供一个新的阈值T’8,然后比较块的方差和新的阈值。
如果方差v8i不比阈值T8大,那么在步骤218就写入8×8块的始地址,而相应的Q比特Qi就设定为0。然后处理下一个8×8的块。如果方差v8i比阈值T8大,那么在步骤220,相应的Q比特Qi就设定为1表示8×8的块要再分为四个4×4的块。
如步骤222所示,四个4×4的块,ji=1∶4,可以考虑继续进一步再分。对于每个4×4的块,在步骤224计算方差v4ij。在步骤226,首先如果块的平均值在两个预定值之间就修改方差阈值T4提供一个新的阈值T’4,然后比较块的方差和新的阈值。
如果方差v4ij不比阈值T4大,那么在步骤228就写入4×4块的地址,而相应的P比特Pij就设定为0。然后处理下一个4×4的块。如果方差v4ij比阈值T4大,那么在步骤230,相应的P比特Pij就设定为1表示4×4的块要再分为四个2×2的块。此外,写入4个2×2块的地址。
可以预先确定阈值T16、T8和T4为常数。作为硬判决这是已知的。二者选一地,可以执行自适应判决或软判决。软判决根据2N×2N块的平均像素值改变方差的阈值,在这里N可以是8、4或2。这样,平均像素值的函数就可以被用作阈值了。
为了说明,考虑以下这个例子。让预定的Y分量对于16×16、8×8和4×4的块的方差阈值分别为50、1100和880。换句话说,就是T16=50,T8=1100以及T16=880。让平均值的区间在80和100之间。假设计算的16×16块的方差是60。由于60和它的平均值90大于T16,所以把16×16的块再分为四个8×8的子块。假设计算的8×8块的方差是1180、935、980和1210。由于8×8块中的有两个方差超过T8,所以这两个块要在进一步分割产生总共八个4×4的子块。最后,假设八个4×4块的方差是620、630、670、610、590、525、930和690,相应的平均值是90、120、110、115。由于第一个4×4块的平均值落进区间(80,100)中,所以它的阈值将会降低到T’4=200,它小于880。因此,这个4×4的块将会被再分,第七个4×4块同样也要再分。最终的块大小分配如图3a所示。相应的四叉树分解如图3b所示。另外,通过这个块大小分配产生的PQR数据如图3c所示。
值得注意的是,利用相似的过程为色彩分量C1和C2分配块大小。色彩分量可以在横向、纵向或在两者上抽取。
另外值得注意的是,虽然块大小分配被描述为自顶向下的方法,其中首先要估计最大的块(在此例中是16×16),但是还可以用自底向上的方法代替。自底向上的方法首先要估计最小的块(在此例中是2×2)。
回到图1,将要描述图像处理系统110的剩余部分。PQR数据随同所选块的地址被送到DCT元件110。DCT元件110用PQR数据在所选块上进行适当大小的离散余弦变换。只有所选块才需要接受DCT处理。
图像处理系统100可以随意包含减少DCT的DC系数间冗余的DQT元件。在每个DCT块的顶部左角遇到一DC系数。一般DC系数与AC系数比较起来是大的。在大小上的差异使设计有效的可变长度编码器变得困难。因此,减少DC系数间的冗余是有利的。
DQT元件112在DC系数上进行两维的DCT,每次进行2×2。以4×4块内的2×2块开始,在四个DC系数上进行两维的DCT。这个2×2的DCT被称作为四个DC系数的差分四叉树变换,或DQT。接着,用DQT的DC系数随同三个与8×8块的相邻的DC系数计算下一级的DQT。最后,用16×16块内的四个8×8块的DC系数计算DQT。这样,在16×16块中有一个真DC系数,而剩下的是相应于DCT和DQT的AC系数。
变换系数(DCT和DQT两者的)提供给量化器114来量化。在一较佳实施例中,用频率加权掩码(FWM)和量化标度因子来量化DC系数。FWM是与输入DCT系数的块相同维数的频率权数表。频率权数对于不同的DCT系数施加不同的权数。权数被设计成突出带有满足人类视觉系统更敏感的频率的输入抽样,而不突出带有满足视觉系统不太敏感的频率的抽样。也可以根据诸如观看距离等因素来设计权数。
根据经验数据选择权数。在1994年国际标准组织的ISO/IEC JTC1 CD 10918“连续色调静止图像的数字压缩和编码—第一部分需求和原则”中公开了为8×8 DCT系数设计加权掩码的方法,通过引用而加入于此。一般设计两个FWM,一个针对亮度分量而一个针对色度分量。通过抽取得到2×2、4×4块大小的FWM表,而通过插补8×8块的FWM表得到16×16块的FWM表。标度因子控制被量化系数的质量和比特率。
这样,每个DCT系数都根据关系式量化DCTq(i,j)=|8*DCT(i,j)fwm(i,j)*q±12|]]>在这里DCT(i,j)是输入DCT系数,fwm(i,j)是频率加权掩码,q是标度因子以及DCTq(i,j)是被量化的系数。值得注意的是,根据DCT系数的符号,在大括号里的第一项会被上舍入或下舍入。也利用合适的加权掩码量化DQT系数。然而,可对Y、Cb和Cr分量的每一个利用多个表或掩码。
被量化的系数提供到之字形扫描并串行转换器116。并串行转换器116以之字形的方式扫描被量化系数的块产生串行被量化系数流。也可以选择一些不同之字形扫描方式,还可以选择除了之字形以外的方式。最佳技术对于之字形扫描使用了8×8的块大小,虽然可以使用其它大小。
值得注意的是,之字形扫描并串行转换器116可以被放置在量化器114之前也可以之后。网络结果是相同的。
在任何情况下,被量化系数流提供给可变长度编码器118。可变长度编码器118可以利用后接哈夫曼编码的零的行程编码。这项技术在上述美国专利号5021891、5107345和5452104中详细讨论,在这里摘录一下。行程编码器提取被量化系数,并从非零系数中分离出零。零值被称作为行程值并且进行哈夫曼编码。非零值单独进行哈夫曼编码。
被量化系数的修正哈夫曼编码也是合理的并用于较佳实施例中。这里,在之字形扫描后,行程编码器将确定在每个8×8块内的行程/大小对。然后对这些行程/大小对进行哈夫曼编码。
哈夫曼编码可以从图形的测量统计设计,也可以从图像的理论统计设计。已经发现的是,大多数自然图像都由空白或相对慢的变化区域和复杂的区域比如物体边界和高对比的结构组成。频域变换如DCT的哈夫曼编码通过分配更多比特给复杂区域以及更少比特给空白区域来利用这个特征。一般哈夫曼编码利用查询表来对行程和非零值进行编码。一般使用多个表,在此项发明中使用3个表为最佳,虽然可以据需要使用1或2个表。
由编码器102产生的的压缩图像信号通过传输通道104被传输到解码器106。包含块大小分配信息的PQR数据也被提供给解码器106。解码器106包含可变长度解码器120,它解码行程值和非零值。
可变长度解码器120的输出提供到反向之字形扫描并串行转换器122来根据扫描的方式排列系数。反向之字形扫描并串行转换器122接收PQR数据帮助把系数正确排序成为合成系数块。
合成块提供给反向量化器124,由于频率加权掩码的使用而取消处理过程。
如果已使用了差分四叉树变换,那么系数块提供给IDQT元件126,后面接着IDCT元件128。否则,系数块就直接提供给IDCT元件128。IDQT元件126和IDCT元件128逆变换系数产生一像素块数据。然后可以需要把像素数据插入、转换成RGB形式,然后为将来显示而存储。
因此,提出了根据像素方差进行块大小分配的图像压缩的系统和方法。基于方差块大小分配提供了几个优点。因为在确定块大小之后进行离散余弦变换,所以完成了有效的计算。计算上加强的变换只需在所选块上进行。此外,块选择处理是有效的,是由于像素值的方差算术上很容易计算。基于方差的块大小分配还有的优点就是它是基于知觉的。像素方差是块中活动的量度,它提供了边缘、结构等存在的表示。它趋向于获取块的细节,这比测量如像素值的平均要好得多。这样,基于方差此项发明方法分配更小的块给有更多边缘的区域,更大的块给更单调的区域。结果,就可以在重构的图像中得到出众的画质。
还有一个重要的优点就是由于是在量化之前进行块大小分配,所以在控制比特率和质量中提供了更大的适应性。由于方差阈值适应于本地装置,所以可以在相对黑的区域分配小的块。这保持了所有正好在显著的视觉阈值以上的区域中的细节。此外,不同于如MPEG的方法量化范围因数从低值变化到高值之时,基于方差的图像压缩导致了图像质量的适度降低。这对于如在数码电影的领域中是特别关键的。
有了高需求的数字图像,盗版就是一个严重的威胁。数字水印就是一个重要的需求来阻止版权的侵害和收入的损失。因为在图像显著重要的区域制作了水印,所以基于方差的块大小分配对于水印就是一个很自然的候选。
以上提供较佳实施例的描述来使任何熟练于此项技术的人都能利用该项发明。对于这些实施例不同的修改对熟练于技术的人是特别明显的,并且在其中定义的一般原理也可应用于其他实施例而无须使用创造能力。这样,不使该项发明仅限于这里说明的实施例,而是使其符合与这里公开的原理和新颖特征一致的最宽的范围。
权利要求
1.一种确定输入图像像素块的块大小分配的方法,所述块大小分配将在压缩所述输入块时使用,所述方法包含的步骤有读取像素数据块;根据所述像素数据块和所述像素数据块的子块的像素值的方差产生块大小分配;以及提供包含有关所述块大小分配的信息的数据结构。
2.按权利要求1所述的方法,其特征在于所述产生的步骤还进一步包含的步骤有确定所述像素数据块的像素值的方差;比较所述方差和阈值;根据所述比较步骤的结果决定再细分所述块;如果所述决定是再细分所述块,那么对每个子块重复进行确定、比较和作决定的步骤直到满足预定的标准;以及指定每一不再细分的块作为所述块大小的分配。
3.按权利要求2所述的方法,其特征在于所述决定的步骤要求如果所述方差大于所述阈值,块就要再分。
4.按权利要求3所述的方法,其特征在于所述阈值是预定的。
5.按权利要求3所述的方法,其特征在于所述阈值是被评估的块的像素平均值的函数。
6.按权利要求2所述的方法,其特征在于所述阈值对于每个再分的级别都要改变。
7.按权利要求2所述的方法,其特征在于所述对于不再重复进行确定、比较和作决定步骤的预定标准是根据像素数据的预选最小块大小的。
8.一种压缩像素数据块的图像压缩系统包含根据所述像素数据块和所述像素数据块的子块的像素值的方差选择待压缩的所述块或者所述块的子块的块大小分配装置;把所述选中的块或子块转换成频域数据的转换装置;量化所述频域数据的量化装置;扫描所述量化数据变为一个连续的数据流的串行化器;以及在准备传输中编码所述连续数据流的可变长度编码装置。
9.按权利要求8所述的系统,其特征在于所述块大小分配装置确定所述像素数据块的像素值的方差、比较所述方差和阈值、根据所述比较步骤的结果决定再细分所述块,如果所述决定是再细分所述块,那么对每个子块重复进行方差确定、与阈值作比较和作细分决定的步骤直到满足预定的标准,以及指定每一不再细分的块作为所述块大小的分配。
10.按权利要求9所述的系统,其特征在于所述再分的决定要求如果所述方差大于所述阈值,块就再分。
11.按权利要求10所述的系统,其特征在于所述阈值是预定的。
12.按权利要求10所述的系统,其特征在于所述阈值是被评估块的像素平均值的函数。
13.按权利要求9所述的系统,其特征在于所述阈值对于每个再分的级别都要改变。
14.按权利要求9所述的系统,其特征在于所述不再细分预定的标准是根据获得的像素数据的预选最小块大小的。
15.按权利要求8所述的系统,其特征在于所述变换装置进行离散余弦变换。
16.按权利要求8所述的系统,其特征在于所述变换装置进行后跟差分四叉树变换的离散余弦变换。
17.按权利要求8所述的系统,其特征在于所述串行化器包含之字形扫描器。
18.按权利要求17所述的系统,其特征在于所述之字形扫描器使用8×8块大小进行之字形扫描。
19.按权利要求8所述的系统,其特征在于所述可变长度编码装置包含哈夫曼编码器。
20.按权利要求19所述的系统,其特征在于所述哈夫曼编码器使用多个查询表对行程和非零值进行编码。
21.按权利要求20所述的系统,其特征在于有三个查询表。
22.一种压缩图像的像素数据块的方法,包含的步骤有读取像素数据块;根据所述像素数据块和所述像素数据块的子块的像素值的方差产生块大小分配;以及提供包含有关所述块大小分配的信息的数据结构;把由所述数据结构指示的所述选中块的像素数据转换成频域表示;量化所述频域数据;扫描所述量化数据变为一个连续的数据流;以及在准备传输中编码所述连续数据流。
23.按权利要求22所述的方法,其特征在于所述产生的步骤还进一步包含的步骤有确定所述像素数据块的像素值的方差;比较所述方差和阈值;根据所述比较步骤的结果决定再细分所述块;如果所述决定是再细分所述块,那么对每个子块重复进行确定、比较和作决定的步骤直到满足预定的标准;以及指定每一不再细分的块作为所述块大小的分配。
24.按权利要求23所述的方法,其特征在于所述决定的步骤要求如果所述方差大于所述阈值,块就要再分。
25.按权利要求24所述的方法,其特征在于所述阈值是预定的。
26.按权利要求24所述的方法,其特征在于所述阈值是被评估的块的像素平均值的函数。
27.按权利要求23所述的方法,其特征在于所述阈值对于每个再分的级别都要改变。
28.按权利要求23所述的方法,其特征在于所述对于不再重复进行确定、比较和作决定步骤的预定标准是根据像素数据的预选最小块大小的。
29.按权利要求22所述的方法,其特征在于在所述变换步骤期间进行离散余弦变换。
30.按权利要求22所述的方法,其特征在于在所述变换步骤期间进行后跟差分四叉树变换的离散余弦变换。
31.按权利要求22所述的方法,其特征在于在所述扫描步骤期间进行之字形扫描。
32.按权利要求31所述的方法,其特征在于用8×8的块大小进行所述之字形扫描。
33.按权利要求22所述的方法,其特征在于在所述编码步骤进行哈夫曼编码。
34.按权利要求33所述的方法,其特征在于哈夫曼编码使用多个查询表对行程和非零值进行编码。
35.按权利要求34所述的方法,其特征在于有三个查询表。
全文摘要
提出利用离散余弦变换系数数据自适应大小的块和子块进行图像压缩的系统和方法。在编码器中的块大小分配元件选择将要处理的一组输入像素的块和子块。选择是根据像素值的方差进行的。带有的方差比阈值更大的块再被细分,而带有的方差比阈值小的块不再被细分。变换元件把所选块的像素值变换到频域中。然后频域值可被量化、连续化以及在传输的准备中被编码成不同大小。
文档编号H04N7/30GK1421102SQ00818271
公开日2003年5月28日 申请日期2000年11月8日 优先权日1999年11月8日
发明者K·赛阿格拉坚, M·J·玛瑞特 申请人:高通股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1