应用Golomb-Rice编码法DCT压缩法的制作方法

文档序号:7740378阅读:334来源:国知局
专利名称:应用Golomb-Rice编码法DCT压缩法的制作方法
背景技术
I.发明领域本发明涉及图形处理与压缩,尤其涉及应用Golomb-Rice的DCT系数编码法。
II.相关技术说明在数字信号处理的一般规范内,数字图片处理具有显著的地位。在数字图片处理技术与科学中,人的视觉的重要性颇引人关注。在视频信号收发领域中,诸如投影电影,正对图像压缩技术进行各种改进。许多现有的和提议的视频系统都利用了数字编码技术,包括图形编码、图像恢复与图像特征选择。图像编码表示试图以有效的方式发送数字通信信道的图片,尽量用少的位以减小所需的带宽,同时使畸变保持在一定极限之内。图像恢复是复原目标的真实图像。经通信信道发送的编码图像会被各种因素畸变,劣化源由从目标形成图像而引起。特征选择指某些图片属性的选择,这类属性为在更广泛范围内的识别、分类与判断所需。
数字电影等视频的数字编码,是一个得益于图像压缩技术改进的领域。数字图像压缩一般分为两类无损法和有损法。无损图像恢复时不损失任何信息。有损法涉及某些信息不可挽回的损失,具体视压缩比、压缩算法质量与算法实施情况而定。通常,为达到经济的数字电影法所期望的压缩比,就考虑有损压缩法。为实现数字电影质量水平,压缩法应提供目视无损水平的性能。因此,虽然压缩处理存在数学上的信息损失,但在正常观看条件下,观众应该看不出该损失造成的图像畸变。
对其它应用即电视系统已开发出诸现有的数字图像压缩技术,这类技术对原来的应用虽然作出了设计上的折衷,但并未满足电影放映所需的质量要求。
数字电影压缩技术应提供看电影的人以前经历过的观看质量。数字电影的观看质量最好要超过高质量的发行电影拷贝的质量,同时压缩技术应具有可实践的高编码效率。按本文规定,编码效率指压缩图像质量达到某一定性水平所需的位速率。而且,系统与编码技术应具有适应不同格式的内在灵活性而且是经济的,即小规模而有效的译码器或编码器处理。
现有的许多压缩技术虽具有高的压缩水平,但会造成视频信号的质量劣化。通常,传递压缩信息的技术要求压缩信息以恒定位速率传递。
既能提供高压缩水平又可对视频信号保持期望质量水平的一种压缩技术,应用了自适应定尺寸的编码“离散余弦变换(DCT)”系数数据块与分块,该技术下称“自适应块尺寸离散余弦变换(ABSDCT)法。题为“Adaptive BlockSize Image Compression Method and System”的美国专利NO.5,021,891揭示了该技术。该专利已转让给本发明的受让人,通过引用包括在这里。题为“Adaptive Block Size Image Compression Method and System”的美国专利NO.5,107,345也揭示了DCT技术,该专利已转让给本发明受让人,通过引用包括在这里。另外,题为“Adaptive Block Size Image Compression Methodand System”的美国专利NO.5,452,104还讨论了ABSDCT技术与“差分像限树变换”技术的组合使用,该专利也已转让给本发明受让人,通过引用包括在这里。这些专利所揭示的系统应用了所谓的“帧内”编码法,图像数据的各帧编码时与任何其它帧的内容无关。应用ABSDCT技术,可实现的数据率能从每秒15亿位减到每秒0.5亿位,看不出像质劣化。
ABSDCT技术可压缩黑白或彩色图像或者代表图像的信号。彩色输入信号可以是YIQ格式,Y是辉度或亮度样本,I和Q位色度或彩色样本,格式为4:4:4或另一种格式。也可应用其它已知的格式,如YUV、YCbCr或RGB格式。由于眼睛对彩色的空间灵敏度低下,大多数研究表明,沿水平与垂直方向把彩色分量的副样本减小到1/4是合适的,因而视频信号可用四个亮度分量和两个色度分量表示。
应用ABSDCT,一般把视频信号分成若干像素块来处理。对每一块,把亮度与色度分量传到块交织器,例如可把16×16(像素)块送到块交织器,后者排列或组织各16×16块内的图像样本,产生数据块和合成分块以作离散余弦变换(DCT)分析。DCT操作器是一种把时空取样的信号转换成用频率表示的方法。转换成频率表示后,DCT技术已被证明适合极高的压缩水平,因为设计的量化器可以利用图像的频率分布特性。在一实施例中,一个16×16DCT用于第一排序,四个8×8DCT用于第二排序,16个4×4DCT用于第三排序,62个2×2DCT用于第四排序。
DCT操作减少了视频源固有的空间冗余度。在DCT之后,大部分视频信号能量易集中于少数DCT系数。为减少DCT系数间的冗余度,可应用附加变换,即“差分像限树变换(DQT)”。
对16×16块和各分块,分析DCT系数值和DQT值(若仅用DQT)确定块或分块编码所需的位数,然后选用要求最少位数编码的块或分块组合代表图像段。例如,可选择两个8×8分块、六个4×4分块和八个2×2分块代表该图像段。
接着,正确地依次持选择的块或分块组合排成16×16块。然后,DCT/DQT系数值经历频率加权、量化和编码(如可变长度编码)、准备传输。上述ABSDCT技术虽然便于执行,但运算量很大,故实施该技术的硬件难以密集化。
可变长度编码法一直以连续长度与尺寸的形式实施。其它压缩法如“联合照相专家组(JPEG)”或“活动图片专家组(MPEG-2)”,都对整个处理的块尺寸应用了普通的Z字形扫描法。但应用ABSDCT,则根据数据块内的变化生成不同的块尺寸。有些编码法如Huffman码,包括一连串零再接一非零系数。然而,当源码元概率为2的负幂时,Huffman编码更优。不过在连续长度/尺寸对情况下,码元概率很少为2的负幂。
再者,Huffman编码还要求存贮预计算码字的码簿,而码簿的规模很大,最长的码字很长,故对连续长度/尺寸对码元用Huffman编码,效率并不高。

发明内容
描述一种以无损方式码量化DCT系数的连续长度与幅度以实现压缩的设备与方法。具体地说,量化后用Golomb-Rice编码法对DCT系数的零连续与非零幅度都编码。发现利用数据指数分布的方法如Golomb-Rice编码法,可实现比其它方法更高的编码效率。
本发明是一种基于质量的图像压缩系统与方法,应用了离散余弦变换系数数据自适应定尺寸的块和分块以及基于质量的量化稳定系数。像素数据块被输入编码器,后者包括一块尺寸指定(BSA)元件,把输入的像素块分割后作处理。块尺寸指定基于输入块和再细分块的变化。通常,将变化较大的区域细分成较小的块,而变化较小的区域不再细分,使块与分块的平均值落入不同的预定范围内。这样,根据其平均值,首先按其标称值修改块的变化阈值,然后将块的变化与阈值比较,若变化大于阈值,再细分该块。
将块尺寸指定供给变换元件,后者把像素数据换成频域数据。只对通过块尺寸指定选择的块和分块变换,然后经量化与串行化对变换数据标定。变换数据的量化基于某个像素亮度,诸如调节反差、系数计数、速率畸变、块尺寸指定密度的定标系数和/或过去的定标系数。Z字串行化基于对同一值建立可能的最长连续长度,然后用可变长度编码器编码数据流以供传输。应用了基于指数分布的编码法,如Golomb-Rice编码。具体而言,对表示零的数据确定零连续长度。Golovnb参数的函数,而余数被编码为零连续长度,Golomb参数和窗的函数。编码的窗与余数串接。对表示非零的数据,把非零数据编码为非零数据值及其符号的函数。编码的数据经传输信道送给译码器,像素数据重建后供显示。
因此,一实施例的一个方面不要求先验码生成。
一实施例的另一个方面不要求存贮使用的内容广泛的码簿。
一实施例的又一个方面减小了硬件实现所需的尺寸。
一实施例再一个方面实现了高编码效率。
一实施例还有一个方面利用了DCT数据的指数分布。
附图简介通过下面结合附图所作的详述,本发明的诸特征与优点就更清楚了,图中用相同的标号标识对应的物件,其中

图1是图像压缩与处理系统中编码器部分的框图;图2是图像压缩与处理系统中译码器部分的框图;图3是基于变化的块尺寸指定涉及的处理步骤的流程图;图4a示出DCT系数矩阵中零连续长度Y分量的指数分布;图4b示出DCT系数矩阵中零连续长度Cb分量的指数分布;图4c示出DCT系数矩阵中零连续长度Cr分量的指数分布;图5a示出DCT系数矩阵中幅度大小Y分量的指数分布;图5b示出DCT系数矩阵中幅度大小Cb分量的指数分布;图5c示出DCT系数矩阵中幅度大小Cr分量的指数分布;图6示出Golomb-Rice编码过程;和图7示出Golomb-Rice编码设备。
较佳实施例的详细描述为利于数字信号纯属并分享相应的好处,一般必须应用某种信号压缩形式。为实现得到图像的高度压缩,保持图像的高质量也很重要。再者,在许多场合中,密集的硬件实施还期望着运算效率。
在详述本发明一实施例之前,应该理解,本发明的应用并不限于下面描述或图示诸元件的结构与安排的细节,本发明具有其它诸实施例的功能并以各种方式实施。还应明白,本文使用的术语出于描述目的,不可视为限制。
一实施例一个方面应用的图像压缩,基于离散余弦变换(DCT)技术,诸如在1999年11月8日提交的题为“Contrast Sensitive Variance Based AdaptiveBlock Size DCT Image Compression”的共同待批美国专利申请连续号09/436,085所揭示的技术,该申请已转让给本申请受让人,通过引用包括在这里。2000年1月28日提交的题为“Quality Based Image Compression”的共同待批美国专利申请09/494,192,描述了应用DCT的图像压缩与解缩系统,该申请已转让给本申请受让人,通过引用包括在这里。通常,准备以数字域处理的图形,其像素数据被分成不重叠块的阵列,尺寸为N×N,可对每一块作二维DCT由下式定义X(k,l)=α(k)β(l)N*MΣm=0N-1Σn=0N-1x(m,n)cos[(2m+1)πk2N]cos[(2n+1)πl2N],0≤k,l≤N-1]]>式中, 并且X(m,n)是N×M块内位置(m,n)处的像素,而X(k,l)为相应的DCT系数。
因像素值非负数,故DCT分量X(0,0)总是正数,通常具有最大能量。其实对典型的图像而言,大部分变换能量集中在分量X(0,0)周围,这一能量压缩特性使DCT技术成为如此受人关注的压缩方法。
该图像压缩技术运用反差自适应编码进一步减小位速率。据观察,大多数自然的图像由变化相对慢的平坦区和目标边界域高反差结构等忙碌区组成。反差自适应编码法利用这一因素,对忙碌区分配更多的位,对不忙碌区分配较少的位。
反差自适应方法应用帧内编码(空间处理),不用帧间编码(时空处理)。帧间编码除了处理电路更复杂外,还要求多个帧缓冲器。在许多场合中,实际实施要求降低复杂性。帧内编码还适合使时空编码法效能低下的场合,如可将每秒24帧的影片归入这一类,因为机械快门造成的积分时间相对短,引起更高度的时间混淆。对于不稳定的迅速移动,设想的帧间相关性被破坏。在涉及50HZ和60HZ两种电力线频率时,帧内编码还更易标准化。目前电视信号以50HZ或60HZ发射,应用数字方式的帧内法能适应50HZ与60HZ两种操作,通过平衡帧速率与空间分辨率,甚至还适合每秒24帧的影片。
出于图像处理目的,对分为不重叠块阵列的像素数据作DCT操作。注意,虽然这里讨论的块尺寸为N×N,但可以设想出使用各种块尺寸,例如可使用N×M块的尺寸,N与M均为整数,而且M大于或小于N。另一要点是可将块分成至少一层分块,如N/ixN/i、N/ixN/j、N/ixM/j等,i和j均为整数。再者,这里讨论的示例性块尺寸是16×16像素块,带相应的DCT系数的块与分块。还可设想出各种其它整数,诸如使用奇偶整数值,例如9×9。
图1和2示出的图像处理系统100,结合了可配置串行化器的理念。该系统100包括压缩接收视频信号的编码器104。压缩信号用传输信道或物理媒体108发送,被译码器112接收,后者把收到的编码数据译码成图像样本再显示。
图像一般被分成像素块作处理。彩色信号用RGB/YC1C2转换器116从RGB空间转换到YC1C2空间,Y是辉度或亮度分量,C1与C2为色度或彩色分量。由于眼睛对彩色的空间灵敏度低下,故许多系统在水平与垂直方向把C1与C2分量的亚取样减到1/4。但亚取样并非必需。在某些场合如涉及“数字电影”的场合中,4:4:4格式的全分辨率图像极为有用或者是必需的。两种可能的YC1C2表示法是YIQ和YUV表示法,二者为本领域熟悉。还可应用YUV表示法的变型,即YCbCr,这可进一步分为奇偶分量。因而在一实施例中,使用了表示法Y-偶、Y-奇、Cb-偶、Cb-奇、Cr-偶、Cr-奇。
在一较佳实施例中,处理每个奇偶y、Cb与Cr分量,不作亚取样,因而向编码器104输入16×16像素块的六个分量。为了说明,示出Y偶分量的编码器104,对Y奇分量和奇偶C6与Cr分量同样使用编码器。编码器104包括块尺寸指定元件120,执行块尺寸指定以供视频压缩,并根据块中图像的感性特征决定对16×16块的块分解。根据16×16块内的活动性,块尺寸指定以象限树方式把各16×16块细分成更小的块,如8×8、4×4和2×2。块尺寸指定元件120生成称为PQR数据的象限树数据,长度为1~21位。因此,若块尺寸指定决定要划分一16×16块,就设置PQR数据的R位,后接Q数据对应于四个划分的8×8块的四个附加位。若块尺寸指定块定细分任一8×8块,则对各细分的8×8块添加P数据的四个附加位。
现参照图3,该流程图详细示出了块尺寸指定元件120的操作。块变化被用作决定的细分块的量度。在步骤202开始,读出像素的一个16×16块。在步骤204,计算该块的变化v16,算式如下var=1N2Σi=0N-1Σj=0N-1xi,j2-(1N2Σi=0N-1Σj=0N-1xi,j)2]]>式中N=16,Xi,j是N×N块内第i行第j列的像素。在步骤206,若块的平均值在两预定值之间,就先修改变化阈值T16。得出新阈值T’16,再将块变化与新阈值T’16比较。
若变化v16不大于阈值T16,则在步骤208把16×16块的起始地址写入暂存器,并将PQR数据的R位置0,表示不细分该16×16块。于是算法读像素下一个16×16块。若变化v16大于阈值T16,则在步骤210把PQR数据的R位置1,表示要将该16×16块细分成四个8×8块。
如步骤212所示,四个8×8块i=1∶4连续考虑再细分。在步骤214,算出各8×8块的变化v8i。在步骤216,若块的平均值在两预定值之间,就先修改变化阈值T8,得出新阈值T’8,然后将块变化与该新阈值比较。
若变化v8i不大于阈值T8,则在步骤218把8×8块的起始地址写入暂存器,相应的Q位Qi置0。然后,处理下一8×8块。若变化v8i大于阈值T8,则在步骤220将相应的Q位Qi置1,表示要将该8×8块细分成四个4×4块。
如步骤222所示,考虑四个4×4块ji=1∶4再细分。在步骤224,算出各4×4块的变化v4ij。在步骤226,若该块的平均值在两预定值之间,先修改变化阈值T4,得出新阈值T’4,再将块变化与该新阈值比较。
若变化V4ij不大于阈值T4,则在步骤228写4×4块的地址,相应的P位Pij置0,再处理下一4×4块。若变化v4ij大于阈值T4,则在步骤230将相应的P位Pij置1,表示要把该4×4块细分成四个2×2块。此外,将四个2×2块的地址写入暂存器。
阈值T16、T8与T4为预定常数。这就是硬判断。另外,可实行自适应或软判断,例如软判断根据2N×2N块的平均像素值改变诸变化的阈值,其中N可以是8、4或2,从而把平均像素值的函数用作阈值。
为了说明,看下列实例。对16×16、8×8和4×4块,分别设Y分量的预定变化阈值为50、1100和880,换言之,T16=50,T8=1100,T4=880。设平均值范围为80和100。假定对16×16块算出的变化为60。因60大于T16,而平均值90在80与100之间,故将16×16块细分成四个8×8分块。假定对8×8块算出的变化为1180、935、980与1210,因两个8×8块的变化超出78,故将这两块再细分,得出总共八个4×4分块。最后,假定八个4×4块的变化为620、630、670、610、590、525、930与690,相应的平均值为90、120、110、115,因第一个4×4块的平均值在(80,100)范围内,其阈值应减小到T’4=200,这小于880,故除了第七4×4块以外,也要细分该4×4块。
注意,对亮度分量Y奇和色度分量Cb-偶、Cb-奇、Cr-偶与Cr-奇,可用类似方法指定块尺寸。色度分量以水平、垂直两种方法取1分之一。
另须注意,虽然把块尺寸指定描述为自上而下的方式,其中首先评估最大的块(本例为16×16),但可以换用自下而上的方式,即首先评估最小的块(本例为2×2)。
再回看图1,PQR数据与选择块的地址一起送到DCT元件124,后者用PQR数据对选择的块执行合适尺寸的离散余弦变换,只是选择的块需作DCT处理。
图像处理系统100还包括减少DCT诸DC系数之间冗余度的DQT元件128。DC系数位于各DCT块的左上角,一般比AC系数大,尺寸差异造成难以设计出有效率的可变长度编码器,故减小DC系数之间的冗余度是有利的。
DQT元件对DC系数执行二维DCT,一次取2×2。从4×4块内的2×2块开始,对四个DC系数作二维DCT,这种2×2DCT称为差分像限树变换,或四个DC系数的DQT。接着,用DQT系数与一8×8块内三个邻近DC系数一起计算下一层DQT。最后,用一16×16块内四个8×8块的DC系数计算DQT。这样在16×16块内,有一个真实的DC系数,其余都是对应于DCT和DQT的AC系数。
对量化器设置变换系数(DCT与DQT两种)作量化。在一实施例中,DCT系数利用频率加权掩码(FWM)和量化标定系数作量化。FWM是一张与输入DCT系数块同尺寸的频率权重表,频率加权对不同的DCT系数加不同的权重。加权设计成强调人的视觉或光学系统对其频率分量更敏感的输入样本,不注重视觉或光学系统对其频率分量不大敏感的样本。加权法还可根据视距等因素来设计。
权重按经验数据选择。在国际标准组织于1994年发布的题为“DigitalCompression and encoding of continuous-tone still image-partlRequirements and guidelines”的ISO/IEC ITC1CD10918中,揭示了对8×8DCT系数设计加权掩码的方法,通过引用包括在这里。一般设计两个FWM,一个用于亮度分量,一个用于色度分量。通过取1/10和对8×8块内插16×16,得到块尺寸2×2、4×4的FWM表,标定系数控制了量化系数的质量与位速率。
这样,各DCT系数按下式量化DCTq(i,j)=[8*DCT(i,j)fwm(i,j)*q±12]]]>式中DCT(i,j)是输入DCT系数,fwm(i,j)是频率加权掩码,q为标定系数,DCTq(i,j)为量化的系数。注意,根据DCT系数的符号,大括号里的第一项作四舍五入。DQT系数还用适当的加权掩码量化,不过可对各Y、Cb与Cr分量应用多张表或掩码。
然后,用量化器130或标定系数元件对像素数据和频率加权掩码块标定。DCT系数量化将其大部分减为零而导致压缩。在一实施例中,有32个对应于平均位速率的标定系数。与MPEG2等其它压缩法不同,平均位速率的控制基于处理图像的质量而不是目标位速率与缓冲器状态。
为进一步提高压缩,把量化的系数送到扫描串行化器134,后者扫描量化系数块,产生串行化的量化系数流。可应用Z字形扫描、列扫描或行扫描。还可选用若干不同的Z字形扫描图案及其图案。一较佳技术对Z字形扫描应用8×8块尺寸。量化系数的Z字形扫描改善了遇到零值连续大的机会,而这种零连续本身具有递减的概率,可用Huffman码有效地编码。
串行化、量化的系数流被送到可变长度编码器138。Z编码器在零与非零系数之间分离量化系数,参照图6作详述。在一实施例中,应用了Golomb-Rice编码法,有利于编码指数分布的非负整数。应用Golomb码对指数分布状变量提供更短长度码,对压缩更佳。
在Golomb编码连续长度中,Golomb码被非负整数m参数化,如给出参数m,正整数n的Golomb编码表示为一元码的商n/m后接用修改二元码表示的余数,若该余数小于2[log2m]-m,它为[log2m]位长,否则为[log2m]位长。Golomb-Rice编码是Golomb编码的特殊情况,参数m表示为m=2K。在此情况下,通过将参数n的二进制表示右移K位得到商n/m,而n/m的余数用n的最低K位表示。因此,Golomb-Rice码是两者的串接。Golomb-Rice编码法可对两侧几何形状(指数)分布的正负两种整数编码,公式如下Pα(x)=cα|x|(1)式(1)中,α是表征X概率衰落的参数,C为归一化常数。因pα(X)是单调的,故可看出,整数值序列应满足
Pα(xi=0)≥Pα(xi=-1)≥Pα(xi=+1)≥Pα(xi=-2)≥…(2)如图4a~4c和5a~5c所示,量化的DCT系数矩阵中的零连续与幅度都具有指数分布,图中示出的分布基于来自实际图像的数据。图4a示出零连续长度与相对频率的Y分量分布400,同样地,图4b和4c示出零连续长度与相对频率410和420的Cb与Cr分量分布。图5a示出幅度大小与相对频率的Y分量分布,同样地,图5b和5c分别示出幅度大小与相对频率510和520的Cb与Cr分量分布。注意,在图5a~5c中,图表示DCT系数大小的分布。每个大小代表一系数值范围,例如四的大小值的范围为{-15,-14,……-8,8,……14,15},共16个值。同样地,+的大小值的范围为{-1023,-1022,……,-512,512,……,1022,1023},共1024个值。从图4a~4c和5a~5c可以看出,连续长度和幅度大小都具有指数分布。幅度的实际分布适合公式(3)p(Xk,l)=2λ2exp{-2λ|Xk,l|},k,l≠0---(3)]]>式(3)中,XK,l代表沿垂直与水平维度分别对应于频率K与l的DCT系数,而均值μx=1/2λ,]]>变化σx2=12λ.]]>因而在处理DCT中的数据时,以所述方式应用Golomb-Rice编码法更佳。
虽然下面描述图像数据压缩,但诸实施例同样适用于压缩音频数据的实施例。压缩图像数据时,图像或视频信号可以是例如RGB或YIQ或YUV或YCbCr分量,具有线性或对数编码像素值。
图6示出零与非零系数的编码过程600。当扫描DCT矩阵时,零与非零系数被分别处理并分开(604)。对零数据,确定零连续长度(608)。注意,连续长度为正整数。例如,若求出连续长度为n,则确定Golomb参数m(612)。在一实施例中,Golomb参数定为连续长度的函数。在另一实施例中,由式(4)确定Golomb参数(m)m=[log2n](4)另一方法是用计数器或寄存器统计连续长度的长度和有关的Golomb参数(616)。为编码零连续长度n,对商作编码(620)。在一实施例中,商被定为零连续长度和Golomb参数的函数。在另一实施例中,商(Q)由式(5)确定Q=[n/2m] (5)
在一实施例中,商Q以一元码编码,要求Q+1位。接着,对余数编码(624)。在一实施例中,余数被编码为连续长度与商的函数。在另一实施例中,用式(6)确定余数(R)R=n-2mQ (6)在一实施例中,余数R以m位二进制码编码。之后确定商Q与余数R,将Q与R的代码串接起来(628),代表零连续长度n的总码。
非零函数也用Golomb-Rice编码。因系数幅度可正可负,故必须使用符号位并编码给定幅度的绝对值。给出的非零函数的幅度为x,可把该幅度表示为幅度绝对值与符号的函数。因此,可用式(7)把幅度表示为y 相应地,非零系数值有选择地用计数器或寄存器统计(632)。然后,判断该幅度大于还是等于零(636),若是,把该值编码为给出值的二倍(640);若不是,则把该值编码为小于绝对值二倍的值(644)。还可应用其它映射方法,关键在于不要求区分值符号的额外位。
编码公式(7)表示的幅度,造成x的正值为偶整数,负值变成奇整数。而且,该映射法把x的概率指定保留在式(2)中。式(7)所示的编码法,其优点是可避免用符号位代表正负数。映射后,以对零连续同样的方式对y编码,操作一直连续到当前块中扫描了所有的系数。
重要的是,虽然本发明诸实施例把系数值和连续长度定为式(1)~(7)的函数,但不一定应用精密的公式(1)~(7)。利用Golomb-Rice编码和DCT系数的指数分布,可更有效地压缩音像数据。
由于编码后的零连续与非零幅度区分不出,故必需应用固定长度的专用前缀码来标志第一零连续的出现。在遇到一非零幅度后,通常在块中会遇到全零,此时使用块结束(EOB)码而不用Golomb-Rice码更有效。EOB码仍可选为专用固定长度码。
根据式(1)或(3),DCT系数矩阵中幅度或连续长度的概率分布用α或λ参数化,这意味着若出现不是一特定DCT系数块的范围,就可提高编码效率,于是可使用一合适的Golomb-Rice参数编码有关量。在一实施例中,对每个连续长度与幅度大小值用计数器或寄存器来计算各自累计值和相应的该值出现次数。例如,若存贮累计值与累计元件数的寄存器分别为Rrl与Nrl,则下面的式(6)可用作编码连续长度的Rice-Golomb参数[log2RrlNrl]---(6)]]>对幅度可应用类似方法。
回过来再看图1,编码器104生成的压缩图像信号,可用缓冲器142暂存,然后用传输信道108发送给译码器112。传输信道108可以是物理媒体,如磁学或光学存贮装置,或是有线或无线传输处理或设备。含块尺寸指定信息的PQR数据也送到译码器112(图2),后者包括缓冲器164和可变长度译码器168,译码器168对连续长度值和非零值译码,其操作方式与图6所述译码器相似但相反。
可变长度译码器168的输出供给逆串行化器172,后者按采用的扫描法排列诸系数。例如,若应用混合的Z字形扫描、垂直扫描和水平扫描,逆串行化器172就根据应用的扫描类型正确地重排诸系数。逆串行化器172接收PQR数据,帮助将诸系数正确地排列成一合成系数块。
由于使用了量化器标定系数和频率加权掩码,为使处理恢复原状,把合成块送给逆量化器174。
若应用了差分像限树变换,则把系数块送到IPQT元件186,后接IDCT元件190,否则直接送到IDCT元件190。IDQT和IDCT元件186与190对系数作逆变换,产生像素数据块。然后该像素数据必须内插转换成RGB形式,再存贮起来供将来显示。
图7示出一Golomb-Rice编码设备700,该设备较佳地执行图6所述的过程。确定器704确定连续长度(n)和Golomb参数(m)。或者对每个连续长度与幅度大小值用计数器或寄存器708计算各自的累计值和相应的该值出现的次数。编码器712将商(Q)编码为连续长度和Golomb参数的函数。在另一实施例中,编码器712还把非零数据编码为非零数据值及其符号的函数。Q值与R值用串接器716串接。
作为举例,结合本文揭示的诸实施例描述的诸示例性逻辑块、流程图和步骤,可用硬软件实现,包括专用集成电路(ASIC)、可编程逻辑装置、分立门或晶体管逻辑、诸如寄存器与FIFD等分立硬件元件、执行固件指令组的处理器、任一普通可编程软件与处理器或它们的任何组合。处理器以微处理器有利,但也可以是任一普通处理器、控制器、微控制器或状态机。软件可驻留于RM、闪光天存储器、ROM、寄存器、硬盘、可卸盘、CD-ROM、DVD-ROM或本领域已知的任何其它形式的存贮媒体。
前述诸较佳实施例供本领域技术人员制作或应用本发明,对这些实施例的各种修正对他们是显而易见的,本文限定的一般原理可应用于其它实施例而无须应用创造才智。因此,本发明并不限于本文所示的诸实施例,而是负荷本文揭示的原理与新特征最广泛的范围。
本发明的其它特征和优点在下面的权利要求中提出。
权利要求
1.一种对表示量化频率的数据进行编码的方法,所述数据包括表示零与非零的数据,其特征在于,该方法包括确定零连续长度(n);把Golomb参数(m)定为零连续长度的函数;把商(Q)编码为零连续长度和Golomb参数的函数;把余数(R)编码为零连续长度、Golomb参数和商的函数;和串接编码的商与编码的余数;而且对于表示非零的数据,把非零数据编码为非零数据值及非零数据值符号的函数。
2.如权利要求1所述的方法,其特征在于,用公式m=[log2n]来确定Golomb参数(m)。
3.如权利要求1所述的方法,其特征在于,用公式Q=[n/2m]来确定商(Q)。
4.如权利要求1所述的方法,其特征在于,用公式R=n-2mQ来确定余数(R)。
5.如权利要求1所述的方法,其特征在于,用下式把所述非零数据的编码定为y值 式中,x是准备编码的非零数据的幅度。
6.一种在数字影院系统中压缩数字图像的方法,所述图像包括被分离成彩色分量的像素数据,其特征在于,该方法包括以下操作读取像素数据的一组彩色分量;生成块尺寸指定,将该组像素彩色分量分成像素数据分块;把所述像素数据分块变换成相应的频域表述;和把频域表述换算成数据流,其中的换算操作基于与像质相关的品质量度;把来自所述数据流的至少一组数据编成用一16×16块表示的数据;把16×16数据组分成用四个8×8块表示的组;对四个8×8数据块的每一块作串行化;和用指数分布对串行化数据作连续长度编码。
7.如权利要求6所述的方法,其特征在于,所述连续长度编码是累计值和特定值相应出现次数的函数。
8.如权利要求6所述的方法,其特征在于,用下式确定连续长度码[log2RrlNrl]]]>式中,Rrl是诸元的累计值,Nrl是该特定值相应出现的次数。
9.如权利要求6所述的方法,其特征在于,换算操作还包括向所述像素数据分块提供频率加权的掩码,使频率加权掩码强调人的视觉系统更敏感的图像部分,而不重视人的视觉系统不大敏感的图像部分。
10.如权利要求6所述的方法,其特征在于,变换操作执行离散余弦变换。
11.如权利要求6所述的方法,其特征在于,变换操作执行离散余弦变换,然后是差分像限树变换(Differential Quad-tree Transform)。
12.一种对表示量化频率的数据进行编码的设备,所述数据包括表示零与非零的数据,其特征在于,该方法包括对于表示零的数据,确定零连续长度(n)的装置;把Golomb参数(m)定为零连续长度的函数的装置;把商(Q)编码为零连续长度和Golomb参数的函数的装置;把余数(R)编码为零连续长度、Golomb参数和商的函数的装置;和串接编码的商与编码的余数的装置;而对于表示非零的数据,把非零数据编码成该非零数据值及所述非零数据值符号的函数的装置。
13.如权利要求12所述的设备,其特征在于,用公式m=[log2n]确定所述Golomb参数(m)。
14.如权利要求12所述的设备,其特征在于,用公式Q=[n/2m]来确定商(Q)。
15.如权利要求12所述的设备,其特征在于,用公式R=n-2mQ来确定余数(R)。
16.如权利要求12所述的设备,其特征在于,用下式把非零数据的编码确定为y值 式中,x为准备编码的非零数据的幅度。
17.如权利要求12所述的设备,其特征在于,还包括统计零连续长度和非零幅值及这些值相应出现次数的装置。
18.一种在数字影院系统中压缩数字图像的设备,所述图像包括像素数据,所述像素数据分离成诸彩色分量,其特征在于,该设备包括以下操作读取一组像素数据彩色分量的装置;生成一块尺寸指定以把该组像素的彩色分量分成像素数据分块的装置;把像素数据分块变换成频域表述的装置;和把频域表述换算成数据流的装置,其中,换算操作基于与图像质量相关的品质量度;把至少一组来自数据流的数据编成可用16×16块表示的数据的装置;把该组16×16数据分成可用四个8×8块表示的组的装置;使四个8×8数据块的每一块串行化的装置;和用指数分布对串行化数据作连续长度编码的装置。
19.如权利要求18所述的设备,其特征在于,所述连续长度编码是累计值和特定值相应出现次数的函数。
20.如权利要求18所述的设备,其特征在于,用下述公式来确定连续长度码,[log2RrlNrl]]]>式中,Rrl是诸元的累计值,Nrl是该特定值相应出现的次数。
21.如权利要求18所述的设备,其特征在于,换算装置还包括向所述像素数据分块提供频率加权掩码的装置,使频率加权掩码强调人的视觉系统更敏感的图像部分,而不重视人的视觉系统不大敏感的图像部分。
22.如权利要求18所述的设备,其特征在于,变换装置配置成执行离散余弦变换。
23.如权利要求18所述的设备,其特征在于,变换操作执行离散余弦变换接着作差分象限树变换。
24.如权利要求18所述的设备,其特征在于,还包括统计尺寸值和这些值在串行化数据中相应出现次数的装置。
25.一种对表示量化频率的数据进行编码的设备,所述数据包括表示零与非零的数据,其特征在于,该设备包括对于表示零的数据,第一确定器,配置成确定零连续长度(n);第二确定器,配置成把Golomb参数(m)定为零连续长度的函数;编码器,配置成把商(Q)编码为零连续长度和Golom参数的函数,并配置成把余数(R)编码为零连续长度、Golomb参数和商的函数,而对于表示非零的数据,则把非零数据编码为该非零数据值及所述非零数据值的符号的函数;和串接器,配置成串接经编码的商与经编码的余数。
26.如权利要求25所述的设备,其特征在于,用公式m=[log2n]来确定Golomb参数(m)。
27.如权利要求25所述的设备,其特征在于,用公式Q=[n/2m]来确定商(Q)。
28.如权利要求25所述的设备,其特征在于,用公式R=n-2mQ来确定余数(R)。
29.如权利要求25所述的设备,其特征在于,用下式把非零数据的编码定为y值 式中,x是准备编码的非零数据的幅度。
30.如权利要求25所述的设备,其特征在于,还包括一计数器,被配置成统计零连续长度和非零幅值及这些值相应出现的次数。
全文摘要
提出一种对量化频率表示的数据编码的设备与方法(600),所述数据包括零和表示非零的数据。对表示零的数据,确定零连续长度。把Golomb参数定为该零连续长度的函数,商编码为零连续长度和Golomb参数的函数,余数编码为零连续长度、Golomb参数和商的函数。编码的商与余数串接。对表示非零的数据,把非零数据编码为该非零数据值及其符号的函数。
文档编号H04N7/30GK1550104SQ02816802
公开日2004年11月24日 申请日期2002年6月17日 优先权日2001年6月29日
发明者K·蒂亚加拉简, K 蒂亚加拉简 申请人:高通股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1