算术编码或算术解码的方法和设备的制作方法

文档序号：7520639阅读：329来源：国知局

专利名称：算术编码或算术解码的方法和设备的制作方法
技术领域：
本发明涉及多媒体数据的算术编码和解码。
背景技术：
算术编码是一种数据无损压缩的方法。算术编码基于概率密度函数(PDF)。为了达到压缩效果，编码所基于的概率密度函数必须与数据实际遵循的实际概率密度函数相同或至少相似一越接近越好。如果算术编码基于适当概率密度函数，则可以实现导致至少几乎最佳代码的显著压缩。因此，在编码和解码系数序列的音频、语音或视频编码中，算术编码是一种频繁使用技术，其中这些系数是用二进制表示的视频像素或音频或语音信号样本值的量化时频变换。为了进一步提高压缩，算术编码可以基于一组概率密度函数，其中用于编码当前系数的概率密度函数取决于所述当前系数的背景。也就是说，取决于出现具有相同量化值的系数的背景，可以将不同概率密度函数用于编码所述相同量化值。系数的背景通过包含在与各自系数相邻的一个或多个相邻系数的邻域，例如，序列中相邻地在要编码或要解码的各自系数前面的一个或多个已编码或已解码系数的子序列中的系数的量化值来定义。邻域可能出现的每种不同可能定义每一种被映射成概率密度函数的不同可能背景。事实上，只有当邻域足够大时所述压缩提高才变得明显。随之而来的是不同可能背景的数量的组合激增以及相应数量巨大的可能概率密度函数或相应复杂映射。在如下文献中可以找到基于背景算术编码方案的一个例子IS0/IECJTC1/SC29/ WG11N10215, October 2008，Busan, Korea，提出统一语音和音频编码(USAC)的参考模型。按照该建议，将已经编码的4元组G-tuples)考虑为背景。在如下文献中可以找到基于USAC相关背景算术编码的另一个例子IS0/IEC JTC1/SC29/WG11N10847, July 2009, London, UK。为了降低高阶条件熵编码中的复杂性，美国专利5，298, 896提出了限定码元 (symbol)的非均勻量化。

发明内容
与要处理的数量巨大背景相对应，存在需要存储，检索和处理的数量巨大概率密度函数或从背景到概率密度函数的至少相应复杂映射。这提高了编码/解码延迟和存储容量要求的至少一种。因此，在技术上需要一种允许在降低编码/解码延迟和存储容量要求的至少一种的同时，几乎一样好地实现压缩的可替代解决方案。为了解决这种需要，本发明提出了包含权利要求1的特征的编码方法、包含权利要求2的特征的解码方法、包含权利要求13的特征的算术编码设备、包含权利要求14的特征的算术解码设备、和按照权利要求15所述的存储介质。在从属权利要求中规定了进一步提出实施例的特征。
算术编码或解码的所述方法将前谱系数分别用于当前谱系数的算术编码或解码，其中所述前谱系数是已经分别编码或解码的。所述前谱系数和所述当前谱系数两者都被包含在视频、音频或语音信号样本值的量化时频变换所得的一个或多个量化谱中。所述方法进一步包含处理前谱系数，将处理后前谱系数用于确定作为至少两个不同背景类别之一的背景类别，将所确定背景类别和从至少两个不同背景类别到至少两个不同概率密度函数的映射用于确定概率密度函数，以及根据所确定概率密度函数算术分别编码或解码当前谱系数。该方法的一个特征是处理前谱系数包含非均勻地量化前谱系数的绝对值。将背景类别替代背景用于确定概率密度函数便于将得出不同但非常相似概率密度函数的两个或更多个不同背景分组成映射到单个概率密度函数的单个背景类别。该分组是通过将前谱系数的非均勻量化绝对值用于确定背景类别实现的。例如，存在处理前谱系数包含确定前谱系数的量化绝对值之和以便用在确定背景类别中的实施例。类似地，存在算术编码设备的相应实施例，以及算术解码设备的相应实施例，其中的处理部件适用于确定前谱系数的量化绝对值之和以便用于确定背景类别。在设备的进一步实施例中，所述处理部件适用于使处理前谱系数进一步包含按照第一量化方案量化前谱系数的绝对值的第一量化、确定按照第一量化方案量化的前谱系数的绝对值的方差的方差确定、将所确定方差用于选择至少两种不同非线性第二量化方案之一、和按照所选择非线性第二量化方案进一步量化按照第一量化方案量化的前谱系数的绝对值的第二量化。所述方法的进一步实施例包含相应步骤。所述方差确定可以包含确定按照第一量化方案量化的前谱系数的绝对值之和，并将所确定和值与至少一个阈值相比较。在进一步实施例中，每种设备的所述处理部件可以适用于使处理导致第一后果或至少一个不同第二后果。然后，确定背景类别进一步包含确定对其处理导致第一后果的那些前谱系数的数量，并将所确定数量用于确定背景类别。每种设备可以包含接收模式切换信号和复位信号的至少一种的部件，其中所述设备适用于将所接收信号的至少一种用于控制背景类别的确定。所述至少两个不同概率密度函数可以通过将代表性数据集用于确定至少两个不同概率密度函数事先确定，所述映射可以使用查找表或散列表实现。

本发明的示范性实施例例示在附图中，并在如下描述中得到更详细说明。这些示范性实施例只是为了阐明本发明，而不是限制定义在权利要求书中的本发明范围和精神而说明的。在附图中图1示范性地描绘了本发明编码器的一个实施例；图2示范性地描绘了本发明解码器的一个实施例；图3示范性地描绘了确定背景类别的背景分类器的第一实施例；图4示范性地描绘了确定背景类别的背景分类器的第二实施例；图fe示范性地描绘了要在频域模式下编码或解码的当前谱区(bin)之前的前谱区的第一邻域；图恥示范性地描绘了要在加权线性预测变换模式下编码或解码的当前谱区之前的前谱区的第二邻域；图6a示范性地描绘了要在频域模式下编码或解码的当前最低频谱区之前的前谱区的第三邻域；图6b示范性地描绘了要在频域模式下编码或解码的当前次最低频谱区之前的前谱区的第四邻域；图7a示范性地描绘了要在加权线性预测变换模式下编码或解码的当前最低频谱区之前的前谱区的第五邻域；图7b示范性地描绘了要在加权线性预测变换模式下编码或解码的当前次最低频谱区之前的前谱区的第六邻域；图7c示范性地描绘了要在加权线性预测变换模式下编码或解码的当前第三最低频谱区之前的前谱区的第七邻域；图7d示范性地描绘了要在加权线性预测变换模式下编码或解码的当前第四最低频谱区之前的前谱区的第八邻域；图8示范性地描绘了要编码或解码的不同谱区的邻域，所述不同谱区包含在要在频域模式下开始编码/解码或出现复位信号之后编码或解码的第一频谱中；以及图9示范性地描绘了要在加权线性预测变换模式下编码或解码的不同谱区的进一步邻域，所述不同谱区被包含在要在在加权线性预测变换模式下开始编码/解码或出现复位信号之后编码或解码的第二频谱中。
具体实施例方式本发明可以在包含相应适配的处理设备的任何电子设备上实现。例如，算术解码的设备可以在电视机、移动电话、个人计算机、mp3播放器、导航系统或汽车音响系统中实现。算术编码的设备可以在移动电话、个人计算机、有源汽车导航系统、数字照相机、数字摄像机或录音机等中实现。下文描述的示范性实施例涉及量化多媒体样本的时频变换所得的量化谱区的编码或解码。本发明基于将已经发射量化谱区，例如，序列中当前量化谱区BIN之前的前量化谱区用于确定用于分别算术编码和解码当前量化谱区BIN的概率密度函数的方式。算术编码或算术解码的方法和设备的所述示范性实施例分别包含用于非均勻量化的步骤或部件。所有步骤或部件一起提供最高编码效率，但每个步骤或部件已单独实现本发明的构思，并提供与编码/解码延迟和/或存储要求有关的好处。因此，详细的描述应该理解为描述只实现所述的步骤或部件之一的示范性实施例，以及描述实现所述的步骤或部件的两个或更多个步骤或部件的组合的示范性实施例。可以但无需包括在本方法的示范性实施例中的第一步骤是决定应该使用哪种一般变换模式的切换步骤。例如，在USAC无噪编码方案中，一般变换模式可以是频域(FD)模式或加权线性预测变换(wLPT)模式。每种一般模式可以将已编码或解码谱区的不同邻域，即，不同的选择用于确定PDF。此后，可以在模块背景生成COCL下确定当前谱区BIN的背景。根据确定的背景，通过分类背景确定背景类别，其中在分类之前，最好但未必通过背景的谱区的非均勻量化NUQl处理背景。分类可以包含估计背景的方差VES并将方差与至少一个阈值相比较。或者，直接从背景中确定方差估计值。然后将方差估计值用于控制最好但未必非线性的进一步量化NUQ2。在示范性地描绘在图1中的编码过程中，确定适当概率密度函数(PDF)来编码当前量化谱区BIN。为此，只能使用在解码器方也已知的信息。也就是说，只能使用前编码或解码量化谱区。这是在背景分类器块COCL中完成的。在那里，所选前谱区定义用于确定实际背景类别的邻域NBH。背景类别可以通过背景类别号表示。背景类别号用于经由映射 MAP，例如，经由查找表或散列表从PDF存储器MEMl中检索相应PDF。背景类别的确定可能取决于允许视所选模式而定使用不同邻域的一般模式开关GMS。如上所述，对于USAC，可能存在两种一般模式(FD模式和wLPT模式)。如果一般模式开关GMS是在编码器方实现的，则模式改变信号或当前一般信号必须被包含在位流中，以便解码器也知道它。例如，在ISO/ IEC JTC1/S(^9/WG11N10847，2009年7月，英国伦敦，提出的统一语音和音频编码(USAC)的参考模型中，存在为发送一般模式而提出的表格4. kore mode和表格4. 5core modeO/1。在确定了适合算术编码器AEC编码当前量化谱区BIN的PDF之后，将当前量化谱区BIN馈入邻域存储器MEM2中，即，当前谱区BIN变成前谱区。包含在邻域存储器MEM2中的前谱区可以被块COCL用于编码下一个谱区BIN。在存储当前谱区BIN期间，之前或之后，通过算术编码器AEC算术编码所述当前谱区BIN。将算术编码器AEC的输出存储在位缓冲器BUF中或直接写入位流中。可以经由，例如，电缆或卫星发送或广播位流或缓冲器BUF的内容。或者，可以将算术编码谱区写在像DVD、硬盘、蓝光盘等那样的存储媒体上。PDF存储器MEMl和邻域存储器MEM2可以在单个物理存储器中实现。复位开关RS可以便于不用知道前谱地在可以开始编码和解码的专用帧上不时重新开始编码或解码，专用帧被称为解码入口点。如果复位开关RS是在编码器方实现的，则复位信号必须被包含在位流中，以便解码器也知道它。例如，在IS0/IEC JTC1/SC29/ WGimi0847，2009年7月，英国伦敦，提出的统一语音和音频编码(USAC)的参考模型中，在 WD 表格 4. 10 和表格 4. 14 中存在 arith reset flag。在图2中示范性地描绘基于相应邻域的解码方案。它包含与编码方案相似的块。要用于算术解码的PDF的确定与编码方案相同，以保证在编码器和解码器两者中，确定的 PDF相同。算术解码从位缓冲器BUF中或直接从位流中获取位，并使用确定的PDF解码当前量化谱区BIN。之后，解码的量化谱区馈入背景类别号确定块COCL的邻域存储器MEM2中，并可以用于解码下一个谱区。图3更详细地示范性描绘了确定背景类别的背景分类器COCL的第一实施例。在将当前量化谱区BIN存储在谱存储器MEM2中之前，可以在块NUQl中对其进行非均勻量化。这具有两方面好处其一，使通常是16位带码元整数值的量化谱区的存储更有效，其二，减少了每个量化谱区具有的值的数量。这使得在块CLASS中的背景类别确定过程中极大地减少了可能背景类别。更进一步，由于在背景类别确定中，可能舍弃了量化谱区的码元，所以可以在非均勻量化块NUQl中包括绝对值计算。在表1中，示出了如块NUQl可以进行的示范性非均勻量化。在本例中，在非均勻量化之后，每个谱区可能有三个不同值。但是，一般说来，非均勻量化的唯一约束是减少一个谱区可能采用的值的数量。
权利要求
1.一种使用前谱系数算术解码当前谱系数的方法，所述前谱系数是已经解码的，并且所述前谱系数和当前谱系数两者都被包含在视频、音频或语音信号样本值的量化时频变换所得的一个或多个量化谱中，所述方法包含-处理前谱系数；-将处理后前谱系数用于确定作为至少两个不同背景类别之一的背景类别；-将所确定背景类别和从至少两个不同背景类别到至少两个不同概率密度函数的映射用于确定概率密度函数；以及-根据所确定概率密度函数算术解码当前谱系数，其中-处理前谱系数包含非均勻地量化前谱系数的绝对值以便在背景类别的确定中使用。
2.一种使用前谱系数算术编码当前谱系数的方法，所述前谱系数是已经编码的，并且所述前谱系数和当前谱系数两者都被包含在视频、音频或语音信号样本值的量化时频变换所得的一个或多个量化谱中，所述方法包含-处理前谱系数；-将处理后前谱系数用于确定作为至少两个不同背景类别之一的背景类别；-将所确定背景类别和从至少两个不同背景类别到至少两个不同概率密度函数的映射用于确定概率密度函数；以及-根据所确定概率密度函数算术编码当前谱系数，其中-处理前谱系数包含非均勻地量化前谱系数的绝对值以便在背景类别的确定中使用。
3.如权利要求1或2所述的方法，其中将前谱系数的量化绝对值之和用于背景类别的确定。
4.如权利要求1或2所述的方法，其中处理前谱系数包含按照第一量化方案量化前谱系数的绝对值的第一量化步骤，确定按照第一量化方案量化的前谱系数的绝对值的方差的步骤，将所确定方差用于选择至少两种不同非线性第二量化方案之一的步骤，以及按照所选择非线性第二量化方案进一步量化按照第一量化方案量化的前谱系数的绝对值的第二量化步骤。
5.如权利要求4所述的方法，其中确定按照第一量化方案量化的前谱系数的绝对值的方差的步骤包含确定按照第一量化方案量化的前谱系数的绝对值之和，并将所确定和值与至少一个阈值相比较。
6.如前面权利要求之一所述的方法，其中所述处理导致第一后果或至少一个不同第二后果，以及确定背景类别进一步包含-确定被非均勻量化成第一后果的前谱系数的数量；以及-将所确定数量用于确定背景类别。
7.如权利要求6所述的方法，其中前谱系数之一优选于其余前谱系数，所述方法进一步包含将前谱系数当中的优选前谱系数的非均勻量化用于确定背景类别。
8.如权利要求7所述的方法，其中前谱系数当中的所述优选前谱系数被包含在前谱中，并且所述当前谱系数被包含在不同当前谱中，所述优选前谱系数和所述当前谱系数以相同频率被包含在各自谱中。
9.如权利要求8所述的方法，其中所述不同当前谱进一步包含其余前谱系数在低于所述相同频率的频率上的至少一个。
10.如前面权利要求之一所述的方法，所述方法进一步包含 -接收模式切换信号和复位信号的至少一种；以及-将至少一种所接收信号用于控制确定背景类别的步骤。
11.如前面权利要求之一所述的方法，所述方法进一步包含 -将代表性数据集用于确定至少两个不同概率密度函数。
12.如前面权利要求之一所述的方法，其中所述映射是使用查找表或散列表实现的。
13.一种使用前谱系数算术编码当前谱系数的设备，所述前谱系数是已经编码的，并且所述前谱系数和当前谱系数两者都被包含在视频、音频或语音信号样本值的量化时频变换所得的一个或多个量化谱中，所述设备包含-处理前谱系数的处理部件；-确定作为至少两个不同背景类别之一的背景类别的第一部件，所述第一部件适用于将处理后前谱系数用于确定背景类别；-确定概率密度函数的第二部件，所述第二部件适用于将所确定背景类别和从至少两个不同背景类别到至少两个不同概率密度函数的映射用于确定概率密度函数；以及 -根据所确定概率密度函数算术编码当前谱系数的算术编码器，其中 -所述处理部件适用于非均勻地量化前谱系数的绝对值以便在背景类别的确定中使用。
14.一种使用前谱系数算术解码当前谱系数的设备，所述前谱系数是已经解码的，并且所述前谱系数和当前谱系数两者都被包含在视频、音频或语音信号样本值的量化时频变换所得的一个或多个量化谱中，所述设备包含-处理前谱系数的处理部件；-确定作为至少两个不同背景类别之一的背景类别的第一部件，所述第一部件适用于将处理后前谱系数用于确定背景类别；-确定概率密度函数的第二部件，所述第二部件适用于将所确定背景类别和从至少两个不同背景类别到至少两个不同概率密度函数的映射用于确定概率密度函数；以及 -根据所确定概率密度函数算术解码当前谱系数的算术解码器，其中 -所述处理部件适用于非均勻地量化前谱系数的绝对值以便在背景类别的确定中使用。
15.一种携带按照权利要求2-12之一的方法算术编码的算术编码谱系数的存储介质。
全文摘要
本发明提出了使用前谱系数算术编码当前谱系数的方法和设备。所述前谱系数是已经编码的，并且所述前谱系数和前谱系数当前谱系数两者都被包含在视频、音频或语音信号样本值的量化时频变换所得的一个或多个量化谱中。所述方法包含处理前谱系数；将处理后前谱系数用于确定作为至少两个不同背景类别之一的背景类别；将所确定背景类别和从至少两个不同背景类别到至少两个不同概率密度函数的映射用于确定概率密度函数；以及根据所确定概率密度函数算术编码当前谱系数，其中处理前谱系数包含非均匀地量化前谱系数的绝对值以便在背景类别的确定中使用。
文档编号H03M7/40GK102577133SQ201080045319
公开日2012年7月11日申请日期2010年10月1日优先权日2009年10月9日
发明者O.维波尔特申请人:汤姆森特许公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：O.维波尔特
技术所有人：汤姆森特许公司
我是此专利的发明人

上一篇：现场设备的光电传感灵敏度调节的制作方法
上一篇：半导体继电器的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、田老师：1: 建筑节能绿色建筑能耗的模拟与检测(EnergyPlus)；建筑碳排放和生命周期评价；城市微气候、建筑能耗与太阳能技术的相互影响；地理信息系统(GIS)和空间回归方法用于城市建筑能耗分析；不确定性、敏感性分析和机器学习方法应用于建筑能耗分析(R)；贝叶斯方法用于城市和单体建筑能源分析 2: 过
2、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
3、毕老师：机构动力学与控制
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、周老师：1.智能机器人技术 2.智能检测与控制技术 3.机构运动学与动力学 4.机电一体化技术
如您是高校老师，可以点此联系我们加入专家库。