处理音频信号的方法和设备的制作方法

文档序号:2827863阅读:148来源:国知局
处理音频信号的方法和设备的制作方法
【专利摘要】本发明提供一种处理音频信号的方法和设备,所述方法包括步骤:接收对应于多个谱系数的输入音频信号;基于所述输入信号的能量来获得位置信息,所述位置信息指示所述谱系数中的特定谱系数的位置;利用所述位置信息以及所述谱系数产生形状矢量;通过搜索对应于所述形状矢量的码本来确定码本索引;以及传输所述码本索引和所述位置信息,其中通过利用从所述谱系数选择的部分来产生所述形状矢量,以及基于所述位置信息来选择所述选择的部分。
【专利说明】处理音频信号的方法和设备
[0001] 本申请是2013年2月25日提交的国际申请日为2011年8月23日的申请号为 201180041093. 7 (PCT/KR2011/006222)的,发明名称为"处理音频信号的方法和设备"的专 利申请的分案申请。

【技术领域】
[0002] 本发明涉及用于处理音频信号的设备及其方法。虽然本发明适合于广范围的应 用,但是它特别适合于对音频信号编码或解码。

【背景技术】
[0003] 压缩编码是指一系列的通过通信线路传送数字信息,或在适合于存储介质的形式 存储数字化信息的信号处理技术。在一般情况下,视频,音频和文本进行压缩编码。特别是, 对于音频进行压缩编码的技术被称为音频压缩。
[0004] 音频压缩技术可包括对音频信号进行频率变换(例如,MDCT(修正离散余弦变 换))的方法。在这样做时,将作为MDCT的结果的MDCT系数传输给解码器。如果这样的话, 解码器通过利用MDCT系数进行频率逆变换(例如,iMDCT (逆MDCT)),来重建音频信号。
[0005] 然而,近来,随着各种各样的媒体和数据传输媒体的发展,人们需要一种用于有效 地处理视频信号的方法和装置。


【发明内容】

[0006] 技术问题
[0007] 但是,在传输MDCT系数的过程中,如果传输全部数据,则可能引起降低比特率效 率的问题。如果传输诸如脉冲等等的数据,则可能引起降低重建速率的问题。
[0008] 技术方案
[0009] 因此,本发明旨在基本上避免由于现有技术的限制和缺点所致的一个或多个问 题。本发明的目的是提供一种处理音频信号的设备及其方法,通过其基于能量产生的形状 矢量(shape vector)可用于传输谱系数(例如,MDCT系数)。
[0010] 本发明的另一目的是提供一种处理音频信号的设备及其方法,通过其形状矢量被 归一化(normalize)然后被传输,以在传输形状矢量时缩小动态范围。
[0011] 本发明的另一目的是提供一种处理音频信号的设备及其方法,通过其在传输每步 骤产生的多个归一化值时,对除了值的平均值之外的其余值进行矢量量化。
[0012] 有益效果
[0013] 因此,本发明提供以下效果和/或特点。
[0014] 首先,在传输谱系数时,当传输基于能量产生的形状矢量时,能够以较少的比特数 提高重建速度。
[0015] 第二,因为将形状矢量归一化然后传输,所以本发明缩小了动态范围,从而提高了 比特效率。
[0016] 第三,本发明通过在多级中重复形状矢量产生步骤来传输多个形状矢量,从而在 不显著提高比特率的情况下更准确地重建谱系数。
[0017] 第四,在传输归一化值时,本发明单独地传输多个归一化值的平均值,并且只矢量 量化与差分矢量(differential vector)相对应的值,从而提高了比特效率。
[0018] 第五,对归一化值差分矢量进行的矢量量化的结果几乎与SNR以及分配给差分矢 量的总比特数无关,但是与形状矢量的总比特数高度相关。因此,虽然将较少的比特数分配 给归一化值差分矢量,但是在不对重建速度造成显著麻烦方面是有利的。

【专利附图】

【附图说明】
[0019] 图1是根据本发明实施例的音频信号处理设备的方框图。
[0020] 图2是描述用于产生形状矢量的处理的示意图。
[0021] 图3是描述用于通过多级(m = 0,…)处理产生形状矢量的处理的示意图。
[0022] 图4示出形状矢量的矢量量化所必需的码本的一个示例。
[0023] 图5是形状矢量的总比特数与信噪比(SNR)之间的关系的示意图。
[0024] 图6是归一化值差分码矢量的总比特数与信噪比(SNR)之间的关系的示意图。
[0025] 图7是用于比特流中包括的元素的语法的一个示例的示意图。
[0026] 图8是根据本发明一个实施例的音频信号处理设备中的解码器的构造的示意图。
[0027] 图9是其中实现根据本发明一个实施例的音频信号处理设备的产品的示意性方 框图。
[0028] 图10是说明其中实现根据本发明一个实施例的音频信号处理设备的产品之间的 关系的不意图。
[0029] 图11是其中实现根据本发明一个实施例的音频信号处理设备的移动终端的示意 性方框图。

【具体实施方式】
[0030] 为了实现这些和其他优点并根据本发明的目的,如同具体实施并宽泛描述的,根 据本发明一个实施例的处理音频信号的方法可包括步骤:接收对应于多个谱系数的输入音 频信号,基于输入信号的能量来获得位置信息,所述位置信息指示多个谱系数中的特定一 个的位置,利用所述位置信息以及所述谱系数来产生形状矢量,通过搜索对应于所述形状 矢量的码本来确定码本索引,以及传输所述码本索引和所述位置信息,其中利用从所述谱 系数选择的部分来产生所述形状矢量,并且其中基于所述位置信息来选择所选择的部分。
[0031] 根据本发明,所述方法可进一步包括步骤:产生关于指定谱系数的符号信息以及 传输所述符号信息,其中进一步基于所述符号信息来产生所述形状矢量。
[0032] 根据本发明,所述方法可进一步包括步骤:产生用于所选择的部分的归一化值。码 本索引确定步骤可包括步骤:通过利用归一化值将所述形状矢量归一化来产生归一化形状 矢量,以及通过搜索对应于所述归一化形状矢量的码本来确定所述码本索引。
[0033] 根据本发明,所述方法可进一步包括步骤:计算第一级到第M级归一化值的平均 值,利用从所述第一级到第M级归一化值减去所述平均值所得到的值来产生差分矢量,通 过搜索对应于所述差分矢量的码本来确定所述归一化值索引,以及传输所述平均值以及对 应于所述归一化值的归一化索引。
[0034] 根据本发明,输入音频信号可包括第(m+1)级输入信号,所述形状矢量可包括第 (m+1)级形状矢量,所述归一化值可包括第(m+1)级归一化值,并且基于第m级输入信号、第 m级形状矢量以及第m级归一化值可产生第(m+1)级输入信号。
[0035] 根据本发明,码本索引确定步骤可包括步骤:利用包括加权因子和所述形状矢量 的成本函数来搜索所述码本,以及确定对应于所述形状矢量的码本索引,所述加权因子可 根据所选择的部分而变化。
[0036] 根据本发明,所述方法可进一步包括步骤:利用所述输入音频信号以及对应于所 述码本索引的形状码矢量来产生残差信号,以及通过对所述残差信号进行频率包络编译来 产生包络参数索引。
[0037] 为了进一步实现这些和其他优点并根据本发明的目的,根据本发明另一实施例用 于处理音频信号的设备可包括:位置检测单元,接收对应于多个谱系数的输入音频信号,所 述位置检测单元基于输入信号的能量来获得位置信息,所述位置信息指示多个谱系数中的 特定一个的位置;形状矢量产生单元,利用所述位置信息以及所述谱系数来产生形状矢量; 矢量量化单元,通过搜索对应于所述形状矢量的码本来确定码本索引;以及复用单元,传输 所述码本索引和所述位置信息,其中利用从所述谱系数选择的部分来产生所述形状矢量, 并且其中基于所述位置信息来选择所选择的部分。
[0038] 根据本发明,所述位置检测单元可产生关于指定谱系数的符号信息,所述复用单 元可传输所述符号信息,并且可进一步基于所述符号信息来产生所述形状矢量。
[0039] 根据本发明,所述形状矢量产生单元可进一步产生用于所选择的部分的归一化 值,并通过利用所述归一化值将所述形状矢量归一化来产生归一化形状矢量。此外,所述矢 量量化单元可通过搜索对应于所述归一化形状矢量的码本来确定所述码本索引。
[0040] 根据本发明,所述设备可进一步包括用于计算第一级到第M级归一化值的平均值 的归一化值编码单元,所述归一化值编码单元利用从第一级到第M级归一化值减去所述平 均值所得到的值来产生差分矢量,归一化值编码单元通过搜索对应于所述差分矢量的码本 来确定所述归一化值索引,归一化值编码单元传输所述平均值以及对应于所述归一化值的 归一化索引。
[0041] 根据本发明,所述输入音频信号可包括第(m+1)级输入信号,所述形状矢量可包 括第(m+1)级形状矢量,所述归一化值可包括第(m+1)级归一化值,以及基于第m级输入信 号、第m级形状矢量以及第m级归一化值可产生第(m+1)级输入信号。
[0042] 根据本发明,所述矢量量化单元可利用包括加权因子和所述形状矢量的成本函数 来搜索所述码本,并确定对应于所述形状矢量的码本索引。此外,所述加权因子可根据所选 择的部分而变化。
[0043] 根据本发明,所述设备可进一步包括残差编码单元,其用于利用所述输入音频信 号以及对应于所述码本索引的形状码矢量来产生残差信号,所述残差编码单元通过对所述 残差信号进行频率包络编译来产生包络参数索引。
[0044] 本发明模式
[0045] 下面详细参照本发明的优选实施例,其示例在附图中示出。首先,不将本说明书和 权利要求书中使用的术语或词语解释为限于一般含义或字典含义,而是应当基于发明人能 够适当地限定术语的概念以便以最佳方式描述发明人的发明的原理,来解释为与本发明的 技术构思相匹配的含义和概念。本公开中公开的实施例和附图中示出的构造只是一个优选 实施例,并不代表本发明的全部技术构思。因此,应当理解,本发明涵盖本发明的修改和变 型,只要它们落入提交本申请时所附权利要求书及其等同物的范围之内。
[0046] 根据本发明,可根据以下参照来解释以下术语,并可将本说明书中未公开的其他 术语解释为与本发明的技术构思相匹配的以下含义和概念。具体而言,可以选择性地将"编 译"解释为"编码"或"解码",并且本公开中的"信息"是一般包括值、参数、系数、元素等等 的术语,并且有时候可将其含义解释为不同,本发明不限于此。
[0047] 在本公开中,广义上,音频信号在概念上区别于视频信号,并指示可以通过听觉方 式识别的所有种类的信号。狭义上,音频信号表示没有语音特性或者具有少量语音特性的 信号。应当在广义上解释本发明的音频信号。但是,如果作为区别于语音信号来使用,则本 发明的音频信号可以理解为狭义上的音频信号。
[0048] 虽然将编译仅指定为编码,但是也可将其解释为包括编码和解码两者。
[0049] 图1是根据本发明实施例的音频信号处理设备的方框图。参照图1,编码器100包 括位置检测单元110和形状矢量产生单元120。编码器100进一步包括矢量量化单元130、 第(m+1)级输入信号产生单元140、归一化值编码单元150、残差产生单元160、残差编码单 元170以及复用单元180的至少其中之一。编码器100可以进一步包括被配置为产生谱系 数的变换单元(附图中未示出),或者可以从外部设备接收谱系数。
[0050] 在以下描述中,示意性说明上述组件的功能。首先,接收或产生编码器100的谱系 数,从谱系数检测高能量采样的位置,基于检测的位置产生归一化形状矢量,进行归一化, 然后进行矢量量化。在后续的级(m= 1,…,M-1)中对信号重复进行形状矢量的产生、归一 化和矢量量化。对通过多个级产生的多个归一化值进行编码,经由形状矢量产生编码结果 的残差,然后对产生的残差进行残差编译。
[0051] 在以下描述中,详细说明上述组件的功能。
[0052] 首先,位置检测单元110接收谱系数作为(第一级(m = 0)的)输入信号\,然后 从系数检测具有最大采样能量的系数的位置。在这种情况下,谱系数对应于单个帧(例如, 20ms)的音频信号的频率变换的结果。例如,如果频率变换包括MDCT,则对应的结果可包括 MDCT(修正离散余弦变换)系数。此外,它可以对应于以低频带(4kHz或更低)上的频率分 量构造的MDCT系数。
[0053] 第一级(m = 0)的输入信号\是一组总共N个谱系数,并且可表示如下。
[0054] [公式 1]
[0055] X〇 = [x0(0), x0(l), --?, x0(N-l)]
[0056] 在公式1中,\表示第一级(m = 0)的输入信号,N表示谱系数的总数。
[0057] 位置检测单元110确定用于第一级(m = 0)的输入信号\的具有最大采样能量 的系数所对应的频率(或频率位置)km如下。
[0058] [公式 2]

【权利要求】
1. 一种解码音频信号的方法,包括: 接收位置信息、符号信息、码本索引、归一化平均值、归一化值索引、包络参数索引W及 平均能量; 利用所述位置信息W及所述符号信息来获得对应于所述码本索引的形状码矢量; 获得对应于所述归一化值索引的归一化值差分码矢量; 通过将所述归一化平均值加到所述归一化值差分码矢量,来产生归一化值码矢量;W 及 利用所述形状码矢量W及所述归一化值码矢量重建第一合成信号。
2. 根据权利要求1所述的方法,进一步包括 利用所述包络参数索引W及所述平均能量产生第二合成信号。
3. 根据权利要求2所述的方法,进一步包括 利用第一合成信号W及第二合成信号重建谱系数。
4. 根据权利要求2所述的方法, 其中所述生成第二合成信号包括: 利用所述包络参数索引W及所述平均能量重建包络参数;W及 通过将随机信号乘W所述包络参数产生所述第二合成信号。
5. 根据权利要求2所述的方法, 其中所述生成第二合成信号包括: 利用所述包络参数索引W及所述平均能量重建包络参数; 利用常数值调节所述包络参数;W及 通过将随机信号乘W所述调节的包络参数产生所述第二合成信号。
6. 根据权利要求4所述的方法, 其中利用所述包络参数索引W及所述平均能量重建包络参数包括: 获得对应于所述包络参数索引的去除平均值的分裂码矢量; 组合所述获得的分裂码矢量;W及 将所述平均能量加到所述分裂码矢量。
7. 根据权利要求1所述的方法, 其中利用码本获得所述归一化值差分码矢量。
8. -种用于解码音频信号的设备,包括: 解复用单元,所述解复用单元接收位置信息、符号信息、码本索引、归一化平均值、归一 化值索引、包络参数索引W及平均能量; 形状矢量重建单元,所述形状矢量重建单元利用所述位置信息W及所述符号信息来获 得对应于所述码本索引的形状码矢量; 归一化值解码单元,所述归一化值解码单元获得对应于所述归一化值索引的归一化值 差分码矢量,并且通过将所述归一化平均值加到所述归一化值差分码矢量来产生归一化值 码矢量;W及 第一合成单元,所述第一合成单元利用所述形状码矢量W及所述归一化值码矢量重建 第一合成信号。
9. 根据权利要求8所述的设备,进一步包括: 残差获得单元,所述残差获得单元利用所述包络参数索引w及所述平均能量产生第二 合成信号。
10. 根据权利要求9所述的设备,进一步包括: 第二合成单元,所述第二合成单元利用第一合成信号W及第二合成信号重建谱系数。
11. 根据权利要求9所述的设备, 其中所述生成第二合成信号包括: 利用所述包络参数索引W及所述平均能量重建包络参数;W及 通过将随机信号乘W所述包络参数产生所述第二合成信号。
12. 根据权利要求9所述的设备, 其中所述生成第二合成信号包括: 利用所述包络参数索引W及所述平均能量重建包络参数; 利用常数值调节所述包络参数;W及 通过将随机信号乘W所述调节的包络参数产生所述第二合成信号。
13. 根据权利要求11所述的设备, 其中利用所述包络参数索引W及所述平均能量重建包络参数包括: 获得对应于所述包络参数索引的去除平均值的分裂码矢量; 组合所述获得的分裂码矢量;W及 将所述平均能量加到所述分裂码矢量。
14. 根据权利要求8所述的设备, 其中利用码本获得所述归一化值差分码矢量。
【文档编号】G10L19/02GK104347079SQ201410539250
【公开日】2015年2月11日 申请日期:2011年8月23日 优先权日:2010年8月24日
【发明者】李昌宪, 丁奎赫, 金洛榕, 田惠晶, 李炳锡, 姜仁圭 申请人:Lg电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1