用于选择第一编码算法与第二编码算法中的一个的装置及方法_2

文档序号:9476325阅读:来源:国知局
示所选择编码算法的输出18。
[0031]在一实施例中,与第一编码算法相关联的第一特性较好地适于音乐状及噪声状信号,而与第二编码算法相关联的第二编码特性较好地适于语音状及瞬态状信号。在本发明的实施例中,第一编码算法为音频编码算法(诸如,变换编码算法),例如MDCT (修改离散余弦变换(modified discrete cosine transform ;MDCT))编码算法,诸如 TCX(变换编码激励)编码算法。其他变换编码算法可基于FFT变换或任何其他变换或滤波器组。在本发明的实施例中,第二编码算法为语音编码算法,诸如,CELP(码激励线性预测)编码算法,诸如ACELP (代数码激励线性预测)编码算法。
[0032]在实施例中,质量测量表示感知质量测量。可计算为第一编码算法的主观质量的估计的单一值,及为第二编码算法的主观质量的估计的单一值。可仅基于此等两值的比较选择给出最佳经估计主观质量的编码算法。此情况不同于AMR-WB+标准中所进行的内容,在AMR-WB+标准中,计算表示信号的不同特性的许多特征,且接着应用分类器以决定选择哪种算法。
[0033]在实施例中,基于加权音频信号(亦即,音频信号的加权版本)的一部分估计各自品质测量。在实施例中,可将加权音频信号定义为由加权功能滤波的音频信号,其中加权功能为加权LPC滤波器A(z/g),其中A(Z)为LPC滤波器且g为介于O与I之间的重量(诸如,0.68)。结果为可以此方式获得感知质量的良好测量。应注意,在预处理平台中判定LPC滤波器A(z)及加权LPC滤波器A(z/g),且其亦用于两种编码算法中。在其他实施例中,加权功能可为线性滤波器、FIR滤波器或线性预测滤波器。
[0034]在实施例中,质量测量为加权信号域中的区段性SNR(信噪比(signal to noiserat1 ;SNR))。结果为,加权信号域中的区段性SNR表示感知质量的良好测量,且因此,其可以有益方式用作品质测量。此区段性SNR亦为ACELP及TCX编码算法两者中所使用以估计编码参数的质量测量。
[0035]另一品质测量可为加权信号域中的SNR。其他质量测量可为区段性SNR,非加权(亦即,未由(加权)LPC系数滤波)信号域中的音频信号的对应部分的SNR。其他质量测量可为倒频谱失真或杂遮比(noise-to-mask rat1 ;NMR)。
[0036]大体而言,SNR逐样本地比较原始音频信号与经处理音频信号(诸如,语音信号)。其目的在于测量再生输入波形的波形编码器的失真。SNR可经计算为如图5a中所展示,其中x(i)及y(i)为由i索引的原始样本及经处理样本,且N为样本的总数目。区段性SNR计算较短区段(诸如,Ims至10ms,诸如5ms)的SNR值的平均,而非操作全部信号。SNR可经计算为如图5b中所展示,其中N及M分别为区段长度及区段数目。
[0037]在本发明的实施例中,音频信号的部分表示通过开窗口音频信号而获得的音频信号的帧,并针对通过开窗口音频信号而获得的多个连续帧执行适当编码算法的选择。在以下规范中,结合音频信号,以可交换方式使用术语「部分」及「帧」。在实施例中,将每一帧划分成子帧,并通过计算每一子帧的SNR(转变为dB),且以dB为单位计算子帧SNR的平均,而估计每一帧的区段性SNR。
[0038]因此,在实施例中,并非估计输入音频信号与经解码音频信号之间的(区段性)SNR,而估计加权输入音频信号与加权经解码音频信号之间的(区段性)SNR。就相关此(区段性)SNR而言,可参考AMR-WB+标准(国际标准3GPP TS 26.290 V6.1.0 2004-12)的5.2.3 章。
[0039]在本发明的实施例中,基于加权音频信号的一部分的能量,并基于通过各自算法编码信号部分时所引入的估计失真估计各自质量测量,其中第一及第二估计器被配置为取决于加权音频信号的能量而判定估计失真。
[0040]在本发明的实施例中,判定在量化音频信号的部分时由用于第一编码算法的量化器所引入的估计量化器失真,并基于加权音频信号的部分的能量及估计量化器失真判定第一质量测量。在此等实施例中,可估计音频信号的部分的全局增益,使得当通过用于第一编码算法的量化器及熵编码器编码时,音频信号的部分将产生给定目标比特率,其中基于估计全局增益判定估计的量化器失真。在此等实施例中,可基于估计增益的功率判定估计量化器失真。当用于第一编码算法的量化器为均匀标量量化器时,第一估计器可被配置为使用公式D = G*G/12来判定估计量化器失真,其中D为估计量化器失真且G为估计全局增益。倘若第一编码算法使用另一量化器,则可自全局增益以不同方式判定量化器失真。
[0041]本发明人认识到,可通过使用呈其任何组合的上文特征,来以适当方式估计将在使用第一编码算法(诸如,TCX算法)编码及解码音频信号的部分时获得的质量测量(诸如,区段性SNR)。
[0042]在本发明的实施例中,第一质量测量为区段性SNR,且基于加权音频信号的对应子部分的能量及估计量化器失真,通过计算与音频信号的部分的多个子部分中的每一个相关联的估计SNR来估计区段性SNR,并通过计算与加权音频信号的部分的子部分相关联的SNR的平均,以获得加权音频信号的该部分的估计区段性SNR。
[0043]在本发明的实施例中,判定在使用自适应码本编码音频信号的部分时由用于第二编码算法的自适应码本所引入的估计自适应码本失真,并基于加权音频信号的部分的能量及估计自适应码本失真,估计第二质量测量。
[0044]在此等实施例中,对于音频信号的部分的多个子部分中的每一个,可基于由预处理平台中所判定的音调滞后转换至过去的加权音频信号的子部分的版本,近似自适应码本;可估计自适应码本增益,使得最小化加权音频信号的部分的子部分与经近似自适应码本之间的误差;且可基于由自适应码本增益按比例调整的加权音频信号的部分的子部分与经近似自适应码本之间的误差的能量,判定估计自适应码本失真。
[0045]在本发明的实施例中,可将所判定的音频信号的部分的每一子部分的估计自适应码本失真减少常数因子,以便考虑由第二编码算法中的创新码本所实现的失真减少。
[0046]在本发明的实施例中,第二质量测量为区段性SNR,且基于加权音频信号的对应子部分的能量及估计自适应码本失真,通过计算与每一子部分相关联的估计SNR来估计区段性SNR,并通过计算与子部分相关联的SNR的平均以获得估计区段性SNR。
[0047]在本发明的实施例中,基于由预处理平台中所判定的音调滞后转换至过去的加权音频信号的部分的版本,近似自适应码本;估计自适应码本增益,使得最小化加权音频信号的部分与经近似自适应码本之间的误差;并基于由自适应码本增益按比例调整的加权音频信号的部分与经近似自适应码本之间的能量,判定估计自适应码本失真。因此,可以较少的复杂性判定估计自适应码本失真。
[0048]本发明人认识到,可通过使用呈其任何组合的上文特征,来以适当方式估计将在使用第二编码算法(诸如,ACELP算法)编码及解码音频信号的部分时获得的质量测量(诸如,区段性SNR)。
[0049]在本发明的实施例中,磁滞机制用于比较估计质量测量。此操作可作出待较稳定地使用哪种算法的决定。磁滞机制可取决于估计质量测量(诸如,其间的差异)及其他参数,诸如,关于先前决定的统计、时间固定帧的数目、帧中的瞬态。就相关此等磁滞机制而言,可参考(例如)W0 2012/110448 Al。
[0050]在本发明的实施例中,用于编码音频信号的编码器包含装置10,用于执行第一编码算法的平台及用于执行第二编码算法的平台,其中取决于由控制器16作出的选择,编码器被配置为使用第一编码算法或第二编码算法来编码音频信号的部分。在本发明的实施例中,用于编码及解码的系统包含被配置为接收音频信号的部分的经编码版本,及用于编码音频信号的部分的算法的指示,并使用所指示算法解码音频信号的部分的经编码版本的编码器及解码器。
[0051]在参看图3详细描述第一估计器12及第二估计器14的实施例之前,参看图2描述编码器20的实施例。
[0052]编码器20包含第一估计器12、第二估计器14、控制器16、预处理单元22、切换器24、被配置为执行TCX算法的第一编码器平台26、被配置为执行ACELP算法的第二编码器平台28及输出接口 30。预处理单元22可为共同USAC编码器的部分,且可被配置为输出LPC系数、加权LPC系数、加权音频信号及音调滞后的集合。应注意,所有此等参数皆用于两种编码算法,亦即TCX算法及ACELP算法。因此,不必另外针对开放回路模式决定计算此等参数。在开放回路模式决定中使用已计算出的参数的优势在于节约复杂性。
[0053]在输入在线提供输入音频信号40。将输入音频信号40应用于第一估
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1