一种用于音频处理框架中的编码和解码方法

文档序号:2829648阅读:247来源:国知局
专利名称:一种用于音频处理框架中的编码和解码方法
技术领域
本发明涉及信号处理中的编、解码技术,特别是一种用于音频处理框 架中的编码和解码方法。
背景技术
音频编解码技术主要包括可以很好利用心理声学模型的T/F (时/频) 转换的方法,和对音频信号模型参数提取的方法。现有的音频处理框架中, AAC (Advance Audio Coding,高级音频编码)框架利用的是T/F转换的 方法,而AMR-WB+ (Extended Adaptive Multi-rate wideband Codec,多 码率可调宽带扩展编解码)框架则同时利用了这两种方法从而对不同信号 进行不同处理。该AMR-WB+框架包括预处理,核心编解码,立体声处理,带宽扩展4 个部分。其中,该核心编码方法流程如图1所示预处理后的低频信号将 将继续进行模式选择,该模式选择是对各TCX (Transform coded excitation,变换编码激励)模式和ACELP (Algebraic Code Excited Linear Prediction,线性预测及代数码本激励)模式的选择;然后再对 信号进行LPC (linear prediction coding,线性预测编码)分析,然后 依据上述模式选择的结果进行TCX80、 TCX40、 TCX20、 ACELP中某一种模
式进行编码流程后将编码码流输出。该TCX20、 TCX40、 TCX80三种模式均 依次包括加权滤波、T/F转换、参数量化步骤。再请参阅图2,它是对应 于上述编码方法的解码方法。如图所示该方法依次包括码流解析、TCX 和ACELP模式选择、TCX80或TCX40或TCX20或ACELP解码流程后输出低 频码流;其中,TCX80、 TCX40、 TCX20解码流程进一步包括F/T转换和LPC 综合等步骤。在上述AMR-WB+核心编码方法中,由于LPC分析主要考虑信号的前后 相关特性,而对于噪声信号,信号的前后相关性较弱,因此对噪声进行LPC 分析显得没有意义,既浪费时间,也占用有限的比特数。同时原有核心编 码方法中使用了复杂的模式选择步骤,也就是说对噪声信号也进行复杂的 模式选择操作,进一步降低了编码处理的效率。发明内容本发明的目的在于提供一种用于音频处理框架中的编码和解码方法, 解决上述1L有技术中所存在的技术问题,降低编、解码方法的复杂度,提 高了编、解码方法的处理效率。为解决上述问题,本发明是这样实现的一种用于音频处理框架中的编码方法,其特征是该方法步骤为-A经过预处理后的低频信号将首先通过噪声检测模块进行噪声检测, 若检测结果是噪声,则执行步骤C,否则,执行步骤B;B信号将继续进行TCX和ACELP模式选择,对信号进行LPC分析,然
后依据模式选择的结果进行TCX80、 TCX40、 TCX20、 ACELP其中一种模式 进行编码流程;在上述四种模式流程中,首先将使用LPC分析所得参数对 信号进行LPC加权滤波步骤,再执行相应模式下的编码,最终将LPC系数、 模式,及该模式下的编码参数一起编码后输出;C信号将直接进行1024 T/F转换,并对转换后的频谱参数,及相关 噪声因子、频谱增益进行量化,同时记录下噪声标志,编码后输出。该噪声检测模块由过零率提取模块、低频能量提取模块、总能量提取 模块、加权能量提取模块和多边界判决模块组成;其中该过零率提取模块用于从输入信号中提取信号符号的变化率,从而获 取信号的基本频率变化;该低频能量提取模块用于从输入信号中提取信号低频部分的能量,从 而获取了信号低频信息量;该总能量提取模块用于从输入信号中获取信号总体能量大小,从而宏 观的获取了信号包含的总信息量;该加权能量提取模块用于获得根据输入信号的基本频谱特征加权后 的能量;该多边界判决模块用于根据上述四个模块获取的参数值与预先通过 分析得到这四种参数的相关域值进行多边界判决,决策出输入是否是噪声信号。该音频处理框架是AMR-WB+框架。一种对应于如上所述编码方法的解码方法,其特征是该解码步骤为- D输入码流通过码流解析后,根据是否具有所述的噪声标志来判断是 否为噪声信号;若是噪声信号,则执行步骤F;否则,执行E步骤;E信号依据解析的编码模式,LPC系数,编码参数进行相应的TCX80、 TCX40、 TCX20、 ACELP解码流程后输出;该TCX解码流程包括F/T转换和 LPC综合步骤;F信号进行1024 F/T转换后,即可输出。藉由上述技术方案,本发明的有益效果是本发明编、解码方法中增加了一噪声检测模块进行噪声检测,且无需 对噪声进行LPC分析和复杂的模式选择操作,因此,降低编、解码方法的复杂度,提高了编、解码方法的处理效率。


图1是现有AMR-WB+框架编码方法流程示意图;图2是现有AMR-WB+框架解码方法流程示意图;图3是本发明方法的AMR-WB+框架编码方法实施例的流程示意图;图4是AMR-WB+框架编码方法实施例中噪声检测模块的结构示意图;图5是本发明方法的AMR-WB+框架解码方法实施例的流程示意图。
具体实施方式
以下结合图3 — 5 ,以及一基于AMR-WB+框架的编、解码方法实施 例对本发明方法作进一步详细描述。如图3所示,它是一种基于现有音频处理框架(AMR-WB+框架) 的编码方法流程示意图。该编码方法包括如下步骤-第一步经过预处理后的低频信号将首先通过噪声检测模块进行噪声 检测,若检测结果是噪声,则执行第三步,否则,执行第二步;第二步信号将继续进行TCX和ACELP模式选择,对信号进行LPC分 析,然后依据模式选择的结果进行TCX80、 TCX40、 TCX20、 ACELP其中一 种模式进行编码流程;在上述四种模式流程中,首先将使用LPC分析所得 参数对信号进行LPC加权滤波步骤,再执行相应模式下的编码,最终将LPC 系数、模式,及该模式下的编码参数一起编码后输出;第三步信号将直接进行1024 T/F转换,并对转换后的频谱参数, 及相关噪声因子、频谱增益进行量化,同时记录下噪声标志,编码后输出。上述编码方法中所使用的噪声检测模块结构,请参阅图4。如图所示它由过零率提取模块、低频能量提取模块、总能量提取模块、加权能量提取模块和多边界判决模块组成;其中该过零率提取模块用于从输入信号中提取信号符号的变化率,从而获取信号的基本频率变化;该低频能量提取模块用于从输入信号中提取信号低频部分的能量,从而获取了信号低频信息量;该总能量提取模块用于从输入信号中获取信号总体能量大小,从而宏观的获取了信号包含的总信息量;该加权能量提取模块用于获得根据输入信号的基本频谱特征加权后的能量;该多边界判决模块用于根据上述四个模块获取的参数值与预先通过分析得到这四种参数的相关域值进行多边界判决,决策出输入是否是噪声信号。该噪声检测模块的功能是对输入原始信号(语音/音频)和随机噪声(环境噪声)进行分类。 一般来说,输入的信号包括四大类音频信号
(有一定周期性)、元音语音信号(voiced speech,有一定周期性并且较 好的符合线性预测模型)、非元音语音信号(unvoiced speech,有着随机 性但是较好的符合线性预测模型)和随机噪声(具有随机性)。该噪声 检测模块就可以区分出其中的随机噪声。在上述的TCX信号处理中,信号FFT分析之前要对其加窗,IFFT之后要对信号加窗叠加。对于不同的模式,加窗的长度与叠加的数值都 将有所不同。在AMR-WB+框架中定义了前一帧模式为 ACELP,TCX20,TCX40,TCX80的情况下的加窗长度及叠加方法。本方法 中对TCX模式到噪声信号的切换,叠加数据将使用前一帧信号LPC综 合后的信号。对于噪声帧加窗采用TCX80模式下相同的方法。在上述编码方法实施例中,由于LPC分析对噪声信号意义不大,因 此噪声信号LPC系数所包含的信息量可以忽略。因此,对于高频处理及 立体声处理模块中使用到低频段LPC系数的情况下,将忽略LPC系数 的模块,使其利用低频段LPC处理的输出直接等于输入,不做任何操作, 即A (z) =1。以下是本编码实施例的算法复杂度分析由于噪声信号只需要做噪声检测和T/F转换,而省去了 16阶的线 性预测分析和模式选择(Mode Selection)部分。而对于非噪声信号则多 做了噪声检测模块。通常来说,在正常通话中,大约有50%是没有语音 信号存在,即只有噪声。在通常的音频序列里,也有20%左右的时候是 没有音频信号存在的。通常的16阶线性预测分析和模式选择部分是非 常耗时的。如果满足以下的式子,那么算法复杂度可以减少
噪声出现率一噪声检测模块复杂度/(16阶线性预测复杂度+模式选择复杂度)此处,16阶线性预测复杂度为N2/2 ,模式选择有开环与闭环两种 方法,对于开环模式选择复杂度为182N,闭环模式选择复杂度为910N, 噪声检测模块复杂度将因具体算法的不同而不同,上述编码实施例中噪 声检测模块复杂度为16N,其中N为帧长,这里取256。噪声出现率将 因不同的信号而不同,这里取30%。这样对于开环模式选择 每帧减少复杂度=0.3 - 4096 /(32768 + 46592) = 0.3 - 0.05 = 0.25对于闭环模式选择 每帧减少复杂度=0.3 - 40% /(32768 + 232960) = 0.3 - 0.015 = 0.285由此可见对于30%的噪声出现率,系统复杂度可减少25% (开环模 式选择)和28.5% (闭环模式选择)。再请参阅图5,它是一种对应于上述AMR-WB+框架编码方法实施 例的解码方法实施例。该解码步骤为第一步输入码流通过码流解析后,根据是否具有所述的噪声标志来 判断是否为噪声信号;若是噪声信号,则执行第三步;否则,执行第二步;第二步信号依据解析的编码模式,LPC系数,编码参数进行相应的TCX80、 TCX40、 TCX20、 ACELP解码流程后输出;该TCX解码流程包括F/T转换和LPC综合步骤;第三步*.信号进行1024 F/T转换后,即可输出。 经码流测试验证后表明使用上述编、解码方法后输出码流与原
AMR-WB+框架下编、解码后的输出码流主观质量一致。
另外,本发明的编、解码方法所应用的音频处理框架将不仅限于 AMR-WB+框架,其它框架(如AAC框架)亦可根据噪声信号检测结 果对原有框架进行相应的改变以提高其对噪声信号的处理效率,降低处 理的复杂度。
综上所述仅为本发明的较佳实施例而已,并非用来限定本发明的实施 范围。即凡依本发明申请专利范围的内容所作的等效变化与修饰,都应为 本发明的技术范畴。
权利要求
1 、 一种用于音频处理框架中的编码方法,其特征是该方法步骤为-A经过预处理后的低频信号将首先通过噪声检测模块进行噪声检测,若检测结果是噪声,则执行步骤C,否则,执行步骤B;B信号将继续进行TCX和ACELP模式选择,对信号进行LPC分析,然 后依据模式选择的结果进行TCX80、 TCX40、 TCX20、 ACELP其中一种模式 进行编码流程;在上述四种模式流程中,首先将使用LPC分析所得参数对 信号进行LPC加权滤波步骤,再执行相应模式下的编码,最终将LPC系数、 模式,及该模式下的编码参数一起编码后输出;C信号将直接进行1024 T/F转换,并对转换后的频谱参数,及相关 噪声因子、频谱增益进行量化,同时记录下噪声标志,编码后输出。
2 、根据权利要求1中所述的用于音频处理框架中的编码方法,其特 征是该噪声检测模块由过零率提取模块、低频能量提取模块、总能量提取 模块、加权能量提取模块和多边界判决模块组成;其中-该过零率提取模块用于从输入信号中提取信号符号的变化率,从而获 取信号的基本频率变化;该低频能量提取模块用于从输入信号中提取信号低频部分的能量,从 而获取了信号低频信息量;该总能量提取模块用于从输入信号中获取信号总体能量大小,从而宏 观获取信号的总信息量;该加权能量提取模块用于获得根据输入信号的基本频谱特征加权后的能量;该多边界判决模块用于根据上述四个模块获取的参数值与预先通过 分析得到这四种参数的相关域值进行多边界判决,决策出输入是否是噪声 信号。
3、 根据权利要求l中所述的用于音频处理框架中的编码方法,其特征是该音频处理框架是AMR-WB+框架。
4、 一种对应于如权利要求1或2或3所述编码方法的解码方法,其 特征是该解码步骤为D输入码流通过码流解析后,根据是否具有所述的噪声标志来判断是 否为噪声信号;若是噪声信号,则执行步骤F;否则,执行E步骤;E信号依据解析的编码模式,LPC系数,编码参数进行相应的TCX80、 TCX40、 TCX20、 ACELP解码流程后输出;该TCX解码流程包括F/T转换和 LPC综合步骤;F信号进行1024 F/T转换后,即可输出。
全文摘要
一种用于音频处理框架中的编码方法,其特征是将噪声信号将直接进行1024T/F转换,并对转换后的频谱参数,及相关噪声因子、频谱增益进行量化,同时记录下噪声标志,编码后输出;非噪声信号仍然按照TCX、ACELP编码操作流程进行。以及一种对应于上述编码方法的解码方法,在输入码流通过码流解析后,根据是否具有所述的噪声标志来判断是否为噪声信号;若是噪声信号,则将信号进行1024F/T转换后即输出;非噪声信号仍然按照TCX、ACELP解码操作流程进行。通过本发明降低编、解码方法的复杂度,提高了编、解码方法的处理效率。
文档编号G10L19/00GK101145343SQ20061011611
公开日2008年3月19日 申请日期2006年9月15日 优先权日2006年9月15日
发明者昙 李, 林福辉, 黄鹤云 申请人:展讯通信(上海)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1