基于子带空间关注测度的可分级音频编码系统及方法

文档序号：2827465阅读：195来源：国知局

基于子带空间关注测度的可分级音频编码系统及方法
【专利摘要】本发明提供一种基于子带空间关注测度的可分级音频编码系统及方法，包括基于能量、频率和空间信息综合计算各子带的子带重要性测度并排序，根据综合测度的排序结果进行比特分配、残差量化编码，对子带排序编号的编码结果和残差量化编码都加入码流。本发明根据能量、频率和空间信息作为子带优先级分配策略，相比单纯利用能量或频率作为感知测度具有更明显的指导意义。
【专利说明】基于子带空间关注测度的可分级音频编码系统及方法
【技术领域】
[0001]本发明涉及音频编码【技术领域】，尤其涉及一种基于子带空间关注测度的可分级音频编码系统及方法。
【背景技术】
[0002]现有的可分级编码方法中主要根据高能量和低频率成分优先的准则作为可分级子带重要性测度划分的依据。然而，简单通过能量或频率成分的高低并不能确定最重要的声音对象所在的子带。在频域子带中，能量高的子带或低频子带并不一定对应着最重要的声音对象所在的子带。除了能量和频率以外，空间位置信息也可用于确定重点的声音对象。点声源或类似点声源通常具有明确的空间位置信息，往往是需要重点关注的声音对象，而环境声或噪声等声源，往往不具备明确的空间位置信息，在分级编码中可以分配更少的优先级。现有的双声道可分级编码方法，在确定下混声道子带重要性测度时，单纯以下混声道的子带能量或频率成分来确定子带分级编码的优先级，由于下混声道中缺失声道间的相关性以及声源的空间位置信息等，如果仅仅根据下混声道的能量或频率的高低来确定最重要声源对应的子带，这样或多或少会导致编码一些重要的具有高关注的或具有明确位置信息的声源时带来质量的损失。因此，若能提供一种分级音频编码方法结合声源的空间位置信息来确定频域子带的重要性，重点关注声音信号中需要重点编码的声音对象，从而提高具有明确位置的、具有高关注的重要声音的编码质量，对音频编码领域具有重要实际意义。

【发明内容】

[0003]本发明的目的是提供一种基于子带空间关注测度的可分级音频编码系统及方法，使得频率子带重要性测度更加反映双声道信号中需要重点关注和编码的声音对象。
[0004]为达到上述目的，本发明提供一种基于子带空间关注测度的可分级音频编码系统，包括以下模块:
[0005]预处理模块，用于对双声道输入信号进行预处理，得到两个声道的当前帧的音频信号S1和S1^并做三路输出，一路输出给核心编码器模块，一路输出给残差提取模块，一路输出给时频变换模块；
[0006]核心编码器模块，用于对从预处理模块输入的音频信号S1和&进行编码，编码结果分作两路，其中一路作为码流的一部分输出给解码端；一路解码得到两个声道的重构信号和I输出给残差提取模块；
[0007]残差提取模块，用于根据从预处理模块输入的音频信号81和&和从核心编码器模块输入的重构信号八和^，得到两个声道的残差信号O1和，er =Sr-Sr，对残差信号ei和^进行时频变换得到两个声道的残差频谱系数efl和e&，下混为和声道sum
和差声道diff, sim=-(efl +e/r) cliff =孑-efr)对sum和diff进行频谱子带划分,将所得
_ ? — ,和声道和差声道各个子带的频谱系数sum(i)和diff(i)分两路输出，一路输出给残差量化编码模块，一路输出给比特分配模块，i取值1，2，…，N，子带数N > I ;
[0008]时频变换模块，用于对从预处理模块输入的音频信号S1和\进行时频变换，得到频谱系数X1和输出给子带划分模块；
[0009]子带划分模块，用于对时频变换模块输入的频谱系数X1和&进行子带划分，得到两个声道的子带频谱系数X1 (i)和\(i)，输出给基于空间关注的子带重要性测度模块；
[0010]基于空间关注的子带重要性测度模块，用于根据从子带划分模块输入的两个声道的子带频谱系数X1 (i)和\(i)，基于能量、频率和空间信息综合计算各子带的子带重要性测度nPi，按照子带重要性从高到低对N个子带进行排序，记子带i的排序所得编号为pSi，得到最后的子带排序编号Psi = {psl, P52,..., Psm, pSN}并做两路输出，一路输出给子带测度编码模块，一路输出给比特分配模块；
[0011]子带测度编码模块，用于对从基于空间关注的子带重要性测度模块输入的子带排序编号Pgi = iPsi? Ps2>...) Ps(N-D) Psn^进7TT摘编码，将编码结果作为码流的一部分输出给解码端；
[0012]比特分配模块，用于根据从残差提取模块输入的频谱系数sum⑴和diff (i)，按照从基于空间关注的子带重要性测度模块输入的排序后的子带编号P ={Pl, P2,, p(n-d，pn}对每个子带进行比特数的分配，将分配的比特数输出给残差量化编码模块；
[0013]残差量化编码模块，用于按照从基于空间关注的子带重要性测度模块输入的排序后的子带编号P = {Pl, P2,, p(n-d，pJ，以子带重要性测度由大到小的顺序依次取一个子带，对从残差提取模块输入的该子带的频谱系数sum(i)和diff(i)，按比特分配模块所得该子带分配的比特数进行球型矢量量化编码，直到编码器给定传输码率下可用的所有编码比特数用完，将编码结果作为码流的一部分输出给解码端。
[0014]而且，所述基于空间关注的子带重要性测度模块包括方位感知测度模块、距离感知测度模块、能量感知测度模块、频率感知测度模块和子带空间关注模块，
[0015]方位感知测度模块，用于根据子带划分模块所得两个声道的各个子带的频谱系数
X1(I)和\(i)，计算出各个子带的声道间强度差
【权利要求】
1.一种基于子带空间关注测度的可分级音频编码系统，其特征在于，包括以下模块: 预处理模块，用于对双声道输入信号进行预处理，得到两个声道的当前帧的音频信号S1和S1^并做三路输出，一路输出给核心编码器模块，一路输出给残差提取模块，一路输出给时频变换模块；核心编码器模块，用于对从预处理模块输入的音频信号S1和&进行编码，编码结果分作两路，其中一路作为码流的一部分输出给解码端；一路解码得到两个声道的重构信号^和I输出给残差提取模块；残差提取模块，用于根据从预处理模块输入的音频信号81和\和从核心编码器模块输入的重构信号$;和L ?得到两个声道的残差信号eJP ey ^ I =S1-Sl , er =Sr-Sr，对残差信号ei和^进行时频变换得到两个声道的残差频谱系数efl和e&，下混为和声道sum和差 I1:声道diff， mn^-(etl+efr) diff=^ej^efr)对sum和diff进行频谱子带划分，将所得和声
5，道和差声道各个子带的频谱系数sum(i)和diff(i)分两路输出，一路输出给残差量化编码模块，一路输出给比特分配模块，i取值1，2，…，N，子带数N > I ; 时频变换模块，用于对从预处理模块输入的音频信号S1和\进行时频变换，得到频谱系数X1和输出给子带划分模块；子带划分模块，用于对时频变换模块输入的频谱系数X1和&进行子带划分，得到两个声道的子带频谱系数X1 (i)和\(i)，输出给基于空间关注的子带重要性测度模块；基于空间关注的子带重要性测度模块，用于根据从子带划分模块输入的两个声道的子带频谱系数X1 (i)和\(i)，基于能量、频率和空间信息综合计算各子带的子带重要性测度nPi,按照子带重要性从高到低对N个子带进行排序，记子带i的排序所得编号为Psi，得到最后的子带排序编号Psi = {Psi, Ps2....，Ps(N-1).PsnI并做两路输出，一路输出给子带测度编码模块，一路输出给比特分配模块；子带测度编码模块，用于对从基于空间关注的子带重要性测度模块输入的子带排序编号Pgi = iPsi) Ps2>...) Ps(N-D) Psn^进7TT摘编码，将编码结果作为码流的一部分输出给解码端; 比特分配模块，用于根据从残差提取模块输入的频谱系数sum(i)和diff (i)，按照从基于空间关注的子带重要性测度模块输入的排序后的子带编号P = {Pl, P2,, Pori), PnI对每个子带进行比特数的分配，将分配的比特数输出给残差量化编码模块；残差量化编码模块，用于按照从基于空间关注的子带重要性测度模块输入的排序后的子带编号P = {Pl, P2,, p(n-d，pJ，以子带重要性测度由大到小的顺序依次取一个子带，对从残差提取模块输入的该子带的频谱系数sum(i)和diff(i)，按比特分配模块所得该子带分配的比特数进行球型矢量量化编码，直到编码器给定传输码率下可用的所有编码比特数用完，将编码结果作为码流的一部分输出给解码端。
2.根据权利要求1所述基于子带空间关注测度的可分级音频编码系统，其特征在于:所述基于空间关注的子带重要性测度模块包括方位感知测度模块、距离感知测度模块、能量感知测度模块、频率感知测度模块和子带空间关注模块，方位感知测度模块，用于根据子带划分模块所得两个声道的各个子带的频谱系数X1(I)和\(i),计算出各个子带的声道间强度差
3.一种基于子带空间关注测度的可分级音频编码方法，其特征在于，包括以下步骤:步骤1，对双声道输入信号进行预处理，得到两个声道的当前帧的音频信号S1和& ；步骤2，对步骤I所得音频信号S1和&进行编码，编码结果分作两路，其中一路作为码流的一部分输出给解码端，一路解码得到两个声道的重构信号夂和I I 步骤3，根据步骤I所得音频信号S1和&和步骤2所得重构信号和夂，得到两个声道的残差信号O1和er, e; =S1-Λ% ? er =.v, - Sr，对残差信号O1和进行时频变换得到两个声道的残差频谱系数efl和，下混为和声道sum和差声道diff，
4.根据权利要求3述基于子带空间关注测度的可分级音频编码方法，其特征在于:步骤6进一步包括以下子步骤，步骤6.1，根据步骤5所得两个声道的各个子带的频谱系数&(1)和\(i)，计算出各个子带的声道间强度差
【文档编号】G10L19/002GK103928030SQ201410181636
【公开日】2014年7月16日申请日期:2014年4月30日优先权日:2014年4月30日
【发明者】胡瑞敏, 高丽, 杨玉红, 王晓晨, 涂卫平, 高戈, 董石, 王松, 李登实, 张茂胜, 杨乘, 姜林申请人:武汉大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：胡瑞敏;高丽;杨玉红;王晓晨;涂卫平;高戈;董石;王松;李登实;张茂胜;杨乘;姜林
技术所有人：武汉大学
我是此专利的发明人

上一篇：语音特效卡拉ok手机点歌系统的制作方法
上一篇：音乐信号处理设备和方法、以及程序的制作方法