一种音频频带处理方法及系统的制作方法

文档序号：2836151阅读：277来源：国知局

专利名称：一种音频频带处理方法及系统的制作方法
技术领域：
本发明涉及数据处理领域，尤其涉及一种音频频带处理方法及系统。
背景技术：
在大量的数字音频设备应用中，都需要对数字音频信号进行音频信号处理，以提高音频质量，例如噪声抑制、音频自动增益控制、回声消除等。从时域上考虑，可以在信号时域上做音频信号幅度大小的调节，也可在时间轴上做语音信号时间压缩和扩展；从频率上考虑，通常需要先将音频频段划分为多个子频带，然后分别对各个子频带的音频信号进行数字信号处理。在音频处理过程中，通常可以认为子频带分得越多，音频信号的处理就越精确，当然这也会带来负面的影响，就是会增加算法复杂度，进而占用更多的处理器系统资源、增加系统功耗。尤其对于移动终端设备，处理器的系统资源和系统功耗是非常敏感的，所以对音频子频带的划分非常考究，子频带分得太少会降低音频信号处理的精度，子频带分得太多又会增加系统开销和系统功耗，现有技术的方案往往不能兼顾这两方面。

发明内容
本发明实施例提供了一种音频频带处理方法及系统，能够提高用户感知的音频性能，且不增加算法复杂度和功耗。本发明实施例提供的音频频带处理方法，包括:确定待处理的音频信号的响度值动态范围；根据所述音频信号的响度值动态范围选择对应的人耳等响曲线；确定所述音频信号的频率范围；根据所述选择的人耳等响曲线确定所述音频信号的频率范围内各频点的权重值；基于所述各频点的权重值将所述音频信号在频域上划分为若干个音频子频带。可选地，所述确定待处理的音频信号的响度值动态范围包括:将预先通过声压检测仪器对音频设备进行检测得到所述音频设备的响度值动态范围作为待处理音频信号的响度值动态范围；或，建立不同音频增益所对应的响度值查询表，根据待处理音频信号的增益范围从所述查询表中查询所述音频信号对应的响度值动态范围。可选地，所述预先通过声压检测仪器对音频设备进行检测得到所述音频设备的响度值动态范围包括:用音频设备直接播放实际音频信号，当音量设置到最小时，通过声压测试仪器测试得到低门限响度值，当音量设置到最大时，通过声压测试仪器测试得到高门限响度值；
将所述低门限响度值与所述高门限响度值之间的动态范围作为所述音频设备的响度值动态范围。可选地，所述根据音频信号的响度值动态范围选择对应的人耳等响曲线包括:将所述音频信号的响度值动态范围的中间值作为参考响度；按照所述参考响度选择对应的人耳等响曲线。可选地，所述根据所述选择的人耳等响曲线确定所述音频信号的频率范围内各频点的权重值包括:根据所述选择的人耳等响曲线对应的函数y = f(x)确定音频信号的频率范围内各频点的权重值，使得各频点的权重值与f(x)成反比；所述X表示音频信号的频率表示人耳在感知相同响度值时X频率上的声压级。可选地，所述基于所述各频点的权重值将所述音频信号在频域上划分为若干个音频子频带包括:将所述音频信号在频域上均分为k个均匀离散的子频带；

根据所述人耳等响曲线为所述k个子频带分配权重值，每个子频带的权重值为该子频带起始频点权重值的平均，或者为该子频带起始频点的中间频点的权重值，或者为该子频带所有频点权重的积分；对所述k个子频带上的所有权重值进行求和得到SUM ；根据处理器资源和功耗需求将所述k个子频带合并为η个连续的子频带，所述η个子频带中每个子频带的权重值之和为SUM/n。可选地，所述基于所述各频点的权重值将所述音频信号在频域上划分为若干个音频子频带包括:通过如下方式计算所述音频信号在频域上的权重值之和SUM:SUM = j" I / f (x)dx.
根据处理器资源和功耗需求将该音频信号在频域上划分为η个连续的子频带，所述η个子频带中每个子频带的权重值之和为SUM/n。可选地，η为固定值，或者为根据音频信号的类型设定的不同值。本实施例中提供的音频频带处理系统，包括:响度值范围确定装置，用于确定待处理的音频信号的响度值动态范围；曲线选择装置，用于根据所述音频信号的响度值动态范围选择对应的人耳等响曲线.-^4 ，频率范围确定装置，用于确定所述音频信号的频率范围；权重分析装置，用于根据所述选择的人耳等响曲线确定所述音频信号的频率范围内各频点的权重值；子频带划分装置，用于基于所述各频点的权重值将所述音频信号在频域上划分为若干个音频子频带。可选地，所述响度值范围确定装置包括:第一确定单元，用于将预先通过声压检测仪器对待处理的音频信号音频设备进行监测检测得到所述音频信号音频设备的响度值动态范围作为待处理音频信号的响度值动态范围；或，第二确定单元，用于建立不同音频增益所对应的响度值查询表，根据待处理音频信号的增益范围从所述查询表中查询所述音频信号对应的响度值动态范围。从以上技术方案可以看出，本发明实施例具有以下优点:本发明实施例中，音频频带处理系统可以根据待处理的音频信号的响度值动态范围选取对应的人耳等响曲线，并根据该人耳等响曲线为音频信号的频率范围内的各频点赋予权重值，使得划分音频子频带时能够充分考虑人耳的特点，对人耳比较敏感的频点处的音频信号使用更多的资源进行处理，而对人耳不敏感的频点处的音频信号使用较少的资源进行处理，从而既能提高用户感知的音频性能，又不会增加算法复杂度和功耗。

图1为本发明音频频带处理方法一个实施例示意图；图2为音频动态范围示意图；图3为人耳等响曲线示意图；图4为本发明音频频带处理系统一个实施例示意图。
具体实施例方式本发明实施例提供了一种音频频带处理方法及系统，能够提高用户感知的音频性能，且不增加算法复杂度和功耗。请参阅图1，本发明音频频带处理方法一个实施例包括:101、确定待处理的音频信号的响度值动态范围；本实施例中，音频频带处理系统可以确定需要进行处理的音频信号的响度值动态范围。为便于理解，下面先介绍一下音频响度的概念:声压是声波于空气中的压力，以音压(SPL, Sound pressure level)表示,通常以dyne/cm2为度量单位。在实际应用中较常用来衡量音频信号音压大小的单位是分贝(dB，decibel)，dB值代表的是两个音压的相对强度，因此需要一个相对的基准音压(SPL,ef)，该基准音压就是人耳的听觉下限(threshold ofhearing),即人耳所能够感觉音频信号的最小音压，而每个人的听觉下限有所不一，但一般定义SPLref = 0.0002dyne/Cm2。响度(Loudness)是人耳对音频信号强度的感觉，与音频信号的声压有关，但相同声压强度的音频信号在不同的音频频率上人耳感知会得到有不同的响度。人耳能听到声音的最微弱强度，称为听觉阈，产生疼痛感的最高声音强度，称为痛觉阈。音频信号的有用响度范围，即音频信号的响度最大值与最小值之间的范围，称为动态范围，音频信号的动态范围位于在听觉阈和痛觉阈之间，如图2所示。从图2可以看出，人们日常语音的动态范围30dB 75dB，音乐的动态范围是25dB IOOdB ;同时，人耳听觉频率范围大约可从20Hz至20KHz，但实际上人耳对于16KHz以上的高频信号的响应就非常不灵敏了。在本实施例中，音频频带处理系统可以采用多种方式确定需要进行处理的音频信号的响度值动态范围，例如可以采用如下一些方式:一、直接通过声压测试仪器测试:本方式中可以将预先通过声压检测仪器对音频设备进行检测得到所述音频设备的响度值动态范围作为待处理音频信号的响度值动态范围。用音频播放器直接播放实际音频信号，当音量设置到最小时，通过声压测试仪器测试得到音频设备对应的响度曲线，然后再根据该响度曲线得到低门限响度值X1ClB,当音量设置到最大时，通过声压测试仪器测试得到音频设备对应的响度曲线，然后再根据该响度曲线得到高门限响度值X2dB，则音频信号的响度值动态范围为(X1ClB, X2dB)。在实际应用中，具体可以将一段特定音频信号数据用该音频设备进行播放，在音频设备配置为最小音量时测试其最小的响度值，在音频设备配置为最大音量的情况测试其最大的响度值；该特定的音频信号的增益范围应当能包括该音频设备所需处理的音频信号的增益范围。二、查表方式当获知一个实际音频设备时，可以建立不同音频增益所对应的响度值查询表，根据待处理音频信号的增益范围从所述查询表中查询所述音频信号对应的响度值动态范围。在实际应用中，可以首先通过测试获得不同的音频信号增益在音频设备最小音量和最大音量下的实际响度值(每个增益点对应一个最小和一个最大响度值)，并建立音频信号增益在音频设备最小音量和最大音量下的响度值表，在对一段音频信号进行处理的时候，根据该段音频信号的增益范围查表即可获得该段音频信号通过所述音频设备播放时所对应的响度范围。例如:对某一特定的音频设备，当音频信号的增益为OdB时，测试得到其对应的最小响度值为XtlminClB(音频设备音量设置为最小)，测试得到其对应的最大响度值为XQmaxdB(音频设备音量设置为最大)；当音频信号的增益为-1dB时，测试得到的其对应的最小响度值为XlmindB，最大响度值为XlmaxdB，以此类推，当音频信号增益为-ndB时，其对应的最小和最大响度值分别为XnminClB和XMdB。在实际应用时，对需要处理的一段音频信号，通过查表获得该段音频信号的最小增益所对应的最小响度值和该段音频信号的最大增益所对应的最大响度值，即可获取该段音频信号在该音频设备播放时的响度动态范围；例如，一段音频信号的增益范围为-ndB -1dB ;则其响度动态范围为XnminClB XlmaxdB。上面以两种方式说明了音频频带处理系统确定需要进行处理的音频信号的响度值动态范围的方式，可以理解的是，在实际应用中，音频频带处理系统还可以使用更多的方式确定音频信号的响度值动态范围，具体此处不做限定。102、根据音频信号的响度值动态范围选择对应的人耳等响曲线；当音频频带处理系统获知音频信号的响度值动态范围之后，则可以根据该动态范围选择对应的人耳等响曲线。为便于理解，下面先介绍一下人耳等响曲线的概念:图3所示的内容就是人耳听觉等响曲线图，从图3中可以看出，人耳听觉响应呈非线性，对于不同频率相同声压等级的音频信号，人耳感知的响度值不一致。简单举例说明，人耳对IKHz 5KHz之间的音频信号比起其他频带的音频信号感度较灵敏，对于4KHz的音频信号最为灵敏，人耳听觉对于20Hz 200Hz的频带内的低频的音频信号，频率越低则感度越低。图3中的各条等响曲线都是相对于IKHz单音，人耳感觉到相同响度的声压强度(SPL，dB)分布。例如IKHz单音在50dB SPL时人耳听起来的音量大小，会等同于50Hz单音在75dB SPL的音量大小和4KHz单音在42dB SPL的音量大小。本实施例中，当音频频带处理系统获知音频信号的响度值动态范围之后，则可以以该动态范围内的中间值的响度作为选择人耳等响曲线的参考响度。由于人耳等响曲线中都是IOdB的倍数响度曲线，当出现动态范围的中间值不是IOdB的倍数时，可以采用就近原则进行选择。103、确定音频信号的频率范围；本实施例中，音频频带处理系统可以根据该音频设备的实际应用场景确定音频信号频率的选择范围。在实际应用中，一般可以分为两种音频信号范围，如图1所不，话音和音乐。例如:该音频设备只是用于话音业务，那么音频信号的频率的选择范围可以确定为200Hz 4KHz，如果该音频设备用于音乐播放，那么音频信号的频率的选择范围可以确定为20Hz 20KHz。音频频带处理系统可以首先将时域音频信号转换为频域音频信号，然后从频域上就可以确定该音频信号的频率范围(^ Ρη)。104、根据选择的人耳等响曲线确定音频信号的频率范围内各频点的权重值；本实施例中，音频频带处理系统可以根据步骤102中确定的人耳等响曲线确定音频信号频率范围内各个频率的权重值，该权重值可以定义为该人耳等响曲线所在频率上的实际响度。具体的，可以根据选择的人耳等响曲线对应的函数y = f(x)确定音频信号的频率范围内各频点的权重值，使得各频点的权重值与f (X)成反比，X表示音频信号的频率，y表示人耳在感知相同响度值时X频率上的声压级。。例如:以50dB SPL人耳等响曲线为例，IKHz的权重值为1/50，IOOHz的权重值为1/60。105、基于各频点的权重值将音频信号在频域上划分为若干个音频子频带。本实施例中，音频频带处理系统确定了各频点的权重值之后,可以基于各频点的权重值将音频信号在频域上划分为若干个音频子频带，具体可以看作是对该动态范围内的所有频点的权重值求和，在实际应用中可以采用如下两种方式:一、离散求和方式确定子频带:(I)、音频频带处理系统将音频信号在频域上均分为k个均匀离散的子频带(Ftl,F1, F2,...Fk)；(2)、音频频带处理系统根据人耳等响曲线为该k个子频带分配权重值，每个子频带的权重值为该子频带起始频点权重值的平均，或者为该子频带起始频点的中间频点的权重值，或者为该子频带所有频点权重的积分；此处以采用子频带其实频点权重值平均的方式来说明，例如:子频带I的权重值等于Ftl和F1的权重的平均值，子带k的权重值等于Flri和Fk的权重的平均值。(3)、音频频带处理系统对k个子频带上的所有权重值进行求和得到SUM ；
(4)、音频频带处理系统根据处理器资源和功耗需求将k个子频带合并为η个连续的子频带，该η个子频带中每个子频带的权重值之和为SUM/n。本实施例中的η可以为固定值，也可以为根据音频信号的具体类型设定的不同值。对于η的取值，根据不同的音频类型和/或音频设备资源状况选择不同的η取值，例如:对于话音音频信号处理，考虑到其频带范围较小，实时性要求较高，以及在实际信号处理中DSP资源有限，可以选择较小的η值，如η = 8，以减小资源耗费，提高音频处理速度；对于音乐音频信号处理，由于其频带范围较大，且其实时性要求较低，对延迟敏感度较小，可以选择较大的η值，如η = 20，以提高音频信号处理精度，获得较高的音频播放质量。二、连续求和方式确定子频带:(I)、音频频带处理系统通过如下方式计算音频信号在频域上的权重值之和SUM:SUM = j" I / f (x)dx.
其中，y = f (X)，该X表示音频信号的频率，y表示人耳在感知相同响度值时X频率上的声压级。(2)、音频频带处理系统根据处理器资源和功耗需求将音频信号在频域上划分为η个连续的子频带，η个子频带中每个子频带的权重值之和为SUM/n。本实施例中的η可以为固定值，也可以为根据音频信号的类型设定的不同值，具体此处不做限定。音频子频带划分完成后，就可以进行后续的处理，例如分别对每个音频子频带的音频信号进行噪声检测和抑制等，具体操作此处不再赘述。本实施例中，音频频带处理系统可以根据待处理的音频信号的响度值动态范围选取对应的人耳等响曲线，并根据该人耳等响曲线为音频信号的频率范围内的各频点赋予权重值，使得划分音频子频带时能够充分考虑人耳的特点，对人耳比较敏感的频点处的音频信号使用更多的资源进行处理，而对人耳不敏感的频点处的音频信号使用较少的资源进行处理，从而既能提高用户感知的音频性能，又不会增加算法复杂度和功耗。为便于理解，下面以一个具体应用中的实例对上述方法进行详细描述:本实施例中以移动终端平台的上行麦克风采样的音频数据进行噪声估计为例进行说明:众所周知，移动终端平台为了提高有效话音的解析度，需要对上行采样的环境噪声进行抑制，目前普遍的做法是通过信号幅度门限值来判断是否是噪声，当信号幅度小于该门限值时被认为是噪声，当大于该门限值时被认为是有效信号。考虑到实际噪声不是在音频频段内平均分布，现有技术中还推出了一种子带分割的方式，首先将时域信号转换为频域信号，在频域内将音频信号再划分为η个子频带(通常采用平均分割的方式)，然后分别对每个子频带进行噪声的检测和抑制处理。虽然从算法和频域上考虑，平均分割子带是比较好的方式，但是考虑到人耳对于不同频率的音频信号，人耳感知的响度值不一致，所以本实施例的处理方式中引入了人耳等响曲线作为子带分割的重要参考因素，具体流程如下:(I)、选定人耳等响曲线；考虑到不同响度的等响曲线不一致，所以首先需要确定选用哪条等响曲线作为参考等响曲线。此处可以采用直接通过声压测试仪器测试的方式来获取音频设备在实际音频信号的动态范围，并以该范围内的中间值的响度作为选择人耳等响曲线的参考响度。例如:测试得到该音频设备的响度值动态范围是IOdB IlOdB,那么可以选择60dB SPL的等响曲线作为参考的人耳等响曲线；如果测试得到音频设备的响度值动态范围是IldB 95dB，中间值是53dBSPL，而图3所示的人耳等响曲线中没有该曲线，则此时可以选择50dB SPL的等响曲线作为参考等响曲线；(2)、信号时频转换；为了进行子频带划分，可以将音频时域信号转换到音频频域信号，从频域上确定该音频信号的频率范围(Ftl-Fn)；(3)、确定权重值；根据所选定的人耳等响曲线函数y = f(x)来确定音频信号频率范围内的权重值，根据权重分析装置的描述，权重值等于l/f(x)；

(4)、积分处理；本实施例中以连续求和方式确定子频带的方式为例,对音频信号频段内的权重函数 1/f (X)求积分SUM = f:l/f(x)dx
权利要求
1.一种音频频带处理方法，其特征在于，包括: 确定待处理的音频信号的响度值动态范围；根据所述音频信号的响度值动态范围选择对应的人耳等响曲线；确定所述音频信号的频率范围；根据所述选择的人耳等响曲线确定所述音频信号的频率范围内各频点的权重值；基于所述各频点的权重值将所述音频信号在频域上划分为若干个音频子频带。
2.根据权利要求1所述的方法，其特征在于，所述确定待处理的音频信号的响度值动态范围包括: 将预先通过声压检测仪器对音频设备进行检测得到所述音频设备的响度值动态范围作为待处理音频信号的响度值动态范围；或，建立不同音频增益所对应的响度值查询表，根据待处理音频信号的增益范围从所述查询表中查询所述音频信号对应的响度值动态范围。
3.根据权利要求2所述的方法，其特征在于，所述预先通过声压检测仪器对音频设备进行检测得到所述音频设备的响度值动态范围包括: 用音频设备直接播放音频信号，当音量设置到最小时，通过声压测试仪器测试得到低门限响度值，当音量设置到最大时，通过声压测试仪器测试得到高门限响度值；将所述低门限响度值与所述高门限响度值之间的动态范围作为所述音频设备的响度值动态范围。
4.根据权利要求1所述的方法，其特征在于，所述根据音频信号的响度值动态范围选择对应的人耳等响曲线包括: 将所述音频信号的响度值动态范围的中间值作为参考响度；按照所述参考响度选择对应的人耳等响曲线。
5.根据权利要求1至3中任一项所述的方法，其特征在于，所述根据所述选择的人耳等响曲线确定所述音频信号的频率范围内各频点的权重值包括: 根据所述选择的人耳等响曲线对应的函数y = f(x)确定音频信号的频率范围内各频点的权重值，使得各频点的权重值与f(x)成反比；所述X表示音频信号的频率，I表示人耳在感知相同响度值时X频率上的声压级。
6.根据权利要求5所述的方法，其特征在于，所述基于所述各频点的权重值将所述音频信号在频域上划分为若干个音频子频带包括: 将所述音频信号在频域上均分为k个均匀离散的子频带；根据所述人耳等响曲线为所述k个子频带分配权重值，每个子频带的权重值为该子频带起始频点权重值的平均，或者为该子频带起始频点的中间频点的权重值，或者为该子频带所有频点权重的积分；对所述k个子频带上的所有权重值进行求和得到SUM ；根据处理器资源和功耗需求将所述k个子频带合并为η个连续的子频带，所述η个子频带中每个子频带的权重值之和为SUM/n。
7.根据权利要求5所述的方法，其特征在于，所述基于所述各频点的权重值将所述音频信号在频域上划分为若干个音频子频带包括:通过如下方式计算所述音频信号在频域上的权重值之和SUM:SUM=fff"l/f(x)dx.5 根据处理器资源和功耗需求将所述音频信号在频域上划分为η个连续的子频带，所述η个子频带中每个子频带的权重值之和为SUM/n。
8.根据权利要求7所述的方法，其特征在于，所述η为固定值，或者为根据音频信号的类型设定的不同值。
9.一种音频频带处理系统，其特征在于，包括: 响度值范围确定装置，用于确定待处理的音频信号的响度值动态范围；曲线选择装置，用于根据所述音频信号的响度值动态范围选择对应的人耳等响曲线；频率范围确定装置，用于确定所述音频信号的频率范围；权重分析装置，用于根据所述选择的人耳等响曲线确定所述音频信号的频率范围内各频点的权重值；子频带划分装置，用于基于所述各频点的权重值将所述音频信号在频域上划分为若干个音频子频带。
10.根据权利要求9所述的音频频带处理系统，其特征在于，所述响度值范围确定装置包括: 第一确定单元，用于将预先通过声压检测仪器对待处理的音频信号音频设备进行监测检测得到所述音频信号音频设备的响度值动态范围作为待处理音频信号的响度值动态范围；或，第二确定单元，用于建立不同音频增益所对应的响度值查询表，根据待处理音频信号的增益范围从所述查询表中查询所述音频信号对应的响度值动态范围。
全文摘要
本发明实施例公开了一种音频频带处理方法及系统，能够提高用户感知的音频性能，且不增加算法复杂度和功耗。本发明实施例方法包括确定待处理的音频信号的响度值动态范围；根据所述音频信号的响度值动态范围选择对应的人耳等响曲线；确定所述音频信号的频率范围；根据所述选择的人耳等响曲线确定所述音频信号的频率范围内各频点的权重值；基于所述各频点的权重值将所述音频信号划分为若干个音频子带信号。本发明实施例还提供一种音频频带处理系统。本发明实施例能够有效提高用户感知的音频性能，且不增加算法复杂度和功耗。
文档编号G10L21/00GK103177727SQ201110439500
公开日2013年6月26日申请日期2011年12月23日优先权日2011年12月23日
发明者付仕明, 叶顺舟申请人:重庆重邮信科通信技术有限公司

完整全部详细技术资料下载