一种音频信号的处理方法和相关装置与流程

文档序号:16008754发布日期:2018-11-20 20:24阅读:174来源:国知局

本申请涉及音频处理技术领域,尤其涉及一种音频信号的处理方法和相关装置。



背景技术:

最小值控制递归平均(Minima Controlled Recursive Averaging,MCRA)方法,用于估计信号中每个子带的噪声能量,从而实现降噪的目的。由于其较好的性能与较低的计算复杂度,广泛用于各种实时语音交互场景,比如移动通话、VoIP、广播、直播、线上教育培训、线上KTV等。

MCRA算法是用最小值控制的,所以如果噪声的能量不断增加或者突然增加,最小值就无法得到及时更新,其性能就会大打折扣,最终表现为降噪性能劣化。

具体可以参阅图1和图2,图1是纯噪声信号,图2是图1中的纯噪声信号经降噪处理后形成的信号。结合图1和图2可以看出,从噪声信号突然增强后的一段时间里,噪声信号无法被正常抑制,直到多秒后,降噪效果才正常。因为降噪异常的持续时长取决于搜索窗长的大小,所以通过降低搜索窗长度可以减短降噪异常的持续时长,以改善去噪效果,但因搜索窗长的大小是固定的,所以同时还会对非噪声信号产生不良影响。

具体再参阅图3和图4,图3为待处理信号,待处理信号中包含非噪声信号和噪声信号,图4为图3中的待处理信号经降噪处理后形成的信号,需要说明的是,在图3和图4中,靠近轴线部分幅值较小且平稳的信号为噪声信号,幅值较大且平稳的信号为非噪声信号。结合图3和图4中可以看出,在抑制噪声的同时,圆圈中的非噪声信号也被抑制了。



技术实现要素:

本申请实施例提供了一种音频信号的处理方法和相关装置,使得在减短降噪异常的持续时长的同时,不会对非噪声信号产生不良影响。

有鉴于此,本申请第一方面提供了一种音频信号的处理方法,所述的处理方法包括:

根据当前帧音频信号的采样率和时长获取所述当前帧音频信号在各个采样点处幅值的第一平均值;

根据预置的指数平滑公式获取所述第一平均值对应的第一指数平滑值;

根据运算参数和预置的运算公式计算所述当前帧音频信号的第一参考值,并通过比较所述第一参考值与预置的第一阈值的大小判定所述当前帧音频信号的第一音频状态,所述运算参数包括第一平均值和第一指数平滑值,所述第一音频状态为纯噪声状态或非纯噪声状态;

根据音频状态与搜索窗长的预置第一对应关系确定所述第一音频状态对应的搜索窗长。

优选地,

根据运算参数和预置的运算公式计算所述当前帧音频信号的第一参考值,并通过比较所述第一参考值与预置的第一阈值的大小判定所述当前帧音频信号的第一音频状态具体包括:

根据预置的第一差值公式计算所述第一平均值和所述第一指数平滑值的差,并将所述差作为所述当前帧音频信号的第一参考值;

比较所述第一参考值与预置的第一阈值的大小,当所述第一参考值大于述第一阈值时,判定所述当前帧音频信号的第一音频状态为非纯噪声状态,否则判定所述当前帧音频信号的第一音频状态为纯噪声状态。

优选地,

在根据运算参数和预置的运算公式计算所述当前帧音频信号的第一参考值之前,还包括:

获取上一帧音频信号的第二音频状态,所述第二音频状态为纯噪声状态或非纯噪声状态;

根据音频状态和第一阈值的预置第二对应关系选择所述第二音频状态对应的第一阈值或根据音频状态和运算公式的预置第三对应关系选择所述第二音频状态对应的运算公式。

优选地,

所述运算参数还包括所述上一帧音频信号对应的第二参考值;

所述第二音频状态为纯噪声状态时,对应的运算公式为其中attack为所述第一参考值,attack[n-1]为所述第二参考值,fast[n]为第一平均值,slow[n]为第一指数平滑值,P和Q为正整数,K、L、M和Decay均为常数,0<Decay<1,且M>L>N;

根据运算参数和预置的运算公式计算所述当前帧音频信号的第一参考值,并通过比较所述第一参考值与预置的第一阈值的大小判定所述当前帧音频信号的第一音频状态具体包括:

比较所述第一参考值与预置的第一阈值的大小,当所述第一参考值大于所述第一阈值时,判定所述当前帧音频信号的第一音频状态为非纯噪声状态。

优选地,

所述的处理方法,还包括:

若所述第一参考值小于等于所述第一阈值,则比较所述第一参考值与预置的第二阈值的大小;

若所述第一参考值大于所述第二阈值,则根据预置的自相关公式计算所述当前帧音频信号的自相关度,并将所述自相关度与预置的第五阈值比较;

若所述自相关度大于所述第五阈值,则判定所述当前帧音频信号的第一音频状态为非纯噪声状态,否则判定所述当前帧音频信号的第一音频状态为纯噪声状态。

优选地,

所述运算参数还包括上一帧音频信号在各个采样点处幅值的第二平均值和所述第二平均值对应的第二指数平滑值;

所述第二音频状态为非纯噪声状态时,对应的运算公式包括第一运算公式diff_fast[n]=|fast[n]-fast[n-1]|和第二运算公式diff_slow[n]=|slow[n]-slow[n-1]|,fast[n]为第一平均值,slow[n]为第一指数平滑值,fast[n-1]为第二平均值,slow[n-1]为第二指数平滑值;

根据运算参数和预置的运算公式计算所述当前帧音频信号的第一参考值,并通过比较所述第一参考值与预置的第一阈值的大小判定所述当前帧音频信号的第一音频状态具体包括:

根据所述第一平均值、所述第二平均值和所述第一运算公式计算第三参考值diff_fast[n];

根据所述第一指数平滑值、所述第二指数平滑值和所述第二运算公式计算第四参考值diff_slow[n];

分别比较所述第三参考值与所述第三阈值、所述第四参考值与所述第四阈值的大小,当所述第三参考值小于所述第三阈值且所述第四参考值小于所述第四阈值时,记为第一参考值小于第一阈值一次,所述第一参考值包括所述第三参考值和所述第四参考值,所述第一阈值包括所述第三阈值和所述第四阈值;

当所述第一参考值小于第一阈值的连续次数大于等于预设次数,则判定所述当前帧音频信号的第一音频状态为纯噪声状态,否则判定所述当前帧音频信号的第一音频状态为非纯噪声状态。

优选地,

所述指数平滑公式为slow[n]=fast[n]*αs+slow[n-1]*(1-αs),其中fast[n]为第一平均值,slow[n]为当前帧音频信号对应的第一指数平滑值,slow[n-1]为上一帧音频信号对应的第二指数平滑值,αs是平滑系数。

本申请第二方面提供一种音频信号的处理装置,包括:

第一获取单元,用于根据当前帧音频信号的采样率和时长获取所述当前帧音频信号在各个采样点处幅值的第一平均值;

第二获取单元,用于获取所述第一平均值对应的第一指数平滑值;

音频状态判定单元,用于根据运算参数和预置的运算公式计算所述当前帧音频信号的第一参考值,并通过比较所述第一参考值与预置的第一阈值的大小判定所述当前帧音频信号的第一音频状态,所述运算参数包括第一平均值和第一指数平滑值,所述第一音频状态为纯噪声状态或非纯噪声状态;

搜索窗长确定单元,用于根据音频状态与搜索窗长的预置第一对应关系确定所述第一音频状态对应的搜索窗长。

优选地,

所述音频状态判定单元具体包括:

第一参考值计算子单元,用于根据预置的第一差值公式计算所述第一平均值和所述第一指数平滑值的差,并将所述差作为所述当前帧音频信号的第一参考值;

第一判定子单元,用于比较所述第一参考值与预置的第一阈值的大小,当所述第一参考值大于述第一阈值时,判定所述当前帧音频信号的第一音频状态为非纯噪声状态,否则判定所述当前帧音频信号的第一音频状态为纯噪声状态。

优选地,

所述的处理装置还包括:

第三获取单元,用于获取上一帧音频信号的第二音频状态,所述第二音频状态为纯噪声状态或非纯噪声状态;

选择单元,用于根据音频状态和第一阈值的预置第二对应关系选择所述第二音频状态对应的第一阈值或根据音频状态和运算公式的预置第三对应关系选择所述第二音频状态对应的运算公式。

优选地,

所述运算参数还包括所述上一帧音频信号对应的第二参考值;

所述第二音频状态为纯噪声状态时,对应的运算公式为其中attack为所述第一参考值,attack[n-1]为所述第二参考值,fast[n]为第一平均值,slow[n]为第一指数平滑值,P和Q为正整数,K、L、M和Decay均为常数,0<Decay<1,且M>L>K;

所述音频状态判定单元包括:

第二判定子单元,用于比较所述第一参考值与预置的第一阈值的大小,当所述第一参考值大于所述第一阈值时,判定所述当前帧音频信号的第一音频状态为非纯噪声状态。

优选地,

所述音频状态判定单元还包括:

第一比较子单元,用于当所述第一参考值小于等于所述第一阈值时,比较所述第一参考值与预置的第二阈值的大小;

相关度计算子单元,用于当所述第一参考值大于所述第二阈值时,根据预置的自相关公式计算所述当前帧音频信号的自相关度,并将所述自相关度与预置的第五阈值比较;

第三判定子单元,用于当所述自相关度大于所述第五阈值时,判定所述当前帧音频信号的第一音频状态为非纯噪声状态,否则判定所述当前帧音频信号的第一音频状态为纯噪声状态。

优选地,

所述运算参数还包括上一帧音频信号在各个采样点处幅值的第二平均值和所述第二平均值对应的第二指数平滑值;

所述第二音频状态为非纯噪声状态时,对应的运算公式包括第一运算公式diff_fast[n]=|fast[n]-fast[n-1]|和第二运算公式diff_slow[n]=|slow[n]-slow[n-1]|,fast[n]为第一平均值,slow[n]为第一指数平滑值,fast[n-1]为第二平均值,slow[n-1]为第二指数平滑值;

所述音频状态判定单元具体包括:

第二参考值计算子单元,用于根据所述第一平均值、所述第二平均值和所述第一运算公式计算所述第三参考值diff_fast[n];

第三参考值计算子单元,用于根据所述第一指数平滑值、所述第二指数平滑值和所述第二运算公式计算所述第四参考值diff_slow[n];

第二比较子单元,用于分别比较所述第三参考值与所述第三阈值、所述第四参考值与所述第四阈值的大小,当所述第三参考值小于所述第三阈值且所述第四参考值小于所述第四阈值时,记为第一参考值小于第一阈值一次,所述第一参考值包括所述第三参考值和所述第四参考值,所述第一阈值包括所述第三阈值和所述第四阈值。

第四判断子单元,用于当所述第一参考值小于第一阈值的连续次数大于等于预设次数,则判定所述当前帧音频信号的第一音频状态为纯噪声状态,否则判定所述当前帧音频信号的第一音频状态为非纯噪声状态。

本申请第三方面提供一种音频信号的处理设备,所述设备包括处理器以及存储器:

所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;

所述处理器用于根据所述程序代码中的指令,执行如上述第一方面所述的处理方法的步骤。

本申请第四方面提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行上述第一方面所述的方法。

从以上技术方案可以看出,本申请实施例具有以下优点:

本申请实施例中,提供了一种音频信号的处理方法,包括根据当前帧音频信号的采样率和时长获取当前帧音频信号在各个采样点处幅值的第一平均值;获取第一平均值对应的第一指数平滑值;根据运算参数和预置的运算公式计算当前帧音频信号的第一参考值,并通过比较第一参考值与预置的第一阈值的大小判定当前帧音频信号的第一音频状态,运算参数包括第一平均值和第一指数平滑值,第一音频状态为纯噪声状态或非纯噪声状态;根据音频状态与搜索窗长的预置第一对应关系确定第一音频状态对应的搜索窗长;

第一平均值和第一指数平滑值可以看成两种不同速度的包络信号值,可以用于音频信号的预测,本申请实施例利用该特性计算得到第一参考值,然后通过第一参考值对当前帧音频信号的音频状态进行判断,从而根据音频状态确定相应的搜索窗长,这样,在MCRA算法中,若当前帧音频信号为纯噪声时,便可以适当降低搜索窗长,从而可以减短降噪异常的持续时长,以改善去噪效果;若当前帧音频信号为非噪声时,便可以适当增加窗长防止对非噪声信号产生不良影响。

附图说明

图1是一段纯噪声信号;

图2是图1中的纯噪声信号经现有的MCRA算法降噪处理后的信号示意图;

图3为一段包含非噪声信号和噪声信号的待处理信号;

图4为图3中的待处理信号经现有的MCRA算法降噪处理后形成的信号示意图;

图5为本申请实施例中音频信号的处理方法的第一实施例的流程示意图;

图6为本申请实施例中音频信号的处理方法的第二实施例的流程示意图;

图7为使用本申请实施例中的处理方法和MCRA算法对图1中的纯噪声信号进行处理后的信号示意图;

图8为使用本申请实施例中的处理方法和MCRA算法对图3中的非纯噪声信号进行处理后的信号示意图;

图9为本申请实施例中音频信号的处理装置的第一实施例的结构示意图;

图10为本申请实施例中音频信号的处理设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

发明人在研究中发现,如果用现有的MCRA算法进行噪声估计,那么在噪声信号突然增强后的一段时间里,噪声信号无法被正常抑制,直到多秒后,降噪效果才正常;尽管通过降低搜索窗长度可以减短降噪异常的持续时长并改善去噪效果,但因搜索窗长的大小是固定的,所以同时会对非噪声信号产生不良影响。

因此,需要自适应调整搜索窗长,当音频信号为纯噪声信号时,可以适当减短搜索窗长,当音频信号为非纯噪声信号时,可以适当增加搜索窗长。

所以本申请实施例提供了一种音频信号的处理方法,先预设设定好音频状态对应的搜索窗长,然后对音频信号的音频状态进行判断,根据判断的结果确定对应的搜索窗长,使得在减短降噪异常的持续时长的同时,不会对非噪声信号产生不良影响。

为了便于理解,请参阅图5,本申请实施例中音频信号的处理方法的第一实施例的流程示意图。

本申请提供了一种音频信号的处理方法的第一实施例,包括:

步骤501,根据当前帧音频信号的采样率和时长获取当前帧音频信号在各个采样点处幅值的第一平均值。

可以理解的是,对于一帧待处理的音频信号,采样率和时长是确定的,例如,当前帧音频信号的采样率可以是32000KHz,时长可以是20ms,那么采样点则有32000*20个。

步骤502,根据预置的指数平滑公式获取第一平均值对应的第一指数平滑值。

因为指数平滑包括一次指数平滑、二次指数平滑以及其他多次指数平滑,所以对应的指数平滑公式也有多种,例如,指数平滑公式可以为slow[n]=fast[n]*αs+slow[n-1]*(1-αs),其中fast[n]为第一平均值,slow[n]为当前帧音频信号对应的第一指数平滑值,slow[n-1]为上一帧音频信号对应的第二指数平滑值,αs是平滑系数。

可以理解的是,第一平均值是由当前帧音频信号的采样率和时长决定的,而第一指数平滑值由上一帧音频信号对应的第二指数平滑值、第一平均值和平滑系数三者决定,而平滑系数决定了第一指数平滑值追踪第一平均值的速度。

步骤503,根据运算参数和预置的运算公式计算当前帧音频信号的第一参考值,并通过比较第一参考值与预置的第一阈值的大小判定当前帧音频信号的第一音频状态,运算参数包括第一平均值和第一指数平滑值,第一音频状态为纯噪声状态或非纯噪声状态。

需要说明的是,因为第一平均值和第一指数平滑值的变化速率不同,所以本申请实施例利用第一平均值和第一指数平滑值之间的差异和变化趋势来判定当前音频信号的第一音频状态;而具体的判定方法有多种,因此对应的运算公式也可以有多种,此处不做限定。

步骤504,根据音频状态与搜索窗长的预置第一对应关系确定第一音频状态对应的搜索窗长。

可以理解的是,不同的音频状态预设的搜索窗长不同,例如当第一音频状态为纯噪声状态时,对应的搜索窗长可以为1ms,当第一音频状态为非纯噪声状态时,对应的搜素窗长可以为0.5ms。

本申请实施例根据第一平均值和第一指数平滑值计算得到第一参考值,然后通过第一参考值对当前帧音频信号的音频状态进行判断,从而根据音频状态确定相应的搜索窗长,这样,在MCRA算法中,若当前帧音频信号为纯噪声时,便可以适当降低搜索窗长,从而可以减短降噪异常的持续时长,以改善去噪效果;若当前帧音频信号为非噪声时,便可以适当增加窗长防止对非噪声信号产生不良影响。

进一步地,步骤503可以具体包括:

根据预置的第一差值公式计算第一平均值和第一指数平滑值的差,并将差作为当前帧音频信号的第一参考值。

比较第一参考值与预置的第一阈值的大小,当第一参考值大于述第一阈值时,判定当前帧音频信号的第一音频状态为非纯噪声状态,否则判定当前帧音频信号的第一音频状态为纯噪声状态。

可以理解的是,在指数平滑法中,第一平均值可以理解为实际值,第一指数平滑值可以理解为预测值,当实际值与预测值的差足够大时,便可以判定当前帧音频信号的第一音频状态为非纯噪声状态。

为了便于理解,请参阅图6,本申请实施例中音频信号的处理方法的第二实施例的流程示意图。

本申请提供了一种音频信号的处理方法的第二实施例,包括:

步骤601,根据当前帧音频信号的采样率和时长获取当前帧音频信号在各个采样点处幅值的第一平均值。

需要说明的是,步骤601的内容与本申请第一实施例步骤501的内容相同,具体可参见本申请第一实施例中步骤501的内容,此处不做赘述。

步骤602,根据预置的指数平滑公式获取第一平均值对应的第一指数平滑值。

需要说明的是,步骤602的内容与本申请第一实施例步骤502的内容相同,具体可参见本申请第一实施例中步骤502的内容,此处不做赘述。

步骤603,获取上一帧音频信号的第二音频状态,第二音频状态为纯噪声状态或非纯噪声状态。

需要说明的是,在本实施例中,步骤603与步骤601的先后顺序不做限定。

步骤604,根据音频状态和第一阈值的预置第二对应关系选择第二音频状态对应的第一阈值或根据音频状态和运算公式的预置第三对应关系选择第二音频状态对应的运算公式。

需要说明的是,相邻两帧音频信号的相关性往往较大,所以当前帧音频信号的音频状态判定需要依据上一帧音频信号的音频状态。

例如,当同一帧音频信号分别放在纯噪声状态的音频信号和非纯噪声状态的音频信号后面,最终判定的音频状态可能不同,为了尽可能保留有用的非纯噪声,同一帧音频信号放在非纯噪声状态的音频信号后面,相比于放在纯噪声状态的音频信号后面,被判定为非纯噪声状态的可能性应该更大。

因此,在本申请实施例中,会根据第二音频状态选择相应的运算公式和阈值,以尽可能地避免因判断错误导致非纯噪声音频信号被去除。

另外需要说明的是,不同的运算公式可以采用不同的运算参数进行运算,该运算参数可以与上一帧音频信号相关,所以有的运算公式在上一帧音频信号为纯噪声状态时更适用,有的运算公式在上一帧音频信号为非纯噪声状态时更适用。

因此,本申请实施例根据第二音频状态选择相应的运算公式可以利用每个运算公式的优势,以实现音频状态的准确判定。

进一步地,在本申请实施例中,运算参数还可以包括上一帧音频信号对应的第二参考值;当第二音频状态为纯噪声状态时,对应的运算公式可以为其中attack为第一参考值,attack[n-1]为第二参考值,fast[n]为第一平均值,slow[n]为第一指数平滑值,P和Q为正整数,K、L、M和Decay均为常数,0<Decay<1,且M>L>K。

可以理解的是,K、L、M和Decay均可以根据实际需要进行调整,例如Decay取0.9,M、L、K分别取0、0.1、0.5,还可以通过将attack[n]的取值限制在0至1之间。

那么,本申请实施例提供的处理方法还包括:

步骤605,比较第一参考值与预置的第一阈值的大小,当第一参考值大于第一阈值时,判定当前帧音频信号的第一音频状态为非纯噪声状态。

步骤606,若第一参考值小于等于第一阈值,则比较第一参考值与预置的第二阈值的大小。

步骤607,若第一参考值大于第二阈值,则根据预置的自相关公式计算当前帧音频信号的自相关度,并将自相关度与预置的第五阈值比较。

自相关度公式可以为其中sn[i]为待处理音频信号,i为采样点,n为待处理音频信号的序号,SR为采样率,T为时长,在该自相关度公式中,步长为1,还可以根据实际需要将步长设置为2或其他正整数。

步骤608,若自相关度大于第五阈值,则判定当前帧音频信号的第一音频状态为非纯噪声状态,否则判定当前帧音频信号的第一音频状态为纯噪声状态。

可以理解的是,在实际应用中,当前帧音频信号可能是声音很微弱的信号,即幅值很小,此时,如果只通过第一参考值与第一阈值的比较,可能不能准确判定出当前音频信号为非纯噪声状态;所以为了尽可能地将非出纯噪声状态的当前音频信号判定出,本申请实施例设定了第二阈值,当第一参考值不大于第一阈值但是大于第二阈值时,便可以通过计算自相关度来判定当前音频信号的第一音频状态。

进一步地,运算参数还可以包括上一帧音频信号在各个采样点处幅值的第二平均值和第二平均值对应的第二指数平滑值,当第二音频状态为非纯噪声状态时,对应的运算公式可以包括第一运算公式diff_fast[n]=|fast[n]-fast[n-1]|和第二运算公式diff_slow[n]=|slow[n]-slow[n-1]|,fast[n]为第一平均值,slow[n]为第一指数平滑值,fast[n-1]为第二平均值,slow[n-1]为第二指数平滑值。

那么,本申请实施例提供的处理方法还包括:

步骤609,根据第一平均值、第二平均值和第一运算公式计算第三参考值diff_fast[n]。

步骤610,根据第一指数平滑值、第二指数平滑值和第二运算公式计算第四参考值diff_slow[n]。

步骤611,分别比较第三参考值与第三阈值、第四参考值与第四阈值的大小,当第三参考值小于第三阈值且第四参考值小于第四阈值时,记为第一参考值小于第一阈值一次,第一参考值包括第三参考值和第四参考值,第一阈值包括第三阈值和第四阈值。

步骤612,当第一参考值小于第一阈值的连续次数大于等于预设次数,则判定当前帧音频信号的第一音频状态为纯噪声状态,否则判定当前帧音频信号的第一音频状态为非纯噪声状态。

需要说明的是,预设次数可以根据实际需要进行设定,例如可以设置为1;而为了防止错误地将含有有用信号的当前帧音频信号判定为纯噪声状态,可以适当增加预设次数的值,例如设置成2或3。

步骤613,根据音频状态与搜索窗长的预置第一对应关系确定第一音频状态对应的搜索窗长。

需要说明的是,步骤613的内容与本申请第一实施例步骤504的内容相同,具体可参见本申请第一实施例中步骤504的内容,此处不做赘述。

为了体现本申请实施例中音频信号的处理方法的效果,请参阅图图7和图8,图7为使用本申请实施例中的处理方法和MCRA算法对图1中的纯噪声信号进行处理后的信号示意图,图8为使用本申请实施例中的处理方法和MCRA算法对图3中的非纯噪声信号进行处理后的信号示意图,将图7与图2对比,将图8与图4对比,可以明显看出,本申请实施例在减短降噪异常持续时长的同时,有效地避免了对非噪声信号产生不良影响。

请参阅图9,本申请实施例中音频信号的处理装置的第一实施例的结构示意图。

本申请提供一种音频信号的处理装置的第一实施例,包括:

第一获取单元901,用于根据当前帧音频信号的采样率和时长获取当前帧音频信号在各个采样点处幅值的第一平均值;

第二获取单元902,用于获取第一平均值对应的第一指数平滑值;

音频状态判定单元903,用于根据运算参数和预置的运算公式计算当前帧音频信号的第一参考值,并通过比较第一参考值与预置的第一阈值的大小判定当前帧音频信号的第一音频状态,运算参数包括第一平均值和第一指数平滑值,第一音频状态为纯噪声状态或非纯噪声状态;

搜索窗长确定单元904,用于根据音频状态与搜索窗长的预置第一对应关系确定第一音频状态对应的搜索窗长。

进一步地,音频状态判定单元903可以具体包括:

第一参考值计算子单元,用于根据预置的第一差值公式计算第一平均值和第一指数平滑值的差,并将差作为当前帧音频信号的第一参考值;

第一判定子单元,用于比较第一参考值与预置的第一阈值的大小,当第一参考值大于述第一阈值时,判定当前帧音频信号的第一音频状态为非纯噪声状态,否则判定当前帧音频信号的第一音频状态为纯噪声状态。

进一步地,音频信号的处理装置还可以包括:

第三获取单元,用于获取上一帧音频信号的第二音频状态,第二音频状态为纯噪声状态或非纯噪声状态;

选择单元,用于根据音频状态和第一阈值的预置第二对应关系选择第二音频状态对应的第一阈值或根据音频状态和运算公式的预置第三对应关系选择第二音频状态对应的运算公式。

进一步地,运算参数还包括上一帧音频信号对应的第二参考值;

第二音频状态为纯噪声状态时,对应的运算公式为其中attack为第一参考值,attack[n-1]为第二参考值,fast[n]为第一平均值,slow[n]为第一指数平滑值,P和Q为正整数,K、L、M和Decay均为常数,0<Decay<1,且M>L>N;

音频状态判定单元903可以包括:

第二判定子单元,用于比较第一参考值与预置的第一阈值的大小,当第一参考值大于第一阈值时,判定当前帧音频信号的第一音频状态为非纯噪声状态。

进一步地,音频状态判定单元903还可以包括:

第一比较子单元,用于当第一参考值小于等于第一阈值时,比较第一参考值与预置的第二阈值的大小;

相关度计算子单元,用于当第一参考值大于第二阈值时,根据预置的自相关公式计算当前帧音频信号的自相关度,并将自相关度与预置的第五阈值比较;

第三判定子单元,用于当自相关度大于第五阈值时,判定当前帧音频信号的第一音频状态为非纯噪声状态,否则判定当前帧音频信号的第一音频状态为纯噪声状态。

进一步地,

运算参数还可以包括上一帧音频信号在各个采样点处幅值的第二平均值和第二平均值对应的第二指数平滑值;

第二音频状态为非纯噪声状态时,对应的运算公式包括第一运算公式diff_fast[n]=|fast[n]-fast[n-1]|和第二运算公式diff_slow[n]=|slow[n]-slow[n-1]|,fast[n]为第一平均值,slow[n]为第一指数平滑值,fast[n-1]为第二平均值,slow[n-1]为第二指数平滑值;

音频状态判定单元903具体可以包括:

第二参考值计算子单元,用于根据第一平均值、第二平均值和第一运算公式计算第三参考值diff_fast[n];

第三参考值计算子单元,用于根据第一指数平滑值、第二指数平滑值和第二运算公式计算第四参考值diff_slow[n];

第二比较子单元,用于分别比较第三参考值与第三阈值、第四参考值与第四阈值的大小,当第三参考值小于第三阈值且第四参考值小于第四阈值时,记为第一参考值小于第一阈值一次,第一参考值包括第三参考值和第四参考值,第一阈值包括第三阈值和第四阈值。

第四判断子单元,用于当第一参考值小于第一阈值的连续次数大于等于预设次数,则判定当前帧音频信号的第一音频状态为纯噪声状态,否则判定当前帧音频信号的第一音频状态为非纯噪声状态。

请参阅图10,本申请实施例中音频信号的处理设备的结构示意图。

本申请实施例还提供一种音频信号的处理设备,设备包括处理器101以及存储器102:

存储器102用于存储程序代码,并将程序代码传输给处理器101;

处理器101用于根据程序代码中的指令,执行前述各个实施例所述的一种音频信号的处理方法中的任意一种实施方式。

本申请实施例还提供一种计算机可读存储介质,用于存储程序代码,该程序代码用于执行前述各个实施例所述的一种音频信号的处理方法中的任意一种实施方式。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-Only Memory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1