噪声检测方法及装置与流程

文档序号:12128411阅读:来源:国知局

技术特征:

1.一种噪声检测方法,其特征在于,所述方法包括:

对于目标音频信号包括的多个帧信号中的每个帧信号,基于所述帧信号的截止频率,确定所述帧信号包括的子带的子带个数以及每个子带的频域幅度平均值,所述目标音频信号为进行噪声检测的音频信号;

基于所述多个帧信号中每个子带的频域幅度平均值,确定是否存在连续预设数值个含有噪声的帧信号,以及确定帧信号差异系数;

当存在连续预设数值个含有噪声的帧信号,且所述帧信号差异系数大于预设系数阈值时,确定所述目标音频信号中存在噪声。

2.根据权利要求1所述的方法,其特征在于,所述基于所述帧信号的截止频率,确定所述帧信号包括的子带的子带个数以及每个子带的频域幅度平均值,包括:

基于所述帧信号的截止频率和预设频点个数,确定所述帧信号包括的子带的子带个数;

基于所述帧信号包括的每个子带的频域信号和所述预设频点个数,确定所述帧信号中每个子带的频域幅度平均值。

3.根据权利要求1所述的方法,其特征在于,所述基于所述多个帧信号中每个子带的频域幅度平均值,确定是否存在连续预设数值个含有噪声的帧信号,以及确定帧信号差异系数,包括:

对于所述多个帧信号中的每个帧信号,基于所述帧信号中每个子带的频域幅度平均值,确定所述帧信号的频域幅度平均值;

基于所述帧信号中每个子带的频域幅度平均值、所述帧信号的频域幅度平均值和所述帧信号包括的子带的子带个数,确定所述帧信号的平稳程度;

确定所述帧信号中子带的最大频域幅度平均值与最小频域幅度平均值之间的比值,得到所述帧信号的幅度比值;

基于所述帧信号的频点个数和所述帧信号的时域信号,确定所述帧信号的时域幅度平均值;

基于所述帧信号的平稳程度、所述帧信号的幅度比值以及所述帧信号的时域幅度平均值,确定是否存在连续预设数值个含有噪声的帧信号;

基于所述多个帧信号的幅度比值,确定所述帧信号差异系数。

4.根据权利要求3所述的方法,其特征在于,所述基于所述帧信号中每个子带的频域幅度平均值、所述帧信号的频域幅度平均值和所述帧信号包括的子带的子带个数,确定所述帧信号的平稳程度,包括:

基于所述帧信号中每个子带的频域幅度平均值、所述帧信号的频域幅度平均值和所述帧信号包括的子带的子带个数,通过如下公式确定所述帧信号的平稳程度;

<mrow> <msub> <mi>F</mi> <mi>v</mi> </msub> <mo>=</mo> <mfrac> <mn>1</mn> <mi>N</mi> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>n</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msup> <mrow> <mo>(</mo> <mi>F</mi> <mo>(</mo> <mi>n</mi> <mo>)</mo> <mo>/</mo> <msub> <mi>F</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>a</mi> <mi>n</mi> </mrow> </msub> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow>

其中,上述公式中,所述Fv为所述帧信号的平稳程度,所述N为所述帧信号包括的子带的子带个数,所述F(n)为所述帧信号中第n个子带的频域幅度平均值,所述Fmean为所述帧信号的频域幅度平均值。

5.根据权利要求3所述的方法,其特征在于,所述基于所述帧信号的平稳程度、所述帧信号的幅度比值以及所述帧信号的时域幅度平均值,确定是否存在连续预设数值个含有噪声的帧信号,包括:

从预设条件中确定所述帧信号的截止频率所满足的条件;

将所述帧信号的截止频率所满足的条件对应的第一数值与预设数值进行相乘,得到第二数值;

当所述多个帧信号中存在连续预设数值个帧信号的时域幅度平均值大于预设幅度阈值、帧信号的平稳程度小于预设平稳阈值,且帧信号的幅度比值大于第二数值时,确定存在连续预设数值个含有噪声的帧信号。

6.根据权利要求3所述的方法,其特征在于,所述基于所述多个帧信号的幅度比值,确定所述帧信号差异系数,包括:

基于所述多个帧信号的幅度比值,通过下述公式确定所述帧信号差异系数;

<mrow> <mi>G</mi> <mo>=</mo> <mfrac> <mrow> <msub> <mi>F</mi> <mrow> <mi>v</mi> <mi>r</mi> <mi>a</mi> <mi>d</mi> <mi>i</mi> <mi>o</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>m</mi> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>F</mi> <mrow> <mi>v</mi> <mi>r</mi> <mi>a</mi> <mi>d</mi> <mi>i</mi> <mi>o</mi> </mrow> </msub> <mrow> <mo>(</mo> <mrow> <mi>m</mi> <mo>+</mo> <mn>1</mn> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>F</mi> <mrow> <mi>v</mi> <mi>r</mi> <mi>a</mi> <mi>d</mi> <mi>i</mi> <mi>o</mi> </mrow> </msub> <mrow> <mo>(</mo> <mrow> <mi>m</mi> <mo>+</mo> <mn>2</mn> </mrow> <mo>)</mo> </mrow> </mrow> <mrow> <msub> <mi>F</mi> <mrow> <mi>v</mi> <mi>r</mi> <mi>a</mi> <mi>d</mi> <mi>i</mi> <mi>o</mi> </mrow> </msub> <mrow> <mo>(</mo> <mrow> <mi>m</mi> <mo>-</mo> <mn>4</mn> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>F</mi> <mrow> <mi>v</mi> <mi>r</mi> <mi>a</mi> <mi>d</mi> <mi>i</mi> <mi>o</mi> </mrow> </msub> <mrow> <mo>(</mo> <mrow> <mi>m</mi> <mo>-</mo> <mn>5</mn> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>F</mi> <mrow> <mi>v</mi> <mi>r</mi> <mi>a</mi> <mi>d</mi> <mi>i</mi> <mi>o</mi> </mrow> </msub> <mrow> <mo>(</mo> <mrow> <mi>m</mi> <mo>-</mo> <mn>6</mn> </mrow> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>

其中,上述公式中,所述G为所述帧信号差异系数,所述Fvradio(m)为所述目标音频信号中第m个帧信号的幅度比值,所述m大于或等于7。

7.一种噪声检测装置,其特征在于,所述装置包括:

第一确定模块,用于对于目标音频信号包括的多个帧信号中的每个帧信号,基于所述帧信号的截止频率,确定所述帧信号包括的子带的子带个数以及每个子带的频域幅度平均值,所述目标音频信号为进行噪声检测的音频信号;

第二确定模块,用于基于所述多个帧信号中每个子带的频域幅度平均值,确定是否存在连续预设数值个含有噪声的帧信号,以及确定帧信号差异系数;

第三确定模块,用于当存在连续预设数值个含有噪声的帧信号,且所述帧信号差异系数大于预设系数阈值时,确定所述目标音频信号中存在噪声。

8.根据权利要求7所述的装置,其特征在于,所述第一确定模块包括:

第一确定子模块,用于基于所述帧信号的截止频率和预设频点个数,确定所述帧信号包括的子带的子带个数;

第二确定子模块,用于基于所述帧信号包括的每个子带的频域信号和所述预设频点个数,确定所述帧信号中每个子带的频域幅度平均值。

9.根据权利要求7所述的装置,其特征在于,所述第二确定模块包括:

第三确定子模块,用于对于所述多个帧信号中的每个帧信号,基于所述帧信号中每个子带的频域幅度平均值,确定所述帧信号的频域幅度平均值;

第四确定子模块,用于基于所述帧信号中每个子带的频域幅度平均值、所述帧信号的频域幅度平均值和所述帧信号包括的子带的子带个数,确定所述帧信号的平稳程度;

第五确定子模块,用于确定所述帧信号中子带的最大频域幅度平均值与最小频域幅度平均值之间的比值,得到所述帧信号的幅度比值;

第六确定子模块,用于基于所述帧信号的频点个数和所述帧信号的时域信号,确定所述帧信号的时域幅度平均值;

第七确定子模块,用于基于所述帧信号的平稳程度、所述帧信号的幅度比值以及所述帧信号的时域幅度平均值,确定是否存在连续预设数值个含有噪声的帧信号;

第八确定子模块,用于基于所述多个帧信号的幅度比值,确定所述帧信号差异系数。

10.根据权利要求9所述的装置,其特征在于,所述第四确定子模块用于:

基于所述帧信号中每个子带的频域幅度平均值、所述帧信号的频域幅度平均值和所述帧信号包括的子带的子带个数,通过如下公式确定所述帧信号的平稳程度;

<mrow> <msub> <mi>F</mi> <mi>v</mi> </msub> <mo>=</mo> <mfrac> <mn>1</mn> <mi>N</mi> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>n</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msup> <mrow> <mo>(</mo> <mi>F</mi> <mo>(</mo> <mi>n</mi> <mo>)</mo> <mo>/</mo> <msub> <mi>F</mi> <mrow> <mi>m</mi> <mi>e</mi> <mi>a</mi> <mi>n</mi> </mrow> </msub> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow>

其中,上述公式中,所述Fv为所述帧信号的平稳程度,所述N为所述帧信号包括的子带的子带个数,所述F(n)为所述帧信号中第n个子带的频域幅度平均值,所述Fmean为所述帧信号的频域幅度平均值。

11.根据权利要求9所述的方法,其特征在于,所述第七确定子模块用于:

从预设条件中确定所述帧信号的截止频率所满足的条件;

将所述帧信号的截止频率所满足的条件对应的第一数值与预设数值进行相乘,得到第二数值;

当所述多个帧信号中存在连续预设数值个帧信号的时域幅度平均值大于预设幅度阈值、帧信号的平稳程度小于预设平稳阈值,且帧信号的幅度比值大于第二数值时,确定存在连续预设数值个含有噪声的帧信号。

12.根据权利要求9所述的装置,其特征在于,所述第八确定子模块用于:

基于所述多个帧信号的幅度比值,通过下述公式确定所述帧信号差异系数;

<mrow> <mi>G</mi> <mo>=</mo> <mfrac> <mrow> <msub> <mi>F</mi> <mrow> <mi>v</mi> <mi>r</mi> <mi>a</mi> <mi>d</mi> <mi>i</mi> <mi>o</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>m</mi> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>F</mi> <mrow> <mi>v</mi> <mi>r</mi> <mi>a</mi> <mi>d</mi> <mi>i</mi> <mi>o</mi> </mrow> </msub> <mrow> <mo>(</mo> <mrow> <mi>m</mi> <mo>+</mo> <mn>1</mn> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>F</mi> <mrow> <mi>v</mi> <mi>r</mi> <mi>a</mi> <mi>d</mi> <mi>i</mi> <mi>o</mi> </mrow> </msub> <mrow> <mo>(</mo> <mrow> <mi>m</mi> <mo>+</mo> <mn>2</mn> </mrow> <mo>)</mo> </mrow> </mrow> <mrow> <msub> <mi>F</mi> <mrow> <mi>v</mi> <mi>r</mi> <mi>a</mi> <mi>d</mi> <mi>i</mi> <mi>o</mi> </mrow> </msub> <mrow> <mo>(</mo> <mrow> <mi>m</mi> <mo>-</mo> <mn>4</mn> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>F</mi> <mrow> <mi>v</mi> <mi>r</mi> <mi>a</mi> <mi>d</mi> <mi>i</mi> <mi>o</mi> </mrow> </msub> <mrow> <mo>(</mo> <mrow> <mi>m</mi> <mo>-</mo> <mn>5</mn> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>F</mi> <mrow> <mi>v</mi> <mi>r</mi> <mi>a</mi> <mi>d</mi> <mi>i</mi> <mi>o</mi> </mrow> </msub> <mrow> <mo>(</mo> <mrow> <mi>m</mi> <mo>-</mo> <mn>6</mn> </mrow> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>

其中,上述公式中,所述G为所述帧信号差异系数,所述Fvradio(m)为所述目标音频信号中第m个帧信号的幅度比值,所述m大于或等于7。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1