噪声检测装置、噪声去除装置和噪声检测方法

文档序号:2822497研发日期:2009年阅读:559来源:国知局
技术简介:
本专利提出一种基于峰平稳性与功率平稳性分析的噪声检测与去除方法。通过时频变换获取信号谱,结合功率谱计算及帧间特征分析,精准识别频域中具有稳定峰值或幅值分布的噪声频率,利用判定单元综合判断噪声存在性,最终通过相位反相合成信号实现噪声消除,显著提升音频信号传输中交流噪声的检测精度与去除效果。
关键词:噪声检测,峰平稳性,功率平稳性
专利名称:噪声检测装置、噪声去除装置和噪声检测方法
技术领域
本公开在这里涉及用于检测音频通信中产生的剌耳噪声的噪声检测装置及噪声
检测方法。
背景技术
在音频通信中,由于诸如放大器或者AD或DA转换器的一些电路的问题(例如,放大器电路与电源电路没有隔离),交流噪声干扰音频信号,使音质劣化。 为了检测交流噪声,可以将输入信号从时域变换到频域,并且在预定交流噪声频率处出现平稳峰时检测到该频率处存在交流噪声。该预定交流噪声频率可以是50Hz或60Hz及其谐波(harmonic overtone),其中50Hz和60Hz对应于日本商用电源的频率。
由于混入了诸如语音和背景噪声的干扰声音,该频率分量可能在交流噪声预期产生峰的频率处未形成峰。在这种情况下,可能在该预期频率处检测不到交流噪声。
下面,将详细地描述上述问题。图1A到图1C为例示了没有检测到交流噪声的情况的示例图。如图1A到图IC中所示,当干扰声音的谱叠加在交流噪声的谱上时,在频率A的峰未出现在交流噪声预期产生峰的位置处。在这种情况下,在该频率A处检测不到交流噪声分量。当去除其他频率处的交流噪声分量时,最终可能得到不自然的语音声音。
[专利文献1]日本专利申请公开2005-77423。

发明内容
根据一个实施方式,一种噪声检测装置包括时频变换单元,其配置为将输入信号从时域转换到频域以产生谱;功率谱计算单元,其配置为根据所述谱获取多个频率的功率;峰平稳性检测单元,其配置为利用在各帧中所述多个频率的功率的峰来检测所述功率的平稳峰所在的频率;功率平稳性检测单元,其配置为利用在各帧中所述多个频率的功率的幅值来检测所述功率的幅值平稳时所在的频率;以及判定单元,其配置为利用所述峰平稳性检测单元检测到的频率和所述功率平稳性检测单元检测到的频率来判定是否存在在所述频域中具有峰平稳性和功率平稳性中至少一项的噪声。


图1A到图1C为例示了没有检测到交流噪声的情况的示例图; 图2为例示了交流噪声在频域中的谱的图; 图3为例示了根据第一实施方式的噪声检测装置的主要功能结构的一个示例的框图; 图4为例示了交流噪声所在的频率处的功率分布的一个示例的图; 图5为例示了由噪声检测装置执行的噪声检测处理的一个示例的流程图; 图6为例示了根据第二实施方式的噪声检测装置的主要功能结构的一个示例的框 图7为例示了由噪声检测装置执行的噪声检测处理的一个示例的流程图; 图8为例示了根据第三实施方式的噪声去除装置的主要功能结构的一个示例的
框图; 图9为例示了由噪声去除装置执行的噪声去除处理的一个示例的流程图;以及 图10为例示了采用了噪声检测装置的音频信号传输系统的一个示例的图。
具体实施例方式
下面,在首先描述了交流噪声的特征之后,通过参照附图来描述用于实施本发明的实施方式。 图2为例示了交流噪声在频域中的谱的图。在图2中,纵轴表示频率,横轴表示时间。各线的浓度(thickness)或者密度表示功率谱的幅值。在图2中,线越浓或者越密,则相应频率处的谱功率越强。交流噪声具有以下两个特征。 第一,交流噪声的峰是与时间的演进无关地平稳的(stationary)(例如,峰平稳性(peak stationarity))。这可以通过所例示的直线保持在同一频率位置处这一事实看出。 第二,给定峰处的频率功率谱的幅值与时间的演进无关地保持恒定(例如,功率平稳性)。在图2中这可以通过在给定峰频率处线的浓度或密度几乎保持恒定这一事实看出。这样,交流噪声具有多个频率分量,各频率分量在频域中具有平稳的峰位置和平稳功率。 下面,对利用了交流噪声的这两个特征检测在频域中具有峰和功率平稳性的噪声(包括交流噪声)的实施方式进行描述。
〈第一实施方式>
〈功能结构> 图3为例示了根据第一实施方式的噪声检测装置1的主要功能结构的一个示例的框图。图3的噪声检测装置1包括时频变换单元11、功率谱计算单元12、峰平稳性检测单元13、功率平稳性检测单元14和判定单元15。 该时频变换单元11将输入信号逐帧地从时域变换到频域。可以通过将信号从时域变换到频域的已知变换方案(诸如,离散傅立叶变换(DFT :discrete Fouriertransform)或快速傅立叶变换(FFT :fast Fourier transform))来执行该时-频变换。时频变换单元11将通过时频变换获得的谱提供给功率谱计算单元12。 功率谱计算单元12接收由时频变换单元11产生的谱,并根据所接收的谱计算功率谱。功率谱计算单元12将所计算出的功率谱提供给峰平稳性检测单元13和功率平稳性检测单元14。 峰平稳性检测单元13利用从功率谱计算单元12接收的功率谱的峰来识别(或检测)功率的峰所在的频率,即,识别(或检测)具有峰平稳性的频率。峰平稳性检测单元13逐帧地存储该功率谱。例如,如果在所存储的功率谱中超过50%的帧中在给定频率处出现了峰,则峰平稳性检测单元13检测到平稳峰。 峰平稳性检测单元13可以选择所存储的功率谱的子集。例如,如果在所选择的子集中超过50%的帧中在给定频率处出现了峰,则峰平稳性检测单元13可以检测到平稳的峰。例如,该子集可以对应于30个帧。峰平稳性检测单元13将所检测到的频率(在该频率处功率谱具有平稳峰)提供给判定单元15。 峰平稳性检测单元13在检测平稳峰时还可以考虑以下条件。例如,这样的一个条件可以规定给定峰的功率比周围频率的功率大X(dB :分贝)或者给定峰的功率大于Y(dBov)。例如,X可以是3,而Y可以是-60。这用来去除微小的峰。 功率平稳性检测单元14利用从功率谱计算单元12接收的功率谱的幅值来识别(或检测)功率的幅值接近恒定时的频率,即,识别(或检测)具有功率平稳性的频率。功率平稳性检测单元14逐帧地存储该功率谱。例如,如果在所存储的功率谱中超过60%的帧中在给定频率处的功率幅值落入给定的5dB范围内,则功率平稳性检测单元14检测到平稳功率。 功率平稳性检测单元14可以选择所存储的功率谱的子集。例如,如果在所选择的子集中超过60%的帧中在给定频率处的功率幅值落入给定的5dB范围内,则功率平稳性检测单元14可以检测到平稳功率。例如,该子集可以对应于30个帧。功率平稳性检测单元14将所检测到的功率谱的幅值平稳时的频率提供给判定单元15。 现在将通过参考图4描述功率平稳性。图4为例示了交流噪声所在的频率处的功率分布的一个示例的图。在图4中所示的示例中,左边的实心条A表示包括语音和背景噪声中的至少一种以及交流噪声的频率分量的功率分布。右边的空心条B表示仅包括交流噪声的频率分量的功率分布。功率轴以5dB为单元进行分区,并且针对各5dB区间对功率值进行计数(tally)。功率轴下面出现的数字(-18、-75等)各表示该区间的代表值。
如图4中所示,分布B具有较大集中度(concentration) 。 S卩,功率在-50dBov范围内的帧的数量占所选择的子集中的帧的70%以上。功率分布A比功率分布B具有更大的方差,但也具有一定集中度。因此,即使语音或背景噪声与交流噪声混合,也可以利用频率分量的功率分布的集中度判定出是否存在交流噪声。即,当计算出功率分布的集中度并检测到该集中度大于预定阈值时,检测到功率平稳性。 功率平稳性检测单元14在检测平稳功率时还可以考虑以下条件。例如, 一个这样的条件可以规定功率大于Z(dBov)。例如,Z可以是-60。这用来去除微小功率值。
判定单元15利用从峰平稳性检测单元13接收的频率和从功率平稳性检测单元14接收的频率来判定是否存在在频域中具有峰和功率平稳性的噪声(例如,交流噪声)。判定单元15包括数量判定单元151。 数量判定单元151对峰平稳性检测单元13和功率平稳性单元14中至少之一检测到的频率的数量进行计数,并判定该计数是否超过预定数量。例如,在8kHz抽样的情况下,预定数量可以是10。可以规定可以不对峰平稳性检测单元13和功率平稳性检测单元14 二者都检测到的频率进行两次计数。 如果数量判定单元151发现计数超过预定数量,则判定单元15检测到存在在频域中具有峰和功率平稳性的噪声。在这种情况下,噪声检测装置1可以在所计数的频率中检测到存在具有峰平稳性和功率平稳性的噪声。如果数量判定单元151发现计数没有超过预定数量,则判定单元15判定不存在在频域中具有峰平稳性和功率平稳性的噪声。
〈操作> 下面,将描述根据第一实施方式的噪声检测装置1的操作。图5为例示了由噪声
6检测装置1执行的噪声检测处理的一个示例的流程图。 在步骤S 11中,时频变换单元11通过对输入信号执行时频变换来计算谱,然后将所计算出的谱提供给功率谱计算单元12。 在步骤S12中,功率谱计算单元12根据所提供的谱计算功率谱,并将计算出的功率谱提供给峰平稳性检测单元13和功率平稳性检测单元14。 在步骤S13中,峰平稳性检测单元13利用所提供的功率谱的峰来检测平稳的功率峰所在的频率。已经描述了如何检测这种频率的细节。然后,峰平稳性检测单元13将所检测到的频率提供给判定单元15。 在步骤S14中,判定单元15的数量判定单元151对峰平稳性检测单元13所检测到的频率的数量进行计数。 在步骤S15中,功率平稳性检测单元14利用所提供的功率谱的功率来检测功率的幅值平稳时的频率。已经描述了如何检测这种频率的细节。然后功率平稳性检测单元14将所检测到的频率提供给判定单元15。 在步骤S16中,判定单元15的数量判定单元151对功率平稳性检测单元14所检测到的频率的数量进行计数。可以规定在步骤S14和S16中,判定单元15的数量判定单元151不对同一频率进行两次计数。 在步骤S17中,判定单元15的数量判定单元151判定通过计数获得的计数是否大于预定数量。如果对步骤S17中的判定的回答为是(即,计数大于预定数量),则处理前进到步骤S18。如果对步骤S17中的判定的回答为否(即,计数不大于预定数量),则处理结束。 在步骤S18中,噪声检测装置1产生这样的指示,即,对在步骤S17中使用的计数做出了贡献的频率处检测到噪声。 下面,将描述对仅利用峰平稳性进行噪声检测的情况和利用峰平稳性和功率平稳
性进行噪声检测的情况之间的噪声检出率进行比较的实验。 利用以下输入信号来进行该实验。-交流噪声 基频50Hz或60Hz 功率幅值平均-30到_50dBov-干扰噪声 在街道、办公室、火车站等记录到的噪声。 在以下条件下对于包括上述交流噪声和背景噪声的输入信号判定存在交流噪声。
-峰平稳性检测 如果对于各具有128ms长度的30个帧(对应于大约4秒钟)而言在超过50%的
帧中满足以下两个条件,则将检测到给定频率,作为具有平稳峰的功率 1)功率大于_60dBov ;以及 2)功率比相邻频率的功率大至少3dB。-功率平稳性检测 如果对于各具有128ms长度的30个帧(对应于大约4秒钟)而言在超过60%的帧中满足以下两个条件,则将检测到给定频率,作为具有平稳功率的频率功率落入给定的
75dB范围内,并且大于_60dBov。-判定标准 1)仅利用峰平稳性的情况 如果在作为基频的整数倍的频率处出现了峰,则检测到存在交流噪声。
2)利用峰平稳性和功率平稳性的情况 当通过峰平稳性检测和功率平稳性检测中至少一项检测到的频率数量为10或更多时,检测到存在交流噪声。 根据上述实验,在仅利用峰平稳性进行判定的情况下交流噪声检出率为79%,而
在利用峰平稳性和功率平稳性两者进行判定的情况下交流噪声检出率为92%。因此,与仅
利用峰平稳性进行的交流噪声判定相比,利用峰平稳性和功率平稳性两者进行的交流噪声
判定提高了交流噪声检出率。此外,上述实验表明第一实施方式的噪声检测装置l,对于既
具有峰平稳性和功率平稳性的诸如交流噪声的噪声而言,能够提高噪声检出率。 根据第一实施方式,输入信号的功率谱用于检测具有峰平稳性或者功率平稳性的
频率,由此对于在频域中既具有峰平稳性又具有功率平稳性的噪声而言提高了噪声检出率。〈第二实施方式> 下面,将描述根据第二实施方式的噪声检测装置2。在第二实施方式中,为了检测是否存在噪声,选择特定频率作为基频,并且检测是该基频的整数倍的那些频率。另外,在第二实施方式中,仅对在基频的整数倍中检测到的频率进行计数。对于在基频的整数倍的频率处平稳的交流噪声而言,这提高了噪声检测的准确性。
〈功能结构> 图6为例示了根据第二实施方式的噪声检测装置2的主要功能结构的一个示例的框图。关于图6中所示的功能,与图3中的功能相同或者类似的功能用相同的标号表示,并省略其描述。 图6的噪声检测装置2包括时频变换单元11、功率谱计算单元12、峰平稳性检测
单元13、功率平稳性检测单元14和判定单元21。下面,将描述判定单元21。 判定单元21包括谐波判定单元211和数量判定单元212。谐波判定单元211假定
选择的频率是基频。谐波判定单元211判定在峰平稳性检测单元13或者功率平稳性检测
单元14检测到的频率当中是否存在是基频的整数倍的频率。所选择的频率可以是峰平稳
性检测单元13或者功率平稳性检测单元14检测到的频率当中的最低频率。 在检测由商用电源等产生的交流噪声的情况下,所选择的频率可以是作为日本商
用电源的频率的50Hz和60Hz中的至少一个。存在多个选择频率。 数量判定单元212对由谐波判定单元211确定为基频的整数倍的频率的数量进行计数,并判定该计数是否超过预定数量。该配置使得可以更准确地检测到在基频的谐波处具有峰平稳性和功率平稳性的诸如交流噪声的噪声。
〈操作> 下面,将描述根据第二实施方式的噪声检测装置2的操作。图7为例示了由噪声检测装置2执行的噪声检测处理的一个示例的流程图。关于图7中所示的步骤,与图5的步骤相同或者类似的步骤用相同的标号表示,并省略其描述。
在步骤S21中,判定单元21的谐波判定单元211判定在峰平稳性检测单元13或者功率平稳性检测单元14检测到的频率当中是否存在是基频的整数倍的频率。如果对步骤S21中的判定的回答为是(S卩,存在等于基频的整数倍的频率),则处理前进到步骤S22。如果对步骤S21中的判定的回答为否(g卩,不存在等于基频的整数倍的频率),则处理结束。
提前选择适当的频率作为基频。所选择的频率可以是峰平稳性检测单元13或者功率平稳性检测单元14检测到的频率当中的最低频率,或者可以是作为日本商用电源的频率的50Hz和60Hz中的至少一个。 在步骤S22中,判定单元21的数量判定单元212对被检测为基频的整数倍的频率的数量进行计数。 在步骤S23中,判定单元21的数量判定单元212判定通过步骤S22中的计数获得
的计数是否大于预定数量。例如,该预定数量可以是IO。然后,如果对步骤S23中的判定的
回答为是,则对在计数判定中使用计数做出了贡献的频率处检测到噪声。 根据第二实施方式,可以更准确地检测在基频的谐波处具有峰和功率平稳性的诸
如交流噪声的噪声。此外,在不用识别出噪声的真正基频的情况下,提高了交流噪声检出率。 数量判定单元212可以不是必需的。例如,可以规定当谐波判定单元211检测到
是基频的整数倍的频率时,仅这种检测就可以当作在这些频率处存在交流噪声的指示。
〈第三实施方式> 下面,将描述根据第三实施方式的噪声去除装置3。在第三实施方式中,一旦检测
到噪声,就去除该检测到的噪声。下面,将描述去除由第一实施方式的判定单元15检测到
的噪声的情况。尽管如此,可以使用替代结构,其中,去除由第二实施方式的判定单元21检
测到的噪声。〈功能结构> 图8为例示了根据第三实施方式的噪声去除装置3的主要功能结构的一个示例的框图。关于图8中所示的功能,与图3中功能相同或者类似的功能用相同的标号表示,并省略其描述。 图8的噪声去除装置3包括时频变换单元11、功率谱计算单元12、峰平稳性检测单元13、功率平稳性检测单元14、判定单元15和去除单元31。下面,将描述去除单元31。
去除单元31合成与判定单元15已经检测到存在噪声的各频率的谱相对应的正弦波,由此产生时域中的噪声信号。然后,去除单元31将所产生的噪声信号的相位反相,并将
反相后的信号添加到输入信号。结果,获得已去除了检测到的噪声的输出信号。
〈操作> 下面,将描述根据第三实施方式的噪声去除装置3的操作。图9为例示了由噪声去除装置3执行的噪声去除处理的一个示例的流程图。关于图9中所示的步骤,与图5中的步骤相同或者类似的步骤用相同的标号表示,并省略其描述。 在步骤S31中,去除单元31合成与步骤S18中被检测为噪声的各频率的谱相对应的正弦波,由此产生噪声信号。然后,去除单元31将所产生的噪声信号的相位反相,并将反相后的信号添加到输入信号。 根据上述第三实施方式,获得已经去除了所检测到的噪声的输出信号。
上述实施方式中所述的检测噪声的处理可以实现为使得计算机执行该处理的程序。这样的程序可以从服务器等安装到计算机,以由计算机来执行,由此执行噪声检测处理。 该程序可以记录在记录介质(例如,CD-R0M、 SD卡等)中。其中记录有程序的这种记录介质可以由计算机或者便携式终端读取,由此执行如前所述的噪声检测处理。记录介质可以是任何类型的记录介质。即,它可以是利用光、电或者磁的方式记录信息的记录介质(例如,CD-ROM、软盘或者磁光盘),或者可以是利用电的方式记录信息的半导体存储器(例如,ROM或闪存)。 图10为例示了采用了噪声检测装置的音频信号传输系统的一个示例的图。这里公开的噪声检测装置可以应用到例示的音频信号传输系统中以准确地检测通过网络传输的音频信号中的诸如交流噪声的噪声。 根据所公开的噪声检测装置,输入信号的功率谱用于检测具有峰平稳性或者功率平稳性的频率,由此对于在频域中既具有峰平稳性又具有功率平稳性的噪声而言提高噪声检出率。 此外,本发明不限于这些实施方式,而是可以在不偏离本发明的范围的情况下进行各种变形和修改。 这里引用的所有示例和条件语言目的都是出于教导目的,以辅助读者理解发明人对本领域作出了贡献的发明和概念,并且所有示例和这里引用的条件语言都是要解释为并不限于这种具体引用的示例和条件,并且说明书中的这种示例的组织也不涉及对本发明的优劣的展示。尽管已经详细描述了本发明的实施方式,但是应当理解的是,在不偏离本发明的精神和范围的情况下,可以对其作出各种改变、代替和变更。
10
权利要求
一种噪声检测装置,该噪声装置包括时频变换单元,其配置成将输入信号从时域变换到频域以产生谱;功率谱计算单元,其配置成根据所述谱获取多个频率的功率;峰平稳性检测单元,其配置成利用在各帧中所述多个频率的功率的峰来检测所述功率的平稳峰所在的频率;功率平稳性检测单元,其配置成利用在各帧中所述多个频率的功率的幅值来检测所述功率的幅值平稳时的频率;以及判定单元,其配置成利用所述峰平稳性检测单元检测到的频率和所述功率平稳性检测单元检测到的频率来判定是否存在在所述频域中具有峰平稳性和功率平稳性中至少一项的噪声。
2. 根据权利要求1所述的噪声检测装置,其中,所述判定单元包括数量判定单元,该数量判定单元配置成判定由所述峰平稳性检测单元和所述功率平稳性检测单元中的至少一个所检测到的频率的总数是否超过预定数量,并响应于所述数量判定单元作出的所述总数超过所述预定数量的判定而检测出存在噪声。
3. 根据权利要求2所述的噪声检测装置,其中,所述数量判定单元配置成仅对所述峰平稳性检测单元和所述功率平稳性检测单元中的至少一个所检测到的频率当中是预定频率的整数倍的频率进行计数。
4. 根据权利要求1到3中任何一项所述的噪声检测装置,其中,所述功率平稳性检测单元配置成检测出这样的频率,即对于该频率中各频率而言相应功率的幅值的分布具有比第一阈值更大的集中度,作为所述功率的幅值平稳时的频率。
5. 根据权利要求4所述的噪声检测装置,其中,所述功率平稳性检测单元配置成检测出这样的频率,即对于该频率中各频率而言在所述分布中具有最大集中度的所述相应功率的幅值大于第二阈值,作为所述功率的幅值平稳时的频率。
6. 根据权利要求1到3中任何一项所述的噪声检测装置,其中,所述峰平稳性检测单元配置成检测这样的频率,在该频率处所述功率在所关心的帧的总数中超过预定比例的帧中呈现局部最大值,作为所述功率的平稳峰所在的频率。
7. 根据权利要求6所述的噪声检测装置,其中,所述峰平稳性检测单元配置成检测比相邻频率的功率大第四阈值的平稳峰。
8. 根据权利要求6所述的噪声检测装置,其中,所述峰平稳性检测单元配置成检测大于第五阈值的平稳峰。
9. 一种噪声去除装置,该噪声去除装置包括时频变换单元,其配置为将输入信号从时域变换到频域以产生谱;功率谱计算单元,其配置根据所述谱获取多个频率的功率;峰平稳性检测单元,其配置为利用在各帧中所述多个频率的功率的峰来检测所述功率的平稳峰所在的频率;功率平稳性检测单元,其配置为利用在各帧中所述多个频率的功率的幅值来检测所述功率的幅值平稳时所处的频率;判定单元,其配置为利用所述峰平稳性检测单元检测到的频率和所述功率平稳性检测单元检测到的频率来判定是否存在在所述频域中具有峰平稳性和功率平稳性的噪声;噪声去除单元,其配置成合成与所述判定单元已经检测到存在所述噪声的频率的谱相对应的正弦波以产生噪声信号,并使所产生的噪声信号的相位反相以添加到所述输入信号。
10. —种噪声检测方法,该方法包括以下步骤时频变换步骤,该步骤将输入信号从时域变换到频域以产生谱;功率谱计算步骤,该步骤根据所述谱获取多个频率的功率;峰平稳性检测步骤,该步骤利用在各帧中通过所述功率谱计算步骤获得的所述多个频率的功率的峰来检测所述功率的平稳峰所在的频率;功率平稳性检测步骤,该步骤利用在各帧中通过所述功率谱计算步骤获得的所述多个频率的功率的幅值来检测所述功率的幅值平稳时所处的频率;以及判定步骤,该步骤利用所述峰平稳性检测步骤检测到的频率和所述功率平稳性检测步骤检测到的频率来判定是否存在在所述频域中具有峰平稳性和功率平稳性中至少一项的噪声。
全文摘要
一种噪声检测装置包括时频变换单元,其配置为将输入信号从时域变换到频域以产生谱;功率谱计算单元,其配置为从所述谱获取多个频率的功率;峰平稳性检测单元,其配置为利用在各帧中所述多个频率的功率的峰来检测所述功率的平稳峰所在的频率;功率平稳性检测单元,其配置为利用在各帧中所述多个频率的功率的幅值来检测所述功率的幅值平稳时所处的频率;以及判定单元,其配置为利用所述峰平稳性检测单元检测到的频率和所述功率平稳性检测单元检测到的频率来判定是否存在在所述频域中具有峰平稳性和功率平稳性中至少一项的噪声。
文档编号G10K11/178GK101763853SQ200910247119
公开日2010年6月30日 申请日期2009年11月30日 优先权日2008年12月24日
发明者伊藤周作, 大谷猛, 田中正清 申请人:富士通株式会社
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!