一种基于似然比测试的噪声鲁棒性的检测方法

文档序号：9811925阅读：725来源：国知局

一种基于似然比测试的噪声鲁棒性的检测方法
【技术领域】
[0001] 本发明涉及语音处理和信号处理领域，特别指一种基于似然比测试的噪声鲁棒性的检测方法。
【背景技术】
[0002] 语音端点检测（VAD)是语音处理相关技术中的一个非常关键的部分，它不仅可用于语音增强中的语音/非语音检测，而且可应用于特征提取和语音信号去混响等过程中。现有的语音信号端点检测算法主要分为三大类:基于时间域的端点检测方法、基于频率域的端点检测方法和基于模型统计的端点检测方法。
[0003] 实际应用中，高精度的语音端点检测对后续的语音增强、端点检测、语音识别或声纹识别都有极其重要的作用。然而，现有的语音端点检测技术仍然存在着一些问题和不足，尤其在实际信道环境下，由于语音信号清音和摩擦音成分的频谱特征与噪音具有很大相似性，而现有大部分端点检测算法都是基于语音本身音节特征实现对语音和噪音的区分，因此在检测端点的过程中，可能会丢失语音起始音或收尾音导致截断效应。同时，大多数算法无法完整保留所有语音信息，当信噪比降低时，检测性能也将明显下降。

【发明内容】

[0004] 本发明所要解决的技术问题是针对现有技术的缺陷，提供分别从信噪比的估计、阈值的鲁棒性设置和拖尾失真消除三个方面进行改进，使得提出的算法相对于现有的算法在低信噪比环境下尤其是非平稳噪声环境下具有更好检测性能的基于似然比测试的噪声鲁棒性的检测方法。
[0005] 本发明为解决上述技术问题采用以下技术方案:一种基于似然比测试的噪声鲁棒性的检测方法，包括以下步骤： 51、通过维纳滤波器对带噪语音信号进行语音增强，以便减弱带噪语音中的噪声信号对干净语音的影响，且提高过滤后的噪声信号的平稳特性;经过维纳滤波器语音增强后的带噪语音信号可以通过干净语音s(n)和干扰噪声痛禱藝加養到:. 其中，η为时间采样索引，且此时通过维纳滤波器后的干净语音信号和干扰噪声可以具备统计独立且均值为零的特性； 52、对带噪语音进行傅立叶变换，经过滤波的带噪语音信号在频谱域上通过干净语音信号的频谱因子叠加干扰噪声的频谱因子得到；
其中，__!#、_尾:_和___:为每帧信号的短时傅立叶因子，m为帧索引，k为帧内的各个频段值,?和釋3分别表示非语音帧和语音帧； 53、计算似然比，干净语音信号和噪声信号的概率密度都满足高斯分布时，观测信号 Χ(η\ k)在Ηβ和％下的概率密度函数为
其中= 为语音信号的功率谱，權|_i:繼夂麵繼麵为噪声信号的功率谱；该帧第k频段的似然比值为：
其中，^ 儀_，樣 i:S_ 后验?目噪比，且先验?目噪比IUa和后验?目噪比Iw#:在直接决策估计器中存在着以下关系：
其中炫鍾一令_数平稳因穿場前一?_的:语音:_号金计一帧的噪声功率谱； 54、进行噪声估计，并设定阈值_，将阈值_与似然比的值相比较来确定当前帧为语音段或非语音段，当似然比的值大于阈值时，初次判定该帧为语音帧，而当似然比的值小于阈值时，就认定该帧为非语音帧，具体可以通过如下公式表示：
其中，Κ为频带总数;％和分别表示非语音帧和语音帧； 55、确定决策规则，m帧的对数似然比为：
表示以In为中心的连续2M+1帧，则以这2M+1个对数似然比为对象的判决规则为：
其中旨賴对于其中的第k频段下的对数似然比1_魏^:，将观测信号在祖和的概率代入其中得到：
先验信噪比龜后验信噪比通过最大似然估计算法得到，即：
因此，对数似然比的值取决于噪声能量谱 se、拖尾失真消除，当信噪比低时，噪声能量谱变大，通过降低选取的阈值符来降低发声段误判概率;反之，通过增大阈值q来和高信噪比信号进行匹配；带噪语音功率谱谱由带噪信号功率谱編平滑得到，平滑因子为时频相关函数，则：
其麵_%_蠢一,与:__1目髮通·論觀矛利用基于最小统计的噪声估计就可以得到每帧信号最小噪声功率谱。与所述噪声能量谱相关的阈值符^为：
其中％是该阈值的一个常系数。
[0006]本发明采用以上技术方案与现有技术相比，具有以下技术效果:本发明所提出的 VAD算法与基于谐波特征的M0LRT算法具有相似的SBR正确率，但却比基于谐波特征的M0LRT 算法具有更为优异的多VAcc;本发明提出的VAD算法在15dB和25dB的信噪比下具有相似的性能，说明本方法对噪声具有很好的鲁棒性。
【附图说明】
[0007]图1(a)是干净语音的示意图。
[0008] 图1(b)是基于Sohn的VAD结果示意图。
[0009] 图1(c)是基于Tan的VAD结果示意图。
[0010]图1(d)是基于本发明所述方法的VAD结果示意图。
[0011] 图2(a)是不同信噪比下的段级性能比较。
[0012] 图2(b)是不同信噪比下的帧级性能比较。
[0013] 图2(c)是不同信噪比下语音帧的正确个数。
[0014] 图3是本发明中基于语音增强的语音端点检测框架示意图。
【具体实施方式】
[0015] 下面结合附图对本发明的技术方案做进一步的详细说明：如图3所示，本发明采取的技术方案如下:一种基于似然比测试的噪声鲁棒性的检测方法，包括以下步骤： S1、通过维纳滤波器对带噪语音信号进行语音增强，以便减弱带噪语音中的噪声信号对干净语音的影响，且提高过滤后的噪声信号的平稳特性;经过维纳滤波器语音增强后的带噪语音信号可以通过干净语音s(n)和干扰噪声痛_基加養:??爸:讀其中，η为时间采样索引，且此时通过维纳滤波器后的干净语音信号和干扰噪声可以具备统计独立且均值为零的特性； 52、对带噪语音进行傅立叶变换，经过滤波的带噪语音信号在频谱域上通过干净语音信号的频谱因子叠加干扰噪声的频谱因子得到；
其中，物爾和断紙鮮为每帧信号的短时傅立叶因子，m为帧索引，k为帧内的各个频段值，ft和分别表示非语音帧和语音帧； 53、计算似然比，干净语音信号和噪声信号的概率密度都满足高斯分布时，观测信号 ___在拓和％下的概率密度函数为
其中___:::二_〖|_漏誦为语音信号的功率谱，_驗:徽=::麵信号的功率谱；该帧第k频段的似然比值为：
其中，s 后验?目噪比，且先验?目噪比和后验?目噪比^^&在直接决策估计器中存在着以下关系：
其中吞逶一，霜数因編:_:表麵一语音傷号愈计，:fe _表承_ 一帧的噪声功率谱； 54、进行噪声估计，并设定阈值S，将阈值q与似然比的值相比较来确定当前帧为语音段或非语音段，当似然比的值大于阈值时，初次判定该帧为语音帧，而当似然比的值小于阈值时，就认定该帧为非语音帧，具体可以通过如下公式表示：
其中，K为频带总数;_和醒:分别表示非语音帧和语音帧； 55、确定决策规则，m帧的对数似然比为：
I?:種表示以L为中心的连续2M+1帧，则以这2M+1个对数似然比为对象的判决规则为：
其中厶指代每一齓对于其中的第k频段下的对数似然比__^丄，将观测信号在観和観的概率代入其中得到：
先验信噪比由后验信噪比通过最大似然估计算法得到，即：
因此，对数似然比的值取决于噪声能量谱 se、拖尾失真消除，当信噪比低时，噪声能量谱变大，通过降低选取的阈值^|来降低发声段误判概率;反之，通过增大阈值η来和高信噪比信号进行匹配；带噪语音功率谱谱__雜由带噪信号功率谱隱平滑得到，平滑因子#|儀|为时频相关函数，则：
其日賴_|_的,稳:因:識利用基于最小统计的噪声估计就可以得到每帧信号最小噪声功率谱每憂I，与所述噪声能量谱相关的阈值1u为：
其中_是该阈值的一个常系数。
[0016 ]具体地，本发明带噪语音爾由干净语音_ii和干扰噪声d(n)叠加得到：
其中，η为时间采样索引。
[0017]假定干净语音和干扰噪声具有统计独立和均值为零的特点，且带噪语音的傅立叶变换可以表示为
其中，__爾、5(故f |和輔_ ||为每帧信号的短时傅立叶因子，m为帧索引，k为帧内的各个频段值，?和A分别表示非语音帧和语音帧。假设干净语音信号和噪声信号的概率密度都满足高斯分布，那么观测信号麵__在_和_:下的概率密度函数为：
其中= '浓.妇門分别为语音信号和噪声信号的功率谱。于是该帧第k频段的似然比(LR)值就为：
其中= %2 ('取处/# (取衫，=丨幻丨(?n4)分别表示先验信噪比和后验信噪比，且先验信噪比1義:和后验信噪比在直接决策(DD)估计器中存在着以下关系：
假设

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李为;朱杰;包旭雷;
技术所有人：深圳市音加密科技有限公司;
我是此专利的发明人