基于非负低秩和稀疏矩阵分解原理的语音增强方法

文档序号：2826395阅读：327来源：国知局

基于非负低秩和稀疏矩阵分解原理的语音增强方法
【专利摘要】本发明公开了一种基于非负低秩和稀疏矩阵分解原理的语音增强方法。该方法首先对含噪语音信号进行平滑、分帧和离散傅里叶变换，得到含噪语音频谱；然后将每帧的含噪语音幅度谱作为列向量按时间顺序排列构成一个含噪语音时频矩阵，通过对含噪语音时频矩阵进行非负低秩和稀疏矩阵分解，获得非负的低秩和稀疏矩阵；利用稀疏矩阵和含噪语音相位重构增强语音频谱，最后通过逆傅里叶变换得到时域形式的增强语音。本发明对噪声适应性强、不需要进行端点检测和模型训练、参数少易调节，强噪声环境性能好，有很好的应用前景。
【专利说明】基于非负低秩和稀疏矩阵分解原理的语音增强方法
【技术领域】
[0001]本发明涉及信号处理领域，适用于含噪语音的噪声抑制，特别是基于非负低秩和稀疏矩阵分解原理的语音增强方法。
【背景技术】
[0002]语音信号是人类交流信息最自然、最有效的手段。随着人类进入信息化时代，迫切需要使用先进的语音处理技术来促进人类社会智能化。早在2000年，比尔盖茨就曾提出“未来10年是语音的时代”。最近几年，随着苹果、谷歌、微软等公司先后推出智能语音服务，智能语音产业已经成为信息【技术领域】中的新兴产业，用户认知度和市场规模正在逐渐扩大。特别是苹果新近推出的智能手机具有语音助理功能，以及科大讯飞的语音“云技术”推出，使智能语音技术面临更加广阔的应用。然而，语音通信和应用过程中不可避免地受到来自周围环境、传播媒介和通信设备内部噪声的干扰，严重影响了智能语音技术的实际应用。
[0003]语音增强是解决噪声污染的有效技术。语音增强通过抑制噪声对语音的干扰，使得增强处理的语音信号同原始纯净语音信号之间的失真最小。过去几十年来，涌现了许多语音增强算法，典型的算法包括谱减法、基于谱幅度最小均方误差、子空间法、小波降噪法。在信噪比较高的环境下语音增强已经得到了有效解决。然而，由于自然环境中噪声的多样性及语音信号本身的复杂性，语音增强算法根据应用环境的不同而不同，这使得其研究工作难度很大，强噪声和多种噪声环境的语音增强问题仍然没有得到很好解决。
[0004]在现有的语音增强算法中，许多方法试图使用语音信号和噪声信号的概率密度模型来最大程度上的移除噪声信号，然而近年研究表明单一的某种分布并不能适用于所有的语音或噪声，需要更为灵活的数学模型和模型估计算法以适应信号自身的特点。此外，在现有语音增强算法中，噪声估计是语音增强算法的前期必备工作。借助噪声估计可以获得噪声功率谱和语音信号的先验信噪比，对语音增强效果的改善至关重要。现有的语音增强方法通过语音端点检测将采集到的语音信号分为噪声段和含噪语音段，利用噪声段来估计和更新噪声估计量，然而这是一种次优估计方式，实际中噪声段和含噪语音段的瞬时噪声并不完全相符，因此，这种噪声估计方法总会带来误差，况且现有语音端点检测技术在低信噪比和非平稳噪声环境下尚不成熟，容易造成误判，会导致语音中存在很大的残留噪声。
[0005]近年的压缩感知理论研究表明，许多实际的观测量都可以归结为一个低秩分量和稀疏分量相加的模式，借助矩阵的低秩和稀疏矩阵分解，可以从大噪声或异常值污染数据中恢复原始数据信息。矩阵的低秩和稀疏矩阵分解已经用于图像增强、视频目标检测、数据挖掘等许多科技领域。
[0006]平稳随机噪声和周期噪声是最常见的两种噪声类别。平稳随机噪声用一阶和二阶统计量描述其随机过程，它的均值和自相关函数与时间无关，由于随机信号自相关函数的傅里叶变换是功率谱，因此平稳随机噪声的时频矩阵是一个秩数为I的低秩矩阵。同样，如果噪声为周期性噪声，由于其时频矩阵只在某些固定频率处有值，其矩阵列向量具有较强的相关性，必然也是一个低秩矩阵。
[0007]综上所述，背景噪声的时频矩阵列向量具有很强的相关性，因此噪声的时频矩阵具有低秩性。相对背景噪声而言，语音源信号在大部分时频点上取值为零或者接近于零，只有少数采样点处取值较大，所以语音源信号具有一定的稀疏性，适合用稀疏矩阵描述。因此，可以考虑借鉴矩阵的低秩和稀疏分解理论来解决语音增强问题。中国专利公开了一种基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法(
【发明者】孙成立, 须明, 王希敏, 谢坚筱申请人:航空电子系统综合技术重点实验室

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：孙成立;须明;王希敏;谢坚筱
技术所有人：航空电子系统综合技术重点实验室
我是此专利的发明人

上一篇：电动车高响度电喇叭的制作方法
上一篇：模拟原声音调的方法和音调信号合成系统的制作方法