基于自适应冗余字典的语音信号稀疏表示方法

文档序号：2819002阅读：884来源：国知局

专利名称：基于自适应冗余字典的语音信号稀疏表示方法
技术领域：
本发明涉及信号处理领域，特别是涉及一种基于自适应冗余字典的语音信号稀疏表示方法，用于稀疏表示语音信号，可应用于语音信号去噪、语音信号特征识别、语音压缩编码和语音压缩感知等领域。
背景技术：
传统语音信号去噪方法基于以下假设在含有噪声的语音信号中，有用信息部分的频率较低，而噪声的频率较高。但是，实际中上述假设条件并不总是成立。一方面，语音中清音帧和过渡帧的有用信息部分含有高频分量；另一方面，噪声虽然以高频成分为主，但也含有低频成分。因此，语音中的有用信息部分和噪声往往在频带上存在重迭，这是造成基于有用信息和噪声频率特性差别的传统语音去噪方法存在缺陷的根本原因。基于语音稀疏分解的去噪方法，将语音中的有用信息部分作为稀疏成分，而将噪声作为语音去除其中稀疏成分后得到的残差，并以此作为语音去噪处理的基础。利用语音的稀疏成分重构语音信号可以有效地消除噪声的影响，获得较高的信噪比，提高语音通话质量，具有应用价值。在信号处理中，用空间变换有效地表达信号，可提高压缩效率。传统的信号表示是基于“正交基”的展开，如DCT，小波变换等，但这种分解不总能够达到较好的效果，尤其是对时频变化范围很广的信号效果更差。一种更好的信号表示方式应是根据信号的特点，自适应地选择基函数。现有技术中，有提出信号在过完备原子库(或称为冗余字典)上进行稀疏分解的思想，该原子库比通常的完备正交基大得多，在信号所表示的空间中足够密。因此，信号稀疏表示的结果就是信号线性展开中大部分基函数的系数为零，只有少数基函数具有较大的非零系数。这里称基函数为原子，其集合为字典。信号稀疏表示具有由可揭示信号主要特征与内在结构的少量原子来表示信号的优良特性，因此在信号去噪、特征识别、弱信号提取和数据压缩等领域得到了广泛应用。语音信号稀疏表示的关键问题之一是设计有效的冗余字典。当前，人们提出多种冗余字典，但它们不总能保证信号的稀疏性。井爱雯等人选取可分离Gabor函数作为语音原子库(井爱雯，刘云，“基于MP算法的语音信号稀疏分解”，计算机工程与应用，2009， 45(5) :144-146)，但离散Gabor函数中多个时频参数所得的原子数量巨大，增加了冗余字典的复杂度。Aharon 等人提出了 K-SVD 算法(M. Aharon, Μ. Elad, Α. Μ. Bruckstein, "The K-SVD :an algorithm for designing of overcomplete dictionaries for sparse representation". IEEE Transactions on Signal Processing,2006,54(11) 4311-4322.)，通过学习、训练大量样本来更新自适应冗余字典，计算量和存储空间巨大。基于模板匹配近似KLT域上的语音信号压缩感知重构算法中(郭海燕，杨震，“基于近似KLT 域的语音信号压缩感知”，电子与信息学报，2009，31 (12) :2948-2952)，清音帧信号在近似 KLT冗余字典上不具有稀疏性。语音信号稀疏表示的关键问题之二是设计快速有效的稀疏分解算法。目前已有 Matching Pursuit (MP) (S. Mallat, Ζ. Zhang, "Matching pursuit with time-frequency dictionaries",IEEE Transactions on Signal Processing,1993,41(12) 3397-3415.),Basis Pursuit (BP)(S· Chen，D· L Donoho，"Atomic decomposition by basis pursuit，，，SIAM Journal on Scientific Computing，1999，20 (1) :33-61·) 禾口 Method of Frames(I. Daubechies，“Time-frequency localization operators :a geometric phase space approach，，，IEEE Transactions on Information Theory，1988， 34(4) =605-612.)等多种算法，但是这些算法都需要进行复杂度较高的优化迭代运算。

发明内容
本发明的目的在于克服上述已有技术的不足，提供一种稀疏性强、稀疏分解效率高的基于自适应冗余字典的语音信号稀疏表示方法。本发明的目的可通过如下解决方案来达到一种基于自适应冗余字典的语音信号稀疏表示算法，包括步骤1)针对数字语音信号短时自相关函数具有指数衰减的特性，构造基于K-L展开的自适应冗余字典；2)设计自适应冗余字典的语音信号稀疏表示算法；所述步骤1)中，假设连续实随机过程{x(t)，t e
}是二阶矩过程，则其K-L
展开式为
权利要求
1. 一种基于自适应冗余字典的语音信号稀疏表示算法，其特征是包括步骤1)针对数字语音信号短时自相关函数具有指数衰减的特性，构造基于K-L展开的自适应冗余字典；2)设计自适应冗余字典的语音信号稀疏表示算法；所述步骤1)中，假设连续实随机过程lx(t)，t e
}是二阶矩过程，则其K-L展开式为其中，系数= f0x(typn(t)dt ；正交K-L基{%(/)}是自相关函数Rx(t,u)的特征函数，和与之对应的特征值λ e R满足Fredholm积分方程(O = j0 Rx (t, υ)φη(υ) υ于是，X (t)的N项近似式为雄)=；η=\由上述K-L展开定义可知，K-L展开的关键是获得自相关函数的特征值和特征函数；针对平稳随机过程的自相关函数在时延较小时较快衰减的特性，考虑指数衰减型自相关函数 Rx(t,u) Zrx(O)eI^ul,其中参数μ反映了衰减速度和rx(0) = var(X(t))，并求解如下的 Fredholm积分方程λφ( ) = jlQRx(t^(u)du = rxJo' eMy(u)du + e"'^ ε-μ"φ(υ) υ)fl兀获得一组正交特征函数组= —coS(n^)+Sm(n^Xne Z-{0}；再加入=丨，构建完备的自适应正交K-L基函数组￡ = 他(0, eZ-{0}};。离散E中基函数，获得自适应冗余字典左= {e。}uK,weZ+}，其中en= [en(l)，…，en(i)， en(M)]T，(/■) = —cos( ) /) + sm( ) /) μ M-IM-I(i = 1，-,Μ)和 e0 = [1，"·，1]τ。所述步骤2)中，因为数字语音信号短时自相关函数具有指数衰减的特性，所以可以基于冗余字典#自适应选取K个原子对语音信号χ e Rm作非线性逼近^ = fKx=Yj α( Κ = Σ \x e"\e ，其中Card(IK) =K, α = [α (1)，···，α (N) ]τ为分解系数向量；。保留α中绝对值最大的K个α (η) (η e Ικ)，并令《( ) = O ( /J，可得到稀疏分解向量和重构语音信号^ =翻，则逼近绝对误差为& =\\x-FKx II2=II χ-Λ Il2。
全文摘要
一种基于自适应冗余字典的语音信号稀疏表示算法，包括步骤1)针对数字语音信号短时自相关函数具有指数衰减的特性，构造基于K-L展开的自适应冗余字典；2)设计自适应冗余字典的语音信号稀疏表示算法。
文档编号G10L19/00GK102332268SQ20111028366
公开日2012年1月25日申请日期2011年9月22日优先权日2011年9月22日
发明者王天荆申请人:王天荆

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王天荆
技术所有人：王天荆
我是此专利的发明人

上一篇：基于稀疏分解与重构的鲁棒语音特征提取方法
上一篇：基于置信度的关键词检出系统裁剪方法