用于基于语音相关结构的盲信道估计的方法和装置的制作方法

文档序号:2821015阅读:182来源:国知局
专利名称:用于基于语音相关结构的盲信道估计的方法和装置的制作方法
技术领域
本发明涉及一种用于语音信号处理的方法和装置,并特别涉及一种在语音系统中,例如在语音和说话者识别系统中去除信道畸变的方法和装置。
背景技术
倒谱均值归一化(CMN)是一种在自动语音识别系统中去除通信信道畸变的有效的技术。为了有效的工作,CMN系统中的语音处理窗口必须非常长,以保存语音信息。不幸的是,当处理非平稳信道时,最好使用更小的窗口,而更小的窗口却不能在CMN系统中一样有效的工作。而且,CMN技术是基于这样一个假定语音均值不携带语音信息,或者其在处理窗口期间是常数。然而,当使用短时窗口时,语音均值会携带重要的语音信息。
对影响语音信号的通信信道的估计问题属于所熟知的盲系统辨识范畴。当只获得一种语音信号时(即“单麦克风”的情况),估计问题没有一般的解决方法。可以使用超采样来获得估计信道所必需的信息,但是如果只获得一种语音信号并且没有可能进行超采样,那么如果不对信号源做出假设,就不可能解决估计问题的每个特例。例如,当识别器不能使用数字转换器时,如果不对信号源做出假设,则不可能为电话语音识别进行信道估计。

发明内容
因此,本发明的一个构造提供一种用于被通信信道损坏的语音信号的盲信道估计方法。该方法包括将含噪语音信号转换为倒谱表示或者对数谱表示;估计该含噪语音信号表示的时间相关;确定该含噪语音信号的平均值;根据最小化限制,利用干净语音训练信号的相关结构和含噪语音信号表示的相关以及该含噪语音信号的平均值来构建和解算线性等式系统;和选择该线性等式系统解算式的符号,以估计在处理窗口上的平均干净语音信号。
本发明的另一构造提供一种用于被通信信道损坏的语音信号的盲信道估计装置。该装置被构造使得将含噪语音信号转换为倒谱表示或者对数谱表示;估计该含噪语音信号的表示的时间相关;确定该含噪语音信号的平均值;根据最小化限制,利用干净语音训练信号的相关结构和含噪语音信号表示的相关以及该含噪语音信号的平均值来构建和解算线性等式系统;和选择该线性等式系统解算式的符号,以估计在处理窗口上的平均干净语音信号。
本发明还有一个构造提供一种其上记录有指令的机器可读介质或媒体,所配置的指令使得包括可编程处理器和数字信号处理器中至少一个的装置进行如下操作将含噪语音信号转换为倒谱表示或者对数谱表示;估计该含噪语音信号的表示的时间相关;确定该含噪语音信号的平均值;根据最小化限制,利用干净语音训练信号的相关结构和该含噪语音信号表示的相关以及该含噪语音信号的平均值来构建和解算线性等式系统;和选择该线性等式系统解算式的符号,以估计在处理窗口上的平均干净语音信号。
本发明的这些构造提供有效并且高效的语音通信信道的估计,而不会删除语音信息。
下文所提供的详细描述,可以明显看出本发明进一步的应用领域。应该理解的是,虽然示出了本发明的优选实施例,但是详细描述和具体范例只是用于说明性的目的,而不意欲限制本发明的范围。


通过下面的详细描述和附图可以对本发明更加全面的理解,其中图1是本发明盲信道估计器的一种构造的功能框图;图2是适合图1的构造使用的最大似然模块的双通实施方式的框图;图3是适合图1的构造使用的最大似然模块的双通GMM实施方式的框图;
图4是本发明的盲信道估计器的另一种构造的功能框图;图5是本发明盲信道估计方法的的一种构造的流程图。
具体实施例方式
下面优选实施例的描述实际上只是示范性的,并不意欲对本发明、其应用或使用进行限定。
这里所使用的“含噪语音信号”指的是被通信信道损坏和/或滤波的信号。还有这里所使用的“干净语音信号”指的是没有被通信信道滤波的语音信号,即通过具有平坦频率响应的系统传送的语音信号,或者用来训练用于语音识别系统的声学模型的语音信号。“平均干净含噪语音信号”指的是从语音信号中去除了通信信道的损坏和/或滤波的估计的含噪语音信号的估计。
参照图1,在本发明的盲信道估计器10的一种构造中,利用存储的语音相关结构 14对语音通信信道12进行估计和补偿。如图1所示,盲信道估计器10表示语音识别系统的一部分,其中信道12的输出是含噪语音信号g(t)=s(t)*h(t),其中s(t)表示利用麦克风或音频处理器16的输出、或通过具有平坦频率响应的滤波器得到的“干净”语音信号,h(t)表示信道12的滤波器。g(t)所表示的信号通过倒谱分析模块18(或通过对数谱分析模块,未示出)转换为倒谱(或对数谱)域中的信号Y(t)=S(t)+H(t)。
设S(t)为表示倒谱(或对数谱)域中的“干净”语音信号。假设干净语音信号的帧间时间相关是τ的递减函数E[S(t)ST(t+τ)]=fτ(E[S(t)S(t)ST(t)]), (1)fτ通过时不变线性滤波器近似为fτ(E[S(t)S(t)ST(t)])=A(τ)E[S(t)ST(t)]。(2)通过执行倒谱分析(即获得倒谱域中的S(t)),然后执行如下的相关,可以从干净语音训练信号中得到矩阵A(τ)的估计
E[S(t)ST(t+τ)]≈1N∫0NS(t+ω)ST(t+τ+ω)dω,---(3)]]>将E[S(t)ST(t+τ)]与E[S(t)ST(t)](即τ延迟与零延迟的相关)的比值进行平均A(t,τ)=E[S(t)ST(t+τ)]E[S(t)ST(t)],---(4)]]>并在训练集上进行积分A^(τ)=E[A(τ)]≈1N∫0TA(t,τ)dt,---(5)]]>其中等式3中的积分在处理窗口的N个采样值上进行,并且等式5中的积分在整个训练集上进行。等式3至5所描述的计算步骤是对在基本上没有噪声的环境中得到的干净语音训练信号进行的,从而可以得到基本上等于s(t)的信号。在使用含噪信道12对盲信道估计器10开始操作之前,将从该信号中得到的估计 存储在相关结构模块14中。
对于信道估计而言,因为等式1中的假设校验完好,即相对误差较小,最好使用短时延,但是时延不要太小使得该语音信号相关不能控制该通信信道相关。
在倒谱域(或对应的对数谱域)中观测倒谱分析模块18(或对应的对数谱分析模块)所产生的含噪语音信号Y(t)。含噪语音信号Y(t)记作Y(t)=S(t)+H(t), (6)其中S(t)是原始的干净语音信号s(t)的倒谱域表示,而H(t)是通信信道12的时变响应h(t)的倒谱域表示。然后所观测的信号Y(t)的相关通过相关估计器20确定。我们用信号Y(t)与具有时延τ的信号Y(t+τ)(或等价的Y(t-τ))表示为CY(τ),其中CY(τ)=E[Y(t)YT(t+τ)]。
线性系统解算器模块22从相关估计器20产生的相关CY和存储在相关结构模块14中的相关结构 得出式子AA=(I-A^(τ))-1(CY(τ)-A^(τ)CY(0)).---(7)]]>同时,平均器模块24根据倒谱分析模块18的输出Y(t)确定值b
b=E[Y(t)], (8)以及线性等式解算器22解算下面用于得到μs的等式系统μsμsT=bbT-A=B,]]>和 (9)μs+H=b。
(10)等式9和10的系统是超定的,意味着单个等式的数目超过了未知量的数目。因此,在盲信道估计器10中,这种等式系统作为最小化问题解算,比如作为最小均方误差问题解算。等式10用于解算μs=S^,]]>其中μs是没有信道损坏或在处理窗口上过滤的平均语音信号的平均值的估计,并利用线性系统解算器22最小化如下等式minμs||μsμsT-B||2.---(11)]]>(一种构造中的估计 并不用于语音识别,是因为用于信道估计的处理窗口,比如为40-200ms,比用于语音识别的窗口,比如为10-20ms要更长。然而,在这种构造中, 用来估计 其中H^=1TΣY(t)-μ^s,]]>其中求和运算在该处理窗口(例如200ms)上进行,然后S(t)用于在较短的处理窗口中识别,其中S^(t)=Y(t)-H^.)]]>在这种构造中,S(t)表示在较短的处理窗口上的干净语音,并且在此处称之为“短窗干净语音”。
在本发明的一种构造中,线性系统解算器22通过设置下式来执行有效的最小化μs=±λ1p1, (12)其中λ1是B的最大的特征值,p1是对应的特征向量。在该构造中,通过查找对应于最大特征值(绝对值形式)的特征向量来得到等式12的解。这是用于解决非对称实矩阵的对角化问题的子情况。虽然已知多种方法用于解决这种类型的问题,但这些方法的精度是由最大与最小特征值之间的比值决定的,也就是说,数值法更适合于较大特征值差的情况。通过实验,发现在本发明的构造中,最大和第二大的特征值的差别大约有一到两个数量级。因此具有足够的稳定性,并且可以比较有把握地假定存在一个特征向量,该特征向量比其它任何特征向量能更好地最小化该代价函数。该特征向量提供一个在处理窗口上的平均干净语音μs的估计。
因为所得到的语音估计都是模量,可以使用试探方式来得到正确的符号。在盲信道估计器10中,最大似然估计器26使用声学模型来确定等式12的解的符号。例如,在两个解码通道中,或者使用语音和静音高斯混合模型(GMM)来执行最大似然估计。
参照图2,在双通最大似然估计器模块26的一种构造中,将Y(t)输入两个估计器模块52、54。估计器模块52也接收 作为输入,并且估计器54模块也接收 作为输入。估计器模块52的结果是 而估计器模块54的结果是 这些结果分别输入执行语音识别的全解码器56和58。全解码器56和58的输出被输入到最大似然选择器模块60,其使用兼有解码器56和58的语音识别输出的似然信息来选择从全解码器56和58输出的字作为结果。在图2没有示出的一种构造中,最大似然选择器模块60的输出 为 或 的输出补充或者替代解码器模块56和58的解码语音输出,但 的输出仍然取决于由模块56和58所提供的似然信息。
在图3中提供了一种双通GMM最大似然解码模块26A的构造,其可以替代图2的双通最大似然估计器模块26。在这种构造中,估计 和 分别输入到语音和静音GMM解码器72和74,最大似然选择器模块76从GMM解码器72和74的输出中选择,以确定该构造的输出 在如图3所示的构造中,最大似然选择器模块76的输出输入到全语音识别解码模块78,以产生解码语音的最终输出。
参照图4,在本发明的盲信道估计器30的另一种构造中,在线性系统解算器模块22中使用相同的最小化,但是使用最小信道范数模块32来确定该解的符号。在盲信道估计器30中,选择使信道倒谱的范数‖H(t)‖2=‖Y-μs‖2最小化的μs=S^(t)]]>的符号作为解±μs的正确符号。该符号的解是基于这样一种假设平均起来,信道倒谱的范数比语音倒谱的范数小,因此选择使得‖H(t)‖2=‖Y-μs‖2最小化的±μs的符号作为语音信号 的符号。
倒谱域(或对数谱域)中的估计语音信号 适合在语音处理应用,比如语音或说话者识别中用于进一步分析。所估计的语音信号可以直接在倒谱域(或对数谱域)中使用,或者转换成该应用所要求的另一种(例如时域或频域)表示。
参照图5,在本发明的盲信道估计方法100的一种构造中,提供了一种基于语音相关结构的盲信道估计的方法。步骤102中,从干净语音训练信号s(t)中获得相关结构 基于在基本上没有噪声的环境中得到的干净语音训练信号,用处理器执行等式3至5所描述的计算步骤,使得干净语音信号基本上等于s(t)。
然后在步骤104,得到要处理的含噪语音信号g(t)并将其转换成倒谱域(或对数谱域)表示的Y(t)。然后在步骤106,使用Y(t)估计相关CY(τ),并且在步骤108用Y(t)确定观测信号Y(t)的平均值b。在步骤110,根据等式11的最小化限制构建和解算线性等式9和10的系统。在步骤112利用最大似然方法或范数最小化方法来选择或确定该解的符号,因此,在处理窗口上产生平均干净语音信号的估计。
当语音源和通信信道更加接近的满足下面四个条件时,使用本发明的构造可以得到更好的结果1、S(t)和H(t)是两个独立的随机过程。
2、E[S(t+τ)]=E[S(t)],即S(t)是短时平稳过程。
3、在处理窗口内信道H(t)是常数,从而H(t)=H,即为短时恒定应用。
4、语音源的相关结构满足时不变线性滤波器模型,即E[S(t)ST(t+τ)]=A(τ)E[S(t)ST(t)]。
可以认为这些条件足以满足小的时延(短时结构)。然而当使用下面的普通的期望值估计器,第二个条件并不严格的满足E[S(t)ST(t+τ)]=1N-τΣi=1N-τS(i)ST(i+τ).---(13)]]>因此,本发明的一种构造使用环形处理窗口E[S(t)ST(t+τ)]=1N-τΣi=1N-τS(i)ST(i+τ)+1τΣi=1τS(N-i)ST(i).---(14)]]>而且,在本方面的一种构造中,为了更接近的满足相关结构条件,利用语音存在检测器来确保在确定相关中忽略静音帧,而只考虑语音帧。另外,利用短处理窗口更加接近的满足短时恒定条件。因此,本发明的一种构造提供了语音检测器模块19来区分语音信号的有无,并且相关估计器模块20和平均器模块24利用该信息来确保只考虑语音帧。
在本发明的一种构造中,在倒谱域中应用上述方法。在另一种构造中,在对数谱域中应用该方法。在一种构造中,为了确保用来解算均方差问题所利用的对角化方法的精确性,使倒谱域或对数谱域中的系数的动态范围是相等的。(通常有多个系数,因为倒谱或对数谱特征是矢量。)例如在一种构造中,通过提取长时平均来归一化倒谱系数,并白噪声化协方差矩阵。在另一种构造中,使用对数谱系数而不是倒谱系数。
在本发明的一种构造中,倒谱系数用于信道去除。在另一种构造中,执行对数谱信道去除。在某些应用中可以进行对数谱信道去除,因为它在频率上是局部的。
在本发明的一种构造中,利用四帧(40ms)的时延来确定输入信号的相关。已经发现这种构造是低语音相关与低固有假设误差之间的一种有效折衷方案。更具体地,如果处理窗口过长,H(t)可以不是常数,相反如果处理窗口过短,则不大可能得到好的相关估计。
利用一个或多个特殊用途的信号处理组件(即特别设计用于执行上述处理的组件)、适当的程序控制下的普通用途的数字信号处理器、适当的程序控制下的普通用途的处理器或CPU、或它们的组合,以及在某些构造中附加的支持硬件(例如存储器),就可以物理上实现本发明的各种构造。对于实时语音识别(例如车辆的语音控制或即说即打计算机系统),可以用麦克风或相似的传感器和音频模数转换器(ADC)输入用户的语音。用于控制普通用途的可编程处理器或CPU、和/或普通用途的数字信号处理器的指令可以以ROM固件的形式、以适当存储媒体或介质上的机器可读指令的形式,该介质不必是可删除的或可改变的(例如软盘、CD-ROM、DVD、闪存或硬盘),或以从其他计算机接收到的信号(例如调制的电子载波信号)的形式提供。后一种情况的范例可以是通过网络从远程计算机接收到的指令,该远程计算机自己可以存储机器可读形式的指令。
这里,进一步描述这种构造的数学分析。
在倒谱域(或对数谱域)中观测的被通信信道损坏的语音信号如上面的等式6所描述的。在时间t具有时延τ的信号X的相关为CX(τ)=E[X(t)XT(t+τ)]。
(15)假定按照上文定义的无相关性、短时平稳、短时恒定条件,观测信号的相关可以记作CY(τ)=CS(τ)+μsHT+HμST+HHT,---(16)]]>其中μs=E[S(t)]。通过假定上文中的短时线性相关结构条件,可以得出上面的等式7和8。
通过考虑下面N2范数中的最小化问题,可以得出有效的最小化minX||XXT-B||2,---(17)]]>其中X=[x1x2…xn]和B=(bi,j)i,j∈1,…,n。假设B可对角化,则我们可以记作B=PΛP*,其中Λ=diag{λ1…λn}是对角矩阵,P={p1,…,pn}是单位矩阵。假定特征值λ1…λn按照递增顺序λ1≥…≥λn排序。可以写作minX||XXY-B||2~minY||YYT-Λ||2,---(18)]]>
其中,Y=PTX。也可以记作||YYT-Λ||2=Σin(yi2-λi)2+ΣiΣj≠i(yiyj)2.---(19)]]>通过进行偏微分,我们得到∂||YYT-Λ||2∂yk=4yk(Σiyi2-λk).---(20)]]>通过将微分设定为零,我们得到4yk(Σiyi2-λk)=0,∀k=1...n.---(21)]]>由于已经假定λ1≥…≥λn,根据前面的等式,它满足系数y1…yn中至多一个系数不为零。通过矛盾法,假定∃i1≠i2:yi1≠0,yi2≠0,]]>然后我们得到Σiyi2=λi1,---(22)]]>Σiyi2=λi2,---(23)]]>并且λi1≠λi2,这是不可能的。而且,给定Y是非零向量,我们得到yi0=±λi0yi=0∀i≠ii0---(24)]]>因此,我们得到||YYT-Λ||2=Σi≠i0λi2,]]>并且使得‖YYT-Λ‖最小的解是i0=1。这也就意味着最小化问题有两个解X=±λ1p1,其中λ1是B的最大特征值,并且p1是对应的特征向量。
本发明的构造提供了损坏语音信号的通信信道的有效估计。已经发现使用此处所描述的方法和装置的试验比标准倒谱均值归一化技术更加有效,因为底层假定更容易验证。这些试验也表明,使用最小范数符号估计进行信道补偿,静态倒谱特征相对于CMN具有显著的改进。对于最大似然符号估计,建议在联合估计声学模型的时候,将信道符号作为隐藏变量考虑,并且在进行期望值最大(EM)算法时对其进行优化。
总之,对于完全使用倒谱域的本发明的构造,也存在对应的完全使用倒谱域的本发明的构造。一旦做出设计选择其中一个或另一个域,在整个构造中应该一致的使用这个域,以避免另外需要从一个域转换到另一个域。
本发明的描述实际上只是示范性的,因此,不脱离本发明要点的变化都被认为是处于本发明的范围之中。这种改变并不被认为是脱离本发明的精神和范围。
权利要求
1.一种用于被通信信道损坏的语音信号的盲信道估计方法,所述方法包括将含噪语音信号转换为倒谱表示或对数谱表示的含噪语音信号表示;估计该含噪语音信号表示的相关;确定该含噪语音信号的平均值;根据最小化限制,利用干净语音训练信号的相关结构和含噪语音信号表示的相关以及含噪语音信号的平均值来构建和解算线性等式系统;和选择该线性等式系统的解的符号,以估计在处理窗口上的平均干净语音信号。
2.根据权利要求1所述的方法,进一步包括使用该平均干净语音估计来确定在该处理窗口上的平均信道估计;和使用该平均信道估计来确定在更短的处理窗口上的干净语音信号。
3.根据权利要求1所述的方法,其中所述选择线性等式系统的解的符号包括利用最大似然准则选择符号。
4.根据权利要求1所述的方法,其中所述选择线性等式系统的解的符号包括选择使得所估计的信道噪声的范数最小的符号。
5.根据权利要求1所述的方法,其中所述将含噪语音信号转换为倒谱表示或对数谱表示的含噪语音信号表示包括将该含噪语音信号转换为倒谱表示。
6.根据权利要求1所述的方法,其中所述将含噪语音信号转换为倒谱表示或对数谱表示的含噪语音信号表示包括将该含噪语音信号转换为对数谱表示。
7.根据权利要求1所述的方法,进一步包括在基本上没有噪声的环境中得到干净语音训练信号,和利用所述干净语音训练信号确定所述相关结构。
8.根据权利要求1所述的方法,其中所述相关结构记作 所述该含噪语音信号表示记作Y(t)=S(t)+H(t),其中Y(t)是该含噪语音信号表示,S(t)是该含噪语音信号的干净语音表示,并且H(t)是通信信道的时变响应表示;所述估计含噪语音信号表示的相关包括确定CY(τ),其中CY(τ)=E[YtYT(t+τ)];所述确定含噪语音信号的平均值包括确定b=E[Y(t)];所述构建和解算线性等式系统包括解算记作如下的线性等式系统μsμsT=bbT-A=B,]]>和μs+H=b中的平均干净语音信号的表示μs,其中A=(I-A^(τ))-1(CY(τ)-A^(τ)CY(0)),]]>和b=E[Y(t)]。
9.根据权利要求8所述的方法,其中所述构建和解算线性等式系统包括根据如下的最小化限制来解算所述线性等式系统minμs||μsμsT-B||2.]]>
10.根据权利要求8所述的方法,其中所述构建和解算线性等式系统包括确定μs为±λ1p1,其中λ1是B的最大特征值,并且p1是对应的特征向量。
11.根据权利要求10所述的方法,进一步包括利用最大似然准则选择μs的符号。
12.根据权利要求11所述的方法,进一步包括选择使信道倒谱的范数‖H(t)‖2=‖Y-μs‖2最小的μs的符号。
13.根据权利要求8所述的方法,进一步包括估计记作s(t)的干净语音训练信号的 为A^(τ)=E[A(τ)]≈1N∫0TA(t,τ)dt,]]>其中A(t,τ)=E[S(t)ST(t+τ)]E[S(t)ST(t)],]]>E[S(t)ST(t+τ)]≈1N∫0NS(t+ω)ST(t+τ+ω)dω,]]>并且S(t)是s(t)的倒谱或对数谱表示。
14.一种用于被通信信道损坏的语音信号的盲信道估计装置,所述装置被构造成将含噪语音信号转换为倒谱表示或对数谱表示的含噪语音信号表示;估计该含噪语音信号表示的相关;确定该含噪语音信号的平均值;根据最小化限制,利用干净语音训练信号的相关结构和含噪语音信号表示的相关以及含噪语音信号的平均值来构建和解算线性等式系统;和选择该线性等式系统的解的符号,以估计在处理窗口上的平均干净语音信号。
15.根据权利要求14所述的装置,进一步被构造成使用该平均干净语音估计来确定在该处理窗口上的平均信道估计;和使用该平均信道估计来确定在更短的处理窗口上的干净语音信号。
16.根据权利要求14所述的装置,其中为选择线性等式系统的解的符号,所述装置被构造成利用最大似然准则选择符号。
17.根据权利要求14所述的装置,其中为选择线性等式系统的解的符号,所述装置被构造成选择使得所估计的信道噪声的范数最小的符号。
18.根据权利要求14所述的装置,其中为将含噪语音信号转换为倒谱表示或对数谱表示的含噪语音信号表示,所述装置被构造成将该含噪语音信号转换为倒谱表示。
19.根据权利要求14所述的装置,其中为了将含噪语音信号转换为倒谱表示或对数谱表示的含噪语音信号的表示,所述装置被构造成将该含噪语音信号转换为对数谱表示。
20.根据权利要求14所述的装置,进一步被构造成在基本上没有噪声的环境中得到干净语音训练信号,和利用所述干净语音训练信号确定所述相关结构。
21.根据权利要求14所述的装置,其中所述相关结构记作 所述该含噪语音信号的表示记作Y(t)=S(t)+H(t),其中Y(t)是该含噪语音信号的表示,S(t)是该含噪语音信号的干净语音表示,并且H(t)是通信信道的时变响应表示;为估计该含噪语音信号表示的相关,所述装置被构造成确定CY(τ),其中CY(τ)=E[YtYT(t+τ)];为确定该含噪语音信号的平均值,所述装置被构造成确定b=E[Y(t)];为构建和解算线性等式,所述装置被构造成解算记作如下的线性等式系统μsμsT=bbT-A=B,]]>和μs+H=b中的平均干净语音信号的表示μs,其中A=(I-A^(τ))-1(CY(τ)-A^(τ)CY(0)),]]>和b=E[Y(t)]。
22.根据权利要求21所述的装置,其中为构建和解算线性等式系统,所述装置被构造成根据如下的最小化限制来解算所述线性等式系统minμs||μsμsT-B||2.]]>
23.根据权利要求21所述的装置,其中为构建和解算线性等式系统,所述装置被构造成确定μs为±λ1p1,其中λ1是B的最大特征值,并且p1是对应的特征向量。
24.根据权利要求23所述的装置,进一步被构造成利用最大似然准则选择μs的符号。
25.根据权利要求24所述的装置,进一步被构造成选择使信道倒谱的范数‖H(t)‖2=‖Y-μs‖2最小的μs的符号。
26.根据权利要求21所述的装置,进一步被构造成估计记作s(t)干净语音训练信号的 为A^(τ)=E[A(τ)]≈1N∫0TA(t,τ)dt,]]>其中A(t,τ)=E[S(t)ST(t+τ)]E[S(t)ST(t)],]]>E[S(t)ST(t+τ)]≈1N∫0NS(t+ω)ST(t+τ+ω)dω,]]>并且S(t)是s(t)的倒谱或对数谱表示。
27.一种其上记录有指令的机器可读介质或媒体,所配置的指令使得包括由可编程处理器和数字信号处理器组成的组中至少一个部件的装置进行如下操作将含噪语音信号转换为倒谱表示或对数谱表示的含噪语音信号的表示;估计该含噪语音信号表示的相关;确定该含噪语音信号的平均值;根据最小化限制,利用干净语音训练信号的相关结构和含噪语音信号表示的相关以及含噪语音信号的平均值来构建和解算线性等式系统;和选择该线性等式系统的解的符号,以估计在处理窗口上的平均干净语音信号。
28.根据权利要求27所述的介质或媒体,其中所述指令包括进行如下操作的指令使用该平均干净语音估计来确定在该处理窗口上的平均信道估计;和使用该平均信道估计来确定在更短的处理窗口上的干净语音信号。
29.根据权利要求27所述的介质或媒体,其中为选择线性等式系统的解的符号,所述记录的指令包括利用最大似然准则选择符号的指令。
30.根据权利要求27所述的介质或媒体,其中为选择线性等式系统的解的符号,所述记录的指令包括选择使得所估计的信道噪声的范数最小的符号的指令。
31.根据权利要求27所述的介质或媒体,其中为将含噪语音信号转换为倒谱表示或对数谱表示的含噪语音信号的表示,所述记录的指令包括将该含噪语音信号转换为倒谱表示的指令。
32.根据权利要求27所述的介质或媒体,其中为了将含噪语音信号转换为倒谱表示或对数谱表示的含噪语音信号的表示,所述记录的指令包括将该含噪语音信号转换为对数谱表示的指令。
33.根据权利要求27所述的介质或媒体,所述记录的指令进一步包括在基本上没有噪声的环境中得到干净语音训练信号,和利用所述干净语音训练信号确定所述相关结构的指令。
34.根据权利要求27所述的介质或媒体,其中所述相关结构记作 所述该含噪语音信号的表示记作Y(t)=S(t)+H(t),其中Y(t)是该含噪语音信号的表示,S(t)是该含噪语音信号的干净语音表示,并且H(t)是通信信道的时变响应表示;为估计该含噪语音信号表示的相关,所述记录的指令包括确定CY(τ),其中CY(τ)=E[YtYT(t+τ)]的指令;为确定该含噪语音信号的平均值,所述记录的指令包括确定b=E[Y(t)]的指令;和为构建和解算线性等式,所述记录的指令包括解算记作如下的线性等式的指令μsμsT=bbT-A=B,]]>和μs+H=b中的平均干净语音信号的表示μs,其中A=(I-A^(τ))-1(CY(τ)-A^(τ)CY(0)),]]>和b=E[Y(t)]。
35.根据权利要求34所述的介质或媒体,其中为构建和解算线性等式系统,所述记录的指令包括根据如下的最小化限制来解算所述线性等式系统的指令minμs||μsμsT-B||2.]]>
36.根据权利要求34所述的介质或媒体,其中为构建和解算线性等式系统,所述记录的指令包括确定μs为±λ1p1的指令,其中λ1是B的最大特征值,并且p1是对应的特征向量。
37.根据权利要求36所述的介质或媒体,所述记录的指令进一步包括利用最大似然准则选择μs的符号的指令。
38.根据权利要求37所述的介质或媒体,其中所述记录的指令进一步包括选择使信道倒谱的范数‖H(t)‖2=‖Y-μs‖2最小的μs的符号的指令。
39.根据权利要求34所述的装置,所述记录的指令进一步包括估计记作s(t)干净语音训练信号的 为下式的指令A^(τ)=E[A(τ)]≈1N∫0TA(t,τ)dt,]]>其中A(t,τ)=E[S(t)ST(t+τ)]E[S(t)ST(t)],]]>E[S(t)ST(t+τ)]≈1N∫0NS(t+ω)ST(t+τ+ω)dω,]]>并且S(t)是s(t)的倒谱或对数谱表示。
全文摘要
提供用于被通信信道损坏的语音信号的盲信道估计方法和装置。一种方法包括将含噪语音信号转换为倒谱表示(18)或者对数谱表示;估计该含噪语音信号表示的相关(20);确定该含噪语音信号的平均值(24);根据最小化限制,利用干净语音训练信号的相关结构(140)和含噪语音信号表示的相关(24)以及含噪语音信号的平均值来构建和解算线性等式系统;和选择线性等式系统(22)的解的符号,以估计在处理窗口上的平均干净语音信号。
文档编号G10L15/02GK1698096SQ03805911
公开日2005年11月16日 申请日期2003年3月14日 优先权日2002年3月15日
发明者尤奈斯·苏尔密, 帕特里克·恩伽元, 卢克·雷茄杰洛, 让-克劳德·容科 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1