感知滤波方法和感知滤波器的制造方法

文档序号：10513519阅读：311来源：国知局

感知滤波方法和感知滤波器的制造方法
【专利摘要】本发明提供了一种感知滤波方法，包括：获取带噪语音，将带噪语音根据噪声估计算法计算得到噪声功率；将带噪语音根据掩蔽模型计算得到频域掩蔽阈值；将带噪语音转换到频域，得到频域带噪语音，包括频域纯净语音和频域背景噪声；基于语音估计误差算法，将语音信号失真表示为关于频域纯净语音、感知滤波器增益的关系式，将滤波背景噪声表示为关于频域背景噪声、感知滤波器增益的关系式；基于语音信号失真功率、滤波背景噪声功率之和小于或等于频域掩蔽阈值的关系构造关于感知滤波器增益的方程；求解方程得到感知滤波器增益；根据感知滤波器增益，对带噪语音进行滤波处理得到增强的语音，提高了增强语音的主观感知质量。还提供了一种感知滤波器。
【专利说明】
感知滤波方法和感知滤波器
技术领域
[0001] 本发明涉及语音信号处理领域，特别是涉及一种感知滤波方法和感知滤波器。
【背景技术】
[0002] 现实生活中语音信号不可避免的会受到背景噪声的污染，语音增强作为一种信号处理方法是解决噪声污染的一种高效途径，因而其一直是语音信号处理领域的一个研究热点。语音增强的目的就是在保证语音可懂度的前提下，尽可能的去除背景噪声，提高语音的主观听觉效果。
[0003] 传统语音增强算法包括谱减法、维纳滤波法、最小均方误差估计法、对数谱幅度最小均方误差、基于DCT (Discrete Cosine Transform，离散余弦）变换的增强方法等。这些方法大都基于频域中语音和噪声分量的统计模型，并结合各种估计理论来设计具有针对性的噪声消除技术。但传统语音增强算法由于假设模型与实际情况存在偏差导致增强后的语音信号中仍然有大量语音失真和残留噪声，影响了语音增强的效果。

【发明内容】

[0004] 基于此，有必要针对上述问题，提供一种感知滤波方法和感知滤波器，将噪声电平降到人耳听觉掩蔽阈值以下，从而提高增强语音的主观感知质量。
[0005] -种感知滤波方法，所述方法包括：
[0006] 获取带噪语音，将所述带噪语音根据噪声估计算法计算得到噪声功率；
[0007] 将所述带噪语音根据掩蔽模型计算得到频域掩蔽阈值；
[0008] 将所述带噪语音转换到频域，得到频域带噪语音，所述频域带噪语音包括频域纯净语音和频域背景噪声；
[0009] 基于语音估计误差算法，将语音信号失真表示为关于所述频域纯净语音、感知滤波器增益的关系式，将滤波背景噪声表示为关于所述频域背景噪声、感知滤波器增益的关系式；
[0010] 根据所述语音信号失真和滤波背景噪声，基于语音信号失真功率、滤波背景噪声功率之和小于或等于频域掩蔽阈值的关系构造关于感知滤波器增益的方程；
[0011] 求解所述方程得到所述感知滤波器增益；
[0012] 根据所述感知滤波器增益，对所述带噪语音进行滤波处理得到增强的语音。
[0013] 在其中一个实施例中，所述根据所述语音信号失真和滤波背景噪声，基于语音信号失真功率、滤波背景噪声功率之和小于或等于频域掩蔽阈值的关系构造关于感知滤波器增益的方程的步骤为：
[0014] 根据所述语音信号失真得到所述语音信号失真功率；
[0015] 根据所述滤波背景噪声得到所述滤波背景噪声功率；
[0016] 基于语音信号失真功率、滤波背景噪声功率之和等于频域掩蔽阈值的关系，得到所述方程（G(k)_l) 2Ps(k) + (G(k))2Pz(k) =T(k)，其中G(k)为感知滤波器增益，k为频谱序号，ps(k)为频域纯净语音功率，Pz(k)为频域背景噪声功率，T(k)为频域掩蔽阈值。
[0017] 在其中一个实施例中，所述求解所述方程得到所述感知滤波器增益的步骤包括：
[0018] 根据所述噪声功率采用近似算法计算得到所述频域背景噪声功率；
[0019] 根据所述频域背景噪声功率计算得到后验信噪比；
[0020] 根据所述后验信噪比基于直接判决算法计算得到先验信噪比；
[0021] 根据所述频域背景噪声功率、先验信噪比、频域掩蔽阈值求解所述方程得到所述感知滤波器增益。
[0022] 在其中一个实施例中，在所述将所述带噪语音转换到频域，得到频域带噪语音，所述频域带噪语音包括频域纯净语音和频域背景噪声的步骤之前，还包括：
[0023] 将所述带噪语音采用基于短时幅度谱估计法进行增强，得到增强后的带噪语音，所述将所述带噪语音转换到频域为将所述增强后的带噪语音转换到频域，所述对带噪语音进行滤波处理得到增强的语音为对增强后的带噪语音进行滤波处理得到增强的语音，所述根据所述噪声功率采用近似算法计算得到所述频域背景噪声功率的步骤为：
[0024] 获取所述基于短时幅度谱估计法的频域增益函数GH (k)，其中k为频谱序号；
[0025] 根据Pz(k) = Ad(k)-(l_GH(k)) |Y(k) Γ得到所述频域背景噪声功率Pz(k)，其中 Ad(k)为噪声功率，Y(k)为频域带噪语音。
[0026] 在其中一个实施例中，所述根据所述后验信噪比基于直接判决算法计算得到先验信噪比的步骤为：
[0027] 获取当前帧和前一帧后验信噪比，分别为(k, 1)，γ ^ (k, 1-1)，其中k为频谱序号，1为帧序号，当前帧为1帧；
[0028] 获取前一帧感知滤波器增益G(k，1-1)，如果所述前一帧为第一帧，则所述前一帧感知滤波器增益为预设值；
[0029] 根据所述后验信噪比和感知滤波器增益通过公式得到当前帧先验信噪比 = 丨）+ (1-/7)raax丨/(々,/)-丨,〇}，其中 η 为平滑因子，并且 0< η < 1〇
[0030] 一种感知滤波器，所述感知滤波器包括：
[0031] 获取模块，用于获取带噪语音；
[0032] 噪声功率计算模块，用于将所述带噪语音根据噪声估计算法计算得到噪声功率；
[0033] 掩蔽阈值计算模块，用于将所述带噪语音根据掩蔽模型计算得到频域掩蔽阈值；
[0034] 频域转换模块，用于将所述带噪语音转换到频域，得到频域带噪语音，所述频域带噪语音包括频域纯净语音和频域背景噪声；
[0035] 方程构造模块，用于基于语音估计误差算法，将语音信号失真表示为关于所述频域纯净语音、感知滤波器增益的关系式，将滤波背景噪声表示为关于所述频域背景噪声、感知滤波器增益的关系式，根据所述语音信号失真和滤波背景噪声，基于语音信号失真功率、滤波背景噪声功率之和小于或等于频域掩蔽阈值的关系构造关于感知滤波器增益的方程；
[0036] 增益求解模块，用于求解所述方程得到所述感知滤波器增益；
[0037] 滤波处理模块，用于根据所述感知滤波器增益，对所述带噪语音进行滤波处理得到增强的语音。
[0038] 在其中一个实施例中，所述方程构造模块根据所述语音信号失真和滤波背景噪声，基于语音信号失真功率、滤波背景噪声功率之和小于或等于频域掩蔽阈值的关系构造关于感知滤波器增益的方程具体为：
[0039] 根据所述语音信号失真得到所述语音信号失真功率；
[0040] 根据所述滤波背景噪声得到所述滤波背景噪声功率；
[0041] 基于语音信号失真功率、滤波背景噪声功率之和等于频域掩蔽阈值的关系，得到所述方程（G(k)_l) 2Ps(k) + (G(k))2Pz(k) =T(k)，其中G(k)为感知滤波器增益，k为频谱序号，Ps(k)为频域纯净语音功率，Pz(k)为频域背景噪声功率，T(k)为频域掩蔽阈值。
[0042] 在其中一个实施例中，所述增益求解模块包括：
[0043] 求解准备单元，用于根据所述噪声功率采用近似算法计算得到所述频域背景噪声功率，根据所述频域背景噪声功率计算得到后验信噪比，根据所述后验信噪比基于直接判决算法计算得到先验?目噪比；
[0044] 求解单元，用于根据所述频域背景噪声功率、先验信噪比、频域掩蔽阈值求解所述方程得到所述感知滤波器增益。
[0045] 在其中一个实施例中，所述感知滤波器还包括：
[0046] 增强模块，用于将所述带噪语音采用基于短时幅度谱估计法进行增强，得到增强后的带噪语首；
[0047] 所述频域转换模块将所述带噪语音转换到频域为将所述增强后的带噪语音转换到频域；
[0048] 所述滤波处理模块对带噪语音进行滤波处理得到增强的语音为对增强后的带噪语音进行滤波处理得到增强的语音；
[0049] 所述求解准备单元根据所述噪声功率采用近似算法计算得到所述频域背景噪声功率具体为：
[0050] 获取所述基于短时幅度谱估计法的频域增益函数GH (k)，其中k为频谱序号；
[0051] 根据Pz(k) = Ad(k)-(l_GH(k)) |Y(k) Γ得到所述频域背景噪声功率Pz(k)，其中 Ad(k)为噪声功率，Y(k)为频域带噪语音。
[0052] 在其中一个实施例中，所述求解准备单元根据所述后验信噪比基于直接判决算法计算得到先验信噪比具体为：
[0053] 获取当前帧和前一帧后验信噪比，分别为(k, 1)，γ ^ (k, 1-1)，其中k为频谱序号，1为帧序号，当前帧为1帧；
[0054] 获取前一帧感知滤波器增益G(k，1-1)，如果所述前一帧为第一帧，则所述前一帧感知滤波器增益为预设值；
[0055] 根据所述后验信噪比和感知滤波器增益通过公式得到当前帧先验信噪比 = 丨）+(卜扑漏<·[/(/0，)-丨,()丨，其中η为平滑因子，并且0 < η < 10
[0056] 上述感知滤波方法和感知滤波器，通过获取带噪语音，将带噪语音根据噪声估计算法计算得到噪声功率，将带噪语音根据掩蔽模型计算得到频域掩蔽阈值，将带噪语音转换到频域，得到频域带噪语音，频域带噪语音包括频域纯净语音和频域背景噪声；基于语音估计误差算法，将语音信号失真表示为关于所述频域纯净语音、感知滤波器增益的关系式，将滤波背景噪声表示为关于所述频域背景噪声、感知滤波器增益的关系式；根据语音信号失真和滤波背景噪声，基于语音信号失真功率、滤波背景噪声功率之和小于或等于频域掩蔽阈值的关系构造关于感知滤波器增益的方程；求解方程得到感知滤波器增益；根据感知滤波器增益，对带噪语音进行滤波处理得到增强的语音。由于语音信号失真功率、滤波背景噪声功率之和小于或等于频域掩蔽阈值，在保证语音信号失真功率较小的同时，保证噪声电平小于人耳听觉掩蔽阈值不被人耳听到，从而提高了增强语音的主观感知质量。
【附图说明】
[0057] 图1为一个实施例中感知滤波方法的流程图；
[0058] 图2为一个实施例中构造关于感知滤波器增益的方程的流程图；
[0059] 图3为一个实施例中求解方程得到感知滤波器增益的流程图；
[0060] 图4为一个实施例中语音增强系统的结构框图；
[0061] 图5为一个实施例中感知滤波器的结构框图；
[0062] 图6为一个实施例中增益求解模块的结构框图；
[0063] 图7为另一个实施例中感知滤波器的结构框图。
【具体实施方式】
[0064] 为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。
[0065] 如图1所示，提供了一种感知滤波方法，包括以下步骤：
[0066] 步骤S110,获取带噪语音，将带噪语音根据噪声估计算法计算得到噪声功率。
[0067] 本实施例中，获取的带噪语音在时域表示为y (n) = s (η)+ζ (η)，其中s (η)为纯净语音信号，ζ(η)为原始带噪语音中的背景噪声。噪声估计算法可以采用现有的算法，将带噪语音y (n) = s (η) +ζ (η)根据噪声估计算法计算得到频域的噪声功率λ d (k)，其中k为频谱序号。
[0068] 步骤S120,将带噪语音根据掩蔽模型计算得到频域掩蔽阈值。
[0069] 本实施例中，掩蔽模型可以为现有的掩蔽模型，如心理声学模型，根据掩蔽模型计算得到频域带噪语音Y (k)的频域掩蔽阈值T (k)。
[0070] 步骤S130,将带噪语音转换到频域，得到频域带噪语音，包括频域纯净语音和频域背景噪声。
[0071 ] 本实施例中，将带噪语音y (n) = s (η) +ζ (η)经过FFT变换转换到频域，得到频域带噪语音Y(k)，表示为Y(k) = S(k)+Z(k)，其中S(k)为频域纯净语音，Z(k)为频域背景噪声，k为频谱序号。可以理解的是，带噪语音可以是经过语音增强算法处理后的带噪语音，如经过基于短时谱幅度估计的语音增强方法处理后的带噪语音，此时ζ (η)为经过基于短时谱幅度估计的语音增强方法处理后语音中的残余噪声。
[0072] 步骤S140,基于语音估计误差算法，将语音信号失真表示为关于所述频域纯净语音、感知滤波器增益的关系式，将滤波背景噪声表示为关于所述频域背景噪声、感知滤波器增益的关系式。
[0073] 本实施例中，经过感知滤波器去噪之后的频域增强语音$0 = (>'(^^(幻，根据语音估计误差蚵幻⑷-i(吟，得到E(k) = S(k)_G(k)Y(k)，其中E(k)为语音估计误差，S(k)为频域纯净语音，G(k)为感知滤波器增益，Y(k)为频域带噪语音。根据Y(k)= S(K)+Z(K)，得到E(k) =S(k)-G(K)(S(K)+Z(K))，其中Z(K)为频域背景噪声。将所述语音估计误差E(k)转化为E(k) = (l-G(k))S(k)_G(K)Z(K)，得到语音信号失真es(k)= (l-G(k))S(k)，滤波背景噪声 ez(k) = |_G(k)Z(k)| = |G(k)Z(k)|。
[0074] 步骤S150,根据语音信号失真和滤波背景噪声，基于语音信号失真功率、滤波背景噪声功率之和小于或等于频域掩蔽阈值的关系构造关于感知滤波器增益的方程。
[0075] 本实施例中，语音信号失真功率为€(/〇 = ￡>/(幻4(幻1，滤波背景噪声功率为 {⑷卜其中E{·}表示期望，T表示矩阵的转置。结合人耳掩蔽效应，最优的增益函数G(k)应该使语音失真尽可能小的同时，使背景噪声处于人耳掩蔽阈值之下，同时如果语音失真过大，明显有畸变，会影响主观感知质量，因此，本实施例要求语音信号失真功率Es (k)、滤波背景噪声功率Ez (k)之和小于或等于频域掩蔽阈值T (k)，即 Es(k)+Ez(k) <T(k)。可以根据需要在满足Es(k)+Ez(k) <T(k)的条件下自定义Es(k)+Ez(k) 与T(k)之间的关系构造关于G(k)的方程，如E s(k)+Ez(k) =T(k)/2。
[0076] 在一个实施例中，如图2所示，根据语音信号失真功率、滤波背景噪声功率之和等于频域掩蔽阈值，构造关于G(k)的方程，步骤S150包括以下步骤：
[0077] 步骤S151，根据所述语音信号失真得到所述语音信号失真功率。
[0078] 具体的，将语音信号失真es(k) = (l_G(k))S(k)代入〇_) = ￡·1<α)·弋(々咖导到语音信号失真功率Es(k) = (G(k)-l)2Ps(k)，其中Ps(k)=E{Sτ(k)，S(k)}为频域纯净语音功率。
[0079] 步骤S152,根据所述滤波背景噪声得到所述滤波背景噪声功率。
[0080] 具体的，将滤波背景噪声ez(k) = |G(k)Z(k) I代入￡-(幻= 得到滤波背景噪声功率民(1〇 = (G(k))2Pz(k)，其中Pz(k) =E{ZT(k)，Z(k)}为频域背景噪声功率。
[0081] 步骤S153,基于语音信号失真功率、滤波背景噪声功率之和等于频域掩蔽阈值的关系，得到所述方程（G(k)-l) 2Ps(k) + (G(k))2Pz(k) =T(k)，其中G(k)为感知滤波器增益， k为频谱序号，Ps(k)为频域纯净语音功率，Pz(k)为频域背景噪声功率，T(k)为频域掩蔽阈值。
[0082] 具体的，将语音信号失真功率Es(k) = (G(k)_l)2Ps(k)、滤波背景噪声功率Ez(k) =(G (k)) 2PZ (k)代入 Es (k) +EZ (k) = T (k)得到（G (k) -1) 2PS (k) + (G (k)) 2PZ (k) = T (k)，其中 G(k)为感知滤波器增益，k为频谱序号，Ps(k)为频域纯净语音功率，Pz(k)为频域背景噪声功率，T(k)为频域掩蔽阈值。
[0083] 步骤S150,求解方程得到感知滤波器增益。
[0084] 本实施例中，（G (k) -1) 2PS (k) + (G (k)) 2PZ (k) = T (k)为关于 G (k)的一元二次方程，可以通过先计算匕(1〇、匕(1〇的值，然后解一元二次方程得到方程的根。也可以通过对方程进行变形，再进行求解方程。由于存在一元二次方程无解的情况，可以在这种情况下自定义 G(k) 〇
[0085] 在一个实施例中，如图3所示，步骤S160包括以下步骤：
[0086] 步骤S161，根据噪声功率采用近似算法计算得到频域背景噪声功率。
[0087] 具体的，将噪声功率λ d (k)近似等于频域背景噪声功率Pz (k)，由Pz (k) = λ d (k) 得到频域背景噪声功率Pz (k)。可以理解的是，如果获取的带噪语音又经过语音增强算法进行了处理，则近似算法可以有所不同，采用自定义的近似算法。
[0088] 步骤S162,根据频域背景噪声功率计算得到后验信噪比，根据后验信噪比基于直接判决算法计算得到先验信噪比。
[0089] 本实施例中，后验信噪比(k)定义为
，其中Y(k)为带噪语音， |Y(k) |为带噪语音的频谱幅度，Pz(k)为频域背景噪声功率。直接判决算法可以采用现有的算法，计算得到先验?目噪比ξ ' (k)。
[0090] 步骤S163,根据频域背景噪声功率、先验信噪比、频域掩蔽阈值求解方程得到感知滤波器增益。
[0091] 本实施例中，如果根据Es(k)+Ez(k) = T(k)构造方程式，则构造的方程为（G(k)-l)2Ps(k) + (G(k))2Pz(k) =T(k)。以求解此方程为例，将此方程左右同时除以匕⑵转化为方程（G(k)-1)H' (k) + (G(k))2=C(k)，其中ξ' (k)为先验信噪比，
，Pz(k)为频域背景噪声功率，T(k)为频域掩蔽阈值。此方程为关于G(k)的二元一次方程，其中ξ ' (k)、C(k)为己知，则根据一元二次方程求根公式
，成立的条件为
，如果
或C(k)彡1时方程无解。
如果C (k)多1
则频域背景噪声功率Pz (k)在频域掩蔽阈值T (k)之下，此时噪声电平小于人耳听觉掩蔽阈值，此时不用对频域带噪语音Y(k)进行滤波处理，也能达到较好的听觉主观效果，定义G(k) = 1。因此，综合上述分析，则感知滤波器G(k) 为：
[0093] 可以理解的是，本实施例只是以求解方程（G(k)_l)2Ps(k) + (G(k))2Pz(k) =T(k)为例进行说明，方程可以为根据Es(k)+Ez(k) <T(k)构造的其它方程。
[0094] 步骤S170,根据感知滤波器增益，对带噪语音进行滤波处理得到增强的语音。
[0095] 本实施例中，根据感知滤波器增益G (k)，由频域带噪语音y(々）=G'a) ）得到增强的频域语音女幻，再将其转换到时域，得到增强的语音。或者先将感知滤波器增益 G (k)转换到时域，得到g (η)，再由i(W)=少，)* g(?)，得到增强的语音^>)，其中y (η)为时域带噪语音，*代表卷积。
[0096] 本实施例中，通过获取带噪语音，将带噪语音根据噪声估计算法计算得到噪声功率，将带噪语音根据掩蔽模型计算得到频域掩蔽阈值，将带噪语音转换到频域，得到频域带噪语音，频域带噪语音包括频域纯净语音和频域背景噪声；基于语音估计误差算法，将语音信号失真表示为关于所述频域纯净语音、感知滤波器增益的关系式，将滤波背景噪声表示为关于所述频域背景噪声、感知滤波器增益的关系式；根据语音信号失真和滤波背景噪声，基于语音信号失真功率、滤波背景噪声功率之和小于或等于频域掩蔽阈值的关系构造关于感知滤波器增益的方程；求解方程得到感知滤波器增益；根据感知滤波器增益，对带噪语音进行滤波处理得到增强的语音。由于语音信号失真功率、滤波背景噪声功率之和小于或等于频域掩蔽阈值，在保证语音信号失真功率较小的同时，保证噪声电平小于人耳听觉掩蔽阈值不被人耳听到，从而提高了增强语音的主观感知质量。
[0097] 在一个实施例中，在步骤S130之前，还包括：将带噪语音采用基于短时幅度谱估计法进行增强，得到增强后的带噪语音，步骤S130中将带噪语音转换到频域为将增强后的带噪语音转换到频域，步骤S170中对带噪语音进行滤波处理得到增强的语音为对增强后的带噪语音进行滤波处理得到增强的语音，步骤S161为：
[0098] 获取基于短时幅度谱估计法的频域增益函数GH (k)，其中k为频谱序号；根据Pz (k) =入#)-(1%〇〇)|￥〇〇|2得到频域背景噪声功率？2〇〇，其中人#)为噪声功率，￥〇〇为频域带噪语音。
[0099] 本实施例中，由于经过基于短时幅度谱估计法增强后的语音仍然存在残余噪声，可以通过本实施例的感知滤波方法进一步提高增强语音的效果。此时根据噪声功率λ d(k) 采用近似算法计算得到频域背景噪声功率Pz(k)时，先获取基于短时幅度谱估计法的频域增益函数G H(k)，然后根据匕⑵=Ad(k)-(l_GH(k)) |Y(k) |2近似估计得到频域背景噪声功率匕00,其中Y(k)为带噪语音，|Y(k) |为带噪语音的频谱幅度。
[0100] 在一个实施例中，根据后验信噪比基于直接判决算法计算得到先验信噪比的步骤为：获取当前帧和前一帧后验信噪比，分别为γ' (k，l)，y< (k，l-l)，其中k为频谱序号，1为帧序号，当前帧为1帧；获取前一帧感知滤波器增益G(k，1-1)，如果所述前一帧为第一帧，则前一帧感知滤波器增益为预设值；根据后验信噪比和感知滤波器增益通过公式得到当前帧先验信噪比= 1,0丨，其中 η 为平滑因子，并且〇 < η < 1。
[0101] 本实施例中，定义第一帧感知滤波器增益G(k，1)为预设值，优先的为1，获取第二帧和第一帧后验信噪比，分别为γ ^ (k，2)，γ ' (k，l)根据次(々,2) = /7(私,1)/仏,1) + (卜_1皿丨/化2)-1,0丨得到第二帧先验信噪比。11为平滑因子，可以取0到1之间的任何数，优选的η =0.92。得到第二帧的先验信噪比gu.2)后，根据后续的步骤解方程可以得到第二帧的感知滤波器增益G(k，2)。又可以根据G(k，2)，计算 f (13)，以此类推。
[0102] 以上实施例可以应用在如图4所示的语音增强系统中，输入带噪语音，经过掩蔽阈值估计164得到频域掩蔽阈值T (k)，经过噪声估计166得到噪声功率λ d(k)，将T (k)、 λ d(k)输入感知增强滤波165,构造并求解方程得到感知滤波器增益，并进行滤波处理得到增强语音。
[0103] 在一个实施例中，如图5所示，提供了一种感知滤波器，包括：
[0104] 获取模块210,用于获取带噪语音。
[0105] 噪声功率计算模块220,用于将带噪语音根据噪声估计算法计算得到噪声功率。
[0106] 掩蔽阈值计算模块230,用于将带噪语音根据掩蔽模型计算得到频域掩蔽阈值。
[0107] 频域转换模块240,用于将带噪语音转换到频域，得到频域带噪语音，频域带噪语音包括频域纯净语音和频域背景噪声。
[0108] 方程构造模块250,用于基于语音估计误差算法，将语音信号失真表示为关于所述频域纯净语音、感知滤波器增益的关系式，将滤波背景噪声表示为关于所述频域背景噪声、感知滤波器增益的关系式，根据语音信号失真和滤波背景噪声，基于语音信号失真功率、滤波背景噪声功率之和小于或等于频域掩蔽阈值的关系构造关于感知滤波器增益的方程。
[0109] 增益求解模块260,用于求解方程得到感知滤波器增益；
[0110] 滤波处理模块270,用于根据感知滤波器增益，对带噪语音进行滤波处理得到增强的语音。
[0111] 在一个实施例中，方程构造模块250根据语音信号失真和滤波背景噪声，基于语音信号失真功率、滤波背景噪声功率之和小于或等于频域掩蔽阈值的关系构造关于感知滤波器增益的方程具体为：根据语音信号失真得到所述语音信号失真功率，根据滤波背景噪声得到所述滤波背景噪声功率，基于语音信号失真功率、滤波背景噪声功率之和等于频域掩蔽阈值的关系，得到方程（G(k)-l) 2Ps(k) + (G(k))2Pz(k) =T(k),其中G(k)为感知滤波器增益，k为频谱序号，Ps(k)为频域纯净语音功率，Pz(k)为频域背景噪声功率，T(k)为频域掩蔽阈值。
[0112] 在一个实施例中，如图6所示，增益求解模块260包括：
[0113] 求解准备单元261，用于根据噪声功率采用近似算法计算得到频域背景噪声功率，根据频域背景噪声功率计算得到后验信噪比，根据后验信噪比基于直接判决算法计算得到先验?目噪比。
[0114] 求解单元262,用于根据频域背景噪声功率、先验信噪比、频域掩蔽阈值求解方程得到感知滤波器增益。
[0115] 在一个实施例中，如图7所示，在上述实施例的基础上，所述感知滤波器还包括：
[0116] 增强模块280,用于将带噪语音采用基于短时幅度谱估计法进行增强，得到增强后的带噪语音。
[0117] 频域转换模块240将所述带噪语音转换到频域为将所述增强后的带噪语音转换到频域，滤波处理模块270对带噪语音进行滤波处理得到增强的语音为对增强后的带噪语音进行滤波处理得到增强的语音。
[0118] 求解准备单元261根据噪声功率采用近似算法计算得到频域背景噪声功率具体为：获取基于短时幅度谱估计法的频域增益函数GH(k)，其中k为频谱序号，根据Pz(k)= Ad(k)_(l_GH(k)) |Y(k) Γ得到频域背景噪声功率Pz(k)，其中λ"1〇为噪声功率，Y(k)为频域带噪语音。
[0119] 在一个实施例中，求解准备单元261根据后验信噪比基于直接判决算法计算得到先验信噪比具体为：获取当前帧和前一帧后验信噪比，分别为γ ' (k, 1)，γ ^ (k, 1-1)，其中k为频谱序号，1为帧序号，当前帧为1帧，获取前一帧感知滤波器增益G(k，1-1)，如果前一帧为第一帧，则前一帧感知滤波器增益为预设值；根据后验信噪比和感知滤波器增益通过公式得到当前帧先验信噪比-丨)+ 0 -·7)?χ丨/(A-，/) -丨,0卜其中 η为平滑因子，并且〇< η < 1。
[0120] 以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。
【主权项】
1. 一种感知滤波方法，所述方法包括：获取带噪语音，将所述带噪语音根据噪声估计算法计算得到噪声功率；将所述带噪语音根据掩蔽模型计算得到频域掩蔽阈值；将所述带噪语音转换到频域，得到频域带噪语音，所述频域带噪语音包括频域纯净语音和频域背景噪声；基于语音估计误差算法，将语音信号失真表示为关于所述频域纯净语音、感知滤波器增益的关系式，将滤波背景噪声表示为关于所述频域背景噪声、感知滤波器增益的关系式；根据所述语音信号失真和滤波背景噪声，基于语音信号失真功率、滤波背景噪声功率之和小于或等于频域掩蔽阈值的关系构造关于感知滤波器增益的方程；求解所述方程得到所述感知滤波器增益；根据所述感知滤波器增益，对所述带噪语音进行滤波处理得到增强的语音。2. 根据权利要求1所述的方法，其特征在于，所述根据所述语音信号失真和滤波背景噪声，基于语音信号失真功率、滤波背景噪声功率之和小于或等于频域掩蔽阈值的关系构造关于感知滤波器增益的方程的步骤为：根据所述语音信号失真得到所述语音信号失真功率；根据所述滤波背景噪声得到所述滤波背景噪声功率；基于语音信号失真功率、滤波背景噪声功率之和等于频域掩蔽阈值的关系，得到所述方程（G(k)-l)2Ps(k) + (G(k))2Pz(k) =T(k)，其中G(k)为感知滤波器增益，k为频谱序号， Ps(k)为频域纯净语音功率，Pz(k)为频域背景噪声功率，T(k)为频域掩蔽阈值。3. 根据权利要求1所述的方法，其特征在于，所述求解所述方程得到所述感知滤波器增益的步骤包括：根据所述噪声功率采用近似算法计算得到所述频域背景噪声功率；根据所述频域背景噪声功率计算得到后验信噪比；根据所述后验信噪比基于直接判决算法计算得到先验信噪比；根据所述频域背景噪声功率、先验信噪比、频域掩蔽阈值求解所述方程得到所述感知滤波器增益。4. 根据权利要求3所述的方法，其特征在于，在所述将所述带噪语音转换到频域，得到频域带噪语音，所述频域带噪语音包括频域纯净语音和频域背景噪声的步骤之前，还包括：将所述带噪语音采用基于短时幅度谱估计法进行增强，得到增强后的带噪语音，所述将所述带噪语音转换到频域为将所述增强后的带噪语音转换到频域，所述对带噪语音进行滤波处理得到增强的语音为对增强后的带噪语音进行滤波处理得到增强的语音，所述根据所述噪声功率采用近似算法计算得到所述频域背景噪声功率的步骤为：获取所述基于短时幅度谱估计法的频域增益函数GH(k)，其中k为频谱序号；根据Pz(k) = Ad(k)-(l_GH(k)) |Y(k) Γ得到所述频域背景噪声功率Pz(k)，其中Ad(k) 为噪声功率，Y(k)为频域带噪语音。5. 根据权利要求3所述的方法，其特征在于，所述根据所述后验信噪比基于直接判决算法计算得到先验信噪比的步骤为：获取当前帧和前一帧后验信噪比，分别为γ ' (k, 1)，γ ^ (k, 1-1)，其中k为频谱序号，1为帧序号，当前帧为1帧；获取前一帧感知滤波器增益G(k，1-1)，如果所述前一帧为第一帧，则所述前一帧感知滤波器增益为预设值；根据所述后验信噪比和感知滤波器增益通过公式得到当前帧先验信噪比《'(/:./) = /7(沿，/-1)/(/:,/-1) + 〇-/7)门1狀{广(人%/)-].0}，其中11为平滑因子，并且〇<11 < 1〇6. -种感知滤波器，其特征在于，所述感知滤波器包括：获取模块，用于获取带噪语音；噪声功率计算模块，用于将所述带噪语音根据噪声估计算法计算得到噪声功率；掩蔽阈值计算模块，用于将所述带噪语音根据掩蔽模型计算得到频域掩蔽阈值；频域转换模块，用于将所述带噪语音转换到频域，得到频域带噪语音，所述频域带噪语音包括频域纯净语音和频域背景噪声；方程构造模块，用于基于语音估计误差算法，将语音信号失真表示为关于所述频域纯净语音、感知滤波器增益的关系式，将滤波背景噪声表示为关于所述频域背景噪声、感知滤波器增益的关系式，根据所述语音信号失真和滤波背景噪声，基于语音信号失真功率、滤波背景噪声功率之和小于或等于频域掩蔽阈值的关系构造关于感知滤波器增益的方程；增益求解模块，用于求解所述方程得到所述感知滤波器增益；滤波处理模块，用于根据所述感知滤波器增益，对所述带噪语音进行滤波处理得到增强的语音。7. 根据权利要求6所述的感知滤波器，其特征在于，所述方程构造模块根据所述语音信号失真和滤波背景噪声，基于语音信号失真功率、滤波背景噪声功率之和小于或等于频域掩蔽阈值的关系构造关于感知滤波器增益的方程具体为：根据所述语音信号失真得到所述语音信号失真功率；根据所述滤波背景噪声得到所述滤波背景噪声功率；基于语音信号失真功率、滤波背景噪声功率之和等于频域掩蔽阈值的关系，得到所述方程（G(k)-l)2Ps(k) + (G(k))2Pz(k) =T(k)，其中G(k)为感知滤波器增益，k为频谱序号， Ps(k)为频域纯净语音功率，Pz(k)为频域背景噪声功率，T(k)为频域掩蔽阈值。8. 根据权利要求6所述的感知滤波器，其特征在于，所述增益求解模块包括：求解准备单元，用于根据所述噪声功率采用近似算法计算得到所述频域背景噪声功率，根据所述频域背景噪声功率计算得到后验信噪比，根据所述后验信噪比基于直接判决算法计算得到先验?目噪比；求解单元，用于根据所述频域背景噪声功率、先验信噪比、频域掩蔽阈值求解所述方程得到所述感知滤波器增益。9. 根据权利要求8所述的感知滤波器，其特征在于，所述感知滤波器还包括：增强模块，用于将所述带噪语音采用基于短时幅度谱估计法进行增强，得到增强后的带噪语音；所述频域转换模块将所述带噪语音转换到频域为将所述增强后的带噪语音转换到频域；所述滤波处理模块对带噪语音进行滤波处理得到增强的语音为对增强后的带噪语音进行滤波处理得到增强的语音；所述求解准备单元根据所述噪声功率采用近似算法计算得到所述频域背景噪声功率具体为：获取所述基于短时幅度谱估计法的频域增益函数GH(k)，其中k为频谱序号；根据Pz(k) = Ad(k)-(l_GH(k)) |Y(k) Γ得到所述频域背景噪声功率Pz(k)，其中Ad(k) 为噪声功率，Y(k)为频域带噪语音。10.根据权利要求8所述的感知滤波器，其特征在于，所述求解准备单元根据所述后验信噪比基于直接判决算法计算得到先验信噪比具体为：获取当前帧和前一帧后验信噪比，分别为γ ' (k, 1)，γ ^ (k, 1-1)，其中k为频谱序号，1为帧序号，当前帧为1帧；获取前一帧感知滤波器增益G(k，1-1)，如果所述前一帧为第一帧，则所述前一帧感知滤波器增益为预设值；根据所述后验信噪比和感知滤波器增益通过公式得到当前帧先验信噪比 |tM>-1)/(氣 I -1) + (1-的 max{ 办 < 1〇
【文档编号】G10L21/0208GK105869649SQ201510031872
【公开日】2016年8月17日
【申请日】2015年1月21日
【发明人】张勇, 刘轶
【申请人】北京大学深圳研究院, 深港产学研基地

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张勇;刘轶;
技术所有人：北京大学深圳研究院;深港产学研基地;
我是此专利的发明人

上一篇：数字音频数据播放方法及装置的制造方法
上一篇：混音方法及装置的制造方法