用于优化耳机中的噪声消除的方法及用于话音通信的耳机的制作方法_2

文档序号：9755293阅读：来源：国知局

语音分量的构造中，然后有效地使输出最小化与使输出中的噪声分量最小化是相同的。该性质通常称作对过滤的约束。
[0030] 在通过广义旁瓣消除（GSC)计算自适应地配置一个或多个音频信号的过滤的情况下，自适应滤波器可W仅过滤并减去已经语音消除的信号。从而，自适应滤波器可W不或者不能修改语音分量，且因此使输出最小化导致使输出中的噪声最小化。
[0031] 在通过最小方差无失真响应（MVDR)计算自适应地配置一个或多个音频信号的过滤的情况下，导向矢量可W表示该约束。阳03引因此，使输出功率最小化导致输出中的噪声最小化。
[0033] 术语"对应于"可W定义或者理解为"与…一样"或者"与…相等"，因此，特征"过滤自适应地配置为持续提供至少噪声消除输出的对应于从至少一个麦克风中生成的基准音频信号的语音部分的语音部分的振幅频谱"可W称为"过滤自适应地配置为持续提供至少噪声消除输出的与从至少一个麦克风中生成的基准音频信号的语音部分一样和/或相等的语音部分的振幅频谱"。
[0034] 通过将噪声抑制应用至波束形成器的输出可W有利地使波束形成与噪声抑制器相结合。运是由于用户语音与外界噪声的比率（信噪比（SNR))在波束形成器的输出中得到改善。因为来自噪声抑制的不期望的处理瑕疵的水平通常取决于SNR，瑕疵减少源于波束形成与噪声抑制的结合。
[0035] 通常，噪声抑制可 W 如在 Proc. I邸E Int. Conf. Acoust. Speech Si即曰1 Processing, 1983,1118-1121 页中的Y.化虹aim和D. Mal址的"Speech enhancement using optimal non-linear spectral ampli1:ude estimation"中描述的或者如在关于噪声抑制技术的其他文献中所描述的那样来实施。通常，时变滤波器应用于信号。分析和/或过滤常常在W多个频带表示信号的频率变换域/滤波器库中实现。在每个表示的频率处，根据估计的期望信号与噪声分量的关系计算时变增益，例如，当估计的信噪比超过预定的、自适应的或者固定的阔值时，增益引导朝向1。相反地，当估计的信噪比没有超过阔值时，增益被设置为小于1的值。
[0036] 通常，估计信号与噪声关系的方式基于跟踪噪声层，其中，通过明显超过噪声层电平的信号部分识别语音或者有噪声的语音。例如，可W通过最小化统计估计噪声电平，如在 2001 年 7 月的 Trans, on Speech and Audio Processing 第 5 期第 9 卷中 R. Martin 的 "Noise Power Spectral Density Estimation Based on Optimal Smoothing and Minimum Statistics"中所披露的，其中，自适应地估计最小信号电平。
[0037] 识别信号和噪声部分的其他方式基于计算多个麦克风空间特征，诸如方向性和接近度，参见2004年7月的IE邸Transactions on Si即al Processing第7期第52卷 1830-1847 页中 0. Yilmaz 和 S. I^ickard 的"Blind Separation of Speech Mix1:ures via Time-Frequen巧 Masking",，或者相干性，参见 2001 年 Microphone Arrays. Springer Berlin Heide化erg 第 39-60 页中 K. Simmer 等人的"Post-filtering techniques"。还可W应用将信号分解为码本时间/频率曲线的词典方法，参见M. Schmi化和R. Olsson 的"Single-ch曰nnel speech sep曰r曰tion using sp曰rse non-neg曰tive m曰trix factorization，"Interspeech，2006。
[0038] 该方法可W包括麦克风输出数字信号；在多频带中执行数字信号至时频表示法的变换；和执行至少组合信号至时域表示的逆变换。
[0039] 可W通过应用于预定持续时间的信号块的快速傅里叶变换（FFT)执行变换。该变换可W包括应用汉宁（Harm)窗口或者另一类型的窗口。时域信号可W经由逆快速傅里叶变换（IFFT)而从时频表示进行重构。阳040] 预定持续时间的信号块可W具有50%重叠的8ms的持续时间，运意味着每4ms计算变换、适应更新、噪声减小更新和时域信号重构。然而，其他持续时间和/或更新间隔是可能的。数字信号可W是多倍过采样率的一位信号、或者两位或=位信号或者8位、10位、 12位、16位或24位信号。
[0041] 在替代的实现/实施方式中，所有或者部分系统可W直接在时域中操作。例如，噪声抑制可W通过FIR或者IIR过滤、波束形成和在频域中计算的噪声抑制滤波器系数而应用于时域信号。
[0042] 该方法可W包括麦克风输出模拟信号；执行模拟信号的模数转换W提供数字信号；在多频带中执行数字信号至时频表示的变换；W及执行至少组合信号至时域表示的逆变换。
[0043] 关于在背景部分中引用的现有技术，其中，两件专利US7346176和US7561700主张类型1问题的解决方案，如在问题陈述部分描述的，但是未主张类型2问题的解决方案并且在现有技术中描述的方法不能解决类型2问题，本申请中要求保护的方法可W解决类型2 问题。
[0044] US7346176和US7561700与类型2问题不兼容，其所主张的方法无法应用，因为现有技术需要计算定位或者错位的测量，例如，现有技术主张"定位估计电路，禪接为从第一麦克风和第二麦克风接收音频信号，并且适配为从来自第一麦克风和第二麦克风的音频信号产生误差信号W表示拾声设备相对于希望的位置的成角度的和/或距离错位。对于已经描述的原因，在问题类型2中，不可能计算位置或者错位的切合实际的测量和本申请的方法没有运样做。
[0045] 因此，现有技术US7346176和US7561700描述的解决方案所解决的问题与本发明方法所解决的问题不同。现有技术通过需要在某些时间点用于校准的条件的校准麦克风 "观察到"声场，然而本申请的方法没有。本申请的方法解决更加困难的问题，其从不需要访问（access,获得）允许对麦克风进行校准的条件。
[0046] 在一些实施方式中，基准音频信号是第一音频信号，或者第二音频信号，或者第一音频信号和第二音频信号的加权平均值，或者第一音频信号和第二音频信号的滤波求和组厶 1=1 O
[0047] 在一些实施方式中，至少噪声消除输出的对应于基准音频信号的语音部分的语音部分的振幅频谱包括至少噪声消除输出与基准音频信号的语音部分成比例的或者相似的语音部分的振幅频谱。
[0048] 在一些实施方式中，噪声消除配置为在执行时不考虑/独立于/不管麦克风的位置和/或灵敏度。
[0049] 在一些实施方式中，通过至少一个波束形成器执行一个或多个音频信号的过滤。
[0050] 在一些实施方式中，通过广义旁瓣消除（GSC)计算自适应地配置一个或多个音频信号的过滤。
[0051] 参见例如 2009 年 7 月，第 388 页，Ivan !"ashev ;Sound Cap1:ure and Processing : Practical Approaches, Wiley,广义旁瓣消除是指具有嵌入处理结构W保存有价值的信号的约束的波束形成器，有价值的信号在耳机使用情形中指的是用户语音。
[0052] GSC具有两个计算分支：
[0053] 第一分支是基准分支或者固定的波束形成器，其拾取用户语音和周围环境噪声的混合。基准分支的示例是延迟求和波束形成器，例如，对与用户语音对准的振幅和相位信号求和，或者将其中一个麦克风作为基准。基准分支应当优选地选择/设计成为尽可能对麦克风相对于用户的嘴的定位不灵敏，因为基准分支的用户语音响应确定GSC的用户语音响应，如W下将解释说明的。由于相对而言对于位置和麦克风灵敏度变化相对不灵敏的事实，因此全向麦克风可W是合适的。在多麦克风耳机式麦克风吊杆设计中，后麦克风（接近麦克风吊杆的旋转点而定位，其中，旋转点通常位于或者较接在耳机的位于用户耳朵处的听筒处）可W是更可取的，因为其对麦克风吊杆的移动不太敏感。因此，优选地，运提供无变化的用户语音信号的振幅频谱。
[0054] GSC计算的第二分支计算语音消除信号，其中，信号通过块矩阵过滤并被减成，W 尽可能多地减少用户语音信号。阳化5] 最后，通过GSC自适应地过滤语音消除信号并从基准分支减去该语音消除信号来执行噪声消除，W使输出功率最小化。在理想的情形中，语音消除信号（理想地）不包含用户语音分量，由此产生噪声消除输出的减成没有改变存在于基准分支中的用户语音分量。因此，语音分量的振幅频谱在GSC基准分支和GSC波束形成器的输出可W是相同的或者非常相似的。可谓GSC波束形成器的射束W用户语音为中屯、。
[0056] 本方法提供一种装置W确保GSC的语音消除分支一直是最优配置的。如果语音消除滤波器未准确地配置，则用户语音将泄漏到语音消除分支中。因此，GSC噪声消除操作将 W不期望的方式改变用户语音响应，即，GSC波束形成器的射束将不再W用户语音为中屯、。本发明的方法提出持续地适应语音消除滤波器W使泄漏到语音消除分支中的语音泄漏最小化。可W使用能考虑的任何优化流程，例如最小均方（least mean square),进行最小化流程。通过话音活动检测器可W有利地控制最小化流程W使语音泄漏最小化，从而防止来自周围环境的噪声的干扰。
[0057] 自适应的语音消除滤波器摸索地结合并补偿起源于麦克风振幅和相位响应、输入端电子响应和声路径响应的麦克风之间的用户语音响应差异。声路径响应取决于麦克风在麦克风吊杆上的位置、麦克风吊杆的位置、给定用户的头部的几何形状和从嘴、肩部反射及其他反射产生的声场。因为所有运些影响是线性的，所W可W根据本发明的方法利用一

完整全部详细技术资料下载

当前第2页1 2 3 4 5