用于动态调谐回音消除器的增益控制系统及方法_4

文档序号:9263617阅读:来源:国知局
,则模式控制器113使声学回音消除器按全双工模式操作(步骤309 和310)。如果回音消除器之前没按全双工模式操作,则模式控制器使回音消除器按半双工 模式操作(步骤309和步骤311)。
[0102] 如果识别出单端讲话区,则回音测量单元利用先前计算的短期平均值来估计远端 信号和麦克风信号的长期平均值(步骤312)。
[0103]
[0104]
[0105] 这种平均化处理可以利用低通滤波器来实现。
[0106] 回音测量单元的下一步骤是计算麦克风信号与远端信号的比率。该比率适当地表 示这两个信号的相对信号强度。可以使用任何合适的计算和测量;在这个示例中,回音测量 单元使用ERL。远端信号与回音之间的功率损耗首先利用针对麦克风信号和远端信号计算 的长期平均值来被估计(步骤312)。在步骤313计算ERL,并且通过以下方程给出ERL:
[0107] (9)
[0108] 下表基于线性标度和对数标度来比较ERL值:
[0109]
[0110] 表1 :基于线性标度和对数标度的ERL值。'
[0111] 随着自适应滤波器改进其对回音路径的建模,ERL估计将逐渐接近实际ERL。这在 图5中示出。ERL估计继续进行,直到确认框112确认ERL估计的稳定性为止(步骤314)。 如果ERL估计稳定,则按全双工模式操作声学回音消除器(步骤315)。如果任何波动被约 束在预定范围内达至少一预定时段,则该确认框优选地确定ERL估计是稳定的。合适的时 段例如可以是3秒钟。然而,ERL估计优选地针对很可能影响ERL的每一种操作改变而重 新初始化。示例包括呼叫启动、音频模式改变以及音量级改变。
[0112] 表2提供了针对通信装置的不同操作模式的麦克风衰减和远端衰减的典型默认 值。不同音频模式的示例包括:"扬声器模式"、"听筒模式"以及"耳机模式"。每一种操作模 式可以对应于扬声器与麦克风之间的希望类型的回音路径。这些默认值的目的是确保自适 应滤波器即使在高的负的ERL条件下也能够估计回音。另一目的是帮助更快速的估计ERL。 衰减控制器优选地被设置成,在开始任何自动调谐操作时应用这些默认值。增益控制系统 将重新初始化自动调谐处理并且返回至呼叫启动、模式改变以及音量级改变时的默认值。
[0113]
[0114] 表2 :针对麦克风和远端衰减的默认可调谐值
[0115] 增益调谐的一个目的是,在不需要人工调谐的情况下,最优化针对现实的平台和 操作模式的这些衰减值。例如,应当对麦克风和远端信号进行适当的调节,以使滤波器系数 不饱和。另一目的是,在没有显著回音的情况下,尽最大可能的程度上提供全双工操作。
[0116]"杨声器樽式"调谐
[0117] 一般来说,扬声器模式下的ERL很可能低于OdB。一些平台可能具有达24dB的 负ERL。默认增益值趋于设置成处理非常低的ERL情况,以使自适应滤波器可以在下降 至-24dB的ERL的宽泛范围内工作。然而,ERL实际上可能高于所考虑的默认增益值,并且 麦克风信号的高衰减影响滤波器的双端讲话性能。下表3是可以如何根据ERL来设置增益 的示例。根据比较表3与表2中的"扬声器模式"值而明白的是,如果ERL高于希望值,则 麦克风衰减被降低。估计ERL由此使得能够自动设置最佳增益,意味着可以最优化自适应 滤波器的性能。
[0118]
[0119] 表3 :扬声器音频模式下的可调谐值
[0120] 一般来说,由回音消除器经历的ERL取决于应用于远端信号和麦克风信号两者的 衰减。衰减麦克风信号补偿了负的ERL。衰减远端信号减小ERL补偿。麦克风衰减与远端 衰减之间的平衡确定输入到回音消除器中的这些信号的比率。
[0121] 图6例示了远端信号和麦克风信号的示例。这些信号给出-12dB的ERL。为了实 现正的ERL,麦克风信号衰减18dB(S卩,麦克风衰减值为3),结果有效ERL为6dB。在这个示 例中,麦克风衰减不是4 (如表3所指示),因为没有应用远端衰减。表3指示远端衰减为 1。由此,因为未应用远端衰减,所以正确的麦克风衰减为3,以获得6dB的有效ERL。
[0122] "听箇樽式"调谐
[0123] -般来说,听筒音频模式下的ERL很可能大于12dB(S卩,麦克风处的回音功率级是 扬声器处的远端信号功率级的不到四倍)。该默认调谐值趋于被设置成处理12dB的ERL。 然而,某些平台将具有比默认值更高的正ERL,从而对于由自适应滤波器完全消除回音来 说,需要衰减远端信号。类似的是,具有小于12dB的ERL的平台可能需要衰减的麦克风信 号。下表4是可以如何根据ERL来设置增益的示例。
[0124]
[0125] 表4 :听筒音频模式下的可调谐值
[0126] "耳机樽式"调谐
[0127] 一般来说,耳机音频模式下的ERL很可能大于24dB(即,麦克风处的回音功率级 很可能是听筒扬声器处的远端信号功率级的不到八倍)。该默认可调谐值趋于设置成支持 24dB的ERL。如果ERL超过24dB,则可能必须衰减远端信号,而如果ERL下降到低于其希望 值,则可能必须从其默认值降低衰减。
[0128]
[0129] 表5.耳机音频模式下的可调谐值
[0130] 另外,无论什么音频模式,当自适应滤波器在远端活动区期间不适应时,还可能必 须衰减麦克风信号。类似地,如果收敛稳定性检测器(参见图2)指示已经出现饱和,则可 能需要增益调谐,以避免自适应滤波器系数中的饱和。
[0131] 收敛稳定性检测器监测滤波器的系数。尤其是,其监测建模的回音路径的优势区 域(dominantarea)中的滤波器系数,并且基于这些滤波器系数随着时间的变化来估计自 适应滤波器的收敛稳定性。收敛稳定性检测器的原理作用是控制NLP域值。如果自适应滤 波器具有稳定收敛,则NLP域值被设置成相对较低的值,以提供全双工性能。如果自适应滤 波器具有边缘收敛(marginalconvergence)或者如果收敛低于可接受最小值,则NLP域值 被设置成更高值,以阻止声学回音消除器的残留回音泄露。在这种情况下,根据自适应滤波 器的不稳定性,由于非线性处理器对传出信号进行限幅,可能导致话音中断。除了对NLP域 值进行调谐以外,收敛稳定性检测器还帮助确认由ERL估计器控制的麦克风衰减。收敛稳 定性检测器由此提供附加增益控制。
[0132] 本文描述的算法的性能已经在三个不同回音区进行了测试:纯单端讲话区、双端 讲话区以及单独近端区。被用于评估该算法的性能的指标是为冻结远端衰减、麦克风衰减 以及NLP域值而花费的时间。将针对这些参数而估计的值与通过人工调谐参数而获取的希 望值相比较,以提供无回音、全双工通信。跨五个不同的基准平台(均为通信装置的特定构 造和模型)来执行该比较。
[0133] 该算法利用表8中列出的常数和域值来实现。该算法被集成到IMG话音引擎中并 且在各种不同的移动平台上进行测试。该评估测试使用宽带编解码器(16kHz采样速率), 和512抽头的自适应滤波器尾长(对应于32ms的尾长)。在所有测试中,这些参数被初始 化成表9中提供的值,并且针对在双端讲话情况、单端讲话情况以及单独近端情况期间的 听筒、免提以及耳机音频模式注释响应时间。为测试增益控制系统的性能,双端讲话测试情 况使用整个呼叫持续时间的80 %的交叠区。
[0134] 第一注释点是,增益控制算法针对所有音频模式决定调谐参数。这确认了该算法 在不需要人工调谐的情况下来提供最佳声学回音消除器。
[0135] (a)扬声器模式
[0136] 图7例示了在单端讲话和双端讲话期间针对免提模式下的装置的响应时间。单端 讲话期间的响应时间具有大约2. 1秒的平均值,而在双端讲话期间,响应时间的平均值大 约为2. 6秒。
[0137] (b)听筒模式
[0138] 图8例示了在单端讲话和双端讲话期间针对听筒模式下的装置的响应时间。与免 提模式类似的是,单端讲话期间的响应时间具有大约2. 2秒的平均值,而在双端讲话期间, 响应时间的平均值大约为2. 45秒。
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1