利用不可听音调的声学回音消除器的时钟偏斜补偿的制作方法

文档序号:7991618阅读:179来源:国知局
利用不可听音调的声学回音消除器的时钟偏斜补偿的制作方法
【专利摘要】本发明提供了用于语音信号中的声学回音消除的方法和设备。通过在语音信号中插入至少一个音调来消除声学回音,其中所述至少一个音调对于收听者基本上是不可听的;根据所述至少一个音调的频率偏移确定两个采样时钟之间的时钟偏斜;根据所确定的时钟偏斜对语音信号进行重采样;以及利用经过重采样的语音信号执行声学回音消除。所提供的声学回音消除器例如可以被实施为基于终端和/或基于网络的声学回音消除器。所述音调可选地包括不可听音调或多个音调。音调生成可以被限制在仅当音调频率附近的语音功率大于预定阈值时发生,或者被限制在呼叫的起始发生。所述音调的水平可选地可被控制使得所述音调被语音信号掩盖。
【专利说明】利用不可听音调的声学回音消除器的时钟偏斜补偿
【技术领域】
[0001]本发明一般涉及信号处理技术,更尤其涉及回音消除技术。
【背景技术】
[0002]随着扬声电话和电话会议的广泛使用,声学回音消除已经变得越来越重要。特别是,声学回音消除器(AEC,Acoustic Echo Canceller)旨在减少或者消除不期望的回音。不期望的回音,通常由当扬声器信号反馈到麦克风中时,由于扬声器-麦克风耦合而造成的直接路径产生以及由于扬声器信号在物体和墙壁上的声学反射而造成的间接路径产生。举例来说,在通过电话或因特网的语音通信中,如果声学回音没有被与电话通信的另一方相关联的终端充分减少,则说话者将听到延迟的且经过过滤的他自己语音版本。
[0003]为了在终端中有效应用AEC,重建将被发送至扬声器的模拟信号的数字到模拟(D/A, digital-to-analog)转换器和对由麦克风拾取的语音信号进行采样的模拟到数字(A/D,analog-to-digital)转换器中的采样率应当完全匹配。已经发现,采样率之间即使小的时钟偏斜也能够显著降低AEC的性能。一般来说,随着扬声器与麦克风信号之间的米样率偏移量增大,AEC的可靠性会降低。终端的采样率中的时钟偏斜是频繁发生的问题,例如在基于PC的软件终端中。采样率偏斜可总是被假定,如果,例如,外部USB摄影机与其内置麦克风和用于视频记录A/D转换器,连同用于音频回放的单独音板一起被使用。在这种情况下,A/D和D/A转换器不是从一个共同的参考(石英钟)来导出他们的时钟,因此不是同步的。
[0004]存在用于在终端中布置的时钟偏斜补偿方法。该基于终端的方法通常利用与D/A和A/D转换器相关联的缓冲器中的读写指针位置。例如,当接收(RX)缓冲器读取指针的递增速度快于发送(TX)缓冲器写入指针时,D/A转换器的采样率高于A/D转换器的采样率。因此,接收缓冲器的每指定时间的读取指针增量与发送缓冲器的写入指针增量之间的差异可以被用来估计时钟偏移量或采样率偏移量。所得到的偏移量可以被用来控制其中一个信号的重米样率,以便得到关于扬声器和麦克风信号的相同米样率。例如,参见M.Pawig和 G.Enzner 的“Adaptive Sampling Rate Correction for Acoustic Echo Controlin Voice-Over-1P (IP语音中的声学回音控制的自适应采样率校正)”,IEEETrans.0nSignal Processing, Vol.58,N0.1 (2010 年 I 月);或者 D.Mili jkovic 等人的“Clock SkewCompensation by Speech Interpolation (通过语音内插的时钟偏斜补偿)”,数字通信的IEEE 国际会议(IEEE Int,IConf.0n Digital Telecommunications) (2006),两者在此通过引用并入本文。
[0005]当在终端中没有充分抑制或消除声学回音时,可以在网络中远程尝试声学回音消除。但是对于基于网络的声学回音消除存在若干技术问题。举例来说,上述基于终端的时钟偏斜补偿技术无法被应用在网络中,因为无法从例如网络之类的远程位置访问读取指针和写入指针位置。
[0006]因此,现有的网络服务仅仅提供声学回音抑制(AES,Acoustic EchoSuppression)。但是,声学回音抑制器的感知性能明显不如AEC的感知性能。AES的一个特别缺陷是在呼叫中缺少透明度,当两端同时尝试讲话时尤为明显。在其基本的形式中,AES通过在一条信号路径中插入损耗来只允许一端讲话(类似于半双工通信模式)。尽管例如舒适噪音插入之类的增强可以提高感知通信质量,但是声学回音抑制器的性能仍然明显不如真实AEC的性能。
[0007]因此,需要用于补偿出现在终端中的时钟偏斜的改进技术,以允许有效应用AEC。还需要可以在终端或网络中采用的时钟偏斜补偿技术。

【发明内容】

[0008]总体来说提供了用于语音信号中声学回音消除的方法和设备。根据本发明的一个方面,通过在语音信号中插入至少一个音调来消除声学回音,其中所述至少一个音调对于收听者基本上是不可听的;根据所述至少一个音调的频率偏移确定两个采样时钟之间的时钟偏斜;根据所述确定的时钟偏斜对语音信号进行重采样;以及利用经过重采样的语音信号执行声学回音消除。所提供的声学回音消除器例如可以被实施为基于终端和/或基于网络的声学回音消除器。
[0009]音调例如可以包括不可听的音调,比如高音音调或者高于最大可检测频率的音调(即由于其频率而不可听)。此外,音调可选地包括多个音调。在各个实施例中,可以只有在音调频率附近的语音功率大于预定阈值才生成所述音调,或者仅在呼叫的起始处生成所述音调。
[0010]根据本发明的另一方面,所述音调的水平可选地被控制使得所述音调被语音信号掩盖。例如,所述音调的水平被从语音信号导出的掩盖阈值控制。
[0011]通过参考下面的详细描述和附图将会获得本发明的更完整的理解,以及本发进一步的特征和优点。
【专利附图】

【附图说明】
[0012]图1不出传统的基于网络的声学回音抑制器(AES);
[0013]图2示出布置在终端中的传统的基于终端的声学回音消除器(AEC);
[0014]图3示出布置在终端中的采用根据本发明的时钟偏斜补偿技术的基于终端的声学回音消除器(AEC);
[0015]图4进一步详细示出图3的音调插入块;
[0016]图5示出图4中所示技术的一种替代音调插入方法;以及
[0017]图6示出布置在网络设备中的采用根据本发明的时钟偏斜补偿技术的基于网络的声学回音消除器(AEC)。
【具体实施方式】
[0018]本发明提供了与声学回音消除器一起使用的用于时钟偏斜补偿的方法和设备。根据本发明的一个方面,将音调(例如不可听音调)添加到语音信号中。该音调被用于估计采样率失配以及用于相应地适配重采样器。在一个示例性实施例中使用高音音调,其中可以控制音调的水平,从而使得所述音调被语音信号掩盖。在一种可替代的实现中,音调水平被设定为固定水平,从而有时导致可听的音调。
[0019]图1示出传统的基于网络的声学回音抑制器(AES, Acoustic Echo Suppressor)100。在此使用术语“近端”和“远端”来指代呼叫的两侧或两端。尽管声学回音问题可在两端均发生,在此,为便于说明仅讨论一端,因为相同的回音缓解方案通常可以被应用于两端中任一侧,对于本领域普通技术人员将是显而易见的。换句话说,在本发明的描述中,术语“近端”和“远端”在整个讨论中可以互换。因此,不损失一般性,仅对一侧进行描述。如图1中所示,AES100是网络设备170的一部分。分别对应于远端语音105和近端语音150的语音活动检测器(VAD, Voice Activity Detector) 110-1、110-2提供至损耗控制块120的输入。损耗控制块120基于由VADl 10-1、110-2检测到的语音活动在远端信号105或近端信号150上插入损耗。与真实声学回音消除器(AEC)相比,AES100不受终端设备180中的米样率差异的影响。
[0020]如图1中所示,终端设备180包括存储所接收到的远端信号105的接收缓冲器125。D/A转换器135把所接收到的数字远端信号105转换成被应用到扬声器144的模拟信号。此外,由麦克风148生成的模拟近端语音信号150被A/D转换器140转换成数字信号,其在通过网络传输之前被存储在发送缓冲器130中。这些缓冲器允许高效的信号编码和传输。声学回音160由终端180的扬声器144与麦克风148之间的耦合引起。AES通常被认为不受控制D/A转换器135的采样时钟与控制A/D转换器140的采样时钟‘之间的采样率差异的影响。
[0021]为便于说明,在图1中未示出由AES100实现的公知舒适噪音插入和双端通话检测技术。同样地,为便于说明,网络设备170和终端设备180中的公知语音编解码器也未示出。
[0022]图2示出布置在终端200中的传统的基于终端的声学回音消除器(AEC)290。如图2中所示,终端200包括存储所接收到的远端信号205的接收缓冲器225。D/A转换器235把所接收到的数字远端信号205转换成被应用到扬声器244的模拟信号。此外,由麦克风248生成的模拟近端语音信号250被A/D转换器240转换成数字信号,其在通过网络(图2中未示出)传输之前被存 储在发送缓冲器230中。声学回音260由终端280的扬声器244与麦克风248之间的耦合以及墙壁反射引起。如前所述,AEC易受控制D/A转换器235的采样时钟与控制A/D转换器240的采样时钟fSM之间的采样率差异的影响。
[0023]如前所述,如图2中所示,为在具有采样时钟频率&^与采样时钟频率fSM之间的采样率差异的终端200中实现声学回音消除,利用重采样器285对近端语音信号250进行重
采样,从而使得结果采样率/&等于控制D/A转换器235的采样率fa。所述重采样是基于每
预定义时间间隔的接收缓冲器读取指针增量270与发送缓冲器写入指针增量280之间的差异。由于网络装备无法访问这些指针,因此这一重采样方法只能在终端200 (而不是网络)中实现。由于终端(特别是PC上的IP软件电话)很少以这种方式处理回音,因此仍然需要基于网络的回音处理。
[0024]关于AEC290的更加详细的讨论,例如参见S.Haykin的“Adaptive Filter Theory(自适应滤波器理论)”,Prentice Hall出版社(2011年),在此通过引用并入本文。通常,AEC290按照众所周知的方式对远端语音信号205进行自适应滤波以便镜像回音路径,并且从近端语音信号250中减去经过滤波的信号,即所估计的回音。
[0025]图3示出布置在终端300中的采用根据本发明的时钟偏斜补偿技术的基于终端的声学回音消除器(AEC)390。正如后面所讨论的那样,本发明的一个方面基于所插入的音调实施重采样。所插入的音调可选地可以是被掩盖音调。为便于说明,图中省略了接收缓冲器和发送缓冲器。
[0026]如图3中所示,具有频率fT_的音调,由下面进一步结合图4讨论的音调插入块400生成。当开关SI和S2处于‘适配’(adapt)位置时,远端语音信号305和所插入的音调被传递到D/A转换器335,且随后被应用到扬声器344,随后被麦克风348拾取。通常,所插入的音调将由于采样频率与采样频率fSM之间的时钟偏斜而发生频率偏移。为了估计所述频率偏移(或频率比值),偏移音调由带通滤波器350进行滤波并且在频率比值计算块360中进一步被分析。带通滤波器350利用具有中心频率等于由频率选择器355生成的音调频率ftone的窄带对偏移音调进行滤波。块355开始于预设频率。如果带通滤波器350的输出水平低于期望阈值,例如,由于扬声器-封闭环境-麦克风系统(即扬声器、房间和麦克风的组合频率响应)的频率响应的陷波,则频率选择块355改变到另一个预设频率。相应地,音调插入块400生成具有该新频率的音调。频率选择355可以循环经过若干预设频率,直到带通滤波器350的输出信号的水平要求得到满足为止。频率比值计算块360确定经过滤波的音调的频率偏移量,并计算相应的重采样比R,其被存储在块365中。重采样
块385对近端信号350进行重采样,使得结果采样频率/皿等于控制D/A转换器335的采
样频率fSL。重采样技术是众所周知的,例如参见T.1.Laakso等人的“Splitting the Unit
Delay - Tools for Fractional Delay Filter Design(分解单位延迟-用于分数延迟滤
波器设计的工具)”,IEEE信号处理期刊(IEEE Signal Process.Magazine) (1996年I月),在此通过引用并入本文。
[0027]如上所述,可以从例如1-2秒的预定评估时间TA中的循环数目导出简单的频率比值算法。重采样器385的期望重采样比由R=fSL/fSM给出。因关于两个音调频率的循环周期可以被标记为TSL=l/fSL和TSM=l/fSM,因此评估周期中的循环数目可以被表示为NSL=TA/TSL和NSM=TA/TSM。由于TSL是已知的,可以精确地计算出NSL。与此相对,必须从信号估计NSM。例如,NSM的估计可以通过对评估间隔TA内的正过零点(positive zerocrossing)次数进行计数来实现。利用该循环数目(其等于正过零点的次数),重采样比可以被确定为R=NSL/NSM。若分数采样单位被计算(也就是说如果两个音调信号被过采样),确定R时的精度可被提高。
[0028]适配控制308使用远端语音305和经过重采样的近端语音388 (或具有原始采样率的近端语音342)来确定远端通话者、近端通话者或者二者(所谓的两端通话)是否正在通话。该检测对于声学回音消除的适配也是必要的(未示出),因此可以从AEC控制导出。近端通话者沉默(即近端通话者未在讲话)的条件必须被满足,以将开关SI和S2设置到“适配”位置。如果近端通话者正在讲话,则适配控制将开关SI和S2设定到‘冻结’(freeze)位置,这意味着没有音调被发送到近端扬声器并且频率比值未被更新,但是存储在365中的先前确定的频率被使用。
[0029]如果呼叫持续时间有限并且终端(更具体来说是决定采样率的石英)的温度波动有限,仅在呼叫或会话的起始处执行频率比值计算的适配可能就足够了。换句话说,仅在可能只持续1-2秒的呼叫建立规程中通过频率比值计算块360运行重采样比的适配可能就足够了。也就是说,开关SI和S2仅在很短的建立间隔期间处于‘适配’位置,而对于呼叫的其余部分,开关SI和S2处于‘冻结’位置。
[0030]或者,可以例如每10分钟仅执行一次持续时间例如为1-2秒的适配。即使使用替换的更加简单的音调插入方法500,正如下面结合图5进一步讨论的那样,该等稀少的可听音调突发通常也会被呼叫参与者很好地容忍。
[0031]或者,当远端语音信号305包含高频带中的足够能量时,适配可仅在时间实例(time instance)期间被执行,例如在‘s’和‘f’之类的摩擦音素期间。高频带内的足够能量允许较高的音调水平,其反过来提高了频率比值计算块360的可靠性。通过对远端语音信号进行高通滤波,接着进行均方根(RMS)运算,随后进行阈值检测,可获得高频带内的足够能量的存在。 [0032]基于上述关于音调插入400和频率比值计算360的适配方法的任一项,获得关于开关SI和S2的共同控制信号。尽管共同控制信号用于开关SI和S2,关于S2的控制信号必须被延迟以考虑到信号从开关SI的输出到重采样器385的输入所经历的往返延迟。例如,延迟发生在D/A转换器335和A/D转换器340中,但也可能发生在终端300中未示出的其他信号处理块中。在后面讨论的网络实现中,额外延迟由网络传输以及音频编码器/解码器引起。可通过类似于传统线路回音消除器中的往返延迟估计技术通过例如相关性来估计往返延迟。在网络实现中,往返延迟可能随时间变化并且偏离所确定的标称往返延迟。在这种情况下,有必要在频率比值计算块360中检测所述音调的准确开头。
[0033]如前所述,按照类似于图2的方式,示例性AEC390自适应地对远端语音信号305进行滤波,并且从经过重采样的近端语音信号350中减去经过滤波的信号,以考虑回音路径的频率响应。
[0034]图4进一步详细示出图3的音调插入块400。如图4中所示,具有频率fTme的音调由音调生成器430生成,并且通过加法器被添加到远端语音信号405的版本中。在一示例性实现中,远端语音信号405可选地由陷波滤波器410滤波,其滤除语音信号405的具有所插入的音调的中心频率fT 的窄带。为了避免扬声器-封闭环境-麦克风(LEM,1udspeaker-enclosure-microphone)系统的频率响应中的潜在陷波,设定音调频率的能力是有用的。
[0035]此外,在一示例性实现中,基于语音信号确定音调频率的掩盖阈值420,使得所述音调正被语音(如同收听者所感知到的)掩盖。为此,音调频率处的掩盖阈值由语音信号计算得出。例如参见 H.Fastle 和 E.Zwicker 的“Psychoacoustics:Facts and Models (心理声学:事实和模型)”Springer (2006年)。通常,掩盖阈值420表明,对于给定频率fTme,音调变为不可听时的音调水平Lt_。音调水平Lt 被设定为不高于掩盖阈值420。如图4所示,音调生成器430的示例性输出与由掩盖阈值420计算的音调水平LTme相乘,并且被增加到陷波滤波器410的输出中,以生成包括所掩盖的音调的远端语音信号450。可选的陷波滤波器410改进了频率比值计算块360 (图3)的性能,这是因为在音调频率附近不存在语音频率分量的情况下更容易识别出所插入的音调。
[0036]例如,频率fT 可以是高音频率(fs/4〈fT_〈fs/2),其中fs是采样频率。对于具有16kHz的采样频率的宽带语音信号,音调频率可以被设置为6kHz。该高音调频率的优点在于,可以通过简单的低复杂度时域算法准确地检测出频率偏移量。例如,预定义时间间隔(近似地,例如大约1-2秒)内的音调循环的数目可通过检测信号的过零点(zerocrossings)来计算。但是,音调频率越高,将被语音信号掩盖的音调就越少。随着语音进展经过不同的音素,掩盖阈值将持续变化。例如,考虑单词‘so’。摩擦音‘s’在6kHz的音调频率附近具有大量能量,从而导致在该音调频率处具有较高掩盖阈值。与此相对,所发出的元音‘o’的大多数能量处于较低频率中,从而导致在该音调频率处具有低掩盖阈值。
[0037]通常,期望较高的掩盖阈值,这是因为其允许注入较高音调水平,其反过来提升频率比值计算的精度和鲁棒性。换句话说,频率比值估计的鲁棒性和精度取决于信噪比(SNR,signal-to-noise ratio)。SNR随音调水平的增加而成比例增加。然而,频率比值计算的精度不仅由音调水平决定,而且还由近端语音检测的可靠性决定。对于近端语音沉默周期的错误检测可导致频率比值计算算法适配的激活(而不是冻结,即不更新该比值)。对于频率比值计算,近端语音被认为是噪音。因此,近端语音沉默的错误检测降低SNR。
[0038]图5描述一种基本的音调插入方法。其可以工作在两种模式。当开关S3处于位置0时,在适配时间间隔期间语音被音调替代。当开关S3处于位置I时,音调被添加到远端语音信号505。类似于音调插入块400,音调插入块500通过音调生成器530产生音调。音调水平被设置为固定水平,其可选地仅取决于远端语音的水平和/或近端语音的水平。
[0039]为防止溢出,远端语音信号505可被限制幅度或者通过小于I的因数进行缩放,其中必须均对两条信号路径306和307 (图3所示)应用该溢出防止,以避免当开关SI的位置改变时,幅度改变。当例如在48kHz使用专业的音频传送时,音调也可被变为不可听,若该音调被设定在高于或等于大约19kHz的频率。在这种情况下,音调不必再由语音信号掩盖,因为其频率超出了人类听觉系统所能感知的最大频率。
[0040]图6示出布置在网络设备670中的采用根据本发明的时钟偏斜补偿技术的基于网络的声学回音消除器(AEC)690。正如后面所讨论的那样,本发明的一个方面基于所插入音调实施重采样的网络实现。所插入音调的水平可以可选地被控制使得所述音调被语音掩盖,或者所插入音调的水平可被设置为固定数值。为便于说明,图中省略了接收缓冲器和发送缓冲器。
[0041]如图6中所示,具有频率fT_的音调由前面结合图4讨论的音调插入块400生成。当开关SI和S2处于适配位置时,音调在网络670中由音频编码器610传输并且随后在终端680处由解码器620解码。按照类似于图1-3的方式,D/A转换器635将具有被掩盖音调的所接收到的已解码数字远端信号转换成被应用到扬声器644的模拟信号。此外,由麦克风648生成的模拟近端语音信号650被A/D转换器640转换成数字信号,其在终端680中由编码器625编码并且随后在网络设备670中由解码器615解码。声学回音660由从终端680的扬声器644到麦克风648的直接声音和反射声音引起。
[0042]通常,所插入的音调将由于采样时钟与采样时钟fSM之间的时钟偏斜而发生频率偏移。通过带通滤波器650对偏移音调进行滤波并且在频率比值计算块660中对其进行进一步分析。带通滤波器650利用以由频率选择器655生成的原始音调频率fTme为中心的窄带对偏移音调进行滤波。频率比值计算块660确定原始音调与经过滤波的音调之间的频率比值R=fa/fSM。该比值为以类似于图3的基于终端的实现方式,将被用在重采样器中的期望重采样比。此外,重采样比被存储在块665中。重采样块685对近端信号650进行重
采样,使得所得到的采样率/?等于控制D/A转换器335的采样率fa。[0043]如前所述,示例性的AEC690自适应地对远端语音信号605进行滤波并且从经过重采样的近端语音信号650中减去所述经过滤波的信号,以考虑到回音路径,其方式类似于图2和3。
[0044]对于图6的基于网络的实现,音调水平Ltone被设定成使得该音调不会通过音频编码/解码处理610、620而丢失。对于低比特率音频/语音编解码器,所导出的音调水平Ltone可以使得音调是可听的,或者可能必须提高音调水平以令其通过编码/解码处理。或者,可同时生成不同频率的多个音调以确保传输。由于音调的较短持续时间(近似地,例如大约1-2秒),略微可听的音调是可接受的。对于例如PCM (脉冲代码调制,pulse codemodulation)编码/解码,可完全应用音调掩盖,从而使得音调不可听。
[0045]多音调方法具有另外两个好处。首先,在LEM频率响应中的音调频率处存在陷波的情况下不需要循环经过不同频率,这意味着只需要一个评估间隔TA而不是多个间隔。换句话说,多音调解决方案可能会在更短时间内适配。多音调解决方案的第二个优点在于,在特定音调频率处的掩盖阈值对于可靠的频率比值计算可能不够高,而在另一音调频率下,掩盖阈值可能足够高。可以按照类似于图4和5的单音调的方式生成多音调,对于本领域普通技术人员将是显而易见的。
[0046]如前所述,在此所描述的时钟偏斜补偿系统的装置提供了相对于传统装置的若干优点。如前所述,所公开的用于实现时钟偏斜补偿的技术允许有效地应用声学回音消除。同样,所公开的时钟偏斜补偿技术可以在终端或网络中实现。
[0047]再次应当强调的是,本发明的上述实施例仅旨在是说明性的。一般来说,如同对于本领域普通技术人员将是显而易见的那样,示例性时钟偏斜补偿技术可被修改以插入音调并且从而确定重采样频率。此外,所公开的用于时钟偏斜补偿的技术可被应用在可能遭遇声学回音的任何终端或网络环境中。
[0048]虽然如同对于本领域普通技术人员将是显而易见的那样,关于数字逻辑块描述了本发明的示例性实施例,各项功能可以在数字域内被实施为软件程序中的处理步骤,通过电路元件或状态机用硬件实施,或者通过软件与硬件的组合来实施。该软件可以被应用在例如数字信号处理器、专用集成电路、微控制器或通用计算机中。这样的硬件和软件可以被实施在集成电路内实现的电路中。
[0049]因此,本发明的功能能够以方法及用于实践这些方法的设备的形式来体现。本发明的一个或多个方面可以,例如是否被存储在存储介质中、被机器加载和/或由机器执行、或者在某些传输介质之上传输的程序代码形式来体现,其中当所述程序代码被加载到例如计算机之类的机器中并且由其执行时,该机器就成为用于实践本发明的设备。当在通用处理器上实现时,各个程序代码段与处理器组合以提供运行类似特定逻辑电路的设备。本发明还可在一个或多个集成电路、数字信号处理器、微处理器和微控制器中实现。
[0050]应当理解的是,在此所示出及描述的各个实施例和变型仅仅是为了说明本发明的原理,并且在不背离本发明的范围和精神的情况下可由本领域技术人员实现各种修改。
【权利要求】
1.一种用于语音信号中声学回音消除的方法,包括: 在所述语音信号中插入至少一个音调,其中所述至少一个音调对于收听者基本上是不可听的; 根据所述至少一个音调的频率偏移确定两个采样时钟之间的时钟偏斜; 根据所述确定的时钟偏斜对所述语音信号进行重采样;以及 利用所述重采样的语音信号执行所述声学回音消除。
2.权利要求1所述的方法,其中,所述方法在一个或多个终端设备和网络设备中实现。
3.权利要求1所述的方法,其中,所述至少一个音调包括一个或多个高音音调和具有对于收听者是不可听的频率的音调。
4.权利要求1所述的方法,还包括控制所述至少一个音调的水平使得所述至少一个音调被所述语音信号掩盖的步骤。
5.权利要求1所述的方法,其中,所述至少一个音调包括多个音调。
6.权利要求1所述的方法,其中,所述至少一个音调的水平被从语音信号导出的掩盖阈值控制。
7.一种用于消除语音信号中声学回音的设备,包括: 音调生成器,用于在所述语音信号中插入至少一个音调,其中所述至少一个音调对于收听者基本上是不可听的;以及 偏移量计算电路,用于根据所述至少一个音调的频率偏移确定两个采样时钟之间的时钟偏斜; 重采样电路,用于根据所述确定的时钟偏斜对所述语音信号进行重采样;以及 利用所述重采样的语音信号消除所述声学回音的声学回音消除器。
8.权利要求7所述的设备,还包括用于对包括所述至少一个音调的频带进行滤波的至少一个带通滤波器。
9.权利要求7所述的设备,还包括用于滤除所述语音信号中的对应于所述至少一个音调的频带的至少一个陷波滤波器。
10.权利要求7所述的设备,其中,所述音调生成器控制所述至少一个音调的水平,使得所述至少一个音调被所述语音信号掩盖。
【文档编号】H04M9/08GK103748865SQ201280040127
【公开日】2014年4月23日 申请日期:2012年8月1日 优先权日:2011年8月17日
【发明者】沃尔特·埃特尔 申请人:阿尔卡特朗讯
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1