回声延迟估计方法及装置、存储介质、电子设备与流程

文档序号:15969934发布日期:2018-11-16 23:24阅读:390来源:国知局

本发明涉及语音处理领域,尤其涉及一种回声延迟估计方法及装置、存储介质、电子设备。

背景技术

在音频通讯系统中,因为信号反馈途径的存在,导致无法避免回声干扰。音频通讯系统中的回声包括电学回声和声学回声。电学回声是由阻抗失配产生的信号能量反射引起,声学回声是指在受话端由扬声器播出的声音被传声器拾取并传回给讲话端。声学回声具有多路径和时变的特点,经过信道延迟后传回被讲话者听到,会降低讲话端的音频清晰度,严重影响音频通讯的质量。

为去除回声对音频通讯的影响,20世纪60年代,贝尔实验室的sondhi提出采用自适应滤波方法实现回声抵消。然而,声回声抵消(acousticechocancellation,aec)对自适应滤波器的性能要求较为苛刻,自适应滤波器的设计面临着一系列的问题,这其中,长延迟对回声抵消的开销和性能有着最直接的影响。

回声的延迟是指输入信号经过一系列处理之后被延迟的时间,诸如经过数模转换、电学转换、声学回声、电学回声、声电转换、模数转换以及数据处理通路等处理后被延迟的时间,其中,数据处理通路会对数字音频信号进行组帧、解帧、增强处理等操作,会对回声信号产生几十毫秒乃至几百毫秒的延迟。若回声抵消系统所使用的自适应滤波器能够适应这么长时间的回声延迟,那么需要处理能力达数百毫秒长的自适应滤波器,所需的计算量以及存储量几何增加,而且会使得自适应滤波器收敛较慢且不稳定,回声抵消性能较差。

现有的回声抵消系统中,若数据链路的回声延迟严格稳定,则可以通过对参考信号延迟一个常数时间作为预处理,这样就可以使用较短的自适应滤波器。但若回声延迟不稳定,则需要能够实时估计回声延迟。现有的延迟估计方法的复杂度较高,且准确性较差。



技术实现要素:

本发明实施例解决的技术问题是如何提高回声延迟估计准确性的同时,降低复杂度。

为解决上述技术问题,本发明实施例提供一种回声延迟估计方法,包括:分别在回声信号和参考信号中,截取预设频段内的回声信号作为兴趣频段回声信号,并截取所述预设频段内的参考信号作为兴趣频段参考信号;所述预设频段为:所述回声信号的增益与所述参考信号的增益之差大于预设值的连续频段;分别对所述兴趣频段回声信号和所述兴趣频段参考信号进行降速率采样,得到降速率兴趣频段回声信号和降速率兴趣频段参考信号;采用所述降速率兴趣频段参考信号,对所述降速率兴趣频段回声信号进行延迟估计,得到回声延迟。

可选的,所述截取预设频段内的回声信号作为兴趣频段回声信号,并截取所述预设频段内的参考信号作为兴趣频段参考信号,包括:采用预设的带通滤波器,在所述回声信号中截取所述预设频段内的回声信号作为所述兴趣频段回声信号,在所述参考信号中截取所述预设频段内的参考信号作为所述兴趣频段参考信号;其中,所述预设频段的中心频率为fc,带宽为fω。

可选的,以截止频率为fω/2的低通滤波器为原型,经过向正半周调制的单边带调制得到所述带通滤波器。

可选的,所述带通滤波器的传递函数为:

其中,n为所述低通滤波器长度,hlp为所述低通滤波器的传递函数,为向量且fs为所述回声信号的采样频率。

可选的,以截止频率为fω/2的低通滤波器为原型,经过向负半周调制的单边带调制得到所述带通滤波器。

可选的,所述带通滤波器的传递函数为:

其中,n为所述低通滤波器长度,hlp为所述低通滤波器的传递函数,为向量且fs为所述回声信号的采样频率。

可选的,以截止频率为fω/2的低通滤波器为原型,经过双边带调制得到所述带通滤波器。

可选的,所述带通滤波器的传递函数为:

其中,n为所述低通滤波器长度,hlp为所述低通滤波器的传递函数,为向量且为向量且fs为所述回声信号的采样频率。

可选的,采用如下公式在所述回声信号中截取所述预设频段内的回声信号作为兴趣频段回声信号:其中,dbp(t)为所述兴趣频段回声信号,hbp为所述带通滤波器的传递函数,d(t)为所述回声信号,t为离散时间索引;采用如下公式在所述参考信号中截取所述预设频段内的参考信号作为兴趣频段参考信号:其中,xbp(t)为所述兴趣频段参考信号,x(t)为所述参考信号。

可选的,所述分别对所述兴趣频段回声信号和所述兴趣频段参考信号进行降速率采样,包括:采用如下公式对所述兴趣频段回声信号进行降速率采样:dbpd(td)=dbp(tdm);其中,dbpd(td)为所述降速率兴趣频段回声信号,td为降速率之后的离散时间索引,m为抽取因子,且1<m≤fs/fω/2,fs为所述回声信号的采样频率;采用如下公式对所述兴趣频段参考信号进行降速率采样:xbpd(td)=xbp(tdm);其中,xbpd(td)为所述降速率兴趣频段参考信号。

可选的,所述采用所述降速率兴趣频段参考信号对所述降速率兴趣频段回声信号进行延迟估计,得到回声延迟,包括:采用如下公式得到所述回声延迟的值:tld=mkmax;其中,tld为所述回声延迟的值,kmax满足:h(kmax)为子带冲激响应h(k)的最大绝对值,且h(k)在td时刻的值为:其中,为h(k)在td时刻的值,k为估计到的最大回声延迟数为km个采样。

本发明实施例还提供了一种回声延迟估计装置,包括:截取单元,用于分别在回声信号和参考信号中,截取预设频段内的回声信号作为兴趣频段回声信号,并截取预设频段内的参考信号作为兴趣频段参考信号;降速率采样单元,用于分别对所述兴趣频段回声信号和所述兴趣频段参考信号进行降速率采样,得到降速率兴趣频段回声信号和降速率兴趣频段参考信号;延迟估计单元,用于采用所述降速率兴趣频段回声信号,对所述降速率兴趣频段回声信号进行延迟估计,得到回声延迟。

可选的,所述截取单元,用于采用预设的带通滤波器,在所述回声信号中截取所述预设频段内的回声信号作为所述兴趣频段回声信号,在所述参考信号中截取所述预设频段内的参考信号作为所述兴趣频段参考信号;其中,所述预设频段的中心频率为fc,带宽为fω。

可选的,所述截取单元,用于采用如下公式在所述回声信号中截取所述预设频段内的回声信号作为兴趣频段回声信号:其中,dbp(t)为所述兴趣频段回声信号,hbp为所述带通滤波器的传递函数,d(t)为所述回声信号,t为离散时间索引;采用如下公式在所述参考信号中截取所述预设频段内的参考信号作为兴趣频段参考信号:其中,xbp(t)为所述兴趣频段参考信号,x(t)为所述参考信号。

可选的,所述降速率采样单元,用于采用如下公式对所述兴趣频段回声信号进行降速率采样:dbpd(td)=dbp(tdm);其中,dbpd(td)为所述降速率兴趣频段回声信号,td为降速率之后的离散时间索引,m为抽取因子,且1<m≤fs/fω/2,fs为所述回声信号的采样频率;采用如下公式对所述兴趣频段参考信号进行降速率采样:xbpd(td)=xbp(tdm);其中,xbpd(td)为所述降速率兴趣频段参考信号。

可选的,所述延迟估计单元,用于采用如下公式得到所述回声延迟的值:tld=mkmax;其中,tld为所述回声延迟的值,kmax满足:h(kmax)为子带冲激响应h(k)的最大绝对值,且h(k)在td时刻的值为:其中,为h(k)在td时刻的值,k为估计到的最大回声延迟数为km个采样。

本发明实施例提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述任一种所述的回声延迟估计方法的步骤。

本发明实施例提供了一种电子设备,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行上述任一种所述的回声延迟估计方法的步骤。

与现有技术相比,本发明实施例的技术方案具有以下有益效果:

在回声信号和参考信号中,分别截取预设频段内的回声信号和参考信号作为兴趣频段回声信号和兴趣频段参考信号,分别对兴趣频段回声信号和兴趣频段参考信号进行降速率采样,采用降速率兴趣频段参考信号对降速率兴趣频段回声信号进行延迟估计。由于只选取预设频段内的参考信号和回声信号,因此可以相应地选取长度较短的滤波器,故可以提高回声延迟估计的稳定性和准确性。并且,通过对兴趣频段参考信号和兴趣频段回声信号进行降速率采样,降低了回声延迟估计时的计算量,故降低了回声延迟估计的计算复杂度。

附图说明

图1是本发明实施例中的一种回声延迟估计方法的流程图;

图2是当通话设备处于手持通话模式时的回声信号与参考信号的示意图;

图3是当通话设备处于免提通话模式时的回声信号与参考信号的示意图;

图4是当通话设备处于蓝牙耳机通话模式时的回声信号与参考信号的示意图;

图5是本发明实施例中的一种低通滤波器的冲激响应示意图;

图6是本发明实施例中的一种低通滤波器的频率响应示意图;

图7是本发明实施例中的一种参考信号的波形图;

图8是本发明实施例中的一种回声信号的波形图;

图9是本发明实施例中的一种降采样兴趣频段参考信号的波形图;

图10是本发明实施例中的一种降采样兴趣频段回声信号的波形图;

图11是采用本发明实施例中提供的回升延迟估计方法得到的一种回声估计延迟的波形图;

图12是采用本发明实施例中提供的回声延迟估计方法得到的另一种回声估计延迟的波形图;

图13是本发明实施例中的一种回升延迟估计装置的结构示意图。

具体实施方式

回声的延迟是指输入信号经过一系列处理之后被延迟的时间,诸如经过数模转换、电学转换、声学回声、电学回声、声电转换、模数转换以及数据处理通路等处理后被延迟的时间。这其中,经过数模转换、电学换换、声学回路、电学回路、声电转换和模数转换的延迟时间均很短,总计数个毫秒。如果没有声学回路慢衰落的影响,回声抵消系统所采用的自适应滤波器只需要几十毫秒的处理能力即可。

回声延迟中,数据处理通路需要对数字音频信号进行组帧、解帧、增强处理等操作,会对回声信号产生几十毫秒乃至几百毫秒的延迟。同时,通讯系统会频繁切换连接方式,例如手机语音通讯中,可能会从手柄模式切换到扬声器模式、车载电话模式、蓝牙耳机模式、数字耳机模式等,不同的数据链路会产生不同的回声延迟。经实际测量,手机语音通讯中的回声延迟会从40ms剧变至250ms。

若回声抵消系统所使用的自适应滤波器能够适应这么长时间的回声延迟,那么需要处理能力为数百毫秒长的自适应滤波器,所需的计算量以及存储量大大增加,而且会使得自适应滤波器收敛较慢且不稳定,回声抵消性能较差。

现有的回声抵消系统中,若数据链路的回声延迟严格稳定,则可以对参考信号延迟一个常数时间作为预处理,这样就可以使用较短的自适应滤波器。但若回声延迟不稳定,则需要能够实时进行回声延迟估计。现有的延迟估计方法的复杂度较高。此外,在实际的回声抵消系统中,回声信号中会混入大量噪声,严重影响到回声延迟估计的稳定性,若回声延迟估计准确率较差,则可能会导致回声抵消系统的性能崩溃。

本发明实施例中,在回声信号和参考信号中,分别截取预设频段内的回声信号和参考信号作为兴趣频段回声信号和兴趣频段参考信号,分别对兴趣频段回声信号和兴趣频段参考信号进行降速率采样,采用降速率兴趣频段参考信号对降速率兴趣频段回声信号进行延迟估计。由于只选取预设频段内的参考信号和回声信号,因此可以选取长度较短的滤波器,故可以提高回声延迟估计的稳定性和准确性。通过对兴趣频段参考信号和兴趣频段回声信号进行降速率采样,降低了回声延迟估计时的计算量,故降低了回声延迟估计的计算复杂度。

为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。

参照图1,给出了本发明实施例中的一种回声延迟估计方法,以下通过具体步骤进行详细说明。

步骤s101,分别在回声信号和参考信号中,截取预设频段内的回声信号作为兴趣频段回声信号,并截取所述预设频段内的参考信号作为兴趣频段参考信号。

在本发明实施例中,预设频段可以为:回声信号的增益与参考信号的增益之差大于预设值的连续频段,也即在回声通路中增益较大而导致回声较大的频段。通常而言,预设频段可以视作为回声信号对参考信号的影响较大的连续频段。

在实际应用中可知,针对不同的通话设备,其对应的预设频段可能不同。针对同一通话设备,当其处于不同的通话模式时,其对应的预设频段也可能不同。因此,可以预先根据不同的通话设备以及其所处的不同的通话模式,来分别设定对应的预设频段。

参照图2~图4,分别给出了同一通话设备在不同的通话模式下的预设频段。

参照图2,给出了通话设备处于手持通话模式时的回声信号与参考信号的示意图。从图2中可以得知,在频段201,也即频率为2600hz~3200hz的频段中,回声信号的增益与参考信号的增益之差大于预设值,因此,可以将频率范围为2600hz~3200hz的频段,作为通话设备处于手持通话模式时的预设频段。

参照图3,给出了通话设备处于免提通话模式时的回声信号与参考信号的示意图。从图3中可以得知,在频段301,也即频率为2600hz~3400hz的频段中,回声信号的增益与参考信号的增益之差大于预设值,因此,可以将频率范围为2600hz~3400hz的频段作为通话设备处于免提通话模式时的预设频段。

参照图4,给出了通话设备处于蓝牙耳机通话模式时的回声信号与参考信号的示意图。从图4中可以得知,在频段401,也即频率为2800hz~3100hz的频段中,回声信号的增益与参考信号的增益之差大于预设值,因此,可以将频率范围为2800hz~3100hz的频段作为通话设备处于蓝牙耳机通话模式时的预设频段。

在具体实施中,可以采用预设的带通滤波器,在回声信号中截取预设频段内的回声信号作为兴趣频段回声信号,在参考信号中截取预设频段内的参考信号作为兴趣频段参考信号。可以设定预设频段的中心频率为fc,带宽为fω。

在实际应用中,可以预先设定不同的带通滤波器,带通滤波器与通话终端的通话模式一一对应,且带通滤波器的中心频率与带宽可以与预设频段相同,也即:带通滤波器的中心频率为fc,带宽为fω。

继续以图2~图4为例,通话设备中可以预先设定3个带通滤波器,带通滤波器1为通话终端处于手持通话模式时对应的带通滤波器,中心频率为2900hz,带宽为300hz;带通滤波器2为通话设备处于免提通话模式时对应的带通滤波器,中心频率为3000hz,带宽为400hz;带通滤波器3为通话设备处于蓝牙耳机通话模式时对应的带通滤波器,中心频率为2950hz,带宽为150hz。

在具体实施中,可以采用如下式(1)在回声信号中截取预设频段内的回声信号作为兴趣频段回声信号:

其中,dbp(t)为兴趣频段回声信号,hbp为带通滤波器的传递函数,d(t)为回声信号,t为离散时间索引。

可以采用如下式(2)在参考信号中截取预设频段内的参考信号作为兴趣频段参考信号:

其中,xbp(t)为兴趣频段参考信号,x(t)为参考信号。

在具体实施中,带通滤波器可以采用如下方式生成:以截至频率为fω/2的低通滤波器为原型,经过向正半周调制的单边带调制得到。所得到的带通滤波器的传递函数为:

其中,n为低通滤波器长度,hlp为低通滤波器的传递函数,为向量且fs为回声信号的采样频率。

在具体实施中,带通滤波器也可以采用如下方式生成:以截止频率为fω/2的低通滤波器为原型,经过向负半周调制的单边带调制得到。所得到的带通滤波器的传递函数为:

其中,n为低通滤波器长度,hlp为低通滤波器的传递函数,为向量且fs为回声信号的采样频率。

在具体实施中,带通滤波器还可以采用如下方式生成:以截止频率为fω/2的低通滤波器为原型,经过双边带调制得到。所得到的带通滤波器的传递函数为:

其中,n为低通滤波器长度,hlp为低通滤波器的传递函数,wfc为向量且为向量且fs为回声信号的采样频率。

步骤s102,分别对所述兴趣频段回声信号和所述兴趣频段参考信号进行降速率采样。

在具体实施中,对兴趣频段回声信号进行降速率采样,得到降速率兴趣频段回声信号。对兴趣频段参考信号进行降速率采样,得到降速率兴趣频段参考信号。

在实际应用中可知,降采样是降低特定信号的采样率的过程,通常用于降低数据传输速率或者数据大小。抽取因子m一般为大于1的整数或有理数,表示降采样之后的采样周期变成特定信号的采样周期的m倍,或者等价地表示为降采样之后的采样速率为特定信号的采样速率的1/m。

在具体应用中,可以根据实际的应用需求来设定抽取因子。例如,设定抽取因子m=5。又如,设定抽取因子m=8。

对上式(1)中的兴趣频段回声信号进行降速率采样,得到的降速率兴趣频段回声信号参照下式(3):

dbpd(td)=dbp(tdm);(3)

其中,dbpd(td)为降速率兴趣频段回声信号,td为降速率之后的离散时间索引,m为抽取因子,且1<m≤fs/fω/2。

对上式(2)中的兴趣频段参考信号进行降速率采样,得到的降速率兴趣频段参考信号参照下式(4):

xbpd(td)=xbp(tdm);(4)

其中,xbpd(td)为所述降速率兴趣频段参考信号。

步骤s103,采用降速率兴趣频段参考信号,对所述降速率兴趣频段回声信号进行延迟估计,得到回声延迟。

在具体实施中,可以采用信号处理理论中的自相关方法,根据降速率兴趣频段参考信号,对降速率兴趣频段回声信号进行延迟估计,得到回声延迟。也可以采用信号处理理论中的自适应滤波器方法,根据降速率兴趣频段参考信号,对降速率兴趣频段回声进行延迟估计,得到回声延迟。

可以理解的是,还可以采用其他的方法,来根据降速率兴趣频段参考信号,对降速率兴趣频段回声信号进行延迟估计,得到回声延迟,此处不做赘述。

下面以采用自适应滤波器方法为例进行说明。

采用如下公式(5)计算得到回声延迟的值为:

tld=mkmax;(5)其中,tld为所述回声延迟的值,kmax满足:h(kmax)为子带冲激响应h(k)的最大绝对值,且h(k)在td时刻的值为:

回声延迟估计得到的回声延迟与实际的回声延迟的误差值为:

其中,为h(k)在td时刻的值,k为估计到的最大回声延迟数为km个采样。

下面通过举例对本发明上述实施例中提供的回声延迟估计方法进行说明。

将一个截止频率为62.5hz的低通滤波器,通过双边带调制搬移到2875hz,生成带宽为125hz的带通滤波器。低通滤波器的冲激响应如图5所示,频率响应如图6所示。

参照图7,给出了一种参考信号的波形图。参照图8,给出了一种回声信号的波形图。

将参考信号经过带通滤波器进行滤波,得到兴趣频段参考信号。对兴趣频段参考信号进行m=32的降采样,得到降采样兴趣频段参考信号,降采样兴趣频段参考信号的波形图参照图9。

将回声信号经过带通滤波器进行滤波,得到兴趣频段回声信号。对兴趣频段回声信号进行m=32的降采样,得到降采样兴趣频段回声信号,降采样兴趣频段回声信号的波形图参照图10。

采用本发明上述实施例中提供的回声延迟估计方法,当通话设备处于蓝牙耳机通话模式下使用蓝牙耳机1时,得到的回声延迟估计的波形图如图11所示;当通话设备处于蓝牙耳机通话模式下使用蓝牙耳机2时,得到的回声延迟估计的波形图如图12所示。

从图11中可知,采用本发明上述实施例中提供的回声延迟估计方法,估计得到的回声延迟的值稳定在96ms。从图12中可知,采用本发明上述实施例中提供的回声延迟估计方法,估计得到的回声延迟的值稳定在188ms。

参照图13,给出了本发明实施例中的一种回声延迟估计装置130,包括:截取单元131、降速率采样单元132以及延迟估计单元133,其中:

截取单元131,用于分别在回声信号和参考信号中,截取预设频段内的回声信号作为兴趣频段回声信号,并截取预设频段内的参考信号作为兴趣频段参考信号;

降速率采样单元132,用于分别对所述兴趣频段回声信号和所述兴趣频段参考信号进行降速率采样,得到降速率兴趣频段回声信号和降速率兴趣频段参考信号;

延迟估计单元133,用于采用所述降速率兴趣频段回声信号,对所述降速率兴趣频段回声信号进行延迟估计,得到回声延迟。

在具体实施中,所述截取单元131,可以用于采用预设的带通滤波器,在所述回声信号中截取所述预设频段内的回声信号作为所述兴趣频段回声信号,在所述参考信号中截取所述预设频段内的参考信号作为所述兴趣频段参考信号;其中,所述预设频段的中心频率为fc,带宽为fω。

在具体实施中,所述截取单元131,可以用于采用如下公式在所述回声信号中截取所述预设频段内的回声信号作为兴趣频段回声信号:其中,dbp(t)为所述兴趣频段回声信号,hbp为所述带通滤波器的传递函数,d(t)为所述回声信号,t为离散时间索引;采用如下公式在所述参考信号中截取所述预设频段内的参考信号作为兴趣频段参考信号:其中,xbp(t)为所述兴趣频段参考信号,x(t)为所述参考信号。

在具体实施中,所述降速率采样单元132,可以用于采用如下公式对所述兴趣频段回声信号进行降速率采样:dbpd(td)=dbp(tdm);其中,dbpd(td)为所述降速率兴趣频段回声信号,td为降速率之后的离散时间索引,m为抽取因子,且1<m≤fs/fω/2,fs为所述回声信号的采样频率;采用如下公式对所述兴趣频段参考信号进行降速率采样:xbpd(td)=xbp(tdm);其中,xbpd(td)为所述降速率兴趣频段参考信号。

在具体实施中,所述延迟估计单元133,可以用于采用如下公式得到所述回声延迟的值:tld=mkmax;其中,tld为所述回声延迟的值,kmax满足:h(kmax)为子带冲激响应h(k)的最大绝对值,且h(k)在td时刻的值为:

其中,为h(k)在td时刻的值,k为估计到的最大回声延迟数为km个采样。

本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行本发明上述实施例中提供的回声延迟估计方法的步骤。

本发明实施例还提供了一种电子设备,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行本发明上述实施例中提供的回声延迟估计方法的步骤。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:rom、ram、磁盘或光盘等。

虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1