应用于楼宇对讲系统的消除回声方法及装置与流程

文档序号:11960808阅读:1339来源:国知局
应用于楼宇对讲系统的消除回声方法及装置与流程

本发明属于语音通信技术领域,具体涉及一种可以应用于楼宇对讲系统的消除回声方法及装置。



背景技术:

目前,楼宇对讲行业很多公司解决回声消除问题主要是在自适应回声消除的基础上研发出回声消除设备;但一方面因为每个系统都有其不同的一些特点,回声消除效果无法得到保证,另一方面,现有产品基本是采用硬件实现的方式,无形增加了整个系统的使用成本。因此,针对楼宇对讲行业这个现状,通过软件方法实现回声消除,在不增加任何硬件成本的基本上,大大增加系统的扩展性和实用性。

目前最常用的WebRTC(Web Real-Time Communication,网页实时通信)回声消除算法存在如下缺点:1)延时要小,因为算法默认滤波器长度是分为12块,每块64点,按照8000采样率,也就是12*8ms=96ms的数据,而且超过这个长度是处理不了的;2)延时抖动要小,因为算法是默认10块也计算一次参考数据的位置(即滤波器能量最大的那一块),所以如果抖动很大的话找参考数据时不准确的,这样回声无法消除了。



技术实现要素:

本发明的目的之一在于克服以上缺点,提供一种应用于楼宇对讲系统的消除回声方法,节省硬件成本,实现方式方便快捷,同时可解决现有技术要求信号延时小的限制。

为了解决上述技术问题,本发明提供了一种消除回声方法,包括以下步骤:

初始化消除回声处理参数;

接收参考回声音频数据;

将待处理音频数据与所述参考回声音频数据进行处理,得到消除回声后的音频数据。

本发明技术方案通过上述三步骤,就可简单快捷地实现消除回声效果,简化现有回声消除技术的繁琐步骤,同时不需要采用额外的硬件设备,降低了使用成本。

进一步地,所述消除回声处理参数包括:每次消除回声用的数据长度、延迟、噪音等级以及回声等级。

本发明技术方案通过延迟、噪音等级以及回声等级三个参数实现消声延迟时间控制,可以解决现有技术中要求输入信号延迟小的限制问题。

进一步地,所述将待处理音频数据与所述参考回声音频数据进行处理,得到消除回声后的音频数据,包括以下步骤:

根据参考回声音频数据计算回声延迟信号;所述回声延迟信号包含多个反射路径的回声延迟信号;

用待处理音频数据减去所述回声延迟信号,得到消除回声后的音频数据。

进一步地,所述根据参考回声音频数据计算回声延迟信号,包括以下步骤:

使用迭代方法计算代价函数中的加权系数,使得代价函数结果值最小;所述代价函数为:,其中,y(n)为待处理音频数据,e(n)为待处理音频数据去除回声之后的信号,x(n)、x(n-1)、x(n-2)…为回声延迟信号,a、b、c…为加权系数;

根据计算出的加权系数,计算出回声延迟信号。

进一步地,所述迭代方法为最小均方算法或归一化最小均方算法。

相应地,本发明还提供了一种消除回声装置,包括:

第一处理模块,用于初始化消除回声处理参数;

第二处理模块,用于接收参考回声音频数据;

第三处理模块,用于将待处理音频数据与所述参考回声音频数据进行处理,得到消除回声后的音频数据。

进一步地,所述第三处理模块包括:

第一处理单元,用于根据参考回声音频数据计算回声延迟信号;所述回声延迟信号包含多个反射路径的回声延迟信号;

第二处理单元,用于用待处理音频数据减去所述回声延迟信号,得到消除回声后的音频数据。

进一步地,所述第一处理单元包括:

第一处理构件,用于使用迭代方法计算代价函数中的加权系数,使得代价函数结果值最小;所述代价函数为:,其中,y(n)为待处理音频数据,e(n)为待处理音频数据去除回声之后的信号,x(n)、x(n-1)、x(n-2)…为回声延迟信号,a、b、c…为加权系数;

第二处理构件,用于根据计算出的加权系数,计算出回声延迟信号。

综上所述,本发明技术方案的有益效果有:

1.本发明技术方案通过上述三步骤,就可简单快捷地实现消除回声效果,简化现有回声消除技术的繁琐步骤,同时不需要采用额外的硬件设备,降低了使用成本。

2.本发明技术方案通过延迟、噪音等级以及回声等级三个参数实现消声延迟时间控制,可以解决现有技术中要求输入信号延迟小的限制问题。

附图说明

图1是本发明实施例的一种消除回声方法步骤流程图。

图2是本发明实施例的一种消除回声装置结构图。

图3是本发明实施例的一种第三处理模块结构图。

图4是本发明实施例的一种第一处理单元结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在远程会议系统、车载电话和语音IP技术中,往往出现语音质量较差的情况,其因素是多方面的,但最关键的因素之一是回声的影响,因此回声消除对提高话音传输质量至关重要。从通讯回音产生的原因看,可以分为声学回音(Acoustic Echo)和线路回音(Line Echo),相应的回声消除技术就叫声学回声消除(Acoustic Echo Cancellation,AEC)和线路回声消除(Line Echo Cancellation,LEC)。本发明的技术方案属于声学回声消除技术,声学回音是指在免提或者会议应用中,远端传送的声音通过近端的扬声器播放出来,再通过位于声音路径上的固体物体多次反射回近端麦克风,造成返回给远端的声音夹杂了回声,声学回声消除技术就是要在声音信号返回给远端之前,将这部分回音信号过滤。

如图1,是本发明实施例的一种消除回声方法步骤流程图,包括以下步骤:

步骤1,初始化消除回声处理参数;

需要初始化的消除回声处理参数包括:每次消除回声用的数据长度、延迟、噪音等级以及回声等级。其中,消除回声用的数据长度指的是待处理数据长度,如果长度过大会导致音频播放延迟,如果太小又会导致消的不干净,在优选的实施例中,可设置为160字节;延迟设置,在优选的实施例中,可设置为320毫秒,该项可以根据实际消声效果去做调整;噪音等级,在优选的实施例中,可设置为-100,主要和应用场景有关;回声等级,在优选的实施例中,可设置为-200。其中噪音等级和回声等级目前固定设置为-100和-200即可,不需要再做调整。

本发明技术方案通过延迟、噪音等级以及回声等级三个参数实现消声延迟时间控制,可以解决现有技术WebRTC算法中要求输入信号延迟小的限制问题。

步骤2,接收参考回声音频数据;

在声学回声的消除原理中,远端信号通过近端喇叭播放出来,再通过位于声音路径上的固体物体多次反射回近端麦克风,形成了回音。它是远端信号在许多个不同声音路径上反射后的汇总,不同于远端信号,但是它和远端信号是高度相关的,所以想要计算出回音信号,就必须用远端信号作为参考回音音频数据。

在具体的实施例中,通常在接收到远端信号后,需要先进行解码操作,将解码后得到的音频信号,作为参考回音音频数据。

步骤3,将待处理音频数据与所述参考回声音频数据进行处理,得到消除回声后的音频数据。其中,待处理音频数据与所述参考回声音频数据进行处理,包括以下步骤:

步骤301,根据参考回声音频数据计算回声延迟信号;所述回声延迟信号包含多个反射路径的回声延迟信号;

本发明的技术方案中,消除回声之后的信号并不是简单地将近端待处理音频数据减去参考回音音频数据,而是近端待处理音频数据减去参考回音音频数据的回声延迟信号,而且这里的回声延迟信号,不是某一个特定的延迟,而是多个不同的延迟的汇总,因为参考回音音频数据从喇叭播放出来后,可以经过多条不同的反射路径,再返回麦克风。

因为参考回声音频数据与回声延迟信号之间存在高度相关,只要找到二者之间的关系,就可以通过参考回声音频数据计算出回声延迟信号。本发明技术方案中,假设每一个延迟都存在,以离散时间信号为例,可以得到如下公式:

y(n)=m(n)+a*x(n)+b*x(n-1)+c*x(n-2)+...其中,x(n),x(n-1),x(n-2)…是参考回声音频数据在不同反射路径的回音延迟信号,它们的汇总即为需要消除的回声信号,y(n)是近端麦克风采集的待处理音频数据信号,m(n)是将待处理音频数据信号消除了回声之后的信号,a,b,c等表示加权系数,加权系数和环境有关,不同人、音箱和话筒位置,房间的构造都会造成加权系数值的不同。在一个特点的环境中,只要能够求出a,b,c等加权系数,就能够计算出回声延迟信号。

本发明的技术方案中,计算加权系数的方法如下:使用迭代方法计算代价函数中的加权系数,使得代价函数结果值最小;所述代价函数为:,其中,y(n)为待处理音频数据,e(n)为待处理音频数据去除回声之后的信号,x(n)、x(n-1)、x(n-2)…为回声延迟信号,a、b、c…为加权系数。这个代价函数和加权系数有关系,可以用来描述去除回声的效果,如果算出的值小,那么说明我们当前的a,b,c等的取值还行,去回声效果好;算出来值大,表示我们当前的a,b,c等的取值不好,去回声效果不好,如果a,b,c等的取值正好合适,使得e(n)最小的时候,那么e(n)=m(n)。

另外,上述提到的迭代方法可以为LMS(Least mean square,最小均方算法)或NLMS(normalized least mean square,归一化最小均方算法)。

根据计算出的加权系数,通过上述公式计算出回声延迟信号。

步骤302,用待处理音频数据减去上述步骤计算出的回声延迟信号,得到消除回声后的音频数据。

本发明技术方案通过上述三步骤,就可简单快捷地实现消除回声效果,同时不需要采用额外的硬件设备,降低了使用成本。

下面以一具体实施例详细说明本发明的消除回声方法。本实施例场景为网络语音对讲,该实施例应用本发明的消除回声方法步骤如下:

步骤1,初始化消除回声处理参数,其中,消除回声用的数据长度,设置为160;延迟设置,设置为320毫秒;噪音等级,设置为-100;回声等级,设置为-200。

步骤2,对讲一方通过网络收到对方发送的语音数据包,对接收到的音频数据进行解码处理,解码后的数据(speech1)一路送给扬声器播放,同时一路送给消回声接口作为参考回音音频数据;此时,本地麦克风采集的信号包括本端讲话(speech2),以及speech1通过扬声器播放后,经过多个声音路径反射回麦克风的回声信号汇总(speech3)。

步骤3,将麦克风采集的信号(speech3+speech2)与参考回音音频数据(speech1)进行处理,消除回声speech3,得到音频数据(speech2),再对speech2进行音频编码后发送给对方设备。

其中,麦克风采集的信号(speech3+speech2)与参考回音音频数据(speech1)进行处理,包括以下步骤:

步骤301,根据参考回声音频数据(speech1)计算回声延迟信号(speech3);

步骤302,用待处理音频数据(speech3+speech2)减去上述步骤计算出的回声延迟信号(speech3),得到消除回声后的音频数据(speech2)。

如图2,是本发明实施例的一种消除回声装置结构图,包括:

第一处理模块,用于初始化消除回声处理参数;需要初始化的消除回声处理参数包括:每次消除回声用的数据长度、延迟、噪音等级以及回声等级。

第二处理模块,用于接收参考回声音频数据;

第三处理模块,用于将待处理音频数据与所述参考回声音频数据进行处理,得到消除回声后的音频数据。

如图3,是本发明实施例的一种第三处理模块结构图,包括:

第一处理单元,用于根据参考回声音频数据计算回声延迟信号;所述回声延迟信号包含多个反射路径的回声延迟信号;

第二处理单元,用于用待处理音频数据减去所述回声延迟信号,得到消除回声后的音频数据。

如图4,是本发明实施例的一种第一处理单元结构图,包括:

第一处理构件,用于使用迭代方法计算代价函数中的加权系数,使得代价函数结果值最小;所述代价函数为:,其中,y(n)为待处理音频数据,e(n)为待处理音频数据去除回声之后的信号,x(n)、x(n-1)、x(n-2)…为回声延迟信号,a、b、c…为加权系数;

第二处理构件,用于根据计算出的加权系数,计算出回声延迟信号。

上述具体实施方式只是对本发明的技术方案进行详细解释,本发明并不只仅仅局限于上述实施例,凡是依据本发明原理的任何改进或替换,均应在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1