一种远程音频交互的多路声学回音消除方法及系统的制作方法

文档序号:2833054阅读:619来源:国知局
专利名称:一种远程音频交互的多路声学回音消除方法及系统的制作方法
技术领域
本发明涉及语音通信技术领域,尤其涉及ー种远程音频交互的多路声学回音消除方法及系统。
背景技术
目前远程音频互换的多种应用领域,包括数字视频会议,电话会议,手持終端等,其中的声学回音消除系统,其多数为单路音频回音处理,不能进行多路声学同时处理。一般处理多路回音消除吋,需采用分布式消除方式,即每路音频信号源端都放置一个回音消除 器,这样给用户成本和施工成本带来了很大的提高。并且,其回音消除的时间也不能有限的提高到500ms,回音消除能力很难大于IOOdB以上,对回音消除的音质不能得到有效保证。而实际中对于超大型会议音频应用领域需要以上三种技术參数全部能达到要求,才能满足高质量的语音通信。

发明内容
本发明实施例提供ー种远程音频交互的多路声学回音消除方法及系统,以较低成本消除多路声学回音,并提供高质量的语音通信。一方面,本发明实施例提供了ー种远程音频交互的多路声学回音消除方法,所述方法包括获取输入的多路音源声学信号;对输入的所述多路音源声学信号进行声学分离处理;分别对进行声学分离处理后的每一路声学信号通过自适应滤波器进行声学回音消除处理;将进行声学回音消除处理后的每一路声学信号进行组合并进行声学合成;将进行声学合成后的声学信号进行输出。优选的,在本发明ー实施例中,所述获取输入的多路音源声学信号可以包括对输入的多路音源声学信号进行滤波处理;将进行滤波处理后的音频信号进行音频模数转换;获取进行音频模数转换后的多路音源声学信号。优选的,在本发明ー实施例中,所述对输入的所述多路音源声学信号进行声学分离处理可以包括根据声学的频率对输入的所述多路音源声学信号进行声学分离处理。优选的,在本发明ー实施例中,所述根据声学的频率对输入的所述多路音源声学信号进行声学分离处理可以包括根据声学的频率对输入的所述多路音源声学信号进行ー次声学分离处理,然后根据预定时间内声学音频大小进行二次分离处理,井根据预定时间内声学间断进行三次分离处理。优选的,在本发明ー实施例中,所述分别对进行声学分离处理后的姆一路声学信号通过自适应滤波器进行声学回音消除处理可以包括分别对进行声学分离处理后的每ー路声学信号通过自适应滤波器模拟实际环境中的回音路径以预测回音信号,并从实际信号中减去预测到的回音信号,以进行声学回音消除处理。优选的,在本发明ー实施例中,所述分别对进行声学分离处理后的姆一路声学信号通过自适应滤波器进行声学回音消除处理可以包括在对进行声学分离处理后的每一路声学信号通过自适应滤波器进行声学回音消除处理过程中,利用双向通话检测器检测是否有话音信号加入,当检测到有话音信号时,暂时冻结所述自适应滤波器对其參数的更新处理行为。优选的,在本发明ー实施例中,所述分别对进行声学分离处理后的姆一路声学信号通过自适应滤波器进行声学回音消除处理后,还可以包括分别通过非线性处理器模块,利用非线性控制算法对进行声学回音消除处理后的每一路声学信号进行润色处理。
优选的,在本发明一实施例中,所述将进行声学合成后的声学信号进行输出可以包括将进行声学合成后的声学信号进行音频数模转换;对进行音频数模转换后的声学信号进行滤波处理;将进行滤波处理后的声学信号进行输出。另ー方面,本发明实施例提供了ー种远程音频交互的多路声学回音消除系统,所述系统包括DSP数字处理器模块,用于获取输入的多路音源声学信号;多路声学分离合成器,用于对输入的所述多路音源声学信号进行声学分离处理;自适应滤波器模块,用于分别对进行声学分离处理后的每一路声学信号通过自适应滤波器进行声学回音消除处理;所述多路声学分离合成器,还用于将进行声学回音消除处理后的每一路声学信号进行组合并进行声学合成;所述DSP数字处理器模块,还用于将进行声学合成后的声学信号进行输出。优选的,在本发明一实施例中,所述系统还可以包括本地声学输入模块,用于对输入的多路音源声学信号进行滤波处理;远程声学输入模块,用于对输入的多路音源声学信号进行滤波处理;音频模数/数模转换模块,用于将进行滤波处理后的音频信号进行音频模数转换;所述DSP数字处理器模块,用于获取进行音频模数转换后的多路音源声学信号。优选的,在本发明ー实施例中,所述多路声学分离合成器,进ー步可以用于根据声学的频率对输入的所述多路音源声学信号进行声学分离处理。优选的,在本发明ー实施例中,所述多路声学分离合成器,进ー步可以具体用于根据声学的频率对输入的所述多路音源声学信号进行一次声学分离处理,然后根据预定时间内声学音频大小进行二次分离处理,井根据预定时间内声学间断进行三次分离处理。优选的,在本发明ー实施例中,所述自适应滤波器模块,进一歩可以用于分别对进行声学分离处理后的每一路声学信号通过自适应滤波器模拟实际环境中的回音路径以预测回音信号,并从实际信号中减去预测到的回音信号,以进行声学回音消除处理。优选的,在本发明ー实施例中,所述系统还可以包括双向通话检测器模块,用于所述自适应滤波器模块在对进行声学分离处理后的每一路声学信号通过自适应滤波器进行声学回音消除处理过程中,利用双向通话检测器检测是否有来自远程声学输入模块的话音信号加入,当检测到有话音信号时,暂时冻结所述自适应滤波器对其參数的更新处理行为。优选的,在本发明ー实施例中,所述系统还可以包括非线性处理器模块,用于所述自适应滤波器模块分别对进行声学分离处理后的每一路声学信号通过自适应滤波器进行声学回音消除处理后,分别通过非线性处理器模块,利用非线性控制算法对进行声学回音消除处理后的每一路声学信号进行润色处理。优选的,在本发明ー实施例中,所述系统还可以包括所述音频模数/数模转换模块,还用于将进行声学合成后的声学信号进行音频数模转换;本地声学输出模块,用于对进行音频数模转换后的声学信号进行滤波处理;然后将进行滤波处理后的声学信号进行输出;远程声学输出模块,用于对进行音频数模转换后的声学信号进行滤波处理;然后将进行滤波处理后的声学信号进行输出。上述技术方案具有如下有益效果因为采用获取输入的多路音源声学信号;对输入的所述多路音源声学信号进行声学分离处理;分别对进行声学分离处理后的每一路声学信号通过自适应滤波器进行声学回音消除处理;将进行声学回音消除处理后的每一路声学信号进行组合并进行声学合成;将进行声学合成后的声学信号进行输出的技术手段,所以以较低成本消除了多路声学回音,并提供了高质量的语音通信。本发明实施例可应用于各种复杂远程音双向语音交互领域中,能将回音处理拖尾时间提高到500ms,声学带宽范围为20HZ至20KHZ,回音消除能力提高到大于100dB。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图I为本发明实施例ー种远程音频交互的多路声学回音消除方法流程图;图2为本发明实施例ー种远程音频交互的多路声学回音消除系统结构示意图;图3为本发明应用实例远程音频交互的多路声学回音消除系统结构示意图;图4为本发明应用实例DSP与SDRAM的连接原理示意图;图5为本发明应用实例声学回音消除基本原理示意图;图6为本发明应用实例自适应滤波器作用示意图;图7为本发明应用实例FIR自适应滤波器基本结构示意图;图8为本发明应用实例双向通话检测器系统意图;图9为本发明应用实例声学输入滤波器电路示意图;图10为本发明应用实例声学输出模块电路示意图;图11为本发明应用实例图3中的各个模块工作的推进流程图;图12为本发明应用实例图3中的DSP数字处理器处理流程图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明实施例要解决的技术问题是实现多路声学回音消除处理,回音消除时间提升到500ms,回音消除能力大于IOOdB。如图I所示,为本发明实施例ー种远程音频交互的多路声学回音消除方法流程图,所述方法包括 101、获取输入的多路音源声学信号;
优选的,所述获取输入的多路音源声学信号可以包括对输入的多路音源声学信号进行滤波处理;将进行滤波处理后的音频信号进行音频模数转换;获取进行音频模数转换后的多路音源声学信号。102、对输入的所述多路音源声学信号进行声学分离处理;优选的,所述对输入的所述多路音源声学信号进行声学分离处理可以包括根据声学的频率对输入的所述多路音源声学信号进行声学分离处理。优选的,所述根据声学的频率对输入的所述多路音源声学信号进行声学分离处理可以包括根据声学的频率对输入的所述多路音源声学信号进行一次声学分离处理,然后根据预定时间内声学音频大小进行二次分离处理,井根据预定时间内声学间断进行三次分离处理。103、分别对进行声学分离处理后的每一路声学信号通过自适应滤波器进行声学回音消除处理;优选的,所述分别对进行声学分离处理后的每一路声学信号通过自适应滤波器进 行声学回音消除处理可以包括分别对进行声学分离处理后的每一路声学信号通过自适应滤波器模拟实际环境中的回音路径以预测回音信号,并从实际信号中减去预测到的回音信号,以进行声学回音消除处理。优选的,所述分别对进行声学分离处理后的每一路声学信号通过自适应滤波器进行声学回音消除处理可以包括在对进行声学分离处理后的每一路声学信号通过自适应滤波器进行声学回音消除处理过程中,利用双向通话检测器检测是否有话音信号加入,当检测到有话音信号时,暂时冻结所述自适应滤波器对其參数的更新处理行为。优选的,所述分别对进行声学分离处理后的每一路声学信号通过自适应滤波器进行声学回音消除处理后,还可以包括分别通过非线性处理器模块,利用非线性控制算法对进行声学回音消除处理后的每一路声学信号进行润色处理。104、将进行声学回音消除处理后的每一路声学信号进行组合并进行声学合成;105、将进行声学合成后的声学信号进行输出。优选的,所述将进行声学合成后的声学信号进行输出可以包括将进行声学合成后的声学信号进行音频数模转换;对进行音频数模转换后的声学信号进行滤波处理;将进行滤波处理后的声学信号进行输出。本发明实施例上述方法技术方案具有如下有益效果因为采用获取输入的多路音源声学信号;对输入的所述多路音源声学信号进行声学分离处理;分别对进行声学分离处理后的每一路声学信号通过自适应滤波器进行声学回音消除处理;将进行声学回音消除处理后的每一路声学信号进行组合并进行声学合成;将进行声学合成后的声学信号进行输出的技术手段,所以以较低成本消除了多路声学回音,并提供了高质量的语音通信。本发明实施例可应用于各种复杂远程音双向语音交互领域中,能将回音处理拖尾时间提高到500ms,声学带宽范围为20HZ至20KHZ,回音消除能力提高到大于100dB。对应于上述方法实施例,如图2所示,为本发明实施例ー种远程音频交互的多路声学回音消除系统结构示意图,所述系统包括DSP数字处理器模块21,用于获取输入的多路音源声学信号;多路声学分离合成器22,用于对输入的所述多路音源声学信号进行声学分离处理;
自适应滤波器模块23,用于分别对进行声学分离处理后的每一路声学信号通过自适应滤波器进行声学回音消除处理;所述多路声学分离合成器22,还用于将进行声学回音消除处理后的每一路声学信号进行组合并进行声学合成;所述DSP数字处理器模块21,还用于将进行声学合成后的声学信号进行输出。如图3所示,为本发明应用实例远程音频交互的多路声学回音消除系统结构示意图,本发明应用实例依据硬件平台模块和硬件平台上算法模块接合完成,主要包括DSP数字处理器模块,音频AD/DA (模数/数模)转换模块,多路声学分离合成器,双向通话检测器模块,非线性处理器模块,自适应滤波器模块,本地声学输入模块,远程声学输入模块,本地 声学输出模块,远程学输出模块;其中,图3中的AD转换模块和DA转换模块都可以通过一音频AD/DA转换模块实现,可通过ー多路声学分离合成器完成多路声学分离和多路声学合成操作。优选的,本地声学输入模块,用于对输入的多路音源声学信号进行滤波处理;远程声学输入模块,用于对输入的多路音源声学信号进行滤波处理;音频模数/数模转换模块,用于将进行滤波处理后的音频信号进行音频模数转换;所述DSP数字处理器模块,用于获取进行音频模数转换后的多路音源声学信号。优选的,所述多路声学分离合成器,进ー步可以用于根据声学的频率对输入的所述多路音源声学信号进行声学分离处理。优选的,所述多路声学分离合成器,进ー步可以具体用于根据声学的频率对输入的所述多路音源声学信号进行一次声学分离处理,然后根据预定时间内声学音频大小进行二次分离处理,井根据预定时间内声学间断进行三次分离处理。优选的,所述自适应滤波器模块,进一歩可以用于分别对进行声学分离处理后的每一路声学信号通过自适应滤波器模拟实际环境中的回音路径以预测回音信号,并从实际信号中减去预测到的回音信号,以进行声学回音消除处理。优选的,双向通话检测器模块,用于所述自适应滤波器模块在对进行声学分离处理后的每一路声学信号通过自适应滤波器进行声学回音消除处理过程中,利用双向通话检测器检测是否有来自远程声学输入模块的话音信号加入,当检测到有话音信号吋,暂时冻结所述自适应滤波器对其參数的更新处理行为。优选的,非线性处理器模块,用于所述自适应滤波器模块分别对进行声学分离处理后的每一路声学信号通过自适应滤波器进行声学回音消除处理后,分别通过非线性处理器模块,利用非线性控制算法对进行声学回音消除处理后的每一路声学信号进行润色处理。优选的,所述音频模数/数模转换模块,还用于将进行声学合成后的声学信号进行音频数模转换;本地声学输出模块,用于对进行音频数模转换后的声学信号进行滤波处理;然后将进行滤波处理后的声学信号进行输出;远程声学输出模块,用于对进行音频数模转换后的声学信号进行滤波处理;然后将进行滤波处理后的声学信号进行输出。以下进行详细说明DSP数字处理器模块是32位的高速处理器,内存使用SDRAM 512M,以提高数量交换量。在DSP数字处理器模块上将设计双向通话检测器算法模块,自适滤波器算法模块和非线性处理器算法模块。本发明实施例对DSP数字处理器模块的选型需要考虑运算速度、成本、硬件资源以及算法的可移植性等多个问题。由于算法的浮点特性,本发明应用实例可采用了美国德州仪器(TI)的浮点DSP作为核心处理器来完成系统的设计,具有32位的外部存储器接ロ。与SDRAM等无缝连接,可以寻址512MB。图4为本发明应用实例DSP与SDRAM的连接原理示意图。多路声学分离合成器,为解决多路回音消除,本发明需先进行解决多路的问题,在多路声学输入端一般会有多路的原始音源和多路的回声音源混合在一起。而进行回音处理时必须以一路为主体完成回音消除,从而就必须解决将多路分离出来,再进行单路的回音消除处理,处理后再进行声学组合合成。在合成时将进一歩完成回音消除后的本地端声学输出和远程端声学输出,以达 到最終多路回音消除的目的。本声学分离器工作原理就是将多路声学分离开,在其分离的过程中,先必须完成AD转换,并送入DSP数字处理器模块。分离的原则最先以声学的频率为分离參数,第个人讲话的频率一定不相同,就算相同也一定不会同时,这里的同时指ns级时间。根据此原理,本发明先进行频率分离。将不同频率的声学进行一次分离。同时本发明为确保分离的正确性,根据一定时间内声学音频大小不同进行二次分离,根据一段时间内声学间断进行三次分离。二次,三次分离都是一次分离的辅助分离。同时,将回音消除后的与消除之前的进行对比,以验证经三次分离后的正确性。最后,经过分离的多路声学分别送到对应的下一处理单元模块中进行回音消除。每一路分别进行单路的回音消除处理后再进行声学组合合成。在合成时将进一歩完成回音消除后的本地端声学输出和远程端声学输出,以达到最終多路回音消除的目的。如图5所示,为本发明应用实例声学回音消除基本原理示意图。根据声学回音消除的基本原理,本发明应用实例可先构建ー个模型来模拟实际环境中的回音路径。依靠此模型准确地仿真回音路径,它的输出结果就是对实际回音信号的预测。从实际信号中减去预测到的回音信号,就消除了回音。本发明应用实例解决声学回音消除技术的方法就是用一个自适应滤波器(Adaptive Filter)来模拟回音路径。而自适应滤波器是本发明的回音消除核心技术。在图5中,H(X)可以看作是ー个函数,由实际环境所決定。这个函数的输入是音源信号X,输出是带有回音的混合信号y。自适应滤波器同样也是ー个函数及(X),它需要尽可能地接近H(X),在输入相同时,应产生差不多相同的输出。所谓“自适应”,是指函数的參数是可调的,它会不断地自我调整,使得当实际环境发生变化,H(x)发生改变时,片(X)总能够保持对H(X)的模拟。如图6所示,为本发明应用实例自适应滤波器作用示意图。自适应滤波器的原理很简单。比如常用的离散时间抽头有限脉冲响应(FIR-Finite Impulse Response)滤波器,采用过去一段时间信号的线性组合来表示未来的输出信号预测值
N-Iy(n) = ^ W1 (n)x(n - i)
i=0在上式中,n代表预测信号出现的时刻,N是自适应滤波器的阶次,W(l,…,
个可调參数。i指可调參数调整后的次数记录,这样的滤波器结构示意图如图7所示,其为本发明应用实例FIR自适应滤波器基本结构示意图。图7中,z—1代表滞后一歩的意思。滤波器的具体结构取决于N个可调參数Wtl,…,的取值。自适应滤波器能实时动态地改变这些參数的值,这些值常表示成滤波器的參数向量W (n) = [w0 (n) W1 (n) W2 (n)…Wh (n) ]T其中n代表离散时刻。如何调整这些參数的值由误差e(n)所決定。当预测信号和实际信号相同吋,e(n) =0,说明滤波器已经能够很好地模拟实际回音通路,所以不需要更新%,…,Wim的取值。当环境发生变化,回音通路改变时,或者回音消除系统刚开始运行吋,自适应滤波器就需要ー个适应过程,以调整參数向量W(n)直至合适。各种不同的自适应滤波算法的主要区别就是如何更新參数向量W(n)的方式不同。其中最基本的自适应滤波器的算法是LMS (Least Mean Square,最小均方差)算法。此方法的最大特点是计算复杂度低,且在平稳信号情况下具有可靠的收敛性。就是说,理论上已经证明,当原始信号为平稳随机信号时,基于LMS算法的自适应滤波器经过一段时间的运行后,其输出量能够渐近跟踪实际信号,误差e(n)将趋于零。LMS是最佳算法,平均回音衰减接近30dB,而计算复杂度却很低,可在DSP上编程 实现。双向通话检测器模块如果在回音消除的过程中突然出现话音信号,自适应滤波器的工作会受到新加入的话音信号的干扰,导致參数不正常地调整,严重的话会造成滤波器发散,输出信号混乱。所以需要双向通话检测器,检测是否有话音信号加入,当检测到有话音信号吋,就暂时冻结自适应滤波器对其參数的更新处理行为。如图8所示,为本发明应用实例双向通话检测器系统示意图。在本发明应用实例过程中对回音消除的过程中突然出现近端话音信号,自适应滤波器的工作会将受到新加入的近端话音信号的干扰,导致參数向量W(n)不正常地调整,严重的话会造成滤波器发散,就是W(n)波动很大,输出信号混乱。为解决此问题,本发明如图8设计了双向通话检测器,用于检测是否有近端话音信号加入。当检测到有近端话音信号时,就暂时冻结自适应滤波器对參数向量W(n)的更新行为。这样能使本发明完美解决滤波发散而引起的信号干扰问题。非线性处理器模块此模块主要对最終的输出信号进行润色处理,如消除噪音杂波,消除残余回音,添加背景效果等。以保证能输出高保真,高品质的音频信号。本发明应用实例中,在近端信号通道上加入了一个非线性处理器,就能采用非线性控制算法,就突发的环境变化做出调整,如背景中的关门声或用户拿电话的手突然做出什么手势或动作等。由于在主控制器下同时优化了不同控制算法,从而进一歩以降低回音和噪声,提高了音质。音频AD/DA (模数/数模)转换模块,此模块主要将输入的模拟音频信号转换成数字音频信号,采用16位的AD/DC转换模块,可保证音频最大不失真转换。本发明应用实例可选用的TI公司生产的ー款高性能的多媒体数字语音编解码器,它的内部ADC和DAC转换模块带有完整的数字滤波器,其数据传输宽度可以是16位、20位、24位和32位,采样频率范围为8 96kHz,并可通过控制接ロ来编辑该器件的控制寄存器,同时可支持SPI (SerialPeripheral Interface,串行外设接 ロ)和 H (Inter-Integrated Circuit,两线式串行总线)两种控制模式。本发明应用实例选用I2C模式。当系统进行初始化配置吋,DSP通过I2C总线将配置命令发送到音频AD/DA (模数/数模)转换芯片,并在配置完成后开始エ作。输入语音信号时,音频AD/DA (模数/数摸)转换芯片先通过其中的AD转换采集输入的语音信号,每采集完ー个信号便将数据发送到DSP的数字接口上,以便DSP可以读取语音数据。每个数据均为16位无符号整数,左右通道各有ー个数值。语音信号输出时,可由DSP将语音数据通过McBSP (Multichannel Buffered Serial Port,多通道缓冲串行ロ)接ロ发送给音频AD/DA (模数/数模)转换芯片,再由音频AD/DA (模数/数模)转换芯片的DA器件将他们变成模拟信号输出。本地声学输入模块此模块主要包括本地端输入音频滤波电路对本地端声学音源进行滤波处理。并将处理后的音频信号送入音频AD/DA转换模块。如图9所示,为本发明应用实例声学输入滤波器电路示意图,本模块在发明应用实例时,主要由模拟音频滤波电路与本地端用户输入接ロ组成,如图9所示,模拟音频信号经过本地端用户输入接ロ,经音频噪声滤波器后,将背景噪声进行滤除处理,使输入到音频AD/DA转换模块的音质更 好得到保证。音频滤波电路采购IT公司专用噪声滤波芯片进行处理,能有效将20KHZ以外的音频噪声进行滤除。远程声学输入模块,此模块主要包括远程端输入音频滤波电路对远程端声学音频进行滤波处理。并将处理后的音频信号送入AD/DA音频模数/数模转换模块。本模块在发明应用实例中,主要由模拟音频滤波电路与远程端用户输入接ロ组成,如图9所示,远程端模拟音频信号经过远程端用户输入接ロ,经音频滤波器后,将背噪声进行滤除处理,使输入到音频AD/DA转换模块的音质更好得到保证。音频滤波电路采购IT公司专用噪声滤波芯片进行处理,能有效将20KHZ以外的音频噪声进行滤除。本地声学输出模块,将音频AD/DA转换模块输出后的本地端音频输出进行滤波处理,并最终输出到本地用户端输出处理。如图10所示,为本发明应用实例声学输出模块电路示意图,本发明应用实例中,对于本地声学输出模块,如图10,使用了一个滤波器,采用了两个电感和三个电容器件,组成桥接式负载输出。本滤波器主要作为电感,在电压交换时使用输出电流保持ー不致,減少了低状态功能或无输入信号时的功耗。同时本电路在为整个发明节约了成本,但通过全面了解其原理,高精度调整电感,电容器件參考,能达到输出调整灵活,质量保证高。远程声学输出模块,将音频AD/DA转换模块输出后的远程端音频输出进行滤波处理,并最终输出到远程端输入处理。在本发明应用实例中,对于远程声学输出模块,同样也采用了如图10的负载输出电路,以达到相同的音频输出效果。如图11所示,为本发明应用实例图3中的各个模块工作的推进流程图,本地端多路声学输入依次进入噪声滤波器,AD转换模块,多路声学分离合成器,自适应滤波器模块,非线性处理器模块,多路声学分离合成器,DA转换模块,LC滤波器,本地端声学输出模块和远程端声学输出模块进行处理;其中,在自适应滤波器模块进行回音消除过程中,双向通话检测器模块检测是否有来自远程声学输入模块的语音信号,当检测到有话音信号时,暂时冻结所述自适应滤波器对其參数的更新处理行为。如图12所示,为本发明应用实例图3中的DSP数字处理器处理流程图开始时,初始化初如化音频AD/DA转换模块,然后分别启动自适应滤波器模块,双向通话检测器模块,非线性处理器模块,多路声学分离合成器,判断是否有声学输入如果有,则进行多路声学分离,否则,继续判断。随后进行路数选择,分为I路、2路、3路,随后通过自适应滤波器模块,非线性处理器模块,多路声学分离合成器进行处理直至事件处理结束进行输出,然后重新检测是否有新的声学输入;其中,在自适应滤波器模块进行回音消除过程中,双向通话检测器模块检测是否有来自远程声学输入模块的语音信号,当检测到有话音信号吋,暂时冻结所述自适应滤波器对其參数的更新处理行为。在本发明应用实例中,使用更先进的回音处理算法和选择高速浮点数字信号处理器,针对现有技术进行有效果的改进,设计出更方面,综合,高效,音质高保真的声学回音消除处理系统。本发明ー种用于远程音频交互吋,对多路声学回音进行消除的数字音频处理系统。通过以DSP数字处理器为硬件核心平台,包括AD/DA音频模数/数模转换模块,多路声学分离器,双向通话检测器,非线性处理器,自适应滤波器,本地声学输入模块,远程声学输入模块,本地声学输出模块,远程学输出模块。本发明采用多引擎回音路径,高速浮点数字信号处理器为算法和硬件基础,可应用于各种复杂远程音双向语音交互领域中,能将回音处理拖尾时间提高到500ms,声学带宽范围为20HZ至20KHZ,回音消除能力提高到大于 IOOdB。本领域技术人员还可以了解到本发明实施例列出的各种说明性逻辑块(illustrative logical block),单元,和步骤可以通过电子硬件、电脑软件,或两者的结合进行实现。为清楚展示硬件和软件的可替换性(interchangeability),上述的各种说明性部件(illustrative components),单元和步骤已经通用地描述了它们的功能。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用,可以使用各种方法实现所述的功能,但这种实现不应被理解为超出本发明实施例保护的范围。本发明实施例中所描述的各种说明性的逻辑块,或単元都可以通过通用处理器,数字信号处理器,专用集成电路(ASIC),现场可编程门阵列(FPGA)或其它可编程逻辑装置,离散门或晶体管逻辑,离散硬件部件,或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器,可选地,该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算装置的组合来实现,例如数字信号处理器和微处理器,多个微处理器,一个或多个微处理器联合一个数字信号处理器核,或任何其它类似的配置来实现。本发明实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件模块、或者这两者的结合。软件模块可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、⑶-ROM或本领域中其它任意形式的存储媒介中。示例性地,存储媒介可以与处理器连接,以使得处理器可以从存储媒介中读取信息,并可以向存储媒介存写信息。可选地,存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于ASIC中,ASIC可以设置于用户終端中。可选地,处理器和存储媒介也可以设置于用户终端中的不同的部件中。在一个或多个示例性的设计中,本发明实施例所描述的上述功能可以在硬件、软件、固件或这三者的任意组合来实现。如果在软件中实现,这些功能可以存储与电脑可读的媒介上,或以ー个或多个指令或代码形式传输于电脑可读的媒介上。电脑可读媒介包括电脑存储媒介和便于使得让电脑程序从ー个地方转移到其它地方的通信媒介。存储媒介可以是任何通用或特殊电脑可以接入访问的可用媒体。例如,这样的电脑可读媒体可以包括但不限于RAM、ROM、EEPR0M、CD-ROM或其它光盘存储、磁盘存储或其它磁性存储装置,或其它任何可以用于承载或存储以指令或数据结构和其它可被通用或特殊电脑、或通用或特殊处理器读取形式的程序代码的媒介。此外,任何连接都可以被适当地定义为电脑可读媒介,例如,如果软件是从ー个网站站点、服务器或其它远程资源通过ー个同轴电缆、光纤电脑、双绞线、数字用户线(DSL)或以例如红外、无线和微波等无线方式传输的也被包含在所定义的电脑可读媒介中。所述的碟片(disk)和磁盘(disc)包括压缩磁盘、镭射盘、光盘、DVD、软盘和蓝光光盘,磁盘通常以磁性复制数据,而碟片通常以激光进行光学复制数据。上述的组合也可以包含在电脑可读媒介中。以上所述的具体实施方式
,对本发明的目的、技术方案和有益效果进行了进ー步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式
而已,并不用于限定本发明 的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
权利要求
1.ー种远程音频交互的多路声学回音消除方法,其特征在于,所述方法包括 获取输入的多路音源声学信号; 对输入的所述多路音源声学信号进行声学分离处理; 分别对进行声学分离处理后的每一路声学信号通过自适应滤波器进行声学回音消除处理; 将进行声学回音消除处理后的每一路声学信号进行组合并进行声学合成; 将进行声学合成后的声学信号进行输出。
2.如权利要求I所述方法,其特征在于,所述获取输入的多路音源声学信号包括 对输入的多路音源声学信号进行滤波处理; 将进行滤波处理后的音频信号进行音频模数转换; 获取进行音频模数转换后的多路音源声学信号。
3.如权利要求I所述方法,其特征在于,所述对输入的所述多路音源声学信号进行声学分离处理包括 根据声学的频率对输入的所述多路音源声学信号进行声学分离处理。
4.如权利要求3所述方法,其特征在于,所述根据声学的频率对输入的所述多路音源声学信号进行声学分离处理包括 根据声学的频率对输入的所述多路音源声学信号进行一次声学分离处理,然后根据预定时间内声学音频大小进行二次分离处理,井根据预定时间内声学间断进行三次分离处理。
5.如权利要求I所述方法,其特征在于,所述分别对进行声学分离处理后的每一路声学信号通过自适应滤波器进行声学回音消除处理包括 分别对进行声学分离处理后的每一路声学信号通过自适应滤波器模拟实际环境中的回音路径以预测回音信号,并从实际信号中减去预测到的回音信号,以进行声学回音消除处理。
6.如权利要求5所述方法,其特征在于,所述分别对进行声学分离处理后的每一路声学信号通过自适应滤波器进行声学回音消除处理包括 在对进行声学分离处理后的每一路声学信号通过自适应滤波器进行声学回音消除处理过程中,利用双向通话检测器检测是否有话音信号加入,当检测到有话音信号吋,暂时冻结所述自适应滤波器对其參数的更新处理行为。
7.如权利要求6所述方法,其特征在于,所述分别对进行声学分离处理后的每一路声学信号通过自适应滤波器进行声学回音消除处理后,还包括 分别通过非线性处理器模块,利用非线性控制算法对进行声学回音消除处理后的每ー路声学信号进行润色处理。
8.如权利要求I所述方法,其特征在于,所述将进行声学合成后的声学信号进行输出包括 将进行声学合成后的声学信号进行音频数模转换; 对进行音频数模转换后的声学信号进行滤波处理; 将进行滤波处理后的声学信号进行输出。
9.ー种远程音频交互的多路声学回音消除系统,其特征在于,所述系统包括DSP数字处理器模块,用于获取输入的多路音源声学信号; 多路声学分离合成器,用于对输入的所述多路音源声学信号进行声学分离处理; 自适应滤波器模块,用于分别对进行声学分离处理后的每一路声学信号通过自适应滤波器进行声学回音消除处理; 所述多路声学分离合成器,还用于将进行声学回音消除处理后的每一路声学信号进行组合并进行声学合成; 所述DSP数字处理器模块,还用于将进行声学合成后的声学信号进行输出。
10.如权利要求9所述系统,其特征在于,所述系统还包括 本地声学输入模块,用于对输入的多路音源声学信号进行滤波处理; 远程声学输入模块,用于对输入的多路音源声学信号进行滤波处理; 音频模数/数模转换模块,用于将进行滤波处理后的音频信号进行音频模数转换; 所述DSP数字处理器模块,用于获取进行音频模数转换后的多路音源声学信号。
11.如权利要求9所述系统,其特征在干, 所述多路声学分离合成器,进ー步用于根据声学的频率对输入的所述多路音源声学信号进行声学分离处理。
12.如权利要求11所述系统,其特征在干, 所述多路声学分离合成器,进ー步具体用于根据声学的频率对输入的所述多路音源声学信号进行一次声学分离处理,然后根据预定时间内声学音频大小进行二次分离处理,并根据预定时间内声学间断进行三次分离处理。
13.如权利要求9所述系统,其特征在干, 所述自适应滤波器模块,进ー步用于分别对进行声学分离处理后的每一路声学信号通过自适应滤波器模拟实际环境中的回音路径以预测回音信号,并从实际信号中减去预测到的回音信号,以进行声学回音消除处理。
14.如权利要求13所述系统,其特征在于,所述系统还包括 双向通话检测器模块,用于所述自适应滤波器模块在对进行声学分离处理后的每一路声学信号通过自适应滤波器进行声学回音消除处理过程中,利用双向通话检测器检测是否有来自远程声学输入模块的话音信号加入,当检测到有话音信号吋,暂时冻结所述自适应滤波器对其參数的更新处理行为。
15.如权利要求14所述系统,其特征在于,所述系统还包括 非线性处理器模块,用于所述自适应滤波器模块分别对进行声学分离处理后的每一路声学信号通过自适应滤波器进行声学回音消除处理后,分别通过非线性处理器模块,利用非线性控制算法对进行声学回音消除处理后的每一路声学信号进行润色处理。
16.如权利要求9所述系统,其特征在于,所述系统还包括 所述音频模数/数模转换模块,还用于将进行声学合成后的声学信号进行音频数模转换; 本地声学输出模块,用于对进行音频数模转换后的声学信号进行滤波处理;然后将进行滤波处理后的声学信号进行输出; 远程声学输出模块,用于对进行音频数模转换后的声学信号进行滤波处理;然后将进行滤波处理后的声学信号进行输出。
全文摘要
本发明提供一种远程音频交互的多路声学回音消除方法及系统,所述远程音频交互的多路声学回音消除方法包括获取输入的多路音源声学信号;对输入的多路音源声学信号进行声学分离处理;分别对进行声学分离处理后的每一路声学信号通过自适应滤波器进行声学回音消除处理;将进行声学回音消除处理后的每一路声学信号进行组合并进行声学合成;将进行声学合成后的声学信号进行输出。所述系统包括DSP数字处理器模块,多路声学分离合成器,自适应滤波器模块。本发明以较低成本消除了多路声学回音,并提供了高质量的语音通信。本发明可应用于各种复杂远程音双向语音交互领域中,能将回音处理拖尾时间提高到500ms,声学带宽范围为20HZ至20KHZ,回音消除能力提高到大于100dB。
文档编号G10L21/02GK102646418SQ201210088640
公开日2012年8月22日 申请日期2012年3月29日 优先权日2012年3月29日
发明者刘卫国, 方斌, 段克, 谢泳江, 贾瑞明 申请人:北京华夏电通科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1