一种语音通信中小空间回声信号的处理方法与流程

文档序号:18708284发布日期:2019-09-18 00:02阅读:273来源:国知局
一种语音通信中小空间回声信号的处理方法与流程

本发明涉及室内声信号处理技术领域,特别是一种语音通信中小空间回声信号的处理方法。



背景技术:

室内声信号用于听音包括两部分信号组成:一是声源直接传达到接收位置的直达声,它随传输距离增大而衰减;二是声源激励起的室内声环境驻波,它充满于室内。因此在小空间中往往比大空间存在较强烈的环境驻波(强反射声)的影响。

对于实际听音空间中的电声通信系统,往往由于声环境驻波的影响造成两个方面影响:一是在双方同时讲话时造成回声干扰,造成音质下降,没有近端语音时也有回声送到远端播放;二是由于通信信道和双方室内构成闭环回声正反馈系统,严重时造成反馈激励的自激啸叫。因此,在电声通信系统中,通常针对回声造成的反馈啸叫的处理方法有:采用均衡处理;或是采用移频处理;或是采用自适应滤波器抵消环境回声。但这些处理在某种程度上都将对音质又引起一定的影响,或者处理不够彻底的问题。



技术实现要素:

有鉴于此,本发明的目的是提出一种语音通信中小空间回声信号的处理方法,用于获得理想的麦克风语音拾音,消除“双讲”的回声干扰。

本发明采用以下方案实现:一种语音通信中小空间回声信号的处理方法,包括以下步骤:

步骤s1:获取室内声环境的脉冲响应信号,并转换成数字信号,该数字信号即室内冲击响应信号y(n);

步骤s2:进行线性预测,利用下式获得室内声环境ar模型的p阶结构参数:

y(n)=a1y(n-1)+a2y(n-2)+···+ap(n-p)+e(n);

式中e(n)称为残差,a1,a2,...ap为室内声环境ar模型的p阶结构参数;

步骤s3:设在z域,室内输入声源信号为x(z),输出为y(z),根据阶数p和室内声环境ar模型的p阶结构参数确定相应的全极点滤波器结构,其系统传递函数如下:

步骤s4:获取近端两路麦克风输入声源在数字域的信号s1(n)和s2(n),同时获取远端送来的电路信号s3(n);将s1(n)和s2(n)采用盲源信号分离处理算法,获得两个分离信号x1(n)与x2(n);将s3(n)送入步骤s3构建的全极点滤波器中,获得场所回声估算信号x3(n);

步骤s5:将x3(n)分别与两个分离信号x1(n)、x2(n)做相关性计算,将与x3(n)之间相似度较高的分离信号视为场所回声信号;

步骤s6:重复步骤s1至步骤s5,对具有一定语音数据采用点的信号段连续进行处理,由此持续取出回声信号,用于消除其对近端麦克风拾取信号的回声干扰。

进一步地,步骤s1中,利用电声系统对室内声环境输入激励信号,从而获取室内声环境的脉冲响应信号;其中所述输入激励信号为白噪声脉冲、周期脉冲或赝噪声。该噪声应在双方会议的语音通信前分别送进相应场所播放,以便获取模拟相应场所的全极点滤波器。

进一步地,步骤s2中,阶数p的取值为2dn,其中dn的计算采用下式:

式中,f为估算的频率,λ为相应波长,dω为估算的带宽,c为声速,λ=4v/s,v为室内容积,s为室内总表面积。

较佳的,步骤s4中,由于场所环境的布置材料具有对不同声波频率的吸声和反射效果,对于固定扬声器布置和扩声麦克风之间来说,是一个线性时不变系统,对于扬声器到麦克风之间相当于一个声波滤波效应,因此,在麦克风处,语音通信中远端语音通过扬声器在场所激励的回声与讲话人的语音分别具备独立语音源的效果进行混合。对于体积不是太大的声空间来说,实际测试结果,环境的回声能量主要集中在500hz以下分立的低频驻波,而高频成分几乎不存在。据此,采用基于信号源统计独立的盲源分离算法后,可以获得两个分离信号,分别为人语音信号和回声信号,设为x1(n)与x2(n),在下一个步骤中进行区分。

较佳的,小空间语音通信采用两个麦克风(无特别距离限制,因为盲源分离可以针对任何的信号混合比例),对两个麦克风各自的混合信号(有用的近端语音信号或室内本底噪声和远端语音在室内的回声信号)进行分离,是采用盲源信号分离方法获取。该方法可以采用现有技术中的多种算法,较佳可以采用基于发明专利《一种比例微分控制的混合信号自适应快速分离方法》(cn201810868388.5)中的方法获取。

较佳的,假设对于两个数字信号l1(n)和l2(n)具有相同数据采样点n,则它们分别组成了n维向量,它们分别为每个有限信号段的特征向量。在两个向量之间,它们的夹角a越小就说明两个信号波形的相似度越高(相关度越高)。评价两个信号间的波形相似度(相关度),可以计算两个信号向量间夹角a的余弦值如下:

显然,该余弦取值将在0和1之间,即夹角在0°到90°间;余弦值越大夹角越小,该系数r越大,两者波形相似度(相关度)越高。因此,步骤s5中,本发明的x3(n)分别和x1(n)、x2(n)采用相同的采样点数n,将x3(n)和x1(n)通过信号相关性系数r1的计算;将x3(n)和x2(n)也通过信号相关性系数r2的计算,它们之间相似度判断的具体计算公式如下:

则相似度系数较高一组中的分离信号为场所回声信号。

与现有技术相比,本发明有以下有益效果:

1、很多通信中的小空间往往都是不经过专门建筑声学处理的空间,本发明的方法尤其适用于无专门声环境设计的小空间中进行语音通信中。由于小空间往往均比大空间明显存在较强的反射声(较强的低频段室内驻波)影响,均应及时处理其不利于通话的危害。因此,当检测到远端有电路信号时就施行本发明的方法,持续识别出麦克风拾取信号中的回声信号,并去除,则麦克风输出的是干净的近端语音信号或正常本底噪声信号,彻底消除回声的不利影响。

2、本发明由于采用了dsp(数字信号处理)构架,具有高度的灵活性,可以实时修改,因而实时性强,且易于应用到智能设备中。

附图说明

图1为本发明实施例的方法原理框图。

图2为本发明实施例的小室内冲击响应、频率响应和616极点模型的频率响应仿真处理结果示意图。其中(a)为房间冲击响应处理结果示意图,(b)为频率响应和616极点模型的频率响应仿真处理结果示意图。

图3为本发明实施例的两路麦克风的混合观察信号s1和s2。其中(a)为麦克风混合信号1,(b)为麦克风混合信号2。

图4为本发明实施例的经过盲源分离算法从两路麦克风混合信号获得的两路分离信号x1和x2,及经过相似度判断抽取的有用语音信号x1。其中(a)为分离信号1,(b)为分离信号2,(c)为相似度判断抽取的信号。其中分离信号1的相似度系数0.8304;分离信号2的相似度系数5.2459e-04。

图5为本发明实施例的远端语音源信号s3通过极点滤波器核对的回声估算x3。其中(a)为远端的电路信号,(b)为远端电路信号的场所回声估算。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

本实施例提供了一种语音通信中小空间回声信号的处理方法,首先要获取室内声环境的室内冲击响应y(n)和确定室内声环境自回归ar模型(以下简称:室内声环境ar模型)的阶数p,用于线性预测室内声环境ar模型的p阶结构参数。

在离散域,线性预测是依据室内冲击响应的时域信号y(n)与y(n-1),甚至更早值y(n-i),(i=2,3,...,q)的相关性提出的。因此,可将y(n)表示为其以前数据的线性组合,即:

y(n)=a1y(n-1)+a2y(n-2)+···+ap(n-p)+e(n);

该式称为y的p阶自回归预测模型,e(n)称为残差,为室内声环境ar模型p阶结构参数,这里的线性预测的主要任务就是获取该参数。ar模型就是一个p阶的全极点滤波器,因此预测获得的室内声环境ar模型参数就是相应的全极点滤波器结构参数。

一般的,e(n)包括三部分:一是输入信号,也称激励信号;二是由于模型的不准确引起的误差;三是噪声。实际应用中,信号是随机且带噪声的,预测误差不可能为零。预测误差的特点是开始时衰减很快,随着预测器阶数p越来越接近正确阶数,衰减会变慢,最后e(n)是与y(n)不相关的零均值随机过程。正确预测室内声环境ar模型的条件为:获取室内声环境冲击响应y(n)和正确确定室内声环境ar模型的阶数p。

如图1所示,本实施例具体包括以下步骤:

步骤s1:获取室内声环境的脉冲响应信号,并转换成数字信号,该数字信号即室内冲击响应信号y(n);

步骤s2:进行线性预测,利用下式获得室内声环境ar模型的p阶结构参数:

y(n)=a1y(n-1)+a2y(n-2)+···+ap(n-p)+e(n);

式中e(n)称为残差,a1,a2,...ap为室内声环境ar模型的p阶结构参数;

步骤s3:设在z域,室内输入声源信号为x(z),输出为y(z),根据阶数p和室内声环境ar模型的p阶结构参数确定相应的全极点滤波器结构,其系统传递函数如下:

步骤s4:获取近端两路麦克风输入声源在数字域的信号s1(n)和s2(n),同时获取远端送来的电路信号s3(n);将s1(n)和s2(n)采用盲源信号分离处理算法,获得两个分离信号x1(n)与x2(n);将s3(n)送入步骤s3构建的全极点滤波器中,获得场所回声估算信号x3(n);

步骤s5:将x3(n)分别与两个分离信号x1(n)、x2(n)做相关性计算,将与x3(n)相似度较高的分离信号视为场所回声信号;

步骤s6:重复步骤s1至步骤s5,对具有一定语音数据采用点的信号段连续进行处理,由此持续取出回声信号,用于消除其对近端麦克风拾取信号的回声干扰。

在本实施例中,步骤s1中,利用电声系统对室内声环境输入激励信号,从而获取室内声环境的脉冲响应信号;其中所述输入激励信号为白噪声脉冲、周期脉冲或赝噪声。该噪声应在双方会议的语音通信前分别送进相应场所播放,以便获取模拟相应场所的全极点滤波器。

在本实施例中,步骤s2中,阶数p的取值为2dn,其中dn的计算采用下式:

式中,f为估算的频率,λ为相应波长,dω为估算的带宽,c为声速,λ=4v/s,v为室内容积,s为室内总表面积。

较佳的,在本实施例中,步骤s4中,由于场所环境的布置材料具有对不同声波频率的吸声和反射效果,对于固定扬声器布置和扩声麦克风之间来说,是一个线性时不变系统,对于扬声器到麦克风之间相当于一个声波滤波效应,因此,在麦克风处,语音通信中远端语音通过扬声器在场所激励的回声与讲话人的语音分别具备独立语音源的效果进行混合。对于体积不是太大的声空间来说,实际测试结果,环境的回声能量主要集中在500hz以下分立的低频驻波,而高频成分几乎不存在。据此,采用基于信号源统计独立的盲源分离算法后,可以获得两个分离信号,分别为人语音信号和回声信号,设为x1(n)与x2(n),在下一个步骤中进行区分。

较佳的,小空间语音通信采用两个麦克风(无特别距离限制,因为盲源分离可以针对任何的信号混合比例),对两个麦克风各自的混合信号(有用的近端语音信号或室内本底噪声和远端语音在室内的回声信号)进行分离,是采用盲源信号分离方法获取。该方法可以采用现有技术中的多种算法,较佳可以采用基于发明专利《一种比例微分控制的混合信号自适应快速分离方法》(cn201810868388.5)中的方法获取。

较佳的,假设对于两个数字信号l1(n)和l2(n)具有相同数据采样点n,则它们分别组成了n维向量,它们分别为每个有限信号段的特征向量。在两个向量之间,它们的夹角a越小就说明两个信号波形的相似度越高(相关度越高)。评价两个信号间的波形相似度(相关度),可以计算两个信号向量间夹角a的余弦值如下:

显然,该余弦取值将在0和1之间,即夹角在0°到90°间;余弦值越大夹角越小,该系数r越大,两者波形相似度(相关度)越高。因此,本发明的x3(n)分别和x1(n)、x2(n)采用相同的采样点数n。因此步骤s5中,将x3(n)和x1(n)通过信号相似度系数r1的计算;将x3(n)和x2(n)也通过信号相似度系数r2的计算,具体计算公式如下:

则相似度系数较高一组中的分离信号为场所回声信号x2(n)。本发明的x3(n)和x1(n)、x2(n)做相似度判断的数据采样点n均为15000。

图1为本发明实施例的方法原理框图。应用于不同声用房的声系统时,首先根据所使用的电声系统对室内输入白噪声脉冲,充分激励起室内的驻波响应,获得室内冲击响应并转换为数字信号;然后估算室内声环境ar模型的阶数,进行线性预测,获取室内声环境ar模型的传递函数参数,建立室内的ar模型传递函数h(z)。其次对麦克风拾音信号进行盲源分离算法,获得语音信号和回声信号。最后依据h(z)建立远端语音源信号(电路获取)的回声估算,再依据相关性判断回声信号并去除的算法结构。

如图2所示,图2为本实施例小室内冲击响应、频率响应和616极点模型的频率响应仿真处理结果示意图。首先用电声系统向小声用房播放适当的声环境激励信号(白噪声脉冲、周期脉冲、赝噪声等),获取声场脉冲响应,并转换为数字信号。其中结果是对室内尺寸为6.3×3.6×2.8(m3)的小房间冲击响应(100hz-400hz)及其仿真处理结果。由驻波数估算式得简正频率数约为308个,根据上述分析,建模需要极点数约为616(p=2×308)个。针对该室内冲击响应,应用levinson-durbin递推算法求解,通过仿真获取其室内声信道616个极点预测模型的频率响应,并与原室内脉冲响应的频率响应相比较,结果显示它们的峰值(谷值)均获得很好吻合。那么,获得信道估算的方法如下:

据上述获得的预测条件,通过线性预测算法获得室内声环境ar模型的系数,确立室内声环境ar模型的传递函数:

建立相应的全极点滤波器。

图3、图4和图5为一个仿真处理实例及结果。其中,分离信号中被抽取的有用信号与估算回声信号相似度系数5.2459e-04,另一个作为回声本身的分离信号与估算回声信号相似度系数0.8304。可见室内声环境ar模型的阶数选择方法满足要求,说明算法正确地获得了对回声信号的有效识别处理,达到预期要求。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述,仅是本发明的较佳实施例而已,并非是对本发明作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例。但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1