一种基于固定波束形成的滤波方法及装置与流程

文档序号:16436990发布日期:2018-12-28 20:34阅读:196来源:国知局
一种基于固定波束形成的滤波方法及装置与流程

本发明实施例涉及信号处理技术领域,尤其涉及一种基于固定波束形成的滤波方法及装置。

背景技术

随着智能家居、物联网的兴起,智能音箱、可穿戴设备、智能手机等电子设备的快速普及,用户对于电子设备的功能以及智能化的要求越来越高,为了使得人机交互更自然简捷,大多数电子设备都配置有智能语音交互功能。但是,当用户和电子设备距离较大时,在电子设备通过传感器阵列(如麦克风阵列)远距离拾音时,由于受到真实环境中包含着的背景噪声(如背景音乐)、其它人声、混响等多种干扰,会使得电子设备所采集的目标用户的语音信号质量较差,导致语音识别准确度较低。

目前,在采集用户语音时通常会使用波束成形(beamforming),波束成形是一种用于传感器阵列(如麦克风阵列)的信号处理技术,用于定向信号接收和对接收到的声音信号进行适当的信号处理。

发明人在研究波束成形过程中发现,由于真实环境中往往存在时变的混响和波束形成算法中的旁瓣的存在,且受到传感器阵列几何形状以及智能终端计算条件约束,导致不能有效抑制非平稳的干扰信号。



技术实现要素:

有鉴于此,本发明实施例提供一种基于固定波束形成的滤波方法及装置,主要目的在于确保目标声源指向的用户语音信号不失真,并对其它空间指向的干扰信号进行有效抑制。

为达到上述目的,本发明实施例主要提供如下技术方案:

第一方面,本发明实施例提供一种基于固定波束形成的滤波方法,所述方法包括:获得待处理的多通道语音信号,其中,所述多通道语音信号至少包括来自目标声源的语音信号以及来自干扰声源的干扰信号;基于预先设置的至少两个指向不同方向的固定波束成形系数,对所述多通道语音信号进行固定波束成形,获得语音估计信号和干扰估计信号;基于所述语音估计信号和所述干扰估计信号,计算后置滤波参数;基于所述后置滤波参数,对所述语音估计信号进行滤波处理,获得处理后的语音信号。

第二方面,本发明实施例提供一种基于固定波束形成的滤波装置,所述装置包括:获得单元,用于获得待处理的多通道语音信号,其中,所述多通道语音信号至少包括来自目标声源的语音信号以及来自干扰声源的干扰信号;波束成形单元,用于基于预先设置的至少两个指向不同方向的固定波束成形系数,对所述多通道语音信号进行固定波束成形,获得语音估计信号和干扰估计信号;计算单元,用于基于所述语音估计信号和所述干扰估计信号,计算后置滤波参数;滤波单元,用于基于所述后置滤波参数,对所述语音估计信号进行滤波处理,获得处理后的语音信号。

第三方面,本发明实施例提供一种计算机可读存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述基于固定波束形成的滤波方法的步骤。

第四方面,本发明实施例提供一种电子设备,所述设备包括:至少一个处理器;以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行上述基于固定波束形成的滤波方法的步骤。

本发明实施例提供的基于固定波束形成的滤波方法及装置,在获得了同时包含目标声源的语音信号和干扰声源的干扰信号的多通道语音信号后,会先基于预先设置的至少两个指向不同方向的固定波束成形系数,对多通道语音信号进行固定波束成形,获得语音估计信号和干扰估计信号。接下来,在进行固定波束成形后,会根据所获得的语音估计信号和干扰估计信号来计算出后置滤波参数。最后,通过该后置滤波参数,对语音估计信号进行滤波处理,获得处理后的语音信号。这样,先通过固定波束成形对语音信号进行波束增强,能够增强目标声源指向的用户语音信号,抑制其它方向的干扰信号,再通过后置滤波参数对增强后的语音信号进行后置滤波,能够对单个波束形成之后增强的用户语音信号中大量残留的干扰信号进行有效抑制。从而,实现了有效抑制非目标声源方向的干扰信号。那么,在应用到远距离拾音时,能够确保目标声源指向的用户语音信号不失真,并对其它空间指向的干扰信号进行有效抑制。

附图说明

通过阅读下文优选实施方式的详细描述,各种其它的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1为本发明实施例一中的基于固定波束形成的滤波方法的流程示意图;

图2a至图2b为本发明实施例一中的麦克风阵列的示意图;

图3为本发明实施例二中的多通道语音信号模型的示意图;

图4为本发明实施例二中的多固定波束的示意图;

图5为本发明实施例三中的基于固定波束形成的滤波装置的结构示意图;

图6为本发明实施例四中的电子设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。

实施例一

本发明实施例提供一种基于固定波束形成的滤波方法,在实际应用中,该基于固定波束形成的滤波方法可以应用于各种需要对语音信号进行滤波来获取干净的语音信号的场合中,例如,在语音识别领域中,为了提高语音识别准确度,需要对传感器阵列所采集的包含有干扰信号的语音信号进行识别前的预处理,来增强目标用户的语音信号,去除环境噪声、其它人声等干扰信号,获得干净的用户语音信号。

具体来说,该基于固定波束形成的滤波方法的执行主体为基于固定波束形成的滤波装置,该基于固定波束形成的滤波装置可以内置或外接于一电子设备。

在实际应用中,该电子设备可以以各种形式来实施。例如,本发明实施例中描述的电子设备可以包括诸如智能音箱、智能电视、智能机顶盒等智能家居设备、诸如智能手机、平板电脑、智能手表、智能手环等随身设备等。当然,还可以为其它类型的具有用户语音采集和处理功能的电子设备,如笔记本电脑等。这里,本发明实施例中对电子设备的具体实现形式不做具体限定。

那么,图1为本发明实施例一中的基于固定波束形成的滤波方法的流程示意图,参见图1所示,该基于固定波束形成的滤波方法可以包括:

s101:获得待处理的多通道语音信号;

其中,多通道语音信号至少包括来自目标声源的语音信号以及来自干扰声源的干扰信号。

这里,目标声源一般是指当前使用电子设备正在发出声音的用户,如正在说话的人;干扰声源可以是指电子设备所处的当前环境中正在发出声音的其它人,如正在唱歌的另一人,也可以是指电子设备所处的当前环境中其它用户使用的正在发出声音的电子设备,如正在播放音乐的音箱、手机等。

这里,目标声源的数量为一个,干扰声源的数量为一个或者多个,如两个、三个等。当然,在实际应用中,所获得的多通道语音信号中除了包括目标声源的语音信号以及来自干扰声源的干扰信号外,还可能包括有其它类型的干扰信号,例如环境噪音、混响干扰等。

在实际应用中,目标声源和干扰声源可以指向为平面波0°~180°的任意角度。

具体来说,为了获得待处理的多通道语音信号,可以通过电子设备中设置的传感器阵列来采集多通道语音信号。在实际应用中,该传感器阵列是由一定数量的声学传感器(例如,麦克风)组成,用来对声场的空间特性进行采样。

示例性地,假设该传感器阵列是由麦克风阵列(microphonearray)来实现的,那么,该传感器阵列可以为由4个成线型等间距均匀分布的麦克风所组成的阵列(如图2a所示),也可以为由6个成线型等间距均匀分布的麦克风所组成的阵列,还可以为由8个成圆形等间距均匀分布的麦克风所组成的阵列(如图2b所示),当然,还可以为由其它数量和排列方式的麦克风所组成的阵列,例如,12个成圆形、长方形、月牙形等间距均匀分布的麦克风所组成的阵列等。这里,本发明实施例对麦克风阵列中麦克风的数量和排列方式不做具体限定。

在实际应用中,考虑到声波的特性,在布局麦克风阵列时,若设置的两两麦克风之间的距离不合适,会导致对声源的聚焦定位产生误差,因此,两两麦克风之间的距离不宜设置的过大,也不能设置的过小。示例性地,可以设置两两麦克风之间的等间距距离小于80毫米,且大于30毫米。

s102:基于预先设置的至少两个指向不同方向的固定波束成形系数,对多通道语音信号进行固定波束成形,获得语音估计信号和干扰估计信号;

在实际应用中,预先设置的至少两个指向不同方向的固定波束成形系数,能够对目标声源指向的语音信号产生增强,并对除目标声源指向的语音信号之外的其它干扰信号产生抑制的方式进行固定波束成形,使得目标声源指向的声音信号不失真,并且,对其它方向的声音信号产生抑制。

具体来说,在获得了待处理的多通道语音信号后,就可以根据预先设计的一组固定波束成形系数,来对多通道语音信号进行固定波束成形,以增强目标声源方向的语音信号的能量,抑制除目标声源方向的其它方向(如干扰声源方向)的干扰信号的能量。这样,就可以获得增强后的语音信号,即语音估计信号,并可以获得抑制后的残留的干扰估计信号。

在具体实施过程中,预先设置的指向不同方向的固定波束成形系数的数量可以为两个、三个、四个等。每个固定波束成形系数是指具有一定指向的固定波束,例如,可以为指向0°、30°、53°、60°、80°、90°、120°、150°、180°等方向的固定波束。但是,应当说明的是,这里并非在限定固定波束成形仅能为上述角度,还可以指向其它角度,这里,本发明实施例不做具体限定。

在实际应用中,每个方向的固定波束成形系数为一个矩阵,该矩阵中所包括的波束成形参数值的数量与麦克风阵列中麦克风的数量一致。

s103:基于语音估计信号和干扰估计信号,计算后置滤波参数;

在实际应用中,由于混响以及波束形成算法中的旁瓣的存在,对多通道语音信号进行波束形成后,使得非目标声源方向的干扰信号不能完全被抑制,导致单个波束形成之后增强的目标声源方向的语音信号中,仍然会存在大量的非目标声源方向的噪声或者干扰声的残留。这样,在执行s102后,所获得的语音估计信号中还会存在干扰信号的残留,因此,还需要基于语音估计信号和干扰估计信号,来计算出后置滤波参数,以便对语音估计信号进行后置滤波,获得更为纯净的语音信号。

在实际应用中,该后置滤波参数能够对增强后的目标声源指向的语音信号中残留的干扰信号,如环境噪声、混响干扰、干扰声源指向的干扰信号等进行进一步地抑制,使得所获得的最终信号不失真,更为纯净。

s104:基于后置滤波参数,对语音估计信号进行滤波处理,获得处理后的语音信号。

具体来说,在获得了后置滤波参数后,就可以根据该后置滤波参数对语音估计信号做进一步的滤波处理,来进一步地抑制经过波束增强后语音估计信号中仍然残留的干扰信号,这样,就可以得到更为纯净的最终信号,即处理后的语音信号。

由上述内容可知,本发明实施例提供的基于固定波束形成的滤波方法,在获得了同时包含目标声源的语音信号和干扰声源的干扰信号的多通道语音信号后,会先基于预先设置的至少两个指向不同方向的固定波束成形系数,对多通道语音信号进行固定波束成形,获得语音估计信号和干扰估计信号。接下来,在进行固定波束成形后,会根据所获得的语音估计信号和干扰估计信号来计算出后置滤波参数。最后,通过该后置滤波参数,对语音估计信号进行滤波处理,获得处理后的语音信号。这样,先通过固定波束成形对语音信号进行波束增强,能够增强目标声源指向的用户语音信号,抑制其它方向的干扰信号,再通过后置滤波参数对增强后的语音信号进行后置滤波,能够对单个波束形成之后增强的用户语音信号中大量残留的干扰信号进行有效抑制。从而,实现了有效抑制非目标声源方向的干扰信号。那么,将该方法应用到远距离拾音时,能够确保目标声源指向的用户语音信号不失真,并对其它空间指向的干扰信号进行有效抑制。

实施例二

基于前述实施例,本发明实施例还提供另一种基于固定波束形成的滤波方法,以具体实例来对前述实施例中各个步骤进行详细阐述。该方法应用于以下场景:参见图3所示,假设传感器阵列30是由m个麦克风成线型等间距均匀分布组成的,并假设空间中存在有一个目标声源31和两个干扰声源32,其中,m为正整数,目标声源31的角度为θs,干扰声源32的角度分别为

下面对上述s101中的多通道语音信号进行介绍。

具体来说,第m个麦克风在t时刻接收到的信号xm(t)可以如下公式(1)所示。

在公式(1)中,*表示卷积,hsm(t)表示目标声源到第m个麦克风的冲击响应,s(t)为目标声源产生的语音信号,him(t)表示第i个干扰声源到第m个麦克风的冲击响应,ni(t)为第i个干扰声源产生的干扰信号,i为干扰声源的索引,i的取值范围为[1,n]。

在实际应用中,为了便于对多通道语音信号进行后续处理,需要先通过傅立叶变换对语音信号进行处理,将原来难以处理的时域信号转换成了易于分析的频域信号,傅立叶变换的原理为任何连续测量的时序或信号,都可以表示为不同频率的正弦波信号的无限叠加,而根据该原理创立的傅立叶变换算法利用直接测量到的原始信号,以累加方式来计算该信号中不同正弦波信号的频率、振幅和相位。其中,有关傅立叶变换的具体实现方式本发明实施例在此不再进行赘述。

接下来,将上述时域信号xm(t)变换到频域之后,就可以得到如下公式(2)所示的频域信号xm(t,k)。

在公式(2)中,t表示时帧索引(timeframeindex),k表示离散频率的索引(frequencybinindex)。

在频域上,将m个麦克风的观测信号用向量形式表示,就可以得到如下公式(3)所示的多通道语音信号x(t,k)。

x(t,k)=[x1(t,k),x2(t,k),...,xm(t,k)]t公式(3)

在公式(3)中,x(t,k)表示多通道语音信号,x1(t,k)表示第1个麦克风所采集的信号,x2(t,k)表示第2个麦克风所采集的信号,xm(t,k)表示第m个麦克风所采集的信号。

在本发明另一实施例中,上述s102可以采用但不局限以下方法来实现。具体地,上述s102可以包括:基于预先设置的至少两个指向不同方向的固定波束成形系数,对多通道语音信号进行固定波束成形,获得至少两个波束信号;将至少两个波束信号中波束指向为目标声源的指向的波束信号,确定为语音估计信号;将至少两个波束信号中除语音估计信号外的其它波束信号,确定为干扰估计信号。

具体来说,预先设置的指向不同方向的固定波束成形系数的数量可以为两个、三个、四个等。每个固定波束成形系数是指具有一定指向的固定波束。举例来说,参见图4所示,在对多通道语音信号进行固定波束成形(也可称为波束增强)时,可以使用7个固定波束40来分别增强不同方向,其中,可以设置波束指向为0°、30°、60°、90°、120°、150°和180°共7个方向的固定波束,其中,目标声源31方向为90°方向。

在本发明实施例中,使用带有白噪声增益约束的固定波束成形技术,可以将整个空间分成p个部分,设计指向p个不同方向的固定波束成形系数w1(t,k),...,wp(t,k),对多通道语音信号进行波束增强,去分别增强来自不同方向信号,其中,w1(t,k)表示第1个方向的固定波束成形系数,wp(t,k)表示第p个方向的固定波束成形系数。

在实际应用中,每个方向的固定波束成形系数为一个矩阵,该矩阵中所包括的波束成形参数值的数量与麦克风阵列中麦克风的数量一致。

示例性地,以目标声源指向角度为θs的方向,麦克风阵列中麦克风数量是m为例,对于每一个时频点来说,目标声源方向对应的固定波束成形系数为一个矩阵,可以如下公式(4)所示。

在公式(4)中,θs表示目标声源的指向,表示目标声源方向对应的第1个波束成形参数,表示目标声源方向对应的第2个波束成形参数,表示目标声源方向对应的第m个波束成形参数。

同理,w1(t,k)、wp(t,k)等其它固定波束成形系数,与上述公式(4)所示的固定波束成形系数类似。这里,不做过多赘述。

接下来,可以使用上述p个设计好的波束形成参数,对多通道语音信号进行增强,获得p个波束信号。

假设目标声源的指向的波束信号为p个波束信号中的第q个波束信号,通过公式(4)和(5),可以计算出该第q个波束信号。

在公式(5)中,表示第q个波束信号,表示目标声源方向对应的固定波束成形系数,x(t,k)表示多通道语音信号。

同理,p个波束信号中的其它p-1个波束信号的计算方式与公式(5)类似,其中,p=1,...,p,p≠q,只用将公式(5)中的目标声源方向对应的固定波束成形系数对应替换为其它的p-1个固定波束成形系数。这里,不做过多赘述。

具体来说,从上述p个波束信号中,将目标声源的指向的波束信号,即上述第q个波束信号作为目标声源的语音信号的估计,就可以得到语音估计信号并将上述p个波束信号中除目标声源的指向的波束信号外,其它p-1个波束信号作为干扰信号的估计,就可以得到干扰估计信号,其中,p=1,...,p,p≠q。

在本发明另一实施例中,上述s103可以采用但不局限以下方法来实现。在具体实施过程中,为了实现更好的滤波效果,获得更为纯净的语音信号,后置滤波参数可以由帧级别后置增益和时频级别后置增益来实现。具体地址,上述s103可以包括以下步骤a1~a2:

步骤a1、基于语音估计信号和干扰估计信号,计算时频级别后置增益;

步骤a2、基于时频级别后置增益,计算帧级别后置增益。

在具体实施过程中,为了计算时频级别的后置增益,上述步骤a1还可以包括以下步骤b1~b2:

步骤b1、基于预设的权重系数,计算干扰估计信号的加权和,获得干扰信号能量估计值;

具体来说,在获得了干扰估计信号其中,p=1,...,p,p≠q后,可以使用通过如下公式(6)进行干扰信号能量的近似估计,获得干扰信号能量估计值

在公式(6)中,αp表示第p个波束的权重,其中,0<αp<1。

在实际应用中,权重系数为经验值,可由本领域技术人员在具体实施过程中根据实际情况来设置,这里,本发明实施例不做具体限定。

步骤b2、基于语音估计信号和干扰信号能量估计值,计算时频级别后置增益。

在具体实施过程中,基于语音估计信号和干扰信号能量估计值,计算时频级别后置增益的具体实现方式,可以存在且不限于包括以下两种实现方式:

第一种实现方式:计算语音估计信号与干扰信号能量估计值的和,获得第一值;计算语音估计信号与第一值的比值,获得时频级别后置增益。

具体来说,由于已经根据公式(5)获得了语音估计信号,并根据公式(6)估计出干扰信号能量估计值,从而,通过如下公式(7),可以计算出时频级别后置增益gtf(t,k)。

在公式(7)中,gtf(t,k)表示时频级别后置增益,表示语音估计信号,表示干扰信号能量估计值。

第二种实现方式:计算语音估计信号与干扰信号能量估计值的比值,获得信噪比估计值;计算信噪比估计值与预设常数值的和,获得第二值;计算信噪比估计值与第二值的比值,获得时频级别后置增益。

具体来说,由于已经根据公式(5)计算出语音估计信号,并根据公式(6)获得了干扰信号能量估计值,从而,也可以先通过如下公式(8)估计时频点的信噪比,获得信噪比估计值,然后,使用估计的信噪比估计值,通过如下公式(9)来估计时间-频率级别的维纳形式的增益,获得时频级别后置增益。

在公式(8)中,表示信噪比估计值,表示语音估计信号,表示干扰信号能量估计值。

在公式(9)中,gtf(t,k)表示时频级别后置增益,表示信噪比估计值,c表示预设常数值。

一般情况下,上述预设常数值可以取1。

具体来说,在执行s102获得了语音估计信号和干扰估计信号后,可以先执行步骤a1计算出时频级别后置增益,然后可以通过分帧处理,执行步骤a2根据该时频级别后置增益通过如下公式(10)来计算出帧级别后置增益。

在公式(10)中,gt(t)表示帧级别后置增益,gtf(t,k)表示时频级别后置增益,k表示总帧数,k=0,...,k-1。

当然,需要说明的是,后置滤波参数除了可以为帧级别后置增益和时频级别后置增益的组合外,也可以为帧级别后置增益和时频级别后置增益中的任一个。

在实际应用中,该后置滤波参数能够对增强后的目标声源指向的语音信号中残留的干扰信号,如环境噪声、混响干扰、干扰声源指向的干扰信号等进行进一步地抑制,使得所获得的最终信号不失真,更为纯净。

在本发明另一实施例中,上述s104可以采用但不局限以下方法来实现。在具体实施过程中,上述s104可以包括:计算帧级别后置增益、时频级别后置增益和语音估计信号的乘积,获得处理后的语音信号。

具体来说,当后置滤波参数具体通过帧级别后置增益和时频级别后置增益来实现时,可以通过如下公式(11)来得到处理后的语音信号。

在公式(11)中,表示处理后的语音信号,gt(t)表示帧级别后置增益,gtf(t,k)表示时频级别后置增益。

至此,便完成了对语音信号的多波束空间后置滤波过程。

由上述内容可知,在本发明实施例中,先通过固定波束成形对语音信号进行波束增强,能够增强目标声源指向的用户语音信号,抑制其它方向的干扰信号,再通过帧级别后置增益和时频级别后置增益对增强后的语音信号进行后置滤波,能够有效抑制增强后的用户语音信号中所残留的干扰信号,如环境噪声、混响干扰、干扰声源指向的干扰信号等,实现了更好的滤波效果。从而,实现了有效抑制非目标声源方向的干扰信号。那么,将该方法应用到远距离拾音时,能够确保目标声源指向的用户语音信号不失真,并对其它空间指向的干扰信号进行有效抑制。

实施例三

基于同一发明构思,作为对上述方法的实现,本发明实施例提供了一种基于固定波束形成的滤波装置,该装置实施例与前述方法实施例对应,为便于阅读,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的全部内容。

图5为本发明实施例三中的基于固定波束形成的滤波装置的结构示意图,参见图5所示,该装置50包括:获得单元501,用于获得待处理的多通道语音信号,其中,多通道语音信号至少包括来自目标声源的语音信号以及来自干扰声源的干扰信号;波束成形单元502,用于基于预先设置的至少两个指向不同方向的固定波束成形系数,对多通道语音信号进行固定波束成形,获得语音估计信号和干扰估计信号;计算单元503,用于基于语音估计信号和干扰估计信号,计算后置滤波参数;滤波单元504,用于基于后置滤波参数,对语音估计信号进行滤波处理,获得处理后的语音信号。

在本发明实施例中,波束成形单元,用于基于预先设置的至少两个指向不同方向的固定波束成形系数,对多通道语音信号进行固定波束成形,获得至少两个波束信号;将至少两个波束信号中波束指向为目标声源的指向的波束信号,确定为语音估计信号;将至少两个波束信号中除语音估计信号外的其它波束信号,确定为干扰估计信号。

在本发明实施例中,计算单元,用于基于语音估计信号和干扰估计信号,计算时频级别后置增益;基于时频级别后置增益,计算帧级别后置增益。

在本发明实施例中,滤波单元,用于计算帧级别后置增益、时频级别后置增益和语音估计信号的乘积,获得处理后的语音信号。

在本发明实施例中,计算单元,用于基于预设的权重系数,计算干扰估计信号的加权和,获得干扰信号能量估计值;基于语音估计信号和干扰信号能量估计值,计算时频级别后置增益。

在本发明实施例中,计算单元,用于计算语音估计信号与干扰信号能量估计值的和,获得第一值;计算语音估计信号与第一值的比值,获得时频级别后置增益。

在本发明实施例中,计算单元,用于计算语音估计信号与干扰信号能量估计值的比值,获得信噪比估计值;计算信噪比估计值与预设常数值的和,获得第二值;计算信噪比估计值与第二值的比值,获得时频级别后置增益。

由于本发明实施例所介绍的基于固定波束形成的滤波装置为可以执行本发明实施例中的基于固定波束形成的滤波方法的装置,故而基于本发明实施例中所介绍的基于固定波束形成的滤波方法,本领域所属技术人员能够了解本发明实施例的基于固定波束形成的滤波装置的具体实施方式以及其各种变化形式,所以在此对于该基于固定波束形成的滤波装置如何实现本发明实施例中的基于固定波束形成的滤波方法不再详细介绍。只要本领域所属技术人员实施本发明实施例中基于固定波束形成的滤波方法所采用的装置,都属于本申请所欲保护的范围。

实施例四

基于同一发明构思,本发明实施例提供一种电子设备。图6为本发明实施例四中的电子设备的结构示意图,参见图6所示,该电子设备60包括:至少一个处理器601;以及与处理器601连接的至少一个存储器602、总线603;其中,处理器601、存储器602通过总线603完成相互间的通信;处理器601用于调用存储器602中的程序指令,以执行以下步骤:获得待处理的多通道语音信号,其中,多通道语音信号至少包括来自目标声源的语音信号以及来自干扰声源的干扰信号;基于预先设置的至少两个指向不同方向的固定波束成形系数,对多通道语音信号进行固定波束成形,获得语音估计信号和干扰估计信号;基于语音估计信号和干扰估计信号,计算后置滤波参数;基于后置滤波参数,对语音估计信号进行滤波处理,获得处理后的语音信号。

在本发明实施例中,上述处理器调用程序指令时还可执行以下步骤:基于预先设置的至少两个指向不同方向的固定波束成形系数,对多通道语音信号进行固定波束成形,获得至少两个波束信号;将至少两个波束信号中波束指向为目标声源的指向的波束信号,确定为语音估计信号;将至少两个波束信号中除语音估计信号外的其它波束信号,确定为干扰估计信号。

在本发明实施例中,上述处理器调用程序指令时还可执行以下步骤:基于语音估计信号和干扰估计信号,计算时频级别后置增益;基于时频级别后置增益,计算帧级别后置增益。

在本发明实施例中,上述处理器调用程序指令时还可执行以下步骤:计算帧级别后置增益、时频级别后置增益和语音估计信号的乘积,获得处理后的语音信号。

在本发明实施例中,上述处理器调用程序指令时还可执行以下步骤:基于预设的权重系数,计算干扰估计信号的加权和,获得干扰信号能量估计值;基于语音估计信号和干扰信号能量估计值,计算时频级别后置增益。

在本发明实施例中,上述处理器调用程序指令时还可执行以下步骤:计算语音估计信号与干扰信号能量估计值的和,获得第一值;计算语音估计信号与第一值的比值,获得时频级别后置增益。

在本发明实施例中,上述处理器调用程序指令时还可执行以下步骤:计算语音估计信号与干扰信号能量估计值的比值,获得信噪比估计值;计算信噪比估计值与预设常数值的和,获得第二值;计算信噪比估计值与第二值的比值,获得时频级别后置增益。

本发明实施例还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述实施例中的基于固定波束形成的滤波方法的步骤。

上述处理器可由中央处理器(centralprocessingunit,cpu)、微处理器(microprocessorunit,mpu)、数字信号处理器(digitalsignalprocessor,dsp)、或现场可编程门阵列(fieldprogrammablegatearray,fpga)等实现。存储器可能包括计算机可读介质中的非永久性存储器,随机存储器(randomaccessmemory,ram)和/或非易失性内存等形式,如只读存储器(readonlymemory,rom)或闪存(flashram),存储器包括至少一个存储芯片。

实施例五

基于同一发明构思,本发明实施例还提供一种计算机可读存储介质,上述计算机可读存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述实施例中的基于固定波束形成的滤波方法的步骤。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、只读光盘(compactdiscread-onlymemory,cd-rom)、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其它可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其它可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其它可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其它可编程数据处理设备上,使得在计算机或其它可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其它可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

存储器可能包括计算机可读介质中的非永久性存储器,ram和/或非易失性内存等形式,如rom或flashram。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其它数据。计算机可读存储介质可以是rom、可编程只读存储器(programmableread-onlymemory,prom)、可擦除可编程只读存储器(erasableprogrammableread-onlymemory,eprom)、电可擦除可编程只读存储器(electricallyerasableprogrammableread-onlymemory,

eeprom)、磁性随机存取存储器(ferromagneticrandomaccessmemory,fram)、快闪存储器(flashmemory)、磁表面存储器、光盘、或只读光盘(compactdiscread-onlymemory,cd-rom)等存储器;也可以是快闪记忆体或其它内存技术、cd-rom、数字多功能光盘(dvd)或其它光学存储、磁盒式磁带,磁带磁磁盘存储或其它磁性存储设备或任何其它非传输介质,可用于存储可以被计算设备访问的信息;还可以是包括上述存储器之一或任意组合的各种电子设备,如移动电话、计算机、平板设备、个人数字助理等。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

以上仅为本发明的实施例而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1