语音检测器的制作方法

文档序号:7765903阅读:130来源:国知局
专利名称:语音检测器的制作方法
技术领域
本发明涉及一种语音检测器,具体但不排他地,涉及一种包括多个彼此间隔紧密 的麦克风在内的语音检测器、一种使用多个麦克风来检测语音的方法、以及形成语音检测 器的自适应差动麦克风。
背景技术
这里描述麦克风彼此相对位置所使用的术语“间隔紧密”意味着,阵列中相邻麦克 风之间的距离远小于麦克风与该麦克风检测到的声源之间的距离。此外,在感兴趣频带内, 声音的波长会长于麦克风之间的间隔。一种公知的使用两个麦克风的语音检测器利用诸如麦克风间级差(ILD)之类的 双耳提示来检测语音。为了利用ILD,需要假定一个麦克风上检测到的语音比另一个麦克风 上检测到的语音大。这种假定对诸如移动电话之类的设备上的两个麦克风的定位进行了约
束ο已知许多语音增强算法利用这样的检测器进行操作。这些利用多于一个麦克风的 语音增强算法通常依赖于通用旁瓣抑制器,该旁瓣抑制器由捕获目标声源的波束形成器、 以及在不会衰减目标声源的情况下从波束形成器输出中移除任何不期望的声音的第二级 自适应滤波器构成。这样的构建块完全依赖于语音检测器的可用性,该语音检测器可以正确控制波束 形成器和二级滤波器的改变。如果检测到目标语音,则仅波束形成器改变,而在没有目标语音的情况下,仅第二 级自适应滤波器改变。这种公知语音检测器的不良性能可以导致对目标信号的抑制以及对干扰(例如, 背景)源的增强。这种不良性能会导致双麦克风语音增强系统的性能比单麦克风系统的性 能差。众所周知,语音检测器的设计通常由特定应用和设计约束来管理。要在特定应用 中使用语音检测器的方式可以基于与讲话者的位置以及任何干扰声源的位置有关的先验 fn息ο在助听应用中,例如,可以假定期望声源位于佩戴助听器的人的正面(正向),而 假定干扰源来自助听器佩戴者的背面(背向)。如果并入了麦克风的设备位于声源的侧向,则将声源描述为垂射式声源。类似地, 如果声源定向至包含麦克风在内的设备的端部,则将声源描述为处于端射式位置。在考虑 声源相对于线性麦克风阵列的位置以及依赖于应用的情况下,通常将定向至阵列一端的声 源描述为处于正向平面,并且将定向至阵列另一端的那些声源描述为处于背向平面。有时将正向平面和背向平面定义为正向半平面和背向半平面,这是由于它们分别 跨过180°角,整个平面定义360°。此外,声源的位置由方位角Θ来定义。这是声源相对 于阵列中心点的入射角。
诸如麦克风在设备上的位置之类的计约束还确定了能够使用的有关期望/不期 望的声源的信息,该信息给出设备的特定拓扑以及麦克风在设备上的位置。例如,在公知的具有两个麦克风的移动电话中,主麦克风置于设备的下部,副麦克 风置于设备的背侧的上部。因此,副麦克风与主麦克风相比更加远离用户的嘴。根据这样的麦克风拓扑,源自移动电话用户的语音在近场中,并且语音在主麦克 风上比在副麦克风上声音大。背景噪音和其他噪音干扰源在远场,因此,背景噪音和其他噪 音在两个麦克风上相同。通过探测每个麦克风之间的间级差,可以正确检测到目标语音。在包括多个间隔紧密麦克风的公知语音检测器中,通常的检测技术是首先对麦克 风信号应用差动处理。假定麦克风紧密间隔,该过程使用两个全向麦克风来产生正向面对 和背向面对的心形信号。例如,如果假定目标声源源自正向,则正向面对与背向面对的心形 麦克风上的功率之间的比值应非常大。对于源自背向的干扰源,该比值非常小,而对于扩散 噪音而言,该比值应接近1。这种麦克风信号的正向-背向心形处理是利用紧密间隔麦克风的通常使用的检 测方法。这种类型检测器的问题在于,不能够容易地适配不同的麦克风配置,也不能够适配 用户对设备进行处理的不同方式。换言之,这种类型的检测器在语音不是源自正向的情况 下是不适合的。例如,上述是移动电话的特定问题,这是由于用户可以改变电话相对于用户的嘴 的方位,并因此语音不一定始终源自麦克风的正向。这种类型的公知语音检测器的另一问题在于,需要在特定容限内匹配每个麦克风 的功率。换言之,必须对麦克风进行校准。

发明内容
根据本发明的第一方面,提供了一种使用第一麦克风和第二麦克风来检测语音的 方法,其中,第一麦克风适用于产生第一信号,第二麦克风适用于产生第二信号,所述方法 包括以下步骤(i)对第二信号应用增益,以产生归一化的第二信号,其中,相对于第一信号对第 二信号进行归一化;(ii)根据第一信号和归一化的第二信号来构造一个或多个信号分量;(iii)构造自适应差动麦克风(ADM),所述ADM具有从一个或多个信号分量构造的 麦克风响应,其中,所述响应具有至少一个方向空响应(null);(iv)响应于检测到的声音,根据已构造的麦克风响应,来产生一个或多个ADM输 出;(ν)计算第一信号分量或已构造的麦克风响应的参数与ADM的输出的参数的比 值;(vi)将所述比值与自适应阈值进行比较;(vii)如果所述比值大于或等于自适应阈值,则检测语音。根据本发明的第二方面,提供了一种语音检测器,包括第一麦克风,适用于产生第一信号;第二麦克风,适用于产生第二信号;
放大器,适用于对第二信号应用增益,以产生归一化的第二信号,其中,相对于第 一信号对第二信号进行归一化;第一处理器,用于根据第一信号和归一化的第二信号来构造一个或多个信号分 量;第二处理器,用于构造自适应差动麦克风,所述自适应差动麦克风具有已构造的 麦克风响应,所述已构造的麦克风响应具有至少一个方向空响应,ADM响应于检测到的声 音,产生一个或多个输出;第三处理器,用于计算第一信号分量或已构造的麦克风响应的参数与ADM的输出 的参数的比值;比较器,将所述比值与自适应阈值进行比较,以检测所述比值是否大于或等于自 适应阈值;以及检测器,用于在比值大于或等于自适应阈值时检测语音。根据本发明的第三方面,提供了一种形成根据本发明的第二方面的语音检测器的 自适应差动麦克风(ADM)。由于ADM的已构造的麦克风响应包括至少一个方向空响应,通过本发明的实施 例,能够通过将空响应定向目标语音的源,来实质上抑制目标声源,例如,目标语音。如果以 这样的方式定向方向空响应,则ADM的一个或多个输出较小,这是由于能够实质上抑制目 标语音。这意味着在第一信号分量或已构造的麦克风响应的参数与ADM的输出的参数之间 所形成的比值较大。当该比值大于或等于自适应阈值时,则检测语音。另一方面,如果将空响应定向至背景或干扰源,则空响应的影响较小,因此,在第 一信号分量与已构造的麦克风响应的参数与ADM的输出的参数之间所形成的比值远小于 针对目标语音的比值。这意味着所述比值小于自适应阈值,从而不检测语音。这是由于如果用户在近场中,则从用户嘴中发出的声音更直接,并且通常比自适 应差动麦克风环境中其他声源的功率更高的功率。因此,如果沿着用户嘴的方向定向空响 应,则ADM可以抑制信号的大部分。这意味着ADM信号远小于信号分量或已构造的麦克风 响应。对于扩散噪音和点干扰,比值小于阈值,并且不检测语音。根据本发明第一方面的方法可以包括另一步骤估计自适应因子β的值。如下文中更详细说明的,通过自适应因子β来确定自适应阈值。如下文中所述, 自适应因子β还确定方向空响应的方位。因此方向空响应的方位和自适应阈值均通过自 适应因子β来确定。由于方向空响应的方位和自适应阈值均取决于β的值,因此,有效地使阈值适合 于β的当前值,从而确定ADM响应。根据本发明第一方面的方法可以还包括以下步骤(viii)改变自适应因子β的值;(ix)重新计算比值;(χ)将重新计算的比值与已改变的阈值进行比较;(xi)如果比值大于已改变的阈值,则检测语音。通过适当地改变自适应因子β的值,可以适当地将方向空响应定向至目标语音源。这会致使目标语音远实质上受到ADM的抑制,并且致使比值大于或等于自适应阈值,因 此致使对语音检修检测。由于本发明实施例的自适应特性,可以适当改变β的值,以便确保适当定向方向 空响应。在本发明的实施例中,可以通过将信号分量或已构造的麦克风响应的功率与ADM 的输出的功率进行比较,来形成比值。在本发明实施例中,可以通过将诸如信号分量或已构造麦克风响应的绝对值之类 的其他参数与ADM的输出的绝对值进行比较,来形成比值。如果使用这样的比值,则需要相 应修改自适应阈值。ADM的输出可以包括响应于在背向平面中检测到的声音而产生的第一输出yb,以 及响应于在正向平面中检测到的声音而产生的第二输出yf。在这样的实施例中,可以根据 ADM的每个输出来分别计算比值。根据两个比值的值,判定语音源位于正向平面还是背向平 面中。对于作为手机(例如,移动电话)的一部分的语音检测器,传播波的近场效应是主 导。通常在免提情况下有效的远场效应通常假定用于小麦克风阵列的分析。具体地,平面 波前和相等麦克风级的假定便于间隔紧密麦克风的所谓本征波束的构造。使用两个麦克风,这些本征波束对应于单极和双极。这些本征波束的组合可以产 生各种一阶差动响应。在本发明的一个实施例中,根据第一和归一化的第二信号来构造两个信号分量。 然而,在其他实施例中,可以构造多于两个信号分量。在本发明的一些实施例中,第一信号分量包括单极信号。在这样的实施例中,或者在其他实施例中,第二信号分量可以包括双极信号。已构造的麦克风响应可以采用任何特定形式,只要该已构造的麦克风响应包括空 响应。空响应定义为响应为零的信号一部分。优选地,已构造麦克风响应包括第一响应和第二响应。在本发明的实施例中,第一响应包括正向面对的心形信号,第二响应包括背向面 对的心形信号。在这样的实施例中,正向和背向心形信号用于自适应构造麦克风响应,该麦克风 响应包含沿着强点源(尤其是语音源)方向的空响应。然而,这些正向和背向心形信号本 身是根据上述本征波束(单极和双极)来构造的,这样可以产生所有其他一阶形的基本形 是单极和双极。本发明的这种实施例提供了针对背向-正向心形检测器的自然或更一般的扩展。在本发明其他实施例中,第一和第二响应可以包括如相面对的一阶响应信号。第一和第二麦克风响应于从一个或多个声音发出的声音,分别产生第一和第二信 号,其中,声音是通过麦克风中的一个或两个麦克风检测到的。然后,通过对第二信号应用增益,来相对于第一信号对第二信号进行归一化。增益 可以是正的或者负的。通过本发明实施例,因此不需要对第一和第二麦克风进行校准,这是由于在检测 语音之前,相对于第一信号对第二信号进行归一化。
第一和第二麦克风可以是任何期望类型的麦克风,并且在本发明的一些实施例 中,第一和第二麦克风分别包括全向麦克风。


仅参照附图,通过实例进一步描述本发明的实施例,在附图中图1和2示出了分别针对平面和球面波的延迟的比较。图3是根据本发明第一实施例的自适应差动麦克风的示意图。图4是示出了使用图3所示ADM检测语音的方法的流程图。图5是示出了在相同位置具有空响应的图3的ADM的两个不同响应的极坐标图。图6是取决于针对图3的ADM的正向或背向半平面中的空响应方位的^和i3f 的值范围的极坐标图。图7是根据本发明第二实施例的ADM的示意图。以及图8是根据包括方位传感器在内的本发明另一实施例的ADM的示意图。
具体实施例方式为了进一步理解本发明,关于本发明实施例考虑一阶差动麦克风的特性,其中,已 构造麦克风响应包括正向和背向面对的心形信号,并且第一和第二信号分量分别包括单极 和双极信号。可以假定麦克风间隔紧密(这等同于条件kd<< ^!,其中沽二^八是波数川是 麦克风之间的距离,c是声速,w是声音的角频率)来构造正向和背向面对的心形信号。相反面对一阶超方向响应的一般形式是Vf = aVm + {l-a)Vd (1)Vb = aVm-(\-a)Vd ⑵其中,α确定所得到的一阶响应。具体地,对于0 < α < 0. 5,方向响应包含至少 一个空响应。因此,α控制一阶麦克风响应中的空响应的位置以及单极响应Vm,并且归一 化后的双极响应由以下给出Vd = --Vd(3)
jwd其中,Vd是双极响应。项l/(jw)是(理想)积分响应,c/d是归一化因子。理想 地,(1)和⑵化简为Vf = 0. 5(l+cos θ )Vb = 0. 5(l-cos θ )(4)对于正向和背向面对的心形(α =0.5),其中,θ是定义声源的位置的方位角,并 且对于较小麦克风间隔是频率相关的。如上所述,正向和背向心形的基本构建方案是依赖于α因子的单极和双极信号 的组合。α的值对于其他一阶单极响应是不同的。换言之,一阶响应的形状取决于α的值。在图1和图2中,f (front plane)和b (back plane)分别指正向平面和背向平面, θ是声源的入射角。在图1和2中示出了这些变量,其中,M1表示第一麦克风,112表示第二麦克风,r是声源与第一麦克风之间的距离,r2是声源与第二麦克风之间的距离,r是声源 与阵列中心的距离。
-阶(归一化的)差动麦克风的方向性因子(Q)可以用α来表示,其中Qia) = -^- (5)
4α -2 + 1其中,IOlogKKa)]是方向性指数。将Q定义为全向麦克风阵列的噪声场中的麦克风阵列的增益。如公式(5)所见,当通过改变α将空响应定向至期望语音源时,也改变了取决于 α的方向性因子Q。相对于第一麦克风M1的功率对第二麦克风M2的功率进行归一化,以便在构造正向 和背向心形信号时减轻近场效应。这可以通过对第二麦克风M2应用增益G来实现。 上述操作可以由以下给出
权利要求
1.一种使用第一麦克风(4)和第二麦克风(6)检测语音的方法,其中,第一麦克风(4) 产生第一信号(X1),第二麦克风(6)产生第二信号(x2),所述方法包括以下步骤(i)对第二信号应用增益,以产生归一化的第二信号,其中,相对于第一信号对第二信 号进行归一化;( )根据第一信号和归一化的第二信号来构造一个或多个信号分量;(iii)构造自适应差动麦克风ADM,所述ADM具有从一个或多个信号分量构造的麦克风 响应,其中,所述响应具有至少一个方向空响应;(iv)响应于检测到的声音,根据已构造的麦克风响应,来产生一个或多个ADM输出 (yf,yb);(ν)计算第一信号分量或已构造的麦克风响应的参数与ADM的输出的参数的比值;(Vi)将所述比值与自适应阈值(14)进行比较;(Vii)如果所述比值大于或等于自适应阈值,则检测语音。
2.根据权利要求1所述的方法,包括以下步骤 估计自适应值β的值。
3.根据权利要求1或2所述的方法,还包括以下步骤(viii)改变自适应因子β的值;(ix)重新计算比值;(x)将重新计算的比值与已改变的阈值进行比较; (Xi)如果所述比值大于已改变的阈值,则检测语音。
4.根据前述权利要求中任一项所述的方法,其中,计算比值的步骤包括根据信号分 量或构造麦克风响应的功率与ADM的输出的功率来计算比值。
5.根据权利要求1至3中任一项所述的方法,其中,计算比值的步骤包括根据信号分 量或构造麦克风响应的绝对值与ADM的输出的绝对值来计算比值。
6.根据前述权利要求中任一项所述的方法,其中,ADM的输出包括响应于背向平面中 检测到的声音而产生的第一输出yb,以及响应与正向平面中检测到的声音而产生的第二输 出yf。
7.根据权利要求6所述的方法,其中,准备比值的步骤包括以下步骤计算第一信号分量或构造麦克风响应的参数与ADM的第一输出的参数的比值;以及 计算第一信号分量或构造麦克风响应的参数与ADM的第二输出的参数的第二比值; 所述方法还包括以下步骤分别将第一比值和第二比值与自适应阈值进行比较;以及 判定语音源位于正向平面中还是背向平面中。
8.根据前述权利要求中任一项所述的方法,其中,根据第一信号和归一化的第二信号 构造一个或多个信号分量的步骤包括根据第一信号和归一化的第二信号构造单极信号和 双极信号。
9.根据前述权利要求中任一项所述的方法,其中,已构造的麦克风响应包括第一响应 (8)和第二响应(10)。
10.根据权利要求8所述的方法,其中,第一响应包括正向面对的心形信号,第二响应 包括背向面对的心形信号。
11.一种语音检测器0),包括第一麦克风G),产生第一信号(X1);第二麦克风(6),产生第二信号(X2);放大器(7),对第二信号应用增益,以产生归一化的第二信号,其中,相对于第一信号对 第二信号进行归一化;第一处理器,根据第一信号和归一化的第二信号来构造一个或多个信号分量;第二处理器,构造自适应差动麦克风,所述自适应差动麦克风具有包括至少一个方向 空响应的构造的麦克风响应,ADM响应于检测到的声音,产生一个或多个输出;第三处理器,计算第一信号分量或已构造的麦克风响应的参数与ADM的输出的参数的 比值;比较器,将所述比值与自适应阈值进行比较,以检测所述比值是否大于或等于自适应 阈值;以及检测器,在所述比值大于或等于自适应阈值时检测语音。
12.根据权利要求11所述的语音检测器,其中,一个或多个信号分量包括单极信号和 双极信号。
13.根据权利要求11或12所述的语音检测器,其中,构造麦克风响应包括正向面对的 心形信号⑶和背向面对的心形信号(10)。
14.根据权利要求11至14中任一项所述的语音检测器,其中,第一、第二和第三处理包 括单个处理器。
15.根据权利要求11至14中任一项所述的语音检测器,其中,第一和第二麦克风中的 每一个包括全向麦克风。
16.一种形成根据权利要求9至12中任一项所述的语音检测器的自适应差动麦克风。
全文摘要
一种使用第一麦克风(4)和第二麦克风(6)来检测语音的方法,包括步骤(i)对第二信号应用增益,以产生归一化的第二信号,其中,相对于第一信号对第二信号进行归一化;(ii)根据第一信号和归一化的第二信号来构造一个或多个信号分量;(iii)构造具有自适应差动麦克风(ADM),所述ADM从一个或多个信号分量构造的麦克风响应,其中,响应具有至少一个方向空响应;(iv)响应于检测到的声音,根据已构造的麦克风响应,来产生一个或多个ADM输出(yf,yb);(v)计算第一信号分量或已构造的麦克风响应的参数与ADM的输出的参数的比值;(vi)将该比值与自适应阈值(14)进行比较;(vii)如果该比值大于或等于自适应阈值,则检测语音。
文档编号H04R1/08GK102081925SQ201010552539
公开日2011年6月1日 申请日期2010年11月17日 优先权日2009年11月20日
发明者勒内·马蒂纳斯·马丽亚·德克斯, 帕特里克·克钦克, 沃特·约斯·蒂瑞, 科内利斯·彼得·扬瑟 申请人:Nxp股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1