校准第一麦克风和第二麦克风的制作方法

文档序号:7868610阅读:203来源:国知局
专利名称:校准第一麦克风和第二麦克风的制作方法
技术领域
本发明涉及一种校准第一和第二麦克风的方法,包括获取步骤,其中通过第一麦克风获取第一输入音频信号,和通过第二麦克风获取第二输入音频信号;校准步骤,其中确定第一麦克风的第一灵敏度和第二麦克风的第二灵敏度。
本发明也涉及一种设备,包括分别用于获取第一和第二输入音频信号的第一麦克风和第二麦克风,和用于确定第一麦克风的第一灵敏度和第二麦克风的第二灵敏度的处理器。
本发明也涉及一种通过处理器执行的计算机程序,包括用于校准第一麦克风和第二麦克风的程序代码,包括获取步骤,其中通过第一麦克风获取第一输入音频信号,和通过第二麦克风获取第二输入音频信号;校准步骤,其中确定第一麦克风的第一灵敏度和第二麦克风的第二灵敏度。
本发明也涉及一种存储有通过处理器执行的计算机程序的数据载体,包括用于校准第一麦克风和第二麦克风的程序代码,该方法包括获取步骤,其中通过第一麦克风获取第一输入音频信号,和通过第二麦克风获取第二输入音频信号;校准步骤,其中确定第一麦克风的第一灵敏度和第二麦克风的第二灵敏度。
从WO-A-0201915中可以得知一种用于校准麦克风的设备。这种已知设备具有多个麦克风,并且可以例如用于远程会议。多个麦克风能够更好地捕获说话者的语音,这样可以在接收器侧得到更高的可理解性。开发多个麦克风的算法需要精确地校准麦克风。这可以在工厂的消音室中完成,但是代价昂贵。在购买之后,这种已知的设备可以执行校准,其能够连接和校准其它空闲的麦克风。然而其缺点就是,麦克风的灵敏度被确定为应用到麦克风的预定声学输入信号与从麦克风测得的电子输出信号之间的关系。
本发明的第一目的是提供一种在起始段落中描述的、用于校准至少两个麦克风的方法,其使用灵活。
本发明的第二目的是提供一种在起始段落中描述的方法,其使用灵活。
本发明的第三目的是提供一种用于在处理器上执行的计算机程序,包括对根据本发明的方法进行编码的程序代码。
本发明的第四目的是提供一种存储根据本发明的计算机程序的数据载体。
实施本发明的第一目的,其中在校准步骤中在缺少用于产生输入音频信号的扬声器的情况下,应用能够确定灵敏度的算法。为了确定已知设备的灵敏度,需要扬声器,其发出用作麦克风的声学输入的预指定声音。在本发明的方法中,通过使用一种算法执行校准,其能够利用自然出现的声音,诸如来自人、例如执行该方法的人的语音,或者从街道上拾取的声音进行校准麦克风。这就使得该方法以及使用该方法的设备能够应用于更多实际使用的情况中,这是因为其避免了携带扬声器。
在该方法的实施例中,通过自适应波束形成滤波器处理第一和第二输入音频信号,并且通过使用该自适应波束形成滤器的加权进行计算来确定灵敏度。波束形成是一种广泛使用的算法,其通过利用多个麦克风的输入信号,用于获得说话者方向上的灵敏度增加,和/或噪音源方向上的灵敏度降低。在实施例中,使用这样一个事实可以从该波束形成器所使用的滤波器的系数推断麦克风的灵敏度。
在该方法更加具体的实施例中,该算法包括计算1LΣk=0L-1|W0(Ωk)|2]]>其中W0是自适应之后波束形成滤波器的加权的离散傅立叶变换,并且在预定数目L个频率Ωk的范围上求和。在傅立叶域进行计算能够使得灵敏度的确定更稳定。
实施第二目的,其中该处理器在缺少用于产生输入音频信号的扬声器的情况下能够确定该灵敏度。麦克风通常集成在能够校准其自身的设备中,诸如远程会议设备。
实施第三目的,其中在校准步骤中应用能够在缺少用于产生输入音频信号的扬声器的情况下确定灵敏度的算法。
实施第四目的,其中在校准步骤中应用能够在缺少用于产生输入音频信号的扬声器的情况下确定灵敏度的算法。
参照此后描述的实施方式和实施例,并且参照附图可以描述清楚根据本发明的方法、设备、计算机程序和数据载体的这些和其它方面,其中它们仅仅用于非限制性的说明。
其中

图1示意性地说明了远程会议会话;图2示意性地说明了校准第一和第二麦克风的方法;图3示意性地说明了波束形成设备;图4示意性地说明了现有技术的麦克风校准设备;图5示意性地说明了根据本发明的用于相对校准第一和第二麦克风的设备;和图6所示为数据载体。
在这些附图中,虚线所示的元件根据所想要的实施例是可选的。
在图1中,所示为远程会议会话。位于本地的人107与远程的人109通信,其例如显示在显示器111上。对于语音通信,需要音频通信装置,其通过控制台101表示。其可以包含例如按钮、小型状态显示、用于再现远程人109所发出的语音的扬声器、和麦克风。实际表明,如果位于本地的人107希望远程人109能够理解他所说的话,那么他必须非常靠近控制台101中的麦克风。如果位于本地的人107可以处在任何他想的地方将会更加实际。为了实现这一点,使用多于一个麦克风,如在图1中所示的第一麦克风103和第二麦克风105。为了更好的捕获说话者的语音,已经开发了利用多个麦克风的空间设置的技术。通过图3解释波束形成技术。存在多种应用,其可以受益于波束形成,并且特别受益于本文所描述的用于相对校准至少两个麦克风的方法。一个范例就是语音控制。例如,电视可以配备有根据关键字的远程控制。波束形成有助于降低关键字的识别故障率。而且便携设备可以配备有多于一个麦克风。
在图2中,在获取步骤ACQ中,获取来自第一麦克风205的第一输入音频信号u1和来自第二麦克风207的第二输入音频信号u2。在校准步骤CAL中,两个输入音频信号u1、u2都被用来确定第一麦克风205的第一灵敏度a1和第二麦克风207的第二灵敏度a2。
图3所示的设备241能够对多个、例如对3个麦克风的输出应用滤波求和的波束形成。第一声源是来自说话者201的语音。假定语音包含单一波长,并假定语音波阵面233是平面并且平行于穿过第一麦克风205和第二麦克风207的虚线。然后每一麦克风拾取相同的声音信号。第一麦克风205将声音转换为采样的第一电子音频信号u1,并且对第二麦克风207、以及如果存在的其它麦克风都进行该相同的应用。如果麦克风205和207的灵敏度相等,那么采样的电子音频信号u1和u2相等。进一步假定第二声源203产生例如单一波长的音乐,并且平面波阵面以角度θ进入麦克风阵列。那么音乐波阵面231到达第一麦克风205比到达第二麦克风207早。这表明电子音频信号u1和u2在某一空间波长λs的正弦波的不同相位初被采样,不同相位与入射角θ的方向和第二声源203的音乐的波长λ有关。可以设计高通空间滤波器,其传输具有无限空间波长λs的来自说话者201的语音,但是阻挡来自第二声源203的不想要的干扰。对于固定位置、单一波长声源,由每一麦克风的单一乘法系数组成的空间滤波器就足够了。
对于发射多个波长的宽带声源,在每一麦克风后面放置时间滤波器,而不是单一乘法系数。例如,第一时间滤波器221对第一麦克风205的电子信号u1进行滤波。u1的连续采样被延迟部件例如第一延迟部件227延迟,并且将延迟后的采样乘以滤波器系数例如第二滤波器系数228,并通过加法器例如第一加法器229加到一起。滤波器系数的数目取决于需要多少来自声音信号的采样,并取决于有多少计算资源可用。时间滤波器221和223的输出通过空间求和230进行求和,以得到时空滤波器输出z。可以通过等式1对时空滤波器240进行数学描述z(n)=Σm=1MΣl=1Nwm(l)um(n-lT)---[1]]]>在等式1中描述了一个滤波后求和波束形成器,n是离散时间索引,l是滤波器系数w的索引,T是采样之间的时间差,并且m是对应于麦克风(205和207)和时间滤波器(221和223)其中之一的麦克风索引。
为了适当地滤波出干扰第二声源203的音频信号,在波束形成的自适应阶段期间滤波器系数必须具有适当的值。如果自适应使用例如使得z(n)的幂最大化的算法,在对于所有的频率Ωk的限制下,都满足下面的条件Σm=1M|Wm(Ωk)|2=C(Ωk)2---[2],]]>
其中Wm(Ωk)是滤波器wm(n)的离散傅立叶变换,并且C是常数,那么在自适应之后最佳滤波器系数满足等式3Wmo(Ωk)=α(Ωk)C(Ωk)Hm*(Ωk)Σm=1M|Hm(Ωk)|2---[3].]]>在等式3中,Hm*(Ωk)是具有索引为m的麦克风的声音脉冲响应的离散傅立叶变换的复共轭。例如图2中的第一声音脉冲响应h1是对从说话者201到第一麦克风205的声音传输进行建模的声音脉冲响应。α(Ωk)是所有时间滤波器221、223和225所共有的全通项。
对于类似于音乐波阵面231的平面波阵面,声学传递函数是传播延迟,并且从而对于每一频率k和麦克风索引m,应用等式4|Hm(Ωk)|2=1[4].
这个模型在混响室中就太简单了。例如从说话者201直接传播到例如第一麦克风205的声音可以积极地或破坏性地干涉例如说话者201的声音在附近的墙壁上的第一反射。这可以表明,例如在第一麦克风205的位置上几乎不存在频率Ωk的任何声功率。对于所有可能的频率Ωk,在麦克风例如第一麦克风205的空间位置上将出现这种干涉是不可能的。因此等式5是非常有可能有效12NΣk=02N-|Hm(Ωk)|2≈1---[5].]]>使用等式5,其保证可以与麦克风205和207大致相等地传输来自说话者201的声音,可以证明每一麦克风的相对灵敏度αm符合等式6αm=12NΣk=02N-1|Wwo(Ωk)|2---[6].]]>因此为了使得麦克风205和207有同样的灵敏度,可以引入校正因子-图2中的211和213--其乘以电子音频信号u1和u2。可以按照等式7来计算这些校正因子bm=cαm---[7],]]>其中c是常数。
执行滤波后求和波束形成器[3]的时空滤波器240识别在校准期间测得的声源与适于对所有麦克风所共有的未知误差因子的麦克风之间的声学传递函数。该误差因子对所有的麦克风是共有的这一事实就使得麦克风能够相对于彼此进行校准。
如果说话者离开麦克风某一距离,例如坐在椅子上看电视,该电视具有用于语音命令的多个麦克风,该方法工作很好,因为声音脉冲响应h1和h2与传播延迟相似,这意味着所有的麦克风接收基本上相同的声音作为输入。如果在某一频率处从例如附近墙壁到麦克风出现强烈的混响,该方法就可能工作不太好。通过修改算法可以丢弃不合理的频率区域,通过使用等式8代替等式6dm=12NiΣiΣk=kiki+1|Wwo(Ωk)|2---[8]]]>在i个频率间隔[ki,ki+1]上进行等式8中的求和,其中例如不会出现不合逻辑的大的值Wm(Ωk)。如果该求和覆盖相当多的频率Ωk,dm仍然还是第m个麦克风的相对灵敏度的可靠测量。Ni是所有间隔[ki,ki+1]中共同的频率总数。为了增加精确度,有利地也从该求和中去掉最低和最高频率,因为某些麦克风在这些频率区域中具有虚假的行为。
图4所示为现有技术的麦克风校准设备。将电子扬声器音频信号e从信号源304发送到扬声器301,其中将信号转换成通过麦克风303拾取的声音302。麦克风303将该声音转换为电子麦克风音频信号s。在该已知的设备中,需要将该扬声器音频信号e和该麦克风音频信号s都发送给处理器305,其可以从这两个音频信号中确定麦克风灵敏度307。在当前发明中,该校准算法不需要扬声器音频信号e。类似于扬声器201的声源输入是足够的。
图5所示为根据本发明相对校准第一和第二麦克风403和405的设备401。处理器407可以使用来自第一麦克风403的第一音频信号和来自第二麦克风405的第二音频信号。可以在处理器407上运行根据本发明的算法,例如参照图3所述的,其例如在某一时间量之后校准麦克风403和405,以抵消时间变化影响,诸如元件老化或温度相关的影响。另一选项是用户按动例如按钮409并启动校准,例如在每次他将该设备带入具有不同声音脉冲响应的不同房间中时。
一个感兴趣的选项是,通过添加语音检测器,只在进入麦克风中的声音是语音时进行校准。
图6所示为用于存储在处理器上执行的计算机程序的数据载体,其描述了根据本发明用于校准第一和第二麦克风的方法。
应该注意到,上述实施例的描述不是对本发明的限制,并且不脱离权利要求书的范围内本领域的技术人员可以设计出替换形式。除了如权利要求中的组合对本发明的元件进行组合之外,本发明也包括本领域的技术人员在本发明的范围中可以得到的其它元件组合。可以在单个专用元件中实现元件的任何组合。权利要求中括号之间的任何附图标记都不意欲限制权利要求。词语“包括”并不排除没有列出在权利要求中的元件或方面。元件前面的词语“一个”并不排除存在多个这样的元件。
本发明可以通过硬件或运行在计算机上的软件实现。
权利要求
1.一种校准第一麦克风和第二麦克风的方法,包括获取步骤,其中通过第一麦克风获取第一输入音频信号,和通过第二麦克风获取第二输入音频信号;校准步骤,其中确定第一麦克风的第一灵敏度和第二麦克风的第二灵敏度,其特征在于,在校准步骤中能够在缺少用于产生输入音频信号的扬声器的情况下,使用能够确定灵敏度的算法。
2.如权利要求1中的方法,其特征在于通过自适应波束形成滤波器处理第一和第二输入音频信号,并且通过使用自适应波束形成滤波器的加权进行计算来确定灵敏度。
3.如权利要求2中校准第一和第二麦克风的方法,其特征在于该算法包括计算1LΣk=0L-1|W0(Ωk)|2]]>其中W0是自适应之后波束形成滤波器的加权的离散傅立叶变换,并且在预定数目L个频率Ωk的范围上求和。
4.一种设备,其包括分别用于获取第一和第二输入音频信号的第一麦克风和第二麦克风,和用于确定第一麦克风的第一灵敏度和第二麦克风的第二灵敏度的处理器,其特征在于,该处理器能够在缺少用于产生输入音频信号的扬声器的情况下确定灵敏度。
5.一种用于通过处理器执行的计算机程序,其描述了校准第一麦克风和第二麦克风的方法,该方法包括获取步骤,其中通过第一麦克风获取第一输入音频信号,和通过第二麦克风获取第二输入音频信号;校准步骤,其中确定第一麦克风的第一灵敏度和第二麦克风的第二灵敏度,其特征在于,在校准步骤中能够在缺少用于产生输入音频信号的扬声器的情况下,使用能够确定灵敏度的算法。
6.一种存储有通过处理器执行的计算机程序的数据载体,该计算机程序描述了校准第一麦克风和第二麦克风的方法,该方法包括获取步骤,其中通过第一麦克风获取第一输入音频信号,和通过第二麦克风获取第二输入音频信号;校准步骤,其中确定第一麦克风的第一灵敏度和第二麦克风的第二灵敏度,其特征在于,在校准步骤中能够在缺少用于产生输入音频信号的扬声器的情况下,使用能够确定灵敏度的算法。
全文摘要
一种用于相对校准至少两个麦克风(205、207)的方法,其不需要来自扬声器(301)的受控音频输入,而能够获取麦克风的相对灵敏度(a1、a2)。为了确定麦克风的灵敏度(a1、a2),校准算法(CAL)在自适应之后使用波束形成滤波器的系数(w1、w2、w3)。
文档编号H04R3/04GK1682566SQ03821653
公开日2005年10月12日 申请日期2003年8月6日 优先权日2002年9月13日
发明者D·A·C·M·鲁维斯, M·B·根诺特 申请人:皇家飞利浦电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1