麦克风校准的制作方法_5

文档序号:9650927阅读:来源:国知局
准轮廓补偿传入信号的TFR并将其提供给应用模块312。在一些实 施例中,校准模块306可W在存储器中存储校准曲线。 阳20引随后,应用模块312可W使用校准的数据样本,W使能应用程序。例如,应用模 块312可被配置成执行声信号盲源分离。应用模块312也可W被配置为执行语音识别,W 从信号的输入流中去除背景噪音,W提高输入信号的音频质量,或执行波束成形,W提高 系统的灵敏度为特定的音频源。应用模块312可被进一步配置为执行在美国临时专利中 61/764290和61/788521公开的操作,两者题为"SIGNALSOURCE沈PARATI0N",运两者都 是通过引用整体并入本文。例如,应用模块312可被配置为从特定的到达方向选择数据样 本,使得从特定方向的声信号由系统中的随后块处理。应用模块312可被配置成执行概率 推理。例如,应用模块312可被配置成对图形模型执行置信传播。在一些情况下,所述图形 模型可是基于因素图的图形模型;在其他情况下,所述图形模型可W是分层结构图形模型; 在其它情况下,所述图形模型可W是马尔可夫随机场(MRF);在其他情况下,所述图形模型 可W是条件随机场(CRF)。 阳209] 图10A-10D示出根据一些实施例使用所公开的校准机构校准麦克风的优势。图 IOA表示声信号的地面实况到达方向值OA)。图IOA的亮度表示DOA的弧度。图IOB示出 不补偿麦克风之间的相对相位误差(例如,没有校准模块306)所估计的D0A。图IOC示出 通过补偿麦克风之间的相对的相位误差(例如,使用校准模块306)所估计的D0A。图IOD 示出对其估计DOA的信号的能量。
[0210] 一般来说,相比于使用校准估计的D0A,无校准估计的DOA更多噪音。事实上,无校 准的DOA估计实际上作为频率的函数漂移,运对于校准估计的DOA并非如此。因此,幅度校 准因子和相对相位误差的建议校准对于应用模块312是有用的。 悦11] 另外,在一般情况下,校准估计的DOA随着时间改进。运一现象说明,当随时间校 准模块304接收附加数据样本时,校准轮廓估计变得更好。当与被测信号相关联的能量较 低(例如,低于麦克风的噪声水平)时,DOA估计不一样稳定。运是因为当信号电平较低时, 不存在信号来估计D0A。在一些实施例中,麦克风信号可使用去噪模块在应用模块312使用 之前去噪。 阳21引在一些实施例中,校准模块306可使用自适应滤波技术估计校准轮廓 。巧=乂仍)cxp(/'則化)图11示出根据在根据一些实施例的自适应滤波技术的校准轮廓估 ;〇 计方法。在步骤1102,校准模块306可W接收在时间帖n=T的TFR样本。 阳21引在步骤1104中,校准模块可估计TFR样本Mi[n=T,Q]的DOA0。如W上所讨 论,在一些实施例中,可使用多信号分类(MUSIC)法、ESH?口法或束形成方法估计DOA0。 [0214] 在一些实施例中,可通过求解线性方程的系统估计输入声音信号的DOA0 :
[0216] 其中,扣化巧是第i个麦克风和基准麦克风(例如,在时间帖T)之间的相对相位 延迟,fs是在ADC302的采样频率,Q是在频域中,P表示时间-频率转换的变换频段(例 如,分辨率)的数目,诸如STFT,V是声信号的转速,是表示第i个麦克风相对于基准麦 克风的位置的二维向量,并且0是声信号的D0A。线性方程系统可W相对于DOA0来求解, W找到输入TFRMi[n=T,Q]的D0A。TFRMi[n=T,Q]的DOA可W表示为0T。相对相 位延迟扣听,巧可W使用上面关于图4、8公开的技术测量或估计。DOA0T可使用上文关于图 4、8公开的技术来估计。
[0217] 随后,校准模块306可W补偿TFRMJnn=T,Q]的相对相位延迟,由于DOA0T。 该补偿TFR样本柄,扣=r,Q]可W计算如下: 阳2化]
[0219] 如果所有麦克风具有相同的幅度响应和相同的相位响应(例如,为零的相对相位 误差,),则所有麦克风的补偿TFR样本= 应该是相同的。经补偿的TFR样本中的任 何差别可W归因于幅度校正因子和相对相位误差。
[0220] 在步骤1106中,校准模块306可W转换补偿TFR样本MJn= :T,n]到时域信号/?斯。 例如,校准模块306可W对补偿TFR样本操作逆时频变换。 阳221] 在步骤1108中,校准模块306可确定线性滤波器gi(t),其映射第i个麦克风的时 域信号而;(0到基准麦克风的时域信号: 阳。2]
阳223] 其中0表示卷积运算符。运样,线性滤波器gi(t)可W考虑第i个麦克风和基准麦 克风之间的任何相对相位敏感性和的相对相位误差。校准模块306可m十算在具有(i+1) 麦克风的麦克风阵列中第i个麦克风的线性滤波器gi(t)。 阳224] 在一些实施例中,校准模块306可W使用自适应滤波技术识别运样的线性滤波器 gi(t)。自适应滤波技术可包括最小均方过滤技术、递推最小二乘滤波技术、多延迟块频域 自适应滤波器技术、内核自适应滤波器技术和/或维纳化Pf方法。在声学回声消除应用中 使用的自适应滤波技术也可用于识别运样的线性滤波器gl(t)。
[0225] 在一些实施例中,校准轮廓可被表示为线性滤波器gi(t)。在其他实施例中,校准 轮廓可被表示为线性滤波器gi(t)的TFR。为此,在步骤1110中,校准模块306可任选地计 算线性滤波器gi(t)的TRF。 阳226] 在一些实施例中,校准模块306可W被配置成通过内插校准因子在不同的频率来 减少计算量。校准模块306可W被配置为维持(1) 一组频率的幅度校正因子和/或相对相 位误差之间的映射和(2)不包括在该组频率中的频率的幅度校准因子和/或相对相位误 差。 阳227] 在校准会话期间,校准模块306可经配置W确定频率组的幅度校正因子和/或相 对相位误差。然后,并非也确定不包括在频率组中的频率的幅度校正因子和/或相对相位 误差,校准模块306可W使用映射来估计不包含在频率组中的频率的幅度校准因子和/或 相对相位误差。W此方式,校准模块306可W减少对于关注的所有频率确定幅度校准因子 和/或相对相位误差的计算量。在某些情况下,校准模块306确定的幅度校准因子和/或 相对相位误差的频率组可包括少至一个频率。
[0228] 在一些实施例中,校准模块306可经配置W使用回归函数确定映射。在一些情况 下,回归函数可W经配置W基于频率组的幅度校准因子和/或相对相位误差而近似于未包 含在频率组的幅度校正因子和/或相对相位误差的样条曲线的一个或多个参数。在其他情 况下,回归函数可W被配置为基于该频率组的幅度校准因子和/或相对相位误差而估计未 在频率组中的每个频率的幅度校准因子和/或相对相位误差的实际值。
[0229] 所公开的装置和系统可W包括计算设备。图12是根据一些实施例的计算装置的 框图。框图显示计算设备1200,其包括处理器1202、存储器1204、一个或多个接口 1206、数 据准备模块304、具有幅度校准模块308和相位校准模块310的校准模块306,和应用模块 312。计算设备1200可W包括附加的模块、更少的模块或模块的任何其它合适的组合,W执 行任何适当的操作或组合操作。 阳230] 设备1200可W与其他计算设备(未示出)经由接口 1206通信。接口 1206可W W硬件实现,W发送和接收各种介质中的信号,诸如光、铜和无线,W及非瞬态的多个不同 协议中一些。 阳231] 在一些实施例中,一个或多个模块304、306、308、310W及312可W在软件中使用 存储器1204实施。存储器1204也能保持麦克风的校准曲线。存储器1204可W是非临时 性计算机可读介质、闪速存储器、磁盘驱动器、光盘驱动器、可编程只读存储器(PROM)、只读 存储器(ROM)或任何其它存储器或组合存储器。该软件可在处理器1202能够执行计算机 指令或计算机代码的运行。处理器1202也可在硬件使用专用集成电路(ASIC)、可编程逻 辑阵列(PLA)、数字信号处理器值SP)、现场可编程口阵列(FPGA)或任何其它集成电路中实 现。 阳232] -个或多个模块304、306、308、310和312可W使用ASIC、PLA、DSP、FPGA或任何其 它集成电路W硬件来实现。在一些实施例中,两个或多个模块304、306、308、310和312可W实施在相同的集成电路,如ASIC、PLA、DSP或FPGA,从而形成片上系统。 阳233] 在一些实施例中,计算设备1200可W包括用户设备。用户设备可W与一个或多个 无线电接入网络W及有线通信网络通信。用户设备可W是具有语音通信能力的蜂窝电话。 用户设备也可W是智能电话提供服务,如文字处理、web浏览、游戏、电子书能力、操作系统 和全键盘。用户设备也可W是提供由智能电话所提供的网络接入和大多数服务的平板计算 机。用户设备使用操作系统(诸如,Symbian0S、iPhone0S、RIM黑替、WindowsMobile、 Linux、HPWebOS和An化oid)操作。屏幕可W是用于将数据输入到移动设备的触摸屏,在 运种情况下,屏幕可W用来代替全键盘。用户设备也可W保持全球定位坐标、简档信息或其 他位置信息。
[0234] 计算设备1200还可W包括能够任何平台计算和通信。非限制性实例可包括电视 灯V)、视频投影机、机顶盒或机顶单元、数字视频录像机值VR)、电脑、上网本、笔记本电脑W 及任何其他音频/视频用的计算能力的设备。该计算设备1200可进行配置一个或多个处 理器,其处理指令和运行在存储器中存储的软件。处理器还使用存储器和接口通信,W与其 他设备进行通信。该处理器可W是任何适用的处理器,例如结合有CPU、应用处理器和闪存 系统的单忍片。该计算设备1200还可W提供各种用户接口,诸如键盘、触摸屏、轨迹球、触 摸垫和/或鼠标。在一些实施例中,该计算设备1200还可W包括扬声器和显示设备。
[0235] 计算设备1200还可W包括生物医学电子设备。生物医疗电子设备可W包括助听 器。该计算设备1200可W是消费设备(例如,电视机或微波炉),和校准模块可促进增强的 音频输入进行语音控制。在一些实施例中,计算设备1200可W被集成到更大的系统,W便 音频处理。例如,计算设备1200可W是汽车的一部分,并且可W促进人人和/或人机交流。 阳236]图13A-13B示出根据一些实施例可用于结合所公开的校准过程的一组麦克风。该 组麦克风可W放置在麦克风单元1302。麦克风单元1302可W包括多个麦克风204。每个 麦克风可包括MEMS元件1306被禪合到在1. 5毫米-2毫米方形结构布置的四个端口之一。 多个麦克风的MEMS元件可W共享公共的后音量1304。可选择地,每个元件可W用单独的分 配后音量。 阳237]更一般地,麦克风包括多个端口,多个元件分别连接到一个或多个端口,并且端口 之间可能禪合(例如,用端口之间特定禪合或使用一个或多个公共后音量)。运种更复杂的 安排可W结合物理定向、频率和/或噪声消除特性W提供适当的输入,W便进一步处理。
[0238]在一些实施例中,麦克风单元1302也可W包括一个或多个数据准备模块304、幅 度校准模块308和相位校准模块310。W运种方式,麦克风单元1302可W成为自校准麦克 风单元,其可禪合到计算系统,而不需要计算系统校准麦克风单元1302的音频数据。在一 些情况下,数据准备模块304、幅度校准模块308和/或麦克风单元1302中的相位校准模块 310可W被实现为硬连线系统。在其他情况下,数据准备模块304、幅度校准模块308W及 麦克风单元1302中的相位校准模块310可W被配置成使处理器执行与各个模块相关的方 法步骤。在一些情况下,麦克风单元1302也可W包括应用模块312,从而提供智能麦克风单 JL O 阳239]麦克风单元1302可W使用接口与其它设备进行通信。接口可W在硬件中实现,W发送和接收各种介质中的信号,诸如光、铜和无线,W及其中可是非瞬态的许多不同的协 议。
[0240]应当理解,所公开的主题不局限于应用到构造的细节,并示于下面的描述或附图 中所示部件的布置。所公开的主题能够被实践和W各种方式进行了。此外,要理解,本文所 采用的措辞和术语是为了描述的目的,而不应被认为是限制。 阳241] 运样,本领域的技术人员将理解,本公开所基于的概念可容易地被用作用于设计 其它结构、方法和系统的基础,应用实施公开主题的若干目的。运一点很重要,因此,权利要 求被认为包括运些等价构造,只要它们不脱离所公开主题的精神和范围。例如,所公开的步 骤可W由一个或多个变量进行。运种关系可W用数学公式表示。然而,本领域的普通技术 人员也可W使用不同的数学方程式通过变换所公开的数学等式表达一个或多个变量之间 的关系。重要的是,权利要求被视为包括一个或多个变量之间的运样的等效关系。 阳242] 虽然在前述示范性描述和示出实施例本公开的主题,应该理解的是,本公开内容 已经仅通过举例的方式进行,并且可对所公开主题的细节进行许多变化,而不背离所公开 主题的精神和范围。
【主权项】
1. 一种装置,包括: 接口,经配置为接收第一数字化信号流和第二数字化信号流,其中,所述第一数字化信 号流和第二数字化信号流对应于分别由第一麦克风和第二麦克风捕获的声音信号; 与所述接口通信的处理器,配置成运行在存储器中存储的模块,其中所述模块经配置 以: 确定第一数字化信号流的第一时间-频率和第二数字化信号流的第二时间-频率表 示,其中,第一时间-频率表示指示第一数字化信号流在多个时间帧对于多个频率的幅度, 并且其中所述第二时间-频率表示指示第二数字化信号流在多个时间帧对于多个频率的 幅度; 确定第一时间-频率表示和第二时间-频率表示在多个时间帧对于第一多个频率之间 的关系;和 基于第一时间-频率表示和第二时间-频率表示,确定第一麦克风和第二麦克风对于 第一多个频率的幅度校准因子之间的关系。2. 如权利要求1所述的装置,其中,所述模块经配置以确定所述第一时间-频率表示和 由第二时间-频率表示法之间的关系: 对于第一多个频率,确定所述第二时间-频率表示和第一时间-频率表示对于每个所 述多个时间帧的比例;和 确定对应于第一所述多个频率的比例的直方图。3. 如权利要求2所述的装置,其中,所述模块被配置为基于直方图中比例的计数确定 幅度校准因子。4. 如权利要求3所述的装置,其中,所述模块被进一步配置为: 基于多个直方图确定对应于多个频率的多个幅度校准因子,其中所述多个直方图分别 对应于多个频率;和 平滑和至少两个所述多个频率相关联的幅度校准因子。5. 如权利要求3所述的装置,其中,所述模块被配置为通过识别直方图中最高计数的 比例,而确定第一多个频率的幅度校准因子。6. 如权利要求1所述的装置,其中,所述模块被配置成通过识别线而确定关系,所述线 建模第一时间-频率表示和第二时间-频率表示对
当前第5页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1