用于估计到达方向的系统、方法和设备的制作方法

文档序号:6214138阅读:180来源:国知局
用于估计到达方向的系统、方法和设备的制作方法
【专利摘要】本发明描述用于将成对差异(例如,相位延迟测量)匹配到源方向候选者的存量且应用成对源方向估计的系统、方法和设备。
【专利说明】用于估计到达方向的系统、方法和设备
[0001] 根据35U. S. C. § 119丰张优先权
[0002] 本专利申请案主张2012年4月13日申请且转让给本受让人的标题为"用于 估计到达方向的系统、方法和设备(SYSTEMS,METHODS,AND APPARATUS FOR ESTIMATING DIRECTION OF ARRIVAL)"的第61/624, 181号临时申请案的优先权。本专利申请案还主 张2012年5月4日申请且转让给本受让人的标题为"用于估计到达方向的系统、方法和 设备(SYSTEMS,METHODS,AND APPARATUS FOR ESTIMATING DIRECTION OF ARRIVAL),,的 第61/642, 954号临时申请案的优先权。本专利申请案还主张2012年11月14日申请且 转让给本受让人的标题为"用于估计到达方向的系统、方法和设备(SYSTEMS,METHODS,AND APPARATUS FOR ESTIMATING DIRECTION OF ARRIVAL)"的第61/726, 336 号临时申请案的优 先权。本专利申请案还主张2012年10月12日申请且转让给本受让人的标题为"用于映射 坐标的系统和方法(SYSTEMS AND METHODS FOR MAPPING COORDINATES)" 的第 61/713, 447 号临时申请案的优先权。本专利申请案还主张2012年10月15日申请且转让给本受让人的 标题为"用于映射座标的系统和方法(SYSTEMS AND METHODS FOR MAPPING COORDINATES)" 的第61/714, 212号的临时申请案的优先权。

【技术领域】
[0003] 本发明涉及音频信号处理。

【背景技术】
[0004] 图1展示多麦克风手持机H100的实例,所述多麦克风手持机包含轴线在装置的正 面的左右方向上的第一麦克风对MV10-UMV10-3,及轴线在前后方向上(即,正交于正面) 的第二麦克风对MV10-UMV10-2。此类布置可用以确定用户何时在装置的正面说话(例如, 浏览-通话模式)。来自前-后麦克风对的信息可用以解析左-右麦克风对自身通常无法 解析的前后方向之间的模糊性。


【发明内容】

[0005] -种根据一股配置的处理多通道信号的方法包含对于所述多通道信号的第一通 道对,计算第一多个方向拟合性量度(例如,方向误差或似然度),其中所述第一多个方向 拟合性量度当中的每一者是基于多个候选方向当中的一个对应不同候选方向。此方法包 含对于所述多通道信号的不同于所述第一对的第二通道对,计算第二多个方向拟合性量度 (例如,方向误差或似然度),其中所述第二多个方向拟合性量度当中的每一者是基于所述 多个候选方向当中的一个对应不同候选方向。此方法包含基于所述第一多个方向拟合性量 度和所述第二多个方向拟合性量度从所述多个候选方向当中选择第一方向。在此方法中, 所述第一多个方向拟合性量度中的每一者是基于所述第一对的所述通道之间在所述多通 道信号的第一频率分量处的差异,且所述第二多个方向拟合性量度中的每一者是基于所述 第二对的所述通道之间在所述第一频率分量处的差异。还揭示具有有形特征的计算机可读 存储媒体(例如,非暂时性媒体),所述有形特征致使读取所述特征的机器执行此类方法。
[0006] -种根据一股配置的处理多通道信号的设备包含用于对于所述多通道信号的第 一通道对计算第一多个方向拟合性量度的装置,其中所述第一多个方向拟合性量度当中的 每一者是基于多个候选方向当中的一个对应不同候选方向。此设备包含用于对于所述多通 道信号的不同于所述第一对的第二通道对计算第二多个方向拟合性量度的装置,其中所述 第二多个方向拟合性量度当中的每一者是基于所述多个候选方向当中的一个对应不同候 选方向。此设备包含用于基于所述第一多个方向拟合性量度和所述第二多个方向拟合性量 度从所述多个候选方向当中选择第一方向的装置。在此设备中,所述第一多个方向拟合性 量度中的每一者是基于所述第一对的所述通道之间在所述多通道信号的第一频率分量处 的差异,且所述第二多个方向拟合性量度中的每一者是基于所述第二对的所述通道之间在 所述第一频率分量处的差异。
[0007] 根据一股配置的用于处理多通道信号的另一设备包含量度计算器,所述量度计算 器经配置以进行以下操作:对于所述多通道信号的第一通道对,计算第一多个方向拟合性 量度,其中所述第一多个方向拟合性量度当中的每一者是基于多个候选方向当中的一个对 应不同候选方向;以及对于所述多通道信号的不同于所述第一对的第二通道对,计算第二 多个方向拟合性量度,其中所述第二多个方向拟合性量度当中的每一者是基于所述多个候 选方向当中的一个对应不同候选方向。此设备包含选择器,所述选择器经配置以基于所述 第一多个方向拟合性量度和所述第二多个方向拟合性量度从所述多个候选方向当中选择 第一方向。在此设备中,所述第一多个方向拟合性量度中的每一者是基于所述第一对的所 述通道之间在所述多通道信号的第一频率分量处的差异,且所述第二多个方向拟合性量度 中的每一者是基于所述第二对的所述通道之间在所述第一频率分量处的差异。

【专利附图】

【附图说明】
[0008] 图1展示多麦克风手持机H100的多个视图。
[0009] 图2展示用于便携式多麦克风装置的五个不同握持位置的实例。
[0010] 图3A展示根据一股配置的方法M10的流程图。
[0011] 图3B展示相对于麦克风对的平面波传播的远场模型。
[0012] 图3C展示任务T10的实施方案T12。
[0013] 图3D展示任务T10的实施方案T14。
[0014] 图4A展示针对四个不同D0A的经解缠相位延迟对频率的曲线图,且图4B展示针 对相同D0A的经缠绕相位延迟对频率的曲线图。
[0015] 图5A展示两个D0A候选者的所测量的相位延迟值及所计算的值的实例。
[0016] 图5B展示计算帧的D0A差的实例。
[0017] 图6A展示似然度计算的实例。
[0018] 图6B说明缩减的候选方向组。
[0019] 图6C和6D说明用于任务T20和T30的迭代实施的后续阶段的候选方向的搜索组。
[0020] 图7和8展示偏差移除的实例。
[0021] 图9展示在帧及频率上绘制所估计的D0A处的源活动似然度的角度图的实例。
[0022] 图10A展示方法M10的实施方案M20的流程图。
[0023] 图10B展示方法M10的实施方案MA20的流程图。
[0024] 图10C展示计算D0A估计的实例。
[0025] 图10D展示识别每一频率的D0A估计的实例。
[0026] 图11A展示方法M20的实施方案M25的流程图。
[0027] 图11B展示线性阵列中的多个麦克风对。
[0028] 图11C展示使用所计算的似然度来识别针对给定频率的最佳麦克风对及最佳D0A 候选者的实例。
[0029] 图12A说明用于缩减频率分量空间中的搜索的策略的实例。
[0030] 图12B展示沿着电视屏幕的顶部边缘布置的麦克风的线性阵列。
[0031] 图13A展示方法M10的实施方案M30的流程图。
[0032] 图13B展示方法M30的实施方案M100的流程图。
[0033] 图13C展示方法M100的实施方案M110的流程图。
[0034] 图14A展示根据一股配置的设备A5的框图。
[0035] 图14B展示设备A5的实施方案A10的框图。
[0036] 图14C展示设备A10的实施方案A15的框图。
[0037] 图14D展示根据一股配置的设备MF5的框图。
[0038] 图14E展示设备MF5的实施方案MF10的框图。
[0039] 图15A展示设备MF10的实施方案MF15的框图。
[0040] 图15B展示1-D测量的模糊性的实例。
[0041] 图15C展示混淆锥的一个实例。
[0042] 图16展示扬声器电话应用中的源混淆的实例。
[0043] 图17A展示2-D麦克风阵列。
[0044] 图17B展示根据一股配置的方法M200的流程图。
[0045] 图17C展示在平面极坐标图显示器上展示的D0A估计的实例。
[0046] 图18A和18B展示在1-D估计的正负号与平面的对应象限之间的对应性。图18C 展示正负号元组的四个值与平面的象限之间的对应性。
[0047] 图18D展示根据替代性映射的360度显示器。
[0048] 图19A展示2-D麦克风阵列。
[0049] 图19B展示2-D麦克风阵列的另一实例。
[0050] 图19C展示其中点源升高到阵列平面上方的通用情况的实例。
[0051] 图20A到20D展示一对D0A估计到阵列平面中的角度的转换的推导。
[0052] 图20E展示所估计仰角角度的计算。
[0053] 图21A展示通过将替代映射应用于图19B的估计而获得的曲线图。
[0054] 图21B展示相交混淆锥的实例。
[0055] 图21C展示图21B的锥体的相交线。
[0056] 图22A展示麦克风阵列MC10-MC20-MC30的实例。
[0057] 图22B到22E展示一对D0A估计到阵列平面中的角度的转换的推导。
[0058] 图23A展示根据一股配置的方法M300的流程图。
[0059] 图23B展示任务TB300的实施方案TB302的流程图。
[0060] 图23C展示根据一股配置的设备A300的框图。
[0061] 图23D展示根据一股配置的设备MF300的框图。
[0062] 图24A展示方法M300的实施方案M320的流程图。
[0063] 图24B展示方法M320的实施方案M325的流程图。
[0064] 图25A展示方法M300的实施方案M330的流程图。
[0065] 图25B展示所估计仰角角度的指示的显示实例。
[0066] 图25C展示方法M330的实施方案M340的流程图。
[0067] 图26A和26B分别展示旋转前后的显示器的实例。
[0068] 图27A和27B分别展示旋转前后的显示器的实例。
[0069] 图28A展示其中装置坐标系E与世界坐标系对准的实例。
[0070] 图28B展示其中装置相对于世界坐标系旋转的实例。
[0071] 图28C展示D0A到世界参考平面上的投影的到装置的显示平面上的透视映射。
[0072] 图29A展示投影到世界参考平面上的D0A的透视映射显示的实例。
[0073] 图29B展示方法M300的实施方案M350的流程图。
[0074] 图29C展示用于输入的用户接口元件的实例。
[0075] 图30A到30C展示用户接口的实例。
[0076] 图31A及31B展示其中使用定向传感器来跟踪装置的定向的实例。
[0077] 图32A展示设备MF300的实施方案MF320的框图。
[0078] 图32B展示设备MF320的实施方案MF325的框图。
[0079] 图32C展示设备A300的实施方案A320的框图。
[0080] 图33A展示设备MF300的实施方案MF330的框图。
[0081] 图33B展示设备MF330的实施方案MF340的框图。
[0082] 图33C展示设备MF300的实施方案MF350的框图。
[0083] 图33D展示设备A300的实施方案A330的框图。
[0084] 图33E展示设备A300的实施方案A350的框图。
[0085] 图34A和34B说明其中源相对于2-D麦克风阵列移动的情形。
[0086] 图35和36展示用2-D麦克风阵列在如图34A中所示的情形中获得的观测结果的 实例。
[0087] 图37展示其中对如图35和36中所示的观测结果加以组合的实例。
[0088] 图38展示其中对如图34B中所示的情形中的观测结果加以组合的实例。
[0089] 图39和40展示用于如图41中所示的会议-呼叫情形的组合观测结果的实例。
[0090] 图42和43展示针对如图44A中所示的动态情形的组合观测结果的实例。
[0091] 图45和46展示针对如图44B中所示的具有道路噪声的动态情形的组合观测结果 的实例。
[0092] 图47展示D0A跟踪的实例。
[0093] 图48A到48D相对于不同阵列配置展示源D0A的实例。
[0094] 图49A展示根据一股配置的方法MC100的流程图。
[0095] 图49B展示任务TC200的实施方案TC202的流程图。
[0096] 图49C展示任务TC200的实施方案TC204的流程图。
[0097] 图49D展示共面麦克风对。
[0098] 图49E展示具有两个麦克风对的三麦克风阵列。
[0099] 图50A展示成对导向向量。
[0100] 图50B展示用于图50A的向量的元素的索引标号。
[0101] 图50C展示不共面的麦克风对。
[0102] 图50D展示成对导向向量的阵列导向矩阵的实例。
[0103] 图51A展示用于图50D中所示的矩阵A的表达式A+x = y的实例。
[0104] 图51B展示图51A的实例的一股化。
[0105] 图52A展示正则化操作的实例。
[0106] 图52B展示归一化操作的实例。
[0107] 图53A到53D和54A到54D展示使阵列导向矩阵的行重叠的两个不同实例。
[0108] 图55A展示其它麦克风阵列配置的若干实例。
[0109] 图55B展示成对的归一化最小方差无失真响应波束成形器/零陷波束成形器的实 例。
[0110] 图56A展示根据此类一股配置的处理多通道信号的方法MD100的流程图。
[0111] 图56B展示根据一股配置的设备MFC100的框图。
[0112] 图56C展示装置FC200的实施方案FC202的框图。
[0113] 图56D展示装置FC200的实施方案FC204的框图。
[0114] 图57A展示根据一股配置的用于处理多通道信号的设备MFD100的框图。
[0115] 图57B展示根据一股配置的设备AC100的框图。
[0116] 图57C展示鉴别器C200的实施方案C204的框图。
[0117] 图57D展示根据一股配置的用于处理多通道信号的设备AD100的框图。
[0118] 图57E展示根据一股配置的集成方法MG100的流程图。
[0119] 图58A展示如本文所描述的源方向估计的集成方法的一个实例流程图。
[0120] 图58B展示方法MG100的实施方案MG110的流程图。
[0121] 图58C展示方法MG110的实施方案MG120的流程图。
[0122] 图59A展示电话设计,且图59B到59D展示与对应的可视化显示器一起在各种模 式中使用此类设计。
[0123] 图60A展示音频预处理级AP10的框图。
[0124] 图60B展示音频预处理级AP10的三通道实施方案AP20的框图。
[0125] 图61A展示通信装置D10的框图。
[0126] 图61B展示无线装置1102的框图。

【具体实施方式】
[0127] 除非通过其上下文明确限制,否则在本文中使用术语"信号"来指示其一股含义中 的任一者,包含如在导线、总线或其它传输媒体上表达的存储器位置的状态(或存储器位 置组)。除非通过其上下文明确地限制,否则在本文中使用术语"产生"来指示其一股含义 中的任一者,例如计算或以其它方式产生。除非通过其上下文明确限制,否则在本文中使用 术语"计算"来指示其一股含义中的任一者,例如计算、评估、估计,和/或从多个值进行选 择。除非通过其上下文明确地限制,否则使用术语"获得"来指示其一股含义中的任一者, 例如计算、导出、接收(例如,从外部装置接收),和/或检索(例如,从存储元件的阵列检 索)。除非通过其上下文明确地限制,否则使用术语"选择"来指示其一股含义中的任一者, 例如识别、指示、应用和/或使用一组两个或两个以上中的至少一者和少于所有者。除非通 过其上下文明确地限制,否则使用术语"确定"来指示其一股含义中的任一者,例如决定、建 立、总结、计算、选择和/或评估。在本发明的说明书和权利要求书中使用术语"包括"时,并 不排除其它元素或操作。使用术语"基于"(如在"A基于B")来指示其一股含义中的任一 者,包含如下情况:⑴"导出自"(例如,"B为A的前驱物"),(ii) "至少基于"(例如,"A 至少基于B"),且如果在特定上下文中适当,(iii) "等于"(例如,"A等于B"或"A与B相 同")。类似地,使用术语"响应于"来指示其一股含义中的任一者,包含"至少响应于"。除 非另外指明,否则术语"A、B和C中的至少一者"、"A、B和C中的一或多者"、"A、B和C当中 的至少一者"和"A、B和C当中的一或多者"指示"A和/或B和/或C"。除非另外指出,否 则术语"A、B和C中的每一者"和"A、B和C当中的每一者"指示"A和B和C"。
[0128] 对多麦克风音频感测装置的麦克风的"位置"的参考指示所述麦克风的声敏感面 的中心的位置,除非上下文另有指示。根据特定上下文,有时使用术语"通道"来指示信号路 径且在其它时候指示由此路径载运的信号。除非另有指示,否则使用术语"系列"来指示两 个或两个以上项目的序列。使用术语"对数"来指示基数为十的对数,但将此运算扩展到其 它基数在本发明的范围内。使用术语"频率分量"来指示信号的一组频率或频带中的一者, 例如(例如,由快速傅里叶变换产生)信号的频域表示的样本(或"频段")或信号的子带 (例如,巴克(Bark)尺度或梅尔(mel)尺度子带)。
[0129] 除非另有指示,否则对具有特定特征的设备的操作的任何揭示内容还明确地希望 揭示具有类似特征的方法(且反之亦然),且对根据特定配置的设备的操作的任何揭示内 容还明确地希望揭示根据类似配置的方法(且反之亦然)。术语"配置"可参考由其特定上 下文指示的方法、设备和/或系统来使用。术语"方法"、"过程"、"程序"和"技术"通用地且 可互换地使用,除非特定上下文另有指示。具有多个子任务的"任务"也是方法。术语"设 备"和"装置"也通用地且可互换地使用,除非特定上下文另有指示。术语"元件"和"模块" 通常用以指示较大配置的一部分。除非由其上下文明确限制,否则术语"系统"在此用以指 示其普通意义中的任一者,包含"交互以用于共同目的的元件群组"。
[0130] 通过参考文献的一部分的任何并入也应理解为并入了在所述部分内参考的术语 或变量的定义,其中此些定义出现在文献中的其它地方,以及并入了在所并入部分中参考 的任何图。除非起初通过定冠词引入,否则用于修饰权利要求元素的序数术语(例如,"第 一"、"第二"、"第三"等)本身不指示所述权利要求元素相对于另一权利要求元素的任何优 先级或次序,而是仅区别所述权利要求元素与具有同一名称(如果没有序数术语)的另一 权利要求元素。除非通过其上下文明确地限制,否则术语"多个"及"组"中的每一者在本 文中用以指示大于1的整数量。
[0131] 可假定,在发射声场的近场和远场区中,波前分别为球面的及平面的。可将近场定 义为距声接收器(例如,麦克风阵列)小于一个波长的空间区。在此定义下,到区边界的距 离与频率成反比地变化。在200、700及2000赫兹的频率下,例如,到一个波长边界的距离 分别为约170厘米、49厘米及17厘米。改为考虑近场/远场边界处于距麦克风阵列特定距 离处(例如,距阵列的麦克风或距阵列的质心50厘米,或距阵列的麦克风或距阵列的质心 1米或1. 5米)可为有用的。
[0132] 除如图1中所展示的手持机或其它手持式通信装置之外,可实施以包含多麦克风 阵列(或从此类阵列接收音频输入)及执行如本文中所描述的方法的音频感测装置的其它 实例还包含桌上型计算机、便携式计算装置(例如,膝上型计算机、笔记型计算机、上网本 计算机、超便携式计算机、平板计算机、移动因特网装置、智能笔记本、智能电话等)、音频记 录器、视频相机、音频或视频会议装置、机顶盒、游戏系统、数字媒体接收器(例如,流式传 输播放器)、媒体播放装置,及显示屏(例如,计算机监视器、电视机)。
[0133] 具有用于音频感测的多个麦克风的装置可经配置以通过测量用于一或多个频率 分量中的每一者的一对麦克风通道之间的差异而估计源信号的到达方向(D0A)以获得相 对于对应麦克风对的轴线的到达方向的对应指示。装置可为例如用于话音通信的装置,例 如图1中所示的便携式装置。源信号可为例如用户的语音。所述通道对之间的差异可例如 为相位或到达时间的差异。对于其中针对两个或两个以上频率分量中的每一者获得此些方 向指示的情况,此类技术可包含组合方向指示(例如,平均化方向指示以确定所估计方向 是否在这些频率分量内不变)以获得用于信号的D0A估计。
[0134] 此类D0A估计可用于如本文中所指出的范围,包含空间选择性滤波以及显示和/ 或跟踪移动源的随时间推移的方向(相对于麦克风的轴线)。举例来说,所估计的D0A可用 以显示源相对于装置的当前方向和/或配置空间选择性滤波操作以增强源信号和/或衰减 从其它方向到达的声音(或在需要的情况下衰减源信号)。可能需要随时间推移继续此类 估计以跟踪可由源和/或麦克风阵列相对于其它者的移动导致的到达方向的改变。举例来 说,可使用此类继续估计来更新当前源方向的可视化和/或更新空间选择性滤波操作。
[0135] 可用于基于时间或相位差的方向估计的频率分量范围通常受到用于麦克风对的 空间混叠频率的约束。可被定义为信号的波长为麦克风之间的距离d的两倍所在的频率的 此频率通常在有用频率分量范围上外加上限。另外,此类基于差异的方法可能不支持超过1 米的源D0A的准确估计,且通常仅支持低D0A分辨率。此类方法通常还仅使用一个固定对 来用于跟踪。在此情况下,解析来自用户的语音与来自另一方向的声音(例如,来自另一人 的语音)之间的模糊性对前-后麦克风对的相依性可在麦克风放置几何布置上强加显著约 束,如将装置放置在表面(例如,桌面)上可有效地遮挡前或后麦克风。
[0136] 挑战是提供一种用于针对同时发生的多个声音事件估计音频信号的每一帧的二 维或三维到达方向(D0A)的方法,所述音频信号在背景噪声及混响下足够强健。可通过最 大化可靠频段的数目来增加此类方法的稳健性。可能需要此类方法适合于任意成形的麦克 风阵列几何位置,以使得可避免对麦克风放置的特定约束。
[0137] 在多麦克风装置的使用期间,所要源信号相对于装置的到达方向可能改变。举例 来说,装置可为用户可能在使用期间在不同位置握持(例如,在图2中所示的五个实例中 的任一者当中)的智能电话(例如,如图1所示)。可能需要从一个握持位置到另一握持 位置提供装置的操作连续性,使得在用户的话音上的所要聚焦得以维持。在另一实例中,装 置可用作扬声器电话。可能需要提供话音跟踪应用(例如,用户跟踪或通用扬声器电话应 用),使得多麦克风装置可任意放置(例如,放置在桌子上用于电话会议、放置在汽车座位 上,等),且/或在使用期间任意移动且仍能够跟踪和/或增强一或多个个别说话者中的每 一者的话音。可能需要此类方法能够相对于可用麦克风的任意定向来处置任意目标说话者 位置。还可能需要此类方法提供瞬时多说话者跟踪/分离能力。令人遗憾的是,当前现有 技术水平为单麦克风方法。
[0138] 还可能需要支持远场应用中的源跟踪,所述源跟踪可用以提供对跟踪关于多麦克 风装置处于大距离处及具有未知定向的源的解决方案。此类应用中的多麦克风装置可包含 安装于电视机或机顶盒上的可用以支持电话的阵列。实例包含Kinect装置的扩音器阵列 (华盛顿州雷蒙德的Microsoft公司)和来自Skype (Microsoft Skype部门)和三星电子 (韩国首尔)的扩音器阵列。除大的源到装置距离之外,此类应用通常还遭受不良信号对干 扰加噪声比(SINR)及房间混响。
[0139] 可针对一或多个此类应用(例如,D0A估计以用于源跟踪、源可视化、空间选择性 滤波、通用扬声器电话应用,或远场应用)实施如本文中所提议的解决方案。可实施此类 方法以在无麦克风放置约束的情况下操作。举例来说,如本文所描述的成对1-D方法可恰 当地并入到任何麦克风阵列几何布置中。此类方法还可经实施以使用高达尼奎斯特频率 (即,取样频率的一半)且低至较低频率(例如,通过支持具有较大麦克风间距离的额外麦 克风对的使用)的可用频段来跟踪源。并非限于单对麦克风用于跟踪,此类方法可经实施 以选择所有可用麦克风对当中的当前最佳对。此类方法可用以支持甚至远场情境(高达3 米到5米或大于5米的距离)中的源跟踪,且/或提供高得多的D0A分辨率。其它潜在特 征包含获得作用中源的准确2-D表示。为获得最佳结果,可能需要每一源为时间稀疏宽带 音频源,且每一频率分量(例如,频段或子频带)通常只有一个源占优势。
[0140] 此类多通道处理一股可适用于(例如)用于扬声器电话应用的源跟踪。此类技术 可用以计算对所接收的多通道信号的帧的D0A估计。此类方法可在每一频段下计算每一候 选角度关于所观测到的角度的误差(其通过相位延迟来指示)。所述频段下的目标角度为 具有最小误差的候选者。在一个实例中,接着跨越频段将误差加总以获得候选者的可能性 的测量结果。在另一实例中,将跨越所有频段最频繁出现的目标D0A候选者中的一或多者 识别为对给定帧的D0A估计(或估计)。
[0141] 图3A展示根据一股配置的包含任务T10、T20及T30的方法M10的流程图。任务 T10计算多通道信号的一对通道之间的差异(例如,其中每一通道是基于由对应麦克风产 生的信号)。用于多个候选方向当中的每一者,任务T20计算基于所计算差异的对应方向拟 合性量度(例如,方向误差)。基于所述多个方向拟合性量度,任务T30选择候选方向。
[0142] 方法M10可经配置以将多通道信号作为一系列片段来处理。典型片段长度的范围 为从约5或10毫秒到约40或50毫秒,且所述片段可为重叠的(例如,与邻近片段重叠达 25%或50%)或非重叠的。在一个特定实例中,将多通道信号划分成一系列非重叠片段或 "帧",每一者的长度为10毫秒。在另一特定实例中,每一帧的长度为20毫秒。如通过方法 M10处理的片段还可为如通过不同操作处理的较大片段(即,子帧),或反过来也是一样。
[0143] 通道之间的差异的实例包含增益差或比率、到达时间差及相位差。举例来说,可实 施任务T10以将一对通道之间的差异计算为所述通道的对应增益值之间的差或比率(例 如,量值或能量差)。图3C展示任务T10的此类实施方案T12。
[0144] 可实施任务T12以计算时域(例如,对于信号的多个子带中的每一者)或频域(例 如,对于变换域中的信号的多个频率分量中的每一者,例如,快速傅里叶变换(FFT)、离散余 弦变换(DCT)或经修改的DCT(MDCT)域)中的多通道信号的片段的增益的测量结果。此类 增益量度的实例包含(不限于)以下各者:总量值(例如,样本值的绝对值的总和)、平均 量值(例如,每一样本)、RMS幅度、中值量值、峰值量值、峰值能量、总能量(例如,样本值的 平方和),及平均能量(例如,每一样本)。
[0145] 为了在增益差技术情况下获得准确结果,可能需要将两个麦克风通道的响应相对 于彼此进行校准。可能需要将低通滤波器应用于多通道信号,使得增益量度的计算限于多 通道信号的音频频率部分(例如,语音频率范围)。举例来说,此类低通滤波器可经实施以 具有700赫兹或1、2、5、7、8、10、12或20千赫兹的截止频率(例如,量值响应下降到-3分 贝或-20分贝时的频率)。
[0146] 可实施任务T12以将增益之间的差计算为对数域(例如,以分贝来计的值)中的 每一通道的对应增益量度值之间的差或等效地计算为线性域中的增益量度值之间的比率。 对于经校准的麦克风对,可采用零增益差来指示源距每一麦克风等距(即,位于所述对的 边射方向),可采用具有较大正值的增益差来指示源更接近一个麦克风(即,位于所述对的 一个端射方向),且可采用具有较大负值的增益差来指示源更接近另一麦克风(即,位于所 述对的另一端射方向)。
[0147] 在另一实例中,实施任务T10以通道对执行交叉相关以确定所述差异。任务T10 的此类实施方案可经配置以基于多通道信号的通道之间的滞后而计算到达时间差。
[0148] 在另一实例中,实施任务T10以将一对通道之间的差异计算为每一通道的相位之 间的差(例如,在信号的特定频率分量处)。图3D展示任务T10的此类实施方案T14。如 下文所论述,可针对多个频率分量当中的每一者执行此类计算。
[0149] 对于由一对麦克风在相对于所述麦克风对的轴线在特定到达方向(D0A)上直接 从点源接收的信号,相位差(也称为"相位延迟")对于每一频率分量不同,并且还取决 于麦克风之间的间距。可将特定频率分量(例如,频段)下的相位延迟的所观测值计算 为复数FFT系数的虚数项与复数FFT系数的实数项的比率的反正切(还被称为反正切 (arctangent))。(如果使用例如DCT或MDCT等实值变换,那么可能需要将此类变换与离散 正弦变换配对(例如,如在复数重叠变换或经修改的复数重叠变换中)以获得相位信息。)
[0150] 如图3B中所展示,特定频率f处的相位延迟值Δφ/可与远场(S卩,平面波)假定 下的源D0A相关,如Δφ/=2ττ/^^,其中d表示麦克风之间的距离(以米来计),Θ表示 相对于正交于阵列轴线的方向的到达角度(以弧度来计),f表示频率(以赫兹来计),且c 表示声速(例如,以米/秒来计)。对于不具有混响的单个点源的理想情况,相位延迟与频 率的比率Δφ//_将在所有频率上具有相同值如下文更详细论述,相对于麦克风对 的D0A Θ为一维测量结果,其定义空间圆锥的表面(例如,使得圆锥的轴线为阵列的轴线)。 与其中实施任务T10以计算增益差的方法M10的类似实施方案相比,其中实施任务T10以 计算相位延迟的方法M10的实施方案将通常对于所述对的麦克风的增益响应之间的失配 更为稳健。
[0151] 此类方法通常实际上受麦克风对的空间混叠频率限制,所述空间混叠频率可被定 义为信号的波长为麦克风之间的距离d的两倍所在的频率。空间混叠造成相位缠绕,所述 情形通常对可用以提供对特定麦克风对的可靠相位延迟测量结果的频率范围给出上限。
[0152] 图4A展示针对各自从不同D0A到达的四个信号的实际相位延迟对频率的曲线图, 其中用于每一信号的曲线图由对应线模式指示。图4B展示对于相同的四个信号的所观测 相位延迟对频率的曲线图(由相同线模式指示),其中每一曲线图的初始部分(即,直到第 一相位缠绕出现)以粗体展示。试图通过对所测量相位进行解缠(例如,对图4B中所示的 观测结果进行解缠以重建如图4A所示的曲线图)而扩展相位延迟测量的有用频率范围通 常不可靠,在存在噪声的情况下尤其如此。
[0153] 可实施任务T20以例如根据增益差、相位差或到达时间差(例如,取决于任务T10 的对应实施方案)而计算方向拟合性量度(例如,方向误差)。举例来说,可实施任务T20以 根据具有K个D0A候选者的存量中的每一 D0A候选者的频率f处的相位差计算方向误差,其 中1彡k彡K且K彡2。任务T20的此实施方案可将用于频率f和D0A候选者k的方向误差 计算为平方_

【权利要求】
1. 一种处理多通道信号的方法,所述方法包括: 对于所述多通道信号的第一通道对,计算第一多个方向拟合性量度,其中所述第一多 个方向拟合性量度当中的每一者是基于多个候选方向当中的一个对应不同候选方向; 对于所述多通道信号的不同于所述第一对的第二通道对,计算第二多个方向拟合性量 度,其中所述第二多个方向拟合性量度当中的每一者是基于所述多个候选方向当中的一个 对应不同候选方向;以及 基于所述第一多个方向拟合性量度和所述第二多个方向拟合性量度,从所述多个候选 方向当中选择第一方向, 其中所述第一多个方向拟合性量度中的每一者是基于所述第一对的所述通道之间在 所述多通道信号的第一频率分量处的差异,且 其中所述第二多个方向拟合性量度中的每一者是基于所述第二对的所述通道之间在 所述第一频率分量处的差异。
2. 根据权利要求1所述的方法,其中所述从所述多个候选方向当中选择所述第一方向 包括确定所述第一多个方向拟合性量度和所述第二多个方向拟合性量度当中的最小方向 误差。
3. 根据权利要求1和2中任一权利要求所述的方法,其中,对于所述第一多个方向拟合 性量度中的每一者,所述第一对的所述通道之间的所述差异是所述第一对中的一个通道中 的所述第一频率分量的相位与所述第一对中的另一通道中的所述频率分量的相位之间的 差异。
4. 根据权利要求1到3中任一权利要求所述的方法,其中所述多通道信号的所述通道 是基于由麦克风的线性阵列产生的信号,使得所述多通道信号的所述通道当中的每一者是 基于由所述线性阵列的不同麦克风产生的信号。
5. 根据权利要求4所述的方法,其中所述第一对中的第一通道对应于所述阵列的第一 麦克风,所述第一对中的第二通道对应于所述阵列的第二麦克风,所述第二对中的第一通 道对应于所述第一麦克风,且所述第二对中的第二通道对应于所述阵列的第三麦克风。
6. 根据权利要求4和5中任一权利要求所述的方法,其中所述第一通道对中的每一通 道是基于由所述线性阵列的第一对麦克风中的对应麦克风产生的信号,且 其中所述第二通道对中的每一通道是基于由所述线性阵列的第二对麦克风中的对应 麦克风产生的信号,且 其中所述第一对麦克风的所述麦克风分开第一距离,且 其中所述第二对麦克风的所述麦克风分开不同于所述第一距离的第二距离。
7. 根据权利要求6所述的方法,其中所述第一频率分量具有小于所述第一距离的两倍 且小于所述第二距离的两倍的波长。
8. 根据权利要求1到7中任一权利要求所述的方法,其中所述方法包括: 对于所述多通道信号的所述第一通道对,计算第三多个方向拟合性量度,其中所述第 三多个方向拟合性量度当中的每一者是基于所述多个候选方向当中的一个对应不同候选 方向; 对于所述多通道信号的所述第二通道对,计算第四多个方向拟合性量度,其中所述第 四多个方向拟合性量度当中的每一者是基于所述多个候选方向当中的一个对应不同候选 方向;以及 基于所述第三多个方向拟合性量度和所述第四多个方向拟合性量度,从所述多个候选 方向当中选择第二方向, 其中所述第三多个方向拟合性量度中的每一者是基于所述第一对的所述通道之间在 所述多通道信号的不同于所述第一频率分量的第二频率分量处的差异,且 其中所述第四多个方向拟合性量度中的每一者是基于所述第二对的所述通道之间在 所述第二频率分量处的差异。
9. 根据权利要求8所述的方法,其中所述方法包括基于所述多个候选方向当中的所述 所选第一候选方向和所述多个候选方向当中的所述所选第二候选方向指示所述多通道信 号的到达方向。
10. 根据权利要求8和9中任一权利要求所述的方法,其中所述从所述多个候选方向当 中选择所述第一方向包括确定所述第一多个方向拟合性量度和所述第二多个方向拟合性 量度当中的最小方向误差,且 其中所述从所述多个候选方向当中选择所述第二方向包括确定所述第三多个方向拟 合性量度和所述第四多个方向拟合性量度当中的最小方向误差。
11. 根据权利要求10所述的方法,其中所述第一多个方向拟合性量度和所述第二多个 方向拟合性量度当中的所述最小方向误差对应于所述多通道信号的所述第一通道对,且 其中所述第三多个方向拟合性量度和所述第四多个方向拟合性量度当中的所述最小 方向误差对应于所述多通道信号的所述第二通道对。
12. 根据权利要求8到11中任一权利要求所述的方法,其中所述所选第一方向与所述 所选第二方向为相同方向。
13. 根据权利要求8到11中任一权利要求所述的方法,其中所述所选第一方向为与所 述所选第二方向不同的方向。
14. 一种用于处理多通道信号的设备,所述设备包括: 用于对于所述多通道信号的第一通道对计算第一多个方向拟合性量度的装置,其中所 述第一多个方向拟合性量度当中的每一者是基于多个候选方向当中的一个对应不同候选 方向; 用于对于所述多通道信号的不同于所述第一对的第二通道对计算第二多个方向拟合 性量度的装置,其中所述第二多个方向拟合性量度当中的每一者是基于所述多个候选方向 当中的一个对应不同候选方向;以及 用于基于所述第一多个方向拟合性量度和所述第二多个方向拟合性量度从所述多个 候选方向当中选择第一方向的装置, 其中所述第一多个方向拟合性量度中的每一者是基于所述第一对的所述通道之间在 所述多通道信号的第一频率分量处的差异,且 其中所述第二多个方向拟合性量度中的每一者是基于所述第二对的所述通道之间在 所述第一频率分量处的差异。
15. 根据权利要求14所述的设备,其中所述从所述多个候选方向当中选择所述第一方 向包括确定所述第一多个方向拟合性量度和所述第二多个方向拟合性量度当中的最小方 向误差。
16. 根据权利要求14和15中任一权利要求所述的设备,其中,对于所述第一多个方向 拟合性量度中的每一者,所述第一对的所述通道之间的所述差异是所述第一对中的一个通 道中的所述第一频率分量的相位与所述第一对中的另一通道中的所述频率分量的相位之 间的差异。
17. 根据权利要求14到16中任一权利要求所述的设备,其中所述多通道信号的所述通 道是基于由麦克风的线性阵列产生的信号,使得所述多通道信号的所述通道当中的每一者 是基于由所述线性阵列的不同麦克风产生的信号。
18. 根据权利要求17所述的设备,其中所述第一对中的第一通道对应于所述阵列的第 一麦克风,所述第一对中的第二通道对应于所述阵列的第二麦克风,所述第二对中的第一 通道对应于所述第一麦克风,且所述第二对中的第二通道对应于所述阵列的第三麦克风。
19. 根据权利要求17和18中任一权利要求所述的设备,其中所述第一通道对中的每一 通道是基于由所述线性阵列的第一对麦克风中的对应麦克风产生的信号,且 其中所述第二通道对中的每一通道是基于由所述线性阵列的第二对麦克风中的对应 麦克风产生的信号,且 其中所述第一对麦克风的所述麦克风分开第一距离,且 其中所述第二对麦克风的所述麦克风分开不同于所述第一距离的第二距离。
20. 根据权利要求19所述的设备,其中所述第一频率分量具有小于所述第一距离的两 倍且小于所述第二距离的两倍的波长。
21. 根据权利要求14到20中任一权利要求所述的设备,其中所述方法包括: 用于对于所述多通道信号的所述第一通道对计算第三多个方向拟合性量度的装置,其 中所述第三多个方向拟合性量度当中的每一者是基于所述多个候选方向当中的一个对应 不同候选方向; 用于对于所述多通道信号的所述第二通道对计算第四多个方向拟合性量度的装置,其 中所述第四多个方向拟合性量度当中的每一者是基于所述多个候选方向当中的一个对应 不同候选方向;以及 用于基于所述第三多个方向拟合性量度和所述第四多个方向拟合性量度从所述多个 候选方向当中选择第二方向的装置, 其中所述第三多个方向拟合性量度中的每一者是基于所述第一对的所述通道之间在 所述多通道信号的不同于所述第一频率分量的第二频率分量处的差异,且 其中所述第四多个方向拟合性量度中的每一者是基于所述第二对的所述通道之间在 所述第二频率分量处的差异。
22. 根据权利要求21所述的设备,其中所述设备包括用于基于所述多个候选方向当中 的所述所选第一候选方向和所述多个候选方向当中的所述所选第二候选方向指示所述多 通道信号的到达方向的装置。
23. 根据权利要求21和22中任一权利要求所述的设备,其中所述从所述多个候选方向 当中选择所述第一方向包括确定所述第一多个方向拟合性量度和所述第二多个方向拟合 性量度当中的最小方向误差,且 其中所述从所述多个候选方向当中选择所述第二方向包括确定所述第三多个方向拟 合性量度和所述第四多个方向拟合性量度当中的最小方向误差。
24. 根据权利要求23所述的设备,其中所述第一多个方向拟合性量度和所述第二多个 方向拟合性量度当中的所述最小方向误差对应于所述多通道信号的所述第一通道对,且 其中所述第三多个方向拟合性量度和所述第四多个方向拟合性量度当中的所述最小 方向误差对应于所述多通道信号的所述第二通道对。
25. 根据权利要求21到24中任一权利要求所述的设备,其中所述所选第一方向与所述 所选第二方向为相同方向。
26. 根据权利要求21到24中任一权利要求所述的设备,其中所述所选第一方向为与所 述所选第二方向不同的方向。
27. -种用于处理多通道信号的设备,所述设备包括: 量度计算器,其经配置以进行以下操作 对于所述多通道信号的第一通道对,计算第一多个方向拟合性量度,其中所述第一多 个方向拟合性量度当中的每一者是基于多个候选方向当中的一个对应不同候选方向,且 对于所述多通道信号的不同于所述第一对的第二通道对,计算第二多个方向拟合性量 度,其中所述第二多个方向拟合性量度当中的每一者是基于所述多个候选方向当中的一个 对应不同候选方向;以及 选择器,其经配置以基于所述第一多个方向拟合性量度和所述第二多个方向拟合性量 度从所述多个候选方向当中选择第一方向, 其中所述第一多个方向拟合性量度中的每一者是基于所述第一对的所述通道之间在 所述多通道信号的第一频率分量处的差异,且 其中所述第二多个方向拟合性量度中的每一者是基于所述第二对的所述通道之间在 所述第一频率分量处的差异。
28. 根据权利要求27所述的设备,其中所述误差计算器经配置以确定所述第一多个方 向拟合性量度和所述第二多个方向拟合性量度当中的最小方向误差。
29. 根据权利要求27和28中任一权利要求所述的设备,其中,对于所述第一多个方向 拟合性量度中的每一者,所述第一对的所述通道之间的所述差异是所述第一对中的一个通 道中的所述第一频率分量的相位与所述第一对中的另一通道中的所述频率分量的相位之 间的差异。
30. 根据权利要求27到29中任一权利要求所述的设备,其中所述多通道信号的所述通 道是基于由麦克风的线性阵列产生的信号,使得所述多通道信号的所述通道当中的每一者 是基于由所述线性阵列的不同麦克风产生的信号。
31. 根据权利要求30所述的设备,其中所述第一对中的第一通道对应于所述阵列的第 一麦克风,所述第一对中的第二通道对应于所述阵列的第二麦克风,所述第二对中的第一 通道对应于所述第一麦克风,且所述第二对中的第二通道对应于所述阵列的第三麦克风。
32. 根据权利要求30和31中任一权利要求所述的设备,其中所述第一通道对中的每一 通道是基于由所述线性阵列的第一对麦克风中的对应麦克风产生的信号,且 其中所述第二通道对中的每一通道是基于由所述线性阵列的第二对麦克风中的对应 麦克风产生的信号,且 其中所述第一对麦克风的所述麦克风分开第一距离,且 其中所述第二对麦克风的所述麦克风分开不同于所述第一距离的第二距离。
33. 根据权利要求32所述的设备,其中所述第一频率分量具有小于所述第一距离的两 倍且小于所述第二距离的两倍的波长。
34. 根据权利要求27到33中任一权利要求所述的设备,其中所述量度计算器经配置以 进行以下操作 对于所述多通道信号的所述第一通道对,计算第三多个方向拟合性量度,其中所述第 三多个方向拟合性量度当中的每一者是基于所述多个候选方向当中的一个对应不同候选 方向,且 对于所述多通道信号的所述第二通道对,计算第四多个方向拟合性量度,其中所述第 四多个方向拟合性量度当中的每一者是基于所述多个候选方向当中的一个对应不同候选 方向,且 其中所述选择器经配置以基于所述第三多个方向拟合性量度和所述第四多个方向拟 合性量度从所述多个候选方向当中选择第二方向,且 其中所述第三多个方向拟合性量度中的每一者是基于所述第一对的所述通道之间在 所述多通道信号的不同于所述第一频率分量的第二频率分量处的差异,且 其中所述第四多个方向拟合性量度中的每一者是基于所述第二对的所述通道之间在 所述第二频率分量处的差异。
35. 根据权利要求34所述的设备,其中所述设备包括指示器,所述指示器经配置以基 于所述多个候选方向当中的所述所选第一候选方向和所述多个候选方向当中的所述所选 第二候选方向指示所述多通道信号的到达方向。
36. 根据权利要求34和35中任一权利要求所述的设备,其中所述选择器经配置以确定 所述第一多个方向拟合性量度和所述第二多个方向拟合性量度当中的最小方向误差,且确 定所述第三多个方向拟合性量度和所述第四多个方向拟合性量度当中的最小方向误差。
37. 根据权利要求36所述的设备,其中所述第一多个方向拟合性量度和所述第二多个 方向拟合性量度当中的所述最小方向误差对应于所述多通道信号的所述第一通道对,且 其中所述第三多个方向拟合性量度和所述第四多个方向拟合性量度当中的所述最小 方向误差对应于所述多通道信号的所述第二通道对。
38. 根据权利要求34到37中任一权利要求所述的设备,其中所述所选第一方向与所述 所选第二方向为相同方向。
39. 根据权利要求34到37中任一权利要求所述的设备,其中所述所选第一方向为与所 述所选第二方向不同的方向。
40. -种具有有形特征的计算机可读数据存储媒体,所述有形特征致使读取所述特征 的机器执行根据权利要求1到13中任一权利要求所述的方法。
【文档编号】G01S3/80GK104220896SQ201380019683
【公开日】2014年12月17日 申请日期:2013年3月19日 优先权日:2012年4月13日
【发明者】金莱轩, 埃里克·维瑟 申请人:高通股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1