用于多通道信号平衡的系统、方法和设备的制作方法

文档序号：7734364阅读：210来源：国知局

专利名称：：用于多通道信号平衡的系统、方法和设备的制作方法
技术领域：
：本发明涉及具有两个或两个以上通道的音频信号的平衡。
背景技术：
：先前在安静的办公室或家庭环境中执行的许多活动如今在如汽车、街道或咖啡馆等声可变场合中执行。因而，大量话音通信在用户被其他人围绕的环境中使用移动装置(例如，手持机和/或头戴式耳机)而发生，通常在人们趋向于聚集的地方遭遇这种噪声内容。此噪声趋向于使正在进行电话交谈的用户分心或苦恼。此外，许多标准自动商业交易(例如，账户余额或股票报价核对)使用基于话音辨识的数据查询，且干扰噪声可显著妨碍这些系统的准确性。对于通信在嘈杂环境中发生的应用，可能需要分离所要语音信号与背景噪声。可将噪声界定为干扰所要信号或以其它方式使所要信号降级的所有信号的组合。背景噪声可包括在声环境内产生的众多噪声信号，例如其他人的背景交谈，以及从所述信号中的每一者产生的反射和混响。除非将所要语音信号与背景噪声分离并隔绝，否则可能难以可靠且高效利用所要语音信号。在一个特定实例中，语音信号在嘈杂环境中产生，且语音处理方法用于分离语音信号与环境噪声。由于噪声几乎总是存在于真实世界情形中，所以此语音信号处理在许多日常通信领域中是重要的。在移动环境中遭遇的噪声可包括多种不同分量，例如竞争谈话者、音乐、混串音、街道噪声和/或机场噪声。由于此噪声的特征通常是不固定的且接近用户自身的频率特征，因此可能难以使用传统的单麦克风或固定波束成形类型方法来模仿所述噪声。单麦克风噪声减少技术通常需要显著的参数调谐以实现最优性能。举例来说，合适的噪声参考在此些情况下可能不直接可用，且可能有必要间接地得出噪声参考。因此，基于多个麦克风的高级信号处理对于支持用于话音通信的移动设备在嘈杂环境中的使用可为理想的。
发明内容一种根据一般配置的处理多通道音频信号的方法包括随着时间的过去而计算音频信号的第一通道的电平的一系列值；以及随着时间的过去而计算音频信号的第二通道的电平的一系列值。此方法包括基于所述第一通道的电平的所述系列值和所述第二通道的电平的所述系列值，随着时间的过去而计算增益因子的一系列值；以及根据所述增益因子的所述系列值，随着时间的过去而相对于所述第一通道的振幅控制所述第二通道的振幅。此方法包括指示所述音频信号的一区段是信息区段。在此方法中，随着时间的过去而计算增益因子的一系列值包括对于所述增益因子的所述系列值中的至少一者且响应于所述指示，基于所述第一通道的所述电平的对应值、所述第二通道的所述电平的对应值以及偏置因子来计算增益因子值。在此方法中，所述偏置因子是基于音频感测装置相对于定向信息源的标准定向。本文中还揭示此方法在音频感测装置(例如，通信装置)内的执行。本文中还揭示包括用于执行此方法的装置的设备，以及具有用于此方法的可执行指令的计算机可读媒体。一种根据一般配置的用于处理多通道音频信号的设备包括用于随着时间的过去而计算音频信号的第一通道的电平的一系列值的装置；以及用于随着时间的过去而计算音频信号的第二通道的电平的一系列值的装置。此设备包括用于基于所述第一通道的电平的所述系列值和所述第二通道的电平的所述系列值，随着时间的过去而计算增益因子的一系列值的装置；以及用于根据所述增益因子的所述系列值，随着时间的过去而相对于所述第一通道的振幅控制所述第二通道的振幅的装置。此设备包括用于指示所述音频信号的一区段是信息区段的装置。在此设备中，所述用于随着时间的过去而计算增益因子的一系列值的装置经配置以响应于所述指示，基于所述第一通道的所述电平的对应值、所述第二通道的所述电平的对应值以及偏置因子来计算所述增益因子的所述系列值中的至少一者。在此设备中，所述偏置因子是基于音频感测装置相对于定向信息源的标准定向。本文中还揭示此设备的实施，其中用于计算第一通道的电平的一系列值的装置是第一电平计算器，用于计算第二通道的电平的一系列值的装置是第二电平计算器，用于计算增益因子的一系列值的装置是增益因子计算器，用于控制所述第二通道的振幅的装置是振幅控制元件，且用于指示的装置是信息区段指示器。本文中还揭示音频感测装置的各种实施方案，所述音频感测装置包括经配置以产生多通道音频信号的麦克风阵列。图IA到图ID展示多麦克风无线头戴式耳机DlOO的各种视图。图2A到图2D展示多麦克风无线头戴式耳机D200的各种视图。图3A展示多麦克风通信手持机D300的横截面图(沿中央轴)。图;3B展示装置D300的实施方案D310的横截面图。图4A展示多麦克风媒体播放器D400的图。图4B和图4C分别展示设备D400的实施方案D410和D420的图。图5A展示多麦克风免提车载套件D500的图。图5B展示多麦克风书写装置D600的图。图6A展示阵列RlOO的实施方案R200的框图。图6B展示阵列R200的实施方案R210的框图。图7A展示阵列RlOO的麦克风可安装于声端口后面的装置外壳内的实例的横截图7B展示经布置以用于预递送校准操作的消声室的俯视图。图8展示以相对于用户的嘴巴的标准定向安装在用户的耳朵处的头戴式耳机DlOO的图。图9展示以相对于用户的嘴巴的标准定向定位的手持机D300的图。图IOA展示根据一般配置的处理多通道音频信号的方法MlOO的流程图。图IOB展示方法MlOO的实施方案M200的流程图。图IlA展示任务T400的实施方案T410的流程图。图IlB展示任务T400的实施方案T460的流程图。图12A展示任务T410的实施方案T420的流程图。图12B展示任务T460的实施方案T470的流程图。图13A展示任务T420的实施方案T430的流程图。图13B展示任务T470的实施方案T480的流程图。图14展示头戴式耳机DlOO相对于用户的嘴巴的标准定向的范围的两个界限的实例图15展示手持机D300相对于用户的嘴巴的标准定向的范围的两个界限的实例。图16A展示方法MlOO的实施方案M300的流程图。图16B展示任务T500的实施方案T510的流程图。图17展示各种类型的信息和噪声源活动的大致到达角度的理想化视觉描绘。图18A展示任务T510的实施方案T550的流程图。图18B展示任务T510的实施方案T560的流程图。图19展示三种不同信息源的活动的大致到达角度的理想化视觉描绘。图20A展示方法MlOO的实施方案M400的流程图。图20B展示其中任务T500的执行是以任务T400的结果为条件的实例的流程图。图21A展示其中任务T550的执行是以任务T400的结果为条件的实例的流程图。图21B展示其中任务T400的执行是以任务T500的结果为条件的实例的流程图。图22A展示任务T510的实施方案T520的流程图。图22B展示任务T510的实施方案T530的流程图。图23A展示任务T550的实施方案T570的流程图。图2展示任务T550的实施方案T580的流程图。图24A展示根据一般配置的装置DlO的框图。图24B展示设备MF100的实施方案MFllO的框图。图25展示设备MFllO的实施方案MF200的框图。图26展示设备MFllO的实施方案MF300的框图。图27展示设备MFllO的实施方案MF400的框图。图28A展示根据一般配置的装置D20的框图。图^B展示设备AlOO的实施方案Al10的框图。图四展示设备AllO的实施方案A200的框图。图30展示设备AllO的实施方案A300的框图。图31展示设备AllO的实施方案A400的框图。图32展示设备MF300的实施方案MF310的框图。图33展示设备A300的实施方案A310的框图。图34展示通信装置D50的框图。具体实施例方式除非受其上下文明确地限制，否则术语“信号”在本文中用以指示其普通意义中的任一者，包括如在导线、总线或其它传输媒体上表达的存储器位置(或存储器位置的集合)的状态。除非受其上下文明确地限制，否则术语“产生”在本文中用以指示其普通意义中的任一者，例如创建、计算或以其它方式生成。除非受其上下文明确地限制，否则术语“计算”在本文中用以指示其普通意义中的任一者，例如计算、评估、平滑和/或从多个值中选择。除非受其上下文明确地限制，否则术语“获得”用以指示其普通意义中的任一者，例如计算、导出、接收(例如，从外部装置)和/或检索(例如，从存储元件阵列)。在本描述和所附权利要求书中使用术语“包含”之处，其并不排除其它元件或操作。术语“基于”(如在“A是基于B”中)用以指示其普通意义中的任一者，包括以下情况⑴“至少基于”(例如，“A至少基于B”)；以及如果在特定上下文中为适当的，(ii)“等于”(例如，“A等于B”)。类似地，术语“响应于”用以指示其普通意义中的任一者，包括“至少响应于”。除非上下文另有指示，否则对多麦克风音频感测装置的麦克风的“位置”的参考指示麦克风的声敏感面的中心的位置。根据特定上下文，术语“通道”有时用以指示信号路径，且在其它时间用以指示由此路径载运的信号。除非另有指示，否则术语“系列”用以指示两个或两个以上项的序列。术语“对数”用以指示基数为十的对数，但此运算向其它基数的扩展是在本发明的范围内。除非另有指示，否则对具有特定特征的设备的操作的任何揭示内容还明确地既定揭示具有类似特征的方法(且反之亦然)，且对根据特定配置的设备的操作的任何揭示内容还明确地既定揭示根据类似配置的方法(且反之亦然)。术语“配置”可如由其特定上下文所指示关于方法、设备和/或系统而使用。除非由特定上下文另外指示，否则术语“方法”、“过程”、“程序”和“技术”一般地且可互换地使用。除非由特定上下文另外指示，否则术语“设备”与“装置”也一般地且可互换地使用。术语“元件”和“模块”通常用以指示较大配置的一部分。除非受其上下文明确地限制，否则术语“系统”在本文中用以指示其普通意义中的任一者，包括“交互以服务共同目的的一群元件”。通过引用文献的一部分而进行的任何并入还应被理解为并入有所述部分内所引用的术语或变量的定义，其中此些定义在文献中的别处，以及在所并入的部分中所引用的任何图中出现。可能需要生产具有阵列RlOO的便携型音频感测装置，所述阵列RlOO具有经配置以接收声信号的两个或两个以上麦克风。举例来说，可将助听器实施为包括此阵列。可实施为包括此阵列且用于音频记录和/或话音通信应用的便携型音频感测装置的其它实例包括电话手持机(例如，蜂窝式电话手持机)；有线或无线头戴式耳机(例如，蓝牙头戴式耳机)；手持式音频和/或视频记录器；经配置以记录音频和/或视频内容的个人媒体播放器；个人数字助理(PDA)或其它手持式计算装置；以及笔记本型计算机、膝上型计算机或其它便携型计算装置。阵列RlOO的每一麦克风可具有全向、双向或单向(例如，心形线)的响应。可用于阵列RlOO中的各种类型的麦克风包括(但不限于)压电麦克风、动态麦克风和驻极体麦克风。在例如手持机或头戴式耳机等用于便携型话音通信的装置中，阵列RlOO的邻近麦克风之间的中心到中心间距通常在从约1.5cm到约4.5cm的范围内，但更大间距(例如，至多达IOcm或15cm)在例如手持机等装置中也是可能的。在助听器中，阵列RlOO的邻近麦克风之间的中心到中心间距可为如约4mm或5mm—样小。阵列RlOO的麦克风可沿一线布置，或替代地使得其中心位于二维(例如，三角形)或三维形状的顶点处。图IA到图ID展示多麦克风便携型音频感测装置DlOO的各种视图。装置DlOO为无线头戴式耳机，其包括载运阵列RlOO的双麦克风实施方案的外壳ZlO和从外壳延伸的听筒Z20。此装置可经配置以经由与例如蜂窝式电话手持机等电话装置的通信(例如，使用如由华盛顿州贝尔维尤市的蓝牙技术联盟公司(BluetoothSpecialInterestGroup,Inc.，)发布的Bluetooth协议的版本)来支持半双工或全双工电话。一般来说，头戴式耳机的外壳可为矩形或另外如图1A、图IB和图ID中所示为细长形(例如，形状类似迷你吊杆)或可为较圆的或甚至圆形的。所述外壳还可封入电池和处理器和/或其它处理电路(例如，印刷电路板和安装于其上的组件)，且可包括电端口(例如，迷你通用串行总线(USB)或用于电池充电的其它端口)以及例如一个或一个以上按钮开关和/或LED等用户接口特征。通常，外壳沿其主轴的长度在从一英寸到三英寸的范围内。通常，阵列R100的每一麦克风安装于外壳中充当声端口的一个或一个以上小孔后面的装置内。图IB到图ID展示用于装置D100的阵列的主要麦克风的声端口Z40和用于装置D100的阵列的次要麦克风的声端口Z50的位置。头戴式耳机还可包括紧固装置，例如耳钩^30，其通常可从头戴式耳机拆卸。外部耳钩可为可反转的(例如)以允许用户配置头戴式耳机用于任一耳朵上。或者，可将头戴式耳机的听筒设计为内部紧固设备(例如，耳塞)，其可包括可移除耳承以允许不同用户使用不同大小(例如，直径)的耳承，以更好地配合特定用户的耳道的外部部分。图2A到图2D展示多麦克风便携型音频感测装置D200的各种视图，多麦克风便携型音频感测装置D200是无线头戴式耳机的另一实例。装置D200包括完整的椭圆形外壳Z12和可经配置为耳塞的听筒Z22。图2A到图2D还展示用于装置D200的阵列的主要麦克风的声端口Z42和用于装置D200的阵列的次要麦克风的声端口Z52的位置。次要麦克风端口Z52可至少部分地被封闭(例如，通过用户接口按钮)是可能的。图3A展示作为通信手持机的多麦克风便携型音频感测装置D300的横截面图(沿中央轴)。装置D300包括具有主要麦克风MClO和次要麦克风MC20的阵列R100的实施方案。在此实例中，装置D300还包括主要扬声器SPlO和次要扬声器SP20。此设备可经配置以经由一个或一个以上编码和解码方案(也称为“编解码器”)无线地发射和接收话音通信数据。此些编解码器的实例包括如2007年2月的标题为“用于宽带扩频数字系统的加强型可变速率编解码器，语音服务选项3、68和70(EnhancedVariableRateCodec,SpeechServiceOptions3,68,and70forWidebandSpreadSpectrumDigitalSystems)，，白勺第三代合作伙伴计划2(3GPP2)文献C.S0014-C,vl.0(在3gpp.org在线可得)中描述的加强型可变速率编解码器；如2004年1月的标题为“用于宽带扩频通信系统的可选模式声码器(SMV)服务选项(ElectableModeVocoder(SMV)ServiceOptionforWidebandSpreadSpectrumCommunicationSystems)”的3GPP2文献C.S0030-0,v3.O(在www.3gpp.org在线可得)中描述的可选模式声码器语音编解码器；如在文献ETSITSU6092V6.0.0(欧洲电信标准协会(ETSI)，索菲亚-安提波利斯经济管理学校(SophiaAntipolisCedex)，法国，2004年12月)中描述的自适应多重速率(AM语音编解码器；以及如文献ETSITS126192V6.0.0(ETSI，2004年12月)中描述的AMR宽带语音编解码器。在图3A的实例中，手持机D300为掀盖式蜂窝式电话手持机(也称为“翻盖”手持机)。此多麦克风通信手持机的其它配置包括直板式和滑盖式电话手持机。图3B展示包括阵列RlOO的三麦克风实施方案的装置D300的实施方案D310的横截面图，阵列RlOO包括第三麦克风MC30。图4A展示作为媒体播放器的多麦克风便携型音频感测装置D400的图。此装置可经配置以用于经压缩音频或视听信息的重放，经压缩音频或视听信息例如是根据标准压缩格式(例如，移动图片专家组(MPEG)-I音频层3(MP3)、MPEG-4部分14(MP4)、视窗媒体音频/视频(WMA/WMV)(华盛顿州雷蒙德市的微软公司)的某一版本、高级音频编码(AAC)、国际电信联盟(ITU)-TH.264或类似格式)而编码的文件或流。装置D400包括安置于所述装置的正面的显示屏幕SClO和扬声器SP10，且阵列R100的麦克风MClO和MC20安置于所述装置的同一面(例如，如在此实例中在顶面的相对侧上，或在正面的相对侧上)。图4B展示装置D400的另一实施方案D410，其中麦克风MClO和MC20安置于装置的相对面，且图4C展示装置D400的又一实施方案D420，其中麦克风MClO和MC20安置于所述装置的邻近面。媒体播放器还可经设计以使得较长轴在既定使用期间为水平的。图5A展示作为免提车载套件的多麦克风便携型音频感测装置D500的图。此装置可经配置以安装在交通工具的仪表盘中或可移除地固定至风挡、遮光板或另一内部表面。装置D500包括扬声器85和阵列R100的实施方案。在此特定实例中，装置D500包括阵列R100的四麦克风实施方案R102。此装置可经配置以经由一个或一个以上编解码器无线地发射和接收话音通信数据，例如上文所列的实例。或者或另外，此装置可经配置以经由与例如蜂窝式电话手持机等电话装置的通信(例如，使用如上文所描述的Bluetooth协议的版本)支持半双工或全双工电话。图5B展示作为书写装置(例如，钢笔或铅笔)的多麦克风便携型音频感测装置D600的图。装置D600包括阵列R100的实施方案。此装置可经配置以经由一个或一个以上编解码器无线地发射和接收话音通信数据，例如上文所列的实例。或者或另外，此装置可经配置以经由与例如蜂窝式电话手持机和/或无线头戴式耳机等装置的通信(例如，使用如上文所描述的Bluetooth协议的版本)支持半双工或全双工电话。装置D600可包括一个或一个以上处理器，其经配置以执行空间选择性处理操作以减小阵列R100所产生的信号中因装置D600的尖端在绘图表面81(例如，一张纸)上的移动引起的劈啪噪声82的电平。明确地揭示本文中所揭示的系统、方法和设备的适用性不限于图IA到图5B中所展示的特定实例。在多麦克风音频感测装置(例如，装置D100、D200、D300、D400、D500或D600)的操作期间，阵列RlOO产生多通道信号，其中每一通道是基于麦克风中的对应一者对声环境的响应。一个麦克风与另一麦克风相比可更直接地接收特定声音，使得对应通道彼此不同以共同地提供对声环境的与使用单个麦克风可捕捉到的表示相比更完整的表示。阵列RlOO可能需要对由麦克风产生的信号执行一个或一个以上处理操作以产生多通道信号S10。图6A展示包括音频预处理阶段APlO的阵列RlOO的实施方案R200的框图，所述音频预处理阶段APlO经配置以执行一个或一个以上此些操作，此些操作可包括(但不限于)阻抗匹配、模/数转换、增益控制和/或模拟和/或数字域中的滤波。图6B展示阵列R200的实施方案R210的框图。阵列R210包括音频预处理阶段APlO的实施方案AP20，其包括模拟预处理阶段PlOa和PlOb。在一个实例中，阶段PlOa和PlOb各自经配置以对对应的麦克风信号执行高通滤波操作(例如，使用截止频率50Hz、IOOHz或200Hz)。阵列RlOO可能需要产生多通道信号作为数字信号，也就是说，作为样本序列。举例来说，阵列R210包括各自经布置以对对应的模拟通道进行取样的模/数转换器(ADC)ClOa和ClOb。用于声应用的典型取样率包括8kHz、12kHz、16kHz和在从约8kHz到约16kHz的范围内的其它频率，但还可使用高达约44kHz的取样率。在此特定实例中，阵列R210还包括数字预处理阶段P20a和P20b，其各自经配置以对对应的数字化通道执行一个或一个以上预处理操作(例如，回音消除、噪声降低和/或频谱整形)。由阵列RlOO产生的多通道信号可用于支持空间处理操作，例如确定音频感测装置与特定声源之间的距离、降低噪声、加强从特定方向到达的信号分量和/或使一个或一个以上声音分量与其它环境声音分离的操作。举例来说，可执行空间选择性处理操作以使多通道信号的一个或一个以上所要声音分量与多通道信号的一个或一个以上噪声分量分离。典型的所要声音分量为音频感测装置的用户的话音的声音，且噪声分量的实例包括(但不限于)漫射环境噪声，例如街道噪声、汽车噪声和/或混串音噪声；以及定向噪声，例如造成干扰的讲话者和/或来自例如电视机、无线电或扩音系统等另一点源的声音。可在音频感测装置内和/或另一装置内执行的空间处理操作的实例在2008年8月25日申请的标题为“用于信号分离的系统、方法和设备(SYSTEMS，METHODS，ANDAPPARATUSFORSIGNALSEPARATION)”的第12/197，924号美国专利申请案和2008年11月M日申请的标题为“用于加强的可懂度的系统、方法、设备和计算机程序产品(SYSTEMS，METHODS,APPARATUS,ANDCOMPUTERPROGRAMPRODUCTSFORENHANCEDINTELLIGIBILITY)”的第12/277，283号美国专利申请案中描述，且包括(但不限于)波束成形和盲源分离操作。变化可在阵列R100的麦克风的制造期间出现，使得即使在一批大规模生产且外观上相同的麦克风当中，敏感性也可能在一个麦克风与另一麦克风之间显著变化。用于便携型畅销装置中的麦克风可以(例如)+/"三分贝的敏感性公差制造，使得两个此类麦克风的敏感性在阵列R100的实施方案中可相差多达六分贝。此外，一旦已将麦克风安装到所述装置中或所述装置上，在所述麦克风的有效响应特性就可发生改变。麦克风通常安装在声端口后面的装置外壳内，且可通过按压和/或通过摩擦或粘附而固定在适当位置。图7A展示麦克风AlO安装在声端口A30后面的装置外壳A20内的实例的横截面。外壳A20通常由成模塑料(例如，聚碳酸酯(PC)和/或丙烯腈-丁二烯-苯乙烯(ABQ)制成，且通常将声端口A30实施为外壳中的一个或一个以上小13孔或槽。外壳A20中的突出部抵着可压缩(例如，弹性体)垫片A40将压力施加到麦克风A10,以将麦克风紧固在适当位置。许多因素可能影响以此方式安装的麦克风的有效响应特性，例如麦克风安装于内的腔的共振和/或其它声特性、抵着垫片的压力的量和/或均勻性、声端口的大小和形状等。对由阵列RlOO产生的多通道信号的操作(例如，空间处理操作)的性能可取决于阵列通道的响应特性彼此匹配的程度如何。举例来说，通道的电平因相应麦克风的响应特性的差异、相应预处理阶段的增益等级的差异和/或电路噪声电平的差异而不同是可能的。在此情况下，所得多通道信号可能不提供对声环境的准确表示，除非可补偿麦克风响应特性之间的差异。在无此补偿的情况下，基于此信号的空间处理操作可能提供错误结果。举例来说，在低频率(即，大约IOOHz到IkHz)下通道之间小至一或两分贝的振幅响应偏差可显著减小低频率方向性。阵列RlOO的通道当中的不平衡的效应对于处理来自具有两个以上麦克风的阵列RlOO的实施方案的多通道信号的应用可能尤其有害。可能需要对经组装的多麦克风音频感测装置执行预递送校准操作(也就是说，在递送给用户之前)，以便量化阵列的通道的有效响应特性之间的差异。举例来说，可能需要对经组装的多麦克风音频感测装置执行预递送校准操作，以便量化阵列的通道的有效增益特性之间的差异。预递送校准操作可包括基于阵列RlOO的实例对声场的响应而计算一个或一个以上补偿因子，其中待校准的所有麦克风暴露于相同的声压电平(SPL)。图7B展示经布置以用于此操作的一个实例的消声室的俯视图。在此实例中，将头部和躯干仿真器(HeadandTorsoSimulator)(HATS，如由丹麦奈如姆的Bruel&Kjaer公司制造)定位于四个扬声器的向内聚焦阵列内的消声室中。所述扬声器由校准信号驱动以产生如图所示封闭HATS的声场，使得声压电平(SPL)关于在所述场内的位置大体上恒定。在一个实例中，所述扬声器由白或粉红噪声的校准信号驱动以产生漫射噪声场。在另一实例中，校准信号包括在所关注频率下的一个或一个以上音调(例如，在约200Hz到约2kHz的范围内(例如在IkHz下)的音调)。声场可能需要在HATS耳朵参考点(ERP)或嘴巴参考点(MRP)处具有从75dB到78dB的SPL。具有待校准的阵列RlOO的实例的多麦克风音频感测装置适当地放置于所述声场内。举例来说，如在图8的实例中，头戴式耳机DlOO或D200可以相对于用嘴巴讲话者的标准定向安装于HATS的耳朵处，或如在图9的实例中，手持机D300可以相对于用嘴巴讲话者的标准定向定位于HATS处。接着记录由阵列响应于声场而产生的多通道信号。基于信号的通道之间的关系，计算一个或一个以上补偿因子(例如，通过所述装置的一个或一个以上处理器和/或通过一个或一个以上外部处理器)以匹配所述阵列的特定实例的通道的增益和/或频率响应特性。举例来说，可计算通道的电平之间的差异或比率以获得增益因子，其可在此之后应用于所述通道中的一者(例如，作为增益因子)以补偿阵列的通道的增益响应特性之间的差异。虽然预递送校准程序在研究和设计期间可为有用的，但对于大多数所制造装置来说，此程序可能过于耗时或在其它方面执行起来不切实际。举例来说，对畅销装置的每一实例执行此操作在经济上可能是不可行的。此外，单独的预递送操作可能不足以在装置的整个寿命期间确保良好的性能。由于可包括老化、温度、辐射和污染的因素，麦克风敏感性可14随着时间的过去而偏移或以其它方式改变。然而，在未适当地补偿阵列的各个通道的响应间的不平衡的情况下，多通道操作(例如，空间选择性处理操作)的所要性能等级可能难以或不可能实现。图IOA展示根据包括任务T100a、T100b、T200和T300的一般配置的处理多通道音频信号(例如，如由阵列RlOO的实施方案所产生)的方法MlOO的流程图。任务TlOOa随着时间的过去而计算音频信号的第一通道的电平的一系列值，且任务TlOOb随着时间的过去而计算音频信号的第二通道的电平的一系列值。基于第一和第二通道的所述系列值，任务T200随着时间的过去而计算增益因子的一系列值。任务T300根据所述系列的增益因子值，随着时间的过去而相对于第一通道的振幅控制第二通道的振幅。任务TlOOa和TlOOb可经配置以在对应时间周期(也称为多通道信号的“区段”)内计算对应通道的电平的系列值中的每一者，作为对所述通道的振幅或量值(也称为“绝对振幅”或“经改正振幅”)的量度。振幅或量值的量度的实例包括总量值、平均量值、均方根(RMS)振幅、中值量值和峰值量值。在数字域中，可根据例如以下表达式的表达式对η个样本值&，i=l，2，...，n的块(也称为“帧”)计算这些量度权利要求1.一种处理多通道音频信号的方法，所述方法包含随着时间的过去而计算所述音频信号的第一通道的电平的一系列值；随着时间的过去而计算所述音频信号的第二通道的电平的一系列值；基于所述第一通道的电平的所述系列值和所述第二通道的电平的所述系列值，随着时间的过去而计算增益因子的一系列值；以及根据所述增益因子的所述系列值随着时间的过去而相对于所述第一通道的振幅控制所述第二通道的振幅，其中所述方法包括指示所述音频信号的区段是信息区段，且其中随着时间的过去而计算增益因子的一系列值包括对于所述增益因子的所述系列值中的至少一者且响应于所述指示，基于所述第一通道的所述电平的对应值、所述第二通道的所述电平的对应值以及偏置因子来计算所述增益因子值，且其中所述偏置因子是基于音频感测装置相对于定向信息源的标准定向。2.根据权利要求1所述的处理多通道音频信号的方法，其中所述指示区段是信息区段是基于所述第一通道的所述电平的对应值和所述第二通道的所述电平的对应值。3.根据权利要求1所述的处理多通道音频信号的方法，其中所述指示区段是信息区段是基于包括阵列不平衡估计的关系，且其中所述阵列不平衡估计是基于所述增益因子的所述系列值中的至少一者。4.根据权利要求1所述的处理多通道音频信号的方法，其中增益因子的所述系列值中的每一者是基于所述第一通道的电平的所述系列值中的一者与所述第二通道的电平的所述系列值中的一者的比率。5.根据权利要求1所述的处理多通道音频信号的方法，其中所述偏置因子与所述第一通道的所述电平的所述对应值与所述第二通道的所述电平的所述对应值之间的比率无关。6.根据权利要求1所述的处理多通道音频信号的方法，其中所述计算所述增益因子值包括使用所述偏置因子来对所述第二通道的所述电平的所述对应值进行加权，且其中所述增益因子值是基于所述第一通道的所述电平的所述对应值与所述第二通道的所述电平的所述经加权对应值的比率。7.根据权利要求1所述的处理多通道音频信号的方法，其中所述方法包括基于所述音频信号的区段的电平与背景电平值之间的关系来指示所述区段是背景区段。8.根据权利要求1所述的处理多通道音频信号的方法，其中所述方法包括指示所述音频信号的并非背景区段的区段是经平衡噪声区段。9.根据权利要求1所述的处理多通道音频信号的方法，其中所述方法包括基于包括阵列不平衡估计的关系来指示所述音频信号的并非背景区段的区段是经平衡噪声区段，且其中所述阵列不平衡估计是基于所述增益因子的所述系列值中的至少一者。10.一种包含指令的计算机可读媒体，所述指令在由至少一个处理器执行时致使所述至少一个处理器执行处理多通道音频信号的方法，所述指令包含在由处理器执行时致使所述处理器随着时间的过去而计算所述音频信号的第一通道的电平的一系列值的指令；在由处理器执行时致使所述处理器随着时间的过去而计算所述音频信号的第二通道的电平的一系列值的指令；在由处理器执行时致使所述处理器基于所述第一通道的电平的所述系列值和所述第二通道的电平的所述系列值随着时间的过去而计算增益因子的一系列值的指令；以及在由处理器执行时致使所述处理器根据所述增益因子的所述系列值随着时间的过去而相对于所述第一通道的振幅控制所述第二通道的振幅的指令，其中所述媒体包括在由处理器执行时致使所述处理器指示所述音频信号的区段是信息区段的指令，且其中在由处理器执行时致使所述处理器随着时间的过去而计算增益因子的一系列值的所述指令包括在由处理器执行时致使所述处理器响应于所述指示，基于所述第一通道的所述电平的对应值、所述第二通道的所述电平的对应值以及偏置因子来计算所述增益因子的所述系列值中的至少一者的指令，且其中所述偏置因子是基于音频感测装置相对于定向信息源的标准定向。11.根据权利要求10所述的计算机可读媒体，其中在由处理器执行时致使所述处理器指示区段是信息区段的所述指令包括在由处理器执行时致使所述处理器基于所述第一通道的所述电平的对应值和所述第二通道的所述电平的对应值来指示区段是信息区段的指令。12.根据权利要求10所述的计算机可读媒体，其中在由处理器执行时致使所述处理器指示区段是信息区段的所述指令包括在由处理器执行时致使所述处理器基于包括阵列不平衡估计的关系来指示区段是信息区段的指令，且其中所述阵列不平衡估计是基于所述增益因子的所述系列值中的至少一者。13.根据权利要求10所述的计算机可读媒体，其中增益因子的所述系列值中的每一者是基于所述第一通道的电平的所述系列值中的一者与所述第二通道的电平的所述系列值中的一者的比率。14.根据权利要求10所述的计算机可读媒体，其中所述偏置因子与所述第一通道的所述电平的所述对应值与所述第二通道的所述电平的所述对应值之间的比率无关。15.根据权利要求10所述的计算机可读媒体，其中在由处理器执行时致使所述处理器计算所述增益因子值的所述指令包括在由处理器执行时致使所述处理器使用所述偏置因子来对所述第二通道的所述电平的所述对应值进行加权的指令，且其中所述增益因子值是基于所述第一通道的所述电平的所述对应值与所述第二通道的所述电平的所述经加权对应值的比率。16.根据权利要求10所述的计算机可读媒体，其中所述媒体包括在由处理器执行时致使所述处理器基于所述音频信号的区段的电平与背景电平值之间的关系来指示所述区段是背景区段的指令。17.根据权利要求10所述的计算机可读媒体，其中所述媒体包括在由处理器执行时致使所述处理器指示所述音频信号的并非背景区段的区段是经平衡噪声区段的指令。18.根据权利要求10所述的计算机可读媒体，其中所述媒体包括在由处理器执行时致使所述处理器基于包括阵列不平衡估计的关系来指示所述音频信号的并非背景区段的区段是经平衡噪声区段的指令，且其中所述阵列不平衡估计是基于所述增益因子的所述系列值中的至少一者。19.一种用于处理多通道音频信号的设备，所述设备包含用于随着时间的过去而计算所述音频信号的第一通道的电平的一系列值的装置；用于随着时间的过去而计算所述音频信号的第二通道的电平的一系列值的装置；用于基于所述第一通道的电平的所述系列值和所述第二通道的电平的所述系列值随着时间的过去而计算增益因子的一系列值的装置；以及用于根据所述增益因子的所述系列值随着时间的过去而相对于所述第一通道的振幅控制所述第二通道的振幅的装置，其中所述设备包括用于指示所述音频信号的区段是信息区段的装置，且其中所述用于随着时间的过去而计算增益因子的一系列值的装置经配置以响应于所述指示，基于所述第一通道的所述电平的对应值、所述第二通道的所述电平的对应值以及偏置因子来计算所述增益因子的所述系列值中的至少一者，且其中所述偏置因子是基于音频感测装置相对于定向信息源的标准定向。20.根据权利要求19所述的用于处理多通道音频信号的设备，其中所述用于指示区段是信息区段的装置经配置以基于所述第一通道的所述电平的对应值和所述第二通道的所述电平的对应值来指示区段是信息区段。21.根据权利要求19所述的用于处理多通道音频信号的设备，其中所述用于指示区段是信息区段的装置经配置以基于包括阵列不平衡估计的关系来指示区段是信息区段，且其中所述阵列不平衡估计是基于所述增益因子的所述系列值中的至少一者。22.根据权利要求19所述的用于处理多通道音频信号的设备，其中增益因子的所述系列值中的每一者是基于所述第一通道的电平的所述系列值中的一者与所述第二通道的电平的所述系列值中的一者的比率。23.根据权利要求19所述的用于处理多通道音频信号的设备，其中所述偏置因子与所述第一通道的所述电平的所述对应值与所述第二通道的所述电平的所述对应值之间的比率无关。24.根据权利要求19所述的用于处理多通道音频信号的设备，其中所述用于计算所述增益因子值的装置经配置以使用所述偏置因子对所述第二通道的所述电平的所述对应值进行加权来计算所述增益因子的所述系列值中的所述至少一者中的每一者，且其中所述增益因子值是基于所述第一通道的所述电平的所述对应值与所述第二通道的所述电平的所述经加权对应值的比率。25.根据权利要求19所述的用于处理多通道音频信号的设备，其中所述设备包括用于基于所述音频信号的区段的电平与背景电平值之间的关系来指示所述区段是背景区段的直ο26.根据权利要求19所述的用于处理多通道音频信号的设备，其中所述设备包括用于指示所述音频信号的并非背景区段的区段是经平衡噪声区段的装置。27.根据权利要求19所述的用于处理多通道音频信号的设备，其中所述设备包括用于基于包括阵列不平衡估计的关系来指示所述音频信号的并非背景区段的区段是经平衡噪声区段的装置，且其中所述阵列不平衡估计是基于所述增益因子的所述系列值中的至少一者。28.根据权利要求19所述的用于处理多通道音频信号的设备，其中所述设备包含通信装置，所述通信装置包括所述用于计算第一通道的电平的一系列值的装置、所述用于计算第二通道的电平的一系列值的装置、所述用于计算增益因子的一系列值的装置、所述用于控制所述第二通道的所述振幅的装置以及所述用于指示所述音频信号的区段是信息区段的装置，且其中所述通信装置包含经配置以产生所述多通道音频信号的麦克风阵列。29.一种用于处理多通道音频信号的设备，所述设备包含第一电平计算器，其经配置以随着时间的过去而计算所述音频信号的第一通道的电平的一系列值；第二电平计算器，其经配置以随着时间的过去而计算所述音频信号的第二通道的电平的一系列值；增益因子计算器，其经配置以基于所述第一通道的电平的所述系列值和所述第二通道的电平的所述系列值随着时间的过去而计算增益因子的一系列值；振幅控制元件，其经配置以根据所述增益因子的所述系列值随着时间的过去而相对于所述第一通道的振幅控制所述第二通道的振幅；以及信息区段指示器，其经配置以指示所述音频信号的区段是信息区段，其中所述增益因子计算器经配置以响应于所述指示，基于所述第一通道的所述电平的对应值、所述第二通道的所述电平的对应值以及偏置因子来计算所述增益因子的所述系列值中的至少一者，且其中所述偏置因子是基于音频感测装置相对于定向声信息源的标准定向。30.根据权利要求四所述的用于处理多通道音频信号的设备，其中所述信息区段指示器经配置以基于所述第一通道的所述电平的对应值和所述第二通道的所述电平的对应值来指示区段是信息区段。31.根据权利要求四所述的用于处理多通道音频信号的设备，其中所述信息区段指示器经配置以基于包括阵列不平衡估计的关系来指示区段是信息区段，且其中所述阵列不平衡估计是基于所述增益因子的所述系列值中的至少一者。32.根据权利要求四所述的用于处理多通道音频信号的设备，其中增益因子的所述系列值中的每一者是基于所述第一通道的电平的所述系列值中的一者与所述第二通道的电平的所述系列值中的一者的比率。33.根据权利要求四所述的用于处理多通道音频信号的设备，其中所述偏置因子与所述第一通道的所述电平的所述对应值与所述第二通道的所述电平的所述对应值之间的比率无关。34.根据权利要求四所述的用于处理多通道音频信号的设备，其中所述增益因子计算器经配置以使用所述偏置因子对所述第二通道的所述电平的所述对应值进行加权来计算所述增益因子的所述系列值中的所述至少一者中的每一者，且其中所述增益因子值是基于所述第一通道的所述电平的所述对应值与所述第二通道的所述电平的所述经加权对应值的比率。35.根据权利要求四所述的用于处理多通道音频信号的设备，其中所述设备包括背景区段指示器，所述背景区段指示器经配置以基于所述音频信号的区段的电平与背景电平值之间的关系来指示所述区段是背景区段。36.根据权利要求四所述的用于处理多通道音频信号的设备，其中所述设备包括经平衡噪声区段指示器，所述经平衡噪声区段指示器经配置以指示所述音频信号的并非背景区段的区段是经平衡噪声区段。37.根据权利要求四所述的用于处理多通道音频信号的设备，其中所述设备包括经平衡噪声区段指示器，所述经平衡噪声区段指示器经配置以基于包括阵列不平衡估计的关系来指示所述音频信号的并非背景区段的区段是经平衡噪声区段，且其中所述阵列不平衡估计是基于所述增益因子的所述系列值中的至少一者。38.根据权利要求四所述的用于处理多通道音频信号的设备，其中所述设备包含通信装置，所述通信装置包括所述第一电平计算器、所述第二电平计算器、所述增益因子计算器、所述振幅控制元件以及所述信息区段指示器，且其中所述通信装置包含经配置以产生所述多通道音频信号的麦克风阵列。全文摘要一种用于处理多通道音频信号的方法可经配置以基于所述信号的两个通道的电平相对于一个通道控制另一通道的振幅。一种此实例将偏置因子用于对所述信号的信息区段的振幅控制，所述偏置因子是基于音频感测装置相对于定向声信息源的标准定向。文档编号H04R3/00GK102047688SQ200980119649公开日2011年5月4日申请日期2009年6月2日优先权日2008年6月2日发明者张国亮,贤珍·Sr·朴申请人:高通股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张国亮;贤珍.Ｓｒ.朴
技术所有人：高通股份有限公司
我是此专利的发明人

上一篇：编码器的制作方法
上一篇：用于多个接收天线的多路复用布置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。