用于对多信道信号进行基于相位的处理的系统、方法、设备及计算机可读媒体的制作方法

文档序号:7911771阅读:227来源:国知局
专利名称:用于对多信道信号进行基于相位的处理的系统、方法、设备及计算机可读媒体的制作方法
技术领域
本发明涉及信号处理。
背景技术
先前在安静的办公室或家庭环境中执行的许多活动如今在声变情景(如汽车、街道或咖啡馆)中执行。举例来说,有人可能希望使用话音通信信道与另一人通信。所述信道可(例如)由移动无线手持机或头戴式耳机、对讲机、双向无线电、车载套件或另一通信装置来提供。因此,在用户由其它人包围的环境中使用移动装置(例如,智能电话、手持机及/或头戴式耳机)来发生大量的话音通信,其中具有在人们趋向于聚集的地方通常遇到的噪声内容种类。此噪声趋向于使电话通话的远端处的用户分心或受到干扰。此外,许多标准自动化商业交易(例如,账户结余或股票报价查核)使用以话音辨识为基础的数据查询,且干扰性噪声可能显著地妨碍到这些系统的准确性。对于通信发生在有噪声环境中的应用来说,可希望将所要语音信号与背景噪声分离。噪声可被定义为干扰所要信号或以其它方式使所要信号降级的所有信号的组合。背景噪声可包括在有声环境内产生的众多噪声信号,例如其它人的背景谈话以及从所要信号及 /或任何其它信号产生的反射及回响。除非所要语音信号与背景噪声分离,否则可能难以可靠且高效地利用所要语音信号。在一个特定实例中,在有噪声环境中产生语音信号,且使用语音处理方法来将所述语音信号与环境噪声分离。
移动环境中所遇到的噪声可包括多种不同分量,例如竞争谈话者、音乐、嘈杂的说话声、街道噪声及/或机场噪声。由于此噪声的特征通常不稳定且接近于用户的自身频率特征,故可能难以使用传统的单麦克风或固定波束成形型方法来将噪声模型化。单麦克风噪声减少技术通常要求显著参数调谐以实现最佳性能。举例来说,合适的噪声参考在此些情况下可能非直接可用的,且可能必需间接地得出噪声参考。因此,可需要以多麦克风为基础的高级信号处理以支持移动装置用于有噪声环境中的话音通信。

发明内容
根据一般配置,一种处理多信道信号的方法包括,针对所述多信道信号的多个不同频率分量中的每一者,计算所述频率分量在所述多信道信号的第一信道中的相位与所述频率分量在所述多信道信号的第二信道中的相位之间的差,以获得多个所计算相位差。此方法包括计算所述第一信道的电平及所述第二信道的对应电平。此方法包括基于所述第一信道的所计算电平、所述第二信道的所计算电平及所述多个所计算相位差中的至少一者来计算增益因子的更新值;及通过根据所述更新值,相对于所述第一信道的对应振幅更改所述第二信道的振幅来产生经处理的多信道信号。本文中还揭示一种设备,其包括用于执行这些动作中的每一者的装置。本文中还揭示一种计算机可读媒体,其具有存储用于执行此种方法的机器可执行指令的有形特征。根据一般配置,一种用于处理多信道信号的设备包括第一计算器,所述第一计算器经配置以通过针对所述多信道信号的多个不同频率分量中的每一者,计算所述频率分量在所述多信道信号的第一信道中的相位与所述频率分量在所述多信道信号的第二信道中的相位之间的差,以获得多个所计算相位差。此设备包括第二计算器,其经配置以计算所述第一信道的电平及所述第二信道的对应电平;及第三计算器,其经配置以基于所述第一信道的所计算电平、所述第二信道的所计算电平及所述多个所计算相位差中的至少一者来计算增益因子的更新值。此设备包括增益控制元件,所述增益控制元件经配置以通过根据所述更新值,相对于所述第一信道的对应振幅更改所述第二信道的振幅来产生经处理的多信道信号。


图1展示使用中的头戴式耳机DlOO的侧视图。图2展示戴在用户耳朵上的头戴式耳机DlOO的俯视图。图3A展示使用中的手持机D300的侧视图。图;3B展示关于麦克风阵列的宽面及端射区的实例。图4A展示根据一般配置的处理多信道信号的方法MlOO的流程图。图4B展示任务TlOO的实施方案T102的流程图。图4C展示任务TllO的实施方案Tl 12的流程图。图5A展示任务T300的实施方案T302的流程图。图5B展示任务T300的替代实施方案T304的流程图。图5C展示方法MlOO的实施方案M200的流程图。图6A展示说明估计到达方向的方法的几何近似法的实例。
图6B展示将图6A的近似法用于第二及第三象限值的实例。图7展示采取球形波前的模型的实例。图8A展示在通带与阻带之间具有相对突然的转变的遮蔽函数的实例。图8B展示遮蔽函数的线性滚降的实例。图8C展示遮蔽函数的非线性滚降的实例。图9A到图9C展示针对不同参数值的非线性函数的实例。图10展示遮蔽函数的方向图案的前向瓣及后向瓣。图IlA展示方法MlOO的实施方案Ml 10的流程图。图IlB展示任务T360的实施方案T362的流程图。图IlC展示任务T360的实施方案T364的流程图。图12A展示方法MlOO的实施方案M120的流程图。图12B展示方法MlOO的实施方案M130的流程图。图13A展示方法MlOO的实施方案M140的流程图。图13B展示方法MlOO的实施方案M150的流程图。图14A展示对应于三个不同阈值的接近性检测区的边界的实例。图14B展示容许方向范围与接近性泡状区的相交以获得说话者覆盖范围的锥形的实例。图15及图16展示如图14B中所展示的来源选择区边界的俯视图及侧视图。图17A展示方法MlOO的实施方案M160的流程图。图17B展示方法MlOO的实施方案M170的流程图。图18展示方法M170的实施方案M180的流程图。图19A展示根据一般配置的方法M300的流程图。图19B展示方法M300的实施方案M310的流程图。图20A展示方法M310的实施方案M320的流程图。图20B展示根据一般配置的设备GlOO的框图。图21A展示根据一般配置的设备AlOO的框图。图21B展示设备AllO的框图。图22展示设备A120的框图。图23A展示阵列RlOO的实施方案R200的框图。图2 展示阵列R200的实施方案R210的框图。图24A展示根据一般配置的装置DlO的框图。图24B展示装置DlO的实施方案D20的框图。图25A到图25D展示多麦克风无线头戴式耳机DlOO的各种视图。图2队到图26D展示多麦克风无线头戴式耳机D200的各种视图。图27A展示多麦克风通信手持机D300的横截面图(沿中心轴线)。图27B展示装置D300的实施方案D310的横截面图。图28A展示多麦克风媒体播放器D400的图。图29A展示多麦克风免提车载套件D500的图。图30展示装置DlO的多麦克风便携式音频感测实施方案D600的图。
具体实施例方式真实世界充满着多种噪声源,包括单点噪声源,其通常侵入到多种声音中,从而导致回响。背景声噪声可包括由一般环境所产生的众多噪声信号及由其它人的背景谈话所产生的干扰信号,以及从所要声音信号及/或任何其它信号产生的反射及回响。环境噪声可影响所感测音频信号(例如,近端语音信号)的可懂度。可希望使用信号处理来区分所要音频信号与背景噪声。举例来说,对于通信可能发生在有噪声环境中的应用来说,可希望使用语音处理方法来区分语音信号与背景噪声且增强其可懂度。此处理在日常通信的许多方面中可为重要的,因为噪声几乎总是存在于真实世界情况中。可希望产生便携式音频感测装置,其具有经配置以接收声信号的两个或两个以上麦克风的阵列R100。可经实施以包括此阵列且可用于音频记录及/或话音通信应用的便携式音频感测装置的实例包括电话手持机(例如,蜂窝式电话手持机或智能电话);有线或无线头戴式耳机(例如,蓝牙头戴式耳机);手持型音频及/或视频记录器;经配置以记录音频及/或视频内容的个人媒体播放器;个人数字助理(PDA)或其它手持型计算装置;及笔记本型计算机、膝上型计算机、上网本型计算机或其它便携式计算装置。在正常使用期间,便携式音频感测装置可在相对于所要声音源的标准定向的范围中的任一定向下操作。举例来说,不同用户可以不同方式戴上或拿着装置,且同一用户可在不同时间甚至在同一使用周期内(例如,在单次电话呼叫期间)以不同方式戴上或拿着装置。图1展示使用中的头戴式耳机DlOO的侧视图,其包括在所述装置相对于用户嘴巴的标准定向的范围中的两个实例。头戴式耳机DlOO具有阵列RlOO的例子,其包括主要麦克风MC10,其经定位以在所述装置的典型使用期间较直接地接收用户的话音;及次要麦克风 MC20,其经定位以在所述装置的典型使用期间较不直接地接收用户的话音。图2展示在相对于用户嘴巴的标准定向中的戴在用户耳朵上的头戴式耳机DlOO的俯视图。图3A展示使用中的头戴式耳机D300的侧视图,其包括在所述装置相对于用户嘴巴的标准定向的范围中的两个实例。除非上下文明确限制,否则术语“信号”在本文中用以指示其普通意义中的任一者,包括如导线、总线或其它传输媒体上表达的存储器位置(或存储器位置的集合)的状态。除非上下文明确限制,否则术语“产生”在本文中用以指示其普通意义中的任一者,例如计算或以其它方式产生。除非上下文明确限制,否则术语“计算”在本文中用以指示其普通意义中的任一者,例如计算、评估、平滑化及/或从多个值进行选择。除非上下文明确限制,否则术语“获得”用以指示其普通意义中的任一者,例如计算、导出、接收(例如,从外部装置)及/或检索(例如,从存储元件阵列)。除非上下文明确限制,否则术语“选择”用以指示其普通意义中的任一者,例如识别、指示、应用及/或使用两个或两个以上者的集合中的至少一者及少于全部。在术语“包含”用在本描述及所附权利要求书中时,并不排除其它元件或操作。术语“基于”(如在“A基于B”中)用以指示其普通意义中的任一者,包括以下情况⑴“从…导出”(例如,“B为A的前驱者”)、(ii) “至少基于”(例如,“A至少基于B”),及在特定上下文中适合时,(iii) “等于”(例如,“A等于B”)。类似地,术语“响应于”用以指示其普通意义中的任一者,包括“至少响应于”。除非上下文另有指示,否则对多麦克风音频感测装置的麦克风的“位置”的参考指示所述麦克风的声敏感面的中心的位置。术语“信道”有时用以指示信号路径且在其它时候用以指示此路径所运载的信号,根据特定上下文而定。除非另有指示,否则术语“一连串” 用以指示两个或两个以上项目的序列。术语“对数”用以指示以十为底的对数,但此运算扩展到其它底数也在本发明的范围内。术语“频率分量”用以指示信号的频率或频带的集合中的一者,例如所述信号的频域表示的样本(或“频段”)(例如,由快速傅立叶变换产生) 或所述信号的子带(例如,巴克(Bark)标度子带)。除非另有指示,否则具有特定特征的设备的操作的任何揭示内容还明确地既定揭示具有类似特征的方法(且反之亦然),且根据特定配置的设备的操作的任何揭示内容还明确地既定揭示根据类似配置的方法(且反之亦然)。术语“配置”可参考如由其特定上下文所指示的方法、设备及/或系统来使用。除非由特定上下文另外指示,否则术语“方法”、 “进程”、“程序”及“技术”以一般意义来使用且可互换使用。除非由特定上下文另外指示, 否则术语“设备”及“装置”还以一般意义来使用且可互换使用。术语“元件”及“模块”通常用以指示较大配置的一部分。除非上下文明确地限制,否则术语“系统”在本文中用以指示其一般意义中的任一者,包括“相互作用以用于实现共同目的的元件群组”。以引用方式对文献的一部分的任何并入也应被理解为并入有在所述部分内所引用的术语或变量的定义(其中此些定义出现在文献中的别处)以及在所并入部分中所引用的任何图。可将近场定义为与声音接收器(例如,麦克风阵列)相距小于一个波长的空间区。 依据此定义,与所述区的边界相距的距离与频率成相反地变化。举例来说,在两百、七百及两千赫兹的频率下,与一波长边界相距的距离分别为约170、四十九及十七厘米。改为将近场/远场边界视为与麦克风阵列相距特定距离(例如,与阵列的麦克风或阵列的质心相距十五厘米,或与阵列的麦克风或阵列的质心相距1米或1. 5米)可为有用的。麦克风阵列产生多信道信号,其中每一信道基于麦克风中的对应一者对声环境的响应。可希望对所述多信道信号执行空间选择性处理(SSP)操作,以辨别所述信号的从不同来源接收到的分量。举例来说,可希望辨别来自所要方向性声音源(例如,用户的嘴巴) 的声音分量与来自扩散的背景噪声及/或一个或一个以上方向性干扰性噪声源(例如,竞争性说话者)的声音分量。SSP操作的实例包括波束成形方法(例如,广义旁瓣消除(GSC)、 最小方差无失真响应(MVDR)及/或线性约束最小方差(LCMV)波束成形器)、盲源分离 (BSS)及其它自适应学习方法,及基于增益的接近性检测。SSP操作的典型应用包括用于便携式音频感测装置的多麦克风噪声减少方案。对阵列RlOO所产生的多信道信号的操作(例如,SSP操作)的性能可取决于阵列信道的响应特性彼此匹配的良好程度。举例来说,信道的电平有可能归因于以下各项而不同相应麦克风的响应特性的差异、相应预处理级的增益电平的差异,及/或信道的电路噪声电平的差异。在此种情况下,除非可补偿信道响应特性之间的失配(也被称作“信道响应不平衡”),否则所得多信道信号不可提供声环境的准确表示。在无此补偿的情况下,基于此信号的SSP操作可提供有错误的结果。对于使用信道之间的增益差异来指示方向性声音源的相对接近性的操作来说,信道的响应之间的不平衡将趋向于降低所述接近性指示的准确性。在另一实例中,在低频率(即,约IOOHz到IkHz) 下信道之间小如一分贝或两分贝的振幅响应偏差可显著降低低频方向性。阵列RlOO的信道的响应间不平衡的效应可对以下应用尤为有害处理来自具有两个以上麦克风的阵列RlOO的实施方案的多信道信号。准确的信道校准对头戴式耳机应用可尤为重要。举例来说,可希望配置便携式音频感测装置以辨别从近场源到达的声音分量与从远场源到达的声音分量。此辨别可基于所述多信道信号的两个信道的增益电平之间的差异(即,“信道间增益电平差异”)来执行,因为可预期此差异对于来自位于阵列的端射方向处的近场源(即,在穿过对应麦克风的中心的线附近)的声音分量来说较高。随着麦克风之间的距离减小,近场信号的信道间增益电平差异也减小。对于手持型应用来说,近场信号的信道间增益电平差异通常与远场信号的信道间增益电平差异相差约六分贝。然而,对于头戴式耳机应用来说,典型近场声音分量的信道间增益电平差异与典型远场声音分量的信道间增益电平差异的偏差可在三分贝内(或更小)。在此种情况下,仅几分贝的信道响应不平衡可严重妨碍辨别此些分量的能力,而三分贝或更大的不平衡可破坏所述能力。阵列信道的响应之间的不平衡可起因于麦克风自身的响应之间的差异。变化可出现在阵列RlOO的麦克风的制造期间,使得甚至在一批大量产生且外观相同的麦克风中,麦克风间的灵敏度也可彼此显著变化。举例来说,用于便携式大量销售的音频感测装置中的麦克风可以正负三分贝的灵敏度容差制造,使得在阵列RlOO的实施方案中两个此种麦克风的灵敏度可相差多达六分贝。可在便携式音频感测装置的制造期间通过使用响应已经匹配(例如,经由挑选或装仓过程)的麦克风来解决信道响应不平衡的问题。另外或其它,可在实验室及/或在生产设施(例如,工厂)中对阵列RlOO的麦克风(或对包括所述阵列的装置)执行信道校准程序。此程序可通过计算一个或一个以上增益因子及将此些因子应用于对应信道来补偿所述不平衡以产生经平衡的多信道信号。可在服务之前执行的校准程序的实例描述于2009 年5月观日申请的标题为“用于多信道信号平衡的系统、方法及设备(SYSTEMS,METHODS, AND APPARATUS FOR MULTICHANNEL SIGNAL BALANCING) ”的第 12/473,930号美国专利申请案及2008年12月12日申请的标题为“用于基于多麦克风的语音增强的系统、方法及设备 (SYSTEMS,METHODS,AND APPARATUS FOR MULTI-MICROPHONE BASED SPEECH ENHANCEMENT)” 的第12/334,246美国专利申请案号中。然而,此些匹配或校准操作可增加生产所述装置的成本,且其还可对在装置的服务寿命期间出现的信道响应不平衡(例如,归因于老化)无效。另外或其它,可在服务期间执行信道校准(例如,如第12/473,930号美国专利申请案中所描述)。此程序可用以校正随时间而出现的响应不平衡及/或校正初始响应不平衡。举例来说,初始响应不平衡可能归因于麦克风失配,及/或归因于有错误的校准程序 (例如,在所述程序期间触摸或覆盖麦克风)。为了避免用波动的信道电平令用户分心,可希望此程序应用随时间逐渐改变的补偿。然而,对于初始响应不平衡较大的情况来说,此逐渐式补偿可导致较长的收敛周期(例如,一分钟到十分钟或以上),在此时间期间,对所述多信道信号的SSP操作可能较差地执行,从而导致令人不满意的用户体验。可使用相位分析来对多信道信号的时频点进行分类。举例来说,可希望配置一系统、方法或设备以基于在多个不同频率中的每一者下多信道信号的信道的估计相位之间的差异来对所述信号的时频点进行分类。此些配置在本文中被称作“基于相位”。
可希望使用基于相位的方案来识别展现特定相位差特性的时频点。举例来说,基于相位的方案可经配置以应用关于麦克风间距离及信道间相位差的信息来确定受感测的多信道信号的特定频率分量是源自相对于阵列轴线的容许角度范围内或是源自此范围外。 可使用此确定来辨别从不同方向到达的声音分量(例如,使得源自所述容许范围内的声音被选择且源自所述范围外的声音被拒绝)及/或辨别从近场源与远场源到达的声音分量。在典型应用中,使用此系统、方法或设备来为在所述多信道信号的至少一部分内 (例如,在特定范围频率内及/或在特定时间间隔内)的每一时频点计算相对于麦克风对的到达方向。可将方向遮蔽函数应用于这些结果以区分具有在所要范围内的到达方向的点与具有其它到达方向的点。可使用来自方向遮蔽操作的结果以通过丢弃或衰减具有在遮蔽外的到达方向的时频点来使来自非所要方向的声音分量衰减。如上文所述,许多个多麦克风空间处理操作固有地视麦克风信道的相对增益响应而定,使得信道增益响应的校准可为启用此些空间处理操作所必需的。在制造期间执行此校准通常为费时及/或在其它方式昂贵。然而,基于相位的方案可经实施以相对不受输入信道间的增益不平衡所影响,使得对应信道的增益响应彼此匹配的程度并非经校准相位差的准确性及基于其的后续操作(例如,方向遮蔽)的限制因素。可希望通过使用此方案的分类结果支持如本文所描述的信道校准操作(也被称作“信道平衡”操作)来利用对基于相位的方案的在信道不平衡的稳健性。举例来说,可希望使用基于相位的方案来识别可用于信道平衡的所记录多信道信号的频率分量及/或时间间隔。此方案可经配置以选择以下时频点,所述时频点的到达方向指示其将预期在每一信道中产生相对相等的响应。关于如图IBB中所展示的相对于双麦克风阵列的声音方向的范围,可希望仅使用从宽面方向(即,正交于阵列轴线的方向)到达的声音分量来进行信道校准。举例来说,在无近场源在作用中且声音源分散(例如,背景噪声)时,可找到此条件。使用来自远场端射源的声音分量进行校准也可为可接受的,因为此些分量可预期引致可忽略的信道间增益电平差异(例如,归因于分散)。然而,从阵列的端射方向(即,阵列轴线附近的方向)到达的近场声音分量将预期具有表示来源位置信息的信道之间的增益差异而非信道不平衡。因此,使用此些分量进行校准可产生不正确的结果,且可希望使用方向遮蔽操作来区分此些分量与从宽面方向到达的声音分量。可使用此基于相位的分类方案来在运行时(例如,在装置的使用期间,无论是连续或是间歇地)支持校准操作。以此方式,可实现自身不受信道增益响应不平衡影响的快速且准确的信道校准操作。或者,可在某一时间周期内积累来自选定时频点的信息以支持稍后进行的信道校准操作。图4A展示根据一般配置的处理多信道信号的方法MlOO的流程图,其包括任务 T100、T200、T300及Τ400。任务TlOO针对多信道信号的多个不同频率分量中的每一者计算所述信号的信道(例如,麦克风信道)之间的相位差。任务Τ200计算所述多信道信号的第一信道的电平及所述多信道信号的第二信道的对应电平。任务Τ300基于计算出的电平及所述计算出的相位差中的至少一者,更新增益因子值。基于所更新的增益因子值,任务Τ400 相对于所述第一信道的对应振幅更改所述第二信道的振幅,以产生经处理(例如,经平衡) 的多信道信号。还可使用方法MlOO来支持对所述多信道信号的进一步操作(例如,如本文中更详细地描述),例如SSP操作。方法MlOO可经配置以将所述多信道信号处理成一连串区段。典型区段长度为约五或十毫秒至约四十或五十毫秒,且所述区段可为重叠(例如,与相邻区段重叠25%或 50%)或不重叠。在一个特定实例中,将所述多信道信号划分成一连串非重叠区段或“帧”, 其各自具有十毫秒的长度。任务TlOO可经配置以针对所述区段中的每一者计算一组相位差(例如,向量)。在方法MlOO的一些实施方案中,任务T200经配置以计算每一信道的区段中的每一者的电平,且任务T300经配置以更新所述区段中的至少一些区段的增益因子值。 在方法MlOO的其它实施方案中,任务T200经配置以计算每一信道的区段中的每一者的一组子带电平,且任务T300经配置以更新一组子带增益因子值中的一者或一者以上。由方法 MlOO处理的区段也可为由不同操作处理的较大区段的区段(即,“子帧”),或反之亦然。图4B展示任务TlOO的实施方案T102的流程图。对于每一麦克风信道来说,任务 T102包括子任务TllO的相应例子,其针对不同频率分量中的每一者来估计所述信道的相位。图4C展示任务TllO的实施方案T112的流程图,实施方案T112包括子任务T1121及 T1122。任务T1121计算所述信道的频率变换,例如快速傅立叶变换(FFT)或离散余弦变换 (DCT)。任务T1121通常经配置以针对每一区段计算所述信道的频率变换。举例来说,可希望配置任务Tl 121以执行每一区段的1 点或256点FFT。任务Tl 121的替代实施方案经配置以使用子带滤波器组来分离所述信道的各种频率分量。任务T1122针对不同频率分量(也称作“频段”)中的每一者来计算(例如,估计) 麦克风信道的相位。举例来说,对于待检查的每一频率分量来说,任务T1122可经配置以将所述相位估计为对应FFT系数的虚数项与所述FFT系数的实数项的比率的逆正切(也称作 jxJEW (arctEingent)) ο任务T102还包括子任务T120,所述子任务T120基于每一信道的估计相位来针对不同频率分量中的每一者计算相位差z^。任务T120可经配置以通过从所述频率分量在一信道中的估计相位减去所述频率分量在另一信道中的估计相位来计算相位差。举例来说, 任务T120可经配置以通过从所述频率分量在一(例如,次要)信道中的的估计相位减去所述频率分量在另一(主要)信道中的的估计相位来计算相位差。在此种情况下,所述主要信道可为预期具有最高信噪比的信道,例如对应于以下麦克风的信道所述麦克风预期在装置的典型使用期间最直接地接收用户的话音。可希望配置方法MlOO (或经配置以执行此方法的系统或设备)以估计在频率的宽带范围内多信道信号的信道之间的相位差。举例来说,此宽带范围可从零Hz、五十Hz、一百 Hz或两百Hz的低频界扩展到三kHz、3. 5kHz或四kHz (或甚至更高,例如高达七kHz或八 kHz或以上)的高频界。然而,任务TlOO可不必计算所述信号的整个带宽上的相位差。举例来说,对于在此宽带范围中的许多频带来说,相位估计可为不切实际或不必要的。在极低频率下对所接收波形的相位关系所作的实际评价通常需要变换器之间的对应较大间距。因此,麦克风之间的最大可用间距可确定低频界。另一方面,麦克风之间的距离不应超过最小波长的一半以便避免空间混叠。举例来说,八千赫兹的取样速率给出从零千赫兹到四千赫兹的带宽。四kHz信号的波长为约8. 5厘米,因此在此种情况下,邻近麦克风之间的间距不应超过约四厘米。麦克风信道可经低通滤波以便去除可能引致空间混叠的频率。因此,可希望配置任务T1122以计算针对少于由任务T1121产生的全部频率分量(例如,少于由任务T1121执行的FFT的全部频率样本)的相位估计。举例来说,任务T1122 可经配置以计算约五十Hz、IOOHz、200Hz或300Hz到约500Hz或1000Hz (明确地涵盖并揭示这八个组合中的每一者)的频率范围的相位估计。可预期,此范围将包括尤其可用于校准的分量且将排除较不可用于校准的分量。可希望还配置任务TlOO以计算将用于实现除信道校准外的目的的相位估计。举例来说,任务TlOO还可经配置以计算将用以跟踪及/或增强用户的话音(例如,如下文更详细地描述)的相位估计。在一个此种实例中,任务T1122还经配置以计算针对700Hz到 2000Hz的频率范围的相位估计,所述范围可预期包括大多数用户话音的能量。对于四千赫兹带宽信号的128点FFT来说,700Hz到2000Hz的范围粗略地对应于从第十个样本到第三十二个样本的二十三个频率样本。在其它实例中,任务T1122经配置以计算从约五十Hz、 IOOHz、200Hz、300Hz 或 500Hz 的下界扩展到约 700Hz、1000Hz、1200Hz、1500Hz 或 2000Hz 的上界(明确地涵盖并揭示这些下界及上界的二十五个组合中的每一者)的频率范围内的相位估计。电平计算任务T200经配置以计算多信道信号的对应区段中的第一信道及第二信道中的每一者的电平。或者,任务T200可经配置以计算所述多信道信号的对应区段的一组子带中的每一者中的第一及第二信道中的每一者的电平。在此种情况下,任务T200可经配置以计算具有同一宽度(例如,500Hz、1000Hz或1200Hz的均一宽度)的一组子带中的每一者的电平。或者,任务T200可经配置以计算一组子带中的每一者的电平,其中所述子带中的至少两者(可能所有)具有不同宽度(例如,具有非均一宽度的一组子带,例如根据信号频谱的巴克(Bark)或美尔(Mel)标度分格的宽度)。任务T200可经配置以将选定子带中的每一信道在时域中的电平L计算为所述信道中的所述子带在对应时间周期内(例如,在对应区段内)的振幅或量值(也称作“绝对振幅”或“经矫正振幅”)的度量。振幅或量值的度量的实例包括总量值、平均量值、均方根 (RMS)振幅、中值量值及峰值量值。在数字域中,可根据例如以下等式中的一者的表达式来在η个样本值Xi,i = l,2,...,n的块(或“帧”)内计算此度量
权利要求
1.一种处理多信道信号的方法,所述方法包含针对所述多信道信号的多个不同频率分量中的每一者,计算所述频率分量在所述多信道信号的第一信道中的相位与所述频率分量在所述多信道信号的第二信道中的相位之间的差,以获得多个所计算相位差;计算所述第一信道的电平及所述第二信道的对应电平;基于所述第一信道的所述所计算电平、所述第二信道的所述所计算电平,及所述多个所计算相位差中的至少一者,计算增益因子的更新值;及通过根据所述更新值相对于所述第一信道的对应振幅而更改所述第二信道的振幅,来产生经处理的多信道信号。
2.根据权利要求1所述的处理多信道信号的方法,其中所述第一信道的所述所计算电平为所述第一信道在第一频率子带中的所计算能量,且其中所述第二信道的所述所计算电平为所述第二信道在所述第一频率子带中的所计算能量,且其中所述第一信道的所述振幅为所述第一信道在所述第一频率子带中的振幅,且其中所述第二信道的所述对应振幅为所述第二信道在所述第一频率子带中的振幅,且其中所述方法包含计算所述第一信道在第二频率子带中的能量,所述第二频率子带不同于所述第一频率子带;计算所述第二信道在所述第二频率子带中的能量;及基于所述第一信道在所述第二频率子带中的所述所计算能量、所述第二信道在所述第二频率子带中的所述所计算能量,及所述多个所计算相位差中的至少一者,来计算第二增益因子的更新值,其中所述产生经处理的多信道信号包括通过根据所述第二增益因子的所述更新值相对于所述第一信道在所述第二频率子带中的振幅更改所述第二信道在所述第二频率子带中的振幅来产生所述经处理的多信道信号。
3.根据权利要求1及2中任一权利要求所述的处理多信道信号的方法,其中所述方法包含基于来自所述多个所计算相位差的信息来计算一致性度量的值,所述一致性度量指示至少所述多个不同频率分量的到达方向间的一致性程度;且其中所述计算增益因子的更新值是基于所述一致性度量的所述所计算值。
4.根据权利要求3所述的处理多信道信号的方法,其中响应于将所述一致性度量的所述值与阈值进行比较的结果而执行所述相对于所述第二信道的对应振幅更改所述第一信道的振幅。
5.根据权利要求1到4中任一权利要求所述的处理多信道信号的方法,其中所述方法包括基于所述多信道信号的估计音调频率来选择所述多个不同频率分量。
6.根据权利要求1到5中任一权利要求所述的处理多信道信号的方法,其中增益因子的所述更新值是基于所述第一信道的所述所计算电平与所述第二信道的所述所计算电平之间的比率。
7.根据权利要求1到6中任一权利要求所述的处理多信道信号的方法,其中所述通过根据所述更新值相对于所述第一信道的对应振幅更改所述第二信道的振幅来产生经处理的多信道信号包含减少所述第一信道的所述所计算电平与所述第二信道的所述所计算电平之间的不平衡。
8.根据权利要求1到7中任一权利要求所述的处理多信道信号的方法,其中所述产生经处理的多信道信号包括根据所述更新值在所述多信道信号的多个连续区段中的每一者中相对于所述第一信道的对应振幅更改所述第二信道的振幅。
9.根据权利要求1到8中任一权利要求所述的处理多信道信号的方法,其中所述方法包含基于所述经处理的多信道信号的第一信道的电平与所述经处理的多信道信号的第二信道的电平之间的关系来指示话音活动的存在。
10.根据权利要求3及4中任一权利要求所述的处理多信道信号的方法,其中所述方法包含基于所述经处理的多信道信号的第一信道的电平与所述经处理的多信道信号的第二信道的电平之间的关系,且响应于将所述一致性度量的所述值与阈值进行比较的结果,根据来自所述多信道信号的所述第一及第二信道中的至少一者的声学信息来更新噪声估计。
11.一种计算机可读媒体,其包含在由处理器读取时致使所述处理器执行根据权利要求1到10中任一权利要求所述的方法的有形特征。
12.一种用于处理多信道信号的设备,所述设备包含第一计算器,其经配置以通过针对所述多信道信号的多个不同频率分量中的每一者计算所述频率分量在所述多信道信号的第一信道中的相位与所述频率分量在所述多信道信号的第二信道中的相位之间的差,来获得多个所计算相位差;第二计算器,其经配置以计算所述第一信道的电平及所述第二信道的对应电平;第三计算器,其经配置以基于所述第一信道的所述所计算电平、所述第二信道的所述所计算电平,及所述多个所计算相位差中的至少一者,来计算增益因子的更新值;及增益控制元件,其经配置以通过根据所述更新值相对于所述第一信道的对应振幅更改所述第二信道的振幅来产生经处理的多信道信号。
13.根据权利要求12所述的设备,其中所述第一信道的所述所计算电平为所述第一信道在第一频率子带中的所计算能量,且其中所述第二信道的所述所计算电平为所述第二信道在所述第一频率子带中的所计算能量,且其中所述第一信道的所述振幅为所述第一信道在所述第一频率子带中的振幅,且其中所述第二信道的所述对应振幅为所述第二信道在所述第一频率子带中的振幅,且其中所述第二计算器经配置以计算所述第一信道在第二频率子带中的能量,所述第二频率子带不同于所述第一频率子带;且计算所述第二信道在所述第二频率子带中的能量,且其中所述第三计算器经配置以基于所述第一信道在所述第二频率子带中的所述所计算能量、所述第二信道在所述第二频率子带中的所述所计算能量及所述多个所计算相位差中的至少一者来计算第二增益因子的更新值;其中所述增益控制元件经配置以通过根据所述第二增益因子的所述更新值相对于所述第一信道在所述第二频率子带中的振幅更改所述第二信道在所述第二频率子带中的振幅来产生所述经处理的多信道信号。
14.根据权利要求12及13中任一权利要求所述的设备,其中所述第三计算器经配置以基于来自所述多个所计算相位差的信息来计算一致性度量的值,所述一致性度量指示至少所述多个不同频率分量的到达方向间的一致性程度;且其中所述第三计算器经配置以基于所述一致性度量的所述所计算值来计算增益因子的所述更新值。
15.根据权利要求14所述的设备,其中所述第三计算器经配置以将所述一致性度量的所述值与阈值进行比较;且其中所述增益控制元件经配置以响应于所述将所述一致性度量的所述值与阈值进行比较的结果来相对于所述第二信道的对应振幅更改所述第一信道的振幅。
16.根据权利要求12到15中任一权利要求所述的设备,其中所述相位差计算器经配置以基于所述多信道信号的估计音调频率来选择所述多个不同频率分量。
17.根据权利要求12到16中任一权利要求所述的设备,其中增益因子的所述更新值是基于所述第一信道的所述所计算电平与所述第二信道的所述所计算电平之间的比率。
18.根据权利要求12到17中任一权利要求所述的设备,其中所述增益控制元件经配置以通过根据所述更新值相对于所述第一信道的对应振幅更改所述第二信道的振幅来减少所述第一信道的所述所计算电平与所述第二信道的所述所计算电平之间的不平衡。
19.根据权利要求12到18中任一权利要求所述的设备,其中所述增益控制元件经配置以通过根据所述更新值在所述多信道信号的多个连续区段中的每一者中相对于所述第一信道的对应振幅更改所述第二信道的振幅来产生所述经处理的多信道信号。
20.根据权利要求12到19中任一权利要求所述的设备,其中所述设备包括话音活动检测器,所述话音活动检测器经配置以基于所述经处理的多信道信号的第一信道的电平与所述经处理的多信道信号的第二信道的电平之间的关系来指示话音活动的存在。
21.根据权利要求14及15中任一权利要求所述的设备,其中所述方法包含基于所述经处理的多信道信号的第一信道的电平与所述经处理的多信道信号的第二信道的电平之间的关系,且响应于将所述一致性度量的所述值与阈值进行比较的结果,根据来自所述多信道信号的所述第一及第二信道中的至少一者的声学信息来更新噪声估计。
22.一种用于处理多信道信号的设备,所述设备包含用于针对所述多信道信号的多个不同频率分量中的每一者来计算所述频率分量在所述多信道信号的第一信道中的相位与所述频率分量在所述多信道信号的第二信道中的相位之间的差以获得多个所计算相位差的装置;用于计算所述第一信道的电平及所述第二信道的对应电平的装置;用于基于所述第一信道的所述所计算电平、所述第二信道的所述所计算电平及所述多个所计算相位差中的至少一者来计算增益因子的更新值的装置;及用于通过根据所述更新值相对于所述第一信道的对应振幅更改所述第二信道的振幅来产生经处理的多信道信号的装置。
23.根据权利要求22所述的设备,其中所述第一信道的所述所计算电平为所述第一信道在第一频率子带中的所计算能量,且其中所述第二信道的所述所计算电平为所述第二信道在所述第一频率子带中的所计算能量,且其中所述第一信道的所述振幅为所述第一信道在所述第一频率子带中的振幅,且其中所述第二信道的所述对应振幅为所述第二信道在所述第一频率子带中的振幅,且其中所述设备包含用于计算所述第一信道在第二频率子带中的能量的装置,所述第二频率子带不同于所述第一频率子带;用于计算所述第二信道在所述第二频率子带中的能量的装置;及用于基于所述第一信道在所述第二频率子带中的所述所计算能量、所述第二信道在所述第二频率子带中的所述所计算能量及所述多个所计算相位差中的至少一者来计算第二增益因子的更新值的装置;其中所述用于产生经处理的多信道信号的装置包括用于通过根据所述第二增益因子的所述更新值相对于所述第一信道在所述第二频率子带中的振幅更改所述第二信道在所述第二频率子带中的振幅来产生所述经处理的多信道信号的装置。
24.根据权利要求22及23中任一权利要求所述的设备,其中所述设备包含用于基于来自所述多个所计算相位差的信息来计算一致性度量的值的装置,所述一致性度量指示至少所述多个不同频率分量的到达方向间的一致性程度;且其中所述用于计算增益因子的更新值的装置经配置以基于所述一致性度量的所述所计算值来计算所述增益因子的所述更新值。
25.根据权利要求M所述的设备,其中所述用于相对于所述第二信道的对应振幅更改所述第一信道的振幅的装置经配置以响应于所述用于将所述一致性度量的所述值与阈值进行比较的装置的输出来执行此更改。
26.根据权利要求22到25中任一权利要求所述的设备,其中所述设备包括用于基于所述多信道信号的估计音调频率来选择所述多个不同频率分量的装置。
27.根据权利要求22到沈中任一权利要求所述的设备,其中增益因子的所述更新值是基于所述第一信道的所述所计算电平与所述第二信道的所述所计算电平之间的比率。
28.根据权利要求22到27中任一权利要求所述的设备,其中所述用于通过根据所述更新值相对于所述第一信道的对应振幅更改所述第二信道的振幅以产生经处理的多信道信号的装置经配置以减少所述第一信道的所述所计算电平与所述第二信道的所述所计算电平之间的不平衡。
29.根据权利要求22到观中任一权利要求所述的设备,其中所述用于产生经处理的多信道信号的装置包括用于根据所述更新值在所述多信道信号的多个连续区段中的每一者中相对于所述第一信道的对应振幅更改所述第二信道的振幅的装置。
30.根据权利要求22到四中任一权利要求所述的设备,其中所述设备包含用于基于所述经处理的多信道信号的第一信道的电平与所述经处理的多信道信号的第二信道的电平之间的关系来指示话音活动的存在的装置。
31.根据权利要求对及25中任一权利要求所述的设备,其中所述设备包含用于基于所述经处理的多信道信号的第一信道的电平与所述经处理的多信道信号的第二信道的电平之间的关系且响应于将所述一致性度量的所述值与阈值进行比较的结果根据来自所述多信道信号的所述第一及第二信道中的至少一者的声学信息来更新噪声估计的装置。
全文摘要
本发明揭示对多信道信号进行基于相位的处理及包括接近性检测的应用。
文档编号H04R3/00GK102461203SQ201080025957
公开日2012年5月16日 申请日期2010年6月9日 优先权日2009年6月9日
发明者埃里克·维塞, 尔南·刘 申请人:高通股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1