基于盲源分离的空间滤波的制作方法

文档序号：7990090阅读：232来源：国知局

基于盲源分离的空间滤波的制作方法
【专利摘要】一种用于电子装置上的基于盲源分离的空间滤波的方法包含获得第一源音频信号和第二源音频信号。所述方法还包含将盲源分离滤波器集合应用于所述第一源音频信号和所述第二源音频信号以产生经空间滤波第一音频信号和经空间滤波第二音频信号。所述方法进一步包含经由第一扬声器播放经空间滤波第一音频信号以产生声学经空间滤波第一音频信号，且经由第二扬声器播放经空间滤波第二音频信号以产生声学经空间滤波第二音频信号。声学经空间滤波第一音频信号和声学经空间滤波第二音频信号在第一位置处产生经隔离声学第一源音频信号且在第二位置处产生经隔离声学第二源音频信号。
【专利说明】基于盲源分离的空间滤波
[0001]相关_请案
[0002]本申请案涉及且主张2011年5月16日申请的“基于盲源分离的空间滤波(BLINDSOURCE SEPARATION BASED SPATIAL FILTERING) ”的第 61 / 486，717 号美国临时专利申请案的优先权。
【技术领域】
[0003]本发明大体上涉及音频系统。更具体来说，本发明涉及基于盲源分离的空间滤波。【背景技术】
[0004]在最近的几十年中，电子器件的使用已变得普遍。具体来说，电子技术的进步已减少了越来越复杂且有用的电子装置的成本。成本減少和消费者需求已促进了电子装置的使用，使得电子装置在现代社会中实际上普遍存在。由于电子装置的使用已扩展，因此针对电子器件的新型和改进特征的需求也扩展。更具体来说，经常寻求执行新功能或更快、更有效或以更高质量执行功能的电子装置。
[0005]一些电子装置使用音频信号来工作。举例来说，一些电子装置使用麦克风俘获声学音频信号和/或使用扬声器输出声学音频信号。电子装置的一些实例包含电视机、音频放大器、光学媒体播放器、计算机、智能电话、平板装置等等。
[0006]当电子装置用扬声器输出声学音频信号时，用户可用双耳听到声学音频信号。当使用两个或两个以上扬声器来输出音频信号时，用户可在双耳中听到多个音频信号的混合。音频信号混合且由用户感知的方式可进ー步取决于收听环境的声学性质和/或用户特征。这些影响中的ー些可能以不合意方式使声学音频信号失真和/或降级。如从此论述可观察到，有助于隔离声学音频信号的系统和方法可为有益的。

【发明内容】

[0007]掲示ー种用于电子装置上的基于盲源分离的空间滤波的方法。所述方法包含获得第一源音频信号和第二源音频信号。所述方法还包含将盲源分离滤波器集合应用于所述第一源音频信号和所述第二源音频信号以产生经空间滤波第一音频信号和经空间滤波第二音频信号。所述方法进ー步包含经由第一扬声器播放所述经空间滤波第一音频信号以产生声学经空间滤波第一音频信号。所述方法另外包含经由第二扬声器播放所述经空间滤波第ニ音频信号以产生声学经空间滤波第二音频信号。声学经空间滤波第一音频信号和声学经空间滤波第二音频信号在第一位置处产生经隔离声学第一源音频信号且在第二位置处产生经隔离声学第二源音频信号。所述盲源分离可为独立向量分析(IVA)、独立分量分析(ICA)或多重自适应解相关算法。所述第一位置可对应于用户的ー个耳朵且所述第二位置对应于所述用户的另ー个耳朵。
[0008]所述方法还可包含训练所述盲源分离滤波器集合。训练盲源分离滤波器集合可包含在所述第一位置的第一麦克风处接收第一经混合源音频信号且在所述第二位置的第二麦克风处接收第二经混合源音频信号。训练盲源分离滤波器集合还可包含使用盲源分离将所述第一经混合源音频信号和所述第二经混合源音频信号分离为近似第一源音频信号和近似第二源音频信号。训练盲源分离滤波器集合可另外包含针对与所述第一位置和所述第二位置相关联的位置将在所述盲源分离期间使用的传递函数存储为所述盲源分离滤波器
隹A
ロ O
[0009]所述方法还可包含训练多个盲源分离滤波器集合，每ー滤波器集合对应于相异位置。所述方法可进ー步包含基于用户位置数据确定将使用哪ー盲源分离滤波器集合。
[0010]所述方法还可包含通过当用户的当前位置处于与所述多个盲源分离滤波器集合相关联的所述相异位置之间时在所述多个盲源分离滤波器集合之间进行内插，来确定经内插盲源分离滤波器集合。所述第一麦克风和所述第二麦克风可包含在头部与躯干模拟器(HATS)中以在训练期间对用户的耳朵进行模型化。
[0011]所述训练可使用多对麦克风和多对扬声器执行。所述训练可针对多个用户执行。
[0012]所述方法还可包含将所述盲源分离滤波器集合应用于所述第一源音频信号和所述第二源音频信号以产生多对经空间滤波音频信号。所述方法可进ー步包含经由多对扬声器播放所述多对经空间滤波音频信号以在所述第一位置处产生所述经隔离声学第一源音频信号且在所述第二位置处产生所述经隔离声学第二源音频信号。
[0013]所述方法还可包含将所述盲源分离滤波器集合应用于所述第一源音频信号和所述第二源音频信号以产生多个经空间滤波音频信号。所述方法可进ー步包含经由扬声器阵列播放所述多个经空间滤波音频信号以在针对多个用户的多个位置对处产生多个经隔离声学第一源音频信号和多个经隔离声学第二源音频信号。
[0014]还掲示ー种经配置以用于基于盲源分离的空间滤波的电子装置。所述电子装置包含处理器和存储在与所述处理器电子通信的存储器中的指令。所述电子装置获得第一源音频信号和第二源音频信号。所述电子装置还将盲源分离滤波器集合应用于所述第一源音频信号和所述第二源音频信号以产生经空间滤波第一音频信号和经空间滤波第二音频信号。所述电子装置进ー步经由第一扬声器播放所述经空间滤波第一音频信号以产生声学经空间滤波第一音频信号。所述电子装置另外经由第二扬声器播放所述经空间滤波第二音频信号以产生声学经空间滤波第二音频信号。声学经空间滤波第一音频信号和声学经空间滤波第二音频信号在第一位置处产生经隔离声学第一源音频信号且在第二位置处产生经隔离声学第二源音频信号。
[0015]还掲示一种用于基于盲源分离的空间滤波的计算机程序产品。所述计算机程序产品包含具有指令的非暂时性有形计算机可读媒体。所述指令包含用于致使电子装置获得第一源音频信号和第二源音频信号的代码。所述指令还包含用于致使所述电子装置将盲源分离滤波器集合应用于所述第一源音频信号和所述第二源音频信号以产生经空间滤波第一音频信号和经空间滤波第二音频信号的代码。所述指令进ー步包含用于致使所述电子装置经由第一扬声器播放所述经空间滤波第一音频信号以产生声学经空间滤波第一音频信号的代码。所述指令另外包含用于致使所述电子装置经由第二扬声器播放所述经空间滤波第ニ音频信号以产生声学经空间滤波第二音频信号的代码。声学经空间滤波第一音频信号和声学经空间滤波第二音频信号在第一位置处产生经隔离声学第一源音频信号且在第二位置处产生经隔离声学第二源音频信号。[0016]还掲示一种用于基于盲源分离的空间滤波的设备。所述设备包含用于获得第一源音频信号和第二源音频信号的装置。所述设备还包含用于将盲源分离滤波器集合应用于所述第一源音频信号和所述第二源音频信号以产生经空间滤波第一音频信号和经空间滤波第二音频信号的装置。所述设备进ー步包含用于经由第一扬声器播放所述经空间滤波第一音频信号以产生声学经空间滤波第一音频信号的装置。所述设备另外包含用于经由第二扬声器播放所述经空间滤波第二音频信号以产生声学经空间滤波第二音频信号的装置。声学经空间滤波第一音频信号和声学经空间滤波第二音频信号在第一位置处产生经隔离声学第一源音频信号且在第二位置处产生经隔离声学第二源音频信号。
【专利附图】

【附图说明】
[0017]图1是说明用于盲源分离(BSS)滤波器训练的电子装置的ー个配置的框图；
[0018]图2是说明用于基于盲源分离(BSS)的空间滤波的电子装置的ー个配置的框图；
[0019]图3是说明用于盲源分离(BSS)滤波器训练的方法的ー个配置的流程图；
[0020]图4是说明用于基于盲源分离(BSS)的空间滤波的方法的ー个配置的流程图；
[0021]图5是说明盲源分离(BSS)滤波器训练的ー个配置的图；
[0022]图6是说明基于盲源分离(BSS)的空间滤波的ー个配置的图；
[0023]图7是说明根据本文掲示的系统和方法的训练和运行时间的ー个配置的框图；
[0024]图8是说明用于多个位置的基于盲源分离(BSS)的滤波的电子装置的ー个配置的框图；
[0025]图9是说明用于多个用户或头部与躯干模拟器(HATS)的基于盲源分离(BSS)的滤波的电子装置的ー个配置的框图；以及
[0026]图10说明可在电子装置中利用的各种组件。
【具体实施方式】
[0027]除非通过上下文明确限制，否则本文使用术语“信号”来指示其任何普通意义，包含在电线、总线或其它传输媒体上表达的存储器位置(或存储器位置集合)的状态。除非通过上下文明确限制，否则本文使用术语“产生”来指示其任何普通意义，例如计算或以其它方式制作。除非通过上下文明确限制，否则本文使用术语“计算”来指示其任何普通意义，例如计算、评估、估计和/或从多个值进行选择。除非通过上下文明确限制，否则本文使用术语“获得”来指示其任何普通意义，例如计算、导出、接收(例如，从外部装置)和/或检索(例如，从存储元件阵列)。当在本描述和权利要求书中使用术语“包括”的情况下，其并不排除其它元件或操作。术语“基干”(如“ A基于B”中)用以指示其任何普通意义，包含以下情况:(i) “至少基干”(例如，“A至少基于B”)，且在特定上下文中适当的情况下，
(ii)“等于”(例如，“A等于B”)。类似地，术语“响应于”用以指示其任何普通意义，包含“至少响应干”。
[0028]除非另外指示，否则具有特定特征的设备的操作的任何掲示也明确地既定掲示具有类似特征的方法(且反之亦然)，且根据特定配置的设备的操作的任何掲示也明确地既定掲示根据类似配置的方法(且反之亦然)。术语“配置”可參考如其特定上下文所指示的方法、设备或系统来使用。术语“方法”、“过程”、“程序”和“技木” 一般地且可互換地使用，除非特定上下文另外指示。术语“设备”和“装置”也一般地且可互換地使用，除非特定上下文另外指示。术语“元件”和“模块”通常用以指示较大配置的一部分。通过參考某一文献的一部分的任何并入均应理解为在其中此些定义出现在所述文献中的其它地方将所述部分内參考的术语或变量的定义并入，以及将所并入部分中參考的任何图式并入。
[0029]双耳立体声声像可为用户给出宽声场的印象，且进一歩使用户沉浸于收听体验中。此立体声像可通过佩戴头戴式耳机来实现。然而，这对于延长的会话可能不舒适，且对于ー些应用是不实际的。为了在扬声器阵列前方在用户的耳朵处实现双耳立体声像，可计算基于头部相关传递函数(HRTF)的逆滤波器，其中可随着用户看视方向而变基于HRTF从数据库选择声学混合矩阵。此混合矩阵可经离线求逆，且在线地将所得矩阵应用于左声像和右声像。这也可称为串扰消除。
[0030]传统的基于HRTF的方法可具有一些缺点。举例来说，HRTF反转是基于模型的方法，其中传递函数可在实验室中获取(例如，在具有标准化扩音器的消声室中)。然而，人和收听环境具有唯一的属性和非理想性(例如，人具有不同形状的面部、头部、耳朵等等)。所有这些情况均影响经由空气的行进特性(例如，传递函数)。因此，HRTF方法可能并不很好地对实际环境进行模型化。举例来说，收听环境的特定器具和分解可能不会由HRTF准确地模型化。
[0031]本发明的系统和方法可用以通过学习应用于混合数据的盲源分离(BSS)滤波器来计算空间滤波器。举例来说，本文掲示的系统和方法可提供使用BSS设计空间滤波器的基于扬声器阵列的双耳成像。解混BSS解决方案将头部与躯干模拟器(HATS)或用户耳朵记录的输入解相关为在统计上独立的输出，且隐式地反转声学情境。HATS可为具有经定位以模拟用户耳朵位置的两个麦克风的人体模型。使用此方法，可避免固有的串扰消除问题，例如头部相关传递函数(HRTF)失配(非个别化HRFT)、扩音器和/或房间传递函数带来的额外失真。此外，通过在训练期间允许麦克风位置(对应于用户、HATS等等)在标称位置周围稍微移动而扩大收听“最佳听音点(sweet spot)”。
[0032]在使用两个独立语音源计算BSS滤波器的实例中，展示了 HRTF和BSS空间滤波器展现出类似的空波束模式，且由本发明的系统和方法解决的串扰消除问题可阐释为向ー个耳朵产生每ー立体声源的空波束。
[0033]现在參见附图描述各种配置，其中相同參考数字可指示功能上类似的元件。在此处附图中大体上描述和说明的系统和方法可以广泛多种不同配置来布置和设计。因此，如附图中表示的若干配置的以下较详细描述既定不限制所主张的范围，而是仅代表系统和方法。
[0034]图1是说明用于盲源分离(BSS)滤波器训练的电子装置102的ー个配置的框图。具体来说，图1说明对盲源分离(BSS)滤波器集合130进行训练的电子装置102。应注意，结合图1描述的电子装置102的功能性可在单个电子装置中实施，或可在多个单独电子装置中实施。电子装置的实例包含蜂窝式电话、智能电话、计算机、平板装置、电视机、音频放大器、音频接收器等等。扬声器AlOSa和扬声器BlOSb可分别接收第一源音频信号104和第二源音频信号106。扬声器AlOSa和扬声器BlOSb的实例包含扩音器。在ー些配置中，扬声器108a-b可耦合到电子装置102。第一源音频信号104和第二源音频信号106可从便携式音乐装置、无线通信装置、个人计算机、电视机、音频/视觉接收器、电子装置102或任一其它合适装置(未图示)接收。
[0035]第一源音频信号104和第二源音频信号106可呈与扬声器108a-b兼容的任一合适格式。举例来说，第一源音频信号104和第二源音频信号106可为电子信号、光学信号、射频(RF)信号等等。第一源音频信号104和第二源音频信号106可为不相等的任何两个音频信号。举例来说，第一源音频信号104和第二源音频信号106可在统计上彼此独立。扬声器108a-b可定位于相对于位置118的任何不相等位置处。
[0036]在滤波器产生(本文称为训练)期间，麦克风116a_b可放置于位置118中。举例来说，麦克风Al 16a可放置于位置Al 14a中，且麦克风BI 16b可放置于位置BI 14b中。在一个配置中，位置A114a可对应于用户的右耳，且位置B114b可对应于用户的左耳。举例来说，用户(或按照用户来模型化的虚拟者)可佩带麦克风A116a和麦克风B116b。举例来说，麦克风116a_b可在由位置118处的用户佩戴的头戴式耳机上。或者，麦克风A116a和麦克风B116b可驻留在电子装置102上(其中电子装置102放置于例如位置118中)。电子装置102的实例包含头戴式耳机、个人计算机、头部与躯干模拟器(HATS)等等。
[0037]扬声器A108a可将第一源音频信号104转换为声学第一源音频信号110。扬声器B108b可将电子第二源音频信号106转换为声学第二源音频信号112。举例来说,扬声器108a-b可分别播放第一源音频信号104和第二源音频信号106。
[0038]在扬声器108a_b播放相应源音频信号104、106时，在麦克风116a_b处接收声学第一源音频信号110和声学第二源音频信号112。声学第一源音频信号110和声学第二源音频信号112在空中从扬声器108a_b发射到麦克风116a_b时可混合。举例来说，经混合源音频信号A120a可包含来自第一源音频信号104的兀素和来自第二源音频信号106的兀素。另外，经混合源音频信号B120b可包含来自第二源音频信号106的元素和来自第一源音频信号104的兀素。
[0039]经混合源音频信号A120a和经混合源音频信号B120b可提供到包含于电子装置102中的盲源分离(BSS)块/模块122。从经混合源音频信号120a-b，盲源分离(BSS)块/模块122可近似地将第一源音频信号104的元素和第二源音频信号106的元素分离为单独信号。举例来说，训练块/模块124可学习或产生传递函数126，以便产生近似第一源音频信号134和近似第二源音频信号136。换句话说，盲源分离块/模块122可对经混合源音频信号A120a和经混合源音频信号B120b进行解混以产生近似第一源音频信号134和近似第ニ源音频信号136。应注意，近似第一源音频信号134可接近地近似第一源音频信号104，而近似第二源音频信号136可接近地近似第二源音频信号106。
[0040]如本文使用，术语“块/模块”可用以指示特定元件可以硬件、软件或两者的组合来实施。举例来说，盲源分离(BSS)块/模块可以硬件、软件或两者的组合来实施。硬件的实例包含电子器件、集成电路、电路组件(例如，电阻器、电容器、电感器等等)、专用集成电路(ASIC)、晶体管、锁存器、放大器、存储器単元、电子电路等等。
[0041]由训练块/模块124学习或产生的传递函数126可从扬声器108a-b与麦克风116a-b之间来近似逆传递函数。举例来说，传递函数126可表示解混滤波器。训练块/模块124可将传递函数126 (例如，对应于近似经反转混合矩阵的解混滤波器)提供到包含于盲源分离块/模块122中的滤波块/模块128。举例来说，训练块/模块124可将传递函数126从经混合源音频信号A120a和经混合源音频信号B120b分别提供到近似第一源音频信号134和近似第二源音频信号136，作为盲源分离(BSS)滤波器集合130。滤波块/模块128可存储盲源分离(BSS)滤波器集合130以用于对音频信号进行滤波。
[0042]在ー些配置中，盲源分离(BSS)块/模块122可产生传递函数126的多个集合和/或多个盲源分离(BSS)滤波器集合130。举例来说，传递函数126的集合和/或盲源分离(BSS)滤波器集合130可分别对应于多个位置118、多个用户等等。
[0043]应注意，盲源分离(BSS)块/模块122可将任ー合适形式的BSS用于本发明的系统和方法。举例来说，可使用包含独立向量分析(IVA)、独立分量分析(ICA)、多重自适应解相关算法等等的BSS。这包含合适的时域或频域算法。换句话说，盲源分离(BSS)块/模块122可使用能够基于源分量在统计上独立的性质来分离源分量的任何处理技木。
[0044]虽然图1中说明的配置是以两个扬声器108a-b来描述，但本发明的系统和方法在ー些配置中可利用两个以上扬声器。在具有两个以上扬声器的ー个配置中，盲源分离(BSS)滤波器集合130的训练可毎次使用两个扬声器。举例来说，训练可利用少于全部的可用扬声器。
[0045]在训练盲源分离(BSS)滤波器集合130之后，滤波块/模块128可在运行时间期间使用滤波器集合130来在音频信号在扬声器上播放之前预处理音频信号。这些经空间滤波的音频信号可在扬声器上播放之后在空中混合，从而导致位置Al 14a和位置BI 14b处的近似隔离的声学音频信号。经隔离声学音频信号可为来自一扬声器的声学音频信号，所述扬声器具有来自另ー扬声器的減少或消除的串扰。举例来说，位置118处的用户在位置Al 14a处在他/她的右耳处可近似听到经隔离声学音频信号(对应于第一音频信号)，而在位置B114b处在他/她的左耳处听到另ー经隔离声学音频信号(对应于第二音频信号)。位置Al 14a处和位置BI 14b处的经隔离声学音频信号可组成双耳立体声像。
[0046]在运行时间期间，盲源分离(BSS)滤波器集合130可用以抢先地对音频信号进行空间滤波以使在收听环境(例如，在位置A114a和位置B114b处)中将发生的混合偏移。此夕卜，盲源分离(BSS)块/模块122可训练多个盲源分离(BSS)滤波器集合130 (例如，每位置118—个)。在此配置中，盲源分离(BSS)块/模块122可使用用户位置数据132来确定最佳盲源分离(BSS)滤波器集合130和/或内插滤波器集合以在运行时间期间使用。用户位置数据132可为指示收听者(例如，用户)的位置的任何数据，且可使用ー个或ー个以上装置(例如，相机、麦克风、运动传感器等等)来收集。
[0047]在扬声器阵列前方在用户耳朵处实现双耳立体声像的一种传统方式可使用基于头部相关传递函数(HRTF)的逆滤波器。如本文使用，术语“双耳立体声像”指代左立体声通道到(例如，用户的)左耳以及右立体声通道到(例如，用户的)右耳的投影。具体来说，基于随着用户看视方向而变从数据库选择的HRTF，可离线地反转声学混合矩阵。随后可将所得矩阵在线地应用于左声像和右声像。此过程也可称为串扰消除。
[0048]然而，基于HRTF的逆滤波可存在问题。举例来说，这些HRTF中的ー些可能是不稳定的。当不稳定HRTF的逆经确定时，整个滤波器可为不稳定的。为了补偿此情况，可使用各种技术来制作稳定的可逆滤波器。然而，这些技术可能在计算上密集且不可靠。相比之下，本发明的系统和方法可不明确地需要反转传递函数矩阵。而是，盲源分离(BSS)块/模块122学习不同滤波器，因此其输出之间的交叉相关减少或最小化(例如，因此输出之间的互信息，例如近似第一源音频信号134和近似第二源音频信号136，得以最小化)。随后可存储ー个或ー个以上盲源分离(BSS)滤波器集合130且在运行时间期间应用于源音频。
[0049]此外，HRTF反转是基于模型的方法，其中传递函数是在实验室中获取(例如，在具有标准化扩音器的消声室中)。然而，人和收听环境具有唯一的属性和非理想性(例如，人具有不同形状的面部、头部、耳朵等等)。所有这些情况均影响经由空气的行进特性(例如，传递函数)。因此，HRTF可能并不很好地对实际环境进行模型化。举例来说，收听环境的特定器具和分解可能不会由HRTF准确地模型化。相比之下，本发明的BSS方法是数据驱动的。举例来说，可在实际运行时间环境中测量经混合源音频信号A120a和经混合源音频信号B120b。所述混合包含针对特定环境的实际传递函数(例如，其针对定收听环境而改善或优化)。另外，HRTF方法可产生紧密的最佳听音点，而BSS滤波器训练方法可通过加宽波束而考虑到一些移动，因此得到用于收听的较宽最佳听音点。
[0050]图2是说明用于基于盲源分离(BSS)的空间滤波的电子装置202的ー个配置的框图。具体来说，图2说明可在运行时间期间使用ー个或ー个以上先前训练的盲源分离(BSS)滤波器集合230的电子装置202。换句话说，图2说明应用盲源分离(BSS)滤波器集合230的重放配置。应注意，结合图2描述的电子装置202的功能性可在单个电子装置中实施，或可在多个单独电子装置中实施。电子装置的实例包含蜂窝式电话、智能电话、计算机、平板装置、电视机、音频放大器、音频接收器等等。电子装置202可耦合到扬声器A208a和扬声器B208b。扬声器A108a和扬声器B108b的实例包含扩音器。电子装置202可包含盲源分离(BSS)块/模块222。盲源分离(BSS)块/模块222可包含训练块/模块224、滤波块/模块228和/或用户位置数据232。
[0051]电子装置202可获得第一源音频信号238和第二源音频信号240。举例来说，电子装置202可从内部存储器、从附接的装置(例如，便携式音频播放器)、从光学媒体播放器(例如，压缩光盘(CD)播放器、数字视频光盘(DVD)播放器、蓝光播放器等等)、从网络(例如，局域网(LAN)、因特网等等)、从到另一装置的无线链路等等获得第一源音频信号238和/或第二源音频信号240。
[0052]应注意，图2中说明的第一源音频信号238和第二源音频信号240可来自与图1中说明的第一源音频信号104和第二源音频信号106的源不同或相同的源。举例来说，图2中的第一源音频信号238可来自与图1中的第一源音频信号104的源相同或不同的源(且类似地对于第二源音频信号240)。举例来说，第一源音频信号238和第二源音频信号240 (例如，ー些原始双耳音频记录)可输入到盲源分离(BSS)块/模块222。
[0053]盲源分离(BSS)块/模块222中的滤波块/模块228可使用适当的盲源分离(BSS)滤波器集合230来预处理第一源音频信号238和第二源音频信号240 (在例如扬声器A208a和扬声器B208b上播放之前)。举例来说，滤波块/模块228可将盲源分离(BSS)滤波器集合230应用于第一源音频信号238和第二源音频信号240以产生经空间滤波音频信号A234a和经空间滤波音频信号B234b。在ー个配置中，滤波块/模块228可使用根据由训练块/模块224学习或产生的传递函数226先前确定的盲源分离(BSS)滤波器集合230来产生分别在扬声器A208a和扬声器B208b上播放的经空间滤波音频信号A234a和经空间滤波音频信号B234b。
[0054]在其中根据多个传递函数集合226获得多个盲源分离(BSS)滤波器集合230的配置中，滤波块/模块228可使用用户位置数据232来确定将哪ー盲源分离(BSS)滤波器集合230应用于第一源音频信号238和第二源音频信号240。
[0055]经空间滤波音频信号A234a可随后经由扬声器A208a播放，且经空间滤波音频信号B234b可随后经由扬声器B208播放。举例来说，经空间滤波音频信号234a_b可由扬声器A208a和扬声器B208b分别转换(从电子信号、光学信号、RF信号等等)为声学经空间滤波音频信号236a-b。换句话说，经空间滤波音频信号A234a可由扬声器A208a转换为声学经空间滤波音频信号A236a，且经空间滤波音频信号B234b可由扬声器B208b转换为声学经空间滤波音频信号B236b。
[0056]由于滤波(由滤波块/模块228使用盲源分离(BSS)滤波器集合230执行)对应于从扬声器208a-b到位置A214a和位置B214b的声学混合的近似逆，因此从第一和第二源音频信号238、240到位置A214a和位置B214b (例如，到用户的耳朵)的传递函数可表达为单位矩阵。举例来说,在包含位置A214a和位置B214b的位置218处的用户可在一个耳朵处听到第一源音频信号238的良好近似，且在另一个耳朵处听到第二源音频信号240的良好近似。举例来说，通过从扬声器A208a播放声学经空间滤波音频信号A236a且在扬声器B208b处播放声学经空间滤波音频信号B236b，经隔离声学第一源音频信号284可在位置A214a处发生且经隔离声学第二源音频信号286可在位置B214b处发生。这些经隔离声学信号284、286可在位置218处产生双耳立体声像。
[0057]换句话说，盲源分离(BSS)训练可产生盲源分离(BSS)滤波器集合230 (例如，空间滤波器集合)作为可对应于声学混合的逆的副产物。这些盲源分离(BSS)滤波器集合230可随后用于串扰消除。在ー个配置中，本发明的系统和方法可提供串扰消除和房间逆滤波，此两者可基于盲源分离(BSS)针对特定用户和声学空间来训练。
[0058]图3是说明用于盲源分离(BSS)滤波器训练的方法300的ー个配置的流程图。方法300可由电子装置102执行。举例来说，电子装置102可训练或产生ー个或ー个以上传递函数126 (以获得ー个或ー个以上盲源分离(BSS)滤波器集合130)。
[0059]在训练期间，电子装置102可接收302来自麦克风A116a的经混合源音频信号八120&和来自麦克风8116ゎ的经混合源音频信号B120b。麦克风Al 16a和/或麦克风BI 16b可包含在电子装置102中或在电子装置102的外部。举例来说，电子装置102可为包含放置于耳朵上的麦克风116a_b的头戴式耳机。或者，电子装置102可从外部麦克风116a_b接收经混合源音频信号A120a和经混合源音频信号B120b。在ー些配置中，例如，麦克风116a_b可位于头部与躯干模拟器(HATS)中以对用户耳朵进行模型化，或可位于由用户在训练期间佩戴的头戴式耳机上。
[0060]将经混合源音频信号120a_b描述为“经混合”，因为其对应的声学信号110、112在其在空中行进到麦克风116a_b时混合。举例来说，经混合源音频信号A120a可包含来自第一源音频信号104的元素和来自第二源音频信号106的元素。另外，经混合源音频信号B120b可包含来自第二源音频信号106的兀素和来自第一源音频信号104的兀素。
[0061]电子装置102可使用盲源分尚(BSS)(例如，独立向量分析(IVA)、独立分量分析(ICA)、多重自适应解相关算法等等)将经混合源音频信号A120a和经混合源音频信号B120b分离304为近似第一源音频信号134和近似第二源音频信号136。举例来说，电子装置102可训练或产生传递函数126，以便产生近似第一源音频信号134和近似第二源音频信号 136。[0062]电子装置102可针对与麦克风116a_b位置114a_b相关联的位置118将在盲源分离期间使用的传递函数126存储306为盲源分离(BSS)滤波器集合130。图3中说明的方法300 (例如，接收302经混合源音频信号120a-b，分离304经混合源音频信号120a_b，以及存储306盲源分离(BSS)滤波器集合130)可称为训练盲源分离(BSS)滤波器集合130。电子装置102可针对收听环境中的不同位置118和/或多个用户训练多个盲源分离(BSS)滤波器集合130。
[0063]图4是说明用于基于盲源分离(BSS)的空间滤波的方法400的ー个配置的流程图。电子装置202可获得402盲源分离(BSS)滤波器集合230。举例来说，电子装置202可执行上文在图3中描述的方法300。或者，电子装置202可从另ー电子装置接收盲源分离(BSS)滤波器集合230。
[0064]电子装置202可转变到运行时间或在运行时间工作。电子装置202可获得404第一源音频信号238和第二源音频信号240。举例来说，电子装置202可从内部存储器、从附接的装置(例如，便携式音频播放器)、从光学媒体播放器(例如，压缩光盘(CD)播放器、数字视频光盘(DVD)播放器、蓝光播放器等等)、从网络(例如，局域网(LAN)、因特网等等)、从到另一装置的无线链路等等获得404第一源音频信号238和/或第二源音频信号240。在ー些配置中，电子装置202可从在训练期间曾使用的相同源获得404第一源音频信号238和/或第二源音频信号240。在其它配置中，电子装置202可从在训练期间曾使用的其它源获得404第一源音频信号238和/或第二源音频信号240。
[0065]电子装置202可将盲源分离(BSS)滤波器集合230应用406于第一源音频信号238和第二源音频信号240以产生经空间滤波音频信号A234a和经空间滤波音频信号B234b。举例来说，电子装置202可使用包括在训练和/或运行时间环境中(例如，在位置A214a和位置B214b处)发生的混合和/或串扰的近似逆的传递函数226或盲源分离(BSS)滤波器集合230对第一源音频信号238和第二源音频信号240进行滤波。
[0066]电子装置202可经由第一扬声器208a播放408经空间滤波音频信号A234a以产生声学经空间滤波音频信号A236a。举例来说，电子装置202可将经空间滤波音频信号A234a提供到第一扬声器208a，所述第一扬声器可将其转换为声学信号(例如，声学经空间滤波音频信号A236a)。
[0067]电子装置202可经由第二扬声器208b播放410经空间滤波音频信号B234b以产生声学经空间滤波音频信号B236b。举例来说，电子装置202可将经空间滤波音频信号B234b提供到第二扬声器208b，所述第二扬声器可将其转换为声学信号(例如，声学经空间滤波音频信号B236b)。
[0068]经空间滤波音频信号A234a和经空间滤波音频信号B234b可在位置A214a产生经隔离声学第一源音频信号284且在位置B214b产生经隔离声学第二源音频信号286。由于滤波(由滤波块/模块228使用盲源分离(BSS)滤波器集合230执行)对应于从扬声器208a-b到位置A214a和位置B214b的声学混合的近似逆，因此从第一和第二源音频信号238、240到位置A214a和位置B214b (例如，到用户的耳朵)的传递函数可表达为单位矩阵。在包含位置A214a和位置B214b的位置218处的用户可在一个耳朵处听到第一源音频信号238的良好近似，且在另一个耳朵处听到第二源音频信号240的良好近似。根据本文掲示的系统和方法，盲源分离(BSS)滤波器集合230对从扬声器208a_b到位置218 (例如,位置A214a和位置B214b)的逆传递函数进行模型化，而不必显式地确定混合矩阵的逆。电子装置202可在扬声器208a-b上播放新源音频238、240之前继续获得404且空间滤波所述音频。在ー个配置中，电子装置202可不需要在毎次进入运行时间时重新训练BSS滤波器集合 230。
[0069]图5是说明盲源分离(BSS)滤波器训练的ー个配置的图。更具体来说，图5说明在训练期间本文掲示的系统和方法的ー个实例。第一源音频信号504可经由扬声器A508a播放，且第二源音频信号506可经由扬声器B508b播放。经混合源音频信号可在麦克风A516a处和麦克风B516b处接收。在图5中说明的配置中，麦克风516a-b由用户544佩戴或包含在头部与躯干模拟器(HATS) 544中。
[0070]说明的H变量可表示从扬声器508a_b到麦克风516a_b的传递函数。举例来说，Hn542a可表示从扬声器A508a到麦克风A516a的传递函数，H12542b可表示从扬声器A508a到麦克风B516b的传递函数，H21542c可表示从扬声器B508b到麦克风A516a的传递函数，且H22542d可表示从扬声器B508b到麦克风B516b的传递函数。因此，组合混合矩阵可由等式⑴中的H表示:
【权利要求】
1.ー种用于电子装置上的基于盲源分离的空间滤波的方法，其包括: 获得第一源音频信号和第二源音频信号；将盲源分离滤波器集合应用于所述第一源音频信号和所述第二源音频信号以产生经空间滤波第一音频信号和经空间滤波第二音频信号；经由第一扬声器播放所述经空间滤波第一音频信号以产生声学经空间滤波第一音频信号；以及经由第二扬声器播放所述经空间滤波第二音频信号以产生声学经空间滤波第二音频信号，其中所述声学经空间滤波第一音频信号和所述声学经空间滤波第二音频信号在第一位置处产生经隔离声学第一源音频信号且在第二位置处产生经隔离声学第二源音频信号。
2.根据权利要求1所述的方法，其进ー步包括训练所述盲源分离滤波器集合。
3.根据权利要求2所述的方法，其中训练所述盲源分离滤波器集合包括: 在所述第一位置的第一麦克风处接收第一经混合源音频信号且在所述第二位置的第二麦克风处接收第二经混合源音频信号；使用盲源分离将所述第一经混合源音频信号和所述第二经混合源音频信号分离为近似第一源音频信号和近似第二源音频信号；以及针对与所述第一位置和所述第二位置相关联的位置将在所述盲源分离期间使用的传递函数存储为所述盲源分离滤波器集合。
4.根据权利要求3所述的方法，其中所述盲源分离是独立向量分析IVA、独立分量分析ICA和多重自适应解相关算`法中的一者。
5.根据权利要求3所述的方法，其进ー步包括: 训练多个盲源分离滤波器集合，每ー滤波器集合对应于相异位置；以及基于用户位置数据确定将使用哪ー盲源分离滤波器集合。
6.根据权利要求5所述的方法，其进ー步包括通过当用户的当前位置处于与所述多个盲源分离滤波器集合相关联的所述相异位置之间时在所述多个盲源分离滤波器集合之间进行内插，来确定经内插盲源分离滤波器集合。
7.根据权利要求3所述的方法，其中所述第一麦克风和所述第二麦克风包含在头部与躯干模拟器HATS中以在训练期间对用户的耳朵进行模型化。
8.根据权利要求2所述的方法，其中所述训练是使用多对麦克风和多对扬声器执行的。
9.根据权利要求2所述的方法，其中所述训练是针对多个用户执行的。
10.根据权利要求1所述的方法，其中所述第一位置对应于用户的ー个耳朵且所述第二位置对应于所述用户的另ー个耳朵。
11.根据权利要求1所述的方法，其进ー步包括: 将所述盲源分离滤波器集合应用于所述第一源音频信号和所述第二源音频信号以产生多对经空间滤波音频信号；以及经由多对扬声器播放所述多对经空间滤波音频信号以在所述第一位置处产生所述经隔离声学第一源音频信号且在所述第二位置处产生所述经隔离声学第二源音频信号。
12.根据权利要求1所述的方法，其进ー步包括: 将所述盲源分离滤波器集合应用于所述第一源音频信号和所述第二源音频信号以产生多个经空间滤波音频信号；以及经由扬声器阵列播放所述多个经空间滤波音频信号以在针对多个用户的多个位置对处产生多个经隔离声学第一源音频信号和多个经隔离声学第二源音频信号。
13.—种经配置以用于基于盲源分离的空间滤波的电子装置，其包括: 处理器；存储器，其与所述处理器电子通信；存储在所述存储器中的指令，所述指令可执行以: 获得第一源音频信号和第二源音频信号；将盲源分离滤波器集合应用于所述第一源音频信号和所述第二源音频信号以产生经空间滤波第一音频信号和经空间滤波第二音频信号；经由第一扬声器播放所述经空间滤波第一音频信号以产生声学经空间滤波第一音频信号；以及经由第二扬声器播放所述经空间滤波第二音频信号以产生声学经空间滤波第二音频信号，其中所述声学经空间滤波第一音频信号和所述声学经空间滤波第二音频信号在第一位置处产生经隔离声学第一源音频信号且在第二位置处产生经隔离声学第二源音频信号。
14.根据权利要求13所述的电子装置，其中所述指令进ー步可执行以训练所述盲源分离滤波器集合。
15.根据权利要求14所述的电子装置，其中训练所述盲源分离滤波器集合包括: 在所述第一位置的第一麦克风处接收第一经混合源音频信号且在所述第二位置的第二麦克风处接收第二经混合源音频信号；使用盲源分离将所述第一经混合源音频信号和所述第二经混合源音频信号分离为近似第一源音频信号和近似第二源音频信号；以及针对与所述第一位置和所述第二位置相关联的位置将在所述盲源分离期间使用的传递函数存储为所述盲源分离滤波器集合。
16.根据权利要求15所述的电子装置，其中所述盲源分离是独立向量分析IVA、独立分量分析ICA和多重自适应解相关算法中的一者。
17.根据权利要求15所述的电子装置，其中所述指令进ー步可执行以: 训练多个盲源分离滤波器集合，每ー滤波器集合对应于相异位置；以及基于用户位置数据确定将使用哪ー盲源分离滤波器集合。
18.根据权利要求17所述的电子装置，其中所述指令进ー步可执行以通过当用户的当前位置处于与所述多个盲源分离滤波器集合相关联的所述相异位置之间时在所述多个盲源分离滤波器集合之间进行内插，来确定经内插盲源分离滤波器集合。
19.根据权利要求15所述的电子装置，其中所述第一麦克风和所述第二麦克风包含在头部与躯干模拟器HATS中以在训练期间对用户的耳朵进行模型化。
20.根据权利要求14所述的电子装置，其中所述训练是使用多对麦克风和多对扬声器执行的。
21.根据权利要求14所述的电子装置，其中所述训练是针对多个用户执行的。
22.根据权利要求13所述的电子装置，其中所述第一位置对应于用户的ー个耳朵且所述第二位置对应于所述用户的另ー个耳朵。
23.根据权利要求13所述的电子装置，其中所述指令进ー步可执行以: 将所述盲源分离滤波器集合应用于所述第一源音频信号和所述第二源音频信号以产生多对经空间滤波音频信号；以及经由多对扬声器播放所述多对经空间滤波音频信号以在所述第一位置处产生所述经隔离声学第一源音频信号且在所述第二位置处产生所述经隔离声学第二源音频信号。
24.根据权利要求13所述的电子装置，其中所述指令进ー步可执行以: 将所述盲源分离滤波器集合应用于所述第一源音频信号和所述第二源音频信号以产生多个经空间滤波音频信号；以及经由扬声器阵列播放所述多个经空间滤波音频信号以在针对多个用户的多个位置对处产生多个经隔离声学第一源音频信号和多个经隔离声学第二源音频信号。
25.一种用于基于盲源分离的空间滤波的计算机程序产品，其包括其上具有指令的非暂时性有形计算机可读媒体，所述指令包括: 用于致使电子装置获得第一源音频信号和第二源音频信号的代码；用于致使所述电子装置将盲源分离滤波器集合应用于所述第一源音频信号和所述第二源音频信号以产生经空间滤波第一音频信号和经空间滤波第二音频信号的代码；用于致使所述电子装置经由第一扬声器播放所述经空间滤波第一音频信号以产生声学经空间滤波第一音频信号的代码；以及用于致使所述电子装置经由第二扬声器播放所述经空间滤波第二音频信号以产生声学经空间滤波第二音频信号的代码，其中所述声学经空间滤波第一音频信号和所述声学经空间滤波第二音频信号在第一位置处产生经隔离声学第一源音频信号且在第二位置处产生经隔离声学第二源音频信号。
26.根据权利要求25所述的计算机程序产品，其中所述指令进ー步包括用于致使所述电子装置训练所述盲源分离滤波器集合的代码。
27.根据权利要求26所述的计算机程序产品，其中所述用于致使所述电子装置训练所述盲源分离滤波器集合的代码包括: 用于致使所述电子装置在所述第一位置的第一麦克风处接收第一经混合源音频信号且在所述第二位置的第二麦克风处接收第二经混合源音频信号的代码；用于致使所述电子装置使用盲源分离将所述第一经混合源音频信号和所述第二经混合源音频信号分离为近似第一源音频信号和近似第二源音频信号的代码；以及用于致使所述电子装置针对与所述第一位置和所述第二位置相关联的位置将在所述盲源分离期间使用的传递函数存储为所述盲源分离滤波器集合的代码。
28.根据权利要求27所述的计算机程序产品，其中所述指令进ー步包括: 用于致使所述电子装置训练多个盲源分离滤波器集合的代码，每ー滤波器集合对应于相异位置；以及用于致使所述电子装置基于用户位置数据确定将使用哪ー盲源分离滤波器集合的代码。
29.根据权利要求28所述的计算机程序产品，其中所述指令进ー步包括用于致使所述电子装置通过当用户的当前位置处于与所述多个盲源分离滤波器集合相关联的所述相异位置之间时在所述多个盲源分离滤波器集合之间进行内插来确定经内插盲源分离滤波器集合的代码。
30.根据权利要求25所述的计算机程序产品，其中所述第一位置对应于用户的ー个耳朵且所述第二位置对应于所述用户的另ー个耳朵。
31.一种用于基于盲源分离的空间滤波的设备，其包括: 用于获得第一源音频信号和第二源音频信号的装置；用于将盲源分离滤波器集合应用于所述第一源音频信号和所述第二源音频信号以产生经空间滤波第一音频信号和经空间滤波第二音频信号的装置；用于经由第一扬声器播放所述经空间滤波第一音频信号以产生声学经空间滤波第一音频信号的装置；以及用于经由第二扬声器播放所述经空间滤波第二音频信号以产生声学经空间滤波第二音频信号的装置，其中所述声学经空间滤波第一音频信号和所述声学经空间滤波第二音频信号在第一位置处产生经隔离声学第一源音频信号且在第二位置处产生经隔离声学第二源音频信号。
32.根据权利要求31所述的设备，其进ー步包括用于训练所述盲源分离滤波器集合的装置。
33.根据权利要求32所述的设备，其中所述用于训练所述盲源分离滤波器集合的装置包括: 用于在所述第一位置的第一麦克风处接收第一经混合源音频信号且在所述第二位置的第二麦克风处接收第二经混合源音频信号的装置；用于使用盲源分离将所述第`一经混合源音频信号和所述第二经混合源音频信号分离为近似第一源音频信号和近似第二源音频信号的装置；以及用于针对与所述第一位置和所述第二位置相关联的位置将在所述盲源分离期间使用的传递函数存储为所述盲源分离滤波器集合的装置。
34.根据权利要求33所述的设备，其进ー步包括: 用于训练多个盲源分离滤波器集合的装置，每ー滤波器集合对应于相异位置；以及用于基于用户位置数据确定将使用哪ー盲源分离滤波器集合的装置。
35.根据权利要求34所述的设备，其进ー步包括用于通过当用户的当前位置处于与所述多个盲源分离滤波器集合相关联的所述相异位置之间时在所述多个盲源分离滤波器集合之间进行内插来确定经内插盲源分离滤波器集合的装置。
36.根据权利要求31所述的设备，其中所述第一位置对应于用户的ー个耳朵且所述第二位置对应于所述用户的另ー个耳朵。
【文档编号】H04S7/00GK103563402SQ201280023454
【公开日】2014年2月5日申请日期:2012年5月1日优先权日:2011年5月16日
【发明者】埃里克·维瑟, 金莱轩, 向佩申请人:高通股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：埃里克·维瑟;金莱轩;向佩
技术所有人：高通股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。