信号源分离的制作方法

文档序号：9278247阅读：911来源：国知局

信号源分离的制作方法
【专利说明】信号源分离
[0001] 交叉参考相关申请
[0002] 本申请要求下列申请的权益：
[0003] ?于2013年2月13日提交的、标题为"SIGNALSOURCESEPARATION"的美国临时申请No. 61/764290 ;
[0004] ?于2013年3月15日提交的、标题为"SIGNALSOURCESEPARATION"的美国临时申请No. 61/788521 ;
[0005] ?于 2013 年 9 月 24 日提交的、标题为"TIME-FREQUENCYDIRECTIONAL FACTORIZATIONFORSOURCESEPARATION" 的美国临时申请No. 61/881678;
[0006] ?于 2013 年 9 月 24 日提交的、标题为"SOURCESEPARATIONUSINGDIRECTIONOF ARRIVALHISTOGRAMS" 的美国临时申请No. 61/881709 ;和
[0007] ?于 2013 年 12 月 23 日提交的、标题为"SMOOTHINGHME-FREQUENCYSOURCE SEPARATIONMASKS"的美国临时申请No. 61/919851。每一个在此引入作为参考。
[0008] 本申请也涉及但不主张于2013年9月17日提交的、标题为"SOURCESEPARATION USINGACIRCULARMODEL"的国际申请PCT/US2013/060044的申请日的权益，其通过引用并入本文。
【背景技术】
[0009] 本发明涉及分离信号源，并且特别涉及一种在多传声器系统中分离多个音频信号源。
[0010] 多声源可以存在于其中音频信号由多个传声器接收的环境。定位、分离和/或跟踪源可以用于许多应用中。例如，在多传声器助听器中，多个源之一可以被选择为所需的信号源，其信号被提供到助听器的用户。所需的源越好地在传声器信号中分离，用户越好地感知所需的信号，希望提供更高的清晰度、低疲劳等。
[0011] 使用多传声器信号从关注的源中分离信号的一种广泛方法是波束成形，其使用以波长或更多的级别的距离分离的多个传声器以向传声器系统提供方向灵敏度。然而，波束成形的方法可以例如限制于传声器的分离不充分。
[0012] 两耳（包括跨传声器）相位差（IPD)已用于从获得信号的集合的源分离。已经显示：只使用具有退化元分解估计技术OUET)的iro和耳间水平差（ILD)，盲源分离是可能的。DUET依赖于条件：将被分离的源显示出W-分离正交。该正交意味着在混合的短时傅立叶变换（STFT)的每一时频槽的能量假定由单个源支配。该混合STFT可被划分成不相交的集合，使得仅分配给第j个源的槽用来重建它。从理论上讲，只要源是W-分离正交，就可以实现完美的分离。即使语音信号仅大致正交，良好的分离可以在实践中实现。
[0013] 通过分解信号的时间对频率的表示，从例如音频信号的单个获取信号（即，从单个传声器）的源分离已使用所需信号的结构进行解决。一种这样的方法使用信号的时间对频率矩阵表示（例如，能量分布）的非负项的非负矩阵分解。该分析的一种产品可以是时间对频率的掩模（例如，二进制掩模），它可用于提取近似于关注的源信号的信号（g卩，来自希望源的信号）。类似的方法已基于使用混合模型建模期望的源而被开发，其中源的信号的频率分布被建模为一组典型光谱特性的混合（例如，在频率上的能量分布）。
[0014] 在一些技术中，信号源的"干净"(clean)示例用于确定特性（例如，典型光谱特性的估计），其然后用于识别退化（例如，噪声）信号中的源信号。在一些技术中，"无监督" 方法估计劣化信号本身的原型特征，或者"半监督"方式适应从劣化信号的先前确定原型。
[0015] 从单个获取的信号分离源的方法已经使用了类似的分解技术，其中两个或更多个源存在。在一些这样的方法中，每个源都与一组不同的典型光谱特性相关联。多源信号然后进行分析，以确定哪些时间/频率分量和关注的源相关联，并且该信号部分被提取为所需的信号。
[0016] 和从单个获取信号分离单一源一样，使用原型光谱特性以多源分离的一些方法使用信号的无监督分析（例如，采用期望最大化（EM)算法，或包括多个源的关节隐马尔可夫模型训练的变体），例如，以向一个或多个信号适用参数概率模型。
[0017] 使用"音频场景分析"和/或所需要源的特性的先验知识，形成时频掩模的其他方法来也用于上混音频并用于选择所需的来源。

【发明内容】

[0018] 在一个方面，总体上，具有紧密间隔元件的传声器用于获取多个信号，从其中分离来自期望源的信号。例如，期望源的信号从背景噪声或从特定干扰源的信号中分离。信号分离方法使用到达方向的信息或从获取信号之间从诸如相位、延迟和振幅的变化确定的其他信息，以及关注源的信号和/或干扰信号的结构信息的组合。和常规的波束形成方法的有效性相比，通过这个信息组合，所述元件可以被更紧密间隔。在一些示例中，所有的传声器元件被集成到单个微电机械系统（MEMS)。
[0019] 在另一个方面，总体上，根据声信号中的源用于信号分离的音频信号分离系统包括微电机械系统（MEMS)的传声器单元。传声器单元包括多个声端口。在相对于传声器单元的空间位置，每个声端口用于感测声环境。在至少一些实施例中，空间位置之间的最小间距小于3毫米。该传声器单元还包括多个传声器元件，每一个都耦合至所述多个声学的声端口，基于所述声端口的空间位置的声环境获取信号。该传声器单元还包括耦合传声器元件到电路，所述传声器元件被配置为提供一个或多个传声器信号，一起代表代表的获得信号和由传声器元件获得的信号中的变化。
[0020] 方面可以包括以下一个或多个特征。
[0021] 所述一个或多个传声器的信号包括多个传声器信号，每个传声器信号对应于不同的传声器元件。
[0022] 该传声器单元进一步包括多个模拟接口，每个模拟接口被配置以提供所述多个传声器信号的模拟传声器信号。
[0023] 所述一个或多个传声器信号包括在所述传声器单元的电路中形成的数字信号。
[0024] 所述一个或多个获取信号中的变化表示在多个频谱分量的每一个所获得的信号之间的相对相位变化和相对延迟变化的至少一个。在一些示例中，频谱分量代表不同的频率或频率范围。在其它示例中，频谱分量可基于倒频谱分解或小波变换。
[0025] 传声器元件的空间位置是共面的位置。在一些示例中，共面位置包括位置的规则栅格。
[0026] 该MEMS传声器单元具有包括多个面的封装，以及声学端口位于封装的多面上。
[0027] 信号分离系统具有多个MEMS传声器单元。
[0028] 信号分离系统具有耦合到传声器单元的音频处理器，所述音频处理器被配置为使用从所获取信号中差异确定的信息以及一个或多个源的信号结构，处理来自传声器单元的一个或多个传声器信号并输出根据所述信号的对应一个或多个源从表示性获取信号分离的一个或多个信号。
[0029] 实现音频处理器的至少一些电路与传声器单元的MEMS集成。
[0030] 传声器单元和音频处理器一起形成工具箱，每个被实施为经配置在音频信号分离系统的操作中互相通信的集成设备。
[0031] 一个或多个源的信号结构包括语音信号结构。在一些示例中，该语音信号结构对于个体是特定的，或者可替换地，该结构对于一类个体或特定和混合结构的混合是通用的。
[0032] 根据所述特性变化的音频处理器被配置为通过计算表示所获取信号中特征性变化的数据并根据特征性变化选择代表性所获取信号的组件而处理信号。
[0033] 信号的所选择分量的特征在于所述组件的时间和频率。
[0034] 所述音频处理器被配置为计算具有以时间和频率索引的值的掩模。选择组件包括结合掩码值和代表性的所获取信号，以形成由音频处理器输出的至少一个信号。
[0035] 表示所获取信号之间特征性变化的数据包括到达信息的方向。
[0036] 该音频处理器包括被配置为使用所述源的信号结构识别和一个或多个源中的至少一个相关联的分量的模块。
[0037] 配置为识别分量的模块实现概率推理方法。在一些示例中，概率推理方法包括置信传播方法。
[0038] 配置为识别分量的模块被配置为组合来自传声器的信号的多个分量的到达估计的方向以选择分量，用于形成从音频处理器输出的信号。
[0039] 配置为识别分量的模块被进一步配置为使用与到达估计的方向相关联的置信度值。
[0040] 配置为识别分量的模块包括：用于接收外部信息的输入，用于识别信号的所需分量。在一些示例中，所述外部信息包括用户提供的信息。例如，用户可以是其语音信号被获取的讲话人、正在接收经分离的话音信号的远端用户、或者其他的人。
[0041] 音频处理器包括信号重建模块，用于根据以时间和频率表征的所识别分量处理来自传声器的一个或者多个信号，以形成增强信号。在一些示例中，信号重建模块包括可控滤波器组。
[0042] 在另一个方面，总体上，微机电系统（MEMS)传声器单元包括多个独立传声器元件以及对应的多个端口，端口之间最小间距小于3毫米，其中每个传声器元件产生从传声器单元所提供的单独访问信号。
[0043] 方面可以包括一个或多个以下特征。
[0044] 每个传声器元件与对应的声端口相关联。
[0045] 至少一些传声器元件共享单元内的后腔。
[0046] 所述MEMS传声器单元进一步包括连接到传声器元件的信号处理电路，用于提供表示在该单元的声端口接收的声学信号的电信号。
[0047] 在另一个方面，总体上，多传声器系统使用单片设备上具有共同或分割后腔的一组紧密间隔的（例如，正方形排列中1.5-2. 0毫米间距）传声器，例如单个衬底上的四个 MEMS传声器。因为紧密间距，相位差和/或到达估计的方向可是有噪音的。这些估计使用概率推理（例如，置信传播（BP)或迭代算法）处理，以提供从其构造时频掩模的较少"噪音"估计（例如，由于加性噪声信号或未建模效果）。<

完整全部详细技术资料下载

当前第1页1 2 3 4 5 6

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：D·温格特;N·斯特因;
技术所有人：美国亚德诺半导体公司;
我是此专利的发明人

上一篇：使用高级频谱延拓降低量化噪声的压扩装置和方法
上一篇：用于控制平均编码率的系统和方法