给助听器等加入盲源分离技术的制作方法

文档序号：7583916阅读：217来源：国知局

专利名称：给助听器等加入盲源分离技术的制作方法
技术领域：
本发明一般涉及用以增强混合信号中所需要的信号分量的电子滤波，更具体地说，涉及用于实时地从各自独立的信号混合体中去混合(分离、去卷积)出所需要的信号的在例如助听器中特别有用的方法和设备。
当一个人聆听某人或某物时，干扰语音或所需要的信号的“噪声”或不希望有的信号是无处不在的。听觉受损的人尤其易受噪声干扰。背景谈话、来自数字装置(移动电话)的干扰、汽车或其它特定的环境噪声，会使听觉受损的人理解所需要的语音信号极其困难。降低信号的噪声电平，再结合自动聚焦到所需要的信号分量上，可以明显地改善诸如先进的助听器等电子语音处理器的性能。
近年来，已经推出利用数字信号处理器的助听器。它们包含一个或多个微音器、模数转换器、数字信号处理器和扬声器。通常数字信号处理器利用滤波器组把输入的信号分成几个频率区。在这些频率区中的每一个内，可以按照助听器用户的特定要求分别调整信号增益和动态压缩参数，以图改善可识度。另外，虽然有减小反馈和降低噪声的数字信号处理算法可用，但它们都有严重的限制。例如，当前可用的降低噪声算法的某些不利之处是当语音和背景噪声处在同一频率区时由于无法区分语音和背景噪声而使获得的改善有限。
一种目前在诸如语音识别、数字通信和传感器信号处理等领域降低噪声中找到应用的比较新的数字信号处理方法，涉及一种通常被称为独立分量分析(ICA)的技术，尤其是采用盲源分离(BSS)技术。这种技术寻找具有多个分量的输入信号，以便进行一种能使分量之间的统计依存性降到最低的信号变换。因而，BSS是一种能够对诸如多个语音或语音与噪声信号的混合体等独立信号混合体的信噪比作出极大改善的信号分离技术。
本发明的一个目标是提供一种电子滤波技术，它包括DSS处理，能够实时地工作以增强对诸如附近个人的语音等所需要信号的接收，而且必要时可以结合到助听器中。
用来送行所需要的由装置的用户恢复的信号的实时去混合的电子滤波装置，其中所需要的信号源自众多独立信号源中的一个。沿着公共轴线定位的两个微音器响应由微音器接收的来自众多独立信号源的声信号而产生第一和第二输入电信号。微音器公共轴线的空间位置可由用户实时地加以控制，以便与所述公共轴线成一直线，使之指向所需要的信号源的方向，以此令输入信号具有固有的方向性。响应输入信号的自适应去混合信号处理器产生其中所需要的信号已从混合信号中分离出来的输出信号。在本发明的一个最佳实施例中，提供一个预处理器，以便通过在输入信号之间建立相对时间滞后来提高输入信号的固有方向性。此外，在加到去混合信号处理器之前预处理器使改进后的输入信号接受去相关处理。去混合信号处理器的选择后的输出可以作为输入加在扬声器上进行重放，或者可以在重放前由另一个处理器作进一步处理以增强信号。

图1以方框图的形式举例说明按照本发明的原理构造的电子滤波装置；图2以方框图的形式举例说明图1所示的电子滤波装置的预处理级；图3以方框图的形式举例说明本发明的电子滤波装置中用的盲源分离技术；以及图4以方框图的形式举例说明本发明的电子滤波装置中用的盲源分离器示范性的实施例。
图1以方框图的形式举例说明本发明在助听器上的应用。助听器10包括两个微音器12和14，分别用来产生两个输入信号1和2。按照本发明的一个方面，这两个微音器在助听器上是这样安装的，使得当注意诸如语音等信号源时，使它们的定位轴线总是基本上在助听器的携带者朝向的方向上伸展。微音器的这种定位使输入信号1和2具有固有的方向性。由于每一个微音器都产生代表它们所接收的来自其工作范围内的信号源的声波的电信号，所以，每一个信号可以包括来自未知个数的信号源未知信号的混合体。在3个主级中处理输入信号1和2。在第一级16上，对输入信号进行预处理，以增强它们的定位已经赋予它们的固有方向性。在第二级18上，所得的信号经受准备产生由微音器12和14拾取的原未知信号的估计值的去混合处理(有时称为分离处理)。在第三级20上，去混合处理的输出信号最好经过后处理，以便产生所需要的信号22，然后可以将后者加在助听器10的扬声器24上，以便重放和呈现给用户。
正如图2所举例说明的，在预处理级16上，首先对原始输入信号进行归一化。利用增益控制来使输入信号1和2归一化为[-1，+1]的范围。现在用矢量x＝(x1(t)，x2(t))表达输入1和2。
按照本发明的一个方面，为了使盲源分离(BSS)技术适用于小得像助听器这样的装置，并使之能实时地工作，预处理级16还提供以下附加处理中的至少第一种处理，最好同时提供这两种处理●增强输入信号中所固有的信号源方向性，后者起因于于微音器12和14相对于感性趣的声源的定向排列。在助听器的示范性实施例中，假定感性趣的声源的定向是用户所朝向的方向。因而，微音器定位在助听器上沿着用户朝向的方向的轴线上，并且假定感性趣的声源方向相对于这样的轴线是0度。第二声源的方向可以在预处理级(16中的延迟框)中进行估计，得出自适应延迟(δ)。所述延迟是正的或负的相对延迟(fractional delay)，使得输入信号中功率最大的分量而不是大体上与微音器轴线成一直线的输入信号同步达到两个微音器。例如，若第二声源与微音器的轴线垂直，则该值为0。对于这种增强，归一化的输入信号x＝(x1(t)，x2(t))变为x1(t)＝x1(t)
x2(t)＝x2(t-δ)●输入信号的去相关。在示范性的实施例中，去相关是通过相关矩阵的对角线化进行的。更具体地说，令C＝协方差(xT)，式中xT是x的转置。若在该两输入信号(x1， x2)之间存在明显的相关，则在时间窗口D上的去相关意味着这些信号分两个步骤的转换(1)时间窗口D内全部数据平均值的对中；(2)对所得数据点进行仿射变换，以便将所得信号的协方差矩阵对角线化。假定x是围绕其平均值的对中，我们使用以下变换x=2(C)-1x]]>在举例说明的实施例中，窗口D包括16,000个样值。
上述预处理使随后的BSS处理易于进行，以便在比不提供该预处理时更短的时间内求出解，另外，还增大了BSS处理达到有效解而不是局部最小值的概率。
图3举例说明BSS算法的操作原理，据此从多个输入信号中去混合或分离出所需要的分量。这种技术之所以被称为盲源分离，原因是它对存在于混合体中的信号类型作的几个假设。正如本专业技术人员所熟知的，BSS处理过程准备从它们的混合体中的一组中恢复该组n个未知源的信号，假定这n个源信号是独立的。更具体地说，如图3所示，若s是n个源的矢量，并且x是这些源的m个观测值的矢量(亦即，来自m个微音器的原始输入信号)，则BSS处理器的目的是找出m乘n的混合矩阵A。
x＝As，式中x是图2所示的预处理后的信号(亦即，x”)，或者等价地，正如本发明所作的，求出一个去混合或分离矩阵W，使得，式中z是分量信号s的独立估计值的矢量，而z是该源信号的估计值。
如前所述，源s＝(s1，s2)并且依赖于环境的混合矩阵A是未知的。BSS处理器(它是众所周知的，可以利用神经网络实现)只见到来自两个微音器的输入x＝(x1，x2)，以便计算独立分量信号s的估计值z＝(z1，z2)。在这种情况下，输入x实际上是前述的预处理后的信号x”。
图4示出BSS处理器400的主要组件的方框图。BSS处理器400包括去混合组件402，用来记录和更新由参数W和v定义的去混合过程的状态；非线性组件404，用来产生适应过程用的统计；和适应组件406，用来计算去混合参数值的变化ΔW和Δv。
正如现将详细描述的，BSS处理器400连续地适配两个状态变量2乘2的去混合矩阵W和2乘1的偏移矢量b。去混合组件402对输入到BSS处理器400的最新N个样值输入提供缓冲。它利用参数W的最新值计算出与最新输入的样值x对应的输出z。这些参数在该过程开始(当v＝0时)时以最小随机值初始化z＝Wx非线性组件404利用可逆映射对系统的输出进行变换。该组件404的目的是避免计算输出的非常大的数值，后者从计算的观点看可能是无穷大。这一目的是通过处理通过可逆映射运行输出z之后获得的统计等效量来实现的。用于组件404中的非线性变换的一个例子是下面定义的s形非线性y，在整个输入缓存中以v平移的z作为参数。y=11+exp(-z-v)]]>适应组件406计算去混合参数W和v的变化，亦即ΔW和Δv。正如本专业的技术人员所熟知的，目的是使输出y所包含关于输入x的互信息最大化，正如，例如，A.J.Bell和T.J.Sejnowski在他们发表于Neural Computation，71129--1159，1995题为“盲分离和盲去卷积用的信息最大化途径”一文以及Bell的美国专利5,705,402中所描述的。这一目的归结为输出y的联合熵H＝H(y1，y2)的一个条件&PartialD;H(y1,y2)&PartialD;w=0]]>&PartialD;H(y1,y2)&PartialD;v=0]]>
对所得自适应规则进行修改，以便进行本专业技术人员所熟知的“自然梯度”步骤，诸如由S.Amari 1996年在Neural Computation所发表的题为“最小互信息盲分离”的出版物中所描述的。
我们得到以下更新规则ΔW＝η(W+(1-2y).u)Δv＝η(1-2y)学习速率η的典型值是0.005。
再次参见图1，以下的去混合器18是后处理步骤20，其中确定去混合器18的哪一个输出估计值更可能代表语音而不是噪声，以及通过将其按比例缩放至输入功率电平来实现输出功率的归一化。输出信号部分可以基于多重判据，例如，利用语音特征抽取和分析、和/或主扬声器检测，后者也能利用特征抽取和分析来实现。
正如前面指出的，在本发明举例说明的实施例中，BSS处理可以应用于助听器中。对系统的输入由该两微音器给出，按照本发明，它们彼此可以靠得很近。就图3和4中所示的BSS处理器的符号而言，该系统具有两个输入和两个输出(n＝m＝2)。
尤其是对于助听器的情况，本发明考虑以下问题●它在无回音环境的真实世界信号混合体中工作。提出的问题是利用BSS的助听器包括两个微音器，由于耳塞助听器所造成的物理限制，两者的距离小于11mm。
●它能够应付比微音器数目还多的信号。到目前为止，这被认为是不可能的，因为支持BSS的现行理论保证只有当n＞m时才有解。
●它工作在不稳定的混合条件下，以便跟随移动的声源并适应改变着的聆听环境。
●它是实时地工作的，使得用户不必担心信号的延迟并且使得助听器能够适应需要。
这样，已经示出和描述了一种用于从独立信号的混合体中实时地去混合而得到所需要的信号的新型方法和设备。但是，在研究了公开说，本发明的许多变化、修改、变型和其它用途及应用将是显而易见的。例如，尽管描述了预处理和后处理BSS处理器16和18，正如这里指出的，在本发明最广泛的应用中这并非严格地必不可少的。另外，BSS处理器400的各组件可以偏向于关于输入信号的先验知识，以方便其操作，例如关于源信号的振幅值分布的知识，或者甚至一个输入信号代表语音。另外，可以把增强其源信号方向性的信号处理包括在预处理器16中。甚至还有，本发明传授的知识对消除干扰、从许多语音的混合体中(“鸡尾酒会”问题)分离出一个语音、以及对于降低噪声的声音混合体的预处理以便允许对所需要的声信号x作进一步处理，都是极其有用的。所有不脱离这里传授的知识的这些变化、修改和变型以及其它用途和应用都为本发明所覆盖，本发明只受上面所解释的后附权利要求书的限制。
权利要求
1.一种用来对装置的用户所需要的待恢复的信号进行实时去混合的电子滤波装置，其中所需要的信号来源于多个独立信号源中的一个，其特征在于包括沿着公共轴线定位的两个微音器，它们随着所述微音器接收到来自所述多个独立信号源的声学信号而产生第一和第二输入电信号，其中所述微音器的公共轴线的空间位置可以由用户实时地加以控制，以便使所述公共轴线这样定向，使得它基本上持续地指向所需要的信号的来源的方向；以及自适应去混合信号处理器，它响应所述输入信号而产生输出信号，其中，从所述混合信号中分离出所需要的信号。
2.权利要求1的方法，其特征在于所述公共轴线在用户的位置上以指向声源方向的方式定位。
3.权利要求2的设备，其特征在于所述各微音器安装在准备装于用户耳朵中的公共的外壳中。
4.权利要求1的方法，其特征在于还包括预处理器，用来在所述输入信号加在所述去混合信号处理器之前修改所述输入信号。
5.权利要求4的设备，其特征在于所述预处理器在所述输入信号的分量之间引入相对的延迟。
6.权利要求4的设备，其特征在于所述预处理器使所述输入信号接受去相关处理。
7.权利要求1的方法，其特征在于还包括后处理器，后者响应所述混合信号处理器的所述输出信号，选择用于信号重放装置的所需要的信号。
8.权利要求1的方法，其特征在于所述去混合信号处理器包括盲源信号分离器。
9.权利要求8的设备，其特征在于所述盲源信号分离器包括神经网络，用来进行不受监视的学习过程，以便使所述输出信号的联合输出熵最大化。
10.一种用来对用户所需要的待恢复的信号进行实时去混合的方法，其中所需要的信号来源于多个独立信号源中的一个，其特征在于所述方法包括以下步骤沿着公共轴线定位两个微音器，用于随着所述微音器接收到来自多全独立信号源的声信号而产生第一和第二输入电信号，所述定位操作是这样的，使得所述微音器的公共轴线可由用户实时地加以控制，以便使所述公共轴线这样定向，使得基本上持续地指向所需要的信号的来源的方向；以及使所述输入信号接受自适应去混合信号处理，以便产生输出信号，其中从所述混合信号中分离出所需要的信号。
11.权利要求10的方法，其特征在于所述定位操作使所述公共轴线以这样的方式定位在用户附近，使得它指向用户所朝向的方向。
12.权利要求11的方法，其特征在于所述定位操作使所述公共轴线定位于准备装于用户耳朵中的公共外壳中。
13.权利要求10的方法，其特征在于还包括预处理步骤，用来在所述输入信号经受所述去混合信号处理之前修改所述输入信号。
14.权利要求10的方法，其特征在于所述预处理器步骤在所述输入信号之间引入相对的延迟。
15.权利要求14的方法，其特征在于所述预处理步骤使相对延迟后的输入信号接受去相关处理。
16.权利要求15的方法，其特征在于所述去相关步骤是通过对利用相对延迟后的输入信号形成的相关矩阵进行对角线化来完成的。
17.权利要求10的方法，其特征在于还包括后处理步骤，后者响应所述去混合信号处理步骤的输出信号，选择用于信号重放装置的所需要的信号。
18.权利要求10的方法，其特征在于所述去混合信号处理步骤包括盲源信号分离处理。
19.权利要求18的方法，其特征在于所述盲源信号分离处理包括不受监视的学习过程，以便使所述输出信号的联合输出熵最大化。
20.一种用来对用户所需要的待恢复的信号进行实时去混合的方法，其中所需要的信号来源于多个独立信号源中的一个，其特征在于所述方法包括以下步骤沿着公共轴线定位两个微音器，用于随着所述微音器接收到来自多个独立信号源的声信号而产生第一和第二输入电信号；对所述第一和第二输入电信号进行预处理，以便由于所述微音器的定位而增强其中固有的信号源的方向性；以及使所述方向性增强后的输入信号接受自适应去混合信号处理，以便产生输出信号，其中从所述混合信号中分离出所需要的信号。
21.权利要求20的方法，其特征在于所述定位操作使所述微音器的公共轴线能由用户实时地控制，以便使所述公共轴线这样定向，使得它基本上持续地指向所需要的信号的来源的方向。
22.权利要求20的方法，其特征在于所述预处理操作包括在所述输入信号之间引入相对的延迟，以便进一步增强其方向性。
23.权利要求22的方法，其特征在于所述预处理操作还包括对所述相对延迟后的输入信号进行去相关处理。
全文摘要
用来对装置的用户所需要的待恢复的信号进行实时去混合的电子滤波装置,其中所需要的信号来源于多个独立信号源中的一个。沿公共轴线定位的两个微音器随着接收到来自多个独立信号源的声信号而产生第一和第二输入电信号。微音器的公共轴线可由用户实时控制,以便使公共轴线这样定向,使得它指向需要的信号源的方向。自适应去混合信号处理器响应输入信号产生输出信号,从混合信号中分离出需要的信号。去混合信号处理器的输出加到扬声器上以便重放。
文档编号H04R25/00GK1261759SQ9912743
公开日2000年8月2日申请日期1999年12月30日优先权日1998年12月30日
发明者J·洛斯卡, C·达肯, T·佩特舍, I·霍鲁贝申请人:西门子共同研究公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：J.洛斯卡;C.达肯;T.佩特舍;I.霍鲁贝
技术所有人：西门子共同研究公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。