减少音频处理装置中的不相关噪声的方法

文档序号：7796660阅读：243来源：国知局

减少音频处理装置中的不相关噪声的方法
【专利摘要】本申请公开了减少音频处理装置中的不相关噪声的方法。本申请还公开了一种音频处理装置，包括多个电输入信号，每一电输入信号按数字化的形式及另外按包括多个频带和多个时刻的时频表示提供；及接收数字化电输入信号并提供所得增强信号的控制单元，其中所述控制单元配置成根据预定方案从所述数字化电输入信号或源自其的信号确定所得增强信号，其中所述预定方案包括所述增强信号的给定时频窗口的内容从包括最小能量的电输入信号的时频窗口的内容确定。本申请使所得音频信号中具有低自相关的声场信号分量最小化。
【专利说明】减少音频处理装置中的不相关噪声的方法
【技术领域】
[0001]本申请涉及音频处理装置例如助听器，如头戴式耳麦或听力仪器。本申请尤其涉及音频信号中例如源自风噪声或传声器噪声的不相关噪声信号分量的最小化。本发明具体涉及包括多个电输入信号的音频处理装置。
[0002]本申请还涉及音频处理装置的运行方法及音频处理装置的用途。
[0003]本申请还涉及包括处理器和程序代码的数据处理系统，其中程序代码使得处理器执行本发明方法的至少部分步骤。
[0004]例如，本发明可用在下述应用中:助听器、头戴式耳麦、头戴式耳机、有源耳朵保护系统、免提电话系统、移动电话、广播系统、记录系统等。
【背景技术】
[0005]下面的现有技术说明涉及本申请的应用领域之一，即助听器。
[0006]风噪声的检测及随后其对例如助听器如头戴式耳麦或听力仪器中的目标信号的影响的最小化已在多个申请中提及。例如，EP1448016A1涉及用于检测传声器阵列中风噪声的存在的装置。每一传声器产生随时间而变的信号，该信号馈给提供一个或多个输出信号的信号处理装置。信号处理装置具有用于在第一和第二传声器信号之间产生随时间而变的互相关函数的装置及用于产生对应于第一或第二传声器信号的随时间而变的自相关函数的信号。另外，信号处理装置配置成检测自相关函数实质上高于互相关函数的情形，其是存在风噪声的指示。
[0007]US20120253798A1涉及两个传声器的布置，其中一个乘以因子α，另一个乘以l-α，及所得的信号进行求和，及其中α通过用于计算α的更新后的值以使和信号的能量最小化的自适应滤波器进行确定，α的更新后的值基于和信号及第一和第二输入信号。
[0008]GB2453118A涉及用于抑制多传声器系统中的风噪声的装置，该系统例如用于从多个传声器产生语音音频信号同时风噪声受到抑制。组合处理器从拆分为第一和第二频域子带的第一和第二传声器信号产生组合子带信号，对于每一子带，通过将组合子带信号的子带量值选择为第一频域子带信号的子带量值和第二频域子带信号的子带量值的最低量值进行拆分。
[0009]W02008041730A1涉及检测风噪声的方法，包括计算两个传声器信号之间的相关系数及两个信号的多个特定参数。
[0010]ΕΡ1339256Α2涉及连接到可控高通滤波器的传声器信号。高通滤波器的控制输入经统计评估单元产生，其在预定时间量期间连续监视输入信号的性态。调节高通滤波器特性以使高通滤波器的输出的能量最小化。

【发明内容】

[0011]本发明具体涉及跨例如来自传声器阵列(及可能来自波束形成器)的多个输入信号随机及不相关的信号的处理。这样的信号例如可包括风噪声。本发明尤其涉及时/频复合域中最佳输入信号源的选择，例如以使所得信号中的风噪声或其它不相关信号(如随机噪声)最小化。
[0012]本申请的目标在于提供用于处理音频信号的改进方案。
[0013]本申请的目标由所附权利要求限定的及下面描述的发明实现。
[0014]咅频处理装置
[0015]一方面，本发明涉及包括N个输入(N>1)并提供所得的处理后的信号Y (例如参见图1a)的音频处理装置，前述输入例如来自传声器阵列或其它和/或不同输入变换器的组合，每一输入变换器提供表不音频处理装置的环境的声信号的电输入信号XiQ=I, 2,…，N)。
[0016]一方面，本申请的目标由音频处理装置实现，其包括:
[0017]-多个电输入信号，每一电输入信号按数字化的形式提供；及
[0018]-接收数字化电输入信号并提供所得增强信号的控制单元，其中该控制单元配置成根据预定方案从数字化电输入信号或源自其的信号确定所得增强信号。
[0019]这具有使所得的音频信号中不合需要的声场信号分量最小化的优点。 [0020]在本说明书中，术语“所得增强信号”意为所得的信号，例如修改或修正后的信号。
[0021]在本说明书中，术语“预定方案”(用于从数字化电输入信号确定所得增强信号)包括在音频处理装置使用之前定义的判据，该判据与数字化电输入信号有关。
[0022]在实施例中，预定方案包括基于相应电输入信号或源自其的信号的量值(或量值平方)的判据。在实施例中，预定方案包括(在给定时间和/或频率)提供所得增强信号的判据，其具有在多个电输入信号之中选择的最小量值。
[0023]在实施例中，预定方案包括用于使所得增强信号的能量最小化的判据。
[0024]在实施例中，用于使能量最小化的判据在每一时间点通过选择在该时间点包含最小能量的电输入信号而实现。
[0025]电输入信号以数字化形式提供(数字化信号包括模拟输入信号在匀称间隔的、独立的时刻的样本值)。在实施例中，所得增强信号确定为在可用电输入信号(或源自其的信号)之中选择的样本的组合，增强信号在特定时间点的每一样本表示(取自)在那时具有最低能量(量值)的电输入信号。
[0026]在实施例中，定义时间帧，每一时间帧包含预定数量的样本。在实施例中，所得增强信号中能量的最小化在时间帧基础上进行，因为所得增强信号确定为在可用电输入信号(或源自其的信号)之中选择的时间帧(而不是样本)的组合。
[0027]在实施例中，预定方案包括导致选择相应的电输入信号(或源自其的信号)之一的给定时频窗口(bin) (k，m)的内容以用在增强信号的对应时频窗口(k，m)中的判据。
[0028]在优选实施例中，预定方案包括增强信号的给定时频窗口(k，m)的内容从包括最小能量的电输入信号(例如在可用输入信号之中具有最小量值)的时频窗口(k，m)的内容确定，例如参见图6a和6b。在包括风噪声的信号中，前述方案利用包含最小能量的源信号也将包含最少的风噪声。
[0029]作为备选，预定方案包括选择具有最大信噪比(SNR)的时频单元。这具有基本消除偏爱某一声源的需要的优点。
[0030]音频处理装置的输入信号可在(时_)频域呈现或通过例如包括在音频处理装置中的适当的功能单元从时域转换到(时-)频域。根据本发明的音频处理装置例如可包括多个时间到时频转换单元(例如未按时频表示提供的每一输入信号一个前述单元，例如参见图1b)以在多个频带k和多个时刻m提供每一输入信号Xi(I^m) α=1，2，...，Ν)(实体(k，m)由指数k和m的对应值定义，称为TF窗口或DFT窗口或TF单元，例如参见图3b)。音频处理装置包括控制或信号处理单元，其接收输入信号的时频表示并提供所得增强信号的时频表示。控制单元配置成根据预定方案从一个或多个电输入信号的时频表示的对应TF窗口的内容确定增强信号的给定时频窗口(k，m)的内容。
[0031]在实施例中，所得增强信号的相位通过在特定时间的信号来源确定。换言之，所得增强信号包括来自给定时间点选择的(满足预定方案的)输入信号(或输入信号的时频单元)的量值和相位。作为备选，所得增强信号的相位可被合成(如随机化)或平滑以避免时刻间(和/或频带间)的相位发生大的变化。
[0032]优选地，电输入信号Xi提供构成音频处理装置的当前声环境的同一声场的不同表示(例如在不同位置和/或通过不同变换器拾取)。
[0033]在实施例中，声场包括一个或多个语音信号。在实施例中，特定语音信号构成佩戴音频处理装置的用户的目标信号。
[0034]电输入信号Xi(I^m) (i=l, 2,…，N)可表不来自输入变换器如传声器(例如常规传声器或振动感测骨导传声器)、或加速计、或无线接收器的信号。
[0035]在实施例中，电输入信号Xi为全向信号。
[0036]在实施例中，电输入信号Xi为两个以上信号的组合如线性组合的结果。在实施例中，电输入信号Xi为处理算法的输出(即电输入信号Xi为已经历处理算法之后所得的信号，例如降噪或压缩或方向算法)。
[0037]音频处理装置可包括用于组合两个以上输入信号(例如来自两个以上传声器的信号)的方向算法，该方向算法在本申请中也称为波束形成。在实施例中，电输入信号Xi为方向(波束形成的)信号(例如源自至少两个全向信号的(如加权)组合)。
[0038]在实施例中，方向算法配置成(从音频处理装置的目前位置)识别到给定声场中包括目标语音信号的声源的方向。
[0039]在实施例中，音频处理装置包括传声器系统，其包括用于将声场转换为相应时变电输入信号的至少两个传声器及至少两个时间到时频转换单元(每一传声器对应一个)以提供每一电输入信号在多个频带k和多个时刻m的时频表示。
[0040]在各个输入信号(例如每一输入信号源自全向传声器)相关的情形下，基于前述相关输入的方向信号具有比每一个别信号低的能量。因此，使用方向信号进行进一步处理或呈现给用户通常是有利的。另一方面，在各个输入信号(或输入信号的分量)不相关的情形下，例如由于风噪声或传声器噪声的影响，使用无方向(全向)信号进行进一步处理或呈现给用户通常是有利的。
[0041]在实施例中，音频处理装置包括至少三个电输入信号，第一和第二电输入信号来自两个(如全向)传声器，第三电输入信号来自提供第一和第二电输入信号的加权组合的方向算法。在实施例中，控制单元配置成通过插入来自两个(如全向)传声器的、具有比方向输入信号(第三电输入信号)的对应信号分量低的能量的信号分量而优化方向信号。
[0042] 在优选实施例中，电输入信号被归一化。这具有各个信号的信号分量可容易比较的优点。在实施例中，音频处理装置包括连接到电输入的归一化滤波器，该归一化滤波器配置成具有传递函数Hn (f)，其使得提供所涉及电输入信号的源可与其它源比较和互换。该归一化滤波器优选配置成使能直接比较输入信号及在输入信号之间进行信号分量(如TF单元)的平滑交换(而不产生明显的中断)。归一化例如可补偿两个电输入信号之间的恒定电平差(例如因提供输入信号的两个源输入变换器相对于当前声源的位置引起)。在实施例中，归一化滤波器包括自适应滤波器。
[0043]在实施例中，使N个电输入信号归一化的方法包括:a)选择参考源输入信号(例如假定最可靠的信号)，如信号X1 ;b)对于每一其它源输入信号Xi, i=2,…，N，计算相较参考源输入信号的量值-频率差(例如对于信号的普通时间段和/或对于在某一时间平均的相应信号)；及c)通过乘以修正值(可能复值)而使每一源按比例调节。
[0044]在实施例中，控制单元包括使权重P能应用于至少一电输入信号(或源自其的信号)的组合单元。在实施例中，权重P取决于频率。(可能随频率而变的？^^，^，〗，…，^f为频率)加权因数提供选择一输入信号(或输入信号的特定频率范围)而不选择另一输入信号的可能性。例如，如果提供电输入信号之一的给定源已知与特定参数(如当前声环境的参数，例如风噪声的总电平)具有特定关系，控制单元可配置成通过因而修改P(f)而考虑该关系。
[0045]在实施例中，对于输入信号q和j的权重Pq (f)和Pj (f)的相对大小受分别提供电输入信号q和j的输入变换器相对于当前声场的声源的位置影响。
[0046]在实施例中，音频处理装置包括风噪声检测器，用于提供在特定时间点(例如在特定位置，或在特定输入信号中)存在的风噪声量的(优选随频率而变的)估计量。在实施例中，风噪声检测器配置成检测任何不相关噪声(如风噪声、传声器噪声等)。
[0047]在实施例中，第i个电输入信号(或源自其的信号，i=l，2，…，N)的加权因数Pi (f)根据风噪声的估计量进行修改。在实施例中，表不方向传声器信号的输入信号的加权因数P(f)在不同频率时不同(例如以补偿风噪声与方向信号的非线性关系)。
[0048]在实施例中，输入信号的加权因数Pi (f)根据检测器如环境检测器或风噪声检测器的输出而自适应确定。
[0049]在实施例中，加权因数Pi (f)用于选择来自唯一源如源j的信号(通过对所有其它信号设置？^^=。(i关j))。
[0050]在实施例中，音频处理装置包括提供指示“波动增益”存在的非自然信号度量的非自然信号检测器，其可能是因处理算法(如目前用于减少音频信号中的不相关噪声的算法)引入的非自然信号的来源。前述非自然信号检测器的例子在EP2463856A1中公开。
[0051]在音频处理的上下文中，术语“非自然信号”意为因信号处理(数字化、降噪、压缩等)引入的音频信号成分，其在呈现给听者时通常不被感知为自然声音。非自然信号通常称为音乐噪声，其由所得信号中的随机谱峰引起。前述非自然信号听上去像短纯音。
[0052]在实施例中，用于使音频信号中的不相关信号分量(如风噪声)最小化的当前方案的启用或禁用受非自然信号度量的影响。换言之，控制单元配置成，如果非自然信号度量表明噪声最小化算法产生的非自然信号听得见(即比降低噪声水平获得的好处差)，忽视预定方案。
[0053]在包括两个传声器输入信号和方向输入的实施例中，根据本发明的能量最小化算法用于去除方向信号中的不相关信号分量。在实施例中，控制单元配置成，在最小化算法产生的非自然信号听得见的情形下，保持方向信号。例如这可通过相较于两个传声器输入信号(第一和第二电输入信号)的加权因数降低方向信号(第三电输入信号)的加权因数P而实现。在实施例中，加权因数P1 (f) =P2 (f) =1及P3⑴〈I。
[0054]在实施例中，音频处理装置适于提供随频率而变的增益以补偿用户的听力损失。在实施例中，音频处理装置包括用于增强输入信号并提供处理后的输出信号的信号处理单
J Li ο
[0055]在实施例中，音频处理装置包括用于将电信号转换为由用户感知为声信号的刺激的输出变换器。在实施例中，输出变换器包括多个耳蜗植入电极或骨导听力装置的振动器。在实施例中，输出变换器包括用于将刺激作为声信号提供给用户的接收器(扬声器)。
[0056]在实施例中，音频处理装置包括用于从另一装置如通信装置或另一音频处理装置无线接收直接电输入信号的天线和收发器电路。在实施例中，音频处理装置包括用于从另一装置如通信装置或另一音频处理装置接收有线直接电输入信号的(可能标准化的)电接口(例如连接器的形式)。在实施例中，直接电输入信号表示或包括音频信号和/或控制信号和/或信息信号。
[0057]在实施例中，音频处理装置和另一装置之间的通信处于基带(音频频率范围，如O和20kHz之间)中。优选地，音频处理装置和另一装置之间的通信基于高于IOOkHz频率下的某种调制。优选地，用于在音频处理装置和另一装置之间建立通信的频率低于50GHz，例如位于从50MHz到50GHz的范围中，例如高于300MHz，例如在高于300MHz的ISM范围中，例如在900MHz范围中或在2.4GHz范围中。
[0058]在实施例中，音频处理装置为便携式装置，例如包括本机能源如电池例如可再充电电池的装置。
[0059]在实施例中，音频处理装置包括输入变换器(传声器系统和/或直接电输入(如无线接收器))和输出变换器之间的正向或信号通路。在实施例中，信号处理单元位于正向通路中。在实施例中，信号处理单元适于根据用户的特定需要提供随频率而变的增益。在实施例中，音频处理装置包括分析通路，其包括用于分析输入信号(如确定电平、调制、信号类型、声反馈估计量等)的功能件。在实施例中，分析通路和/或信号通路的部分或所有信号处理在频域进行。在实施例中，分析通路和/或信号通路的部分或所有信号处理在时域进行。
[0060]在实施例中，表声信号的模拟电信号在模数(AD)转换过程中转换为数字音频信号，其中模拟信号以预定采样频率或速率fs进行采样，fs例如在从8kHz到80kHz的范围中(适应应用的特定需要，例如48kHz)以在离散的时间点tn (或η)提供数字样本xn (或
X[η])，每一音频样本通过预定的比特数Ns表示声信号在tn时的值，Ns例如在从I到64比特的范围中，例如16或24比特。数字样本X具有ts=l/fs的时间长度，对于fs=20kHz，例如50 μ S0在实施例中，多个音频样本按时间帧进行安排。在实施例中，一时间帧包括64个音频数据样本。根据实际应用可使用其它帧长度。帧长度例如可以是2-20ms级，例如3.2ms或3.75ms (如蓝牙)或5ms或7.5ms (如蓝牙)或IOms (如DECT)。
[0061]在实施例中，音频处理装置包括模数(AD)转换器以按预定采样速率如20kHz使模拟输入数字化。在实施例中，音频处理装置包括数模(DA)转换器以将数字信号转换为模拟输出信号，例如用于经输出变换器呈现给用户。
[0062]在实施例中，音频处理装置如传声器单元和/或收发器单元包括用于提供输入信号的时频表示的TF转换单元。在实施例中，时频表示包括所涉及信号在特定时间及频率范围的对应复值或实值的阵列或映射。在实施例中，TF转换单元包括滤波器组,用于对(时变)输入信号进行滤波并提供多个(时变)输出信号，每一输出信号包括不同的输入信号频率范围。在实施例中，TF转换单元包括傅里叶变换单元，用于将时变输入信号转换为频域中的(时变)信号。在实施例中，音频处理装置考虑的、从最小频率fmin到最大频率fmax的频率范围包括典型的人听频范围20Hz-20kHz的一部分，例如范围20Hz-12kHz的一部分。在实施例中，音频处理装置的正向通路和/或分析通路的信号拆分为NI个频带，其中NI例如大于5，如大于10，如大于50，如大于100，如大于500，至少其部分个别进行处理。在实施例中，音频处理装置适于在NP个不同频道中处理正向通路和/或分析通路的信号(NP ( NI)。频道宽度可均匀或非均匀(例如宽度随频率增加)、重叠或非重叠。
[0063]在实施例中，音频处理装置包括电平检测器(LD)，用于确定输入信号的电平(例如基于频带级和/或全(宽带)信号)。从用户的声环境拾取的电传声器信号的输入电平例如是声环境的分类参数。
[0064]在特定实施例中，音频处理装置包括话音活动检测器(VAD)，用于确定输入信号(在特定时间点)是否包括话音信号。这具有下述优点:包括用户环境中的人发声(如语音)的电传声器信号的时间段可被识别，因而与仅包括其它声源(如自然或人工产生的噪声如风噪声或传声器噪声)的时间段分离。
[0065]在实施例中，音频处理装置包括信噪比检测器(估计器XSNR估计例如可结合如上所述的话音活动检测器(VAD)进行。
[0066]在实施例中，音频处理装置包括音频处理装置周围的当前声场中存在预定量的不相关信号分量的检测器。在实施例中，音频处理装置包括风噪声检测器、相关检测器、自相关检测器或其组合。
[0067]在实施例中，用于使音频信号中的不相关信号分量(如风噪声)最小化的当前方案的启用或禁用取决于来自检测器的控制信号。
[0068]在实施例中，音频处理装置包括声(和/或机械)反馈抑制系统。在实施例中，音频处理装置还包括用于所涉及应用的其它有关功能，例如压缩、降噪等。
[0069]在实施例中，音频处理装置包括听音装置如助听器或通信装置如移动电话。在实施例中，助听器包括头戴式耳麦。在实施例中，助听器包括听力仪器，如适于位于用户耳朵处或适于全部或部分位于用户耳道中的听力仪器。在实施例中，助听器包括耳机、耳朵保护装置或其组合。
[0070]
[0071]此外，本发明提供上面描述的、“【具体实施方式】”中详细描述的及权利要求中限定的音频处理装置的用途。在实施例中，提供在包括一个或多个目标信号和一个或多个噪声信号的混合的音频系统中的用途，一个或多个噪声信号包括不相关信号分量如风噪声。在实施例中，提供在包括一个或多个听力仪器、头戴式耳机、耳麦、有源耳朵保护系统等的系统中的用途，例如免提电话系统、远程会议系统、广播系统、卡拉OK系统、教室放大系统等。
[0072][0073]—方面，本申请进一步提供音频处理装置的运行方法，该方法包括:
[0074]-提供多个电输入信号，每一电输入信号按数字化的形式提供；
[0075]-基于数字化电输入信号提供所得增强信号；及
[0076]-根据预定方案从数字化电输入信号或源自其的信号确定所得增强信号。
[0077]当由对应的过程适当代替时，上面描述的、“【具体实施方式】”中详细描述的及权利要求中限定的装置的部分或所有结构特征可与本发明方法的实施结合。方法的实施具有与对应装置一样的优点。
[0078]计算机可读介质
[0079]本发明进一步提供保存包括程序代码的计算机程序的有形计算机可读介质，当计算机程序在数据处理系统上运行时，使得数据处理系统执行上面描述的、“【具体实施方式】”中详细描述的及权利要求中限定的方法的至少部分(如大部分或所有)步骤。除了保存在有形介质如磁盘、⑶-ROM、DVD、硬盘、或任何其它机器可读的介质上，计算机程序也可经传输介质如有线或无线链路或网络如因特网进行传输并载入数据处理系统从而在不同于有形介质的位置处运行。
[0080]数据处理系统
[0081]本发明进一步提供数据处理系统，包括处理器和程序代码，程序代码使得处理器执行上面描述的、“【具体实施方式】”中详细描述的及权利要求中限定的方法的至少部分(如大部分或所有)步骤。
[0082]本申请的进一步的目标由从属权利要求和本发明的详细描述中限定的实施方式实现。
[0083]除非明确指出，在此所用的单数形式的含义均包括复数形式(即具有“至少一”的意思)。应当进一步理解，说明书中使用的术语“具有”、“包括”和/或“包含”表明存在所述的特征、整数、步骤、操作、元件和/或部件，但不排除存在或增加一个或多个其他特征、整数、步骤、操作、元件、部件和/或其组合。应当理解，除非明确指出，当元件被称为“连接”或“耦合”到另一元件时，可以是直接连接或耦合到其他元件，也可以存在中间插入元件。如在此所用的术语“和/或”包括一个或多个列举的相关项目的任何及所有组合。除非明确指出，在此公开的任何方法的步骤不必须精确按所公开的顺序执行。
【专利附图】

【附图说明】
[0084]本发明将在下面参考附图、结合优选实施方式进行更完全地说明。
[0085]图1a-1c示意性地示出了根据本发明的音频处理装置的三个实施例。
[0086]图2a_2c示出了根据本发明的音频处理装置的三个实施例。
[0087]图3a_3b示意性地示出了时域到时频域的信号转换，其中图3a示出了随时间而变的声音信号(振幅-时间)及其在模数转换器中的采样，图3b示出了在采样信号傅里叶变换之后所得的时频单元的“分布图”。
[0088]图4a_4c示出了根据本发明的音频处理装置的三个实施例，其中处理在频域进行。
[0089]图5示出了根据本发明的音频处理装置的实施例，其中电输入信号包括两个传声器信号及从传声器信号产生的方向信号。[0090]图6a_6b示出了根据本发明实施例的第一和第二电输入信号及所得的增强输出信号的时频表示的例子。
[0091]图7a_7b分别示出了根据本发明的听力仪器(图7a)和头戴式耳麦(图7b)的实施例。
[0092]为清晰起见，这些附图均为示意性及简化的图，它们只给出了对于理解本发明所必要的细节，而省略其他细节。
[0093]通过下面给出的详细描述，本发明进一步的适用范围将显而易见。然而，应当理解，在详细描述和具体例子表明本发明优选实施例的同时，它们仅为说明目的给出。对于本领域的技术人员来说，从下面的详细描述可显而易见地得出其它实施方式。
【具体实施方式】
[0094]图1a-1c示出了根据本发明的音频处理装置的三个实施例。
[0095]在第一基本实施例中，图1a的音频处理装置APD包括多个电输入信号X1，…，Xn(其中N ^ 2)，每一电输入信号以数字化形式提供，及包括接收数字化电输入信号并提供所得增强信号Y的控制单元CTR。控制单元CTR配置成根据预定方案从数字化电输入信号X1，…，Xn或源自其的信号确定所得增强信号Y，例如通过使在预定时间点的增强信号Y的能量最小化进行(例如基于样本或时间帧或时频单元)。
[0096]在第二基本实施例中，图1b的音频处理装置APD包括多个输入信号I1, I2,…，In(其中N ^ 2),每一输入信号Ii连接到提供输入信号的时频表不Xi (例如包括输入信号在多个频带k和多个时刻m时的(复)值)的分析滤波器组A-FB。控制单元CTR配置成根据预定方案从电输入信号X1, X2,…，Xn或源自其的信号的时频表示确定所得增强信号Y。所得增强信号Y在此假定以时频表示提供及在此连接到将所得增强信号提供为时域信号OUT的合成滤波器组S-FB，时域信号OUT可在随后的信号处理单元中进一步处理。
[0097]如图1c中所示的根据本发明的音频处理装置APD的第三基本实施例包括与结合图1b所述一样的功能元件。另外，图1c的实施例还包括提供输入信号I1, I2,…，In的输入单元IU1, IU2,...，IUno输入单元IU1, IU2,...，IUn通常提供表示音频信号的(电)输入信号
I1,I2,…，In (即包括听频范围(如≤20kHz)中的频率)。输入单元IU1, IU2,…，IUn例如可包括一个或多个输入变换器，如用于拾取声学声音信号的传声器和/或用于(无线或有线)接收包括音频的电或电磁信号的收发器，和/或为来自已应用于音频信号的处理算法的信号输入。在图1c的实施例中，时域信号OUT连接到输出单元0U。输出单元OU例如可以是输出变换器，如用于将电输出信号OUT转换为由用户感知为声音的刺激。该输出变换器例如可包括:a)用于将电信号转换为声学声音信号的接收器/扬声器；b)骨导听力仪器的振动器，用于将电信号转换为通过用户头部的骨结构而到用户内耳的机械振动；或(3) —个或多个耳蜗植入电极，用于将电信号直接或间接传到用户的耳蜗神经。作为备选或另外，输出单元可包括用于将电输出信号传给另一装置的收发器。 [0098]图la、lb或Ic中所示的音频处理装置的实施例可包括配置成影响增强信号Y的形成的检测器(如体现在控制单元CTR中或其外部)。该检测器的输出可在形成增强信号Y时影响一个或多个电输入信号Xi的权重。
[0099]图2a_2c示出了根据本发明的音频处理装置的三个实施例。图2a_2c中所示的音频处理装置的实施例例如可表示听音装置，如助听器，如头戴式耳麦或听力仪器(的一部分)。
[0100]图2a的音频处理装置实施例包括传声器单元M1, M2,…，Mn，每一传声器单元拾取音频处理装置周围的声场版本并将声音信号转换为数字化(电)输入信号Ii, i=l,2,…，N。假定每一传声器单元M1, M2,…，Mn均包括模数(AD)转换单元以将模拟电信号转换为数字化电信号。控制单元CTR接收数字化电输入信号I1, I2,…，In并提供所得增强信号Y，其中不相关信号分量被最小化。该信号被馈给处理单元FSP进行另外的信号处理，例如进一步降噪、应用随频率而变的增益、反馈消除或回波消除等。在图2a的实施例中，处理单元的输出OUT馈给用于将电输出信号OUT转换为提供给用户的输出声音的扬声器单元SP。扬声器单元SP例如体现在位于用户耳朵处或用户耳道中的耳件中。
[0101]图2b的音频处理装置实施例包括与图2a的实施例一样的元件。另外，图2b的音频处理装置还包括体现在方向单元DIR中的方向算法，其连接到数字化(电)输入信号Ii,i=l,2, -,N0方向单元DIR提供仿真具有方向特性的方向传声器的方向信号ID以在特定方向提供增加的灵敏度及在其它方向提供减小的灵敏度，从而衰减来自那些(其它)方向的噪声(可能及目标信号)。方向信号ID，其形成为输入信号Ii, i=l, 2，…，N的加权组合，连接到控制单元CTR。控制单元CTR因而接收数字化电输入信号I1, I2,…，In及另外接收方向信号ID作为输入并基于其提供所得增强信号Y。在图2b的实施例中，方向信号ID假定具有较低的不相关噪声如风噪声量(至少在方向特性的灵敏度减小的方向)，及控制单元CTR的任务可看作通过插入来自各个传声器的(在信号I1, I2,…，In之中的)、具有比方向输入信号ID的对应信号分量低的能量(如量值)因而低的噪声的信号分量而优化方向信号。如上结合图2a所述，所得增强信号Y连接到处理单元FSP进行另外的信号处理。
[0102]图2c的音频处理装置实施例包括多个传声器单兀M1, M2,…，Mn,每一传声器单兀拾取音频处理装置周围的声场版本并将声音信号转换为(电)输入信号。每一传声器Mi连接到归一化滤波器Hi (i=l, 2，…，N)，每一滤波器配置成具有传递函数Hi (f)，其使得提供所涉及(电)输入信号的(由传声器Mi拾取的)源可与其它源比较和互换。提供归一化电输入信号Ii的归一化滤波器Hi连接到时间到时频转换单元(在此为分析滤波器组A-FB)，其输出Xi (包括对应信号Ii的时频表示)馈给信号处理单元SPU。信号处理单元SPU包括根据本发明的、配置成使所得音频信号(Y，在图2c中未示出)中的不相关噪声最小化的算法。信号处理单元SPU可配置成在应用根据本发明的噪声最小化算法之前或之后对输入信号X^i=I, 2,-,N)应用另外的信号处理。同样，所得增强信号Y可在处理后的输出信号OF(假定为时频表示)连接到时频到时间转换单元(在此为合成滤波器组S-FB)以提供时域输出信号OUT之前在信号处理单元SPU中进行进一步处理。输出信号OF连接到输出变换器OT0输出变换器OT可以多种不同的方式体现，例如结合图1c所述的方式。
[0103]图3a_3b示意性地示出了时域到时频域的信号转换，其中图3a示出了随时间而变的声音信号(振幅-时间)及其在模数转换器中的采样，图3b示出了在采样信号傅里叶变换之后所得的时频单元的“分布图”。图3a示出了随时间而变的声音信号x(t)(振幅(SPL[dB])_时间(t))、其在模数转换器中的采样、及帧中时间样本的分组，每一组包括Ns个样本。表明按dB计的声压级对时间的曲线(图3a中的实线)例如可表示由输入变换器如传声器提供的、在由模数转换单元数字化之前的时变模拟电信号。图3b示出了源自图3a的输入信号的傅里叶变换(如离散傅里叶变换DFT)的时频单元的“分布图”，其中给定时频单元(m，k)对应于一个DFT窗口并包括所涉及信号X(m，k) (X(m,k)= |χ|。eiφ
|Χ| =量值及φ = +目位)在给定时间帧m和频带k的复值。在下面，给定频带假定包含
每一时间帧中的信号的一个值(通常为复值)。作为备选，其可包括一个以上的值。在本说明书中，使用术语“频率范围”及“频带”。频率范围可包括一个或多个频带。图3b的时频分布图示出了对于频带k=l, 2，…，K和时间单位m=l，2，…，M的时频单元(m, k)。每一频带Afk在图3b中指示为宽度全都相同，但并不必须如此。频带可以为不同的宽度(或作为备选，频道可定义为包含不同数量的均匀频带，例如给定频道的频带数量随频率增加而增加，最低频道例如包括单一频带)。各个时频窗口的时间间隔Atm (时间单位)在图3b中指示为具有相等大小。尽管在本实施例中假定如此，但并不必须如此。时间单位Atm通常等于时间帧中样本的数量Ns (参见图3a)乘以样本的时间长度ts (%=(1/4)，其中仁为采样频率)。在音频处理系统中，时间单位例如在ms级。
[0104]图4a_4c示出了根据本发明的音频处理装置的三个实施例，其中在频域进行处理。
[0105]图4a的音频处理装置实施例包括与图1c中所示实施例一样的功能单元。差别在于图1c中的控制单元CTR在图4a中标记为WNR及不同频带(或频道)中的处理由多个(1，2，…，K个)控制单元WNR指示，每一频带k 一个控制单元。每一子频带控制单元提供对于特定频带k所得增强信号Y(n，k)，η为时间指数(上面称为m)。图4b更详细地示出了图4a的控制单元WNR的实施例(图4b具体示出了子频带k=l)。每一子频带控制单元WNRk(k=l，2，…，N)包括归一化滤波器H1, H2,…，HN。特定子频带控制单元WNRk的每一归一化滤波器Hi对输入信号Xi (n, k)进行滤波并提供归一化信号XNi (n, k)。归一化滤波器氏(1=1，2，...，^配置成使能直接比较所得的输入信号XNiOi, k)及在不同输入信号XNi (n, k)之间平滑交换信号分量(如TF单元(n，k))(而不产生明显的中断)。给定子频带控制单元WNRk的归一化信号XNi (n, k)连接到控制单元CNT和选择单元SEL。所涉及子频带控制单元的控制单元CNT配置成确定当前时频单元(n，k)中哪一时频单元满足预定判据(如具有最低能量(量值))并将选择信号S(n，k)提供为输出，其馈给选择单元SEL并控制归一化输入信号XN1, XN2,…，XNn的N个时频单元(n, k)之中适当时频单元(n, k)的选择。选择单元SEL从而在所得增强信号Y (n，k)中将所选的TF单元提供为输出。在所有K个子频带控制单元WNRk (k=l，2，…，K)中进行同样的程序，从而提供所得增强信号Y (n，k)。
[0106]图4c示出了子频带控制单元WNRk(k=l，2，…，K)的备选例子。在图4c的实施例中，图4b的频率指数k被符号ω代替。图4b的归一化滤波器Hi (k)实施为具有随频率而变的倍增因数Hi(Co)的乘法器。图4b的控制单元CNT在图4c的实施例中由用于确定(实值或)复值输入信号的量值的单元I X 1、用于将加权因数Pi(O)应用于所涉及输入信号的乘法单元X、及用于在给定时间点η确定来自输入Xi (η，ω)的归一化加权量值信号
I Xi (η, ω).Hi(Q) I.Pi(CO)之中的最小值的最小化单元Min{.}实施。最小化单元Min{.}的输出控制选择单元(相当于图4b中的SEL单元)，其提供所得的增强输出信号Y(η, ω)。
[0107] 图5示出了根据本发明的音频处理装置的实施例，其中电输入信号包括两个传声器信号及从传声器信号产生的方向信号。图5中所示的音频处理装置实施例包括四个输入单元IU1UU2UU3和IU4,每一输入单元提供相应的数字化电输入信号I1U2U3和14，每一数字化电输入信号表不输入音频信号。输入单兀IUp IU2由相应的传声器单兀体现。输入单元IU3由天线和收发器电路体现，其用于接收及(可能)解调表示音频信号的电磁信号，前述音频信号例如由与音频处理装置分开定位的传声器(例如在另一装置中，如在通信装置中，如在移动电话中，或在双耳听音系统如双耳助听器系统的对侧听音装置中)拾取。第四输入单元IU4可以是另一传声器或任何其它输入变换器(如振动感测骨导传声器或加速计)或如上(例如结合图1C)所述的输入信号。音频处理装置包括分析滤波器组A-FB，用于将输入信号I1-14提供为时频表示的信号IF1-1Fp作为备选，假定在输入单元IU1-1U4中发生的模数转换可包括在分析滤波器组A-FB中。图5的音频处理装置还包括结合图2c和图4b、4c所述的归一化滤波器H1-Hp归一化滤波器H1和H2的输出连接到方向单元DIR，其将方向信号X1 (n, k提供为输出。音频处理装置还包括控制单元WNR，用于从来自方向单元DIR(信号
X1(n, k))及源自输入单元IU1-1U4的四个归一化音频信号X2 (n, k) -X5 (n, k)的输入信号提供增强信号Y (n，k)。
[0108]在实施例中，音频处理装置包括确定给定输入信号中(如X1(Ak)-X5(I^k)中的每一个)是否存在预定量的不相关信号分量的检测器(例如体现在控制单元WNR中)。在实施例中，音频处理装置包括风噪声检测器。在实施例中，音频处理装置包括相关检测器并配置成确定在五个信号X1 (n, k) -X5 (n, k)之中选择的两个输入信号之间的互相关。在实施例中，音频处理装置包括自相关检测器并配置成确定在信号X1Oi, k)-X5(n, k)之中选择的信号的自相关。在实施例中，用于使不相关信号分量(如风噪声)最小化的当前方案的启用或禁用(或进攻性)取决于来自一个或多个检测器的控制信号。
[0109]假定为时频表示的所得增强信号Y可在连接到合成滤波器组S-FB以提供时域输出信号OUT之前在随后的信号处理单元(在此未示出)中进行进一步处理。输出信号OF连接到输出单元0U，其可以多种不同的方式体现，例如结合图1c所述的方式。
[0110]本发明的算法配置成通过在给定时间点和给定频率(即给定TF单元)在可用输入信号之中选择具有最低量值的信号而优化输出信号。在给定声环境中的用户(或装置本身)已将方向信号选择为首选信号来听的情形下，例如为使来自用户后面的信号最小化，本算法可通过选择来自全向信号输入的时频单元而改善所选的信号(例如包括改善用户对语音信号的感知)。例如，如果不相关噪声(如风噪声)源主要从方向传声器特性定义的方向到达时(如在用户前面)，即可如此进行。
[0111]图6a-6b示出了根据本发明实施例的第一和第二电输入信号及所得的增强输出信号的时频表示的例子。图6a示出了噪声最小化算法的输入信号X1 (上表)和X2 (中间表)的示例性量值Mag，对于每一时频单元(k，m)，其选择具有最低量值Mag的那一个并将其包括在所得增强信号Y (k，m)中(下表)。每一表示出了对于十二个时间帧Hi1-Hi12，在八个频带krk8中的复合信号的任意单元中的量值Mag的值。上面的表在白背景上示出了第一输入信号X1的量值，而中间的表在灰背景上示出了第二输入信号X2的量值。下面的示出所得增强信号Y的量值Mag (Y (k, m)) =Min (Mag (X1 (k, m)) ; Mag (X2 (k, m))的表通过其背景阴影指明每一量值的来源，白背景表明来源为X1，灰背景表明来源为X2。
[0112]在图6a_6b所示的方案中，所得信号Y的能量(量值)最小化通过使每一 TF单元的量值最小化而实现。作为备选，所得信号Y的最小化可对每一时间帧执行，从而所得信号Y(Hi)从输入信号(在此为X1, X2)进行确定，使得在给定时刻m的能量(正比于SUM( I Xi (k, m) I 2)最小化。这将导致在给定时刻m，选择来自在该时刻具有最低总能量的输入信号的所有时间单位(整个时间帧)。这将导致所得信号Y(m)中在可用输入信号(在此为X1 (m)，X2 (m))的时间帧之中选择的时间帧的组合。
[0113]图6b不出了第一输入信号X1 (k, Iii1)(上面的图)、第二输入信号X2(k, Iii1)(中间的图)和所得增强信号Y(k，Hi1)(下面的图)的特定时间帧(在此为Hi1)的频谱(量值、任意单元)。图6b的曲线反映了在图6a的表的第一列(对应于时刻Hi1冲指示的相应信号的量值。从而说明所得信号Y的时频单元(k，Hi1) (k=l, 2，…，K=8)包括输入信号X1, X2的对应时频单元(k，mi)的量值的最小值。
[0114]图7a_7b分别示出了根据本发明的听力仪器(图7a)和头戴式耳麦(图7b)的实施例。
[0115]图7a示出了听音装置如听力仪器HI形式的音频处理装置。图7a的实施例相当于图5实施例的、包括两个传声器IUp IU2和方向单元DIR的上面部分。图7a的听力仪器HI包括从一对(全向)传声器单元(用于拾取声输入的每一版本)经方向单元DIR和信号处理单元SPU到扬声器单元的正向通路。信号处理单元SPU包括根据本发明的噪声最小化算法，例如以使正向通路的所得增强信号中的风噪声最小化(例如结合图4b和4c所述)。信号处理单元SPU还包括用于在呈现给用户之前增强输入音频信号的其它处理算法。信号处理单元SPU例如包括用于使声输出适应用户的听力受损的算法，包括应用随频率(和输入电平)而变的增益。
[0116]图7b示出了与通信装置ComD无线通信的听音装置如头戴式耳麦HS形式的音频处理装置。头戴式耳麦HS包括(实质上)独立的传声器通路和扬声器通路。扬声器通路(图7b的上面部分)包括无线接收器(包括天线和Rx电路)，用于经无线链路WL从通信装置ComD如移动电话接收音频信号。扬声器通路还包括用于处理无线接收器提取的音频信号的信号处理单兀SPU-SP和用于将处理后的音频信号转换为输出声音“声输出”以由头戴式耳麦的用户感知的扬声器。传声器通路(图7b的下面部分)与图7a的听力仪器的正向通路一样，除了头戴式耳麦HS的输出变换器是用于建立到通信装置ComD的无线链路的无线发射器之外。头戴式耳麦从而(使用扬声器通路和传声器通路)配置成无线建立到通信装置ComD的双向音频链路WL (如电话会话)。
[0117]本发明由独立权利要求的特征限定。从属权利要求限定优选实施例。权利要求中的任何附图标记不意于限定其范围。
[0118]一些优选实施例已经在前面进行了说明，但是应当强调的是，本发明不受这些实施例的限制，而是可以权利要求限定的主题内的其它方式实现。
[0119]参考文献
[0120]EP1448016A1(OTICON) 18.08.2004
[0121]US20120253798A1(B0SE C0RP) 04.10.2012
[0122]GB2453118A(MOTOROLA)01.04.2009
[0123]W02008041730A1(MATSUSHITA) 10.04.2008
[0124]EP1339256A2 (PHONAK) 27.08.2003[0125] EP2463856A1 (OTICON) 13.06.2012
【权利要求】
1 .一种音频处理装置，包括: -多个电输入信号，每一电输入信号按数字化的形式及另外按包括多个频带k和多个时刻m的时频表示提供；及 -接收数字化电输入信号并提供所得增强信号的控制单元，其中所述控制单元配置成根据预定方案从所述数字化电输入信号或源自其的信号确定所得增强信号，其中所述预定方案包括所述增强信号的给定时频窗口(k，m)的内容从包括最小能量的电输入信号的时频窗口(k，m)的内容确定。
2.根据权利要求1所述的音频处理装置，其中所述电输入信号Xi(k, m) (i=l, 2，…，N)中的一个或多个表示来自输入变换器的信号。
3.根据权利要求1所述的音频处理装置，其中所述电输入信号Xi(k, m) (i=l, 2，…，N)中的一个或多个表不全向信号或方向信号。
4.根据权利要求1所述的音频处理装置，其中电输入信号Xi为来自处理算法的输出，所述电输入信号Xi为在已经历处理算法之后得到的信号。
5.根据权利要求1所述的音频处理装置，包括至少三个电输入信号，第一和第二电输入信号来自两个传声器，及第三电输入信号来自提供所述第一和第二电输入信号的加权组合的方向算法。
6.根据权利要求5所述的音频处理装置，其中所述控制单元配置成通过插入来自两个传声器的、具有比方向输入信号的对应信号分量低的能量的信号分量而优化方向信号。
7.根据权利要求1所述的音频处理装置，包括传声器系统，所述传声器系统包括用于将声场转换为相应时变电输入信号的至少两个传声器及至少两个时间到时频转换单元，每一传声器对应一个时间到时频转换单兀，以提供每一电输入信号在多个频带k和多个时刻m的时频表示。
8.根据权利要求1所述的音频处理装置，包括连接到所述电输入信号之一的归一化滤波器，所述归一化滤波器配置成具有传递函数Hn (f)，f为频率，其使得所涉及电输入信号可与其它归一化电输入信号比较和互换。
9.根据权利要求1所述的音频处理装置，其中所述控制单元包括使权重P能应用于至少一电输入信号或源自其的信号的组合单元。
10.根据权利要求9所述的音频处理装置，其中所述权重P取决于频率。
11.根据权利要求10所述的音频处理装置，其中所述控制单元配置成实现:对于输入信号q和j的权重Pq(f)和h(f)的相对大小受分别提供电输入信号q和j的输入变换器相对于当前声场的声源的位置影响。
12.根据权利要求10所述的音频处理装置，其中输入信号的加权因数Pi(f)根据检测器的输出而自适应确定。
13.根据权利要求1所述的音频处理装置，包括风噪声检测器，用于提供在特定时间点存在的风噪声或任何其它不相关噪声量的估计量。
14.根据权利要求1所述的音频处理装置，配置成使得所得增强信号的相位通过在特定时间的信号来源确定。
15.根据权利要求1所述的音频处理装置，配置成使得所得增强信号的相位被合成或平滑以避免时刻间和/或频带间的相位发生大的变化。
16.根据权利要求1所述的音频处理装置，包括提供指示“波动增益”存在的非自然信号度量的非自然信号检测器，其可以是因处理算法引入的非自然信号的来源，及其中所述控制单元配置成在非自然信号度量表明噪声最小化算法产生的非自然信号听得见时忽视预定方案。
17.根据权利要求16所述的音频处理装置，包括两个传声器输入信号及方向输入，其中所述控制单元配置成在所述最小化算法产生的非自然信号听得见时保持所述方向信号。
18.根据权利要求1所述的音频处理装置，包括用于将电信号转换为用户感知为声信号的刺激的输出变换器。
19.根据权利要求1所述的音频处理装置，包括助听器或移动电话。
20.音频处理装置的运行方法，包括: -提供多个电输入信号，每一电输入信号按数字化的形式及另外按包括多个频带k和多个时刻m的时频表不提供； -基于时频表示的数字化电输入信号提供所得增强信号；及 -根据预定方案从所述数字化电输入信号或源自其的信号确定所得增强信号，其中所述预定方案包括所述增强信号的给定时频窗口(k，m)的内容从包括最小能量的电输入信号的时频窗口(k，m) 的内容确定。
【文档编号】H04R3/00GK103986995SQ201410045333
【公开日】2014年8月13日申请日期:2014年2月7日优先权日:2013年2月7日
【发明者】S·菲尔德, T·考尔伯格, T·克瑞斯蒂安森, C·本杰敏森申请人:奥迪康有限公司, 森海塞尔通信公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：S·菲尔德;T·考尔伯格;T·克瑞斯蒂安森;C·本杰敏森
技术所有人：奥迪康有限公司;森海塞尔通信公司
我是此专利的发明人

上一篇：用于发射无线电信号的无线电装置制造方法
上一篇：用于传输无线信号的无线电装置制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。