语音滤波方法、装置以及电子设备的制作方法

文档序号：2826228研发日期：2013年阅读：201来源：国知局

技术简介：
本专利针对语音识别中用户语音与噪声难以区分的问题，提出基于频谱特征的语音滤波方法。通过提取用户语音的参考频谱特征（如基频谐波阶数和强度），实时分析输入信号频谱并与之比对，根据匹配程度选择语音增益或噪声增益进行动态调整，从而有效增强目标语音信号并抑制噪声干扰，提升语音通信质量。
关键词：语音滤波,频谱特征,噪声抑制

语音滤波方法、装置以及电子设备的制作方法
【专利摘要】本发明实施例提供一种语音滤波方法、装置以及电子设备，该语音滤波方法包括：确定与待分析用户的语音特征对应的参考频谱特征；根据所述参考频谱特征，对输入的声音信号进行滤波。通过本发明的实施例，能够针对不同的待分析用户，利用待分析用户特定的声音特征，强化对该待分析用户的语音传输效果，以达到更为有效的语音信息传输。
【专利说明】语音滤波方法、装置以及电子设备

【技术领域】
[0001]本发明涉及语音处理技术，特别涉及一种语音滤波方法、装置以及电子设备。

【背景技术】
[0002]迄今为止，诸如通信装置以及电子录音笔等电子装置已被广泛使用，其中，这些电子装置通过麦克风采集使用者的语音信号，并将其转换为数字信号以传送和/或记录，并在随后播放。在采集使用者的语音信号时，从周围环境发出的噪音可能会混合到麦克风中，从而阻碍了语音被听见。
[0003]在现有技术中，已经发展出多种滤波技术，这些滤波技术通过降低噪声信号的水平，并保持或提高语音信号的水平，能够提高所采集到的语音信号的质量。在上述滤波技术中，如何有效地识别噪声信号和语音信号成为一个关键问题。
[0004]应该注意，上面对技术背景的介绍只是为了方便对本发明的技术方案进行清楚、完整的说明，并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本发明的【背景技术】部分进行了阐述而认为上述技术方案为本领域技术人员所公知。

【发明内容】

[0005]本发明的发明人在实施现有技术时发现，现有的语音降噪滤波技术中，针对不同的待分析用户(使用者)，采用相同的滤波参数对输入的声音信号进行降噪处理。这种固定滤波参数的降噪处理过程局限于“语音VS噪声”的模型进行降噪处理，未考虑到使用者个体的语音特征，是一种基础的降噪解决方案。
[0006]本发明实施例提供一种语音滤波方法、装置以及电子设备，目的在于针对不同的待分析用户，利用待分析用户特定的声音特征，强化对该个体的语音传输效果，以达到更为有效的个体信息传输。
[0007]根据本发明实施例的一个方面，提供一种语音滤波方法，所述语音滤波方法包括:
[0008]确定与待分析用户的语音特征对应的参考频谱特征；
[0009]根据所述参考频谱特征，对输入的声音信号进行滤波。
[0010]根据本发明实施例的另一个方面，其中，确定与所述待分析用户的语音特征对应的所述参考频谱特征包括:
[0011]获取所述待分析用户的语音信号；
[0012]对所述待分析用户的语音信号进行频谱分析，以得到所述待分析用户的语音信号的参考频谱；
[0013]从所述参考频谱中，提取所述参考频谱特征。
[0014]根据本发明实施例的另一个方面，其中，所述参考频谱特征包括所述参考频谱中相对于基频的主要谐频的阶数，以及所述主要谐频的强度。
[0015]根据本发明实施例的另一个方面，其中，根据所述参考频谱特征，对所述输入的声音信号进行滤波包括:
[0016]分析所述输入的声音信号,确定对应所述输入的声音信号的输入频谱特征；
[0017]将所述输入频谱特征与所述参考频谱特征进行比较；
[0018]选择与所述比较的结果对应的增益；
[0019]根据所述增益，对所述输入的声音信号进行处理。
[0020]根据本发明实施例的另一个方面，其中，选择与所述比较的结果对应的增益包括:
[0021]如果所述输入频谱特征与所述参考频谱特征相同，选择语音增益；
[0022]如果所述输入频谱特征与所述参考频谱特征不同，选择噪声增益。
[0023]根据本发明实施例的另一个方面，其中，根据所述增益，对所述输入的声音信号进行处理包括:
[0024]对所述输入的声音信号进行延迟；
[0025]利用所述增益，对延迟后的所述输入的声音信号的强度进行调整。
[0026]根据本发明实施例的又一个方面，提供一种语音滤波装置，所述语音滤波装置包括:
[0027]第一确定单元，其确定与待分析用户的语音特征对应的参考频谱特征；
[0028]滤波单元，其根据所述参考频谱特征，对输入的声音信号进行滤波。
[0029]根据本发明实施例的又一个方面，其中，所述第一确定单元包括:
[0030]第一语音获取单元，其获取所述待分析用户的语音信号；
[0031]第一语音分析单元，其对所述待分析用户的语音信号进行频谱分析，以得到所述待分析用户的语音信号的参考频谱；
[0032]第一提取单元，其从所述参考频谱中，提取所述参考频谱特征。
[0033]根据本发明实施例的又一个方面，其中，所述滤波单元包括:
[0034]输入频谱确定单兀,其分析所述输入的声音信号，确定对应所述输入的声音信号的输入频谱特征；
[0035]比较单元，其将所述输入频谱特征与所述参考频谱特征进行比较；
[0036]选择单元，选择与所述比较的结果对应的增益；
[0037]处理单元，根据所述增益，对所述输入的声音信号进行处理。
[0038]根据本发明实施例的又一个方面，其中，
[0039]如果所述输入频谱特征与所述参考频谱特征相同，所述选择单元选择语音增益；
[0040]如果所述输入频谱特征与所述参考频谱特征不同，所述选择单元选择噪声增益。
[0041]根据本发明实施例的又一个方面，其中，所述处理单元包括:
[0042]延迟单元，其对所述输入的声音信号进行延迟；
[0043]调整单元，其利用所述增益，对延迟后的所述输入的声音信号的强度进行调整。
[0044]根据本发明实施例的再一个方面，提供一种电子设备，所述电子设备包括如前所述语音滤波装置。
[0045]本发明实施例的有益效果在于，针对不同的待分析用户，利用待分析用户特定的声音特征，强化对该待分析用户的语音传输效果，以达到更为有效的语音信息传输。。
[0046]参照下面的描述和附图，将清楚本发明的这些和其他方面。在这些描述和附图中，具体公开了本发明的特定实施方式，来表示实施本发明的原理的一些方式，但是应当理解，本发明的范围不受此限制。相反，本发明包括落入所附权利要求书的精神和内涵范围内的所有变化、修改和等同物。
[0047]针对一个实施方式描述和/或例示的特征，可以在一个或更多个其它实施方式中以相同方式或以类似方式使用，和/或与其他实施方式的特征相结合或代替其他实施方式的特征使用。
[0048]应当强调的是，术语“包括”当在本说明书中使用时用来指所述特征、要件、步骤或组成部分的存在，但不排除一个或更多个其它特征、要件、步骤、组成部分或它们的组合的存在或增加。
[0049]参照以下附图，将更好地理解本发明的许多方面。附图中的组成部分不一定按比例绘制，重点在于清楚地例示出本发明的原理。为了便于例示和描述本发明的一些部分，可以将附图中的对应部分在尺寸上放大，例如，放大得相对于其他部分比在根据本发明实际制成的示例性设备中的要大。在本发明的一个图或实施方式中示出的部件和特征可以与一个或更多个其它图或实施方式中示出的部件和特征相结合。此外，在附图中，相同的标号在全部图中都标示对应的部分，并且可以用来标示一个以上实施方式中的相同或类似部分。

【专利附图】

【附图说明】
[0050]所包括的附图用来提供对本发明的进一步的理解，其构成了说明书的一部分，例示了本发明的优选实施方式，并与文字说明一起用来解释本发明的原理，其中对于相同的要素，始终用相同的附图标记来表示。
[0051]在附图中:
[0052]图1是本发明实施例1的语音滤波方法的一个流程示意图；
[0053]图2是语音信号的频谱分析图；
[0054]图3是不同个体的语音频谱分析图；
[0055]图4是本发明实施例1的确定参考频谱特征的方法流程图；
[0056]图5是本发明实施例中对输入的声音信号进行滤波的方法流程示意图；
[0057]图6是本发明实施例2的语音滤波装置的一个构成示意图；
[0058]图7是本发明实施例2的第一确定单元的一个结构示意图；
[0059]图8是本发明实施例2的滤波单元的一个结构示意图；
[0060]图9是本发明实施例的电子设备1000的系统构成的一示意框图。

【具体实施方式】
[0061]下面将结合附图对本发明的各种实施方式进行说明。这些实施方式只是示例性的，不是对本发明的限制。
[0062]实施例1
[0063]本发明实施例1提供一种语音滤波方法。图1是本发明实施例1的语音滤波方法的一个流程示意图，如图1所示，该语音滤波方法包括:
[0064]步骤101，确定与待分析用户的语音特征对应的参考频谱特征；
[0065]步骤102，根据该参考频谱特征，对输入的声音信号进行滤波。
[0066]用来描述声音的参数有很多,例如声音的音调、声音的响度、声音的音色等,这些参数从不同的方面反映了声音的特征。在上述参数中，音色最能反映发声体的差异，根据不同的音色，即使在同一音调和同一声音的响度的情况下，也能区分出是不同物体或不同的发声者发出的声音。人所发出的语音的音色，与周围环境的噪声的音色不相同，并且，不同的人发出的语音的音色也不相同。
[0067]图2是语音信号的频谱分析图。如图2所示，横轴表示频率，纵轴表示强度。其中，FO为语音信号的基频，FU F2、F3、……Fn为第N阶谐波频率(即谐频)，η为谐频的阶数，即，谐频共有η阶；在图2中，每一阶谐频所对应的波峰的频率与强度大小的配比关系与发声体的物理结构(例如，人的声带口腔以及喉部特征)有关，因此，发生者的个体物理差异是导致每个人的音色区别的基本原因。
[0068]从频谱分析的角度来看，不同个体间音色的区别主要体现在语音的谐频能量分布的差异上。图3是不同个体的语音的频谱分析图。在图3中，实线曲线和虚线曲线代表不同个体的语音的频谱分布。图3 (a)是具有相同基频的不同个体的语音的频谱分布图，从图3 (a)可以看出，即使两个个体的语音信号的基频相同，其谐频分量成分组成(例如谐频的阶数、各谐频的频率和强度等)也是不相同的。图3 (b)是具有不同基频的个体的语音的频谱分布图，如图3 (b)所示，不同个体的语音在表达同一个字或词时，不仅基频不同，并且主要谐频的阶数以及各主要谐频的频率和强度(反映了谐频的能量)也是不同的，从而决定了不同个体语音音色的差别。通过识别特定个体语音的主要谐频的阶数以及主要谐频的强度等参数，能够对该特定个体的语音进行识别。
[0069]本发明的实施例1正是基于特定个体的语音具有特定的音色，从而能够准确地识别该特定个体的语音这一原理做出的。值得注意的是，以上是以将音色作为语音特征为例对本发明进行了示意性说明，但是本发明不限于此。例如，如果其他的语音特征能够反映个体之间语音的差别，也适用于本发明的方法或装置。
[0070]在本实施例的步骤101中，进行音色特征的提取，即，获取与待分析用户的语音特征对应的参考频谱特征。其中，该参考频谱特征能够用来表征该待分析用户的语音特征。根据上述的说明可知，在将音色作为该待分析用户的语音特征时，该参考频谱特征可以是最能体现用户音色的参数，例如，可以是语音的谐频分量成分组成。在一个具体的实施方式中，语音的谐频分量成分组成可以是语音中相对于基频的主要谐频的阶数以及主要谐频的强度等参数。在具体实施例中，各主要谐频的强度可以表示为各主要谐频与基频的声压比例。
[0071]需要说明的是，可以根据多种方式确定主要谐频。在本实施例中，可以根据频谱分析图中波峰的半峰宽来确定主要谐频，例如，可以将半峰宽大于或等于特定阈值的波峰确定为主要谐频对应的波峰；如果半峰宽小于该特定阈值，那么该波峰可以被认为是非主要谐频对应的波峰。在具体实施时，该半峰宽的特定阈值可以根据用户和产品的要求来设定。
[0072]在其它的实施例中，如果使用音色之外的别的语音特征，那么该参考频谱特征也可以包括其它的参数。
[0073]另外，在本实施例的步骤101中，可以对待分析用户的语音信号进行实时分析，从而确定与待分析用户的语音特征对应的参考频谱特征；或者，可以提前预存待分析用户与参考频谱特征的对应关系列表，通过查表的方式确定与待分析用户的语音特征对应的参考频谱特征。具体将在以下的实施方式中进行进一步说明。
[0074]在本实施例的步骤102中，进行特征性信号滤波，即，根据参考频谱特征来识别输入的声音信号是期望的语音信号还是噪声信号，并根据识别结果，对期望的语音信号或噪声信号进行不同的处理，例如，如果识别结果为期望的语音信号，则可以提高其强度，如果识别结果为噪声信号，则可以降低其强度，等等。由此，可以对输入的声音信号进行实时滤波。
[0075]图4是本发明实施例1的步骤101确定参考频谱特征的一个实施方式的方法流程图，如图4所示，确定参考频谱特征的方法包括:
[0076]步骤401，获取待分析用户的语音信号；
[0077]步骤402，对该待分析用户的语音信号进行频谱分析，以得到所述待分析用户的语音信号的参考频谱；
[0078]步骤403，从参考频谱中提取所述参考频谱特征。
[0079]在本发明实施例中，可以根据来自用户界面的指示信号，开启“训练模式”，在“训练模式下”，可以通过上述步骤401-步骤403获取该参考频谱特征。
[0080]在本实施例的步骤401中，可以采用现有技术中的多种方式获取待分析用户的语音信号，例如，可以通过麦克风等语音采集设备直接采集该待分析用户的语音信号，并且，可以通过来自用户界面的指示信号设定采集的时间长度，从而控制采集过程的开始和结束；此外，也可以从存储设备中获取预先存储的该待分析用户的语音信号。需要注意的是，该语音信号应当尽可能少地包含外部环境的噪音，这样，能够对该待分析用户的语音特征进行更为准确地分析。
[0081]在本实施例的步骤402中，对所获取的该待分析用户的语音信号进行频谱分析，以得到该待分析用户的语音信号的参考频谱。
[0082]在一个具体的实施方式中，可以对该待分析用户的语音信号进行快速傅里叶变换(Fast Fourier Transform, FFT),从而将时域中的语音信号转换到频域,获得该语音信号的频谱，即参考频谱。关于快速傅里叶变换的具体实现方式，可以参考现有技术，本发明实施例不再赘述。
[0083]在本实施例的步骤403中，从该参考频谱中提取参考频谱特征。由于该参考频谱反映了该待分析用户的语音信号中不同频率信号的强度分布，因此，能够从该参考频谱中提取部分特征来反映该待分析用户的语音特征。
[0084]在具体实施时，所提取的参考频谱特征可以是相对于基频的主要谐频的阶数以及各主要谐频的强度。其中，该主要谐频可以位于可听域内，并且，可以参考人耳的听觉掩蔽曲线来确定该主要谐频。此外，该主要谐频可以有多个。在一个【具体实施方式】中，各主要谐频的强度可以表示为各主要谐频与基频的声压比例。对于所提取的上述参考频谱特征，可以以列表的形式进行存储，从而便于后续的滤波操作。
[0085]需要说明的是，可以针对一个语音信号，实施上述步骤401-步骤403，从而确定一个参考频谱特征的列表；也可以获取该待分析用户的多个语音信号，对这多个语音信号都分别实施上述步骤401-步骤403，从而获得多个参考频谱特征的列表，进而，对该多个参考频谱特征的列表进行统计化处理，得到平均化参考频谱特征的列表，一个较大量的统计得出的参考频谱特征能够更为准确地反映该待分析用户的语音特征。
[0086]在步骤101确定参考频谱特征的另外一个实施方式中，还可以对多个待分析用户对应的参考频谱特征进行预先存储，这样，通过选择待分析用户，就能够直接获取与该待分析用户的语音特征对应的参考频谱特征，而无需对该用户的语音信号进行实时分析。
[0087]以上两种实施方式只是对确定参考频谱特征的举例，本发明实施例并不以此作为限制，任何确定对应待分析用户的参考频谱特征的方案都包含于本发明实施例的保护范围。在得到了与待分析用户的语音特征对应的参考频谱特征之后，在步骤102中，可以根据该参考频谱特征，对输入的声音信号进行滤波。
[0088]图5是本发明实施例的步骤102对输入的声音信号进行滤波的一个实施方式的方法流程图，如图5所示，对输入的声音信号进行滤波的方法包括:
[0089]步骤501，分析所述输入的声音信号，确定对应所述输入的声音信号的输入频谱特征；
[0090]步骤502，将输入频谱特征与参考频谱特征进行比较；
[0091]步骤503，选择与比较的结果对应的增益；
[0092]步骤504，根据所述增益，对所述输入的声音信号进行处理。
[0093]在本发明实施例中，输入的声音信号中不仅包括来自该待分析用户的语音信号，也夹杂着来自周围环境的噪音信号。经过对输入的声音信号进行滤波，可以提高语音信号的强度和/或降低噪音信号的强度，从而提高信噪比。
[0094]在本发明实施例中，可以根据来自用户界面的指示信号，开启“使能模式”，在“使能模式下”，可以通过上述步骤501-步骤504对输入的声音信号进行滤波。
[0095]在上述步骤501中,可以采用多种方法来确定与输入的声音信号对应的输入频谱特征，例如，可以采用与步骤402-步骤403类似的方法，即:可以采用快速傅里叶变换对该输入的声音信号进行频谱分析，以得到该输入的声音信号的频谱，即输入频谱；随后，从该输入频谱中提取出输入频谱特征，该输入频谱特征也可以是相对于基频的主要谐频的阶数以及各主要谐频的强度，另外，该输入频谱特征也可以被设置为列表的形式。
[0096]需要说明的是，并不是总能从该输入频谱中提取出所需的输入频谱特征，例如，当输入的声音信号中噪音信号淹没了用户的语音信号，就无法从输入频谱中识别主要谐频，从而无法提取主要谐频的阶数以及主要谐频与基频的声压比例等参数，在这种情况下，可以在列表中为主要谐频的阶数以及主要谐频与基频的声压比例等参数赋一个特定的值，以表示该参数无法提取。在这种情况下，可以不对声音信号进行特殊增益处理，输入的声音信号将以一个比较低的量值向后继系统传输。
[0097]在本发明的实施例中，由于输入频谱特征和参考频谱特征都采用相同的参数来表征，因此，通过对相同参数的值进行比较，能够识别输入的声音信号中所包含的该待分析用户的语音信号。
[0098]在本实施例的步骤502中，对输入频谱特征和参考频谱特征进行比较。
[0099]在具体实施时，可以对输入频谱和参考频谱中主要谐频的阶数进行比较，得到第一比较值，对输入频谱和参考频谱中各主要谐频的强度进行比较，得到第二比较值；在第一比较值处于预设的第一范围和/或第二比较值处于预设的第二范围时，可以确定为输入频谱特征和参考频谱特征相同，否则，可以确定为输入频谱特征和参考频谱特征不同。
[0100]在本实施例中，由于输入频谱特征反映了输入的声音信号的音色，而参考频谱特征反映了该待分析用户的语音的音色，因此，当输入频谱特征和参考频谱特征相同时，可以认为输入的声音信号的音色与该待分析用户的语音的音色相同，也就是说，该输入的声音信号可以被认为是由该待分析用户发出的语音信号；反之，当输入频谱特征和参考频谱特征不相同时，可以认为该输入的声音信号并不是来自该待分析用户的语音信号，从而认为该输入的声音信号为噪音信号。
[0101]在本实施例的步骤503中，根据对输入频谱特征和参考频谱特征的比较结果，选择与该比较结果对应的增益。
[0102]在本实施例中，如果该比较结果为输入频谱特征和参考频谱特征相同，可以认为该输入的声音信号是来自该待分析用户的语音信号，因此，可以选择语音增益，该语音增益能够用于对该输入的声音信号的强度进行放大处理。
[0103]在具体实施时，可以根据用户和产品的要求，设置该语音增益的具体值；另外，也可以根据该输入的声音信号的强度，动态地调整该语音增益的具体值，例如，当输入的声音信号的强度较大时，可以适当减小该语音增益，而当输入的声音信号的强度较小时，可以适当增加该语音增益，由此，能够使得经过语音增益处理后的声音信号的强度平稳，不会使用户感觉到声音忽大忽小。
[0104]此外，在本实施例中，如果该比较结果为输入频谱特征和参考频谱特征不相同，那么可以认为该输入的声音信号是噪声信号，因此，可以选择噪声增益，该噪声增益能够用于对该噪声信号的强度进行缩小处理，从而降低该噪声信号的音量。
[0105]在具体实施时，同样可以根据用户和产品的要求，设置该噪声增益的具体值。
[0106]在本实施例的步骤504中，根据所选择的语音增益或者噪声增益，对输入的声音信号进行相应处理。
[0107]在具体实施时，假设实施步骤501-步骤503所需的时间为t，那么，对于时刻T输入的声音信号而言，需要延迟时间t才能得到对应的增益。因此，在本实施例中，可以对该输入的声音信号进行延迟处理，以等待对比步骤和增益选择步骤的完成，并根据所选择的增益对延迟处理后的声音信号的强度进行放大或缩小处理。
[0108]在具体实施时，同样可以根据用户和产品的要求，设置对声音信号进行延迟处理后的延迟时间。
[0109]对延迟处理后的声音信号的强度进行调整，可以是根据增益来调整声音信号的音量，例如根据语音增益来放大语音信号的音量，或者根据噪声增益来缩小噪声信号的音量。需要说明的是，本发明对声音信号的处理并不限于调整音量的大小，可以根据增益对语音信号或噪声信号进行其它的处理。
[0110]由上述实施例可知，针对不同的待分析用户，利用待分析用户特定的声音特征，强化对该待分析用户的语音传输效果，以达到更为有效的语音信息传输。
[0111]实施例2
[0112]本发明实施例2提供一种语音滤波装置，对应于实施例1所述的语音滤波方法，与实施例1相同的内容不再赘述。
[0113]图6是本发明实施例2的语音滤波装置的一个构成示意图，如图6所示，该语音滤波装置600包括:
[0114]第一确定单元601，其确定与待分析用户的语音特征对应的参考频谱特征；
[0115]滤波单元602，其根据所述参考频谱特征，对输入的声音信号进行滤波。
[0116]本实施例中各单元的具体工作方式请参考实施例1中相应步骤的具体工作方式，此处不再赘述。值得注意的是，该语音滤波装置600仅示出了与本发明实施例相关的部分构成部分，对于语音滤波装置的其他部分没有示出，可以参考现有技术。
[0117]图7是本发明实施例2的第一确定单元的一个结构示意图。如图7所示，在本发明的实施例2中，第一确定单元601可以包括:
[0118]第一语音获取单元701，其获取该待分析用户的语音信号；
[0119]第一语音分析单元702，其对待分析用户的语音信号进行频谱分析，以得到该待分析用户的语音信号的参考频谱；
[0120]第一提取单元703，其从该参考频谱中，提取参考频谱特征。
[0121]本实施例中，第一确定单元601的各部分的具体工作方式可参考实施例1中相应步骤的具体工作方式，此处不再赘述；此外，当第一确定单元601可以设置存储单元和选取单元，其中，该存储装置将待分析用户及其对应的参考频谱特征进行预先存储，该选取单元通过选择待分析用户从而确定对应的参考频谱特征。
[0122]图8是本发明实施例2的滤波单元的一个结构示意图。如图8所示，在本发明的实施例2中，滤波单元602可以包括:
[0123]输入频谱确定单兀801,其分析所述输入的声音信号,确定对应所述输入的声音信号的输入频谱特征；
[0124]比较单元802，其将输入频谱特征与参考频谱特征进行比较；
[0125]选择单元803，选择与上述比较的结果对应的增益；
[0126]处理单元804，根据增益，对所述输入的声音信号进行处理。
[0127]本实施例中，滤波单元602的各部分的具体工作方式可参考实施例1中相应步骤的具体工作方式，此处不再赘述。
[0128]在一个【具体实施方式】中，输入频谱确定单元801可以包括:
[0129]第二语音分析单元8011，其对输入的声音信号进行频谱分析，以得到该输入的声音信号的输入频谱；
[0130]第二提取单元8012，其从该输入频谱中，提取输入频谱特征。
[0131]关于输入频谱确定单元801各单元的具体工作方式，可以参考实施例1中步骤501的具体工作方式，此处不再赘述。
[0132]此外，在本实施例中，处理单元804可以包括:
[0133]延迟单元8041，其对输入的声音信号进行延迟处理；
[0134]调整单元8042，其利用所述增益，对延迟处理后的输入的声音信号的强度进行调難
iF.0
[0135]关于处理单元804各单元的具体工作方式，可以参考实施例1中步骤504的具体工作方式，此处不再赘述。
[0136]由上述实施例可知，本发明实施例2提供的语音滤波装置能够针对不同的待分析用户，利用待分析用户特定的声音特征，强化对该待分析用户的语音传输效果，以达到更为有效的语音信息传输。
[0137]实施例3
[0138]本发明实施例还提供一种电子设备，该电子设备包括如实施例2所述的语音滤波
>J-U ρ?α装直。
[0139]图9是本发明实施例的电子设备1000的系统构成的一示意框图，其中包括了音频处理器130，该音频处理器130中包括本发明实施例2的语音滤波装置600。值得注意的是，该图是示例性的；还可以使用其他类型的结构，来补充或代替该结构，以实现电信功能或其他功能。
[0140]如图9所示，该电子设备1000还可以包括中央处理器100、通信模块110、输入单元120、图像处理装置200、存储器140、照相机150、显示器160、电源170。
[0141]该中央处理器100(有时也称为控制器或操作控件，可以包括微处理器或其他处理器装置和/或逻辑装置)接收输入并控制电子设备1000的各个部分和操作。输入单元120向中央处理器100提供输入。该输入单元120例如为按键或触摸输入装置。照相机150用于摄取图像数据，并将摄取的图像数据提供给中央处理器100，以按常规方式使用，例如，进行存储、传送等。
[0142]电源170用于向电子设备1000提供电力。显示器160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。
[0143]存储器140耦合到中央处理器100。该存储器140可以是固态存储器，例如，只读存储器(ROM)、随机存取存储器(RAM)、SM卡等。还可以是这样的存储器，其即使在断电时也保存信息，可被选择性地擦除且设有更多数据，该存储器的示例有时被称为EPROM等。存储器140还可以是某种其它类型的装置。存储器140包括缓冲存储器141 (有时被称为缓冲器)。存储器140可以包括应用/功能存储部142，该应用/功能存储部142用于存储应用程序和功能程序或用于通过中央处理器100执行电子设备1000的操作的流程。
[0144]存储器140还可以包括数据存储部143，该数据存储部143用于存储数据，例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器140的驱动程序存储部144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
[0145]通信模块110即为经由天线111发送和接收信号的发送机/接收机110。通信模块(发送机/接收机)110耦合到中央处理器100，以提供输入信号和接收输出信号，这可以和常规移动通信终端的情况相同。
[0146]基于不同的通信技术，在同一电子设备中，可以设置有多个通信模块110，如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)110还经由音频处理器130耦合到扬声器131，以经由扬声器131提供音频输出。音频处理器130除了具备语音滤波装置600之外，还可以包括任何合适的缓冲器、解码器、放大器等。
[0147]本发明实施例还提供一种计算机可读程序，其中当在电子设备中执行所述程序时，所述程序使得计算机在所述电子设备中执行如上面实施例1所述的语音滤波方法。
[0148]本发明实施例还提供一种存储有计算机可读程序的存储介质，其中所述计算机可读程序使得计算机在电子设备中执行上面实施例1所述的语音滤波方法。
[0149]以上参照附图描述了本发明的优选实施方式。这些实施方式的许多特征和优点根据该详细的说明书是清楚的，因此所附权利要求旨在覆盖这些实施方式的落入其真实精神和范围内的所有这些特征和优点。此外，由于本领域的技术人员容易想到很多修改和改变，因此不是要将本发明的实施方式限于所例示和描述的精确结构和操作，而是可以涵盖落入其范围内的所有合适修改和等同物。
[0150] 应当理解，本发明的各部分可以用硬件、软件、固件或者它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可以用本领域共知的下列技术中的任一项或者他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。
[0151 ] 流程图中或在此以其它方式描述的任何过程或方法描述或框可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程中的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中，可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或者按相反的顺序，来执行功能，这应被本发明所述【技术领域】的技术人员所理解。
[0152]在流程图中表示或者在此以其它方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。
[0153]上述文字说明和附图示出了本发明的各种不同的特征。应当理解，本领域普通技术人员可以准备合适的计算机代码来实现上面描述且在附图中例示的各个步骤和过程。还应当理解，上面描述的各种终端、计算机、服务器、网络等可以是任何类型的，并且可以根据公开内容来准备所述计算机代码以利用所述装置实现本发明。
[0154]在此公开了本发明的特定实施方式。本领域的普通技术人员将容易地认识到，本发明在其他环境下具有其他应用。实际上，还存在许多实施方式和实现。所附权利要求绝非为了将本发明的范围限制为上述【具体实施方式】。另外，任意对于“用于……的装置”的引用都是为了描绘要素和权利要求的装置加功能的阐释，而任意未具体使用“用于……的装置”的引用的要素都不希望被理解为装置加功能的元件，即使该权利要求包括了 “装置”的用词。
[0155]尽管已经针对特定优选实施方式或多个实施方式示出并描述了本发明，但是显然，本领域技术人员在阅读和理解说明书和附图时可以想到等同的修改例和变型例。尤其是对于由上述要素(部件、组件、装置、组成等)执行的各种功能，除非另外指出，希望用于描述这些要素的术语(包括“装置”的引用)对应于执行所述要素的具体功能的任意要素(即，功能等效)，即使该要素在结构上不同于在本发明的所例示的示例性实施方式或多个实施方式中执行该功能的公开结构。另外，尽管以上已经针对几个例示的实施方式中的仅一个或更多个描述了本发明的具体特征，但是可以根据需要以及从对任意给定或具体应用有利的方面考虑，将这种特征与其他实施方式的一个或更多个其他特征相结合。
【权利要求】
1.一种语音滤波方法，其特征在于，所述语音滤波方法包括:确定与待分析用户的语音特征对应的参考频谱特征；根据所述参考频谱特征，对输入的声音信号进行滤波。
2.如权利要求1所述的语音滤波方法，其中，确定与所述待分析用户的语音特征对应的所述参考频谱特征包括:获取所述待分析用户的语音信号；对所述待分析用户的语音信号进行频谱分析，以得到所述待分析用户的语音信号的参考频谱；从所述参考频谱中，提取所述参考频谱特征。
3.如权利要求2所述的语音滤波方法，其中，所述参考频谱特征包括所述参考频谱中相对于基频的主要谐频的阶数，以及所述主要谐频的强度。
4.如权利要求1所述的语音滤波方法，其中，根据所述参考频谱特征，对所述输入的声音信号进行滤波包括:分析所述输入的声音信号，确定对应所述输入的声音信号的输入频谱特征；将所述输入频谱特征与所述参考频谱特征进行比较；选择与所述比较的结果对应的增益；根据所述增益，对所述输入的声音信号进行处理。
5.如权利要求4所述的语音滤波方法，其中，选择与所述比较的结果对应的增益包括:如果所述输入频谱特征与所述参考频谱特征相同，选择语音增益；如果所述输入频谱特征与所述参考频谱特征不同，选择噪声增益。
6.如权利要求4所述的语音滤波方法，其中，根据所述增益，对所述输入的声音信号进行处理包括:对所述输入的声音信号进行延迟；利用所述增益，对延迟后的所述输入的声音信号的强度进行调整。
7.一种语音滤波装置，其特征在于，所述语音滤波装置包括:第一确定单元，其确定与待分析用户的语音特征对应的参考频谱特征；滤波单元，其根据所述参考频谱特征，对输入的声音信号进行滤波。
8.如权利要求7所述的语音滤波装置，其中，所述第一确定单元包括:第一语音获取单元，其获取所述待分析用户的语音信号；第一语音分析单元，其对所述待分析用户的语音信号进行频谱分析，以得到所述待分析用户的语音信号的参考频谱；第一提取单元，其从所述参考频谱中，提取所述参考频谱特征。
9.如权利要求7所述的语音滤波装置，其中，所述滤波单元包括:输入频谱确定单元，其分析所述输入的声音信号，确定对应所述输入的声音信号的输入频谱特征；比较单元，其将所述输入频谱特征与所述参考频谱特征进行比较；选择单元，选择与所述比较的结果对应的增益；处理单元，根据所述增益，对所述输入的声音信号进行处理。
10.如权利要求9所述的语音滤波装置，其中，如果所述输入频谱特征与所述参考频谱特征相同，所述选择单元选择语音增益；如果所述输入频谱特征与所述参考频谱特征不同，所述选择单元选择噪声增益。
11.如权利要求9所述的语音滤波装置，其中，所述处理单元包括:延迟单元，其对所述输入的声音信号进行延迟处理；调整单元，其利用所述增益，对延迟处理后的所述输入的声音信号的强度进行调整。
12.一种电子设备，所述电子设备包括如权利要求7至11任一项所述的语音滤波装置。
【文档编号】G10L21/0208GK104464746SQ201310414740
【公开日】2015年3月25日申请日期:2013年9月12日优先权日:2013年9月12日
【发明者】王孟川申请人:索尼公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王孟川;
技术所有人：索尼公司;
我是此专利的发明人

上一篇：消声箱的制作方法
下一篇：用于融合多个语音识别系统的识别结果的方法及系统的制作方法

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！