语音信号的处理方法和装置的制造方法

文档序号：9688756阅读：379来源：国知局

语音信号的处理方法和装置的制造方法
【技术领域】
[0001]本发明涉及语音识别技术领域，尤其涉及一种语音信号的处理方法以及一种语音信号的处理装置。
【背景技术】
[0002]语音识别是指通过机器将人的语音自动转换为相应的文本。近年来，语音识别技术发展较为迅速，特别是深度神经网络被应用到语音识别之后，识别系统的性能得到了大幅度提尚。
[0003]相关技术中，语音识别过程通过对大量纯净语音样本进行训练，得到声学模型和语言模型。训练样本越大，精确度越高，得到的声学模型效果越好，语音识别的准确率也就越尚。
[0004]但随着移动互联网的发展，语音输入方式越来越普遍，语音使用人群也越来越广泛，而且每个用户使用的环境有很大差异，特别是在噪声环境下，比如汽车行驶过程中的车载噪声，在餐厅或者其他人群密集的地方产生的人群噪声等。而现有语音识别的训练缺乏噪声语音样本，同时噪声语音样本与纯净语音样本的声学特征差异很大，因此相关技术中的声学模型在安静环境下的语音识别的准确率很高，而在噪声环境下的语音识别的准确率将大大降低。

【发明内容】

[0005]本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
[0006]为此，本发明的第一个目的在于提出一种语音信号的处理方法，该方法大大提高了在噪声环境下的语音识别的准确性，提升语音识别服务的鲁棒性和语音识别服务的体验。
[0007]本发明的第二个目的在于提出一种语音信号的处理装置。
[0008]为达上述目的，本发明第一方面实施例提出了一种语音信号的处理方法，包括以下步骤:采集噪声样本信号;根据所述噪声样本信号对预存的纯净语音样本信号进行处理，得到具有噪声的噪声语音样本信号;根据所述噪声语音样本信号和所述纯净语音样本信号训练语首t旲型。
[0009]本发明实施例的语音信号的处理方法，根据不同场景的噪声样本和纯净语音样本生成噪声语音样本，并根据噪声语音样本和纯净语音样本训练语音模型，从而能够通过该语音模型将各种噪声环境下的语音信号转换成安静环境下的语音信号，从而大大提高了在噪声环境下的语音识别的准确性，提升语音识别服务的鲁棒性和语音识别服务的体验。
[0010]为达上述目的，本发明第二方面实施例提出了一种语音信号的处理装置，包括:第一采集模块，用于采集噪声样本信号;第一处理模块，用于根据所述噪声样本信号对预存的纯净语音样本信号进行处理，得到具有噪声的噪声语音样本信号;第一训练模块，用于根据所述噪声语音样本信号和所述纯净语音样本信号训练语音模型。
[0011]本发明实施例的语音信号的处理装置，根据不同场景的噪声样本和纯净语音样本生成噪声语音样本，并根据噪声语音样本和纯净语音样本训练语音模型，从而能够通过该语音模型将各种噪声环境下的语音信号转换成安静环境下的语音信号，从而大大提高了在噪声环境下的语音识别的准确性，提升语音识别服务的鲁棒性和语音识别服务的体验。
[0012]本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。
【附图说明】
[0013]本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中:
[0014]图1是本发明一个实施例的语音信号的处理方法的流程图；
[0015]图2是本发明一个具体实施例的语音信号的处理方法的流程图；
[0016]图3是本发明另一个具体实施例的语音信号的处理方法的流程图；
[0017]图4是本发明一个实施例的语音信号的处理装置的结构示意图；
[0018]图5是本发明一个具体实施例的语音信号的处理装置的结构示意图；
[0019]图6是本发明另一个实施例的语音信号的处理装置的结构示意图。
【具体实施方式】
[0020]下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。
[0021 ]此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。
[0022]流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。
[0023]下面参考附图描述根据本发明实施例的语音信号的处理方法和装置。
[0024]一种语音信号的处理方法，包括以下步骤:a、采集噪声样本信号;b、根据噪声样本信号对预存的纯净语音样本信号进行处理，得到具有噪声的噪声语音样本信号；C、根据噪声语音样本信号和纯净语音样本信号训练语音模型。
[0025]图1是本发明一个实施例的语音信号的处理方法的流程图。
[0026]如图1所示，语音信号的处理方法包括以下步骤:
[0027]SlOl，采集噪声样本信号。
[0028]具体地，采集在语音识别过程中可能出现的场景噪声以作为噪声样本信号，其中，场景噪声可以是在多个不同场景下采集得到，例如，采集汽车行驶过程中的车载噪声、采集在餐厅产生的人群噪声、或者采集其他人群密集的地方产生的人群噪声等作为噪声样本信号。进而，采集的噪声样本信号越多，在不同环境下对采集的语音信号进行处理的精确度就越高，语音识别的准确率就越高。
[0029]S102，根据噪声样本信号对预存的纯净语音样本信号进行处理，得到具有噪声的噪声语音样本信号。
[0030]其中，纯净语音样本信号为安静环境下的语音样本信号，即不包含噪声信号的语音信号。也就是说，通过采集的噪声样本信号对安静环境下的语音样本信号进行加噪处理，以得到噪声环境下的语音样本信号，即噪声语音样本信号。
[0031]应当理解的是，对纯净语音样本信号进行加噪处理可以采用现有的处理方法，为了避免冗余，此处不再复赘。
[0032]S103，根据噪声语音样本信号和纯净语音样本信号训练语音模型。
[0033]在本发明的一个实施例中，根据噪声语音样本信号和纯净语音信号训练语音模型还包括:提取噪声语音样本信号和纯净语音样本信号的声学特征，并建立噪声语音样本信号的声学特征与纯净语音样本信号的声学特征的映射关系。
[0034]具体地，可以通过提取噪声语音样本信号和纯净语音样本信号的声学特征，并通过回归神经网络建立噪声语音样本信号的声学特征到纯净语音样本信号的声学特征的映射，以得到语音模型。
[0035]在语音识别过程中，由于语音模型是基于噪声语音样本信号获得，因此能够将噪声环境下的语音信号映射成安静环境下的语音信号，从而准确识别出噪声环境下的语音信号，提高了语音识别

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：时雪煜;李先刚;邹赛赛;
技术所有人：百度在线网络技术（北京）有限公司;
我是此专利的发明人

上一篇：语音信号噪声频谱估计方法、装置及降噪处理方法
上一篇：一种环境自适应的语音混响消除方法和系统的制作方法