一种基于声纹识别的音频处理方法及系统的制作方法

文档序号：9688754阅读：1694来源：国知局

一种基于声纹识别的音频处理方法及系统的制作方法
【技术领域】
[0001]本发明涉及音频处理技术领域，尤其涉及一种基于声纹识别的音频处理方法及系统。
【背景技术】
[0002]随着社交类软件越来越普及，语音输入也越来越多，成为人们最有效最方便的输入方式。而且现有技术中，在语音输入的同时，却缺少个性化，也无法根据个人的声纹数据进行识别，从而针对不同的声音进行不同的处理。尤其是一些唱K类软件，有些人唱歌时五音不全，因此在获取最终的录音效果时，需要对声音根据个人声音特色进行处理。但现有的音频处理是无法根据个人声音特色进行处理，从而在所有的音频输出文件中的输出的音频都不具有一致性。
[0003]因此，现有技术还有待于改进和发展。

【发明内容】

[0004]鉴于现有技术的不足，本发明目的在于提供一种基于声纹识别的音频处理方法及系统，旨在解决现有技术中在语音输入的同时，却缺少个性化，也无法根据个人的声纹数据进行识别，从而针对不同的声音进行不同的处理的缺陷。
[0005]本发明的技术方案如下:
一种基于声纹识别的音频处理方法，其中，方法包括:
A、当检测到有原始音频输入时，接收用户指令判断是否进行原始音频处理；
B、若进行原始音频处理，则获取用户输入的原始音频的声纹数据并识别，根据声纹数据对原始音频进行处理。
[0006]所述的基于声纹识别的音频处理方法，其中，所述步骤B具体包括:
B1、当进行原始音频处理时，获取用户的输入的原始音频的声纹数据并判断数据库中是否存在与原始音频匹配的调整参数；
B2、若存在，则根据数据库中的调整参数对用户的输入的音频进行处理，合成处理后的目标首频；
B3、若不存在，对原始音频进行处理，并将用户输入的原始音频的声纹数据及处理的参数存储在数据库中，合成处理后的目标音频。
[0007]所述的基于声纹识别的音频处理方法，其中，所述步骤B3具体包括:
B31、当检测到数据库中不存在与原始音频匹配的调整参数，根据预设的模板或者接收用户输入自行调整音频参数对原始音频进行处理；
B32、将预设的模板或接收用户输入自行调整音频参数作为对应的原始音频的调整参数与用户输入的原始音频的声纹数据进行绑定；
B33、存储用户输入的原始音频的声纹数据及对应的原始音频调整参数。
[0008]所述的基于声纹识别的音频处理方法，其中，所述方法还包括: C、若不进行原始音频处理，则直接进行原始音频录入。
[0009]上述任一项所述的基于声纹识别的音频处理方法，其特征在于，所述步骤B中获取用户的输入的原始音频的声纹数据具体包括:
B10、采集用户输入的原始音频，对原始音频进行采样、量化、预加重、加窗处理；
B20、对处理后的原始音频提取语音特征参数，获取到原始音频的声纹数据。
[0010]一种基于声纹识别的音频处理系统，其中，所述系统包括:
检测与判断模块，用于当检测到有原始音频输入时，接收用户指令判断是否进行原始音频处理；
识别与处理模块，用于若进行原始音频处理，则获取用户输入的原始音频的声纹数据并识别，根据声纹数据对原始音频进行处理。
[0011]所述的基于声纹识别的音频处理系统，其中，所述识别与处理模块具体包括:
判断单元，用于当进行原始音频处理时，获取用户的输入的原始音频的声纹数据并判断数据库中是否存在与原始音频匹配的调整参数；
第一音频处理单元，用于若存在，则根据数据库中的调整参数对用户的输入的音频进行处理，合成处理后的目标音频；
第二音频处理单元，用于若不存在，对原始音频进行处理，并将用户输入的原始音频的声纹数据及处理的参数存储在数据库中，合成处理后的目标音频。
[0012]所述的基于声纹识别的音频处理系统，其中，所述第二音频处理单元具体包括:
检测与处理单元，用于当检测到数据库中不存在与原始音频匹配的调整参数，根据预设的模板或者接收用户输入自行调整音频参数对原始音频进行处理；
绑定单元，用于将预设的模板或接收用户输入自行调整音频参数作为对应的原始音频的调整参数与用户输入的原始音频的声纹数据进行绑定；
存储单元，用于存储用户输入的原始音频的声纹数据及对应的原始音频调整参数。
[0013]所述的基于声纹识别的音频处理系统，其中，所述系统还包括:
录入单元，用于若不进行原始音频处理，则直接进行原始音频录入。
[0014]上述任一项所述的基于声纹识别的音频处理系统，其中，所述识别与处理模块还包括:
音频预处理单元，用于采集用户输入的原始音频，对原始音频进行采样、量化、预加重、加窗处理；
提取与获取单元，用于对处理后的原始音频提取语音特征参数，获取到原始音频的声纹数据。
[0015]本发明提供了一种基于声纹识别的音频处理方法及系统，本发明可根据声纹识另IJ，可有针对性的对用户进行美化，美化处理后的声音识别性强，而且保证每次美化后的声音具有一致性，实现了针对个人的声音的美化。
【附图说明】
[0016]图1为本发明的一种基于声纹识别的音频处理方法的较佳实施例的流程图。
[0017]图2是本发明的一种基于声纹识别的音频处理方法的具体应用实施例的流程图。
[0018]图3为本发明的一种基于声纹识别的音频处理系统的较佳实施例的功能原理框图。
【具体实施方式】
[0019]为使本发明的目的、技术方案及效果更加清楚、明确，以下对本发明进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。
[0020]本发明提供了一种基于声纹识别的音频处理方法的较佳实施例的流程图，如图1所示，所述方法包括:
步骤S100、当检测到有原始音频输入时，接收用户指令判断是否进行原始音频处理。
[0021]具体实施时，用户可通过语音输入的方式，输入自己的原始声音，记为原始音频。用户一般通过移动终端进行输入，移动终端包括但不限于手机、平板电脑等智能终端。用户可自由选择是否进行对原始音频进行处理。
[0022]步骤S200、若进行原始音频处理，则获取用户输入的原始音频的声纹数据并识别，根据声纹数据对原始音频进行处理。
[0023]具体实施时，当用户选择对原始音频处理，移动终端例如手机获取用户的输入的原始音频，对原始音频提取声纹数据，利用声纹数据原始音频进行处理，获取合成后的声
■~>V.曰ο
[0024]进一步的实施例中，所述步骤S200之后还包括:
步骤S300、若不进行原始音频处理，则直接进行原始音频录入。
[0025]具体实施时，若用户选择不处理音频，则直接获取原始录音并存储。
[0026]具体实施时，获取用户的输入的原始音频的声纹数据具体包括:
步骤S210、采集用户输入的原始音频，对原始音频进行采样、量化、预加重、加窗处理；步骤S220、对处理后的原始音频提取语音特征参数，获取到原始音频的声纹数据。
[0027]具体实施时，声纹采集，即采集待测声音文件；利用外接话筒进行录音，得到待测声音文件，实现声纹的采集；对待测声音文件进行语音预处理；对通过外接话筒录音所获得的待测声音文件进行预处理，实现对声纹的预处理；预处理包括采样、量化、预加重、加窗等处理过程，以实现语音特征的提取功能；对待测声音文件进行特征参数的提取；对待测声音文件进行分析处理，提取声音文件的语音特征参数；建立声纹数据库；待测声音文件按照其语音特征参数进行分类，并将待测声音文件根据其不同类别保存于数据库中，形成声纹数据库。
[0028]进一步的实施例中，步骤S200具体包括:
步骤S201、当进行原始音频处理时，获取用户的输入的原始音频的声纹数据并判断数据库中是否存在与原始音频匹配的调整参数；
步骤S202、若存在，则根据数据库中的调整参数对用户的输入的音频进行处理，合成处理后的目标音频；
步骤S203、若不存在，对原始音频进行处理，并将用户输入的原始音频的声纹数据及处理的参数存储在数据库中，合成处理后的目标音频。
[0029]具体实施时，用户在开启原始音频处理后，开始声纹识别打开，若检测到匹配的声纹特征，则将该声纹的声音进行声音美化的处理，如果没有检测到匹配的声纹，则存储该声纹，选择相应的声音模板进行美化，或者调整相关的音色，频域的参数作为该声纹的美化模板。
[0030]进一步的实施例中，所述步骤S203具体包括:
步骤S231、当检测到数据库中不存在与原始音频匹配的调整参数，根据预设的模板或者接收用户输入自行调整音频参数对原始音频进行处理；
步骤S232、将预设的模板或接收用户输入自行调整音频参数作为对应的原始音频的调整参数与用户输入的原始音频的声纹数据进行绑定；
步骤S233、存储用户输入的原始音频的声纹数据及对应的原始音频调整参数。
[0031]具体实施时，当检测到数据库中不存在与原始音频匹配的调整参数，说明用户

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：冯剑明;黄慧琳;
技术所有人：惠州TCL移动通信有限公司;
我是此专利的发明人

上一篇：一种环境自适应的语音混响消除方法和系统的制作方法
上一篇：用于通话的方法及装置的制造方法