用于音频识别的模型建构方法与流程

文档序号：29507756发布日期：2022-04-06 19:05阅读：来源：国知局

技术特征：
1.一种用于音频识别的模型建构方法，包括：取得音频数据；利用分类模型决定所述音频数据的预测结果，其中所述分类模型是基于机器学习算法所训练，且所述预测结果包括所述分类模型所定义的标签；根据所述预测结果的损失程度提供提示消息，其中所述损失程度相关于所述预测结果与对应的实际结果之间的差异，且所述提示消息用于询问所述音频数据与所述标签的相关性；以及根据所述提示消息的确认响应修正所述分类模型，其中所述确认响应相关于确认所述音频数据与所述标签的相关性。2.根据权利要求1所述的用于音频识别的模型建构方法，其中所述提示消息包括所述音频数据及问题内容，所述问题内容是询问所述音频数据是否属于所述标签，且提供所述提示消息的步骤包括：播放所述音频数据并提供所述问题内容。3.根据权利要求2所述的用于音频识别的模型建构方法，其中根据所述提示消息的所述确认响应修正所述分类模型的步骤包括：接收输入操作，其中所述输入操作对应于所述问题内容的选项，且所述选项是所述音频数据属于所述标签、或所述音频数据不属于所述标签；以及根据所述输入操作决定所述确认响应。4.根据权利要求1所述的用于音频识别的模型建构方法，其中根据所述提示消息的所述确认响应修正所述分类模型的步骤包括：将所述确认响应对应的标签与所述音频数据作为所述分类模型的训练数据，并据以重新训练所述分类模型。5.根据权利要求1所述的用于音频识别的模型建构方法，其中取得所述音频数据的步骤包括：分析原始音频数据的特性，以决定所述原始音频数据的噪声分量；以及对所述原始音频数据抵消所述噪声分量以生成所述音频数据。6.根据权利要求5所述的用于音频识别的模型建构方法，其中所述特性包括多个本质模态函数，且决定所述音频数据的噪声分量的步骤包括：分解所述原始音频数据，以产生所述原始音频数据的多个模态分量，其中每一所述模态分量对应到一所述本质模态函数；决定每一所述模态分量的自相关性；以及依据所述多个模态分量的自相关性选择一所述模态分量作为所述噪声分量。7.根据权利要求1或5所述的用于音频识别的模型建构方法，其中取得所述音频数据的步骤包括：对所述音频数据提取声音特征；根据所述声音特征决定所述音频数据中的目标片段及非目标片段；以及保留所述目标片段，并移除所述非目标片段。8.根据权利要求7所述的用于音频识别的模型建构方法，其中所述目标片段为语音内容，所述非目标片段不为所述语音内容，所述声音特征包括短时能量及过零率，且对所述音
频数据提取所述声音特征的步骤包括：根据所述音频数据的所述短时能量及所述过零率决定所述目标片段在所述音频数据中的二端点，其中所述二端点相关于所述目标片段在时域上的边界。9.根据权利要求7所述的用于音频识别的模型建构方法，还包括：根据所述目标片段提供第二提示消息，其中所述第二提示消息用于要求对所述目标片段赋予所述标签；以及根据所述第二提示消息的第二确认响应训练所述分类模型，其中所述第二确认响应包括所述目标片段对应的所述标签。10.根据权利要求1所述的用于音频识别的模型建构方法，还包括：提供所述分类模型经由网络传输；加载通过所述网络所取得的所述分类模型以对语音输入识别；以及根据所述语音输入的识别结果提供事件通知。

技术总结
本发明实施例提供一种用于音频识别的模型建构方法。在这方法中。取得音频数据。利用分类模型决定音频数据的预测结果，这分类模型是基于机器学习算法所训练，且这预测结果包括这分类模型所定义的标签。根据预测结果的损失程度提供提示消息，这损失程度相关于预测结果与对应的实际结果之间的差异，且提示消息用于询问音频数据与标签的相关性。根据提示消息的确认响应修正分类模型，且这确认响应相关于确认音频数据与标签的相关性。藉此，可提升标记效率及预测正确性。率及预测正确性。率及预测正确性。

技术研发人员：陈建芳吴易万许桓瑞李建明
受保护的技术使用者：亚旭电子科技(江苏)有限公司
技术研发日：2020.09.21
技术公布日：2022/4/5

完整全部详细技术资料下载

当前第2页1 2