用于语音识别的音频语料筛选方法、装置及计算机设备与流程

文档序号：18740723发布日期：2019-09-21 01:44阅读：来源：国知局

技术特征：

1.一种用于语音识别的音频语料筛选方法，其特征在于，所述方法包括：

获取长语音音频语料，所述长语音音频语料至少包含两个原始单句；

获取以所述原始单句为单位对所述长语音音频语料进行标注得到的多段音频语料及每段所述音频语料所对应的标注文本；

使用多段所述音频语料及每段所述音频语料所对应的标注文本对语音识别模型进行训练以得到第一语音识别模型；

通过所述第一语音识别模型对每段所述音频语料进行识别以得到每段所述音频语料对应的第一识别文本；

将每个所述第一识别文本和每个所述第一识别文本所对应的所述标注文本进行比对以统计每段所述音频语料的第一词识别率，所述第一词识别率包括词错误率或者词正确率；

对每段所述音频语料的所述第一词识别率是否满足第一词识别率预设条件进行判断；

将满足所述第一词识别率预设条件的所述第一词识别率所对应的所述音频语料及所述音频语料所对应的所述标注文本进行存储以得到筛选后的第一语料。

2.根据权利要求1所述用于语音识别的音频语料筛选方法，其特征在于，所述将满足所述第一词识别率预设条件的所述第一词识别率所对应的所述音频语料及所述音频语料所对应的所述标注文本进行存储以得到筛选后的第一语料的步骤之后，还包括：

使用所述第一语料对所述第一语音识别模型进行训练以得到第二语音识别模型；

通过所述第二语音识别模型对所述第一语料包含的每段所述音频语料进行识别以得到每段所述音频语料的第二识别文本；

将每个所述第二识别文本和每个所述第二识别文本所对应的所述标注文本进行比对以统计每段所述音频语料的第二词识别率，所述第二词识别率包括词错误率或者词正确率；

对每段所述音频语料的第二词识别率是否满足第二词识别率预设条件进行判断；

将满足所述第二词识别率预设条件的所述第二词识别率所对应的所述音频语料及所述音频语料所对应的所述标注文本进行存储以得到筛选后的第二语料；

迭代上述步骤直至得到满足预设词识别率预设条件的所有所述音频语料及所述音频语料所对应的标注文本以得到筛选后的语料。

3.根据权利要求1或者2所述用于语音识别的音频语料筛选方法，其特征在于，所述第一词识别率为第一词错误率；

所述对每段所述音频语料的所述第一词识别率是否满足第一词识别率预设条件进行判断的步骤包括：

对每段所述音频语料的第一词错误率是否小于或者等于第一预设词错误率阈值进行判断；

所述将满足所述第一词识别率预设条件的所述第一词识别率所对应的所述音频语料及所述音频语料所对应的所述标注文本进行存储以得到筛选后的第一语料的步骤包括：

将满足所述第一词错误率小于或者等于所述第一预设词错误率阈值的所述音频语料及所述音频语料所对应的所述标注文本进行存储以得到筛选后的第一语料。

4.根据权利要求3所述用于语音识别的音频语料筛选方法，其特征在于，所述将每个所述第一识别文本和每个所述第一识别文本所对应的所述标注文本进行比对以统计每段所述音频语料的第一词识别率的步骤包括：

将每个所述第一识别文本和每个所述第一识别文本所对应的所述标注文本按照文本顺序进行比对以得到所述第一识别文本调整成所述标注文本的插入词、替换词及删除词；

计算所述插入词、所述替换词及所述删除词的数量之和与所述标注文本中词数量的比值以得到所述第一词错误率。

5.根据权利要求1或者2所述用于语音识别的音频语料筛选方法，其特征在于，所述第一词识别率为第一词正确率；

所述对每段所述音频语料的所述第一词识别率是否满足第一词识别率预设条件进行判断的步骤包括：

对每段所述音频语料的第一词正确率是否大于或者等于第一预设词正确率阈值进行判断；

将满足所述第一词正确率大于或者等于所述第一预设词正确率阈值的所述音频语料及所述音频语料所对应的所述标注文本进行存储以得到筛选后的第一语料。

6.根据权利要求5所述用于语音识别的音频语料筛选方法，其特征在于，所述将每个所述第一识别文本和每个所述第一识别文本所对应的所述标注文本进行比对以统计每段所述音频语料的第一词正确率的步骤包括：

将每个所述第一识别文本和每个所述第一识别文本所对应的标注文本按照文本顺序进行比对以得到所述第一识别文本调整成所述标注文本的匹配词；

计算所述匹配词与所述标注文本中词数量的比值以得到第一词正确率；

或者，所述将每个所述第一识别文本和每个所述第一识别文本所对应的所述标注文本进行比对以统计每段所述音频语料的第一词正确率的步骤包括：

计算所述插入词、所述替换词及所述删除词的数量之和与所述标注文本中词数量的比值以得到所述第一词错误率；

根据所述第一词错误率获得对应所述音频语料的第一词正确率。

7.根据权利要求1或者2所述用于语音识别的音频语料筛选方法，其特征在于，所述原始单句携带有所述原始单句在所述长语音音频语料中位置的预设顺序标识。

8.一种用于语音识别的音频语料筛选装置，其特征在于，包括：

获取单元，用于获取长语音音频语料，所述长语音音频语料至少包含两个原始单句；

标注单元，用于获取以所述原始单句为单位对所述长语音音频语料进行标注得到的多段音频语料及每段所述音频语料所对应的标注文本；

第一训练单元，用于使用多段所述音频语料及每段所述音频语料所对应的标注文本对语音识别模型进行训练以得到第一语音识别模型；

第一识别单元，用于通过所述第一语音识别模型对每段所述音频语料进行识别以得到每段所述音频语料对应的第一识别文本；

第一统计单元，用于将每个所述第一识别文本和每个所述第一识别文本所对应的所述标注文本进行比对以统计每段所述音频语料的第一词识别率，所述第一词识别率包括词错误率或者词正确率；

第一判断单元，用于对每段所述音频语料的所述第一词识别率是否满足第一词识别率预设条件进行判断；

第一存储单元，用于将满足所述第一词识别率预设条件的所述第一词识别率所对应的所述音频语料及所述音频语料所对应的所述标注文本进行存储以得到筛选后的第一语料。

9.一种计算机设备，其特征在于，所述计算机设备包括存储器以及与所述存储器相连的处理器；所述存储器用于存储计算机程序；所述处理器用于运行所述存储器中存储的计算机程序，以执行如权利要求1-7任一项所述用于语音识别的音频语料筛选方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时使所述处理器执行如权利要求1-7中任一项所述用于语音识别的音频语料筛选方法的步骤。

完整全部详细技术资料下载

当前第2页1 2 3