语音识别纠错方法、相关设备及可读存储介质与流程

文档序号：20268245发布日期：2020-04-03 18:40阅读：来源：国知局

技术特征：

1.一种语音识别纠错方法，其特征在于，所述方法包括：

获取待识别的语音数据及其第一次识别结果；

从所述第一次识别结果中提取关键词，所述关键词是具有领域特性的专业词汇；

参考所述第一次识别结果的上下文信息以及所述关键词，对所述语音数据进行第二次识别，得到第二次识别结果；

根据所述第二次识别结果，确定最终的识别结果。

2.根据权利要求1所述的方法，其特征在于，所述参考所述第一次识别结果的上下文信息以及所述关键词，对所述语音数据进行第二次识别，得到第二次识别结果，包括：

获取所述语音数据的声学特征；

将所述语音数据的声学特征、所述第一次识别结果以及所述关键词，输入预先训练的语音纠错识别模型，得到第二次识别结果，所述语音纠错识别模型是利用纠错训练数据集对预设模型进行训练得到的；

其中，所述纠错训练数据集中包括至少一组纠错训练数据，每组纠错训练数据包括一条语音数据对应的声学特征、所述一条语音数据对应的文本、所述一条语音数据对应的第一次识别结果以及所述第一次识别结果中的关键词。

3.根据权利要求2所述的方法，其特征在于，所述将所述语音数据的声学特征、所述第一次识别结果以及所述关键词，输入预先训练的语音纠错识别模型，得到第二次识别结果，包括：

利用所述语音纠错识别模型对所述语音数据的声学特征、所述第一次识别结果以及所述关键词进行编码以及注意力计算，并基于计算结果，得到第二次识别结果。

4.根据权利要求3所述的方法，其特征在于，所述利用所述语音纠错识别模型对所述语音数据的声学特征、所述第一次识别结果以及所述关键词进行编码以及注意力计算，并基于计算结果，得到第二次识别结果，包括：

利用所述语音纠错识别模型的编码层和注意力层，分别对所述语音数据的声学特征、所述第一次识别结果以及所述关键词进行编码以及注意力计算，得到所述计算结果；

利用所述语音纠错识别模型的解码层，对所述计算结果进行解码，得到第二次识别结果。

5.根据权利要求3所述的方法，其特征在于，所述利用所述语音纠错识别模型对所述语音数据的声学特征、所述第一次识别结果以及所述关键词进行编码以及注意力计算，并基于计算结果，得到第二次识别结果，包括：

对所述语音数据的声学特征、所述第一次识别结果以及所述关键词进行合并，得到合并向量；

利用所述语音纠错识别模型的编码层和注意力层，对所述合并向量进行编码以及注意力计算，得到所述计算结果；

利用所述语音纠错识别模型的解码层，对所述计算结果进行解码，得到第二次识别结果。

6.根据权利要求4所述的方法，其特征在于，所述利用所述语音纠错识别模型的编码层和注意力层，分别对所述语音数据的声学特征、所述第一次识别结果以及所述关键词进行编码以及注意力计算，得到所述计算结果，包括：

利用所述语音纠错识别模型的编码层，分别对每一目标对象进行编码，得到所述每一目标对象的声学高级特征；

利用所述语音纠错识别模型的注意力层，分别对所述每一目标对象相关的上一时刻的语义向量以及所述语音纠错识别模型上一时刻的输出结果，进行注意力计算，得到所述每一目标对象相关的隐层状态；

利用所述语音纠错识别模型的注意力层，分别对所述每一目标对象的声学高级特征以及所述每一目标对象相关的隐层状态，进行注意力计算，得到所述每一目标对象相关的语义向量；

其中，所述目标对象包括所述语音数据的声学特征、所述第一次识别结果以及所述关键词。

7.根据权利要求5所述的方法，其特征在于，所述利用所述语音纠错识别模型的编码层和注意力层，对所述合并向量进行编码以及注意力计算，得到所述计算结果，包括：

利用所述语音纠错识别模型的编码层，对所述合并向量进行编码，得到所述合并向量的声学高级特征；

利用所述语音纠错识别模型的注意力层，对所述合并向量相关的上一时刻的语义向量以及所述语音纠错识别模型上一时刻的输出结果，进行注意力计算，得到所述合并向量相关的隐层状态；

利用所述语音纠错识别模型的注意力层，对所述合并向量的声学高级特征以及所述合并向量相关的隐层状态，进行注意力计算，得到所述合并向量相关的语义向量。

8.根据权利要求1所述的方法，其特征在于，所述根据所述第二次识别结果，确定最终的识别结果，包括：

获取所述第一次识别结果的置信度，以及，所述第二次识别结果的置信度；

从所述第一次识别结果以及所述第二次识别结果中，确定置信度高的识别结果为最终的识别结果。

9.一种语音识别纠错装置，其特征在于，所述装置包括：

获取单元，用于获取待识别的语音数据及其第一次识别结果；

关键词提取单元，用于从所述第一次识别结果中提取关键词，所述关键词是具有领域特性的专业词汇；

语音识别单元，用于参考所述第一次识别结果的上下文信息以及所述关键词，对所述语音数据进行第二次识别，得到第二次识别结果；

识别结果确定单元，用于根据所述第二次识别结果，确定最终的识别结果。

10.一种语音识别纠错系统，其特征在于，包括存储器和处理器；

所述存储器，用于存储程序；

所述处理器，用于执行所述程序，实现如权利要求1至8中任一项所述的语音识别纠错方法的各个步骤。

11.一种可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，实现如权利要求1至8中任一项所述的语音识别纠错方法的各个步骤。

完整全部详细技术资料下载

当前第2页1 2 3