语音识别纠错方法及装置与流程

文档序号：12179714阅读：来源：国知局

技术特征：

1.一种语音识别纠错方法，其特征在于，包括：

获取通过当前语音识别模型得到的历史识别结果，其中，所述历史识别结果包含多个文本信息；

对所述多个文本信息进行逻辑分析，提取出相互之间存在复述逻辑的目标文本信息；

将所述相互之间存在复述逻辑的目标文本信息进行错误信道统计，生成文本对齐模型；

接收用户输入的语音信息；

根据所述当前语音识别模型和所述文本对齐模型对所述语音信息进行解码，以得到目标语音识别结果。

2.根据权利要求1所述的方法，其特征在于，所述对所述多个文本信息进行逻辑分析，提取出相互之间存在复述逻辑的目标文本信息，包括：

通过隐马尔可夫模型对所述多个文本信息进行逻辑建模，以确定任意两个文本信息之间的逻辑关系；

根据所述任意两个文本信息之间的逻辑关系，从所述多个文本信息中提取出所述相互之间存在复述逻辑的目标文本信息。

3.根据权利要求1或2所述的方法，其特征在于，所述对所述多个文本信息进行逻辑分析，提取出相互之间存在复述逻辑的目标文本信息，包括：

获取每个文本信息的特征信息，其中，所述特征信息包括以下至少一项：文本特征信息、发音特征信息、语义特征信息；

根据所述特征信息计算任意两个文本信息之间的相似度；

获取所述任意两个文本信息之间的输入时间间隔；

根据所述任意两个文本信息之间的相似度和所述输入时间间隔，从所述多个文本信息中提取出所述相互之间存在复述逻辑的目标文本信息。

4.根据权利要求3所述的方法，其特征在于，所述根据所述相似度和所述输入时间间隔，从所述多个文本信息中提取出所述相互之间存在复述逻辑的目标文本信息，包括：

将相似度大于或者等于预设相似度，且输入时间间隔小于或者等于预设时间间隔的文本信息确定为所述目标文本信息。

5.根据权利要求1所述的方法，其特征在于，根据所述当前语音识别模型和所述文本对齐模型对所述语音信息进行解码，以得到目标语音识别结果，包括：

通过所述语音识别模型对所述语音信息进行解码，得到第一语音识别结果；

根据所述第一语音识别结果、所述文本对齐模型和隐马尔可夫模型，得到第二语音识别结果；

将所述第二语音识别结果确定为所述目标语音识别结果。

6.一种语音识别纠错装置，其特征在于，包括：

获取模块，用于获取通过当前语音识别模型得到的历史识别结果，其中，所述历史识别结果包含多个文本信息；

提取模块，用于对所述多个文本信息进行逻辑分析，提取出相互之间存在复述逻辑的目标文本信息；

生成模块，用于将所述相互之间存在复述逻辑的目标文本信息进行错误信道统计，生成文本对齐模型；

接收模块，用于接收用户输入的语音信息；

识别模块，用于根据所述当前语音识别模型和所述文本对齐模型对所述语音信息进行解码，以得到目标语音识别结果。

7.根据权利要求6所述的装置，其特征在于，所述提取模块包括：

关系确定子模块，用于通过隐马尔可夫模型对所述多个文本信息进行逻辑建模，以确定任意两个文本信息之间的逻辑关系；

第一提取子模块，用于根据所述任意两个文本信息之间的逻辑关系，从所述多个文本信息中提取出所述相互之间存在复述逻辑的目标文本信息。

8.根据权利要求6或7所述的装置，其特征在于，所述提取模块包括：

第一获取子模块，用于获取每个文本信息的特征信息，其中，所述特征信息包括以下至少一项：文本特征信息、发音特征信息、语义特征信息；

计算子模块，用于根据所述特征信息计算任意两个文本信息之间的相似度；

第二获取子模块，用于获取所述任意两个文本信息之间的输入时间间隔；

第二提取子模块，用于根据所述任意两个文本信息之间的相似度和所述输入时间间隔，从所述多个文本信息中提取出所述相互之间存在复述逻辑的目标文本信息。

9.根据权利要求8所述的装置，其特征在于，所述第二提取子模块用于：

将相似度大于或者等于预设相似度，且输入时间间隔小于或者等于预设时间间隔的文本信息确定为所述目标文本信息。

10.根据权利要求6所述的装置，其特征在于，所述识别模块包括：

识别子模块，用于通过所述语音识别模型对所述语音信息进行解码，得到第一语音识别结果；

处理子模块，用于根据所述第一语音识别结果、所述文本对齐模型和隐马尔可夫模型，得到第二语音识别结果；

结果确定子模块，用于将所述第二语音识别结果确定为所述目标语音识别结果。

完整全部详细技术资料下载

当前第2页1 2 3