语音识别的文本纠错方法、装置、设备及可读存储介质与流程

文档序号：37617188发布日期：2024-04-18 17:31阅读：6来源：国知局

本发明涉及语音识别，具体涉及一种语音识别的文本纠错方法、装置、设备及可读存储介质。

背景技术：

1、语音识别作为一种基本的文本输入功能，最大程度上实现了语音输入，解放了用户的双手，但是现有的语音识别在垂直领域远没有在通用领域的识别效果好，其在垂直领域对往往存在一定的识别错误，这就会影响信息输入，需要进行文本信息纠错。目前对于语音识别结果的纠错方法基本采用深度学习，在大量的垂直领域语料上进行模型训练，再用训练结果去纠错。

2、但是，对于垂直领域而言，能够收集到的语料并不多，这就会导致数据量不足以训练深度学习模型，导致其纠错准确率较低，难以很好的解决语音识别结果的纠错。

技术实现思路

1、有鉴于此，本发明实施例提供了一种语音识别的文本纠错方法、装置、设备及可读存储介质，以解决语音识别的纠错准确率较差的问题。

2、根据第一方面，本发明实施例提供了一种语音识别的文本纠错方法，包括：获取识别垂直领域的预设语音信息所得到的文本信息；当所述文本信息存在待纠错文本信息时，基于预设纠错模型从所述文本信息中筛选出候选文本，所述预设纠错模型基于文本之间的转移概率训练得到；基于所述候选文本与所述待纠错文本信息的相似度，从所述候选文本中确定出所述待纠错文本信息对应的目标文本。

3、本发明实施例提供的语音识别的文本纠错方法，通过对垂直领域的语音识别结果进行错误信息识别，并基于文本之间的转移概率对相关的候选文本进行召回，继而根据文本信息的相似度确定出目标文本，由此不受语料信息不足的限制，通过上下文之间的文本转移概率即可确定出目标文本，提高了语音纠错效果。

4、结合第一方面，在第一方面的第一实施方式中，所述基于预设纠错模型从所述文本信息中筛选出候选文本，包括：获取所述待纠错文本信息对应的第一语音，从所述预设语音信息中解析出与所述第一语音相一致的第二语音；将所述第二语音对应的文本确定为所述候选文本。

5、本发明实施例提供的语音识别的文本纠错方法，通过识别与待纠错文本信息所对应第一语音相一致的第二语音，并将第二语音对应的文本作为候选文本，最大程度上提高了候选文本的召回率，从而提高了纠错准确率。

6、结合第一方面第一实施方式，在第一方面的第二实施方式中，所述第二语音与所述第一语音的声母相同，和/或，所述第二语音与所述第一语音的韵母相同；所述将所述第二语音对应的文本确定为所述候选文本，包括：将与所述第一语音的声母相同的文本确定为所述候选文本；和/或，将与所述第一语音的韵母相同的文本确定为所述候选文本。

7、本发明实施例提供的语音识别的文本纠错方法，将与第一语音的声母相同和/或韵母相同的文本确定为候选文本，避免候选文本的遗漏，提高了候选文本的召回率。

8、结合第一方面第一实施方式，在第一方面的第三实施方式中，所述基于预设纠错模型从所述文本信息中筛选出候选文本，还包括：基于预设纠错模型确定所述待纠错文本信息与所述文本信息中其他文本之间的文本转移概率；将所述文本转移概率超过预设阈值的文本确定为所述候选文本。

9、本发明实施例提供的语音识别的文本纠错方法，通过确定待纠错文本信息与文本信息中其他文本之间的文本转移概率，将文本转移概率超过预设阈值的文本作为候选文本，进一步保证了候选文本的召回完整性，避免候选文本的遗漏而影响文本纠错的准确率。

10、结合第一方面，在第一方面的第四实施方式中，判断所述文本信息是否存在所述待纠错文本信息，包括：解析所述文本信息，确定所述文本信息中各个分词的转移概率；当所述转移概率低于预设概率值时，判定所述文本信息中存在所述待纠错文本信息。

11、结合第一方面第四实施方式，在第一方面的第五实施方式中，所述解析所述文本信息，确定所述文本信息中各个分词的转移概率，包括：对所述文本信息进行分词处理，得到所述文本信息的多个分词；分析任意一个分词到其他分词的第一转移总次数，以及所述任意一个分词与其相邻分词之间的第一转移次数，确定所述第一转移次数以及所述第一转移总次数的比值；将所述比值确定为所述转移概率。

12、本发明实施例提供的语音识别的文本纠错方法，通过对识别语音得到的文本信息进行解析，以根据文本信息中各个分词之间的转移概率确定其是否存在识别错误的待纠错文本信息，以保证在检测到待纠错文本信息后进行文本纠错，保证语音识别结果的准确度。

13、结合第一方面，在第一方面的第六实施方式中，所述基于所述候选文本与所述待纠错文本信息的相似度，从所述候选文本中确定出所述待纠错文本信息对应的目标文本，包括；确定所述候选文本与所述待纠错文本信息的语音相似度；基于所述候选文本对应的文本转移概率以及所述语音相似度，确定所述候选文本对应的目标概率值；将所述目标概率值最大的候选文本确定为所述目标文本。

14、本发明实施例提供的语音识别的文本纠错方法，结合语音相似度以及文本转移概率确定候选文本的目标概率值，将目标概率值最大的候选文本作为最终的目标文本，最大程度上提高了文本纠错的准确率。

15、根据第二方面，本发明实施例提供了一种语音识别的文本纠错装置，包括：获取模块，用于获取识别垂直领域的预设语音信息所得到的文本信息；筛选模块，用于当所述文本信息存在待纠错文本信息时，基于预设纠错模型从所述文本信息中筛选出候选文本，所述预设纠错模型基于文本之间的转移概率训练得到；确定模块，用于基于所述候选文本与所述待纠错文本信息的相关性，从所述候选文本中确定出所述待纠错文本信息对应的目标文本。

16、根据第三方面，本发明实施例提供了一种电子设备，包括：存储器和处理器，所述存储器和所述处理器之间互相通信连接，所述存储器中存储有计算机指令，所述处理器通过执行所述计算机指令，从而执行第一方面或第一方面任一实施方式所述的语音识别的文本纠错方法。

17、根据第四方面，本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使计算机执行第一方面或第一方面任一实施方式所述的语音识别的文本纠错方法。

18、需要说明的是，本发明实施例提供的语音识别的文本纠错装置、电子设备以及计算机可读存储介质的相应有益效果，请参见语音识别的文本纠错方法中相应内容的描述，在此不再赘述。

技术特征：

1.一种语音识别的文本纠错方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于预设纠错模型从所述文本信息中筛选出候选文本，包括：

3.根据权利要求2所述的方法，其特征在于，所述第二语音与所述第一语音的声母相同，和/或，所述第二语音与所述第一语音的韵母相同；所述将所述第二语音对应的文本确定为所述候选文本，包括：

4.根据权利要求2所述的方法，其特征在于，所述基于预设纠错模型从所述文本信息中筛选出候选文本，还包括：

5.根据权利要求1所述的方法，其特征在于，判断所述文本信息是否存在所述待纠错文本信息，包括：

6.根据权利要求5所述的方法，其特征在于，所述解析所述文本信息，确定所述文本信息中各个分词的转移概率，包括：

7.根据权利要求1所述的方法，其特征在于，所述基于所述候选文本与所述待纠错文本信息的相似度，从所述候选文本中确定出所述待纠错文本信息对应的目标文本，包括；

8.一种语音识别的文本纠错装置，其特征在于，包括：

9.一种电子设备，其特征在于，包括：

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使计算机执行权利要求1-7任一项所述的语音识别的文本纠错方法。

技术总结
本发明涉及语音识别技术领域，公开了一种语音识别的文本纠错方法、装置、设备及可读存储介质。其中，该方法包括：获取识别垂直领域的预设语音信息所得到的文本信息；当文本信息存在待纠错文本信息时，基于预设纠错模型从文本信息中筛选出候选文本，该预设纠错模型基于文本之间的转移概率训练得到；基于候选文本与待纠错文本信息的相似度，从候选文本中确定出待纠错文本信息对应的目标文本。通过实施本发明，语音识别结果的纠错不受语料信息不足的限制，通过上下文之间的文本转移概率即可确定出目标文本，提高了语音纠错效果。

技术研发人员：付红雷,田勇,梁雄,张波
受保护的技术使用者：广联达科技股份有限公司
技术研发日：
技术公布日：2024/4/17

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：付红雷,田勇,梁雄,张波
技术所有人：广联达科技股份有限公司
我是此专利的发明人

上一篇：一种可调节板式空气过滤器的制作方法
上一篇：导电快拆压紧式结构的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。