语音识别文本修订方法、装置、计算机设备以及存储介质与流程

文档序号：34182123发布日期：2023-05-17 09:35阅读：49来源：国知局

本公开涉及计算机，具体而言，涉及一种语音识别文本修订方法、装置、计算机设备以及存储介质。

背景技术：

1、随着智能化时代到来，在许多基础行业领域中也逐渐引入智能化设备来替代人工作业。在利用语音识别作为文本输入方式的时候，针对不同的场景会有不同的结果。如果用户在输入的时候需可以切换场景(例如输入计算机专业文本、财经类专业文本)，那么将很大的提高输入的准确性，但是用户很可能是在输入语音，获得有误的转写结果之后才想到需要修改之前的场景。例如，在医疗行业中，医生往往需要为病人开具病例、处方单亦或者写病例信息存档等。现今可以通过医生语音讲述，并对医生的语音进行转写的方式形成最终的文本。

2、这里，在中医诊断过程中，现阶段存在症状描述时候采用“西医”方向的语言进行描述，在开具对应的药物时采用“中医”方向的语言进行描述，两种场景(中医和西医使用完全的不同的术语体系，在用户随意输入的前提下，系统也很难自动判断输入的场景)。然而，在现有的语音识别技术中，往往无法识别场景转换，从而导致转写得到的文本错误率较高。

技术实现思路

1、本公开实施例至少提供一种语音识别文本修订、装置、计算机设备以及存储介质。

2、第一方面，本公开实施例提供了一种语音识别文本修订方法，包括：

3、获取预设识别模型，并通过所述预设识别模型对待识别语音进行识别，得到语音文本；

4、对所述语音文本进行纠错识别，确定所述语音文本中的待修改文本；

5、在模型数据库中进行模型重选，得到第一识别模型；所述模型数据库中包括多个不同语音识别场景所分别对应的识别模型；

6、通过所述第一识别模型对所述语音文本中的待修改文本进行修正，得到纠正文本。

7、一种可选的实施方式中，所述对所述语音文本进行纠错识别，确定所述语音文本中的待修改文本，包括：

8、获取所述语音文本中的任意语句，并确定所述任意语句与所述模型数据库中的识别模型之间的匹配度；

9、将所述匹配度满足匹配条件的识别模型确定为第二识别模型；

10、在所述第二识别模型与所述预设识别模型不同时，将所述任意语句确定为待修改文本。

11、一种可选的实施方式中，所述通过所述第一识别模型对所述语音文本中的待修改文本进行修正，得到纠正文本，包括：

12、确定所述待修改文本在所述待识别语音中对应的语音片段；

13、基于所述第一识别模型对所述语音片段的内容进行识别，并基于识别结果对所述待修改文本进行修正，得到纠正文本。

14、一种可选的实施方式中，所述方法还包括：

15、确定与所述模型数据库中的识别模型相匹配的训练文本合集；

16、基于所述训练文本合集，对待训练的识别模型进行训练，得到满足识别精度的识别模型。

17、一种可选的实施方式中，所述确定与所述识别模型相匹配的训练文本合集，包括：

18、确定与所述识别模型相匹配的第一训练文本；

19、在所述第一训练文本中确定与所述识别模型对应的语音识别场景相关的场景字词；

20、对所述场景字词进行掩码处理，得到第二训练文本，并基于所述第一训练文本以及所述第二训练文本确定所述训练文本合集。

21、一种可选的实施方式中，所述通过所述第一识别模型对所述语音文本中的待修改文本进行修正，得到纠正文本之后，还包括：

22、获取用户对所述纠正文本的修改信息；所述修改信息中包括用户指示所述纠正文本中的错误字词；

23、在所述错误字词的数量小于或等于预设数量阈值时，对所述纠正文本进行位置匹配度检测，以根据位置匹配度检测得到的结果对所述纠正文本进行修正，得到第一目标文本；

24、在所述错误字词的数量大于预设数量阈值时，在所述在模型数据库中确定第三识别模型，并通过所述第三识别模型对所述纠正文本进行修正，得到第二目标文本；所述第三识别模型为所述模型数据库中除所述第一识别模型和所述预设模型外的其他识别模型。

25、一种可选的实施方式中，所述修改信息中还包括与每一所述错误字词对应的正确字词；所述对所述纠正文本进行位置匹配度检测，以根据位置匹配度检测得到的结果对所述纠正文本进行修正，得到第一目标文本，包括：

26、获取所述纠正文本中的标记文本；所述标记文本为所述纠正文本中包含所述错误字词的文本；

27、确定每一个所述错误字词在所述标记文本中的依存概率；一个所述错误字词对应一个所述依存概率；

28、将所述依存概率与预设概率阈值进行比较，并将所述依存概率小于所述预设概率阈值的错误字词确定为目标修改字词；

29、将所述纠正文本中所有目标修改字词替换为与其对应的所述正确字词，得到所述第一目标文本。

30、第二方面，本公开实施例还提供一种语音识别文本修订装置，包括：

31、识别单元，用于获取预设识别模型，并通过所述预设识别模型对待识别语音进行识别，得到语音文本；

32、纠错单元，用于对所述语音文本进行纠错识别，确定所述语音文本中的待修改文本；

33、确定单元，用于在模型数据库中进行模型重选，得到第一识别模型；所述模型数据库中包括多个不同语音识别场景所分别对应的识别模型；

34、修正单元，用于通过所述第一识别模型对所述语音文本中的待修改文本进行修正，得到纠正文本。

35、第三方面，本公开实施例还提供一种计算机设备，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当计算机设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行上述第一方面，或第一方面中任一种可能的实施方式中的步骤。

36、第四方面，本公开实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述第一方面，或第一方面中任一种可能的实施方式中的步骤。

37、在本公开实施例中，首先可以对待识别语音进行内容识别，得到语音文本，并确定该语音文本中可能存在转写错误的待修改文本，接下来，可以通过第一识别模型对该待修改文本进行修正，得到纠正文本，从而提高该纠正文本的识别准确率。

38、为使本公开的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

技术特征：

1.一种语音识别文本修订方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述对所述语音文本进行纠错识别，确定所述语音文本中的待修改文本，包括：

3.根据权利要求1所述的方法，其特征在于，所述通过所述第一识别模型对所述语音文本中的待修改文本进行修正，得到纠正文本，包括：

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

5.根据权利要求4所述的方法，其特征在于，所述确定与所述识别模型相匹配的训练文本合集，包括：

6.根据权利要求1所述的方法，其特征在于，所述通过所述第一识别模型对所述语音文本中的待修改文本进行修正，得到纠正文本之后，还包括：

7.根据权利要求6所述的方法，其特征在于，所述修改信息中还包括与每一所述错误字词对应的正确字词；所述对所述纠正文本进行位置匹配度检测，以根据位置匹配度检测得到的结果对所述纠正文本进行修正，得到第一目标文本，包括：

8.一种语音识别文本修订装置，其特征在于，包括：

9.一种计算机设备，其特征在于，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当计算机设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行如权利要求1至7任意一项所述的语音识别文本修订方法的步骤。

10.一种计算机可读存储介质，其特征在于，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如权利要求1至7任意一项所述的语音识别文本修订方法的步骤。

技术总结
本公开提供了语音识别文本修订方法、装置、计算机设备以及存储介质，其中，该方法包括：获取预设识别模型，并通过所述预设识别模型对待识别语音进行识别，得到语音文本；对所述语音文本进行纠错识别，确定所述语音文本中的待修改文本；在模型数据库中进行模型重选，得到第一识别模型；所述模型数据库中包括多个不同语音识别场景所分别对应的识别模型；通过所述第一识别模型对所述语音文本中的待修改文本进行修正，得到纠正文本。

技术研发人员：周月辉,赵雷,田维政,陈文艺
受保护的技术使用者：新声科技（深圳）有限公司
技术研发日：
技术公布日：2024/1/12

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周月辉赵雷田维政陈文艺
技术所有人：深圳市人民医院
我是此专利的发明人

上一篇：智能侦察系统多级效能计算方法、装置、设备及介质与流程
上一篇：一种双幅桥梁检修车的制作方法