一种语音识别方法、装置、存储介质及设备与流程

文档序号:33947802发布日期:2023-04-26 09:09阅读:来源:国知局

技术特征:

1.一种语音识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述目标语音的音频特征为所述目标语音的幅度谱特征。

3.根据权利要求1所述的方法,其特征在于,所述语音识别模型包括编码层、音素识别层、解码层和文本实体词汇检测层;所述将所述目标语音的音频特征输入至预先构建的语音识别模型,识别得到所述目标语音的音素识别结果和初始文本识别结果中的第一实体词汇及其位置信息,包括:

4.根据权利要求1所述的方法,其特征在于,所述识别得到所述目标语音的音素识别结果和初始文本识别结果中的第一实体词汇及其位置信息之后,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述利用预先构建的领域专业实体词汇列表,对所述目标语音的音素识别结果进行解码,得到第二实体词汇,包括:

6.根据权利要求1所述的方法,其特征在于,所述确定所述第一实体词汇和第二实体词汇各自对应的相似实体词汇,包括:

7.根据权利要求1-6任一项所述的方法,其特征在于,所述根据所述打分结果,判断是否需要利用第二实体词汇或所述第一实体词汇和第二实体词汇各自对应的相似实体词汇对所述第一实体词汇进行纠错处理,若是,则根据得到的纠错结果,确定所述目标语音对应的最终识别结果,包括:

8.一种语音识别装置,其特征在于,包括:

9.一种语音识别设备,其特征在于,包括:处理器、存储器、系统总线;

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行权利要求1-7任一项所述的方法。


技术总结
本申请公开了一种语音识别方法、装置、存储介质及设备,该方法包括:首先生成目标语音的音频特征,然后将其输入至预先构建的语音识别模型,识别得到目标语音的音素识别结果和初始文本识别结果中的第一实体词汇及其位置信息;接着利用预先构建的领域专业实体词汇列表,对目标语音的音素识别结果进行解码,得到第二实体词汇;确定第一实体词汇和第二实体词汇各自对应的相似实体词汇,并利用预设的语言模型对这些相似实体词汇、第一实体词汇、第二实体词汇进行打分,得到打分结果;再根据打分结果,判断是否需要利用第二实体词汇或任一相似实体词汇对第一实体词汇进行纠错处理,若是,则在纠错后确定目标语音的最终识别结果,以提高语音识别效果。

技术研发人员:吴华鑫,刘迪源,潘嘉,刘庆峰
受保护的技术使用者:科大讯飞股份有限公司
技术研发日:
技术公布日:2024/1/11
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1