本公开涉及语音识别,尤其涉及一种语音识别方法、装置、设备、介质及车辆。
背景技术:
1、现有语音识别系统主要由声学模型、语言模型和解码器三部分组成,提取语音的声学特征输入到声学模型中,得到每个发音的概率,语言模型对识别到的发音进行打分,得到发音得分,解码器再对识别得到的发音、发音得分找到一条得分最高的识别结果,最终输出语音的识别结果。
2、相关技术中,如果正确的结果不在声学模型输出的发音候选中,最终系统输出的结果很难识别正确,现有的解决办法是不断的补充数据来优化难识别的语音,优化模型。但是对于训练数据中未出现的,声学模型无法准确识别的,以及热点词汇组合等,现有方法只能通过调整语言模型的权重,提高输出结果的概率,但也不能保证完全修复这样的问题。
技术实现思路
1、为了解决上述技术问题,本公开提供了一种语音识别方法、装置、设备、介质及车辆。
2、第一方面,本公开提供了一种语音识别方法,包括:
3、获取目标语音,并提取所述目标语音的声学特征;
4、对所述声学特征进行识别分类处理,得到识别分类结果,所述识别分类结果包括拼音识别结果和领域分类结果;
5、在确定所述领域分类结果小于预设阈值的情况下,对所述拼音识别结果和关联候选结果进行评分排序处理,得到评分排序结果,所述关联候选结果为与所述拼音识别结果相关联的预设结果;
6、确定所述评分排序结果中分数最高的结果为目标结果。
7、第二方面,本公开提供了一种语音识别装置,包括:
8、特征提取模块,用于获取目标语音,并提取所述目标语音的声学特征;
9、第一处理模块,用于对所述声学特征进行识别分类处理,得到识别分类结果,所述识别分类结果包括拼音识别结果和领域分类结果;
10、第二处理模块,用于在确定所述领域分类结果小于预设阈值的情况下,对所述拼音识别结果和关联候选结果进行评分排序处理,得到评分排序结果,所述关联候选结果为与所述拼音识别结果相关联的预设结果;
11、结果确定模块,用于确定所述评分排序结果中分数最高的结果为目标结果。
12、第三方面,本公开提供了一种语音识别设备,包括:
13、处理器;
14、存储器,用于存储可执行指令;
15、其中,处理器用于从存储器中读取可执行指令,并执行可执行指令以实现第一方面的语音识别方法。
16、第四方面,本公开提供了一种计算机可读存储介质,该存储介质存储有计算机程序,当计算机程序被处理器执行时,使得处理器实现第一方面的语音识别方法。
17、第五方面,本公开提供了一种车辆,包括如上的语音识别装置。
18、本公开实施例提供的技术方案与现有技术相比具有如下优点:
19、本公开实施例的语音识别方法、装置、设备、介质及车辆,能够获取目标语音,并提取所述目标语音的声学特征,接着对所述声学特征进行识别分类处理,得到识别分类结果,所述识别分类结果包括拼音识别结果和领域分类结果,然后在确定所述领域分类结果小于预设阈值的情况下,对所述拼音识别结果和关联候选结果进行评分排序处理,得到评分排序结果,所述关联候选结果为与所述拼音识别结果相关联的预设结果,最后确定所述评分排序结果中分数最高的结果为目标结果,由此,得到目标语音对应的拼音识别结果和领域分类结果,并在领域分类结果小于预设阈值时,进行评分排序处理,最后确定得到评分排序结果中分数最高的结果为目标结果,从而提升语音识别准确率。
1.一种语音识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述声学特征进行识别分类处理,得到识别分类结果,包括:
3.根据权利要求1所述的方法,其特征在于,所述对所述声学特征进行识别分类处理,得到识别分类结果,包括:
4.根据权利要求2所述的方法,其特征在于,在所述对所述声学特征进行识别分类处理,得到识别分类结果之后,所述方法还包括:
5.根据权利要求4所述的方法,其特征在于,所述对所述拼音识别结果和关联候选结果进行评分排序处理,得到评分排序结果,包括:
6.根据权利要求4所述的方法,其特征在于,所述通过预先训练好的评分排序模型,对所述拼音识别结果和所述关联候选结果进行评分排序处理,得到所述评分排序结果,包括:
7.一种语音识别装置,其特征在于,包括:
8.一种语音识别设备,其特征在于,包括:
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,当所述计算机程序被处理器执行时,使得处理器实现用上述权利要求1-6中任一项所述的语音识别方法。
10.一种车辆,其特征在于,包括如权利要求7所述的语音识别装置或权利要求8所述的语音识别设备或权利要求9所述的计算机可读存储介质。