语音识别方法、装置、设备、介质及车辆与流程

文档序号：42632589发布日期：2025-08-01 18:54阅读：32来源：国知局

本公开涉及语音识别，尤其涉及一种语音识别方法、装置、设备、介质及车辆。

背景技术：

1、现有语音识别系统主要由声学模型、语言模型和解码器三部分组成，提取语音的声学特征输入到声学模型中，得到每个发音的概率，语言模型对识别到的发音进行打分，得到发音得分，解码器再对识别得到的发音、发音得分找到一条得分最高的识别结果，最终输出语音的识别结果。

2、相关技术中，如果正确的结果不在声学模型输出的发音候选中，最终系统输出的结果很难识别正确，现有的解决办法是不断的补充数据来优化难识别的语音，优化模型。但是对于训练数据中未出现的，声学模型无法准确识别的，以及热点词汇组合等，现有方法只能通过调整语言模型的权重，提高输出结果的概率，但也不能保证完全修复这样的问题。

技术实现思路

1、为了解决上述技术问题，本公开提供了一种语音识别方法、装置、设备、介质及车辆。

2、第一方面，本公开提供了一种语音识别方法，包括：

3、获取目标语音，并提取所述目标语音的声学特征；

4、对所述声学特征进行识别分类处理，得到识别分类结果，所述识别分类结果包括拼音识别结果和领域分类结果；

5、在确定所述领域分类结果小于预设阈值的情况下，对所述拼音识别结果和关联候选结果进行评分排序处理，得到评分排序结果，所述关联候选结果为与所述拼音识别结果相关联的预设结果；

6、确定所述评分排序结果中分数最高的结果为目标结果。

7、第二方面，本公开提供了一种语音识别装置，包括：

8、特征提取模块，用于获取目标语音，并提取所述目标语音的声学特征；

9、第一处理模块，用于对所述声学特征进行识别分类处理，得到识别分类结果，所述识别分类结果包括拼音识别结果和领域分类结果；

10、第二处理模块，用于在确定所述领域分类结果小于预设阈值的情况下，对所述拼音识别结果和关联候选结果进行评分排序处理，得到评分排序结果，所述关联候选结果为与所述拼音识别结果相关联的预设结果；

11、结果确定模块，用于确定所述评分排序结果中分数最高的结果为目标结果。

12、第三方面，本公开提供了一种语音识别设备，包括：

13、处理器；

14、存储器，用于存储可执行指令；

15、其中，处理器用于从存储器中读取可执行指令，并执行可执行指令以实现第一方面的语音识别方法。

16、第四方面，本公开提供了一种计算机可读存储介质，该存储介质存储有计算机程序，当计算机程序被处理器执行时，使得处理器实现第一方面的语音识别方法。

17、第五方面，本公开提供了一种车辆，包括如上的语音识别装置。

18、本公开实施例提供的技术方案与现有技术相比具有如下优点：

19、本公开实施例的语音识别方法、装置、设备、介质及车辆，能够获取目标语音，并提取所述目标语音的声学特征，接着对所述声学特征进行识别分类处理，得到识别分类结果，所述识别分类结果包括拼音识别结果和领域分类结果，然后在确定所述领域分类结果小于预设阈值的情况下，对所述拼音识别结果和关联候选结果进行评分排序处理，得到评分排序结果，所述关联候选结果为与所述拼音识别结果相关联的预设结果，最后确定所述评分排序结果中分数最高的结果为目标结果，由此，得到目标语音对应的拼音识别结果和领域分类结果，并在领域分类结果小于预设阈值时，进行评分排序处理，最后确定得到评分排序结果中分数最高的结果为目标结果，从而提升语音识别准确率。

技术特征：

1.一种语音识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述对所述声学特征进行识别分类处理，得到识别分类结果，包括：

3.根据权利要求1所述的方法，其特征在于，所述对所述声学特征进行识别分类处理，得到识别分类结果，包括：

4.根据权利要求2所述的方法，其特征在于，在所述对所述声学特征进行识别分类处理，得到识别分类结果之后，所述方法还包括：

5.根据权利要求4所述的方法，其特征在于，所述对所述拼音识别结果和关联候选结果进行评分排序处理，得到评分排序结果，包括：

6.根据权利要求4所述的方法，其特征在于，所述通过预先训练好的评分排序模型，对所述拼音识别结果和所述关联候选结果进行评分排序处理，得到所述评分排序结果，包括：

7.一种语音识别装置，其特征在于，包括：

8.一种语音识别设备，其特征在于，包括：

9.一种计算机可读存储介质，其特征在于，所述存储介质存储有计算机程序，当所述计算机程序被处理器执行时，使得处理器实现用上述权利要求1-6中任一项所述的语音识别方法。

10.一种车辆，其特征在于，包括如权利要求7所述的语音识别装置或权利要求8所述的语音识别设备或权利要求9所述的计算机可读存储介质。

技术总结
本公开涉及一种语音识别方法、装置、设备、介质及车辆。其中，语音识别方法包括：获取目标语音，并提取所述目标语音的声学特征；对所述声学特征进行识别分类处理，得到识别分类结果，所述识别分类结果包括拼音识别结果和领域分类结果；在确定所述领域分类结果小于预设阈值的情况下，对所述拼音识别结果和关联候选结果进行评分排序处理，得到评分排序结果，所述关联候选结果为与所述拼音识别结果相关联的预设结果；确定所述评分排序结果中分数最高的结果为目标结果。根据本公开实施例，能够提升语音识别准确率。

技术研发人员：刘明
受保护的技术使用者：北京罗克维尔斯科技有限公司
技术研发日：
技术公布日：2025/7/31

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘明
技术所有人：北京罗克维尔斯科技有限公司
我是此专利的发明人

上一篇：体外分离人毛囊来源的黑色素细胞的方法和应用与流程
下一篇：厨房用水控制系统及其控制方法与流程

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！