语音识别方法、装置、电子设备和存储介质与流程

文档序号:42295309发布日期:2025-06-27 18:32阅读:59来源:国知局

本技术涉及语音识别,特别是涉及一种语音识别方法、装置、电子设备和计算机可读存储介质。


背景技术:

1、语音识别技术,是一种能够将音频转换成文本或命令的技术,识别准确性是语音识别技术的优劣评价的一个重要维度。通常情况下,不同业务场景下识别的内容领域偏好存在差异,应用领域内经常出现的词汇或者定制的偏好词汇,也可以叫做热词。实际应用场景中,可以在语音识别过程中考虑热词的影响,提高识别准确率。

2、然而,传统的语音识别热词增强技术中,由于热词识别效果受限,识别的准确率较差。


技术实现思路

1、本技术实施例提供了一种语音识别方法、装置、电子设备、计算机可读存储介质,可以提高识别准确率。

2、第一方面,本技术提供了一种语音识别方法。所述方法用于对语音信号中的语音帧进行识别,包括:

3、根据所述语音帧的目标解码路径,对所述语音帧进行解码,得到所述语音帧的多个候选路径及对应的路径分值,每个候选路径对应一个路径分值,所述目标解码路径为与所述语音帧相邻的上一语音帧的任一目标路径;

4、根据所述路径分值和目标热词,从所述多个候选路径中确定保留路径,所述保留路径包括路径分值排名前n的分值匹配路径以及与所述目标热词相匹配的热词匹配路径,所述n为正整数,所述目标热词为根据所述目标解码路径从预设热词库中确定得到;

5、根据所述预设热词库中所述目标热词的热词分值,对所述保留路径的路径分值进行更新,得到更新后的路径分值;

6、根据所述更新后的路径分值,从所述保留路径中确定所述语音帧的与所述目标解码路径对应的目标路径。

7、在其中一个实施例中,所述热词匹配路径的确定方式,包括:

8、根据所述目标热词,从所述多个候选路径中确定与所述目标热词相匹配的初始匹配路径;

9、根据所述目标热词的热词分值,对所述初始匹配路径的路径分值进行更新,得到更新后的初始匹配路径的路径分值;

10、确定所述更新后的初始匹配路径的路径分值排名前m的初始匹配路径作为热词匹配路径,所述m为正整数。

11、在其中一个实施例中,所述目标热词包括潜在热词和同音热词中的至少一种,所述热词匹配路径的确定方式,包括:

12、从所述多个候选路径中,确定包含所述潜在热词的候选路径为潜在匹配路径;

13、从所述多个候选路径中,确定与所述同音热词相匹配的候选路径为同音匹配路径;

14、根据所述潜在匹配路径和所述同音匹配路径中的至少一种,得到热词匹配路径。

15、在其中一个实施例中,所述同音热词的确定方式,包括:

16、针对所述目标解码路径,从所述语音帧的除所述目标解码路径以外的其他解码路径中,确定倒数第二个词单元与所述目标解码路径的最后一个词单元相同的路径,作为同音路径;

17、从所述预设热词库中,确定与所述同音路径的最后一个词单元同音的目标词单元,并将所述目标词单元对应的热词作为同音热词。

18、在其中一个实施例中,所述潜在热词的确定方式,包括:

19、根据所述目标解码路径的最后一个词单元,从所述预设热词库中确定与所述最后一个词单元相匹配的热词,作为潜在热词。

20、在其中一个实施例中,所述从所述预设热词库中确定与所述最后一个词单元的热词,作为潜在热词,包括:

21、从所述预设热词库中确定与所述最后一个词单元相匹配的热词为候选热词;

22、从所述候选热词中,确定热词分值大于预设分值的热词为潜在热词。

23、第二方面,本技术还提供了一种语音识别装置。所述装置用于对语音信号中的语音帧进行识别,包括:

24、解码模块,用于根据所述语音帧的目标解码路径,对所述语音帧进行解码,得到所述语音帧的多个候选路径及对应的路径分值,每个候选路径对应一个路径分值,所述目标解码路径为与所述语音帧相邻的上一语音帧的任一目标路径;

25、第一确定模块,用于根据所述路径分值和目标热词,从所述多个候选路径中确定保留路径,所述保留路径包括路径分值排名前n的分值匹配路径以及与所述目标热词相匹配的热词匹配路径,所述n为正整数,所述目标热词为根据所述目标解码路径从预设热词库中确定得到;

26、更新模块,用于根据所述预设热词库中所述目标热词的热词分值,对所述保留路径的路径分值进行更新,得到更新后的路径分值;

27、第二确定模块,用于根据所述更新后的路径分值,从所述保留路径中确定所述语音帧的与所述目标解码路径对应的目标路径。

28、在其中一个实施例中,所述装置包括热词匹配路径的确定模块,所述热词匹配路径的确定模块,包括:

29、第一确定子模块,用于根据所述目标热词,从所述多个候选路径中确定与所述目标热词相匹配的初始匹配路径;

30、第一更新子模块,用于根据所述目标热词的热词分值,对所述初始匹配路径的路径分值进行更新,得到更新后的初始匹配路径的路径分值;

31、第二确定子模块,用于确定所述更新后的初始匹配路径的路径分值排名前m的初始匹配路径作为热词匹配路径,所述m为正整数。

32、在其中一个实施例中,所述目标热词包括潜在热词和同音热词中的至少一种,所述装置包括热词匹配路径的确定模块,所述热词匹配路径的确定模块包括:

33、第三确定子模块,用于从所述多个候选路径中,确定包含所述潜在热词的候选路径为潜在匹配路径;

34、第四确定子模块,用于从所述多个候选路径中,确定与所述同音热词相匹配的候选路径为同音匹配路径;

35、第五确定子模块,用于根据所述潜在匹配路径和所述同音匹配路径中的至少一种,得到热词匹配路径。

36、在其中一个实施例中,所述装置还包括同音热词的确定模块,所述同音热词的确定模块包括:

37、第六确定子模块,用于针对所述目标解码路径,从所述语音帧的除所述目标解码路径以外的其他解码路径中,确定倒数第二个词单元与所述目标解码路径的最后一个词单元相同的路径,作为同音路径;

38、第七确定子模块,用于从所述预设热词库中,确定与所述同音路径的最后一个词单元同音的目标词单元,并将所述目标词单元对应的热词作为同音热词。

39、在其中一个实施例中,所述装置还包括潜在热词的确定模块,所述潜在热词的确定模块包括:

40、第八确定子模块,用于根据所述目标解码路径的最后一个词单元,从所述预设热词库中确定与所述最后一个词单元相匹配的热词,作为潜在热词。

41、在其中一个实施例中,所述第八确定子模块,包括:

42、第一确定单元,用于从所述预设热词库中确定与所述最后一个词单元相匹配的热词为候选热词;

43、第二确定单元,用于从所述候选热词中,确定热词分值大于预设分值的热词为潜在热词。

44、第三方面,本技术还提供了一种电子设备。所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现本公开实施例中任一项所述的方法的步骤。

45、第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本公开实施例中任一项所述的方法的步骤。

46、第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现本公开实施例中任一项所述的方法的步骤。

47、上述语音识别方法、装置、电子设备、计算机可读存储介质和计算机程序产品,用于对语音信号的语音帧进行识别,针对语音帧的目标解码路径,对语音帧进行解码,得到多个候选路径及对应的路径分值,并根据路径分值和目标热词确定保留路径,保留路径包括路径分值排名前n的分值匹配路径和与目标热词相匹配的热词匹配路径,根据预设热词库中目标热词的热词分值,对保留路径的路径分值进行更新,得到更新后的路径分值,并根据更新后的路径分值,从保留路径中确定语音帧的与所述目标解码路径对应的目标路径。由于本方案中在从候选路径中选择目标路径时,先根据路径分值和目标热词确定保留路径,能够兼顾路径分值和热词对识别效果的影响,在路径分值更新前保留分值匹配路径和热词匹配路径,降低在保留路径筛选过程中热词分值较高的热词匹配路径被遗漏的概率;再根据目标热词的热词分值对路径分值进行更新,根据更新后的路径分值从保留路径中确定目标路径,能够通过热词分值增强热词匹配路径,提高目标路径中热词匹配路径的命中概率,优化了热词的识别性能,有效增强语音识别中的场景定制化能力,保证了每一帧语音帧的识别准确率,进而有效提高语音信号的识别准确率;且在语音信号的识别过程中,对从候选路径中确定目标路径的选择方式进行优化调整,无需调整每一个语音帧的目标路径组成的识别结果搜索空间,平衡了热词识别性能和解码效率,不额外增加解码耗时保证解码过程效率的同时,有效提高了热词识别效果,进而提高了语音信号识别结果的准确率,有效增强语音识别中的场景定制化能力。

当前第1页1 2 
当前第1页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!
1