语音识别的方法、装置、电子设备和存储介质与流程

文档序号：39600125发布日期：2024-10-11 13:07阅读：120来源：国知局

本发明涉及计算机，尤其涉及一种语音识别的方法、装置、电子设备和存储介质。

背景技术：

1、近年来，随着端到端自动语音识别(automatic speech recognition：asr)技术的快速发展，智能外呼系统已经在营销、催收、物流派件等领域中获得了广泛应用，asr技术可以识别外呼对象输入的音频，并结合自然语言理解技术来判断外呼对象的意图信息，从而实现智能化的语音交互。相关技术中，识别语音的准确性通常是通过模型训练实现，但是对于一些命名实体名词等信息，其因为出现的频率较低，所以通过模型训练并不能得出很好的识别效果，从而导致识别准确性较低。

技术实现思路

1、有鉴于此，本发明实施例提供一种语音识别的方法、装置、电子设备和存储介质，能够解决对出现的频率较低的命名实体名词等识别效果较差，导致识别准确性较低的问题。

2、为实现上述目的，根据本发明实施例的一个方面，提供了一种语音识别的方法。

3、本发明实施例的一种语音识别的方法包括：响应于语音识别指令，获取待处理信息，调用预设生成模型，生成所述待处理信息的编码特征；

4、获取所述语音识别指令对应领域的热词集合，以计算所述热词集合的词向量；调用预设的计算模型，基于所述编码特征和所述词向量计算初始权重矩阵；

5、筛选所述初始权重矩阵中不满足预设条件的参数集合，以将所述参数集合更新为预设值，得到更新后的权重矩阵；

6、基于所述更新后的权重矩阵和所述编码特征，确定所述待处理信息的识别结果。

7、在一个实施例中，筛选所述初始权重矩阵中不满足预设条件的参数集合，包括：

8、筛选所述初始权重矩阵中数值小于预设门限的参数集合。

9、在又一个实施例中，筛选所述初始权重矩阵中不满足预设条件的参数集合，包括：

10、从所述初始权重矩阵中筛选预设比例的参数集合，其中所述参数集合中参数的数值小于非所述数据集合中参数的数值。

11、在又一个实施例中，在所述响应于语音识别指令之前，还包括：

12、响应于热词处理指令，获取对应的目标领域，以查询关联的会话文本集合；

13、调用预设的识别模型，识别所述会话文本集合对应的热词集合，以确定为所述目标领域的热词集合。

14、在又一个实施例中，所述确定为所述目标领域的热词集合之后，还包括：

15、对所述热词集合中每个热词，采集对应不同音频特征的各热词音频信息，调用预设的识别模型对各所述热词音频信息识别，计算识别结果的准确率，以基于所述准确率确定目标热词音频信息，并更新至所述目标领域的热词。

16、在又一个实施例中，获取所述语音识别指令对应领域的热词集合，包括：

17、获取所述语音识别指令对应的领域标识，以查询所述领域标识的第一热词集合；

18、获取所述领域关联的相邻领域标识，以查询所述相邻领域标识对应的第二热词集合；

19、将所述第一热词集合和第二热词集合合并，确定所述语音识别指令对应领域的热词集合。

20、为实现上述目的，根据本发明实施例的另一方面，提供了一种语音识别的装置。

21、本发明实施例的一种语音识别的装置包括：生成单元，用于响应于语音识别指令，获取待处理音频，调用预设生成模型，生成所述待处理音频的编码特征；

22、计算单元，用于获取所述语音识别指令对应领域的热词集合，以计算所述热词集合的词向量；调用预设的计算模型，基于所述编码特征和所述词向量计算初始权重矩阵；

23、更新单元，用于筛选所述初始权重矩阵中不满足预设条件的参数集合，以将所述参数集合更新为预设值，得到更新后的权重矩阵；

24、识别单元，用于基于所述更新后的权重矩阵和所述编码特征，确定所述待处理信息的识别结果。

25、在一个实施例中，所述更新单元，具体用于：

26、筛选所述初始权重矩阵中数值小于预设门限的参数集合。

27、在又一个实施例中，所述更新单元，具体用于：

28、从所述初始权重矩阵中筛选预设比例的参数集合，其中所述参数集合中参数的数值小于非所述数据集合中参数的数值。

29、在又一个实施例中，所述装置还包括：

30、查询单元，用于响应于热词处理指令，获取对应的目标领域，以查询关联的会话文本集合；

31、确定单元，用于调用预设的识别模型，识别所述会话文本集合对应的热词集合，以确定为所述目标领域的热词集合。

32、在又一个实施例中，所述确定单元，具体用于：

33、对所述热词集合中每个热词，采集对应不同音频特征的各热词音频信息，调用预设的识别模型对各所述热词音频信息识别，计算识别结果的准确率，以基于所述准确率确定目标热词音频信息，并更新至所述目标领域的热词。

34、在又一个实施例中，所述计算单元，具体用于：

35、获取所述语音识别指令对应的领域标识，以查询所述领域标识的第一热词集合；

36、获取所述领域关联的相邻领域标识，以查询所述相邻领域标识对应的第二热词集合；

37、将所述第一热词集合和第二热词集合合并，确定所述语音识别指令对应领域的热词集合。

38、为实现上述目的，根据本发明实施例的再一个方面，提供了一种电子设备。

39、本发明实施例的一种电子设备，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明实施例提供的语音识别的方法。

40、为实现上述目的，根据本发明实施例的又一个方面，提供了一种计算机可读介质。

41、本发明实施例的一种计算机可读介质，其上存储有计算机程序，所述程序被处理器执行时实现本发明实施例提供的语音识别的方法。

42、为实现上述目的，根据本发明实施例的又一个方面，提供了一种计算机程序产品。

43、本发明实施例的一种计算机程序产品，包括计算机程序，所述程序被处理器执行时实现本发明实施例提供的语音识别的方法。

44、上述发明中的一个实施例具有如下优点或有益效果：本发明实施例中，在语音识别时，对于待处理信息可以先通过生成模型来生成待处理信息的编码特征；同时可以计算语音识别指令对应领域的热词集合的词向量，以结合编码特征来计算初始权重矩阵，实现将领域内热词和待处理信息相结合，使热词增强对出现频率较低信息的识别效果；进一步的，对初始权重矩阵筛选中不满足预设条件的参数集合，并更新为预设值，以降低弱影响力的热词对识别效果的干扰，进而通过更新后的权重矩阵和编码特征确定待处理音频的识别结果。如此本发明实施例中，在语音识别时结合热词集合计算初始权重矩阵，以通过热词来增强出现频率较低信息的识别效果，同时还会将不满足预设条件的参数集合更新为预设值，从而可以降低弱影响热词的干扰，增强强影响热词的增强效果，进而提高出现频率较低信息的识别效果，提高识别准确性。

45、上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

当前第1页1 2

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：付立,范璐,吴友政,何晓冬
技术所有人：京东城市（北京）数字科技有限公司
我是此专利的发明人

上一篇：一种铝合金型材生产用转运装置的制作方法
下一篇：一种可批量开盖的开盖机的制作方法

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！