语音识别方法、电子设备和计算机可读存储介质与流程

文档序号:33712123发布日期:2023-04-01 00:20阅读:来源:国知局

技术特征:
1.一种语音识别方法,包括:获取待识别的语音信息;针对所述待识别的语音信息,确定至少一个识别领域;从至少两个候选识别模型中,确定与所述至少一个识别领域匹配的至少一个识别模型;利用所述至少一个识别模型,对所述待识别的语音信息进行识别,以得到语音识别结果。2.根据权利要求1所述的语音识别方法,其中,针对所述待识别的语音信息,确定至少一个识别领域,包括:基于所述待识别的语音信息,确定所述待识别的语音信息对应的意图信息;至少基于所述意图信息,确定所述至少一个识别领域。3.根据权利要求2所述的语音识别方法,其中,基于所述待识别的语音信息,确定所述待识别的语音信息对应的意图信息,包括:对所述待识别的语音信息进行特征提取操作,得到特征数据;将所述特征数据输入声学模型,以得到所述声学模型的输出结果,其中,所述声学模型的输出结果包括与所述特征数据对应的字符;基于所述声学模型的输出结果,解码得到所述待识别的语音信息对应的k条字符序列;基于所述k条字符序列,确定所述意图信息;其中,k为正整数。4.根据权利要求1所述的语音识别方法,其中,针对所述待识别的语音信息,确定至少一个识别领域,包括:获取接收所述待识别的语音信息的语音接收设备的当前状态信息和/或与所述语音接收设备相关联的关联设备的当前状态信息;基于所述语音接收设备的当前状态信息和/或所述关联设备的当前状态信息,确定当前场景信息;至少基于所述当前场景信息,确定所述至少一个识别领域。5.根据权利要求1所述的语音识别方法,其中,针对所述待识别的语音信息,确定至少一个识别领域,包括:获取在接收所述待识别的语音信息之前接收的至少一条历史语音信息对应的至少一个历史识别领域;至少基于所述至少一个历史识别领域,确定所述至少一个识别领域。6.根据权利要求1所述的语音识别方法,其中,针对所述待识别的语音信息,确定至少一个识别领域,包括:获取m个参考信息,并分别基于所述m个参考信息确定m个候选领域;基于所述m个候选领域,确定所述至少一个识别领域;其中,m为大于1的整数。7.根据权利要求6所述的语音识别方法,其中,所述m个参考信息包括以下信息中的至少一种:所述待识别的语音信息对应的意图信息;
基于接收所述待识别的语音信息的语音接收设备的当前状态信息和/或与所述语音接收设备相关联的关联设备的当前状态信息确定的当前场景信息;在接收所述待识别的语音信息之前接收的历史语音信息对应的历史识别领域。8.根据权利要求6或7所述的语音识别方法,其中,确定至少一个识别领域包括:确定一个识别领域;基于所述m个候选领域,确定所述至少一个识别领域,包括:若所述m个候选领域均为第一领域,则将所述第一领域作为所述识别领域;若所述m个候选领域包括各不相同的n个候选领域,则从所述n个候选领域中确定一个候选领域作为所述识别领域;其中,n为大于1且小于等于m的正整数。9.根据权利要求8所述的语音识别方法,其中,从所述n个候选领域中确定一个候选领域作为所述识别领域,包括:基于所述m个候选领域,统计所述n个候选领域各自的频次;将所述n个候选领域中频次最高的候选领域作为所述识别领域。10.根据权利要求8所述的语音识别方法,其中,从所述n个候选领域中确定一个候选领域作为所述识别领域,包括:基于所述m个参考信息的优先权排序,确定所述m个参考信息中优先权最高的参考信息;将所述n个候选领域中与所述优先权最高的参考信息对应的候选领域作为所述识别领域。11.根据权利要求8所述的语音识别方法,其中,所述m个参考信息包括p个意图信息和q个其他信息,所述m个候选领域包括分别与所述p个意图信息对应的p个第一候选领域和分别与所述q个其他信息对应的q个其他候选领域,p为大于1且小于m的整数,q为小于m的正整数;从所述n个候选领域中确定一个候选领域作为所述识别领域,包括:若所述p个第一候选领域中的至少一个候选领域与所述q个其他候选领域中的至少一个候选领域均为第二领域,则将所述第二领域作为所述识别领域。12.根据权利要求6所述的语音识别方法,其中,确定至少一个识别领域包括:确定多个识别领域;基于所述m个候选领域,确定所述至少一个识别领域。包括:若所述m个候选领域包括各不相同的n个候选领域,则将所述n个候选领域作为所述多个识别领域,其中,n为大于1且小于等于m的正整数;确定与所述至少一个识别领域匹配的至少一个识别模型,包括:确定分别与所述多个识别领域匹配的多个识别模型;利用所述至少一个识别模型,对所述待识别的语音信息进行识别,以得到语音识别结果。包括:分别利用所述多个识别模型对所述待识别的语音信息进行识别,以得到多个候选识别结果;基于所述多个候选识别结果,确定所述语音识别结果。
13.根据权利要求12所述的语音识别方法,其中,分别利用所述多个识别模型对所述待识别的语音信息进行识别,以得到多个候选识别结果,包括:分别利用所述多个识别模型对所述待识别的语音信息进行识别,以得到多个候选识别结果以及所述多个候选识别结果分别对应的多个得分;基于所述多个候选识别结果,确定所述语音识别结果,包括:从所述多个候选识别结果中选择得分最高的候选识别结果作为所述语音识别结果。14.根据权利要求1所述的语音识别方法,还包括:针对至少两个预设识别领域,分别训练得到对应的至少两个候选识别模型;基于所述至少两个预设识别领域与所述至少两个候选识别模型的对应关系生成领域与模型对应信息;其中,确定与所述至少一个识别领域匹配的至少一个识别模型,包括:利用所述领域与模型对应信息,确定与所述至少一个识别领域匹配的至少一个识别模型。15.根据权利要求3所述的语音识别方法,其中,所述识别模型包括语言模型;利用所述至少一个识别模型,对所述待识别的语音信息进行识别,以得到语音识别结果,包括:将所述声学模型的输出结果输入所述语言模型,以得到所述语言模型的输出结果,将所述语言模型的输出结果作为所述语音识别结果。16.根据权利要求3所述的语音识别方法,其中,所述识别模型包括语言模型;利用所述至少一个识别模型,对所述待识别的语音信息进行识别,以得到语音识别结果。包括:将所述k条字符序列输入所述语言模型,以得到所述语言模型的输出结果,将所述语言模型的输出结果作为所述语音识别结果。17.根据权利要求16所述的语音识别方法,其中,基于所述声学模型的输出结果,解码得到所述待识别的语音信息对应的k条字符序列,包括:执行多次解码操作,直至触发结束条件,以获得最后一次解码操作解码得到的多条字符序列以及所述多条字符序列的排序,其中,所述结束条件表征当前解码的语句结束,对于首次解码操作之后的每次解码操作,均基于上一次解码操作得到的多条非完整字符序列继续向后解码;其中,在所述排序中,所述多条字符序列按照质量由高至低排列,所述k条字符序列为所述排序中的前k条字符序列。18.一种电子设备,包括:语音接收装置,配置为接收待识别的语音信息;语音识别装置,配置为执行如权利要求1-17任一项所述的语音识别方法。19.一种电子设备,包括:处理器;存储器,存储有一个或多个计算机程序模块;其中,所述一个或多个计算机程序模块被配置为由所述处理器执行,用于实现权利要求1-17任一项所述的语音识别方法。20.一种计算机可读存储介质,存储有非暂时性计算机可读指令,当所述非暂时性计算
机可读指令由计算机执行时可以实现权利要求1-17任一项所述的语音识别方法。

技术总结
一种语音识别方法、语音识别装置、电子设备和计算机可读存储介质。该语音识别方法包括:获取待识别的语音信息;针对该待识别的语音信息,确定至少一个识别领域;从至少两个候选识别模型中,确定与该至少一个识别领域匹配的至少一个识别模型;利用该至少一个识别模型,对该待识别的语音信息进行识别,以得到语音识别结果。该方法可以适用多种场景,在不降低准确度的前提下达到减少计算量的目的。低准确度的前提下达到减少计算量的目的。低准确度的前提下达到减少计算量的目的。


技术研发人员:李林峰 李国华 黄海荣 牛坤
受保护的技术使用者:湖北星纪时代科技有限公司
技术研发日:2022.12.01
技术公布日:2023/3/31
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1