本公开涉及信息,尤其涉及一种多音区语音识别方法、装置、车辆及存储介质。
背景技术:
1、现在车载语音已经越来越普及,用户可使用车载语音助手,通过语音交互来实现导航、播放语音以及车辆控制等功能。
2、为满足用户的需求,车载语音助手已经可实现对车辆座舱内的用户的定向语音交互,以避免车辆座舱内其他位置的声音带来的干扰。但是,在车载语音助手与用户进行定向语音交互的过程中,如果用户移动至其他位置进行发声,车载语音助手则无法继续与用户进行语音交互,降低了用户的体验。
技术实现思路
1、为了解决上述技术问题,本公开提供了一种多音区语音识别方法、装置、车辆及存储介质。
2、本公开实施例第一方面提供了一种多音区语音识别方法,该方法包括:
3、获取位于目标车辆的座舱内的用户发出的实时交互语音;
4、确定实时交互语音对应的第一来源音区;
5、在第一来源音区为目标音区的情况下,对实时交互语音进行语音识别,得到实时交互语音对应的实时控制指令,目标音区包括用户发出的唤醒语音对应的第二来源音区以及第二来源音区的相邻音区。
6、本公开实施例第二方面提供了一种多音区语音识别装置,该装置包括:
7、第一获取模块,用于获取位于目标车辆的座舱内的用户发出的实时交互语音;
8、第一确定模块,用于确定实时交互语音对应的第一来源音区;
9、识别模块,用于在第一来源音区为目标音区的情况下,对实时交互语音进行语音识别,得到实时交互语音对应的实时控制指令,目标音区包括用户发出的唤醒语音对应的第二来源音区以及第二来源音区的相邻音区。
10、本公开实施例第三方面提供了一种车辆,包括存储器和处理器,其中,存储器中存储有计算机程序,当计算机程序被处理器执行时,实现第一方面的多音区语音识别方法。
11、本公开实施例第四方面提供了一种计算机可读存储介质,存储介质中存储有计算机程序,当计算机程序被处理器执行时,实现第一方面的多音区语音识别方法。
12、本公开实施例提供的技术方案与现有技术相比具有如下优点:
13、本公开实施例中,在获取到位于目标车辆的座舱内的用户发出的实时交互语音之后,可以确定实时交互语音对应的第一来源音区,如果第一来源音区为目标音区,则对实时交互语音进行语音识别,得到实时交互语音对应的实时控制指令,由于目标音区包括用户发出的唤醒语音对应的第二来源音区以及第二来源音区的相邻音区,因此,用户即可以在唤醒语音对应的第二来源音区实现语音交互,也可以在第二来源音区的相邻音区实现语音交互,进而在车载语音助手与用户进行定向语音交互的过程中,即便用户从唤醒车载语音助手的音区移动到相邻音区,也可以正常与车载语音助手进行语音交互,提升了用户的体验。
1.一种多音区语音识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,在所述对所述实时交互语音进行语音识别,得到所述实时交互语音对应的实时控制指令之后,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,在所述将所述实时控制指令与所述历史非完整控制指令合并,得到合并控制指令之后,所述方法还包括:
4.根据权利要求2所述的方法,其特征在于,在所述查询是否存在历史非完整控制指令之后,所述方法还包括:
5.根据权利要求2所述的方法,其特征在于,在所述判断所述实时控制指令是否为完整控制指令之后,所述方法还包括:
6.根据权利要求1所述的方法,其特征在于,还包括:
7.根据权利要求6所述的方法,其特征在于,所述基于所述第二来源音区和所述第二来源音区的相邻音区,确定所述目标音区,包括:
8.一种多音区语音识别装置,其特征在于,所述装置包括:
9.一种车辆,其特征在于,所述车辆包括:
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有计算机程序,当所述计算机程序被处理器执行时,实现如权利要求1-7中任一项所述的多音区语音识别方法。