本申请涉及车辆,更具体而言,涉及一种意图识别方法、电子装置、车辆和非易失性计算机可读存储介质。
背景技术:
1、车辆在对声音信号进行语音识别和意图理解后,对于意图明确的句子,可以准确理解并执行对应的意图,为用户带来良好的体验,用户不需要再反复解释或澄清自己的需求,车辆基于语音识别和意图理解,即可做出满意的回应。
2、但是,在日常的生活和应用中,车辆接收到的语音,并非都是包含明确的意图的语音。车辆在遇到表述不规范或意图不明确的语音的情况下,通常会选择拒绝识别、或者向用户发出“无法识别”的提示,甚至会直接执行对意图不明确的语音进行泛化处理后得到的意图(该意图通常是车辆在无法正确识别的情况下,对不明确的意图进行泛化处理后得到的,正确性通常较低),导致用户的使用体验较差。
技术实现思路
1、有鉴于此,本申请实施方式提供一种意图识别方法、电子装置、车辆和非易失性计算机可读存储介质,可以提高用户的使用体验。
2、本申请的意图识别方法包括:在接收到语音指令的情况下,对所述语音指令进行识别,以得到语音识别结果;在所述语音识别结果满足预设引导条件的情况下,发出引导信息,所述引导信息基于所述语音识别结果生成;在接收到针对所述引导信息的反馈语音的情况下,对所述反馈语音进行识别,以得到意图识别结果。
3、在某些实施方式中,所述语音识别结果包括分类结果和提取词,所述分类结果包括是否存在意图,所述提取词包括实体词、动词和方位词中至少一者,所述语音识别结果满足预设引导条件,包括以下至少一种:所述分类结果为存在意图、所述提取词中仅存在实体词、且所述实体词的置信度大于第一置信度阈值;所述分类结果为存在意图、所述提取词中仅存在实体词和动词、且所述实体词的置信度位于第二置信度阈值和所述第一置信度阈值之间,所述第二置信度阈值小于所述第一置信度阈值;所述分类结果为存在意图、所述提取词中仅存在实体词、且所述实体词的置信度位于第二置信度阈值和所述第一置信度阈值之间,所述第二置信度阈值小于所述第一置信度阈值;所述分类结果为存在意图、所述提取词中仅存在方位词;所述分类结果为存在意图、所述提取词仅存在动词;所述分类结果为存在意图、所述提取词仅存在方位词和动词。
4、在某些实施方式中,所述语音识别结果包括提取词,所述提取词包括实体词、动词和方位词中至少一者,所述方法还包括:基于所述提取词中缺少的目标词和所述实体词的置信度中至少一者生成所述引导信息,所述目标词包括动词和方位词中至少一者。
5、在某些实施方式中,所述基于所述提取词中缺少的目标词和所述实体词的置信度中至少一者生成所述引导信息,包括:在所述提取词包含实体词的情况下,基于所述提取词中缺少的目标词和所述实体词的置信度中生成所述引导信息;在所述提取词不包含实体词的情况下,基于所述提取词中缺少的目标词生成所述引导信息。
6、在某些实施方式中,所述引导信息包括方位引导信息、动作引导信息、动作与方位引导信息、实体引导信息、动作与实体引导信息、方位与实体引导信息;所述在所述提取词包含实体词的情况下,基于所述提取词中缺少的目标词和所述实体词的置信度中生成所述引导信息,包括:在所述提取词中仅存在实体词、且所述实体词的置信度大于第一置信度阈值,生成所述动作引导信息或所述动作与方位引导信息;在所述提取词中仅存在实体词和动词、且所述实体词的置信度位于所述第二置信度阈值和所述第一置信度阈值之间的情况下,生成所述实体引导信息或所述方位与实体引导信息;在所述提取词中仅存在实体词、且所述实体词的置信度位于第二置信度阈值和所述第一置信度阈值之间的情况下,生成所述动作与实体引导信息;所述在所述提取词不包含实体词的情况下,基于所述提取词中缺少的目标词生成所述引导信息,包括:在所述提取词中仅存在方位词的情况下,生成所述动作与实体引导信息;在所述提取词仅存在动词的情况下,生成所述方位与实体引导信息;在所述提取词仅存在方位词和动词,生成实体引导信息。
7、在某些实施方式中,所述语音识别结果包括分类结果和提取词,所述分类结果包括是否存在意图,所述提取词包括实体词、动词和方位词中至少一者,所述方法还包括:在所述识别结果满足预设的意图生成条件的情况下,基于所述语音识别结果生成所述意图识别结果;其中,所述意图生成条件包括所述分类结果为存在意图、所述提取词包含动词和实体词、且所述实体词的置信度大于第一置信度阈值、或者所述分类结果为存在意图、所述提取词包含动词、方位词和实体词、且所述实体词的置信度大于第一置信度阈值。
8、在某些实施方式中,所述识别结果包括分类结果和提取词,所述分类结果包括是否存在意图,所述提取词包括实体词、动词和方位词中至少一者,所述方法还包括:在所述识别结果满足预设停止条件的情况下,停止进行意图识别;其中,所述识别结果满足预设停止条件,包括以下至少一种:所述分类结果为不存在意图;所述提取词无方位词;所述提取词中的实体词的置信度小于第三置信度阈值。
9、在某些实施方式中,所述实体词的置信度基于第一置信度和第二置信度确定,所述第一置信度基于预设的意图配置表中,与所述实体词匹配的各个匹配实体词和所述实体词之间的最大相似度确定,所述第二置信度基于所述实体词的拼音和所述最大相似度对应的所述匹配实体词的拼音的相似度确定。
10、在某些实施方式中,所述对所述语音指令进行识别,以得到语音识别结果,包括:基于预设的深度学习模型,对所述语音指令进行识别,以得到所述语音识别结果。
11、本申请实施方式的电子装置包括处理器,所述处理器与存储器连接;所述存储器中存储有计算机程序,所述处理器执行所述计算机程序以实现上述任一实施方式所述的意图识别方法的指令。
12、本申请实施方式的车辆包括上述任一实施方式所述的电子装置。
13、本申请实施方式的非易失性计算机可读存储介质,包括计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述任一实施方式所述的意图识别方法。
14、本申请实施方式的意图识别方法、电子装置、车辆和非易失性计算机可读存储介质,在接收到语音指令的情况下,对语音指令进行识别,以得到语音识别结果;在语音识别结果满足预设引导条件的情况下,发出引导信息,引导信息基于语音识别结果生成;在接收到针对引导信息的反馈语音的情况下,对反馈语音进行识别,以得到意图识别结果,即基于对语音指令识别后得到的语音识别结果,向用户发出引导信息,再通过接收和识别用户的反馈语音,以得到意图识别结果,即使接收到车辆难以明确意图、或车辆无法保证识别的准确性的语音指令,也可以通过发出引导信息,与用户进行交互,从而得到意图识别结果,而非拒绝识别、回复用户无法识别或执行错误的意图等,提高执行的意图的准确性与提高用户的使用体验。
15、本申请的实施方式的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实施方式的实践了解到。
1.一种意图识别方法,其特征在于,包括:
2.根据权利要求1所述的意图识别方法,其特征在于,所述语音识别结果包括分类结果和提取词,所述分类结果包括是否存在意图,所述提取词包括实体词、动词和方位词中至少一者,所述实体词用于表征所述语音指令操作的物体,所述语音识别结果满足预设引导条件,包括以下至少一种:
3.根据权利要求1或2所述的意图识别方法,其特征在于,所述语音识别结果包括提取词,所述提取词包括实体词、动词和方位词中至少一者,所述方法还包括:
4.根据权利要求3所述的意图识别方法,其特征在于,所述基于所述提取词中缺少的目标词和所述实体词的置信度中至少一者生成所述引导信息,包括:
5.根据权利要求4所述的意图识别方法,其特征在于,所述引导信息包括动作引导信息、动作与方位引导信息、实体引导信息、动作与实体引导信息、方位与实体引导信息中至少一者;
6.根据权利要求1-5任一项所述的意图识别方法,其特征在于,所述语音识别结果包括分类结果和提取词,所述分类结果包括是否存在意图,所述提取词包括实体词、动词和方位词中至少一者,所述方法还包括:
7.根据权利要求1-6任一项所述的意图识别方法,其特征在于,所述识别结果包括分类结果和提取词,所述分类结果包括是否存在意图,所述提取词包括实体词、动词和方位词中至少一者,所述方法还包括:
8.根据权利要求2-7任一项所述的意图识别方法,其特征在于,所述实体词的置信度基于第一置信度和第二置信度确定,所述第一置信度基于预设的意图配置表中,与所述实体词匹配的各个匹配实体词和所述实体词之间的最大相似度确定,所述第二置信度基于所述实体词的拼音和所述最大相似度对应的所述匹配实体词的拼音的相似度确定。
9.根据权利要求1-8任一项所述的意图识别方法,其特征在于,所述对所述语音指令进行识别,以得到语音识别结果,包括:
10.一种电子装置,其特征在于,包括:
11.一种车辆,其特征在于,包括:
12.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-9任一项所述的意图识别方法。