本技术涉及语音交互,具体涉及一种语音交互方法、电子设备、车辆及存储介质。
背景技术:
1、车机智能交互系统已经成为了新型汽车发展的主流方向。车机智能交互系统可以识别用户的语音指令,理解用户的意图,并给出智能化的回答和建议。目前,对于长串的复杂的语音指令,车机智能交互系统难以快速准确的识别,语音交互体验较差。
技术实现思路
1、本技术实施例提供一种语音交互方法、电子设备、车辆及存储介质,可以提高语音交互体验。
2、本技术实施例的第一方面提供了一种语音交互方法,包括:
3、在获取到创建快捷语音指令的意图的情况下,将语音识别到的目标指令与所述快捷语音指令绑定;
4、所述目标指令的复杂度高于所述快捷语音指令的复杂度,所述目标指令用于在检测到所述快捷语音指令的情况下执行。
5、可选的,所述在获取到创建快捷语音指令的意图的情况下,将语音识别到的目标指令与所述快捷语音指令绑定,包括:
6、获取快捷指令文本,将语音识别到的目标指令与所述快捷指令绑定,所述快捷指令文本为所述快捷指令对应的文本。
7、可选的,所述在获取到创建快捷语音指令的意图的情况下,将语音识别到的目标指令与所述快捷语音指令绑定,包括:
8、获取语音意图信息;
9、在所述语音意图信息表征创建快捷语音指令的意图的情况下,确定所述快捷语音指令对应的文本;
10、获取语音识别到的目标指令;
11、将所述目标指令与所述快捷语音指令绑定。
12、可选的,所述获取语音意图信息,包括:
13、获取第一语音指令;
14、对所述第一语音指令进行识别,将识别到的所述第一语音指令的意图确定为语音意图信息。
15、可选的,所述确定所述快捷语音指令对应的文本,包括:
16、发出第一语音交互指令,所述第一语音交互指令用于请求输入快捷语音指令;
17、获取第二语音指令,将识别到的所述第二语音指令对应的文本确定为快捷语音指令对应的文本。
18、可选的,所述获取第二语音指令,将识别到的所述第二语音指令对应的文本确定为快捷语音指令对应的文本,包括:
19、获取第二语音指令,对所述第二语音指令进行识别,得到所述第二语音指令对应的第二语音文本,识别所述第二语音文本的意图;
20、在所述第二语音文本的意图不包含结束快捷指令设置状态的意图,并且不包含重新进入快捷指令状态的意图的情况下,确定所述第二语音文本为快捷语音指令对应的文本。
21、可选的,所述将语音识别到的目标指令与所述快捷语音指令绑定,包括:
22、发出第二语音交互指令,所述第二语音交互指令用于请求输入与所述捷语音指令绑定的指令;
23、获取第三语音指令,对所述第三语音指令进行识别,得到所述第三语音指令对应的第三语音文本,将所述第三语音文本转换为目标指令,建立所述快捷语音指令与所述目标指令的绑定关系。
24、可选的,所述获取语音意图信息,包括:
25、获取第四语音指令;
26、当所述第四语音指令对应的转化后的目标指令满足预设条件时,发出第三语音交互指令,所述第三语音交互指令用于询问是否为所述目标指令创建对应的快捷语音指令;
27、获取针对所述第三语音交互指令的语音回应,将识别到的所述语音回应的意图确定为语音意图信息。
28、可选的,所述确定所述快捷语音指令对应的文本,包括:
29、发出第四语音交互指令,所述第四语音交互指令用于请求输入与所述目标指令对应的快捷语音指令;
30、获取第五语音指令,对所述第五语音指令进行识别,得到所述第五语音指令对应的第五语音文本,识别所述第五语音文本的意图;
31、在所述第五语音文本的意图不包含结束快捷指令设置状态的意图,并且不包含重新进入快捷指令状态的意图的情况下,确定所述第五语音文本为目标快捷语音指令对应的文本。
32、可选的,所述将所述第三语音文本转换为目标指令,包括:
33、将所述第三语音文本拆分为至少一个条件文本和至少一个动作文本,确定所述至少一个条件文本和所述至少一个动作文本之间的对应关系;
34、将所述至少一个条件文本转换为至少一个条件指令,将所述至少一个动作文本转换为至少一个动作指令;
35、基于所述至少一个条件指令、至少一个动作指令、所述至少一个条件指令和所述至少一个动作指令之间的对应关系生成目标指令。
36、可选的,所述将所述第三语音文本拆分为至少一个条件文本和至少一个动作文本,确定所述至少一个条件文本和所述至少一个动作文本之间的对应关系,包括:
37、通过大模型将所述第三语音文本拆分为至少一个条件文本和至少一个动作文本,确定所述至少一个条件文本和所述至少一个动作文本之间的对应关系。
38、可选的,所述通过大模型将所述第三语音文本拆分为至少一个条件文本和至少一个动作文本,确定所述至少一个条件文本和所述至少一个动作文本之间的对应关系之前,所述方法还包括:
39、通过训练数据集对所述大模型进行训练,在所述大模型的训练阶段,通过大模型的低阶调试方法和提示调优方法对所述大模型进行参数调优;第一训练数据包括:条件类文本和动作类文本的组合,所述第一训练数据是所述训练数据集中的任一个。
40、可选的,所述条件类文本包括:时间条件类文本、循环条件类文本、车辆状态类文本、环境状态类文本中的至少一种;所述动作类文本包括:车控动作类文本、导航类文本、车机应用类控制动作文本中的至少一种。
41、可选的,所述在获取到创建快捷语音指令的意图的情况下,将语音识别到的目标指令与所述快捷语音指令绑定之后,所述方法还包括:
42、获取第六语音指令,对所述第六语音指令进行识别,得到所述第六语音指令对应的第六语音文本;
43、在所述第六语音文本与所述快捷语音指令对应的文本匹配的情况下,确定与所述快捷语音指令绑定的目标指令;
44、执行所述目标指令。
45、可选的,所述目标指令包括目标条件指令和所述目标条件指令对应的动作指令;所述执行所述目标指令,包括:
46、在满足所述目标条件指令的情况下,执行所述目标条件指令对应的动作指令。
47、可选的,所述确定与所述快捷语音指令绑定的目标指令,包括:
48、根据第一指令集合与第二指令集合的映射关系,确定与所述快捷语音指令绑定的目标指令;所述第一指令集合包括至少一条快捷语音指令,所述第二指令集合包括至少一条目标指令,所述至少一条快捷语音指令与所述至少一条目标指令一一对应。
49、可选的,所述指令的复杂度与所述指令包含的条件指令数量和动作指令数量之和正相关,或者所述指令的复杂度与所述指令对应的文本长度正相关。
50、本技术实施例的第二方面提供了一种语音交互装置,包括:
51、绑定单元,用于在获取到创建快捷语音指令的意图的情况下,将语音识别到的目标指令与所述快捷语音指令绑定;所述目标指令的复杂度高于所述快捷语音指令的复杂度,所述目标指令用于在检测到所述快捷语音指令的情况下执行。
52、本技术实施例的第三方面提供了一种电子设备,包括处理器和存储器,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如本技术实施例第一方面中的步骤指令。
53、本技术实施例的第四方面提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本技术实施例第一方面中所描述的部分或全部步骤。
54、本技术实施例的第五方面提供了一种计算机程序产品,其中,上述计算机程序产品包括计算机程序,上述计算机程序可操作来使计算机执行如本技术实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
55、本技术实施例的第六方面提供了一种车辆,该车辆包括本技术实施例的第三方面的电子设备。
56、本技术实施例中,在获取到创建快捷语音指令的意图的情况下,将语音识别到的目标指令与快捷语音指令绑定;目标指令的复杂度高于快捷语音指令的复杂度,目标指令用于在检测到快捷语音指令的情况下执行。本技术实施例中,在获取到创建快捷语音指令的意图时,可以将语音识别到的目标指令与所述快捷语音指令绑定,由于目标指令的复杂度高于快捷语音指令的复杂度,只需要检测到复杂度较低的快捷语音指令,即可执行复杂度较高的目标指令,实现对复杂度较高的指令的快速检测与执行,从而提高语音交互体验。