本发明涉及自动驾驶,尤其涉及一种根据语音匹配按钮的方法、装置以及电子设备。
背景技术:
1、消费群体变迁和新盈利模式塑造的双重推动下,汽车“智能化”在加速发展,“智能化”边界也在不断扩容。在整车智能化中,除了自动驾驶外,占据核心位置的就是“智能座舱”。车内的物理按键逐渐被收进了电子大屏中,通过“语音”触发“模拟点触”实现人机交互,即为“可见即可说”,即:用户在车机上看见的任何文字、按钮,都可以直接通过下发语音指令进行交互,如“点击蓝牙开关”、“点导航按钮”。
2、目前现有“可见即可说”的实现方案分为2种途径:一是通过字符串全匹配的方式,通过判定用户指令文本与屏幕显示的文本,是否完全匹配,此方法存在的问题在于,完全匹配使得用户指令受限,不能够识别更自然的表达说法。二是通过规则模板的方式,通过定义大量的规则句式模板,再与屏幕上的显示文本进行结合,此方法一定程度上,会带来更多的句式支持,但受限于大量规则句式的定义和维护,规则定义受限,维护成本和使用成本高。
3、因此,现有技术存在规则定义受限,不能识别自然表达说法下的用户语音的问题。
技术实现思路
1、本技术提供了一种根据语音匹配按钮的方法、装置以及电子设备,以至少解决相关技术中存在规则定义受限,不能识别自然表达说法下的用户语音的问题。
2、根据本技术实施例的一个方面,提供了一种根据语音匹配按钮的方法,该方法包括:
3、将用户的语音信息转换为指令文本;
4、将所述指令文本进行字符匹配,判断是否能够得到目标按钮;
5、在无法得到所述目标按钮情况下,将所述指令文本进行第一逻辑匹配,得到第一召回结果;
6、将所述指令文本进行第二逻辑匹配,得到第二召回结果;
7、根据所述第一召回结果和所述第二召回结果,得到所述目标按钮。
8、根据本技术实施例的另一个方面,还提供了一种根据语音匹配按钮的装置,该装置包括:
9、转换模块,用于将用户的语音信息转换为指令文本;
10、第一匹配模块,用于将所述指令文本进行字符匹配,判断是否能够得到目标按钮;
11、第二匹配模块,用于在无法得到所述目标按钮情况下,将所述指令文本进行第一逻辑匹配,得到第一召回结果;
12、第三匹配模块,用于将所述指令文本进行第二逻辑匹配,得到第二召回结果;
13、得到模块,用于根据所述第一召回结果和所述第二召回结果,得到所述目标按钮。
14、可选地,第二匹配模块包括:
15、输入单元,用于将所述指令文本输入预设模型,得到所述指令文本对应的语义槽、话术领域、以及语义意图;
16、第一获取单元,用于获取第一预设种类按钮的第一预设按钮定义,其中,所述第一预设按钮定义包括每个第一预设种类按钮的语义槽规则、话术领域规则、以及语义意图规则;
17、第一得到单元,用于在所述指令文本对应的语义槽、话术领域、以及语义意图分别与同一个第一预设种类按钮的所述语义槽规则、所述话术领域规则、以及所述语义意图规则匹配成功的情况下,得到所述第一召回结果。
18、可选地,第一获取单元包括:
19、第一获取子模块,用于获取每个所述第一预设种类按钮对应的正确语义槽类型和名称、错误语义槽类型和名称,其中,所述错误语义槽类型和名称用于避免匹配错误;
20、第一生成子模块,用于根据所述正确语义槽类型和名称、所述错误语义槽类型和名称,生成所述语义槽规则;
21、第二获取子模块,用于获取每个所述第一预设种类按钮的对应的所述话术领域规则和所述语义意图规则;
22、第三获取子模块,用于获取每个所述第一预设种类按钮的第一标识;
23、第二生成子模块,用于根据所述第一标识、所述语义槽规则、所述话术领域规则以及所述语义意图规则,生成每个所述第一预设种类按钮的所述第一预设按钮定义。
24、可选地,第三匹配模块包括:
25、第二获取单元,用于获取字典文件和召回路径文件;
26、构建单元,用于根据所述字典文件,构建前缀树;
27、第二得到单元,用于将所述指令文本进行分词处理,得到词列表;
28、第三得到单元,用于根据所述词列表、预设匹配方法、所述字典文件以及所述前缀树,得到候选主成分词,其中,所述候选主成分词包含按钮的候选主体名称和候选动作;
29、生成单元,用于根据所述候选主成分词,生成候选召回路径集,其中,所述候选召回路径集包含第一预设数量个候选召回路径;
30、判断单元,用于判断每个所述候选召回路径是否只包含一个所述候选主体名称和一个所述候选动作;
31、删去单元,用于在所述候选召回路径不是只包含一个所述候选主体名称和一个所述候选动作时,删去所述候选召回路径;
32、第四得到单元,用于在所有所述候选召回路径均只包含一个所述候选主体名称和一个所述候选动作的情况下,将所述候选召回路径集中的每个候选召回路径分别与所述召回路径文件中的预设召回路径进行匹配,得到所述第二召回结果。
33、可选地,第二获取单元包括:
34、第四获取子模块,用于获取第二预设种类按钮的第二预设按钮定义,其中,所述第二预设按钮定义包括每个所述第二预设种类按钮的第二标识、主体名称集合以及行为动作集合,所述主体名称集合包括所述第二预设种类按钮的别称名、标准名、错误名,所述行为动作集合包括动作的别称名、标准名、错误名,所述第二预设种类按钮的错误名和所述动作的错误名用于避免匹配错误,所述别称名为除所述标准名之外的正确称呼;
35、第一构建子模块,用于根据所述第二预设种类按钮的别称名、标准名、错误名、所述动作的别称名、标准名、错误名以及预设顺序,构建字典文件;
36、第三生成子模块,用于根据所述第二标识、所述主体名称集合以及所述行为动作集合,生成每个所述第二预设种类按钮对应的第二预设数量个预设召回路径;
37、第二构建子模块,用于根据所述预设召回路径,构建召回路径文件。
38、可选地,第四获取子模块包括:
39、第一获取子单元,用于获取每个所述第二预设种类按钮的别称名、标准名以及错误名;
40、第一构建子单元,用于根据所述第二预设种类按钮的别称名、标准名以及错误名,构建每个所述第二预设种类按钮的主体名称集合;
41、第二获取子单元,用于获取每个所述第二预设种类按钮支持的第三预设数量个所述动作;
42、第三获取子单元,用于获取每个所述动作的别称名、标准名以及错误名;
43、第二构建子单元,用于根据所述动作的别称名、标准名以及错误名,构建每个所述第二预设种类按钮的行为动作集合;
44、第四获取子单元,用于获取每个所述第二预设种类按钮的第二标识;
45、生成子单元,用于根据所述第二标识、所述主体名称集合以及所述行为动作集合,生成每个所述第二预设种类按钮的所述第二预设按钮定义。
46、可选地,第三得到单元包括:
47、第五获取子模块,用于根据所述字典文件获取每个所述第二预设种类按钮的错误名;
48、第一得到子模块,用于根据所述词列表、预设匹配方法、所述字典文件以及所述前缀树,得到命中词;
49、筛选子模块,用于根据所述错误名筛选所述命中词,得到筛选后的命中词;
50、第二得到子模块,用于根据所述筛选后的命中词,得到所述所述候选主成分词。
51、可选地,所述第一召回结果包括命中词长度,得到模块包括:
52、第三获取单元,用于获取当前界面中按钮元素的第三标识;
53、第五得到单元,用于根据所述第一召回结果和所述命中词长度,得到第一中间按钮的第四标识;
54、第六得到单元,用于根据所述第三标识和所述第四标识,得到所述目标按钮;
55、第七得到单元,用于根据所述第二召回结果,得到第二中间按钮的第五标识;
56、第八得到单元,用于根据所述第三标识和所述第五标识,得到所述目标按钮。
57、根据本技术实施例的又一个方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器、通信接口和存储器通过通信总线完成相互间的通信;其中,存储器,用于存储计算机程序;处理器,用于通过运行所述存储器上所存储的所述计算机程序来执行上述任一实施例中的方法步骤。
58、根据本技术实施例的又一个方面,还提供了一种计算机可读的存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一实施例中的方法步骤。
59、在本技术实施例中,通过将用户的语音信息转换为指令文本;将指令文本进行字符匹配,判断是否能够得到目标按钮;在无法得到目标按钮情况下,将指令文本进行第一逻辑匹配,得到第一召回结果;将指令文本进行第二逻辑匹配,得到第二召回结果;根据第一召回结果和第二召回结果,得到目标按钮。通过上述方法,采用3种不同匹配方式对指令文本进行匹配,提升了对各种按钮的匹配成功率,以解决用户不同的需求,放开了传统技术中的规则定义限制。采用3种不同匹配方式,能够识别用户的自然语言,同时通过配置按钮更方便快捷、灵活多变的泛化说法,减少本方法的维护成本、更新成本和用户学习成本。解决了相关技术中存在规则定义受限,不能识别自然表达说法下的用户语音的问题。