本发明属于命令词识别,尤其涉及一种命令词识别方法及电子设备和存储介质。
背景技术:
1、随着越来越多的端侧设备使用语音命令词识别,对该技术的要求也越来越高。端侧设备由于成本和技术的限制,往往没有充裕的计算资源,同时面对的智能家居,控制面板,物联网等场景的命令词存在许多易混淆词,提升易混淆词的识别正确率对用户体验有着关键作用。采用现有技术往往对计算资源要求较高,但是面对低成本芯片往往达不到这样的要求,同时易混淆词有其特殊性无法达到更好的效果。
2、对于现有的易混淆词的识别一些技术是使用两级处理模块,将通过第一识别模块的结果再送入第二识别模块,通过两级识别提升命令词识别正确性。基于音频序列输入第一识别模块生成命令词置信度,基于置信度获得易混淆词,将其送入第二识别模块,进一步区分命令词,缓解易混淆词的误识别问题。现有技术中在第一识别模块的计算结果基础上增加模块二的计算,势必会增加计算占用算力,如果第二识别模块有比较高实时率,那么会带来明显的计算延时造成数据堵塞,这个实时系统是不可忍受的,而低实时率需要芯片有较高的计算能力,从而支持两级模块,这个要求对低成本芯片往往比较苛刻。
3、发明人发现:现有的相似技术需要两级处理模块,增加了计算资源占用;应用于实时系统要求第二识别模块有较低的实时率,对于低成本芯片来说该条件比较苛刻,在调整模块时没有涉及针对易混淆词优化的操作。
技术实现思路
1、本发明实施例旨在至少解决上述技术问题之一。
2、第一方面,本发明实施例提供一种命令词识别方法,包括:获取用户输入的音频,对所述音频进行解码得到解码结果;若所述解码结果匹配到命令词表中的某一命令词,查找所述命令词表中是否存在与所述某一命令词的字符串互为前缀子父串的其他命令词,其中,前缀字符相同的字符串互为前缀子父串;若所述命令词表中存在与所述某一命令词的字符串互为前缀子父串的其他命令词,则根据前缀子父串对应的解码配置进行后续解码;若所述命令词表中不存在与所述某一命令词的字符串互为前缀子父串的其他命令词,则继续采用当前解码配置进行后续解码。
3、第二方面,本发明实施例提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明上述任一项命令词识别方法。
4、第三方面,本发明实施例提供一种存储介质,所述存储介质中存储有一个或多个包括执行指令的程序,所述执行指令能够被电子设备(包括但不限于计算机,服务器,或者网络设备等)读取并执行,以用于执行本发明上述任一项命令词识别方法。
5、第四方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述任一项命令词识别方法。
6、本发明实施例通过判断命令词词表中是否含有前缀子父串,如果含有该种子父串则解码器中使用不同解码配置,可以实现减少父串串子串的错误,同时没有增加计算资源。
1.一种命令词识别方法,包括:
2.根据权利要求1所述的方法,其中,互为前缀子父串的多个字符串中较短的字符串为子串,互为前缀子父串的多个字符串中最长的字符串为父串,所述根据前缀子父串对应的解码配置进行后续解码包括:
3.根据权利要求2所述的方法,其中,所述方法还包括:
4.根据权利要求1所述的方法,其中,所述对所述音频进行解码得到解码结果包括:
5.根据权利要求4所述的方法,其中,所述通过对比学习的方式进行训练包括:
6.根据权利要求5所述的方法,其中,在所述根据所述解码结果对比学习目标序列和混淆序列之前,所述方法还包括:
7.根据权利要求6所述的方法,其中,所述方法还包括:
8.根据权利要求1所述的方法,其中,所述若所述解码结果匹配到命令词表中的某一命令词包括:
9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至8任一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至8任一项所述方法的步骤。