本技术涉及终端,尤其涉及一种语音解析方法、电子设备、可读存储介质及芯片系统。
背景技术:
1、随着终端设备的不断发展,终端设备不但可以根据接收的用户触发的点击等操作执行动作,还可以通过语音助手检测用户发出的语音,根据用户发出的语音执行动作。
2、现有技术中,终端设备可以通过语音助手检测用户发出的语音指令,并结合终端设备当前界面所展示的界面内容,对用户发出的语音指令进行解析,确定语音指令对应的用户意图,之后可以控制终端设备执行与用户意图相匹配的操作。
3、但是,终端设备在某些场景中无法准确理解用户意图,可能会触发错误的操作或反复询问用户,造成终端设备与用户交互效率较低的问题。
技术实现思路
1、本技术提供一种语音解析方法、电子设备、可读存储介质及芯片系统,解决了现有技术中终端设备在某些场景中与用户交互效率较低的问题。
2、为达到上述目的,本技术采用如下技术方案:
3、第一方面,提供一种语音解析方法,包括:
4、获取语音指令和运行的应用程序所发出的信息,所述语音指令用于指示终端设备执行操作,所述应用程序所发出的信息包括用于提醒用户的提醒信息;
5、根据所述语音指令和所述提醒信息,确定所述语音指令对应的用户意图。
6、通过在获取到语音指令时,获取运行的应用程序所发出的信息,将应用程序发出的信息也作为确定用户意图的一个因素,可以提高确定语音指令所对应的用户意图的准确性,从而可以提高终端设备与用户进行语音交互的效率。
7、在第一方面的第一种可能的实现方式中,在所述根据所述语音指令和所述提醒信息,确定所述语音指令对应的用户意图之前,所述方法还包括:
8、获取第一应用程序列表和第二应用程序列表,所述第一应用程序列表为所述终端设备安装的各应用程序的列表,所述第二应用程序列表为所述终端设备当前运行的应用程序的列表;
9、根据所述第一应用程序列表和所述第二应用程序列表,确定与所述语音指令相对应的应用程序的标识、以及所述应用程序的运行状态;
10、所述根据所述语音指令和所述提醒信息,确定所述语音指令对应的用户意图,包括:
11、若所述应用程序的运行状态为后台运行,则根据所述提醒信息、所述语音指令和所述应用程序的标识,确定所述语音指令对应的所述用户意图;
12、若所述应用程序的运行状态为前台运行,则根据所述应用程序的当前界面,获取所述当前界面对应的界面信息,并根据所述语音指令、所述提醒信息和所述界面信息,确定所述语音指令对应的所述用户意图。
13、根据第一应用程序列表和第二应用程序列表,确定与语音指令相对应的应用程序,从而确定该应用程序的运行状态,进而可以根据不同的运行状态,采用不同的方式确定语音指令对应的用户意图,可以提高确定用户意图的灵活性。
14、若该应用程序的运行状态为前台运行,则可以继续获取该应用程序的界面信息,从而可以根据语音指令和提醒信息,再结合获取的界面信息确定语音指令相对应的用户意图,可以提高确定用户意图的准确性。
15、基于第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,所述根据所述应用程序的当前界面,获取所述当前界面对应的界面信息,包括:
16、对所述当前界面进行提取,得到所述当前界面包括的界面内容;
17、对所述界面内容进行解析,得到所述应用程序对应的界面信息。
18、基于第一方面的上述任意一种可能的实现方式,在第一方面的第三种可能的实现方式中,所述获取语音指令和运行的应用程序所发出的信息,包括:
19、在第一时刻获取所述语音指令;
20、根据所述第一时刻,获取在第一时刻之前预设时间内运行的各个所述应用程序所发出的信息。
21、通过在第一时刻获取语音指令,再获取第一时刻之前预设时间内应用程序发出的信息,可以减少获取应用程序发出的信息的工作量,可以提高获取语音指令和应用程序所发出的信息的多样性和灵活性。
22、基于第一方面的上述除第三种之外的其他任意一种可能的实现方式,在第一方面的第四种可能的实现方式中,所述获取运行的应用程序所发出的信息,包括:
23、实时获取运行的所述应用程序所发出的信息。
24、通过实时获取应用程序发出的信息,可以在获取到语音指令时,可以及时结合获取的信息,确定语音指令对应的用户意图,从而可以提高确定用户意图的效率,可以提高获取应用程序所发出的信息的多样性和灵活性。
25、基于第一方面的上述任意一种可能的实现方式,在第一方面的第五种可能的实现方式中,所述获取运行的应用程序所发出的信息,包括:
26、通过预先设置的接口,获取所述终端设备播报的音频数据;
27、采用自动语音识别技术asr对所述音频数据进行转换,得到所述应用程序发出的文本形式的信息。
28、通过采用获取音频数据的方式,获取应用程序所发出的音频数据,并对音频数据进行转换,得到应用程序发出的文本形式的信息,可以提高获取应用程序所发出信息的灵活性。
29、基于第一方面的上述除第五种之外的其他任意一种可能的实现方式,在第一方面的第六种可能的实现方式中,所述获取运行的应用程序所发出的信息,包括:
30、通过预先设置的接口,对所述应用程序发送的文本数据进行提取,得到所述应用程序发出的文本形式的信息。
31、通过采用提取文本数据的方式,获取应用程序所发出的信息,可以提高获取应用程序所发出信息的效率,可以提高获取应用程序所发出信息的灵活性。
32、基于第一方面的上述任意一种可能的实现方式,在第一方面的第七种可能的实现方式中,所述根据所述语音指令和所述提醒信息,确定所述语音指令对应的用户意图之前,所述方法还包括:
33、采用asr技术对所述语音指令进行转换,得到文本形式的文本指令;
34、所述根据所述语音指令和所述提醒信息,确定所述语音指令对应的用户意图,包括:
35、根据所述文本指令和所述提醒信息,确定所述语音指令对应的所述用户意图。
36、通过对语音指令进行转换,得到文本指令,并基于文本指令,结合提醒信息确定用户意图,可以提高确定用户意图的灵活性和多样性。
37、基于第一方面的第七种可能的实现方式,在第一方面的第八种可能的实现方式中,所述采用asr技术对所述语音指令进行转换,得到文本形式的文本指令,包括:
38、采用语音增强技术对所述语音指令进行去噪,得到去噪后的语音指令;
39、采用所述asr技术对所述去噪后的语音指令进行转换,得到文本形式的所述文本指令。
40、通过对语音指令进行去噪,再对去噪后的语音指令进行转换,得到文本指令,可以提高转换文本指令的准确性,从而可以提高确定用户意图的准确性。
41、基于第一方面的上述任意一种可能的实现方式,在第一方面的第九种可能的实现方式中,在所述获取语音指令和运行的应用程序所发出的信息之前,所述方法还包括:
42、根据多种样本数据,建立不同种类的样本数据之间的多种关联关系,多种所述样本数据包括:样本提醒信息、样本界面内容、样本语音指令和样本用户意图,多种所述关联关系包括:所述样本用户意图与所述样本提醒信息之间的关联关系,所述样本用户意图与所述样本语音指令之间的关联关系,所述样本用户意图与所述样本界面内容之间的关联关系;
43、根据多种所述关联关系进行训练,得到融合模型,所述融合模型为单个模型或多个模型所组成的模型组。
44、基于第一方面的第九种可能的实现方式,在第一方面的第十种可能的实现方式中,所述根据所述语音指令和所述提醒信息,确定所述语音指令对应的用户意图,包括:
45、通过所述融合模型,结合所述语音指令和所述提醒信息,确定所述语音指令对应的所述用户意图。
46、通过融合模型对获取的语音指令和提醒信息进行解析,得到融合模型输出的与语音指令和提醒信息相匹配的用户意图,可以提高确定用户意图的准确性。
47、基于第一方面的上述任意一种可能的实现方式,在第一方面的第十一种可能的实现方式中,在所述根据所述语音指令和所述提醒信息,确定所述语音指令对应的用户意图之后,所述方法还包括:
48、根据所述用户意图,调用意图执行接口,执行与所述用户意图相匹配的操作。
49、基于第一方面的上述任意一种可能的实现方式,在第一方面的第十二种可能的实现方式中,所述方法应用在多设备场景中,所述多设备场景包括第一终端设备和第二终端设备,所述第一终端设备与所述第二终端设备连接;
50、所述获取语音指令和运行的应用程序所发出的信息,包括:
51、所述第一终端设备获取语音指令和所述第一终端设备运行的应用程序所发出的信息;
52、所述第一终端设备根据所述语音指令,向第二终端设备发送信息请求指令,所述信息请求指令用于指示所述第二终端设备获取、并向所述第一终端设备反馈所述第二终端设备运行的应用程序所发出的信息;
53、所述第一终端设备接收所述第二终端设备反馈的运行的应用程序所发出的信息。
54、在多设备场景中任意一个采集到语音指令的终端设备,可以根据语音指令对多设备场景中的其他设备进行控制,可以提高语音指令控制终端设备的灵活性。
55、第二方面,提供一种语音解析装置,包括:
56、第一获取模块,用于获取语音指令和运行的应用程序所发出的信息,所述语音指令用于指示终端设备执行操作,所述应用程序所发出的信息包括用于提醒用户的提醒信息;
57、第一确定模块,用于根据所述语音指令和所述提醒信息,确定所述语音指令对应的用户意图。
58、在第二方面的第一种可能的实现方式中,所述装置还包括:
59、第二获取模块,用于获取第一应用程序列表和第二应用程序列表,所述第一应用程序列表为所述终端设备安装的各应用程序的列表,所述第二应用程序列表为所述终端设备当前运行的应用程序的列表;
60、第二确定模块,用于根据所述第一应用程序列表和所述第二应用程序列表,确定与所述语音指令相对应的应用程序的标识、以及所述应用程序的运行状态;
61、所述第一确定模块,具体用于若所述应用程序的运行状态为后台运行,则根据所述提醒信息、所述语音指令和所述应用程序的标识,确定所述语音指令对应的所述用户意图;若所述应用程序的运行状态为前台运行,则根据所述应用程序的当前界面,获取所述当前界面对应的界面信息,并根据所述语音指令、所述提醒信息和所述界面信息,确定所述语音指令对应的所述用户意图。
62、基于第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,所述第一确定模块,还具体用于对所述当前界面进行提取,得到所述当前界面包括的界面内容;对所述界面内容进行解析,得到所述应用程序对应的界面信息。
63、基于第二方面的上述任意一种可能的实现方式,在第二方面的第三种可能的实现方式中,所述获第一获取模块,具体用于在第一时刻获取所述语音指令;根据所述第一时刻,获取在第一时刻之前预设时间内运行的各个所述应用程序所发出的信息。
64、基于第二方面的上述除第三种之外的其他任意一种可能的实现方式,在第二方面的第四种可能的实现方式中,所述第一获取模块,具体用于实时获取运行的所述应用程序所发出的信息。
65、基于第二方面的上述任意一种可能的实现方式,在第二方面的第五种可能的实现方式中,所述第一获取模块,还具体用于通过预先设置的接口,获取所述终端设备播报的音频数据;采用自动语音识别技术asr对所述音频数据进行转换,得到所述应用程序发出的文本形式的信息。
66、基于第二方面的上述除第五种之外的其他任意一种可能的实现方式,在第二方面的第六种可能的实现方式中,所述第一获取模块,还具体用于通过预先设置的接口,对所述应用程序发送的文本数据进行提取,得到所述应用程序发出的文本形式的信息。
67、基于第二方面的上述任意一种可能的实现方式,在第二方面的第七种可能的实现方式中,所述装置还包括:
68、转换模块,用于采用asr技术对所述语音指令进行转换,得到文本形式的文本指令;
69、所述第一确定模块,还具体用于根据所述文本指令和所述提醒信息,确定所述语音指令对应的所述用户意图。
70、基于第二方面的第七种可能的实现方式,在第二方面的第八种可能的实现方式中,所述转换模块,具体用于采用语音增强技术对所述语音指令进行去噪,得到去噪后的语音指令;采用所述asr技术对所述去噪后的语音指令进行转换,得到文本形式的所述文本指令。
71、基于第二方面的上述任意一种可能的实现方式,在第二方面的第九种可能的实现方式中,所述装置还包括:
72、建立模块,用于根据多种样本数据,建立不同种类的样本数据之间的多种关联关系,多种所述样本数据包括:样本提醒信息、样本界面内容、样本语音指令和样本用户意图,多种所述关联关系包括:所述样本用户意图与所述样本提醒信息之间的关联关系,所述样本用户意图与所述样本语音指令之间的关联关系,所述样本用户意图与所述样本界面内容之间的关联关系;
73、训练模块,用于根据多种所述关联关系进行训练,得到融合模型,所述融合模型为单个模型或多个模型所组成的模型组。
74、基于第二方面的第九种可能的实现方式,在第二方面的第十种可能的实现方式中,所述第一确定模块,还具体用于通过所述融合模型,结合所述语音指令和所述提醒信息,确定所述语音指令对应的所述用户意图。
75、基于第二方面的上述任意一种可能的实现方式,在第二方面的第十一种可能的实现方式中,所述装置还包括:
76、执行模块,用于根据所述用户意图,调用意图执行接口,执行与所述用户意图相匹配的操作。
77、基于第二方面的上述任意一种可能的实现方式,在第二方面的第十二种可能的实现方式中,所述装置应用在多设备场景中,所述多设备场景包括第一终端设备和第二终端设备,所述第一终端设备与所述第二终端设备连接;
78、所述第一获取模块,还具体用于所述第一终端设备获取语音指令和所述第一终端设备运行的应用程序所发出的信息;并根据所述语音指令,向第二终端设备发送信息请求指令,再接收所述第二终端设备反馈的运行的应用程序所发出的信息,所述信息请求指令用于指示所述第二终端设备获取、并向所述第一终端设备反馈所述第二终端设备运行的应用程序所发出的信息。
79、第三方面,提供一种电子设备,包括:处理器,所述处理器用于运行存储器中存储的计算机程序,以实现如上述第一方面中任一项所述的语音解析方法。
80、第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面中任一项所述的语音解析方法。
81、第五方面,提供一种芯片系统,所述芯片系统包括存储器和处理器,所述处理器执行所述存储器中存储的计算机程序,以实现如上述第一方面中任一项所述的语音解析方法。
82、可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。