一种语音信息处理方法、装置、电子设备及存储介质与流程

文档序号:30635825发布日期:2022-07-05 21:19阅读:94来源:国知局
一种语音信息处理方法、装置、电子设备及存储介质与流程

1.本发明涉及计算机语音交互技术领域,特别涉及一种语音信息处理方法、装置、电子设备及存储介质。


背景技术:

2.随着汽车智能化的发展,车辆已经由过去的工具属性逐渐发展成为一个智能的生活空间,用户在车内需要做的事情也越来越多。要想实现车辆对用户意图的识别和执行,需要通过人机交互才能实现。在驾驶过程中,传统的触控交互无论是在便利性和安全性方面都有很大的缺陷,不适用于驾驶中的人机交互。


技术实现要素:

3.为了解决上述提出的至少一个技术问题,本公开提出了一种语音信息处理方法、装置、电子设备及存储介质。
4.一方面,本公开提供了一种语音信息处理方法,应用于语音处理设备,方法包括:
5.获取语音处理设备的工作状态;
6.响应于工作状态为空闲状态并且语音处理设备接收到语音信息的情况,将工作状态由空闲状态迁移至语义分析状态;
7.在工作状态为语义分析状态并且获取到语音信息的情况下,对语音信息进行分析,确定语音信息中的意图信息;
8.调用意图信息对应的意图处理对象,获取意图处理对象反馈的动作执行结果,意图处理对象用于执行与意图信息相关的至少一个动作;
9.根据动作执行结果,迁移工作状态。
10.在一个可选的实施例中,根据动作执行结果,迁移工作状态,包括:
11.响应于动作执行结果为第一类型值的情况,将工作状态由语义分析状态迁移至准备状态,第一类型值表征意图可执行;
12.在工作状态为准备状态并且获取到第一类型值的情况下,根据意图处理对象确定检查项;
13.响应于存在检查项的情况,执行检查项的系统命令;
14.响应于不存在检查项或检查项执行完成的情况,确定意图处理对象中的至少一个功能项,将工作状态由准备状态迁移至执行状态;
15.响应于工作状态为执行状态的情况,执行功能项的系统命令得到系统命令执行结果;
16.根据系统命令执行结果,迁移工作状态。
17.在一个可选的实施例中,上述根据系统命令执行结果,迁移工作状态,包括:
18.响应于系统命令执行结果为执行成功的情况,将工作状态由执行状态迁移至准备状态;
19.或,
20.响应于系统命令执行结果为最终命令完成或执行错误的情况,将工作状态由执行状态迁移至请求状态;
21.响应于工作状态为请求状态的情况,根据系统命令执行结果生成结果信息,迁移工作状态。
22.在一个可选的实施例中,上述根据系统命令执行结果生成结果信息,迁移工作状态,包括:
23.响应于得到结果信息的情况,将工作状态由请求状态迁移至语义分析状态;
24.响应于工作状态为语义分析状态并且得到结果信息的情况,根据结果信息得到意图执行信息,将工作状态由语义分析状态迁移至结束状态。
25.在一个可选的实施例中,上述根据系统命令执行结果生成结果信息,迁移工作状态还包括:
26.响应于未得到结果信息的情况,将工作状态由请求状态迁移至处理错误状态;
27.响应于工作状态为处理错误状态的情况,获取错误信息,发送提示请求,将工作状态由处理错误状态迁移至显示状态;
28.响应于工作状态为显示状态且收到提示请求的情况,调用显示装置显示错误信息,将工作状态由显示状态迁移至结束状态;
29.响应于工作状态为结束状态的情况,执行结束操作,将工作状态由结束状态回归至空闲状态。
30.在一个可选的实施例中,上述根据动作执行结果,迁移工作状态,还包括:
31.响应于动作执行结果为第二类型值的情况,将工作状态由语义分析状态迁移至显示状态,第二类型值表征意图暂不可执行;
32.响应于工作状态为显示状态并且获取到第二类型值为显示错误的情况,调用显示装置显示提示信息,将工作状态由显示状态迁移至结束状态;
33.或,
34.响应于工作状态为显示状态并且获取到第二类型值为非显示错误的情况,调用显示装置显示提示信息,将工作状态由显示状态迁移至等待用户操作状态。
35.在一个可选的实施例中,上述方法还包括:
36.响应于工作状态为等待用户操作状态并且获取到用户操作信息的情况,将用户操作信息转化为语义信息;
37.响应于得到语义信息的情况,将工作状态由等待用户操作状态迁移至语义分析状态,根据语义信息确定意图信息;
38.响应于工作状态为等待用户操作状态并且未得到用户操作信息的情况,将工作状态由等待用户操作状态迁移至请求状态;
39.响应于工作状态为请求状态的情况,请求后台生成提示用户信息;
40.响应于得到提示用户信息的情况,将工作状态由请求状态迁移至语义分析状态;
41.响应于未得到提示用户信息的情况,将工作状态由请求状态迁移至显示状态。
42.在一个可选的实施例中,上述根据动作执行结果,迁移工作状态,还包括:
43.响应于动作执行结果为第三类型值的情况,将工作状态由语义分析状态迁移至结
束状态,第三类型值表征退出意图执行。
44.在一个可选的实施例中,上述获取意图处理对象反馈的动作执行结果,包括:
45.根据语音信息的分析结果填充词槽;
46.响应于词槽填充完备的情况,得到动作执行结果。
47.第二方面,本发明还提供了一种语音信息处理装置,包括:
48.状态获取模块,用于获取语音处理设备的工作状态;
49.状态迁移模块,用于响应于工作状态为空闲状态并且语音处理设备接收到语音信息的情况,将工作状态由空闲状态迁移至语义分析状态;
50.意图信息确定模块,用于对语音信息进行分析,确定语音信息中的意图信息;
51.调用模块,用于调用意图信息对应的意图处理对象,获取意图处理对象反馈的动作执行结果,意图处理对象用于执行与意图信息相关的至少一个动作;
52.上述状态迁移模块,还用于根据动作执行结果,迁移工作状态。
53.第三方面,本发明还提供了一种电子设备,包括:
54.处理器;
55.用于存储处理器可执行指令的存储器;
56.其中,处理器用于执行指令,以实现上述语音信息处理方法。
57.第四方面,本发明还提供了一种存储介质,当存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述语音信息处理方法。
58.第五方面,本发明还提供了一种计算机程序产品,计算机程序产品包括计算机程序,计算机程序存储在可读存储介质中,计算机设备的至少一个处理器从可读存储介质读取并执行计算机程序,使得设备执行上述语音信息处理方法。
59.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。
60.实施本公开,具有以下有益效果:
61.获取语音处理设备的工作状态;响应于工作状态为空闲状态并且语音处理设备接收到语音信息的情况,将工作状态由空闲状态迁移至语义分析状态;在工作状态为语义分析状态并且获取到语音信息的情况下,对语音信息进行分析,确定语音信息中的意图信息;调用意图信息对应的意图处理对象,获取意图处理对象反馈的动作执行结果,意图处理对象用于执行与意图信息相关的至少一个动作;根据动作执行结果,迁移工作状态。
62.本公开通过对不同工作状态的功能划分及不同工作状态间的迁移实现了对语音信息的处理,相比较其他语音信息处理方法,本公开通过不同工作状态的构建规划了各个工作状态下的处理内容及流程,通过不同的工作状态间的迁移,完成了对语音信息的处理,得到了用户的意图信息,实现了意图信息的执行。在意图执行的过程中,本公开通过意图处理对象来实现意图信息,意图处理对象中封装了执行意图信息所需的功能项和系统命令,调用意图处理对象避免了大量系统资源的调用和冗余代码数据的产生。
63.根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
64.为了更清楚地说明本技术实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
65.图1是根据一示例性实施例示出的实施环境示意图;
66.图2是根据一示例性实施例示出的一种语音信息处理方法的流程图;
67.图3是根据一示例性实施例示出的一种根据动作执行结果迁移工作状态的流程图;
68.图4是根据一示例性实施例示出的一种根据系统命令执行结果迁移工作状态的流程图;
69.图5是根据一示例性实施例示出的一种根据系统命令执行结果生成结果信息迁移工作状态的流程图;
70.图6是根据一示例性实施例示出的另一种根据动作执行结果迁移工作状态的流程图;
71.图7是根据一示例性实施例示出的一种等待用户操作状态的流程图;
72.图8是根据一示例性实施例示出的一种工作状态迁移流程图;
73.图9是根据一示例性实施例示出的一种语音信息处理装置框图;
74.图10是根据一示例性实施例示出的一种用于语音信息处理的电子设备的框图。
具体实施方式
75.下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
76.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
77.以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
78.本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关
系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括a、b、c中的至少一种,可以表示包括从a、b和c构成的集合中选择的任意一个或多个元素。
79.另外,为了更好地说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
80.相关技术中,为实现对语音信息的处理通常采用编程的逻辑方法来实现,在这一过程中会调用大量系统资源,产生大量冗余的代码和数据,拖慢处理进程,而且处理结果不够准确高效。
81.为了提升语音信息处理质量,减少不必要的资源调用,使处理过程更加规划条理,提高语音信息处理的准确率,根据处理结果准确调用系统资源,本公开实施例提供一种语音信息处理方法。
82.请参阅图1,图1是根据一示例性实施例示出的一种应用环境的示意图,如图1所示,该应用环境可以包括服务器01和终端02。
83.在一个可选的实施例中,服务器01可以用于语音信息处理方法进行语音信息处理。具体的,服务器01可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn(content delivery network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。
84.在一个可选的实施例中,终端02可以结合服务器01的语音信息处理方法进行语音信息处理。具体的,终端02可以包括但不限于智能手机、台式计算机、平板电脑、笔记本电脑、智能音箱、数字助理、增强现实(augmented reality,ar)/虚拟现实(virtual reality,vr)设备、智能可穿戴设备等类型的电子设备。可选的,电子设备上运行的操作系统可以包括但不限于安卓系统、ios系统、linux系统、windows系统、unix系统等。
85.例如,在终端02上输入语音信息,服务器01获取终端02上的语音信息;之后,获取语音处理设备的工作状态;响应于工作状态为空闲状态并且语音处理设备接收到语音信息的情况,将工作状态由空闲状态迁移至语义分析状态;在工作状态为语义分析状态并且获取到语音信息的情况下,对语音信息进行分析,确定语音信息中的意图信息;调用意图信息对应的意图处理对象,获取意图处理对象反馈的动作执行结果,意图处理对象用于执行与意图信息相关的至少一个动作;根据动作执行结果,迁移工作状态;最后将语音信息处理结果传输到终端02上。
86.此外,需要说明的是,图1所示的仅仅是本公开提供的一种应用环境,在实际应用中,还可以包括其他应用环境。
87.本说明书实施例中,上述服务器01以及终端02可以通过有线或无线通信方式进行直接或间接地连接,本公开在此不做限制。
88.图2是根据一示例性实施例示出的一种语音信息处理方法的流程图,如图2所示,语音信息处理方法可以应用于服务器、终端,包括以下:
89.步骤s201:获取语音处理设备的工作状态。
90.本公开实施例中,获取语音处理设备的工作状态可以通过访问语音处理设备来实
现。如此,可以了解到语音处理设备当前所处的工作状态。
91.步骤s202:响应于工作状态为空闲状态并且语音处理设备接收到语音信息的情况,将工作状态由空闲状态迁移至语义分析状态。
92.本公开实施例中,响应于工作状态为空闲状态并且语音处理设备接收到语音信息的情况,进行工作状态迁移,将工作状态由空闲状态迁移至语义分析状态。可选的,语音信息可以是通过收声装置接收到的一段语音信号,还可以是用户通过录音设备录入的一段语音信号等。
93.步骤s203:在工作状态为语义分析状态并且获取到语音信息的情况下,对语音信息进行分析,确定语音信息中的意图信息。
94.本公开实施例中,当工作状态处于语义分析状态并且获取到语音信息时,对语音信息进行分析,分析过程可以是先将语音信息转化为文本信息,之后对文本信息进行文本处理得到标准化文本信息,通过对标准化文本信息的分析得到所属的领域和意图,从而得到意图信息。如此,便确定出语音信息中的意图信息。可选的,上述分析过程可以通过调用自动语音识别技术(automatic speech recognition,asr)来实现。
95.步骤s204:调用意图信息对应的意图处理对象,获取意图处理对象反馈的动作执行结果,意图处理对象用于执行与意图信息相关的至少一个动作。
96.本公开实施例中,为实现意图信息,因此调用意图信息对应的意图处理对象,获取意图处理对象反馈的动作执行结果,意图处理对象用于执行与意图信息相关的至少一个动作。意图处理对象中会提前预定义好实现该意图所需的功能项,功能项中包括系统命令和该系统命令的执行状态和结果。因此,当确定出意图信息后,调用意图信息对应的意图处理对象,获取意图处理对象反馈的动作执行结果,以便于实现意图信息。
97.基于上述可知,本公开实施例在语义分析状态下实现了分析处理语音信息进而得到意图信息,本公开实施例中的意图处理对象中封装了执行意图信息所需的功能项和系统命令,在执行意图信息的过程中,直接调用意图信息对应的意图处理对象能够避免出现冗余代码数据,减少在执行过程产生其它与执行意图信息无关的动作,从而避免调用多余的系统资源,提高执行效率。
98.步骤s205:根据动作执行结果,迁移工作状态。
99.图3是根据一示例性实施例示出的一种根据动作执行结果迁移工作状态的流程图,如图3所示,根据动作执行结果,迁移工作状态,包括:
100.步骤s301:响应于动作执行结果为第一类型值的情况,将工作状态由语义分析状态迁移至准备状态,第一类型值表征意图可执行。
101.本公开实施例中,响应于动作执行结果为第一类型值的情况,进行工作状态迁移,将工作状态由语义分析状态迁移至准备状态。可选的,第一类型值可以是动作执行结果的取值为执行意图。
102.步骤s302:在工作状态为准备状态并且获取到第一类型值的情况下,根据意图处理对象确定检查项。
103.本公开实施例中,当工作状态处于准备状态并且获取到第一类型值时,根据意图处理对象确定是否存在检查项。例如,当意图处理对象是打电话意图对应的意图处理对象时,需要先检查蓝牙连接状态,在蓝牙已连接的情况下才能进行打电话的操作,因此,此时
存在检查蓝牙连接状态的检查项。
104.步骤s303:响应于存在检查项的情况,执行检查项的系统命令。
105.本公开实施例中,响应于存在检查项的情况,执行检查项的系统命令。例如,存在检查蓝牙连接状态的检查项时,发现蓝牙未连接,执行蓝牙连接的系统命令。
106.步骤s304:响应于不存在检查项或检查项执行完成的情况,确定意图处理对象中的至少一个功能项,将工作状态由准备状态迁移至执行状态。
107.本公开实施例中,响应于不存在检查项或检查项执行完成的情况,由于要实现意图可能需要一个或一个以上的功能项才能完成,因此确定意图处理对象中的至少一个功能项,进行工作状态迁移,将工作状态由准备状态迁移至执行状态。
108.步骤s305:响应于工作状态为执行状态的情况,执行功能项的系统命令得到系统命令执行结果。
109.本公开实施例中,响应于工作状态为执行状态的情况,执行功能项的系统命令,得到系统命令执行结果。在执行过程中,若遇到一次执行不成功的情况,如信号未发送成功、未接收到信号等,可以再次重试,后台能够设置最大重试次数。
110.基于上述可知,本公开实施例通过准备状态和执行状态实现了意图处理对象的执行,完成了意图信息的执行过程,通过准备状态下和执行状态下各自的工作步骤的条理规划,使执行过程条理清晰,准确无误。针对执行过程可能会出现的执行不成功的情况,本公开实施例还能够通过重试来实现系统命令的执行,有效提高了执行的成功率。
111.步骤s306:根据系统命令执行结果,迁移工作状态。
112.图4是根据一示例性实施例示出的一种根据系统命令执行结果迁移工作状态的流程图,如图4所示,根据系统命令执行结果,迁移工作状态,包括:
113.步骤s401:响应于系统命令执行结果为执行成功的情况,将工作状态由执行状态迁移至准备状态。
114.本公开实施例中,响应于系统命令执行结果为执行成功的情况,进行工作状态迁移,将工作状态由执行状态迁移至准备状态,确定出下一功能项,并将工作状态重新迁回至执行状态。
115.或,
116.步骤s402:响应于系统命令执行结果为最终命令完成或执行错误的情况,将工作状态由执行状态迁移至请求状态。
117.本公开实施例中,响应于系统命令执行结果为最终命令完成或执行错误的情况,进行工作状态迁移,将工作状态由执行状态迁移至请求状态。
118.步骤s403:响应于工作状态为请求状态的情况,根据系统命令执行结果生成结果信息,迁移工作状态。
119.基于上述可知,本公开实施例针对不同的系统命令执行结果设置了不同的工作状态迁移方式,将不同的系统命令执行结果分开处理使得对系统命令执行结果的处理更具有条理性,实现了对系统命令执行结果的层次化处理,有效防止了处理混乱现象的发生。有助于提高处理效率。
120.图5是根据一示例性实施例示出的一种根据系统命令执行结果生成结果信息迁移工作状态的流程图,如图5所示,根据系统命令执行结果生成结果信息,迁移工作状态,包
括:
121.步骤s501:响应于得到结果信息的情况,将工作状态由请求状态迁移至语义分析状态。
122.本公开实施例中,响应于得到结果信息的情况,进行工作状态迁移,将工作状态由请求状态迁移至语义分析状态。
123.步骤s502:响应于工作状态为语义分析状态并且得到结果信息的情况,根据结果信息得到意图执行信息,将工作状态由语义分析状态迁移至结束状态。
124.本公开实施例中,响应于工作状态为语义分析状态并且得到结果信息的情况,根据结果信息得到意图执行信息。例如,得到意图执行信息为意图已执行。随后进行工作状态迁移,将工作状态由语义分析状态迁移至结束状态。
125.基于上述可知,本公开实施例在得到结果信息后根据结果信息得到意图执行信息,实现了对意图执行情况的了解。通过意图执行信息的反馈,能够了解到意图执行的情况,进而确保意图已执行后再进入结束状态,完善了意图执行流程。
126.如图5所示,上述根据系统命令执行结果生成结果信息,迁移工作状态,还包括:
127.步骤s503:响应于未得到结果信息的情况,将工作状态由请求状态迁移至处理错误状态。
128.本公开实施例中,响应于未得到结果信息的情况,说明遇到处理错误,进行工作状态迁移,将工作状态由请求状态迁移至处理错误状态。
129.步骤s504:响应于工作状态为处理错误状态的情况,获取错误信息,发送提示请求,将工作状态由处理错误状态迁移至显示状态。
130.本公开实施例中,响应于工作状态为处理错误状态的情况,获取错误信息。可选的,错误信息可以包括:请求超时、网络错误等。随后发送提示请求,进行工作状态迁移,将工作状态由处理错误状态迁移至显示状态。
131.步骤s505:响应于工作状态为显示状态且收到提示请求的情况,调用显示装置显示错误信息,将工作状态由显示状态迁移至结束状态。
132.本公开实施例中,响应于工作状态为显示状态且收到提示请求的情况,通过调用显示装置显示错误信息。可选的,调用显示装置显示错误信息可以是1)调用图形用户显示界面显示错误信息;2)调用音响设备播报错误信息;3)调用图形用户显示界面显示错误信息,同时调用音响设备播报错误信息。随后进行工作状态迁移,将工作状态由显示状态迁移至结束状态。
133.步骤s506:响应于工作状态为结束状态的情况,执行结束操作,将工作状态由结束状态回归至空闲状态。
134.本公开实施例中,响应于工作状态为结束状态的情况,执行结束操作。可选的,结束操作可以包括:调用音响设备播报结束提示音、参数复位、关闭已打开的资源、释放内存等。随后,进行工作状态迁移,将工作状态由显示状态迁移至结束状态。
135.基于上述可知,本公开实施例针对未得到结果信息的情况,设置了工作状态迁移过程,经处理错误状态的分析处理和显示状态的显示处理,实现了错误信息的获取以及向用户反馈错误信息,使用户了解到错误信息内容,以便于用户的后续处置,增强了人机交互的实用性。
136.图6是根据一示例性实施例示出的另一种根据动作执行结果迁移工作状态的流程图,如图6所示,根据动作执行结果,迁移工作状态,还包括:
137.步骤s601:响应于动作执行结果为第二类型值的情况,将工作状态由语义分析状态迁移至显示状态,第二类型值表征意图暂不可执行。
138.本公开实施例中,响应于动作执行结果为第二类型值的情况,进行工作状态迁移,将工作状态由语义分析状态迁移至显示状态。可选的,第二类型值可以是动作执行结果的取值为显示错误、上一页、下一页、显示提示、无效话语。
139.步骤s602:响应于工作状态为显示状态并且获取到第二类型值为显示错误的情况,调用显示装置显示提示信息,将工作状态由显示状态迁移至结束状态。
140.本公开实施例中,响应于工作状态为显示状态并且获取到第二类型值为显示错误的情况,调用显示装置显示提示信息,随后进行工作状态迁移,将工作状态由显示状态迁移至结束状态。
141.或,
142.步骤s603:响应于工作状态为显示状态并且获取到第二类型值为非显示错误的情况,调用显示装置显示提示信息,将工作状态由显示状态迁移至等待用户操作状态。
143.本公开实施例中,响应于工作状态为显示状态并且获取到第二类型值为非显示错误的情况,通过调用显示装置显示提示信息。可选的,调用显示装置显示提示信息可以是1)调用图形用户显示界面显示提示信息;2)调用音响设备播报提示信息;3)调用图形用户显示界面显示提示信息,同时调用音响设备播报提示信息。当动作执行结果的取值为无效话语,调用音响设备播报提示信息,不调用图形用户显示界面显示提示信息。例如,用户说的话语不符合当前当前语境,如提示用户“你要打电话给谁”,用户说“哈哈哈”,此种情况下动作执行结果的取值为无效话语,调用音响设备提示用户,语音播报“我没有听清,请再说一遍”,不调用图形用户显示界面显示更新提示信息。随后进行工作状态迁移,将工作状态由显示状态迁移至等待用户操作状态。
144.基于上述可知,本公开实施例针对不同的第二类型值设定了不同的工作状态迁移方式,通过显示状态下对第二类型值动作执行结果的分情况处理,实现了不同的工作状态迁移,在处理流程上实现了分步处理,满足了层次化的处理需求,使处理流程更具有条理性。
145.图7是根据一示例性实施例示出的一种等待用户操作状态的流程图,如图7所示,上述方法还包括:
146.步骤s701:响应于工作状态为等待用户操作状态并且获取到用户操作信息的情况,将用户操作信息转化为语义信息。
147.本公开实施例中,响应于工作状态为等待用户操作状态并且获取到用户操作信息的情况,请求后台将用户操作信息转化为语义信息。可选的,获取用户操作信息的方式可以是:1)开启录音设备录音;2)等待用户通过图形用户显示界面选择操作;3)开启录音设备录音,同时等待用户通过图形用户显示界面选择操作。根据用户操作信息请求后台生成语义信息。
148.步骤s702:响应于得到语义信息的情况,将工作状态由等待用户操作状态迁移至语义分析状态,根据语义信息确定意图信息。
149.本公开实施例中,响应于得到语义信息的情况,即接收到后台发出的语义信息,进行工作状态迁移,将工作状态由等待用户操作状态迁移至语义分析状态,对语义信息进行分析处理确定出意图信息,后续过程在此不做赘述。
150.步骤s703:响应于工作状态为等待用户操作状态并且未得到用户操作信息的情况,将工作状态由等待用户操作状态迁移至请求状态。
151.本公开实施例中,响应于工作状态为等待用户操作状态并且未得到用户操作信息的情况,进行工作状态迁移,将工作状态由等待用户操作状态迁移至请求状态。后台可设置最大重试次数。
152.步骤s704:响应于工作状态为请求状态的情况,请求后台生成提示用户信息;响应于得到提示用户信息的情况,将工作状态由请求状态迁移至语义分析状态;响应于未得到提示用户信息的情况,将工作状态由请求状态迁移至显示状态。
153.本公开实施例中,响应于工作状态为请求状态的情况,请求后台生成提示用户信息,进行工作状态迁移。响应于得到提示用户信息的情况,提示用户信息以语义信息的形式下发,将工作状态由请求状态迁移至语义分析状态;响应于未得到提示用户信息的情况,将工作状态由请求状态迁移至显示状态。
154.基于上述可知,本公开实施例根据等待用户操作状态下出现的不同情况设定了不同的工作状态迁移方式,响应于得到用户操作信息的情况,通过对用户操作信息的获取和处理实现了对用户意图信息的再次获取;响应于未得到用户操作信息的情况,本公开实施例还能够提示用户进行操作,满足人性化需求。
155.在一个可选的实施例中,根据动作执行结果,迁移工作状态,还包括:
156.响应于动作执行结果为第三类型值的情况,将工作状态由语义分析状态迁移至结束状态,第三类型值表征退出意图执行。
157.本公开实施例中,响应于动作执行结果为第三类型值的情况,进行工作状态迁移,将工作状态由语义分析状态迁移至准备状态。可选的,第三类型值可以是动作执行结果的取值为退出。基于上述可知,本公开实施例实现了退出意图信息的识别,完成了识别到用户的退出意图后退出语音信息处理的工作状态迁移流程。
158.上述实施例中,第一类型值、第二类型值和第三类型值都是部分动作执行结果。第一类型值是动作执行结果取值为执行意图,第二类型值是动作执行结果取值为显示错误、上一页、下一页、显示提示、无效话语,第三类型值是动作执行结果取值为退出。“第一”、“第二”、“第三”仅用于区别不同类别的部分动作执行结果,而不必用于描述特定的顺序或先后次序,在适当情况下可以互换。
159.在一个可选的实施例中,步骤s204中,获取意图处理对象反馈的动作执行结果,包括:
160.根据语音信息的分析结果填充词槽;响应于词槽填充完备的情况,得到动作执行结果。
161.本公开实施例中,根据语音信息的分析结果取出其中的特征词不断填充词槽,响应于词槽填充完备的情况,即词槽填满,得到动作执行结果。可选的,上述根据语音信息的分析结果填充词槽的过程可通过调用自动语音识别技术(automatic speech recognition,asr)来完成。
162.上述实施例中,本公开通过对不同工作状态的功能划分及不同工作状态间的迁移实现了对语音信息的处理,优化了对系统资源的调用。相比较其他语音信息处理方法,本公开通过不同工作状态的构建规划了各个工作状态下的处理内容及流程,通过不同的工作状态间的迁移,完成了对语音信息的处理,得到了用户的意图信息,实现了意图信息的执行。在意图执行的过程中,本公开通过意图处理对象来实现意图信息,意图处理对象中封装了执行意图信息所需的功能项和系统命令,调用意图处理对象避免了大量系统资源的调用和冗余代码数据的产生。
163.在一个具体的实施方式中,以打电话这一意图为例详述本技术实施例中的技术方案。图8是根据一示例性实施例示出的一种工作状态迁移流程图。参照图8,工作状态包括:空闲状态801、语义分析状态802、显示状态803、等待用户操作状态804、准备状态805、执行状态806、请求状态807、处理错误状态808和结束状态809。
164.响应于工作状态为空闲状态801并且语音处理设备接收到语音信息“我要打电话”的情况,将工作状态由空闲状态801迁移至语义分析状态802;
165.在工作状态为语义分析状态802并且获取到语音信息“我要打电话”的情况下,对语音信息“我要打电话”进行分析,确定出语音信息“我要打电话”中的意图信息为“打电话”;
166.调用意图信息“打电话”对应的打电话意图处理对象,获取打电话意图处理对象反馈的动作执行结果,打电话意图处理对象用于执行与意图信息“打电话”相关的至少一个动作;
167.由于执行打电话意图处理对象需要确定电话呼叫对象的姓名及电话号码,而当前并不知道用户想要呼叫的对象,因此,意图暂不可执行,还需要向用户确认呼叫对象的姓名及电话号码;
168.打电话意图处理对象反馈的动作执行结果为第二类型值中的显示提示;
169.响应于动作执行结果为第二类型值,将工作状态由语义分析状态802迁移至显示状态803;
170.响应于工作状态为显示状态803并且获取到第二类型值为非显示错误的情况,调用显示装置显示提示信息,如调用图形用户显示界面显示提示信息,同时调用音响设备播报提示信息“你要打给谁”,在图形用户显示界面显示完成,音响设备播报完成后,将工作状态由显示状态803迁移至等待用户操作状态804。
171.在等待用户操作状态804,开启录音设备录音,同时等待用户通过图形用户显示界面选择操作。用户讲话“打给李华”,获取到用户操作信息“打给李华”。
172.响应于工作状态为等待用户操作状态804并且获取到用户操作信息“打给李华”,将用户操作信息“打给李华”转化为语义信息;
173.响应于得到语义信息的情况,将工作状态由等待用户操作状态804迁移至语义分析状态802,根据语义信息确定出用户意图信息为“打电话给李华”;
174.由于李华的电话号码可能有多个,仍需用户选择拨打哪个号码,因此意图暂不可执行,打电话意图处理对象反馈的动作执行结果仍为第二类型值中的显示提示;
175.响应于动作执行结果为第二类型值,将工作状态由语义分析状态802迁移至显示状态803;
176.响应于工作状态为显示状态803并且获取到第二类型值为非显示错误的情况,调用显示装置显示提示信息,如调用图形用户显示界面显示提示信息,同时调用音响设备播报提示信息“请选择电话号码”,在图形用户显示界面显示完成,音响设备播报完成后,将工作状态由显示状态803迁移至等待用户操作状态804;
177.在等待用户操作状态804,开启录音设备录音,同时等待用户通过图形用户显示界面选择操作。用户讲话“打给座机号码12345”,获取到用户操作信息“打给座机号码12345”;
178.响应于工作状态为等待用户操作状态804并且获取到用户操作信息“打给座机号码12345”,将用户操作信息“打给座机号码12345”转化为语义信息;
179.响应于得到语义信息的情况,将工作状态由等待用户操作状态804迁移至语义分析状态802,确定出用户意图信息“打电话给李华座机号码12345”;
180.此时,用户想要呼叫的对象和电话号码都已确认,意图可执行,打电话意图处理对象反馈的动作执行结果为第一类型值执行意图;
181.响应于动作执行结果为第一类型值的情况,将工作状态由语义分析状态802迁移至准备状态805;
182.在工作状态为准备状态805并且获取到第一类型值的情况下,根据打电话意图处理对象确定检查项;
183.由于打电话需要首先确定蓝牙状态是否已连接,因此存在检查项检查蓝牙连接状态;
184.响应于存在检查项检查蓝牙连接状态的情况,执行检查项的系统命令,确定蓝牙已连接,检查项检查蓝牙连接状态执行完成;
185.响应于检查项检查蓝牙连接状态执行完成的情况,确定打电话意图处理对象中的至少一个功能项,将工作状态由准备状态805迁移至执行状态806;
186.响应于工作状态为执行状态806的情况,执行功能项的系统命令拨打电话,由于只有拨打电话的系统命令,拨打完成后,得到系统命令执行结果为最终命令完成;
187.根据系统命令执行结果,迁移工作状态;
188.响应于系统命令执行结果为最终命令完成的情况,将工作状态由执行状态迁移至请求状态807;
189.响应于工作状态为请求状态807的情况,根据系统命令执行结果生成结果信息,迁移工作状态;
190.响应于得到结果信息的情况,将工作状态由请求状态807迁移至语义分析状态802;
191.响应于工作状态为语义分析状态802并且得到结果信息的情况,根据结果信息得到意图执行信息,如:意图已执行,将工作状态由语义分析状态802迁移至结束状态809;
192.响应于工作状态为结束状态809的情况,执行结束操作,如调用音响设备播报结束提示音,将调用的参数复位,关闭已打开的资源,释放内存等,结束操作执行完成后,将工作状态由结束状态809回归至空闲状态801。
193.前述根据系统命令执行结果生成结果信息,如遇到请求超时或出现网络错误,未得到生成的结果信息,后续工作状态迁移按如下进行;
194.响应于未得到结果信息的情况,将工作状态由请求状态807迁移至处理错误状态
808;
195.响应于工作状态为处理错误状态808的情况,获取错误信息,发送提示请求,将工作状态由处理错误状态808迁移至显示状态803;
196.响应于工作状态为显示状态803且收到提示请求的情况,调用显示装置显示错误信息,以错误信息为“网络错误”为例,调用图形用户显示界面显示错误信息“网络错误”,同时调用音响设备播报错误信息“网络错误”,提示完成后,将工作状态由显示状态803迁移至结束状态809;
197.响应于工作状态为结束状态809的情况,执行结束操作,如调用音响设备播报结束提示音,将调用的参数复位,关闭已打开的资源,释放内存等,结束操作执行完成后,将工作状态由结束状态809回归至空闲状态801。
198.图9是根据一示例性实施例示出的一种语音信息处理装置框图。参照图9,该装置包括状态获取模块901、状态迁移模块902、意图信息确定模块903和调用模块904,其中,
199.状态获取模块901,用于获取语音处理设备的工作状态;
200.状态迁移模块902,用于响应于工作状态为空闲状态并且语音处理设备接收到语音信息的情况,将工作状态由空闲状态迁移至语义分析状态;
201.意图信息确定模块903,用于对语音信息进行分析,确定语音信息中的意图信息;
202.调用模块904,用于调用意图信息对应的意图处理对象,获取意图处理对象反馈的动作执行结果,意图处理对象用于执行与意图信息相关的至少一个动作;
203.上述状态迁移模块902,还用于根据动作执行结果,迁移工作状态。
204.在一个可选的实施例中,上述状态迁移模块902,包括:
205.第一迁移模块,用于响应于动作执行结果为第一类型值的情况,将工作状态由语义分析状态迁移至准备状态;
206.上述第一迁移模块,还用于在工作状态为准备状态并且获取到第一类型值的情况下,根据意图处理对象确定检查项;
207.上述第一迁移模块,还用于响应于存在检查项的情况,执行检查项的系统命令;
208.第二迁移模块,还用于响应于不存在检查项或检查项执行完成的情况,确定意图处理对象中的至少一个功能项,将工作状态由准备状态迁移至执行状态;
209.上述第二迁移模块,还用于响应于工作状态为执行状态的情况,执行功能项的系统命令得到系统命令执行结果;
210.第三迁移模块,用于根据系统命令执行结果,迁移工作状态。
211.在一个可选的实施例中,上述第三迁移模块,包括:
212.第四迁移模块,用于响应于系统命令执行结果为执行成功的情况,将工作状态由执行状态迁移至准备状态;
213.或,
214.上述第四迁移模块,用于响应于系统命令执行结果为最终命令完成或执行错误的情况,将工作状态由执行状态迁移至请求状态;
215.第五迁移模块,用于响应于工作状态为请求状态的情况,根据系统命令执行结果生成结果信息,迁移工作状态。
216.在一个可选的实施例中,上述第五迁移模块,包括:
217.第六迁移模块,用于响应于得到结果信息的情况,将工作状态由请求状态迁移至语义分析状态;
218.上述第六迁移模块,还用于响应于工作状态为语义分析状态并且得到结果信息的情况,根据结果信息得到意图执行信息,将工作状态由语义分析状态迁移至结束状态。
219.在一个可选的实施例中,上述第五迁移模块,还包括:
220.第七迁移模块,用于响应于未得到结果信息的情况,将工作状态由请求状态迁移至处理错误状态;
221.上述第七迁移模块,还用于响应于工作状态为处理错误状态的情况,获取错误信息,发送提示请求,将工作状态由处理错误状态迁移至显示状态;
222.上述第七迁移模块,还用于响应于工作状态为显示状态且收到提示请求的情况,调用显示装置显示错误信息,将工作状态由显示状态迁移至结束状态;
223.上述第七迁移模块,还用于响应于工作状态为结束状态的情况,执行结束操作,将工作状态由结束状态回归至空闲状态。
224.在一个可选的实施例中,上述上述状态迁移模块902,还包括:
225.第八迁移模块,用于响应于动作执行结果为第二类型值的情况,将工作状态由语义分析状态迁移至显示状态;
226.上述第八迁移模块,还用于响应于工作状态为显示状态并且获取到第二类型值为显示错误的情况,调用显示装置显示提示信息,将工作状态由显示状态迁移至结束状态;
227.或,
228.上述第八迁移模块,还用于响应于工作状态为显示状态并且获取到第二类型值为非显示错误的情况,调用显示装置显示提示信息,将工作状态由显示状态迁移至等待用户操作状态。
229.在一个可选的实施例中,上述第八迁移模块还包括:
230.第九迁移模块,用于响应于工作状态为等待用户操作状态并且获取到用户操作信息的情况,将用户操作信息转化为语义信息;
231.上述第九迁移模块,还用于响应于得到语义信息的情况,将工作状态由等待用户操作状态迁移至语义分析状态,根据语义信息确定意图信息;
232.上述第九迁移模块,还用于响应于工作状态为等待用户操作状态并且未得到用户操作信息的情况,将工作状态由等待用户操作状态迁移至请求状态;
233.上述第九迁移模块,还用于响应于工作状态为请求状态的情况,请求后台生成提示用户信息,迁移工作状态。
234.在一个可选的实施例中,上述状态迁移模块902,还包括:
235.第十迁移模块,用于响应于动作执行结果为第三类型值的情况,将工作状态由语义分析状态迁移至结束状态。
236.在一个可选的实施例中,上述调用模块904,包括:
237.填充模块,用于根据语音信息的分析结果填充词槽;
238.动作执行结果模块,用于响应于词槽填充完备的情况,得到动作执行结果。
239.关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
240.在示例性实施例中,还提供了一种电子设备,包括:处理器;用于存储该处理器可执行指令的存储器;其中,该处理器用于该指令,以实现如本公开实施例中的语音信息处理方法。
241.图9是根据一示例性实施例示出的一种用于语音信息处理的电子设备的框图,该电子设备可以是终端,其内部结构图可以如图9所示。该电子设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种语音信息处理方法。该电子设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该电子设备的输入装置可以是显示屏上覆盖的触摸层,也可以是电子设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
242.本领域技术人员可以理解,图9中示出的结构,仅仅是与本公开方案相关的部分结构的框图,并不构成对本公开方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
243.在示例性实施例中,还提供了一种存储介质,当该存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行本公开实施例中的语音信息处理方法。
244.在示例性实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行本公开实施例中的语音信息处理方法。
245.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本公开所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
246.本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
247.应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1