语音交互方法、装置、设备及存储介质与流程

文档序号:30061841发布日期:2022-05-17 23:49阅读:107来源:国知局
语音交互方法、装置、设备及存储介质与流程

1.本技术属于计算机技术领域,具体涉及一种语音交互方法、装置、设备及存储介质。


背景技术:

2.随着语音交互技术的发展,语音助手的应用场景越来越广泛,能够为用户提供越来越丰富的服务。语音助手可以与用户进行智能对话和即时问答的智能交互,实现帮忙用户解决问题。以应用内的语音助手为例,用户可以通过语音助手控制应用、查询相关信息及控制智能设备等。
3.目前,语音助手对用户输入的交互内容,在不能根据该交互内容确定用户意图时,需要通过逐步的即时问答的方式来确定用户意图,以基于用户意图提供相关服务的入口;用户如果想使用相关服务,则需要点击相关入口进入相关服务页面,才能使用相关功能,从而增加了用户的操作成本。


技术实现要素:

4.为了解决现有技术中的上述问题,即为了降低用户的操作成本,本技术提供了一种语音交互方法、装置、设备及存储介质。
5.第一方面,本技术提供一种语音交互方法,应用于客户端,该语音交互方法包括:
6.获取用户输入的交互内容;
7.向服务端发送交互内容,以得到与交互内容对应的相关信息;
8.若相关信息为目标服务页面的页面链接,则通过页面链接获取目标服务页面;
9.显示目标服务页面。
10.在一种可能的实现方式中,若相关信息为目标服务页面的页面链接,则通过页面链接获取目标服务页面,包括:若相关信息为目标服务页面的页面链接,且根据页面链接,确定页面链接不需要与预设服务信息进行拼接,则通过页面链接获取目标服务页面,预设服务信息包括当前服务页面的标识信息和当前服务页面的功能信息;或者,若相关信息为目标服务页面的页面链接,且根据页面链接,确定页面链接需要与预设服务信息进行拼接,则将页面链接与预设服务信息进行拼接,获得拼接后的页面链接,通过拼接后的页面链接获取目标服务页面。
11.在一种可能的实现方式中,交互内容包括文本内容,获取用户输入的交互内容,包括:通过键盘输入框,获取用户输入的文本内容。
12.在一种可能的实现方式中,交互内容包括语音内容,获取用户输入的交互内容,包括:通过话筒按钮,获取用户输入的语音信号;对语音信号进行语音识别,得到语音信号包含的语音内容。
13.在一种可能的实现方式中,该语音交互方法还包括:在键盘输入框内,显示语音内容。
14.在一种可能的实现方式中,该语音交互方法还包括:若相关信息为文本类型,则以文本形式显示相关信息;或者,若相关信息为技能卡片类型,则以技能卡片形式显示相关信息。
15.在一种可能的实现方式中,该语音交互方法还包括:若在发送交互内容后预设时长内未得到与交互内容对应的相关信息,则提示用户重新输入交互内容。
16.在一种可能的实现方式中,该语音交互方法还包括:在用户进入当前服务页面时,获取当前服务页面对应的请求中携带的交互内容,以向服务端发送交互内容。
17.第二方面,本技术提供一种语音交互方法,应用于服务端,该语音交互方法包括:
18.接收来自客户端的交互内容;
19.根据交互内容,从预设列表中匹配与交互内容具有对应关系的目标服务页面的页面链接,获得对应的相关信息;
20.向客户端发送相关信息,相关信息包括目标服务页面的页面链接,以使客户端通过页面链接获取目标服务页面,并显示目标服务页面。
21.在一种可能的实现方式中,向客户端发送相关信息之前,该语音交互方法还包括:若根据交互内容,从预设列表中未匹配到与交互内容具有对应关系的目标服务页面的页面链接,则获取与交互内容对应的相关信息,相关信息为文本类型;或者,若根据交互内容,从预设列表中未匹配到与交互内容具有对应关系的目标服务页面的页面链接,则获取与交互内容对应的相关信息,相关信息为技能卡片类型。
22.第三方面,本技术提供一种语音交互装置,应用于客户端,该语音交互装置包括:
23.获取模块,用于获取用户输入的交互内容;
24.发送模块,用于向服务端发送交互内容,以得到与交互内容对应的相关信息;
25.处理模块,用于若相关信息为目标服务页面的页面链接,则通过页面链接获取目标服务页面;
26.显示模块,用于显示目标服务页面。
27.在一种可能的实现方式中,处理模块具体用于:若相关信息为目标服务页面的页面链接,且根据页面链接,确定页面链接不需要与预设服务信息进行拼接,则通过页面链接获取目标服务页面,预设服务信息包括当前服务页面的标识信息和当前服务页面的功能信息;或者,若相关信息为目标服务页面的页面链接,且根据页面链接,确定页面链接需要与预设服务信息进行拼接,则将页面链接与预设服务信息进行拼接,获得拼接后的页面链接,通过拼接后的页面链接获取目标服务页面。
28.在一种可能的实现方式中,交互内容包括文本内容,获取模块具体用于:通过键盘输入框,获取用户输入的文本内容。
29.在一种可能的实现方式中,交互内容包括语音内容,获取模块具体用于:通过话筒按钮,获取用户输入的语音信号;对语音信号进行语音识别,得到语音信号包含的语音内容。
30.在一种可能的实现方式中,显示模块还用于:在键盘输入框内,显示语音内容。
31.在一种可能的实现方式中,显示模块还用于:若相关信息为文本类型,则以文本形式显示相关信息;或者,若相关信息为技能卡片类型,则以技能卡片形式显示相关信息。
32.在一种可能的实现方式中,处理模块还用于:若在发送交互内容后预设时长内未
得到与交互内容对应的相关信息,则提示用户重新输入交互内容。
33.在一种可能的实现方式中,获取模块还用于:在用户进入当前服务页面时,获取当前服务页面对应的请求中携带的交互内容,以向服务端发送交互内容。
34.第四方面,本技术提供一种语音交互装置,应用于服务端,该语音交互装置包括:
35.接收模块,用于接收来自客户端的交互内容;
36.处理模块,用于根据交互内容,从预设列表中匹配与交互内容具有对应关系的目标服务页面的页面链接,获得对应的相关信息;
37.发送模块,用于向客户端发送相关信息,相关信息包括目标服务页面的页面链接,以使客户端通过页面链接获取目标服务页面,并显示目标服务页面。
38.在一种可能的实现方式中,处理模块还用于:向客户端发送相关信息之前,若根据交互内容,从预设列表中未匹配到与交互内容具有对应关系的目标服务页面的页面链接,则获取与交互内容对应的相关信息,相关信息为文本类型;或者,若根据交互内容,从预设列表中未匹配到与交互内容具有对应关系的目标服务页面的页面链接,则获取与交互内容对应的相关信息,相关信息为技能卡片类型。
39.第五方面,本技术提供一种电子设备,包括:处理器,以及与处理器通信连接的存储器;
40.存储器存储计算机执行指令;
41.处理器执行存储器存储的计算机执行指令,以实现如本技术第一方面所述的语音交互方法。
42.第六方面,本技术提供一种电子设备,包括:处理器,以及与处理器通信连接的存储器;
43.存储器存储计算机执行指令;
44.处理器执行存储器存储的计算机执行指令,以实现如本技术第二方面所述的语音交互方法。
45.第七方面,本技术提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序指令,计算机程序指令被执行时,实现如本技术第一方面所述的语音交互方法。
46.第八方面,本技术提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序指令,计算机程序指令被执行时,实现如本技术第二方面所述的语音交互方法。
47.第九方面,本技术提供一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现如本技术第一方面所述的语音交互方法。
48.第十方面,本技术提供一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现如本技术第二方面所述的语音交互方法。
49.本领域技术人员能够理解的是,在本技术中,通过客户端获取用户输入的交互内容,向服务端发送交互内容;服务端根据交互内容,从预设列表中匹配与交互内容具有对应关系的目标服务页面的页面链接,获得对应的相关信息;服务端向客户端发送相关信息,相关信息包括目标服务页面的页面链接;若相关信息为目标服务页面的页面链接,则客户端通过页面链接获取目标服务页面,并显示该目标服务页面。由于本技术的服务端根据交互内容,以从预设列表中匹配与交互内容具有对应关系的目标服务页面的页面链接的方式,确定交互内容的意图为需要直接显示对应的目标服务页面,进而将目标服务页面的页面链
接发送给客户端,客户端根据该页面链接直接显示目标服务页面,其中,预设列表可灵活配置,因此,能够大大降低用户的操作成本,提升用户体验,从而提升用户粘性。
附图说明
50.下面参照附图来描述本技术的语音交互方法、装置、设备及存储介质的优选实施方式。附图为:
51.图1为本技术一实施例提供的应用场景示意图;
52.图2为本技术一实施例提供的语音交互方法的信令交互示意图;
53.图3为本技术另一实施例提供的语音交互方法的信令交互示意图;
54.图4为本技术又一实施例提供的语音交互方法的信令交互示意图;
55.图5为本技术一实施例提供的语音交互装置的结构示意图;
56.图6为本技术另一实施例提供的语音交互装置的结构示意图;
57.图7为本技术一实施例提供的电子设备的结构示意图。
具体实施方式
58.首先,本领域技术人员应当理解的是,这些实施方式仅仅用于解释本技术的技术原理,并非旨在限制本技术的保护范围。本领域技术人员可以根据需要对其做出调整,以便适应具体的应用场合。
59.在本技术实施例中使用的术语是仅仅处于描述特定实施例的目的,而非旨在限制本发明。在本技术实施例中所使用的单数形式的“一种”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
60.应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示为:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
61.取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
62.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
63.目前,语音助手是应用交互的一个非常重要的方式。语音助手对用户输入的交互内容的识别结果,通常以文本或技能卡片的形式呈现,或者以语音方式回复,或者通过用户输入的交互内容提供相关服务的入口。一示例中,用户如果想使用相关服务,则需要点击相关服务的入口进入相关服务页面,才能使用相关功能。又一示例中,服务端会根据用户输入的交互内容,直接完成设备控制等操作,同时以文本或者技能卡片的形式通知用户,相关设备的操作行为已经完成。
64.在一些场景下,用户通过语音助手输入交互内容,通常是将语音助手当作一个使用服务的快捷入口,期望以更快捷的方式使用相关服务。一示例中,用户通过语音助手输入的交互内容为“我的场景

母婴模式’详情”,用户并没有直接表达期望执行相关场景服务,因此,应该只是期望了解一下对应场景的详情信息;又一示例中,用户通过语音助手输入的交互内容为“设置我的空调

客厅空调
’”
,用户的意图是期望设置一下对应的设备,但是并没有明确表示具体设置的内容,因此,无法直接帮助用户完成其想要的操作,这时,语音助手将详情页面展示给用户更合适。
65.在上述场景下,如果语音助手给用户呈现的是与用户输入的交互内容对应的相关服务的入口链接或者技能卡片,则需要用户进行继续点击的操作,因此,增加了用户的操作成本,不利于用户体验的提升。
66.相关技术中,一些系统级别的语音助手增加了跳转到相关页面的功能,比如点击语音助手后,会打开系统的天气应用、用于显示时间的时钟应用和用于显示日期的日历应用,而对于设备控制逻辑,则没有直接的跳转逻辑,仅仅控制设备并呈现控制结果。
67.示例性地,对于手机的语音助手,通常只有明确的“打开

xx应用
’”
等明确打开应用的交互内容才会打开相关应用,其他交互内容通常是以文本或者技能卡片等形式进行回复。对于大部分场景,比如智能家居的场景,则没有提供相关推断和自动跳转等逻辑。
68.另外,大部分的应用内语音助手仅仅为自己应用的功能提供服务,不提供非应用服务之外的语音服务。比如,有的应用仅仅显示天气情况后进行播报,没有额外信息的呈现,也不支持点击操作。因此,应用内的语音助手通常不会提供更丰富的语音服务和详情查看功能。
69.基于上述问题,本技术提供一种语音交互方法、装置、设备及存储介质,通过客户端获取用户输入的交互内容,根据交互内容能够直接显示对应的目标服务页面。因此,能够大大降低用户的操作成本,提升用户体验,从而提升用户粘性。
70.以下,首先对本技术提供的方案的应用场景进行示例说明。
71.图1为本技术一实施例提供的应用场景示意图。如图1所示,本应用场景中,用户打开手机101里的应用,通过应用内的客户端输入交互内容,客户端向服务端102发送用户输入的交互内容,服务端102根据用户输入的交互内容确定对应的交互结果,将交互结果发送给客户端,客户端根据交互结果显示相应的内容。其中,服务端102根据用户输入的交互内容确定对应的交互结果以及客户端根据交互结果显示相应的内容的具体实现过程可以参见下述各实施例的方案。
72.需要说明的是,图1仅是本技术实施例提供的一种应用场景的示意图,本技术实施例不对图1中包括的设备进行限定,也不对图1中设备之间的位置关系进行限定。例如,在图1所示的应用场景中,还可以包括数据存储设备,该数据存储设备相对服务端102可以是外部存储器,也可以是集成在服务端102中的内部存储器。
73.接下来,通过具体实施例介绍语音交互方法。
74.图2为本技术一实施例提供的语音交互方法的信令交互示意图。如图2所示,本技术实施例的方法包括:
75.s201、客户端获取用户输入的交互内容。
76.本技术实施例中,示例性地,用户打开移动终端中安装的应用,进入有客户端的服
务页面,完成语音助手的软件开发工具包(software development kit,sdk)的初始化工作。客户端解析服务页面的相关字段,比如可以通过页面传递的信息,解析场景标识(比如用sceneid表示)等与服务页面相关的服务字段;解析与推荐交互内容、设备标识等相关的信息,用于在用户界面(user interface,ui)上的进行展示。用户可以通过客户端输入交互内容,比如用户可以通过客户端的键盘输入框输入交互内容,或者,用户可以通过客户端的话筒按钮输入语音信号,进而客户端获取用户输入的交互内容,用户输入的交互内容比如为“设置我的空调

客厅空调
’”
。可以理解,用户输入的交互内容为客户端待识别的用户的语料。对于客户端具体如何获取用户输入的交互内容,可参见后续实施例,此处不再赘述。
77.s202、客户端向服务端发送交互内容,以得到与交互内容对应的相关信息。
78.相应地,服务端接收来自客户端的交互内容。
79.该步骤中,客户端获取到用户输入的交互内容后,可以向服务端发送交互内容,以得到与交互内容对应的相关信息。服务端则可以接收来自客户端的交互内容。可以理解,与交互内容对应的相关信息包含了与交互内容的意图相对应的信息。
80.s203、服务端根据交互内容,从预设列表中匹配与交互内容具有对应关系的目标服务页面的页面链接,获得对应的相关信息。
81.示例性地,用户输入的每一条交互内容都可能对应一种服务页面,比如用户输入的交互内容为“我的场景

母婴模式’详情”,对应“母婴模式”场景的详情服务页面;比如用户输入的交互内容为“设置我的空调

客厅空调
’”
,对应“客厅空调”的设备详情服务页;比如用户输入的交互内容为“查看治疗便秘的食材信息”,对应“治疗便秘的相关食材”的健康服务页面等。因此,可以预先配置好预设列表,预设列表中包含有交互内容与服务页面的页面链接的对应关系。对于预设列表的配置方式,比如可以通过分析交互内容的意图,通过人工配置预设列表;或者,可以通过算法识别出交互内容所属的领域,从而获得对应的页面链接,本技术不以此为限制。
82.服务端在获得用户输入的交互内容后,可以根据交互内容,从预设列表中匹配与交互内容具有对应关系的目标服务页面的页面链接。比如用户输入的交互内容为“设置我的空调

客厅空调
’”
,由于在预设列表中已经配置了与该交互内容具有对应关系的目标服务页面的页面链接,该页面链接用于显示“客厅空调”的设备详情服务页,因此,服务端可以根据交互内容,从预设列表中匹配到该页面链接。具体地,服务端可以将交互内容与预设列表中的交互内容进行匹配,在匹配到预设列表中的交互内容时,根据匹配到的预设列表中的交互内容,获得对应的目标服务页面的页面链接。对于具体如何进行匹配,比如服务端可以从交互内容中提取关键信息,与预设列表中的交互内容进行匹配,来确定是否匹配到了预设列表中的交互内容;或者,服务端可以将交互内容与预设列表中的交互内容进行匹配,获得对应的匹配度,根据匹配度是否大于阈值,来确定是否匹配到了预设列表中的交互内容,本技术不以此为限制。
83.s204、服务端向客户端发送相关信息,相关信息包括目标服务页面的页面链接,以使客户端通过页面链接获取目标服务页面,并显示目标服务页面。
84.相应地,客户端执行s205、若相关信息为目标服务页面的页面链接,则通过页面链接获取目标服务页面。
85.该步骤中,服务端在获得了与交互内容对应的相关信息后,向客户端发送相关信
息,相关信息包括目标服务页面的页面链接。客户端接收该相关信息,进行数据解析,在确定相关信息为目标服务页面的页面链接后,通过页面链接获取目标服务页面。
86.进一步地,若相关信息为目标服务页面的页面链接,则通过页面链接获取目标服务页面,可以包括:若相关信息为目标服务页面的页面链接,且根据页面链接,确定页面链接不需要与预设服务信息进行拼接,则通过页面链接获取目标服务页面,预设服务信息包括当前服务页面的标识信息和当前服务页面的功能信息;或者,若相关信息为目标服务页面的页面链接,且根据页面链接,确定页面链接需要与预设服务信息进行拼接,则将页面链接与预设服务信息进行拼接,获得拼接后的页面链接,通过拼接后的页面链接获取目标服务页面。
87.示例性地,若根据页面链接,确定页面链接不需要与预设服务信息进行拼接,则根据该页面链接直接进行内部跳转动作,获取目标服务页面。示例性地,页面链接比如为“客厅空调”的设备详情服务页,则客户端根据该页面链接直接进行内部跳转动作,获取“客厅空调”的设备详情服务页。若根据页面链接,确定页面链接需要与预设服务信息进行拼接,则将页面链接与预设服务信息进行拼接,获得拼接后的页面链接,通过拼接后的页面链接获取目标服务页面。示例性地,预设服务信息比如当前服务页面的标识信息,页面链接比如为人工客户服务页面的链接,则客户端将人工客户服务页面的链接和当前服务页面(即用户输入交互内容时所在的服务页面)的标识信息进行拼接,获得拼接后的人工客户服务页面的链接,进而根据拼接后的人工客户服务页面的链接直接进行内部跳转动作,获得对应的人工客户服务页面。需要说明的是,预设服务信息包括当前服务页面的标识信息和当前服务页面的功能信息,还可以包括其他与目标服务页面的页面链接相关的信息,本技术不以此为限制。
88.s206、客户端显示目标服务页面。
89.该步骤中,客户端获取到目标服务页面后,可以显示目标服务页面。示例性地,客户端获取到的目标服务页面比如为“客厅空调”的设备详情服务页,则显示“客厅空调”的设备详情服务页。
90.在上述实施例的基础上,客户端显示目标服务页面后,用户可以通过目标服务页面直接使用相关技能,比如可以控制设备、查看和修改智能场景以及查看健康食谱等,因此,能够方便用户快捷使用相关技能。
91.本技术实施例提供的语音交互方法,通过客户端获取用户输入的交互内容,向服务端发送交互内容;服务端根据交互内容,从预设列表中匹配与交互内容具有对应关系的目标服务页面的页面链接,获得对应的相关信息;服务端向客户端发送相关信息,相关信息包括目标服务页面的页面链接;若相关信息为目标服务页面的页面链接,则客户端通过页面链接获取目标服务页面,并显示该目标服务页面。由于本技术实施例的服务端根据交互内容,以从预设列表中匹配与交互内容具有对应关系的目标服务页面的页面链接的方式,确定交互内容的意图为需要直接显示对应的目标服务页面,进而将目标服务页面的页面链接发送给客户端,客户端根据该页面链接直接显示目标服务页面,其中,预设列表可灵活配置,因此,能够大大降低用户的操作成本,提升用户体验,从而提升用户粘性。
92.在上述实施例的基础上,一种可能的实施方式中,交互内容包括文本内容,客户端获取用户输入的交互内容,可以包括:通过键盘输入框,获取用户输入的文本内容。
93.示例性地,键盘输入框为用户输入交互内容的界面。键盘输入框可以嵌入在用户当前所在的服务页面中,用户点击该输入框即可输入文本内容,因此,客户端可以获取用户输入的文本内容。
94.另一种可能的实施方式中,交互内容包括语音内容,客户端获取用户输入的交互内容,可以包括:通过话筒按钮,获取用户输入的语音信号;对语音信号进行语音识别,得到语音信号包含的语音内容。
95.示例性地,话筒按钮可以嵌入在用户当前所在的服务页面中,用户点击该话筒按钮即可输入语音信号,因此,客户端可以通过话筒按钮获取用户输入的语音信号,进而对语音信号进行语音识别,得到语音信号包含的语音内容。具体如何对语音信号进行语音识别,可参考目前相关技术,此处不再赘述。
96.进一步地,可选的,对于上述交互内容包括语音内容的实施方式中,还可以包括:客户端在键盘输入框内,显示语音内容。
97.客户端对语音信号进行语音识别,得到语音信号包含的语音内容后,可以在键盘输入框内,显示语音内容,通过上述方式,能够方便用户查看自己输入的语音内容与显示的语音内容是否相同。
98.在上述实施例的基础上,考虑到相关信息为文本类型,图3为本技术另一实施例提供的语音交互方法的信令交互示意图。如图3所示,本技术实施例的方法可以包括:
99.s301、客户端获取用户输入的交互内容。
100.该步骤的具体描述可以参见图2所示实施例中s201的相关描述,此处不再赘述。
101.s302、客户端向服务端发送交互内容,以得到与交互内容对应的相关信息。
102.相应地,服务端接收来自客户端的交互内容。
103.该步骤的具体描述可以参见图2所示实施例中s202的相关描述,此处不再赘述。
104.s303、服务端根据交互内容,从预设列表中匹配与交互内容具有对应关系的目标服务页面的页面链接。
105.该步骤的具体描述可以参见图2所示实施例中s203的相关描述,此处不再赘述。
106.s304、若服务端根据交互内容,从预设列表中未匹配到与交互内容具有对应关系的目标服务页面的页面链接,则获取与交互内容对应的相关信息,相关信息为文本类型。
107.示例性地,服务端在根据交互内容,从预设列表中未匹配到与交互内容具有对应关系的目标服务页面的页面链接后,确定与交互内容对应的识别结果需要以文本形式呈现,则获取与交互内容对应的相关信息,相关信息为文本类型。
108.s305、服务端向客户端发送相关信息,相关信息为文本类型。
109.相应地,客户端执行s306、若相关信息为文本类型,则以文本形式显示相关信息。
110.该步骤中,服务端在获取到与交互内容对应的文本类型的相关信息后,将该相关信息发送给客户端。客户端在接收到该相关信息后,以文本形式显示相关信息。
111.本技术实施例提供的语音交互方法,通过服务端根据交互内容,确定从预设列表中未匹配到与交互内容具有对应关系的目标服务页面的页面链接后,则获取与交互内容对应的文本类型的相关信息,进而客户端以文本形式显示相关信息。因此,能够灵活地呈现与交互内容对应的相关信息,满足不同应用场景的需求,提升用户体验。
112.在上述实施例的基础上,考虑到相关信息为技能卡片类型,图4为本技术又一实施
例提供的语音交互方法的信令交互示意图。如图4所示,本技术实施例的方法可以包括:
113.s401、客户端获取用户输入的交互内容。
114.该步骤的具体描述可以参见图2所示实施例中s201的相关描述,此处不再赘述。
115.s402、客户端向服务端发送交互内容,以得到与交互内容对应的相关信息。
116.相应地,服务端接收来自客户端的交互内容。
117.该步骤的具体描述可以参见图2所示实施例中s202的相关描述,此处不再赘述。
118.s403、服务端根据交互内容,从预设列表中匹配与交互内容具有对应关系的目标服务页面的页面链接。
119.该步骤的具体描述可以参见图2所示实施例中s203的相关描述,此处不再赘述。
120.s404、若服务端根据交互内容,从预设列表中未匹配到与交互内容具有对应关系的目标服务页面的页面链接,则获取与交互内容对应的相关信息,相关信息为技能卡片类型。
121.示例性地,服务端根据交互内容,从预设列表中未匹配到与交互内容具有对应关系的目标服务页面的页面链接后,确定与交互内容对应的识别结果需要以技能卡片的形式呈现,则获取与交互内容对应的相关信息,相关信息为技能卡片类型。
122.s405、服务端向客户端发送相关信息,相关信息为技能卡片类型。
123.相应地,客户端执行s406、若相关信息为技能卡片类型,则以技能卡片形式显示相关信息。
124.示例性地,服务端在获取到与交互内容对应的技能卡片类型的相关信息后,将该相关信息发送给客户端。客户端在接收到该相关信息后,进行解析,解析出回复文本信息的同时,解析出技能卡片的数据,并进行显示。
125.本技术实施例提供的语音交互方法,通过服务端根据交互内容,确定从预设列表中未匹配到与交互内容具有对应关系的目标服务页面的页面链接后,则获取与交互内容对应的技能卡片类型的相关信息,进而客户端以技能卡片形式显示相关信息。因此,能够灵活地呈现与交互内容对应的相关信息,满足不同应用场景的需求,提升用户体验。
126.在上述实施例的基础上,可以理解,用户在和语音助手交互过程中,语料和对应的意图是多样的,因此,语料回复内容的内容、形式、跳转的链接以及跳转的形式也会随之不同,在一些场景下直接用文本形式或者技能卡片形式展示更为直观,在一些场景下需要直接进行服务页面的跳转,展示相关服务页面,更为便捷,方便用户可通过相关服务页面直接使用相关技能。
127.在上述实施例的基础上,可选的,客户端若在发送交互内容后预设时长内未得到与交互内容对应的相关信息,则提示用户重新输入交互内容。
128.示例性地,预设时常可按需设置。客户端确定在发送交互内容后预设时长内未得到与交互内容对应的相关信息后,可以提示用户重新输入交互内容,以继续为用户提供交互服务,比如为用户显示与交互内容对应的目标服务页面。
129.在上述实施例的基础上,一种可能的实施方式中,客户端在用户进入当前服务页面时,获取当前服务页面对应的请求中携带的交互内容;向服务端发送交互内容,以得到与交互内容对应的相关信息。
130.示例性地,用户在进入当前服务页面时,当前服务页面对应的请求中携带有交互
内容,则客户端获取当前服务页面对应的请求中携带的交互内容,然后向服务端发送交互内容,以得到与交互内容对应的相关信息。可以理解,服务端对当前服务页面对应的请求中携带的交互内容的处理方式与上述用户输入的交互内容的处理方式类似,此处不再赘述。
131.综上,本技术提供的技术方案,至少具有如下优势:
132.(1)具有更好的用户体验:根据用户语料意图对应用内的语音助手回复内容进行技能服务配置,以不同的形式为用户提供服务,对于可直接提供技能服务(即目标服务)的意图直接提供跳转对应的目标服务页面,增强语音助手交互行为的智能性,提高用户体验;
133.(2)动态修改终端行为:比如若是人工配置预设列表,只需要依赖运营,就可动态配置预设列表的相关参数,调整相关资源;若是算法提供跳转页面链接的方式,则只需要修改相关算法,就可以修改提供服务的范围。不需要每次依赖发版本,修改相关内容的成本低。
134.(3)更多的经济效益:根据用户语料意图对应用内的语音助手回复内容进行技能服务配置,以不同的形式为用户提供服务,对于可直接提供技能服务的意图直接提供跳转对应的服务页面,增加了用户粘性,且提高了用户体验,从而增加市场的认可,进而可以提高经济效益。
135.下述为本技术装置实施例,可以用于执行本技术方法实施例。对于本技术装置实施例中未披露的细节,请参照本技术方法实施例。
136.图5为本技术一实施例提供的语音交互装置的结构示意图。如图5所示,本技术实施例的语音交互装置500包括:获取模块501、发送模块502、处理模块503和显示模块504。其中:
137.获取模块501,用于获取用户输入的交互内容。
138.发送模块502,用于向服务端发送交互内容,以得到与交互内容对应的相关信息。
139.处理模块503,用于若相关信息为目标服务页面的页面链接,则通过页面链接获取目标服务页面。
140.显示模块504,用于显示目标服务页面。
141.可选的,处理模块503可以具体用于:若相关信息为目标服务页面的页面链接,且根据页面链接,确定页面链接不需要与预设服务信息进行拼接,则通过页面链接获取目标服务页面,预设服务信息包括当前服务页面的标识信息和当前服务页面的功能信息;或者,若相关信息为目标服务页面的页面链接,且根据页面链接,确定页面链接需要与预设服务信息进行拼接,则将页面链接与预设服务信息进行拼接,获得拼接后的页面链接,通过拼接后的页面链接获取目标服务页面。
142.在一些实施例中,交互内容包括文本内容,获取模块501可以具体用于:通过键盘输入框,获取用户输入的文本内容。
143.可选的,交互内容包括语音内容,获取模块501可以具体用于:通过话筒按钮,获取用户输入的语音信号;对语音信号进行语音识别,得到语音信号包含的语音内容。
144.可选的,显示模块504还可以用于:在键盘输入框内,显示语音内容。
145.在一些实施例中,显示模块504还可以用于:若相关信息为文本类型,则以文本形式显示相关信息;或者,若相关信息为技能卡片类型,则以技能卡片形式显示相关信息。
146.可选的,处理模块503还可以用于:若在发送交互内容后预设时长内未得到与交互
内容对应的相关信息,则提示用户重新输入交互内容。
147.在一些实施例中,获取模块501还可以用于:在用户进入当前服务页面时,获取当前服务页面对应的请求中携带的交互内容,以向服务端发送交互内容。
148.本技术实施例的装置,可以用于执行上述任一方法实施例中客户端的方案,其实现原理和技术效果类似,此处不再赘述。
149.图6为本技术另一实施例提供的语音交互装置的结构示意图,应用于服务端。如图6所示,本技术实施例的语音交互装置600包括:接收模块601、处理模块602和发送模块603。其中:
150.接收模块601,用于接收来自客户端的交互内容。
151.处理模块602,用于根据交互内容,从预设列表中匹配与交互内容具有对应关系的目标服务页面的页面链接,获得对应的相关信息。
152.发送模块603,用于向客户端发送相关信息,相关信息包括目标服务页面的页面链接,以使客户端通过页面链接获取目标服务页面,并显示目标服务页面。
153.可选的,处理模块602还可以用于:向客户端发送相关信息之前,若根据交互内容,从预设列表中未匹配到与交互内容具有对应关系的目标服务页面的页面链接,则获取与交互内容对应的相关信息,相关信息为文本类型;或者,若根据交互内容,从预设列表中未匹配到与交互内容具有对应关系的目标服务页面的页面链接,则获取与交互内容对应的相关信息,相关信息为技能卡片类型。
154.本技术实施例的装置,可以用于执行上述任一方法实施例中服务端的方案,其实现原理和技术效果类似,此处不再赘述。
155.图7为本技术一实施例提供的电子设备的结构示意图。示例性地,电子设备可以被提供为一服务器或计算机。参照图7,电子设备700包括处理组件701,其进一步包括一个或多个处理器,以及由存储器702所代表的存储器资源,用于存储可由处理组件701的执行的指令,例如应用程序。存储器702中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件701被配置为执行指令,以执行上述任一方法实施例。
156.电子设备700还可以包括一个电源组件703被配置为执行电子设备700的电源管理,一个有线或无线网络接口704被配置为将电子设备700连接到网络,和一个输入输出(i/o)接口705。电子设备700可以操作基于存储在存储器702的操作系统,例如windows servertm,mac os xtm,unixtm,linuxtm,freebsdtm或类似。
157.本技术还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当处理器执行计算机执行指令时,实现如上的语音交互方法的方案。
158.本技术还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上的语音交互方法的方案。
159.上述的计算机可读存储介质,上述可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。可读存储介质可以是通用或专用计算机能够存取的任何可用介质。
160.一种示例性的可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质
读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(application specific integrated circuits,简称:asic)中。当然,处理器和可读存储介质也可以作为分立组件存在于如上的语音交互装置中。
161.本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。
162.至此,已经结合附图所示的优选实施方式描述了本技术的技术方案,但是,本领域技术人员容易理解的是,本技术的保护范围显然不局限于这些具体实施方式。在不偏离本技术的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1