服务的确定方法和装置、存储介质及电子装置与流程

文档序号:32001582发布日期:2022-11-02 11:29阅读:38来源:国知局
服务的确定方法和装置、存储介质及电子装置与流程

1.本技术涉及智慧家庭领域,具体而言,涉及一种服务的确定方法和装置、存储介质及电子装置。


背景技术:

2.随着互联网技术以及物联网技术的发展,越来越多的设备支持运行智能家居场景,但相关技术中,现有智能家居场景下的声纹识别技术主要应用在说话人辨认和确认后单个指令的操作,基本目的都是通过提取声纹特征,辨别或确认说话人身份,从而判定是否执行某操作,如:是否执行转账操作;是否开门等。
3.当前声纹识别技术的应用范围都仅止步于辨认和确认说话人身份,对于身份辨认和确认后的后续推送服务基本没有涉及。并且家庭里存在多个用户时,每个用户对同一询问所期望获取到的结果都不相同。现有的推送服务仅限于识别用户意图并随机推送,不能针对各个用户的不同喜好进行个性化推送。
4.针对相关技术中,无法基于声纹向不同的目标对象推送不同服务等问题,尚未提出有效的技术方案。


技术实现要素:

5.本发明实施例提供了一种服务的确定方法和装置、存储介质、电子装置,以至少解决相关技术中,无法基于声纹向不同的目标对象推送不同服务等问题。
6.根据本发明的一个实施例,提供了一种服务的确定方法,包括:确定查询音频对应的声纹特征以及文本内容;在所述声纹特征与数据库中的注册声纹特征匹配的情况下,获取与所述声纹特征匹配的注册声纹特征对应的服务列表,其中,所述服务列表用于提供符合所述查询音频的多个待推送的服务类别;根据所述文本内容从所述服务列表中确定目标服务,并生成用于反馈所述查询音频的响应音频。
7.在一个示例性实施例中,根据所述文本内容从所述服务列表中确定目标服务,并生成用于反馈所述查询音频的响应音频,包括:确定所述目标服务对应的类别信息;在所述类别信息为安全服务的情况下,根据预设的安全验证话术生成用于反馈所述查询音频的响应音频;在所述类别信息为推送服务的情况下,确定所述文本内容对应的回答文本,并通过所述回答文本生成反馈所述查询音频的响应音频,其中,所述回答文本用于指示与目标对象执行声纹注册流程时确定的多个待推送的服务类别匹配的配置文本。
8.在一个示例性实施例中,确定查询音频对应的声纹特征以及文本内容之后,上述方法还包括:获取数据库中存储的多个注册声纹特征;确定所述声纹特征与所述多个注册声纹特征中每一个注册声纹特征的相似度,得到多个相似度值;在所述多个相似度值均小于预设阈值的情况下,确定所述查询音频对应的声纹特征需要进行声纹注册,并开启所述声纹特征的声纹注册流程。
9.在一个示例性实施例中,根据预设的安全验证话术生成用于反馈所述查询音频的
响应音频之后,上述方法还包括:使用所述响应音频发起与所述查询音频对应的目标的语音交互;采集所述目标对象在语音交互中的回答结果,其中,所述回答结果用于指示目标对象反馈的针对预设的安全验证话术的回答数据;在所述回答结果与所述预设的安全验证话术对应的标准结果相同的情况下,确定所述目标对象通过安全验证,允许所述目标对象执行安全服务对应的操作;在所述回答结果与所述预设的安全验证话术对应的标准结果不相同的情况下,确定所述目标对象未通过安全验证,禁止所述目标对象执行安全服务对应的操作。
10.在一个示例性实施例中,开启所述声纹特征的声纹注册流程之后,上述方法还包括:获取预设的注册交互语音;其中,所述注册交互语音中包括多个询问语音;基于所述注册交互语音与所述查询音频对应的目标对象进行语音交互;确定所述目标对象针对所述注册交互语音回答的回答语音;在所述回答语音为有效语音的情况下,根据所述回答语音对应的文本内容为所述声纹特征配置多个待推送的服务类别完成所述声纹特征的注册。
11.在一个示例性实施例中,根据所述文本内容从所述服务列表中确定目标服务,并生成用于反馈所述查询音频的响应音频之后,上述方法还包括:获取所述查询音频对应的目标对象对于所述响应音频的确认时间;在所述确认时间小于等于预设有效时间的情况下,确定所述目标对象允许所述目标服务进行服务推送;在所述确认时间大于预设有效时间的情况下,确定所述响应音频未得到所述目标对象的确认,禁止所述目标服务进行服务推送。
12.在一个示例性实施例中,在所述确认时间大于预设有效时间的情况下,确定所述响应音频未得到所述目标对象的确认,禁止所述目标服务进行服务推送之后,上述方法还包括:主动向所述目标对象发送提示信息,其中,所述提示信息用于指示是否发起对预设的安全验证话术的更新;接收所述目标对象针对所述提示信息下发的重置指令,其中,所述重置指令中携带有所述提示信息的提示次数以及对于所述响应音频的二次确认时间;使用所述重置指令更新所述确认时间,并开启用于采集新的安全验证话术对预设的安全验证话术进行话术更新的收音功能。
13.根据本发明的另一个实施例,提供了一种服务的确定装置,包括:第一确定模块,用于确定查询音频对应的声纹特征以及文本内容;获取模块,用于在所述声纹特征与数据库中的注册声纹特征匹配的情况下,获取与所述声纹特征匹配的注册声纹特征对应的服务列表,其中,所述服务列表用于提供符合所述查询音频的多个待推送的服务类别;第二确定模块,用于根据所述文本内容从所述服务列表中确定目标服务,并生成用于反馈所述查询音频的响应音频。
14.在一个示例性实施例中,上述第二确定模块,还用于确定所述目标服务对应的类别信息;在所述类别信息为安全服务的情况下,根据预设的安全验证话术生成用于反馈所述查询音频的响应音频;在所述类别信息为推送服务的情况下,确定所述文本内容对应的回答文本,并通过所述回答文本生成反馈所述查询音频的响应音频,其中,所述回答文本用于指示与目标对象执行声纹注册流程时确定的多个待推送的服务类别匹配的配置文本。
15.在一个示例性实施例中,上述装置还包括:第三确定模块,用于获取数据库中存储的多个注册声纹特征;确定所述声纹特征与所述多个注册声纹特征中每一个注册声纹特征的相似度,得到多个相似度值;基于所述多个相似度值确定是否开启声纹注册流程。
16.在一个示例性实施例中,上述第三确定模块,还用于在所述多个相似度值均小于预设阈值的情况下,确定所述查询音频对应的声纹特征需要进行声纹注册,并开启所述声纹特征的声纹注册流程;在所述多个相似度值均大于等于预设阈值的情况下,确定所述查询音频对应的声纹特征存在匹配的注册声纹特征,并禁止开启所述声纹特征的声纹注册流程。
17.在一个示例性实施例中,上述第二确定模块还包括:采集单元,用于使用所述响应音频发起与所述查询音频对应的目标的语音交互;采集所述目标对象在语音交互中的回答结果,其中,所述回答结果用于指示目标对象反馈的针对预设的安全验证话术的回答数据;在所述回答结果与所述预设的安全验证话术对应的标准结果相同的情况下,确定所述目标对象通过安全验证,允许所述目标对象执行安全服务对应的操作;在所述回答结果与所述预设的安全验证话术对应的标准结果不相同的情况下,确定所述目标对象未通过安全验证,禁止所述目标对象执行安全服务对应的操作。
18.在一个示例性实施例中,上述第三确定模块,还包括:交互单元,用于获取预设的注册交互语音;其中,所述注册交互语音中包括多个询问语音;基于所述注册交互语音与所述查询音频对应的目标对象进行语音交互;确定所述目标对象针对所述注册交互语音回答的回答语音;在所述回答语音为有效语音的情况下,根据所述回答语音对应的文本内容为所述声纹特征配置多个待推送的服务类别完成所述声纹特征的注册。
19.在一个示例性实施例中,上述装置还包括:推送模块,用于获取所述查询音频对应的目标对象对于所述响应音频的确认时间;在所述确认时间小于等于预设有效时间的情况下,确定所述目标对象允许所述目标服务进行服务推送;在所述确认时间大于预设有效时间的情况下,确定所述响应音频未得到所述目标对象的确认,禁止所述目标服务进行服务推送。
20.在一个示例性实施例中,上述推送模块,还包括:更新单元,用于主动向所述目标对象发送提示信息,其中,所述提示信息用于指示是否发起对预设的安全验证话术的更新;接收所述目标对象针对所述提示信息下发的重置指令,其中,所述重置指令中携带有所述提示信息的提示次数以及对于所述响应音频的二次确认时间;使用所述重置指令更新所述确认时间,并开启用于采集新的安全验证话术对预设的安全验证话术进行话术更新的收音功能。
21.根据本发明的又一个实施例,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
22.根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
23.通过本发明,确定查询音频对应的声纹特征以及文本内容;在所述声纹特征与数据库中的注册声纹特征匹配的情况下,获取与所述声纹特征匹配的注册声纹特征对应的服务列表,其中,所述服务列表用于提供符合所述查询音频的多个待推送的服务类别;根据所述文本内容从所述服务列表中确定目标服务,并生成用于反馈所述查询音频的响应音频,也就是说,在确定查询音频对应的声纹特征之后,确定该声纹特征对应的目标对象在注册时设置的服务列表,并依据查询音频对应的文本内容在服务列表中确定目标服务,生成推
送目标服务的用于反馈所述查询音频的响应音频,因此,可以解决现有技术中无法基于声纹向不同的目标对象推送不同服务等问题,将不同目标对象的服务需求与声纹结合起来,为家庭内不同用户提供更精确、贴心的服务。
附图说明
24.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。
25.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
26.图1是根据本技术实施例的一种服务的确定方法的硬件环境示意图;
27.图2是根据本发明实施例的服务的确定方法的流程图;
28.图3是根据本发明可选实施例的依据声纹进行服务推送的交互示意图;
29.图4是根据本发明可选实施例的声纹注册流程的交互示意图;
30.图5是根据本发明可选实施例的基于声纹的账户重置与安全验证的交互示意图;
31.图6是根据本发明实施例的服务的确定装置的结构框图。
具体实施方式
32.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
33.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
34.根据本技术实施例的一个方面,提供了一种服务的确定方法。该服务的确定方法广泛应用于智慧家庭(smart home)、智能家居、智能家用设备生态、智慧住宅(intelligencehouse)生态等全屋智能数字化控制应用场景。可选地,在本实施例中,上述服务的确定方法可以应用于如图1所示的由终端设备102和服务器104所构成的硬件环境中。如图1所示,服务器104通过网络与终端设备102进行连接,可用于为终端或终端上安装的客户端提供服务(如应用服务等),可在服务器上或独立于服务器设置数据库,用于为服务器104提供数据存储服务,可在服务器上或独立于服务器配置云计算和/或边缘计算服务,用于为服务器104提供数据运算服务。
35.上述网络可以包括但不限于以下至少之一:有线网络,无线网络。上述有线网络可
以包括但不限于以下至少之一:广域网,城域网,局域网,上述无线网络可以包括但不限于以下至少之一:wifi(wireless fidelity,无线保真),蓝牙。终端设备102可以并不限定于为pc、手机、平板电脑、智能空调、智能烟机、智能冰箱、智能烤箱、智能炉灶、智能洗衣机、智能热水器、智能洗涤设备、智能洗碗机、智能投影设备、智能电视、智能晾衣架、智能窗帘、智能影音、智能插座、智能音响、智能音箱、智能新风设备、智能厨卫设备、智能卫浴设备、智能扫地机器人、智能擦窗机器人、智能拖地机器人、智能空气净化设备、智能蒸箱、智能微波炉、智能厨宝、智能净化器、智能饮水机、智能门锁等。
36.在本实施例中提供了一种服务的确定方法,图2是根据本发明实施例的服务的确定方法的流程图,该流程包括如下步骤:
37.步骤s202,确定查询音频对应的声纹特征以及文本内容;
38.步骤s204,在所述声纹特征与数据库中的注册声纹特征匹配的情况下,获取与所述声纹特征匹配的注册声纹特征对应的服务列表,其中,所述服务列表用于提供符合所述查询音频的多个待推送的服务类别;
39.步骤s206,根据所述文本内容从所述服务列表中确定目标服务,并生成用于反馈所述查询音频的响应音频。
40.通过上述步骤,确定查询音频对应的声纹特征以及文本内容;在所述声纹特征与数据库中的注册声纹特征匹配的情况下,获取与所述声纹特征匹配的注册声纹特征对应的服务列表,其中,所述服务列表用于提供符合所述查询音频的多个待推送的服务类别;根据所述文本内容从所述服务列表中确定目标服务,并生成用于反馈所述查询音频的响应音频,也就是说,在确定查询音频对应的声纹特征之后,确定该声纹特征对应的目标对象在注册时设置的服务列表,并依据查询音频对应的文本内容在服务列表中确定目标服务,生成推送目标服务的用于反馈所述查询音频的响应音频,因此,可以解决现有技术中无法基于声纹向不同的目标对象推送不同服务等问题,将不同目标对象的服务需求与声纹结合起来,为家庭内不同用户提供更精确、贴心的服务。
41.可选的,上述方法可以应用与语音设备中或者是包含语音交互功能的应用以及终端中,可以使得语音设备与目标对象(即用户)的交互之后,更好的依据目标对象的喜好向目标对象推送对应的服务,并形成适合的响应语音,最终提升目标对象使用语音设备的体验。
42.在一个示例性实施例中,根据所述文本内容从所述服务列表中确定目标服务,并生成用于反馈所述查询音频的响应音频,包括:确定所述目标服务对应的类别信息;在所述类别信息为安全服务的情况下,根据预设的安全验证话术生成用于反馈所述查询音频的响应音频;在所述类别信息为推送服务的情况下,确定所述文本内容对应的回答文本,并通过所述回答文本生成反馈所述查询音频的响应音频,其中,所述回答文本用于指示与目标对象执行声纹注册流程时确定的多个待推送的服务类别匹配的配置文本。
43.简单来说,针对不同的目标服务,语音设备进行响应的方式不同,当语音设备需要为目标对象提供安全服务时,为了加强交互的安全性,因此,需要使用预设的安全验证话术生成用于反馈所述查询音频的响应音频,并进一步依据目标对象对响应音频的回复,利用声纹特征确定该目标对象是否被允许发起安全服务的执行,并结合查询音频和响应音频对应的交互内容,保证安全服务的安全性;当语音设备需要为目标对象提供推送服务时,便可
以直接根据目标对象的喜好确定对应的目标服务,并使用语音设备中预置的与该目标服务对应的回答文本向目标对象发起推送。
44.在一个示例性实施例中,确定查询音频对应的声纹特征以及文本内容之后,上述方法还包括:获取数据库中存储的多个注册声纹特征;确定所述声纹特征与所述多个注册声纹特征中每一个注册声纹特征的相似度,得到多个相似度值;基于所述多个相似度值确定是否开启声纹注册流程。
45.在一个示例性实施例中,基于所述相似度确定是否开启声纹注册流程,包括:在所述多个相似度值均小于预设阈值的情况下,确定所述查询音频对应的声纹特征需要进行声纹注册,并开启所述声纹特征的声纹注册流程;在所述多个相似度值均大于等于预设阈值的情况下,确定所述查询音频对应的声纹特征存在匹配的注册声纹特征,并禁止开启所述声纹特征的声纹注册流程。
46.即由于不同的目标对象的声纹不同,在使用语音设备的推送功能前,需要确定当前查询音频的声纹特征与数据库中存储的多个注册声纹特征的相似度,判断当前查询音频对应的目标对象是否已注册声纹,在未注册的情况下,为当前查询音频的声纹特征开启声纹注册流程,保证后续服务推送的有效性。
47.在一个示例性实施例中,根据预设的安全验证话术生成用于反馈查询音频的响应音频之后,上述方法还包括:使用响应音频主动发起与查询音频对应的目标的语音交互;采集目标对象在语音交互中的回答结果,其中,回答结果用于指示目标对象反馈的针对预设的安全验证话术的回答数据;在回答结果与预设的安全验证话术对应的标准结果相同的情况下,确定目标对象通过安全验证,允许目标对象执行安全服务对应的操作;在回答结果与预设的安全验证话术对应的标准结果不相同的情况下,确定目标对象未通过安全验证,禁止目标对象执行安全服务对应的操作。
48.例如,当发现当前目标对象的声纹特征为存在在数据库中的注册声纹特征时,此时可以主动询问目标对象当初设置的安全验证话术,如目标对象在规定时间内回答正确,则验证通过,允许目标对象进行重置账户信息的安全服务。如目标对象未在规定时间内回答或者回答错误,说明当前目标对象存在风险,禁止目标对象执行安全服务对应的操作,进一步的,为了保证确定的准确性,还可以根据实际设置需求,向目标对象发起至少两次的主动询问,在至少两次的主动询问之后发起禁止目标对象执行安全服务对应的操作。
49.在一个示例性实施例中,开启所述声纹特征的声纹注册流程之后,上述方法还包括:获取预设的注册交互语音;其中,所述注册交互语音中包括多个询问语音;基于所述注册交互语音与所述查询音频对应的目标对象进行语音交互;确定所述目标对象针对所述注册交互语音回答的回答语音;在所述回答语音为有效语音的情况下,根据所述回答语音对应的文本内容为所述声纹特征配置多个待推送的服务类别完成所述声纹特征的注册。
50.例如,目标对象接受语音设备的注册邀请,语音设备主动对目标对象发起询问,可选的,可以使用总计七个问题的预设问题,每个问题询问后开启收音;若目标对象没有在规定时间内回答,则重复询问当前问题,最多重复询问两次,若第三次用户仍未回答,则按顺序跳到下一个问题。如果七个问题当中有回答无效或者未按时回答的问题,则在第七个问题结束后重新按照顺序询问未回答问题。当所有问题都回答完毕后,则代表目标对象完成声纹特征的注册流程。
51.在一个示例性实施例中,根据所述文本内容从所述服务列表中确定目标服务,并生成用于反馈所述查询音频的响应音频之后,上述方法还包括:获取所述查询音频对应的目标对象对于所述响应音频的确认时间;在所述确认时间小于等于预设有效时间的情况下,确定所述目标对象允许所述目标服务进行服务推送;在所述确认时间大于预设有效时间的情况下,确定所述响应音频未得到所述目标对象的确认,禁止所述目标服务进行服务推送。
52.在一个示例性实施例中,在所述确认时间大于预设有效时间的情况下,确定所述响应音频未得到所述目标对象的确认,禁止所述目标服务进行服务推送之后,上述方法还包括:主动向所述目标对象发送提示信息,其中,所述提示信息用于指示是否发起对预设的安全验证话术的更新;接收所述目标对象针对所述提示信息下发的重置指令,其中,所述重置指令中携带有所述提示信息的提示次数以及对于所述响应音频的二次确认时间;使用所述重置指令更新所述确认时间,并开启用于采集新的安全验证话术对预设的安全验证话术进行话术更新的收音功能。
53.可以理解的是,由于不同的目标对象对于响应音频的反应周期不同,如,老人理解与反馈的时间弱于年轻人,因此,需要结合预设有效时间进行目标服务的推送确认,并根据目标对象发送的重置指令对确认时间进行更新,使得反应超出预设有效时间的目标对象可以再次进行目标服务的推送确认,保证对于目标服务的推送效果。可选的,若用户选择重置安全验证话术,则开启收音并记录本次安全验证话术,同时删除该声纹对应的旧安全话术,结束流程。若用户在开启收音后并未给出新的安全验证话术,则重新询问用户是否需要重置安全验证话术,最多询问两次。如用户未在规定询问次数和时间内给出新的安全验证话术,则结束流程。
54.为了更好的理解上述服务的确定方法的过程,以下结合几个可选实施例对上述服务的确定方法流程进行说明。
55.声纹识别技术:声纹识别(voiceprint recognition,vpr)是生物识别技术中的一种,通过语音信号中的个性信息来判断说话人的身份,也称为“说话人识别(speaker recognition,sr)”。该技术又分为两类:“说话人辨认(speakeridentification,si)”和“说话人确认(speakerverification,sv)”。
56.目前,国内的声纹识别技术主要运用于以下三个方面:信息安全、司法刑侦、智能家居领域。其基本目的都是通过提取声纹特征,辨别或确认说话人身份,从而判定是否执行某操作,如:是否执行转账操作;是否开门等。
57.现有智能家居场景下的声纹识别技术主要应用在说话人辨认和确认后单个指令的操作,如:辨别该声纹对应的说话人为该家庭的用户,则自动开门;辨别该声纹为该家庭的老人/小孩,则自动调整空调温度和风速到该年龄段的适宜指数等。对于一些更为复杂,日常生活中使用更多的智能设备基础技能(音乐、新闻等)则没有和声纹建立联系,做到“因人而异”,例如,音乐播放、新闻、穿衣推荐等基础服务推送一般存在随机性,当家庭里不同用户发出某个指令后获得的推送结果并不一定匹配当前用户的喜好。如用户a发出query“来点音乐”,智能设备推送了爵士乐,但实际上用户a喜欢听抒情民谣;用户b发出query“今天有什么新闻”,设备推送的大部分是科技版的新闻,但实际用户b可能更期望了解今日的娱乐新闻,导致推送服务的个性化不够。
58.此外,对于智能家庭场景下用户账号的安全验证和重置问题,目前基本采用用户手机验证码或者邮箱验证码来验证或重置,这两种方法都存在一定的风险和不便捷性:如遇到用户手机丢失、号码更换或邮箱密码丢失时,则不便于账户安全验证或用户重置账户信息。
59.因此,上述方案存在以下缺点:1)当前声纹识别技术的应用范围都仅止步于辨认和确认说话人身份,对于身份辨认和确认后的后续推送服务基本没有涉及。2)家庭里存在多个用户时,每个用户对同一query所期望获取到的结果都不相同。现有的推送服务仅限于识别用户意图并随机推送,不能针对各个用户的不同喜好进行个性化推送。3)目前账户安全验证和重置的方法基本建立在用户手机或邮箱验证这两种方法上。而这两种方法都存在缺点:如遇到用户手机丢失、号码变更、邮箱密码丢失等情况时,想要验证或重置账号会变得十分不便。
60.作为一种可选的实施例,针对上述缺陷,提出了一种依据声纹的个性化推送和安全验证服务,声纹识别认证是生物认证里最安全稳定的一种手段。因为声纹,相比于指纹、虹膜,拥有最稳定的特征,并具有不可复制性。通过声纹注册的过程,提取声纹特征,记录家庭各个成员的喜好,当家庭里不同用户发出询问query时能有针对性的对该用户提供推送服务,提升用户体验。此外,还可以通过声纹简化账号安全验证和重置方式,加强账号安全。
61.可选的,图3是根据本发明可选实施例的依据声纹进行服务推送的交互示意图,具体步骤如下:
62.步骤302、用户输入语音询问query,如“我要听歌”。
63.步骤304、设备分析该用户声纹特征,判断该用户有无声纹注册信息。
64.步骤306、如有声纹注册信息,则根据该用户的声纹信息和注册时对应喜好为该用户推送对应音乐。
65.步骤308、如无声纹注册信息,则引导用户完成声纹注册流程。
66.步骤310、如用户拒绝声纹注册邀请,则识别步骤302中的语音询问query的内容信息随机为用户推送音乐。
67.步骤312、如用户接受邀请,则完成注册后识别步骤302中的语音询问query并基于该内容信息提取用户喜好特征,根据所述用户喜好特征为用户推送音乐。
68.可选的,图4是根据本发明可选实施例的声纹注册流程的交互示意图,具体步骤如下:
69.步骤402、用户接受注册邀请,设备主动对用户发起询问。
70.步骤404、根据预设的七个问题主动发起与用户的语音交互,每个问题询问后开启收音;若用户没有在规定时间内回答,则重复询问当前问题,最多重复询问两次,若第三次用户仍未回答,则按顺序跳到下一个问题。
71.步骤406、如果七个问题当中有回答无效或者未按时回答的问题,则在第七个问题结束后重新按照顺序询问未回答问题。
72.步骤408、当所有问题都回答完毕后,则代表完成注册流程。
73.可以理解的是,通过声纹注册的过程,可以记录家庭里不同用户的喜好,从而在用户发出query后能精准推送其渴望接收的讯息。
74.可选的,图5是根据本发明可选实施例的基于声纹的账户重置与安全验证的交互
示意图,具体步骤如下:
75.步骤502、用户选择重置账户信息或账户存在风险需要进行安全验证。
76.步骤504、辨认该用户声纹信息是否存在,如否,则邀请用户注册声纹。
77.步骤506、如该用户声纹信息存在,则主动询问用户当初设置的安全验证话术。
78.步骤508、如用户在规定时间内回答正确,则验证通过,允许用户重置账户信息。
79.步骤510、如用户未在规定时间内回答,则重新询问用户安全验证话术,最多询问两次。
80.步骤512、如用户并未在规定询问次数和时间内回答出安全验证话术,则验证失败。
81.步骤514、验证失败后主动询问用户是否需要重置安全验证话术,若用户选择否,则结束该流程。
82.步骤516、若用户选择重置安全验证话术,则开启收音并记录本次安全验证话术,同时删除该声纹对应的旧安全话术,结束流程。
83.步骤518、若用户在开启收音后并未给出新的安全验证话术,则重新询问用户是否需要重置安全验证话术,最多询问两次。如用户未在规定询问次数和时间内给出新的安全验证话术,则结束流程。
84.综上,通过上述改良设计,把声纹识别的技术和后续的家庭场景下基础技能的服务联系起来,为家庭内不同用户提供更精确、贴心的服务。同时简化和加强用户账号的重置方式和安全保障。进而通过声纹识别技术、记录用户声纹特征和喜好,能够为家庭各成员提供个性化服务,让所有人更好的享受智能家居新生活;并且在验声纹信息和声纹注册过程中设置的安全问题,可以更高效地保障账号安全,同时也简化了账户安全验证和账户信息重置的流程,提高账户安全性。
85.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述服务的确定。
86.在本实施例中还提供了一种服务的确定装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
87.图6是根据本发明实施例的服务的确定装置的结构框图,如图6所示,该装置包括:
88.(1)第一确定模块62,用于确定查询音频对应的声纹特征以及文本内容;
89.(2)获取模块64,用于在所述声纹特征与数据库中的注册声纹特征匹配的情况下,获取与所述声纹特征匹配的注册声纹特征对应的服务列表,其中,所述服务列表用于提供符合所述查询音频的多个待推送的服务类别;
90.(3)第二确定模块66,用于根据所述文本内容从所述服务列表中确定目标服务,并生成用于反馈所述查询音频的响应音频。
91.通过上述装置,确定查询音频对应的声纹特征以及文本内容;在所述声纹特征与数据库中的注册声纹特征匹配的情况下,获取与所述声纹特征匹配的注册声纹特征对应的服务列表,其中,所述服务列表用于提供符合所述查询音频的多个待推送的服务类别;根据所述文本内容从所述服务列表中确定目标服务,并生成用于反馈所述查询音频的响应音频,也就是说,在确定查询音频对应的声纹特征之后,确定该声纹特征对应的目标对象在注册时设置的服务列表,并依据查询音频对应的文本内容在服务列表中确定目标服务,生成推送目标服务的用于反馈所述查询音频的响应音频,因此,可以解决现有技术中无法基于声纹向不同的目标对象推送不同服务等问题,将不同目标对象的服务需求与声纹结合起来,为家庭内不同用户提供更精确、贴心的服务。
92.在一个示例性实施例中,上述第二确定模块,还用于确定所述目标服务对应的类别信息;在所述类别信息为安全服务的情况下,根据预设的安全验证话术生成用于反馈所述查询音频的响应音频;在所述类别信息为推送服务的情况下,确定所述文本内容对应的回答文本,并通过所述回答文本生成反馈所述查询音频的响应音频,其中,所述回答文本用于指示与目标对象执行声纹注册流程时确定的多个待推送的服务类别匹配的配置文本。
93.在一个示例性实施例中,上述装置还包括:第三确定模块,用于获取数据库中存储的多个注册声纹特征;确定所述声纹特征与所述多个注册声纹特征中每一个注册声纹特征的相似度,得到多个相似度值;基于所述多个相似度值确定是否开启声纹注册流程。
94.在一个示例性实施例中,上述第三确定模块,还用于在所述多个相似度值均小于预设阈值的情况下,确定所述查询音频对应的声纹特征需要进行声纹注册,并开启所述声纹特征的声纹注册流程;在所述多个相似度值均大于等于预设阈值的情况下,确定所述查询音频对应的声纹特征存在匹配的注册声纹特征,并禁止开启所述声纹特征的声纹注册流程。
95.在一个示例性实施例中,上述第二确定模块还包括:采集单元,用于使用所述响应音频主动发起与所述查询音频对应的目标的语音交互;采集所述目标对象在语音交互中的回答结果,其中,所述回答结果用于指示目标对象反馈的针对预设的安全验证话术的回答数据;在所述回答结果与所述预设的安全验证话术对应的标准结果相同的情况下,确定所述目标对象通过安全验证,允许所述目标对象执行安全服务对应的操作;在所述回答结果与所述预设的安全验证话术对应的标准结果不相同的情况下,确定所述目标对象未通过安全验证,禁止所述目标对象执行安全服务对应的操作。
96.在一个示例性实施例中,上述第三确定模块,还包括:交互单元,用于获取预设的注册交互语音;其中,所述注册交互语音中包括多个询问语音;基于所述注册交互语音与所述查询音频对应的目标对象进行语音交互;确定所述目标对象针对所述注册交互语音回答的回答语音;在所述回答语音为有效语音的情况下,根据所述回答语音对应的文本内容为所述声纹特征配置多个待推送的服务类别完成所述声纹特征的注册。
97.在一个示例性实施例中,上述装置还包括:推送模块,用于获取所述查询音频对应的目标对象对于所述响应音频的确认时间;在所述确认时间小于等于预设有效时间的情况下,确定所述目标对象允许所述目标服务进行服务推送;在所述确认时间大于预设有效时间的情况下,确定所述响应音频未得到所述目标对象的确认,禁止所述目标服务进行服务推送。
98.在一个示例性实施例中,上述推送模块,还包括:更新单元,用于主动向所述目标对象发送提示信息,其中,所述提示信息用于指示是否发起对预设的安全验证话术的更新;接收所述目标对象针对所述提示信息下发的重置指令,其中,所述重置指令中携带有所述提示信息的提示次数以及对于所述响应音频的二次确认时间;使用所述重置指令更新所述确认时间,并开启用于采集新的安全验证话术对预设的安全验证话术进行话术更新的收音功能。
99.在本发明的描述中,需要理解的是,术语中“中心”、“上”、“下”、“前”、“后”、“左”、“右”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或组件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
100.在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“连接”、“相连”应做广义理解,例如,可以是固定连接,也可以是拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以是通过中间媒介间接相连,可以是两个组件内部的连通。当组件被称为“固定于”或“设置于”另一个元件,它可以直接在另一个组件上或者也可以存在居中的组件。当一个组件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明的具体含义。
101.需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
102.本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
103.在一个示例性实施例中,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
104.s1,确定查询音频对应的声纹特征以及文本内容;
105.s2,在所述声纹特征与数据库中的注册声纹特征匹配的情况下,获取与所述声纹特征匹配的注册声纹特征对应的服务列表,其中,所述服务列表用于提供符合所述查询音频的多个待推送的服务类别;
106.s3,根据所述文本内容从所述服务列表中确定目标服务,并生成用于反馈所述查询音频的响应音频。
107.在一个示例性实施例中,在本实施例中,上述存储介质可以包括但不限于:u盘、只读存储器(read-only memory,简称为rom)、随机存取存储器(random access memory,简称为ram)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
108.本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
109.在一个示例性实施例中,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
110.在一个示例性实施例中,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
111.s1,确定查询音频对应的声纹特征以及文本内容;
112.s2,在所述声纹特征与数据库中的注册声纹特征匹配的情况下,获取与所述声纹特征匹配的注册声纹特征对应的服务列表,其中,所述服务列表用于提供符合所述查询音频的多个待推送的服务类别;
113.s3,根据所述文本内容从所述服务列表中确定目标服务,并生成用于反馈所述查询音频的响应音频。
114.在一个示例性实施例中,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
115.显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,在一个示例性实施例中,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
116.以上所述仅是本技术的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1