一种语音控制方法、装置、存储介质及空调与流程

文档序号:16906415发布日期:2019-02-19 18:22阅读:171来源:国知局
一种语音控制方法、装置、存储介质及空调与流程

本发明属于语音控制技术领域,具体涉及一种语音控制方法、装置、存储介质及空调,尤其涉及一种自动切换语言系统的语音空调的实现方法、装置、存储介质及ai空调。



背景技术:

如今,家用电器空调做得越来越智能,增加语音功能成为流行趋势,这给人们的生活带来了便利的同时,也给部分语言功底不好的人增加了使用的烦恼。比如老人,习惯讲粤语的港民、澳民等。虽然市面上已经有方言识别的相关技术,但是已有的方案是将方言系统与普通话系统录入到语音系统中,在语音解析前,需要先确定方言系统还是普通话系统,然后根据已确定的语言系统,来解析用户语音。这种方法存在一个弊端,如果用户使用的语言不符合已选的语言系统,则无法识别用户语言,且现在一个家庭中,老人、成人、小孩讲的语种也可能不一样,或者用户在使用过程中,方言与普通话是交替使用的,如果语音设备只有一种语言系统,对用户语音的识别会较低。



技术实现要素:

本发明的目的在于,针对上述缺陷,提供一种语音控制方法、装置、存储介质及空调,以解决现有技术中根据已确定的语言系统或普通话系统来解析用户语音的方式,在用户使用的语言不符合已选的语言系统时则无法识别用户语言,存在语音识别成功率低的问题,达到提升语音识别成功率的效果。

本发明提供一种语音控制方法,包括:获取用于控制待控设备的语音指令;确定发出所述语音指令的用户身份是否属于设定身份范围;若所述用户身份属于所述设定身份范围,则调用与所述用户身份匹配的惯用语音系统对所述语音指令进行语义解析;或者,若所述用户身份不属于所述设定身份范围,则调用设定的默认语音系统对所述语音指令进行语义解析。

可选地,其中,获取用于控制待控设备的语音指令,包括:获取语音采集模块采集到的用于控制待控设备的语音指令;其中,所述语音采集模块,设置在待控设备侧、待控设备所属环境中、客户端中任一设置侧;和/或,所述语音采集模块,包括:麦克风;和/或,所述设定身份范围,包括:设定声纹范围;其中,确定发出所述语音指令的用户身份是否属于设定身份范围,包括:识别所述语音指令所包含的声纹信息;确定所述声纹信息是否在所述设定声纹范围内;若所述声纹信息在所述设定声纹范围内,则确定所述用户身份属于所述设定身份范围;或者,若所述声纹信息不在所述设定声纹范围内,则确定所述用户身份不属于所述设定身份范围。

可选地,其中,调用与所述用户身份匹配的惯用语音系统对所述语音指令进行语义解析,包括:根据设定身份与设定语音系统之间的对应关系,将所述对应关系中与所述用户身份相同的所述设定身份对应的设定语音系统确定为与所述用户身份匹配的惯用语音系统;根据所述惯用语音系统的惯用语义库对所述语音指令进行语义解析,以得到基于所述惯用语音系统确定的与所述语音指令匹配的语义关键词;和/或,调用设定的默认语音系统对所述语音指令进行语义解析,包括:根据所述默认语音系统的默认语义库对所述语音指令进行语义解析,以得到基于所述默认语音系统确定的与所述语音指令匹配的语义关键词。

可选地,还包括:在调用与所述用户身份匹配的惯用语音系统对所述语音指令进行语义解析的解析失败的情况下,确定所述解析失败的第一解析次数是否大于或等于第一设定次数、和/或所述解释失败的第一解析时长是否大于或等于第一设定时长;若所述第一解析次数大于或等于所述第一设定次数、和/或所述第一解析时长大于或等于所述第一设定时长,则调用设定语音系统中除所述惯用语音系统之外的其它语音系统进行语义解析;或者,若所述第一解析次数小于所述第一设定次数、和/或所述第一解析时长小于所述第一设定时长,则继续使用所述惯用语音系统对所述语音指令进行语义解析;或者,在调用设定的默认语音系统对所述语音指令进行语义解析的解析失败的情况下,确定所述解析失败的第二解析次数是否大于或等于第二设定次数、和/或所述解释失败的第二解析时长是否大于或等于第二设定时长;若所述第二解析次数大于或等于所述第二设定次数、和/或所述第二解析时长大于或等于所述第二设定时长,则调用设定语音系统中除所述默认语音系统之外的其它语音系统进行语义解析;或者,若所述第二解析次数小于所述第二设定次数、和/或所述第二解析时长小于所述第二设定时长,则继续使用所述默认语音系统对所述语音指令进行语义解析。

可选地,还包括:在调用设定的默认语音系统对所述语音指令进行语义解析的解析成功的情况下,或在调用设定语音系统中除所述默认语音系统之外的其它语音系统进行语义解析的解析成功的情况下,或在继续使用所述默认语音系统对所述语音指令进行语义解析的解析成功的情况下,将对不属于所述设定身份范围的所述用户身份的语音指令进行语音解析的解析成功的当前语音系统确定为所述用户身份的惯用语音系统,并将所述用户身份存储至所述设定身份范围中。

可选地,其中,所述语音指令,包括:普通话语音指令、外语语音指令、以及与待控设备的待使用用户的用户籍贯对应的方言语音指令;和/或,所述设定语音系统,包括:普通话语音系统、外语语音系统、以及与待控设备的待使用用户的用户籍贯对应的方言语音系统;所述默认语音系统,包括:普通话语音系统;所述惯用语音系统,包括:普通话语音系统、外语语音系统、以及与待控设备的待使用用户的用户籍贯对应的方言语音系统中任一语音系统。

可选地,还包括:存储待控设备的待使用用户的用户身份,并建立用户身份与惯用语音系统之间的对应关系;和/或,根据调用与所述用户身份匹配的惯用语音系统对所述语音指令进行语义解析得到的语义关键词、或调用设定的默认语音系统对所述语音指令进行语义解析得到的语义关键词,控制待控设备执行与所述语音指令对应的控制指令;其中,控制待控设备执行与所述语音指令对应的控制指令,包括:若所述语音指令的语义关键词中包含中文与外语之间的翻译语义,则对与所述语音指令对应的控制指令进行翻译后再执行翻译后的控制指令。

与上述方法相匹配,本发明另一方面提供一种语音控制装置,包括:获取单元,用于获取用于控制待控设备的语音指令;控制单元,用于确定发出所述语音指令的用户身份是否属于设定身份范围;所述控制单元,还用于若所述用户身份属于所述设定身份范围,则调用与所述用户身份匹配的惯用语音系统对所述语音指令进行语义解析;或者,所述控制单元,还用于若所述用户身份不属于所述设定身份范围,则调用设定的默认语音系统对所述语音指令进行语义解析。

可选地,其中,所述获取单元获取用于控制待控设备的语音指令,包括:获取语音采集模块采集到的用于控制待控设备的语音指令;其中,所述语音采集模块,设置在待控设备侧、待控设备所属环境中、客户端中任一设置侧;和/或,所述语音采集模块,包括:麦克风;和/或,所述设定身份范围,包括:设定声纹范围;其中,所述控制单元确定发出所述语音指令的用户身份是否属于设定身份范围,包括:识别所述语音指令所包含的声纹信息;确定所述声纹信息是否在所述设定声纹范围内;若所述声纹信息在所述设定声纹范围内,则确定所述用户身份属于所述设定身份范围;或者,若所述声纹信息不在所述设定声纹范围内,则确定所述用户身份不属于所述设定身份范围。

可选地,其中,所述控制单元调用与所述用户身份匹配的惯用语音系统对所述语音指令进行语义解析,包括:根据设定身份与设定语音系统之间的对应关系,将所述对应关系中与所述用户身份相同的所述设定身份对应的设定语音系统确定为与所述用户身份匹配的惯用语音系统;根据所述惯用语音系统的惯用语义库对所述语音指令进行语义解析,以得到基于所述惯用语音系统确定的与所述语音指令匹配的语义关键词;和/或,所述控制单元调用设定的默认语音系统对所述语音指令进行语义解析,包括:根据所述默认语音系统的默认语义库对所述语音指令进行语义解析,以得到基于所述默认语音系统确定的与所述语音指令匹配的语义关键词。

可选地,还包括:所述控制单元,还用于在调用与所述用户身份匹配的惯用语音系统对所述语音指令进行语义解析的解析失败的情况下,确定所述解析失败的第一解析次数是否大于或等于第一设定次数、和/或所述解释失败的第一解析时长是否大于或等于第一设定时长;所述控制单元,还用于若所述第一解析次数大于或等于所述第一设定次数、和/或所述第一解析时长大于或等于所述第一设定时长,则调用设定语音系统中除所述惯用语音系统之外的其它语音系统进行语义解析;或者,所述控制单元,还用于若所述第一解析次数小于所述第一设定次数、和/或所述第一解析时长小于所述第一设定时长,则继续使用所述惯用语音系统对所述语音指令进行语义解析;或者,所述控制单元,还用于在调用设定的默认语音系统对所述语音指令进行语义解析的解析失败的情况下,确定所述解析失败的第二解析次数是否大于或等于第二设定次数、和/或所述解释失败的第二解析时长是否大于或等于第二设定时长;所述控制单元,还用于若所述第二解析次数大于或等于所述第二设定次数、和/或所述第二解析时长大于或等于所述第二设定时长,则调用设定语音系统中除所述默认语音系统之外的其它语音系统进行语义解析;或者,所述控制单元,还用于若所述第二解析次数小于所述第二设定次数、和/或所述第二解析时长小于所述第二设定时长,则继续使用所述默认语音系统对所述语音指令进行语义解析。

可选地,还包括:所述控制单元,还用于在调用设定的默认语音系统对所述语音指令进行语义解析的解析成功的情况下,或在调用设定语音系统中除所述默认语音系统之外的其它语音系统进行语义解析的解析成功的情况下,或在继续使用所述默认语音系统对所述语音指令进行语义解析的解析成功的情况下,将对不属于所述设定身份范围的所述用户身份的语音指令进行语音解析的解析成功的当前语音系统确定为所述用户身份的惯用语音系统,并将所述用户身份存储至所述设定身份范围中。

可选地,其中,所述语音指令,包括:普通话语音指令、外语语音指令、以及与待控设备的待使用用户的用户籍贯对应的方言语音指令;和/或,所述设定语音系统,包括:普通话语音系统、外语语音系统、以及与待控设备的待使用用户的用户籍贯对应的方言语音系统;所述默认语音系统,包括:普通话语音系统;所述惯用语音系统,包括:普通话语音系统、外语语音系统、以及与待控设备的待使用用户的用户籍贯对应的方言语音系统中任一语音系统。

可选地,还包括:所述控制单元,还用于存储待控设备的待使用用户的用户身份,并建立用户身份与惯用语音系统之间的对应关系;和/或,所述控制单元,还用于根据调用与所述用户身份匹配的惯用语音系统对所述语音指令进行语义解析得到的语义关键词、或调用设定的默认语音系统对所述语音指令进行语义解析得到的语义关键词,控制待控设备执行与所述语音指令对应的控制指令;其中,所述控制单元控制待控设备执行与所述语音指令对应的控制指令,包括:若所述语音指令的语义关键词中包含中文与外语之间的翻译语义,则对与所述语音指令对应的控制指令进行翻译后再执行翻译后的控制指令。

与上述装置相匹配,本发明再一方面提供一种空调,包括:以上所述的语音控制装置。

与上述方法相匹配,本发明再一方面提供一种存储介质,包括:所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行以上所述的语音控制方法。

与上述方法相匹配,本发明再一方面提供一种空调,包括:处理器,用于执行多条指令;存储器,用于存储多条指令;其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行以上所述的语音控制方法。

本发明的方案,通过在使用过程中如果遇到空调语音系统无法识别出用户指令的情况,则根据用户籍贯,自动切换成与用户籍贯地语言一致的语言系统,对用户指令进行识别,提高语音识别成功率。

进一步,本发明的方案,通过在使用过程中如果遇到空调语音系统无法识别出用户指令的情况,则根据用户籍贯,自动切换成与用户籍贯地语言一致的语言系统,对用户指令进行识别,提升用户使用的便捷性。

进一步,本发明的方案,通过在使用过程中如果遇到空调语音系统无法识别出用户指令的情况,则根据用户籍贯,自动切换成与用户籍贯地语言一致的语言系统,对用户指令进行识别,提升用户体验。

进一步,本发明的方案,通过在遇到语音系统无法识别出用户指令的情况时再尝试识别几次,如果仍然无法识别出用户指令则自动切换语音系统,可以避免误识别而影响用户使用。

进一步,本发明的方案,通过根据用户籍贯,自动切换成与用户籍贯地语言一致的语言系统,对用户指令进行识别,可以提高语音识别成功率,进而提升用户使用的便捷性和人性化体验。

由此,本发明的方案,通过根据用户指令识别用户身份,进而根据用户身份调用惯用语音系统,对用户指令进行识别,解决现有技术中根据已确定的语言系统或普通话系统来解析用户语音的方式,在用户使用的语言不符合已选的语言系统时则无法识别用户语言,存在语音识别成功率低的问题,从而,克服现有技术中识别成功率低、适用范围小和用户体验差的缺陷,实现识别成功率高、适用范围大和用户体验好的有益效果。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

图1为本发明的语音控制方法的一实施例的流程示意图;

图2为本发明的方法中确定发出所述语音指令的用户身份是否属于设定身份范围的一实施例的流程示意图;

图3为本发明的方法中调用与所述用户身份匹配的惯用语音系统对所述语音指令进行语义解析的一实施例的流程示意图;

图4为本发明的方法中在调用惯用语音系统对所述语音指令进行语义解析的解析失败的情况下继续处理的一实施例的流程示意图;

图5为本发明的方法中在调用默认语音系统对所述语音指令进行语义解析的解析失败的情况下继续处理的一实施例的流程示意图;

图6为本发明的语音控制装置的一实施例的结构示意图;

图7为本发明的空调的一实施例的自动切换语言系统的流程示意图。

结合附图,本发明实施例中附图标记如下:

102-获取单元;104-控制单元。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

根据本发明的实施例,提供了一种语音控制方法,如图1所示本发明的方法的一实施例的流程示意图。该语音控制方法可以包括:步骤s110至步骤s140。

在步骤s110处,获取可以用于控制待控设备的语音指令。例如:获取待控设备所属环境中可以用于控制待控设备的语音指令。

其中,所述语音指令,可以包括:普通话语音指令、外语语音指令、以及与待控设备的待使用用户的用户籍贯对应的方言语音指令。

由此,通过多种形式的语音指令,有利于提升用户使用语音服务的通用性和便捷性。

可选地,步骤s110中获取可以用于控制待控设备的语音指令,可以包括:获取语音采集模块采集到的可以用于控制待控设备的语音指令。

其中,所述语音采集模块,设置在待控设备侧、待控设备所属环境中、客户端中任一设置侧;和/或,所述语音采集模块,可以包括:麦克风。

由此,通过多种形式的语音指令的发送方式,有利于提升用户使用语音指令控制待控设备的便捷性和灵活性。

在步骤s120处,确定发出所述语音指令的用户身份是否属于设定身份范围。

可选地,所述设定身份范围,可以包括:设定声纹范围。

其中,可以结合图2所示本发明的方法中确定发出所述语音指令的用户身份是否属于设定身份范围的一实施例流程示意图,进一步说明步骤s120中确定发出所述语音指令的用户身份是否属于设定身份范围的具体过程,可以包括:步骤s210至步骤s240。

步骤s210,识别所述语音指令所包含的声纹信息。

例如:在使用过程中,语音空调麦克风采集到用户语音指令,首先对该语音的声纹进行识别。

步骤s220,确定所述声纹信息是否在所述设定声纹范围内。

步骤s230,若所述声纹信息在所述设定声纹范围内,则确定所述用户身份属于所述设定身份范围。

例如:如果用户身份存储模块中找到该声纹,则优先调用该声纹对应的惯用语言模块对用户指令进行解析对照。

或者,步骤s240,若所述声纹信息不在所述设定声纹范围内,则确定所述用户身份不属于所述设定身份范围。

例如:如果无法识别声纹身份,则调用默认语言系统对应的语音模块对语音指令进行解析对照。

由此,通过识别语音指令所保护的声纹信息确定用户身份,使得对用户身份确定的便捷性好、可靠性高。

在步骤s130处,若所述用户身份属于所述设定身份范围,则调用与所述用户身份匹配的惯用语音系统对所述语音指令进行语义解析。

可选地,可以结合图3所示本发明的方法中调用与所述用户身份匹配的惯用语音系统对所述语音指令进行语义解析的一实施例流程示意图,进一步说明步骤s130中调用与所述用户身份匹配的惯用语音系统对所述语音指令进行语义解析的具体过程,可以包括:步骤s310和步骤s320。

步骤s310,根据设定身份与设定语音系统之间的对应关系,将所述对应关系中与所述用户身份相同的所述设定身份对应的设定语音系统确定为与所述用户身份匹配的惯用语音系统。

步骤s320,根据所述惯用语音系统的惯用语义库对所述语音指令进行语义解析,以得到基于所述惯用语音系统确定的与所述语音指令匹配的语义关键词。

由此,通过根据用户身份调用与用户身份匹配的惯用语音系统,直接利用该用户惯用的惯用语音系统对该用户的语音指令进行语义解析,可以快速而精准地确定语音指令中的语义关键词,进而根据该语义关键词执行与该语音指令对应的控制指令,可靠性高、且用户体验好。

或者,在步骤s140处,若所述用户身份不属于所述设定身份范围,则调用设定的默认语音系统对所述语音指令进行语义解析。

例如:在使用过程中,如果遇到空调语音系统无法识别出用户指令的情况,语音系统能够根据用户籍贯,自动切换成与用户籍贯地语言一致的语言系统,对用户指令进行识别;使得语音控制过程变得更加灵活,提高了用户体验,提高了语音识别的准确信。

由此,通过在发送语音指令的用户身份属于设定身份范围时直接调用与该用户身份匹配的惯用语音系统对语音指令进行语义解析,在发送语音指令的用户身份不属于设定身份范围时调用待控设备设定的默认语音系统对语音指令进行语义解析,从而可以根据用户身份对语音指令进行语义解析,有利于提高语义解析中对语义识别的成功率和识别效率。

可选地,步骤s140中调用设定的默认语音系统对所述语音指令进行语义解析,可以包括:根据所述默认语音系统的默认语义库对所述语音指令进行语义解析,以得到基于所述默认语音系统确定的与所述语音指令匹配的语义关键词。

由此,通过在语音指令对应的用户身份不在设定身份范围内时,利用待控设备设置的默认语音系统对语音指令进行语义解析,可以方便其身份不在设定身份范围内的用户使用语音指令控制待控设备,且控制的便捷性和可靠性均较好。

其中,所述设定语音系统,可以包括:普通话语音系统、外语语音系统、以及与待控设备的待使用用户的用户籍贯对应的方言语音系统。所述默认语音系统,可以包括:普通话语音系统。所述惯用语音系统,可以包括:普通话语音系统、外语语音系统、以及与待控设备的待使用用户的用户籍贯对应的方言语音系统中任一语音系统。

由此,通过多种语音系统,有利于提升用户使用的便捷性和通用性。

在一个可选实施方式中,还可以包括:以下任一继续处理的控制情形。

第一种控制情形:在调用惯用语音系统对所述语音指令进行语义解析的解析失败的情况下继续处理的过程。

下面结合图4所示本发明的方法中在调用惯用语音系统对所述语音指令进行语义解析的解析失败的情况下继续处理的一实施例流程示意图,进一步说明在调用惯用语音系统对所述语音指令进行语义解析的解析失败的情况下继续处理的具体过程,可以包括:步骤s410至步骤s430。

步骤s410,在调用与所述用户身份匹配的惯用语音系统对所述语音指令进行语义解析之后,在调用与所述用户身份匹配的惯用语音系统对所述语音指令进行语义解析的解析失败的情况下,确定所述解析失败的第一解析次数是否大于或等于第一设定次数、和/或所述解释失败的第一解析时长是否大于或等于第一设定时长。

步骤s420,若所述第一解析次数大于或等于所述第一设定次数、和/或所述第一解析时长大于或等于所述第一设定时长,则调用设定语音系统中除所述惯用语音系统之外的其它语音系统进行语义解析。

或者,步骤s430,若所述第一解析次数小于所述第一设定次数、和/或所述第一解析时长小于所述第一设定时长,则继续使用所述惯用语音系统对所述语音指令进行语义解析。

例如:调用该声纹对应的惯用语言模块对用户指令进行解析对照,若解析三次都无法将语音指令解析成句意明确的语句,则自动调用第二种语言模块对语音进行识别。

由此,通过在利用惯用语音系统对语音指令进行语义解析的过程中,若解析失败则根据解析失败的次数、时间等控制是否切换至其它语音系统或继续利用该惯用语音系统进行语义解析,有利于在语音解析失败的情况下尽可能尝试再次解析或换用其它语音系统解析,可以提升用户使用的可靠性。

第二种控制情形:在调用默认语音系统对所述语音指令进行语义解析的解析失败的情况下继续处理的过程。

下面结合图5所示本发明的方法中在调用默认语音系统对所述语音指令进行语义解析的解析失败的情况下继续处理的一实施例流程示意图,进一步说明在调用默认语音系统对所述语音指令进行语义解析的解析失败的情况下继续处理的具体过程,可以包括:步骤s510至步骤s530。

步骤s510,在调用设定的默认语音系统对所述语音指令进行语义解析之后,在调用设定的默认语音系统对所述语音指令进行语义解析的解析失败的情况下,确定所述解析失败的第二解析次数是否大于或等于第二设定次数、和/或所述解释失败的第二解析时长是否大于或等于第二设定时长。

步骤s520,若所述第二解析次数大于或等于所述第二设定次数、和/或所述第二解析时长大于或等于所述第二设定时长,则调用设定语音系统中除所述默认语音系统之外的其它语音系统进行语义解析。

或者,步骤s530,若所述第二解析次数小于所述第二设定次数、和/或所述第二解析时长小于所述第二设定时长,则继续使用所述默认语音系统对所述语音指令进行语义解析。

例如:在使用过程中,如果遇到空调语音系统无法识别出用户指令的情况,语音系统会对该语音指令多次识别,识别次数不超过三次;如果三次识别都失败,语音系统能够根据用户籍贯,自动切换成与用户籍贯地语言一致的语言系统,对用户指令进行识别。

例如:调用默认语言系统对应的语音模块对语音指令进行解析对照。在解析识别过程中,如果解析三次都无法将语音指令解析成句意明确的语句,则自动调用第二语言系统对应的语音模块对用户语音指令进行解析对照。

由此,通过在利用默认语音系统对语音指令进行语义解析的过程中,若解析失败则根据解析失败的次数、时间等控制是否切换至其它语音系统或继续利用该默认语音系统进行语义解析,有利于在语音解析失败的情况下尽可能尝试再次解析或换用其它语音系统解析,可以提升用户使用的可靠性。

在一个可选实施方式中,还可以包括:在调用设定的默认语音系统对所述语音指令进行语义解析的解析成功的情况下,或在调用设定语音系统中除所述默认语音系统之外的其它语音系统进行语义解析的解析成功的情况下,或在继续使用所述默认语音系统对所述语音指令进行语义解析的解析成功的情况下,将对不属于所述设定身份范围的所述用户身份的语音指令进行语音解析的解析成功的当前语音系统确定为所述用户身份的惯用语音系统,并将所述用户身份存储至所述设定身份范围中。

例如:自动调用第二语言系统对应的语音模块对用户语音指令进行解析对照。解析成功后,记录成功解析该用户语音所调用的语言模块的次数,将调用次数多的语言模块作为用户惯用语言系统,与用户声纹对应记录在用户身份存储模块中,再下一次语音识别的时候,优先调用该语言模块。

由此,通过在对其身份不属于设定身份范围的用户的语音指令解析成功后,存储该用户的用户身份,并按解析成功的当前语音系统为该用户的惯用语音系统对该用户的用户身份进行匹配,可以方便下次该用户使用语音服务时可以快速而精准地利用其惯用语音系统进行语义解析,提高该用户使用语音服务的高效性和便捷性。

在一个可选实施方式中,还可以包括以下至少一种处理情形。

第一处理情形:预存用户身份与惯用语音系统及其对应关系的过程,具体可以如下:

在确定发出所述语音指令的用户身份是否属于设定身份范围之前,存储待控设备的待使用用户的用户身份,并建立用户身份与惯用语音系统之间的对应关系。

例如:在使用前,用户需选择添加自己惯用的地区方言,语音空调默认语言系统为普通话,则第二语言系统为用户选择的方言,用户也可根据自身习惯调节二者的顺序。

由此,通过预先存储用户身份、惯用语音系统及其对应关系,可以方便用户使用时直接根据用户身份调用惯用语音系统,提升语义解析的效率和精准性。

第二种情形:根据语义解析得到的语义关键词执行与语音指令对应的控制指令的过程,具体可以如下:

在调用与所述用户身份匹配的惯用语音系统对所述语音指令进行语义解析之后,或在调用设定的默认语音系统对所述语音指令进行语义解析之后,根据调用与所述用户身份匹配的惯用语音系统对所述语音指令进行语义解析得到的语义关键词、或调用设定的默认语音系统对所述语音指令进行语义解析得到的语义关键词,控制待控设备执行与所述语音指令对应的控制指令。

其中,控制待控设备执行与所述语音指令对应的控制指令,可以包括:若所述语音指令的语义关键词中包含中文与外语之间的翻译语义,则对与所述语音指令对应的控制指令进行翻译后再执行翻译后的控制指令。

例如:该语音空调音乐播放功能支持自动将中文翻译成英文的功能,该功能针对用户在使用过程中,需要说出歌手英文名、歌名等,但部分用户英文发音困难的情况,此时,用户只需在下达指令时加上“英文歌”三个字,就可以用对应的中文代替,系统会自动在音乐翻译模块中匹配歌曲对应的英文名。例如:用户想听英文歌“myheartwillgoon”,但用户不想说英文,他可以直接使用指令“我想听英文歌我心永恒”,语音空调可以自动将“我心永恒”翻译成“myheartwillgoon”,并执行指令。

由此,通过根据语义解析得到的语义关键词对应控制指令执行用户的语音指令,可以实现用户对待控设备的语音控制,而且可以根据不同语言需求进行翻译,大大方便了用户的使用,智能化程度高、人性化好。

经大量的试验验证,采用本实施例的技术方案,通过在使用过程中如果遇到空调语音系统无法识别出用户指令的情况,则根据用户籍贯,自动切换成与用户籍贯地语言一致的语言系统,对用户指令进行识别,提高语音识别成功率。

根据本发明的实施例,还提供了对应于语音控制方法的一种语音控制装置。参见图6所示本发明的装置的一实施例的结构示意图。该语音控制装置可以包括:获取单元102和控制单元104。

在一个可选例子中,获取单元102,可以用于获取可以用于控制待控设备的语音指令。例如:获取待控设备所属环境中可以用于控制待控设备的语音指令。该获取单元102的具体功能及处理参见步骤s110。

其中,所述语音指令,可以包括:普通话语音指令、外语语音指令、以及与待控设备的待使用用户的用户籍贯对应的方言语音指令。

由此,通过多种形式的语音指令,有利于提升用户使用语音服务的通用性和便捷性。

可选地,所述获取单元102获取可以用于控制待控设备的语音指令,可以包括:所述获取单元102,具体还可以用于获取语音采集模块采集到的可以用于控制待控设备的语音指令。

其中,所述语音采集模块,设置在待控设备侧、待控设备所属环境中、客户端中任一设置侧;和/或,所述语音采集模块,可以包括:麦克风。

由此,通过多种形式的语音指令的发送方式,有利于提升用户使用语音指令控制待控设备的便捷性和灵活性。

在一个可选例子中,控制单元104,可以用于确定发出所述语音指令的用户身份是否属于设定身份范围。该控制单元104的具体功能及处理参见步骤s120。

可选地,所述设定身份范围,可以包括:设定声纹范围。

其中,所述控制单元104确定发出所述语音指令的用户身份是否属于设定身份范围,可以包括:

所述控制单元104,具体还可以用于识别所述语音指令所包含的声纹信息。该控制单元104的具体功能及处理还参见步骤s210。

例如:在使用过程中,语音空调麦克风采集到用户语音指令,首先对该语音的声纹进行识别。

所述控制单元104,具体还可以用于确定所述声纹信息是否在所述设定声纹范围内。该控制单元104的具体功能及处理还参见步骤s220。

所述控制单元104,具体还可以用于若所述声纹信息在所述设定声纹范围内,则确定所述用户身份属于所述设定身份范围。该控制单元104的具体功能及处理还参见步骤s230。

例如:如果用户身份存储模块中找到该声纹,则优先调用该声纹对应的惯用语言模块对用户指令进行解析对照。

或者,所述控制单元104,具体还可以用于若所述声纹信息不在所述设定声纹范围内,则确定所述用户身份不属于所述设定身份范围。该控制单元104的具体功能及处理还参见步骤s240。

例如:如果无法识别声纹身份,则调用默认语言系统对应的语音模块对语音指令进行解析对照。

由此,通过识别语音指令所保护的声纹信息确定用户身份,使得对用户身份确定的便捷性好、可靠性高。

在一个可选例子中,所述控制单元104,还可以用于若所述用户身份属于所述设定身份范围,则调用与所述用户身份匹配的惯用语音系统对所述语音指令进行语义解析。该控制单元104的具体功能及处理还参见步骤s130。

可选地,所述控制单元104调用与所述用户身份匹配的惯用语音系统对所述语音指令进行语义解析,可以包括:

所述控制单元104,具体还可以用于根据设定身份与设定语音系统之间的对应关系,将所述对应关系中与所述用户身份相同的所述设定身份对应的设定语音系统确定为与所述用户身份匹配的惯用语音系统。该控制单元104的具体功能及处理还参见步骤s310。

所述控制单元104,具体还可以用于根据所述惯用语音系统的惯用语义库对所述语音指令进行语义解析,以得到基于所述惯用语音系统确定的与所述语音指令匹配的语义关键词。该控制单元104的具体功能及处理还参见步骤s320。

由此,通过根据用户身份调用与用户身份匹配的惯用语音系统,直接利用该用户惯用的惯用语音系统对该用户的语音指令进行语义解析,可以快速而精准地确定语音指令中的语义关键词,进而根据该语义关键词执行与该语音指令对应的控制指令,可靠性高、且用户体验好。

或者,在一个可选例子中,所述控制单元104,还可以用于若所述用户身份不属于所述设定身份范围,则调用设定的默认语音系统对所述语音指令进行语义解析。该控制单元104的具体功能及处理还参见步骤s140。

例如:在使用过程中,如果遇到空调语音系统无法识别出用户指令的情况,语音系统能够根据用户籍贯,自动切换成与用户籍贯地语言一致的语言系统,对用户指令进行识别;使得语音控制过程变得更加灵活,提高了用户体验,提高了语音识别的准确信。

由此,通过在发送语音指令的用户身份属于设定身份范围时直接调用与该用户身份匹配的惯用语音系统对语音指令进行语义解析,在发送语音指令的用户身份不属于设定身份范围时调用待控设备设定的默认语音系统对语音指令进行语义解析,从而可以根据用户身份对语音指令进行语义解析,有利于提高语义解析中对语义识别的成功率和识别效率。

可选地,所述控制单元104调用设定的默认语音系统对所述语音指令进行语义解析,可以包括:所述控制单元104,具体还可以用于根据所述默认语音系统的默认语义库对所述语音指令进行语义解析,以得到基于所述默认语音系统确定的与所述语音指令匹配的语义关键词。

由此,通过在语音指令对应的用户身份不在设定身份范围内时,利用待控设备设置的默认语音系统对语音指令进行语义解析,可以方便其身份不在设定身份范围内的用户使用语音指令控制待控设备,且控制的便捷性和可靠性均较好。

其中,所述设定语音系统,可以包括:普通话语音系统、外语语音系统、以及与待控设备的待使用用户的用户籍贯对应的方言语音系统。所述默认语音系统,可以包括:普通话语音系统。所述惯用语音系统,可以包括:普通话语音系统、外语语音系统、以及与待控设备的待使用用户的用户籍贯对应的方言语音系统中任一语音系统。

由此,通过多种语音系统,有利于提升用户使用的便捷性和通用性。

在一个可选实施方式中,还可以包括:以下任一继续处理的控制情形。

第一种控制情形:在调用惯用语音系统对所述语音指令进行语义解析的解析失败的情况下继续处理的过程,具体如下:

所述控制单元104,还可以用于在调用与所述用户身份匹配的惯用语音系统对所述语音指令进行语义解析之后,在调用与所述用户身份匹配的惯用语音系统对所述语音指令进行语义解析的解析失败的情况下,确定所述解析失败的第一解析次数是否大于或等于第一设定次数、和/或所述解释失败的第一解析时长是否大于或等于第一设定时长。该控制单元104的具体功能及处理还参见步骤s410。

所述控制单元104,还可以用于若所述第一解析次数大于或等于所述第一设定次数、和/或所述第一解析时长大于或等于所述第一设定时长,则调用设定语音系统中除所述惯用语音系统之外的其它语音系统进行语义解析。该控制单元104的具体功能及处理还参见步骤s420。

或者,所述控制单元104,还可以用于若所述第一解析次数小于所述第一设定次数、和/或所述第一解析时长小于所述第一设定时长,则继续使用所述惯用语音系统对所述语音指令进行语义解析。该控制单元104的具体功能及处理还参见步骤s430。

例如:调用该声纹对应的惯用语言模块对用户指令进行解析对照,若解析三次都无法将语音指令解析成句意明确的语句,则自动调用第二种语言模块对语音进行识别。

由此,通过在利用惯用语音系统对语音指令进行语义解析的过程中,若解析失败则根据解析失败的次数、时间等控制是否切换至其它语音系统或继续利用该惯用语音系统进行语义解析,有利于在语音解析失败的情况下尽可能尝试再次解析或换用其它语音系统解析,可以提升用户使用的可靠性。

第二种控制情形:在调用默认语音系统对所述语音指令进行语义解析的解析失败的情况下继续处理的过程,具体如下:

所述控制单元104,还可以用于在调用设定的默认语音系统对所述语音指令进行语义解析之后,在调用设定的默认语音系统对所述语音指令进行语义解析的解析失败的情况下,确定所述解析失败的第二解析次数是否大于或等于第二设定次数、和/或所述解释失败的第二解析时长是否大于或等于第二设定时长。该控制单元104的具体功能及处理还参见步骤s510。

所述控制单元104,还可以用于若所述第二解析次数大于或等于所述第二设定次数、和/或所述第二解析时长大于或等于所述第二设定时长,则调用设定语音系统中除所述默认语音系统之外的其它语音系统进行语义解析。该控制单元104的具体功能及处理还参见步骤s520。

或者,所述控制单元104,还可以用于若所述第二解析次数小于所述第二设定次数、和/或所述第二解析时长小于所述第二设定时长,则继续使用所述默认语音系统对所述语音指令进行语义解析。该控制单元104的具体功能及处理还参见步骤s530。

例如:在使用过程中,如果遇到空调语音系统无法识别出用户指令的情况,语音系统会对该语音指令多次识别,识别次数不超过三次;如果三次识别都失败,语音系统能够根据用户籍贯,自动切换成与用户籍贯地语言一致的语言系统,对用户指令进行识别。

例如:调用默认语言系统对应的语音模块对语音指令进行解析对照。在解析识别过程中,如果解析三次都无法将语音指令解析成句意明确的语句,则自动调用第二语言系统对应的语音模块对用户语音指令进行解析对照。

由此,通过在利用默认语音系统对语音指令进行语义解析的过程中,若解析失败则根据解析失败的次数、时间等控制是否切换至其它语音系统或继续利用该默认语音系统进行语义解析,有利于在语音解析失败的情况下尽可能尝试再次解析或换用其它语音系统解析,可以提升用户使用的可靠性。

在一个可选实施方式中,还可以包括:所述控制单元104,还可以用于在调用设定的默认语音系统对所述语音指令进行语义解析的解析成功的情况下,或在调用设定语音系统中除所述默认语音系统之外的其它语音系统进行语义解析的解析成功的情况下,或在继续使用所述默认语音系统对所述语音指令进行语义解析的解析成功的情况下,将对不属于所述设定身份范围的所述用户身份的语音指令进行语音解析的解析成功的当前语音系统确定为所述用户身份的惯用语音系统,并将所述用户身份存储至所述设定身份范围中。

例如:自动调用第二语言系统对应的语音模块对用户语音指令进行解析对照。解析成功后,记录成功解析该用户语音所调用的语言模块的次数,将调用次数多的语言模块作为用户惯用语言系统,与用户声纹对应记录在用户身份存储模块中,再下一次语音识别的时候,优先调用该语言模块。

由此,通过在对其身份不属于设定身份范围的用户的语音指令解析成功后,存储该用户的用户身份,并按解析成功的当前语音系统为该用户的惯用语音系统对该用户的用户身份进行匹配,可以方便下次该用户使用语音服务时可以快速而精准地利用其惯用语音系统进行语义解析,提高该用户使用语音服务的高效性和便捷性。

在一个可选实施方式中,还可以包括以下至少一种处理情形。

第一处理情形:预存用户身份与惯用语音系统及其对应关系的过程,具体如下:

所述控制单元104,还可以用于在确定发出所述语音指令的用户身份是否属于设定身份范围之前,存储待控设备的待使用用户的用户身份,并建立用户身份与惯用语音系统之间的对应关系。

例如:在使用前,用户需选择添加自己惯用的地区方言,语音空调默认语言系统为普通话,则第二语言系统为用户选择的方言,用户也可根据自身习惯调节二者的顺序。

由此,通过预先存储用户身份、惯用语音系统及其对应关系,可以方便用户使用时直接根据用户身份调用惯用语音系统,提升语义解析的效率和精准性。

第二种情形:根据语义解析得到的语义关键词执行与语音指令对应的控制指令的过程,具体如下:

所述控制单元104,还可以用于在调用与所述用户身份匹配的惯用语音系统对所述语音指令进行语义解析之后,或在调用设定的默认语音系统对所述语音指令进行语义解析之后,根据调用与所述用户身份匹配的惯用语音系统对所述语音指令进行语义解析得到的语义关键词、或调用设定的默认语音系统对所述语音指令进行语义解析得到的语义关键词,控制待控设备执行与所述语音指令对应的控制指令。

其中,所述控制单元104控制待控设备执行与所述语音指令对应的控制指令,可以包括:所述控制单元104,具体还可以用于若所述语音指令的语义关键词中包含中文与外语之间的翻译语义,则对与所述语音指令对应的控制指令进行翻译后再执行翻译后的控制指令。

例如:该语音空调音乐播放功能支持自动将中文翻译成英文的功能,该功能针对用户在使用过程中,需要说出歌手英文名、歌名等,但部分用户英文发音困难的情况,此时,用户只需在下达指令时加上“英文歌”三个字,就可以用对应的中文代替,系统会自动在音乐翻译模块中匹配歌曲对应的英文名。例如:用户想听英文歌“myheartwillgoon”,但用户不想说英文,他可以直接使用指令“我想听英文歌我心永恒”,语音空调可以自动将“我心永恒”翻译成“myheartwillgoon”,并执行指令。

由此,通过根据语义解析得到的语义关键词对应控制指令执行用户的语音指令,可以实现用户对待控设备的语音控制,而且可以根据不同语言需求进行翻译,大大方便了用户的使用,智能化程度高、人性化好。

由于本实施例的装置所实现的处理及功能基本相应于前述图1至图5所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。

经大量的试验验证,采用本发明的技术方案,通过在使用过程中如果遇到空调语音系统无法识别出用户指令的情况,则根据用户籍贯,自动切换成与用户籍贯地语言一致的语言系统,对用户指令进行识别,提升用户使用的便捷性。

根据本发明的实施例,还提供了对应于语音控制装置的一种空调。该空调可以包括:以上所述的语音控制装置。

在一个可选实施方式中,针对在用户使用的语言不符合已选的语言系统时则无法识别用户语言存在语音识别成功率低的问题,本发明的方案,提出一种自动切换语言系统的语音空调,在使用过程中,如果遇到空调语音系统无法识别出用户指令的情况,语音系统能够根据用户籍贯,自动切换成与用户籍贯地语言一致的语言系统,对用户指令进行识别。从而,使得语音控制过程变得更加灵活,提高了用户体验,提高了语音识别的准确信。

其中,无法识别的情况,可以包括:语音系统没有听懂用户的话,也就是通过语音识别技术解析出的用户语义不符合语言逻辑,设备无法得出用户的意图;而无法识别的原因可能是因为语种不同,此时就切换到另外一种语言系统。

例如:也可以在遇到语音系统无法识别出用户指令的情况时再尝试识别几次,如果仍然无法识别出用户指令则自动切换语音系统。如:在使用过程中,如果遇到空调语音系统无法识别出用户指令的情况,语音系统会对该语音指令多次识别,识别次数不超过三次;如果三次识别都失败,语音系统能够根据用户籍贯,自动切换成与用户籍贯地语言一致的语言系统,对用户指令进行识别。

例如:用户籍贯或用户户籍,可以通过用户身份证信息、用户主动输入、分析用户方言等方式获取。

在一个可选例子中,本发明的方案中,该语音空调能够自动切换语言系统,可以包括:可自动切换普通话、地方方言、英文语言系统;绑定用户身份与用户惯用语言;支持中文歌名自动翻译成英文歌名。

在一个可选具体实施方式中,可以参见图7所示的例子,对本发明的方案的具体实现过程进行示例性说明。

在一个可选具体例子中,本发明的方案中,该系统可以包括:语音存储模块、用户身份存储模块和音乐翻译模块。

可选地,语音存储模块:可以用于存储普通话语音模块与方言语音模块。

可选地,用户身份存储模块:可以用于绑定存储用户声纹与惯用语言。

可选地,音乐翻译模块:用于存储时下热门的英文歌名与对应的中文歌名、欧美歌手英文名与对应中文名。

在一个可选具体例子中,参见图7所示的例子,本发明的方案的具体实现过程,可以包括:

步骤1、在使用前,用户需选择添加自己惯用的地区方言,语音空调默认语言系统为普通话,则第二语言系统为用户选择的方言,用户也可根据自身习惯调节二者的顺序。

步骤2、在使用过程中,语音空调麦克风采集到用户语音指令,首先对该语音的声纹进行识别:

如果用户身份存储模块中找到该声纹,则优先调用该声纹对应的惯用语言模块对用户指令进行解析对照,若解析三次都无法将语音指令解析成句意明确的语句,则自动调用第二种语言模块对语音进行识别。

如果无法识别声纹身份,则调用默认语言系统对应的语音模块对语音指令进行解析对照。在解析识别过程中,如果解析三次都无法将语音指令解析成句意明确的语句,则自动调用第二语言系统对应的语音模块对用户语音指令进行解析对照。解析成功后,记录成功解析该用户语音所调用的语言模块的次数,将调用次数多的语言模块作为用户惯用语言系统,与用户声纹对应记录在用户身份存储模块中,再下一次语音识别的时候,优先调用该语言模块。

其中,该方法解决了家庭多用户情况下,老人习惯说方言,小孩只会讲普通话的问题。在家庭中多个用户去控制空调的时候,语音指令往往不是一个人下达的,导致语言类别处于切换状态。比如上一秒小孩调皮把空调调到了16度,老人担心小孩感冒,将空调调到26度,小孩使用普通话下达指令,老人使用方言下达语音指令,该方法能够根据用户声纹,首先调用用户惯用的语言模块来解析语音,提高了语音解析的成功率。

除此之外,该语音空调音乐播放功能支持自动将中文翻译成英文的功能,该功能针对用户在使用过程中,需要说出歌手英文名、歌名等,但部分用户英文发音困难的情况,此时,用户只需在下达指令时加上“英文歌”三个字,就可以用对应的中文代替,系统会自动在音乐翻译模块中匹配歌曲对应的英文名。例如:用户想听英文歌“myheartwillgoon”,但用户不想说英文,他可以直接使用指令“我想听英文歌我心永恒”,语音空调可以自动将“我心永恒”翻译成“myheartwillgoon”,并执行指令。

由于本实施例的空调所实现的处理及功能基本相应于前述图6所示的装置的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。

经大量的试验验证,采用本发明的技术方案,通过在使用过程中如果遇到空调语音系统无法识别出用户指令的情况,则根据用户籍贯,自动切换成与用户籍贯地语言一致的语言系统,对用户指令进行识别,提升用户体验。

根据本发明的实施例,还提供了对应于语音控制方法的一种存储介质。该存储介质,可以包括:所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行以上所述的语音控制方法。

由于本实施例的存储介质所实现的处理及功能基本相应于前述图1至图5所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。

经大量的试验验证,采用本发明的技术方案,通过在遇到语音系统无法识别出用户指令的情况时再尝试识别几次,如果仍然无法识别出用户指令则自动切换语音系统,可以避免误识别而影响用户使用。

根据本发明的实施例,还提供了对应于语音控制方法的一种空调。该空调,可以包括:处理器,用于执行多条指令;存储器,用于存储多条指令;其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行以上所述的语音控制方法。

由于本实施例的空调所实现的处理及功能基本相应于前述图1至图5所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。

经大量的试验验证,采用本发明的技术方案,通过根据用户籍贯,自动切换成与用户籍贯地语言一致的语言系统,对用户指令进行识别,可以提高语音识别成功率,进而提升用户使用的便捷性和人性化体验。

综上,本领域技术人员容易理解的是,在不冲突的前提下,上述各有利方式可以自由地组合、叠加。

以上所述仅为本发明的实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1