一种语音控制方法、装置、存储介质及空调与流程

文档序号:17493659发布日期:2019-04-23 20:58阅读:182来源:国知局
一种语音控制方法、装置、存储介质及空调与流程

本发明属于语音控制技术领域,具体涉及一种语音控制方法、装置、存储介质及空调,尤其涉及一种语音空调语音识别状态控制方法、装置、存储介质及ai空调。



背景技术:

在专利(申请)号为201710543572.8的在先文献中,公开了一种语音唤醒方法,智能设备进入语音识别阶段后,若接收到的第一请求为唤醒词,确定接收的唤醒词用于重新唤醒智能设备。其中,为防止误操作而重复进行唤醒词控制的行为,影响了用户体验,增加了语音控制的流程繁琐性,不够人性化,且交互生硬。



技术实现要素:

本发明的目的在于,针对上述缺陷,提供一种语音控制方法、装置、存储介质及空调,以解决现有技术中智能设备进入语音识别阶段后若接收到的第一请求为唤醒词,则确定接收的唤醒词用于重新唤醒智能设备,这种为防止误操作而重复进行唤醒词控制的行为,影响了用户体验的问题,达到提升用户体验的效果。

本发明提供一种语音控制方法,包括:获取在待控设备的语音识别状态下其所属环境中的声音信息;所述声音信息,包括:语音指令和/或环境噪音;确定所述声音信息中的环境噪音的噪音音量是否超出设定的噪音阈值;若所述噪音音量未超出所述噪音阈值,则根据所述声音信息中的语音指令控制待控设备保持在所述语音识别状态;或者,若所述噪音音量超出所述噪音阈值,则根据所述声音信息中的语音指令和环境噪音控制待控设备退出所述语音识别状态。

可选地,根据所述声音信息中的语音指令控制待控设备保持在所述语音识别状态,包括:对所述声音信息中的语音指令进行语义解析,以确定所述声音信息中的语音指令是否为设定的用户控制指令;若所述声音信息中的语音指令是所述用户控制指令,则控制待控设备执行所述用户控制指令;或者,若所述声音信息中的语音指令不是所述用户控制指令,则继续获取所述语音识别状态下待控设备所属环境中的声音信息。

可选地,根据所述声音信息中的语音指令和环境噪音控制待控设备退出所述语音识别状态,包括:对所述声音信息中的语音指令进行语义解析,以确定所述声音信息中的语音指令是否为设定的用户控制指令;若所述声音信息中的语音指令是所述用户控制指令,则控制待控设备执行所述用户控制指令,并根据所述语音识别状态下的聆听时间控制待控设备退出所述语音识别状态;或者,若所述声音信息中的语音指令不是所述用户控制指令,则确定所述声音信息为环境噪音,并根据所述语音识别状态下的聆听时间控制待控设备退出所述语音识别状态。

可选地,根据所述语音识别状态下的聆听时间控制待控设备退出所述语音识别状态,包括:确定所述语音识别状态下设定的聆听时间内是否有新的语音指令输入;若在所述聆听时间内有新的语音指令输入,则继续获取所述语音识别状态下待控设备所属环境中的声音信息;或者,若在所述聆听时间内没有新的语音指令输入,则退出所述语音识别状态。

可选地,还包括:获取待控设备所属环境中用于唤醒待控设备的语音服务的语音唤醒词;根据所述语音唤醒词,控制待控设备进入语音识别状态,以启动待控设备的语音服务。

可选地,还包括:对待控设备处于所述语音识别状态的第一状态、和/或待控设备退出所述语音识别状态的第二状态进行指示;和/或,若待控设备在处于所述语音识别状态的第一状态、以及退出所述语音识别状态的第二状态之间发送状态改变,则对所述状态改变的情况进行提示。

与上述方法相匹配,本发明另一方面提供一种语音控制装置,包括:获取单元,用于获取在待控设备的语音识别状态下其所属环境中的声音信息;所述声音信息,包括:语音指令和/或环境噪音;控制单元,用于确定所述声音信息中的环境噪音的噪音音量是否超出设定的噪音阈值;所述控制单元,还用于若所述噪音音量未超出所述噪音阈值,则根据所述声音信息中的语音指令控制待控设备保持在所述语音识别状态;或者,所述控制单元,还用于若所述噪音音量超出所述噪音阈值,则根据所述声音信息中的语音指令和环境噪音控制待控设备退出所述语音识别状态。

可选地,所述控制单元根据所述声音信息中的语音指令控制待控设备保持在所述语音识别状态,包括:对所述声音信息中的语音指令进行语义解析,以确定所述声音信息中的语音指令是否为设定的用户控制指令;若所述声音信息中的语音指令是所述用户控制指令,则控制待控设备执行所述用户控制指令;或者,若所述声音信息中的语音指令不是所述用户控制指令,则继续获取所述语音识别状态下待控设备所属环境中的声音信息。

可选地,所述控制单元根据所述声音信息中的语音指令和环境噪音控制待控设备退出所述语音识别状态,包括:对所述声音信息中的语音指令进行语义解析,以确定所述声音信息中的语音指令是否为设定的用户控制指令;若所述声音信息中的语音指令是所述用户控制指令,则控制待控设备执行所述用户控制指令,并根据所述语音识别状态下的聆听时间控制待控设备退出所述语音识别状态;或者,若所述声音信息中的语音指令不是所述用户控制指令,则确定所述声音信息为环境噪音,并根据所述语音识别状态下的聆听时间控制待控设备退出所述语音识别状态。

可选地,所述控制单元根据所述语音识别状态下的聆听时间控制待控设备退出所述语音识别状态,包括:确定所述语音识别状态下设定的聆听时间内是否有新的语音指令输入;若在所述聆听时间内有新的语音指令输入,则继续获取所述语音识别状态下待控设备所属环境中的声音信息;或者,若在所述聆听时间内没有新的语音指令输入,则退出所述语音识别状态。

可选地,还包括:所述获取单元,还用于获取待控设备所属环境中用于唤醒待控设备的语音服务的语音唤醒词;所述控制单元,还用于根据所述语音唤醒词,控制待控设备进入语音识别状态,以启动待控设备的语音服务。

可选地,还包括:所述控制单元,还用于对待控设备处于所述语音识别状态的第一状态、和/或待控设备退出所述语音识别状态的第二状态进行指示;和/或,所述控制单元,还用于若待控设备在处于所述语音识别状态的第一状态、以及退出所述语音识别状态的第二状态之间发送状态改变,则对所述状态改变的情况进行提示。

与上述装置相匹配,本发明再一方面提供一种空调,包括:以上所述的语音控制装置。

与上述方法相匹配,本发明再一方面提供一种存储介质,包括:所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行以上所述的语音控制方法。

与上述方法相匹配,本发明再一方面提供一种空调,包括:处理器,用于执行多条指令;存储器,用于存储多条指令;其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行以上所述的语音控制方法。

本发明的方案,通过在一定场景下省略唤醒词直接进行智能控制,优化用户体验,使交互更友好智能,简化控制流程。

进一步,本发明的方案,通过在不影响语音识别准确率的情况下简化用户操作,智能省略用户唤醒词输入,提高用户体验和交互的人性化程度。

进一步,本发明的方案,通过根据环境噪音情况,自适应调整聆听时间,在安静环境下延长聆听时间,避免用户经常输入唤醒词带来的不耐烦,可以优化用户体验,简化控制流程。

进一步,本发明的方案,通过基于检测周围环境噪音大小,判别语音识别的误识别率大小,智能调整语音识别聆听退出时间,在不影响语音识别准确率的情况下简化用户操作,智能省略用户唤醒词输入,提高用户体验。

进一步,本发明的方案,通过在智能装置被唤醒后,如果一直处于安静环境下,误识别低且智能设备可准确识别用户语音控制操作,不会产生误识别,则智能设备保持语音识别状态,下次语音控制无需重新输入语音唤醒词,可以提高用户体验。

由此,本发明的方案,通过基于检测周围环境噪音大小,判别语音识别的误识别率大小,智能调整语音识别聆听退出时间,解决现有技术中智能设备进入语音识别阶段后若接收到的第一请求为唤醒词,则确定接收的唤醒词用于重新唤醒智能设备,这种为防止误操作而重复进行唤醒词控制的行为,影响了用户体验的问题,从而,克服现有技术中用户体验差、控制过程繁琐和交互灵活性差的缺陷,实现用户体验好、控制过程简单和交互灵活性好的有益效果。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

图1为本发明的语音控制方法的一实施例的流程示意图;

图2为本发明的方法中根据所述声音信息中的语音指令控制待控设备保持在所述语音识别状态的一实施例的流程示意图;

图3为本发明的方法中根据所述声音信息中的语音指令和环境噪音控制待控设备退出所述语音识别状态的一实施例的流程示意图;

图4为本发明的方法中根据所述语音识别状态下的聆听时间控制待控设备退出所述语音识别状态的一实施例的流程示意图;

图5为本发明的方法中根据语音唤醒词控制待控设备进入语音识别状态的一实施例的流程示意图;

图6为本发明的语音控制装置的一实施例的结构示意图;

图7为本发明的空调的一实施例的唤醒控制流程示意图。

结合附图,本发明实施例中附图标记如下:

102-获取单元;104-控制单元。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

根据本发明的实施例,提供了一种语音控制方法,如图1所示本发明的方法的一实施例的流程示意图。该语音控制方法可以包括:步骤s110至步骤s130。

在步骤s110处,获取在待控设备的语音识别状态下其所属环境中的声音信息。所述声音信息,可以包括:语音指令和/或环境噪音。例如:智能装置被唤醒后,处于语音识别阶段。

在步骤s120处,确定所述声音信息中的环境噪音的噪音音量是否超出设定的噪音阈值。例如:环境噪音的判断:假如采集到的语音能识别出语音控制指令,则滤除语音控制指令的其他波形段输入为环境噪音。假如采集到的语音不能识别出语音控制指令,则该段语音全部视为环境噪音。

在步骤s130处,若所述噪音音量未超出所述噪音阈值,则根据所述声音信息中的语音指令控制待控设备保持在所述语音识别状态,以在下次语音控制时无需重新唤醒待控设备而直接在所述语音识别状态下进行语音控制。例如:智能装置被唤醒后,如果一直处于安静环境下,误识别低且智能设备可准确识别用户语音控制操作,不会产生误识别,则智能设备保持语音识别状态;下次语音控制无需重新输入语音唤醒词。

可选地,可以结合图2所示本发明的方法中根据所述声音信息中的语音指令控制待控设备保持在所述语音识别状态的一实施例流程示意图,进一步说明步骤s130中根据所述声音信息中的语音指令控制待控设备保持在所述语音识别状态的具体过程,可以包括:步骤s210至步骤s230。

步骤s210,对所述声音信息中的语音指令进行语义解析,以确定所述声音信息中的语音指令是否为设定的用户控制指令。

步骤s220,若所述声音信息中的语音指令是所述用户控制指令,则控制待控设备执行所述用户控制指令。

或者,步骤s230,若所述声音信息中的语音指令不是所述用户控制指令,则继续获取所述语音识别状态下待控设备所属环境中的声音信息。

例如:持续识别模式及持续进行语音采集,用户每次发出控制语音指令不需要先发出语音唤醒指令。直到用户使用语音控制指令退出语音识别状态或智能设备识别到环境噪音超过预设阈值切换到等待退出模式。

由此,通过在环境噪音较小的情况下控制待控设备保持在语音识别状态下,在该语音识别状态下若对语音指令的语义解析成功则直接控制待控设备执行该语音指令,若对语音指令的语义解析不成功则继续获取环境中的声音信息以继续在语音识别状态下进行语音指令的语音解析及控制,大大方便了用户在唤醒待控设备的语音服务后随时发送语音指令控制待控设备,控制效率更好,使用便捷性更佳。

或者,在步骤s140处,若所述噪音音量超出所述噪音阈值,则根据所述声音信息中的语音指令和环境噪音控制待控设备退出所述语音识别状态。例如:在语音识别阶段,一旦检测环境噪音大则在一定等待时间后退出语音识别状态,如需控制需要再次通过语音唤醒词唤醒智能设备。

例如:为了解决唤醒词控制影响用户体验的问题,通过基于检测周围环境噪音大小,判别语音识别的误识别率大小,智能调整语音识别聆听退出时间,在不影响语音识别准确率的情况下简化用户操作,智能省略用户唤醒词输入。从而,采用本发明的唤醒控制方法,可在一定场景下省略唤醒词直接进行智能控制,优化用户体验,使交互更友好智能。

例如:采集语音,检测环境噪音,如果环境噪音超过设定阈值分贝。则语音识别开启等待退出模式。如果环境噪音低于设定阈值分贝。则语音识别开启持续识别模式。

由此,通过在待控设备处于语音识别状态下时,根据获取的环境中的声音信息中的噪音音量控制待控设备保持在语音识别状态下或退出语音识别状态,可以在噪音音量较低时不按设定的聆听时间退出语音识别状态,方便用户在下次语音控制时直接在该语音识别状态下进行,避免重复唤醒,提升了用户体验,也简化了控制流程。

可选地,结合图3所示本发明的方法中根据所述声音信息中的语音指令和环境噪音控制待控设备退出所述语音识别状态的一实施例流程示意图,进一步说明步骤s140中根据所述声音信息中的语音指令和环境噪音控制待控设备退出所述语音识别状态的具体过程,可以包括:步骤s310至步骤s330。

步骤s310,对所述声音信息中的语音指令进行语义解析,以确定所述声音信息中的语音指令是否为设定的用户控制指令。

步骤s320,若所述声音信息中的语音指令是所述用户控制指令,则控制待控设备执行所述用户控制指令,并根据所述语音识别状态下的聆听时间控制待控设备退出所述语音识别状态。

或者,步骤s330,若所述声音信息中的语音指令不是所述用户控制指令,则确定待控设备不能识别所述声音信息中的语音指令,即确定所述声音信息为环境噪音,并根据所述语音识别状态下的聆听时间控制待控设备退出所述语音识别状态。

例如:等待退出模式及在每特定时间t内没有等待采集到有效语音输入则退出语音识别模式。再次进入语音识别状态需要首先接收到唤醒指令。

由此,通过在环境噪音较大的情况下若对语音指令的语义解析成功则直接控制待控设备执行该语音指令后按设定的聆听时间控制待控设备退出语音识别状态,若对语音指令的语义解析不成功则确定环境中的声音信息全部为环境噪音按按设定的聆听时间控制待控设备退出语音识别状态,以在环境噪音较大的情况下退出语音识别状态节约资源,人性化好。

更可选地,结合图4所示本发明的方法中根据所述语音识别状态下的聆听时间控制待控设备退出所述语音识别状态的一实施例流程示意图,进一步说明步骤s320或步骤s330中根据所述语音识别状态下的聆听时间控制待控设备退出所述语音识别状态的具体过程,可以包括:步骤s410至步骤s430。

步骤s410,确定所述语音识别状态下设定的聆听时间内是否有新的语音指令输入。

步骤s420,若在所述聆听时间内有新的语音指令输入,则继续获取所述语音识别状态下待控设备所属环境中的声音信息。

或者,步骤s430,若在所述聆听时间内没有新的语音指令输入,则退出所述语音识别状态,以继续获取待控设备所属环境中可以用于唤醒待控设备的语音服务的语音唤醒词。

由此,通过在设定的聆听时间内没有新的语音指令输入的情况下退出语音识别状态,以在环境噪音较大的情况下退出当前的语音识别状态而重新唤醒并重新进入新的语音识别状态,有利于提升控制的可靠性,也有利于节约在环境噪音较大的情况下持续进行语音识别而耗费的资源。

在一个可选实施方式中,还可以包括:根据语音唤醒词控制待控设备进入语音识别状态的过程。

下面结合图5所示本发明的方法中根据语音唤醒词控制待控设备进入语音识别状态的一实施例流程示意图,进一步说明根据语音唤醒词控制待控设备进入语音识别状态的具体过程,可以包括:步骤s510和步骤s520。

步骤s510,在获取在待控设备的语音识别状态下其所属环境中的声音信息之前,获取待控设备所属环境中可以用于唤醒待控设备的语音服务的语音唤醒词。

步骤s520,根据所述语音唤醒词,控制待控设备进入语音识别状态,以启动待控设备的语音服务。

例如:智能语音设备接收到语音唤醒词,智能语音设备被唤醒。智能语音设备进入语音识别阶段,接收语音并识别。

由此,通过在接收到待控设备所属环境中的语音唤醒词的情况下,控制待控设备进入语音识别状态,以启动待控设备的语音服务,使得语音服务的使用便捷、且安全。

在一个可选实施方式中,还可以包括以下至少一种控制方式。

第一种控制方式:对待控设备处于所述语音识别状态的第一状态、和/或待控设备退出所述语音识别状态的第二状态进行指示。例如:若待控设备处于所述语音识别状态下,则对待控设备处于所述语音识别状态的第一状态进行指示灯开启指示或显示。若待控设备退出所述语音识别状态,则对待控设备退出所述语音识别状态的第二状态进行指示灯熄灭至少或显示。

第二种控制方式:若待控设备在处于所述语音识别状态的第一状态、以及退出所述语音识别状态的第二状态之间发送状态改变,则对所述状态改变的情况进行提示。

例如:智能设备处于语音识别状态时开启指示灯指示。退出语音识别状态指示灯熄灭。状态发生改变语音设备发出蜂鸣提示音。

由此,通过对语音识别状态的在线状态或离线状态进行指示、以及对语音识别状态的在线状态与离线状态之间的状态改变进行提示,可以方便用户得知待控设备的当前状态,直观性强,人性化好。

经大量的试验验证,采用本实施例的技术方案,通过在一定场景下省略唤醒词直接进行智能控制,优化用户体验,使交互更友好智能,简化控制流程。

根据本发明的实施例,还提供了对应于语音控制方法的一种语音控制装置。参见图6所示本发明的装置的一实施例的结构示意图。该语音控制装置可以包括:获取单元102和控制单元104。

在一个可选例子中,获取单元102,可以用于获取在待控设备的语音识别状态下其所属环境中的声音信息。所述声音信息,可以包括:语音指令和/或环境噪音。该获取单元102的具体功能及处理参见步骤s110。例如:智能装置被唤醒后,处于语音识别阶段。

在一个可选例子中,控制单元104,可以用于确定所述声音信息中的环境噪音的噪音音量是否超出设定的噪音阈值。该控制单元104的具体功能及处理参见步骤s120。例如:环境噪音的判断:假如采集到的语音能识别出语音控制指令,则滤除语音控制指令的其他波形段输入为环境噪音。假如采集到的语音不能识别出语音控制指令,则该段语音全部视为环境噪音。

在一个可选例子中,所述控制单元104,还可以用于若所述噪音音量未超出所述噪音阈值,则根据所述声音信息中的语音指令控制待控设备保持在所述语音识别状态,以在下次语音控制时无需重新唤醒待控设备而直接在所述语音识别状态下进行语音控制。该控制单元104的具体功能及处理还参见步骤s130。例如:智能装置被唤醒后,如果一直处于安静环境下,误识别低且智能设备可准确识别用户语音控制操作,不会产生误识别,则智能设备保持语音识别状态;下次语音控制无需重新输入语音唤醒词。

可选地,所述控制单元104根据所述声音信息中的语音指令控制待控设备保持在所述语音识别状态,可以包括:

所述控制单元104,具体还可以用于对所述声音信息中的语音指令进行语义解析,以确定所述声音信息中的语音指令是否为设定的用户控制指令。该控制单元104的具体功能及处理还参见步骤s210。

所述控制单元104,具体还可以用于若所述声音信息中的语音指令是所述用户控制指令,则控制待控设备执行所述用户控制指令。该控制单元104的具体功能及处理还参见步骤s220。

或者,所述控制单元104,具体还可以用于若所述声音信息中的语音指令不是所述用户控制指令,则继续获取所述语音识别状态下待控设备所属环境中的声音信息。该控制单元104的具体功能及处理还参见步骤s230。

例如:持续识别模式及持续进行语音采集,用户每次发出控制语音指令不需要先发出语音唤醒指令。直到用户使用语音控制指令退出语音识别状态或智能设备识别到环境噪音超过预设阈值切换到等待退出模式。

由此,通过在环境噪音较小的情况下控制待控设备保持在语音识别状态下,在该语音识别状态下若对语音指令的语义解析成功则直接控制待控设备执行该语音指令,若对语音指令的语义解析不成功则继续获取环境中的声音信息以继续在语音识别状态下进行语音指令的语音解析及控制,大大方便了用户在唤醒待控设备的语音服务后随时发送语音指令控制待控设备,控制效率更好,使用便捷性更佳。

或者,在一个可选例子中,所述控制单元104,还可以用于若所述噪音音量超出所述噪音阈值,则根据所述声音信息中的语音指令和环境噪音控制待控设备退出所述语音识别状态。该控制单元104的具体功能及处理还参见步骤s140。例如:在语音识别阶段,一旦检测环境噪音大则在一定等待时间后退出语音识别状态,如需控制需要再次通过语音唤醒词唤醒智能设备。

例如:为了解决唤醒词控制影响用户体验的问题,通过基于检测周围环境噪音大小,判别语音识别的误识别率大小,智能调整语音识别聆听退出时间,在不影响语音识别准确率的情况下简化用户操作,智能省略用户唤醒词输入。从而,采用本发明的唤醒控制方法,可在一定场景下省略唤醒词直接进行智能控制,优化用户体验,使交互更友好智能。

例如:采集语音,检测环境噪音,如果环境噪音超过设定阈值分贝。则语音识别开启等待退出模式。如果环境噪音低于设定阈值分贝。则语音识别开启持续识别模式。

由此,通过在待控设备处于语音识别状态下时,根据获取的环境中的声音信息中的噪音音量控制待控设备保持在语音识别状态下或退出语音识别状态,可以在噪音音量较低时不按设定的聆听时间退出语音识别状态,方便用户在下次语音控制时直接在该语音识别状态下进行,避免重复唤醒,提升了用户体验,也简化了控制流程。

可选地,所述控制单元104根据所述声音信息中的语音指令和环境噪音控制待控设备退出所述语音识别状态,可以包括:

所述控制单元104,具体还可以用于对所述声音信息中的语音指令进行语义解析,以确定所述声音信息中的语音指令是否为设定的用户控制指令。该控制单元104的具体功能及处理还参见步骤s310。

所述控制单元104,具体还可以用于若所述声音信息中的语音指令是所述用户控制指令,则控制待控设备执行所述用户控制指令,并根据所述语音识别状态下的聆听时间控制待控设备退出所述语音识别状态。该控制单元104的具体功能及处理还参见步骤s320。

或者,所述控制单元104,具体还可以用于若所述声音信息中的语音指令不是所述用户控制指令,则确定待控设备不能识别所述声音信息中的语音指令,即确定所述声音信息为环境噪音,并根据所述语音识别状态下的聆听时间控制待控设备退出所述语音识别状态。该控制单元104的具体功能及处理还参见步骤s330。

例如:等待退出模式及在每特定时间t内没有等待采集到有效语音输入则退出语音识别模式。再次进入语音识别状态需要首先接收到唤醒指令。

由此,通过在环境噪音较大的情况下若对语音指令的语义解析成功则直接控制待控设备执行该语音指令后按设定的聆听时间控制待控设备退出语音识别状态,若对语音指令的语义解析不成功则确定环境中的声音信息全部为环境噪音按按设定的聆听时间控制待控设备退出语音识别状态,以在环境噪音较大的情况下退出语音识别状态节约资源,人性化好。

更可选地,所述控制单元104根据所述语音识别状态下的聆听时间控制待控设备退出所述语音识别状态,可以包括:

所述控制单元104,具体还可以用于确定所述语音识别状态下设定的聆听时间内是否有新的语音指令输入。该控制单元104的具体功能及处理还参见步骤s410。

所述控制单元104,具体还可以用于若在所述聆听时间内有新的语音指令输入,则继续获取所述语音识别状态下待控设备所属环境中的声音信息。该控制单元104的具体功能及处理还参见步骤s420。

或者,所述控制单元104,具体还可以用于若在所述聆听时间内没有新的语音指令输入,则退出所述语音识别状态,以继续获取待控设备所属环境中可以用于唤醒待控设备的语音服务的语音唤醒词。该控制单元104的具体功能及处理还参见步骤s430。

由此,通过在设定的聆听时间内没有新的语音指令输入的情况下退出语音识别状态,以在环境噪音较大的情况下退出当前的语音识别状态而重新唤醒并重新进入新的语音识别状态,有利于提升控制的可靠性,也有利于节约在环境噪音较大的情况下持续进行语音识别而耗费的资源。

在一个可选实施方式中,还可以包括:根据语音唤醒词控制待控设备进入语音识别状态的过程,具体如下:

所述获取单元102,还可以用于在获取在待控设备的语音识别状态下其所属环境中的声音信息之前,获取待控设备所属环境中可以用于唤醒待控设备的语音服务的语音唤醒词。该获取单元102的具体功能及处理还参见步骤s510。

所述控制单元104,还可以用于根据所述语音唤醒词,控制待控设备进入语音识别状态,以启动待控设备的语音服务。该控制单元104的具体功能及处理还参见步骤s520。

例如:智能语音设备接收到语音唤醒词,智能语音设备被唤醒。智能语音设备进入语音识别阶段,接收语音并识别。

由此,通过在接收到待控设备所属环境中的语音唤醒词的情况下,控制待控设备进入语音识别状态,以启动待控设备的语音服务,使得语音服务的使用便捷、且安全。

在一个可选实施方式中,还可以包括以下至少一种控制方式。

第一种控制方式:所述控制单元104,还可以用于对待控设备处于所述语音识别状态的第一状态、和/或待控设备退出所述语音识别状态的第二状态进行指示。例如:若待控设备处于所述语音识别状态下,则对待控设备处于所述语音识别状态的第一状态进行指示灯开启指示或显示。若待控设备退出所述语音识别状态,则对待控设备退出所述语音识别状态的第二状态进行指示灯熄灭至少或显示。

第二种控制方式:所述控制单元104,还可以用于若待控设备在处于所述语音识别状态的第一状态、以及退出所述语音识别状态的第二状态之间发送状态改变,则对所述状态改变的情况进行提示。

例如:智能设备处于语音识别状态时开启指示灯指示。退出语音识别状态指示灯熄灭。状态发生改变语音设备发出蜂鸣提示音。

由此,通过对语音识别状态的在线状态或离线状态进行指示、以及对语音识别状态的在线状态与离线状态之间的状态改变进行提示,可以方便用户得知待控设备的当前状态,直观性强,人性化好。

由于本实施例的装置所实现的处理及功能基本相应于前述图1至图5所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。

经大量的试验验证,采用本发明的技术方案,通过在不影响语音识别准确率的情况下简化用户操作,智能省略用户唤醒词输入,提高用户体验和交互的人性化程度。

根据本发明的实施例,还提供了对应于语音控制装置的一种空调。该空调可以包括:以上所述的语音控制装置。

在一个可选实施方式中,为了解决唤醒词控制影响用户体验的问题,本发明的方案,提供了一种语音空调语音识别状态控制方法。

在一个可选例子中,本发明的方案,通过基于检测周围环境噪音大小,判别语音识别的误识别率大小,智能调整语音识别聆听退出时间,在不影响语音识别准确率的情况下简化用户操作,智能省略用户唤醒词输入。从而,采用本发明的唤醒控制方法,可在一定场景下省略唤醒词直接进行智能控制,优化用户体验,使交互更友好智能。

在一个可选具体例子中,可以参见图7所示的例子,对本发明的方案的具体实现过程进行示例性说明。

嘈杂环境下如果保持智能设备处于语音识别环境下,容易引发误识别和误触发,但安静环境下语音误触发概率低。基于此种现象,智能装置被唤醒后,处于语音识别阶段。一旦检测环境噪音大则在一定等待时间后退出语音识别状态,如需控制需要再次通过语音唤醒词唤醒智能设备。智能装置被唤醒后,如果一直处于安静环境下,误识别低且智能设备可准确识别用户语音控制操作,不会产生误识别,则智能设备保持语音识别状态;下次语音控制无需重新输入语音唤醒词。

在一个可选具体例子中,参见图7所示的例子,本发明的语音空调语音识别状态控制方法,可以包括:

步骤1、智能语音设备接收到语音唤醒词,智能语音设备被唤醒。

步骤2、智能语音设备进入语音识别阶段,接收语音并识别。

例如:远场识别(远距离语音控制)中,为避免误唤醒,是需要先唤醒,再说控制指令的;如“天猫精灵”、“播放音乐”等。设备被唤醒后,有一段聆听时间,现有的策略为持续一段时间无语音输入,则认为退出语音识别模式。但在安静环境下也是同样的聆听时间,这样不合理。所以,本发明的方案,是根据环境噪音情况,自适应(智能调整)调整聆听时间,在安静环境下延长聆听时间,避免用户经常输入唤醒词带来的不耐烦。

例如:在接收语音的过程中,同时检测环境噪音分贝(没有说话声的时候),如果环境噪音大,按原时长结束聆听时间。如果环境噪音小,延长聆听时间,继续识别,直到环境噪音达到阈值。如:我们设置25分贝为本发明的噪声阈值,人说话声一般是大于40分贝的;我们认为25-40分贝大概就是阈值以上。10-25分贝为安静环境。

步骤3、采集语音,检测环境噪音,如果环境噪音超过设定阈值分贝。则语音识别开启等待退出模式。如果环境噪音低于设定阈值分贝。则语音识别开启持续识别模式。

例如:采集环境噪音随时都可以,无需判断是否在采集语音(人声)前后。因为远场识别情况下,设备一直都是在采集声音的。

例如:采集语音:远场识别下,实时采集语音,基于短时能量与过零率的端点检测语音识别技术,计算声音能量陡增陡降为说话语音。

例如:检测环境噪音:远场识别下,实时采集语音,基于短时能量与过零率的端点检测语音识别技术,计算声音能量连续时间内均在某一环境噪音能量范围内视为环境噪音。

步骤4、等待退出模式及在每特定时间t内没有等待采集到有效语音输入则退出语音识别模式。再次进入语音识别状态需要首先接收到唤醒指令。

步骤5、持续识别模式及持续进行语音采集,用户每次发出控制语音指令不需要先发出语音唤醒指令。直到用户使用语音控制指令退出语音识别状态或智能设备识别到环境噪音超过预设阈值切换到等待退出模式。

步骤6、环境噪音的判断:假如采集到的语音能识别出语音控制指令,则滤除语音控制指令的其他波形段输入为环境噪音。假如采集到的语音不能识别出语音控制指令,则该段语音全部视为环境噪音。

步骤7、智能设备处于语音识别状态时开启指示灯指示。退出语音识别状态指示灯熄灭。状态发生改变语音设备发出蜂鸣提示音。

由于本实施例的空调所实现的处理及功能基本相应于前述图6所示的装置的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。

经大量的试验验证,采用本发明的技术方案,通过根据环境噪音情况,自适应调整聆听时间,在安静环境下延长聆听时间,避免用户经常输入唤醒词带来的不耐烦,可以优化用户体验,简化控制流程。

根据本发明的实施例,还提供了对应于语音控制方法的一种存储介质。该存储介质,可以包括:所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行以上所述的语音控制方法。

由于本实施例的存储介质所实现的处理及功能基本相应于前述图1至图5所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。

经大量的试验验证,采用本发明的技术方案,通过基于检测周围环境噪音大小,判别语音识别的误识别率大小,智能调整语音识别聆听退出时间,在不影响语音识别准确率的情况下简化用户操作,智能省略用户唤醒词输入,提高用户体验。

根据本发明的实施例,还提供了对应于语音控制方法的一种空调。该空调,可以包括:处理器,用于执行多条指令;存储器,用于存储多条指令;其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行以上所述的语音控制方法。

由于本实施例的空调所实现的处理及功能基本相应于前述图1至图5所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。

经大量的试验验证,采用本发明的技术方案,通过在智能装置被唤醒后,如果一直处于安静环境下,误识别低且智能设备可准确识别用户语音控制操作,不会产生误识别,则智能设备保持语音识别状态,下次语音控制无需重新输入语音唤醒词,可以提高用户体验。

综上,本领域技术人员容易理解的是,在不冲突的前提下,上述各有利方式可以自由地组合、叠加。

以上所述仅为本发明的实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1