一种语音控制方法、装置、存储介质及空调与流程

文档序号:17593345发布日期:2019-05-03 22:07阅读:216来源:国知局
一种语音控制方法、装置、存储介质及空调与流程

本发明属于语音控制技术领域,具体涉及一种语音控制方法、装置、存储介质及空调,尤其涉及基于改进语音识别控制方式的人机交互技术的实现方法、装置、存储介质及空调。



背景技术:

语音表达是人类可以自然表达的最直接的一种方式,因此语音输入技术被认为是人机交互发展的主要方向,目前越来越多的设备采用语音识别系统进行语音控制以及语音交互,比如空调加入语音控制模块。但是目前存在一个问题就是我们对带有语音设备的空调进行交互时,会出现语音输入效果差、识别率低下甚至不能工作的问题,产生问题的原因在于当我们输入一句语音命令时,由于口音导致识别不清楚等,从而影响了其分析判断。



技术实现要素:

本发明的目的在于,针对上述缺陷,提供一种语音控制方法、装置、存储介质及空调,以解决现有技术中对带有语音设备的空调进行交互时由于口音导致语音识别准确性差的问题,达到提升语音识别准确性的效果。

本发明提供一种语音控制方法,包括:获取语音控制命令;根据设定的词槽中的语义关键词确定所述语音控制命令的控制关键词;根据所述控制关键词执行所述语音控制命令。

可选地,获取语音控制命令,包括:获取语音采集模块采集到的语音控制命令;其中,所述语音采集模块,设置在待提醒设备侧、待提醒设备所属环境中、客户端中任一设置侧;和/或,所述语音采集模块,包括:麦克风。

可选地,根据设定的词槽中的语义关键词确定所述语音控制命令的控制关键词,包括:对所述语音控制命令进行文字识别,得到文字控制命令;将所述文字控制命令与设定的词槽中的语义关键词进行对比,将所述词槽中与所述文字控制命令的读音和含义相同、或读音和含义的相近程度达到设定程度的语义关键词确定为所需的控制关键词。

可选地,其中,所述词槽中的语义关键词,包括:待控设备的所有语义控制命令的同音关键词;和/或,根据设定的词槽中的语义关键词确定所述语音控制命令的控制关键词的操作,由待控设备执行、或由待控设备上传至云服务器由云服务器执行后再由待控设备接收。

可选地,还包括:接收待控设备的所有语音控制命令的同音关键词并存储到设定的词槽中。

与上述方法相匹配,本发明另一方面提供一种语音控制装置,包括:获取单元,用于获取语音控制命令;控制单元,用于根据设定的词槽中的语义关键词确定所述语音控制命令的控制关键词;所述控制单元,还用于根据所述控制关键词执行所述语音控制命令。

可选地,所述获取单元获取语音控制命令,包括:获取语音采集模块采集到的语音控制命令;其中,所述语音采集模块,设置在待提醒设备侧、待提醒设备所属环境中、客户端中任一设置侧;和/或,所述语音采集模块,包括:麦克风。

可选地,所述控制单元根据设定的词槽中的语义关键词确定所述语音控制命令的控制关键词,包括:对所述语音控制命令进行文字识别,得到文字控制命令;将所述文字控制命令与设定的词槽中的语义关键词进行对比,将所述词槽中与所述文字控制命令的读音和含义相同、或读音和含义的相近程度达到设定程度的语义关键词确定为所需的控制关键词。

可选地,其中,所述词槽中的语义关键词,包括:待控设备的所有语义控制命令的同音关键词;和/或,所述控制单元根据设定的词槽中的语义关键词确定所述语音控制命令的控制关键词的操作,由待控设备执行、或由待控设备上传至云服务器由云服务器执行后再由待控设备接收。

可选地,还包括:所述获取单元,还用于接收待控设备的所有语音控制命令的同音关键词并存储到设定的词槽中。

与上述装置相匹配,本发明再一方面提供一种空调,包括:以上所述的语音控制装置。

与上述方法相匹配,本发明再一方面提供一种存储介质,包括:所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行以上所述的语音控制方法。

与上述方法相匹配,本发明再一方面提供一种空调,包括:处理器,用于执行多条指令;存储器,用于存储多条指令;其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行以上所述的语音控制方法。

本发明的方案,通过添加同音关键词,可以提高语音控制识别率,提高识别的准确性。

进一步,本发明的方案,通过添加同音关键词,可以有效地提高产品的语音控制识别率,提高使用便捷性。

进一步,本发明的方案,通过添加同音关键词,给用户带来更好的人机交互体验。

进一步,本发明的方案,通过添加同音关键词,可以提高语音识别的准确性。

进一步,本发明的方案,通过添加同音关键词,可以提高人机交互的便捷性和高效性。

由此,本发明的方案,通过添加同音关键词来进行人机的交互,解决现有技术中对带有语音设备的空调进行交互时由于口音导致语音识别准确性差的问题,从而,克服现有技术中语音识别准确性差、使用不方便和用户体验差的缺陷,实现语音识别准确性好、使用方便和用户体验好的有益效果。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

图1为本发明的语音控制方法的一实施例的流程示意图;

图2为本发明的方法中根据设定的词槽中的语义关键词确定所述语音控制命令的控制关键词的一实施例的流程示意图;

图3为本发明的语音控制装置的一实施例的结构示意图;

图4为本发明的空调的一实施例的语音识别流程示意图。

结合附图,本发明实施例中附图标记如下:

102-获取单元;104-控制单元。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

根据本发明的实施例,提供了一种语音控制方法,如图1所示本发明的方法的一实施例的流程示意图。该语音控制方法可以包括:步骤s110至步骤s130。

在步骤s110处,获取语音控制命令。

可选地,步骤s110中获取语音控制命令,可以包括:获取语音采集模块采集到的语音控制命令。

其中,所述语音采集模块,设置在待提醒设备侧、待提醒设备所属环境中、客户端中任一设置侧;和/或,所述语音采集模块,可以包括:麦克风。

由此,通过多种形式的语音控制命令的发送方式,有利于提升用户使用语音控制命令控制待控设备的便捷性和灵活性。

在步骤s120处,根据设定的词槽中的语义关键词确定所述语音控制命令的控制关键词。

其中,所述词槽中的语义关键词,可以包括:待控设备的所有语义控制命令的同音关键词。

例如:词槽里包含有每个字的拼音,以及大量的同音不同字词组拼音,包含常用单词/词组的读音,例如文字拼音库、词组拼音库等、通过把数据保存为一个个键值对。

由此,通过将语义控制命令的同音关键词集中设置在词槽中,便于确定语音控制命令,且精准性好、可靠性。

可选地,步骤s120中根据设定的词槽中的语义关键词确定所述语音控制命令的控制关键词的操作,由待控设备执行、或由待控设备上传至云服务器由云服务器执行后再由待控设备接收。

由此,通过多种方式确定语音控制命令对应的控制关键词,可以满足不同用户的不同需求,使用的便捷性和灵活性更好。

可选地,可以结合图2所示本发明的方法中根据设定的词槽中的语义关键词确定所述语音控制命令的控制关键词的一实施例流程示意图,进一步说明步骤s120中根据设定的词槽中的语义关键词确定所述语音控制命令的控制关键词的具体过程,可以包括:步骤s210和步骤s220。

步骤s210,对所述语音控制命令进行文字识别,得到文字控制命令。

步骤s220,将所述文字控制命令与设定的词槽中的语义关键词进行对比,将所述词槽中与所述文字控制命令的读音和含义相同、或读音和含义的相近程度达到设定程度的语义关键词确定为所需的控制关键词。

例如:当用户对空调发出语音控制命令时,语音识别模块收集到语音信号并传入到云服务平台,云服务平台的语音识别系统,对收集到的语音信号进行一系列的运算处理,把识别的文字,然后和词槽里的关键词进行一一对比。

例如:通过一系列算法把识别的文字转化为拼音,并人为地把所有的表示的同音字添加到词槽里,通过这种方式可以提高文字语音识别效率,从而可以有效地提高产品的语音控制识别率,解决语音输入效果差、识别率低下甚至不能工作的问题,给用户带来更好的人机交互体验。

由此,通过对语音控制命令进行文字识别后,与词槽中的语义关键词进行对比得到与语音控制命令对应的控制关键词,使得对控制关键词的确定更加精准且更加高效。

在步骤s130处,根据所述控制关键词执行所述语音控制命令。

例如:利用语音+各种检测手段,提高语音控制识别率;可以利用通过改进语音识别控制方式添加同音关键词,提高语音控制识别率。如:主要通过改进语音识别控制方式,添加同音关键词来进行人机的交互。

例如:利用通过改进语音识别控制方式添加同音关键词到云服务器语音识别系统,提高语音控制识别率;可以有效地提高产品的语音控制识别率,解决语音输入效果差、识别率低下甚至不能工作的问题,从而给用户带来更好的人机交互体验。

由此,通过根据词槽中的语义关键词确定语音控制命令的控制关键词,进而根据该控制关键词执行该语音控制命令,使得对语音控制命令的识别准确性高,且识别效率高、用户体验好。

在一个可选实施方式中,还可以包括:在根据设定的词槽中的语义关键词确定所述语音控制命令的控制关键词之前,接收待控设备的所有语音控制命令的同音关键词并存储到设定的词槽中。

例如:把所有相关控制命令的同音字以及相近词组,添加到云服务平台语音识别系统的词槽里。

由此,通过预先将待控设备的所有语音控制命令的同音关键词存储在词槽中,便于根据不同用户发送的语音控制命令确定控制关键词,且控制的便捷性好、精准性好。

经大量的试验验证,采用本实施例的技术方案,通过添加同音关键词,可以提高语音控制识别率,提高识别的准确性。

根据本发明的实施例,还提供了对应于语音控制方法的一种语音控制装置。参见图3所示本发明的装置的一实施例的结构示意图。该语音控制装置可以包括:获取单元102和控制单元104。

在一个可选例子中,获取单元102,可以用于获取语音控制命令。该获取单元102的具体功能及处理参见步骤s110。

可选地,所述获取单元102获取语音控制命令,可以包括:所述获取单元102,具体还可以用于获取语音采集模块采集到的语音控制命令。

其中,所述语音采集模块,设置在待提醒设备侧、待提醒设备所属环境中、客户端中任一设置侧;和/或,所述语音采集模块,可以包括:麦克风。

由此,通过多种形式的语音控制命令的发送方式,有利于提升用户使用语音控制命令控制待控设备的便捷性和灵活性。

在一个可选例子中,控制单元104,可以用于根据设定的词槽中的语义关键词确定所述语音控制命令的控制关键词。该控制单元104的具体功能及处理参见步骤s120。

其中,所述词槽中的语义关键词,可以包括:待控设备的所有语义控制命令的同音关键词。

例如:词槽里包含有每个字的拼音,以及大量的同音不同字词组拼音,包含常用单词/词组的读音,例如文字拼音库、词组拼音库等、通过把数据保存为一个个键值对。

由此,通过将语义控制命令的同音关键词集中设置在词槽中,便于确定语音控制命令,且精准性好、可靠性。

可选地,所述控制单元104根据设定的词槽中的语义关键词确定所述语音控制命令的控制关键词的操作,由待控设备执行、或由待控设备上传至云服务器由云服务器执行后再由待控设备接收。

由此,通过多种方式确定语音控制命令对应的控制关键词,可以满足不同用户的不同需求,使用的便捷性和灵活性更好。

可选地,所述控制单元104根据设定的词槽中的语义关键词确定所述语音控制命令的控制关键词,可以包括:

所述控制单元104,具体还可以用于对所述语音控制命令进行文字识别,得到文字控制命令。

所述控制单元104,具体还可以用于将所述文字控制命令与设定的词槽中的语义关键词进行对比,将所述词槽中与所述文字控制命令的读音和含义相同、或读音和含义的相近程度达到设定程度的语义关键词确定为所需的控制关键词。

例如:当用户对空调发出语音控制命令时,语音识别模块收集到语音信号并传入到云服务平台,云服务平台的语音识别系统,对收集到的语音信号进行一系列的运算处理,把识别的文字,然后和词槽里的关键词进行一一对比。

例如:通过一系列算法把识别的文字转化为拼音,并人为地把所有的表示的同音字添加到词槽里,通过这种方式可以提高文字语音识别效率,从而可以有效地提高产品的语音控制识别率,解决语音输入效果差、识别率低下甚至不能工作的问题,给用户带来更好的人机交互体验。

由此,通过对语音控制命令进行文字识别后,与词槽中的语义关键词进行对比得到与语音控制命令对应的控制关键词,使得对控制关键词的确定更加精准且更加高效。

在一个可选例子中,所述控制单元104,还可以用于根据所述控制关键词执行所述语音控制命令。该控制单元104的具体功能及处理还参见步骤s130。

例如:利用语音+各种检测手段,提高语音控制识别率;可以利用通过改进语音识别控制方式添加同音关键词,提高语音控制识别率。如:主要通过改进语音识别控制方式,添加同音关键词来进行人机的交互。

例如:利用通过改进语音识别控制方式添加同音关键词到云服务器语音识别系统,提高语音控制识别率;可以有效地提高产品的语音控制识别率,解决语音输入效果差、识别率低下甚至不能工作的问题,从而给用户带来更好的人机交互体验。

由此,通过根据词槽中的语义关键词确定语音控制命令的控制关键词,进而根据该控制关键词执行该语音控制命令,使得对语音控制命令的识别准确性高,且识别效率高、用户体验好。

在一个可选实施方式中,还可以包括:所述获取单元102,还可以用于在根据设定的词槽中的语义关键词确定所述语音控制命令的控制关键词之前,接收待控设备的所有语音控制命令的同音关键词并存储到设定的词槽中。

例如:把所有相关控制命令的同音字以及相近词组,添加到云服务平台语音识别系统的词槽里。

由此,通过预先将待控设备的所有语音控制命令的同音关键词存储在词槽中,便于根据不同用户发送的语音控制命令确定控制关键词,且控制的便捷性好、精准性好。

由于本实施例的装置所实现的处理及功能基本相应于前述图1至图2所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。

经大量的试验验证,采用本发明的技术方案,通过添加同音关键词,可以有效地提高产品的语音控制识别率,提高使用便捷性。

根据本发明的实施例,还提供了对应于语音控制装置的一种空调。该空调可以包括:以上所述的语音控制装置。

在一个可选实施方式中,本发明的方案,利用语音+各种检测手段,提高语音控制识别率。

在一个可选例子中,本发明的方案,可以利用通过改进语音识别控制方式添加同音关键词,提高语音控制识别率。

可选地,本发明的方案,利用通过改进语音识别控制方式添加同音关键词到云服务器语音识别系统,提高语音控制识别率。

可见,本发明的方案,可以有效地提高产品的语音控制识别率,解决语音输入效果差、识别率低下甚至不能工作的问题,从而给用户带来更好的人机交互体验。

在一个可选具体实施方式中,可以参见图4所示的例子,对本发明的方案的具体实现过程进行示例性说明。

在一个可选具体例子中,本发明的方案,在技术实现上主要通过改进语音识别控制方式,添加同音关键词来进行人机的交互。

具体地,本发明的方案的实现原理可以包括:

步骤1、为了解决语音输入控制时遇到同音不同字的情况太多,我们手动把所有相关控制命令的同音字以及相近词组,添加到云服务平台语音识别系统的词槽里。

步骤2、当用户对空调发出语音控制命令时,语音识别模块收集到语音信号并传入到云服务平台,云服务平台的语音识别系统,对收集到的语音信号进行一系列的运算处理,把识别的文字,然后和词槽里的关键词进行一一对比。

例如:这里所说的一系列运算处理,可以包括:是语音处理系统把用户的声音转化成文本的处理,而我主要做的不是如何把声音转化成文本,而是把文本更好的和词槽里面匹配,就是语音系统的转化成的文字,然后和词槽里的关键词进行一一对比,详细举例可以参见以下说明。

其中,词槽里包含有每个字的拼音,以及大量的同音不同字词组拼音,包含常用单词/词组的读音,例如文字拼音库、词组拼音库等、通过把数据保存为一个个键值对,例如词组拼音字典里面:

最高峰=zui,gao,feng

最高风=zui,gao,feng

最高飞=zui,gao,fei

等等。

对有些字是多音字我们保存其最常用的读音,不常用的读音多出现在单词/词组里。但是纯粹的基于词库的方法实际中也会遇到问题,更好的方法先利用分词工具进行分词得到,然后在基于词库对每个结果分别处理。如果预定义的字典不能满足我们的需求可以手动添加字典,并采用判决的方法得出识别结果,这样就大大提高了文字语音的识别的成功率。

举例比如说我们词库中含有四字词组,所以“播放天气预报”从4个字开始匹配;

(1)判断播放天气是否在词库中,不在

(2)判断播放天是否在词库中,不在

(3)判断播放是否在词库中,在,得到bofang

(4)判断天气预报是否在词库中,在,得到tianqiyubao

但是纯粹的基于词库的方法实际中也会遇到问题,例如提出了解决方案这句话中了解会被当作一个单词,所以会得到错误结果:

tichuliaojiefangan

更好的方案是先利用分词工具,进行分词得到:

1、提出

2、了

3、解决

4、方案

然后再基于词库对每个结果分别处理,就能得到:tichulejiejuefangan。

可见,为了提高语音识别率,尤其遇到现实生活中我们说话方式或者说话口音等问题,会遇到同音不同字的情况太多,比如说用户控制空调说“最高峰”、“最高风”等,但我们只需要同音即可,通过一系列算法把识别的文字转化为拼音,并人为地把所有的表示的同音字添加到词槽里,通过这种方式可以提高文字语音识别效率,从而可以有效地提高产品的语音控制识别率,解决语音输入效果差、识别率低下甚至不能工作的问题,给用户带来更好的人机交互体验。

由于本实施例的空调所实现的处理及功能基本相应于前述图3所示的装置的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。

经大量的试验验证,采用本发明的技术方案,通过添加同音关键词,给用户带来更好的人机交互体验。

根据本发明的实施例,还提供了对应于语音控制方法的一种存储介质。该存储介质,可以包括:所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行以上所述的语音控制方法。

由于本实施例的存储介质所实现的处理及功能基本相应于前述图1至图2所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。

经大量的试验验证,采用本发明的技术方案,通过添加同音关键词,可以提高语音识别的准确性。

根据本发明的实施例,还提供了对应于语音控制方法的一种空调。该空调,可以包括:处理器,用于执行多条指令;存储器,用于存储多条指令;其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行以上所述的语音控制方法。

由于本实施例的空调所实现的处理及功能基本相应于前述图1至图2所示的方法的实施例、原理和实例,故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明,在此不做赘述。

经大量的试验验证,采用本发明的技术方案,通过添加同音关键词,可以提高人机交互的便捷性和高效性。

综上,本领域技术人员容易理解的是,在不冲突的前提下,上述各有利方式可以自由地组合、叠加。

以上所述仅为本发明的实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1