电器控制方法及装置与流程

文档序号:14992388发布日期:2018-07-20 22:34阅读:150来源:国知局

本发明涉及电气控制领域,具体而言,涉及一种电器控制方法及装置。



背景技术:

伴随智能家居的逐步推广,家用电器中的图像识别控制及语音识别控制越来越普遍,相关技术也越来越成熟。但相关技术中,语音识别在智能家电的控制中仍存在一定弊端,例如,任意声源只要播报语音指令,皆可唤醒和控制家电,故语音控制的安全性较低;又如多个声源混合发声时,允许家电对多个声源同时进行语音识别,从而增大了底层芯片的计算量和识别难度,进而语音控制的误识别率也较高。

针对上述的问题,目前尚未提出有效的解决方案。



技术实现要素:

本发明实施例提供了一种电器控制方法及装置,以至少解决相关技术中电器语音控制可靠性不足的技术问题。

根据本发明实施例的一个方面,提供了一种电器控制方法,包括:根据采集的语音的声纹,确定所述语音为允许进行指令识别的语音;根据指令识别模型,识别出所述语音对应的控制指令,其中,所述指令识别模型为使用多组数据通过机器学习训练得到,所述多组数据中的每组数据均包括:语音和与该语音对应的控制指令;根据识别出的所述控制指令对所述电器进行控制。

可选的,在根据所述指令识别模型,识别出所述语音对应的所述控制指令之前,还包括:采集预定数量的不同年龄,不同性别的采样语音,以及与所述采样语音对应的采样控制指令;对所述采样语音和所述采样控制指令进行训练,得到所述指令识别模型。

可选的,在根据采集的所述语音的所述声纹,确定所述语音为允许进行指令识别的所述语音之前,还包括:通过以下方式至少之一,接收到请求注册为允许进行指令识别的语音的语音:通过所述电器的拾音装置接收语音的方式,通过预定终端的应用录入语音的方式;提取接收到的语音的声纹,并将提取的声纹进行存储,作为允许进行指令识别的语音对应的注册声纹。

可选的,将提取的所述声纹进行存储包括以下至少之一:将提取的声纹存储在所述电器本地;将提取的声纹通过无线传输方式传输至远程服务器。

可选的,根据采集的语音的声纹,确定所述语音为允许进行指令识别的所述语音包括:判断采集的所述语音的声纹是否能够与所述注册声纹匹配;在判断结果为是的情况下,确定采集的所述语音为允许进行指令识别的所述语音。

可选的,根据识别出的所述控制指令对所述电器进行控制包括:在识别出的所述控制指令为多个的情况下,获取多个控制指令的权限等级,并确定权限等级最高的控制指令;根据权限等级最高的控制指令对所述电器进行控制。

根据本发明实施例的另一方面,还提供了一种电器控制装置,包括:确定模块,用于根据采集的语音的声纹,确定所述语音为允许进行指令识别的语音;识别模块,用于根据指令识别模型,识别出所述语音对应的控制指令,其中,所述指令识别模型为使用多组数据通过机器学习训练得到,所述多组数据中的每组数据均包括:语音和与该语音对应的控制指令;控制模块,用于根据识别出的所述控制指令对所述电器进行控制。

可选的,所述的装置还包括:采集模块,用于在根据所述指令识别模型,识别出所述语音对应的所述控制指令之前,采集预定数量的不同年龄,不同性别的采样语音,以及与所述采样语音对应的采样控制指令;训练模块,用于对所述采样语音和所述采样控制指令进行训练,得到所述指令识别模型。

可选的,所述的装置还包括:接收模块,用于在根据采集的所述语音的所述声纹,确定所述语音为允许进行指令识别的所述语音之前,通过以下方式至少之一,接收到请求注册为允许进行指令识别的语音的语音:通过所述电器的拾音装置接收语音的方式,通过预定终端的应用录入语音的方式;提取模块,用于提取接收到的语音的声纹;存储模块,用于并将提取的声纹进行存储,作为允许进行指令识别的语音对应的注册声纹。

可选的,所述存储模块,还用于通过以下方式至少之一,将提取的所述声纹进行存储:将提取的声纹存储在所述电器本地;将提取的声纹通过无线传输方式传输至远程服务器。

可选的,所述确定模块包括:判断单元,用于判断采集的所述语音的声纹是否能够与所述注册声纹匹配;确定单元,用于在判断结果为是的情况下,确定采集的所述语音为允许进行指令识别的所述语音。

可选的,控制模块包括:获取单元,用于在识别出的所述控制指令为多个的情况下,获取多个控制指令的权限等级,并确定权限等级最高的控制指令;控制单元,用于根据权限等级最高的控制指令对所述电器进行控制。

在本发明实施例中,采用人工智能的方式,通过机器学习训练得到指令识别模型,进而根据指令识别模型,将根据采集的语音的声纹确定出的允许进行指令识别的语音,识别出该语音对应的控制指令,进而达到了根据识别出的控制指令对电器进行控制的目的,其中,指令识别模型为使用多组数据通过机器学习训练得到,多组数据中的每组数据均包括:语音和与该语音对应的控制指令。本发明实施例实现了提高电器语音控制安全性和识别率的技术效果,进而解决了相关技术中电器语音控制可靠性不足的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是根据本发明实施例的电器控制方法的流程图;

图2是根据本发明优选实施方案的声纹本地建模注册方法的流程图;

图3是根据本发明优选实施方案的声纹在线建模注册方法的流程图;

图4是根据本发明优选实施方案的单个声源识别方法的流程图;

图5是根据本发明优选实施方案的多个声源识别方法的流程图;

图6是根据本发明实施例的一种电器控制装置的结构示意图;

图7是根据本发明实施例的一种电器控制装置的优选结构示意图一;

图8是根据本发明实施例的一种电器控制装置的优选结构示意图二;

图9是根据本发明实施例的一种电器控制装置的确定模块62的结构示意图;

图10是根据本发明实施例的一种电器控制装置的控制模块66的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本发明实施例,提供了一种电器控制的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

图1是根据本发明实施例的电器控制方法的流程图,如图1所示,该方法包括如下步骤:

步骤s102,根据采集的语音的声纹,确定语音为允许进行指令识别的语音;

步骤s104,根据指令识别模型,识别出语音对应的控制指令,其中,指令识别模型为使用多组数据通过机器学习训练得到,多组数据中的每组数据均包括:语音和与该语音对应的控制指令;

步骤s106,根据识别出的控制指令对电器进行控制。

根据上述步骤,采用人工智能的方式,通过机器学习训练得到指令识别模型,进而在根据采集的语音的声纹确定出的允许进行指令识别的语音之后,根据指令识别模型,识别出该语音对应的控制指令,进而达到了根据识别出的控制指令对电器进行控制的目的,其中,指令识别模型为使用多组数据通过机器学习训练得到,多组数据中的每组数据均包括:语音和与该语音对应的控制指令。通过上述处理,对智能家电做语音控制权限处理,实现了提高电器语音控制安全性;在语音识别前对用户声源进行区分、筛选和过滤,实现了提高识别率的技术效果,进而解决了相关技术中电器语音控制可靠性不足的技术问题。

其中,需要说明的是,上述电器控制方法中采用了声纹识别的方式,该声纹识别不同于语音识别,语音识别是让机器通过识别和解析把语音信号转变为相应命令的相关技术,而声纹识别是把声信号转换成电信号,再用计算机进行识别的相关技术。声纹识别中有两个关键问题,一是特征提取,二是模式匹配(也可称模式识别)。其中,特征提取的任务是提取并选择对说话人的声纹具有可分性强、稳定性高等特性的声学或语言特征。较好的特征,应该能够有效地区分不同的说话人,但又能在同一说话人语音发生变化时保持相对的稳定;不易被他人模仿进而能够较好地解决被他人模仿问题;还具有较好的抗噪性能。

针对语音识别中存在的用户类型范围广,由于口音、性别、年龄易发生误操作的问题,优选的,在根据指令识别模型,识别出语音对应的控制指令之前,还可以包括:采集预定数量的不同年龄,不同性别的采样语音,以及与采样语音对应的采样控制指令;对采样语音和采样控制指令进行训练,得到指令识别模型。通过上述方法,可以对不同年龄段,不同性别,不同音色的语音均进行采样训练,使得训练出的指令识别模型更为全面,从而有效提高采用该指令识别模型识别出的识别结果,使其更为准确。

需要说明的是,上述每组训练数据可以是通过实验得到的,也可以是大量应用该电器控制方法的电器在使用过程中不断采集积累上报的,通过对已经销售出去的电器进行追踪,从而得到大量的数据均可以用于训练。可选的,在应用该电器控制处理方法的电器中也可以预先设置通讯模块,多个电器可以将实时采集到的数据上传到服务器中,以供机器训练使用。其中,通讯模块可以包括但不限于:无线网卡、蓝牙等。

为多渠道获取用户语音,优选的,在根据采集的语音的声纹,确定语音为允许进行指令识别的语音之前,还可以包括:通过以下方式至少之一,接收到请求注册为允许进行指令识别的语音的语音:通过电器的拾音装置接收语音的方式,通过预定终端的应用录入语音的方式;提取接收到的语音的声纹,并将提取的声纹进行存储,作为允许进行指令识别的语音对应的注册声纹。其中,通过包含拾音装置的电器本身或手机、电脑等预定终端,均可以获取到被允许进行指令识别的用户语音,上述方式极大地扩展了用户语音的获取来源。若选择通过预定终端获取语音,则可以在预定终端对应的应用程序的相关注册入口,进行声音录入,进而提取声纹特征,并发送给远程服务器存储,完成声音的建模和注册;若选择通过电器自带的拾音装置获取语音,则可以通过该电器上的语音识别模块对该语音进行声纹特征提取,并将提取的特征存储在本地存储器上,完成声纹建模注册。可选的,通过该电器上的语音识别模块提取的声纹特征,也可以通过通讯模块上传至远程服务器进行存储,故将提取的声纹进行存储可以包括以下至少之一:将提取的声纹存储在电器本地;将提取的声纹通过无线传输方式传输至远程服务器。通过上述多种声纹的获取存储方式,可以提高提取的声纹的可用率,进而提高该电器控制方法中声纹识别的可靠性。

图2是根据本发明优选实施方案的声纹本地建模注册方法的流程图,如图2所示,该方法包括如下步骤:

(1)用户对语音控制家电发出建模注册指令;

(2)家电的语音模块中的拾音装置接收语音,语音识别模块对该语音进行声纹特征提取,并将提取的特征存储在本地存储器上,完成声纹建模注册。

图3是根据本发明优选实施方案的声纹在线建模注册方法的流程图,如图3所示,该方法包括如下步骤:

(1)用户对语音控制家电发出建模注册指令;

(2)家电的语音模块中的拾音装置接收语音,语音识别模块对该语音进行声纹特征提取,并将该声纹特征传给无线传输模块;

(3)无线传输模块将该声纹特征发送给服务器进行存储,完成声纹建模注册。

为提高语音控制安全性,优选的,根据采集的语音的声纹,确定语音为允许进行指令识别的语音可以包括:判断采集的语音的声纹是否能够与注册声纹匹配;在判断结果为是的情况下,确定采集的语音为允许进行指令识别的语音。通过对采集的语音的声纹进行判断,其是否可以与注册声纹进行匹配,如是,则对该语音进行后续识别。如采集到多个用户发出声音的情况下,通过判断各个语音中的声纹能否与注册的声纹进行匹配,针对能匹配的用户声音,进行下一步识别,针对不能匹配的用户声音,则过滤掉不予识别。进而通过对用于语音的权限设定和识别,使电器仅对有控制权限的语音,即进行声纹注册过的语音进行识别,进而提高了电器语音控制的安全性设置。

图4是根据本发明优选实施方案的单个声源识别方法的流程图,如图4所示,该方法包括如下步骤:

(1)用户对语音控制家电发出语音指令;

(2)家电的语音模块接收指令并提取声纹特征,然后去本地存储器或通过无线传输模块去服务器中查询该声纹信息和该家电是否注册绑定。若是,则继续识别该语音指令,判断语音中是否含有可以控制家电的指令,进而对家电进行相应控制;若否,则不对该语音指令进行识别,其中,该家电也可给出类似客户声音未注册的提示语。

图5是根据本发明优选实施方案的多个声源识别方法的流程图,如图5所示,该方法包括如下步骤:

(1)用户a、b、c分别在语音控制家电附近发声,该声音包括但不限于语音指令、闲聊等;

(2)家电的语音模块接收到语音并提取对应不同声源的声纹特征,然后去本地存储器或服务器查询各个声纹特征和该家电是否注册绑定,若某声纹特征已注册绑定该家电,则继续识别该语音;反之,则过滤掉该语音,不做识别。

而针对匹配有多个用户同时发出控制指令的情况,优选的,根据识别出的控制指令对电器进行控制可以包括:在识别出的控制指令为多个的情况下,获取多个控制指令的权限等级,并确定权限等级最高的控制指令;根据权限等级最高的控制指令对电器进行控制。通过上述优选设计方案,可以实现在有多个用户同时发出控制指令的情况下,通过用户权限设置避免控制混乱的情况发生。

通过本发明实施例的电器控制方法及上述各个优选实施方案,可以实现将用户的声音与电器进行绑定,通过在电器本地存储器或服务器中存储该声纹信息并进行注册,使用户声纹,即声音特征,相当于开启该家电的通行证。进而声纹注册成功后,还可以实现通过声纹提取和配对来决定该声源是否允许继续进行指令识别,若该声源的声纹已注册,则对其发出的声音进行判断是否存在家电的控制指令;若未注册,则不允许进行指令判断,同时还能在多个声源混合发声时,过滤掉未被注册的声源,仅允许已注册的声源进行语音指令识别。进而达到了通过防止陌生人恶意唤醒和操控家电来提高语音控制安全性,和通过在语音识别前利用声纹识别对声源进行筛选和过滤来减少了语音模块底层芯片的计算工作,进而提高了设备性能和语音识别效率的效果。

在本发明实施例中,还提供了一种电器控制装置,图6是根据本发明实施例的一种电器控制装置的结构示意图,如图6所示,该装置包括:确定模块62,识别模块64,控制模块66。下面对该电器控制装置进行说明。

确定模块62,用于根据采集的语音的声纹,确定语音为允许进行指令识别的语音;

识别模块64,连接于上述确定模块62,用于根据指令识别模型,识别出语音对应的控制指令,其中,指令识别模型为使用多组数据通过机器学习训练得到,多组数据中的每组数据均包括:语音和与该语音对应的控制指令;

控制模块66,连接于上述识别模块64,用于根据识别出的控制指令对电器进行控制。

图7是根据本发明实施例的一种电器控制装置的优选结构示意图一,如图7所示,该装置中除含图6中的所有结构外,还包括:采集模块72,训练模块74。下面对该电器控制装置进行说明。

采集模块72,用于在根据指令识别模型,识别出语音对应的控制指令之前,采集预定数量的不同年龄,不同性别的采样语音,以及与采样语音对应的采样控制指令;

训练模块74,连接于上述采集模块72和识别模块64,用于对采样语音和采样控制指令进行训练,得到指令识别模型。

图8是根据本发明实施例的一种电器控制装置的优选结构示意图二,如图8所示,该装置中除含图6中的所有结构外,还包括:接收模块82,提取模块84,存储模块86。下面对该电器控制装置进行说明。

接收模块82,用于在根据采集的语音的声纹,确定语音为允许进行指令识别的语音之前,通过以下方式至少之一,接收到请求注册为允许进行指令识别的语音的语音:通过电器的拾音装置接收语音的方式,通过预定终端的应用录入语音的方式;

提取模块84,连接于上述接收模块82,用于提取接收到的语音的声纹;

存储模块86,连接于上述接收模块82和确定模块62,用于并将提取的声纹进行存储,作为允许进行指令识别的语音对应的注册声纹。

可选的,上述存储模块86,还用于通过以下方式至少之一,将提取的声纹进行存储:将提取的声纹存储在电器本地;将提取的声纹通过无线传输方式传输至远程服务器。

图9是根据本发明实施例的一种电器控制装置的确定模块62的结构示意图,如图9所示,该确定模块62包括:判断单元92,确定单元94。下面对该确定模块62进行说明。

判断单元92,用于判断采集的语音的声纹是否能够与注册声纹匹配;

确定单元94,连接于上述判断单元92,用于在判断结果为是的情况下,确定采集的语音为允许进行指令识别的语音。

图10是根据本发明实施例的一种电器控制装置的控制模块66的结构示意图,如图10所示,该控制模块66包括:获取单元102,控制单元104。下面对该控制模块66进行说明。

获取单元102,用于在识别出的控制指令为多个的情况下,获取多个控制指令的权限等级,并确定权限等级最高的控制指令;

控制单元104,连接于上述获取单元102,用于根据权限等级最高的控制指令对电器进行控制。

根据本发明实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述任意一项的电器控制方法。

根据本发明实施例的另一方面,还提供了一种处理器,该处理器用于运行程序,其中,程序运行时执行上述任意一项的电器控制方法。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1