智能设备控制方法和装置与流程

文档序号:16687724发布日期:2019-01-22 18:29阅读:226来源:国知局
智能设备控制方法和装置与流程

本发明涉及语音控制技术领域,具体涉及一种智能设备控制方法和装置。



背景技术:

随着语音处理技术的不断发展,越来越多的设备具备语音识别的功能,如智能手机、智能安防等各种设备,语音识别对设备的控制也越来越广泛,如同设备的键盘、鼠标控制,将会越来越普遍。现有语音识别技术的应用研究主要集中在如何提高语音控制设备的准确度上。

语音识别技术是根据用户输入的语音识别出语音信号中的内容,并按照识别出的内容对设备进行控制。语音识别技术代替了传统输入模式,已用于如电视机、智能手机等电子装置中。例如,用户可以说出特定短语,例如“打开照相机”来将智能手机上的相机打开。

现有的语音控制方法在带给用户便捷的同时,也存在一些问题,如:现有的对设备的语音控制方法没有充分考虑到设备信息安全的问题,即语音识别中,只追求了对语音内容的识别,只要识别到的语音内容匹配,就能对设备进行控制,使得该设备可以被任何人控制,包括非法用户,从而有可能给设备的机主带来损失,不利于设备的信息安全。



技术实现要素:

有鉴于此,本发明的目的在于克服现有技术的不足,提供一种智能设备控制方法和装置。

为实现以上目的,本发明采用如下技术方案:一种智能设备控制方法,包括:

获取第一密码,所述第一密码为待判断的语音信号;

判断所述待判断的语音信号对所述智能设备是否具有控制权;

当所述待判断的语音信号对所述智能设备具有控制权时,获取所述待判断的语音信号的语音内容;并按照所述语音内容对所述智能设备进行控制;

当所述待判断的语音信号对所述智能设备不具有控制权时,获取待判断的第二密码;

当所述待判断的第二密码是智能设备的正确密码时,采用所述待判断的语音信号对所述智能设备进行控制。

可选的,所述判断所述待判断的语音信号对所述智能设备是否具有控制权,包括:

在所述待判断的语音信号的声纹特征属于预存的第一密码库中的声纹特征时,判断出所述待判断的语音信号对所述智能设备具有控制权,其中,所述第一密码库为语音密码库。

可选的,所述方法还包括:

获取待注册的语音信号;

根据所述待注册的语音信号的声纹特征组成所述语音密码库,并对所述语音密码库进行存储。

可选的,所述方法还包括:

当所述待判断的语音信号对所述智能设备不具有控制权,且所述待判断的第二密码是智能设备的正确密码时,将所述待判断的语音信号的声纹特征添加到预存的第一密码库中。

可选的,所述判断所述待判断的语音信号对所述智能设备是否具有控制权,还包括:

提取所述待判断的语音信号的声纹特征,并与智能设备本地预存的第一密码库中的声纹特征进行比对;或者,

将所述待判断的语音信号发送给服务器,以使服务器提取所述待判断的语音信号的声纹特征,并与服务器预存的第一密码库中的声纹特征进行比对;以及,接收服务器发送的比对结果。

可选的,判断所述待判断的第二密码是智能设备的正确密码,包括:

将所述待判断的第二密码与智能设备本地预存的第二密码库中的密码进行比对;或者,

将所述待判断的第二密码发送给服务器,以使服务器将所述待判断的第二密码与服务器预存的第二密码库中的密码进行比对;以及,接收服务器发送的比对结果。

可选的,所述方法还包括:

获取待注册的图像文本密码;

根据所述待注册的图像文本密码组成所述第二密码库,并将所述第二密码库存储在智能设备本地。

本发明还提供了一种智能设备控制方法,包括:

接收待判断的语音信号;

提取所述待判断的语音信号的声纹特征,并与预存的语音密码库中的声纹特征进行比对,得到比对结果;

将所述比对结果发送出去。

可选的,所述方法还包括:

接收待注册的语音信号;

提取所述待注册的语音信号的声纹特征;

根据所述声纹特征形成语音密码库,并对所述语音密码库进行存储。

可选的,所述方法还包括:

接收待判断的第二密码;

将所述待判断的第二密码与预存的第二密码库中的密码进行比对,得到比对结果;

将所述比对结果发送出去。

可选的,所述方法还包括:

获取待注册的图像文本密码;

根据所述待注册的图像文本密码组成所述第二密码库,并对所述第二密码库进行存储。

本发明还提供了一种智能设备控制装置,包括:

第一获取模块,用于获取第一密码,所述第一密码为待判断的语音信号;

第一判断模块,用于判断所述待判断的语音信号对所述智能设备是否具有控制权;

第二获取模块,用于获取所述待判断的语音信号的语音内容;

第三获取模块,用于获取待判断的第二密码;

第二判断模块,用于判断所述待判断的第二密码是否为智能设备的正确密码;

控制模块,用于当所述待判断的语音信号对所述智能设备具有控制权时,或当所述待判断的第二密码是智能设备的正确密码时,按照所述语音内容对所述智能设备进行控制。

此外,本发明还提供了一种智能设备,包括:如前面任一项所述的控制装置。

本发明采用以上技术方案,所述智能设备控制方法,包括:获取第一密码,所述第一密码为待判断的语音信号;判断所述待判断的语音信号对所述智能设备是否具有控制权;当所述待判断的语音信号对所述智能设备具有控制权时,获取所述待判断的语音信号的语音内容;并按照所述语音内容对所述智能设备进行控制;当所述待判断的语音信号对所述智能设备不具有控制权时,获取待判断的第二密码;当所述待判断的第二密码是智能设备的正确密码时,采用所述待判断的语音信号对所述智能设备进行控制。本发明通过语音信号具有声纹的唯一性特征,来判别发声人对智能设备是否具有控制权,从而实现对智能设备的控制,该控制方法能够避免智能设备被非法用户控制,有利于保证智能设备的信息安全和机主的利益。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明智能设备控制方法实施例一提供的流程示意图;

图2是本发明智能设备控制方法实施例二提供的流程示意图;

图3是本发明智能设备控制方法实施例三提供的流程示意图;

图4是本发明智能设备控制方法实施例四提供的流程示意图;

图5是本发明智能设备控制方法实施例五提供的流程示意图;

图6是本发明智能设备控制方法实施例六提供的流程示意图;

图7是本发明智能设备控制装置实施例一的结构示意图。

图中:1、第一获取模块;2、第一判断模块;3、第二获取模块;4、第三获取模块;5、第二判断模块;6、控制模块。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。

图1是本发明实施例一提供的智能设备控制方法的流程示意图。

如图1所示,本实施例的方法包括:

s11:获取第一密码,所述第一密码为待判断的语音信号;

s12:判断所述待判断的语音信号对所述智能设备是否具有控制权;

进一步的,所述判断所述待判断的语音信号对所述智能设备是否具有控制权,包括:

在所述待判断的语音信号的声纹特征属于预存的第一密码库中的声纹特征时,判断出所述待判断的语音信号对所述智能设备具有控制权,其中,所述第一密码库为语音密码库。

所述控制权是指能够控制智能设备进行操作的权利。

进一步的,所述预存的语音密码库可以是通过注册的语音信号提取获取的,也可以是一个已有的语音密码库。当语音密码库是通过注册的语音信号获取时,具体的处理过程包括:

获取待注册的语音信号;

根据所述待注册的语音信号的声纹特征组成所述语音密码库,并对所述语音密码库进行存储。

进一步的,所述判断所述待判断的语音信号对所述智能设备是否具有控制权,还包括:

提取所述待判断的语音信号的声纹特征,并与智能设备本地预存的语音密码库中的声纹特征进行比对;或者,

将所述待判断的语音信号发送给服务器,以使服务器提取所述待判断的语音信号的声纹特征,并与服务器预存的语音密码库中的声纹特征进行比对;以及,接收服务器发送的比对结果。

也就是说,提取所述待判断的语音信号的声纹特征,并对该声纹特征进行比对的过程可以在智能设备本地执行,也可以在远程服务器端执行。当在智能设备本地执行时,由智能设备本地的判断处理模块提取所述待判断的语音信号的声纹特征,并将该声纹特征与智能设备本地预存的语音密码库中的声纹特征进行比对:如果所述待判断的语音信号的声纹特征与所述语音密码库中的某一个语音声纹特征比对成功,则所述待判断的语音信号对智能设备具有控制权;如果所述待判断的语音信号的声纹特征与所述语音密码库中的每一个语音声纹特征比对均不成功,则所述待判断的语音信号对智能设备不具有控制权。

以上比对过程也可以在远程服务器端执行,当在服务器端执行时,所述智能设备将获取的所述待判断的语音信号发送给服务器,服务器提取所述待判断的语音信号的声纹特征,并将该声纹特征与服务器预存的语音密码库中的声纹特征进行比对,得到比对结果,并将比对结果发送给所述智能设备。

s13:当所述待判断的语音信号对所述智能设备具有控制权时,获取所述待判断的语音信号的语音内容;并按照所述语音内容对所述智能设备进行控制;

s14:当所述待判断的语音信号对所述智能设备不具有控制权时,获取待判断的第二密码;

s15:当所述待判断的第二密码是智能设备的正确密码时,采用所述待判断的语音信号对所述智能设备进行控制。

在实际使用中,所述第二密码包括除语音信号之外的任何形式的密码,比如,图形密码、图像密码、文本密码、指纹密码以及虹膜密码等等。

进一步的,判断所述待判断的第二密码是智能设备的正确密码,包括:

将所述待判断的第二密码与智能设备本地预存的第二密码库中的密码进行比对;或者,

将所述待判断的第二密码发送给服务器,以使服务器将所述待判断的第二密码与服务器预存的第二密码库中的密码进行比对;以及,接收服务器发送的比对结果。

进一步的,所述预存的第二密码库可以是通过待注册的图像文本密码提取获取的,也可以是一个已有的第二密码库。当第二密码库是通过待注册的图像文本密码获取时,具体的处理过程包括:

获取待注册的图像文本密码;

根据所述待注册的图像文本密码组成所述第二密码库,并将所述第二密码库存储在智能设备本地。

在实际使用中,可通过智能设备上的语音采集模块获取待判断的语音信号。

本实施例采用在对智能设备控制前,先对输入的语音信号进行声纹比对,从而判断输入语音信号对智能设备的控制权,当该输入语音信号对智能设备具有控制权时,该智能设备才会响应输入语音信号对应的控制指令。如果判断得出输入语音信号对智能设备不具有控制权,本实施例中还可获取待判断的第二密码,并当该第二密码比对成功后,就能实现所述待判断的语音信号对智能设备进行控制。本实施例通过语音信号具有声纹的唯一性特征,来实现对智能设备的控制,该控制方法能够让智能语音控制更加的安全可靠。

图2是本发明实施例二提供的智能设备控制方法的流程示意图。

如图2所示,本实施例所述的方法包括:

s21:获取第一密码,所述第一密码为待判断的语音信号;

s22:判断所述待判断的语音信号对所述智能设备是否具有控制权;

s23:当所述待判断的语音信号对所述智能设备具有控制权时,获取所述待判断的语音信号的语音内容,并按照所述语音内容对所述智能设备进行控制。

进一步的,所述判断所述待判断的语音信号对所述智能设备是否具有控制权,还包括:

提取所述待判断的语音信号的声纹特征,并与智能设备本地预存的语音密码库中的声纹特征进行比对;或者,

将所述待判断的语音信号发送给服务器,以使服务器提取所述待判断的语音信号的声纹特征,并与服务器预存的语音密码库中的声纹特征进行比对;以及,接收服务器发送的比对结果。

s24:当所述待判断的语音信号对所述智能设备不具有控制权时,获取待判断的第二密码;

进一步的,所述获取待判断的第二密码可以包括:用户输入的文字、指纹或图形、图像以及虹膜密码等等。

s25:当所述待判断的第二密码是智能设备的正确密码时,采用所述待判断的语音信号对所述智能设备进行控制,同时将所述待判断的语音信号的声纹特征添加到预存的语音密码库中。

进一步的,判断所述待判断的第二密码是否是智能设备的正确密码,该判断过程可以在智能设备本地执行,也可以在远程服务器端执行。当在智能设备本地执行时,智能设备将获取的待判断的第二密码与本地预存的第二密码库进行比对。

以上比对过程也可以在远程服务器端执行,当在服务器端执行时,所述智能设备将获取的所述待判断的第二密码发送给服务器,服务器将获取的待判断的第二密码与本地预存的第二密码库进行比对,得到比对结果,并将比对结果发送给所述智能设备。

进一步的,所述的预存的第二密码库可以是预先通过注册的图像文本密码形成的,也可以是一个已有的图像文本密码库。当第二密码库是预先通过注册的图像文本密码形成时,具体的处理过程包括:

获取待注册的图像文本密码;

根据所述待注册的图像文本密码组成所述第二密码库,并对所述第二密码库进行存储。

本实施例当所述第一密码(待判断的语音信号)对智能设备不具有控制权时,通过获取待判断的第二密码,并当该第二密码是智能设备的正确密码时,就能实现所述待判断的语音信号对智能设备进行控制,同时还可将所述待判断的语音信号的声纹特征添加到预存的语音密码库中,以方便以后具有该声纹特征的语音信号能够对所述智能设备进行控制。此外,本实施例在执行该控制方法时,对输入信号的存储、比对以及密码库的更新过程不会被用户所感知到,本实施例在提高智能设备安全可靠的同时,保证了用户体验。

采用本实施例所述的控制方法能够避免智能设备被任何人控制,尤其是非法用户,从而有利于保证智能设备的信息安全和机主的利益。

图3是本发明实施例三提供的智能设备控制方法的流程示意图。

如图3所示,本实施例的控制方法包括:

s31:接收待判断的语音信号;

s32:提取所述待判断的语音信号的声纹特征,并与预存的语音密码库中的声纹特征进行比对,得到比对结果;

s33:将所述比对结果发送出去。

本实施例所述的控制方法是在所述智能设备的远端控制中心或服务器上执行的。比如,在实际使用中,所述智能设备为一手持终端机,服务器上预存有语音密码库。手持终端机获取第一密码(待判断的语音信号),并将该语音信号发送给所述服务器,服务器接收待判断的语音信号,并提取所述待判断的语音信号的声纹特征,并与预存的语音密码库中的声纹特征进行比对,得到比对结果,再将所述比对结果发送给手持终端机;所述手持终端机根据比对结果,即该语音信号对所述手持终端机是否具有控制权,来判断是否要执行所述语音信号所包含的指令;

当所述手持终端机接收的比对结果表明:所述待判断的语音信号对所述智能设备具有控制权时,所述手持终端机获取所述待判断的语音信号的语音内容;并按照所述语音内容对所述智能设备进行控制,否则,所述手持终端机不执行语音信号的指令。

本实施例通过将对第一密码的控制权判别处理交由服务器来完成,由于服务器具有处理速度快的特点,使得本实施例所述的控制方法处理时间更短,有利于提高用户体验。

图4是本发明实施例四提供的智能设备控制方法的流程示意图。

如图4所示,本实施例所述的控制方法包括:

s41:接收所述智能终端发送的待注册的语音信号;

s42:提取所述待注册的语音信号的声纹特征;

s43:根据所述声纹特征形成语音密码库,并对所述语音密码库进行存储;

s44:接收所述智能终端发送的待判断的语音信号;

s45:提取所述待判断的语音信号的声纹特征,并与存储的语音密码库中的声纹特征进行比对,得到比对结果;

s46:将所述比对结果发送给所述智能终端。

本实施例四所述的控制方法是在所述智能设备的远端控制中心或服务器上执行的。本实施例四所述的控制方法,在执行对语音信息的控制器判别之前,需要预先建立语音密码库。即:所述远端控制中心或服务器接收所述智能终端发送的待注册的语音信号;提取所述待注册的语音信号的声纹特征;根据所述声纹特征形成语音密码库,并对所述语音密码库进行存储。

当所述智能设备接收到用户发出的语音信号后,智能设备将该语音信号发送给所述服务器,服务器接收待判断的语音信号,并提取所述待判断的语音信号的声纹特征,并与上段形成的语音密码库中的声纹特征进行比对,得到比对结果,再将所述比对结果发送给智能设备;所述智能设备根据比对结果,即该语音信号对所述智能设备是否具有控制权,来判断是否要执行所述语音信号所包含的指令。

图5是本发明实施例五提供的智能设备控制方法的流程示意图。

如图5所示,本实施例的控制方法包括:

s51:接收待判断的第二密码;

s52:将所述待判断的第二密码与预存的第二密码库中的密码进行比对,得到比对结果;

s53:将所述比对结果发送出去。

本实施例所述的控制方法是在所述智能设备的远端控制中心或服务器上执行的。比如,在实际使用中,所述智能设备为一手持终端机,服务器上预存有第二密码库。手持终端机获取第二密码,并将该第二密码发送给所述服务器,服务器接收待判断的第二密码,并将所述待判断的第二密码与服务器本地预存的第二密码库中的密码进行比对,得到比对结果,再将所述比对结果发送给手持终端机;所述手持终端机根据比对结果,得到所述待判断的第二密码是否是智能设备的正确密码的结论。

本实施例通过将对第二密码的控制权判别处理交由服务器来完成,由于服务器具有处理速度快的特点,使得本实施例所述的控制方法处理时间更短,有利于提高用户体验。

图6是本发明实施例六提供的智能设备控制方法的流程示意图。

如图6所示,本实施例所述的控制方法包括:

s61:接收所述智能终端发送的待注册的图像文本密码;

s62:根据所述待注册的图像文本密码组成所述第二密码库,并对所述第二密码库进行存储;

s63:接收所述智能终端发送的待判断的第二密码;

s64:将所述待判断的第二密码与预存的第二密码库中的密码进行比对,得到比对结果;

s65:将所述比对结果发送给所述智能终端。

可以理解的是,本实施例所述的方法也是在远端控制中心或服务器上执行的,处理过程与实施例四类似,在此不再赘述。

图7是本发明智能设备控制装置实施例一提供的结构示意图。

如图7所示,本实施例所述的控制装置包括:

第一获取模块1,用于获取第一密码,所述第一密码为待判断的语音信号;

第一判断模块2,用于判断所述待判断的语音信号对所述智能设备是否具有控制权;

第二获取模块3,用于获取所述待判断的语音信号的语音内容;

第三获取模块4,用于获取待判断的第二密码;

第二判断模块5,用于判断所述待判断的第二密码是否为智能设备的正确密码;

控制模块6,用于当所述待判断的语音信号对所述智能设备具有控制权时,或当所述待判断的第二密码是智能设备的正确密码时,按照所述语音内容对所述智能设备进行控制。

其中,所述第一获取模块1为语音采集模块;

在所述待判断的语音信号的声纹特征属于预存的语音密码库中的声纹特征时,所述第一判断模块2会判断出所述待判断的语音信号对所述智能设备具有控制权。

本实施例采用所述第一获取模块1获取待判断的语音信号;并通过所述第一判断模块2对输入的语音信号进行声纹比对,得到比对结果,从而判断输入语音信号对智能设备的控制权(即,识别出发声人是否具有对该智能设备的控制权);只有当该输入语音信号对智能设备具有控制权时,所述第二获取模块3才会对所述待判断的语音信号进行处理,以得到语音内容,然后,所述控制模块4响应所述语音内容对应的控制指令。如果判断得出输入语音信号对智能设备不具有控制权,本实施例中还可通过所述第三获取模块4获取待判断的第二密码,并当该第二密码比对成功后,实现所述待判断的语音信号对智能设备进行控制。本实施例通过语音信号具有声纹的唯一性特征,来实现对智能设备的控制,该控制方法能够让智能语音控制更加的安全可靠。

此外,本发明还提供了一种智能设备,包括:如前面任一实施例所述的控制装置。

可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。

需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器,磁盘或光盘等。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1