控制智能终端的方法、装置及智能终端与流程

文档序号:14726965发布日期:2018-06-19 11:21阅读:230来源:国知局

本发明涉及智能控制的技术领域,尤其是涉及一种控制智能终端的方法、装置及智能终端。



背景技术:

随着科学技术的不断发展,人们可以通过触摸屏对智能终端进行控制和操作,一定程度上方便了用户的使用。然而,随着用户对智能终端的个性化服务的不断提升,使得智能终端的功能也越来越多样化,如,用户可以输入语音控制命令对智能终端进行控制等等,也越来越方便用户体验控制的多样性。

但是,现有技术中的语音控制功能,通常只识别预先登记的特定语音,对语音进行简单识别,导致语音控制的灵活性较低,也降低了用户的体验度。



技术实现要素:

有鉴于此,本发明的目的在于提供一种控制智能终端的方法、装置及智能终端,以缓解由于语音控制的灵活性较低,降低用户体验度的技术问题。

第一方面,本发明实施例提供了一种控制智能终端的方法,该方法应用于智能终端,包括:接收语音信号,判断该语音信号是否为语音控制功能的语音指令信号;如果是,提取语音信号的声纹数据;判断声纹数据与预先存储的声纹数据是否一致;如果是,执行语音信号对应的操作功能。

结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,上述方法还包括:智能终端首次开机时接收用户输入的语音信号;对语音信号进行分析,提取语音信号的声纹数据,将声纹数据标记为预先存储的声纹数据;保存语音信号和声纹数据。

结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,上述判断语音信号是否为语音控制功能的语音指令信号包括:判断当前接收到的语音信号是否包含有语音指令信号的关键字,如果是,对语音信号进行连续性分析,根据分析结果判断语音信号是否为语音控制功能的语音指令信号;其中,连续性分析包括语气连续性分析和/或语音信号的字节长度分析。

结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第三种可能的实施方式,其中,上述判断声纹数据与预先存储的声纹数据是否一致包括:匹配当前接收到的语音信号的声纹数据与预先存储的声纹数据的相似度;当相似度超过预先设定的相似度阈值时,确定声纹数据与预先存储的声纹数据一致。

结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,上述执行语音信号对应的操作功能包括:启动语音控制功能,在预先存储的语音控制指令集中查找与语音信号匹配的指令;将查找到的指令作为语音信号的控制指令;通过语音控制功能执行语音信号的控制指令。

结合第一方面的第四种可能的实施方式,本发明实施例提供了第一方面的第五种可能的实施方式,其中,上述启动语音控制功能之后,上述方法还包括:智能终端发出已启动语音控制功能的提醒信号,其中,提醒信号包括震动、灯闪或声音中的一种或多种。

结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第六种可能的实施方式,其中,上述方法还包括:接收用户输入的声纹数据更新指令,根据声纹数据更新指令对预先存储的声纹数据进行更新,其中,声纹数据更新指令包括以下指令中的一种或多种:声纹数据删除指令、声纹数据添加指令和声纹数据更改指令。

结合第一方面,本发明实施例提供了第一方面的第七种可能的实施方式,其中,上述接收语音信号包括:通过语音采集器接收语音信号;或者,通过无线连接部件接收远端部件传输的语音信号。

第二方面,本发明实施例还提供了一种控制智能终端的装置,该装置设置于智能终端,包括:第一判断模块,用于接收语音信号,判断语音信号是否为语音控制功能的语音指令信号;提取模块,用于当第一判断模块的判断结果为是时,提取语音信号的声纹数据;第二判断模块,用于判断声纹数据与预先存储的声纹数据是否一致;执行模块,用于当第二判断模块的判断结果为是时,执行语音信号对应的操作功能。

第三方面,本发明实施例还提供了一种智能终端,该智能终端包括存储器以及处理器,存储器用于存储支持处理器执行上述第一方面所述方法的程序,处理器被配置为用于执行存储器中存储的程序。

第四方面,本发明实施例还提供了一种计算机存储介质,用于储存为第二方面所述装置所用的计算机软件指令。

本发明实施例带来了以下有益效果:

本发明实施例提供的一种控制智能终端的方法、装置及智能终端,能够在智能终端接收到语音信号后,判断该语音信号是否为语音控制功能的语音指令信号;如果是,提取语音信号的声纹数据;并继续判断声纹数据与预先存储的声纹数据是否一致;当一致时,智能终端能够执行该语音信号对应的操作功能,使用户可以在双手处于忙碌状态时通过语音对智能终端进行控制,同时,也能判断该用户输入的语音信号的合法性,避免其他用户对智能终端进行非法操作,不仅提高智能终端语音控制的灵活性,也有助于提高用户的体验度。

本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种控制智能终端的方法的流程图;

图2为本发明实施例提供的另一种控制智能终端的方法的流程图;

图3为本发明实施例提供的一种控制智能终端的装置的结构示意图;

图4为本发明实施例提供的一种智能终端的结构框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为便于对本实施例进行理解,首先对本发明实施例所公开的一种控制智能终端的方法进行详细介绍。

实施例一:

本发明实施例提供了一种控制智能终端的方法,该方法可以应用于智能终端,其中,本发明实施例中的智能终端可以是移动终端设备,例如可以包括智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机、车载电脑、穿戴式移动终端、智能家居等等,下面通过实施例进行描述。

参见图1所示的一种控制智能终端的方法的流程图,该方法包括以下步骤:

步骤S102,接收语音信号,判断语音信号是否为语音控制功能的语音指令信号;

其中,智能终端可以通过语音采集器接收语音信号,如智能终端内置的话筒、具有麦克风功能的耳机等器件;进一步,智能终端也可以通过无线连接部件接收远端部件传输的语音信号;其中,无线连接部件包括蓝牙接收器或红外语音接收器。通过这两种方式,智能终端均可以较为方便快捷的接收到语音信号,在具体实现时,可以根据实际应用需要,选择两种方式之一进行语音信号的接收。

步骤S104,如果是,提取语音信号的声纹数据;

步骤S106,判断声纹数据与预先存储的声纹数据是否一致;

步骤S108,如果是,执行语音信号对应的操作功能。

本发明实施例提供的一种控制智能终端的方法,能够在智能终端接收到语音信号后,判断该语音信号是否为语音控制功能的语音指令信号;如果是,提取语音信号的声纹数据;并继续判断声纹数据与预先存储的声纹数据是否一致;当一致时,智能终端能够执行该语音信号对应的操作功能,使用户可以在双手处于忙碌状态时通过语音对智能终端进行控制,同时,也能判断该用户输入的语音信号的合法性,避免其他用户对智能终端进行非法操作,不仅提高智能终端语音控制的灵活性,也有助于提高用户的体验度。

具体实现时,上述预先存储的声纹数据,可以是智能终端用户本人的声纹数据,拥有该智能终端的用户,可以在智能终端首次开机时,收集一段用户本人的语音信号,由智能终端进行声纹数据提取,并保存,后续用户语音操作都将与该保存的声纹数据进行识别和匹配,以判断语音信号的合法性。基于此,本发明实施例还提供了另一种控制智能终端的方法,如图2所示的另一种控制智能终端的方法的流程图,包括以下步骤:

步骤S202,智能终端首次开机时接收用户输入的语音信号;

步骤S204,提取语音信号的声纹数据,将声纹数据标记为预先存储的声纹数据;

具体实现时,上述声纹数据可以通过专门的声纹识别芯片进行提取,并保存,以便对后续用户输入的语音信号进行识别和匹配。

步骤S206,保存语音信号和声纹数据;

步骤S208,接收语音信号;

步骤S210,判断当前接收到的语音信号是否包含有语音指令信号的关键字;如果是,执行步骤S212;如果否,执行步骤S224,智能终端保持当前状态。

具体实现时,上述关键字可以是手机语音控制功能系统自带的默认关键字,也可以是由用户预先语音录制的信号,且,本实施例的语音控制功能可以是手机上附加的APP或者手机上现有应用的改进功能。

当接收到的语音信息不包含关键字时,智能终端继续保持当前的状态,如待机状态等等。

步骤S212,对语音信号进行连续性分析;

步骤S214,根据分析结果判断语音信号是否为语音控制功能的语音指令信号;如果是,执行步骤S216;如果否,执行步骤S224,智能终端保持当前状态。

其中,上述连续性分析包括语气连续性分析和/或语音信号的字节长度分析。

具体实现时,上述语音指令信号通常都是比较短的语音,如打开qq、打开微信、呼叫XX等。但是,在平时的说话和聊天的语句中,也会出现上述类似的语音,为了避免智能终端被误触发,可以通过对语音信号进行连续性分析的方式,排除平时的说话和聊天时发出的与语音指令信号相似或者一致的语音。

当智能终端探测到关键字后,可以继续探测包含该关键词的语音信号的连续性,如语音信号的持续时长和语音信号的字节长度等,当超过预先设置的连续性阈值时,可以排除该语音信号,即,当前的语音信号并不是语音控制功能的语音指令信号,此时,智能终端继续保持当前的状态。

如果是,则执行步骤S216~步骤S222。

步骤S216,提取语音信号的声纹数据;

步骤S218,匹配当前接收到的语音信号的声纹数据与预先存储的声纹数据的相似度;

步骤S220,当相似度超过预先设定的相似度阈值时,确定声纹数据与预先存储的声纹数据一致;

在实际使用时,声纹不仅具有特定性,而且有相对稳定性的特点,如,成年以后,人的声音可保持长期相对稳定不变,无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹却始终不相同,因此,基于声纹的这两个特征,可以判断用户输入的语音信号的合法性,即,判断该语音信号是否为用户本人输入的,避免其他人员在未经智能终端的拥有中允许的情况下,对智能终端进行控制和操作,提高了智能终端的使用安全性。

具体实现时,上述匹配的过程也可以通过上述专门的声纹识别芯片进行,可以对该声纹识别芯片进行编程,通过软件实现声纹数据的收集,并计算匹配收集的语音信号是否为用户本人输入的。

进一步,对于有联网功能的智能终端,智能终端还可以将收集的语音信号上传至与服务器,通过云服务器来进行声波数据的提取和匹配,并将匹配结果返回至智能终端,减少智能终端的数据处理量。

步骤S222,执行语音信号对应的操作功能。

具体的执行过程包括:(1)启动语音控制功能,在预先存储的语音控制指令集中查找与语音信号匹配的指令;(2)将查找到的指令作为语音信号的控制指令;(3)通过语音控制功能执行语音信号的控制指令。

具体地,上述用户输入的语音信号,可以是控制智能终端启动的启动信号,该启动信号可以是智能终端自带的默认启动信号,也可以是由用户预先语音录制的信号,以语音录制方式为例,用户可以通过智能终端内置的录音功能录制一段语音(如:启动语音控制功能),将录制保存的该段语音设置为语音控制功能启动信号,当下次用户再次说出该段语音时,智能终端首先提取该段语音的声纹数据,当判断出该声纹数据与合法的语音指令信号的声纹数据一致时,启动该语音控制功能。

进一步,当上述智能终端具有锁定功能时,该语音信号也可以是该智能终端的解锁信号,当智能终端判断出该声纹数据与合法的语音指令信号的声纹数据一致时,还可以继续判断该语音信号与预存的解锁码是否匹配,如果匹配,智能终端解锁,并启动语音控制功能。

上述通过引入语音控制指令集的方式,能够对各个语音信号对应的控制指令进行区分,达到有效的控制智能终端进行对应操作的目的。

为了能够提示用户当前语音控制功能已启动,上述智能终端启动语音控制功能之后,该方法还包括:智能终端发出已启动所述语音控制功能的提醒信号,其中,该提醒信号包括震动、灯闪或声音等中的一种或多种。通过这种提醒信号,用户可以方便地得知语音控制功能是否启动,为后续的语音控制操作的顺利进行提供了可靠地保障。

为了避免智能终端收集用户本人声纹数据后,只能识别用户本人的情形,用户本人还可通过密码设置的方式添加或者修改多个声纹数据,因此,上述方法还包括:接收用户输入的声纹数据更新指令,根据声纹数据更新指令对预先存储的声纹数据进行更新,其中,声纹数据更新指令包括以下指令中的一种或多种:声纹数据删除指令、声纹数据添加指令和声纹数据更改指令。

在实际应用中,上述智能终端可以是手机,还可以是汽车,或者,具有智能终端控制功能的军事武器等等。

当智能终端为手机,且上述语音信号对应的控制操作为手机应用操作时,该智能终端(即手机)在待机状态下执行手机应用操作,其中,手机应用操作包括:拨号呼叫应用、读取短信应用、开启指定应用(例如手机里安装的各种附加应用,如腾讯的微信或者qq)等。当然,该手机应用操作还可以是启动手机由待机状态下的黑屏转变为开机下的亮屏。

当智能终端为汽车时,且语音信号对应的控制操作为汽车功能操作时,智能终端在开机状态下执行汽车功能操作,其中,汽车功能操作包括:点火开机,打开导航,无人驾驶应用,开启指定等应用,无需进入语音控制的界面,可以直接通过语音控制功能对智能终端进行控制。

下面以智能终端为手机,控制手机语音拨打电话为例,详细阐述上述方法的实现过程:

(1)手机黑屏待机状态下(也可以称为黑屏锁定状态下),采集语音信号,判断当前接收到的语音信号是否包含有语音指令信号的关键字;

该关键词可以是手机语音控制功能系统自带的默认关键词,也可以是由用户预先语音录制的信号。

本实施例的语音控制功能可以是手机上附加的APP或者手机上现有应用的改进功能。

(2)当手机接收到包含启动语音控制功能的关键词的语音信号后,对语音信号进行连续性分析,根据分析结果判断语音信号是否为语音控制功能的语音指令信号;如果分析结果不超过预先设置的连续性阈值,则启动语音控制功能。

进一步,手机还可以判断该段语音信号是否为语音控制功能启动信号且与手机解锁码匹配,进而手机解锁,并启动该语音控制功能。

本实施例中,手机黑屏待机状态下启动语音控制功能可以不亮屏。

(3)手机向用户发出已启动语音控制功能的提醒信号。其中,该提醒信号包括震动、灯闪或声音等中的一种或多种,用户可以预先进行设置;

(4)用户收到上述提醒信号后,确定手机已启动语音控制功能,进行语音控制拨打电话;如,输入呼叫XX的语音信号,继续执行上述(1)~(3)的过程,对下一个语音信号进行判断。

具体实现时,用户可以呼叫被叫用户的手机号码,也可以直接呼叫手机存储的联系人姓名。

(5)手机收到上述用户拨打电话的语音指令信号后,拨叫对应的号码,完成整个呼叫过程。

本发明实施例提供的一种控制智能终端的方法,能够在智能终端接收到语音信号后,判断该语音信号是否为语音控制功能的语音指令信号;如果是,提取语音信号的声纹数据;并继续判断声纹数据与预先存储的声纹数据是否一致;当一致时,智能终端能够执行该语音信号对应的操作功能,使用户可以在双手处于忙碌状态时通过语音对智能终端进行控制,同时,也能判断该用户输入的语音信号的合法性,避免其他用户对智能终端进行非法操作,不仅提高智能终端语音控制的灵活性,也有助于提高用户的体验度。

实施例二:

在上述实施例的基础上,本发明实施例还提供了一种控制智能终端的装置,该装置设置于智能终端,如图3所示的一种控制智能终端的装置的结构示意图,该装置包括:

第一判断模块30,用于接收语音信号,判断语音信号是否为语音控制功能的语音指令信号;

提取模块32,用于当第一判断模块的判断结果为是时,提取语音信号的声纹数据;

第二判断模块34,用于判断声纹数据与预先存储的声纹数据是否一致;

执行模块36,用于当第二判断模块的判断结果为是时,执行语音信号对应的操作功能。

本发明实施例提供的控制智能终端的装置,与上述实施例提供的控制智能终端的方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。

在上述实施例的基础上,本发明实施例还提供了一种智能终端,该智能终端包括存储器以及处理器,存储器用于存储支持处理器执行上述实施例一所述方法的程序,处理器被配置为用于执行存储器中存储的程序。

图4示出了一种可应用于本发明实施例中的智能终端的结构框图。如图4所示,智能终端400包括存储器402、存储控制器404,一个或多个(图中仅示出一个)处理器406、外设接口408、射频模块410、音频模块412、触控屏幕414等。这些组件通过一条或多条通讯总线/信号线416相互通讯。

存储器402可用于存储软件程序以及模块,如本发明实施例中的方法及装置对应的预先存储的语音控制指令集,处理器406通过运行存储在存储器402内的软件程序以及模块,从而执行各种功能应用以及数据处理,如本发明实施例提供的判断语音信号是否与预先存储的合法的语音指令信号一致,及启动语音控制功能等。

存储器402可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。处理器406以及其他可能的组件对存储器402的访问可在存储控制器404的控制下进行。

外设接口408将各种输入/输出装置耦合至处理器406以及存储器402。在一些实施例中,外设接口408,处理器406以及存储控制器404可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。

射频模块410用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯。

音频模块412向用户提供音频接口,其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。

触控屏幕414在用户终端400与用户之间同时提供一个输出及输入界面。具体地,触控屏幕414向用户显示视频输出,这些视频输出的内容可包括文字、图形、视频、及其任意组合。

可以理解,图4所示的结构仅为示意,智能终端400还可包括比图4中所示更多或者更少的组件,或者具有与图4所示不同的配置。图4中所示的各组件可以采用硬件、软件或其组合实现。

附图中的流程图和结构框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

本发明实施例所提供的控制智能终端的方法、装置及智能终端的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是:以上实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1