一种语音控制应用程序的方法、装置及终端设备与流程

文档序号:16687267发布日期:2019-01-22 18:26阅读:126来源:国知局
一种语音控制应用程序的方法、装置及终端设备与流程

本发明涉及通信技术领域,特别涉及一种语音控制应用程序的方法、装置及终端设备。



背景技术:

通常,应用程序(application,app)需要通过多步操作实现对应的应用程序的功能,例如应用程序中的个性化设置等。例如,用户需要在第一个界面上查找对应的节点,在跳转到另一个界面上查找下一个节点,这样会导致操作繁琐,可能还会出现用户不知晓对应的节点,导致无法设置成功,用户体验较差。



技术实现要素:

本发明实施例提供一种语音控制应用程序的方法、装置及终端设备,用于简化用户操作,简化用户操作的难度,提高用户的便捷使用性,提高用户体验。

本发明实施例提供一种语音控制应用程序的方法,包括:

终端确定用户对应用程序的图标的操作符合第一配置,所述第一配置用于指示启动所述应用程序的语音控制功能;

所述终端接收第一语音指令,并提取所述第一语音指令中的关键字;

所述终端确定与所述关键字对应的操作指令,并对所述应用程序执行所述操作指令。

一种可能的实现方式,所述终端确定与所述关键字对应的操作指令,包括:

所述终端根据第一关键字,确定出与所述第一关键字相关联的多个操作对象;

所述终端发送提示信息,所述提示信息用于使用户确定所述第一语音指令的操作对象;

所述终端接收所述用户的第二语音指令,并根据所述第二语言指令确定操作对象;

所述终端根据第二关键字确定所述第二语言指令的操作动作;

所述终端至少根据所述操作对象和所述操作动作确定所述操作指令。

一种可能的实现方式,所述终端对所述应用程序执行所述操作指令之前,还包括:

所述终端对所述第一语音指令进行声纹识别;

所述终端根据识别结果在所述应用程序中确定所述第一语音指令的使用权限;

所述终端根据所述操作指令及所述第一语音指令的使用权限,确定是否可以执行所述操作。

一种可能的实现方式,所述终端确定用户对应用程序的图标的操作符合第一配置之后,还包括:

所述终端在所述图标周围显示录音标记;所述录音标记用于指示所述应用程序已启动所述语音控制功能;

所述终端接收第一语音指令之后,并提取所述第一语音指令中的关键字之前,还包括:

所述终端确定所述用户对所述图标的操作符合第二配置,所述第二配置用于指示关闭所述语音控制功能;

所述终端在所述图标周围隐藏所述录音标记。

第二方面,本发明实施例提供一种语音控制应用程序的装置,包括:

处理单元,用于确定用户对应用程序的图标的操作符合第一配置,所述第一配置用于指示启动所述应用程序的语音控制功能;确定与所述关键字对应的操作指令,并对所述应用程序执行所述操作指令;

收发单元,用于接收第一语音指令,并提取所述第一语音指令中的关键字。

一种可能的实现方式,所述处理单元,具体用于:

根据第一关键字,确定出与所述第一关键字相关联的多个操作对象;所述终端发送提示信息,所述提示信息用于使用户确定所述第一语音指令的操作对象;所述终端接收所述用户的第二语音指令,并根据所述第二语言指令确定操作对象;所述终端根据第二关键字确定所述第二语言指令的操作动作;所述终端至少根据所述操作对象和所述操作动作确定所述操作指令。

一种可能的实现方式,所述处理单元,还用于:

对所述第一语音指令进行声纹识别;根据识别结果在所述应用程序中确定所述第一语音指令的使用权限;根据所述操作指令及所述第一语音指令的使用权限,确定是否可以执行所述操作。

一种可能的实现方式,所述处理单元,还用于:

在所述图标周围显示录音标记;所述录音标记用于指示所述应用程序已启动所述语音控制功能;确定所述用户对所述图标的操作符合第二配置,所述第二配置用于指示关闭所述语音控制功能;在所述图标周围隐藏所述录音标记。

第三方面,提供一种终端设备,该终端设备包括:

至少一个处理器,以及

与所述至少一个处理器连接的存储器;

其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令实现如第一方面任一项所述的方法。

第四方面,提供一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面任一项所述的方法。

本发明实施例中,当用户需要执行应用程序中的操作时,用户可以向终端设备输入语音指令,终端设备可以语音指令中的关键词查找与语音指令对应的操作对象,并执行所述操作。整个过程,用户只需要输入语音指令而无需输入多次操作即可使得终端设备快速执行,简化了用户操作,提高了用户体验。

附图说明

图1是本发明实施例提供的语音控制应用程序的方法的流程示意图;

图2为本发明实施例提供的语音控制应用程序的架构示意图;

图3为本发明实施例提供的语音控制应用程序的装置的结构示意图;

图4为本发明实施例提供的终端设备的一种结构示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚明白,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。

本发明实施例描述的应用场景是为了更加清楚的说明本发明实施例的技术方案,并不构成对于本发明实施例提供的技术方案的限定,本领域普通技术人员可知,随着新应用场景的出现,本发明实施例提供的技术方案对于类似的技术问题,同样适用。

随着科学技术的不断发展,越来越多的智能设备能被终端上的app(application,应用)控制,比如智能空调、智能电饭煲、智能电视、智能冰箱等。

目前,终端上的app控制智能设备时,可以有多种设置方式或者针对多台设备设置不同的设置方式。例如,可以在app上根据智能设备位于的位置,比如将房间分成卧室1,卧室2,客厅,厨房,卫生间,在卧室1中有智能空调1、智能电视1和智能饮水机1;在卧室2有智能空调2和智能电视2;在客厅有智能空调4、智能电视4和智能冰箱,如果将卧室2中的智能电视2移动到客厅,则需要用户用手指长按app显示界面显示的卧室2中的智能电视2的图标,当弹出“移动”、“删除”、“增加”的对话框后,用户选择“移动”,智能电视2对应的图标处于可移动状态,用户用手指拖动智能电视2对应的图标,将其拖动到app显示界面显示的客厅中,操作非常繁琐,很容易出错,用户体验较差。

如果用户不通过手指操作,而是通过语音操作实现多种控制方式,而不需要用户学习不同的软件中的各自配置方法,使得操作简便,有效提高用户体验和用户使用产品的效率。

本发明实施例中的终端可以是手机、平板电脑,任何能够安装app的终端都适用本发明实施例。

本发明实施例中的设备可以是任何的智能设备,比如智能空调、智能冰箱、智能洗衣机、智能饮水机等。

下面结合说明书附图介绍本发明实施例提供的技术方案。

请参见图1,本发明实施例提供了一种语音控制应用程序的方法,该方法可以由终端设备,例如手机、平板电脑等执行,该方法的流程描述如下:

步骤101:终端确定用户对应用程序的图标的操作符合第一配置,所述第一配置用于指示启动所述应用程序的语音控制功能;

步骤102:所述终端接收第一语音指令,并提取所述第一语音指令中的关键字;

步骤103:所述终端确定与所述关键字对应的操作指令,并对所述应用程序执行所述操作指令。

在步骤101中,第一配置可以为通过双击图标实现启动应用程序的语音控制功能;比如,可以通过判断在0.5s内点击图标的次数,当点击次数大于2次时,表示为双击。当然也可以通过其他操作方式,实现启动应用程序的语音控制功能,在此不做限定。

为避免误操作,可以在开启对应的应用程序的进程之后,才可以通过第一配置触发启动所述应用程序的语音控制功能。例如,在开启对应的应用程序后,将该应用程序设置为后台运行,保持应用程序的进程不关闭的情况下,使得终端接收的第一语言指令为该应用程序接收并执行的,而不是终端的其他应用程序执行。

一种可能的实现方式,所述终端确定用户对应用程序的图标的操作符合第一配置之后,还包括:

所述终端在所述图标周围显示录音标记;所述录音标记用于指示所述应用程序已启动所述语音控制功能。

一种可能的实现方式,用户确定语音指令输入完毕,可以隐藏所述录音标记。具体的,可以在终端接收第一语音指令,并提取所述第一语音指令中的关键字之前,所述终端确定所述用户对所述图标的操作符合第二配置,所述第二配置用于指示关闭所述语音控制功能;所述终端在所述图标周围隐藏所述录音标记。其中,第二配置,可以为用户单击所述录音标记,以隐藏录音标记。

一种具体的实施方式中,可以通过双击手机桌面的图标;然后就显示一个话筒的图案在应用程序图标的右下角,标志着语音的录入,当再次点击该图标的时候,语音录入截止,话筒图标消失。当在语音录入期间,可以通过说话来操控app。比如点击应用程序的图标,然后说第一语音指令为“打开空调”,然后语音识别到关键字为空调,然后手机就打开了空调插件的页面。

可以在app后台运行时通过语音进行快速的设置场景等,而不需要打开app一步一步操作。比如第一语音指令为“新添加一个叫游戏的场景,空调设置开机2小时”。语音就可以智能识别新添加场景,名字识别,设备为空调,状态为开机2小时,识别到之后,app智能设置,直接新建一个叫游戏的场景,然后设备空调开机为两小时。

此时,应用程序app就智能执行完第一语音指令中的操作指令。如果应用程序确定没有空调这个设备,则发出弹窗到app上,提示用户无此设备。

本发明实施例中,当用户需要执行应用程序中的操作时,用户可以向终端设备的应用程序开启的语音控制功能输入语音指令,终端设备的应用程序中的语音模块可以通过语音指令中的关键词查找与语音指令对应的操作对象,并执行所述操作。整个过程,用户只需要输入语音指令而无需输入多次操作即可使得终端设备快速执行,简化了用户操作,提高了用户体验。

用户需要控制被控设备时,会发起语音指令,终端可以通过语音模块来接收用户发起的语音指令。例如:“打开电视机”,语音模块可以接收到该语音指令。

获取到用户发起的语音指令之后,可以对该语音指令进行解析,然后得到语音指令中的关键字。

在具体实施过程中,可以根据关键字确定对应的设备的控制协议,从预设的操作指令库中确定该控制协议对应的操作指令,遍历该控制协议对应的操作指令,就可以查找到与该语音信息对应的操作指令。

上述预设的操作指令库,可以是用户自己设置的,也可以是从服务器下载的。可选的,接收用户输入的操作指令,然后将该用户设置的操作指令存储在操作指令库中。

相应的,还可以从服务器中下载,此时接收服务器发送的更新信息,该更新信息中包括待更新的操作指令,根据该待更新的操作指令更新上述操作指令库。

可选的,用户还可以对操作指令库中的指令进行修改。具体的,接收用户输入的语音指令包括修改信息,该修改信息包括待修改的操作指令,然后根据该待修改的操作指令,修改上述操作指令库中对应的操作指令。例如,用户更换了自己的家用电器,此时可以删除品牌a的操作指令,增加品牌b的操作指令;或者,删除电器1的操作指令,增加电器2的操作指令;修改的操作可以包括删除、增加等操作。

在查找到对应的操作指令之后,就可以将查找到的操作指令发送到被控设备中,从而使得被控设备根据该操作指令进行控制操作。例如,“打开电视机”对应的操作指令,被控设备就是电视机,其就会执行该指令,开始启动。

需要说明的是,该终端为了能操作市面上电器,出厂时已经集成了灯,电视机,空调等电器的指令集,该产品能从服务器获取最新的指令集,动态更新。

一种可能的实现方式,如图2所示,本发明实施例设置应用程序中的设备的系统包括:终端10、服务器20。

终端10,用于响应用户的语音指令,将获取的语音指令发送给服务器;接收所述服务器返回的与所述语音指令匹配的控制命令;根据所述控制命令中的处理命令,对所述控制命令中的设备执行所述控制命令。

服务器20,用于根据接收到的终端发送的语音指令,确定与所述语音指令匹配的设备标识和处理命令;根据所述处理命令生成包含所述设备标识的控制命令,并发送给所述终端。

本发明实施例中,终端响应用户的语音指令,将获取的语音指令发送给服务器,服务器接收到终端发送的语音指令后,确定与该语音指令匹配的设备标识和处理命令,服务器再根据该处理命令生成包含确定的设备标识的控制命令,并将该控制命令发送给终端,终端接收到服务器返回的控制命令后,根据控制命令中的处理命令对对应的设备进行处理,无需通过手指进行操作,通过语音操作,终端自动设置设备,进而执行设备上需要执行的处理命令,操作简便,不易出错。

在具体实施过程中,可以包括以下步骤:

步骤一,登入应用程序app,以使app在后台运行就行。

步骤二,双击终端桌面的图标,待图标右下角显示有话筒时,确认开启语音控制功能。

步骤三,对应用程序输入第一语音命令,并进行录音。

步骤四,再次点击应用程序图标,若图标右下角话筒消失,则录音结束。

步骤五,app对录音进行分析,确定第一语音命令中的关键字,并分别发给服务器和本地,服务器根据关键字对应的控制指令进行分析判断,然后下发或者处理数据,同时本地也可以根据所说的关键字进行数据的传递和ui的修改,通过综合处理之后,将对应的控制指令的执行结果显示在app中,并在弹出界面中显示最终处理完成的页面;

步骤六、接收用户确认指令,确认第一语音指令执行完毕,退出app。

终端在进行工作之前,需要用户对其进行设置,用户可以通过该终端上的触摸屏进行设置,也可以通过与该终端注册了的app进行设置,主要是设置家用电器对应的指令,可以添加或删除相应的指令。

现在用几类电器,来举例详情描述整个操作过程。

先从数据库结构分析指令集,支持的家用电器产品表,电视机,空调,灯,电风扇。

然后每类产品有一个操作指令集,比如电视机下面包括打开电视机,关闭电视机的指令。强调一下,为了能支持市面上几乎所有品牌的电视机,所以需要收集所有品牌的指令,或者产品能从服务器获取并更新本地指令集。当用户发起语音信息后,语音信息经过语义服务器解析后,然后发起相应的指令。

如果购买一台电视机,但是开机和关机的指令不是通用的,并且本地指令中也没有包括这款电视机的指令,那么用户可通过以下方式增加语音控制功能。

一、用户反馈该款电视机品牌和型号给终端对应厂商,厂商经过测试后,公司把指令加入到服务器的指令集中,然后更新远程升级产品的本地指令集,这样用户就能控制该款电视机了。

二、用户也可以通过语音指令将该款电视机的指令录入到产品中,具体可以通过语音控制进入到产品的电视机指令集,选择操作指令类型(如:开机),然后添加对应的操作,产品里面的模块就处于接受状态,然后用户按住摇控器的开机键发射,当模块接受完成后,用户就能通过该产品进行语音控制该款电视机人开机了。其他指令也是类似的操作。

为了更加高效稳定的控制,用户通过语音指令,选择用户家电的品牌和类型,比如用户购买的是格力空调,用户可以通过语音指令设置品牌为格力,这样用户每次在发起语音控制时,终端就只需要发起格力空调的语音指令,即可控制该空调,从而提升用户的体验,减少不必要的开销。

终端中存储的房间标识和设备标识会在终端中的app的显示界面显示,以便用户通过语音设置房间与设备的关系。终端中存储的房间标识和设备标识可以是终端在出厂之前预先存储在终端中的,也可以是用户在使用过程中根据需要自行设置存储在终端中的。比如,终端在出厂前存储在终端中的房间有4个,分别为主卧、客卧、客厅、厨房和卫生间,设备有空调、电视、冰箱和电饭煲,用户在使用过程中,可以在app上添加一个房间,房间标识为主卧1,用户将房间主卧1保存在终端中后,在app显示界面会显示主卧1的房间。

根据上述场景,终端在确定多个操作对象,例如确定出多个电器时,一种可能的实现方式,所述终端确定与所述关键字对应的操作指令,包括:

步骤一、所述终端根据第一关键字,确定出与所述第一关键字相关联的多个操作对象;

步骤二、所述终端发送提示信息,所述提示信息用于使用户确定所述第一语音指令的操作对象;

步骤三、所述终端接收所述用户的第二语音指令,并根据所述第二语言指令确定操作对象;

步骤四、所述终端根据第二关键字确定所述第二语言指令的操作动作;

步骤五、所述终端至少根据所述操作对象和所述操作动作确定所述操作指令。

用户想通过语音控制终端以实现电视机开关机的功能,此时,用户按住终端对应的app,终端接收到该指令,用户就可以在添加指令按键下开启语音控制功能的开启,用户通过输入语音指令,选择操作类型开或关,然后点击开始录入指令,最后关闭该语音控制功能的方式可以为语音方式,也可以是手动操作。

用户在设置家用电器对应的指令集后,通过上述流程来实现对家用电器的控制。

用户对着终端说“打开空调”、“打开电视机”、“关灯”等语音,此时,终端的语音模块可以识别到用户的语音,将语音数据经过语音语义平台,转换成指令并通过模块发射出去。也可以说语音模块将语音信息发送给语义服务器,语义服务器进行解析,然后返回终端能够识别的控制协议,终端接收到控制协议之后,遍历该控制协议对应的所有指令,然后发送指令。当家用电器接收到指令,从而完成了整个操作流程。

一种可能的实现方式,所述终端对所述应用程序执行所述操作指令之前,还包括:

所述终端对所述第一语音指令进行声纹识别;

所述终端根据识别结果在所述应用程序中确定所述第一语音指令的使用权限;

所述终端根据所述操作指令及所述第一语音指令的使用权限,确定是否可以执行所述操作。

通过上述方法,使得终端的语音指令可以针对不同的用户进行设置,实现针对用户的个性化设置,提高用户体验。

下面结合说明书附图介绍本发明实施例提供的设备。

请参见图3,本发明实施例提供一种语音控制应用程序的装置,该装置设备可以是手机、平板等。该终端设备可以包括收发单元301、处理单元302,包括:

处理单元302,用于确定用户对应用程序的图标的操作符合第一配置,所述第一配置用于指示启动所述应用程序的语音控制功能;确定与所述关键字对应的操作指令,并对所述应用程序执行所述操作指令;

收发单元301,用于接收第一语音指令,并提取所述第一语音指令中的关键字。

一种可能的实现方式,处理单元302,具体用于:

根据第一关键字,确定出与所述第一关键字相关联的多个操作对象;所述终端发送提示信息,所述提示信息用于使用户确定所述第一语音指令的操作对象;所述终端接收所述用户的第二语音指令,并根据所述第二语言指令确定操作对象;所述终端根据第二关键字确定所述第二语言指令的操作动作;所述终端至少根据所述操作对象和所述操作动作确定所述操作指令。

一种可能的实现方式,处理单元302,还用于:

对所述第一语音指令进行声纹识别;根据识别结果在所述应用程序中确定所述第一语音指令的使用权限;根据所述操作指令及所述第一语音指令的使用权限,确定是否可以执行所述操作。

一种可能的实现方式,处理单元302,还用于:

在所述图标周围显示录音标记;所述录音标记用于指示所述应用程序已启动所述语音控制功能;确定所述用户对所述图标的操作符合第二配置,所述第二配置用于指示关闭所述语音控制功能;在所述图标周围隐藏所述录音标记。

请参见图4,基于同一发明构思,本发明一实施例提供一种终端设备,该终端设备可以是手机、平板等,该终端设备可以包括:至少一个处理器401,处理器401用于执行存储器中存储的计算机程序时实现本发明实施例提供的如图1所示的语音控制应用程序的方法的步骤。

可选的,处理器401具体可以是中央处理器、特定应用集成电路(英文:applicationspecificintegratedcircuit,简称:asic),可以是一个或多个用于控制程序执行的集成电路。

可选的,该终端设备还包括与至少一个处理器连接的存储器402,存储器402可以包括只读存储器(英文:readonlymemory,简称:rom)、随机存取存储器(英文:randomaccessmemory,简称:ram)和磁盘存储器。存储器402用于存储处理器401运行时所需的数据,即存储有可被至少一个处理器301执行的指令,至少一个处理器301通过执行存储器302存储的指令,执行如图1所示的方法。其中,存储器302的数量为一个或多个。其中,存储器402在图4中一并示出,但需要知道的是存储器402不是必选的功能模块,因此在图4中以虚线示出。

其中,收发单元301、处理单元302所对应的实体设备均可以是前述的处理器401。该设备可以用于执行图1所示的实施例所提供的方法。因此关于该设备中各功能模块所能够实现的功能,可参考图1所示的实施例中的相应描述,不多赘述。

本发明实施例还提供一种计算机存储介质,其中,计算机存储介质存储有计算机指令,当计算机指令在计算机上运行时,使得计算机执行如图1所述的方法。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:通用串行总线闪存盘(universalserialbusflashdisk)、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1