语音控制方法、移动终端及存储介质与流程

文档序号:21398645发布日期:2020-07-07 14:31阅读:144来源:国知局
语音控制方法、移动终端及存储介质与流程

本发明涉及电子电器技术领域,尤其涉及语音控制方法、移动终端及计算机可读存储介质。



背景技术:

随着移动终端的生产工艺的发展,如手机、平板电脑等移动终端已经成为人们日常生活中不可或缺的生产、生活工具。为提高用户控制移动终端时的便捷性,许多移动终端都设置有与语音控制功能。

现有的具备语音控制功能的移动终端在进行语音控制时,需要用户先输入终端设备的语音唤醒词,然后在判定语音唤醒词合法时,再唤醒移动终端,以供移动终端接收语音控制指令,并根据接收到的语音控制指令控制设备执行相应动作。这样存在语音控制步骤繁琐的缺点。



技术实现要素:

本发明的主要目的在于提供一种语音控制方法、移动终端及计算机可读存储介质,旨在达成简化移动终端的语音控制步骤的效果。

为实现上述目的,本发明提供一种语音控制方法,所述语音控制方法包括以下步骤:

获取当前接收到的语音信息对应的快捷操作;

控制移动终端执行所述快捷操作。

可选地,获取当前接收到的语音信息对应的快捷操作的步骤包括:

获取与所述语音信息匹配的预存语音信息关联的所述快捷操作;

或者,识别所述语音信息对应的语音内容,并获取与所述语音内容匹配的预存语音内容关联的所述快捷操作。

可选地,所述获取与所述语音信息匹配的预存语音信息关联的所述快捷操作包括:

确定所述语音信息与每一所述预存语音信息之间的匹配度;

将与所述语音信息之间的匹配度大于或等于所述第一匹配度的所述预存语音信息作为匹配的所述预存语音信息。

可选地,所述将与所述语音信息之间的匹配度大于或等于所述第一匹配度的所述预存语音信息作为匹配的所述预存语音信息的步骤包括:

在所述移动终端包括多个与所述语音信息之间的匹配度大于或等于所述第一匹配度的所述预存语音信息时,将与所述语音信息之间的匹配度最大的所述预设语音信息作为匹配的所述预存语音信息。

可选地,所述将与所述语音信息之间的匹配度大于或等于所述第一匹配度的所述预存语音信息作为匹配的所述预存语音信息的步骤包括:

在所述移动终端包括多个与所述语音信息之间的匹配度大于或等于所述第一匹配度的所述预存语音信息时,将与所述语音信息之间的匹配度大于或等于所述第一匹配度的预设语音信息中触发次数最多的所述预设语音信息作为匹配的所述预存语音信息。

可选地,所述识别所述语音信息对应的语音内容,并获取与所述语音内容匹配的预存语音内容关联的所述快捷操作的步骤之前,还包括:

在接收到所述语音信息后,获取所述语音信息对应的声纹特征;

在所述声纹特征与预设声纹特征之间匹配度大于或等于第二预设匹配度时,执行所述识别所述语音信息对应的语音内容,并获取与所述语音内容匹配的预存语音内容关联的所述快捷操作的步骤。

可选地,所述预存语音信息与所述快捷操作之间的关联关系,和/或所述预存语音内容与所述快捷操作之间的关联关系保存在网络服务器中。

可选地,所述语音控制方法还包括:

快捷语音设置界面下,接收预设信息,其中,所述预设信息包括预设语音信息及/或预设语音内容,其中,所述预设语音内容根据在所述快捷语音设置界面下接收到的语音信息确定;

获取用户选定的所述快捷操作;

将所述预设语音信息及/或预设语音内容与所述快捷操作关联保存。

此外,为实现上述目的,本发明还提供一种移动终端,所述移动终端包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的移动终端的控制程序,所述移动终端的控制程序被所述处理器执行时实现如上所述的语音控制方法的步骤。

此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有移动终端的控制程序,所述移动终端的控制程序被处理器执行时实现如上所述的语音控制方法的步骤。

本发明实施例提出的一种语音控制方法、移动终端及计算机可读存储介质,可以无需预先输入唤醒关键词,再对移动终端进行语音控制,而直接通过语音信息对移动终端进行控制。由于可以根据接收到的语音信息与预设语音信息之间的匹配度确定目标语音信息,并获取目标语音信息关联的快捷操作作为所述语音信息对应的快捷操作,从而使得移动终端可以根据所述语音信息确定控制者的身份的同时,直接通过控制指令控制移动终端,这样达成了在提高语音控制的安全性的同时,简化语音控制的步骤的效果。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图;

图2为本发明语音控制方法一实施例的流程示意图;

图3为本发明另一实施例的流程示意图;

图4为本发明又一实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

由于现有的具备语音控制功能的移动终端在进行语音控制时,需要用户先输入终端设备的语音唤醒词,然后在判定语音唤醒词合法时,再唤醒移动终端,以供移动终端接收语音控制指令,并根据接收到的语音控制指令控制设备执行相应动作。这样存在语音控制步骤繁琐的缺点。

为解决上述缺陷,本发明实施例提出一种语音控制方法,主要解决方案是:

获取当前接收到的语音信息对应的快捷操作;

控制移动终端执行所述快捷操作。

本发明实施例提供的语音控制方法、移动终端及计算机可读存储介质,由于可以无需预先输入唤醒关键词,再对移动终端进行语音控制,而直接通过语音信息对移动终端进行控制。由于可以根据接收到的语音信息与预设语音信息之间的匹配度确定目标语音信息,并获取目标语音信息关联的快捷操作作为所述语音信息对应的快捷操作,从而使得移动终端可以根据所述语音信息确定控制者的身份的同时,直接通过控制指令控制移动终端,这样达成了在提高语音控制的安全性的同时,简化语音控制的步骤的效果。

如图1所示,图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。

本发明实施例终端可以是智能手机等终端设备。

如图1所示,该终端可以包括:处理器1001,例如cpu,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard)、鼠标等,可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及移动终端的控制程序。

在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;处理器1001可以用于调用存储器1005中存储的移动终端的控制程序,并执行以下操作:

获取当前接收到的语音信息对应的快捷操作;

控制移动终端执行所述快捷操作。

进一步地,处理器1001可以调用存储器1005中存储的移动终端的控制程序,还执行以下操作:

获取与所述语音信息匹配的预存语音信息关联的所述快捷操作;

或者,识别所述语音信息对应的语音内容,并获取与所述语音内容匹配的预存语音内容关联的所述快捷操作。

进一步地,处理器1001可以调用存储器1005中存储的移动终端的控制程序,还执行以下操作:

确定所述语音信息与每一所述预存语音信息之间的匹配度;

将与所述语音信息之间的匹配度大于或等于所述第一匹配度的所述预存语音信息作为匹配的所述预存语音信息。

进一步地,处理器1001可以调用存储器1005中存储的移动终端的控制程序,还执行以下操作:

在所述移动终端包括多个与所述语音信息之间的匹配度大于或等于所述第一匹配度的所述预存语音信息时,将与所述语音信息之间的匹配度最大的所述预设语音信息作为匹配的所述预存语音信息。

进一步地,处理器1001可以调用存储器1005中存储的移动终端的控制程序,还执行以下操作:

在所述移动终端包括多个与所述语音信息之间的匹配度大于或等于所述第一匹配度的所述预存语音信息时,将与所述语音信息之间的匹配度大于或等于所述第一匹配度的预设语音信息中触发次数最多的所述预设语音信息作为匹配的所述预存语音信息。

进一步地,处理器1001可以调用存储器1005中存储的移动终端的控制程序,还执行以下操作:

在接收到所述语音信息后,获取所述语音信息对应的声纹特征;

在所述声纹特征与预设声纹特征之间匹配度大于或等于第二预设匹配度时,执行所述识别所述语音信息对应的语音内容,并获取与所述语音内容匹配的预存语音内容关联的所述快捷操作的步骤。

进一步地,处理器1001可以调用存储器1005中存储的移动终端的控制程序,还执行以下操作:

在快捷语音设置界面下,接收预设信息,其中,所述预设信息包括预设语音信息及/或预设语音内容,其中,所述预设语音内容根据在所述快捷语音设置界面下接收到的语音信息确定;

获取用户选定的所述快捷操作;

将所述预设语音信息及/或预设语音内容与所述快捷操作关联保存。

参照图2,在本发明语音控制方法的一实施例中,所述语音控制方法包括以下步骤:

步骤s10、获取当前接收到的语音信息对应的快捷操作;

步骤s20、控制移动终端执行所述快捷操作。

在本实施例中,在现有的移动终端的语音控制方法中,用户需要先输入唤醒词,通过唤醒词唤醒移动终端的语音控制功能后,才能向移动终端输入控制语音,进而通过控制语音控制移动终端。

示例性地,以小米手机为例,当需要通过语音控制小米手机时,需要先向手机输入内容为“小爱同学”的语音信息。当手机接收到包含“小爱同学”的语音内容的语音信息时,唤醒手机,并接收用户后续输入的语音。并在对语音进行识别后,根据识别内容确定对应的操作,并控制手机执行所述对应操作。由于每次控制移动终端均需要先输入包换唤醒词的语音信息,通过包含唤醒词的语音信息唤醒移动终端后,才能进行语音控制。这样存在语音控制步骤繁琐的缺陷。

本发明提出的技术方案可以在接收到语音信息时,直接获取所述语音信息对应的快捷操作。

具体地,移动终端可以设置有语音接收装置,当所述语音接收装置接收到语音信息时,移动终端可以将所述语音信息与预存语音信息进行匹配,以确定当前接收到的语音信息与预存语音信息之间的匹配度。

可以理解的是,所述移动终端中预先保存了至少一个预设语音信息,当所述移动终端中保存有多个预设语音信息时,移动终端可以将所述语音信息与多个预设语音信息逐一进行匹配,以获取当前接收到的语音信息与每一预设语音信息之间的匹配度。

需要说明的是,所述语音信息为语音接收装置对当前环境声波进行声电转换后的音频文件。所述语音信息为预先保存在移动终端中的音频文件。因此,移动终端可以通过音频处理算法,提取所述语音信息的语音特征,以及所述预设语音信息的语音特征。其中,所述语音特征包括但不限于音调、音色、音频及/或音频文件的dm5值(校检值)等语音特征。

其中,所述语音信息与所述预设语音信息之间的匹配度可以根据以下公式计算:

其中,m为语音信息与所述预设语音信息之间的匹配度;i为提取的语音特征的子特征的个数;pi为第i个子特的权重值;mi为所述语音信息与所述预设语音信息之间的第i个子特征之间的相似度。

当提取到所述语音信息与所述预设语音信息的语音特征时,可以根据所述语音信息与预设语音信息的语音的特征之间的每一子特之间的相似度,确定所述语音信息与预设语音信息之间的匹配度。

进一步地,当获取到所述语音信息与预设语音信息之间的匹配度时,判断所述移动终端中是否存在与所述语音信息之间的匹配度大于或等于第一匹配度的预设语音信息。其中,所述第一匹配度为预设的匹配度阈值,可以预先保存在所述移动终端中。

当所述移动终端中不存在与所述语音信息之间的匹配度大于或等于第一匹配度的预设语音信息时,判定当前接收到的语音信息为无效语音信息。移动终端可以不作任何响应。或者也可以输出语音信息输入错误的提示信息,以提示用户重新输入语音信息。

当所述移动终端中仅存在一个与所述语音信息之间的匹配度大于或等于第一匹配度的预设语音信息时,获取所述预设语音信息关联的快捷操作,作为所述语音信息对应的快捷操作。

当所述移动终端中存在多个与所述语音信息之间的匹配度大于或等于第一匹配度的预设语音信息时,将与所述语音信息之间的匹配度大于或等于第一匹配度多个预设语音信息中,与所述语音信息之前的匹配度最大的预设语音信息作为目标语音信息,并获取所述目标语音信息关联的快捷操作,作为所述语音信息对应的快捷操作。或者,当所述移动终端中存在多个与所述语音信息之间的匹配度大于或等于第一匹配度的预设语音信息时,获取与所述语音信息之间的匹配度大于或等于第一匹配度的多个预设语音信息中,每一预设语音信息的触发次数,其中,所述触发次数为所述预设语音信息关联的快捷操作被移动终端执行的次数。然后选取所述触发次数最多的预设语音信息作为所述目标语音信息,并获取所述目标语音信息关联的快捷操作,作为所述语音信息对应的快捷操作。

进一步地,当获取到所述语音信息对应的快捷操作时,控制移动终端执行所述快捷操作。示例性地,所述快捷操作可以是打开移动终端中已安装的应用程序、播放移动终端中已保存的媒体文件及/或给预设用户拨打电话等操作。

需要说明的是,所述快捷操作时用户预先设定的操作,可以是移动中的可执行的操作中的任一操作。在此,本实施例对所述快捷操作不作具体限定。

在本实施例公开的技术方案中,可以无需预先输入唤醒关键词,再对移动终端进行语音控制,而直接通过语音信息对移动终端进行控制。由于可以根据接收到的语音信息与预设语音信息之间的匹配度确定目标语音信息,并获取目标语音信息关联的快捷操作作为所述语音信息对应的快捷操作,从而使得移动终端可以根据所述语音信息确定控制者的身份的同时,直接通过控制指令控制移动终端,这样达成了在提高语音控制的安全性的同时,简化语音控制的步骤的效果。

参照图3,基于上述实施例,在另一实施例中,所述步骤s10包括:

步骤s11、识别所述语音信息对应的语音内容,并获取与所述语音内容匹配的预存语音内容关联的所述快捷操作;

在本实施例中,当接收到一语音信息时,可以先对所述语音信息进行语音识别,以确定所述语音信息对应的语音内容。例如,在接收到一语音信息时,先通过语音识别算法将所述语音信息转换为文本信息,并将所述文本信息作为所述语音信息对应的语音内容。

然后在所述语音内容与预设语音内容相同时,获取所述语音内容关联的快捷操作,作为所述语音信息对应的快捷操作。

示例性地,当接收到一语音信息时,对所述语音信息进行语音识别,获取所述语音信息对应的语音内容,当所述语音内容为“打开爱奇艺”,获取移动终端或服务器中预存的“打开爱奇艺”这一预存语音内容关联的快捷操作,其中,“打开爱奇艺”关联的快捷操作可以是打开应用软件“爱奇艺”。当移动终端为保存“打开爱奇艺”这一预存语音内容是,移动终端不作任何响应,或者输出语音内容无法识别的提示信息。

当根据语音信息确定的语音内容为“1”时,可以移动终端或者服务器中保存的“1”关联的快捷操作,例如,“1”关联的快捷操作可以是打电话给预设用户。

可选地,在所述步骤s11之前,还包括:

步骤s30、在接收到所述语音信息后,获取所述语音信息对应的声纹特征;

步骤s40、判断所述声纹特征与预设声纹特征之间匹配度是否大于或等于第二预设匹配度;

在本实施方式中,当接收到一语音信息时,先提取所述语音信息对应的声纹特征,并对比所述声纹特征与预设声纹特征。根据对比结果确定所述声纹特征与预设声纹特征之间的匹配度。其中,所述预设声纹特征为预先保存在移动终端中的用户声纹特征。由于声纹不仅具有特定性,而且有相对稳定性的特点。成年以后,人的声音可保持长期相对稳定不变。无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹却始终相同。基于声纹的这两个特点,通过声纹鉴定技术进行检验对比,可以确定当前输入语音信息的用户是否具有控制移动终端的权限。

当所述声纹特征与预设特征匹配度大于或等于第二匹配度时,判定当前输入语音信息的用户为拥护移动终端控制权限的用户,从而可以执行所述步骤s11。

在当前接收到的语音信息对应的声纹特征与预设声纹特征的匹配度小于第二匹配度时,判定当前输入语音信息的用户不具备移动终端的控制权限,从而使移动终端对所述语音信息不作任何响应。这样达成了提高移动终端在语音控制时的安全性的效果。

在本实施例公开的技术方案中,在接受到语音信息时,可以直接根据语音信息对应的快捷操作控制移动终端,由于可以在不输入唤醒关键词的前提下,直接通过语音信息控制移动终端,这样达成了简化语音控制步骤的效果。

参照图4,基于上述任一实施例,在又一实施例中,所述步骤s10之前,还包括:

步骤s50、在快捷语音设置界面下,接收预设信息,其中,所述预设信息包括预设语音信息及/或预设语音内容,其中,所述预设语音内容根据在所述快捷语音设置界面下接收到的语音信息确定;

步骤s60、获取用户选定的所述快捷操作;

步骤s70、将所述预设语音信息及/或预设语音内容与所述快捷操作关联保存。

在本实施例中,在移动终端的设置页面内设置有快捷语音设置控件,当所述快捷语音设置控件被触发时,移动终端可以进入快捷语音设置界面。

当所述移动终端处于所述快捷语音设置界面下时,可以通过快捷语音设置界面中的语音录制按钮录制控制移动终端录制所述预设语音。或者通过语音内容输入框输入所述预设语音内容。

进一步地,移动终端接收到用户录制的预设语音,和/或获取到用不输入的预设语音内容时,可以显示快捷操作列表,以使用户可以通过所述快捷操作列表选定所述预设语音和/或预设语音内容关联的快捷操作。

在本实施例公开的技术方案中,先在快捷语音设置界面下,接收预设信息,然后获取所述预设信息对应的快捷操作,最后将所述预设信息与所述快捷操作关联保存,以在进行快捷语音控制时,根据所述预设信息确定所述快捷操作。这样达成了自定义设置语音信息对应的快捷操作的效果。

此外,本发明实施例还提出一种移动终端,所述移动终端包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的移动终端的控制程序,所述移动终端的控制程序被所述处理器执行时实现如上各个实施例所述的语音控制方法的步骤。

此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有移动终端的控制程序,所述移动终端的控制程序被处理器执行时实现如上各个实施例所述的语音控制方法的步骤。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是智能手机、平板电脑等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1