语音处理方法和装置、电子设备、计算机可读存储介质与流程

文档序号:14995109发布日期:2018-07-24 09:26阅读:279来源:国知局
技术简介:
本专利针对智能终端在语音交互模式下资源管理效率低的问题,提出基于电量数据动态匹配应用程序集合的解决方案。通过检测设备电量状态(如充电/剩余电量阈值)智能筛选可用应用,并结合声纹识别验证用户权限,确保语音指令精准执行目标应用,从而提升操作效率与能耗控制。
关键词:语音交互,电量管理

本申请涉及计算机技术领域,特别是涉及一种语音处理方法和装置、电子设备、计算机可读存储介质。



背景技术:

用户可以通过输入操作指令对电子设备进行操作,该操作指令可以为物理按键指令、手势操作指令、语音操作指令等。语音操作具有操作简便、输入效率高等优点。然而,由于使用电子设备时的语音环境复杂以及语音难以准确采集等问题,因此在通过语音操作电子设备的过程中,通常难以精准地定位用户的需求,导致电子设备的操作效率很低。



技术实现要素:

本申请实施例提供一种语音处理方法和装置、电子设备、计算机可读存储介质,可以提高智能终端的操作效率。

一种语音处理方法,包括:

在电子设备开启语音交互模式的情况下,获取所述电子设备的电量数据;

根据所述电量数据获取所述语音交互模式对应的应用程序集合,所述应用程序集合中包括一个或多个应用程序;

获取语音指令,并从所述应用程序集合中获取用于执行所述语音指令的目标应用程序;

控制所述目标应用程序根据所述语音指令进行对应的操作。

一种语音处理装置,包括:

电量获取模块,用于在电子设备开启语音交互模式的情况下,获取所述电子设备的电量数据;

应用获取模块,用于根据所述电量数据获取所述语音交互模式对应的应用程序集合,所述应用程序集合中包括一个或多个应用程序;

指令获取模块,用于获取语音指令,并从所述应用程序集合中获取用于执行所述语音指令的目标应用程序;

应用操作模块,用于控制所述目标应用程序根据所述语音指令进行对应的操作。

一种电子设备,包括存储器及处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:

在电子设备开启语音交互模式的情况下,获取所述电子设备的电量数据;

根据所述电量数据获取所述语音交互模式对应的应用程序集合,所述应用程序集合中包括一个或多个应用程序;

获取语音指令,并从所述应用程序集合中获取用于执行所述语音指令的目标应用程序;

控制所述目标应用程序根据所述语音指令进行对应的操作。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行如下步骤:

在电子设备开启语音交互模式的情况下,获取所述电子设备的电量数据;

根据所述电量数据获取所述语音交互模式对应的应用程序集合,所述应用程序集合中包括一个或多个应用程序;

获取语音指令,并从所述应用程序集合中获取用于执行所述语音指令的目标应用程序;

控制所述目标应用程序根据所述语音指令进行对应的操作。

上述语音处理方法和装置、电子设备、计算机可读存储介质,电子设备可以进行模式切换,在电子设备开启语音交互模式的情况下,可以获取电子设备的电量数据,并根据电量数据获取语音交互模式对应的应用程序集合。然后根据获取的语音指令从应用程序集合中获取用于执行该语音指令的目标应用程序,然后控制目标应用程序根据语音指令进行对应的操作。这样在需要通过语音进行交互控制的时候,用户可以将电子设备切换到语音交互模式下,然后通过输入语音指令对应用程序进行控制,提高了电子设备的操作效率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为一个实施例中语音处理方法的应用环境示意图;

图2为另一个实施例中语音处理方法的应用环境示意图;

图3为一个实施例中语音处理方法的流程图;

图4为另一个实施例中语音处理方法的流程图;

图5为又一个实施例中语音处理方法的流程图;

图6为又一个实施例中语音处理方法的流程图;

图7为又一个实施例中语音处理方法的流程图;

图8为一个实施例的语音处理装置的结构框图;

图9为另一个实施例的语音处理装置的结构框图;

图10为与本申请实施例提供的电子设备相关的手机的部分结构的框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本申请的范围的情况下,可以将第一客户端称为第二客户端,且类似地,可将第二客户端称为第一客户端。第一客户端和第二客户端两者都是客户端,但其不是同一客户端。

图1为一个实施例中语音处理方法的应用环境示意图。如图1所示,该应用环境包括终端102和服务器104。其中,终端102中可以从服务器104中获取应用程序的安装包,然后根据该安装包安装应用程序。终端102中可以进行模式的切换,当终端102开启语音交互模式时,会根据电量数据获取语音交互模式对应的应用程序集合。然后终端102在接收到语音指令时,从应用程序集合中获取用于执行该语音指令的目标应用程序;并控制目标应用程序根据语音指令进行对应的操作。终端102在根据语音指令进行对应的操作的过程中,可以向服务器104发起应用请求,并根据发起的应用请求来完成操作。其中,终端102为处于计算机网络最外围,主要用于输入用户信息以及输出处理结果的电子设备,例如可以是个人电脑、移动终端、个人数字助理、可穿戴电子设备等。服务器104是用于响应服务请求,同时提供计算服务的设备。可以理解的是,服务器104可以为一个服务器集群,即服务器104可以包含一台或者多台计算机。可以理解的是,本申请提供的其他实施例中,该语音处理方法的应用环境可以只包含终端102。

图2为另一个实施例中语音处理方法的应用环境示意图。如图2所示,该应用环境包括用户202和终端204。用户202可以对终端204的模式进行切换,还可以通过终端204输入语音信息,终端204在采集到语音信息后,将语音信息进行解析,生成语音指令。当终端204开启语音交互模式时,获取语音交互模式对应的应用程序集合。然后根据用户202输入的语音信息生成语音指令,并从应用程序集合中获取用于执行语音指令的目标应用程序。最后控制目标应用程序根据语音指令进行对应的操作。

图3为一个实施例中语音处理方法的流程图。本实施例中的语音处理方法,以运行于图1或图2中的终端上为例进行描述。如图3所示,该语音处理方法包括步骤302至步骤308。其中:

步骤302,在电子设备开启语音交互模式的情况下,获取电子设备的电量数据。

用户在使用电子设备的过程中,可以通过输入操作指令来实现对电子设备的操作。具体地,该操作指令可以是触控操作、物理按键的按压操作、语音控制操作或对移动终端的晃动操作等触发操作。电子设备在检测到操作指令后,根据操作指令来进行相应的操作。例如,电子设备检测到用户按压音量调节键后,根据按压的音量调节键的次数来加大或减小当前音量值。由于电子设备在使用过程中语音环境复杂,因此一般会通过开关来控制语音的输入,在需要的时候才会通过语音来实现对电子设备的控制。

语音交互模式是指用户可以通过发出语音对电子设备进行控制的模式。例如,在语音交互模式下,用户可以对着电子设备说“查询天气”,电子设备接收到该语音信息后,就可以根据该语音信息将天气APP(Application,应用程序)打开,通过该天气APP查询天气,并将查询结果反馈给用户。可以理解的是,在语音交互模式下,并不仅限于通过语音对电子设备进行控制,还可以同时通过触控操作、物理按键的按压操作、晃动操作等对电子设备进行控制。

其中,应用程序是指电子设备中针对某种应用目的所撰写的软体,电子设备可以通过应用程序实现对用户的需求服务。例如,用户可以通过游戏类应用程序玩游戏,也可以通过视频类应用程序看视频,还可以通过音乐类应用程序播放音乐等。应用程序可以根据运行的状态分为前台应用程序和后台应用程序。前台应用程序是指在电子设备的前台运行的应用程序,前台应用程序可以在与在前台显示并与用户实现交互。后台应用程序是指在电子设备的后台运行的应用程序,后台应用程序一般不能在前台显示并与用户实现交互过程。一般地,应用程序的应用操作是由一个或多个进程(process)来共同完成,进程是是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位。

电量数据是表示电子设备的电量使用情况的数据,根据电量数据可以获取电子设备的电量使用情况。例如,可以根据电量数据检测到电子设备是否处于充电状态,也可以根据电量数据来计算电子设备当前的剩余电量,或者根据电量数据可以统计电子设备在一段时间内所使用的总电量。

步骤304,根据电量数据获取语音交互模式对应的应用程序集合,该应用程序集合中包括一个或多个应用程序。

应用程序集合是指应用程序的集合,其中包含一个或多个应用程序。在语音交互模式下,应用程序集合中包含的应用程序可以通过语音进行控制。预先建立语音交互模式与应用程序集合的对应关系,当电子设备开启语音交互模式时,就可以获取语音交互模式对应的应用程序。电子设备中可以存储语音交互模式对应的应用列表,该应用列表中包含一个或多个应用标识,每一个应用标识用于唯一标示一个应用程序。根据该应用列表就可以获取语音交互模式对应的应用程序集合。

电量数据可以反映电子设备的电量使用情况,根据电量数据获取应用程序集合,也即可以根据电子设备的电量使用情况来获取应用程序集合。例如,在电量较低的情况下,可以根据耗电量较低的应用程序组成应用程序集合,使得只能通过语音控制耗电量较低的应用程序,而不能控制耗电量高的应用程序,以减少电子设备的功耗。

步骤306,获取语音指令,并从应用程序集合中获取用于执行语音指令的目标应用程序。

在一个实施例中,语音指令是指根据语音转换得到的可以操作应用程序的指令。具体地,电子设备中可以安装语音采集器件,通过该语音采集器件可以采集用户输入的语音信息,将用户输入的语音信息转换为电信号。然后电子设备可以将转换的电信号进行语音数字编码识别和语义理解,生成语音指令。该语音指令中包含目标应用标识、操作信息等内容,目标应用标识是指目标应用程序的唯一标识,目标应用程序是指执行该语音指令的应用程序,操作信息是指用于指示目标应用程序进行相应操作的信息。

电子设备在接收到语音指令后,会将语音指令中的目标应用标识与应用列表中的应用标识一一进行对比,若检测到应用列表中存在与目标应用标识相匹配的应用标识,则说明应用程序集合中存在用于执行该语音指令的目标应用程序,即可以从应用程序集合中获取用于执行语音指令的目标应用程序,并通过目标应用程序对该语音指令进行处理。若应用列表中不存在与目标应用标识相匹配的应用标识,则说明应用程序集合中不存在用于执行该语音指令的目标应用程序。

步骤308,控制目标应用程序根据语音指令进行对应的操作。

语音指令中包含操作信息,目标应用程序可以根据语音指令中的操作信息来执行对应的操作。例如,用户可以说“播放歌曲”,电子设备接收到用户输入的语音信息后,就可以对语音信息进行解析得到需要进行的操作为播放歌曲,可以播放歌曲的应用程序为音乐APP。然后电子设备生成语音指令,并控制目标应用程序根据语音指令进行对应的操作。

上述实施例提供的语音处理方法,电子设备可以进行模式切换,在电子设备开启语音交互模式的情况下,可以获取电子设备的电量数据,并根据电量数据获取语音交互模式对应的应用程序集合。然后根据获取的语音指令从应用程序集合中获取用于执行该语音指令的目标应用程序,然后控制目标应用程序根据语音指令进行对应的操作。这样在需要通过语音进行交互控制的时候,用户可以将电子设备切换到语音交互模式下,然后通过输入语音指令对应用程序进行控制,提高了电子设备的操作效率。

图4为另一个实施例中语音处理方法的流程图。本实施例中的语音处理方法,以运行于图1或图2中的终端上为例进行描述。如图4所示,该语音处理方法包括步骤402至步骤416。其中:

步骤402,接收模式开启指令,根据模式开启指令开启电子设备的语音交互模式。

在一个实施例中,电子设备可以是默认为处于语音交互模式的,也可以是在接收到模式开启指令后,根据模式开启指令切换到语音交互模式的。接收模式开启指令具体可以包括:采集用户输入的模式开启语音信息,根据该模式开启语音信息生成模式开启指令;采集用户输入的模式开启手势信号,根据该模式开启手势信号生成模式开启指令;采集用户的人脸图像,根据该人脸图像生成模式开启指令;采集用户的人脸图像,并根据该人脸图像识别表情特征,根据表情特征生成模式开启指令;接收用户通过模式开启界面输入的模式开启指令。其中,模式开启界面是指电子设备中可以输入模式开启指令的界面。例如,模式开启界面可以是手机菜单设置界面,也可以是专门用于开启语音交互模式的应用程序的交互界面,在本实施例中不进行限定。

具体地,当电子设备开启语音交互模式时,电子设备可以采集语音信息,并根据语音信息对电子设备进行操作。例如,用户可以通过输入语音信息,使电子设备实现音乐播放、智能家居控制、听书听新闻、天气查询、音量调节、设置闹钟等操作。

步骤404,在电子设备开启语音交互模式的情况下,获取电子设备的电量数据。

步骤406,根据电量数据获取语音交互模式对应的应用程序集合,该应用程序集合中包括一个或多个应用程序。

当电子设备开启语音交互模式时,可以根据电量数据获取语音交互模式对应的应用程序集合,该应用程序集合中的应用程序被允许用户通过语音进行控制。预先建立电量数据、模式标识与应用列表的对应关系,电子设备可以通过模式标识对电子设备当前所处的模式进行记录。当电子设备处于语音交互模式时,则获取电量数据。然后根据电量数据和模式标识获取对应的应用列表,根据该应用列表获取应用程序集合。可以理解的是,该应用程序集合可以包含电子设备中所安装的所有应用程序,也可以包含电子设备中所安装的部分应用程序,在本实施例中不做限定。

步骤408,接收用户输入的语音信息,并对语音信息进行声纹识别。

在一个实施例中,语音信息是指用户输入的语音数据,电子设备可以通过麦克风等语音采集器件对语音信息进行采集。声纹识别(Voiceprint Recognition,VPR)是指通过语音信息辨认说话人的过程,根据声纹识别可以辨别输入语音信息的用户。常用的声纹识别算法包括PLDA(Probabilistic Linear Discriminant Analysis,概率线性判别分析)算法、GMM-UBM(Gaussian mixture model-Universal Background Model,高斯混合模型-通用背景模型)算法等,在本实施例中不限定。

可以理解的是,用户输入的语音信息中还可以包括设备标识,当电子设备接收到语音信息之后,可以提取该语音信息的关键词。若提取的关键词中包含该电子设备对应的设备标识,则再对语音信息进行声纹识别。例如,设备标识可以为“呀咪”,当电子设备采集到语音信息后,若提取的语音信息的关键词中包含“呀咪”,则认为该语音信息为控制电子设备的信息,则将该语音信息进行声纹识别。

步骤410,当根据声纹识别结果确定用户具有语音操作权限,则根据语音信息生成语音指令,语音操作权限是指允许用户通过语音对应用程序进行操作的权限。

语音操作权限是指允许用户通过语音对应用程序进行操作的权限。具体地,电子设备在采集到语音信息之后,可以对语音信息进行声纹识别,根据声纹识别结果可以得到输入该语音信息的用户的用户标识。电子设备可以预先建立用户标识和权限标识的对应关系,用户标识可以唯一标示一个用户,权限标识用于标示是否允许用户通过语音对应用程序进行操作。根据用户标识即可获取对应的权限标识,根据权限标识可以确定该用户是否具有语音操作权限。若该用户具有语音操作权限,则将语音信息进行解析,根据语音信息生成语音指令。

步骤412,从应用程序集合中获取用于执行语音指令的目标应用程序。

电子设备在采集到语音信息之后,会对语音信息进行语音识别和语义理解等处理,以识别用户需要通过语音信息进行的操作。然后获取目标应用程序,并通过目标应用程序来完成相应的操作。例如,用户说“将闹钟设置为7:00”,那么电子设备解析语音信息之后,就可以通过调用闹钟APP,将闹钟设置为7:00。

步骤414,从应用程序集合中获取至少一个待操作应用程序,并根据获取的待操作应用程序生成待操作应用程序集合,待操作应用程序为允许输入语音信息的用户通过语音进行操作的应用程序。

在一个实施例中,若用户具有语音操作权限,则还可以进一步将用户进行分类,不同用户可操作的应用程序不同。例如,手机的机主具有最大权限,可以操作应用程序集合中的所有应用程序。机主的直系亲属具有较大的权限,可以操作大部分的应用程序。机主的其他亲戚和朋友具有较小的权限,可以操作一小部分的应用程序。这样进行权限管理,可以保证电子设备的安全性。

步骤416,若目标应用程序为待操作应用程序集合的应用程序,则控制目标应用程序根据语音指令进行对应的操作。

具体地,当获取到目标应用程序之后,可以从应用程序集合中获取至少一个待操作应用程序,然后根据待操作应用程序生成待操作应用程序集合。其中,待操作应用程序为允许输入语音信息的用户通过语音进行操作的应用程序。例如,识别输入该语音信息的用户为机主,那么待操作应用程序就可以为应用程序集合中全部的应用程序。若识别输入该语音信息的用户非机主,那么待操作应用程序就可以为应用程序集合中的部分应用程序。

将目标应用程序与待操作应用程序集合中的应用程序进行比较,若根据语音指令获取的目标应用程序为待操作应用程序集合中的应用程序,说明该用户具有对目标应用程序进行语音操作的权限,则可以控制目标应用程序根据语音指令进行对应的操作。否则,说明该用户没有对该目标应用程序进行语音操作的权限,则可以禁止用户对目标应用程序的操作,并在电子设备的界面上提示用户没有操作权限。

在一个实施例中,获取应用程序集合的方法具体可以包括:

步骤502,根据电量数据检测电子设备是否处于充电状态。

在本申请提供的实施例中,为避免电子设备的耗电量过高,则可以根据电子设备的电量情况来获取不同的应用程序集合。检测电子设备的电量情况有多种方式,例如,可以根据电子设备当前是否处于充电状态来进行判断,也可以根据电子设备的当前剩余电量来进行判断。当电子设备处于充电状态或当前剩余电量高于某个值时,说明电子设备有足够的电量。具体地,当电子设备有足够电量时,可以通过语音控制较多的应用程序;当电子设备的电量不足时,只能通过语音控制耗电量较低的应用程序。

具体地,电子设备在充电开始时,电池管理器会通过广播发送电池的充电详情。当电子设备的充电状态发生改变时,电池管理器同样会通过广播来发送电池设备的充电详情。在需要检测电子设备是否处于充电状态时,直接调用广播接收器就可以进行检测。例如,在Android系统中,可以通过BatteryManager(电池管理器)来发送广播,通过调用registerReceiver(广播接收器)就可以判断电子设备是否处于充电状态。

步骤504,若是,则获取语音交互模式对应的第一应用程序集合。

步骤506,若否,则获取语音交互模式对应的第二应用程序集合。

具体地,根据电量数据检测电子设备是否处于充电状态,根据检测结果获取语音交互模式的应用程序集合。若电子设备处于充电状态,认为电子设备的电量充足,则可以获取语音交互模式对应的第一应用程序集合;若电子设备未处于充电状态,认为电子设备的电量不足,则可以获取语音交互模式对应的第二应用程序集合。

其中,第一应用程序集合与第二应用程序集合的关系可以为:第一应用程序集合为第二应用程序集合的子集,或第二应用程序集合为第一应用程序集合的子集,或第一应用程序集合与第二应用程序集合相等,在本实施例中不具体限定。第一应用程序集合和第二应用程序集合可以分别由不同应用类型的应用程序组成的。例如,第一应用程序集合可以是由游戏类、视频类、即时通讯类应用程序组成的应用程序集合,第二应用程序集合可以是由工具类、社交类应用程序组成的引用集合。第一应用程序集合和第二应用程序集合可以分别由不同应用优先级的应用程序组成的。例如,可以将电子设备的应用程序分为五个应用优先级,第一应用程序集合可以是由1-3级应用程序组成的应用程序集合,第二应用程序集合可以是由4-5级应用程序组成的应用程序集合。

电子设备中应用程序在运行过程中会产生耗电,电子设备会将各个应用程序的耗电量进行统计,一般应用程序的运行时间越长,资源占用率越高,耗电量越高。例如,在Android系统中,framework(框架)层中有一个专门用于统计电量的Service(服务):BatteryStatsSerive。该BatteryStatsSerive服务可以在ActivityManagerService中创建,ActivityManagerService会对电子设备中的各个模块数据存放到系统目录batterystats.bin文件中,然后通过数据分析器BatteryStatsImpl来分析电量数据,从而实现对耗电量的统计。

在一个实施例中,第二应用程序集合为第一应用程序集合的子集,电子设备可以将第一应用程序集合中的应用程序的历史耗电量进行统计,并根据第一应用程序集合中历史耗电量低于耗电阈值的应用程序生成第二应用程序集合。具体地,历史耗电量是指应用程序在历史运行过程中所消耗的电量,可以通过百分比的形式进行表示,则电子设备中的所有应用程序的历史耗电量加起来等于100%。可以理解的是,电子设备在统计各个应用程序的耗电量时,会将各个应用程序的历史耗电量与应用标识建立对应关系,根据应用标识就可以获取应用程序对应的历史耗电量。

在本申请提供的实施例中,获取应用程序集合的方法具体还可以包括:

步骤602,根据电量数据确定电子设备的当前剩余电量。

电子设备还可以通过电子设备的当前剩余电量来判断电量是否充足。一般来说,当前剩余电量大于某个值时,认为电子设备的电量充足;当前剩余电量小于某个值是,认为电子设备的电量不足。然后根据电子设备的当前剩余电量来获取应用程序集合。可以理解的是,电子设备可以是在开启语音交互模式之后,直接获取当前剩余电量,然后根据当前剩余电量来获取应用程序集合。也可以是在开启语音交互模式之后,检测电子设备是否处于充电状态,若否,则根据电子设备的当前剩余电量来获取应用程序集合。

步骤604,当该当前剩余电量大于或等于电量阈值时,获取语音交互模式对应的第三应用程序集合。

步骤606,当该当前剩余电量小于电量阈值时,获取语音交互模式对应的第四应用程序集合。

在一个实施例中,获取电子设备的当前剩余电量,根据当前剩余电量获取语音交互模式的应用程序集合。当前剩余电量大于或等于电量阈值时,可以获取语音交互模式对应的第三应用程序集合;当前剩余电量小于电量阈值时,可以获取语音交互模式对应的第四应用程序集合。一般地,第三应用程序集合是电子设备预先设置好的,第四应用程序集合可以是预先设置好的,也可以是根据当前剩余电量动态生成的。

第三应用程序集合与第四应用程序集合的关系可以为:第三应用程序集合为第四应用程序集合的子集,或第四应用程序集合为第三应用程序集合的子集,或第三应用程序集合与第四应用程序集合相等,在本实施例中不具体限定。第三应用程序集合和第四应用程序集合可以分别由不同应用类型的应用程序组成的。例如,第三应用程序集合可以是由游戏类、视频类、即时通讯类应用程序组成的应用程序集合,第四应用程序集合可以是由工具类、社交类应用程序组成的引用集合。第三应用程序集合和第四应用程序集合可以分别由不同应用优先级的应用程序组成的。例如,可以将电子设备的应用程序分为五个应用优先级,第三应用程序集合可以是由1-3级应用程序组成的应用程序集合,第四应用程序集合可以是由4-5级应用程序组成的应用程序集合。

具体地,电子设备可以预先设置当前剩余电量的耗电阈值的对应关系,当电子设备的当前剩余电量小于电量阈值时,可以根据当前剩余电量获取对应的耗电阈值,然后根据第三应用程序集合中历史耗电量低于耗电阈值的应用程序生成第四应用程序集合。一般地当前剩余电量越低,对应的耗电阈值越低。

可以理解的是,电子设备在开启语音交互模式之后,用户可以手动退出语音交互模式,也可以设置语音交互时长,通过语音交互时长控制电子设备自动退出语音交互模式。即当电子设备进入语音交互模式的时长超过语音交互时长时,电子设备退出语音交互模式。电子设备通过语音交互时长自动退出语音交互模式时,可以建立语音交互时长与电量阈值的对应关系。则步骤604之前就可以包括:获取语音交互时长,该语音交互时长为允许电子设备处于语音交互模式的时长;根据语音交互时长获取对应的电量阈值。一般地,语音交互时长越长,对应的电量阈值越大。

在一个实施例中,电子设备可以预先建立用户标识与应用标识的对应关系,然后根据用户标识获取待操作应用程序。则获取待操作应用程序的方法可以包括:

步骤702,根据声纹识别结果获取输入语音信息的用户所对应的目标用户标识,并获取目标用户标识对应的目标应用标识。

电子设备可以存储用户的语音数据库,并将语音数据库中的每一条语音信息建立一个用户标识。电子设备在采集到用户的语音信息之后,将输入的语音信息进行声纹识别,并将输入的语音信息的声纹识别结果与语音数据库中的每一条语音信息的声纹识别结果进行匹配,并获取语音数据库中匹配上的语音信息所对应的用户标识,作为目标用户标识。可以预先建立用户标识和应用标识的对应关系,再根据该对应关系获取目标用户标识对应的目标应用标识。

在一个实施例中,可以根据应用程序集合中的应用程序的应用等级,获取待操作应用程序。具体地,应用等级表示应用程序的重要程度,可以预先将应用程序集合中的应用程序划分为至少两个应用等级,并然后建立用户标识与应用等级的对应关系。获取到目标用户标识之后,可以根据目标用户标识获取对应的目标应用等级,然后获取目标应用等级对应的应用标识作为目标应用标识。

在本申请提供的实施例中,还可以根据应用程序集合中的应用程序的应用类型,获取待操作应用程序。具体地,可以预先将应用程序集合中的应用程序划分为至少两个应用类型,并然后建立用户标识与应用类型的对应关系。获取到目标用户标识之后,可以根据目标用户标识获取对应的目标应用类型,然后获取目标应用类型对应的应用标识作为目标应用标识。例如,当输入语音信息的用户为儿童时,可以禁止该用户通过语音控制游戏类应用程序。

步骤704,从应用程序集合中获取目标应用标识对应的应用程序,作为待操作应用程序。

上述实施例提供的语音处理方法,电子设备可以进行模式切换,在电子设备开启语音交互模式的情况下,可以获取电子设备的电量数据,根据电量数据获取语音交互模式对应的应用程序集合。然后根据获取的语音信息确定用户具有语音操作权限后,再从应用程序集合中获取用于执行该语音指令的目标应用程序,并控制目标应用程序根据语音指令进行对应的操作。这样在需要通过语音进行交互控制的时候,用户可以将电子设备切换到语音交互模式下,然后通过输入语音指令对应用程序进行控制,提高了电子设备的操作效率。并根据用户的语音信息识别用户的操作权限,提高电子设备操作的安全性。

应该理解的是,虽然图2至图6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2至图6中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

图8为一个实施例的语音处理装置的结构框图。如图8所示,该语音处理装置800包括电量获取模块802、应用获取模块804、指令获取模块806和应用操作模块808。其中:

电量获取模块802,用于在电子设备开启语音交互模式的情况下,获取所述电子设备的电量数据。

应用获取模块804,用于根据所述电量数据获取所述语音交互模式对应的应用程序集合,所述应用程序集合中包括一个或多个应用程序。

指令获取模块806,用于获取语音指令,并从所述应用程序集合中获取用于执行所述语音指令的目标应用程序。

应用操作模块808,用于控制所述目标应用程序根据所述语音指令进行对应的操作。

上述实施例提供的语音处理装置,电子设备可以进行模式切换,在电子设备开启语音交互模式的情况下,可以获取电子设备的电量数据,并根据电量数据获取语音交互模式对应的应用程序集合。然后根据获取的语音指令从应用程序集合中获取用于执行该语音指令的目标应用程序,然后控制目标应用程序根据语音指令进行对应的操作。这样在需要通过语音进行交互控制的时候,用户可以将电子设备切换到语音交互模式下,然后通过输入语音指令对应用程序进行控制,提高了电子设备的操作效率。

图9为另一个实施例的语音处理装置的结构框图。如图9所示,该语音处理装置900包括模式开启模块902、电量获取模块904、应用获取模块906、指令获取模块908和应用操作模块910。其中:

模式开启模块902,用于接收模式开启指令,根据所述模式开启指令开启电子设备的语音交互模式。

电量获取模块904,用于在电子设备开启语音交互模式的情况下,获取所述电子设备的电量数据。

应用获取模块906,用于根据所述电量数据获取所述语音交互模式对应的应用程序集合,所述应用程序集合中包括一个或多个应用程序。

指令获取模块908,用于获取语音指令,并从所述应用程序集合中获取用于执行所述语音指令的目标应用程序。

应用操作模块910,用于控制所述目标应用程序根据所述语音指令进行对应的操作。

上述实施例提供的语音处理装置,电子设备可以进行模式切换,在电子设备开启语音交互模式的情况下,可以获取电子设备的电量数据,并根据电量数据获取语音交互模式对应的应用程序集合。然后根据获取的语音指令从应用程序集合中获取用于执行该语音指令的目标应用程序,然后控制目标应用程序根据语音指令进行对应的操作。这样在需要通过语音进行交互控制的时候,用户可以将电子设备切换到语音交互模式下,然后通过输入语音指令对应用程序进行控制,提高了电子设备的操作效率。

在一个实施例中,应用获取模块906还用于根据所述电量数据检测所述电子设备是否处于充电状态;若是,则获取所述语音交互模式对应的第一应用程序集合;若否,则获取所述语音交互模式对应的第二应用程序集合。

在一个实施例中,应用获取模块906还用于根据所述电量数据确定所述电子设备的当前剩余电量;当所述当前剩余电量大于或等于电量阈值时,获取所述语音交互模式对应的第三应用程序集合;当所述当前剩余电量小于电量阈值时,获取所述语音交互模式对应的第四应用程序集合。

在一个实施例中,指令获取模块908还用于接收用户输入的语音信息,并对所述语音信息进行声纹识别;当根据声纹识别结果确定所述用户具有语音操作权限,则根据所述语音信息生成语音指令,所述语音操作权限是指允许用户通过语音对应用程序进行操作的权限。

在一个实施例中,应用操作模块910还用于从所述应用程序集合中获取至少一个待操作应用程序,并根据获取的待操作应用程序生成待操作应用程序集合,所述待操作应用程序为允许输入所述语音信息的用户通过语音进行操作的应用程序;若所述目标应用程序为所述待操作应用程序集合的应用程序,则控制所述目标应用程序根据所述语音指令进行对应的操作。

在一个实施例中,应用操作模块910还用于预先建立用户标识与应用标识的对应关系;根据所述声纹识别结果获取输入所述语音信息的用户所对应的目标用户标识,并获取所述目标用户标识对应的目标应用标识;从所述应用程序集合中获取所述目标应用标识对应的应用程序,作为待操作应用程序。

上述语音处理装置中各个模块的划分仅用于举例说明,在其他实施例中,可将语音处理装置按照需要划分为不同的模块,以完成上述语音处理装置的全部或部分功能。

本申请实施例中提供的语音处理装置中的各个模块的实现可为计算机程序的形式。该计算机程序可在终端或服务器上运行。该计算机程序构成的程序模块可存储在终端或服务器的存储器上。该计算机程序被处理器执行时,实现本申请实施例中所描述方法的步骤。

本申请实施例还提供了一种计算机可读存储介质。一个或多个包含计算机可执行指令的非易失性计算机可读存储介质,当所述计算机可执行指令被一个或多个处理器执行时,使得所述处理器执行上述实施例提供的语音处理方法的步骤。

一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例提供的语音处理方法的步骤。

本申请实施例还提供了一种电子设备。如图10所示,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。该电子设备可以为包括手机、平板电脑、PDA(Personal Digital Assistant,个人数字助理)、POS(Point of Sales,销售终端)、车载电脑、穿戴式设备等任意终端设备,以电子设备为手机为例:

图10为与本申请实施例提供的电子设备相关的手机的部分结构的框图。参考图10,手机包括:射频(Radio Frequency,RF)电路1010、存储器1020、输入单元1030、显示单元1040、传感器1050、音频电路1060、无线保真(wireless fidelity,WiFi)模块1070、处理器1080、以及电源1090等部件。本领域技术人员可以理解,图10所示的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

其中,RF电路1010可用于收发信息或通话过程中,信号的接收和发送,可将基站的下行信息接收后,给处理器1080处理;也可以将上行的数据发送给基站。通常,RF电路包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low Noise Amplifier,LNA)、双工器等。此外,RF电路1010还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(Global System of Mobile communication,GSM)、通用分组无线服务(General Packet Radio Service,GPRS)、码分多址(Code Division Multiple Access,CDMA)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、长期演进(Long Term Evolution,LTE))、电子邮件、短消息服务(Short Messaging Service,SMS)等。

存储器1020可用于存储软件程序以及模块,处理器1080通过运行存储在存储器1020的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器1020可主要包括程序存储区和数据存储区,其中,程序存储区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能的应用程序、图像播放功能的应用程序等)等;数据存储区可存储根据手机的使用所创建的数据(比如音频数据、通讯录等)等。此外,存储器1020可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元1030可用于接收输入的数字或字符信息,以及产生与手机1000的用户设置以及功能控制有关的键信号输入。具体地,输入单元1030可包括触控面板1031以及其他输入设备1032。触控面板1031,也可称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1031上或在触控面板1031附近的操作),并根据预先设定的程式驱动相应的连接装置。在一个实施例中,触控面板1031可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器1080,并能接收处理器1080发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1031。除了触控面板1031,输入单元1030还可以包括其他输入设备1032。具体地,其他输入设备1032可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)等中的一种或多种。

显示单元1040可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1040可包括显示面板1041。在一个实施例中,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板1041。在一个实施例中,触控面板1031可覆盖显示面板1041,当触控面板1031检测到在其上或附近的触摸操作后,传送给处理器1080以确定触摸事件的类型,随后处理器1080根据触摸事件的类型在显示面板1041上提供相应的视觉输出。虽然在图10中,触控面板1031与显示面板1041是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板1031与显示面板1041集成而实现手机的输入和输出功能。

手机1000还可包括至少一种传感器1050,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1041的亮度,接近传感器可在手机移动到耳边时,关闭显示面板1041和/或背光。运动传感器可包括加速度传感器,通过加速度传感器可检测各个方向上加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换)、振动识别相关功能(比如计步器、敲击)等;此外,手机还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器等。

音频电路1060、扬声器1061和传声器1062可提供用户与手机之间的音频接口。音频电路1060可将接收到的音频数据转换后的电信号,传输到扬声器1061,由扬声器1061转换为声音信号输出;另一方面,传声器1062将收集的声音信号转换为电信号,由音频电路1060接收后转换为音频数据,再将音频数据输出处理器1080处理后,经RF电路1010可以发送给另一手机,或者将音频数据输出至存储器1020以便后续处理。

WiFi属于短距离无线传输技术,手机通过WiFi模块1070可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图10示出了WiFi模块1070,但是可以理解的是,其并不属于手机1000的必须构成,可以根据需要而省略。

处理器1080是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器1020内的软件程序和/或模块,以及调用存储在存储器1020内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。在一个实施例中,处理器1080可包括一个或多个处理单元。在一个实施例中,处理器1080可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等;调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1080中。

手机1000还包括给各个部件供电的电源1090(比如电池),优选的,电源可以通过电源管理系统与处理器1080逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

在一个实施例中,手机1000还可以包括摄像头、蓝牙模块等。

在本申请实施例中,该电子设备所包括的处理器1080执行存储在存储器上的计算机程序时实现上述实施例提供的语音处理方法的步骤。

本申请所使用的对存储器、存储、数据库或其它介质的任何引用可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM),它用作外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDR SDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 3 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!