语音控制方法、装置、计算机设备和计算机可读存储介质与流程

文档序号:19145654发布日期:2019-11-15 23:29阅读:270来源:国知局

本申请涉及计算机技术领域,特别是涉及一种语音控制方法、装置、计算机设备和计算机可读存储介质。



背景技术:

随着计算机技术的发展,出现了语音控制技术,语音控制技术是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。大量的语音识别控制产品已经进入市场和服务领域,例如通过语音调节空调或智能音响的音量等。

传统的智能音箱与终端通过蓝牙连接时,一般是通过语音调节音箱的音量,但是当终端的音量太低时,即使将音箱音量调整到最高时仍达不到用户想要的音量大小。此时只能通过手动调节手机的音量,操作不便利。



技术实现要素:

基于此,有必要针对该技术问题,提供一种语音控制方法、装置、计算机设备和计算机可读存储介质。

一种语音控制方法,所述方法包括:

智能音箱获取语音信息;

所述智能音箱获取根据所述语音信息生成的控制指令;

所述智能音箱将所述控制指令通过蓝牙协议发送给移动终端,所述控制指令用于指示所述移动终端调节自身的音频参数,所述移动终端包括智能手机、平板电脑和笔记本电脑中的至少一种。

一种语音控制方法,应用于终端,所述方法包括:

移动终端通过蓝牙协议接收智能音箱发送的控制指令,其中,所述控制指令是根据语音信息生成的,所述移动终端包括智能手机、平板电脑和笔记本电脑中的至少一种;

所述移动终端根据所述控制指令调节自身的音频参数。

一种语音控制装置,应用于智能音箱,所述装置包括:

语音信息获取模块,用于获取语音信息;

控制指令获取模块,用于获取根据所述语音信息生成的控制指令;

发送模块,用于用于将所述控制指令通过蓝牙协议发送给移动终端,所述控制指令用于指示所述移动终端调节自身的音频参数,所述移动终端包括智能手机、平板电脑和笔记本电脑中的至少一种。

一种语音控制装置,应用于移动终端,所述装置包括:

接收模块,用于接收智能音箱发送的控制指令,其中,所述控制指令是根据语音信息生成的,所述移动终端包括智能手机、平板电脑和笔记本电脑中的至少一种;

调节模块,用于根据所述控制指令调节自身的音频参数。

一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行任一项所述语音控制方法的步骤。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行任一项语音控制方法的步骤。

上述语音控制方法、装置、计算机设备和计算机可读存储介质中,智能音箱通过获取语音信息,并获取根据该语音信息生成的控制指令,将该控制指令发送给移动终端,该控制指令用于指示该移动终端调节自身的音频参数,该移动终端包括智能手机、平板电脑和笔记本电脑中的至少一种,从而能够通过智能音箱对移动终端进行语音控制,无需手动调节移动终端的音频,给用户提供更多便利,能够满足用户的更多需求。

附图说明

图1为一个实施例中语音控制方法的应用环境图;

图2为一个实施例中语音控制方法的流程示意图;

图3为另一个实施例中语音控制方法的流程示意图;

图4为一个实施例中移动终端根据控制指令调节音频参数的流程示意图;

图5为另一个实施例中移动终端根据控制指令调节音频参数的流程示意图;

图6为另一个实施例中移动终端根据控制指令调节音频参数的流程示意图;

图7为一个实施例中移动终端根据控制指令调节音量的示意图;

图8为一个实施例中语音控制装置的结构框图;

图9为另一个实施例中语音控制装置的结构框图;

图10为一个实施例中移动终端的结构框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

图1为一个实施例中语音控制方法的应用环境图。参照图1,该语音控制方法应用于语音控制系统。该语音控制系统包括智能音箱110和移动终端120。智能音箱110和移动终端120通过蓝牙协议连接。智能音箱110可以是具备语音识别和蓝牙技术的音箱。移动终端具体可以智能手机、平板电脑、笔记本电脑等中的至少一种。

在本实施例中,智能音箱110和移动终端120可通过蓝牙音频/视频远程控制协议进行通信。智能音箱110接收用户的语音信息,将该语音信息上传到云端,通过云端的语音识别引擎进行语音识别,以判断用户的意图。云端的语音识别引擎对该语音信息进行语音识别后,得到识别结果,返回给智能音箱110。智能音箱110接收该语音识别结果,根据该语音识别结果生成控制指令。接着,智能音箱110将该控制指令发送给移动终端120。移动终端120接收该控制指令,根据该控制指令调节自身的音频参数。

在本实施例中,智能音箱110通过麦克风阵列采集用户的语音信息,将该语音信息发送给语音识别引擎,通过语音识别引擎向云端发起识别请求,以判断用户的意图。

在本实施例中,云端的语音识别引擎得到识别结果后,根据该语音识别结果生成控制指令,并将该控制指令返回给智能音箱110。智能音箱110接收该控制指令,并通过蓝牙协议将该控制指令发送给移动终端120。

在一个实施例中,智能音箱110接收用户的语音信息后,可通过自身内部的语音识别引擎对该语音信息进行识别。对该语音信息进行语音识别后,得到识别结果,智能音箱110可根据对该语音信息的识别结果生成控制指令。接着,智能音箱110将该控制指令发送给移动终端120。

如图2所示,在一个实施例中,提供了一种语音控制方法。本实施例主要以该方法应用于上述图1中的智能音箱110来举例说明。参照图2,该语音控制方法具体包括如下步骤:

步骤202,智能音箱获取语音信息。

具体地,智能音箱与移动终端通过蓝牙协议实现通信连接,智能音箱接收用户发出的语音信息。

步骤204,智能音箱获取根据该语音信息生成的控制指令。

具体地,智能音箱通过内部的语音识别引擎对该语音信息进行语音识别,以识别用户的意图,并根据识别的结果生成对应的控制指令。

在本实施例中,智能音箱可通过第三方设备对该语音信息进行语音识别,并接收第三方设备返回的识别结果,根据识别结果生成对应的控制指令。

步骤206,智能音箱将控制指令通过蓝牙协议发送给移动终端,该控制指令用于指示移动终端调节自身的音频参数,该移动终端包括智能手机、平板电脑和笔记本电脑中的至少一种。

具体地,智能音箱将该控制指令发送给移动终端,以使移动终端根据该控制指令调节自身的音频参数。

在本实施例中,当控制指令中包含至少两个移动终端时,该智能音箱可确定该控制指令中同一移动终端对应的控制指令,并将控制指令按照对应的移动终端进行分类,将分类后的控制指令分别发送给对应的移动终端。

在本实施例中,该方法还包括:接收移动终端的响应信息。其中,响应信息是指移动终端接收到控制指令后,针对该控制指令做出相应的响应,并形成响应信息返回给该智能音箱。

具体地,智能音箱将该控制指令发送给移动终端后,等待移动终端返回相应的响应信息。当智能音箱接收到移动终端返回的响应信息后,将该响应信息转化为语音并播放,以提示用户。

上述语音控制方法,智能音箱通过获取语音信息,并获取根据该语音信息生成的控制指令,将该控制指令发送给移动终端,该控制指令用于指示该移动终端调节自身的音频参数,该移动终端包括智能手机、平板电脑和笔记本电脑中的至少一种,从而能够通过智能音箱对移动终端的控制,无需手动调节移动终端的音频,给用户提供更多便利,能够满足用户的更多需求。

在一个实施例中,该智能音箱获取根据该语音信息生成的控制指令,包括:该智能音箱获取生成的包括音频及对应的音频参数的控制指令,其中,该音频对应的音频参数是根据该语音信息确定的。

其中,控制指令包括音频及对应的音频参数。该控制指令中可存在多个音频和每个音频对应的音频参数。音频包括但不限于媒体、闹钟、移动终端的系统铃声、通话等音频类型。

具体地,智能音箱可通过内部的语音识别引擎对该语音信息进行语音识别,以识别用户的意图,得到识别结果。接着,智能音箱将该识别结果转化为对应的控制指令。

在本实施例中,智能音箱可通过第三方设备对该语音信息进行语音识别,得到识别结果。接着,智能音箱接收第三方设备返回的识别结果,该识别结果中包括用户想要调整的音频和该音频具体需要调整的音频参数。接着,智能音箱将用户想要调整的音频和该音频具体需要调整的音频参数生成对应的控制指令。

在本实施例中,当该识别结果中包含至少两个移动终端时,智能音箱确定至少两个移动终端中的每个移动终端对应的需要调整的音频,以及该音频需要调整的音频参数。接着,智能音箱将至少两个移动终端中的每个移动终端对应的需要调整的音频,以及该音频需要调整的音频参数生成对应的控制指令。

上述语音控制方法,智能音箱根据对语音信息的识别,确定该语音信息中的音频和对应的音频参数,从而可确定用户需要调整的音频及需要调整的音频参数。并获取智能音箱自身生成的或者通过第三方设备生成的包括音频及对应的音频参数的控制指令,以指示移动终端进行相应的调整。

在一个实施例中,该智能音箱获取生成的包括音频及对应的音频参数的控制指令,包括:智能音箱获取生成的包括至少两个音频对应的音频参数和调整顺序的控制指令,该调整顺序是根据该语音信息中至少两个音频出现的时间顺序确定的。

具体地,智能音箱可通过内部的语音识别引擎对该语音信息进行语音识别,以识别用户的意图,得到识别结果。接着,智能音箱可确定该识别结果中存在的音频的个数,当该识别结果中存在至少两个音频时,智能音箱可确定该至少两个音频中的每个音频对应的音频参数。接着,智能音箱确定该至少两个音频中的每个音频对应的调整顺序。进一步地,智能音箱可确定该至少两个音频中的每个音频在语音信息中出现的时间,并将出现的时间进行对比,以得到该至少两个音频中的每个音频在语音信息中出现的先后顺序。该至少两个音频中的每个音频在语音信息中出现的先后顺序即作为该至少两个音频中每个音频的调整顺序。接着,智能音箱将该至少两个音频、至少两个音频中每个音频对应的音频参数和调整顺序生成相应的控制指令。

在本实施例中,智能音箱可通过第三方设备对该语音信息进行语音识别,得到识别结果。

在本实施例中,智能音箱可通过第三方设备对该语音信息进行语音识别,得到识别结果。接着,智能音箱可通过第三方设备确定该识别结果中存在的音频的个数,当该识别结果中存在至少两个音频时,确定该至少两个音频中的每个音频对应的音频参数。接着,智能音箱通过第三方设备确定该至少两个音频中的每个音频对应的调整顺序。进一步地,智能音箱可通过第三方设备确定该至少两个音频中的每个音频在语音信息中出现的时间,并将每个音频出现的时间进行对比,以得到该至少两个音频中的每个音频在语音信息中出现的先后顺序。该至少两个音频中的每个音频在语音信息中出现的先后顺序即作为该至少两个音频中每个音频的调整顺序。接着,智能音箱通过第三方设备将该至少两个音频、至少两个音频中的每个音频对应的音频参数和调整顺序,转化为控制指令。接着,智能音箱从第三方设备获取该包括至少两个音频、至少两个音频中每个音频对应的音频参数和调整顺序的控制指令。

在本实施例中,对语音信息进行识别并得到识别后,当识别结果中存在至少两个移动终端时,智能音响确定至少两个移动终端中的每个移动终端对应的音频和音频参数。当一个移动终端对应至少两个音频时,智能音箱确定该至少两个音频中的每个音频对应的音频参数和调整顺序。并将每个移动终端对应的音频、音频参数和调整顺序转化为各移动终端对应的控制指令。

例如,智能音箱接收到的语音信息为“关掉笔记本电脑的音乐,关掉智能手机的闹钟,打开智能手机的视频播放,并将音量调整到70%”,对该语音进行识别,得到的识别结果可为“笔记本-音乐-停止播放”,“智能手机-闹钟-关闭”,“智能手机-视频-音量调整为70%”。此时,智能音箱可确定智能手机对应的需要调整的音频为闹钟和视频,并可确定闹钟和视频分别对应的调整参数。则智能音箱可进一步确定闹钟和视频的调整顺序,该调整顺序可以根据闹钟和视频在该语音信息中出现的先后顺序确定。

上述语音控制方法,智能音箱根据对语音信息的识别,通过自身生成的或者通过第三方设备生成的包括至少两个音频对应的音频参数和调整顺序的控制指令,该调整顺序是根据该语音信息中至少两个音频出现的时间顺序确定的,以指示移动终端按照调整顺序对音频进行相应的调整。

在一个实施例中,该音频参数包括音量;

该智能音箱获取根据该语音信息生成的控制指令,包括:智能音箱获取生成的包括音量调节方向和音量调节幅度的控制指令,该音量调节方向是根据该语音信息确定的,该音量调节幅度是根据该音量调节方向获取的。

其中,音量调节幅度是指音量调节的变化量、音量调节的倍率等。例如,音量调节幅度为3、5或6等。或者音量调节幅度是当前音量值的2倍、3倍等。

具体地,智能音箱通过自身内部的语音识别引擎或第三方设备的语音设备引擎对该语音信息进行识别后,得到识别结果。智能音箱可确定该识别结果中是否存在音频和对应的音频参数。当智能音箱检测到该识别结果中存在音频参数但不存在音频时,可进一步确定该识别结果的音频参数的类型,例如:音量、音效等。当智能音箱检测到该识别结果只存在音量一种音频参数时,确定该音量的音量调节幅度和调节方向。接着,智能音箱根据音量调节方向和音量调节幅度生成对应的控制指令。

在本实施例中,当智能音箱检测到该识别结果中存在音量调节方向时,判定用户需要调节的音频参数为音量。则智能音箱检测到该识别结果的音量调节方向对应的音量调节幅度。当智能音箱检测出该识别结果中存在音量调节方向且不存在音量调节幅度时,智能音箱可获取该音量调节方向对应的预设的音量调节幅度。接着,智能音箱将该音量调节方向和该音量调节方向对应的预设的音量调节幅度转化为控制指令。

上述语音控制方法中,当音频参数包括音量时,智能音箱确定音量调节方向和音量调节幅度,当语音信息中不存在音量调节幅度时,可根据音量调节方向获取对应的音量调节幅度,能够补充音量调整的信息,并且能够满足用户的需求。获取生成的包括音量调节方向和音量调节幅度的控制指令,以将该控制值指令发送给移动终端,能够明确指示移动终端对自身的音量进行调节。

在本实施例中,当智能音箱检测出该识别结果中存在音量调节方向且不存在音量调节幅度时,将该识别结果中的音量调节方向与预设的音量调节方向进行匹配,该预设的音量调节方向包括正方向和负方向,正方向表示增大音量,负方向表示减小音量;当识别结果中的音量调节方向与预设的音量调节方向中的正方向匹配成功时,获取该正方向对应的音量调节幅度,将该正方向对应的音量调节幅度作为该识别结果中的音量调节方向所对应的音量调节幅度。当识别结果中的音量调节方向与预设的音量调节方向中的负方向匹配成功时,获取该负方向对应的音量调节幅度,将该负方向对应的音量调节幅度作为该识别结果中的音量调节方向所对应的音量调节幅度。接着,智能音箱根据该识别结果中的音量调节方向及对应的音量调节幅度生成控制指令。

在一个实施例中,在该获取语音信息之后,该方法还包括:智能音箱将该语音信息上传到云端;

该智能音箱获取根据该语音信息生成的控制指令,包括:智能音箱接收该云端返回的根据该语音信息生成的控制指令。

具体地,智能音箱接收用户的语音信息之后,将该语音信息上传到云端,通过云端的语音识别引擎对该语音信息进行语音识别,以判断用户的意图。云端的语音识别引擎对该语音信息进行识别后,得到识别结果。接着,智能音箱可通过云端的语音识别引擎根据该语音识别结果生成对应的控制指令,并将该控制指令返回给智能音箱。智能音箱接收该云端返回的根据该语音信息生成的控制指令。

上述语音控制方法,通过将该语音信息上传到云端,以通过云端对该语音信息进行识别,并返回识别结果,能够节省智能音箱的存储空间,并提高识别的效率。

在一个实施例中,如图3所示,提供了一种语音控制方法。本实施例主要以该方法应用于上述图1中的移动终端120来举例说明。参照图3,该语音控制方法具体包括如下步骤:

步骤302,移动终端通过蓝牙协议接收智能音箱发送的控制指令,其中,该控制指令是根据语音信息生成的,该移动终端包括智能手机、平板电脑和笔记本电脑中的至少一种。

步骤304,移动终端根据该控制指令调节自身的音频参数。

具体地,移动终端通过蓝牙音频/视频远程控制协议(avrcp)与智能音箱进行通信连接。智能音箱获取生成的控制指令后,将该控制指令通过蓝牙音频/视频远程控制协议发送给移动终端。移动终端可实时监听蓝牙音频/视频远程控制协议的回调,检测到回调信息后,移动终端可通过蓝牙音频/视频远程控制协议接收智能音箱发送的控制指令,其中,该控制指令是根据语音信息生成的。移动终端接收到该控制指令后,根据该控制指令调节自身的音频参数。通过接收智能音箱发送的控制指令,并根据该控制指令调节移动终端自身的音频参数,使得用户可直接通过智能音箱使用语音调节移动终端的音量,从而为用户提供更便利的语音控制。

在一个实施例中,如图4所示,该方法还包括:

步骤402,移动终端识别该控制指令,确定该控制指令中的音频。

具体地,移动终端接收到该控制指令后,对该控制指令进行识别,以确定该控制指令中存在的音频。

步骤404,移动终端统计该控制指令中同一音频对应的音频参数。

具体地,移动终端可提取该控制指令中存在的音频,并确定该控制指令中的每个音频对应的音频参数。接着,移动终端可将该控制指令中存在的音频进行一一比对,确定该控制指令中是否存在相同的音频。当存在相同的音频时,将该相同的音频对应的音频参数归为一类,从而可统计出该控制指令中的同一音频对应的音频参数。

在本实施例中,移动终端可提取该控制指令中存在的音频,将该控制指令中存在的音频进行一一比对,以确定该控制指令中是否存在相同的音频。当存在相同的音频时,移动终端可保留相同的音频中的任一个,并获取同一音频对应的音频参数,从而可统计出该控制指令中的同一音频对应的音频参数。

该移动终端根据该控制指令调节自身的音频参数,包括:

步骤406,移动终端按照该音频对应的音频参数,对该移动终端中对应的音频的音频参数进行调整。

具体地,移动终端从自身的多个音频中确定与控制指令中的统计后的每个音频相同的音频,以确定移动终端中需要调整音频参数的音频。接着,移动终端获取移动终端内的需要调整音频参数的音频当前的音频参数,将当前的音频参数修改为控制指令中的相同的音频对应的音频参数。

例如,移动终端接收的控制指令为:将移动终端铃声的音量调整为5,媒体的音量调整为60,闹钟的音量调整为100,媒体的音量调整为50。则移动终端识别该控制指令,可知该控制指令中存在的音频为移动终端铃声、媒体和闹钟,并存在各自对应的音频参数。移动终端可统计同一音频对应的音量参数,即控制指令中出现两次媒体,该两个媒体为同一音频,则移动终端可保留一个即可,得到该媒体对应的音频参数为:调整为60和调整为50。

接着,移动终端从自身多个音频中确定出移动终端的系统铃声、媒体和闹钟,并获取移动终端的系统铃声、媒体和闹钟当前的音量值。移动终端将自身铃声当前的音量值调节为5,将闹钟当前的音量值调节为100,并将媒体当前的音量值调整为60,调整后再将媒体的音量值调整为50。

上述语音控制方法中,移动终端通过识别该控制指令,确定该控制指令中的音频,并统计该控制指令中同一音频对应的音频参数,按照该音频对应的音频参数,对该移动终端中对应的音频的音频参数进行调整。使得控制指令中需要对同一音频进行多次调整时,可进行一次音频的切换即可完成对该同一音频的调整,避免了多次来回切换音频的消耗,提高音频参数调整的速度,从而提高语音控制的响应速度。

在本实施例中,移动终端可从该控制指令中选择一个音频及该音频对应的音频参数,并从自身的多个音频中确定与该选择的音频相同的音频。移动终端可获取移动终端内的该相同的音频当前的音频参数,将该移动终端中的该音频当前的音频参数修改为选择的该音频对应的音频参数。按照相同的方式,可根据控制指令中的各音频对应的音频参数,对移动终端内的相同音频的当前音频参数调整为控制指令中对应的音频参数。

在一个实施例中,统计该控制指令中同一音频对应的音频参数之后,还包括:移动终端确定至少两个相同的音频中每个音频对应的调整顺序,并按照最后一个调整顺序对应的音频的音频参数,对该移动终端中对应的音频的音频参数进行调整。例如,移动终端接收的控制指令中先后出现了两次媒体,第一次需要将媒体的音量调整为60,第二次需要将媒体的音量调整为50。则移动终端可直接将第二次对应的“媒体的音量调整为50”作为移动终端中的媒体调整的目标,从而直接将移动终端中的媒体当前的音量调整为50。

在一个实施例中,如图5所示,该方法还包括:

步骤502,移动终端识别该控制指令,确定该控制指令中的音频。

步骤504,移动终端统计该控制指令中至少两个音频中每个音频对应的音频参数,并确定该每个音频对应的调整顺序。

具体地,移动终端接收到该控制指令后,对该控制指令进行识别,以确定该控制指令中存在的音频。当该控制指令中存在至少两个音频时,统计每个该控制指令中至少两个音频中每个音频对应的音频参数。接着,移动终端可根据该至少两个音频中每个音频在该控制指令中出现的先后顺序,将该控制指令中的音频出现的顺序作为该音频对应的调整顺序。

在本实施例中,移动终端可检测控制命令中是否携带每个音频对应的调整顺序,若否,则移动终端可随机设置控制命令中的至少两个音频中每个音频对应的调整顺序。

在本实施例中,移动终端可根据控制命令中的至少两个音频中每个音频对应的音频参数的数量,确定每个音频参数的调整顺序。音频对应的音频参数越多,调整顺序越排后。

该根据该控制指令调节自身的音频参数,包括:

步骤506,移动终端按照该音频对应的音频参数及调整顺序,对该移动终端中对应的音频的音频参数依次调整。

具体地,移动终端按照该音频对应的音频参数及确定的调整顺序,依次获取移动终端中相同的音频当前的音频参数,并将当前的音频参数调整为控制指令中的对应音频的音频参数。

在本实施例,移动终端可检测控制命令中是否携带每个音频对应的调整顺序,若是,则移动终端按照控制指令中的每个音频对应的调整顺序及音频参数,对移动终端中对应的音频当前的音频参数进行调整,以达到用户的要求。

上述语音控制方法,移动终端通过识别该控制指令,确定该控制指令中的音频,统计该控制指令中至少两个音频中每个音频对应的音频参数,并确定该每个音频对应的调整顺序,按照该音频对应的音频参数及调整顺序,对该移动终端中对应的音频的音频参数依次调整,能够在控制指令中存在调整顺序时按照调整顺序进行调整,当控制指令中不存在调整顺序时,可快速确定多个音频的调整顺序,从而快速有序地实现用户响应。

在一个实施例中,如图6所示,该控制指令中包括调节方向和音量变化量;

该移动终端根据该控制指令调节自身的音频参数,包括:

步骤602,移动终端获取自身各音频当前的音量值。

具体地,移动终端接收到智能音箱发送的控制指令后,对该控制指令进行识别。当移动终端检测到该控制指令中只包含调节方向和音量变化量时,判定用户需要把移动终端中的所有音频的音量按照该调节方向和音量变化量进行调整。则移动终端获取自身的各个音频对应的当前的音量值。

步骤604,移动终端将该控制指令中的音量变化量,转换为自身的各音频对应的音量变化量。

具体地,由于不同的音频的音量调节范围并不相同。则移动终端需要将该控制指令中的音量变化量通过转换函数转换为移动终端的各音频对应的音量变化量。例如,控制指令中的音量变化量为5,但是媒体、闹钟、通话等音频对应的音量变化量并不一定是5,需要经过转化函数,得到媒体、闹钟、通话等音频分别对应的音量变化量。

步骤606,移动终端根据该调节方向和该各音频对应的音量变化量,对该移动终端的各音频当前的音量值分别进行调整。

具体地,移动终端将自身的各音频当前的音量值按照该控制指令中的调节方向和移动终端中的各音频对应的音量变化量进行调节。

进一步地,移动终端确定该调节方向为正方向或负方向。当该调节方向为正方向时,表示增强音量,则移动终端可将自身的各音频当前的音量值相应地加上移动终端中各音频对应的音量变化量。当该调节方向为负方向时,表示减小音量,则移动终端可将自身的各音频当前的音量值相应地减去移动终端中各音频对应的音量变化量。

上述语音控制方法,移动终端获取该自身各音频当前的音量值,将该控制指令中的音量变化量,转换为该自身各音频对应的音量变化量,根据该调节方向和该移动终端的各音频对应的音量变化量,对该移动终端的各音频当前的音量值分别进行调整,从而能够确定移动终端中各音频对应的音量变化量,以确定移动终端中各音频各自需要调节的范围,从而实现准确调节。

如图7所示,为一个实施例中移动终端根据控制指令调节音量的示意图。移动终端与智能音箱通过蓝牙音频/视频远程控制协议进行连接,连接后移动终端实时监听蓝牙音频/视频远程控制协议的回调。当移动终端检测到智能音箱通过音频/视频远程控制协议发送的控制指令时,移动终端可调用音量设置函数将控制指令传输给音频服务。该音频服务接收到控制指令后,确定移动终端中需要调整音量的音频。由于不同音频类型的音量调节范围不同,所以需要将音量值的变化量从源流类型变换到目标流类型下。移动终端的音频服务可并通过转换函数将控制指令中的音频对应的音量变化量,转换为移动终端中需要调整的音频对应的音量变化量。接着,移动终端通过音频服务根据控制指令中的调整方向和移动终端中需要调整的音频对应的音量变化量,将该移动终端中的需要调整的音频的当前音量值进行调整,得到该移动终端的音频的调整后的音量值并存储。接着,移动终端的音频服务将该音频调整后的音量值发送给混音器,混音器存储该音频调整后的音量值,并将该音频调整后的音量值通过混音线程输出。

在一个实施例中,该语音控制方法包括:

智能音箱获取语音信息。

接着,智能音箱将该语音信息上传到云端。

进一步地,智能音箱接收云端返回的包括至少两个音频对应的音频参数和调整顺序的控制指令,该调整顺序是根据该语音信息中至少两个音频出现的时间顺序确定的。

接着,智能音箱确定控制指令对应的移动终端,将该控制指令发送给对应的移动终端,该控制指令用于指示移动终端调节自身的音频参数,移动终端包括智能手机、平板电脑和笔记本电脑中的至少一种。

可选地,移动终端接收智能音箱发送的控制指令,其中,该控制指令是根据语音信息生成的。

接着,移动终端识别该控制指令,确定该控制指令中的音频。

接着,移动终端统计该控制指令中至少两个音频中每个音频对应的音频参数,并确定该每个音频对应的调整顺序。

进一步地,移动终端按照该音频对应的音频参数及调整顺序,对该移动终端中对应的音频的音频参数依次调整。

可选地,当控制指令中包括调节方向和音量变化量时,移动终端获取该移动终端中各音频当前的音量值;移动终端将该控制指令中的音量变化量,转换为该移动终端中各音频对应的音量变化量;移动终端根据该调节方向和该移动终端的各音频对应的音量变化量,对该移动终端的各音频当前的音量值分别进行调整。

上述语音控制方法,智能音箱通过接收用户的语音信息,并将该语音信息上传到云端,通过云端对该语音信息进行识别,并根据识别结果返回控制指令,通过云端识别语音信息能够节省智能音箱的存储空间。将该控制指令发送给移动终端,可指示移动终端根据该控制指令调整对应的音频参数。移动终端接收该控制指令后,确定该控制指令中的音频,并统计该控制指令中至少两个音频中每个音频对应的音频参数,以及该每个音频对应的调整顺序,从而可根据控制指令中的信息对移动终端中的音频的音频参数进行相应的调节。本方案通过智能音箱接收用户的语音信息,并经过识别生成控制指令,将该控制指令发送给移动终端,能够实现智能音箱对移动终端的控制,并实现了通过智能音箱控制移动终端调节移动终端中的音频参数,提供给用户更多的便利,提高用户体验。

图2-图6为一个实施例中语音控制方法的流程示意图。应该理解的是,虽然图2-图6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-图6中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图8所示,提供了一种语音控制装置,应用于智能音箱。该语音控制装置包括:语音信息获取模块802、控制指令获取模块804和发送模块806。其中,

语音信息获取模块802,用于获取语音信息。

控制指令获取模块804,用于获取根据该语音信息生成的控制指令。

发送模块806,用于将该控制指令通过蓝牙协议发送给移动终端,该控制指令用于指示该移动终端调节自身的音频参数,该移动终端包括智能手机、平板电脑和笔记本电脑中的至少一种。

上述语音控制装置,通过获取语音信息,并获取根据该语音信息生成的控制指令,将该控制指令发送给移动终端,该控制指令用于指示该移动终端调节自身的音频参数,该移动终端包括智能手机、平板电脑和笔记本电脑中的至少一种,从而能够通过智能音箱实现对移动终端的语音控制,给用户提供更多便利,能够满足用户的更多需求。

在一个实施例中,控制指令获取模块804还用于:获取生成的包括音频及对应的音频参数的控制指令,其中,该音频对应的音频参数是根据该语音信息确定的。该语音控制装置,根据对语音信息的识别,确定该语音信息中的音频和对应的音频参数,从而可确定用户需要调整的音频及需要调整的音频参数。并获取智能音箱自身生成的或者通过第三方设备生成的包括音频及对应的音频参数的控制指令,以指示移动终端进行相应的调整。

在一个实施例中,控制指令获取模块804还用于:获取生成的包括至少两个音频对应的音频参数和调整顺序的控制指令,该调整顺序是根据该语音信息中至少两个音频出现的时间顺序确定的。该语音控制装置,智能音箱根据对语音信息的识别,通过自身生成的或者通过第三方设备生成的包括至少两个音频对应的音频参数和调整顺序的控制指令,该调整顺序是根据该语音信息中至少两个音频出现的时间顺序确定的,以指示移动终端按照调整顺序对音频进行相应的调整。

在一个实施例中,该音频参数包括音量,控制指令获取模块804还用于:

获取生成的包括音量调节方向和音量调节幅度的控制指令,该音量调节方向是根据该语音信息确定的,该音量调节幅度是根据该音量调节方向获取的。该语音控制装置,当音频参数包括音量时,确定音量调节方向和音量调节幅度,当语音信息中不存在音量调节幅度时,可根据音量调节方向获取对应的音量调节幅度,能够补充音量调整的信息,并且能够满足用户的需求。获取生成的包括音量调节方向和音量调节幅度的控制指令,以将该控制值指令发送给移动终端,能够明确指示移动终端对自身的音量进行调节。

在一个实施例中,在该获取语音信息之后,该装置还包括:上传模块。该上传模块用于:将该语音信息上传到云端。

控制指令获取模块804还用于:接收该云端返回的根据该语音信息生成的控制指令。通过将该语音信息上传到云端,以通过云端对该语音信息进行识别,并返回识别结果,能够节省智能音箱的存储空间,并提高识别的效率。

在一个实施例中,如图9所示,提供了一种语音控制装置,应用于移动终端。该语音控制装置包括:接收模块902和调节模块904。其中,

接收模块902,用于接收智能音箱发送的控制指令,其中,所述控制指令是根据语音信息生成的。

调节模块904,用于根据所述控制指令调节自身的音频参数。

本实施例中,移动终端通过接收智能音箱发送的控制指令,并根据该控制指令调节移动终端自身的音频参数,使得用户可直接通过智能音箱使用语音调节移动终端的音量,从而为用户提供更便利的语音控制。

在一个实施例中,该装置还包括:识别模块,该识别模块用于:识别该控制指令,确定该控制指令中的音频;统计该控制指令中同一音频对应的音频参数。

调节模块904还用于:按照该音频对应的音频参数,对该移动终端中对应的音频的音频参数进行调整。

上述语音控制装置中,通过识别该控制指令,确定该控制指令中的音频,并统计该控制指令中同一音频对应的音频参数,按照该音频对应的音频参数,对该移动终端中对应的音频的音频参数进行调整。使得控制指令中需要对同一音频进行多次调整时,可进行一次音频的切换即可完成对该同一音频的调整,避免了多次来回切换音频的消耗,提高音频参数调整的速度,从而提高语音控制的响应速度。

在一个实施例中,该识别模块用于:识别该控制指令,确定该控制指令中的音频;统计该控制指令中至少两个音频中每个音频对应的音频参数,并确定该每个音频对应的调整顺序。

调节模块904还用于:按照该音频对应的音频参数及调整顺序,对该移动终端中对应的音频的音频参数依次调整。

上述语音控制装置,通过识别该控制指令,确定该控制指令中的音频,统计该控制指令中至少两个音频中每个音频对应的音频参数,并确定该每个音频对应的调整顺序,按照该音频对应的音频参数及调整顺序,对该移动终端中对应的音频的音频参数依次调整,能够在控制指令中存在调整顺序时按照调整顺序进行调整,当控制指令中不存在调整顺序时,可快速确定多个音频的调整顺序,从而快速有序地实现用户响应。

在一个实施例中,该控制指令中包括调节方向和音量变化量;

调节模块904还用于:获取该移动终端中各音频当前的音量值;将该控制指令中的音量变化量,转换为该移动终端中各音频对应的音量变化量;根据该调节方向和该移动终端的各音频对应的音量变化量,对该移动终端的各音频当前的音量值分别进行调整。

上述语音控制装置,获取该移动终端中各音频当前的音量值,将该控制指令中的音量变化量,转换为该移动终端中各音频对应的音量变化量,根据该调节方向和该移动终端的各音频对应的音量变化量,对该移动终端的各音频当前的音量值分别进行调整,从而能够确定移动终端中各音频对应的音量变化量,以确定移动终端中各音频各自需要调节的范围,从而实现准确调节。

图10示出了一个实施例中移动终端的内部结构图。如图10所示,该移动终端包括该移动终端包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该移动终端的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现语音控制方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行语音控制方法。移动终端的显示屏可以是液晶显示屏或者电子墨水显示屏,移动终端的输入装置可以是显示屏上覆盖的触摸层,也可以是移动终端外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,本申请提供的语音控制装置可以实现为一种计算机程序的形式,计算机程序可在该智能音箱上运行。智能音箱的存储器中可存储组成该语音控制装置的各个程序模块,比如,图8所示的语音信息获取模块802、控制指令获取模块804和发送模块806。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的语音控制方法中的步骤。

例如,该智能音箱可以通过如图8所示的语音控制装置中的语音信息获取模块802执行获取语音信息的步骤。智能音箱可通过控制指令获取模块804执行获取根据该语音信息生成的控制指令的步骤。智能音箱可通过发送模块806执行将该控制指令发送给移动终端,该控制指令用于指示该移动终端调节自身的音频参数的步骤。

在一个实施例中,本申请提供的语音控制装置可以实现为一种计算机程序的形式,计算机程序可在如图10所述的该移动终端上运行。移动终端的存储器中可存储组成该语音控制装置的各个程序模块,比如,图9所示的接收模块902和调节模块904。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的语音控制方法中的步骤。

例如,该移动终端可以通过如图9所示的语音控制装置中的接收模块902执行接收智能音箱发送的控制指令,其中,所述控制指令是根据语音信息生成的步骤。移动终端可通过调节模块904执行根据所述控制指令调节自身的音频参数的步骤。

在一个实施例中,提供了一种计算机设备,该计算机设备为智能音箱或移动终端,该计算机设备包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述语音控制方法的步骤。此处语音控制方法的步骤可以是上述各个实施例的语音控制方法中的步骤。

在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述语音控制方法的步骤。此处语音控制方法的步骤可以是上述各个实施例的语音控制方法中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!