语音双模控制方法、装置及用户终端的制作方法

文档序号:9687032阅读:456来源:国知局
语音双模控制方法、装置及用户终端的制作方法
【技术领域】
[0001]本发明涉及控制技术领域,具体而言,涉及一种语音双模控制方法、装置及用户终端。
【背景技术】
[0002]随着移动终端的不断普及与发展,使用移动终端访问互联网逐渐成为一种趋势。目前,许多移动终端均支持语音识别功能,现今的语音识别主要包括以下两种实现方式:一种是按住麦克风按钮开始说话,离开麦克风按钮结束说话;另一种是采用VAD(语音活动侦测)自动识别,进入语音输入界面后直接说话。
[0003]上述两种语音输入识别方式,分别对应了不同用户的操作习惯,分别适用于不同场景,现今的各浏览器和应用软件往往只支持其中一种实现方式,无法实现在同时支持两种语音输入方式的应用场景下的模式选择和切换。

【发明内容】

[0004]本发明的目的在于提供一种语音双模控制方法、装置及用户终端,以使现有的浏览器和应用软件无法实现操作说和直接说两种语音输入模式的灵活选择和切换的问题得到改善。
[0005]为了实现上述目的,本发明实施例采用的技术方案如下:
[0006]第一方面,本发明实施例提供了一种语音双模控制方法,所述方法包括:监测用户在语音输入界面下是否执行启动操作说判停模式的操作;在监测到用户执行启动所述操作说判停模式的操作时,判断麦克风是否处于忙碌状态,如果是,则将语音模式从直接说自动判停模式切换为所述操作说判停模式,其中,在用户执行启动所述操作说判停模式的操作之前,若所述麦克风处于忙碌状态,则所述语音模式为所述直接说自动判停模式。
[0007]结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所述监测用户在语音输入界面下是否执行启动所述操作说判停模式的操作,包括:监测用户在语音输入界面下是否执行启动所述操作说判停模式的操作的开始操作;若监测到所述开始操作,则监测用户持续执行所述开始操作的时长,在所述时长达到预设阈值时,判定监测到用户在语音输入界面下执行启动所述操作说判停模式的操作。
[0008]结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述监测用户在语音输入界面下是否执行启动所述操作说判停模式的操作,包括:监测用户在语音输入界面下是否执行启动所述操作说判停模式的操作的开始操作;在监测到所述开始操作时,判断所述麦克风是否处于空闲状态,如果是,则将所述语音模式设置为所述直接说自动判停模式,监测用户持续执行所述开始操作的时长,在所述时长达到预设阈值时,判定监测到用户在语音输入界面下执行启动所述操作说判停模式的操作。
[0009]结合第一方面的第二种可能的实施方式,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述方法还包括:获取用户在语音输入界面下通过语言表述的信息;监测用户在语音输入界面下执行的结束所述操作说判停模式的操作;当监测到用户执行结束所述操作说判停模式的操作时,判断当前处于所述直接说自动判停模式还是处于所述操作说判停模式,若当前处于所述直接说自动判停模式,则继续获取用户通过语言表述的信息;若当前处于所述操作说判停模式,则停止获取用户通过语言表述的信息。
[0010]第二方面,本发明实施例提供了一种语音双模控制方法,所述方法包括:监测用户在语音输入界面下是否执行启动操作说判停模式的操作的开始操作;在监测到所述开始操作时,判断麦克风是否处于空闲状态,如果是,则将语音模式设置为直接说自动判停模式,监测用户持续执行所述开始操作的时长,在所述时长达到预设阈值时,判定监测到用户在语音输入界面下执行启动所述操作说判停模式的操作,将所述语音模式从所述直接说自动判停模式切换为所述操作说判停模式。
[0011]第三方面,本发明实施例提供了一种语音双模控制装置,运行于用户终端,所述装置包括:启动操作监测模块,用于监测用户在语音输入界面下是否执行启动操作说判停模式的操作;状态判断模块,用于在所述启动操作监测模块监测到用户执行启动所述操作说判停模式的操作时,判断麦克风是否处于忙碌状态,如果是,则将语音模式从直接说自动判停模式切换为所述操作说判停模式,其中,在用户执行启动所述操作说判停模式的操作之前,若所述麦克风处于忙碌状态,则所述语音模式为所述直接说自动判停模式。
[0012]第四方面,本发明实施例提供了一种语音双模控制装置,运行于用户终端,所述装置包括:开始操作监测模块,用于监测用户在语音输入界面下是否执行启动操作说判停模式的操作的开始操作;模式设置及切换模块,用于在所述开始操作监测模块监测到所述开始操作时,判断麦克风是否处于空闲状态,如果是,则将语音模式设置为直接说自动判停模式,使所述开始操作监测模块监测用户持续执行所述开始操作的时长,在所述时长达到预设阈值时,判定监测到用户在语音输入界面下执行启动所述操作说判停模式的操作,将所述语音模式从所述直接说自动判停模式切换为所述操作说判停模式。
[0013]第五方面,本发明实施例提供了一种用户终端,包括:麦克风、触控屏幕、存储器以及处理器,所述存储器存储有语音双模控制装置中的模块,所述处理器用于运行存储在所述存储器内的模块。
[0014]本发明实施例提供的语音双模控制方法、装置及用户终端,适用于同时支持“操作说”和“直接说”两种语音输入方式的应用场景,通过对用户操作行为和麦克风状态的监测,灵活可靠地选择采用直接说自动判停模式或操作说判停模式或进行模式切换,实现对不同行为习惯用户的语音输入的适配,显著提高了用户语音输入的便利性和灵活性,提高了用户的语音输入体验。
[0015]为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
【附图说明】
[0016]为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0017]图1示出了一种可应用于本发明实施例的用户终端的结构框图;
[0018]图2示出了本发明第一实施例提供的一种语音双模控制方法流程示意图;
[0019]图3示出了本发明第一实施例提供的另一种语音双模控制方法流程示意图;
[0020]图4示出了本发明第一实施例提供的另一种语音双模控制方法流程示意图;
[0021]图5示出了本发明实施例提供的一种结束操作说判停模式的控制方法流程示意图;
[0022]图6示出了本发明第二实施例提供的一种语音双模控制方法流程示意图;
[0023]图7示出了本发明第三实施例提供的一种语音双模控制装置的结构框图;
[0024]图8示出了本发明第三实施例提供的另一种语音双模控制装置的结构框图;
[0025]图9示出了本发明第三实施例提供的另一种语音双模控制装置的结构框图;
[0026]图10示出了本发明第三实施例提供的另一种语音双模控制装置的结构框图;
[0027]图11示出了本发明第四实施例提供的一种语音双模控制装置的结构框图;
[0028]图12示出了本发明第四实施例提供的另一种语音双模控制装置的结构框图;
[0029]图13示出了本发明实施例提供的一种在麦克风空闲状态下启动操作说判停模式的交互界面示意图;
[0030]图14示出了本发明实施例提供的一种结束操作说判停模式的交互界面示意图;
[0031]图15示出了本发明实施例提供的一种在麦克风忙碌状态下启动操作说判停模式的交互界面示意图;
[0032]图16示出了本发明实施例提供的另一种在麦克风空闲状态下启动操作说判停模式的交互界面示意图;
[0033]图17示出了本发明实施例提供的另一种结束操作说判停模式的交互界面示意图;
[0034]图18示出了本发明实施例提供的另一种在麦克风空闲状态下启动操作说判停模式的交互界面示意图;
[0035]图19示出了本发明实施例提供的另一种结束操作说判停模式的交互界面示意图;
[0036]图20示出了本发明实施例提供的另一种在麦克风忙碌状态下启动操作说判停模式的交互界面示意图;
[0037]图21示出了本发明实施例提供的另一种在麦克风空闲状态下启动操作说判停模式的交互界面示意图;
[0038]图22示出了本发明实施例提供的另一种结束操作说判停模式的交互界面示意图;
[0039]图23示出了本发明实施例提供的另一种在麦克风忙碌状态下启动操作说判停模式的交互界面示意图。
【具体实施方式】
[0040]本发明实施例所提供的语音双模控制方法及装置可应用于用户终端100中,于本发明实施例中,用户终端100优选为移动终端设备,例如可以包括智能手机、平板电脑、电子书阅读器、膝上型便携计算机、车载电脑、穿戴式移动终端等等。
[0041]图1示出了一种可应用于本发明实施例中的用户终端100的结构框图。如图1所示,用户终端100包括存储器102、存储控制器104,一个或多个(图中仅示出一个)处理器106、外设接口 108、射频模块110、音频模块112、触控屏幕114等。这些组件通过一条或多条通讯总线/信号线116相互通讯。
[0042]存储器102可用于存储软件程序以及模块,如本发明实施例中的语音双模控制方法及装置对应的程序指令/模块,处理器106通过运行存储在存储器102内的软件程序以及模块,从而执行各种功能应用,如本发明实施例提供的语音双模控制方法。
[0043]存储器102可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。处理器106以及其他可能的组件对存储器102的访问可在存储控制器104的控制下进行。
[0044]外设接口 108将各种输入/输出装置耦合至处理器106以及存储器102。在一些实施例中,外设接口 108,处理器106以及存储控制器104可以在单个芯片中实现。在其他一些实例中,它们可以分别由独立的芯片实现。
[0045]射频模块110用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1