一种语音识别的方法及移动终端与流程

文档序号:14914899发布日期:2018-07-11 00:27阅读:582来源:国知局

本发明实施例涉及通信领域,特别涉及一种语音识别的方法及移动终端。



背景技术:

随着语音识别技术的不断进步,用户在使用移动终端时,可以通过输入语音的方式来执行各种操作。现有的语音识别功能只能对用户输入的一段连续的语音进行识别,当用户在输入语音的过程中因特殊情况被打断时,例如:向偶遇的熟人打招呼、来电话导致界面被切换等,由于中断前输入的语音内容不是完整的语句,移动终端无法通过语音识别获得该语音的语义,导致用户只能将中断之前输入过的语音重新输入一遍,用户体验较差。



技术实现要素:

本发明实施例提供了一种语音识别的方法及移动终端,解决语音输入被中断而需要重新输入语音的问题。

依据本发明实施例的第一方面,提供了一种语音识别的方法,应用于移动终端,包括:在所述移动终端处于语音识别状态时,确定是否中断语音识别;若是,保存中断语音识别之前获取的第一语音信息,从所述语音识别状态切换至语音识别中断状态;在所述移动终端处于所述语音识别中断状态时,确定是否恢复语音识别;若是,从所述语音识别中断状态切换至所述语音识别状态,获取第二语音信息;对在中断语音识别之前获取的一个或多个第一语音信息,以及在恢复语音识别之后获取的一个或多个第二语音信息进行语音识别。

依据本发明实施例的第二方面,提供了一种移动终端,包括:第一确定模块,用于在所述移动终端处于语音识别状态时,确定是否中断语音识别;保存模块,用于在所述第一确定模块确定中断语音识别时,保存中断语音识别之前获取的第一语音信息;第一切换模块,用于在所述第一确定模块确定中断语音识别时,从所述语音识别状态切换至语音识别中断状态;第二确定模块,用于在所述移动终端处于所述语音识别中断状态时,确定是否恢复语音识别;第二切换模块,用于在所述第二确定模块确定恢复语音识别时从所述语音识别中断状态切换至所述语音识别状态;获取模块,用于在所述第二确定模块确定恢复语音识别时获取第二语音信息;语音识别模块,用于对在中断语音识别之前获取的一个或多个第一语音信息,以及在恢复语音识别之后获取的一个或多个第二语音信息,进行语音识别。

依据本发明实施例的第三方面,提供了另一种移动终端,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如第一方面所述的语音识别的方法的步骤。

依据本发明实施例的第四方面,提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如的第一方面所述的语音识别的方法的步骤。

这样,移动终端能够在语音识别被中断时切换至语音识别中断状态,并保存中断语音识别之前获取的第一语音信息,在语音识别被恢复时能够切换至语音识别状态,并获取恢复语音识别之后的第二语音信息,根据在中断语音识别之前获取的一个或多个第一语音信息,以及在恢复语音识别之后获取的一个或多个第二语音信息,进行语音识别,得到完整的语义,避免用户因语音输入被中断而需要重新输入语音,提升了移动终端的使用体验。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的语音识别方法的流程示意图之一;

图2为本发明实施例提供的语音识别方法的流程示意图之二;

图3为本发明实施例提供的语音识别方法的流程示意图之三;

图4为本发明实施例提供的语音识别方法的流程示意图之四;

图5为本发明实施例提供的一种移动终端的结构示意图;

图6为本发明实施例提供的另一种移动终端的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

参见图1,本发明实施例提供了一种语音识别的方法,具体步骤如下:

步骤101、在移动终端处于语音识别状态时,确定是否中断语音识别,若是执行步骤102;否则,继续执行步骤101;

在本发明实施例中,移动终端可以是手机、平板电脑、笔记本电脑、掌上电脑、车载终端或可穿戴设备等。

语音识别状态表示移动终端的语音识别功能处于运行状态,该语音识别功能可以是移动终端自身提供的,也可以是第三方应用程序提供的(例如微信或者QQ等),本发明实施例对语音识别功能的提供方式不做具体限定。

当移动终端处于语音识别状态时,会实时确定是否中断语音识别,确定依据可以是用户输入的第一语音指令、用户输入的第一按键操作或者移动终端显示界面的第一切换触发方式等,本发明实施例对确定是否中断语音识别的方式不做具体限定。

步骤102、保存中断语音识别之前获取的第一语音信息,从语音识别状态切换至语音识别中断状态;

在本发明实施例中,第一语音信息是用户通过移动终端的麦克风输入的语音信息,可以是一句或多句语音信息,在本发明实施例中并不具体限定第一语音信息的具体内容。语音识别中断状态表示移动终端暂时停止语音识别功能,并等待语音识别恢复的状态,需要说明的是,当移动终端处于语音识别中断状态时,移动终端的语音识别功能并没有关闭,只是处于暂停接收语音的状态。

步骤103、在移动终端处于语音识别中断状态时,确定是否恢复语音识别,若是,执行步骤104;否则,继续执行步骤103;

在本发明实施例中,当移动终端处于语音识别中断状态时,会实时确定是否恢复语音识别,确定依据可以是用户输入的第二语音指令、用户输入的第二按键操作或者移动终端显示界面的第二切换触发方式等,本发明实施例对确定是否恢复语音识别的方式不做具体限定。

步骤104、从语音识别中断状态切换至语音识别状态,获取第二语音信息,返回执行步骤101或者执行步骤105;

在本发明实施例中,第二语音信息用户通过移动终端的麦克风输入的语音信息,可以是一句或多句语音信息,在本发明实施例中并不具体限定第二语音信息的具体内容。

步骤105、对在中断语音识别之前获取的一个或多个第一语音信息,以及在恢复语音识别之后获取的一个或多个第二语音信息进行语音识别;

需要说明的是,步骤105可以是在移动终端执行步骤101~步骤104一次或多次后执行,其中多次执行步骤101~步骤104表示用户在使用移动终端进行语音识别时被多次打断,本发明实施例对于用户被打断一次或多次的应用场景均适用。

在本发明实施例中,语音识别被中断一次或多次后,能够获取到中断语音识别之前的一个或多个第一语音信息,以及在恢复语音识别之后的一个或多个第二语音信息,对该一个或多个第一语音信息和第二语音信息进行语音识别,从而得到完成的语义。

例如:用户通过移动终端的麦克风向该移动终端输入以下第一语音信息:“请于上午10点在会议室开会,开会”之后,移动终端检测到中断语音识别,则保持第一语音信息,当该移动终端检测到恢复语音识别,则该移动终端继续获取以下第二语音信息:“期间请将手机调至静音,谢谢。”,完成语音输入后,该移动终端对:“请于上午10点在会议室开会,开会期间请将手机调至静音,谢谢。”进行语音识别。

需要说明的是,语音识别可以采用现有的语音识别技术实现,本发明实施例对语音识别的方式不做具体限定。

这样,移动终端能够在语音识别被中断时切换至语音识别中断状态,并保存中断语音识别之前获取的第一语音信息,在语音识别被恢复时能够切换至语音识别状态,并获取恢复语音识别之后的第二语音信息,根据在中断语音识别之前获取的一个或多个第一语音信息,以及在恢复语音识别之后获取的一个或多个第二语音信息,进行语音识别,得到完整的语义,避免用户因语音输入被中断而需要重新输入语音,提升了移动终端的使用体验。

在本发明实施例中,在移动终端确定恢复语音识别时,能够输出提示信息,该提示信息中包括第一语音信息的相关信息,参见图2,本发明实施例提供了另一种语音识别的方法,具体步骤如下:

步骤201、在移动终端处于语音识别状态时,确定是否中断语音识别,若是执行步骤202;否则,继续执行步骤201;

在本发明实施例中,语音识别状态表示移动终端的语音识别功能处于运行状态,该语音识别功能可以是移动终端自身提供的,也可以是第三方应用程序提供的(例如微信或者QQ等),本发明实施例对语音识别功能的提供方式不做具体限定。

当移动终端处于语音识别状态时,会实时确定是否中断语音识别,确定依据可以是用户输入的第一语音指令、用户输入的第一按键操作或者移动终端显示界面的第一切换触发方式等,本发明实施例对确定是否中断语音识别的方式不做具体限定。

步骤202、保存中断语音识别之前获取的第一语音信息,从语音识别状态切换至语音识别中断状态;

在本发明实施例中,语音识别中断状态表示移动终端暂时停止语音识别功能,并等待语音识别恢复的状态,需要说明的是,当移动终端处于语音识别中断状态时,移动终端的语音识别功能并没有关闭,只是处于暂停接收语音的状态。

步骤203、在移动终端处于语音识别中断状态时,确定是否恢复语音识别,若是,执行步骤204;否则,继续执行步骤203;

在本发明实施例中,当移动终端处于语音识别中断状态时,会实时确定是否恢复语音识别,确定依据可以是用户输入的第二语音指令、用户输入的第二按键操作或者移动终端显示界面的第二切换触发方式等,本发明实施例对确定是否恢复语音识别的方式不做具体限定。

步骤204、输出提示信息;

在本发明实施例中,在语音识别恢复之后,移动终端能够输出提示信息,该提示信息包括第一语音信息的相关信息,该相关信息的内容可以是第一语音信息的内容,用于提示用户在语音识别被中断之前,用户已输入的语音内容,本发明实施例对该相关信息的内容不做具体限定。

步骤205、从语音识别中断状态切换至语音识别状态,获取第二语音信息,返回执行步骤201或者执行步骤206;

步骤206、对在中断语音识别之前获取的一个或多个第一语音信息,以及在恢复语音识别之后获取的一个或多个第二语音信息进行语音识别;

需要说明的是,步骤206可以是在移动终端执行步骤201~步骤205一次或多次后执行,其中多次执行步骤201~步骤205表示用户在使用移动终端进行语音识别时被多次打断,本发明实施例对于用户被打断一次或多次的应用场景均适用。

在本发明实施例中,语音识别被中断一次或多次后,能够获取到中断语音识别之前的一个或多个第一语音信息,以及在恢复语音识别之后的一个或多个第二语音信息,对该一个或多个第一语音信息和第二语音信息进行语音识别,从而得到完成的语义。

需要说明的是,语音识别可以采用现有的语音识别技术实现,本发明实施例对语音识别的方式不做具体限定。

这样,移动终端能够在语音识别被中断时切换至语音识别中断状态,并保存中断语音识别之前获取的第一语音信息,在语音识别被恢复时能够切换至语音识别状态,且在语音识别被恢复之前,能够输出提示信息,提示用户继续进行语音输入,在恢复语音识别之后获取第二语音信息,根据在中断语音识别之前获取的一个或多个第一语音信息,以及在恢复语音识别之后获取的一个或多个第二语音信息,进行语音识别,得到完整的语义,避免用户因语音输入被中断而需要重新输入语音,提升了移动终端的使用体验。

在本发明实施例中,移动终端能够通过用户输入的语音指令、用户输入的按键操作或者根据移动终端的显示界面的切换触发方式确定是否中断或恢复语音识别,参见图3,本发明实施例提供了又一种语音识别的方法,具体步骤如下:

步骤301、获取用户输入的第一语音指令,然后执行步骤304;

步骤302、获取用户输入的第一按键操作,然后执行步骤305;

在本发明实施例中,第一按键操作可以是用户对实体按键或虚拟按键的操作,本发明实施例对第一按键操作的操作方式不做具体限定。

步骤303、获取移动终端的显示界面的第一切换触发方式,然后执行步骤306;

在本发明实施例中,移动终端的显示界面的第一切换触发方式可以是强制性的,例如,在用户进行语音输入时有电话打进来,显示界面强制切换至通话界面等,本发明实施例对移动终端的显示界面的第一切换触发方式不做具体限定。

步骤304、根据第一语音指令是否与第一预设语音指令匹配,确定是否中断语音识别,若是,执行步骤307;否则继续执行步骤301;

在本发明实施例中,如果第一语音指令与第一预设的语音指令匹配,则移动终端确定中断语音识别。该第一预设的语音指令可以是移动终端预设置的语音指令,也可以是由用户设置的语音指令,例如,该第一预设的语音指令可以是“稍等”、“等会儿”等,本发明实施例对第一预设的语音指令的内容不做具体限定。

步骤305、根据第一按键操作是否与第一预设按键操作匹配,确定是否中断语音识别,若是,执行步骤307;否则继续执行步骤302;

在本发明实施例中,如果第一按键操作与第一预设的按键操作匹配,则移动终端确定中断语音识别。该第一预设的按键操作可以是移动终端预设置的语音指令,也可以是由用户设置的按键操作,例如,用户可以设置第一预设的按键操作为按压主屏幕实键,本发明实施例对第一预设的按键操作的操作方式不做具体限定。

步骤306、根据第一切换触发方式是否与第一预设切换触发方式匹配,确定是否中断语音识别,若是,执行步骤307;否则继续执行步骤303;

在本发明实施例中,移动终端可以预先设置当第一预设切换触发方式,例如:强制性切换方式,如果第一切换触发方式与第一预设切换触发方式匹配,则确定中断语音识别,例如,当用户在进行语音输入时有电话打进来,显示界面强制切换至通话界面的情况,移动终端确定中断语音识别,本发明实施例对第一切换触发方式的类别与确定中断语音识别之间的对应关系不做具体限定。

步骤307、保存中断语音识别之前获取的第一语音信息,从语音识别状态切换至语音识别中断状态,然后执行步骤308、步骤309或者步骤310;

在本发明实施例中,当移动终端处于语音识别中断状态时,会实时确定是否恢复语音识别,可选地,执行步骤308、步骤309或步骤310;

步骤308、获取用户输入的第二语音指令,然后执行步骤311;

步骤309、获取用户输入的第二按键操作,然后执行步骤312;

在本发明实施例中,第二按键操作可以是用户对实体按键或虚拟按键的操作,本发明实施例对第二按键操作的操作方式不做具体限定。

步骤310、获取移动终端的显示界面的第二切换触发方式,然后执行步骤313;

在本发明实施例中,移动终端的显示界面的第一切换触发方式可以是非强制性的,例如,用户通过调用后台将显示界面切换至语音识别的界面等,本发明实施例对移动终端的显示界面的第二切换触发方式不做具体限定。

步骤311、根据第二语音指令是否与第二预设语音指令匹配,确定是否恢复语音识别,若是,执行步骤311;否则继续执行步骤308;

在本发明实施例中,如果第二语音指令与第二预设的语音指令匹配,则移动终端确定恢复语音识别。该预设的语音指令可以是移动终端预设置的语音指令,也可以是由用户设置的语音指令,例如,该预设的语音指令可以是“我回来了”、“我们继续”等,本发明实施例对第二预设的语音指令的内容不做具体限定。

步骤312、根据第二按键操作是否与第二预设按键操作匹配,确定是否恢复语音识别,若是,执行步骤311;否则继续执行步骤309;

在本发明实施例中,如果第二按键操作与第二预设的按键操作匹配,则移动终端确定恢复语音识别。该第二预设的按键操作可以是移动终端预设置的语音指令,也可以是由用户设置的按键操作,例如,用户可以设置第二预设的按键操作为同时按压电源键和返回键,本发明实施例对第二预设的按键操作的操作方式不做具体限定。

步骤313、根据第二切换触发方式是否与第二预设切换触发方式匹配,确定是否恢复语音识别,若是,执行步骤311;否则继续执行步骤310;

在本发明实施例中,移动终端可以预先设置第二预设切换触发方式,例如:非强制性切换方式,如果第二切换触发方式与第二预设切换触发方式匹配,则确定恢复语音识别,例如,当用户通过调用后台将显示界面切换至语音识别的界面,本发明实施例对第二切换触发方式的类别与确定恢复语音识别之间的对应关系不做具体限定。

步骤314、从语音识别中断状态切换至语音识别状态,获取第二语音信息,返回执行步骤301、步骤302或者步骤303;或者执行步骤315;

步骤315、对在中断语音识别之前获取的一个或多个第一语音信息,以及在恢复语音识别之后获取的一个或多个第二语音信息进行语音识别;

例如:用户通过移动终端的麦克风向该移动终端输入以下第一语音信息:“请于上午10点在会议室开会,开会”之后,以用户通过输入的语音指令为例,用户输入第一语音指令:“稍等”,该移动终端检测到第一语音指令,则保持第一语音信息,当用户输入第二语音指令:“我回来了”,该移动终端检测到第二语音指令,则该移动终端继续获取以下第二语音信息:“期间请将手机调至静音,谢谢。”,完成语音输入后,该移动终端对:“请于上午10点在会议室开会,开会期间请将手机调至静音,谢谢。”进行语音识别。对于用户通过输入的按键操作或者移动终端根据显示界面的切换触发方式确定是否中断或恢复语音识别的应用场景与上述过程类似,在此不再赘述。

需要说明的是,步骤315可以是在移动终端执行步骤301~步骤314一次或多次后执行,其中多次执行步骤301~步骤314多次表示用户在使用移动终端进行语音识别时被多次打断,本发明实施例对于用户被打断一次或多次的应用场景均适用。

在本发明实施例中,语音识别被中断一次或多次后,能够获取到中断语音识别之前的一个或多个第一语音信息,以及在恢复语音识别之后的一个或多个第二语音信息,对该一个或多个第一语音信息和第二语音信息进行语音识别,从而得到完成的语义。

需要说明的是,语音识别可以采用现有的语音识别技术实现,本发明实施例对语音识别的方式不做具体限定。

这样,移动终端在进行语音识别的过程中,能够依据用户输入的第一语音指令、第一按键操作或者显示界面的第一切换触发方式中断语音识别,并依据用户输入的第二语音指令、第二按键操作或者显示界面的第二切换触发方式恢复语音识别,然后对中断语音识别之前获取的一个或多个第一语音信息,以及恢复语音识别之后获取的一个或多个第二语音信息,进行语音识别,得到完整的语义,避免用户因语音输入被中断而需要重新输入语音,提升了移动终端的使用体验。

在本发明实施例中,移动终端获取在中断语音识别之前的一个或多个第一语音信息,以及在恢复语音识别之后的一个或多个第二语音信息,能够选择先将第一语音信息和第二语音信息合并后进行语音识别,或者先分别对第一语音信息和第二语音信息进行语音识别,再将语音识别结果合并为完整语义,参见图4,本发明实施例提供了还一种语音识别的方法,具体步骤如下:

步骤401、在移动终端处于语音识别状态时,确定是否中断语音识别,若是执行步骤402;否则,继续执行步骤401;

在本发明实施例中,语音识别状态表示移动终端的语音识别功能处于运行状态,该语音识别功能可以是移动终端自身提供的,也可以是第三方应用程序提供的(例如微信或者QQ等),本发明实施例对语音识别功能的提供方式不做具体限定。

当移动终端处于语音识别状态时,会实时确定是否中断语音识别,确定依据可以是用户输入的第一语音指令、用户输入的第一按键操作或者移动终端显示界面的第一切换触发方式等,本发明实施例对确定是否中断语音识别的方式不做具体限定。

步骤402、保存中断语音识别之前获取的第一语音信息,从语音识别状态切换至语音识别中断状态;

在本发明实施例中,语音识别中断状态表示移动终端暂时停止语音识别功能,并等待语音识别恢复的状态,需要说明的是,当移动终端处于语音识别中断状态时,移动终端的语音识别功能并没有关闭,只是处于暂停接收语音的状态。

步骤403、在移动终端处于语音识别中断状态时,确定是否恢复语音识别,若是,执行步骤404;否则,继续执行步骤403;

在本发明实施例中,当移动终端处于语音识别中断状态时,会实时确定是否恢复语音识别,确定依据可以是用户输入的第二语音指令、用户输入的第二按键操作或者移动终端显示界面的第二切换触发方式等,本发明实施例对确定是否恢复语音识别的方式不做具体限定。

步骤404、从语音识别中断状态切换至语音识别状态,获取第二语音信息,返回执行步骤401;或者执行步骤405或者步骤407;

步骤405、将一个或多个第一语音信息和一个或多个第二语音信息合成,得到第三语音信息;

在本发明实施例中,移动终端通过现有的语音处理技术,将获取到的一个或多个第一语音信息和一个或多个第二语音信息合并成第三语音信息,实现将用户分段输入的多个语音信息合并为一个完整的语音信息。需要说明的是,本发明实施例对将第一语音信息和第二语音信息合并为第三语音信息的方式不做具体限定。

步骤406、对第三语音信息进行语音识别,得到第一语音识别结果;

步骤407、分别对一个或多个第一语音信息和一个或多个第二语音信息进行语音识别,得到多个第二语音识别结果;

在本发明实施例中,移动终端对一个或多个第一语音信息和一个或多个第二语音信息分别进行语音识别,得到对应的多个第二语音识别结果。

步骤408、对多个第二语音识别结果进行语义分析,得到第三语音识别结果;

在本发明实施例中,通过现有的语义分析技术,将多个第二语音识别结果合并成一个第三语音识别结果,本发明实施例对语义分析的方式不做具体限定。

例如:用户通过移动终端的麦克风向该移动终端输入以下第一语音信息:“请于上午10点在会议室开会,开会”之后,移动终端检测到中断语音识别,则保持第一语音信息,当该移动终端检测到恢复语音识别,则该移动终端继续获取以下第二语音信息:“期间请将手机调至静音,谢谢。”,完成语音输入后,该移动终端可以将该第一语音信息和第二语音信息合成为第三语音信息:“请于上午10点在会议室开会,开会期间请将手机调至静音,谢谢。”,然后进行语音识别,得到第一语音识别结果;或者分别对该第一语音信息和第二语音信息进行语音识别,得到多个第二语音识别结果,对多个第二语音识别结果进行语义分析,得到第三语音识别结果。

需要说明的是,步骤405~步骤408可以是在移动终端执行步骤401~步骤404一次或多次后执行,其中多次执行步骤401~步骤404表示用户在使用移动终端进行语音识别时被多次打断,本发明实施例对于用户被打断一次或多次的应用场景均适用。

在本发明实施例中,语音识别被中断一次或多次后,能够获取到中断语音识别之前的一个或多个第一语音信息,以及在恢复语音识别之后的一个或多个第二语音信息,对该一个或多个第一语音信息和第二语音信息进行语音识别,从而得到完成的语义。

需要说明的是,语音识别可以采用现有的语音识别技术实现,本发明实施例对语音识别的方式不做具体限定。

这样,移动终端根据在中断语音识别之前获取的一个或多个第一语音信息,以及在恢复语音识别之后获取的一个或多个第二语音信息,能够选择先对第一语音信息和第二语音信息进行语音合并得到第三语音信息,进而识别得到第一语音识别结果;或者先分别对第一语音信息和第二语音信息进行语音识别得到多个第二语音识别结果,然后将多个第二语音识别结果合并为第三语音识别结果,得到完整的语义,避免用户因语音输入被中断而需要重新输入语音,提升了移动终端的使用体验。

参见图5,本发明实施例提供了一种移动终端500,包括:

第一确定模块501,用于在移动终端处于语音识别状态时,确定是否中断语音识别;

保存模块502,用于在第一确定模块确定中断语音识别时,保存中断语音识别之前获取的第一语音信息;

第一切换模块503,用于在第一确定模块确定中断语音识别时,从语音识别状态切换至语音识别中断状态;

第二确定模块504,用于在移动终端处于语音识别中断状态时,确定是否恢复语音识别;

第二切换模块505,用于在第二确定模块确定恢复语音识别时从语音识别中断状态切换至语音识别状态;

获取模块506,用于在第二确定模块确定恢复语音识别时获取第二语音信息;

语音识别模块507,用于对在中断语音识别之前获取的一个或多个第一语音信息,以及在恢复语音识别之后获取的一个或多个第二语音信息进行语音识别;

可选地,第一确定模块501包括:

第一获取单元5011,用于获取用户输入的第一语音指令;

第一确定单元5012,用于根据第一语音指令是否与第一预设语音指令匹配,确定是否中断语音识别;

和/或,第二获取单元5013,用于获取用户输入的第一按键操作;

第二确定单元5014,用于根据第一按键操作是否与第一预设按键操作匹配,确定是否中断语音识别;

和/或,第三获取单元5015,用于获取移动终端的显示界面的切换触发方式;

第三确定单元5016,用于根据切换触发方式是否与第一预设切换触发方式匹配,确定是否中断语音识别;

可选地,第二确定模块504包括:

第四获取单元5041,用于获取用户输入的第二语音指令;

第四确定单元5042,用于根据第二语音指令是否与第二预设语音指令匹配,确定是否恢复语音识别;

和/或,第五获取单元5043,用于获取用户输入的第二按键操作;

第五确定单元5044,用于根据第二按键操作是否与第二预设按键操作匹配,确定是否恢复语音识别;

和/或,第六获取单元5045,用于获取移动终端的显示界面的切换触发方式;

第六确定单元5046,用于根据切换触发方式是否与第二预设切换触发方式匹配,确定是否恢复语音识别;

可选地,语音识别模块507包括:

合成单元5071,用于将一个或多个第一语音信息和一个或多个第二语音信息合成,得到第三语音信息;

第一识别单元5072,用于对第三语音信息进行语音识别,得到第一语音识别结果;

和/或,第二识别单元5073,用于分别对一个或多个第一语音信息和一个或多个第二语音信息进行语音识别,得到多个第二语音识别结果;

分析单元5074,用于对多个第二语音识别结果进行语义分析,得到第三语音识别结果;

可选地,该语音识别装置500还包括:

输出模块508,用于输出提示信息,其中,提示信息包括第一语音信息的相关信息。

本发明实施例提供的移动终端能够实现图1至图4的方法实施例中移动终端实现的各个过程,为避免重复,这里不再赘述。

这样,移动终端能够在语音识别被中断时切换至语音识别中断状态,并获取中断语音识别之前的第一语音信息,在语音识别被恢复时切换至语音识别状态,并获取恢复语音识别之后的第二语音信息,根据在中断语音识别之前获取的一个或多个第一语音信息,以及在恢复语音识别之后获取的一个或多个第二语音信息,进行语音识别,得到完整的语义,避免用户因语音输入被中断而需要重新输入语音,提升了移动终端的使用体验。

图6为实现本发明各个实施例的一种移动终端的硬件结构示意图,如图所示,该移动终端600包括但不限于:射频单元601、网络模块602、音频输出单元603、输入单元604、传感器605、显示单元606、用户输入单元607、接口单元608、存储器609、处理器610、以及电源611等部件。本领域技术人员可以理解,图6中示出的移动终端结构并不构成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,移动终端包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。

在一个实施例中,处理器610,用于在移动终端处于语音识别状态时,确定是否中断语音识别;若是,保存中断语音识别之前获取的第一语音信息,从语音识别状态切换至语音识别中断状态;在移动终端处于语音识别中断状态时,确定是否恢复语音识别;若是,从语音识别中断状态切换至语音识别状态,获取第二语音信息;对在中断语音识别之前获取的一个或多个第一语音信息,以及在恢复语音识别之后获取的一个或多个第二语音信息进行语音识别。

这样,移动终端能够在语音识别被中断时切换至语音识别中断状态,并获取中断语音识别之前的第一语音信息,在语音识别被恢复时切换至语音识别状态,并获取恢复语音识别之后的第二语音信息,根据在中断语音识别之前获取的一个或多个第一语音信息,以及在恢复语音识别之后获取的一个或多个第二语音信息,进行语音识别,得到完整的语义,避免用户因语音输入被中断而需要重新输入语音,提升了移动终端的使用体验。

应理解的是,本发明实施例中,射频单元601可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器610处理;另外,将上行的数据发送给基站。通常,射频单元601包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元601还可以通过无线通信系统与网络和其他设备通信。

移动终端通过网络模块602为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。

音频输出单元603可以将射频单元601或网络模块602接收的或者在存储器609中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元603还可以提供与移动终端600执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元603包括扬声器、蜂鸣器以及受话器等。

输入单元604用于接收音频或视频信号。输入单元604可以包括图形处理器(Graphics Processing Unit,GPU)6041和麦克风6042,图形处理器6041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元606上。经图形处理器6041处理后的图像帧可以存储在存储器609(或其它存储介质)中或者经由射频单元601或网络模块602进行发送。麦克风6042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元601发送到移动通信基站的格式输出。

移动终端600还包括至少一种传感器605,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板6061的亮度,接近传感器可在移动终端600移动到耳边时,关闭显示面板6061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别移动终端姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器605还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。

显示单元606用于显示由用户输入的信息或提供给用户的信息。显示单元606可包括显示面板6061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板6061。

用户输入单元607可用于接收输入的数字或字符信息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元607包括触控面板6071以及其他输入设备6072。触控面板6071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板6071上或在触控面板6071附近的操作)。触控面板671可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器610,接收处理器610发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板6071。除了触控面板6071,用户输入单元607还可以包括其他输入设备6072。具体地,其他输入设备6072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。

进一步的,触控面板6071可覆盖在显示面板6061上,当触控面板6071检测到在其上或附近的触摸操作后,传送给处理器610以确定触摸事件的类型,随后处理器610根据触摸事件的类型在显示面板6061上提供相应的视觉输出。虽然在图6中,触控面板6071与显示面板6061是作为两个独立的部件来实现移动终端的输入和输出功能,但是在某些实施例中,可以将触控面板6071与显示面板6061集成而实现移动终端的输入和输出功能,具体此处不做限定。

接口单元608为外部装置与移动终端600连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元608可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端600内的一个或多个元件或者可以用于在移动终端600和外部装置之间传输数据。

存储器609可用于存储软件程序以及各种数据。存储器609可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器609可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器610是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器609内的软件程序和/或模块,以及调用存储在存储器609内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处理器610可包括一个或多个处理单元;优选的,处理器610可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器610中。

移动终端600还可以包括给各个部件供电的电源611(比如电池),优选的,电源611可以通过电源管理系统与处理器610逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

另外,移动终端600包括一些未示出的功能模块,在此不再赘述。

优选的,本发明实施例还提供一种移动终端,包括处理器610,存储器609,存储在存储器609上并可在所述处理器610上运行的计算机程序,该计算机程序被处理器610执行时实现上述语音识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。

本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述语音识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1