一种语音控制方法、系统、设备及计算机可读存储介质与流程

文档序号：18890216发布日期：2019-10-15 21:41阅读：185来源：国知局

本申请涉及通信技术领域，更具体地说，涉及一种语音控制方法、系统、设备及计算机可读存储介质。

背景技术：

随着通信技术的发展，智能设备越来越多的进入用户的生活，受到用户的关注，智能设备的一个特点是可以识别并响应用户的语音。以智能设备为手机为例，当用户通过特定语音唤醒手机的语音识别功能后，手机能够采集用户在一段时间内输入的语音并且进行相应处理，并且在执行完处理操作后进入休眠状态，等待下一次被用户唤醒。也即用户在使用手机等智能设备的语音交互功能时，需要多次唤醒手机，并且用户在唤醒手机后，若未能在特定时间内完成语音输入操作，手机仍会进行休眠状态，使得用户使用智能设备的体验性较差，使得智能设备处理语音的效率较低。并且，手机的便携性尚且可以弥补语音触发的缺点(长按菜单键等)，但对于一些体积比较大不具备便携性的智能设备来说，操作起来费时费力。

技术实现要素：

本申请的目的是提供一种语音控制方法，其能在一定程度上解决如何提高智能设备处理语音的效率问题。本申请还提供了一种语音控制系统、设备及计算机可读存储介质。

为了实现上述目的，本申请提供如下技术方案：

一种语音控制方法，应用于智能设备，包括：

当判定执行语音交互功能时，持续采集语音，得到目标语音；

对所述目标语音中的目标命令进行识别，并响应所述目标命令。

优选的，所述目标语音由语音单元组成；

所述持续采集语音，得到目标语音，包括：

判断当前时刻是否属于预设的语音采集时刻；

若当前时刻属于所述语音采集时刻，则从当前时刻开始，采集预设时长的语音作为所述语音单元；

若当前时刻不属于所述语音采集时刻，则返回执行所述判断当前时刻是否属于预设的语音采集时刻的步骤。

优选的，所述判断当前时刻是否属于预设的语音采集时刻之前，还包括：

按照相邻语音采集时刻间的时长小于所述预设时长，且所述预设时长大于等于所述目标命令的语音时长的原则，确定所述语音采集时刻和所述预设时长。

优选的，所述按照相邻语音采集时刻间的时长小于所述预设时长，且所述预设时长大于等于所述目标命令的语音时长的原则，确定所述语音采集时刻和所述预设时长，包括：

根据时长关系公式，按照所述相邻语音采集时刻间的时长小于所述预设时长，且所述预设时长大于等于所述目标命令的语音时长的原则，确定所述语音采集时刻和所述预设时长；

所述时长关系公式包括：

x≤(n-1)l/n；l＝np；

其中，x表示所述目标命令的语音时长；n表示大于1的正整数；l表示所述预设时长；p表示所述相邻语音采集时刻间的时长。

优选的，所述从当前时刻开始，采集预设时长的语音作为所述语音单元，包括：

选取一个空闲的用于存储语音的存储空间作为目标存储空间；

将从当前时刻开始采集的语音均存储在所述目标存储空间中，直至装满所述目标存储空间，得到所述语音单元；

其中，所述存储空间所能存储的语音的时长为所述预设时长。

优选的，所述选取一个空闲的用于存储语音的存储空间作为目标存储空间，包括：

判断是否存在空闲存储空间；

若不存在空闲存储空间，则创建一个存储空间并作为所述目标存储空间；

若存在空闲存储空间，则选取一个空闲的存储空间作为所述目标存储空间。

优选的，所述将从当前时刻开始采集的语音均存储在所述目标存储空间中，直至装满所述目标存储空间，得到所述语音单元之后，还包括：

将所述目标存储空间中的所述语音单元存储至预设音频队列中；

释放所述目标存储空间；

所述对所述目标语音中的目标命令进行识别，包括：

从所述预设音频队列中获取一个所述语音单元进行命令识别；

并从所述预设音频队列中删除选取的所述语音单元。

优选的，所述对所述目标语音中的目标命令进行识别，包括：

将所述目标语音与预设语法进行匹配，若匹配成功，则将与所述目标语音匹配的所述预设语法映射为所述目标命令。

优选的，所述智能设备包括超声设备；

所述对所述目标语音中的目标命令进行识别，并响应所述目标命令，包括：

对所述目标语音中的超声指令进行识别，并响应所述超声指令。

一种语音控制系统，应用于智能设备，包括：

第一采集模块，用于当判定执行语音交互功能时，持续采集语音，得到目标语音；

第一识别模块，用于对所述目标语音中的目标命令进行识别，并响应所述目标命令。

一种超声设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如上任一所述语音控制方法的步骤。

一种计算机可读存储介质，应用于智能设备，所述计算机可读存储介质中存储有计算机程序，所述计算机程序被处理器执行时实现如上任一所述语音控制方法的步骤。

本申请提供的一种语音控制方法，应用于智能设备，当判定执行语音交互功能时，持续采集语音，得到目标语音；对目标语音中的目标命令进行识别，并响应目标命令。本申请提供的一种语音控制方法，智能设备在判定执行语音交互功能时，持续采集语音，得到目标语音，对目标语音中的目标命令进行识别，并响应目标命令，由于是持续采集语音，使得用户无需继续唤醒智能设备即可持续输入语音，也不存在智能设备未接收完语音便进入休眠的情况，可以提高智能设备采集语音的效率，进而提高对语音的处理效率。本申请提供的一种语音控制系统、设备及计算机可读存储介质也解决了相应技术问题。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例提供的一种语音控制方法的第一流程图；

图2为本申请实施例提供的语音控制方法的第二流程图；

图3为目标命令的语音时长、预设时长、相邻语音采集时刻间的时长间的关系示意图；

图4为本申请实施例提供的一种语音控制系统的结构示意图；

图5为本申请实施例提供的一种语音控制设备的结构示意图；

图6为本申请实施例提供的一种语音控制设备的另一结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

随着通信技术的发展，智能设备越来越多的进入用户的生活，受到用户的关注，智能设备的一个特点是可以识别并响应用户的语音。以智能设备为手机为例，当用户通过特定语音唤醒手机的语音识别功能后，手机能够采集用户在一段时间内输入的语音并且进行相应处理，并且在执行完处理操作后进入休眠状态，等待下一次被用户唤醒。也即用户在使用手机等智能设备的语音交互功能时，需要多次唤醒手机，并且用户在唤醒手机后，若未能在特定时间内完成语音输入操作，手机仍会进行休眠状态，但对于一些体积比较大不具备便携性的智能设备来说，这种语音操作方式则会降低用户的使用体验。本申请提供的一种语音控制方法可以提高用户使用智能设备时的便捷性和语音处理效率。

请参阅图1，图1为本申请实施例提供的一种语音控制方法的第一流程图。

本申请实施例提供的一种语音控制方法，应用于智能设备，可以包括以下步骤：

步骤s101：当判定执行语音交互功能时，持续采集语音，得到目标语音。

实际应用中，智能设备在判定执行语音交互功能时，便持续采集语音，并得到相应的目标语音。智能设备的类型可以根据实际需要确定，比如其可以为手机、平板、超声设备等。智能设备判定执行语音交互功能的判断方法也可以根据实际需要灵活确定，比如智能设备可以在接收到特定触发命令后判定需执行语音交互功能，也可以在自身特定按键被触发时判定需执行语音交互功能，还可以在自身按键被按特定触发方式触发后判定需执行语音交互功能等。

步骤s102：对目标语音中的目标命令进行识别，并响应目标命令。

实际应用中，智能设备在采集得到目标语音后，便可以对目标语音中的目标命令进行识别，并相应识别得到目标命令等。具体应用场景中，在对目标语音中的目标命令进行识别时，可以在智能设备中预先搭建语法识别网络，将目标语音与语法识别网络进行匹配，得到相应的目标命令。具体应用场景中，在对目标语音中的目标命令进行识别时，还可以直接将目标语音与预设语法进行匹配，若匹配成功，则将与目标语音匹配的预设语法映射为目标命令。

具体应用场景中，智能设备可以为超声设备，此时对目标语音中的目标命令进行识别，并响应目标命令时，可以对目标语音中的超声指令进行识别，并响应超声指令。

实际应用中，智能设备是否关闭语音交互功能的过程可以由外界控制，比如外界可以通过指令来控制智能设备是否关闭语音交互功能等，则智能设备在响应目标命令之后，还可以判断是否接收到语音交互功能关闭指令；若接收到语音交互功能关闭指令，则停止采集语音；若未接收到语音交互功能关闭指令，则继续采集语音。应当指出，语音交互功能关闭指令可以为用户语音输入的指令，也可以为用户触发智能设备上的按键后生成的指令等。

本申请提供的一种语音控制方法，应用于智能设备，当判定执行语音交互功能时，持续采集语音，得到目标语音；对目标语音中的目标命令进行识别，并响应目标命令。本申请提供的一种语音控制方法，智能设备在判定执行语音交互功能时，持续采集语音，得到目标语音，对目标语音中的目标命令进行识别，并响应目标命令，由于是持续采集语音，使得用户无需继续唤醒智能设备即可持续输入语音，也不存在智能设备未接收完语音便进入休眠的情况，可以提高智能设备采集语音的效率，进而提高对语音的处理效率，由于不需要反复唤醒，操作简单便捷，适用于大型智能设备。

请参阅图2，图2为本申请实施例提供的语音控制方法的第二流程图。

实际应用中，本申请中的目标语音可以由多个语音单元组成，则本申请实施例提供的一种语音控制方法可以包括以下步骤：

步骤s201：当判定执行语音交互功能时，判断当前时刻是否属于预设的语音采集时刻，若是，则执行步骤s202，若否，则返回执行步骤s201。

步骤s202：采集预设时长的语音作为语音单元，执行步骤s203。

实际应用中，如果智能设备无间隔的持续采集语音的话，会造成智能设备功耗较大，为了降低智能设备的功耗，在持续采集语音时，可以先判断当前时刻是否属于预设的语音采集时刻，若是，则采集预设时长的语音作为目标语音，由于只有在语音采集时刻才采集语音，与无间隔的持续采集语音相比，可以降低智能设备采集语音时的功耗；此外，与无间隔的持续采集语音得到一个整体的目标语音相比，通过在不同的语音采集时刻采集预设时长的语音作为语音单元，相当于将目标语音拆分为多个语音单元，从而可以以语音单元为单位对采集的语音进行命令识别、处理等，也即在采集下一个语音单元时，便可以对已采集的语音单元进行处理，与采集完整个目标语音后才对语音进行处理相比，可以提高对命令的识别效率、处理效率。应当指出，本申请所涉及的语音采集时刻属于语音采集时刻集中的时刻，也即语音采集时刻的值不唯一，其数量可以由具体应用场景中语音采集时长确定。

具体应用场景中，在按照不同语音采集时刻采集预设时长的语音作为语音单元时，目标语音中的目标命令可能被保存在一个语音单元中，此时，在对每个语音单元进行命令识别时，只需在识别出目标命令后，直接响应目标命令即可；而在目标命令被保存在多个语音单元中时，在对每个语音单元进行命令识别时，各个语音单元识别得到的命令只是目标命令中的部分命令，此时，在识别出语音单元中的命令后，还需对识别出的命令进行拼凑等操作来恢复出目标命令，进而响应目标命令等。

具体应用场景中，如果预设时长小于相邻两个语音采集时刻间的时长，则会使得智能设备出现采集的目标语音不完整的情况，由此使得智能设备可能无法识别目标语音中的指令，影响用户体验，为了避免此种情况，在判断当前时刻是否属于预设的语音采集时刻之前，可以按照相邻语音采集时刻间的时长小于预设时长，且预设时长大于等于目标命令的语音时长的原则，确定语音采集时刻和预设时长。由于相邻语音采集时刻间的时长小于预设时长，且预设时长大于等于目标命令的语音时长，那么目标命令趋向于能够被完整采集到一个语音单元中，从而可以保证智能设备通过语音单元采集到完整的目标命令，避免智能设备执行对识别出的命令进行拼凑等操作，进一步提高智能设备处理语音的效率。当然，也可以有其他确定语音采集时刻和预设时长的方法，本申请在此不做具体限定。

具体应用场景中，在按照相邻语音采集时刻间的时长小于预设时长，且预设时长大于等于目标命令的语音时长的原则，确定语音采集时刻和预设时长时，可以根据时长关系公式，按照相邻语音采集时刻间的时长小于预设时长，且预设时长大于等于目标命令的语音时长的原则，确定语音采集时刻和预设时长；

时长关系公式包括：

x≤(n-1)l/n；l＝np；

其中，x表示目标命令的语音时长；n表示大于1的正整数；l表示预设时长；p表示相邻语音采集时刻间的时长。

时长关系公式的推导过程如下：

请参阅图3，图3为目标命令的语音时长、预设时长、相邻语音采集时刻间的时长间的关系示意图。为了对齐数据以方便对数据进行处理，假设l＝np，也即l是p的整数倍；当某个语音单元能够包含整个目标命令时，x≤(n-1)p，也即x≤(n-1)l/n。为了便于理解，假设目标命令的语音时长为2秒，相邻语音采集时刻间的时长为2秒，取n＝2，则预设时长便为4秒。目标命令无论在什么时段都可以被采集到一个语音单元中。

按照该计算公式可以保证目标命令能够被完整采集到一个语音单元中。

步骤s203：对语音单元中的目标命令进行识别，并响应目标命令。

实际应用中，为了便于智能设备处理目标语音，在按照语音采集时刻采集语音时，可以借助不同的语音存储载体来将不同语音采集时刻采集到的目标语音进行区分，比如可以借助存储空间来保存语音单元，并且设置存储空间所能存储的语音的时长恰好等于语音单元的时长，那么，一个存储空间便只能存储一个语音单元，从而可以借助存储空间将不同的语音单元进行区分，则从当前时刻开始，采集预设时长的语音作为语音单元时，可以选取一个空闲的用于存储语音的存储空间作为目标存储空间；将从当前时刻开始采集的语音均存储在目标存储空间中，直至装满目标存储空间，得到语音单元；其中，存储空间所能存储的语音的时长为预设时长。

具体应用场景中，已有存储空间的数量可能有限，此种情况下，如果存储空间被占用的话，会给语音单元的存储带来困扰，为了避免存储空间给语音单元的存储带来困扰，在选取一个空闲的用于存储语音的存储空间作为目标存储空间时，可以判断是否存在空闲存储空间；若不存在空闲存储空间，则创建一个存储空间并作为目标存储空间；若存在空闲存储空间，则选取一个空闲的存储空间作为目标存储空间。

具体应用场景中，借助存储空间不仅能将不同语音单元区分开来，还可以借助存储空间来对不同的语音单元进行处理，在此过程中，为了提高存储空间的利用率，并且为了便于智能设备准确对语音单元进行处理，智能设备将从当前时刻开始采集的语音均存储在目标存储空间中，直至装满目标存储空间，得到语音单元之后，还可以将目标存储空间中的语音单元存储至预设音频队列中；释放目标存储空间；相应的，在对语音单元中的目标命令进行识别时，可以从预设音频队列中获取一个语音单元进行识别；并从预设音频队列中删除选取的语音单元。也即智能设备在得到语音单元后，会将语音单元存储在预设音频队列中，然后释放目标存储空间，使得目标存储空间可以存储下一个语音单元，减少存储空间的创建数量，提高存储空间的利用率；并且智能设备每次从预设音频队列中获取一个语音单元进行识别，避免了一次对多个语音单元进行识别，从而避免了智能设备一次识别出多个命令，进而避免了因一次识别过程中命令数量过多，智能设备识别出错的情况，保证了智能设备识别语音的准确率。

本申请还提供了一种语音控制系统，其具有本申请实施例提供的一种语音控制方法具有的对应效果。请参阅图4，图4为本申请实施例提供的一种语音控制系统的结构示意图。

本申请实施例提供的一种语音控制系统，应用于智能设备，可以包括：

第一采集模块101，用于当判定执行语音交互功能时，持续采集语音，得到目标语音；

第一识别模块102，用于对目标语音中的目标命令进行识别，并响应目标命令。

本申请实施例提供的一种语音控制系统，应用于智能设备，目标语音可以由语音单元组成；

第一采集模块可以包括：

第一判断子模块，用于判断当前时刻是否属于预设的语音采集时刻；若当前时刻属于语音采集时刻，则从当前时刻开始，采集预设时长的语音作为语音单元；若当前时刻不属于语音采集时刻，则返回执行判断当前时刻是否属于预设的语音采集时刻的步骤。

本申请实施例提供的一种语音控制系统，应用于智能设备，还可以包括：

第一确定子模块，用于第一判断子模块判断当前时刻是否属于预设的语音采集时刻之前，按照相邻语音采集时刻间的时长小于预设时长，且预设时长大于等于目标命令的语音时长的原则，确定语音采集时刻和预设时长。

本申请实施例提供的一种语音控制系统，应用于智能设备，第一确定子模块可以包括：

第一确定单元，用于根据时长关系公式，按照相邻语音采集时刻间的时长小于预设时长，且预设时长大于等于目标命令的语音时长的原则，确定语音采集时刻和预设时长；

时长关系公式包括：

x≤(n-1)l/n；l＝np；

其中，x表示目标命令的语音时长；n表示大于1的正整数；l表示预设时长；p表示相邻语音采集时刻间的时长。

本申请实施例提供的一种语音控制系统，应用于智能设备，第一判断子模块可以包括：

第一选取子模块，用于选取一个空闲的用于存储语音的存储空间作为目标存储空间；

第一存储子模块，用于将从当前时刻开始采集的语音均存储在目标存储空间中，直至装满目标存储空间，得到语音单元；

其中，存储空间所能存储的语音的时长为预设时长。

本申请实施例提供的一种语音控制系统，应用于智能设备，第一选取子模块可以包括：

第一判断单元，用于判断是否存在空闲存储空间；若不存在空闲存储空间，则创建一个存储空间并作为目标存储空间；若存在空闲存储空间，则选取一个空闲的存储空间作为目标存储空间。

本申请实施例提供的一种语音控制系统，应用于智能设备，还可以包括：

第二存储子模块，用于第一存储子模块将从当前时刻开始采集的语音均存储在目标存储空间中，直至装满目标存储空间，得到语音单元之后，将目标存储空间中的语音单元存储至预设音频队列中；

第一释放子模块，用于释放目标存储空间；

第一识别模块可以包括：

第一获取子模块，用于从预设音频队列中获取一个语音单元进行识别；

第一删除子模块，用于从预设音频队列中删除选取的语音单元。

本申请实施例提供的一种语音控制系统，应用于智能设备，第一识别模块可以包括：

第一匹配单元，用于将目标语音与预设语法进行匹配，若匹配成功，则将与目标语音匹配的预设语法映射为目标命令。

本申请实施例提供的一种语音控制系统，应用于智能设备，智能设备可以包括超声设备；

第一识别模块可以包括：

第一识别单元，用于对目标语音中的超声指令进行识别，并响应超声指令。

本申请还提供了一种超声设备及计算机可读存储介质，其均具有本申请实施例提供的一种语音控制方法具有的对应效果。请参阅图5，图5为本申请实施例提供的一种超声设备的结构示意图。

本申请实施例提供的一种超声设备，应用于智能设备，包括存储器201和处理器202，存储器201中存储有计算机程序，处理器202执行存储器201中存储的计算机程序时实现如上任一实施例所描述的语音控制方法的步骤。

请参阅图6，本申请实施例提供的另一种超声设备中还可以包括：与处理器202连接的输入端口203，用于传输外界输入的命令至处理器202；与处理器202连接的显示单元204，用于显示处理器202的处理结果至外界；与处理器202连接的通信模块205，用于实现超声设备与外界的通信。显示单元204可以为显示面板、激光扫描使显示器等；通信模块205所采用的通信方式包括但不局限于移动高清链接技术(hml)、通用串行总线(usb)、高清多媒体接口(hdmi)、无线连接：无线保真技术(wifi)、蓝牙通信技术、低功耗蓝牙通信技术、基于ieee802.11s的通信技术。

本申请实施例提供的一种计算机可读存储介质，应用于智能设备，计算机可读存储介质中存储有计算机程序，计算机程序被处理器执行时实现如上任一实施例所描述的语音控制方法的步骤。

本申请所涉及的计算机可读存储介质包括随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质。

本申请实施例提供的一种语音控制系统、设备及计算机可读存储介质中相关部分的说明请参见本申请实施例提供的一种语音控制方法中对应部分的详细说明，在此不再赘述。另外，本申请实施例提供的上述技术方案中与现有技术中对应技术方案实现原理一致的部分并未详细说明，以免过多赘述。

还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明，使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：庄健春
技术所有人：深圳开立生物医疗科技股份有限公司
我是此专利的发明人

上一篇：车辆防碰撞制动方法及系统与流程
上一篇：用于在至少两辆汽车之间交换信息的方法与流程