一种语音控制方法及装置与流程

文档序号：12478640阅读：214来源：国知局

本发明涉及智能终端领域，尤其涉及一种语音控制方法及装置。

背景技术：

目前，智能终端越来越多的采用语音控制打开终端各种应用程序。现有的语音控制方法中，若用户需要打开终端某一应用程序，用户需要先通过录入预设的语音唤醒词，或触摸屏幕按钮来启动语音识别功能；再通过录入预设的开启应用程序的语音来打开相应的应用程序。例如，用户需要通过语音控制打开地图时，首先通过录入“你好，小星”(预设的语音唤醒词)启动语音识别功能；听到终端应答提示音确认终端开启语音识别功能后，接着录入“打开地图”(预设的开启地图应用的语音唤醒词)，终端打开地图。可以看出，现有的语音控制方法启动过程繁琐，用户体验差。

技术实现要素：

为解决上述技术问题，本发明实施例期望提供一种语音控制方法及装置，简化通过语音控制来启动终端应用程序的过程，提高用户体验。

本发明的技术方案是这样实现的：

第一方面，本发明实施例提供了一种语音控制方法，包括：终端获取用户的语音信号；所述终端检测所述语音信号的语音强度，并判断所述语音信号的语音强度所属的语音强度区间；所述终端根据所述语音信号所属的语音强度区间执行对应的操作。

在上述实施例中，所述语音强度区间包括以下至少一种：较强语音强度区间，一般语音强度区间，较弱语音强度区间，其中，所述较强语音强度区间的语音强度大于所述一般语音强度区间的语音强度，所述一般语音强度区间的语音强度大于所述较弱语音强度区间的语音强度。

在上述实施例中，当所述语音信号所属的语音强度区间为所述较强语音强度区间时，所述终端根据所述语音信号所属的语音强度区间执行对应的操作，具体包括：所述终端判断所述语音信号是否是预设的语音指令，若所述语音信号是预设的语音指令，则所述终端执行与所述语音信号对应的操作。

在上述实施例中，在所述终端判断所述语音信号是否是预设的语音指令之前，所述方法还包括：所述终端通过噪音检测判断出所述语音信号不是噪音时，所述终端判断所述语音信号是否是预设的语音指令。

在上述实施例中，在所述终端判断所述语音信号是否是预设的语音指令之前，所述方法还包括：所述终端判断对所述语音信号的处理时间是否小于预设的时间阈值，并在所述处理时间小于所述时间阈值时，所述终端判断所述语音信号是否是预设的语音指令。

在上述实施例中，当语音信号所属的语音强度区间为所述一般语音强度区间时，所述终端根据所述语音信号所属的语音强度区间执行对应的操作，具体包括：所述终端判断自身是否处于用户近距离操作状态，若所述终端处于所述用户近距离操作状态，且所述终端判断出所述语音信号是预设的语音指令，则所述终端执行与语音信号对应的操作。

在上述实施例中，在所述终端判断自身是否处于用户近距离操作状态之前，所述方法还包括：所述终端通过噪音检测判断出所述语音信号不是噪音时，所述终端判断自身是否处于所述用户近距离操作状态。

在上述实施例中，在所述终端判断自身是否处于用户近距离操作状态之前，所述方法还包括：所述终端判断对所述语音信号的处理时间是否小于预设的时间阈值，并在所述处理时间小于所述时间阈值时，所述终端判断自身是否处于所述用户近距离操作状态。

在上述实施例中，所述终端判断自身是否处于用户近距离操作状态，具体包括：所述终端采集当前画面信息，若根据当前画面信息识别出人脸特征，则所述终端判断自身处于所述用户近距离操作状态。

在上述实施例中，所述终端判断自身是否处于用户近距离操作状态，具体包括：所述终端通过重力传感器来判定终端显示屏垂直线与重力线的夹角是否大于预设角度，若所述终端显示屏垂直线与重力线的夹角大于预设角度，则所述终端判断自身处于所述用户近距离操作状态。

在上述实施例中，当所述语音信号所属的语音强度区间为所述较弱语音强度区间时，所述终端根据所述语音信号所属的语音强度区间执行对应的操作，具体包括：所述终端对所述语音信号不做处理。

第二方面，本发明实施例提供了一种语音控制装置，包括：获取单元、检测单元、执行单元，其中：所述获取单元，用于获取用户的语音信号；所述检测单元，用于检测所述获取单元获取的所述语音信号的语音强度，并判断所述语音信号的语音强度所属的语音强度区间；所述执行单元，用于根据所述检测单元判断出的所述语音信号所属的语音强度区间执行对应的操作。

在上述实施例中，当所述检测单元判断出所述语音信号所属的语音强度区间为所述较强语音强度区间时，所述执行单元，具体用于：判断所述语音信号是否是预设的语音指令，若所述语音信号是预设的语音指令，则执行与所述语音信号对应的操作。

在上述实施例中，所述执行单元，具体用于：通过噪音检测判断出所述语音信号不是噪音时，判断所述语音信号是否是预设的语音指令，若所述语音信号是预设的语音指令，则执行与语音信号对应的操作。

在上述实施例中，所述执行单元，具体用于：判断对所述语音信号的处理时间是否小于预设的时间阈值，并在所述处理时间小于所述时间阈值时，判断所述语音信号是否是预设的语音指令，若所述语音信号是预设的语音指令，则执行与语音信号对应的操作。

在上述实施例中，当所述检测单元判断出所述语音信号所属的语音强度区间为所述一般语音强度区间时，所述执行单元，具体用于：判断所述终端是否处于用户近距离操作状态，若所述终端处于所述用户近距离操作状态，且判断出所述语音信号是预设的语音指令，则执行与语音信号对应的操作。

在上述实施例中，所述执行单元，具体用于：通过噪音检测判断出所述语音信号不是噪音时，判断所述终端是否处于所述用户近距离操作状态，若所述终端处于所述用户近距离操作状态，且判断出所述语音信号是预设的语音指令，则执行与语音信号对应的操作。

在上述实施例中，所述执行单元，具体用于：判断对所述语音信号的处理时间是否小于预设的时间阈值，并在所述处理时间小于所述时间阈值时，判断所述终端是否处于所述用户近距离操作状态，若所述终端处于所述用户近距离操作状态，且判断出所述语音信号是预设的语音指令，则执行与语音信号对应的操作。

在上述实施例中，所述执行单元，具体用于：采集当前画面信息，若根据当前画面信息识别出人脸特征，则判断所述终端处于所述用户近距离操作状态。

在上述实施例中，所述执行单元，具体用于：通过重力传感器来判定终端显示屏垂直线与重力线的夹角是否大于预设角度，若所述终端显示屏垂直线与重力线的夹角大于预设角度，则判断所述终端处于所述用户近距离操作状态。

在上述实施例中，当所述检测单元判断出所述语音信号所属的语音强度区间为所述较弱语音强度区间时，所述执行单元，具体用于：对所述语音信号不做处理。

本发明实施例提供了一种语音控制方法及装置，通过终端获取用户的语音信号；终端检测语音信号的语音强度，并判断语音信号的语音强度所属的语音强度区间；终端根据语音信号所属的语音强度区间执行对应的操作，省略了用户通过语音唤醒词或语音识别功能开启按钮来启动语音识别功能的过程，简化了通过语音控制来启动终端应用程序的过程，提高用户体验。

附图说明

图1为本发明实施例提供的一种语音控制方法的流程示意图；

图2为本发明实施例提供的一种语音强度区间示意图；

图3为本发明实施例提供的一种语音控制方法详细实施例的流程示意图；

图4为本发明实施例提供的一种语音控制装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

图1示出了本发明实施例提供的一种语音控制方法，参考图1，该方法包括：

S101：终端获取用户的语音信号；

需要说明的是，本发明实施例提供的语音控制方法，应用于用户近距离操作终端的场景下，例如用户手持终端的场景，或用户将终端放在桌面上并靠近终端进行操作的场景。

S102：终端检测语音信号的语音强度，并判断语音信号的语音强度所属的语音强度区间；

需要说明的是，若用户近距离操作终端，终端检测到的语音信号的语音强度是在一个固定范围内变化的。例如，若用户在距离终端话筒5-20cm处说话，终端检测到的语音信号的语音强度80-100dB左右。这样，终端通过检测语音信号的语音强度，并判断语音信号的语音强度属于预先设置哪个的语音强度区间，实现终端针对不同语音强度区间对语音信号进行准确分析，为用户快速开启终端应用程序提供基础。

示例性地，语音强度区间包括以下至少一种：较强语音强度区间，一般语音强度区间，较弱语音强度区间，其中，较强语音强度区间的语音强度大于一般语音强度区间的语音强度，一般语音强度区间的语音强度大于较弱语音强度区间的语音强度。

举例来说，图2示出了一种语音强度区间示意图，参见图2所示，较强语音强度区间为语音强度大于V1的区间；一般语音强度区间为语音强度小于等于V1且大于V2；较弱语音强度区间为语音强度小于等于V2。其中，V1和V2为预先设置的用于判断是否触发终端语音控制的语音强度阈值，V1大于V2。V1及V2是终端根据用户近距离操作时检测到的语音信号的语音强度变化范围来设置的。例如，终端检测到的语音信号的语音强度变化范围为80-100dB，那么V1可以在85-95dB之间设置，V2可以在70-80dB之间设置，V1及V2的具体数值的设置可以根据实际情况进行设置，本发明实施例对此不做具体限制。

S103：终端根据语音信号所属的语音强度区间执行对应的操作。

需要说明的是，终端预先设置不同语音强度区间对应的操作。例如，对于语音强度较强的语音强度区间，由于语音强度足够大，说明用户在距离终端话筒较近处说话，便可以直接触发语音控制，执行与语音信号对应的操作，省略了用户通过语音唤醒词或语音识别功能开启按钮来启动语音识别功能的过程，使用户在使用语音识别功能开启应用程序时更加快捷。对于语音强度不太大的语音强度区间，需要进行辅助判断，即进一步确认终端处于用户近距离操作状态时，再触发语音控制，执行与语音信号对应的操作，这样可以提高终端对语音控制的准确性。对于语音强度非常弱的语音强度区间，可以忽略该语音信号。

示例性地，当语音信号所属的语音强度区间为较强语音强度区间时，终端根据语音信号所属的语音强度区间执行对应的操作，具体包括：终端判断语音信号是否是预设的语音指令，若语音信号是预设的语音指令，则终端执行与语音信号对应的操作。

其中，预设的语音指令，用于终端打开相应的应用程序。比如，用户预设语音指令“打开手机地图”，用于终端打开地图应用。又如，用户预设语音指令包括终端通信录里存储的联系人姓名，那么当用户对着终端话筒说出通信录里的联系人姓名如“张三”时，终端检索出关于“张三”的电话号码等信息供用户进行拨出电话等操作。

优选地，在终端判断语音信号是否是预设的语音指令之前，方法还包括：终端通过噪音检测判断出该语音信号不是噪音时，终端判断语音信号是否是预设的语音指令。

其中，终端对语音信号进行噪音检测，判断语音信号是典型的已知噪声还是人为语音，是通信领域的惯用技术手段，因此这里不再赘述其实现过程。

需要说明的是，终端对语音信号进行噪音检测，可以排除终端被所处环境的噪声所触发的情况，从而避免误操作，提高了终端对语音控制的准确性。

优选地，在终端判断语音信号是否是预设的语音指令之前，方法还包括：终端判断对语音信号的处理时间是否小于预设的时间阈值，并在处理时间小于预设的时间阈值时，终端判断语音信号是否是预设的语音指令。

需要说明的是，终端仅在处理时间小于预设的时间阈值时，执行与语音信号对应的操作，满足了用户语音控制终端的实效性要求，提高了用户体验。

示例性地，当语音信号所属的语音强度区间为一般语音强度区间时，终端根据语音信号所属的语音强度区间执行对应的操作，具体包括：终端判断自身是否处于用户近距离操作状态，若终端处于用户近距离操作状态，且终端判断出语音信号是预设的语音指令，则终端执行与语音信号对应的操作。

其中，用户近距离操作状态，为用户在距离终端较近处操作终端的状态，用于辅助判断终端是否触发语音控制。

优选地，在终端判断自身是否处于用户近距离操作状态之前，方法还包括：终端通过噪音检测判断出该语音信号不是噪音时，终端判断自身是否处于用户近距离操作状态。

优选地，在终端判断自身是否处于用户近距离操作状态之前，方法还包括：：终端判断对语音信号的处理时间是否小于预设的时间阈值，并在处理时间小于预设的时间阈值时，终端判断自身是否处于用户近距离操作状态。

优选地，终端判断自身是否处于用户近距离操作状态，具体包括：终端采集当前画面信息，若根据当前画面信息识别出人脸特征，则终端判断自身处于用户近距离操作状态。

需要说明的是，终端采集当前画面信息并根据当前画面信息识别出人脸特征，是现有的一项人脸识别技术，因此这里不再赘述其实现过程。。

优选地，终端判断自身是否处于用户近距离操作状态，具体包括：终端通过重力传感器来判定终端显示屏垂直线与重力线的夹角是否大于预设角度，若终端显示屏垂直线与重力线的夹角大于预设角度，则终端判断自身处于用户近距离操作状态。

其中，终端显示屏垂直线，为垂直于终端显示屏且方向面向终端外侧；重力线，方向为竖直向下；预设角度，用于判断终端显示屏是水平或倾斜的面向竖直向上的方向的，预设角度可以根据实际情况进行设置，例如，预设角度为135度，本发明实施例对此不做具体限制。

需要说明的是，终端通过重力传感器判断出终端显示屏垂直线与重力线的夹角大于预设角度时，可以判断出终端显示屏是水平或倾斜的面向竖直向上的方向，而由于大多数情况下用户对终端进行操作时，终端显示屏是水平或倾斜的面向竖直向上的方向，进而可以判断出终端处于用户近距离操作状态。

示例性地，当语音信号所属的语音强度区间为较弱语音强度区间时，终端根据语音信号所属的语音强度区间执行对应的操作，具体包括：终端对语音信号不做处理。

图3示出了本发明实施例提供的一种语音控制方法详细实施例的流程图，参考图3，该方法包括：

S301：终端获取用户的语音信号；

S302：终端检测语音信号的语音强度V；

S303：终端根据语音强度V判断语音信号所属的语音强度区间；若语音信号属于较弱语音强度区间，则继续执行步骤S301；若语音信号属于一般语音强度区间，则执行步骤S304；若语音信号属于较强语音强度区间，则执行步骤S305；

其中，终端预先设置V1为90dB，V2为70dB，若语音强度V≤V2，则语音信号属于较弱语音强度区间；若V2<V≤V1，则语音信号属于一般语音强度区间；若语音强度V>V1，则语音信号属于较强语音强度区间。

S304：终端采集当前画面信息，并判断当前画面信息是否能够识别出人脸特征，若是，则执行步骤S305；若否，则继续执行步骤S301；

S305：终端通过噪音检测判断语音信号是否噪音，若是，则继续执行步骤S301；若否，则执行步骤S306；

S306：终端判断对语音信号的处理时间是否小于预设的时间阈值，若否，则继续执行步骤S301；若是，则执行步骤S307；

S307：终端判断语音信号是否是预设的语音指令，若否，则继续执行步骤S301；若是，则执行步骤S308；

S308：终端解析语音信号，并根据解析的结果执行相应的操作。

本发明实施例提供了一种语音控制方法，通过终端获取用户的语音信号；终端检测语音信号的语音强度，并判断语音信号的语音强度所属的语音强度区间；终端根据语音信号所属的语音强度区间执行对应的操作，省略了用户通过语音唤醒词或语音识别功能开启按钮来启动语音识别功能的过程，使用户在使用语音识别功能开启应用程序时更加快捷，提高用户体验。

图4示出了本发明实施例提供的一种语音控制装置的结构示意图，参考图4，该语音控制装置40包括：获取单元401、检测单元402、执行单元403，其中：

获取单元401，用于获取用户的语音信号；

检测单元402，用于检测获取单元401获取的语音信号的语音强度，并判断语音信号的语音强度所属的语音强度区间；

执行单元403，用于根据检测单元402判断出的语音信号所属的语音强度区间执行对应的操作。

示例性地，当检测单元402判断出语音信号所属的语音强度区间为较强语音强度区间时，执行单元403，具体用于：判断语音信号是否是预设的语音指令，若语音信号是预设的语音指令，则执行与语音信号对应的操作。

示例性地，执行单元403，具体用于：通过噪音检测判断出语音信号不是噪音时，判断语音信号是否是预设的语音指令，若语音信号是预设的语音指令，则执行与语音信号对应的操作。

示例性地，执行单元403，具体用于：判断对语音信号的处理时间是否小于预设的时间阈值，并在处理时间小于时间阈值时，判断语音信号是否是预设的语音指令，若语音信号是预设的语音指令，则执行与语音信号对应的操作。

示例性地，当检测单元402判断出语音信号所属的语音强度区间为一般语音强度区间时，执行单元403，具体用于：判断终端是否处于用户近距离操作状态，若终端处于用户近距离操作状态，且判断出语音信号是预设的语音指令，则执行与语音信号对应的操作。

示例性地，执行单元403，具体用于：通过噪音检测判断出语音信号不是噪音时，判断终端是否处于用户近距离操作状态，若终端处于用户近距离操作状态，且判断出语音信号是预设的语音指令，则执行与语音信号对应的操作。

示例性地，执行单元403，具体用于：判断对语音信号的处理时间是否小于预设的时间阈值，并在处理时间小于时间阈值时，判断终端是否处于用户近距离操作状态，若终端处于用户近距离操作状态，且判断出语音信号是预设的语音指令，则执行与语音信号对应的操作。

示例性地，执行单元403，具体用于：采集当前画面信息，若根据当前画面信息识别出人脸特征，则判断终端处于用户近距离操作状态。

示例性地，执行单元403，具体用于：通过重力传感器来判定终端显示屏垂直线与重力线的夹角是否大于预设角度，若终端显示屏垂直线与重力线的夹角大于预设角度，则判断终端处于用户近距离操作状态。

示例性地，当检测单元402判断出语音信号所属的语音强度区间为较弱语音强度区间时，执行单元403，具体用于：对语音信号不做处理。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈建江;
技术所有人：中兴通讯股份有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。