一种语音控制方法及移动终端与流程

文档序号：12279214阅读：217来源：国知局

本发明涉及通信技术领域，尤其涉及一种语音控制方法及移动终端。

背景技术：

随着科学技术的发展，对于移动终端的控制由按键控制逐渐发展为触摸控制。随着移动终端用户对语音控制的需求的增加，现有的很多移动终端都搭载了智能语音系统。现有的智能语音系统进行语音控制的主要原理是：通过终端设备的麦克风进行语音输入；将声压转换为电信号之后进行语音编码，再在语音库里面进行检索；若检索到，则该移动终端进行相应的操作。但是，现有技术的语音控制的问题是无法辨别说话人的声音，因此，可能会破坏该移动终端的安全性，使任何人都可能通过语音来控制该移动终端。此外，现有技术中，用户必须启动麦克风输入模式才能进行语音输入，在息屏和锁屏下需要唤醒移动终端的中央处理器才能操作，则该移动终端在息屏和锁屏状态下需要将麦克风设置为常开才行，使得用户体验较差。

技术实现要素：

本发明实施例提供一种语音控制方法，以解决现有技术中的语音控制方法的安全性较低以及使移动终端的功耗较大的问题。

本发明实施例提供一种移动终端，以解决现有技术中的移动终端在通过语音控制时安全性较低以及功耗较大的问题。

第一方面，提供一种语音控制方法，应用于具有微型机电系统麦克风的移动终端，所述方法包括：接收移动终端用户通过所述微型机电系统麦克风输入的语音；从所述输入的语音中提取声纹；将所述声纹与预存的样本声纹比对；当所述声纹与预存的样本声纹匹配时，则从所述输入的语音中获取特征码；唤醒所述移动终端的中央处理器；根据所述特征码，控制所述中央处理器执行所述特征码对应的预设操作指令。

第二方面，提供一种移动终端，包括：微型机电系统麦克风和中央处理器，所述微型机电系统麦克风包括：第一语音接收模块，用于接收移动终端用户通过所述微型机电系统麦克风输入的语音；第一声纹提取模块，用于从所述第一语音接收模块接收的所述输入的语音中提取声纹；比对模块，用于将所述第一声纹提取模块提取的所述声纹与预存的样本声纹进行比对；特征码获取模块，用于当所述比对模块比对所述声纹与预存的样本声纹匹配时，则从所述第一语音接收模块接收的所述输入的语音中获取特征码；唤醒模块，用于唤醒所述移动终端的中央处理器；执行模块，用于根据所述特征码获取模块获取的所述特征码，控制所述中央处理器执行所述特征码对应的预设操作指令。

这样，本发明实施例中，通过提取并比对声纹，由于该声纹的特定性，提高了语音控制的安全性，并且通过微型机电系统麦克风来输入语音及对语音进行声纹比对，可在声纹匹配的情况下，再唤醒移动终端的中央处理器进行相应的操作，使得移动终端的功耗较小；在唤醒移动终端的中央处理器后，可执行该获取的特征码对应的预设操作指令。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获取其他的附图。

图1是本发明第一实施例的语音控制方法的流程图；

图2是本发明第二实施例的语音控制方法的流程图；

图3是本发明第三实施例的语音控制方法的流程图；

图4是本发明第四实施例的移动终端的一种结构框图；

图5是本发明第四实施例的移动终端的另一种结构框图；

图6是本发明第五实施例的移动终端的结构框图；

图7是本发明第六实施例的移动终端的结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获取的所有其他实施例，都属于本发明保护的范围。

第一实施例

本发明第一实施例公开了一种语音控制方法。该第一实施例的方法应用于具有微型机电系统麦克风的移动终端。其中，微型机电系统麦克风是一种能够作为主要输入接口，永远在线(always on)并随时能够接收语音指令的麦克风。该微型机电系统麦克风可检测语音，并且在检测语音的过程中不需要移动终端的中央处理器进行工作，移动终端的中央处理器可处于休眠的状态。因此，该微型机电系统麦克风在较低的待机功耗下具备较高的性能。通过采用该微型机电系统麦克风，本方法在检测语音的过程中，可使移动终端的中央处理器保持休眠的状态。如图1所示，为本发明第一实施例的语音控制方法的流程图。该第一实施例的方法具体包括如下的步骤：

步骤101：接收移动终端用户通过微型机电系统麦克风输入的语音。

移动终端用户对着微型机电系统麦克风说话从而录入该语音。优选的，该输入的语音为移动终端用户的正常的声音。当然，通过不断的接收移动终端用户的语音，随着接收的语音越多，可使对该移动终端用户的语音的识别率提高，即使采集到的语音为移动终端用户的非正常声音，也能识别出该语音的声纹，避免移动终端用户在情绪突变或者生病时无法识别声纹的问题。

步骤102：从输入的语音中提取声纹。

声纹通过声波频谱的形式表现，因此可从输入的语音中获取该声波频谱来提取声纹。

步骤103：将声纹与预存的样本声纹进行比对。

样本声纹一般是移动终端用户的声纹。声纹不仅具有特定性，而且具有相对的稳定性。因此，可通过判断提取的声纹是否与样本声纹匹配来确定输入的语音是否是移动终端用户自身的语音，从而可提高安全性。

步骤104：当声纹与预存的样本声纹匹配时，则从输入的语音中获取特征码。

其中，该特征码是通过对语音进行编码后获取的。

若声纹没有匹配成功，则不做任何处理，即不会比较特征码。

步骤105：唤醒移动终端的中央处理器。

步骤106：根据特征码，控制中央处理器执行特征码对应的预设操作指令。

根据特征码可以获取该输入的语音的对应的预设操作指令，从而可控制中央处理器执行该指令。

本发明第一实施例的方法，通过提取并比对声纹，由于该声纹的特定性，提高了语音控制的安全性，并且通过微型机电系统麦克风来输入语音及对语音进行声纹比对，可在声纹匹配的情况下，再唤醒移动终端的中央处理器进行相应的操作，使得移动终端的功耗较小；在唤醒移动终端的中央处理器后，可执行获取的特征码对应的预设操作指令。

第二实施例

本发明第二实施例公开了一种语音控制方法。该第二实施例的方法应用于具有微型机电系统麦克风的移动终端。其中，微型机电系统麦克风是一种能够作为主要输入接口，永远在线(always on)并随时能够接收语音指令的麦克风。该微型机电系统麦克风可检测语音，并且在检测语音的过程中不需要移动终端的中央处理器进行工作，移动终端的中央处理器可处于休眠的状态。因此，该微型机电系统麦克风在较低的待机功耗下具备较高的性能。通过采用该微型机电系统麦克风，本方法在检测语音的过程中，可使移动终端的中央处理器保持休眠的状态。如图2所示，为本发明第二实施例的语音控制方法的流程图。该第二实施例的方法具体包括如下的步骤：

步骤201：接收移动终端用户通过微型机电系统麦克风输入的样本语音。

该样本语音的长度没有限制，以能提取到足够的声纹为标准。输入的样本语音越多，则更有利于后续步骤匹配的准确性。优选的，该样本语音为移动终端用户的正常的声音。当然，通过不断的接收移动终端用户的语音，随着接收的语音越多，可使对该移动终端用户的语音的识别率提高，即使采集到的样本语音为移动终端用户的非正常声音，也能识别出该样本语音的声纹，避免移动终端用户在情绪突变或者生病时无法识别声纹的问题。

步骤202：从样本语音中提取声纹作为样本声纹。

该步骤提取的样本声纹可作为一种密码，若输入语音的声纹与该样本声纹匹配，才能进行后续的步骤。

步骤203：接收移动终端用户通过微型机电系统麦克风输入的语音。

移动终端用户对着微型机电系统麦克风说话从而录入该语音。与步骤201相同，优选的，该输入的语音为移动终端用户的正常的声音。

步骤204：从输入的语音中提取声纹。

声纹通过声波频谱的形式表现，因此可从输入的语音中获取该声波频谱来提取声纹。

步骤205：将声纹与预存的样本声纹进行比对。

步骤206：当声纹与预存的样本声纹匹配时，则从输入的语音中获取特征码。

其中，该特征码是通过对语音进行编码后获取的。

若声纹没有匹配成功，则不做任何处理。

步骤207：唤醒移动终端的中央处理器。

步骤208：解析特征码，获取输入的语音对应的操作指令。

根据特征码可以获取该输入的语音对应的操作指令，从而可控制中央处理器执行该指令。

步骤209：判断操作指令在移动终端是否存在对应的操作响应指令。

例如，操作指令是打开音乐播放器，操作响应指令为音乐播放器，则判断操作指令在移动终端是否存在对应的操作响应指令即判断移动终端是否安装有音乐播放器。例如，操作指令是今天的温度，操作响应指令也为今天的温度，则判断操作指令在移动终端是否存在对应的操作响应指令即判断在移动终端是否存储有今天的温度。

若移动终端存在对应的操作响应指令，则执行步骤210。若移动终端不存在对应的操作响应指令，则执行步骤211。

步骤210：执行操作响应指令对应的操作。

优选的，步骤210具体包括：

1、若操作响应指令为应用，则执行该应用对应的操作。

例如，操作指令是打开音乐播放器，操作响应指令为音乐播放器，则执行该应用对应的操作为打开音乐播放器。

2、若操作响应指令为信息，则将信息通过显示的方式和/或语音的方式反馈给移动终端用户。

该种情况下，一般操作指令与操作响应指令相同。

例如，操作指令是今天的温度，则操作响应指令也为今天的温度，则将今天的温度通过显示的方式和/或语音的方式反馈给移动终端用户。

其中，通过显示的方式需要唤醒移动终端的屏幕。通过语音的方式不需要唤醒移动终端的屏幕，可节省移动终端功耗。

步骤211：通过网络搜索与操作指令对应的操作响应指令，并执行操作响应指令对应的操作。

具体的，步骤211包括：

1、若操作响应指令为应用，则将应用对应的信息通过显示的方式和/或语音的方式反馈给移动终端用户。

例如，操作指令是打开音乐播放器，则操作响应指令为音乐播放器，通过网络搜索到音乐播放器后，向移动终端用户显示该音乐播放器对应的信息，例如网址、名称等等，以便移动终端用户决定打开或者下载等等。

2、若操作响应指令为信息，则将信息通过显示的方式和/或语音的方式反馈给移动终端用户。

该种情况下，一般操作指令与操作响应指令相同。

例如，操作指令是今天的温度，则操作响应指令也为今天的温度，通过网络搜索到今天的温度，向移动终端用户反馈今天的温度。

通过显示的方式需要唤醒移动终端的屏幕。通过语音的方式不需要唤醒移动终端的屏幕，可节省移动终端功耗。

综上，本发明第二实施例的方法，通过提取并比对声纹，由于该声纹的特定性，提高了语音控制的安全性，并且通过微型机电系统麦克风来输入语音及对语音进行声纹比对，可在声纹匹配的情况下，再唤醒移动终端的中央处理器进行相应的操作，使得移动终端的功耗较小；可通过判断移动终端是否存在操作指令对应的操作响应指令或者通过网络搜索与操作指令对应的操作响应指令，并执行该操作响应指令对应的操作。

第三实施例

本发明第三实施例公开了一种语音控制方法。该第三实施例的方法应用于具有微型机电系统麦克风的移动终端。其中，微型机电系统麦克风是一种能够作为主要输入接口，永远在线(always on)并随时能够接收语音指令的麦克风。该微型机电系统麦克风可检测语音，并且在检测语音的过程中不需要移动终端中央处理器进行工作，移动终端的中央处理器可处于休眠的状态。因此，该微型机电系统麦克风在较低的待机功耗下具备较高的性能。通过采用该微型机电系统麦克风，本方法在检测语音的过程中，可使移动终端中央处理器保持休眠的状态。如图3所示，为本发明第三实施例的语音控制方法的流程图。该第三实施例的方法具体包括如下的步骤：

步骤301：接收移动终端用户通过微型机电系统麦克风输入的样本语音。

步骤302：从样本语音中提取声纹作为样本声纹。

该步骤提取的样本声纹可作为一种密码，若输入语音的声纹与该样本声纹匹配，才能进行后续的步骤。

步骤303：接收移动终端用户通过微型机电系统麦克风输入的样本特征字符串。

其中，该样本特征字符串包括如下的至少一项：字、词语、句子、单个数字、数字串。应当理解的是，该样本特征字符串并不以此为限。

例如，样本特征字符串为微信、打电话、123等等。

步骤304：生成与样本特征字符串关联的样本指令。

该生成与样本特征字符串关联的样本指令可由移动终端用户根据自己的习惯、喜好、需求等来设置。例如，样本特征字符串为打电话，则该样本特征字符串关联的样本指令为打电话。例如，样本特征字符串为微信，则可将该样本特征字符串与打开微信的样本指令关联。例如，样本特征字符串为123，则可将该样本特征字符串与打开音乐播放器的样本指令关联。

步骤305：获取样本特征字符串的样本特征码。

通过对样本特征字符串进行编码获取样本特征字符串的样本特征码。

步骤306：接收移动终端用户通过微型机电系统麦克风输入的语音。

移动终端用户对着微型机电系统麦克风说话从而录入该语音。与步骤301相同，优选的，该输入的语音为移动终端用户的正常的声音。

步骤307：从输入的语音中提取声纹。

声纹通过声波频谱的形式表现，因此可从输入的语音中获取该声波频谱来提取声纹。

步骤308：将声纹与预存的样本声纹进行比对。

步骤309：当声纹与预存的样本声纹匹配时，则从输入的语音中获取特征码。

其中，该特征码是通过对语音进行编码后获取的。

若声纹没有匹配成功，则不做任何处理。

步骤310：将从输入的语音中获取的至少一个特征码与预存的样本特征码比较。

虽然通过步骤308确定该输入语音来自于移动终端用户，但是，即使输入的是移动终端用户的语音，移动终端用户可能并不想使用移动终端进行任何操作。例如，移动终端用户可能说话声音较大，使得微型机电系统麦克风采集到了该语音，但其实移动终端用户并没有要唤醒移动终端的中央处理器进行任何操作的意愿。因此，如果只匹配成功了声纹，就唤醒移动终端的中央处理器，则可能会浪费功耗。因此，该步骤310的目的是在唤醒移动终端之前，通过比较特征码再增加一个匹配的过程，以降低移动终端的中央处理器被误唤醒的可能性。

输入语音中可以包含至少一个特征码。该特征码是通过对语音进行编码后提取的。该步骤310无须提取该输入语音中的所有特征码，只需提取至少一个特征码与预存的样本特征码比较即可，以减少比较的时间。该比较的特征码的数量可由移动终端系统或者移动终端用户设定，例如设置比较的特征码为两个。

步骤311：若预存的样本特征码中存在输入的语音的特征码，则唤醒移动终端的中央处理器。

在特征码也匹配的情况下，表明移动终端用户确实需要使用移动终端，则唤醒移动终端的中央处理器。

步骤312：将输入语音的所有特征码与预存的样本特征码比较。

由于要确定执行的指令是样本指令中的哪一条指令，因此，需要对所有的特征码进行匹配，从而可获取对应的样本指令。

步骤313：根据存在于预存的样本特征码中的输入的语音的特征码，获取输入的语音的特征码对应的样本特征字符串。

样本特征字符串可以由至少一个样本特征码构成。

例如，如果输入语音为微信，该输入语音的特征码为微信。样本特征码中也有微信，则该输入语音的特征码均存在于样本特征码中。因此，获取该输入语音的特征码对应的样本特征字符串为微信。

例如，如果输入语音为打开微信并找到联系人A，该输入语音的特征码为微信、联系人A。但是，样本特征码中只有微信，则只有该输入语音的特征码中的微信存在于样本特征码中。因此，获取该输入语音的特征码对应的样本特征字符串为微信。

步骤314：根据样本特征字符串执行与样本特征字符串关联的样本指令。

例如，样本字符串为微信，与微信关联的样本指令为打开微信，则执行该打开微信的样本指令。

步骤315：将中央处理器切换至休眠状态。

在执行完指令后，将中央处理器切换至休眠状态，以节省功耗。

综上，本发明第三实施例的方法，通过提取并比对声纹，由于该声纹的特定性，提高了语音控制的安全性，并且通过微型机电系统麦克风来输入语音及对语音进行声纹比对和特征码比较，可在声纹和特征码都匹配的情况下，再唤醒移动终端的中央处理器进行相应的操作，使得移动终端的功耗较小；通过将输入语音的特征码与样本特征码比较，从而可获取对应的样本指令，以便执行该特征码对应的预设操作指令。

第四实施例

本发明第四实施例提供了一种移动终端。该实施例的移动终端可以是但不限于手机、平板电脑、MP3/MP4、智能手表、智能手环、个人数字助理(Personal Digital Assistant，PDA)、车载电脑等等。如图4和5所示，分别为本发明第四实施例的移动终端的一种结构框图和本发明第四实施例的移动终端的另一种结构框图。

该移动终端400包括：微型机电系统麦克风410和中央处理器420。其中，微型机电系统麦克风410是一种能够作为主要输入接口，永远在线(always on)并随时能够接收语音指令的麦克风。该微型机电系统麦克风410可检测语音，并且在检测语音的过程中不需要移动终端400的中央处理器420进行工作，移动终端400的中央处理器420可处于休眠的状态。因此，该微型机电系统麦克风410在较低的待机功耗下具备较高的性能。通过设置该微型机电系统麦克风400，本实施例的移动终端400在检测语音的过程中，可使移动终端400的中央处理器420保持休眠的状态。

此外，该微型机电系统麦克风410具体包括如下的模块：

第一语音接收模块4101，用于接收移动终端400用户通过微型机电系统麦克风410输入的语音。

移动终端400用户对着微型机电系统麦克风410说话从而录入该语音。优选的，该输入的语音为移动终端400用户的正常的声音。当然，通过不断的接收移动终端400用户的语音，随着接收的语音越多，可使对该移动终端400用户的语音的识别率提高，即使采集到的语音为移动终端400用户的非正常声音，也能识别出该语音的声纹，避免移动终端400用户在情绪突变或者生病时无法识别声纹的问题。

第一声纹提取模块4102，用于从第一语音接收模块4101接收的输入的语音中提取声纹。

声纹通过声波频谱的形式表现，因此第一声纹提取模块4102可从输入的语音中获取该声波频谱来提取声纹。

比对模块4103，用于将第一声纹提取模块4102提取的声纹与预存的样本声纹进行比对。

样本声纹一般是移动终端400用户的声纹。声纹不仅具有特定性，而且具有相对的稳定性。因此，比对模块4103可通过判断提取的声纹是否与样本声纹匹配来确定输入的语音是否是移动终端400用户自身的语音，从而可提高安全性。

特征码获取模块4104，用于当比对模块4103比对声纹与预存的样本声纹匹配时，则从第一语音接收模块4102接收的输入的语音中获取特征码。

其中，该特征码是通过对语音进行编码后获取的。

若声纹没有匹配成功，则不做任何处理，即不会比较特征码。

唤醒模块4105，用于唤醒移动终端的中央处理器420。

控制模块4106，用于根据特征码获取模块4104获取的特征码，控制中央处理器420执行特征码对应的预设操作指令。

控制模块4106根据特征码可以获取该输入的语音对应的预设指令，从而可控制中央处理器420执行该指令。

通过上述的模块设计，提取并匹配声纹，由于该声纹的特定性，提高了语音控制的安全性，并且通过微型机电系统麦克风410来输入语音及对语音进行声纹匹配，可在声纹匹配成功的情况下，再唤醒移动终端400的中央处理器420进行相应的操作，使得移动终端400的功耗较小；在唤醒移动终端400的中央处理器420后，可执行该语音表示的指令。

优选的，中央处理器420包括：

指令获取模块4201，用于解析特征码获取模块4104获取的特征码，获取输入的语音对应的操作指令。

指令获取模块4201根据特征码可以获取该输入的语音对应的操作指令。

第一判断模块4202，用于判断指令获取模块4201获取的操作指令在移动终端400是否存在对应的操作响应指令。

若移动终端400存在对应的操作响应指令，则由第一执行模块4203进行相应的操作。若移动终端400不存在对应的操作响应指令，则由第二执行模块4204进行相应的操作。

第一执行模块4203，用于若第一判断模块4202判断移动终端400存在对应的操作响应指令，则执行操作响应指令对应的操作。

优选的，该第一执行模块4203包括：

第一执行子模块42031，用于若操作响应指令为应用，则执行应用对应的操作。

例如，指令获取模块4201获取的操作指令是打开音乐播放器，则操作响应指令为音乐播放器，第一判断模块4202判断移动终端400安装有音乐播放器，则第一执行子模块42031打开音乐播放器。

第二执行子模块42032，用于若操作响应指令为信息，则将信息通过显示的方式和/或语音的方式反馈给移动终端400用户。

该种情况下，一般操作指令与操作响应指令相同。

例如，指令获取模块4201获取的操作指令是今天的温度，则操作响应指令也是今天的温度，第一判断模块4202判断移动终端400存储有今天的温度，第二执行子模块42032向移动终端400用户反馈今天的温度。

其中，通过显示的方式需要唤醒移动终端400的屏幕。通过语音的方式不需要唤醒移动终端400的屏幕，可节省移动终端400功耗。

第二执行模块4204，用于若第一判断模块4202判断移动终端400不存在对应的操作响应指令，则通过网络搜索与操作指令对应的操作响应指令，并执行操作响应指令对应的操作。

其中，第二执行模块4204包括：

第三执行子模块42041，用于若操作响应指令为应用，则将应用对应的信息通过显示的方式和/或语音的方式反馈给移动终端400用户。

例如，操作指令是打开音乐播放器，则操作响应指令为音乐播放器，通过网络搜索到音乐播放器后，第三执行子模块42041向移动终端400用户显示该音乐播放器对应的信息，例如网址、名称等等，以便移动终端400用户决定打开或者下载等等。

第四执行子模块42042，用于若操作响应指令为信息，则将信息通过显示的方式和/或语音的方式反馈给移动终端400用户。

该种情况下，一般操作指令与操作响应指令相同。

例如，操作指令是今天的温度，则操作响应指令也为今天的温度，通过网络搜索到今天的温度，第四执行子模块42042向移动终端400用户反馈今天的温度。

通过显示的方式需要唤醒移动终端400的屏幕。通过语音的方式不需要唤醒移动终端400的屏幕，可节省移动终端400功耗。

通过上述的模块设计，可通过判断移动终端400是否存在操作指令对应的操作响应指令或者通过网络搜索与操作指令对应的操作响应指令，并执行该操作响应指令对应的操作。

优选的，该微型机电系统麦克风410还包括：

第二语音接收模块4107，用于第一语音接收模块4101接收移动终端400用户通过微型机电系统麦克风410输入的语音的步骤之前，接收移动终端400用户通过微型机电系统麦克风410输入的样本语音。

该样本语音的长度没有限制，以能提取到足够的声纹为标准。输入的样本语音越多，则更有利于后续步骤匹配的准确性。优选的，该样本语音为移动终端400用户的正常的声音。

第二声纹提取模块4108，用于从第二语音接收模块4107接收的样本语音中提取声纹作为样本声纹。

第二声纹提取模块4108提取的样本声纹可作为一种密码，若输入语音的声纹与该样本声纹匹配，才能进行后续的过程。

通过上述的模块设计，可获取样本声纹。

优选的，该微型机电系统麦克风410还包括：

样本特征字符串接收模块4109，用于第二声纹提取模块4108从样本语音中提取声纹作为样本声纹的步骤之后，接收移动终端400用户通过微型机电系统麦克风410输入的样本特征字符串。

其中，样本特征字符串包括如下的至少一项：字、词语、句子、单个数字、数字串。应当理解的是，该样本特征字符串并不以此为限。

例如，样本特征字符串为微信、打电话、123等等。

样本指令生成模块4110，用于生成与样本特征字符串接收模块4109接收的样本特征字符串关联的样本指令。

样本指令生成模块4110生成与样本特征字符串关联的样本指令可由移动终端400用户根据自己的习惯、喜好、需求等来设置。例如，样本特征字符串为打电话，则该样本特征字符串关联的样本指令为打电话。例如，样本特征字符串为微信，则可将该样本特征字符串与打开微信的样本指令关联。例如，样本特征字符串为123，则可将该样本特征字符串与打开音乐播放器的样本指令关联。

样本特征码获取模块4111，用于获取样本特征字符串接收模块4109接收的样本特征字符串的样本特征码。

样本特征码获取模块4111通过对样本特征字符串进行编码获取样本特征自字符串的样本特征码。

通过上述的模块设计，可获取关联的样本字符串、样本指令和样本特征码，为后续执行输入的语音的指令提供参照。

优选的，唤醒模块4105包括：

第一特征码比较子模块41051，用于将特征码获取模块4104从输入的语音中获取的至少一个特征码与样本特征码获取模块4111获取的该预存的样本特征码比较。

若声纹没有匹配成功，则不做任何处理，即不会比较特征码。

虽然确定该输入语音来自于移动终端400用户，但是，即使输入的是移动终端400用户的语音，移动终端400用户可能并不想使用移动终端400进行任何操作。例如，移动终端400用户可能说话声音较大，使得微型机电系统麦克风410采集到了该语音，但其实移动终端400用户并没有要唤醒移动终端400的中央处理器420进行任何操作的意愿。因此，如果只匹配成功了声纹，就唤醒移动终端400的中央处理器420，则可能会浪费功耗。

因此，该设计第一特征码比较子模块40151的目的是在唤醒移动终端400的中央处理器420之前，通过比较特征码再增加一个匹配的过程，以降低移动终端400的中央处理器420被误唤醒的可能性。

输入语音中可以包含至少一个特征码。该特征码是通过对语音进行编码后提取的。第一特征码比较子模块41051无须提取该输入语音中的所有特征码，只需提取至少一个特征码与预存的样本特征码比较即可，以减少比较的时间。该比较的特征码的数量可由移动终端400系统或者移动终端400用户设定，例如设置比较的特征码为两个。

唤醒子模块41052，用于若第一特征码比较子模块41051比较得到预存的样本特征码中存在输入语音的特征码，则唤醒移动终端400的中央处理器420。

在特征码也匹配的情况下，表明移动终端400用户确实需要使用移动终端400，则唤醒子模块41051唤醒移动终端400的中央处理器420。

通过上述的模块设计，除声纹匹配以外，可在至少一个特征码与样本特征码也匹配的情况下，再唤醒移动终端400的中央处理器420。

优选的，中央处理器420包括：

第二特征码比较模块4205，用于将特征码获取模块4104获取的该输入的语音的所有特征码与样本特征码获取模块4111获取的预存的样本特征码比较。

由于要确定执行的指令是样本指令中的哪一条指令，因此，第二特征码比较模块4205需要对所有的特征码进行匹配，从而可获取对应的样本指令。

特征字符串获取模块4206，用于根据存在于样本特征码获取模块4111获取的预存的样本特征码中的特征码获取模块4104获取的该输入的语音的特征码，获取特征码获取模块4104获取的输入语音的特征码对应的样本特征码获取模块4111获取的样本特征字符串。

样本特征字符串可以由至少一个样本特征码构成。

例如，如果输入语音为微信，该输入语音的特征码为微信。样本特征码中也有微信，则该输入语音的特征码均存在于样本特征码中。因此，特征字符串获取模块4206获取该输入语音的特征码对应的样本特征字符串为微信。

例如，如果输入语音为打开微信并找到联系人A，该输入语音的特征码为微信、联系人A。但是，样本特征码中只有微信，则只有该输入语音的特征码中的微信存在于样本特征码中。因此，特征字符串获取模块4206获取该输入语音的特征码对应的样本特征字符串为微信。

第三执行模块4207，用于根据特征字符串获取模块4206获取的样本特征字符串执行样本指令生成模块4110生成的与样本特征字符串关联的样本指令。

例如，样本字符串为微信，与微信关联的样本指令为打开微信，则第三执行模块4207执行该打开微信的样本指令。

优选的，该中央处理器420还包括：

休眠模块4208，用于控制模块4106根据特征码获取模块4104获取的所述特征码，控制中央处理器420执行特征码对应的预设操作指令的步骤之后，将中央处理器420切换至休眠状态。

综上，本发明第四实施例的移动终端400，通过提取并比对声纹，由于该声纹的特定性，提高了语音控制的安全性，并且通过微型机电系统麦克风410来输入语音及对语音进行声纹比对和特征码比较，可在声纹和特征码都匹配的情况下，再唤醒移动终端400的中央处理器420进行相应的操作，使得移动终端400的功耗较小；在唤醒移动终端400的中央处理器420后，可执行获取的特征码对应的预设操作指令。

第五实施例

图6是本发明第五实施例的移动终端的结构框图。图6所示的移动终端600包括：至少一个中央处理器601、存储器602、至少一个网络接口604、用户接口603和微型机电系统麦克风606。移动终端600中的各个组件通过总线系统605耦合在一起。可理解，总线系统605用于实现这些组件之间的连接通信。总线系统605除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图6中将各种总线都标为总线系统605。

其中，用户接口603可以包括显示器、键盘或者点击设备例如，鼠标，轨迹球(trackball)、触感板或者触摸屏等。

可以理解，本发明实施例中的存储器602可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM，DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(Synch Link DRAM，SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM，DRRAM)。本发明实施例描述的系统和方法的存储器602旨在包括但不限于这些和任意其它适合类型的存储器。

在一些实施方式中，存储器602存储了如下的元素，可执行模块或者数据结构，或者他们的子集，或者他们的扩展集：操作系统6021和应用程序6022。

其中，操作系统6021，包含各种系统程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务。应用程序6022，包含各种应用程序，例如媒体播放器(MediaPlayer)、浏览器(Browser)等，用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序6022中。

在本发明实施例中，通过调用存储器602存储的程序或指令，具体的，可以是应用程序6022中存储的程序或指令。接收移动终端600用户通过微型机电系统麦克风606输入的语音；微型机电系统麦克风606用于从输入的语音中提取声纹；将声纹与预存的样本声纹进行比对；当声纹与预存的样本声纹匹配时，则从输入的语音中获取特征码；唤醒移动终端的中央处理器601；根据特征码，控制中央处理器601执行特征码对应的预设操作指令。

上述本发明实施例揭示的方法部分应用于微型机电系统麦克风606中。微型机电系统麦克风606是一种能够作为主要输入接口，永远在线(always on)并随时能够接收语音指令的麦克风。该微型机电系统麦克风606可检测语音，并且在检测语音的过程中不需要移动终端600的中央处理器601进行工作，移动终端600的中央处理器601可处于休眠的状态。因此，该微型机电系统麦克风606在较低的待机功耗下具备较高的性能。通过设置该微型机电系统麦克风606，本实施例的移动终端600在检测语音的过程中，可使移动终端600的中央处理器601保持休眠的状态。

上述本发明实施例揭示的方法还可以部分应用于中央处理器601中，或者由中央处理器601实现。中央处理器601可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的唤醒中央处理器601后的步骤可以通过中央处理器601中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器601可以是通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器602，中央处理器601读取存储器602中的信息，结合其硬件完成上述方法的步骤。

可以理解的是，本发明实施例描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现，处理单元可以实现在一个或多个专用集成电路(Application Specific Integrated Circuits，ASIC)、数字信号处理器(Digital Signal Processing，DSP)、数字信号处理设备(DSP Device，DSPD)、可编程逻辑设备(Programmable Logic Device，PLD)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。

对于软件实现，可通过执行本发明实施例所述功能的模块(例如过程、函数等)来实现本发明实施例所述的技术。软件代码可存储在存储器602中并通过微型机电系统麦克风606执行。存储器602可以在处理器601中或在处理器601外部实现。

可选地，微型机电系统麦克风606用于根据特征码，控制中央处理器601执行特征码对应的预设操作指令的步骤中，中央处理器601用于解析特征码，获取输入的语音对应的操作指令；判断操作指令在移动终端600是否存在对应的操作响应指令；若移动终端600存在对应的操作响应指令，则执行操作响应指令对应的操作；若移动终端600不存在对应的操作响应指令，则通过网络搜索与操作指令对应的操作响应指令，并执行操作响应指令对应的操作。

可选地，作为另一个实施例，若移动终端600存在对应的操作响应指令，则中央处理器601用于执行操作响应指令对应的操作的步骤中，中央处理器601具体用于若操作响应指令为应用，则执行应用对应的操作；或者，若操作响应指令为信息，则将信息通过显示的方式和/或语音的方式反馈给移动终端600用户。

可选地，若移动终端600不存在对应的操作响应指令，则中央处理器601通过网络搜索与操作指令对应的操作响应指令，并执行操作响应指令对应的操作的步骤中，中央处理器601具体用于若操作响应指令为应用，则将应用对应的信息通过显示的方式和/或语音的方式反馈给移动终端600用户；或者，若操作响应指令为信息，则将信息通过显示的方式和/或语音的方式反馈给移动终端600用户。

可选地，接收移动终端600用户通过微型机电系统麦克风606输入的语音的步骤之前，接收移动终端600用户通过微型机电系统麦克风606输入的样本语音；微型机电系统麦克风606用于从样本语音中提取声纹作为样本声纹。

可选地，微型机电系统麦克风606用于从样本语音中提取声纹作为样本声纹的步骤之后，接收移动终端600用户通过微型机电系统麦克风606输入的样本特征字符串；微型机电系统麦克风606用于生成与样本特征字符串关联的样本指令；获取样本特征字符串的样本特征码；其中，样本特征字符串包括如下的至少一项：字、词语、句子、单个数字、数字串。

可选地，微型机电系统麦克风606用于唤醒移动终端600的中央处理器601的步骤中，微型机电系统麦克风606用于将从输入的语音中获取的至少一个特征码与预存的样本特征码比较；若预存的样本特征码中存在输入的语音的特征码，则唤醒移动终端600的中央处理器601；微型机电系统麦克风606用于根据特征码，控制中央处理器601执行特征码对应的预设操作指令的步骤中，中央处理器601用于将输入的语音的所有特征码与预存的样本特征码比较；根据存在于预存的样本特征码中的输入的语音的特征码，获取输入的语音的特征码对应的样本特征字符串；根据样本特征字符串执行与样本特征字符串关联的样本指令。

可选地，微型机电系统麦克风606用于根据特征码，控制中央处理601器执行特征码对应的预设操作指令的步骤之后，将中央处理器601切换至休眠状态。

移动终端600能够实现前述实施例中移动终端实现的各个过程，为避免重复，这里不再赘述。

本发明第五实施例的移动终端600，通过提取并比对声纹，由于该声纹的特定性，提高了语音控制的安全性，并且通过微型机电系统麦克风606来输入语音及对语音进行声纹比对和特征码比较，可在声纹和特征码都匹配的情况下，再唤醒移动终端600的中央处理器601进行相应的操作，使得移动终端600的功耗较小；在唤醒移动终端600的中央处理器601后，可执行获取的特征码对应的预设操作指令。

第六实施例

图7是本发明第六实施例的移动终端的结构示意图。具体地，图7中的移动终端700可以为手机、平板电脑、个人数字助理(Personal Digital Assistant，PDA)、或车载电脑等。

图7中的移动终端700包括射频(Radio Frequency，RF)电路710、存储器720、输入单元730、显示单元740、中央处理器760、音频电路770、WiFi(Wireless Fidelity)模块780、电源790和微型机电系统麦克风750。

其中，输入单元730可用于接收用户输入的数字或字符信息，以及产生与移动终端700的用户设置以及功能控制有关的信号输入。具体地，本发明实施例中，该输入单元730可以包括触控面板731。触控面板731，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板731上的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触控面板731可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给该处理器760，并能接收处理器760发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板731。除了触控面板731，输入单元730还可以包括其他输入设备732，其他输入设备732可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

其中，显示单元740可用于显示由用户输入的信息或提供给用户的信息以及移动终端700的各种菜单界面。显示单元740可包括显示面板741，可选的，可以采用LCD或有机发光二极管(Organic Light-Emitting Diode，OLED)等形式来配置显示面板741。

应注意，触控面板731可以覆盖显示面板741，形成触摸显示屏，当该触摸显示屏检测到在其上或附近的触摸操作后，传送给处理器760以确定触摸事件的类型，随后处理器760根据触摸事件的类型在触摸显示屏上提供相应的视觉输出。

触摸显示屏包括应用程序界面显示区及常用控件显示区。该应用程序界面显示区及该常用控件显示区的排列方式并不限定，可以为上下排列、左右排列等可以区分两个显示区的排列方式。该应用程序界面显示区可以用于显示应用程序的界面。每一个界面可以包含至少一个应用程序的图标和/或widget桌面控件等界面元素。该应用程序界面显示区也可以为不包含任何内容的空界面。该常用控件显示区用于显示使用率较高的控件，例如，设置按钮、界面编号、滚动条、电话本图标等应用程序图标等。

其中中央处理器760是移动终端700的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在第一存储器721内的软件程序和/或模块，以及调用存储在第二存储器722内的数据，执行移动终端700的各种功能和处理数据，从而对移动终端700进行整体监控。可选的，中央处理器760可包括一个或多个处理单元。

其中，微型机电系统麦克风750是一种能够作为主要输入接口，永远在线(always on)并随时能够接收语音指令的麦克风。该微型机电系统麦克风750可检测语音，并且在检测语音的过程中不需要移动终端700的中央处理器760进行工作，移动终端700的中央处理器760可处于休眠的状态。因此，该微型机电系统麦克风750在较低的待机功耗下具备较高的性能。通过设置该微型机电系统麦克风750，本实施例的移动终端700在检测语音的过程中，可使移动终端700的中央处理器760保持休眠的状态。

在本发明实施例中，通过调用存储该第一存储器721内的软件程序和/或模块和/或该第二存储器722内的数据，接收移动终端700用户通过微型机电系统麦克风750输入的语音；微型机电系统麦克风750用于从输入的语音中提取声纹；将声纹与预存的样本声纹进行比对；当声纹与预存的样本声纹匹配时，则从输入的语音中获取特征码；唤醒移动终端的中央处理器760；根据特征码，控制中央处理器760执行特征码对应的预设操作指令。

可选地，微型机电系统麦克风750用于根据特征码，控制中央处理器760执行特征码对应的预设操作指令的步骤中，中央处理器760用于解析特征码，获取输入的语音对应的操作指令；判断操作指令在移动终端700是否存在对应的操作响应指令；若移动终端700存在对应的操作响应指令，则执行操作响应指令对应的操作；若移动终端700不存在对应的操作响应指令，则通过网络搜索与操作指令对应的操作响应指令，并执行操作响应指令对应的操作。

可选地，作为另一个实施例，若移动终端700存在对应的操作响应指令，则中央处理器760用于执行操作响应指令对应的操作的步骤中，中央处理器760具体用于若操作响应指令为应用，则执行应用对应的操作；或者，若操作响应指令为信息，则将信息通过显示的方式和/或语音的方式反馈给移动终端700用户。

可选地，若移动终端700不存在对应的操作响应指令，则中央处理器760通过网络搜索与操作指令对应的操作响应指令，并执行操作响应指令对应的操作的步骤中，中央处理器760具体用于若操作响应指令为应用，则将应用对应的信息通过显示的方式和/或语音的方式反馈给移动终端700用户；或者，若操作响应指令为信息，则将信息通过显示的方式和/或语音的方式反馈给移动终端700用户。

可选地，接收移动终端700用户通过微型机电系统麦克风750输入的语音的步骤之前，接收移动终端700用户通过微型机电系统麦克风750输入的样本语音；微型机电系统麦克风750用于从样本语音中提取声纹作为样本声纹。

可选地，微型机电系统麦克风750用于从样本语音中提取声纹作为样本声纹的步骤之后，接收移动终端700用户通过微型机电系统麦克风750输入的样本特征字符串；微型机电系统麦克风750用于生成与样本特征字符串关联的样本指令；获取样本特征字符串的样本特征码；其中，样本特征字符串包括如下的至少一项：字、词语、句子、单个数字、数字串。

可选地，微型机电系统麦克风750用于唤醒移动终端700的中央处理器760的步骤中，微型机电系统麦克风750用于将从输入的语音中获取的至少一个特征码与预存的样本特征码比较；若预存的样本特征码中存在输入的语音的特征码，则唤醒移动终端700的中央处理器760；微型机电系统麦克风750用于根据特征码，控制中央处理器760执行特征码对应的预设操作指令的步骤中，中央处理器760用于将输入的语音的所有特征码与预存的样本特征码比较；根据存在于预存的样本特征码中的输入的语音的特征码，获取输入的语音的特征码对应的样本特征字符串；根据样本特征字符串执行与样本特征字符串关联的样本指令。

可选地，微型机电系统麦克风750用于根据特征码，控制中央处理760器执行特征码对应的预设操作指令的步骤之后，将中央处理器760切换至休眠状态。

可见，本发明实施例的移动终端700，通过提取并比对声纹，由于该声纹的特定性，提高了语音控制的安全性，并且通过微型机电系统麦克风750来输入语音及对语音进行声纹比对和特征码比较，可在声纹和特征码都匹配的情况下，再唤醒移动终端700的中央处理器760进行相应的操作，使得移动终端700的功耗较小；在唤醒移动终端700的中央处理器760后，可执行获取的特征码对应的预设操作指令。

本领域普通技术人员可以意识到，结合本发明实施例中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王仲霖;
技术所有人：维沃移动通信有限公司;
我是此专利的发明人

上一篇：一种声音模式的切换方法及装置、用户终端与流程
上一篇：来电处理方法及装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。