语音控制方法、语音系统、设备和存储介质与流程

文档序号：15697329发布日期：2018-10-19 19:15阅读：233来源：国知局

本发明涉及智能家居技术领域，尤其涉及一种语音控制方法、语音系统、设备和存储介质。

背景技术：

语音控制指的是智能设备对采集到的语音信息进行分析，并根据分析结果进行对应的控制。随着科技的发展，越来越多的设备都采用了语音进行控制。目前主要是通过将语音合成和转换成文本，然后经过云端或者本地进行运算后，进行语义识别生成指令，进而控制各种设备。但是这种语音控制方式由于只是对语音进行单一的语义识别，所以并不能够针对不同的用户的使用习惯进行个性化的识别，而且并不具备自动学习以提高智能化控制效率。

技术实现要素：

本发明的主要目的为提供一种能够个性化控制设备的语音控制方法和语音系统、设备和存储介质以提升用户的体验。

本发明提供了一种语音控制方法，包括以下步骤：

提取语音信息中的特征语音段和上述特征语音段的声纹；

根据上述特征语音和上述声纹从预设的特征指令库中匹配出对应的语音指令；

根据上述特征语音和上述声纹从预设的设备列表中匹配出目标设备；

根据上述语音指令控制上述目标设备。

进一步地，上述提取语音信息中的特征语音段和上述特征语音段的声纹的步骤包括：

判定上述语音信息中是否包含有特定词组；

若是，则截取上述特定词组对应的语音段形成上述特征语音段，并提取上述特征语音段的声纹。

进一步地，在上述根据上述特征语音和上述特征声纹从预设的特征指令库中匹配出对应的语音指令步骤之前，还包括：

获取语音声源位置；

匹配出与上述声源位置距离最近的下位设备。

进一步地，上述根据上述特征语音和上述声纹从预设的特征指令库中匹配出对应的语音指令的步骤包括：

判断特征声纹库中是否存在与上述声纹相匹配的的特征声纹；

若是，则根据上述特征语音内的特征词组和上述特征声纹从预设的上述特征指令库中匹配出对应的上述语音指令；

若否，则根据上述特征语音内的特征词组和上述下位设备从预设的特征指令库中匹配出对应的语音指令，并将上述声纹处理生成声纹范本并存入上述特征声纹库中。

进一步地，上述判断特征声纹库中是否存在与上述声纹相匹配的特征声纹的步骤包括：

根据上述特征词组调取上述特征声纹库中对应的声纹范本，并建模生成上述特征声纹；

将上述声纹分别和上述特征声纹进行声纹比对，并判定是否存在与上述声纹相似度达到指定比例的上述特征声纹。

进一步地，在截取上述特定词组对应的语音段形成上述特征语音段，并提取上述特征语音段的声纹的步骤之后，还包括：

记录每个特定词组的出现次数；

根据上述每个特定词组的出现次数对预设设备列表中的对应的设备进行排序，并将上述排序设定为匹配目标设备时的匹配排序。

进一步地，在根据上述特征语音和上述特征声纹从预设的特征指令库中匹配出对应的语音指令步骤之前还包括建立特征声纹库，上述建立特征声纹库的步骤包括：

获取各用户的指定词组或文字的声纹作为声纹模板；

对各用户的上述声纹模板进行等级设置；

设置不同等级的上述声纹模板所对应的设备列表及权限列表。

本发明还提出一种语音系统，包括：

提取单元，用于提取语音信息中的特征语音段和上述特征语音段的声纹；

指令匹配单元，根据上述特征语音和上述声纹从预设的特征指令库中匹配出对应的语音指令；

目标设备匹配单元，用于根据上述特征语音和上述声纹从预设的设备列表中匹配出目标设备；

控制单元，用于根据语音指令控制目标设备。

本发明还提出一种计算机设备，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，上述处理器执行上述程序时实现如实施例中任意一项所述的方法。

本发明还提出一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如实施例中任意一项所述的方法。

对比现有技术，本发明具有如下有益效果：通过根据特征词组和声纹匹配出语音指令进行控制目标设备，实现了可以针对不同的人进行个性化控制设备，提高了用户的体验；通过根据语音声源位置和特征词组进行控制目标设备，扩大语音控制范围；通过对提取的声纹处理生成声纹范本并通过声纹范本建模，实现声纹识别的自动深度学习过程以提高语音控制的准确率；通过设置的权限列表，以提高语音控制的准确率。

附图说明

图1是本发明一实施例的语音控制方法的流程示意图；

图2是本发明一实施例的语音控制方法的流程示意图；

图3是本发明一实施例的语音控制方法的流程示意图；

图4是本发明一实施例的语音控制方法的流程示意图；

图5是本发明一实施例的语音控制方法的流程示意图；

图6是本发明一实施例的语音控制方法的流程示意图；

图7是本发明一实施例的语音控制方法的流程示意图；

图8是本发明一实施例的语音系统的结构示意图；

图9是本发明一实施例的一种计算机设备的结构示意图。

1、提取单元；2、指令匹配单元；3、目标设备匹配单元；4、控制单元；5、计算机设备；6、外部设备；7、处理单元；8、总线；9、网络适配器；10、(i/o)接口；11、显示器；12、系统存储器；13、随机存取存储器(ram)；14、高速缓存存储器；15、存储系统；16、程序/实用工具；17、程序模块。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参照图1，提出本发明一实施例的语音控制方法，包括以下步骤：

s1、提取语音信息中的特征语音段和上述特征语音段的声纹；

s2、根据上述特征语音和上述声纹从预设的特征指令库中匹配出对应的语音指令；

s3、根据上述特征语音和上述声纹从预设的设备列表中匹配出目标设备；

s4、根据上述语音指令控制上述目标设备。

如上述步骤s1，提取语音信息中的特征语音段和上述特征语音段的声纹，其中，上述声纹指的是携带语音信息的声波频谱，能够唯一识别某人或某物的声音特征，即是上述声纹具有对个体识别功能。

如上述步骤s2，根据上述特征语音和上述声纹从预设的特征指令库中匹配出对应的语音指令，其中，上述特征语音含有特定词组的语音信息，上述特定词组一般包括有效词组和特征词组或仅仅包括特征词组，上述有效词组一般是指具有单一上述语音指令指向的词组，如设备名词、全部或所有设备等等词组，上述特征词组一般是指包含有有效的动作的词组如打开、关闭、开或关等等词组。

如上述步骤s3，根据上述特征语音和上述声纹从预设的设备列表中匹配出目标设备，其中，预设的上述设备列表用于将存储默认设备信息和新增设备信息。

如上述步骤s4，根据上述语音指令控制上述目标设备，根据上述语音指令控制的上述目标设备可以为单个设备或多个设备。

在本实施中，上述提取语音信息中的特征语音段和上述特征语音段的声纹的步骤之前，还包括：

a1获取语音信息；

a2将上述语音信息进行滤波、噪音和增益调节处理。

如上述步骤a1，获取语音信息，其中，上述语音信息一般指的是声音携带的信息。

如上述步骤a2，对上述语音信息进行滤波、噪音和增益调节处理，上述语音信息经过滤波、噪音和增益调节处理后被纯化，减少背景噪音对语音信息的影响，以获得纯净的语音信息来提高语音控制的准确率。

参照图2，在本实施中，上述提取语音信息中的特征语音段和上述特征语音段的声纹的步骤包括：

s5、判定上述语音信息中是否包含有特定词组；

s6、若是，则截取上述特定词组对应的语音段形成上述特征语音段，并提取上述特征语音段的声纹。

如上述步骤s5，判定上述语音信息中是否包含有特定词组，其中，上述特定词组一般包括有效词组和特征词组或仅仅包括特征词组，上述有效词组一般是指具有单一上述语音指令指向的词组，如设备名词、全部或所有设备等等词组，上述特征词组一般是指包含有有效的动作的词组如打开、关闭、开或关等等词组。上述特定词组的其中一种存在形式为包含有效词组和特征词组，另一种存在形式为仅仅包含特征词组，具体地，特定词组可以为开灯、开第一排的灯、打开、全部打开或关闭空调等等。对应地，它们的有效词组分别为灯、第一排的灯、全部和空调，特征词组为开、开、打开、打开和关闭。

如上述步骤s6，若是，则截取上述特定词组对应的语音段形成上述特征语音段，并提取上述特征语音段的声纹，其中，被提取的上述特征语音段的声纹用于与上述特征声纹匹配。

参照图3，在本实施中，在上述根据上述特征语音和上述特征声纹从预设的特征指令库中匹配出对应的语音指令步骤之前，还包括：

s7、获取语音声源位置；

s8、匹配出与上述声源位置距离最近的下位设备。

如上述步骤s7，获取语音声源位置，上述语音声源位置一般是根据语音的强弱和语音接收时间差等等信息获取。

如上述步骤s8，匹配出与上述声源位置距离最近的下位设备，其中，上述下位设备为单一设备。

参照图4，在本实施中，上述根据上述特征语音和上述声纹从预设的特征指令库中匹配出对应的语音指令的步骤包括：

s9、判断特征声纹库中是否存在与上述声纹相匹配的的特征声纹；

s10、若是，则根据上述特征语音内的特征词组和上述特征声纹从预设的上述特征指令库中匹配出对应的上述语音指令；

s11、若否，则根据上述特征语音内的特征词组和上述下位设备从预设的特征指令库中匹配出对应的语音指令，并将上述声纹处理生成声纹范本并存入上述特征声纹库中。

如上述步骤s9，判断特征声纹库中是否存在与上述声纹相匹配的的特征声纹，其中，上述特征声纹一般为声纹模型，上述特征声纹可以与对应用户的所有声纹相匹配。

若上述步骤s10，若是，则根据上述特征语音内的特征词组和上述特征声纹从预设的上述特征指令库中匹配出对应的上述语音指令，具体地，根据特征声纹确定用户身份，根据特征词组确定用户的控制意向，即可以根据不同用户的使用习惯进行从预设的上述特征指令库中匹配出对应的上述语音指令。

上述步骤s11，若否，则根据上述特征语音内的特征词组和上述下位设备从预设的特征指令库中匹配出对应的语音指令，并将上述声纹处理生成声纹范本并存入上述特征声纹库中，其中，上述声纹经过处理后生成的上述声纹范本用于构建上述特征声纹，上述下位设备为与上述声源位置距离最近的设备，即是即使用户还没有建立上述特征声纹，不能确定该用户身份时，亦可以通过仅仅包含上述特征词组的上述特征语音和上述下位设备从预设的特征指令库中匹配出对应的语音指令。

参照图5，在本实施中，上述判断特征声纹库中是否存在与上述声纹相匹配的特征声纹的步骤包括：

s12、根据上述特征词组调取上述特征声纹库中对应的声纹范本，并建模生成上述特征声纹；

s13、将上述声纹分别和上述特征声纹进行声纹比对，并判定是否存在与上述声纹相似度达到指定比例的上述特征声纹。

上述步骤s12，根据上述特征词组调取上述特征声纹库中对应的声纹范本，并建模生成上述特征声纹，其中，上述特征声纹一般用于确定用户身份。

上述步骤s13，将上述声纹分别和上述特征声纹进行声纹比对，并判定是否存在与上述声纹相似度达到指定比例的上述特征声纹，其中，上述指定比例为上述声纹与上述特征声纹匹配的最低比例值。

参照图6，在本实施中，在截取上述特定词组对应的语音段形成上述特征语音段，并提取上述特征语音段的声纹的步骤之后，还包括：

s14、记录每个特定词组的出现次数；

s15、根据上述每个特定词组的出现次数对预设设备列表中的对应的设备进行排序，并将上述排序设定为匹配目标设备时的匹配排序。

如上述步骤s14，记录每个特定词组的出现次数，每个特定词组出现一次记为对应用户使用对应设备的一次使用记录，出现次数最多的特定词组为该用户最为常用的使用习惯，即用户最常用的设备，上述记录每个特定词组的出现次数即为记录用户的使用习惯。

如上述步骤s15，根据上述每个特定词组的出现次数对预设设备列表中的对应的设备进行排序，并将上述排序设定为匹配目标设备时的匹配排序，在对应的设备列表中上述排列在最前的设备为该用户最为常用的设备。因此，可以根据用户的上述语音信息中的上述特征词组和上述声纹实现对最为常用的设备进行控制。

在本实施中，在记录每个特定词组的出现次数步骤之后，还包括：

a3、将特定词组的记录根据上述特定词组携带的声纹发送至对应用户记录存储位置。

如上述步骤a3，将上述特定词组的记录根据上述特定词组携带的声纹发送至对应用户记录存储位置，将对应用户的使用记录进行分类存储，有利于后期查找方便。

参照图7，在本实施例中，在根据上述特征语音和上述特征声纹从预设的特征指令库中匹配出对应的语音指令步骤之前还包括建立特征声纹库，上述建立特征声纹库的步骤包括：

s16、获取各用户的指定词组或文字的声纹作为声纹模板；

s17、对各用户的上述声纹模板进行等级设置；

s18、设置不同等级的上述声纹模板所对应的设备列表及权限列表。

如上述步骤s16，获取各用户的指定词组或文字的声纹作为声纹模板，其中，上述各用户的指定词组或文字一般指的是具有对应设备指向的指定词组或文字。

如上述步骤s17，对各用户的上述声纹模板进行等级设置，其中，上述根据各用户的上述声纹模板进行等级设置即是对各用户进行等级划分。

如上述步骤s18，设置不同等级的上述声纹模板所对应的设备列表及权限列表，其中，不同的用户对应不同的上述设备列表，根据上述权限列表确定用户对设备的使用权限。

在一具体实施例中，一种语音控制方法，包括以下步骤：

a1获取语音信息；

a2将上述语音信息进行滤波、噪音和增益调节处理；

s5、判定上述语音信息中是否包含有特定词组；

s6、若是，则截取上述特定词组对应的语音段形成上述特征语音段，并提取上述特征语音段的声纹；

s14、记录每个特定词组的出现次数；

a3、将特定词组的记录根据上述特定词组携带的声纹发送至对应用户记录存储位置；

s15、根据上述每个特定词组的出现次数对预设设备列表中的对应的设备进行排序，并将上述排序设定为匹配目标设备时的匹配排序；

s7、获取语音声源位置；

s8、匹配出与上述声源位置距离最近的下位设备。

s16、获取各用户的指定词组或文字的声纹作为声纹模板；

s17、对各用户的上述声纹模板进行等级设置；

s18、设置不同等级的上述声纹模板所对应的设备列表及权限列表；

s12、根据上述特征词组调取上述特征声纹库中对应的声纹范本，并建模生成上述特征声纹；

s13、将上述声纹分别和上述特征声纹进行声纹比对，并判定是否存在与上述声纹相似度达到指定比例的上述特征声纹。

s10、若是，则根据上述特征语音内的特征词组和上述特征声纹从预设的上述特征指令库中匹配出对应的上述语音指令；

s3、根据上述特征语音和上述声纹从预设的设备列表中匹配出目标设备；

s4、根据上述语音指令控制上述目标设备。

参照图，本发明还提出一种语音系统，包括：

提取单元1，用于提取语音信息中的特征语音段和上述特征语音段的声纹；

指令匹配单元2，用于根据上述特征语音和上述声纹从预设的特征指令库中匹配出对应的语音指令；

目标设备匹配单元3，用于根据上述特征语音和上述声纹从预设的设备列表中匹配出目标设备；

控制单元4，用于根据语音指令控制目标设备。

上述提取单元1，用于提取语音信息中的特征语音段和上述特征语音段的声纹，上述声纹指的是携带语音信息的声波频谱，能够唯一识别某人或某物的声音特征，即是上述声纹具有对个体识别功能。

上述指令匹配单元2，用于根据上述特征语音和上述声纹从预设的特征指令库中匹配出对应的语音指令，其中，上述特征语音含有特定词组的语音信息，上述特定词组一般包括有效词组和特征词组或仅仅包括特征词组，上述有效词组一般是指具有单一上述语音指令指向的词组，如设备名词、全部或所有设备等等词组，上述特征词组一般是指包含有有效的动作的词组如打开、关闭、开或关等等词组。

上述目标设备匹配单元3，用于根据上述特征语音和上述声纹从预设的设备列表中匹配出目标设备，其中，预设的上述设备列表用于将存储默认设备信息和新增设备信息。

上述控制单元4，用于根据语音指令控制目标设备，根据上述语音指令控制的上述目标设备可以为单个设备或多个设备。

本实施例中，还包括：语音信息获取单元和语音信息优化单元。

上述语音信息获取单元，用于获取语音信息。

上述语音信息优化单元，用于对上述语音信息进行滤波、噪音和增益调节处理，上述语音信息经过滤波、噪音和增益调节处理后被纯化，减少背景噪音对语音信息的影响，以获得纯净的语音信息来提高语音控制的准确率。

本实施例中，还包括：特定词组判断单元和提取子单元。

上述特定词组判断单元，用于判定上述语音信息中是否包含有特定词组，其中，上述特定词组一般包括有效词组和特征词组或仅仅包括特征词组，上述有效词组一般是指具有单一上述语音指令指向的词组，如设备名词、全部或所有设备等等词组，上述特征词组一般是指包含有有效的动作的词组如打开、关闭、开或关等等词组。上述特定词组的其中一种存在形式为包含有效词组和特征词组，另一种存在形式为仅仅包含特征词组，具体地，特定词组可以为开灯、开第一排的灯、打开、全部打开或关闭空调等等。对应地，它们的有效词组分别为灯、第一排的灯、全部和空调，特征词组为开、开、打开、打开和关闭。

上述提取子单元，用于截取上述特定词组对应的语音段形成上述特征语音段，并提取上述特征语音段的声纹，其中，被提取的上述特征语音段的声纹用于与上述特征声纹匹配。

本实施例中，还包括声源位置获取单元和下位设备匹配单元。

上述声源位置获取单元，用于获取语音声源位置，上述语音声源位置一般是根据语音的强弱和语音接收时间差等等信息获取。

上述下位设备匹配单元，用于匹配出与上述声源位置距离最近的下位设备，其中，上述下位设备为单一设备。

本实施例中，还包括声纹判断单元、第一指令匹配子单元、第二指令匹配子单元和声纹范本生成单元。

上述声纹判断单元，用于判断特征声纹库中是否存在与上述声纹相匹配的的特征声纹；其中，上述特征声纹一般为声纹模型，上述特征声纹可以与对应用户的所有声纹相匹配。

上述第一指令匹配子单元，用于根据上述特征语音内的特征词组和上述特征声纹从预设的上述特征指令库中匹配出对应的上述语音指令，具体地，根据特征声纹确定用户身份，根据特征词组确定用户的控制意向，即可以根据不同用户的使用习惯进行从预设的上述特征指令库中匹配出对应的上述语音指令。

上述第二指令匹配单元，用于根据上述特征语音内的特征词组和上述下位设备从预设的特征指令库中匹配出对应的语音指令，并将上述声纹处理生成声纹范本并存入上述特征声纹库中，其中，上述声纹经过处理后生成的上述声纹范本用于构建上述特征声纹，上述下位设备为与上述声源位置距离最近的设备，即是即使用户还没有建立上述特征声纹，不能确定该用户身份时，亦可以通过仅仅包含上述特征词组的上述特征语音和上述下位设备从预设的特征指令库中匹配出对应的语音指令。

声纹范本生成单元，用于对用户的声纹进行处理生成声纹范本，上述声纹范本用于建立特征声纹。

在本实施例中，还包括：声纹建模单元和声纹对比单元。

上述声纹建模单元，用于根据上述特征词组调取上述特征声纹库中对应的声纹范本，并建模生成上述特征声纹，其中，上述特征声纹一般用于确定用户身份。

上述声纹对比单元，用于将上述声纹分别和上述特征声纹进行声纹比对，并判定是否存在与上述声纹相似度达到指定比例的上述特征声纹，其中，上述指定比例为上述声纹与上述特征声纹匹配的最低比例值。

在本实施中，还包括：记录单元和设备排序单元。

上述记录单元，用于记录每个特定词组的出现次数，每个特定词组出现一次记为对应用户使用对应设备的一次使用记录，出现次数最多的特定词组为该用户最为常用的使用习惯，即用户最常用的设备，上述记录每个特定词组的出现次数即为记录用户的使用习惯。

上述设备排序单元，用于根据上述每个特定词组的出现次数对预设设备列表中的对应的设备进行排序，并将上述排序设定为匹配目标设备时的匹配排序，在对应的设备列表中上述排列在最前的设备为该用户最为常用的设备。因此，可以根据用户的上述语音信息中的上述特征词组和上述声纹实现对最为常用的设备进行控制。

在本实施中，还包括：记录存储单元。

上述记录存储单元，用于将上述特定词组的记录根据上述特定词组携带的声纹发送至对应用户记录存储位置，将对应用户的使用记录进行分类存储，有利于后期查找方便。

在本实施例中，还包括:声纹模板建立单元、等级设置单元和列表设置单元。

上述声纹模板，用于建立单元获取各用户的指定词组或文字的声纹作为声纹模板，其中，上述各用户的指定词组或文字一般指的是具有对应设备指向的指定词组或文字。

上述等级设置单元，用于对各用户的上述声纹模板进行等级设置，其中，上述根据各用户的上述声纹模板进行等级设置即是对各用户进行等级划分。

上述列表设置单元，用于设置不同等级的上述声纹模板所对应的设备列表及权限列表，其中，不同的用户对应不同的上述设备列表，根据上述权限列表确定用户对设备的使用权限。

参照图9，在本发明实施例中，本发明还提供一种计算机设备，上述计算机设备5以通用计算设备的形式表现，计算机设备5的组件可以包括但不限于：一个或者多个处理器或者处理单元5，系统存储器12，连接不同系统组件(包括系统存储器12和处理单元7)的总线8。

总线8表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(isa)总线，微通道体系结构(mac)总线，增强型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。

计算机设备5典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备5访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

系统存储器12可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(ram)13和/或高速缓存存储器14。计算机设备5可以进一步包括其他移动/不可移动的、易失性/非易失性计算机体统存储介质。仅作为举例，存储系统15可以用于读写不可移动的、非易失性磁介质(通常称为“硬盘驱动器”)。尽管图9中未示出，可以提供用于对可移动非易失性磁盘(如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如cd～rom，dvd～rom或者其他光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线8相连。存储器可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块17，这些程序模块17被配置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块17的程序/实用工具16，可以存储在例如存储器中，这样的程序模块17包括——但不限于——操作系统、一个或者多个应用程序、其他程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块17通常执行本发明所描述的实施例中的功能和/或方法。

计算机设备5也可以与一个或多个外部设备6(例如键盘、指向设备、显示器11、摄像头等)通信，还可与一个或者多个使得用户能与该计算机设备5交互的设备通信，和/或与使得该计算机设备5能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口10进行。并且，计算机设备5还可以通过网络适配器9与一个或者多个网络(例如局域网(lan))，广域网(wan)和/或公共网络(例如因特网)通信。如图所示，网络适配器9通过总线8与计算机设备5的其他模块通信。应当明白，尽管图9中未示出，可以结合计算机设备5使用其他硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。

处理单元7通过运行存储在系统存储器12中的程序，从而执行各种功能应用以及数据处理，例如实现本发明实施例所提供的语音控制方法。

也即，上述处理单元7执行上述程序时实现：提取语音信息中的特征语音段和上述特征语音段的声纹；根据上述特征语音和上述声纹从预设的特征指令库中匹配出对应的语音指令；根据上述特征语音和上述声纹从预设的设备列表中匹配出目标设备；据上述语音指令控制上述目标设备。

在本发明实施例中，本发明还提出一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本申请所有实施例提供的语音控制方法：

也即，给程序被处理器执行时实现：提取语音信息中的特征语音段和上述特征语音段的声纹；根据上述特征语音和上述声纹从预设的特征指令库中匹配出对应的语音指令；根据上述特征语音和上述声纹从预设的设备列表中匹配出目标设备；据上述语音指令控制上述目标设备。

可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机克顿信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)13、只读存储器(rom)、可擦可编程只读存储器(epom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd～rom)、光存储器件、磁存储器件或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，改计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，上述程序设计语言包括面向对象的程序设计语言——诸如java、smalltalk、c++，还包括常规的过程式程序设计语言——诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行或者完全在远程计算机或者服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)——连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

以上所述仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黎发敢;丁翔;童辉;黄海骅
技术所有人：深圳小祺智能科技有限公司
我是此专利的发明人

上一篇：一种基于移动终端的用户疲劳检测方法及移动终端与流程
上一篇：排水阶梯的制作方法