一种语音控制方法、装置及系统与流程

文档序号：11097737阅读：788来源：国知局

本发明涉及智能控制技术领域，尤其涉及一种语音控制方法、装置及系统。

背景技术：

随着人们工作、居家、旅行等的便利需要和智能管控技术的发展，单位、家庭及个人拥有和管理的智能设备越来越多，人机交互的便利给智能设备带来的体验越来越符合人们生产生活的需要。智能设备的麦克风(MIC，Microphone)和扬声器(Speaker)如同人类的耳朵和嘴巴，用来听和说。人类除了眼睛之外与现实世界做互动用的最多的器官就是耳朵和嘴巴，也就是说大多数人通过嘴巴说和耳朵听来感知世界，这两种器官是人类社会认识自然，改造世界最基本的工具。对于现有的智能设备来说，大部分都已经具备了MIC和Speaker。虽然现有技术可以实现通过语音方式进行远程遥控，然而，现有方案在远距离语音操控方面的性能需要进一步提高。

技术实现要素：

为了解决上述技术问题，本发明提供一种语音控制方法、装置及系统，能够提高语音控制的准确性及便利性。

为了达到上述技术目的，本发明提供一种语音控制方法，应用于同一网络中的多个智能设备，包括：至少一智能设备通过至少一语音接口接收用户语音，并获得从所述用户语音解析出的语音数据；所述智能设备通过比对所述语音数据与本地存储的语音信息列表中的数据，识别出语音控制指令，其中，所述语音信息列表至少包括：所述网络中各智能设备的地址、设备名称录音、语音特征参数数据以及语义数据，所述语音控制指令包括待操控智能设备名称以及操控命令；当所述智能设备识别出的语音控制指令的置信度高于预设阈值时，所述智能设备根据所述语音控制指令控制待操控智能设备执行所述操控命令。

进一步地，当至少两个智能设备分别通过语音接口接收用户语音，并分别获得从用户语音解析出的语音数据时，所述至少两个智能设备分别通过比对所述语音数据与本地存储的语音信息列表中的数据，识别出语音控制指令之后，还包括：当所述至少两个智能设备识别出的语音控制指令的置信度均小于所述预设阈值时，所述至少两个智能设备通过满足预设条件的语音接口组成的语音接口阵列，得到增强的语音，分别通过比对从增强的语音解析出的增强语音数据与本地存储的语音信息列表中的数据，识别出增强语音控制指令，当其中一个增强语音控制指令的置信度高于所述预设阈值时，所述至少两个智能设备中的其中之一根据置信度高于所述预设阈值的增强语音控制指令控制待操控智能设备执行相应的操控命令。

进一步地，所述满足预设条件的语音接口包括：接收到用户语音的语音接口，或者，接收到用户语音且数据相关性大于阈值的语音接口。

进一步地，所述智能设备通过至少一语音接口接收用户语音，并获得从所述用户语音解析出的语音数据，包括：

所述智能设备通过本地语音接口接收用户语音，并从所述用户语音解析得到语音数据；和/或，

所述智能设备通过远程语音接口接收用户语音，并从远程语音服务器接收从所述用户语音解析出的语音数据。

进一步地，该方法还包括：各智能设备通过智能管理终端加入所述网络，并从所述智能管理终端同步更新的语音信息列表。

进一步地，该方法还包括：各智能设备记录设备名称录音，解析所述设备名称录音得到相应的语音特征参数数据以及语义数据，存储所述设备名称录音、语音特征参数数据及语义数据至本地的语音信息列表，并将更新的语音信息列表同步给所述网络中的其他智能设备。

进一步地，所述语音特征参数数据包括设备名称语音特征参数数据以及语音操控特征参数数据。

本发明还提供一种语音控制装置，应用于智能设备，包括：至少一语音接口，用于接收用户语音；数据获取单元，用于获得从所述用户语音解析出的语音数据；语音识别单元，用于通过比对所述语音数据与本地存储的语音信息列表中的数据，识别出语音控制指令，其中，所述语音信息列表至少包括：所述网络中各智能设备的地址、设备名称录音、语音特征参数数据以及语义数据，所述语音控制指令包括待操控智能设备名称以及操控命令；指令驱动单元，用于当识别出的语音控制指令的置信度高于预设阈值时，根据所述语音控制指令控制待操控智能设备执行所述操控命令。

进一步地，所述语音接口包括本地语音接口和/或远程语音接口，所述数据获取单元包括数据解析单元和/或数据接收单元，其中，所述数据解析单元，用于从所述用户语音解析得到语音数据，所述数据接收单元，用于从远程语音服务器接收从所述用户语音解析出的语音数据。

本发明还提供一种语音控制系统，包括：至少两个如上所述的智能设备，其中，当所述至少两个智能设备识别出的语音控制指令的置信度均小于预设阈值时，所述至少两个智能设备通过满足预设条件的语音接口组成的语音接口阵列，得到增强的语音，分别通过比对从增强的语音解析出的增强语音数据与本地存储的语音信息列表中的数据，识别出增强语音控制指令，当其中一个增强语音控制指令的置信度高于所述预设阈值时，所述至少两个智能设备中的其中之一根据置信度高于所述预设阈值的增强语音控制指令控制待操控智能设备执行相应的操控命令。

进一步地，该系统还包括：智能管理终端，用于设置所述至少两个智能设备所在的网络，并向所述至少两个智能设备同步更新的语音信息列表。

本发明提供的语音控制方法，应用于同一网络中的多个智能设备，至少一智能设备通过至少一语音接口接收用户语音，并获得从所述用户语音解析出的语音数据；所述智能设备通过比对所述语音数据与本地存储的语音信息列表中的数据，识别出语音控制指令，其中，所述语音信息列表至少包括：所述网络中各智能设备的地址、设备名称录音、语音特征参数数据以及语义数据，所述语音控制指令包括待操控智能设备名称以及操控命令；当所述智能设备识别出的语音控制指令的置信度高于预设阈值时，所述智能设备根据所述语音控制指令控制待操控智能设备执行所述操控命令。如此，通过智能设备语音接口识别置信度高于预设阈值的语音控制指令进行远程语音操控，提升了远距离语音操控智能设备的准确性和便利性。而且，本发明的实现简单且实用。

进一步地，在本发明中，各智能设备记录设备名称录音，解析所述设备名称录音得到相应的语音特征参数数据以及语义数据，存储所述设备名称录音、语音特征参数数据及语义数据至本地的语音信息列表，并将更新的语音信息列表同步给网络中的其他智能设备。如此，通过智能设备的语音接口配置管理网络中的智能设备名称实现智能设备的语音定位，进而实现基于该语音定位的智能设备语音操控。

进一步地，当至少两个智能设备识别出的语音控制指令的置信度均小于所述预设阈值时，所述至少两个智能设备通过满足预设条件的语音接口组成的语音接口阵列，得到增强的语音，分别通过比对从增强的语音解析出的增强语音数据与本地存储的语音信息列表中的数据，识别出增强语音控制指令，当其中一个增强语音控制指令的置信度高于所述预设阈值时，所述至少两个智能设备中的其中之一根据置信度高于所述预设阈值的增强语音控制指令控制待操控智能设备执行相应的操控命令。如此，通过多个智能设备语音接口进行远程语音操控智能设备，提升了远距离语音操控智能设备的准确性和便利性。

附图说明

图1为本发明实施例提供的语音控制方法的流程图；

图2为本发明一实施例提供的语音控制装置的示意图；

图3为本发明一实施例提供的语音控制系统的示意图；

图4为本发明实施例中智能设备加入语音管理网络的流程图；

图5为本发明实施例中智能设备的语音信息的配置流程图；

图6为本发明实施例中语音控制指令的驱动流程图。

具体实施方式

以下结合附图对本发明的实施例进行详细说明，应当理解，以下所说明的实施例仅用于说明和解释本发明，并不用于限定本发明。

图1为本发明实施例提供的语音控制方法的流程图。如图1所示，本实施例提供的语音控制方法，应用于同一网络中的多个智能设备，包括以下步骤：

步骤101：至少一智能设备通过至少一语音接口接收用户语音，并获得从所述用户语音解析出的语音数据。

具体而言，步骤101包括：

所述智能设备通过本地语音接口接收用户语音，并从所述用户语音解析得到语音数据；和/或，

所述智能设备通过远程语音接口接收用户语音，并从远程语音服务器接收从所述用户语音解析出的语音数据。

步骤102：所述智能设备通过比对所述语音数据与本地存储的语音信息列表中的数据，识别出语音控制指令。

其中，所述语音信息列表至少包括：所述网络中各智能设备的地址、设备名称录音、语音特征参数数据以及语义数据。其中，语音特征参数数据例如包括设备名称语音特征参数数据以及语音操控特征参数数据。于一实施例中，语音信息列表例如包括：所述网络中各智能设备的介质访问控制(MAC，Medium Access Control)地址数据包、设备类型数据包、设备名称录音数据包、设备名称语音特征参数数据包、语音操控特征参数数据包、语义解析数据包以及设备状态标志位。

其中，所述从用户语音解析出的语音数据例如包括：设备名称语音特征数据、语音操控特征数据以及语义解析数据。所述语音控制指令包括待操控智能设备名称以及操控命令。

于此，在用户语音记录、从用户语音解析出的语音数据以及语音信息列表的基础上，根据预设的语音网络算法，识别出具有一定置信度的语音控制指令。其中，置信度表示可信程度。举例而言，针对每个智能设备而言，通过现有的语音识别技术从用户语音中解析出语音参数或语义，根据预设算法比对得到的语音参数或语音与语音信息列表中的数据，确定其中置信度最高的数据组合得到语音控制指令。之后，通过所述置信度与预设阈值的比较，确定是否执行识别出的语音控制指令。

步骤103：当所述智能设备识别出的语音控制指令的置信度高于预设阈值时，所述智能设备根据所述语音控制指令控制待操控智能设备执行所述操控命令。

具体而言，当所述智能设备识别出的语音控制指令的置信度高于预设阈值时，所述智能设备根据本地的语音信息列表确定该语音控制指令对应的待操控智能设备的地址，在与该待操控智能设备建立连接之后，发送所述语音控制指令至该待操控智能设备，通过所述语音控制指令控制该待操控智能设备执行操控命令。

进一步地，当至少两个智能设备分别通过语音接口接收用户语音，并分别获得从用户语音解析出的语音数据时，所述至少两个智能设备分别通过比对所述语音数据与本地存储的语音信息列表中的数据，识别出语音控制指令之后，该方法还包括：

当所述至少两个智能设备识别出的语音控制指令的置信度均小于预设阈值时，所述至少两个智能设备通过满足预设条件的语音接口组成的语音接口阵列，得到增强的语音，分别通过比对从增强的语音解析出的增强语音数据与本地存储的语音信息列表中的数据，识别出增强语音控制指令，当其中一个增强语音控制指令的置信度高于所述预设阈值时，所述至少两个智能设备中的其中之一根据置信度高于所述预设阈值的增强语音控制指令控制待操控智能设备执行相应的操控命令。

其中，所述满足预设条件的语音接口包括：接收到用户语音的语音接口，或者，接收到用户语音且数据相关性大于阈值的语音接口。其中，所述语音接口为智能设备的本地麦克风或远程麦克风。

进一步地，该方法还包括：各智能设备通过智能管理终端加入所述网络，并从所述智能管理终端同步更新的语音信息列表。

此外，本发明还提供一种语音控制装置，应用于智能设备，包括：至少一语音接口，用于接收用户语音；数据获取单元，用于获得从所述用户语音解析出的语音数据；语音识别单元，用于通过比对所述语音数据与本地存储的语音信息列表中的数据，识别出语音控制指令，其中，所述语音信息列表至少包括：所述网络中各智能设备的地址、设备名称录音、语音特征参数数据以及语义数据，所述语音控制指令包括待操控智能设备名称以及操控命令；指令驱动单元，用于当识别出的语音控制指令的置信度高于预设阈值时，根据所述语音控制指令控制待操控智能设备执行所述操控命令。

其中，所述语音接口包括本地语音接口和/或远程语音接口，所述数据获取单元包括数据解析单元和/或数据接收单元，其中，所述数据解析单元，用于从所述用户语音解析得到语音数据，所述数据接收单元，用于从远程语音服务器接收从所述用户语音解析出的语音数据。所述语音接口例如为麦克风。

图2为本发明一实施例提供的语音控制装置的示意图。如图2所示，本实施例提供的语音控制装置包括语音接口(如本地麦克风或远程麦克风)、数据获取单元、语音识别单元以及指令驱动单元。其中，所述数据获取单元包括数据解析单元和/或数据接收单元，所述数据解析单元用于从用户语音解析得到语音数据，例如由语音数据存储单元、语音特征解析单元以及语义解析单元组成。具体而言，语音数据存储单元，用于存储用户语音；语音特征解析单元，用于从存储的用户语音中解析出语音特征数据以及语音操控特征数据；语义解析单元，用于解析出语义。所述数据接收单元，用于从远程语音服务器接收从所述用户语音解析出的语音数据。然而，本发明对此并不限定。当采用远程语音接口接收用户语音时，数据解析单元例如设置在远程语音服务器，由远程语音服务器将从用户语音中解析出的语音数据发送给智能设备。

于实际应用中，数据解析单元以及语音识别单元例如为处理器等具有信息能力的元件，指令驱动单元例如为发射器等具有信息发送能力的元件，数据接收单元例如为接收器等具有信息接收能力的元件。然而，本发明对此并不限定。数据解析单元以及语音识别单元的功能例如通过处理器执行存储在存储器的程序/指令实现。

此外，本实施例还提供一种语音控制系统，包括至少两个如上所述的智能设备，其中，当所述至少两个智能设备识别出的语音控制指令的置信度均小于预设阈值时，所述至少两个智能设备通过满足预设条件的语音接口组成的语音接口阵列，得到增强的语音，分别通过比对从增强的语音解析出的增强语音数据与本地存储的语音信息列表中的数据，识别出增强语音控制指令，当其中一个增强语音控制指令的置信度高于所述预设阈值时，所述至少两个智能设备中的其中之一根据置信度高于所述预设阈值的增强语音控制指令控制待操控智能设备执行相应的操控命令。其中，所述语音接口包括本地麦克风和/或远程麦克风。

进一步地，该系统还包括智能管理终端，用于设置所述至少两个智能设备所在的网络，并向所述至少两个智能设备同步更新的语音信息列表。

图3为本发明一实施例提供的语音控制系统的示意图。如图3所示，本实施例提供的语音控制系统例如包括智能管理终端以及智能设备A～D。然而，本发明对于智能设备的数目并不限定，满足大于或等于二即可。其中，智能设备与智能管理终端之间以及智能设备之间例如通过无线或者有线方式连接。

以下对本发明实施例进行详细说明。

图4为本发明实施例中智能设备加入语音管理网络的流程图。如图4所示，本实施例中智能设备加入语音管理网络的过程包括以下步骤：

步骤401：启动智能管理终端的应用(APP，Application)进入管理系统待机主界面，点击智能管理终端应用的“添加设备”按钮，或者，发出语音“添加设备”，扫描智能设备外观的二维码，二维码例如包括设备类型数据、MAC地址数据以及智能设备自身无线保真(WIFI，WIreless-FIdelity)热点密码，如表1所示，智能管理终端自动加入智能设备自身WIFI，其中，智能设备加电启动没有连接WIFI网络时，起始均以WIFI热点存在；

表1智能设备外观的二维码包括内容

步骤402：智能管理终端APP显示所在范围内所有WIFI网络，选择智能设备需要加入的正式WIFI网络，将智能设备加入到所选的WIFI网络中，并获取该智能设备缺省的语音管理列表信息，其中，语音管理列表如表2所示：

表2语音管理列表

步骤403：智能管理终端的APP每加入一台智能设备，根据语音管理信息列表中的各智能设备的MAC地址，通过地址解析协议(ARP，Address Resolution Protocol)解析网络协议(IP，Internet Protocol)地址，建立传输控制协议(TCP，Transmission Control Protocol)/IP连接后，同步网络中所有的智能设备的语音信息列表。例如，将新增的智能设备信息同步给网络中所有的智能设备，以确定网络中每台智能设备的语音信息列表保持最新且相同。

图5为本发明实施例中智能设备的语音信息的配置流程图。如图5所示，本实施例中智能设备的语音信息的配置过程包括以下步骤：

步骤501：用户通过智能设备的本地MIC或者远程MIC进行录音；

步骤502：智能设备通过本地或者远程语音数据解析单元，进行录音记录(如存储“设备名称”录音记录)、进行特征值提取(如提取“设备名称”语音特征参数以及语音操控特征参数)以及进行语义解析(如解析设备名称)，并将上述数据存储到本地语音信息列表中；

步骤503：智能设备通过网络同步所有在线的智能设备的本地语音信息列表。例如，将智能设备新增的语音配置信息同步给网络中所有的智能设备，以确定网络中每台智能设备的语音信息列表保持最新且相同。

图6为本发明实施例中语音控制指令的网络驱动流程图。为了进行更好地说明，先进行如下假设：在同一个网络环境，一个空间内，用户进行语音操控时，有至少一个智能设备的至少一个MIC会收到声音；其中，网络中通过语音配置的n个智能设备的名称为：Name₁、Name₂……Name_n；智能设备所带的m个麦克风的名称为(m≥n，n为大于或等于1的整数)：MIC₁、MIC₂……MIC_m，其中，智能设备与麦克风为一对一或者一对多的关系；CONF(MIC_i，Name_j)代表智能设备网络中的第i个麦克风识别出呼叫第j个智能设备的置信度；VAD(MIC_i)>0表示智能设备网络中第i个麦克风有人说话；CORR(MIC_i，MIC_j)表示智能设备网络中第i个麦克风与第j个麦克风的数据相关性。

如图6所示，本实施例中语音控制指令的网络驱动过程包括以下步骤：

步骤601：用户通过语音发出智能设备控制指令，在同一空间的网络中的多个智能设备的MIC收到用户语音；

步骤602：收到用户语音的各个智能设备比对从用户语音解析出的数据及语音信息列表中的数据，当获取置信度超过预设阀值的语音控制指令时，识别出该语音控制指令的智能设备与该语音控制指令对应的待操控智能设备建立网络，驱动该待操控智能设备执行该语音控制指令携带的操控命令；例如，语音控制命令为客厅大灯开；

具体而言，当VAD(MIC_i)>0且CONF(MIC_i，Name_j)>预设阈值P(P<1，例如0.8)，此时说话人离智能设备麦克风i最近，且智能设备麦克风i识别出来的呼叫智能设备Name_j可信，则智能设备Name_i与智能设备Name_j建立TCP/IP连接，驱动智能设备Name_j的命令列表中的设备控制命令；

步骤603：当多个智能设备获取的语音控制指令的置信度均小于预设阀值时，则调动网络中所有存在语音输入的智能设备MIC形成一个MIC阵列，对声源进行定位，形成一个指向声源的波束，进而形成置信度高于预设阈值的语音控制指令驱动相应的智能设备操控；其中，所述多个智能设备中的任意一个可根据语音控制指令与待操控智能设备建立连接，进而控制待操控智能设备执行相应操控指令。然而，本发明对此并不限定。所述根据语音控制指令与待操控智能设备建立连接的智能设备例如为识别出高于预设阈值的置信度的语音控制指令的智能设备。

举例而言，当说话人没有特别靠近某个麦克风时，智能设备通过用户数据报协议(UDP，User Datagram Protocol)广播把所有VAD(MIC_i)>0且VAD(MIC_j)>0且CORR(MIC_i，MIC_j)>阈值C(C<1，例如0.5)的麦克风自动组成一个麦克风阵列，对声源进行定位，并形成一个指向声源的波束，增强采集语音，提高识别率，波束形成后的增强语音作为语音识别的输入，进而识别出增强语音控制指令。

综上所述，在本发明实施例中，通过智能设备的语音接口来配置管理网络中的智能设备名称实现智能设备的语音定位，并且通过多个智能设备的语音接口进行远程语音操控智能设备，从而提升远距离语音操控智能设备的准确性和便利性。而且，本发明方案实现简单且实用。

以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：彭和清;黎家力;阮亚平;李辉;
技术所有人：中兴通讯股份有限公司;
我是此专利的发明人