基于耳机的语音控制方法、装置及其设备与流程

文档序号：13474186阅读：301来源：国知局

本发明涉及人工智能技术领域，尤其涉及一种基于耳机的语音控制方法、装置及其设备。

背景技术：

人工智能(artificialintelligence)，英文缩写为ai。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。其中，人工智能最重要的方面就是语音识别技术。

相关技术中，用户可以根据自身需要向对应的目标设备发送语音控制指令，以使对应的设备根据语音控制指令进行相应的操作处理。但是，目前的语音控制方式由于周边环境的嘈杂和噪声，会对语音接收和识别产生较大的影响，降低语音识别的准确性，影响了后续的响应操作，降低了处理效率。

技术实现要素：

本发明的目的旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本发明的第一个目的在于提出一种基于耳机的语音控制方法，用于解决现有技术中语音控制方式由于周边环境的嘈杂和噪声，会对语音接收和识别产生较大的影响，降低语音识别的准确性，影响了后续的响应操作，降低了处理效率的问题。

本发明的第二个目的在于提出一种基于耳机的语音控制装置。

本发明的第三个目的在于提出一种计算机设备。

本发明的第四个目的在于提出一种非临时性计算机可读存储介质。

本发明的第五个目的在于提出一种计算机程序产品。

为达上述目的，本发明第一方面实施例提出了一种基于耳机的语音控制方法，所述方法应用于耳机，所述耳机与用户之间的距离在预设范围内，所述方法包括以下步骤：接收耳机控制指令，启动语音控制模式；接收所述用户发送的语音信息，对所述语音信息进行语音解析获取目标设备和操作意图；查询预设的指令库获取与所述操作意图对应的控制指令；与所述目标设备建立通信链路，通过所述通信链路向所述目标设备发送所述控制指令，以使所述目标设备根据所述控制指令进行相应的操作处理。

本发明实施例的基于耳机的语音控制方法，通过接收耳机控制指令，启动语音控制模式，接着接收用户发送的语音信息，并对语音信息进行语音解析获取目标设备和操作意图，然后查询预设的指令库获取与操作意图对应的控制指令，最后与目标设备建立通信链路，通过通信链路向目标设备发送控制指令，以使目标设备根据控制指令进行相应的操作处理。由此，避免了外界噪音对语音控制的干扰，使用户可以不考虑近场或者远场通信，提高了语音控制的准确性和灵活性。

为达上述目的，本发明第二方面实施例提出了一种基于耳机的语音控制装置，所述装置应用于耳机，所述耳机与用户之间的距离在预设范围内，所述装置包括：启动模块，用于接收耳机控制指令，启动语音控制模式；解析模块，用于接收所述用户发送的语音信息，对所述语音信息进行语音解析获取目标设备和操作意图；查询模块，用于查询预设的指令库获取与所述操作意图对应的控制指令；处理模块，用于与所述目标设备建立通信链路，通过所述通信链路向所述目标设备发送所述控制指令，以使所述目标设备根据所述控制指令进行相应的操作处理。

本发明实施例的基于耳机的语音控制装置，通过接收耳机控制指令，启动语音控制模式，接着接收用户发送的语音信息，并对语音信息进行语音解析获取目标设备和操作意图，然后查询预设的指令库获取与操作意图对应的控制指令，最后与目标设备建立通信链路，通过通信链路向目标设备发送控制指令，以使目标设备根据控制指令进行相应的操作处理。由此，避免了外界噪音对语音控制的干扰，使用户可以不考虑近场或者远场通信，提高了语音控制的准确性和灵活性。

为达上述目的，本发明第三方面实施例提出了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时，实现如一种基于耳机的语音控制方法，所述方法包括：接收耳机控制指令，启动语音控制模式；接收所述用户发送的语音信息，对所述语音信息进行语音解析获取目标设备和操作意图；查询预设的指令库获取与所述操作意图对应的控制指令；与所述目标设备建立通信链路，通过所述通信链路向所述目标设备发送所述控制指令，以使所述目标设备根据所述控制指令进行相应的操作处理。

为了实现上述目的，本发明第四方面实施例提出了一种非临时性计算机可读存储介质，当所述存储介质中的指令由处理器被执行时，使得能够执行一种基于耳机的语音控制方法，所述方法包括：接收耳机控制指令，启动语音控制模式；接收所述用户发送的语音信息，对所述语音信息进行语音解析获取目标设备和操作意图；查询预设的指令库获取与所述操作意图对应的控制指令；与所述目标设备建立通信链路，通过所述通信链路向所述目标设备发送所述控制指令，以使所述目标设备根据所述控制指令进行相应的操作处理。

为了实现上述目的，本发明第五方面实施例提出了一种计算机程序产品，当所述计算机程序产品中的指令处理器执行时，执行一种基于耳机的语音控制方法，所述方法包括：接收耳机控制指令，启动语音控制模式；接收所述用户发送的语音信息，对所述语音信息进行语音解析获取目标设备和操作意图；查询预设的指令库获取与所述操作意图对应的控制指令；与所述目标设备建立通信链路，通过所述通信链路向所述目标设备发送所述控制指令，以使所述目标设备根据所述控制指令进行相应的操作处理。

本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1是根据本发明一个实施例的基于耳机的语音控制方法的流程示意图；

图2是根据本发明另一个实施例的基于耳机的语音控制方法的流程示意图；

图3是根据本发明一个实施例的基于耳机的语音控制装置的结构示意图；

图4是根据本发明另一个实施例的基于耳机的语音控制装置的结构示意图

图5是根据本发明又一个实施例的基于耳机的语音控制装置的结构示意图；

图6是根据本发明一个实施例的计算机设备的结构示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

下面参考附图描述本发明实施例的基于耳机的语音控制方法、装置及其设备。

目前，随着语音交互控制服务的发展，用户可以根据自身需要向对应的目标设备发送语音控制指令，以使对应的设备根据语音控制指令进行相应的操作处理。但是，目前的语音控制方式由于周边环境的嘈杂和噪声，会对语音接收和识别产生较大的影响，降低语音识别的准确性，影响了后续的响应操作，降低了处理效率。

针对这一问题，本发明实施例提供了基于耳机的语音控制方法，能够通过耳机实现对目标设备的语音控制，避免了外界噪音对语音控制的干扰，使用户可以不考虑近场或者远场通信，提高了语音控制的准确性和灵活性。具体如下：

图1是根据本发明一个实施例的基于耳机的语音控制方法的流程示意图。如图1所示，该基于耳机的语音控制方法包括：

需要说明的是，本发明实施例的基于耳机的语音控制方法应用于耳机，耳机与用户之间的距离在预设范围内。其中，耳机的类型可以根据实际应用需要进行选择设置，比如有线耳机、蓝牙耳机等中的一种或者多种。

步骤101，接收耳机控制指令，启动语音控制模式。

具体地，在实际应用中，为了方便用户操作控制，在用户需要通过耳机进行语音控制时，可以采取很多种方式发送耳机控制指令启动语音控制模式，用户可以根据实际应用需要或者操作习惯等等进行选择设置，举例说明如下：

作为一种示例，通过耳机上预设的相关按键发送耳机控制指令。作为另一种示例通过与耳机有线或者无线连接的手机等终端设备上的应用程序或者点击按键等方式发送耳机控制指令。

步骤102，接收用户发送的语音信息，对语音信息进行语音解析获取目标设备和操作意图。

步骤103，查询预设的指令库获取与操作意图对应的控制指令。

具体地，在启动语音控制模式后，用户可以根据需要输入语音信息，从而在接收用户发送的语音信息，可以采用很多种方式对语音信息进行语音解析获取目标设备和操作意图，可以根据实际应用需要进行选择设置，举例说明如下：

第一种示例，将语音信息转换为文本信息，接着对文本信息进行切词处理，提取关键字，进行识别获取目标设备和操作意图。

第二种示例，将语音信息输入预设算法中进行处理得到目标设备和操作意图。

步骤104，与目标设备建立通信链路，通过通信链路向目标设备发送控制指令，以使目标设备根据控制指令进行相应的操作处理。

具体地，在确定获取目标设备和操作意图后，需要与目标设备建立连接发送控制指令，以使目标设备根据控制指令进行相应的操作处理。可以理解的是，不同的耳机其连接方式不同，举例说明如下：

第一种示例，耳机为无线耳机，与目标设备建立蓝牙通信链路或者局域网通信链路，通过蓝牙通信链路或者局域网通信链路向目标设备发送控制指令。

第二种示例，耳机为有线耳机，有线耳机与终端设备连接，通过音频线向终端设备发送目标设备和控制指令，以使终端设备建立与目标设备之间的通信链路，并将控制指令发送给目标设备。

综上所述，本发明实施例的基于耳机的语音控制方法，通过接收耳机控制指令，启动语音控制模式，接着接收用户发送的语音信息，并对语音信息进行语音解析获取目标设备和操作意图，然后查询预设的指令库获取与操作意图对应的控制指令，最后与目标设备建立通信链路，通过通信链路向目标设备发送控制指令，以使目标设备根据控制指令进行相应的操作处理。由此，避免了外界噪音对语音控制的干扰，使用户可以不考虑近场或者远场通信，提高了语音控制的准确性和灵活性。

基于上述实施例，为了进一步提高语音控制的准确性和灵活性，以及避免了外界噪音对语音控制的干扰，在接收耳机控制指令之前，需要进行相关处理操作，具体结合图2描述如下：

图2是根据本发明另一个实施例的基于耳机的语音控制方法的流程示意图。如图2所示，在步骤101之前，还包括：

步骤201，获取当前的场景特征和控制条件。

具体地，可以获取当前的场景特征比如户内、户外、会议和休息等等，还可以获取控制条件用户输入目标设备的距离等等。

步骤202，采集预设时段内的声音信息，分析声音信息的频率和幅度提取声音特征参数。

具体地，可以通过相关声音采集设备采集预设时段内的声音信息，其中，预设时段可以根据实际应用需要进行选择设置，接着通过预设算法、模型等方式分析声音信息的频率和幅度提取声音特征参数。

步骤203，从预设的噪音干扰数据库中获取与场景特征和控制条件对应的噪音阈值条件。

步骤204，若判断获知声音特征参数满足噪音阈值条件，则判断获知满足噪音触发条件，发送耳机控制指令。

具体地，预先在噪音干扰数据库中存储不同的场景特征和控制条件对应的噪音阈值条件，可以是映射表的形式存储场景特征和控制条件对应的噪音阈值条件，也可以是通过输入场景特征和控制条件到预设算法得到对应的噪音阈值条件。

进一步地，判断声音特征参数是否满足噪音阈值条件，在满足时发送耳机控制指令。也就是说只有声音特征参数满足当前的场景特征和控制条件的噪音阈值条件时才能够发送耳机控制指令，从而避免了外界噪音对语音控制的干扰，使用户可以不考虑近场或者远场通信。

需要说明的是，如果声音特征参数不满足噪音阈值条件，不发送耳机控制指令。

综上所述，本发明实施例的基于耳机的语音控制方法，通过获取当前的场景特征和控制条件，接着采集预设时段内的声音信息，并分析声音信息的频率和幅度提取声音特征参数，然后从预设的噪音干扰数据库中获取与场景特征和控制条件对应的噪音阈值条件，最后在判断获知声音特征参数满足噪音阈值条件时判断获知满足噪音触发条件，发送耳机控制指令。由此，避免了外界噪音对语音控制的干扰，使用户可以不考虑近场或者远场通信，提高了语音控制的准确性和灵活性。

基于上述实施例，当耳机连接有控制面板时，可以显示与至少一个设备对应的控制功能，以及根据目标设备反馈的响应消息显示实时的控制状态。比如可以控制面板了解设备对应的控制功能，以便进行精确的语音控制，同时还可以通过控制面板及时了解目标设备反馈的响应消息，确定当前的控制状态，进一步方便用户操作，提高用户体验。

为了实现上述实施例，本发明还提出一种基于耳机的语音控制装置，图3是根据本发明一个实施例的基于耳机的语音控制装置的结构示意图。如图3所示，该基于耳机的语音控制装置包括：启动模块11、解析模块12、查询模块13和处理模块14。

其中，启动模块11，用于接收耳机控制指令，启动语音控制模式。

解析模块12，用于接收用户发送的语音信息，对语音信息进行语音解析获取目标设备和操作意图。

查询模块13，用于查询预设的指令库获取与操作意图对应的控制指令。

处理模块14，用于与目标设备建立通信链路，通过通信链路向目标设备发送控制指令，以使目标设备根据控制指令进行相应的操作处理。

第一种示例，耳机为无线耳机，处理模块14具体用于与目标设备建立蓝牙通信链路或者局域网通信链路，通过蓝牙通信链路或者局域网通信链路向目标设备发送控制指令。

第二种示例，耳机为有线耳机，有线耳机与终端设备连接，处理模块14具体还用于通过音频线向终端设备发送目标设备和控制指令，以使终端设备建立与目标设备之间的通信链路，并将控制指令发送给目标设备。

需要说明的是，前述对基于耳机的语音控制方法实施例的解释说明也适用于该实施例的基于耳机的语音控制装置，此处不再赘述。

综上所述，本发明实施例的基于耳机的语音控制装置，通过接收耳机控制指令，启动语音控制模式，接着接收用户发送的语音信息，并对语音信息进行语音解析获取目标设备和操作意图，然后查询预设的指令库获取与操作意图对应的控制指令，最后与目标设备建立通信链路，通过通信链路向目标设备发送控制指令，以使目标设备根据控制指令进行相应的操作处理。由此，避免了外界噪音对语音控制的干扰，使用户可以不考虑近场或者远场通信，提高了语音控制的准确性和灵活性。

图4是根据本发明另一个实施例的基于耳机的语音控制装置的结构示意图。如图4所示，在图1的基础上，还包括：第一获取模块15、采集分析模块16、第二获取模块17和发送模块18。

其中，第一获取模块15，用于获取当前的场景特征和控制条件。

采集分析模块16，用于采集预设时段内的声音信息，分析声音信息的频率和幅度提取声音特征参数。

第二获取模块17，用于从预设的噪音干扰数据库中获取与场景特征和控制条件对应的噪音阈值条件。

发送模块18，用于在判断获知声音特征参数满足噪音阈值条件时判断获知满足噪音触发条件，发送耳机控制指令。

需要说明的是，前述对基于耳机的语音控制方法实施例的解释说明也适用于该实施例的基于耳机的语音控制装置，此处不再赘述。

综上所述，本发明实施例的基于耳机的语音控制装置，通过获取当前的场景特征和控制条件，接着采集预设时段内的声音信息，并分析声音信息的频率和幅度提取声音特征参数，然后从预设的噪音干扰数据库中获取与场景特征和控制条件对应的噪音阈值条件，最后在判断获知声音特征参数满足噪音阈值条件时判断获知满足噪音触发条件，发送耳机控制指令。由此，避免了外界噪音对语音控制的干扰，使用户可以不考虑近场或者远场通信，提高了语音控制的准确性和灵活性。

基于上述实施例，当耳机连接有控制面板时，如图5所示，在图3的基础上，还包括：显示模块19。

具体地，显示模块19可以显示与至少一个设备对应的控制功能，以及根据目标设备反馈的响应消息显示实时的控制状态。比如可以控制面板了解设备对应的控制功能，以便进行精确的语音控制，同时还可以通过控制面板及时了解目标设备反馈的响应消息，确定当前的控制状态，进一步方便用户操作，提高用户体验。

本发明提出一种计算机设备，图6是根据本发明一个实施例的计算机设备的结构示意图。如图6所示，存储器21、处理器22及存储在存储器21上并可在处理器22上运行的计算机程序。

处理器22执行所述程序时实现上述实施例中提供的基于耳机的语音控制方法。

进一步地，计算机设备还包括：

通信接口23，用于存储器21和处理器22之间的通信。

存储器21，用于存放可在处理器22上运行的计算机程序。

存储器21可能包含高速ram存储器，也可能还包括非易失性存储器(non-volatilememory)，例如至少一个磁盘存储器。

处理器22，用于执行所述程序时实现上述实施例所述的基于耳机的语音控制方法。

如果存储器21、处理器22和通信接口23独立实现，则通信接口21、存储器21和处理器22可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(industrystandardarchitecture，简称为isa)总线、外部设备互连(peripheralcomponent，简称为pci)总线或扩展工业标准体系结构(extendedindustrystandardarchitecture，简称为eisa)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图6中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

可选的，在具体实现上，如果存储器21、处理器22及通信接口23，集成在一块芯片上实现，则存储器21、处理器22及通信接口23可以通过内部接口完成相互间的通信。

处理器22可能是一个中央处理器(centralprocessingunit，简称为cpu)，或者是特定集成电路(applicationspecificintegratedcircuit，简称为asic)，或者是被配置成实施本发明实施例的一个或多个集成电路。

为了实现上述实施例，本发明还提出一种非临时性计算机可读存储介质，当所述存储介质中的指令由处理器被执行时，使得能够执行一种基于耳机的语音控制方法，所述方法包括：接收耳机控制指令，启动语音控制模式；接收用户发送的语音信息，对语音信息进行语音解析获取目标设备和操作意图；查询预设的指令库获取与操作意图对应的控制指令；与目标设备建立通信链路，通过通信链路向目标设备发送控制指令，以使目标设备根据控制指令进行相应的操作处理。

为了实现上述实施例，本发明还提出一种计算机程序产品，当所述计算机程序产品中的指令处理器执行时，执行一种基于耳机的语音控制方法，所述方法包括：接收耳机控制指令，启动语音控制模式；接收用户发送的语音信息，对语音信息进行语音解析获取目标设备和操作意图；查询预设的指令库获取与操作意图对应的控制指令；与目标设备建立通信链路，通过通信链路向目标设备发送控制指令，以使目标设备根据控制指令进行相应的操作处理。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(ram)，只读存储器(rom)，可擦除可编辑只读存储器(eprom或闪速存储器)，光纤装置，以及便携式光盘只读存储器(cdrom)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如，如果用硬件来实现和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(pga)，现场可编程门阵列(fpga)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王知践
技术所有人：百度在线网络技术（北京）有限公司
我是此专利的发明人