家用电器的语音控制方法以及装置与流程

文档序号：11628125阅读：432来源：国知局

本发明涉及家用电器控制领域，尤其涉及一种家用电器的语音控制方法以及装置。

背景技术：

智能家电日益受到厂家和大众的关注，各种智能技术逐渐被尝试用于家用电器设备上，以提高家用电器的易用性和智能化。语音识别技术，由于其便捷、人性化的交互体验，深受大家的青睐。很多家电企业都开始将语音识别技术应用在智能家电上。但是，现有的语音识别技术的应用，更多的是基于指令词的功能控制，勉强达到与遥控器相当的效果，距离真正的智能人机对话还有很长的距离。

目前，国内大多数的语音识别产品，只能支持单一标准普通话，尽管部分引擎通过引入口音训练，也仅仅只能支持“略带方言的普通话”，而对于纯方言来说，基本没有得到很好的支持，这样对于不会或不善于说普通话的用户来说，很难实现通过语音来控制家用电器的功能，用户体验变差。

技术实现要素：

本发明的目的旨在至少在一定程度上解决上述的技术问题之一。

为此，本发明的第一个目的在于提出一种家用电器的语音控制方法。该方法可以使得家用电器支持不同方言的语音控制，更进一步地扩大了使用家用电器语音控制的用户群体，提高了家用电器与用户之间的粘性，提升了用户的使用体验。

本发明的第二个目的在于提出一种家用电器的语音控制装置。

为达到上述目的，本发明第一方面实施例提出的家用电器的语音控制方法，包括：根据用户指令，从预先训练的多个语音识别引擎中选取目标语音识别引擎，其中，所述多个语音识别引擎之间相互独立；根据所述目标语音识别引擎对所述家用电器进行语音控制。

根据本发明实施例的家用电器的语音控制方法，根据用户指令从预先训练的多个语音识别引擎中选取目标语音识别引擎，并根据该目标语音识别引擎对家用电器进行语音控制。即根据用户需求从预先训练的多个语音识别引擎中来选择出能够识别用户自身常用或惯用语言的目标语音识别引擎，并通过该目标语音识别引擎识别用户输入的语音，以实现家用电器的语音控制，使得家用电器支持不同方言的语音控制，更进一步地扩大了使用家用电器语音控制的用户群体，提高了家用电器与用户之间的粘性，提升了用户的使用体验。

根据本发明的一个实施例，通过以下步骤获取所述用户指令：通过所述家用电器对应的遥控器，获取用户针对所述遥控器的第一操作，并根据所述第一操作生成所述用户指令；或者，所述家用电器中具有选择语言识别类别的按键装置，其中，获取用户针对所述按键装置的第二操作，并根据所述第二操作生成所述用户指令；或者，与所述家用电器适配的移动终端中具有语言识别类别切换功能的触控装置，其中，获取用户通过所述触控装置输入的针对所述语言识别类别的第三操作，并根据所述第三操作生成所述用户指令。

根据本发明的一个实施例，所述用户指令为用户输入的语音指令。

根据本发明的一个实施例，所述根据用户指令，从预先训练的多个语音识别引擎中选取目标语音识别引擎，包括：接收用户输入的语音指令；对所述语音指令进行识别和语言类别的匹配，并根据匹配度确定对应的目标语言类别；将当前使用的语音识别引擎切换至与所述目标语言类别对应的所述目标语音识别引擎。

根据本发明的一个实施例，所述语音指令中的文本内容包含预设的唤醒词，其中，所述对所述语音指令进行识别和语言类别的匹配，包括：根据预先训练的唤醒词识别引擎对所述语音指令进行识别和语言类别的匹配，其中，所述唤醒词识别引擎包含多种语言发音的唤醒词语音识别模型。

为达到上述目的，本发明第二方面实施例提出的家用电器的语音控制装置，包括：选取模块，用于根据用户指令，从预先训练的多个语音识别引擎中选取目标语音识别引擎，其中，所述多个语音识别引擎之间相互独立；语音控制模块，用于根据所述目标语音识别引擎对所述家用电器进行语音控制。

根据本发明实施例的家用电器的语音控制装置，可通过选取模块根据用户指令从预先训练的多个语音识别引擎中选取目标语音识别引擎，语音控制模块根据该目标语音识别引擎对家用电器进行语音控制。即根据用户需求从预先训练的多个语音识别引擎中来选择出能够识别用户自身常用或惯用语言的目标语音识别引擎，并通过该目标语音识别引擎识别用户输入的语音，以实现家用电器的语音控制，使得家用电器支持不同方言的语音控制，更进一步地扩大了使用家用电器语音控制的用户群体，提高了家用电器与用户之间的粘性，提升了用户的使用体验。

根据本发明的一个实施例，所述装置还包括：获取模块，用于获取所述用户指令；其中，所述获取模块具体用于：通过所述家用电器对应的遥控器，获取用户针对所述遥控器的第一操作，并根据所述第一操作生成所述用户指令；或者，所述家用电器中具有选择语言识别类别的按键装置，其中，获取用户针对所述按键装置的第二操作，并根据所述第二操作生成所述用户指令；或者，与所述家用电器适配的移动终端中具有语言识别类别切换功能的触控装置，其中，获取用户通过所述触控装置输入的针对所述语言识别类别的第三操作，并根据所述第三操作生成所述用户指令。

根据本发明的一个实施例，所述用户指令为用户输入的语音指令。

根据本发明的一个实施例，所述选取模块包括：接收单元，用于接收用户输入的语音指令；识别匹配单元，用于对所述语音指令进行识别和语言类别的匹配；确定单元，用于根据匹配度确定对应的目标语言类别；选取单元，用于将当前使用的语音识别引擎切换至与所述目标语言类别对应的所述目标语音识别引擎。

根据本发明的一个实施例，所述语音指令中的文本内容包含预设的唤醒词，其中，所述识别匹配单元具体用于：根据预先训练的唤醒词识别引擎对所述语音指令进行识别和语言类别的匹配，其中，所述唤醒词识别引擎包含多种语言发音的唤醒词语音识别模型。

本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1是根据本发明一个实施例的家用电器的语音控制方法的流程图；

图2是根据本发明一个具体实施例的家用电器的语音控制方法的流程图；

图3是根据本发明一个实施例的针对多个语音识别引擎的切换选择界面示例图；

图4是根据本发明另一个具体实施例的家用电器的语音控制方法的流程图；

图5是根据本发明一个实施例的家用电器的语音控制装置的结构示意图；

图6是根据本发明一个具体实施例的家用电器的语音控制装置的结构示意图；

图7是根据本发明另一个具体实施例的家用电器的语音控制装置的结构示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

下面参考附图描述本发明实施例的家用电器的语音控制方法以及装置。

图1是根据本发明一个实施例的家用电器的语音控制方法的流程图。需要说明的是，本发明实施例的家用电器的语音控制方法可应用于本发明实施例的家用电器的语音控制装置，其中，作为一种示例，该语音控制装置可被配置于家用电器，即该家用电器具有语音识别功能，通过该语音识别功能即可实现通过语音控制家电的目的；作为另一种示例，该语音控制装置还可配置于移动终端，该移动终端可提供与家用电器适配的应用程序，通过该应用程序即可控制家用电器，其中，该应用程序具有语音识别功能，可接收并识别用户的语音，并将识别到的语音生成对应的控制指令，通过该控制指令来对家用电器进行相应的控制。

如图1所示，该家用电器的语音控制方法可以包括：

s110，根据用户指令，从预先训练的多个语音识别引擎中选取目标语音识别引擎。

可以理解，上述多个语音识别引擎之间是相互独立工作，互不干扰，即每个语音识别引擎可独立完成语音的识别工作，并且，可以独立完成对该引擎中的语音识别模型的训练和优化等工作。其中，不同的语音识别引擎对应的不同语言类别，即每个语音识别引擎均是预先通过各自语言类别的语料进行训练而得到的。其中，在本发明的实施例中，该语言类别可包括但不限于普通话、英语、广东话、四川话、闽南话等，其中，方言类别不限于上述广东话、四川话、闽南话等这几种，还可以包括其他具有特色的方言，在此不作具体限定。

举例而言，可为用户提供用户指令的输入装置，用户可通过该输入装置输入用户指令，在接收到该用户指令之后，可从多个语音识别引擎中选取出与该用户指令对应的目标语音识别引擎。

需要说明的是，由于本发明实施例的家用电器的语音控制方法的应用场景的不同，所以上述用户指令的获取方式也会不同：例如，假设本发明实施例的家用电器的语音控制方法应用于移动终端，即通过移动终端中的应用程序来实现对家用电器的语音控制，此时语音识别功能可设置于该移动终端中，则可通过移动终端来获取用户输入的语音指令，并将该语音指令作为上述用户指令；又如，假设本发明实施例的家用电器的语音控制方法应用于家用电器，即该家用电器中具有语音识别功能，则可通过该家用电器的遥控器、或者该家用电器上的功能按键等方式来获取上述用户指令，具体实现过程可参见后续实施例的描述。

s120，根据目标语音识别引擎对家用电器进行语音控制。

具体地，在从多个语音识别引擎中选取出目标语音识别引擎之后，可通过该目标语音识别引擎来实现对家用电器的语音控制。例如，假设用户使用广东话控制语音，则可根据用户指令从多个语音识别引擎中选取出广东话语音识别引擎，这样，在用户输入广东话语音时，可通过该广东话语音识别引擎对用户输入的广东话语音进行识别，并根据识别结果生成对应的控制指令，最后，根据该控制指令控制家用电器执行相应的操作。

图2是根据本发明一个具体实施例的家用电器的语音控制方法的流程图。其中，以本发明实施例的家用电器的语音控制方法应用于家用电器为例，即该家用电器自身具有语音识别功能，此时，可通过家用电器的遥控器或按键等方式来获取用户输入的用户指令。具体地，如图2所示，该家用电器的语音控制方法可以包括：

s210，获取用户指令。

可以理解，用户指令的获取方式有很多种，例如，可以是通过遥控器来获取用户指令，还可以是通过家用电器自身的按键来获取用户指令等，具体实现过程可参见下述给出的示例：

作为一种示例，通过家用电器对应的遥控器，获取用户针对遥控器的第一操作，并根据第一操作生成用户指令，其中，该第一操作可为选择点击等操作。也就是说，用户可通过遥控器中的按键来选择满足用户需求的目标语音识别引擎。

作为另一种示例，家用电器中具有选择语言识别类别的按键装置，其中，获取用户针对按键装置的第二操作，并根据第二操作生成用户指令，其中，该第二操作可为选择点击等操作，此外，该按键装置可以是实体的物理按键，还可以是虚拟的触控按键等。也就是说，用户可通过家用电器的按键装置来选择满足用户需求的目标语音识别引擎。

作为又一种示例，与家用电器适配的移动终端中具有语言识别类别切换功能的触控装置，其中，获取用户通过触控装置输入的针对语言识别类别的第三操作，并根据第三操作生成用户指令。

也就是说，在本示例中，用于家用电器的语音识别功能被设置于移动终端中，可通过移动终端输入语音来控制家用电器进行相应操作，此时用户可通过移动终端提供的触控装置来选择满足用户需求的目标语音识别引擎。例如，如图3所示，移动终端中可安装有用于控制家用电器的应用程序，其中，该应用程序具有语音识别功能，用户通过输入语音即可实现对家用电器的控制，为了尽可能地满足各种方言的用户使用，该应用程序可提供多个相互独立工作的语音识别引擎，如普通话、english(英语)、四川话、闽南话、方言一、方言二等，并可通过各种方言的语音识别引擎的选择设置界面，用户通过该选择设置界面即可选择满足用户需求的目标语音识别引擎。

s220，根据用户指令，从预先训练的多个语音识别引擎中选取目标语音识别引擎，其中，多个语音识别引擎之间相互独立。

s230，根据目标语音识别引擎对家用电器进行语音控制。

为了进一步提升用户体验，可选地，在本发明的一个实施例中，在根据用户指令从预先训练的多个语音识别引擎中选取目标语音识别引擎的同时，还可播报该目标语音识别引擎所对应的语言种类。也就是说，在从多个语音识别引擎中选取目标语音识别引擎的过程中，可通过扬声器等播放装置播报当前选择的语言种类。由此，保证在没有屏幕交互的场景下，也能够让用户了解当前选择的语言种类。

根据本发明实施例的家用电器的语音控制方法，通过家用电器的遥控器、或者家用电器自身的按键、或者与家用电器适配的移动终端应用程序的选项等方式来获取用户输入的用户指令，并根据该用户指令从多个语音识别引擎中选取目标语音识别引擎，最后，根据该目标语音识别引擎对家用电器进行语音控制，即通过借助其他硬件来实现不同方言种类的语音识别引擎的切换，使得切换方式更加便捷。

为了进一步提升用户体验，方便用户针对不同方言种类的语音识别引擎的切换，在本发明的一个实施例中，可预先训练一个包含多种不同方言发音集合的唤醒词识别引擎，这样通过该唤醒词识别引擎来使得用户通过语音即可实现不同方言种类的语音识别引擎的切换，此时，用户输入的用户指令为用户输入的语音指令。具体地，如图4所示，本发明实施例的家用电器的语音控制方法可以包括：

s410，接收用户输入的语音指令。

可以理解，该语音指令即为用户输入的语音信息。

s420，对语音指令进行识别和语言类别的匹配，并根据匹配度确定对应的目标语言类别。

具体地，可对语音指令进行识别，得到该语音指令对应的文本内容，并判断该文本内容是否包含预设的唤醒词，若是，则提取该语音指令中的特征，并根据该特征来对语音指令进行语言类别的匹配，并将匹配度最高的语音类别作为该目标语言类别。

作为一种示例，上述对语音指令进行识别和语言类别的匹配的具体实现过程可如下：根据预先训练的唤醒词识别引擎对语音指令进行识别和语言类别的匹配。

具体地，可预先训练一个包含多种不同方言发音集合的唤醒词识别引擎，该唤醒词识别引擎中可包含多种语言发音的唤醒词语音识别模型，这样，在实际应用中，在接收到用户输入的语音指令时，可通过该多种语言发音的唤醒词语音识别模型对该语音指令进行识别和语言类别的匹配。作为一种示例，该唤醒词可为“语言切换”等。

s430，将当前使用的语音识别引擎切换至与目标语言类别对应的目标语音识别引擎。

具体地，在确定目标语言类别之后，可从多个语音识别引擎中选取出与该目标语言类别对应的目标语音识别引擎，此时可将当前使用的语音识别引擎切换到该目标语音识别引擎，以便后续通过该目标语音识别引擎实现家用电器的语音控制。由此，用户可以通过使用不同的方言讲唤醒词，来切换引擎自动识别语言种类，并跳转至对应的语音识别引擎。

s440，根据目标语音识别引擎对家用电器进行语音控制。

根据本发明实施例的家用电器的语音控制方法，用户可以通过使用不同的方言讲唤醒词，来切换引擎自动识别语言种类，并跳转至对应的语音识别引擎，以便后续通过该目标语音识别引擎实现家用电器的语音控制。即在整个语音控制的过程中，无需借助其他硬件来实现不同语音识别引擎之间的切换，减少了切换方言的成本，灵活无缝地给用户带来了便捷，极大提升了用户体验。

与上述几种实施例提供的家用电器的语音控制方法相对应，本发明的一种实施例还提供一种家用电器的语音控制装置，由于本发明实施例提供的家用电器的语音控制装置与上述几种实施例提供的家用电器的语音控制方法相对应，因此在前述家用电器的语音控制方法的实施方式也适用于本实施例提供的家用电器的语音控制装置，在本实施例中不再详细描述。图5是根据本发明一个实施例的家用电器的语音控制装置的结构示意图。如图5所示，该家用电器的语音控制装置可以包括：选取模块510和语音控制模块520。

具体地，选取模块510可用于根据用户指令，从预先训练的多个语音识别引擎中选取目标语音识别引擎，其中，多个语音识别引擎之间相互独立。

语音控制模块520可用于根据目标语音识别引擎对家用电器进行语音控制。

作为一种示例，以本发明实施例的家用电器的语音控制装置应用于家用电器为例，即该家用电器自身具有语音识别功能，此时，可通过家用电器的遥控器或按键等方式来获取用户输入的用户指令。举例而言，如图6所示，该家用电器的语音控制装置还可包括：获取模块530，用于获取用户指令。其中，在本发明的实施例中，该获取模块530具体用于：通过家用电器对应的遥控器，获取用户针对遥控器的第一操作，并根据第一操作生成用户指令；或者，家用电器中具有选择语言识别类别的按键装置，其中，获取用户针对按键装置的第二操作，并根据第二操作生成用户指令；或者，与家用电器适配的移动终端中具有语言识别类别切换功能的触控装置，其中，获取用户通过触控装置输入的针对语言识别类别的第三操作，并根据第三操作生成用户指令。

由此，通过借助其他硬件来实现不同方言种类的语音识别引擎的切换，使得切换方式更加便捷。

为了进一步提升用户体验，方便用户针对不同方言种类的语音识别引擎的切换，在本发明的一个实施例中，可预先训练一个包含多种不同方言发音集合的唤醒词识别引擎，这样通过该唤醒词识别引擎来使得用户通过语音即可实现不同方言种类的语音识别引擎的切换，此时，用户输入的用户指令为用户输入的语音指令。具体地，在本发明的实施例中，如图7所示，在如图5所示的基础上，该选取模块510可包括：接收单元511、识别匹配单元512、确定单元513和选取单元514。其中，接收单元511用于接收用户输入的语音指令。识别匹配单元512用于对语音指令进行识别和语言类别的匹配。确定单元513用于根据匹配度确定对应的目标语言类别。选取单元514用于将当前使用的语音识别引擎切换至与目标语言类别对应的目标语音识别引擎。

在本发明的实施例中，语音指令中的文本内容可为预设的唤醒词。其中，识别匹配单元512可根据预先训练的唤醒词识别引擎对语音指令进行识别和语言类别的匹配，其中，唤醒词识别引擎包含多种语言发音的唤醒词语音识别模型。

由此，在整个语音控制的过程中，无需借助其他硬件来实现不同语音识别引擎之间的切换，减少了切换方言的成本，灵活无缝地给用户带来了便捷，极大提升了用户体验。

在本发明的描述中，需要理解的是，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(ram)，只读存储器(rom)，可擦除可编辑只读存储器(eprom或闪速存储器)，光纤装置，以及便携式光盘只读存储器(cdrom)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(pga)，现场可编程门阵列(fpga)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：何瑞澄
技术所有人：广东美的制冷设备有限公司
我是此专利的发明人

上一篇：一种基于语音信号频域处理的空调控制装置的制造方法
上一篇：一种隐私保护的方法及移动终端与流程