一种智能设备的语音交互控制方法和装置与流程

文档序号：12609061阅读：458来源：国知局

本发明涉及智能设备语音交互技术领域，具体涉及一种智能设备的语音交互控制方法和装置。

背景技术：

目前，消费类智能设备通常具有语音交互功能，能够对用户的语音指令进行识别和理解，并进行语音对话。现有的智能设备在进行语音交互之前，通常需要进行语音唤醒。

语音唤醒的过程主要为：用户首先需要说唤醒词，唤醒词可以是针对某一特定智能设备而预先设置的。智能设备对语音进行检测，提取语音特征，确定提取到的语音特征与预设的唤醒词的语音特征是否匹配，如果匹配，唤醒识别功能对后续用户发出的语音指令进行语音识别和语义解析。例如，用户想和智能机器人进行聊天，需要先说出唤醒词“哈利，哈利”，智能机器人采集并识别出用户发出的语音信号中的词语与预定唤醒词匹配时，唤醒语音交互功能，并回复：“您好，……”

但是，现有技术中在唤醒智能设备以及和智能设备语音交互过程中，智能设备的位置都是固定的。当用户和智能设备之间离的较远时，智能设备往往不能有效识别用户发出的语音信号，导致用户体验较差。

技术实现要素：

本发明提供了一种智能设备的语音交互控制方法和装置，以解决现有的智能设备在与用户相距较远时往往不能有效识别用户发出的语音信号，导致用户体验较差的问题。

根据本发明的一个方面，提供了一种智能设备的语音交互控制方法，该方法包括：

实时监测并采集智能设备用户发出的语音信号；

对采集的语音信号进行语音识别；

根据智能设备对语音信号的语音识别结果，唤醒智能设备的相应功能并确定是否控制智能设备移动，是则，获取用户的位置，控制智能设备朝向用户移动，缩短智能设备与用户之间的距离，识别用户再次发出的语音信号；否则，直接根据语音识别结果控制所述智能设备执行相应的操作。

可选地，获取用户的位置，控制智能设备朝向用户移动包括：

控制智能设备朝向用户移动至第一预定位置，第一预定位置与用户之间的距离小于第一距离阀值。

可选地，还包括：

根据智能设备对用户再次发出的语音信号的语音识别结果，确定是否再次控制智能设备移动，是则，控制智能设备朝向用户移动至第二预定位置，第二预定位置与用户之间的距离小于第二距离阈值。

可选地，对采集的语音信号进行语音识别包括：从采集的语音信号中识别出唤醒词；

根据智能设备对语音信号的语音识别结果，唤醒智能设备的相应功能并确定是否控制智能设备移动包括：

当识别出的唤醒词与保存的预定唤醒词相匹配时，唤醒智能设备的相应功能并控制智能设备移动；或者，

对采集的语音信号进行语音识别包括：从采集的语音信号中识别出唤醒词和命令词；

根据智能设备对语音信号的语音识别结果，唤醒智能设备的相应功能并确定是否控制智能设备移动包括：

当识别出的唤醒词与保存的预定唤醒词相匹配，识别出的命令词与保存的预定命令词不相匹配时，唤醒智能设备的相应功能并控制智能设备移动；

当识别出的唤醒词与保存的预定唤醒词相匹配，且识别出的命令词与保存的预定命令词相匹配时，唤醒智能设备的相应功能并根据命令词的指示控制智能设备执行相应的操作。

可选地，获取用户的位置，控制智能设备朝向用户移动包括：

根据采集的语音信号，利用声源定位计算得到声源相对于智能设备的位置信息，根据位置信息确定出该用户与智能设备间的距离及方位；

利用确定出的用户与智能设备间的距离和方位，控制智能设备朝向用户移动，缩短智能设备与用户之间的距离，识别用户再次发出的语音信号。

可选地，利用确定出的用户与智能设备间的距离和方位，控制智能设备朝向用户移动，缩短智能设备与用户之间的距离包括：

利用距离定位确定出室内空间中用户的位置坐标以及智能设备当前的位置坐标，

根据确定出的用户的位置坐标以及预设的第一距离阀值，计算得到第一预定位置对应的位置坐标，

利用室内导航生成以智能设备当前的位置坐标为起点，以第一预定位置对应的位置坐标为终点的预设路径，实时控制智能设备按照该预设路径并以预设的固定步长移动到第一预定位置。

根据本发明的另一个方面，提供了一种智能设备的语音交互控制装置，该装置包括：

信号采集单元，用于实时监测并采集智能设备用户发出的语音信号；

语音识别单元，用于对采集的语音信号进行语音识别；

交互控制单元，用于根据智能设备对语音信号的语音识别结果，唤醒智能设备的相应功能并确定是否控制智能设备移动，是则，获取用户的位置，控制智能设备朝向用户移动，缩短智能设备与用户之间的距离，识别用户再次发出的语音信号；否则，直接根据语音识别结果控制智能设备执行相应的操作。

可选地，交互控制单元，具体用于控制智能设备朝向用户移动至第一预定位置，第一预定位置与用户之间的距离小于第一距离阀值；

和/或，

交互控制单元，还用于根据智能设备对用户再次发出的语音信号的语音识别结果，确定是否再次控制智能设备移动，是则，控制智能设备向用户移动至第二预定位置，第二预定位置与用户之间的距离小于第二距离阈值。

可选地，语音识别单元，用于从采集的语音信号中识别出唤醒词；

交互控制单元，用于当识别出的唤醒词与保存的预定唤醒词相匹配时，唤醒智能设备的相应功能并控制智能设备移动；或者，

语音识别单元，用于从采集的语音信号中识别出唤醒词和命令词；

交互控制单元，用于当唤醒词与保存的预定唤醒词相匹配，命令词与保存的预定命令词不相匹配时，唤醒智能设备的相应功能并控制智能设备移动；当唤醒词与保存的预定唤醒词相匹配，且命令词与保存的预定命令词相匹配时，唤醒智能设备的相应功能并根据命令词的指示控制智能设备执行相应的操作；

可选地，交互控制单元，还用于根据采集的语音信号，利用声源定位计算得到声源相对于智能设备的位置信息，根据位置信息确定出该用户与智能设备间的距离及方位；利用确定出的用户与智能设备间的距离和方位，控制智能设备朝向用户移动，缩短智能设备与用户之间的距离，识别用户再次发出的语音信号；

以及，利用距离定位确定出室内空间中用户的位置坐标以及智能设备当前的位置坐标，根据确定出的用户的位置坐标以及预设的第一距离阀值，计算得到第一预定位置对应的位置坐标，利用室内导航生成以智能设备当前的位置坐标为起点，以第一预定位置对应的位置坐标为终点的预设路径，实时控制智能设备按照该预设路径并以预设的固定步长移动到第一预定位置。

本发明的有益效果是：本发明的这种语音交互控制技术方案，通过实时监测并采集智能设备用户发出的语音信号，对采集的语音信号进行语音识别；根据智能设备对语音信号的语音识别结果，唤醒智能设备的相应功能并确定是否控制智能设备移动，是则，获取用户的位置，控制智能设备朝向用户移动，缩短智能设备与用户之间的距离，识别用户再次发出的语音信号；否则，直接根据语音识别结果控制智能设备执行相应的操作。如此，实现了在远场语音识别效果不佳的情况下，控制智能设备移动到说话人近前，并再次进行近场语音识别，提高语音识别率的有益效果，弥补了远场语音识别效果差，智能设备不能有效识别用户语音的缺点，优化了用户语音交互体验。

附图说明

图1是本发明一个实施例的一种智能设备的语音交互控制方法流程示意图；

图2是本发明一个实施例的一种智能设备的语音交互控制方法的流程示意图；

图3是本发明一个实施例的语音识别和声源定位的原理示意图；

图4是本发明一个实施例的一种智能设备的语音交互控制装置的结构框图。

具体实施方式

本发明的设计构思在于：本发明技术方案通过对用户发出的一次语音信号进行识别，当在智能设备初始位置(远场)无法有效识别出语音信号后，根据语音识别结果控制智能设备向用户移动到一个预定位置(近场)，以缩短智能设备和用户的距离，并当移动到近场后，再次与用户交互，从而能够根据用户语音信号适应调整位置，以准确识别出用户语音信号中的指令，优化了用户语音交互体验。

本发明以下实施例中以智能机器人为例来具体说明本发明的语音交互控制方案的应用。

现有的智能机器人语音交互的唤醒方式通常有两种，一是单唤醒词唤醒，举例而言，在语音交互之前，用户需要先发出唤醒词如，“哈利，哈利”，并听到机器人的答复(如，“hi，我是哈利……”)之后，用户再发出命令词，如“我想听讲故事”。这种唤醒方式需要说话人在说完唤醒词后等待一段时间再发出命令词，不符合用户正常的说话习惯。

一种改进的方式是采用唤醒词加命令词同时识别方式。例如，用户在语音交互之前，发出的语音指令“哈利，哈利，我想听讲故事”。但是，由于用户和智能机器人之间的距离远近不确定，所以，当用户与智能机器人之间相距较远时，智能机器人的远距离拾音效果不佳，对命令词的识别往往存在一定的偏差，进而导致用户交互体验也不理想。

为此，本发明实施例提供了一种语音交互控制方案，改善智能机器人对远距离识音效果差的问题。

实施例一

图1是本发明一个实施例的一种智能设备的语音交互控制方法流程示意图，参见图1，该语音交互控制方法包括：

步骤S11，实时监测并采集智能设备用户发出的语音信号；

步骤S12，对采集的语音信号进行语音识别；

步骤S13，根据智能设备对语音信号的语音识别结果，唤醒智能设备的相应功能并确定是否控制智能设备移动，是则，获取用户的位置，控制智能设备朝向用户移动，缩短智能设备与用户之间的距离，识别用户再次发出的语音信号；否则，直接根据语音识别结果控制所述智能设备执行相应的操作。

这里唤醒智能设备的相应功能可以是唤醒智能设备的语音交互功能，实际应用过程中，智能设备在没有用户和其对话的时候，可以处于休眠/待机状态以节省功耗，并且智能设备中可以设置麦克风阵列，用来实时监测并采集智能设备用户发出的语音信号。

由图1所示的方法可知，通过对用户发出的语音信号进行识别，当语音识别结果不理想时，控制智能设备朝向用户移动，缩短用户与智能设备的距离，当移动到与用户相距较近的位置后，再次对用户发出的语音信号进行识别(如，识别用户发出的命令词)从而实现了在识别效果不好的情况下，控制设备移动到说话人近前，进行近场语音识别，弥补了远场语音识别效果差的缺点。并且，只需用户发出一次语音指令，即可同时完成唤醒、指令识别和定位移动功能，优化了用户体验。

实施例二

图2是本发明一个实施例的一种智能设备的语音交互控制方法的流程示意图，以下结合图2对本发明实施例的语音交互控制方法的实现步骤和原理进行具体说明。参见图2，本实施例的方法包括如下步骤S21至步骤S27。

流程开始；

步骤S21，判断是否有用户语音输入；是则，执行步骤S22，否则可结束流程。

步骤S22，执行唤醒算法和声源定位；

在采集到用户发出的语音信号后，智能机器人内部的语音信号处理功能根据该语音信号执行唤醒算法和声源定位。

图3是本发明一个语音识别和声源定位的原理示意图，参见图3，包括：

流程开始，

执行步骤S32：对采集的语音信号进行语音信号识别，判断出语音信号中只有唤醒词时，识别唤醒词，得到单唤醒词识别结果；或执行步骤S31：对采集的语音信号进行语音信号识别，判断出语音信号中既包括唤醒词又包括命令词(或命令语句)时，识别唤醒词及命令词，得到唤醒词和命令词识别结果；

在步骤S32中得到单唤醒词语音识别结果(如，“哈利哈利”)，可控制唤醒智能机器人并等待用户再次说话。在步骤S31中，得到唤醒词和命令词识别结果(如，“哈利哈利，我想听讲故事”)，可根据识别出的唤醒词唤醒智能机器人，并控制智能机器人根据命令词的指示做相应的操作。由此满足支持不同唤醒识别方式的智能机器人的交互需求。例如，针对支持单一唤醒词识别方式的智能机器人而言，可以选择按照步骤S32及其后的步骤执行。而对于唤醒语音指令中包括命令词时，支持唤醒词及命令词同时识别的识别方式的智能机器人则可以按照步骤S31→步骤S33→步骤S35的顺序执行。

本实施例中，根据智能设备对语音信号的语音识别结果，唤醒智能设备的相应功能并确定是否控制智能设备移动包括三种情形分别为：

第一种情形，当识别出的唤醒词与保存的预定唤醒词相匹配时，唤醒智能设备的相应功能并控制智能设备移动；这种情况下，支持单一唤醒词唤醒模式，即，用户只需要说出预定的唤醒词，即可唤醒智能机器人的例如语音交互功能，并触发机器人内部的移动控制实现移动到用户近前的效果。

第二种情形，当识别出的唤醒词与保存的预定唤醒词相匹配，识别出的命令词与保存的预定命令词不相匹配时，唤醒智能设备的相应功能并控制智能设备移动。这种情况下，支持唤醒词和命令词唤醒模式，即，智能机器人能够识别用户说出了预定唤醒词和不确定的命令词，但是由于语音的模糊性，环境噪声干扰致使无法准确识别出命令词是否是预定命令词，这时可唤醒智能机器人的相应功能例如语音交互功能，并触发机器人内部的移动控制实现移动到用户的近前的效果。当移动到用户近前后，可以控制智能机器人引导用户再次说出命令词，从而基于近场语音识别，更有效的识别出用户说出的命令词。

第三种情形，当识别出的唤醒词与保存的预定唤醒词相匹配，且识别出的命令词与保存的预定命令词相匹配时，唤醒智能设备的相应功能并根据命令词的指示控制智能设备执行相应的操作。这种情形也是支持唤醒词和命令词唤醒模式，当可以识别出用户说出的预定唤醒词和预定命令词，控制智能机器人直接根据命令词的指示执行相应动作而无须控制智能机器人移动。由于能够准确识别出唤醒词和命令词，说明智能机器人和用户的距离是是合适的，此时可不必控制机器人移动而直接执行用户要求的动作，以向用户提供自然流畅的交互体验。

需要强调的是，如何对用户发出的语音信号进行语音识别不是本发明实施例的重点，可以采用现有技术任一可行的技术手段来实现，本实施例中没有说明的技术细节可以参见现有技术，这里不再赘述。

根据步骤S32中的语音信号识别结果，在识别出唤醒词后，执行步骤S34，声源定位。即，根据用户本次发出的只包括了唤醒词的语音信号进行声源定位。

根据步骤S31中的语音信号识别结果，在识别出唤醒词和命令词后，执行步骤S33，声源定位。即，根据用户本次发出的既包括了唤醒词又包括了命令词的语音信号进行声源定位。

需要说明的是，本实施例中，声源定位和语音识别之间的执行顺序没有严格限定，即，可以在进行语音识别的同时执行声源定位，或者先执行声源定位后执行语音识别，或者，先执行语音识别后执行声源定位。

声源定位是通过计算用户发出的声音，到达智能机器人的时间差和声强差对声源进行准确的定位，确定出说话人的方向或位置。举例而言，现有技术中可以利用麦克风(MIC)阵列，通常是环MIC(4+1)或者(6+1)完成360°的声源定位；或者，利用线性双MIC或四MIC，完成180°的声源定位。这里，步骤S33和步骤S34中声源定位可以采用现有技术来实现，并且步骤S33和步骤S34中的声源定位的实现过程可以相同。

在步骤S34执行之后，执行步骤S36，输出位置信息。在步骤S33执行之后，执行步骤S35，输出位置信息。

这里，步骤S35和步骤S36中的输出位置信息，具体是输出用户(即，说话人)相对于智能机器人的距离和方位信息给智能机器人的移动控制处理功能，使得移动控制处理功能可以根据用户的方向或位置信息在需要时进行移动控制，缩短用户和智能机器人的距离。流程结束。

通过图3所示可知，当用户与智能机器人进行语音交互，发出了语音信号时，智能机器人的语音识别功能，利用语音识别算法识别出用户本次发出的语音信号中的唤醒词，或者同时识别出语音信号中的唤醒词和命令词后可得到两种语音识别结果，如图2中步骤S231和步骤S232所示。

步骤S231，单唤醒词；步骤S232，唤醒词和命令词；

这里和图3中的步骤S31和步骤S32类似，都可以根据智能机器人的具体情况来选择一个分支执行。

如果在步骤S231中识别出用户当前的发出语音信号的是单一唤醒词，则智能机器人可直接执行步骤S25，结合声源定位、距离定位和室内导航实现自动移动到用户身边。

具体的，本实施例的方法先通过声源定位确定出用户相对于智能机器人的位置信息(包括距离和方位信息)，然后先控制智能设备朝向用户移动至第一预定位置，第一预定位置与用户之间的距离小于第一距离阀值。例如，根据声源定位确定出用户与智能机器人相距5米，则可以控制智能机器人朝向用户移动到第一预定位置，第一预定位置与用户之间的距离小于第一距离阀值，例如第一距离阈值为3米，则可以控制智能机器人移动到相距用户2.5米的位置。

当智能机器人移动到相距用户2.5米的位置之后，可以对用户再次发出的语音信号的语音识别结果，确定是否再次控制智能设备移动，是则，控制智能设备朝向用户移动至第二预定位置，第二预定位置与用户之间的距离小于第一距离阈值。举例而言，如果在与用户相距2.5米的位置仍然不能有效的识别出用户的语音信号中的命令词，则可以考虑进一步缩短用户和智能机器人之间的距离以提高语音识别率。

如果在步骤S232中识别出用户当前的发出的语音信号是既包括唤醒词又包括命令词时，则执行步骤S24。

步骤S24，语音指令识别，若识别出命令，则执行步骤S27，若未识别出命令，则执行步骤S25，

步骤S25，结合声源定位、距离定位和室内导航实现自动移动到用户身边(近场)。

本实施例中，控制智能设备朝向用户移动是利用了声源定位、距离定位和室内导航算法来具体实现的，以下详细说明。

首先，本实施例根据采集的用户说出的语音信号，利用声源定位计算得到声源(即说话人)相对于智能设备的位置信息，根据位置信息确定出该用户与智能设备间的距离及方位；

接着，在确定出的用户与智能设备间的距离和方位后，利用距离定位方式确定出室内空间中用户的位置坐标以及智能设备当前的位置坐标，根据确定出的用户的位置坐标以及预设的第一距离阀值，计算得到第一预定位置对应的位置坐标，这里的距离定位有两种具体实现方式，一种是利用视觉识别，例如，3D深度视觉，通过带有深度信息采集功能的摄像头，能够识别平面图像之外的三维立体数据，直接得到用户在室内空间的深度距离信息。另一种实现方式是，红外线测距，通过红外线传感器来识别和确定用户在室内空间中的具体位置坐标。

最后，利用室内导航生成以智能设备当前的位置坐标为起点，以第一预定位置对应的位置坐标为终点的预设路径，实时控制智能设备按照该预设路径并以预设的固定步长移动到第一预定位置。

这里的室内导航也可以采用现有技术来实现。例如，SLAM(Simultaneous Localization and Mapping，即时定位与地图构建)能够增强环境感知的能力，在不依赖Wi-Fi或蓝牙的前提下，也能独立感知所在的室内环境并辅助智能机器人构建在室内场景中的三维数据生产及环境感知系统，助力机器人的自主行走。

需要强调的是，本实施例中在具体导航时，是控制智能机器人按照预定的固定步长移动的，即控制机器人每一步移动固定的距离从而向说话人靠近，以获得更优的语音识别效果。

步骤S26，语音交互并再次进行语音指令识别，识别到准确的命令词，则控制执行该命令词相应的操作；若仍然无法准确识别到命令词，则返回执行步骤S25或直接结束。

本实施例中，当控制智能机器人移动到合适的位置(例如，与用户相距1米的位置)后，可以控制智能机器人说一些引导词，以引导用户再说一遍命令词，并再次进行语音指令识别，如果在该位置能够正确识别出命令词，则控制控制执行该命令词相应的操作，满足用户使用需求。如果还是不能准确识别出命令词，则可以返回执行步骤25，继续控制智能机器人移动，缩短智能机器人与用户间的距离，避免由于智能机器人与用户距离较远而导致智能机器人无法准确识别出用户说出的命令词。或者，直接结束流程。

本实施例中，还可以对语音识别的次数进行限制，例如，设置语音识别的次数阈值，如三次，当用户说了三次命令词，而进行了相应的三次语音识别后，智能机器人仍然不能有效识别出命令词，则可以控制结束流程，以保证提供良好的用户交互体验。或者，在智能机器人未准确识别出命令词时，对未准确识别出命令词设定次数阈值，对每次进行的命令词识别进行累计，当未准确识别出命令词的次数超过次数阈值时，再控制智能机器人移动，缩短智能机器人与用户间的距离。之所以设定未准确识别出命令词次数，是为了防止实际应用时，由于用户说话声音太小并非两者距离太远而未准确识别出命令词，这时控制智能机器人移动既不能解决问题并会增加系统功耗。

至此，通过本发明实施例的语音交互控制方法优化了智能设备由唤醒到进入工作状态的流程，保证了智能设备可支持通过单唤醒词唤醒以及唤醒词加命令语句同时识别直接进行命令动作两种工作状态，并且，当识别到用户说出的命令词不清晰时，可以通过声源定位辅助控制智能设备移动到用户近前交互，提高语音识别的识别率，给用户提供了自然、流畅的交互体验，解决了用户对交互流程不熟悉造成的交互体验差的问题。

实施例三

本实施例以列举一个本发明实施例的智能设备的语音交互控制方法的具体应用场景。

在本实施例中，智能设备具体为服务机器人，该服务器机器人能够执行本发明实施例的智能设备的语音交互控制方法。

机器人和3岁的小明都在客厅中，小明对机器人进行语音唤醒，如果机器人没有被唤醒，不进行任何反应。

小明和机器人的初始距离在2米内，小明对机器人说：“哈利，我想听讲故事。”若没有听清则机器人询问：“我没有听清，请再说一遍吧。”

同时，机器人根据小明发出的声音信号，计算出哪个方位发出的声音，面部转向这一方向进行响应，并移动到小明面前(距离在1米之内)。再次对小明发出的语音信号进行识别，当机器人识别出小明再次发出的预定命令词：“讲故事”后，查找保存的预先录制好的故事音频并播放，完成小明要求的动作。

实施例四

图4是本发明一个实施例的一种智能设备的语音交互控制装置的结构框图，参见图4，智能设备的语音交互控制装置40包括：

信号采集单元401，用于实时监测并采集智能设备用户发出的语音信号；

语音识别单元402，用于对采集的语音信号进行语音识别；

交互控制单元403，用于根据智能设备对语音信号的语音识别结果，唤醒智能设备的相应功能并确定是否控制智能设备移动，是则，获取用户的位置，控制智能设备朝向用户移动，缩短智能设备与用户之间的距离，识别用户再次发出的语音信号；否则，直接根据语音识别结果控制智能设备执行相应的操作。

本实施例中，交互控制单元403，具体用于控制智能设备朝向用户移动至第一预定位置，第一预定位置与用户之间的距离小于第一距离阀值；

和/或，

交互控制单元403，还用于根据智能设备对用户再次发出的语音信号的语音识别结果，确定是否再次控制智能设备移动，是则，控制智能设备向用户移动至第二预定位置，第二预定位置与用户之间的距离小于第二距离阈值。

在本发明的一个实施例中，语音识别单元402，用于从采集的语音信号中识别出唤醒词；

交互控制单元403，用于当识别出的唤醒词与保存的预定唤醒词相匹配时，唤醒智能设备的相应功能并控制智能设备移动；

语音识别单元402，还用于从采集的语音信号中识别出唤醒词和命令词；

交互控制单元403，用于当唤醒词与保存的预定唤醒词相匹配，命令词与保存的预定命令词不相匹配时，唤醒智能设备的相应功能并控制智能设备移动；当唤醒词与保存的预定唤醒词相匹配，且命令词与保存的预定命令词相匹配时，唤醒智能设备的相应功能并根据命令词的指示控制智能设备执行相应的操作；

在本发明的一个实施例中，交互控制单元403，还用于根据采集的语音信号，利用声源定位计算得到声源相对于智能设备的位置信息，根据位置信息确定出该用户与智能设备间的距离及方位；利用确定出的用户与智能设备间的距离和方位，控制智能设备朝向用户移动，缩短智能设备与用户之间的距离，识别用户再次发出的语音信号；以及，利用距离定位确定出室内空间中用户的位置坐标以及智能设备当前的位置坐标，根据确定出的用户的位置坐标以及预设的第一距离阀值，计算得到第一预定位置对应的位置坐标，利用室内导航生成以智能设备当前的位置坐标为起点，以第一预定位置对应的位置坐标为终点的预设路径，实时控制智能设备按照该预设路径并以预设的固定步长移动到第一预定位置。

通过图4所示的智能设备的语音交互控制装置，当用户发出语音指令后，语音交互控制装置自动实现语音唤醒和声源定位，若智能设备被唤醒，将语音数据发送到被唤醒的主程序以实现指令识别，若指令识别正确，则直接执行指令操作，若识别可信度较低，则利用声源定位的结果定位到说话人的方位，并结合距离定位(如视觉识别、红外等)确定说话人的具体位置，再运用室内导航技术(如SLAM算法)，控制智能设备移动到说话人身边，达到近场(如，与用户相距1米内)语音交互，再次实现语音指令识别，提高语音识别率。

需要说明的是，本实施例中的智能设备的语音交互控制装置是与前述智能设备的语音交互控制方法相对应的，因而本实施例中对智能设备人物识别的装置实现步骤没有描述的部分可以参见本发明前述实施例的相关说明，这里不再赘述。

本发明的这种语音交互控制技术方案，通过实时监测并采集智能设备用户发出的语音信号，对采集的语音信号进行语音识别；根据智能设备对语音信号的语音识别结果，唤醒智能设备的相应功能并确定是否控制智能设备移动，是则，获取用户的位置，控制智能设备朝向用户移动，缩短智能设备与用户之间的距离，识别用户再次发出的语音信号；否则，直接根据语音识别结果控制智能设备执行相应的操作。如此，实现了在远场语音识别效果不佳的情况下，控制智能设备自动移动到说话人近前，并再次进行近场语音识别提高语音识别率的有益效果，弥补了远场语音识别效果差，智能设备不能有效识别用户语音的缺点，优化了用户语音交互体验。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：马洪龙;陈川;刘翠;
技术所有人：歌尔股份有限公司;
我是此专利的发明人

上一篇：智能心电监护系统的制作方法与工艺
上一篇：一种高强度脱醇型单组分RTV硅橡胶及其制备方法与流程