机器人语音指令识别的方法及相关机器人装置与流程

文档序号：12513533阅读：454来源：国知局

本发明实施方式涉及机器人领域，特别是涉及一种机器人语音指令识别的方法及相关机器人装置。

背景技术：

当前可运动有机械动作能力的机器人在工作时，由于舵机和/或马达的运转，或者对其他物体的操作或清洁(如开门操作、洗碗操作、扫地操作等等)，都不可避免地产生噪声，而如果用户在这个过程中又对机器人发出了语音指令，噪声就必然对机器人语音识别的准确率造成一定的影响。即使有降噪算法，也只能对稳态噪声进行过滤，对机器人工作过程中变化的和不可预测的噪声很难滤除。另一种方法就是机器人在检测到用户发出语音后则停止当前的动作，等接收到语音指令后再继续之前的动作，但这样做又必然会降低工作效率。

鉴于此，克服上述现有技术所存在的缺陷是本技术领域亟待解决的问题。

技术实现要素：

本发明实施方式主要解决的技术问题是提供一种机器人语音指令识别的方法及相关机器人装置，能够较好地协调语音指令识别准确率与工作效率。

为解决上述技术问题，本发明实施方式采用的一个技术方案是：提供一种机器人语音指令识别的方法，包括：在检测到用户发出语音后，且在当前语音指令识别准确率低于预设的准确率阈值时，调整机器人的工作状态至机器人在调整后的语音指令识别准确率达到预设的准确率阈值。

其中，上述方法还包括：获取当前噪声等级；根据当前噪声等级，按照噪声等级与识别准确率的对应关系确定当前语音指令识别准确率。

其中，预设的准确率阈值与机器人当前执行任务的优先级对应；执行任务的优先级越高，对应的准确率阈值越低。

其中，调整机器人的工作状态至机器人在调整后的语音指令识别准确率达到预设的准确率阈值包括：根据当前语音指令识别准确率和预设的准确率阈值的差值，确定对机器人的工作状态的调整幅度；按照所确定的调整幅度调整机器人的动作，使机器人在调整后的语音指令识别准确率达到预设的准确率阈值。

其中，上述方法还包括：在机器人在调整后的语音指令识别准确率未达到预设的准确率阈值时，告知用户当前环境噪声较大或向用户靠近。

其中，在机器人在调整后的语音指令识别准确率未达到预设的准确率阈值时，告知用户当前环境噪声较大或向用户靠近，是指:在机器人在调整后的语音指令识别准确率未达到预设的准确率阈值且当前执行任务的优先级低于预设优先级时，告知用户当前环境噪声较大或向用户靠近。

其中，调整机器人的工作状态至机器人在调整后的语音指令识别准确率达到预设的准确率阈值包括：按照预设的调整幅度步进调整机器人的动作，至机器人在调整后的语音指令识别准确率达到预设的准确率阈值。

其中，上述方法还包括：在机器人在调整工作状态后停止动作时，语音指令识别准确率仍未达到预设的准确率阈值时，告知用户当前环境噪声较大或向用户靠近。

其中，调整机器人的工作状态包括如下一种或者任意几种：放慢动作速度、降低马达转速、关闭非人声频段舵机。

为解决上述技术问题，本发明实施方式采用的另一个技术方案是：提供一种机器人语音指令识别装置，包括：调整模块，用于在用户发出语音后，且在当前语音指令识别准确率低于预设的准确率阈值时，调整机器人的工作状态至机器人在调整后的语音指令识别准确率达到预设的准确率阈值。

其中，上述装置还包括：获取模块，用于获取当前噪声等级；准确率确定模块，用于根据当前噪声等级，按照噪声等级与识别准确率的对应关系确定当前语音指令识别准确率。

其中，上述调整模块包括：幅度确定单元，用于根据当前语音指令识别准确率和预设的准确率阈值的差值，确定对机器人的工作状态的调整幅度；第一调整单元，用于按照所确定的调整幅度调整机器人的动作，使机器人在调整后的语音指令识别准确率达到预设的准确率阈值。

为解决上述技术问题，本发明实施方式采用的另一个技术方案是：提供一种机器人装置，包括：

至少一个处理器；以及

与至少一个处理器连接的存储器；其中，

存储器存储有可被至少一个处理器执行的指令程序，指令程序被至少一个处理器执行，以使至少一个处理器用于：

在检测到用户发出语音后，且在当前语音指令识别准确率低于预设的准确率阈值时，调整机器人的工作状态至机器人在调整后的语音指令识别准确率达到预设的准确率阈值。

与现有技术相比，本发明实施方式的有益效果是：

本发明实施例中，在检测到用户发出语音指令后，且在当前语音指令识别准确率低于预设的准确率阈值时，机器人装置调整自身的工作状态，例如放慢动作速度，以使得调整后的语音指令识别准确率达到预设的准确率阈值，从而使得机器人装置无需停止动作即可更为准确地接收语音指令，较好地协调了语音指令识别准确率与工作效率。

附图说明

图1是本发明机器人语音指令识别的方法的一个实施例的流程示意图；

图2是本发明机器人语音指令识别装置的一个实施例的结构示意图；

图3是本发明机器人装置的一个实施例的结构示意图。

具体实施方式

本发明实施例提供了一种机器人语音指令识别的方法、机器人语音指令识别装置及机器人装置。

请参阅图1，图1是本发明机器人语音指令识别的方法的一个实施例的流程示意图。如图1所示，本实施例包括：

步骤101：在检测到用户发出语音后，判断当前语音指令识别准确率是否低于预设的准确率阈值；

本实施例的执行主体具体可以是机器人装置。机器人装置在执行任务过程中，可以不断地检测用户是否发出语音，例如可以在捕捉到用户声音时，认为用户正在发出语音，而后判断当前语音指令识别准确率是否低于预设的准确率阈值。

优选地，预设的准确率阈值与机器人当前执行任务的优先级对应；执行任务的优先级越高，对应的准确率阈值越低。这样，优先级越高的执行任务越不容易被用户发出的语音指令打扰。

例如，机器人的任务优先级分为1，2，3，4，5共五级(实际可分为任意级)，1级为最高优先级，5级为最低优先级。语音指令的优先级可定义为任意两个优先级之间，如1.5，2.5，3.5，4.5，以保证语音命令与任何任务不处于相同优先级。根据任务的优先级预设的准确率阈值分别为x1，x2，x3，x4，x5，对应任务优先级的1-5级，准确率阈值x1最低，准确率阈值x5最高。

可以根据当前噪声来确定当前语音指令识别准确率，例如：获取当前噪声等级；根据当前噪声等级，按照本地保存的噪声等级与识别准确率的对应关系确定当前语音指令识别准确率。例如，噪声等级1为大于等于10dB且小于20dB，噪声等级2为大于等于20dB且小于30dB，噪声等级越高，语音指令识别准确率越低。

也可以在检测到用户发出语音指令后，尝试识别一次语音指令的表达内容，如果不能识别，则判定当前语音指令识别准确率低于预设的准确率阈值。例如，在步骤101中，在检测到用户发出语音指令后，在判断当前语音指令识别准确率是否低于预设的准确率阈值之前还可以包括：识别用户语音指令的表达内容。此时，判断当前语音指令识别准确率是否低于预设的准确率阈值具体可以包括：在无法识别用户语音指令的表达内容时，判定当前语音指令识别准确率低于预设的准确率阈值。

步骤102：在判定当前语音指令识别准确率低于预设的准确率阈值时，调整机器人的工作状态至机器人在调整后的语音指令识别准确率达到预设的准确率阈值。

具体地，调整机器人的工作状态可以包括如下一种或者任意几种：放慢动作速度、降低马达转速、关闭非人声频段舵机，这些都有助于降低机器人自身或对物体的操作噪声对语音指令识别准确率的影响，可以提高当前语音指令识别准确率，利于机器人装置正确接收语音指令。

可以根据经验预先设定语音指令识别准确率差值与调整幅度的对应关系，从而可以根据该差值来对机器人的工作状态进行调整。因此，步骤102中，调整机器人的工作状态至机器人在调整后的语音指令识别准确率达到预设的准确率阈值具体可以包括：根据当前语音指令识别准确率和预设的准确率阈值的差值，确定对机器人的工作状态的调整幅度；按照所确定的调整幅度调整机器人的动作，使机器人在调整后的语音指令识别准确率达到预设的准确率阈值。

正常情况下，根据上述差值来对机器人的工作状态进行调整后，机器人的语音指令识别准确率应该能够达到预设的准确率阈值，如果仍然不能达到，则判定当前噪声来自外界环境而非自身运动，可以告知用户当前环境噪声较大，可能造成识别不正确的情况，或者向用户靠近以更好地接收语音指令。优选地，在调整后的语音指令识别准确率未达到预设的准确率阈值的情况下，且当前执行任务的优先级低于预设优先级时，告知用户当前环境噪声较大或向用户靠近，这样，优先级越高的执行任务越不容易被用户发出的语音指令打扰。

当然，也可以步进式地调整机器人的动作，即调整机器人的工作状态至机器人在调整后的语音指令识别准确率达到预设的准确率阈值可以包括：按照预设的调整幅度步进调整机器人的动作，至机器人在调整后的语音指令识别准确率达到预设的准确率阈值。例如，按照阶梯递减20％调整可影响人声频段的相应动作速度和幅度，每次递减完再次获取当前噪声等级，判断当前语音指令识别准确率是否低于预设的准确率阈值，如果低于预设的准确率阈值，则保持当前动作速度和幅度等，直到语音指令接收完成。

如果阶梯递减直到机器人停止动作，语音指令识别准确率仍然低于预设的准确率阈值，则判定此噪声来自外界环境而非自身运动，可以告知用户当前环境噪声较大，可能造成识别不正确的情况，或者向用户靠近以更好地接收语音指令。

步骤103：在判定当前语音指令识别准确率不低于预设的准确率阈值时，继续接收用户发出的语音。

本实施例中，在检测到用户发出语音指令后，且在当前语音指令识别准确率低于预设的准确率阈值时，机器人装置调整自身的工作状态，例如放慢动作速度，以使得调整后的语音指令识别准确率达到预设的准确率阈值，从而使得机器人装置无需停止动作即可更为准确地接收语音指令，较好地协调了语音指令识别准确率与工作效率。如果机器人的调整速度足够快，则能够很快的完成收敛，基本不影响用户当前执行的任务，体验很好；而如果调整速度较慢，则可能收敛时间较长，但依然会好于没有此方法应用的情况。

需要说明的是，在一些实施例中，判断当前语音指令识别准确率是否低于预设的准确率阈值可以不在检测到用户发出语音指令后进行。例如，机器人装置可以在开始新任务后判断当前语音指令识别准确率是否低于预设的准确率阈值，并在本地保存判断结果，在检测到用户发出语音指令后读取该判断结果即可。

实施例二

请参阅图2，图2是本发明机器人语音指令识别装置的一个实施例的结构示意图。如图2所示，本实施例包括：

检测模块201，用于检测用户发出的语音指令；

检测模块可以不断地检测用户是否发出语音指令，例如可以在捕捉到用户声音时，认为用户正在发出语音指令。

判断模块202，用于判断当前语音指令识别准确率是否低于预设的准确率阈值；

可以根据当前噪声来确定当前语音指令识别准确率。例如，机器人语音指令识别还可以包括：获取模块，用于获取当前噪声等级；准确率确定模块，用于根据当前噪声等级，按照噪声等级与识别准确率的对应关系确定当前语音指令识别准确率。

本实施例中，检测模块201检测到用户发出语音指令之后，触发判断模块202执行操作。

调整模块203，用于在检测模块检测到用户发出语音指令后，且在判断模块判定当前语音指令识别准确率低于预设的准确率阈值时，调整机器人的工作状态至机器人在调整后的语音指令识别准确率达到预设的准确率阈值。

可以根据经验预先设定语音指令识别准确率差值与调整幅度的对应关系，从而可以根据该差值来对机器人的工作状态进行调整。例如，调整模块203可以包括：幅度确定单元，用于根据当前语音指令识别准确率和预设的准确率阈值的差值，确定对机器人的工作状态的调整幅度；第一调整单元，用于按照所确定的调整幅度调整机器人的动作，使机器人在调整后的语音指令识别准确率达到预设的准确率阈值。

也可以步进式地调整机器人的动作。例如，调整模块203可以包括：第二调整单元，用于按照预设的调整幅度步进调整机器人的动作，至机器人在调整后的语音指令识别准确率达到预设的准确率阈值。

具体地，调整模块203调整机器人的工作状态可以包括如下一种或者任意几种：放慢动作速度、降低马达转速、关闭非人声频段舵机，这些都有助于降低机器人自身或对物体的操作噪声对语音指令识别准确率的影响，可以提高当前语音指令识别准确率，利于机器人装置正确接收语音指令。

本实施例中，在检测模块检测到用户发出语音指令后，且在判断模块判定当前语音指令识别准确率低于预设的准确率阈值时，调整模块调整自身的工作状态，例如放慢动作速度，以使得调整后的语音指令识别准确率达到预设的准确率阈值，从而使得机器人装置无需停止动作即可更为准确地接收语音指令，很好地协调了语音指令识别准确率与工作效率。

在一些实施例中，判断模块202也可以不在检测模块201检测到用户发出语音指令后执行操作。例如，判断模块202可以在机器人开始新任务后判断当前语音指令识别准确率是否低于预设的准确率阈值，并在本地保存判断结果，检测模块201检测到用户发出语音指令后，机器人语音指令识别装置直接读取该判断结果即可。

在一些实施例中，机器人语音指令识别装置也可以不包括检测模块201与判断模块202，而由外部设备在用户发出语音后，且在当前语音指令识别准确率低于预设的准确率阈值时，触发调整模块203调整机器人的工作状态。

实施例三

请参阅图3，图3是本发明机器人装置的一个实施例的结构示意图。如图3所示，机器人装置300包括：

至少一个处理器310，图3中以一个处理器310为例；以及与至少一个处理器310通信连接的存储器320；其中，存储器存储有可被至少一个处理器执行的指令程序，指令程序被至少一个处理器执行，以使至少一个处理器能够执行上述机器人语音指令识别的方法。

处理器310和存储器320可以通过总线或者其他方式连接，图3中以通过总线连接为例。

存储器320作为一种非易失性计算机可读存储介质，可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块，如本申请实施例中的机器人语音指令识别的方法对应的程序指令/模块。处理器310通过运行存储在存储器320中的非易失性软件程序、指令以及模块，从而执行机器人装置的各种功能应用以及数据处理，即实现上述方法实施例的应用于机器人装置的机器人语音指令识别的方法。

存储器320可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储上述机器人语音指令识别的方法的使用所创建的数据等。此外，存储器320可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中，存储器320可包括相对于处理器310远程设置的存储器，这些远程存储器可以通过网络连接至机器人装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

一个或者多个模块存储在存储器320中，当被一个或者多个处理器310执行时，执行上述任意方法实施例中的应用于机器人装置的机器人语音指令识别的方法。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考上述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

以上所述仅为本发明的实施方式，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：骆磊
技术所有人：深圳达闼科技控股有限公司
我是此专利的发明人