机器人的语音控制方法、装置及机器人与流程

文档序号：12724008阅读：470来源：国知局

本发明涉及机器人领域，特别是涉及机器人的语音控制方法、装置及机器人。

背景技术：

随着人们生活水平的不断提高、科学技术日新月异的不断发展，作为集机械、电子、控制、计算机、传感器、人工智能等多学科先进技术于一体的现代制造业重要的自动化装备，机器人特别是服务型机器人将逐步走进人们的生活，与人类友好相处，是未来社会生活发展的必然趋势。

目前，常见的机器人控制方式为语音控制，即机器人接收用户语音输入的指令并执行该用户指令，具体不但可以实现动作的执行，还可实现语音播放及与使用者的语音交互等。然而，现有机器人在执行中，通常需要等待指令执行完成后才能接收新指令的。例如，当机器人在执行唱歌过程中，用户无法插入让其查询天气，而必须等待其唱歌完成后，机器人才开始接收用户语音输入查询天气的指令并向用户播报当前天气情况，而且机器人由于自身处理能力有限，容易造成对语音信号处理缓慢而延迟响应指令。

技术实现要素：

本发明主要解决的技术问题是提供机器人的语音控制方法、装置及机器人，能够实现在指令执行过程中的及时响应新指令。

为解决上述技术问题，本发明采用的一个技术方案是：提供一种机器人的语音控制方法，包括：

机器人在执行指令时，侦测周边语音信号；

在侦测到第一语音信号时，识别所述第一语音信号是否为设定语音信号；

若是，则接收所述第一语音信息之后的第二语音信号，并将所述第二语音信号发送至服务器；接收所述服务器对所述第二语音信号进行语义分析得到的新指令；执行所述新指令。

其中，所述接收所述第一语音信息之后的第二语音信号，包括：

停止执行所述指令，并接收在停止执行所述指令时侦测到的第二语音信号。

其中，所述在侦测到第一语音信号时，识别所述第一语音信号是否为设定语音信号，包括：将侦测到的语音信号与其播放的参考语音信号进行回声对消，得到第一语音信号；识别所述第一语音信号是否为设定语音信号。

其中，所述执行所述新指令，包括:

判断所述新指令是否为预设的可执行指令；

若是，则执行所述新指令；否则，发出无法执行所述新指令的提示。

其中，还包括：

若第一语音信号不为设定语音信号，则丢弃该第一语音信号，并继续侦测周边语音信号。

为解决上述技术问题，本发明采用的另一个技术方案是：提供一种机器人的语音控制装置，包括：

侦测模块，用于在执行指令时，侦测周边语音信号；

识别模块，用于在侦测到第一语音信号时，识别所述第一语音信号是否为设定语音信号；

第一接收模块，用于在识别所述第一语音信号为设定语音信号时，接收所述第一语音信息之后的第二语音信号；

发送模块，用于将所述第二语音信号发送至服务器；

第二接收模块，用于接收所述服务器对所述第二语音信号进行语义分析得到的新指令；

执行模块，用于执行所述新指令。

其中，所述第一接收模块具体用于停止执行所述指令，并接收在停止执行所述指令时侦测到的第二语音信号。

其中，所述识别模块包括：

消除单元，用于将侦测到的第一语音信号与其播放的参考语音信号进行回声对消，得到处理后的第一语音信号；

识别单元，用于识别所述处理后的第一语音信号是否为设定语音信号。

其中，所述执行模块具体包括：

判断单元，用于判断所述新指令是否为预设的可执行指令；

执行单元，用于在所述新指令为预设的可执行指令时，执行所述新指令；在所述新指令不为预设的可执行指令时，发出无法执行所述新指令的提示。

为解决上述技术问题，本发明采用的再一个技术方案是：提供一种机器人，包括机器人本体、存储器、语音采集器、发送器、接收器及处理器，

所述语音采集器用于采集语音信号；

所述发送器用于向其他设备发送信号；

所述接收器用于接收其他设备发送的信号；

所述存储器用于存储计算机程序；

所述处理器执行所述计算机程序，用于：

在所述机器人本体执行指令时，通过所述语音采集器侦测周边语音信号；

在所述语音采集器侦测到第一语音信号时，识别所述第一语音信号是否为设定语音信号；

在识别所述第一语音信号为设定语音信号时，接收所述第一语音信息之后的第二语音信号，并通过所述发送器将所述第二语音信号发送至服务器；

获取所述接收器接收到的所述服务器对所述第二语音信号进行语义分析得到的新指令；

控制所述机器人本体执行所述新指令。

上述方案，机器人在执行指令过程中，若侦测到为设定语音信号的第一语音信号，则将后续侦测到的第二语音信号发送至服务器进行语音分析，并根据服务器的语音分析结果执行相应新指令，故利于机器人与用户间的即时交互，使机器人能快速响应用户的新指令，而且减少了机器人的工作量，也保证了新指令的及时分析并执行，实现了在执行指令过程中及时响应新指令，提高了机器人控制的灵活性，增强机器人功能，丰富用户的体验。

附图说明

图1是本发明机器人的语音控制方法一实施例的流程图；

图2是本发明机器人的语音控制方法另一实施例的部分流程图；

图3是本发明机器人的语音控制方法再一实施例的部分流程图；

图4是本发明机器人的语音控制装置一实施例的结构示意图；

图5是本发明机器人的语音控制装置另一实施例的部分结构示意图；

图6是本发明机器人的语音控制装置再一实施例的部分结构示意图；

图7是本发明机器人一实施例的结构示意图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、接口、技术之类的具体细节，以便透彻理解本申请。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施方式中也可以实现本申请。在其它情况中，省略对众所周知的装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。

请参阅图1，图1是本发明机器人的语音控制方法一实施例的流程图。本实施例中，该语音控制方法由机器人执行，包括以下步骤：

S101：机器人在执行指令时，侦测周边语音信号。

本实施例中，该机器人可为服务型机器人，可执行唱歌、换歌、跳舞、换舞、讲故事、应答服务如查询天气、当前时间等指令。当然，该机器人也可以为工业型的其他类型机器人，在此不作限定。

机器人可接收语音信号，并执行该语音信号对应的指令。为能够实现新指令的执行，机器人在执行某一指令过程中，同时侦测周边语音信号，例如启动麦克风接收周边环境中的语音信号。

S102：机器人在侦测到第一语音信号时，识别所述语音信号是否为设定语音信号。若否，则执行S103，若是，执行S104。

为避免机器人误执行非用户要求执行的指令。机器人存储有设定语音信号，该设定语音信息可为一些非日常用语且可区别于机器人发出的声音，以避免误操作。在执行某一指令过程中，若机器人侦测到第一语音信号，则识别该第一语音信号是否与该设定语音信号一致。具体识别方式可如将该第一语音信息的信号特征与设定语音信号的信号特征进行比较，若两者的信号特征匹配的确定该第一语音信号为该设定语音信号；或者机器人对第一语音信号进行语音分析，得到对应的文字信息，判断该文字信息是否与设定语音信号的文字信息是否匹配，若匹配，则确定该第一语音信号为该设定语音信号。

在另一实施例中，机器人在接收到第一语音信号时，可先进行滤波去噪，以消除自身在执行指令过程中的发出的声音。机器人对去噪后的第一语音信号进行上述识别。请结合参阅图2，在一实施例中，S102中可具体包括以下子步骤：

S1021：机器人将侦测到的第一语音信号与其播放的参考语音信号进行回声对消，得到处理后的第一语音信号。

S1022：识别所述处理后的第一语音信号是否为设定语音信号。

其中，该播放的参考语音信号可根据其播放文件得到，可将第一语音信号与该播放文件均进行对应时间点的采样，并将对应时间点的采样信号进行比较，以消除第一语音信号中的机器人自身播放声音信号。具体，该回声对消方式可采用自适应滤波器或现有其他回声消除算法，在此不作限定。

S103：机器人丢弃该第一语音信号。

当识别出第一语音信号不为设定语音信号时，确定用户未发出插入新指令，该第一语音信号为无效噪音，此时，机器人将该第一语音信号丢弃，即不处理该第一语音信号，并继续执行上述S101，以继续侦测周边语音信号。

S104：机器人接收所述第一语音信息之后的第二语音信号，并根据所述第二语音信号执行新指令。

当识别出第一语音信号为设定语音信号时，确定用户需要插入新指令，此时，机器人接收位于第一语音信号之后的第二语音信号并进行处理，以根据所述第二语音信号执行新指令。

其中，机器人可在第一语音信号为设定语音信号时，不停止执行当前的指令，并在执行该指令的过程中继续接收第二语音信号，并在执行第二语音信号对应的新指令前停止执行该当前的指令，转而执行新指令。当然，若机器人判断出新指令与当前指令的执行不相互影响，也可不停止当前指令，在执行当前指令的同时执行新指令。

或者，机器人可在第一语音信号为设定语音信号时，停止执行当前的指令，并在停止执行该指令后接收第二语音信号以根据第二语音信号执行新指令。此时，由于机器人停止执行指令，减少了周边的噪音影响，故降低了对第二语音信号的干扰，提高执行新指令的准确性。

在一实施例中，该机器人内部设有运算器以用于对语音信号进行语义分析，故在接收到第二语音信号后，机器人内部的运算器执行对该第二语音信号进行语义分析，分析得到该第二语音信号对应的新指令，并执行该新指令。

请结合参阅图3，在另一实施例中，S104中的所述根据所述第二语音信号执行新指令可具体包括以下子步骤：

S1041：将所述第二语音信号发送至服务器。

S1042：接收所述服务器对所述第二语音信号进行语义分析得到的新指令。

S1043：执行所述新指令。

在一实施例中，该机器人内部设有通信接口以用于与服务器通信，在接收到第二语音信号后，机器人通过该通信接口将该第二语音信号发送至服务器，以请求该服务器对第二语音信号语义分析，服务器分析得到该第二语音信号对应的新指令后将该新指令反馈至机器人，机器人通过其通信接口接收到该机器人后，执行该新指令。故利用服务器执行语义分析，减少了机器人的工作量，而且避免了由于机器人由于其处理能量有效，无法及时进行语义分析的情况，保证了新指令的及时分析并执行。

其中，为进一步避免误操作，机器人预设有若干个可执行指令，上述S1043可具体为：机器人判断与第二语音信号对应的新指令是否为预设的可执行指令；若是，则执行所述新指令，否则，发出无法执行所述新指令的提示。上述提示的实现方法包括机器人语音播报无法执行该新指令，或者在机器人的显示屏上显示该提示等。

可以理解的是，上述第一语音信号和第二语音信号为机器人先后侦测得到的语音信号，两个信号做出不同命名仅为了更好描述，并不代表两者类型或来源的不同。

为更好理解本发明，列举一应用场景如下，服务型机器人在执行唱歌过程中，接收到用户发出的第一语音信号，机器人识别该第一语音信号为设定语音信号“请接收新指令”，则停止唱歌，并接收用户发出的第二语音信号，将该第二语音信号通过WIFI发送至服务器进行语音分析，并接收到服务器反馈的与该第二语音信号对应的新指令“换歌”，则机器人从歌曲目录中选择下一首歌曲进行播放。

本实施例中，机器人在执行指令过程中，若侦测到为设定语音信号的第一语音信号，则对后续侦测到的第二语音信号进行处理以执行相应新指令，故利于机器人与用户间的即时交互，使机器人能快速响应用户的新指令，实现了在执行指令过程中响应及时新指令，提高了机器人控制的灵活性，增强机器人功能，丰富用户的体验。

请参阅图4，图4是本发明机器人的语音控制装置一实施例的结构示意图。本实施例中，该装置包括：

侦测模块41，用于在执行指令时，侦测周边语音信号；

识别模块42，用于在侦测到第一语音信号时，识别所述第一语音信号是否为设定语音信号；

第一接收模块43，用于在识别所述第一语音信号为设定语音信号时，接收所述第一语音信息之后的第二语音信号；

发送模块44，用于将所述第二语音信号发送至服务器；

第二接收模块45，用于接收所述服务器对所述第二语音信号进行语义分析得到的新指令；

执行模块46，用于执行所述新指令。

可选的，第一接收模块43具体用于停止执行所述指令，并接收在停止执行所述指令时侦测到的第二语音信号。

可选地，请结合参考图5，识别模块42具体包括：

消除单元421，用于将侦测到的第一语音信号与其播放的参考语音信号进行回声对消，得到处理后的第一语音信号；

识别单元422，用于识别所述处理后的第一语音信号是否为设定语音信号。

可选地，请结合参考图6，执行模块44具体包括：

判断单元441，用于判断所述新指令是否为预设的可执行指令；

执行单元442，用于在所述新指令为预设的可执行指令时，执行所述新指令，在所述新指令不为预设的可执行指令时，发出无法执行所述新指令的提示。

可选地，该装置还包括丢弃模块47，用于在第一语音信号不为设定语音信号时，丢弃该第一语音信号，并继续侦测周边语音信号。

其中，该装置的上述模块分别用于执行上述方法实施例中的相应步骤，具体执行过程如上方法实施例说明，在此不作赘述。

参阅图7，本发明机器人一实施例的结构示意图。本实施例中，该机器人70包括机器人本体71、语音采集器72、存储器73、发送器75、接收器76及处理器74。其中，存储器73及处理器74均可以是一个或多个，图7中仅以一个为例。

机器人本体71用于在处理器74的控制下执行指令，该机器人本体具体可包括驱动器以及执行元件如机器人手臂、脚、播放器等。

语音采集器73用于采集语音信号，具体可为麦克风等。

发送器75用于向其他设备如服务器发送信号；

接收器76用于接收其他设备如服务器发送的信号；

存储器73用于存储计算机程序，并向处理器74提供所述计算机程序，且可存储处理器74处理的数据，例如语音采集器73采集到的语音信号、处理器74在执行计算机程序需要使用到的设定语音信号灯。其中，存储器73可以包括只读存储器、随机存取存储器和非易失性随机存取存储器(NVRAM)中的至少一种。

存储器73存储的计算机程序包括如下的元素，可执行模块或者数据结构，或者它们的子集，或者它们的扩展集:

操作指令：包括各种操作指令，用于实现各种操作。

操作系统：包括各种系统程序，用于实现各种基础业务以及处理基于硬件的任务。

在本发明实施例中，处理器74通过调用存储器73存储的操作指令(该操作指令可存储在操作系统中)，用于：

在机器人本体71执行指令时，通过所述语音采集器72侦测周边语音信号；

在所述语音采集器72侦测到第一语音信号时，识别所述第一语音信号是否为设定语音信号；

在识别所述第一语音信号为设定语音信号时，接收所述第一语音信息之后的第二语音信号，并通过发送器75将所述第二语音信号发送至服务器；

获取接收器接76收到的所述服务器对所述第二语音信号进行语义分析得到的新指令；

控制机器人本体71执行所述新指令。

可选地，处理器74执行所述接收所述第一语音信息之后的第二语音信号，包括：停止执行所述指令，并接收在停止执行所述指令时侦测到的第二语音信号。

可选地，处理器74执行所述在侦测到第一语音信号时，识别所述第一语音信号是否为设定语音信号，包括：将侦测到的第一语音信号与其播放的参考语音信号进行回声对消，得到处理后的第一语音信号；识别所述处理后的第一语音信号是否为设定语音信号。

可选地，处理器74所述执行所述新指令，包括:判断所述新指令是否为预设的可执行指令；若是，则执行所述新指令，否则，发出无法执行所述新指令的提示。

可选地，处理器74还用于若第一语音信号不为设定语音信号，则丢弃该第一语音信号，并继续通过语音采集器72侦测周边语音信号。

上述处理器74还可以称为CPU(Central Processing Unit，中央处理单元)。具体的应用中，机器人的各个组件可通过总线耦合在一起，其中总线除包括数据总线之外，还可以包括电源总线、控制总线和状态信号总线等。

上述本发明实施方式揭示的方法也可以应用于处理器74中，或者由处理器74实现。处理器74可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器74中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器74可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器73，处理器74读取相应存储器中的信息，结合其硬件完成上述方法的步骤。

上述方案中，机器人在执行指令过程中，若侦测到为设定语音信号的第一语音信号，则将后续侦测到的第二语音信号发送至服务器进行语音分析，并根据服务器的语音分析结果执行相应新指令，故利于机器人与用户间的即时交互，使机器人能快速响应用户的新指令，而且将语音分析发送至服务器执行，减少了机器人的工作量，也保证了新指令的及时分析并执行，实现了在执行指令过程中响应及时新指令，提高了机器人控制的灵活性，增强机器人功能，丰富用户的体验。

在本发明所提供的几个实施方式中，应该理解到，所揭露的方法以及装置，可以通过其它的方式实现。例如，以上所描述的装置实施方式仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。

另外，在本发明各个实施方式中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

上述其他实施方式中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本发明各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：熊友军;查雄兴
技术所有人：深圳市优必选科技有限公司
我是此专利的发明人

上一篇：移位寄存器单元、栅极驱动电路及其驱动方法与流程
上一篇：一种医疗探测设备的探头顶紧装置的制作方法