服务机器人的识别启动方法及装置与流程

文档序号：14136872阅读：194来源：国知局

本发明涉及一种机器人，更具体地说，它涉及一种服务机器人的识别启动方法及装置。

背景技术：

近些年，机器人产业呈爆发式增长，人工智能逐渐走进普通老百姓的生活。随着市场需求的不断增大，服务机器人产业的规模持续增长。伴随着语音识别、计算机视觉、人脸识别等人工智能技术的准确率的提高，以及他们在服务机器人上的更好地融合，人类的方方面面正在被服务机器人所“侵蚀”。由于机器人均采用电池作为供电电源，因此，如何降低耗电量一直是研究的课题之一，为了能够有效的节约电量，在人们不需要机器人进行服务时，机器人一般处于待机待启动状态。

当用户需要对机器人进行启动时，目前的一般采用手动输入启动指令启动、语音识别启动、人脸识别启动等多种方式。现有的可参考公开号为cn106502649a的中国发明专利申请，其公开了一种机器人服务启动方法及装置，其方法包括获取用户输入的语音交互信息、对语音信息进行解析，得到启动词好声纹特征信息，之后通过利用启动词和声纹特征信息与预设的启动词和声纹特征信息进行比对，从而启动机器人。

上述启动方式只是通过语音识别对待机状态的机器人进行语音启动，但是存在不足之处，一旦用户感冒生病、情绪变化，很容易产生语音识别错误，经常会出现多次识别、难以通过或者拒绝通过的情况，用户体验较差。

技术实现要素：

针对现有技术存在的不足，本发明的目的在于提供一种服务机器人识别启动方法，其具有的优势是能够减少错误识别次数、提高识别通过率。

为了实现上述目的，本发明的第一方面，提供了一种服务机器人的识别启动方法，包括：

语音消息获取步骤：获取用户的语音消息；

语音消息解析步骤：解析获取到的用户的语音消息，得到暗语以及声纹特征信息；

服务启动步骤：将得到的暗语、声纹特征信息按顺序依次与预设的暗语和声纹特征信息进行匹配；若二者均匹配成功，则生成启动指令以指示机器人启动进行服务状态；若声纹特征信息匹配失败，则进入下一步骤；

识别方式选择步骤：提示用户选择二次语音验证、面部验证或退出的一种，若用户通过二次语音验证、面部验证的一种则生成启动指令以指示机器人启动进行服务状态。

优选地，服务启动步骤之后，识别方式选择步骤之前，还包括用户身份核准步骤：获取用户的身份信息，与预存的身份特征信息进行匹配。

优选地，所述用户身份核准步骤中，包括指纹识别或二代身份证识别。

优选地，所述二次语音验证包括以下步骤：

提示用户输入语音消息，并且解析语音信息得到声纹特征信息，形成暂存声纹特征模板；

降低比对阈值，将暂存的声纹特征信息模板与预设的声纹特征进行匹配，若匹配成功，则生成启动指令以指示机器人启动进入服务状态。

优选地，在二次语音验证的步骤中，匹配成功的声纹特征信息模板更新至声纹特征信息模板库中。

优选地，所述面部验证包括如下步骤：

获取用户的面部信息；

将获取到的用户的面部信息进行预处理，并解析、提取面部信息得到面部特征信息；

将提取到的面部特征信息与预存的面部特征信息进行匹配，若匹配成功，则生成启动指令以指示机器人启动进入服务状态。

优选地，所述语音消息解析步骤中，得到的暗语与预存的暗语一致或者包含于预存的暗语之中。

为了实现上述目的，本发明的第二方面，提供了如下技术方案：

一种服务机器人识别启动装置，包括：语音消息获取模块，其用于获取用户的语音消息；

语音消息解析模块，其用于解析获取到的用户的语音消息，得到暗语以及声纹特征信息；

服务启动模块：其用于将得到的暗语、声纹特征信息按顺序依次与预设的暗语和声纹特征信息进行匹配；若二者均匹配成功，则生成启动指令以指示机器人启动进行服务状态；

识别方式选择模块，其用于当声纹特征信息匹配失败后，提示用户选择二次语音验证、面部验证或退出的一种，若用户通过二次语音验证、面部验证的一种则生成启动指令以指示机器人启动进行服务状态。

优选地，所述识别方式选择模块包括识别方式选择单元、二次语音验证单元、面部验证单元和退出返回单元；

所述二次语音验证单元包括：

语音采集单元，其用于获取用户输入的语音消息；

语音解析单元，其用于解析语音信息得到声纹特征信息，形成暂存声纹特征模板；

匹配调整单元，其用于降低匹配阈值；

声纹特征信息匹配单元，其用于将暂存的声纹信息模板与预设的声纹特征信息进行二次匹配，若匹配成功，则生成启动指令以指示机器人启动进入服务状态。

所述面部验证单元包括：

图像采集单元，其用于采集人脸面部信息；

预处理单元，其用于对采集到的人脸面部信息进行预处理，提取得到人脸的面部特征信息；

面部特征信息匹配单元，其用于将提取到的面部特征信息与预存的面部特征信息进行匹配，若匹配成功，则生成启动指令以指示机器人启动进入服务状态。

优选地，该装置还包括用户身份核准模块，其用于在服务启动步骤之后，识别方式选择步骤之前获取用户的身份信息，与预存的身份特征信息进行匹配，若匹配成功，则进行识别方式选择。

综上所述，本发明具有以下有益效果：

1、本发明通过对用户语音信息进行解析得到暗语与声纹特征信息，并且对二者进行分别匹配，对机器人进行启动识别，当用户由于感冒、情绪等变化导致声音发生变化时，能够进行二次声音识别，通过调整阈值来对用户的声纹特征信息进行识别，能够有效的减少错误识别次数，提高识别通过率；

2、本发明通过在对用户语音消息进行二次声纹特征信息识别时，仅识别用户的声纹特征信息，而不对用户的暗语进行识别，节省了识别步骤，避免了二次识别时由于暗语造成的识别错误，在一定程度提高了识别通过率；

3、本发明通过设置用户身份信息核准步骤，能够对用户的身份进行有效的识别，提升了机器人的安全级别，对个人隐私具有良好的保障；

4、采用识别方式选择能够在用户二次识别时根据用户需求选择二次语音验证和面部验证，能够提高识别通过率和降低识别次数，避免出现机器人拒绝识别的情况发生。

附图说明

图1为本发明一个实施例中的一种服务机器人识别启动方法流程图；

图2为本发明一个实施例中的一种服务机器人具体地识别启动方法流程图；

图3为本发明另一个实施例中的一种服务机器人识别启动方法流程图；

图4为本发明实施例中的一种服务机器人识别启动装置的组成示意图；

图5为本发明实施例中的识别方式选择模块的组成示意图；

图6为本发明实施例中的二次语音验证单元的组成示意图；

图7为本发明实施例中的面部验证单元的组成示意图。

具体实施方式

下面将结合本发明实施例汇总的附图，对本发明实施例中的技术方案进行清除、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

本发明一实施例提供了一种服务机器人识别启动方法，参考图1，该方法包括：

s101、语音消息获取步骤：获取用户的语音消息。

s102、解析获取到的用户的语音消息，得到暗语以及声纹特征信息。

s103、服务启动步骤：将得到的暗语、声纹特征信息按顺序依次与预设的暗语和声纹特征信息进行匹配；若二者均匹配成功，则生成启动指令以指示机器人启动进行服务状态；若声纹特征信息匹配失败，则进入下一步骤。

s104、识别方式选择步骤：提示用户选择二次语音验证、面部验证或退出的一种，若用户通过二次语音验证、面部验证的一种则生成启动指令以指示机器人启动进行服务状态。

此处，启动指令是用于指示机器人启动进入服务状态。所述的“暗语”包括但不限于词语和/或数字以及二者形成的短句。在步骤s102中解析得到的暗语需要与预先设定的暗语保持一致或者包含在设定的暗语之中。在一个示例中，用户预先设定的暗语为“小优”，当用户向机器人发出语音消息为“小优”或者“醒醒，小优”时，均能够匹配成功。需要解释的是，上述所指的机器人启动进入服务状态是指机器人从待机状态下接受指令，相应的，机器人内部用于接收用户语音消息的模块始终处于开启状态。

为了详细阐述本发明实施例的识别启动方法，参考图2，具体地，该识别启动方法包括：

s201、获取用户的语音消息；

s202、语音消息经过预处理，解析获取到的用户的语音消息，得到暗语以及声纹特征信息。其中，解析得到的暗语和声纹特征信息分别与预设的暗语和声纹特征信息进行独立对应的匹配，其能够明确用户的错误类别，也就是说，能够明确是属于“暗语错误”还是：“非用户本人”。

s203、将暗语与预设的暗语进行匹配。

s204、判断是否暗语匹配成功。具体地，在本发明实施例中，暗语匹配应该作为第一优先级进行匹配验证，若暗语匹配失败，则认为用户不清楚暗语，则机器人保持待机状态；若暗语匹配成功，则会生成声纹特征匹配指令指示机器人进行声纹特征信息匹配。

s205、将声纹特征信息与预设声纹特征信息进行匹配。

s206、判断是否声纹特征匹配成功。

s215、机器人启动进入服务状态。

具体地，若声纹特征信息匹配成功，则发出唤醒指令以指示机器人由待机状态转变为运行服务状态；若声纹特征信息匹配失败，需要了解的是，声纹特征信息匹配失败的情况有多种，例如：用户感冒、情绪变化大等，此时机器人会发生误识别，造成难以通过或者拒绝通过的情况。

s207、提示用户选择识别验证方式，选择语音验证、面部验证或者退出。具体地，当声纹特征信息匹配失败后，会出现多种情况，例如是用户本人，但是由于用户感冒、情绪变化、周围环境嘈杂等原因造成匹配失败，还有是非用户本人；如果是用户本人，但是由于身体原因，那么接下来可能会多次匹配失败甚至拒绝识别通过，因此，机器人提供了不同的再次识别方式。其中包括语音验证、面部验证和退出重新识别三种方式，用户可以自主选择不同的方式进行验证，有利于提高机器人的识别通过效率。

如果选择面部验证，则按照下述步骤：

s208、采集人脸面部信息。具体地，选择面部验证之后，机器人内部的用于提取图像的模块会开启，用于收集人脸面部信息。

s209、人脸面部信息进行光照预处理，提取得到的人脸面部特征信息。具体地，由于外部光照对人脸面部特征信息提取会有较大的影响，在进行特征提取时需要利用各种图像增强处理方法去除各种光照影响，例如常用的直方图均衡化、同态滤波、以及retinex图像增强等。

s210、将提取到的面部特征信息与预存的面部特征信息进行匹配。

s211、判断是否面部特征匹配成功。

s215、机器人启动进入服务状态。

具体地，将提取的面部特征信息与预存的人脸面部特征信息进行比对，如果比对成功，则确定为用户本人使用，机器人会接收到启动指令并且启动进入服务状态。

如果选择语音验证，则按照下述步骤：

s212、获取用户的语音消息，并且解析获取到的用户的语音消息得到声纹特征信息，形成暂存声纹特征模板。具体地，用户再输入语音消息，需要说明的是，此时用户再次输入的语音消息并不一定需要包含暗语，为了提高识别通过率，降低暗语造成误判的概率，这里只针对客户的声纹特征信息进行再次识别，解析得到声纹特征信息形成暂存的声纹特征信息模板，此模板将用户此次声纹特征信息进行暂时记录以供与声纹特征信息模板库中的预存的声纹特征信息模板进行匹配验证。

s213、降低匹配阈值，将暂存的声纹特征信息模板与预设的声纹特征信息进行二次匹配。当然，匹配阈值的降低幅度可以进行调节，以用户所需的识别级别进行确定。通过降低匹配阈值能够提高用户的识别通过率，避免出现难以识别、拒绝通过的情况。

s214、判断是否二次匹配成功。若二次匹配成功，则发出启动指令以用于指示机器人启动进入服务状态；反之，确定非用户本人使用机器人，机器人拒绝通过，仍然保持待机状态。

s215、机器人启动进入服务状态。

通过采用二次声纹特征匹配的方式，在这之中，通过降低阈值来保证机器人能够提高识别通过率。

本发明实施例中，通过面部验证与二次语音验证相结合的方式，能够提供给用户不同选择。我们需要明白，服务机器人，在满足一定的安全识别的基础上，更多的还是能够快速响应用户的命令，因此，保证识别通过率仍然是重点，以此提高用户的使用体验。

本发明另一实施例提供了一种服务机器人识别启动方法，参考图3，该方法步骤中s301至s306是对用户的语音消息进行解析，并且分别对暗语以及声纹特征信息进行独立匹配；s310、s311、s312、s313、s314、s315、s321是用户二次语音验证的步骤；s310、s316、s317、s318、s319、s320、s321是用户选择面部验证的步骤，上述步骤与上一实施例的步骤相同，且原理相同，再次不在赘述。

优选地，在步骤s306之后，步骤s310之前，该方法还包括用户身份核准步骤，具体步骤为：

s307、获取用户身份信息；

s308、与预存的身份信息库的身份信息进行匹配；

s309、判断是否身份信息匹配成功。

具体地，当用户的声纹特征信息匹配失败之后，需要验证用户的身份信息，确保用户为本人，进一步地提升了机器人的安全使用级别。此处的用户身份信息可以为指纹或二代身份证信息。

进一步地，还包括步骤s316、将匹配成功的声纹特征信息模板更新至声纹特征信息模板库中。

容易理解的，将此时用户状态下的用户声纹特征信息模板更新至声纹特征模板库中，能够更多的存储用户不同状态下的声纹特征信息，在今后的使用过程中，一旦再次出现用户此次状态，机器人能够一步识别用户，有利于减少错误识别次数，提高机器人的识别通过率，避免出现难以识别或者拒绝识别的情况，提高了用户体验。

本发明另一实施例还提供了一种服务及其人识别启动装置，参考图4，该装置包括：

语音消息获取模块41，其用于获取用户的语音消息；

语音消息解析模块42，其用于解析获取到的用户的语音消息，得到暗语以及声纹特征信息；

服务启动模块44，其用于将得到的暗语、声纹特征信息按顺序依次与预设的暗语和声纹特征信息进行匹配；若二者均匹配成功，则生成启动指令以指示机器人启动进行服务状态；

识别方式选择模块45，其用于当声纹特征信息匹配失败后，提示用户选择二次语音验证、面部验证或退出的一种，若用户通过二次语音验证、面部验证的一种则生成启动指令以指示机器人启动进行服务状态。

优选地，该装置还包括用户身份核准模块43，其用于在用户首次声纹特征识别失败后，获取用户的身份信息，与预存的身份特征信息进行匹配；若匹配成功，则进行识别方式的选择。

具体地，参考图5，识别方式模块包括识别方式选择单元440、二次语音验证单元44、面部验证单元443和退出返回单元442，识别方式选择单元440用于选择二次语音验证单元441、面部验证单元443或者退出返回单元442的一种供用户进行再次的识别验证。

其中，参考图6，二次语音验证单元441包括：

语音采集单元4411，其用于获取用户输入的语音消息；语音解析单元4412，其用于解析语音信息得到声纹特征信息，形成暂存声纹特征模板；匹配调整单元4413，其用于降低匹配阈值；声纹特征信息匹配单元4414，其用于将暂存的声纹信息模板与预设的声纹特征信息进行二次匹配，若匹配成功，则生成启动指令以指示机器人启动进入服务状态。

参考图7，面部验证单元443包括：图像采集单元4431，其用于采集人脸面部信息；预处理单元4432，其用于对采集到的人脸面部信息进行预处理，提取得到人脸的面部特征信息；面部特征信息匹配单元4433，其用于将提取到的面部特征信息与预存的面部特征信息进行匹配，若匹配成功，则生成启动指令以指示机器人启动进入服务状态。

本方发明实施例中提供的服务机器人启动识别装置与上述识别唤醒方法一样，能够有效的减少错误识别次数，提高识别通过率；提升了机器人的安全级别，对个人隐私具有良好的保障。

通过以上实施方式的描述，所述领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在可读取的存储介质中，如计算机的软盘、硬盘或光盘等，包括若干指令用以使得一台计算机设别（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述的方法。

以上所述，仅仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易的变化或者替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘雪楠;覃立万
技术所有人：北京康力优蓝机器人科技有限公司
我是此专利的发明人