一种对人员进行多重识别的机器人云操作系统的制作方法

文档序号：15047741发布日期：2018-07-27 23:04阅读：121来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本公开涉及机器人领域，特别是一种对人员进行多重识别的机器人云操作系统。

背景技术：

随着机器人技术的发展，特别是机器人在安保场所的应用，例如商场、酒店、火车站、机场，鉴于对场所中人员的身份识别的需要，目前主要依靠机器人本地进行识别。

由于机器人在本地识别受到本地机器人的体积、功耗、移动性等方面的限制，导致现有机器人的计算能力有限，不能很好满足身份识别的需求。

如何克服机器人本地识别能力的限制，这成为亟待解决的技术问题。

技术实现要素：

针对上述问题，本公开提供了一种对人员进行多重识别的机器人云操作系统，包括：

机器人本体、云计算服务端，标注客户端；

机器人本体包括采集单元，所述采集单元用于采集经过机器人本体的人员的声音、图像；

机器人本体还包括多路传输单元，所述多路传输单元用于将所述声音和图像分别传输至第一识别单元，第二识别单元，和第三识别单元，其中：

第一识别单元设置于机器人本体，用于通过位于机器人本体内的本地数据库识别所述人员的身份信息，且当所述第一识别单元无法有效识别所述人员的身份信息时，所述第一识别单元还用于请求第二识别单元和第三识别单元的协作；

第二识别单元设置于云计算服务端，用于通过云计算服务端的数据库识别所述人员的身份信息；

第三识别单元设置于标注客户端，用于通过其他人员对所述声音或图像的人工标注数据库，识别所述人员的身份信息。

通过云计算和人工标注，以及本地识别，所述机器人系统实现了对经过机器人的人员的多重识别，从而改善了机器人识别人员的效率和精确性。

附图说明

图1为本公开一个实施例的示意图。

具体实施方式

为了使本领域技术人员理解本公开所披露的技术方案，下面将结合实施例及有关附图，对各个实施例的技术方案进行描述，所描述的实施例是本公开的一部分实施例，而不是全部的实施例。本公开所采用的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。此外，“包括”和“具有”以及它们的任何变形，意图在于覆盖且不排他的包含。例如包含了一系列步骤或单元的过程、或方法、或系统、或产品或设备没有限定于已列出的步骤或单元，而是可选的还包括没有列出的步骤或单元，或可选的还包括对于这些过程、方法、系统、产品或设备固有的其他步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本公开的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其他实施例互斥的独立的或备选的实施例。本领域技术人员可以理解的是，本文所描述的实施例可以与其他实施例相结合。

参见图1，在一个实施例中，本公开揭示了一种对人员进行多重识别的机器人云操作系统，包括：

机器人本体、云计算服务端，标注客户端；

机器人本体包括采集单元，所述采集单元用于采集经过机器人本体的人员的声音、图像；

机器人本体还包括多路传输单元，所述多路传输单元用于将所述声音和图像分别传输至第一识别单元，第二识别单元，和第三识别单元，其中：

第二识别单元设置于云计算服务端，用于通过云计算服务端的数据库识别所述人员的身份信息；

第三识别单元设置于标注客户端，用于通过其他人员对所述声音或图像的人工标注数据库，识别所述人员的身份信息。

对于上述实施例，其与现有技术中的机器人系统明显不同：现有技术中采用的是本地识别，如果无法识别则不能很好的完成既定任务。本实施例则额外设置了多路传输单元，用于向第一至第三识别单元传输待识别的声音和图像，充分利用第二识别单元的云端计算能力，更加特别的，利用了第三识别单元及其对应的人工标注能力。能够理解，所述人工标注数据库可以是预先建立的，所述预先建立可以是标注客户端在日常工作过程中积累而建立的；此外，所述人工标注数据库可以是实时更新的，所述实时更新可以是所述其他人员在接收到所述声音和图像后，及时识别后标注所述声音和图像，从而实时更新所述人工标注数据库。

由此可见，通过上述实施例，所述机器人系统通过云计算和人工标注，以及本地识别，实现了对经过机器人的人员的多重识别，从而改善了机器人识别人员的效率和精确性。

需要强调的是，优先使用第一识别单元和本地数据库。这是考虑到机器人所部署的场所可能具有特定的应用场景，例如商场、酒店、机场等，其本地数据库往往具有对应特定应用场景的信息：例如商场的工作人员和常驻人员的身份信息。当第一识别单元需要协作时，其会请求第二识别单元和第三识别单元的协作。也就是说，上述实施例第一识别单元之所以具备优先性是具备其特定技术效果的，而且上述实施例实现了机器人所部署的场所的技术需求的同时，最大程度的保障了识别所述人员身份的总目标。

在另一个实施例中，当机器人的传感器，例如激光雷达，感知到有人员进入机器人的管控范围时(例如方圆5米内)，机器人从休眠模式切换到工作模式，开始获取人员的声音和图像。本领域技术人员知晓，声音的特征可以用于辨别人员身份，图像特别是面部图像、步态的特征也可以用于辨别人员身份。

当机器人采集到声音时，由麦克风阵列录制成音频文件，例如格式为wav格式的音频文件。第一识别单元可以利用声纹识别技术在机器人本体、通过本地数据库对所述音频文件进行识别。

进一步，对所述音频文件进行识别时，还可以通过语音活性检测技术去除空白的、无意义的音频内容，然后通过其余有效音频部分进行人员身份的识别。显然，这加快了识别的速度。

如果涉及到机器人与人员的交互，那么也可以将音频文件或所述有效音频部分发送到本地的语音识别模块转换成文本。然后，语音识别模块进一步将文本进行处理匹配合适的交互文本，所述交互文本用于机器人与人员交互。将所述交互文本再发送到语音合成模块从而将交互文本转换成用于交互的音频文件。所述用于交互的音频文件通过扬声器进行播放，从而完成整个人机交互的过程。

附带提及的，所述的语音识别模块、语音合成模块，也可以部署在云端，或本地部署的同时也额外在云端部署。通过云计算服务器提供相应的api接口即可，例如通过restapi的方式给开发者提供一个通用的http接口，音频文件通过该接口上传云端。

至于通过图像识别人员的身份，以人脸识别为例：

所述人脸识别的特征是先通过机器人的摄像头获取人脸图片，然后把图片与本地数据库的人脸进行比对，如果比对匹配成功则能够获取该图片所对应的人员的姓名，如果匹配失败则将依靠云计算服务端的数据库和人工标注数据库进行识别。

在另一个实施例中，当感知到人员进入其范围时，所述机器人本体可以通过硬件(例如麦克风阵列)识别所述人员(即声源)的方位，当确认了所述人员的方位后，所述机器人本体可以把其他方位的声源的声音弱化或者屏蔽掉，进而达到减噪的目的，确保所采集的声音的信号质量。如果有必要，所述机器人本体可以在将其他方位的声源的声音弱化或屏蔽的同时，进一步调整姿态，面向所述人员。

在另一个实施例中，

所述标注客户端与所述机器人本体位于同一地理区域。

就该实施例而言，主要针对标注客户端与机器人属于同一所有权人、且同一地理区域的情形，特别是酒店、商场，例如标注客户端的其他人员也属于酒店或商场的工作人员。由于标注客户端所涉及的其他人员属于工作人员，在同一地理区域时，所述其他人员也便于收集、获取到相应的顾客、访客的信息并将其身份信息维护到人工标注数据库中。

在另一个实施例中，

所述标注客户端与所述机器人本体位于同一局域网。

能够理解，上一个实施例是针对同一地理区域，而本实施例则针对同一局域网。特别的，通过vpn或其他远程连接方式接入到同一局域网的情形，例如总部与别处分部通过vpn处于同一局域网，可能存在共享身份信息的应用场景，例如工作人员与机器人共享有关身份信息，这就意味着无论是否处于同一地理区域，即使机器人处于分部，总部的工作人员也可以通过标注客户端和第三识别单元协助机器人进行身份识别。

在另一个实施例中，

所述机器人自动扫描并适配预先建立配对关系的标注客户端。

就该实施例而言，当机器人自动扫描并适配预先建立配对关系的标注客户端时，就更为便捷的连接到了第三识别单元。

更进一步的，为了机器人节省电能，每当机器人因为人员进入其管控范围而从休眠模式进入工作模式时，所述机器人自动扫描并适配预先建立配对关系的标注客户端。

在另一个实施例中，

所述标注客户端与所述机器人本体不属于同一地理区域，也不属于同一局域网。

能够理解，前文涉及同一地理区域，也涉及同一局域网，且均有其技术需求，而既不属于同一地理区域也不属于同一局域网的技术需求则在于：

在对数据安全性要求不高的场景，特别是需要更广泛的采集数据、识别身份的情形下，位于互联网任何一个角落的其他人员，只要其能够通过所述声音或图像一定程度的识别经过机器人本体的人员的身份，相应的标注客户端就可以与所述机器人不属于同一地理区域，也不属于同一局域网。

在另一个实施例中，

所述标注客户端包括基于微信小程序的客户端。

就该实施例而言，其目的在于通过微信小程序来进行人工标注数据库的维护。之所以通过微信小程序，原因在于：微信的用户基数非常大，方便更广泛的采集数据、识别身份。

在另一个实施例中，

所述标注客户端包括提供第三方标注服务的客户端。

能够理解，这是为了通过第三方标注服务来拓展采集数据、识别身份的规模。

在另一个实施例中，

所述标注客户端和所述机器人本体位于同一商场；

所述标注客户端包括配置给商场工作人员的终端。

正如前文所述，该实施例是针对特定应用场景，例如对安保有要求的商场，需要商场工作人员所配置的终端和机器人本体进行协作。

进一步的，机器人还可以进一步在商场中提供人机交互功能。所述标注客户端甚至可以进一步实现：编辑本地问答集、注册与管理人脸识别及配置机器人(包括使得机器人进入休眠模式或立即唤醒机器人)。

在另一个实施例中，

所述系统还包括中央监控端；

所述中央监控端，用于收集第一识别单元、第二识别单元、第三识别单元的识别结果，并监控所述经过机器人本体的人员。

能够理解，这是为了全面收集各方识别单元的识别结果，即使极端情况下有不同的识别结果，也要全面收集，便于监控端的进一步监控和判断。

在另一个实施例中，

所述标注客户端至少包括第一标注客户端、第二标注客户端。

就该实施例而言，其意味着可以通过多个标注客户端来增强识别能力。

需要说明的是，上述各个实施例所述作为分离部件说明的各个单元可以是，或者也可以不是物理上分开的，可以位于一个地方，或者也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外，本公开提供的处理系统的模块或单元之间的连接关系表示它们之间具有通信连接，具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到本公开可借助软件加必需的通用硬件的方式来实现，当然也可以通过专用硬件包括专用集成电路、专用cpu、专用存储器、专用元器件等来实现。一般情况下，凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现，而且，用来实现同一功能的具体硬件结构也可以是多种多样的，例如模拟电路、数字电路或专用电路等。但是，对本公开而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在可读取的存储介质中，如计算机的软盘，u盘、移动硬盘、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、磁碟或者光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本公开各个实施例对应的方法。

本说明书中每个实施例采用递进的方式描述，重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

以上对本公开所提供的系统进行了详细介绍，本文中应用了具体个例对本公开的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本公开的方法及其核心思想；同时，对于本领域技术人员，依据本公开的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本公开的限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李志;沈云辉;关毅江;陈日发;曾广樊
技术所有人：广东工业大学
我是此专利的发明人

上一篇：一种监控系统用服务器的制作方法
上一篇：一种高可靠的助插拔侧向锁紧装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。