一种机器人语音定位过程的摄像头角度校准方法

文档序号：10613244阅读：438来源：国知局

一种机器人语音定位过程的摄像头角度校准方法
【专利摘要】本发明公开了一种机器人语音定位过程的摄像头角度校准方法，包括以下步骤：第一步，语音粗定位：根据语音信息将摄像头转到大致的语音源方位；第二步，人脸检测：利用摄像头检测是否有人脸，若摄像头检测到人脸则进行第三步；第三步，人脸角度偏差计算：以摄像头中心点为原点建立矩形坐标轴，并定位出人脸的中心坐标[X,Y]，该坐标[X,Y]也为人脸中心与摄像头中心的偏差；第四步：角度调整：根据人脸坐标与摄像头中心点偏差换算出摄像头沿X轴旋转的角度degreeX和沿Y轴旋转的角度degreeY，然后根据degreeX和degreeY旋转摄像头使人脸的中心点对准摄像头的中心点。本发明提高了语音定位过程的摄像头对准精度。本发明提高了语音定位过程的摄像头对准精度。
【专利说明】
一种机器人语音定位过程的摄像头角度校准方法
技术领域
[0001]本发明涉及语音定位技术领域，特别是一种机器人语音定位过程的摄像头角度校准方法。【背景技术】
[0002]随着电子计算机科学的不断发展，智能机器人的研究越发深入，其携带的功能也越来越多，具有视觉、听觉、嗅觉等功能的高度智能化机器人已经出现，这种机器人均具有一套识别系统，通过该识别系统采集信息，经过处理器及其携带的处理系统所采集的信息获取识别结果，常见的如人脸识别系统，利用摄像头采集人脸图像，处理后即能识别出人的身份，但对于高度智能化的机器人来说仅通过一套人脸识别系统实现一系列复杂操作是不够的，例如能够与人交互的机器人，其还携带了360°的语音定位功能，用户呼叫机器人，机器人根据语音信息判断用户所处大致方位，再调转其摄像头的方向对准人脸进行图像采集和识别，这种技术能够实现360°无差别的定位跟踪，可以说更多技术的结合让机器人的智能化程度逐步提升。
[0003]但是，目前机器人的语音定位技术还存在偏差，在上述的语音定位过程中，语音信息只能提供给机器人一个大致的方位，转动摄像头(即转动机器人头部)后很难精确找到人脸的中心位置，可能导致摄像头获取图像不够清晰，存在识别误差的可能，在操作上只能通过用户自己去寻找与摄像头对准的点，因此机器人的语音定位技术有待改进。
【发明内容】

[0004]本发明为解决上述问题，提供了一种机器人语音定位过程的摄像头角度校准方法，其提高了语音定位过程的摄像头对准精度。
[0005]为实现上述目的，本发明采用的技术方案为:一种机器人语音定位过程的摄像头角度校准方法，包括以下步骤:第一步，语音粗定位:机器人采集到声波后，通过语音定位模块定位出语音源位置，根据该语音源位置信息将带有摄像头的机器人面部转到大致的语音源方位；第二步，人脸检测:利用机器人面部的摄像头采集图像，通过人脸检测模块判断所采集的图像中是否有人脸，若存在人脸则进行第三步；第三步，人脸角度偏差计算:采集一张人脸图像，检测出人脸中心位置，以摄像头中心点为原点建立矩形坐标轴，根据人脸中心位置和矩形坐标轴定位出图像中人脸的中心坐标 [X，Y]，该坐标[X，Y]也为人脸中心与摄像头中心的偏差；第四步:角度调整:根据人脸坐标与摄像头中心点偏差换算出摄像头沿X轴旋转的角度 degreeX和沿Y轴旋转的角度degreeY，然后根据degreeX和degreeY值微调摄像头，使人脸的中心点对准摄像头的中心点，实现语音的精确定位。
[0006]所述第三步与第四步之间还包括步骤:将计算出的偏差与预设偏差标准值比较，若偏差小于预设偏差标准值则执行第四步，该预设偏差标准值根据摄像头参数预先设置。
[0007]所述第二步中的矩形坐标中，原点位于矩形的几何中心，所述第三步中degreeX和 degreeY的计算公式如下:degreeX = x / (width/2) * MAX_DEGREE_X / 2; degreeY = y / (height/2) * MAX_DEGREE_Y / 2;其中，width为矩形沿X方向的长度，height为矩形沿Y轴方向的长度，MAX_DEGREE_XS 摄像头沿X方向的最大广角，MAX_DEGREE_Y为摄像头沿Y方向的最大广角。
[0008]所述MAX_DEGREE_X为80°，MAX_DEGREE_Y 为40°。
[0009]本发明的有益效果是:本发明的一种机器人语音定位过程的摄像头角度校准方法，通过在语音大致定位后，根据摄像头采集的图像中人脸图像与摄像头中心点在所采集的图像中的位置，计算出摄像头需要微调的旋转角度值，根据该旋转角度值机器人的面部方向，使机器人面部的摄像头对准人脸，针对机器人之前的语音粗定位进行微调，实现语音的精确定位，不仅提高了机器人与人声交互过程的拾音效果，提高语音识别的准确度，而且，机器人都能采集到交互对象人脸的正面图像，提高了用户体验。【附图说明】
[0010]此处所说明的附图用来提供对本发明的进一步理解，构成本发明的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中:图1为本发明的流程框图。【具体实施方式】
[0011]为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白，以下结合附图及实施例对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。
[0012]如图1所示，本发明揭示的一种机器人语音定位过程的摄像头角度校准方法，其包括以下步骤:第一步，语音粗定位:机器人采集到声波后，通过语音定位模块定位出语音源位置，根据该语音源位置信息将带有摄像头的机器人面部转到大致的语音源方位；第二步，人脸检测:利用机器人面部的摄像头采集图像，通过人脸检测模块判断所采集的图像中是否有人脸，若存在人脸则进行第三步；第三步，人脸角度偏差计算:采集一张人脸图像，检测出人脸中心位置，以摄像头中心点为原点建立矩形坐标轴，根据人脸中心位置和矩形坐标轴定位出图像中人脸的中心坐标 [X，Y]，该坐标[X，Y]也为人脸中心与摄像头中心的偏差；第四步:角度调整:根据人脸坐标与摄像头中心点偏差换算出摄像头沿X轴旋转的角度 degreeX和沿Y轴旋转的角度degreeY，然后根据degreeX和degreeY值微调摄像头，使人脸的中心点对准摄像头的中心点，实现语音的精确定位。[〇〇13]所述第三步与第四步之间还包括步骤:将计算出的偏差与预设偏差标准值比较，若偏差小于预设偏差标准值则执行第四步，该预设偏差标准值根据摄像头参数预先设置。
[0014]所述第二步中的矩形坐标中，原点位于矩形的几何中心，所述第三步中degreeX和degreeY的计算公式如下:degreeX = x / (width/2) * MAX_DEGREE_X / 2; degreeY = y / (height/2) * MAX_DEGREE_Y / 2;其中，width为矩形沿X方向的长度，height为矩形沿Y轴方向的长度，MAX_DEGREE_XS 摄像头沿X方向的最大广角，MAX_DEGREE_Y为摄像头沿Y方向的最大广角。
[0015]所述MAX_DEGREE_X为80°，MAX_DEGREE_Y 为40°。
[0016]本发明的一种机器人语音定位过程的摄像头角度校准方法，通过在语音大致定位后，根据摄像头采集的图像中人脸图像与摄像头中心点在所采集的图像中的位置，计算出摄像头需要微调的旋转角度值，根据该旋转角度值机器人的面部方向，使机器人面部的摄像头对准人脸，针对机器人之前的语音粗定位进行微调，实现语音的精确定位，不仅提高了机器人与人声交互过程的拾音效果，提高语音识别的准确度，而且，机器人都能采集到交互对象人脸的正面图像，提高了用户体验。
[0017]上述说明示出并描述了本发明的优选实施例，应当理解本发明并非局限于本文所披露的形式，不应看作是对其他实施例的排除，而可用于各种其他组合、修改和环境，并能够在本文发明构想范围内，通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围，则都应在本发明所附权利要求的保护范围内。
【主权项】
1.一种机器人语音定位过程的摄像头角度校准方法，其特征在于，包括以下步骤: 第一步，语音粗定位:机器人采集到声波后，通过语音定位模块定位出语音源位置，根据该语音源位置信息将带有摄像头的机器人面部转到大致的语音源方位；第二步，人脸检测:利用机器人面部的摄像头采集图像，通过人脸检测模块判断所采集的图像中是否有人脸，若存在人脸则进行第三步；第三步，人脸角度偏差计算:采集一张人脸图像，检测出人脸中心位置，以摄像头中心点为原点建立矩形坐标轴，根据人脸中心位置和矩形坐标轴定位出图像中人脸的中心坐标 [X，Y]，该坐标[X，Y]也为人脸中心与摄像头中心的偏差；第四步:角度调整:根据人脸坐标与摄像头中心点偏差换算出摄像头沿X轴旋转的角度 degreeX和沿Y轴旋转的角度degreeY，然后根据degreeX和degreeY值微调摄像头，使人脸的中心点对准摄像头的中心点，实现语音的精确定位。2.如权利要求1所述的一种机器人语音定位过程的摄像头角度校准方法，其特征在于: 所述第三步与第四步之间还包括步骤:将计算出的偏差与预设偏差标准值比较，若偏差小于预设偏差标准值则执行第四步，该预设偏差标准值根据摄像头参数预先设置。3.如权利要求1所述的一种机器人语音定位过程的摄像头角度校准方法，其特征在于: 所述第二步中的矩形坐标中，原点位于矩形的几何中心，所述第三步中degreeX和degreeY 的计算公式如下:degreeX = x / (width/2) * MAX_DEGREE_X / 2; degreeY = y / (height/2) * MAX_DEGREE_Y / 2;其中，width为矩形沿X方向的长度，height为矩形沿Y轴方向的长度，MAX_DEGREE_XS 摄像头沿X方向的最大广角，MAX_DEGREE_Y为摄像头沿Y方向的最大广角。4.如权利要求3所述的一种机器人语音定位过程的摄像头角度校准方法，其特征在于: 所述MAX_DEGREE_X为80°，MAX_DEGREE_Y 为40°。
【文档编号】G06K9/00GK105975930SQ201610287804
【公开日】2016年9月28日
【申请日】2016年5月4日
【发明人】沈崇禧, 伍本强, 刘福权
【申请人】南靖万利达科技有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：沈崇禧;伍本强;刘福权;
技术所有人：南靖万利达科技有限公司;
我是此专利的发明人

上一篇：一种基于多尺度池化的卷积神经网络人脸识别方法
上一篇：一种基于聚合通道特征的快速行人检测方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。