图像识别方法和系统的制作方法

文档序号：6438398阅读：560来源：国知局

专利名称：图像识别方法和系统的制作方法
图像识别方法和系统技术领域：
本发明涉及图像处理领域，特别是涉及一种基于动态影像的图像识别方法和系统。
背景技术：
近年来，随着智能终端设备的普及，寻求一种更自然更简单的人机交互方式已然成为科研和产业领域的热点问题。纵观人机交互技术的发展历史，已逐渐从鼠标、键盘、遥控器等方式发展为视觉、语音、姿态等非接触式的操作方式，而且视觉技术作为其中最为重要的手段。随着3D技术的发展，微软推出了 Kinect系统，其通过动态三维重建技术，将人机交互由2D的图像空间拓展到真实的3D空间，3D空间的深度信息有效的解决了 2D空间中较为复杂的背景分割问题，使得该技术趋于成熟，并已应用到电视机、游戏机等设备中，用做外置的人机交互设备。但这种基于3D技术的手势和姿态体感控制系统受限于其昂贵的硬件成本和巨大的运算量，以及其体积较大，很难集成到现有智能终端设备中。为了减少数据处理量，通常是通过摄像头获取2D画面，基于2D图像智能分析技术判断操作者的动作和意图，进而控制机器。但其所面临最大的问题是环境的复杂性和不确定性，使得图像识别准确性不高，误判较多，导致整个图像识别系统不稳定。

发明内容基于传统技术的图像识别系统不稳定的问题，有必要提供一种基于动态影像的图像识别方法和系统。一种图像识别方法，包括如下步骤:步骤SlOl，获取动态影像；

步骤S102，提取所述动态影像中的多帧静态图像；步骤S103，分别识别所述多帧静态图像中是否包含同一目标图像；步骤S104，在识别结果为包含所述目标图像的所述静态图像的数量达到预设数量阀值时，判定所述动态影像中包含所述目标图像。本发明一较佳实施例中，所述步骤S104是在所述多帧静态图像的头尾二帧所述静态图像和中间一帧所述静态图像识别到同一所述目标图像时，判定所述动态影像中包含所述目标图像。本发明一较佳实施例中，所述步骤S103进一步包括在一帧所述静态图像中识别到两种所述目标图像时，当第一种目标图像的相似度超过第二种目标图像的相似度达到预设差值时，选择所述第一种目标图像作为该帧静态图像中的目标图像，反之选择所述第二种目标图像作为该帧静态图像中的目标图像。本发明一较佳实施例中，还包括如下步骤:步骤S201，提取所述静态图像中识别出的目标图像的坐标；步骤S202，根据预设方式定义识别出的所述目标图像上某一点为基准点；
步骤S203，当相邻二帧所述静态图像中识别到的所述目标图像不同时，通过预设参数调整后一帧所述静态图像中识别到的所述目标图像的基准点位置；步骤S204，记录所述多帧静态图像中所述目标图像的所述基准点的移动轨迹，生成所述目标图像的移动信息。一种图像识别装置，包括影像摄取单元、图像提取单元，所述影像摄取单元用于获取动态影像，所述图像提取单元用于提取所述动态影像中的多帧静态图像，所述图像识别装置还包括:图像识别单元，用于分别识别所述多帧静态图像中是否包含同一目标图像。识别判定单元，用于在识别结果为包含所述目标图像的所述静态图像的数量达到预设数量阀值时，判定所述动态影像中包含所述目标图像。本发明一较佳实施例中，所述识别判定单元是在所述多帧静态图像的头尾二帧所述静态图像和中间一帧所述静态图像识别到同一目标图像时，判定所述动态影像中包含所述目标图像。本发明一较佳实施例中，所述图像识别单元进一步用于在一帧所述静态图像中识别到两种目标图像时，当第一种目标图像的相似度超过第二种目标图像的相似度达到预设差值时，选择所述第一种目标图像作为该帧静态图像中的目标图像，反之选择所述第二种目标图像作为该帧静态图像中的目标图像。上述图像识别方法和装置是通过多帧静态图像的成功识别的比例，判定动态影像中是否包含目标图像，这样便可以减小单帧图像误判带来的不良问题，提高系统稳定性。

图1为一实施例的图像识别方法步骤流程图；图2为一实施例的基于图像识别的轨迹记录方法步骤流程图；图3为一实施例的图像识别装置的功能模块图。
具体实施方式为了解决传统技术的图像识别系统不稳定的问题，提出了一种基于动态影像的图像识别方法和系统。在图像识别之前，都需要设置目标图像，而用户最方便且最常使用的就是“手”，本发明一较佳实施例以各个手势作为目标图像，包括手掌、拳头、八字、食指等。以便图像识别成功后分别控制其他设备执行预设的对应指令，如若识别到手掌，则控制鼠标左键单击，识别到拳头，控制鼠标右键单击等。如图1所示，其为本发明一较佳实施例的图像识别方法步骤流程图，包括如下步骤:步骤S101，获取动态影像。该步骤可以是通过摄像头拍摄得到。步骤S102，提取动态影像中的多帧静态图像。因为动态影像是由多帧图像组成，图像识别动作是在各帧静态图像中进行。步骤S103，分别识别所述多帧静态图像中是否包含同一目标图像。步骤S104，在识别结果为包含目标图像的静态图像的数量达到预设数量阀值时，判定动态影像中包含所述目标图像。因为在图像识别过程中，单独一帧静态图像的识别容易产生误判。本发明一实施例是在连续的5帧静态图像中，只要有3帧识别到同一目标图像，步骤S104即判定动态影像中包含所述目标图像。本发明一较佳实施例中，是在5帧静态图像中的第I，3，5帧识别到同一目标图像时，即头尾二帧静态图像和中间一帧静态图像识别到同一目标图像时，步骤S104判定动态影像中包含所述目标图像。这样便可以减小单帧图像误判带来的不良问题，提高系统稳定性。在使用手掌和拳头作为目标图像时，因为手掌的下部分(除去手指后的部分)跟拳头的形状非常相似，所以有时会识别到同时存在两个目标图像。本发明一较佳实施例中，步骤S103进一步包括在一帧静态图像中识别到两种目标图像时，当第一种目标图像(拳头)的相似度超过第二种目标图像(手掌)的相似度达到预设差值时，选择第一种目标图像作为该帧静态图像中的目标图像，反之选择第二种目标图像作为该帧静态图像中的目标图像。如:第一种目标图像的相似度大于三倍的第二种目标图像的相似度时，选择第一种目标图像作为该帧静态图像中的目标图像。在判定动态影像中包含所述目标图像后，若希望能够根据目标图像在动态影像中的移动，产生控制命令(如控制鼠标指针的移动)，则必须得到目标图像的移动轨迹，如图2所示，其为识别到目标图像之后的轨迹记录方法，包括如下步骤:步骤S201，提取静态图像中识别出的目标图像的坐标。步骤S202，根据预设方式定义识别出的目标图像上某一点为基准点。步骤S203，当相邻二帧静态图像中识别到的目标图像不同时，通过预设参数调整后一帧静态图像中识别到的目标图像的基准点位置，以保证移动轨迹的平滑度。如，假设前一帧的目标图像是手掌，基准点为手掌图像的中心点，后一帧目标图像为拳头，若还以拳头的中心点作为基准点，那么基准点就等于突然往下移动，这个时候可以将拳头图像的基准点定位在拳头图像的顶端，即尽可能地与原手掌图像的中心位置靠近。
步骤S204，记录多帧静态图像中目标图像的基准点的移动轨迹，生成目标图像的移动信息。这样就减小/避免了切换目标图像后移动轨迹的跳动/抖动情况，使得在控制鼠标指针的移动时，减少/避免切换目标图像时导致的鼠标指针的抖动。在后续利用步骤S204的轨迹控制鼠标指针的移动时，因为用户手势在动态影象中的移动范围和鼠标指针在屏幕上的移动范围并非一致。为此，本发明一较佳实施例中，将目标图像的移动信息通过预设比例换算后，产生控制鼠标指针移动的控制信息。该预设比例可以根据目标图像和所在的静态图像的尺寸比例关系获得。如图3所述，其为本发明一实施例的图像识别装置30的功能模块图，包括:影像摄取单元300、图像提取单元302、图像识别单元304和识别判定单元306。影像摄取单元300用于获取动态影像。如通过摄像头拍摄动态影像。图像提取单元302用于提取动态影像中的多帧静态图像。图像识别单元304用于分别识别所述多帧静态图像中是否包含同一目标图像。识别判定单元306用于在识别结果为包含目标图像的静态图像的数量达到预设数量阀值时，判定动态影像中包含所述目标图像。
因为在图像识别过程中，单独一帧静态图像的识别容易产生误判。本发明一实施例的识别判定单元306是在连续的5帧静态图像中，只要有3帧识别到同一目标图像，即判定动态影像中包含所述目标图像。本发明一较佳实施例中，是在5帧静态图像中的第1，3，5帧识别到同一目标图像时，即头尾2帧静态图像和中间帧静态图像识别到同一目标图像时，判定动态影像中包含所述目标图像。这样便可以减小单帧图像误判带来的不良问题，提高系统稳定性在使用手掌和拳头作为目标图像时，因为手掌的下部分(除去手指后的部分)跟拳头的形状非常相似，所以有时会识别到同时存在两个目标图像。本发明一较佳实施例中，图像识别单元304进一步用于在一帧静态图像中识别到两种目标图像时，当第一种目标图像(拳头)的相似度超过第二种目标图像(手掌)的相似度达到预设差值时，选择第一种目标图像作为该帧静态图像中的目标图像。如:第一种目标图像的相似度大于三倍的第二种目标图像的相似度时，选择第一种目标图像作为该帧静态图像中的目标图像。以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。
权利要求
1.一种图像识别方法，其特征在于，包括如下步骤: 步骤SlOl，获取动态影像；步骤S102，提取所述动态影像中的多帧静态图像；步骤S103，分别识别所述多帧静态图像中是否包含同一目标图像；步骤S104，在识别结果为包含所述目标图像的所述静态图像的数量达到预设数量阀值时，判定所述动态影像中包含所述目标图像。
2.根据权利要求1所述的图像识别方法，其特征在于，所述步骤S104是在所述多帧静态图像的头尾二帧所述静态图像和中间一帧所述静态图像识别到同一所述目标图像时，判定所述动态影像中包含所述目标图像。
3.根据权利要求1所述的图像识别方法，其特征在于，所述步骤S103进一步包括在一帧所述静态图像中识别到两种所述目标图像时，当第一种目标图像的相似度超过第二种目标图像的相似度达到预设差值时，选择所述第一种目标图像作为该帧静态图像中的目标图像，反之选择所述第二种目标图像作为该帧静态图像中的目标图像。
4.根据权利要求1所述的图像识别方法，其特征在于，还包括如下步骤: 步骤S201，提取所述静态图像中识别出的目标图像的坐标；步骤S202，根据预设方式定义识别出的所述目标图像上某一点为基准点；步骤S203，当相邻二帧所述静态图像中识别到的所述目标图像不同时，通过预设参数调整后一帧所述静态图像中识别到的所述目标图像的基准点位置；步骤S204，记录所述多帧静态图像中所述目标图像的所述基准点的移动轨迹，生成所述目标图像的移动信息。
5.一种图像识别装置，包括影像摄取单元、图像提取单元，所述影像摄取单元用于获取动态影像，所述图像提取单元用于提取所述动态影像中的多帧静态图像，其特征在于，所述图像识别装置还包括: 图像识别单元，用于分别识别所述多帧静态图像中是否包含同一目标图像。
识别判定单元，用于在识别结果为包含所述目标图像的所述静态图像的数量达到预设数量阀值时，判定所述动态影像中包含所述目标图像。
6.根据权利要求5所述的图像识别装置，其特征在于，所述识别判定单元是在所述多帧静态图像的头尾二帧所述静态图像和中间一帧所述静态图像识别到同一目标图像时，判定所述动态影像中包含所述目标图像。
7.根据权利要求5所述的图像识别装置，其特征在于，所述图像识别单元进一步用于在一帧所述静态图像中识别到两种目标图像时，当第一种目标图像的相似度超过第二种目标图像的相似度达到预设差值时，选择所述第一种目标图像作为该帧静态图像中的目标图像，反之选择所述第二种目标图像作为该帧静态图像中的目标图像。
全文摘要
一种图像识别方法包括如下步骤获取动态影像；提取所述动态影像中的多帧静态图像分别识别所述多帧静态图像中是否包含同一目标图像；在识别结果为包含所述目标图像的所述静态图像的数量达到预设数量阀值时，判定所述动态影像中包含所述目标图像。本发明还提供一种图像识别装置。上述图像识别方法和装置是通过多帧静态图像的成功识别的比例，判定动态影像中是否包含目标图像，这样便可以减小单帧图像误判带来的不良问题，提高系统稳定性。
文档编号G06K9/32GK103106388SQ20111036112
公开日2013年5月15日申请日期2011年11月15日优先权日2011年11月15日
发明者宋展, 郑锋, 赵颜果申请人:中国科学院深圳先进技术研究院

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：宋展;郑锋;赵颜果;
技术所有人：中国科学院深圳先进技术研究院;
我是此专利的发明人

上一篇：具有语义分析能力的、数据敏感的协商与合作引擎及方法
上一篇：人机交互方法和装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。