图像识别方法和装置的制作方法

文档序号:6438394阅读:218来源:国知局
专利名称:图像识别方法和装置的制作方法
图像识别方法和装置
技术领域
本发明涉及图像分析领域,特别是涉及一种图像识别方法和装置。
背景技术
近年来,随着智能终端设备的普及,寻求一种更自然更简单的人机交互方式已然成为科研和产业领域的热点问题。纵观人机交互技术的发展历史,已逐渐从鼠标、键盘、遥控器等方式发展为视觉、语音、姿态等非接触式的操作方式,而且视觉技术作为其中最为重要的手段。即通过摄像头获取画面,基于图像智能分析技术判断操作者的动作和意图,进而控制机器。但其所面临最大的问题是环境的复杂性和不确定性,使得该技术还未完全成熟。随着3D技术的发展,微软推出了 Kinect系统,其通过动态三维重建技术,将人机交互由2D的图像空间拓展到真实的3D空间,3D空间的深度信息有效的解决了 2D空间中较为复杂的背景分割问题,使得该技术趋于成熟,并已应用到电视机、游戏机等设备中,用做外置的人机交互设备。传统技术的不足是:(I)基于辅助设备的手势人机交互方式:需要用户手持或者穿戴具有明显标记物的手柄或者手套,用于降低视觉检测和识别的难度,但却失去了手势操作本该具有的自然性和便利性;(2)基于视觉的手势识别操作技术:受限于其算法的稳定性和抗干扰性,当场景较为复杂或者外界光照影响较为严重时,其手势目标检测准确性和跟踪及识别的准确率急剧下降,根源于其机器学习和模式识别算法的有效性和鲁棒性;(3)基于3D技术的手势体感控制技术:以微软Kinect系统为代表的该技术通过动态三维重构技术实现 了对场景的三维实时重建,将视觉检测算法由2D导入3D空间进行,降低了识别的难度,但增加了硬件成本和计算量,而且产品体积较大,很难嵌入到现有的智能终端设备中。

发明内容基于传统技术的各种不足,有必要提供一种识别精度更高的图像识别方法和装置。一种图像识别方法,包括如下步骤:步骤S201,获取待检测图像;步骤S202,通过预设窗口从所述待检测图像上截取得到窗口图像;步骤S203,利用至少二种分辨率分别将所述窗口图像剖分为多个细胞单元,同一种分辨率下,所述细胞单元的尺寸相同,分辨率越高,所述细胞单元尺寸越小;步骤S204,提取各个分辨率下所述细胞单元的梯度方向直方图;步骤S205,分别将同一分辨率下的所有所述细胞单元的所述梯度方向直方图结合,得到对应分辨率下所述窗口图像的梯度方向直方步骤S206,根据各个分辨率对应的所述窗口图像的所述梯度方向直方图和预设的判定函数,计算得到各个分辨率下所述窗口图像和目标图像的相似度值;步骤S207,根据预设的判定阀值和各个分辨率对应的所述相似度值,分别判定各个分辨率下所述窗口图像是否为所述目标图像;步骤S208,在所有分辨率下均判定所述窗口图像是所述目标图像时,最终判定所述窗口图像是所述目标图像。本发明一较佳实施例中,所述步骤S203中所述至少二种分辨率的剖分执行顺序是从低到高的逐个执行,并且是在某一分辨率下所述步骤S207判定所述窗口图像是所述目标图像后,所述步骤S203再进行更高分辨率的剖分;当在某一分辨率下所述步骤S207判定所述窗口图像不是所述目标图像,则所述步骤S203不进行更高分辨率的剖分,此时就最终判定所述窗口图像不是所述目标图像。本发明一较佳实施例中,在提取所述细胞单元的梯度方向直方图时,一个像素点对与该像素点梯度方向相近的几个角度区间都做投票,所述像素点的梯度方向距离某个角度区间中心的距离越近则投票的权重越大,反之则越小。本发明一较佳实施例中,当所述像素点的梯度方向距离某个角度区间中心的距离超过预设距离阈值,该像素点不对该区间进行投票。本发明一较佳实施例中,所述步骤S204中,高分辨率下提取的所述细胞单元的梯度方向直方图的维数大于或等于低分辨率下所述细胞单元的梯度方向直方图的维数。一种图像识别装置,其包括图像获取单元和截图单元,所述图像获取单元用于获取待检测图像;所述截图单元用于通过预设窗口从所述待检测图像上截取得到窗口图像;所述图像识别装置还包括:剖分单元,用于利用至少二种分辨率分别将所述窗口图像剖分为多个细胞单元,同一种分辨率下,所述细胞单元的尺寸相同,分辨率越高,所述细胞单元尺寸越小;提取单元,用于提取各个分辨率下所述细胞单元的梯度方向直方图;整合单元,用于分别将同一分辨率下的所有所述细胞单元的梯度方向直方图结合,得到对应分辨率下所述窗口图像的梯度方向直方图;计算单元,用于根据各个分辨率对应的所述窗口图像的梯度方向直方图和预设的判定函数,计算得到各个分辨率下所述窗口图像和目标图像的相似度值;识别单元,用于根据预设的判定阀值和各个分辨率对应的所述相似度值,分别判定各个分辨率下所述窗口图像是否为所述目标图像;判定单元,用于在所有分辨率下均判定所述窗口图像是所述目标图像时,最终判定所述窗口图像是所述目标图像。本发明一较佳实施例中,所述剖分单元用于从低到高的逐个执行所述至少二种分辨率的剖分,并且是在某一分辨率下所述识别单元判定所述窗口图像是所述目标图像后,再进行更高分辨率的剖分;当在某一分辨率下所述识别单元判定所述窗口图像不是所述目标图像,所述剖分单元不进行更高分辨率的剖分,此时所述判定单元用于最终判定所述窗口图像不是所述目标图像。本发明一较佳实施例中,所述提取单元在所述细胞单元上提取所述梯度方向直方图时,一个像素点对与该像素点梯度方向相近的几个角度区间都做投票,所述像素点的梯度方向距离某个角度区间中心的距离越近则投票的权重越大,反之则越小。本发明一较佳实施例中,当所述像素点的梯度方向距离某个角度区间中心的距离超过预设距离阈值,该像素点不对该区间进行投票。本发明一较佳实施例中,所述提取单元在高分辨率下提取的所述细胞单元的梯度方向直方图的维数大于或等于低分辨率下所述细胞单元的梯度方向直方图的维数。上述图像识别方法和装置,通过多种分辨率剖分窗口图像,利用多种分辨率下的判定结果共同确定窗口图像是否为目标图像,以实现更高精度的图像识别。

图1为一实施例的图像识别方法的步骤流程图;图2为一实施例的图像识别装置的功能模块图。
具体实施方式为了解决传统技术图像识别精度不高的问题,提出了一种精确更高的图像识别方法和装置。在图像识别之前,首先要对目标图像建立模型表示(即挖掘显著性特征),后续检测中,将滑动得到的窗口图像的特征与模型比对,做出目标/非目标判定,实现目标检测。本发明是利用梯度方向直方图HOG (Histograms of Oriented Gradients)对图像进行特征描述,在特征空间中生成正类的子集和负类的子集;然后通过分片线性曲面来逼近正类和负类之间的真实分类面,而分片线性分类面是通过级联若干个线性SVM来获得的。如图1所示,其为本发明一实施例的图像识别方法的步骤流程图,包括如下步骤:步骤S201,获取待检测图像。如通过摄像头拍摄画面,然后提取一帧图像。假设目标图像设置的是手掌,那么图像识别即是判断拍摄的画面中是否有手掌图像。步骤S202,通过预设窗口从所述待检测图像上截取得到窗口图像。本发明一实施例中,预设窗口的截取方式是采用滑动穷搜的方式实现。为了检测大小不同的目标图像,可以采用固定的预设窗口,通过缩放原始图像大小来获得,又或者通过不同大小的预设窗口滑动获得。步骤S203,利用至少二种分辨率分别将窗口图像剖分为多个细胞单元,同一种分辨率下,细胞单元的尺寸相同,分辨率越高,细胞单元尺寸越小。 例如:第一种分辨率将窗口图像剖分为3*3 = 9个细胞单元;第二种分辨率将窗口图像剖分为6*6 = 36个细胞单元;第三种分辨率将窗口图像剖分为9*9 = 81个细胞单元。分辨率的数量也不宜太多,过多则会影响图像识别的效率,本发明采用三种分辨率。步骤S204,提取各个分辨率下细胞单元的梯度方向直方图。本发明实施中,高分辨率下提取的细胞单元的梯度方向直方图的维数大于或等于低分辨率下细胞单元的梯度方向直方图的维数。本发明在提取所述细胞单元的梯度方向直方图时,并非一个像素点只对一个角度区间做投票,而是对与该像素点梯度方向相近的几个角度区间都做投票。像素点的梯度方向距离某个角度区间中心的距离越近则投票的权重越大,反之则越小。若距离超过预设距离阈值,则该像素点不对该区间进行投票。实验证明使用该种方法提取的梯度方向直方图具有更好的稳定性。步骤S205,分别将同一分辨率下的所有细胞单元的梯度方向直方图结合,得到对应分辨率下窗口图像的梯度方向直方图。如此,分辨率越高,窗口图像的梯度方向直方图维度就越高。步骤S206,根据各个分辨率对应的窗口图像的梯度方向直方图和预设的判定函数,计算得到各个分辨率下窗口图像和目标图像的相似度值。本发明实施例中,相似度值是通过支持向量机输出的从O到I之间的数值,相似度值越大,代表窗口图像越有可能是目标图像。步骤S207,根据预设的判定阀值和各个分辨率对应的相似度值,分别判定各个分辨率下窗口图像是否为目标图像。步骤S208,在所有分辨率下均判定窗口图像是目标图像时,最终判定该窗口图像是目标图像。本发明采用多种分辨率对窗口图像进行剖分是因为:只用一种分辨率的情况下,若分辨率较低,识别精度不高;若分辨率较高,又有可能丧失目标的整体信息,所以采用多种分辨率,能够使得图像识别结果更准确。为了提高图像识别效率,本发明一较佳实施例中,所述步骤S203中所述的至少二种分辨率的剖分执行顺序是从低到高的逐个执行,并且是在某一分辨率下所述步骤S207判定窗口图像是目标图像后,所述步骤S203再进行更高分辨率的剖分,当在某一分辨率下所述步骤S207判定窗口图像不是目标图像,则所述步骤S203无需进行更高分辨率的剖分,此时就最终判定窗口图像不是目标图像。这样就可以利用数据处理比较简单的低分辨率快速过滤了非目标图像,缩短识别时间。如图2所示,其为一实施例的图像识别装置40的功能模块图,包括:图像获取单元400、截图单元402、剖分单元404、提取单元406、整合单元408、计算单元410、识别单元412以及判定单元414。图像获取单元400用于获取待检测图像。如通过摄像头拍摄画面,然后提取一帧图像。截图单元402用于通过预设窗口从所述待检测图像上截取得到窗口图像。剖分单元404用于利用至少二种分辨率分别将窗口图像剖分为多个细胞单元,同一种分辨率下,细胞单元的尺寸相同,分辨率越高,细胞单元尺寸越小。提取单元406用于提取各个分辨率下细胞单元的梯度方向直方图。本发明实施例中,高分辨率下提取的细胞单元的梯度方向直方图的维数大于或等于低分辨率下细胞单元的梯度方向直方图的维数。本发明提取单元406用于在提取细胞单元的梯度方向直方图时,并非一个像素点只对一个角度区间做投票,而是对与该像素点梯度方向相近的几个角度区间都做投票。该像素点的梯度方向距离某个角度区间中心的距离越近则投票的权重越大,反之则越小。如距离超过预设距离阈值,则该像素点不对该区间进行投票。整合单元408用于分别将同一分辨率下的所有细胞单元的梯度方向直方图结合,得到对应分辨率下窗口图像的梯度方向直方图。如此,分辨率越高,窗口图像的梯度方向直方图维度就越高。计算单元410用于根据各个分辨率对应的窗口图像的梯度方向直方图和预设的判定函数,计算得到各个分辨率下窗口图像和目标图像的相似度值。识别单元412用于根据预设的判定阀值和各个分辨率对应的相似度值,分别判定各个分辨率下窗口图像是否为目标图像。判定单元414用于在所有分辨率下均判定窗口图像是目标图像时,最终判定该窗口图像是目标图像。本发明的图像识别装置40的剖分单元404采用多种分辨率对窗口图像进行剖分是因为:只用一种分辨率的情况下,若分辨率较低,识别精度不高;若分辨率较高,又有可能丧失目标的整体信息,所以采用多种分辨率,能够使得图像识别结果更准确。为了提高图像识别效率,本发明一较佳实施例中,所述剖分单元404用于从低到高的逐个执行所述至少二种分辨率的剖分,并且是在某一分辨率下识别单元412判定窗口图像是目标图像后,再进行更高分辨率的剖分;当在某一分辨率下识别单元412判定窗口图像不是目标图像,剖分单元404则无需进行更高分辨率的剖分,此时判定单元414就最终判定窗口图像不是目标图像。这样就可以利用数据处理比较简单的低分辨率快速过滤了非目标图像,缩短识别时间。以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
权利要求
1.一种图像识别方法,其特征在于,包括如下步骤: 步骤S201,获取待检测图像; 步骤S202,通过预设窗口从所述待检测图像上截取得到窗口图像; 步骤S203,利用至少二种分辨率分别将所述窗口图像剖分为多个细胞单元,同一种分辨率下,所述细胞单元的尺寸相同,分辨率越高,所述细胞单元尺寸越小步骤S204,提取各个分辨率下所述细胞单元的梯度方向直方图;.步骤S205,分别将同一分辨率下的所有所述细胞单元的所述梯度方向直方图结合,得到对应分辨率下所述窗口图像的梯度方向直方图; 步骤S206,根据各个分辨率对应的所述窗口图像的所述梯度方向直方图和预设的判定函数,计算得到各个分辨率下所述窗口图像和目标图像的相似度值; 步骤S207,根据预设的判定阀值和各个分辨率对应的所述相似度值,分别判定各个分辨率下所述窗口图像是否为所述目标图像; 步骤S208,在所有分辨率下均判定所述窗口图像是所述目标图像时,最终判定所述窗口图像是所述目标图像。
2.根据权利要求1所述的图像识别方法,其特征在于,所述步骤S203中所述至少二种分辨率的剖分执行顺序是从低到高的逐个执行,并且是在某一分辨率下所述步骤S207判定所述窗口图像是所述目标图像后,所述步骤S203再进行更高分辨率的剖分;当在某一分辨率下所述步骤S207判定所述窗口图像不是所述目标图像,则所述步骤S203不进行更高分辨率的剖分,此时就最终判定所述窗口图像不是所述目标图像。
3.根据权利要求1所述的图像识别方法,其特征在于,在提取所述细胞单元的梯度方向直方图时,一个像素点对与该像素点梯度方向相近的几个角度区间都做投票,所述像素点的梯度方向距离某个角度区间中心的距离越近则投票的权重越大,反之则越小。
4.根据权利要求3所述的图像识别方法,其特征在于,当所述像素点的梯度方向距离某个角度区间中心的距离超过预设距离阈值,该像素点不对该区间进行投票。
5.根据权利要求1所述的图像识别方法,其特征在于,所述步骤S204中,高分辨率下提取的所述细胞单元的梯度方向直方图的维数大于或等于低分辨率下所述细胞单元的梯度方向直方图的维数。
6.一种图像识别装置,其包括图像获取单元和截图单元,所述图像获取单元用于获取待检测图像;所述截图单元用于通过预设窗口从所述待检测图像上截取得到窗口图像;其特征在于,所述图像识别装置还包括: 剖分单元,用于利用至少二种分辨率分别将所述窗口图像剖分为多个细胞单元,同一种分辨率下,所述细胞单元的尺寸相同,分辨率越高,所述细胞单元尺寸越小; 提取单元,用于提取各个分辨率下所述细胞单元的梯度方向直方图; 整合单元,用于分别将同一分辨率下的所有所述细胞单元的梯度方向直方图结合,得到对应分辨率下所述窗口图像的梯度方向直方图; 计算单元,用于根据各个分辨率对应的所述窗口图像的梯度方向直方图和预设的判定函数,计算得到各个分辨率下所述窗口图像和目标图像的相似度值; 识别单元,用于根据预设的判定阀值和各个分辨率对应的所述相似度值, 分别判定各个分辨率下所述窗口图像是否为所述目标图像;判定单元,用于在所有分辨率下均判定所述窗口图像是所述目标图像时,最终判定所述窗口图像是所述目标图像。
7.根据权利要求6所述的图像识别装置,其特征在于,所述剖分单元用于从低到高的逐个执行所述至少二种分辨率的剖分,并且是在某一分辨率下所述识别单元判定所述窗口图像是所述目标图像后,再进行更高分辨率的剖分;当在某一分辨率下所述识别单元判定所述窗口图像不是所述目标图像,所述剖分单元不进行更高分辨率的剖分,此时所述判定单元用于最终判定所述窗口图像不是所述目标图像。
8.根据权利要求6所述的图像识别装置,其特征在于,所述提取单元在所述细胞单元上提取所述梯度方向直方图时,一个像素点对与该像素点梯度方向相近的几个角度区间都做投票,所述像素点的梯度方向距离某个角度区间中心的距离越近则投票的权重越大,反之则越小。
9.根据权利要求8所述的图像识别装置,其特征在于,当所述像素点的梯度方向距离某个角度区间中心的距离超过预设距离阈值,该像素点不对该区间进行投票。
10.根据权利要求6所述的图像识别装置,其特征在于,所述提取单元在高分辨率下提取的所述细胞单元的梯度方向直方图的维数大于或等于低分辨率下所述细胞单元的梯度方向直方图的维数。`
全文摘要
一种图像识别方法包括如下步骤利用至少二种分辨率分别将窗口图像剖分为多个细胞单元;提取各个分辨率下细胞单元的梯度方向直方图;分别将同一分辨率下的所有细胞单元的梯度方向直方图结合,得到对应分辨率下窗口图像的梯度方向直方图;根据各个分辨率对应的窗口图像的梯度方向直方图和预设的判定函数,计算得到多个相似度值;根据预设的判定阀值和各个分辨率对应的相似度值,分别判定各个分辨率下窗口图像是否为目标图像;在所有分辨率下均判定窗口图像是目标图像时,最终判定窗口图像是目标图像。本发明还提供一种图像识别装置。上述方法和装置利用多种分辨率下的判定结果共同确定窗口图像是否为目标图像,以实现更高精度的图像识别。
文档编号G06T7/00GK103106387SQ20111036108
公开日2013年5月15日 申请日期2011年11月15日 优先权日2011年11月15日
发明者赵颜果, 郑锋, 宋展 申请人:中国科学院深圳先进技术研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1