图像识别方法及装置、计算机装置和计算机可读存储介质与流程

文档序号:14072717阅读:180来源:国知局

本发明涉及计算机视觉技术领域,具体涉及一种图像识别方法及装置、计算机装置和计算机可读存储介质。



背景技术:

现有的图像识别方法大多存在一定的缺点。举例来说,基于多区域、多特征的识别方法,通常需要组成维数较高的特征向量再进行训练和预测,计算复杂度较高且准确率和鲁棒性易受到影响。使用rgb色彩空间会受到光照、拍摄条件的影响从而造成同一被测物在不同拍摄条件下提取的特征不同,从而影响识别准确性。而基于色彩空间直方图在计算相似性时易受到干扰,且无论是直方图相交法还是距离计算法,其准确率都不是很高,且在多区域计算中复杂度较高。



技术实现要素:

鉴于以上内容,有必要提出一种图像识别方法及装置、计算机装置和计算机可读存储介质,其可以实现快速高鲁棒性高抗干扰性的图像识别。

本申请的第一方面提供一种图像识别方法,所述方法包括:

对查询图像与数据库图像进行区域划分;

计算查询图像与数据库图像的每个区域的每个像素点的对数相对rgb坐标;

根据查询图像与数据库图像的每个区域的每个像素点的对数相对rgb坐标对查询图像与数据库图像的每个区域内的像素点进行聚类,得到查询图像与数据库图像的每个区域的聚类中心;

根据查询图像与数据库图像的每个区域的聚类中心确定查询图像与数据库图像是否匹配。

另一种可能的实现方式中,所述查询图像与数据库图像是人物图像,所述对查询图像与数据库图像进行区域划分包括:

按照查询图像与数据库图像中的人物形体将查询图像与数据库图像各自划分为上下两个区域,其中上区域对应人物的上半身,下区域对应人物的下半身。

另一种可能的实现方式中,所述根据查询图像与数据库图像的每个区域的聚类中心确定查询图像与数据库图像是否匹配包括:

计算查询图像与数据库图像对应的每个区域的聚类中心的距离;

根据查询图像与数据库图像对应的每个区域的聚类中心的距离确定查询图像与数据库图像是否匹配。

另一种可能的实现方式中,所述计算查询图像与数据库图像对应的每个区域的聚类中心的距离包括:

计算查询图像与数据库图像对应的每个区域的聚类中心的欧氏距离;或者

计算查询图像与数据库图像对应的每个区域的聚类中心的曼哈顿距离;或者

计算查询图像与数据库图像对应的每个区域的聚类中心的马氏距离。

本申请的第二方面提供一种图像识别装置,所述装置包括:

区域划分单元,用于对查询图像与数据库图像进行区域划分;

坐标计算单元,用于计算查询图像与数据库图像的每个区域的每个像素点的对数相对rgb坐标;

聚类单元,用于根据查询图像与数据库图像的每个区域的每个像素点的对数相对rgb坐标对查询图像与数据库图像的每个区域内的像素点进行聚类,得到查询图像与数据库图像的每个区域的聚类中心;

匹配单元,用于根据查询图像与数据库图像的每个区域的聚类中心确定查询图像与数据库图像是否匹配。

另一种可能的实现方式中,所述查询图像与数据库图像包括人物图像,所述区域划分单元具体用于:

按照查询图像与数据库图像中的人物形体将查询图像与数据库图像各自划分为上下两个区域,其中上区域对应人物的上半身,下区域对应人物的下半身。

另一种可能的实现方式中,所述匹配单元具体用于:

计算查询图像与数据库图像对应的每个区域的聚类中心的距离;

根据查询图像与数据库图像对应的每个区域的聚类中心的距离确定查询图像与数据库图像是否匹配。

另一种可能的实现方式中,所述匹配单元计算查询图像与数据库图像对应的每个区域的聚类中心的距离具体包括:

计算查询图像与数据库图像对应的每个区域的聚类中心的欧氏距离;或者

计算查询图像与数据库图像对应的每个区域的聚类中心的曼哈顿距离;或者

计算查询图像与数据库图像对应的每个区域的聚类中心的马氏距离。

本申请的第三方面提供一种计算机装置,所述计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现所述图像识别方法。

本申请的第四方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述图像识别方法。

本发明对查询图像与数据库图像进行区域划分;计算查询图像与数据库图像的每个区域的每个像素点的对数相对rgb坐标;根据查询图像与数据库图像的每个区域的每个像素点的对数相对rgb坐标对查询图像与数据库图像的每个区域内的像素点进行聚类,得到查询图像与数据库图像的每个区域的聚类中心;根据查询图像与数据库图像的每个区域的聚类中心确定查询图像与数据库图像是否匹配。本发明利用对数相对rgb坐标进行图像识别,不同姿态和拍摄角度得到的对数相对rgb坐标分布相似,因而对姿态和拍摄角度的鲁棒性较好,具有姿态和拍摄角度不变性。对数相对rgb坐标是红色分量ri、绿色分量gi对绿色分量为gi的归一化坐标,减小了光照对识别的影响,因而对光照的鲁棒性较好,具有光照强度不变性。对数相对rgb坐标将每个像素点的三维坐标减少到二维,减小了运算复杂度,提高识别速度。实施例一根据对数相对rgb坐标分区域对像素点进行聚类,将一个区域的像素点变为一个聚类中心,减小了偶然误差的影响(即消除杂散点的影响),提高了识别的鲁棒性和抗干扰能力。此外,本发明根据查询图像与数据库图像的每个区域的聚类中心确定查询图像与数据库图像是否匹配,对于聚类中心的计算数据运算量小,运算复杂度低,可以快速得到匹配结果。因此,本发明可以实现快速高鲁棒性高抗干扰性的图像识别。

附图说明

图1是本发明实施例一提供的图像识别方法的流程图。

图2是图像的对数相对rgb坐标分布图。

图3是本发明实施例二提供的图像识别装置的结构图。

图4是本发明实施例三提供的计算机装置的示意图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。

优选地,本发明的图像识别方法应用在一个或者多个计算机装置中。所述计算机装置是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(applicationspecificintegratedcircuit,asic)、可编程门阵列(field-programmablegatearray,fpga)、数字处理器(digitalsignalprocessor,dsp)、嵌入式设备等。

所述计算机装置可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机装置可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

实施例一

图1是本发明实施例一提供的图像识别方法的流程图。所述图像识别方法应用于计算机装置。

如图1所示,所述图像识别方法具体包括以下步骤:

101:对查询图像与数据库图像进行区域划分。

查询图像是需要识别或匹配的图像,数据库图像是预先建立的图像库中的图像。所述图像识别方法是将查询图像与数据库图像进行比较,确定查询图像与数据库图像是否匹配,以确认查询图像中的内容与数据库图像中的内容是否一致。例如,当进行行人识别时,道路上摄像头拍摄到的行人图像为查询图像,交管系统的人像库图像为数据库图像,根据行人图像与人像库图像的相似系数判断行人图像与人像库图像是否匹配。若匹配,则认为行人图像中的人物为人像库图像中的人物;否则,若不匹配,则认为行人图像中的人物非人像库图像中的人物,可以对行人图像和另一张人像库图像进行识别。

数据库图像通常与特定信息(例如个人身份信息)相关联。根据匹配结果,可以获得查询图像的相关信息(例如个人身份信息)。例如,当进行行人识别时,若行人图像与人像库图像匹配,则将人像库图像对应的个人身份信息作为行人图像中人物的个人身份信息。

所述图像识别方法可以应用于各个领域,如视频监控、产品检测、医学诊断等。例如,在交通监控中,可以利用本发明进行行人识别、司机识别、车辆识别等。

对查询图像与数据库图像进行区域划分时,采用相同的划分方法。例如,将查询图像和数据库图像各自划分为上下两个区域或者左右两个区域。

在本实施例中,所述图像识别方法用于人物识别(例如行人识别),查询图像与数据库图像是人物图像,可以将查询图像与数据库图像按照图像中的人物形体各自划分为上下两个区域。上区域对应人物的上半身,下区域对应人物的下半身。例如,将查询图像划分为上区域r1和下区域r2,将数据库图像划分为上区域r1′和下区域r2′。当图像中的人物为直立人物时,由于直立人物的比例大致类似但姿态和动作不同,根据图像中人物的形体进行上下区域的划分会有更高的鲁棒性。同时,最具颜色特征的人物服装通常为上衣下衣,因此将人物图像划分为上下两个区域。

在对人物图像进行两个区域的划分时,可以根据经验值确定划分的位置,例如按照人体上下身的黄金比例进行划分。或者,可以识别人物图像中人物的上装与下装的分界处,从该分界处进行划分。

可以理解,可以以其他方式对查询图像与数据库图像进行区域划分。例如,可以采用金字塔模型对查询图像与数据库图像进行区域划分。

可以将查询图像与数据库图像各自划分为两个区域,也可以将查询图像与数据库图像各自划分为多于两个区域,例如各自划分为三个区域或四个区域。

102:计算查询图像与数据库图像的每个区域的每个像素点的对数相对rgb坐标。

在本实施例中,红色分量为ri、绿色分量为gi、蓝色分量为bi的像素点i的对数相对rgb坐标为(xi,yi),其中可以取以e为底的对数,即或者,可以取以其他值为底的对数,例如取以10为底的对数。

为横轴,为纵轴,可以得到查询图像与数据库图像的对数相对rgb坐标分布图。当本发明图像识别方法用于人物识别时,若人物图像中人物上下身服装颜色差异较大,则人物图像的上区域(对应人物的上半身)的像素点对应的对数相对rgb坐标与人物图像的下区域(对应人物的下半身)的对数相对rgb坐标往往分布在两个不同区域,因而通常会得到两个中心的坐标簇。

图2是图像的对数相对rgb坐标分布图。图2中,图像划分为r1与r2两个区域(例如查询图像划分为上区域r1和下区域r2),其中,20是区域r1的像素点的对数相对rgb坐标分布,21是区域r2的像素点的对数相对rgb坐标分布。

使用rgb色彩空间会受到光照、姿态、拍摄角度的影响,从而造成同一被测物在不同条件下提取的特征不同,影响识别准确性。本发明利用对数相对rgb坐标进行图像识别,不同姿态和拍摄角度得到的对数相对rgb坐标分布非常相似,因而对姿态和拍摄角度的鲁棒性较好,具有姿态和拍摄角度不变性。对数相对rgb坐标是红色分量ri、绿色分量gi对绿色分量为gi的归一化坐标,减小了光照和图像质量对识别的影响,具有光照强度不变性。同时,对数相对rgb坐标以0为中心左右对称,具有较好的对称性和平衡性。此外,对数相对rgb坐标将每个像素点的三维坐标减少到二维,减小了运算复杂度,并使得其分布可以用二维图像来表示,为进一步的聚类提供了可能。

103:根据查询图像与数据库图像的每个区域的每个像素点的对数相对rgb坐标对查询图像与数据库图像的每个区域内的像素点进行聚类,得到查询图像与数据库图像的每个区域的聚类中心。

例如,对查询图像的上区域r1和下区域r2的像素点进行聚类,得到查询图像的上区域r1的聚类中心(x1,y1)和下区域r2的聚类中心(x2,y2);对数据库图像的上区域r1′和下区域r2′的像素点进行聚类,得到查询图像的上区域r1′的聚类中心(x1′,y1′)和下区域r2′的聚类中心(x2′,y2′)。

参阅图2所示,根据区域r1的每个像素点的对数相对rgb坐标对区域r1的像素点进行聚类,得到区域r1的聚类中心22;根据区域r2的每个像素点的对数相对rgb坐标对区域r2的像素点进行聚类,得到区域r2的聚类中心23。

可以使用gmm(gaussianmixturemodel,高斯混合模型)或k-means算法对查询图像与数据库图像的每个区域内的像素点进行聚类,得到查询图像和数据库图像的每个区域的聚类中心。例如,使用聚类中心数为2的高斯混合模型gmm或k-means算法得到查询图像的上区域r1的聚类中心(x1,y1)和下区域r2的聚类中心(x2,y2),得到数据库图像的上区域r1′的聚类中心(x1′,y1′)和下区域r2′的聚类中心(x2′,y2′)。

还可以使用其他的聚类算法对查询图像与数据库图像的每个区域内的像素点进行聚类。例如,使用dbscan(density-basedspatialclusteringofapplicationswithnoise,具有噪声的基于密度的聚类方法)算法对查询图像与数据库图像的每个区域内的像素点进行聚类。

根据对数相对rgb坐标分区域对像素点进行聚类,可以减小了偶然误差的影响(即消除杂散点的影响),提高了识别的鲁棒性和抗干扰能力。

104:根据查询图像与数据库图像的每个区域的聚类中心确定查询图像与数据库图像是否匹配。

例如,当进行行人识别时,根据摄像头拍摄到的行人图像与交管系统的人像库图像的相似系数判断行人图像与人像库图像是否匹配。若匹配,则认为行人图像中的人物为人像库图像中的人物;否则,若不匹配,则认为行人图像中的人物非人像库图像中的人物,可以对行人图像和另一张人像库图像进行识别。

可以计算查询图像与数据库图像对应的每个区域的聚类中心的距离,根据查询图像与数据库图像对应的每个区域的聚类中心的距离确定查询图像与数据库图像是否匹配。

在本实施例中,可以计算查询图像与数据库图像对应的每个区域的聚类中心的欧氏距离,根据查询图像与数据库图像对应的每个区域的聚类中心的欧氏距离确定查询图像与数据库图像是否匹配。例如,查询图像包括上区域r1的聚类中心(x1,y1)和下区域r2的聚类中心(x2,y2),数据库图像包括上区域r1′的聚类中心(x1′,y1′)和下区域r2′的聚类中心(x2′,y2′),计算得到查询图像的上区域r1的聚类中心(x1,y1)与数据库图像的上区域r1′的聚类中心(x1′,y1′)的欧氏距离以及查询图像的下区域r2的聚类中心(x2,y2)与数据库图像的下区域r2′的聚类中心(x2′,y2′)的欧氏距离

或者,可以计算查询图像与数据库图像对应的每个区域的聚类中心的曼哈顿距离(即绝对值距离),根据查询图像与数据库图像对应的每个区域的聚类中心的曼哈顿距离确定查询图像与数据库图像是否匹配。例如,查询图像包括上区域r1的聚类中心(x1,y1)和下区域r2的聚类中心(x2,y2),数据库图像包括上区域r1′的聚类中心(x1′,y1′)和下区域r2′的聚类中心(x2′,y2′),计算得到查询图像的上区域r1的聚类中心(x1,y1)与数据库图像的上区域r1′的聚类中心(x1′,y1′)的曼哈顿距离d1=|x1-x′1|+|y1-y′1|,以及查询图像的下区域r2的聚类中心(x2,y2)与数据库图像的下区域r2′的聚类中心(x2′,y2′)的曼哈顿距离d2=|x2-x′2|+|y2-y′2|。

其他的实施例中,可以计算查询图像与数据库图像对应的每个区域的聚类中心的其他距离,例如马氏距离。

可以对查询图像与数据库图像对应的每个区域的聚类中心的距离进行预设运算,根据运算结果确定查询图像与数据库图像是否匹配。

在一个实施例中,可以计算查询图像与数据库图像对应的每个区域的聚类中心的距离之和(例如d1+d2),判断查询图像与数据库图像对应的每个区域的聚类中心的距离之和是否小于或等于预设距离,若查询图像与数据库图像对应的每个区域的聚类中心的距离之和小于或等于预设距离,则判断查询图像与数据库图像匹配;否则,若查询图像与数据库图像对应的每个区域的聚类中心的距离之和大于预设距离,则判断查询图像与数据库图像不匹配。

或者,可以判断查询图像与数据库图像对应的每个区域的聚类中心的距离之和是否小于查询图像与其他的数据库图像对应的每个区域的聚类中心的距离之和,若查询图像与数据库图像对应的每个区域的聚类中心的距离之和小于查询图像与其他的数据库图像对应的每个区域的聚类中心的距离之和,则判断查询图像与数据库图像匹配;否则,若查询图像与数据库图像的每个区域对应的聚类中心的距离之和不小于查询图像与其他的数据库图像对应的每个区域的聚类中心的距离之和,则判断查询图像与数据库图像不匹配。

在另一实施例中,可以计算查询图像与数据库图像对应的每个区域的聚类中心的平均距离(例如(d1+d2)/2),判断查询图像与数据库图像对应的每个区域的聚类中心的平均距离是否小于或等于预设距离,若查询图像与数据库图像对应的每个区域的聚类中心的平均距离小于或等于预设距离,则判断查询图像与数据库图像匹配;否则,若查询图像与数据库图像对应的每个区域的聚类中心的平均距离大于预设距离,则判断查询图像与数据库图像不匹配。

或者,可以判断查询图像与数据库图像对应的每个区域的聚类中心的平均距离是否小于查询图像与其他的数据库图像对应的每个区域的聚类中心的平均距离,若查询图像与数据库图像对应的每个区域的聚类中心的平均距离小于查询图像与其他的数据库图像对应的每个区域的聚类中心的平均距离,则判断查询图像与数据库图像匹配;否则,若查询图像与数据库图像对应的每个区域的聚类中心的平均距离不小于查询图像与其他的数据库图像对应的每个区域的聚类中心的平均距离,则判断查询图像与数据库图像不匹配。

实施例一的图像识别方法对查询图像与数据库图像进行区域划分;计算查询图像与数据库图像的每个区域的每个像素点的对数相对rgb坐标;根据查询图像与数据库图像的每个区域的每个像素点的对数相对rgb坐标对查询图像与数据库图像的每个区域内的像素点进行聚类,得到查询图像与数据库图像的每个区域的聚类中心;根据查询图像与数据库图像的每个区域的聚类中心确定查询图像与数据库图像是否匹配。实施例一利用对数相对rgb坐标进行图像识别,不同姿态和拍摄角度得到的对数相对rgb坐标分布相似,因而对姿态和拍摄角度的鲁棒性较好,具有姿态和拍摄角度不变性。对数相对rgb坐标是红色分量ri、绿色分量gi对绿色分量为gi的归一化坐标,减小了光照对识别的影响,因而对光照的鲁棒性较好,具有光照强度不变性。对数相对rgb坐标将每个像素点的三维坐标减少到二维,减小了运算复杂度,提高识别速度。实施例一根据对数相对rgb坐标分区域对像素点进行聚类,将每个区域的像素点变换为一个聚类中心,减小了偶然误差的影响(即消除杂散点的影响),提高了识别的鲁棒性和抗干扰能力。此外,实施例一根据查询图像与数据库图像的每个区域的聚类中心确定查询图像与数据库图像是否匹配,对于聚类中心的计算数据运算量小,运算复杂度低,可以快速得到匹配结果。因此,实施例一的图像识别方法可以实现快速高鲁棒性高抗干扰性的图像识别。

实施例二

图3为本发明实施例二提供的图像识别装置的结构图。如图3所示,所述图像识别装置10可以包括:区域划分单元301、坐标计算单元302、聚类单元303、匹配单元304。

区域划分单元301,用于对查询图像与数据库图像进行区域划分。

查询图像是需要识别或匹配的图像,数据库图像是预先建立的图像库中的图像。所述图像识别方法是将查询图像与数据库图像进行比较,确定查询图像与数据库图像是否匹配,以确认查询图像中的内容与数据库图像中的内容是否一致。例如,当进行行人识别时,道路上摄像头拍摄到的行人图像为查询图像,交管系统的人像库图像为数据库图像,根据行人图像与人像库图像的相似系数判断行人图像与人像库图像是否匹配。若匹配,则认为行人图像中的人物为人像库图像中的人物;否则,若不匹配,则认为行人图像中的人物非人像库图像中的人物,可以对行人图像和另一张人像库图像进行识别。

数据库图像通常与特定信息(例如个人身份信息)相关联。根据匹配结果,可以获得查询图像的相关信息(例如个人身份信息)。例如,当进行行人识别时,若行人图像与人像库图像匹配,则将人像库图像对应的个人身份信息作为行人图像中人物的个人身份信息。

所述图像识别方法可以应用于各个领域,如视频监控、产品检测、医学诊断等。例如,在交通监控中,可以利用本发明进行行人识别、司机识别、车辆识别等。

对查询图像与数据库图像进行区域划分时,采用相同的划分方法。例如,将查询图像和数据库图像各自划分为上下两个区域或者左右两个区域。

在本实施例中,所述图像识别方法用于人物识别(例如行人识别),查询图像与数据库图像是人物图像,可以将查询图像与数据库图像按照图像中的人物形体各自划分为上下两个区域。上区域对应人物的上半身,下区域对应人物的下半身。例如,将查询图像划分为上区域r1和下区域r2,将数据库图像划分为上区域r1′和下区域r2′。当图像中的人物为直立人物时,由于直立人物的比例大致类似但姿态和动作不同,根据图像中人物的形体进行上下区域的划分会有更高的鲁棒性。同时,最具颜色特征的人物服装通常为上衣下衣,因此将人物图像划分为上下两个区域。

在对人物图像进行两个区域的划分时,可以根据经验值确定划分的位置,例如按照人体上下身的黄金比例进行划分。或者,可以识别人物图像中人物的上装与下装的分界处,从该分界处进行划分。

可以理解,可以以其他方式对查询图像与数据库图像进行区域划分。例如,可以采用金字塔模型对查询图像与数据库图像进行区域划分。

可以将查询图像与数据库图像各自划分为两个区域,也可以将查询图像与数据库图像各自划分为多于两个区域,例如各自划分为三个区域或四个区域。

坐标计算单元302,用于计算查询图像与数据库图像的每个区域的每个像素点的对数相对rgb坐标。

在本实施例中,红色分量为ri、绿色分量为gi、蓝色分量为bi的像素点i的对数相对rgb坐标为(xi,yi),其中可以取以e为底的对数,即或者,可以取以其他值为底的对数,例如取以10为底的对数。

为横轴,为纵轴,可以得到查询图像与数据库图像的对数相对rgb坐标分布图。当本发明图像识别方法用于人物识别时,若人物图像中人物上下身服装颜色差异较大,则人物图像的上区域(对应人物的上半身)的像素点对应的对数相对rgb坐标与人物图像的下区域(对应人物的下半身)的对数相对rgb坐标往往分布在两个不同区域,因而通常会得到两个中心的坐标簇。

图2是图像的对数相对rgb坐标分布图。图2中,图像划分为r1与r2两个区域(例如查询图像划分为上区域r1和下区域r2),其中,20是区域r1的像素点的对数相对rgb坐标分布,21是区域r2的像素点的对数相对rgb坐标分布。

虽然颜色特征为最具分辨力的特征,但是对照明环境、相机拍摄和空间分布的鲁棒性较差。使用rgb色彩空间会受到光照、拍摄条件的影响,从而造成同一被测物在不同拍摄条件下提取的特征不同,影响识别准确性。本发明利用对数相对rgb坐标进行图像识别,不同姿态和拍摄角度得到的对数相对rgb坐标分布非常相似,因而对姿态和角度的鲁棒性较好,具有拍摄角度不变性。对数相对rgb坐标是红色分量ri、绿色分量gi对绿色分量为gi的归一化坐标,减小了光照和图像质量对识别的影响,具有一定的光照强度不变性。同时,对数相对rgb坐标以0为中心左右对称,具有较好的对称性和平衡性。此外,对数相对rgb坐标将每个像素点的三维坐标减少到二维,减小了运算复杂度,并使得其分布可以用二维图像来表示,因此不需要使用常用的直方图统计图,为进一步的聚类提供了可能。

聚类单元303,用于根据查询图像与数据库图像的每个区域的每个像素点的对数相对rgb坐标对查询图像与数据库图像的每个区域内的像素点进行聚类,得到查询图像与数据库图像的每个区域的聚类中心。

例如,对查询图像的上区域r1和下区域r2的像素点进行聚类,得到查询图像的上区域r1的聚类中心(x1,y1)和下区域r2的聚类中心(x2,y2);对数据库图像的上区域r1′和下区域r2′的像素点进行聚类,得到查询图像的上区域r1′的聚类中心(x1′,y1′)和下区域r2′的聚类中心(x2′,y2′)。

参阅图2所示,根据区域r1的每个像素点的对数相对rgb坐标对区域r1的像素点进行聚类,得到区域r1的聚类中心22;根据区域r2的每个像素点的对数相对rgb坐标对区域r2的像素点进行聚类,得到区域r2的聚类中心23。

可以使用gmm(gaussianmixturemodel,高斯混合模型)或k-means算法对查询图像与数据库图像的每个区域内的像素点进行聚类,得到查询图像和数据库图像的每个区域的聚类中心。例如,使用聚类中心数为2的高斯混合模型gmm或k-means算法得到查询图像的上区域r1的聚类中心(x1,y1)和下区域r2的聚类中心(x2,y2),得到数据库图像的上区域r1′的聚类中心(x1′,y1′)和下区域r2′的聚类中心(x2′,y2′)。

还可以使用其他的聚类算法对查询图像与数据库图像的每个区域内的像素点进行聚类。例如,使用dbscan(density-basedspatialclusteringofapplicationswithnoise,具有噪声的基于密度的聚类方法)算法对查询图像与数据库图像的每个区域内的像素点进行聚类。

根据对数相对rgb坐标分区域对像素点进行聚类,可以减小了偶然误差的影响(即消除杂散点的影响),提高了识别的鲁棒性和抗干扰能力。

匹配单元304,用于根据查询图像与数据库图像的每个区域的聚类中心确定查询图像与数据库图像是否匹配。

例如,当进行行人识别时,根据摄像头拍摄到的行人图像与交管系统的人像库图像的相似系数判断行人图像与人像库图像是否匹配。若匹配,则认为行人图像中的人物为人像库图像中的人物;否则,若不匹配,则认为行人图像中的人物非人像库图像中的人物,可以对行人图像和另一张人像库图像进行识别。

可以计算查询图像与数据库图像对应的每个区域的聚类中心的距离,根据查询图像与数据库图像对应的每个区域的聚类中心的距离确定查询图像与数据库图像是否匹配。

在本实施例中,可以计算查询图像与数据库图像对应的每个区域的聚类中心的欧氏距离,根据查询图像与数据库图像对应的每个区域的聚类中心的欧氏距离确定查询图像与数据库图像是否匹配。例如,查询图像包括上区域r1的聚类中心(x1,y1)和下区域r2的聚类中心(x2,y2),数据库图像包括上区域r1′的聚类中心(x1′,y1′)和下区域r2′的聚类中心(x2′,y2′),计算得到查询图像的上区域r1的聚类中心(x1,y1)与数据库图像的上区域r1′的聚类中心(x1′,y1′)的欧氏距离以及查询图像的下区域r2的聚类中心(x2,y2)与数据库图像的下区域r2′的聚类中心(x2′,y2′)的欧氏距离

或者,可以计算查询图像与数据库图像对应的每个区域的聚类中心的曼哈顿距离(即绝对值距离),根据查询图像与数据库图像对应的每个区域的聚类中心的曼哈顿距离确定查询图像与数据库图像是否匹配。例如,查询图像包括上区域r1的聚类中心(x1,y1)和下区域r2的聚类中心(x2,y2),数据库图像包括上区域r1′的聚类中心(x1′,y1′)和下区域r2′的聚类中心(x2′,y2′),计算得到查询图像的上区域r1的聚类中心(x1,y1)与数据库图像的上区域r1′的聚类中心(x1′,y1′)的曼哈顿距离d1=|x1-x′1|+|y1-y′1|,以及查询图像的下区域r2的聚类中心(x2,y2)与数据库图像的下区域r2′的聚类中心(x2′,y2′)的曼哈顿距离d2=|x2-x′2|+|y2-y′2|。

其他的实施例中,可以计算查询图像与数据库图像对应的每个区域的聚类中心的其他距离,例如马氏距离。

可以对查询图像与数据库图像对应的每个区域的聚类中心的距离进行预设运算,根据运算结果确定查询图像与数据库图像是否匹配。

在一个实施例中,可以计算查询图像与数据库图像对应的每个区域的聚类中心的距离之和(例如d1+d2),判断查询图像与数据库图像对应的每个区域的聚类中心的距离之和是否小于或等于预设距离,若查询图像与数据库图像对应的每个区域的聚类中心的距离之和小于或等于预设距离,则判断查询图像与数据库图像匹配;否则,若查询图像与数据库图像对应的每个区域的聚类中心的距离之和大于预设距离,则判断查询图像与数据库图像不匹配。

或者,可以判断查询图像与数据库图像对应的每个区域的聚类中心的距离之和是否小于查询图像与其他的数据库图像对应的每个区域的聚类中心的距离之和,若查询图像与数据库图像对应的每个区域的聚类中心的距离之和小于查询图像与其他的数据库图像对应的每个区域的聚类中心的距离之和,则判断查询图像与数据库图像匹配;否则,若查询图像与数据库图像的每个区域对应的聚类中心的距离之和不小于查询图像与其他的数据库图像对应的每个区域的聚类中心的距离之和,则判断查询图像与数据库图像不匹配。

在另一实施例中,可以计算查询图像与数据库图像对应的每个区域的聚类中心的平均距离(例如(d1+d2)/2),判断查询图像与数据库图像对应的每个区域的聚类中心的平均距离是否小于或等于预设距离,若查询图像与数据库图像对应的每个区域的聚类中心的平均距离小于或等于预设距离,则判断查询图像与数据库图像匹配;否则,若查询图像与数据库图像对应的每个区域的聚类中心的平均距离大于预设距离,则判断查询图像与数据库图像不匹配。

或者,可以判断查询图像与数据库图像对应的每个区域的聚类中心的平均距离是否小于查询图像与其他的数据库图像对应的每个区域的聚类中心的平均距离,若查询图像与数据库图像对应的每个区域的聚类中心的平均距离小于查询图像与其他的数据库图像对应的每个区域的聚类中心的平均距离,则判断查询图像与数据库图像匹配;否则,若查询图像与数据库图像对应的每个区域的聚类中心的平均距离不小于查询图像与其他的数据库图像对应的每个区域的聚类中心的平均距离,则判断查询图像与数据库图像不匹配。

实施例二的图像识别装置对查询图像与数据库图像进行区域划分;计算查询图像与数据库图像的每个区域的每个像素点的对数相对rgb坐标;根据查询图像与数据库图像的每个区域的每个像素点的对数相对rgb坐标对查询图像与数据库图像的每个区域内的像素点进行聚类,得到查询图像与数据库图像的每个区域的聚类中心;根据查询图像与数据库图像的每个区域的聚类中心确定查询图像与数据库图像是否匹配。实施例二利用对数相对rgb坐标进行图像识别,不同姿态和拍摄角度得到的对数相对rgb坐标分布相似,因而对姿态和拍摄角度的鲁棒性较好,具有姿态和拍摄角度不变性。对数相对rgb坐标是红色分量ri、绿色分量gi对绿色分量为gi的归一化坐标,减小了光照对识别的影响,因而对光照的鲁棒性较好,具有光照强度不变性。对数相对rgb坐标将每个像素点的三维坐标减少到二维,减小了运算复杂度,提高识别速度。实施例二根据对数相对rgb坐标分区域对像素点进行聚类,将每个区域的像素点变换为一个聚类中心,减小了偶然误差的影响(即消除杂散点的影响),提高了识别的鲁棒性和抗干扰能力。此外,实施例一根据查询图像与数据库图像的每个区域的聚类中心确定查询图像与数据库图像是否匹配,对于聚类中心的计算数据运算量小,运算复杂度低,可以快速得到匹配结果。因此,实施例二的图像识别方法可以实现快速高鲁棒性高抗干扰性的图像识别。

实施例三

图4为本发明实施例三提供的计算机装置的示意图。所述计算机装置1包括存储器20、处理器30以及存储在所述存储器20中并可在所述处理器30上运行的计算机程序40,例如图像识别程序。所述处理器30执行所述计算机程序40时实现上述图像识别方法实施例中的步骤,例如图1所示的步骤101~104。或者,所述处理器30执行所述计算机程序40时实现上述装置实施例中各模块/单元的功能,例如图3中的单元301~304。

示例性的,所述计算机程序40可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器20中,并由所述处理器30执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序40在所述计算机装置1中的执行过程。例如,所述计算机程序40可以被分割成图3中的区域划分单元301、坐标计算单元302、聚类单元303、匹配单元304,各单元具体功能参见实施例二。

所述计算机装置1可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。本领域技术人员可以理解,所述示意图4仅仅是计算机装置1的示例,并不构成对计算机装置1的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述计算机装置1还可以包括输入输出设备、网络接入设备、总线等。

所称处理器30可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器30也可以是任何常规的处理器等,所述处理器30是所述计算机装置1的控制中心,利用各种接口和线路连接整个计算机装置1的各个部分。

所述存储器20可用于存储所述计算机程序40和/或模块/单元,所述处理器30通过运行或执行存储在所述存储器20内的计算机程序和/或模块/单元,以及调用存储在存储器20内的数据,实现所述计算机装置1的各种功能。所述存储器20可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机装置1的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器20可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

所述计算机装置1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。

在本发明所提供的几个实施例中,应该理解到,所揭露的计算机装置和方法,可以通过其它的方式实现。例如,以上所描述的计算机装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

另外,在本发明各个实施例中的各功能单元可以集成在相同处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在相同单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。计算机装置权利要求中陈述的多个单元或计算机装置也可以由同一个单元或计算机装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1