一种识别目标图片的设备、方法以及计算设备的制作方法

文档序号:6630942阅读:160来源:国知局
一种识别目标图片的设备、方法以及计算设备的制作方法
【专利摘要】本发明公开了一种识别目标图片的设备,该设备包括:数据存储单元,适于存储目标图片集合;相似度计算单元,适于计算待识别图片与目标图片集合中目标图片的相似度;目标图片识别单元,适于当待识别图片与目标图片集合中某个目标图片的相似度大于等于第一门限时,确定待识别图片为第一类型目标图片;当待识别图片与目标图片集合中所有目标图片的相似度均小于第一门限,且待识别图片与目标图片集合中至少一个目标图片的相似度大于等于第二门限时,确定待识别图片为第二类型目标图片;数据更新单元,适于将确定为第二类型目标图片的待识别图片添加到目标图片集合中。本发明还公开了对应的识别目标图片的方法以及包括该识别目标图片的设备的计算设备。
【专利说明】一种识别目标图片的设备、方法以及计算设备

【技术领域】
[0001] 本发明涉及图片检测【技术领域】,具体涉及一种识别目标图片的设备、方法以及计 算设备。

【背景技术】
[0002] 在网络中很多类型的资源站点上,都会出现一些广告图片,这些广告图片的种类 非常丰富,其包括各类商品的广告和实体商店的广告,以及一些其他类型的广告。这些广告 图片不但会出现在商家的站点上,也会出现在其他资源站点的页面上。例如,在允许用户上 传图片的社区(论坛、图片站等),会有一些用户上传广告图片。大量广告图片的存在,往往 对用户造成干扰,甚至用户进行图片搜索时,也会出现与用户需求无关的广告图片。因此, 需要一种能够识别图片是否属于广告图片的技术,并对识别出的广告图片进行针对性的处 理,从而提商网站浏览内容的质量。
[0003] 在进行广告图片识别时,通常会预先设置一个广告图片库,然后将待识别图片与 广告图片库中的图片进行匹配,根据匹配结果来确定待识别图片与广告图片的相识度,进 而确定待识别图片是否为广告图片。
[0004] 而对于广告图片库的处理,现有技术提供了两种方式。在一种实现方式中,广告图 片库的规模是固定的,新识别出的广告图片不会更新到广告图片库中,广告图片库得不到 及时的更新,这有可能会导致后续对广告图片的漏检。在另外一种实现方式中,将新识别出 的所有广告图片都更新到广告图片库中,这会使得广告图片库中存在冗余的图片,并会使 得广告图片库的规模越来越大,导致后续进行匹配时计算量太大。


【发明内容】

[0005] 鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上 述问题的识别目标图片的设备、方法以及计算设备。
[0006] 根据本发明的一个方面,提供了一种识别目标图片的设备,驻留在计算设备中,该 识别目标图片的设备包括:数据存储单元,适于存储目标图片集合,所述目标图片集合中包 括一个或多个目标图片;相似度计算单元,适于计算待识别图片与目标图片集合中目标图 片的相似度;目标图片识别单元,适于当相似度计算单元计算出待识别图片与目标图片集 合中某个目标图片的相似度大于等于预设的第一门限时,确定所述待识别图片为第一类型 目标图片;当相似度计算单元计算出待识别图片与目标图片集合中所有目标图片的相似度 均小于第一门限,且待识别图片与目标图片集合中至少一个目标图片的相似度大于等于预 设的第二门限时,确定所述待识别图片为第二类型目标图片;数据更新单元,适于将确定为 第二类型目标图片的待识别图片添加到目标图片集合中。
[0007] 可选地,在根据本发明的识别目标图片的设备中,所述目标图片识别单元还适于, 当相似度计算单元计算出待识别图片与目标图片集合中某个目标图片的相似度大于等于 第一门限时,通知相似度计算单元停止进行相似度计算。
[0008] 可选地,在根据本发明的识别目标图片的设备中,所述目标图片识别单元还适于, 当相似度计算单元计算出待识别图片与目标图片集合中所有目标图片的相似度均小于第 二门限时,将该待识别图片标识为未知图片;所述数据更新单元还适于,获取人工对一个或 多个未知图片的识别结果,当所述识别结果表明未知图片为目标图片时,将该未知图片添 加到目标图片集合中。
[0009] 可选地,在根据本发明的识别目标图片的设备中,所述数据更新单元将该未知图 片添加到目标图片集合之前,通知相似度计算单元计算该未知图片与目标图片集合中目标 图片的相似度,当相似度计算单元计算出未知图片与目标图片集合中某个目标图片的相似 度大于等于第一门限时,不将该未知图片添加到目标图片集合中。
[0010] 可选地,在根据本发明的识别目标图片的设备中,所述目标图片集合中包括的目 标图片为该目标图片的特征值集;所述相似度计算单元进一步适于,计算待识别图片的特 征值集,根据待识别图片的特征值集与目标图片集合中目标图片的特征值集进行匹配,并 根据特征值匹配对数量来确定待识别图片与目标图片的相似度。
[0011] 可选地,在根据本发明的识别目标图片的设备中,图片的特征值集是通过仿射尺 度不变特征变换ASIFT算法计算得到,且所述特征值集中的每个特征值包括特征点的位置 信息、尺度信息、方向信息和特征向量信息。
[0012] 根据本发明的另一方面,提供了一种计算设备,该计算设备包括根据本发明的识 别目标图片的设备。
[0013] 根据本发明的又一方面,提供了一种识别目标图片的方法,由计算设备执行,该识 别目标图片的方法包括:计算待识别图片与目标图片集合中目标图片的相似度,其中所述 目标图片集合中包括一个或多个目标图片;当计算出待识别图片与目标图片集合中某个目 标图片的相似度大于等于预设的第一门限时,确定所述待识别图片为第一类型目标图片; 当计算出待识别图片与目标图片集合中所有目标图片的相似度均小于第一门限,且待识别 图片与目标图片集合中至少一个目标图片的相似度大于等于预设的第二门限时,确定所述 待识别图片为第二类型目标图片;将确定为第二类型目标图片的待识别图片添加到目标图 片集合中。
[0014] 可选地,在根据本发明的识别目标图片的方法中,当计算出待识别图片与目标图 片集合中某个目标图片的相似度大于等于第一门限时,停止进行相似度计算。
[0015] 可选地,在根据本发明的识别目标图片的方法中,还包括:当计算出待识别图片与 目标图片集合中所有目标图片的相似度均小于第二门限时,将该待识别图片标识为未知图 片;获取人工对一个或多个未知图片的识别结果,当所述识别结果表明未知图片为目标图 片时,将该未知图片添加到目标图片集合中。
[0016] 可选地,在根据本发明的识别目标图片的方法中,在将该未知图片添加到目标图 片集合之前,计算该未知图片与目标图片集合中目标图片的相似度,当计算出未知图片与 目标图片集合中某个目标图片的相似度大于等于第一门限时,不将该未知图片添加到目标 图片集合中。
[0017] 可选地,在根据本发明的识别目标图片的方法中,所述目标图片集合中包括的目 标图片为该目标图片的特征值集;所述计算待识别图片与目标图片集合中目标图片的相似 度包括:计算待识别图片的特征值集,根据待识别图片的特征值集与目标图片集合中目标 图片的特征值集进行匹配,并根据特征值匹配对数量来确定待识别图片与目标图片的相似 度。
[0018] 可选地,在根据本发明的识别目标图片的方法中,图片的特征值集是通过仿射尺 度不变特征变换ASIFT算法计算得到,且所述特征值集中的每个特征值包括特征点的位置 信息、尺度信息、方向信息和特征向量信息。
[0019] 根据本发明的识别目标图片的方案,预先设置两个门限,当待识别图片与目标图 片集合中某个目标图片的相似度大于等于预设的第一门限时,确定所述待识别图片为第一 类型目标图片,不将该待识别图片添加到目标图片集合中;当待识别图片与目标图片集合 中所有目标图片的相似度均小于第一门限,且待识别图片与目标图片集合中至少一个目标 图片的相似度大于等于预设的第二门限时,确定所述待识别图片为第二类型目标图片,并 将该待识别图片添加到目标图片集合中。这样,目标图片集合既能够得到有效更新,又不至 于存在重复的项目,从而保证目标图片集合是完备且不冗余的,一方面提高了目标图片识 别的准确度,另一方面降低了目标图片识别的计算量。
[0020] 上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段, 而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够 更明显易懂,以下特举本发明的【具体实施方式】。

【专利附图】

【附图说明】
[0021] 通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通 技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明 的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0022] 图1示出了根据本发明一个实施例的识别目标图片的设备的结构图;
[0023] 图2示出了根据本发明一个实施例的识别目标图片的方法的流程图;以及
[0024] 图3示出了布置为实现根据本发明的识别目标图片的方法的示例计算设备的框 图。

【具体实施方式】
[0025] 下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开 的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例 所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围 完整的传达给本领域的技术人员。
[0026] 图1示出了根据本发明一个实施例的识别目标图片的设备100的结构图。识别目 标图片的设备1〇〇驻留在计算设备中。参照图1,识别目标图片的设备1〇〇包括数据存储单 元110、相似度计算单元120、目标图片识别单元130和数据更新单元140。
[0027] 数据存储单元110适于存储目标图片集合。该目标图片集合中包括一个或多个目 标图片。根据识别对象的不同,目标图片集合中的目标图片可以是广告图片、不良图片(例 如色情图片)或者其他需要识别的任何图片类型。
[0028] 初始化时,可以将已有(或者已知)的目标图片加入到目标图片集合中,并由数据 存储单元110进行存储。后续,根据设备100对待识别图片的识别结果,由数据更新单元 140对目标图片集合进行更新。
[0029] 根据本发明的一个实施方式,在进行两张图片的相似判断时,可以先利用预定的 图片识别算法获取这两张图片各自的特征值集,然后进行特征值匹配,并根据特征值匹配 的结果来判断二者的相似度。因此,在一种实现方式中,数据存储单元110可以不存储原图 片,而是存储该图片的特征值集,即目标图片集合中包括的目标图片为该目标图片的特征 值集。
[0030] 当前已有许多比较成熟的相似图片识别算法,例如颜色分布算法、内容分布算法、 平均哈希算法(averagehash,ahash)、感知哈希算法(perceptualhash,phash)、尺度不变 特征变换算法(Scale-invariantfeaturetransform,sift)、仿射尺度不变特征变换算法 (AffineScale-invariantfeaturetransform,asift)等等。
[0031] 基于颜色分布法和内容分布法的图片识别算法,主要是用矩阵来表示颜色分布或 内容分布的特征值,然后对特征矩阵进行相似度计算。基于颜色分布法和内容分布法的图 片识别算法可以用于发现原图的缩放图。
[0032] 平均哈希算法主要通过缩小图片、简化色彩、计算像素的灰度平均值并量化像素 的灰度来生成哈希值,然后通过计算哈希值的汉明距离来判断图片的相识度。感知哈希算 法主要是通过离散余弦变换求得图片的哈希值,然后通过计算哈希值的汉明距离来判断图 片的相识度。平均哈希算法适用于识别亮度、对比度或颜色发生变化的图片相似识别场景。 感知哈希算法也能实现平均哈希算法的功能,同时还能应用于经过伽马矫正和颜色直方图 处理的相似图片识别。
[0033]sift和asift算法主要是通过提取图片的特征值集并进行比对,然后根据特征值 匹配对数量判定图片相似与否。asift算法不仅能完成图片缩放、亮度变化、对比度变化、伽 马矫正、颜色直方图处理的图片相似识别,还适用于经过旋转或倾斜等非常规处理的变种 图片和原图的相似识别。
[0034] 当采用sift或者asift算法时,图片的特征值集中的每个特征值包括特征点的位 置信息(横坐标X、纵坐标y)、尺度信息(scale)、方向信息(orientation)和特征向量信息 (vec[128],是一个用于描述特征点的临近范围梯度方向直方图数组)。例如从图片中提取 了一个特征点,其特征值为{x= 13. 5,y= 25. 4,scale= 12. 7,angle= 36. 5,vec[128] ={11,230, 32,……}}。另外,在asift算法中,还会生成原图片的多张仿射图片。在本 发明实施例中,可以将目标图片的原图及其多个仿射图的所有特征值作为该目标图片的特 征值集进行存储,即一个目标图片的特征值集中即包括原图的所有特征值,又包括每个仿 射图的所有特征值。
[0035] 需要说明的是,本发明实施例对具体的图片识别算法不做限制,本领域技术人员 可以根据需要进行合理选择。
[0036] 相似度计算单元120适于计算待识别图片与目标图片集合中目标图片的相似度。 当目标图片集合中包括的目标图片为该目标图片的特征值集时,相似度计算单元120可以 先计算待识别图片的特征值集,然后将待识别图片的特征值集与目标图片集合中目标图片 的特征值集进行匹配,并根据特征值匹配对数量来确定待识别图片与目标图片的相似度。 当然,如果目标图片集合中包括的目标图片是该目标图片自身,也可以采用预定图片识别 算法来计算待识别图片与目标图片的相似度。
[0037] 由于目标图片集合中通常会存在多张目标图片,则相似度计算单元120可以按照 预定顺序从目标图片集合中取出目标图片,并采用预定图片识别算法对待识别图片与取出 的目标图片进行相似度计算。并且,可以根据目标图片识别单元130的识别结果来确定何 时停止相似度计算。
[0038] 以采用asift算法为例,图片的特征值集中的每个特征值包括特征点的位置信 息、尺度信息、方向信息和特征向量信息。在一种实现方式中,可以根据待识别图片中各特 征点与目标图片中各特征点的特征向量信息,分别计算位于两张图片中的两个特征点的特 征向量距离,如果所述的特征向量距离满足预设值则判断上述两个特征点相匹配,为一个 特征值匹配对;在所有特征点的特征向量距离计算和判断完成后,得到两张图片的特征值 匹配对数量。在另外一种实现方式中,还可以先根据特征点的位置信息、尺度信息和/或方 向信息进行初步计算,在初步计算结果满足预设条件后,再进行上述的特征向量距离计算 和判断。通过上述计算得到待识别图片与目标图片的特征值匹配对数量之后,可以将该特 征值匹配对数量作为待识别图片与目标图片的相似度;也可以对该特征值匹配对数量进行 归一化处理(例如将特征值匹配对数量除以一预设值),将归一化处理结果作为待识别图 片与目标图片的相似度。
[0039] 目标图片识别单元130根据相似度计算单元120计算出的待识别图片与目标图片 集合中各目标图片的相似度,来确定待识别图片是否为目标图片。当相似度计算单元120 计算出待识别图片与目标图片集合中某个目标图片的相似度大于等于预设的第一门限时, 确定待识别图片为第一类型目标图片(深度相似图片);当相似度计算单元120计算出待 识别图片与目标图片集合中所有目标图片的相似度均小于第一门限,且待识别图片与目标 图片集合中至少一个目标图片的相似度大于等于预设的第二门限时,确定待识别图片为第 二类型目标图片(轻度相似图片)。
[0040] 其中,第一门限和第二门限可以根据经验或者实验确定。在一个具体实验中,实验 的数据源是从企业网站随机下载的1000张图片,以及一个由100张广告图片组成的广告图 片库。由设备100进行广告图片识别,并经过人工验证后,得到的统计结果如下表所示:
[0041]

【权利要求】
1. 一种识别目标图片的设备,驻留在计算设备中,该识别目标图片的设备包括: 数据存储单元,适于存储目标图片集合,所述目标图片集合中包括一个或多个目标图 片; 相似度计算单元,适于计算待识别图片与目标图片集合中目标图片的相似度; 目标图片识别单元,适于当相似度计算单元计算出待识别图片与目标图片集合中某 个目标图片的相似度大于等于预设的第一门限时,确定所述待识别图片为第一类型目标图 片;当相似度计算单元计算出待识别图片与目标图片集合中所有目标图片的相似度均小于 第一门限,且待识别图片与目标图片集合中至少一个目标图片的相似度大于等于预设的第 二门限时,确定所述待识别图片为第二类型目标图片;以及 数据更新单元,适于将确定为第二类型目标图片的待识别图片添加到目标图片集合 中。
2. 如权利要求1所述的识别目标图片的设备,其中,所述目标图片识别单元还适于,当 相似度计算单元计算出待识别图片与目标图片集合中某个目标图片的相似度大于等于第 一门限时,通知相似度计算单元停止进行相似度计算。
3. 如权利要求1或2所述的识别目标图片的设备,其中,所述目标图片识别单元还适 于,当相似度计算单元计算出待识别图片与目标图片集合中所有目标图片的相似度均小于 第二门限时,将该待识别图片标识为未知图片; 所述数据更新单元还适于,获取人工对一个或多个未知图片的识别结果,当所述识别 结果表明未知图片为目标图片时,将该未知图片添加到目标图片集合中。
4. 如权利要求3所述的识别目标图片的设备,其中,所述数据更新单元将该未知图片 添加到目标图片集合之前,通知相似度计算单元计算该未知图片与目标图片集合中目标图 片的相似度,当相似度计算单元计算出未知图片与目标图片集合中某个目标图片的相似度 大于等于第一门限时,不将该未知图片添加到目标图片集合中。
5. 如权利要求1所述的识别目标图片的设备,其中,所述目标图片集合中包括的目标 图片为该目标图片的特征值集; 所述相似度计算单元进一步适于,计算待识别图片的特征值集,根据待识别图片的特 征值集与目标图片集合中目标图片的特征值集进行匹配,并根据特征值匹配对数量来确定 待识别图片与目标图片的相似度。
6. 如权利要求5所述的识别目标图片的设备,其中,图片的特征值集是通过仿射尺度 不变特征变换ASIFT算法计算得到,且所述特征值集中的每个特征值包括特征点的位置信 息、尺度信息、方向信息和特征向量信息。
7. -种计算设备,包括如权利要求1至6中任一项所述的识别目标图片的设备。
8. -种识别目标图片的方法,由计算设备执行,该识别目标图片的方法包括: 计算待识别图片与目标图片集合中目标图片的相似度,其中所述目标图片集合中包括 一个或多个目标图片; 当计算出待识别图片与目标图片集合中某个目标图片的相似度大于等于预设的第一 门限时,确定所述待识别图片为第一类型目标图片;当计算出待识别图片与目标图片集合 中所有目标图片的相似度均小于第一门限,且待识别图片与目标图片集合中至少一个目标 图片的相似度大于等于预设的第二门限时,确定所述待识别图片为第二类型目标图片;以 及 将确定为第二类型目标图片的待识别图片添加到目标图片集合中。
9. 如权利要求8所述的识别目标图片的方法,其中,当计算出待识别图片与目标图片 集合中某个目标图片的相似度大于等于第一门限时,停止进行相似度计算。
10. 如权利要求8或9所述的识别目标图片的方法,还包括:当计算出待识别图片与 目标图片集合中所有目标图片的相似度均小于第二门限时,将该待识别图片标识为未知图 片;以及 获取人工对一个或多个未知图片的识别结果,当所述识别结果表明未知图片为目标图 片时,将该未知图片添加到目标图片集合中。
【文档编号】G06K9/64GK104318259SQ201410559532
【公开日】2015年1月28日 申请日期:2014年10月20日 优先权日:2014年10月20日
【发明者】裴育 申请人:北京齐尔布莱特科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1