相似图片检索系统及方法

文档序号:6472349阅读:218来源:国知局
专利名称:相似图片检索系统及方法
技术领域
本发明涉及一种图片处理系统及方法,特别是关于一种相似图片检索系统及方法。
背景技术
随着数码技术的发展,图片越来越多地应用于生产生活的各个方面,成为一种重要的信 息财富。各种以图片服务为主的软件、网站,甚至机构应运而生。管理及维护图片需要耗费 大量的时间,而且常常会遇到重复图片的问题。传统的文件系统只对图片的名称以及一些描 述信息进行记录,而无法知道图片本身的内容。内容完全相同的图片,可能因为名称不同, 因而在数据库中被认为是不同的图片。过多重复的图片导致数据库的运作效率低下,而且很 大程度造成资源的浪费。
现有的图片检索技术主要采取逐行扫描进行对比,或者提取整张图片的哈希码进行对比 。上述两种图片检索方式的査找结果精确,然而处理速度缓慢,如果需要在成千上万的图片 中寻找相似图片,显然不可行。此外上述方式的抗干扰性差,两张图片只要存在细微差别, 将被认为是不同的图片,无法达到査找相似图片的目的。

发明内容
鉴于以上内容,有必要提供一种相似图片检索系统,能够快速准确地査找相似图片。 此外,还有必要提供一种相似图片检索方法,能够快速准确地査找相似图片。 一种相似图片检索系统,运行于计算机中,所述计算机包括用于存储现有图片的图片存 储区,该系统包括接收模块,用于接收用户指定的源图片;设置模块,用于设置相似图片 检索的相似度,所述相似度包括粗略检索相似度;及粗略检索模块,用于对源图片和现有图 片提取粗略特征,并根据设置的粗略检索相似度比较源图片和现有图片的粗略特征,査找粗 略相似图片。
一种相似图片检索方法,该方法包括步骤接收模块,用于接收用户指定的源图片;设 置模块,用于设置相似图片检索的相似度,所述相似度包括粗略检索相似度;及粗略检索模 块,用于对源图片和现有图片提取粗略特征,并根据设置的粗略检索相似度比较源图片和现 有图片的粗略特征,査找粗略相似图片。
本发明采用逐级检索的方式査找相似图片,检索速度快且具有较高的抗干扰性。


图l为本发明相似图片检索系统较佳实施例的运行环境架构图。
图2为本发明相似图片检索方法较佳实施例的流程图。
具体实施例方式
相似图片是指在颜色、轮廓、布局等方面相似或相同的图片。
参阅图1所示,是本发明相似图片检索系统较佳实施例的运行环境架构图。所述相似图 片检索系统10运行于计算机1中,该计算机l包括用于存储现有图片的图片存储区ll。该系统 包括接收模块100、设置模块101、粗略检索模块102、抗干扰性检索模块103、精确检索模 块104及显示模块105。
所述接收模块100用于接收用户指定的源图片。
所述设置模块101用于设置相似图片检索的相似度,所述相似度包括粗略检索相似度、 抗干扰性检索相似度及精确检索相似度。例如,粗略检索相似度为80%,抗干扰性检索相似 度为75%,精确检索相似度为90%。
所述粗略检索模块102用于对源图片和现有图片提取粗略特征,并根据设置的粗略检索 相似度比较源图片和现有图片的粗略特征,査找粗略相似图片。在本较佳实施例中,粗略检 索模块102对源图片和现有图片以网格为单位提取粗略特征。例如,将图片的长和宽10等分 ,整张图片划分为10X10400个网格,每张图片划分的网格个数称为网格总数。将每个网格 的颜色总数、最多颜色点的RGB值,最少颜色点的RGB值用"I"连接为一个字符串,以该字 符串作为该网格的粗略特征,即粗略特征为颜色总数I最多颜色点的RGB值I最少颜色点的 RBG值。通常一个RGB值由三个字节组成,分别代表红(R)、绿(G)、蓝(B)的颜色强度 。例如,FFOOOO表示红色,FFFFFF表示白色。粗略检索模块102根据设置的粗略检索相似度 依次比较源图片和现有图片各个网格的粗略特征。例如,粗略检索相似度为80%,网格总数 为100,若粗略特征相同的网格个数达到网格总数的80%,即粗略特征相同的网格个数为80, 则该现有图片是粗略相似图片。还可以进一步判定若图片的一个网格的颜色总数、最多颜 色点的RGB值及最少颜色点的RBG值分别达到源图片相应网格的颜色总数、最多颜色点的RGB 值及最少颜色点的RBG值的80。/。,则为粗略特征相同的网格。
所述抗干扰性检索模块103用于对源图片和査找的粗略相似图片提取抗干扰性特征,根 据设置的抗干扰性检索相似度比较源图片和粗略相似图片的抗干扰性特征,査找抗干扰性相 似图片。抗干扰性特征可以包括旋转角度不敏感数据,宽高比例不敏感数据、偏色不敏感数 据和整体轮廓数据。所述旋转角度不敏感数据用来抗旋转、镜像,该数据可以是图片的面积 及图片的同心圆信息。所述宽高比例不敏感数据用来抗縮放、比例失真,该数据可以是各个网格的像素数量及各个网格的颜色的比例。所述偏色不敏感数据用来抗偏色、过曝、欠曝, 该数据可以是图片的二值化信息。所述整体轮廓数据用来抗加边、模糊、噪点、水印,该数 据可以是图像的边缘。可以先将源图片和粗略相似图片进行二值化处理,然后得到上述抗干 扰性特征。二值化是指使得整张图片只包含两种颜色,例如只包含黑和白两种颜色。根据抗 干扰性特征判断是否为抗干扰性相似图片时,若其中一项抗干扰性特征(例如旋转角度不敏 感数据、宽高比例不敏感数据、偏色不敏感数据或者整体轮廓数据)符合抗干扰性检索相似 度的要求,则该图片是抗干扰性相似图片。以宽高比例不敏感数据为例,假设抗干扰性检索 相似度为75%,若网格的像素数量及网格的颜色比例相同的网格个数达到网格总数的75%,则 该粗略相似图片是抗干扰性相似图片。
所述精确检索模块104用于对源图片和査找的抗干扰性相似图片提取哈希(Hash)码, 并且根据精确检索相似度比较源图片和抗干扰性相似图片的Hash码,査找精确相似图片。一 张图片的Hash码为一个字符串,比较两张图片的Hash码就是依次比较两个字符串的各个字符 。例如,精确检索相似度为90%,依次比较源图片及抗干扰性图片的Hash码的各个字符,若 相同字符个数超过源图片Hash码字符个数的90%,则该抗干扰性图片为精确相似图片。
所述显示模块105用于将精确相似图片显示出来。
参阅图2所示,是本发明相似图片检索方法较佳实施例的流程图。
步骤S201,接收模块100接收用户指定的源图片。
步骤S202,设置模块101设置相似图片检索的相似度。所述相似度包括粗略检索相似度 、抗干扰性检索相似度及精确检索相似度。例如,粗略检索相似度为80%,抗干扰性检索相 似度为75%,精确检索相似度为90%。
步骤S203,粗略检索模块102对源图片和现有图片提取粗略特征。在本较佳实施例中, 粗略检索模块102对源图片和现有图片以网格为单位提取粗略特征。例如,将图片的长和宽 IO等分,整张图片划分为10X10400个网格, 一张图片划分的网格个数称为网格总数。将每 个网格的颜色总数、最多颜色点的RGB值,最少颜色点的RGB值用"l"连接为一个字符串, 以该字符串作为该网格的粗略特征,即粗略特征为颜色总数I最多颜色点的RGB值I最少颜 色点的RBG值。通常一个RGB值由三个字节组成,分别代表红(R)、绿(G)、蓝(B)的颜 色强度。例如,FFOOOO表示红色,FFFFFF表示白色。
步骤S204,粗略检索模块102根据设置的粗略检索相似度比较源图片和现有图片的粗略 特征,査找粗略相似图片。在本较佳实施例中,粗略检索模块102根据设置的粗略检索相似 度依次比较源图片和现有图片各个网格的粗略特征。例如,粗略检索相似度为80%,网格总数为100,若粗略特征相同的网格个数达到网格总数的80%,即粗略特征相同的网格个数为 80,则该现有图片是粗略相似图片。还可以进一步判定若图片的一个网格的颜色总数、最 多颜色点的RGB值及最少颜色点的RBG值分别达到源图片相应网格的颜色总数、最多颜色点的 RGB值及最少颜色点的RBG值的80。/。,则为粗略特征相同的网格。若该步骤中未査找到粗略相 似图片,则提示用户并结束流程。
步骤S205,抗干扰性检索模块103对源图片和査找的粗略相似图片提取抗干扰性特征。 抗干扰性特征可以包括旋转角度不敏感数据,宽高比例不敏感数据、偏色不敏感数据和整体 轮廓数据。所述旋转角度不敏感数据用来抗旋转、镜像,该数据可以是图片的面积及图片的 同心圆信息。所述宽高比例不敏感数据用来抗縮放、比例失真,该数据可以是各个网格的像 素数量及各个网格的颜色的比例。所述偏色不敏感数据用来抗偏色、过曝、欠曝,该数据可 以是图片的二值化信息。所述整体轮廓数据用来抗加边、模糊、噪点、水印,该数据可以是 图像的边缘。可以先将源图片和粗略相似图片进行二值化处理,然后得到上述抗干扰性特征 。二值化是指使得整张图片只包含两种颜色,例如只包含黑和白两种颜色。
步骤S206,抗干扰性检索模块103根据设置的抗干扰性检索相似度比较源图片和粗略相 似图片的抗干扰性特征,査找抗干扰性相似图片。根据抗干扰性特征判断是否为抗干扰性相 似图片时,若其中一项抗干扰性特征(例如旋转角度不敏感数据、宽高比例不敏感数据、偏 色不敏感数据或者整体轮廓数据)符合抗干扰性检索相似度的要求,则该图片是抗干扰性相 似图片。以宽高比例不敏感数据为例,假设抗干扰性检索相似度为75%,若网格的像素数量 及网格的颜色比例相同的网格个数达到网格总数的75%,则该粗略相似图片是抗干扰性相似 图片。若该步骤中未査找到抗干扰性相似图片,则提示用户并结束流程。
步骤S207,精确检索模块104对源图片及査找的抗干扰性相似图片提取Hash码。 一张图 片的Hash码为一个字符串。
步骤S208,精确检索模块104根据精确检索相似度比较源图片和抗干扰性相似图片的 Hash码,査找精确相似图片。 一张图片的Hash码为一个字符串,比较两张图片的Hash码就是 依次比较两个字符串的各个字符。例如,精确检索相似度为90%,依次比较源图片及抗干扰 性图片的Hash码的各个字符,若相同字符个数超过源图片Hash码字符个数的90y。,则该抗干 扰性图片为精确相似图片。若该步骤中未査找到精确相似图片,则提示用户并结束流程。
步骤S209,显示模块105将精确相似图片显示出来。
上述实施例中相似图片检索依次包括粗略检索、抗干扰性检索和精确检索。用户若不需 要进行精确査找,可以只进行粗略检索,或者依次进行粗略检索和抗干扰性检索。此外,相似度可以灵活设置,例如粗略检索相似度是与源图片的偏差为±20%,则根据相似度进行 比较时相应调整判定方法。
以上实施例仅用以说明本发明的技术方案而非限制,尽管参照以上较佳实施例对本发明 进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等 同替换都不应脱离本发明技术方案的精神和范围。
权利要求
1.一种相似图片检索系统,运行于计算机中,所述计算机包括用于存储现有图片的图片存储区,其特征在于,该系统包括接收模块,用于接收用户指定的源图片;设置模块,用于设置相似图片检索的相似度,所述相似度包括粗略检索相似度;及粗略检索模块,用于对源图片和现有图片提取粗略特征,并根据设置的粗略检索相似度比较源图片和现有图片的粗略特征,查找粗略相似图片。
2.如权利要求l所述的相似图片检索系统,其特征在于,所述粗略检 索模块以网格为单位提取粗略特征,网格的粗略特征为颜色总数I最多颜色点的RGB值I最 少颜色点的RBG值,其中,所述RGB值由三个分别代表不同颜色强度值的字节组成。
3.如权利要求1或2所述的相似图片检索系统,其特征在于,所述相 似度还包括抗干扰性检索相似度。
4.如权利要求3所述的相似图片检索系统,其特征在于,该系统还包括抗干扰性检索模块,用于对源图片和査找的粗略相似图片提取抗干扰性特征,并根据 设置的抗干扰性检索相似度比较源图片和粗略相似图片的抗干扰性特征,査找抗干扰性相似 图片。
5.如权利要求4所述的相似图片检索系统,其特征在于,所述抗干扰 性特征包括旋转角度不敏感数据、宽高比例不敏感数据、偏色不敏感数据及整体轮廓数据。
6.如权利要求4所述的相似图片检索系统,其特征在于,所述相似度还包括精确检索相似度。
7.如权利要求6所述的相似图片检索系统,其特征在于,该系统还包括精确检索模块,用于对源图片和査找的抗干扰性相似图片提取哈希码,并根据设置的 精确检索相似度比较源图片和抗干扰性相似图片的哈希码,査找精确相似图片。
8 如权利要求7所述的相似图片检索系统,其特征在于,该系统还包括显示模块,用于显示査找的精确相似图片。
9 一种相似图片检索方法,其特征在于,该方法包括步骤 接收用户指定的源图片;设置相似图片检索的相似度,所述相似度包括粗略检索相似度;及 对源图片和现有图片提取粗略特征,并根据设置的粗略检索相似度比较源图片和现有 图片的粗略特征,査找粗略相似图片。
10 如权利要求9所述的相似图片检索方法,其特征在于,所述对源 图片和现有图片提取粗略特征是对源图片和现有图片以网格为单位提取粗略特征,网格的粗 略特征为颜色总数I最多颜色点的RGB值I最少颜色点的RBG值,其中,所述RGB值由三个分 别代表不同颜色强度值的字节组成。
11 如权利要求9或10所述的相似图片检索方法,其特征在于,所述 相似度还包括抗干扰性检索相似度。
12 如权利要求ll所述的相似图片检索方法,其特征在于,该方法还包括对源图片和査找的粗略相似图片提取抗干扰性特征,并根据设置的抗干扰性检索相似 度比较源图片和粗略相似图片的抗干扰性特征,査找抗干扰性相似图片。
13 如权利要求12所述的相似图片检索方法,其特征在于,所述抗干 扰性特征包括旋转角度不敏感数据、宽高比例不敏感数据、偏色不敏感数据及整体轮廓数据
14 如权利要求12所述的相似图片检索方法,其特征在于,所述相似 度还包括精确检索相似度。
15 如权利要求14所述的相似图片检索方法,其特征在于,该方法还包括对源图片和査找的抗干扰性相似图片提取哈希码,并根据设置的精确检索相似度比较 源图片和抗干扰性相似图片的哈希码,査找精确相似图片。
16 如权利要求15所述的相似图片检索方法,其特征在于,该方法还包括显示査找的精确相似图片。
全文摘要
一种相似图片检索方法,该方法包括步骤接收模块,用于接收用户指定的源图片;设置模块,用于设置相似图片检索的相似度,所述相似度包括粗略检索相似度;及粗略检索模块,用于对源图片和现有图片提取粗略特征,并根据设置的粗略检索相似度比较源图片和现有图片的粗略特征,查找粗略相似图片。本发明还提供一种相似图片检索系统。本发明能够快速准确地查找相似图片。
文档编号G06T7/00GK101576896SQ20081030149
公开日2009年11月11日 申请日期2008年5月9日 优先权日2008年5月9日
发明者常小军 申请人:鸿富锦精密工业(深圳)有限公司;鸿海精密工业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1