一种基于视觉特征的图片搜索方法

文档序号:6363886阅读:238来源:国知局
专利名称:一种基于视觉特征的图片搜索方法
技术领域
本发明涉及图片的识别与搜索技术,特别是涉;sut"图片特征变量的选择与对图片 特征谱线的分析与提取方法及其在图片的识别与搜索中的应用。
背景技术
基于视觉特征或基于内容的图片搜索技^f究从第 一个商业化的基于内容的图像 和动态景M索系统一-IBM公司的QBIC到现在已经有十几年的历i了。
现将当前世界上主要的类似技术做一介绍
1. QBIC(Query By I咖ge Content)图<綠索系统是IBM公司90年代开发制作 的图像和动态景^r索系统,是第一个基于内容的商业化的图#^索系统.QBIC系统提供了 多种的查询方式,包括利用标准范图(系统自身提供)检索,用户绘制简图或扫描输入图 像进行检索,选择色彩或结构查询方式,用户输入动态影象片段和前景中运动的对勤全索。 在用户输入图像、简图或影象片段时,QBIC对输入的查询图像进行颜色、紋理、形状等特征 进行分析和抽取,然后根据用户选择的查询方式分别进行不同的处理。QBIC中使用的颜色特 征有色彩百分比、色彩位置分布等;使用的玟理特征是根据Tamura提出的故理表示的一种 改进,即结合了M度、对比度和方向性的特性;使用的形状特征有面积、圆形度、偏心度、 主轴偏向和一组代数矩不变量。QBIC还是少数几个考虑了高维特征索引的系统之一。
QBIC除了上面的基于内容特性的检索,还辅以文本查询手段。
2. Virage是由Virage公司开发的基于内容的图^b^索引擎.同QBIC系统一样, 它也支持基于色彩、颜色布局、紋理和结构等视觉特征的图傳輪索。
VIRAGE公司的VIR (Visual Information Retrieval)图像引擎提供了四种可视 属性检索(颜色、成分、紋理和形状)。每种属性^J昧予0到10的权值。通过颜色特性检索 是最简单明了的,该软件对选出的基础图像的色调、色彩以及饱合度进行分析,然后在图像 库中查找与这些颜色属性最接近的图像。成分(composition)特性指相关颜色区域的近似程 度。用户可以设定一个或多个属性权值来优化检索。要达到最佳平衡度需要反复试验,但 检索过程是相当快的。在结果显示矩阵中可以选择查看3、 6、 9、 12、 15或18个简图。通过 对四个属性权值的调整,显示出不同的检索结果。简闺是根据相似度降序排列。点击简图标 题将得到该图像的一些详细说明,包括Virage计算出的相似比。
3. RetrievalWare是由Excalibur科技有限公司开发的一种基于内容的图像检 索工具。早期版本中,可以看到该系统的重点在于运用神经网络算法实现闺像检索。在比较 新的版本中r提供基于6种图像属性的检索,分别是颜色、形状、紋理、颜色结构、亮度结 构和纵横比。颜色属性是对图像的颜色及其所占的比率进行测定,但并不包括对颜色的结构 或位置的测定,这一项是由颜色结构属性控制的;形状属性指图像中物体的轮廓或线条的相 对方位、弯曲度及对比度;紋理属性是指图像的平滑度或粗糙度, 一幅图的表面特性;亮度 属性是指构成图像的象素组合的亮度。
4. Photobook是美国麻省理工学院的多媒体实验室所开发的用于图像查询和浏览 的交互工具。它由三个子系统组成,分别负责提取形状、纹理、面部特征。因此,用户可以 在这三个子系统中分别进行基于形状、基于玟理和基于面部特征的图像检索。
5. VisualSEEK是基于视觉特征的检索工具,WebSEEK是一种面向兩的文本或 图4綠索引擎。这两个检索系统都是由哥伦比亚大学开发的。它们的主要特点是采用了图像 区域之间空间关系和M缩域中提取的视觉特征。系统所采用的视觉特征是利用颜色集和基 于小波变换的紋理特征。Visual SEEK同时支持基于视觉特征的查询和基于空间关系的查询。 WebSEEK包括三个主要模块图像/视频釆集模块,主题分类和索引模块,查找、浏览和检索模块'
毫无例外的,在这些基于视觉特征或基于内容的图片搜索技术中,紋理和形状是 不同的两种属性。复杂的算法与结构使得对使用这些技术的用户的知识结构要求是比较高的, 算法复杂,数据处理量偏大,人工干预多的特点对大规模商业运营的成本压力也是显而易见 的。
(三)

发明内容
本发明所要解决的技术问 _:在图片的识别与搜索中,选择合适的图片特征变 量并对图片特征变量特征谱线进行分析,采用减少处理数据量的特征值提取方法,降低大众 普及使用的难度。
由于客户端处理数据量小,易于搮作,可以广泛适用于互联网困片搜索引擎、移 动终端图片搜索等领域。
又由于可以根据用户意愿随意确定搜索的有效区域与内容,还可以用于用户^AL 计算机的图片搜索领域。
为解决以上技术问题,本发明在公开了以下技术方案。
(四)
具体实施例方式
一种基于视觉特征的图片搜索方法的实现,包括
将图片的色相、饱和度、亮度、^JL和平面位置等特征变量数量化并赋值。 将图库中的图片文件按照设定几何尺寸转为标准缩略图。
获取标准缩略图每个像素点的色相、饱和度、亮度、灰度和平面位置数值,形成 标准缩略图单一特征变量的一次特征数据库.
对标准缩略图按照设定的不同识别精度分析,形成单一特征变量的跃变边界线。 并由全部的跃变边界线形成每个图片文件标准缩略图的单一特征变量的特征镨线.全部图片 文件标准缩略图的单一特征变量特征谱线形成该特征变量的二次特征数据库。
单一特征变量跃变边界线上每个像素点位置的切线方向形成该特征变量的三次特
征数据库。
一次特征数据库、二次特征数据库与三次特征数据库形成图库图片标准缩略图的 全特征数据库。全特征数据库与图库中图片文件的URL (Uniform Resoure Locator)关联。
搜索时,在作为样本文件的图片上,以计算M入设备取得的通过"搜索目标" 的一条或多条连续或不连续曲线作为"搜索条件"。对"搜索条件"与跃变边界线的交集,按 照其色相、饱和度、亮度、灰度、平面位置和跃变边界线在该像素点(点蔟)上的切线方向 等数值与全特征数据库进行比对,完成单一特征变量或多特征变量组合搜索。
搜索的结果返回为与"搜索条件"吻合程度符合预先设定的图片以及其URL。 本技术方案中涉及的下列词汇是指 "图库"本地计算机的图片存^i殳备或搜索引擎在网络中能4^到的图片。 "标准缩略图"按照搜索准度与文件大小平衡而确定地固定尺寸缩略图。
"跃变边界线"按照单一特征变量的识别精度,发生数值变化像素点连线的中点 顺序连接而成的圓滑曲线。由于在当前的显示技术中的像素表达导致跃变边界线不落在任何 像素点上,实际处理时,以跃变边界线两側的像素点形成的两条曲线分别计算。
权利要求
1、一种基于视觉特征的图片搜索方法,其特征在于,包括将图库中的图片按照设定几何尺寸转为标准缩略图,再以标准缩略图上每个像素点色相、饱和度、亮度、灰度、平面位置、单一特征变量的跃变边界线和跃变边界线在其上每像素点处的切线方向为特征变量形成全特征数据库并与该图片的URL(Uniform ResoureLocator)关联。标准缩略图按照设定的识别精度,形成单一特征变量的跃变边界线。并由全部的跃变边界线形成该图片的单一特征变量谱线。搜索时,在作为样本文件的图片上,以计算机输入设备取得的任意的点、连续或不连续曲线作为“搜索条件”。对“搜索条件”与跃变边界线的交集,按照其色相、饱和度、亮度、灰度、平面位置和跃变边界线在该像素点(点簇)上的切线方向进行单一特征变量或多特征变量组合搜索。搜索的结果返回为与“搜索条件”吻合程度符合预先设定的图片以及其URL。
2、 根据权利要求l所述的方法,其中标准缩略图是指按照搜索准度与文件大小平衡而 确定的固定尺寸缩略图。
3、 根据权利要求1所述的方法,其中全特征数据库是指对图片的标准缩略图按照色相、 饱和度、亮度、灰度和平面位置等特征变量的数值做出的描述。全特征数据库包括一次特 征数据库、二次特征数据库与三次特征数据库。其中,标准缩略图每个像素点的色相、饱和度、亮度、灰度和平面位置数值, 形成标准缩略图一次特征数据库;标准缩略图的单一特征变量跃变边界线谱线形成该特征 变量的二次特征数据库;标准缩略图单一特征变量跃变边界线在跃变边界线上每个像素点 位置的切线方向形成三次特征数据库。
4、 根据权利要求1所述的方法,其中跃变边界线是指按照单一特征变量的识别精度, 发生数值变化像素点连线的中点顺序连接而成的圆滑曲线。由于在当前的显示技术中的像 素表达导致跃变边界线不落在任何像素点上,实际处理时,以跃变边界线两侧的像素点形 成的两条曲线分别计算。
全文摘要
本发明涉及图片的识别与搜索技术。以图片的标准缩略图为对象,将色相、饱和度、亮度、灰度和平面位置等特征变量数量化并赋值。并在此基础上,形成单一特征变量的跃变边界线的集合--单一特征变量的特征谱线。对单一特征变量的跃变边界线逐像素点作切线,以切线的方向为该像素点的单一特征变量的特征值。操作简单,无需用户拥有专业知识背景。以用户输入的曲线与单一特征变量的特征谱线的交点特征值为识别图片的基础数据。搜索时,客户端与服务器端处理数据量都比较小。本发明可以广泛适用于图片识别、互联网图片搜索引擎、移动终端图片搜索等领域。也可以与“关键字”搜索结合,对现有图片搜索方式进行优化。
文档编号G06F17/30GK101556611SQ200910107050
公开日2009年10月14日 申请日期2009年5月8日 优先权日2009年5月8日
发明者白青山 申请人:白青山
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1