图像智能模式识别搜索方法

文档序号:6330431阅读:395来源:国知局
专利名称:图像智能模式识别搜索方法
技术领域
本发明属于计算机图像模式识别领域,特别是针对互联网搜索引擎在搜索中动态生成的静止图像,提出了结合图像注释文本特征和图像自身度量值进行关联分析的搜索方法。

背景技术
图像模式识别是指对图像数据进行识别模式的自动化处理系统设计的研究。模式识别的一个重要应用领域是检测特定类型的文本或图像并对操作过程加以控制。模式(也被称为对象、案例或样本)是对象的“物理”描述,通常是信号、图像或简单的数值表。特征是从模式得到的对分类有用的度量、属性或基元。比如,在图像识别中,一幅256×256的灰度图可以得到65536个图像度量值(光强),通常选取少量度量值作为特征值以提高识别效率,但识别正确率也随之下降了。模式识别系统的目标是要在表示空间和解释空间之间找到一种映射关系。实现模式识别的基本方法包括数据聚类,用某种相似性度量的方法将数据组织成有意义的和有用的各组数据,解决方案是数据驱动的,不依赖于任何监督学习或指导,优点是分类精度较高,缺点是实现比较复杂,效率比较低。统计分类,属于监督学习类型,基于用概率统计模型得到各类别的特征向量分布,以对图像进行分类。获得特征向量的分布基于一个类别已知的训练样本集(比如专家系统),用已知类别标签的样本集来训练从而得知如何分类,实现较简单,运行速度比较快,缺点是数据训练样本集很难准确确定以及分类精度比较低。神经网络,是受人脑组织的生理学知识启发而创立的,由一系列互相联系的相同的单元(神经元)组成,相互间的联系可以在不同的神经元之间传递增强或抑制信号。增强或抑制是通过调整相互间联系的权重系数实现。与统计分类方法相反,神经网络与“模型”无关,表现出一种非监督学习下分类器的性能,具有能够通过调整使得输出在特征空间中逼近任意目标的优点。存在的不足,一是数学表达很复杂并且不具有应用的通用性,二是从神经网络本身得不到任何语义的信息。
目前,互联网搜索已经不再局限于文本对象,越来越多地需要进行图像、视频等多媒体文件的搜索。各大搜索引擎如Google、Yahoo、Live Search、Baidu、AltaVista等也提供了图片搜索的功能,但主要是根据图片的超链URL和图片的关键字标注进行搜索。互联网上图像的检索经历了两个阶段第一阶段是以关键字为基础的检索。第二阶段是以图像自身的内容为基础的检索。在基于关键字的图像检索系统中,需要先对所有的图像进行关键字标注,然后才能使用全文检索技术对图像进行搜索。这种方法存在两个方面的问题一是这种方法需要较多的人工参与,而且随着图像数目的增加,这种方法很难实现;第二个问题在于图像所包含的信息量庞大,不同的人对于同一张图像的理解也不相同,这就导致对图像的标注没有一个统一的标准,因而检索的结果不能很好地符合用户的需求。基于内容的检索不同于基于关键字的检索,它不需要过多的人工参与,而利用图像自身的特征(如颜色、纹理、形状等)来进行检索,具有较强的客观性。但是,由于这些特征并不代表图像真正的语义信息,基于内容的检索结果往往不令人满意,有时会将不相关的广告条、图标、背景图、按钮也检索出来。另外,如果关键字标注不存在,那么图像的真实含义将不得而知。


发明内容
为了克服现有图像搜索技术的不足,本发明提出了图像智能模式识别搜索方法,将图像的超链URL分析与图像自身内容模式识别相结合,并自动为图像添加关键字。
技术方案首先由人类专家建立图像的样本训练集数据库,再结合基于文本的搜索引擎技术和基于图像内容的查询技术,由网络爬行器进行互联网图像的搜索,解析URL信息,将图像URL及相关信息抓取到本地原始数据库中;对图像进行大小、格式初步过滤,将尺寸较小、格式不符合要求的图像删除,进行必要的解压缩,图像预分类等预处理;然后计算提取图像的颜色特征、纹理特征、形状特征,得到相应的颜色、纹理、形状特征向量集,结合图像URL信息一起保存到图像基础数据库中,并为其建立索引;图像基础数据库中的图像与样本训练集进行特征向量相似度计算,将图像进行分类后保存到图像分类数据库中;接受用户输入的关键字或图像描述,产生索引向量,与图像分类数据库中的图像特征向量进行相似度计算,将索引结果返回给用户;用户如果不满意搜索结果,则对样本训练集数据库和图像分类数据库进行自动调整,再次得出图像检索结果。
有益技术效果是结合了模式识别中非监督学习和监督学习的优点,提高了大规模网络中图片搜索的命中度,降低了得出图片检索结果的响应时间,并具备一定的智能模式识别分类功能。

具体实施例方式 为节省存储空间、提高传输效率,互联网络上的图像一般采用经过压缩的JPEG、GIF、TIFF等格式,一般不采用BMP格式。目前在互联网络上使用最广泛的是JPEG格式,JPEG(JointPhotographic Experts Group)是ISO、CCITT、IEC为连续色调静态图像联合研制的第一个国际数字图像压缩标准。JPEG标准中定义了两种不同性能的系统基本系统和扩展系统。基本系统将图像分割成若干8×8的方块,对每个方块进行DCT变换,量化后的DC系数采用一维DPCM编码,AC系数经过Z扫描后采用游程编码。最后对DPCM和游程编码的输出使用哈夫曼编码方法来降低冗余度,解码器只存储两个哈夫曼表。扩展系统能提供分层操作模式,每个图像分量的编码要经过多次扫描,从而提供空间分辨率递增的不同层次的图像,每一层编码输出作为对上一层图像编码时的预测图像。在网络带宽较窄的情况下,能够较快地以最佳质量层进传输图像。GIF(Graphics Interchange Format)是主要为数据流而设计的一种传输格式,可用于多图像的顺序传输和显示,在网页上经常出现的动画图标便是利用了GIF的这一特性。GIF按照顺序被划分为五个部分文件头块、逻辑屏幕描述块、可选择的色表(调色板)、图像数据块(或特殊目的块)和尾块,每个块由每个字节中的标识码或特征码标识。GIF采用的是LZW压缩算法,该算法用一个字符串表保存数据流中的符号序列,每个字符串都有一个编码作为它的索引值。
图像通过两种方式链接到HTML页面内嵌式(InIine)和外链式(Reference). ①内嵌式这种方式通过使用IMG元素将图像(一般为图标或小尺寸图像)嵌入HTML页面。IMG元素使用SRC属性来指定图像的自身URL,使用ALT属性来指定对图像进行说明的文字。其基本格式为<IMG SRC=”URL”ALT=”image description”> ②外链式这种方式通过锚点元素(Anchor element)A来实现。A元素使用HREF属性来指定链接图像的URL。其基本格式为<A HREF=”URL”>HYPERLINK TEXT</A> 具体实现方法如下 (1)构建样本训练集。根据用户喜好及网络图片现状,挑选有代表性的JPEG图片或GIF图片保存在分类器中,比如划分为自然、建筑、人物、动物、植物等N类,针对每个分类建立数据集。比如“人物”类数据集(Human)包括K个含标准人脸的图像,包括地球四大人种原型(H1,H2,H3和H4)的轮廓图和各个原型从不同角度和距离拍摄的图(分别记为Hij,其中i指典型模式的序号,j指角度的序号),原型经过处理后的图像,添加了分段线性的轮廓线。确定轮廓时使用的是一种动态的轮廓跟踪技术,不断调整线段的数量。考虑到通用的情况,选择提取分类图像的文本描述、颜色、纹理、形状作为各个分类的特征向量C=C(Description,Color,Texture,Shape),建立各个分类初始的图像特征向量样本训练集。设置与各个分类图像特征向量的欧几里德距离的阈值Tij(1<=i<=N,1<=j<=4)和4个图像特征向量的初始权重系数Wj,计算出样本训练集的特征向量索引 (2)图像的爬行和获取。在搜索引擎服务器后台运行一个或多个网络爬行器crawler(或称网络机器人robot、网络蜘蛛spider),对一定范围的网络站点的HTML网页进行爬行。当需要爬行的网络规模小于设定值时,可采用通用的深度优先算法或宽度优先算法进行爬行;当网络规模较大时,可采用并发蛙跳启发式搜索算法(见另一发明专利)等比较适合大规模网络爬行的效率较高的算法进行多线程爬行,可以根据搜索对象的特点,创建两个或更多的线程并设置各个线程的运行优先级,控制每个线程的执行,使爬行进程的运行效率更高。如果只进行图像的爬行,则对网络爬行器设置URL过滤条件,根据HTML页面的图像链接方式解析含有诸如*.jpg、*.jpeg、*.gif等后缀的URL的链接文件及描述信息。采用时间戳技术,如果发现网页上的图像内容发生变化或者出现新的图像网页,则将页面内所链接的图像文件及文本注释信息存储到本地原始数据库中。
(3)图像特征的提取。为了提高系统整体识别运行速度,考虑使用与样本训练集相同的图像特征作为四类特征向量(文本描述Description,颜色Color,纹理Texture,形状Shape)。从本地原始数据库中读取图像,将图像的注释、URL地址等文本信息连接成字符串作为“文本描述”特征向量。即Description=图像注释||URL地址。
其他类特征向量的提取如下 ①“颜色”(Color)特征向量的获取。常用的颜色特征空间包括一是最基本的RGB特征空间,基于笛卡尔三维坐标系统,是一个立方体形状,三个轴分别表示R(red红色)、G(green绿色)和B(blue蓝色),各个轴的取值范围都是0到255。坐标原点(0,0,0)表示“黑色”,(255,0,0)表示“红色”,(0,255,0)表示“绿色”,(0,0,255)表示“蓝色”,(255,255,255)表示“白色”,从“黑色”到“白色”相连的立方体的对角线表示从“黑色”到“白色”的连续灰度值,立方体内其他各点表示不同的颜色。根据这个空间模型,每幅彩色图像可以被分解到3个独立的平面上。二是经过线性变换的特征空间,包括用于PAL制式彩色标准的YUV颜色空间、用于NTSC制式彩色视频标准的YIQ颜色空间和用于JPEG压缩图形格式的YCrCb颜色空间。三是经过线性变换和非线性变换的CIE(LUV)颜色空间。四是HSV颜色空间,HSV分别表示颜色的三种属性色调(Hue)、饱和度(Saturation)和亮度(Value)。传统的RGB表示方法实现很简单,但不太满足人眼的视觉特性和因特网上图片的特殊要求。HSV表示方法最满足人眼特性,但实现很复杂,需要通过大量运算将RSB转换为HSV。考虑到因特网大规模图像识别的问题,以及图像格式大多为YCrCb表示方法。故提出一种比较快速实现的折衷办法,首先判断图像的格式,如果为JPEG(JPG)格式,“颜色”特征向量表示为三维向量Y、Cr、Cb的一维转换形式,即颜色特征向量其中Y=0.299R+0.587G+0.114B,Cr=0.5R-0.4187G-0.0813B,Cb=-0.1687R-0.3313G+0.5B;如果为BMP格式,则②“纹理”(Texture)特征向量的获取。纹理特征是表示视觉的基本结构,主要包括粗糙性、方向性、对比度、周期性、凹凸性等。典型的纹理特征包括Tamura纹理特征、基于小波变换的纹理特征、共现自回归纹理特征等。图像的纹理分割是一项相当困难并且计算量很大的任务。因此,本发明提出比较简单的实现方法,只计算粗糙度、对比度和方向性。粗糙度的计算1)计算移动平均数(moving average),对于2k×2k的窗口,移动平均数为 2)计算水平和垂直向的偏差 ck(i,j)=max(|ak(i-2k-1,j)-ak(i+2k-1,j)|,|ak(i,j-2k-1)-ak(i,j+2k-1)|) 3)确定窗口大小 4)计算平均窗口大小
对比度的计算 方向性是指图像里灰度值的方向。计算方向性需要以下四步 1)计算每个像素的梯度。梯度指此像素点周围灰度值增加最快的方向。水平梯度等于左边像素的三个灰度值与右边像素的三个灰度值之间的偏差,而垂直梯度则是上下像素的三个灰度值偏差。



2)计算梯度向量的极坐标 3)计算倾斜向量角度的直方图 nφ(k)表示满足和|g|>t条件的像素点的比例。
4)得到直方图以后,计算波峰(波谷到波谷)周围的值的变化总和 方向性(Direction)=波谷到波谷之间变化的总和 考虑到纹理特征中粗糙度和对比度对人眼感官占的比例较大,因此纹理特征向量 ③“形状”(Shape)特征向量的获取。主要是针对容易辨别的图像边缘特征的提取。边缘检测算子检查每个像素的邻域,并对灰度变化率进行量化,也包括方向的确定。大多数使用基于方向导数掩模求卷积的方法,实际应用中求导数是利用差分近似微分来进行。几种常用的边缘检测方法包括Sobel边缘检测算子方法、Prewitt边缘检测算子方法、高斯-拉普拉斯算子检测方法、Canny边缘检测方法。本发明采用比较简单实用的长度、宽度、矩形度、圆形度相结合的方法。计算物体边界点的最大和最小坐标值,就可得到物体的水平(L)和垂直跨度(W)以及它们之间的比值r=L/W,这样的外接矩形是物体最小的外接矩形(MER-MinimumEnclosing Rectangle)。矩形度用物体的面积与其最小外接矩形的面积之比来刻画,反映物体对其外接矩形的充满程度,即R=A/Amer。圆形度用来刻画物体边界的复杂程度,它们在圆形边界时取最小值。最常用的圆形度是周长的平方与面积的比,即C=P2/A。“形状”特征向量公式如下 Shape=C/r+r/R+R/C=(RC2+Cr2+rR2)/rRC 最后,得到图像的特征向量E=E(Description,Color,Texture,Shape)。将带有特征向量的图像建立索引后保存到图像基础数据库中。
(4)图像的分类。从图像基础数据库中读取图像,求出图像的特征向量与样本训练集中各个分类特征向量的欧几里德距离,即Dij=|Eij-Cij|,其中1<=i<=N,1<=j<=4。相似度函数为1<=i<=N,1<=j<=4。其中,Wj是图像特征向量的权重系数,可以根据用户的输入自动调整。图像的与各个分类样本训练集的相似度求出后,再求出最小值Fk=min(Fi)。将图像经过hash函数变换h=(index)mod(INDEX(k))后,将图像、图像特征向量及第k类训练样本特征向量复制到与相应的图像分类数据库中,该分类的序列号为h。对存储的图像按照与训练样本特征向量的相似度函数值F由小到大进行排序(值越小,表明图像与训练样本越相似,排序也越靠前),序号为p,图像新的索引为h+p。并按照尺寸比例,生成图像的相应缩略图(为了方便用户辨别)。
(5)用户检索。在web客户端界面展现给用户为图像搜索复合条件,包括图像文字描述S1、颜色S2、纹理S3和形状S4及条件的相应权重系数(Wj)’等,根据用户的选择,提交复合条件给web服务器进行计算,得到用户查找关键字然后,提交给后台的数据库检索程序,首先与样本训练集数据库中的特征向量索引进行欧几里德距离计算,找出距离最小的值min(|key-INDEX(m)|),该最小值对应的分类号为m。然后,将key经过hash函数变换1=(key)mod(INDEX(m))后,在图像分类数据库中找到第1类图像,将命中的图像检索结果按照相似程度返回给用户,返回结果信息包括图像特征信息和缩略图。用户如果搜索结果不满意,则可以更改检索条件权重系数再次提交搜索请求。搜索引擎后台图像处理程序则按照用户提交的权重系数重新对样本训练集特征向量索引进行计算,然后图像分类器中的图像特征向量索引重新计算后按照第(4)步进行重新分类,最后将结果返回给用户,直到用户不再提交权重系数修改为止。
权利要求
1.一种图像智能模式识别搜索方法,其特征在于,首先由人类专家建立图像的样本训练集数据库,再结合基于文本的搜索引擎技术和基于图像内容的查询技术,由网络爬行器进行互联网图像的搜索,解析URL信息,将图像URL及相关信息抓取到本地原始数据库中;对图像进行大小、格式初步过滤,将尺寸较小、格式不符合要求的图像删除,进行必要的解压缩,图像预分类等预处理;然后计算提取图像的颜色特征、纹理特征、形状特征,得到相应的颜色、纹理、形状特征向量集,结合图像URL信息一起保存到图像基础数据库中,并为其建立索引;图像基础数据库中的图像与样本训练集进行特征向量相似度计算,将图像进行分类后保存到图像分类数据库中;接受用户输入的关键字或图像描述,产生索引向量,与图像分类数据库中的图像特征向量进行相似度计算,将索引结果返回给用户;用户如果不满意搜索结果,则对样本训练集数据库和图像分类数据库进行自动调整,再次得出图像检索结果。
2.按照权利要求1所述的一种图像智能模式识别搜索方法,其特征在于,
(1)构建样本训练集;根据用户喜好及网络图片现状,挑选有代表性的JPEG图片或GIF图片保存在分类器中,比如划分为自然、建筑、人物、动物、植物等N类,针对每个分类建立数据集;比如“人物”类数据集(Human)包括K个含标准人脸的图像,包括地球四大人种原型的轮廓图和各个原型从不同角度和距离拍摄的图分别记为Hij,其中i指典型模式的序号,j指角度的序号,原型经过处理后的图像,添加了分段线性的轮廓线;确定轮廓时使用的是一种动态的轮廓跟踪技术,不断调整线段的数量;考虑到通用的情况,选择提取分类图像的文本描述、颜色、纹理、形状作为各个分类的特征向量C=C,建立各个分类初始的图像特征向量样本训练集;设置与各个分类图像特征向量的欧几里德距离的阈值Tij(1<=i<=N,1<=j<=4)和4个图像特征向量的初始权重系数Wj,计算出样本训练集的特征向量索引
(2)图像的爬行和获取;在搜索引擎服务器后台运行一个或多个网络爬行器crawler(或称网络机器人robot、网络蜘蛛spider),对一定范围的网络站点的HTML网页进行爬行;当需要爬行的网络规模小于设定值时,可采用通用的深度优先算法或宽度优先算法进行爬行;当网络规模较大时,可采用并发蛙跳启发式搜索算法等比较适合大规模网络爬行的效率较高的算法进行多线程爬行,可以根据搜索对象的特点,创建两个或更多的线程并设置各个线程的运行优先级,控制每个线程的执行,使爬行进程的运行效率更高;如果只进行图像的爬行,则对网络爬行器设置URL过滤条件,根据HTML页面的图像链接方式解析含有诸如*.jpg、*.jpeg、*.gif等后缀的URL的链接文件及描述信息;采用时间戳技术,如果发现网页上的图像内容发生变化或者出现新的图像网页,则将页面内所链接的图像文件及文本注释信息存储到本地原始数据库中;
(3)图像特征的提取;为了提高系统整体识别运行速度,考虑使用与样本训练集相同的图像特征作为四类特征向量(文本描述Description,颜色Color,纹理Texture,形状Shape);从本地原始数据库中读取图像,将图像的注释、URL地址等文本信息连接成字符串作为“文本描述”特征向量;即Description=图像注释||URL地址;
其他类特征向量的提取如下
①“颜色”(Color)特征向量的获取;常用的颜色特征空间包括一是最基本的RGB特征空间,基于笛卡尔三维坐标系统,是一个立方体形状,三个轴分别表示R(red红色)、G(green绿色)和B(blue蓝色),各个轴的取值范围都是0到255;坐标原点(0,0,0)表示“黑色”,(255,0,0)表示“红色”,(0,255,0)表示“绿色”,(0,0,255)表示“蓝色”,(255,255,255)表示“白色”,从“黑色”到“白色”相连的立方体的对角线表示从“黑色”到“白色”的连续灰度值,立方体内其他各点表示不同的颜色;根据这个空间模型,每幅彩色图像可以被分解到3个独立的平面上;二是经过线性变换的特征空间,包括用于PAL制式彩色标准的YUV颜色空间、用于NTSC制式彩色视频标准的YIQ颜色空间和用于JPEG压缩图形格式的YCrCb颜色空间;三是经过线性变换和非线性变换的CIE(LUV)颜色空间;四是HSV颜色空间,HSV分别表示颜色的三种属性色调(Hue)、饱和度(Saturation)和亮度(Value);传统的RGB表示方法实现很简单,但不太满足人眼的视觉特性和因特网上图片的特殊要求;HSV表示方法最满足人眼特性,但实现很复杂,需要通过大量运算将RSB转换为HSV;考虑到因特网大规模图像识别的问题,以及图像格式大多为YCrCb表示方法;故提出一种比较快速实现的折衷办法,首先判断图像的格式,如果为JPEG(JPG)格式,“颜色”特征向量表示为三维向量Y、Cr、Cb的一维转换形式,即颜色特征向量其中Y=0.299R+0.587G+0.114B,Cr=0.5R-0.4187G-0.0813B,Cb=-0.1687R-0.3313G+0.5B;如果为BMP格式,则②“纹理”(Texture)特征向量的获取;纹理特征是表示视觉的基本结构,主要包括粗糙性、方向性、对比度、周期性、凹凸性等;典型的纹理特征包括Tamura纹理特征、基于小波变换的纹理特征、共现自回归纹理特征等;图像的纹理分割是一项相当困难并且计算量很大的任务;因此,本发明提出比较简单的实现方法,只计算粗糙度、对比度和方向性;粗糙度的计算1)计算移动平均数(moving average),对于2k×2k的窗口,移动平均数为
2)计算水平和垂直向的偏差
ck(i,j)=max(|ak(i-2k-1,j)-ak(i+2k-1,j)|,|ak(i,j-2k-1)-ak(i,j+2k-1)|)
3)确定窗口大小
4)计算平均窗口大小
对比度的计算
方向性是指图像里灰度值的方向;计算方向性需要以下四步
1)计算每个像素的梯度;梯度指此像素点周围灰度值增加最快的方向;水平梯度等于左边像素的三个灰度值与右边像素的三个灰度值之间的偏差,而垂直梯度则是上下像素的三个灰度值偏差;
梯度计算
水平梯度
垂直梯度
2)计算梯度向量的极坐标
3)计算倾斜向量角度的直方图
nφ(k)表示满足和|g|>t条件的像素点的比例;
4)得到直方图以后,计算波峰(波谷到波谷)周围的值的变化总和
方向性(Direction)=波谷到波谷之间变化的总和
考虑到纹理特征中粗糙度和对比度对人眼感官占的比例较大,因此纹理特征向量
③“形状”(Shape)特征向量的获取;主要是针对容易辨别的图像边缘特征的提取;边缘检测算子检查每个像素的邻域,并对灰度变化率进行量化,也包括方向的确定;大多数使用基于方向导数掩模求卷积的方法,实际应用中求导数是利用差分近似微分来进行;几种常用的边缘检测方法包括Sobel边缘检测算子方法、Prewitt边缘检测算子方法、高斯-拉普拉斯算子检测方法、Canny边缘检测方法;本发明采用比较简单实用的长度、宽度、矩形度、圆形度相结合的方法;计算物体边界点的最大和最小坐标值,就可得到物体的水平(L)和垂直跨度(W)以及它们之间的比值r=L/W,这样的外接矩形是物体最小的外接矩形(MER-MinimumEnclosing Rectangle);矩形度用物体的面积与其最小外接矩形的面积之比来刻画,反映物体对其外接矩形的充满程度,即R=A/Amer;圆形度用来刻画物体边界的复杂程度,它们在圆形边界时取最小值;最常用的圆形度是周长的平方与面积的比,即C=P2/A;“形状”特征向量公式如下
Shape=C/r+r/R+R/C=(RC2+Cr2+rR2)/rRC
最后,得到图像的特征向量E=E(Description,Color,Texture,Shape);将带有特征向量的图像建立索引后保存到图像基础数据库中;
(4)图像的分类;从图像基础数据库中读取图像,求出图像的特征向量与样本训练集中各个分类特征向量的欧几里德距离,即Dij=|Eij-Cij|,其中1<=i<=N,1<=j<=4;相似度函数为1<=i<=N,1<=j<=4;其中,Wj是图像特征向量的权重系数,可以根据用户的输入自动调整;图像的与各个分类样本训练集的相似度求出后,再求出最小值Fk=min(Fi);将图像经过hash函数变换h=(index)mod(INDEX(k))后,将图像、图像特征向量及第k类训练样本特征向量复制到与相应的图像分类数据库中,该分类的序列号为h;对存储的图像按照与训练样本特征向量的相似度函数值F由小到大进行排序,序号为p,图像新的索引为h+p;并按照尺寸比例,生成图像的相应缩略(5)用户检索;在web客户端界面展现给用户为图像搜索复合条件,包括图像文字描述S1、颜色S2、纹理S3和形状S4及条件的相应权重系数(Wj)’等,根据用户的选择,提交复合条件给web服务器进行计算,得到用户查找关键字然后,提交给后台的数据库检索程序,首先与样本训练集数据库中的特征向量索引进行欧几里德距离计算,找出距离最小的值min(|key-INDEX(m)|),该最小值对应的分类号为m;然后,将key经过hash函数变换l=(key)mod(INDEX(m))后,在图像分类数据库中找到第l类图像,将命中的图像检索结果按照相似程度返回给用户,返回结果信息包括图像特征信息和缩略图;用户如果搜索结果不满意,则可以更改检索条件权重系数再次提交搜索请求;搜索引擎后台图像处理程序则按照用户提交的权重系数重新对样本训练集特征向量索引进行计算,然后图像分类器中的图像特征向量索引重新计算后按照第(4)步进行重新分类,最后将结果返回给用户,直到用户不再提交权重系数修改为止。
全文摘要
本发明提出了图像智能模式识别搜索方法。建立图像样本训练集数据库,结合基于文本的搜索引擎技术和基于图像内容的查询技术,由网络爬行器进行互联网图像搜索,解析URL信息,将图像URL及相关信息抓取到本地原始数据库;对图像进行初步过滤,解压缩,图像预分类等预处理;然后计算提取图像的颜色特征、纹理特征、形状特征,得到相应特征向量集,结合图像URL信息一起保存到图像基础数据库中,并为其建立索引;图像基础数据库中的图像与样本训练集进行特征向量相似度计算,将图像进行分类后保存到图像分类数据库中;接受用户输入的关键字或图像描述,产生索引向量,与图像分类数据库中的图像特征向量进行相似度计算,将索引结果返回给用户。
文档编号G06F17/30GK101211341SQ20061014834
公开日2008年7月2日 申请日期2006年12月29日 优先权日2006年12月29日
发明者蔡阳波, 勇 陈 申请人:上海芯盛电子科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1