基于遗传算法的图像内容检索方法

文档序号：6365090阅读：205来源：国知局

专利名称：基于遗传算法的图像内容检索方法
技术领域：
本发明涉及的是一种图像内容检索方法，特别是一种基于遗传算法的图像内容检索方法，属于图像信息处理领域。
背景技术：
图像是多媒体信息库中最普通的一种媒体，研究检索多媒体信息库中图像内容的有效方法是非常有意义的。对于图像的检索，早期采用文字形式，对图像附上特定属性，并且将这些属性看作格式化的数据，通过输入字符串并与这些属性进行匹配，来达到图像检索的目的。这种方法现在仍然作为一种主要的检索方法得到大量应用。然而，由于该种基于文字的方法要求用户输入与图像具有较强相关性的文字，文字若不能精确描述图像信息，则检索效果不好，但若要实现精确描述，却需要进行十分繁琐的工作。鉴于上述原因，基于内容的图像检索技术引起了人们的很大兴趣。
迄今为止，人们进行了许多关于图像模板匹配方面的研究，然而针对多媒体信息库，能够对其实现图像内容有效检索全过程的整套技术方面的研究成果相对来说还比较少见，经文献检索发现，典型的有Excalibur公司的技术开发小组开发的Visual RetrievalWare(可视检索软件)查询技术，公开在http//www.convera.com/Products/products rw.asp上，这些技术的基本思想都是从图像自身的颜色、纹理、形状等属性的相似性角度出发，通过匹配运算来达到检索的目的。Visual RetrievalWare(可视检索软件)提供了基于颜色、形状、纹理、颜色结构、亮度结构和纵横比6种图像属性的检索，每一个属性权重值范围从0到5，不同的权值设定产生的结果不同，其中颜色属性是对图像的颜色及其所占的比率进行测定；形状属性指图像中物体的轮廓或线条的相对方位、弯曲度及对比度；纹理属性是指图像的平滑度或粗糙度；亮度属性是指构成图像的象素组合的亮度。但是该技术对于图像检索的前端处理技术方面和目标对象的自我扩展能力和搜索算法方面的智能化和实时性方面都有待于改进。

发明内容
本发明针对现有技术的不足和缺陷，提供一种基于遗传算法的图像内容检索方法，通过执行用户模板预处理、匹配检索、检索结果处理三方面的操作，使其具有高效的智能检索效果，同时兼顾检索速度问题，对检索速度进行了一定的改善。本发明是通过以下技术方案实现的，本发明方法具体如下首先，由用户通过人机接口提供期望查找的目标对象图像；其次，对目标对象进行特征提取，并基于特征提取后的目标对象生成目标对象模板集；然后，一方面基于模板集构造具体遗传算法，另一方面基于已得到的目标对象特征对等待检索的图像数据库中的每一图像进行搜索区域初步范围定界；最后，利用所构造的遗传算法对已得到的初步搜索区域进行检索，并将检索结果返回给用户。
本发明具有人机交互接口、用户模板预处理、匹配检索、检索结果输出四个部分的功能。其中，人机交互接口完成用户的目标对象的输入和接受返回的检索结果；用户模板预处理操作是对用户的目标对象图像实施一定的处理，提取其特征及生成适应性强的模板集；匹配检索完成媒体库中每一图像内的初步检索区域的定界，并利用遗传算法在已定界的区域内进行目标检索；检索结果输出操作是根据用户的实际应用需求返回检索结果给人机交互接口。
以下对本发明方法作进一步的描述(1)由人机接口接受用户提供的需要查找的特定目标对象图像。
(2)对用户输入的目标对象进行预处理，应用特征提取技术，提取用户输入的特定目标对象的颜色和轮廓方面的特征信息，并基于目标对象生成目标对象模板集。
在特征提取方面，颜色信息提取采用直方图统计的方法，而图形轮廓提取则采用坎尼算子的方法。这两种信息的结合，可以比较好的描述图像的一般性特征，同时又简化了图像数据。
在模板集生成方面，对于特征提取后的目标对象，采用放大，缩小，旋转等变形技术，生成具有相似性的新模板，以扩展用户目标对象模板数量，形成用户目标对象模板集，对于该模板集中的每一模板，用N个bits来编码其编号，该编号将在后续的遗传检索算法中被用来代表具体的模板，N个bits可以最多表示2N个模板，N可以根据实际的需要来确定。
(3)进行匹配检索操作，对于媒体库中等待被检索的每一图像，利用上述的颜色和轮廓特征提取方法，且根据用户目标图像中所提取的特征值进行图像处理，并且特别借助区域增长的方法界定待检测的图像的搜索区域初步范围，然后，利用基于模板集构造的性能良好的遗传算法在已得到的初步检索区域内进行优化匹配检索。
区域增长法主要是基于所提取的图像特征信息在图像中给定起始增长点和增长阈值后，采用递归搜索每一个像素点的周围相邻8个点，用标记掩码的方式来连接离散的图像轮廓或者区域，从而构成连续的封闭区域并将其确定为图像中进行检索的初步区域。
在得到检索初步区域后，就可利用基于模板集构造的性能良好的遗传算法在该区域内进行优化匹配检索。
该遗传算法在得到模板集后就可以构造出来，在该算法中，每一条染色体采用M个bits表示，其中K个bits表示图像二维空间中目标的位置，从而每条染色体可以搜索的范围是2K/2*2K/2大小，其余的(M-K)个bits表示模板的编码，另外，染色体的适应度函数用最小相关误差表示。在利用该算法检索时，根据最小相关误差函数计算每一条染色体的适应度函数值，并且根据计算结果从大到小排序，每一世代保留最优的若干条染色体，当算法收敛到设定的阈值或者遗传算法演进到规定的世代数时，搜索即告结束，得到检索结果。
(4)根据检索结果并按照用户的实际应用需求，或者将查找到的图像返回给用户，或者以文字形式通知用户是否已检索到所需要的图像。
本发明具有实质性特点和显著进步，基于遗传算法的图像内容检索技术是在性能良好的图像特征提取技术、适应性模板集的生成、区域增长法以及遗传算法智能检索技术的基础上研发的。与已有的相应技术相比，该技术具有高效的智能检索效果，同时其兼顾检索速度问题，对检索速度进行了一定的改善。
具体实施例方式
结合本发明的内容进一步提供以下实施例基于本发明方法开发了原型系统，该系统包括用户提供目标对象图像和返回结果的接口、目标对象预处理模块、遗传算法构造模块、搜索区域初步范围定界模块、等待检索的图像数据库、利用遗传算法进行检索模块。
首先，由用户通过人机接口提供期望查找的目标对象图像，在实验系统中是人体的某些特殊部位；第二步，由目标对象预处理模块对目标对象进行特征提取，特征提取是通过直方图统计的办法提取目标对象的颜色特征和利用坎尼算子的方法提取目标对象的轮廓特征，再利用特征提取后的目标对像通过旋转，放大，缩小，扭曲生成目标对象的模板集；然后，一方面利用遗传算法构造模块基于模板集构造具体遗传算法，包括确定遗传算法中的染色体编码方式、遗传交叉的操作方式及适应度函数，在实验系统中，染色体编码方式采用16位编码，遗传交叉的操作方式采用双点交叉和1％的变异率，适应度函数是基于最小均方误差。另一方面利用基于已得到的目标对象特征，在搜索区域初步范围定界模块中对等待检索的图像数据库中的每一幅图像进行搜索区域初步范围定界，在实验系统中，确定的主要区域是人的身体区域，也即对图像数据库中的每一幅图像采用直方图统计和坎尼算子操作提取特征，再特别借助区域增长的方法，界定出一幅图像中的人体所占的区域；之后，在利用遗传算法进行检索的模块中使用所构造的遗传算法对已得到的初步搜索区域通过交叉变异运算进行检索，当遗传算法搜索结果超过预定的阈值或者世代演进超过120代的时候，搜索即告结束；最后，将检索结果以文字或者图像的形式返回给用户。
本方法经过系统原型的具体实施，效果较好，遗传算法的使用使得在查找的准确度方面，有很大的改观。此外，由于在前端引入图像的特征提取和搜索区域的初步定界，减少了大量的冗余计算，所以在查找的速度方面也有一定的改善。
权利要求
1.一种基于遗传算法的图像内容检索方法，其特征在于方法具体如下首先，由用户通过人机接口提供期望查找的目标对象图像；其次，对目标对象进行特征提取，并基于特征提取后的目标对象生成目标对象模板集；然后，一方面基于模板集构造具体遗传算法，另一方面基于已得到的目标对象特征对等待检索的图像数据库中的每一图像进行搜索区域初步范围定界；最后，利用所构造的遗传算法对已得到的初步搜索区域进行检索，并将检索结果返回给用户。
2.根据权利要求1所述的这种基于遗传算法的图像内容检索方法，其特征是以下对方法所作的进一步的描述(1)由人机接口接受用户提供的需要查找的特定目标对象图像；(2)对用户输入的目标对象进行预处理，应用特征提取技术，提取用户输入的特定目标对象的颜色和轮廓方面的特征信息，并基于目标对象生成目标对象模板集；(3)进行匹配检索操作，对于媒体库中等待被检索的每一图像，利用上述的颜色和轮廓特征提取方法，且根据用户目标图像中所提取的特征值进行图像处理，并且借助区域增长的方法界定待检测的图像的搜索区域初步范围，然后，利用基于模板集构造的性能良好的遗传算法在已得到的初步检索区域内进行优化匹配检索；(4)根据检索结果并按照用户的实际应用需求，或者将查找到的图像返回给用户，或者以文字形式通知用户是否已检索到所需要的图像。
3.根据权利要求2所述的这种基于遗传算法的图像内容检索方法，其特征是在特征提取方面，颜色信息提取采用直方图统计的方法，而图形轮廓提取则采用坎尼算子的方法；在模板集生成方面，对于特征提取后的目标对象，采用放大，缩小，旋转等变形技术，生成具有相似性的新模板，以扩展用户目标对象模板数量，形成用户目标对象模板集，对于该模板集中的每一模板，用N个bits来编码其编号，该编号将在后续的遗传检索算法中代表具体的模板，N个bits最多表示2N个模板。
4.根据权利要求2所述的这种基于遗传算法的图像内容检索方法，其特征是区域增长法主要是基于所提取的图像特征信息在图像中给定起始增长点和增长阈值后，采用递归搜索每一个像素点的周围相邻8个点，用标记掩码的方式来连接离散的图像轮廓或者区域，构成连续的封闭区域并将其确定为图像中进行检索的初步区域。
5.根据权利要求2所述的这种基于遗传算法的图像内容检索方法，其特征是遗传算法在得到模板集后就构造出来，在该算法中，每一条染色体采用M个bits表示，其中K个bits表示图像二维空间中目标的位置，每条染色体搜索的范围是2K/2*2K/2大小，其余的M-K个bits表示模板的编码，另外，染色体的适应度函数用最小相关误差表示，在利用该算法检索时，根据最小相关误差函数计算每一条染色体的适应度函数值，并且根据计算结果从大到小排序，每一世代保留最优的若干条染色体，当算法收敛到设定的阈值或者遗传算法演进到规定的世代数时，搜索即告结束，得到检索结果。
全文摘要
一种基于遗传算法的图像内容检索方法属于图像信息处理领域。方法具体如下首先，由用户通过人机接口提供期望查找的目标对象图像；其次，对目标对象进行特征提取，并基于特征提取后的目标对象生成目标对象模板集；然后，一方面基于模板集构造具体遗传算法，另一方面基于已得到的目标对象特征对等待检索的图像数据库中的每一图像进行搜索区域初步范围定界；最后，利用所构造的遗传算法对已得到的初步搜索区域进行检索，并将检索结果返回给用户。本发明与已有的相应技术相比，具有高效的智能检索效果，同时其兼顾检索速度问题，对检索速度进行了一定的改善。
文档编号G06K9/36GK1405727SQ02145109
公开日2003年3月26日申请日期2002年11月7日优先权日2002年11月7日
发明者李生红, 杨树堂, 李建华, 毛俊逸, 须泽中, 杨慰籍申请人:上海交通大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李生红;杨树堂;李建华;毛俊逸;须泽中;杨慰籍
技术所有人：上海交通大学
我是此专利的发明人

上一篇：一种医疗资助一卡通系统的制作方法
上一篇：基于fpga的51核ic卡硬件仿真器的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。