一种基于社区分析的图像索引并行构建方法

文档序号:8457380阅读:257来源:国知局
一种基于社区分析的图像索引并行构建方法
【技术领域】
[0001]本发明涉及图像查询技术领域,具体地是涉及一种基于社区分析的图像索引并行构建方法。
【背景技术】
[0002]从人类的认知角度看,人类对图像的描述和理解主要是在语义层次上进行。而图像的底层物理特征(如色彩、纹理、形状、结构等)难于表达图像高层语义内容,图像表达的数字阵列与通常可以被人类所接受的概念化内容之间存在着语义鸿沟。如果不对原始图像进行预处理,仅仅根据整幅图像的底层物理特征进行检索,图像中将包含了大量不相关的信息。这些不相关的信息直接影响检索的准确性,即使采用相关反馈技术也难以取得比较令人满意的检索结果。
[0003]因此,本发明的发明人亟需构思一种新技术以改善其问题。

【发明内容】

[0004]为了解决上述不足,本发明提供了一种基于社区分析的图像索引并行构建方法。
[0005]为解决上述技术问题,本发明的技术方案是:
[0006]一种基于社区分析的图像索引并行构建方法,包括如下步骤:
[0007]S1:采用并行K均值聚类算法对目标图像实现聚类,所述目标图像由多个视觉关键词构成的特征聚类向量表示;
[0008]S2:对聚类得到的每个类分别建立索引;
[0009]S3:进行图像查询。
[0010]进一步地,所述步骤SI具体包括:
[0011]Sll:提取目标图像和图像数据库中每幅图像的颜色特征和纹理特征;
[0012]S12:对描述图像内容的高维特征进行降维,得到特征子集;
[0013]S13:结合网格的样本密度,对特征子集构成的数据集进行聚类。
[0014]进一步地,所述步骤S3具体包括:
[0015]S31:将目标图像中提取的降维后的特征子集与所述步骤SI最终所得到的各聚类中心进行匹配,选择最相似的索引树;
[0016]S32:在最相似的索引树中,根据目标图像的所述颜色特征和纹理特征进行检索,得到相似性匹配结果。
[0017]进一步地,所述步骤S13具体包括:
[0018]S131:将降维后的低维数据空间划分成固定大小的网格;
[0019]S132:计算每个网格中落入的样本数目得到每个格点的样本密度;
[0020]S133:将格点按照其样本密度排序;
[0021]S134:根据排序结果得到初始聚类的分类数和各分类的初始中心;
[0022]S135:用K均值方法来模拟数据点的分布,得到最终的聚类结果。
[0023]进一步地,所述步骤S12中对高维图像特征进行降维时,选择全局颜色矩作为表征图像内容的特征向量。
[0024]进一步地,选择全局颜色矩是选取颜色的一阶矩、二阶矩和三阶矩作为表征图像的特征向量。
[0025]采用上述技术方案,本发明至少包括如下有益效果:
[0026]本发明所述的基于社区分析的图像索引并行构建方法,采用并行K均值聚类算法对图像块实现聚类,图像采用由一系列的视觉关键词构成的特征聚类向量表示,在图像检索时能避免线性扫描海量、高维和动态的特征数据库。采用向量空间模型及语言模型计算每个图像对的语义相似度,构建图像的语义相似度社会网络,在此基础上,基于大规模社区分析方法构建海量图像的语义索引。在索引构建中采用高维聚类索引空间的某些有意义的子空间计算图像间的相似度,从而克服聚类索引“维度灾难”的问题,结合图像块物理特征索引与图像全局层次的语义索引,提升海量图像检索的速度和效果。
【附图说明】
[0027]图1为本发明所述的基于社区分析的图像索引并行构建方法的流程图。
【具体实施方式】
[0028]下面结合附图和实施例对本发明进一步说明。
[0029]如图1所示,为符合本发明的一种基于社区分析的图像索引并行构建方法,包括如下步骤:
[0030]S1:采用并行K均值聚类算法对目标图像实现聚类,所述目标图像由多个视觉关键词构成的特征聚类向量表示;
[0031]S2:对聚类得到的每个类分别建立索引;
[0032]S3:进行图像查询。
[0033]进一步地,所述步骤SI具体包括:
[0034]Sll:提取目标图像和图像数据库中每幅图像的颜色特征和纹理特征;
[0035]S12:对描述图像内容的高维特征进行降维,得到特征子集;
[0036]S13:结合网格的样本密度,对特征子集构成的数据集进行聚类。
[0037]进一步地,所述步骤S3具体包括:
[0038]S31:将目标图像中提取的降维后的特征子集与所述步骤SI最终所得到的各聚类中心进行匹配,选择最相似的索引树;
[0039]S32:在最相似的索引树中,根据目标图像的所述颜色特征和纹理特征进行检索,得到相似性匹配结果。
[0040]进一步地,所述步骤S13具体包括:
[0041]S131:将降维后的低维数据空间划分成固定大小的网格;
[0042]S132:计算每个网格中落入的样本数目得到每个格点的样本密度;
[0043]S133:将格点按照其样本密度排序;
[0044]S134:根据排序结果得到初始聚类的分类数和各分类的初始中心;
[0045]S135:用K均值方法来模拟数据点的分布,得到最终的聚类结果。
[0046]进一步地,所述步骤S12中对高维图像特征进行降维时,选择全局颜色矩作为表征图像内容的特征向量。
[0047]进一步地,选择全局颜色矩是选取颜色的一阶矩、二阶矩和三阶矩作为表征图像的特征向量。
[0048]本实施例采用并行K均值聚类算法对图像块实现聚类,图像采用由一系列的视觉关键词构成的特征聚类向量表示,在图像检索时能避免线性扫描海量、高维和动态的特征数据库。采用向量空间模型及语言模型计算每个图像对的语义相似度,构建图像的语义相似度社会网络,在此基础上,基于大规模社区分析方法构建海量图像的语义索引。在索引构建中采用高维聚类索引空间的某些有意义的子空间计算图像间的相似度,从而克服聚类索弓I “维度灾难”的问题,结合图像块物理特征索引与图像全局层次的语义索引,提升海量图像检索的速度和效果。
[0049]本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
【主权项】
1.一种基于社区分析的图像索引并行构建方法,其特征在于,包括如下步骤: 51:采用并行K均值聚类算法对目标图像实现聚类,所述目标图像由多个视觉关键词构成的特征聚类向量表示; 52:对聚类得到的每个类分别建立索引; 53:进行图像查询。
2.如权利要求1所述的基于社区分析的图像索引并行构建方法,其特征在于,所述步骤SI具体包括: 511:提取目标图像和图像数据库中每幅图像的颜色特征和纹理特征; 512:对描述图像内容的高维特征进行降维,得到特征子集; 513:结合网格的样本密度,对特征子集构成的数据集进行聚类。
3.如权利要求1所述的基于社区分析的图像索引并行构建方法,其特征在于,所述步骤S3具体包括: 531:将目标图像中提取的降维后的特征子集与所述步骤SI最终所得到的各聚类中心进行匹配,选择最相似的索引树; 532:在最相似的索引树中,根据目标图像的所述颜色特征和纹理特征进行检索,得到相似性匹配结果。
4.如权利要求2或3所述的基于社区分析的图像索引并行构建方法,其特征在于,所述步骤S13具体包括: 5131:将降维后的低维数据空间划分成固定大小的网格; 5132:计算每个网格中落入的样本数目得到每个格点的样本密度; 5133:将格点按照其样本密度排序; 5134:根据排序结果得到初始聚类的分类数和各分类的初始中心; 5135:用K均值方法来模拟数据点的分布,得到最终的聚类结果。
5.如权利要求4所述的基于社区分析的图像索引并行构建方法,其特征在于:所述步骤S12中对高维图像特征进行降维时,选择全局颜色矩作为表征图像内容的特征向量。
6.如权利要求5所述的基于社区分析的图像索引并行构建方法,其特征在于:选择全局颜色矩是选取颜色的一阶矩、二阶矩和三阶矩作为表征图像的特征向量。
【专利摘要】本发明公开了一种基于社区分析的图像索引并行构建方法,采用并行K均值聚类算法对图像块实现聚类,图像采用由一系列的视觉关键词构成的特征聚类向量表示,在图像检索时能避免线性扫描海量、高维和动态的特征数据库。采用向量空间模型及语言模型计算每个图像对的语义相似度,构建图像的语义相似度社会网络,在此基础上,基于大规模社区分析方法构建海量图像的语义索引。在索引构建中采用高维聚类索引空间的某些有意义的子空间计算图像间的相似度,从而克服聚类索引“维度灾难”的问题,结合图像块物理特征索引与图像全局层次的语义索引,提升海量图像检索的速度和效果。
【IPC分类】G06F17-30, G06K9-62
【公开号】CN104778281
【申请号】CN201510224042
【发明人】束兰, 黄裕新
【申请人】苏州搜客信息技术有限公司
【公开日】2015年7月15日
【申请日】2015年5月6日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1