一种社会媒体下的图像集摘要生成算法

文档序号：6622250阅读：232来源：国知局

一种社会媒体下的图像集摘要生成算法
【专利摘要】本发明公开了一种社会媒体下的图像集摘要生成算法，首先提取社会媒体下的图像集中图像的视觉特征；然后对提取的局部特征和全局特征进行融合和匹配；接着利用最优特征点的空间约束关系构成空间位置地图并构成简化的几何约束代表数据集，进一步滤除噪声点；其次建立基于近邻传播的自动聚类模型；最后采用聚类有效性指标查找一组最优类中心。本发明能够充分利用图像的多模态特征，对社会媒体下的图像集中大量相关图像进行摘要，从而准确生成一组最优代表性图像。
【专利说明】一种社会媒体下的图像集摘要生成算法

【技术领域】
[0001] 本发明涉及社会媒体图像集的分析与检索领域，具体是一种社会媒体下的图像集摘要生成算法。

【背景技术】
[0002] 随着互联网技术的飞速发展和多媒体技术的广泛应用，互联网地位不断提升，并成为人们交流和共享信息的主要平台。网络用户自发贡献图片和视频等多媒体资料，并通过分享、评价、讨论等方式传播，从而海量的图片潮水般的涌向网络。在如此浩瀚的图片海洋中，找到那个我们想要的图片并非易事。当我们发起一个查询，返回给我们的是一个庞大的多媒体图片集队列，并且有大量内容重复或部分重复的数据，同时也包含相当数量与查询内容弱相关或不相关的数据。如何快速并且准确地从这样一个充斥着大量冗余和噪声数据的大规模图片集合中浏览和获取用户所需信息，已经成为迫切需要解决的问题。
[0003] 近年来，图像集摘要作为一种有效的信息处理方法，得到了学术界越来越多的关注。目前存在的图像集的摘要技术，主要使用尺度不变的局部SIFT特征作为图像的视觉特征，SIFT特征虽然有较好的稳定性，但由其特征维度较高，所以计算代价较大。
[0004] 在数据挖掘领域，聚类是一种非常有效的将输入空间划分成簇的无监督模式分类方法，被广泛应用于模式识别、数据分析、信息检索等领域。聚类分析从数据集中发现数据间的相似性，并根据相似性对数据进行分类，同一簇内的数据尽可能相似，不同簇间的数据尽可能的相异，其目标是识别数据集的自然结构。但是，目前所提出的聚类分析用于图像集摘要生成时，存在以下的缺陷和不足：
[0005] 第一，传统的聚类方法需要预先给定簇的个数，或者对一个基本的数据集假设一些可能的分布。这些需求具有不可操作性，因为用户在聚类分析之前可能并没有这方面的信息。很多聚类方法只能凭经验指定簇个数。簇个数越少使得计算简单但数据集划分的准确度低，簇个数越高使得数据集的划分准确度高但摘要图像有冗余。
[0006] 第二、传统的聚类算法依赖于初始聚类中心，所以结果往往不稳定。
[0007] 第三，一个最优的聚类算法是不存在的，没有一个聚类方法适合于所有的数据集。

【发明内容】

[0008] 本发明的目的是提供一种社会媒体下的图像集摘要生成算法，以避免现有技术所存在的不足之处，能够充分利用图像的视觉特征，对互联网平台的社会化图像集自动生成摘要，从而准确地表示出与事件最相关的一组社会化图像。
[0009] 为了达到上述目的，本发明所采用的技术方案为：
[0010] 一种社会媒体下的图像集摘要生成算法，其特征在于：包括以下步骤：
[0011] ⑴、提取社会媒体图像集I中图像Ii (1彡i彡η)的视觉特征，其中包括局部SURF 特征、全局颜色特征和纹理特征，然后构建特征空间矩阵；
[0012] (2)、匹配特征空间，用最近邻比率找到一组最优匹配点对，构造空间地图，对于任
[0013] 意N个匹配点，第i个和第j个匹配点的位置关系使得空间信息表Μ中元素取值如公式（1)、公式⑵所示，

【权利要求】
1. 一种社会媒体下的图像集摘要生成算法，其特征在于：包括以下步骤： (1) 、提取社会媒体图像集I中图像Ii (1 < i < Π )的视觉特征，其中包括局部SURF特征、全局颜色特征和纹理特征，然后构建特征空间矩阵； (2) 、匹配特征空间，用最近邻比率找到一组最优匹配点对，构造空间地图，对于任意N 个匹配点，第i个和第j个匹配点的位置关系使得空间信息表Μ中元素取值如公式（1)、公式⑵所示，
其中^为Μ矩阵的第i行第j列的元素，Xi、yi分别是匹配点i的坐标，\、t分别是匹配点j的坐标，根据匹配点最近邻比率越小正确率越高的特点，挑选前T个最优匹配点，两两组合分别构造 A'=(彳个参考坐标，对应两个匹配点a和b，且a〈b，以a点为中心，a点指向b点的方向作为X轴正方向，从而确定了坐标旋转角度β如公式（3)所示：
其中，xa、ya是a点坐标，xb、yb是b点坐标。匹配点（x，y)在新坐标系下的坐标（xk，yk)如公式⑷所示：
那么形成了 3维空间约束矩阵Μ如公式（5)、公式（6)所示：
其中，k e l，2，L，K; (3) 简化随机抽样一致性拟合初始模型参数的过程，选择少数最优匹配点作为初始样本数据，可以通过设置尽量少的迭代次数来得到尽量真实的单应性矩阵参数，选择投影变换矩阵作为图像变换模型，变换关系如公式（7)所示：
这里，（x2，y2)是原图像中点坐标（Xl，yi)经过投影变换后的点坐标，A，h 8是单应性矩阵参数，ω为尺度因子。这是8个参数的投影变换，至少需要4个匹配对来生成，利用最小二乘法求解这8个参数，如公式（8)所示：
其中，
Η = IX h2 h3 h4 h5 h6 h7 h8] (10)
先设尺度因子ω = 1，得到H的一组值，再用此值计算出ω的值，进行多次迭代求出稳定的Η，初始样本数据数目η由公式（12)所示： n = min {N0, max {n0, n0 log2yN0}} (12) 这里队是一次匹配的匹配点数目，并且队彡4,?为样本数目步长，μ为比例因数； (4) 、待配准的两幅图像根据相应的匹配对分别产生空间约束矩阵，和Μ，对，和Μ 矩阵中的异值点进行统计，生成异值矩阵W如公式（13)所示：， W(i，j，k)=M，(i, j,k) ? M(i, j,k) (13) 为了确保匹配精度，K值选择应大于2,但考虑到运算速度，K取值又不能过大，一般选择K = 3,最后得到特征点在空间约束矩阵下的错误率为屯如公式（14)所示：
设模型参数变换得到匹配点坐标值与实际坐标的距离值为+，根据式（15)进行匹配点判别，由于透视变换矩阵仅为少数数据得出，不能保证求得最精确的结果，所以采用两个约束条件相互补充，如公式（15)所示： φ · djd+α )< y (15) 公式中a为比例因子，γ均为距离阈值； (5) 、建立基于近邻传播的自动聚类模型，采用对分搜索方法输出一系列簇数目的聚类结果，设定有效性指标L，通过对结果的L指标分析进而确定最佳簇数目如公式（16)所示：
其中，ACID为平均最小类间距离，ACOD为平均类间距离，如公式（17)、（18)所示：
(6) 、根据有效性指标找到最优的聚类数目对应着对图像集的分类，同时获得一组聚类中心作为这个数据集的一组代表图像，并构成图像集摘要。
【文档编号】G06F17/30GK104123382SQ201410376990
【公开日】2014年10月29日申请日期:2014年7月31日优先权日:2014年7月31日
【发明者】赵烨, 洪日昌, 汪萌, 刘学亮, 郝世杰申请人:合肥工业大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赵烨;洪日昌;汪萌;刘学亮;郝世杰
技术所有人：合肥工业大学
我是此专利的发明人

上一篇：适于多光谱图像压缩的配准预处理系统的制作方法
上一篇：一种触控黑白板及其驱动方法、触控装置制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。