一种基于主动学习的图像标注方法

文档序号:6541273阅读:193来源:国知局
一种基于主动学习的图像标注方法
【专利摘要】本发明公开了一种基于主动学习的网络图像标注方法。该方法首先基于图像数据集构建表征图像视觉相似性关系的K近邻图结构,计算相应的拉普拉斯图矩阵L;接着采用迭代计算求解最优化问题,选择出T个标注样本让用户进行标注;然后根据选择出来的T个标注样本训练多类别SVM分类器模型fsvm,最后基于训练的SVM分类模型fsvm对图像数据集中的图像进行图像类别判断,依据判别结果对图像进行标注,从而实现基于主动学习的图像标注。本方法采用迭代依次挑选出最具代表性的图像数据进行交互式标注,不仅提高训练的SVM模型性能和图像标注的准确度,还能减少需要标注的图像数目,达到减轻人工劳动量的目的。
【专利说明】一种基于主动学习的图像标注方法
【技术领域】
[0001]本发明涉及网络图像标注技术,主动学习技术和SVM分类器,尤其涉及采用主动学习进行图像标注方法。
【背景技术】
[0002]近年来,伴随着计算机视觉技术和机器学习算法的兴起,基于图像内容的网络图像自动标注技术得到飞速发展。通用的图像标注流程包括:(1)图像视觉特征提取和表达;
[2]基于训练数据对分类器或者搜索模型进行训练;(3)使用训练好的分类器或者搜索模型对图像进行分类或者是搜索近邻,实现对图像的标注。
[0003]从上面的通用图像标注流程可以看出无论是分类器还是搜索模型的构建通常都是需要训练数据集的支撑。而构建这样的训练数据,经常需要对图像数据进行标注,比较耗时同时也是比较繁琐的。为了节省人工标注的劳动量,以往的研究工作一般是从两个方法来解决这个问题。
[0004]第一种解决思路是采用半监督学习的方法,只对训练数据集中的少量数据进行标注,然后将数据集中大量的未标注的数据加入到模型的训练中,通过挖掘图像之间存在的特征空间上的近邻关系来提高算法的准确性。
[0005]第二种解决思路是采用主动学习的方法,通过采用某种策略和方法,主动地从训练数据集中挑选出部分具有代表性或者是最具模糊性的图像数据,对这些数据进行人工标注,然后利用这些标注的数据集对算法模型进行训练。由于标注的数据是经过智能选择过的,因此使用这些的标注数据进行模型训练,可以进一步提高算法的准确率。
[0006]关于第一种解决思路的相关工作可以参考Xiaojin Zhu的《Sem1-supervisedLearning Survey》一文。第二中解决思路是与本发明所提出的方法关系最密切的。这类工作包括支持向量机主动学习(Support Vector Machine active learning, SVMactive),基于回归的主动学习方法(Regression based active learning),基于最优实验设计(Optimal Experiment Design, OED)类的主动学习方法和基于图的主动学习方法,如Laplacian Optimal Design (LOD)等
[0007]与上面介绍的方法不同,本发明所提出的方法采用贪心算法求解需要标注的图像数据,在得到用户标注图像结果后,我们将其应用到多类别SVM模型中,训练SVM模型,然后应用训练结果对数据集中的其他图像进行自动标注。

【发明内容】

[0008]本发明的目的是为了克服在训练SVM算法模型是需要提供大量人工标注的图像数据,耗费时间和人力的问题,提供一种基于主动学习的网络图像标注方法。
[0009]基于主动学习的网络图像标注方法包括如下步骤:
[0010]I)对网络图像数据集MSRA-MM数据集中,选择80类图像,每类100张图像,共计8000张图像,提取64维的颜色直方图和255维的颜色纹理矩特征,构成319维的图像视觉特征表达,得到图像特征集X = [X1, X2,, Xn] e Rdxn,其中d = 319为图像特征维度,η =8000为图像样本数;
[0011]2)构建表征图像视觉相似性关系的K近邻图结构,以图像特征集中样本作为K近邻图的顶点,K近邻图的边权重矩阵S设置如下:
【权利要求】
1.一种基于主动学习的网络图像标注方法,其特征在于包括如下步骤: 1)对网络图像数据集MSRA-MM数据集中,选择80类图像,每类100张图像,共计8000张图像,提取64维的颜色直方图和255维的颜色纹理矩特征,构成319维的图像视觉特征表达,得到图像特征集X= [x1; X2,, xn] e Rdxn,其中d = 319为图像特征维度,η = 8000为图像样本数; 2)构建表征图像视觉相似性关系的K近邻图结构,以图像特征集中样本作为K近邻图的顶点,K近邻图的边权重矩阵S设置如下:
【文档编号】G06K9/62GK103942561SQ201410106864
【公开日】2014年7月23日 申请日期:2014年3月20日 优先权日:2014年3月20日
【发明者】陈晋音, 黄坚 申请人:杭州禧颂科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1