基于稀疏组群结构的图像标注方法

文档序号:6463871阅读:181来源:国知局
专利名称:基于稀疏组群结构的图像标注方法
技术领域
本发明涉及一种基于稀疏组群结构的图像标注的方法。该方法利用稀疏组群结构进行特征选择,结合标注单词间的相关性学习来对图像进行标注。
背景技术
随着图像特征提取技术的日益成熟,可以提取的异构特征越来越多,它们可以用来描述图像视觉特征的多个方面,例如全局特征(颜色、纹理)和局部特征(SIFT、形状上下文、GLOH(梯度位置和方向直方图))。虽然可从图像中提取众多异构特征,但是不同异构特征有着不同的内在表达能力。也就是说,若干种类异构特征的组合可充分表达图像某一语义,而不是所有异构特征全部组合起来表达图像某一语义,后者将会引入过多无关特征或噪音,影响图像语义的精确表达。因此,在图像标注过程中,对于给定的图像标注单词,将会只有有限种异构特征可以用来表达这一标注单词,对某个图像语义来说,所选择的异构特征因此往往是比较稀疏的。iS^Jfe lasso (least absolution shrinkage and selection operator)
想被提出,借助于其所具有的变量选择特性,一些在lasso基础上进行图像特征稀疏性选择的方法被提出。但是,图像的视觉特征具有明显的组群结构,不同类别的视觉特征具有不同的视觉特性。如果在图像标注中能够充分利用这种组群结构,构造相应异构特征的选择机制,将会促进图像标注结果的“可解释性”。在传统图像多标注处理过程中,一般会对每个标注单词构建一个独立的回归模型而预测标注结果,这种方法没有考虑到标注单词之间的相关性,影响了标注结果。为了将标注间的相关性考虑进来,一些算法利用了典型相关分析或者共享结构来更好的学习多标注间的关联。

发明内容
本发明的目的是克服现有技术的不足,提供一种基于稀疏组群结构的图像标注方法。基于稀疏组群结构的图像标注方法包括如下步骤1)对图像数据集进行特征提取;2)对每个图像数据集选取η个数据作为训练集,其余作为测试集,使每个标注单词都出现在训练集合中;3)利用稀疏组群结构对图像进行特征选择;4)利用图像标注单词之间的关系进一步优化标注结果。所述的对图像数据集进行特征提取的步骤为1)对图像数据进行特征提取,特征包括全局特征和局部特征,全局特征包括颜色、 纹理、形状,局部特征包括SIFT、形状上下文;
4
2)将每幅图像用多种异构特征向量的组合来表示,即,一幅图像表示为(Xi, Yi) eRpx{o,l}G,其中Xi= 0^,...,^/£铲表示图像的特征向量,?表示特征维数,71 =(yn,...,yiC)Te {0,1广是相应的标注向量,C表示数据集的标注单词总数,= 1表示第i幅图像有第j个标注,否则,yu = o,假设从图像数据中提取G类特征,dg表示第g类
特征的维数,ge {1,...,G},那么弋=P,图像的特征向量重新表示为
权利要求
1.一种基于稀疏组群结构的图像标注方法,其特征在于包括如下步骤1)对图像数据集进行特征提取;2)对每个图像数据集选取η个数据作为训练集,其余作为测试集,使每个标注单词都出现在训练集合中;3)利用稀疏组群结构对图像进行特征选择;4)利用图像标注单词之间的关系进一步优化标注结果。
2.根据权利要求1所述的一种基于稀疏组群结构的图像标注方法,其特点在于,所述的对图像数据集进行特征提取的步骤为1)对图像数据进行特征提取,特征包括全局特征和局部特征,全局特征包括颜色、纹理、形状,局部特征包括SIFT、形状上下文;2)将每幅图像用多种异构特征向量的组合来表示,即,一幅图像表示为(Xi, Yi) eRpX{0,l}G,其中Xi= 0^,...,^/£铲表示图像的特征向量,?表示特征维数,71 =(yn,...,yiC)Te {0,1广是相应的标注向量,C表示数据集的标注单词总数,= 1表示第i幅图像有第j个标注,否则,yu = o,假设从图像数据中提取G类特征,dg表示第g类G特征的维数,ge {^,...,⑵,那么!;义二厂,图像的特征向量重新表示为一(τ τ vg^lXi 一、X/,l,...,X/’f; J °
3.根据权利要求1所述的一种基于稀疏组群结构的图像标注方法,其特点在于,所述的利用稀疏组群结构对图像进行特征选择的步骤为1)对每个标注单词c(ce {1,...,C}),训练回归模型f。,训练模型包括一个逻辑损失函数和一个正则化项风广)二+《丨丨2,其中λ是一个可调节的参数,S=Iw^IiogSSI,成是截距项,&卢⑷’…而表示对应第g类异构特征的参数向量;2)通过迭代求解上述最优化问题,得到参数向量β,图像特征选择结果为5·二^^。
4.根据权利要求1所述的一种基于稀疏组群结构的图像标注方法,其特点在于,所述的利用图像标注单词之间的关系进一步优化标注结果的步骤为1)假设给定η个有标注单词的图像样例,X=(xi; X2,..., xn) GRpxn,Y= (yi,y2,..., yn) e Rexn,分别表示图像的特征向量和标注单词向量;2)运用典型相关分析选择向量Wx和Wy使X和Y之间相关性最大,即求解以下最优化问题(wx,wy) = arg msix{corr{wrxX, wTyY)}WtXYtWcorr{wTX, wTY) 二 ,x y^{wTxXXT wX^yYY1Wy)解得相关向量Wx和Wy ;3)优化的标注结果夕二砂,其中j)是前一步通过回归模型解得的,B= T-1DT, T是一个 CXC的矩阵,其中的每一行是运用典型相关分析得到的典型相关坐标,即Γ D是一个CXC的对角矩阵D = diag(d1, d2,. . .,dc),其对角线上的元素通过典型相关分析以后的X 和Y的协方差得到
全文摘要
本发明公开了一种基于稀疏组群结构的图像标注方法。包括如下步骤1)对图像数据集进行特征提取;2)对每个图像数据集选取n个数据作为训练集,其余作为测试集,使每个标注单词都出现在训练集合中;3)利用稀疏组群结构对图像进行特征选择;4)利用图像标注单词之间的关系进一步优化标注结果。本发明充分利用了图像异构特征的组群性质来对图像特征进行筛选,利用图像标注单词之间的相关性来优化图像标注,比传统标注方法产生的标注结果更准确。
文档编号G06F17/30GK102375855SQ201010262568
公开日2012年3月14日 申请日期2010年8月20日 优先权日2010年8月20日
发明者吴飞, 庄越挺, 袁莹 申请人:浙江大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1