一种基于多示例包特征学习的图像多标签标注算法_2

文档序号:9911674阅读:来源:国知局
直方图特征,并首 尾相接排成一列,所有图像分块特征按列排成一个矩阵,得到测试图像包的特征矩阵,矩阵 每列看作测试图像包的一个示例特征;
[0051] 步骤6.4:计算测试图像包与投影示例的距离,排成一列得到测试图像包的投影特 征向量;
[0052]步骤6.5:依据步骤五学习得到的特征选择系数W的非零行序号集合IX,对应选择 出测试图像包投影向量的行,得到测试图像包的分类特征;
[0053]步骤6.6:将测试图像包的分类特征分别输入步骤6.1得到的训练好的SVM分类器, 分别得到每个标签的预测概率,如果概率值大于等于设定值则该标签被标注于测试图像, 反之,则该标签不被标注于测试图像,如此便得到最终的测试图像标注结果。
[0054]进一步的,该设定值为0.5。
[0055]本发明的有益效果:
[0056] (1)本发明在学习包分类特征的同时剔除了干扰示例,选择出了判别性高的图像 包特征。
[0057] (2)本发明在学习包分类特征时兼顾了训练图像集合的多标签之间的关系,增加 了包分类特征所包含的语义信息。
[0058] (3)本发明提出了一种新的基于多示例包特征学习的图像多标签标注算法,该技 术具有重要的学术意义和社会意义,并具有广阔的应用前景。
【具体实施方式】:
[0059]下面对本发明进行详细说明:
[0060] 一种基于多示例包特征学习的图像多标签标注算法,该方法具体包括以下步骤:
[0061] 步骤1:获得训练图像集合并对其中的图像进行分割,得到所有图像的分块图像集 合;图像分割算法以像素RGB颜色值作为聚类目标,采用模糊C均值聚类(FCM)算法进行图像 分割。
[0062] 步骤2:对训练集合中的每个图像分块提取颜色直方图特征和方向梯度直方图特 征(H0G特征)。具体步骤如下:
[0063] 步骤2.1:分别提取图像分块每个像素的R,G,B颜色值;
[0064] 步骤2.2:将颜色值平均分为16组,以16作为组距,分别统计R,G,B三种颜色值在每 组颜色值范围内的像素数,并采用最大值归一化后,得到R,G,B三种颜色的直方图;
[0065]步骤2.3:将R,G,B三种颜色直方图首尾相接得到48维的图像分块颜色直方图特征 列向量;
[0066]步骤2.4:将图像块进行灰度化,并提取每个像素灰度值;
[0067]步骤2.5:采用Gamma校正法对输入图像块进行颜色空间的标准化;
[0068]步骤2.6:计算图像每个像素的梯度(包括大小和方向);计算步骤如下:
[0069]步骤2.6.1:计算每个像素点(X,y)的梯度如下:
[0070] Gi(x,y)=H(x+l ,y)-H(x-l ,y)
[0071] G2(x,y)=H(x,y+l)-H(x,y-l)
[0072] 式中,Gi(x,y),G2(x,y),H(x,y),分别表示像素点(x,y)处的水平方向梯度、垂直方 向梯度和像素灰度值。
[0073]步骤2.6.2:计算每个像素点(x,y)处的梯度幅值和梯度方向如下:
[0074]
[0075]
[0076]步骤2.7:将梯度方向360度分为12组,组距30度,来统计每个图像块的方向梯度直 方图。统计过程为:如果一个像素的梯度方向在直方图某组梯度方向数值范围内,则该组统 计计数根据该像素梯度大小增加相应的计数。如:一个像素梯度方向为40度,大小为2,则需 在方向梯度直方图31-60这个数值区间的组上增加计数2。统计好的方向梯度直方图进行最 大值归一化后,则得到维数为12维的图像分块方向梯度直方图,用列向量表示;
[0077] 步骤2.8:将颜色直方图与方向梯度直方图首尾相接,则得到图像分块的特征值向 量,用列向量表示;
[0078] 步骤3:将一个图像看作一个包,该图像的分块特征看作包内的示例,则得到多示 例学习框架所需的图像包结构;用一个矩阵表示一个图像包,矩阵的每列为步骤2中所得到 的每个图分块示例的特征向量;
[0079] 步骤4:将训练集合中所有图像包中的示例组成投影示例集合,每个图像包通过向 该集合投影得到图像包的投影特征,具体步骤如下:
[0080] 步骤4.1:收劁斤有训练图像包集合的所有示例,^示例集合卜ΙΛ ft, ··,. ·。其 中,Μ表示所有示例数,pm为投影示例集合的第m个示例;
[0081 ] 步骤4.2:计算图像包到每个投影示例的距离,其计算如下:
[0082]
[0083]
[0084] 其中,Xi为第i个图像包,xi,j为第i个图像包的第j个示例,pm为投影示例集合中的 第m个示例,σ为高斯距离参数,取1~2之间的值。s( Xld,pm)所求的是包内示例到投影示例 的高斯距离。图像包到投影示例的距离dUuPm)所求为图像包内所有示例到投影示例高斯 距离中的最小距离。
[0085]步骤4.3:将图像包到所有投影示例的距离值排成一列,得到图像包的投影特征; [0086]步骤5:将图像包投影特征经过12>1范式约束的稀疏表示模型进行特征学习,选择 出判别性高的特征作为图像包的分类特征,具体步骤如下:
[0087] 步骤5.1:将训练集中每个图像包的投影特征作为矩阵的列,得到训练集投影特征 矩阵Z=[Z1,…, Ζι,···ΖΝ],其中,N为训练集图像包的数量。将训练集中每个图像包的标签值 作为列,得到训练集图像包标签矩阵Y= [yi,…,yi,…yN],其中每个图像包的标签值yi为一 个列向量,其维度为图像集的标签总数,其元素数取值为[0,1]。如果元素值为1,则对应的 标签被标注到该图像,否则,该标签不被标注到该图像;
[0088] 步骤5.2:构造 12, i范式约束稀疏表示模型如下:
[0089]
[0090] 其中,Z为训练集投影特征矩阵,其列向量为每个图像包的投影特征,W为12>1范式 约束稀疏表示模型要求解的特征选择系数。Y为训练集图像包标签矩阵,其每列对应一个图 像包的标签向量,每个标签向量的元素数对应图像标签数,非零元素表示其对应标签被标 注于该图像。N为训练集图像包的数量。在优化求解出1 2>1范式约束稀疏表示模型的W后,根 据W的非零行序号则可对应选择出相应包特征矩阵Z的行,所选择出的行组成的矩阵即为图 像包分类特征矩阵,其每列为每个训练图像包的分类特征。
[0091] 步骤5.3:采用增广拉格朗日算法求解出12>1范式约束稀疏表示模型中的特征选择 系数I
[0092] 步骤5.4:记录W中的非零行序号集合为IX,选取训练集投影特征矩阵Z中序号为IX 的行则得到学习的图像包分类特征;
[0093]步骤6:将学习出的训练集图像包分类特征送入SVM分类器进行训练,得到训练模 型的参数,用训练好的SVM分类器对未知标签信息的测试图像标签进行预测,具体步骤如 下:
[0094]步骤6.1:将步骤5中学习到的训练集图像包分类特征分别送入不同标签对应的 SVM分类器进行训练,则每一个标签学习得到一个SVM分类器;
[0095] 步骤6.2:用模糊C均值聚类(FCM)算法将测试图像进行图像分割,得到测试图像分 块;
[0096] 步骤6.3:对每个测试图像分块提取颜色直方图特征和方向梯度直方图特征,并首 尾相接排成一列,所有图像分块特征按列排成一个矩阵,得到测试图像包的特征矩阵,矩阵 每列看作测试图像包的一个示例特征;
[0097]步骤6.4:依据步骤4的方法,计算测试图像包与投影示例的距离,排成一列得到测 试图像包的投影特征向量;
[0098]步骤6.5:依据步骤5学习得到的特征选择系数W的非零行序号集合IX,对应选择出 测试图像包投影向量的行,得到测试图像包的分类特征;
[0099]步骤6.6:将测试图像包的分类特征分别输入步骤6.1得到的训练好的SVM分类器, 分别得到每个标签的预测概率
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1