一种基于多示例包特征学习的图像多标签标注算法_3

文档序号：9911674阅读：来源：国知局

，如果概率值2 〇. 5则该标签被标注于测试图像，反之，则该标签不被标注于测试图像，如此便得到最终的测试图像标注结果。
[0100]上述虽然对本发明的【具体实施方式】进行了描述，但并非对本发明保护范围的限制，所属领域技术人员应该明白，在本发明的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
【主权项】
1. 一种基于多示例包特征学习的图像多标签标注算法，其特征是，包括以下步骤：步骤一:获得训练图像集合并对其中的所有训练图像进行分割，得到所有训练图像的图像分块的集合；步骤二:对训练图像的图像分块的集合中的每个图像分块提取颜色直方图特征和方向梯度直方图特征；步骤三:将一个训练图像看作一个图像包，该训练图像的颜色直方图特征和方向梯度直方图特征看作图像包内的示例，则得到多示例学习框架所需的图像包结构；步骤四：将训练图像集合中所有图像包中的示例组成投影示例集合，每个图像包通过向该投影示例集合投影得到图像包的投影特征；步骤五:将图像包的投影特征经过范式约束的稀疏表示模型进行特征学习，选择出判别性高的特征作为图像包的分类特征；步骤六:将学习出的训练图像集合的图像包的分类特征送入SVM分类器进行训练，得到训练模型的参数，用训练好的SVM分类器对未知标签信息的测试图像标签进行预测。2. 如权利要求1所述的一种基于多示例包特征学习的图像多标签标注算法，其特征是，所述步骤一中，对训练图像进行分割时，以像素RGB颜色值作为聚类目标，采用模糊C均值聚类算法进行图像分割。3. 如权利要求1所述的一种基于多示例包特征学习的图像多标签标注算法，其特征是，所述步骤二中，颜色直方图特征和方向梯度直方图特征的提取具体步骤如下：步骤2.1:分别提取图像分块中每个像素的R，G，B颜色值；步骤2.2:将颜色值平均分为16组，以16作为组距，分别统计R，G，B三种颜色值在每组颜色值范围内的像素数，并采用最大值归一化后，得到R，G，B三种颜色的直方图；步骤2.3:将R，G，B三种颜色直方图首尾相接得到48维的分块图像的颜色直方图特征列向量，继而得到颜色直方图；步骤2.4:将图像分块进行灰度化，并提取每个像素灰度值；步骤2.5:采用Ga_a校正法对输入图像分块进行颜色空间的标准化；步骤2.6:计算图像分块每个像素的梯度；步骤2.7:将梯度方向360度分为12组，组距30度，来统计每个图像分块的方向梯度直方图；步骤2.8:将颜色直方图与方向梯度直方图首尾相接，则得到图像分块的特征值向量，用列向量表示。4. 如权利要求3所述的一种基于多示例包特征学习的图像多标签标注算法，其特征是，步骤2.6中，在计算图像分块每个像素的梯度时具体的计算步骤如下：步骤2.6.1:计算每个像素点(X，y)的梯度如下： Gi(x,y)=H(x+l,y)-H(x-l,y) G2(x,y)=H(x,y+l)-H(x,y-l) 式中，61(1，7)，62&，7)，!1&，7)，分别表示像素点&，7)处的水平方向梯度、垂直方向梯度和像素灰度值；步骤2.6.2:计算每个像素点(X，y)处的梯度幅值和梯度方向如下：5. 如权利要求3所述的一种基于多示例包特征学习的图像多标签标注算法，其特征是，所述步骤2.7中，所述统计过程为:如果一个像素的梯度方向在直方图某组梯度方向数值范围内，则该组统计计数根据该像素梯度大小增加相应的计数;统计好的方向梯度直方图进行最大值归一化后，则得到维数为12维的图像分块方向梯度直方图，用列向量表示。6. 如权利要求3所述的一种基于多示例包特征学习的图像多标签标注算法，其特征是，所述步骤三中，用一个矩阵表示一个图像包，矩阵的每列为步骤2.8中所得到的每个图像分块示例的特征向量。7. 如权利要求1所述的一种基于多示例包特征学习的图像多标签标注算法，其特征是，所述步骤四中，具体步骤为：步骤4.1:收集所有训练图像集合的所有示例，组成投影示例集合P={P1，…，pm，…， pM}，其中，Μ表示所有示例数，pm为投影示例集合的第m个示例；步骤4.2:计算图像包到每个投影示例的距离，其计算如下：其中，Xi为第i个图像包，xi, j为第i个图像包的第j个示例，Pm为投影示例集合中的第m个示例，σ为高斯距离参数，取1~2之间的值，s(Xld，pm)所求的是包内示例到投影示例的高斯距离，图像包到投影示例的距离(KXhPm)所求为图像包内所有示例到投影示例高斯距离中的最小距尚；步骤4.3:将图像包到所有投影示例的距离值排成一列，得到图像包的投影特征。8. 如权利要求1所述的一种基于多示例包特征学习的图像多标签标注算法，其特征是，所述步骤五中的具体步骤为：步骤5.1:将训练图像集合中每个图像包的投影特征作为矩阵的列，得到训练集投影特征矩阵Z=[Z1，…，Ζι，···ΖΝ]，其中，N为训练集图像包的数量，将训练图像集中每个图像包的标签值作为列，得到训练集合图像包标签矩阵Y= [yi，…，yi，…yN]，其中每个图像包的标签值又:为一个列向量，其维度为图像集的标签总数，其元素数取值为[〇，1]，如果元素值为1，则对应的标签被标注到该图像，否则，该标签不被标注到该图像；步骤5.2:构造12, i范式约束稀疏表示模型如下：其中，W为12>1范式约束稀疏表示模型要求解的特征选择系数；步骤5.3:采用增广拉格朗日算法求解出12,:范式约束稀疏表示模型中的特征选择系数 W；步骤5.4:记录W中的非零行序号集合为IX，选取训练集投影特征矩阵Z中序号为IX的行则得到学习的图像包分类特征。9. 如权利要求1所述的一种基于多示例包特征学习的图像多标签标注算法，其特征是，所述步骤六中，具体步骤为：步骤6.1:将步骤五中学习到的训练图像集合图像包分类特征分别送入不同标签对应的SVM分类器进行训练，则每一个标签学习得到一个SVM分类器；步骤6.2:用模糊C均值聚类算法将测试图像进行图像分割，得到测试图像分块；步骤6.3:对每个测试图像分块提取颜色直方图特征和方向梯度直方图特征，并首尾相接排成一列，所有图像分块特征按列排成一个矩阵，得到测试图像包的特征矩阵，矩阵每列看作测试图像包的一个示例特征；步骤6.4:计算测试图像包与投影示例的距离，排成一列得到测试图像包的投影特征向量；步骤6.5:依据步骤五学习得到的特征选择系数W的非零行序号集合IX，对应选择出测试图像包投影向量的行，得到测试图像包的分类特征；步骤6.6:将测试图像包的分类特征分别输入步骤6.1得到的训练好的SVM分类器，分别得到每个标签的预测概率，如果概率值大于等于设定值则该标签被标注于测试图像，反之，则该标签不被标注于测试图像，如此便得到最终的测试图像标注结果。10. 如权利要求9所述的一种基于多示例包特征学习的图像多标签标注算法，其特征是，所述步骤6.6中的设定值为0.5。
【专利摘要】本发明公开了一种基于多示例包特征学习的图像多标签标注算法，包括：得到所有训练图像的图像分块的集合；对训练图像的图像分块的集合中的每个图像分块提取颜色直方图特征和方向梯度直方图特征；将一个训练图像看作一个图像包，得到多示例学习框架所需的图像包结构；将训练图像集合中所有图像包中的示例组成投影示例集合，每个图像包通过向该投影示例集合投影得到图像包的投影特征；选择出判别性高的特征作为图像包的分类特征；将学习出的训练图像集合的图像包的分类特征送入SVM分类器进行训练，得到训练模型的参数，用训练好的SVM分类器对测试图像标签进行预测。本发明的标注算法实现简单，训练器成熟可靠，预测快捷，更好的完成图像多标签。
【IPC分类】G06T7/00, G06K9/62, G06K9/46, G06K9/66
【公开号】CN105678309
【申请号】CN201610076444
【发明人】丁昕苗, 郭文, 刘延武, 张帅, 曲衍怀, 范丽杰
【申请人】山东工商学院
【公开日】2016年6月15日
【申请日】2016年2月3日

完整全部详细技术资料下载

当前第3页1 2 3