基于稀疏子空间多任务学习的图像分类预测方法与流程

文档序号:12124227阅读:192来源:国知局
本发明涉及图像分类
技术领域
,特别涉及基于稀疏子空间多任务学习的图像分类预测方法。
背景技术
:随着互联网通讯技术与数字影像技术的快速发展,人们获得各种图像信息越来越容易,导致互联网中存在大量的图像数据,如何从大规模的图像数据中准确找到符合用户需求的相关图像一直是计算机视觉领域的研究热点和挑战。现实世界中的样本往往和多个类别相关联,例如,一幅图片可以同时被标注为“sea”,“sky”,“beach”等标签,这就需将样本同时归到多个类,这就是多标注分类问题。解决多标注分类问题一种常用的方法是对每个标注构造一个二元分类器,具有此标注的样本为正样例其余样本为负样例,这种方法已经被广泛应用于多种分类问题中,但该方法存在如下的问题:1)相比于传统的单标签分类,多标签分类问题则是一种更加复杂的分类问题,传统分类方法没有考虑不同标签之间语义关联性;2)图像存在多种异构特征,在表示特定高层语义时所起作用的重要程度不同,传统分类方法没有很好的对异构特征进行有效融合。技术实现要素:为了克服这一传统方法未能考虑不同标签之间语义关联性的不足,本发明提供一种基于稀疏子空间多任务学习的图像分类预测方法,包括:步骤一:根据对训练图像集提取的异构视觉特征构建特征数据;步骤二:基于任务的相关性和异构视觉特征的结构性,根据特征数据的训练数据集建立稀疏子空间的多任务分类算法的目标函数;步骤三:基于稀疏子空间的多任务分类算法的目标函数,采用迭代优化算法进行求解,生成稀疏子空间多任务分类模型;步骤四:采用稀疏子空间多任务分类模型对图像测试集进行分类预测。进一步地,所述异构视觉特征至少包括颜色、纹理和形状。进一步地,步骤二中包括:对异构特征的融合引入组稀疏正则化其中G是异构特征子集的个数,u是分类模型的权重向量;结合子空间相关性和稀疏机制建立多任务学习模型,构成最终的目标函数:其中U和V为权重向量,Q是共享子空间。进一步地,所述步骤三中分别对变量V、Q和W进行迭代优化,获得稳定最优解,即生成稀疏子空间多任务分类模型。本发明利用多任务学习的思想来改善分类器的泛化性能,结合子空间相关性和稀疏机制建立多任务学习机制对图像进行分类,提高了分类器的泛化性能。具体地,一方面利用多个任务在潜在子空间的相关性建立分类模型,另一方面为了更加有效地利用图像的异构特征,在基于子空间的多任务学习中引入了一种基于组稀疏(groupsparsity)结构,进而提出了稀疏子空间多任务学习的分类算法。最后,提出了一种有效的迭代优化算法对基于稀疏子空间多任务学习的目标函数进行优化,求得全局最优解。具体实施方式为使本发明实施例的目的、技术方案和优点更加清楚,下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明实施例提供一种基于稀疏子空间多任务学习的图像分类方法,包括:步骤一:根据对训练图像集提取的异构视觉特征构建特征数据;步骤二:基于任务的相关性和异构视觉特征的结构性,根据特征数据的训练数据集建立稀疏子空间的多任务分类算法的目标函数;步骤三:基于稀疏子空间的多任务分类算法的目标函数,采用迭代优化算法进行求解,生成稀疏子空间多任务分类模型;步骤四:采用稀疏子空间多任务分类模型对图像测试集进行分类预测。上述步骤二和三中,具体公式推导如下:采用如下的目标函数方式:损失函数+正则化模型由于增加了子空间信息,原表达变为:f(x)=uTx=wTx+vTQx。其中u,wandv为整体特征空间的权重系数,高位特征空间的权重系数和共享的低维子空间的权重系数。L为损失函数:其中X∈Rn×d,Y∈Rn×c,U∈Rd×c。令XU-Y=[z1,...,zn]T,则L(X,Y,U)=Tr((XU-Y)TD1(XU-Y))(3)其中:R为正则化模型通过添加惩罚项的形式,约束任务之间特征的相关性,提出了一种结构化稀疏子空间模型:R(U,V,Q)=R1(U)+R2(U,V,Q)(5)其中R1为结构稀疏正则化模型,定义为:其中由于||U||2,1和同价,同理||U||G2,1与同价,其中D2和D3定义如下:则R2为子空间共享模型,定义为:综合以上的L和R,定义目标函数如下:其中λ1,λ2andλ3为正则项系数。●首先对V最小化:对V求导,得出V=QU最小,代入(11)后,得到:因为Tr((U-QTQU)T(U-QTQU))=Tr(UT(I-QTQ)(I-QTQ)U)并且(I-QTQ)(I-QTQ)=I-QTQ,所以得到●对U最小化:对U求导,然后得到:设U=S-1XD1Y,其中S=(P-λ3QTQ)-1(15)P=XD1X+λ1D2+λ2D3+λ3I(16)公式(13)可以写成:把U=S-1XD1Y代入公式(17)中,得到如下:上述问题等价于:根据Sherman–Woodbury–Morrison公式:则公式(19)转换为:等价于:通过矩阵变换,(22)可以写成:使用迭代优化算法进行求解。上述介绍的迭代优化算法流程如下所示。实验验证:选取了三个图像分类数据集Kodak,MSRA-MM和NUS-WIDE,对不同的数据集提取了不同的特征,如表1所示:表1异构特征子集描述KodakMSRA-MMNUS-WIDE颜色相关图颜色相关图颜色相关图共生矩阵纹理特征边缘方向直方图边缘方向直方图边缘方向直方图人脸特征词袋特征人脸特征颜色直方图颜色直方图颜色直方图RGB颜色直方图块颜色矩块颜色矩块颜色矩小波纹理特征小波纹理特征小波纹理特征为了评估图像标注算法性能,本发明采用了ROC曲线下面积(areaundercurve,简称AUC),包括MicroAUC和MacroAUC以及准确率(precision)这3种评价指标。随机分别选取了300个带标注的图像作为训练集(保证每个标注至少出现一次),在剩余的数据中分别选取1200个未标注图像作为测试集,每组实验重复10次,然后算出10次结果的平均值。比较的算法包括:Lasso、Grouplasso和subspaceMTL,比较结果如表2-4所示:表2多种分类算法的MacroAUC比较LassoGrouplassosubspaceMTLSGLSMTLKodak0.71480.73950.78660.8245MSRA-MM0.62080.62390.67850.7022NUS-WIDE0.70820.71540.75130.7816表3多种分类算法的MicroAUC比较LassoGrouplassosubspaceMTLSGLSMTLKodak0.71920.73220.78540.8098MSRA-MM0.70580.71710.75440.7832NUS-WIDE0.72500.73340.75320.7793表4多种分类算法的精度比较LassoGrouplassosubspaceMTLSGLSMTLKodak0.88390.89160.91880.9312MSRA-MM0.82650.84700.91720.9411NUS-WIDE0.80550.83170.89330.9122从表2-4可以看出,本发明提出的基于稀疏子空间多任务学习的图像分类算法在三个数据集上均达到了最高的分类性能,提升了传统只基于稀疏学习算法或者只基于子空间多任务学习算法的分类性能。最后应说明的是以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1