图像多特征动态结构融合的标记传播分类方法与流程

文档序号:11655005阅读:476来源:国知局

本发明属于视频监控图像处理领域,涉及一种图像多特征动态结构融合的标记传播分类方法。



背景技术:

近年来,基于内容分析的智能监控系统的应用越来越多,要智能分析和识别目标,图像的描述与认知是要解决的重要问题,因为图像的方向梯度直方图(hog,cn103903238a权利要求1实施的方法)、局部二值模式(lbp,cn103903238a权利要求1实施的方法)和图像数据本身描述表现出的结构多样性和各个结构描述融合的复杂性,使得考虑单一结构约束难以有效的传播标记,进行图像半监督的分类。现有技术中的方法无法利用多特征结构在标记传播中的动态非线性特性,进而无法更加准确的进行图像内容识别。



技术实现要素:

本发明的目的是提供一种图像多特征动态结构融合的标记传播分类方法,能够获得更加准确的图像半监督分类,更加准确的进行图像内容识别。

本发明所采用的技术方案是,一种图像多特征动态结构融合的标记传播分类方法,具体按照以下步骤实施:

步骤1,初始化图像标记矩阵并计算各特征的相似矩阵;

步骤2,建立特征结构线性模型,并求解线性规划问题优化式;

步骤3,基于各特征结构关系的标记传播;

步骤4,判断标记相对误差是否符合要求。

本发明的特点还在于,

所述的步骤1具体为:

步骤1.1,针对m个图像进行分类标记时,设m个图像中每个图像都由n个特征表示,

其中,第n个特征的集合表示为xn=[xn1,xn2,...,xnm]t,其中,n={1,2,3...n};

将m个图像的标记矩阵记为yt∈rm×c

当t=0时,表示还未开始进行标记,为图像初始状态,

则最初的图像标记矩阵为y0∈rm×c,其中c为图像的类别数。

则,

其中i=(1,...,m),j=(1,...,c);

步骤1.2,通过公式(2)的计算,

得到标记向量

然后再进行归一计算化后得

按照公式(3)计算,得到向量元素对应每一图像,标记其类别,其中

步骤1.3,图像中的任意两特征间的距离度量为dxn(xni,xnk),

其中,xni和xnk为图像i和图像k的特征表征,i=(1,...,m),k=(1,...,m);

计算度量的相似矩阵为wn={wn(i,k)}(i=1,2,...,mk=1,2,...,m),如下式(5):

其中,xn=[xn1,xn2,...,xnm]t为特征矩阵。

所述的步骤2具体为:

将步骤1中根据式(5)建立线性模型,得

其中w=[w1,...,wn]t为特征结构,αt=[αt1,...,αtn]t为特征结构的关系,t为循环传播的次数变量,t=(0,...,p)。

求解并建立t循环时时对应的拉普拉斯矩阵

lt=dt-wt(7)

其中dt为对角阵,对角元素为其余为零;

lt为t次循环的拉普拉斯矩阵;

通过单纯形法求解下面的线性规划问题优化式(8),

其中,特征结构w=[w1,...,wn]t的权重参数为αt=[αt1,...,αtn]t

其中,i为单位矩阵,κ为调节超级参数,实验取值为100。

所述的步骤3具体为:

根据步骤2中计算得到的特征结构关系αt=[αt1,...,αtn]t得以下迭代式,

其中,

计算在t循环中标记向量yt+1。

通过式(12)的计算

得到标记向量归一化后得

然后标记每一图像的类别,其中

所述的步骤4具体为:

时,结束标记,此时t=p,分类标记向量

时,未完成标记,返回步骤2,αt+1=αt,令t=t+1,重新进行计算和标记。

本发明的有益效果是,本方法在获取图像的多项特征的前提下,建立多特征结构概率模型,考虑多特征结构关系和各特征结构的分布的前提下,发掘多特征结构在标记传播中的动态非线性特性;然后通过在多特征结构的动态关系相互作用传播标记,最后得到准确性高的多特征结构融合的半监督分类方法。

具体实施方式

下面结合具体实施方式对本发明进行详细说明。

一种图像多特征动态结构融合的标记传播分类方法,具体按照以下步骤实施:

步骤1,初始化图像标记矩阵并计算各特征的相似矩阵,

步骤1.1,针对m个图像进行分类标记时,设m个图像中每个图像都由n个特征表示,

其中,第n个特征的集合表示为xn=[xn1,xn2,...,xnm]t,其中,n={1,2,3...n};

将m个图像的标记矩阵记为yt∈rm×c

当t=0时,表示还未开始进行标记,为图像初始状态,

则最初的图像标记矩阵为y0∈rm×c,其中c为图像的类别数。

则,

其中i=(1,...,m),j=(1,...,c);

步骤1.2,通过公式(2)的计算,

得到标记向量

然后再进行归一计算化后得

按照公式(3)计算,得到向量元素对应每一图像,标记其类别,其中

步骤1.3,图像中的任意两特征间的距离度量为dxn(xni,xnk),

其中,xni和xnk为图像i和图像k的特征表征,i=(1,...,m),k=(1,...,m);

计算度量的相似矩阵为wn={wn(i,k)}(i=1,2,...,mk=1,2,...,m),如下式(5):

其中,xn=[xn1,xn2,...,xnm]t为特征矩阵。

步骤2,建立特征结构线性模型,并求解线性规划问题优化式,

将步骤1中根据式(5)建立线性模型,得

其中w=[w1,...,wn]t为特征结构,αt=[αt1,...,αtn]t为特征结构的关系,t为循环传播的次数变量,t=(0,...,p)。

求解并建立t循环时对应的拉普拉斯矩阵

lt=dt-wt(7)

其中dt为对角阵,对角元素为其余为零;

lt为t次循环的拉普拉斯矩阵;

通过单纯形法求解下面的线性规划问题优化式(8),

其中,特征结构w=[w1,...,wn]t的权重参数为αt=[αt1,...,αtn]t

其中,i为单位矩阵,κ为调节超级参数,实验取值为100。

步骤3,基于各特征结构关系的标记传播,

根据步骤2中计算得到的特征结构关系αt=[αt1,...,αtn]t得以下迭代式,

其中,

计算在t循环中标记向量yt+1。

通过式(12)的计算

得到标记向量归一化后得

然后标记每一图像的类别,其中

步骤4,判断标记相对误差是否符合要求,即,

时,结束标记,此时t=p,分类标记向量

时,未完成标记,返回步骤2,αt+1=αt,令t=t+1,重新进行计算和标记。

实施例:

在实际的标记处理中,特征的选择数量根据处理的样本不同而不一样,当n={1,2,3}时,进行处理的3个特征分别为hog特征、lbp特征和图像向量化特征。

在orl人脸图像数据库中,对图像最终编码随机取各类不同的训练测试样本。分别比较了两类最新的多特征融合的半监督分类方法:多模课程学习算法(mmcl)[1]、多模动态标记传播算法(mdlp)[2]和基于最大后验概率的结构建模(smmpp)[3]+动态标记传播算法(dlp)[2]。

[1]g.chen,d.tao,s.j.maybank,l.wei,multi-modalcurriculumlearningforsemi-supervisedimageclassification,ieeetransactionsonimageprocessing25(7)(2016)3249–3260.

[2]b.wang,j.tsotsos,dynamiclabelpropagationforsemi-supervisedmulti-classmulti-labelclassification,patternrecognition52(2016)75–84.

[3]g.lin,h.zhu,x.kang,y.miu,e.zhang,featurestructurefusionmodellingforclassification,ietimageprocessing9(10)(2015)883–888.

在orl人脸图像数据库识别准确率(%)

从上述数据对比表中可以看出,利用本发明方法,与现有的处理方法相比,其准确率均有所提高。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1