图像分类器的生成方法、图像分类方法和装置的制造方法

文档序号:9631809阅读:486来源:国知局
图像分类器的生成方法、图像分类方法和装置的制造方法
【技术领域】
[0001] 本发明涉及图像分类领域,并且更具体地,涉及一种图像分类器的生成方法、图像 分类方法和装置。
【背景技术】
[0002] 隐变量指不能直接被观测到,却在实际应用中起到重要作用的综合性变量,如空 间关系、数据结构、内联状态等。隐变量广泛应用于机器视觉、自然语言处理、语音识别和公 众健康等领域。实验证明,处理图像、语音等对象时,隐变量的引入能捕获更多的有用信息, 与仅使用显变量的方式相比,处理效果显著提高。
[0003]早期的隐变量模型多为生成模型(generativemodels),如隐马尔可夫模型 (HiddenMarkovModel,HMM)、高斯混合模型(GaussianMixtureModel,GMM)等。近期更多 的研究者试图探寻判别模型(discriminativemodels)中引入隐变量的可能性。典型的例 子如条件随机场(ConditionalRandomField,CRF)、隐变量支持向量机(LatentSupport VectorMachine,LSVM)等,这些模型在各自领域均取得了一定成果。值得一提的是,LSVM 配合局部可变形模型(DeformablePart-basedModel,DPM),即DPM-LSVM,在机器视觉中的 物体检测领域已成为近年来较为成功的算法。DPM用于描述检测类别物体的特征,它由三 部分组成:一个主体滤波器(rootfilter),多个局部滤波器(partfilters),以及每个局部 对应的形变惩罚(deformablecosts)。主体部分用于描述物体的大体轮廓,局部部分用于 描述检测物体的细节特征,形变惩罚用于保证每个局部相对于主体的位置不能有过大的偏 移。在物体检测过程中,局部相对于主体的位置可以在一定范围内变化,可看作隐变量,采 用LSVM进行训练。
[0004]LSVM的目标函数形式与原始的SVM相似,如⑴所示:
[0005]
(I)
[0006] 其中,β是分类器的模型参数,yi表示训练样本Xi的标签,s(Xl,β)表示样本Xl 的分数,这个分数是在所有可能局部相对位置(即隐变量取值范围)中最优的分数,该分数 满足式(2):
[0007]
(2)
[0008] 式⑵中,z为隐变量,f为特征提取方法,f(Xl,z)为样本Xl的特征向量,如DPM 中使用框架梯度直方图特征。
[0009] 可以证明LSVM的目标函数(式(1))具有半凹性,即固定正样本的隐变量取值 时,目标函数是凹的。因此,LSVM的求解可使用坐标梯度下降(CoordinateGradient Descent),即首先固定分类器的模型参数,求得正样本隐变量取值,再固定正样本隐变量取 值,求最优模型参数和负样本隐变量取值,如此迭代直至收敛。
[0010] LSVM与SVM-样,主要适用于物体检测领域。当推广到物体分类领域时,LSVM的 处理方式是将物体分类领域中的多类问题转化成物体检测领域的二类问题。采用此种处理 方式,会使得用于物体分类的多个分类器的训练过程彼此孤立。实际中,多种物体类别之间 可能存在一定的关联性,比如,将建筑物分成多类建筑风格,待分类图片中的建筑物可能同 时具有两种或两种以上建筑风格的特征。因此,将多个分类器的训练过程转化成彼此孤立、 非此即彼的多个二类问题,会导致分类结果不准确。

【发明内容】

[0011] 本发明实施例提供一种图像分类器的生成方法和装置,以提高分类结果的准确 性。
[0012] 第一方面,提供一种图像分类器的生成方法,包括:获取训练样本集,所述训练样 本集包括N个图像样本,所述N个图像样本属于K个类别,N、K为正整数,N大于K;获取每 一个所述图像样本的特征向量,其中,所述特征向量包括图像样本的隐变量;基于所述N个 图像样本的隐变量,通过多元逻辑回归模型,训练所述K个类别的分类器。
[0013] 结合第一方面,在第一方面的一种实现方式中,所述K个类别的分类器分别包括K 个模型参数,所述基于所述N个图像样本的隐变量,通过多元逻辑回归模型,训练所述K个 类别的分类器,包括:获取所述K个模型参数的初始值;获取所述N个图像样本的隐变量的 初始值;基于所述N个图像样本的特征向量,以及所述N个图像样本隐变量的初始值,通过 所述多元逻辑回归模型,训练所述K个类别的分类器,以确定所述K个模型参数的目标值。
[0014] 结合第一方面或其上述实现方式的任一种,在第一方面的另一种实现方式中,所 述N个图像样本隐变量的初始值包括:正图像样本隐变量的初始值和负图像样本隐变量的 初始值,所述基于所述N个图像样本的特征向量,以及所述N个图像样本隐变量的初始值, 通过所述多元逻辑回归模型,训练所述K个类别的分类器,以确定所述K个模型参数的目标 值,包括:基于所述N个图像样本的特征向量,以及所述N个图像样本隐变量的初始值,通过 所述多元逻辑回归模型,训练所述K个类别的分类器,以确定所述K个模型参数的当前值, 当所述K个模型参数的当前值满足预设的收敛条件时,将所述K个模型参数的当前值确定 为所述K个模型参数的目标值,当所述K个模型参数的当前值不满足所述收敛条件时,基 于所述N个图像样本的特征向量,以及所述K个模型参数的当前值,确定所述正图像样本隐 变量的当前值,并利用所述正图像样本隐变量的当前值更新所述正图像样本隐变量的初始 值,重复执行本步骤直到所述K个模型参数的当前值满足所述收敛条件。
[0015] 结合第一方面或其上述实现方式的任一种,在第一方面的另一种实现方式中,所 述基于所述N个图像样本的特征向量,以及所述N个图像样本隐变量的初始值,通过所述多 元逻辑回归模型,训练所述K个类别的分类器,以确定所述K个模型参数的当前值,包括: 基于所述N个图像样本的特征向量,以及所述N个图像样本隐变量的初始值,通过所述多元 逻辑回归模型,训练所述K个类别的分类器,以确定所述K个模型参数的迭代值,基于所述 N个图像样本的特征向量,以及所述K个模型参数的迭代值,确定所述负图像样本隐变量的 迭代值,并利用所述负图像样本隐变量的迭代值更新所述负图像样本隐变量的初始值,当 所述K个模型参数的迭代值满足预设的迭代停止条件时,将所述K个模型参数的迭代值确 定为所述K个模型参数的当前值,否则,重复执行本步骤直到所述K个模型参数的当前值满 足所述迭代停止条件。
[0016] 结合第一方面或其上述实现方式的任一种,在第一方面的另一种实现方式中,所 述基于所述N个图像样本的特征向量,以及所述N个图像样本隐变量的初始值,通过所述 多元逻辑回归模型,训练所述K个类别的分类器,以确定所述K个模型参数的迭代值,包 括:根据公式
确定所述K个模型参数的迭代值,其中,
Xi表示所述N个图像样本中的 第i样本,^表示所述K个模型参数中的第1个模型参数,Θ表示所述K个模型参数组 成的K维变量表示Xi的类别对应的模型参数,Z(Xi)表示Xi的隐变量z的取值范围, f(Xi,z)表示X;的特征向量。
[0017] 结合第一方面或其上述实现方式的任一种,在第一方面的另一种实现方 式中,所述根据公式
,确定所述K个模型参数的迭 代值,包括:根据公式
确定βk对应 的梯度,其中, < ·' !
i· rrt
表不1 (Θ)关于βk的偏 导函数,^^表示所述K个模型参数中的第k个模型参数,Zl(i3k)表示模型参数为^^时\ 的隐变量的初始值,f(Xl,Zl (βk))表示隐变量z取值Zl (βk)时Xl的特征向量;基于所述 βk对应的梯度,以1 (Θ)为目标函数,采用梯度上升算法,确定所述βk的迭代值。
[0018] 结合第一方面或其上述实现方式的任一种,在第一方面的另一种实现方式中,所 述迭代停止条件为所述目标函数值1 (Θ)的变化小于预设阈值;或者,所述迭代停止条件 为迭代次数达到预设次数。
[0019] 结合第一方面或其上述实现方式的任一种,在第一方面的另一种实现方式中,所 述根据公另
确定所述K个模型参数的迭代值,包括:根 据公式
,并行计算 所述κ个模型参数的迭代值,其中,ΜΘ)是对ι(θ)中的对数取凹上界转化而来的,
[0020] 结合第一方面或其上述实现方式的任一种,在第一方面的另一种实现方式中,所 述基于所述N个图像样本的特征向量,以及所述K个模型参数的迭代值,确定所述负图像样 本隐变量的迭代值,包括:根据公式< ?/(AyZh确定所述负图像样本隐 变量的迭代值,其中,Xl表示所述N个图像样本中的第i样本,βt表示所述K个模型参数 中的第t个模型参数,且爲*爲,.,爲v表示Xl类别对应的模型参数,Z(Xl)表示Xl的隐变量 Z的取值范围,f(Xi,Z)表示Xi的特征向量,2丨表示模型参数为βt时Xi隐变量的迭代值,i为1至N中的任意整数,t为1至K中的任意整数。
[0021] 结合第一方面或其上述实现方式的任一种,在第一方面的另一种实现方式中,所 述基于所述N个图像样本的特征向量,以及所述K个模型参数的当前值,确定所述正图像样 本隐变量的当前值,包括:根据公式
确定所述正图像样本隐 变量的当前值,其中,Xl表示所述N个图像样本中的第i样本,爲,表示Xl类别对应的模型 参数,Z(Xi)表示Xi的隐变量z的取值范围,f(Xi,z)表示Xi的特征向量,< 表示模型参数 为爲时Xl隐变量的当前值,i为1至N中的任意整数。
[0022] 结合第一方面或其上述实现方式的任一种,在第一方面的另一种实现方式中,所 述基于每一个所述模型参数的初始值,确定每一个所述图像样本的隐变量的初始值,包括: 根据公式< Av/XW),确定每一个所述图像样本的隐变量的初始值,其 中,Xi表示所述Ν个图像样本中的第i样本,βk表示所述Κ个模型参数中的第k个模型参 数,Z(Xi)表示Xi的隐变量z的取值范围,f(Xi,z)表示Xi的特征向量,< 表示模型参数为 βk时Xi隐变量z的初始值,i为1至N中的任意整数,k为1至K中的任意整数。
[0023] 第二方面,提供一种图像分类方法,包括:获取待分类图像的特征向量;基于所 述待分类图像的特征向量,利用K个分类器,确定所述待分类图像的类别,其中,所述K 个分类器是利用第一方面或第一方面的任
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1