图像分类器的生成方法、图像分类方法和装置的制造方法

文档序号：9631809阅读：486来源：国知局

图像分类器的生成方法、图像分类方法和装置的制造方法
【技术领域】
[0001] 本发明涉及图像分类领域，并且更具体地，涉及一种图像分类器的生成方法、图像分类方法和装置。
【背景技术】
[0002] 隐变量指不能直接被观测到，却在实际应用中起到重要作用的综合性变量，如空间关系、数据结构、内联状态等。隐变量广泛应用于机器视觉、自然语言处理、语音识别和公众健康等领域。实验证明，处理图像、语音等对象时，隐变量的引入能捕获更多的有用信息，与仅使用显变量的方式相比，处理效果显著提高。
[0003]早期的隐变量模型多为生成模型（generativemodels)，如隐马尔可夫模型 (HiddenMarkovModel，HMM)、高斯混合模型（GaussianMixtureModel，GMM)等。近期更多的研究者试图探寻判别模型（discriminativemodels)中引入隐变量的可能性。典型的例子如条件随机场（ConditionalRandomField，CRF)、隐变量支持向量机（LatentSupport VectorMachine，LSVM)等，这些模型在各自领域均取得了一定成果。值得一提的是，LSVM 配合局部可变形模型（DeformablePart-basedModel，DPM)，即DPM-LSVM，在机器视觉中的物体检测领域已成为近年来较为成功的算法。DPM用于描述检测类别物体的特征，它由三部分组成：一个主体滤波器（rootfilter),多个局部滤波器（partfilters),以及每个局部对应的形变惩罚（deformablecosts)。主体部分用于描述物体的大体轮廓，局部部分用于描述检测物体的细节特征，形变惩罚用于保证每个局部相对于主体的位置不能有过大的偏移。在物体检测过程中，局部相对于主体的位置可以在一定范围内变化，可看作隐变量，采用LSVM进行训练。
[0004]LSVM的目标函数形式与原始的SVM相似，如⑴所示：
[0005]
(I)
[0006] 其中，β是分类器的模型参数，yi表示训练样本Xi的标签，s(Xl，β)表示样本Xl 的分数，这个分数是在所有可能局部相对位置（即隐变量取值范围）中最优的分数，该分数满足式（2):
[0007]
(2)
[0008] 式⑵中，z为隐变量，f为特征提取方法，f(Xl，z)为样本Xl的特征向量，如DPM 中使用框架梯度直方图特征。
[0009] 可以证明LSVM的目标函数（式（1))具有半凹性，即固定正样本的隐变量取值时，目标函数是凹的。因此，LSVM的求解可使用坐标梯度下降（CoordinateGradient Descent)，即首先固定分类器的模型参数，求得正样本隐变量取值，再固定正样本隐变量取值，求最优模型参数和负样本隐变量取值，如此迭代直至收敛。
[0010] LSVM与SVM-样，主要适用于物体检测领域。当推广到物体分类领域时，LSVM的处理方式是将物体分类领域中的多类问题转化成物体检测领域的二类问题。采用此种处理方式，会使得用于物体分类的多个分类器的训练过程彼此孤立。实际中，多种物体类别之间可能存在一定的关联性，比如，将建筑物分成多类建筑风格，待分类图片中的建筑物可能同时具有两种或两种以上建筑风格的特征。因此，将多个分类器的训练过程转化成彼此孤立、非此即彼的多个二类问题，会导致分类结果不准确。

【发明内容】

[0011] 本发明实施例提供一种图像分类器的生成方法和装置，以提高分类结果的准确性。
[0012] 第一方面，提供一种图像分类器的生成方法，包括：获取训练样本集，所述训练样本集包括N个图像样本，所述N个图像样本属于K个类别，N、K为正整数，N大于K;获取每一个所述图像样本的特征向量，其中，所述特征向量包括图像样本的隐变量；基于所述N个图像样本的隐变量，通过多元逻辑回归模型，训练所述K个类别的分类器。
[0013] 结合第一方面，在第一方面的一种实现方式中，所述K个类别的分类器分别包括K 个模型参数，所述基于所述N个图像样本的隐变量，通过多元逻辑回归模型，训练所述K个类别的分类器，包括：获取所述K个模型参数的初始值；获取所述N个图像样本的隐变量的初始值；基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的目标值。
[0014] 结合第一方面或其上述实现方式的任一种，在第一方面的另一种实现方式中，所述N个图像样本隐变量的初始值包括：正图像样本隐变量的初始值和负图像样本隐变量的初始值，所述基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的目标值，包括：基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的当前值，当所述K个模型参数的当前值满足预设的收敛条件时，将所述K个模型参数的当前值确定为所述K个模型参数的目标值，当所述K个模型参数的当前值不满足所述收敛条件时，基于所述N个图像样本的特征向量，以及所述K个模型参数的当前值，确定所述正图像样本隐变量的当前值，并利用所述正图像样本隐变量的当前值更新所述正图像样本隐变量的初始值，重复执行本步骤直到所述K个模型参数的当前值满足所述收敛条件。
[0015] 结合第一方面或其上述实现方式的任一种，在第一方面的另一种实现方式中，所述基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的当前值，包括：基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的迭代值，基于所述 N个图像样本的特征向量，以及所述K个模型参数的迭代值，确定所述负图像样本隐变量的迭代值，并利用所述负图像样本隐变量的迭代值更新所述负图像样本隐变量的初始值，当所述K个模型参数的迭代值满足预设的迭代停止条件时，将所述K个模型参数的迭代值确定为所述K个模型参数的当前值，否则，重复执行本步骤直到所述K个模型参数的当前值满足所述迭代停止条件。
[0016] 结合第一方面或其上述实现方式的任一种，在第一方面的另一种实现方式中，所述基于所述N个图像样本的特征向量，以及所述N个图像样本隐变量的初始值，通过所述多元逻辑回归模型，训练所述K个类别的分类器，以确定所述K个模型参数的迭代值，包括：根据公式
确定所述K个模型参数的迭代值，其中，
Xi表示所述N个图像样本中的第i样本，^表示所述K个模型参数中的第1个模型参数，Θ表示所述K个模型参数组成的K维变量表示Xi的类别对应的模型参数，Z(Xi)表示Xi的隐变量z的取值范围， f(Xi，z)表示X;的特征向量。
[0017] 结合第一方面或其上述实现方式的任一种，在第一方面的另一种实现方式中，所述根据公式
，确定所述K个模型参数的迭代值，包括：根据公式
确定βk对应的梯度，其中， < ·' !
i· rrt
表不1 (Θ)关于βk的偏导函数，^^表示所述K个模型参数中的第k个模型参数，Zl(i3k)表示模型参数为^^时\ 的隐变量的初始值，f(Xl，Zl (βk))表示隐变量z取值Zl (βk)时Xl的特征向量；基于所述 βk对应的梯度，以1 (Θ)为目标函数，采用梯度上升算法，确定所述βk的迭代值。
[0018] 结合第一方面或其上述实现方式的任一种，在第一方面的另一种实现方式中，所述迭代停止条件为所述目标函数值1 (Θ)的变化小于预设阈值；或者，所述迭代停止条件为迭代次数达到预设次数。
[0019] 结合第一方面或其上述实现方式的任一种，在第一方面的另一种实现方式中，所述根据公另
确定所述K个模型参数的迭代值，包括：根据公式
，并行计算所述κ个模型参数的迭代值，其中，ΜΘ)是对ι(θ)中的对数取凹上界转化而来的，
[0020] 结合第一方面或其上述实现方式的任一种，在第一方面的另一种实现方式中，所述基于所述N个图像样本的特征向量，以及所述K个模型参数的迭代值，确定所述负图像样本隐变量的迭代值，包括：根据公式< ?/(AyZh确定所述负图像样本隐变量的迭代值，其中，Xl表示所述N个图像样本中的第i样本，βt表示所述K个模型参数中的第t个模型参数，且爲*爲,.，爲v表示Xl类别对应的模型参数，Z(Xl)表示Xl的隐变量 Z的取值范围，f(Xi,Z)表示Xi的特征向量，2丨表示模型参数为βt时Xi隐变量的迭代值，i为1至N中的任意整数，t为1至K中的任意整数。
[0021] 结合第一方面或其上述实现方式的任一种，在第一方面的另一种实现方式中，所述基于所述N个图像样本的特征向量，以及所述K个模型参数的当前值，确定所述正图像样本隐变量的当前值，包括：根据公式
确定所述正图像样本隐变量的当前值，其中，Xl表示所述N个图像样本中的第i样本，爲,表示Xl类别对应的模型参数，Z(Xi)表示Xi的隐变量z的取值范围，f(Xi,z)表示Xi的特征向量，< 表示模型参数为爲时Xl隐变量的当前值，i为1至N中的任意整数。
[0022] 结合第一方面或其上述实现方式的任一种，在第一方面的另一种实现方式中，所述基于每一个所述模型参数的初始值，确定每一个所述图像样本的隐变量的初始值，包括：根据公式< Av/XW)，确定每一个所述图像样本的隐变量的初始值，其中，Xi表示所述Ν个图像样本中的第i样本，βk表示所述Κ个模型参数中的第k个模型参数，Z(Xi)表示Xi的隐变量z的取值范围，f(Xi,z)表示Xi的特征向量，< 表示模型参数为 βk时Xi隐变量z的初始值，i为1至N中的任意整数，k为1至K中的任意整数。
[0023] 第二方面，提供一种图像分类方法，包括：获取待分类图像的特征向量；基于所述待分类图像的特征向量，利用K个分类器，确定所述待分类图像的类别，其中，所述K 个分类器是利用第一方面或第一方面的任

完整全部详细技术资料下载

当前第1页1 2 3 4 5 6

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：谢清鹏;
技术所有人：华为技术有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。