图像分类方法和设备的制作方法

文档序号：6611190阅读：203来源：国知局

专利名称：图像分类方法和设备的制作方法
技术领域：
本发明一般地涉及图像分类方法和设备。
背景技术：
近年来在机器学习和图像比较方面，研究者已经获得令人可喜
的进步。在机器学习领域，Boosting、支持矢量机器和其他所谓的大间隔(large-margin)技术不断地在当应用于老的技术时展示出改进的性能和更为确定的机器学习方法。Adaboost是一种用于提高任意给定学习方法精确度的通用方法。其从大的集合中选择少量的关键特征并且产生极其有效的分类器，并且具有用于例如人脸检测的视觉对象4全测的成功应用。关于Adaboost的解释，参见由Yoav Freund Robert E. Schapire撰写的"A Short Introduction to Boosting，，，通过参考将其内容全部并入在此。
同时，针对于图像比较，图像检索领域的研究者已经设计出新的表示方法，其允许基于例如色彩和紋理分布的多个线索来进行图像间的快速比较。例如色彩直方图、冗余紋理滤波器组和其他技术已经显示出超出早期技术的重大改进。
不幸地是除了一些特殊例外，当前很少有研究通过将每个的最佳元素进行合并来试图针对这两个领域。因此，将更新的图像分析

发明内容
本发明的目的在于提供一种图像分类方法和设备，以将图像分类成多个种类，从而获得比现有方法更好的分类结果。
为了实现上述的目的，本发明提供一种用于将图像分类成多个
种类的方法，包括步骤根据图像确定色彩直方图矢量以及基于色彩直方图矢量将图像分类成多个种类，其中色彩直方图矢量由从候选色彩直方图特征选择的一些色彩直方图特征组成。
本发明还提供一种用于将图像分类成多个种类的设备，包括确定模块，其用于根据图像确定色彩直方图矢量；以及分类模块，其用于基于色彩直方图矢量将图像分类成多个种类，其中色彩直方图矢量由从候选色彩直方图特征选择的一些色彩直方图特征组成。
由于Adaboost的效力，可以选4奪图像的关4建和有效特征并且由此提高了计算效率。与考虑色彩样本的分布但忽略其有效性的其他直方图算法相比，有效性也在积分图像直方图的考虑之内。总之，本发明的使用可以显著提高图像的查全率并获得与现有方法更好的分类结果。

根据下面结合附图阅读的示例性的实施方式的详细描述，本发明的上述和其他目的、特征和优势将变得明显。
图1是根据本发明一个实施方式的一种用于将图像分类成多个种类的方法的流程图3是图2中的Adaboost算法中的WeakLearn (弱学习)算法的流程图4是根据本发明一个实施方式的一种用于将图像分类成多个种类的设备的示意框图；以及
图5示出本发明可在其中实施的一个实施方式的示意性应用。
具体实施例方式
现在参考附图对本发明进行更为详细地描述。
图1示出根据本发明的一个实施方式的一种用于将图像分类成多个种类的方法的流程图。在步骤100处，输入将要^皮分类的图像。
在步骤110处，执行确定图像的色彩直方图矢量(也可由图4中的
确定模块400来执行)，下文将对其进行详细地描述。
首先，定义一种简单但很有效的候选色彩直方图特征。其可由下面的方程来表达
化，"2，^,g2,VW^ J J J^O,g，Z))d喊必(。<g2，& <62) (1)
其中；^,g,6)表示图像像素色彩的概率。符号。^,g,，&AA表示特征参
数，换句话说，不同的^"2，g'，&AA可产生不同的特征。图像的候选色
彩直方图^^2，&，g2，VW可根据下式计算
<formula>complex formula see original document page 6</formula>(2)
其中M代表图像中像素的总数，而—w化I代表像素的总数，其r值大于或等于r,而小于或等于r2, g值大于或等于g!而小于或等于g2, b值大于或等于bi而小于或等于b2的。从理论上来说，上述的六个参数可以是从O到255的任意值并且因此在图像中存在
(257"56/2)3 =35，598，301，659'136个特征。尽管理论特征值是如此的巨大，但
由于计算的限度，仅它们中的一些将用作候选特征。优选地，。^,g,，g2AA可以是oo，3o,5o,7o,9o，uo,i3o，i5(y7oj9o，"o，23o,25o)集
合中的一个值。然而，应该注意到n^，g'，g^,A的值不限于这里所描述的值，本领域技术人员可以根据实际需要设置。，^g"g^"^的值。接着，
将仅有(14"3/2)3 =753571个特征用作候选色彩直方图特征。然而，753571 个特征对于本方法来说依然太大。出于进一步简化的目的，使用
Adaboost算法来训练将在本方法中使用的一些特征(即，选择特征，这也可由图4中的确定才莫块410来执行)。
现在参考图2,其示出了 Adaboost算法的流程图。尽管本领域技术人员了解Adaboost,但对其简短的描述将有助于更好的理解本发明。在步骤200，输入m个训练样本，即，SM(w》，(巧,h),…U,其中输
入标示y'ey-W"。这里Xi是通过由方程(2)计算的候选色彩直方图特征&,&..1753571所组成的753571维矢量，而值仅可以分别为代表蓝天图
像样本和非蓝天图像样本的0或1的力是与Xj关联的分类标记。应该注意到使用本发明来将图像分类成蓝天图像和非蓝天图像仅是示例性的，并且其可被用于将图像分类成如期望的任意种类。另外，应该注意到力的值不限于这里所述的值，本领域技术人员还可根据实际需要来设置yi 的值。
在步骤210,初始变量被设置成等于l,在步骤220,根据下式来执
行Dt(i)的初始化
<formula>complex formula see original document page 7</formula> (3)
其中D,是第一轮的训练样本^^，少》，""h)，…，""，乂""的分布并且利用均勻分布来初始化。为了稍后的迭代而预先指定T并且在本方法中 T优选的是46。在每次迭代中基于先前Dt—,来计算随后的Dt。接着流程图前进到迭代部分，在步骤230,调用具有误标记分布Dt的弱学习(稍后描述)并且由此得到输出为0或1的假设ht(x)。输入样本的分类取决于ht(x)的输出，即，如果ht(x)-l，则输入样本一皮分类为正的样本，而如果ht(x)二O,则输入样本被分类为负的样本。4妾着ht(x)的伪损失可以根据下式计算
S是估计假设ht好坏程度的值。如果￡'是零，则ht的结果很好。另一方面，如果s'越大，则f'的结果越坏。应该注意到该误差是针对分布 AW来测量的。接着将^设置成等于^(1 —&)，该值仅是为表达方便起见的临时变量并且没有实质性的含意。根据下式来更新分布A".-
<formula>complex formula see original document page 7</formula>其他、乂
其中z'是归一化常量(这样选择使得"'+1将是分布)。示例的权重与
某个数相乘，使得可基于A来计算",+,。接着可通过除以归一化常量来重新归一化权重。有效地，由许多先前弱假设所分类的"容易，，样本将得到更低的权重，而往往被误分类的"难"样本将得到更高的权重。因此，本方法将对于弱学习来说是最难的样本分配最大的权重。在步骤270,获得h,，h2…hT,来自f,，f2，f3…f75357的相应特征Fj,F2…FT是由
Adaboost所选4奪的特征。
现在返回到图1,在步骤130,通过如下T个选择的特征来形成最终强的分类器
<formula>complex formula see original document page 8</formula> (6)
其中<formula>complex formula see original document page 8</formula>和A,A,…A可通过上述提到的过程获得。如果H(x)的结果是l，则图像被分类为目标种类，而如果H(x)的结果是O，则图像被分类为非目标种类。这也可以通过图4中的分类模块410来完成。
现在参考图3，其示出图2中所称的弱学习算法。在步骤300, m
个样本的S-Kx，yO,(X2,y2),…，(Xm,ym))训练集合以及其在Adaboost算法中
的第t轮的相应分布D- (D(l),D(2),.jD(m))被输入。接着流程图前进到迭代
处理。对于"m，" (d是753571，即，候选色彩直方图特征的数目)，
获得第k个模式尸^".'，A."…，A.'"，其中^.'=~并且^是^的第k个元
素，而Xi是第i个样本的特征向量。通过Pk对训练样本S进行排序，使
得对于任意的KJ, Pk,Pkj,得到符号权重^^u"，…w^，气,'=0^2-lr"W,因此对于正的(负的)样本，Wk,i是正的(负的)，
得到负权重的和卯^S- (和是正数)，得到符号权重
"=","""，^'}的累积和，其中'^ ' ,接着找到索引il和
i2,使得C"1 =丽".1,、2"" "-1}和 2 =minKl'C"，""q,",—J ,如果 1 >—CW，
则设置Sk=l， " = ^n/2 + w/2，否则设置&=-"=- 2/2-~2+1/2, 接着得到候选"，其中&(x》41 &'*&1>(),得到损失函数
lo其他
S柳
在上述的迭代处理之后，在步骤370,选择最佳k,即，W，其中 argmin(q)
"。最终，弱学习输出如下的假设
假定在第t轮迭代中得到弱学习假设并且令h尸h，to。则A。是在
Adaboost算法的第t轮中选择的特征。
图5示出其中可实施本发明一个实施方式的示意应用。在步骤500 输入图像。在步骤510,图像由根据本发明的如图1中的方法或如图4 中的设备来进行分类。在步骤520,基于得到的图像种类来对图像施加图像改进处理。最后获得改进的图像。例如，假设目标种类是蓝天，并且在训练处理中，则原始的候选特征是G，f2…ft (作为示例，t是 753571 ),由Adaboost从候选特征所选择的特征是fnl, fn2... fnm (作为示例，m是43)。处理输入的色彩图像。对于特征值是Vi,...，Vm的例子，
首先在图1的步骤llO确定图像的特征fd,..，fnm的值，并且将其施加到
图1的步骤120,接着图像被分类为蓝天图像。接着在图5的步骤520 中，施加图像改进处理以改进作为蓝天图像的输入图像(改进方法可以使得图像中的蓝色更深)。
尽管已经公开了本发明的特定实施方式，但本领域技术人员将理解可针对特定的实施方式做出改变而不会偏离本发明的精神和范围。因此，本发明的范围不限于特定的实施方式，并且意图在于所附权利要求书涵盖本发明范围内的任何和所有这样的应用、修改和实施方式。
权利要求
1.一种用于将图像分类成多个种类的方法，包括步骤根据所述图像确定色彩直方图矢量；以及基于所述色彩直方图矢量将所述图像分类成多个种类，其中所述色彩直方图矢量由从候选色彩直方图特征选择的一些色彩直方图特征组成。
2. 根据权利要求1所述的方法，其中每个所述候选色彩直方图特征定义为由图像中所选色彩范围内的图像像素色彩的概率。
3. 根据权利要求2所述的方法，其中所述概率计算为所选色彩范围内的像素与所述图像中所有像素的比值。
4. 根据权利要求2所述的方法，其中所选色彩范围是任意色彩空间内的色彩范围。
5. 根据权利要求4所述的方法，其中所述色彩空间是RGB色彩空间。
6. 根据权利要求4所述的方法，其中所选色彩范围是所述色彩空间内的任意色彩范围。
7. 根据权利要求6所述的方法，其中所述色彩范围是立方体。
8. 根据权利要求7所述的方法，其中所述立方体的边长是整数 n的倍数，其中n的值是从一到所述色彩空间所允许的最大值。
9. 才艮据权利要求1所述的方法，其中由Adaboost算法来^丸行从所述候选色彩直方图特征选择所述色彩直方图特征。
10. —种用于将图像分类成多个种类的设备，包括确定模块，其用于根据所述图像确定色彩直方图矢量，分类模块，其用于基于所述色彩直方图矢量将所述图像分类成多个种类，其中所述色彩直方图矢量由从候选色彩直方图特征选择的一些色彩直方图特征组成。
11. 根据权利要求IO所述的设备，其中每个所述候选色彩直方图特征定义为由图像中所选色彩范围内的图像像素色彩的概率。
12. 根据权利要求11所述的设备，其中所述概率计算为所选色彩范围内的像素与所述图像中所有像素的比值。
13. 根据权利要求11所述的设备，其中所选色彩范围是任意色彩空间内的色彩范围。
14. 根据权利要求13所述的设备，其中所述色彩空间是RGB色彩空间。
15. 根据权利要求13所述的设备，其中所选色彩范围是所述色彩空间内的任意色彩范围。
16. 根据权利要求15所述的设备，其中所述色彩范围是立方体。
17. 根据权利要求16所述的设备，其中所述立方体的边长是整数n的倍数，其中n的值是从一到所述色彩空间所允许的最大值。
18. 根据权利要求IO所述的设备，其中由Adaboost算法来执行从所述候选色彩直方图特征选择所述色彩直方图特征。
全文摘要
本公开涉及一种用于将图像分类成多个种类的方法，包括步骤根据图像确定色彩直方图矢量以及基于色彩直方图矢量将图像分类成多个种类，其中色彩直方图矢量由从候选色彩直方图特征选择的一些色彩直方图特征组成。本方法可显著地提高图像的查全率并获得比现在方法更好的分类结果。
文档编号G06K9/62GK101344927SQ20071013625
公开日2009年1月14日申请日期2007年7月12日优先权日2007年7月12日
发明者王健民, 新纪申请人:佳能株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王健民;纪新
技术所有人：佳能株式会社
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。