用于图像分类的方法、设备以及存储介质的制作方法

文档序号:7952629阅读:316来源:国知局
专利名称:用于图像分类的方法、设备以及存储介质的制作方法
技术领域
本发明涉及图像分类,特别地涉及用于图像分类的方法、设备以及存储介质。
背景技术
在基于内容的图像检索中将图像分类到有意义的类别是一个具有挑战并且重要的问题。在很多的方法中,从整个图像提取出来的大量的特征直接用于图像分类。如我们所知,有意义的特征主要出现在图像的部分,而不是整个图像上。
由Aditya Vailaya等所著的“On image classificationcityimages vs.landscapes”,Pattern Recognition31(12)1921-1935(1998)讨论了基于内容的图像分类。该讨论根据每一个整体图像。

发明内容
本发明的目的在于开发一种改进的基于内容的图像分类方法,特别地提供一种根据块特征的基于内容的图像分类方法,该块特征从图像的一部分中提取,以更好地描述图像有意义的特征。
本发明提供了一种图像分类方法,包括步骤将输入图像分割为块;获得图像的每个块的块特征;根据块特征获得每个块的评估;根据图像的块的评估获得图像特征;根据图像特征将图像分类到预定义内容的类别。
本发明还提供了一种图像分类设备,包括图像分割装置用以将输入图像分割为块;块特征获得装置用以获得图像的每个块的块特征;
块评估装置用以根据块特征获得每个块的评估;图像特征获得装置用以根据图像的块的评估获得图像特征;图像分类装置用以根据图像特征将图像分类到预定义内容的类别。
本发明还提供一编码有用以分类图像的机器可读计算机程序码的存储介质,该存储介质包括用以导致一处理器完成本发明方法的指令。
通过本发明,开发了一种改进的根据块分割和块特征的基于内容的图像分类方法。
通过以下结合附图的对最优实施例进行的描述,本发明的其他特征和优势将会变得明显,其中附图以举例的方式表示了本发明的原则。


图1为根据本发明的图像分类方法的流程图;图2表示根据本发明的图像分类设备;图3为根据本发明一个实施例的图像分类方法的流程图;图4为根据本发明的图像分类设备200的一个实施例;图5概括地表示了可以实现本发明方法的图像分类系统;图6表示有待根据本发明进行分类的蓝天图像;图7表示有待根据本发明进行分类的非蓝天图像。
具体实施例方式
根据本发明,在一个基于内容的图像分类处理中,一输入图像被分类或是不分类到一个基于内容的类别中,也就是,该输入图像由分类处理进行识别是否包含有预定义内容。一输入图像首先被分割为许多块。在很多情况下,预定义内容可能主要包含在一个或几个块中,而不是在所有的块中。接着对每一块进行评估。该评估指出了被评估块包含预定义内容所达到的程度。根据对块的评估,获得输入图像的特征。所述输入图像的特征被用以判断输入图像包含预定义内容所达到的程度。最后,根据输入图像的特征对输入图像进行分类。
图1为根据本发明的图像分类方法的流程图。图2表示了一个根据本发明的图像分类设备100。
在步骤S1,由输入装置101输入的输入图像被图像分割装置102分割为块。这些块可以具有相同或不同的尺寸,相同或不同的形状,重叠或不重叠。
在步骤S2,由块特征获得装置103获得被图像分割装置分割的每一块的特征。这些块的特征可能是,例如,基本彩色R,G和B的彩色统计值,如块的图像像素的R(红色)值的均值,块的图像像素的G(绿色)值的均值,块的图像像素的B(蓝色)值的均值;块中的R值,G值以及B值的对于各个均值的差值,例如均方差;或是R,G和B值的差值之间的关系,例如协方差。本领域技术人员已知的是,还可以使用其他已知的特征来进一步描述每一个块。至于用以描述每个块的特征,其可以通过考虑实际情况和效果,例如预定义内容的特性,来决定。
在步骤S3,根据来自块特征获得装置103的每一个块的上述特征,每一个块由块评估装置104进行评估以描述该块可能包含预定义内容所达到的程度。并且为每一个块获得一个评估。也就是说特征和预定义内容之间的关系被整体地表示为评估。已经有许多方法被开发出来以根据图像的特征来评估图像。实际中,例如,该特征可以加权方法进行运用以获得评估,也就是,每个特征对于评估的作用可以得到调节。
在步骤S4中,由图像特征获得装置105根据来自块评估装置104的块评估而获得输入图像的图像特征。该图像特征包括,例如,这些块的评估的均值,或是其中某些块的评估的均值,例如具有最大评估的块的二分之一,四分之一或八分之一。图像特征还可以包括,例如,块的评估的均方差或是某些块的评估的均方差,例如具有最大评估的块的二分之一,四分之一或八分之一。
在步骤S5中,由图像分类装置106依据根据来自图像特征获得装置105的图像特征获得的分类值而对图像进行分类。根据上述的图像特征,图像分类装置106获得一个分类值以描述该图像可能包含预定义内容所达到的程度。如果图像分类装置106判断出该分类值不小于一预定的阈值,则图像分类装置106将该输入图像分类到具有预定义内容的类别中。否则,该输入图像不被分类到具有预定义内容的类别。实际中,例如,该特征可以加权方法进行运用以获得分类值,也就是,每个图像特征对于分类的作用可以得到调节。
图3为根据本发明一个实施例的图像分类方法的流程图。图4为根据本发明的图像分类设备200的一个实施例。
例如,根据图3中的图像分类方法,图4的图像分类设备200将所输入的图像分类为蓝天图像或非蓝天图像。
图3所示的实施例优选地从步骤S21开始,即由图像调整尺寸装置201a调整所输入图像的尺寸到一特殊尺寸,以推动接下来的处理。在本实施例中,首先,具有初始尺寸的图像由图像调整尺寸装置201a调整尺寸到一个新的尺寸19200像素。图像的宽高比并没有改变。
在步骤S22,来自图像调整尺寸装置201a的调整尺寸后的图像被图像分割装置202分割为尽可能多的块。这些块具有相同的尺寸宽度和高度都为16。所有的块都没有重叠。
在步骤S23,块特征获得装置203获得每一块的特征,例如基本色彩R,G和B的色彩统计值。在本实施例中,r(i),g(i),b(i)代表一个块中第i个图像像素的r,g和b值。在一个块中有16×16=256个像素,i=1...256。
块特征获得装置203获得一块中的图像像素的R(红色)值的均值,一块中的图像像素的G(绿色)值的均值,以及一块中的图像像素的B(蓝色)值的均值,其表示为f(1)=Σi=1256r(i)256,]]>f(2)=Σi=1256g(i)256,]]>f(3)=Σi=1256b(i)256.]]>块特征获得装置203获得块中的R值,G值以及B值的对于各个均值的差值,例如均方差,其表示为f(4)=Σi=1256(r(i)-f(1))2256,]]>f(5)=Σi=1256(g(i)-f(2))2256,]]>f(6)=Σi=1256(b(i)-f(3))2256.]]>块特征获得装置203获得R,G和B值的差值之间的关系,例如协方差,其表示为f(7)=Σi=1256(r(i)-f(1))×(g(i)-f(2))256,]]>f(8)=Σi=1256(r(i)-f(1))×(b(i)-f(3))256,]]>f(9)=Σi=1256(g(i)-f(2))×(b(i)-f(3))256.]]>在本实施例中,由块特征获得装置203获得的上面九个特征被用以描述每一块。
这样就获得了每一块的9维的特征矢量。令f(i)(i=1...9)为该9维特征矢量。
在步骤S24,根据上面的每一块的特征矢量,每一块由块评估装置204进行评估以描述该块可能包含蓝天内容所达到的程度。并且块评估装置204对于每一块都获得一评估。也就是说该特征和蓝天内容之间的关系被整体地表示为评估。在本实施例中,特征矢量中的特征以加权方法进行运用以获得评估,也就是,每个特征对于评估的作用可以被调节。
在本实施例中,一块的评估为该块的特征矢量与一给定的9维系数矢量的内积。令c(i)(i=1...9)为这个9维系数矢量。
那么Evaluation=Σi=19f(i)×c(i)9]]>在步骤S25,由图像特征获得装置205根据来自块评估装置204的块的评估而获得输入图像的图像特征。在本实施例中,目前为止,由于每一块产生一个评估故而获得了许多评估。令e(i)为所有评估中第i个最大的评估。并且n为这些评估的计数。
因此对于任何的i<j(i=1...n,j=1...n),e(i)≥e(j)获得如下的图像块的评估统计值作为图像特征。
图像特征获得装置205获得这些块的评估的均值以及这些块的评估的均方差值,其表示为imf(1)=Σi=1ne(i)n,]]>imf(2)=Σi=1n(e(i)-imf(1))2n.]]>图像特征获得装置获得最大的块的评估的二分之一的均值和均方差值,其表示为imf(3)=Σi=1n/2e(i)n/2,]]>imf(4)=Σi=1n/2(e(i)-imf(3))2n/2,]]>
其中n/2为取整后的数值。
图像特征获得装置205获得最大的块的评估的四分之一的均值和均方差值,其表示为imf(5)=Σi=1n/4e(i)n/4]]>imf(6)=Σi=1n/4(e(i)-imf(5))2n/4]]>其中n/4为取整后的数值。
图像特征获得装置205获得最大的块的评估的八分之一的均值和均方差值,其表示为imf(7)=Σi=1n/8e(i)n/8,]]>imf(8)=Σi=1n/8(e(i)-imf(7))2n/8.]]>其中n/8为取整后的数值。
接着图像特征获得装置205对于该图像获得一个8维的图像特征矢量。令imf(i)(i=1...8)为该8维图像特征矢量。
在本实施例的步骤S26,图像分类装置206依据根据来自图像特征获得装置205的图像特征矢量获得的分类值对图像进行分类。该分类值由图像分类装置206获得以描述该图像可能包含蓝天内容所达到的程度。在本实施例中,图像特征矢量以加权方法进行运用以获得分类值,也就是,图像特征矢量中的每个图像特征对于分类的作用可以被调节。
我们定义一个8维的权重矢量w(i),并且定义“th”为阈值。
如果图像分类装置206判断出Σi=18imf(i)×w(i)≥th,]]>则该图像为一个蓝天图像,否则不是。
在本实施例中,还描述了计算下面参数的方法步骤S23中的c(i)(i=1...9)以及步骤S26中的w(i)(i=1...8)和“th”。
1.从蓝天图像中得到许多纯的蓝天图像切片并且从某些图像中得到许多纯的非蓝天图像切片作为训练集。纯的蓝天图像为仅包含蓝天区域的图像,而纯的非蓝天图像为不包含蓝天区域的图像。
2.对于训练集中的每个图像,应用步骤S21和S22的两个操作,于是得到每一块的特征矢量f(i)(i=1...9)。接着该步骤,对于上面的两种类型的(蓝天和非蓝天)图像,可以得到两种类型的块和矢量。每一种都从相应类型的图像得到。
3.运用Fisher线性分类器来训练这两种类型的矢量,得到权重矢量c(i)(i=1...9)。
4.对于每一个图像,应用步骤S25的操作,得到矢量imf(i)(i=1...8)。接着对于上述两种类型的图像,得到两种类型的矢量。每一种都从相应类型的图像得到。
5.运用Fisher线形分类器来训练这两种类型的矢量,得到权重矢量w(i)(i=1...8)。
6.选择“th”作为imf(i)和w(i)的内积的阈值,标准是在之前的步骤得到的Fisher线形分类器对于使用阈值的训练集,可以得到最好的结果(正确率与错误率之间的差最大)。
下面给出了关于如图6所示的蓝天图像(出于打印的原因表现为黑白的)以及如图7所示的非蓝天图像(出于打印的原因表现为黑白的)的图像分类的一个数字例子。
在本例中,c(i)(i=1...9)为-3.5984 -1.3171 8.1411 0.0310 0.1250 -0.0402 -0.0259 -0.1211-0.0740.
w(i)(i=1...8)为-0.81944 -0.29196 -2.5335 -6.9175 -2.4346 1.1157 -0.57225 -1.2136.
th为6974.
结果是,对于图6中所示的蓝天图像,图像特征(imf(i))为-7070.6 5105.2 -3327.8 1104.9 -2497.4 678.68 -2270.3 895.1与w(i)(i=1...8)的内积为12142,其大于th,并且被分类为蓝天。
对于图7中所示的非蓝天图像,图像特征(imf(i))为-7717.9 8860.1 -2255.6 1394.4 -1045.1 410.35 -706.23 141.45,与w(i)(i=1...8)的内积为3041.3,其小于th,并且被分类为非蓝天。
以下给出的描述数字地解释了如何获得上面的c(i)(i=1...9),w(i)(i=1...8)以及th。
首先,以下给出块特征的一个数字的例子。
对于蓝天块r值的矩阵为107 114 115 113 113 113 113 113 112 112 113 114 115 114 113 113109 113 114 113 113 114 113 113 112 114 113 115 113 113 113 113114 116 116 115 115 114 113 113 114 112 113 115 113 113 113 113107 118 115 116 116 116 115 115 114 115 112 113 115 115 113 113114 119 116 114 115 115 115 114 114 114 114 114 114 114 114 114110 120 117 116 116 115 116 116 116 116 115 115 113 114 114 114110 120 117 116 116 117 115 115 116 116 115 115 117 114 114 114117 122 119 116 117 118 118 116 117 117 116 115 115 115 115 115
113 122 119 118 118 119 117 117 118 118 118 118 118 116 116 115115 123 120 119 118 119 118 120 119 119 119 117 116 118 117 116115 123 120 120 117 119 118 120 119 119 117 118 116 117 119 118119 124 122 120 120 120 119 120 119 120 120 119 119 120 122 119117 124 121 120 121 120 120 119 120 120 120 119 119 121 121 119120 128 126 125 124 123 123 124 123 124 125 122 124 123 123 120122 128 126 125 126 126 123 124 123 122 123 124 126 120 122 120123 128 125 125 125 125 125 123 124 125 125 125 125 125 126 121g值的矩阵为166 168 168 167 167 167 167 167 166 166 167 168 169 168 167 167168 167 167 167 167 168 167 167 166 168 167 169 167 167 167 167173 169 169 169 169 168 167 167 168 166 167 169 167 167 167 167166 166 168 168 168 168 167 167 168 169 166 167 169 169 167 167173 167 169 166 167 167 167 166 168 168 168 168 168 168 168 168167 167 168 168 168 167 168 168 168 168 169 169 167 168 168 168167 167 168 168 168 169 167 167 168 168 169 169 171 168 168 168174 169 170 168 169 170 170 168 169 169 170 169 169 169 169 169170 169 170 170 170 171 169 169 170 170 170 170 170 168 168 169172 170 171 171 170 171 170 172 171 171 171 169 168 170 169 170172 170 171 172 169 171 170 172 171 171 169 170 168 169 171 172176 172 174 173 172 172 171 172 171 172 172 171 171 171 173 173174 172 173 173 173 172 172 171 172 172 172 171 171 172 172 172172 172 175 174 173 172 172 173 172 173 174 171 173 172 172 175174 172 175 174 175 175 172 173 172 171 172 173 175 169 171 175175 172 174 174 174 174 174 172 173 174 174 174 174 174 175 176b值的矩阵为210 212 212 214 214 214 214 214 213 213 214 215 216 215 214 214212 211 211 214 214 215 214 214 213 215 214 216 214 214 214 214217 213 213 216 216 215 214 214 215 213 214 216 214 214 214 214210 212 212 215 215 215 214 214 214 215 212 213 215 216 214 214217 213 213 213 214 214 214 213 214 214 214 214 214 215 215 215212 213 213 215 215 214 215 215 215 215 215 215 213 214 214 214212 213 213 215 215 216 214 214 215 215 215 215 217 214 214 214219 215 215 215 216 217 217 215 216 216 216 215 215 215 215 215215 215 215 217 217 218 216 216 217 217 217 217 217 215 215 215217 216 216 218 217 218 217 219 218 218 218 216 215 217 216 216217 214 216 219 216 218 217 219 218 218 216 217 215 216 218 218
219 210 214 215 219 219 218 219 218 219 219 218 218 218 220 219217 210 213 215 220 219 219 218 219 219 219 218 218 219 219 216222 219 218 217 216 215 215 216 215 216 217 214 216 215 215 216224 219 218 217 218 218 215 216 215 214 215 216 218 212 214 216225 219 217 217 217 217 217 215 216 217 217 217 217 217 218 2179维的特征矢量为117.6563 169.8672 215.6055 17.2618 6.3744 4.8908 8.77385.0521 3.8376.
评估(9维特征矢量与c(i)(i=1...9)的内积)为1108.2。
对于非蓝天块r值的矩阵为167 131 55 109 94 74 163 187 161 47 60 108 17 97 122 4248 77 91 74 30 99 0171 131 80 114 36 31 73 55 10199 109 77 50 45 35 172 79 102 167 127 140 141 101 84 7783 123 78 103 83 117 129 104 130 127 225 81 171 57 107 10470 80 134 59 41 20 86 0132 44 51 101 66 54 131 129154 102 0 37 118 42 45 44 48 42 70 60 38 13 19 11445 18 34 99 105 32 183 22 41 54 62 31 106 69 20 8679 111 2 81 42 44 111 49 88 78 59 56 90 60 71 8870 71 46 27 35 88 987 923 81 93 25 84 91 1956 68 38 44 14 39 21 92 59 22 105 26 136 78 29 3940 70 23 87 46 48 138 0721 98 32 34 50 44 2777 566 41 131 87 46 22 36 10 62 92 30 57 95 8655 37 161 108 71 110 132 48 14 21 45 23 31 64 42 1536 73 38 39 32 72 941 45 52 15 028 33 25 2124 31 72 31 25 70 9122 14 26 27 100 31 30 19 3726 661 55 24 57 52 11 36 12 116 89 27 11 31 22g值的矩阵为206 153 68 130 115 102 181 212 202 86 96 144 38 112 147 6473 92 108 89 42 116 23 208 177 121 149 70 58 101 79 124
129 139 104 73 69 61 204 119 140 207 168 174 176 129 107 108116 153 116 145 128 165 175 150 175 172 255 119 213 103 151 143112 124 182 103 87 58 124 33 163 81 89 140 105 92 172 171190 138 26 76 160 83 81 83 74 67 101 92 72 43 46 14982 58 76 138 144 72 213 50 70 78 91 46 127 98 45 120112 141 38 119 75 74 139 61 107 100 87 83 114 92 109 124105 107 73 52 68 131 33 104 26 42 103 124 51 116 124 4589 98 65 62 42 81 45 118 84 38 125 58 168 110 62 6971 100 53 121 74 74 176 34 30 34 130 64 63 78 71 56106 32 91 63 154 123 86 52 66 28 100 127 68 98 124 11381 59 197 148 111 154 171 84 41 48 84 47 58 89 54 2853 98 74 80 69 102 42 76 66 78 53 15 46 48 34 3345 52 102 54 47 97 40 150 33 46 58 123 46 44 31 5139 25 86 75 44 88 80 27 51 28 147 114 42 26 44 37b值的矩阵为153 107 25 74 59 44 139 170 146 29 35 98 0 73 107 1731 51 72 50 6 71 0154 105 55 93 20 15 53 17 7069 75 49 31 19 13 157 59 79 144 102 113 12291 65 4947 81 43 82 63 103 111 86 116 107 206 60 14931 76 7826 49 108 42 22 1 65 0103 11 38 93 58 35 106 105118 74 0 19 96 27 37 26 35 25 44 42 21 0 08328 628 85 87 19 161 022 42 47 15 88 52 36955 91 0 82 28 22 88 23 62 61 39 40 62 25 34 5047 46 30 10 15 78 070 010 65 80 16 66 71 032 48 12 22 0 35 11 73 45 9 88 9 12160 91912 48 3 70 23 35 129 0214 89 17 17 29 28 1048 051 24 110 62 24 032 6 49 71 9 38 68 6236 20 136 86 51 93 124 36 67 29 11 25 60 32 821 58 12 24 15 52 034 33 41 4 0 22 27 15 914 19 52 10 11 52 0110 518 14 94 27 21 92822 044 38 7 44 32 022 0 90 74 23 3 24 189维特征矢量为65.641 95.09 47.918 1847.4 2216.9 1609.1 1992.1 1694.3 1821.7.
评估(9维特征矢量与c(i)(i=1...9)的内积)为-93.2237。
下面给出训练的一个数字例子。
首先,对c(i)(i=1...9)进行如下的训练。
下面所列出的为蓝天块的样本(fi)。
每一行为一个样本,一共使用了9933个块样本,在这里只列举了其中的10个。
161.25184.50206.8825.043.306.306.0711.363.99169.14186.36205.475.56 5.077.365.213.36 3.94173.01189.11206.616.20 5.006.635.294.70 3.97161.83184.80207.3014.882.644.103.396.72 2.73168.39187.34205.9813.753.666.234.614.73 2.30174.57189.28206.625.70 4.263.742.463.66 2.81162.34185.16207.7114.003.994.573.846.52 3.71168.96186.99205.889.41 4.427.074.673.41 3.50172.38189.57206.2810.169.268.104.335.56 7.0878.45 104.54137.519.27 9.839.599.429.37 9.70.................
下面所列出的为非蓝天块的样本f(i)。
每一行为一个样本,一共使用了17758个块样本,在这里只列举了其中的10个。
37.5115.5117.515.415.415.415.415.415.4187.8833.3228.981051.33 389.04 281.66 569.30 389.67 302.0870.0530.7225.68289.16 192.32 155.38 226.66 189.93 167.3951.1720.7723.0414.55 10.02 9.718.2410.22 9.27105.32 63.1641.613589.80 3206.25 2284.21 3305.04 2478.39 2545.1060.0925.8119.33820.77 510.48 187.10 620.97 279.24 261.1897.0448.6829.0025.49 28.93 10.66 27.04 14.09 14.3569.5930.7123.46327.86 252.94 178.30 277.40 191.48 188.9451.1849.4027.79820.74 1389.68 452.49 990.96 562.71 690.2791.8146.7428.4046.89 37.04 10.97 38.82 17.82 16.28
.................
通过训练获得的c(i)(i=1...9)为-3.5984 -1.3171 8.1411 0.0310 0.1250 -0.0402 -0.0259 -0.1211-0.0740.
对w(i)(i=1...8)进行如下的训练。
下面所列出的为蓝天图像的样本(imf(i))。
每一行为一个样本。一共使用了1001个图像样本,这里仅列举出其中的10个。
-4294.73947.4-18101420.5-499.41297.31-265.71107.21-5894.15971.2-3243.9 669.02-2723.4534.08-2337.6521.38-5229.13974.9-2209.9 1191.3-1197.1556.14-852.22507.75-7741.16747.2-3532.8 785.59-3020.4815.49-2475.8870.44-5311.63038.7-3240.9 912.08-2527.3644.45-2028.5533.04-5317.25601.3-1530.9 887.1 -868.35450.55-720.79585.16-6503.65593.3-4041.5 1136.8-3269.61180.2-2354.5970.65-5622 3319.5-3802.8 563.24-3366.5447.2 -3077.2478.51-5372.13162 -3167.4 667.87-2711.1651.08-2256.5663.74-7562.15326.9-4032.7 1999.7-2479.21687.2-1074.91031.................
下面所列出的为非蓝天图像的样本(imf(i))。
每一行为一个样本。一共使用了2469个图像样本,这里仅列举出了其中的10个。
-9451.27478.4-3776.31472.1-2679.31265.7-2198.71610.7-5752.92926.4-3911.5775.24-3209.4371.95-2876 155.79-7556.38430.2-3034.51672.4-1533.8948.26-872.1 738.72-4737 4224.2-1619.61179.8-673.85441.18-323.48308.41-4671.73917.4-2349.91262.8-1272.4763.57-583.62193.82-6135.95062.4-3643.61248.5-2669.71082.7-1830.2894.28-7763.67765.8-2932.61998.6-1104.91120.8-333.51570.27-5508 5359.6-1965.31445 -686.85707.97-65.51764.766-5672.62604.8-4068.5981.61-3603.21209.1-3071.91552.3
-5685.37713.1-434.93632.482.9443225.9161.6225.57.................
通过训练获得的w(i)(i=1...8)为-0.81944-0.29196-2.5335-6.9175-2.43461.1157-0.57225-1.2136.
th为6974。
图5概括地表示了可以实现本发明方法的图像分类系统。图5所示的图像处理系统包括CPU(中央处理单元)111,RAM(随机存取存储器)112,ROM(只读存储器)113,系统总线114,HD(硬盘)控制器115,键盘控制器116,串行端口控制器117,并行端口控制器118,显示屏控制器119,硬盘120,键盘121,图像输入装置122,打印机123以及显示屏124。在这些组件中,连接到系统总线114的为CPU111,RAM112,ROM113,HD控制器115,键盘控制器116,串行端口控制器117,并行端口控制器118以及显示屏控制器119。硬盘120连接到HD控制器115,并且键盘121连接到键盘控制器116,图像输入装置122连接到串行端口控制器117,打印机123连接到并行端口控制器118,并且显示屏124连接到显示屏控制器119。
图5中的每一个组件的功能都是本领域内已知的并且图5所示的结构为传统的。这样的结构不仅应用于个人计算机,还应用于其他的基于计算机的设备。在一种不同的应用中,图5所示的组件中的一些可以省略,且系统可以实现为一个单片微机。如果应用软件存储在EPROM或是其他的非易失存储器里,HD控制器115以及硬盘120可以省略。
图5所示的整个系统由计算机可读指令控制,其通常以软件形式存储在硬盘120(或如上所述,在EPROM或其他非易矢存储器)中。该软件也可以从网络上下载(图中没有示出)。该软件,无论是保存在硬盘120上或是从网络下载的,可以载入RAM112,并且由用于完成软件所定义的功能的CPU111来执行。
对于本领域的技术人员而言,无需任何创造性的工作就可以根据本法明的方法开发出一个或多个软件。这样开发出来的软件将会执行图1以及图3所示的图像分类方法。
在某种意义上,图5所示的图像处理系统,如果有根据本发明的方法开发出来的软件作为支持,可以达到图2以及图4所示的用于处理图像的设备的相同的功能。
本发明还提供了一种存储介质,其上编码有用于图像处理的机器可读的计算机程序码,该存储介质包括用以使处理器完成根据本发明的方法的指令。该存储介质可以是任何具体的介质,例如软磁盘,CD-ROMs,硬驱动(例如,图5所示的硬盘120)。
虽然之前的描述参考了本发明的特殊实施例,但是可以理解的是对于本领域的技术人员而言这些仅为举例说明,并且在这些实施例中可以做出改变而不会背离本发明的原则,以及由所附权利要求定义的范围。
权利要求
1.一种图像分类方法,包括步骤将输入图像分割为块;获得图像的每个块的块特征;根据块特征获得每个块的评估;根据图像的块的评估获得图像特征;根据图像特征将图像分类到预定义内容的类别。
2.根据权利要求1的图像分类方法,进一步包括在分割前对输入图像调整尺寸的步骤。
3.根据权利要求2的图像分类方法,其中在调整尺寸步骤中,图像的宽度与高度比不改变。
4.根据权利要求1的图像分类方法,其中块的块特征为块的像素的彩色统计值。
5.根据权利要求4的一种图像分类方法,其中块的块特征为块的像素的基本彩色值的均值、均方差值或是协方差值。
6.根据权利要求1的一种图像分类方法,其中通过将该块的各个加权块特征进行相加而得到每个块的评估。
7.根据权利要求1的一种图像分类方法,其中图像的图像特征为该图像的块的评估的统计值。
8.根据权利要求7的一种图像分类方法,其中该图像的图像特征为该图像的块的评估的均值,均方差值。
9.根据权利要求8的一种图像分类方法,,其中该图像的图像特征为图像的块的一些最大评估的均值,均方差值。
10.根据权利要求1的一种图像分类方法,其中在分类步骤中,将图像的各个加权的图像特征相加而得到分类值。
11.根据权利要求10的一种图像分类方法,其中在分类步骤中,将分类值与预定的值进行比较以判断是否将该图像分类到具有预定义内容的类别中。
12.根据权利要求11的一种图像分类方法,其中分类值指的是该图像包含预定义内容所达到的程度。
13.根据权利要求1的一种图像分类方法,其中块的评估指的是该块包含预定义内容所达到的程度。
14.一种图像分类设备,包括图像分割装置,用以将输入图像分割为块;块特征获得装置,用以获得图像的每个块的块特征;块评估装置,用以根据块特征获得每个块的评估;图像特征获得装置,用以根据图像的块的评估获得图像特征;图像分类装置,用以根据图像特征将图像分类到预定义内容的类别。
15.根据权利要求14的一种图像分类设备,进一步包括用以在图像分割装置对图像进行分割前将输入图像的尺寸调整到预定尺寸的图像调整尺寸装置。
16.根据权利要求15的一种图像分类设备,其中当图像调整尺寸装置对输入图像调整尺寸时,该图像调整尺寸装置不改变图像的宽度与高度比。
17.根据权利要求14的一种图像分类设备,其中块的块特征为块的像素的彩色统计值。
18.根据权利要求17的一种图像分类设备,其中块的块特征为块的像素的基本彩色值的均值、均方差值或是协方差值。
19.根据权利要求14的一种图像分类设备,其中块评估装置通过将该块的各个加权块特征进行相加而得到每个块的评估。
20.根据权利要求14的一种图像分类设备,其中图像的图像特征为该图像的块的评估的统计值。
21.根据权利要求20的一种图像分类设备,其中该图像的图像特征为该图像的块的评估的均值,均方差值。
22.根据权利要求20的一种图像分类设备,其中该图像的图像特征为图像的块的一些最大评估的均值,均方差值。
23.根据权利要求14的一种图像分类设备,其中图像分类装置通过将图像的各个加权的图像特征相加而得到图像的分类值。
24.根据权利要求23的一种图像分类设备,其中图像分类装置将分类值与预定的值进行比较以判断是否将该图像分类到具有预定义内容的类别中。
25.根据权利要求24的一种图像分类设备,其中分类值指的是该图像包含预定义内容所达到的程度。
26.根据权利要求14的一种图像分类设备,其中块的评估指的是该块包含预定义内容所达到的程度。
27.一种编码有用以分类图像的机器可读计算机程序码的存储介质,该存储介质包括用以使处理器完成根据权利要求1-13的任一个的方法的指令。
全文摘要
本发明提供一种图像分类方法,包括步骤将输入图像分割为块;获得图像的每个块的块特征;根据块特征获得每个块的评估;根据图像的块的评估获得图像特征;根据图像特征将图像分类到预定义内容的类别。
文档编号H04N5/76GK101018280SQ20061000732
公开日2007年8月15日 申请日期2006年2月9日 优先权日2006年2月9日
发明者王健民, 纪新 申请人:佳能株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1