图像处理设备和图像处理方法_2

文档序号:8365796阅读:来源:国知局
可以从图像处理设备10外部的数据库获取样本图像。
[0043]局部图像特征生成部13对于利用样本图像获取部12获取的样本图像生成局部图像特征。例如,局部图像特征生成部13对于样本图像的像素中的全部或一部分中的每一个,基于像素(或由多个像素构成的像素组)(或基点,其是像素或像素组中包括的任何坐标)周围的特定区域中的图像信息生成局部特征。例如,可以使用像素的RGB值、尺度不变特征变换(SIFT)特征、方向梯度直方图(HOG)特征和Gabor特征中的一个或多个作为局部特征。局部图像特征生成部13可以对于样本图像中的像素设置多个大小(尺度)的区域以对于每个大小的区域生成局部特征。
[0044]局部图像特征聚类设置部14将由局部图像特征生成部13生成的局部特征划分为多个聚类以保持关于每个聚类的中心的信息。例如,局部图像特征聚类设置部14可以利用k-Means聚类将对于多个样本图像获取的局部特征划分为聚类。在本示例性实施方式中,识别编号被添加到局部特征的每个聚类并且聚类的数目可以为大约几千。局部图像特征聚类设置部14可以将关于局部特征的聚类的信息存储在例如聚类模型参数存储器20中。
[0045]局部图像特征量化部15基于由局部图像特征聚类设置部14设置的多个聚类中由局部图像特征生成部13生成的局部特征属于哪个聚类来对局部特征进行量化。例如,局部图像特征量化部15可以将由局部图像特征生成部13生成的局部特征替换为局部特征属于的聚类的识别编号以对局部特征进行量化。
[0046]学习区域设置部16基于由学习信息接受部11接受的学习信息在样本图像中设置在学习处理中使用的一个或多个部分图像区域(学习区域)。例如,学习区域设置部16可以基于由学习信息接受部11接受的区域指定数据在样本图像中设置一个或更多个学习区域。学习区域中的至少一些可以彼此交叠。特别地,学习区域中的一些可以被设置为对于包括待学习的对象的区域彼此交叠。虽然在本示例性实施方式中示例了学习区域具有矩形形状的情况,但是学习区域可以具有除了矩形之外的形状。
[0047]矩形特征值生成部17基于由学习区域设置部16设置的学习区域(矩形区域)中包括的并且被量化的局部特征(此外,局部特征的分布)生成学习区域(矩形区域)的特征值。例如,矩形特征值生成部17可以基于通过计数为目标矩形区域中包括的每个像素量化的局部特征(即,聚类编号)的频率来将特征值生成为矩形特征值。例如,矩形特征值生成部17可以通过将每个聚类编号的频率除以矩形区域中包括的像素的数目来生成被归一化的直方图。由于矩形特征值的是几千维度的向量,因此向量可以被压缩为低维度向量。例如,为了压缩向量的维度,可以预先准备很多矩形特征值,可以利用主成分分析(PCA)来计算本征值,并且可以将矩形特征值投影在由均具有高本征值的若干本征向量构成的子空间上以压缩维度。替选地,可以使用添加到用于学习的样本图像的对象的种类(图像类别)利用典范相关分析(CCA)来计算其中矩形特征值与图像类别之间的相关性增加的子空间。
[0048]矩形特征值存储器18将由学习区域设置部16设置的每个矩形区域与针对矩形区域由矩形特征值生成部17生成的矩形特征值和由学习信息接受部11接受的对象的种类(图像类别)关联地保持。矩形特征值存储器18可以将每个矩形区域与关于矩形区域的位置(坐标位置)和大小的信息关联地保持。
[0049]机器学习部19基于在矩形特征值存储器18中保持的对象的种类(图像类别)和矩形特征值学习对应于每个对象种类的识别器。例如,机器学习部19可以将每个对象种类以一一对应的方式与识别器标识符(ID)关联,以对于由识别器ID标识的每个识别器基于与对应于该识别器的对象的种类关联的矩形特征值执行学习处理。例如,机器学习部19可以在对象为车时利用对应于车的第X识别器(识别模型)执行学习处理,并且可以在对象为人时利用对应于人的第Y识别器(识别模型)执行学习处理。机器学习部19可以在识别模型参数存储器20中存储对应于对象的种类的第一至第N(N是大于等于I的整数)识别器的学习参数。
[0050]机器学习部19可以对于每个对象种类执行矩形区域的大小和位置的聚类以在对应于该对象的种类的第i (i是从I至N的任意整数)识别模型参数存储器20-1中存储包括关于对应于对象的种类的典型矩形区域的大小和位置(坐标位置、坐标位置处的移动量等等)的信息的矩形区域设置参数。
[0051]虽然诸如最近邻识别器或随机森林识别器的高速识别器是想要的识别器,但是可以使用高斯混合模型或支持向量机。当使用最近邻识别器或随机森林识别器时,可以利用一个识别器来识别多个图像类别,并且当使用高斯混合模型或支持向量机时可以准备图像类别的数目的识别器。
[0052]识别模型参数存储器20包括第一至第N(N是大于或等于I的整数)识别模型参数存储器20-1至20-N。第i (i是从I至N的任意整数)识别模型参数存储器20-1对于对应于第i识别模型的对象的种类存储标识由机器学习部19学习的矩形特征值的识别条件(识别超平面等等)的识别模型参数。第i识别模型参数存储器20-1可以进一步存储关于基于在学习中使用的矩形区域学习的典型矩形区域的大小和位置的信息。
[0053]上面描述了图像处理设备10的关于学习处理的示例性功能。接下来,将参考图2描述图像处理设备10的关于利用识别器从图像识别对象的处理的示例性功能。
[0054]1-2.关于识别处理的功能块的描述
[0055]参考图2,图像处理设备10包括目标图像获取部21、局部图像特征生成部13、局部图像特征聚类设置部14、局部特征量化部15、识别模型选择部22、识别目标区域设置部23、矩形特征值生成部17、识别部24、识别模型参数存储器20、识别结果整合部25和识别结果输出部26。
[0056]上述图像处理设备10中的块的功能可以由计算机实现,该计算机包括诸如CPU的控制器、存储器、将数据发送到外部装置并且从其接收数据的输入-输出部以及读出存储在计算机可读信息存储介质中的程序以执行所读出的程序的单元。程序可以经由诸如光盘、磁盘、磁带、磁光盘或闪存的信息存储介质提供给是计算机的信息处理设备10或者可以经由诸如互联网的数据通信网络提供给图像处理设备10。现在将详细描述图2中所示的块的功能。
[0057]目标图像获取部21获取将要进行识别处理的图像(目标图像)。例如,目标图像获取部21可以从诸如相机或个人计算机的外部装置获取目标图像。图3示出了由目标图像获取部21获取的目标图像T的示例。
[0058]局部图像特征生成部13对于由目标图像获取部21获取的目标图像生成局部图像特征。例如,局部图像特征生成部13对于目标图像的像素(或像素组)的全部或一部分中的每一个,基于像素(或由多个像素构成的像素组)(或是像素或像素组中包括的任意坐标的基点)周围的特定区域中的图像信息生成局部特征。例如,像素的RGB值、SIFT特征、HOG特征和Gabor特征中的一种或多种可以用作局部特征。局部图像特征生成部13可以对于目标图像中的每个像素设置多个大小(尺度)的区域以对于每个大小的区域生成局部特征。
[0059]局部图像特征聚类设置部14设置关于局部特征的每个聚类的信息。例如,局部图像特征聚类设置部14可以基于关于识别模型参数存储器20中存储的局部特征的聚类的信息设置关于局部特征的每个聚类的信息。
[0060]局部图像特征量化部15基于由局部图像特征生成部13生成的局部特征属于由局部图像特征聚类设置部14设置的多个聚类中的哪个聚类来对局部特征进行量化。例如,局部图像特征量化部15可以将由局部图像特征生成部13生成的局部特征替换为局部图像所属于的聚类的识别编号以对局部特征进行量化。
[0061]识别模型选择部22从第一至第N(N是大于或等于I的整数)识别模型中选择在识别中使用的识别模型。例如,识别模型选择部22可以在选择在进行指定时指定的识别模型并且可以在没有指定时按照识别模型的编号的升序(或降序)来顺序地选择第一至第N识别模型。
[0062]识别目标区域设置部23在目标图像中设置将要识别的多个部分图像区域(识别目标区域)。例如,识别目标区域设置部23可以将目标图像中具有一个或多个预定大小的矩形区域移动预定偏移量以设置多个识别目标区域。当由识别模型选择部22选择了第i(i是从I至N的任意整数)识别模型时,识别目标区域设置部23可以参考第i识别模型参数存储器20-1中存储的矩形区域设置参数以基于关于矩形区域设置参数中指示的大小和位置的信息设置多个识别目标区域。识别目标区域设置部23可以将部分图像区域的位置设置为在目标图像中设置的多个部分图像区域中的至少一些彼此交叠。虽然在本示例性实施方式中示例了识别目标区域具有矩形形状的情况,但是识别目标区域可以具有除了矩形之外的形状。
[0063]图4示出了对于目标图像T由识别目标区域设置部23设置的示例性多个识别目标区域。在图4中示出了对于目标图像T设置四个识别目标区域A、B、C和D的示例。
[0064]矩形特征值生成部17基于由识别目标区域设置部23设置的识别目标区域(矩形区域)中包括的并且被量化的局部特征生成识别目标区域(矩形区域)的特征值。例如,矩形特征值生成部17可以基于通过计数对于目标矩形区域中包括的每个像素量化的局部特征的频率(即,聚类编号)而生成的直方图来将特征值生成为矩形特征值。例如,矩形特征值生成部17可以通过将每个聚类编号的频率除以矩形区域中包括的像素的数目来生成归一化的直方图。由于矩形特征值是几千维度的向量,因
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1