获取图像描述信息的方法及装置以及分类器训练方法

文档序号：6428021阅读：181来源：国知局

专利名称：获取图像描述信息的方法及装置以及分类器训练方法
技术领域：
本发明一般地涉及图像处理技术领域，尤其是一种获取图像描述信息的方法及装置，分类器训练方法，以及图像识别方法和装置。
背景技术：
随着计算机技术和互联网的迅速发展，在许多领域中，数字图像的数量和复杂度都呈现出爆炸性的增长趋势。因此，如何对这些海量图像进行快速有效的管理自然而然成为我们面临的ー个挑战课题，主要包括对这些图像的访问、存取、组织、检索等。为了满足这ー需求，自上个世纪九十年代以来，各个领域的研究人员和学者已经投入了很多精力对图像识别技术进行研究，并开发出一些有效的技术和系统。
·
在图像识别系统中，根据图像中的特征，如顔色、纹理和形状特征，计算图像间的距离，即确定图像之间的相似度，完成图像识别的功能。例如，对10类对象Cl. . . ClO进行识另IJ，那么首先需要为每ー个类别(从Cl到C10)准备ー些图像，即训练图像集(训练样本)，包含对象Cl的图像组成Cl的训练图像集，包含对象C2的图像组成C2的训练图像集...；然后，从这些训练图像集中提取图像特征；最后，根据这些图像特征构建模型。在识别阶段，当给定ー个待识别图像时，首先从该图像中提取图像特征，然后，利用之前构建的模型判断该图像的类别，完成识别功能。然而，一幅图像往往包含复杂的内容，如包括前景对象和背景部分，而在图像识别时往往只是针对前景对象，如果在识别过程提取图像特征时，对于整个图像中的前景对象和背景部分毫无差别，会导致图像识别的准确度下降。因此，在提取图像特征之前，如何尽可能的减小背景部分的影响，获得更准确的图像描述信息是非常重要的。

发明内容
有鉴于此，本发明实施例提供了一种图像描述信息的获取方法及装置，能够减小图像中背景部分的影响，获得更准确的图像描述信息。根据本发明实施例的ー个方面，提供一种基于多幅图像获取图像描述信息的方法，包括分割所述多幅图像，获得所述多幅图像的子图像；基于所述子图像相互之间的特征相似性，获得所述子图像的相似度因子；基于所述子图像的相似度因子计算所述子图像所对应的图像的描述信息。根据本发明实施例的另ー个方面，提供一种分类器训练方法，包括利用上述基于多幅图像获取图像描述信息的方法，将训练图像作为所述多幅图像，计算所述训练图像的图像描述信息；基于所述训练图像的图像描述信息训练分类器。根据本发明实施例的再ー个方面，提供ー种图像识别方法，包括利用上述基于多幅图像获取图像描述信息的方法，将待识别图像与训练图像共同作为所述多幅图像，计算所述待识别图像的图像描述信息；基于所述待识别图像的图像描述信息，利用基于上述分类器训练方法训练的分类器，对所述待识别图像进行识别分类。根据本发明实施例的另ー个方面，提供一种基于多幅图像获取图像描述信息的装置，包括图像分割単元，被配置成分割所述多幅图像，获得所述多幅图像的子图像；因子获取单元，被配置成基于所述子图像相互之间的特征相似性，获得所述子图像的相似度因子；信息获取单元，被配置成基于所述子图像的相似度因子计算所述子图像所对应的图像的描述信息。根据本发明实施例的另ー个方面，提供ー种图像识别装置，包括如上所述的图像描述信息获取装置，用于获取待识别图像的图像描述信息；分类器，被配置为基于所述待识别图像的图像描述信息，对所述待识别图像进行识别分类。另外，根据本发明的另一方面，还提供了ー种存储介质。所述存储介质包括机器可读的程序代码，当在信息处理设备上执行所述程序代码时，所述程序代码使得所述信息处理设备执行根据本发明的上述基于多幅图像获取图像描述信息的方法。此外，根据本发明的再一方面，还提供了ー种程序产品。所述程序产品包括机器可执行的指令，当在信息处理设备上执行所述指令吋，所述指令使得所述信息处理设备执行根据本发明的上述基于多幅图像获取图像描述信息的方法。根据本发明实施例的上述ー种方法，通过计算每一幅图像中不同区域的子图像的相似度因子，标明了该图像中各区域的重要度，从而在获得图像的描述信息时，可以根据该图像的特征及其对应的相似度因子进行计算，从而使图像中重要度大的区域的特征占有较大的比重，而重要度小的区域的特征占有较小的比重，例如使图像中前景对象在最終的特征中占有较大的比重，而背景内容占有较小的比重，有效的减小了背景噪声的影响，获得了更准确的图像描述信息。在下面的说明书部分中给出本发明实施例的其他方面，其中，详细说明用于充分地公开本发明实施例的优选实施例，而不对其施加限定。

下面结合具体的实施例，并參照附图，对本发明实施例的上述和其它目的和优点做进ー步的描述。在附图中，相同的或对应的技术特征或部件将采用相同或对应的附图标记来表示。图I是示出作为本发明实施例提供一种基于多幅图像获取图像描述信息的方法的流程图；图2是示出作为本发明实施例提供的分割图像的方法流程图；图3是示出作为本发明实施例提供的ー种分割方式下获得的图像的示意图；图4是示出作为本发明实施例提供的另ー种分割方式下获得的图像的示意图；图5是示出作为本发明实施例提供的各子图像的相似度因子的获得方法流程图6是示出作为本发明实施例提供的ー种分割方式下获得的图像权值矩阵的示意图；图7是示出作为本发明实施例提供的另ー种分割方式下获得的图像权值矩阵的示意图；图8是示出作为本发明实施例提供基于子图像的相似度因子计算子图像所对应的图像的描述信息的方法流程图；图9是示出作为本发明实施例提供的两种分割方式下最终获得的图像权值矩阵的不意图；图10是示出作为本发明实施例提供的图像特征点的示意图；图11是示出作为本发明实施例提供的一种基于多幅图像获取图像描述信息的装置的不意图；图12是示出作为本发明实施例提供的ー种图像识别装置的结构示意图；图13是示出作为本发明的实施例中所采用的信息处理设备的个人计算机的示例性结构的框图。
具体实施例方式
下面參照附图来说明本发明的实施例。參见图1，本发明实施例提供的一种基于多幅图像获取图像描述信息的方法包括SlOl :分割多幅图像，获得多幅图像的子图像。本发明实施例中，该多幅图像可以是ー个训练图像集。在获取各图像的描述信息时，首先对该多幅图像进行分割获得多幅图像的子图像，该分割过程可以采用ー种分割方式对每幅图像进行一次分割，也可以采用多种不同的分割方式对每幅图像进行多次分割。具体分割时，可以采用网格划分的方法进行分割，将图像分割成NXM的矩形区域，或者是三角形或多边形网格，而且网格不要求是均匀的；此外，也可以采用各种现有的或者未来开发出的图像分割算法，按图像的内容和/或视觉特征和/或其他特征进行分割。其中，采用多种分割方式分割图像时，对同一图像的分割方式尽量不同，在对多幅图像的同一次分割中，不同图像尽量采用相同的分割方式。S102:基于子图像相互之间的特征相似性，获得子图像的相似度因子。在获得各图像的子图像后，可以对每个子图像提取特征，例如，顔色、形状和纹理特征，然后计算该多幅图像中各子图像的特征之间的相似性，获得各子图像的相似度因子，某一子图像与其它子图像的相似度越高，该子图像的相似度因子值也就越大。对于同一训练图像集中的各图像，相似度因子高的子图像更有可能是其图像中的关键区域，例如图像中的前景对象。其中，用于计算子图像相似度因子的方法有多种，例如采用排序(ranking)的方法对该多幅图像中的所有子图像进行处理，如man ifold ranking或者pagerank技术等，其中，manifold ranking技术可參见作者为Dengyong Zhou,Jason Weston,Arthur Gretton,
Ranking on Data Manifold，in Proceeding of the Advances in Neura丄Information Processing Systems 2003中的參考文献；pagerank技术可參见美国专利Method for node ranking in a linked database (公开号6，285，999,申请日2001 年9 月 4 日)，美国专利 Method for scoring documents in a linked database (公开号6，799，176,申请日2004 年 9 月 28 日)，美国专利 Method for node ranking in a linkeddatabase (公开号7, 058, 628,申请日2006 年 6 月 6 日)，及美国专利 Scoring documentsin a linked database (公开号7，269，587，申请日2007年9月11日)。文献的全部内容通过此处的引用而全部结合到本申请中。按照各子图像特征之间的相似性对各子图像进行排序，获得各子图像对应的排名(rank)值，将该rank值作为对应子图像的相似度因子。其中，根据对多幅图像的分割方式可以有不同的相似度因子计算方法，具体请參照后续实施例的描述。S103:基于子图像的相似度因子计算子图像所对应的图像的描述信息。在获得图像的描述信息时，即可对图像每ー个位置处的特征，按照该位置对应的相似度因子进行加权。各图像中不同位置对应的相似度因子与该图像的分割方式相关，对于采用ー种分割方式分割所述多幅图像的情形，各图像不同位置对应的相似度因子即为该位置所对应的子图像的相似度因子，对于采用多种分割方式分割所述多幅图像的情形，各图像不同位置对应的相似度因子可以根据该位置所对应的多个子图像的相似度因子获得。具体请參见后续实施例的描述。本发明实施例通过计算每一幅图像中不同区域的子图像的相似度因子，标明了该图像中各区域的重要度，从而在获得图像的描述信息时，可以根据该图像的特征及其对应的相似度因子(即重要度)进行计算，从而使图像中重要度大的区域的特征占有较大的比重，而重要度小的区域的特征占有较小的比重，例如使图像中前景对象在最終的特征中占有较大的比重，而背景内容占有较小的比重，有效的减小了背景噪声的影响，获得了更准确的图像描述信息。在本发明的另ー实施例中，以采用两种不同的分割方式分割多幅图像为例进行说明。如图2所示，该分割图像的过程可以包括以下步骤S201，将多幅图像中的每幅图像分割成2X2(或者其他数值)的矩形区域。如图3所示，以其中一幅图像A为例，分割后的图像包括子图像a、b、C、d。S202，将上述多幅图像中的每幅图像分割为3X3(或者其他数值)的矩形区域。如图4所示，仍以图像A为例，分割后的图像包括子图像e、f、g、h、i、j、k、I、m。以上两个步骤互不相干，其顺序可以根据需要调整，在其他实施例中，分割方式可以有更多种，此处不再一一赘述。以上述分割方式为例，各子图像的相似度因子可以通过以下方法获得，如图5所示，该方法可以包括S501，提取所有子图像的特征。该特征提取方法可以采用现有技术中的任何图像特征提取技木，此处不再赘述。本实施例中的所有子图像为上述多种分割方式下获得的所有子图像。S502，按照所有子图像特征之间的相似性，对所有子图像进行排序，获得各子图像的排名值。在本实施例中,采用manifold ranking方法进行排序,对多幅图像进行上述两次分割后共得到N个子图像，记为A1, ...，An。经特征提取后，每个子图像都生成一个特征向量，并将这些特征向量记为f1;... fN。首先初始化用向量R = Qr1, . . . , rN]表示各子图像的rank值,并初始化为I,其中rN表示第N个子图像的rank值(排名值)；计算任意两个特征向量も、fj之间的距离，记为Clijtl举例计算可以采用欧式距离等方法来完成；根据子图像特征向量之间的距离Clij，为每一个子图像确定其k近邻子图像。即与某个子图像距离最小的前k个子图像作为该子图像的k近邻子图像。其中，k为经验參数。计算相似度矩阵W(affinity matrix);相似度矩阵根据子图像特征向量之间的距离得到，其大小为NxN矩阵，矩阵的每一行、每一列都对应ー个子图像。Wu表示矩阵中第i行、第j列的元素，σ为经验參数，可取所有du的平均值，或者其他经验值。
iexp(-^/2cr2)如果/；(或/プ)属于/バ或/；)的k近邻
「1O矩阵W的归ー化。S = D_1/2WD_1/2，其中，D是ー个对角矩阵，对角线上元素的值等于W中对应行上元素的值的和；按照下式循环迭代，直到收敛R(t+1) = a * S * R(t) + (l_a) * I其中，a是
之间的ー个经验參数，一般取接近于I的值。R(t+1)和R(t)分别表示在第t+Ι和第t次迭代时子图像的rank值。S为上述对W进行归一化后得到的矩阵。获得的各子图像的排名值(Rank值)即可作为各子图像的相似度因子。在另ー实施例中，各子图像的相似度因子还可以通过其它方法获得，例如，仍以上述图3、4所示的两种分割方式为例，在获得两种分割方式下多幅图像的子图像后，提取各子图像的特征，然后对每ー种分割方式，基于该分割方式获得的所有子图像特征相互之间的相似性，获得各子图像的相似度因子。具体的，不是对两种分割方式下的所有子图像按照特征相似性进行排序，而是针对不同的分割方式，对每一分割方式下获得的所有子图像进行排序，也即进行两次排序，分别获得各子图像的相似度因子。对于更多种分割方式下，子图像相似度因子的获得方法也可以采用类似上述两种方式，分别是基于所有分割方式获得的所有子图像的特征相互之间的相似性，获得各子图像的相似度因子；或者，对每ー种分割方式，基于该分割方式获得的所有子图像的特征相互之间的相似性，获得各子图像的相似度因子。当然，在另ー实施例中，如果对上述多幅图像采用的是ー种分割方式，则只需对获得的所有子图像进行特征提取，然后根据子图像特征之间的相似性计算各子图像的相似度因子即可。在获得各子图像的相似度因子后，在本发明实施例中，如图8所示，基于子图像的相似度因子计算子图像所对应的图像的描述信息，可以包括S801，根据各子图像的相似度因子，获得图像的权值矩阵。在获得各子图像的相似度因子之后，根据各子图像在图像中的位置，即可获得用于表征图像各区域重要度的该图像的权值矩阵。若采用多种分割方式对多幅图像进行分割，则不同分割方式下可获得对应的权值矩阵，如图6、7所示，其中图6所示的权值矩阵对应于该图像在如图3所示的分割方式下获得的各子图像的相似度因子，图7所示的权值矩阵对应于同一图像在如图4所示的分割方式下获得的各子图像的相似度因子。则该图像最終的权值矩阵可以基于图6、7所示的权值矩阵获得，具体的可以采用两权值矩阵叠加的方式获得，该叠加可以是图6、7中重叠区域的相似度因子的相加，或相乘，或其它任何体现叠加效果的数学变换，例如最終该图像权值矩阵如图9所示，为对图6、7所示的权值矩阵的叠加，也即对图6、7中重叠区域的相似度因子的相加，该图9所示的权值矩阵即表明了该图像不同区域的重要性。若采用ー种分割方式对多幅图像进行分割，如只采用图3所示的分割方式进行分害I]，则根据各子图像在图像中的位置获得的图6所示的权值矩阵即为该图像最終的权值矩阵。在获得图像的权值矩阵后，后续即可利用该图像的权值矩阵对图像中的特征加权，形成图像的描述信息。
S802，提取图像的特征。该特征的提取可以采用传统的方法，例如顔色直方图、边缘方向直方图、局部特征等。该步骤802与步骤801可同时进行或根据需要调整顺序，此处不作限定。S803，根据图像的权值矩阵，确定提取的图像特征所处的位置所对应的相似度因子。在获得图像的权值矩阵后，即获得该图像不同位置处所对应的相似度因子，也即权值，进而即可根据提取的图像特征所在的位置，确定该位置处的相似度因子。以图9所示的权值矩阵为例，提取的图像特征所对应的相似度因子即为该特征在图9中的位置所对应的权值。S804，根据该位置所对应的相似度因子，对提取的特征进行加权，以获得图像的描述信息。以边缘方向直方图为例来说明，假设要生成的边缘方向直方图包含180个bin，即每个bin对应于O度到180度边缘方向区间中的I度，将该直方图记为H。如图10中的4个特征点a、b、c、d。假设这四个点对应的边缘方向分别为30度、45度、120度、30度。计算边缘方向直方图时，需要遍历图像中的每个特征点，并统计在各个边缘方向上的特征点的个数。以图10中的4个特征点为例当遇到第一个特征点a时，该特征点的边缘方向为30度，因此，需要在与30度对应的直方图bin上加上该特征点对应的权值O. 4，得到H(30) = O. 4 ；同上述过程类似，对于特征点b和C，需要在与45度和120对应的直方图bin上加上b和c点对应的权值，得到H(45) = O. 6，H(120) = O. 4 ；当遇到第4个特征点d时，该特征点的边缘方向为30度，因此，需要在与30度对应的直方图bin上加上该特征点对应的权值O. 4。在之前的过程中，已经得到H(30) = O. 4，所以，统计特征点d后，新的值为H(30) = O. 4+0. 4 = 0.8。H (30) = O. 4 a 点H (45) = O. 6 b 点
H (120) =0.4 c 点H (30) = O. 4+0. 4 = O. 8 d 点通过图像特征对应位置处相似度因子的获得，及根据相似度因子对特征的加权，使前景对象在最終的特征中占有较大的比重，而背景内容占有较小的比重，达到了减小背景噪声的目的。在本发明的另ー实施例中，在对图像每ー个位置的特征按照该位置所对应的多个子图像的相似度因子而得到的权值加权之前，可以先对不同分割方式下获得的子图像的相似度因子进行归一化，然后再对图像每ー个位置的特征按照该位置所对应的多个子图像的归ー化后的相似度因子而得到的权值加权。基于上述获得图像描述信息的方法，本发明实施例还提供一种分类器训练方法，该方法首先将训练图像集中的训练图像作为上述实施例中的多幅图像，然后利用上述方法获得训练图像的图像描述信息，然后基于该训练图像的图像描述信息训练分类器。·基于上述图像描述信息的方法，本发明实施例还提供ー种图像识别方法，该方法首先将待识别图像和训练图像集中的训练图像共同作为上述实施例中的多幅图像，然后利用上述实施例的方法获得待识别图像的图像描述信息，基于该待识别图像的图像描述信息，利用上述实施例提供的分类器对该待识别图像进行识别分类。本发明实施例还提供了一种基于多幅图像的获取图像描述信息的装置，如图11所示，该装置可以包括图像分割単元1101，被配置成分割多幅图像，获得该多幅图像的子图像；因子获取单元1102，被配置成基于子图像相互之间的特征相似性，获得子图像的相似度因子；信息获取单元1103，被配置成基于子图像的相似度因子计算子图像所对应的图像的描述信息。信息获取单元具体可以被配置成对图像每ー个位置的特征按照所对应的相似度因子加权。图像分割単元1101对该多幅图像进行分割获得多幅图像的子图像，该分割过程可以采用ー种分割方式对每幅图像进行一次分割，也可以采用多种不同的分割方式对每幅图像进行多次分割，在获得各图像的子图像后，因子获取单元1102对每个子图像提取特征，然后计算该多幅图像中各子图像的特征之间的相似性，获得各子图像的相似度因子，信息获取单元1103，即可对图像每ー个位置处的特征，按照该位置对应的相似度因子进行加权，计算子图像所对应的图像的描述信息。本发明实施例通过上述単元计算每一幅图像中不同区域的子图像的相似度因子，标明了该图像中各区域的重要度，从而在获得图像的描述信息时，可以根据该图像的特征及其对应的相似度因子进行计算，从而使图像中重要度大的区域的特征占有较大的比重，而重要度小的区域的特征占有较小的比重，例如使图像中前景对象在最終的特征中占有较大的比重，而背景内容占有较小的比重，有效的减小了背景噪声的影响，获得了更准确的图像描述信息。在本发明的另ー实施例中，图像分割単元，被进ー步配置成按照多种不同的分割方式分割每一幅图像；因子获取单元，被进ー步配置成对每ー种分割方式，基于该分割方式获得的所有子图像相互之间的特征相似性，获得各子图像的相似度因子，具体的可以采用ranking的方法,对子图像进行排序,获得各子图像的rank值；信息获取单元,被进ー步配置成对图像每ー个位置的特征按照基于所述位置所对应的多个子图像的相似度因子得到的权值加权。在本发明的另ー实施例中，因子获取单元，还可以被进ー步配置成基于所有分割方式获得的所有子图像相互之间的特征相似性，获得各子图像的相似度因子。在本发明的另ー实施例中，信息获取单元，还可以被进ー步配置成对图像每ー个位置的特征按照所述位置所对应的子图像的相似度因子加权。在本发明的另ー实施例中，该装置还可以包括归ー化単元，被配置成在所述对图像每ー个位置的特征按照所述位置所对应的多个子图像的相似度因子而得到的权值加权之前，对不同分割方式下获得的子图像的相似度因子进行归一化，然后再由所述信息获取単元对图像每ー个位置的特征按照所述位置所对应的多个子图像的归ー化后的相似度因子而得到的权值加权。
在本发明的另ー实施例中，如图12所示，为ー种图像识别装置，该装置可以包括图像描述信息获取装置1201，用于获取待识别图像的图像描述信息。分类器1202，被配置为基于待识别图像的图像描述信息，对待识别图像进行识别分类。其中，图像描述信息获取装置1201与前述实施例中的基于多幅图像的获取图像描述信息的装置类似，此处不再赘述，将待识别图像作为上述多幅图像中的其中一幅图像，该图像描述信息获取装置1201获取待识别图像的图像描述信息后，由分类器1202基于该待识别图像的图像描述信息，对待识别图像进行识别分类，其中，该分类器1202采用前述实施例中的分类器训练方法进行训练。另外，还应该指出的是，上述系列处理和装置也可以通过软件和/或固件实现。在通过软件和/或固件实现的情况下，从存储介质或网络向具有专用硬件结构的计算机，例如图13所示的通用个人计算机1300安装构成该软件的程序，该计算机在安装有各种程序时，能够执行各种功能等等。在图13中，中央处理单元(CPU) 1301根据只读存储器(ROM) 1302中存储的程序或从存储部分1308加载到随机存取存储器(RAM) 1303的程序执行各种处理。在RAM 1303中，也根据需要存储当CPU 1301执行各种处理等等时所需的数据。CPU 130UR0M 1302和RAM 1303经由总线1304彼此连接。输入/输出接ロ 1305也连接到总线1304。下述部件连接到输入/输出接ロ 1305 :输入部分1306，包括键盘、鼠标等等；输出部分1307，包括显示器，比如阴极射线管(CRT)、液晶显示器(IXD)等等，和扬声器等等；存储部分1308，包括硬盘等等；和通信部分1309，包括网络接ロ卡比如LAN卡、调制解调器等等。通信部分1309经由网络比如因特网执行通信处理。根据需要，驱动器1310也连接到输入/输出接ロ 1305。可拆卸介质1311比如磁盘、光盘、磁光盘、半导体存储器等等根据需要被安装在驱动器1310上，使得从中读出的计算机程序根据需要被安装到存储部分1308中。在通过软件实现上述系列处理的情况下，从网络比如因特网或存储介质比如可拆卸介质1311安装构成软件的程序。
本领域的技术人员应当理解，这种存储介质不局限于图13所示的其中存储有程序、与设备相分离地分发以向用户提供程序的可拆卸介质1311。可拆卸介质1311的例子包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存储器(⑶-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)(注册商标))和半导体存储器。或者，存储介质可以是ROM 1302、存储部分1308中包含的硬盘等等，其中存有程序，并且与包含它们的设备一起被分发给用户。还需要指出的是，执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行，但是并不需要一定按照时间顺序执行。某些步骤可以并行或彼此独立地执行。虽然已经详细说明了本发明及其优点，但是应当理解在不脱离由所附的权利要求所限定的本发明的精神和范围的情况下可以进行各种改变、替代和变换。而且，本发明实施例的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情
况下，由语句“包括ー个......”限定的要素，并不排除在包括所述要素的过程、方法、物品
或者设备中还存在另外的相同要素。关于包括以上实施例的实施方式，还公开下述附记附记I. 一种基于多幅图像获取图像描述信息的方法，包括分割所述多幅图像，获得所述多幅图像的子图像；基于所述子图像相互之间的特征相似性，获得所述子图像的相似度因子；基于所述子图像的相似度因子计算所述子图像所对应的图像的描述信息。附记2.根据附记I所述的方法，其中，基于所述子图像的相似度因子计算所述子图像所对应的图像的描述信息的处理包括对图像每ー个位置的特征按照所对应的相似度因子加权。附记3.根据附记2所述的方法，对图像每ー个位置的特征按照所对应的相似度因子加权的处理包括对图像每ー个位置的特征按照所述位置所对应的子图像的相似度因子加权。附记4.根据附记2所述的方法，其中，所述分割所述多幅图像包括按照多种不同的分割方式分割每一幅图像；其中，对图像每ー个位置的特征按照所对应的相似度因子加权的处理包括对图像每ー个位置的特征按照基于所述位置所对应的多个子图像的相似度因子得到的权值加权。附记5.根据附记4所述的方法，其中，获得所述子图像的相似度因子的处理包括对每ー种分割方式，基于该分割方式获得的所有子图像相互之间的特征相似性，获得各子图像的相似度因子。附记6.根据附记4所述的方法，其中，获得所述子图像的相似度因子的处理包括基于所有分割方式获得的所有子图像相互之间的特征相似性，获得各子图像的相似度因子。
附记7.根据附记4所述的方法，其中，在对图像每ー个位置的特征按照基于所述位置所对应的多个子图像的相似度因子得到的权值加权之前，还包括对不同分割方式下获得的子图像的相似度因子进行归一化。附记8.根据附记I所述的方法，其中，获得所述子图像的相似度因子的处理包括采用排序的方法，基于所述子图像相互之间的特征相似性，对所述子图像进行排序，获得各子图像的排名值，将获得的各子图像的排名值作为各子图像的相似度因子。附记9. 一种分类器训练方法，包括利用如附记1-8所述的方法，将训练图像作为所述多幅图像，计算所述训练图像的图像描述信息；基于所述训练图像的图像描述信息训练分类器。附记10. —种图像识别方法，包括利用如附记1-8所述的方法，将待识别图像与训练图像共同作为所述多幅图像，计算所述待识别图像的图像描述信息；基于所述待识别图像的图像描述信息，利用基于附记9的方法训练的分类器，对所述待识别图像进行识别分类。附记11. 一种基于多幅图像获取图像描述信息的装置，包括图像分割単元，被配置成分割所述多幅图像，获得所述多幅图像的子图像；因子获取单元，被配置成基于所述子图像相互之间的特征相似性，获得所述子图像的相似度因子；信息获取单元，被配置成基于所述子图像的相似度因子计算所述子图像所对应的图像的描述信息。附记12.根据附记11所述的装置，其中，所述信息获取单元被进ー步配置成对图像每ー个位置的特征按照所对应的相似度因子加权。附记13.根据附记12所述的装置，其中，所述信息获取单元被进ー步配置成对图像每ー个位置的特征按照所述位置所对应的子图像的相似度因子加权。附记14.根据附记12所述的装置，其中，所述图像分割単元被进ー步配置成按照多种不同的分割方式分割每一幅图像；所述信息获取单元被进ー步配置成对图像每ー个位置的特征按照基于所述位置所对应的多个子图像的相似度因子得到的权值加权。附记15.根据附记14所述的装置，其中，所述因子获取单元被进ー步配置成对每ー种分割方式，基于该分割方式获得的所有子图像相互之间的特征相似性，获得各子图像的相似度因子。附记16.根据附记14所述的装置，其中，所述因子获取单元被进ー步配置成基于所有分割方式获得的所有子图像相互之间的特征相似性，获得各子图像的相似度因子。附记17.根据附记14所述的装置，还包括
归ー化単元，被配置成在所述对图像每ー个位置的特征按照所述位置所对应的多个子图像的相似度因子而得到的权值加权之前，对不同分割方式下获得的子图像的相似度因子进行归一化。附记18.根据附记11所述的装置，其中，所述因子获取单元被进ー步配置成采用排序的方法，基于所述子图像相互之间的特征相似性，对所述子图像进行排序，获得各子图像的排名值，将获得的各子图像的排名值作为各子图像的相似度因子。附记19. ー种图像识别装置，包括如附记11-18所述的图像描述信息获取装置，用于获取待识别图像的图像描述信息；分类器，被配置为基于所述待识别图像的图像描述信息，对所述待识别图像进行识别分类。
权利要求
1.一种基于多幅图像获取图像描述信息的方法，包括分割所述多幅图像，获得所述多幅图像的子图像；基于所述子图像相互之间的特征相似性，获得所述子图像的相似度因子；基于所述子图像的相似度因子计算所述子图像所对应的图像的描述信息。
2.根据权利要求I所述的方法，其中，基于所述子图像的相似度因子计算所述子图像所对应的图像的描述信息的处理包括对图像每一个位置的特征按照所对应的相似度因子加权。
3.根据权利要求2所述的方法，对图像每一个位置的特征按照所对应的相似度因子加权的处理包括对图像每一个位置的特征按照所述位置所对应的子图像的相似度因子加权。
4.根据权利要求2所述的方法，其中，所述分割所述多幅图像包括按照多种不同的分割方式分割每一幅图像；其中，对图像每一个位置的特征按照所对应的相似度因子加权的处理包括对图像每一个位置的特征按照基于所述位置所对应的多个子图像的相似度因子得到的权值加权。
5.根据权利要求4所述的方法，其中，获得所述子图像的相似度因子的处理包括对每一种分割方式，基于该分割方式获得的所有子图像相互之间的特征相似性，获得各子图像的相似度因子。
6.根据权利要求4所述的方法，其中，获得所述子图像的相似度因子的处理包括基于所有分割方式获得的所有子图像相互之间的特征相似性，获得各子图像的相似度因子。
7.根据权利要求4所述的方法，其中，在对图像每一个位置的特征按照基于所述位置所对应的多个子图像的相似度因子得到的权值加权之前，还包括对不同分割方式下获得的子图像的相似度因子进行归一化。
8.根据权利要求I所述的方法，其中，获得所述子图像的相似度因子的处理包括采用排序的方法，基于所述子图像相互之间的特征相似性，对所述子图像进行排序，获得各子图像的排名值，将获得的各子图像的排名值作为各子图像的相似度因子。
9.一种分类器训练方法，包括利用如权利要求1-8所述的方法，将训练图像作为所述多幅图像，计算所述训练图像的图像描述信息；基于所述训练图像的图像描述信息训练分类器。
10.一种基于多幅图像获取图像描述信息的装置，包括图像分割单元，被配置成分割所述多幅图像，获得所述多幅图像的子图像；因子获取单元，被配置成基于所述子图像相互之间的特征相似性，获得所述子图像的相似度因子；信息获取单元，被配置成基于所述子图像的相似度因子计算所述子图像所对应的图像的描述信息。
全文摘要
本发明实施例公开了一种获取图像描述信息的方法及装置以及分类器训练方法。获取图像描述信息的方法包括分割所述多幅图像，获得所述多幅图像的子图像；基于所述子图像相互之间的特征相似性，获得所述子图像的相似度因子；基于所述子图像的相似度因子计算所述子图像所对应的图像的描述信息。本发明实施例在获得图像的描述信息时，可以根据该图像的特征及其对应的相似度因子进行计算，从而使图像中重要度大的区域的特征占有较大的比重，而重要度小的区域的特征占有较小的比重，例如使图像中前景对象在最终的特征中占有较大的比重，而背景内容占有较小的比重，有效的减小了背景噪声的影响，获得了更准确的图像描述信息。
文档编号G06K9/64GK102855497SQ20111018893
公开日2013年1月2日申请日期2011年6月27日优先权日2011年6月27日
发明者刘汝杰, 中村秋吾, 上原祐介申请人:富士通株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘汝杰;中村秋吾;上原祐介
技术所有人：富士通株式会社
我是此专利的发明人

上一篇：棒材进行计数的方法及装置的制作方法
上一篇：输入感测电路和包括该输入感测电路的触摸面板的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。