基于随机森林分类器的分类方法及装置的制造方法_3

文档序号:9844416阅读:来源:国知局
个维度,再计算出样本图像在该分裂维度上的特征值。例如,该步骤202可以包括以下步骤I至2:
[0101]1、根据该随机森林分类器中第一节点的分裂维度索引,确定该分裂维度索引对应的区域位置索弓I和偏置位置索弓I。
[0102]其中,该区域位置索引用于确定该第一节点的分裂维度对应的提取区域的位置,该偏置位置索引用于确定该分裂维度对应的细胞单元在该提取区域中的位置,每个提取区域包括多个细胞单元。
[0103]该测试装置可以确定每个提取区域中的细胞单元数目,以及每个细胞单元的维度数目,计算细胞单元数目与每个细胞单元的维度数目的乘积,即为每个提取区域的总维度数目。
[0104]之后,该测试装置可以对该分裂维度索引与提取区域的总维度数目之间的商值进行取整运算,得到整数商值,将该整数商值加I后得到的数值作为该分裂维度索引对应的区域位置索引,从而确定该样本图像的提取区域。并计算该总维度数目与该整数商值之间的乘积,将该分裂维度索引与该乘积之间的差值作为该分裂维度索引对应的偏置位置索引。
[0105]举例来说,采用预设特征提取算法时,每个细胞单元的特征的维度数目为10,相邻的2*2个细胞单元构成一个提取区域,即提取区域中的细胞单元数目为4,提取区域的维度总数目为40,而且提取区域的步长为2,则如果该第一节点的分裂维度索引为1000,表示分裂维度为第1001个维度,通过计算可以确定区域位置索引为26,偏置位置索引为0,表示该分裂维度对应于第26个提取区域中提取出的第I个特征值。
[0106]2、根据该区域位置索引,对样本图像中与该区域位置索引对应的提取区域进行特征提取,得到特征向量,并从该特征向量中提取该偏置位置索引对应的特征值。
[0107]该测试装置可以根据该区域位置索引,确定该样本图像中与该区域位置索引对应的提取区域,并采用预设特征提取算法,对该提取区域进行特征提取,得到特征向量,即采用预设特征提取算法,对该提取区域中的每个细胞单元分别进行特征提取,得到每个细胞单元的特征向量,按照每个细胞单元的位置顺序,将每个细胞单元的特征向量进行组合,得到该提取区域的特征向量。
[0108]则该测试装置即可根据该偏置位置索引,从该特征向量中提取该偏置位置索引对应的特征值,即为该样本图像在该分裂维度上的特征值。
[0109]其中,该测试装置可以确定预设对应关系,该预设对应关系包括每个提取区域对应的区域位置索引,根据预设对应关系即可确定该样本图像中与该区域位置索引对应的提取区域。另外,该预设特征提取算法为HOG特征提取算法,或者其他类型的特征提取算法,该预设特征提取算法与该随机森林分类器在训练过程中采用的特征提取算法相同。该预设对应关系可以根据该预设特征提取算法所确定的提取区域的尺寸确定,本实施例对此不做限定。
[0110]参见上述步骤I的举例,该测试装置可以对该样本图像中的第26个提取区域进行特征提取,得到一个4维的特征向量,并提取出该特征向量中的第I个特征值,即为该样本图像在第1001个维度上的特征值。
[0111]在步骤203中,根据该第一节点的分裂条件对该特征值进行判断,根据判断结果从该第一节点的分支节点中确定待遍历的第二节点。
[0112]本实施例中,每个节点的分裂条件用于对样本图像在该节点的分裂维度上的特征值进行判断,判断结果不同时,待遍历的下一节点也不同。
[0113]当计算得到该样本图像在该第一节点的分裂维度上的特征值时,该测试装置可以根据第一节点的分裂条件对该特征值进行判断,得到判断结果,并从该第一节点的分支节点中获取与该判断结果对应的节点,即为待遍历的第二节点。
[0114]例如,第一节点的分裂条件包括与该第一节点的多个分支节点对应的多个条件,当该特征值满足该分裂条件中的某一条件时,该特征值所满足的条件对应的分支节点即为待遍历的第二节点。
[0115]又如,该第一节点的分裂条件包括分裂函数,且根据该分裂函数进行计算得到的计算结果为O时对应的分支节点为节点A,计算结果为I时对应的分支节点为节点B,则当根据该分裂函数对该特征值进行计算得到的计算结果为I时,将节点B确定为待遍历的第二节点。
[0116]在步骤204中,继续执行步骤202至203,直至获取到该样本图像在每个决策树中的分类结果,根据样本图像在每个决策树中的分类结果确定该样本图像的分类结果。
[0117]确定第二节点后,该测试装置即可针对第二节点继续执行上述步骤202至203。
[0118]也即是,该测试装置根据该第二节点的分裂维度索引,对该样本图像进行特征提取,得到该样本图像在第二节点的分裂维度上的特征值,并根据第二节点的分裂条件对该特征值进行判断,根据判断结果从该第二节点的分支节点中确定待遍历的第三节点,以此类推,直至遍历到决策树的最后一层节点,即可将遍历到的最后一层节点的分类结果作为该样本图像在该决策树中的分类结果。
[0119]仅以随机森林分类器中的一个决策树为例,用于划分人脸图像的决策树可以如图3所示,影响分类结果的维度包括Π和f2。应用该决策树对样本图像进行分类时,首先将该样本图像输入至该决策树的节点I。
[0120]节点I的分裂维度为Π,节点I的分裂条件为:特征值是否符合预设条件I,如果符合则分裂至节点2,如果不符合则确定为非人脸。因此,计算该样本图像在维度fl上的特征值nl,判断nl是否符合预设条件I,如果nl符合预设条件I,则遍历至节点2。
[0121]节点2的分裂维度为f2,节点2的分裂条件为:特征值是否符合预设条件2,如果符合则确定为人脸,如果不符合则确定为非人脸。因此,计算该样本图像在维度f2上的特征值n2,判断n2是否符合预设条件2,如果n2符合预设条件2,则确定该样本图像是人脸图像。
[0122]由于该随机森林分类器包括多个决策树,该测试装置可以确定该样本图像在多个决策树中的分类结果,并将在多个决策树中出现最多的分类结果作为该样本图像的分类结果O
[0123]需要说明的是,本实施例仅是以待测试的一张样本图像为例进行说明,而在实际进行训练时,可以采用上述步骤对多张样本图像分别进行上述分类过程,得到每张样本图像的分类结果。而且针对多张样本图像,采用本实施例所采用的方法进行测试时,可以减小更多的计算量,保证该随机森林分类器的测试速度很快。
[0124]本实施例提供的方法,通过根据随机森林分类器中第一节点的分裂维度索引,对待测试的样本图像进行特征提取,得到该样本图像在该第一节点的分裂维度上的特征值,根据该第一节点的分裂条件对该特征值进行判断,从而确定待遍历的第二节点,以此类推,直至获取到该样本图像的分类结果,无需预先计算出样本图像在所有维度上的特征值,避免了进行不必要的计算,大大减小了计算量,提高了测试速度。
[ΟΙ25]由于SVM分类器(Support Vector Machine,支持向量机)的模型文件要保存所有的支持向量,因此会随着训练样本的增加而变大,而随机森林分类器与SVM分类器不同,随机森林分类器的模型文件的大小与训练样本的多少并无直接关系,而是更依赖于随机森林中每个决策树的结构,在保证很高识别率的同时,还可以更自由地控制模型文件大小以及增加训练集。
[0126]对HOG特征来说,如果进行特征提取时提取的角度区间较多,或者提取窗口较大,会导致提取到的特征维度较高,甚至能达到几千维。那么,在对分类器进行测试的过程中,如果只针对一张样本图像,算出该样本图像几千维的特征值,然后输入到分类器中,其测试速度还可以接受,但是如果测试的样本图像很多,就会导致计算量非常大,测试速度很慢。
[0127]而针对随机森林分类器来说,整个随机森林中的每个节点在进行分类时,只会用到一小部分特征,而不会用到所有的特征,即真正分类时用到的维度数目远小于总的维度数目,随机森林分类器具有特征选择性。因此,与其在进行分类之前计算出所有的特征值,还不如将特征提取融入到分类器中,在分类的过程中遇到当前节点时,实时计算出当前节点需要的特征值,这样就可以少算大部分维度上的特征值,节省计算时间,提高速度。
[0128]图4是根据一示例性实施例示出的一种基于随机森林分类器的分类装置的框图。参见图4,该装置包括获取模块401,特征提取模块402,分裂模块403和循环模块404。
[0129]获取模块401被配置为用于获取已训练的随机森林分类器中的多个决策树以及每个决策树中至少一层节点的分裂维度索引和分裂条件,该分裂维度索引用于唯一确定分裂维度,该分裂维度和该分裂条件用于从对应节点的分支节点中确定待遍历的下一节点;
[0130]特征提取模块402被配置为用于根据该随机森林分类器中第一节点的分裂维度索弓I,对待测试的样本图像进行特征提取,得到该样本图像在该第一节点的分裂维度上的特征值;
[0131]分裂模块403被配置为用于根据该第一节点的分裂条件对该特征值进行判断,根据判断结果从该第一节点的分支节点中确定待遍历的第二节点;
[0132]循环模块404被配置为用于根据当前所确定节点的分裂维度索引和分裂条件,继续提取该样本图像的特征值并确定待遍历的下一节点,直至获取到该样本图像的分类结果O
[0133]本实施例提供的装置,通过根据随机森林分类器中第一节点的分裂维度索引,对待测试的样本图像进行特征提取,得到该样本图像在该第一节点的分裂维度上的特征值,根据该第一节点的分裂条件对该特征值进行判断,从而确定待遍历的第二节点,以此类推,直至获取到该样本图像的分类结果,无需预先计算出样本图像在所有维度上的特征值,避免了进行不必要的计算,大大减小了计算量,提高了测试速度。
[0134]在另一实施例中,该获取模块401还被配置为用于获取已训练的随机森林分类器的模型文件,该模型文件中至少包括该多个决策树以及每个决策树中至少一层节点的分裂维度索引和分裂条件。
[0135]参见图5,在另一实施例中,该特征提取模块402包括:
[
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1