特征提取方法及装置的制造方法_3

文档序号:9888699阅读:来源:国知局
征,提 高了在模式识别中的检测率和准确度的效果。
[0123] 图5是根据另一示例性实施例示出的一种特征提取装置的框图,如图5所示,该特 征提取装置包括但不限于:
[0124] 处理模块410,被配置为将图像进行归一化处理,得到预定尺寸大小的图像。
[0125] 在模式识别中,一般会涉及到对多个图像的特征提取。
[0126] 在对图像进行特征提取之前,处理模块410对图像进行归一化处理,将不同大小的 图像处理为预定尺寸大小的图像,以便于对图像的统一处理。
[0127] 划分模块420,被配置为将图像划分为若干个块,每个块包括若干个单元格。
[0128]可选的,划分模块420对归一化处理后的图像进行划分包括:将图像划分为若干个 块,再将每个块划分为若干个单元格。
[0129]可选的,划分模块420对归一化处理后的图像进行划分包括:将图像划分为若干个 单元格,再将相连的单元格组成一个块,每个块中包含有若干个单元格,比如:将两两相邻 的四个呈田字形排列的单元格组成一个块。
[0130]本实施例中,划分模块420在图像划分过程中,对划分块和划分单元格的顺序不作 具体限定,可以先划分块再划分单元格,也可以先划分单元格再组合成块。
[0131]本实施例中,划分模块420对图像划分的块与块之间是否存在重叠区域不作具体 限定,块与块之间可以存在重叠区域也可以不存在重叠区域。
[0132] 转化模块440,被配置为对每个单元格进行离散余弦变换DCT。
[0133] 对于图像中的每个单元格而言,假定每个单元格的像素组成的矩阵A的大小为Μ像 素*Ν像素,则矩阵Α的DCT(Discrete Cosine Transform,离散余弦变换)变换系数如下公 式:
[0134]
[0135] .BP.q 为矩阵 A 的 DCT 系数,ρ = 0,1,2···,Μ-1,πι = 0,1,2···,Μ-?4 = 0,1,2···,Ν-1,η = 0,1,2···,Ν-1。
[0136] 转化模块440将图像中的每个单元格都进行DCT变换,从而将图像从空间域转换为 频率域。
[0137] 可选的,转化模块440,被配置为对每个单元格进行DFT变换(Discrete Fourier Transform,离散傅里叶变换)。
[0138] 对于图像中的每个单元格而言,假定每个单元格的大小为Μ像素*N像素,组成的函 数为f(x,y),则函数f(x,y)的DFT系数F(u,v)如下公式:
[0139]
[0140]其中,u = 0,l,2...,M-l,v = 0,l,2.",N-l,(x,y)为像素的位置。
[0141]转化模块440将图像中的每个单元格都进行DFT变换,从而将图像从空间域转换为 频率域。
[0142] 提取模块460,被配置为提取图像在频率域中的方向梯度直方图H0G特征。
[0143] 本实施例中,提取模块460可以包括如下子模块:
[0144] 计算子模块461,被配置为计算频率域中每个单元格的梯度大小和梯度方向,得 到每个单元格的描述子。
[0145] 计算子模块461利用梯度算子计算经过DCT变换或DFT变换后的每个单元格中的每 个像素的横向梯度和纵向梯度。
[0146] 本实施例中对梯度算子的选择不作具体限定。
[0147] 假定像素的横向梯度为H(X,y),纵向梯度为V(X,y),则每个像素的梯度方向和梯 度幅值的计算分别如下公式(1)和公式(2):
[0148] 0(x,y)=tan_1[V(x,y)/H(x,y)] (1)
[0149] m(x,y) = [H(x,y)2+V(x,y)2]1/2 (2)
[0150] 其中,9(x,y)为像素(x,y)的梯度方向,m(x,y)为像素(x,y)的梯度大小。
[0151] 梯度方向0(X,y)的取值范围为-90度到90度,将梯度方向0(X,y)平均分成z份,对 每个单元格中的所有像素按照权重m(x,y)在梯度方向划分的每一份进行统计,最后每个单 元格得到一个z维的向量,也即得到每个单元格对应的描述子。
[0152] 本实施例中,对将梯度方向划分为多少份不作具体限定。
[0153] 第一统计子模块462,被配置为统计频率域中每个块内的各个描述子,得到每个块 的H0G特征。
[0154] 第一统计子模块462对每个块内包含的各个单元格中计算得到的描述子进行统 计,得到每个块的H0G特征。
[0155] 在对各个单元格中计算得到的描述子进行统计时,第一统计子模块462可以将各 个单元格对应的描述子进行串联,使得每个块的H0G特征是一个向量,该向量的维数是该块 内包含单元格对应的描述子维数的k倍。
[0156]第二统计子模块463,被配置为统计图像在频率域中各个块的H0G特征,得到图像 的H0G特征。
[0157]第二统计子模块463统计各个块的H0G特征,得到图像的H0G特征。
[0158]可选的,第二统计子模块463,被配置为将图像中各个块的H0G特征串联成一个矩 阵,得到图像的H0G特征,矩阵的每一列为一个块的H0G特征。
[0159] 综上所述,本公开实施例中提供的特征提取装置,通过将图像划分为若干个块,每 个块包括若干个单元格;对每个单元格进行DCT变换或DFT变换;计算频率域中每个单元格 的梯度大小和梯度方向,得到每个单元格的描述子;统计频率域中每个块内的各个描述子, 得到每个块的H0G特征;统计图像在频率域中各个块的H0G特征,得到图像的H0G特征;解决 了在H0G特征提取过程中是针对图像的空间域直接计算得到,导致在模式识别中的检测率 和准确度较低的问题;达到了在频率域提取图像的H0G特征,提高了在模式识别中的检测率 和准确度的效果。
[0160] 在基于图5所示的可选实施例中,第二统计子模块463可以包括如下子模块,如图6 所示:
[0161]调整子模块610,被配置为将图像中每个块的HOG特征由初始的L* 1维向量调整为 M*N的矩阵,每个块包括M*N个像素,L=M*N。
[0162 ]每个块的H0G特征是将各个单元格对应的描述子进行串联得到的L* 1维向量,调整 子模块610将L* 1维向量调整为M*N的矩阵,也即,将各个块中的L* 1维向量按照包含的单元 格调整为对应的矩阵,该对应的矩阵的每一列为一个单元格的描述子;再将每个单元格的 描述子按照对应的像素进行调整,调整后得到的矩阵的每一列为对应块中对应列的像素对 应的H0G特征。
[0163] 特征提取子模块620,被配置为根据每个块的调整后的H0G特征和每个块在图像中 的对应位置,得到图像的H0G特征。
[0164] 特征提取子模块620根据每个块的调整后的H0G特征和每个块在图像中的对应位 置,得到图像中对应像素位置的H0G特征。
[0165] 综上所述,本实施例提供的特征提取装置,通过将图像中每个块的H0G特征由初始 的L* 1维向量调整为M*N的矩阵,每个块包括M*N个像素,L=M*N;根据每个块的调整后的H0G 特征和每个块在图像中的对应位置,得到图像的HOG特征;使得提取后的图像的HOG特征与 对应于图像中每个块的对应位置,可以更好地突出图像中各个块的特征。
[0166] 关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法 的实施例中进行了详细描述,此处将不做详细阐述说明。
[0167] 本公开一示例性实施例提供了一种特征提取装置,能够实现本公开提供的特征提 取方法,该特征提取装置包括:处理器、用于存储处理器可执行指令的存储器;
[0168] 其中,处理器被配置为:
[0169] 将图像划分为若干个块,每个块包括若干个单元格;
[0170] 将每个单元格从空间域转化为频率域;
[0171] 提取图像在频率域中的方向梯度直方图H0G特征。
[0172] 图7是根据一示例性实施例示出的一种特征提取装置的框图。例如,装置700可以 是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身 设备,个人数字助理等。
[0173] 参照图7,装置700可以包括以下一个或多个组件:处理组件702,存储器704,电源 组件706,多媒体组件708,音频组件710,输入/输出(1/0)接口 712,传感器组件714,以及通 信组件716。
[0174] 处理组件702通常控制装置700的整体操作,诸如与显示,电话呼叫,数据通信,相 机操作和记录操作相关联的操作。处理组件702可以包括一个或多个处理器718来执行指 令,以完成上述的方法的全部或部分步骤。此外,处理组件702可以包括一个或多个模块,便 于处理组件702和其他组件之间的交互。例如,处理组件702可以包括多媒体模块,以方便多 媒体组件708和处理组件702之间的交互。
[0175] 存储器704被配置为存储各种类型的数据以支持在装置700的操作。这些数据的示 例包括用于在装置700上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消 息,图片,视频等。存储器704可以由任何类型的易失性或非易失
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1