一种基于主线方向特征的深度信念网络图像分类方法

文档序号：8339998阅读：204来源：国知局

一种基于主线方向特征的深度信念网络图像分类方法
【技术领域】
[0001] 本发明属于图像处理技术领域，尤其是涉及一种基于主线方向特征的深度信念网络图像分类方法。
【背景技术】
[0002] 图像分类是图像处理的重要目的之一，很多场合需要通过图像分类来发现感兴趣的场景或目标是否出现。图像分类是根据图像具有的某种属性将其划分到预先设定的不同类别中。如何提高图像分类的准确性，最核心的问题是如何对图像进行有效的表达。常用的特征提取方法有SIFT、HOG、LBP和Gabor等，这些方法提取了图像某些特征，并应用于图像分类，得到了较好的分类效果。近年来，深度信念网络（Deep Belief Network，DBN)的提出在分类方面带来了很大的进步，已成功应用于遥感图像分类和垃圾邮件过滤等领域中，然而，进一步提升DBN模型的分类性能仍是一个难题。由于传统DBN的输入是将一个图像矩阵转化为一维向量，输入信息仅包含幅度信息，丢失过多的二维结构信息，从而使分类效果变差。本发明提取图像的多尺度主线方向（Multi-Scale Main Direction，MSMD)信息的方法，增加了空间特征信息，能够有效提高图像分类的正确率。

【发明内容】

[0003] 本发明的目的在于提出一种基于主线方向特征的深度信念网络图像分类方法，包括如下步骤：
[0004] 1)对训练样本进行主线方向信息特征提取；
[0005] 2)构造训练样本矩阵，将主线方向信息附加到训练样本矩阵中；
[0006] 3)将附加主线方向信息的训练样本矩阵输入DBN模块；
[0007] 4)通过无监督训练、有监督微调，对输入DBN模块的训练样本矩阵进行分类训练，当网络收敛后，用于图像分类。
[0008] 所述对训练样本进行主线方向信息特征提取方法，包括以下步骤：
[0009] 步骤1 :确定图像区域块的方向投影值；
[0010] 步骤2 :根据图像区域块在12个方向上的投影值，确定图像的线方向图和能量图；
[0011] 步骤3 :确定能量图的二值图；
[0012] 步骤4 :确定能量二值图的方向分离图EAb和EBb ;
[0013] 步骤5 :提取主线方向信息。
[0014] 所述确定图像区域块的方向投影值的步骤为：
[0015] 步骤1 :样本图像的大小是mXm，m为图像长和宽的像素点数值，像素点的横纵坐标为X、y，选取样本图像左上角的区域块，大小为dXd(d为奇数，3 < 9)，以1个像素为步长，向右或向下平移，得到（m-d+1) X (m-d+1)个区域块；再对区域块的像素值进行归一化处理；
[0016] 步骤2 :对于每一个区域块，将经过该区域块中心点的垂直方向的直线作为基准，垂直向上为正方向，以π/12的角度为间隔，逆时针旋转得到12条直线，每条直线与正方向的夹角分别为π /12, π /6,…，11 π /12, π，确定每一条直线所经过的区域块的像素值；
[0017] 步骤3 :每一个区域块以左上角为原点，水平向右为j轴正方向，垂直向下为i轴正方向，i、j为区域块内对应的横纵坐标；由于区域块的大小是dXd，i、j的取值范围都为 [l，d]，对应关系为：
[0018]
【主权项】
1. 一种基于主线方向特征的深度信念网络图像分类方法，其特征在于，包括如下步骤： 1) 对训练样本进行主线方向信息特征提取； 2) 构造训练样本矩阵，将主线方向信息附加到训练样本矩阵中； 3) 将附加主线方向信息的训练样本矩阵输入DBN模块； 4) 通过无监督训练、有监督微调，对输入DBN模块的训练样本矩阵进行分类训练，当网络收敛后，用于图像分类。
2. 根据权利要求1所述一种基于主线方向特征的深度信念网络图像分类方法，其特征在于，所述对训练样本进行主线方向信息特征提取方法，包括以下步骤：步骤1 :确定图像区域块的方向投影值；步骤2 :根据图像区域块在12个方向上的投影值，确定图像的线方向图和能量图；步骤3 :确定能量图的二值图；步骤4 :确定能量二值图的方向分离图EAb和E Bb; 步骤5 :提取主线方向彳目息。
3. 根据权利要求2所述对训练样本进行主线方向信息特征提取方法，其特征在于，所述确定图像区域块的方向投影值的步骤为：步骤1 :样本图像的大小是mXm，m为图像长和宽的像素点数值，像素点的横纵坐标为 X、y，选取样本图像左上角的区域块，大小为dXd(d为奇数，3 < 9)，以1个像素为步长，向右或向下平移，得到（m-d+1) X (m-d+1)个区域块；再对区域块的像素值进行归一化处理；步骤2 :对于每一个区域块，将经过该区域块中心点的垂直方向的直线作为基准，垂直向上为正方向，以π/12的角度为间隔，逆时针旋转得到12条直线，每条直线与正方向的夹角分别为：π /12, π /6,…，11 π /12, π，确定每一条直线所经过的区域块的像素值；步骤3 :每一个区域块以左上角为原点，水平向右为j轴正方向，垂直向下为i轴正方向，i、j为区域块内对应的横纵坐标；由于区域块的大小是dXd，i、j的取值范围都为 [l，d]，对应关系为：
公式（1)中，Θ为直线与正方向的夹角，取值范围为n /12, π /6,…，11 π /12, π，共 12个值；d为所选区域块的尺度大小；N为自然数集；若由式（1)所得的j〈l，则取j = 1 ;若得j>d，则取j = d ; 步骤4 :将步骤3得到的d个像素值累加求和，作为该区域块在这个方向上的投影值 (Re);改变角度θ (θ = π/12, 31/6,…π)得到该区域块在12个方向上的投影值；向右或向下移动区域块，就能够得到（m-d+1) X (m-d+1)个区域块在12个方向上的投影值。
4. 根据权利要求2所述对训练样本进行主线方向信息特征提取方法，其特征在于，所述确定线方向图和能量图的步骤为：步骤1 :将尺度为d的区域块在12个方向上的投影值（R0，θ = π/12, π/6,…π )放在一个1行12列的矩阵里，矩阵记为Rixn; 步骤2:选取矩阵中的最小值，将该最小值记为r，并记录对应的列号（η); 步骤3 :确定所选一个区域块的线方向图和能量图，由公式（2)和公式（3)确定：
公式（2)、（3)中，D(x，y)为线方向图，E(x，y)为能量图，x、y分别是尺度为d的一个区域块的中心点在原图像中对应的横、纵坐标；步骤4 :向右或向下移动区域块，重复公式⑵~（3)，就能够得到不同位置点（x，y)对应的线方向值（D(x，y))和能量值（E(x，y))，进而得到整个线方向图（D)和能量图（E)。
5. 根据权利要求2所述对训练样本进行主线方向信息特征提取方法，其特征在于，所述能量图的二值图的确定方法为：将能量图中的所有能量值从大到小排序，选取一个能量值M作为门限值对能量图进行二值化，M的取值通过方差分类法试验确定，规则如下：
公式（4)中，Eb为能量图的二值图，M为门限值。
6. 根据权利要求2所述对训练样本进行主线方向信息特征提取方法，其特征在于，所述能量图的二值图的方向分离图EAb和E Bb确定规则为：
以3X3区域为最小单位，删除EAb、EBb中连通区域的面积（Si，i = 1···η)小于P(P为常数，1〈P〈9)的线条，将去掉杂线后的方向分离图（LA、LB)合并为主线能量图，即 la^\〇 Si~P (7) A [I Si > P 同理，得到Lb; Pl= LaU Lb (8) 公式（8)中，匕为主线能量图。
7. 根据权利要求2所述对训练样本进行主线方向信息特征提取方法，其特征在于，所述主线方向信息的提取方法为记录主线能量图（PJ像素值为1的位置，并保留线方向图 (D)的此位置，其余位置置于0,即
公式（9)中，Ld为主线方向特征图，即为主线方向信息；通过改变尺度d的大小，就能够得到不同尺度的主线方向信息。
【专利摘要】本发明公开了属于图像处理技术领域的一种基于主线方向特征的深度信念网络图像分类方法。通过对训练样本进行主线方向信息特征提取；构造训练样本矩阵，将主线方向信息附加到训练样本矩阵中；将附加主线方向信息的训练样本矩阵输入DBN模块；采用无监督训练、有监督微调方法，对输入DBN模块的训练样本矩阵进行分类训练，当网络收敛后，用于图像分类。本发明通过增加图像的空间特征信息，提高了多种图像的分类效果，能够显著提高图像分类的正确率和识别率。
【IPC分类】G06K9-66
【公开号】CN104657751
【申请号】CN201510108808
【发明人】高强, 李倩, 余萍
【申请人】华北电力大学（保定）
【公开日】2015年5月27日
【申请日】2015年3月12日

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高强;李倩;余萍;
技术所有人：华北电力大学（保定）;
我是此专利的发明人

上一篇：一种基于深度学习的安全带佩戴识别方法
上一篇：一种用于人物关系抽取的方法和装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。