基于稀疏自动编码器和支持向量机的图像分类方法与流程

文档序号:12124156阅读:来源:国知局

技术特征:

1.基于稀疏自动编码器和支持向量机的图像分类方法,其特征在于:该方法包括以下步骤,

S1:获取训练图像集和测试图像集;

S2:构建多隐含层的深度稀疏自动编码器,输入训练图像集,对深度稀疏自动编码器进行训练,直到满足训练条件;

S3:将测试图像集输入到训练好的深度稀疏自动编码器进行逐层学习,每层隐含层提取到一个特征集信息;并用提出的特征权值结合法对每个特征集分配一个特征权值,最后将每层隐含层获得的特征集和对应的权值结合成一个新的待分类图像特征集;

S4:将训练图像特征集作为训练样本对支持向量机分类器进行训练,并采用遗传算法对支持向量机进行优化,选择出支持向量机的最优参数,达到支持向量机最优分类性能;

S5:将得到的待分类图像特征集输入到优化后的支持向量机,进行图像分类并得到分类准确率。

2.根据权利要求1所述的基于稀疏自动编码器和支持向量机的图像分类方法,其特征在于:

S1:获取训练图像集和测试图像集;

S2:构建多隐含层的深度稀疏自动编码器,输入训练图像集,对深度稀疏自动编码器进行训练,直到满足训练条件;

深度稀疏自动编码器首先要进行网络训练,具体训练过程如下:

1)将训练图像集作为输入层,将x=h0作为稀疏自动编码器的可视层,训练出第一层隐含层;

x为可视层向量即输入层,h是隐含层向量,第n层隐含层向量就是hn,所以此处的h0和x的含义相同,即输入层,也叫可视层;

2)用第一层得到的图像特征作为输入数据到第二层中;

3)利用第2步的数据训练第二层,同样运用稀疏自动编码器模型;

4)重复上述2、3步骤,直到训练到所需要的层数N;

5)用BP算法对网络进行微调,使所有的参数都被优化;

S3:将测试图像集输入到训练好的深度稀疏自动编码器进行逐层学习,每层隐含层提取到一个特征集信息;并用提出的特征权值结合法对每个特征集分配一个特征权值,最后将每层隐含层获得的特征集和对应的权值结合成一个新的待分类图像特征集;

具体分为以下3个小步骤:

S3.1:将测试图像集输入到训练好的深度稀疏自动编码器进行逐层学习,提取图像特征,经过多个隐含层,得到了从简单的边缘特征到深层抽象的特征表达,每层隐含层都会提取到一个特征集Si,直到得到N个特征集,N为正整数;

S3.2:为了提高特征的识别力,提出特征权值结合法;按照如下公式,为每层隐含层得到的特征集分配一个特征权值W,其中,第i个特征集在整个深度稀疏自动编码器所占权值为Wi,且权值Wi满足下式:

Wi=i·W i=1,...,N

S3.3:将每层隐含层得到的特征集和对应的特征权值结合成一个新特征集T,作为待分类的特征集,新特征集T的表达式为:

S4:将训练图像特征集作为训练样本对支持向量机分类器进行训练,并采用遗传算法对支持向量机进行优化,选择出支持向量机的最优参数,达到支持向量机最优分类性能;

遗传算法对支持向量机的寻优步骤如下:

S4.1:确定种群大小、最大迭代次数等各参数,随机产生初始化种群,生成种群个体;

本方法中,种群数量设为20,最大的进化代数设为200,支持向量机参数C的变化范围设为(0,100],参数γ的变化范围为(0,1];

S4.2:将种群中个体基因串解码为相应的核函数、核函数参数及错误惩罚因子,并带入支持向量机进行训练和测试;

利用遗传算法对支持向量机分类器的参数寻优,首先需要对核函数、核函数参数以及错误惩罚因子进行遗传编码;本方法对所有参数都采用二进制编码;基因串的编码格式如下表所示:

表1基因串的编码格式

c0c1c2c3cn+1cn+2cn+m+1

表1中,c0和c1为SVM的核函数类型的二进制编码,总共有四种类型的核函数;核函数参数的编码为n位,错误惩罚因子的编码为m位,都是在取值范围内的二进制编码;所以,n+m+2位的二进制编码组合就是个体基因串的编码表示;

S4.3:通过适应度函数计算初始种群中每个个体的适应度值,并保留当前种群中的最优和最差个体;

遗传算法的目标是对支持向量机参数寻优,达到支持向量机的最优分类性能,遗传算法中的评价标准即适应度来评判种群进化的优劣;本方法中将测试样本的准确率ACCtest加上一个很小的常数c再取倒数后的值作为种群适应度的评价函数Fit,评价函数Fit适应度的值采用下式计算:

Fit=1/(ACCtest+c)

S4.4:判断是否满足终止条件,若满足则终止迭代,得到最优个体,种群选出最优解;否则,执行S4.5步;

S4.5:执行选择、交叉和变异操作;

在选择操作中,本方法采用赌轮选择法和最优保留、最差替换准则相结合的选择方式;赌轮选择法的个体被选中的概率与其适应度函数成正比,群体中每一个染色体指定饼图中的一小块区域,区域大小与染色体的适应性成比例,染色体适应性越高,与其对应的区域面积越大;为了选取染色体,旋转轮盘,最后指针停下指向的区域就是所选择的染色体;

交叉概率Pc和变异概率Pm的选择是影响遗传算法行为和性能的关键所在,直接影响算法的收敛性,交叉算子在遗传算法中起核心作用,变异运算是改变群体中的个体串的某些基因座上的基因值;本方法采用的自适应Pc和Pm的计算公式如下:

其中,Pc1和Pc2分别为个体的最大和最小交叉概率,Pm1和Pm2分别为个体的最大和最小变异概率,Pc1、Pc2、Pm1和Pm2都是区间(0,1)上的常数;fmax是群体中最大的适应度值,favg是每代中的平均适应度值,f是要变异个体的适应度值,f′是要交叉的两个个体中大的适应度值;

S4.6:并计算新生成的子代种群中每个个体的适应度值,并保留当前种群中的最优和最差个体;

至此就完成了一组训练样本的训练过程,然后迭代重复以上步骤,直至达到S4.4中的终止条件;

S4.7:执行最优保留,最差替换准则;

最优保留,最差替换准则就是种群中适应度最高的个体不参加交叉和变异运算,而是用它来替换掉本代种群中经过交叉、变异等运算后产生的适应度最低的个体;

S5:将得到的待分类图像特征集输入到优化后的支持向量机,进行图像分类并得到分类准确率。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1