一种基于多通道特征的ELM和DE相结合的图像分类方法与流程

文档序号：11520295阅读：195来源：国知局

本发明涉及图像分类领域，尤其涉及一种基于多通道特征的elm(extremelearningmachine极端学习机)和de(differentialevolution差分进化算法)相结合的图像分类方法。

背景技术：

图像分类问题是当今计算机视觉与图像处理领域许多重要研究领域的基础问题。好的图像分类技术可以有效地解决其他科研领域的难题，比如图像检索领域、遥感图像领域、三维重建领域等等。分类的目的就是根据现有的图像特征建立一个分类器，能够对未知的图像类型进行预测。例如，通过遥感图像分类获得土地利用图、植被覆盖图以及其他一些图件，进而将这些图件作为下一步的基础图件，进行环境、土地利用；在医学上可以通过对x线图形分类进行乳腺癌肿块的诊断。

因此，近些年来许多图像分类方法被提出来。有基于纹理、形状以及颜色空间的图像分类技术，分类器一般都使用svm(supportvectormachine，支持向量机)。但是这些方法都存在不同程度的问题。首先，对于采用的这些纹理、形状以及颜色空间特征不足以表达图像的特征。其次，svm分类器需要反馈调节参数，耗时长，不能达到快速分类效果。

技术实现要素：

本发明针对上述技术问题，提出一种基于多通道特征的elm和de相结合的图像分类方法。本发明方法通过提取分辨率高的图像特征来提高分类精度，以及通过使用耗时少的分类器实现快速图像分类。

本发明的基于多通道特征的elm和de相结合的图像分类方法，包括：训练过程和预测过程。所述训练过程包括：

步骤a1：获取正负样本；

步骤a2：将上述样本的大小统一变换到规定尺寸，并进行高斯滤波处理；

步骤a3：提取上述样本图像的积分通道特征，包括：灰度颜色通道特征、梯度方向直方图通道特征和梯度幅值通道特征；

步骤a4：将步骤3中提取的积分通道特征作为elm的输入并进行图像分类训练，同时，使用de差分进化算法对elm进行改进优化，使elm的分类效果达到最优，从而获得训练好的分类器。

所述预测过程包括：

步骤b1：将待预测图像的大小缩到规定尺寸，并进行高斯滤波处理；

步骤b2：提取上述待预测图像的积分通道特征，包括灰度颜色通道、梯度方向直方图通道和梯度幅值通道；

步骤b3：将上述提取的积分通道特征作为上述训练好的分类器的输入，通过所述分类器进行分类，将分类结果输出。

本发明所采用的技术方案是一种基于多通道特征的elm和de相结合的图像分类方法，可以实现快速、高精度、具有很高的实用价值的图像分类。

附图说明

图1为本发明的图像分类方法的流程图。

图2(a)为本发明的正样本集(人脸)的示意图；图2(b)为缩小后的正样本集(人脸)的示意图。

图3(a)为本发明的负样本集(被覆盖掉人脸的人)的示意图；图3(b)为缩小后的负样本集(人脸)的示意图。

具体实施方式

下面通过实施例对本发明作进一步说明，其目的仅在于更好地理解本发明的研究内容而非限制本发明的保护范围。

如图1所示，本发明的一种基于多通道特征的elm和de相结合的图像分类方法，包括训练过程和预测过程，所述训练过程包括如下步骤：

步骤a1：获取正负样本，本实施例中以人脸图像为训练样本，取不同光照场景下、不同年龄、不同性别等人脸作为正样本，取除人脸之外的其他身体部位小块作为负样本，如图2(a)和图3(a)所示。无人脸的任何图像都可以作为负样本，为了减少误检，本发明采用覆盖掉人脸的图像作为负样本集。本发明中，正样本数量为五万，负样本数量十万。

步骤a2：将上述样本的大小统一缩放或裁切到规定尺寸，并进行高斯滤波处理。这里，规定尺寸可以是20*20(分辨率)，如图2(b)和图3(b)中所示。当然也可以根据实际需求是其他尺寸。这里使用高斯滤波处理，减弱噪声，增强对比度。

步骤a3：提取上述样本图像的积分通道特征，包括：灰度颜色通道特征、梯度方向直方图通道特征和梯度幅值通道特征。这里，灰度颜色通道特征为1个、梯度方向直方图通道特征为6个，梯度幅值通道特征为1个。当然，根据实际的需求，也可以提取不同的特征数量。

步骤a4：将步骤a3中提取的积分通道特征作为elm的输入并进行图像分类训练，同时，使用de差分进化算法对elm进行改进优化，使elm的分类效果达到最优，从而获得训练好的分类器。

进一步地，步骤a4中使用de差分进化算法对elm进行改进优化进一步包括：

步骤a41：将elm随机产生的输入权值wi与隐层权值bi作为de的初始种群θ并输入de；

上述公式(1)中，k表示隐层结点数，n表示输入神经元数。对种群中的每个个体，计算相应的广义逆矩阵，对广义逆矩阵的结果在验证集上计算均方根误差，并以该误差作为每个个体的适应度，所述均方根误差的计算公式如下：

上述公式(2)中，e表示均方根误差，(xj,tj)为elm的训练数据，n为输入样本数，i表示第i个隐层结点，j表示第j个输入数据，m表示输入数据x的维数(即特征数)，根据经验设置de最大的进化代数为50，选取最小误差时的θ，作为elm最优的输入权值与隐层权值；

步骤a42：将elm的分类错误率作为阈值，所述错误率为分错类的图像与总图像数量的比值，对步骤a41中获得的elm的输入权值与隐层权值进行优选。具体地，设定一个elm的最大能接受的错误率δ，若在de的最大进化代数内，得到的elm错误率小于δ，则此时de的输出为elm的最优权值；若de达到最大进化代数，且elm的错误率依旧大于设置的阈值，则选择最大代数内elm最小错误率时的de输出为最优权值。

通过上述步骤，可获得训练好的最优的分类器。

下面介绍预测过程，所述预测过程包括如下步骤：

步骤b1：将待预测图像的大小缩放到规定尺寸，并进行高斯滤波处理；

步骤b2：提取上述待预测图像的积分通道特征，包括灰度颜色通道、梯度方向直方图通道和梯度幅值通道；

步骤b3：将上述提取的积分通道特征作为上述训练好的分类器的输入，通过所述分类器进行分类，将分类结果输出。

上述步骤b3之后还可以包括统计误检率的步骤。

通过本发明的基于多通道特征的elm和de相结合的图像分类方法，可以实现快速、高精度、具有很高的实用价值的图像分类。

显然，本技术领域中的普通技术人员应当认识到，以上的实施例仅是用来说明本发明，而并非用作为对本发明的限定，只要在本发明的实质精神范围内，对以上所述实施例的变化、变型都将落在本发明的权利要求书范。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：欧阳海飞;许震;张如高
技术所有人：新智认知数据服务有限公司
我是此专利的发明人

上一篇：相似图片检测的方法和装置与流程
上一篇：基于分布式聚类的网络流量时间序列预测方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。