本发明涉及烟叶分拣方法,具体涉及一种基于卷积神经网络的烟叶分拣方法。
背景技术:
现有的烟叶分拣过程中,由于烟叶形态多样、没有特定的纹理,颜色也较为复杂,所以其特征相较于杂物并不明显,而且杂物的种类繁多。仅从形态、纹理和颜色等单一特征来区分非常容易产生误判和漏判。
目前主要采用的是用颜色特征来进行分拣,该方法在异物颜色有差异的情况下能区分比较多的异物,但是对于颜色接近的异物,例如其他植物茎叶、麻绳、颜色相近的纸张碎片等是识别不出来的,而对于这些杂物的剔除仍然是烟叶分拣评测中的重要的指标。
技术实现要素:
本发明的目的在于提供一种基于卷积神经网络的烟叶分拣方法。
实现本发明目的的技术方案为:一种基于卷积神经网络的烟叶分拣方法,包括如下步骤:
步骤1,采集烟叶图像,由人工分拣将烟叶分为两类,一类为正常烟叶,另一类为杂物;
步骤2,设计一个包括4个特征提取层、一个全连接层和一个输出层的神经网络,每个特征提取层包含一个卷积层、一个下采样层和一个激活层;
步骤3,将步骤1中划分的两类图像分别切分为n*n的图片,进行标号并贴上标签,然后将这两类图像输入设计好的卷积神经网络进行训练;
步骤4,经过训练得到卷积神经网络的参数模型,将参数导入只有前向传播的卷积神经网络进行分类,通过阈值判别来决定是否发出剔除指令;
步骤5,在训练过程中将漏判和误判的图像制作成样本集,加入训练样本中再次进行训练以得到神经网络参数模型。
与现有技术相比,本发明的显著优点为:
(1)本发明极大的提高对于杂物的识别率,而且相对于现在的单一的特征分拣模式不能根据不同杂物进行调节的缺点,本发明能够对烟叶和杂物进行学习,随着使用的周期加长,采集的样本越多,训练出来的参数模型就越能精确的对杂物和烟叶进行识别,降低误检率和漏判率;(2)使用卷积神经网络来对烟叶进行分拣不仅能够将颜色有差异的杂物,也能将具有纹理特征以及形态特征的杂物分拣开来,而且由于对于正常烟叶和杂物的分辨是由人工先验识别然后制作样本输入,所以只要样本的输入合理,卷积神经网络能够达到与人工分拣一样的准确性。
附图说明
图1为本发明神经网络的结构模型图。
图2为本发明训练过程的流程图。
图3为本发明检测过程的流程图。
具体实施方式
一种基于卷积神经网络的烟叶分拣方法,包括如下步骤:
步骤1,采集烟叶图像,由人工分拣将烟叶分为两类,一类为正常烟叶,另一类为杂物;
步骤2,设计一个包括4个特征提取层、一个全连接层和一个输出层的神经网络,每个特征提取层包含一个卷积层、一个下采样层和一个激活层,如图1所示;神经网络中卷积核的大小为5*5,下采样的步长为2;每一层卷积核的数量依次为32、32、64和128,全连接层的神经元数量为500,输出的类别为2类,训练时小样本集合的数量为100。
步骤3,将步骤1中划分的两类图像分别切分为128*128的小图片,进行标号并贴上标签,然后将这两类图像输入设计好的卷积神经网络进行训练;
步骤4,经过训练得到卷积神经网络的参数模型,将参数导入只有前向传播的卷积神经网络进行分类,通过阈值判别来决定是否发出剔除指令;
步骤5,在训练过程中将漏判和误判的图像制作成样本集,加入训练样本中再次进行训练以得到更为精确的神经网络参数模型。
下面结合附图与实施例对本发明作进一步详细描述。
实施例
一种基于卷积神经网络的烟叶分拣方法,包括如下步骤:
(1)采集图像:用图像采集系统采集烟叶图像,对于采集的图像进行分类,人工挑选出正常烟叶的图像以及杂物的图像,将采集的图像分为两大类。
(2)制作样本:将分类完成的两类图像进行切分,所有图像均切分为128*128大小的小图片,然后对两类切分好的图片进行标号以及生成标签。
(3)搭建神经网络:在生成了样本库以后,需要搭建一个卷积神经网络系统来对样本进行学习。网络的结构如图1所示,其中包括四个特征提取层,每层包括卷积层、下采样层以及激活层,每一特征提取层输出作为下一特征提取层的输入。输入图片的大小为128*128,卷积核的大小为5*5,下采样的步长为2。每一层卷积核的数量依次为32、32、64和128,全连接层的神经元数量为500,输出的类别为2类,训练时小样本集合的数量为100。
(4)训练卷积神经网络:运用制作的样本集输入,由卷积神经网络进行参数的训练,直到达到期望的准确率,如果已经达到迭代的次数上限仍未能达到期望的准确率,重新制作样本集进行训练,注意样本集制作时分类要准确。
(5)使用网络进行分拣处理:由于不同的采集系统采集的图像的尺寸不一,首先对图像进行尺寸的预处理,然后采用步骤(4)生成的参数模型,采用卷积神经网络的前向传播过程对输入图像进行分类,将分类结果统计然后通过阈值判决,进而决定是否输出分拣过程中的剔除指令。
(6)调节阈值并优化:调节阈值并对分拣过程中的漏判和误判的图像进行存储,然后重复步骤(2)、(3)和(4),对神经网络进一步优化。
图1为神经网络的结构模型,其中tobacco为图像输入层;conv1、conv2、conv3、conv4均为卷积层,每一层卷积核的数量依次为32、32、64和128,卷积核大小均为5*5;pool1、pool2、pool3、pool4均为下采样层,下采样的步长均为2;relu1、relu2、relu3、relu4均为激活层,激活函数均为relu函数;ip1为全连接层;ip2为输出层;loss为误差层,用于反向传播。
整套系统的工作流程如图2、图3所示,图2为训练过程,图3为运用过程。如图2所示,图像采集系统采集图像,制作样本集,分类并添加标签,训练图像数据,测试分类结果,根据分类结果判断是否继续训练或者重新制作样本集。完成训练过程以后进行如图3所示的检测流程,根据判决结果决定是否发出剔除指令来对烟叶进行分拣。在检测的流程中同时对样本进行采集,将误判和漏判的样本存储,在系统运行一定周期以后将采集的样本加入样本集,进行训练,提高网络的识别精度和识别种类的数量。