基于AlexNet网络模型的果蔬分类方法及装置与流程

文档序号：14120922阅读：385来源：国知局

本发明涉及图像分类技术领域，更具体地，涉及一种基于alexnet网络模型的果蔬分类方法及装置。

背景技术：

为了保证城市果蔬供给，各供货端每天需进行果蔬的采摘和分拣。目前，蔬菜的分拣完全依赖人工完成。随着城市人口的增加，果蔬的需求量也急剧增加，同时，随着互联网技术和各种信息技术的发展，我国的农业发展模式开始由原来的传统农业向现代化的智慧农业进行转变，果蔬的种植开始规模化，分拣工作量也也急剧增加。人工分拣方式因效率低下和成本开销大而无法满足供货商的需求。因此，急需一种自动分类蔬菜的方式以方便自动化分拣。

技术实现要素：

本发明提供一种基于alexnet网络模型的果蔬图像分类方法及装置，以克服现有技术中，人工分拣方式因效率低下和成本开销大而无法满足供货商的需求的问题。

根据本发明的第一方面，提供一种基于alexnet网络模型的果蔬图像分类方法，该方法包括：获取目标果蔬的图像，将所述图像输入至目标alexnet网络模型，输出所述图像对应的果蔬种类。

结合本发明第一方面的第一种可能实现方式，在第二种可能实现方式中，所述将所述图像输入至目标alexnet网络模型之前还包括：将需分类的各种果蔬的样本图像及其种类标签作为初始alexnet网络模型的输入项，采用小批量随机梯度下降算法，对所述初始alexnet网络模型进行训练直至满足网络误差不大于误差阈值，获取目标alexnet网络模型。

结合本发明第一方面的第二种可能实现方式，在第三种可能实现方式中，所述将需分类的各种果蔬的样本图像及其种类标签作为初始alexnet网络模型的输入项，采用小批量随机梯度下降算法，对所述初始alexnet网络模型进行训练直至满足预设条件，获取目标alexnet网络模型，具体包括：从需分类的各种果蔬的样本图像及其种类标签中选取部分样本图像及其种类标签并输入初始alexnet网络模型，获取初始网络误差；基于所述初始网络误差，调整所述初始alexnet网络模型的参数；基于所述部分样本图像及其种类标签和参数调整后的alexnet网络模型，获取网络误差；若判断获知所述网络误差大于误差阈值，则重新调整alexnet网络模型的参数，并重新获取网络误差，重复此过程，直至重新获取到的网络误差不大于所述误差阈值为止，以得到目标alexnet网络模型；若判断获知所述新的网络误差小于或等于所述误差阈值，则将所述参数调整后的alexnet网络模型作为目标alexnet网络模型。

结合本发明第一方面的第三种可能实现方式，在第四种可能实现方式中，其特征在于，所述网络误差的具体获取方式为：alexnet网络模型利用损失函数计算所述网络误差；其中，j(θ)为网络误差值；θ为alexnet网络模型的参数，m为选取的部分样本图像的数目；yⁱ为第i个样本图像的真实种类标签；hθ(xⁱ)为样本图像种类标签预测函数；xⁱ为选取的部分样本图像第i个样本图像的特征向量。

结合本发明第一方面的第一种可能实现方式，在第五种可能实现方式中，所述目标alexnet网络模型包括卷积层和连接层；所述目标alexnet网络模型具体用于利用卷积层将所述预设大小的目标果蔬图像进行卷积处理，并将卷积结果输入连接层获取所述目标果蔬图像的种类。

结合本发明第一方面的第一至四种可能实现方式，在第六种可能实现方式中，所述需分类的各种果蔬的样本图像通过需分类的各种果蔬的若干图像，利用数据增强，扩大图像数目获得。

根据本发明的第二方面，提供一种基于alexnet网络模型的果蔬分类装置，包括：获取模块和分类模块；所述获取模块，用于获取目标果蔬的图像；所述分类模块，用于将所述图像输入至目标alexnet网络模型，输出所述图像对应的果蔬种类。

根据本发明的第三方面，提供一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，使所述计算机执行如第一方面所述的方法。

根据本发明的第四方面，提供一种非暂态计算机可读存储介质，其特征在于，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行如第一方面所述的方法。

本发明提出的基于alexnet网络模型的果蔬图像分类方法及装置，通过获取目标果蔬的图像，将所述图像输入至目标alexnet网络模型，输出所述图像对应的果蔬种类，实现了果蔬的自动分类。本发明的方法应用于果蔬的分拣工作中，可大大提高分拣效率降低成本。

附图说明

图1为根据本发明实施例的基于alexnet网络模型的果蔬图像分类方法流程图；

图2为根据本发明实施例的基于alexnet网络模型的果蔬图像分类装置流程图。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。

本发明的方法可用于高度自动化的果蔬分拣系统。例如，可利用传送带将待分拣的果蔬传送至分类处进行分类，根据分类结果将果蔬送至对应的收货口，实现自动分拣。分类方法如下：

如图1所示，根据本发明的第一方面，提供一种基于alexnet网络模型的果蔬分类方法，该方法包括：步骤1，获取目标果蔬的图像；步骤2，将所述图像输入至目标alexnet网络模型，输出所述图像对应的果蔬种类。

在本实施例中，目标果蔬为各种可食用的蔬菜和水果，例如，白菜、芹菜和空心菜等蔬菜；苹果、梨和桃子等水果。获取目标果蔬的图像的方式可以为实时抓拍，例如，对传送带上放置送往分拣点的目标果蔬进行抓拍获取图像。为了便于后续目标alexnet网络模型能够直接对目标果蔬的图像进行分类，在将目标果蔬的图像输入模型前，将目标果蔬的图像按照预设尺寸调整为同样的尺寸。预设大小需根据目标alexnet网络模型对输入图像尺寸的规定进行设置。alexnet网络模型具有出色的分类准确率，为alexnet在2012年提出。alexnet利用alexnet网络模型在当年的iamgenet大规模视觉识别挑战赛中取得了最好的成绩。目标alexnet网络模型为利用需分类的各种果蔬的样本图像及其种类标签对alexnet网络模型进行训练而得。因此，也具有较佳的分类性能。

本发明提出的基于alexnet网络模型的果蔬图像分类方法，通过获取目标果蔬的图像，将所述图像输入至目标alexnet网络模型，输出所述图像对应的果蔬种类，实现了果蔬的自动分类。本发明的方法应用于果蔬的分拣工作中，可大大提高分拣效率降低成本。

作为一种可选实施例，所述步骤2之前还包括：所述将所述图像输入至目标alexnet网络模型之前还包括：将需分类的各种果蔬的样本图像及其种类标签作为初始alexnet网络模型的输入项，采用小批量随机梯度下降算法，对所述初始alexnet网络模型进行训练直至满足网络误差不大于误差阈值，获取目标alexnet网络模型。

在本实施例中，用于训练初始alexnet网络模型的样本图像包括了所有可能需自动分类的果蔬，既可以通过拍摄获取也可以通过网络下载获取。随机梯度下降算法每次仅采用一个样本进行迭代，训练速度很快。但由于仅用一个样本决定梯度方向，得到的解很有可能不是最优解。此外，一次迭代一个样本，迭代方向变化很大，很难快速收敛到局部最优解。批量梯度下降算法每次采用一批样本进行迭代，但当一批样本数目较大时，训练速度较慢。因此，在本实施例中，采用小批量梯度下降法对初始alexnet网络模型进行训练。小批量梯度下降法是批量梯度下降法和随机梯度下降法的折中，即每次采用一小批样本进行迭代，这样便可以以较快的速度得到最优解。

作为一种可选实施例，所述将需分类的各种果蔬的样本图像及其种类标签作为初始alexnet网络模型的输入项，采用小批量随机梯度下降算法，对所述初始alexnet网络模型进行训练直至满足预设条件，获取目标alexnet网络模型，具体包括：从需分类的各种果蔬的样本图像及其种类标签中选取部分样本图像及其种类标签并输入初始alexnet网络模型，获取初始网络误差；基于所述初始网络误差，调整所述初始alexnet网络模型的参数；基于所述部分样本图像及其种类标签和参数调整后的alexnet网络模型，获取网络误差；若判断获知所述网络误差大于误差阈值，则重新调整alexnet网络模型的参数，并重新获取网络误差，重复此过程，直至重新获取到的网络误差不大于所述误差阈值为止，以得到目标alexnet网络模型；若判断获知所述新的网络误差小于或等于所述误差阈值，则将所述参数调整后的alexnet网络模型作为目标alexnet网络模型。

在本实施例中，初始alexnet网络模型为现有的alexnet网络模型，其参数为默认设置。网络误差为根据种类标签和分类结果计算出的表明分类误差大小的数值。如果网络误差较大，说明当前的参数需要调整。在本实施例中具体利用反向传播调整参数，以减小网络误差。调整参数后的alexnet网络模型较调整参数前具有更好的分类效果，更小的网络误差。通过反复调整参数，使alexnet网络模型分类效果越来越好直至网络误差小于误差阈值，便可获得具有良好分类效果的目标alexnet网络模型。

作为一种可选实施例，所述网络误差的具体获取方式为：alexnet网络模型利用损失函数计算所述网络误差；其中，j(θ)为网络误差值；θ为alexnet网络模型的参数，m为选取的部分样本图像的数目；yⁱ为第i个样本图像的真实种类标签；hθ(xⁱ)为样本图像种类标签预测函数；xⁱ为选取的部分样本图像第i个样本图像的特征向量。

在本实施例中，计算网络误差的具体过程为：对于m个样本图像中的每一个样本图像，首先求取该样本图像的预测种类标签和真实种类标签差值的平方的一半，然后将m个样本图像的预测种类标签和真实种类标签差值的平方的一半求平均。

作为一种可选实施例，所述目标alexnet网络模型包括卷积层和连接层；所述目标alexnet网络模型具体用于利用卷积层将所述预设大小的目标果蔬图像进行卷积处理，并将卷积结果输入连接层获取所述目标果蔬图像的种类。

所述alexnet网络模型共八层，前五层为卷积层，后三层为全连接层；前两层卷积层包括卷积、修正、归一化和池化处理；第三层至第五层卷积层包括卷积和修正处理；所述第五层卷积层还包括池化处理；第六层和第七层全连接层包括全连接、修正和dropout处理；最后一层全连接层包括全连接和softmax处理。

在本实施例中，修正处理通过修正线性单元(relu)激活函数实现，函数公式如下：f(x)＝max(0,x)；其中，x为特征图中任一点的原始r、g或b值；f(x)为特征图中x对应点修正后的r、g或b值。relu属于不饱和非线性函数。对于relu函数而言，如果输入大于0，则输出与输入相等，否则输出为0。在本实施例中，采用relu可对特征图中异常的原始r、g或b值进行修正。此外，通过采用relu使得一部分神经元输出为0，网络变得稀疏，可加快网络的训练速度，同时，减少了网络中参数的相互依存关系，进而减少了过拟合的发生。

在本实施例中，局部响应归一化公式如下：其中，为归一化结果，表示输入矩阵(x,y)位置处的值做第i次卷积并通过relu单元的结果，n是指相同位置的第i次前后附近的n次卷积，而n是总的卷积次数；α，β，k为超参数。

在本实施例中，所述池化处理的公式如下：其中，rn表示特征图中第n个池化区域，ci表示rn中第i个像素值。

在本实施例中，所述dropout操作处理的概率根据实际情况设置，本实施例对此不作具体限定。优选地，定义的概率为0.5。

作为一种可选实施例，所述需分类的各种果蔬的样本图像通过需分类的各种果蔬的若干图像，利用数据增强，扩大图像数目获得。

数据增强的方式可以为旋转、翻转、变换等，可根据实际情况选择具体方式，本实施例不做具体限定。在本实施例中，优选地，采用旋转的方式对果蔬图像按90°、180°、270°旋转，将图像数目扩大了4倍。在训练阶段，数据增强可以产生额外的训练样本，从而减少过拟合带来的影响。在测试阶段，数据增加有助于提高分类精度。

本发明提出的基于alexnet网络模型的果蔬图像分类装置，通过获取模块，获取目标果蔬的图像，通过分类模块，将所述图像输入至目标alexnet网络模型，输出所述图像对应的果蔬种类，实现了果蔬的自动分类。本发明的装置应用于果蔬的分拣工作中，可大大提高分拣效率降低成本。

作为一种可选实施例，所述装置还包括：模型获取模块；所述模型获取模块用于将需分类的各种果蔬的样本图像及其种类标签作为初始alexnet网络模型的输入项，采用小批量随机梯度下降算法，对所述初始alexnet网络模型进行训练直至满足网络误差不大于误差阈值，获取目标alexnet网络模型。

作为一种可选实施例，所述模型获取模块具体用于从需分类的各种果蔬的样本图像及其种类标签中选取部分样本图像及其种类标签并输入初始alexnet网络模型，获取初始网络误差；基于所述初始网络误差，调整所述初始alexnet网络模型的参数；基于所述部分样本图像及其种类标签和参数调整后的alexnet网络模型，获取网络误差；若判断获知所述网络误差大于误差阈值，则重新调整alexnet网络模型的参数，并重新获取网络误差，重复此过程，直至重新获取到的网络误差不大于所述误差阈值为止，以得到目标alexnet网络模型；若判断获知所述新的网络误差小于或等于所述误差阈值，则将所述参数调整后的alexnet网络模型作为目标alexnet网络模型。

作为一种可选实施例，所述装置还包括数据增强模块，用于通过需分类的各种果蔬的若干图像，利用数据增强，扩大图像数目获得所述需分类的各种果蔬的样本图像。

最后，本发明的方法仅为较佳的实施方案，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李振波;朱玲;林尚伟;吴静;李晨;李光耀;钮冰姗;彭芳;岳峻;李道亮
技术所有人：中国农业大学
我是此专利的发明人

上一篇：一种具有耐磨作用的新型轴承的制作方法
上一篇：一种多功能轴承的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。