一种基于自编码特征学习的冬虫夏草检测方法与流程

文档序号:12468875阅读:507来源:国知局
一种基于自编码特征学习的冬虫夏草检测方法与流程

本发明属于人工智能应用技术领域,具体是一种基于自编码特征学习的冬虫夏草检测方法。



背景技术:

冬虫夏草又名虫草,是我国民间惯用的一种名贵滋补药材,其营养成分高于人参,可入药,也可食用,是上乘的佳肴,具有很高的营养价值。冬虫夏草主产于金沙江、澜沧江、怒江三江流域的上游。东至四川省的凉山,西至西藏的普兰县,北起甘肃省的岷山,南至喜马拉雅山和云南省的玉龙雪山。最好的虫草生长在海拔3000~5500米左右的向阳潮湿、土质松软肥沃的山坡、草甸、灌木丛下,且采挖周期只有一个月左右。

传统的冬虫夏草的采挖方式采用人工搜寻,挖掘的方法,由于虫草的稀少,且生长在潮湿的草甸、山坡上,背景比较复杂,使得其非常难以被发现,所以虫草的搜寻是一个非常耗时的过程,一个普通藏民通常一天多的可以发现二十根左右,少的只有两三根,甚至可能一无所获。藏民们通常采用跪地慢搜的方法,由于草地的潮湿,也会的使得挖草对身体有着很大的损伤。所以探寻一种能够自动搜寻虫草或者缩小搜索面积的自动化方法就显得非常重要。

由于虫草生长环境的复杂性,导致普通的图像检测方法无法在此方面使用。深度学习模型是一种神经网络模型,采用分层学习机制,能够自动的从输入数据逐层学习到高层抽象数据。所以本发明提出了一种基于自编码特征学习的冬虫夏草检测方法,通过采集已标注的样本图像,自动训练编码特征,采用非线性核支持向量机进行分类检测,能够比较准确的检测到虫草的位置。专利检索以及对国内外各种科技文献检索表明,尚未有基于自编码特征学习的冬虫夏草检测方法见诸文献。



技术实现要素:

本发明的目的在于提供一种基于自编码特征学习的冬虫夏草检测方法,能够在复杂背景下检测冬虫夏草。

实现本发明的技术解决方案为:一种基于自编码特征学习的冬虫夏草检测方法,包括以下步骤:(1)采集一系列包含冬虫夏草的图像;(2)提取图像中的冬虫夏草以及其他背景,并制作成大小相同的正负样本;(3)通过提取的样本图像训练自编码模型,获取自编码模型参数;(4)将样本通过自编码模型进行编码;(5)将获得的编码以及样本类别采用非线性支持向量机进行分类训练,获取分类模型参数;(6)采集待检测的冬虫夏草图像,将其在多个尺度下进行分块;(7)对每一块图像采用自编码模型进行编码,采用非线性支持向量机进行分类并记录位置;(8)剔除检测到的重合区域,并将所有非重合区域标注在待检测图像上。

本发明与现有技术相比,其显著优点:本发明首次提供了一种自动检测冬虫夏草的方法,能够在图像上自动标注冬虫夏草的位置。

附图说明

图1是本发明冬虫夏草检测方法的流程图。

图2是栈式自编码模型示意图。

图3是高斯金字塔方法示意图。

具体实施方式

本发明基于自编码特征学习的冬虫夏草检测方法,其步骤为:

1.样本的制作

1)采集一系列包含冬虫夏草的图像;

2)提取包含冬虫夏草的子块,以及包含背景的子块,提取比例为1:10,并将其缩放为同一尺寸;

3)将样本按照正负样本类别进行归类,并进行编号。

2.分类模型的训练

1)将样本库打乱顺序,采用两层栈式自编码网络进行训练,获得训练后的模型参数;

2)将样本库采用训练好的模型进行编码,

3)同时将编码以及样本类别标签带入到非线性核支持向量机进行训练,获取分类模型参数,其中非线性核采用高斯函数;

3.虫草的检测

1)采集待检测的可能包含冬虫夏草图像;

2)将图像在5个尺度上进行分块,每个块的大小同样本库大小相同;

3)针对分割好的图像块,采用训练好的自编码模型进行编码,然后带入训练好的非线性核支持向量机模型进行分类,并将分类为正的图像块进行记录;

4)待5个尺度上的图像块全部分类完成后,将有重叠区域的记录进行清除;

将非重叠区域采用矩形框的方式标注在待检测图像上,即为冬虫夏草的位置。

下面结合附图对本发明做进一步详细描述。

1、样本的制作

首先,用摄像机采集包含冬虫夏草的图片不少于500幅(越多越好),设每一幅图片的大小为M×N;

然后,从每一幅图片中剪切出11k幅大小为m×n的样本图片,其中含正样本(含冬虫夏草)k幅,负样本(不含冬虫夏草)的图片为10k幅,其中k为此原始图片中所含冬虫夏草的数量;

最后,将正负样本按照顺序编号,并分别归类存储,用于后面的模型训练使用。

2、分类模型的训练

本发明所使用的冬虫夏草编码分类模型为自编码模型和支持向量机模型。其中编码模型为两层栈式自编码模型,分类模型采用非线性核支持向量机,核为高斯函数。

1)特征自编码模型

特征的提取采用两层栈式自编码特征,如图2所示。其中,为单个图像样本,h,s,t分别为隐含层特征,最终的自编码特征为s层,W(1),W(2),W(3),W(4),b(1),b(2),b(3),b(4)为自编码网络的模型参数。

训练样本库中的冬虫夏草样本为彩色图像,包含三个通道,所以模型中的α=3mn,且在本发明中,设定h,t层其特征节点数为γ=β/2=α/4。

为了保证训练的一般性,本发明将所有的正负样本数据打乱顺序后,全部带入训练模型,采用反馈型神经网络的训练方法即可得到自编码特征模型的参数W(1),W(2),b(1),b(2)

最后,采用训练完成的特征自编码模型,将所有的训练样本带入此模型得到s层的自编码特征。

2)分类模型:

将上一步得到的自编码特征带入两类别核支持向量机进行分类训练,在带入训练时,正样本的分类标签为+1,负样本的分类标签为-1。其中,核采用非线性高斯核

最终可以训练得到核支持向量机的模型参数。

3、虫草的检测

首先,采集一幅可能包含冬虫夏草的场景图像,设其原始的尺寸为M×N,考虑到单一尺度的图像可能会导致检测不完全,所以本发明在多尺度情况下进行,对原始的M×N图像采用如图3所示的高斯金字塔进行下采样,每一层的采样比率为上一层的3/4,即采样后的图像大小为其中i为金字塔层号,第一层为0。

同样将每一层的图像分块为m×n的大小,将每一个分块带入图2所示的模型,采用训练好的参数W(1),W(2),b(1),b(2)计算出对应分块的s层特征,将此特征带入核支持向量机模型进行分类,即可得到此小块的类别。

如果该小块的类别为正,则记录高斯金字塔的尺度序号以及块序号为(i,c,d),作为标注位置,如果为类别为负,则不做处理。其中i为尺度序号,c,d分别为行与列方向上的块序号。

执行完所有的5层尺度的计算,统计所有检测到的标注位置及大小,采用四元组矩形框进行位置标注,矩形框的位置为其中前两个数字为起始位置,后两个数字为矩形框的长和宽。

最后,考虑到有可能在不同尺度下都检测到同一个目标,通过计算矩形框之间的被包含关系,将所有的被包含的矩形框位置进行剔除,并根据计算结果,在原始的M×N的图像上绘制出相应的矩形框,即为冬虫夏草的位置。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1