一种基于机器学习算法的树叶病害识别方法与流程

文档序号:16812949发布日期:2019-02-10 13:55阅读:734来源:国知局
一种基于机器学习算法的树叶病害识别方法与流程
本发明涉及计算机信息图像处理
技术领域
,更具体地说,涉及一种基于机器学习算法的树叶病害识别方法。
背景技术
:伴随着我国经济的不断高速发展,和人口快速的增长,我国的农业相应的也发展起来,水果已成为寻常百姓家中必备食品,由于水果需求很大,它的种植面积也在不断扩大。随着水果生产面积的增加,它的病害问题也逐渐引起专家的关注与重视,正确高效地识别果树的病害类型可以使果树得到及时的治疗,从而降低不必要的损失,增加果园的产量。当下,图像处理技术得到飞速发展,同时在生活及生产上的应用也逐渐普及。于是图像识别技术在农业领域的应用也使得农作物病害的治理和防治取得了极大的改善。对果树树叶的病害图像进行快速辨别,主要涉及到对图像采集、图像预处理、图像分割、图像特征提取、图像分类识别等方面进行研究与实现,且取得了不错的成果。经检索,mohammede1-helly等(2004)开发了一个全面的图像处理系统,可以自动检测叶斑以确定疾病类型。该系统使用人工神经网络作为分类器来识别黄瓜白粉病,霜霉病和叶害虫。但该方法计算量较大,时间消耗多,算法性能较差。2015年,中国专利申请号:cn104422660a,公开日为2015年3月18日,公开了一种高光谱的植物叶片病虫害诊断系统,包括高光谱成像仪、镜头、标定白板、样本放置平台、线光源、线光源支持壁、电控位移台、移动平台控制装置、暗箱、可调支架脚和计算机。高光谱成像仪和线光源一起固连在电控位移台上,受移动平台控制装置控制一起移动;在移动过程中线光源照射标定白板和被测植物叶片,高光谱成像仪采集数据并实时上传到计算机;经过图像分析和处理软件处理后,输入已经建立的病虫害三重诊断模型,实时定量得到植物的病虫害感染程度,据此分析决策是否对测量植物喷药以及用药种类剂量及喷头形式。该申请案主要用于快速地诊断植物的病虫害感染程度,对提高精准施药的决策水平、实现精细农业起到积极作用。但该申请案的不足之处是,无法对不同病虫害进行区分。2015年,中国专利申请号cn201510321137.1,申请日为2015年6月11日,发明创造名称为:融合光谱和图像信息的作物病虫害识别和区分方法,该申请案基于光谱和图像信息处理技术获取光谱图像数据,之后进行叶片区域与背景分离、病虫伤斑提取、光谱特征和图像特征计算。最终使用费氏线性判别分析模型输出叶片的病虫害类型。该申请案可以有效地对不同类型病虫害进行识别,为农药施用管理和病虫害绿色防控提供科学决策的依据。但该申请案所用光谱图像需要专业人员获取且设备昂贵,不利于推广运用。技术实现要素:1.发明要解决的技术问题传统的果树树叶病害治理的方法主要依靠果农或者农业专家亲自到果园里查看果树的生长状况,这种方法通过人眼判断果树的生长状况和病害,因而识别的结果会存在一定的误差,同时也耗时耗力。为了克服上述问题,本发明提出了一种基于机器学习算法的树叶病害识别方法;本发明可以通过计算机自动识别不同类型果树树叶病害,较大地减少空间和时间开销,同时也提高了识别精度;针对采集的样本图像质量参差不齐,图像特征不够突出,本发明对样本图像进行了预处理,从而使样本便于后续工作的进行;针对样本图像表现的纹理差异不明显,不便于纹理特征提取,本发明对预处理后的图像采用自适应阈值算法进行图像分割,从而很好地凸显样本图像的纹理特征;针对支持向量机(svm)模型在默认参数下无法满足识别要求,本发明结合交叉验证算法利用网格寻优法获取svm模型的最优参数,从而达到最佳效果,为果病害防止提供支持。2.技术方案为达到上述目的,本发明提供的技术方案为:本发明的一种基于机器学习算法的树叶病害识别方法,其步骤为:1)采集树叶样本图像,共收集健康图像和病害图像各一百幅,并对图像进行预处理;2)采用自适应阈值分割法对预处理后的样本图像进行分割,突出样本图像的纹理特征;3)基于rgb颜色空间提取样本图像的颜色特征和分割图像的纹理特征;4)提取出所有样本图像的特征,设为样本特征集m,采用交叉验证的方法构建svm分类模型;5)利用网格寻优法寻找最优参数,所述参数为惩罚因子c和核参数g;6)利用步骤5)寻找的最优参数,即可得到最优的svm分类模型,将测试样本图像输入到训练好的svm分类模型,得到识别结果。更进一步地,步骤1)所述的图像预处理过程为:首先对样本图像大小进行尺寸调整和灰度化处理,调整尺寸为100*100,然后使用直方图均衡化算法对灰度图像进行图像增强操作,最后采用中值滤波算法对图像进行去噪处理。更进一步地,所述的图像增强操作过程为:首先将原图像的像素灰度值归一化并统计各灰度级的分布概率,然后利用累积变换函数对归一化的灰度值进行变换并按照相同的灰度级将其转换为标准的灰度值,从而得到经均衡化处理后的新图像。更进一步地,步骤2)对样本图像进行分割的过程为:设定图像在像素点(a,b)处的灰度值为k(a,b),以像素点(a,b)为中心的b×b窗口,其中b表示窗口的边长,c表示差值,计算图像中各个像素(a,b)的阈值v(a,b),计算公式如下:对图像中各个像素点(a,b)用v(a,b)值逐点进行二值化:更进一步地,步骤3)所述的颜色特征包括rgb三个通道的均值、方差、偏度、峰度、熵和梯度六个特征,纹理特征包括角二阶矩asm、熵ent、对比度con和逆差阵idm。更进一步地,步骤3)所述的颜色特征表示如下:a.均值:b.方差:c.偏度:d.峰度:e.熵:f.梯度:上式中,p(k)表示在图像中像素灰度值为k的分布概率,nk为其频数,n为像素总数,l为灰度级数,为均值,δ2为方差,kk为偏度,kf为峰度,ke为熵,m×n表示图像的大小,表示灰度值为k的像素在水平方向的梯度,表示灰度值为k的像素在垂直方向的梯度,kg为其平均梯度。更进一步地,步骤3)所述的纹理特征表示如下:a.角二阶矩(asm):b.熵(ent):c.对比度(con):d.逆差阵(idm):其中,g(i,j)为灰度共生矩阵中的元素,l为灰度级数。更进一步地,步骤4)中所述svm分类模型的核函数为径向基核函数:其中,核参数g代表核函数的宽度。更进一步地,步骤5)中所述的惩罚因子c和核参数g的默认值分别为500和0.5。更进一步地,步骤5)中寻找到的惩罚因子c和核参数g的最优值是7000和0.006。3.有益效果采用本发明提供的技术方案,与已有的公知技术相比,具有如下显著效果:(1)本发明的一种基于机器学习算法的树叶病害识别方法,在图像预处理过程中首先对尺寸调整后的图像进行灰度化和图像增强处理,然后使用中值滤波算法对图像进行去噪处理。经过该处理后,可以改善图像质量、丰富图像信息,加强图像观感和提高图像识别效果。(2)本发明的一种基于机器学习算法的树叶病害识别方法,在图像分割中使用自适应阈值分割算法能很好的将样本图像中的健康图像和病害图像在纹理表达上有效区分,经过图像分割,为后续的样本图像的纹理特征提取提供了有利条件。(3)本发明的一种基于机器学习算法的树叶病害识别方法,在特征提取中基于rgb颜色空间提取样本图像的颜色特征,并用分割后的样本图像生成灰度共生矩阵,从而提取其纹理特征,经过特征提取,将样本图像转化为表征图像的特征值,为后面的样本图像分类模型的训练提供了必要条件。(4)本发明的一种基于机器学习算法的树叶病害识别方法,在图像识别中通过交叉验证算法对svm模型进行训练和测试,并使用网格寻优法获取svm模型的最优参数,经过该训练后,可以达到最佳的识别效果。附图说明图1为本发明的一种基于机器学习算法的树叶病害识别方法的流程图;图2为本发明实施例1中所述苹果树叶灰度图像(病害图像);图3为图2图像的增强效果图;图4为图3中值滤波后的去噪图像;图5为图4自适应阈值分割后的效果图;图6为图2经预处理与自适应阈值分割后的效果图;图7为本分类模型判断为生病的效果图;图8为本分类模型判断为健康的效果图。具体实施方式为进一步了解本发明的内容,结合附图和实施例对本发明作详细描述。实施例1结合图1,本实施例的一种基于机器学习算法的树叶病害识别方法,以对苹果树叶进行病害识别为例,对病害图像进行识别的步骤如下:1)图像预处理:采集苹果树叶样本图像,所述样本图像包含健康和病害图像,病害图像中含有病害区域和一定的健康区域,只要含有病害区域的样本图像即可认定为病害图像,本实施例共收集了健康图像和病害图像各一百幅,并对这些图像进行预处理。所述图像预处理过程为:首先对样本图像大小进行尺寸调整和灰度化处理,获得如图2所示的灰度图,调整尺寸为100*100,然后使用直方图均衡化算法对灰度图像进行图像增强操作,所述的图像增强操作过程为:首先将原图像的像素灰度值k归一化得到rk并计算各灰度级的分布概率p(rk),然后利用累积变换函数t(·)对归一化的灰度值rk进行变换得到sk并按照相同的灰度级将其转换为标准的灰度值,从而得到经均衡化处理后的新图像,进行图像增强获得的效果如图3所示,经过上述处理后可以提高图像的对比度,丰富图像的细节。所述累积变换函数如下:上式中n为像素总数,nj为不同灰度级的像素数目,l为灰度级数,j=0,1,...,k。最后采用中值滤波算法进行去噪处理,得到如图4所示的去噪图像,经过去噪处理后,在滤除噪声的同时,最大程度的保留了图像的细节与轮廓。2)图像分割:在分割算法中设定图像在像素点(a,b)处的灰度值为k(a,b),以像素点(a,b)为中心的b×b窗口,其中b表示窗口的边长,c表示差值,计算图像中各个像素(a,b)的阈值v(a,b),计算公式如下:对图像中各个像素点(a,b)用v(a,b)值逐点进行二值化:对去噪后的图像进行自适应阈值分割得到如图5所示的效果图以及对健康图像经步骤1)和步骤2)得到如图6所示的效果图。从图5和图6对比可以看出,健康的分割图像纹理分布均匀,纹理基元较小,而病害的分割图像纹理分布错乱,纹理基元较大,这表明样本图像经步骤1)和步骤2)后纹理特征被有效表征。3)图像特征提取:利用步骤2)所述的领域自适应阈值分割算法对步骤1)预处理后的苹果树叶图像进行分割,凸显健康图像和病害图像的纹理特征。首先基于rgb颜色空间,选用苹果树叶病害图像的颜色特征中的颜色矩,根据苹果树叶病害图像归一化后的灰度值分别提取r,g,b三个通道的均值,方差,偏度,峰度,熵,梯度六个特征值,每一个特征值,其在数字图像处理中都代表了图片某一方面的特点。然后根据图像亮度分布规律及相似亮度的像素空间位置特点,在步骤3)分割后的样本图像中统计按照一定方向和距离且灰度值分别为i-1与j-1的像素组合出现的频数记为g(i,j),其中i=1,2,...,l,j=1,2,...,l,进而生成灰度共生矩阵g,从而提取其二阶矩(asm)、熵(ent)、对比度(con)和逆差阵(idm)等纹理特征。所述的六个颜色特征描述如下:a.均值(mean):反映了图像的亮度,均值越大说明图像亮度越大,反之越小。b.方差(variance):是一种衡量样本分布均匀性的尺度标准。c.偏度(skewness):描述的是样本总体取值分布的对称性,即图像的扭曲度。d.峰度(kurtosis):描述的是样本的峰值陡峭或平缓程度。e.熵(entropy):它表征图像中灰度分布的聚集特征所包含的信息量。f.梯度(gradient):描述图像灰度值的变化快慢的情况。其中,p(k)表示在图像中像素灰度值为k的分布概率,nk为其频数,n为像素总数,为均值,l为灰度级数,δ2为方差,kk为偏度,kf为峰度,ke为熵,m×n表示图像的大小,表示灰度值为k的像素在水平方向的梯度,表示灰度值为k的像素在垂直方向的梯度,kg为其平均梯度。所述的四个纹理特征描述如下:a.角二阶矩(asm):用来衡量灰度分布是否均匀和纹理的宽度,当图像纹理较窄、灰度分布均匀时,值较大,反之,较小。b.熵(ent):描述图像具有的信息量和信息复杂程度,当复杂程度高时,熵值较大,反之则较小。c.对比度(con):描述一幅图像灰度值最大和最小之间的量度,即指灰度值的反差情况。反差越大代表对比越大,反差越小代表对比越小。d.逆差阵(idm):描述图像纹理可分辨程度和是否周期呈现。易于分辨,规律性强的,则值大,反之值较小。其中,g(i,j)为灰度共生矩阵中的元素,l为灰度级数。4)重复上述步骤提取出所有样本图像的特征,设为样本特征集m;5)图像分类模型训练:采用交叉验证的方法即将样本特征集m分为n个子集,随机选取其中的n-1个子集来训练svm分类模型,剩下的1个子集用来测试。在模型训练中需要优化的参数主要有两个,分别是惩罚因子(c)和核参数(g),利用网格寻优法寻找最优参数。本实施例中svm的核函数为径向基核函数(rbf):其中,核参数g代表核函数的宽度。所述的惩罚因子(c)和核参数(g)的默认值是500和0.5。寻找到的惩罚因子(c)和核参数(g)的最优值是7000和0.006。6)苹果树叶病害分类识别:利用步骤5)寻找的最优参数,即可得到最优的svm分类模型,将测试样本图像输入到训练好的svm分类模型,得到如图7和图8所示的识别结果。本实施例对苹果树叶病害识别的预测时间和识别准确率详见表1,由表1中数据可以看出本实施例的准确率达到了96.67%,同时预测时间也可以满足实时性要求。表1测试图像识别结果表参数值预测时间识别准确率默认参数3ms83.33%最优参数2.3ms96.67%以上示意性的对本发明及其实施方式进行了描述,该描述没有限制性,附图中所示的也只是本发明的实施方式之一,实际的结构并不局限于此。所以,如果本领域的普通技术人员受其启示,在不脱离本发明创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本发明的保护范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1