一种基于图像特征提取的树木病虫害图片分类方法与流程

文档序号:30212559发布日期:2022-05-31 12:19阅读:217来源:国知局
一种基于图像特征提取的树木病虫害图片分类方法与流程

1.本发明属于图片识别处理领域,具体涉及一种基于图像特征提取的树木病虫害图片分类方法。


背景技术:

2.树木病虫害的识别是对树木进行保护和利用的基础,传统的病虫害识别方式通常是农业专家及技术人员借助光学显微镜目视的方式进行观测识别,这种传统方法存在效率较低、极度依赖观测人员的经验、成本较高等缺点。随着机器学习等相关技术的发展,在人工标注的图像样本的基础之上训练机器学习分类模型来对树木病虫害图像进行分类具有可行性。
3.主流的机器学习图像分类模型能否取得较好识别效果的关键在于图像特征的提取,关于图像特征提取,业界主流的方法是对图像中物体的边缘轮廓等特征进行提取;但这种方法分类结果的独立性不好,影响树木病虫害图像识别地准确率。


技术实现要素:

4.针对现有技术的以上缺陷或改进需求,本发明要解决的是方法是对图像中物体的边缘轮廓等特征进行提取;但这种方法分类结果的独立性不好,影响树木病虫害图像识别地准确率的问题。
5.为了实现上述目的,本发明涉及一种基于图像特征提取的树木病虫害图片分类方法,包括如下步骤:步骤1:对树木病虫害图像数据进行采集和存储;步骤2:对步骤1中的树木病虫害图像数据的病虫害类别进行人工标注;步骤3:将步骤1采集的多张树木病虫害图像的灰度向量及其类别标注值构成原始的全量数据集;步骤4:选取m个不同的机器学习算法,对其中的每个机器学习算法都依次执行4个步骤:通过放回抽样构造新的训练集、寻找最优参数、训练图像分类模型、使用图像分类模型为原始的全量数据集的每张图像提取1个新的数值特征;m个机器学习算法并行地执行上述流程为原始的全量数据集的每张图像提取了m个新的数值特征;步骤5:以图像的灰度值向量以及m个新的数值特征作为输入,以病虫害类别标注值作为输出,在原始的全量数据集上使用多层感知机神经网络算法训练最终的病虫害类别分类模型;步骤6:对树木病虫害图像的病虫害类别进行预测。
6.进一步的,所述步骤1的具体方法为:从自然界中通过图像传感器采集总共n张各种类型的树木病虫害图像,将这n张图像分别记为χ1,χ2,

,χn,所有图像的像素都是h
×
w,每张图像都有3个通道,按照红绿蓝的顺序进行存储,每个通道都对应着一个h行w列的灰度矩阵。
7.进一步的,所述步骤2的具体方法为:设病虫害的类别总共有c种,c种病虫害类别用1,2,

,c这c个整数表示,步骤1中n张各种类型的树木病虫害图像的病虫害类别已经被人工标注,类别标注整数值分别是y1, y2,
ꢀ…
, yn,则y1, y2,

, yn均属于集合{1,2,

,c}。
8.进一步的,所述步骤3的具体方法为:设步骤1中n张各种类型的树木病虫害图像中的任一病虫害图像在数学上都对应着3个h行w列的灰度矩阵ri,gi,bi,将这三个矩阵依次按行展开成3个灰度值向量,每个向量的长度都是h
×ꢀ
w,再把这三个向量拼接成一个长度为3
×h×
w的灰度值向量,将这个长为3
×h×
w的灰度值向量记为xi,类别标注值记为yi,图像的记号与图像对应的灰度值向量一一对应;n张各种类型的树木病虫害图像的灰度向量及其类别标注值构成原始的全量数据集:。
9.进一步的,所述步骤4的具体方法为:使用m种不同的机器学习算法并行地训练图像分类模型,要求这m种机器学习算法均不是多层感知机神经网络分类模型;将这m种机器学习算法分别记为;针对选择的m种机器学习算法中的某个特定算法:,为该算法构造训练集、选择最优参数、基于最优参数训练模型的流程是:第一步,构造训练集;设定放回抽样的次数是l,初始化新的训练集为空集,循环执行抽样操作l次,每次执行抽样操作时,都从 中随机地选择一个样本,将该样本复制一份并追加到新训练集s中;l次抽样操作都执行完成后,新训练集s的样本容量为l;第二步,选择最优参数;针对机器学习分类算法,j=1,2,
ꢀ…
,m为其构造算法参数搜索集合w,w中的每个元素都是与算法相匹配的参数;基于w中的不同参数来训练算法,最终的分类准确率是不一样,为此需要从w中找到一个使得分类准确率最高的参数;将中的样本随机的切分成占比75%的训练集和占比25%的验证集,对于w中的每个参数,使用该参数在训练集上训练模型,在验证集上计算分类准确率,筛选出使得验证集上分类准确率最高的那个参数,将其记为;
第三步,基于最优参数训练模型;使用参数在上训练树木病虫害分类模型,得到一个病虫害类别分类函数
ꢀꢀ
,自变量x代表长度为3
×h×
w的灰度值向量变量,分类函数的输出值是一个代表病虫害类别的整数值;将上述包含3个步骤的流程作用在所有的m种算法上,最终得到m个病虫害类别分类函数:;将n张各种类型的树木病虫害图像的灰度值向量xi,i=1,2,

,n,输入进m个病虫害类别分类函数中,则为第i张图像新增了m个特征:。
10.进一步的,所述步骤5的具体方法为:对于n张各种类型的树木病虫害图像的灰度值向量xi及类别标注值yi,,将每张图像的灰度值向量与m个新增的特征s
i,1
, s
i,2
,
ꢀ…
,s
i,m
, i=1,2,
ꢀ…
,n拼接成一个新的输入向量,的具体构造如下:;使用多层感知机神经网络算法mlp以及匹配的参数w
mlp
,在训练集
,
yi,i=1,2,
ꢀ…
,n上训练多层感知机图像分类函数f
mlp
(w
mlp
,x),自变量x代表长度为3
×h×
w的灰度值向量,分类函数的输出值是一个代表病虫害类别的整数值。
11.进一步的,所述步骤6的具体方法为:对于一张新采集且病虫害类别未知的树木病虫害图像x
new
,通过裁剪缩放使得其像素是h
×
w,裁剪缩放后的图像对应着3个h行w列的灰度矩阵r
new
,g
new
,b
new
,将这三个矩阵依次按行展开成3个灰度值向量,每个向量的长度都是h
×
w,再把这三个向量拼接成一个长度为3
×h×
w的灰度值向量,将这个长为3
×h×
w的灰度值向量也记为x
new
,将x
new
输入m个病虫害分类函数: 中,为该图
像新增了m个特征:将x
new
与m个新增的特征拼接成一个新的输入向量:;将输入多层感知机图像分类函数
ꢀꢀ
中,则这张新采集且病虫害类别未知的树木病虫害图像的病虫害类别由下式给出:。
12.总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:本发明的基于图像特征提取的树木病虫害图片分类方法,使用集合分类模型对树木病虫害图像提取多个新的特征,通过放回随机抽样确保不同的新特征之间是相互独立的,可提高树木病虫害图像识别的准确率。
附图说明
13.图1为本发明较佳实施例的流程示意图。
具体实施方式
14.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
15.请参考图1,本发明涉及一种基于图像特征提取的树木病虫害图片分类方法,具体包括如下步骤:(1)树木病虫害图像数据集的标注从自然界中通过图像传感器采集总共n张各种类型的树木病虫害图像,将这n张图像分别记为χ1,χ2,

,χn,所有图像的像素都是h
×
w,每张图像都有3个通道,按照红绿蓝的顺序进行存储,每个通道都对应着一个h行w列的灰度矩阵。
16.设病虫害的类别总共有c种,c种病虫害类别用1,2,

,c这c个整数表示, n张各种

,自变量x代表长度为3
×h×
w的灰度值向量变量,分类函数的输出值是一个代表病虫害类别的整数值;将上述包含3个步骤的流程作用在所有的m种算法上,最终得到m个病虫害类别分类函数:;将n张各种类型的树木病虫害图像的灰度值向量xi,i=1,2,

,n,输入进m个病虫害类别分类函数中,则为第 i张图像新增了m个特征:。
[0019] (3)树木病虫害图像分类模型的训练对于n张各种类型的树木病虫害图像的灰度值向量xi及类别标注值yi,,在第(2)节中通过集合分类模型为每个病虫害图像新增m个新增的特征s
i,1
, s
i,2
,
ꢀ…
,s
i,m
,将每张图像的灰度值向量与m个新增的特征s
i,1
, s
i,2
,
ꢀ…
,s
i,m
, i=1,2,
ꢀ…
,n拼接成一个新的输入向量,的具体构造如下:;使用多层感知机神经网络算法mlp以及匹配的参数w
mlp
,在训练集
,
yi,i=1,2,
ꢀ…
,n上训练多层感知机图像分类函数f
mlp
(w
mlp
,x),自变量x代表长度为3
×h×
w的灰度值向量,分类函数的输出值是一个代表病虫害类别的整数值。
[0020] (4)树木病虫害图像类别的预测对于一张新采集且病虫害类别未知的树木病虫害图像x
new
,通过裁剪缩放使得其像素是h
×
w,裁剪缩放后的图像对应着3个h行w列的灰度矩阵r
new
,g
new
,b
new
,将这三个矩阵依次按行展开成3个灰度值向量,每个向量的长度都是h
×
w,再把这三个向量拼接成一个长度为3
×h×
w的灰度值向量,将这个长为3
×h×
w的灰度值向量也记为x
new
,将x
new
输入m个病虫害分类函数: 中,为该图像新增了m个特征:
使用第(3)节涉及到的方法,将x
new
与m个新增的特征拼接成一个新的输入向量:;将输入多层感知机图像分类函数
ꢀꢀ
中,则这张新采集且病虫害类别未知的树木病虫害图像的病虫害类别由下式给出:。
[0021]
相较于业界主流的做法,本方案创新性地提出了一种新的图像特征提取方法:使用多个机器学习分类算法在标注好的病虫害图像数据集上并行地训练,训练每个机器学习分类模型训练时,不直接使用原始的全量数据集,而是对原始全量数据集进行有放回的随机抽样,在又放回随机抽样得到的新数据集上再训练这个特定的机器学习分类模型。由于放回抽样的随机性,不同机器学习分类模型的训练集是不同的,确保了分类结果的独立性。
[0022]
将一张病虫害图像输入进训练完成后得到的多个图像分类函数中,得到若干个分类结果,将这些分类结果看作新的特征,则新特征的数量与并行训练的机器学习分类算法的数量一致。将这若干个新的特征结合图像的灰度值向量作为新的输入数据,训练神经网络分类模型,最终得到树木病虫害图像分类模型。
[0023]
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1