一种基于机器学习与图像处理的土壤质地检测方法及装置

文档序号:32757565发布日期:2022-12-31 05:00阅读:66来源:国知局
一种基于机器学习与图像处理的土壤质地检测方法及装置

1.本发明涉及农业土壤检测技术领域,具体涉及一种基于机器学习与图像处理的土壤质地检测及装置。


背景技术:

2.土壤质地是土壤重要物理性质之一,土壤质地综合反映土壤的物理状况,是土壤最基本的性状。土壤质地与土壤中的水、肥、气、热和土壤供肥能力有着密切关系。土壤是植物根系的生长环境,土壤质地主要影响作物的根系分布,影响着植物的生长发育。
3.土壤质地按照土壤中径粒大小的含量进行分类,按照美国土壤质地分类方法,可采用三角坐标图解法,等边三角形的三条边分别代表黏粒(<0.002mm)、粉粒(0.002~0.05mm)及砂粒(0.05~2mm)的含量(%)。其中,砂质土壤的通透性良好,大孔隙多,小孔隙少,孔隙中经常充满空气,易干旱,保肥性差;黏质土壤土粒间孔隙小,通气透水性差,易积水,耕性差。
4.现有技术对土壤质地进行检测,通常采用的是比重计方法,在检测时,需要技术人员在所预设的沉降时间到达后,及时读取并记录比重计上读数。预设的沉降时间有多组,技术人员在获取相应的比重计读数时需要等候进行记录;在这个过程中,实验等候时间长,且费时费力,当样本土样种数较多时,更加复杂,极易出错。


技术实现要素:

5.本发明的目的在于克服上述存在的问题,提供一种基于机器学习与图像处理的土壤质地检测方法,该方法基于图像处理对土壤表面的信息进行特征,基于机器学习建立土壤质地检测模型,实现对土壤质地各含量的快速检测,检测效率高。
6.本发明的另一个目的在于提供一种基于机器学习与图像处理的土壤质地检测装置。
7.本发明的目的通过以下技术方案实现:
8.一种基于机器学习与图像处理的土壤质地检测方法,包括以下步骤:
9.(1)通过图像采集装置对已知土壤质地数据的土壤样本进行图像采集;
10.(2)图像处理模块对图像进行处理,获取土壤样本表面的图像特征数据;
11.(3)以8∶2的比例将土壤样本的图像特征数据随机划分为训练集和测试集;
12.(4)特征工程数据处理模块对训练集和测试集的图像特征数据进行标准化处理,使得不同的图像特征数据具有相同的尺度;
13.(5)使用遗传算法对图像特征数据进行特征选择,筛选出较优的特征,去除较差的特征,从而达到最优的结果,得到最优的特征;
14.(6)回归模型模块利用bp神经网络,以土壤样本的土壤质地数据的准确值作为目标,对训练集进行训练得到土壤质地检测的回归模型,并通过测试集对回归模型进行评估,其得到的结果判断回归模型的优劣性;
15.(7)通过图像采集装置对待检测土壤进行图像采集,图像处理模块对图像进行处理,获取待检测土壤的图像特征数据,通过回归模型,计算出待检测土壤的土壤质地数据。
16.本发明的一个优选方案,其中,在步骤(1)中,将土壤样本置于检测箱中,利用工业相机,对土壤样本进行图像采集。
17.优选地,在步骤(2)中,图像特征数据包括颜色特征和纹理特征;图像处理模块对图像进行颜色特征和纹理特征进行提取,提取的颜色特征包括rgb颜色通道均值、hsv颜色通道均值以及lab颜色通道均值;提取的颜色特征纹理特征包括灰度共生矩阵以及灰度二值模式;对采集的所有图像的图像特征数据,构建土壤样本特征库。
18.优选的,在步骤(3)中,从土壤样本特征库中以8∶2的比例将土壤样本的图像特征数据随机划分为训练集和测试集。
19.优选地,在步骤(4)中,使用z-score标准化对图像特征数据进行标准化处理,经处理后,特征数据符合正态分布,其公式如下:
[0020][0021]
式中:x
*
为标准化后的图像特征数据;x为各特征参数的实际值;μ为某一特征变量的平均值;σ为某一特征变量的标准差。
[0022]
优选地,在步骤(5)中,使用遗传算法对图像特征数据进行特征选择,筛选出较优的特征,去除较差的特征,从而达到最优的结果,得到最优的特征的具体步骤为:将土壤质地数据作为优化目标,将标准化后的图像特征数据作为基因,并进行二进制编码,在二进制编码中,“0”和“1”的总数与单个样本中包含的特征总数相同,其中,基因“1”的个数即为要选择的特征个数,将选择的特征生成特征子集;然后随机生成初始群体;遗传算法中的适应度函数用来判断种群中个体的优劣程度,采用bp神经网络中关系系数r2作为适应度函数;在遗传算法运行中,当最优特征组合的适应度值结果不再上升时,终止运行,输出最优特征;否则,基因则继续进行选择、交叉和变异。
[0023]
优选地,在步骤(6)中,bp神经网络的训练模型共设置了4层,分别为输入层、第一层隐藏层、第二层隐藏层以及输出层,其中,第一层隐藏层设置了200个节点,第二层隐藏层设置了100个节点,输出层的输出结果为3个变量,第一个变量为土壤样本的黏粒的含量,第二个变量为土壤样本的粉粒的含量,第三个变量为土壤样本的砂粒的含量。
[0024]
优选地,在步骤(6)中,使用随机梯度下降法对bp神经网络的权值进行寻优求解,迭代次数为1000次。
[0025]
一种基于机器学习与图像处理的土壤质地检测装置,包括用于采集土壤样本图像的图像采集装置、用于对图像进行处理从而获得图像特征数据的图像处理模块、用于对图像特征数据进行标准化处理的特征工程数据处理模块、利用遗传算法对图像特征数据进行特征选择的特征选择模块以及用于建立回归模型的回归模型模块;其中,所述图像采集装置与所述图像处理模块连接,所述图像处理模块与所述特征工程数据处理模块连接,所述特征工程数据处理模块与所述特征选择模块连接,所述特征选择模块与所述回归模型模块连接。
[0026]
优选地,所述图像采集装置包括检测箱、工业相机以及led光源,其中,所述检测箱为检测提供一个黑暗的环境,所述工业相机用于对检测箱中的土壤样本进行图像采集,并
将采集的图像发送至图像处理模块中,所述led光源为检测环境提供光源。
[0027]
优选地,图像处理模块通过opencv-python提取图像的颜色特征和纹理特征。
[0028]
本发明与现有技术相比具有以下有益效果:
[0029]
1、本发明中的基于机器学习与图像处理的土壤质地检测方法,通过对已知土壤质地数据的土壤样本进行图像采集,提取图像中的图像特征数据,对图像特征数据标准化处理后,通过遗传算法对图像特征数据进行特征选择,选择出较优的特征;用bp神经网络训练得到土壤质地检测的回归模型;通过能够对土壤质地检测预估模型,对后续土壤质地检测提供了一个检测模型;通过图像采集装置采集待检测土壤的图像,通过图像处理模块对图像进行图像特征数据提取,通过提取的图像特征数据作为变量输入就可以得到土壤质地数据,减少了训练所花费的时间;实现对土壤质地各含量的快速检测,检测效率高,大大减少了人力和物力。
[0030]
2、本发明中的基于机器学习与图像处理的土壤质地检测方法,使用遗传算法对图像特征数据进行特征选择,筛选较优的特征,使得结果达到最优,将选择较优的特征生成特征子集;利用bp神经网络对特征子集训练得到土壤质地检测的回归模型;通过遗传算法对提取特征进行特征选择优化,选取对训练模型有用的特征变量,提高了土壤质地的预测精度。
附图说明
[0031]
图1为本发明中的一种基于机器学习与图像处理的土壤质地检测装置的一种具体实施方式的结构示意图。
[0032]
图2为本发明中的土壤样本的图像特征数据提取流程示意图。
[0033]
图3为本发明中的遗传算法特征选择流程示意图。
具体实施方式
[0034]
为了使本领域的技术人员很好地理解本发明的技术方案,下面结合实施例和附图对本发明作进一步描述,但本发明的实施方式不仅限于此。
[0035]
实施例1
[0036]
参见图1-图3,本实施例公开了一种基于机器学习与图像处理的土壤质地检测方法,包括以下步骤:
[0037]
(1)通过图像采集装置对已知土壤质地数据的土壤样本4进行图像采集;
[0038]
(2)图像处理模块对图像进行处理,获取土壤样本4表面的图像特征数据;
[0039]
(3)以8∶2的比例将土壤样本的图像特征数据随机划分为训练集和测试集;
[0040]
(4)特征工程数据处理模块对训练集和测试集的图像特征数据进行标准化处理,使得不同的图像特征数据具有相同的尺度;
[0041]
(5)使用遗传算法对图像特征数据进行特征选择,筛选出较优的特征,去除较差的特征,从而达到最优的结果,得到最优的特征;
[0042]
(6)回归模型模块利用bp神经网络,以土壤样本的土壤质地数据的准确值作为目标,对最优特征的训练集进行训练得到土壤质地检测的回归模型,并通过最优特征的测试集对回归模型进行评估,其得到的结果判断回归模型的优劣性;
[0043]
(7)通过图像采集装置对待检测土壤进行图像采集,图像处理模块对图像进行处理,获取待检测土壤的图像特征数据,通过回归模型,计算出待检测土壤的土壤质地数据。
[0044]
在步骤(1)中,所述土壤样本4为土壤样本数据库中的土壤样本,该土壤样本的土壤质地数据为已知,即已知土壤样本的黏粒的含量、粉粒的含量以及砂粒的含量。
[0045]
参见图1,在步骤(1)中,将土壤样本4置于检测箱3中,利用工业相机1,对土壤样本4进行图像采集。
[0046]
参见图2,在步骤(2)中,图像特征数据包括颜色特征和纹理特征;图像处理模块对图像进行处理,获取土壤样本4表面的图像特征数据的具体步骤为:图像处理模块对图像进行颜色特征和纹理特征进行提取,提取的颜色特征包括rgb颜色通道均值、hsv颜色通道均值以及lab颜色通道均值;提取的颜色特征纹理特征包括灰度共生矩阵以及灰度二值模式;对采集的所有图像的图像特征数据,构建土壤样本特征库。
[0047]
参见图2,本实施例中,提取一张图像的特征为一组图像特征数据,一组图像特征数据总共有45个特征。土壤样本特征库中包含多组图像特征数据,土壤样本为多份,每份的土壤质地数据均不同,每份土壤样本可以采集一张图像,也可以采集多张图像。对特征进行标准化处理后,对其进行遗传算法的优化,选择对结果影响最大的土壤质地特征变量,最终获得19个特征变量。此处的45个特征参数分别是指r通道均值、g通道均值、b通道均值、h通道均值、s通道均值、v通道均值、l通道均值、a通道均值、b通道均值、灰度共生矩阵均值、灰度共生矩阵方差、灰度共生矩阵对比度、灰度共生矩阵熵、灰度共生矩阵能量、灰度共生矩阵逆方差、灰度共生矩阵相关性、灰度共生矩阵标准差、灰度共生矩阵同质性、灰度共生矩阵差异性、灰度二值模式(lbp)灰度1至26的像素量;最后获得19个特征包含g通道均值、r通道均值、h通道均值、l通道均值、灰度共生矩阵均值、灰度共生矩阵方差、灰度共生矩阵逆方差、灰度共生矩阵对比度、lbp灰度值为2、3、5、8、11、13、15、16、17、24、25的像素量。
[0048]
在步骤(3)中,从土壤样本特征库中以8∶2的比例将土壤样本的图像特征数据随机划分为训练集和测试集。具体地,从土壤样本特征库中以8∶2的比例将多组图像特征数据随机划分为训练集和测试集。如果采集了10张不同土壤样本的图像,提取了10组图像特征数据,将其中的8组图像特征数据作为训练集,2组图像特征数据作为测试集。
[0049]
在步骤(4)中,使用z-score标准化对图像特征数据进行标准化处理,经处理后,特征数据符合正态分布,其公式如下:
[0050][0051]
式中:x
*
为标准化后的图像特征数据;x为各特征参数的实际值;μ为某一特征变量的平均值;σ为某一特征变量的标准差。
[0052]
参见图3,在步骤(5)中,使用遗传算法对图像特征数据进行特征选择,筛选出较优的特征,去除较差的特征,从而达到最优的具体步骤为:将土壤质地数据作为优化目标,将标准化后的图像特征数据作为基因,并进行二进制编码,在二进制编码中,“0”和“1”的总数与单个样本中包含的特征总数相同,其中,基因“1”的个数即为要选择的特征个数,将选择的特征生成特征子集;然后随机生成初始群体;遗传算法中的适应度函数用来判断种群中个体的优劣程度,采用bp神经网络中关系系数r2作为适应度函数;在遗传算法运行中,当最优特征组合的适应度值结果不再上升时,终止运行,输出最优特征;否则,基因则继续进行
选择、交叉和变异。
[0053]
上述生成初始群体中,初始化种群尽量保证基因多样性。这里选择100个随机生成的个体作为初始化种群。
[0054]
参见图3,初始种群的设定完成后,进行适应度值评估检测。计算交换产生的新个体的适应度,适应度可以用来度量种群中个体的优劣程度,这里的适应度就是特征组合的判据值。具体的适应度函数如下,利用bp神经网络对提取的特征子集进行训练和测试,其中,训练集用于构建土壤质地检测的回归模型,而测试集用于验证回归模型的性能,当对测试集进行预测时,其关系系数r2越接近1,说明该个体越优。适应度值评估检测之后判断是否满足终止条件,这里设定当遗传算法选择的最优特征组合的适应度值结果不再上升时,终止运行,输出结果最优的特征;不满足终止条件的特征,进行基因操作,具体的基因操作如下:
[0055]
(a)选择;选择是为了从交换后的群体中选出优良的个体,使他们有更多的机会作为父代为下一代繁衍子孙。选择的原则是适应性强的个体(也就是r2越接近1的个体)为下一代贡献的概率大,选择实现了达尔文的适者生存原则。这里的选择算子选用的是锦标赛选择法,其核心思想是:在每次进化的过程中从父代中随机选取一定数量的个体,并在这些个体中选取适应度最高的个体进行遗传操作,对这一过程进行重复操作,直至子代种群与父代种群的规模相同。通过这一过程,极大的保持了种群的多样性;
[0056]
(b)交叉算子的设定;交叉算子是产生新的种群个体的主要操作方法,交叉算子使得遗传算法具有全局搜索能力;具体由交叉概率(pc)挑选的每两个父代通过将相异的部分基因进行交换,从而产生新的个体,得到的新一代个体,遗传了其父辈的优良特性。通常交叉概率的取值为0.5-0.9之间。这里的交叉概率(pc)设定为0.5;
[0057]
(c)变异;变异是以一定的概率(pm)随机地改变染色体中的某个基因值,变异为新的个体产生提供了机会。通常取值在0.001~0.01之间。这里的变异概率(pm)设定为0.05。
[0058]
步骤(6)中,利用bp神经网络对土壤质地建立检测的回归模型,在检测中,输入的最优特征参数作为标签,土壤样本4送至实验室检测得到的土壤质地数据的准确值作为目标进行模型的训练。bp神经网络的训练模型共设置了4层,分别为输入层、第一层隐藏层、第二层隐藏层以及输出层,其中,第一层隐藏层设置了200个节点,第二层隐藏层设置了100个节点,输出层的输出结果为3个变量,第一个变量为土壤样本4的黏粒的含量,第二个变量为土壤样本4的粉粒的含量,第三个变量为土壤样本4的砂粒的含量;输入层用于输入图像特征数据。使用随机梯度下降法对bp神经网络的权值进行寻优求解,迭代次数设置为1000次。
[0059]
如表1所示,表1中的mse是衡量“平均误差”的一种较方便的方法,mse可以评价数据的变化程度,mse的值越小,说明预测模型描述实验数据具有更好的精确度。通过对比分析,使用遗传算法对特征进行选择与bp神经网络结合和单纯使用bp神经网络的效果可知,本实施例使用经过遗传算法特征选择优化后的bp神经网络组合下的识别效率和稳定性有所提升。
[0060]
表1土壤质地预测评价表
[0061][0062]
经过上述模型建立后,采集待检测土壤的图像,提取特定的特征作为模型变量输入到模型中,就可以检测出待检测土壤的土壤质地数据。本实施例的基于机器学习和图像处理的土壤质地检测方法,结构简单、体积小、操作方便,省时省力,在线检测效果高,识别速度快。
[0063]
实施例2
[0064]
参见图1,本实施例公开了一种基于机器学习与图像处理的土壤质地检测装置,包括用于采集土壤样本4图像的图像采集装置、用于对图像进行处理从而获得图像特征数据的图像处理模块、用于对图像特征数据进行标准化处理的特征工程数据处理模块、利用遗传算法对图像特征数据进行特征选择的特征选择模块以及用于建立回归模型的回归模型模块;其中,所述图像采集装置与所述图像处理模块连接,所述图像处理模块与所述特征工程数据处理模块连接,所述特征工程数据处理模块与所述特征选择模块连接,所述特征选择模块与所述回归模型模块连接。
[0065]
所述特征工程数据处理模块、特征选择模块以及回归模型模块均为电脑上的app或者运行的程序。
[0066]
参见图1,所述图像采集装置包括检测箱3、工业相机1以及led光源2,其中,所述检测箱3为检测提供一个黑暗的环境,所述工业相机1用于对检测箱3中的土壤样本4进行图像采集,并将采集的图像发送至图像处理模块中,所述led光源2为检测环境提供光源。
[0067]
参见图1,所述led光源2为设置在检测箱3内壁的led灯带,所述检测箱3上设有用于放置土壤样本4的检测平台,所述工业相机1安装在检测箱3的顶部,工业相机1通过数据线连接电脑5,进行图像传输;电脑5中设有图像采集模块和图像处理模块,图像采集模块用于控制工业相机1拍照采集土壤样本4图像,图像处理模块通过opencv-python提取图像的颜色特征和纹理特征。
[0068]
上述为本发明较佳的实施方式,但本发明的实施方式并不受上述内容的限制,其他的任何未背离本发明的精神实质与原理下所做的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1