本发明涉及计算机软件,具体涉及一种枯叶病预测模型构建方法、设备、系统及存储介质。
背景技术:
1、苹果树枝枯病是首先在苹果树上发现,定名为苹果树枝枯病。在蔷薇科果树上都有不同程度的发生。苹果树枝枯病是由朱红丛赤壳菌侵染所引起的、发生在苹果树上的病害。主要危害苹果大树上衰弱的枝梢,多在结果枝或衰弱的延长枝前端形成褐色不规则凹陷斑,病斑上散生小黑点,即病菌的分生孢子器。发病后期病部树皮脱落,木质部外露,严重的枝条枯死。
2、病菌以菌丝和分生孢子器在病部越冬。天气潮湿或降雨时,从孢子器中释放出分生孢子,借风雨传播。病菌为弱寄生菌,只有在枝条很弱且有伤口时,才能侵染、发病。发病原因为:(1)清园不彻底:病菌在枯枝上越冬,次年春季病菌借风力、昆虫、雨水传播。(2)管理不到位:一是水肥不足,使树体衰弱;二是土壤板结,根系发育不良,吸收功能降低;三是管理过程中由于操作不慎造成机械伤口,有利于病菌侵入;四是晚霜冻害。(3)园内荫蔽,通风透光不良,枝条生长嫩弱。
3、传播途径途径为:病菌可在病树上越冬,翌年春季经花器、自然孔(气孔、皮孔、水孔)或伤口侵入。②果园内传播。病菌可借风雨、昆虫(如蜜蜂、介壳虫、蚜虫)、鸟类和修剪工具等。③远距离传播,主要是易感寄主材料的转移,包括幼苗、接穗、砧木、水果、被污染的运输工具及候鸟等。
4、苹果树枝枯病完全消灭是不可能的,会长期共存。因此通过提高果树自身抗性抑制枝枯病的发展是最佳的解决方案。
5、目前,由于能够采集到的苹果树枝枯病数据集太小,无法产生对参数有效的估计。特别是能够导致苹果树枝枯病的属性太多,而样本太少的时候,很容易产生过拟合。一般来说样本集的数据数量小于50个时,无法划分足够的训练集和验证集,并且数据中往往还有许多缺失值需要不断补全,导致现有的采用机器学习的预测模型在预测苹果树枝枯病的发病率时误差较大。
技术实现思路
1、针对现有技术中的技术缺陷,本发明实施例的目的在于提供一种枯叶病预测模型构建方法、设备、系统及存储介质,用工具变量补齐枯叶病数据集中的缺失值,进行数据清洗和数据增强,产生足够多的数据作为训练样本,然后利用训练样本做神经网络拟合和各种机器数据学习拟合获取枯叶病预测模型。
2、为实现上述目的,第一方面,本发明实施例提供了一种枯叶病预测模型构建方法,包括:
3、s1:获取枯叶病数据集h:{x,y},其中,x:{x}是茎和叶的微量元素含量,为自变量,y:{y}是枯叶病发病率,为因变量;
4、s2:按预设方法对所述枯叶病数据集进行增强处理,获取训练样本;
5、s3:利用所述训练样本对机器学习模型进行训练,获取枯叶病预测模型。
6、进一步,在步骤s1中,同时获取枯叶病数据集、验证样本和与所述枯叶病数据集对应的相关随机序列,所述相关随机序列为其它环境数据;
7、且步骤s3之后还包括:
8、s4:将所述验证样本输入所述枯叶病预测模型,验证所述枯叶病预测模型有效性。
9、进一步,按预设方法对所述枯叶病数据集进行增强处理,获取训练样本,包括:
10、s21:用对角线法递归并发现第n个相关随机序列的递归可枚举函数作为可能工具变量z:{z},n≥1,n为正整数;
11、s22:若z:{zi}不能通过对称性条件φ检查,取n=n+1,重新执行步骤s21,其中,{zi}为z的幂次集,i为正整数;
12、s23:若z:{zi}能通过对称性条件φ检查,将可能工具变量z:{z}作为工具变量;
13、s24:用工具变量z:{z}对x:{x}进行逆向拟合,得到z:{z}到x:{x}的过拟合关系θ-1;用y:{y}到工具变量z:{z}进行逆向拟合,获取y:{y}到z:{z}的过拟合关系γ-1;
14、s25:根据过拟合关系θ-1和过拟合关系γ-1,从数据y:{y}求出数据x:{x}里的缺失项,得到完整的数据集h:{x,y};
15、s26:用分段插值的方法或者高斯混合模型获得因变量y的随机分布,产生预设数量的因变量数据y:{y产生};使用过拟合关系γ-1计算出预设数量的工具变量数据z:{z产生};使用过拟合关系θ-1计算出预设数量的自变量数据x:{x产生};
16、s27:若z:{z产生i}不能通过对称性条件φ检查,取n=n+1,重新执行步骤s21,其中,{z产生i}为z产生的幂次集,i为正整数;
17、s28:若z:{z产生i}能通过对称性条件φ检查,将自变量数据x:{x产生}和因变量数据y:{y产生}作为训练样本。
18、进一步,步骤s4之后还包括:
19、s5:若所述枯叶病预测模型有效性小于预设的阈值,取n=n+1,重新执行步骤s21。
20、第二方面,本发明实施例还提供了一种枯叶病预测模型构建设备,包括:
21、数据获取模块,用于获取枯叶病数据集h:{x,y},其中,x:{x}是茎和叶的微量元素含量,为自变量,y:{y}是枯叶病发病率,为因变量;
22、训练样本获取模块,用于按预设方法对所述枯叶病数据集进行增强处理,获取训练样本;
23、模型构建模块,用于利用所述训练样本对机器学习模型进行训练,获取枯叶病预测模型。
24、进一步,所述数据获取模块用于同时获取枯叶病数据集、验证样本和与所述枯叶病数据集对应的相关随机序列,所述相关随机序列为其它环境数据;
25、所述设备还包括:
26、模型验证模块,用于将所述验证样本输入所述枯叶病预测模型,验证所述枯叶病预测模型有效性。
27、进一步,所述训练样本获取模块具体用于执行以下步骤:
28、s61:用对角线法递归并发现第n个相关随机序列的递归可枚举函数作为可能工具变量z:{z},n≥1,n为正整数;
29、s62:若z:{zi}不能通过对称性条件φ检查,取n=n+1,重新执行步骤s61,其中,{zi}为z的幂次集,i为正整数;
30、s63:若z:{zi}能通过对称性条件φ检查,将可能工具变量z:{z}作为工具变量;
31、s64:用工具变量z:{z}对x:{x}进行逆向拟合,得到z:{z}到x:{x}的过拟合关系θ-1;用y:{y}到工具变量z:{z}进行逆向拟合,获取y:{y}到z:{z}的过拟合关系γ-1;
32、s65:根据过拟合关系θ-1和过拟合关系γ-1,从数据y:{y}求出数据x:{x}里的缺失项,得到完整的数据集h:{x,y};
33、s66:用分段插值的方法或者高斯混合模型获得因变量y的随机分布,产生预设数量的因变量数据y:{y产生};使用过拟合关系γ-1计算出预设数量的工具变量数据z:{z产生};使用过拟合关系θ-1计算出预设数量的自变量数据x:{x产生};
34、s67:若z:{z产生i}不能通过对称性条件φ检查,取n=n+1,重新执行步骤s61,其中,{z产生i}为z产生的幂次集,i为正整数;
35、s68:若z:{z产生i}能通过对称性条件φ检查,将自变量数据x:{x产生}和因变量数据y:{y产生}作为训练样本。
36、第三方面,本发明实施例还提供了一种枯叶病预测模型构建系统,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如第一方面所述的方法。
37、第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如第一方面所述的方法。
38、实施本发明实施例提供的枯叶病预测模型构建方法,先用工具变量补齐枯叶病数据集中的缺失值,进行数据清洗和数据增强,产生足够多的数据作为训练样本,然后利用训练样本做神经网络拟合和各种机器数据学习拟合获取枯叶病预测模型。由于训练样本足够大,所获得的枯叶病预测模型的有效性更高,预测结果更加准确。