一种基于交叉分析优化手足口病传播决策树分类器的预测系统的制作方法

文档序号:36600218发布日期:2024-01-06 23:09阅读:11来源:国知局
一种基于交叉分析优化手足口病传播决策树分类器的预测系统的制作方法

本发明涉及传染病特别涉及一种基于交叉分析优化手足口病传播决策树分类器的预测系统。


背景技术:

1、在当前全球范围内,手足口病是一种常见的传染病,特别是在幼儿之间的传播率较高,手足口病的传播与多种因素相关,包括环境因素和社会因素以及病毒特性,因此,准确预测手足口病的传播趋势对于制定相应的预防和控制策略至关重要,然而,传统的手足口病传播预测方法存在一些问题,首先,数据的收集和处理方式相对较为简单,没有充分考虑环境因素和社会因素之间的交互影响,其次,现有的预测模型通常局限于单一的统计模型,缺乏强大的解释力和预测准确性,此外,现有模型在检验和优化方面也存在一定的不足,无法全面评估模型的性能。

2、基于以上特点,本发明提供了一种基于交叉分析优化手足口病传播决策树分类器的预测系统。


技术实现思路

1、本发明的目的在于提供一种基于交叉分析优化手足口病传播决策树分类器的预测系统,通过限定了手足口病传播过程中环境因素的取值范围,进行温度和湿度的环境因素与社会因素的交叉分析,依据决策树的分类特性,再通过基尼指数对决策树节点分类错误率进行评估,并使用交叉验证调节决策树参数,进而建立出手足口病传播预测模型,所建立的模型具有高稳定性、高精度和高泛化的能力。

2、为了达成以上目的,本发明采取的技术方案为:

3、一种基于交叉分析优化手足口病传播决策树分类器的预测系统,包括手足口病传播数据收集和处理模块,手足口病传播特征提取模块,建立手足口病传播预测模型模块,手足口病传播预测模型检验模块,手足口病传播预测模型优化模块。

4、手足口病传播数据收集和处理模块用于收集手足口病毒基于环境因素和社会因素传播过程中相关变量的数据,以及对收集的环境和社会因素的变量进行归一化处理;

5、手足口病传播特征提取模块用于提取对手足口病传播具有影响的特征;

6、建立手足口病传播预测模型模块用于使用提取的手足口病传播特征数据进行手足口病传播预测模型的训练;

7、手足口病传播预测模型检验模块用于检验手足口病传播预测模型的精度;

8、手足口病传播预测模型优化模块用于提升手足口病传播预测模型的精度。

9、进一步的,在手足口病传播数据收集和处理模块中,将收集的手足口病传播数据划分为训练集和验证集,训练集为70%,验证集为30%,其中,环境因素以温度、湿度和空气污染状况,在对温度和湿度进行数据处理前,对环境温度进行限定,温度范围为20-30℃,环境湿度进行限定,湿度范围为35-65%,其中,空气污染状况以空气pm2.5值作为数据,pm2.5值范围为20-35ug/m3,手足口病传播数据收集和处理模块中,社会因素以手足口病疫苗接种率、手足口病疫苗失效率、手足口病转移率、手足口病感染进程率、无症状手足口病传染率、有症状手足口病传染率和手足口病恢复率的数据。

10、作为本发明的进一步方案,在手足口病传播数据收集和处理模块中,数据的处理采用去中心标准化处理,所用公式为:

11、

12、其中,ui‘为相应特征的第i个标准化处理后的值,ui为相应特征的第i个值,n为相应特征含有单一个体的数量,i为相应特征的相应值。

13、进一步的,在手足口病传播特征提取模块中,使用交叉基函数进行特征的提取,以环境因素中的温度和湿度分别与社会因素的各项特征进行交叉,构建新的手足口病传播特征,其中,使用非线性多项函数、高斯函数和对数函数作为交叉基,进行2-3项多特征交叉分析。

14、作为本发明的进一步方案,在手足口病传播特征提取模块中,使用两项特征进行交叉基函数处理构建新特征,在进行两两交叉分析中,使用单因素分析,确立相关性>0.75的两项特征,所用公式为:

15、

16、其中,γi为基于两项特征进行交叉基函数处理构建新特征值,x1和x2为提取的手足口病的特征,δi为高斯函数的标准差,β0为非线性表达式中的系数。

17、使用三项特征进行交叉基函数处理构建新特征时,基于二项特征交叉基函数处理构建新特征的方法,加入对数基函数表达值,所用对数基函数表达式为:

18、

19、其中,θ为基于对数基函数的第三项表达值,x3为第三项初始特征值,为第三项初始特征的中心值。

20、进一步的,在建立手足口病传播预测模型模块中,使用手足口病传播特征提取模块产生的新特征,进行手足口病传播预测模型的训练,所用训练方法为决策树法,在决策数的节点训练中,使用信息增益和信息增益率进行训练,其中,再引入信息墒用于度量手足口病传播特征样本集合,在信息增益中设有手足口病传播数据的随机变量和每个被取值时的概率,通过假定手足口病传播的一个数据集,假定的数据集中的取值以观察属性作为体现,而观察属性值的体现是相应全部取值的集合,最终在信息增益率中所用公式为:

21、

22、其中,i为基尼指数值,gi为手足口病传播数据集中每个被取值时的概率,sv为手足口病传播的数据集中相应子集的大小,s为手足口病传播的假定数据集,z和a为手足口病传播的一个假定数据集中的一个观察属性,z(a)为手足口病传播的一个假定数据集中的一个观察属性全部取值的集合,k为手足口病传播数据集的取值个数。

23、作为本发明的进一步方案,在决策树中,设置有弱学习器,最大特征数调节器,最大节点数调节器,决策树深度调节器,决策树节点样本调节器,其中弱学习器数量范围为150-300,最大特征数范围为0-2,最大节点数范围为0-2,决策树深度范围为1-3,决策树节点样本范围为2-5。

24、进一步的,在手足口病传播预测模型检验模块中,对手足口病传播预测模型的检验评分,选用均方误差和解释方差得分作为评价指标,所用检验样本为30%的测试集,以手足口病传播测试样本的真实值和预测值间的差异性进行均方误差的计算,以手足口病传播测试样本的真实集和预测集进行解释方差的计算。

25、作为本发明的进一步方案,在手足口病传播预测模型检验模块中,解释方差的评分取值范围为0-1,其中0-0.75为劣质手足口病传播预测模型,0.75-0.90为一般手足口病传播预测模型,0.90-1为优质手足口病传播预测模型。

26、作为本发明的进一步方案,在手足口病传播预测模型优化模块中,使用基尼指数对信息增益和信息增益率针对手足口病传播节点分类的错误率进行评估,以5折交叉验证进行决策树参数的调节,其中,弱学习器数量范围为200-240,最大特征数范围为0-1,最大节点数范围为0-1,决策树深度范围为1-2,决策树节点样本范围为2-3。

27、一种基于交叉分析优化手足口病传播决策树分类器的预测系统,其中,手足口病传播数据收集和处理模块用于收集并处理手足口病传播的数据,再将处理后的数据传入手足口病传播特征提取模块进行特征的提取,进而生成新特征,将生成的新特征导入建立手足口病传播预测模型模块,再使用手足口病传播预测模型检验模块对手足口病传播预测模型进行检验,依据检验的结果,再使用手足口病传播预测模型优化模块对手足口病传播预测模型进行优化,最终输出高精度的手足口病传播预测模型,因此,基于机器学习的手足口病传播预测系统间的连接关系为手足口病传播数据收集和处理模块与手足口病传播特征提取模块相连接,手足口病传播特征提取模块与建立手足口病传播预测模型模块相连接,再与手足口病传播预测模型检验模块相连接,最后连接与手足口病传播预测模型优化模块。

28、本发明的有益技术效果:通过限定了手足口病传播过程中环境因素的取值范围,确保所采集的数据符合实际手足口病传播的情况,再通过对温度、湿度等环境因素与疫苗接种率、感染率等社会因素进行交叉分析,构建新的手足口病传播特征,能够更好地描述手足口病传播的复杂关系,而且,对于决策树模型的训练,引入了信息增益和信息增益率的概念,并引入信息熵用于度量特征样本集合,再通过设置弱学习器数量、最大特征数、最大节点数、决策树深度和决策树节点样本参数的范围,可以灵活地调节模型的复杂度和性能,最后,通过基尼指数对决策树节点分类错误率进行评估,并使用交叉验证调节决策树参数,能够提高手足口病传播预测模型的稳定性和泛化能力。

29、该方法中未涉及部分均与现有技术相同或能够采用现有技术加以实现。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1