老年健康数据知识分析方法和系统与流程

文档序号:19789588发布日期:2020-01-24 14:04阅读:来源:国知局

技术特征:

1.一种老年健康数据知识分析方法,其特征在于,所述方法由计算机执行,包括以下步骤:

s1、获取老年健康调查数据;

s2、对所述老年健康调查数据进行预处理;

s3、对预处理之后的老年健康调查数据进行集成特征选择,得到关键特征;

s4、基于所述关键特征获取知识发现模型;

s5、基于机器学习评价指标、解释机器学习性评价方法和所述知识发现模型,获取老年健康调查数据知识发现模型;

s6、基于所述老年健康调查数据知识发现模型分析所述老年健康调查数据,得到所述老年健康调查数据中的自变量与因变量的关系。

2.如权利要求1所述的老年健康数据知识分析方法,其特征在于,所述预处理包括缺失值处理。

3.如权利要求2所述的老年健康数据知识分析方法,其特征在于,所述缺失值处理包括:

s201、记一组老年健康调查数据为x1......xk,以统一的形式表示这组老年健康调查数据中的缺失值;

s202、从第一个老年健康调查数据开始,如果x1有缺失值,将在其他变量x2到xk上回归,将x1中的缺失值替换为预测值,所述预测值由来自x1的后验预测分布模拟得出;

s203、对于下一个具有缺失值的老年健康调查数据xi,在所有其他老年健康调查数据x1......xk上回归,xi中的缺失值被来自xi的后验预测分布的模拟值所取代,将老年健康调查数据中的所有缺失值进行替换。

4.如权利要求1所述的老年健康数据知识分析方法,其特征在于,所述集成特征选择包括:

s301、分别使用卡方检验、互信息、基于l2逻辑回归、随机逻辑回归、随机森林和lightgbm对预处理之后的一组老年健康调查数据中的特征a进行特征选择,获取特征a的6种类型的特征得分向量;

s302、对所述特征a的6种类型的特征得分向量进行归一化处理,归一化处理的公式包括:

其中:

x*为归一化处理后的特征得分向量;

xi为特征a的6种类型的特征得分向量中的其中一种特征得分向量;

s303、基于归一化后的特征a的6种类型的特征得分向量获取特征平均总得分值;

s304、基于步骤s301~s303的方法,获取老年健康调查数据中m个特征的特征平均总得分值,再将m个特征的特征平均总得分值相加,得到总得分值,将总得分值除以6,除以6之后再除以老年健康调查数据中老年人的个数,得到最终平均总得分值,选取老年健康调查数据中特征平均总得分值在最终平均总得分值之上的特征作为关键特征。

5.如权利要求1所述的老年健康数据知识分析方法,其特征在于,所述获取知识发现模型的方法包括:

将关键特征输入梯度提升树分类器中,获取知识发现模型。

6.如权利要求5所述的老年健康数据知识分析方法,其特征在于,所述获取老年健康调查数据知识发现模型的具体方法包括:

s501、基于机器学习评价指标对知识发现模型进行评价,基于评价结果,筛选知识发现模型,得到初始老年健康调查数据知识发现模型;

s502、将排列重要性和基于博弈论shapley值的shapleyadditiveexplanations两种解释机器学习性评价方法加入到初始老年健康调查数据知识发现模型中,得到老年健康调查数据知识发现模型。

7.如权利要求6所述的老年健康数据知识分析方法,其特征在于,在步骤s501中,所述机器学习评价指标包括:准确率、f值和auc值。

8.一种老年健康数据知识分析系统,其特征在于,所述系统包括计算机,所述计算机包括:

至少一个存储单元;

至少一个处理单元;

其中,所述至少一个存储单元中存储有至少一条指令,所述至少一条指令由所述至少一个处理单元加载并执行以实现以下步骤:

s1、获取老年健康调查数据;

s2、对所述老年健康调查数据进行预处理;

s3、对预处理之后的老年健康调查数据进行集成特征选择,得到关键特征;

s4、基于所述关键特征获取知识发现模型;

s5、基于机器学习评价指标、解释机器学习性评价方法和所述知识发现模型,获取老年健康调查数据知识发现模型;

s6、基于所述老年健康调查数据知识发现模型分析所述老年健康调查数据,得到所述老年健康调查数据中的自变量与因变量的关系。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1