患者住院时长的预测方法、装置、电子设备及存储介质与流程

文档序号:23963329发布日期:2021-02-18 20:28阅读:来源:国知局

技术特征:
1.一种患者住院时长的预测方法,其特征在于,包括:利用多个二分类基学习器级联串接构建有序多分类的预测模型;利用训练数据集训练各个所述基学习器直至每一所述基学习器达到性能指标要求,得到训练好的预测模型;根据预设预测特征,选取待预测样本输入所述训练好的预测模型,得到预测结果。2.根据权利要求1所述的方法,其特征在于,在所述利用训练数据集训练各个所述基学习器之前,所述预测方法还包括:基于医院信息管理系统中患者的电子病历数据,进行数据清理,提取训练数据构成训练数据集。3.根据权利要求2所述的方法,其特征在于,在所述根据预设预测特征,选取待预测样本输入所述训练好的预测模型之前,所述预测方法还包括:从所述医院信息管理系统的电子病历数据中或者从所述训练数据集中筛选出对患者的住院时长预测价值高的预测特征;结合专家知识对所筛选的预测特征进行补充与调整,得到预设预测特征。4.根据权利要求2所述的方法,其特征在于,所述进行数据清理,包括:剔除缺失率过高的患者数据,剔除异常数据,以及随机填补数据缺失值。5.根据权利要求1所述的方法,其特征在于,所述二分类基学习器为梯度提升决策树算法。6.根据权利要求1所述的方法,其特征在于,所述利用训练数据集训练各个所述二分类基学习器直至每一所述二分类基学习器达到性能指标要求,包括:s1、将所述训练数据集输入所述预测模型,设定初始值m=1;单个训练样本输入格式为(x,y);y为包含有序m分类的结局变量,x代表训练样本的预测特征的集合;m为所述预测模型的分类类别的数量;s2、判断m是否<m;若是,则进入步骤s3;若否,则跳到步骤s7;s3、提取y≥第m类别的数据作为第m个基学习器的训练数据子集;s4、用第一训练标签标记所述训练数据子集中y=第m类别的数据,用第二训练标签标记所述训练数据子集中y>第m类别的数据;s5、基于上述步骤获得的所述训练数据子集与训练标签,训练所述二分类基学习器,得到第m个基学习器;s6、m自增1后更新,返回步骤s2;s7、输出训练完成的m-1个基学习器。7.根据权利要求6所述的方法,其特征在于,采用随机超参数搜索结合五折交叉验证方法实现各个基学习器的超参数优化,使用f1分数作为超参数寻优的模型预测性能的参考指标。8.根据权利要求1所述的方法,其特征在于,所述预测方法还包括:基于医院信息管理系统中电子病历数据的更新,定期同步对所述预测模型进行更新。9.一种患者住院时长的预测装置,其特征在于,包括:构建模块,用于利用多个二分类基学习器级联串接构建有序多分类的预测模型;训练模块,用于利用训练数据集训练各个所述基学习器直至每一所述基学习器达到性
能指标要求,得到训练好的预测模型;预测模块,用于根据预设预测特征,选取待预测样本输入所述训练好的预测模型,得到预测结果。10.一种电子设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-8中任一所述的患者住院时长的预测方法。11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以实现如权利要求1-8中任一所述的患者住院时长的预测方法。
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1