一种基于机器学习的术后急性肾损伤智能预测方法及装置与流程

文档序号:28923057发布日期:2022-02-16 13:40阅读:142来源:国知局
一种基于机器学习的术后急性肾损伤智能预测方法及装置与流程

1.本发明涉及手术并发症早期预测技术领域,尤其涉及一种基于机器学习的术后急性肾损伤智能预测方法及装置。


背景技术:

2.围手术期并发症和死亡率是迫切需要关注的公共卫生问题,其中急性肾损伤(acute kidney injury,aki)是术后常见的并发症之一,且该并发症的漏诊率较高。部分aki患者肾功能恢复不佳,需依赖肾脏替代治疗(renal replacement therapy,rrt),aki可显著增高院内病死率和增加医疗资源的消耗。尽管许多因素如患者的病史、合并疾病等无法改变,但一些围手术期危险因素如术中血压、麻醉浓度等可实时调整,若能在术前识别术后aki发病的高风险,并在围手术期对患者的肾功能及时给予必要的保护措施,可改善其预后。虽然围手术期变量和术后结局之间的关系已经在人群水平上用logistic回归等方法得到了证实,但使用实时生理参数来动态预测每个病人的围手术期结局的研究仍是空白。长期以来习惯使用标准预测模型,如logistic回归、线性回归等模型来识别和监测不良结局的危险因素,但这些统计方法的预测能力及临床应用有限,预测的准确度和稳定性较差,且无法保证预测结果的全面性。以心脏手术后aki为例,国内外先后建立了多个心脏术后aki预测模型,如cleveland、mehta和sri,但通过对心脏手术患者的临场分析,这些预测模型均不能很好的预测患者心脏术后aki。因此,有必要提供一种基于机器学习的术后急性肾损伤智能预测方法及装置,以实现在术前准确预测术后aki发病的风险。


技术实现要素:

3.本发明提供一种基于机器学习的术后急性肾损伤智能预测方法及装置,用以解决现有技术中预测准确性、全面性和稳定性较差的缺陷,实现术后aki发病的准确预测。
4.本发明提供一种基于机器学习的术后急性肾损伤智能预测方法,包括:
5.获取待测患者的围手术期数据;
6.根据所述围手术期数据,得到所述待测患者的术后急性肾损伤预测结果;其中,将所述围手术期数据输入预测模型得到所述待测患者的术后急性肾损伤预测结果;
7.其中,所述预测模型包括若干个预测子模型,若干个所述预测子模型分别采用不同的机器学习网络构建得到;所述待测患者的术后急性肾损伤预测结果,根据训练好的若干个所述预测子模型的模型权重及预测值计算得到;
8.所述预测模型的训练包括:分别确定训练集中各样本数据在每个所述预测子模型上的数据权重,根据所述数据权重对各所述预测子模型进行训练。
9.根据本发明提供的一种基于机器学习的术后急性肾损伤智能预测方法,确定训练集中各样本数据在每个所述预测子模型上的数据权重,包括:
10.在所述预测模型的训练过程中,根据所述训练集中各样本数据在前一个所述预测子模型上的数据权重、前一个所述预测子模型的模型权重以及前一个所述预测子模型对所
述训练集中各样本数据的预测值,确定所述训练集中各样本数据在当前所述预测子模型上的数据权重;其中,在所述预测模型的训练过程中,依次对若干个所述预测子模型进行训练。
11.根据本发明提供的一种基于机器学习的术后急性肾损伤智能预测方法,所述预测子模型的模型权重的确定包括:
12.获取所述预测子模型在所述训练集上的加权误差率,根据所述加权误差率确定所述预测子模型的模型权重;其中,所述加权误差率根据所述训练集中各样本数据在所述预测子模型上的数据权重,以及所述预测子模型对所述训练集中各样本数据的预测误差得到。
13.根据本发明提供的一种基于机器学习的术后急性肾损伤智能预测方法,根据所述加权误差率确定所述预测子模型的模型权重,如下式所示:
[0014][0015]
式中,αk表示第k个预测子模型的模型权重,ek表示第k个预测子模型在训练集上的加权误差率。
[0016]
根据本发明提供的一种基于机器学习的术后急性肾损伤智能预测方法,根据所述数据权重对各所述预测子模型进行训练的过程中,还包括:
[0017]
剔除所述训练集中的离群点;其中,剔除所述训练集中的离群点包括:
[0018]
在所述预测模型的前m轮训练中,如果若干个所述预测子模型均无法对所述样本数据进行正确分类,则将所述样本数据作为离群点并剔除;其中,m《n,n为所述预测模型的总训练轮数。
[0019]
根据本发明提供的一种基于机器学习的术后急性肾损伤智能预测方法,根据所述数据权重对各所述预测子模型进行训练的过程中,还包括:
[0020]
剔除所述预测模型中的离群预测子模型;其中,剔除所述预测模型中的离群预测子模型包括:
[0021]
在所述预测模型的前t轮训练中,获取每个所述预测子模型的平均运行时间,若所述预测子模型的平均运行时间超出预设阈值,则将所述预测子模型作为离群预测子模型并剔除;其中,t《n,n为所述预测模型的总训练轮数。
[0022]
本发明还提供一种基于机器学习的术后急性肾损伤智能预测装置,包括:
[0023]
数据获取模块,用于获取待测患者的围手术期数据;
[0024]
智能预测模块,用于根据所述围手术期数据,得到所述待测患者的术后急性肾损伤预测结果;其中,将所述围手术期数据输入预测模型得到所述待测患者的术后急性肾损伤预测结果;
[0025]
其中,所述预测模型包括若干个预测子模型,若干个所述预测子模型分别采用不同的机器学习网络构建得到;所述待测患者的术后急性肾损伤预测结果,根据训练好的若干个所述预测子模型的模型权重及预测值计算得到;
[0026]
所述预测模型的训练包括:分别确定训练集中各样本数据在每个所述预测子模型上的数据权重,根据所述数据权重对各所述预测子模型进行训练。
[0027]
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述基于机器学习的术后急性肾损伤智能预测方法的步骤。
[0028]
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述基于机器学习的术后急性肾损伤智能预测方法的步骤。
[0029]
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述基于机器学习的术后急性肾损伤智能预测方法的步骤。
[0030]
本发明提供的基于机器学习的术后急性肾损伤智能预测方法及装置,通过预测模型对待测患者的围手术期数据进行智能预测,得到待测患者的术后急性肾损伤预测结果,其中,预测模型包括若干个采用不同的机器学习网络构建的预测子模型,通过若干个预测子模型的模型权重及预测值来获取待测患者的术后急性肾损伤预测结果,等同于多个专家共同会诊决策,最大程度上保证了预测结果的准确性、全面性和稳定性;同时,预测模型的训练过程中,确定训练集中各样本数据在每个预测子模型上的数据权重,通过数据权重对各预测子模型进行训练,使得各个预测子模型的侧重点均不相同,通过多个预测子模型预测结果的结合,进一步提高了待测患者术后aki预测结果的准确性和全面性,从而能够根据预测结果对围手术期的危险因素进行及时调整,并给予必要的保护措施,改善术后急性肾损伤的预后。
附图说明
[0031]
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0032]
图1是本发明提供的基于机器学习的术后急性肾损伤智能预测方法的流程示意图;
[0033]
图2是本发明提供的基于机器学习的术后急性肾损伤智能预测装置的结构示意图;
[0034]
图3是本发明提供的电子设备的结构示意图。
具体实施方式
[0035]
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0036]
下面结合图1描述本发明的基于机器学习的术后急性肾损伤智能预测方法,如图1所示,基于机器学习的术后急性肾损伤智能预测方法包括如下步骤:
[0037]
s100、获取待测患者的围手术期数据;
[0038]
该步骤中,待测患者的围手术期数据,使用各种电子病历资源来提取覆盖整个围
手术期的信息,提取到的围手术期数据包括:人口学数据、既往史数据、术前数据、术中数据。其中,人口学数据包括但不限于:id号、性别、年龄、文化程度、住院科室、住院天数、住院总费用;既往史数据包括但不限于:既往病史、手术史、家族史;术前数据包括:术前诊断、合并症、脑血管病、贫血、慢性阻塞性肺疾病、术前实验室检查报告、纽约心脏学会心功能分级、左心室射血分数、术前充血性心力衰竭、造影检查与手术间隔天数、术前肾毒性药物使用史;术中数据包括但不限于:急诊手术、手术术式、是否进行体外循环(cpb,cardiopulmonary bypass)、cpb持续时间、主动脉阻断时间、术中平均动脉压、cpb低温方式、术中补液量、输红细胞悬液量、输血浆量、尿量、cpb超滤量、液体平衡、呼吸机参数、麻醉药物、每分钟的生命体征(3小时的程序中,约有180次生命体征的测量)、血压数据(每分钟测量一次血压到每5分钟测量一次)。本实施例中,围手术期数据的所有数据字段均为字母和/或数字,且围手术期数据以统一和细粒度的方式捕获,从而便于编码和数据分析。
[0039]
其中,获取待测患者的围手术期数据后,还对该围手术期数据进行数据预处理,将数据预处理后的围手术期数据输入预测模型得到待测患者的术后急性肾损伤预测结果。本实施例中,采用python软件对围手术期数据进行数据预处理,数据预处理包括:数据清洗、标准化处理、结构化处理。通过数据清洗、标准化处理,能够排除人为可确定的失真样本。
[0040]
传统术后急性肾损伤预测方法中,采用的数据较为单一,需要大量预处理,对缺失值多、质量低的数据预测能力较差。而本发明预测过程中所采用的数据来源广、量级高、维度杂,不拘于结构化的表格数据或者固定时间点的检测数据,能够无差别地灵活训练患者某一次的检验结果,或者在院治疗器件数天、数月的所有检验数据,真正体现了大数据的特征;同时,本发明预测模型通过不同的算法来满足不同的数据需求,有效提高了对术后急性肾损伤的预测能力。
[0041]
s200、根据围手术期数据,得到待测患者的术后急性肾损伤预测结果;其中,将围手术期数据输入预测模型得到待测患者的术后急性肾损伤预测结果;
[0042]
该步骤中,预测模型包括若干个预测子模型,若干个预测子模型分别采用不同的机器学习网络构建得到;本实施例中,通过机器学习和深度学习的十大最经典算法构建预测子模型,分别为:cart(classification and regression tree,分类回归树)、svm(support vector machines,支持向量机)、crf(conditional random field,条件随机场)、rf(random forest,随机森林)、xgboost(extremegradient boosting)、隐马尔可夫模型、广义线性模型、lstm(longshort term memory,长短期记忆模型)、朴素贝叶斯模型(naive bayesian model,nbm)、adaboost算法。
[0043]
cart算法是一种决策树算法,主要用于分类与回归,cart生成的决策树是一棵二叉树,其本质是对特征空间进行二元划分,计算简单,易于理解,可解释性强,比较适合处理有缺失属性的样本,不仅能够处理不相关的特征,还能在相对短的时间内对大型数据源得出可行且效果良好的结果。
[0044]
svm算法是一种监督式学习的方法,可广泛地应用于统计分类以及回归分析,svm使用核函数可以向高维空间进行映射,解决非线性的分类问题,分类思想简单,分类效果较好。
[0045]
crf算法结合了最大熵模型和隐马尔可夫模型的特点,是一种无向图模型,没有严格的独立性假设条件,可以容纳任意上下文信息,特征设计灵活,而且克服了最大熵马尔可
夫模型标记偏置的缺点。
[0046]
rf算法是bagging的一个扩展变体,在以决策树为基分类器进行集成的基础上,进一步在决策树的训练过程中引入了随机属性选择,简单容易实现,计算开销小,能够收敛于更小的泛化误差,且训练效率高,被誉为“代表集成学习技术水平的方法”,且能够处理很高维度的数据。
[0047]
xgboost是一个优化的分布式梯度增强库,提出了泰勒展开的二阶导的形式计算损失,在损失函数中增加正则项来防止过拟合,并通过相关的数据缓存机制、数据压缩和分片、并行计算等方面的优化,使得算法的效率最大化。
[0048]
隐马尔可夫模型是关于时序的概率模型,描述由一个隐含的马尔可夫链生成不可观测的状态序列,再由状态序列生成观测序列的过程,对过程的状态预测效果良好。
[0049]
广义线性模型通过联结函数建立响应变量的数学期望值与线性组合的预测变量之间的关系,无论在广度上还是深度上都具有较好的分类效果。
[0050]
lstm改善了rnn中存在的长期依赖问题,作为非线性模型,lstm可作为复杂的非线性单元,用于构造更大型的深度神经网络。
[0051]
朴素贝叶斯属于生成式模型,有着坚实的数学基础,以及稳定的分类效率,对大数量训练和查询时具有较高的速度,对小规模的数据表现很好,能够处理多分类任务,适合增量式训练,对缺失数据不太敏感,算法也比较简单。
[0052]
adaboost算法是第一个为二进制分类开发的真正成功的增强算法,具有较高的分类精度。
[0053]
传统术后急性肾损伤预测方法中,预测模型通常采用logistic、cox回归等基本模型,不适用于高维度的大数据建模,且预测能力及临床应用有限,预测的准确度和稳定性较差。而本发明所采用的10大算法均为机器学习和深度学习近年最具创造性和可靠性的前沿成果,不仅可应用于所有类型的原始数据,又有极强的可扩展性。
[0054]
该步骤中,通过训练集对预测模型进行训练,其中,训练集的选取过程中,首先选取研究对象,研究对象采用在手术室进行手术的所有年龄≥18岁的患者,并排除在主手术室以外区域接受麻醉护理的患者(如产科套房或门诊手术套房)、术前接受肾脏替代治疗的患者、术前30天内没有基线肌酐的患者、接受肾移植或透析治疗的患者、术前有严重肝损伤和感染。其次,根据选取的研究对象,获取相应的围手术期数据,并采用python软件对获取的围手术期数据进行数据清洗、标准化处理、结构化处理后,作为训练集。
[0055]
通过训练集对预测模型进行训练包括:分别确定训练集中各样本数据在每个预测子模型上的数据权重,根据数据权重对各预测子模型进行训练。其中,在预测模型的训练过程中,依次对若干个预测子模型进行训练,具体包括如下步骤:
[0056]
s201、对训练集中各样本数据在第一个预测子模型上的数据权重进行初始化,根据初始化后的数据权重对第一个预测子模型进行训练;
[0057]
该步骤中,设定训练集在第k个预测子模型上的数据权重d(k)如下式所示:
[0058]
d(k)=(ω
k1
,ω
k2


,ω
km
)
[0059]
式中,ω
ki
为训练集中第i个样本数据在第k个预测子模型上的数据权重,i=1,2,

,m,m为训练集中样本数据的数量;当k=1时,训练集中各样本数据在第一个预测子模
型上的数据权重的初始化结果为:k=1,即每个样本数据的数据权重均相同。
[0060]
s202、根据训练集中各样本数据在前一个预测子模型上的数据权重、前一个预测子模型的模型权重以及前一个预测子模型对训练集中各样本数据的预测值,确定训练集中各样本数据在当前预测子模型上的数据权重,并根据训练集中各样本数据在当前预测子模型上的数据权重,对当前预测子模型进行训练;重复步骤s202,直到所有预测子模型完成本轮训练;
[0061]
该步骤中,预测子模型的模型权重的确定包括:
[0062]
获取预测子模型在训练集上的加权误差率,根据加权误差率确定预测子模型的模型权重;其中,加权误差率根据训练集中各样本数据在预测子模型上的数据权重,以及预测子模型对训练集中各样本数据的预测误差得到,加权误差率的计算如下式所示:
[0063][0064]
式中,ek为第k个预测子模型在训练集上的加权误差率;p(
·
)表示加权误差率函数,gk(
·
)表示第k个预测子模型的输出;(xi,yi)表示训练集中的第i个样本数据,其中,xi、yi分别为第i个样本数据的样本值和类别标签;ω
ki
为训练集中第i个样本数据在第k个预测子模型上的数据权重,i=1,2,

,m,m为训练集中样本数据的数量;i(
·
)表示指示函数,当gk(xi)≠yi为true时,i(
·
)输出为1,当gk(xi)≠yi为false时,i(
·
)输出为0。
[0065]
根据加权误差率确定预测子模型的模型权重,如下式所示:
[0066][0067]
式中,αk表示第k个预测子模型的模型权重,ek表示第k个预测子模型在训练集上的加权误差率;因此,预测子模型的加权误差率越大,则对应的模型权重越小,也就是说误差率越小的预测子模型,其模型权重越大。
[0068]
根据训练集中各样本数据在前一个预测子模型上的数据权重、前一个预测子模型的模型权重以及前一个预测子模型对训练集中各样本数据的预测值,确定训练集中各样本数据在当前预测子模型上的数据权重,如下式所示:
[0069][0070]
式中,zk为公式的简化表达,其中,1≤k≤k-1,k为预测子模型的数量。
[0071]
s203、在第h轮训练中,根据训练集中各样本数据在最后一个预测子模型上的数据权重、最后一个预测子模型的模型权重以及最后一个预测子模型对训练集中各样本数据的预测值,确定第h+1轮训练中,训练集中各样本数据在第一个预测子模型上的数据权重,并根据训练集中各样本数据在第一个预测子模型上的数据权重,对第一个预测子模型进行第h+1轮训练;其中,1≤h≤n-1,n为预测模型的总训练轮数;
[0072]
重复步骤s202~s203,直到预测模型训练完成。
[0073]
为同时保证预测模型的准确度和训练的时效性,本实施例中,同时将训练轮数和模型准确率作为预测模型训练完成的条件;其中训练轮数为:每个预测子模型的训练轮数均大于100,且所有预测子模型的总训练轮数不超过2000;模型准确率设定为80%,即预测模型的准确率均达到80%,结束训练。现有技术中,训练的迭代次数难以设定,通常只设定准确率阈值,如果为达到该准确率阈值而进行的迭代次数过高,算法将在实际应用环节中丧失时效性,甚至产生迟迟未达到该阈值的死循环,而本发明同时设定迭代次数阈值和准确率阈值,能够在保证准确度的同时,有效防止时效性的丧失,即同时保证了准确度和时效性。
[0074]
该步骤中,对每个预测子模型进行新一轮的训练,都会根据前一个预测子模型的训练结果调整一次训练集中各样本数据的数据权重,前一个预测子模型的训练中,被错误分类的样本数据的数据权重增加,被正确分类的样本数据的数据权重降低,促使下一个预测子模型的训练过程中,着重分析错误分类的样本数据,达到“你分不对我来分”的效果。由于每个预测子模型都会重点关注上一个预测子模型分错的样本,因此,每个预测子模型都有各自的侧重点,通过多个预测子模型的结合,能够有效提高术后急性肾损伤的预测准确度。
[0075]
为进一步提高预测模型的训练效率及训练效果,根据数据权重对各预测子模型进行训练的过程中,还包括:剔除训练集中的离群点以及离群预测子模型;
[0076]
其中,剔除训练集中的离群点包括:
[0077]
在预测模型的前m轮训练中,如果若干个预测子模型均无法对样本数据进行正确分类,则将样本数据作为离群点并剔除;其中,m<n,n为预测模型的总训练轮数;本实施例中,m取值为2,即各个预测子模型在两轮训练中均无法对该样本数据进行正确分类,则将该样本数据视为离群点,将其数据权重清零,并剔除。现有技术中,训练偏向于分类困难的样本,导致模型极易受噪声干扰,然而,实验中难免有偶然或反常,好像“太阳从西边升起”,如果训练集中存在少量违背科学规律的反常样本,或者在操作、记录、统计环节中由于人为疏忽或造假导致的失真样本,弱分类器将难以对其作出准确分类,导致这类样本的权重越来越高,且满足该失真样本的预测势必严重影响整体分类器在实际应用中的准确度。本发明通过数据清洗、标准化处理排除人为可确定的失真样本后,进一步通过离群点剔除对失真样本进行全面剔除,能够有效保证预测模型的准确度。
[0078]
剔除预测模型中的离群预测子模型包括:
[0079]
在预测模型的前t轮训练中,获取每个预测子模型的平均运行时间,若预测子模型的平均运行时间超出预设阈值,则将预测子模型作为离群预测子模型并剔除;其中,t《n,n为预测模型的总训练轮数;本实施例中,t取值为2,即获取每个预测子模型在两轮训练过程中的平均运行时间,若第k个预测子模型的平均运行时间超过其他k-1个预测子模型的平均运行时间的均值的5倍,则将该预测子模型视为离群预测子模型,将其模型权重清零,并剔除。由于每个弱分类器的训练时间非常不一致,如果各个分类器的训练时间差异过大,将导致部分硬件资源严重浪费,同时影响预测模型在实际应用中的时效性,本发明将运行时间过长的预测子模型剔除,能够有效保证预测模型的整体时效性,且避免硬件资源的浪费。
[0080]
待测患者的术后急性肾损伤预测结果,根据若干个预测子模型的模型权重及预测值计算得到,如下式所示:
[0081][0082]
式中,f(x)为预测模型的输出,即待测患者的术后急性肾损伤预测结果;x为输入的待测患者的围手术期数据;sign(
·
)为符号函数,自变量大于0时,输出为1,自变量小于0时,输出为-1,自变量=0时,输出为0;αk表示第k个预测子模型的模型权重;gk(
·
)表示第k个预测子模型的输出,即第k个预测子模型的预测值;k表示预测子模型的总数量;其中,f(x)输出0时,表示分类失败,该情况为极限情况,通常情况下不会出现。
[0083]
传统术后急性肾损伤预测方法中,预测模型通常采用logistic、cox回归等基本模型,其预测过程包括:预测分布-》明确数学模型来拟合-》假设检验-》p值的经典统计,可见,其预测结果依赖假设,泛化能力较差,仅能找出影响因子,预测效果不稳定。且现有bagging和boosting技术在训练模型时没有做到基于初始训练效果为不同弱分类器以及不同样本数据赋予不同权重,导致“专家和外行具有同样的投票权重”和“简单题和难题一个分”,严重影响整体分类器的最终效果。而本发明所采用的机器学习网络对数据没有任何假设,且建立的预测模型不依赖于单一算法,通过数据权重的设置,使得多个最主流算法具有不同的侧重点,同时,多个最主流算法依照加权误差率来确定模型权重,根据模型权重进行加权投票,加权误差率越大,则对应的模型权重越小,加权误差率越大越小,其模型权重越大,等同于多个专家共同会诊决策,最大程度上保证了预测结果的准确性、全面性和稳定性。
[0084]
下面结合图2对本发明提供的基于机器学习的术后急性肾损伤智能预测装置进行描述,下文描述的基于机器学习的术后急性肾损伤智能预测装置与上文描述的基于机器学习的术后急性肾损伤智能预测方法可相互对应参照。如图2所示,基于机器学习的术后急性肾损伤智能预测装置包括:
[0085]
数据获取模块701,用于获取待测患者的围手术期数据;
[0086]
智能预测模块702,用于根据围手术期数据,得到待测患者的术后急性肾损伤预测结果;其中,将围手术期数据输入预测模型得到待测患者的术后急性肾损伤预测结果;
[0087]
其中,预测模型包括若干个预测子模型,若干个预测子模型分别采用不同的机器学习网络构建得到;待测患者的术后急性肾损伤预测结果,根据训练好的若干个预测子模型的模型权重及预测值计算得到;
[0088]
预测模型的训练包括:分别确定训练集中各样本数据在每个预测子模型上的数据权重,根据数据权重对各预测子模型进行训练。作为可选方案,确定训练集中各样本数据在每个预测子模型上的数据权重,包括:
[0089]
在预测模型的训练过程中,根据训练集中各样本数据在前一个预测子模型上的数据权重、前一个预测子模型的模型权重以及前一个预测子模型对训练集中各样本数据的预测值,确定训练集中各样本数据在当前预测子模型上的数据权重;其中,在预测模型的训练过程中,依次对若干个预测子模型进行训练。预测子模型的模型权重的确定包括:
[0090]
获取预测子模型在训练集上的加权误差率,根据加权误差率确定预测子模型的模型权重;其中,加权误差率根据训练集中各样本数据在预测子模型上的数据权重,以及预测子模型对训练集中各样本数据的预测误差得到。根据加权误差率确定预测子模型的模型权重,如下式所示:
[0091][0092]
式中,αk表示第k个预测子模型的模型权重,ek表示第k个预测子模型在训练集上的加权误差率。
[0093]
作为可选方案,智能预测模块702根据数据权重对各预测子模型进行训练的过程中,还包括:
[0094]
剔除训练集中的离群点;其中,剔除训练集中的离群点包括:
[0095]
在预测模型的前m轮训练中,如果若干个预测子模型均无法对样本数据进行正确分类,则将样本数据作为离群点并剔除;其中,m《n,n为预测模型的总训练轮数。
[0096]
作为可选方案,智能预测模块702数据权重对各预测子模型进行训练的过程中,还包括:
[0097]
剔除预测模型中的离群预测子模型;其中,剔除预测模型中的离群预测子模型包括:
[0098]
在预测模型的前t轮训练中,获取每个预测子模型的平均运行时间,若预测子模型的平均运行时间超出预设阈值,则将预测子模型作为离群预测子模型并剔除;其中,t《n,n为预测模型的总训练轮数。
[0099]
图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)810、通信接口(communications interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行基于机器学习的术后急性肾损伤智能预测方法,该方法包括:获取待测患者的围手术期数据;
[0100]
根据围手术期数据,得到待测患者的术后急性肾损伤预测结果;其中,将围手术期数据输入预测模型得到待测患者的术后急性肾损伤预测结果;
[0101]
其中,预测模型包括若干个预测子模型,若干个预测子模型分别采用不同的机器学习网络构建得到;待测患者的术后急性肾损伤预测结果,根据训练好的若干个预测子模型的模型权重及预测值计算得到;
[0102]
预测模型的训练包括:分别确定训练集中各样本数据在每个预测子模型上的数据权重,根据数据权重对各预测子模型进行训练。
[0103]
此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0104]
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的基于机器学习的术后急性肾损伤智能预测方法,
该方法包括:获取待测患者的围手术期数据;
[0105]
根据围手术期数据,得到待测患者的术后急性肾损伤预测结果;其中,将围手术期数据输入预测模型得到待测患者的术后急性肾损伤预测结果;
[0106]
其中,预测模型包括若干个预测子模型,若干个预测子模型分别采用不同的机器学习网络构建得到;待测患者的术后急性肾损伤预测结果,根据训练好的若干个预测子模型的模型权重及预测值计算得到;
[0107]
预测模型的训练包括:分别确定训练集中各样本数据在每个预测子模型上的数据权重,根据数据权重对各预测子模型进行训练。
[0108]
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的基于机器学习的术后急性肾损伤智能预测方法,该方法包括:获取待测患者的围手术期数据;
[0109]
根据围手术期数据,得到待测患者的术后急性肾损伤预测结果;其中,将围手术期数据输入预测模型得到待测患者的术后急性肾损伤预测结果;
[0110]
其中,预测模型包括若干个预测子模型,若干个预测子模型分别采用不同的机器学习网络构建得到;待测患者的术后急性肾损伤预测结果,根据训练好的若干个预测子模型的模型权重及预测值计算得到;
[0111]
预测模型的训练包括:分别确定训练集中各样本数据在每个预测子模型上的数据权重,根据数据权重对各预测子模型进行训练。
[0112]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0113]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0114]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1