融合主动学习和对比学习的血透并发心血管疾病预测系统的制作方法

文档序号：33292481发布日期：2023-02-28 20:20阅读：来源：国知局

技术特征：
1.一种融合主动学习和对比学习的血透并发心血管疾病预测系统，其特征在于，包括：血透数据准备模块，用于利用医院电子信息系统和日常监测设备提取患者样本的结构化数据，并对所述结构化数据处理得到扩增结构化数据；血透并发心血管疾病风险预测模块，用于构建风险评价模型，将所述扩增结构化数据通过所述风险评价模型训练学习得到患者表征和评分，并利用所述患者表征和评分进行血透并发心血管疾病风险预测。2.如权利要求1所述的一种融合主动学习和对比学习的血透并发心血管疾病预测系统，其特征在于，所述结构化数据包括人口统计学数据、临床事件数据、用药数据和日常监测数据。3.如权利要求1所述的一种融合主动学习和对比学习的血透并发心血管疾病预测系统，其特征在于，所述血透数据准备模块具体包括：数据获取单元，用于利用医院电子信息系统和穿戴设备提取患者样本的结构化数据；数据清洗单元，用于对所述结构化数据进行缺失值处理、错误值的检测、重复数据的消除和/或不一致性的消除操作，得到静态数据和时序数据；数据融合单元，用于对所述时序数据采用卷积操作得到的一维压缩数据和所述静态数据进行拼接后得到原始融合特征；数据扩增单元，用于将所述原始融合特征采用单特征随机化法，得到扩增结构化数据。4.如权利要求3所述的一种融合主动学习和对比学习的血透并发心血管疾病预测系统，其特征在于，所述数据扩增单元的扩增过程为：步骤s1：将所述原始融合特征为患有心血管并发症的患者作为原始阳性样本，所述原始融合特征为未患有心血管并发症的患者作为原始阴性样本，所有所述原始阳性样本构成原始阳性样本集合，所有所述原始阴性样本构成原始阴性样本集合；步骤s2：当所述原始阳性样本的数量小于所述原始阴性样本的数量，则对所述原始阳性样本集合进行扩增，得到扩增阳性样本，直至阳性样本的数量等于所述原始阴性样本的数量；当所述原始阳性样本的数量大于所述原始阴性样本的数量，则对所述原始阴性样本集合进行扩增，得到扩增阴性样本，直至阴性样本的数量等于所述原始阳性样本的数量；步骤s3：所述原始阳性样本集合和所述扩增阳性样本构成阳性样本扩增集，所述原始阴性样本集合和所述扩增阴性样本构成阴性样本扩增集；步骤s4：所述阳性样本扩增集和所述阴性样本扩增集共同构成扩增结构化数据。5.如权利要求4所述的一种融合主动学习和对比学习的血透并发心血管疾病预测系统，其特征在于，所述步骤s2中得到扩增阳性样本的过程为：将所述原始融合特征与所述原始阳性样本集合进行组合，得到组合阳性样本集，所述组合阳性样本集中包含单个原始融合特征及单个原始融合特征对应的单个阳性样本集；将单个所述组合阳性样本集中的单个原始融合特征作为干预特征，将单个所述组合阳性样本集中的其余原始融合特征作为固定特征集，单个所述阳性样本集中的阳性样本作为扩增对象进行样本扩增，得到单个扩增阳性样本，直至扩增的次数为所述原始阴性样本与所述原始阳性样本的差值，完成整个扩增过程，得到最终的扩增阳性样本；得到扩增阴性样本的过程为：将所述原始融合特征与所述原始阴性样本集合进行组合，得到组合阴性样本集，所述
组合阴性样本集中包含单个原始融合特征及单个原始融合特征对应的单个阴性样本集；将单个所述组合阴性样本集中的单个原始融合特征作为干预特征，将单个所述组合阴性样本集中的其余原始融合特征作为固定特征集，单个所述阴性样本集中的阴性样本作为扩增对象进行样本扩增，得到单个扩增阴性样本，直至扩增的次数为所述原始阴性样本与所述原始阳性样本的差值，完成整个扩增过程，得到最终的扩增阴性样本。6.如权利要求1所述的一种融合主动学习和对比学习的血透并发心血管疾病预测系统，其特征在于，所述血透并发心血管疾病风险预测模块具体包括：风险评价单元：用于构建风险评价模型，利用所述扩增结构化数据作为模型的训练数据，得到评分和患者表型；主动学习单元：用于利用所述评分和所述患者表型，通过正负样本挑选规则器从所述扩增结构化数据中挑选出正负样本；对比学习单元：用于利用所述正负样本进行对比学习，更新与风险评价单元共用的编码器的网络参数。7.如权利要求6所述的一种融合主动学习和对比学习的血透并发心血管疾病预测系统，其特征在于，所述风险评价单元具体包括：用于利用编码器和风险评价网络构建模型，通过损失函数进行优化，完成风险评价模型的构建；用于利用所述风险评价模型中的编码器提取患者表型，所述患者表型通过所述风险评价网络计算血透并发心血管疾病的评分；用于为患者设置真实标签，当患者患有心血管并发症，则真实标签为1；反之，则真实标签为0；用于利用所述评分和所述真实标签对损失函数进行优化。8.如权利要求6所述的一种融合主动学习和对比学习的血透并发心血管疾病预测系统，其特征在于，所述主动学习单元具体包括：用于对所述风险评价模型输出的患者表型做归一化处理，得到的患者表征通过归一化处理映射到0-1空间中；用于利用正负样本挑选规则器分别计算所述扩增结构化数据中的每个样本表征到其他样本表征在0-1空间方向的夹角；用于将计算得到每个样本的夹角按照其他样本的真实标签是否和当前样本的真实标签相同，分为第一组和第二组，并将第一组和第二组内部分别按从小到大排序；用于将排序后的第一组中选取上四分位数作为正样本集，排序后的第二组中选取下四分位数作为负样本集。9.如权利要求6所述的一种融合主动学习和对比学习的血透并发心血管疾病预测系统，其特征在于，所述对比学习单元具体包括：用于利用所述正负样本进行对比学习，正样本和患者样本的真实标签相同，负样本和患者样本的真实标签不同，计算正样本和患者样本的正样本余弦距离、负样本和患者样本的负样本余弦距离，通过正样本余弦距离和负样本余弦距离构建对比学习单元的损失函数，更新与风险评价单元共用的编码器的网络参数。10.如权利要求6所述的一种融合主动学习和对比学习的血透并发心血管疾病预测系
统，其特征在于，所述风险评价单元、所述主动学习单元和所述对比学习单元共用所述编码器，所述编码器为5层全连接网络，每层节点数分别为1024、512、256、128、64，激活函数为relu。

技术总结
本发明公开了融合主动学习和对比学习的血透并发心血管疾病预测系统，包括：血透数据准备模块，用于利用医院电子信息系统和日常监测设备提取患者样本的结构化数据，并对所述结构化数据处理得到扩增结构化数据；血透并发心血管疾病风险预测模块，用于构建风险评价模型，将所述扩增结构化数据通过所述风险评价模型训练学习得到患者表征和评分，并利用所述患者表征和评分进行血透并发心血管疾病风险预测。本发明解决正负样本匹配问题，利用血透并发心血管疾病的真实标签数据，迭代式地更新对比学习模型参数，利用真实的并发症结果标签提升模型性能；解决采集的样本过少或者阳性样本和阴性样本数量不平衡的问题，同时减少扩增数据与原始数据的差异性。据与原始数据的差异性。据与原始数据的差异性。

技术研发人员：李劲松王丰池胜强朱伟伟
受保护的技术使用者：之江实验室
技术研发日：2023.01.09
技术公布日：2023/2/27

完整全部详细技术资料下载

当前第2页1 2