一种血液恶性肿瘤的筛查方法和系统与流程

文档序号:30220284发布日期:2022-05-31 21:21阅读:2400来源:国知局
一种血液恶性肿瘤的筛查方法和系统与流程

1.本发明属于医疗数据处理领域,一种血液恶性肿瘤的筛查方法和系统。


背景技术:

2.本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
3.常见的血液肿瘤主要包括各类白血病、多发性骨髓瘤以及恶性淋巴瘤,是一类严重影响人群健康的恶性肿瘤。目前已有的hm筛查模型,往往只选用了健康人和血液恶性肿瘤两种人群,或是简单调整样本比例提高阳性预测值。实际上我们在研究中发现,不同类型的疾病对筛查模型的影响很大。简单的利用普通人群构建模型,在实际使用中会出现特定疾病人群阳性率偏高的问题,造成大量误报。通过调整学习样本中不同疾病的比例,可以构建最佳学习样本,从而大幅提高模型的抗干扰能力。


技术实现要素:

4.为了解决上述问题,本发明利用血常规筛查血液恶性肿瘤,特别改进了其他非血液恶性肿瘤疾病的干扰,创新了血液恶性肿瘤筛查方式。
5.为了实现上述目的,本发明采用如下技术方案:数据获取模块,其用于获取血常规检验数据,通过识别血常规化验单图片或直接从电子数据中导入;模型构建模块,通过对健康人群、常见疾病人群、非血液系统恶性肿瘤人群和血液恶性肿瘤人群建立样本,并利用机器学习算法得到筛查模型;筛查模块,利用筛查模型检查血液恶性肿瘤。
附图说明
6.构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
7.图1是本发明实施例的一种血液恶性肿瘤的筛查方法和系统结构示意图。
8.图2是本发明实施例的xgboost算法训练集变量重要性排序结果。
具体实施方式
9.下面结合附图与实施例对本发明作进一步说明。
10.应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常
理解的相同含义。
11.图1给出了本实施例的一种血液恶性肿瘤的筛查方法和系统,其包括:(1) 数据获取模块,其用于获取血常规检验数据,通过识别血常规化验单图片或直接从电子数据中导入。
12.其中血常规指标包括白细胞计数(wbc),红细胞计数(rbc),血红蛋白(hb),红细胞比容(hct),平均红细胞体积(mcv),平均红细胞血红蛋白含量(mch),平均红细胞血红蛋白浓度(mchc),血小板计数(plt),淋巴细胞百分比(lymph%),单核细胞百分比(mono%),中性粒细胞百分比(neut%),嗜酸性粒细胞百分比(eos%),嗜碱性粒细胞百分比(baso%),淋巴细胞计数(lymph),单核细胞计数(mono),中性粒细胞计数(neut),嗜酸性粒细胞计数(eos),嗜碱性粒细胞计数(baso),红细胞体积分布宽度cv(rdw-cv),红细胞体积分布宽度sd(rdw-sd),血小板分布宽度(pdw),平均血小板体积(mpv),大血小板百分比(p-lcr%),血小板比容(pct)。
13.(2) 模型构建模块,通过对健康人群、常见疾病人群、非血液系统恶性肿瘤人群和血液恶性肿瘤人群建立样本,并利用机器学习算法得到筛查模型。
14.步骤1:健康人群、常见疾病人群、非血液系统恶性肿瘤人群为阴性样本,血液恶性肿瘤人群为阳性样本。
15.步骤2:通过遗传算法调整不同比例的人群样本,并对各种比例的样本的血常规数据使用机器学习算法训练和测试,筛选最好的评价指标模型。图2是根据变量在xgboost模型中被调用的次数,所得到的筛查因子的重要性排序结果。不同比例人群样本模型变量的排序也有所变化。机器学习算法模型可以为预设的算法,svm、随机森林算法、lightgbm算法或xgboost算法。机器学习算法模型也可为经多个算法比较后筛选出的最优机器学习算法模型。
16.(3) 筛查模块,利用筛查模型检查血液恶性肿瘤。
17.对于本领域的技术人员来说,本发明可以有各种更改和变化,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。


技术特征:
1.一种血液恶性肿瘤的筛查方法和系统,其特征在于,包括:数据获取模块,其用于获取血常规检验数据,通过识别血常规化验单图片或直接从电子数据中导入;模型构建模块,通过对健康人群、常见疾病人群、非血液系统恶性肿瘤人群和血液恶性肿瘤人群建立样本,并利用机器学习算法得到筛查模型;筛查模块,利用筛查模型检查血液恶性肿瘤。2.如权利要求1所述的一种血液恶性肿瘤的筛查方法和系统,其特征在于,常见疾病人群包括冠心病、脑卒中、糖尿病、肺炎、慢性胃炎、慢性肾炎、肝炎。3.如权利要求1所述的一种血液恶性肿瘤的筛查方法和系统,其特征在于,非血液系统恶性肿瘤人群包括肺癌、肝癌、胃癌、食道癌、结直肠癌、乳腺癌、宫颈癌、肾癌、胰腺癌、甲状腺癌、前列腺癌、卵巢癌、鼻咽癌。4.如权利要求1所述的一种血液恶性肿瘤的筛查方法和系统,其特征在于,健康人群、常见疾病人群、非血液系统恶性肿瘤人群为阴性样本,血液恶性肿瘤人群为阳性样本。5.如权利要求4所述的一种血液恶性肿瘤的筛查方法和系统,其特征在于,通过调整各种疾病的占比构建总体样本,并对各种比例下的样本血常规数据使用机器学习算法训练和测试,筛选评价指标最好的模型。6.如权利要求5所述的一种血液恶性肿瘤的筛查方法和系统,其特征在于,模型评价指标包括预测正确率、auc、灵敏度、特异度、ppv、npv。7.如权利要求6所述的一种血液恶性肿瘤的筛查方法和系统,其特征在于,利用多种机器学习算法进行模型计算,并选择评价指标最好的模型。

技术总结
本发明公开一种血液恶性肿瘤的筛查方法和系统,属于医疗数据处理领域。其特征在于,包括:数据获取模块,其用于获取血常规检验数据,通过识别血常规化验单图片或直接从电子数据中导入;模型构建模块,通过对健康人群、常见疾病人群、非血液系统恶性肿瘤人群和血液恶性肿瘤人群建立样本,并利用机器学习算法得到筛查模型;筛查模块,利用筛查模型检查血液恶性肿瘤。本发明利用血常规筛查血液恶性肿瘤,特别改进了其他非血液恶性肿瘤疾病的干扰,创新了血液恶性肿瘤筛查方式。血液恶性肿瘤筛查方式。血液恶性肿瘤筛查方式。


技术研发人员:季凯 王正
受保护的技术使用者:王正
技术研发日:2022.03.07
技术公布日:2022/5/30
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1