一种川崎病丙球无反应预测方法、存储介质及终端设备与流程

文档序号:26269810发布日期:2021-08-13 19:23阅读:118来源:国知局
一种川崎病丙球无反应预测方法、存储介质及终端设备与流程

本发明涉及儿童川崎病发生丙球无反应的预测技术领域,尤其涉及一种川崎病丙球无反应预测方法、存储介质及终端设备。



背景技术:

川崎病(kawasakidisease,kd)又称皮肤粘膜淋巴结综合征,由日本学者川崎富于1967年首次报道。kd主要发生在5岁以下的儿童,目前病因不明,系急性、自限性的发热出疹血管炎性疾病,可累及全身中、小血管,目前已取代风湿热成为发达国家儿童后天获得性心脏病首位病因,其发病率呈现逐年上升趋势。川崎病的病因及发病机制尚未完全明确,炎症性反应为其主要病理生理学过程。kd的严重并发症是冠状动脉瘤(coronaryarteryaneurysm,caa)形成。研究表明血管内皮细胞功能持续障碍是冠状动脉瘤的重要原因,小檗碱(berberine,bbr)因其血管内皮细胞保护作用可能是kd新的治疗方法。大剂量静脉注射免疫丙种球蛋白(intravenousimmunoglobulin,ivig)是目前公认的一线治疗,免疫丙种球蛋白的使用剂量不管是1g/kg/d1-2天或单次2g/kg/d,其疗效差异无统计学意义[7]。经ivig治疗后,冠状动脉瘤发生率已从25%降至4%左右,但仍有10%-20%患儿出现ivig无反应(intravenousimmunoglobulinresistant,ivigr)。2017年aha关于kd诊疗指南对ivigr定义为,应用首剂静脉注射免疫丙种球蛋白结束至少36小时后到两周期间仍有或再次出现体温(腋窝)≥37.3℃,并伴随5项主要临床诊断至少一项者。主要临床表现为:①口唇潮红干裂、草莓舌、咽部及口腔粘膜红斑;②双侧非渗出性结膜炎;③皮疹:斑丘疹、弥漫性红皮病、多形性红斑;④急性期手足潮红或硬肿,亚急性期甲周脱屑;⑤单侧颈部淋巴结肿大(直径≥1.5cm)。

目前已有相关研究表明发病年龄<12个月,男性患儿,首剂ivig治疗早于急性期病程4天,血常规中高水平的白细胞(wbc)和中性粒细胞百分比(neu%)、低水平的血小板计数(plt)和血红蛋白浓度(hb),炎症指标如红细胞沉降率(esr)、c反应蛋白(crp)、降钙素原(pct)的升高,生化检验中低水平的血清白蛋白(alb)和血清钠离子浓度、高水平的钾离子浓度、总胆红素(tb)、谷草转氨酶(ast)以及谷丙转氨酶(alt),评估心肌功能中高水平的乳酸脱氢酶(ldh)和心房钠尿肽(nt-probnp)等是预测川崎病患儿发生ivigrkd的常见危险因素[9-12]。也有新研究提示nlr、plr、mpvlr等外周血细胞参数是发生ivigrkd的危险因素,因血常规在临床中廉价、操作简单易行,近年来逐渐被关注。世界各地区研究人员在此基础上建立预测ivigrkd评分系统,目前影响力较大的有,日本kobayashi、egami、sano,韩国moon,中国大陆地区北京yang,中国大陆地区上海wang,中国台湾地区lin建立的formosa评分系统等。上述评分系统在kd临床治疗方案上除了moon对ivig使用剂量为1g/kg,其余研究均采用ivig2g/kg的治疗量。但各研究的评分项目差异较大,在预测效能上灵敏度和特异度高低不一,显示出不同评分系统地区特异性。其他地区对上述某些评分体系进行预测效能评价,如loomba等、sleeper等和tremoule等的研究应用egami于美国kd患儿,sarah等探讨kobayashi于英国kd患儿,shin等对韩国患儿应用kobayashi进行验证,fu等将kobayashi应用于中国北京kd患儿,何跃娥等将kobayashi、egami、sano三各评分系统应用于中国温州kd患儿。以上评分体系预测效能均不高,因此现依然没有任何一个预测ivigrkd评分系统能被全世界广泛接受并指导于临床应用。目前中国深圳地区暂未建立起川崎病专病数据库,亦缺乏高效能的预测ivigrkd评分模型。

因此,现有技术还有待于改进和发展。



技术实现要素:

鉴于上述现有技术的不足,本发明的目的在于提供一种川崎病丙球无反应预测方法、存储介质及终端设备,旨在解决现有ivigrkd评分系统的评分项目差异较大,在预测效能上灵敏度和特异度高低不一,显示出不同评分系统地区特异性的问题。

本发明的技术方案如下:

一种川崎病丙球无反应预测方法,其中,包括步骤:

运用lasso对川崎病临床训练数据集进行特征筛选,选出14个与发生ivigrkd相关的特征;

将所述14个特征进行logistic回归,构建lasso-logistic回归模型;

根据所述lasso-logistic回归模型绘制列线图,并根据所述lasso-logistic回归模型中14个特征对发生ivigrkd的贡献程度,在每个特征对应线段上标注刻度,表示该特征的取值范围,线段的长度反映了该特征对发生ivigkd的贡献度;

给每个特征的每个取值水平进行赋分并计算14个特征的总得分,通过总得分与发生ivigkd概率之间的函数转换关系得出川崎病丙球无反应预测结果。

所述川崎病丙球无反应预测方法,其中,所述14个特征为年龄、ivig治疗前血常规中的平均血小板体积、血小板与淋巴细胞比值、嗜酸性粒细胞绝对值、ivig治疗后48h血常规中的中性粒细胞绝对值、血小板计数、血红蛋白浓度、红细胞计数、谷草转氨酶、钠离子浓度、总蛋白、白蛋白、是否有无菌性脓尿以及左冠状动脉前降支的z值。

所述川崎病丙球无反应预测方法,其中,logistic回归方程为:log-oddsratioforivigr=21.0427+(-0.26)×年龄+(-0.38)×ivig治疗前血常规中的平均血小板体积+0.0006×血小板与淋巴细胞比值+(-10.2483)×嗜酸性粒细胞绝对值+0.00269×谷草转氨酶+(-0.127)×钠离子浓度+(-0.0418)×白蛋白+0.0461×总蛋白+1.0832×是否有无菌性脓尿+0.00163×血小板计数+(-0.0277)×血红蛋白浓度+0.2167×ivig治疗后48h血常规中的中性粒细胞绝对值+(-0.569)×红细胞计数+0.0451×左冠状动脉前降支的z值。

所述川崎病丙球无反应预测方法,其中,运用lasso对川崎病临床训练数据集进行特征筛选,选出14个与发生ivigrkd相关的特征之前,还包括步骤:

获取川崎病临床病例数据,并对所述川崎病临床病例数据进行初步统计、数据清洗、缺失值填补及标准化处理,得到标准化川崎病临床数据;

将所述标准化川崎病临床数据按照预定比例划分成川崎病临床训练数据集和川崎病临床验证数据集。

一种存储介质,其中,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现本发明任意一项川崎病丙球无反应预测方法中的步骤。

一种终端设备,其中,包括处理器,适于实现各指令;以及存储介质,适于存储多条指令,所述指令适于由处理器加载并执行本发明任意一项川崎病丙球无反应预测方法中的步骤。

有益效果:本发明提供的川崎病丙球无反应预测方法,采用lasso进行特征选择,可解释性强,入选的变量能避免过拟合,而后将所选特征进行logistic回归处理,构建的lasso-logistic回归模型用于预测ivigrkd具有更高的灵敏度和特异度;本发明还将lasso-logistic回归模型绘制成可视化的列线图,使得预测模型易于理解;并且临床医生根据病人临床资料数据可在列线图中评分后得出ivigrkd发生概率,具有临床应用性。

附图说明

图1为本发明提供的一种川崎病丙球无反应预测方法较佳实施例的流程图。

图2为本发明提供的一种川崎病丙球无反应预测方法的具体流程图。

图3为本发明根据lasso-logistic回归模型绘制的列线图示意图。

图4为本发明一种终端设备的原理框图。

具体实施方式

本发明提供一种川崎病丙球无反应预测方法、存储介质及终端设备,为使本发明的目的、技术方案及效果更加清楚、明确,以下对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。

机器学习是一门多学科交叉的专业,它涵盖概率论知识、统计学知识、近似理论知识和复杂算法知识,以计算机作为工具,致力于真实实时的模拟人类学习方式,将现有内容进行知识结构划分来有效提高学习效率[29]。机器学习处理的是数据,通过学习输入的数据,从而建立模型,以便预测新的数据都输出。它具有学习能力强、覆盖范围广、适应力强和可移植性好的优势,因此应用广泛,在数据分析与挖掘、模式识别(如医学图像分析、生物特征识别、搜索引擎等)、生物信息学以及人工智能等领域均有应用。目前结合机器学习等智能计算技术的大数据分析技术是大数据领域研究热点和发展趋势。

现有技术中,kobayashi、egami、sano等提出的ivigrkd预测模型多运用多变量回归分析选出ivigrkd的危险因素,并纳入评分项目,根据roc曲线或四分位数决定各评分项目得临界值,再以or值、hr值或回归系数确定每个变量的权重,最终依据roc曲线的灵敏度和特异度等指标建成ivigrkd预测评分系统,导致评分项目差异较大,在预测效能上灵敏度和特异度高低不一,显示出不同评分系统地区特异性。

基于此,本发明提供了一种川崎病丙球无反应预测方法,如图1所示,其包括步骤:

s10、运用lasso对川崎病临床训练数据集进行特征筛选,选出14个与发生ivigrkd相关的特征;

s20、将所述14个特征进行logistic回归,构建lasso-logistic回归模型;

s30、根据所述lasso-logistic回归模型绘制列线图,并根据所述lasso-logistic回归模型中14个特征对发生ivigrkd的贡献程度,在每个特征对应线段上标注刻度,表示该特征的取值范围,线段的长度反映了该特征对发生ivigkd的贡献度;

s40、给每个特征的每个取值水平进行赋分并计算14个特征的总得分,通过总得分与发生ivigkd概率之间的函数转换关系得出川崎病丙球无反应预测结果。

本实施例选用lasso进行特征选择,后与分类器logistic回归建立ivigrkd预测模型,选择它们的原因是,lasso能够对变量进行筛选和降低模型的复杂程度,避免过拟合,logistic回归是经典回归方法,适用于自变量与因变量呈线性关系的数据,将所选特征进行logistic回归处理构建的lasso-logistic回归模型用于预测ivigrkd具有更高的灵敏度和特异度;本实施例还将lasso-logistic回归模型绘制成可视化的列线图,使得预测模型易于理解;并且临床医生根据病人临床资料数据可在列线图中评分后得出ivigrkd发生概率,具有临床应用性。

本实施例中,lasso是机器学习中的一种特征筛选算法,是一种处理具有复共线性数据的有偏估计。通过构造一个惩罚函数得到一个较为精炼的模型,使得它压缩一些系数,得出的非零系数的变量即为所选出的特征。

在一些实施方式中,对2014年-2018年深圳市儿童医院833例川崎病临床病例数据进行研究,如图2所示,首先对所述川崎病临床病例数据进行初步统计、数据清洗、缺失值填补及标准化处理,得到标准化川崎病临床数据,将所述标准化川崎病临床数据按照预定3:7的比例划分得到70%的川崎病临床训练数据集和30%的川崎病临床验证数据集;之后运用lasso对川崎病临床训练数据集进行特征筛选,选出14个发生ivigrkd的危险因素,即获得14个特征,将所述14个特征进行logistic回归处理,构建lasso-logistic回归模型,基于此结果绘制列线图(又称诺模图,nomogram),它建立于多因素回归分析基础上,整合多个预测指标,运用带有刻度的线段,按照一定比例绘制在同一平面上,以表达预测模型中各变量的相互关系。

在本实施例中,选出的14个特征为年龄,ivig治疗前血常规中的平均血小板体积(mpv)、血小板与淋巴细胞比值(plr)以及嗜酸性粒细胞绝对值(eo),ivig治疗后48h血常规中的中性粒细胞绝对值(neu)、血小板计数(plt)、血红蛋白浓度(hb)以及红细胞计数(rbc),谷草转氨酶(ast)、钠离子浓度,总蛋白(tp),白蛋白(alb),是否有无菌性脓尿(pyuria),左冠状动脉前降支的z值(ladz)。

本实施例中,计算得到的logistic回归方程见下:log-oddsratioforivigr=21.0427+(-0.26)×age+(-0.38)×mpv+0.0006×plr+(-10.2483)×eo+0.00269×ast+(-0.127)×na+(-0.0418)×alb+0.0461×tp+1.0832×pyuria+0.00163×plt+(-0.0277)×hb+0.2167×neu+(-0.569)×rbc+0.0451×ladz。

在本实施例中,当构建lasso-logistic回归模型后,可采用30%的川崎病临床验证数据集运用bootstrap法有放回地重复抽样1000次建模,计算lasso-logistic回归模型的auc值、灵敏度、特异度、准确率及其95%可信区间,通过灵敏度、特异度、auc、95%可信区间等指标与目前现有影响力较大的ivigrkd评分系统进行比较,评价新模型可靠性。

在本实施例中,如图3所示,在构建lasso-logistic回归模型后,根据模型中14个特征对发生ivigrkd的贡献程度,在每个特征对应线段上标注刻度,表示该特征的取值范围,线段的长度反映了该特征对发生ivigkd的贡献度。对于是否存在无菌性脓尿(pyuria)该二分类特征,若存在脓尿则在列线图中记为“有”,否则记为“无”。

在本实施例中,根据临床病例数据给每个特征的每个取值水平进行赋分并计算得分,这里包括单项得分(每个特征在不同取值下对应的单项得分),以及总得分(全部变量取值后对应的单项得分合计的总得分),最后通过总得分与发生ivigkd概率之间的函数转换关系得出结果。

在一些具体的实施方式中,如果一个患儿该14个特征总得分分别等于175、234、256、270、295以及315,其相应发生ivigrkd的预测概率分别是0.1%、10%、40%、70%、95%以及99%。

在一些实施方式中,还提供一种存储介质,其中,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如本发明所述川崎病丙球无反应预测方法中的步骤。

在一些实施方式中,还提供一种终端设备,如图4所示,其包括至少一个处理器(processor)20;显示屏21;以及存储器(memory)22,还可以包括通信接口(communicationsinterface)23和总线24。其中,处理器20、显示屏21、存储器22和通信接口23可以通过总线24完成相互间的通信。显示屏21设置为显示初始设置模式中预设的用户引导界面。通信接口23可以传输信息。处理器20可以调用存储器22中的逻辑指令,以执行上述实施例中的方法。

此外,上述的存储器22中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。

存储器22作为一种计算机可读存储介质,可设置为存储软件程序、计算机可执行程序,如本公开实施例中的方法对应的程序指令或模块。处理器20通过运行存储在存储器22中的软件程序、指令或模块,从而执行功能应用以及数据处理,即实现上述实施例中的方法。

存储器22可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器22可以包括高速随机存取存储器,还可以包括非易失性存储器。例如,u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。

此外,上述存储介质以及终端设备中的多条指令处理器加载并执行的具体过程在上述方法中已经详细说明,在这里就不再一一陈述。

作为举例,所述终端设备包括处理器20,所述处理器20可以调用存储器22中的逻辑指令,以执行以下指令:

运用lasso对川崎病临床训练数据集进行特征筛选,选出14个与发生ivigrkd相关的特征;

将所述14个特征进行logistic回归,构建lasso-logistic回归模型;

根据所述lasso-logistic回归模型绘制列线图,并根据所述lasso-logistic回归模型中14个特征对发生ivigrkd的贡献程度,在每个特征对应线段上标注刻度,表示该特征的取值范围,线段的长度反映了该特征对发生ivigkd的贡献度;

给每个特征的每个取值水平进行赋分并计算14个特征的总得分,通过总得分与发生ivigkd概率之间的函数转换关系得出川崎病丙球无反应预测结果。

下面通过具体实施例对本发明一种川崎病丙球无反应预测方法做进一步的解释说明:

实施例1

获得患儿临床病例数据为:年龄:5月,mpv:12.2fl,plr:198,ast:44iu/l,na:134mmol/l,alb:26g/l,tp:44.9g/l,pyuria:是,plt:478*109/l,hb:117g/l,neu:7.94*109/l,rbc:3.62*1012/l,ladz:3.73。

根据实施例1中患儿临床病例数据给川崎病患儿的“年龄,ivig治疗前血常规中的平均血小板体积(mpv)、血小板与淋巴细胞比值(plr)以及嗜酸性粒细胞绝对值(eo),ivig治疗后48h血常规中的中性粒细胞绝对值(neu)、血小板计数(plt)、血红蛋白浓度(hb)以及红细胞计数(rbc),谷草转氨酶(ast)、钠离子浓度,总蛋白(tp),白蛋白(alb),是否有无菌性脓尿(pyuria),左冠状动脉前降支的z值(ladz)”的每个取值水平进行赋分并计算单项得分,全部特征取值后对应的单项得分合计形成总得分=38+10+4+2+12+12+5+26+18+56+25+5=215,根据所述总得分对应预测ivigrkd发生率为79%。

应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1