基于铁代谢指标的结核病风险预测模型的构建方法和系统与流程

文档序号:18036098发布日期:2019-06-28 23:20阅读:193来源:国知局
基于铁代谢指标的结核病风险预测模型的构建方法和系统与流程
本发明涉及模型的构建方法,具体涉及一种基于铁代谢指标的结核病风险预测模型的构建方法和系统。
背景技术
:结核病是严重危害人类健康的慢性传染性疾病。据世界卫生组织2016年报道,全球新发1040万人,死亡140万人,耐药48万人。我国是全球结核病高负担第二的国家,如何提高结核病防治效果是国家布局的重大攻关课题。及时发现和诊断结核病患者,是当前提高治疗成功率,减少疾病传播的结核病防治主要策略。然而,由于结核病的复杂性和特殊性,当前的结核病诊断技术远远不能满足临床的需求。病原学诊断,也就是从患者来源的标本中找到结核菌存在的直接证据,是当前确诊结核病的金标准,具体包括微生物学显微镜检查(分枝杆菌抗酸染色涂片)和分枝杆菌培养,以及近年来发展的核酸检测诊断技术。遗憾的是,这些技术存在敏感性严重不足的缺点,即便联合应用上述三项检测技术的敏感性也不足50%:另外,结核菌培养还存在耗时长(1到2个月),对生物安全要求高等缺点。这些现实问题,不仅容易造成临床上的误诊和漏诊,延误治疗机会,而且从结核病预防控制的角度,显著增加了结核在社区播散的机会,增加结核病防控的难度。人工神经网络是由大量处理单元互联组成的非线性、自适应信息处理系统。它是在现代神经科学研究成果的基础上提出的,试图通过模拟大脑神经网络处理、记忆信息的方式进行信息处理。它的构筑理念是受到生物(人或其他动物)神经网络功能的运作启发而产生的。人工神经网络通常是通过一个基于数学统计学类型的学习方法(learningmethod)得以优化,所以人工神经网络也是数学统计学方法的一种实际应用,通过统计学的标准数学方法我们能够得到大量的可以用函数来表达的局部结构空间,另一方面在人工智能学的人工感知领域,我们通过数学统计学的应用可以来做人工感知方面的决定问题(也就是说通过统计学的方法,人工神经网络能够类似人一样具有简单的决定能力和简单的判断能力),这种方法比起正式的逻辑学推理演算更具有优势。铁是维持结核菌和宿主基本代谢的重要微量元素,铁代谢与结核病发生发展关系密切。临床上通过络合法、化学发光法和免疫比浊法来检测人血清样本中铁代谢相关指标:血清铁serumiron、铁蛋白ferritin和转铁蛋白transferrin。我们测定了样本人血清中铁代谢指标的数据,利用神经网络模型(nnet,neuralnetwork)对这三个指标进行建模分析,该模型是把已知的足够多的系统输入、输出值做为训练样本,按给定的规则训练网络,使该网络的输出误差控制在预定范围内的一种算法。nnet具有大规模并行、分布式存储和处理、自组织、自适应和自学能力,特别适合处理需要同时考虑许多因素和条件的、不精确和模糊的信息处理问题;我们利用该算法和铁代谢指标,建立了一种结核病发病风险预测的模型,该模型具有高敏感性、特异性,可用于结核病发病的风险评估。技术实现要素:本发明的目的在于提供一种基于铁代谢指标的结核病风险预测模型的构建方法,利用神经网络算法,构建用于评估结核病发病风险模型。为实现上述目的,本发明提供了一种基于铁代谢指标的结核病风险预测模型的构建方法,包括以下步骤:(1)样本的收集与处理;(2)从样本中测定铁代谢指标,具体包括三种代谢相关指标的数据,即血清铁、转铁蛋白和铁蛋白;(3)使用神经网络的方法拟合训练集进行模型的构建,记录最优模型参数;同时根据roc曲线使用验证集计算模型分类的阈值,构建得到结核病发病风险评估模型。进一步地,所述步骤(1)中样本的收集与处理的具体方法为:每位受试者空腹12h,使用含有分离胶的真空管采集静脉血5ml,血标本室温放置30min~45min后,1000g离心5分钟,分离血清,置洁净试管加盖低温保存。进一步地,所述步骤(2)中血清铁的检测方法为络合法,转铁蛋白的检测方法为免疫比浊法,铁蛋白的检测方法为化学发光法。进一步地,所述步骤(3)中模型建立及优化的具体方法为:纳入肺结核患者、健康对照者、结核菌潜伏感染、结核病治愈、非结核菌肺炎病人,将纳入者按照3:1比例完全随机分为训练组和测试组,所有血清铁、转铁蛋白和铁蛋白含量值均取log2(x),采用神经网络模型,通过5次随机抽样、10倍交叉验证后,最终选择网络层数为5,权重衰减值为0.1,诊断阈值为0.3823。基于这种构建方法的构建系统,包括:数据采集模块,至少用于数据采集,获取样本数据集;数据处理模块,至少用于从样本数据集中提取可用于构建评估模型的有效样本;模型构建模块,至少用于将所述有效样本的不完整数据集随机分割为训练集和验证集,并使用神经网络的方法拟合训练集,记录最优模型参数;阈值计算模块,至少用于根据roc曲线使用验证集计算模型分类阈值。本发明的优点在于:本发明测定了样本人血清中铁代谢指标的数据,利用神经网络模型(nnet,neuralnetwork)对这三个指标进行建模分析,该模型是把已知的足够多的系统输入、输出值做为训练样本,按给定的规则训练网络,使该网络的输出误差控制在预定范围内;利用该算法和铁代谢指标,建立了一种结核病发病风险预测的模型,该模型具有高敏感性、特异性,可用于结核病发病的风险评估。附图说明图1(a)是本发明实施例中标本血清铁的含量值的比较图;图1(b)是本发明实施例中标本铁蛋白的含量值的比较图;图1(c)是本发明实施例中标本转铁蛋白的含量值的比较图;图2是本发明实施例中基于神经网络算法的结核病发病风险评估模型的预测值;图3是本发明实施例中基于神经网络算法的结核病风险评估模型的roc曲线图。具体实施方式下面结合附图和具体实施方式对本发明做进一步说明,以下实施例旨在说明本发明而不是对本发明的进一步限定。本发明所采用的原料均能够从市场上购买或按照现有技术合成。实施例一种基于铁代谢指标的结核病风险预测模型的构建方法,包括以下步骤:(1)样本的收集与处理;本实施例纳入人群空腹12h,使用含有分离胶的真空管采集静脉血5ml,血标本室温放置30min~45min后,1000g离心5分钟,分离血清,置洁净试管加盖低温保存;血清样本可在2-8℃储存一周。(2)从样本中测定铁代谢指标,具体包括三种代谢相关指标的数据,即血清铁、转铁蛋白和铁蛋白;血清铁的检测方法为络合法,转铁蛋白的检测方法为免疫比浊法,铁蛋白的检测方法为化学发光法;检测的具体步骤如下:步骤一:络合法检测血清铁含量全自动生化仪器(西门子siemensadvia2400)检测标本前需要采用血清铁标准品进行校正,按照仪器使用sop输入正确的实验参数,仪器自动向反应杯中加入100μl样本、1000μlr1,室温孵育5分钟,记录595nm处吸光度a1,然后加入250μlr2,其中r1和r2均来源于铁测定试剂盒,室温反应5分钟,记录吸光度a2,计算样本的吸光度差值(a2-a1),并建立标准液吸光度-浓度对应关系的工作曲线,在工作曲线上读取对应的浓度值(μg/dl);步骤二:免疫比浊法检测转铁蛋白含量使用西门子siemensadvia2400进行检测,检测标本前需采用转铁蛋白标准品进行校正,按照仪器使用sop输入正确的实验参数,仪器自动向反应杯中加入100μl样本、1000μlr1,室温孵育5分钟,记录340nm处吸光度a1,然后加入5μlr2,其中r1和r2均来源于转铁蛋白测定试剂盒,室温反应5分钟,记录吸光度a2,计算样本的吸光度差值(a2-a1),并建立标准液吸光度-浓度对应关系的工作曲线,在工作曲线上读取对应的浓度值(g/l);步骤三:化学发光法检测血清铁蛋白含量免疫化学发光检测系统(雅培i2000sr)检测标本前需要采用不同浓度铁蛋白标准品进行校正,按照仪器使用sop输入正确的实验参数,仪器将标本自动加入反应杯中,同时加入微粒子r1,孵育10min,样本中的铁蛋白和铁蛋白抗体包被的微粒子结合;冲洗后,加入吖啶酯标记的铁蛋白抗体结合物r2,形成混合物之后,再次冲洗,将预激发液和激发液加入到反应混合物中,其中r1和r2均来源于铁蛋白测定试剂盒。测定产生的化学发光反应,以相对发光单位表示;样本中的铁蛋白含量和光学系统检测到的相对发光单位值之间成正比;即可建立标准品浓度相对发光单位-浓度对应关系的工作曲线,在工作曲线上读取样本对应的浓度值(pmol/l)。上述过程中使用的标准品和检测试剂具体信息如下表1所示:表1:(3)使用神经网络的方法拟合训练集进行模型的构建,记录最优模型参数;同时根据roc曲线使用验证集计算模型分类的阈值,构建得到结核病发病风险评估模型;为了简明易懂,在本发明中使用了一些简单缩写,具体如下表所示:本实施例将人群分为五组:健康对照hc200例、结核病tb316例、结核菌潜伏感染ltbi167例、结核病治愈rxtb100例和非结核性细菌性肺炎pn100例,通过检测每例外周血血清铁、铁蛋白和转铁蛋白的含量,绘制得到图1(a)为标本血清铁的含量值的比较,图1(b)为标本铁蛋白的含量值的比较和图1(c)为标本转铁蛋白的含量值的比较,将全部实施例按照4:1比例完全随机分为训练组和测试组,其中训练组包括152hc,237tb,132ltbi,63rxtb和79pn;测试组包括48hc,79tb,35ltbi,37rxtb和21pn;将所有标本血清铁、铁蛋白和转铁蛋白含量值均取log2(x),本实施例nnet模型采用权重衰减(weightdecay),尽量减少分类误差,避免模型过度拟合(over-fitting);将训练组数据输入nnet模型,通过5次随机抽样、10倍交叉验证(crossvalidation)后,最终选择网络层数为5,权重衰减值为0.1;训练组样本经过nnet模型换算后(nnet值),通过roc曲线判断nnet值用于预测结核病发病风险的的效能,具体包括auc、准确性、灵敏度和特异性;为提供结核病发病预测方法,通过调整阈值(cut-off)使特异性接近90%,尽可能选择较高灵敏度;当阈值为0.3823时,训练组及测试组结核病人相对应换算值(nnet值)均明显高于其余四组人群,具体结果如图2所示,图2是本发明实施例中基于铁代谢指标的神经网络算法用于结核病发病风险评估模型的分析结果,可用于结核病风险评估。图3表示本发明实施例基于神经网络算法的结核病风险评估模型的roc曲线图;用于获取评估结核病发病分险的最佳阈值,通过roc曲线,在阈值为0.3823时,灵敏度和特异性为表2所示;表2参数训练组测试组auc0.91(0.89,0.94)0.90(0.86,0.94)准确性0.85(0.82,0.88)0.84(0.79,0.89)灵敏度0.83(0.77,0.87)0.70(0.58,0.79)特异性0.86(0.83,0.89)0.92(0.86,0.96)表2表示基于铁代谢指标的nnet模型在训练组和测试组中用于预测结核病发病风险的检验效能,nnet模型在训练组和测试组中的auc、准确性、灵敏度、特异性分别为:0.91(95%ci0.89-0.94)、85%(95%ci82%-88%)、83%(95%ci77%-87%)、86%(95%ci83%-89%)和0.90(95%ci0.86-0.94)、84%(95%ci79%-89%)、70%(95%ci58%-79%)、92%(95%ci86%-96%)。本发明还提供了基于铁代谢指标的结核病风险预测模型的构建方法的构建系统,包括:数据采集模块,至少用于数据采集,获取样本数据集;数据处理模块,至少用于从样本数据集中提取可用于构建评估模型的有效样本;模型构建模块,至少用于将所述有效样本的不完整数据集随机分割为训练集和验证集,并使用神经网络的方法拟合训练集,记录最优模型参数;阈值计算模块,至少用于根据roc曲线使用验证集计算模型分类阈值。综上所述,本发明通过检测病人外周血清铁、铁蛋白和转铁蛋白含量指标,然后利用建立的运算公式模型,计算各个标本nnet值及诊断阈值,从而诊断病人是否患有活动性结核病。nnet值越高,则说明患结核的可能性高。最后应说明的是:以上实施例仅用以说明本发明而并非限制本发明所描述的技术方案;本领域的普通技术人员应当理解,仍然可以对本发明进行修改或等同替换;而一切不脱离本发明的精神和范围的技术方案及其改进,其均应涵盖在本发明的权利要求范围中。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1