一种基于血清中脂溶性代谢物因子的肠道健康状态诊断模型的建立方法及其应用与流程

文档序号:18983057发布日期:2019-10-29 03:58阅读:238来源:国知局
一种基于血清中脂溶性代谢物因子的肠道健康状态诊断模型的建立方法及其应用与流程
本发明属于肠道健康诊断
技术领域
,尤其涉及一种基于血清中脂溶性代谢物因子的肠道健康状态诊断模型的建立方法及其应用。
背景技术
:肠道健康状态,特别是大肠癌是发生在胃肠道的常见癌症,发病原因大多与不良生活习惯及老化有关,40岁以上人群的发病风险急剧上升。大肠癌在全球癌症中发病率第三、死亡率第二。在中国,大肠癌在癌症中的发病率位第三位,死亡率位于第五位。大肠癌是一个发展较缓慢的癌症,从早期发展到iv期可能会经过十年,0/i期大肠癌的5年存活率可达90%,而iv期的存活率仅为5-7%。早期大肠癌几乎没有什么症状,如果没有大肠癌早筛,患者往往到晚期才发现自己的肿瘤,因此早期发现对大肠癌患者的预后意义重大。目前临床公认及沿用的大肠癌早期筛查手段是传统的便潜血、肠镜、血清标记物检测以及新一代大肠癌筛查技术:基于粪便dna(sdna)或血液dna筛查技术。便潜血的干扰因素多,结果假阳性高,敏感性差,肠镜是大肠癌诊断的金标准。但由于国内医疗资源不足,医生有限,目前医院中肠镜的预约均需要1-2周甚至更长时间,这些还仅是针对症状的患者。再加上肠镜是侵入性的检查手段,患者的体验差,这使得肠镜不可能成为大规模筛查的手段。血清cea检查诊断大肠癌的敏感性低,早期诊断不明显。基于新技术的粪便dna(sdna)和血液dna筛查技术不仅价格昂贵,而且因为粪便dna是依赖肠粘膜脱落进入粪便的发生癌前病变的细胞中的异常dna,所以在发现癌前病变及早期肿瘤方面受限制,而血液dna筛查技术通过检测游离dna中甲基化基因,敏感度低于粪便dna,并且对息肉的检出率低,难以大规模人群使用。因此,检查方便,准确率高的大肠癌早期筛查方法成为迫切的需求。代谢组学(metabolomics/metabonomics)是近年来系统生物学研究领域中最活跃的分支学科之一,广泛应用于癌症研究领域。代谢组学采用高灵敏度、高通量的现代仪器分析手段,定性、定量地研究肿瘤发生发展过程中脂溶性代谢物的变化,筛选和鉴别新型肿瘤生物标志物,对肿瘤临床诊断及预后监控具有重要价值,展现出广阔的临床应用前景。多数研究都证实了代谢异常与大肠癌的发生发展密切相关,为寻找大肠癌相关的代谢性生物标志物奠定了基础。液相-串联质谱联用检测方法同时使用液相色谱分离和质谱离子对检测,具有灵敏度高、特异性强的特点。因此,基于液相-串联质谱联用检测方法(liquidchromatography-tandemmassspectrometry,lc-ms/ms)的靶向代谢组学研究大肠癌患者血液中的胃肠道代谢谱变化,寻找其变化规律,发展成为肿瘤生物标志物,对于大肠癌的诊断有着重要的临床价值和现实意义。第一类和本发明最接近的专利或专利申请均以血液为被检测样本,均用于大肠癌或其他胃肠道肿瘤的辅助诊断和筛查,但被检测的物质种类或分子不同,具体如下:1.以microrna为被检测物;2.以血清中氨基酸为被检测物,如专利申请201810798829.9;3.以血清中仅酶切处理后多肽物为被检测物,如专利申请201711173453.4;4.以血清中代谢物为被检测物,如专利申请201710260039;第二类和本发明使用检测方法相近,但被检测样本或被检测疾病不同的,包括如下申请:1.直接检测肿瘤组织或组织匀浆,如专利申请201710002126.6;2.唾液为被检物,如申请201910074569.5;3.尿液为被检物,如申请201811331633.5或201811361223.5;第三类和本发明相近的是检测方法相似,但没有针对特异的肿瘤的申请,如:针对血中大量代谢物的定性定量检测,如专利申请201811266123.4。依据这三类申请,本发明针对其的创新性由以下三个方面体现:1.对第三类申请,尽管检测方法相似,被检测的代谢物可能存在交叉,第三类申请是针对检测的方法进行专利,然后必须依赖使用全部选取的代谢物的全部信息,对被检测的疾病状态进行区分和鉴别,检测方法本身已经是仪器厂家公布的方法和数据,创造性不佳;2.第二类申请和本申请针对不同的组织样本,这类不同如临床应用中验尿或验血的不同,确定检测使用的不同样本范围。能够应用对血的检测,不一定能用在对尿上,而且临床意义也不相同,因此和本专利申请不同。3.第一类申请和本申请针对同种疾病,同种被检样本,但检测血液中代谢物标志物不同,且标志物筛选过程中的数据处理方式以及检测方法设置参数均不同,且建立模型过程也不相同,因此最终确定模型的检测精度也不同。技术实现要素:本发明是通过以下技术方案来实现:首先,建立同时检测人血清中110种脂溶性代谢物含量的液相-串联质谱联用检测方法;其次,将受试人员中的非肠道健康人群(包括大肠癌患者、癌前病变患者)和肠道健康人群按照约1:1比例分成训练集和测试集,进行该检测方法在人血清中脂溶性代谢物含量测定中的应用,即对受试人员进行血清中110种脂溶性代谢物的含量测定;而后,通过训练集样本的人工智能模式识别技术进行靶向脂溶性代谢物代谢组学研究,确定特异脂溶性代谢物"acetylcarnitinedl","rfa446","alanine","orn","rfa447","coenzymea_neg","choline","rfa449","uridine","lysine"可以作为潜在的诊断肠道健康的生物标志物;最后,通过人工智能神经网络建模,基于"acetylcarnitinedl","rfa446","alanine","orn","rfa447","coenzymea_neg","choline","rfa449","uridine","lysine"脂溶性代谢物因子建立肠道健康状态诊断模型,并确定截断值,经测试集样本验证后证实该诊断模型对肠道健康状态的各项诊断评价指标。所述的同时检测的人血清中110种脂溶性代谢物包括:"rfa446","rfa447","rfa449","myo-inositol","citrate-isocitrate","citrate","uridine","shikimate-3-phosphate","cyclic-amp","sedoheptulose1,7-bisphosphate(sbp)","s-adenosyl-l-homocysteine_neg","adenosine5-phosphosulfate","adp_neg","dgdp_neg","idp_neg","cholesterylsulfate","atp_neg","dgtp","dephospho-coa_neg","nadph_neg","coenzymea_neg","taurine","benzeneaceticacid","hypoxanthine","acetylphosphate","hydroxyphenylaceticacid","uricacid","d-glyceraldehdye-3-phosphate","shikimate","2-isopropylmalicacid","lysine","dephospho-coa_pos","imidazole","glutamine","gln","glutamate","methionine","met1","met2","n1-methyl2-pyridone-5-carboxamide","histidine","his","2-aminooctanoicacid","carnitine","phenylalanine","phe","1-methyl-histidine","arginine","arg","citrulline","cit","tyrosine","tyr1","gly","tyr2","phosphorylcholine","n-acetyl-glutamine","ng,ng-dimethyl-l-arginine","acetylcarnitinedl","tryptophan","putrescine","trp","kynurenine","β-ala","glycerophosphocholine","adenosine","1-methyladenosine","7-methylguanosine","cmp","ump","damp","amp","alanine","imp","gmp","aminoimidazolecarboxamideribonucleotide","s-adenosyl-l-homocysteine_pos","betainealdehyde","choline","dimethylglycine","α-abu","gaba","nadph","serine","ser","cytosine","creatinine","creatinine","proline","indole","betaine","coenzymea_pos","valine","urea","gaa","threonine","nicotinamide","dl-pipecolicacid","creatine","hydroxyproline","leucine-isoleucine","creatine","3-hyp","alpha-ile","ornithine","ea","orn","asparagine","asn","methylnicotinamide"。所述受试人员血清样本由61例非健康人群和80例健康人群的血清样本组成,其中,训练集的71例样本为28例非健康人群(癌前病变或大肠癌患者),43例健康人群;测试集的70例样本为33例非健康人群(癌前病变或大肠癌患者),37例健康人群。所述的液相-串联质谱联用检测方法包括以下步骤:首先利用液相系统将110种血清中脂溶性代谢物色谱分离,其次利用串联质谱系统以mrm半定量法建立110种血清中脂溶性代谢物与标准内标的比例关系,再通过梯度稀释方法,确定110种血清中脂溶性代谢物与标准内标的比例关系的线性范围和线性关系,最后对血清中选定的脂溶性代谢标志物的与标准内标的比例关系的线性范围和线性关系验证。即对血清样本中的200余种脂溶性代谢物进行靶向定量分析,建立血清中小分子化合物的液相-串联质谱联用定量筛选方法,筛选出峰形较好的110种脂溶性代谢物,并对其在血清中的含量进行相对定量检测,其检测结果以峰面积的形式呈现;优选的,液相-串联质谱联用检测系统的设置条件为:液相采用absciexexionlc超高效液相色谱仪系统:色谱柱为phenomenexgemininx-c18(3μm,50*2mm),柱温为40℃;流动相a相为含体积分数为5%的乙腈及20mm氢氧化铵,20mm乙酸铵的水溶液,流动相b相为乙腈,流速为0.35ml/min,洗脱时间23min,洗脱梯度为16min,2%b;17min,85%b;23min,85%b,自动进样器进样盘温度为4℃,进样体积为10μl,进样针吸取速度为5μl/s;联质谱采用absciexqtrap6500三重四极杆复合线性离子阱质谱系统:离子化模式为电喷雾电离正离子模式(esi+)和电喷雾电离负离子模式(esi-),监测模式为多反应监测(mrm);在正离子模式下,气帘气为25psi,碰撞气设置为high,离子化电压为5500v,温度475℃,喷雾气为33psi,辅助加热气为33psi;在负离子模式下,气帘气为25psi,碰撞气设置为high,离子化电压为-4500v,温度475℃,喷雾气为33psi,辅助加热气为33psi。优选的,待检测样品前处理过程如下:s1称取10.8mg胆酸,溶于1080μl甲醇中,震荡混匀,制成浓度为10mg/ml的胆酸内标储备溶液;将300ml甲醇中加入120μl胆酸内标储备液,作为沉淀溶液备用;s2血清4℃放置解冻,震荡,取15μl于ep管中,加入1ml沉淀溶液,震荡10min,15000g10℃离心15min,取上清液100μl,浓缩后储存于-80℃冰箱中,上机前将样品从-80℃冰箱中取出,100μl水重溶,涡旋混匀,15000g10℃离心10min,取上清液置于样品瓶中,等待检测。所述的血清靶向脂溶性代谢物代谢组学研究包括:采用方差分析、rf模型和人工智能模式识别技术对非肠道健康人群(包括大肠癌患者、癌前病变患者)和肠道健康人群的血清进行多维数据分析,得到最优差异脂溶性代谢物,分别为"acetylcarnitinedl","rfa446","alanine","orn","rfa447","coenzymea_neg","choline","rfa449","uridine","lysine",可以作为潜在的诊断肠道健康的生物标志物;具体的,使用r语言软件进行多维数据处理,采用anova分析各组血清中脂溶性代谢物含量的差异,以p<0.01为具有统计学意义,并采用人工智能的模式识别技术对不同组的数据计算之间比例关系,选取差异大的特征项,最后用随机森林模型和模式识别技术进一步优选出10个差异脂溶性代谢物,作为构建肠道健康状态诊断模型的脂溶性代谢物因子。更为具体的,首先对血清脂溶性代谢物的血清样本数据随机1000次,每次抽样50%的样本数据,通过anova模型中的变量显著差异性分析找到p值小于0.01的脂溶性代谢物后,对p值小于0.01的其余的脂溶性代谢物,分别计算非健康人群和健康人群的血清中各脂溶性代谢物含量的均值比率,其中比率绝对值大于1.2的差异脂溶性代谢物作为初选的特征变量,初选出88个特征变量;对初选的88个特征变量进行进一步优化,首先对血清脂溶性代谢物血清样本数据进行抽样,每次抽样50%的样本数据进行递归特征删减法和带有多重交叉验证的随机森林模型获得最佳特征变量组合,共随机抽样1000次后得到了1000个带有重要度的特征变量的组合,随后按照重要度从1到20选取对应每个重要度中出现变量频次大于50次的变量;最终选出共10个变量作为优选变量,即10个脂溶性代谢物因子。最后,本发明提供了一种血清中脂溶性代谢物因子在构建肠道健康状态诊断模型中的应用;该诊断模型采用前馈反向传播神经网络算法来建立模型,通过对由脂溶性代谢物因子构成的多个单元个数和最大300个训练周期遍历执行后,从而选取最优的隐藏层单元个数和训练周期,建立诊断模型,确定出联合因子。其中,所选取最优的隐藏层单元个数为2个,训练周期为100;所述脂溶性代谢物因子包括"acetylcarnitinedl","rfa446","alanine","orn","rfa447","coenzymea_neg","choline","rfa449","uridine","lysine"10个脂溶性代谢物因子。优选的,所述联合因子截断值为0.396,即当检测结果大于截断值时,诊断为癌前病变或大肠癌患者。联合因子=h1×7.96+h2×(-15.17)+ε2×2.42h1=i1×2.37+i2×1.79+i3×(-2.57)+i4×(-3.12)+i5×3.83+i6×(-1.67)+i7×(-0.9)+i8×2.61+i9×(-3.82)+i10×(-5.94)+ε1×4.06h2=i1×(-6.36)+i2×(-1.35)+i3×(-4.34)+i4×7.39+i5×(-0.5)+i6×5.27+i7×0.78+i8×4.63+i9×0.87+i10×(-0.31)+ε1×(-0.24)其中,i1、i2、i3、i4、i5、i6、i7、i8、i9、i10分别代表10个脂溶性代谢物的峰度与内标峰度的比值,ε1和ε2代表2个隐藏层单元,它们的取值是模型从线性到非线性的渐进转变进程中,由模型自动迭代拟合计算出最优值。优选的,该肠道健康状态诊断模型,可用于评估肠道的健康状态、肠道的肿瘤风险、肠道的癌前病变、指导肠道健康干预手段的选择,或者观测肠道健康干预后的效果。与现有技术相比,本发明具有以下有益的技术效果:(1)该诊断模型采用液相-串联质谱联用检测方法同时检测人血清中110种脂溶性代谢物含量,检测脂溶性代谢物数量多、针对性强,且血清前处理过程简单,分析时间短,适用于临床样本的高通量分析检验。(2)该诊断模型使用的人血清样本较结直肠组织样本容易取样获得,较尿液、粪便样本容易被待测人群心理接受,避免患者进行影像学检查时的射线损伤、结直肠镜检查时的侵入损伤,患者依从性好,特别适用于进行肠道健康的大规模人群筛查。(3)该诊断模型基于血清中10个脂溶性代谢物含量进行构建,模型简单、计算方便、判断容易,且模型对肠道健康状态诊断的准确度高、灵敏度高、特异性强,各项诊断评价指标接近于大肠癌肠镜金标准。(4)本发明构建的肠道健康状态诊断模型为肠道健康的临床诊断提供了一种有效可靠便捷的方法,具有良好的肠道健康辅助诊断价值。(5)本发明所选的部分代谢标志物在肿瘤和肠道健康状态异常的情况下,呈现升高的状态,而状态异常的情况下,呈现升高的状态是临床检测的一直寻求的理想标志物,这部分变化可以保障避免使用只有异常状态下降的标志物,因只有异常状态下降的标志物,临床检测中仪器功能损坏或样本不合格,会形成假阳性。附图说明图1为被测混合样本中某一个样本的脂溶性代谢物总离子流图;图2为被测混合样本中某一个样本分别在正离子模式和负离子模式下的脂溶性代谢物总离子流图;图3为部分代谢标志物在肿瘤和肠道健康状态异常的情况下,呈现升高的状态图;图4为非健康人群(癌前病变或大肠癌患者)、健康人群血清样本的特征选择图;图5为基于非健康人群(癌前病变或大肠癌患者)、健康人群血清样本训练集建立的神经网络拓扑图预测模型;图6为非健康人群(癌前病变或大肠癌患者)、健康人群血清样的训练集和测试集roc图。具体实施方式为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的
技术领域
的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。实施例一实施例1:同时检测人血清110种血清中脂溶性代谢物含量的液相-串联质谱联用检测方法的建立1目的以"rfa446","rfa447","rfa449","myo-inositol","citrate-isocitrate","citrate","uridine","shikimate-3-phosphate","cyclic-amp","sedoheptulose1,7-bisphosphate(sbp)","s-adenosyl-l-homocysteine_neg","adenosine5-phosphosulfate","adp_neg","dgdp_neg","idp_neg","cholesterylsulfate","atp_neg","dgtp","dephospho-coa_neg","nadph_neg","coenzymea_neg","taurine","benzeneaceticacid","hypoxanthine","acetylphosphate","hydroxyphenylaceticacid","uricacid","shikimate","lysine","d-glyceraldehdye-3-phosphate","2-isopropylmalicacid","dephospho-coa_pos","imidazole","glutamine","gln","glutamate","methionine","met1","met2","n1-methyl2-pyridone-5-carboxamide","histidine","his","2-aminooctanoicacid","carnitine","phenylalanine","phe","1-methyl-histidine","arginine","arg","citrulline","cit","tyrosine","tyr1","gly","tyr2","phosphorylcholine","n-acetyl-glutamine","ng,ng-dimethyl-l-arginine","acetylcarnitinedl","tryptophan","putrescine","trp","kynurenine","β-ala","glycerophosphocholine","adenosine","1-methyladenosine","7-methylguanosine","cmp","ump","damp","amp","alanine","imp","gmp","aminoimidazolecarboxamideribonucleotide","s-adenosyl-l-homocysteine_pos","betainealdehyde","choline","dimethylglycine","α-abu","gaba","nadph","serine","ser","cytosine","creatinine","creatinine","proline","indole","betaine","coenzymea_pos","valine","urea","gaa","threonine","nicotinamide","dl-pipecolicacid","creatine","hydroxyproline","leucine-isoleucine","creatine","3-hyp","alpha-ile","ornithine","ea","orn","asparagine","asn","methylnicotinamide"作为待测物质,建立人血清110种血清中脂溶性代谢物的液相-串联质谱联用检测方法。2实验仪器与材料2.1仪器absciexqtrap6500三重四极杆复合线性离子阱质谱系统;absciexexionlc超高效液相色谱仪系统,包括双元泵、真空脱气机、自动进样器、柱温箱;analyst数据处理工作站,multiquant定量软件,均为美国absciex公司产品。电子天平,mettlertoledoab104型(最大载荷101g,分度值0.1mg),瑞士梅特勒公司产品。移液器,单道可调量程20μl、100μl、200μl、1000μl,吉而逊实验仪器(上海)有限公司产品。涡旋混匀仪,vortex-genie2型,美国scientificindustries公司公司产品。高速离心机,centrifuge5415r型,德国艾本德公司产品。冷冻离心机,tomycc-105离心浓缩仪型,日本tomy公司产品。超低温冰箱,dw-hl218型,中科美菱低温科技有限责任公司产品。2.2试剂与耗材甲醇,hplc级,美国j.t.baker公司生产。乙腈、氢氧化铵(ammoniumhydroxide),美国sigma-aldrich公司生产。乙酸铵(ammoniumacetate)为分析纯,国药集团化学试剂有限公司生产,批号20130408。超纯净水,经美国thermofisherscientific公司barnsteadtmeasypureii超纯水器处理得到。一次性使用离心管,1.5ml,爱思进(axygen)生物技术有限公司生产。一次性使用移液器枪头,10μl、200μl、1000μl,爱思进生物技术有限公司生产。一次性进样瓶,2ml,美国thermofisherscientific公司生产。一次性内衬管,150μl,美国thermofisherscientific公司生产。2.3内标内标(internalstandard,is)脂溶性代谢物为13c的胆酸(13ccholicacid)。3液相-串联质谱联用检测方法液相-串联质谱联用检测方法包括以下步骤:首先利用液相系统将110种血清中脂溶性代谢物色谱分离,其次利用串联质谱系统以mrm半定量法建立110种血清中脂溶性代谢物与标准内标的比例关系。再通过梯度稀释方法,确定110种血清中脂溶性代谢物与标准内标的比例关系的线性范围和线性关系,最后对血清中选定的脂溶性代谢标志物的与标准内标的比例关系的线性范围和线性关系验证。3.1相关溶液的配制与前处理3.1.1胆酸内标溶液的配置:称取10.8mg胆酸,溶于1080μl甲醇中,震荡混匀。储备溶液浓度为10mg/ml。3.1.2沉淀溶液的配置:300ml甲醇中加入120μl胆酸内标储备液,作为沉淀溶液。3.2色谱条件液相采用absciexexionlc超高效液相色谱仪系统:色谱柱为phenomenexgemininx-c18(3μm,50*2mm),柱温为40℃;流动相a相为含体积分数为5%的乙腈及20mm氢氧化铵,20mm乙酸铵的水溶液,流动相b相为乙腈,流速为0.35ml/min,洗脱时间23min,洗脱梯度为16min,2%b;17min,85%b;23min,85%b,自动进样器进样盘温度为4℃,进样体积为10μl,进样针吸取速度为5μl/s。3.3质谱条件串联质谱采用absciexqtrap6500三重四极杆复合线性离子阱质谱系统:离子化模式为电喷雾电离正离子模式(esi+)和电喷雾电离负离子模式(esi-),监测模式为多反应监测(mrm);在正离子模式下,气帘气为25psi,碰撞气设置为high,离子化电压为5500v,温度475℃,喷雾气为33psi,辅助加热气为33psi;在负离子模式下,气帘气为25psi,碰撞气设置为high,离子化电压为-4500v,温度475℃,喷雾气为33psi,辅助加热气为33psi。3.4血清样本的前处理3.4.1血清4度放置解冻,震荡,取15μl于ep管中。3.4.2加入1ml沉淀溶液,震荡10min。15000g10℃离心15min。3.4.3取上清液100μl,浓缩后储存于-80℃冰箱中。3.4.4上机前将样品从-80℃冰箱中取出,100μl水重溶,涡旋混匀,15000g10℃离心10min,取上清液置于样品瓶中,等待检测;其中,受试人员血清样本由61例非健康人群和80例健康人群的血清样本组成,共计141例样本。3.5方法学验证胆酸内标标准溶液在同一天内进样8次,考察方法的日内精密度。胆酸内标标准溶液每天进样8次,连续三天进样,考察方法的日间精密度,并计算相对标准偏差(rsd)。以4μg/ml的胆酸内标溶液为标准计算胆酸内标的基质效应:计算公式为me=a/b;其中,a为胆酸内标在血清中的响应,b为胆酸内标在纯溶剂中的响应。重复性验证:加入的胆酸内标作为质控,加入由几个血清样品混合的混合样品做质控。样品检测时,将样品分为open组和blind组,其中,open组为实验组,blind组为验证组。open组的样品数共计90个,另有10个混合样品做质控,10个胆酸标品和10个空白。blind组的样品数共计51个,另有10个混合样品做质控,10个胆酸标品和10个空白。open组的上样过程如下:blind组的上样过程如下:3.6数据处理采用analyst1.6.3数据处理工作站和multiquant3.0.2软件进行质谱数据处理,检测结果以txt的形式呈现,可进行下一步的数据分析。4结果对于胆酸内标的浓度检测偏差来说,胆酸内标日内精密度rsd为5.31%,胆酸内标日间精密度rsd为6.13%。以4μg/ml的胆酸内标溶液为标准计算胆酸内标的基质效应,me的值为0.73,表明血清对胆酸内标的响应有基质抑制效应。以13c的胆酸内标(分子量:409.3da)作为标准,blind组中10个胆酸标品的峰面积cv(变异系数)值为4.12,10个混合样品的峰面积cv值为9.69。open组中10个胆酸标品的cv值为3.39,10个混合样品的峰面积cv值为4.45。由此可以看出,在整个批次的样品检测过程中,色谱柱和质谱的表现相对稳定,此次实验数据的质量是可靠的。5血清脂溶性代谢物液相-串联质谱联用检测方法的建立本实验对血清样本中的200余种脂溶性代谢物进行靶向定量分析,筛选出峰形较好的110种脂溶性代谢物,并对其在血清中的含量进行相对定量检测,其检测结果以峰面积的形式呈现,建立了血清中小分子化合物的液相-串联质谱联用定量筛选方法。6小结本实验对血清样本中的200余种脂溶性代谢物进行靶向定量分析,建立了血清中小分子化合物的液相-串联质谱联用定量筛选方法,其中有效检测化合物110种,均拥有较好的色谱分离与质谱响应信号。从混合质控样品的胆酸内标峰面积cv值及其日内、日间精密度来看,在整个批次的样品检测过程中,色谱柱和质谱的表现相对稳定。实施例2:癌前病变或大肠癌患者血清靶向脂溶性代谢物代谢组学研究1目的进行血清靶向脂溶性代谢物代谢组学研究。2数据处理及统计方法使用r语言软件进行多维数据处理,采用anova分析各组血清中脂溶性代谢物含量的差异,以p<0.01为具有统计学意义,并采用人工智能的模式识别技术对不同组的数据计算之间比例关系,选取差异大于1.20的特征项,最后用随机森林模型和模式识别技术进一步优选差异脂溶性代谢物。3血清中脂溶性代谢物多维数据分析及差异性变量分析为了寻找非健康人群(癌前病变或大肠癌患者)血清与健康人群血清的差异性脂溶性代谢物,首先对血清脂溶性代谢物检测141例样本数据随机1000次,每次抽样50%的样本数据,通过anova模型中的变量显著差异性分析找到p值小于0.01的脂溶性代谢物后,对p值小于0.01的其余的脂溶性代谢物,分别计算非健康人群(癌前病变或大肠癌患者)和健康人群的血清中各脂溶性代谢物含量的均值比率,其中比率绝对值大于1.2的差异脂溶性代谢物作为初选的特征变量。具体的数据如下表所示,初选出88个特征变量,每个变量按照出现频次排序。由于特征变量过多不利于建模,因此再次优选特征项。采用递归特征删减法和带有多重交叉验证的随机森林模型的抽样方法以及人工智能模式识别方法对上述的88个特征变量进行优选。优选的方法如下,首先对血清脂溶性代谢物检测141例样本数据进行抽样,每次抽样50%的样本数据进行递归特征删减法和带有多重交叉验证的随机森林模型获得最佳特征变量组合,共随机抽样1000次后得到了1000个带有重要度的特征变量的组合。随后按照重要度从1到20选取对应每个重要度中出现变量的频次大于50次的变量。最终如图4所示,选出了"acetylcarnitinedl","rfa446","alanine","orn","rfa447","coenzymea_neg","choline","rfa449","uridine","lysine"共10个变量作为优选变量,即最终确定的10个脂溶性代谢物因子。4小结对实施例2中测定的血清样本进行血清靶向脂溶性代谢物代谢组学研究,表明非健康人群(癌前病变或大肠癌患者)血清与健康人群志愿者血清中的脂溶性代谢物代谢谱具有较大差异,差异性脂溶性代谢物为"acetylcarnitinedl","rfa446","alanine","orn","rfa447","coenzymea_neg","choline","rfa449","uridine","lysine",可作为潜在的诊断肠道健康的生物标志物(脂溶性代谢物因子),以便下一步进行肠道健康状态诊断模型的建立。实施例3:基于血清中脂溶性代谢物因子的肠道健康状态诊断模型的建立1目的基于血清脂溶性代谢物因子建立肠道健康诊断模型,并进行模型验证。2数据处理及统计方法采用r语言进行人工智能分析,绘制受试者工作特征曲线(receiveroperatingcharacteristiccurve,roc曲线)。3肠道健康诊断模型的建立和诊断模型的验证3.1肠道健康诊断模型的建立roc曲线是以假阳性率[以1-特异性(1-specificity)表示]为横坐标、真阳性率[以灵敏度(sensitivity)表示]为纵坐标绘制的曲线,主要用于评价临床指标对疾病的诊断效能,以确认最佳的诊断截断值,并可以比较多种不同的临床诊断指标对疾病的诊断效能。由于人工神经网络的快速发展,它已经成为模式识别的强有力的工具。神经网络的运用展开了新的领域,解决其它模式识别不能解决的问题,其分类功能特别适合于模式识别与分类的应用,所以本模型的建立采用传统的前馈反向传播神经网络算法来建立模型。该模型的建立是对训练集的71例样本(其中,28例非健康人群(癌前病变或大肠癌患者),43例健康人群)进行训练预测。该模型的预测效果需要确定2个参数:隐藏层单元个数和训练周期。通过对由脂溶性代谢物因子构成的1-10个单元个数和最大300个训练周期遍历执行后,选取最优的隐藏层单元个数2个,训练周期100来建立诊断模型,其中诊断模型的网络拓扑图如图5所示。各节点之前的权重如下表所示。nodesb->h1i1->h1i2->h1i3->h1i4->h1i5->h1i6->h1wts4.062.371.79-2.57-3.123.83-1.67nodesi7->h1i8->h1i9->h1i10->h1b->h2i1->h2i2->h2wts-0.92.61-3.82-5.94-0.24-6.36-1.35nodesi3->h2i4->h2i5->h2i6->h2i7->h2i8->h2i9->h2wts-4.347.39-0.55.270.784.630.87nodesi10->h2b->oh1->oh2->o---wts-0.312.427.96-15.17---结合以上分析结果确定出联合因子;联合因子=h1×7.96+h2×(-15.17)+ε2×2.42h1=i1×2.37+i2×1.79+i3×(-2.57)+i4×(-3.12)+i5×3.83+i6×(-1.67)+i7×(-0.9)+i8×2.61+i9×(-3.82)+i10×(-5.94)+ε1×4.06h2=i1×(-6.36)+i2×(-1.35)+i3×(-4.34)+i4×7.39+i5×(-0.5)+i6×5.27+i7×0.78+i8×4.63+i9×0.87+i10×(-0.31)+ε1×(-0.24)其中,i1、i2、i3、i4、i5、i6、i7、i8、i9、i10分别代表"acetylcarnitinedl","rfa446","alanine","orn","rfa447","coenzymea_neg","choline","rfa449","uridine","lysine"10个脂溶性代谢物因子的峰度与内标峰度的比值。ε1和ε2代表2个隐藏层单元,它们的取值是模型从线性到非线性的渐进转变进程中,由模型自动迭代拟合计算出最优值。3.2联合因子诊断模型的效能评估进行联合因子的roc曲线绘制,如图6所示,采用该诊断模型对训练集和测试集的预测结果auc为0.95和0.91。训练集的截断值为0.396,灵敏度为96%、特异性为88%。参考已公布的cea诊断的auc值仅为0.656,该模型的auc远远超过cea诊断。4小结在实施例2中血清靶向脂溶性代谢物代谢组学研究基础上,通过人工智能神经网络,基于"acetylcarnitinedl","rfa446","alanine","orn","rfa447","coenzymea_neg","choline","rfa449","uridine","lysine",共10个脂溶性代谢物建立了因子诊断模型,其中因子截断值为0.396(当由肠道健康诊断模型确定出的联合因子诊断值大于截断值时,诊断为癌前病变或大肠癌患者);该肠道健康诊断模型对上述血清的测试样本的auc值为0.91、灵敏度为96%、特异性为88%、各项诊断评价指标均优于cea诊断,具有良好的肠道健康辅助诊断价值。最后,需要说明的是,采用本发明提供的肠道健康诊断模型进行诊断的过程如下:1、空腹抽取检测者外周静脉血1ml,离心分离后获取血清;2、采用液相-串联质谱联用检测方法检测血清中"acetylcarnitinedl","rfa446","alanine","orn","rfa447","coenzymea_neg","choline","rfa449","uridine","lysine",共10个脂溶性代谢物的峰度和内标峰度的比值;3、根据肠道健康诊断模型计算出联合因子,用计算出的联合因子与截断值(0.396)进行比较,如果大于截断值(0.396)时,诊断为癌前病变或大肠癌患者。最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1