一种胰腺导管腺癌标志物及其筛选方法与流程

文档序号:16679249发布日期:2019-01-19 00:14阅读:375来源:国知局
一种胰腺导管腺癌标志物及其筛选方法与流程

本发明属于临床检验诊断领域,具体涉及一种胰腺导管腺癌标志物及其筛选方法。



背景技术:

胰腺导管腺癌是胰腺癌的一种,它是一种恶性程度极高,诊断和治疗都很困难的消化道恶性肿瘤。胰腺导管腺癌早期诊断技术主要包括肿瘤生物标志物、影像学诊断以及基因诊断等方向。但这几种方法仍然存在严重的不足:

1)目前腺管上皮的导管腺癌的血清标志物为ca19-9,其用于检测胰腺癌的敏感度与特异性均不高。尤其对于早期胰腺癌的检测,ca19-9的阳性率检出率只有37.5%。

2)胆管炎、胰腺炎以及肝炎等良性病变患者的血清中,ca19-9的检测水平也可以显著升高。

3)现有的其他胰腺癌肿瘤生物标志物,包括ca50、ca242、cea、afp等,其诊断效能并不比ca19-9更好。



技术实现要素:

针对目前胰腺导管腺癌的诊断标志物检测敏感度及特异性差的问题,本发明通过高效液相色谱-串联质谱技术对早期胰腺导管腺癌早期患者血清进行微量代谢组学分析,发现正常人群和早期胰腺导管腺癌人群之间的差异代谢物;进一步通过该技术分析正常人与胰腺导管腺癌患者之间的差异代谢物;找到癌症引起的胰腺导管腺癌患者的特异性差异代谢产物,即胰腺导管腺癌的诊断分子。

本发明的目的在于提供了一种基于代谢组学的胰腺导管腺癌诊断标志物。

本发明所述的胰腺导管腺癌标志物,为c10:1酰基肉碱和溶血磷脂酰胆碱lysopc(14:0)中的一种或两种的组合。

进一步地限定,当所述胰腺导管腺癌标志物为c10:1酰基肉碱和溶血磷脂酰胆碱lysopc(14:0)的组合物时,两标志物的拟合得分为y=-8.13e-6*x1-1.875e-5*x2,其中x1为c10:1酰基肉碱质谱检测响应值,x2为溶血磷脂酰胆碱lysopc(14:0)质谱检测响应值,y为两个潜在生物标志物拟合后得分。

上述胰腺导管腺癌标志物的筛选方法,包括如下步骤:

1)取胰腺导管腺癌病人临床血清样本n1例和健康人对照m1例作为训练集;取胰腺导管腺癌患者n2例和健康人对照m2例作为验证集,其中,n1≥185,m1≥146,n2≥50,m2≥50;

2)每例血清样本分别加入样本3倍体积的甲醇-乙腈混合溶液,得到的混合溶液在冰水浴中静置后,离心,取上清;

3)通过色谱-质谱联用代谢组学分析方法对上述样品进行质谱分析;

4)然后筛选差异代谢物,获得胰腺导管腺癌标志物。

进一步地限定,步骤2)所述甲醇-乙腈混合溶液中甲醇与乙腈体积比为1:1。

进一步地限定,步骤2)所述得到的混合溶液经斡旋1min后,在冰水浴静置15min,然后在4℃下,12000g高速离心15min。

进一步地限定,步骤3)所述色谱-质谱联用代谢组学分析方法中色谱分离所用的色谱柱为behc18色谱柱。

进一步地限定,步骤3)所述色谱-质谱联用代谢组学分析方法中色谱分离所采用的流动相a为含有体积分数0.1%甲酸的水,流动相b为含有体积分数0.1%甲酸的乙腈。

进一步地限定,所述色谱-质谱联用代谢组学分析方法中色谱分离所采用的分离时间为15分钟,流速为0.3ml/min;其色谱梯度为:0到0.5分钟,流动相a从0到1%且流动相b从100%到99%;0.5到3.5分钟,流动相a从1%到53%且流动相b从99%到47%;3.5到7.5分钟,流动相a从53%到70%且流动相b从47%到30%;7.5到9分钟,流动相a从70%到90%且流动相b从30%到10%;9到13分钟,流动相a保持90%且流动相b保持10%;13.1到15分钟,流动相a梯度返回1%。

进一步地限定,步骤3)所述色谱-质谱联用代谢组学分析方法中质谱分析采用正负离子扫描模式,其中正离子模式电压为4kv,负离子模式电压3.5kv;雾化温度:330℃;雾化流速:10l/min;碎裂电压:100v;筛选电压:65v;扫描范围:70-1100m/z;扫描速度:1.5谱/sec。

进一步地限定,步骤4)所述差异代谢物的筛选方法包括血清代谢组学轮廓分析、数据的前处理及多元统计分析,筛选的标准为:

1)以性别、年龄为交互因素的logistics模型中,这些因素能否对差异性代谢产物的预测性能造成显著性影响;

2)差异性代谢产物与ca19-9的pearson相关系数小于0.15;

3)在受试者工作曲线分析中,差异性代谢产物的曲线下面积大于0.8,同时满足以上3个标准的差异代谢产物作为胰腺导管腺癌标志物。

本发明所述的胰腺导管腺癌可用于制备胰腺导管腺癌诊断试剂盒。

有益效果

本发明公开了基于代谢组学的胰腺导管腺癌早期诊断标志物,所述诊断标志物由以下化合物组成:c10:1酰基肉碱和溶血磷脂酰胆碱lysopc(14:0)。本发明还公开了基于代谢组学的胰腺导管腺癌早期诊断标志物的筛选方法。本发明通过高效液相色谱-串联质谱技术对患者血清进行微量代谢组学分析,通过该技术分析正常人与胰腺导管腺癌患者血清代谢轮廓的差异;进一步发现正常人群和胰腺导管腺癌人群之间的差异代谢物;找到胰腺导管腺癌患者的特异性差异代谢产物,即胰腺导管腺癌的诊断分子;本发明获得的胰腺导管腺癌标志物能辅助ca19-9诊断胰腺导管腺癌人群,能提高ca19-9阴性患者85%的诊断率。本发明所提供的方法具有无创,方便快捷的特点,并且能够准确反应患者与正常对照组的代谢图谱差异,特异性高。本发明为患者争取时间,尽早开始治疗,提高临床治疗效果。

附图说明

图1为正,负离子模式下两组总离子流图(bpcs)图。a)正离子模式下正常对照组bpc图;b)正离子模式下胰腺导管腺癌组bpc图;c)负离子模式下正常对照组bpc图;d)负离子模式下胰腺导管腺癌组bpc图,各图中横坐标为保留时间min,纵坐标为相对相应强度。

图2为正常对照组和胰腺导管腺癌组总离子主成分分析和偏最小二乘判别分析的得分图。a)总离子主成分分析(pca)得分图;b)总离子代谢轮廓偏最小二乘判别分析(pls-da)得分图;c)pls-da在100次置换测试交叉验证图。

图3为生物标志物的评估。a)lysopc(14:0)训练集下的roc曲线;b)c10:1酰基肉碱训练集下的roc曲线;c)lysopc(14:0)验证集下的roc曲线;d)c10:1酰基肉碱验证集下的roc曲线,各图中横坐标为1-特异度,纵坐标为灵敏度。

图4为生物标志物分数的图形表示的散点图。每一个点均为一个患者,被圈出的个体为ca19-9不敏感且潜在标志物敏感患者,横坐标为ca19-9含量,其中ca19-9含量临界点为37u/ml,纵坐标为拟合后得分,其中联合诊断后两个生物标志物的临界点(阈值)为0.541。

具体实施方式

收集胰腺导管腺癌病人及健康人的血清样本,其中胰腺导管腺癌患者235例和健康人对照196例。样本经处理后通过超高效液相色谱-质谱联用仪检测分析,通过建立多维统计模型可视化地显示胰腺导管腺癌病人及健康人对照之间的代谢谱差异,通过统计学方法获得差异性代谢物。本发明的测定方法可以全面、综合地体现胰腺导管腺癌病人及健康人之间的代谢产物的变异状况,找到胰腺导管腺癌的诊断标记物,为胰腺导管腺癌的早期诊断和预后提供有利的技术支持。

下述实施例中所述超高效液相色谱仪购买自沃特世公司,电喷雾离子化-四级杆/飞行时间串联质谱仪购买自安捷伦公司。

所述训练集是指:用于构建模型样本的集合

验证集是指:用于验证模型样本的集合。

c10:1酰基肉碱:c10:1酰基肉碱代表癸烯酰基肉碱,其中c10:1表示在特定的一个c原子上连有10个碳原子,且在这10个碳原子组成的结构中,含有1个双键。

溶血磷脂酰胆碱lysopc(14:0),14:0代表所述溶血磷脂酰胆碱lysopc中一号碳上有14个碳原子,0个双键。

实施例1.胰腺导管腺癌诊断标志物的筛选方法。

(一)样本采集:

采集空腹全血样本,其中包括:

(1)训练集:胰腺导管腺癌患者185例,健康人对照组146例。

(2)验证集:胰腺导管腺癌患者50例,健康人对照组50例。

(二)血清样本前处理:

全血样本用无抗凝剂的采集管采集,在4℃条件下,4000g离心15min,取50ul上层血清移至新的ep管中,再向ep管中加入150ul冰冷的体积比为1:1的甲醇:乙腈混合溶液,得到的混合溶液斡旋混合1min后,放置冰水浴中静置15min。擦净ep管外的水后以12000g,4℃,高速离心15min,吸取上清置于进样瓶中带上样分析。

(三)通过色谱-质谱联用代谢组学分析方法进行对上述样品的质谱分析:

超高效液相色谱仪(配备溶剂控制器和样品控制器)连用电喷雾离子化-四级杆/飞行时间串联质谱仪(配备双电喷雾电离源)。

质控样本:

把所有的样品都随机化,为了保证分析体系的稳定性,质控样本由所有样本取2ul混合而成,于检测样本一同制备,且质控样本分析被用于每次分析的初始及终末。

利用标准校正液液对正离子电喷雾离子模式和负离子电喷雾离子模式将系统调节至最优的灵敏度和分辨率。同时,在测量全程使用参比液对质谱进行实时矫正。色谱分离采用behc18色谱柱(2.1mm×100mm,1.7μm)的超高效液相色谱系统。流动相a为含有体积分数0.1%甲酸的水,流动相b为含有体积分数0.1%甲酸的乙腈,分析体系为15分钟。色谱梯度为:0到0.5分钟,流动相a从0到1%且流动相b从100%到99%;0.5到3.5分钟,流动相a从1%到53%且流动相b从99%到47%;3.5到7.5分钟,流动相a从53%到70%且流动相b从47%到30%;7.5到9分钟,流动相a从70%到90%且流动相b从30%到10%;9到13分钟,流动相a保持90%且流动相b保持10%;13.1到15分钟,流速为0.3ml/min,流动相a梯度返回1%。质谱分析采用正负离子扫描模式,具体扫描参数为:毛细管电压:4kv用于正离子模式,3.5kv用于负离子模式;雾化器温度:330℃;雾化器流速:10l/min;碎裂电压:100v;筛选电压:65v;扫描范围:m/z70-1100;扫描速度:1.5谱/sec。

(四)筛选差异代谢物的筛选及数据比对:

所有胰腺导管腺癌和健康对照样本通过超高压液相色谱-飞行时间质谱仪uplc-q-tof进行代谢物全谱分析测试。如图1所示,两组样本的正、负离子模式色谱图中色谱峰均分离度较好,且同一保留时间下所出峰高和峰形在谱图中均可看出差异,体现胰腺癌组与对照组样本代谢轮廓上的差异。

利用r软件对原始数据进行分析得到原始矩阵,原始矩阵数据经过除去同位素峰及加合离子后,在正离子模式下获得离子特征4515个,负离子模式下获得离子特征6220个。这些离子特征将会进一步用于主成分分析等多变量分析模型的建立,应用主成分分析(pca)来可视化表征两者样本间的分组及聚类情况。模型的建立直接利用上述数据,pca得分图见图2中a)所示。每一个圆圈代表一个样本,浅色的圆圈代表pdac个体,深色的圆圈代表正常个体,图中两组数据组内个体间呈现聚类的趋势,组间分组效果明显。为了更加清晰地观察进一步的分组趋势及判定pdac与对照组织间是否真的存在可表征组间差异的代谢产物,本研究还利用训练集数据构建了有监督性的偏最小二乘判别分析(pls-da),pls-da得分图见图2中b)所示pls-da模型与pca模型结果相一致,且组间的分组效果更佳明显。pls-da是有监督性的分析手段,为了得到可靠的模型,检验模型是否存在过拟合,采用交叉验证方法来检验,结果显示图2中c)所示,图中展示出模型并没有过拟合,说明建立的模型是真实可靠的,pdac组与其对照组确实存在差异。

为了筛选代谢差异离子,我们利用wilcoxon秩和检验分析,选取p<0.05的离子,用来对训练集数据进行初步筛选,共获得在胰腺癌及其对照组间有统计学意义(p<0.05)的离子后,再结合正常对照与pdac组建立pls-da模型下各离子的vip值,由于vip值反映了变量在差异中的重要性,常用来筛选差异代谢物。最终本研究中p<0.05且vip>1的代谢物,即为差异代谢离子。接着将这些差异代谢离子进行二级谱图的鉴定再与网络数据库精确分子量的二级谱图进行对比,代谢差异离子的二级谱图与数据库的二级谱图一致的情况下我们认定检测的代谢离子即为网络数据库的代谢物,网络数据库例如hmdb(http://www.hmdb.ca),metlin(http://metlin.scripps.edu)和kegg(http://www.kegg.jp)。

为了避免以往研究单纯追求优异的诊断性能而忽视临床诊断交互因素的问题,利用验证集数据结合logistic回归分析评估了前期所得差异性代谢产物在预测过程中抗临床交互因素干扰的性能。此外,充分考虑到潜在生物标志物的临床实用性,能否辅助提高ca19-9的诊断性能也是潜在诊断性代谢产物的考核标准。因此,本研究基于以下三点标准,在差异性代谢产物中进行诊断性代谢产物的筛选。

(1)在以性别、年龄为交互因素的logistics模型中,这些因素能否对差异性代谢产物的预测性能造成显著性影响;

(2)差异性代谢产物与ca19-9的pearson相关系数小于0.15;该标准记载在t.l.,m.b.,expressionofphosphatidylethanolaminen-methyltransferaseinhumanhepatocellularcarcinomas[j],oncology,65(2003)152-158.。

(3)在受试者工作曲线分析中,差异性代谢产物的曲线下面积大于0.8。该标准记载在s.narita,n.tsuchiya,l.wang,s.matsuura,c.ohyama,s.satoh,k.sato,o.ogawa,t.habuchi,t.kato,associationoflipoproteinlipasegenepolymorphismwithriskofprostatecancerinajapanesepopulation,internationaljournalofcancer[j].journalinternationalducancer,112(2004)872-876.。

u.nasution,w.vangulik,r.kleijn,w.vanwinden,a.proell,j.heijnen,measurementofintracellularmetabolitesofprimarymetabolismandadeninenucleotidesinchemostatcultivatedpenicilliumchrysogenum[j],biotechnologyandbioengineering,94(2006)159-166.。

根据以上标准,共有两个潜在诊断性代谢标志物产物被筛选出来,即c10:1酰基肉碱和溶血磷脂酰胆碱lysopc(14:0)。c10:1酰基肉碱和lysopc(14:0)在pdac组中的相对含量低于对照组。这两个诊断性代谢产物在模型中对于pdac及其对照样本的判定均未体现出受性别、年龄及分期的显著影响(p<0.05)。

进一步利用受试者工作(roc)曲线来考量两个诊断标志物的诊断性能,roc曲线是根据一系列不同的二分类方式(分界值或决定阈),以真阳性率(灵敏度)为纵坐标,假阳性率(1-特异度)为横坐标绘制的曲线。roc曲线越靠近左上角,标志物的诊断准确性就越高,最靠近左上角的roc曲线的点是错误最少的最好阈值,其假阳性和假阴性的总数最少。计算各个潜在标志物的roc曲线下的面积(auc)可判断潜在标志物诊断价值,auc越大其诊断价值就越大。本实验两个潜在诊断标志物在训练集和验证集中的auc见图3。图3中a)展示溶血磷脂酰胆碱lysopc(14:0)在训练集中auc为0.926,图3中b)展示c10:1酰基肉碱在训练集中auc为0.840,图3中c)展示溶血磷脂酰胆碱lysopc(14:0)在验证集中auc为0.892,图3中d)展示c10:1酰基肉碱在训练集中auc为0.833。两个潜在标志物在独立的训练集中auc也可以达到0.8以上,说明两个潜在标志物对pdac的单独诊断有良好的诊断效能。

本研究将所得到的两个潜在生物标志物利用spssstatistics19统计软件,以自变量为疾病种类(胰腺癌和正常对照)、协变量分别为两个潜在标志物进行二元logistic回归分析进行联合诊断,得到y=-8.13e-6*x1-1.875e-5*x2,其中x1为c10:1酰基肉碱质谱检测响应值,x2为溶血磷脂酰胆碱lysopc(14:0)质谱检测响应值,y为两个潜在生物标志物拟合后得分。根据上述公式对每一个样本求得两个标志物联合诊断后的得分,用拟合后的得分再进行roc曲线。由于临界点的灵敏度和特异性是整个曲线中算术和最大的值,最后选取临界点0.541处的横纵坐标即1-特异度和灵敏度,此时的灵敏度和auc值分别达到0.85和0.91,远高于ca19-9的诊断性能,如表1所示。

表1样本灵敏度以及auc值检测

为了探究本研究所筛选得到的两个潜在生物标志物与ca19-9的在诊断pdac时的差异,本研究以验证集中有ca19-9信息的患者的ca19-9含量为横坐标,生物标志物拟合后得分为纵坐标形成一个象限图,如图4所示。图中每一个点均为一名患者,在x=39左侧的点为不能被ca19-9诊断出来的患者,在y=0.541下方的点为不能被本研究潜在标志物诊断出来的患者,被圈出的个体为ca19-9不能诊断出来的患者且可被本研究潜在标志物诊断出来的患者。14个ca19-9阴性患者中,12个患者被两个潜在的生物标志物诊断出来。这表明,本研究的潜在标志物可以弥补ca19-9在诊断时所遗留下的患者,使ca19-9阴性患者提高85%,可以推测在本研究的潜在标志物与ca19-9联合诊断时可达到更好的效果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1