一种适合于食管鳞状细胞癌早期诊断的诊断标记物的制作方法_3

文档序号:9325361阅读:来源:国知局
阵进行代谢物峰标识,用于进一步的统计分析; (4) 根据质荷比和保留时间从二维矩阵中筛选出本发明适合于食管鳞状细胞癌早期诊 断的诊断标记物的信息,得到诊断标记物二维矩阵; (5) 根据该诊断标记物二维矩阵,使用R语言中randomForest软件包构建随机森林模 型,得食管鳞状细胞癌诊断模型。
[0014] 上述构建方法中,所述食管原位癌是指??!分期标准中0期,指粘膜上皮层内或 皮肤表皮内的非典型增生(重度)累及上皮的全层,但尚未侵破基底膜而向下浸润生长的 癌;早期食管癌是指?m分期标准中I和II期,指无淋巴结累及、无远处转移的局限于黏 膜后或黏膜下层的癌;晚期食管癌是指?m分期标准中III期和IV期,指已累及肌层或 达外膜或外膜以外,有局部或远处淋巴结转移的癌。?M分期标准依据American joint Committee on Cancer (AJCC)TNM Classfication of Carcinoma of the Esophagus and Esophagogastric Junction(7th ed, 2010)〇 本发明的优选方案中,构建随机森林模型时,建模参数ntree = 5000。 本发明的优选方案中,模型构建时,是基于以下的样本数目构建的:所用的述食管原位 癌患者39人,早期食管癌患者28人,晚期食管癌患者30人,健康人群105人。
[0015] 本发明的优选方案中,当适合于食管鳞状细胞癌早期诊断的诊断标记物为25种 血清代谢标记物的组合(诊断标记物A)时,所得的诊断模型的诊断界值(Threshold)为 0. 3552 ;当适合于食管鳞状细胞癌早期诊断的诊断标记物为7种血清代谢标记物的组合 (诊断标记物B)时,所得的诊断模型的诊断界值(Threshold)为0.7431 ;当适合于食管鳞 状细胞癌早期诊断的诊断标记物为5种血清代谢标记物的组合(诊断标记物C)时,所得的 诊断模型的诊断界值(Threshold)为0.4943。当诊断模型给出的预测数值大于等于诊断界 值时,说明患有食管鳞状细胞癌,当小于诊断界值时,说明未患有食管鳞状细胞癌。 本发明还提供了一种食管鳞状细胞癌诊断模型,该诊断模型按照上述食管鳞状细胞癌 诊断模型的构建方法构建而得。同上,在本发明优选方案中,当诊断模型所用的诊断标记物 为诊断标记物A时,诊断模型的诊断界值为0. 3552 ;当为诊断标记物B时,诊断模型的诊断 界值为0. 7431 ;当为诊断标记物C时,诊断模型的诊断界值为0. 4943。 本发明还提供了一种食管鳞状细胞癌诊断模型的使用方法,即采用该食管鳞状细胞癌 诊断模型诊断食管鳞状细胞癌的方法,包括以下步骤: (1) 取待检血清样本,通过预处理达到进样要求,将预处理后的待检血清样本采用 LC-MS血清代谢组学技术进行分析,得该待检血清样本的原始代谢指纹图谱; (2) 使用R语言XCMS软件包将该原始代谢指纹图谱进行图谱预处理,并进行代谢物峰 标识,得到可以用于统计分析的二维矩阵; (3) 根据质荷比和保留时间从二维矩阵中筛选出本发明适合于食管鳞状细胞癌早期诊 断的诊断标记物的信息,得到诊断标记物二维矩阵; (4) 将诊断标记物二维矩阵带入食管鳞状细胞癌诊断模型中,根据模型给出的数值和 模型的诊断界值(Threshold),判断是否为早期食管鳞状细胞癌。
[0016] 在本发明的优选方案中,当以25种血清代谢标记物的组合(诊断标记物A)为适 合于食管鳞状细胞癌早期诊断的诊断标记物时,诊断模型给出的数值大于或等于0. 3552 时,诊断为食管癌,否则为不是;当以7种血清代谢标记物的组合(诊断标记物B)为适合于 食管鳞状细胞癌早期诊断的诊断标记物时,诊断模型给出的数值大于或等于〇. 7431时,诊 断为食管癌,否则为不是;当以5种血清代谢标记物的组合(诊断标记物C)为适合于食管 鳞状细胞癌早期诊断的诊断标记物时,诊断模型给出的数值大于或等于〇. 4943时,诊断为 食管癌,否则为不是。 本发明优点为:本发明采用血清代谢组学技术以及数据统计分析技术得到适合于食管 鳞状细胞癌早期诊断的诊断标记物和食管鳞状细胞癌诊断模型,并且发现了与诊断标记物 有密切相关的10个代谢通路。本发明诊断标记物筛选方法可操作性强,模型构建方法简 单,所得诊断模型效果良好,灵敏度高,特异性好,不仅适合晚期食管癌的诊断,还适合于早 期食管癌的诊断,特别适合于食管癌的早期诊断。本发明仅通过取血就能实现诊断,无创、 花费低,能够很好的替代现今内创性诊断模式,大大减轻了患者的痛苦,且本发明诊断快 速、便捷,所需时间短,提高了工作效率,有利于食管癌的早发现、早治疗,具有良好的临床 使用和推广价值。
【附图说明】
[0017] 图1.原始代谢指纹图谱的总离子色谱图(LC-QTOF/MS,+ESI为正离子模式,-ESI 为负离子模式),横轴为保留时间(Retention Time,min),纵轴为代谢物相对浓度,Normal 为健康血清样本,ESCC为食管癌血清样本。 图2.代谢轮廓预分析的PCA得分图,其中Normal为健康血清样本,ESCC为食管癌血 清样本,QC表示质量控制样品。 图3A为食管癌和健康对照的代谢轮廓比较的PLS-DA三维得分图,建模的R2X = 0. 167, R2Y = 0. 569, Q2Y = 0. 523 ;图3B为相应的基于随机置换方法的PLS-DA建模验证 图。其中Normal为健康血清样本,ESCC为食管癌血清样本。 图4. L-色氨酸(L-Tryptophan)的鉴定流程图,其中图(a) :m/z为205. 0974的色谱图 中保留时间特征;图(b):保留时间为181. 38s的一级质谱图;图(c):保留时间为181. 38s, m/z 为 205. 0974 的二级离子 MS/MS 碎片图;图(d):代谢物(RT : 181. 38s,m/z :205. 0974) 的碎片裂解机制。 图5. 25个代谢标记物所构建的随机森林模型的外部测试样本的ROC曲线图。 图6. 7个代谢标记物所构建的随机森林早期食管癌诊断模型的外部测试样本ROC曲 线。 图7. 5个代谢标记物所构建的随机森林早期食管癌诊断模型的外部测试样本ROC曲 线。
【具体实施方式】 下面,通过以下【具体实施方式】对本发明进行进一步的解释,并对本发明优点进行进一 步的证明。 本发明诊断标记物的筛选、诊断模型的构建方法以及效果验证如下: 1、 研究对象
[0018] 本研究依托"国家食管癌早诊早治示范基地(山东省肥城市)"的食管癌筛查平 台,针对山东省肥城市40-69岁胃镜下碘染色指示性活检对象(作为金标准确认),采集 食管原位癌(0期39例)、早期食管癌(I期17例、II期11例)及晚期食管癌(III期30 例);并随机抽取筛检中胃镜下碘染色阴性受试者即无上消化道病变的健康对象105例作 为健康样本。 2、 LC-MS的血清代谢组学检测 所有采集的血清样本离心后放于_80°C冰箱内保存,使用超高效液相色谱-质谱联用 仪 (UPLC-QTOF/MS 6550,Agilent)和 Bravo 自动标本预处理系统(Agilent, USA)进行代 谢组学检测(分3个大批次检测,并做好质量控制),获得样本的包含色谱和质谱信息的原 始代谢指纹图谱。具体操作如下: 2. 1仪器和设备 实验设备包括:UPLC-QT0F/MS 6550 系统(Agilent, USA)、Bravo 系统(Agilent, USA)、 高速低温离心机、振动涡旋机、氮气干燥装置、4°C冷藏冰箱(海尔)、纯水仪(西门子)。 实验耗材包括:Waters ACQUITY UPLC? HSS T3 (particle size,1.8ym; IOOmm(Iength) X2. lmm)色谱柱、液氮、高纯氮;锥底进样瓶、2ml离心转子、2ml离心管(圆 底)、移液器、1000 μ 1枪头、200 μ 1枪头、记号笔、乳胶手套、口罩。 实验试剂包括:甲醇(迪马,HPLC级纯)、乙腈(迪马,HPLC级纯)、甲酸(光复精密化 学研究所,天津)、纯水(TO(XlOppb)。 2. 2血清样本预处理
[0019] 血清样本预处理前,制备21份质量控制样品(QC),将所有早期食管癌血清样本、 食管原位癌血清样本、晚期食管癌血清样本、健康血清样本和质量控制样品进行随机编号, 以早期食管癌血清样本、食管原位癌血清样本、晚期食管癌血清样本、健康血清样本作为分 析样本,每隔10个分析样本加入一个质量控制样品。将早期食管癌血清样本、食管原位癌 血清样本和晚期食管癌血清样本统称为食管癌血清样本,质量控制样品为5份食管癌血清 样本和5份健康血清样本的混合样品。食管癌血清样本、健康血清样本和质量控制样品均 进行预处理,预处理包括以下4个步骤: (1) 用移液器抽取50μ1分析样本或质量控制样品,置于Bravo自动标本处理系统 (Agilent,USA)的 96 孔板上; (2) 加入150 μ 1甲醇提取,涡旋30s,并在-20°C下孵化以沉淀蛋白。 (3) 然后于高速离心机中在4°C下以4000转/分离心20min ; (4) 将步骤(3)的上清液倒入LC-MS进样瓶中,保存在-80°C下以备LC-MS检测; 2. 3 血清 UPLC-QT0F/MS 检测
[0020] UPLC系统(1290series,Agilent)将6 μ L等份预处理后的样品注入ACQUITY UPLC HSS Τ3 (particle size, 1.8 ym;100mm (length) Χ2. Imm)色谱柱(Waters, Milford, USA) 〇 进样顺序为完全随机化进样,以排除进样顺序带来的偏倚。色谱流动相包含两种溶剂:A为 0· lwt%甲酸(水稀释,正离子ESI+)或0· 5mM氟化铵(水稀释,负离子ESI-),B为0· lwt% 甲酸(乙腈稀释,正离子ESI+)或100%乙腈(负离子ESI-)。色谱梯度为:〇-lmin为1% B,l-8min为1% B-100% B逐渐递增,然后10-10.1 min为100% B迅速减为1% B,然后1% B持续I. 9min。流速为0. 5ml/min。整个样品检测过程维持在4°C。其中,A和B的百分含 量指的是体积百分含量。 质谱检测使用Agilent四极杆时间飞行质谱仪Q-TOF(6550, Agilent),并采用电喷雾 离子源的正离子模式(ESI+)和负离子模式(ESI-)。离子源温度设定为400°C,而锥孔气流 量为12L/min。同时,脱溶剂气温设定为250°C,而脱溶剂气流量16L/min。在正离子和负 离子模式下毛细管电压分别为+3kV和-3kV,且锥孔电压均为0V。锥孔压力为20psi (正离 子)和40psi (负离子)。图谱数据采集的质荷比范围为50~1200m/z,采集的扫描频率为 0. 25s JS/MS二级质谱分析中,高纯度氮作为碰撞气体用于生成目标离子碎片,碰撞能量设 置为 10、20、或 40eV。 3、 XCMS图谱预处理
[0021] UPLC-QT0F/MS血清正离子ESI+和负离子ESI-检测获得原始代谢指纹图谱数据 (见图1),通过Agilent公司的Masshunter软件转化为Mzdata数据文件,然后使用R语言 的XCMS软件包进行XCMS图谱预处理,预处理包括保留时间校正、峰识别、峰匹配、峰对齐、 滤噪、重叠峰解析、阈值选择、标准化等。XCMS预处理的相关参数为:峰半腰峰宽为10(fwhm =10),保留时间窗设置为10 (bw = 10),而其他参数为默认值。XCMS图谱预处理后得到 可用于统计分析的二维矩阵,其中每行为样本(观测),每列为代谢物(变量),矩阵中值 为相应的代谢物浓度。并且每个代谢物峰使用保留时间(retention time,RT)和质荷比 (mass-to-charge ratio,m/z)定性。然后该二维矩阵使用R软件包CAMERA进行代谢物峰 标识(包括同位素峰、加合物和碎片离子)。统计分析前对样本进行标准化处理,待分析保 留时间范围设定为0. 5~lOmin。经XCMS图谱预处理,在正离子检测模式的UPLC-QTOF/MS 谱生成的数据矩阵中包含981个代谢物峰,负离子检测模式为485个代谢物峰,共有1466 个代谢物峰。 4、 LC-MS实验质量控制 在血清样本进行代谢组学检测时,将制备的QC样品按每10个分析样本安排1个QC的 顺序均匀地插入分析样本中,从而实时监测从样本前处理到样本检测过程中的质量控制情 况。所得原始代谢指纹图谱经XCMS图谱预处理后,计算每个代谢物在QC样本中的% RSD 值(变异系数),绝大多数代谢物的% RSD值控制在30%以下,说明样本前处理到样本品检 测过程中的质量控制情况良好,所获得的代谢组学数据真实可信。 5、 基于PCA的代谢轮廓预分析 使用无监督分析方法即主成分分析(principal component analysis, PCA)来初步观 察组间分类趋势和离群点,见图2。图中QC标本的重复性可表明LC-MS实验质量控制良好。 从图中还可以看出,食管癌及健康对照间具有一定的分类趋势,但仍有部分交叉,需要采用 有监督学习方法实现进一步的分类。 6、 基于PLS-DA的代谢轮廓分析
[0022] 将得到的二维矩阵数据随机分配成4/5作为训练样本training data,另外1/5作 为外部测试样本test data(见表1)。为尽量消除组内差距引起的偏差,获得较为明显的分 组趋势,进
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1