检测大肠癌血清蛋白质的质谱模型及其构建方法

文档序号:5877761阅读:201来源:国知局
专利名称:检测大肠癌血清蛋白质的质谱模型及其构建方法
技术领域
本发明涉及恶性肿瘤检测领域,为一种新的非侵入性的检测方法,在体外对大肠癌进行早期发现,早期检测,其敏感性和特异性均达到90%以上。
表面-增强激光解吸-电离(SELDI)根本的原理是通过使用特异的探针表面俘获蛋白质表面-增强亲合力,是最近两年才发展起来的一种新的蛋白组学的研究方法。SELDI可以克服二维凝胶电泳存在的内在问题,包括疏水性问题、强酸性、强碱性的蛋白质的分离、膜蛋白的分离问题、低分子量检测的灵敏性、低丰度蛋白质的灵敏性问题。蛋白质只要与SELDI蛋白质芯片阵列结合,就可通过电离-解吸飞行时间-质谱仪检测,并根据蛋白质的质量和电荷比(m/z)每一个蛋白质的峰值明显地分离并形成一个蛋白质(保留在芯片上的蛋白质)的图谱。
目前,在非侵入性大肠癌的诊断中常有以下几种方法①粪便潜血试验,粪便潜血是最为常见的大肠癌早期指征之一,但仅有50%的大肠癌和30%腺瘤隐血试验阳性,假阴性太多,为此不少学者致力于改进隐血试验的方法,如愈创木脂法,免疫隐血试剂法等。其特异性虽然提高了,但敏感性却降低,且费用也增加了。②粪便生化与免疫学试验,应用免疫胶乳清蛋白试剂盒检测粪便中高于正常量的清蛋白,对隐血阴性的大肠癌的检测起到补充的作用,但其在大肠癌中的阳性率为55.4%,腺瘤为27.1%。此外,大肠癌患者粪便中的促腐因子,各种肿瘤伴随抗原和肿瘤相关产物的检测,在大肠癌早期诊断中也起到一定的帮助。③粪便中癌基因的检测,Doolittle等发现在46-50%的大肠癌病人的粪便中检测到K-Ras基因的突变。Dong等在大肠癌病人的粪便中对TP53,BAT26,and K-Ras基因进行检测也发现有71%的大肠癌中同时发生突变。④血液中肿瘤标记物的检测,Barillari等88例大肠癌患者的血清进行了CEA,TPA and CA 19-9的检测,发现它们的敏感性和特异性分别为72%、62%、38%和78%、86%、97%。Nicolini等对90例大肠癌病人的血清进行CEA,TPA,GICA,CA 72.4,和CA 195的检测,同样发现他们的敏感性与特异性仍徘徊在50-70%之间。⑤血液中癌基因的检测,Hibi等发现在44例大肠癌病人的血清中检测到22例有K-Ras或p53基因的微卫星不稳定性。Salbe等也在35例病人中的血清中发现40%的病人有K-Ras基因的突变。Lauschke等的研究也证实在病人的血清中可检测到K-Ras和APC基因的突变。可见大肠癌早期诊断的方法很多,但均存在特异性与敏感性之间的矛盾,假阳性率和假阴性率高的问题。这也是困扰我们对大肠癌进行早期诊断的最重要的问题。
本发明提供的模型由人血清蛋白质质谱、质谱仪及人工神经网络分析组成。
本发明提供的人血清蛋白质质谱由四个质荷比(M/Z)位于5910±15Da,8930±15Da,4476±15Da和8817±15Da的蛋白质(包括磷酸化,甲基化,乙酰基化修饰前或修饰后)所组成。
本发明的第二个目的是提供这种质谱模型的构建方法,包括①血清准备,②质谱数据的收集,③质谱数据的人工神经网络分析。
本发明提供的质谱模型的构建方法,血清准备包括白蛋白亲和树脂CibacronBlue 3GA(Sigma),以1%CHAPS作为去垢剂,20mM HEPES的缓冲液,采用H4蛋白质芯片(Ciphergen)。
本发明提供的质谱模型的构建方法,质谱仪采用表面-增强激光解吸-电离-飞行时间-质谱仪(surface-enhanced laser desorption/ionization time-of-flight massspectrometry SELDI-TOF-MS)进行质谱数据收集,其中激光强度为130,检测敏感性为6。
本发明提供的质谱模型的构建方法,采用反向传播(BP)人工神经网络的方法进行质谱数据的分析。
本发明与其他非侵入性大肠癌的诊断方法比较具有以下优点(1)本发明提供的质谱模型,为早期诊断大肠癌提供了新的途径和方法,并为进一步发现新的肿瘤标记物提供了基础。(2)与以往的传统的非侵入性方法比较具有极高的特异性与敏感性,其敏感性与特异性均达到90%以上,是一种在蛋白质组学水平上的诊断,对大肠癌的早期发现,早期诊断提供了新的方法与标准。(3)本发明模型的构建方法设计合理,可行,是为降低我国大肠癌的病死率、提高大肠癌的治愈率、进一步筛查大肠癌提供了一种新的方法。
图2为部分健康人与大肠癌血清的蛋白质质谱图。
图3为质荷比(M/Z)位于(A)5910Da,(B)8930Da,(C)4476Da和(D)8817Da的部分健康人与大肠癌血清的蛋白质质谱图。
图4为人工神经网络训练图。
图5为人工神经网络训练参数设置。
实施例1 本发明的一种检测大肠癌血清蛋白质的质谱模型及构建方法1、技术路线血清标本在冰浴中解冻后3000rpm离心5分钟,取10ul加入90ul0.5%CHAPS(pH7.4)溶液中充分混匀(10分钟),白蛋白亲和树脂(Cibacron Blue3GA(Sigma))预先用0.5%CHAPS平衡3次×5分钟,将Cibacron Blue 3GA与血清样本在4℃摇床上60分钟,12000rpm离心5分钟(4℃),取上清溶液40ul。H4芯片(Ciphergen)预先用20mM HEPES(pH7.4)平衡2次×5分钟,将去除白蛋白后的血清标本用20mM HEPES(pH7.4)稀释至200ul,加至96孔的Bioprocessor(Ciphergen),振荡平台上振荡60分钟。甩去血清标本,20mM HEPES(pH7.4)200ul清洗芯片3次×5分钟,再用去离子水清洗芯片2次×1分钟,干燥后加入0.5ul CHCA(α-cyano-4-hydroxycinnamic acid)×2次。上机检测。
2、数据收集与处理应用PBS-II SELDI质谱仪(Ciphergen),分析软件为Proteinchip Software3.0版。设定激光强度为150,灵敏度为6,收集数据的范围为1000-200000,收集位置从20-80,平均每点收集20次,收集总点数为140次。在收集每次实验数据前用标准蛋白芯片校正分子量。
所有原始数据先用Proteinchip Software 3.0做校正(总离子强度及分子量的均一化)。先对训练组的2k-20k的峰值,用Proteinchip Software 3.0的biomark wizard过滤噪音,设置初始的噪音过滤值为5,第二次的噪音过滤值为2,以10%为最小阈值聚类共产生多个分子量的质谱图。然后用相同方法获取测试组的多个相同分子量的质谱图。
3、网络参数的优化对训练集用这多个变量建立一个神经网络。神经网络采用反向传播算法(用共轭梯度学习函数改进Trainscg)。具体设置为共有4层,输入输出层,和两个隐含层,每个隐含层有20个神经元。每一层都采用正切S形传递函数(Tansig)。随机初始化。输出神经元为1个,对应健康人和大肠癌患者的期望输出值,分别设为-1和1。首先对训练标本进行人工神经网络训练,得出一个模型,对模型进行检验,并利用此模型对未知血清进行盲法分析。
实施例2 部分实例1、样本与仪器147例血清标本,其中55例大肠癌的血清标本均来自浙江大学医学院附属第二医院肿瘤科,92例健康人的血清标本取自经本院体检的健康人群。55例大肠癌均经术后病理报告确定,其中Dukes A8例;Dukes B20例;Dukes C15例;Dukes D12例。其中男性35例,女性20例,平均年龄57.6岁(31-84岁)。92例健康人均经常规体检项目确定健康的人群,以年龄和性别配对,其中男性60例,女性32例,平均年龄55.3岁(28-78岁)。所有的血清标本均在清晨空腹下抽取,分离血清后储存于-80℃低温冰箱中。大肠癌的血清标本须在进行所有治疗前留取。147例标本随机分成训练组87例,与测试组60例。
PBS-II表面-增强激光解吸-电离飞行时间-质谱仪(SELDI-TOF)及实验所需的H4蛋白质芯片由美国Ciphergen公司研制。人工神经网络软件采用Matlab的NNTools,预先将数据进行矩阵转换后输入NNTools。。
2、技术路线血清标本在冰浴中解冻后3000rpm离心5分钟,取10ul加入90ul0.5%CHAPS(pH7.4)溶液中充分混匀(10分钟),Cibacron Blue 3GA(Sigma)预先用0.5%CHAPS平衡3次×5分钟,将Cibacron Blue 3GA与血清样本在4℃摇床上60分钟,12000rpm离心5分钟(4℃),取上清溶液40ul。H4芯片(Ciphergen)预先用20mM HEPES(pH7.4)平衡2次×5分钟,将去除白蛋白后的血清标本用20mM HEPES(pH7.4)稀释至200ul,加至96孔的Bioprocessor(Ciphergen),振荡平台上振荡60分钟。甩去血清标本,20mM HEPES(pH7.4)200ul清洗芯片3次×5分钟,再用去离子水清洗芯片2次×1分钟,干燥后加入0.5ul CHCA(Ciphergen)×2次。上机检测。
3、数据收集与处理应用PBS-II SELDI质谱仪(Ciphergen),分析软件为Proteinchip Software3.0版。设定激光强度为150,灵敏度为6,收集数据的范围为1000-200000,收集位置从20-80,平均每点收集20次,收集总点数为140次。在收集每次实验数据前用标准蛋白芯片校正分子量。
所有原始数据先用Proteinchip Software 3.0做校正(总离子强度及分子量的均一化)。先对训练组的2k-20k的峰值,用Proteinchip Sofiware 3.0的biomarkwizard过滤噪音,设置初始的噪音过滤值为5,第二次的噪音过滤值为2,以10%为最小阈值聚类共产生54个分子量的质谱图。将健康人与大肠癌两组血清蛋白质质谱数据进行成组资料的多元方差分析(Kruskal-Wallis法),选择p值<0.0000001的四个质荷比(M/Z)位于5910Da,8930Da,4476Da和8817Da的蛋白质作为鉴别大肠癌与健康人血清蛋白质的质谱。
4、网络参数的优化
对训练集用这4个变量建立一个神经网络,参见

图1。神经网络采用反向传播算法(用共轭梯度学习函数改进Trainscg)。具体设置为共有4层,输入层2、输出层3,和两个隐含层3-2、3-2,每个隐含层有20个神经元,有3个连接权重值5、6、7,每一层都采用正切S形传递函数(Tansig)。随机初始化。输出神经元为1个,对应健康人和大肠癌患者的期望输出值,分别设为健康人-1和大肠癌1。首先对87例标本进行人工神经网络训练,得出一个模型,对模型进行检验,并利用此模型对60例未知血清进行盲法分析。
5、盲法分析方法对60例血清标本(包括大肠癌患者与健康人)进行盲法预测,应用相同的技术路线与收集数据的方法,用已确定的聚类模型对60例血清的蛋白质的质谱进行聚类,同样得到4个分子量的峰值,将数据导出后,进行矩阵转换,再导入已建立的人工神经网络模型,输出预测值。
结果1、血清蛋白质质谱图所有芯片在PBS-II型SELDI质谱仪(Ciphergen)进行数据的读取,每个标本均收集140次,共检测到160个不同质荷比(M/Z)的峰值,所有数据均保存在同一个文件中,部分图谱参见图2,在图2中共有8例样本,在上方的4例为健康人的血清蛋白质质谱图,下方的4例为大肠癌患者的。原始数据先用Proteinchip Software 3.0(Ciphergen)做校正(总离子强度及分子量的均一化)。对2k-20k的峰值,用Proteinchip Software 3.0的biomark wizard过滤噪音,设置初始的噪音过滤值为5,第二次的噪音过滤值为2,以10%为最小阈值。聚类共产生54个分子量的峰值图谱。图3是将图2中的质荷比(M/Z)位于5910Da,8930Da,4476Da和8817Da区域放大,图3A,3B,3C,3D分别是分子量位于5910Da,8930Da,4476Da和8817Da的放大质谱图,左面为质谱图,右面为相应的模拟电泳图。均为4例健康人和4例大肠癌患者的对照。
2、人工神经网络模型对87例训练组的血清标本的蛋白质质谱图数据经矩阵转换后,输入MATLAB的NNTools中,进行训练(训练结果参见图4),经过254次后模型达到我们设定的值(参见图5),检验模型的误差低于1×10-8。
将87例血清标本的蛋白质质谱数据用此模型进行检验,输出值为-1和1,-1为健康人,1为大肠癌患者,结果所有大肠癌患者和健康人都被准确地分类,(见表1)。
表1 87例血清标本应用人工神经网络模型的输出值样本 例数 输出值(1)输出值(-1) 准确率(%)大肠癌22 22(100%) 0(0%) 100健康人65 0(1%) 65(100%)100总例数87 1003、盲法分析结果60例未知的血清标本应用已确定的方法进行血清蛋白质质谱的测定,对每例血清蛋白质质谱数据导入已建立的人工神经网络模型中,进行预测,23例大肠癌病人中19例,37例健康人中有34例被准确地预测,结果见表2表260例未知血清标本应用人工神经网络模型输出值样本 例数预测大肠癌(1) 预测健康人(-1)预测率(%)大肠癌23 19(82.6%)4(17.4%)82.6健康人37 3(8.1%) 34(91.9%) 91.9总例数6088.3计算该方法的敏感性为82.6%(19/23),特异性为91.9%(34/37)。
4、血清CEA的检测我们同时对147例血清标本进行了CEA的检测(时间分辨荧光分析技术TRF),结果得到应用血清CEA检测大肠癌的敏感性与特异性分别为47.3%和93.5%,敏感性远远低于质谱法的结果。
本发明涉及的部分参考文献(1)、李连弟,鲁凤珠,张思维,等.中国恶性肿瘤死亡率20年变化趋势和近期预测分析.中华肿瘤杂志,1997,19(1)3-9(2)、Young GP.Prevention and early detection of colorectal cancer.Landon WB Sounders,1996241-250(3)、Hutchens TW,Yip T-T.Rapid Commun Mass Spectrom 1993;7576-80.
(4)、Merchant M,Weinberger SR.Recent advancements in surfaceenhancedlaser desorption/ionization-time of flight-mass spectrometry.Electrophoresis2000;211164-7(5)、刘希永,郑树,陈坤,等大肠癌序贯筛检方案在人群中应用的前瞻性评估 中华流行病学杂志,2000,21(6)285-287(6)、李世荣,张采莲,徐恩迪。粪便序贯隐血与微量白蛋白互补对提高大肠肿瘤筛检率的价值 中华肿瘤杂志 1995;17381-383(7)、Hu JY.Wang S,Zhu JG et al.Expression of B7 costimulation moleculesby colorectal cancer cells reduces tumorigenicity and indues anti-tumor immunity.World J Gastroenterol.1999;5147-151(8)、Zhao CH,Jiang CY,Zhang YY et al.Analysis of LDH activities and itsisoenzyme pattems in colorectal cancer tissues.China Nati J New Gastroenterol1997;341-42(9)、Guo WJ,Zhou GD,Wu HJ,et al.Ultrastructural localization of glutathioneS-transferase-pi in human colorectal cancer cells World J Gastroenterol2000;6454-455(10)、冯相才,黄文,周殿元,等用抗人结肠癌单克隆抗体检测血液和粪便中大肠癌相关抗原的研究 新消化病学杂志,1995;336-38(11)、余少平,郑少金,周洪跃 单克隆抗体人群大肠癌普查意义再探讨华人消化杂志。1998;6(特刊7)498(12)、Doolittle,B.R.;Emanuel,J.;Tuttle,C.Detection of the mutated K-Rasbiomarker in colorectal carcinoma J.Natl.Cancer Inst.2001 70(3)289-301(13)、Dong,S.M.;Traverso,G.;Johnson,C.et al.Detecting colorectal cancer instool with the use of multiple genetic targets J.Natl.Cancer Inst.2001 93(11)858-865(14)、Barillari,P.;Ramacciato,G.;de Angelis,R.et al.The role of CEA,TPAand CA 19-9 in the early detection of recurrent colorectal cancer Int.J.ColorectalDis.1989 4(4)230-233(15)、Nicolini,A.;Caciagli,M.;Zampieri,F.Usefulness of CEA,TPA,GICA,CA72.4,and CA 195 in the Diagnosis of primary colorectal cancer and at its relapseCancer Detect.Prev.1995 19(2)183-195(16)、Hibi,K.;Robinson,C.R.;Booker,S.et al.Molecular detection of geneticalterations in the serum of colorectal cancer patients Cancer Res.1998 58(7)1405-1407(17)、Salbe,C.;Trevisiol,C.;Ferruzzi,E.et al Molecular detection of codon 12K-RAS mutations in circulating DNA from serum of colorectal cancer patientsInt.J.Biol.Markers 2000 15(4)300-307(18)、Lauschke,H.;Caspari,R.;Friedl,W.et al.Detection of APC and k-rasmutations in the serum of patients with colorectal cancer Cancer Detect.Prev.200125(1)55-61
本发明提及的所有文献都在申请中引用作为参考,就如同每一篇文献都被单独引用作为参考那样。此外应理解,本发明是结合最佳实施例进行描述的,然而在阅读了本发明的上述内容后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
权利要求
1.一种检测大肠癌血清蛋白质的质谱模型及其构建方法,其特征是该模型由人血清蛋白质质谱、质谱仪及人工神经网络分析组成。
2.如权利要求1所述的检测大肠癌血清蛋白质的质谱模型,其特征是该蛋白质的质谱由四个质荷比(M/Z)位于5910±15Da,8930±15Da,4476±15Da和8817±15Da的蛋白质所组成。
3.如权利要求1和2所述的检测大肠癌血清蛋白质的质谱模型的构建方法,其特征是①血清准备;②质谱数据的收集;③质谱数据的人工神经网络分析。
4.如权利要求3所述的质谱模型的构建方法,其特征是血清准备包括白蛋白亲和树脂Cibacron Blue 3GA(Sigma),以1%CHAPS作为去垢剂,20mMHEPES的缓冲液,采用H4蛋白质芯片(Ciphergen)。
5.如权利要求3所述的质谱模型的构建方法,其特征是利用表面-增强激光解吸-电离-飞行时间-质谱仪进行质谱数据收集,激光强度为130,检测敏感性为6,。
6.如权利要求3所述的质谱模型的构建方法,其特征是采用反向传播(BP)人工神经网络的方法进行质谱数据的分析。
7.如权利要求1和2所述的检测大肠癌血清蛋白质的质谱模型及构建方法,其特征是该模型可用于大肠癌早期检测和筛查。
全文摘要
本发明提供为一种对大肠癌进行检测的非侵入性的新方法——检测大肠癌血清蛋白质的质谱模型及构建方法。该模型由人血清蛋白质质谱、质谱仪及人工神经网络分析组成,血清蛋白质的质谱由四个质荷比(M/Z)的蛋白质所组成。其构建方法包括血清准备、质谱数据的收集、质谱数据的人工神经网络分析。本发明提供的模型能够对大肠癌进行早期检测,其敏感性与特异性均达到90%以上,是一种在蛋白质组学水平上的诊断,对大肠癌的早期发现,早期诊断提供了新的方法与标准,从而为降低我国大肠癌的病死率,提高大肠癌的治愈率,并进一步为高危人群筛查大肠癌提供一种新的方法。
文档编号G01N33/68GK1445533SQ0311676
公开日2003年10月1日 申请日期2003年4月28日 优先权日2003年4月28日
发明者陈益定, 郑树, 胡汛, 俞捷凯 申请人:浙江大学医学院附属第二医院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1