真核细胞中高化学计量的非遗传性突变的鉴定方法

文档序号:582032阅读:382来源:国知局
专利名称:真核细胞中高化学计量的非遗传性突变的鉴定方法
技术领域
本发明涉及一种用于鉴定非遗传性突变的方法,尤其是应用整体蛋白质组学方法 结合DNA测序以及可采用特异性结合蛋白质突变残基及侧翼序列的亲和试剂去鉴定真核 细胞中高化学计量的非遗传性突变的方法。
背景技术
基因突变与诸如癌症、神经性疾病和代谢异常等多种疾病相关(1’2)。就西方国家最 主要的致死疾病之一癌症而言,基因突变是其主要诱因。无论是体细胞还是生殖细胞中,即 使只有的基因发生突变也会导致癌变⑶。因此,在过去几十年里,随机基因突变与癌症 的相关性研究是肿瘤生物学的一个主要研究领域,研究证明了基因组的完整性在健康与疾 病中的关键角色。在生物信息流动中,基因先被转录为mRNA,随后mRNA被翻译为蛋白,整个过程通 常能正确地进行。在这个过程中如果基因发生突变,则改变的DNA信息传递给突变蛋白质, 最终影响细胞的生理学功率。除基因突变之外,蛋白质序列改变在原则上可以发生在蛋白 质合成过程中的任一步骤。如转录和翻译过程中的错误整合可能会产生由单氨基酸替换的 蛋白质突变。由于这种蛋白质突变是由蛋白质合成过程中的错误而不是DNA突变引起的, 我们将这种现象命名为非遗传性突变(NGM)(参见图1所示)。蛋白质合成的错误率已在模式生物和特定的基因中进行过研究。这些研究建立了 一个长期被接受的观点,即蛋白质合成的错误率非常低(4’5)。自上世纪70年代,通过体外 RNA聚合酶II的转录分析,对转录错误已进行了充分研究,研究表明转录过程中的典型错 误率在10_5至10_6之间(6_ 。蛋白质翻译过程中的错误研究在四十年前就已开展起来,现今 的研究主要集中在如细菌、酵母等低等生物的特定基因上。由于tRNA合成酶在tRNA氨酰化 时的错误和核糖体选择tRNA时的错误,翻译过程中的错误率估计在10_3至10_4之间(9_13)。 此外,目前尚不知由转录和翻译过程中的错误整合导致的蛋白质突变是随机发生在蛋白质 氨基酸序列上或集中在某些特定残基上。对细胞内蛋白质合成的错误率进行全面评估是一项困难的工作,迄今尚未全面开 展起来。近年来,随着蛋白质组学技术的发展,使得系统分析由NGM引起的蛋白质突变成为 可能。在过去十年里,基于大规模质谱分析的“鸟枪法”蛋白质组学技术成为蛋白质和蛋白 质翻译后修饰位点鉴定必不可少的手段(14aS。数据检索算法的进展得以开发串联质谱的 非限制性序列比对用于鉴定所有可能的蛋白质翻译后修饰(16_19)。该方法同样可用于系统 分析突变或寡核苷酸多态性(SNP)。然而,考虑到非限制性序列比对的典型性高错误率,以 及诸如对合成多肽MS/MS严格验证手段的缺失,上述研究的可靠性尚未能充分保证。此外, 对于突变是发生在DNA序列上还是蛋白质合成过程中的这一根本问题仍未能解答。

发明内容
为了解决上述问题,本发明提供了一种基于质谱分析的蛋白质组学技术和基因组DNA测序对真核细胞线粒体蛋白质组中非遗传性突变的鉴定及半定量方法。本发明的鉴定方法包括三个主要步骤首先,对从真核细胞中提取的线粒体蛋白 质进行大规模的蛋白质组学分析及PTMap扫描,准确识别所有可能带有点突变的NGM候选 多肽;其次,对突变型合成多肽高解析度的MS/MS及MS/MS/MS分析,将其分析数据与数据库 进行比对搜索,确认含有点突变的多肽;验证野生型突变多肽与突变型合成多肽的化学同 一性;最后,对含有点突变的多肽的对应DNA片段进行基因组DNA测序,以证实这些点突变 是由蛋白质合成过程而不是由基因点突变所造成的,即是非遗产性突变。在上述方案中,所述的PTMap是一种新型的非限制性序列比对算法。该算法基于 这样一种概念根据肽段的理论上的离子化片段,一次真实的串联质谱肽段鉴定应该能够 解释所有主要肽谱峰(17)。研究表明该算法具有高可靠性及低假阳性(17),并可用于鉴定与 所有已知及新的可能存在的蛋白质翻译后修饰方式对应的肽段质量位移(2°’21);同样,该算 法也能用于鉴定SNPs及NGM。本发明方法证明了真核细胞中NGM的高化学计量比,以及和野生型肽段相比,在 特定肽段上NGM的丰度可高达71 % (根据二级质谱肽谱计数),该数字远高于以前研究结 论;因此,通过本发明方法的研究结果暗示了存在一种尚未被揭示的内在机制对NGM进行 着调控。此外,基于本发明方法对蛋白质非遗传性突变的鉴定,为后继研制特异性的识别蛋 白质中非遗传性突变残基及其侧翼序列的亲和试剂提供了直接的可行性。


图1致使多肽点突变可能途径的示意图(左)遗传突变;(右)非遗传性突变的 两种途径转录错误或翻译错误。图2(A)系统鉴定真核细胞中线粒体蛋白非遗传性突变多肽的实验流程;(B)非遗 传性多肽的步进式确认示意图。图3通过对合成多肽的质谱分析确认鉴定的非遗传性多肽。野生型多肽序列 “AHFSLR”的高分辨率MS/MS鉴定㈧及相应合成多肽的MS/MS/MS鉴定(C);突变型多肽序 列“IHFSLR”的高分辨率MS/MS鉴定(B)及相应合成多肽的MS/MS/MS鉴定(D) ;MS/MS分析 中的最强离子片段进一步用于MS/MS/MS分析。“b” “y”离子类型按已有报道定义(45) ;
与“*”指对应于b或y离子的水分丢失离子与氨基丢失离子。图4基因组DNA序列确认示意图及导致P- > S突变的等位差异的鉴定。
具体实施例方式材料与方法从真核细胞中制备线粒体应用非连梯度分离方法(22^)WHeLa S3细胞中 (Biovestlnternational Inc. Minneapolis, MN)分离线粒体。制备过程中所有设备及溶 液均在冰上冷却。制备过程简述如下将50ml细胞沉淀在500ml添加有蛋白酶抑制剂 (Sigma, St. Louis,MO)的低渗缓冲液中重悬20 分钟(IOmM Tris pH 7. 3,1. 5mM MgCl2, IOmM KCl, IOmM 2-Mercaptoethanol);勻浆机勻浆后于IOOOg离心10分钟;收集上清液,并于 20,OOOg离心30分钟;将离心后沉淀重悬于6ml HIM缓冲液中(200mM甘露醇mannitol, 70mM蔗糖sucrose,ImM EGTA, IOmM HEPES, pH 7. 5,含蛋白酶抑止剂),随后转入含70%/20% (v/v) Percoll 溶液(GE Healthcare, Piscataway,NJ)的超速离心管中,于 Beckman Ti70(8X38. 5ml)固定角转子中100,OOOg离心1小时;将线粒体从70%/20%介面回收后 加入3倍量的PBS于20,OOOg离心10分钟;沉淀用液氮冷冻并保存于_80°C冰箱中。线粒体蛋白组分分离 线粒体用含1 % n-dodecyl-D-maltoside(n-十二烷 基-D-麦芽糖苷)的HlM缓冲液于冰上裂解30分钟,并不时涡旋;50,OOOg离心30分钟后, 测定上清中蛋白质浓度;10. 8mg线粒体蛋白质由制备性HPLC系统(Shimadzu Scientific Instrument, Columbia,MD)分成 50 组份,分离柱为 PolyCATWAX (2 0x9.4mm, 5 μ m,1000A, PolyLCInc.,Columbia,ffl)),溶剂 B 流速为 4ml/ 分钟(溶剂 B 梯度0% B,1 分钟;0% B ~ 8% B,7 分钟;8% B 32% B 13 分钟;32% B 48% B 16 分钟;48% B 80% B,6 分钟; 80% B 100% B,3 分钟;100% B,10分钟;移动相A :10mM MES,pH 6.0 ;移动相B =IOmMMES, PH 6.0,SOOmM NaCl) 0为减少样品蛋白的降解,整个实验均在4°C下操作。蛋白质沉淀与 溶液内胰酶裂解由HPLC分离的各组分蛋白均由三氯乙酸(TCA)沉淀法沉淀。将TCA加 入到各组分蛋白溶液中至终浓度为10%。将溶液混勻,4°C放置过夜;混合液于67,900g离 心,沉淀用预冷的丙酮洗三次;蛋白质沉淀重悬于50mM碳酸氢氨缓冲液中按完全裂解法裂 Μ (24) ο经修饰的猪胰酶(Pr0mega,MadiS0n,WI)按1 50 (w/w,酶比底物)加入至蛋白质 溶液中,37°C酶解过夜;加入DTT至终浓度为5mM,于56°C终止反应30分钟;随后加入碘乙 酰胺至终浓度15mM,于室温乙酰化30分钟;加入半胱胺酸至终浓度为15mM,于室温反应30 分钟以淬灭过量的酰化溶剂。按1 100(w/w,酶比底物)再次加入胰酶,于37°C裂解3小 时;裂解后溶液经真空干燥;干燥后的胰酶裂解多肽经yC18Ziptip(Millip0re,Bedford, ΜΑ)重新水化与脱盐。高效液相层析/质谱分析每份胰酶裂解样品溶解在3μ1 HPLC流动相A中 (0. 1 %甲酸/2%乙腈/97. 9%水(v/v/v)) O取1 μ 1进样至IJ Eksigent纳升HPLC系统中 (EksigentTechnologies, Dublin, CA),通过配有纳升电喷雾离子源的LTQ-Orbitrap进行 质谱分析(ThermoFisher Scientific,ffaltham,MA) 毛细管柱(IOcm长 Χ75μπι 内径)填 充 Luna C18 树脂(5 μ m 粒径,100 A孔径)(Phenomenex,Torrance, CA)。在 1. 5 小时内以 8 %至90 %流动相B (0. 1 %甲酸/90 %乙腈/9. 9 %水)从柱中梯度洗脱多肽,进入电喷雾质 谱分析。400m/z下以30,000解析度进行Orbitrap全质谱扫描采集。每个全扫描继以10 个数据依赖的LTQ 二级质谱扫描。数据依赖扫描的排除时间为36秒,重复计数为2,排除质 量窗口为+2Da和-IDa0鉴定含点突变多肽的蛋白质序列数据库搜索来自每个蛋白组分的HPLC-MS/MS 数据通过Mascot (v2. LMatrix Science,London,UK)进行蛋白质鉴定。通过Thermo Fisher 公司的“extractjiisn. exe”软件(采用其默认参数)产生峰阵列。设定Mascot分析前体离 子质量偏差为+/_2Da,碎片离子质量偏差为+/-0.5Da。所有数据通过国际蛋白索引(IPI) 人类蛋白数据库(V3.61)进行搜索。碘乙酰胺修饰的半胱氨酸烷基化被定义为固定修饰。 在每个样品,鉴定的P < 0. 05的蛋白以及满足截止分数14的多肽被整合到一个新的蛋白 质数据库中,用于后续的突变/修饰分析。用PTMap 2.0程序进行突变和修饰的多肽非限 制性鉴定。该程序能够实现复杂蛋白混合物的翻译后修饰/突变分析而不是单一蛋白(17)。 通过PTMap2.0程序分析产生峰阵列。非修饰多肽的全扫描质量偏差设为15ppm,二级质谱 质量偏差为0. 5Da。设甲硫氨酸氧化为可变修饰,碘乙酰胺修饰的半胱氨酸烷基化被定义为固定修饰。随后PTMap参数用于对蛋白质序列进行数据库搜索(17)。设定允许三个丢失酶切 位点。PTMap Simmatcted截止分数在前述质量范围和后续的前体离子m/z中设定为10 20。 对非修饰肽的PTMap截止分数为0.5,修饰肽为1.0。对于修饰性多肽,采用已报道方法确 定修饰位点(17)。基于reverse-forward数据库方法(25)估算错误发现率对于非修饰肽为 1%,翻译后修饰多肽则为5%。反向蛋白质序列数据库的构建与之前的报道相同(26)。所有 经鉴定的多肽序列都经过进一步严格手工确认β7),并且随后对合成多肽进行MS/MS及MS/ MS/MS确认。合成多肽质谱分析的肽段确认对于每一个鉴定了的具有非遗传性突变的多肽, 都合成了其野生型与突变型多肽。所有合成多肽都经过MS和MS/MS确认。在进行质谱分 析前,合成多肽的浓度已被调整到与对应的体内多肽相近的浓度。为避免多肽的残留污染 进行充分洗脱。野生型与突变型多肽的靶向MS/MS在400m/z下以分辨率15,000状态下采 集,通过LTQ离子阱采集了具非遗传性突变的体内突变型多肽及其对应的合成多肽的最强 碎片峰的三级质谱。比对搜索为检测含有点突变的多肽是否出现在蛋白质中,本发明对NCBI-nr 人类蛋白质数据库(http://blast.ncbi.nih.gov/blast.cgi)进行了蛋白质比对。对于 每一个目标多肽序列,由申请人自己开发的程序以亮氨酸与异亮氨酸为互换残基对其生 成多肽序列组,并以之进行查询。如果多肽组比对后没有与数据库中完全相匹配的结果, 则认为此多肽含有一个点突变。对与含有点突变多肽相对应的基因组DNA片段测序基 因组DNA样品从HeLa S3细胞(与制备线粒体所用为同一批样品)中用DNeasy Blood & Tissue 试剂盒 ^!IAGEN,Valencia, CA)提取。PCR 反应体系为 25 μ 1,含 2. 5U 的 Pfu Turbo DNA 聚合酶(Stratagene,La Jolla, CA) ,IXcloned Pfu DNA 聚合酶缓冲液,5mM dNTPs,45ngHeLa S3基因组DNA和IOpmole的正向及反向引物。PCR反应在Eppendorf MasterCycler (Eppendorf,ffestbury, NY)上进行,反应条件预变性 95°C 2 分钟;PCR 反应 30 个循环,每一循环 95°C 30s,52°C或 55°C 30s, 72°C Imin ;最后以 72°C IOmin 结束。PCR 产物被连接到pCR-Blunt II-TOPO克隆载体中(Invitrogen,Carlsbad, CA)。连接产物根 据产品说明转化至DH5 α感受态细胞OlIAGEN,Valencia, CA)。由PCR阳性克隆产生的质 粒DNA用QIApr印Spin Miniprep试剂盒按产品说明进行抽提(QIAGEN, Valencia, CA)。 DNA测序由芝加哥大学癌症研究中心所属DNA测序中心完成。核苷酸序列由Lasergene软 件(v8.02) (DNASTAR Inc.)进行分析并翻译成相应多肽序列。结果合理性长期以来,人们普遍认为蛋白质合成的错误率极低(4’5)。然而,这一结论的得出是 基于对一些特定转录与翻译系统的有限研究⑷。因此,尚缺乏在整体水平对NGM系统性地 开展研究。为填补这项空白,本发明利用高分辨率的LTQ Orbitrap质谱分析以及高可靠性 非限制性序列比对的PTMap算法,对NGM进行了蛋白质组规模的分析。如果野生型多肽与 其相应的突变型多肽都被鉴定到,那么该点突变很可能是由蛋白生物合成时导致的,而不 是由基因的点突变造成,除非在细胞中存在等位基因变体或多染色质。基于遗传或非遗传 的突变这两种可能性,可以在后续的基因组测序中加以区分。策略
鉴定由非遗传机制导致的蛋白质点突变需要高灵敏度与宽动态范围的检测能力, 因为相对于野生型,突变蛋白的浓度较低。为解决这一问题,本发明选择线粒体蛋白进行了 系统的NGM研究,这是因为线粒体蛋白首先在数量上满足要求(1,000至1,5000个),其次 线粒体蛋白在细胞调控中有着多种功能。HeLa S3细胞线粒体蛋白裂解物通过PolyCATWAX 混合柱进行分离。该柱有混合装填的弱阴与弱阳离子交换填料,从而在宽的等电点范围内 分离蛋白。通过这种方法,将10. 8mg线粒体蛋白分成50个组分。每一组分蛋白通过TCA/ 丙酮沉淀法沉淀,然后经完全酶解法进行胰酶酶解(24)。酶解多肽通过nano-HPLC/MS/MS和 LTQ Orbitrap进行质谱分析。二级质谱数据通过Mascot和PTMap算法分析(图2A)。通 过这种方法共鉴定了 1,355个蛋白(参见表1),随后对这1,355个蛋白进行了 NGM分析。表1.蛋白质信息IPl Jtfj M白质犓总分子数(Day
IPID0Q21812TaxJd=96D6 Ger>B_Symbor=AHNAK Neuioblast igffereniiatioivasBOdated pnoleiFi AHNAKS29213
IPID0465Q28TaxJcNSKB Gerie_Symbol=RCTPri ;TPH tficseplK>sphate isc^ierase 1 scjform 231057
IPl0eD5635-TTaxJi^STO Geiis_Synibol=C1Soffn0 UPF0556 proton C19orf101SS97
lPffif021@219TaxJd=SM eRS_3ynibol=LGAtS1 GaleciliT-11604S
IPi0GO249l5TaxJd=SOT Sefse_Syni&ol =PRDXS Jsoform Mitochondr^ of PeFcocir^oKin-S, miiochondrial2229^
IPI008S4105Taxj£t 96[i6 Gerse_Syrr bol=LAMP1 Lvsosoms-assodated nwnbrane glycoprotein 145367
ΙΡ 0012102TaxJMTO Gei^e_Symbol =G^IS M-^sty Ig^u cosarufne-S-sul Ja^se62B4S
IP D9D297DT淑Jsf=SOT Gene_Symbol-BAT2D1 I^ofoim 2 of BAT2 profesn i2915S5
iPE00646572Tax_lii=96i}S Gsne_Symboi=^UG16 1518 kOa pr^ein15192^
ipl00029019TaxJii=96iB Gene_Synibot-UBAP2L isoform 2 of UbKptin^socisiIed proton 2-能e1D39S1
fPiOtJOeSO^TaxJd=9TO Gerte_Symbo(=HRSP12 l flx)miclease OK11414542
ΙΡ βββ262閱TaxJd=9TO Gei>e_Symfeol^GA N(4)-(beia-N-aceiylgliJccisanninyl)-L-asparapRase377 16154
EPI00306043Tax_|d=9TO Geiie_Symbo!=YTHDF2 lsoform 1 of YTH domah fen% pattern 26Ξ467
Ρ\ D0D19755TaxJii=SKM Gene_Symbol=GST01 Glutathione S-transferase omega-127S33
IPtOOI71127 Gene_Synfibol=UBAP2 L^quiir^-asMciatad protein 211Τβ14
IPiGGI 793^ TaxJ<f=9^>6 Gerse_Synnbor=BAIAP2t1 Srain-spedflc ^gio^iesis inhibit^l^seocialed protein 2-like571 稱
权利要求
1.一种非遗传性突变的鉴定方法,包括下述步骤a.从真核细胞中提取线粒体蛋白质;b.对上述线粒体蛋白质进行大规模的蛋白质组学分析;c.识别所有可能带有点突变的NGM候选多肽;d.验证野生型突变多肽与突变型合成多肽的化学同一性;e.对含有点突变的多肽的对应DNA片段进行基因组DNA测序,以证实这些点突变是由 蛋白质合成过程而不是由基因点突变所造成的。
2.根据权利要求1所述的非遗传性突变的鉴定方法,其特征在于,步骤b是用非限制性 序列比对算法进行。
3.根据权利要求2所述的非遗传性突变的鉴定方法,其特征在于,所述非限制性序列 比对算法是PTMap扫描法。
全文摘要
本发明真核细胞中高化学计量的非遗传性突变的鉴定方法,提供了一种基于质谱分析的蛋白质组学技术和基因组DNA测序,对非遗传性突变(NGM)的单氨基酸突变导致的蛋白质合成错误的鉴定及半定量方法。本发明方法具体通过综合大规模蛋白质组分析、非限制性序列比对、合成肽段的高解析度二级质谱和三级质谱鉴定及基因测序,对NGM进行了系统解析,鉴定出4个蛋白的4个肽段中含有NGM。本发明估算出NGM在肽段中的发生率约0.05%,在蛋白质水平上高于0.3%。根据突变肽段及正常肽段的质谱肽谱计数比,NGM的化学计量介于0.05~0.71之间。通过本发明的鉴定方法首次证明了NGM的高发生率及高化学计量;同时,也预测了NGM作为一种可能的机制参于了基本的生物学和生理学过程。
文档编号C12Q1/68GK102140496SQ20101010304
公开日2011年8月3日 申请日期2010年1月29日 优先权日2010年1月29日
发明者赵英明 申请人:赵英明
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1