用于衍生多肽的串联质谱从头测序的锁定质量离子的制作方法

文档序号:3575672阅读:300来源:国知局
专利名称:用于衍生多肽的串联质谱从头测序的锁定质量离子的制作方法
技术领域
本发明涉及多肽或蛋白质的质谱测序技术,更具体地,涉及用于利用质谱分析进行从头测序的多肽衍生化技术,以及与此相关的锁定质量离子技术。
背景技术
蛋白质组学是蛋白质研究的领域,其研究对生物的蛋白质补足组(complement)进行的大规模或总体分析(Aebersold and Mann,2003,Nature 422198)。蛋白质组学在研究、诊断以及临床应用中是很重要的,因为来自若干技术学科的信息被与细胞功能及生理联系了起来,所述技术学科包括化学、遗传学、细胞成像和基于芯片或微阵列的蛋白质分析或DNA分析。实践中,蛋白质组学要求在短时间内对大量蛋白质的复杂数据进行详细分析。对蛋白质和肽的分析在大规模的蛋白质组学分析中是特别有用的。
质谱分析(MS)是蛋白质组学中潜在的有用工具,因为其对质量高度灵敏的测量可以通过氨基酸序列来鉴别出一些蛋白质(Aebersold andGoodlett,Chem.Rev.101269-295,2001;reviewed in Mann,et al.,2001,Ann.Rev.Biochemistry 70437;Kinter and Sherman,Protein sequencing andIdentification Using Tandem Mass Spectrometry,Wiley,NY,2000)。因为每种氨基酸或氨基酸残基的链理论上可以通过对其质量进行的精确测量来检测出来,因此足够精确的测量使得可对各种氨基酸进行鉴别。当样品处理和MS技术都高度精确时,就可以鉴别出形成多肽分子的氨基酸的实际序列。此外,如果用高度精确且可信赖的方法检测到了与一种氨基酸的已知质量的偏差,这就表示该氨基酸已被修饰。对蛋白质结构修饰的检测在蛋白质组学研究中极其重要。
质谱分析(MS)涉及在气相中对经过电离的待分析物进行的分析,其中使用对待分析物进行电离的离子源,测量经过电离的待分析物的质荷比(M/Z)的质量分析仪,以及记录每个m/z值处离子数目的检测器。MS装置还可以与分离装置耦合,以改进分析复杂混合物的能力。此外,可以将MS仪器进行组合来提高灵敏度和选择性。近来,已对样品制备和电离化技术进行了许多改进,其总体而言属于质谱仪的“离子源”部分。大气压电离化技术(Atmospheric Pressure Ionization,API),例如电喷雾电离化(Electrospray,ESI)、大气压化学电离化(Atmospheric PressureChemical Ionization,APCI)、大气压光化电离化(Atmospheric PressurePhotoionization,APPI)和大气压基质辅助激光解吸附/电离化(Atmospheric Pressure Matrix Assisted Laser Desorption/Ionization,APMALDI),目前常用于从流体样品中产生待分析物离子。上述技术已经通过增加进入质谱分析仪并到达下游检测器的经电离的待分析物离子的浓度,改进了质谱分析仪系统的灵敏度。
电喷雾源中,来自源装置(例如液相色谱柱)的待分析物溶液,通过针作为液体流被注入。由喷雾装置产生的液体流例如喷雾气体、气动辅助(pneumatic assist)和超声波的不稳定性,会导致所述的流被破坏成滴,其中很多都带有电荷,这是由于针相对于周围导体来说具有较高的电势造成的,或者是由于静电效应。通过蒸发对带电荷的滴进行解溶剂化,释放出经过解溶剂化并经过电离的待分析物分子。然后将所述待分析物离子引向质谱分析仪的接口,从所述接口将所述组成分子通过一个或多个下游的真空场所转移到质量分析仪中。在质量分析仪中,对待分析物离子进行过滤,然后对其进行检测。
对质量分析技术,例如飞行时间(TOF)和扇形磁场以及傅立叶变换离子回旋共振(FTICR)分析仪的协同改进,已使得1至10ppm(ppm表示“百万分之一”)的数量级的质量检测精确度成为可行。然而,这种水平的精确度需要仪器的稳定性和重复性达到一定程度,由于环境温度、质谱仪腔压力和施加电压的波动所导致的“漂移”(drift)使得所需要的稳定性和重复性无法一直都可获得。为调校此类漂移,用已知的质量来校正仪器,其中使用被称为质量校正的方法。根据此技术,典型地,使用具有特征性的m/z比率的已知化合物(本文中称为“锁定质量”)来与未知化合物的样品(待分析物)一起进行分析或连续地进行分析。得到的质谱含有一个或多个与所述锁定质量的m/z比率相应的内部校正峰,然后其可被用作比例尺,通过其来测量与未知化合物相应的峰的质量。对锁定质量离子的使用可被用于对仪器的直接校正,用于在对某些待分析物的测量中的错误检测,用于对某些待分析物中的特定的峰或强度的比较,以及用于任何定性或定量的质量分析或数据处理步骤。因此,当用质量分析来测量多肽时,谱包括来自锁定质量离子的峰以及来自肽片段的峰。得到的谱因此可能含有对校正MS仪器、关于多肽待分析物的衍生序列信息,以及协助对待分析物的数学分析有用的信息,这可以独立进行,或者可以与对仪器的校正一起进行。
在质量校正的传统方法中,在离子源中进行电离化之前就将锁定质量与未知样品相混合。该传统方法会受污染的影响,因为所述的锁定质量污染了转移线以及毛细末梢,抑制了对样品化合物的电离化效率。在需要对大分子量的化合物(例如多肽)进行区别的高精确度的阈值处,轻微的仪器漂移就可能导致错误的结果,需要在大漂移波动产生之前以高通量的速率进行连续的分析。对于高通量的速率,锁定质量污染成为更为重要的议题,因为从前次分析留下的锁定质量的残基可能难于在后续分析进行之前被清除。
外部引入锁定质量减轻了污染的效果。见美国专利No.6,207,954、欧洲专利EP No.0966022。然而,对于外部引入技术,待分析物样品以及锁定质量离子必须来自不同的探针,这会减少溶液中所述锁定质量及样品之间的相互作用和探针污染,因此需要两倍的样品探针和注射器。
考虑到肽的片段化所固有的复杂性和对MS谱的分析的困难,用于对肽进行化学衍生化的不同方法的组合还未完全发展起来。对蛋白质组学以及对肽的复杂混合物的分析而言,一般公认仅有非常简单并且极端有效的化学衍生化步骤能与蛋白质组学兼容。如果化学反应引入了任何杂质,那么肽的样品将变得甚至更为复杂,因此使得MS分析及其后的数据处理复杂化。(Mann and Jensen,Nat.Biotech.21255-261,2003)。因此,虽然化学衍生化法是用于质谱分析的已知工序,但是使用多种不相关的衍生化技术被认为将会向肽的质量分析引入显著的复杂度和复杂性,使用从头测序(de novo sequencing)来对肽的线性氨基酸序列进行完全的测定仍然是很困难的。

发明内容
本发明是对用于质谱分析的多肽进行化学衍生化以及在质量分析之前使用内部引入的锁定质量离子的新颖的手段。本发明既包括方法,又包括物质的组合物;具体而言,本发明包括多种化学衍生物,与引入或制造锁定质量分子的MS仪器相关的多种衍生物的用途,改进的数据分析技术,所述技术应用于经衍生化的多肽的方法,用于测定经过修饰的肽的氨基酸序列,本发明还包括用于质量分析中上述所有用途的方法和装置。在某些实施方式中,本发明还包括用于MS数据分析的新技术,其中使用了谱的数据,计算机数据库以及使用MS数据以鉴别蛋白质、鉴别肽或肽的序列的软件和算法,以及用对多肽的质量分析以及锁定质量离子对多肽进行从头测序的软件和算法。
在一些实施方式中,本发明包括至少两个化学反应步骤,其中,每一个都是对多肽中存在的化学基团的衍生化。该方法被称为多次衍生化,因为使用了至少两种截然不同的标记方法。实验室中进行的化学反应步骤可依次或平行地进行于下述环境中,其中,所述的化学反应不干扰对所述肽的修饰,或者不干扰试剂之间的交叉反应,以这样的方式使得待分析的肽的所述反应和衍生化得到折衷。典型地,衍生化进行于已经或将要被消化以产生多肽片段的样品上,典型地,其具有至少两个化学标记步骤在第一个步骤,消化后对多肽进行衍生化,以建立活性末端及获得第一种衍生物,以协助对单个残基的鉴别。第一个衍生化步骤的例子是赖氨酸衍生化,例如Peters,et al.(WO 03/056299)所描述的方法。
在第二次衍生化中,已经过第一个衍生化步骤衍生化的多肽,例如赖氨酸(特别是C-末端的赖氨酸)被衍生化的那些,被用于进行第二次化学衍生化,其中会独特地修饰与第一次衍生化不同的部分。第二次衍生化的一个例子是对羧基的烷基化,例如,对天冬氨酸残基的羧基进行甲基化。所述开展两种对肽的部分进行衍生化的方法区别于使用核同位素作为质量标签或使用两步化学反应,所述化学反应利用了保护基团保护特定的肽的部分免受单次化学衍生化。对赖氨酸的衍生化可以在对多肽进行的酶消化或化学片段化之后发生。该衍生化步骤可以在对羧基烷基化之前或之后有利地进行,这取决于待分析物或其它的实验参数。
在一种优选的实施方式中,对多肽或蛋白质样品进行胰蛋白酶水解之后,接着是第一次衍生化,其优选标记胰蛋白酶水解片段的C-末端残基,典型地,产生C-末端赖氨酸的咪唑衍生物。第一或单一的经衍生化的多肽与第二衍生化试剂反应,以在羧基处对多肽的酸性残基侧链产生额外的衍生化。
本发明的另一应用是鉴别出样品中存在的蛋白质或多肽待分析物的变异体或修饰。很多重要的生理条件是由对蛋白质或多肽的修饰导致的,所述修饰可于含有来自病人的多肽的生物样品中检测到,所述生物样品例如血液、尿、唾液、脑脊髓、体液、腹水、血浆、细胞或组织样品或提取物或常用于分析方法的其它物质。采用上述样品,对蛋白质或多肽待分析物的精确实验测量允许基于对多肽的测量出的质谱图案与假定或标准质谱图案的比较的分析和诊断。所述标准质谱图案可以代表正常的待分析物,或者代表已知表示疾病状态或已知的生理条件、或特定的目标基因型的待分析物。在该种实施方式中,实验获得的序列被与标准物或参照物进行比较,其差异与标准或参照和病人的待分析物之间存在的特定修饰或改变相关。该测量出的差异因此能鉴别出突变,多态性,剪切重排,缺失,取代或其它翻译后修饰,例如磷酸化、乙酰化、氧化、甲基化、凝胶化、糖基化等。
在不同的实施方式中,锁定质量离子的源可以包括不同的结构,以引入锁定质量分子,其可以包括光电离化、场解吸附电离化、电子电离化和热电离化装置。锁定质量离子可被向内引入到串联质谱仪中,其中,典型地,所述的串联质谱仪具有第一质量分析仪场所(stage)、碰撞室和第二质量分析仪场所。所述碰撞室从第一质量分析仪接收经过衍生化的多肽待分析物离子,其包括碰撞气体,所述气体对经过衍生化的多肽离子进行片段化,成更小尺寸的经衍生化的子代(daughter)离子。碰撞室中的所述第一质量分析仪场所使得分开的单元结合起来形成单一的装置。所述电离化可以在将待分析物和锁定质量分子引入到离子光学器件之前发生,或在离子光学器件中发生。因此,所述锁定质量离子可在经衍生化的多肽离子的下游途径中或附近被实质上电离化,使得经过衍生化的多肽离子和锁定质量离子经过同样的途径,同时或实质上同时被进行质量分析。
用于通过串联质谱分析对多肽待分析物进行质量校正的方法包括使用碰撞室和在碰撞室中制造锁定质量离子。在该实施方式中,锁定质量离子被引入到碰撞室中,并在碰撞室中被电离。然而,本领域的技术人员将意识到,电离化可在所述碰撞室之中或之外发生。如上所述,所述锁定质量离子可在离子光学器件中被制造出来,所述器件是将多肽待分析物子代离子转移到质量分析仪场所中去的。在该实施方式中,锁定质量离子或者通过将锁定质量离子引入到离子光学器件中产生出来,或者通过在所述离子光学器件中对锁定质量离子进行电离化产生出来。本文中描述的每种方法都包括如下步骤用对锁定质量离子的检测和对锁定质量离子质量分析(单独进行或与多肽待分析物一起进行),来独立地校正质量分析仪。


图1A和图1B是咪唑标记的肽(SEQ ID NO1)GLQYLLEK的MS/MS谱(MALDI/Q-TOF),其赖氨酸残基处已被衍生化,羧酸酯基团被进行了甲基化。肽(SEQ ID NO1)GLQYLLEK是从β晶状体球蛋白(牛眼晶状体)的胰蛋白酶消化产物中产生的。
图2A和2B是咪唑标记的肽(SEQ ID NO2)CDENILWLDYK的MS/MS谱(MALDI/Q-TOF),所述的肽产生自丙酮酸激酶(兔肌肉)的胰蛋白酶消化产物。
图3A和图3B是咪唑标记的肽(SEQ ID NO1)GLQYLLEK的MS/MS谱,已用咪唑对所述的肽羧基末端的赖氨酸和氨基末端的赖氨酸进行了衍生化,所述的肽产生自β-晶状体球蛋白(牛眼晶状体)的胰蛋白酶消化产物。
图4A和图4B。Lys-C可被用于消化蛋白质,以增加羧基末端赖氨酸的出现,这可能会增加用于鉴别的蛋白质序列的覆盖范围。然而,Lys-C消化之后得到的肽通常具有内部的精氨酸,这使得它们的MS/MS谱难于被解读,即使是在咪唑衍生化之后,如图4A所示。对来自细胞色素C(牛心脏)的同样的肽(SEQ ID NO3)进行连续衍生化之后的MS/MS谱(图4B)显示了直到内部精氨酸的长且占据优势的y-离子系列,使得该肽序列的长段可被读出。
图5是本发明的方法的一种实施方式,所述方法包括对质谱数据的分析,以进行从头的肽序列分析、在后续分析中使用序列数据、以及开展大量需要精确序列信息的肽分析步骤中的任何一种。
图6是包括有本发明的一种实施方式的质谱分析仪系统的结构图。
图7是包括有本发明的一种实施方式的图6的质谱分析仪系统的结构图。
图8展示了图6的质谱分析仪系统的一种实施方式,其中用同心共轴的辐射灯作为电离化的源。
图9展示了包括有本发明的串联质谱分析仪系统(MS/MS)的一种示例性实施方式。
图10展示了包括有本发明的串联质谱分析仪系统的一种实施方式。
具体实施例方式
定义本文中使用的术语“烷基化剂”指如本文中所述的能与氨基酸的羧酸酯基团反应以产生烷基衍生物的化合物。
术语“质量分析”指一种方法,其中,对氨基酸残基的鉴别是通过对质量电荷比(M/Z)的测量来确定的。
“多肽”指包含通过肽键相连的氨基酸残基、相关的天然形成的结构变异体、以及合成的非天然形成的其类似物的聚合物,相关的天然形成的其结构变异体,以及合成的非天然形成的其类似物。术语“多肽”还包括作为较大多肽的切割、消化或片段化产物存在的多个氨基酸,其中,切割、消化或片段化是通过化学、生化、电离化、机械或其它反应发生的。术语“蛋白质”典型地指超过大约20个氨基酸残基的大多肽。本文中使用的术语“蛋白质”和“多肽”可以互换。术语“肽”典型地指10个至20个残基的短多肽。
对通过片段化从蛋白质获得的一组肽而言,获得对其精确的质量测量的能力使得通过质谱进行的多肽分析容易起来,所述片段化是在使用用于蛋白水解的特异性切割酶之后发生于特定的氨基酸序列上的。对蛋白质进行鉴别的原理假设用规定的蛋白酶水解之后,不同氨基酸序列的蛋白质产生的一组肽构成对特定的蛋白质来说独一无二的蛋白质质量指纹(fingerprint)。如果用基于实验中精确观察到的肽的指纹而选定的质量,来搜索含有该特定蛋白质序列的序列数据库,用作为外部参照物的锁定质量离子进行校正,并将该数据库与蛋白酶的片段化规则联合起来,就可以期待能够在该数据库中正确地鉴别出所述蛋白质来。锁定质量离子的使用改善了用于单独谱的分析的定性和定量质量测量,也改善了用于测序或其它肽分析中的数据处理的定性和定量质量测量。
在可获得的MS设备中,MALDI-MS/MS是常用于肽分析的,虽然其它也可以使用。Aebersold and Goodlett,2001;Cramer and Corless,RapidComm.in Mass Spectrom.152058-2066,2001;其它MS仪器组合见Aebersold and Mann,2003。在MS分析之前对肽的N-末端进行化学修饰已被发现能改进MS分析。用活性N-羟基琥珀酰亚胺酯在N-末端引入季铵基团,增加了MALDI MS的灵敏度(Bartlet-Jones,et al.,Rapid Comm.Mass Spectrom.8737,1994)。Cardenas,et al用N-琥珀酰亚胺-2-(3-吡啶基)乙酸酯与肽进行反应,接着进行液相色谱分离及ESI-MS/MS分析(Cardenas,et al.,Rapid Comm.Mass Spectrum.111271-1278,1997)。该反应修饰了N-末端的氨基酸以及赖氨酸的氨基。Keough et al.报道将磺酸基添加到经胰蛋白酶水解的肽的N末端,会增加片段化的灵敏度,较之天然的肽会产生更高产量的片段离子。(WO 02/08767;2003/0032056;WO02/095419;PNAS 967131-7134,1999;Rapid Commun.Mass Spectrom 152227-2239,2001)。通过对酰胺氮的质子化对酰胺键进行去稳定,在MALDI和ESI(AP MALDI与离子阱MS组合)电离化条件下会产生广泛的片段化。经磺酸化的含有天冬氨酸、谷氨酸和被氧化的甲硫氨酸的肽的MS/MS谱显示,肽主链上的片段化更加一致。此外,Keogh et al.观察到了脯氨酸残基上N-末端一侧的优先片段化,这增强了对脯氨酸的识别。
在分析之前对肽的C-末端氨基酸进行化学修饰已被发现能形成更长且更稳定的y-离子系列。已有若干种对C-末端进行化学修饰的方法被报道用于赖氨酸。如上所述,通常在通过MS进行的多肽分析中使用胰蛋白酶消化来产生片段化,因为得到的片段会可靠地以精氨酸(R)或赖氨酸(K)结尾,因此建立起C-末端的部分。虽然已知精氨酸会产生异常强的MS信号,但赖氨酸却难于被检测到。然而,可对赖氨酸进行化学修饰以增强其信号(见Peters,WO 03/056299)。这种修饰可使赖氨酸的质量与谷氨酰胺的质量区别开。。Cagney和Emili(2002)使用了一种相似的手段,其中对C末端赖氨酸进行差别胍酯化(guanidination),接着进行LC-ESI-MS/MS分析(Cagney and Emili,Nat.Biotech.20163-170,2002)。Gu et al(Gu et al.,J.Am.Soc.Mass Spectrom.141-7,2003)利用了加入氘标记的(重)赖氨酸。
Peters et al.(Peters,et al.,WO 03/056299)描述了一种不同的用于C-末端赖氨酸的化学衍生化方法,其指出,当用一组特别的试剂,例如2-甲氧基-4,5-二氢-1-H-咪唑(称为“咪唑”)来修饰多肽C-末端的赖氨酸时,得到的MS/MS谱的复杂度将被很大地降低。Peters et al.注意到,对y-离子系列的鉴别会被改进,因此使得对氨基酸序列的检测更为精确。
通过对肽进行化学衍生化获得的对MS/MS谱的简化,额外的锁定质量离子,以及随之改善的对氨基酸序列数据进行测量和鉴别的能力,显示了发展高品质的片段化谱以及获得完整的b-离子以及尤其是y-离子序列的长的系列的精确测量的潜力,并提供了用于从头测序的实用手段。改进的从头质量测量的分辨率和精确的校正增加了序列测定的精确度,也减少了对预测性的蛋白质计算机序列分析的依赖。
通过上述方法进行的蛋白质鉴别涉及一些基本步骤。通过使用对氨基酸序列有特异性的切割试剂来对样品蛋白质进行消化,以产生肽,使得羧基-或氨基-末端的残基以合理的确定度被已知。例如,胰蛋白酶在消化片段的羧基末端了留下精氨酸(R)或赖氨酸(K)。因此,经胰蛋白酶消化的肽的N-末端(除了N-最末端的一个)可被鉴别为在蛋白质序列中紧接着K或R残基的氨基酸。消化之后,在质谱仪中对肽或多肽的质量进行尽可能精确的测量。在计算机中对实验蛋白质片段的质量数据进行处理,将其与计算机数据库中的数据进行比较,并且使用用于实验中所用的蛋白水解方法的规则,以产生一系列理论质量,与测量出的一系列质量进行比较。用算法来对测量出的一系列肽质量与上述对数据库中每个蛋白质预测的一系列质量进行比较,以及对每一匹配给出一个分数值,该分数值表示了匹配程度的排名。该方法通常被称为“计算机”消化(″in silico″digestion),通过质量分析对蛋白质进行正确的鉴别取决于测量出的质量与数据库中含有的相应数据之间的关系。然而,该方法中存在有很多困难。显然,对待鉴别的蛋白质而言,其序列必须要存在于用于比较的序列数据库中。另外,蛋白质混合物的消化物对质量分析来说存在一个问题,因为不易明确复杂的肽混合物中哪个肽来自于特定的蛋白质。测量精确度的提高将降低实验获得的质量与序列数据库中相应质量匹配的潜在错误,因此将增加数据库搜索的严谨度。
如果对纯粹的蛋白质进行消化,将得到的肽的质量与为该蛋白质预测出的一系列肽质量进行比较,典型地,将产生两种观察结果。第一种是并非所有预测出的肽都被检测到。第二种是一些测量出的肽质量并不在从该蛋白质预测出的一系列质量之中。第一个问题,遗漏的质量,通常是由于可能发生于质谱分析之前或期间的很多问题所导致的,例如低溶解度、选择性吸收、离子抑制、选择性电离、很短或很长的肽长度、遗漏的或不恰当的蛋白水解切割或其它导致样品丢失或使特定的肽很少或无法被MS检测到的人为因素。这是很关键的缺陷,因为遗漏的肽质量可能含有很有意义的生物信息。不幸的是,不进行进一步的实验,就无法区分无甚价值的和有意义的遗漏信息。因此,未被检出的肽质量是通过质谱进行的蛋白质鉴别的一个重大问题,并且,其可能是错误鉴别或遗漏鉴别的唯一的主要来源。
片段离子谱是通过被称为碰撞诱导裂解(CID)的方法来产生的,所述方法中,肽的酰胺键被破坏,之后是对片段离子谱的记录。对酰胺键的切割导致b-离子(含有N-末端)和y-离子(含有C-末端)的产生。经胰蛋白酶水解的肽的高品质的MS/MS谱典型地会显示显著的b和y-离子系列。如果对10残基肽的每个酰胺键而言,仅有上述两种离子产生的话,所述的片段离子谱将含有18个峰。理想地,b或y型占主导地位的长的稳定离子系列将被回收。实际中,肽的片段化是不定的,且取决于基团部分(moiety),这在分析中导致缺口及困难。产生的片段离子的多样性和不定性使得从肽的MS/MS谱来鉴别肽和测序变得复杂。使对MS/MS谱的解读变复杂的因素是遗漏的离子集合、内部重排、后续片段化以及多电荷状况。还需要考虑的是片段离子峰强度与离子系列来源和片段质量之间的关系、氨基酸残基及其衍生物对相邻酰胺键切割的影响、以及氨基酸组成和中性片段化丢失之间的联系。
质谱分析可以定义出多肽序列的特征,或者确定蛋白质或多肽序列的两种形式之间的不同之处。对来自两种生物学条件,例如来自癌症与正常细胞的蛋白质表达的比较,可揭示出对应于癌症状态的独一无二的蛋白质或一组蛋白质。在蛋白质组学中用质谱分析来从头获得序列信息的能力要求高度精确的MS技术、MS/MS谱的可靠产生、以及解读肽片段化由此鉴别出大量的特定残基从而产生真实可靠的序列信息的能力。为达到此目的,必须克服使用MS数据来确定肽的序列的过程中的若干已知的问题。根据本发明,多肽被多次衍生化,以对片段化特征进行控制,使得与未经过如此衍生化及与锁定质量离子联合起来用于联合质量分析的其它多肽相比较,得到的MS/MS谱中的y-离子展现出更加近似相等的强度,且使缺口和非测序数据点最少化。
从头测序中的重要参数包括多肽片段的片段离子方向性(directionality)氨基(b-离子)或羧基(y-离子)末端上离子电荷保持。一旦片段离子定向的方向性已被指定,就可以通过确定特定氨基酸残基的质量来从头获得肽序列。从头序列信息能产生相应于整个肽的较大部分的各单个残基的延长且可靠的鉴别,并从头数据用于数据库搜索时增强分析能力。从头获得的序列可与通过数据库搜索发现的序列进行比较,也可用于分析实验和理论数据之间的差异本身。当从头序列信息与从数据库搜索获得的序列不同时,该差异可以被归因于一种生物学现象,所述现象可在含有其序列被实验性测定的多肽的样品即生物样品中被鉴别出。该特定的基于肽的分析可以通过任何已知的下述技术来开展,所述技术中,可基于质量本身或与对锁定质量离子的测量的比较来确定特定的分子形式。可被鉴别出来的分子形式包括磷酸化、乙酰化、氧化、硝化、甲基化、硅化(silation)、糖基化、交联等。
虽然示出了利用MALDI/Q-TOF的特定序列的实施例,但本领域的技术人员可以认识到,该方法可被延伸到其它的MS接口(举例而言,电喷雾电离化MS)、另外的MS电离化体系、片段化手段以及质谱仪。如所述实施例所示,甲基化导致被咪唑衍生化的肽中C末端赖氨酸氨基酸侧链羧基的转化。去除羧酸酯基团离子化的电荷可能增加在片段化期间破坏邻近的肽键所需要的能量,因此,产生具有改进的y-离子强度分布的MS/MS谱。对样品进行处理以促进特定的片段化特征的能力和对实验获得的质量数据与锁定离子质量数据的比较,极大地简化了从头对序列的鉴别(即,对线型氨基酸序列的“召唤(calling)”)。
本发明改进了对来自本文公开的经过多次衍生化的多肽的肽数据进行的测序后分析。在一些情况下,本发明改进了可被开展的测序后数据分析的品质。在另一些情况下,对谱数据品质的改进使得目前由于肽序列质量分析的开展中所固有的困难而无法实现的新技术变得可行。
虽然本发明公开了具体的衍生化策略,但本领域的技术人员可以知道对酸性残基侧链或多肽链的其它地方、多个不同的功能基团进行其它化学修饰,以对从头序列召唤的精确度加以改进。
近来,包括同位素标记和化学衍生化的基于MS/MS的方法,已经提高了MS谱的读出率(Cagney and Emili,2002评论)。使用16O/18O标记,改进了对y-离子的鉴别,但还降低了信号强度(Munchbach et al.,Anal.Chem.724047-4057,2000;Uttenweiler-Joseph et al.,Proteomics 1668,2001)。另一种方法涉及到对肽中羧基的甲酯化(Hunt,et al.,PNAS 836233,1986;Goodlett,et al.,Rapid Commun.Mass Spectrom.151214,2001)。该反应增加了天冬氨酸和谷氨酸羧基侧链的质量,还修饰了C-末端的羧基。然而,对同位素标记和甲基化而言,经修饰的谱都应仍与原始的未被衍生的肽的谱进行比较。因此,对肽进行的化学标记可能需要额外的会使高通量测序变慢的实验及计算机步骤。质谱分析(MS)涉及在气相中对经过电离的待分析物进行的分析,其中使用对待分析物进行电离的离子源,测量经过电离的待分析物的质荷比(M/Z)的质量分析仪,以及记录每个m/z值处离子数目的检测器。MS装置还可以被耦合到分离装置(例如色谱柱、芯片分离系统等),以改进分析复杂混合物的能力。
虽然多次衍生化和锁定质量离子技术被特别地设计来协助使用串联MS/MS的从头多肽测序,但其应用还可延伸至其中从多肽的质量所获得的信息被下述的连续衍生化所改进的任何质谱分析。此外,虽然某些技术被描述为优选的,例如对赖氨酸的衍生化以及对酸性残基羧基的烷基化,但大量的其它衍生化是可以考虑的。当然,将一种特定的衍生化的顺序指定为“第一”或“第二”可以是完全任意的,不排除在反应条件允许的情况下对多肽的两个不相关的化学部分同时进行标记。
在本发明的描述中,用同位素标签来产生同位素类似物不被认为是本发明的衍生化步骤,虽然经过多次衍生化的多肽还可用同位素标签来标记。在一个方面,多次衍生化排除了对带有保护基团的单一标记种类的使用。在此类情况下,多肽上仅有单一的目标部分被标记,但是保护基团使某些允许基于单一标记的存在而产生定量差异的化学环境被区别开。
相反地,在多次衍生化中,两种不相关的标记策略被用于对目标多肽的两个化学基团进行独立衍生化,优选地,通过对两种或多种标记来说实质上全部可用的位点进行标记反应。第一次衍生化的一个例子由Peters etal.PCT/US02/35581,WO 03/056299提供,其全文通过引用的方式被特别地包括在本文中。典型地,用能破坏多肽酰胺键的化学反应来切割含有完整蛋白质、蛋白质片段或多肽片段或其它多肽待分析物的样品。
虽然本说明书中为了阐释的目的使用了胰蛋白酶的消化,但是其它特定的消化也是可能的,其包括但不限于胰凝乳蛋白酶、内蛋白酶、Arg C或Lys C,化学片段化方法,例如溴化氰切割、羟胺切割、BNPS-Skatole等。然而,胰蛋白酶(或内蛋白酶)切割是优选的,因为得到的多肽具有C-末端赖氨酸或精氨酸残基的特征。USP 5,821,063提供了用于多肽的通用消化方法。当然,赖氨酸残基的衍生化发生于末端赖氨酸和内部赖氨酸,虽然对末端赖氨酸的标记对于测序的目的来说是特别有用的。
在一个方面,通过连接具有任何如下结构式的咪唑衍生物来对赖氨酸残基进行衍生化 其中,每个R都是可从下述基团中独立选择出的功能基团,所述基团是氢、氘、卤素、羟基、氰基、可选的被取代的烷基、可选的被取代的烷基氨基甲酰基、可选的被取代的烷氧基、可选的被取代的烷氧基羰基、可选的被取代的芳基、可选的被取代的芳氧基、可选的被取代的芳氧基羰基、可选的被取代的芳基氨基甲酰基、可选的被取代的硅氧烷基(siloxanly)以及亲和标签。
下标“m”是从0-7的整数,其中,连接两个氮的环表示具有2至12个额外环原子的可选被取代的单环或双环系统,其中,所述环原子选自碳、氧、氮、硫和硅,其中,前述的环原子可选地可被取代。
在一个方面,所述标记具有如下结构式
其中,R1、R2、R3和R4都是可从下述基团中独立选择出的功能基团,所述基团是氢、氘、卤素、羟基、氰基、可选的被取代的烷基、可选的被取代的烷基氨基甲酰基、可选的被取代的烷氧基、可选的被取代的烷氧基羰基、可选的被取代的芳基、可选的被取代的芳氧基、可选的被取代的芳氧基羰基、可选的被取代的芳基氨基甲酰基以及亲和标签;或在另一种实施方式中,R2、R3和其与之相连的碳,联合形成了n元碳环、杂环、芳环或芳基杂环,其中n是从大约4至大约8之间的整数。优选地,形成5元或6元环。然而,在某些实施方式中,y是0,其邻接的碳原子和R1与R2都不存在,以形成4元环。
R5选自氢、卤素、羟基、可选的被取代的烷基、可选的被取代的烷氧基、可选的被取代的芳基和亲和标签。在结构式I中,下标“y”是0、1或2。
在另一个方面,用如下结构式的化合物来作为衍生化试剂
其中,每个R都各自独立地选自氢、氘、卤素、羟基、氰基、可选的被取代的烷基、可选的被取代的烷基氨基甲酰基、可选的被取代的烷氧基、可选的被取代的烷氧基羰基、可选的被取代的芳基、可选的被取代的芳氧基、可选的被取代的芳氧基羰基、可选的被取代的芳基氨基甲酰基、可选的被取代的硅氧烷基以及亲和标签。
下标“m”是从0-7的整数,其中,连接两个氮的环表示具有2至12个额外环原子的可选被取代的单环或双环系统,其中,环原子选自碳、氧、氮、硫和硅。结构式II中,LG是离去基团。
在一种实施方式中,所述标记具有如下结构式 其中,R1、R2、R3和R4都是可从下述基团中独立选择出的功能基团,所述基团是氢、氘、卤素、羟基、氰基、可选的被取代的烷基、可选的被取代的烷基氨基甲酰基、可选的被取代的烷氧基、可选的被取代的烷氧基羰基、可选的被取代的芳基、可选的被取代的芳氧基、可选的被取代的芳氧基羰基、可选的被取代的芳基氨基甲酰基以及亲和标签;或在另一种实施方式中,R2、R3和其与之相连的碳,联合形成了n元碳环、杂环、芳环或芳基杂环,其中n是从大约4至大约8之间的整数。优选地,形成5元或6元环。然而,在某些实施方式中,y是0,其邻接的碳原子和R1与R2都不存在,以形成4元环。
R5选自氢、卤素、羟基、可选的被取代的烷基、可选的被取代的烷氧基、可选的被取代的芳基和亲和标签。LG是X-CH3,其中X是杂原子例如O和S。下标“y”是0、1或2。
上述结构式的一种特别的实施方式是2-甲氧基-4,5-二氢-1H-咪唑,上述衍生化的一种实施例会在经胰蛋白酶消化的多肽的C末端赖氨酸残基处产生咪唑衍生物。
第一次衍生化不仅仅限于那些关于对C-末端残基进行标记以改进占优势的y-离子谱的方法。Carderas et al.Rapid Comm.Mass Spectrum.Vol.II,1271-1278(1997)先对肽进行了标记,再经过LC柱及后续的ESI MS/MS分析。衍生化反应在传统的LC装置中进行,其中,用经过修饰的胰蛋白酶对蛋白质样品进行消化,再用N-琥珀酰亚胺-2(3-吡啶基)乙酸酯(SPA)进行嵌入式衍生化。得到的N-末端吡啶乙酰基衍生物和赖氨酸侧链氨基基团与胰蛋白酶-OH基团的部分标记共同存在。该技术能帮助区分同量异位的残基和偏向于形成b-离子的CID片段化途径的改变。
在Bhikhabbai et al.PCT/US02/16247中描述了对肽的N-末端残基进行额外的功能衍生化,其中,用带有磺酰部分和经活化的酸部分的酸性试剂进行了水相衍生化。该反应的特征在于由于其趋向于降低MS检测的灵敏度,因而其需要较大的样品。在对衍生化反应的选择方面,从多肽片段的C-末端导致片段化反应以产生能在测序分析中对残基进行鉴别的y-离子的能力应与此类衍生化会极显著地降低获得的质谱的灵敏度这一趋势相平衡。Bhikhabbai et al.的衍生化可通过与下述步骤组合来实现,所述步骤保护某些特定官能团的反应,否则这些官能团将被衍生化。磺酰部分和经活化的酸的部分的组合将在每个赖氨酸残基处导致磺化反应。为了保护赖氨酸残基免受该反应,使用鸟嘌呤化(guanination)反应的保护手段被用于对赖氨酸侧链进行特别保护,以防止其在衍生化步骤中发生反应。此种保护的基团反应对该种衍生化来说是必要的,特别是使用胰蛋白酶消化因此在肽片段的C-末端产生了多个赖氨酸或精氨酸残基的时候。将保护基团与经活化的酸的部分和磺酰部分联合使用,是本文描述的多次衍生化范畴内的单一衍生化步骤。
Keough et al.(WO 00/43792)描述了另一种单一衍生化,其中用,例如磺基或双磺基衍生物,来获得用一个或多个pKa值小于2的酸的部分对多肽的N-末端进行的衍生化。该衍生化试图以电荷位点特异性的方式在多肽的酰胺键产生选择性切割,以使单一系列中仅有y-离子的选择性检测可以实现。
如上所述,第二个衍生化步骤帮助解决了存在独特问题的质量测量问题,并检测到了在单一衍生化的多肽中的问题。在一个方面,第二个衍生化步骤包含对酸性侧链羧酸酯基团的烷基化。在一种实施方式中,第二个衍生化步骤改变了被衍生化的肽的片段化特征,以给出具有近似等同的强度的占优势的y-离子系列。在任何一种上述实施方式中,在质量测量之前引入锁定质量离子,将其与经过多次衍生化的多肽一起分析。
对谷氨酸和天冬氨酸及其衍生物、类似物的酸性氨基酸侧链的羧基的烷基化可以按照如下述实施例1中所述的来获得。对肽中羧基的烷基化帮助区分y离子与存在的其它任何离子(包括化学噪音)。在一个甲基化的实施例中,该反应还增加了多肽片段的质量,每个羧基增加了14个质量单位。天冬氨酸和谷氨酸的酸性侧链不存在的时候,仅有C-末端的羧基能被观察到了进行了反应,以及显示出所述的14个质量单位的变化。
通常,烷基化对羧基进行了标记,以形成带有直链、分支或叔烷基的酯,所述基团如下述结构式所示CH3(-CH2)n其中,n=0-3,所述的烷基种类可以是甲基、乙基、丙基、正丙基、异丙基、丁基、正丁基、异丁基、仲丁基或叔丁基等种类,其中,甲基是优选的。
烷基化反应向蛋白质酸性侧链的羧基加上了烷基基团,对甲基化而言是加上了14个au。特别地,该反应发生于天冬氨酸、谷氨酸和S-羧甲基化的半胱氨酸。该反应导致了与酸性侧链数目及被选用的烷基种类相关的质量变化,还对所述的MS/MS谱产生了改进。消化或其它片段化可发生于被衍生化以及未被衍生化的多肽上,以定位酸性残基。因此,如上所述,典型地,术语“烷基化”或“甲基化”表示形成羧基的烷基酯或甲基酯,然而,该反应可能并不总是导致酯化,所述的烷基化还可能导致羧基周围电荷分布的改变,这仍然提供了本发明的优点,而不是严格地限于形成烷基酯。
如前所述,本发明还包括用于下列过程的方法对肽进行的衍生化、对经过多次衍生化的肽和锁定质量离子的质量分析、测定经过衍生化的肽的氨基酸序列、序列分析以及其它若干基于使用来自经连续衍生化的肽的数据的特定方法。上述方法中的初始化步骤可以包括为了质量分析来分离和制备待分析物。典型地,该步骤包括获得含有多肽的样品,从样品中分离出所述的多肽(虽然对某些样品而言,该步可以忽略),以及通过纯化、消化或其它方式制备用于衍生化步骤的多肽。然后如上所述,对待分析物进行至少第一次和第二次化学衍生化。如果所述反应不包括竞争,或不妨碍对肽的标记,或不包含待分析物的结构或化学组成,所述步骤可以同时进行。一旦样品/待分析物已制备好,就可以按照上述那样引入锁定质量离子,进行质量分析并获得谱,其中,用MS/MS来测量多肽片段和锁定质量离子,并获得经衍生化的多肽和锁定质量离子的质量/电荷比率数据。该质谱包括将肽片段的质量/电荷比率与氨基酸序列相关联的数据,并可以包括以任何形式存在的下述定性或定量的数据,所述数据可与锁定质量离子测量一起用于判断所述待分析物的信息,包括测定至少部分氨基酸序列。
除原本的序列数据外,所述的谱还可以含有反映关于基础(underlying)肽的非序列信息的数据,包括该肽的化学信息,包括糖基化、水合或其它化学修饰。对第一个待分析物的非序列信息可被用于直接确定关于第一个待分析物的信息,或可被用来与第二个待分析物的序列信息或非序列信息、或从中获得第一个或第二个待分析物的样品的序列信息或非序列信息进行比较。在蛋白质组学分析中,比较两种待分析的肽的形式时,该种类型的数据分析是特别有用的。
所述的特定技术包括测量待分析物的实验或实际质量、测定待分析物的氨基酸序列、引入在系统中被电离的锁定质量分子使得所述锁定质量离子与待分析物一起被引入、测量锁定质量离子的质荷比用作校正或参照值、测量实验或实际质量与基于组成原子的分子量的理论值之间的差异、以及确定对任何多肽种类而言,获得的实验值与理论值或已知的质量数据之间的差异的来源。
质量分析数据或谱可与已知的测序算法一起使用,以产生肽待分析物的氨基酸序列(Taylor and Johnson,Rapid Communications in MassSpectrometry,11,1067-1075m 1997;Chen,et al.,Journal of ComputationalBiology,8(6),571-583,2001;Dancik,et al.,Journal of Computational Biology,6,327-342,1999;Eng,et al.,J.Am.Soc.Spectrom.,5976-989,1994;Mann &Wilm,Anal.Chem.,664390-4399,1994)。上述算法是公知的,并且不考虑质量分析数据的精确度和精确性,其具有一定程度的实用性。由本发明提供的对数据获取和质谱品质的改进增加了每次质量测量的精确度,增加了测序算法的实用性,并增加了可被精确测定的序列长度和序列信息的精确度。本发明的方法包括将可获得的测序算法应用到从对经过连续衍生化的多肽的质量分析获得的序列信息上,以及获得经过独特衍生化的多肽或片段的序列信息。
使用用本发明测定出来的精确的氨基酸序列数据,可仅从对部分氨基酸序列的精确测定和对蛋白质数据库的搜索来进行对部分或全长蛋白质的鉴别。在很多蛋白质组学的研究和基本的生物试验中,关键的测定是对有时存在于生物样品中的待分析物蛋白质的鉴别。典型地,通过对实验测定的氨基酸序列与全长蛋白质数据库中的大量参照氨基酸序列和鉴别出的蛋白质片段进行比对,上述蛋白质组学数据库得以被执行。很容易认识到,序列信息精确度和多肽待分析物中鉴别出来的序列数量的增加,将改进用参照测序对实验测定出的多肽片段进行比较或鉴别的实用性。因此,本发明的一个方面是利用从对本文所述的锁定质量离子和经过衍生化的多肽的质量分析所获得的序列数据来鉴别蛋白质的用途,所述鉴别是通过如下方式实现的向蛋白质数据库提交从MS实验数据测定的氨基酸序列,以鉴别待分析物和/或鉴别作为样品组分的待分析物。
已经表明,连续的(没有缺口的连续序列)五个或更多氨基酸的序列可被用于搜索数据库从而以高度的置信度来鉴别蛋白质(Mann & Wilm,Anal.Chem.,664390-4399,1994)。氨基酸序列的上述长度已被称为关键长度序列标签。更长的氨基酸序列标签可以显著地提高鉴别的精确性,当数据库中的很多蛋白质共享一定量的进化保守序列时,这是非常有用的。更长的氨基酸序列标签还可以增加对没有完全或足够测序的基因组的生物的蛋白质鉴别的置信度。然而,当在序列标签中发现缺口时(例如,用三氨基酸标签加上不定长度的缺口接着是二氨基酸的标签,来代替五个连续氨基酸的标签),蛋白质鉴别就变得非常困难。更多的蛋白质可与更小的序列标签相匹配,而且因为两个小标签的方向性也是未知的,蛋白质鉴别就非常不可靠了。Mann和Wilm已经提出对85%置信度的蛋白质鉴别而言,最小的序列标签应当有至少三个至四个连续的残基,但是明显地,更长的序列标签是有好处的。
如上所述,本发明的技术对蛋白质中的翻译后修饰进行MS/MS分析是特别有用的。上述修饰被广义定义为在信使RNA已翻译成氨基酸序列之后发生的多肽序列或化学上的任何改变。翻译后修饰在蛋白质组学分析和对与疾病相关的临床样品里蛋白质的分析中特别重要。很多类型的翻译后修饰,例如糖基化以及本文中描述的其它修饰,是已知与特定的疾病状态一致的,或者其可以表明在对病人的诊断中有临床上的重要意义的生理条件。在某些情况下,用本发明所述的锁定质量离子和连续衍生化方法来改进多肽片段的质谱的能力,还使通过对多肽待分析物质量的直接测量和与内部和外部参照值的比较来对特定的翻译后修饰进行的检测和鉴别变得可行。在上述情况下,实验性地开展质量分析,以测量多肽片段和锁定质量离子的质量,将所述多肽片段的质量与经过或未经过翻译后修饰的所述多肽片段的期待质量进行比较。例如,加入水分子,作为对多肽片段的翻译后水合,将增加18的质量,即加入的水分子的质量。当对多肽片段的质量分析产生了与天然多肽相差18个单位的数字时,就鉴别出了翻译后修饰。可对所有类型的翻译后修饰进行类似的分析,所述翻译后修饰中可制造出天然多肽较之被修饰的多肽在质量测量上的差异,并且参照质量的数字是已知的。
类似地,这对于对给定的经历过翻译后修饰的肽序列中的特定残基进行的鉴别也有着相当重要的意义。例如,在拥有超过一个潜在修饰位点的肽中。其中一个例子是具有两个潜在的磷酸化位点的肽序列。为了鉴别出独特的修饰位点,通过MS/MS片段化进行的从头序列分析可以区分两个潜在的修饰位点,因为MS/MS片段化图案应当显示出漂移了磷酰基团的额外质量(80amu)的恰当质量的y-离子,所述额外质量被添加到连接有磷酰基团的氨基酸残基的质量上。因此,除任何附属修饰的质量之外,MS/MS谱信息包括锁定质量离子、取决于氨基芳基质量的漂移。以下是明显的与已知氨基酸质量不一致的相邻的y-离子之间的质量漂移可作为修饰(包括已知的和有待被了解的翻译后修饰)存在情况的判据。
当质量分析中的任何差异都可被归因于疾病或有临床意义的任何生理条件时,类似的能力是存在的。例如,当蛋白质突变已知是针对特定疾病状态的,并且当该突变是已知的及能导致与天然多肽或代表正常或非疾病状态的多肽的质量差异,通过比较病人样品中多肽待分析物的质量与天然或非疾病状态的已知质量,就可以从质量分析来做出临床诊断。对此种应用而言,仅需要对本发明的方法加以调整,以包括如下步骤在上述连续衍生化之前将所述的多肽待分析物从病人样品中分离出来。此外,对质量数据或谱的数据处理包括如下步骤确定至少一个包含有病人样品的一部分的多肽片段的质量,将该结果与非疾病状态的已知质量相比较。对病人样品和正常样品的比较能显示出疾病状态是否存在。因为本发明的连续衍生化增强了串联MS/MS以高通量模式进行从头肽测序的能力,本发明还增加了用MS/MS技术来进行用于对多肽序列的任何检测的大规模筛选和临床诊断的实用性。
本领域的技术人员明显知道,本发明增加的对多肽测序的实用性还可以转化为增加的使用多核苷酸数据库进行基因组分析的实用性。任何时候,只要多肽序列已知,就可以确定出理论多核苷酸序列,可以在已知的数据库中针对与已知序列的相似性进行搜索,即,通过BLAST或其它已知的技术。在本发明方法的范畴内,在开展基因组分析中对多核苷酸序列进行确定的实用性增加,仅仅需要从对锁定质量离子和经过衍生化的多肽的质量分析进行到对多肽序列的测定,通过已知技术对理论的多核苷酸序列进行确定,以及使用现有的多核苷酸数据库来使多肽待分析物的序列与编码所述多肽片段或含有所述片段的全长多肽的基础多核苷酸序列关联起来。
如上述关于蛋白质组学研究的例子所述,在蛋白质样品中检测改变(例如突变或翻译后修饰)的能力可与编码所述蛋白质的基础多核苷酸序列联合起来,以进行基于所述经过衍生化的多肽序列的基因组学研究。在蛋白质组学应用中,来自实验获得的多核苷酸序列的数据可被用以分析实验确定的多核苷酸序列和参照序列之间的差异,所述差异可被鉴别出,并与疾病或其它生理条件相关联。在每种此类应用中,本发明提供的基本的优点是对经过连续衍生化的多肽的质量分析产生的谱或质量数据与参照值之间的比较,所述参照值或者是关于已知多肽的质量的,或者是关于已知多肽的序列的。因此,对本发明产生的数据的比较可以包含校正或内部或外部参照的测量,对实验获得的质量数据与含有参照质量数据的数据库之间的比较,或者对实验获得的序列数据与含有参照序列数据的数据库之间的比较,或者是上述二者的组合。
实施例八个蛋白质,β-酪蛋白(牛奶)、肌红蛋白(马心脏)、细胞色素c(牛心脏)、β-晶状体球蛋白(牛眼晶状体)、钙调蛋白(牛脑)、人血清蛋白、丙酮酸激酶(兔肌肉)和人转铁蛋白被单独溶解于含有8M尿素、100mM NH4HCO3、pH为8.5、终浓度为大约2mg/ml的缓冲液中。每种蛋白质取大约200μg,先用三(2-羧乙基)-盐酸磷化氢在37℃进行30分钟的还原,再在室温用碘代乙酰胺与其进行30分钟的反应。得到的蛋白质溶液被稀释四倍,至最终的尿素浓度为2M,以40∶1加入胰蛋白酶,在37℃培养过夜。通过加入少量乙酸来终止消化反应。细胞色素c和转铁蛋白按照上面描述的那样被还原和烷基化。不经稀释就将Lys-C以100∶1加入到蛋白质溶液中,并在37℃培养过夜,再用乙酸来终止反应。
为了用咪唑来修饰肽羧基末端的赖氨酸,将30μl(-10μg)蛋白质的胰蛋白酶消化产物与20μl 1M的咪唑贮藏液(例如,终浓度为400mM的2-甲氧基-4,5-二氢-1-H-咪唑,终浓度为400mM)混合。在60℃对该反应混合物进行3小时的培养,用5μl的冰醋酸来终止反应。在C18旋转柱(Pierce)上对肽进行纯化,分为两半并冻干。其中一半被溶于50∶50v/v的甲醇水中,用MALDI-MS/MS加以分析。为衍生化羧酸酯基团,将另一半溶于100μl作为烷基化试剂的2M甲醇HCl中,在室温培养2小时(Ficarro et al.,Nature Biotechnology,2002,20301-305)。通过冻干来终止该反应。被冻干的肽混合物被重新溶解于50∶50v/v的甲醇∶水中,用MALDI-MS/MS加以分析。用此方法对八种不同的蛋白质分别进行试验。如本领域的技术人员所知,为增加单个蛋白质的蛋白质序列覆盖度,或为了分析更为复杂的蛋白质混合物,例如蛋白质复合物,或者甚至是细胞的全部溶解产物,还可通过单独的或多维的分离技术(例如液相色谱)来对经过衍生化的肽进行分离,然后用合适的质谱方法对其进行分析,例如通过MALDI-MS/MS或在线的电喷雾电离化MS/MS。来自细胞色素、丙酮酸激酶和β-晶状体球蛋白的有代表性的MS/MS谱被展示出来。
与相应的未经过衍生化的肽(图1、2、3和4的A图)相比,经连续衍生化的肽(图1、2、3和4的B图)在谱的品质方面取得的改进是很显著的,从上述的谱中可以容易地确定肽的序列。在所有情况下,较之未经过衍生化的肽,对经过羧酸酯衍生化的肽进行肽片段化需要更高的碰撞能量,这代表着经过稳定化的肽键。通过破坏酸性残基的羧酸酯侧链产生的y离子不再占据优势地位,例如图2中A部分的y2离子所示。并且,通常地,y1离子及其片段不再是MS/MS谱中的优势特征了。这两项改进使得更高质量的y离子能被检测到。总体而言,经过羧酸酯衍生化的肽在MS/MS谱上产生了具有更加完全的y-离子系列和均匀分布的峰强度的片段,这是从头测序中所期待的特征。
参考图1A和图1B,图1A是从对肽(SEQ ID No1)进行的MALDI/Q-TOF MS分析中获得的MS/MS数据,所述的肽已用Peters et al(WO 03/056299)描述的技术在赖氨酸残基处进行了衍生化。如图1A所示,某些特征在对被测序的氨基酸进行直接译码时可能存在问题。所述y离子及其片段,即215.1、170.1和152.1a.m.u.在所述的谱中占据优势地位,并抑制了其它的y离子,特别是具有较高质量的那些。对系列中其它y离子的抑制增加了对肽中氨基末端残基错误鉴别的可能性。与之相比,图1B展示了已经过实质性改进的y-离子强度分布和经过改进的鉴别组成序列的能力。
对下述多肽的分析可能导致另外的问题,所述多肽中联系羧基末端和酸性残基(例如谷氨酸和天冬氨酸)的肽键,在某些序列情况下易于被破坏,导致MS/MS谱仅有少数占据优势的峰,不足以确定所述肽的全长序列。这可能导致对所述肽中残基的鉴别被遗漏。图2A中显示的对肽(SEQ ID No2)的分析产生的MS/MS谱的数据示例性地说明了这一情况。图2B显示了对多肽片段进行甲基化之后谱的品质的改进。
参考图3A,从其中羧基末端的赖氨酸和氨基末端的甘氨酸都被用咪唑衍生化了的肽(SEQ ID No1)中获得的MS/MS谱显示虽然在肽的氨基末端的一级胺通常不与咪唑试剂反应,但是当肽的氨基末端的氨基酸是甘氨酸时,N末端就会以较慢的速率被衍生化。由于y-离子系列不完全以及y、a、b和一些c离子的存在,来自此类双标记肽的MS/MS谱难于从头被解读。当根据本发明对同样的肽进行连续标记后,y-离子系列变成了所述谱中占据优势的特征,从头解读变得更为容易更为精确,如图3B所示。
参考图4,从具有内部精氨酸的肽(SEQ ID No3)获得的MS/MS谱。Lys-C通常被用于消化蛋白质,以增加羧基末端赖氨酸残基的出现,这增加了将实验确定的序列用于蛋白质鉴别的能力。然而,内部的精氨酸残基使得所述的MS/MS谱难于被解读,即使是在咪唑衍生化之后,如图4A所示。图4B显示了有所改进的MS/MS谱,其来自对同样的肽的酸性残基的羧基进行的烷基化,其显示了直到内部精氨酸的氨基酸残基系列,因此允许对长序列标签的测定。
本发明包括含有用于进行上述衍生化的试剂和说明书的工具包。对每个工具包而言,所述试剂包括但不限于烷基化试剂、特异性甲基化的试剂例如甲醇氯化氢、经活化的咪唑化合物例如2-甲氧基-4,5-二氢-1-H-咪唑、缓冲液、溶剂和容器。锁定质量离子可以是满足下述条件的任何化学物质,所述化学物质在减压和/或高温条件下可挥发,当暴露于光子或电离化试剂气体(例如丙酮)时具有化学稳定性及可被电离。例如,具有高达5000Da分子量的有机化学物质,例如,氟化膦嗪、聚乙二醇、烷基胺或氟化羧酸可以使用。上述化学物质以举例的方式列出,任何数量的其它同样合适的化学物质也可用于本发明。例如,被共同转让给Flanagan的美国专利No.5,872,357(通过全文引用被包括进本文中)中,描述了可被使用于本发明方法中、以避免污染和电荷竞争的其它合适的锁定质量材料。当使用有机化学物质时,减少分析期间碳同位素C13的作用是有利的,以预防不精确性。典型的用于锁定质量的有机化学物质具有7.5至12eV的电离势,大多数具有低于10eV的电离势,使得上述化学物质特别适用于通过具有此类水平的光子能的紫外照射来进行电离化。所述工具包还可以包括反应管、混合管和显示化学反应完成程度的指示剂。该工具包包括书面的说明书,以开展如上所述的衍生化反应以及如下所述引入锁定质量离子,其还可以包括用于分析从本发明的实践中获得的质量数据或质量谱的说明书。该工具包还包括用于在质谱分析之前色谱清除反应产物的固相设备。
所述数据分析系统包括用于对质量分析数据进行分析及报告的计算机或数据处理器,显示质谱的显示单元(例如视频监视器)和/或打印机。对序列分析而言,所述计算机/数据处理器包括用于开展序列计算和显示或打印氨基酸序列的软件。可用相同的或单独的计算机/数据处理器来提交序列数据,来进行数据库分析、蛋白质鉴别或上述的蛋白质组学或基因组学分析。
下述内部质量校正系统的目的是对最后的质量分析仪场所提供锁定质量,其可被用于修正(校正)所述质量分析仪的质荷比的比例尺。在不同类型的质量分析仪中,使用不同的比例尺。例如,当使用四极分析仪时,对应用的四极电压和质荷比之间的转换进行校正。在飞行时间质量分析仪中,对离子漂移时间和质荷比之间的转换进行校正。鉴于多种因素例如温度、电压波动、压力和腔的长度会影响到校正,而且其影响难于被计算及预测,使用参照锁定质量是确保通过质谱分析仪检测和计算得到的质荷比的精确度的有用手段。
图6显示了包括本发明的示例性的质谱分析仪系统。用于分析经过多次衍生化的多肽样品的质量分析仪系统1包括离子源10和质量分析仪5。离子源10被用于对经过衍生化的多肽待分析物分子进行电离,以及将得到的离子导向质量分析仪接口20。可用于本发明的不同类型的离子源包括电喷雾、大气压化学电离化、大气压光电离化、基质辅助激光解吸附电离化和大气压基质辅助激光解吸附电离化的源,以及其它已知的类型。所述的离子源可以实质上处于大气压下,但是低于或高于大气压的压力下的源也被认为是在本发明用途的范围之内的。
为确保足够数量的经衍生化多肽待分析物离子通过接口20进入到质谱分析仪5中,所述的源10和接口可被保持有电势差,将所述的待分析物离子推动到孔21中。也可能存在其它结构或者电极(未示出),它们具有电势差以帮助将待分析物离子推动到孔21中。气流也可被用于帮助将离子推动到孔21中。图6中,接口20被显示为从质谱仪5向着离子源延伸出去的毛细管,但其可以仅仅是一个孔。接口中的孔21可以典型地在200-1000 4m直径的范围内,但是更大或更小的直径是可用的。其它未显示出来的设备可被包括进质谱分析仪5或接口20,以进一步地协助待分析物离子的解溶剂化。此类设备可以包括加热的毛细管,其导致了质谱分析仪中转运待分析物离子期间溶剂的蒸发;和/或加热的气体逆流,其在待分析物离子通过接口20进入质谱分析仪之前干燥所述的待分析物离子。以这种方式,与所述溶剂相关的经电离的待分析物以高浓度进入质谱分析仪5。
待分析物离子通过接口20,被吸引至质谱分析仪5的第一真空场所30,其典型地处于大约0.5-5托的压力下。在第一真空场所30中,待分析物离子通常会经历自由射流胀大(free jet expansion)。处于第一真空场所下游末端的撇沫器34中止了所述的射流胀大,待分析物离子经过撇沫器34进入到第二真空场所40,其典型地处于大约0.5-5托。需要注意图6描述的真空场所30、40、50、60是与一个真空泵系统耦合的,这将为本领域技术人员所理解。
当所述待分析物离子进入真空场所30时,所述离子主要被气流、电极(例如撇沫器34)上的电压以及其它可能存在的用以协助离子转运的离子光学元件推动。(此类可能存在于真空场所30中的元件并未在图6中示出)。通过离子光学器件48,对经过撇沫器34到真空腔40的待分析物离子的运动进行进一步地协助。下文中,离子光学器件48应被解释为包括了在接口20和质量分析仪75之间的所有离子光学元件,包括撇沫器34和图6-10中未示出的位于真空场所30的其它元件。
锁定质量离子的源41与离子光学器件48相邻。在上下文中“与……相邻”被定义为包含如下概念中的一个或多个“在……旁边”、“在……附近”、“围绕着……的”、“部分围绕着……的”、“包括……的部分”、“与……相连”以及“与……有功能性的关联”。源41的功能是在离子光学器件48内的区域47制造离子,或者向该区域提供离子。源41的一部分因此可被置于所述质谱仪真空腔的外面。一个例子可以是激光或紫外照射源,其发射的光通过适当的窗口或光学器件被引向区域47。另一个例子是锁定质量气体源,其向系统提供气体,并因此将锁定质量分子引入到所述分子可被电离的区域47中。
在一种实施方式中,如图7所示,从锁定质量源提供的锁定质量分子通过入口43以气相形式被引入到第二真空场所。所述锁定质量可以是满足下述条件的任何化学物质,所述化学物质在减压和/或高温条件下可挥发,当暴露于光子或电离化试剂气体(例如丙酮)时具有化学稳定性及可被电离。例如,具有高达5000Da分子量的有机化学物质,例如,氟化膦嗪、聚乙二醇、烷基胺或氟化羧酸可以使用。上述化学物质以举例的方式给出,任何数量的其它同样合适的化学物质也可用于本发明。例如,被共同转让给Flanagan的美国专利No.5,872,357(通过全文引用被包括进本文中)中,描述了可被使用于本发明方法中、以避免污染和电荷竞争的其它合适的锁定质量材料。当使用有机化学物质时,减少分析期间碳同位素C13的作用是有利的,以预防不精确性。典型的用于锁定质量的有机化学物质具有7.5至12eV的电离势,大多数具有低于10eV的电离势,使得上述化学物质特别适用于通过具有此类水平的光子能的紫外照射来进行电离化。
在离子光学器件48的离子光学通路49中或与其相邻之处,将注入到第二真空场所40中的锁定质量分子流与经过衍生化的多肽待分析物离子混合。在所述离子光学通路49中,所述锁定质量分子通过锁定质量电离源45被电离,所述源45照射单个真空场所中的质谱分析仪轴向上的短跨度(或者,电离化区域47)。所述电离化区域47被限制为轴向上的短跨度,以确保锁定质量离子与待分析物离子具有大约相同的碰撞条件,并在基本恒定的压力下被产生出来。电离源45与中心轴的径向距离取决于其提供的辐射强度,但是,一般而言,所述电离源被置于紧接电离化区域47的地方,以对该区域施加最大的照射。电离源45(和电离化区域47)可位于第二真空场所40之中,或者其可位于某下游真空场所例如50、60之中。(关于电离源45碰撞条件和定位的标准在下文中会被讨论)。根据一种实施方式,电离源45是真空紫外(VUV)源,例如,等离子灯。产生10至10.6eV范围内的光子的氪等离子灯,是特别适合锁定质量电离势的有关范围的。或者,可以使用激光电离化技术,例如共振-增强多光子电离化(resonance-enhanced multiphoton ionization,REMPI)。在每一种情况下,109光子/cm2/s范围内的光子流量可以产生精确检测所需要的足够的离子流。电离源45从外部能量源46接收电能。所述电离源通过从锁定质量分子移除电子来产生正的锁定质量离子。电离化的其它手段,例如电子碰撞是本领域已知的,也可被使用。或者,可以使用通过电或热的手段来产生负的锁定质量离子的电离源。
根据使用光电离源的一种实施方式,锁定质量电离源45被置于第二真空场所40之中,其位置使得从所述源发射的光子可与离子光学通路49中的锁定质量分子交叉。为使曝光(exposure)最大化,将锁定质量气体以相对于离子向导48的中心轴成直角的方向引入,并以相对于上述两个方向都成直角的方向来引导电离源的最大强度是有利的。因为能量高于7.5eV的光子在第二真空场所中的压力下容易被分散,和/或被背景气体成分吸收,所以将所述电离源45定位于紧靠着离子光学器件是有好处的,例如,在100mm范围内。然而,电离源45也可被置于真空系统外面。在那种情况下,所述电离化辐射通过合适的光学器件被转移到电离化区域47中。
图8展示了根据本发明的质谱分析仪系统的一种实施方式,其中,同心(concentric)VUV灯被用作为所述的电离源。图8中,同心VUV灯与离子光学器件48的一部分同轴,或围绕着该部分。如前述实施方式所述,VUV灯44的轴长度被限制为短跨度,以限定相应的电离化区域。
经衍生化的多肽待分析物离子和锁定质量离子被引导到下游,这是沿着由离子光学器件48界定出的离子光学通路49进行的。所述光学器件可以包括对经过通路49的离子施加静电和/或RF和/或磁场的电极和电路。典型的合适的光学器件包括多极离子向导,例如八极或六极离子向导。多极向导可与本领域内已知的多种手段组合使用,以产生沿着离子光学通路49的同轴电场。合适的向导包括,例如,离子漏斗,例如,美国专利No.6,107,628中描述的那些。
离子光学器件48执行至少三种功能首先,离子光学器件在离子源和质量分析仪之间以通常为轴向的方向移动离子,并防止离子的径向损失。通常垂直于离子光学通路49的轴的场用于将离子限制在所述轴旁的区域,而轴向电场(通常结合气体运动)用于使离子从离子源移动到质量分析仪中;第二,在真空场所,离子光学器件协助去除伴随离子的气体以及将离子源中大约是大气压的压力降低至质量分析仪中的大约10-5托或更低。所述光学器件或向导的作用允许在所述离子被约迫沿着光学通路移动的时候,所述气体逃逸至真空腔中并被泵抽走。典型地,为降低总压力需要多个真空腔。所述离子光学器件和/或离子向导协助离子在腔间的转移。腔的确切数目可以变动,其对本发明来说并不重要;第三,所述离子光学器件或向导在转移期间对离子进行冷却及聚焦。在通常的质谱分析实践中,离子与离子向导中背景气体的碰撞导致沿着向导轴向的离子在径向和轴向的冷却和聚焦。(聚焦在上下文中指减少光束的径向范围)。发生该作用的区域的背景气体压力典型地是毫托或更高。美国专利No.4,963,736中描述了通过碰撞进行的离子冷却。
对于大多数类型的质量分析仪而言,冷却和聚焦对获得高分辨率和灵敏度来说是令人期待的,对于飞行时间质量分析仪来说尤其重要。充分的离子运动调节对TOF分析仪的良好的分辨率来说是必要的,其可以通过在将离子引入分析仪之前对离子碰撞冷却和聚焦来获得,这通常与用合适的孔对离子光束进行的“剪切”(“slicing”,降低横向尺寸和发散度)组合使用。单独使用离子光学器件(而没有剪切),通过降低离子发散的速度,尤其是在相对于轴的横向方向上的速度,来进行的冷却是无法实现的,这是Liouville定理相空间中颗粒密度守恒的结果。
用三条坐标轴x、y、z和相应的动量分量px、py、pz来描述离子颗粒的运动。一种此类对运动的描述是代表颗粒的点在坐标轴和动量分量的六维空间中的轨道。该空间被称为颗粒的相空间。用n个此类颗粒的系统,该系统的运动是相空间中颗粒的代表点所采取的一系列轨道(假设所述颗粒之间不发生相互作用)。Liouville定理指出“在可从哈密尔敦函数获得的力的作用下,一组颗粒的运动是使得适当的相空间中代表点的局部密度在所有地方保持一致的。”由处于离子束外部的宏观电磁场对离子施加的力落入了该类别中。在描述质谱分析仪系统中离子运动时,通常选用使得x、y、z运动互相独立的坐标轴。这样每个相空间的平面(x,p,)、(y,p,)和(z,p,)可被独立考虑。对这种通常的情况而言,Liouville定理意味着随着离子运动的进行,被所述离子的代表点占据的上述平面中的每个的区域可改变形状,但不可改变面积。上述面积的大小只可被非保守力的作用(例如,碰撞)或被将离子移出光束(例如,剪切)所改变。
下文中,“离子的相空间”应被解释为表示“被离子的代表点占据的相空间平面的区域”。本发明的说明书中提到的特定的相空间平面是与垂直于离子向导或离子光学器件的纵向轴的坐标轴相关的相空间平面。此类垂直的轴也被称为“横向(轴)”。
如果锁定质量离子不以与待分析物离子相同的方式被冷却和聚焦(即,它们与所述轴横向的各自的相空间不一致),所述仪器的质量分辨率可能在所述的两种物质间产生差异。在一些情况下,可能得到错误的质量校正。因此,令锁定质量离子经历与经衍生化的多肽待分析物离子实质上相同的冷却和聚焦是很重要的。这伴随着在显著的冷却和聚焦发生之前,即在离子到达适于冷却的压力(名义上为大约5毫托或更高)之前,在离子向导中产生锁定质量离子。因此,在离子光学器件48的特定实施方式中,对锁定质量分子电离化的最优位置易于被本领域技术人员所确定。
因此,为了在图6的实施例系统中以类似方式调节锁定质量离子和经衍生化的多肽待分析物离子,将锁定质量和待分析物离子引导着经过同样的离子光学通路49。它们因此被经历近乎同样的背景气体碰撞历史。在该实施例中,很多碰撞冷却发生于第三真空场所50前,所述场所50保持于大约5毫托或更低一点的压力下。为协助冷却,第三真空场所50可以比其它场所更长,以加长离子光学通路49并因此增加离子和气体分子间碰撞的可能性。
经衍生化的待分析物和锁定质量离子从第三真空场所50进入第四高真空场所60,其中压力降低至小于大约10-4托,或者在某些应用中小于大约10-5托。到含有质量分析仪75的真空腔70的接口65被置于第四真空场所的下游末端。任何类型的质量分析仪都可以使用;例子包括离子阱、四极质量过滤器、扇形磁场、TOF和傅立叶变换离子回旋共振(FTICR)分析仪。对质量分析仪附近或之中的压力的实际选择将取决于所用质量分析仪的种类,其将在大于10-4托(在用离子阱分析仪的情况下)至小于10-5托(对FTICR分析仪而言)之间的范围内变动,中间的值是对四极质量过滤器和TOF分析仪的情况而言的。如果使用TOF分析仪,接口65可以包含用于在离子进入垂直加速腔之前限制其光束横向范围的剪切器。经衍生化的多肽待分析物和锁定质量离子可被选择,并接着用质量分析仪75中的离子检测器对其进行检测。
图9图示了串联质谱分析仪系统200的一种实施方式,其提供了锁定质量校正和对经衍生化的多肽待分析物的测量。如图所示,经衍生化的多肽待分析物离子源202将待分析物离子通过孔204引入到真空接口腔205种,所述的孔204处于纵向毛细管206上。待分析物离子流经接口腔205和撇沫器208,进入到真空腔209的第一质量分析仪215中。可选地,离子光学器件210被包括,用于对进入质量分析仪215的待分析物离子进行聚焦和加速。在期待质量范围内的待分析物离子被选择出来并经过所述的质量分析仪,余下的离子被滤掉。经过第一质量分析仪215的选出的待分析物离子然后在被加速到适于碰撞离解(dissociation)的动能之后再进入真空腔218中的碰撞室220。在所述碰撞室220中,至少一部分“父代”待分析物离子(通常是长的多肽或蛋白质),通过与气体的碰撞被片段化成“子代”离子,所述气体可以是从碰撞气源230提供并保持于适当压力下的惰性气体,例如氮。如本领域所已知,所述碰撞气体压力及碰撞室220的长度被选择,来产生足够的离解碰撞,以产生需要量的子代离子。所述子代离子(通常是较短的多肽片段)然后通过气流或通过离子光学器件(未示出)被转移到真空腔232的第二质量分析仪240中。在一些实施方式中,可以用碰撞室220的DC电场来协助对子代离子的转移。锁定质量离子可在碰撞室220中产生,或从与碰撞室220相邻(此处的“相邻”按上文所述来理解)的锁定质量离子源241被引入到碰撞室220。在一些实施方式中,所述锁定质量离子源241可以包含用于向碰撞室220提供锁定质量分子的锁定质量源225,和用于在碰撞室220中电离化锁定质量分子的锁定质量电离源235。所述锁定质量源225,例如,可以是气体源。所述锁定质量电离源235例如可以是紫外辐射源或激光。所述锁定质量离子与待分析物子代离子再次被一起转移至第二质量分析仪240中,所述转移是通过气流、碰撞室220中的DC电场、离子光学器件(未示出)或其组合来进行的。所述离子进入第二质量分析仪240,其选择锁定质量离子和待分析物子代离子通过,使它们进入到检测器245中。随后可以在数据获取及处理单元250中进行数据分析,所述单元250与所述检测器245相连或被包括在其中。
分析仪215和240可以是任何类型的质量分析仪或质量过滤器。一种示例性的实施方式包括了215处的四极质量过滤器和240处的飞行时间质量分析仪。在一些实施方式中,第一分析仪215和碰撞室220可以被组合成具有上述两项功能(质量选择和离子片段化)的单个设备。例子包括四极离子阱和线性离子阱。该类型的一种示例性实施方式可以包括在215处的离子阱和在240处的飞行时间质量分析仪,其间有可选的光束调节离子光学器件。这样单独的碰撞室将不是必需的。单独真空腔的实际数目将随通常,锁定质量分子可被引入到碰撞室220的任何地方,其可在沿着所述的室的纵向轴上的任何或所有位置被电离。因为锁定质量离子将具有原本的热初始动能,它们将不会经历碰撞离解。对其中在碰撞室220中的场(DC、AC或RF)被用于对待分析物离子进行离解的实施方式而言,在所述室的下游末端处或附近对锁定质量分子进行电离化是有好处的,其使得锁定质量离子离开所述的室之前没有较大部分离子被离解。在其中光束调节离子光学器件被置于碰撞室220下游,所述的室和第二质量分析仪之间的实施方式中,锁定质量离子可产生于所述光学器件中,而不是碰撞室中。此类实施方式中的一种在图10中被图示出来。用于光束调节的离子光学器件222被置于碰撞室220和第二质量分析仪240之间。锁定质量离子被产生于离子光学器件222,或从与离子光学器件222相邻的(采用上文中的理解)锁定质量离子源241引入离子光学器件222。在一些实施方式中,所述的锁定质量离子源241可以包含用于向离子光学器件222提供锁定质量分子的锁定质量源225,和用于在离子光学器件222中电离化锁定质量分子的锁定质量电离源235。所述锁定质量源225,例如,可以是气体源。所述锁定质量电离源235例如可以是紫外辐射源或激光。所述锁定质量离子与待分析物子代离子再次被一起转移至第二质量分析仪240中,所述转移是通过气流、DC电场、离子光学器件222或其组合来进行的。接着,按照上述那样来进行对所述离子的质量分析。在一些实施方式中,第一质量分析仪215和碰撞室220可以被组合成单件设备,例如如上所述的离子阱。权利要求中术语“碰撞室”的范围包括在另外的设备或装置中开展碰撞室功能(例如离子片段化)的实施方式。
已结合上述若干质谱分析仪系统提到了通过内部引入锁定质量来校正质谱分析仪系统的不同方法。根据第一种方法,锁定质量分子被引入质谱分析仪系统源后的真空场所,再在待分析物离子下游通路中或附近被电离,使得待分析物离子和锁定质量离子随后都经过同样的下游通路并一起被检测和分析。在第二种方法中,为对串联质谱分析仪进行校正,锁定质量分子被引入,并在待分析物子代离子的通路中被电离。所述锁定质量离子然后与待分析物子代离子一起被引导转移,以便检测和分析。
上述示例性方法中的内部引入锁定质量的使用优于向离子源的引入。虽然存在可能,但是待分析物样品和锁定质量溶液之间的转换不是必需的,在引入待分析物和锁定质量样品之间也不要求清洗的时间,因为所述锁定质量物质不会污染离子源或其与质谱分析仪的接口。样品分析的通量和速度因此相应增加。所有类型的离子源都可以使用,而没有受到锁定质量电离化需求或污染问题的限制。所述锁定质量分子不与经衍生化的多肽待分析物反应,也不会为了电离化而竞争。
只要不与本公开矛盾,本说明书中引用的所有文献和专利申请文件都以参考文献的方式被包括进本文中,就像每件单独的文献或专利申请文件被特别且单独地指出以参考文献的方式被包括进来一样。本说明书还全文引用了2004年7月16日递交的美国专利申请10/892,870。
虽然为了清楚理解的目的,前述的发明某些细节是通过详细阐述和实施例的方式来描述的,但是根据本发明的教导,可在不超过所附的权利要求的精神或范围的情况下,做出某些改变和修改,这对本领域技术人员来说是很明显的。
序列表<110>安捷伦科技有限公司蒂莫西·H·乔伊斯巴里·E·博伊斯戈登·R·尼古拉刘宏斌<120>用于衍生多肽的串联质谱从头测序的锁定质量离子<130>10040405KTM7374<140>还未转让<141>2004-07-16<160>3<170>Patentln version 3.2<210>1<211>8<212>PRT<213>牛<220>
<221>MISC_FEATURE<223>来自β-晶状体球蛋白(牛眼晶状体)的肽<400>1Gly Leu Gln Tyr Leu Leu Glu Lys1 5<210>2<211>11<212>PRT<213>兔<220>
<221>MISC_FEATURE<223>来自丙酮酸激酶(兔肌肉)的肽<400>2Cys Asp Glu Asn Ile Leu Trp Leu Asp Tyr Lys1 5 10<210>3<211>11<212>PRT<213>牛<220>
<221>MISC_FEATURE<223>来自细胞色素c(牛心脏)的肽<400>3Gly Glu Arg Glu Asp Leu Ile Ala Tyr Leu Lys1 5 10
权利要求
1.一种对多肽进行质量分析的方法,所述方法包括对多肽待分析物进行第一次衍生化;对多肽待分析物进行第二次衍生化;对锁定质量分子和经衍生化的多肽待分析物进行电离化;获得对所述锁定质量分子和所述经衍生化的多肽待分析物的质量分析。
2.如权利要求1所述的方法,还包括在第一次衍生化之前对所述多肽进行消化的步骤。
3.如权利要求1所述的方法,其中,所述的第一次衍生化包括将所述多肽与咪唑反应。
4.如权利要求1所述的方法,其中所述的第二次衍生化包括将所述多肽待分析物与烷基化试剂反应。
5.如权利要求4所述的方法,其中所述的第二次衍生化产生了谷氨酸或天冬氨酸酸性侧链上羧基的烷基衍生物。
6.如权利要求1所述的方法,还包括从质量分析来确定经过连续衍生化的多肽的氨基酸序列。
7.如权利要求3所述的方法,其中所述的将所述多肽与咪唑反应的步骤是与2-甲氧基-4,5-二氢-1H-咪唑进行的。
8.如权利要求4所述的方法,其中所述的第二次衍生化包含对羧基进行甲基化。
9.如权利要求4所述的方法,其中所述的将所述多肽与烷基化试剂反应的步骤产生了羧基的烷基衍生物,所述烷基选自由乙基、丙基、正丙基、异丙基、丁基、正丁基、异丁基、仲丁基和叔丁基以及其组合所构成的组。
10.如权利要求1所述的方法,其中所述的对锁定质量分子和多肽待分析物进行电离化的步骤发生在碰撞室中。
11.如权利要求1所述的方法,其中所述的对锁定质量分子和经过连续衍生化的多肽进行电离化的步骤是用紫外辐射进行的。
12.一种确定多肽待分析物序列的方法,所述方法包括对多肽待分析物进行第一次衍生化,以产生具有经衍生化的赖氨酸的经过衍生化的多肽待分析物;将所述经过衍生化的多肽待分析物与第二试剂反应以产生经过多次衍生化的多肽待分析物;引入锁定质量分子;对所述锁定质量分子和所述经过多次衍生化的多肽进行电离化;以及进行对所述经过多次衍生化的多肽待分析物的质量分析。
13.如权利要求12所述的方法,还包括从所述质量分析来确定所述经过多次衍生化的多肽待分析物的氨基酸序列的步骤。
14.如权利要求13所述的方法,还包括将所述氨基酸序列与参照序列相比较。
15.如权利要求14所述的方法,还包括测定所述氨基酸序列的质量与所述参照序列质量之间的差异。
16.如权利要求15所述的方法,还包括将所述比较与翻译后修饰关联起来。
17.如权利要求12所述的方法,还包括在所述第一次衍生化之前对所述多肽待分析物进行消化的步骤。
18.如权利要求12所述的方法,其中,所述对锁定质量分子和经过多次衍生化的多肽进行电离化的步骤发生于碰撞室中。
19.如权利要求12所述的方法,其中,所述对锁定质量分子和经过多次衍生化的多肽进行电离化的步骤使用紫外辐射。
20.一种对多肽进行质量分析的方法,所述方法包括对锁定质量分子和经衍生化的多肽进行电离化,所述多肽包含经咪唑衍生化的赖氨酸基团和经烷基化的羧基;以及获得对所述锁定质量分子和所述经衍生化的多肽的质量分析。
全文摘要
本发明公开了通过化学反应对用于质谱分析的待分析物进行的多次衍生化。所述衍生化增强了MS技术对于分析蛋白质样品的用途,特别是通过串联MS/MS来确定多肽的序列时。本发明中描述了用于对多肽进行测序以及在蛋白质分析中使用测序数据的精确质量分析技术。本发明还提供了用于对质谱分析仪进行校正的装置和方法,所述校正是通过在所述质谱分析仪的源后场所内部引入校正质量来实现的。在质量分析之前将锁定质量离子与经衍生化的多肽待分析物离子混合。
文档编号C07K1/00GK1766636SQ200510084518
公开日2006年5月3日 申请日期2005年7月18日 优先权日2004年7月16日
发明者蒂莫西·H·乔伊斯, 巴里·E·博伊斯, 戈登·R·尼古拉, 刘宏斌 申请人:安捷伦科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1