转基因蛋白的定量分析的制作方法

文档序号:12286957阅读:526来源:国知局
转基因蛋白的定量分析的制作方法与工艺

随着重组DNA技术越来越多地被用于产生商业和工业用途的转基因植物,这对开发分析转基因植物系的高通量方法产生了需要。这样的分析方法对于性状发现研究、产品开发、种子生产和商业化是必需的,并且有助于具有期望的或最佳的表型的转基因植物的快速开发。而且,目前用于人类消费的GM植物的安全性评估的建议指南要求在亲本和转化作物之间在DNA和蛋白质水平上进行表征。开发的新植物品种包括日益复杂的遗传修饰,尤其是包括叠加的基因和性状。

当前用于分析本领域优选的转基因植物的方法包括基于DNA的技术(例如PCR和/或RT-PCR);使用报告基因;Southern印迹;和免疫化学。所有这些方法都受限于各种缺点。

尽管之前已经公开了质谱,但现有方法由于缺乏有选择性且灵敏的定量而受到限制。对用于植物中转基因表达产物的定量的选择性且灵敏的高通量方法仍然存在需要。

发明概述

本发明涉及使用质谱法对来自植物的复杂蛋白样品进行定量多路分析的方法。在一些实施方案中,本公开涉及维持转基因植物品种的方法,通过(例如)分析转基因植物品种的多个世代而选择性且灵敏地定量多重化的(multiplexed)转基因蛋白。

在一个方面,提供了对基于植物的样品中的一种或多种具有已知氨基酸序列的感兴趣蛋白质进行定量的高通量方法。该方法包括:

(a)从基于植物的样品中提取蛋白质;

(b)消化从步骤(a)提取的蛋白质获得肽(peptides);

(c)在单一步骤中分离各肽;

(d)从具有已知氨基酸序列的感兴趣蛋白质中确定多个特征肽;

(e)使用高分辨率精确质谱法(HRAM MS)测量所述多个特征肽;和

(f)基于所述特征肽的测量,定量所述具有已知氨基酸序列的感兴趣蛋白质。

在一个实施方案中,通过柱色谱在单一步骤中分离各肽。在一个另外的实施方案中,柱色谱包括液相柱色谱。在另一个实施方案中,在单一步骤中获得对应于感兴趣蛋白质的各肽的质谱数据。

在一个实施方案中,所述一种或多种感兴趣蛋白质包括两种感兴趣蛋白质。在另一个实施方案中,所述一种或多种感兴趣蛋白质包括三种到二十种感兴趣蛋白质。在另一个实施方案中,所述一种或多种感兴趣蛋白质包括三种到十种感兴趣蛋白质。在另一个实施方案中,所述一种或多种感兴趣蛋白质包括四种感兴趣蛋白质。

在一个实施方案中,所述基于植物的样品来自转基因植物。在一个另外的实施方案中,所述一种或多种感兴趣蛋白质包括在转基因植物中转基因表达的预期产物。在另一个实施方案中,所述一种或多种感兴趣蛋白质包括5'-烯醇丙酮酰-3'-磷酸莽草酸合酶(EPSPS)。在另一个实施方案中,所述一种或多种感兴趣蛋白质包括5-烯醇丙酮酰莽草酸-3-磷酸合酶基因(2mEPSPS)。在另一个实施方案中,所述多个特征肽包含至少一个选自SEQ ID NO:2-25的序列。在另一个实施方案中,所述多个特征肽包含至少两个选自SEQ ID NO:2-25的序列。在另一个实施方案中,所述多个特征肽包含至少三个选自SEQ ID NO:2-25的序列。在另一个实施方案中,所述多个特征肽包含SEQ ID NO:3、12、和21。在另一个实施方案中,所述多个特征肽由SEQ ID NO:3、12、和21组成。

在另一个实施方案中,所述一种或多种感兴趣蛋白质包括芳氧基链烷酸酯双加氧酶(AAD)。在另一个实施方案中,所述一种或多种感兴趣蛋白质包括芳氧基链烷酸酯双加氧酶-12(AAD-12)。在另一个实施方案中,所述多个特征肽包含至少一个选自SEQ ID NO:27-45的序列。在另一个实施方案中,所述多个特征肽包含至少两个选自SEQ ID NO:27-45的序列。在另一个实施方案中,所述多个特征肽包含至少三个选自SEQ ID NO:27-45的序列。在另一个实施方案中,所述多个特征肽包含SEQ ID NO:28、29、和34。在另一个实施方案中,所述多个特征肽由SEQ ID NO:28、29、和34组成。

在另一个实施方案中,所述一种或多种感兴趣蛋白质包括双丙氨膦抗性(bar)基因产物或膦丝菌素N-乙酰转移酶(PAT)。在另一个实施方案中,所述一种或多种感兴趣蛋白质包括膦丝菌素乙酰转移酶(PAT)。在另一个实施方案中,所述多个特征肽包含选自SEQ ID NO:47-60的至少一个序列。在另一个实施方案中,所述多个特征肽包含选自SEQ ID NO:47-60的至少两个序列。在另一个实施方案中,所述多个特征肽包含选自SEQ ID NO:47-60的至少三个序列。在另一个实施方案中,所述多个特征肽包含SEQ ID NO:49、55、和56。在另一个实施方案中,所述多个特征肽由SEQ ID NO:49、55、和56组成。

在一个实施方案中,测量多个特征肽包括计算相应的峰高度或峰面积。在另一个实施方案中,测量多个特征肽包括比较来自高碎裂模式和低碎裂模式的数据。

在另一个方面,提供了对基于植物的样品中一种或多种具有已知氨基酸序列的感兴趣蛋白质进行定量的高通量系统。该系统包括:

用于从基于植物的样品提取蛋白质的高通量手段/装置;

用于在单一步骤中分离肽的分离模块;

用于从具有已知氨基酸序列的感兴趣蛋白质中选择多个特征肽的选择模块;和

用于测量多个特征肽的高分辨率精确质谱(HRAM MS)。

在一个实施方案中,该分离模块包括包括液相柱色谱。在另一个实施方案中,柱色谱包括液相柱色谱。在另一个实施方案中,高分辨率精确质谱(HRAM MS)包括串联质谱仪。在另一个实施方案中,高分辨率精确质谱(HRAM MS)不包括串联质谱仪。

在一个实施方案中,所述基于植物的样品来自转基因植物。在一个另外的实施方案中,所述一种或多种感兴趣蛋白质包括在转基因植物中转基因表达的预期产物。在另一个实施方案中,所述一种或多种感兴趣蛋白质包括5'-烯醇丙酮酰-3'-磷酸莽草酸合酶(EPSPS)。在另一个实施方案中,所述一种或多种感兴趣蛋白质包括5-烯醇丙酮酰莽草酸-3-磷酸合酶基因(2mEPSPS)。在另一个实施方案中,所述多个特征肽包含至少一个选自SEQ ID NO:2-25的序列。在另一个实施方案中,所述多个特征肽包含至少两个选自SEQ ID NO:2-25的序列。在另一个实施方案中,所述多个特征肽包含至少三个选自SEQ ID NO:2-25的序列。在另一个实施方案中,所述多个特征肽包含SEQ ID NO:3、12、和21。在另一个实施方案中,所述多个特征肽由SEQ ID NO:3、12、和21组成。

在另一个实施方案中,所述一种或多种感兴趣蛋白质包括芳氧基链烷酸酯双加氧酶(AAD)。在另一个实施方案中,所述一种或多种感兴趣蛋白质包括芳氧基链烷酸酯双加氧酶-12(AAD-12)。在另一个实施方案中,所述多个特征肽包含至少一个选自SEQ ID NO:27-45的序列。在另一个实施方案中,所述多个特征肽包含至少两个选自SEQ ID NO:27-45的序列。在另一个实施方案中,所述多个特征肽至少三个包含选自SEQ ID NO:27-45的序列。在另一个实施方案中,所述多个特征肽包含SEQ ID NO:28、29、和34。在另一个实施方案中,所述多个特征肽由SEQ ID NO:28、29、和34组成。

在另一个实施方案中,所述一种或多种感兴趣蛋白质包括双丙氨膦抗性(bar)基因产物或膦丝菌素N-乙酰转移酶(PAT)。在另一个实施方案中,所述一种或多种感兴趣蛋白质包括膦丝菌素乙酰转移酶(PAT)。在另一个实施方案中,所述多个特征肽包含至少一个选自SEQ ID NO:47-60的序列。在另一个实施方案中,所述多个特征肽包含至少两个选自SEQ ID NO:47-60的序列。在另一个实施方案中,所述多个特征肽包含至少三个选自SEQ ID NO:47-60的序列。在另一个实施方案中,所述多个特征肽包含SEQ ID NO:49、55、和56。在另一个实施方案中,所述多个特征肽由SEQ ID NO:49、55、和56组成。

在另一个方面,提供了对基于植物的样品中一种或多种具有已知氨基酸序列的感兴趣蛋白质进行定量的高通量方法。该方法包括使用本文中提供的系统。

附图简述

图1显示本文中公开的方法和系统的代表性分析工作流程。

图2显示另一个来自HRAM LC-MS的标准色谱图500ng/mL合成肽的代表性数据:总离子电流(上数第一图);合并的提取离子(上数第二图);提取离子367.2082m/z–EISGTVK(2+)(上数第三图或中间图);提取离子367.1850m/z-DVASWR(2+)(倒数第二图);和提取离子484.7798m/z-VNGIGGLPGGK(2+)(倒数第一图)。所有离子的提取窗口为2.0ppm。

图3显示来自HRAM LC-MS的胰蛋白酶消化的转基因大豆样品色谱图的代表性数据:总离子电流(上数第一图);合并的提取离子(上数第二图);提取离子367.2082m/z–EISGTVK(2+)(上数第三图或中间图);提取离子367.1850m/z-DVASWR(2+)(倒数第二图);和提取离子484.7798m/z-VNGIGGLPGGK(2+)(倒数第一图)。所有离子的提取窗口为2.0ppm。

图4显示用于定量的具有肽注释的叠加的HRAM LC-MS标准(上图)和转基因(下图)提取离子色谱图的代表性数据。所有离子的提取窗口为2.0ppm。

图5显示来自HRAM LC-MS的标准色谱图500ng/mL合成肽的另外的代表性数据:总离子电流(上数第一图);合并的提取离子(上数第二图);提取离子346.6889m/z–FGAIER(2+)(上数第三图或中间图);提取离子621.8563m/z-IGGGDIVAISNVK(2+)(倒数第二图);和提取离子598.2831m/z-AAYDALDEATR(2+)(倒数第一图)。所有离子的提取窗口为2.0ppm。

图6显示来自HRAM LC-MS的胰蛋白酶消化的转基因大豆样品色谱图的代表性数据:总离子电流(上数第一图);合并的提取离子(上数第二图);提取离子346.6889m/z–FGAIER(2+)(上数第三图或中间图);提取离子621.8563m/z-IGGGDIVAISNVK(2+)(倒数第二图);和提取离子598.2831m/z-AAYDALDEATR(2+)(倒数第一图)。所有离子的提取窗口为2.0ppm。

图7显示用于定量的具有肽注释的叠加的HRAM LC-MS标准(上图)和转基因(下图)提取离子色谱图的代表性数据。所有离子的提取窗口为2.0ppm。

图8显示来自HRAM LC-MS的标准色谱图500ng/mL合成肽的另外的代表性数据:总离子电流(上数第一图);合并的提取离子(上数第二图);提取离子928.9367m/z–TEPQTPQEWIDDLER(2+)(上数第三图或中间图);提取离子761.9330m/z-SVVAVIGLPNDPSVR(2+)(倒数第二图);和提取离子565.8013m/z-LHEALGYTAR(2+)(倒数第一图)。所有离子的提取窗口为2.0ppm。

图9显示来自HRAM LC-MS的胰蛋白酶消化的转基因大豆样品色谱图的代表性数据:总离子电流(上数第一图);合并的提取离子(上数第二图);提取离子928.9367m/z–TEPQTPQEWIDDLER(2+)(上数第三图或中间图);提取离子761.9330m/z-SVVAVIGLPNDPSVR(2+)(倒数第二图);和提取离子565.8013m/z-LHEALGYTAR(2+)(倒数第一图)。所有离子的提取窗口为2.0ppm。

图10显示用于定量的具有肽注释的叠加的HRAM LC-MS标准(上图)和转基因(下图)提取离子色谱图的代表性数据。所有离子的提取窗口为2.0ppm。

发明详述

本发明基于这样的发现,即在利用特定仪器的多路分析过程中,来自前体蛋白的选定的特征肽可以产生灵敏的定量。具体地,在一个实施方案中,液相色谱与高分辨率精确质谱(LC-HRAM MS)方法联用检测5-烯醇丙酮酰莽草酸-3-磷酸合酶(2mEPSPS)的蛋白表达水平。本文中公开的方法和系统能够分析单独的2mEPSPS,或用于植物提取物中2mEPSPS与另外的蛋白质的组合的定量分析多路测定。具体地,在另一个实施方案中,液相色谱与高分辨率精确质谱(LC-HRAM MS)方法联用检测芳氧基链烷酸酯双加氧酶-12(AAD-12)的蛋白表达水平。本文中公开的方法和系统能够分析单独的AAD-12,或用于植物提取物中AAD-12与另外的蛋白质的组合的定量分析多路测定。具体地,在又另一个实施方案中,液相色谱与高分辨率精确质谱(LC-HRAM MS)方法偶联检测膦丝菌素乙酰转移酶(PAT)的蛋白表达水平。本文中公开的方法和系统能够分析单独的PAT,或用于植物提取物中PAT与另外的蛋白质的组合的定量分析多路测定。

由于越来越多的转基因蛋白被共表达或“叠加”以实现对多种除草剂的耐受性或提供多种抗虫作用方式,灵敏的、能够选择性地检测多种感兴趣的转基因蛋白多路测定具有重要意义。目前,用于转基因蛋白表达检测的所有相关技术严重依赖于传统的免疫化学技术,这对于容纳产生每个样品所需的数据量提出了挑战。

通常使用选择反应监测(SRM)来完成用于定量研究的质谱检测。使用特定类型的仪器,进行对来源中形成的感兴趣离子的初始质量选择,随后在质谱仪(MS)的碰撞区域中解离该前体(蛋白质)离子,然后对特定的产物(肽)离子进行质量选择和计数。在一些实施方案中,单位时间计数(counts per unit time)可以提供可积分的峰面积,从中可以确定分析物的量或浓度。在一些实施方案中,在具有HRAM能力的质谱仪上进行用于定量的高分辨率精确质量(HRAM)监测的使用可以包括,但不限于:混合四极-飞行时间、四极-轨道阱、离子阱-轨道阱或四极-离子阱-轨道阱(三合一)质谱仪。通过使用特定类型的仪器,肽不经历碎裂条件,而是作为完整的肽通过使用全扫描或靶向扫描模式(例如,选择性离子监测模式或SIM)加以测量。可通过产生每种特定分析物的提取离子色谱图来确定可积分的峰面积,并且可以计算分析物的量或浓度。数据的高分辨率和精确质量性质使得感兴趣的分析物(蛋白质和/或肽)的高度特异性和灵敏的离子信号成为可能。

除非另有说明,在包括说明书和权利要求书在内的本申请中使用的以下术语具有下面给出的定义。必须注意的是,如在说明书和在所附权利要求中使用的,单数形式“一个(a)”、“一种(an)”以及“该”包括复数指示物,除非上下文中另外清楚地指出。

如本文中所用的,术语“生物限制”是指遗传修饰的植物或其遗传物质移动到指定区域的限制。该术语包括物理、物理化学、生物限制,以及阻止遗传修饰的植物在自然环境或人工生长条件下的存活、扩散或繁殖的其他形式的限制。

如本文中使用的,术语“复杂蛋白样品”用于区分样品与纯化的蛋白样品。复杂蛋白样品含有多种蛋白质,并可能另外含有其他污染物。

如本文中使用的,通用术语“质谱”或“MS”是指任何适合的质谱方法、装置或配置,包括例如电喷雾电离(ESI)、基质辅助激光解吸/电离(MALDI)MS、MALDI-飞行时间(TOF)MS、大气压(AP)MALDI MS、真空MALDI MS、或其组合。质谱装置通过测量分子经过一组磁场和电场的飞行路径来测量所述分子的分子质量(作为分子的质荷比的函数)。质荷比是在带电粒子的电动力学中广泛使用的物理量。可以由本领域技术人员先验地计算特定肽的质荷比。两个具有不同质荷比的粒子当经受相同的电场和磁场时在真空中不会以相同的路径移动。

质谱仪器由三个模块组成:离子源,其将样品分子分离成离子;质量分析器,其通过施加电磁场根据离子的质量来将它们分类;和检测器,其测量指示剂量的值,并由此提供用于计算每个离子存在的丰度的数据。该技术既可以应用于定性也可以应用于定量。这些应用包括鉴定未知化合物,确定分子中元素的同位素组成,通过观察化合物的碎裂来确定它的结构,以及定量样品中化合物的量。

质谱方法和装置的详细综述可以在通过提述并入本文的以下参考文献中找到:Can和Annan(1997)Overview of peptide and protein analysis by mass spectrometry.In:Current Protocols in Molecular Biology,由Ausubel等人编辑,New York:Wiley,p.10.21.1-10.21.27;Paterson和Aebersold(1995)Electrophoresis 16:1791-1814;Patterson(1998)Protein identification and characterization by mass spectrometry.In:Current Protocols in Molecular Biology,Ausubel等人编辑,New York:Wiley,p.10.22.1-10.22.24;以及Domon和Aebersold(2006)Science 312(5771):212-17。

如该术语本文中使用的,当同一样品中存在两种或更多种感兴趣的蛋白质和/或肽时,蛋白质和/或肽是“多路(化)的”。

如本文中使用的,“植物性状”可以指植物的任何单一特征或可量化的测量。

如本文中使用的,短语“肽”或“肽类”可以指以确定的顺序连接α-氨基酸所形成的短聚合物。也可以通过用蛋白酶消化多肽(例如蛋白质)产生肽。

如本文中使用的,短语“蛋白质”或“蛋白质”可以指由排列在直链中并通过相邻氨基酸残基的羧基和氨基之间的肽键连接在一起的氨基酸构成的有机化合物。蛋白质中的氨基酸序列由遗传密码中编码的基因序列定义。通常,遗传密码指定20个标准氨基酸,然而在某些生物中,遗传密码可包括硒代半胱氨酸—并且在某些古细菌中包括-吡咯赖氨酸。常常观察到蛋白质中的残基通过翻译后修饰而被化学修饰,所述修饰可以在蛋白质在细胞中被利用之前或作为调控机制的一部分发生。蛋白质残基也可以根据本领域技术人员熟悉的技术通过设计加以修饰。如本文中使用的,术语“蛋白质”包括包含天然存在的氨基酸、合成氨基酸、修饰的氨基酸、或任何或所有上述氨基酸的组合的线性链。

如本文中使用的,术语“单次注射”是指在MS或LC-MS装置操作中的初始步骤。当蛋白质样品在单次注射中引入装置中时,整个样品是在单一步骤中引入的。

如本文中使用的,短语“特征肽”是指特定蛋白质的鉴别(短肽)序列。任何蛋白质可以含有平均10至100个特征肽。特征肽一般具有以下标准中的至少一个:容易通过质谱法检测,可预测地和稳定地从液相色谱(LC)柱洗脱,通过反相高效液相色谱(RP-HPLC)富集,电离良好,碎裂良好,或其组合。通过质谱法易于定量的肽一般具有以下标准中的至少一个:易于合成,能够被高度纯化(>97%),可溶于≤20%乙腈,非特异性结合低,抗氧化,合成后抗修饰,以及疏水性或疏水性指数≥10且≤40。疏水性指数可以根据Krokhin,Molecular and Cellular Proteomics 3(2004)908计算,将此文献通过提述并入本文。已知具有疏水性指数小于10或大于40的肽可能无法通过RP-HPLC柱可重现地拆分或洗脱。

如本文中使用的,术语“叠加”是指掺入植物基因组中的多个异源多核苷酸的存在。

串联质谱:在串联质谱法中,从感兴趣的分子产生的母离子(parent ion)可以在质谱仪中过滤,并且母离子随后被碎裂以产生一个或多个子离子(daughter ion),然后在第二质谱程序中分析(检测和/或定量)所述子离子。在一些实施方案中,排除使用串联质谱法。在这些实施方案中,在所提供的方法和系统中不使用串联质谱法。因此,在这些实施方案中既不产生母离子也不产生子离子。

如本文中使用的,术语“转基因植物”包括在其基因组内包含异源多核苷酸的植物。通常,异源多核苷酸稳定整合在基因组内,使得多核苷酸传代到连续世代。异源多核苷酸可以单独地或作为重组表达盒的一部分整合到基因组中。“转基因”在本文中用于包括其基因型由于异源核酸的存在已经被改变的任何细胞、细胞系、愈伤组织、组织、植物部分或植物,包括最初如此改变以及通过有性杂交或无性繁殖从初始转基因植物产生的那些转基因植物。

在本发明的实践中可以处理提供有用植物部分的任何植物。实例包括提供花、果实、蔬菜和籽粒的植物。

如本文中使用的,用语“植物”包括双子叶植物和单子叶植物。双子叶植物的实例包括烟草、拟南芥、大豆、番茄、木瓜、芸苔、向日葵、棉花、苜蓿、马铃薯、葡萄树、木豆、豌豆、芸苔属植物、鹰嘴豆、糖用甜菜、油菜、西瓜、甜瓜、胡椒、花生、南瓜(pumpkin)、萝卜、菠菜、倭瓜(squash)、绿花椰菜、卷心菜、胡萝卜、花椰菜、芹菜、大白菜、黄瓜、茄子、和莴苣。单子叶植物的实例包括玉米、水稻、小麦、甘蔗、大麦、黑麦、高粱、兰花、竹子、香蕉、香蒲、百合、燕麦、洋葱、小米、和黑小麦。果实的实例包括香蕉、菠萝、桔子、葡萄、葡萄柚、西瓜、甜瓜、苹果、桃、梨、猕猴桃、芒果、油桃、番石榴、柿子、鳄梨、柠檬、无花果、和浆果。花的包括实例满天星(baby’s breath)、康乃馨、大丽花、水仙、天竺葵、非洲菊、百合、兰花、牡丹、野胡萝卜花(Queen Anne's lace)、玫瑰、金鱼草、或其他插花(cut-flowers)或装饰花、盆花和花球。

在质谱方法中从复杂样品中鉴定单个蛋白质所容许的特异性是独特的,因为仅需要感兴趣的蛋白质序列即可鉴定感兴趣的蛋白质。与其他形式的多路复用相比,质谱法的独特之处在于其能够利用蛋白质的一级氨基酸序列的全长来靶向蛋白质的一级氨基酸序列中独特的标识类型部分(identifier-type portions),从而几乎消除非特异性检测。在本发明的一些实施方案中,利用独特地标识感兴趣的蛋白质的蛋白水解片段或蛋白水解片段组来检测复杂蛋白样品中的感兴趣的蛋白质。

在一些实施方案中,所公开的方法能够通过单次质谱分析来定量或测定复杂蛋白样品中多种蛋白质的比率,而不是单独多次测量每一种感兴趣的蛋白质并将各个结果编译成一个样品结果。

在一些实施方案中,本公开内容还提供了可用于开发和使用转基因植物技术的方法。具体地,公开的方法可以用于在连续世代中维持转基因植物的基因型。同样,本文中公开的方法的一些实施方案可用于提供非转基因植物的高通量分析,所述非转基因植物有被来自相邻植物的转基因污染(例如通过异花授粉)的风险。通过这些实施方案,可以促进和/或实现转基因的生物限制。在其他实施方案中,本文中公开的方法可以用于以高通量方式筛选植物转化程序的结果,以鉴定表现出期望的表达特征的转化体。

可以使用本发明的方法分析经由转基因表达技术引入植物中的任何蛋白质。适合于根据本发明的多路分析的蛋白质可以赋予使转基因植物优于其非转基因对应物的输出性状。可以赋予的期望性状的非限制性实例包括除草剂抗性、对昆虫的抗性、对疾病的抗性、对环境胁迫的抗性、增加的产量、改善的营养价值、改善的保质期、改变的油含量、改变的油组成、改变的糖含量、改变的淀粉含量、基于植物的药物的生产、工业产品(例如聚羟基链烷酸酯:被认为是理想的替代石油衍生的塑料的大分子聚酯)的生产、以及生物修复的潜力。而且,可以使用本公开的方法分析单个植物物种内的一种或多种转基因蛋白的表达。将两个或更多个基因或期望性状添加或调节到单个感兴趣物种中称为基因叠加。此外,在目前公开的具有一种或多种内源植物蛋白的多路分析中,可以同时分析一种或多种转基因蛋白的表达。

在转基因植物中表达的特别适合的蛋白质是赋予除草剂耐受性的那些,例如赋予对草甘膦除草剂的耐受性的5'-烯醇丙酮酰-3'-磷酸莽草酸合酶(EPSPS)的基因或其任何变体、赋予对2,4-D除草剂的耐受性的芳氧基链烷酸酯加双氧酶(AAD)、赋予对草铵膦除草剂的耐受性的膦丝菌素乙酰转移酶(PAT)、或其组合。

可以使用四极杆分析器来确定质荷比。例如,在“四极杆”或“四极杆离子阱”仪器中,振荡射频场中的离子受到与施加在电极之间的DC电势、RF信号的振幅和m/z成比例的力。可以选择电压和振幅,使得只有具有特定m/z的离子才能行遍四极杆的全长,而所有其他离子被偏转。因此,四极杆仪器可以充当注入仪器中的离子的“质量过滤器”和“质量检测器”。

碰撞诱导解离(“CID”)通常用于产生供进一步检测的子离子。在CID中,母离子通过与惰性气体如氩气碰撞而获得能量,随后通过称为“单分子分解”的过程而碎裂。母离子中必须储存足够的能量,使得离子内的某些键可以由于增加的能量而断裂。

质谱仪一般向用户提供离子扫描;即,在给定范围(例如10至1200amu)内每个m/z的相对丰度。分析物测定的结果,即质谱,可以通过本领域已知的许多方法与原始样品中的分析物的量关联。例如,鉴于取样和分析参数是得到仔细控制的,可以将给定离子的相对丰度与该相对丰度到原始分子的绝对量的换算表进行比较。或者,可以与样品一起运行分子标准品(例如,内标和外标),并基于从那些标准品产生的离子构建标准曲线。使用这种标准曲线,给定离子的相对丰度可以转化为原始分子的绝对量。许多其他用于将离子的存在或量与原始分子的存在或量关联的方法是本领域普通技术人员熟知的。

电离方法的选择可以基于待测量的分析物、样品类型、检测器类型、阳性对阴性模式的选择等来确定。可以使用多种方法产生离子,所述方法包括但不限于:电子电离、化学电离、快速原子轰击、场解吸、和基质辅助激光解吸电离(MALDI)、表面增强激光解吸电离(SELDI)、解吸电喷雾电离(DESI)、光子电离、电喷雾电离、和电感耦合等离子体。电喷雾电离是指其中将溶液通过一段末端施加有高的正或负电位的短毛细管的方法。到达管端部的溶液被蒸发(雾化)成在溶剂蒸气中的非常小的溶液液滴的射流或喷雾。这种液滴的雾流过蒸发室,蒸发室被加热以防止冷凝并使溶剂蒸发。随着液滴变小,电表面电荷密度增加,直到这样的时间为止:在相同电荷之间的自然排斥导致离子以及中性分子被释放。

LC的流出物可以直接且自动地(即,“在线”)注入到电喷雾装置中。在一些实施方案中,LC流出物中包含的蛋白质首先通过电喷雾电离成母离子。

各种不同的质量分析器可用于液相色谱-质谱联用(LC-MS)。示例性质量分析器包括但不限于单四极杆、三重四极杆、离子阱、TOF(飞行时间)、和四极杆飞行时间(Q-TOF)。

四极杆质量分析器可以由4个彼此平行设置的圆棒组成。在四极杆质谱仪(QMS)中,四极杆是负责基于离子的质荷比(m/z)过滤样品离子的仪器组件。基于离子在施加到杆的振荡电场中的轨迹的稳定性,离子在四极杆中被分离。

离子阱是捕获真空系统或管的区域中的离子的电场或磁场的组合。离子阱可以在质谱中使用,同时操纵离子的量子态。

飞行时间质谱法(TOFMS)是质谱法的一种方法,其中通过时间测量来确定离子的质荷比。离子被已知强度的电场加速。该加速产生与具有相同电荷的任何其他离子具有相同动能的离子。离子的速度取决于质荷比。测量粒子随后到达在已知距离处的检测器所花费的时间。这一时间将取决于粒子的质荷比(粒子越重,到达的速度越低)。根据这一时间和已知的实验参数,可以找到离子的质荷比。

在一些实例中,通过所提供的方法和/或系统使用的特定仪器可以包括高碎裂模式和低碎裂模式(或可替代地非碎裂模式)。这样的不同模式可以包括产生高分辨率质量数据的交替扫描高能量和低能量获取方法。在一些实施方案中,高分辨率质量数据可以包括产物数据集(例如,在高碎裂模式下从产物离子(碎裂离子)衍生的数据)和前体数据集(例如,在低碎裂或非碎裂模式下从前体离子(未碎裂离子)衍生的数据)。

在一些实施方案中,所提供的方法和/或系统使用质谱仪,所述质谱仪包括可用于选择步骤的过滤装置、可用于碎裂步骤的碎裂装置、和/或用于获取和/或质谱创建步骤中的一个或多个质量分析器。

过滤装置和/或质量分析器可以包括四极杆。选择步骤和/或获取步骤和/或质谱创建步骤可涉及分辨四极杆(resolving quadrupole)的使用。另外或可替代地,过滤装置可包括二维或三维离子阱或飞行时间(ToF)质量分析器。该/这些质量分析器可以包括或进一步包括下述的一者或多者:飞行时间质量分析器和/或离子回旋共振质量分析器和/或轨道阱质量分析器和/或二维或三维离子阱。

借助基于质荷比(m/z)的选择的过滤可以如下实现:使用可以基于m/z选择离子的质量分析器(例如四极杆);或传输宽的m/z范围,根据离子的m/z分离离子,然后借助于离子的m/z值选择感兴趣的离子。后者的实例是与定时离子选择器组合的飞行时间质量分析器。所提供的方法和/或系统可以包括使用色谱技术,例如液相色谱(LC),分离和/或分开一种或多种感兴趣的蛋白质,例如从多种蛋白质的两种或更多种蛋白质中。该方法可以进一步包括测量感兴趣的蛋白质的洗脱时间和/或将测量的洗脱时间与预期的洗脱时间进行比较。

另外或可替代地,可以使用离子迁移技术分离感兴趣的蛋白质,这可以使用离子迁移单元来进行。另外,可以通过离子迁移漂移的次序或时间来选择感兴趣的蛋白质。该方法可以进一步包括测量感兴趣的蛋白质的漂移时间和/或将测量的漂移时间与预期的漂移时间进行比较。

在一些实施方案中,所提供的方法和/或系统是无标记的,其中定量可以通过比较在注射之间或跨样品的感兴趣前体或产物m/z值的峰强度或质谱峰下面积来实现。在一些实施方案中,内标标准化可用于解决任何已知的相关分析误差。另一种无标记的定量方法——光谱计数(spectral counting),涉及以非冗余或冗余方式对每个给定肽获得的碎片离子谱或扫描的数目求和。然后将每种蛋白质的各相关肽质谱图加和,从而提供每种蛋白质的扫描数量的测量,其与蛋白质的丰度成比例。然后可以在样品/注射之间进行比较。

在一些实施方案中,离子源选自:(1)电喷雾电离(“ESI”)离子源;(2)大气压光电离(“APPI”)离子源;(3)大气压化学电离(“APCI”)离子源;(4)基质辅助激光解吸电离(“MALDI”)离子源;(5)激光解吸电离(“LDI”)离子源;(6)大气压电离(“API”)离子源;(7)硅上解吸电离(“DIOS”)离子源;(8)电子轰击(“E1”)离子源;(9)化学电离(“CI”)离子源;(10)场电离(“F1”)离子源;(11)场解吸(“FD”)离子源;(12)电感耦合等离子体(“ICP”)离子源;(13)快速原子轰击(“FAB”)离子源;(14)液体二次离子质谱(“LSIMS”)离子源;(15)解吸电喷雾电离(“DESI”)离子源;(16)镍-63放射性离子源;(17)大气压基质辅助激光解吸电离离子源;和(18)热喷雾离子源。

在一些实施方案中,所提供的方法和/或系统包括被配置为执行包括计算机可读程序代码手段的计算机程序元件的设备和/或控制系统,所述计算机可读程序代码手段用于使处理器执行用于实现所述方法的过程。

在一些实施方案中,所提供的方法和/或系统使用交替的低和高能量扫描功能,与植物提取物的液相色谱分离联用。可以提供感兴趣的蛋白质的信息列表,包括但不限于前体离子的mm/z、产物离子的m/z、保留时间、离子迁移漂移时间和迁移变化率。在LC分离过程中,并且当靶离子洗脱到质谱仪中时(并且由于检测到低能量前体离子或高能量产物离子,或者激活保留时间窗),所提供的方法和/或系统的质量分析器可以选择窄的m/z范围(宽度可变),以便将离子传递到气体池。因此,可以显著增强信噪比将感兴趣的蛋白质加以定量。

在一些实施方案中,在感兴趣的靶蛋白即将洗脱进入质谱仪离子源的色谱保留时间,所提供的方法和/或系统的质量分析器可以根据靶向的前体离子选择窄的m/z范围(宽度可变)。然后将这些选择的离子转移到能够通过在高碎裂模式和低碎裂模式(或非碎裂模式)之间交替和重复切换来离解离子的仪器阶段,其中在高碎裂模式下样品前体离子基本上被碎裂成产物离子,其中在低碎裂模式下样品前体离子基本上不碎裂。一般在两种模式下都获得高分辨率精确质谱,并且在实验结束时,通过离子的色谱洗脱时间和任选的其他物理化学性质的拟合的紧密程度来识别相关的前体离子和产物离子。与感兴趣的靶蛋白相关的前体离子或产物离子的信号强度可用于确定植物提取物中蛋白质的量。

本领域技术人员将理解,可以存在基于所提供的公开内容的某些变化。因此,给出以下实施例用于说明本发明的目的,而不应解释为对本发明或权利要求的范围的限制。

实施例

实施例1

用混有二硫苏糖醇(DTT)的测定缓冲液PBST提取植物样品(例如籽粒、叶、根、草料、花粉)。SEQ ID NO:1提供了5-烯醇丙酮酰莽草酸-3-磷酸合酶(2mEPSPS)的蛋白质序列:

MAGAEEIVLQPIKEISGTVKLPGSKSLSNRILLLAALSEGTTVVDNLLNSEDVHYMLGALRTLGLSVEADKAAKRAVVVGCGGKFPVEDAKEEVQLFLGNAGIAMRSLTAAVTAAGGNATYVLDGVPRMRERPIGDLVVGLKQLGADVDCFLGTDCPPVRVNGIGGLPGGKVKLSGSISSQYLSALLMAAPLALGDVEIEIIDKLISIPYVEMTLRLMERFGVKAEHSDSWDRFYIKGGQKYKSPKNAYVEGDASSASYFLAGAAITGGTVTVEGCGTTSLQGDVKFAEVLEMMGAKVTWTETSVTVTGPPREPFGRKHLKAIDVNMNKMPDVAMTLAVVALFADGPTAIRDVASWRVKETERMVAIRTELTKLGASVEEGPDYCIITPPEKLNVTAIDTYDDHRMAMAF SLAACAEVPVTIRDPGCTRKTFPDYFDVLSTFVKN.

将提取的蛋白质变性,然后通过加入胰蛋白酶蛋白酶并在37℃下温育15-20小时进行蛋白水解消化。然后将消化反应物用甲酸(pH=1-2)酸化,并使用LC-MS进行分析。在计算机上分析和消化2mEPSPS的蛋白质序列以产生待检测的理论肽片段并通过LC-MS进行测量。胰蛋白酶消化后的5-烯醇丙酮酰莽草酸-3-磷酸合酶(2mEPSPS)的候选特征肽列于表1中。

令人惊讶的是,与来自酶联免疫吸附测定(ELISA)或其他定量方法的结果相比,使用LC-MS进行定量,三个候选特征肽提供了良好的相关性。这三个特征肽是EISGTVK(SEQ ID NO:3)、DVASWR(SEQ ID NO:21)、和VNGIGGLPGGK(SEQ ID NO:12)。,这些序列的商业合成肽以及微生物衍生的2mEPSPS蛋白都用作分析参考标准品经历与上述相同的消化过程,其中合成肽可以直接用作蛋白质定量的分析参考标准品。

来自HRAM LC-MS的标准色谱图500ng/mL合成肽的代表性数据显示在图2中,其中在总离子电流(上数第一图);合并的提取离子(上数第二图);提取离子367.2082m/z–EISGTVK(2+)(上数第三图或中间图);提取离子367.1850m/z-DVASWR(2+)(倒数第二图);和提取离子484.7798m/z-VNGIGGLPGGK(2+)(倒数第一图)中进行比较可以鉴定每个特征肽的特征峰。所有离子的提取窗口为2.0ppm。

来自HRAM LC-MS的的胰蛋白酶消化的转基因大豆样品色谱图另外的代表性数据显示在图3中,其中在总离子电流(上数第一图);合并的提取离子(上数第二图);提取离子367.2082m/z–EISGTVK(2+)(上数第三图或中间图);提取离子367.1850m/z-DVASWR(2+)(倒数第二图);和提取离子484.7798m/z-VNGIGGLPGGK(2+)(倒数第一图)中进行比较也可以鉴定每个特征肽的特征峰。所有离子的提取窗口为2.0ppm。

可以计算每个特征肽的特征峰的峰面积,并且具有肽注释的叠加的HRAM LC-MS标准(上图)和转基因(下图)提取的离子色谱图的代表性数据显示在图4中用于定量。所有离子的提取窗口为2.0ppm。

实施例2

用混有二硫苏糖醇(DTT)的测定缓冲液PBST提取植物样品(例如籽粒、叶、根、草料、花粉)。将提取的蛋白质变性,然后通过加入胰蛋白酶蛋白酶并在37℃下温育15-20小时进行蛋白水解消化。然后将消化反应用甲酸(pH=1-2)酸化,并使用LC-MS进行分析。SEQ ID NO:26提供了AAD-12蛋白序列:

MAQTTLQITPTGATLGATVTGVHLATLDDAGFAALHAAWLQHALLIFPGQHLSNDQQITFAKRFGAIERIGGGDIVAISNVKADGTVRQHSPAEWDDMMKVIVGNMAWHADSTYMPVMAQGAVFSAEVVPAVGGRTCFADMRAAYDALDEATRALVHQRSARHSLVYSQSKLGHVQQAGSAYIGYGMDTTATPLRPLVKVHPETGRPSLLIGRHAHAIPGMDAAESERFLEGLVDWACQAPRVHAHQWAAGDVVVWDNRCLLHRAEPWDFKLPRVMWHSRLAGRPETEGAALV.

在计算机上分析和消化AAD-12的蛋白质序列以产生待检测的理论肽片段并通过LC-MS进行测量。胰蛋白酶消化后的AAD-12的候选特征肽列于表2中。

令人惊讶的是,与来自酶联免疫吸附测定(ELISA)或其他定量方法的结果相比,使用LC-MS进行定量,三个候选特征肽提供了良好的相关性。这三个特征肽是FGAIER(SEQ ID NO:28)、IGGGDIVAISNVK(SEQ ID NO:29)、和AAYDALDEATR(SEQ ID NO:34)。通过与上述相同的消化过程,这些序列的商业合成肽以及微生物衍生的AAD-12蛋白都用作分析参考标准品,其中合成肽可以直接用作蛋白质定量的分析参考标准品。

来自HRAM LC-MS的标准色谱图500ng/mL合成肽的代表性数据显示在图5中,其中在总离子电流(上数第一图);合并的提取离子(上数第二图);提取离子346.6889m/z–FGAIER(2+)(上数第三图或中间图);提取离子621.8563m/z-IGGGDIVAISNVK(2+)(倒数第二图);和提取离子598.2831m/z-AAYDALDEATR(2+)(倒数第一图)中进行比较可以鉴定每个特征肽的特征峰。所有离子的提取窗口为2.0ppm。

来自HRAM LC-MS的的胰蛋白酶消化的转基因大豆样品色谱图另外的代表性数据显示在图6中,其中在总离子电流(上数第一图);合并的提取离子(上数第二图);提取离子346.6889m/z–FGAIER(2+)(上数第三图或中间图);提取离子621.8563m/z-IGGGDIVAISNVK(2+)(倒数第二图);和提取离子598.2831m/z-AAYDALDEATR(2+)(倒数第一图)中进行比较也可以鉴定每个特征肽的特征峰。所有离子的提取窗口为2.0ppm。

可以计算每个特征肽的特征峰的峰面积,并且具有肽注释的叠加的HRAM LC-MS标准(上图)和转基因(下图)提取的离子色谱图的代表性数据显示在图7中用于定量。所有离子的提取窗口为2.0ppm。

实施例3

用混有二硫苏糖醇(DTT)的测定缓冲液PBST提取植物样品(例如籽粒、叶、根、草料、花粉)。将提取的蛋白质变性,然后通过加入胰蛋白酶蛋白酶并在37℃下温育15-20小时进行蛋白水解消化。然后将消化反应用甲酸(pH=1-2)酸化,并使用LC-MS进行分析。SEQ ID NO:46提供了膦丝菌素乙酰转移酶(PAT)的蛋白质序列:

MSPERRPVEIRPATAADMAAVCDIVNHYIETSTVNFRTEPQTPQEWIDDLERLQDRYPWLVAEVEGVVAGIAYAGPWKARNAYDWTVESTVYVSHRHQRLGLGSTLYTHLLKSMEAQGFKSVVAVIGLPNDPSVRLHEALGYTARGTLRAAGYKHGGWHDVGFWQRDFELPAPPRPVRPVTQI.

在计算机上分析和消化PAT的蛋白质序列以产生待检测的理论肽片段并通过LC-MS进行测量。胰蛋白酶消化后的膦丝菌素乙酰转移酶(PAT)的候选特征肽列于表3中。

令人惊讶的是,与来自酶联免疫吸附测定(ELISA)或其他定量方法的结果相比,使用LC-MS进行定量,三个候选特征肽提供了良好的相关性。这三个特征肽是TEPQTPQEWIDDLER(SEQ ID NO:49)、SVVAVIGLPNDPSVR(SEQ ID NO:55)、和LHEALGYTAR(SEQ ID NO:56)。通过与上述相同的消化过程,这些序列的商业合成肽以及微生物衍生的PAT蛋白都用作分析参考标准品,其中合成肽可以直接用作蛋白质定量的分析参考标准品。

来自HRAM LC-MS的标准色谱图500ng/mL合成肽的代表性数据显示在图8中,其中在总离子电流(上数第一图);合并的提取离子(上数第二图);提取离子928.9367m/z–TEPQTPQEWIDDLER(2+)(上数第三图或中间图);提取离子761.9330m/z-SVVAVIGLPNDPSVR(2+)(倒数第二图);和提取离子565.8013m/z-LHEALGYTAR(2+)(倒数第一图)中进行比较可以鉴定每个特征肽的特征峰。所有离子的提取窗口为2.0ppm。

来自HRAM LC-MS的的胰蛋白酶消化的转基因大豆样品色谱图另外的代表性数据显示在图9中,其中在总离子电流(上数第一图);合并的提取离子(上数第二图);提取离子928.9367m/z–TEPQTPQEWIDDLER(2+)(上数第三图或中间图);提取离子761.9330m/z-SVVAVIGLPNDPSVR(2+)(倒数第二图);和提取离子565.8013m/z-LHEALGYTAR(2+)(倒数第一图)中进行比较也可以鉴定每个特征肽的特征峰。所有离子的提取窗口为2.0ppm。

可以计算每个特征肽的特征峰的峰面积,并且具有肽注释的叠加的HRAM LC-MS标准(上图)和转基因(下图)提取的离子色谱图的代表性数据显示在图10中用于定量。所有离子的提取窗口为2.0ppm。

序列表

<110> 美国陶氏益农公司

Oman, Trent J.

Hill, Ryan C.

Schafer, Barry W.

Gilbert, Jeffrey R.

Shan, Guomin

<120> 转基因蛋白的定量分析

<130> 75620

<160> 60

<170> PatentIn version 3.5

<210> 1

<211> 445

<212> PRT

<213> 拟南芥(Arabidopsis thaliana)

<400> 1

Met Ala Gly Ala Glu Glu Ile Val Leu Gln Pro Ile Lys Glu Ile Ser

1 5 10 15

Gly Thr Val Lys Leu Pro Gly Ser Lys Ser Leu Ser Asn Arg Ile Leu

20 25 30

Leu Leu Ala Ala Leu Ser Glu Gly Thr Thr Val Val Asp Asn Leu Leu

35 40 45

Asn Ser Glu Asp Val His Tyr Met Leu Gly Ala Leu Arg Thr Leu Gly

50 55 60

Leu Ser Val Glu Ala Asp Lys Ala Ala Lys Arg Ala Val Val Val Gly

65 70 75 80

Cys Gly Gly Lys Phe Pro Val Glu Asp Ala Lys Glu Glu Val Gln Leu

85 90 95

Phe Leu Gly Asn Ala Gly Ile Ala Met Arg Ser Leu Thr Ala Ala Val

100 105 110

Thr Ala Ala Gly Gly Asn Ala Thr Tyr Val Leu Asp Gly Val Pro Arg

115 120 125

Met Arg Glu Arg Pro Ile Gly Asp Leu Val Val Gly Leu Lys Gln Leu

130 135 140

Gly Ala Asp Val Asp Cys Phe Leu Gly Thr Asp Cys Pro Pro Val Arg

145 150 155 160

Val Asn Gly Ile Gly Gly Leu Pro Gly Gly Lys Val Lys Leu Ser Gly

165 170 175

Ser Ile Ser Ser Gln Tyr Leu Ser Ala Leu Leu Met Ala Ala Pro Leu

180 185 190

Ala Leu Gly Asp Val Glu Ile Glu Ile Ile Asp Lys Leu Ile Ser Ile

195 200 205

Pro Tyr Val Glu Met Thr Leu Arg Leu Met Glu Arg Phe Gly Val Lys

210 215 220

Ala Glu His Ser Asp Ser Trp Asp Arg Phe Tyr Ile Lys Gly Gly Gln

225 230 235 240

Lys Tyr Lys Ser Pro Lys Asn Ala Tyr Val Glu Gly Asp Ala Ser Ser

245 250 255

Ala Ser Tyr Phe Leu Ala Gly Ala Ala Ile Thr Gly Gly Thr Val Thr

260 265 270

Val Glu Gly Cys Gly Thr Thr Ser Leu Gln Gly Asp Val Lys Phe Ala

275 280 285

Glu Val Leu Glu Met Met Gly Ala Lys Val Thr Trp Thr Glu Thr Ser

290 295 300

Val Thr Val Thr Gly Pro Pro Arg Glu Pro Phe Gly Arg Lys His Leu

305 310 315 320

Lys Ala Ile Asp Val Asn Met Asn Lys Met Pro Asp Val Ala Met Thr

325 330 335

Leu Ala Val Val Ala Leu Phe Ala Asp Gly Pro Thr Ala Ile Arg Asp

340 345 350

Val Ala Ser Trp Arg Val Lys Glu Thr Glu Arg Met Val Ala Ile Arg

355 360 365

Thr Glu Leu Thr Lys Leu Gly Ala Ser Val Glu Glu Gly Pro Asp Tyr

370 375 380

Cys Ile Ile Thr Pro Pro Glu Lys Leu Asn Val Thr Ala Ile Asp Thr

385 390 395 400

Tyr Asp Asp His Arg Met Ala Met Ala Phe Ser Leu Ala Ala Cys Ala

405 410 415

Glu Val Pro Val Thr Ile Arg Asp Pro Gly Cys Thr Arg Lys Thr Phe

420 425 430

Pro Asp Tyr Phe Asp Val Leu Ser Thr Phe Val Lys Asn

435 440 445

<210> 2

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 2

Ala Gly Ala Glu Glu Ile Val Leu Gln Pro Ile Lys

1 5 10

<210> 3

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 3

Glu Ile Ser Gly Thr Val Lys

1 5

<210> 4

<211> 31

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 4

Ile Leu Leu Leu Ala Ala Leu Ser Glu Gly Thr Thr Val Val Asp Asn

1 5 10 15

Leu Leu Asn Ser Glu Asp Val His Tyr Met Lys Gly Ala Leu Arg

20 25 30

<210> 5

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 5

Thr Leu Gly Leu Ser Val Glu Ala Asp Lys

1 5 10

<210> 6

<211> 9

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 6

Ala Val Val Val Gly Cys Gly Gly Lys

1 5

<210> 7

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 7

Phe Pro Val Glu Asp Ala Lys

1 5

<210> 8

<211> 15

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 8

Glu Glu Val Gln Leu Phe Leu Gly Asn Ala Gly Ile Ala Met Arg

1 5 10 15

<210> 9

<211> 22

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 9

Ser Leu Thr Ala Ala Val Thr Ala Ala Gly Gly Asn Ala Thr Tyr Val

1 5 10 15

Leu Asp Gly Val Pro Arg

20

<210> 10

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 10

Glu Arg Pro Ile Gly Asp Leu Val Val Gly Leu Lys

1 5 10

<210> 11

<211> 18

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 11

Gln Leu Gly Ala Asp Val Asp Cys Phe Leu Gly Thr Asp Cys Pro Pro

1 5 10 15

Val Arg

<210> 12

<211> 11

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 12

Val Asn Gly Ile Gly Gly Leu Pro Gly Gly Lys

1 5 10

<210> 13

<211> 31

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 13

Leu Ser Gly Ser Ile Ser Ser Gln Tyr Leu Ser Ala Leu Leu Met Ala

1 5 10 15

Ala Pro Leu Ala Leu Gly Asp Val Glu Ile Glu Ile Ile Asp Lys

20 25 30

<210> 14

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 14

Leu Ile Ser Ile Pro Tyr Val Glu Met Thr Leu Arg

1 5 10

<210> 15

<211> 9

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 15

Ala Glu His Ser Asp Ser Trp Asp Arg

1 5

<210> 16

<211> 40

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 16

Asn Ala Tyr Val Glu Gly Asp Ala Ser Ser Ala Ser Tyr Phe Leu Ala

1 5 10 15

Gly Ala Ala Ile Thr Gly Gly Thr Val Thr Val Glu Gly Cys Gly Thr

20 25 30

Thr Ser Leu Gln Gly Asp Val Lys

35 40

<210> 17

<211> 11

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 17

Phe Ala Glu Val Leu Glu Met Met Gly Ala Lys

1 5 10

<210> 18

<211> 15

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 18

Val Thr Trp Thr Glu Thr Ser Val Thr Val Thr Gly Pro Pro Arg

1 5 10 15

<210> 19

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 19

Ala Ile Asp Val Asn Met Asn Lys

1 5

<210> 20

<211> 22

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 20

Met Pro Asp Val Ala Met Thr Leu Ala Val Val Ala Leu Phe Ala Asp

1 5 10 15

Gly Pro Thr Ala Ile Arg

20

<210> 21

<211> 6

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 21

Asp Val Ala Ser Trp Arg

1 5

<210> 22

<211> 19

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 22

Leu Gly Ala Ser Val Glu Glu Gly Pro Asp Tyr Cys Ile Ile Thr Pro

1 5 10 15

Pro Glu Lys

<210> 23

<211> 13

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 23

Leu Asn Val Thr Ala Ile Asp Thr Tyr Asp Asp His Arg

1 5 10

<210> 24

<211> 18

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 24

Met Ala Met Ala Phe Ser Leu Ala Ala Cys Ala Glu Val Pro Val Thr

1 5 10 15

Ile Arg

<210> 25

<211> 14

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 25

Thr Phe Pro Asp Tyr Phe Asp Val Leu Ser Thr Phe Val Lys

1 5 10

<210> 26

<211> 293

<212> PRT

<213> Delftia acidovorans

<400> 26

Met Ala Gln Thr Thr Leu Gln Ile Thr Pro Thr Gly Ala Thr Leu Gly

1 5 10 15

Ala Thr Val Thr Gly Val His Leu Ala Thr Leu Asp Asp Ala Gly Phe

20 25 30

Ala Ala Leu His Ala Ala Trp Leu Gln His Ala Leu Leu Ile Phe Pro

35 40 45

Gly Gln His Leu Ser Asn Asp Gln Gln Ile Thr Phe Ala Lys Arg Phe

50 55 60

Gly Ala Ile Glu Arg Ile Gly Gly Gly Asp Ile Val Ala Ile Ser Asn

65 70 75 80

Val Lys Ala Asp Gly Thr Val Arg Gln His Ser Pro Ala Glu Trp Asp

85 90 95

Asp Met Met Lys Val Ile Val Gly Asn Met Ala Trp His Ala Asp Ser

100 105 110

Thr Tyr Met Pro Val Met Ala Gln Gly Ala Val Phe Ser Ala Glu Val

115 120 125

Val Pro Ala Val Gly Gly Arg Thr Cys Phe Ala Asp Met Arg Ala Ala

130 135 140

Tyr Asp Ala Leu Asp Glu Ala Thr Arg Ala Leu Val His Gln Arg Ser

145 150 155 160

Ala Arg His Ser Leu Val Tyr Ser Gln Ser Lys Leu Gly His Val Gln

165 170 175

Gln Ala Gly Ser Ala Tyr Ile Gly Tyr Gly Met Asp Thr Thr Ala Thr

180 185 190

Pro Leu Arg Pro Leu Val Lys Val His Pro Glu Thr Gly Arg Pro Ser

195 200 205

Leu Leu Ile Gly Arg His Ala His Ala Ile Pro Gly Met Asp Ala Ala

210 215 220

Glu Ser Glu Arg Phe Leu Glu Gly Leu Val Asp Trp Ala Cys Gln Ala

225 230 235 240

Pro Arg Val His Ala His Gln Trp Ala Ala Gly Asp Val Val Val Trp

245 250 255

Asp Asn Arg Cys Leu Leu His Arg Ala Glu Pro Trp Asp Phe Lys Leu

260 265 270

Pro Arg Val Met Trp His Ser Arg Leu Ala Gly Arg Pro Glu Thr Glu

275 280 285

Gly Ala Ala Leu Val

290

<210> 27

<211> 63

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 27

Met Ala Gln Thr Thr Leu Gln Ile Thr Pro Thr Gly Ala Thr Leu Leu

1 5 10 15

Gly Ala Thr Val Thr Gly Val His Leu Ala Thr Leu Asp Asp Ala Gly

20 25 30

Phe Ala Ala Leu His Ala Ala Trp Leu Gln His Ala Leu Leu Ile Phe

35 40 45

Pro Gly Gln His Leu Ser Asn Asp Gln Gln Ile Thr Phe Ala Lys

50 55 60

<210> 28

<211> 6

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 28

Phe Gly Ala Ile Glu Arg

1 5

<210> 29

<211> 13

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 29

Ile Gly Gly Gly Asp Ile Val Ala Ile Ser Asn Val Lys

1 5 10

<210> 30

<211> 6

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 30

Ala Asp Gly Thr Val Arg

1 5

<210> 31

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 31

Gln His Ser Pro Ala Glu Trp Asp Asp Met Met Lys

1 5 10

<210> 32

<211> 35

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 32

Val Ile Val Gly Asn Met Ala Trp His Ala Asp Ser Thr Tyr Met Pro

1 5 10 15

Val Met Ala Gln Gly Ala Val Phe Ser Ala Glu Val Val Pro Ala Val

20 25 30

Gly Gly Arg

35

<210> 33

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 33

Thr Cys Phe Ala Asp Met Arg

1 5

<210> 34

<211> 11

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 34

Ala Ala Tyr Asp Ala Leu Asp Glu Ala Thr Arg

1 5 10

<210> 35

<211> 6

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 35

Ala Leu Val His Gln Arg

1 5

<210> 36

<211> 9

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 36

His Ser Leu Val Tyr Ser Gln Ser Lys

1 5

<210> 37

<211> 28

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 37

Leu Gln His Val Gln Gln Ala Gly Ser Ala Tyr Ile Gly Tyr Gly Met

1 5 10 15

Asp Thr Thr Ala Thr Pro Leu Arg Pro Leu Val Lys

20 25

<210> 38

<211> 14

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 38

Val His Pro Glu Thr Gly Arg Pro Ser Leu Leu Ile Gly Arg

1 5 10

<210> 39

<211> 15

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 39

His Ala His Ala Ile Pro Gly Met Asp Ala Ala Glu Ser Glu Arg

1 5 10 15

<210> 40

<211> 14

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 40

Phe Leu Glu Gly Leu Val Asp Trp Ala Cys Gln Ala Pro Arg

1 5 10

<210> 41

<211> 17

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 41

Val His Ala His Gln Trp Ala Ala Gly Asp Val Val Val Trp Asp Asn

1 5 10 15

Arg

<210> 42

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 42

Cys Leu Leu His Arg

1 5

<210> 43

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 43

Ala Glu Pro Trp Asp Phe Lys

1 5

<210> 44

<211> 6

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 44

Val Met Trp His Ser Arg

1 5

<210> 45

<211> 13

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 45

Leu Ala Gly Arg Pro Glu Thr Glu Gly Ala Ala Leu Val

1 5 10

<210> 46

<211> 183

<212> PRT

<213> Streptomyces viridochromogenes

<400> 46

Met Ser Pro Glu Arg Arg Pro Val Glu Ile Arg Pro Ala Thr Ala Ala

1 5 10 15

Asp Met Ala Ala Val Cys Asp Ile Val Asn His Tyr Ile Glu Thr Ser

20 25 30

Thr Val Asn Phe Arg Thr Glu Pro Gln Thr Pro Gln Glu Trp Ile Asp

35 40 45

Asp Leu Glu Arg Leu Gln Asp Arg Tyr Pro Trp Leu Val Ala Glu Val

50 55 60

Glu Gly Val Val Ala Gly Ile Ala Tyr Ala Gly Pro Trp Lys Ala Arg

65 70 75 80

Asn Ala Tyr Asp Trp Thr Val Glu Ser Thr Val Tyr Val Ser His Arg

85 90 95

His Gln Arg Leu Gly Leu Gly Ser Thr Leu Tyr Thr His Leu Leu Lys

100 105 110

Ser Met Glu Ala Gln Gly Phe Lys Ser Val Val Ala Val Ile Gly Leu

115 120 125

Pro Asn Asp Pro Ser Val Arg Leu His Glu Ala Leu Gly Tyr Thr Ala

130 135 140

Arg Gly Thr Leu Arg Ala Ala Gly Tyr Lys His Gly Gly Trp His Asp

145 150 155 160

Val Gly Phe Trp Gln Arg Asp Phe Glu Leu Pro Ala Pro Pro Arg Pro

165 170 175

Val Arg Pro Val Thr Gln Ile

180

<210> 47

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 47

Met Ser Pro Glu Arg

1 5

<210> 48

<211> 32

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 48

Arg Pro Val Glu Ile Arg Pro Ala Thr Ala Ala Asp Met Ala Ala Val

1 5 10 15

Cys Asp Ile Val Asn His Tyr Ile Glu Thr Ser Thr Val Asn Phe Arg

20 25 30

<210> 49

<211> 15

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 49

Thr Glu Pro Gln Thr Pro Gln Glu Trp Ile Asp Asp Leu Glu Arg

1 5 10 15

<210> 50

<211> 4

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 50

Leu Gln Asp Arg

1

<210> 51

<211> 22

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 51

Tyr Pro Trp Leu Val Ala Glu Val Glu Gly Val Val Ala Gly Ile Ala

1 5 10 15

Tyr Ala Gly Pro Trp Lys

20

<210> 52

<211> 16

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 52

Asn Ala Tyr Asp Trp Thr Val Glu Ser Thr Val Tyr Val Ser His Arg

1 5 10 15

<210> 53

<211> 13

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 53

Leu Gly Leu Gly Ser Thr Leu Tyr Thr His Leu Leu Lys

1 5 10

<210> 54

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 54

Ser Met Glu Ala Gln Gly Phe Lys

1 5

<210> 55

<211> 15

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 55

Ser Val Val Ala Val Ile Gly Leu Pro Asn Asp Pro Ser Val Arg

1 5 10 15

<210> 56

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 56

Leu His Glu Ala Leu Gly Tyr Thr Ala Arg

1 5 10

<210> 57

<211> 4

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 57

Gly Thr Leu Arg

1

<210> 58

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 58

Ala Ala Gly Tyr Lys

1 5

<210> 59

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 59

His Gly Gly Trp His Asp Val Gly Phe Trp Gln Arg

1 5 10

<210> 60

<211> 17

<212> PRT

<213> 人工序列

<220>

<223> 候选特征肽

<400> 60

Asp Phe Glu Leu Pro Ala Pro Pro Arg Pro Val Arg Pro Val Thr Gln

1 5 10 15

Ile

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1