在植物中表达多蛋白的遗传学方法

文档序号:454435阅读:409来源:国知局
专利名称:在植物中表达多蛋白的遗传学方法
技术领域
本发明涉及一种增强蛋白表达水平的方法,尤其通过在植物的一个单独的转录单元内共表达两个或多个蛋白来增强蛋白的表达。本发明还涉及植物中两个或多个蛋白的共表达和分泌,涉及发明方法中所应用的接头序列,涉及发明中应用的DNA构建体以及用发明中的这种构建体所转化的植物。
由于许多应用都基于通过基因转移所进行的植物遗传学改变,协同表达两个或多个转基因是可取的。例如,在植物中,编码具有不同生化靶点的抗菌蛋白的转基因的共表达能够产生增强的抗病水平,产生较广阔范围的病原体抗性,或者产生更难被病原体变异适应所克服的抵抗性。其他例子包括,通过共表达包含在一条生物合成途径中的多个转基因,在转基因植物中产生一种特殊的代谢物。要获得表达多个转基因的转基因植物,存在不同的方法。一种常用的选择方案是,通过单独的转化作用分别导入每一个转基因,并将不同的单一转基因表达品系杂交。这种方法的缺点是,在产生的后代中,不同的转基因将被插入不同的位置。这会使随后的育种过程复杂化。而且,这种方法不适用于营养繁殖的作物,例如马铃薯、许多观赏植物和果树。
第二种可能性是,把不同的转基因作为一个单独转化载体内连接的表达盒来导入,每一表达盒有自己的启动子和终止子。在这种情况下,这样一组转基因将作为一个单一的基因位点来分离。然而已经发现,转基因植物中相同启动子的多个拷贝的存在,经常抑制转基因的转录(Matzke,M.A.和Matzke,A.J.M.,1998,细胞和分子生物学54,94-103)。在一项把载体导入植物的实验中,其中的载体包含四个相连接的转基因,每一转基因由一个CaMV35S启动子驱动,Van denElzen P.J.等(Phil.Trans.Soc.Lon.B.,1993,342:271-278)发现,所分析的转基因品系中没有一个能在相当高的水平表达全部的四个转基因。为了避免这个问题,可以在所应用的每一个表达盒中使用不同的启动子。然而,目前只有有限的可供选择的启动子组,在表达水平、细胞类型和进化专一性以及对环境因素的反应上具有相仿的特性。
第三个选项是用所谓的内部核糖体进入位点分隔不同的编码区域,从一个转录单元产生多个蛋白。内部核糖体进入位点使核糖体在mRNA的内部位置重复翻译。尽管内部核糖体进入位点在动物体系得到了很好的证明(Kaminiski A.等.,1994,genet.Eng.16,115-155),但是目前还不知道这些位点在来自植物的核-编码基因中是否也起作用。多顺反子性的基因在插入植物叶绿体基因组时能够被表达(Daniell H.等.,1998,自然生物技术16,345-348),但是这种情况下的基因产物被限定在叶绿体,而叶绿体并不总是外源蛋白优选的沉积位点。
最后,第四种策略是基于水解断裂一个由单个转录单元编码的多蛋白前体,而产生多个蛋白。例如,马铃薯Y病毒组(Potyviruses)把它们的基因组RNA翻译成一个单一的多蛋白前体,该前体包含的蛋白水解结构域能够顺式断裂多蛋白前体(Dougherty,W.G.和Carrington,J.C.,1988,植物病理学综述年刊26,123-143)。Beckvon Bodman,S.et al.,(1995,生物/技术13,587-591)已经利用马铃薯Y病毒组方法共表达了参与甘露碱生物合成的两种酶。这两种生物合成酶与一个来源于马铃薯Y病毒组多蛋白前体的蛋白酶一起被融合在一个开放阅读框中,而邻接区域被8个氨基酸长的间隔区分开,间隔区代表了蛋白酶的特异裂解位点。用这种结构转化的植物合成了苷露碱,表明这两种酶已经以某种方式产生了至少有部分功能的形式,尽管在植物(inplanta)中没有为推测的裂解作用提出直接的证据。这种方法的缺点是,病毒蛋白需要与感兴趣的蛋白共表达,这并不总是可取的。最近,Urwin P.E.等(1998,植物学204,472-479)已经证明可以共表达用一个来自植物金属硫蛋白样蛋白的蛋白酶敏感前肽接合的两个不同的蛋白酶抑制因子。在转基因拟南芥(Arabidopsis thaliana)中已经发现,由一个半胱氨酸蛋白酶抑制子(oryzacystatin from vice)、一个来源于豌豆金属硫蛋白样蛋白的前肽和一个丝氨酸蛋白酶抑制子组成的一个多蛋白前体被裂解。然而仅是部分裂解,因为在转基因植物中也能检测到没被裂解的多蛋白前体。由于该多蛋白前体不包含一个引导肽,所以预测翻译产物将沉积在细胞溶质中。衍生出前肽的金属硫蛋白也不包含一个引导肽(Evans IM 1990,欧洲生物化学协会联合会刊(FEBS Lett.262,29~32)),因此它的加工必须在胞质中进行。
对一些应用而言,胞质加工和沉积是一个缺陷。许多蛋白,尤其是糖基化蛋白或有多个二硫键的蛋白,必须在分泌途径合成(包括内质网和高尔基器),以折叠成一种有功能的形式(Bednarek和Raikhel1992,植物分子生物学20,133-150)。另外,对于一些应用,例如抗菌蛋白的表达,细胞外间隙是优选的沉积位点,因为大多数微生物至少早期感染过程发生在细胞外间隙。指定到细胞外间隙的蛋白也是通过分泌途径合成的,但是除了引导肽以外还缺少额外的靶向信息(Bednarek和Raikhel 1992,植物分子生物学20,133-150)。这种方法的其它应用事例在WO 95/24486和WO95/17514中有所描述。
申请者意外发现,用一个多蛋白前体构建体转化的植物中,植物防卫素的表达水平远高于其在用单一的植物防卫素构建体转化的植物中的表达。
因此,本发明提供了在转基因植物中提高一种蛋白表达水平的方法,该方法包括在所述植物的基因组插入一个DNA序列。该DNA序列包含一个启动子区域和一个3′-终止区,其中所述的蛋白编码区由一个编码接头前肽的DNA序列相互分隔开。所述前肽提供一个裂解位点,表达的多蛋白在该位点被翻译后加工成组分(component)蛋白分子。
这里描述的加工系统不仅可以用来共表达两个或多个不同蛋白,而且可以用来获得一个蛋白尤其是小蛋白的高表达。所观察到的促进翻译效率的原因目前还不清楚。可能归于mRNA长度或原始翻译产物长度的影响。
优选一个信号序列有效地连接在蛋白编码区之间。
这里所表述的“信号序列”是用来定义编码引导肽的一个序列,该引导肽使新生多肽进入内质网,而且引导肽在这种转位作用之后被切除。
信号序列可以来自任何适合的来源并且可能天然联合有它要被连接的启动子。我们已经发现,来自植物蛋白防卫素家族的信号序列(Broekaert et a1,1995植物生理学108,1353-1358;Broekaertet al,1997,Crit,Rev,Plant Sci 16,297-323),尤其适合在本发明方法中使用。
这样,在一个更加优选的实施方案中,提供了一种在转基因植物中提高蛋白表达水平的方法,包括在所述植物的基因组插入一个DNA序列,该DNA序列包含一个启动子区域连接一个信号序列。该信号序列被连接到两个或多个蛋白编码区和一个3′-终止区,其中所述的蛋白编码区由一个编码接头前肽的DNA序列相互分隔开。所述前肽提供一个裂解位点,表达的多蛋白在该位点被翻译后加工成组分蛋白分子。
本发明的这种方法尤其适合长度在100个氨基酸或少于100个氨基酸的蛋白的表达。
本发明提供了一种简便高效的方法,即在植物中把两个或多个蛋白作为一个单独的转录单元共表达,在转录单元中,两种蛋白被一种可裂解的连接物连接。这样设计这种结构,以便在植物的分泌途径中发生裂解作用,把蛋白释放到胞外。
根据本发明的另一个方面,提供了一种在转基因植物中表达多个蛋白的方法,包括在所述植物的基因组插入一个DNA序列,该DNA序列包含一个启动子区域连接一个信号序列。该信号序列被连接到两个或多个蛋白编码区和一个3'-终止区,其中所述的蛋白编码区由一个编码接头前肽的DNA序列相互分隔开。所述前肽提供一个裂解位点,表达的多蛋白在该位点被翻译后加工成组分蛋白分子。
根据本发明的所有方面,两个或两个以上的蛋白编码区最好不编码相同的蛋白,即,本发明的方法允许在一个单一的转录单元中产生不同的蛋白质。根据本发明的方法,要表达的DNA序列不是植物中天然用来产生多蛋白的序列,即该DNA序列的一个或多个组分对于植物宿主是异种的。
这里描述的多蛋白表达方法不包括象国际专利申请公开No.WO95/24486中SEQ ID NO.14,15,16,17或18中所描述的,使用如Ib-AMP基因表达的接头前肽,将三个各自编码Rs-AFP2蛋白的编码区分开并将其插入植物基因组。相适应地,本发明的方法中不使用WO95/24486中SEQ ID NO.14,15,16,17或18所描述的天然Ib-AMP基因的接头前肽。
在另一个方面,本发明提供了一种在转基因植物中表达多个蛋白的方法,包括在所述植物的基因组插入一个DNA序列,该DNA序列包含一个启动子区域连接一个信号序列。该信号序列被连接到两个或多个蛋白编码区和一个3′-终止区,其中所述的蛋白编码区由一个编码接头前肽的DNA序列相互分隔开。所述前肽提供一个裂解位点,表达的多蛋白在该位点被翻译后加工成组分蛋白分子。前提条件是,当接头前肽来源于国际专利申请公开No.WO95/24486中SEQ ID NO.14,15,16,17或18所描述的Ib-AMP基因时,它不分隔三个各自编码Rs-AFP2蛋白的编码区。
Rs-AFP2的序列在1993年3月18日发布的国际专利申请公开No.WO93/05153中有完整描述。
启动子序列可能自然地连接有信号序列,也/或者可能自然地联合有它要连接的蛋白编码序列,或者它可能是植物中任何其它的转录启动子。启动子可能是一个组成性的启动子或者可能是一个可诱导启动子。
这里所描述的本发明在所有方面和所有实施例中使用的一种优选的接头前肽,在多蛋白编码-DNA被表达的植物细胞分泌途径中,从所述的DNA编码多蛋白前体中裂解。接头前肽优选这样的设计或选择,以便使前肽被天然存在于植物细胞分泌途径的蛋白酶降解,其中编码多蛋白的DNA在分泌途径表达。花椰菜花叶病毒的特殊启动子例如35SRNA的Penh 25S启动子,这样的蛋白酶的例子包括枯草杆菌蛋白酶样蛋白酶。
因此,在本发明的一个优选的实施方案中,提供了一种在转基因植物中表达多个蛋白的方法,包括在所述植物的基因组插入一个DNA序列,该DNA序列包含一个启动子区域连接一个信号序列。该信号序列被连接到两个或多个蛋白编码区和一个3′-终止区,其中所述的蛋白编码区由一个编码接头前肽的DNA序列相互分隔开。所述前肽提供一个裂解位点,表达的多蛋白在该位点被翻译后加工成组分蛋白分子。所述接头前肽在表达DNA编码多蛋白的植物细胞分泌途径中,从所述的DNA编码多蛋白前体中裂解。
这里所描述的多蛋白表达方法不包括象国际专利申请公开No.WO95/24486中SEQ ID NOs 14,15,16,17或18中所描述的,使用来源于Ib-AMP基因的接头前肽将三个各自编码Rs-AFP2蛋白的编码区分开并将其插入植物基因组。
在本发明的一些实施方案中,接头前肽不是从病毒得来的。
在本发明的一个优选的实施方案中,提供了一种在转基因植物中表达多个蛋白的方法,包括在所述植物的基因组插入一个DNA序列,该DNA序列包含一个启动子区域连接一个信号序列。该信号序列被连接到两个或多个蛋白编码区和一个3'-终止区,其中所述的蛋白编码区由一个编码接头前肽的DNA序列相互分隔开。所述前肽提供一个裂解位点,表达的多蛋白在该位点被转录后加工成组分蛋白分子。所述接头前肽在表达DNA编码多蛋白的植物细胞分泌途径中,从所述的DNA编码多蛋白前体中裂解。其中前肽的裂解是由天然存在于植物分泌途径的蛋白酶进行的。
接头前肽可能是一种天然包含发生在植物分泌途径中的蛋白酶加工位点的肽,例如这里将进一步描述的Ib-AMP基因来源的内部前肽。接头前肽或者可能是一种在任一端或两端都已经设计有蛋白酶加工位点的肽,其利于序列的裂解。在前肽具有一个这样的蛋白酶加工位点的地方,可以再加入一个蛋白酶加工位点。如果需要或期望,可以包括重复的加工位点,例如包含六个以上重复的加工位点。
例如,正如这里所充分描述的,又一个蛋白酶加工位点已经被加到DNA序列的3’-末端。该DNA序列编码来自大丽花和苋属植物的C-末端前肽,其在N-末端天然具有一个未知分泌途径的蛋白酶加工位点,并且这些肽尤其适合在本发明的方法中应用。已经描述了某些包含C-末端前肽序列的大丽花序列,并在共同未决的英国专利No.9818003.7中要求保护。
然而,另一策略基于使用病毒例如小核糖核酸病毒的序列,例如口蹄疫病毒(FMDV)RNA的被称作2A序列的20个氨基酸序列,导致多蛋白的裂解(Ryan and Drew 1994,EMPO杂志,13,928-933)。然而在这个例子中,为了避免不需要的氨基酸在蛋白产物中的滞留,联合一个产生N-末端的序列,例如一个植物来源的序列或片段,来形成一个嵌合的前肽。
在本发明中,我们已经建立了新的策略来制造在分泌途径被裂解的人造多蛋白前体。第一种策略基于使用一个IbAMP基因来源的前肽。IbAMP是来自凤仙花(Impatiens balsamina)的一个基因,编码一种独特的多蛋白前体,该前体特有一个引导肽和6个连续的抗菌肽,每一抗菌肽侧面与16到28个氨基酸长度变化的前肽相连接(Tailor R.H.et al.,1997,生物化学杂志272,24480-24487)。并不知道IbAMP前体在它来源的植物中是怎样并在何处进行加工的。来自IbAMP的一个内部前肽被用来分隔两个不同的植物防卫素编码区,这两个编码区一个来源于萝卜种子(RsAFP2,Terras F.R.G.etal.,1992,生物化学267,15301-15309;Terras et al,1995,植物细胞学,7,573-588),一个来自大丽花种子(DmAMP1,Osborn R.W.et al.,1995,欧洲生物化学协会联合会刊368,257-262)。
另一策略基于使用来自DmAMP1前体或AcAMP2前体或者它们的片段的C-末端前肽(De Bolle M.F.C.ET AL.,1993,植物分子生物学22,1187-1190)。选择这些C-末端前肽的根据是,我们以前观察到它们在转基因烟草中能被明显裂解而不影响它们在前体中所连接的成熟蛋白的细胞外沉积(R.W.Osborn and S.Attenborough,个人通信;De Bolle M.F.C.et al.,1996,植物分子生物学31,993-1008),表明这种断裂是由存在于液泡除外的分泌途径中的一种蛋白酶所进行的。要把这些C-末端前肽转化为内部前肽,在前肽的C-末端部分设计了一个枯草杆菌蛋白酶样蛋白酶加工位点。
枯草杆菌蛋白酶样蛋白酶是在最后两个残基是碱性的识别位点特异断裂的酶(Barr,P.J.,1991,细胞66,1-3;Park C.M.etal.,1994,分子微生物学,11,155-164)。尽管枯草杆菌蛋白酶样蛋白酶在真菌(例如Kex2样蛋白酶)和高等动物(例如弗林蛋白酶)中被很好地证明,但近来的证据表明这些酶也存在于植物中(Kinal H.et al.,1995,植物细胞7,677-688;Tornero P.et al.,1997,生物化学杂志272,14412-14419),包括拟南芥属植物(Ribeiro A.et al.,1995,植物细胞7,785-794)。
我们已经发现,包含一个引导肽和两个由任何上述内部前肽相互分隔的不同植物防卫素的多蛋白前体,能够在转基因植物中被加工,同时释放两种植物防卫素。确实发生了这种裂解,这样至少植物防卫素的大部分沉积在细胞外间隙。因此,前体的加工在分泌途径或细胞外间隙发生。在转基因植物中被裂解的不同前肽没有显示出原始序列同源性。然而所有的序列都似乎富含小氨基酸A,V,S和T,并且都包含由两个酸性残基、两个碱性残基或一个酸性残基和一个碱性残基所组成的二肽序列。尽管在本发明实施例中证明的前肽裂解没有明显地发生在液泡中,但如果期望蛋白在液泡中沉积,可能也可以使用来自液泡蛋白(例如2S的白蛋白)的内部前肽。这里所述的共表达实验中使用了两个不同的植物防卫素,但预测当在多蛋白前体结构中应用其它类型的蛋白或者使用两个以上的成熟蛋白域时,将得到相同结果。
要在分泌途径中把多蛋白指向一个特殊的细胞器,可以把一个适合的靶向序列加到一个或多个多蛋白编码区域。例如,一个内质网靶向序列,例如编码KDEL(SEQ ID NO 65)的序列,可以被加到一个或多个成熟蛋白编码区,或者一个液泡靶向的序列(Chispeel和Raikhel 1992,细胞学68,613-616)可以被加到一个或多个蛋白编码区的3’-或5’-末端。近来的一个例子是,证明大麦凝集素的羧基末端前肽指定异源蛋白以不同方式分泌到液泡中(Bednarek和Raikhel 1991,植物细胞学3,1195-1206;De Bolle等,1996,植物分子生物学31,933-1008)。
根据这里所述的的本发明的所有方面和方法,优选所使用的接头前肽的序列至少有40%包括选自丙氨酸、缬氨酸、异亮氨酸、甲硫氨酸、亮氨酸、苯丙氨酸、色氨酸和酪氨酸的2到5个连续疏水残基的延伸或者包括2到5个选自天冬氨酸、谷氨酸、赖氨酸、精氨酸、组氨酸、丝氨酸、苏氨酸、谷氨酰胺和天冬酰胺的2到5个亲水残基的延伸。
所述的疏水残基优选丙氨酸、缬氨酸、亮氨酸、甲硫氨酸和/或异亮氨酸,而所述亲水残基优选天冬氨酸、谷氨酸、赖氨酸和/或精氨酸。
更优选地,接头前肽在它N-或C-末端裂解位点的7个残基内有一个具有2到5个连续酸性残基、2到5个连续碱性残基或者2到5个混合酸碱性残基的序列。
根据这里所述的的本发明的所有方面,尤其优选所使用的接头前肽的序列至少有40%由选自丙氨酸、缬氨酸、异亮氨酸、甲硫氨酸、亮氨酸、苯丙氨酸、色氨酸和酪氨酸的2到5个连续疏水残基的延伸或者选自天冬氨酸、谷氨酸、赖氨酸、精氨酸、组氨酸、丝氨酸、苏氨酸、谷氨酰胺和天冬酰胺的2到5个亲水残基的延伸组成。并且接头前肽在它N-或C-末端裂解位点的7个残基内有一个具有2到5个连续酸性残基、2到5个连续碱性残基或者2到5个连续的混合酸碱性残基序列。
也优选使用富含小氨基酸A,V,S和T,并且包含由两个酸性残基、两个碱性残基或一个酸性残基和一个碱性残基所组成的二肽序列的接头前肽,在翻译中提供一个裂解位点,表达的多蛋白在该位点被翻译后加工成为组分蛋白分子。
这里所用的术语“富含”表示A,V,A和T残基的存在比根据氨基酸随机分布所预计的更加频繁。
更优选接头前肽在其N-末端和/或C-末端的7个氨基酸内有一个二肽序列,该二肽序列由两个酸性残基、两个碱性残基或一个酸性残基和一个碱性残基组成,其中所述的二肽序列在接头前肽的每一末端可能相同或不同。
在一个更优选的实施方案中,所述二肽序列选自EE,ED和/或KK。
特别期望接头前肽拥有距离足够远的两个(或多个)蛋白域,以便它们能够独立地适当折叠。为了这一目的,接头前肽适合至少10个氨基酸长而更优选至少15个氨基酸长。更加有利的是,接头前肽不与它所连接的任一个二级结构单元相互作用并因此自身没有特别的二级结构或形成单独的二级结构,如α螺旋。
在这里描述的本发明的这一和其它所有方面和实施例中,提供裂解位点的接头前肽序列,优选包括一个从自然资源如植物或病毒,或其变体,或者这些中任一个的片段中可分离到的接头序列。特别是,接头前肽可以从一种植物蛋白,或片段,或其变体或衍生物中分离,这提供了适合的裂解位点。特别的例子包括一个可裂解的接头前肽,来自大丽花基因C-末端的前肽区,正如在共同未决的英国专利申请No.9818003.7中所描述和要求的。
在应用病毒序列时,优选一个嵌合前肽元件。
这里表达的“变体”是指氨基酸序列内部的一个或多个氨基酸被其它氨基酸替代,使氨基酸序列不同于它们所来源的基本序列。氨基酸替代可以被认为是“保守的”,其中的氨基酸被一个具有广泛相似特性的不同氨基酸代替。非保守性替代是氨基酸被不同类型的氨基酸代替。概括地讲,不改变多肽的生物活性,将不可能有非保守的替代。相适应地,变体与基本序列间至少有85%,优选至少90%的相似性。
在本发明范围中,相互间具有至少85%相似性的两个氨基酸序列在一个相似的位置至少有85%相似(同样的或保守替代的)的氨基酸残基,当最佳排列时,提供了3个缺口。前提条件是,就缺口而言,总共不超过15个氨基酸残基受到影响。同样地,相互间具有至少90%相似性的两个氨基酸序列在一个相似的位置至少有90%同样或保守替代的氨基酸残基,当最佳排列时,提供了3个缺口。前提条件是,就缺口而言,总共不超过15个氨基酸残基受到影响。
为了本发明的这一目的,规定一个保守氨基酸,与未改变蛋白相比,不改变蛋白活性/功能。特别可以在以下各组内的氨基酸间进行保守替代。
(ⅰ)丙氨酸,丝氨酸,甘氨酸和苏氨酸(ⅱ)谷氨酸和天冬氨酸(ⅲ)精氨酸和赖氨酸(ⅳ)异亮氨酸,亮氨酸,缬氨酸和甲硫氨酸(ⅴ)苯丙氨酸,酪氨酸和色氨酸序列的相似性可以用本领域已知的序列排列算法来进行测定,序列排列算法例如,Myers和Miller(生物科学的计算应用4,11-17(1988))以及Wilbur和Lipman(美国国家科学院院刊80,726-30(1983))所描述的Clustal方法,还有Watterman和Eggert方法(分子生物学杂志(1987)197,723-728)。可以从美国威斯康星州,53715,Madison,1228 Selfpark大街的DNAstar公司获得的MegAlign Lipman Pearson成对方法(使用默认参数),作为Lasergene因方法的一部分也可以被使用。
特别地,接头前肽是从一种可以从植物蛋白分离的序列,而更优选从植物抗菌蛋白的前体中分离。所述植物抗菌蛋白如一种防卫素或一种橡胶蛋白(hevein)类型的抗菌肽(Broekaert等1997,植物科学综述评论16,297-323)。接头前肽最优选来自一种防卫素和/或一种橡胶蛋白类型的抗菌肽,尤其是来自Dm-AMP1和Ac-AMP2的C-末端前肽,其序列如图2所述(SEQ ID NO 5和SEQ ID NO 8)。
也优选使用从凤仙花属植物的抗菌肽来源的接头前肽。Ib-AMP基因包括5个前肽区,所有的前肽区都适用于本发明,并在国际专利申请公告WO95/24486的第29页和40-42页充分描述,其内容在此引入作为参考。可以使用来自Dm-AMP和Ac-AMP基因的全部或部分C-末端前肽。
在一个特别优选的实施方案中,使用的接头前肽包括一个自然存在的接头前肽序列,其被进行了修改,以便使其裂解后,来自该序列的氨基酸在蛋白产物上的残余减少,优选没有残余。适当的改变可以用下文所描述的常规方法来测定。在最简单的形式上,分离本发明的蛋白产物并分析它们是否包含来自前肽连接物的任何残留的氨基酸。接头序列然后可以被修改除去一些或所有这些残基,前提条件是能保留翻译后裂解的功能。
“片段”这一术语是指氨基酸已经从中删除的序列,优选从其一个末端区删除氨基酸。这样的片段包括上面提到的天然序列的修改形式。
本发明的一个接头前肽如果作为一个翻译后的裂解位点,可能包括来源不同的一个或多个这种片段。接头前肽序列的例子是这里所示的SEQ ID NOs3,4,6,7,21,22,23,24,25,26,27,28和29以及其充当前肽的变体。其中具体的例子是SEQ IDNOs3,4,6,7,21,22,23,24,25,26,27,28和29自身。
前肽序列尤其包括SEQ ID NOs3,4,6或7。
根据本发明一个优选的实施例,进一步提供了一种在转基因植物中表达多个蛋白的方法,包括在所述植物的基因组插入一个DNA序列,该DNA序列包含一个启动子区域连接一个信号序列。该信号序列被连接到两个或多个蛋白编码区和一个3′-终止区,其中所述的蛋白编码区由一个编码接头前肽的DNA序列相互分隔开。其中接头前肽来自一种防卫素和/或一种橡胶蛋白类型的抗菌肽,该前肽提供一个裂解位点,表达的多蛋白在该位点被翻译后加工成各组分蛋白分子。
在这里,特别优选使用如图2中所描述的Dm-AMP1和Ac-AMP2来源的C-末端前肽作为可裂解的连接物,即提供一个可裂解的连接位点。可能有必要按照前肽的选择,在任一端或两端都设计一个额外的特异性蛋白酶识别位点,以利于序列的裂解。适当的特异性蛋白酶识别位点包括枯草杆菌蛋白酶样蛋白酶识别位点,识别一个由两个碱性残基组成的二肽序列,或一个由一个疏水残基、任一残基、一个碱性残基和一个碱性残基组成的四肽序列或一个由一个碱性残基、任一残基、一个碱性残基和一个碱性残基组成的四肽。在本发明的方法中尤其优选使用枯草杆菌蛋白酶样蛋白酶识别位点。
根据本发明的一个更优选的实施方案,进一步提供了一种在转基因植物中表达多个蛋白的方法,包括在所述植物的基因组插入一个DNA序列,该DNA序列包含一个启动子区域连接一个信号序列。该信号序列被连接到两个或多个蛋白编码区和一个3′-终止区,其中所述的蛋白编码区由一个编码接头前肽的DNA序列相互分隔开。所述前肽提供了一个裂解位点,表达的多蛋白在该位点被翻译后加工成各组分蛋白分子。其中已经在该接头前肽的任一端或两端设计了一个额外的特异性蛋白酶识别位点,以利于序列的裂解。
根据本发明的一个更优选的实施方案,进一步提供了一种在转基因植物中表达多个蛋白的方法,包括在所述植物的基因组插入一个DNA序列,该DNA序列包含一个启动子区域连接一个信号序列。该信号序列被连接到两个或多个蛋白编码区和一个3′-终止区,其中所述的蛋白编码区由一个编码接头前肽的DNA序列相互分隔开。其中接头前肽来自一种防卫素和/或一种橡胶蛋白类型的抗菌肽,该前肽提供一个裂解位点,表达的多蛋白在该位点被翻译后加工成各组分蛋白分子。其中已经在该接头前肽的任一端或两端设计了一个额外的特异性蛋白酶识别位点,以利于序列的裂解。
本发明进一步提供使用从植物来源蛋白中分离的前肽,作为转基因植物中通过分泌途径合成的多蛋白前体中的可裂解连接物。前肽优选从一种植物防卫素或一种橡胶蛋白类型的抗菌肽的前体中分离(Broekaert等1997,植物科学综述评论16,297-323)。前肽可能也优选从一种来源于凤仙花属植物的抗菌肽中分离。
在本发明的另一个方面,提供使用一种前肽作为转基因植物通过分泌途径合成的多蛋白前体中的可裂解连接物。其中至少40%的前肽序列由选自丙氨酸、缬氨酸、异亮氨酸、甲硫氨酸、亮氨酸、苯丙氨酸、色氨酸和酪氨酸的2到5个连续疏水残基的延伸或者选自天冬氨酸、谷氨酸、赖氨酸、精氨酸、组氨酸、丝氨酸、苏氨酸、谷氨酰胺和天冬酰胺的2到5个亲水残基的延伸组成。
更优选接头前肽在其N-末端或C-末端断裂位点的7个氨基酸内有一个具有2到5个连续酸性残基、2到5个碱性残基或者2到5个连续的混合酸碱性残基的序列。
尤其优选接头前肽的序列至少有40%由选自丙氨酸、缬氨酸、异亮氨酸、甲硫氨酸、亮氨酸、苯丙氨酸、色氨酸和酪氨酸的2到5个连续疏水残基的延伸或者选自天冬氨酸、谷氨酸、赖氨酸、精氨酸、组氨酸、丝氨酸、苏氨酸、谷氨酰胺和天冬酰胺的2到5个亲水残基的延伸组成。并且接头前肽在它N-或C-末端裂解位点的7个残基内有一个具有2到5个连续酸性残基、2到5个碱性残基或者2到5个连续的混合酸碱性残基序列。
在本发明的一个深入的方面,提供使用一种肽序列作为一个可裂解的接头序列,该肽序列富含小氨基酸A,V,S和T,并且包含由两个酸性残基、两个碱性残基或一个酸性残基和一个碱性残基所组成的二肽序列。其中所述的序列是从一种植物防卫素或一种橡胶蛋白类型的抗菌蛋白中分离的。
本发明的方法可以用来获得任何期望蛋白的有效表达和分泌,并且尤其适合表达那些必须在分泌途径自然合成以便被折叠成一种功能形式的蛋白质,例如糖基化蛋白和那些有二硫键的蛋白。另外,非常有利于参与病原体侵袭植物引起的防卫作用的蛋白被有效地分泌到细胞外间隙,因为这通常是病原体攻击的最初位点。发明的这些方法为多个蛋白的细胞外运送提供了一种有效的手段。
本发明的方法还尤其适合生产小肽,生产的小肽然后可以用于防染处理目的。即,转基因植物或其来源的种子可以直接被用来作为食品,从而被动免疫受者。
根据本发明的方法,能够表达的蛋白例子包括抗真菌蛋白,其在国际专利申请公告WO92/15691,WO92/21699,WO93/05153,WO93/04586,WO94/11511,WO95/04754,WO95/18229,WO95/24486,WO97/21814和WO97/21815中有所描述,抗真菌蛋白包括Rs-AFP1,Rs-AFP2,Dm-AMP1,Dm-AMP2,Hs-AFP1,Ah-AMP1,Ct-AMP1,Ct-AMP2,Bn-AFP1,Bn-AFP2,Br-AFP1,Br-AFP2,Sa-AFP1,Sa-AFP2,Cb-AMP1,Cb-AMP2,Ca-AMP1,Bm-AMP1,Ace-AMP1,Ac-AMP1,Ac-AMP2,Mj-AMP1,Mj-AMP2,Ib-AMP1,Ib-AMP2,Ib-AMP3,Ib-AMP4,PR-1类型的蛋白,例如壳多糖酶,葡聚糖酶如β-3和β-1,6葡聚糖酶,壳质结合的凝集素,玉米素,渗透蛋白,硫堇和核糖体非活性蛋白以及从它们或抗真菌蛋白来源的表现85%序列同一性的肽,优选超过90%的序列同一性,更优选大于95%的序列同一性的任何所述蛋白,其中序的列同一性如上面所规定。
可裂解的接头用来连接两个或多个感兴趣的蛋白并提供裂解位点使多蛋白翻译后在此加工成各组分蛋白分子。
在本发明的一个深入的方面提供了一个DNA构建体,该构建体所包括的一个DNA序列包含有一个启动子区连接一个植物来源的信号序列,所述信号序列被连接到两个或多个蛋白编码区和一个3′-终止区,其中所述的蛋白编码区由一个编码接头前肽的DNA序列相互分隔开。其中所述的接头前肽提供一个翻译后裂解位点。
适合地,蛋白编码区编码不同蛋白。前肽接头序列的优选实施例如上详述。
在本发明这方面的一个优选的实施方案中提供了一种DNA构建体,其中所述编码接头前肽的DNA序列编码一个来自Ib-AMP基因的内部前肽。在本发明这方面的一个更加优选的实施方案中提供了一种DNA构建体,其中所述编码接头前肽的DNA序列编码来自Dm-AMP或Ac-AMP基因的C-末端前肽。
在本发明的一个特别优选的实施方案中提供了如上所述的一种DNA构建体,其中当编码接头前肽的DNA序列来源于Dm-AMP基因或Ac-AMP基因时,其在任一端点或两个端点都额外包括一个或多个蛋白酶识别位点。
在本发明的一个深入方面提供了一种DNA构建体,该构建体所包括的一个DNA序列包含有一个启动子区连接到两个或多个蛋白编码区和一个3'-终止区,其中所述的蛋白编码区由一个编码接头前肽的DNA序列相互分隔开,该DNA序列编码来源于Dm-AMP基因或Ac-AMP基因的C-末端前肽。其中所述的接头前肽提供一个翻译后裂解位点。
在本发明的一个特别优选的实施例中提供了如上所述的一种DNA构建体,其中来源于Dm-AMP基因或Ac-AMP基因的编码接头前肽的DNA序列,在其任一端点或两个端点都额外包括一个或多个蛋白酶识别位点。
在本发明的另一个深入方面,提供了一种根据本发明上述任意方面的DNA构建体所转化的转基因植物。
在本发明的一个深入方面提供了由一个DNA序列转化的一种转基因植物,该DNA序列包含有一个启动子区连接到一个信号序列,所述信号序列被连接到两个或多个蛋白编码区和一个3'-终止区,其中所述的蛋白编码区由一个编码接头前肽的DNA序列相互分隔开。其中所述的接头前肽在翻译上提供了一个裂解位点。
在这方面的一个优选的实施例,所述接头前肽至少有40%的序列由选自丙氨酸、缬氨酸、异亮氨酸、甲硫氨酸、亮氨酸、苯丙氨酸、色氨酸和酪氨酸的2到5个连续疏水残基的延伸或者选自天冬氨酸、谷氨酸、赖氨酸、精氨酸、组氨酸、丝氨酸、苏氨酸、谷氨酰胺和天冬酰胺的2到5个亲水残基的延伸组成。
所述疏水残基优选丙氨酸、缬氨酸、亮氨酸、甲硫氨酸和/或异亮氨酸,而所述亲水残基优选天冬氨酸、谷氨酸、赖氨酸和/或精氨酸。
更优选接头前肽在其N-末端或C-末端断裂位点的7个氨基酸内有一个具有2到5个连续酸性残基、2到5个碱性残基或者2到5个连续的混合酸碱性残基的序列。
特别优选接头前肽至少有40%的序列由选自丙氨酸、缬氨酸、异亮氨酸、甲硫氨酸、亮氨酸、苯丙氨酸、色氨酸和酪氨酸的2到5个连续疏水残基的延伸或者选自天冬氨酸、谷氨酸、赖氨酸、精氨酸、组氨酸、丝氨酸、苏氨酸、谷氨酰胺和天冬酰胺的2到5个亲水残基的延伸组成。并且接头前肽在它N-或C-末端裂解位点的7个残基内有一个具有2到5个连续酸性残基、2到5个碱性残基或者2到5个连续的混合酸碱性残基序列。
在本发明这方面的一个更优选的实施方案中,提供裂解位点的DNA序列编码一个肽序列,该肽序列富含小氨基酸A,V,S和T,并且包含由两个酸性残基、两个碱性残基或一个酸性残基和一个碱性残基所组成的二肽序列。
在本发明这方面的一个特别优选的实施方案中,提供裂解位点的DNA序列编码一个来源于Ib-AMP基因的肽序列,例如图2所述。在本发明这方面的一个更加特别优选的实施方案中,提供裂解位点的DNA序列编码来自如图2所述的Dm-AMP1和Ac-AMP2的C-末端前肽,该C-末端前肽可能被随意设计包含有一个编码枯草杆菌蛋白酶-样蛋白酶识别位点的DNA序列。
本发明的一个深入方面提供了一个包含上述DNA构建体的载体。
这里所描述的某些接头序列是新的,这些接头序列及其编码序列形成了本发明的一个深入的方面。因此,特别提供了一种核酸,其编码SEQ ID NO 4,6,7,29,21,22,23,24,25,26,27,28的一个接头前肽或图34所示的接头前肽及其变体。特殊的变体在C-末端连接有SEQ ID NO 77。
正如本领域的技术人员将明显看到的那样,DNA序列的各组分的序列,即,根据本发明方法所用的信号序列、接头序列、蛋白序列、终止子序列可以从它的已知氨基酸序列来预测,编码蛋白的DNA可以用一种标准的核酸合成仪来制造。可替代地,编码本发明各组分的DNA可以从自然资源中适当分离产生。
通过引用下列非限制的实施例和附图来进一步阐明本发明。其中

图1示DmAMP1基因编码区的核酸序列(SEQ ID NO 1)和相应的氨基酸序列(SEQ ID NO 2)。相应于成熟DmAMP1的氨基酸被下划线。相应于内含子的核酸下划双线。
图2示来自载体结构的编码区(SEQ ID NO 3-8)的简图。在内部前肽下面的氨基酸序列代表接头前肽所来源的前肽序列。
图3显示了植物转化载体pFAJ3105的图示。
图4显示了植物转化载体pFAJ3106的图示。
图5显示了植物转化载体pFAJ3107的图示。
图6显示了植物转化载体pFAJ3108的图示。
图7显示了植物转化载体pFAJ3109的图示。
图8显示了包含在pFAJ3105质粒NcoⅠ和SacⅠ位点之间的开放阅读框区域的核酸序列(SEQ ID NO 9)和相应的氨基酸序列(SEQID NO 10)。在相应于成熟DmAMP1和成熟RsAFP2的氨基酸下面分别划单线和双线。
图9显示了包含在pFAJ3106质粒NcoⅠ和SacⅠ位点之间的开放阅读框区域的核酸序列(SEQ ID NO 11)和相应的氨基酸序列(SEQID NO 12)。在相应于成熟DmAMP1和成熟RsAFP2的氨基酸下面分别划单线和双线。
图10显示了包含在pFAJ3107质粒NcoⅠ和SacⅠ位点之间的开放阅读框区域的核酸序列(SEQ ID NO 13)和相应的氨基酸序列(SEQID NO 14)。在相应于成熟DmAMP1和成熟RsAFP2的氨基酸下面分别划单线和双线。
图11显示了包含在pFAJ3108质粒NcoⅠ和SacⅠ位点之间的开放阅读框区域的核酸序列(SEQ ID NO 15)和相应的氨基酸序列(SEQID NO 16)。在相应于成熟DmAMP1和成熟RsAFP2的氨基酸下面分别划单线和双线。
图12显示了包含在pFAJ3109质粒NcoⅠ和SacⅠ位点之间的开放阅读框区域的核酸序列(SEQ ID NO 17)和相应的氨基酸序列(SEQID NO 18)。在相应于成熟DmAMP1的氨基酸下面划线。
图13显示了一些用构建的pFAJ3105转化的转基因植物和一些用构建的pFAJ3109转化的转基因个体的Dm-AMP1表达水平(作为总的可溶性蛋白的百分比)。
图14显示了对用pFAJ3105(A)或pFAJ3109(B)转化的叶子粗提物的C8-二氧化硅柱进行的反相-高压液相色谱(RP-HPLC)分析。提取物如材料和方法中所述来制备。用0.1%三氟乙酸中一定浓度梯度的乙腈来洗脱柱子(0-35分钟,15%-50%的乙腈溶在0.1%的三氟乙酸中)。洗脱物被即时监测以测定214nm的光吸收(上部的轨迹图),分级分离,并进行酶联免疫吸附测定来检测DmAMP1(下部的柱状图,实心柱)和RsAFP2(下部的柱状图,空心柱)。用箭头在A214色谱图上表示出DmAMP1和RsAFP2确切的洗脱位置。
图15显示了用3105构建使转化的拟南芥属植物(转化株14)细胞外液体部分的反相色谱(RPC)结果。反相色谱法在一个用0.1%三氟乙酸平衡的C8-二氧化硅柱(Microsorb-MV,4.6×250mm,Rainin)上实行。装柱后,以1ml/min的流速用0.1%的三氟乙酸洗脱柱子20分钟,然后应用在0.1%三氟乙酸中15%到50%线性梯度的乙腈洗脱35分钟。即时测定280nm的光吸收(实线)并用一个传导监控器即时测定乙腈的浓度(虚线)。收集各部分并用酶联免疫吸附测定来检测DmAMP1-CRP和RsAFP2-CRP。使用粗体的峰号表示DmAMP1-CRP的存在,用斜体的峰号表示RsAFP2-CRP的存在。
图16显示了用3105构建体转化的拟南芥属植物(转化株14)的提取物的反相色谱(RPC)结果。样品是来自离子交换色谱法的两个不同的部分,指示DmAMP1-CRPs或RsAFP2-CRPs的存在,也就是说,那些部分在0.17-0.33M的NaCl(A)和0.33-0.49M的NaCl之间洗脱。反相色谱法按照图14的图注实行。即时测定280nm的光吸收(实线)并用一个传导监控器即时测定乙腈的浓度(虚线)。收集各部分并用酶联免疫吸附测定来检测DmAMP1-CRP和RsAFP2-CRP。使用粗体的峰号表示DmAMP1-CRP的存在,用斜体的峰号表示RsAFP2-CRP的存在。
图17显示了由pFAJ3105、pFAJ3106和pFAJ3108构建体编码的多蛋白前体的氨基酸序列。虚线表示为了简洁而从完整序列作了省略。斜体书写的序列是DmAMP1的引导肽,下划线的序列是成熟的DmAMP1,黑体的序列是接头肽。下划双线的序列是成熟的RsAFP2。箭头指代根据N-末端测序和纯化的DmAMP1-CRP和RsAFP2-CRP的质谱分析得到的加工位点。
图18显示了用pFAJ3106构建体转化的拟南芥属植物(转化株9)细胞外液体部分的反相色谱(RPC)结果。反相色谱法的执行和各部分的分析如图15的图注所述。使用粗体的峰号表示DmAMP1-CRP的存在,用斜体的峰号表示RsAFP2-CRP的存在。
图19显示了用3108构建体转化的拟南芥属植物(转化株9)提取物的反相色谱(RPC)结果。样品是来自离子交换色谱法的一个部分,指示DmAMP1-CRPs或RsAFP2-CRPs的存在,也就是说,那些部分在0.17-0.33M的NaCl之间洗脱并指示DmAMP1-CRPs的存在。反相色谱法的执行和各部分的分析如图15的图注所述。使用粗体的峰号表示DmAMP1-CRP的存在。
图20是pFAJ3105、pFAJ3343、pFAJ3344、pFAJ3345、pFAJ3346和pFAJ3369构建体的编码区示意图。完整的箭头表示实验确定的裂解位点。开放的箭头表示假定的裂解位点。缩写词SP DmAMP1:DmAMP1的信号肽区(参见图1);DmAMP1:DmAMP1的成熟蛋白区(参见图1);RsAFP2:RsAFP2的成熟蛋白区(Terras等,1995,植物细胞,7,573-588)。充分出示了接头肽序列(SEQ ID NO 3,29,21-24分别出示)。
图21是具有SEQ ID NO 24接头肽的pFAJ3367构建体编码区的示意图。缩写词SP DmAMP1:DmAMP1的信号肽区(参见图1);DmAMP1:DmAMP1的成熟蛋白区(参见图1);RsAFP2:RsAFP2的成熟蛋白区(Terras等,1995,植物细胞,7,573-588);HsAFP1:HsAFP1的成熟蛋白区(Osborn等,1995,欧洲生物化学协会联合会刊368,257-262);AceAMP1:AceAMP1的成熟蛋白区(Cammue等,植物生理学109,445-455)。
图22是pFAJ3106-2、pFAJ3107-2和pFAJ3108-2构建体编码区的示意图。缩写词SP DmAMP1:DmAMP1的信号肽区(参见图1);DmAMP1:DmAMP1的成熟蛋白区(参见图1);RsAFP2:RsAFP2的成熟蛋白区(Terras等,1995,植物细胞,7,573-588);RSKex2p:Kex2蛋白酶的识别序列(IGKR)(Jiang和Rogers,1999,植物生理学18,23-32);AcAMP1:AcAMP1的成熟蛋白区(De Bolle等,植物分子生物学31,997-1008)。接头前肽序列如SEQ ID NOs 25,26和27中所分别充分展示的那样。
图23是pFAJ3368和pFAJ3370构建体编码区的示意图。开放箭头指示假定的裂解位点。缩写词SP DmAMP1:DmAMP1的信号肽区(参见图1);DmAMP1:DmAMP1的成熟蛋白区(参见图1);RsAFP2:RsAFP2的成熟蛋白区(Terras等,1995,植物细胞,7,573-588);2A序列口蹄疫病毒多蛋白的裂解识别位点。接头前肽序列如SEQ IDNO 28中所分别充分展示的那样。
图24显示了包含在pFAJ3343质粒NcoⅠ和SacⅠ位点之间的开放阅读框区域的核酸序列(SEQ ID NO 30)和相应的氨基酸序列(SEQID NO 31)。在相应于成熟DmAMP1和成熟RsAFP2的氨基酸下面分别划单线和双线。相应于内部接头肽的氨基酸用粗体(SEQ ID NO29)。
图25显示了包含在pFAJ3344质粒NcoⅠ和SacⅠ位点之间的开放阅读框区域的核酸序列(SEQ ID NO 32)和相应的氨基酸序列(SEQID NO 33)。在相应于成熟DmAMP1和成熟RsAFP2的氨基酸下面分别划单线和双线。相应于内部接头肽的氨基酸用粗体(SEQ ID NO21)。
图26显示了包含在pFAJ3345质粒NcoⅠ和SacⅠ位点之间的开放阅读框区域的核酸序列(SEQ ID NO 34)和相应的氨基酸序列(SEQID NO 35)。在相应于成熟DmAMP1和成熟RsAFP2的氨基酸下面分别划单线和双线。相应于内部接头肽的氨基酸用粗体(SEQ ID NO22)。
图27显示了包含在pFAJ3346质粒NcoⅠ和SacⅠ位点之间的开放阅读框区域的核酸序列(SEQ ID NO 36)和相应的氨基酸序列(SEQID NO 37)。在相应于成熟DmAMP1和成熟RsAFP2的氨基酸下面分别划单线和双线。相应于内部接头肽的氨基酸用粗体(SEQ ID NO23)。
图28显示了包含在pFAJ3369质粒NcoⅠ和SacⅠ位点之间的开放阅读框区域的核酸序列(SEQ ID NO 38)和相应的氨基酸序列(SEQID NO 39)。在相应于成熟DmAMP1和成熟RsAFP2的氨基酸下面分别划单线和双线。相应于内部接头肽的氨基酸用粗体(SEQ ID NO24)。
图29显示了包含在pFAJ3347质粒NcoⅠ和SacⅠ位点之间的开放阅读框区域的核酸序列和相应的氨基酸序列。在相应于成熟DmAMP1、成熟RsAFP2、成熟HsAFP1和成熟AceAMP1的氨基酸下面分别划单线、双线、虚线和点线。相应于内部接头肽的氨基酸用粗体(SEQID NO 24)。
图30显示了包含在pFAJ3106-2质粒NcoⅠ和SacⅠ位点之间的开放阅读框区域的核酸序列(SEQ ID NO 42)和相应的氨基酸序列(SEQID NO 43)。在相应于成熟DmAMP1和成熟RsAFP2的氨基酸下面分别划单线和双线。相应于内部接头肽的氨基酸用粗体(SEQ ID NO 4)。
图31显示了包含在pFAJ3107-2质粒NcoⅠ和SacⅠ位点之间的开放阅读框区域的核酸序列(SEQ ID NO 44)和相应的氨基酸序列(SEQID NO 45)。在相应于成熟DmAMP1和成熟RsAFP2的氨基酸下面分别划单线和双线。相应于内部接头肽的氨基酸用粗体(SEQ ID NO 6)。
图32显示了包含在pFAJ3108-2质粒NcoⅠ和SacⅠ位点之间的开放阅读框区域的核酸序列(SEQ ID NO 46)和相应的氨基酸序列(SEQID NO 47)。在相应于成熟DmAMP1和成熟RsAFP2的氨基酸下面分别划单线和双线。相应于内部接头肽的氨基酸用粗体(SEQ ID NO 7)。
图33显示了包含在pFAJ3370质粒NcoⅠ和SacⅠ位点之间的开放阅读框区域的核酸序列(SEQ ID NO 48)和相应的氨基酸序列(SEQID NO 49)。在相应于成熟DmAMP1和成熟RsAFP2的氨基酸下面分别划单线和双线。接头肽用粗体字体表示(SEQ ID NO 28),并具有用粗斜体表示的相应于2A序列的氨基酸。
图34显示了包含在pFAJ3368质粒NcoⅠ和SacⅠ位点之间的开放阅读框区域的核酸序列(SEQ ID NO 50)和相应的氨基酸序列(SEQID NO 51)。在相应于成熟DmAMP1和成熟RsAFP2的氨基酸下面分别划单线和双线。相应于内部接头肽的氨基酸用粗体(SEQ ID NO24)。接头肽用粗体字体表示,并具有用粗斜体表示的相应于2A序列的氨基酸。
下列实施例对本发明进行说明。
实施例1克隆DmAMP1 cDNA和DmAMP1基因克隆程序和多聚酶链反应(PCR)程序按标准规程执行(Sambrook等,1989,分子克隆实验手册,第2版,Cold Spring Harbor实验室出版,Cold Spring Harbor,纽约)。用从光滑大丽花(Dahliamerckii)收集的接近干燥的种子建立一个cDNA文库。用Jepson I等人的方法(1991,植物分子生物学报告9,131-138),从这些种子中纯化出总RNA。从2g的光滑大丽花种子中获得0.6mg的总RNA。用PolyATract磁珠(Promega)从0.2mg总RNA中分离出将近2μg的poly-A+RNA。
利用一个ZAP-cDNA合成试剂盒(Stratagene),用poly-A+RNA构建一个cDNA文库。在第一和第二股链合成之后,把cDNA和载体DNA连接在一起。在用Gigapack Gold(Stratagene)包裹提取物进行的噬菌体组装之后,得到将近1×105个噬菌斑形成单位(pfu)。使用基于DmAMP1的N-末端序列CEKASKTW(SEQ ID NO.14)的寡核苷酸AFP-5(5’-TG(T,C)GANAANGCN(A,T)(G,C)NAA(A,G)ACNTGG)(SEQ ID NO.13)(Osborn R.W.等,1995,欧洲生物化学协会联合会刊368,257-262)和基于DmAMP1的C-末端序列MCFCYFNC(SEQ ID NO.53)的AFP-3EX(5’-CA(A,G)AANTANCANAAA(A,G)CACAT)(SEQ ID NO.52)以及从光滑大丽花叶子中分离的基因组DNA,生成一种144个碱基对的PCR产物,并从琼脂糖凝胶中分离出来。PCR产物被克隆进pBluescript。插入的10个转化体被测序。序列代表3个近乎同源的DmAMP1-类基因,其中的PCR克隆4编码所观察到的成熟DmAMP1。用32P CTP标记的144个碱基对的PCR产物混合物被用来探测从含有cDNA文库总共6×104个噬菌斑形成单位的培养盘中制得的Hybond N(Amersham)滤片。获得了30个可能的阳性信号。挑取22个噬菌斑并再进行两轮的筛选。体内切除后,13个克隆通过DNA测序来表征。4类DmAMP1相关肽由13个cDNA克隆编码。三种形式的DmAMP1成熟蛋白区在4种类型中体现。一种类型(Dm2.5类型)包括一个可能相应于DmAMP2的成熟蛋白区(OsbornR.W.等,1995,欧洲生物化学协会联合会刊368,257-262)。没有一个cDNA编码一种相当于所观察的成熟DmAMP1肽序列的成熟蛋白区。
应用PCR克隆4的序列(上述)和从cDNA推论的肽N-末端和C-末端信息,设计了两对寡核甘酸用于扩增编码DmAMP1的基因。来自光滑大丽花的基因组DNA与寡核甘酸MATAFP-5P(5’-ATGGC(C,G)AAN(A,C)(A,G)NTC(A,G)GTTGCNTT)(SEQ ID NO.66)和MATAFP-5(5’-AAACACATGTGTTTCCCATT)(SEQ ID NO.54)一起被应用于PCR反应,PCR产物被克隆到pBluescript并对克隆测序。含有DmAMP1基因5’部分的一个克隆被鉴定。来自光滑大丽花的基因组DNA与MATAFP-3(5’-AGCGTGTCATGTGCGTAAT)(SEQ ID NO.55)和DM25MAT-3(5’-TAAAGAAACCGACCCTTTCACGG)(SEQ ID NO.56)一起被用于PCR反应,PCR产物被克隆到pBluescript并对克隆测序。含有DmAMP1基因5’部分的一个克隆被鉴定。成熟基因的5’和3’区域被结合起来组装DmAMP1基因的编码区序列(图1)。
DmAMP1基因编码的前体含有一个28个氨基酸的引导肽、一个50个氨基酸的成熟蛋白和一个40个氨基酸的C-末端前肽。开放阅读框被定位在引导肽区域内部的一个92个碱基对的内含子打断。为了从DmAMP1基因序列中删除内含子,并允许把含有或不合C-末端前肽区的DmAMP1的编码区克隆进一个表达盒载体,执行了两个PCR反应。其分别用引物DMVEC-3(5’ATGCATCCATGGTGAATCGGTTGCGTTCTCCGCGTTCGTTCTGATCCTTTCGTGCTCGATCTCAGATATCGCATCCGTTAGTGGAGAACTATGCGAGAAA)(SEQ ID NO.57)和DMVEC-2(5’AAACCGACCGAGCTCACGGATGTTCAACGTTTGGAAC)(SEQ ID NO.58),以及DMVEC-3和DMVEC4(5’-AGCAAGCTTTTCGGGAGCTCAATTGAAGTAA)(SEQ ID NO.59)。DMVEC-3引导DmAMP1基因的顶部链,相应于没有内含子的引导肽区并在转录起点导入一个NcoⅠ位点。DMVEC-2基因引导DmAMP1基因底部链3’-末端的C-末端前肽区并在转录停止密码子的后面导入一个SacⅠ位点。DMVEC-4基因引导DmAMP1基因底部链3’-末端的成熟蛋白区,并且在该区后面融合一个终止密码,在终止密码子的后面导入一个SacⅠ位点。
两个PCR产物都用NcoⅠ和SacⅠ切割,它们由于成熟蛋白区的一个内部NcoⅠ位点的存在而把PCR产物裂解成两个片段。产生的NcoⅠ-SacⅠ和NcoⅠ-NcoⅠ片段被顺序地克隆到pMJB1质粒。pMJB1质粒是一个表达盒载体,依次含有一个HindⅢ位点,增强的花椰花椰菜叶病35S RNA(CaMV35S)启动子(Kay R等,1987,科学236,1299-1302),一个XhoⅠ位点,烟草花叶病毒(TMV)5’未翻译的引导序列(Gallie D.R.和Walbot V.,1992,核酸相关研究20,4631-4638),一个多聚连接物包括NcoⅠ、SmaⅠ、KpnⅠ和SacⅠ位点,根瘤菌3’未翻译的终止区(Bevan M.W.等,1983,自然304,184-187)以及一个EcoRⅠ位点。产生的质粒被分别称为pDMAMPE(引导肽区,成熟蛋白区和C-末端前肽区)和pDMAMPD(引导肽区和成熟蛋白区)。编码区通过DNA测序来鉴定。
实施例2构建植物转化载体为了研究在植物中表达多蛋白基因的可能性,使四个不同植物转化载体与两个不同的植物防卫素共表达。这两个具有抗真菌特性并富含半胱氨酸的植物防卫素就是RsAFP2和DmAMP1.来自DmAMP1 cDNA的一个引导肽,DmAMP1的成熟蛋白区,一个内部前肽区和RsAFP2的成熟蛋白区都是这些构建物的多蛋白前体区的特征。四种构建体只有内部前肽不同(图2)。
·3105构建体用IbAMP的一个内部前肽分隔DmAMP1和RsAFP2。
·3106构建体在C-末端有一个前肽,由DmAMP1前肽的一部分和一个假定的枯草杆菌蛋白酶-样蛋白酶加工位点(IGKR)(SEQ ID NO.67)组成。
·3107构建体除了采用完整的DmAMP1前肽以外,其它与3106结构相同。
·3108构建体在C-末端有一个前肽,由DmAMP1前肽和一个假定的枯草杆菌蛋白酶-样蛋白酶加工位点(IGKR)组成。
3106,3107和3108构建物的理论基础是基于我们的发现,当在烟草中分别作为Ac-AMP21-和DmAMP1-前蛋白原表达时,AcAMP2和DmAMP1的C-末端前肽在N-末端被裂解掉,而这种加工不减少成熟蛋白到非原生质体的分配(De Bolle等,1996,植物分子生物学31,993-1008;R.W.Osborn和S.Attenborough,个人通讯)。这表示加工酶在分泌途径或在非原生质体中。另一方面,这些构建体内部前肽C-末端的裂解可能由一个枯草杆菌蛋白酶样的蛋白酶执行,已知酵母中的一个这样的蛋白酶成员(Kex2)在高尔基器裂解蛋白(Wilcox C.A和Fuller R.S.,1991,细胞生物学杂志115,297),而番茄中的一个成员在非原质体执行裂解(Tornero P.等,1997,生物化学杂志272,14412-14419)。在非原生质体沉积的蛋白通常通过包括高尔基器的分泌途径合成。非原生质体是设计在转基因植物中的抗菌蛋白更喜欢的沉积位点(Jongedijk E等,1995,Euphytica 85,173-180;De Bolle等,1996,植物分子生物学31,993-1008)。也构建一个只表达DMAMP1的构建体(3109构建体,图7)。
图3-7分别显示了所制备的植物转化载体pFAJ3105、pFAJ3106、pFAJ3107、pFAJ3108和pFAJ3109的示意图。包含在这些质粒XhoⅠ和SacⅠ位点之间的核甘酸序列,包括抗菌蛋白编码区,在图8-13中介绍。包含在pFAJ3105质粒XhoⅠ和SacⅠ位点之间的区域(图8所示),按照Pont-Kindom G.A.D.的两步PCR程序(1994,生物技术16,1010-1011)来构建。引物OWB175(5’AGGAAGTTCATTTGG)和(SEQ ID NO.68),OWB278(5’GCCTTTGGCACAACTTCTGTCCTGGCTCCACGTCCTCTGGGGTAGCCACCTCGTCAGCAGCGTTGGAACAATTGAAGTAACAAACAC)(SEQ ID NO.60)在第一个PCR反应中被应用,并用质粒pDMAMPE作为模板。第二个PCR反应使用质粒pFRG4(Terras F.R.G.等,1995,植物细胞7,573-588)作为模板,用第一个PCR反应产物、引物OWB175和引物OWB172(5’TTAGAGCTCCTATTAACAAGGAAAGTAGC(SEQ ID NO.61),SacⅠ位点下划线)的混合物作为引物。形成的PCR产物用XhoⅠ和SacⅠ消化并克隆到表达盒载体pMJB1(参见上面)。所产生的质粒被称作pFAJ3099,其中的表达盒用HindⅢ(侧面连接花椰花椰菜叶病毒35S启动子的5’末端)和EcoRⅠ(侧面连接胭脂碱合成酶终止子的3’末端)来消化,并克隆到植物转化载体pGPTVbar的相应位点(Becker D等,1992,植物分子生物学20,1195-1197)以产生pFAJ3105质粒。
质粒pFAJ3106、pFAJ3107和pFAJ3108的构建类似,除了第一次PCR反应中的引物OWB278分别用下列引物代替OWB279( 5’GCCTTTGGCACAACTTCTGCCTCTTTCCGATGAGTTCGGCTTTAAGTTTGTC)(SEQ ID NO.62);OWB303(5’GCCTTTGGCACAACTTCTGCCTCTTTCCGATCGGAGTTCAACGTTTGGAACC)(SEQ ID NO.63);OWB304(5’GCCTTTGGCACAACTTCTGCCTCTTTCCGATAGTTTTGGTGGCAGCAACATCAGGCTTGGTGATCCACAGTAGTAGTACTGGCACAATTGAAGTAACAGAAACAC)(SEQ ID NO.64);质粒pFAJ3109是通过把质粒pDMAMPD的HindⅢ-EcoRⅠ片段(参见上面)克隆到植物转化载体pGPTVbar的相应位点(参见上面)来构建的。
实施例3植物转化按照Bechtold N.等的花序渗入法(1993,C.R.科学学会316,1194-1199),用重组的根瘤土壤杆菌转化拟南芥(Arabidopsisthaliana)的Columbia-O生态型。转化株在沙子/珍珠岩混合物中选择,用含有终浓度为5mg/l的除草剂Basta(Agrevo)的水地下灌溉以有活性膦丝菌素成分。
实施例4测定靶蛋白,包括酶联免疫吸附(ELISA)测定和蛋白分析在用RsAFP2(按照Tetras F.R.G.等,1992,生物化学杂志267,15301-15309中的描述纯化)或DmAMPl按照Osborn R.W.等,1995,欧洲生物化学协会联合会刊368,257-262中的描述纯化)注射的兔子体内引发抗血清。基本如Pennninckx I.A.M.A.等(1996,植物细胞8,2309-2323)所描述的那样,把酶联免疫吸附(ELISA)测定作为一种竞争型分析来建立。用溶在涂层缓冲液中的50ng/mlRsAFP2或DmAMPl来处理ELISA微量滴定板。初级抗血清在含3%(质量/体积)明胶和0.05%(体积比)Tween20的PBS中稀释成1000-和2000-倍的溶液(DmAMP1和RsAFP2,分别地)来使用。
总蛋白量根据Bradford(1976,生物化学年刊72,248-254)的方法,用牛血清白蛋白作为标准物来测量。
拟南芥植物的叶子在液氮中匀浆并用一种由10mM NaH2PO4、15mMNa2HPO4、100mM KCl、1.5mM NaCl组成的缓冲液抽提。组织匀浆在85℃加热10分钟并在冰上冷却。加热处理的提取物在15000×g离心15分钟并被注入到一个反相高压液相色谱柱(RT-HPLC),该柱由用0.1%(体积比)三氟乙酸(TFA)平衡过的C8二氧化硅(0.46×25cm,Rainin)组成。柱子以1ml/min的流速用0.1%(体积比)三氟乙酸中15%到50%(体积比)线性梯度的乙腈洗脱35分钟。测定洗脱物在214nm的光吸收,收集1ml的各级分,分级分离并在最后重新溶入水中。这些级分用于酶联免疫吸附(ELISA)测定。
实施例5制备细胞内提取物通过把拟南芥属植物的叶子浸入一个含有提取缓冲液(10mMNaH2PO4、15mM Na2HPO4、100mM KCl、1.5mM NaCl)的烧杯中,从植物叶子中收集细胞内液体。盛有叶子的烧杯被放在真空容器中并连续六轮抽真空2分钟,然后突然真空释放。浸透的叶子被轻轻地放到一个离心管里,与管底刻度分离。1800×g离心15分钟后从底部收集细胞内液体。将叶子再一次真空浸透并离心,得到的(细胞外)液体与第一步真空所得的部分结合。在这一步之后,在一个Phastprep(BI0101/Savant)往复震荡器中对叶子进行抽提,并且通过离心(10,000×g10分钟)净化抽提物。产生的上清被认为是胞内提取物。
在一系列用上述结构转化的T1转基因拟南芥属植物的叶子中,分析DmAMP1和RsAFP2的表达水平。在表1中给出上述基于酶联免疫吸附测定的表达分析结果。
表1Dm-AMP1和Rs-AFP2在转基因拟南芥属植侏中的表达水平
在上表不“nd”指未作实验。
大多用3105、3106、3107和3108多蛋白构建体转化的测试株,明显表达DmAMP1-CRPs(DmAMP1-交叉反应蛋白)和RsAFP2-CRPs(PsAFP2-交叉反应蛋白)。DmAMP1-CRP和RsAFP2-CRP表达水平之间基本上有一个很好的相关性。然而,RsAFP2-CRP的水平大体上比DmAMP1-CRP的水平低2-5倍。而检测抽提物中RsAFP2-CRPs的酶联免疫吸附测定不如DmAMP1-CRPs的酶联免疫吸附测定可信。在RsAFP2的酶联免疫吸附测定中,转基因植物提取物稀释液产生的剂量-反应曲线偏离了那些含有真正RsAFP2的标准稀释液的剂量-反应曲线,表明提取物中的大多数Rs-AFP2-CRPs在免疫学上不同于RsAFP2自身。用3106、3107和3108构建体转化的植物的提取物与用3105构建体转化的植物的提取物相比,前者从RsAFP2标准剂量-反应曲线的偏离更明显。
没有一种提取物在Dm-AMP1的酶联免疫吸附测定中,在剂量-反应曲线上偏离Dm-AMP1的标准物。用3105、3106、3107或3108多蛋白构建体转化的植株与那些用单一蛋白构建体3109转化的植株相比,前者的DmAMP-CRP水平远高于后者。这也在图3中举例说明,其中对用多蛋白构建体3105转化的植物的DmAMP1-CRP表达水平和用单一蛋白构建体3109转化的植物的DmAMP1-CRP表达水平进行了比较。迄今为止,还没有文献报道说转基因植物的一种肽的表达水平能高达总蛋白的4%(例如,植株3105-15和3105-18中的DmAMP1-CRP水平,参见表1)。因此,应用多蛋白构建体似乎导致了明显增强的表达水平,这是一个意外的发现。
实施例6分离从多蛋白前体加工的蛋白转基因植株选自用3105结构(植株1)或3106结构(植株2)转化的群体。并且所选植株被进一步繁殖以获得转基因纯合子植物。为了分析DmAMP1和RsAFP2在这些植株中是否被正确加工,如实施例1中所述制备植物的提取物并通过在C8-二氧化硅柱上进行的反相-高压液相色谱法来分离。收集各级分并如实施例4所述,用酶联免疫吸附测定鉴定是否存在与DmAMP1抗体或RsAFP2抗体有交叉反应的化合物。如图15所示,在用3105构建体转化以及用3106构建体转化植株中,DmAMP1-CRPs在一个与真正DmAMP1相同或非常相近的位置洗脱。同样,在3105和3106构建体的转化株中都检测到RsAFP2-CRPs在一个与真正RsAFP2相同或非常相近的位置洗脱。没有一种组分与抗-DmAMP1和抗-RsAFP2的抗体都反应,这表明提取物中不存在没有被裂解的融合蛋白。在非转化的植株中没有发现交叉反应的化合物。
这样看来,3105构建体(IbAMP内部前肽作为接头肽)和3106构建体(具有枯草杆菌蛋白酶-样蛋白酶位点的部分DmAMP1 C-末端前肽作为接头肽)转录单元的原始翻译产物以某种方式被加工,产生分离的DmAMP1-CRPs和RsAFP2-CRPs,在色谱性质上似乎分别与DmAMP1和RsAFP2相同或非常相近。
实施例7共表达的植物防卫素的亚细胞定位分析为了检测共表达的植物防卫素是被分泌到细胞外还是沉积在细胞内,从用3105构建体(植株2)、3106构建体(植株2)或3108构建体(植株12)转化的纯合子转基因阿布属植株的叶子中获得细胞外液和细胞内提取组分。细胞溶质的葡萄糖-6-磷酸脱氢酶被用作标记物,检测细胞外液被细胞内部组分污染的情况。如表2所示,葡萄糖-6-磷酸脱氢酶以大约80/20的比例在细胞内提取部分和细胞外液体部分之间分配。相反,发现所检测转基因植物的大多数DmAMP1-CRP和RsAFP2-CRP含量在细胞外液体部分中。这些结果表明,从多蛋白前体释放的两种植物防卫素都主要沉积在非原生质体。因此,所有多蛋白结构裂解的加工步骤一定在非原生质体或分泌途径即内质网、高尔基器或在高尔基器和非原生质体之间进行运输的小泡中发生。
表2从转基因拟南芥属植物获取的细胞外液(EF)和细胞内提取(IE)成分中,葡萄糖-6-磷酸脱氢酶(GPD)活性、DmAMP1和RsAFP2的相对丰度。构建体 相对丰度(%)1GPDDmAMP1 RsAFP2EFIEEFIE EFIEpFAJ31051783937928pFAJ31061783946604pFAJ310820809827525
1相对丰度用细胞外液和细胞内提取部分含量总和的百分数表示。
实施例8纯化从多蛋白前体3105构建体加工而来的蛋白来自3105构建体转化群体的转基因植株14被进一步繁殖,以获得转基因的纯合子植物。在这一转化植株叶子制备的细胞外液中,通过反相色谱技术纯化DmAMP1-CRPs和RsAFP2-CRPs。为了达到这个目的,叶子用一种含50mM MES(pH6)的缓冲液和一种蛋白酶抑制物混合物(1mM苯甲基磺酰氟,1mM N-乙基顺丁烯二酰亚胺,5mM EDTA和0.02mM胃酶抑素A)在真空浸透,离心收集细胞外液。用这一匀浆处理过程避免了将DmAMP1-CRPs和RsAFP2-CRPs暴露给隔开的蛋白酶。收集的细胞外液通过在C8-二氧化硅柱上(Microsorb-MV,4.6×250mm,Rainin)进行的反相-高压液相色谱来分析,分别用抗DmAMP1和RsAFP2的抗体,通过酶联免疫吸附测定检测各部分的DmAMP1-CRPs和RsAFP2-CRPs存在情况。图15显示了用3105构建体转化的拟南芥属转基因植株14的这种分析结果。DmAMP1-CRPs在两个峰洗脱,后一个洗脱峰的位置非常接近真正DmAMP1的洗脱位置。发现RsAFP2-CRPs在一个与DmAMP1-CRPs的峰很好分离的峰洗脱,并且洗脱位置非常接近真正RsAFP2的洗脱位置。没有一部分与抗-DmAMP1和抗-RsAFP2的抗体都反应,这表明细胞外液中不存在没有被裂解的融合蛋白。基于DmAMP1-CRPs和RsAFP2-CRPs的峰值面积分别与其他一系列由真正的DmAMP1和RsAFP2组成的标准物的峰值面积的比较,可以断定3105构建体转化株的提取物包含大约等量的DmAMP1-CRPs和RsAFP2-CRPs。通过分析从转基因株制备的细胞外液,得到非常相似的色谱图(结果未出示),表明DmAMP1-CRPs和RsAFP2-CRPs的色谱形式与所检测的转基因株无关。
为了检测基于细胞外液制备的纯化过程是否反映了转基因拟南芥植物叶子中DmAMP1-CRPs和RsAFP2-CRPs的真实组成,开发了一个替代的纯化过程,该过程从叶子的粗提物开始。为此目的,叶子在液氮中匀浆并用50mM含有一种蛋白酶抑制剂混合物(1mM苯甲基磺酰氟,1mM N-乙基顺丁烯二酰亚胺,5mM EDTA和0.02mM胃酶抑素A)的MES(pH6)提取。匀浆物通过离心(10000×g,10分钟)净化。上清然后通过离子交换层析(ICE)和随后的反相色谱分离(RPC)。在每次分离之后,收集各部分并用抗DmAMP1和RsAFP2的抗体通过两种不同的酶联免疫吸附测定分别检测DmAMP1-CRPs和RsAFP2-CRPs。通过使提取物经过一个pH6的阳离子交换柱(Mono S,5×50mm,Pharmacia),来进行离子交换层析。当用pH 6的50mM N-吗啉代乙磺酸(MES)中0-0.5M线性梯度的NaCl洗脱柱子时,在0.17-0.33MNaCl之间洗脱的部分检测有DmAMP1-CRPs,而RsAFP2-CRPs在0.24-0.49M NaCl之间洗脱。含有DmAMP1-CRPs或RsAFP2-CRPs的各级分被集中成两部分(0.17-0.33M NaCl;0.24-0.49M NaCl),其中每一部分都在C8-二氧化硅柱上(Microsorb-MV,4.6×250mm,Rainin)进行反相色谱分析,用一个线性浓度梯度的乙腈洗脱(图16)。DmAMP1-CRPs在两个峰洗脱,后一个洗脱峰的位置非常接近真正DmAMP1的洗脱位置。发现RsAFP2-CRPs在一个与DmAMP1-CRPs的峰很好分离的峰洗脱,并且洗脱位置非常接近真正RsAFP2的洗脱位置。仍然没有一部分与抗-DmAMP1和抗-RsAFP2的抗体都反应,表明提取物中不存在没有被裂解的融合蛋白。
从细胞外液纯化的不同DmAMP1-CRPs和RsAFP2-CRPs受到N-末端序列分析(程序如Cammue等在1992,生物化学杂志,2228-2233中描述)还受到基质辅助激光解吸流失电离时间(Matrix-assistedtaser desorption ioniration-time of flight)(MALDI-TOF)的质谱分析(Mann和Talbo,1996,当前生物技术评论7,11-19)。C-末端氨基酸的测定基于实验测得的预测理论质谱的最好近似值(表3)。较小的DmAMP1-CRPs,p3105EF1和较大的DmAMP1-CRP,p3105EF2(蛋白编码如图15和表3),都与成熟DmAMP1有完全相同的N-末端序列。p3105EF1和p3105EF2与真正的DmAMP1相比较,它们有与C-末端一个额外存在的丝氨酸残基相一致的色谱。然而,当p3105EF2的色谱(在实验误差内)完全相应于为具有一个C-末端丝氨酸的DmAMP1(此后称为DmAMP1+S)所预测的色谱时,p3105EF1的色谱对于DmAMP1+S的预测色谱,大约超过了8道尔顿。因此,蛋白可能是具有还原二硫键的DmAMP1+S衍生物。根据N-末端序列和质谱数据,RsAFP2-CRP的p3105EF3部分是一个在N-末端具有额外五肽序列DVEPG的RsAFP2衍生物。这个蛋白更多被称为DVEPG+RsAFP2。用同样的方法分析从总的叶子提取物中所纯化的不同DmAMP1-CRPs和RsAFP2-CRPs。分析结果表明总的叶子提取物中存在相同的分子形式,即DmAMP1+S,一种推定的DmAMP1+S还原形式,以及DVEPG+RsAFP2(参见下文实施例10的表3)。
包括主要加工产物的纯化级分,DmAMP1+S以及DVEPG+RsAFP2,分别根据Cammue等所述的方法(1992,生物化学267,2228-2233),用黄色镰孢(Fusarium culmorum)进行抗菌活性检测,以所检测生物体50%生长抑制所需要的蛋白浓度来表示特异的抗菌活性,DmAMP1+S与真正DmAMP1的特异抗菌活性相同。纯化DVEPG+RsAFP2的特异抗菌活性大约低于真正RsAFP2的2倍。DVEPG+RsAFP2抗菌活性的轻微下降很可能是由于N-末端5个氨基酸的存在。然而,我们的数据证明转基因植物中多蛋白前体的加工可能导致释放生物活性蛋白。
对3105构建体转化的植物中产生的AFPs进行分析,揭示前体显然通过三个裂解步骤来加工(图17)(ⅰ)前体在引导肽的C-末端以与作用于真正DmAMP1前体相同的方式进行裂解;(ⅱ)前体在接头肽第一个氨基酸的C-末端裂解,这样释放了DmAMP1+S;(ⅲ)前体在接头肽第五个末尾残基的N-末端进一步加工,这样释放了DVEPG+RsAFP2。还不知道哪些蛋白酶引起了这些观测的裂解,也不知道涉及了多少蛋白酶。接头肽的裂解可能只包括蛋白酶内切,或者是蛋白内切酶和在裂解产物末端进一步剪切的外肽酶协同作用的结果。接头肽C-末端的加工在E和D两个酸性残基之间进行,这对酸性残基可能是一个特异性蛋白内切酶的靶序列。以前已经从拟南芥植物种子中纯化了一种能够在两个连续酸性残基之间进行裂解的天冬氨酸蛋白内切酶(D’Hont等,1993,生物化学杂志268,20884-20891)。值得提到的是,在IbAMP1多蛋白前体的六个内部前肽中有五个的ED序列恰好发生在前肽的C-末端(Tailor等,1997,生物化学杂志272,24480-24487)。六个IbAMP1内部前肽中的一个,更准确说是在3105构建体中所用的那个,其ED序列不发生在前肽的C-末端,而被4个氨基酸从C-末端分开。凤仙花中这个前肽的加工可能包括ED序列的裂解以及随后用一种氨肽酶对所产生蛋白进行的N-末端局部修剪。
所期望的是,一种类似于3105构建体中应用的IbAMP1前肽但其ED二肽被移到C-末端的前肽,将产生一种裂解产物,该产物在内部前肽C-末端定位的蛋白中只有一个或没有额外的N-末端氨基酸。换句话说,C-末端已经具有一个ED序列的另一种IbAMP1前肽(Tailor等,1997,生物化学杂志272,24480-24487)或一个相关序列可以对加工的准确度提供同样的改进。
实施例9纯化从多蛋白前体结构pFAJ3106中加工而来的蛋白来自用pFAJ3106结构转化的拟南芥属植物群体的转基因株9被进一步繁殖,获得转基因的纯合子植物。通过反相色谱法从叶子细胞外液中纯化DmAMP1-CRPs和RsAFP2-CRPs,细胞外液的制备方法与上面实施例8所描述的pFAJ3105构建体转化株细胞外液的制备方法相同。在图18中显示了分离物的色谱图。DmAMP1-CRPs在两个峰洗脱,称为pFAJ3106EF1和pFAJ3106EF2,这两部分都与DmAMP1有相同的N-末端序列(参见下面实施例10的表3)。pFAJ3106EF2的质谱相应于为一个具有额外赖氨酸的DmAMP1衍生物所预测的质谱。因此我们断定它是前体在信号肽裂解位点和接头肽C-末端第一个残基(赖氨酸)之后进行裂解的产物;这个蛋白更多被称作DmAMP1+K。
通过N-末端氨基酸测序发现RsAFP2-CRP部分的起始序列是LIGKRQK。因此,这种被称为LIGKRQK+RsAFP2的蛋白,来源于前体N-末端在接头肽第六个末端残基(谷氨酰胺)的裂解。建议的参与加工pFAJ3106结构的裂解步骤如图17所示。
实施例10纯化从多蛋白前体构建体pFAJ3108中加工而来的蛋白来自用pFAJ3108构建体转化的拟南芥属植物群体的转基因株9被进一步繁殖,获得转基因的纯合子植物。按照一种基于上面实施例8所述的用于3105转化株的离子交换层析和反相色谱的程序,从这一转化株的叶子总粗提物中纯化DmAMP1-CRPs和RsAFP2-CRPs。在图19中显示了离子交换层析和反相色谱分离的色谱图。离子交换层析分离产生两个包含DmAMP1-CRPs的峰。然而,在任何一个洗脱级分都不能检测到RsAFP2-CRPs。因为用pFAJ3108结构转化的植物的粗提物和细胞外液部分明显存在RsAFP2-CRPs(参见表1和表2),所以RsAFP2-CRPs一定是在分离过程中丢失了。最可能的解释是,RsAFP2-CRPs没有被0.5M的NaCl从离子交换层析柱中洗脱出来,0.5M NaCl是洗脱梯度所用的最高浓度。含有DmAMP1-CRPs的成分通过反相色谱分离,产生两个DmAMP1-CRP峰。通过N-末端测序和MALDI-TOF色谱检测来分析这种成分,揭示它是一种C-末端具有一个额外丙氨酸的DmAMP1衍生物(DmAMP1+A)。这种蛋白是前体在信号肽裂解位点和接头肽C-末端第一个残基(丙氨酸)进行裂解的产物(图17)。
表3显示了如图15、16、18和19所述纯化的DmAMP1-CRP和RsAFP2-CRP成分,通过MALDI-TOF-质谱法或EI-质谱法测定的质谱以及通过自动化Edman降解测定的N-末端序列。也出示了在实验质谱和理论质谱之间给出最好一致性的预测的C-末端序列。
实施例11pFAJ3105构建体的改造从对pFAJ3105构建体转化的拟南芥属植物进行的分析可以明显看出,多蛋白前体确实被裂解了(参见表3,图17)。然而裂解是这样发生的,来自接头肽的一个氨基酸保持依附到从接头肽N-末端定位的成熟蛋白,并且5个氨基酸保持依附到从接头肽C-末端定位的成熟蛋白(参见图17)。依附到成熟蛋白的接头肽-来源的氨基酸可能会干扰这些成熟蛋白的功能性状,为了减少这些氨基酸的数量,已经设计了许多构建体,以便获得在更接近(或恰好优选在)成熟蛋白的边界发生的裂解。
在pFAJ3343构建体中,已经删除了pFAJ3105中编码接头肽N-末端残基的密码子。预计发生的成熟DmAMP1的裂解不额外带有任何来自接头肽的氨基酸(图20)。在pFAJ3344、pFAJ3345和pFAJ3346构建体中,pFAJ3105的接头肽C-末端密码子已经被改变,分别删除了最后的2个、4个和5个残基。预计pFAJ3344、pFAJ3345和pFAJ3346构建体裂解后,保持依附在RsAFP2 N-末端的残基数量将分别是3个、1个和0个(图20)。可以构建其它结构,其中减少了pFAJ3105构建体中接头肽区的N-或C-末端残基数目。
在pFAJ3105构建体中,接头肽来自IbAMP前体的第四个内部前肽(Tailor R.H.等,1997,生物化学杂志272,24480-24487)。在pFAJ3369构建体中,这个接头肽被IbAMP前体的第一个内部前肽替代(Tailor R.H.等,1997,同上)。在后一个接头前肽中,成对的酸性残基发生在C-末端。预计发生的裂解只有一个残基将保持依附在RsAFP2的N-末端(图20)。
实施例12构建一种构建体,用来表达一种具有4个成熟蛋白区的多蛋白在pFAJ3367结构中多蛋白区的组成是DmAMP1 cDNA的信号肽区,后面有四个不同抗菌肽的编码区,每一个被IbAMP前体的第一个内部前肽区分隔开。四个不同抗菌蛋白的编码区顺序是(见图21)1.植物防卫素DmAMP1(Osborn R.W.等,1995,欧洲生物化学联合会刊368,257-262)2.植物防卫素RsAFP2(Terras F.R.G.等,1995,植物细胞7,573-588)3.植物防卫素HsAFP1(Osborn R.W.等,1995,欧洲生物化学联合会刊368,257-262)4.脂质转移蛋白-样蛋白AcAMP1(Cammue B.P.A.等,1995,植物生理学109,445-455)这一构建体将产生四种不同的成熟抗菌蛋白(DmAMP1、RsAFP2、HsAFP1和AcAMP1),每一种蛋白都被分泌到细胞外间隙。
可以构建其它构建体,含有其它成熟肽区并带有上述任何其它接头肽。
实施例13构建体pFAJ3106、pFAJ3107和DFAJ3108的改造由构建体pFAJ3106、pFAJ3107和pFAJ3108构建体编码的多蛋白,包含在C-末端具有Kex2识别位点IGKR的接头肽。Jiang L.和Rogers J.C.(1999,植物杂志18,23-32)已经证明,在转基因烟草中,含有一个IGKR位点的多蛋白不被分开或很少被分开。在IGKR序列被IGKRIGKRIGKR序列(SEQ ID NO.77)替代的多蛋白中,发现裂解得到提高。
构建体FAJ3106-2、pFAJ3107-2和pFAJ3108-2除了IGKR编码区被一个编码IGKRIGKRIGKR的区域替代以外,其它与构建体pFAJ3106、pFAJ3107和pFAJ3108都相同(图22)。由这些构建体编码的多蛋白在接头肽的N-末端和C-末端都能被有效断裂。
可以构建其它构建体,其中减少了构建体pFAJ3106、pFAJ3107和pFAJ3108中接头肽区的N-或C-末端残基数目。
实施例14基于含有2A序列的杂合接头肽的多蛋白构建体口蹄疫病毒(FMDV)的RNA被翻译成一个多蛋白,该多蛋白的裂解依赖于一个被称为2A序列的20个氨基酸的序列(Ryan和Drew,1994,EMBO杂志13,928-933)。由2A序列连接的多蛋白的裂解发生在2A序列的第19个氨基酸(G)和第20个氨基酸(P)之间,裂解作用通过一个与加工酶显然无关的加工过程来进行,并且其发生可能归于G和P之间肽键的非正常形式(Halpin等,1999,植物杂志17,453-459)。Halpin等(1999,植物杂志17,453-459)已经证明包含FMDV 2A序列作为一个接头肽的多蛋白在植物中表达时,被有效地断裂。然而,利用FMDV 2A序列作为一个接头肽的一个主要的缺点是,裂解不在接头肽的N-末端发生。因此,相应于FMDV 2A序列前19个残基的一段比较长的19个氨基酸的延伸保持依附于成熟蛋白的C-末端。这段额外的19个氨基酸的延伸可能会干扰它所连接的蛋白的功能性状。
为了解决接头前肽裂解后不完全去除的问题,提议使用杂合的接头肽,在其N-末端是在构建体pFAJ3105、pFAJ3106、pFAJ3107或构建体pFAJ3108中所描述的接头肽的一部分,在其C-末端是FMDV 2A序列的一部分(或这种肽的一部分)。基于这一原则的例子是pFAJ3370构建体和pFAJ3368构建体(图23)。pFAJ3370构建体具有与pFAJ3150构建体相同的一个多蛋白区,除了pFAJ3370构建体多蛋白区的接头肽是一个29氨基酸的肽,该肽由IbAMP前体第四个内部前肽的前9个氨基酸(Tailor R.H.等,1997,生物化学杂志272,24480-24487)继之以FMDV 2A序列全部20个氨基酸组成。这个接头肽的裂解将释放一个C-末端具有一个额外丝氨酸的成熟DmAMP1以及一个N-末端具有一个额外脯氨酸的成熟RsAFP2。
构建体pFAJ3368与构建体pFAJ3370相同,除了C-末端成熟蛋白区(在该情况下编码RsAFP2)被一个编码这个成熟蛋白区及之前一个信号肽区的区域(在该情况下编码具有自身信号肽的RsAFP2)代替。如果在FMDV 2A序列G和P之间的裂解发生在多蛋白转位到内质网之前,那么预计pFAJ3368构建体与pFAJ3370构建体相比,将使两种成熟蛋白蛋白更好地定位到细胞外间隙。在这种情况下,分泌的成熟蛋白将由C-末端具有一个额外丝氨酸的DmAMP1和没有附加氨基酸的RsAFP2组成。如果在FMDV 2A序列G和P之间的裂解发生在多蛋白转位到内质网之后,那么预计依附在RsAFP2的信号肽不能被有效去除,这种情况下pFAJ3370构建体将比pFAJ3368构建体更优选。
序列表<110>曾尼卡有限公司Broekaert,Willem FFrancois,Isabelle EJAEvans,Ian JDe Bolle,Miguel FCRay,John A<120>遗传方法<130>PPD 50348/WO<140><141><150>GB 9818001.1<151>1998-08-18<150>GB 9826753.7<151>1998-12-04<160>81<170>PatentIn Vet.2.1<210>1<211>446<212>DNA<213>光滑大丽花<220><221>CDS<222>(1)..(64)<220><221>CDS<222>(157)..(446)<400> 1atg gtg aat cgg tcg gtt gcg ttc tcc gcg ttc gtt ctg atc ctt ttc48Met Val Asn Arg Ser Val Ala Phe Ser Ala Phe Val Leu Ile Leu Phe1 5 10 15gtg ctc gcc atc tca g gttatcaaat ctttagttca tttattgaat atgatagtat 104Val Leu Ala Ile Ser20ttatattctt ttatggtttt atgtgttctg acaagttgca aatattgagt ag at atc 161Asp Ilegca tcc gtt agt gga gaa cta tgc gag aaa gct agc aag aca tgg tcg 209Ala Ser Val Ser Gly Glu Leu Cys Glu Lys Ala Ser Lys Thr Trp Ser25 30 35gga aac tgt ggc aat acg gga cat tgt gac aac caa tgt aaa tca tgg 257Gly Asn Cys Gly Asn Thr Gly His Cys Asp Asn Gln Cys Lys Ser Trp40 45 50 55gag ggt gcg gcc cat gga gcg tgt cat gtg cgt aac ggg aaa cac atg 305Glu Gly Ala Ala His Gly Ala Cys His Val Arg Asn Gly Lys His Met60 65 70tgt ttc tgt tac ttc aat tgt aaa aaa gcc gaa aag ctt gct caa gac 353Cys Phe Cys Tyr Phe Asn Cys Lys Lys Ala Glu Lys Leu Ala Gln Asp75 80 85aaa ctt aaa gcc gaa caa ctc gct caa gac aaa ctt aat gcc caa aag 401Lys Leu Lys Ala Glu Gln Leu Ala Gln Asp Lys Leu Asn Ala Gln Lys90 95 100ctt gac cgt gat gcc aag aaa gtg gtt cca aac gtt gaa cat ccg446Leu Asp Arg Asp Ala Lys Lys Val Val Pro Asn Val Glu His Pro105 110 115<210>2<211>118<212>蛋白质<213>光滑大丽花<400>2Met Val Asn Arg Ser Val Ala Phe Ser Ala Phe Val Leu Ile Leu Phe1 5 10 15Val Leu Ala Ile Ser Asp Ile Ala Ser Val Ser Gly Glu Leu Cys Glu20 25 30Lys Ala Ser Lys Thr Trp Ser Gly Asn Cys Gly Asn Thr Gly His Cys35 40 45Asp Asn Gln Cys Lys Ser Trp Glu Gly Ala Ala His Gly Ala Cys His50 55 60Val Arg Asn Gly Lys His Met Cys Phe Cys Tyr Phe Asn Cys Lys Lys65 70 75 80Ala Glu Lys Leu Ala Gln Asp Lys Leu Lys Ala Glu Gln Leu Ala Gln85 90 95Asp Lys Leu Asn Ala Gln Lys Leu Asp Arg Asp Ala Lys Lys Val Val100 105 110Pro Asn Val Glu His Pro115<210>3<211>16<212>蛋白质<213>人工序列<220><223>人工序列描述接头前肽<400> 3Ser Asn Ala Ala Asp Glu Val Ala Thr Pro Glu Asp Val Glu Pro Gly1 5 10 15<210>4<211>20<212>蛋白质<213>人工序列<220><223>人工序列描述接头前肽<400>4Lys Lys Ala Glu Lys Leu Ala Gln Asp Lys Leu Lys Ala Glu Gln Leu1 5 10 15Ile Gly Lys Arg20<210>5<21l>40<212>蛋白质<213>大丽花<400> 5Lys Lys Ala Glu Lys Leu Ala Gln Asp Lys Leu Lys Ala Glu Gln Leu1 5 10 15Ala Gln Asp Lys Leu Asn Ala Gln Lys Leu Asp Arg Asp Ala Lys Lys20 25 30Val Val Pro Asn Val Glu His Pro35 40<210>6<211>44<212>蛋白质<213>人工序列<220><223>人工序列描述接头前肽<400>6Lys Lys Ala Glu Lys Leu Ala Gln Asp Lys Leu Lys Ala Glu Gln Leu1 5 10 15Ala Gln Asp Lys Leu Asn Ala Gln Lys Leu Asp Arg Asp Ala Lys Lys20 25 30Val Val Pro Asn Val Glu His Pro Ile Gly Lys Arg35 40<210>7<211>20<212>蛋白质<213>人工序列<220><223>人工序列描述接头前肽<400> 7Ala Ser Thr Thr Val Asp His Gln Ala Asp Val Ala Ala Thr Lys Thr1 5 10 15Ile Gly Lys Arg20<210>8<211>3l<212>蛋白质<213>尾稳苋<400>8Ala Ser Thr Thr Val Asp Mis Gln Ala Asp Val Ala Ala Thr Lys Thr1 5 10 15Ala Lys Asn Pro Thr Asp Ala Lys Leu Ala Gly Ala Gly Ser Pro20 25 30<210>9<211>522<212>DNA<213>人工序列<220><223>人工序列描述合成序列<220><221>CDS<222>(76)..(513)<400>9ctcgagtatt tttacaacaa ttaccaacaa caacaaacaa caaacaacat tacaattact 60atttacaatt acacc atg gtg aat cgg tcg gtt gcg ttc tcc gcg ttc gtt 111Met Val Asn Arg Ser Val Ala Phe Ser Ala Phe Val1 5 10ctg atc ctt ttc gtg ctc gcc atc rca gat arc gca tcc gtt agt gga159Leu Ile Leu Phe Val Leu Ala Ile Ser Asp IIe Ala Ser Val Ser Gly15 20 25gaa cta tgc gag aaa gct agc aag acg tgg tcg ggc aac tgt ggc aac207Glu Leu Cys Glu Lys Ala Ser Lys Thr Trp Ser Gly Asn Cys Gly Asn30 35 40acg gga cat tgt gac aac caa tgt aaa tca tgg gag ggt gcg gcc cat255Thr Gly His Cys Asp Asn Gln Cys Lys Ser Trp Glu Gly Ala Ala His45 50 55 60gga gcg tgt cat gtg cgt aac ggg aaa cac atg tgt ttc tgt tac ttc303Gly Ala Cys His Val Arg Asn Gly Lys His Met Cys Phe Cys Tyr Phe65 70 75aat tgt tcc aac gct gct gac gag gtg gct acc cca gag gac gtg gag351Asn Cys Ser Asn Ala Ala Asp Glu Val Ala Thr Pro Glu Asp Val Glu80 85 90cca gga cag aag ttg tgc caa agg cca agt ggg aca tgg tca gga gtc399Pro Gly Gln Lys Leu Cys Gln Arg Pro Ser Gly Thr Trp Ser Gly Val95 100 105tgt gga aac aat aac gca tgc aag aat cag tgc att aga ctt gag aaa447Gys Gly Asn Asn Asn Ala Cys Lys Asn Gln Cys Ile Arg Leu Glu Lys110 115 120gca cga cat gga tct tgc aac tat gtc ttc cca gct cac aag tgt atc495Ala Arg His Gly Set Cys Asn Tyr Val Phe Pro Ala His Lys Cys Ile125 130 135 140tgc tac ttt cct tgt taa taggagctc 522Cys Tyr Phe Pro Cys145<210>10<211>145<212>蛋白质<213>人工序列<223>人工序列描述合成序列<400>10Met Val Asn Arg Ser Val Ala Phe Ser Ala Phe Val Leu Ile Leu Phe1 5 10 15Val Leu Ala Ile Ser Asp Ile Ala Ser Val Ser Gly Glu Leu Cys Glu20 25 30Lys Ala Ser Lys Thr Trp Ser Gly Asn Cys Gly Asn Thr Gly His Cys35 40 45Asp Asn Gln Cys Lys Ser Trp Glu Gly Ala Ala His Gly Ala Cys His50 55 60Val Arg Asn Gly Lys His Met Cys Phe Cys Tyr Phe Asn Cys Ser Asn65 70 75 80Ala Ala Asp Glu Val Ala Thr Pro Glu Asp Val Glu Pro Gly Gln Lys85 90 95Leu Cys Gln Arg Pro Ser Gly Thr Trp Ser Gly Val Cys Gly Asn Asn100 105 110Asn Ala Cys Lys Asn Gln Cys Ile Arg Leu Glu Lys Ala Arg His Gly115 120 125Ser Cys Asn Tyr Val Phe Pro Ala His Lys Cys Ile Cys Tyr Phe Pro130 135 140Cys145<210>11<211>534<212>DNA<213>人工序列<220><223>人工序列描述接头前肽<220><221>CDS<222>(76)..(525)<400>11ctcgagtatt tttacaacaa ttaccaacaa caacaaacaa caaacaacat tacaattact 60atttacaatt acacc atg gtg aat cgg tcg gtt gcg ttc tcc gcg ttc gtt 111Met Val Asn Arg Ser Val Ala Phe Ser Ala Phe Val1 5 10ctg atc ctt ttc gtg ctc gcc atc tca gat atc gca tcc gtt agt gga 159Leu Ile Leu Phe Val Leu Ala Ile Ser Asp Ile Ala Ser Val Ser Gly15 20 25gaa cta tgc gag aaa gct agc aag acg tgg tcg ggc aac tgt ggc aac 207Glu Leu Cys Glu Lys Ala Ser Lys Thr TrD Ser Gly Asn Cys Gly Asn30 35 40acg gga cat tgt gac aac caa tgt aaa rca tgg gag ggt gcg gcc cat 255Thr Gly His Cys Asp Asn Gln Cys Lys Ser Trp Glu Gly Ala Ala His45 50 55 60gga gcg tgt cat gtg cgt aac ggg aaa cac atg tgt ttc tgt tac ttc 303Gly Ala Cys His Val Arg Asn Gly Lys His Met Cys Phe Cys Tyr Phe65 70 75aat tgt aaa aaa gcc gaa aag ctt gct caa gac aaa ctt aaa gcc gaa 351Asn Cys Lys Lys Ala Glu Lys Leu Ala Gln Asp Lys Leu Lys Ala Glu80 85 90caa ctG atc gga aag agg cag aag ttg tgc caa agg cca agt ggg aca 399Gln Leu Ile Gly Lya Arg Gln Lys Leu Cys Gln Arg Pro Ser Gly Thr95 100 105tgg tca gga gtc tgt gga aac aat aac gca tgc aag aat cag tgc att 447Trp Ser Gly Val Cys Gly Asn Asn Asn Ala Cys Lys Asn Gln Cys Ile110 115 120aga ctt gag aaa gca cga cat gga tct tgc aac tat gtc ttc cca gct 495Arg Leu Glu Lys Ala Arg His Gly Ser Cys Asn Tyr Val Phe Pro Ala125 130 135 140cac aag tgt atc tgc tac ttt cct tgt taa taggagctc 534His Lys Cys Ile Cys Tyr Phe Pro Cys145<210>12<211>149<212>蛋白质<213>人工序列<223>人工序列描述合成序列<400>12Met Val Asn Arg Ser Val Ala Phe Ser Ala Phe Val Leu Ile Leu Phe1 5 10 15Val Leu Ala Ile Ser Asp Ile Ala Ser Val Ser Gly Glu Leu Cys Glu20 25 30Lys Ala Ser Lys Thr Trp Ser Gly Asn Cys Gly Asn Thr Gly His Cys35 40 45Asp Asn Gln Cys Lys Ser Trp Glu Gly Ala Ala His Gly Ala Cys His50 55 60Val Arg Asn Gly Lys His Met Cys Phe Cys Tyr Phe Asn Cys Lys Lys65 70 75 80Ala Glu Lys Leu Ala Gln Asp Lys Leu Lys Ala Glu Gln Leu Ile Gly85 90 95Lys Arg Gln Lys Leu Cys Gln Arg Pro Ser Gly Thr Trp Ser Gly Val100 105 110Cys Gly Asn Asn Asn Ala Cys Lys Asn Gln Cys Ile Arg Leu Glu Lys115 120 125Ala Arg His Gly Ser Cys Asn Tyr Val Phe Pro Ala His Lys Cys Ile130 135 140Cys Tyr Phe Pro Cys145<210>13<211>24<212>DNA<213>人工序列<220><223>人工序列描述寡核苷酸<220><221>misc_特征<222>(6,9,12,15,21)<223>n是任何残基<400>13tgyganaang cnwsnaarac ntgg 24<210>14<211>8<212>蛋白质<213>光滑大丽花<400>14Cys Glu Lys Ala Ser Lys Thr Trp1 5<210>15<211>606<212>DNA<213>人工序列<220><223>人工序列描述合成序列<220><221>CDS<222>(76)..(597)<400>15ctcgagtatt tttacaacaa ttaccaacaa caacaaacaa caaacaacat tacaattact 60atttacaatt acacc atg gtg aat cgg tcg gtt gcg ttc tcc gcg ttc gtt 111Met Val Asn Arg Ser Val Ala Phe Ser Ala Phe Val1 5 10ctg atc ctt ttc gtg ctc gcc atc tca gat atc gca tcc gtt agt gga 159Leu Ile Leu Phe Val Leu Ala Ile Ser Asp Ile Ala Ser Val Ser Gly15 20 25gaa cta tgc gag aaa gct agc aag acg tgg tcg ggc aac tgt ggc aac 207Glu Leu Cys Glu Lys Ala Ser Lys Thr Trp Ser Gly Asn Cys Gly Asn30 35 40acg gga cat tgt gac aac caa tgt aaa tca tgg gag ggt gcg gcc cat 255Thr Gly His Cys Asp Asn Gln Cys Lys Ser Trp Glu Gly Ala Ala His45 50 55 60gga gcg tgt cat gtg cgt aac ggg aaa cac atg tgt ttc tgt tac ttc 303Gly Ala Cys His Val Arg Asn Gly Lys His Met Cys Phe cys Tyr Phe65 70 75aat tgt aaa aaa gcc gaa aag ctt gct caa gac aaa ctt aaa gcc gaa 351Asn Cys Lys Lys Ala Glu Lys Leu Ala Gln Asp Lys Leu Lys Ala Glu80 85 90caa ctc gct caa gac aaa ctt aat gcc caa aag ctt gac cgt gat gcc 399Gln Leu Ala Gln Asp Lys Leu Asn Ala Gln Lys Leu Asp Arg Asp Ala95 100 105aag aaa gtg gtt cca aac gtt gaa cat ccg atc gga aag agg cag aag 447Lys Lys Val Val Pro Asn Val Glu His Pro Ile Gly Lys Arg Gln Lys110 115 120ttg tgc caa agg cca agt ggg aca tgg tca gga gtc tgt gga aac aat 495Leu Cys Gln ArG Pro Ser Gly Thr Trp Ser Gly Val Cys Gly Asn Asn125 130 135 140aac gca tgc aag aat cag tgc att aga ctt gag aaa gca cga cat gga 543Asn Ala Cys Lys Asn Gln Cys Ile Arg Leu Glu Lys Ala Arg His Gly145 150 155tct tgc aac tat gtc rtc cca gct cac aag tgt atc tgc tac ttt cct 591Ser Cys Asn Tyr Val Phe Pro Ala His Lys Cys Ile Cys Tyr Phe Pro160 165 170tgt taa taggagctc 606Cys<210>16<211>173<212>蛋白质<213>人工序列<223>人工序列描述合成序列<400> 16Met Val Asn Arg Ser Val Ala Phe Sar Ala Phe Val Leu Ile Leu Phe1 5 10 15Val Leu Ala Ile Ser Asp Ile Ala Ser Val Ser Gly Glu Leu Cys Glu20 25 30Lys Ala Ser Lys Thr Trp Sar Gly Asn Cys Gly Asn Thr Gly His Cys35 40 45Asp Asn Gln Cys Lys Ser Trp Glu Gly Ala Ala His Gly Ala Cys His50 55 60Val Arg Asn Gly Lys His Met Cys Phe Cys Tyr Phe Asn Cys Lys Lys65 70 75 80Ala Glu Lys Leu Ala Gln Asp Lys Leu Lys Ala Glu Gln Leu Ala Gln85 90 95Asp Lys Leu Asn Ala Gln Lys Leu Asp Arg Asp Ala Lys Lys Val Val100 105 110Pro Asn Val Glu His Pro Ile Gly Lys Arg Gln Lys Leu Cys Gln Arg115 120 125Pro Ser Gly Thr Trp Ser Gly Val Cys Gly Asn Asn Asn Ala Cys Lys130 135 140Asn Gln Cys Ile Arg Leu Glu Lys Ala Arg His Gly Ser Cys Asn Tyr145 150 155 160Val Phe Pro Ala His Lys Cys Ile Cys Tyr Phe Pro Cys165 170<210>17<211>534<212>DNA<213>人工序列<220><223>人工序列描述合成序列<220><221>CDS<222>(76)..(525)<400>17ctcgagtatt tttacaacaa ttaccaacaa caacaaacaa caaacaacat tacaattact 60atttacaatt acacc atg gtg aat cgg tcg gtt gcg ttc tcc gcg ttc gtt 111Met Val Asn Arg Ser Val Ala Phe Ser Ala Phe Val1 5 10ctg atc ctt ttc gtg ctc gcc atc tca gat atc gca tcc gtt agt gga 159Leu Ile Leu Phe Val Leu Ala Ile Ser Asp Ile Ala Ser Val Ser Gly15 20 25gaa cta tgc gag aaa gct agc aag acg tgg tcg ggc aac tgt ggc aac 207Glu Leu Cys Glu Lys Ala Ser Lys Thr Trp Ser Gly Asn Cys Gly Asn30 35 40acg gga cat tgt gac aac caa tgt aaa tca tgg gag ggt gcg gcc cat 255Thr Gly His Cys Asp Asn Gln Cys Lys Ser Trp Glu Gly Ala Ala His45 50 55 60gga gcg tgt cat gtg cgt aac ggg aaa cac atg tgt ttc tgt tac ttc 303Gly Ala Cys His Val Arg Asn Gly Lys His Met Cys Phe Cys Tyr Phe65 70 75aat tgt gcc agt act act gtg gat cac caa gct gat gtt gct gcc acc 351Asn Cys Ala Ser Thr Thr Val Asp His Gln Ala Asp Val Ala Ala Thr80 85 90aaa act atc gga aag agg cag aag ttg tgc caa agg cca agt ggg aca 399Lys Thr Ile Gly Lys Arg Gln Lys Leu Cys Gln Arg Pro Ser Gly Thr95 100 105tgg tca gga gtc tgt gga aac aat aac gca tgc aag aat cag tgc att 447Trp Ser Gly Val Cys Gly Asn Asn Asn Ala Cys Lys Asn Gln Cys Ile110 115 120aga ctt gag aaa gca cga cat gga tct tgc aac tat gtc ttc cca gct 495Arg Leu Glu Lys Ala Arg His Gly Ser Cys Asn Tyr Val Phe Pro Ala125 130 135 140cac aag tgt atc tgc tac ttt cct tgt taa taggagctc 534His Lys Cys Ile Cys Tyr Phe Pro Cys145<210>18<211>149<212>蛋白质<213>人工序列<223>人工序列描述合成序列<400>18Met Val Asn Arg Ser Val Ala Phe Ser Ala Phe Val Leu Ile Leu Phe1 5 10 15Val Leu Ala Ile Ser Asp Ile Ala Ser Val Ser Gly Glu Leu Cys Glu20 25 30Lys Ala Ser Lys Thr Trp Ser Gly Asn Cys Gly Asn Thr Gly His Cys35 40 45Asp Asn Gln Cys Lys Ser Trp Glu Gly Ala Ala His Gly Ala Cys His50 55 60Val Arg Asn Gly Lys His Met Cys Phe Cys Tyr Phe Asn Cys Ala Ser65 70 75 80Thr Thr Val Asp His Gln Ala Asp Val Ala Ala Thr Lys Thr Ile Gly85 90 95Lys Arg Gln Lys Leu Cys Gln Arg Pro Ser Gly Thr Trp Ser Gly Val100 105 110Cys Gly Asn Asn Asn Ala Cys Lys Asn Gln Cys Ile Arg Leu Glu Lys115 120 125Ala Arg His Gly Ser Cys Asn Tyr Val Phe Pro Ala His Lys Cys Ile130 135 140Cys Tyr Phe Pro Cys145<210>19<211>316<212>DNA<213>人工序列<220><223>人工序列描述合成序列<220><221>CDS<222>(76)..(312)
权利要求
1.一种在转基因植物中提高一种或多种蛋白表达水平的方法,包括在所述植物的基因组插入一个DNA序列,该DNA序列包含一个启动子区域,其中启动子区域可操作地连接有两个或多个蛋白编码区和一个3’-终止区,其中所述的蛋白编码区由一个编码接头前肽的DNA序列相互分隔开,所述前肽提供一个裂解位点,表达的多蛋白在该位点被翻译后加工成组分蛋白分子。
2.根据权利要求1的方法,其中所说的启动子区被可操作地连接到一个信号序列,该信号序列被可操作地连接到两个或多个蛋白编码区和一个3’-终止区。
3.一种在转基因植物中表达多蛋白的方法,包括在所述植物的基因组插入一个DNA序列,该DNA序列包含一个启动子区域,其中启动子区域可操作地连接到一个信号序列,该信号序列可操作地连接两个或多个蛋白编码区和一个3’-终止区,其中所说的蛋白编码区由一个编码接头前肽的DNA序列相互分隔开,所说的前肽提供一个裂解位点,表达的多蛋白在该位点被翻译后加工成组分蛋白分子。
4.根据上述任一项权利要求的方法,其中所述接头前肽的序列至少有40%由选自丙氨酸、缬氨酸、异亮氨酸、甲硫氨酸、亮氨酸、苯丙氨酸、色氨酸和酪氨酸的2到5个连续疏水残基的一段序列或者由选自天冬氨酸、谷氨酸、赖氨酸、精氨酸、组氨酸、丝氨酸、苏氨酸、谷氨酰胺和天冬酰胺的2到5个亲水残基的一段序列组成。
5.根据前述任一项权利要求的方法,其中所述接头前肽在其N-或C-末端裂解位点的7个残基内有一个具有2到5个连续酸性残基、2到5个连续碱性残基或者2到5个连续的混合酸碱性残基的序列。
6.根据前述任一项权利要求的方法,其中编码所述接头前肽的DNA序列编码一种可以从植物蛋白,或病毒分离到的前肽,或它的变体,或者其中任一个的片段,其提供了一个裂解位点,从而使表达的多蛋白在该位点被翻译后加工成组分蛋白分子。
7.根据前述任一项权利要求的方法,其中编码所述接头前肽的DNA序列编码一种可以从植物蛋白中分离到的前肽或其片段。
8.根据权利要求6或7的方法,其中编码所述接头前肽的DNA序列编码一个嵌合的前肽,包括一种可以从一种或多种植物和/或一种病毒中分离到的前肽,或者它的变体或其中任一个的片段。
9.根据权利要求7或8的方法,其中的植物蛋白是植物防卫素的前体,或者橡胶蛋白类型的抗菌蛋白。
10.根据权利要求9的方法,其中的植物蛋白是来源于凤仙花属的抗菌蛋白。
11.根据权利要求10的方法,其中的前肽包括SEQ ID NO.3,29,21,22,23或24。
12.根据权利要求8的方法,其中的前肽包括来自Dm-AMP1或Ac-AMP2的C-末端前肽或它的片段,或其中任何一个的变体。
13.根据权利要求12的方法,其中的前肽包括SEQ ID NO.4,6,7,25,26或27。
14.根据前述任一项权利要求的方法,其中的前肽是嵌合的前肽。
15.根据权利要求13的方法,其中的嵌合前肽包括病毒前肽或它的片段,以及从植物蛋白分离的前肽或它的片段。
16.根据权利要求15的方法,其中的病毒是小核糖核酸病毒。
17.根据权利要求15或16的方法,其中的嵌合前肽包括病毒前肽序列的SEQ ID NO.28。
18.根据前述任一项权利要求的方法,其中的接头前肽在任一个末端或两个末端都设计有一个蛋白酶加工位点。
19.根据权利要求18的方法,其中的蛋白酶加工位点是一个枯草杆菌蛋白酶样的蛋白酶的加工位点。
20.根据权利要求2或3的方法,其中的信号序列来自植物防卫素基因。
21.根据前述任一项权利要求的方法,其中多蛋白中的一个或多个是防卫蛋白。
22.将一种在分泌途径可裂解的植物接头前肽应用于转基因植物中的合成多蛋白前体。
23.根据权利要求22的前肽的应用,其中前肽来自植物蛋白或者来自病毒。
24.根据权利要求22或权利要求23前肽的应用,其中的前肽来自植物蛋白并且该蛋白是一种植物防卫素的前体,或者来自橡胶蛋白类型的抗菌蛋白,或者可以从凤仙花属植物中分离。
25.将一种前肽用作转基因植物分泌途径中合成的多蛋白前体的可裂解接头,其中所说的前肽接头如在权利要求4或权利要求5中所定义的一样。
26.使用一个富含小氨基酸A,V,S和T,并且包含由两个酸性残基、两个碱性残基或一个酸性残基和一个碱性残基所组成的二肽序列的前肽,作为一个可裂解的接头序列,其中所述的序列可以从一种植物防卫素或一种橡胶蛋白类型的抗菌肽中分离。
27.一种DNA构建体,包括可操作地连接有一个植物来源的信号序列的启动子区,其中所说信号序列被可操作连接到一个或多个蛋白编码区和一个3’终止区,其中所述的蛋白编码区被一个编码接头前肽的DNA序列相互分隔开,所述前肽提供一个翻译后的裂解位点。
28.一种DNA构建体,包括可操作地连接有两个或多个蛋白编码区和一个3’终止区的启动子区,其中所述的蛋白编码区被一个编码接头前肽的DNA序列相互分隔开,该DNA序列来自Dm-AMP基因或来自Ac-AMP基因并编码C-末端前肽,所述前肽提供了一个翻译后的裂解位点。
29.根据权利要求27或28的DNA构建体,其中编码接头前肽的DNA序列在其任一个末端或两个末端都额外包含一个或多个蛋白酶识别位点。
30.一种载体,包含根据权利要求19-21任一项DNA构建体。
31.一种转基因植物,它是用根据权利要求27-30中任一项的DNA构建体或载体转化的。
32.使用DNA构建体或者包含所述构建体的载体来提高转基因植物中蛋白的表达水平,所述DNA结构体包含一个DNA序列,该DNA序列包括一个可操作地连接有两个或多个蛋白编码区和一个3’终止区的启动子区,其中所述的蛋白编码区被一个编码接头前肽的DNA序列相互分隔开,所述前肽提供了一个翻译后的裂解位点。
33.一种核酸,它编码SEQ ID NO.4、6、7、29、21、22、23、24、25、26、27、28的肽或图34所示的接头肽,或者其中任一个的变体。
34.根据权利要求33的核酸,它编码SEQ ID NO.4、6、7、29、21、22、23、24、25、26、27、28的肽或图34所示的接头肽。
35.根据权利要求33的核酸,它编码在SEQ ID NO.4、6、7、29、21、22、23、24、25、26、27、28的C-末端包含有SEQ ID NO.77的肽,或者编码图34所示的接头肽。
全文摘要
一种表达或提高转基因植物中一种或多种蛋白质的表达水平的方法,包括向所述植物的基团组中插入一种DNA序列,所述DNA序列包括和2个或多个蛋白编码区和一个3′终止子区的可操作地连接的启动子区,其中所说的蛋白编码区被编码接头前肽的DNA序列所分隔开,其中所说的前肽提供了断裂位点从而使所表面的多蛋白被翻译后加工成为成分蛋白分子。特别是,还包括了信号肽序列从而使翻译后加工在植物的分泌途径进行。本发明还描述了在本方法中所使用的合适的接头序列和DNA构建体。
文档编号C12R1/91GK1315999SQ9981029
公开日2001年10月3日 申请日期1999年8月17日 优先权日1998年8月18日
发明者W·F·布雷凯特, I·E·J·A·弗兰科伊斯, M·F·C·德波勒, I·J·埃文斯, J·A·雷 申请人:曾尼卡有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1