无融合生殖种子的产生方法

文档序号:451218阅读:1772来源:国知局
专利名称:无融合生殖种子的产生方法
技术领域
本发明涉及遗传转化的植物的产生方法。具体地说,本发明主要涉及诱导无融合生殖的方法,由该方法得到的无融合生殖种子,以及从这些种子萌发的植物和它们的子代。
无融合生殖,即通过种子的营养(无性)繁殖,是发现于一些非栽培性的多倍体物种中的基因控制生殖机理。该过程分类为配子体生殖或无配子体生殖。在配子体无性生殖中,有两种类型(无孢子生殖和倍数孢子形成),形成多个尤其缺少反足核的胚囊,或者在胚囊中产生其它大孢子。在不定胚生殖(无配子体无融合生殖)中,体细胞胚直接由胚囊细胞,子房壁或子房膜发育而来。在不定胚生殖中由周围细胞发育而来的体细胞胚侵入有性子房,其中一个体细胞胚竞争过其它的体细胞胚和有性胚,并利用所产生的胚乳。
无融合生殖是一种可控制的再生现象,在有性植物与单性植物的有效杂交情况下,它呈现出许多促进植物改良和育种的优点。
例如,无融合生殖能提供纯种,杂交种。而且,无融合生殖能缩短和简化培育过程,以便除去经检验能产生和/或稳定一种理想基因组合的自花授精体和子代。由于无融合生殖基因型繁殖与杂合性无关,故无融合生殖将用作具有独特基因组合的基因型品种。基因或基因组就这样“象金字塔状重叠”并“固定”在超基因型中。每一种从有性-单性杂交得来的较好的无融合生殖基因型都有潜能成为育种植物。植物育种者利用无融合生殖能够发展具有稳定特性的育种植物,比如植株高度,种子和饲料质量及成熟期。育种者在杂交种的商业生产中不受(ⅰ)细胞质-细胞核相互作用产生雄性不育雌性亲本或(ⅱ)授粉者的能育性恢复能力的限制。几乎所有的杂交亲合种质都可以是产生单性杂种的潜在亲本。
最后,无融合生殖将简化商业杂交种子的生产。特别是,(ⅰ)将消除对商用杂交种生产田进行物理性隔离的需要;(ⅱ)所有的可用田地都可能用来增加杂交种,以代替在授粉植株系和雄性不育系之间划分空间;(ⅲ)同时也不必保留亲本系的良种。
由无融合生殖种子的产生带来的潜在益处目前还未被意识到,很大程度上是由于无融合生殖能力进入所感兴趣植物体的工程问题。本发明提供了解决该问题的方案,即提供了获得显示无融合生殖的不定胚生殖类型的植物的方法。
按照本发明,其中提供了一种产生无融合生殖种子的方法,该方法包括以下几个步骤(ⅰ)利用编码一种蛋白质的核苷酸序列转化植物材料,所说的蛋白质在细胞中或细胞膜中存在时,使得所说的细胞变为胚发生性的,(ⅱ)使转化材料再生成为植物体,或者其包含心皮的部分,以及(ⅲ)在胚囊附近表达序列。
“胚囊附近”意指下列一项或几项心皮,珠被,胚珠,胚珠premordium,子房壁,合点,珠心,菌纤索和胎盘。专业人员清楚“珠被”也包括那些组织,如从珠被中获得的内种皮。“胚发生性的”意指在允许条件下细胞发育成胚的能力。“以活性形式”这一术语包括截短的蛋白质或由于限制条件而突变的其它蛋白质,所说的条件是它们促使胚胎发育开始或扩增,无论其是否发生作用都与信号转导组分相互作用,要不然它们将含于它们通常存在的组织中。
术语“植物材料”包括原生质体,具有细胞壁的分离植物细胞(如气孔保卫细胞),花粉,整个组织如外露胚根,茎干,叶片,花瓣,下胚轴段,顶端分生组织,子房,合子胚本身,根,维管束,中柱鞘,花药纤丝,体细胞胚及其类似物。
本发明另一实施方案涉及一种包含编码蛋白质的核苷酸序列的DNA分子,所说的蛋白质在细胞中或细胞膜中以活性形式存在时,使得所说的细胞变成胚发生性的。
可将所说的核苷酸序列导入植物材料中,主要是通过细菌或病毒载体,通过微注射,通过在高分子量的乙二醇存在时同时温育植物材料与序列,或通过在生物惰性微粒表面包被序列,然后将所说微粒导入植物材料中。
表达序列可能产生能跨越植物细胞膜的蛋白激酶,特别地是,该激酶如能够自身磷酸化的激酶一样,是富含亮氨酸重复单位的受体。专业人员清楚术语“如激酶一样的富含亮氨酸重复单位的受体”意味着什么。这种蛋白质的例子包括Arabidopsis RLK5(Walker,1993),ArabidopsisRPS2(Bent等,1994),番茄CF-9基因产物(Jones等,1994),番茄N(Whitham等,1994),矮牵牛花PRK1(Mu等,1994),果蝇Toll基因产物(Hashimoto等,1988),水稻OsPK10基因编码的蛋白激酶(Zhao等,1994),水稻EST克隆ric2976的翻译产物及果蝇属Pelle基因产物(Shelton和Wasserman,1993)。这种蛋白质的其它例子包括,来自Arabidopsis的TMK1,Clavatal,Erecta,和TMKL1基因产物,来自Drosophila的Flightless-1基因产物,来自猪的TrkC基因产物,大鼠LhCG受体和FSH受体,狗TSH受体,以及人Trk受体激酶。蛋白质可能包含配体结合结构域,脯氨酸盒,跨膜结构域,激酶结构域和蛋白质结合结合域。在许多受体激酶中,细胞外(配体结合)结构域作为无配体状态下激酶结构域的抑制剂。在结合配体之后除去这一抑制。因此,在本发明的一个实施方案中,蛋白质或者是缺少配体结合结构域或者是配体结合结构域功能失活,以便在缺少激活信号(配体)情况下激酶结构域在组成上是有活性的。蛋白质是否具有配体结合结构域-功能活性或功能失活,其一旦被表达并掺入到植物细胞膜中,蛋白质结合结构域优选在细胞内定位。
在本方法的一个优选的实施方案中,所说的序列还编码细胞膜靶向序列。序列可以是那些在SEO ID Nos:1,2,20,或32中所描述的序列或其类似物,即它互补于在严格条件下与所说序列杂交并且编码具激酶活性的膜结合蛋白质之序列的序列。“类似物”意指一种序列,它互补于能够与发明序列杂交的试验序列。当试验序列和发明序列是双链时,构成试验序列的核酸在20℃内优选具有发明序列的TM。在试验序列和发明序列混合并同时变性情况下,序列的TM值相互优选在10℃内。试验或发明DNA优选受支持时,优选在严格条件下完成杂交。这样,变性试验序列或发明序列任一种优选与支持体结合,在50至70℃温度下,在双强度的含0.1%SDS柠檬酸盐缓冲盐水(SSC)中,在特定的时间段内进行杂交,随后在相同温度下,用SSC浓度降低的缓冲液冲洗支持体。取决于所需的严格程度,以及这样获得的序列的相似程度,在一特殊温度下,例如60℃时,这种浓度降低的缓冲液,典型的是含0.1%SDS的单强度SSC,含0.1%SDS的半强度SSC,含0.1%SDS的十分之一强度的SSC。相似程度最大的序列是那些序列,其杂交过程至少受到在浓度降低的缓冲液中洗涤的影响。最优选的是试验序列和发明序列是如此的相似,以便在含0.1%SDS的十分之一强度柠檬酸钠缓冲液中洗涤或温育时,它们之间的杂交本质上不受影响。
因此,本发明还包括如SEQ ID No.22,24,26,28和30中所描述的DNA序列或互补于在严格条件下与所说序列进行杂交并且编码具激酶活性的膜结合蛋白质的序列的DNA序列。
所说的序列可以被修饰,由此除去已知的mRNA不稳定性序列基元或聚腺苷酸化信号,和/或利用掺入所说序列之植物的优选密码子,以便在所说植物中这种修饰的序列的表达产生蛋白质,该蛋白质本质上类似于在有机体(其中蛋白质是内源性的)中表达未修饰序列获得的蛋白质。
为了以组织特异性方式在再生植物体(特别是在其心皮部分)中获得序列表达,所说的序列优选地在一个诱导型或发育调节型启动子的表达控制之下,典型地如下列中之一在植物中调节SERK基因表达的启动子,Arabidopsis ANT基因启动子,来自Phalaenopsis的O126基因启动子,胡萝卜壳多糖酶DcEP3-1基因启动子,Arabidopsis AtChitⅣ基因启动子,Arabidopsis LTP-1基因启动子,Arabidopsis bel-1基因启动子,矮牵牛花fbp-7基因启动子,Arabidopsis AtDMC1启动子,pTA7001诱导型启动子。DcEP3-1基因是在内部珠被降解期间被瞬时表达,后来在发育胚乳的内衬细胞中表达。AtChiⅣ基因是在珠孔胚乳中被瞬时表达至细胞形成(cellularisation)。LTP-1启动子在发育珠心的表皮中有活性,包括珠被,种皮和早期的胚。bel-Ⅰ基因在发育的内珠被中表达,而fbb-7启动子在胚囊发育期间有活性。Arabidopsis ANT基因在珠被发育期间表达,而来自于Phalaenopsis的O126基因在成熟胚珠中表达。
最优选的是在胚囊,子房壁,珠心,或珠被的体细胞中表达所说的序列。
无融合生殖种子中的胚乳来自于胚囊中极性核与授粉的雄配子核子的融合。优选的是表达编码蛋白质的序列优选于极性核与雄配子核子的融合。
本发明还包括一种DNA,但优选地是一种重组DNA,其包含编码一种蛋白质的序列,所说的蛋白质在细胞中或细胞膜中存在时,使得所说的细胞变成胚发生性的。优选的是编码蛋白质的DNA是同激酶一样的富含亮氨酸重复单位的受体,包括配体结合结构域,脯氨酸盒,跨膜结构域,激酶结构域及蛋白质结合结构域,配体结合结构域可以缺少或是功能上无活性的。
特别是,本发明所说的DNA包含一种DNA序列,其编码具有以下氨基酸序列的N端蛋白质片段Gln Ser Trp Asp Pro Thr Leu Val AsnPro Cys Thr Trp Phe His Val Thr Cys Asn。
本发明的特定实施方案中涉及到一种DNA,包括编码蛋白质的DNA序列,这些蛋白质具有SEQ ID Nos 3或21中所描述的序列,或者是一种实质上与其相似的蛋白质,它能够与膜结合,并具有激酶活性。实质上相似意味着是具有一种氨基酸序列的纯蛋白质,该氨基酸序列至少90%类似于以下SEQ ID No 3中描述的蛋白质序列。在本发明的上下文中,彼此至少有90%相似性的两个氨基酸序列至少具有90%完全相同的或当序列对比最佳出现8个缺口时,在相似的位置进行保守置换的氨基酸残基,条件是对于每个缺口来说总的不超过4个氨基酸残基受到影响。为了实现本发明的目的,可能在下组的氨基酸之间进行保守置换(ⅰ)丝氨酸和苏氨酸;(ⅱ)谷氨酸和天冬氨酸;(ⅲ)精氨酸和赖氨酸;(ⅳ)天冬酰胺和谷氨酰胺;(ⅴ)异亮氨酸,亮氨酸,缬氨酸和甲硫氨酸;(ⅳ)苯丙氨酸,酪氨酸和色氨酸;
(ⅶ)丙氨酸和甘氨酸。
此外,非保守置换也可能低频发生。因此,本发明还涉及一种DNA序列,包含编码N端蛋白质片段的DNA序列,这些蛋白质片段具有以下氨基酸序列Val Xaa Gln Ser Trp Asp Pro Thr Leu Val Asn Pro Cys ThrTrp Phe His Val Thr Cys Asn,Xaa是可变氨基酸,但优选Leu或Val。
在本发明范围内特别优选的是一种包含编码N端蛋白质片段DNA序列的DNA,该蛋白质片段具有以下氨基酸序列Val Xaa Gln Ser TrpAsp Pro Thr Leu Val Asn Pro Cys Thr Trp Phe His Val Thr Cys AsnXab Xac Xad Xae Val Xaf Arg Val Asp Leu Gly Asn Xag Xah Leu SerGly His Leu Xai Pro Glu Leu Gly Xaj Leu Xak Xal Leu Gln,从Xaa到Xak为可变氨基酸,但优选Xaa=Leu或ValXab=Asn或GlnXac=Glu或Asp或HisXad=Asn或HisXae=Ser或Arg或GlnXaf=Ile或ThrXag=Ala或SerXah=Glu或AsnXai=Val或AlaXaj=Val或LysXak=Lys或GluXal=Asn或His优选的是,DNA还编码细胞膜靶向序列,并且蛋白质编码区处于发育调节型或诱导型启动子的表达控制之下,例如,在植物中调节SERK基因表达的启动子,胡萝卜壳多糖酶DcEP3-1基因启动子,ArabidopsisAtChitⅣ基因启动子,Arabidopsis LTP-1基因启动子,Arabidopsisbel-1基因启动子,petunia fbp-7基因启动子,Arabidopsis ANT基因启动子,或来自Phalaenopsis的O126基因启动子;Arabidopsis AtDMC1启动子,或pTA7001诱导型启动子。
对于所说的DNA,特别优选的实施方案包括在SEQ ID Nos.1,2,20或32中所描述的那些或者是那些互补于在严格条件下与所说序列进行杂交的序列,并且其编码有激酶活性的膜结合蛋白。如上所述,所说的DNA可被修饰,由此除去已知的mRNA不稳定性序列基元或聚腺苷酸化信号,和/或利用掺入所说序列之植物的优选密码子,以便在所说植物中这种修饰的序列的表达产生蛋白质,该蛋白质本质上类似于在有机体(其中蛋白质是内源性的)中表达未修饰序列获得的蛋白质。
本发明还包括含有前三段中所述DNA的载体,以重组DNA或载体转化的植物,含有稳定掺入的DNA的这种植物的子代,和/或该植物或其子代的无融合生殖种子。
本发明的重组DNA分子可通过一些经认证的方法引入植物细胞。本领域技术人员清楚对方法的选择可以取决于植物的类型,即单子叶植物或者双子叶植物,作为转化的目标。适宜的转化植物细胞的方法包括微注射(Crossway等,生物技术4:320-334(1986)),电穿孔法(Riggs等,美国国家科学院院报83:5602-5606(1986),土壤杆菌介导的转化(Hinchee等,生物技术6:915-921(1988)),直接基因转移(Paszkowski等,EMBO J.3:2717-2722(1984)),利用Agracetus公司,Madison,威斯康星及Dupont公司,Wilmington,Delaware提供的弹道粒子加速装置(见,例如,Sanford等,美国专利4,945,050;和McCabe等,生物技术6:923-926(1988)),原生质体转化/再生方法(见1994年9月27日颁发给Ciba-Geigy公司的美国专利5,350,689)。也可参见,Weissinger等,遗传学年鉴22:421-477(1988);Sanford等,粒子科学与技术5:27-37(1987)(洋葱);Christou等,植物生理87:671-674(1988)(大豆);McCabe等,生物/技术6:923-926(1988)(大豆);Datta等,生物/技术8:736-740(1990)(稻米);Klein等,美国国家科学院院报,85:4305-4309(1988)(玉米);Klein等,生物/技术6:559-563(1988)(玉米);Klein等,植物生理,91:440-444(1988)(玉米);Fromm等,生物/技术8:833-839(1990);及Gordon-Kamm等,植物细胞2:603-618(1990)(玉米)。
包括在本发明范围之内的是转基因植物,尤其是通过上述过程转化的转基因能育植物和它们的无性和/或有性子代,它们仍包含稳定掺入的DNA和/或这种植物或其子代的无融合生殖种子。
按照本发明的转基因植物可以是双子叶或单子叶植物。这些植物包括大田作物,蔬菜类及水果类,有番茄,胡椒,瓜,莴苣,花椰菜,椰菜,甘蓝,布鲁塞尔苗菜,糖甜菜,玉米,甜玉米,洋葱,胡萝卜,韭菜,黄瓜,烟草,苜蓿,紫茄子,甜菜,蚕豆,芹菜,菊苣,豇豆,菊荬菜,葫芦,落花生,番木瓜,豌豆,花生,凤梨,马铃薯,红花,脆豆,大豆,菠菜,南瓜,向日葵,高梁,西瓜及其同类植物;同时观赏植物包括凤仙花属,秋海棠属,矮牵牛花,天竺葵属的植物,Viola,樱草属植物,马鞭草属植物,长春花属,万寿菊属,樱草属,Saint Paulia,藿香,苋属植物,Anthirrhinum,耧斗菜属,菊花,瓜菊,苜蓿,Cosmo,豇豆,大丽花属,Datura,飞燕草,大丁草,剑兰,大岩桐,Hippeastrum,松叶菊属,蛾蝶花,Zinnia及其同类植物。在一个优选的实施方案中,在“种子作物”,如玉米,甜玉米,及豌豆等中表达DNA,通过该方式表达获得的无融合生殖种子与来自未转化的同类作物的种子相比,未发生物理性突变或受到损害。优选的Graminaceae科单子叶植物包括Lolium,Zea,Triticum,Triticale,Sorohum,Saccharum,Bromus,Oryzae,Avena,Hordeum,Secale和Setaria植物。
更优选的是转基因玉米,小麦,大麦,高粱,黑麦,燕麦,草皮及草料草,小米和稻米。特别优选的是玉米,小麦,高粱,黑麦,燕麦,草皮草和稻米。
在双子叶植物中,Arabidopsis,大豆,棉花,糖甜菜,甘蔗,油籽油菜,烟草和向日葵是较优选的。特别优选的是大豆,棉花,烟草,糖甜菜及油籽油菜。
“子代”表达可理解为包括转基因植物的“无性”和“有性”方法产生的子代。该定义也意味着包括通过已知方法可得到的所有突变体和变体,例如细胞融合或突变体选择,连同所有的转化植物材料杂交和融合产物一起,仍然显示了初始转化植物的特征性性状。只要所说的子代植物仍包含本发明说明的DNA,该定义也包括回交获得的子代植物。
本发明的另一目的涉及转基因植物的增殖材料。
转基因植物的增殖材料,相对本发明,其定义为能够在体内或在体外经有性或无性繁殖的任何植物材料。在本发明的范围内特别优选的是原生质体,细胞,愈伤组织,组织,器官,种子,胚,花粉,卵细胞,合子,及其他任何从转基因植物获得的繁殖材料。
植物的局部,例如来源于转基因植物或者通过本发明的方法预先转化的它们的子代并因此至少部分由转基因细胞组成的花,茎,果,叶,根,也都是本发明的目的。特别优选无融合生殖种子。
本发明的另一目的是一种产生无融合生殖种子,但优选的是属于不定胚生殖类型的种子的方法,包括以下步骤(ⅰ)利用编码一种蛋白质的核苷酸序列转化植物材料,所说的蛋白质在细胞中或细胞膜中以活性形式存在时使所说的细胞变为胚发生性的,但优选的蛋白质是一种能跨跃植物细胞膜并能自身磷酸化的蛋白质激酶;(ⅱ)使这种转化材料再生成为植物,或该植物的含心皮部分,以及(ⅲ)在胚囊附近表达序列。
由本发明的DNA表达的激酶蛋白质优选的是如同激酶一样的富含亮氨酸重复单位的受体,包含配体结合结构域,脯氨酸盒,跨膜结构域,激酶结构域和蛋白质结合结构域。在本发明的特定实施方案中,所说的激酶蛋白质可能缺乏功能性配体结合结构域,但包含脯氨酸盒,跨膜结构域,激酶结构域和蛋白质结合结构域。
通过工程化进入上述转基因种子和植物的遗传特性,经有性生殖或营养生长传递,能在子代植物中保留和遗传。一般所说的保留与遗传使用适合特定的目的,如耕种,播种或收获而建立的已知农业方法。也可应用专门的方法如水培或温室技术。当生长的农作物易受昆虫的伤害或侵染以及杂草植物的竞争时,应采取措施控制杂草,植物病害,昆虫,线虫类及其它不利的条件以便提高产量。这些措施包括机械措施,如翻耕土壤或除去杂草及受侵染的植物,也可使用农用化学品,如除草剂,杀真菌剂,杀配子剂,杀线虫剂,生长调节剂,催熟剂和杀虫剂。
可进一步在植物育种中利用本发明转基因植物与种子的有利的遗传特性,目的在于开发具有改良特性的植物,这些特性如对害虫,除草剂,或不利条件的耐受性,提高营养价值,增加产量,或改善结构减少因倒伏或落花而造成的损失。各育种步骤以完全确定的人工干涉为特征,如选择杂交系,引导亲本系授粉,或选择合适的子代植物。取决于所要求的性质不同,采取不同的育种措施。有关技术在本领域是熟知的,包括但不限于杂交,近交,回交繁育,多次繁育,品种融合,种间杂交,非整倍体技术等。杂交技术也包括通过机械、化学或生化手段进行植物绝育产生雄性或雌性不育植物。雄性不育植物用不同系的花粉进行异花传粉,确保雄性不育但雌性能育植物的基因组将始终如一地获得双亲系的特性。这样,本发明的转基因种子和植物可用于改良植物系的繁育,例如这些植物系可增加常规方法的效能,象使用除草剂或杀虫剂处理,或者可实现用所说方法进行分配,因为它们具有改进的遗传特性。另外可获得对不利条件具有较强耐受性的新的农作物,因为它们优化的基因“装备”,其生产收获的产品质量要好于那些不能耐受类似的不利发育条件的产品质量。
在种子生产中,种子萌芽质量和种子均匀性是十分重要的产品特征,而农民收获和出售的种子,这些并不是重要。因为保持一种作物不混杂有其他作物及杂草种子,控制种生性疾病,并产生萌芽率高的种子十分困难,在培育、调控和销售纯种子的领域中有经验的种子生产者已经发展了相当广泛和完全确定的生产实践。这样,农民购买经鉴定过的达到一定质量标准的种子,而不是利用自己收获的种子就是一件平常的事情了。作为繁殖材料的种子通常用保护剂进行包衣处理,包衣物质包含除草剂,杀虫剂,杀真菌剂,杀细菌剂,杀线虫剂,软体动物灭杀剂或它们的混合物。
惯用的保护剂包衣包括化合物如克菌丹,萎锈灵,福美双(TMTD_),methalaxyl(Apron_)及pirimiphos-methyl(Actellico_)。如果需要将这些化合物与另外一些在制剂领域中习惯使用的载体,表面活性剂或应用促进佐剂混合在一起,可避免受到由细菌,真菌或动物害虫造成的破坏。保护剂包衣可通过以液态制剂浸渍繁殖材料,也可通过以组合的潮湿或者干燥制剂涂敷来施用。其它的使用方法也有可能,如针对芽或者果实的处理方法。
提供所培养植物的繁殖材料,特别是植物种子是本发明的又一个目的,用通常用于种子处理的种子保护剂包衣对种子进行处理。
提供新的农艺方法是本发明的又一方面,如以上举例说明的方法,这些方法的特征是利用本发明的转基因植物,转基因植物材料,或者转基因种子。
为了由按照本发明的方法转化的植物繁育子代,可能要用到下列方法如下述实施例中所述产生的植物在温室的盆中或土壤里培育,如本领域中已知的方法,允许其开花。从成熟雄蕊获得花粉,用于给同株植物,同胞植物,或任一理想植物的雌蕊授粉。同样地,在转化植物上发育的雌蕊可能由得自同株植物,同胞植物,或者任一理想植物的花粉受粉。通过这一方法获得的转化子代可能因存在引入基因和/或伴随DNA(基因型),或所赋予的表型而区别于非转化子代。转化子代同样地可以自交或与其它植物杂交,如通常任何一种带有理想性状的植物所完成的一样。类似地,用该方法产生的烟草或其它转化植物可能自交或杂交,如在本领域中已知的一样,以便产生具有所要求特征的子代。同样地,结合使用本领域及本发明已知的方法产生的其它转基因有机体可按本领域已知的方法育种以便产生具有理想特征的子代。
本发明进一步包括一种由植物材料获得胚发生细胞的方法,该方法包括用本发明中的重组DNA序列或载体转化植物材料,在该材料或其衍生物中表达序列并使所说的材料或其衍生物受一种化合物的作用,这种化合物充当所说序列基因产物的配体。
本发明进一步涉及一种在体外条件下产生体细胞胚的方法,其中所说的SERK蛋白质被异位超量表达。
本发明还包括在无融合生殖种子生产中使用所说的DNA,在此应用中的序列是在胚囊附近表达的。
在本发明的特定实施方案中,SERK基因可能在转基因植物,如,例如Arabidopsis植物中,在植物表达信号控制下表达,尤其在植物中调节SERK基因表达的启动子,但优选发育调节型或诱导型启动子,如,例如胡萝卜壳多糖酶DcEP3-1基因启动子,Arabidopsis AtChitⅣ基因启动子,Arabidopsis LTP-1基因启动子,Arabidopsis bel-1基因启动子,petunia fbp-7基因启动子,Alabidopsis ANT基因启动子,或来自Phalaenopsis的O126基因启动子;Arabidopsis AtDMC1启动子,或pTA7001诱导型启动子。
DcEP3-1和AtChitⅣ基因的启动子可经标准化过程进行克隆和表征。DcSERK编码序列(SEQ ID No.2)在DcEP3-1,AtChitⅣ或AtLTP-1启动子后克隆,并转化进入Arabidopsis。以这样的方式完成连接,即启动子与将被转录的序列可操作地连接。这一构建体,也含有为选择转化材料提供的已知的标记基因,被插入到一个二元载体,如pBIN19的T-DNA区域并转化进入Arabidopsis。土壤杆菌介导的进入Arabidopsis的转化,通过专业人员已知的真空渗透或根转化过程来完成。选择和收获转化的种子并(如有可能)通过正常的自交建立转化系。以35S启动子-SERK构建体和整个SERK基因本身的平行转化用来作为对照,评价在许多细胞中或者仅在极少数天然表达SERK基因细胞中的超量表达。在植物中无论何处存在激活SERK-介导的转导链的信号,35S启动子-SERK构建体都可引起胚发生。基于携带LTP1启动子-GUS和SERK启动子-芽孢杆菌RNA酶花粉的供体植物系去雄和产生,建立一个试验系统。
相同的构建体(35S,EP3-1,AtChitⅣ,AtLTP-1和SERK启动子融合于SERK编码序列)用来转化进入几个Arabidopsis本底植物。这些本底植物是野生型,雄性不育,fis(emb 173的等位基因)和primordiatiming(pt)-1系,或者是这些本底植物中两种或几种的组合。wt系用作对照来评价对正常合子胚形成可能发生的作用,并且记录去雄后未受精的种子套数。ms系用来直接记录未受精的种子套数。fis系显示未受精的种子和胚发育的一定程度,因此可望具有一种无融合生殖胚发生的自然趋势,它因SERK构建体的存在而增强。pt-1系有很强的再生能力,用来启动第一个稳定胚发生Arabidopsis细胞的悬浮培养物。可通过相互间的杂交及与包含表达构建体的异位SERK的系进行杂交获得几个以上本底植物的组合。除了ms系之外,繁殖都可通过正常的自交进行,随后分析去雄株的无融合生殖性状。接着一类似策略是,ATChiⅣ,AtLTP-1及SERK启动子由bel-1和fbp-7启动子代替,也可由对雌性配子体组分特异的其它启动子代替。
产生的附加构建体具有组成型受体激酶活性。大多数的SERK类型受体激酶充当均二聚(homodimeric)受体,需要在能激活下游信号转导级联之前自身磷酸化。在许多受体激酶中,在无配体阶段胞外结构域成为激酶结构域的抑制剂。在结合配体之后除去这一抑制(Cadena和Gill,1992)。通过导入SERK构建体,从中除去了胞外结合配体结构域,能产生带有组成上活化的激酶结构域的突变均二聚蛋白质(在没有自然种群的SERK蛋白质的细胞中)或者均二聚蛋白质(在也表达未修饰形式的细胞中)。这一方法,当与珠心区域的活性启动子之一结合时,在缺少激活信号的情况下导致胚发生途径的活化。在必须或需要使SERK途径的活化仅仅依赖于特异的启动子活性,而独立于激活信号的时序调节的情况下这可能是重要的选择。引入导致不依赖于受精的胚发生(fie)的SERK构建体,在其它物种中试验它们的作用。为了识别fie表型,专业人员将利用合适的雄性不育本底植物。然而,为了确保产生胚乳,对于不定形胚生殖类型的无融合生殖来说,授粉常常是必要的。
尽管已通过SERK基因在心皮的珠心区域的异源表达产生无融合生殖种子的方法特别描述了本发明,专业人员还将认识到其它的基因,其产物与SERK基因产物有类似的结构/功能,也可能具有同样的表达结果。此外,虽然实施例说明了在Arabidopsis中无融合生殖种子的产生,但本发明当然不仅限于在这一植物中进行无融合生殖种子诱导基因表达。而且,目前公开的内容也包括这样一种可能性,即以组成型组织非特异方式在转化植物材料中表达SERK(或相关)基因序列(例如在CaMV35S或NOS启动子的转录控制下表达)。在此情况下,所说基因产物的配体在胚囊附近范围内的局部存在,确保了组织特异性。此外,SERK(或相关)基因产物可能与蛋白质如转录因子相互作用,这些因子牵涉到调节胚发生。在按照现公开方法转化的组织内的相互作用也是本发明的一部分。
受益于本说明书的专业人员将清楚SERK基因(和前面段落中描述的其它基因)可转化进植物材料,植物材料能繁殖和/或分化并用作为外植体,从外植体上可获得体细胞胚。在转化组织(易受激酶基因产物的配体的作用)中这种序列的表达本质上增加了细胞在组织中的百分比(与存在于非转化的类似组织中的细胞数目相比),这样的细胞能够形成体细胞胚。
通过下列描述和有关的图及序列表,本发明将更加明确。
SEQ ID NO.1描述推定的受体激酶(SERK)的Daucus carota基因组克隆,该激酶与感受态细胞向胚发生细胞的过渡有关;SEQ ID NO.2描述所说的推定的激酶的cDNA;SEQ ID NO.3描述预测的由SEQ ID NO:1中的DNA编码的SERK蛋白质序列;SEQ ID NOs:4-16描述各种PCR引物的序列;SEQ ID NOs:17-19描述SEQ ID NO.2的基因产物中所包含的特异性肽。
SEQ ID NO:20描述推定受体激酶(SERK)的Arabidopsis thaliana部分基因组克隆,该激酶与感受态细胞向胚发生细胞的过渡有关;SEQ ID NO:21描述预测的由SEQ ID NO:20中的DNA编码的SERK蛋白质序列;SEQ ID NOs:22,24,26,28和30描述与SERK LRR序列具有高同源性的5个EST克隆的部分DNA序列。
SEQ ID NOs.23,25,27,29和31描述SEQ ID NOS:22,24,26,28和30中的5个EST克隆的部分DNA序列的预测蛋白质序列。
SEQ ID NO:32描述来自Arabidopsis thaliana的SERK cDNA的核苷酸序列。
SEQ ID NO:33描述预测的由SEQ ID NO:32中的DNA编码的Arabidopsis thaliana SERK蛋白质的氨基酸序列。


图1显示对从上述组织中提取的RNA进行的RT-PCR实验结果。显现SERK表达必须在40个循环后对产生的带进行Southern印迹分析。泳道包括第7天的外植物,用2,4-D处理少于3天(泳道1)或多于3天(泳道2)。在原物中,在泳道2而不是泳道1中可见到一十分微弱的信号。建立的胚发生培养物(泳道4-6)而不是非胚发生对照物(泳道3)表达SERK基因。在胡萝卜中,授粉之后除了发育种子外检测不到任何表达(泳道7)。至授粉后第7天,胡萝卜合子仍然未分裂,表明观察到的信号仅来自合子。在第10天和在第20天,胡萝卜合子胚发生分别达到早球期和心期。在Northern印迹上看不到任何信号。
图2A显示用2,4-D处理3天后的第7天的外植体与SERK cDNA整体原位杂交的结果。外植体表面的极少数细胞表达SERK基因,那些表达的细胞都变为胚发生细胞。图2B显示包含球期合子胚的部分解剖的种子的整体原位杂交。杂交可通过DIG染色显现。
图3显示在胚发生胚轴细胞中激素诱导活化期间的SERK表达(由整体原位杂交确定)。棒眼50mm(A-E)由活化胚轴的机械断裂产生的细胞群。只有极少数的一定类型的细胞,被确定增大的细胞显示SERK表达(星号)。小胞质细胞(c),增大细胞(eg)和大细胞(l)不显示SERK表达。
(F)在激素诱导的活化之前的胚轴纵向段。在任一类型细胞中都不可能检测到SERK表达。
(G-I)激素处理开始10天后,来自内胚轴组织的增殖块(纵向段)。G中在一排显示相同形态的阴性细胞中,可检测到显示SERK表达的单一增大的细胞。H中显示SERK表达的单一增大的细胞从增殖块表面分离。I中在增殖组织表面可检测到一群显示SERK表达的增大的细胞。
(J)根处理开始10天后,来自内胚轴组织的增殖块(用2,4-D处理24小时随后除去激素)。根原基和从表面分离的增大的细胞均不显示任何SERK表达。
图4显示Arabidopsis WS转化植物的表型,在幼苗阶段用2200 bpSERK-荧光素酶构建体对其进行转化。照片拍于T2种子萌发后28天。在植物Ⅱ和Ⅲ萌芽7天之后的幼苗阶段,未见到清晰的枝条分生组织。头两片叶子,如果发育完全,如萌发后28天所拍照片上所示的一样呈针状。植物Ⅰ已经开始开花,尚未显示清晰的表型。次生枝条分生组织在第Ⅱ号植物中已经发育,随后也将在第Ⅱ1号植物中发育。枝条分生组织,花序及正常的花最终在所有植物上发育。
图5显示2200 bp SERK萤光素酶构建体如何影响转化植物长角果中发育胚珠的数量。
图6显示体外纯化SERK融合蛋白质的自身磷酸化。泳道1纯化SERK融合蛋白质;泳道2丝氨酸磷酸酯;泳道3苏氨酸磷酸酯;泳道4酪氨酸磷酸酯。
下列描述说明如何分离与克隆SERK基因和由所说基因在心皮的珠心区域中的异源表达产生无融合生殖种子,因此形成体细胞胚,它们穿透胚囊并随着胚囊的发育被种子包裹。SERK基因的分离和克隆在胡萝卜胚细胞培养物中优选表达的cDNA克隆的分离为了增加成功获得在能形成胚的胡萝卜悬浮细胞中表达的基因的机会,要确定一系列建立的细胞培养物中胚形成细胞的数量。培养物的透过30mm尼龙筛的细胞亚群从八种不同培养物中分离出来,培养物的寿命范围为2个月到4年之间。在这些30mm的子群体中,确定由单一细胞和小细胞群形成的胚的数量,并表示为占胚形成开始时存在的细胞总数的百分比。能够形成体细胞胚的频率超过1%的过筛<30mm的培养物随后可作为感受态细胞的来源,产生不到0.01%胚的培养物用作为非成胚对照。除常规示差筛选cDNA文库之外,冷噬斑筛选(Hodge等,1992)和示差显示(dd)RT-PCR(Liang和Pardee,1992)作为主要的克隆方法。
示差筛选的标记探针从筛出的<30mm的细胞子群体中的RNA获得,这些子群体来自于成胚或非成胚细胞培养物。用这些探针在大约2000种噬斑的文库筛选中产生噬斑,其中26种不能与任一探针进行杂交。纯化并进一步分析这些所谓的冷噬斑。从进行杂交的噬斑总数来看,大约有30种仅与来自成胚细胞的探针进行杂交。从三种成胚和三种非成胚悬浮培养物中分离mRNA,在其上进行利用一个锚引物和一个十链节(decamer)引物组合的ddRT-PCR反应。每次反应获得大约50个不同的ddRT-PCR片段。使用三个不同的锚和六个不同的十链节引物的组合,总共大约有1000个不同的cDNA片段显现。其中所说的六个PCR片段仅在以mRNA和以寡聚体构成的泳道内发现,这些mRNA来自成胚培养物的<30mm的细胞群体(表1),而寡聚体是锚引物(5'-TTTTTTTTTTTGC-3')和十链节引物(5′-GGGATCTAAG-3'),(5'-ACACGTGGTC-3′),(5'-TCAGCACAGG-3')的组合。因为差别PCR片段经常是由几个未分离的cDNA片段组成的(Li等,1994),事实证明克隆所得的PCR片段先于对其的进一步表征十分重要。
所有获得的克隆都经过第二次筛选,其包括在高度严格条件下完成的斑点Northern杂交。这一方法,使用来自整个未筛分的成胚和非成胚悬浮培养物的RNA,证明是一种快速和可靠的另外的可选择方法。示差筛选后获得的30个克隆中,仅有一个(22-28)证明局限于成胚细胞培养物,而大多数都是组成型表达的。由冷噬斑筛选获得的26个克隆在斑点Northern分析中需要长时间暴露。其中六个克隆不显示任一杂交信号,19个证明能够在成胚和非成胚细胞培养物中表达。一个克隆(31-50)在所有成胚培养物和一种非成胚培养物,而非其它培养物中显示出低的表达。由ddRT-PCR显示获得的六个克隆片段中,其中四个显示杂交或多或少地限制到成胚培养物中存在的克隆。对所有经过第二次筛选的克隆进行测序。ddRT-PCR克隆中的两个(6-8和7-13)与胡萝卜脂质移换蛋白质(LTP)基因完全相同,以前确定为胡萝卜成胚细胞培养物的标记。LTP表达限制到成胚细胞群和表皮层,表皮层指来自早球期的体细胞胚表皮和合子胚表皮(Sterk等,1991)。因此,若LTP基因不是感受态细胞的标记,那它在筛选中的出现就确认了我们方法的有效性,即关于体细胞胚发生期间早期表达基因的克隆。cDNA克隆31-50编码包含受体样激酶的富含亮氨酸重复单位与分离的克隆31-50对应的mRNA带有开放的具有1659核苷酸读框,该读框编码55kDa的计算Mw的蛋白质。因为克隆31-50主要在成胚细胞培养物中表达,它被重新命名为体细胞胚发生受体激酶(SERK)。SERK蛋白质包含具有富含五次重复的亮氨酸基元的N端结构域,这种基元在LRR受体激酶中充当蛋白质结合结构域(Kobe和Deisenhofer,1994)。在SERK的胞外LRR结构域和跨膜区域之间是富含脯氨酸的一个33个氨基酸的区域(13),那是SERK蛋白质所特有的。其中特别令人感兴趣的是序列SPPPP,它保存在伸展蛋白(一类普通植物的细胞壁蛋白质)中(Varner和Lin,1989)。所提到的蛋白质胞内结构域含有蛋白质激酶的催化核心所特有的11个子结构域。核心序列HRDVKAAN与GTLGYIAPE分别存在于激酶子结构域VB与Ⅷ中,表明其具有丝氨酸和苏氨酸激酶功能(Hanks等1988)。SERK蛋白质胞内部分的另一令人感兴趣的特征是C端24个氨基酸类似单一LRR。存在于胞内LRR序列之内的丝氨酸与苏氨酸残基被酸性残基围绕,并可能是SERK自身磷酸化的靶,因此以类似方式调节其它蛋白质与这种受体激酶相互作用的能力,象描述的酪氨酸受体激酶的EGF家族的SH2结构域一样。
SERK cDNA克隆与胡萝卜基因组的杂交揭示,以EcoR1消化之后,仪有一条主要的杂交带,可能反映了胡萝卜基因组中只有一个SERK基因。以Ddel(在SERK基因内切割三次的酶)消化之后确认了这一点。对来自成胚细胞培养物的mRNA进行Northern印迹分析并与标记的SERK探针杂交后,观察不到任一信号,反映出这些培养物中存在低水平的转录物。与其它探针相比暴露长时间之后,有可能在原始斑点印迹Northern上检测SERK转录物。
使用含SERK蛋白质完整胞内区域的细菌融合蛋白质,按照以前描述的自身磷酸化测定方法(Mu等1994),在体外研究SERK蛋白质的自身磷酸化能力。细菌表达的SERK融合蛋白质能够自身磷酸化,表明SERK蛋白质能够在体内作为蛋白激酶发挥作用(Heldin,1995)。SERK基因表达符合胚轴活化期间感受态细胞的首先出现以2,4-D诱导胡萝卜胚轴时,仅仅维管束组织的细胞增殖。表皮和皮层来源的细胞只是膨胀,表明维管束组织从新开始的悬浮培养物中衍生细胞。除去2,4-D 2-3周之后开始形成体细胞胚。成胚细胞先于体细胞胚,成胚细胞又是从感受态细胞发育的。2,4-D存在时感受态和成胚细胞形成,这发生在什么时间及哪些细胞获得感受态都不清楚。由于以前的实验(Toonen等1994)揭示了细胞形态不是一种好的标准,用实验方法确定首先出现的单一感受态细胞,通过在大群的固定化细胞上进行半自动细胞跟踪来完成。胚轴外植体用2,4-D活化处理七天,发生机械断裂,所生成的主要单一悬浮细胞群样品被固定化,从而能够通过细胞跟踪来记录它们的发育状况。通过该方法得到的固定化细胞群包含所有形态上可辨的细胞类型,这些细胞类型在未断裂活化胚轴中也可看到。因为已知胚轴活化期间所观察的不同的细胞形态(Guzzo等1995),所以在活化外植体中追溯每种类型细胞的原始位置是可能的。小的富含细胞质的细胞(16×16mm)是增殖细胞,围绕在维管束周围。正在增大的有空泡细胞(16×40mm)富含在增殖细胞群表面可见,当其充分增大时,可从该表面分离(35×90mm)。大的有空泡细胞(超过60×140mm)是胚轴表皮与皮层薄壁组织的非增殖残余部分。正在增大的和已充分增大的细胞的形状可从椭圆变化至细长或三角形。跟踪从活化七天的胚轴释放的总共24,722个细胞,显示仅有20个单一细胞形成体细胞胚。由于对连续2,4-D处理的依赖性,形成胚的单一细胞仍处于感受态细胞阶段。所有形成胚的单一细胞属于3,511个增大的细胞的范畴,因此包含那些形成胚频率为0.56%的感受态细胞。单一细胞跟踪实验清楚地揭示了外植体细胞在2,4-D作用下的重新引发细胞分裂的能力,产生胞质含量高并能迅速增殖的细胞群,这些细胞确实与胚形成能力有因果关系。有一点也是清楚的,即在组成新开始的成胚悬浮培养物的细胞中,仅有极有限数量的细胞确实是能形成成胚细胞的感受态细胞。
SERK基因表达,如在细胞跟踪实验中使用方法一样,由在类似的细胞群体上进行的整体原位杂交来确定,发现仅限于0.44%的增大细胞。因此,看起来SERK基因表达的质量和数量都与感受态单一细胞密切相关。
为了洞察外植体活化过程中对SERK表达的时序调节,整体原位杂在完全未经触动的或手切的外植体上完成,外植体用2,4-D处理不同的时间。在返回到B5-0之前,每隔一天从未处理和用2,4-D处理三天,六天,七天或十天的外植体上收集有代表性的样品。在用2,4-D处理不到三天的外植体上从未发现任一表达SERK的细胞。尽管在头五天培养之后增大的细胞开始出现,但在6-7天的2,4-D处理的培养物中,发现极少数最先出现的表达SERK的增大的细胞。这些极少数细胞存在于起源于维管束原组织的增殖细胞群的表面。在用2,4-D处理十天的胚轴中,SERK阳性细胞数量增加至3.04%,在这一阶段也包括存在于小型细胞群中的细胞。在小的富含胞质的细胞或大的有空泡细胞中不曾发现任一SERK转录物。胚轴也只用2,4-D处理一天,接着在无激素培养基中培养总共七或十天。在这些条件下,外植体细胞增殖并引起根的发生和非成胚细胞培养物的生成,而从未发现SERK表达。上述的原位杂交结果来自数量相对较少的细胞,因此进行RT-PCR后进行Sorthern杂交以便获得更定量的结果。这些结果在图7中显示,并确认在2,4-D处理三天的外植体中感受态细胞的首先出现与SERK基因表达之间的密切时序关系。在与SERK的cDNA探针杂交之后,Northern杂交从未给出任一信号,延长其在Phosphorlmager中的暴露时间后也不曾给出任一信号,符合SERK基因的极端限制表达模式。SERK基因表达符合建立的成胚细胞培养物中感受态细胞的出现迄今为止所描述的结果均表明,感受态细胞和成胚细胞的形成在外植体活化期间局限于一类特殊的增大细胞,在建立的成胚细胞培养物中该情况更复杂。在这种培养物中的感受态单一细胞似乎不属于任一特殊细胞类型,但却显示起源于所有的形态各异的细胞类型。在细胞跟踪实验中,成胚细胞,不需要用外源植物生长素处理,从未观察到其单一形态而总是由至少3-4个细胞团组成(Toonen等1994)。在所有的形态可辨单一细胞类型中,均可观察到SERK表达,单细胞类型存在于成胚细胞培养物中,取决于细胞类型其频率在0.1和0.5%之间。在非成胚培养物中,从未见到SERK表达细胞。象在活化外植体中观察到的一样,SERK表达并不只限于单一细胞,也出现在2至16个细胞组成的小细胞团中。由于已知这种规模的细胞团由成胚细胞组成,这些数据说明SERK表达不只限于感受态单一细胞,也可能存在于小型成胚细胞团中。在体细胞胚发生的晚球期、心期和鱼雷期,未见到任一SERK表达。SERK基因在合子胚中瞬时表达胡萝卜中的SERK基因表达由RT-PCR测定。结果表明授粉之前,在成熟植物的器官或花中均没有SERK mRNA积聚。能检测到SERK表达的第一个场合是在授粉(DAP)后三天的花中,在此阶段同时完成受精和胚乳发育过程。与合子胚的早球期对应,直至二十DAP SERK mRNA仅存在于花中(Yeung等人1996)。部分解剖的胡萝卜种子的整体原位杂交证明SERK基因表达仅发生在早期胚中直到球期。在整个胚胎包括胚柄中观察到SERK基因表达。受精前后,在幼苗,根,茎干,叶子,发育和成熟的花器官,花粉粒,柱头中未见到SERK基因表达。发育的种子组织如种子外衣,珠被,受精前所有的胚囊组分及胚乳,在所研究的所有发育阶段没有显示任一SERK表达。后来的胡萝卜合子胚阶段也完全没有SERK mRNA。假设这一方式的表达,限定于在合子胚中进行,那么通过RT-PCR检测花中的信号达3和7DAP一定来自存在于合子中的SERK mRNA,因为胡萝卜合子在授粉后一周仍然没分裂(Yeung等,1996)。当与体细胞胚相比时,虽然SERK表达持续至合子球期胚的稍后阶段,这些结果确认了体细胞胚发生期间观察到的SERK基因瞬时表达方式,并意味着在体外感受态细胞的形成和在体内合子的形成之间存在对应关系。方法细胞培养,胚轴外植体诱导及细胞跟踪细胞培养物来自Daucus carota栽培品种Flakkese,保存方法如前述(De Vries等,1988a)。细胞悬浮培养物,以高细胞密度保存于补充2mM 2,4-D的B5介质(B5-2介质)中(Gamborg等,1968)。具有球期、心期和鱼雷期体细胞胚的培养物来自在没有2,4-D的B5介质(B5-0)中以低细胞密度(100 000细胞/ml)培养的<30mm过筛细胞培养物。对于胚轴外植体诱导实验,植物幼苗从前述的Daucus carota栽培品种S Valery种子获得(Guzzo等,1994)。将一周幼苗的胚轴切分成3-5mm的小段,在B5-2介质中培养不同时间再返回B5-0介质。胚轴分段在移出和暴露于2,4-D七天后,在170mm筛上断裂,收集得到的细胞以形成优质细胞悬浮液。这些细胞在B5-0.2介质中的固定是在一植物凝胶薄层上完成的(Toonen等,1994)。进一步培养一周后通过用B5-0介质冲洗平板除去2,4-D。这样允许胚在球期后发育。通过前述Toonen等(1994)方法的改进过程记录固定化细胞的发育。主要变化包括一新的用于自动3维运动的微扫描程序,以扫描在植物凝胶中的所有细胞(Toonen等,1996)。核酸分离和分析RNA从De Vries等(1988b)描述的培养细胞和植物组织中分离而来。Poly(A)+-RNA由低聚(dT)纤维素(Biolabs)纯化过程获得。为进行RNA凝胶印迹分析,10mg的总RNA样品在甲酰胺凝胶上电泳,并且转移到nytran-plus膜上。为进行RNA斑点印迹分析,使用hybridot岐管将5mg总RNA变性并吸印到nytran-plus滤膜上。
基因组DNA按照Sterk等(1991)的方法进行分离。10mg的基因组DNA样品用不同的限制酶消化和在琼脂糖凝胶上分离,并且转移到nytran-plus膜(Schleicher和Schuell)上。RNA印迹的杂交在42℃条件下的含50%的甲酰胺,6×SSC,5×Denhardt,0.5%SDS和0.1mg/ml鲑精DNA的杂交缓冲液中进行。DNA印迹的杂交以前述方法完成(Sterk等,1991)。杂交后,在严格条件下(在0.1%SSC,1%SDS中,3×20分钟,65℃)洗涤滤膜。使滤膜曝光于柯达X-Omat AR胶卷。印迹上RNA的完整性和数量经与18S核糖体RNA探针杂交而确认。用ABI373A自动化DNA测序仪(应用生物系统)完成核苷酸序列分析。筛选过程两个独立的cDNA文库用等量的poly(A)+RNA构建,这些poly(A)+RNA来自B5-2介质中培育六天建立的总的细胞培养物,B5-0介质中培育六天的过筛<125mm的细胞培养物及B5-0介质中培育六天的过筛<30mm的细胞培养。cDNA合成和进入Uni-ZAPTM载体的克隆按照“制造商方案”(Stratagene)完成。
cDNA文库的示差筛选基本上由Scott等(1991)描述的方法完成。三个成胚或三个非成胚细胞培养物经30mm目的筛子筛分后在B5-2介质中培育七天,从中分离RNA。第一条cDNA链合成利用AMV逆转录酶(Gibco BgL)在4mg总的RNA上完成。利用标记于第一条cDNA上的随机引物制备[32P]dATP标记的探针。来自成胚和非成胚细胞群的探针与两对硝酸纤维素滤膜杂交,每对包含来自一个cDNA文库的1000个噬斑。65℃条件下在0.1%SSC,1%SDS中洗涤3×20分钟后,由在柯达X-omatic胶卷上的放射自显影技术显现杂交两天。仅显示具有成胚转录物探针信号的噬斑进一步经两个循环的筛选而纯化。
为了确认在<30mm过筛细胞群中以低水平表达的cDNA克隆,用象Hodge等(1992)所描述的方法进行冷噬斑筛选。从示差筛选获得的,放射自显影七天后没有显示任一信号的噬斑进一步经过两个循环的筛选纯化。得到的克隆作为表征相应基因表达模式的探针。示差显示RT-PCR示差显示mRNA基本上如Liang和Pardee(1992)描述的方法完成。cDNA合成通过将1mg总的RNA于10ml的缓冲液中退火,缓冲液包含200mM KCl,10mM Tris-HCl(pH8.3),和1mM具有100ng下列锚引物之一的EDTA:(5)′-TTTTTTTTTTTGC-3′),(5′-TTTTTTTTTTTCTG-3′),(5′-TTTTTTTTTTTCA-3′)。退火通过在83℃下加热混合物3分钟,随后在42℃下培养30分钟来进行。退火之后加入15ml提前加温的包含16mM MgCl2,24mM Tris-HCl(pH8.3),8mM DTT,400mM dNTP,以及4单位AMV逆转录酶(Gibco BRL)的cDNA缓冲液。42℃条件下发生cDNA合成90分钟,第一条cDNA链用苯酚/氯仿提取并用糖原作为载体用乙醇沉淀。PCR反应在20ml的反应量中完成,包含10%合成cDNA,100ng的锚引物,20ng的下列10链节引物之一(5′-GGGATCTAAG-3′),(5′-TCAGCACAGG-3′),(5′-GACATCGTCC-3′),(5′-CCCTACTGGT-3),(5′-ACACGTGGTC-3′),(5′-GGTGACTGTC-3'),2mM dNTP,PCR缓冲液(10mMTris-HCl(pH9.0),1.5mM MgCl250mM KCl,0.01%明胶和0.1%TritonX100)中0.5单位Taq酶和6nM[α-32p]dATP(Amersham)。PCR参数是94℃ 30秒,40℃ 1分钟和72℃ 30秒,利用Cetus 9600(Perkin-Elmer)40个循环。扩增和标记的cDNAs在6%的变性DNA测序凝胶上分离。在不固定条件下干燥凝胶,同时利用柯达X-omatic胶卷自显影16小时显现带。将包含150-450个核苷酸的差别表达的cDNA片段的带从凝胶上切下,同时从凝胶切片提取DNA,通过电洗脱将其提取到DE-81纸(Whatmann)上。在低盐缓冲液(10mM TE缓冲液中100mM LiCl2)中洗涤纸,以及在高盐缓冲液(在10mM含20%乙醇的TE缓冲液中1M LiCl2)中洗脱cDNA,然后以糖原为载体cDNA通过于乙醇中沉淀而浓缩。利用同上所述的相同的PCR循环参数再扩增cDNA片段,但是PCR缓冲液包含2.5mM的10链节和锚低聚引物及100mM dNTP。DE-81纸允许对DNA片段的有效回收和40个循环后再扩增产生平均为500ng的DNA。利用大肠杆菌DNA聚合酶Ⅰ(Pharmacia)的Klenow片段钝化扩增的PCR产物末端,在SephacryⅠ-S200柱(Pharmacia)上进行纯化,连接进SmaⅠ线形pBluescript载体ⅡSK-(Stratagene),并利用电穿孔法转化进大肠杆菌。RT-PCR来自Daucus carota的成熟植物组织从S & G seeds(Enkhuizen)获得。手工控制授粉。花组织RNA从每一时间点的三个竞争伞状花序获得,其包含所有的包括花粉粒的花器官。来自成熟植物组织或细胞培养物的2mg总RNA在42℃下与50ng低聚(5'-TCTTGGACCAGATAATTC-3′)在10ml退火缓冲液(250mM KCl,10mM Tris-HCl pH8.3,1mMEDTA)中退火。退火30分钟之后,在15ml cDNA缓冲液(24mM Tris-HClpH8.3,16mM MgCl2,8mM DTT,0.4mM dNTP)中加入1单位的AMV-逆转录酶。逆转录反应在42℃条件下发生90分钟。SERK-cDNA的PCR扩增用对SERK激酶结构域特异的两个低聚引物,(5′-CTCTGATGACTTTCCAGTC-3′)和(5′-AATGGCATTTGCATGG-3′)进行。扩增在94℃ 30秒进行30个循环,在54℃退火30秒,及在72℃延伸1分钟,随后在72℃最后延伸10分钟。整体原位杂交整体原位杂交基本上如前面描述的方法(Engler等1994)完成。将细胞培养物和体细胞胚在外涂多聚-L-赖氨酸的玻片上固定化,在固定期间进行以改善处理。经将七日龄幼苗的胚轴埋入3%的Seaplaque琼脂糖(Duchefa)中并在Eppendorf试管中处理它们,在外植体上的整体原位杂交发生。横向及纵向段均用vibrotome(Biorad microcut)制成。厚50-170mm的段在B5-2介质中培养至少三天以诱导胚形成细胞的形成。最佳的诱导是用至少90mm厚的纵向胚轴段实现的。为了获得增殖的,非成胚细胞培养物,可将胚轴段暴露于2,4-D中仅1天,接着转入B5-0介质中(Guzzo等,1994)。在发育种子上的整体原位杂交,通过去除种子的合点端使得探针的穿入更容易来完成。杂交之后,小心地剥去珠被和胚乳的外包层以暴露发育的胚。在分段上的原位杂交方法除了利用非放射性探针外如前所述(Sterk等1991)。
所有样品均在包含70mM EGTA,4%仲甲醛,0.25%戊二醛,0.1%吐温20及10%DMSO的PBS中固定60分钟。然后洗涤样品,用蛋白酶K处理10分钟,再次洗涤并第二次固定。杂交溶液由包含0.1%吐温20,330mM NaCl,50mg/ml肝素及50%去离子甲酰胺的PBS组成。利用洋地黄毒苷标记的意义或反义核酸探针(BoehringerMannheim),在42℃进行杂交16小时。洗涤之后用RNaseA处理细胞,同时用抗洋地黄毒苷碱性磷酸酶缀合物(Boehringer Mannheim)培养,该缀合物预先用植物蛋白质提取物吸附。除去过量抗体,可通过冲洗后在染色缓冲液(100mM Tris-HCl pH9.5,100mM NaCl,5mM MgCl2,1mM左旋咪唑)中清洗来完成,并且在包含NBT和BCIP的缓冲液中的染色反应时间为16小时。利用装备有Nomarski镜片的Nikon Opbiphot显微镜进行观察。自身磷酸化测定编码大多数N端三个LRRs以外的开放读框的SERK cDNA的1.4kB SspⅠ cDNA片段被克隆进入pGEX表达载体(Pharmacia)。由SERK和谷胱甘肽S-转移酶基因产物组成的融合蛋白质通过以2mM IPTG诱导转化的E.coli反应三小时而合成。如前述方法(Horn和Walker,1994)分离和纯化融合蛋白质。纯化的融合蛋白质与谷胱甘肽琼脂糖小珠(Sigma)连接,在20℃ 10ml的缓冲液(50mM Hepes(pH7.6),10mM MgCl2,10mM MnCl2,1mM DTT,1mCi[y-32p](3000 Ci/mmol))中培养20分钟。通过在4℃ 50mM Tris-HCl(pH7.3),10mM MgCl2中洗涤融合蛋白质/谷胱甘肽琼脂糖小珠三次5分钟除去过量标记物。通过在SDS-PAGE加样缓冲液中熬炼除去小珠中的蛋白质。等量蛋白质由SDS-PAGE分离,同时通过放射自显影术显现蛋白质自身磷酸化。用杆状病毒表达系统产生的SERK融合蛋白质包含Daucus carota SERK蛋白质的胞内部分(胡萝卜SERK cDNA克隆31-50的1.0 kB HindⅢ/SspⅠ片段)的另外一些融合蛋白质利用杆状病毒载体pAcHLT制造。利用这一纯化蛋白质的体外磷酸化研究显示了这一SERK融合蛋白质若非全部,大多数的自身磷酸化发生在苏氨酸残基上(图6)。病毒转移载体的构建pAcHLT-B与pAcHLT-C杆状病毒转移载体用于胡萝卜SERK基因的两个cDNA片段的克隆。将胡萝卜DcSERK cDNA的SspⅠ 1.41 kB片段克隆进入pAcHLT-B的SmaⅠ位点,将胡萝卜DcSERK cDNA的SspⅠ/PvuⅡ 1.07 kB片段克隆进入pAcHLT-C的SmaⅠ位点。第一构建体包含DcSERK蛋白质的完全的C端部分和推定的胞外区中的脯氨酸富集区和三个富含亮氨酸的重复单位。第二个构建体仅含有DcSERK基因产物的推定的胞内区。为了确认载体内DcSERK cDNA的存在和取向,进行核苷酸序列分析。昆虫细胞的转化产生的转移载体与线性化的AcMNPV杆状病毒DNA结合用来转染(脂转染)来自草地夜蛾(Spodoptera frugiperda)的昆虫细胞培养物Sf21。单层SF21细胞在装有2ml Hink介质的35mm的培养皿中转染。将1微克线形AcMNPV杆状病毒DNA(Baculogold,Invitrogen)加入到25微升水中的5微克pAcHLT/SERK载体构建体中。15微升Lipofectin(BRL)与10微升水混合,之后加入DNA溶液。混匀后加入200微升Hink介质到混合物中,同时将溶液转移到单层细胞上,从中除去介质。一小时后,加入500微升Hink介质并培养细胞另3小时。最后,加入含20%胎牛血清(FBS)的Hink介质1ml,同时培养细胞4天。在转染之后,病毒感染能通过细胞生长的减慢,细胞的膨胀,以及细胞核的增大来鉴定。四天后,收获被感染的细胞,收集包含感染性芽植病毒的介质并用于噬斑测定和扩增重组病毒原种。单一重组病毒的分离单一重组病毒噬斑从单层细胞分离,这些单层细胞以一定滴定范围的初级病毒原种感染。感染在具有单层细胞的35mm培养皿中完成。将病毒原种在600微升Graces介质中稀释,加到单层细胞中,随后在含20%FBS的Graces介质中温育90分钟。接下来,高压灭菌3%海洋噬斑(Sea Plaque)琼脂糖,与等量的含20%FBS的2×Graces介质混合,从得到的琼脂糖取出上层溶液2ml,在除去病毒接种物之后涂布于细胞单层上。温育4天后可见单一的噬斑并能对其进行纯化和进一步分析。融合蛋白质产生确定纯化的重组病毒滴度后,在75cm2的瓶中以10的感染复数(MOI)感染单层Sf21细胞。与病毒接种物的细胞温育进行90分钟,之后加入8ml含10%FBS的Hink介质。温育3天后,收获细胞并用PBS清洗两次。细胞在冰上溶解于二十倍体积1×昆虫细胞溶解缓冲液(10mM TrispH7.5,130mM NaCl,1%Triton,100mM NaF,10mM NaPi,10mM NaPPi,并具有蛋白酶抑制剂16mg/l苄脒,10mg/l菲咯啉,10mg/l抑蛋白酶肽,10mg/l亮抑蛋白酶肽,10mg/l胃酶抑制剂A,1mM PMSF)45分钟。
溶胞产物通过在10.000g下离心30分钟清除,同时上清液在TALON树脂(具有对重组体融合蛋白质6×HIS标记的高亲和性)中分批培养。室温下轻轻搅拌20分钟完成结合过程。树脂用溶解缓冲液洗涤三次,其后用含200mM咪唑的溶解缓冲液进行洗脱。收集纯化的融合蛋白质并通过SDS-PAGE试验其纯度和完整性。自身磷酸化测定通过温育1微克纯化的融合蛋白质30分钟测定蛋白激酶活性,条件为室温下在包含10mM MgCl2,10mM MnCl2,1mM DTT和10μM[γ-32]ATP(105pm/pmol ATP)的缓冲液中。在SDS-PAGE之后在含50mM NH4CO3,0.1%SDS,0.25%β-巯基乙醇的缓冲液中从凝胶中纯化自身磷酸化的融合蛋白质。用20μg/ml BSA和20%(w/v)固体三氯乙酸沉淀蛋白质。离心之后收集沉淀物,在120℃下在50μl 6N HCl中水解1小时。其后用冻干法除去HCl并将小球悬浮在由2.2%甲酸和7.8%乙酸组成的缓冲液中。水解的蛋白质与对照氨基酸样品(磷酸丝氨酸,磷酸苏氨酸,磷酸酪氨酸)一道载于纤维素薄层层析平板上。层析在包含丙酸∶1M氨水∶异丙醇(90∶35∶35v/v/v)的缓冲液中完成。分离和显现干燥平板之后,所分离的氨基酸通过喷以0.25%丙酮中的茚三酮,其后在65℃加热5分钟来显现。为了检测磷标记的氨基酸接着使平板暴露于PhosphoImager暗盒。SERK抗体纯化的融合蛋白质(10μg)与弗氏完全佐剂混合,IP注射进入BALBc小鼠体内。4周后注射激发抗原(在弗氏不完全佐剂中的10μg纯化的融合蛋白质)。两周后最后一次加强注射。最后加强注射后一周,从这些小鼠体内收集血清。得到的血清的特异性和滴度利用具有或没有SERK融合蛋白质的总昆虫细胞提取物在Western印迹上试验。SERK基因引入植物和无融合生殖种子利用SERK启动子片段/荧光素酶基因融合转化胡萝卜二元载体pMT500基于pBIN19载体(Bevan,1984),包含具有五个独特限制位点的多接头荧火虫荧光素酶基因下游,通过以下方式产生,即萤火虫萤光素酶编码区的单向连接,后跟二元载体pMOG800(由荷兰Mogen N.V.,Leiden友好提供)的HindⅢ-XbaⅠ位点中的来自豌豆rbcS::E9基因的聚腺苷酸化序列。二元载体pMOG800基于pBIN19(Bevan,1984),但当在pBIN19中时,多接头在侧面与左边缘和新霉素磷酸转移酶(NPTⅡ)表达盒连接,在pMOG800中的多接头在侧面与右边缘和NPTⅡ表达盒连接。来自胡萝卜SERK基因的转录调节序列通过用HindⅢ和DraⅠ消化从基因组λ克隆分离而来(SEQ ID NO.1),并克隆进入pBluescript SK+的HindⅢ/SmaⅠ位点。从得到的载体分离包含SERK基因组DNA的KpnⅠ/SstⅠ片段并将其克隆进入二元载体pMT500的KpnⅠ/SstⅠ位点。得到的DNA构建体,pMT531,包含2200bp基因组SERKDNA片段作为启动子序列,荧光素酶基因作为必需的报道基因,及E9转录终止序列。
二元载体pMT531经电穿孔法转化进入根瘤土壤杆菌菌株MOG101和MOG301(为转化进入胡萝卜细胞)和根瘤土壤杆菌菌株C58C1(为转化进入Arabidipsis thaliana植物)。在含有100mg/l卡那霉素的LB平板上选择转化的菌落。胡萝卜细胞的转化在基因组胡萝卜HindⅢ/DraⅠ 2200 bp DNA片段控制下的萤火虫萤光素酶编码序列,通过根瘤土壤杆菌介导的胚轴段的转化引入胡萝卜细胞。Daucus carota栽培品种‘Amsterdamse bak’的转化通过将黑暗中生长的一周龄幼苗切成10-20mm的小段完成。切段在新制备的稀释10倍的过夜土壤杆菌属培养物上培养20分钟。将切段干燥和转移到修饰的Gamborgs B5介质(P1介质;S & G seeds,Enkhuizen,荷兰)中,B5介质用2μM 2,4-D补充(P1-2)并用琼脂(Difco,底特律,Mi,美国)固化。在25+0.5℃条件下在暗处培养两天后,将切段转移到固化的用卡那霉素(100mg/l),羧苄青霉素(500mg/l;Duchefa)和万古霉素(100mg/l;Duchefa)补充的P1-2介质中。三周后将切段转移到新鲜平板上,另三周后挑出转化的愈伤组织。在16小时光照/8小时黑暗条件下,转化的愈伤组织与抗生素一起在P1-2平板上培育3周。通过把0.2g愈伤组织转移到10ml以200mg/l卡那霉素,250mg/l羧苄青霉素和50mg/l万古霉素补充的液态P1-2介质中,转化的成胚悬浮培养物如所描述的开始启动。在最初的几周内,每间隔一周往培养物中加入1至3体积的新鲜介质。5到7周后将培养物分培至每两周每50ml介质2ml的叠集细胞量,在25+0.5℃,在16小时光照/8小时黑暗条件下培养。
转移到卡那霉素选择介质上一周后,用萤光素喷雾胚轴段以试验在转化的愈伤组织中是否是转化后立即出现萤光素酶表达。大量的胚轴段在切割边缘显示萤光素酶活性,但没有发育愈伤组织。代而行之的是细菌的生长,表明萤光素酶活性具有细菌起源。转化后六至十周,获得的愈伤组织显示可变化量的萤光素酶活性,而不能再观察到细菌生长。12周后,测定直径为5-10mm的愈伤组织用来开始悬浮培养。这时未观察到任何细菌污染。对照转化实验,其中在CaMV 35S启动子作用之下的萤光素酶表达在悬浮培养物中的单一细胞和细胞团中观察到,证明萤光素酶蛋白质在Daucus carota悬浮培养的细胞中有活性。细胞固定化一周龄的高密度(106-107细胞/ml)悬浮培养物通过连续孔径为300,125,50和30μm的尼龙筛(Monodur-PES;Verseidag Techfab,Walbeck,德国)进行筛分。通过最后一筛的单一细胞和细胞团被命名为<30μm的细胞群体。未转化细胞的对照实验以在P1-2介质中所培育的悬浮培养物Daucus carota栽培品种‘Trophy’(S & G seeds)来进行。按大小分级分离的小于30μm的细胞群体在培养皿(Heraeus,Hanau,德国)中固定于植物凝胶(P8196;Sigma,St Louis,Mo,美国)中。底层由1ml的含有5mM Ca2+和0.2%植物凝胶的P1-0介质组成。以0.1%植物凝胶补充的无Ca2+的B5-0介质中二十万个细胞(<30μm和<50μm群体)倾倒在底层上面。对于这一层应用了B5,因为在室温下植物凝胶在无Ca2+的P1介质中固化。固化后2小时,含0.2%植物凝胶的附加P1-0层倾倒在细胞层上以阻止B5层的移动。为防止植物凝胶层的脱水并供给细胞萤光素,固化后加入0.5ml含0.05μM萤光素(Promega,Madison,Wi,美国)的P1-0介质。培养物中最后的萤光素浓度是0.02μM。在单一细胞上萤光素检测用CCD照相机完成,时间为每小时5次(Schmidt等,(1997)发育124:2049-2062)。培养7天后,通过用P1-0介质彻底洗涤除去培养物中的萤光素。利用SERK启动子片段/荧光素酶基因融合的Arabidopsis转化野生型WS植物在标准天长条件下培育16小时光照和8小时黑暗。
为了增加花序的数量除去最先出现的花序。五天后,植物准备进行真空渗透。包含转化质粒的土壤杆菌属菌株C58C1培育在具有50mg/l卡那霉素,50mg/l利福霉素和25mg/l庆大霉素的LB平板上。一单一菌落用于接种含50mg/l卡那霉素,50mg/l利福霉素和25mg/l庆大霉素的LB介质。培养物在28℃条件下O/N培育,得到的对数期培养物(OD6000.8)经离心使细胞成团,并重新悬浮于150ml的渗透介质(含5%蔗糖和10μl/l苄基氨基嘌呤的0.5×MS介质(pH5.7))中。6种Arabidopsis植物的花序浸没在渗透悬浮液中,而植物的余下部分(仍然是盆栽)倒置在金属网上以避免与渗透悬浮液接触。在50kPa时对整个装置抽真空10分钟。随后把植物直接放在标准天长条件下。下种后用1%次氯酸钠浸泡进行表面灭菌,然后用无菌水彻底清洗,并种在具有0.5×MS介质和80mg/l卡那霉素的培养皿上,目的是选出已转化的种子。在长天条件(10.000lux)之下发芽后五天,转化的幼苗可通过其子叶的绿色来识别(未转化幼苗变黄),并在C1实验室长天条件下的土壤中进一步培育。这种真空渗透方法大约能产生0.1%的转化种子。
包含编码卡那霉素抗性基因和与萤火虫萤光素酶基因融合的2200bp(HindⅢ/DraⅠ)SERK基因组DNA的构建体通过真空渗透转化进Arabidopsis thaliana(WS),产生六种不同的卡那霉素抗性初级转化体(Ⅰ,Ⅱ,Ⅲ,Ⅳ,Ⅴ和Ⅵ)。植物Ⅳ和Ⅵ在幼苗阶段死去,虽然它们具卡那霉素抗性。T2代能从四种植物Ⅰ,Ⅱ,Ⅲ和Ⅴ获得(图4)。在Ⅲ和Ⅴ号植物T2代的长角果内,在大约25-50%种子中能观察到发育中的早期抑制现象。植物Ⅰ与Ⅱ没有显示出发育种子在数量上的减少(图5)。类似的结果在T3代中也观察到,其中又是大约25-50%的种子显示出正常种子发育的早期抑制作用。利用AtSERK基因的Arabidopsis转化分离AtSERK基因组与cDNA克隆利用DcSERK cDNA序列(seq ID no.2)作为探针,由ArabidopsisLandsberg erecta总基因组DNA形成的λZipLox基因文库根据同源序列的存在被筛选。可获得分别具有14,18和20kb插入物的三种不同的λ克隆。14kb克隆由EcoRⅠ消化,得到的片段亚克隆进入pBluescript载体。对横跨AtSERK基因整个编码序列的片段进行分离,测序,并且与Daucus相应物比较。所得的序列如SEQ ID NO:20所示。
利用DcSERK cDNA序列(SEQ ID NO:2)作为探针,ZAPⅡ cDNA文库根据同源序列的存在被筛选。获得四个λ克隆,它们的插入物利用辅助噬菌体切除过程亚克隆进入pBluescript载体。对横跨AtSERK基因整个AtSERK cDNA编码序列的片段进行分离,测序,并且与Daucus相应物比较。所得的序列如SEQ ID NO:32所示。包含启动子序列的质粒Arabidopsis thaliana LTP1启动子片段从二元质粒pUH1000(Thoma,S.,Hecht,U.,Kipper,A.,Borella,J.,De Vries,S.C.,Sommerville,C.(1994)植物生理105,35-45),通过用BamHⅠ和HindⅢ消化并克隆进pBluescript SK-(pMT121)获得。
-由-343到-90区的重复增强的CaMV 35S启动子(Kay等,(1987)科学236:1299-1302)从pMON999载体,通过用HindⅢ和SstⅠ消化并克隆进入pBluescript SK-载体(pMT120)分离。-启动子AtDMC1(Klimyuk和Jones(1997)植物杂志11:1-14)。
质粒SLJ 9691是包括pBluescript SK+的构建体,其中Arabidopsisthaliana DMC1基因组克隆(登记号U76670)克隆进入EcoRⅤ位点。SLJ9691携带如下修饰过的AtDMC1基因5′端的EcoRV片段BgⅢ位点代替第二HpaⅠ位点,两个ATG密码子在第一外显子中和XhoⅠ位点在第二外显子的ATG密码子位置。-来自矮牵牛花的FBP7启动子(Angenent等(1995)植物细胞7:1569-1582)。
FBP7基因启动子通过亚克隆FBP7的0.6 kb HindⅢ-XbaⅠ基因组DNA片段进入pBluescript KS-的HindⅢ-XbaⅠ位点被克隆,产生载体FBP201。pAtSERK二元载体的构建体基于pBIN 19载体,构建二元载体pAtSERK以便在不同启动子控制下转化Arabidopsis thaliana SERK cDNA。
SERK的全长Arabidopsis thaliana eDNA克隆(Seq ID No.NEW)从pBluescript SK-质粒获得。包含AtSERK cDNA的SmaⅠ-KpnⅠ2.1 kb片段克隆进入pBIN19 SmaⅠ-KpnⅠ。为了产生二元载体pAtSERK,通过克隆Klenow-填补的EcoRⅠ-HindⅢ E9 DNA片段进入pBIN19:AtSERK载体的Klenow-填补的XmaⅠ位点,豌豆rbcS::E9基因(Millar等,(1992),植物细胞41075-1087)的聚腺苷酸化序列被置于AtSERKES cDNA的下游。植物表达载体的构建pAtSERK二元载体用来产生下列启动子-AtSERK构建体。
-AtLTP1启动子在二元载体pAtSERK的SmaⅠ位点克隆,作为Klenow-填补的KpnⅠ-SstⅠDNA片段来给出pAtLTP1AtSERK载体。
-CaMV 35S启动子在二元载体pAtSERK的SmaⅠ位点克隆,作为Klenow-填补的KpnⅠ-SstⅠ片段来给出p35SAtSERK载体。
-AtDMC1启动子由来自克隆SLJ 9691的BgⅢ-XhoⅠ3.3kB片段组成,其由Klenow填补并克隆进入pAtSERK二元载体的SmaⅠ位点以给出pAtDMC1AtSERK载体。
-FBP2101的SacⅠ-KpnⅠ片段用Klenow填补并克隆进入pAtSERK二元载体的SmaⅠ位点以给出pFBP2101AtSERK载体。植物表达载体引入Arabidopsis thaliana植物细胞上述载体构建体(pAtLTP1AtSERK,p35SAtSERK,pAtDMC1AtSERK,pFBP2101AtSERK)已经电转化进入本领域所知的Arabidopsis thaliana植物细胞C58C1菌株。
野生型Arabidopsis thaliana WS植物在标准天长条件下培育16小时光照和8小时黑暗。
去除首先出现的花序目的是增加花序数量。五天后,植物准备好进行真空渗透。包含转化质粒(pAtLTP1AtSERK载体或p35SAtSERK或pAtDMC1AtSERK载体或pFBP2101AtSERK载体)的土壤杆菌属菌株C58C1在有50mg/l卡那霉素,50mg/l利福霉素和25mg/l庆大霉素的LB平板上培育。单一菌落用于接种500ml的含50mg/l卡那霉素,50mg/l利福霉素和25mg/l庆大霉素的LB介质。培养物在28℃下O/N培育,离心得到的对数期培养物(OD600 0.8)使细胞成团并重新悬浮于150ml的渗透介质(含5%蔗糖和1mg/l苄基氨基嘌呤的0.5×MS介质(pH5.7))中。6种Arabidopsis植物花序浸没在渗透悬浮液中,植物的余下部分(仍然是盆栽)倒置在金属网上以避免与渗透悬浮液接触。
在50kPa时对整个装置抽真空10分钟。随后将植物直接放置在标准天长条件下。下种后用1%次氯酸钠浸透进行表面灭菌,然后用无菌水彻底清洗,并种到具有0.5×MS介质和80mg/l卡那霉素的培养皿上以便选出转化的种子。长天(10.000lux)条件之下发芽后五天,转化的幼苗可通过其子叶的绿色来识别(未转化的幼苗子叶变黄),进一步在长天条件下的土壤中培育。真空渗透方法产生大约0.1%的转化的种子。SERK序列在Arabidopsis thaliana植物细胞中的表达对转基因和不转基因的Arabidopsis thaliana植物的花序分析,通过以AtSERK cDNA为探针的整体原位杂交分析来实现。在含70mMEGTA,4%仲甲醛,0.25%戊二醛,0.1%吐温20及10%DMSO的PBS中固定不同发育阶段的花序60分钟。然后冲洗样品,用蛋白酶K处理10分钟,再次冲洗涤并进行第二次固定。杂交溶液由包含0.1%吐温20,330mM NaCl,50 mg/ml肝素及50%去离子甲酰胺的PBS组成。利用洋地黄毒苷-标记的意义或反义核酸探针(Boehringer Mannheim)的杂交在42℃条件下发生16小时。洗涤之后,细胞用RNaseA处理,同时与用植物蛋白提取物预吸附的抗-洋地黄毒苷-碱性磷酸酶缀合物(Boehringer Mannheim)一起培养。通过冲洗后在染色缓冲液(100mMTris-HCl pH9.5,100mM NaCl,5mM MgCl2,1mm左旋咪唑)中清洗除去过量抗体,在含NBT和BCIP的缓冲液中进行染色反应16小时。利用装有Nomarski镜片的Nikon Optiphot显微镜进行观察。
转化的植物显示在胚囊附近的SERK异位表达。参考文献Aleith,F.和Richter,G.(1990)植物183,17-24。
Bent,A.F.,Kunkel,B.N.,Dahlbeck D.,Brown,K.L.,Schmidt,R.,Giraudat,J.,Leung,J.和Staskawicz,B.J.(1994)科学265,1856-1860。
Braun T,Schofield P.R.和Sprengel R.(1991)EMBO J.10,1885-1890。
Dangl,J.L.(1995)细胞80,363-366。
De Jong,A.J.,Schmidt,E.D.L.和De Vries,S.C.(1993)植物分子生物学5,367-377。
De Vries,S.C.,Booij,H.,Meyerink,P.,Huisman,G.,Wilde,H.D.,Thomas T.L.和Van Kammen,A.(1988a)植物176,196-204。
De Vries,S.C.,Hoge,H.和Bisseling,T.(1988b)植物分子生物学手册,B6,S.B.Gelvin,R.A.Schilperoort和D.P.S.Verma.eds(Dordrecht,荷兰Klnwer学院出版社),pp1-13。
Dubois,T.,Guedira,M.,Dubois,D.和Vasseur,J.(1991)原生质162,120-127。
Dudits,D.,Gyorgyey,J.,Bogre,L.和Bako,L.(1995)在植物中的体外胚发生。Ed.Thorpe,TA.Klnwer出版社,pp.267-308。
Engler J.A.,Van Montagu M.和Engler G.(1994)植物分子生物学报告12,321-331。
Gamborg,O.L.,Miller,R.A.和Ojima,K.(1968)Exp.Cell.Res.50,151-158。
Giorgetti,L.,Vergara,M.R.,Evangelista,M.,LoSchiavo,F.,Terzi,M.和Ronchi,V.N.(1995)Mol.Gen.Genet.246,657-662。
Goldberg,R.B.,Barker,S.J.和Perez-Grau,L.(1989)细胞56,149-160.
Goldberg,R.B.,Barker,S.J.,Perez-Grau,L.(1989)细胞56,149-160.
Goldberg,RB.,de Paiva,G.和Yadegari,R(1994)科学266,605-614.
Govind,S.和Steward,R.(1991)Drosophila中Dorsoventral模式形成。Trends Genet.7,119-125。
Guzzo,F.,Baldan,B.,Levi,M.,Sparvoli,E.,LoSchiavo,F.,Terzi,M.,和P.Mariani(1995).原生质185,28-36.
Guzzo,F.,Baldan,B.,Mariani,P.,LoSchiavo,F.和Terzi,M.(1994)实验植物学45,1427-1432。
Hanks,S.K.,Quinn,A.M.和Hunter,T.(1988)科学241,42-52。
Hashimoto,C.,Hudson,K.L.和Anderson K.V.(1988)细胞52,269-279。
Heck,G.R.,Perry,S.E.,Nichols,K.W.和Femandez,D.E.(1995)AGL15,在发育胚中表达的MADS结构域蛋白质。植物细胞7,1271-1282。
Heldin,C-H.(1995)细胞80,213-223。
Hodge,R.,Paul,Wyatt,Draper,J.和Scott,R(1992)植物杂志2,257-260。
Horn,M.A.和Walker,J.C.(1994)生物化学生物物理学报1208,65-74。
Jones,D.A.,Thomas,C.M.,Hammond-Kosack,K.E.,Balint-Kurti,P.J.和Jones,J.D.G.(1994)科学266,789-792。
Kobe B,和Deisenhofer J.(1994)TIBS 19,415-421。
Li,F.,Barnathan,E.S.和Kariko,K(1994)核酸研究22,1764-1765。
Liang,P.和Pardee,A.B.(1992)科学,257,967-971。
Meyerowitz,E.M.(1995)EDBC 95欧洲发育生物学组织讨论会。摘要S14。
Mu J-H.,Lee H-S.和Kao T-h.(1994)植物细胞6,709-721。
Pennell,R.I.,Janniche,L.,Scofield,G.N.,Booij,H.,de Vries,S.C.和Roberts,K.(1992)细胞生物学杂志119,1371-1380。
Rounsley,S.D.,Ditta,G.S.和Yanofsky,M.F.(1995)植物细胞7,1259-1269。
Sato,S.,Toya,T.,Kawahara,R.,Whittier,R.F.,Fukuda,H.和Komamine,A.(1995)植物分子生物学28,39-46。
Shelton,C.A.和Wasserman,S.A.(1993)细胞72,515-525。
Sterk,P.,和De Vries,S.C.(1992)In Redenbangh K(ed),Synseeds使用合成种子对农作物的改良,CRC出版社,伦敦(1992)。
Sterk,P.,Booij,H.,Schellekens,G.A.,Van Kammen,A.和De Vries,S.C.(1991)植物细胞3,907-921。
Thomas,T.L.(1993)植物细胞5,1401-1410。
Toonen,M.A.J.和De Vries,S.C.(1995)在胚胎发生,植物的产生。Eds.Wang,T.L.和Cuming,A.BIOS科学出版社,牛津大学,英国,pp.173-189。
Toonen,M.A.J.,Hendriks,T.,Schmidt,E.D.L.,Verhoeven,H.A.,Van Kammen,A和De Vries,S.C.(1994)植物194,565-572。
Toonen,M.A.J.,Schmidt,E.D.L.,Hendriks,T.,Verhoeven,H.A.,Van Kammen,A.和De Vries,S.C.(1996)submitted。
Torii,K.U.和Komeda,Y.(1994)第四次国际植物分子生物学讨论会。摘要692。
Van Engelen,F.A.和De Vries,S.G.(1992)Trends Genet.8,66-70。
Varner,J.E.和Lin,L.-S.(1989)细胞56,231-239。
Walker J.C.(1994)植物分子生物学26,1599-1609。
Walker,J.C.(1993)植物杂志3,451-456。
Whitham,S.,Dinesh-Kumar,S.P.,Choi,D.,Hehl,R.,Corr,C.和Baker,B.(1994)细胞78,1101-1115。
Wilde,H.T.,Nelson,W.S.,Booij H.,de Vries,S.C.和Thomas,T.L.(1988)植物176,205-213。
Wurtele,E.S.,Wang,H.,Durgerian,S.,Nikolau,B.J.和Ulrich,T.H.(1993)植物生理102,303-312。
Zhao,Y.,Feng,X.H.,Watson,J.C.,Bottino,P.J.和Kung,S.D.(1994)植物分子生物学26,791-803。
Zimmerman,J.L.(1993)植物细胞5,1411-1423。序列表(1)一般信息(ⅰ)申请人A)姓名;NOVARTIS AG(B)街道Schwarzwaldallee 215(C)城市Basel(E)国家瑞士(F)邮区代码(ZIP):4058(G)电话+41 61 69 11 11(H)传真+41 61 696 79 76(I)电传962 991(ⅱ)发明名称在有机化合物上或有关有机化合物的改进(ⅲ)序列数33(ⅳ)计算机可读形式(A)介质类型软盘(B)计算机IBM PC兼容机(C)操作系统PC-DOS/MS-DOS(E)软件PatentIn Release #1.0,版本#1.25(EPO)(2)SEQ ID NO:1的信息(ⅰ)序列特征(A)长度6695个碱基对(B)类型核酸(C)链型双链(D)拓扑结构未知(ⅱ)分子类型DNA(基因组)(ⅲ)假设否(ⅲ)反义否(ⅸ)原始来源(A)生物体Daucus carota
(ⅸ)特征(A)名称/关键词CDS(B)位置3696..6671(ⅸ)特征(A)名称/关键词内含子(B)位置3731..3802(ⅸ)特征(A)名称/关键词内含子(B)位置3851..3979(ⅸ)特征(A)名称/关键词内含子(B)位置4124..4211(ⅸ)特征(A)名称/关键词内含子(B)位置4284..4357(ⅸ)特征(A)名称/关键词内含子(B)位置4430..4528(ⅸ)特征(A)名称/关键词内含子(B)位置4642..4757(ⅸ)特征(A)名称/关键词内含子(B)位置4890..4967(ⅸ)特征(A)名称/关键词内含子(B)位置5295..5803(ⅸ)特征(A)名称/关键词内含子
(B)位置6197..6339(ⅸ)序列描述SEQ ID NO:1:TCTAGATGAC GAAATCGCGC TACCTTTGAT TTNGAAATAC TAGGTTGTAG TATCTTGATT60AGTTTTTTGG ATATCTTGCT GTAATTTCTT TAGGAGATGC AAACGGTCTT CATTTAATAT 120GAGCCCTTGT GACTTGACAA AAGTATCTAG CATGTTTGAT CACGAGGTAG CTAAAAAGTA 180GCGTGTTTGA TTAAGCACAT AATATTGTAT TGGGCCTATT GGCTATCAAT GAAGTTTGAT 240GCAAGTATAT AGCTTGTATT ATGCATGTGA TGAGGGTATA TAAAAGGGGT AAAGAACATT 300CTCTCGTAGC ATTCATTTTT CTCTTGCCTA TAGTTAACGA GTTTTGTCAC ACATGACGTT 360GAAACTGGAT GTGTCTGTTC TTCCATCTAA GTTTGGATTA CCTGATAGAT GCTCAACTTC 420TTCGTCAGCC TTTTCTTTCC GATTTTTCCC AAGACAAGAT TCTTTAGTTA ATAGTTATTG 480CTCTGGTGGC TTGTGTGCAT TTTAGGAATC TTACTCTGTT TTTTAATGGA GAAACGAAAC 540CTACCTTTTT TTCTGTGTTC CCTTTTATGA TATCACCTGC TTGGAGGCGT TTAGACTTTA 600TCCACCTAAA CTATTCATGT TTACCAGACA AGCTATACGT TTTATCCCCC CCCCCCGCGG 660ACCTGNGGAC AAAAGAAGCG CTGATGAACT GATTTAATCC GTGTTTTATT ATATTACACA 720TTGATGCTTC ATGGAGCTAA TATCTTTGGT TAAATTTCAT GTATATATAT ACCCTTCCCT 780CTTGTGATGG CAGTGGCCCC TCGTTTAATT AGCGTACTTA ATTATCTGAT GGATACTGTA 840TGCTTGGCAG ATGATGTCAT CAGATTATAC CATTTGTTGT GCTCTACAAA ATAAAAAACC 900TCTATTTATG TTCATCTTTT TGGTAACAAG TAACTAATTG ATGCGCTATG TTGACAGGCG 960ATGCATTACA CAACTTACGA ACTAGCTTGC AAGATCCCAA CAATGTCCTG CAGAGCTGGG 1020ATCCAACCCT TGTGAACCCT TGCACATGGT TTCATGTGAC ATGTAACAAT GAAAACAGTG 1080TTATAAGAGT GTAGGTCACT TCCCTTATTA ATTTTTTTAG CAAGTTACGA ATATTTACTC 1140AATTGAGCAG ATGTCTCTTT AAATATTTTT CTTTAATTTC TTAGCTAAGC GGAGCATCTA1200TCTTAAGTAT CTCTACTGAA TTTAAGACAT AATACATTTT TTTAAAAAAT CTATTAGAGT 1260GTTTTTTCCG CACAGCGCAC ATATATCTTT TTTCTGGTAA TTCAGACAAC CTTTCTCCCG 1320ACGATAAAAT AATATAAGAT TAACTCCTTG AACTAATTTT TTATTTTTCT TTTCTTTTTA 1380TGTTCTTTGC AGAAAGTTTC TTATGGTCTT TTGTGAAAAG TACATTCTAT GATAATTTTT 1440TGGCAACTCA TATAAATTTA TATATATTCC ATGTAGTTAT AAGTTAAAAA AAGCTTCCTA 1500TTAATTCCAA GATAGAGGTT CATTTTTATA GTTTGGGCAT CCATGAGTTT TTGAAAATGT 1560CAGAAATTTT GTTGAGTTAA TTTTACTTAC CAACTTTTAT GGCGTCATGC AGTGATCTTG 1620GGAATGCAGC ATTATCTGGT CAATTGGTTC CTCTTGGCCA GTTGAAAAAT TTACAATACT 1680TGTAAGACCA TATCACTTGG AATGCTTTAG TTTTTATACA GCACAATGCT TTCAATATCT 1740GTTAAAAGTG TGAAAAAGTT GACTTTCTAG CTTCAGCAGT TGTTCGGATA ATATCTATGA 1800AGCACTTAAA AGGCTGGGCA ATTTTTTTGT TATTATTTCA AATATTGTTA ATTGTTACTA 1860CTTAATATGA TAAACTGATT TAACTCCTCA TGATTGGTCT CAGTCCAATG TGCCCTCATT 1920AGTCACATNA TAAAATTCCN GGGTTGGACA AATATAACTT CTTTTCTTAA GGTCCAGAAA 1980GAGCACTTAT CAACCTTGTC TAGCGCATAA CGTCACAGTG GGTCAGTCAC GGGCTATCCA 2040GTTTGGGGAG GTTTTAATGA GCACTTATTT ACCTTGTCTT TTAAACGTCT GAGGATGTTA 2100TTAAAGTCTG CATCATTCAG AGTTTAAATT AGCACTTTCA GTTGTATTAT GAATGGTACA 2160TGAAAGATAC ATATCTTAAT GTTCCTATGC CTGTTTCAAC ATGTCTCTAA TATTCTGTTA 2220TCTTTGTCAT CTTAAAAATG GCACTGATTA AAATGTGAGA AAGGTAGTCT TCCAATACCA 2280TTTCATGTAT ACCAGAGAAT ATCATAATTT TTTTAAATCA TAAGTTGGGC CCTAGAGTTT 2340TCTCAGTATT GGTCTATTTA TATTTTCCAC CATTTATAAC TGTGTTGTCA GATGAAAATC 2400TTGGACTTCC ACAGAAGATC TTATAGTAAA AGTATTCTTT AGATCTGATG ATGAAAGTTG 2460TCATGGTGTG GCCTGTCCCA GAATTTAAAT CAATCCCATG TCACATGTTT GTTGATCTGA 2520CTACTCACTG TTAATCGAAG AGTAACTATT TGTGAATTAA ATGCTTTTTT TTTTGTTCTT 2580CATGCTTAGC GTTATAAAGG TCTACGTCTG ACTATGGTTT TTAACATGTT ATAGTTTTGT 2640ACTGACAAGT TTAAAGTTTC TCTTGTTTAC GAATTAAGAA TATATAATAT AAAACGCTTT 2700AACTTTCTCT GTGGAAGGTG TTCTTACCTT TTTATATATA TATATAGATA CTCAGACTCT 2760GCTGGCAATT ATATCTTACG AACTTACGAG TATACAGAAC TTGTATATTA GGTTCAGATG 2820AGTGGCTGTA GTAGAACACC TTAAGCAAGA ACTTAATCAT GAGGTTTCAA CCTTTTAACT 2880TTCTTTTTAG ATTTTTTCAA GTTTATGGAA AATTGTACCT CATGATCGTG GTTTCTTTCC 2940ATAAACTTTC CATATAAGTC CGTTTCTTGA CGTTTTCATG TAAGCTGTTC ACGAGTGATT 3000ATTAGCGGTT CTTTCAATAA TCATAATGTG TCTCACTTTG ATGAGGCCTG TACTTATTAT 3060TGCACCTTGC ACTTAACCTT GATCCTCATG TCATCTTGAT TGTCATAGTC ATCTAACCGA 3120GTTGAACATG GTTTATCATG TCTTTTGAGG TAACAATGTA GCTTTCACCT CTGTCCTTGA 3180TATAGGTTTA AGGCTTGCAC CTCCCACTAG CCTTTCGTTG TTTTATTCAC AGTTCACACA 3240CCTACTAGCA CTGTTCACCT CTAGTCTTTT GTCCGCAAAT AGTAAGAAGT TTCTTTCGCA 3300TAATAGTGGA TGATCATTTA AGAAATAGTG AATCAAATTA TCGTGTTATT GTGTTTGTAC 3360TTTGGAATTA AATGAGTTGC TGAACATTGT TGCTGTTTAT CGTTGTCAAG GCTTTGCCAA 3420GGAAGGCGAT TAGTAAGAGT GGGCATCCAA GCGCCTTTAT CTTGAAGGGG CGGGCGGCAC 3480GTTGTGGATT CTGGGTGTCT ATTAGAGGAC ATTATCTATA TATACTGATT ATTTATTAGA 3540ATATAAATCA ACTACTATAT TTTTCTTTGT AATGTTTATA TAGAAATCCC ACTCGTAAAC 3600TTGACAAATA CCATTGAAAT ATTTGAACCT AATTAATTAG TAGTGTCAGG TTTAAATTCA 3660AACTCATTTA ATTTTACTTT AAAAAATAAT TCTATATGAA TCGTAACAGT ATAAATATAT3720TAAATTACAT GTATGTGTGC CTATATATAG CTGAATGTCT AATAGACTCC AAGACGGCTG 3780CTCTTACTGC CTAGGCGTCC AGGCAGTTCA CTGATGCTTA CCTTGACAAA TATGGGGTTC 3840GTATGACATT GTTGGGGATC CCTATCACTG GATTCCTGTT TTGCTGACCC TCTGTTCAAT 3900TGATTTTCAT TGATGTAGTA TTACTAGTTT TATAAATATT CTTTATTGCA ATAATTTAAC 3960TGGAGTTTAA CAATGACAGG GAGCTTTACA GCAATAACAT AAGTGGACCA ATTCCTAGTG 4020ATCTTGGGAA TCTGACAAAT TTGGTGAGCT TGGACCTATA CATGAATAGC TTCTCTGGAC 4080CTATACCGGA CACATTAGGA AAGCTTACAA GGCTAAGATT CTTGTATGAC TACAAATCTT 4140CACTAGTTTT TAACTTAATG CAATTTGATT ATCCTTTCAA GTGATTGATT ATATCACAAA 4200TTACTGGATA GGCGTCTCAA CAACAACTGC CTCTCTGGTC CAATTCCAAT GTCACTGACT 4260AATATTACAA CTCTTCAAGT CCTGTAAGTA TTCCGACCTT TCCAGATAGT TTTGTTGTTG 4320TGGATGTTTC AATTTTAATA CTAAATATGT TCATCAGGGA TTTATCAAAC AATCGGCTAT 4380CAGGACCAGT ACCGGATAAT GGCTCATTTT CTTTGTTTAC ACCTATCAGG TTTAATGCTA 4440GTAATATCTT TAATATTATG GTTCTTACTT CTACTGCGAA AGCTATGATA ATATTTTTTT 4500TCTCCTTCAT ATATTATCAC TTTCGCAGTT TTGGCAATAA TTTGAATTTA TGTGGACCTG 4560TAACTGGGAG GCCCTGCCCT GGATCTCCCC CATTTTCTCC ACCACCTCCG TTCATCCCAC 4620CATCAACAGT ACAGCCTCCA GGTGATTTAG TTTTTATATT AATTCCCGTA ATTAATTTTA 4680TGACTGTAAA AATTGGTGTT AATTTCACCA GTTGCGAATA AAGTATTTTC CTTCTTTCTC 4740TTCTTATTAT TATGAAGGAC AAAATGGTCC CACTGGAGCT ATTGCTGGGG GAGTAGCTGC 4800TGGTGCTGCT TTACTGTTTG CTGCACCTGC AATGGCATTT GCATGGTGGC GGAGAAGAAA 4860ACCGCGAGAA CATTTCTTTG ATGTGCCAGG TTAGTCCTGT AAATAGATAT CTATTGAAGC 4920GCTTACTGTC TGTGGACTTT GTTTTCACTG TCATTAGTTA ACTTCAGCTG AAGAGGACCC 4980AGAAGTGCAC CTTGGTCAAC TGAAGAGGTT TTCTCTGCGA GAATTGCAAG TCGCAACGGA 5040TACTTTTAGT ACCATCCTTG GAAGAGGTGG ATTTGGTAAG GTGTATAAGG GACGCCTTGC 5100TGATGGCTCA CTTGTAGCAG TTAAAAGGCT TAAAGAAGAA CGAACACCAG GTGGCGAGCT 5160GCAGTTTCAA ACAGAAGTGG AAATGATTAG CATGGCTGTG CATCGAAATC TTCTGCGTCT 5220ACGTGGTTTC TGCATGACAC CTACCGAGCG GCTTCTTGTA TATCCATACA TGGCTAATGG 5280AAGTGTTGCG TCATGTTTAA GAGGTATCTC AGTTACAATT ACCATAACTT GCCAGAAGTT 5340TGTTTGATTA AAAATGAAAT ATAACTCCCT ACACTATGTT AAGGTGTTAT AATTTCTGAG 5400CAGATCTTAT TTCCCATTGC AAGATACCAG TTATTATTGT TTTTTCTGTA ATTGATACCG 5460GTTATATTTC TTTCTTGTAT TTGGTTATAT GCAAGGATTT CGAGTCTAAT AAGTTATCAA 5520ACTGGATGCT ATGTTTATTC TGCAATTGAA TTCTTGCTTC AGGTGCCAAA ATATATATGA 5580TTCAACTTGG AATCATCTTA TAATATACTG TGTAAAGTCA GCTGTTGACT TTCATCATTA 5640ATTAGTCTTC ATAAATCAGA ATCTGCCTAG TGAGCTTTAC CGACATACTC TAAACCTTTC 5700TTATGGCCCT GTATATAATC GTCCCACTTA CTTTATTCAG TTTGTCTGCT CTCTGAATTT 5760TTGATCTGTA CATTGTGATG TCTTGTTTTC ATCAAATGTA GAGCGTCAGC CATCAGAACC 5820TCCCCCTGAT TGGCCAACTA GGGAGAGGAT TGCACTAGGA TCTTCTAGGG GCCTATCTAA 5880ATTGCATGAC CATTGTGATC CCAAGATTAT CCATCGCGAT GTAAAAGCTG CAAATATATT 5940ATTGGACGAA GAATTTGAGG CTGTTGTAGG TGATTTTGGG TTAGCTAGGC TCATGGATTA 6000CAAGGATACC CATGTTACGA CTGCTGTAAG GGGTACCATT GGGCACATAG CTCCCGAGTA 6060CCTCTCGACT GGAAAGTCAT CAGAGAAGAC CGATGTCTTT GGTTATGGGA TAATGCTCCT 6120AGAGCTCATT ACTGGACAGA GGGCTTTTGA TCTTGCTCGC CTTGCGAACG ATGATGATGT 6180ATTGTTGTTG GATTGGGTAT GTGTCCCGGG TGTTCCTTTG GTTAATTATT TCACATATTA 6240GTGCTTACTA CTTTGTTGTG GCCCTTTGTT TTTATTTCCT GCCTGTATTT GATTCTTAGT 6300CATGTTATGC ATATTGACCT GCTTTGCAAT GTCTTTTAGG TTAAAAGCCT TTTGAAAGAG 6360AAAAAGTTGG AGATGCTGGT CGATCCTGAC CTGCAGAACA ATTACATTGA CACAGAAGTT 6420GAGCAGCTTA TTCAAGTAGC ATTACTCTGT ACCCAGGGTT CGCCAATGGA GCGGCCTAAG 6480ATGTCAGAGG TAGTCCGAAT GCTTGAAGGT GATGGCCTTG CAGAAAAGTG GGACGAGTGG 6540CAAAAAGTTG AAGTCATCCA TCAAGACGTA GAATTAGCTC CACATCGAAC TTCTGAATGG 6600ATCCTAGACT CGACAGATAA CTTGCATGCT TTTGAATTAT CTGGTCCAAG ATAAACAGCA 6660TATAAAATGT AATGAAATTA ATATTTTTTA TGGTT6695(2)SEQ ID NO:2的信息(ⅰ)序列特征(A)长度1815个碱基对(B)类型核酸(C)链型单链(D)拓扑结构未知(ⅱ)分子类型cDNA(ⅲ)假设否(ⅲ)反义否(ⅳ)原始来源(A)生物体Daucus carota(ⅸ)特征(A)名称/关键词CDS(B)位置94..1752(ⅸ)序列描述SEQ ID NO:2:GACAAATACC ATTGAAATAT TTGAACCTAA TTAATTGTA GTGTCAGGTT TAAATTCAAA60CTCATTTAAT TTTACTTTAA AAAATAATTC TAT ATG AAT CGT AAC AGT ATA AAT 114Met Asn Arg Asn Ser Tle Asn1 5ATA TTA AAT TAC ATG CAG TTC ACT GAT GCT TAC CTT GAC AAA TAT GGG162Ile Leu Asn Tyr Met Gln Phe Thr Asp Ala Tyr Leu Asp Lys Tyr Gly10 15 20GTT CTT ATG ACA TTG GAG CTT TAC AGC AAT AAC ATA AGT GGA CCA ATT210Val Leu Met Thr Leu Glu Leu Tyr Ser Asn Asn Ile Ser Gly Pro Ile25 30 35CCT AGT GAT CTT GGG AAT CTG ACA AAT TTG GTG AGC TTG GAC CTA TAC258Pro Ser Asp Leu Gly Asn Leu Thr Asn Leu Val Ser Leu Asp Leu Tyr40 45 50 55ATG AAT AGC TTC TCT GGA CCT ATA CCG GAC ACA TTA GGA AAG CTT ACA306Met Asn Ser Phe Ser Gly Pro Ile Pro Asp Thr Leu Gly Lys Leu Thr60 65 70AGG CTA AGA TTC TTG CGT CTC AAC AAC AAC AGC CTC TCT GGT CCA ATT354Arg Leu Arg Phe Leu Arg Leu Asn Asn Asn Ser Leu Ser Gly Pro Ile75 80 85CCA ATG TCA CTG ACT AAT ATT ACA ACT CTT CAA GTC CTG GAT TTA TCA402Pro Met Ser Leu Thr Asn Ile Thr Thr Leu Gln Val Leu Asp Leu Ser90 95 100AAC AAT CGG CTA TCA GGA CCA GTA CCG GAT AAT GGC TCA TTT TCT TTG450Asn Asn Arg Leu Ser Gly Pro Val Pro Asp Asn Gly Ser Phe Ser Leu105 110 115TTT ACA CCT ATC AGT TTT GCC AAT AAT TTG AAT TTA TGT GGA CCC GTA498Phe Thr Pro Ile Ser Phe Ala Asn Asn Leu Asn Leu Cys Gly Pro Val120 125 130 135ACT GGG AGG CCC TGC CCT GGA TCT CCC CCA TTT TCG CCA CCA CCT CCG 546Thr Gly Arg Pro Cys Pro Gly Ser Pro Pro Phe Ser Pro Pro Pro Pro140 145 150TTC ATC CCA CCA TCA ACA GTA CAG CCT CCA GGA CAA AAT GGT CCC ACT 594Phe Ile Pro Pro Ser Thr Val Gln Pro Pro Gly Gln Asn Gly Pro Thr155 160 165GGA GCT ATT GCT GGG GGA GTA GCT GCT GGT GCT GCT TTA CTG TTT GCT 642Gly Ala Ile Ala Gly Gly Val Ala Ala Gly Ala Ala Leu Leu Phe Ala170 175 180GCA CCT GCA ATG GCA TTT GCA TGG TGG CGG AGA AGA AAA CCG CGA GAA 690Ala Pro Ala Met Ala Phe Ala Trp Trp Arg Arg Arg Lys Pro Arg Glu185 190 195CAT TTC TTT GAT GTG CCA GCT GAA CAG GAC CCA GAA GTG CAC CTT GGT 738His Phe Phe Asp Val Pro Ala Glu Glu Asp Pro Glu Val His Leu Gly200 205 210 215CAA CTG AAG AGG TTT TCT CTG CGA GAA TTG CAA GTC GCA ACG GAT ACT 786Gln Leu Lys Arg Phe Ser Leu Arg Glu Leu Gln Val Ala Thr Asp Thr220 225 230TTT AGT ACC ATA CTT GGA AGA GGT GGA TTT GGT AAG GTG TAT AAG GGA 834Phe Ser Thr Ile Leu Gly Arg Gly Gly Phe Gly Lys Val Tyr Lys Gly235 240 245CGC CTT GCT GAT GGC TCA CTT GTA GCA GTT AAA AGG CTT AAA GAA GAA 882Arg Leu Ala Asp Gly Ser Leu Val Ala Val Lys Arg Leu Lys Glu Glu250 255 260CGA ACA CCA GGT GGT GAG CTG CAG TTT CAA ACA GAG GTG GAA ATG ATT 930Arg Thr Pro Gly Gly Glu Leu Gln Phe Gln Thr Glu Val Glu Met Ile
265 270 275AGC ATG GCT GTG CAT CGA AAT CTT CTG CGT CTA CGT GGT TTC TGC ATG 978Ser Met Ala Val His Arg Asn Leu Leu Arg Leu Arg Gly Phe Cys Met280 285 290 295ACA CCA ACA GAG CGG CTT CTT GTA TAT CCA TAC ATG GCT AAT GGA AGT 1026Thr Pro Thr Glu Arg Leu Leu Val Tyr Pro Tyr Met Ala Asn Gly Ser300 305 310GTT GCG TCG TGT TTA AGA GAG CGT CAG CCA TCA GAA CCT CCC CTT GAT 1074Val Ala Ser Cys Leu Arg Glu Arg Gln Pro Ser Glu Pro Pro Leu Asp315 320 325TGG CCA ACT AGG AAG AGG ATT GCA CTA GGA TCT GCT AGG GGG CTT TCT 1122Trp Pro Thr Arg Lys Arg Ile Ala Leu Gly Ser Ala Arg Gly Leu Ser330 335 340TAT TTG CAT GAC CAT TGT GAT CCC AAG ATT ATC CAT CGT GAT GTA AAA 1170Tyr Leu His Asp His Cys Asp Pro Lys Ile Ile His Arg Asp Val Lys345 350 355GCT GCA AAT ATA TTA TTG GAC GAA GAA TTT GAG GCT GTT GTA GGT GAT 1218Ala Ala Asn Ile Leu Leu Asp Glu Glu Phe Glu Ala Val Val Gly Asp360 365 370 375TTT GTG TTA GCT ATG CTC ATG GAT TAC AAG GAT ACC CAT GTT ACA ACT 1266Phe Gly Leu Ala Arg Leu Met Asp Tyr Lys Asp Thr His Val Thr Thr380 385 390GCT GTA AGG GGT ACC TTG GGC TAC ATA GCT CCC GAG TAC CTC TCG ACT 1314Ala Val Arg Gly Thr Leu Gly Tyr Ile Ala Pro Glu Tyr Leu Ser Thr395 400 405GGA AAG TCA TCA GAG AAG ACC GAT GTC TTT GGT TAT GGG ATT ATG CTC 1362Gly Lys Ser Ser Glu Lys Thr Asp Val Phe Gly Tyr Gly Ile Met Leu410 415 420TTA GAG CTC ATT ACT GGA CAG AGA GCT TTT GAT CTT GCT CGC CTT GCG 1410Leu Glu Leu Ile Thr Gly Gln Arg Ala Phe Asp Leu Ala Arg Leu Ala425 430 435AAC GAT GAT GAT GTT ATG TTG TTG GAT TGG GTT AAA AGC CTT TTG AAA 1458Asn Asp Asp Asp Val Met Leu Leu Asp Trp Val Lys Ser Leu Leu Lys440 445 450 455GAG AAA AAG TTG GAG ATG CTG GTC GAT CCT GAC CTG GAG AAC AAT TAC 1506Glu Lys Lys Leu Glu Met Leu Val Asp Pro Asp Leu Glu Asn Asn Tyr460 465 470ATT GAC ACA GAA GTT GAG CAG CTT ATT CAA GTA GCA TTA CTC TGT ACC 1554Ile Asp Thr Glu Val Glu Gln Leu Ile Gln Val Ala Leu Leu Cys Thr475 480 485CAG GGT TCG CCA ATG GAG CGG CCT AAG ATG TCA GAG GTA GTC CGA ATG 1602Gln Gly Ser Pro Met Glu Arg Pro Lys Met Ser Glu Val Val Arg Met490 495 500CTT GAA GGT GAT GGC CTT GCA GAA AAG TGG GAC GAG TGG CAA AAA GTA 1650Leu Glu Gly Asp Gly Leu Ala Glu Lys Trp Asp Glu Trp Gln Lys Val505 510 515GAA GTC ATC CAT CAA GAC GTA GAA TTA GCT CCA CAT CGA ACT TCT GAA 1698Glu Val Ile His Gln Asp Val Glu Leu Ala Pro His Arg Thr Ser Glu520 525 530 535TGG ATC CTA GAC TCG ACA GAT AAC TTG CAT GCT TTT GAA TTA TCT GGT 1746Trp Ile Leu Asp Ser Thr Asp Asn Leu His Ala Phe Glu Leu Ser Gly540 545 550CCA AGA TAAACAGGAT ATAAAATGTG AATGAAATTA ATAAAAAAAA TGGTTAAAAA 1802Pro ArgAAAAAAAAAA AAA 1815(2)SEQ ID NO:3的信息(ⅰ)序列特征(A)长度553个氨基酸(B)类型氨基酸(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅸ)序列描述SEQ ID NO:3:Met Asn Arg As Ser Ile Asn Ile Leu Asn Tyr Met Gln Phe Thr Asp1 5 10 15Ala Tyr Leu Asp Lys Tyr Gly Val Leu Met Thr Leu Glu Leu Tyr Ser20 25 30Asn Asn Ile Ser Gly Pro Ile Pro Ser Asp Leu Gly Asn Leu Thr Asn35 40 45Leu Val Ser Leu Asp Leu Tyr Met Asn Ser Phe Ser Gly Pro Ile Pro50 55 60Asp Thr Leu Gly Lys Leu Thr Arg Leu Arg Phe Leu Arg Leu Asn Asn65 70 75 80Asn Ser Leu Ser Gly Pro Ile Pro Met Ser Leu Thr Asn Ile Thr Thr85 90 95Leu Gln Val Leu Asp Leu Ser Asn Asn Arg Leu Ser Gly Pro Val Pro100 105 110Asp Asn Gly Ser Phe Ser Leu Phe Thr Pro Ile Ser Phe Ala Asn Asn115 120 125Leu Asn Leu Cys Gly Pro Val Thr Gly Arg Pro Cys Pro Gly Ser Pro130 135 140Pro Phe Ser Pro Pro Pro Pro Phe Ile Pro Pro Ser Thr Val Gln Pro145 150 155 160Pro Gly Gln Asn Gly Pro Thr Gly Ala Ile Ala Gly Gly Val Ala Ala165 170 175Gly Ala Ala Leu Leu Phe Ala Ala Pro Ala Met Ala Phe Ala Trp Trp180 185 190Arg Arg Arg Lys Pro Arg Glu His Phe Phe Asp Val Pro Ala Glu Glu195 200 205Asp Pro Glu Val His Leu Gly Gln Leu Lys Arg Phe Ser Leu Arg Glu210 215 220Leu Gln Val Ala Thr Asp Thr Phe Ser Thr Ile Leu Gly Arg Gly Gly225 230 235 240Phe Gly Lys Val Tyr Lys Gly Arg Leu Ala Asp Gly Ser Leu Val Ala245 250 255Val Lys Arg Leu Lys Glu Glu Arg Thr Pro Gly Gly Glu Leu Gln Phe260 265 270Gln Thr Glu Val Glu Met Ile Ser Met Ala Val His Arg Asn Leu Leu275 280 285Arg Leu Arg Gly Phe Cys Met Thr Pro Thr Glu Arg Leu Leu Val Tyr290 295 300Pro Tyr Met Ala Asn Gly Ser Val Ala Ser Cys Leu Arg Glu Arg Gln305 310 315 320Pro Ser Glu Pro Pro Leu Asp Trp Pro Thr Arg Lys Arg Ile Ala Leu
325330 335Gly Ser Ala Arg Gly Leu Ser Tyr Leu His Asp His Cys Asp Pro Lys340 345 350Ile Ile His Arg Asp Val Lys Ala Ala Asn Ile Leu Leu Asp Glu Glu355 360 365Phe Glu Ala Val Val Gly Asp Phe Gly Leu Ala Arg Leu Met Asp Tyr370 375 380Lys Asp Thr His Val Thr Thr Ala Val Arg Gly Thr Leu Gly Tyr Ile385 390 395 400Ala Pro Glu Tyr Leu Ser Thr Gly Lys Ser Ser Glu Lys Thr Asp Val405 410 415Phe Gly Tyr Gly Ile Met Leu Leu Glu Leu Ile Thr Gly Gln Arg Ala420 425 430Phe Asp Leu Ala Arg Leu Ala Asn Asp Asp Asp Val Met Leu Leu Asp435 440 445Trp Val Lys Ser Leu Leu Lys Glu Lys Lys Leu Glu Met Leu Val Asp450 455 460Pro Asp Leu Glu Asn Asn Tyr Ile Asp Thr Glu Val Glu Gln Leu Ile465 470 475 480Gln Val Ala Leu Leu Cys Thr Gln Gly Ser Pro Met Glu Arg Pro Lys485 490 495Met Ser Glu Val Val Arg Met Leu Glu Gly Asp Gly Leu Ala Glu Lys500 505 510Trp Asp Glu Trp Gln Lys Val Glu Val Ile His Gln Asp Val Glu Leu515 520 525Ala Pro His Arg Thr Ser Glu Trp Ile Leu Asp Ser Thr Asp Asn Leu530 535 540His Ala Phe Glu Leu Ser Gly Pro Arg545 550(2)SEQ ID NO:4的信息(ⅰ)序列特征(A)长度13个碱基对(B)类型核酸(C)链型单链(D)拓扑结构未知(ⅲ)假设否(ⅲ)反义否(ⅳ)原始来源(A)生物体引物(primer)(ⅸ)序列描述SEQ IDNO:4:TTTTTTTTTT TGC13(2)SEQ ID NO:5的信息(ⅰ)序列特征(A)长度10个碱基对(B)类型核酸(C)链型单链(D)拓扑结构未知(ⅲ)假设否(ⅲ)反义否(ⅵ)原始来源(A)生物体引物(ⅸ)序列描述SEQ IDNO:5:GGGATCTAAG10(2)SEQ ID NO:6的信息(ⅰ)序列特征(A)长度10个碱基对
(B)类型核酸(C)链型单链(D)拓扑结构未知(ⅲ)假设否(ⅲ)反义否(ⅵ)原始来源(A)生物体引物(ⅸ)序列描述SEQ ID NO:6:ACACGTGGTC10(2)SEQ ID N0:7的信息(ⅰ)序列特征(A)长度10个碱基对(B)类型核酸(C)链型单链(D)拓扑结构未知(ⅲ)假设否(ⅲ)反义否(ⅵ)原始来源(A)生物体引物(ⅸ)序列描述SEQ ID NO:7:TCAGCACAGG10(2)SEQ ID NO:8的信息(ⅰ)序列特征(A)长度14个碱基对(B)类型核酸(C)链型单链(D)拓扑结构未知
(ⅲ)假设否(ⅲ)反义否(ⅵ)原始来源(A)生物体引物(ⅸ)序列描述SEQ ID NO:8:TTTTTTTTTT TCTG 14(2)SEQ ID NO:9的信息(ⅰ)序列特征(A)长度13个碱基对(B)类型核酸(C)链型单链(D)拓扑结构未知(ⅲ)假设否(ⅲ)反义否(ⅵ)原始来源(A)生物体引物(ⅸ)序列描述SEQ ID NO:9:TTTTTTTTTT TCA13(2)SEQ ID NO:10的信息(ⅰ)序列特征(A)长度10个碱基对(B)类型核酸(C)链型单链(D)拓扑结构未知(ⅲ)假设否(ⅲ)反义否(ⅵ)原始来源
(A)生物体引物(ⅸ)序列描述SEQ ID NO:10:GACATCGTCC10(2)SEQ ID NO:11的信息(ⅰ)序列特征(A)长度10个碱基对(B)类型核酸(C)链型单链(D)拓扑结构未知(ⅲ)假设否(ⅲ)反义否(ⅵ)原始来源(A)生物体引物(ⅸ)序列描述SEQ ID NO:11:CCCTACTGGT10(2)SEQ ID NO:12的信息(ⅰ)序列特征(A)长度10个碱基对(B)类型核酸(C)链型单链(D)拓扑结构未知(ⅲ)假设否(ⅲ)反义否(ⅵ)原始来源(A)生物体引物(ⅸ)序列描述SEQ ID NO:12:ACACGTGGTC10(2)SEQ ID NO:13的信息(ⅰ)序列特征(A)长度10个碱基对(B)类型核酸(C)链型单链(D)拓扑结构未知(ⅲ)假设否(ⅲ)反义否(ⅵ)原始来源(A)生物体引物(ⅸ)序列描述SEQ ID NO:13:GGTGACTGTC10(2)SEQ ID NO:14的信息(ⅰ)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑结构未知(ⅲ)假设否(ⅲ)反义否(ⅵ)原始来源(A)生物体引物(ⅸ)序列描述SEQ ID NO:14:TCTTGGACCA GATAATTC 18(2)SEQ ID NO:15的信息(ⅰ)序列特征
(A)长度19个碱基对(B)类型核酸(C)链型单链(D)拓扑结构未知(ⅲ)假设否(ⅲ)反义否(ⅵ)原始来源(A)生物体引物(ⅸ)序列描述SEQ ID NO:15:CTCTGATGAC TTTCCAGTC 19(2)SEQ ID NO:16的信息(ⅰ)序列特征(A)长度16个碱基对(B)类型核酸(C)链型单链(D)拓扑结构未知(ⅲ)假设否(ⅲ)反义否(ⅵ)原始来源(A)生物体引物(ⅸ)序列描述SEQ ID NO:16:AATGGCATTT GCATGG 16(2)SEQ ID NO:17的信息(ⅰ)序列特征(A)长度5个氨基酸(B)类型氨基酸(C)链型单链
(D)拓扑结构未知(ⅱ)分子类型肽(ⅲ)假设否(ⅲ)反义否(ⅵ)原始来源(A)生物体Daucus carota(ⅸ)序列描述SEQ ID NO:17:Ser Pro Pro Pro Pro1 5(2)SEQ ID NO:18的信息(ⅰ)序列特征(A)长度8个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构未知(ⅱ)分子类型肽(ⅲ)假设否(ⅲ)反义否(ⅵ)原始来源(A)生物体Daucus carota(ⅸ)序列描述SEQ ID NO:18:His Arg Asp Val Lys Ala Ala Asn1 5(2)SEQ ID NO:19的信息(ⅰ)序列特征(A)长度9个氨基酸(B)类型氨基酸
(C)链型单链(D)拓扑结构未知(ⅱ)分子类型肽(ⅲ)假设否(ⅲ)反义否(ⅵ)原始来源(A)生物体Daucus carota(ⅸ)序列描述SEQ ID NO:19:Gly Thr Leu Gly Tyr Ile Ala Pro Glu1 5(2)SEQ ID NO:20的信息(ⅰ)序列特征(A)长度4081个碱基对(B)类型核酸(C)链型双链(D)拓扑结构未知(ⅱ)分子类型DNA(基因组)(ⅲ)假设否(ⅲ)反义否(ⅵ)原始来源(A)生物体Arabidopsis thaliana(ⅵ)间接来源(A)克隆Arabidopsis SERK基因(ⅸ)特征(A)名称/关键词外显子(B)位置1280..1367(ⅸ)特征(A)名称/关键词外显子
(B)位置1796..1928(ⅸ)特征(A)名称/关键词外显子(B)位置2014..2085(ⅸ)特征(A)名称/关键词外显子(B)位置2203..2346(ⅸ)特征(A)名称/关键词外显子(B)位置2450..2521(ⅸ)特征(A)名称/关键词外显子(B)位置2617..2688(ⅸ)特征(A)名称/关键词外显子(B)位置2772..2884(ⅸ)特征(A)名称/关键词外显子(B)位置3015..3146(ⅸ)特征(A)名称/关键词外显子(B)位置3305..3646(ⅸ)特征(A)名称/关键词外显子(B)位置3760..4081(ⅸ)序列描述SEQ ID NO:20:TCTAGAAACC TTTTGATCAT AATGAAAATA AAGAGTCCAT CCACCACATG GGGTAAGCAT 60AATGTGTGAT ATTTAAAGGG TAACAAATGT AATCTGCTTT TTATTTTACT TTTTACCTCT 120ACTCAAATTG TATGGGCAGT TTTTTTTTTT TTTTAAATGA TAAGACAAGT ATCTGTTTAA 180TGGTATTGTG ATGAAACAGT AGTAAAGTCA TATCGGGCAC GCCATACTAC TTCCACAGTG 240GAACTTGGCC AAATTTTGTC TTTGCCGTCT CTACAGTTTC TTCCACCAAA TTTTTTGTTG 300ACAAAACTCA AATCTTTCAA TCTCATCTCT GCCAAAGTTG GGTTTAGAAA GAATATCAGC 360AAACACTAAT ATCTTTATTG TTGCATGGTT TATCAATCAC AAAATTCACA ACCATTGTAA 420AAAAAAATTC ACATTTTTGG TATGAGATTG CTCACATGAT AGTGAACCTC TTTAACATTT 480TAACTTTACT TTCATAAATA CGGGATTACG AATCTTACTT GCATTAAAAA TTTAGAAAAG 540GTTTTTCTAC TTAAAGAAAA AAGGGACCCA ACAGAGAGAG GTTTGACCAG GAGAAACGGG 600TGCATAGCCT TAAGAGCTTT CAACTACTTT ACCCCAAACC CAAAGCGATG TCACTTTCAA 660CCATCTCTTC TCTCCCCCGA ACCCGTTTTT TTGACCGGTC AGTTCGGGCA GCAGCACCGT 720TACGGGCAGC TTATATTCCT CGTCTTCCTC CTCTACACCA CTGCATGCCC ATAAATAAAG 780CCCGTTGAGA TCTTTAAAAA TATTAAATAA TATATCAACG AAAAAGCTAT TTTATTCATA 840AGAAGAAAAA GAGAGGAACA ACAACAACAC ACTAATCATA GTTTCTCTGG CAGGCTTGTT 900GTTGCGGCTT AATAAAAAGC TCTTTTGTTA TTATTACTTC ACGTAGATTT TCCCCAAAAA 960GCTCTTATTT TTTTGTTTAA AAAAAAAAGT TTCATCTTTA TTCAACTTTT GTTTTACAGT1020GTGTGTGTGA GAGAGAGAGT GTGGTTTGAT TGAGGAAAGA CGACGACGAG AACGCCGGAG 1080AATTAGGATT TTTATTTTAT TTTTTACTCT TTGTTTGTTT TAATGCTAAT GGGTTTTTAA 1140AAGGGTTATC GAAAAAATGA GTGAGTTTGT GTTGAGGTTG TCTCTGTAAA GTGTTAATGG 1200TGGTGATTTT CGGAAGTTAG GGTTTTCTCG GATCTGAAGA GATCAAATCA AGATTCGAAA 1260TTTAGCATTG TTGTTTGAAA TGGAGTCGAG TTATGTGGTG TTTATCTTAC TTTCACTGAT 1320CTTACTTCCG AATCATTCAC TGTGGCTTGC TTCTGCTAAT TTGGAAGGTT CTTGGTTACT 1380CAATTACTCA TCTTTACTCG TTTCTCAATT ACTTTCTCGA TTCTTTTTTA TTTGGAGGTG 1440AATCGCTATC TTTAGTGTCT GCATTTTGAT TTATGAAAAT TGTTGTTGTT CTTTGTATTT 1500GTAAGATTTA GTGGCTCGTA CTTTGAATAC ACTGTTTTGC TTTTCTTGTT CAGATCAACT 1560TTGTATATTG TAAAGGCATG TTCTTTGGGT TGAAAAGCTG GGTTATTTGA TATCTTAAGA 1620TTGATGTTGT TGATCCAAAC ATTCTCTGAA AGACTTCATT TGTTTTTGGT TTTGTAAAGA 1680ATTTGTTTAA TTATTAGCCT CTAATCTCAG AGAGGCCTGT TTGAATAGTT CTCTCTTGAA 1740ATTAGACTTT TCACCAATTG ATGCTAATTG TGTAGATTTG TTGTTCTTGT TATAGGTGAT 1800GCTTTGCATA CTTTGAGGGT TACTCTAGTT GATCCAAACA ATGTCTTGCA GAGCTGGGAT 1860CCTACGCTAG TGAATCCTTG CACATGGTTC CATGTCACTT GCAACAACGA GAACAGTGTC 1920ATAAGAGTGT AAAGCTTTCT TCTACTAATC CCACTTTTTA AACTTTGACC TCAGCGTGGT1980TACCGACATT TTTGTTTCTT TTGTCAAATA CAGTGATTTG GGGAATGCAG AGTTATCTGG2040CCATTTAGTT CCAGAGCTTG GTGTGCTCAA GAATTTGCAG TATTTGTAAG TTCCACTTAT2100GCATCATGCT TTAACAAAAC AAATCCAAGA TTTGACAGAA GAAGCACTGG AGTTACCTTT2160TGTAATTGAA ATCTTTTTAA CAAGTTTCTT ATTTTCTTAC AGGGAGCTTT ACAGTAACAA2220CATAACTGGC CCGATTCCTA GTAATCTTGG AAATCTGACA AACTTAGTGA GTTTGGATCT2280TTACTTAAAC AGCTTCTCCG GTCCTATTCC GGAATCATTG GGAAAGCTTT CAAAGCTGAG2340ATTTCTGTGA GTATACATAT GCTTTACCGG CTCAGTTACA GTCTTTGTTT AATCTTAGGT2400TTTGTTCCAA TTTTTGACTC TTTGCTGAAA ATTTTACATG CAAGAATAGC CGGCTTAACA2460ACAACAGTCT CACTGGGTCA ATTCCTATGT CACTGACCAA TATTACTACC CTTCAAGTGT2520TGTGAGTCCT CTCATTAACT TTCATTTATG TCTACTTCAT TCTCCCTCAG TTGATTTGTT2580GAGTTAATGC ACTTAACCTT GATGGATGCA ACACAGAGAT CTATCAAATA ACAGACTCTC2640TGGTTCAGTT CCTGACAATG GCTCCTTCTC ACTCTTCACA CCCATCAGGT TCTATGATTT2700ATCCTCTTCA GTTATTTCAG TTGTTGTGTC AGTGTCTGAA CTTATTCTGA AACTTTCATT2760TCCTTGTGCA GTTTTGCTAA TAACTTAGAC CTATGTGGAC CTGTTACAAG TCACCCATGT2820CCTGGATCTC CCCCGTTTTC TCCTCCACCA CCTTTTATTC AACCTCCCCC AGTTTCCACC2880CCGAGTAAGC CTCCTCTTTT TAGTTTACAT TATAGGAAAC AGAAGATGAA ATCTTTGCTT2940CTCTGTCAAT CCTTTTTCTC ATATAACTCA TCTTGCCAAT AAGGCAATAA CCAAATGATC3000TAATTTGATT TCAGGTGGGT ATGGTATAAC TGGAGCAATA GCTGGTGGAG TTGCTGCAGG3060TGCTGCTTTG CTCTTTGCTG CTCCTGCAAT AGCCTTTGCT TGGTGGCGAC GAAGAAAGCC3120ACTAGATATT TTCTTCGATG TGCCTGGTGA GTTTATTATT CGCATTAGTT TCTGTTCTTA3180GCCAGCAATT TTGTTTTGCA GAAAAGTATT GGAACAACTG TTAATGAAAA TCAATACATA3240AGTCATTGTT TTTTAAGTTA CAAACTCTTT TGAGTAAAAT CTCGATTGCA AAATCTCTAT3300GCAGCCGAAG AAGATCCAGA AGTTCATCTG GGACAGCTCA AGAGGTTTTC TTTGCGGGAG3360CTACAAGTGG CGAGTGATGG GTTTAGTAAC AAGAACATTT TGGGCAGAGG TGGGTTTGGG3420AAAGTCTACA AGGGACGCTT GGCAGACGGA ACTCTTGTTG CTGTCAAGAG ACTGAAGGAA3480GAGCGAACTC CAGGTGGAGA GCTCCAGTTT CAAACAGAAG TAGAGATGAT AAGTATGGCA3540GTTCATCGAA ACCTGTTGAG ATTACGAGGT TTCTGTATGA CACCGACCGA GAGATTGCTT3600GTGTATCCTT ACATGGCCAA TGGAAGTGTT GCTTCGTGTC TCAGAGGTAA AAACTAAACA3660ATTAAACATC TTGTGCTCTC TCTCAATTAC TTTGACGTGA ATTGTTTTTT CATGTTTTCC3720TTTATGGGTT CATAATTGTT GGTTACACTA ATGACACAGA GAGGCCACCG TCACAACCTC3780CGCTTGATTG GCCAACGCGG AAGAGAATCG CGCTAGGCTC AGCTCGAGGT TTGTCTTACC3840TACATGATCA CTGCGATCCG AAGATCATTC ACCGTGACGT AAAAGCAGCA AACATCCTCT3900TAGACGAAGA ATTCGAAGCG GTTGTTGGAG ATTTCGGGTT GGCAAAGCTA ATGGTCTATA3960AAGACACTCA CGTGACAACA GCAGTCCGTG GCACCATCGG TCACATCGCT CCAGAATATC4020TCTCAACCGG AAAATCTTCA GAGAAAACCG ACGTTTTCGG ATACGGAATC ATGCTTCTAG4080A4081(2)STQ ID NO:21的信息(ⅰ)序列特征(A)长度494个氨基酸(B)类型氨基酸(C)链型未知(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅲ)假设否(ⅴ)片段类型N-端(ⅸ)序列描述SEQ ID NO:21:Met Glu Ser Ser Tyr Vel Vel Phe Ile Leu Leu Ser Leu Ile Leu Leu1 5 10 15Pro Asn His Ser Leu Trp Leu Ala Ser Ala Asn Leu Glu Gly Asp Ala20 25 30Leu His Thr Leu Arg Val Thr Leu Val Asp Pro Asn Asn Val Leu Gln35 40 45Ser Trp Asp Pro Thr Leu Val Asn Pro Cys Thr Trp Phe His Val Thr50 55 60Cys Asn Asn Glu Asn Ser Val Ile Arg Val Asp Leu Gly Asn Ala Glu65 70 75 80Leu Ser Gly His Leu Val Pro Glu Leu Gly Val Leu Lys Asn Leu Gln85 90 95Glu Leu Tyr Ser Asn Asn Ile Thr Gly Pro Ile Pro Ser Asn Leu Gly100 105 110Aan Leu Thr Asn Leu Val Ser Leu Asp Leu Tyr Leu Asn Ser Phe Ser115 120 125Gly Pro Ile Pro Glu Ser Leu Gly Lys Leu Ser Lys Leu Arg Phe Leu130 135 140Arg Leu Asn Asn Asn Ser Leu Thr Gly Ser Ile Pro Met Ser Leu Thr145 150 155 160Asn Ile Thr Thr Leu Gln Val Leu Asp Leu Ser Asn Asn Arg Leu Ser165 170 175Gly Ser Val Pro Asp Asn Gly Ser Phe Ser Leu Phe Thr Pro Ile Ser180 185 190Phe Ala Asn Asn Leu Asp Leu Cys Gly Pro Val Thr Ser His Pro Cys195 200 205Pro Gly Ser Pro Pro Phe Ser Pro Pro Pro Pro Phe Ile Gln Pro Pro210 215 220Pro Val Ser Thr Pro Ser Gly Tyr Gly Ile Thr Gly Ala Ile Ala Gly225 230 235 240Gly Val Ala Ala Gly Ala Ala Leu Leu Phe Ala Ala Pro Ala Ile Ala245 250 255Phe Ala Trp Trp Arg Arg Arg Lys Pro Leu Asp Ile Phe Phe Asp Val260 265 270Pro Ala Glu Glu Asp Pro Glu Val His Leu Gly Gln Leu Lys Arg Phe275 280 285Ser Leu Arg Glu Leu Gln Val Ala Ser Asp Gly Phe Ser Asn Lys Asn
290 295 300Ile Leu Gly Arg Gly Gly Phe Gly Lys Val Tyr Lys Gly Arg Leu Ala305 310 315 320Asp Gly Thr Leu Val Ala Val Lys Arg Leu Lys Glu Glu Arg Thr Pro325 330 335Gly Gly Glu Leu Gln Phe Gln Thr Glu Val Glu Met Ile Ser Met Ala340 345 350Val His Arg Asn Leu Leu Arg Leu Arg Gly Phe Cys Met Thr Pro Thr355 360 365Glu Arg Leu Leu Val Tyr Pro Tyr Met Ala Asn Gly Ser Val Ala Ser370 375 380Cys Leu Arg Glu Arg Pro Pro Ser Gln Pro Pro Leu Asp Trp Pro Thr385 390 395 400Arg Lys Arg Ile Ala Leu Gly Ser Ala Arg Gly Leu Ser Tyr Leu His405 410 415Asp His Cys Asp Pro Lys Ile Ile His Arg Asp Val Lys Ala Ala Asn420 425 430Ile Leu Leu Asp Glu Glu Phe Glu Ala Val Val Gly Asp Phe Gly Leu435 440 445Ala Lys Leu Met Asp Tyr Lys Asp Thr His Val Thr Thr Ala Val Arg450 455 460Gly Thr Ile Gly His Ile Ala Pro Glu Tyr Leu Ser Thr Gly Lys Ser465 470 475 480Ser Glu Lys Thr Asp Val Phe Gly Tyr Gly Ile Met Leu Leu485 490(2)SEQ ID NO:22的信息(ⅰ)序列特征(A)长度1106个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA到mRNA(ⅲ)假设否(ⅸ)特征(A)名称/关键词CDS(B)位置142..795(ⅸ)序列描述SEQ ID NO:22:TCGACCCACG CGTCCGTCCA ACTTCAATAA AGGGGAAACC AACGTAACCC TAATTTTGCT 60TTCTCCTCTT TGTTCAGAAA ATTTTCCCTT TACTCTCAAA TTCCTTTTCG ATTTCCCTCT 120CTTAAACCTC CGAAAGCTCA C ATG GCG TCT CGA AAC TAT CGG TGG GAG CTC 171Met Ala Ser Arg Asn Tyr Arg Trp Glu Leu1 5 10TTC GCA GCT TCG TTA ACC CTA ACC TTA GCT TTG ATT CAC CTG GTC GAA 219Phe Ala Ala Ser Leu Thr Leu Thr Leu Ala Leu Ile His Leu Val Glu15 20 25GCA AAC TCC GAA GGA GAT GCT CTC TAC GCT CTT CGC CGG AGT TTG ACA 267Ala Asn Ser Glu Gly Asp Ala Leu Tyr Ala Leu Arg Arg Ser Leu The30 35 40GAT CCA GAC CAT GTC CTC CAG AGC TGG GAT CCA ACT CTT GTT AAT CCT315Asp Pro Asp His Val Leu Gln Ser Trp Asp Pro Thr Leu Val Asn Pro45 50 55TGT ACC TGG TTC CAT GTC ACC TGT AAC CAA GAC AAC CGC GTC ACT CGT363Cys Thr Trp Phe His Val Thr Cys Asn Gln Asp Asn Arg Val Thr Arg60 65 70GTG GAT TTG GGA AAT TCA AAC CTC TCT GGA CAT CTT GCG CCT GAG CTT411Val Asp Leu Gly Asn Ser Asn Leu Ser Gly His Leu Ala Pro Glu Leu75 80 85 90GGG AAG CTT GAA CAT TTA CAG TAT CTA GAG CTC TAC AAA AAC AAC ATC459Gly Lys Leu Glu His Leu Gln Tyr Leu Glu Leu Tyr Lys Asn Asn Ile95 100 105CAA GGA ACT ATA CCT TCC GAA CTT GGA AAT CTG AAG AAT CTC ATC AGC507Gln Gly Thr Ile Pro Ser Glu Leu Gly Asn Leu Lys Asn Leu Ile Ser110 115 120TTG GAT CTG TAC AAC AAC AAT CTT ACA GGG ATA GTT CCC ACT TTC TTG555Leu Asp Leu Tyr Asn Asn Asn Leu Thr Gly Ile Val Pro Thr Phe Leu125 130 135GGA AAA TTG AAG TCT CTG GTC TTT TTA CGG CTT AAT GAC AAC CGA TTG603Gly Lys Leu Lys Ser Leu Val Phe Leu Arg Leu Asn Asp Asn Arg Leu140 145 150ACC GGT CCA ATC CTA GAG CAC TCA CGG CAA TCC CAA GCC TTT AAA GTT651Tnr Gly Pro Ile Leu Glu His Ser Arg Gln Ser Gln Ala Phe Lys Val155 160 165 170GTT GAC GTC TCA AGC AAT GAT TTG TGT GGG ACA ATC CCA ACA AAC GGA699Val Asp Val Ser Ser Asn Asp Leu Cys Gly Thr Ile Pro Thr Asn Gly175 180 185CCC TTT GCT CAC ATT CCT TTA CAG AAC TTT GAG AAC AAC CCG AGA TTG747Pro Phe Ala His Ile Pro Leu Gln Asn Phe Glu Asn Asn Pro Arg Leu190 195 200GAS GGA CCG GAA TTA CTC GGT CTT GCA AGC TAC GAC ACT AAC TGC ACC 795Glu Gly Pro Glu Leu Leu Gly Leu Ala Ser Tyr Asp Thr Asn Cys Thr205 210 215TGAAACAACT GGCAAAACCT GAAAATGAAG AATTGGGGGG TGACCTTGTA AGAACACTTC855ACCACTTTAT CAAATATCAC ATCTATTATG TAATAAGTAT ATATATGTAG TAAAAACAAA915AAAAATGAAG AATCGAATCG GTAATATCAT CTGGTCTCAA TTGAGAACTT CGAGGTCTGT975ATGTAAAATT TCTAAATGCG ATTTTCGCTT ACTGTAATGT TCGGTTGTGG GATTCTGAGA 1035AGTAACATTT GTATTGGTAT GGTATCAAGT TGTTCTGCCT TGTCTGCAAA AAAAAAAAAA 1095AAAAAAAAAA A1106(2)SEQ ID NO:23的信息(ⅰ)序列特征(A)长度218个氨基酸(B)类型氨基酸(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅸ)序列描述SEQ ID NO:23:Met Ala Ser Arg Asn Tyr Arg Trp Glu Leu Phe Ala Ala Ser Leu Thr1 5 10 15Leu Thr Leu Ala Leu Ile His Leu Val Glu Ala Asn Ser Glu Gly Asp20 25 30Ala Leu Tyr Ala Leu Arg Arg Ser Leu Thr Asp Pro Asp His Val Leu35 40 45Gln Ser Trp Asp Pro Thr Leu Val Asn Pro Cys Thr Tro Phe His Val50 55 60Thr Cys Asn Gln Asp Asn Arg Val Thr Arg Val Asp Leu Gly Asn Ser65 70 75 80Asn Leu Ser Gly His Leu Ala Pro Glu Leu Gly Lys Leu Glu His Leu85 90 95Gln Tyr Leu Glu Leu Tyr Lys Asn Asn Ile Gln Gly Thr Ile Pro Ser100 105 110Glu Leu Gly Asn Leu Lys Asn Leu Ile Ser Leu Asp Leu Tyr Asn Asn115 120 125Asn Leu Thr Gly Ile Val Pro Thr Phe Leu Gly Lys Leu Lys Ser Leu130 135 140Val Phe Leu Arg Leu Asn Asp Asn Arg Leu Thr Gly Pro Ile Leu Glu145 150 155 160His Ser Arg Gln Ser Gln Ala Phe Lys Val Val Asp Val Ser Ser Asn165 170 175Asp Leu Cys Gly Thr Ile Pro Thr Asn Gly Pro Phe Ala His Ile Pro180 185 190Leu Gln Asn Phe Glu Asn Asn Pro Arg Leu Glu Gly Pro Glu Leu Leu195 200 205Gly Leu Ala Ser Tyr Asp Thr Asn Cys Thr210 215(2)SEQ ID NO:24的信息(ⅰ)序列特征(A)长度981个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA到mRNA(ⅲ)假设否(ⅸ)特征(A)名称/关键词CDS(B)位置104..757(ⅸ)序列描述SEQ ID NO:24:AGTGTGAGTA ATTTAGTTTG CTTTCTCCTC TTTGTTCAGA AAATTTTCCC TTTACTCTCA 60AATTCCTTTT CGATTTCCCT CTCTTAAACC TCCGAAAGCT CAC ATG GCG TCT CGA115Met Ala Ser Arg1AAC TAT CGG TGG GAG CTC TTC GCA GCT TCG TTA ACC CTA ACC TTA GCT163Asn Tyr Arg Trp Glu Leu Phe Ala Ala Ser Leu Thr Leu Thr Leu Ala5 10 15 20TTG ATT CAC CTG GTC GAA GCA AAC TCC GAA GGA GAT GCT CTC TAC GCT211Leu Ile His Leu Val Glu Ala Asn Ser Glu Gly Asp Ala Leu Tyr Ala25 30 35CTT CGC CGG AGT TTG ACA GAT CCA GAC CAT GTC CTC CAG AGC TGG GAT259Leu Arg Arg Ser Leu Thr Asp Pro Asp His Val Leu Gln Ser Trp Asp40 45 50CCA ACT CTT GTT AAT CCT TGT ACC TGG TTC CAT GTC ACC TGT AAC CAA307Pro Thr Leu Val Asn Pro Cys Thr Trp Phe His Val Thr Cys Asn Gln55 60 65GAC AAC CGC GTC ACT CGT GTG GAT TTG GGA AAT TCA AAC CTC TCT GGA355Asp Asn Arg Val Thr Arg Val Asp Leu Gly Asn Ser Asn Leu Ser Gly70 75 80CAT CTT GCG CCT GAG CTT GGG AAG CTT GAA CAT TTA CAG TAT CTA GAG403His Leu Ala Pro Glu Leu Gly Lys Leu Glu His Leu Gln Tyr Leu Glu85 90 95 100CTC TAC AAA AAC AAC ATC CAA GGA ACT ATA CCT TCC GAA CTT GGA AAT451Leu Tyr Lys Asn Asn Ile Gln Gly Thr Ile Pro Ser Glu Leu Gly Asn105 110 115CTG AAG AAT CTC ATC AGC TTG GAT CTG TAC AAC AAC AAT CTT ACA GGG499Leu Lys Asn Leu Tle Ser Leu Asp Leu Tyr Asn Asn Asn Leu Thr Gly120 125 130ATA GTT CCC ACT TCT TTG GGA AAA TTG AAG TCT CTG GTC TTT TTA CGG547Ile Val Pro Thr Ser Leu Gly Lys Leu Lys Ser Leu Val Phe Leu Arg135 140 145CTT AAT GAC AAC CGA TTG ACC GGT CCA ATC CCT AGA GCA CTC ACG GCA595Leu Asn Asp Asn Arg Leu Thr Gly Pro Ile Pro Arg Ala Leu Thr Ala150 155 160ATC CCA AGC CTT AAA GTT GTT GAC GTC TCA AGC AAT GAT TTG TGT GGA643Ile Pro Ser Leu Lys Val Val Asp Val Ser Ser Asn Asp Leu Cys Gly165 170 175 180ACA ATC CCA ACA AAC GGA CCC TTT GCT CAC ATT CCT TTA CAG AAC TTT691Thr Ile Pro Thr Asn Gly Pro Phe Ala His Ile Pro Leu Gln Asn Phe185 190 195GAG AAC AAC CCG AGA TTG GAG GGA CCG GAA TTA CTC GGT CTT GCA AGC739Glu Asn Asn Pro Arg Leu Glu Gly Pro Glu Leu Leu Gly Leu Ala Ser200 205 210TAC GAC ACT AAC TGC ACC TGAAACAACT GGCCAAAACCT GAAAATGAAG 787Tyr Asp Thr Asn Cys Thr215AATTGGGGGG TGACCTTGTA AGAACACTTC ACCACTTTAT CAAATATCAC ATCTATTATG 847TAATAAGTAT ATATATGTAG TAAAAACAAA AAAAATGAAG AATCGAATCG GTAATATCAT 907CTGGTCTCAA TTGAGAACTT CGAGGTCTGT ATGTAAAATT TCTAAATGCG ATTTTCGCCT 967AAATTACTCA CACT981(2)SEQ ID NO:25的信息(ⅰ)序列特征(A)长度218个氨基酸(B)类型氨基酸(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅸ)序列描述SEQ ID NO:25:Met Ala Ser Arg Asn Tyr Arg Trp Glu Leu Phe Ala Ala Ser Leu Thr1 5 10 15Leu Thr Leu Ala Leu Ile His Leu Val Glu Ala Asn Ser Glu Gly Asp20 25 30Ala Leu Tyr Ala Leu Arg Arg Ser Leu Thr Asp Pro Asp His Val Leu35 40 45Gln Ser Trp Asp Pro Thr Leu Val Asn Pro Cys Thr Trp Phe His Val
50 55 60Thr Cys Asn Gln Asp Asn Arg Val Thr Arg Val Asp Leu Gly Asn Ser65 70 75 80Asn Leu Ser Gly His Leu Ala Pro Glu Leu Gly Lys Leu Glu His Leu85 90 95Gln Tyr Leu Glu Leu Tyr Lys Asn Asn Ile Gln Gly Thr Ile Pro Ser100 105 110Glu Leu Gly Asn Leu Lys Asn Leu Ile Ser Leu Asp Leu Tyr Asn Asn115 120 125Asn Leu Thr Gly Ile Val Pro Thr Ser Leu Gly Lys Leu Lys Ser Leu130 135 140Val Phe Leu Arg Leu Asn Asp Asn Arg Leu Thr Gly Pro Ile Pro Arg145 150 155 160Ala Leu Thr Ala Ile Pro Ser Leu Lys Val Val Asp Val Ser Ser Asn165 170 175Asp Leu Cys Gly Thr Ile Pro Thr Asn Gly Pro Phe Ala His Ile Pro180 185 190Leu Gln Asn Phe Glu Asn Asn Pro Arg Leu Glu Gly Pro Glu Leu Leu195 200 205Gly Leu Ala Ser Tyr Asp Thr Asn Cys Thr210 215(2)SEQ ID NO:26的信息(ⅰ)序列特征(A)长度789个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA到mRNA(ⅲ)假设否(ⅸ)特征(A)名称/关键词CDS(B)位置2..661(ⅸ)序列描述SEQ ID NO:26:T CGA CCC ACG CGT CCG CGA AAC TAT CGG TGG GAG CTC TTC GCA GCT 46Arg Pro Thr Arg Pro Arg Asn Tyr Arg Trp Glu Leu Phe Ala Ala1 5 10 15TCG TTA ATC CTA ACC TTA GCT TTG ATT CAC CTG GTC GAA GCA AAC TCC 94Ser Leu Ile Leu Thr Leu Ala Leu Ile His Leu Val Glu Ala Asn Ser20 25 30GAA GGA GAT GCT CTT TAC GCT CTT CGC CGG AGT TTA ACA GAT CCG GAC142Glu Gly Asp Ala Leu Tyr Ala Leu Arg Arg Ser Leu Thr Asp Pro Asp35 40 45CAT GTT CTC CAG AGC TGG GAT CCA ACT CTT GTT AAT CCT TGT ACC TGG190His Val Leu Gln Ser Trp Asp Pro Thr Leu Val Asn Pro Cys Thr Trp50 55 60TTC CAT GTC ACC TGT AAC CAA GAC AAC CGC GTC ACT CGT GTG GAT TTG238Phe His Val Thr Cys Asn Gln Asp Asn Arg Val Thr Arg Val Asp Leu65 70 75GGG AAT TCA AAC CTC TCT GGA CAT CTT GCA CCT GAG CTT GGG AAG CTP286Gly Asn Ser Asn Leu Ser Gly His Leu Ala Pro Glu Leu Gly Lys Leu80 85 90 95GAA CAT TTA CAG TAT CTA GAG CTC TAC AAA AAC AAC ATC CAA GGA ACT334Glu His Leu Gln Tyr Leu Glu Leu Tyr Lys Asn Asn Ile Gln Gly Thr100 105 110ATA CCT TCC GAA CTT GGA AAT CTG AAG AAT CTC ATC AGC TTG GAT CTG382Ile Pro Ser Glu Leu Gly Asn Leu Lys Asn Leu Ile Ser Leu Asp Leu115 120 125TAC AAC AAC AAT CTT ACA GGG ATA GTT CCC ACT TCT TTG GGA AAA TTG430Tyr Asn Asn Asn Leu Thr Gly Ile Val Pro Thr Ser Leu Gly Lys Leu130 135 140AAG TCT CTG GTC TTT TTA CGG CTT AAT GAC AAC CGA TTG ACG GGG CCA478Lys Ser Leu Val Phe Leu Arg Leu Asn Asp Asn Arg Leu Thr Gly Pro145 150 155ATC CCT AGA GCA CTC ACT GCA ATC CCA AGC CTT AAA GTT GGT GAT GTC526Ile Pro Arg Ala Leu Thr Ala Ile Pro Ser Leu Lys Val Val Asp Val160 165 170 175TCA AGC AAT GAT TTG TGT GGA ACA ATC CCA ACA AAC GGA CCT TTT GCT574Ser Ser Asn Asp Leu Cys Gly Thr Ile Pro Thr Asn Gly Pro Phe Ala180 185 190CAC ATT CCT TTA CAG AAC TTT GAG AAC AAC CCG AGG TTG GAG GGA CCG622His Ile Pro Leu Gln Asn Phe Glu Asn Asn Pro Arg Leu Glu Gly Pro195 200 205GAA TTA CTC GGT CTT GCA AGC TAC GAC ACT AAC TGC ACC TGAAAAAATT 671Glu Leu Leu Gly Leu Ala Ser Tyr Asp Thr Asn Cys Thr210 215 220GGCAAAACCT GAAAATGAAG AATTGGGGGG TGACCTTTTA AGAACACTTC ACCACTTTAT 731CAAATATCAC ATCTACTATG TAATAAGTAT ATATATGTAG TCCAAAAAAA AAAAAAAA789(2)SEQ ID NO:27的信息(ⅰ)序列特征(A)长度220个氨基酸(B)类型氨基酸(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅸ)序列描述SEQ IDNO:27:Arg Pro Thr Arg Pro Arg Asn Tyr Arg Trp Glu Leu Phe Ala Ala Ser1 5 10 15Leu Ile Leu Thr Leu Ala Leu Ile His Leu Val Glu Ala Asn Ser Glu20 25 30Gly Asp Ala Leu Tyr Ala Leu Arg Arg Ser Leu Thr Asp Pro Asp His35 40 45Val Leu Gln Ser Trp Asp Pro Thr Leu Val Asn Pro Cys Thr Trp Phe50 55 60His Val Thr Cys Asn Gln Asp Asn Arg Val Thr Arg Val Asp Leu Gly65 70 75 80Asn Ser Asn Leu Ser Gly His Leu Ala Pro Glu Leu Gly Lys Leu Glu85 90 95His Leu Gln Tyr Leu Glu Leu Tyr Lys Asn Asn Ile Gln Gly Thr Ile100 105 110Pro Ser Glu Leu Gly Asn Leu Lys Asn Leu Ile Ser Leu Asp Leu Tyr115 120 125Asn Asn Asn Leu Thr Gly Ile Val Pro Thr Ser Leu Gly Lys Leu Lys130 135 140Ser Leu Val Phe Leu Arg Leu Asn Asp Asn Arg Leu Thr Gly Pro Ile145 150 155 160Pro Arg Ala Leu Thr Ala Ile Pro Ser Leu Lys Val Val Asp Val Ser165 170 175Ser Asn Asp Leu Cys Gly Thr Ile Pro Thr Asn Gly Pro Phe Ala His180 185 190Ile Pro Leu Gln Asn Phe Glu Asn Asn Pro Arg Leu Glu Gly Pro Glu195 200 205Leu Leu Gly Leu Ala Ser Tyr Asp Thr Asn Cys Thr210 215 220(2)SEQ ID NO:28的信息(ⅰ)序列特征(A)长度894个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA到mRNA(ⅲ)假设否(ⅸ)特征(A)名称/关键词CDS(B)位置1..675(ⅸ)序列描述SEQ ID NO:28:GGA CCG ATT CAA GCC TCC GAA GGG GAC GCT CTT CAC GCG CTT CGC CGG 48Gly Pro Ile Gln Ala Ser Glu Gly Asp Ala Leu His Ala Leu Arg Arg1 5 10 15AGC TTA TCA GAT CCA GAC AAT GTT GTT CAG AGT TGG GAT CCA ACT CTT 96Ser Leu Ser Asp Pro Asp Asn Val Val Gln Ser Trp Asp Pro Thr Leu20 25 30GTT AAT CCT TGT ACT TGG TTT CAT GTC ACT TGT AAT CAA CAC CAT CAA 144Val Asn Pro Cys Thr Trp Phe His Val Thr Cys Asn Gln His His Gln35 40 45GTC ACT CGT CTG GAT TTG GGG AAT TCA AAC TPA TCT GGA CAT CTA GTA 192Val Thr Arg Leu Asp Leu Gly Asn Ser Asn Leu Ser Gly His Leu Val50 55 60CCT GAA CTT GGG AAG CTT GAA CAT TTA CAA TAT CTG TAT GGA ATC ATC 240Pro Glu Leu Gly Lys Leu Glu His Leu Gln Tyr Leu Tyr Gly Ile Ile65 70 75 80ACT CTT TTG CCT TTT GAT TAT CTG AAA ACA TTT ACA TTA TCA GTC ACA 288Thr Leu Leu Pro Phe Asp Tyr Leu Lys Thr Phe Thr Leu Ser Val Thr85 90 95CAT ATA ACA TTT TGC TTT GAG TCA TAT AGT GAA CTC TAC AAA AAC GAG 336His Ile Thr Phe Cys Phe Glu Ser Tyr Ser Glu Leu Tyr Lys Asn Glu100 105 110ATT CAA GGA ACT ATA CCT TCT GAG CTT GGA AAT CTG AAG AGT CTA ATC 384Ile Gln Gly Thr Ile Pro Ser Glu Leu Gly Asn Leu Lys Ser Leu Ile115 120 125AGT TTG GAT CTG TAC AAC AAC AAT CTC ACC GGG AAA ATC CCA TCT TCT 432Ser Leu Asp Leu Tyr Asn Asn Asn Leu Thr Gly Lys Ile Pro Ser Ser130 135 140TTG GGA AAA TTG AAG TCA CTT GTT TTT TTG CGG CTT AAC GAA AAC CGA 480Leu Gly Lys Leu Lys Ser Leu Val Phe Leu Arg Leu Asn Glu Asn Arg145 150 155 160TTG ACC GGT CCT ATT CCT AGA GAA CTC ACA GTT ATT TCA AGC CTT AAA 528Leu Thr Gly Pro Ile Pro Arg Glu Leu Thr Val Ile Ser Ser Leu Lys165 170 175GTT GTT AGT GTC TCA GGG AAT GAT TTG TGT GGA ACA ATT CCA GTA GAA 576Val Val Asp Val Ser Gly Asn Asp Leu Cys Gly Thr Ile Pro Val Glu180 185 190GGA CCT TTT GAA CAC ATT CCT ATG CAA AAC TTT GAG AAC AAC CTG AGA 624Gly Pro Phe Glu His Ile Pro Met Gln Asn Phe Glu Asn Asn Leu Arg195 200 205TTG GAG GGA CCA GAA CTA CTA GGT CTT GCG AGC TAT GAC ACC AAT TGC 672Leu Glu Gly Pro Glu Leu Leu Gly Leu Ala Ser Tyr Asp Thr Asn Cys210 215 220ACT TAAAAAGAAG TTGAAGAACC TATAAAGAAG AATGTTAGGT GACCTTGTAA 725Thr225GAACTCTGTA CCAAGTGTTT GTAAATCTAT ATAGAGCCTT GTTTCATGTT ATATATGAAA 785GCTTTGAGAG ACAGTAACTT GCAATGTATT GGTATTGGTA GAAAAAGTTG AAATGAGAAT 845TGCTTTGTAA TTGGATTTGT GTTTCTTATG TAACTTGAAT TTCTTATTA 894(2)SEQ ID NO:29的信息(ⅰ)序列特征(A)长度225个氨基酸(B)类型氨基酸(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅸ)序列描述SEQ ID NO:29:Gly Pro Ile Gln Ala Ser Glu Gly Asp Ala Leu His Ala Leu Arg Arg1 5 10 15Ser Leu Ser Asp Pro Asp Asn Val Val Gln Ser Trp Asp Pro Thr Leu20 25 30Val Asn Pro Cys Thr Trp Phe His Val Thr Cys Asn Gln His His Gln35 40 45Val Thr Arg Leu Asp Leu Gly Asn Ser Asn Leu Ser Gly His Leu Val50 55 60Pro Glu Leu Gly Lys Leu Glu His Leu Gln Tyr Leu Tyr Gly Ile Ile65 70 75 80Thr Leu Leu Pro Phe Asp Tyr Leu Lys Thr Phe Thr Leu Ser Val Thr85 90 95His Ile Thr Phe Cys Phe Glu Ser Tyr Ser Glu Leu Tyr Lys Asn Glu100 105 110Ile Gln Gly Thr Ile Pro Ser Glu Leu Gly Asn Leu Lys Ser Leu Ile115 120 125Ser Leu Asp Leu Tyr Asn Asn Asn Leu Thr Gly Lys Ile Pro Ser Ser130 135 140Leu Gly Lys Leu Lys Ser Leu Val Phe Leu Arg Leu Asn Glu Asn Arg145 150 155 160Leu Thr Gly Pro Ile Pro Arg Glu Leu Thr Val Ile Ser Ser Leu Lys165 170 175Val Val Asp Val Ser Gly Asn Asp Leu Cys Gly Thr Ile Pro Val Glu180 185 190Gly Pro Phe Glu His Ile Pro Met Gln Asn Phe Glu Asn Asn Leu Arg195 200 205Leu Glu Gly Pro Glu Leu Leu Gly Leu Ala Ser Tyr Asp Thr Asn Cys210 215 220Thr225(2)SEQ ID NO:30的信息(ⅰ)序列特征(A)长度1063个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA到mRNA(ⅲ)假设否(ⅸ)特征(A)名称/关键词CDS(B)位置106..759(ⅸ)序列描述SEQ IDNO:30:TCGACCCACG CGTCCGACGA AACCCTAATT TTGCTTCCTC ATCTTGTTCA GAAAATTACT60CAAATTCCTA TTAGATTACT CTCTCTTCGA CCTCCGATAG CTCAC ATG GCG TCT 114Met Ala SerCGA AAC TAT CGG TGG GAG CTC TTC GCA GCT TCG TTA ATC CTA ACC TTA 162Arg Asn Tyr Arg Trp Glu Leu Phe Ala Ala Ser Leu Ile Leu Thr Leu5 10 15GCT TTG ATT CAC CTG GTC GAA GCA AAC TCC GAA GGA GAT GCT CTT TAC 210Ala Leu Ile His Leu Val Glu Ala Asn Ser Glu Gly Asp Ala Leu Tyr20 25 30 35CCT CTT CGC CGG AGT TTA ACA GAT CCG GAC CAT GTT CTC CAG AGC TGG 258Ala Leu Arg Arg Ser Leu Thr Asp Pro Asp His Val Leu Gln Ser Trp40 45 50GAT CCA ACT CTT GTT AAT CCT TGT ACC TGG TTC CAT GTC ACC TGT AAC 306Asp Pro Thr Leu Val Asn Pro Cys Thr Trp Phe His Val Thr Cys Asn55 60 65CAA GAC AAC CGC GTC ACT CGT GTG GAT TTG GGG AAT TCA AAC CTC TCT 354GLn Asp Asn Arg Val Thr Arg Val Asp Leu Gly Asn Ser Asn Leu Ser70 75 80GGA CAT CTT GCG CCT GAG CTT GGG AAG CTT GAA CAT TTA CAG TAT CTA 402Gly His Leu Ala Pro Glu Leu Gly Lys Leu Glu His Leu Gln Tyr Leu85 90 95GAG CTC TAC AAA AAC AAC ATC CAA GGA ACT ATA CCT TCC GAA CTT GGA 450Glu Leu Tyr Lys Asn Asn Ile Gln Gly Thr Ile Pro Ser Glu Leu Gly100 105 110 115AAT CTG AAG AAT CTC ATC AGC TTG GAT CTG TAC AAC AAC AAT CTT ACA 498Asn Leu Lys Asn Leu Ile Ser Leu Asp Leu Tyr Asn Asn Asn Leu Thr120 125 130GGG ATA GTT CCC ACT TCT TTG GGA AAA TTG AAG TCT CTG GTC TTT TTA 546Gly Ile Val Pro Thr Ser Leu Gly Lys Leu Lys Ser Leu Val Phe Leu135 140 145CGG CTT AAT GAC AAC CGA TTG ACG GGG CCA ATC CCT AGA GCA CTC ACT 594Arg Leu Asn Asp Asn Arg Leu Thr Gly Pro Ile Pro Arg Ala Leu Thr150 155 160GCA ATC CCA AGC CTT AAA GTT GTT GAT GTC TCA AGC AAT GAT TTG TGT 642Ala Ile Pro Ser Leu Lys Val Val Asp Val Ser Ser Asn Asp Leu Cys165 170 175GGA ACA ATC CCA ACA AAC GGA CCT TTT GCT CAC ATP CCT TPA CAG AAC 690Gly Thr Ile Pro Thr Asn Gly Pro Phe Ala His Ile Pro Leu Gln Asn180 185 190 195TTT GAG AAC AAC CCG AGG TTG GAG GGA CCG GAA TEA CTC GGT CTT GCA 738Phe Glu Asn Asn Pro Arg Leu Glu Gly Pro Glu Leu Leu Gly Leu Ala200 205 210AGC TAC GAC ACT AAC TGC ACC TCAAAAAAATT GGCAAAACCT GAAAATGAAG789Ser Tyr Asp Thr Asn Cys Thr215AATTGGGGGG TGACCTTGTA AGAACACTTC ACCACTTTAT CAAATATCAC ATCTACTATG849TAATAAGTAT ATATATGTAG TCCAAAAAAA AAATGAAGAA TCGAATCAGT AATATCATCT909GGTCTCAATP GAGAACTTTG AGGTCTGTGT ATGTAAAATT TCTAAATGCG ACTTTCGCGT969ACTGTAATGT TCGGTTGTGG GATTCTGAGA AGTAACATTT GTATTGGTAT GGTATCAAGT 1029TGTTCTGCCT TGTCTGCAAA AAAAAAAAAA AAAA 1063(2)SEQ ID NO:31的信息(ⅰ)序列特征(A)长度218个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅸ)序列描述SEQ ID NO:31:Met Ala Ser Arg Asn Tyr Arg Trp Glu Leu Phe Ala Ala Ser Leu Ile1 5 10 15Leu Thr Leu Ala Leu Ile His Leu Val Glu Ala Asn Ser Glu Gly Asp20 25 30Ala Leu Tyr Ala Leu Arg Arg Ser Leu Thr Asp Pro Asp His Val Leu35 40 45Gln Ser Trp Asp Pro Thr Leu Val Asn Pro Cys Thr Trp Phe His Val50 55 60Thr Cys Asn Gln Asp Asn Arg Val Thr Arg Val Asp Leu Gly Asn Ser65 70 75 80Asn Leu Ser Gly His Leu Ala Pro Glu Leu Gly Lys Leu Glu His Leu85 90 95Gln Tyr Leu Glu Leu Tyr Lys Asn Asn Ile Gln Gly Thr Ile Pro Ser100 105 110Glu Leu Gly Asn Leu Lys Asn Leu Ile Ser Leu Asp Leu Tyr Asn Asn115 120 125Asn Leu Tnr Gly Ile Val Pro Thr Ser Leu Gly Lys Leu Lys Ser Leu130 135 140Val Phe Leu Arg Leu Asn Asp Asn Arg Leu Thr Gly Pro Ile Pro Arg145 150 155 160Ala Leu Thr Ala Ile Pro Ser Leu Lys Val Val Asp Val Ser Ser Asn165 170 175Asp Leu Cys Gly Thr Ile Pro Thr Asn Gly Pro Phe Ala His Ile Pro180 185 190Leu Gln Asn Phe Glu Asn Asn Pro Arg Leu Glu Gly Pro Glu Leu Leu195 200 205Gly Leu Ala Ser Tyr Asp Thr Asn Cys Thr210 215(2)SEQ ID NO:32的信息(ⅰ)序列特征(A)长度2089个碱基对(B)类型核酸(C)链型双链(D)拓扑结构线性(ⅱ)分子类型cDNA到mRNA(ⅲ)假设否(ⅲ)反义否(ⅵ)原始来源(A)生物体Arabidopsis thaliana(ⅵ)间接来源(A)克隆SERK基因cDNA(ⅸ)特征(A)名称/关键词CDS(B)位置195..2069(ⅸ)序列描述SEQ ID NO:32GGATTTTTAT TTTATTTTTT ACTCTTTGTT TGTTTTAATG CTAATGGGTT TTTAAAAGGG 60TTATCGAAAA AATGAGTGAG TTTGTGTTGA GGTTGTCTCT GTAAAGTGTT AATGGTGGTG 120ATTTTCGGAA GTTAGGGTTT TCTCGGATCT GAAGAGATCA AATCAAGATT CGAAATTTAC 180CATTGTTGTT TGAA ATG GAG TCG AGT TAT GTG GTG TTT ATC TTA CTT TCA 230Met Glu Ser Ser Tyr Val Val Phe Ile Leu Leu Ser1 5 10CTG ATC TTA CTT CCG AAT CAT TCA CTG TGG CTT GCT TCT GCT AAT TTG 278Leu Ile Leu Leu Pro Asn His Ser Leu Trp Leu Ala Ser Ala Asn Leu15 20 25GAA GGT GAT GCT TTG CAT ACT TTG AGG GTT ACT CTA GTT GAT CCA AAC 326Glu Gly Asp Ala Leu His Thr Leu Arg Val Thr Leu Val Asp Pro Asn30 35 40AAT GTC TTG CAG AGC TGG GAT CCT ACG CTA GTG AAT CCT TGC ACA TGG 374Asn Val Leu Gln Ser Trp Asp Pro Thr Leu Val Asn Pro Cys Thr Trp45 50 55 60TTC CAT GTC ACT TGC AAC AAC GAG AAC AGT GTC ATA AGA GTT GAT TTG 422Phe His Val Thr Cys Asn Asn Glu Asn Ser Val Ile Arg Val Asp Leu65 70 75GGG AAT GCA GAG TTA TCT GGC CAT TTA GTT CCA GAG CTT GGT GTG CTC 470Gly Asn Ala Glu Leu Ser Gly His Leu Val Pro Glu Leu Gly Val Leu80 85 90AAG AAT TTG CAG TAT TTG GAG CTT TAC AGT AAC AAC ATA ACT GGC CCG 518Lys Asn Leu Gln Tyr Leu Glu Leu Tyr Ser Asn Asn Ile Thr Gly Pro95 100 105ATT CCT AGT AAT CTT GGA AAT CTG ACA AAC TTA GTG AGT TTG GAT CTT 566Ile Pro Ser Asn Leu Gly Asn Leu Thr Asn Leu Val Ser Leu Asp Leu110 115 120TAC TTA AAC AGC TTC TCC GGT CCT ATT CCG GAA TCA TTG GGA AAG CTT 614Tyr Leu Asn Ser Phe Ser Gly Pro Ile Pro Glu Ser Leu Gly Lys Leu125 130 135 140TCA AAG CTG AGA TTT CTC CGG CTT AAC AAC AAC AGT CTC ACT GGG TCA 662Ser Lys Leu Arg Phe Leu Arg Leu Asn Asn Asn Ser Leu Thr Gly Ser145 150 155ATT CCT ATG TCA CTG ACC AAT ATT ACT ACC CTT CAA GTG TTA GAT CTA 710Ile Pro Met Ser Leu Thr Asn Ile Thr Tnr Leu Gln Val Leu Asp Leu160 165 170TCA AAT AAC AGA CTC TCT GGT TCA GTT CCT GAC AAT GGC TCC TTC TCA 758Ser Asn Asn Arg Leu Ser Gly Ser Val Pro Asp Asn Gly Ser Phe Ser175 180 185CTC TTC ACA CCC ATC AGT TTT GCT AAT AAC TTA GAC CTA TGT GGA CCT 806Leu Phe Thr Pro Ile Ser Phe Ala Asn Asn Leu Asp Leu Cys Gly Pro190 195 200GTT ACA AGT CAC CCA TGT CCT GGA TCT CCC CCG TTT TCT CCT CCA CCA854Val Thr Ser His Pro Cys Pro Gly Ser Pro Pro Phe Ser Pro Pro Pro205 210 215 220CCT TTT ATT CAA CCT CCC CCA GTT TCC ACC CCG AGT GGG TAT GGT ATA902Pro Phe Ile Gln Pro Pro Pro Val Ser Thr Pro Ser Gly Tyr Gly Ile225 230 235ACT GGA GCA ATA GCT GGT GGA GTT GCT GCA GGT GCT GCT TTG CCC TTT950Thr Gly Ala Ile Ala Gly Gly Val Ala Ala Gly Ala Ala Leu Pro Phe240 245 250GCT GCT CCT GCA ATA GCC TTT GCT TGG TGG CGA CGA AGA AGC CCA CTA998Ala Ala Pro Ala Ile Ala Phe Ala Trp Trp Arg Arg Arg Ser Pro Leu255 260 265GAT ATT TTC TTC GAT GTC CCT GCC GAA GAA GAT CCA GAA GTT CAT CTG 1046Asp Ile Phe Phe Asp Val Pro Ala Glu Glu Asp Pro Glu Val His Leu270 275 280GGA CAG CTC AAG AGG TTT TCT TTG CGG GAG CTA CAA GTG GCG AGT GAT 1094Gly Gln Leu Lys Arg Phe Ser Leu Arg Glu Leu Gln Val Ala Ser Asp285 290 295 300GGG TTT AGT AAC AAG AAC ATT TTG GGC AGA GGT GGG TTT GGG AAA GTC 1142Gly Phe Ser Asn Lys Asn Ile Leu Gly Arg Gly Gly Phe Gly Lys Val305 310 315TAC AAG GGA CGC TTG GCA GAC GGA ACT CTT GTT GCT GGC AAG AGA CTG 1190Tyr Lys Gly Arg Leu Ala Asp Gly Thr Leu Val Ala Val Lys Arg Leu320 325 330AAG GAA GAG CGA ACT CCA GGT GGA GAG CTC CAG TTT CAA ACA GAA GTA 1238Lys Glu Glu Arg Thr Pro Gly Gly Glu Leu Gln Phe Gln Thr Glu Val335 340 345GAG ATG ATA AGT ATG GCA GTT CAT CGA AAC CTG TTG AGA TTA CGA GGT 1286Glu Met Ile Ser Met Ala Val His Arg Asn Leu Leu Arg Leu Arg Gly350 355 360TTC TGT ATG ACA CCG ACC GAG AGA TTG CTT GTG TAT CCT TAC ATG GCC 1334Phe Cys Met Thr Pro Thr Glu Arg Leu Leu Val Tyr Pro Tyr Met Ala365 370 375 380AAT GGA AGT GTT GCT TCG TGT CTC AGA GAG AGG CCA CCG TCA CAA CCT 1382Asn Gly Ser Val Ala Ser Cys Leu Arg Glu Arg Pro Pro Ser Gln Pro385 390 395CCG CTT GAT TGG CCA ACG CGG AAG AGA ATC GCG CTA GGC TCA GCT CGA 1430Pro Leu Asp Trp Pro Thr Arg Lys Arg Ile Ala Leu Gly Ser Ala Arg400 405 410GGT TTG TCT TAC CTA CAT GAT CAC TGC GAT CCG AAG ATC ATT CAC CGT 1478Gly Leu Ser Tyr Leu His Asp His Cys Asp Pro Lys Ile Ile His Arg415 420 425GAC GTA AAA GCA GCA AAC ATC CTC TTA GAC GAA GAA TTC GAA GCG GTT 1526Asp Val Lys Ala Ala Asn Ile Leu Leu Asp Glu Glu Phe Glu Ala Val430 435 440GTT GGA GAT TTC GGG TTG GCA AAG CTT ATG GAC TAT AAA GAC ACT CAC 1574Val Gly Asp Phe Gly Leu Ala Lys Leu Met Asp Tyr Lys Asp Thr His445 450 455 460GTG ACA ACA GCA GTC CGT GGC ACC ATC GGT CAC ATC GCT CCA GAA TAT 1622Val Thr Thr Ala Val Arg Gly Thr Ile Gly His Ile Ala Pro Glu Tyr465 470 475CTC TCA ACC GGA AAA TCT TCA GAG AAA ACC GAC GTT TTC GGA TAC GGA 1670Leu Ser Thr Gly Lys Ser Ser Glu Lys Thr Aso Val Phe Gly Tyr Gly480 485 490ATC ATG CTT CTA GAA CTA ATC ACA GGA CAA AGA GCT TTC GAT CTC GCT 1718Ile Met Leu Leu Glu Leu Ile Thr Gly Gln Arg Ala Phe Asp Leu Ala495 500 505CGG CTA GCT AAC GAC GAC GAC GTC ATG TTA CTT GAC TGG GTG AAA GGA 1766Arg Leu Ala Asn Asp Asp Asp Val Met Leu Leu Asp Trp Val Lys Gly510 515 520TTG TTG AAG GAG AAG AAG CTA GAG ATG TTA GTG GAT CCA GAT CTT CAA 1814Leu Leu Lys Glu Lys Lys Leu Glu Met Leu Val Asp Pro Asp Leu Gln525 530 535 540ACA AAC TAC GAG GAG AGA GAA CTG GAA CAA GTG ATA CAA GTG GCG TTG 1862Thr Asn Tyr Glu Glu Arg Glu Leu Glu Gln Val Ile Gln Val Ala Leu545 550 555CTA TGC ACG CAA GGA TCA CCA ATG GAA AGA CCA AAG ATG TCT GAA GTT 1910Leu Cys Thr Gln Gly Ser Pro Met Glu Arg Pro Lys Met Ser Glu Val560 565 570GTA AGG ATG CTG GAA GGA GAT GGG CTT GCG GAG AAA TGG GAC GAA TGG 1958Val Arg Met Leu Glu Gly Asp Gly Leu Ala Glu Lys Trp Asp Glu Trp575 580 585CAA AAA GTT GAG ATT TTG AGG GAA GAG ATT GAT TTG AGT CCT AAT CCT 2006Gln Lys Val Glu Ile Leu Arg Glu Glu Ile Asp Leu Ser Pro Asn Pro590 595 600AAC TCT GAT TGG ATT CTT GAT TCT ACT TAC AAT TTG CAC GCC GTT GAG 2054Asn Ser Asp Trp Ile Leu Asp Ser Thr Tyr Asn Leu His Ala Val Glu605 610 615 620TTA TCT GGT CCA AGG TAAAAAAAAA AAAAAAAAAA 2089Leu Sar Gly Pro Arg625(2)SEQ ID NO:33的信息(ⅰ)序列特征(A)长度625个氨基酸(B)类型氨基酸(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅸ)序列描述SEQ ID NO:33:Met Glu Ser Ser Tyr Val Vel Phe Ile Leu Leu Ser Leu Ile Leu Leu1 5 10 15Pro Asn His Ser Leu Trp Leu Ala Sar Ala Asn Leu Glu Gly Asp Ala20 25 30Leu His Thr Leu Arg Val Thr Leu Val Asp Pro Asn Asn Val Leu Gln35 40 45Ser Trp Asp Pro Thr Leu Val Asn Pro Cys Thr Trp Phe His Val Thr50 55 60Cys Asn Asn Glu Asn Ser Val Ile Arg Val Asp Leu Gly Asn Ala Glu65 70 75 80Leu Ser Gly His Leu Val Pro Glu Leu Gly Val Leu Lys Asn Leu Gln85 90 95Tyr Leu Glu Leu Tyr Ser Asn Asn Ile Thr Gly Pro Ile Pro Ser Asn100 105 110Leu Gly Asn Leu Thr Asn Leu Val Ser Leu Asp Leu Tyr Leu Asn Ser115 120 125Phe Ser Gly Pro Ile Pro Glu Ser Leu Gly Lys Leu Ser Lys Leu Arg130 135 140Phe Leu Arg Leu Asn Asn Asn Ser Leu Thr Gly Ser Ile Pro Met Ser145 150 155 160Leu Thr Asn Ile Thr Thr Leu Gln Val Leu Asp Leu Ser Asn Asn Arg165 170 175Leu Ser Gly Ser Val Pro Asp Asn Gly Ser Phe Ser Leu Phe Thr Pro180 185 190Ile Ser Phe Ala Asn Asn Leu Asp Leu Cys Gly Pro Val Thr Ser His195 200 205Pro Cys Pro Gly Ser Pro Pro Phe Ser Pro Pro Pro Pro Phe Ile Gln210 215 220Pro Pro Pro Val Ser Thr Pro Ser Gly Tyr Gly Ile Thr Gly Ala Ile225 230 235 240Ala Gly Gly Val Ala Ala Gly Ala Ala Leu Pro Phe Ala Ala Pro Ala245 250 255Ile Ala Phe Ala Trp Trp Arg Arg Arg Ser Pro Leu Asp Ile Phe Phe260 265 270Asp Val Pro Ala Glu Glu Asp Pro Glu Val His Leu Gly Gln Leu Lys275 280 285Arg Phe Ser Leu Arg Glu Leu Gln Val Ala Ser Asp Gly Phe Ser Asn290 295 300Lys Asn Ile Leu Gly Arg Gly Gly Phe Gly Lys Val Tyr Lys Gly Arg305 310 315 320Leu Ala Asp Gly Thr Leu Val Ala Val Lys Arg Leu Lys Glu Glu Arg325 330 335Thr Pro Gly Gly Glu Leu Gln Phe Gln Thr Glu Val Glu Met Ile Ser340 345 350Met Ala Val His Arg Asn Leu Leu Arg Leu Arg Gly Phe Cys Met Thr355 360 365Pro Thr Glu Arg Leu Leu Val Tyr Pro Tyr Met Ala Asn Gly Ser Val370 375 380Ala Ser Cys Leu Arg Glu Arg Pro Pro Ser Gln Pro Pro Leu Asp Trp385 390 395 400Pro Thr Arg Lys Arg Ile Ala Leu Gly Ser Ala Arg Gly Leu Ser Tyr405 410 415Leu His Asp His Cys Asp Pro Lys Ile Ile His Arg Asp Val Lys Ala
420 425 430Ala Asn Ile Leu Leu Asp Glu Glu Phe Glu Ala Val Val Gly Asp Phe435 440 445Gly Leu Ala Lys Leu Met Asp Tyr Lys Asp Thr His Val Thr Thr Ala450 455 460Val Arg Gly Thr Ile Gly His Ile Ala Pro Glu Tyr Leu Ser Thr Gly465 470 475 480Lys Ser Ser Glu Lys Thr Asp Val Phe Gly Tyr Gly Ile Met Leu Leu485 490 495Glu Leu Ile Thr Gly Gln Arg Ala Phe Asp Leu Ala Arg Leu Ala Asn500 505 510Asp Asp Asp Val Met Leu Leu Asp Trp Val Lys Gly Leu Leu Lys Glu515 520 525Lys Lys Leu Glu Met Leu Val Asp Pro Asp Leu Gln Thr Asn Tyr Glu530 535 540Glu Arg Glu Leu Glu Gln Val Ile Gln Val Ala Leu Leu Cys Thr Gln545 550 555 560Gly Ser Pro Met Glu Arg Pro Lys Met Ser Glu Val Val Arg Met Leu565 570 575Glu Gly Asp Gly Leu Ala Glu Lys Trp Asp Glu Trp Gln Lys Val Glu580 585 590Ile Leu Arg Glu Glu Ile Asp Leu Ser Pro Asn Pro Asn Ser Asp Trp595 600 605Ile Leu Asp Ser Thr Tyr Asn Leu His Ala Val Glu Leu Ser Gly Pro610 615 620Arg62权利要求
1.一种产生无融合生殖种子的方法,该方法包括以下步骤(ⅰ)利用编码一种蛋白质的核苷酸序列转化植物材料,所说的蛋白质在细胞中或细胞膜中存在时,使得所说的细胞变为胚发生性的,(ⅱ)使转化材料再生成为植物体,或者其包含心皮的部分,以及(ⅲ)在胚囊附近表达序列。
2.按照前面的权利要求的方法,其中所说的无融合生殖种子是无定形胚芽型。
3.按照前面任一权利要求的方法,其中所说的序列表达产生能够跨越植物细胞膜的蛋白激酶。
4.按照前面的权利要求的方法,其中所说的激酶能够自身磷酸化。
5.按照前面任一权利要求的方法,其中所说的蛋白质是同激酶一样的富含亮氨酸重复单位的受体,包含配体结合结构域,脯氨酸盒,跨膜结构域,激酶结构域和蛋白质结合结构域。
6.按照前面的权利要求的方法,其中所说的蛋白质缺少功能性配体结合结构域,但包含脯氨酸盒,跨膜结构域,激酶结构域和蛋白质结合结构域。
7.按照前面任一权利要求的方法,其中一旦掺入到细胞膜,蛋白质结合结构域即在细胞内定位。
8.按照前面任一权利要求的方法,其中所说的序列还编码细胞膜靶向序列。
9.按照前面任一权利要求的方法,其中所说的序列是在SEQ ID Nos.1或2中描述的序列或者是互补于在严格条件下与所说序列杂交并且编码具激酶活性的膜结合蛋白质之序列的序列。
10.按照前面任一权利要求的方法,其中所说的序列被修饰,由此除去已知的mRNA不稳定性序列基元或聚腺苷酸化信号,和/或利用插入所说序列之植物的优选密码子,以便在所说植物中这种修饰的序列的表达产生蛋白质,该蛋白质本质上类似于在有机体(其中蛋白质是内源性的)中表达未修饰序列获得的蛋白质。
11.按照前面任一权利要求的方法,其中序列的表达在一个诱导型或者发育调节型启动子的控制之下。
12.按照前面权利要求的方法,其中的序列表达处于下列启动子之一的控制之下植物中调节SERK基因表达的启动子,胡萝卜壳多糖酶DcEP3-1基因启动子,Arabidopsis AtChitⅣ基因启动子,ArabidopsisLTP-1基因启动子,Arabidopsis bel-1基因启动子,矮牵牛花fbp-7基因启动子,Arabidopsis ANT基因启动子,来自Phalaenopsis的O126基因启动子。
13.按照前面任一权利要求的方法,其中所说的序列在胚囊,子房壁,珠心,或者珠被的体细胞中表达。
14.按照前面任一权利要求的方法,其中所说的无融合生殖种子内的胚乳来自胚囊内的极性核与授粉雄配子核子的融合。
15.按照前面权利要求的方法,其中编码蛋白质序列的表达先于极性核与雄配子核子的融合。
16.包含编码一种蛋白质的序列的DNA,所说的蛋白质在细胞中或细胞膜中存在时,使得所说的细胞变为胚发生性的。
17.按照权利要求16的DNA,其中所说的蛋白质是同激酶一样的富含亮氨酸重复单位的受体,包含配体结合结构域,脯氨酸盒,跨膜结构域,激酶结构域及蛋白质结合结构域,配体结合结构域(可以是可以不是缺失或者功能上失活的)。
18.按照权利要求16或17的DNA,其包含编码有下列氨基酸序列的N端蛋白质片段的DNA序列Gln Ser Trp Asp Pro Thr Leu Val AsnPro Cys Thr Trp Phe His Val Thr Cys Asn。
19.按照权利要求18的DNA,其包含编码有下列氨基酸序列的N端蛋白质片段的DNA序列Val Xaa Gln Ser Trp Asp Pro Thr Leu ValAsn Pro Cys Thr Trp Phe His Val Thr Cys AsnXaa是一种可变氨基酸,但优选Leu或Val。
20.按照权利要求19的DNA,其包含编码有下列氨基酸序列的N端蛋白质片段的DNA序列Val Xaa Gln Ser Trp Asp Pro Thr Leu ValAsn Pro Cys Thr Trp Phe His Val Thr Cys Asn Xab Xac Xad Xae ValXaf Arg Val Asp Leu Gly Asn Xag Xah Leu Ser Gly His Leu Xai Pro GluLeu Gly Xaj Leu Xak Xal Leu GlnXaa到Xak是一种可变氨基酸,但优选Xaa=Leu或ValXab=Asn或GlnXac=Glu或Asp或HisXad=Asn或HisXae=Ser或Arg或GlnXaf=Ile或ThrXag=Ala或SerXah=Glu或AsnXai=Val或AlaXaj=Val或LysXak=Lys或GluXal=Asn或His
21.包含编码一种蛋白质的序列的DNA,所说的蛋白质具有SEQ IDNo.3中描述的序列,或本质上与其类似的并且能够与膜结合和有激酶活性。
22.包含编码一种蛋白质的序列的DNA,所说的蛋白质具有SEQ IDNo.21中描述的序列,或本质上与其类似的并且能够与膜结合和有激酶活性。
23.包含编码一种蛋白质的序列的DNA,所说的蛋白质具有SEQ IDNo.33中描述的序列,或本质上与其类似的并且能够与膜结合和有激酶活性。
24.包含编码一种蛋白质的序列的DNA,所说的蛋白质具有SEQ IDNos.23,25,27,29及31中描述的序列,或本质上与其类似的并且能够与膜结合和有激酶活性。
25.按照前面任一权利要求的DNA,其包括具有SEQ ID Nos.1或2中所示序列的DNA,或者是具有互补于在严格条件下与所说序列杂交并且编码具激酶活性的膜结合蛋白质之序列的DNA。
26.按照前面任一权利要求的DNA,其包括具有SEQ ID No:20中所示序列的DNA,或者是具有互补于在严格条件下与所说序列杂交并且编码具激酶活性的膜结合蛋白质之序列的DNA。
27.按照前面任一权利要求的DNA,包括具有SEQ ID No:32中所示序列的DNA,或者是具有互补于在严格条件下与所说序列杂交并且编码具激酶活性的膜结合蛋白质之序列的DNA。
28.按照前面任一权利要求的DNA,包括具有SEQ ID Nos:22,24,26,28和30中所示序列的DNA,或者是具有互补于在严格条件下与所说序列杂交并且编码具激酶活性的膜结合蛋白质之序列的DNA。
29.按照前面任一权利要求的DNA,其还编码细胞膜靶向序列。
30.按照前面任一权利要求的DNA,其中所说的蛋白质编码区处于发育调节型或诱导型启动子的表达控制之下。
31.按照权利要求30的DNA,其中所说的启动子是下列之一植物中调节SERK基因表达的启动子,胡萝卜壳多糖酶DcEP3-1基因启动子,Arabidopsis AtChitⅣ基因启动子,Arabidopsis LTP-1基因启动子,Arabidopsis bel-1基因启动子,矮牵牛花fbp-7基因启动子,Arabidopsis ANT基因启动子,来自Phalaenopsis的O126基因启动子;Arabidopsis DMC1启动子,pTA7001诱导型启动子。
32.按照前面任一权利要求的DNA,其中所说的DNA是重组体DNA。
33.按照前面任一权利要求的DNA,其中所说的序列被修饰,由此除去已知的mRNA不稳定性序列基元或聚腺苷酸化信号,和/或利用插入所说序列之植物的优选密码子,以便在所说植物中这种修饰的序列的表达产生蛋白质,该蛋白质本质上类似于在有机体(其中蛋白质是内源性的)中表达未修饰序列获得的蛋白质。
34.DNA,其互补于在严格条件下与权利要求16-29中任一的DNA杂交的DNA。
35.一种载体,其包含如权利要求16-34中任一所要求的DNA序列。
36.一种植物细胞,其是以权利要求16-34中的任一DNA或权利要求35中的载体转化的植物细胞,含有稳定掺入到它的基因组的DNA。
37.按照权利要求36的植物细胞,其是整个植物的一部分。
38.以权利要求16-34中的任一DNA或权利要求35中的载体转化的植物,包含稳定掺入DNA的这种植物的子代,和/或这种植物或这种子代的无融合生殖种子。
39.以由权利要求16-34中的重组DNA所包含的DNA转化的植物。
40.权利要求16-34之任一中的DNA在无融合生殖种子生产中的用途。
41.植物,其来源于由权利要求1-15或40任一中的方法获得的无融合生殖种子。
42.一种获得栽培品种的方法,该方法包括以下步骤以权利要求38,39或40中的植物花粉或者用该方法得到的品种花粉给植物授精。
43.一种在植物材料中获得胚发生细胞的方法,该方法包括利用如权利要求16-34中任一所要求的重组DNA序列,由权利要求16-34任一中的重组DNA所包含的DNA或者权利要求35中的载体转化植物材料,在植物材料或其衍生物中表达序列,并使所说植物材料或其衍生物受到一种化合物的作用,该化合物充当所说序列基因产物的配体。
44.按照前面权利要求的方法,其中所说的序列编码如同激酶一样的富含亮氨酸重复单位的受体,所说的化合物是植物激素。
45.一种在体外条件下产生体细胞胚的方法,其中SERK蛋白质被异位超量表达。
46.包含由权利要求1-15或者40任一中的方法获得的无融合生殖种子的袋子。
全文摘要
本发明主要提供了一种产生无融合生殖种子的方法,该方法包括以下几个步骤:(i)利用编码一种蛋白质的核苷酸序列转化植物材料,所说的蛋白质在细胞中或细胞膜中存在时,使得所说的细胞变为胚发生性的,(ii)使转化材料再生成为植物体,或者其包含心皮的部分,以及(iii)在胚囊附近表达序列。所说的蛋白质可以是富含亮氨酸重复单位的受体激酶,其优选地是修饰到这样一种程度,即配体结合结构域被缺失或在功能上被灭活。
文档编号C12N15/82GK1218510SQ97194634
公开日1999年6月2日 申请日期1997年5月13日 优先权日1996年5月14日
发明者S·C·德夫里斯, E·D·L·史密特, G·J·范霍尔斯特, V·F·G·赫克特 申请人:诺瓦提斯公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1