通过表达嘌呤二氢吲哚蛋白修饰谷类籽粒硬度的制作方法

文档序号:454400阅读:260来源:国知局
专利名称:通过表达嘌呤二氢吲哚蛋白修饰谷类籽粒硬度的制作方法
背景技术
谷类,包括小麦(Triticum aestivum L.em Thell.),是世界上最重要的粮食作物。除了用于饲喂家畜外,在几乎每一种文化中,谷类籽粒都被磨成面粉。小麦面粉被发现在世界上广泛使用但特别在欧洲及北美使用,水稻粉广泛用于亚洲,高粱粉用于非洲,而玉米粉(或玉米片)用于美洲。
谷类植物籽粒在种间及种内有变化。谷粒结构指核仁(颖果)的结构,也就是说,胚乳在物理上是柔软还是坚硬。通常地,水稻,高粱,大麦及玉米是坚硬结构的籽粒而燕麦,黑麦及黑小麦是柔软的。几乎世界上全部的小麦生产及贸易(分别约550及100mmt每年)以柔软或者坚硬来鉴定。一般来说,硬质小麦用于制作面包而软质小麦用于制作饼干,蛋糕及糕点(Morris & Rose,谷粒品质,Chapman & Hall,纽约,NY,3-54页(1996))。非常坚硬的硬质小麦(T.turgidum)通常用于食用面糊。
除在味道及水吸收方面的不同外,谷粒结构也支配着磨制技术。典型地,谷粒愈硬,磨制时亦需要愈多能量,在磨制过程中淀粉损失越多,磨制后的颗粒大小越大。
一种负责谷粒柔软的15kDa标记蛋白,称作friabilin,在软质小麦水洗后的淀粉(water-washed starch)表面大量存在,在硬质小麦淀粉中小量存在,在坚硬小麦淀粉中(durum wheat starch)不存在(Greenwell& Schofield,谷类化学,63:379-380(1986))。对friabilin N-末端序列分析表明其为两或更多独立的多肽组成的混合物(Morris等,谷类科学杂志,21:167-174(1994);和Jolly等,遗传学理论及应用,86:589-597(1993))。已发现两个主要成份多肽与两个分别称作嘌呤二氢吲哚A(puro A)及嘌呤二氢吲哚B(puro B)的脂结合蛋白相同(Gantier等,植物分子生物学,25:43-57(1994))。puro A及puroB的转录物由染色体5D控制(Giroux & Morris,遗传学理论及应用,95:857-864(1997))。
puro A及puro B在植物蛋白中是独特的,因为它们富含色氨酸,亲脂的疏水结构域(Blochet等,Gluten proteins 1990,Bushuk & Tkachuk(编),美国谷类化学家协会,St.Paul,MN,314-325页(1991);及Wilde等,农业研究,20:971(1993))。friabilin(puro A及puro B)与淀粉颗粒表面的联系明显地通过极性脂类介导。事实上,膜结构脂类,糖脂及磷脂在水洗淀粉表面的出现与friabilin一样(Greenblatt等,谷类化学,72:172-176(1995))在软质小麦淀粉中存在量很高,硬质小麦淀粉中存在数量低,在坚硬小麦淀粉中不存在。
存在的需求是比通过杂交育种获得更确定地获得对谷类植物籽粒结构的修饰。杂交育种时,有可能亲本植物是生殖不相容的。也有这种非常真实的可能性,即为产生一种杂交植物,需要大量的水,化肥及大面积土地。通过用改变谷粒结构的核酸序列创造转基因植物,这些问题就能够避免。本发明满足了这种及其它需要。
发明简述本发明鉴定了在小麦(Triticum aestivum)中作为籽粒柔软度主要成份的puro A及puro B。本发明也提供向小麦及其它谷类植物中引入嘌呤二氢吲哚基因(puroindoline gene)及其同源基因修饰谷粒结构的方法。
在一个优选的实施方案中,提供一种从至少一个具有硬质结构籽粒的亲本植物产生具有更软结构籽粒的转基因植物的方法。该方法包括引入一种核酸序列的步骤,核酸序列能在严格的条件下与从由SEQ IDNO:1及SEQ ID NO:3组成的组中选择出的核酸序列杂交,并且可操作地编码进入亲本植物细胞中的嘌呤二氢吲哚蛋白,从含有该核酸序列的细胞产生植株。在一个更优选的实施方案中,该植物从由硬质小麦(durum wheat),高粱,水稻,大麦及玉米组成的组中选出。在一个最优选的实施方案中,该植物是玉米。在一个优选的实施方案中,核酸导入由农杆菌属(Agrobacterium)感染介导。也是在该实施方案中,嘌呤二氢吲哚蛋白从由puro A及puro B组成的组中选出是优选的。
本发明的另一个实施方案提供了产生具有硬质结构籽粒的转基因植物的方法,其中该植物来自具有软结构籽粒的至少一个亲本植物。该方法包含引入阻止嘌呤二氢吲哚蛋白或同系物表达进亲本植物细胞的核酸序列并从该细胞产生植株的步骤。在该实施方案特别优选的方面,此植物从由小麦,黑麦,黑小麦及燕麦组成的组中选出。
在该实施方案的另一个优选的方面是向细胞中引入核酸序列并通过可操作地编码核酶来阻抑puro A或puro B的表达。在一个更优选的实施方案中,核酸序列可操作地编码在严格条件下能与SEQ ID NO:1或SEQ ID NO:3互补的核酸序列杂交的反义核酸。依赖于谷类植物,核酸能可操作地编码一种转座子。本发明的另一方面,核酸序列通过农杆菌感染引入植物中。
本发明的另一个实施方案中,提供了一种产生具有硬质结构籽粒的转基因植物的方法,其中该植物来源于至少一个具有软质结构籽粒的亲本植物。此方法包含向亲本植物细胞中引入核酸序列的步骤,其中,该核酸序列能够在严格的条件下与SEQ ID NO:5所示的核酸序列杂交并且从该细胞产生植株。在一种更优选的实施方案中,此植物从由小麦、黑麦、黑小麦及燕麦组成的组中选出。在这个实施方案的一个优选方面,核酸序列通过农杆菌属(Agrobacterium)感染引入植物中。
在另一个实施方案中,提供一种具有软质结构籽粒的转基因植物。此植物来源于至少一种具有硬质结构籽粒的亲本植物。该植物包含一种可操作地编码嘌呤二氢吲哚蛋白的核酸序列,其中该核酸序列能在严格的条件下与从由SEQ ID NO:1及SEQ ID NO:3组成的组中选出的核酸序列杂交。在一种更优选的实施方案中,该植物从由坚硬小麦(durumwheat),高粱,水稻,大麦及玉米组成的组中选出。在一种特别优选的实施方案中,该植物是玉米。
在这个实施方案中,嘌呤二氢吲哚(puroindoline)核酸序列通过转化引入植物并且嘌呤二氢吲哚蛋白从由puro A及puro B组成的组中选出。在一种特别优选的实施方案中,转化通过农杆菌属感染完成。
在本发明的又一个实施方案中,提供一种具有硬质结构籽粒的转基因植物。此植物从至少一种具有软质结构籽粒且包含一种阻止嘌呤二氢吲哚蛋白表达的核酸序列的亲本而得来。在该实施方案的一个特别优选的方面,子代植物从由小麦,黑麦,黑小麦及燕麦组成的组中选出。
本实施方案的一个优选方面,核酸序列被引入一种小麦细胞中并通过可操作地编码一种核酶或转座子以阻止puro A或puro B的表达。然而,此核酸序列可操作地编码一种能与SEQ ID NO:1或SEQ ID NO:3互补的序列杂交的反义核酸是优选的。在一种特别优选的实施方案中,核酸序列通过农杆菌属感染引入植物。
在另一个实施方案中,本发明提供一种具有硬质籽粒的转基因植物,它来源于至少一个软质籽粒的亲本。该植物包含在严格条件下能与由SEQ ID NO:5组成的组中选出的核酸序列杂交的核酸序列。
图2A是83硬/软染色体5D重组体及亲本SKCS单谷粒硬度读数频率分布直方图,“Chinese spring”(CS)及“Chinese spring”替代Cheyenne5D(CS(CNN5D))。读数为每两个位点的两份的平均数。亲代CS及CS(CNN5D)的值分别为60及79。图2B图示反映了SKCS单谷粒相对NIR硬度读数。重组体根据puro B序列类型分类,其中(+)表示柔软类型亲本CS的甘氨酸序列类型,(●)表示坚硬类型亲本CS取代的Cheyenne 5D的丝氨酸序列类型。
图3示淀粉表面friabilin相对数量,以软质籽粒亲本“CS”的软/硬重组体对NIR硬度的百分率表示。重组体根据puro b序列类型分类,其中(+)表示柔软类型亲本CS的甘氨酸序列类型,(●)表示坚硬类型亲本CS(CNN5D)的丝氨酸序列类型。
定义除非另有说明,这里所用的所有技术及科学术语都具有本发明所属的领域内的技术人员所通常理解的意义。以下文献给技术人员提供一种用于本发明中的许多术语的通用定义Singleton等,Dictionary ofMicrobiology and Molecular Biology(微生物学与分子生物学词典)(第二版,1994年);剑桥科学与技术词典(Walker编,1988);The Glossaryof Genetics(遗传学专用词汇词典),5Th ED,(第五版),Rieger,R等编,Springer Verlag(1991);以及Hale & Marham,The Harper CollinsDictionary of Biology(1991)(Harper Collins生物学词典)。象这里所用的,如果没有以另外的形式特殊说明,以下术语都具有归属于所述的意义。
术语“细胞”指植物中的任何细胞,包括但不限于体细胞,配子或胚。“胚”指在开始萌发之前的孢子体植物。胚可以通过有性杂交或自杂交由配子受精而形成。“有性杂交”是指一种植物被另外植物受粉的过程。“自交”是指通过自花受粉形成种子,也就是,花粉及胚珠来源于同一植株。术语“回交”指F1代杂种植株与任一亲本杂交。典型地,回交用于转移赋予一种简单遗传的,高度可遗传的性状基因进入近交系。术语近交系指回归亲本。期望性状来源是供体亲本。供体与回归亲本有性杂交后,具有供体亲本期望性状的F1代杂种植株被选出并与回归亲本或自交系重复杂交(也就是回交)。
胚也能够由“胚体细胞发生”及“克隆”形成。体细胞胚发生指直接或间接地从植物细胞,组织及器官产生胚。间接体细胞胚发生的特征在于长成一块愈伤组织并在愈伤组织表面形成胚。直接体细胞胚发生是指在不干扰愈伤组织阶段的条件下,从外植体组织的单一细胞或细胞群形成无性胚。因为从愈伤组织得到的植株易于产生畸形,直接体细胞胚发生是优选的。
短语“籽粒结构”指用于销售的小麦的主要分类基础。常用术语,“籽粒”是存在于植物胚珠的胚乳。在小麦中,籽粒或胚乳结构由硬质基因(Hardness gene)的表达来区分。然而,所有谷类籽粒都能在籽粒结构基础上分类。在高粱及玉米中,软柔软的胚乳由于基因如opaque-2及floury-2突变形成。尽管,这些突变基因的表达是隐性的并导致其它的,有害的表型如对机械及害虫损伤更大的易感性。
“较软结构籽粒”(Softer textured grain)指通过用Perten SKCS4100(Perten Instruments,Reno,NV)测量;通过如方法39-70所述的近红外反射分光术(NIR)测量(美国谷类化学家协会批准方法,第9版,美国谷类化学家协会,St.Paul,MN(1995));或通过相当技术测量,由后代或转基因植物产生的籽粒比至少其一个亲本产生的籽粒低10个单位。在一个更优选的实施方案中,后代或转基因植物的籽粒比至少其一个亲本籽粒低至少20个单位。在一个最优选的实施方案中,后代或转基因植物的籽粒比亲本籽粒低至少40个单位。然而,因为籽粒硬度是一种数量性状,技术人员将认识到籽粒硬度部分地由后代或转基因植物及亲本植物生长的环境条件决定。
“较硬结构籽粒”(harder textured grain)指通过用上述技术测量,由后代植株产生的籽粒比至少一个后代植物亲本产生的籽粒大10个单位。在一个更优选的实施方案中,后代或转基因植物的籽粒比至少一个亲本籽粒大至少20个单位。在一个最优选的实施方案中,后代或转基因植物的籽粒比亲本籽粒大至少40个单位。
短语“在严格的条件下杂交”指由二条单链核酸形成双链双螺旋。双链区可包括一或二条单链核酸的全长,或一单链核酸的全部及另一单链核酸的亚序列或双链区域可包括每一核酸的亚序列。一本广博的用于核酸杂交的通用指南参见Tijssen,生物化学及分子生物学实验技术-用核酸探针杂交Ⅰ及Ⅱ部分,Elsevier,New York,(1993)。通常地,严格条件被选择为在一确定的离子强度及pH下对特定核酸序列比其热熔点Tm值低约5℃。Tm是指(在确定离子强度及pH下)有50%目标序列与一完全匹配的探针杂交的温度。高度严格的条件被选择为对一特异探针等于Tm值。有时术语“Td”被用于定义至少一半的探针从一完全匹配的目标核酸上解离时的温度。不管怎样,一种用于判断Tm或Td的评估技术种类是可以得到的,并概略地在Tijssen,出处同上中描述。典型地,估计在双螺旋中的G-C碱基对对Tm值的贡献约为3℃,而A-T碱基对约为2℃,达到约80-100℃的理论最大值。然而,更精确的Tm及Td模型是可以得到并适合的,其中考虑进入G-C累积的相互作用,溶剂影响,所需试验温度及其它因素等。在一实施例中,PCR引物被设计为其有约60℃的解离温度(Td),用公式Td=(((((3×#GC)+(2×# AT))×37)-562)/# bp)-5计算所得;其中#GC,#AT及#bp分别表示包含于退火引物与模板DNA中的G-C碱基对数量,A-T碱基对数量,总碱基对数量。
一种用于具有100个以上互补碱基的互补核酸在滤膜上进行Southern或Northern杂交的严格杂交条件的实施例为在42℃下,50%甲醛水溶液(formalin)及1mg(毫克)肝素(heparin)中杂交过夜进行。一种用于这样核酸的Southern印迹严格洗涤条件的例子为在65℃下,用0.2×SSC洗15分钟(见Sambrook等,分子克隆-实验室手册(第2版)1-3卷。冷泉港实验室,冷泉港出版社,NY(纽约)1989(Sambrook),对SSC缓冲液的描述)。通常在高严格洗涤前用低严格洗涤条件洗涤以除去背景探针信号。一种低严格洗涤条件的实施例为40℃下2×SSC洗涤15分钟。
通常,信号与干扰的比率是用无关探针在该特定杂交分析中所得信号的2倍或比之更高,说明检测到了特异杂交。对于高度特异性杂交策略,如等位基因-特异杂交,一种等位基因-特异探针通常与包含多态性核苷酸的标记核酸(例如,一种基因组核酸或类似物)在高度严格条件下杂交。
短语“引入一种核酸序列”指通过重组手段引入核酸序列,包括但不限于,农杆菌属-介导的转化,基因枪法(biolistic methods),电穿孔,用于植物技术中,等等。术语“核酸”是与DNA,RNA及多聚核苷酸同义的。这样一种含有该核酸序列的植物这里指R1代植物。R1代植物也可以通过已被引入该核酸序列植物的克隆,有性杂交或自交产生。
“转基因植物”是通过重组技术已经引入核酸序列的植物,例如,含有核酸的载体。载体是一种核酸组合物,它能转导,转化或感染细胞,由此引起此细胞表达载体-编码的核酸及任选的不是此细胞天然的蛋白,或者以一种非该细胞天然的方式表达蛋白。载体包括被细胞表达的核酸(通常为RNA或DNA)。载体任选地包括帮助核酸能够进入细胞的材料,例如,逆转录病毒粒子,脂质体,蛋白包被或其它等。载体含有允许它们在细菌或其它非植物有机体中繁殖及选择的核酸序列。对于载体及分子生物学技术的描述,见Current Protocols in MolecularBiology(分子生物学现代方法),Ausubel等,(编),现代方法,a jointventure between Greene Publishing Associates,Inc.and John Wiley &Sons,Inc.,(全刊及包括1998年增刊)(Ausubel)。
短语“表达盒”指在载体上被转录及一启动子指导该转录的一段核酸序列。“启动子”是指导核酸转录的一段核酸控制序列。象这里所用的,一个启动子包括临近转录起始位点的必需核酸序列,如,就多聚酶Ⅱ类型(polymeraseⅡ)启动子来说,为一TATA元件。启动子也任选地包括可以定位于远离转录起点几千碱基对部位处的远侧增强子或阻遇物元件。启动子可以或者是同源的,即,自然存在地指导目的核酸表达或异源的,即自然存在地指导从非目的核酸的基因来源的核酸表达。具有异源启动子序列的融合基因是可取的,例如,用于调节编码蛋白的表达。一种“组成型”启动子是一种在大多数环境及发育条件下,在选择的有机体组织中有活性的启动子。一种“可诱导的”启动子是一种在选择的有机体中,在环境及发育条件调控下的启动子。
短语“可操作地编码”指在一种启动子及一种二级核酸序列间的功能连锁,其中启动子序列起动该二级序列相应的RNA的转录。
短语“阻止一种嘌呤二氢吲哚蛋白的表达”指一植物细胞中嘌呤二氢吲哚蛋白的合成的抑制。抑制可以或者在转录水平,也就是,相应mRNA合成阶段,或者翻译水平,也就是蛋白质合成阶段。本发明的目的,阻止嘌呤二氢吲哚蛋白表达通过引入阻抑mRNA或蛋白质合成的核酸序列来完成。该核酸可编码阻抑嘌呤二氢吲哚基因表达的mRNA转录本并提供一硬质结构籽粒。例如,显示了反义RNA抑制基因表达,见,如,Sheehy等,美国科学院院报,85:8805-8809(1998),及美国专利4801340号。有义抑制(Sense suppression)也被用于调节内源基因的表达,见,Napoli等,植物细胞2:279-289(1990)及美国专利5034323号。
反义技术包含从目的嘌呤二氢吲哚基因克隆核酸片段并可操作地连接进入一启动子下,结果转录出RNA反义链(或互补链)。该构建物接着转化进入植物,RNA反义链由此形成。
通常被引入的核酸片段将是与嘌呤二氢吲哚蛋白基因或需抑制的基因的至少一部分基本相同。然而,该序列不需要完全相同来抑制表达。引入的序列,相对于或初级转录物或完全加工的mRNA,也不需是全长。通常地,较高同源性可以用于弥补应用较短序列的不足。此外,引入的序列不需要同样的内含子或外显子形式,非编码片段的同源物可以同样有效。正常地,在约30或40核苷酸到约2000核苷酸间的序列长度是可以应用的,尽管至少约100核苷酸长度的序列是优选的,至少约200核苷酸长度的序列是更优选的,至少约500核苷酸长度的序列是特别优选的。
起催化作用的RNA分子或核酶也能用于抑制基因表达。设计特异与事实上任何目标RNA配对并在特异位点断裂磷酸二醋骨架是可能的,由此功能性地灭活目标RNA。在完成这种断裂中,它是一种真正的酶。反义RNA内包含的核酶序列赋予其RNA-断裂活性,由此提高构建体的活性。目标RNA特异核酶的一般设计及应用在Haseloff等,自然334:585-591(1988)中已描述。
“转座子”指具有移动或跳跃到基因组内新的座位去的能力的DNA序列。转座子需要两种成份催化转位的转座酶及位于转座子末端保证酶发挥功能的核苷酸序列。转座子是既自主又非自主的。自主性转座子是既能够转位又能催化非自主元件转位的转座子。自主性转座子的例子为从玉米中分离出的Ac元件及Spm转座子,以上所有都已被克隆并在本领域内深入描述,见,如,美国专利4732856号及Gierl等,植物分子生物学13:261-266(1989)。
自主性转座子包含转座酶所需序列及在转座子末端被转座酶识别的序列(“Ds元件”)。转座酶所需序列(或转座酶基因)是末端序列非依赖活化的,也就是,如果末端序列被删除,转座酶基因活性仍然保留,并且酶编码元件可以用于与一非自主性转座子或Ds元件连接以引发Ds元件转位。转座酶基因在Ts101及Ts105元件中是明显的。
在转座酶基因存在时,仅仅存在于非自主元件末端的DNA序列对其转座活性是需要的。这些末端在这里指“转座子末端”或“Ds元件”。见,如Coupland等,美国科学院院报86:9385(1989),其中描述了转座必需的序列。转座子末端内部的DNA序列是非必需的并且能包含从事实上任何来源的序列,包括外源突变的嘌呤二氢吲哚核酸序列。因此,当转座子插入一基因组时,正确的核酸序列被切除并被突变序列替换。因为该序列内的突变,植物产生的嘌呤二氢吲哚蛋白将含有一种突变或如果插入一终止密码将是截短的形式。
术语“后代”指一特别植物(自交)或一对植物(杂交或回交)的后代。后代可以是F1,F2,或任何随后产生的后代。典型地,双亲是花粉供体及胚珠供体,本发明中它们通过杂交产生后代植株。双亲也指本发明中一种杂交植物的F1亲本(F2植株)。最终,亲本指与本发明中的杂种植物回交以产生另一种本发明中的杂种植物的一种回归亲本。
短语“产生一种转基因植物”指形成一种本发明中的植物。该植物通过重组技术产生,也就是,克隆,体细胞胚胎发生或任何其它本领域中技术人员所应用产生植物的技术。
本发明全过程中所使用的植物的常见名称指下述属的植物品种
短语“嘌呤二氢吲哚蛋白”指一类蛋白,包括但不限于“puro A”,或“puro B”。puro A及puro B是富含色氨酸的疏水结构域,它具有亲脂性(Bloehet等,Gluten Proteins 1990,Bushak & Tkachuk(编),美国谷类化学家协会,St.Paul,MN(1991);及Wilde等,农业研究20:971(1993))。除了在小麦中发现的嘌呤二氢吲哚蛋白外,用于本发明中,它也指嘌呤二氢吲哚同源物。同源物指具有同源功能的蛋白质,也就是,影响籽粒结构,例如,来源于燕麦的燕麦蛋白(Avenin)。同源物也指核酸序列或氨基酸序列同源物。
“核酸序列同源物”指脱氧核糖核苷酸或核糖核苷酸及聚合物其中以或者单或双链形式,含有天然核苷酸的已知相似物,它具有与对照核酸相似的结合特性并与天然形成的核苷酸以相似方式新陈代谢。
如果没有其它指明,特别核酸序列其中也暗含保守地修饰的变异体(例如简并密码替换)及互补序列,以及明确指明的序列。特别地,简并密码替换可通过产生序列达到,其中一或多个选出的密码(或全部)第三位置用混合碱基和/或脱氧次黄苷残基替换(Batzer等,核酸研究19:5081(1991);Ohtsuka等,生物学化学杂志260:2605-2608(1985);及Rossolini等,分子细胞探针8:91-98(1994))。术语核酸与基因,cDNA,及基因编码的mRNA互换使用。
术语“氨基酸序列同源物”指具有相似氨基酸序列的蛋白质。技术人员会认识到决定性的氨基酸序列位于蛋白质的功能结构域内。这样,对于一种同源蛋白质具有对全长氨基酸序列不超过40%同源性但在一功能结构域内多于90%同源性是可能的。除了自然形成的氨基酸外,同源物也包括其中一个或多个氨基酸残基是相应于一种天然形成的氨基酸,以及天然形成的蛋白质的人工化学合成的类似物。
这里所说的氨基酸残基指或者它们被普遍知道的三字母符号或者是由IUPAC-IUB生物化学命名委员会推荐的单字母符号。核苷酸,同样地,也称为被普遍接受的单字母符号。
“保守地修饰的变异体”对氨基酸及核酸序列都适用。对于具体的核酸序列,保守地修饰的变异体指那些编码相同或基本相同氨基酸序列的核酸,或核酸并不编码氨基酸序列的那些核酸或指基本上相同的序列。因为遗传密码的简并性,大量功能上相同的核酸编码任何指定的蛋白质。例如,密码子GCA,GCC,GCG及GCU都编码丙氨酸。这样,在任何丙氨酸被一密码子确定的位置上,该密码子可以被改变成任何一个上述的相应密码子而不改变所编码的多肽。这样的核酸突变称为“沉默突变”,它是一种保守地修饰的变异体。这里编码一种多肽的任何核酸序列也描述该核酸每一可能的沉默突变。技术人员将认识到核酸上的每一密码子(除AUG外,它是编码Met的唯一密码子)都能被修饰以产生一功能上相同的分子。相应地,一种编码多肽的核酸的每一沉默突变都暗含在每一所描述的序列中。
至于氨基酸序列,技术人员将认识到对一核酸,肽,多肽的个别替换,缺失或增加或者蛋白序列改变,增加或缺失单一氨基酸或在编码区序列中很小百分比的氨基酸是一种“保守地修饰的变异体”,其中改变导致一氨基酸被一化学上相似的氨基酸替换。保守替换提供功能上相似氨基酸为本领域所熟知。
下述六组,每一组含有的氨基酸都可以互相间保守替换1)丙氨酸(A),丝氨酸(S),苏氨酸(T);
2)天冬氨酸(D),谷氨酸(E);3)天冬酰胺(N),谷氨酰胺(E);4)精氨酸(R),赖氨酸(K);5)异亮氨酸(I),亮氨酸(L),蛋氨酸(M),缬氨酸(V);及6)苯丙氨酸(F),酪氨酸(Y),色氨酸(W)。
(见,如,creighton,蛋白质(1984))。
术语“转化”指通过分子生物学家所应用的各种技术将核酸引入植物培养物或者植物器官的植物细胞中。例如,核酸可以通过使用诸如电穿孔及显微注射植物细胞原生质体的技术直接引入植物细胞基因组DNA,或DNA构建物可以用生物导弹方法直接引入植物细胞,如DNA微粒轰击。可选择地,DNA构建物与适宜的T-DNA侧翼区结合并引入一常见的根癌农杆菌(Agrobacterium tumefaciens)宿主载体中。当细胞被该细菌感染时,根癌农杆菌宿主的毒性功能指导构建物及相邻标记插入植物细胞DNA中。
显微注射技术为本领域所熟知并在科学及专利文献中已有很好的描述。用聚乙二醇沉淀引入DNA构建体在Paszkowski等,EMBO J.3:2717(1984)中已有描述。电穿孔技术在Fromm等,美国科学院院报82:5824(1985)中描述。导弹转化技术在Klein等,自然327:70-73(1987)中描述。
根癌农杆菌介导的转化技术,包括双元载体的卸载和使用,也在科技综述中有很好的描述。见例如,Horsch等,科学233:496-498(1984)及Fraley等,美国科学院院报80:4803(1983)。发明详述本发明涉及植物嘌呤二氢吲哚基因,尤其是小麦puro A及puro B基因。来源于嘌呤二氢吲哚基因的核酸序列可用于修饰转基因谷类植物及后代谷类植物的籽粒结构。本发明的嘌呤二氢吲哚基因可以在通常用于生产淀粉,食品和/或饲料的谷类品种中表达,例如小麦,黑麦,燕麦,玉米等。通过加入嘌呤二氢吲哚基因到谷类植物基因组中,该植物籽粒变得比其亲本籽粒结构更柔软。通过阻抑嘌呤二氢吲哚基因表达,籽粒会比其亲本谷类籽粒变得更坚硬。另外,因为籽粒结构的定量特性,引入嘌呤二氢吲哚基因的突变形式影响谷类植物籽粒结构的修饰。
一般地,下述的在植物维持及育种以及重组DNA技术中使用的专门名词及实验程序在本领域中广泛了解并普遍运用。标准的技术用于克隆,DNA及RNA分离,扩增及纯化。通常涉及DNA连接酶,DNA多聚酶,限制性内切酶等的酶反应根据厂商的说明进行。这些技术及其它各种技术一般根据下述文献进行Sambrook等,Molecular Cloning-ALaboratory Manual(分子克隆-实验室手册),Cold Spring HarborLaboratory(冷泉港实验室),冷泉港,纽约(1989)及Dodds & Roberts,Experiments in Plant Tissue Culture(植物组织培养实验)3RD ED,(第三版)Cambridge University Press(剑桥大学出版社)(1995)。Ⅰ.嘌呤二氢吲哚蛋白及基因小麦籽粒结构的不同是由于一个主要基因的表达所引起,该基因鉴定为Hardness(Ha)(Symes,澳大利亚农业研究杂志16:113-123(1965);及Baker,农作物科学17:960-962(1977)),它定位于染色体5D短臂上(Mattern等,Proceedings of the 4thInternationalWheat Genetics Symposium(第4届国际小麦遗传研讨会会刊),Missouri大学,Columbia,MO.,第703-707页(1973)及Law等,用核技术改良种子蛋白(Seed Protein Improvement By Nuclear Techniques),国际原子能机构,奥地利维也纳,第483-502页(1978))。
单一主要基因的存在与小麦(T.aestivum)异源六倍体(2n=6x=42条染色体,基因组AABBDD)的性质是矛盾的,因为许多基因以三份同源体存在,每份来源于一个基因组。Ha等位基因定位于六倍体小麦5A及5B染色体但不表达。由于这一原因,缺少D基因组的坚硬小麦(T.turgidum L.var.durum)(2n=4x=28染色体,基因组AABB)通常比硬质六倍体小麦结构更坚硬。
小麦嘌呤二氢吲哚蛋白是在种子胚乳中发现的,半胱氨酸及色氨酸丰富的脂结合蛋白。成熟的嘌呤二氢吲哚蛋白A及嘌呤二氢吲哚蛋白B长148个氨基酸,分子量分别为16,792及16,387 Dal(道尔顿)。(Gautier等,植物分子生物25:43(1994))。它们具有55%的氨基酸同源性并表现出很强的碱性,两蛋白的pI点都大于10。
研究表明嘌呤二氢吲哚A及嘌呤二氢吲哚B必须都表达方能赋予小麦软质特性。puro B的色氨酸丰富区一个甘氨酸(Gly)向丝氨酸(Ser)的变化(Gly-46变成Ser-46)已经在两个硬质小麦品种中报道(Giroux& Morris,遗传学理论及应用95:857-864(1997))。见SEQ ID NO:5。该序列变化与籽粒硬度紧密连锁并能减轻脂结合强度。因为甘氨酸向丝氨酸的变化引起的内在疏水性的减弱(Thorgeirsson等,生物化学35:1803-1809(1996))。puro B中的该突变与83染色体5D重组取代体品系的硬籽粒结构间紧密连锁暗示该蛋白包括在控制籽粒柔软性中(Giroux & Morris,遗传学理论及应用95:857-864(1997))。存在于puro B中的变化在两不同硬质品种中是相同的并在两软质参考品种中是缺失的。该变化可以简单表明在friabilin成份puro B及Ha基因间存在紧密连锁。
任何已分离的嘌呤二氢吲哚或其同源基因都能在本发明中应用。使用的特殊的多聚核苷酸不是本发明的关键特征,只要在籽粒结构上实现所需变化。正如上所示,所有嘌呤吲哚蛋白都在Ha座位编码。在六倍体小麦中,第五组染色体命名为5A、5B及5D。Ha座位发现于5D染色体上。因为4倍体坚硬小麦(Triticum turgidum)缺失D组染色体,Ha座位是缺失的并且坚硬小麦无一例外地是硬质的。
小麦嘌呤二氢吲哚基因已被克隆并在文献中描述。例如,puro A及puro B两者的cDNA都已经从Triticum aestivum半成熟种子cDNA文库中分离并测序(Gautier等,植物分子生物学25:43(1994))。
其它嘌呤二氢吲哚或其同源基因的分离,包括无功能序列的同源物,可以通过很多技术完成。例如,在背景技术中揭示的以该序列为基础的寡核苷酸探针,可以用于从cDNA或基因组DNA文库中分离所需基因。构建基因组文库,通过随机断裂例如用限制性内切酶,产生基因组DNA大片段,并与DNA载体连接以形成能够包装进适当载体中的串联体。为制备cDNA文库,从胚乳中分离mRNA,并从该mRNA制备含有嘌呤二氢吲哚基因转录本的cDNA文库。
选择地,感兴趣的核酸可以用扩增技术从核酸样品中扩增。例如,用多聚酶链式反应(PCR)技术从基因组DNA,cDNA,基因组文库或cDNA文库中直接扩增嘌呤二氢吲哚基因或相关基因的序列。PCR及其它体外扩增方法也可以是很有用的,例如克隆编码蛋白的核酸序列用于表达,制备核酸用作探针以检测样品中目的mRNA的存在与否,用于核酸测序,或其它目的。对于PCR的综述见,PCR方法方法及应用指南,Innis等(编),Academic Press,San Diego(1990)。
多聚核苷酸也可以通过所述技术文献中的已知技术合成。见,如,Carruthers等,Cold Spring Harbor Symp.Quant.Biol.47:411-418(1982),及Adams等,J.Am.Chem.Soc.105:661(1983)。然后,双链DNA片段可以通过或者合成互补链并在适当条件下与该链一起退火或用一适宜的引物通过用DNA多聚酶加入互补链来得到。
如这里所描述的已制备分离的序列可以再被用于修饰嘌呤二氢吲哚基因表达并由此修饰植物籽粒结构。技术人员将认识到该编码功能性嘌呤二氢吲哚蛋白的核酸序列不需具有与这里揭示的例证基因相同的序列。这样,编码嵌合嘌呤二氢吲哚多肽的基因能应用于本发明中。
如上所示,嘌呤二氢吲哚多肽,象其它蛋白一样,具有完成不同功能的不同结构域。因此,嘌呤二氢吲哚基因序列不需全长,只要该蛋白的目的功能结构域表达即可。嵌合的嘌呤二氢吲哚多肽可以容易地设计,如用本领域的技术人员所熟知的各种重组DNA技术。例如,该链通过氨基酸替代,添加,缺失等在一级结构水平从自然发生的序列上变化。特别地,半胱氨酸残基可以添加,缺失或在多肽内移动以实现具有目的特性的修饰的嘌呤二氢吲哚多肽。嵌合多肽也可以通过融合两或多个嘌呤二氢吲哚基因的编码序列产生。所有这些修饰可以用于许多联合形式中以产生最终修饰的蛋白链。Ⅱ.重组构建物的制备在本发明的一个实施方案中,为修饰植物籽粒结构,制备了含有分离的嘌呤二氢吲哚基因序列及适于转化植物细胞的重组DNA载体。编码目的嘌呤二氢吲哚多肽的DNA序列,例如编码全长蛋白的cDNA或基因组序列,是可方便地用于构建一种能够引入目的植物中的重组体表达盒。表达盒典型地含有该嘌呤二氢吲哚核酸序列可操作地与启动子序列及其它转录及翻译起始调控序列连接,这些调控序列将指导在转化的植物目的组织(如胚乳)中从嘌呤二氢吲哚基因或其反义基因转录该序列。
例如,可以使用一种组成型植物启动子片段,它将指导植物所有组织表达嘌呤二氢吲哚蛋白。这样的启动子在大多数环境条件和发育状态或细胞分化过程中都是有活性的。组成型启动子的例子包括花椰菜花叶病毒(CaMV)35S转录起始区,来源于根癌农杆菌(Agrobacteriumtumefaciens)T-DNA上的1′-或2′启动子,以及其它为技术人员所知道的各种植物基因的转录起始区。
选择地,植物启动子可以受环境控制。这里所指的这样启动称作“可诱导的”启动子。环境条件通过可诱导启动子影响转录的实例包括病原体侵害,无氧条件或光的存在。
典型地,用于本发明中构建体的启动子将是“组织-特异性的”并在发育控制下的,结果,目的基因仅仅在某一组织中表达,例如胚乳。指导在种子中表达的启动子,尤其在胚乳中表达的启动子是特别优选的。这样启动子的实例包括来源于编码种子贮藏蛋白基因的启动子,例如napin,cruciferin,phaseolin等(见美国5,420,034号专利)。其它适用在谷类中表达嘌呤二氢吲哚基因的启动子包括来源于编码麦胶蛋白(gliadin)基因,谷类醇溶谷蛋白(prolamines)基因(例如,玉米醇溶蛋白(zein),大麦醇溶蛋白(hordein),黑麦碱(secalin)及燕麦蛋白(avenin))及淀粉生物合成酶基因的启动子。
来源于嘌呤二氢吲哚基因的内源启动子在指导嘌呤二氢吲哚基因在种子中表达,尤其胚乳中表达特别有用。这些种子特异性启动子也能用于指导异源结构基因表达。这样该启动子也能用于重组表达盒以驱动任何期望在种子中表达的基因进行表达。这些实例包括编码对提高种子营养价值有用的蛋白质的基因(例如编码在脂,蛋白及碳水化合物或淀粉生物合成中涉及的蛋白质的基因)。其它基因,包括那些编码药用上有用的化合物的基因,以及编码植物对真菌或其它种子感染有抵抗作用产物的基因。
嘌呤二氢吲哚基因启动子也能够用于起动抑制内源性嘌呤二氢吲哚基因表达的mRNA分子的转录。在植物中用重组DNA技术抑制基因表达的手段是为人们所熟知的。例如,反义技术可以方便地使用。见,例如,Sheedy等,美国科学院院报85:8805-8809(1988),及美国专利4,801,340号。催化性RNA分子或核酶也能用于抑制胚乳-特异性基因的表达。设计及运用靶RNA-特异的核酶在Haseloff等,自然334:585-591(1988)中已有描述。在有义方向引入核酸构型(configured)来阻止目标基因转录也已证明是一种有效手段。用有义抑制调节基因表达的一个应用实例见,Napoli等,植物细胞2:279-289(1990)及美国专利5,034,323号,5,231,020号及5,283,184号。
本发明的嘌呤二氢吲哚启动子典型地长至少400碱基对,并通常至少约800bp或1000bp。该启动子长度典型地少于约3500bp,通常少于约2800bp,并经常少于约2000bp。启动子长度从天然基因翻译起始密码子上游计数。技术人员将认识到应用“大约”来表达核酸片段长度意指包括与这里所述及的长度变化不大且维持所述启动子功能(也就是,种子-特异基因表达)的各种长度的片段。
确定嘌呤二氢吲哚启动子,基因组嘌呤二氢吲哚基因克隆的5′部分用于分析启动子序列的序列特征。例如,启动子序列元件包括TATA盒共有序列(TATAAT),它通常位于转录起始位点上游20到30bp处。在植物中,在TATA盒(TATA box)上游更远的地方,在-80到-100bp位置处,有一典型的启动子元件,它有一系列的腺嘌呤(adenine)围绕G(或T)NG三核苷酸。Messing等,Genetic Engineering in Plants(植物遗传工程),Kosage等(编),221-227页(1983)。
在本发明的表达载体制备中,不是启动子及嘌呤二氢吲哚基因的序列也优选地应用。假如期望正确表达多肽,在嘌呤二氢吲哚基因编码区3′末端的多聚腺苷区域是应该包括的。多聚腺苷区域能从天然基因中得到,从多种其它植物基因或从T-DNA中得到。
含有嘌呤二氢吲哚基因序列的载体典型地包含赋予植物细胞可选择表型的标记基因。例如,该标记可编码除草剂抗性,尤其抗除草剂抗性产物,如,对卡那霉素,G 418,博某霉素(Bleomycin),潮霉素(hygromycin)的抗性或对除草剂的抗性,如对chlorosluforon或膦丝菌素(phosphinothricin)(在bialaphos及Basta中的有效成份)的抗性。Ⅲ.转基因植物制备在本发明的一个优选实施方案中,本发明中转基因植物是谷类植物,包括但不限于,小麦,黑麦,黑小麦,大麦,玉米,高粱及水稻。在一个更优选的实施方案中,转基因植物是小麦,高粱及玉米。在一个最优选的实施方案中,转基因植物是玉米。
以上描述的DNA构建体可以通过一系列传统技术引入目的宿主植物基因组中。转化各种高等植物品种的技术是深入了解的并在科学及技术文献中描述。见,例如,Weising等,遗传学年鉴22:421-477(1988)。
该DNA构建体可以用生物导弹(biolistic)方法,电穿孔,PEG(聚乙二醇)沉淀,及显微注射植物细胞原生质体或胚发生愈伤组织的技术直接引入植物细胞基因组DNA中。选择地,DNA构建体可以与适宜的T-DNA侧翼区结合并用根癌农杆菌或发根病农杆菌(A.rhizogenes)载体引入。
微粒轰击技术在Klein等,自然327:70-73(1987)中已有描述。一种特别优选的转化小麦及其它谷类的方法是轰击未成熟胚来源的愈伤组织,如Weeks等,植物生理学102:1077-1084(1993)所述。
显微注射技术为本领域所熟知并在科学及专利文献中有很好的描述。用聚乙二醇沉淀引入DNA构建体在Paszkowski等,EMBO J.3:2717-2722(1984)中有所描述。电穿孔技术在Fromm等,美国科学院院报82:5824(1985)中描述。
根癌农杆菌介导的转化技术也在科学文献中广泛描述。见,如Horsch等,科学233:496-498(1984),及Fraley等,美国科学院院报80:4803(1983)。尽管农杆菌属主要于双子叶植物中有用,某些单子叶植物也能够被农杆菌属转化。例如,水稻的农杆菌属转化由Hiei等,植物杂志6:271-282(1994);美国专利5,187,073号;美国专利5,591,616号;Li等,Science in China(中国科学)34:54(1991);及Raineri等,生物/技术8:33(1990)。Xu等通过农杆菌属感染转化玉米,大麦,黑小麦及龙须菜(Xu等,Chinese J.Bot.2:81(1990))。
本发明在小麦及其它谷类中尤其有用。很多转化谷类的方法已经在文献中描述。例如,水稻转化由Toriyama等,生物/技术6:1072-1074(1988),Zhang等,遗传学理论及应用76:835-840(1988),及Shimamoto等,自然338:274-276(1989)描述。转基因玉米再生植株在Fromm等,生物/技术8:833-839(1990)及Gordon-Kamm等,植物细胞2:603-618(1990)中描述。相近地,燕麦(Sommers等,生物/技术10:1589-1594(1992)),小麦(Vasil等,生物/技术10:667-674(1992);Weeks等,植物生理学102:1077-1084(1993)),高粱(Casas等,美国国家科学院院报90:11212-11216(1993)),水稻(Li等,植物细胞报道12:250-255(1993)),大麦(Yuechun和Lemoux,植物生理学104:37-48(1994)),和黑麦(Castillo等,生物/技术12:1366-1371(1994))都已通过轰击(bombardment)转化成功。
通过上述任何转化技术获得的转化植物细胞都可以通过培养再生成具有转化的基因型从而具有期望表型的完整植株。这样的再生技术依赖于在组织生长培养基中加入一定的植物激素,典型地依赖于杀虫剂(biocide)和/或除草剂(herbicide)标记,它已经与嘌呤二氢吲哚多聚核苷酸序列一起引入植物细胞中。从培养的原生质体再生植株在Evans等,Protoplasts Isolation And Culture,Handbook of Plant Cell Culture,(原生质体分离及培养,植物细胞培养手册),Macmillian PublishingCompany(Macmillia出版公司),New York,124-176,1983;及Binding,Regeneration of Plants,Plant Protoplasts,(植株再生,植物原生质体)CRC Press,Boca Raton,21-73,1985中已有描述。再生植株也可以从植物愈伤组织,外植体,器官或其中一部分得到。这样的再生技术在Klee等,植物生理学年鉴38:467-486(1987)中概略地予以了描述。
本发明方法以没被天然发现的方式及环境条件下将嘌呤二氢吲哚多聚核苷酸掺入转化的植物中特别有用。尤其,嘌呤二氢吲哚蛋白可以非天然植物特征的时间或数量表达。
技术人员将认识到当表达盒稳定地整合进转基因植物并被确定可操作后,它就可以通过有性杂交引入其它植物中。一种用于转移期望表型进入植物育种群体的技术是通过回杂。然而,多种标准育种技术的任何一个都能使用,依赖于被杂交的品种。Ⅳ.嘌呤二氢吲哚基因断裂在本发明的一个实施方案中,表达嘌呤二氢吲哚基因并具有软质结构籽粒的植物被转化,结果是DNA-RNA-蛋白质合成的胞内途径破坏。嘌呤二氢吲哚蛋白合成的抑制能够通过多种不同机制实现,包括但不限于反义核酸,转座子,核酶,定点诱变,化学诱变及放射。在一种优选的实施方案中,蛋白合成抑制是用反义核酸。
反义技术是基于相对于其正常存在的转录逆转有义核酸并可操作地与启动子连接。反义核酸可以通过上述方法构建,只要它能够被转录成互补于并可阻断有义基因产生的RNA的翻译的RNA。对于反义核酸的综述,制备反义核酸的方法学以及用它来阻断RNA的翻译,见,美国专利5,728,926号,1998年3月17日发行及美国专利5,695,992号,1997年12月9日发行。
简而言之,反义基因通过删除有义基因双链编码区或其功能片段并以相对它用于转录的正常存在方式相反方向插入一启动子下游来产生。优选地,一终止子结构将加入该反义基因3′末端。另外,反义基因也能人工合成,尤其当用一有义基因的很小片段断时。带有启动子及终止子序列的反义核酸与一载体相连,并且该载体通过那些技术人员熟知的技术及以上描述的技术引入植物中。
核酶是另一种以核酸为基础的翻译抑制物。有两种不同形式的核酶。第一种是在Tetrahymena thermophila(四膜虫)(称为IVS,或L-19 IVS RNA)中天然存在的并广泛地在Zaug等,科学224:574-578(1984);Zaug和Cech,科学231:470-475(1986);Zaug等,自然324:429-433(1986)及P.C.T申请号WO88/04300中描述。这些核酶的活性位点由与目标RNA序列杂交的8bp(8碱基对)组成。核酶,以自由的鸟苷(G)或鸟苷衍生物形式存在,然后断裂目标RNA。从断裂形成的RNA片段包含末端5′磷酸基团及3′羟基基团。
第二类核酶在美国专利5,747,335,1998年5月5日发布中描述。这类核酶包含一个杂交区,该杂交区含有一或多条由至少与一种目标RNA的部分序列互补的单链RNA形成的臂。至少其中一条臂是与能够断裂目标RNA并含有至少9个核苷酸的催化区域相关联的。如果杂交区域包含两或多条RNA臂,在该臂中的核苷酸数量应该比9个核苷酸更多。
另一种抑制蛋白合成的技术是向植物基因组中引入一种转座子。该方法在美国专利5,225,341号中已有描述,该专利发布于1993年7月6日。简单地说,插入一种转座子来破坏感兴趣的基因,例如,嘌呤二氢吲哚A(puro A)。目前,最优选的转座子系统为玉米来源的Ac/Ds系统,尽管从其它品种中得到的元件也可以使用。许多植物,然而,已知含有转座子。它们典型地通过从体细胞突变体产生的多样化来检测。有关转座子的综述可以见于Nevers等,Adv.in Bot.Res.12:103-203(1987)。
所需载体将优选地包含一种含有设计用于起动植物中感兴趣基因转录的表达盒的转座子。细菌或病毒起源的辅助序列,也典型地被包括在内以允许该载体克隆进入细菌或噬菌体宿主中。
载体也将典型地含有一种辅助的可选择的标记基因,通过该标记基因可以在培养基中鉴定转化的植物细胞。通常,标记基因将编码抗生素抗性蛋白。其它编码额外功能的辅助DNA序列也可以存在于载体上。例如,就农杆菌属转化来说,也将包括T-DNA序列以便于随后转移到植物染色体上。
除了以上概述的基于核酸的策略,其它植物中抑制蛋白质合成的方法也为技术人员所熟知。这些方法包括但不限于,化学诱变及放射线照射。化学诱变是使一种化学物质与植物细胞接触结果使DNA链损伤。然后该细胞用其自身的修复机制在下一个准备用于细胞分裂的染色体复制期间退火双链DNA。然而,修复机制经常是不完善的并在双链DNA中发生错配。有细胞分裂时,其中之一的子代细胞含有错配的DNA并因此形成突变。
放射也导致突变。植物细胞优选地用X-射线照射,然而,紫外线辐射也引起DNA链的断裂。与化学诱变相似,细胞不完美的修复机制在子代细胞中创造突变。当用这些细胞再生植株,该突变就存在于基因组中并能传给下一代植物。Ⅴ.植物选择育种当产生转基因植物后,选择随之的子代以选择含有赋予一种特异有益性状的遗传材料的后代,例如,籽粒结构,是有益的。在选择开始之前,然而,期望基因组的遗传图应该被制作。遗传图通过寻找遗传上互相连锁(在连锁群中)的多态性标记,或与基因连锁或QTL影响感兴趣的表型性状来制作。标记基因排列进入连锁群作为该标记将来之用的参考及精确地定位基因或QTL相关标记是有用的。这些QTL′s中的许多具有多个的亚基因座及通过该亚基因座的单倍型。每一种单倍型提供一种在基因座内的不同的等位基因组分,因此,与仅仅一个基因座有两个等位基因相比,它拓展这些标记基因座的用途到更多的图谱研究中。A.植物鉴定本发明的后代及转基因植物可通过基因型或表型进行鉴定。基因型分析是鉴定特殊遗传物质的存在或缺失。为鉴定嘌呤二氢吲哚基因是否成功地引入后代植物中,本发明的亲本植物也需进行基因型分析。
表型分析是鉴定表型性状的缺失或存在。表型性状是一植物由其遗传物质及环境因素互作所确定的物理特性。表型性状可以是或者简单的,如孟德尔性状(Mendelian),或者复杂的,如,数量性状。孟德尔性状是通过带有显性基因的杂交植株表现出来的。例如,需要春化作用这一性状,这种需要(冬性)对于不需要(春性)来说是隐性的。
数量表型性状是指后代植株的物理特征介于两个亲本之间的性状。仅仅为了讨论的目的,转基因植物的亲本是基因组供体及嘌呤二氢吲哚基因的供体。一种数量性状的一个实例为小麦籽粒结构。
1.DNA分析a.DNA指纹分析通常,“DNA指纹分析”(DNA Fingerprinting)是一个广义的术语,用于指示那种评估从各种来源分离到的DNA中的序列差异的方法。典型地,DNA指纹分析用于分析及比较不同生物物种来源的DNA。在本发明的一个优选实施方案中,DNA指纹分析用于评价个体之间,尤其是亲本,后代及转基因植株之间的关系。
由指纹分析得到的DNA序列差异称为DNA多态性。生物体DNA多态性存在可以指示这样一生物体的遗传起源和作为那种生物体的特征性遗传标记。这样的多态性可由基因组的插入,缺失,和/或突变而产生。
在本领域中已知许多用于DNA指纹分析的方法。限制性片段长度多态性(RFLP)技术应用限制性内切酶消化DNA之后经过凝胶电泳,对消化的DNA进行大小分离,将大小分离的DNA与一特异性多核苷酸片段(或“多核苷酸探针”)杂交。这里使用的探针是一种用放射性同位素或其它易于鉴定方式标记的生物化学标记。探针用于鉴定DNA,基因,基因产物或蛋白质的特异区域。因此,一种“多核苷酸探针”是能够用来鉴定互补核酸序列的核酸分子。多核苷酸探针的序列可能已知,也可能未知。多核苷酸探针结合的限制性片段分子量大小的差异反应了DNA样品的序列差异,即DNA多态性。见Tanksley,生物技术7:257-264(1988)。因此,一种“多态性DNA片段”是具有独特大小和序列的DNA片段,它以另外一种独特的分子量大小存在于其它的DNA样品中或在其它DNA样品中不存在。
其它产生DNA片段用于指纹分析的方法如使用多聚酶链式反应(PCR)扩增特异的DNA序列。见,如,Williams,核酸研究18:6531-6353(1990)(随机扩增多态性DNA(RAPD)技术),Heath,核酸研究21:5782-5785(简单序列重复(SSR)技术)和PCT申请WO93/06239(扩增片段长度多态性(AFLP)技术)。也见于美国专利4,683,195号及美国专利4,683,202号(讨论PCR扩增技术)。
一种有用的分析转移的遗传标记存在的技术,RAPD分析被用于本发明中分析后代植株的基因型信息。RAPD分析在基因组水平上检测重组事件并在特异且随机产生的DNA片段的基础上检测。由于它不需要如上所述标记的核酸探针或杂交,它可以很快完成。
简单地说,基因组DNA从亲本及后代中分离。每一基因组DNA样品用一套引物扩增。将扩增产物进行琼脂糖凝胶电泳来产生DNA图谱。DNA的琼脂糖电泳在本领域中是熟知的。如果期望,该PCR引物能被用放射性同位素或荧光团标记以便更好地检测低浓度的DNA。然而,在扩增过程中通常可以产生足够的DNA片段,以致于不需要标记,DNA图谱可以通过溴化乙锭(EB),染色凝胶而观察到,它也是一种标准方法。
假如泳道中母本DNA图谱与后代DNA泳道中的图谱相同,那就是没有发生DNA交换,该后代是自花授粉或克隆的结果。如果后代的DNA图谱与亲本DNA图谱有任何一点不同,则说明基因组发生了重组。
所有这些PCR为基础的指纹分析方法导致产生大量特异大小及序列的可复制的DNA片段,它们可通过大小,典型地,通过凝胶电泳分离。通过大小分离的片段的观察或被直接用一种荧光染料观察或被标记的多核苷酸探针杂交或被PCR过程中标记的扩增产物(放射性地或荧光性地)并紧接着在凝胶上检测标记产物来实现。
b.制备及利用标记以检测多态性核酸尽管编码必需蛋白质的DNA序列在不同物种之间高度保守,但有一些DNA区域是不编码的或编码部分不具关键功能的蛋白质,因此,绝对保守的核酸序列很难选到。遗传变异的主要原因是添加,缺失或点突变,存在于植物群体中的个体基因组的重组及可转座元件。
点突变是典型地造成DNA复制不精确的原因。在减数分裂形成生殖细胞或有丝分裂产生克隆期间,DNA聚合酶转换碱基,或者转换(即一种嘌呤变为另一种嘌呤或一种嘧啶转变为另一种嘧啶)或者颠换(也就是嘌呤转变为嘧啶及反之)。如果DNA聚合酶之外切功能不能对错配进行校正,这种碱基转变将被保持。在萌发或下次细胞分裂(在克隆细胞时)期间,带有点突变的DNA链就成为互补链的模板,碱基改变即掺入到基因组中。
可转座的元件是在基因组中具有转移或跳跃到新位置能力的DNA序列。本领域中已知的几个转座子的实例(见如,Freeling M.,植物生理学年鉴35:277-298(1984);Haring等,植物分子生物学16:449-469(1991);及Walbot,植物分子生物学年鉴43:49-82(1992))。
技术人员能设计用于检测标记的探针核酸,包括PCR引物探针,等位基因-特异探针,RAPD探针等用于检测这里所述及的基因座的多态性核苷酸,以及下面讨论的遗传连锁序列。适当的克隆及测序技术的实例以及足以指导技术人员通过许多克隆操作的说明可见于Berger &Kimmel,Guide to Molecular Cloning Techniques(分子克隆技术指南),酶学方法第152卷Academic Press,Inc.,San Diego,CA(Berger);Sambrook等,Molecular Cloning-A Laboratory Manual(分子克隆-实验手册)(2ND ED)第1-3卷,Cold Spring Harbor Laboratory,ColdSpring Harbor Press,NY(1989),(Sambrook);及分子生物学常用方法,F.M.Ansubel等编,常用方法,Current Protocols,a joint venturebetween Greene Publishing Associates,Inc.和John Wiley & Sons,Inc.,(全部及包括1997年增刊)(Ausubel)。提供用于克隆的细菌及噬菌体目录,如,由ATCC,The ATCC Catalogue of Bacteria andBacteriophage(ATCC细菌及噬菌体目录),Gherna等(编)(1992)ATCC出版。另外用于测序,克隆和分子生物学其它方面的基本程序及潜在的理论因素也见于Lewin,Genes V(基因V),Oxford UniversityPressInc.,NY(1995)(Lewin);及Watson等,Recombinant DNA(重组DNA),2ND ED(第二版),Scientific American Books(美国科学丛书),NY(1992)。
生物试剂和实验仪器的制造厂商的产品信息中也提供了已知生物学方法中有用的信息。这样的制造厂商包括Sigma Chemical Company(Sigma化学公司)(Saint Louis,MO);New England Biolabs(新英格兰生物实验室)(Beverly,MA);R & D系统(Minneapolis,MN);Pharmacia LKB生物技术(Piscataway,NJ);Clontech实验室公司(PaloAlto,CA);Chemgenes公司,(Waltham MA)Aldrich化学公司(Milwaukee,WI);Glen研究公司(Sterling,VA);GIBCO BRL生命技术公司(Gaithersberg,MD);Fluka Chemica-Biochemika Analytika(Fluka Chemie AG,Buchs,Switzerland);Invitrogen(San Diego,CA);Perkin Elmer(Foster City,CA);及Stratagene;以及许多其它为技术人员所知的商业来源(source)。
本发明的核酸组合物,无论是DNA,RNA,cDNA,基因组DNA或其类似物,或这些分子的杂合体,均从生物来源中分离或体外合成而得到。本发明的核酸存在于植物,整个细胞,细胞裂解液或部分纯化或基本上很纯的形式中。
适合于扩增作为分子探针的序列或产生随后用于亚克隆的核酸片段的体外扩增技术是已知的。足以指导技术人员通过这样体外扩增方法的技术实例包括多聚酶链式反应(PCR),连接酶链式反应(LCR),Qβ复制酶扩增及其它RNA聚合酶介导的技术(例如,NASBA)可见于Berger,Sambrook,及Ausubel以及美国专利4,683,202;PCR ProtocolsA Guide to Methods And Applications(PCR方案,一本方法及应用手册)(Innis等编),Academic Press Inc.San Diego,CA(1990)(Innis);Arnheim & Levinson(1990年10月1日)C & EN 36-47;Kwoh等,美国国家科学院院报87:1874(1990);Lomell等,临床化学杂志35:1826(1989);Landegren等,科学241:1077-1080(1988);Van Brunt,生物技术8:291-294(1990);Wu & Wallace,基因4:560(1989);Barringer等,基因89:117(1990),及Sooknanan & Malek,生物技术13:563-564(1995)。改进的体外扩增核酸的克隆方法在Wallace等,美国专利5,426,039中已有描述。技术人员将意识到基本上任何RNA都能转变成适于限制性内切酶消化,PCR扩增及用反转录酶及一种聚合酶测序的双链DNA,见,Ausubel,Sambrook及Berger,全部出处同上。
用作探针的寡核苷酸,例如,在体外扩增方法中,用作基因探针,或作为抑制成份(如核酶)典型地根据固相亚磷酰胺三醋法化学合成,该方法由Beaucage & Caruthers,Tetrahedron Letts.,22(20):1859-1862(1981)描述,用Needham-VanDevanter等,核酸研究12:6159-6168(1984)中所述的一种自动合成仪合成。寡核苷酸也能通过技术人员已知的各种商业来源定制和订购。如果需要,可用天然的丙烯酰胺凝胶电泳或如Pearson & Regnier,染色体杂志255:137-149(1983)所描述的阴离子交换HPLC(高效液相色谱)进行寡核苷酸的纯化。合成的寡核苷酸序列可用Maxam & Gilbert,酶学方法65:499-560(1980)中所述的化学降解法进行验证。
c.探针标记和检测用于原位检测,体外扩增(PCR,LCR等),杂交技术(等位基因特异性杂交,原位分析,Southern分析,Northern分析等)或其它任一检测步骤中的探针,可以用带有任何可检测的成份,通过光谱的,化学的,生化的,免疫化学的,电子的,光学的或化学的手段进行标记。本发明中的有用标记物包括光谱标记物,例如荧光染料(例如,荧光素异硫氰酸盐,Texos红,罗丹明,地高辛,生物素等),放射标记物(如,3H,125I,35S,14C,32P,33P,等),酶(例如,辣根过氧化物酶,碱性磷酸酶等)及其它本领域中的技术人员已知的标记物。
一般来说,监测探针-目标核酸杂交的检测器适用于特殊的标记物。典型的检测器包括分光光度计,光电管及光电二极管,显微镜,闪烁计数器,照相机,胶片等,以及其中不同的组合。适宜的检测器的实例可以从许多商业性组织中获得,这对技术人员是很熟悉的。
由于放射性核苷酸的掺入核酸是直接的,该检测代表一种优选的标记策略。掺入放射性标记物的实例技术包括用一种激酶或磷酸酶进行末端标记,缺口平移(nick translation),使用聚合酶掺入有放射性的核苷酸及其它已知的策略。
荧光标记物也是优选的标记物,具有操作时不需要特别小心的优点。优选的标记物典型地具有下述一或几个特点高敏感性,高稳定性,低背景,低环境敏感性和高特异性。现已普遍知道的掺入到本发明的标记物中的荧光半分子包括但不限于Texas red(德克萨斯红),罗丹明,和荧光素。具有偶联一种元件之功能的单个的荧光复合物在本发明的仪器或检测中能够被较理想地检测,或者它可被修饰以掺入到这种功能物包括如丹磺酰氯;荧光素如3,6-二羟-9-二苄吡喃醇中。许多荧光标记物都可从公司购买,如SIGMA化学公司(St.Louis,MO),分子探针,R & D系统(Minneapolis,MN),Pharmacia LKB生物技术公司(Piscataway,NJ),Clontech实验室公司(Palo Alto,CA),Chem基因公司,Aldrich化学公司(Milwaukee,WI),Glen研究公司,GIBCOBRL生物技术公司(Gaithersberg,MD),Fluka Chemica-BiochemikaAnalytika(Fluka Chemie AG,Buchs,Switzerland),及应用生物系统(Applies Biosystems)(Foster City,CA)以及其它为技术人员熟知的商业来源。
2.形态学和数量性状的研究后代和转基因植株的外形也被用来鉴定本发明的植株。籽粒结构的形态学性状及嘌呤二氢吲哚蛋白的表达通过产生的后代监测。另外,植物高度,穗长(玉米中),叶形等数量性状也被监测以保证植物品系保持健康。
数量性状的资料对鉴定后代杂种优势的表达或抑制是很重要的。为了可信,每一亲本和后代的每一个数量性状至少要做2份,优选20份观察记录资料进行变异性分析。然后确定每一各种变异性状至少5%显著差异(LSD)的植株的结果及变异系数,并列表。
除后代杂种优势的表达和抑制外,数量性状的差异能够表明遗传水平的重组,亲本及后代的细胞学特征也可用于比较鉴定杂种后代。细胞学分析包括但不限于染色体作图来检测杂交后代中是否有亲本染色体的存在和原位杂交,如同功酶分析。
荧光原位杂交(FISH)是观察DNA序列的一个重要技术。该方法与已成为实验室基因定位研究的常规方法。例如,FISH用于将基因定位到特定染色体区域或确定产生的克隆在染色体上的顺序。另外,FISH也能用于比较亲本和后代的染色体。
一类叫做“染色体染料”的FISH探针是可以得到的。该类探针对确定染色体结构非常有用,因为他们或多或少一致地与一给定的染色体的全长杂交。染料用来确定一个细胞的染色体组,结构异常如转位,及鉴定亲本标记染色体的起源。
用于FISH中标记DNA探针的方法有很多,包括非直接法,即利用酶反应将半抗原如生物素或地高辛掺入到DNA中。之后与染色体中期分裂相或分裂间期核进行杂交,通过免疫学方法将荧光标记连到杂交体上。最近,荧光染料可直接掺入探针,不需要中间步骤即可检测。标准的FISH染料包括荧光素,罗丹明,德克萨斯红(Texas Red)和CascadeBlue。多重探针FISH分析可利用半抗原或荧光染料标记不同探针来完成。
B.等位基因-特异性杂交(ASH)筛选后代是否具有其亲本赋予的特殊序列的一个特别优选的技术是等位基因特异性杂交,或“ASH”。该技术的基础是一短的单链寡核苷酸探针与一单链目标核酸当它们的碱基完全互补时能够稳定退火。杂交可通过探针上的放射活性或非放射活性标记来检测(标记探针或其它核酸的方法在下面详述)。
当在不同基因型中一个DNA片段的碱基组成在一个或几个核苷酸位点不同时,ASH的标记呈现多态性。对每种多态性设计两个或多个不同的ASH探针,使它们除了多态性核苷酸外,DNA序列一致。每一探针与一个等位基因序列精确相符以使那些探针能够区别于所有的两者之中的一个等位基因序列。每一探针与目标DNA杂交。通过合适的探针设计和严格的条件可以排除杂交中探针和目标DNA之间的单一碱基的错配,未结合探针会被洗掉。在这种情况下,只有其中一种探针会与一目标样品杂交,这种样品是等位基因的纯合型或同源型(一种等位基因是通过探针与靶子之间的DNA同源性来判断的)。两个等位基因的杂合的或异源的样品会与两个探针都杂交。每一等位基因都有一个探针使多态性成为遗传上的共显性从而使它在鉴定接合性(zygosity)时非常有用。另外,当与两个探针都不发生杂交时,共显性的ASH系统很有用,以致于对照实验可直接鉴定不足够的目标DNA或出现的新等位基因。
当通过杂交确定只有一个等位基因出现或缺失时,或者用一个探针来发生杂交时,ASH标记被用作显性标记。二者之一的等位基因可通过缺乏杂交信号推断。异源性靶核酸(如多等位基因植物的染色体DNA)通过将包含一个基因组核酸不同多态性的2个或多个探针与其同时杂交来进行检测。
一种ASH探针的设计是当碱基对完全互补时,它能与靶核酸形成一稳定的双螺旋。探针与靶之间一个或多个碱基对的错配阻止杂交的稳定。这一过程的许多变化证明这是正确的。探针和靶分子任选地或者是RNA或为变性DNA;靶分子是与探针序列互补的任何长度的核苷酸。探针设计成可与靶DNA任一链杂交;探针分子大小的范围在保证不同严格杂交条件下波动。
多聚酶链式反应(PCR)(见如,Mullis & Faloona,酶学方法155:335-350(1987)及上述文献)可允许在相对较小的体积中从低浓度的核酸扩增ASH的靶序列(Koenraadt & Jones,植物病理学82:1354-1358(1992);Iitia等,生物技术17:566-571(1994))。另外,从基因组DNA来的靶序列用限制性内切酶消化,通过凝胶电泳进行大小分离。靶序列结合到膜的表面,或如美国专利5,468,613号所述,将ASH探针序列结合到膜上,典型地会发生杂交反应。
利用核苷酸等位基因和多态性,通过PCR扩增基因组DNA的核酸片段,以点杂交的形式将靶DNA转到膜上,与一标记的寡核苷酸探针杂交,放射后显影观察得到ASH数据。
在一种变化中,ASH技术被应用到多个多态性核酸的快速特异检测的固相分析中。典型地,ASH探针与一固相支持物相连,靶核酸(如基因组核酸)与探针杂交。可用一荧光团标记探针或靶序列或全部标记。当靶序列被标记时,可用结合的荧光来检测杂交。当探针被标记时,可通过标记物的萃灭来检测杂交。当探针和靶全部被标记时,可通过检测由于两个结合标记物的接近而导致的颜色转移(color shift)来检测杂交。一系列标记策略、标记物等,尤其是荧光的应用在前面已有描述。
在一个实施方案中,在一固相支持物合成一种ASH探针阵列。用芯片掩蔽(clip masking)技术和光保护化学有可能产生排列有序的核酸探针。这些排列,如已知的“DNA芯片”或非常大规模的固定化高分子阵列(“VLSIPSTM”阵列)在两种大约1平方厘米到几平方厘米的基质上能够包括数万个确定的探针区。
固相核酸阵列检测靶核酸的构建和应用在文献中已有描述。见,Fodor等,科学251:767-777(1991);Sheldon等,临床化学39(4):718-719(1993);Kozal等,自然医学2(7):753-759(1996)及美国专利5,571,639号。也见于PCT/US 95/16155(WO96/17958)。简而言之,组合策略可合成含有大量探针的阵列用最少数量的合成步骤来完成。例如,只利用32步化学合成反应有可能合成并附着所有可能的DNA 8聚体聚寡核苷酸(48或65536个可能的组合)。一般地,VLSIPSTM程序提供了一个方法,只用4n个合成步骤在一个阵列中就可产生4n个不同的寡核苷酸探针。
用自动亚磷酰胺化学法和类似于计算机芯片工业的光抗(photoresist)技术的芯片掩蔽技术在玻璃表面完成寡核苷酸阵列的光-指导的(Light-directed)组合合成。典型地,玻璃表面可用一含有功能团如被光不稳定(photolabile)保护基团封闭的羟基基团或胺基基团的硅烷(silane)试剂衍生化。通过照相平版印刷屏蔽的光解被用来选择性地暴露功能基团,这些功能基团可与5′-光保护的核苷酸亚磷酰胺反应。亚磷酰胺只与那些发光的位点发生反应(通过去除光不稳定的封闭集团而暴露)。这样,亚磷酰胺只加在前面步骤中选择性暴露的区域上。这些步骤不断重复,直到理想的序列阵列在固体表面合成出来。不同寡核苷酸类似物在阵列不同位置的组合合成(combinatorial synthesis)是由合成中发光(illumination)的方式及加入偶联剂的顺序决定的。用荧光显微镜或激光扫描显微镜来监测靶核酸与阵列的杂交。
除利用现有技术设计、制造(build)和使用探针阵列外,技术人员还可以从专业的阵列制造商那里定做阵列和阵列阅读器(array-readingdevices)。
探针的设计受到目的应用的影响将被意识到。例如,当几个等位基因特异性探针与靶序列相互作用在一个单一阵列进行检测时,如单一DNA芯片上,较为理想的是所有探针都具有相似的解链温度。因此,探针的长度要调整以便在阵列中的所有探针的解链温度都非常相似(将意识到当不同探针具有不同GC含量时,需要使不同探针具有不同长度以达到一特定的Tm值)。尽管解链温度是探针设计时需要考虑的一个主要方面,还需要考虑其它因素来进一步调整探针的组成(construction)。
C.标记辅助筛选当基因或QTL和一个或多个标记物一起被作图并发现连锁不稳定时,有可能利用那些标记物来筛选那些基因或QTL的理想的等位基因-一个称作标记辅助筛选(MAS)的过程。简而言之,在一被筛选的植株来源-生物样品中的相应于标记核酸的一种核酸被检测。该检测可采用探针核酸与标记杂交的形式,如利用等位基因-特异性杂交,southern分析,northern分析,原位杂交,随着标记区域PCR扩增的引物的杂交等。这里介绍了检测标记物的各种程序。当在生物样品中的一特定标记物被鉴定存在(或不存在),该植株被选择,即,通过选择育种用其制作后代植物。
MAS在植物和动物育种中的另一用途是通过回交育种辅助恢复回归亲本基因型。用于回归亲本基因型的MAS可与用于使用这些标记的期望遗传材料的MAS相结合。相应地,有可能利用标记物将QTLs引入具有另外的理想遗传背景的谷类作物中,利用本发明的标记物来筛选QTL及其它期望的遗传背景。
以上所述的任何克隆或扩增策略对产生重叠克隆的连续序列都是很有用的,因此提供重叠的核酸,该核酸是遗传上连锁的核酸在分子水平上表现出的物理位置关系。这一策略的一个普遍的例子是在各个生物测序工程中,对重叠克隆进行测序以提供染色体的全部序列。在该程序中,按照上述文献中的标准步骤构建生物体的cDNA或基因组DNA文库。分离单个克隆并测序,将重叠的序列信息排列以提供该生物体的序列。也见Fleischmann等,科学269:496-512(1995)中描述的全部基因组的随机测序及全部流感嗜血杆菌(Haemophilus influenzae)基因组的排列;Fraser等,科学270:397-403(1995)中描述的完整的Mycoplasmagenitalium基因组的随机测序及排列;及Bult等,科学273:1058-1073(1996)中描述的Methanococcus jannaschii基因组的随机测序和排列。Hagiwara & Curtis,核酸研究24(12):2460-2461(1996)中发展了一种“长距离测序仪”(long distance sequencer)的PCR流程,从非常大的克隆中产生重叠核酸以帮助测序以及一些扩增并标记这些重叠核酸到适当的测序模板的方法。这些方法可与鸟枪测序(shotgunsequencing)技术联合使用以提高在整个生物体测序工程中主要应用的鸟枪法的效率。
当这些技术应用于本发明时,对鉴定和测定遗传上与上述基因座连锁的基因组核酸序列是很有用的。
Ⅵ.实施例A.植物培养及籽粒硬度测量T.aestivum,“Falcon”及“Heron”品种(Symes等,澳大利亚农业研究杂志20,971-979(1969))的软及硬质近似同源品系(NILs)于1995年夏天种植于Lind,WA附近。籽粒硬度用近-远红外线反射的(NIR)分光光度计(型号450,Ttchnicon,Tarrytown,NY),以UDY研磨籽粒(方法39-70A;AACC 1995)测量。单谷粒硬度读数(SKCS)通过对300粒谷粒样品的硬度分析获得,使用Perten 4100型SKCS,按照制造商建议的操作步骤进行(Perten Instruments,Reno,NV)。
按照Law,遗传学53:487(1996)所述程序从软质红小麦“中国春”(Chinese Spring)和硬质红冬麦品种“Cheyenne”形成83个纯合的染色体5D替换系(Substitution lines)。从“Cheyenne”来的puro B的46位是丝氨酸。每个品系均含有20对正常整倍体的“中国春”(CS)染色体和1对重组的“中国春”/“Cheyenne”5D染色体(CS(CNN5D))。“Langdon”硬质,“Langdon”替换系LDN 5D(5B),其中“中国春”5D染色体替换了5B染色体,CS Nulli 5D/Tetra 5A中“中国春”5D染色体被替换成另一拷贝的5A染色体,它们均按常规培养方式生长在温室中。表1籽粒结构测定
从表1中可以看出,从硬籽粒品种“Cheyenne”转移突变puro B蛋白造成后代植物(CS(CNN5D))籽粒比亲本品系“中国春”的籽粒明显坚硬。后代植株的SKCS值为79而亲本的SKCS为60。相反地,“Langdon”硬质小麦(durum wheat)中来源于“中国春”的puro A和puro B的表现造成籽粒SKCS值从88降到24;基本上产生了一软质硬小麦(soft durum wheat)。
如上所述,一些硬质小麦品种缺少puro B丝氨酸突变。“Falcon”,一个这样的品种,被选择用于进一步研究。用“Falcon”做为硬质(hard)等位基因供体,“Heron”做为软质等位基因供体得到互补的软及硬质NILs(近同源品系)(Symes,澳大利亚农业研究杂志16:113-123(1965))。在这套NILs中,当或者“Falcon”或者“Heron”作为回归亲本时,软和硬质品系都存在。每套NILs由回交7代产生并进行软质或硬质结构籽粒的筛选。示于

图1的NILs代表利用或者“Falcon”或者“Heron”作为回归亲本创造的一种硬质及软质NIL。
检验了puro A蛋白的有无与籽粒软/硬之间的连锁。44个“Falcon”/“Heron”硬/软质NILs中的每一个都通过SDS-PAGE(如下所述)分离friabilin成份蛋白进行鉴定并计数(scoring)puro A蛋白的存在。依照基因组DNA中扩增puro A的能力(如下所述),NILs也进行了puroA基因含量的鉴定。单个品系要被分为无puro A(无效的,null)的“Falcon”型或带有puro A的“Heron”型。通过两种不同方法获得的这些NILs表型籽粒硬度示于图1,其中指明了puro A类型。还发现两种NILs是含有puro A和那些缺少这种蛋白的种子的混合物。对每两种NILs(AUS 90077及AUS 90254)的10个单独的谷粒进行了puro A存在的分析。NIL AUS 90077,NIR硬39,十分之六的谷粒含有puro A。NIL AUS 90254,NIR硬度29,显示十分之七的谷粒含有puro A。依照这两个NILs的中间硬度值,混合物的百分比十分符合预期的频率。(软质NIL平均NIR等于15。硬质NIL平均NIR等于71。预期的NIL 90077等于{(6×15)+(4×71)}/10=37.4。预期的NIL 90254等于{(7×15)+(4×71)}/10=31.8)。每一个这些NILs混合物的观察百分比可能解释了它们的某些中同硬度值。结果,在puro A存在及这套遗传原种(genetic stocks)中的籽粒柔软性间没有重组。
B.puro A,puro B及GSP-1 DNA的分离及PCR扩增用Dellaporta等,植物分子生物学报道1:19-21(1983)的方案分离小麦胚乳DNA。设计识别存在于硬质小麦品种“Wanser”及“Cheyenne”中的puro B的丝氨酸序列变化的引物用于扩增13个软质地小麦和11个硬质地小麦。puro B中的丝氨酸突变是一个氨基酸即46位甘氨酸(GGC)变为丝氨酸(AGC)的改变(Gautier等,植物分子生物学25:43-57(1994))。采用这种序列改变来制备甘氨酸或丝氨酸特异的PCR引物(Giroux & Morris,遗传学理论及应用95:857-864(1997))(SEQ ID NO:9及10)。“硬质”或丝氨酸-特异性3′puroB引物末端带有T而“软质”或甘氨酸-特异性引物3′末端带有C。
用小麦品种Gly-46或Ser-46特异序列SEQ ID NO:9,SEQ IDNO:10及SEQ ID NO:11来扩增puro B序列在其它文献中也有描述(Giroux & Morris,遗传学理论及应用95:857-864(1997))。如前述(Gautier等,植物分子生物学25:43-57(1994))用SEQ ID NO:7及SEQ ID NO:8作为引物已完成小麦品种中puro A序列的扩增。每套引物的退火温度保持在58℃。单个PCR反应重复两次或多次。
用硬质丝氨酸特异性引物(puro B)检测到了一大小特异性产物(250bp)用作指示46位丝氨酸的存在。而硬质小麦puro B中甘氨酸到丝氨酸的改变是很普遍的,也发现了某些例外。大多数(7/11)硬质小麦显出一丝氨酸特异的250 bp带,而4个硬质小麦品种,“Express”,“Butte86”,“Westbred 926”及“Falcon”没有。四种例外的每一个都显示出一甘氨酸特异性“软质”小麦puro B带。所有13个软质小麦产生甘氨酸特异性带而没有丝氨酸特异性带。对每一个应用的基因组DNAs的全puro B编码序列扩增是可能的。
一GSP-1相关克隆,SR 3.1,检测一种RFLP明显与籽粒硬度连锁(Jolly等,美国国家科学院院报93:2408-2413(1996)),然而还没有转录或基因表达分析的报导。我们用“Heron”,“Falcon”进行Northern杂交分析,实验中用了4个硬/软质NILs,发现GSP-1转录水平的差异与籽粒硬度不一致。另外,还检测了从“中国春”及CS(CNN5D)来源的4个单独的硬质和软质品系。
另外的基因,称为GSP-1,已表明与籽粒柔软性有关(Rahman等,欧洲生物化学杂志223:917-925(1994);及Jolly等,美国国家科学院院报93:2408-2413(1996))。从开花后14天的“中国春”的种子中提取RNA,通过RT-PCR扩增GSP-1探针。该探针用以下引物制备5′引物由DNA序列5′GTAGTGAGCACTACTATTGC3′(SEQ IDNO:11)组成,3′引物为5′-GAGCCTTCCCTCCAAGTGC-3′(SEQID NO:12)的反向互补序列。PCR退火温度为58℃。
SEQ ID NO:11及SEQ ID NO:12扩增GSP1b的一内部400bp片段(Rahman等,欧洲生物化学杂志223:917-925(1994))。该400 bp片段用作探针,在高严格条件下与“Falcon”/“Heron”NILs的总RNA及“中国春”染色体5D替换品系(Giroux & Morris,遗传学理论及应用95:857-864(1997))杂交。
与“Falcon”/“Heron”NILs一样,GSP-1转录与籽粒硬度无关。“Langdon”硬质与软质的双体替换品系LND-CS DS5D(5B)也都含有GSP-1转录物。GSP-1物理上定位于这三组每一个5号同源染色体的短臂(Gill等,遗传学143:1001-1012(1996))上,其转录物不单由5D控制。依据这些数据,我们认为在影响籽粒柔软性方面,GSP-1的直接作用是不可能的。
Northern印迹分析Friabilin成份转录物及蛋白分析在4个puro B中不含有甘氨酸到丝氨酸转变的硬质小麦品种中进行。探针是用上述puro A、puro B和GSP-1引物扩增的核酸序列。RNA分离,northern凝胶印迹的制备,及探测(probing)按前述标准方法进行(Giroux & Morris,遗传学理论及应用95:857-864(1997))。puro A,puro B及GSP 1探针用随机引物法制备(Gibco/BRL,生命技术公司Gaithersburg,MD),其特异活性超过1×109cpm/μg DNA。每次northern印迹放射自显影曝光前在67℃进行2次高严格洗涤。
嘌呤二氢吲哚转录物水平发现由染色体5D控制,因为CS Nulli 5D/Tetra 5A mRNA不含有嘌呤二氢吲哚转录本而LDN 5D(5B)mRNA含有转录本。
含有非-丝氨酸puro B小麦mRNA的Northern印迹表明这四个硬质小麦品种的每一个都不含有任何可检测到的puro A的转录本。每一个硬质小麦基因型的puro B的转录水平与软质小麦基因型的相似。C.Triton-X114可溶蛋白的分离及蛋白电泳Friabilin成份在SDS-PAGE凝胶中被分离为二种明显的成分(Morris等,谷类科学杂志21:167-174(1994)),鉴定为puro A及puro B。对“中国春”(软质),“中国春”的二倍体染色体5D替换系,CS-CNN DS5D(硬质)(“Cheyenne”硬质小麦品种作为5D染色体对的供体),“Heron”及“Falcon”进行了friabilin成分的分离。
Triton-X100-可溶性蛋白通过triton-X114的相分配法进行分离(Bordier,生物学化学杂志256:1604-1607(1981))。压碎的全部谷粒加入1%(v/v)溶解在Tris缓冲盐溶液(TBS,10mM Tris,150mMNaCl,pH7.5)中的triton-X114,在4℃混合30分钟,之后短暂离心(10000g,5分钟),将上清转移到37℃再离心30分钟。下层的去污剂相转移到一个新管再重复相分配。相分配后,去污剂富集相中的蛋白用80%(v/v)丙酮沉淀。沉淀物用丙酮,乙醚洗涤并干燥。加入SDS样品缓冲液(不加还原剂)调整蛋白上样量为每道相当于1mg全谷粒。SDS-PAGE按标准方法完成,用13.5%T,2.6%C,及0.75mm厚的SE 600胶(Bio-Rad),凝胶用TCA固定法银染(Morris等,谷类科学杂志21:167-174(1994))。
仔细检查带型发现上层带在“Falcon”中是缺失的,很可能是puroA,因为friabilin带的缺失与puro A转录的缺失相对应。该puro A带在所有软质小麦如“中国春”和“Heron”及所有puro B丝氨酸型的硬质小麦突变体如“Cheyenne”及硬质“中国春”/“Cheyenne”的双体替换衍生物,CS-CNN DS5D中是存在的。“Express”,“Butte 86”及“Westbred926”中也缺少相应于puro A的蛋白带。“Langdon”硬质缺少任何量的friabilin蛋白,而用“中国春”5D染色体替换“Langdon”5B染色体对的LGD-CSDS 5D(5B)则保持有friabilin及籽粒柔软性。
D.根癌农杆菌感染介导的puro A及puro B核酸序列的水稻(oryza cativa)转染上述的puro A及puro B基因用于转化水稻。利用Li等,植物细胞报道12:250-255(1993)的修改方法将该基因引入易感水稻中。简要地说,利用潮霉素(hygromycin)构建物pMON 410(来自Monsanto)和一含有感兴趣序列的bluescript载体进行共转化。另外,pB 822的Kpn片段克隆到pTA818载体,pTA818来自于Invitrogen载体pcr1000并含有1kb片段RAPD818。最后构建好的质粒叫做pC822。植株在潮霉素(30mg/L)中筛选,之后用Northern印迹筛选嘌呤二氢吲哚转录物的存在。
转基因植株结种后,可用上述方法对转化体进行黄单胞菌属(Xanthomonas)抗性的检测。
E.经过轰击法转化Triticum aestivum12.5μg的每种DNA包裹到金颗粒上用于轰击进Bobwhite培育品种小麦未成熟胚中,轰击前,胚胎在含有甘露醇的愈伤组织诱导培养基中培养4小时,轰击后再培养20小时,除此之外,基本上按照Weeks等,植物生理学102:1077-1084(1993)的方法。依照转化体在再生的愈伤组织和绿芽阶段对1mg/L bialaphos的抗性及再生发根期对3mg/Lbialaphos的抗性按上文所述的Weeks等的方法对转化体进行筛选。
所提供的上述实例用以说明本发明但不限制其范围。本发明的其它变异形式对本领域中的普通技术人员将是容易明白的并且包含在附加的权利要求中。这里引用的所有出版物,专利和专利申请都作为参考文献引用。
序列表SEQ ID:1嘌呤二氢吲哚A的cDNASEQ ID:2嘌呤二氢吲哚A的氨基酸序列 SEQ ID NO:3嘌呤二氢吲哚B的cDNASEQ ID NO:4嘌呤二氢吲哚B的氨基酸序列 SEQ ID NO:5丝氨酸替换的嘌呤二氢吲哚B的cDNASEQ ID NO:6替换的嘌呤二氢吲哚B的氨基酸序列 SEQ ID NO:7 puro A正义链引物5′-ATGAAGGCCCTCTTCCTCA-3′SEQ ID NO:8 puro A反义链引物5′-TCACCAGTAATAGCCAATAGTG-3′SEQ ID NO:9 puro B正义链引物5′-ATGAAGACCTTATTCCTCCTA-3′SEQ ID NO:10 puro B反义链5′-TCACCAGTAATAGCCACTAGGGAA-3′SEQ ID NO:11 puro B丝氨酸替代序列的反义链5′-CCACCAGTAATAGCCACTAGGGAA-3′SEQ ID NO:11 GSP1正义链5′GTAGTGAGCACTACTATTGC 3′SEQ ID NO:12 GSP1反义链5′-GAGCCTTCCCTCCAAGTGC-3′
权利要求
1.一种产生具有软质结构籽粒的转基因植物的方法,所说的植物来源于至少一个具有硬质结构籽粒的亲本植物,所说的方法包含以下步骤将可操作地编码嘌呤二氢吲哚蛋白的核酸序列引入来源于亲本植物的细胞中,其中所说的核酸序列在严格条件与从SEQ ID NO:1和SEQID NO:3组成的一组中选出的核酸序列杂交;以及从含有该核酸序列的细胞产生后代植株。
2.权利要求1中的方法,其中后代植物从由硬质小麦,高粱,水稻,大麦和玉米组成的组中选出。
3.权利要求2中的方法,其中的后代植物是玉米。
4.权利要求1中的方法,其中的引入步骤是通过农杆菌属感染介导的。
5.权利要求1中的方法,其中的嘌呤二氢吲哚蛋白是从由嘌呤二氢吲哚A和嘌呤二氢吲哚B组成的组中选出。
6.一种产生具有硬质结构籽粒的转基因植物的方法,所说的植物来源于至少一个具有软质结构籽粒的亲本植物,所说的方法包含以下步骤引入阻止嘌呤二氢吲哚蛋白表达的核酸序列进入来源于亲本植物的细胞中;以及从该细胞产生植株。
7.方法6中的植物,其中植物是从由小麦、黑麦、黑小麦和蒸麦组成的组中选出。
8.权利要求6中的方法,其中的核酸序列阻止嘌呤二氢吲哚A或嘌呤二氢吲哚B的表达。
9.权利要求6中的方法,其中的核酸序列可操作地编码一种核酶。
10.权利要求6中的方法,其中核酸序列可操作地编码一种反义核酸,所说的核酸在严格条件下与SEQ ID NO:1或SEQ ID NO:3互补的核酸序列杂交。
11.权利要求6中的方法,其中核酸序列可操作地编码一种转座子。
12.权利要求6中的方法,其中引入步骤是由农杆菌属感染介导的。
13.一种产生具有较硬结构籽粒的转基因植物的方法,所说的植物来源于至少一个具有软质结构籽粒的亲本植物,所说的方法包含以下步骤将核酸序列引入来源于亲本植物的细胞中,所说的核酸序列在严格条件下与SEQ ID NO:5中所示的核酸序列杂交;以及从该细胞产生植株。
14.方法13中的植物,其中植物是从由小麦、黑麦、黑小麦和燕麦组成的组中选出。
15.权利要求13中的方法,其中的核酸序列是通过农杆菌属感染被引入细胞的。
16.来源于至少一种具有硬质结构籽粒的亲本植物的具有软质结构籽粒的转基因植物,其中所说的植物含有一个可操作地编码嘌呤二氢吲哚蛋白的核酸序列,其中所说的核酸序列在严格条件下与一个从由SEQID NO:1和SEQ ID NO:3组成的组中选出的核酸序列杂交。
17.权利要求16中的植物,从由硬质小麦、高粱、水稻、大麦和玉米组成的组中选出。
18.权利要求17中的后代植物,其中的植物是玉米。
19.权利要求16中的后代植物,其中的嘌呤二氢吲哚蛋白是从由嘌呤二氢吲哚A和嘌呤二氢吲哚B组成的组中选出。
20.权利要求16中的后代植物,其中的核酸序列通过农杆菌感染引入到植物中。
21.来源于至少一个具有软质籽粒的亲本的具有较硬结构籽粒的转基因植物,包含阻止嘌呤二氢吲哚蛋白表达的核酸序列。
22.权利要求21中的植物是从由小麦、黑麦、黑小麦和燕麦组成的组中选出。
23.权利要求21中的植物,其中的核酸序列阻止嘌呤二氢吲哚A和嘌呤二氢吲哚B的表达。
24.权利要求21中的植物,其中的核酸序列可操作地编码一种核酶。
25.权利要求21中的植物,其中的核酸序列可操作地编码一种反义核酸,该核酸与SEQ ID NO:1或SEQ ID NO:3互补的序列杂交。
26.权利要求21中的植物,其中的核酸序列可操作地编码一种转座子。
27.权利要求21中的植物,其中的核酸序列是通过农杆菌属感染被引入到后代植物中的。
28.来源于至少一个具有软质籽粒的亲本的具有硬质结构籽粒的转基因小麦植物,它含有在严格条件下与SEQ ID NO:5所示的序列杂交的核酸序列。
29.权利要求28的后代植物,其中的核酸序列可操作地编码一种转座子。
30.权利要求28的后代植物,其中的核酸序列是通过农杆菌属感染引入到后代植物的。
全文摘要
本发明提供了生产转基因植物的方法,当与转基因植物来源的植物相比时,该转基因植物修饰了籽粒结构。通过引入赋予籽粒柔软性的数量性状,嘌呤二氢吲哚A(puroindolineA)及嘌呤二氢吲哚B(puroindolineB),赋予转基因植物修饰的籽粒结构。
文档编号C12N15/29GK1311817SQ9980905
公开日2001年9月5日 申请日期1999年5月21日 优先权日1998年5月22日
发明者C·F·莫里斯, M·J·基罗克斯 申请人:美国政府农业部, 研究及发展协会有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1