生产改变含油量的植物的制作方法

文档序号：551622阅读：351来源：国知局

专利名称：生产改变含油量的植物的制作方法
相关申请本申请要求2003年12月17日提交的美国临时专利申请60/530,878的优先权，其内容全部引入作为参考。
背景技术：
操纵农作物种子的组合物，尤其是种子油类的含量和组成的能力在涉及加工食品油类以及动物饲养油类的农业工业中具有重要的应用价值。农作物的种子含有多种有价值的组分包括油类，蛋白以及淀粉。工业生产过程可以分离若干或所有这些组分用于专门应用的单独销售。例如，几乎60％的美国大豆农作物通过大豆加工工业进行压榨。大豆加工产生高价销售的精炼油，而残余物主要作为低价值的饲料销售(US Soybean Board，2001 Soy Stats)。加拿大油菜(canola)种子被压榨产生油类以及副产品加拿大油菜粗粉(加拿大加拿大油菜协会)。几乎20％的1999/2000年的美国玉米农作物经过工业化精炼，主要用于产生淀粉，乙醇以及油类(玉米精炼业者协会)。因此，常常需要使种子的含油量最大化。例如，对于诸如大豆以及加拿大油菜的加工含油种子而言，提高种子的绝对含油量将提高这种谷物的价值。对于加工的玉米而言，可能需要根据其它主要组分的应用提高或者降低含油量。降低油类可以通过降低与油类氧化相关的不希望的味道改善分离的淀粉的质量。或者，在味道不重要的乙醇产生中，提高含油量可以提高总的价值。在许多谷物饲料中，诸如玉米以及小麦，可能希望提高植物含油量，因为油类比诸如碳水化合物的其它种子组分具有较高的能含量。含油种子加工，就像大多数谷物加工业一样是资金密集产业；因此产品从低值组分到高价值油类组分的产品分布的较小改变可能对于谷物加工者而言具有显著的经济影响。
油类的生物技术处理可以提供组成的改变以及油产量的改进。组成的改变尤其包括高油酸的大豆以及玉米油(美国专利6,229,033以及6,248,939)，以及含有月桂酸酯的种子(美国专利5,639,790)等。组成改变的工作主要集中在加工的含油种子但是已经可以很容易地延伸至非-含油种子农作物包括玉米。虽然对提高含油量具有相当的兴趣，在这一领域目前唯一可行的生物技术是高油类玉米(HOC)技术(杜邦，美国专利5,704,160)。HOC利用通过标准的选择育种连同生产系统中称为顶交(TopCross)的优良品种(不孕雄性)杂交雌性得到的高油类授粉者。顶交高油类系统使玉米收获的谷物含油量从～3.5％提高到～7％，改善了谷物的能含量。
虽然HOC生产系统已经卓有成效，但是其仍然具有固有的局限性。首先，担负全部的土地的种子栽植的低授粉者百分比的系统含有固有风险，尤其是在早年。第二，当前HOC领域含油量已经平稳在大约9％的油类。最后，高油类玉米主要不是生物化学变化，而是对于提高含油量产生间接结果的解剖学上的突变体(提高胚芽尺寸)。为此，可选择的高油类策略，尤其是来源于改变生化产量的高油类策略将是非常重要的。
操作油市场最明显的目标农作物是大豆以及油菜籽，并且大量商业工作(例如美国专利5,952,544；PCT申请WO9411516)证明拟南芥是这些农作物中油类代谢的优良模型。种子油组合物的生物化学筛选已经鉴定了拟南芥的许多关键生物合成酶基因并且导致农业上重要基因的直向同源物被鉴定。例如，利用化学诱变处理群的筛选已经鉴定了其种子显示脂肪酸成份改变的脂类突变体(Lemieux B等1990，James以及Dooner，1990)。检测脂肪酸成份改变的T-DNA诱变筛选(Feldmann等1989)鉴定了ω3脱氢酶(FAD3)以及δ-12脱氢酶(FAD2)基因(美国专利5952544；Yadav等，1993；Okuley等，1994)。集中在含油量而非油类质量的筛选分析化学上诱导的皱缩种子或籽粒密度改变的突变体，据此推断出改变的植物含油量(Focks以及Benning，1998)。用来鉴定参与非常长链脂肪酸产生的酶的另一种筛选鉴定了编码负责降低种子中三酰甘油聚集的甘油二酯酰基转移酶(DGAT)的基因的突变(Katavic V等，1995)。此外，还显示DGAT cDNA的种子特异性过表达与提高的植物含油量有关(Jako等，2001)。
植物中的激活标签法指一种通过插入包含调节序列(例如，增强子)的异源核酸构建体到植物基因组中而产生随机突变的方法。调节序列可起到增强一个或多个天然植物基因转录的作用；因此，激活标签法是一种用于产生功能获得(gain-of-function)，通常是显性突变体的有效方法(参见，例如，Hayashi等，1992；Weigel D等，2000)。插入的构建体提供了一种分子标签，其用于快速鉴定由于其错表达引起突变表型的天然植物。激活标签法同时可导致功能丧失的表型。插入可导致天然植物基因的破坏，在该情况中表型通常是隐性的。
激活标签法已经用于多种物种，包括烟草和拟南芥，以鉴定各种突变表型和与这些表型相关的基因(Wilson，等，1996，Schaffer等，1998，Fridborg等，1999；Kardailsky等，1999；Christensen S等，1998)。
发明概述本发明提供了具有高油类含量表型的转基因植物。转基因植物包括含有编码或互补于编码包括SEQ ID NO2的氨基酸序列的HIO32.2多肽或其直系同源物的序列的核苷酸序列的转化载体。在优选的实施方案中，转基因植物选自油菜，大豆，玉米，向日葵，棉花，可可，红花，油棕，椰子，亚麻，蓖麻以及花生。本发明还提供了产生油类的方法，包括培育转基因植物以及从所述植物回收油类。本发明进一步提供了产生具有高油表型植物的方法，所述方法通过鉴定具有HIO32.2基因的等位基因的植物进行，所述HIO32.2基因的等位基因引起与缺少该等位基因且产生所述鉴定的植物的子代的植物相比含油量的增加，其中产生的子代遗传该等位基因并且为高油表型。
本发明的转基因植物通过包括向植物的祖细胞导入含有编码或互补于编码HIO32.2多肽的序列的核苷酸序列的植物转化载体，以及培育转化的祖细胞产生转基因植物的方法产生，其中的HIO32.2多核苷酸序列的表达产生高油类含量表型。
发明详述定义除非另有陈述，这里使用的全部技术以及科学术语具有与本领域技术人员知晓的相同的含义。专业人员尤其是参考Sambrook等，1989，以及Ausubel FM等，1993的定义以及术语。应该理解本发明不限于所描述的特定方法，流程以及试剂，因为这些可以改变。
此处所述的术语“载体”是指设计用于在不同宿主细胞之间转移的核酸构建体。“表达载体”是指可以在异源细胞中整合并表达异源DNA片段的载体。许多原核以及真核生物表达载体是可以市售获得的。选择合适的表达载体是本领域述人员所熟知的。
“异源的”核酸构建体或序列具有一部分序列不是植物细胞的野生型序列但是在其中表达。异源的控制序列是指不天然调节目前正在调节的相同基因表达的控制序列(即启动子或增强子)。通常，异源核酸序列不是它们所存在于的细胞或者基因组的一部分所内源产生的，并且已经通过传染，转染，显微注射，电穿孔法等添加到细胞中。“异源的”核酸构建体可以含有控制序列/DNA编码序列组合，其与野生型植物中发现的控制序列/DNA编码序列组合相同或者不同。
此处所述的术语“基因”是指参与多肽链产生的DNA片段，其可能包括或者不包括编码区之前以及之后的区域，例如5′非翻译区(5′UTR)或者“前导”序列以及3′UTR或者“尾部”序列以及单独的编码片段(外显子)以及非-转录调节序列之间的内含子序列(内含子)。
这里使用的“重组体”包括已经通过导入异源的核酸序列进行修饰的细胞或者载体，或者所述细胞来源于如此修饰的细胞。因此，例如，重组细胞表达在天然(非-重组体)形式的细胞内没有发现相同形式的基因或者表达在人为干预下完全表达或者完全不表达的异常表达的天然基因。
此处所述的术语“基因表达”是指基于基因的核酸序列产生的多肽的方法。所述方法包括转录以及翻译；因此“表达”可以是针对多核苷酸或者多肽序列或者两者。有时，多核苷酸序列的表达不会引起蛋白翻译。“过表达”是指相对于其在野生型(或者其它的参考[例如，非-转基因])植物中的表达，多核苷酸和/或多肽序列表达增加并且可能涉及自然存在或者非-自然存在的序列。“异位表达”是指在未-改变或者野生型植物中不自然发生的，在某时，某地和/或提高水平的表达。“下调表达”是指多核苷酸和/或多肽序列，通常是内源性基因相对于其在野生型植物中表达的降低表达。术语“错误表达”以及“改变表达”包括过表达，下调表达以及异位表达。
在将核酸序列插入细胞的概念中，术语“引入的”是指“转染”，或者“转化”或者“转导”，并且包括核酸序列整合到真核或者原核细胞中，其中核酸序列可以整合入细胞的基因组(例如染色体，质粒，质体或者线粒体DNA)，转化为自主复制子，或者瞬间表达(例如，转染的mRNA)。
本文使用的“植物细胞”是指来源于植物的任意细胞，包括来自未分化的组织(例如愈伤组织)以及植物种子，花粉，繁殖体(progagules)以及胚的细胞。
此处所述的术语“天然的”以及“野生型”相对于给定植物性状或者表型是指具有在相同种类的植物本身发现的特征或者表型的形式。
此处所述的术语关于植物特性的“修饰”是指转基因植物相对于类似的非-转基因植物的表型的改变。对于转基因植物的“目的表型(性状)”，指通过T1和/或后代植物证明的可观察到的或可测量的表型，相应的非转基因植物不显示该表型(也即，在相似条件下培养或分析的基因型类似的植物)。目的表型可表示对植物的改良，或可提供一种在其他植物中产生改良的方法。“改良”是一种通过给植物提供独特的和/或新的品质，而增强植物物种或品种的实用性的特征。“改变含油量表型”指遗传修饰植物的可测量表型，其中与类似的，但是非修饰的植物相比，该植物显示统计上显著增加或减少的总体含油量(即，油类占种子质量的百分比)。高油表型指总体含油量增加。
本文使用的“突变体”多核苷酸序列或者基因与相应的野生型多核苷酸序列或者基因在序列或者表达上不同，其中的差异导致修饰的植物的表型或者性状。相对于植物或植物株系，术语“突变体”是指植物或者株系具有修饰的植物表型或性状，其中修饰的表型或性状与野生型多核苷酸序列或基因的修饰表达有关。
此处所述的术语“T1”是指来自T0植物的种子的植物子代。T1子代是可通过应用选择性试剂筛选的第一系列转化的植物，所述的选择性试剂为例如抗生素或除草剂，由此转基因植物含有相应的抗性基因。术语“T2”是指通过T1植物的花进行自体受精产生的植物子代，所述T1植物之前被筛选作为转基因植物。T3植物是由T2植物等产生的。这里所述的特定植物的“直系子代”来源于所述植物的种子(或者，有时来自其它的组织)且是紧随的子代；例如，对于特定的家系而言，T2植物是T1植物的直系子代。特定植物的“间接子代”来源于所述植物直系子代的种子(或其它组织)，或来自该家系随后子代的种子(或其它组织)；例如，T3植物是T1植物的间接子代。
此处所述的术语“植物部分”包括任意的植物器官或组织，包括，但不限于种子，胚，分生组织区域，愈伤组织，叶，根，芽，配子体，孢子体，花粉和小孢子。植物细胞可获自任意的植物器官或组织以及由其制备的培养物。可用于本发明方法的植物种类通常是广泛的，其可以是可用于转化技术的高等植物，包括单子叶的和双子叶的植物。
在这里所述的“转基因植物”包括在其基因组内含有异源多核苷酸的植物。异源的多核苷酸可以稳定地整合到基因组中，或可以被插入到染色体外。优选地，本发明的多核苷酸被稳定地整合到基因组中从而使多核苷酸被连续传代。植物细胞，组织，器官或已被导入异源多核苷酸的植物被认为是“转化的”，“转染的”或“转基因的”植物。也含有该异源多核苷酸的转化植物或植物细胞的直系和间接子代也被视为是转基因的。
具有改变的含油量表型的植物的鉴定我们使用拟南芥激活标签(ACTTAG)筛选，来鉴定我们命名为“HIO32.2”(At3g47710；GI#22331644，编码蛋白T23J7.40(GI#22331654)的基因与改变的含油量表型(具体地，高油表型)之间的关联。简要地，而且如实施例中进一步描述的，用pSKI015载体对许多拟南芥植物进行了突变，所述载体包含来自根癌农杆菌Ti质粒的T-DNA，病毒增强子元件和选择标记基因(Weigel等，2000)。当T-DNA插入到转化植物的基因组中时，增强子元件可导致附近基因的上调，通常在增强子的大约10千碱基(kb)内。为了鉴定转基因植物，把T1植物暴露于选择剂，以便特异性地回收表达选择标记，并具有T-DNA的转化植物。从这些植物收集T2种子。从大约15-20个T2种子提取脂类。进行气相色谱(GC)分析，以测定种子样本的脂肪酸含量和组成。
对显示高油表型的拟南芥系进行了鉴定，其中含油量(也即，脂肪酸)与在相同时间培养和分析的其它植物的种子的平均含油量约27.0％相比构成种子质量的约36.3％(油34％)。通过鉴定T-DNA插入片段的位点发现了HIO32.2基因与高油表型之间的关联，并且如实施例所示，证实了高油种子表型和T-DNA的存在的遗传共分离。因此，HIO32.2基因和/或多肽可用于开发具有修饰的含油量表型(“HIO32.2表型”)的基因修饰的植物。HIO32.2基因可用于产生含油种子作物，其从含油种子加工提供提高的产油量，以及用于生产能提供能量增加的饲料谷物作物用于动物饲养。HIO32.2基因可进一步用于增加特种油料作物的含油量，以便增加所需稀有脂肪酸的产量。已经进行遗传修饰以表达HIO32.2的转基因植物可用于生产油，其中利用标准方法培养转基因植物，并从植物部分(例如，种子)获得油。
HIO32.2核酸和多肽拟南芥HIO32.2核酸(基因组DNA)序列提供于SEQ ID NO1以及Genbank登录号GI#18409525。对应的蛋白序列提供于SEQ ID NO2以及GI#22331645中。拟南芥HIO30.2的直系同源物或旁系同源物的核酸和/或蛋白描述于下面的实施例3中。
如这里使用的术语“HIO32.2多肽”指全长HIO32.2蛋白或其“功能活性”的片段，衍生物(变体)或者直系同源物，指该蛋白片段，衍生物或者直系同源物显示与SEQ ID NO2的多肽相关的一种或多种功能活性。在一个优选的实施方案中，功能活性HIO32.2多肽，当在植物中错表达时，导致改变的含油量表型。在更进一步优选的实施方案中，HIO32.2多肽在植物中的错表达导致高油表型。在另一个实施方案中，功能活性HIO32.2多肽当在植物或植物细胞中表达时，能拯救缺陷的(包括缺失的)内源HIO32.2活性；该拯救多肽可来自与具有缺陷活性的植物相同的或不同的物种。在另一个实施方案中，全长HIO32.2多肽的功能活性片段(也即，具有SEQ ID NO2的序列的天然多肽或其天然存在的直系同源物)保留与全长HIO32.2多肽相关的一种或多种生物学特性，例如信号活性，结合活性，催化活性或细胞或者细胞外定位活性。HIO32.2片段优选包括HIO32.2结构域，例如C-或N-末端或者催化结构域，尤其，优选包括HIO32.2蛋白的至少10个，优选至少20个，更优选至少25个，最优选至少50个的连续氨基酸。功能域可使用PFAM程序进行鉴定(Bateman A等，1999 Nucleic Acids Res 27260-262)。优选的HIO32.2片段包含螺旋-环-螺旋DNA结合结构域(PF00010)。全长HIO32.2多肽的功能活性变体或其片段，包括具有氨基酸插入，缺失，或者置换，但保留与全长HIO32.2多肽相关的一种或多种生物学特性的多肽。有时，产生的变体能改变HIO32.2多肽的翻译后加工。例如，与天然多肽相比，变体可以具有改变的蛋白转运或者蛋白定位特性，或者改变的蛋白的半衰期。
这里使用的术语“HIO32.2核酸”包含具有SEQ ID NO1提供的序列，或者与SEQ ID NO1提供的序列互补的序列的核酸，及其功能活性片段，衍生物或直系同源物。本发明的HIO32.2核酸可以是来源于基因组DNA或者cDNA的DNA，或者RNA。
在一个实施方案中，功能活性的HIO32.2核酸编码或者互补于编码功能活性的HIO32.2多肽的核酸。基因组DNA包括在该定义内，其用作原始RNA转录本(也即，mRNA前体)的模板，其在编码功能活性HIO32.2多肽之前需要加工，例如剪接。HIO32.2核酸可包括其他的非编码序列，其可以转录或者不被转录；这种序列包括5’和3’UTRs，聚腺苷酸化信号和尤其是本领域已知的控制基因表达的调节序列。一些多肽需要加工事件，例如蛋白水解剪切，共价修饰，等等，以便完全活化。因此，功能活性核酸可编码成熟的或者预先加工的HIO32.2多肽，或者中间体形式。HIO32.2多核苷酸还可以包括异源编码序列，例如，编码包括的促进融合多肽纯化的标记或者转化标记的序列。
在另一个实施方案中，功能活性HIO32.2核酸可用于例如，通过反义抑制，共抑制等产生功能丧失的HIO32.2表型。
在一个优选的实施方案中，用于本发明方法的HIO32.2核酸，包括编码或互补于编码HIO32.2多肽的序列的核酸序列，该HIO32.2多肽与SEQ ID NO2提供的多肽序列具有至少50％，60％，70％，75％，80％，85％，90％，95％或以上的序列同一性。
在另一个实施方案中，本发明的HIO32.2多肽包括与SEQ ID NO2的HIO32.2多肽序列具有至少50％或60％同一性的多肽序列，而且与SEQ ID NO2的HIO32.2多肽序列可具有至少70％，80％，85％，90％或95％或以上的序列同一性。在另一个实施方案中，HIO32.2多肽包括与SEQ ID NO2所示的多肽的功能活性片段具有至少50％，60％，70％，80％，85％，90％或95％或以上的序列同一性的多肽序列，诸如螺旋-环-螺旋DNA结合结构域。在另一个实施方案中，HIO32.2多肽包括与SEQ ID NO2的多肽序列的全长具有至少50％，60％，70％，80％或90％的序列同一性的多肽序列并含有螺旋-环-螺旋DNA结合结构域。
在另一个方面，HIO32.2多核苷酸序列与SEQ ID NO1所示的HIO32.2核酸序列的全长或是与这种HIO32.2序列互补的核酸序列具有至少50％到60％的同一性，而且可包含与SEQ ID NO1所示的HIO32.2序列或其功能活性片段，或互补序列具有至少70％，80％，85％，90％或95％或以上的序列同一性。
这里使用的，对于特定的目标序列或其特定部分，“百分比(％)序列同一性”被定义为如果必要获得最大的百分比序列同一性，如通过WU-BLAST-2.0al9程序(Altschul等，J.Mol.Biol.(1990)215403-410所产生的，其中搜索参数设为缺省值，在进行序列比对和引入缺口之后，候选的衍生序列中核苷酸或氨基酸与目标序列(或其特定部分)中核苷酸或氨基酸相同的百分比。HSP S和HSP S2参数是机动值，而且是通过程序本身取决于特定序列的组成和在其中对感兴趣的序列进行搜索的特定数据库的组成而确定的。“％同一性值”通过把匹配的相同核苷酸或氨基酸的数目除以报告的百分比同一性的序列的序列长度而确定。“百分比(％)氨基酸序列相似性”通过进行与确定百分比氨基酸序列同一性相同的计算而确定，但是在计算中除了相同的氨基酸之外还包括保守氨基酸取代。保守氨基酸取代，即其中氨基酸被具有相似特性的另一个氨基酸所取代，而对蛋白的折叠或活性没有显著的影响。可以互相取代的芳香族氨基酸为苯丙氨酸，色氨酸和酪氨酸；可互换的疏水氨基酸为亮氨酸，异亮氨酸，甲硫氨酸和缬氨酸；可互换的极性氨基酸为谷氨酰胺和天门冬酰胺；可互换的碱性氨基酸为精氨酸，赖氨酸和组氨酸；可互换的酸性氨基酸为天冬氨酸和谷氨酸；可互换的小氨基酸为丙氨酸，丝氨酸，苏氨酸，半胱氨酸和甘氨酸。
目标核酸分子的衍生核酸分子包括能选择性地与SEQ ID NO1的核酸序列杂交的序列。杂交的严谨度可通过温度，离子强度，pH，以及杂交和洗涤期间变性剂诸如甲酰胺的存在来进行控制。通常使用的条件是大家所熟知的(参见，例如，Current Protocol in MolecularBiology，Vol.1，Chap.2.10，John Wiley & Sons，Publishers(1994)；Sambrook等，Molecular Cloning，Cold Spring Harbor(1989))。在一些实施方案子中，本发明的核酸分子能在如下的严谨杂交条件下与包含SEQ ID NO1的核苷酸序列的核酸分子杂交含有核酸的滤纸，在含有6X单倍浓度的柠檬酸盐(SSC)(1X SSC为0.15M NaCl，0.015M柠檬酸钠；pH7.0)，5X Denhardt溶液，0.05％焦磷酸钠和100μg/ml的鲱鱼精子DNA的溶液中，65℃预杂交8小时至过夜；在含有6X SSC，1XDenhardt溶液，100μg/ml酵母tRNA和0.05％焦磷酸钠的溶液中，65℃杂交18-20小时；在含有0.1X SSC和0.1％SDS(十二烷基硫酸钠)的溶液中，65℃洗涤滤纸1小时。在其他的实施方案中，使用如下的中等严谨杂交条件包含核酸的滤纸，在含有35％甲酰胺，5X SSC，50mMTris-HCl(pH7.5)，5mM EDTA，0.1％PVP，1％Ficoll，1％BSA和500μg/ml变性鲑鱼精子DNA的溶液中，40℃预处理6小时；在含有35％甲酰胺，5X SSC，50mM Tris-HCl(pH7.5)，5mM EDTA，0.02％PVP，0.02％Ficoll，0.2％BSA，100μg/ml鲑鱼精子DNA和10％(wt/vol)葡聚糖硫酸酯的溶液中，40℃杂交18-20小时；接着，在含有2X SSC和0.1％SDS的溶液中，55℃洗涤两次1小时。或者，可使用如下的低严谨条件在含有20％甲酰胺，5x SSC，50mM磷酸钠(pH7.6)，5XDenhardt溶液，10％葡聚糖硫酸酯和20μg/ml变性剪切鲑鱼精子DNA的溶液中，37℃孵育8小时到过夜；在相同的缓冲液中杂交18到20小时；在1x SSC中，大约37℃洗涤滤纸1小时。
由于遗传密码的简并性，可产生许多编码HIO32.2多肽的多核苷酸序列。例如，根据特定宿主生物显示的最佳密码子使用，可选择密码子以增加多肽在特定的宿主物种中的表达(参见，例如，Nakamura等，1999)。这种序列变体可用于本发明的方法中。
本发明的方法可使用拟南芥HIO32.2的直系同源物。鉴定其他植物品种中直系同源物的方法是本领域已知的。一般说来，不同物种中的直系同源物保持相同的功能，由于存在一个或多个蛋白基序和/或三维结构。在进化过程中，当物种形成后发生基因重复事件时，一个物种，例如拟南芥中的单个基因可能相应于另一个物种中的多个基因(旁系同源物)。这里使用的，术语“直系同源物”包括旁系同源物。当序列数据可用于特定的植物物种时，通常可通过序列同源性分析，例如BLAST分析，一般使用蛋白饵序列，来鉴定直系同源物。如果来自正向BLAST结果的最合适序列检索到了反向BLAST中原始的查询序列，该序列则为可能的直系同源物(Huynen MA和Bork P，Proc Natl AcadSci(1998)955849-5856；Huynen MA等，Genome Research(2000)101204-1210)。用于多个序列比对的程序，例如CLUSTAL(Thompson JD等，1994，Nucleic Acids Res 224673-4680)，可用于突出直系同源蛋白的保守区域和/或残基，并产生系统树。在表示来自不同物种的多个同源序列(例如，通过BLAST分析检索到的)的系统树中，来自2个物种的直系同源序列，相对于来自2个物种的所有其他的序列，通常在系统树上显得最靠近。结构串线(threading)或蛋白折叠的其他分析(例如，使用ProCeryon，Biosciences，Salzburg，Austria的软件)也可鉴定可能的直系同源物。核酸杂交方法也可用于寻找直向同源基因，而且当不能获得序列数据是优选的。简并PCR和cDNA或基因组DNA文库筛选是寻找相关基因序列的常见方法，而且是本领域熟知的(参见，例如，Sambrook，1989；Dieffenbach and Dveksler，1995)。例如，Sambrook等中描述了用于从感兴趣的植物物种产生cDNA文库，和用部分同源基因探针探测文库的方法。拟南芥HIO32.2编码序列的高度保守部分可用作探针。HIO32.2直系同源核酸可在高度，中度或低度严谨条件下与SEQ ID NO1的核酸杂交。扩增或分离假定的直系同源物的部分之后，可通过标准技术克隆该部分并进行测序，而且用作探针来分离完整的cDNA或基因组克隆。或者，可以启动EST方案来产生感兴趣的植物物种的序列信息数据库。在另一种方法中，能特异性结合已知的HIO32.2多肽的抗体，用于直系同源物分离(参见，例如，Harlow andLane，1988，1999)。Western印迹分析可确定HIO32.2直系同源物(也即，直系同源蛋白)存在于特定植物物种的粗提取物中。当观察反应性时，可通过筛选显示特定植物物种的表达文库，来分离编码候选直系同源物的序列。如Sambrook等1989中所述，可在各种商业可获得的载体中构建表达文库，包括λgt11。一旦通过任何这些方法鉴定到了候选的直系同源物，候选的直系同源序列可用作饵(“查询”)，用于从其中已经鉴定到HIO32.2核酸和/或多肽序列的拟南芥或其他的物种中对序列进行反向BLAST。
可使用任何可用的方法来获得HIO32.2核酸和多肽。例如，通过如前所述的筛选DNA文库或通过使用聚合酶链式反应(PCR)，分离感兴趣的cDNA或基因组DNA序列的技术是本领域熟知的。或者，可合成核酸序列。任何已知的方法，例如位点定向诱变(Kunkel TA等，1991)，可用于将所需的改变引入到克隆的核酸中。
通常，本发明的方法包括把所需形式的HIO32.2核酸整合到用于转化植物细胞的植物表达载体中，并在宿主植物中表达HIO32.2多肽。
分离的HIO32.2核酸分子是不同于天然发现的形式或设置的核酸分子，而且从至少一个杂质核酸分子中鉴定和分离，该杂质核酸分子通常结合在HIO32.2核酸的天然来源中。然而，分离的HIO32.2核酸分子包括包含在通常表达HIO32.2的细胞中的HIO32.2核酸分子，例如，该核酸分子位于与天然细胞的核酸分子不同的染色体位置中。
产生具有改变的含油量表型的遗传修饰的植物HIO32.2核酸和多肽可用于产生具有修饰的含油量表型的遗传修饰的植物。这里使用的，“修饰的含油量表型”可指植物任何部分中修饰的含油量；经常在种子中观察到修饰的含油量。在一个优选的实施方案中，植物中HIO32.2基因的改变表达可用于产生具有高油表型的植物。
这里所述的方法一般适用于所有植物。尽管在拟南芥中进行了激活标签法和基因鉴定，但是HIO32.2基因(或其直系同源物，变体或片段)可在任何植物种类中表达。在一个优选的实施方案中，本发明涉及产油植物，其在特异性器官，主要是在种子中生产和储存三酰基甘油。这些物种包括大豆(Glycine max)，油菜籽和canola(包括甘蓝型油菜(Brassica napus)，B.campestris)，向日葵(Helianthus annus)，棉花(陆地棉)，玉米(Zea maya)，可可(Theobroma cacao)，红花(Carthamustinctorius)，油棕(Elaeis guineensis)，椰子(Cocos nucifera)，亚麻(Linumusitatissimum)，蓖麻(Ricinus communis)和花生(Arachis hypogaea)。本发明还涉及产生果实和蔬菜的植物，产生谷物的植物，产生坚果的植物，快速周期的芸苔品种，紫花苜蓿(Medicago sativa)，烟草(Nicotiana)，草坪草(Poaceae family)，其他的饲料作物，和可能是稀有脂肪酸来源的野生物种。
本领域技术人员应该了解本领域存在的各式各样的转化技术，而且新技术不断地变成可用的。适于靶宿主植物的任何技术可用于本发明的范围内。例如，可引入各种形式的构建体，包括但不限于DNA链，到质粒，或人工染色体中。可通过各种技术将构建体引入到靶植物细胞中，包括但不限于异源核酸的土壤农杆菌介导的转化，电穿孔法，显微注射，微粒轰击，磷酸钙-DNA共沉淀或脂质体介导的转化。植物转化优选是永久的，也即通过使导入的表达构建体整合到宿主植物基因组中，以便该导入的构建体传递给连续的植物世代。根据计划的用途，包含HIO32.2多核苷酸的异源核酸构建体可编码完整的蛋白或其生物学活性部分。
在一个实施方案中，双元基于Ti的载体系统可用于转移多核苷酸。标准的土壤农杆菌双元载体是本领域技术人员已知的，而且许多是可商业获得的(例如，pBI121 Clontech Laboratories，Palo Alto，CA)。
用土壤农杆菌载体转化植物的最佳方法随待转化的植物种类而变化。用于土壤农杆菌介导的转化的示例性方法包括转化来源于无菌籽苗和/或小植株的胚轴，芽，茎或叶组织的外植体。这种转化的植物可有性繁殖，或通过细胞或组织培养繁殖。先前已经描述了土壤农杆菌转化用于许多不同类型的植物，而且可在科学文献中找到这种转化方法。其中特别相关的是转化商业上重要的作物，例如油菜籽(De Block等，1989)，向日葵(Everett等，1987)和大豆(Christou等，1989；Kline等，1987)的方法。
根据表达水平，发生表达的组织类型和/或表达的发育阶段，可调节HIO32.2的表达(包括转录和翻译)。许多异源调节序列(例如，启动子和增强因子)可用于控制HIO32.2核酸的表达。这些包括组成型，诱导型和可调节的启动子，以及能以组织或瞬时特异性方式调控表达的启动子和增强因子。示例性的组成型启动子包括树莓E4启动子(美国专利5,783,393和5,783,394)，35S CaMV(Jones JD等，1992)，CsVMV启动子(Verdaguer B等，1998)和甜瓜肌动蛋白启动子(公开的PCT申请WO0056863)。示例性的组织特异性启动子包括番茄E4和E8启动子(美国专利5,859,330)和番茄2AII基因启动子(Van Haaren MJJ等，1993)。
在一个优选的实施方案中，HIO32.2表达在来自其表达与早期种子和/或胚胎发育相关的基因的调节序列的调控下。其启动子与早期种子和胚胎发育相关的豆科植物基因包括V.faba豆球蛋白(Baumlein等，1991，Mol Gen Genet 225121-8；Baumlein等，1992，Plant J 2233-9)，V.faba usp(Fiedler等，1993，Plant Mol Biol 22669-79)，豌豆convicilin(Bown等，1988，Biochem J 251717-26)，豌豆凝集素(dePater等，1993，Plant Cell 5877-86)，P.vulgaris β菜豆蛋白(Bustos等，1991，EMBO J 101469-79)，P.vulgaris DLEC2和PHS[β](Bobb等，1997，Nucleic Acids Res 25641-7)和大豆β-conglycinin，7S贮藏蛋白(Chamberland等，1992，Plant Mol Biol 19937-49)。其启动子与早期种子和胚胎发育相关的谷类基因包括水稻谷蛋白(″GluA-3，″Yoshiharaand Takaiwa，1996，Plant Cell Physiol 37107-11；″GluB-1，″Takaiwa等，1996，Plant Mol Biol 301207-21；Washida等，1999，Plant Mol Biol 401-12；″Gt3，″Leisy等，1990，Plant Mol Biol 1441-50)，水稻醇溶谷蛋白(Zhou & Fan，1993，Transgenic Res 2141-6)，小麦醇溶谷蛋白(Hammond-Kosack等，1993，EMBO J 12545-54)，玉米醇溶蛋白(Z4，Matzke等，1990，Plant Mol Biol 14323-32)和大麦B-hordein(Entwistle等，1991，Plant Mol Biol 171217-31)。其他的其启动子与早期种子和胚胎发育相关的基因，包括油棕GL07A(7S球蛋白，Morcillo等，2001，Physiol Plant 112233-243)，甘蓝型油菜napin，2S贮藏蛋白和napA基因(Josefsson等，1987，J Biol Chem 26212196-201；Stalberg等，1993，Plant Mol Biol 1993 23671-83；Ellerstrom等，1996，Plant Mol Biol 321019-27)，甘蓝型油菜油质蛋白(Keddie等，1994，Plant Mol Biol 24327-40)，拟南芥油质蛋白(Plant等，1994，Plant Mol Biol 25193-205)，拟南芥FAEl(Rossak等，2001，Plant Mol Biol 46717-25)，刀豆conA(Yamamoto等，1995，Plant Mol Biol 27729-41)和长春花异胡豆苷合成酶(Str，Ouwerkerk and Memelink，1999，Mol Gen Genet 261635-43)。在另一个优选的实施方案中，使用来自在油生物合成期间表达的基因的调节序列(参见，例如，美国专利5,952,544)。可选择的启动子来自于植物贮藏蛋白基因(Bevan等，1993，Philos Trans R Soc Lond B Biol Sci342209-15)。
在另一个方面，有时可能需要抑制宿主细胞中内源HIO32.2的表达。用于实施本发明该方面的示例性方法包括，但不限于反义抑制(Smith等，1988；van der Krol等，1988)；共抑制(Napoli，等，1990)；核酶(PCT公开WO 97/10328)；和正义与反义的组合(Waterhouse，等，1998)。抑制宿主细胞中内源序列的方法，一般使用待抑制序列的至少一部分的转录或转录和翻译。这种序列可以与内源序列的编码以及非编码区同源。反义抑制可使用完整的cDNA序列(Sheehy等，1988)，部分cDNA序列包括5’编码序列(Cannon等，1990)或3’非编码序列(Ch′ng等，1989)的片段。共抑制技术可使用完整的cDNA序列(Napoli等，1990；van der Krol等，1990)或部分cDNA序列(Smith等，1990)。
可进行标准的分子和遗传试验，以更进一步分析基因与观察到的表型之间的关联。示例性技术描述如下。
1.DNA/RNA分析例如，通过原位杂交，可通过突变体与野生型系的对比确定阶段-与组织特异性基因表达模式。可进行基因，尤其是侧翼调节区甲基化状况的分析。其他的适用技术包括过表达，异位表达，在其他植物物种中的表达和基因敲除(反向遗传学，靶向敲除，病毒诱导的基因沉默[VIGS，参见Baulcombe D，1999])。
在优选的应用中，通过微阵列分析的表达分布被用于同时测量许多不同基因表达中的差异或诱导的改变。用于微阵列分析的技术是本领域熟知的(Schena M等，Science(1995)270467-470；Baldwin D等，1999；Dangond F，Physiol Genomics(2000)253-58；van Hal NL等，JBiotechnol(2000)78271-280；Richmond T and Somerville S，Curr OpinPlant Biol(2000)3108-116)。可以进行单独标签的株系的表达分布分析。这种分析可鉴定由于感兴趣基因的过表达而协调调节的其它基因，其可有助于把未知基因置于特定的途径。
2.基因产物的分析基因产物分析可包括重组蛋白表达，抗血清产生，免疫定位，催化或其他的活性的生物化学分析，磷酸化状况分析和通过酵母双杂交分析进行与其他蛋白之间的相互作用分析。
3.途径分析途径分析可包括，基于它的错表达表型或通过与相关基因的序列同源性，把基因或基因产物置于特定的生物化学，新陈代谢或信号途径中。或者，分析可包括与野生型系和其它突变系的遗传交叉(产生双突变体)，以把基因指定于途径中，或确定在途径中突变对下游“报告”基因表达的作用。
产生具有改变含油量的表型的突变植物本发明更进一步提供了鉴定在内源HIO32.2或者其等位基因中具有能赋予这些植物及其后代HIO32.2表型的突变的非转基因植物的方法。在一种称为“TILLING”的方法中(用于在基因组中靶向诱导的局部病变)，例如，使用EMS处理，在感兴趣植物的种子中诱导突变。培养得到的植物，并且自花受精，后代用于制备DNA样品。HIO32.2-特异性PCR被用于鉴定突变的植物是否具有HIO32.2突变。然后测试具有HIO32.2突变的植物含油量的改变，或者，测试植物的含油量的改变，然后使用HIO32.2-特异性PCR确定具有改变含油量的植物是否具有突变的HIO32.2基因。TILLING可鉴定能改变特异性基因的表达或由这些基因编码的蛋白的活性的突变(参见Colbert等(2001)Plant Physiol126480-484；McCallum等(2000)Nature Biotechnology 18455-457)。
在另一种方法中，候选基因/数量性状基因座(QTL)方法可用于标记辅助的育种项目，以鉴定HIO32.2基因或HIO32.2直系同源物中的等位基因或突变，其能赋予含油量的改变(参见Bert等，Theor ApplGenet.2003 Jun；107(1)181-9；以及Lionneton等，Genome.2002 Dec；45(6)1203-15)。因此，在本发明更进一步的方面中，HIO32.2核酸被用于鉴定具有改变的含油量的植物是否在内源HIO32.2中具有突变，或是否具有能导致含油量改变的特定等位基因。
虽然参考特定的方法和实施方案已经描述了本发明，应当理解只要不背离本发明可以进行各种修饰和改变。这里引用的所有出版物都明确地在这里作为参考引入，用于描述和公开可与本发明一起使用的组合物和方法的目的。所有引用的专利，专利申请和参考的公共数据库中的序列信息也引入作为参考。
实施例实施例1利用激活标签构建体进行转化产生具有HIO32.2表型的植物使用激活标签“ACTTAG”载体，pSKI015产生突变体(GI#6537289；Weigel D等，2000)。使用标准方法产生拟南芥转基因植物，基本上如公开的申请PCT WO0183697中所述。简要地，T0拟南芥(Col-0)植物用携带有pSKI015载体的土壤农杆菌进行转化，该载体包括来源于土壤农杆菌Ti质粒的T-DNA，除草剂抗性选择性标记基因和4X CaMV35S增强子元件。根据除草剂抗性，在T1世代选择转基因植物。由T1植物选择T2种子并以加索引的集合进行保藏，并评价T2种子的一部分用于筛选。
利用下列方法进行种子脂肪酸含量的定量测定。通常以标准1∶1∶2比率含有纯合插入物，纯合野生型以及杂合基因型的测试的各个品系的15到20个T2种子样品在UMT-2超微量天平(Mettler-Toledo Co.，Ohio，USA)上称重然后转入玻璃提取瓶。从种子提取脂类，并根据Browse等人(Biochem J 23525-31，1986)方法的修改方法将所有种子在80℃在500ul的2.5％H2SO4的MeOH溶液中转酯化3小时。已知量的十七烷酸加入反应中作为内标物。向每个瓶中加入750μl的水以及400μl的己烷然后用力摇动并进行相分离。反应瓶直接加载到GC上进行分析并通过自动取样器取上层己烷相。具有火焰电离检测的气相色谱法用于脂肪酸甲酯的分离和测定。Agilent 6890 Plus GC′s用于用Agilent Innowax柱(30m×0.25mm ID，250um膜厚度)进行分离。载气是以2.5ml/分钟恒定流动的氢气。以不分流的方式注射1μl的样品(进入温度220℃，清洗气流15ml/min 1分钟)。烘箱设置为105℃的起始温度，起始时间0.5分钟，然后以每分钟60℃的斜度升至175℃，40℃/分钟升至260℃，最终保持时间2分钟。通过火焰电离进行检测(温度275℃，燃油流30.0ml/分钟，氧化剂400.0ml/min)。利用Millennium色谱管理系统监控仪器控制和数据收集与分析(版本3.2，WatersCorporation，Milford，MA)。自动进行整合和定量分析，但是所有的分析随后都进行人工检验以在得到研究中获得的结果汇总之前证实正确的峰鉴别和可接受的信噪比。
命名为WO00082263的ACTTAG品系被鉴定为高油表型。具体地，与其它生长的ACTTAG品系并在相同条件下分析(即基准线)的平均27.0％的平均含油量相比，油构成种子质量的36.3％(w/w)。一式两份进行同样种子的重新分析。分析证实相对于对照含油量的增加。得出结论，存在ACTTAG位点可以使种子含油量与对照相比提高7％到11％之间。基于来自遗传型个体的种子的含油量确定了高油表型是显性的。
实施例2显示改变的含油量表型的植物中T-DNA插入序列的表征我们进行了基本上如专利申请PCT WO0183697中所示的标准分子分析，以确定与改变的含油量表型相关的T-DNA插入位点。简而言之，从显示改变的含油量表型的植物提取基因组DNA。使用pSKI015载体的特异性引物进行的PCR，确认了来自WO00082263系的植物中存在35S增强子，Southern印迹分析证实了ACTTAG T-DNA的基因组整合，并且显示单独的T-DNA插入序列在转基因系中的存在。
质粒拯救被用于回收T-DNA插入序列侧翼的基因组DNA，然后使用基础的BLASTN搜索和/或拟南芥信息源(TAIR)数据库(可以在公众可以进入的拟南芥信息资源网站获得)进行序列分析。具有与染色体3的BAC克隆T23J7(GI#4741184)具有序列同一性。回收来自核苷酸16030-16423以及16443-17200的序列，将左边界置于核苷酸16423(GI#4741184)的上游以及核苷酸15443的下游。来自染色体3deBAC克隆T23J7(GI#4741184)的核苷酸15424-16442的序列在突变的染色体中缺失。
为了确定T-DNA插入序列是否引起高种子油表型，检验高种子油表型以及T-DNA的存在的共分离。将18个T2植物培养成熟并由这些植物收集的种子确定种子油表型。如实施例1所述确定这些植物的种子油含量。通过使用对相应的基因组区域以及T-DNA特异性的引物的PCR，分析T3种子中T-DNA在插入位点的存在或者不存在，推断T2种子的遗传型。结果显示位点包含T-DNA插入序列的T3种子的平均含油量比缺乏该插入序列的那些家族的平均含油量更高。该位点的T2个体同型接合子产生与缺乏T-DNA的后代相比107.5％含油量的种子。这些位点T2个体半合子产生与缺乏T-DNA的后代相比112.7％含油量的种子。因为高油位点的纯合子和半合子显示含油量类似的增加，我们推断T-DNA与高油表型相关并且表型由显性突变引起。
序列分析揭示核苷酸序列显示为SEQ NO1，T-DNA插入序列的左边界为该基因的翻译起始位点的约954碱基对的3’，我们命名为HIO32.2。
实施例3拟南芥HIO32.2序列的分析利用BLAST(Altschul等，1997，J.Mol.Biol.215403-410)，PFAM(Bateman等，1999，Nucleic Acids Res 27260-262)，PSORT(Nakai K和Horton P，1999，Trends Biochem Sci 2434-6)和/或CLUSTAL(Thompson JD等，1994，Nucleic Acids Res 224673-4680)进行序列分析。
At3g47710的TAIR预测对应于Genbank预测的15-92氨基酸残基(gi|22331644)。在两种情况中，残基都不紧随翻译起始密码子(ATG)鸟苷(G)，其对于拟南芥中的大多数基因是典型的。很可能预测的At3g47710的基因结构具有非典型的残基(胸腺嘧啶，T)紧随着翻译起始密码子(ATG)。这个方案得到基因结构得到cDNAs支持的At3g47710的三个拟南芥同系物(Atlg74500，At5g39860和gi|21617952)在起始密码子具有序列ATGT的事实的支持。
针对ESTs的BLASTN没有拟南芥EST显示与候选基因At3g47710的准确匹配。然而，对应于At3g47710的拟南芥同系物的ESTs可以被鉴定。这些基因描述在以下BLASTP分析中。
还有显示与At3g47700的相似性的其它类似的植物ESts。有可能，制备各个物种的ESTs重叠群。每一紧随种的最佳匹配列于如下并且包括在以下的“直系同源物表”中毛豆，Lycopersicon esculentun，树棉，玉米，稻，小麦，马铃薯。
1.来自大豆(Glycine max)的一个EST重叠群＞gi|16344264|gb|BI969859.1|BI969859GM830009A23D05＞gi|16344265|gb|BI969860.1|BI969860GM830009A23D06＞gi|10848131|gb|BF070679.1|BF070679st23h10.y1＞gi|19345905|gb|BM890785.1|BM890785sam07g12.y1记分＝310(114.2bits)，期望值＝2.8e-33从多个发育阶段的混合组织或者从发芽的幼苗分离这些ESTs。
Contigged序列显示在以下的SEQ NO3中。
2.来自小麦(Triticum aestivum)的一个EST来自未公开的cDNA文库的＞gi|20103472|dbj|BJ282051.1|BJ282051BJ282051。
记分＝286(105.7比特)，期望值＝9.9e-31如上所述的EST(gi|20103472)包括下列EST来自未公开的cDNA文库的＞gi|20106345|dbj|BJ287183.1|BJ287183BJ287183。
3.来自番茄(Lycopersicon esculentum)的一个EST＞gi|7409117|gb|AW647879.1|AW647879 EST326333番茄萌发幼苗，TAMU文库记分＝278(102.9比特)，期望值-6.9e-304.来自土豆(Solanum tuberosum)的一个EST来自用混合的番茄组织构建的文库的＞gi|21375581|gb|BQ516712.1|BQ516712EST624127记分＝265(98.3比特)，期望值＝1.7e-28如上所述的EST(gi|20103472)包括下列EST来自用混合的番茄组织构建的文库的＞gi|21375582|gb|BQ516713.1|BQ516713EST6241285.来自水稻(Oryza sativa)的一个EST来自1周龄根的＞gi|8334893|gb|BE039877.1|BE039877OC09D12OC Oryza sativa cDNA 5′，mRNA记分＝228(85.3比特)，期望值＝1.4e-246.来自玉米(Zea mays)的一个EST分离自用来自不同阶段组织构建的以及用各种激素处理的B73玉米文库的＞gi|18173123|gb|BM348511.1|BM348511MEST292-A06.T3ISUM5-RN玉米cDNA克隆记分＝202(76.2比特)，期望值＝7.9e-22，
7.来自树棉(Gossypium arboreum)的EST＞gi|18098731|gb|BM357985.1|BM357985 GA_Ea0003E23r树棉7-10dpa纤维文库记分＝197(74.4比特)，期望值＝2.7e-21针对所有aa结果的BLASTPAt3g47710与少数的植物蛋白具有同源性。最佳匹配的7个BLAST列举如下并且被包含在下述“直系同源表”中。
1.本身(3个冗余登录号)＞gi|22331645|ref|NP_190355.2|bHLH蛋白；蛋白idAt3g47710.1[Arabidopsis thaliana]记分＝123比特(309)，期望值＝5e-28以下两个序列为基于Genbank注释的At3g47710的冗余登录号。由gi|7487374和gi|4741188预测的At3g47710的基因结构对应于gi|22331645的氨基酸残基15-92。
＞gi|7487374|pir||T07710推测的蛋白T23J7.40-拟南芥(Arabidopsisthaliana)＞gi|4741188|emb|CAB41854.1|推测的蛋白[Arabidopsis thaliana]记分＝111比特(277)，期望值＝2e-242.来自拟南芥的Atlg74500(4个冗余登录号)＞gi|15221264|ref|NP_177590.1|bHLH蛋白；蛋白idAtlg74500.1，通过cDNA519支持[拟南芥]＞gi|25406349|pir|1A96774可能的DNA结合蛋白F1M20.18[[进口的]拟南芥＞gi|12324788|gb|AAG52350.1|AC011765_2推断的DNA结合蛋白；54988-54618[拟南芥]＞gi|21593858|gblAAM65825.1|推断的DNA结合蛋白[拟南芥]记分＝78.2比特(191)，期望值＝2e-143.来自拟南芥染色体3的DNA结合蛋白类蛋白(在Genbank中的两个冗余登录号)＞gi|21617952|gb|AAM67002.1|DNA结合蛋白类[拟南芥]记分＝73.9比特(180)，期望值＝4e-13这是由绘制于拟南芥染色体3的cDNA所表示的基因。这些基因没有TAIR注释。
下列登录号可能是gi|21617952的冗余登录号，因为BLASTN显示序列gi|21617952和gi|9294226被定位于拟南芥基因组中的相同位置。序列gi|21617952和gi|19294226相差几个氨基酸。可能是测序错误或具有较少或没有活性影响的单核苷酸多态性。
＞gi|9294226|dbi|BAB02128.1|DNA结合蛋白类[拟南芥]记分＝74.7比特(182)，期望值＝2e-134.拟南芥的At5g39860(在Genbank中的3个冗余登录号)＞gi|15242499|ref|NP_198802.1|bHLH蛋白；蛋白idAt5g39860.1[拟南芥]＞gi|10176978|dbj|BAB10210.1|DNA结合蛋白类[拟南芥]＞gi|21593819|gb|AAM65786.1|DNA结合蛋白类[拟南芥]记分＝70.9比特(172)，期望值＝4e-125.拟南芥的At5g15160(在Genbank中的3个冗余登录号)＞gi|15242227|ref|NP_197020.1|bHLH蛋白；蛋白idAt5g15160.1[[拟南芥]＞gi|11357892|pir||T49951推测的蛋白F8M21.50-拟南芥＞gi|7671485|emb|CAB89326.1|推断的蛋白[拟南芥]记分＝69.7比特(169)，期望值＝8e-126.来自水稻(Oryza sativa)的推测蛋白＞gi|21671920|gb|AAM74282.1|AC083943_22类似于推定的DNA结合蛋白的假定蛋白[稻(japonica cultivar-组)记分＝54.3比特(129)，期望值＝4e-07
7.来自水稻(Oryza sativa)的推定蛋白＞gi|10241623|emb|CAC09463.1|推定的DNA结合蛋白[稻(indicacultivar-组)记分＝53.5比特(127)，期望值＝6e-07
最接近的拟南芥同源物
At3g47710是非分泌性蛋白，缺乏跨膜结构域(由TMHMM预测)和信号肽(由SignalP预测)。PSORT2预测At3g47710定位在线粒体(64％线粒体，24％核，8％细胞质，4％过氧物酶体)。然而，Predator分析给出相反的结果并显示At3g47710既不定位于线粒体也不定位于质粒(5％线粒体，O％质粒)。因此Pfam分析显示At3g47710与螺旋-环-螺旋DNA结合域显示微弱的同源性(PF00010，SM00353)。碱性的螺旋-环-螺旋蛋白(bHLH)是一组具有多种功能的真核转录因子。这些转录因子的特征为具有高度保守的bHLH结构域，介导DNA结合及与其它蛋白的二聚作用(Littlewood和Evan，1995，Protein Profile 2，621-702)。
已经表征了大量Arabidopsis bHLH蛋白并显示多种重要的功能诸如，果皮边缘的发育，果实裂开，光信号转导，根毛发育和毛状体发育(Heisler等人，2001 Development.128，1089-1098；Rajani和Sundaresan，2001，Curr Biol.11，1914-1922；Huq和Quail，2002EMBOJ.21，2441-2450；Wada等人，2002，Development.129，5409-5419；Smolen等人，2002，Genetics.161，1235-1246；Sawa，2002，DNA Res.9，31-34)。人们注意到At3g47710的BLASTP分析不能功能上表征Arabidopsis中的bHLH蛋白，显示At3g47710是与这些bHLH蛋白距离较远的家族成员。尽管如此，可以想像转录因子At3g47710的过表达可能通过改变核或者线粒体中下游基因的表达增加种子油含量。
模型结构域seq-f seq-t hmm-fhmm-t记分E-值--------------- ----- ----- ----- ----- ----- -------SM00353 1/1 1666.. 161[] 9.80.028PF00010 1/1 1661.. 153[] 1.90.073实施例4证实表型/基因型的关联RT-PCR分析表明HIO32.2基因在来自显示HIO32.2表型的植物中过表达。具体地，从在多种发育阶段以及库收集的显示HIO32.2表型的植物的簇生叶子和/或角果提取RNA。利用特异于SEQ ID NO1所示序列，特异于T-DNA插入物邻近的其它的预测基因以及特异于组成型表达的肌动蛋白基因(阳性对照)的引物进行RT-PCR。结果表明显示HIO32.2表型的植物HIO32.2基因的mRNA在叶子中上调在长角果中下调。
HIO32.2表型的显性遗传模式通过遗传分析证实。通常，遗传分析涉及杂交第一代F1的产生以及分析。一般地，通过由T2植物收集花粉进行F1杂交，所述T2植物用于对野生型植物授粉。这样的杂交通过采取来自各个选择的个体植物的4朵花以及利用T2花作为雄性花粉供体以及野生型植物的花作为雌性进行。4-5杂交用于单独的目的。将由同样个体杂交形成的种子进行聚集，种植以及培育成成熟的杂交第一代F1。
实施例5高油表型的扼要重述为了证实At3g47710的过表达是否导致高含油种子表型，将来自过表达该基因的转基因植物的种子的油含量与来自非转基因对照植物的种子的油含量进行比较。为了进行这种比较，将At3g47710克隆到植物转化载体中，At3g47710位于强组成型CsVMV启动子后面，并利用floral dip法转化到拟南芥植物中。该转化载体含有能提供对卡那霉素抗性的nptII基因，作为选择标记。将来自转化植物的种子在含有卡那霉素的琼脂培养基中培育。7天后，鉴定转基因植物的健康绿色植物并移植到土壤。非转基因对照植物在琼脂培养基上发芽，生长7天然后转移到土壤上。将22个转基因的幼苗和10个非转基因的对照植物转移到相同的32格平地的随机位置。植物生长至成熟并自花授精并结子。从每一植物收获种子，通过如下所述的方法由Near Infrared(NIR)波谱学评估种子的含油量。
使用Bruker 22N/F近红外光谱法捕获NIR红外光谱。使用来自样品和参比方法的NIR数据，根据制造商的说明书将Bruker软件用于评估总的种子油和总的种子蛋白含量。根据AOCS程序Aml-92的一般方法开发了油含量预测校准，AOCS程序Aml-92是美国石油化学家学会的正式方法和美国石油学会推荐作法(Official Methods andRecommended Practices of the American Oil Chemists Society，第5版，AOCS，Champaign Ill)。开发了用于NIR预测原油ASE(Ren Oil，Accelerated Solvent Extraction)的校准。
已经在五个实验中检验了At3g47710的过表达对种子油的影响。在四个实验中，过表达At3g47710的植物具有比生长在相同的平地的对照植物高的种子油含量。整个实验中，过表达At3g47710的植物的平均种子油含量比未转化的对照高3.5％。过表达At3g47710的植物的种子油含量显著高于非-转基因对照植物(双向方差分析；P＝0.0066)，
参见表1。表1.
参考文献A1tschul，S.F.et al.，J.Mol.Biol.215403-410，1990.
Altschul，S.F.et al.，Nucleic Acids Res.253389-3402，1997.
Ausubel FM et al.Current Protocols in Molecular Biology，JohnWiley & Sons，NewYork，N.Y.，1993.
Baldwin D et al.，Cur Opin Plant Biol.2(2)96-103，1999.
Bateman et al.，1999，Nucleic Acids Res 27260-262.
Baulcombe D，Arch Virrol Suppl 15189-201，1999.
Cannon et al.，Plant Molec.Biol.(1990)1539-47.
Ch′ng et al.，Proc.Natl.Acad.Sci.USA(1989)8610006-10010Christensen S et al.，9th International Conference on ArabidopsisResearch.Univ.ofWisconsin-Madison，June 24-28，1998.Abstract 165.
Christou et al.，Proc.Natl.Acad.Sci USA(1989)867500-7504.
Cough，SJ and Bent，AF，the Plant Journal 16(6)735-743，1998.
De Block et al.，Plant Physiol.(1989)91694-701.
Dieffenbach C and Dveksler G(Eds.)PCR PrimerA LaboratoryManual，Cold SpringHarbor Laboratory Press，NY，1989.
Everett et al.，Bio/Technology(1987)51201Feldmann et al.，Science 2431351-1354，1989.
Focks N and Benning C，Plant Physiol 11891-101，1998.
Fridborg I et al.，Plant Cell 111019-1032，1999.
Geest AH and Hall TC，Plant Mol Biol 32(4)579-88，1996.
Gelvin，S.B.，Schilperoort，R.A.，Varma，D.P.S.，eds.PlantMolecular BiologyManual 1990.
Glick，BR and Thompson，JE，Eds.METHODS IN PLANT MOLECULARBIOLOGY AND
BIOTECHNOLOGY，p.213-221，CRC Press，1993.
Harlow E and Lane D，AntibodiesA Laboratory Manual，ColdSpring HarborLaboratory Press，1988，New York.
Harlow E and Lane D，Using AntibodiesA Laboratory Manual，ColdSpring HarborLaboratory Press，1999，New YorkHayashi H et al.，Science 2581350-1353，1992.
James DW and Dooner HK(1990)Theor Appl Genet 80，241-245.
Jensen，L.G.，et al.，Proc.Natl.Acad.Sci.USA 933487-3491，1996.
Jones JD et al，Transgenic Res 1285-297 1992.
Kardailsky I et al.，Science 2861962-1965，1999.
Kline et al.，Nature(1987)32770.
Kunkel TA et al.，Methods Enzymol.204125-39，1991.
Lemieux B，et al.1990，Theor Appl Genet 80，234-240.
Nakamura Y et al，1999，Nucleic Acids Res 27292.
Napoli，et al，Plant Cell 2279-289，1990.
Omirulleh et al.，Plant Mol Biol.21(3)415-28，1993.
Sambrook et al.Molecular CloningA Laboratory Manual(SecondEdition)，ColdSpring Harbor Press，Plainview，N.Y.，1989.
Schaffer R，et al.，Cell 931219-1229，1998.
Sheehy et al.，Proc.Natl.Acad.Sci.USA(1988)858805-8809.
Smith，et al.，Nature 334724-726，1988.
Smith et al.，Mol.Gen.Genetics(1990)224477-481.
Thompson JD et al，1994，Nucleic Acids Res 224673-4680.
van der Krol et al.，Biotechniques(1988)6958-976.
van der Krol et al.，The Plant Cell(1990)2291-299.
Van Haaren MJJ et al.，Plant Mol Bio 21625-640，1993.
Verdaguer B et al.，Plant Mol Biol 371055-1067，1998.
Waterhouse，et al.，Proc.Natl.Acad.Sci.USA 9513959-13964，1998.
Weigel D，et al.，Plant Physiology，1221003-1013，2000.
Wilson K et al.，Plant Cell 8659-671，1996.
Yadav NS et al.(1993)Plant Physiol 103，467-476.
Bert et al.，Theor Appl Genet.2003 Jun；107(1)181-9.
Colbert et al(2001)Plant Physiol 126480-484.
Jako，et al.，Plant Physiology 126(2)861-74，2001.
Katavic，et al.，Plant Physiology，108(1)399-409，1995.
Lionneton et al，Genome.2002 Dec；45(6)1203-15).
McCallum et al(2000)Nature Biotechnology 18455-457).
序列表<110>农业经济有限责任公司(Agrinomics，LLC)<120>生产改变含油量的植物(GENERATION OF PLANTS WITH ALTERED OIL CONTENT)<130>SCT062676-66<150>60/530,878<151>2003-12-17<160>3<170>PatentIn version 3.2<210>1<211>279<212>DNA<213>Arabidopsis thaliana<400>1atgtctagca gaaaatcacg ttcaagacaa actggagctt ccatgatcac ggatgaacaa 60atcaacgatc ttgtcctcca gcttcatcgg cttctccccg aacttgctaa caacagacgc120tctggaaagg tttcagcatc aagggtatta caagagacat gcagttacat aaggaacttg180agcaaagaag tggatgatct tagtgaaaga ttgtctcaac ttttggaatc aactgattca240gctcaagctg cactaatccg aagtttgctt atgcagtag 279<210>2<211>92<212>PRT<213>Arabidopsis thaliana<400>2Met Ser Ser Arg Lys Ser Arg Ser Arg Gln Thr Gly Ala Ser Met Ile1 5 10 15Thr Asp Glu Gln Ile Asn Asp Leu Val Leu Gln Leu His Arg Leu Leu20 25 30Pro Glu Leu Ala Asn Asn Arg Arg Ser Gly Lys Val Ser Ala Ser Arg35 40 45
Val Leu Gln Glu Thr Cys Ser Tyr Ile Arg Asn Leu Ser Lys Glu Val50 55 60Asp Asp Leu Ser Glu Arg Leu Ser Gln Leu Leu Glu Ser Thr Asp Ser65 70 75 80Ala Gln Ala Ala Leu Ile Arg Ser Leu Leu Met Gln85 90<210>3<211>697<212>DNA<213>Arabidopsis thaliana<400>3gatttctttc tcgatcccca acatcactag ctagctcctt gtacacactc tacaacccca 60cctagctaca tcacttaatt agttttacca atttcaaatt ctcacctgtc actagctata120tttcataact gatcattacc aactcatcac tacatattat tggctaggat tcaccattag180acttaagatt agttgattta ttacatatat aagatgtcta gcaggaggtc acggtcaagg240caaacaagta gttcaaggaa tatcaccgat gatcagatca atgatcttgt ctctaagttg300caacagcttc ttccagagat tcgcgatagg cgctctgaca aggtttcagc ttccaaggtg360ttgcaagaga catgcaacta tattagaagc ttacacaggg aagtgggtga cctaagcgag420cgtttatctg agctcctgga tacaactgac acggctcaag ctgcaataat tagaaattta480ctgatgcaat agatcggtgc agttgttaat ttatcgtata attcatagtt aacacttcag540tacttgtgaa ccgatccagt cactggtcgt gtatttctta ttctcttttc gtttcacttt600tttttttttt tttgtgctgg ttcttgtcca ctaatatgaa tgattactgc ttttgcaaag660cccaatttcc ttatatatta aataaaagtt tcagagg 69权利要求
1.包括植物转化载体的转基因植物，该植物转化载体含有编码或互补于编码包括SEQ ID NO2的氨基酸序列的HIO32.2多肽或其直系同源物的序列的核苷酸序列，因此相对于对照植物，该转基因植物具有高油表型。
2.权利要求1的转基因植物，其选自油菜籽，大豆，玉米，向日葵，棉花，可可，红花，油棕，椰子，亚麻，蓖麻和花生。
3.从权利要求1的植物获得的植物部分。
4.权利要求3的植物部分，其是种子。
5.一种生产油的方法，其包括培育权利要求1的转基因植物，以及从所述植物回收油。
6.产生高油表型植物的方法，所述方法包括a)把植物转化载体导入到植物的祖细胞中，该植物转化载体含有编码或互补于编码包括SEQ ID NO2的氨基酸序列的HIO32.2多肽或其直系同源物的序列的核苷酸序列，和b)培育该转化的祖细胞以生产转基因植物，其中表达所述的多核苷酸序列，而且相对于对照植物，所述的转基因植物显示改变的含油量表型。
7.通过权利要求6的方法获得的植物。
8.权利要求7的植物，其选自油菜籽，大豆，玉米，向日葵，棉花，可可，红花，油棕，椰子，亚麻，蓖麻和花生。
9.权利要求7的植物，其中的植物选自从所述组细胞生长而来的植物，从所述组细胞生长而来的植物的直接后代的植物以及从所述组细胞生长而来的植物的间接后代的植物。
10.产生具有高油表型植物的方法，包括鉴定具有HIO32.2基因的等位基因的植物，所述HIO32.2基因的等位基因引起与缺少该等位基因且产生所述鉴定的植物的子代的植物相比含油量的增加，其中产生的子代遗传该等位基因并且为高油表型。
11.权利要求10的方法，其使用候选基因/QTL法。
12.权利要求10的方法，其使用TILLING法。
全文摘要
本发明涉及由于HIO32.2核酸的改变的表达，而显示改变的含油量表型的植物。本发明更进一步涉及生产具有改变的含油量表型的植物的方法。
文档编号C12N15/82GK1893819SQ200480037978
公开日2007年1月10日申请日期2004年12月17日优先权日2003年12月17日
发明者乔纳森·莱特纳, 海因·措恩格·额, 约翰·P·戴维斯申请人:农业经济有限责任公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：乔纳森.莱特纳;海因.措恩格.额;约翰.Ｐ.戴维斯
技术所有人：农业经济有限责任公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.食品功能因子基因工程菌种的构建、智能高通量进化筛选 2.发酵工艺优化
2、马老师：1.酶工程与生物催化 2.酿造技术与风味分析 3.生物质资源综合利用
3、林老师：1.酿造微生物育种及关键酿造工艺开发 2. 真菌基因功能及调控网络解析 3.精细化学品、蛋白真菌细胞底盘开发
4、张老师：1.发酵食品安全：危害物相关基因的筛选，危害物产生菌的快速检测，危害物的预警和发酵过程控制 2.真菌次级代谢与调控 3.酿造酒相关研究
5、郭老师：1.现代酿造技术与食品安全 2. 酵母生物学 3.生物基化学品与合成生物学
如您是高校老师，可以点此联系我们加入专家库。