Eg1117和eg307多核苷酸及其用途的制作方法

文档序号:557620阅读:557来源:国知局

专利名称::Eg1117和eg307多核苷酸及其用途的制作方法
技术领域
:如产量的多核苷酸和多肽序列的分子和进化技术,所鉴定的多核苷酸和多肽序列,以及使用所鉴定的多核苷酸和多肽序列的方法。
背景技术
:人类已培育植物和动物数千年,其中选择某些商业上有价值的和/或美学的性状。驯化植物在诸如产量、短日照长度开花、蛋白质和/或油含量、易于收获、味道、抗病性和抗旱性的性状方面不同于其野生祖先或家族成员。驯化动物在诸如脂肪和/或蛋白质含量、乳生产、温顺、生殖力和成熟时间的性状方面不同于其野生祖先或家族成员。目前,支持上述差异的大多数基因是未知的,同样重要地,在这些基因中已进化从而提供这些能力的特定改变也是未知的。了解驯化植物和驯化动物与其野生祖先或家族成员之间的这些差异的基础,将提供用于维持并增强那些性状的有用信息。在作物植物的情况下,控制所需性状的特定基因的鉴定将允许以先前不可能的方式直接且快速地进行改良。鉴定相比同源祖先基因而言已进化从而赋予独特的、增强的或改变的功能的驯化基因种类能够用于开发调节这些功能的试剂。鉴定已进化的支持性驯化基因种类和特定核苷酸变化,以及进一步表征由这些进化的基因编码的蛋白质中的物理和生物化学变化,可以提供关于支持所需性状的机制的有价值的信息。这种有价值的信息可以应用于DNA标记辅助育种或DNA标记辅助选择。备选地,这种信息可以用于开发进一步增强靶蛋白功能的试剂。备选地,负责的基因的进一步改造可以修饰或增加所需性状。此外,可能发现所鉴定的基因在控制其他驯化植物中的目的性状之中起作用。人类通过人工选择已对作物植物提供了强烈的选择压力。这种压力反映在驯化生物和其野生祖先或家族成员的同源基因之间的进化上显著的变化中。已发现,只有少数基因,例如10-15个/物种,在驯化的作物植物中控制具有商业利益的性状。这些少数基因非常难以通过植物分子生物学标准方法进行鉴定。申请中描述。用于DNA标记辅助育种(markerassistedbreeding,MAB)和謹标记辅助选择(markerassistedselection,MAS)的方法是本领域技术人员众所周知的,并且已在许多出版物中描述(参见,例如Peleman和vanderVoort,BreedingbyDesign,TRENDSinPlantScience8(7):330-334)。此类方法在开发新植物品种的过程中通过增加选择和掺入与所需表型相关的特定等位基因的能力可以使得植物育种更有效。伴随现今通常使用的标记物的一个问题是,通过重组它们可以变得与靼基因或性状相分离(参见HollandinProceedingsofthe4thInternationalCropScienceCongress26Sep-1Oct2004,Brisbane,Australia)。事实上,Holland引用了其中标记的使用比常规育种更好的实例,以及其中常规育种得到比标记辅助育种更好的结果的其他实例。Holland陈述到,"标记不可能立刻普遍用于处理复杂性状如产量"。对于可用于处理复杂性状如产量的标记来说所需要的是支持此类复杂性状的特定基因,而不是只在某些时候与此类复杂性状相关联的标记。发明详述使用本发明,本发明人已鉴定出相应于EG1117(对于玉蜀黍(Z.则/s/zwj^)(玉米)、两色高粱(高粱)、甘蔗(S.130/*/7^'/7<3/://77)(甘蔗)、小麦(7:ae"/w/迈)(小麦)、大麦(Ara/gflre)(大麦)和水稻(0.(驯化稻))、EG307(原种玉米等位基因,非原种玉米等位基因,小麦、大麦、两色高粱和水稻)的基因、多核苷酸和多肽。本发明的多核苷酸和多肽可用于各种方法中,例如鉴定与植物中的产量相关联的多核苷酸序列的方法;测定植物是否具有一种或多种包含EG1117或EG307序列的多核苷酸序列的方法;和关于特定EG1117或EG307序列而言植物的标记辅助育种方法。本发明的多核苷酸和多肽还可用于形成植物细胞、繁殖材料、转基因植物和转染的宿主细胞。另外,本发明的多核苷酸和多肽还可用作用于改进的标记辅助选择或标记辅助育种的标记。此外,此类多核苷酸和多肽可以用于鉴定在分享共同祖先或家族成员的其他物种中的同源基因,其在培育此类其他物种中用作标记。例如,玉米、稻、小麦、粟、高粱及其他谷类植物分享共同的祖先或家族成员,并且在稻中鉴定的基因可以直接导致获得这些其他禾本类植物中的同源基因。同样地,番茄和马铃薯分享共同的祖先或家族成员,并且通过本主题方法而在番茄中鉴定的基因预期在马铃薯中具有同系物,反之亦然。除非另有说明,本发明的实践采用在本领域技术内的分子生物学、遗传学和分子进化的常规技术。此类技术在文献中充分说明,例如"MolecularCloning:ALaboratoryManual",第二版(Sambrook等人,1989);"OligonucleoUdeSynthesis"(M.J.Gait,编者,1984);"CurrentProtocolsinMolecularBiology"(F.M.Ausubel等人,编者,1987);"PCR:ThePolymeraseChainReaction",(Mullis等人,编者,1994);"MolecularEvolution",(Li,1997)。定义应当注意,术语"a"或"an"实体指一个(种)或多个(种)的那种实体;例如,"agene"指一个(种)或多个(种)基因或至少一个(种)基因。像这样,术语"a"(或"an")、"一个(种)或多个(种),,和"至少一个(种)"在本文中可互换使用。还应注意,术语"包括"、"包含,,和"含有"可以互换使用。如本文使用的,"多核苷酸"指任何长度的聚合形式的核苷酸,核糖核苷酸或脱氧核糖核苷酸、或其类似物。这个术语指所述分子的一级结构,因而包括双和单链DNA,以及双和单链RNA。它还包括经修饰的多核苷酸例如甲基化的和/或加帽的多核苷酸,包含修饰的碱基、主链修饰的多核苷酸,等等。术语"多核苷酸"和"核苷酸序列"可互换使用。如本文使用的,"基因"指包含编码蛋白质的序列的多核苷酸或多核苷酸的部分。本领域充分理解的是,基因还包含非编码序列,例如5'和3'侧翼序列(例如启动子、增强子、阻抑子及其他调节序列)以及内含子。术语"多肽,,、"肽"和"蛋白质"在本文中可互换地用于指任何长度的氨基酸聚合物。这些术语还包括通过包括糖基化、乙酰化和磷酸化的反应进行翻译后修饰的蛋白质。术语"驯化生物"指已经历人工选择压力并形成商业或美学有关性状的个体活生物体或其种群、物种、亚种、品种、栽培种或品系。在一些优选实施方案中,驯化生物是选自玉米、小麦、稻、高粱、番茄或马铃薯或者其中已知祖先或家族成员的具有商业利益的任何其他驯化植物的植物。"植物"是处于任何发育阶段的任何植物,特别是种子植物。术语"野生祖先或家族成员"或"祖先或家族成员"指已由其进化出驯化生物、物种、亚种、品种、栽培种或品系的先驱或前驱生物、物种、亚种、品种、栽培种或品系。驯化生物可以具有一个或超过一个的祖先或家族成员。通常,驯化植物可以具有一个或多个祖先或家族成员,而驯化动物通常只有单个祖先或家族成员。术语"商业或美学有关性状"在本文中用于指在驯化生物例如植物或动物中存在的性状,对于其的分析可以提供与开发改良的生物或开发试剂有关的信息(例如物理或生物化学数据),所述试剂可以调节负责该性状的多肽或分别的多核苷酸。所述商业或美学有关性状相对于祖先或家族成员来说可以是独特的、增强的或改变的。"改变的"意指有关性状在质量上或数量上不同于在祖先或家族成员中观察到的性状。优选的商业或美学有关性状是产量。术语"Ka/Ks型方法"意指评估同源基因中非同义置换和同义置换数目之间的差异(通常(但不一定)显示为比例)的方法(包括测定非同义和同义位点的更严密的方法)。这些方法使用几种命名法系统进行命名,包括但不限于Ka/Ks、dN/ds、DN/DS。术语"进化上显著的变化"和"适应性的进化变化"指在两种生物、物种、亚种、品种、栽培种和/或品系之间的一个或多个核苦酸或肽序列变化,其可以归因于选择压力放松或正选择压力。用于确定进化上显著的变化的存在的一种方法是应用Ka/Ks型分析方法,例如以便测量L/Ks比例。通常,1.0或更大的KA/Ks比例被视为进化上显著的变化。严格说来,正好1.0的L/Ks比例是选择压力放松(中性进化)的指标,和大于1.0的KA/Ks比例是正选择的指标。然而,通常公认的是,GenBank以及其他公共数据库中的ESTs常常具有一定程度的测序误差,并且甚至少数不正确的核普酸也可以影响Ka/Ks比例。由于这个原因,L/Ks比例低至0.75的多核苷酸可以谨慎地进行再次测序,并再次就选择压力放松(中性的进化上显著的变化)、正选择压力(正的进化上显著的变化)或负选择压力(进化上保守的变化)进行评估。术语"正的进化上显著的变化,,意指在特定生物、物种、亚种、品种、栽培种或品系中的进化上显著的变化,其导致与其他有关生物比较是正向的适应性变化。正的进化上显著的变化的例子是已导致作物植物中产量增加的变化。如上所述,正选择由大于1.0的L/Ks比例来指示。以渐增的优先选择顺序,Ka/Ks但大于1.25、1.5和2.0。术语"中性的进化上显著的变化"指相对于其祖先生物来说在驯化生物中出现并且在中性条件下形成的多核苷酸或多肽变化。中性的进化变化由约0.75-1.25的〖a/Ks值来证明,优选约0.9-1.1,和最优选等于约1.o。此外,在中性进化的情况下,不能推断出"方向性"。基因没有限制地自由积聚变化,因此祖先和驯化的版本相对于彼此进行改变。术语"同源的"或"同系的"或"直向同源的"是本领域已知且充分了解的,并且指分享共同祖先或家族成员的相关序列,并且基于序列同一性的程度进行测定。这些术语描述了在一个物种、亚种、品种、栽培种或品系中发现的基因和在另一个物种、亚种、品种、栽培种或品系中的相应或等价基因之间的关系。为了本发明的目的比较了同源序列。"同源序列"或"同系物"或"直向同源物',被认为、相信或已知是功能上相关的。功能关系可以以许多方式中的任何一种来指明,包括但不限于(a)序列同一性的程度;(b)相同或相似的生物学功能。优选地,(a)和(b)都被指明。序列同一性的程度可以改变,但优选为至少50%(当使用本领域已知的标准序列比对程序时)、更优选至少60%、更优选至少约75%、更优选至少约85%。同源性可以使用本领域容易获得的软件程序来测定,例如在Cwre/^户,"歸/s//#o/,/ar肠/og/(F.M.Ausubel等人,编者,1987)补遗30,第7.718节,表7.71中讨论的那些。优选的比对程序是MacVector(OxfordMolecularUd,Oxford,U丄)和ALIGNPlus(ScientificandEducationalSoftware,Pennsylvania)。另一个优选的比对程序是Sequencher(GeneCodes,ArmArbor,Michigan),4吏用缺省参数。如本领域充分了解的,术语"核普酸变化"指核苷酸置换、缺失和/或插入。"持家基因"是本领域充分了解的术语,并且指与一般细胞功能相关的那些基因,所述细胞功能包括但不限于生长、分裂、停滞、代谢和/或死亡。"持家,,基因一般执行在超过一种细胞类型中发现的功能。相反地,细胞特异性基因一般在特定细胞类型和/或类别中执行功能。如本文使用的,术语"试剂"指调节多核香酸或多肽功能的生物学或化学化合物,例如简单或复杂的有机或无机分子、肽、蛋白质或寡核苷酸。可以合成一大批化合物,例如寡聚物,例如寡肽和寡核苷酸,以及基于各种核心结构的合成有机和无机化合物,并且这些也包括在术语"试剂"中。另外,各种天然来源可以提供用于篩选的化合物,例如植物或动物提取物等等。化合物可以单独或互相组合地进行测试。术语"调节多核苷酸或多肽的功能"指当与不添加试剂相比较时,多核普酸或多肽的功能发生改变。调节可以在影响功能的任何水平上发生。多核苷酸或多肽的功能可以是直接或间接的,并且直接或间接地测量。"多核苷酸的功能"包括但不限于,复制;翻译;表达模式。多核苷酸功能还包括与在所述多核苷酸内编码的多肽相关的功能。例如,作用于多核苷酸并影响蛋白质表达、构象、折叠(或其他物理特征)、与其他部分(例如配体)的结合、活性(或其他功能特征)、调节和/或蛋白质结构或功能的其他方面的试剂被认为调节了多核苷酸的功能。"多肽的功能"包括但不限于,构象、折叠(或其他物理特征)、与其他部分(例如配体)的结合、活性(或其他功能特征)和/或蛋白质结构或功能的其他方面。例如,作用于多肽并影响其构象、折叠(或其他物理特征)、与其他部分(例如配体)的结合、活性(或其他功能特征)和/或蛋白质结构或功能的其他方面的试剂被认为调节了多肽的功能。有效试剂可以用于调节多肽功能的方式包括但不限于1)改变构象、折叠或其他物理特征;2)改变与其天然配体的结合强度或改变与配体结合的特异性;和3)改变多肽的活性。术语"靶位点"指多肽中的位置,其可以是单个氨基酸和/或结构和/或功能基序例如结合位点、二聚化结构域或催化活性位点的一部分。靶位点可以用于与试剂例如治疗剂直接或间接地相互作用。术语"分子差异"包括任何结构和/或功能差异。检测此类差异的方法以及此类差异的例子在本文中描述。"功能效应"是本领域众所周知的术语,并且指在任何活性水平上展示的任何效应,无论是直接还是间接的。术语"易于收获"指有助于人工或自动收集结构或部分(例如果实、叶、根)以用于消费或其他商业加工的植物特征或特点。术语"产量"指可获得用于由人类用于食物、治疗、兽医或其他市场的植物或动物组织或材料的量。术语"增强的经济生产力"指调节商业或美学有关性状以便改善所需特点的能力。增加的产量和增强的逆境抗性是增强的经济生产力的两个例子。本领域已知的一般程序为了本发明的目的,来自驯化植物或其祖先或家族成员的多核苷酸的来源可以是任何合适的来源,例如基因组序列或cDNA序列。优选地,比较cDNA序列。蛋白质编码序列可以从可利用的私人、公共和/或商业数据库例如本文描述的那些中获得。这些数据库充当由正在进行的研究努力所产生的分子序列储库。备选地,蛋白质编码序列可以根据本领域众所周知的方法从例如由在细胞中表达的mRNA逆转录出的cDM测序中或在PCR扩增后获得。备选地,基因组序列可以用于序列比较。基因组序列可以从可利用的>^共、私人和/或商业数据库或从基因组DNA文库测序或在PCR后从基因组DNA获得。在一些实施方案中,cDNA从mRNA制备,所述mRNA获得自处于确定的发育阶段的组织,或在生物已经历某些环境条件后获得的组织。用于本发明的序列比较的cDNA文库可以使用本领域文献中充分说明的常规cDNA文库构建技术来进行构建。总mRNAs用作用于逆转录cDNAs的模板。将转录出的cDNAs亚克隆到合适的载体中以建立cDNA文库。建立的cDNA文库可以对于全长cDNA内容物进行最大化,尽管可以〗吏用少于全长的cDNAs。此外,序列频率可以才艮据例如Bonaldo等人(1996)Ce/o迈e6:791-806进行标准化。随机选自构建的cDNA文库的cDNA克隆可以使用标准自动化测序技术进行测序。优选地,对于测序使用全长cDM克隆。来自cDNA文库的全部或大部分cDNA克隆可以进4于测序,尽管通过对少至单个cDNA或几个cDM克隆进行测序来实践本发明的一些实施方案也是可以的。在本发明的一个优选实施方案中,待测序的cDNA克隆可以根据其表达特异性进行预先选择。为了选择相应于特异性表达的活性基因的cDNAs,可以使用从同一生物的其他器官、组织或细胞获得的mRNAs对所述cDNAs实施消减式杂交。在具有合适的严紧性和浓度的某些杂交条件下,与非组织特异性mRNAs杂交并从而可能代表了"持家"基因的那些cDNAs可以^皮从cDNA库中排除。因此,待测序的剩余cDNAs更可能与组织特异性功能相关。为了消减式杂交的目的,非组织特异性mRNAs可以从一种组织获得,或优选地从不同组织和细胞的组合获得。非组织特异性mRNAs的量被最大化以饱和组织特异性cDNAs。备选地,来自在线数据库的信息可以用于选择更可能与特定功能相关的cDNAs或认为其是优先的。例如,用于测序的祖先cDNA候选物可以使用从候选驯化生物cDNA序列设计的引物通过PCR进行选择。候选驯化生物cDNA序列是例如只在植物特定部分中发现的那些cDNA序列,或相应于可能在特定功能中重要的基因的那些cDM序列。此类特定cDNA序列可以通过搜索在线序列数据库来获得,在所述在线序列数据库中可能明确说明了关于cDNA序列的表达特性镨和/或生物活性的信息。已知驯化生物的基因的祖先同系物的序列可以使用本领域的标准方法获得,例如PCR方法(4吏用,例如,GeneAmpPCRSystem9700热循环4义(AppliedBiosystems,Inc.))。例如,用于测序的祖先cDNA候选物可以^吏用从候选驯化生物cDNA序列设计的引物通过PCR进行选择。对于PCR,引物可以使用本领域的标准方法从驯化生物的序列制备,包括7>众可获得的引物设计程序例如PRIMER(WhiteheadInstitute)。扩增出的祖先序列随后可以使用本领域的标准方法和设备进4亍观'J序,伊Jj口自动4匕须'J序4义(AppliedBiosystems,Inc.)。同样地,祖先或家族成员基因模拟物可以用于获得在驯化生物中的相应20基因驯化生物中正选择出的多核苷酸的鉴定在一个优选实施方案中,本文描述的方法可以应用于鉴定在农业上重要的驯化植物中控制目的性状的基因。人类已在不了解控制这些性状的基因的情况下培育驯化植物数千年。关于所涉及的特定遗传机需或增强性状的植物。'、'、、、人类通过人工选择已对作物植物提供了强烈的选择压力。这种压力反映在驯化生物和其野生祖先或家族成员的同源基因之间的进化上显著的变化中。已发现,只有少数基因,例如10-15个/物种,在驯化的作物植物中控制具有商业利益的性状。这些少数基因非常难以通过植物分子生物学标准方法进行鉴定。本文描述的L/Ks及相关分析可以鉴定控制目的性状的基因。对于任何目的作物植物,可以从驯化物种或亚种及其野生祖先或家族成员中构建cDNA文库。如于1999年1月29日提交的USSN09/240,915中所描述的,每个cDNA文库针对彼此进行"BLAST"以鉴定同源多核苷酸。备选地,技术人员可以访问商业和/或公众可得的基因组或cDNA数据库而不是构建cDNA文库。接下来,可以进行KA/Ks或相关分析以鉴定在选择压力下已快速进化的所选择的基因。这些基因随后使用标准分子和转基因植物方法进行评估以确定它们是否在具有商业或美学利益的性状中起作用。使用本发明的方法,本发明人已鉴定了相应于基因EG1117或EG307(其是产量相关基因)的多核苷酸和多肽。目的基因可以通过例如随机或位点定向诱变进行操作以开发新的经改良的品种、亚种、品系或栽培种。一般地,在本发明的一个实施方案中,核苷酸序列从驯化生物和野生祖先或家族成员获得。将驯化生物和祖先或家族成员的核苷酸序列互相进行比较以鉴定同源的序列。分析同源序列以鉴定在驯化生物和祖先或家族成员之间具有核酸序列差异的那些。随后进行分子进化分析以在数量上和质量上评估所述差异的进化显著性。对于已进行正选择的基因,可以进行外类群分析以鉴定驯化生物中(或者祖先或家族成员中)已进行正选择的那些基因。接下来,在分子/遗传同一性和生物学功能方面对序列进行表征。最后,该信息可以用于鉴定可调节由所述基因编码的多肽的生物学功能的试剂。本发明的一般方法需要比较祖先和驯化生物的编码蛋白质的核苷酸序列。将生物信息学应用于该比较,并且选择出包含核苷酸变化的序列,所述核苷酸变化是进化上显著的变化。本发明使得能够鉴定已进化从而赋予某些进化优势的基因,和鉴定特定的进化出的变化。例如,驯化生物可以是水稻,和野生祖先或家族成员是野生稻(rw/7;w^/7)。在本发明的情况下,编码蛋白质的核苷酸序列通过标准测序技术从植物克隆中获得。比较驯化生物和其祖先或家族成员的蛋白质编码序列以鉴定同源序列。本发明考虑了用于完成这种比较的任何合适机制。比对可以人工或通过软件(合适的比对程序的例子是本领域已知的)来进行。优选地,经由数据库搜索例如BLAST搜索来比较来自祖先或家族成员或者家族成员的蛋白质编码序列与驯化物种的序列。高得分的"命中",即在BLAST分析后显示显著相似性的序列,将被检索出并进行分析。显示显著相似性的序列可以是具有至少约60%、至少约75%、至少约80%、至少约85%或至少约90%序列同一性的那些。优选地,进一步分析显示大于约80%同一性的序列。经由数据库搜索鉴定的同源序列可以使用本领域已知和可用的序列比对方法和程序进行整体比对,例如常用的由Higgins等人(1992)C^/08:189-191所述的简单比对程序CLUSTALV。作为例子,从野生稻获得的核苷酸序列可以在GenBank中的水稻ESTs的搜索之中用作查询序列以鉴定同源序列。应当注意,完整的编码蛋白质的核苷酸序列不是必需的。事实上,可以比较部分cDNA序列。一旦通过下文描述的方法鉴定出目的序列,就可以使用进一步的克隆和/或生物信息学方法来获得关于所述目的基因或蛋白质的整个编码序列。备选地,驯化生物和其祖先或家族成员或者家族成员之间的蛋白行。参见,例如Rava等人,美国专利5,545,531。分析经比对的驯化生物和祖先或家族成员或者家族成员的蛋白质编码序列以鉴定特定位点上的核苷酸序列差异。再一次,本发明考虑了用于完成这种分析的任何合适方法。如果不存在核苷酸序列差异,那么所述祖先或家族成员或者家族成员的蛋白质编码序列通常不进行进一步分析。检测到的序列变化一般且优选最先检查精确性。优选地,最初的检查包括执行一个或多个下列步骤,所述步骤中的任何一个或所有是本领域已知的(a)找到在祖先和驯化生物序列之间有变化的点;(b)检查序列荧光图(色谱图)以确定看起来对于祖先或家族成异的强而清晰的信号;(c)检查驯化生物命中以察看是否存在相应于序列变化的超过一种的驯化生物序列。关于相同基因的多重馴化生物序列输入提供了关于驯化序列是精确的以及变化是显著的独立支持,所述相同基因在其中于祖先或家族成员序列中存在不同核苷酸的位置处具有相同核苷酸。使用数据库信息和遗传密码来检查此类变化以确变化。^"核普酸变化"的定义所清楚解释的,本发明^括相比来自祖先或家族成员的相应序列而言在驯化生物的编码蛋白质的多核苷酸序列中的至少一个核苷酸变化(置换、缺失或插入)。优选地,所述变化是核苷酸置换。更优选地,超过一个置换存在于所鉴定的序列中,并且对其实施分子进化分析。在一个实施方案中,本发明包括用于鉴定与植物中的产量相关联的多核苷酸序列的方法。这种方法包括比较植物多核苷酸序列的至少一部分与至少一种BG1117多核苷酸序列和/或EG307多核苷酸序列的步骤。这种方法还包括鉴定植物中与选自EG1117多核苷酸序列和EG307多核普酸序列的多核苷酸相比较包含至少一个核苷酸变化的至少一种多核苷酸序列的步骤,其中所述鉴定的多核苷酸序列与植物中的产量相关联。优选的EG307和EG1117多核苷酸序列包括SEQIDNO:71;SEQIDNO:72;SEQIDNO:74;SEQIDNO:75;SEQIDNO:41;SEQIDNO:42;SEQIDNO:44;SEQIDNO:45;SEQIDNO:47;SEQIDNO:48;SEQIDNO:50;SEQIDNO:51;SEQIDNO:53;SEQIDNO:54;SEQIDNO:56;SEQIDNO:57;SEQIDNO:59;SEQIDNO:60;SEQIDNO:62;SEQIDNO:63;SEQIDNO:65;SEQIDNO:66;SEQIDNO:68;SEQIDNO:69;SEQIDNO:117;SEQIDNO:119;SEQIDNO:115;SEQIDNO:78;SEQIDNO:79;SEQIDNO:80;SEQIDNO:81;SEQIDNO:82;SEQIDNO:83;SEQIDNO:84;SEQIDNO:85;SEQIDNO:94;SEQIDNO:95;SEQIDNO:97;SEQIDNO:98;SEQIDNO:100;SEQIDNO:101;SEQIDNO:103;SEQIDNO:105;SEQIDNO:107;SEQIDNO:109;SEQIDNO:111;SEQIDNO:113;SEQIDNO:86;SEQIDNO:87;SEQIDNO:88;SEQIDNO:89;SEQIDNO:90;SEQIDNO:91;SEQIDNO:92;SEQIDNO:93;以及与前述SEQIDNos具有至少约70。/。序列同一性的多核苷酸。优选的植物多核苦酸序列包括来源于基因组DNA的植物序列或来源于植物的经表达的基因即cDNA的植物序列。这样做的方法是本领域已知的并且在本i兌明书中的其他地方讨论。优选地,EG307或EG1117多核苷酸序列与植物中增加的产量相关联。测定和定量产量的方法是本领域已知的,并且在本说明书中的其他地方讨论。最优选地,产量可以通过确定产量相对于第二种植物而言是否增加来进行定量,所述第二种植物来自共同祖先、属或家族成员植物,更优选相同种,更加优选相同栽培种,并且所述第二种植物有至少一个核苷酸变化的第二种EG307或EG1117多核苷酸序列。在本发明的所有实施方案中,优选的多核苷酸序列包括与本发明的EG307或EG1117多核苷酸具有至少约60%序列同一性并且对于产量具有与本文指定的SEQIDNO基本上相同的影响的多核苷酸。优选地,本发明的多核苷酸将与SEQIDNO:71;SEQIDNO:72;SEQIDNO:74;SEQIDNO:75;SEQIDNO:41;SEQIDNO:42;SEQIDNO:44;SEQIDNO:45;SEQIDNO:47;SEQIDNO:48;SEQIDNO:50;SEQIDNO:51;SEQIDNO:53;SEQIDNO:54;SEQIDNO:56;SEQIDNO:57;SEQIDNO:59;SEQIDNO:60;SEQIDNO:62;SEQIDNO:63;SEQIDNO:65;SEQIDNO:66;SEQIDNO:68;SEQIDNO:69;SEQIDNO:117;SEQIDNO:119;SEQIDNO:115;SEQIDNO:78;SEQIDNO:79;SEQIDNO:80;SEQIDNO:81;SEQIDNO:82;SEQIDNO:83;SEQIDNO:84;SEQIDNO:85;SEQIDNO:94;SEQIDNO:95;SEQIDNO:97;SEQIDNO:98;SEQIDNO:100;SEQIDNO:101;SEQIDNO:103;SEQIDNO:105;SEQIDNO:107;SEQIDNO:109;SEQIDNO:111;SEQIDNO:113;SEQIDNO:86;SEQIDNO:87;SEQIDNO:88;SEQIDNO:89;SEQIDNO:90;SEQIDNO:91;SEQIDNO:92;和SEQIDNO:93中的任何一个具有至少约65%的同一性、至少约66%的同一性、至少约67%的同一性、至少约68%的同一性、至少约69%的同一性、至少约70%的同一性、至少约71%的同一性、至少约72%的同一性、至少约73%的同一性、至少约74%的同一性、至少约75%的同一性、至少约76%的同一性、至少约77%的同一性、至少约78%的同一性、至少约79%的同一性、至少约80%的同一性、至少约81%的同一性、至少约82%的同一性、至少约83%的同一性、至少约84%的同一性、至少约85%的同一性、至少约86%的同一性、至少约87%的同一性、至少约88%的同一性、至少约89%的同一性、至少约90%的同一性、至少约91%的同一性、更优选至少约92%的同一性、至少约93%的同一性、至少约94%的同一性、至少约95%的同一性、和更加优选至少约95.5%的同一性、至少约96%的同一性、至少约96.5%的同一性、至少约97。/。的同一性、至少约97.5%的同一性、至少约98%的同一性、至少约98.5%的同一性、至少约99%的同一性、至少约99.5%的同一性,或相同。在本发明的所有实施方案中,优选的多肽序列包括与本发明的EG307或EG1117多肽具有至少约60。/。序列同一性并且对于产量具有与本文指定的SEQIDNO基本上相同的影响的多肽。优选地,本发明的多肽将与SEQIDNO:73;SEQIDNO:76;SEQIDNO:43;SEQIDNO:46;SEQIDNO:49;SEQIDNO:52;SEQIDNO:55;SEQIDNO:58;SEQIDNO:61;SEQIDNO:64;SEQIDNO:67;SEQIDNO:70;SEQIDNO:118;SEQIDNO:120;SEQIDNO:116;SEQIDNO:96;SEQIDNO:99;SEQIDNO:102;SEQIDNO:104;SEQIDNO:106;SEQIDNO:108;SEQIDNO:110;SEQIDNO:112;和SEQIDNO:114中的任何一个具有至少约65%的同一性、至少约66%的同一性、至少约67%的同一性、至少约68%的同一性、至少约69%的同一性、至少约70%的同一性、至少约71%的同一性、至少约72%的同一性、至少约73%的同一性、至少约74%的同一性、至少约75%的同一性、至少约76%的同一性、至少约77%的同一性、至少约78%的同一性、至少约79%的同一性、至少约80%的同一性、至少约81%的同一性、至少约82%的同一性、至少约83%的同一性、至少约84%的同一性、至少约85%的同一性、至少约86%的同一性、至少约87%的同一性、至少约88%的同一性、至少约89%的同一性、至少约90%的同一性、至少约91%的同一性、更优选至少约92%的同一性、至少约93%的同一性、至少约94%的同一性、至少约95%的同一性、和更加优选至少约95.5%的同一性、至少约96%的同一性、至少约96.5%的同一性、至少约97%的同一性、至少约97.5%的同一性、至少约98%的同一性、至少约98.5%的同一性、至少约99%的同一性、至少约99.5%的同一性,或相同。在本发明的所有实施方案中,本发明的驯化植物优选包括玉蜀黍(Zea鹏^迈ays)、水稻(Oi"7zsss〃m)、小麦(7W〃c"迈se"/r咖)、大麦(^orde咖ra/^sre)、甘庶(Sacc力ar"迈o/Y7c//7<s_r"iZ7)、两色高粱(Sorg力咖Wco7or)和珍珠粟(?e/7/n.set咖OT^o^es)。在本发明的所有实施方案中,野生祖先或家族成员植物优选包括关于选自下列的驯化植物的野生祖先或家族成员植物玉蜀黍、水稻、小麦、大麦、甘蔗、两色高粱和珍珠粟。特别优选的野生祖先或家族成员植26物是野生稻。任何植物EG307或EG1117多肽是本发明的合适多肽。从中分离出EG307或EG1117多肽(包括分离天然多肽或通过重组或合成技术产生多肽)的合适植物包括玉米,小麦,大麦,黑麦,粟,鹰嘴豆,兵豆,亚麻,橄榄,无花果,扁桃,阿月浑子,胡桃,甜菜,欧防风,柑橘类水果,包括但不限于橘、柠檬、来檬、葡萄柚、桔、明尼欧拉桔柚(minneola)和橘柚,甘薯,菜豆,豌豆,菊苣,莴苣,甘蓝,花椰菜,花茎甘蓝,芜斧,萝卜,菠菜,声夢,洋葱,大蒜,胡椒,芽菜,南瓜,西葫芦,大麻,胡瓜,苹果,梨,揾椁,甜瓜,李子,樱桃,桃,油桃,杏,草莓,葡萄,覆盆子,黑莓,波萝,鲟梨,番木瓜,芒果,香蕉,大豆,番茄,高粱,甘蔗,普通甜菜,向曰葵,油菜籽,三叶草,烟草,胡萝卜,棉花,苜蓿,稻,马铃薯,茄子,黄瓜,拟南芥,以及木本植物例如针叶树和落叶树,而玉米、高粱、甘蔗和小麦是特别理想的。本发明的这个实施方案包括用于鉴定本发明序列的等位基因变体的方法。如本文使用的,"标记"是指染色体上的基因座,其用于鉴定染色体上的独特位置。"多态标记"是指这样的标记,所述标记看起来为多重形式(等位基因),从而使得不同形式的标记物当以同源对存在时允许追踪那个对中的每个染色体的传递。基因型可以通过使用一个或多个标记来进行限定。本发明还提供了包含具有足够长度和与本发明基因的互补性的多核苷酸的分离的核酸,以在基因转录物的检测、定量或分离中用作探针或扩增引物。例如,本发明的分离的核酸可以在所需转基因植物的筛选中用作探针来检测mRNA水平中的缺陷,用于检测基因中的突变(例如,置换、缺失或添加),用于在化合物筛选测定法中监控表达上调或酶活性的变化,用于检测基因的任何数目的等位基因变体(多态性),或在植物育种程序中用作分子标记。另外,本发明进一步提供了包含编码多肽/多核苷酸的一种或多种多态(等位基因)变体的多核苷酸的分离的核酸。多态变体通常在例如用于作物改良的标记辅助选择方法中用于跟踪染色体区域的分离。本发明提供了使用本发明的多核苷酸对植物进行基因分型的方法。基因分型提供了区分染色体对的同系物的手段,并且可以用于区分植物种群中的分离子。分子标记方法可以用于系统发生研究,表征作物品种中的亲缘关系,鉴定杂交或体细胞杂种,定位影响单基因性状的染色体区段,定位克隆,和数量遗传研究。参见,例如PELEMAN和VANDERV00RT,(2003)TRENDSINPLANTSCIENCE,VOL8(7):330-334,和HOLLAND(2004)PROCEEDINGSOFTHE4thINTERNATIONALCROPSCIENCECONGRESS26SEP-1Oct2004,BRISBANE,AUSTRALIA。技术,例如但不限于,限制性片段长度多态性(RFLPs)。RFLPs是由核苷酸序列变异性引起的在DNA限制性片段之间的等位基因差异的产物。如本领域技术人员众所周知的,RFLPs通常通过提取基因组DNA并用限制性内切酶进行消化来检测。一般地,所得到的片段根据大小进行分离并与探针杂交;单拷贝探针是合适的。揭示出来自同源染色体的限制性片段。等位基因中片段大小的差异代表了RFLP。因此,本发明进一步提供了手段以通过使用诸如RFLP分析的技术来追踪本发明的基因或核酸,以及与这些基因或核酸遗传连锁的染色体序列的分离。连锁的染色体序列在本发明基因的50厘摩(cM)内,通常在40或30cM内,在某些情况下在20或10cM内,和在某些情况下在5、3、2或1cM内。在本发明中,用于植物核基因组的分子标记作图的核酸探针在选择性杂交条件下与编码本发明多核苷酸的基因选择性杂交。在一些实施方案中,探针选自本发明的多核苷酸。通常,这些探针是cDNA探针或PstI基因组克隆。探针的长度更详细地讨论(同上),但通常长度为至少15个碱基,并且在一些情况下长度为至少20、25、30、35、40或50个碱基。然而,一般地,探针长度少于约1千碱基。在一些实施方案中,探针是与单倍染色体组中的独特基因座杂交的单拷贝探针。RFLP作图中采用的一些示例性限制性内切酶是EcoRI、EcoRV和Sstl。如本文使用的,术语"限制性内切酶"是指识别并且单独或与另一种组合物相结合地在特定核苷酸序列上进行切割的组合物。检测RFLP的方法包括步骤(a)用限制性内切酶消化植物的基因组DNA;(b)在选择性杂交条件下使核酸探针与所述基因组DNA的多核苷酸序列杂交;(c)从其中检测RFLP。区分本发明多核苷酸的多态(等位基因)变体的其他方法可以通过使用本领域技术人员众所周知的分子标记技术来获得,包括诸如下列技术l)单链构象分析(SSCP);2)变性梯度凝胶电泳(DGGE);3)RNA酶保护测定法;4)等位基因特异性寡核苷酸(AS0s);5)使用识别核普酸错配的蛋白质,例如大肠杆菌mutS蛋白;和6)等位基因特异性PCR。基于检测2条互补DNA链之间的错配的其他方法包括夹板变性凝胶电泳(CDGE);异源双链体分析(HA);和化学错配切割(CMC)。示例性多态变体在下表I中提供表I.玉米中的EG307的多态变体<table>tableseeoriginaldocumentpage29</column></row><table>因此,本发明进一步提供了基因分型的方法,包括在严紧杂交条件下使怀疑包含本发明多核苷酸的样品与核酸探针接触的步骤。一般地,所述样品是植物样品;怀疑包括本发明的玉米多核苷酸的样品(例如,基因、mRNA)。所述核酸探针在严紧条件下与包含多态标记的本发明多核苷酸的亚序列(subsequence)选择性杂交。所述核酸探针与多态标记核酸序列的选择性杂交产生杂交复合物。杂交复合物的检测指示出在所述样品中存在那种多态标记。在一些实施方案中,所述核酸探针包含本发明的多核苷酸。对于本领域技术人员来说显而易见的是,通过对这些基因进行测序可以鉴定关于EG307和EG1117的多态变体。对于本领域技术人员清楚的是,通过对更多的玉米品系和杂种,更多的稻品系和杂种,更多的高粱、大麦、小麦品系,粟或甘蔗品系进行测序可以鉴定EG307和EG1117的另外多态变体或等位基因,并且可以进行关联测试以找到与产量性状(例如总产量、粒重、粒长、或其他产量相关性状)或质量性状(例如ASV、白垩、或其他质量性状)的最佳表型相关联的这两个基因中每一个的等位基因。使用这些另外的等位基因的关联测试将指出哪些等位基因与特定性状的所需表型相关联。然后,可以就与产量性状(例如总产量、粒重、粒长、单抹粒数,等)的最佳性能或质量性状(例如ASV或白垩,等)的最佳性能相关联的等位基因(或特征性的所需等位基因的一部分)的存在来篩选有希望的亲本近交系。与产量性状或质量性状的最佳性能相关联的等位基因将是用于达到所需表型的"所需等位基因"。在优选实施方案中,本发明提供了用于鉴定作物种类中EG307或EG1117等位基因的方法;用于测定植物是否包含优选的EG307或EG1117等位基因的方法;以及用于就优选的EG307或EG1117等位基因来筛选植物的方法。EG307和EG1117的等位基因包括,例如SEQIDNO:71;SEQIDNO:72;SEQIDNO:74;SEQIDNO:75;SEQIDNO:41;SEQIDNO:42;SEQIDNO:44;SEQIDNO:45;SEQIDNO:47;SEQIDNO:48;SEQIDNO:50;SEQIDNO:51;SEQIDNO:53;SEQIDNO:54;SEQIDNO:56;SEQIDNO:57;SEQIDNO:59;SEQIDNO:60;SEQIDNO:62;SEQIDNO:63;SEQIDNO:65;SEQIDNO:66;SEQIDNO:68;SEQIDNO:69;SEQIDNO:117;SEQIDNO:119;SEQIDNO:115;SEQIDNO:78;SEQIDNO:79;SEQIDNO:80;SEQIDNO:81;SEQIDNO:82;SEQIDNO:83;SEQIDNO:84;SEQIDNO:85;SEQIDNO:94;SEQIDNO:95;SEQIDNO:97;SEQIDNO:98;SEQIDNO:100;SEQIDNO:101;SEQIDNO:103;SEQIDNO:105;SEQIDNO:107;SEQIDNO:109;SEQIDNO:111;SEQIDNO:113;SEQIDNO:86;SEQIDNO:87jSEQIDNO:88;SEQIDNO:89;SEQIDNO:90;SEQIDNO:91;SEQIDNO:92;SEQIDNO:93;以及与上文列举的多核苷酸具有至少约70%序列同一性的多核普酸。对于用于鉴定EG307或EG1117的其他等位基因的方法,方法在一个步骤中包括使用来自本发明多核苷酸序列的任何序列的至少一部分来扩增一种或多种作物种类植物中的相应EG307或EG1117序列。在另一个步骤中,这些方法包括测定扩增出的序列的核苷酸序列。在另一个步骤中,这些方法包括比较扩增出的序列与本发明的多核普酸序列,以鉴定所测试的作物种类植物中EG307或EG1117的任何等位基因。一般地,这些方法还包括用于鉴定或测定优选等位基因(例如,与所需性状相关联的等位基因)的方法。在一个步骤中,使用来自本发明多核苷酸序列的任何序列的至少一部分来扩增至少两种植物中的相应EG307或EG1117序列,对于所述植物来说已经或可以测量性状的特定参数。此类性状包括例如产量。在另一个步骤中,这些方法包括测定每种植物中的EG307或EG1117序列。在另一个步骤中,这些方法包括鉴定EG307或EG1117的优选等位基因或多核苷酸序列。优选的等位基因可以通过基因分型分析经由测定该等位基因与所需性状的关联来鉴定。此类基因分型分析的例子可以在本文的实施例中找到。一般地,这些方法还包括用于就优选的等位基因或多核苷酸序列来筛选植物的方法。此类方法包括使用优选等位基因(例如与所需性状相关联的等位基因)的至少一部分来扩增植物中的相应EG307或EG111"7序列,并且选择包含所需等位基因(或多核苷酸序列)的那些植物。本发明还提供了产生EG307或EG1117多肽的方法,其包括a)提供用多核苦酸转染的细胞,所述多核苷酸编码EG307或EG1117多肽并被定位于在细胞中进行表达;b)在用于表达所述多核香酸的条件下培养转染的细胞;和c)分离EG307或EG1117多肽。本发明还提供了从重组植物细胞文库中分离产量相关基因的方法。该方法包括提供植物细胞DNA制备物或重组植物细胞文库;在允许检测具有50%或更大序列同一性的基因的杂交条件下,使所述制备物或植物细胞文库与具有可检测标记的EG307或EG1117保守寡核苷酸31(如本文其他地方所述,由本发明的EG307或EG1117多核苷酸序列产生)接触;以及通过其与可检测标记的关联性来分离产量相关基因。本发明还提供了从植物细胞DNA中分离产量相关基因的方法。该方法包括提供植物细胞DNA样品;提供与EG307或EG1117基因寡核苷酸(如本文其他地方所述,由本发明的EG307或EG1117多核苷酸序列产生)的保守区具有序列同源性的寡核苷酸对;在适合于聚合酶链式反应介导的DNA扩增的条件下,将所述寡核苷酸对与植物细胞DNA样品合并;以及分离扩增出的产量相关基因或其片段。通过本文描述的方法鉴定的序列可以用于鉴定试剂,所述试剂可用于使用这些序列来调节驯化生物独特的、增强的或改变的功能能力和/或校正这些能力中的缺陷。这些方法釆用例如本领域已知的篩选技术,例如体外系统、基于细胞的表达系统以及转基因动物和植物。本发明提供的方法不仅快速鉴定进化的基因,而且还指出可以对蛋白质所实施的调整,所述调整可能不是太有毒的,因为它们存在于另一个物种中o本发明还提供了产生EG307或EG1117多肽的方法。步骤包括提供用多核苷酸转染的细胞,所述多核苷酸编码EG307或EG1117多肽并被定位于在细胞中进行表达;和在用于表达所述多核苷酸的条件下培养转染的细胞;以及分离EG307或EG1117多肽。本发明还提供了用于在植物细胞中检测增加产量的基因或基因的增加产量的等位基因变体的方法,其包括下列步骤。步骤包括在允许检测与本发明的EG307或EG1117多核苷酸具有约50%或更大序列同一性的核酸分子序列的杂交条件下,使EG307或EG1117基因或者长度大于12个核苷酸、在某些情况下长度大于30个核苷酸的其部分,与来自所述植物细胞的基因组DNA制备物接触,所述本发明的EG307或EG1117多核苷酸例如为选自下列的多核苷酸SEQIDNO:71;SEQIDNO:72;SEQIDNO:74;SEQIDNO:75;SEQIDNO:41;SEQIDNO:42;SEQIDNO:44;SEQIDNO:45;SEQIDNO:47;SEQIDNO:48;SEQIDNO:50;SEQIDNO:51;SEQIDNO:53;SEQIDNO:54;SEQIDNO:56;SEQIDN0:57;SEQIDNO:59;SEQIDNO:60;SEQIDNO:62;SEQIDNO:63;SEQIDNO:65;SEQIDNO:66;SEQIDNO:68;SEQIDNO:69;SEQIDNO:117;SEQIDNO:119;SEQIDNO:115;SEQIDNO:78;SEQIDNO:79;SEQIDNO:80;SEQIDNO:81;SEQIDNO:82;SEQIDNO:83;SEQIDNO:84;SEQIDNO:85;SEQIDNO:94;SEQIDNO:95;SEQIDNO:97;SEQIDNO:98;SEQIDNO:100;SEQIDNO:101;SEQIDNO:103;SEQIDNO:105;SEQIDNO:107;SEQIDNO:109;SEQIDNO:111;SEQIDNO:113;SEQIDNO:86;SEQIDNO:87;SEQIDNO:88;SEQIDNO:89;SEQIDNO:90;SEQIDNO:91;SEQIDNO:92;SEQIDNO:93;以及与上文列举的多核苷酸具有至少约70%序列同一性的多核苷酸;以及检测杂交,由此可以鉴定出增加产量的基因。本发明还提供了用于在植物细胞中检测增加产量的基因或基因的增加产量的等位基因变体的方法。这种方法包括在允许检测与如本发明其他地方所述的本发明多核苷酸具有约50%或更大序列同一性的核酸分子序列的杂交条件下,使增加产量的基因EG307或EG1117或者长度大于12个核苷酸、在某些情况下长度大于30个核苷酸的这些基因中任一个的一部分,与来自所述植物细胞的基因组DNA制备物接触;以及检测杂交,由此可以鉴定出增加产量的基因或基因的特定的增加产量的等位基因变体。通过本文描述的方法鉴定的序列可以用于鉴定试剂,所述试剂可用于使用这些序列来调节驯化生物独特的、增强的或改变的功能能力和/或校正这些能力中的缺陷。这些方法采用例如本领域已知的筛选技术,例如体外系统、基于细胞的表达系统以及转基因动物和植物。本发明提供的方法不仅快速鉴定进化的基因,而且还指出可以对蛋白质所实施的调整,所述调整可能不是太有毒的,因为它们存在于另一个物种中。在一个实施方案中,本发明包括用于测定植物是否含有包含EG307序列的特定多核苷酸序列的方法。这种方法包括下列步骤。一个步骤包括比较所述植物的编码多肽的核苷酸序列的至少约一部分与本发明的EG307多核苷酸的多核苷酸序列,所述本发明的EG307多核苷酸例如为选自下列的那些U)选自SEQIDN0:71;SEQIDNO:72;SEQIDNO:74;SEQIDNO:75;SEQIDNO:41;SEQIDNO:42;SEQIDNO:44;SEQIDNO:45;SEQIDNO:47;SEQIDNO:48;SEQIDNO:50;SEQIDNO:51;SEQIDNO:53;SEQIDNO:54;SEQIDNO:56;SEQIDNO:57;SEQIDNO:59;SEQIDNO:60;SEQIDNO:62;SEQIDNO:63;SEQIDNO:65;SEQIDNO:66;SEQIDNO:68;SEQIDNO:69;SEQIDNO:117;SEQIDNO:119;SEQIDNO:115;SEQIDNO:78;SEQIDNO:79;SEQIDNO:80;SEQIDNO:81;SEQIDNO:82;SEQIDNO:83;SEQIDNO:84;和SEQIDNO:85的多核苷酸;和(ii)与(i)的多核苷酸具有至少约70%序列同一性并赋予与(i)的多核苷酸基本上相同的产量的多核苷酸。上文列举的多核苷酸之一可以被选择作为所述特定多核苷酸(即,目的多核苷酸,用于测定所述植物是否包含那种多核苷酸或相关多核苷酸)。在另一个步骤中,该方法包括鉴定所述植物是否包含所述特定多核苷酸。优选地,所述植物多核苷酸序列是基因组腿或c腿。在另一个实施方案中,本发明包括用于测定植物是否含有包含EG111序列的特定多核苷酸序列的方法。这种方法包括这一步骤,即比较所述植物的多核苷酸序列的至少约一部分与本发明的EG1117多核苷酸序列,所述本发明的EG1117多核苷酸序列例如为选自下列的多核苷酸(i)选自SEQIDNO:94;SEQIDNO:95;SEQIDNO:97;SEQIDNO:98;SEQIDNO:100;SEQIDNO:101;SEQIDNO:103;SEQIDNO:105;SEQIDNO:107;SEQIDNO:109;SEQIDNO:111;SEQIDNO:113;SEQIDNO:86;SEQIDNO:87;SEQIDNO:88;SEQIDNO:89;SEQIDNO:90;SEQIDNO:91;SEQIDNO:92;和SEQIDNO:93的多核苷酸;和(ii)与(i)的多核普酸具有至少约70%序列同一性并赋予与(i)的多核苷酸基本上相同的产量的多核普酸。上文列举的多核苷酸之一可以被选择作为所述特定多核苷酸(即,目的多核苷酸,用于测定所述植物是否包含那种多核苷酸或相关多核苷酸)。在另一个步骤中,该方法包括鉴定所述植物是否包含所述特定多核苷酸。优选地,所述植物多核苷酸序列是基因组DNA或cDNA。优选地,所述EG307或EG1117多核苷酸序列与植物中增加的产量相关联。测定和定量产量的方法是本领域已知的,并且在本说明书中的其他地方讨论。例如,增加的产量可以是相对于来自共同祖先、属或家族成员植物的第二种植物来说增加的产量,所述第二种植物含有相对于来自所述植物的所述EG307多核苷酸序列而言具有至少一个核苷酸变化的第二种EG307多核苷酸序列。本发明还提供了改变植物种群中籽粒产量基因频率的方法,以及用于标记辅助育种或标记辅助选择的方法,其包括下列步骤。一个步骤包括使用寡核普酸作为标记来筛选多种植物以测定个体植物中籽粒灌浆基因的存在或不存在,所述寡核苷酸由选自下列的核苷酸序列的不超过300个碱基组成SEQIDN0:71;SEQIDNO:72;SEQIDNO:74;SEQIDNO:75;SEQIDNO:41;SEQIDNO:42;SEQIDNO:44;SEQIDNO:45;SEQIDNO:47;SEQIDNO:48;SEQIDNO:50;SEQIDNO:51;SEQIDNO:53;SEQIDNO:54;SEQIDNO:56;SEQIDNO:57;SEQIDNO:59;SEQIDNO:60;SEQIDNO:62;SEQIDNO:63;SEQIDNO:65;SEQIDNO:66;SEQIDNO:68;SEQIDNO:69;SEQIDNO:117;SEQIDNO:119;SEQIDNO:115;SEQIDNO:78;SEQIDNO:79;SEQIDNO:80;SEQIDNO:81;SEQIDNO:82;SEQIDNO:83;SEQIDNO:84;SEQIDNO:85;SEQIDNO:94;SEQIDNO:95;SEQIDNO:97;SEQIDNO:98;SEQIDNO:100;SEQIDNO:101;SEQIDNO:103;SEQIDNO:105;SEQIDNO:107;SEQIDNO:109;SEQIDNO:111;SEQIDNO:113;SEQIDNO:86;SEQIDNO:87;SEQIDNO:88;SEQIDNO:89;SEQIDNO:90;SEQIDNO:91;SEQIDNO:92;SEQIDNO:93,以及与前迷SEQIDNO具有至少约70%序列同一性的多核苷酸。另一个步骤包括基于籽粒产量基因的存在或不存在来选择至少一种个体植物用于育种;并且另一个步骤包括培育如此选择的至少一种植物以产生具有改变的籽粒产量基因频率的植物种群。在一个实施方案中,用于标记辅助育种的方法包括关于特定EG1117多核苷酸序列的植物标记辅助育种方法。这个实施方案包括下列步骤。一个步骤包括对于至少一种植物,比较所述植物的所述核苷酸序列的至少一部分与本发明的特定EG1117多核苷酸序列,例如,选自下列的那些(i)选自SEQIDN0:94;SEQIDNO:95;SEQIDN0:97;SEQIDNO:98;SEQIDNO:100;SEQIDNO:101;SEQIDNO:103;SEQIDNO:105;SEQIDNO:107;SEQIDNO:109;SEQIDNO:111;SEQIDNO:113;SEQIDNO:86;SEQIDNO:87;SEQIDNO:88;SEQIDNO:89;SEQIDNO:90;SEQIDNO:91;SEQIDNO:92;和SEQIDNO:93的多核普酸;和(ii)与(i)的多核苷酸具有至少约70%序列同一性并赋予与(i)的多肽基本上相同的产量的多核苷酸。这种方法还包括鉴定植物是否包含所述特定多核苷酸序列的步骤;以及培育包含所述特定多核苷酸序列的植物以产生子代的步骤。用于标记辅助育种的方法还包括关于特定EG307多核苷酸序列的植物标记辅助育种方法。步骤包括对于至少一种植物,比较所述植物的所述核苷酸序列的至少一部分与本发明的特定EG307,例如,选自下列的多核苷酸序列(i)选自SEQIDNO:71;SEQIDNO:72;SEQIDNO:74;SEQIDNO:75;SEQIDNO:41;SEQIDNO:42;SEQIDNO:44;SEQIDNO:45;SEQIDNO:47;SEQIDNO:48;SEQIDNO:50;SEQIDNO:51;SEQIDNO:53;SEQIDNO:54;SEQIDNO:56;SEQIDNO:57;SEQIDNO:59;SEQIDNO:60;SEQIDNO:62;SEQIDNO:63;SEQIDNO:65;SEQIDNO:66;SEQIDNO:68;SEQIDNO:69;SEQIDNO:117;SEQIDNO:119;SEQIDNO:115;SEQIDNO:78;SEQIDNO:79;SEQIDNO:80;SEQIDNO:81;SEQIDNO:82;SEQIDNO:83;SEQIDNO:84;和SEQIDNO:85的多核苷酸;和(ii)与(i)的多核苷酸具有至少约70%序列同一性并赋予与(i)的多肽基本上相同的产量的多核苦酸;鉴定植物是否包含所述特定多核苷酸序列;以及培育包含所述特定多核苷酸序列的植物以产生子代。这些标记辅助育种方法包括用于选择具有改变的产量的植物例如谷类植物(包括但不限于,玉米、小麦、大麦以及禾本科的其他成员)或豆类植物(例如,大豆)的方法,其包括从待选植物中获得核酸分子,使核酸分子和一种或多种在严紧或高严紧条件下与包含本发明的EG307和EG1117多核苷酸的核酸序列选择性杂交的探针接触;检测所述一种或多种探针与核酸序列的杂交,其中杂交的存在指示出存在与改变的产量相关联的基因;以及基于此类杂交的存在或不存在来选择植物。在一个实施方案中,标记辅助选择在稻中完成。在另一个实施方案中,标记辅助选择使用一种或多种在严紧或高严紧条件下与包含本发明的EG307和EG1117多核苷酸的序列选择性杂交的探针在小麦中完成。在另外一个实施方案中,标记辅助选择使用一种或多种在严紧:择性杂交的探:十在玉蜀黍或玉米中完成。在另外2个实施方』中,标记辅助选择使用一种或多种在严紧或高严紧条件下与包含本发明的EG307和EG1117多核苷酸的序列选择性杂交的探针在高粱中完成。在另外一个实施方案中,标记辅助选择使用一种或多种在严紧或高严紧探针在大麦中完成。在每种情况下,标记辅助选择可以使用针对单一序列或多重序列的一种或多种探针来完成。如果使用多重序列,那么它们可以同时或顺次^f吏用。在用于选择质量性状的育种过程中还可以使用分子标记。例如与等位基因紧密连锁的标记或包含有在实际目的等位基因内的序列的标记可以在回交育种程序中用于选择包含目的等位基因的植物。所述标记还可用于选择回归亲本的基因组以及针对供体亲本的标记。使用这种程序可以最小化在所选植物中残留的来自供体亲本的基因组量。它还可用于减少在回交程序中需要与回归亲本回交的数目。在该选择过程中使用分子标记通常称为遗传标记增强型选择(GeneticMarkerEnhancedSlection)。在另一个实施方案中,本发明包括分离的多核苷酸,其包括下列多核苷酸中的一种或多种SEQIDNO:71;SEQIDNO:72;SEQIDNO:74;SEQIDN0:75;SEQIDNO:41;SEQIDNO:42;SEQIDNO:44;SEQIDNO:45;SEQIDNO:47;SEQIDNO:48;SEQIDNO:50;SEQIDNO:51;SEQIDNO:53;SEQIDNO:54;SEQIDNO:56;SEQIDNO:57;SEQIDNO:59;SEQIDNO:60;SEQIDNO:62;SEQIDNO:63;SEQIDNO:65;SEQIDNO:66;SEQIDNO:68;SEQIDNO:69;SEQIDNO:117;SEQIDNO:119;SEQIDNO:115;SEQIDNO:78;SEQIDNO:79;SEQIDNO:80;SEQIDNO:81;SEQIDNO:82;SEQIDNO:83;SEQIDNO:84;SEQIDNO:85;SEQIDNO:94;SEQIDNO:95;SEQIDNO:97;SEQIDNO:98;SEQIDNO:100;SEQIDNO:101;SEQIDNO:103;SEQIDNO:105;SEQIDNO:107;SEQIDNO:109;SEQIDNO:111;SEQIDNO:113;SEQIDNO:86;SEQIDNO:87;SEQIDNO:88;SEQIDNO:89;SEQIDNO:90;SEQIDNO:91;SEQIDNO:92;SEQIDNO:93;以及与上文列举的(即任何)多核苷酸序列具有至少约70%序列同一性并赋予与上文列举的任何多核苷酸序列基本上相同的产量的多核苷酸序列。本发明的一个实施方案是分离的植物多核苷酸,其在严紧杂交条件下与至少一种下列基因杂交EG307或EG1117基因。此类基因的识别性特征直到此时才进行描述。本发明的多核苷酸可以包括分离的天然植物EG307或EG1117基因或其同系物,后者在下文更详细地描述。本发明的多核苷酸可以包括一个或多个调节区、全长或部分编码区或者其组合。本发明多核苷酸的最小尺寸是可以在严紧杂交条件下与前述基因之一形成稳定杂交物的最小尺寸。合适的植物在下文公开。依照本发明,分离的多核苷酸是已从其天然环境中取出的多核苷酸(即已经历了人为处理)。如此,"分离的"不反映多核苷酸已纯化的程度。分离的多核苷酸可以包括DNA、RNA、或者DNA或RNA的衍生物。本发明的分离的植物EG307或EG1117多核苷酸可以作为完整(全部)基因或能够与那种基因形成稳定杂交物的其部分从其天然来源获得。分离的植物EG307或EG1117多核普酸还可以使用重组DNA技术(例如聚合酶链式反应(PCR)扩增,克隆)或化学合成来产生。分离的植物EG307或EG1117多核苷酸包括天然多核苷酸及其同系物,包括但不限于天然等位基因变体以及其中已插入、缺失、置换和/或倒转了核苷酸的经修饰的多核苷酸,所述插入、缺失、置换和/或倒转以这样的方EG307或EG1117多肽或在严紧条件下与天然基因分离物形成稳定杂交物的能力。一旦已分离所需DNA,就可以通过已知方法对其进行测序。本领域公认的是,此类方法是易于出错的,从而使得相同区域的多次测序是常规的并且仍预期在所得到的推导出的序列中导致可测量的错误率,特别是在具有重复结构域、广泛的二级结构、或罕见碱基组成的区域中,例如具有高GC碱基含量的区域。当出现差异时,可以进行再次测序并且可以釆用特别方法。特别方法可以包括通过^f吏用下列来改变测序条件不同的温度;不同的酶;改变寡核苷酸形成高级结构的能力的蛋白质;改变的核苷酸例如ITP或甲基化的dGTP;不同的凝胶组成,例如添加甲酰胺;不同的引物或位于问题区域不同距离处的引物;或不同的模板例如单链DNAs。还可以釆用mRNA测序。本发明人注意到,SEQIDN0:97(来自两色高粱的EG1117多核苷酸,其最初在USSN60/"6,511中作为SEQIDNO:3公开)被发现有错误并且已校正,从而使得SEQIDN0:97是就本发明人目前所知而言的正确版本。植物EG307或EG1117多核苷酸同系物可以使用本领域技术人员已知的许多方法来产生(参见,例如Sambrook等人,同前)。例如,多核苷酸可以使用各种技术进行修饰,包括但不限于常规诱变技术和重组DNA技术,例如位点定向诱变、多核普酸的化学处理以诱导突变、核酸片段的限制性内切酶切割、核酸片段的连接、聚合酶链式反应(PCR)扩增和/或核酸序列的所选区域的诱变、寡核苷酸混合物的合成以及混合基团的连接以"建立"多核苷酸混合物及其组合。可以通过筛选由所述核酸编码的多肽的功能(例如引发针对EG307或EG1117多肽的至少一个表位的免疫应答的能力,增加包含EG307或EG1117基因的转基因植物产量的能力)和/或通过与EG307或EG1117基因杂交而从修饰的核酸的混合物中选择出多核苷酸同系物。本发明的分离的多核苷酸可以包括编码本发明的至少一种植物EG307或EG1117多肽的核酸序列,此类多肽的例子在本文中>^开。虽然短语"多核苷酸"主要指实体的多核苷酸,并且短语"核酸序列"主要指多核苷酸上的核苷酸的序列,但是这两个短语可以互换使用,特别是关于能够编码EG307或EG1117多肽的多核苷酸或核酸序列而言。如迄今公开的,本发明的植物EG307或EG1117多肽包括但不限于,具有全长植物EG307或EG1117编码区的多肽,具有部分植物EG307或EG1117编码区的多肽,融合多肽,多价保护性多肽及其组合。清的多肽,所述动物已用由其分离出了该多核苷酸的EG307或EG1117多肽进行免疫。当在合适的植物中表达时,本发明的多核苷酸能够增加植物的产量。如下文将更详细地公开的,此类多核苷酸可以是或编码反义RNA、能够形成三股螺旋的分子、核酶或其他基于核酸的化合物。本发明的一个实施方案是在严紧杂交条件下与本发明的EG307或EG1117多核苷酸、或此类EG307或EG1117多核苷酸的同系物、或此类多核苷酸的互补物杂交的植物EG307或EG1117多核苷酸。本发明的任何核酸序列的多核苷酸互补物指与链(对于其而提及该序列)互补(即可以与所述链形成完整的双螺旋)的多核苷酸的核酸序列。应当注意,对于其来说已测定了一条链的核酸序列(由SEQIDNO表示)的本发明双链核酸分子还包括具有为那种SEQIDNO的互补物的序列的互补链。如此,可以是双链或单链的本发明的多核苷酸包括在严紧杂交条件下与本文指明的给定SEQIDNO和/或与本文可能指明或未指明的那种SEQIDNO的互补物形成稳定杂交物的那些多核苷酸。用于推导互补序列的方法是本领域技术人员已知的。在一些实施方案中,EG307或EG1117多核苷酸能够编码植物中天然存在的EG307或EG1117多肽的至少一部分。在一些实施方案下,本发明的EG307或EG1117多核苷酸在严紧杂交条件下与至少一种下列多核苷酸或者此类多核苷酸的同系物或互补物杂交SEQIDN0:71;SEQIDNO:72;SEQIDNO:74;SEQIDNO:75;SEQIDNO:41;SEQIDNO:42;SEQIDNO:44;SEQIDNO:45;SEQIDNO:47;SEQIDNO:48;SEQIDNO:50;SEQIDNO:51;SEQIDNO:53;SEQIDNO:54;SEQIDNO:56;SEQIDNO:57;SEQIDNO:59;SEQIDNO:60;SEQIDNO:62;SEQIDNO:63;SEQIDNO:65;SEQIDNO:66;SEQIDNO:68;SEQIDNO:69;SEQIDNO:117;SEQIDNO:119;SEQIDNO:115;SEQIDNO:78;SEQIDNO:79;SEQIDNO:80;SEQIDNO:81;SEQIDNO:82;SEQIDNO:83;SEQIDNO:84;SEQIDNO:85;SEQIDNO:94;SEQIDNO:95;SEQIDNO:97;SEQIDNO:98;SEQIDNO:100;SEQIDNO:101;SEQIDNO:103;SEQIDNO:105;SEQIDNO:107;SEQIDNO:109;SEQIDNO:111;SEQIDNO:113;SEQIDNO:86;SEQIDNO:87;SEQIDNO:88;SEQIDNO:89;SEQIDNO:90;SEQIDNO:91;SEQIDNO:92;SEQIDNO:93。解允许本领域技术人员,例如(a)制备那些多核苷酸的拷贝,(b)获得包含此类多核苷酸的至少一部分的多核香酸(例如包含全长基因、全长编码区、调节控制序列、截短的编码区的多核苷酸),和(c)获得关于其他植物的EG307或EG1117多核苷酸。此类多核苷酸可以以各种方式获得,包括使用本发明的抗体来筛选合适的表达文库;常规克隆技术,其使用本发明的寡核苷酸探针来筛选合适的文库或DNA;以及使用本发明的寡核苷酸引物的合适文库或DNA的PCR扩增。待筛选的或由其扩增多核苷酸的合适文库包括诸如基因组DNA文库,BAC文库,YAC文库,由分离的植物组织制备的cDNA文库这样的文库,所述植物组织包括但不限于茎、生殖结构/组织、叶、根和分蘖;以及由来自上文列出的任何或所有组织的汇集的cDNAs构建出的文库。在稻和玉米的情况下,可以4吏用从ClemsonUniversity可获得的BAC文库。类似地,待筛选的或由其扩增多核苷酸的DNA来源包括植物基因组DNA。克隆和扩增基因的技术在例如Sambrook等人(同前)中,以及在Galim和Breiman,TRANSGENICPLANTS,ImperialCollegePress,1997中公开。本发明还包括这样的多核苷酸,其是在严紧杂交条件下能够与本发明的其他(有时更长的)多核苷酸(例如包含植物EG307或EG1117基因或其他植物EG307或EG1117多核苷酸的那些)的互补区杂交的寡核苷酸。本发明的寡核苷酸可以是RNA、DNA或二者之一的衍生物。此类寡核苷酸的最小尺寸是在给定寡核苷酸和本发明的另一种多核苷酸上的互补序列之间形成稳定杂交物所需的尺寸。最小尺寸的特征在本文中公开。寡核苷酸的尺寸还必须对于依照本发明来使用所述寡核苷酸来说是足够的。本发明的寡核普酸可以在各种应用中使用,包括但不限于,作为探针以鉴定另外的多核苷酸,作为引物以扩增或延伸多核苷酸,作为用于表达分析的乾,作为用于把向诱变和/或回收的候选物,或在农业应用中用于改变EG307或EG1117多肽产生或活性。此类农业应用包括此类寡核苦酸在例如基于反义、三股螺旋形成、核酶和/或RNA药物的技术中的用途。因此,本发明包括此类寡核普酸和用于通过使用一种或多种此类技术来增强植物的经济生产力的方法。本发明还包括分离的多肽,其包括由下列多核苷酸编码的一种或多种多肽SEQIDN0:71;SEQIDNO:72;SEQIDNO:74;SEQIDNO:75;SEQIDNO:41;SEQIDNO:42;SEQIDNO:44;SEQIDNO:45;SEQIDNO:47;SEQIDNO:48;SEQIDNO:50;SEQIDNO:51;SEQIDNO:53;SEQIDNO:54;SEQIDNO:56;SEQIDNO:57;SEQIDNO:59;SEQIDNO:60;SEQIDNO:62;SEQIDNO:63;SEQIDNO:65;SEQIDNO:66;SEQIDNO:68;SEQIDNO:69;SEQIDNO:117;SEQIDNO:119;SEQIDNO:115;SEQIDNO:94;SEQIDNO:95;SEQIDNO:97;SEQIDNO:98;SEQIDNO:100;SEQIDNO:101;SEQIDNO:103;SEQIDNO:105;SEQIDNO:107;SEQIDNO:109;SEQIDNO:111;SEQIDNO:113,以及由与上文列举的多核苷酸具有至少约70%序列同一性并赋予与上文列举的多核苷酸基本上相同的产量的多核苷酸编码的多肽。本发明的分离的多肽还包括SEQIDN0:73;SEQIDNO:76;SEQIDNO:43;SEQIDNO:46;SEQIDNO:49;SEQIDNO:52;SEQIDNO:55;SEQIDNO:58;SEQIDNO:61;SEQIDNO:64;SEQIDNO:67;SEQIDNO:70;SEQIDNO:118;SEQIDNO:120;SEQIDNO:116;SEQIDNO:96;SEQIDNO:99;SEQIDNO:102;SEQIDNO:104;SEQIDNO:106;SEQIDNO:108;SEQIDNO:110;SEQIDNO:112;SEQIDNO:114;以及与上文列举的任何多肽具有至少约75%序列同一性并赋予与上文列举的任何多肽基本上相同的产量的多肽。根据本发明,分离的或生物学上纯的多肽是已从其天然环境中取出的多肽。如此,"分离的"和"生物学上纯的"不必反映多肽已纯化的程度。本发明的分离的EG307或EG1117多肽可以从其天然来源中获得,可以使用重组DNA技术产生,或可以通过化学合成产生。本发明的EG307或EG1117多肽可以通过其在功能测定法中执行天然EG307或EG1117功能的能力来进行鉴定。"天然的EG307或EG1117多肽"意指全长EG307或EG1117多肽。短语"在功能测定法中能够执行天然EG307或EG1117功能"意指所述多肽在功能测定法中具有至少约10%的天然多肽活性。在其他实施方案中,所述EG307或EG1117多肽在功能测定法中具有至少约20%的天然多肽活性。在其他实施方案中,所述EG307或EG1117多肽在功能测定法中具有至少约30%的天然多肽活性。在其他实施方案中,所述EG307或EG1117多肽在功能测定法中具有至少约40%的天然多肽活性。在其他实施方案中,所述EG307或EG1117多肽在功能测定法中具有至少约50%的天然多肽活性。在其他实施方案中,所述多肽在功能测定法中具有至少约60%的天然多肽活性。在其他实施方案中,所述多肽在功能测定法中具有至少约70%的天然多肽活性。在其他实施方案中,所述多肽在功能测定法中具有至少约80%的天然多肽活性。在其他实施方案中,所述多肽在功能测定法中具有至少约90%的天然多肽活性。功能测定法的例子包括如在本说明书中的其他地方详述的抗体结合测定法或产量增加测定法。如本文使用的,分离的植物EG307或EG1117多肽可以是全长多肽或此类多肽的任何同系物。EG307或EG1117同系物的例子包括其中氨基酸已缺失(例如截短版本的多肽,例如肽)、插入、倒转、置换和/或衍生(例如,通过糖基化、磷酸化、乙酰化、十四烷基化、异戊二烯化、棕榈酰化、酰胺化和/或添加甘油磷脂酰肌醇)的EG307或EG1117多肽,从而使得同系物具有天然的EG307或EG1117活性。在一个实施方案中,当使用本领域技术人员已知的技术将同系物作为免疫原施用给动物时,动物将产生针对EG307或EG1117多肽的至少一个表位的体液和/或细胞免疫应答。还可通过其在功能测定法中执行EG307或EG1117功能的能力来选择EG307或EG1117同系物。突变的结果。本发明的EG307或EG1117多肽同系物还可使用本领域已知的技术来产生,所述技术包括但不限于,直接修饰多肽,或使用例如常规或重组DNA技术修饰编码该多肽的基因以实现随机或靼向诱变。依照本发明,模拟表位(mimetope)指能够模拟本发明的分离的植物EG307或EG1117多肽的能力从而在功能测定法中执行本发明的EG307或EG1117多肽功能的任何化合物。模拟表位的例子包括但不限于,抗独特型抗体或其片段,其包括模拟本发明的分离的多肽的一个或多个表位的至少一个结合位点;分离的多肽的非多肽性质的免疫原性部分(例如碳水化合物结构);以及合成或天然的有机分子,包括核酸,其具有类似于本发明的分离的多肽的至少一个表位的结构。此类模拟表位可以使用计算机产生的本发明多肽的结构来进行设计。模拟表位还可通过下列方式来获得产生分子例如寡核苷酸、肽或其他有机分子的随机样品,并使用相应的结合伙伴通过亲和层析技术来筛选此类样品。本发明的EG307或EG1117多肽同系物的最小尺寸是足以被多核苷酸编码的尺寸,所述多核苦酸能够与编码相应天然多肽的多核苦酸的互补序列形成稳定杂交物。如此,编码此类多肽同系物的多核苷酸的尺寸取决于核酸组成以及多核香酸和互补序列之间的同源性百分比,还取决于杂交条件本身(例如温度、盐浓度和曱酰胺浓度)。还应当注意,形成稳定杂交物所需的同源性程度可以依同源性序列是散布在多核苷酸各处还是群集(即集中)在多核普酸上的不同区域中而变化。如果多核苷酸是富含GC的,那么此类多核苷酸的最小尺寸的长度通常为至少约12-约15个核苷酸,并且如果它们是富含AT的,那么长度为至少约15-约17个碱基。在一些实施方案中,多核苷酸的长度为至少12个碱基。本发明的植物EG307或EG1117多肽是当在植物中表达或调整时能够增加植物产量的化合物。本发明的一个实施方案是融合多肽,其包括附着至融合区段、包含EG307或EG1117多肽的结构域。包括融合区段作为本发明的EG307或EG1117多肽的一部分可以增强多肽在生产、贮存和/或使用过程中的稳定性。取决于区段的特征,融合区段还可充当免疫增强剂以增强疫应答。此外,融合区段可以用作使得纯化EG307或EG1117多肽变得简单的工具,例如使得能够使用亲和层析来纯化所得到的融合多肽。合适的融合区段可以是具有所需功能(例如赋予多肽增加的稳定性、赋予多肽增加的免疫原性,和/或简化多肽的纯化)的任何大小的结构域。一种或多种融合区段的使用在本发明的范围内。融合区段可以连接至多肽的包含EG307或EG1117的结构域的氨基和/或羧基末端。融于切割的,以便使得能够直接回收此类多肽的包含EG307或EG1117的结构域。在一些实施方案中,融合多肽通过培养用融合多核苷酸转染的重组细胞产生,所述融合多核苷酸编码包括附着至包含EG307或EG1117的结构域的羧基和/或氨基末端的融合区段的多肽。在本发明中使用的一些融合区段包括谷胱甘肽结合结构域;金属结合结构域,例如能够结合二价金属离子的聚组氨酸区段;免疫球蛋白结合结构域,例如多肽A、多肽G、T细胞、B细胞、Fc受体或补体多肽的抗体结合结构域;糖结合结构域,例如来自麦芽糖结合多肽的麦芽糖结合结构域;和/或"标签"结构域(例如,p-半乳糖苷酶的至少一部分,链霉标签肽(streptagpeptide),可以通过使用结合该结构域的化合物例如单克隆抗体纯化的其他结构域)。其他融合区段包括金属结合结构域,例如聚组氨酸区段;麦芽糖结合结构域;链霉标签肽。如本文使用的,多核苷酸或多肽的"至少一部分"意指如上所述,具有此类序列的最小尺寸特征的部分,或全长分子的任何更大的片段,直至并且包括全长分子。例如,多核苷酸的一部分可以是12个核苷酸、13个核苷酸、14个核香酸、15个核苷酸等等,直至全长多核苷酸。类似地,多肽的一部分可以是4个氨基酸、5个氨基酸、6个氨基酸、7个氨基酸等等,直至全长多肽。待使用的部分的长度将取决于特定应用。如上文讨论的,可用作杂交探针的多核普酸的一部分可以短至n个核苷酸。可用作表位的多肽的一部分可以短至4个氨基酸。执行全长多肽功能的多肽的一部分一般会长于4个氨基酸。本发明的其他植物EG307或EG1117多肽是下列多肽,包括但不限于编码的多肽、全长多肽、加工的多肽、融合多肽及其多价多肽、以及为包含前述SEQIDN0s的至少一部分的多肽截短同系物的多肽。所提及的本发明序列在表II中讨论。表II显示了序列识别号,基因,它所分离自的物种,序列的描述,它所来源的优先权申请,及其在优先权申请中的原始序列识别号。本申请中所有提及的序列是产量相关基因并且能够改变植物的产量,例如所提及的序列能够增加植物的产量和/或减少植物的产量。用于评估产量的方法在本文的其他地方描述。表II<table>tableseeoriginaldocumentpage46</column></row><table><table>tableseeoriginaldocumentpage47</column></row><table><table>tableseeoriginaldocumentpage48</column></row><table>对于EG307或EG1117,一些重组细胞是植物细胞。"植物细胞"意指经由半透膜束缚并包含质体的任何自身繁殖的细胞。如果希望进一步繁殖,那么此类细胞还需要细胞壁。如本文使用的,植物细胞包括但不限于,藻类、蓝细菌、种子、悬浮培养物、胚、分生组织区、愈伤组织、叶、根、芽、配子体、孢子体、花粉和小孢子。重组细胞和转基因植物的特征以及合适的方法在WO03/062382以及美国专利号6,040,497中描述,二者均整体引入作为参考。例如,基因在玉米中的表达是本领域已知的,并且合适的启动子是已知的且可以由有丰富知识的技术人员进行选择。例如,植物表达载体可以使用已知的玉米表达载体来进行构建,例如可以从RhonePoulencAgrochimie获得的那些。构建表达载体和转化栽体的方法包括标准的体外基因重组和操作。参见,例如Weissbach和Weissbach,1988,MethodsForPlantMolecularBiology,AcademicPress,第26-28章中描述的技术。括但不限于众所周知的来自土壤杆菌的Ti质粒家族及其衍生物,包括整合和双元载体,并且包括但不限于pBIB-KAN、pGA471、pEND4K、pGV38S0和pM0NS0S。还包括DNA和RNA植物病毒,包括但不限于CaMV、双粒病毒、烟草花叶病毒和由此经改造的衍生物,其中任何一种可以有效地充当将编码序列或其功能等价物与相关联的调节元件一起转移到植物细胞的栽体中和/或自主维持转移的序列。另外,转座元件可以为了帮助选择转化体和转染体,转化栽体可以优选是经修饰的以包括报道基因产物或选择标记的编码序列。报道分子或选择标记的此类编码序列应当优选与上述调节元件编码序列可操作地结合。可用于本发明的报道基因包括但不限于'3-葡糖醛酸糖苷酶(GUS)基因(Jefferson等人,Proc.Natl.Acad.Sci.USA,83:8447(1986)),和萤光素酶基因(0w等人,Science234:856(1986))。编码可以用于本发明的选择标记的编码序列包括但不限于编码赋予对于抗生素、抗代谢物或除草剂(包括但不限于卡那霉素、潮霉素、链霉素、草铵膦(phosphinothricin)、庆大霉素、氨甲蝶呤、草甘膦和磺酰脲类除草剂)的抗性的基因产物的那些序列,并且包括但不限于编码酶例如新霉素磷酸转移酶II(NPTII)、氯霉素乙酰转移酶(CAT)和潮霉素磷酸转移酶I(HPT,HYG)的编码序列。各种植物表达系统可以用于表达编码序列或其功能等价物。具体的植物物种可以选自任何双子叶植物、单子叶植物种类、棵子植物、低等维管植物或非维管植物,包括任何谷类作物或其他农业上重要的作物。此类植物包括但不限于,苜蓿、拟南芥、芦夢、小麦、甘蔗、珍珠粟、高粱、大麦、甘蓝、胡萝卜、芽菜、玉米、棉花、黄瓜、亚麻、莴苣、油菜、梨、豌豆、矮牵牛、杨树、马铃薯、稻、甜菜、向日葵、烟草、番茄、小麦和白三叶。通过其可以转化或转染植物的方法是本领域技术人员众所周知的。参见,例如,PlantBiotechnology,1989,Kung和Arntzen,eds.,ButterworthPublishers,ch.1,2。导的叶盘或其他植物组织的转化,将DNA直接显微注射入植物细胞内,将DNA电穿孔入植物细胞原生质体内,脂质体或原生质球融合,微粒轰击,以及使用经适当改造的植物病毒转染植物细胞或组织。实践本见,例如Dixon,1985,PlantCel1Culture:APracticalApproach,IRLPress。可以有效用于实践本发明的那些组织培养操作程序包括产生并培养植物原生质体和细胞悬浮液,在包含转化剂的工程林系(例如土壤杆菌或植物病毒抹系)的培养基上无菌培养繁殖叶盘或其他植物组织,以及由原生质体、细胞悬浮液和愈伤组织再生完整的转化植物。本发明还通过如下方式来实践用包含表达构建体的转化载体转化或转染植物或植物细胞,所述表达构建体包含该序列的编码序列;并选择表达该序列的转化体或转染体。经转化或转染的植物细胞和组织可以通过本领域技术人员众所周知的技术进行选择,包括但不限于检测报道基因产物或基于前述选择标记之一的存在进行选择。随后,经转化或转染的植物细胞和组织生长并由其再生出完整植物。该编码序列在植物基因组中的整合和维持可以通过标准技术来证实,例如通过Southern杂交分析,PCR分析,包括逆转录酶-PCR(RT-PCR),或关于预期蛋白质产物的免疫学测定法。一旦鉴定了此类植物转化体或转染体,本发明的非限制性实施方案就涉及那种转化体或转染体克隆扩充和在序列生产中的使用。可以在表达构建体中使用的调节元件包括可以对于植物细胞来说异源或同源的启动子。启动子可以是植物启动子或非植物启动子,其能够在植物细胞和植物中驱动所连接的序列的高水平转录。可以在实毒(CaMV)19S或35S,rbcS,关于叶绿素a/b结合蛋白的启动子,Adhl、N0S和HMG2,或其修饰或衍生物。启动子可以是组成型或诱导型的。例如,并且不作为限制,诱导型启动子可以是在植物、植物组织或植表达的启动子。此类MGA-诱导型植物启动子的一个非限制性例子是MeGA。表达构建体可以根据本领域技术人员已知的方法另外进行修饰以增强或优化在植物或植物细胞中的异源基因表达。此类修饰包括但不限于突变DNA调节元件以增加启动子强度或改变其本身的编码序列。其他修饰包括删除内含子序列或从编码序列的5'和/或3'末端删除多余的非编码序列,以便最小化与序列或距离相关的对于蛋白质表达的负面影响,例如,通过最小化或消除信使去稳序列(messagedestabilizingsequence)。表达构建体可以根据本领域技术人员已知的方法进一步进行修饰以添加、去除、或以其他方式修饰肽信号序列,从而改变信号肽切割或者增加或改变所表达的多肽经由植物内膜系统的耙向。例如,但不作为限制,表达构建体可以特定地进行改造以将该多肽靶向于分泌、或液泡定位、或保留在内质网(ER)中。本发明还包括能够选择性结合本发明的EG307或EG1117多肽或者其模拟表位的分离的抗体。重组细胞和转基因植物的特征以及合适方法在WO03/062382中描述。本发明还包括植物细胞,其包含编码EG1117或EG307多肽的异源DNA。此类多肽能够改变植物的产量。例如,最优选地,该多肽能够增加植物的产量,并且较不优选地,该多肽能够减少植物的产量。植物细胞包括如本文其他地方描述的本发明的多肽。另外,本发明包括包含上述转基因植物细胞的转基因植物的繁殖材料。本发明还包括包含异源DNA的转基因植物,所述异源DNA编码在植物组织中表达的EG1117或EG307多肽。此类多肽能够改变植物的产量。所述转基因植物包含如本文其他地方描述的本发明的多肽。本发明还包括分离的多核普酸,其包含与编码植物组织中的EG1117或EG307多肽的多核苷酸可操作地连接的启动子。此类多肽能够改变植物的产量。所述转基因植物包含如本文其他地方描述的本发明的多肽。所述多核苷酸可以是重组多核香酸,并且可以包含任何启动子,包括对于EG1117或EG307基因来说天然的启动子。本发明还包括经转染的宿主细胞,包括用构建体转染的宿主细胞,所述构建体包含与编码报道分子蛋白的多核苦酸可操作地连接的来自EG1117或EG307多核苷酸的启动子、增强子或内含子多核苷酸或者其任意组合。此类构建体能够改变植物的产量。经转染的宿主细胞包含如本文其他地方描述的本发明的多肽。本发明还包括重组栽体,其包含至少一种本发明的植物EG307或EG1117多核苷酸,其被插入到能够将所述多核苷酸递送到宿主细胞内的任何载体中。重组分子的特征以及合适的方法在W003/062382中描述。在本发明重组载体中包含的合适的多核苷酸是如本文关于合适的植物EG307或EG1117多核苷酸本身而公开的那些。在本发明的重组载体中(特别是在重组分子中)包含的多核香酸包括本发明的EG307或EG1117多核苷酸。如本文使用的,严紧杂交条件指在其下使用多核苷酸(包括寡核苷酸)来鉴定具有类似核酸序列的分子的标准杂交条件。此类标准条件在例如Sambrook等人,MOLECULARCLONING:ALABORATORYMANUAL,ColdSpringHarborLabsPress,1989中7>开。此类条件的例子在本申请的实施例部分中提供。如本文使用的,玉米EG307或EG1117基因包括与天然的玉米EG307或EG1117基因有关的所有核酸序列,例如控制由那种基因编码的玉米EG307或EG1117多肽的产生的调节区(例如,但不限于,转录、翻译和翻译后控制区)以及其编码区本身。在一个实施方案中,玉米EG307或EG1117基因包含核酸序列SEQIDNO:71;SEQIDNO:72;SEQIDNO:74;SEQIDNO:75;SEQIDNO:41;SEQIDNO:42;SEQIDNO:44;SEQIDNO:45;SEQIDNO:47;SEQIDNO:48;SEQIDNO:50;SEQIDNO:51;SEQIDNO:53;SEQIDNO:54;SEQIDNO:56;SEQIDNO:57;SEQIDNO:59;SEQIDNO:60;SEQIDNO:62;SEQIDNO:63;SEQIDNO:65;SEQIDNO:66;SEQIDNO:68;SEQIDNO:69;SEQIDNO:117;SEQIDNO:119;SEQIDNO:115;SEQIDNO:78;SEQIDNO:79;SEQIDNO:80;SEQIDNO:81;SEQIDNO:82;SEQIDNO:83;SEQIDNO:84;SEQIDNO:85;SEQIDNO:94;SEQIDNO:95;SEQIDNO:97;SEQIDNO:98;SEQIDNO:100;SEQIDNO:101;SEQIDNO:103;SEQIDNO:105;SEQIDNO:107;SEQIDNO:109;SEQIDNO:111;SEQIDNO:113;SEQIDNO:86;SEQIDNO:87;SEQIDNO:88;SEQIDNO:89;SEQIDNO:90;SEQIDNO:91;SEQIDNO:92;SEQIDNO:93(以及本文呈现的所有其他序列)。在另一个实施方案中,玉米EG307或EG1117基因可以是等位基因变体,所述等位基因变体包含与本发明的EG307或EG1117相似但不相同的序列,是其活性涉及相同生物化学或发育过程的在基因组中的基因座,和/或出现在与包括本发明EG307或EG1117基因的基因基本上相同的基因座上、但由于例如突变或重组引起的天然变异而具有相似但不相同的序列的基因。因为基因组可以经历重排,所以等位基因的物理排列不一定相同。等位基因变体通常编码这样的多肽,即所述多肽具有与由和它们进行比较的基因所编码的多肽类似的活性。等位基因变体还可包括基因的5'或3'非翻译区中(例如在调节控制区中)的改变。等位基因变体是本领域技术人员众所周知的,并且将预期可在基因组是多倍体的给定栽培种或品系内和/或在包括两种或更多种栽培种或品系的种群中发现。等位基因可以定义为与第二种EG1117或EG307多核苷酸序列相比较具有至少一个核苷酸变化的EG1117或EG307多核苷酸序列。如此,用于编码本发明的EG307或EG1117多肽同系物的多核苷酸的最小尺寸的长度为约12-约18个核苷酸。除了实践限制外,对此类多核苷酸的最大尺寸没有限制,因为所述多核苷酸可以包括基因的一部分、完整基因或多基因,或其部分。类似地,本发明的EG307或EG1117多肽同系物的最小尺寸的长度为约4-约6个氨基酸,所需尺寸取决于是否需要此类多肽的全长、融合、多价或功能部分。在一些实施方案中,多肽的长度为至少30个氨基酸。如本文使用的,EG307或EG1117基因包括与天然的EG307或EG1117基因有关的所有核酸序列,例如控制由那种基因编码的EG307或EG1117多肽的产生的调节区(例如,但不限于,转录、翻译和翻译后控制区)以及其编码区本身。在一个实施方案中,EG307或EG1117基因包含本发明的EG307或EG1117多核香酸。在另一个实施方案中,玉米EG307或EG1117基因可以是等位基因变体,其包含与本发明的EG307或EG1117多核苷酸相似但不相同的序列。如本文使用的,EG307或EG1117基因包括与天然的EG307或EG1117基因有关的所有核酸序列,例如控制由那种基因编码的EG307或EG1117多肽的产生的调节区(例如,但不限于,转录、翻译和翻译后控制区)以及其编码区本身。EG307或EG1117基因优选地可以包含本发明的EG307或EG1117多核苷酸。本发明的另外目的、优点和新型特征在检查下列其实施例后对于本领域技术人员将是显而易见的,所述实施例不希望是限制性的。实施例1.产量候选基因的确认性验证关联分析如W003/062382的实施例17中描述的,关联分析涉及对在大量充分表征的稻品系中的每种候选基因进行测序以弄清所述基因是否与已知性状相关联。除了如实施例17中所述进行分析的稻品系外,还就EG307和EG1117等位基因来分析44个充分表征的稻品系(参见表1)。如先前发现的,对于每个EG307和EG1117的衍生的、正选择的等位基因与这44个稻品系中的较高粒重相关。使用关于关联的卡方检验,我们发现等位基因(基因型)和表型之间的关联是显著的,采用2个自由度,尸<0.0001。由下表观察到的模式显示,EG307的确影响产量,即,是在植物中能够增加产量的产量相关基因。表III.通过粒重分选的稻登记物(accession)的基因分型<table>tableseeoriginaldocumentpage55</column></row><table><table>tableseeoriginaldocumentpage56</column></row><table>307A=EG307祖先等位基因;307D=EG307衍生的(适应的)等位基因1117A=EG1117祖先等位基因;1117D=EG1117衍生的(适应的)等位基表iv.千粒重对等位基因类型(数据来自表ni)<table>tableseeoriginaldocumentpage57</column></row><table>等位基因类型表v.对于品系效应进行校正的单因子加合性模型,其显示出EG307或EGlin的等位基因对于表型性状的影响(〉1SD或〈-1SD表明主基因效应)因<image>imageseeoriginaldocumentpage58</image>表IV显示了表III中的数据的图,其显示出与EG307或EG1117的祖先的(方块)或衍生的(三角形)等位基因相关的粒重范围。在表V中,将表型数据转化为Z得分,其是表示性状受特定基因型影响的程度的值。Z得分表明性状以什么程度以及哪个方向偏离性状分布的平均值,其以性状分布的标准差(SD)的单位表示。大于1SD的Z得分表明等位基因和性状的效应。Z得分越大,效应越大。关于产量的Z得分是4SD,这是非常显著的效应。随后使用更高通量的方法对另外104个充分表征的稻品系和杂种进行基因分型。对于每个EG307和EG1117的祖先等位基因可以通过检查几个关键位置上的核苷酸而与衍生的(适应的)等位基因区分开。因此,我们并不通过对整个编码序列进行测序来进行基因分型,而是通过分析在几个关键位置上存在的核苷酸来进行基因分型。设计可以产生在待分析位置周围的小(不大于200bp的产物,优选100-150bp)PCR产物的引物。接下来,设计可以跨越该位置的探针,使待分析的位置尽可能靠近探针中心。探针尽可能短,但不短于12bps。此外,这样设计探针,从而使得它们具有在65-67。C范围内的解链温度(Tm)。对于每组引物设计两种探针,其中对于每个待分析的位置采用一种。使用ABIMGB淬灭技术,对于探针可以使用比对于实际PCR产物自身所使用的Tms更高的Tms。合成掺入不同荧光标记(VIC或FAM)的每种探针。制备包括一组正向和反向引物以及两种探针的引物/探针混合物(参见表2)。根据制造商关于基因分型的方案来使用BiotageRotor-Gene3000RTPCR系统。对于关于祖先或衍生的等位基因来说纯合的品系或杂种,只有对相应于祖先或衍生的等位基因的核苷酸来说特异的探针才会附着至在热循环反应中制备的产物,并从而发焚光。当二者都存在时(如在杂合子中),在PCR反应中可见两种荧光染料。表VI.稻基因分型引物和探针EG307位置6232041-(76-77)正向引物CGAAATGATGGTGAGAACAGCAT(SEQIDNo.78)反向引物TCGACTCTTGGCATGAC1111G(SEQIDNo.79)探针CAGTACCGAAACAA(SEQIDNo.80)CAGTACT"GAAACAAGG(SEQIDNo.81)EG307位置3292014-(74-75)正向引物GGAACCTGGTGAGCAATTGG(SEQIDNo.82)反向引物GGACTGGGTAACACAACCTTTCTT(SEQIDNo.83)探针CAGACAGrGCATGGC(SEQIDNo.84)CAGACAG月GCATGGC(SEQIDNo.85)EG1117位置22014-(72-73)正向引物TGTCATCAGTGTCATCATCTGGATT(SEQIDNo.86)反向引物CCCTTCCAGTGAACTTTCTAGCTATT(SEQIDNo.87)探针CCGTTTTATG/ICCGTGTG(SEQiDNo,88)CCGTTTTATGGCCGTGTG(SEQIDNo.89)EG1117位置12012-93正向引物CCATTTGGGCCACTACTATTA(SEQIDNo.90)反向引物TCATTGTCCCTCCTGCATCC(SEQIDNo.91)探针ATGCTCACAACTCT(SEQIDNo.92)ATGCTCAGAACTCTT(SEQIDNo.93)使用对于品系效应而进行校正的单因子加合性统计模型,我们分析了基因型的影响(对于每个EG307和EG1117的纯合祖先或纯合衍生的等位基因)。6个估计量大于1个标准差(主基因效应),以降序对下列具有最显著的效应产量、植物高度、未加工粒重(sdwtl000-未加工的)、脱壳粒重(sdwt1000-脱壳的)、宽度和ASV(参见图2)。较不显著的估计的正效应是对于倒伏、淀粉酶和长度。关于两种基因的衍生等位基因,对于白垩性状存在一个主要的估计的负效应。白垩一般是稻的不合需要的特征,尽管它在某些专门类型的稻中可以是需要的。白垩起因于畸形淀粉颗粒的形成,所述畸形淀粉颗粒与正确形状的淀粉颗粒相比不同地进行填塞,在它们之中留下空气隙。EG307和EG1117的驯化的(衍生的)等位基因与较少的白垩相关。我们随后计算了R2,其为由对于品系效应而进行校正的单因子加合性模型所解释的变异比例。对于主要正效应,R2对于产量为47。/。,对于高度为35%,对于脱壳粒重为35%,对于宽度为18%,对于ASV(碱消值(alkalinespreadingvalue),当与淀粉酶%组合时产生淀粉指数)为15%,对于未加工粒重为11%,和对于白垩为19%。实施例2.鉴定在小麦、大麦、高粱和甘蔗中的EG307和EG1117使用稻EG1117序列通过BLAST在GenBank中搜索小麦、大麦、高粱和甘蔗基因组序列,鉴定了看起来是同源的至少4个小麦ESTs(包括登录号CK203588、CK203242、BE444456和BJ481258)、几个大麦ESTs(包括登录号BJ478960和BJ481259)、4个高粱ESTs(包括登录号CA200440、BG948036、BG947743和BM327663)和5个甘蔗ESTs(包括登录号CA284889、CA102585、CA200440、CA218123和CA106550)。通过标准方法设计允许成功扩增小麦、大麦、高粱和甘蔗同系物的引物。小麦、大麦、高粱和甘蔗同系物的序列在本文中提供。现代面包小麦是六倍体,由3个基因组组成,因此我们预期看到3个拷贝的EG1117和EG307。在EG1117的情况下,我们已知存在至少3个表达的拷贝。使用稻EG307序列通过BLAST在GenBank中搜索小麦和大麦基因组序列,鉴定了看起来是同源的许多小麦ESTs(包括登录号CD898159、BE496848、BF484251、CA595746、CA730688和CV772418)以及9个大麦ESTs(包括登录号BI958390、CA026456、BQ467189、CA002341、BE558500、BQ466901、BU996029、CAOl術l、CB867549)。通过标准方法设计允许成功扩增小麦和大麦同系物的引物。序列在本文中提供。实施例3.在玉米中的关联分析使用来自稻和玉米ESTs的序列数据,设计引物并在祖先玉米(假蜀黍)、3个玉米地方品种和6个商购可得的原种杂种中PCR扩增EG307和EG1117。发现EG307等位基因群集为2组。包括等位基因A(SEQIDNO:71)和等位基因B(SEQIDNO:74)的一组紧密相关的等位基因只在所述6个原种杂种中发现。包括等位基因I(SEQIDNO:41)、等位基因II(SEQIDNO:44)、等位基因III(SEQIDNO:47)、等位基因IV(SEQIDNO:50)、等位基因V(SEQIDNO:53)、等位基因VI(SEQIDNO:56)、等位基因VII(SEQIDNO:59)、等位基因VIII(SEQIDNO:62)、等位基因IX(SEQIDNO:65)和等位基因X(SEQIDNO:68)的另一组紧密相关的等位基因只在产量较少的祖先玉米或地方品种中发现。注意到许多序列例如ESTs存在于公共结构域中。一些ESTs在与本发明的多核苷酸重叠的区域中可以具有与本文公开的多核苷酸高度同一的区域。换言之,在本发明的多核苷酸和公共结构域中的序列例如EST之间可能潜在地存在同一性较低的区域,其中该序列或EST不与本发明的多核苷酸重叠,以及同一性较高的区域,其中那种EST与本发明的多核苷酸重叠。同一性较低的区域可以由本发明人指定,这些区域将包括与公共结构域中的序列或EST没有重叠的所提及的SEQIDNO:的区域,并且同一性较低的这些区域将与本文所提及的SEQIDNO:具有至少约50%、至少约55%、至少约58%、至少约60%、至少约61%、至少约62%、至少约63%、至少约64%、至少约65%、至少约66%、至少约67%、至少约68%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%的同一性百分比。这些区域可以通过调出其在SEQIDNO:中的位置来分别要求,例如,区域可以如下进行鉴定SEQIDNO:105的核苷酸1-144。实施例4.使用基因型作为用于标记辅助选择或标记辅助育种的标记在使用地方品种品系进行杂交以试图使原种杂种达到更好的抗旱性或抗虫性但不损失产量之中,筛选来自此类杂交的幼苗并且只选择包含最佳EG307或EG1117等位基因的那些幼苗。在产量较低的近交系和产量较高的近交系的杂交中,筛选来自此类杂交的幼苗并且只选择包含最佳EG307或EG1117等位基因的那些幼苗。为了举例说明和描述的目的已给出了本发明的前述讨论。前述不希望将本发明限制于本文公开的形式。尽管本发明的描述已包括一个或多个实施方案以及某些变化和修改的描述,但其他变化和修改也在本发明的范围内,例如,在理解本公开内容后,这可能在本领域技术人员的能力和知识范围内。希望获得包括备选实施方案至允许的程度的权利,包括对于所要求的那些来说备选的、可互换的和/或等价的结构、功能、范围或步骤,无论此类备选的、可互换的和/或等价的结构、功能、范围或步骤是否在本文中公开,并且不希望公开地奉献任何可授予专利的主题。权利要求1.用于鉴定与植物中的产量相关的多核苷酸序列的方法,其包括步骤a)比较植物多核苷酸序列的至少一部分与选自EG1117多核苷酸序列和EG307多核苷酸序列的至少一种多核苷酸;和b)鉴定植物中与选自EG1117多核苷酸序列和EG307多核苷酸序列的多核苷酸相比较包含至少一个核苷酸变化的至少一种多核苷酸序列,其中所述鉴定的多核苷酸序列与植物中的产量相关联。2.权利要求l的方法,其中所述多核苷酸序列选自a)SEQIDNO:71;SEQIDNO:72;SEQIDNO:74;SEQIDNO:75;SEQIDNO:41;SEQIDNO:42;SEQIDNO:44;SEQIDNO:45;SEQIDNO:47;SEQIDNO:48;SEQIDNO:50;SEQIDNO:51;SEQIDNO:53;SEQIDNO:54;SEQIDNO:56;SEQIDNO:57;SEQIDNO:59;SEQIDNO:60;SEQIDNO:62;SEQIDNO:63;SEQIDNO:65;SEQIDNO:66;SEQIDNO:68;SEQIDNO:69;SEQIDNO:117;SEQIDNO:119;SEQIDNO:115;SEQIDNO:78;SEQIDNO:79;SEQIDNO:80;SEQIDNO:81;SEQIDNO:82;SEQIDNO:83;SEQIDNO:84;SEQIDNO:85;SEQIDNO:94;SEQIDNO:95;SEQIDNO:97;SEQIDNO:98;SEQIDNO:100;SEQIDNO:101;SEQIDNO:103;SEQIDNO:105;SEQIDNO:107;SEQIDNO:109;SEQIDNO:111;SEQIDNO:113;SEQIDNO:86;SEQIDNO:87;SEQIDNO:88;SEQIDNO:89;SEQIDNO:90;SEQIDNO:91;SEQIDNO:92;SEQIDNO:93;和b)与a)中的多核苷酸具有至少约70%序列同一性的多核苷酸。3.权利要求1的方法,其中所述植物多核苷酸序列是基因组DNA。4.权利要求l的方法,其中所述植物多核苷酸序列是cDNA。5.权利要求l的方法,其中所述EG307或EG1117多核苷酸序列与植物中增加的产量相关联。6.权利要求5的方法,其中增加的产量是相对于来自相同属的第二种植物来说增加的产量,所述第二种植物含有相对于来自所述植物的所述EG307或EG1117多核苷酸序列而言具有至少一个核苷酸变化的第二种EG307或EG1117多核苷酸序列。7.权利要求l的方法,其中所述植物选自玉蜀黍、水稻、小麦、大麦、甘蔗、两色高粱和珍珠粟。8.权利要求1的方法,其中所述植物选自驯化植物的野生祖先植物,所述驯化植物选自玉蜀黍、水稻、小麦、大麦、甘蔗、两色高粱和珍珠粟。9.权利要求8的方法,其中所述植物是野生稻或假蜀黍。10.分离的多核苷酸,其选自a)选自SEQIDNO:71;SEQIDNO:72;SEQIDNO:74;SEQIDNO:75;SEQIDNO:41;SEQIDNO:42;SEQIDNO:44;SEQIDNO:45;SEQIDNO:47;SEQIDNO:48;SEQIDNO:50;SEQIDNO:51;SEQIDNO:53;SEQIDNO:54;SEQIDNO:56;SEQIDNO:57;SEQIDNO:59;SEQIDNO:60;SEQIDNO:62;SEQIDNO:63;SEQIDNO:65;SEQIDNO:66;SEQIDNO:68;SEQIDNO:69;SEQIDNO:117;SEQIDNO:119;SEQIDNO:115;SEQIDNO:78;SEQIDNO:79;SEQIDNO:80;SEQIDNO:81;SEQIDNO:82;SEQIDNO:83;SEQIDNO:84;SEQIDNO:85;SEQIDNO:94;SEQIDNO:95;SEQIDNO:97;SEQIDNO:98;SEQIDNO:100;SEQIDNO:101;SEQIDNO:103;SEQIDNO:105;SEQIDNO:107;SEQIDNO:109;SEQIDNO:111;SEQIDNO:113;SEQIDNO:86;SEQIDNO:87;SEQIDNO:88;SEQIDNO:89;SEQIDNO:90;SEQIDNO:91;SEQIDNO:92;SEQIDNO:93的多核苦酸;和b)与a)的多核苷酸具有至少约70%同源性并赋予与a)的多核苷酸基本上相同的产量的多核普酸。11.分离的多肽,其选自a)由选自SEQIDNO:71;SEQIDNO:72;SEQIDNO:74;SEQIDNO:75;SEQIDNO:41;SEQIDNO:42;SEQIDNO:44;SEQIDNO:45;SEQIDNO:47;SEQIDNO:48;SEQIDNO:50;SEQIDNO:51;SEQIDNO:53;SEQIDNO:54;SEQIDNO:56;SEQIDNO:57;SEQIDNO:59;SEQIDNO:60;SEQIDNO:62;SEQIDNO:63;SEQIDNO:65;SEQIDNO:66;SEQIDNO:68;SEQIDNO:69;SEQIDNO:117;SEQIDNO:119;SEQIDNO:115;SEQIDNO:94;SEQIDNO:95;SEQIDNO:97;SEQIDNO:98;SEQIDNO:100;SEQIDNO:101;SEQIDNO:103;SEQIDNO:105;SEQIDNO:107;SEQIDNO:109;SEQIDNO:111;和SEQIDNO:113的多核苷酸编码的多肽;b)由与a)中的多核苷酸具有至少约70%序列同一性并赋予与a)的多核苷酸基本上相同的产量的多核苷酸编码的多肽;c)包含SEQIDNO:73;SEQIDNO:76;SEQIDNO:43;SEQIDNO:46;SEQIDNO:49;SEQIDNO:52;SEQIDNO:55;SEQIDNO:58;SEQIDNO:61;SEQIDNO:64;SEQIDNO:67;SEQIDNO:70;SEQIDNO:118;SEQIDNO:120;SEQIDNO:116;SEQIDNO:96;SEQIDNO:99;SEQIDNO:102;SEQIDNO:104;SEQIDNO:106;SEQIDNO:108;SEQIDNO:110;SEQIDNO:112;和SEQIDN0:114的多肽;和d)与c)的多肽具有至少约75%序列同一性并赋予与c)的多肽基本上相同的产量的多肽。12.植物细胞,其包含编码EG1117或EG307多肽的异源DNA,其中所述多肽能够增加植物的产量,其中所述多肽选自a)由选自SEQIDNO:71;SEQIDNO:72;SEQIDNO:74;SEQIDNO:75;SEQIDNO:41;SEQIDNO:42;SEQIDNO:44;SEQIDNO:45;SEQIDNO:47;SEQIDNO:48;SEQIDNO:50;SEQIDNO:51;SEQIDNO:53;SEQIDNO:54;SEQIDNO:56;SEQIDNO:57;SEQIDNO:59;SEQIDNO:60;SEQIDNO:62;SEQIDNO:63;SEQIDNO:65;SEQIDNO:66;SEQIDNO:68;SEQIDNO:69;SEQIDNO:117;SEQIDNO:119;SEQIDNO:115;SEQIDNO:94;SEQIDNO:95;SEQIDNO:97;SEQIDNO:98;SEQIDNO:100;SEQIDNO:101;SEQIDNO:103;SEQIDNO:105;SEQIDNO:107;SEQIDNO:109;SEQIDNO:111;和SEQIDNO:113的多核苷酸编码的多肽;b)由与a)中的多核苷酸具有至少约70%序列同一性的多核苷酸编码的多肽;c)包含SEQIDNO:73;SEQIDNO:76;SEQIDNO:43;SEQIDNO:46;SEQIDNO:49;SEQIDNO:52;SEQIDNO:55;SEQIDNO:58;SEQIDNO:61;SEQIDNO:64;SEQIDNO:67;SEQIDNO:70;SEQIDNO:118;SEQIDNO:120;SEQIDNO:116;SEQIDNO:96;SEQIDNO:99;SEQIDNO:102;SEQIDNO:104;SEQIDNO:106;SEQIDNO:108;SEQIDNO:110;SEQIDNO:112;和SEQIDN0:114的多肽;和d)与c)的多肽具有至少约75%序列同一性的多肽。13.转基因植物的繁殖材料,其包括权利要求12的转基因植物细胞。14.转基因植物,其包含编码在植物组织中表达的EG1117或EG307多肽的异源DNA,其中所述多肽能够增加所述植物的产量,其中所述多肽选自a)由选自SEQIDNO:71;SEQIDNO:72;SEQIDNO:74;SEQIDNO:75;SEQIDNO:41;SEQIDNO:42;SEQIDNO:44;SEQIDNO:45;SEQIDNO:47;SEQIDNO:48;SEQIDNO:50;SEQIDNO:51;SEQIDNO:53;SEQIDNO:54;SEQIDNO:56;SEQIDNO:57;SEQIDNO:59;SEQIDNO:60;SEQIDNO:62;SEQIDNO:63;SEQIDNO:65;SEQIDNO:66;SEQIDNO:68;SEQIDNO:69;SEQIDNO:117;SEQIDNO:119;SEQIDNO:115;SEQIDNO:94;SEQIDNO:95;SEQIDNO:97;SEQIDNO:98;SEQIDNO:100;SEQIDNO:101;SEQIDNO:103;SEQIDNO:105;SEQIDNO:107;SEQIDNO:109;SEQIDNO:111;和SEQIDNO:113的多核苷酸编码的多肽;b)由与a)中的多核苷酸具有至少约70%序列同一性的多核苷酸编码的多肽;c)包含SEQIDNO:73;SEQIDNO:76;SEQIDNO:43;SEQIDNO:46;SEQIDNO:49;SEQIDNO:52;SEQIDNO:55;SEQIDNO:58;SEQIDNO:61;SEQIDNO:64;SEQIDNO:67;SEQIDNO:70;SEQIDNO:118;SEQIDNO:120;SEQIDN0:116;SEQIDNO:96;SEQIDNO:99;SEQIDNO:102;SEQIDNO:104;SEQIDNO:106;SEQIDNO:108;SEQIDNO:110;SEQIDNO:112;和SEQIDN0:114的多肽;和d)与c)的多肽具有至少约75%序列同一性并赋予与c)的多肽基本上相同的产量的多肽。15.分离的多核苷酸,其包含与编码植物组织中的EG1117或EG307基因的多核苷酸可操作地连接的启动子,其中所述多核苷酸能够增加植物的产量,其中所述多核苷酸选自a)选自SEQIDNO:71;SEQIDNO:72;SEQIDNO:74;SEQIDNO:75;SEQIDNO:41;SEQIDNO:42;SEQIDNO:44;SEQIDNO:45;SEQIDNO:47;SEQIDNO:48;SEQIDNO:50;SEQIDNO:51;SEQIDNO:53;SEQIDNO:54;SEQIDNO:56;SEQIDNO:57;SEQIDNO:59;SEQIDNO:60;SEQIDNO:62;SEQIDNO:63;SEQIDNO:65;SEQIDNO:66;SEQIDNO:68;SEQIDNO:69;SEQIDNO:117;SEQIDNO:119;SEQIDNO:115;SEQIDNO:94;SEQIDNO:95;SEQIDNO:97;SEQIDNO:98;SEQIDNO:100;SEQIDNO:101;SEQIDNO:103;SEQIDNO:105;SEQIDNO:107;SEQIDNO:109;SEQIDNO:111;和SEQIDNO:113的多核苷酸;和b)与a)中的多核苷酸具有至少约70%序列同一性的多核苷酸。16.权利要求15的分离的多核苷酸,其中所述多核苷酸是重組多核苷酸。17.权利要求16的多核苷酸,其中所述启动子是对于EG1117或EG307基因来说天然的启动子。18.转染的宿主细胞,其包括用构建体转染的宿主细胞,所述构建体包含与编码报道分子蛋白的多核苷酸可操作地连接的来自EG1117或EG307多核苷酸的启动子、增强子或内含子多核苷酸或者其任意组合,其中所述EG1117或EG307多核苷酸能够增加植物的产量,其中所述EG1117或EG307多核苦酸选自a)选自SEQIDNO:71;SEQIDNO:72;SEQIDNO:74;SEQIDNO:75;SEQIDNO:41;SEQIDNO:42;SEQIDNO:44;SEQIDNO:45;SEQIDNO:47;SEQIDNO:48;SEQIDNO:50;SEQIDNO:51;SEQIDNO:53;SEQIDNO:54;SEQIDNO:56;SEQIDNO:57;SEQIDNO:59;SEQIDNO:60;SEQIDNO:62;SEQIDNO:63;SEQIDNO:65;SEQIDNO:66;SEQIDNO:68;SEQIDNO:69;SEQIDNO:117;SEQIDNO:119;SEQIDNO:115;SEQIDNO:94;SEQIDNO:95;SEQIDNO:97;SEQIDNO:98;SEQIDNO:100;SEQIDNO:101;SEQIDNO:103;SEQIDNO:105;SEQIDNO:107;SEQIDNO:109;SEQIDNO:111;和SEQIDNO:113的多核苷酸;b)与a)中的多核苷酸具有至少约70%序列同一性的多核苷酸。19.用于测定植物是否含有包含EG1117序列的特定多核苷酸序列的方法,其包括步骤a)比较所述植物的所述多核香酸序列的至少约一部分与选自下列的多核苷酸序列(i)选自SEQIDNO:94;SEQIDNO:95;SEQIDNO:97;SEQIDNO:98;SEQIDNO:100;SEQIDNO:101;SEQIDNO:103;SEQIDNO:105;SEQIDNO:107;SEQIDNO:109;SEQIDNO:111;SEQIDNO:113;SEQIDNO:86;SEQIDNO:87;SEQIDNO:88;SEQIDNO:89;SEQIDNO:90;SEQIDNO:91;SEQIDNO:92;和SEQIDNO:93的多核普酸;和(ii)与(i)的多核普酸具有至少约70%序列同一性并赋予与(i)的多核苷酸基本上相同的产量的多核苷酸,其中一种或多种a)的多核苷酸是所述特定多核苷酸;和b)鉴定所述植物是否含有所述特定多核苷酸。20.权利要求19的方法,其中所述植物多核苷酸序列是基因组DNA。21.权利要求19的方法,其中所述植物多核苷酸序列是cDNA。22.权利要求19的方法,其中所述EG1117多核苷酸序列与植物中增加的产量相关联。23.权利要求22的方法,其中增加的产量是相对于来自相同属的第二种植物来说增加的产量,所述第二种植物含有相对于来自所述植物的所述EG1117多核苷酸序列而言具有至少一个核苷酸变化的第二种EG1117多核苷酸序列。24.权利要求22的方法,其中所述植物选自玉蜀黍、水稻、小麦、大麦、甘蔗、两色高粱和珍珠粟。25.权利要求23的方法,其中所述第二种植物选自驯化植物的野生祖先植物,所述驯化植物选自玉蜀黍、水稻、小麦、大麦、甘蔗、两色高粱和珍珠粟。26.用于测定植物是否含有包含EG307序列的特定多核苷酸序列的方法,其包括步骤a)比较所述植物的编码多肽的核苷酸序列的至少约一部分与选自下列的多核苷酸序列(i)选自SEQIDN0:71;SEQIDNO:72;SEQIDNO:74;SEQIDNO:75;SEQIDNO:41;SEQIDNO:42;SEQIDNO:44;SEQIDNO:45;SEQIDNO:47;SEQIDNO:48;SEQIDNO:50;SEQIDNO:51;SEQIDNO:53;SEQIDNO:54;SEQIDNO:56;SEQIDNO:57;SEQIDNO:59;SEQIDNO:60;SEQIDNO:62;SEQIDNO:63;SEQIDNO:65;SEQIDNO:66;SEQIDNO:68;SEQIDNO:69;SEQIDNO:117;SEQIDNO:1195SEQIDN0:115^SEQ訓0:78;SEQIDNO:79;SEQIDNO:80;SEQIDNO:81;SEQIDNO:82;SEQIDNO:83;SEQIDNO:84;和SEQIDNO:85的多核苷酸;和(ii)与(i)的多核苷酸具有至少约70%序列同一性并赋予与U)的多核苷酸基本上相同的产量的多核苷酸,其中一种或多种a)的多核苷酸是所述特定多核苷酸;和b)鉴定所述植物是否含有所述特定多核苷酸。27.权利要求26的方法,其中所述植物多核苷酸序列是基因组腿。28.权利要求26的方法,其中所述植物多核苷酸序列是cDNA。29.权利要求26的方法,其中所述EG307多核苷酸序列与植物中增加的产量相关联。30.权利要求29的方法,其中增加的产量是相对于来自相同属的第二种植物来说增加的产量,所述第二种植物含有相对于来自所述植物的所述EG307多核苷酸序列而言具有至少一个核苷酸变化的第二种EG307多核苷酸序列。31.权利要求26的方法,其中所述植物选自玉蜀黍、水稻、小麦、大麦、甘蔗、两色高粱和珍珠栗。32.权利要求31的方法,其中所述第二种植物选自驯化植物的野生祖先植物,所述驯化植物选自玉蜀黍、水稻、小麦、大麦、甘蔗、两色高粱和珍珠粟。33.关于特定EG1117多核苷酸序列而言植物的标记辅助育种方法,其包括步骤a)对于至少一种植物比较所述植物的所述核苷酸序列的至少一部分与选自下列的特定EG1117多核苷酸序列(i)选自SEQIDNO:94;SEQIDNO:95;SEQIDNO:97;SEQIDNO:98;SEQIDNO:100;SEQIDNO:101;SEQIDNO:103;SEQIDNO:105;SEQIDNO:107;SEQIDNO:109;SEQIDNO:111;SEQIDNO:113;SEQIDNO:86;SEQIDNO:87;SEQIDNO:88;SEQIDNO:89;SEQIDNO:90;SEQIDNO:91;SEQIDNO:92;和SEQIDNO:93的多核苷酸;和(ii)与(i)的多核苷酸具有至少约70%序列同一性并赋予与(i)的多肽基本上相同的产量的多核苷酸;b)鉴定所述植物是否包含所述特定多核苷酸序列;和c)培育包含所述特定多核苷酸序列的植物以产生子代。34.权利要求33的方法,其中所述植物多核苷酸序列是基因组DNA。35.权利要求33的方法,其中所述植物多核苷酸序列是cDM。36.权利要求33的方法,其中所述EG1117多核苷酸序列与植物中增加的产量相关联。37.权利要求36的方法,其中增加的产量是相对于来自相同属的第二种植物来说增加的产量,所述第二种植物含有相对于来自所述植物的所述EG1117多核苷酸序列而言具有至少一个核苷酸变化的第二种EG1117多核苷酸序列。38.权利要求33的方法,其中所述植物选自玉蜀黍、水稻、小麦、大麦、甘蔗、两色高粱和珍珠粟。39.权利要求37的方法,其中所述第二种植物选自驯化植物的野生祖先植物,所述驯化植物选自玉蜀黍、水稻、小麦、大麦、甘蔗、两色高粱和珍珠粟。40.关于特定EG307多核苷酸序列而言植物的标记辅助育种方法,其包括步骤a)对于至少一种植物比较所述植物的所述核苷酸序列的至少一部分与选自下列的特定EG307多核苷酸序列(i)选自SEQIDN0:71;SEQIDNO:72;SEQIDNO:74;SEQIDNO:75;SEQIDNO:41;SEQIDNO:42;SEQIDNO:44;SEQIDNO:45;SEQIDNO:47;SEQIDNO:48;SEQIDNO:50;SEQIDNO:51;SEQIDNO:53;SEQIDNO:54;SEQIDNO:56;SEQIDNO:57;SEQIDNO:59;SEQIDNO:60;SEQIDNO:62;SEQIDNO:63;SEQIDNO:65;SEQIDNO:66;SEQIDNO:68;SEQIDNO:69;SEQIDNO:117;SEQIDNO:119;SEQI固115;SEQIDNO:78;SEQIDNO:79;SEQIDNO:80;SEQIDNO:81;SEQIDNO:82;SEQIDNO:83;SEQIDNO:84;和SEQIDNO:85的多核苷酸;和(ii)与(i)的多核苷酸具有至少约70%序列同一性并赋予与(i)的多肽基本上相同的产量的多核苷酸;b)鉴定所述植物是否包含所述特定多核苷酸序列;和c)培育包含所述特定多核苷酸序列的植物以产生子代。41.权利要求38的方法,其中所述植物多核苷酸序列是基因组DM。42.权利要求38的方法,其中所述植物多核苷酸序列是cDNA。43.权利要求38的方法,其中所述EG307多核苷酸序列与植物中增加的产量相关联。44.权利要求41的方法,其中增加的产量是相对于来自相同属的第二种植物来说增加的产量,所述第二种植物含有相对于来自所述植物的所述EG307多核苷酸序列而言具有至少一个核苷酸变化的第二种EG307多核苷酸序列。45.权利要求38的方法,其中所述植物选自玉蜀黍、水稻、小麦、大麦、甘蔗、两色高粱和珍珠粟。46.权利要求44的方法,其中所述第二种植物选自驯化植物的野生祖先植物,所述驯化植物选自玉蜀黍、水稻、小麦、大麦、甘蔗、两色高粱和珍珠粟。全文摘要本发明提供了用于鉴定可能与植物中的商业有关性状相关联的多核苷酸和多肽序列的方法,具体地,关于玉米、小麦、大麦、高粱和甘蔗中的产量相关基因EG307和EG1117的如此鉴定的多核苷酸和多肽序列。由此鉴定的序列可用于增强驯化植物或野生祖先植物中的商业所需性状,鉴定有关的多核苷酸序列,对植物进行基因分型,以及标记辅助育种。由此鉴定的序列还可以用于产生异源DNA、转基因植物和转染的宿主细胞。文档编号C12N15/00GK101495629SQ200680018730公开日2009年7月29日申请日期2006年3月29日优先权日2005年3月29日发明者W·梅希尔申请人:进化基因组学有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1