用于调节在植物中的表达的启动子的制作方法

文档序号：252058阅读：730来源：国知局

用于调节在植物中的表达的启动子的制作方法
【专利摘要】本发明涉及能够调节在植物中的表达的分离的核酸分子，以及包含所述核酸分子的表达盒、载体和转基因植物。
【专利说明】用于调节在植物中的表达的启动子
发明领域
[0001]本发明涉及能够调节在植物中的表达的分离的核酸分子，以及包含所述核酸分子的表达盒、载体和转基因植物。
[0002]发明背景
[0003]操纵植物来改变和/或改善表型特征(如生产力、品质或抗虫性)需要在植物组织中表达异源基因。这类遗传操作依赖于按需驱动和控制基因表达的手段的可利用性。例如，遗传操作依赖于合适启动子的可利用性和应用，所述启动子在植物中是有效的，并调节基因表达，从而在转基因植物中产生所需效应。对于植物生物技术中的多种应用，组织特异性的表达谱是有利的，因为在一种组织中表达的有利效应在其他组织中可能有缺点。例如，驱动在植物表皮中表达的启动子(如表皮优先的或表皮特异性的启动子)可用于表达阻止病原体(如真菌或细菌)通过表皮感染植物的基因。有多种不同启动子的选择是有利的，如此使得能够为特别的基因、构建体、细胞、组织、植物或环境选择最合适的启动子。此外，对于用多重植物转录单元(PTU)转化植物的兴趣增加，以及与用于这些目的的常规调节分子应用相关的潜在问题，都使可利用多种启动子分子具有优势。
[0004]因此，本领域对鉴别可用于在经济上重要的植物中表达选定的转基因的新型分子存在持续的需要。因而本发明的目标是提供新和备选的表达盒，用于在多种植物组织(例如表皮)中表达转基因。本发明实现了该目标。
[0005]发明概述
[0006]本发明的第一个实施方案涉及能够调节在植物中的表达的分离的核酸分子，选自
[0007]i) SEQ ID N0:l、2、3、4、5、6、7、8、9、10、ll、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88 或 89 所述分子，和
[0008]ii) SEQ ID N0:l、2、3、4、5、6、7、8、9、10、ll、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88 或 89 的任一项所述分子的至少250个连续碱基的片段，和
[0009]iii)至少250个连续的碱基的核苷酸分子，其与SEQ ID NO: 1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88或89的任一项所述转录调节核苷酸分子具有至少60%序列同一性，和
[0010]iv)核苷酸分子，其与 SEQ ID N0:l、2、3、4、5、6、7、8、9、10、ll、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88 或 89 的任一
项所述转录调节核苷酸分子具有至少60%序列同一性，和
[0011]V)至少250个碱基的核苷酸分子，其能够在下述条件下，与SEQ ID N0:l、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88或89的任一项描述的转录调节核苷酸分子，或其互补序列杂交，所述条件等价于在50°C在7%十二烷基磺酸钠(SDS)、0.5M NaPO4UmM EDTA中杂交和在50°C在 0.1X SSC,0.1%SDS 中洗涤；
[0012]vi)至少250个碱基的核苷酸分子，其能够在下述条件下，与包含SEQ ID N0:l、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88或89的任一项描述的转录调节核苷酸分子或其互补序列的250个或更多个连续核苷酸的核酸杂交，所述条件等价于在50°C在7%十二烷基磺酸钠(SDS)、0.5M NaPO4UmM EDTA 中杂交和在 50。。在 0.1X SSC,0.1%SDS 中洗涤；
[0013]vii)核苷酸分子，其是上述i)至vi)的任一条核苷酸序列的互补序列或反向互补序列。
[0014]在另一个实施方案中，具有如上述i)、ii)、iii)、iv)、v)、vi)和vii)定义的序列的分离的核酸分子能够用于驱动在植物中的组成型表达，或在植物表皮或叶肉中的表达。在另一个实施方案中，源自如上述i)、ii)、iii)、iv)、v)、vi)和vii)定义的分离的核酸分子在植物表皮和/或叶肉中的表达是可被病原体感染诱导的，例如被真菌感染诱导。
[0015]在优选的实施方案中，具有如上述ii)定义的序列的能够调节在植物中的表达的分尚的核酸分子包含最小启动子，优选地各个分尚的核酸分子的最小启动子。
[0016]可或可以从植物基因组DNA的基因(例如植物基因组DNA)获得分离的核酸分子，所述基因编码多肽，所述多肽包含与选自SEQ ID N0:221、223、225、227、229、231、233、235、
237、239、241、243、245、247、249、251、253和225的多肽具有至少80%氨基酸序列同源性的氨基酸序列。
[0017]可或可以从植物基因组DNA的基因获得分离的核酸分子，所述基因与选自SEQ IDN0:220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252 和 254
的核酸分子具有至少80%序列同一'丨生。
[0018]在一个实施方案中，具有如上述的序列的分离的核酸分子能够修饰在植物或其部分中的转录，例如在植物细胞中的转录。更具体而言，具有如上述的序列的分离的核酸分子能够在植物的表皮和/或叶肉中，或源自这类组织的植物细胞中组成型地修饰转录。
[0019]本发明也考虑的实施方案是如上述定义的具有ii)、iii)、iv)、V)、vi)和vii)所述序列的分离的核酸分子与其源自的SEQ ID N0:l、2、3、4、5、6、7、8、9、10、ll、12、13、14、15、16、17和18所述的对应的转录调节核苷酸分子具有基本相同的转录调节活性。
[0020]优选地，分离的核酸分子选自SEQ ID N0:l、2、3、4、5、6、7、8、9、10、ll、12、13、14、
15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88 和 89
所述分子，或其任何同源物或片段。
[0021]更优选地，转录调节核苷酸分子选自以下分子组成的组:
[0022]i) SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88 和 89 所述分子，和
[0023]ii) SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、
22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、
47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、
72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88 和 89 的任一项所述分子的至少250个连续的碱基，优选至少300个连续的碱基，更优选至少400个连续的碱基，甚至更优选至少500个连续的碱基，最优选至少750个连续的碱基的片段，和
[0024]iii)至少250个连续的碱基,优选至少300个连续的碱基、更优选至少400个连续的碱基，甚至更优选至少500个连续的碱基，最优选至少750个连续的碱基的核苷酸分子，其与 SEQ ID N0:l、2、3、4、5、6、7、8、9、10、ll、12、13、14、15、16、17、18、19、20、21、22、23、24、
25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、
50、51、52、53、54、55 、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、
75、76、77、78、79、80、81、82、83、84、85、86、87、88或89的任一项所述转录调节核苷酸分子具有至少60%、65%或70%，优选至少75%、80%或85%，更优选至少90%或95%，甚至更优选至少96%或97%，最优选至少98%或99%的序列同一性，和
[0025]iv)核苷酸分子，其与 SEQ ID NO: 1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88 或 89 所述的
能够调节在植物中的表达的分离的核酸分子具有至少60%、65%或70%，优选至少75%、80%或85%,更优选至少90%或95%，甚至更优选至少96%或97%，最优选至少98%或99%的序列同一性，和
[0026]V)至少250个碱基，优选至少300个碱基，更优选至少400个碱基，甚至更优选至少500个碱基,最优选至少750个碱基的核苷酸分子,其优选地能够在下述条件下，与SEQ ID N0:l、2、3、4、5、6、7、8、9、10、ll、12、13、14、15、16、17、18、19、20、21、22、23、24、25、
26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、
51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、
76、77、78、79、80、81、82、83、84、85、86、87、88或89所述的能够调节在植物中的表达的分离的核酸分子或其互补序列杂交，所述条件等价于在50°C在7%十二烷基磺酸钠(SDS)、0.5MNaPO4UniM EDTA中杂交和在50°C在0.1X SSC,0.1%SDS中洗涤，更理想地在50°C在SDS、0.5MNaPO4UmM EDTA 中杂交和在 65。。在 0.1X SSC,0.1%SDS 中洗涤；
[0027]vi )至少250个碱基，优选至少300个碱基，更优选至少400个碱基，甚至更优选至少500个碱基，最优选至少750个碱基的核苷酸分子，其优选地能够在下述条件下，与包含 SEQ ID N0:l、2、3、4、5、6、7、8、9、10、ll、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88或89所述的能够调节在植物中的表达的分离的核酸分子或其互补序列的至少250，优选至少300，更优选至少400，甚至更优选至少500，最优选至少750个连续的核苷酸杂交，所述条件等价于在50°C在7%十二烷基磺酸钠(SDS)、0.5M NaPO4UmM EDTA 中杂交和在 50°C在 0.1X SSC,0.1%SDS 中洗涤，更优选在 50°C在 7%SDS、0.5M NaPO4UmM EDTA 中杂交和在 65。。在 0.1X SSC,0.1%SDS 中洗涤；
[0028]vii)能够调节在植物中的表达的分离的核酸分子,其是上述i)至vi)的任一条核酸分子的互补序列或反向互补序列。
[0029]在优选的实施方案中，具有如上述ii)定义的序列的能够调节在植物中的表达的分尚的核酸分子包含最小启动子，优选地各个分尚的核酸分子的最小启动子。
[0030]本发明的另一个实施方案是用于调节在植物中的表达的表达盒，其包含
[0031]a)至少一个如上述定义的能够调节在植物中的表达的分离的核酸分子，
[0032]和与其功能性连接的
`[0033]b)至少一个核酸分子，其与待在植物或其部分中表达的所述转录调节核苷酸分子异源。
[0034]待在植物或其部分中表达的异源核苷酸分子优选地还与具有表达增强效应的内含子、NEENA (W02011023537，W02011023539)、5’和/或3’ -非翻译区、转录终止和/或多聚腺苷酸化信号有效连接。3‘_非翻译区适于稳定mRNA表达和结构。可以导致mRNA的存在延长，因而增强表达水平。终止和多聚腺苷酸化信号适于稳定mRNA表达(例如，通过稳定RNA转录物，从而稳定RNA水平)，以确保恒定的mRNA转录物长度和阻止通读转录。尤其是在多基因表达构建体中，这是重要的特征。此外，正确的转录终止与导致增强的表达水平的调节性5’核苷酸序列的转录再起始相关。上述信号可以是在植物中有功能的任何信号，病情可以例如从植物基因、植物病毒基因或其他植物病原体中分离。然而，在优选的实施方案中，3’ -非翻译区、转录终止和多聚腺苷酸信号来自用作本发明启动子来源的基因。
[0035]本发明的转录调节分子可用于表达任何种类的核酸分子。例如，核酸分子的表达可以导致蛋白质的表达，或反义RNA、有义或双链RNA的表达。优选地，核酸分子的表达赋予植物农业上有价值的性状。
[0036]本发明的另一个实施方案涉及包含本发明的分离的核酸分子或表达盒的载体。本发明的另一个实施方案涉及包含本发明的表达盒或载体的转基因宿主细胞或非人生物。本发明的另一个实施方案涉及包含本发明的表达盒或载体的转基因植物或植物细胞。优选地，所述植物或植物细胞来自双子叶植物，优选来自蝶形花科(Fabacea)，更优选的来自大豆属(Glycine),最优选的来自大豆种(Glycine max)。
[0037]本发明的其他实施方案是用于生产如上文定义的表达盒或如上文定义的载体的方法，包括步骤
[0038]a.提供如上文定义的能够调节在植物中的表达的分离的核酸分子，和
[0039]b.将所述分离的核酸分子和至少一种与所述分离的核酸分子异源的核酸分子功能性连接。
[0040]本发明的额外的实施方案是用于生产转基因植物的方法，包括步骤
[0041]a.提供如上文定义的表达盒或如上文定义的载体，和
[0042]b.将所述表达盒或载体转化到植物部分或植物细胞中，和
[0043]c.从所述经转化的植物部分或植物细胞再生植物。
[0044]本发明的额外的实施方案是用于提供包含能够调节在植物中的表达的分离的核酸分子的表达盒的方法，包括步骤
[0045]a)使用 SEQ ID NO: 1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17 或 18 或 220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252 和 254 所述序列的至少15连续的bp，优选至少20连续的bp，从植物基因组DNA中分离第一核酸分子，和
[0046]b)将步骤a)中获得的第一核酸分子和至少一个与所述第一核酸分子异源的额外的核酸分子功能性连接。
[0047]定义
[0048]可以理解，本发明不限于所述特别的方法学、规程、细胞系、植物种或属、构建体和试剂。还可以理解，本文中使用的术语仅仅是出于描述特别实施方案的目的，而并非意在限制本发明的范围，本发明的范围仅受所附权利要求的限制。必须注意的是，如本文中和所附权利要求中使用的，单数形式“a”、“an”、以及“the”包括了复数的指代，除非上下文中另外明确指出。因此，例如“载体”指一个或多个载体，并包括本领域技术人员已知的等价形式，依此类推。
[0049]本文中使用的术语“约”意指近似、大概、大约或在区域内。当术语“约”与数值范围连用时，其通过向上和向下延伸所述数值范围来修饰所述范围。一般而言，本文中使用的术语“约”用于修饰数值高于或低于所述值的20%，优选高于或低于10% (更高或更低)。
[0050]如本文中使用的，词语“或”意指特定列表中的任一个成员，还包括所述列表中的成员的任意组合。
[0051]术语“基因”在广义上用于指与生物学功能相关的核酸的任何区段。因此，基因包括编码序列和/或其表达所需的调节分子。例如，基因指表达mRNA或功能性RNA，或编码特定蛋白质的核酸片段，并且包括调节分子。基因还包括非表达的DNA区段，例如形成其他蛋白质识别序列的区段。可以从多个来源获得基因，包括从目标来源克隆或从已知的或预测的序列信息合成，并可以包括被设计为具有所需的参数的序列。
[0052]术语〃天然的〃或〃野生型〃基因指存在于未转化细胞，即不具有已知突变的细胞的基因组中的基因。
[0053]“标志物基因”编码可选择的或可筛选的性状。
[0054]术语〃嵌合基因〃指任何基因，其含有:
[0055]I)不是天然地功能性连接的DNA序列，包括调节序列和编码序列，或
[0056]2)编码非天然邻接的蛋白质部分的序列，或
[0057]3)非天然邻接的启动子的部分。
[0058]因此，嵌合基因可包含源自不同来源的调节分子和编码序列，或包含源自相同来源的，但以不同于自然界中发现的方式排列的调节分子，和编码序列。
[0059]“转基因”指已经通过转化导入到基因组中并稳定维持的基因。转基因可包括，例如，与待转化的特定的植物的基因异源或同源的基因。此外，转基因可包含插入到非天然生物中的天然基因，或嵌合基因。术语“内源基因”指在生物基因组的天然位置上的天然基因。“外源基因”指通常在宿主生物中不可见，但通过基因转移导入的基因。
[0060]与本发明的核苷酸序列对应的"寡核苷酸"(例如用于探测或扩增反应)的长度可以是约30或更少个核苷酸(例如，9、12、15、18、20、21、22、23或24个，或9至30个之间的任何数量)。一般而言，特异性引物的长度可多达14个核苷酸。为了最佳特异性和成本效益，可优选长度为16至24个核苷酸的引物。本领域技术人员普遍熟练于设计用于例如PCR方法的引物。需要时，可以用本文公开的基因的整个限制性酶切片段进行探测，所述限制性酶切片段长度可以是100，或者甚至1000个核苷酸。
[0061]术语〃多肽〃、〃肽〃、〃寡肽〃、〃基因产物〃、〃表达产物〃和〃蛋白质〃在本文
中可互换的使用，指连续的氨基酸残基的聚合物或寡聚物。如本文中使用的，术语"氨基酸序列"或“多肽序列”指代表氨基酸残基的缩写、字母、字符或单词的列表。在本文中，可以用普遍已知的三字母符号或IUPAC-1UB生物化学命名委员会推荐的一字母符号指代氨基酸。本文中使用的缩写是用于氨基酸的常规一字母代码:A，丙氨酸；B，天冬酰胺或天冬氨酸；C，半胱氨酸；D，天冬氨酸；E，谷氨酸盐，谷氨酸；F，苯丙氨酸，G，甘氨酸；H，组氨酸；I，异亮氨酸；K，赖氨酸；L，亮氨酸；M，甲硫氨酸；N，天冬酰胺；P，脯氨酸；Q，谷氨酰胺；R，精氨酸；S，丝氨酸；T，苏氨酸；V，缬氨酸;W，色氨酸；Y，酪氨酸；Ζ，谷氨酰胺或谷氨酸(参见L.Stryer, Biochemistry, 1988, W.H.Freeman and Company, New York)。在氨基酸序列中的字母“ X ”在本文中用于代表任何氨基酸残基。
[0062]〃编码序列〃指编码具体氨基酸分子且排除了非编码序列的DNA或RNA分子。其可以构成“不中断的编码序列”，即，缺少内含子，例如在cDNA中，或者其可以包括一个或多个以恰当的剪切接合点为边界的内含子。“内含子”是RNA分子，其包含在初级转录物中，但通过细胞内的RNA切割和重新连接而被去除以产生可以翻译成蛋白质的成熟mRNA。
[0063]术语“开放阅读框”和“0RF”指编码序列的翻译起始和终止密码子之间被编码的氨基酸序列。术语"起始密码子”和“终止密码子”指编码序列中3个相邻的核苷酸单元(密码子)，分别说明蛋白质合成(mRNA翻译)的起始和链终止。
[0064]“功能性RNA〃指反义RNA、微小RNA、siRNA、核酶或其他不翻译的RNA。
[0065]术语“ RNA转录物”指从RNA聚合酶催化的DNA分子转录获得的产物。当RNA转录物是DNA分子的完美互补拷贝时，其被称为初级转录物，或者其可以是源自初级转录物的转录后加工的RNA分子并且被称为成熟的RNA。“信使RNA”(mRNA)指不含内含子并可以被细胞翻译成蛋白质的RNA。“cDNA”指与mRNA互补或源自mRNA的单链或双链DNA。
[0066]“能够调节表达的分离的核酸分子”、“转录调节核苷酸分子”、“调节分子”或“合适的调节分子”都指这样的核苷酸分子，其影响待转录的相关的(或功能性连接的)核苷酸分子的转录、RNA加工或稳定性、或翻译。转录调节核苷酸分子可以相对于待转录的核苷酸分子具有多种定位。转录调节核苷酸分子可位于待转录分子(例如，编码序列)的上游(5’非编码序列)、内部或下游(3’非编码序列)。转录调节核苷酸分子可选自增强子、启动子、翻译前导序列、内含子、5’ -非翻译序列、3’ -非翻译序列和多聚腺苷酸化信号序列。其包括天然的和合成的分子，以及可以是合成的和天然的分子组合的分子。如上所述，术语“转录调节核苷酸分子”不限于启动子。然而，本发明的转录调节核苷酸分子优选包含至少一个启动子分子(例如，位于基因的转录起点上游的分子，其能够诱导下游分子转录)。在一个优选的实施方案中，本发明的转录调节核苷酸分子包含相应基因的启动子分子并且一任选且优选地，包含所述基因的天然5’-非翻译区。此外，也可以使用所述基因的3’-非翻译区和/或多聚腺苷酸化区。如本文中使用的，术语“顺式元件”或“启动子基序”指赋予基因表达的整体控制方面的顺式作用型转录调节元件。顺式元件可以发挥结合转录因子的功能，后者是调节转录的反式作用蛋白质因子。一些顺式元件结合一种以上的转录因子，并且转录因子可以以不同的亲和力与一种以上的顺式元件相互作用。本发明的启动子理想地含有可以赋予或调节基因表达的顺式元件。可以通过多种技术鉴别顺式元件，包括删除分析，即，从启动子的5’末端或内部删除一个或多个核苷酸；DNA结合蛋白分析，使用DNase I足迹法、甲基化干扰、电泳迁移率变化测定、通过连接介导的PCR的体内基因组足迹法，和其他的常规测定；或通过常规的DNA序列比较方法通过与已知的顺式元件基序进行DNA序列相似性分析。可以通过诱变(或取代)一个或多个核苷酸或通过其他常规方法，进一步研究顺式元件的精细结构。可以通过化学合成或通过从包括这类元件的启动子中分离，来获得顺式元件，并且其可以用含有有用的限制性酶位点的额外侧翼核苷酸来合成以帮助后续操作。
[0067]“5’非编码序列”或“5’ -非翻译序列”或区”指位于编码序列的5’(上游)的核苷酸分子的序列。其存在于起始密码子上游的完全加工过的mRNA中，并且可影响初级转录物加工为mRNA、mRNA稳定性或翻译效率。
[0068]“3’非编码序列”或“3’ -非翻译序列”或区”指位于编码序列的3’(下游)的核苷酸分子序列并且包括多聚腺苷酸化信号序列和编码能够影响mRNA加工或基因表达的调节信号的其他序列。多聚腺苷酸化信号的特征通常是影响朝向mRNA前体的3’末端的多聚腺苷酸的添加。Ingelbrecht等人，1989示例了不同的3’非编码序列的应用。
[0069]术语“翻译前导序列”指在启动子和被翻译为RNA的编码序列之间的基因的DNA序列部分，并存在于翻译起始密码子上游(5’)的完全加工过的mRNA中。翻译前导序列可以影响初级转录物加工为mRNA、mRNA稳定性或翻译效率。
[0070]“信号肽”指多肽的氨基末端延伸，其与多肽联合翻译形成前体肽并且是多肽进入分泌通路必需的。术语“信号序列”指编码信号肽的核苷酸序列。术语“转运肽”在本文中用于指表达的多肽的一部分(优选指多肽的氨基末端延伸)，其与多肽联合翻译形成前体肽并且是多肽进入细胞器(例如质体(如叶绿体)或线粒体)必需的。术语“转运序列”指编码转运肽的核苷酸序列。
[0071]“启动子”指通常位于其编码序列上游(5’)的核苷酸分子，通过提供RNA聚合酶和正确转录所需的其他因子的识别而控制编码序列的表达。“启动子”包括最小启动子，所述最小启动子是包含TATA框与用于说明转录起始位点的其他序列的短DNA序列，向所述序列添加调节元件用于控制表达。“启动子”还指包括最小启动子和能够控制编码序列或功能性RNA的表达的调节元件的核苷酸分子。该类型的启动子分子由近端和更远端的上游元件组成，后一类元件通常被称为增强子。因此，“增强子”是这样的DNA分子，所述DNA分子可以刺激启动子活性并可以是启动子的内在元件，或者是增强启动子的水平或组织特异性的插入的异源元件。增强子能够以两种取向(正常或翻转的)运行，并且即使向启动子的上游或下游移动也能够发挥功能。增强子和其他上游启动子元件结合介导其作用的序列特异性的DNA结合蛋白。启动子可以以其整体源自天然基因，或者由源自天然可见的不同启动子的不同元件构成，或者甚至由合成的DNA片段构成。启动子还可以含有参与结合蛋白质因子的DNA序列，所述因子控制响应生理或发育条件的转录起始效率。本领域技术人员了解使单向启动子成为双向启动子的方法，和使用启动子序列的互补序列或反向互补序列产生与原始序列具有相同启动子特异性的启动子的方法。例如 Xie 等人(2001) “Bidirectionalization of polar promoters in plants，，naturebiotechnologyl9,第677-679页描述了用于组成型启动子以及诱导型启动子的这类方法。作者描述了向任意给定启动子的5’末端添加最小启动子足以获得以相同的启动子特异性控制两个方向表达的启动子。
[0072]“起始位点”是转录序列部分的第一个核苷酸附近的位置，也被定义为+1位。相对于该位点，对基因的所有其他序列及其控制区编号。下游序列(即，3’方向的其他蛋白质编码序列)被命名为正值，而上游序列(5’方向的绝大部分控制区)被命名为负值。
[0073]在缺少上游激活时,无活性的或具有极大降低的启动子活性的启动子元件,特别是TATA元件被称为“最小或核心启动子”。在存在合适的转录因子的条件下，最小启动子发挥允许转录的功能。因此，“最小或核心启动子”仅由转录起始所需的所有基础元件组成，例如TATA框和/或起始因子。
[0074]“组成型表达 ”指使用组成型或受调节的启动子的表达。“条件的”和“受调节的表达”指由受调节的启动子控制的表达。
[0075]“组成型启动子”指能够表达开放阅读框(ORF)的启动子，其在植物的所有的或几乎所有的发育阶段期间，在所有的或几乎所有的植物组织中进行控制。每个转录激活元件都不会表现出绝对的组织特异性，但在绝大部分植物部分中介导的转录活化水平是在转录最活跃的植物部分中达到的水平的至少1%。
[0076]“受调节的启动子”指非组成型地指导基因表达，而是以时间和/或空间受调节的方式指导表达的启动子，并且包括组织特异性启动子和诱导型启动子。其包括天然的和合成的分子，以及可以是合成的和天然的分子组合的分子。不同的启动子可以指导基因在不同的组织或细胞类型中、或不同的发育阶段、或响应不同的环境条件而表达。不断发现可用于植物细胞中的多种类型的新型启动子，多个例子可见于Okamuix)等人(1989)的编辑物。可用于植物中的典型的受调节的启动子包括但不限于安全剂诱导型启动子、源自四环素诱导型系统的启动子、源自水杨酸诱导型系统的启动子、源自乙醇诱导型系统的启动子、源自糖皮质激素诱导型系统的启动子、源自病原体诱导型系统的启动子，和源自蜕皮激素诱导型系统的启动子。
[0077]“组织特异性启动子”指不在所有的植物细胞中表达，而仅在一种或多种特定器官(如叶或种子)、特定组织(如表皮、绿色组织、胚或子叶)的细胞类型或特定细胞类型(如叶实质或种子贮藏细胞)中表达的受调节的启动子。还包括受时间调节的启动子，如在早期或晚期胚胎发生早期、在发育的种子或果实的展叶果熟的过程中，在完全分化的叶中，或在开始衰老时。
[0078]“诱导型启动子”指可以在一种或多种细胞类型中开启的受调节的启动子，或者基于外部刺激，例如化学品、光、激素、胁迫或病原体导致增加的表达的启动子。
[0079]“有效连接的”或“功能性连接的”优选地指在单个核酸片段上的核酸分子的关联，使得一个核酸分子的功能受其他核酸分子的影响。例如，认为调节DNA分子与编码RNA或多肽的DNA分子是“有效连接的”或“关联的”，如果这两个分子的位置使调节DNA分子影响编码DNA分子的表达(即，编码序列或功能性RNA处于启动子的转录控制之下)。编码序列可以以有义或反义取向与调节分子有效连接。
[0080]“表达”指内源基因、ORF或其部分或转基因在植物中的的转录和/或翻译。例如，在反义构建体的情况下，表达可以指仅反义DNA的转录。此外,表达指有义(mRNA)或功能性RNA的转录和稳定积累。表达还可以指生广蛋白质。
[0081]“特异性表达”是基因产物的表达，仅限于一种或几种植物组织中(空间限制)和/或一种或几种植物发育阶段(时间限制)。应理解难以存在真正的特异性:启动子似乎优选在一些组织中开启，而在其他组织中没有或仅有少量活性。该现象被称为泄露表达。然而，本发明中的特异性表达意指在一种或几种植物组织中的优选的表达。
[0082]启动子(有或无增强子)的“表达模式”是表达水平的模式，其表现为所述启动子在植物中的何处和哪些发育阶段中起始转录。当一种启动子的表达模式与其他启动子的表达模式只有极少重叠时，启动子的组的表达模式被认为是互补的。可以通过测量标准转录的报告子mRNA的“稳态”浓度，确定启动子的表达水平。该测量是间接的，因为报告子mRNA恶浓度不仅依赖于其合成速率，还依赖于mRNA的降解速率。因此，稳态水平是合成速率和降解速率的产物。然而，当转录的分子相同时，可认为降解速率以固定的速率进行，并且因此该值可作为合成速率的量度。当以该方式比较启动子时，本领域技术人员可利用的技术是杂交Sl-RNA酶分析、norther印迹和竞争性RT-PCR。该技术列表并非以任何方式代表所有可利用的技术，而是描述用于分析mRNA的转录活性和表达水平的常用方法。几乎所有启动子的转录起点的分析已经揭示了在转录开始处通常不会没有单个碱基，而是具有或多或少成簇的起始位点集合，每个簇占mRNA的一些起始起点。由于该分布在启动子之间存在差异，因此群体中的每个报告子mRNA的序列都将彼此不同。由于每个mRNA种类或多或少对降解易感，因此，对不同的报告子mRNA不能期待具有单个降解速率。多个真核启动子分子已显示，在起始位点(起始子)附近的序列在决定由特异性启动子指导的RNA表达水平中具有重要的作用。这还包括转录的序列的部分。因此，启动子与报告子分子的直接融合将导致次优的转录水平。分析表达模式和水平的常用方法是通过确定细胞中积累的蛋白质的“稳态”水平。本领域技术人员已知的报告子基因的常用候选对象是β_葡萄糖醛酸苷酶(GUS)、氯霉素乙酰转移酶(CAT)和具有突光特性的蛋白质,如来自水母(Aequora victoria)的绿色荧光蛋白(GFP)。然而，在原则上，更多种蛋白质也适合该目的，只要所述蛋白质不干扰本质的植物功能。多种工具适合进行定量和定位。可以方便地产生或获得基于例如免疫化学、酶学、荧光检测和定量的检测系统。可以使用蛋白质表达的原位分析，来确定植物组织提取物或完整的组织中的蛋白质水平。一般而言，具有一种嵌合的启动子报告子构建体的单个转化品系的报告子基因的表达水平可不同。通常还观察到这类转化体不表达任何可检测的产物(RNA或蛋白质)的现象。表达的变异通常归因于“位置效应”，尽管该无活性的潜在分子机制通常不明。
[0083]“过表达”指转基因细胞或生物中的表达水平超过了正常或未转化(非转基因)的细胞或生物中的表达水平。
[0084]“反义抑制”指生产能够抑制内源基因或转基因的蛋白质表达的反义RNA转录物。
[0085]“基因沉默”指病毒基因、转基因或内源核基因的依赖于同源性的抑制。基因沉默可以是转录的，当抑制是由于受影响的基因转录减少造成的时，或转录后的，当抑制是由于与受影响的基因同源的RNA种类的增加的转化(降解)时(Englishl996)。基因沉默包括病毒诱导的基因沉默(Ruiz等人1998)。
[0086]如本文中使用的，术语“异源DNA分子”、“外源DNA片段”或“异源核酸”每个指源自对于特定宿主细胞外来来源的分子，或者如果来自相同的来源，则是从其原始形态修饰过的。因此，宿主细胞中的异源基因包括与特定宿主细胞内源性的基因，但经过了例如使用DNA改组的修饰。术语还包括天然存在的DNA分子的非天然存在的多拷贝。因此，术语指对于细胞外源或异源的DNA区段，或对于细胞同源但位于宿主细胞核酸内通常不可见所述元件的位置中的DNA区段。表达外源性DNA区段来生产外源性多肽。“同源”DNA分子是与其导入的宿主细胞天然相关的DNA分子。
[0087]在核苷酸序列同一性的上下文中，“与......同源”指两条核酸分子的核苷酸序列
之间或两条蛋白质分子的氨基酸序列之间的相似性。这类同源性的估算是由在本领域技术人员普遍已知的严格条件下的DNA-DNA或DNA-RNA杂交提供的(如Haines和Higgins (编著),Nucleic Acid Hybridization, IRL Press, Oxford, U.K.所述)，或由两条核酸或蛋白质之间的的序列相似性比较提供的。
[0088]术语“基本相似的”或“相似的”指代表本文公开的拟南芥(Arabidopsisthaliana)或大豆(Glycine max)序列的功能和/或结构等价物或直系同源物的核苷酸和
氨基酸序列。
[0089]就最广的含义而言，当在本文中用于指核苷酸序列时，术语“基本相似的”或“相似的”意指核苷酸序列是这样的基因的部分，所述基因编码与参考核苷酸序列的基因编码的多肽具有基本相同的结构和功能的多肽，例如，核苷酸序列包含参考核苷酸序列对应的基因的直系同源物的基因的启动子，以及与特别地本文示例的启动子序列结构上相关的启动子序列，即，基本相似的启动子序列在高或非常高严格度条件下，与本文示例的启动子序列的互补序列杂交。例如，这样的改变的核苷酸序列是与特别的序列基本相似的，所述改变的核苷酸序列简单地反映了遗传密码的简并性，但仍编码与特别的氨基酸序列相同的氨基酸序列。术语“基本相似的”还包括其中序列经过修饰用于例如优化在特别细胞中的表达的核苷酸序列，以及编码相对于参照序列编码的(未修饰的)多肽具有一个或多个氨基酸替换的变体多肽的核苷酸序列，所述替换不改变变体多肽相对于未修饰的多肽的活性。
[0090]就最广的含义而言，当在本文中用于指多肽或核酸时，术语“基本相似的”或“相似的”意指多肽或核酸具有与参照多肽基本相同的结构和功能。此外，与特别的序列基本相似的氨基酸序列或核酸是与所述序列的整体氨基酸或核酸的同一性为至少90%或更大的那些序列。导致等价的核苷酸或氨基酸序列的修饰完全属于本领域的常规技术。基本相似的多肽或核酸与参照多肽或核酸之间的氨基酸或核酸序列同一性百分比是至少90%或更高，例如91%、92%、93%、94%、95%、96%、97%、98%，多达至少99%，其中参照多肽是由这样的基因编码的多肽，所述基因含具有SEQ ID N0:l、2、3、4、5、6、7、8、9、10、ll、12、13、14、15、
16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、
41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、
66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88 或 89 中的任一条的启动子，包含 SEQ ID N0:220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252或254中所含开放阅读框的核苷酸序列，所述核苷酸序列编码SEQID N0:221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253 或
225所述的多肽。除了具有基本相同的功能外，两条多肽彼此基本相似的一个提示是，活性齐U，例如特异性结合多肽之一的抗体，也特异性结合另一条多肽。
[0091]可以使用Smith-Waterman序列比对算法(参见例如，Waterman (1995)),进行序列比较。优选使用具有下列参数的1calS程序，1.16版:匹配:1，错配罚分:0.33，开放空位罚分:2，延伸空位罚分:2。
[0092]此外，与参照核苷酸序列“基本相似的”或“相似的”核苷酸序列被称为与参照核苷酸序列“等价的”。技术人员可认识到，本发明所涵盖的等价核苷酸序列也可以用其在低、中和/或严格条件(例如，0.1X SSC, 0.1%SDS, 65°C)下，与落入所附权利要求文字范围内的核苷酸序列杂交的能力来定义。
[0093]当用于指代多核苷酸片段或同源物时，“基本相同的活性”或“相同的活性”意指片段或同源物具有全长多核苷酸的表达调节活性的至少90%或更高，例如91%、92%、93%、94%、95%、96%、97%、98%，多达至少 99%。
[0094]“靶基因”指复制子上表达所需靶编码序列、功能性RNA或蛋白质的基因。靶基因对复制子的复制不是必需的。此外，靶基因可包含插入到非天然生物中的天然的非病毒基因，或嵌合基因，并将处于合适的调节序列的控制之下。因此，靶基因中的调节序列可以来自任何来源，包括病毒。靶基因可以包括与待转化的特别的植物的基因异源或同源的编码序列。然而，靶基因不包括天然的病毒基因。典型的靶基因包括但不限于编码结构蛋白、种子贮藏蛋白、传递除草剂抗性的蛋白质，和传递昆虫抗性的蛋白质的基因。由靶基因编码的蛋白质被称为“外源蛋白质”。靶基因在植物中的表达通常产生改变的植物性状。
[0095]术语“改变的植物性状”意指转基因植物中相对于野生型或非转基因植物宿主的任何表型或基因型的改变。
[0096]“复制基因”指编码病毒复制蛋白的基因。除复制蛋白的ORF外，复制基因还可以含有其他重叠的或非重叠的0RF，如天然病毒序列中可见的。虽然对复制不是必需的，这些额外的ORF可以增强复制和/或病毒DNA积累。此类额外的ORF的例子分别是在双生病毒群ACMV和TGMV中的AC3和AL3。
[0097]“嵌合反式作用复制基因”指复制基因，其中复制蛋白的编码序列处于受调节的植物启动子控制下，而不在天然的病毒复制基因中，或经修饰的天然病毒复制基因中，例如，其中在5’转录但非翻译区中插入了位点特异性序列。这类嵌合基因还包括在启动子和转录起始位点之间插入复制蛋白结合的已知的位点，所述位点减弱病毒复制蛋白基因的转录。
[0098]“染色体整合的”指外源基因或DNA构建体通过共价键整合到宿主DNA中。当基因不是“染色体整合的”时，它们可以是“瞬时表达的”。基因的瞬时表达指不是整合到宿主染色体中，而是独立发挥功能的基因表达，例如作为自主复制质粒或表达盒的一部分，或作为其他生物系统(如病毒)的一部分。
[0099]术语“转化”指将核酸片段转移到宿主细胞的基因组中，获得基因上稳定的遗传。含有经转化的核酸片段的宿主细胞被称为“转基因”细胞，并且包含转基因细胞的生物被称为“转基因生物”。转化植物和植物细胞的方法的实例包括农杆菌介导的转化(DeBlaerel987)和颗粒轰击技术(US4，945，050)。通过熟练的技术人员普遍已知的方法从转基因细胞再生完整的植物(参见例如，Fromml990)。
[0100]“转化的”、“转基因的”和“重组的”指其中导入了异源核酸分子的宿主生物，如细菌或植物。本领域普遍已知并公开了可以将核酸分子稳定地整合到基因组中(Sambrookl989 ；Innisl995 ；Gelfandl995 ;Innis&Gelfandl999)。已知的 PCR 方法包括但不限于使用配对的引物、巢式引物、单特异性引物、简并引物、基因特异性引物、载体特异性引物、部分错配的引物等的方法。例如，“转化的”、“转化体”，和“转基因”植物或愈伤组织已经过了转化过程，并含有整合到其染色体中的外源基因。术语“未转化的”指没有经过转化过程的正常植物。
[0101]“瞬时转化的”指其中已导入了转基因和外源DNA的细胞(例如，通过农杆菌介导的转化或基因枪方法)，但未进行对于稳定维持的选择。
[0102]“稳定转化的”指在转化后在选择培养基上经过选择并再生的细胞。
[0103]“瞬时表达”指细胞中的表达，所述细胞中通过病毒感染或通过例如农杆菌介导的转化、电穿孔或基因枪等方法，导入病毒或转基因，但不对稳定的维持进行选择。
[0104]“遗传上稳定的”和“可遗传的”指染色体整合的遗传元件，所述遗传元件稳定维持在植物中并在连续的世代之间被后代稳定遗传。
[0105]“初级转化体”和“T0世代”指与初始转化的组织具有相同遗传世代的转基因植物(即，自转化后尚未经历减数分裂和受精)。
[0106]“次级转化体”和“Tl、T2、T3等世代”指通过一个或多个减数分裂和受精的循环，源自初级转化体的转基因植物。它们可以源自初级或次级转化体的自花授粉，或初级或次级转化体与其他转化的或未转化的植物杂交。
[0107]野生型:涉及生物、多肽或核酸序列时，术语〃野生型〃、〃天然的〃或〃天然起源"意指所述生物是天然存在的，或可自至少一个天然存在的生物中获得，所述生物没有被改变、突变或人为操作。
[0108]术语“基因组”或“基因组DNA”指宿主生物的可遗传的遗传信息。所述基因组DNA包含核DNA (也被称为染色体DNA)和质体(例如，叶绿体)和其他细胞器(例如，线粒体)DNA。术语基因组或基因组DNA优选指核的染色体DNA。
[0109]术语“染色体DNA”或“染色体DNA序列”理解为不依赖于细胞周期状态的细胞核的基因组DNA。因此，染色体DNA可以组织在染色体或染色单体上，它们可以是浓缩的或未卷曲的。可以通过本领域已知的多种方法证实和分析染色体DNA中的插入片段，例如聚合酶链式反应(PCR)分析、Southern印迹分析、荧光原位杂交(FISH)和原位PCR。
[0110]术语"核酸"指单链或双链形式的脱氧核糖核苷酸或核糖核苷酸，或其聚合物，由含有糖、磷酸和碱基的单体(核苷酸)构成，所述单体是嘌呤或嘧啶。除非另外指出，术语涵盖了含有天然核苷酸的已知类似物的核酸，所述类似物具有与参照核酸相似的结合特性，并以与天然存在的核苷酸相似的方式代谢。除非另外指出，特别的核酸序列还暗示性地涵盖了它的经保守修饰的变体(例如，简并密码子替换)和互补序列，以及明确提示的序列。具体而言，可以通过生成这样的序列实现简并密码子替换，所述序列中一个或多个选定的(或所有)密码子的第三位被混合的碱基和/或脱氧肌苷残基取代(Batzerl991 ；0htsukal985 ；Rossolinil994)。〃核酸片段〃是给定的核酸分子的一部分。在高等植物中，脱氧核糖核酸(DNA)是遗传材料，而核糖核酸(RNA)参与包含在DNA中的信息向蛋白质中的转移。术语“核苷酸序列”指DNA或RNA的聚合物，可以是单链或双链的，任选地含有能够掺合到DNA或RNA聚合物中的合成的、非天然的或改变的核苷酸碱基。术语"核酸"或"核酸序列"还可以与基因、cDNA、DNA和由基因编码的RNA可互换地使用。
[0111]本发明涵盖了分离的或基本纯化的核酸或蛋白质组分。在本发明的上下文中，"分离的〃或〃纯化的"DNA分子或〃分离的〃或〃纯化的〃多肽是通过人力，与其天然的环境分开存在DNA分子或多肽，并因此不是天然的产物。分离的DNA分子或多肽可以以纯化的形式存在，或存在于非天然的环境中，例如，在转基因宿主细胞中。例如，"分离的"或"纯化的"核酸分子或蛋白质，或其生物学活性部分，当通过重组技术生产时基本不含其它细胞材料或培养基，或当化学合成时基本不含化学前体或其他化学物。优选地，"分离的"核酸不含核酸所来源的生物基因组DNA中天然位于核酸侧翼(即，位于核酸的5’或3’末端的序列)的序列(优选蛋白质编码序列)。例如，在多个实施方案中，分离的核酸分子可含有少于约5kb、4kb、3kb、2kb、lkb、0.5kb或0.1kb的核苷酸序列，所述核苷酸序列在核酸来源细胞的基因组DNA中天然位于核酸分子的侧翼。基本不含细胞材料的蛋白质包括具有少于约30%、20%、10%、5% (以干重计)的污染蛋白质的蛋白质或多肽制品。当重组生产本发明的蛋白质或其生物学活性部分时，培养基优选占少于约30%、20%、10%或5% (以干重计)的化学前体或非目标蛋白质化学物。本发明的核苷酸序列包括天然存在的序列以及突变体(变体)形式。这类变体可持续具有所需活性，即，启动子活性或由非变体核苷酸序列的开放阅读框编码的产物的活性。
[0112]涉及序列时(例如，多肽或核酸序列，如本发明的转录调节核苷酸分子)，术语“变体”或“同源物”意在表示基本相似的序列。对于包含开放阅读框的核苷酸序列，变体包括由于遗传密码简并性而编码天然蛋白质的相同氨基酸序列的那些序列。天然存在的等位变体例如可以用普遍已知的分子生物学技术，例如，使用聚合酶链式反应(PCR)和杂交技术鉴别的变体。变体核苷酸序列还包括合成来源的核苷酸序列,例如通过定点诱变生成的,并且用于开放阅读框的那些序列，其编码天然蛋白质，及编码相对于天然蛋白质具有氨基酸替换的多肽。一般而言，本发明的核苷酸序列变体将与天然的(野生型或内源的)核苷酸序列具有至少 40、50、60 至 70%，例如优选 71%、72%、73%、74%、75%、76%、77%、78% 至 79%，一般至少80%,例如 81%-84%，至少 85%，例如 86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、至98%和99%核苷酸序列同一性。
[0113]用于本文中的"表达盒"意指能够指导特别的核苷酸序列在恰当的宿主细胞中表达的DNA序列,包含与目标核苷酸序列有效连接的启动子，所述启动子任选地与终止信号和/或其他调节元件有效连接。表达盒还可包含正确的翻译核苷酸序列所需的序列。编码区通常编码目标蛋白，但也编码功能性的目标RNA，例如反义RNA或非翻译RNA，以有义或反义取向。包含目标核苷酸的表达盒可以是嵌合的，意味着其至少一个组分与其至少一个其他组分是异源的。表达盒还可以是天然存在的，但也可以用于异源表达的重组形式获得。表达盒可以完全在胞外装配(例如，通过重组克隆技术)。然而，还可以使用部分内源组分装配表达盒。例如，可以通过将启动子序列放在(或插入到)内源序列上游从而使其成为功能性连接的并受所述启动子序列控制，来获得表达盒。同样的，可以将待表达的核酸序列放在(或插入到)内源启动子序列的下游，从而形成表达盒。表达盒中的核苷酸序列的表达可处于组成型启动子或诱导型启动子的控制下，后者仅当宿主细胞暴露在一些特定的外部刺激条件下才起始转录。在多细胞生物的情况下，启动子还可以是特别的组织或器官或发育阶段特异性的。在优选的实施方案中，这类表达盒将包含与目标核苷酸序列相连接的本发明的转录起始区。这类表达盒优选提供多个限制性位点，用于插入目标基因于调节区的转录调节下。表达盒可额外含有可选择的标志物基因。按5’ -3’转录方向，盒可包括在植物中有功能的转录和翻译起始区、目标DNA序列，和转录和翻译终止区。终止区可以与转录起始区是天然的，可以与目标DNA序列是天然的，或者可以源自另一种来源。方便的终止区可获得自根癌农杆菌的Ti质粒，例如章鱼碱合酶和胭脂氨酸合酶终止区，和下文所述其他(还参见 Guerineaul991 ；Proudfootl991 ；Sanfaconl991 ；Mogenl990 ；Munroel990 ；Ballasl989 ；Joshil987)。
[0114]将〃载体〃定义为尤其包括处于双链或单链的线性或环状形式的任何质粒、粘粒、噬菌体或农杆菌二元载体，其可以是或不是可自我传代的或可移动的，并且可以通过整合到细胞基因组中或存在于染色体外(例如，具有复制起点的自主复制型质粒)，来转化原核或真核宿主。
[0115]具体而言，包括了穿梭载体，其意为能够天然地或经设计地在两种不同的宿主生物中复制的DNA运载体，可选自放线菌及相关物种、细菌和真核生物(例如，高等植物、哺乳动物、酵母或真菌细胞)。
[0116]优选地，载体中的核酸处于用于宿主细胞(例如微生物，如细菌或植物细胞)中的转录的恰当启动子或其他调节元件的控制下，并且与其有效连接。载体可以是在多种宿主中有功能的双功能表达载体。在基因组DNA的情况下，可以含有其自身的启动子或其他调节元件，而在cDNA的情况下，可以处于用于宿主细胞中的表达的恰当启动子或其他调节元件的控制下。
[0117]“克隆载体”通常含有一个或少数限制性内切酶识别位点，在所述位点出可以以可确定的方式插入外源DNA序列，而不丢失载体的必需生物学功能，还可以插入适用于鉴别和选择用克隆载体转化的细胞的标志物基因。标志物基因通常包括提供四环素抗性、潮霉素抗性或青霉素抗性的基因。
[0118]“转基因植物”是具有一个或多个含有表达载体或重组表达构建体的植物细胞的植物。
[0119]“植物组织”包括分化的和未分化的组织或植物，包括但不限于根、茎、芽、叶、花粉、种子、瘤组织和多种形式的细胞和培养物,例如单细胞、原生质体、胚和愈伤组织。植物组织可以在植物中，或在器官、组织或细胞培养物中。
[0120]下列术语用于描述两条或多条核酸或多核苷酸之间的序列关系:(a)“参照序列”、(b) “比较窗口”、(C) “序列同一性”、(d) “序列同一性百分比”，和(e) “基本相同”。
[0121](a)如本文中使用的，“参照序列”是用作序列比较基础的定义的序列。参照序列可以是指定的序列的子集或整体；例如，作为全长cDNA或基因序列或分离的能够调节植物中的表达的核酸序列的区段，优选地完整的cDNA或基因序列或分离的能够调节植物中的表达的核酸序列是参照序列。
[0122](b)如本文中使用的，“比较窗口”指多核苷酸序列的连续和指定的区段，其中用于两条序列的最佳比对，比较窗口中的多核苷酸序列可包含较之参照序列(所述参照序列不包含添加或缺失)的添加或缺失(即，空位)。一般而言，比较窗口的长度是至少20个连续的核苷酸，任选地可以是30、40、50、100个或更长。在优选的实施方案中，定义序列同源性的比较窗口由整个查询序列组成。本领域技术人员理解为了避免由于多核苷酸序列中包括空位而造成与参照序列的高相似性，通常导入空位罚分，并从匹配数中减去。
[0123]用于比较的序列比对方法是本领域普遍已知的。因此，可以使用数学算法实现任意两条序列之间的百分比同一性确定。这类数学算法的优选的非限制性例子是Myers和Miller, 1988的算法；Smith等人1981的局部同源性算法；Needleman和Wunschl970的同源性比对算法；Pearson和Lipmanl988的相似性搜索方法；Karlin和Altschul, 1990的算法，在 Karlin 和 Altschul, 1993 中修饰。
[0124]可以利用计算机执行这些数学算法用于比较序列以确定序列同一性。这类执行包括但不限于:PC/Gene程序中的CLUSTAL (可获得自Intelligenetics, MountainView, Calif.) ；ALIGN 程序(2.0 版)和 Wisconsin Genetics 软件包，第 8 版(可获得自 Genetics Computer Group (GCG), 575Science Drive, Madison, ffis., USA)中的 GAP、BESTFIT、BLAST、FASTA和TFASTA。使用这些程序的比对可以用默认参数实施。CLUSTAL程序是详细描述过的(Higginsl988, 1989 ；Corpetl988 ；Huangl992 ;Pearsonl994)。ALIGN 程序基于Myers和Miller,见上文，的算法。Altschul等人，1990的BLAST程序基于Karlin和Altschul，见上文，的算法。多重比对(即2条以上的序列)优选使用Clustal W算法(Thompsonl994 ;例如，在软件 VectorNTI?,第 9 版；Invitrogen Inc.)实施，评分矩阵BL0SUM62MT2使用默认设置(空位开放罚分15/19，空位延伸罚分6.66/0.05 ;空位分隔罚分范围8 ;比对的％同一性延迟40 ;使用残基特异性空位和亲水性残基空位)。
[0125]用于实施BLAST分析的软件可通过美国国立生物技术信息中心(http://www.ncb1.nlm.nih.gov)公开获得。该算法首先涉及通过鉴别查询序列中长度W的短字节,来鉴别高评分序列对(HSP)，所述短字节当与数据库序列中相同长度的字节比对时，匹配或满足一些正值阈值分数T (Altschull990)。这些初始的邻近字节命中作为种子，触发寻找含有它们的更长HSP的搜索。然后，只要可以增加累积的比对分数，沿每条序列的两个方向延伸字节命中。对于核苷酸序列，使用参数M (匹配残基对的奖励分数；总是>0)和N (错配残基对的罚分；总是〈0)计算累加分数。对于氨基酸序列，使用评分矩阵计算累加分数。当累加的比对分数比其达到的最大值降低了数量X时，累加分数由于积累了一个或多个负分残基比对而变成O或负值，或达到任一序列的末端时，中止每个方向的字节命中延伸。
[0126]除计算百分比序列同一性外，BLAST算法还对两条序列之间的相似性实施统计学分析(参见例如KarlinMltschul (1993))。由BLAST算法提供的一种相似性量度是最小总和概率(P(N))，该量度提供了两条核苷酸或氨基酸序列之间可能偶然发生匹配的概率的提示。例如，如果在测试核酸序列与参照核酸序列的比较中，最小总和概率小于约0.1，更优选小于约0.01，最优选小于约0.001，则认为测试核酸序列是与参照序列相似的。
[0127]为了获得用于比较目的的有空位的比对，可以利用如Altschul等人1997所述的有空位的BLAST (在BLAST2.0中)。备选地，可以使用PS1-BLAST (在BLAST2.0中)实施重复搜索，所述搜索检测到分子之间的远距离关系。参见Altschul等人，见上文。当利用BLAST、有空位的BLAST、PS1-BLAST时，可以使用各个程序的默认参数(例如，BLASTN用于核苷酸序列，BLASTX用于蛋白质)。BLASTN程序(用于核苷酸序列)使用字节长度(W)
11、期望值(E) 10、截断值100，M=5, N=-4，并且比较两条链作为默认值。对于氨基酸序列，BLASTP程序使用字节长度(W)3、期望值(E)IO和BLOSUM62评分矩阵作为默认值(参见Henikoff&Henikoff, 1989)。参见 http:1 Iwm.ncb1.nlm.nih.gov。还可以通过目测人工实施比对。
[0128]出于本发明的目的，优选使用BlastN程序(1.4.7或更新的版本)及其默认参数，或任何等价程序，进行核苷酸序列比较用于确定与本文公开的启动子序列的百分比序列同一性。“等价程序”指用于任何两条讨论序列的任何序列比较程序，当与通过优选的程序生成的对应的比对相比时，生成了具有相同的核苷酸或氨基酸残基匹配的比对和相同的百分比序列同一性。
[0129](C)如本文中使用的，在两条核酸或多肽序列的上下文中，“序列同一性”或“同一性”指在指定的比较窗口中，当关于最大相应程度比对时，两条序列中相同的残基。当序列同一性百分比用于指蛋白质时，应认识到不同的残基位置通常是由保守的氨基酸替换而不同，其中氨基酸残基被具有相似化学特性(例如，电荷或疏水性)的其他氨基酸残基替换并因此不改变分子的功能特性。当序列的不同在于保守替换时，可以将百分比序列同一性调高，以校正替换的保守性本质。由这类保守性替换而不同的序列被称为具有“序列相似性”或“相似性”。进行该调整的手段是本领域技术人员普遍已知的。通常涉及将保守性替换评分为部分错配而非完全错配，从而增加百分比序列同一性。因此，例如，当相同的氨基酸被赋值为I并且非保守性替换被赋予分数O时，保守性替换被赋予O至I之间的分数。如程序PC/GENE (Intelligenetics, Mountain View, Calif.)中所执行的，计算保守性替换的分数。
[0130](d)如本文中使用的，“序列同一性百分比”意指通过在比较窗口中比较两条最佳比对的序列所确定的值，所述比较窗口优选地如SEQ ID N0:l、2、3、4、5、6、7、8、9、10、ll、
12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87,88或89所定义的完整查询序列或参照序列，其中用于两条序列的最佳比对，比较窗口中的多核苷酸序列的部分较之(不包括添加或删除的)参照序列可包含添加或缺失(即，空位)。如下计算百分比:确定两条序列中都存在的相同核酸碱基或氨基酸残基的位置数以产生匹配的位置数，用匹配位置数除以比较窗口中的位置总数，并将结果乘以100，以产生序列同一性百分比。
[0131](e) (i)术语多核苷酸序列“基本相同”意指使用所述使用标准参数的比对程序之一，较之参照序列多核苷酸包含具有至少90%、91%、92%、93%，或94%，最优选至少95%、96%、97%、98%或99%序列同一性的序列。本领域技术人员可认识到，通过考虑密码子简并性、氨基酸相似性、阅读框定位等，可以恰当地调整这些值以确定由两条核苷酸序列编码的蛋白质的对应的同一性。出于这些目的的氨基酸序列的基本相同通常意指至少90%、95%，最优选至少98%的序列同一性。
[0132]核苷酸序列基本相同的另一个提示是两个分子是否在严格条件(见下文)下彼此杂交。一般而言，选择的严格条件比具体序列在定义的离子强度和PH的热融解温度(Tm)低约5°C。然而，严格条件涵盖了约1°C至约20°C的温度范围，取决于本文另外定性的所需严格程度。如果它们编码的多肽基本相同，在严格条件下不彼此杂交的核酸仍然是基本相同的。这可以发生在，例如，当使用遗传密码所允许的最大密码子简并性生成核酸拷贝时。两条核酸序列基本相同的一个提示是当第一核酸编码的多肽与第二核酸编码的多肽免疫交叉反应时。
[0133](ii)在肽的上下文中，术语“基本相同”表示在指定的比较窗口中，肽包含与参照序列具有至少90%、91%、92%、93%或94%，或者甚至更优选95%、96%、97%、98%或99%的序列同一I"生。优选地,使用Needleman和Wunsch(1970)的同源性比对算法,进行最佳比对。两条肽序列基本相同的提示是一条肽与针对第二条肽的抗体具有免疫反应性。因此，例如当两条肽仅由于保守性替换而不同时，肽与第二条肽是基本相同的。
[0134]对于序列比较，通常以一条序列作为参照序列，将测试序列与之相比。当使用序列比较算法时，将测试序列和参照序列输入到计算机中，需要时指定子序列坐标，并指定序列算法程序参数。然后，序列比较算法基于所指定的程序参数，计算测试序列相对于参照序列的百分比序列同一性。本发明的参照序列由包括在序列操作规程中的序列定义，优选SEQID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88 和 89、220、222、224、226、228、230、232、234、236、
238、240、242、244、246、248、250、252和 254、221、223、225、227、229、231、233、235、237、
239、241、243、245、247、249、251、253和 255。优选地，参照序列包含由 SEQ ID N0:l、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88 或 89 或 220、222、224、226、228、230、232、234、236、238、240、242、
244、246、248、250、252 或 254 或 221、223、225、227、229、231、233、235、237、239、241、243、
245、247、249、251、253或255定义的完整序列，更优选地参照序列由SEQID N0:l、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88 或 89 或 220、222、224、226、228、230、232、234、236、238、240、242、
244、246、248、250、252或 254 或 221、223、225、227、229、231、233、235、237、239、241、243、
245、247、249、251、253或255定义的完整序列组成。
[0135]如上所述，两条核酸序列基本相同的另一个提示是两个分子在严格条件下彼此杂交。词组“与……特异性杂交”指当序列存在于复杂的混合物(例如，总细胞)DNA或RNA中时，在严格条件下，分子仅与特别的核苷酸序列结合、成双链体或杂交。“基本结合”指在探针核酸和靶核酸之间的互补杂交，并且包括可以通过降低杂交基质的严格度以实现对靶核酸序列的理想的检测而容纳的最少错配。
[0136]在核酸杂交实验(例如Southern和Northern杂交)的上下文中，“严格的杂交条件”和“严格的杂交洗涤条件”是序列依赖性的，并且在不同的环境参数下是不同的。Tm是50%的靶序列与完美匹配的探针杂交时的温度(在定义的离子强度和pH下)。特异性通常是杂交后洗涤的函数，关键的因素是最终洗涤溶液的离子强度和温度。对于DNA-DNA杂合体，可以根据Meinkoth和Wahl, 1984的等式估算Tm:
[0137]Tm=81.5°C +16.6 (1g10M) +0.41 (%GC) -0.61 (%form) - 500/L
[0138]其中，M是单价阳离子的摩尔浓度，%GC是DNA中的鸟嘌呤和胞嘧啶核苷酸的百分t匕，％form是杂交溶液中的甲酰胺百分比，L是杂合体的碱基对长度。每1%错配降低Tm约1°C;因此，可以调节Tm、杂交和/或洗涤条件，以杂交具有所需同一性的序列。例如，如果寻找具有>90%同一性的序列，则可以将Tm降低10°C。一般而言，选择严格条件为在定义的离子强度和PH下比具体序列与其互补序列的热融解点I低约5°C。然而，严格的严格条件可以利用比热融解点I低1、2、3、4、5、6、7、8、9或10°C的杂交和/或洗涤；中等的严格条件可以利用比热融解点I低6、7、8、9或10°C的杂交和/或洗涤；低严格条件可以利用比热融解点I低11、12、13、14、15或20°C的杂交和/或洗涤。使用该等式，杂交和洗涤组分，和所需的T，本领域普通技术人员可理解，内在地描述了杂交严格度和/或洗涤溶液的变异。如果所需的错配程度导致低于45°C (水溶液)或32°C (甲酰胺溶液)的T，优选增加SSC浓度，使得可以使用更高的温度。关于核酸杂交的全面指导可见于Tijssen，1993。一般而言，选择高严格条件为在定义的离子强度和PH下比具体序列的热融解点Tm低约5°C。
[0139]高严格洗涤条件的例子是在72 °C的0.15M NaCl中约15分钟。严格洗涤条件的例子是在65°C的0.2X SSC中洗涤15分钟(参见Sambrook，见下文，关于SSC缓冲液的描述)。通常，高严格洗涤之前进行低严格洗涤，以去除背景探针信号。例如多于100个核苷酸的双链体的中等严格洗涤的实例是在45°C的IX SSC中15分钟。例如多于100个核苷酸的双链体的低严格洗涤的实例是在40°C的4至6X SSC中15分钟。对于短探针(例如，约10至50个核苷酸)，严格条件通常涉及在pH7.0至8.3，小于约1.5M，更优选约0.01至1.0M的Na离子浓度(或其他盐)的盐浓度，并且温度通常是至少约30°C，而长探针(例如>50个核苷酸)是至少约60°C。还可以用添加去稳定剂(例如甲酰胺)实现严格条件。一般而言，在特别的杂交测定中，比不相关的探针观察到的信号噪音比高2X (或更高的)信号噪音比提示检测到特异性杂交。如果其编码的蛋白质是基本相同的，则在严格条件下彼此不杂交的核酸仍然是基本相同的。这可以发生在例如当使用遗传密码所允许的最大密码子简并性生成核酸拷贝时。
[0140]选择非常严格的条件等于特别的探针的Tm。在Southern或Northern印迹的滤膜上，用于具有多于100个互补残基的互补核酸的严格杂交条件的例子是50%甲酰胺，例如在370C，在50%甲酰胺，IM NaCl, 1%SDS中杂交，和在60至65°C，在0.1x SSC中洗涤。示例性的低严格条件包括在37°C，用30至35%甲酰胺，IM NaCl, 1%SDS (十二烷基磺酸钠)的缓冲溶液杂交，和在50至55°C，在IX至2X SSC (20X SSC=3.0M NaCl/0.3M柠檬酸三钠)中洗涤。示例性的中等严格条件包括在37°C，用40至45%甲酰胺，IM NaCl, 1%SDS中杂交，和在55至60°C，在0.5X至IX SSC中洗涤。
[0141]以下是可用于克隆与本发明的参照核苷酸序列基本相同的直系同源核苷酸序列的杂交/洗涤条件组的例子:参照核苷酸序列优选在50°C，在7%十二烷基磺酸钠(SDS)，0.5M NaPO4, ImM EDTA中与参照核苷酸序列杂交，并在50°C，在2X SSC,0.1%SDS中洗涤，更理想地在50°C，在7%十二烷基磺酸钠(SDS)，0.5M NaPO4, ImM EDTA中杂交，并在50°C，在IXSSC, 0.1%SDS中洗涤，更理想地是仍然在7%十二烷基磺酸钠(SDS)，0.5M NaPO4, ImM EDTA中杂交，并在50。。，在0.5X SSC, 0.1%SDS中洗涤，优选在50°C，在7%十二烷基磺酸钠(SDS)，0.5M NaPO4, ImM EDTA 中杂交，并在 50°C，在 0.1X SSC, 0.1%SDS 中洗涤，更优选在 50°C，在7% 十二烷基磺酸钠(SDS)，0.5M NaPO4, ImM EDTA 中杂交，并在 65°C，在 0.1X SSC, 0.1%SDS中洗涤。
[0142]“DNA改组”是在DNA分子中优选随机地导入突变或重排的方法，或在两条或多条DNA分子之间优选随机地生成DNA序列交换的方法。DNA改组获得的DNA分子是改组的DNA分子，所述改组的DNA分子是源自至少一个模板DNA分子的非天然存在的DNA分子。改组的DNA优选编码相对于模板DNA编码的多肽经修饰的变体多肽，并且相对于模板DNA编码的多肽可具有改变的生物学活性。
[0143]“重组DNA分子”是使用重组DNA技术和用于将DNA序列联结在一起的方法，例如Sambrook等人，1989中所述,联结在一起的DNA序列的组合。
[0144]词语“植物”指任何植物，特别是指农业上有用的植物(例如，种子植物)，“植物细胞”是植物的结构和生理学单元，包含细胞壁，但也可以指原生质体。植物细胞可以是分离的单细胞或培养的细胞的形式，或者作为更有组织的单元的部分，例如植物组织，或分化成存在于植物发育的任何阶段的结构的植物器官。这类结构包括一种或多种植物器官，包括但不限于果实、芽、茎、叶、花瓣等。优选地，术语“植物”包括整个植物、芽营养器官/结构(例如叶、茎和块茎)、根、花和花器官/结构(例如，苞片、花萼、花瓣、雄蕊、心皮、花药和胚珠)、种子(包括胚、胚乳和种皮)和果实(成熟的子房)、植物组织(例如，维管组织、地下组织等)和细胞(例如，保卫细胞、卵细胞、毛状体等)，及其后代。可用于本发明方法中的植物类别一般宽泛地是只要易于进行转化技术的高等或低等植物类别，包括被子植物(单子叶和双子叶植物)、裸子植物、苔藓和多细胞藻类。其包括多种倍性水平的植物，包括非整倍体、多倍体、二倍体、单倍体和半合子。植物界的高等和低等植物的所有种属都包含在本发明的范围内。进一步包括了成熟的植物、种子、芽和幼苗，及其来源的部分、繁殖材料(例如种子和果实)和培养物，例如细胞培养物。优选的是下列植物科的植物和植物材料:觅科(Amaranthaceae )、十字花科(Brassicaceae )、石竹科(Carophy 11aceae )、黎科(Chenopodiaceae)、菊科( Compositae)、葫芦科(Cucurbitaceae)、唇形科(Labiatae)、? 科(Leguminosae)、蝶形花科(Papilionoideae)、百合科(Liliaceae)、亚麻科(Linaceae)、锦奏科(Malvaceae)、蓄薇科(Rosaceae)、虎耳草科(Saxifragaceae)、玄参科(Scrophulariaceae)、爺科(Solanaceae)、番杏科(Tetragoniaceae)。一年生、多年生、单子叶和双子叶植物是用于生成转基因植物的优选宿主生物。在所有的观赏植物、林业、果实或观赏树、花、切花、灌木或草皮中使用根据本发明的重组系统或方法也是有利的。所述植物可包括但不应限于苔藓植物，例如苔纲(獐耳细辛属)和藓纲(苔藓)；蕨类植物如蕨、问荆和石松；裸子植物，如针叶树、苏铁植物、银杏和买麻藤科(Gnetatae)；藻类，如绿藻纲、Phaeophpyceae，红藻纲、蓝藻纲、黄藻纲、硅藻纲(硅藻)和裸藻纲。用于本发明目的的植物可包括蔷薇科，如玫瑰；杜鹃花科(Ericaceae)，如杜鹃花属和杜鹃花；大戟科(Euphorbiaceae )，如一品红和巴豆；石竹科，如石竹；茄科，如矮牵牛；苦苣苔科(Gesneriaceae),如非洲紫罗兰；凤仙花科(Balsaminaceae),如凤仙花；兰科(Orchidaceae),如兰花；鳶尾科(Iridaceae),如唐菖蒲、鳶尾花、小苍兰和番红花；菊科，如金盖花；物牛儿苗科(Geraniaceae),如天竺葵；百合科，如龙血树属(Drachaena);桑科(Moraceae),如格属植物；天南星科(Araceae),如喜林芋属和其他多种。根据本发明的转基因植物还特别选自双子叶作物植物，例如选自豆科，如豌豆、紫花苜蓿和大豆；伞形科(Umbelliferae)，特别是胡萝卜属(Daucus)(非常特别的是胡萝卜物种(胡萝卜))和芹属(非常特别的是药疗(Graveolens var.dulce)(疗菜))及其他多种；爺科,特别是番爺属(Lycopersicon)，非常特别的是番茄物种(西红柿)，和茄属，非常特别是马铃薯物种(土豆)和茄(茄子)、烟草及其他多种植物；和辣椒属(Capsicum)，非常特别的是朝天椒物种(辣椒)及其他多种；豆科，特别是大豆属(Glycine)，非常特别的是大豆物种及其他多种；十字花科(Cruciferae),特别是芸薹属(Brassica),非常特别的是欧洲油菜物种(油菜)、芸薹种(甜菜)、甘蓝变种Tastie (卷心菜)、甘蓝变种Snowball Y (花菜)和甘蓝变种Emperor (西兰花);拟南芥属，非常特别的是拟南芥物种及其他多种；菊科，特别是莴苣属(Lactuca)，非常特别的是莴苣物种(莴苣)及其他多种。根据本发明的转基因植物可选自单子叶作物植物，例如谷类，如小麦、大麦、高粱和小米、黑麦、黑小麦、玉米、稻和燕麦，以及甘蔗。还优选的是树，例如苹果、梨、温柏、李、樱桃、桃、油桃、杏、木瓜、芒果和其他木本物种，包括针叶树和落叶树，例如杨树、松树、红杉、雪松、橡树等。尤其优选的是拟南芥(Arab i dops i s thaI iana )、烟草(Nicotiana tabacum)、油菜、大豆、玉米(玉蜀黍)、小麦、亚麻(Linum usitatissimum)(亚麻籽和亚麻)、亚麻莽(Camelina sativa)、芥菜(Brassica juncea)、马铃薯和万寿菊。
[0145]“显著增加”是大于测量技术内在的边缘误差的增加，优选增加约2倍或更多。
[0146]“显著少于”意指大于测量技术内在的边缘误差的减少，优选减少约2倍或更多。
[0147]发明详述
[0148]因此，本发明提供了分离的核酸分子，所述核酸分子包含植物核苷酸序列，所述植物核苷酸序列指导有效连接的核酸片段在植物或其部分的表皮中的转录。
[0149]本发明还提供了分离的核酸分子，所述核酸分子包含植物核苷酸序列，所述植物核苷酸序列由病原体，优选真菌病原体诱导，而指导有效连接的核酸片段在植物或其部分的表皮中的转录。
[0150]本发明还提供了分离的核酸分子，所述核酸分子包含植物核苷酸序列，所述植物核苷酸序列指导有效连接的核酸片段在植物或其部分中的组成型转录。
[0151]本发明还提供了分离的核酸分子，所述核酸分子包含植物核苷酸序列，所述植物核苷酸序列指导有效连接的核酸片段在植物或其部分中叶肉特异性或叶肉优选的转录。
[0152]本发明还提供了分离的核酸分子，所述核酸分子包含植物核苷酸序列，所述植物核苷酸序列由病原体诱导，优选真菌病原体诱导，而指导有效连接的核酸片段在植物或其部分中叶肉和表皮特异性的或叶肉和表皮优选的转录。
[0153]此外，本发明提供了转基因表达盒，所述转基因表达盒用于调节在植物表皮中的表达、在植物表皮和/或叶肉中的诱导型表达或组成型表达，所述表达盒包含:
[0154]a)至少一个转录调节核苷酸分子，其源自GenBank大豆基因组基因座位Glymallgl4950、Glymal4g06680、Glyma02g47670、Glymal4g02930、Glymal7g27610、Glymal3g44640、Glyma08g37270、Glyma04g40860.1、Glyma01g33070.2、Glymal5g05820.1、Glyma01g42660.l、Glymal7gl4320或Glyma01g01510.1所述的任一项大豆基因或其直系同源基因
[0155]及与其功能性连接的
[0156]b)至少一个与所述转录调节核苷酸分子异源的核酸分子。[0157]此外，本发明提供了用于调节在植物叶肉中的表达的转基因表达盒，包含:
[0158]a)至少一个转录调节核苷酸分子，其源自GenBank拟南芥基因组基因座位Atlg49750、At3g62410、Atlg61520、Atlg30380 或 Atlg65490 所述的任一项拟南芥基因或其直系同源基因
[0159]及与其功能性连接的
[0160]b)至少一个与所述转录调节核苷酸分子异源的核酸分子。
[0161]在本发明的上下文中，“组织特异性转录”意指转录调节核酸分子以这样的方式对核酸分子的转录，所述方式是所述核酸分子在所述组织中的转录占所述核酸分子在整个植物的任何发育阶段中转录的RNA总量的大于90%，优选大于95%，更优选大于99%。本文具体公开的转录调节核苷酸分子被认为是组织特异性的转录调节核苷酸分子。
[0162]在本发明的上下文中， “组织优先的转录”意指转录调节核酸分子以这样的方式对核酸分子的转录，所述方式是所述核酸序列在所述组织中的转录占所述核酸序列在整个植物的任何发育阶段中转录的RNA总量的大于50%，优选大于70%，更优选大于80%。
[0163]在本发明的上下文中，“基本相同的转录调节活性”意指转录调节核酸分子对核酸分子的转录，与其来源的转录调节核酸分子具有相同的组织特异性或组织优先的转录，并具有其来源的转录调节核酸分子的至少50%，优先至少60%，更优选至少80%或90%，甚至更优选至少95%，最优选相同的表达强度，所述转录调节核酸分子是SEQ ID N0:l、2、3、4、5、6、
7、8、9、10、11、12、13、14、15、16、17或18的任一项的片段或同源物或变体。
[0164]优选地，本发明的转录调节核苷酸分子包括各个基因的至少一个启动子序列(例如，位于能够诱导下游序列转录的各个基因的转录起始上游的序列)。所述转录调节核苷酸分子可包含所述基因的启动子序列，但还可包含其他元件，例如5’ -非翻译序列、增强子、内含子等。优选地，所述启动子序列指导有效连接的核酸区段(例如包含结构或调节基因的开放阅读框的连接的植物DNA)在植物表皮或植物表皮细胞中的转录。
[0165]如上文定义章节中所述，优选通过使用默认参数的BLASTN程序，测量核苷酸序列之间的同一性，字节长度(W)ll、期望值(E)10、截断值100，M=5，N=-4，并且比较两条链。为了测量氨基酸序列之间的同一性，使用BLASTP程序，默认参数为字节长度(W)3、期望值(E)10 和 BL0SUM62 评分矩阵(参见 Henikoff&Henikoff, 1989)。使用 BLAST 程序 1.4.7 版或更新版。
[0166]优选的，所述分离的核苷酸序列的这类同源物或片段(例如，上文ii)、iii)、iv)、V)、vi)和vii)指定的序列)能够修饰植物细胞或生物中的转录，更优选的，所述同源物或片段(例如，上文 ii)、iii)、iv)、v)和 vi)所述序列)具有与 SEQ ID NO: 1、2、3、4、5、6、7、
8、9、10、11、12、13、14、15、16、17或18所述转录调节核苷酸分子基本相同的转录调节活性。优选的，同源物或片段(例如，上文iv)或V)所指定的序列)在严格条件下(即，中等严格，更优选高严格条件下)与指定的靶序列杂交。
[0167]优选的，本发明的表达盒中使用的转录调节核苷酸分子选自由SEQ ID N0:l、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、
31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、
56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、
81、82、83、84、85、86、87、88和89所述的分子或其任何同源物或片段组成的分子。更优选的，本发明的表达盒使用的转录调节核苷酸分子选自由以下分子组成的分子:
[0168]i)SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、
23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、
48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、
73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88 和 89 所述分子，和
[0169]ii)SEQ ID NO:1、2、3、4、5、6、7、8、9、10、I1、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88 和 89 的任一项所述分子的至少250个连续的碱基，优选至少300个连续的碱基、更优选至少400个连续的碱基，甚至更优选至少500个连续的碱基，最优选至少750个连续的碱基的片段，和
[0170]iii)具有至少250个连续的碱基，优选至少300个连续的碱基、更优选至少400个连续的碱基，甚至更优选至少500个连续的碱基，最优选至少750个连续的碱基，与SEQID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、
27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、
52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、
77、78、79、80、81、82、83、84、85、86、87、88或89的任一项所述转录调节核苷酸分子具有至少60%、65%或70%，优选至少75%、80%或85%，更优选至少90%或95%，甚至更优选至少96%或97%，最优选至少98%或99% 序列同一性的核苷酸分子，和
[0171]iv)与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88 和 89 所述能够调节在植物中的表达的分离的核酸分子具有至少60%、65%、70%、75%或80%，优选至少85%，更优选至少90%或95%，甚至更优选至少96%或97%，最优选至少98%或99%序列同一性的核苷酸分子，和
[0172]V)具有至少250个碱基，优选至少300个碱基，更优选至少400个碱基，甚至更优选至少500个碱基，最优选至少750个碱基的核苷酸分子，所述核苷酸分子优选在与下述条件等价的条件下，能够与 SEQ ID N0:l、2、3、4、5、6、7、8、9、10、ll、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88 和 89 所述能够调节在植物中的表达的分离的核酸分子，或其互补序列杂交，所述条件是在50°C，在7%十二烷基磺酸钠(SDS)，0.5M NaPO4, ImM EDTA 中杂交，并在 50°C，在 0.1X SSC, 0.1%SDS 中洗涤，更理想地在 50°C，在 7%SDS, 0.5M NaPO4, ImM EDTA 中杂交，并在 65°C，在 0.1X SSC, 0.1%SDS 中洗漆;
[0173]Vi)具有至少250个碱基，优选至少300个碱基，更优选至少400个碱基，甚至更优选至少500个碱基，最优选至少750个碱基的核苷酸分子，所述核苷酸分子优选在与下述条件等价的条件下，能够与包含 SEQ ID N0:l、2、3、4、5、6、7、8、9、10、ll、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、
67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88 和 89 所述能够调节在植物中的表达的分离的核酸分子，或其互补序列的至少250个，优选至少300个，更优选至少400个，甚至更优选至少500个，最优选至少750个连续的核苷酸的核酸杂交，所述条件是在50°C，在7%十二烷基磺酸钠(SDS)，0.5M NaPO4, ImM EDTA中杂交并在50°C，在 0.1X SSC, 0.1%SDS 中洗涤，更理想地在 50°C，在 7%SDS，0.5M NaPO4, ImM EDTA 中杂交并在 65。。，在 0.1X SSC, 0.1%SDS 中洗涤；
[0174]vii)能够调节在植物中的表达的分离的核酸分子，是前述i)至vi)的任一核酸分子的互补序列或反向互补序列。
[0175]优选的，用于本发明的表达盒的这类转录调节核苷酸分子(例如，上文ii)、iii)、iv)、V)、vi)和vii)所述序列)的同源物或片段能够修饰在植物细胞或生物中的转录，更优选的，所述同源物或片段(例如，上文ii)、iii)、iv)、V)和vi)所述序列)具有与SEQ IDN0:l、2、3、4、5、6、7、8、9、10、ll、12、13、14、15、16、17 和 18 所述转录调节核苷酸分子基本相同的转录调节活性。优选的，同源物或片段(例如，上文iii)所述序列)与SEQ ID N0:l、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17 和 18 所述序列具有至少 60% 或 65%，优选至少70%、75%或80%，更优选至少90%或95%，最优选至少97%、98%或99%的序列同一性。优选的，同源物或片段(例如，上文iv)或V)所述序列)在严格条件下(即，中等严格，更优选高严格条件下)与特定靶序列杂交。
[0176]在申请US61/419895 和 EP10193800.9 中，描述了用于生产这类与 SEQ ID N0:l、2、3、4、5、6、7、8、9、 10、11、12、13、14、15、16、17和18所述参照序列具有相同表达模式的同源
物的方法。
[0177]可或能够从植物基因组DNA的这样的基因中，获得本发明的转录调节核苷酸分子的同源物或片段(例如，SEQ ID 勵:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17和18所述序列)，所述基因编码与 SEQ ID N0:221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253和255所述多肽具有至少90%氨基酸序列同一性，更优选至少90%或95%，最优选至少97%或98%氨基酸序列同一性的氨基酸序列。
[0178]如果在与参照分子相同的组织中起始转录，则认为转录调节核苷酸分子的活性是等价的。优选使用与所述转录调节核苷酸序列有效连接的报告子基因证实这类表达谱。在本上下文中，优选的报告子基因(Schenbornl999)是绿色荧光蛋白(GFP) (Chui 1996 ；Leffell997)、氯霉素转移酶、荧光素酶(Millarl992)、β -葡萄糖醛酸糖苷酶或β -半乳糖苷酶。尤其优选的是β -葡萄糖醒酸苷酶(Jeffersonl987)。
[0179]除此之外，转录调节核苷酸分子的功能性等价的同源物或片段的转录调节活性可与其亲本序列的活性不同，尤其是表达水平。表达水平可高于或低于亲本序列的表达水平。根据待表达的目标核酸序列，两种偏差都可能是有利的。优选的是这样的功能等价序列，其与亲本序列相比，与所述亲本序列的表达水平偏差不超过50%，优选25%，更优选10% (优选根据mRNA表达或蛋白质(例如，报告子基因)表达来判断)。还优选的是相比其亲本序列展现出增加的表达的等价序列，优选增加至少50%,更优选至少100%,最优选至少500%。
[0180]优选的，可或能够从植物基因组DNA的这样的基因中，获得本发明的转录调节核苷酸分子的功能等价物，所述基因表达由cDNA所述的mRNA，所述cDNA包含与SEQ IDN0:220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252 和 254任一所述序列基本相似的，并优选与 SEQ ID N0:220、222、224、226、228、230、232、234、236、
238、240、242、244、246、248、250、252和254任一所述序列具有至少90%，优选至少92%或95%，更优选至少96%或97%，最优选至少99%序列同一性。优选地，所述转录调节核苷酸分子在与 SEQ ID 勵:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17和 18 定义的参照分子相同的组织中表现出启动子活性。
[0181]通过使用本文所述的拟南芥或大豆启动子序列作为探针，在低、中或严格杂交条件下杂交，筛选其他植物中的同源结构基因，可以从其他植物物种获得转录调节核苷酸分子的这类功能等价物。还可以使用在物种之间保守的本发明的启动子序列区作为PCR引物，从拟南芥或大豆以外的物种扩增区段，并使用所述区段作为杂交探针(后一方法允许更高的严格度筛选)或在转录测定中确定启动子活性。此外，使用计算机算法，可以利用启动子序列在数据库中鉴别结构上相关的序列。
[0182]更具体而言，基于本发明的核酸序列，可以根据基于与拟南芥或大豆核酸序列的序列相似性的普遍已知的技术，例如杂交、PCR或计算机生成的序列比较，从任何理想生物，优选从另一种植物中鉴别或分离直系同源物。例如，使用特别的拟南芥或大豆核酸序列的全部或部分作为探针，所述探针选择性地与存在于选定的源生物的克隆的基因组DNA片段或cDNA片段的群体(B卩，基因组或cDNA文库)中的其他基因序列杂交。此外，可以从生物的任何细胞或组织制备合适的基因组和cDNA文库。这类技术包括涂板DNA文库的杂交筛选(噬菌斑或克隆；参见例如Sambix)0kl989)，和使用优选与本文提供的核苷酸序列的相关多肽或子序列之间保守的序列结构域对应的寡核苷酸引物进行PCR扩增(参见例如Innisl990)。这些方法特别适合从与探针序列来源的生物密切相关的生物中分离基因序列。利用使用拟南芥或大豆序列作为探针的这些方法非常适合从任何生物来源，优选其他植物物种中分离基因序列。在PCR方法中，可以设计用于PCR反应的寡核苷酸引物，以从来自任何目标植物的提取的cDNA或基因组DNA扩增相应的DNA序列。用于设计PCR引物和PCR克隆的方法是本领域普遍已知的。
[0183]在杂交技术中，使用已知核苷酸序列的全部或部分作为探针，所述探针选择性地与存在于选定的生物的克隆的基因组DNA片段或cDNA片段的群体(即，基因组或cDNA文库)中的其他对应的核苷酸序列杂交。杂交探针可以是基因组DNA片段、cDNA片段、RNA片段，或其他寡核苷酸，并可用可检测的基团标记，例如32P，或任何其他可检测的标志物。因此，例如，可以通过基于本发明的序列标记合成的寡核苷酸，制备用于杂交的探针。用于制备杂交探针和构建cDNA和基因组文库的方法是本领域普遍已知的，并公开在Sambrook等人(1989)中。一般而言,与本文公开的序列杂交的序列将与所公开的序列具有至少约50%至70%，甚至约80%、85%、90%、95%至98%，或更高的同一性。即，序列的序列相似性范围可享有至少约50%至70%，甚至约80%、85%、90%、95%至98%的序列相似性。
[0184]还可以通过例如搜索已知的数据库中编码具有指定的氨基酸序列同一性的多肽的基因或具有指定的核苷酸序列同一性的DNA，来鉴别本发明的核酸分子。用于比较的比对序列的方法是本领域普遍已知的，描述在上文中。
[0185]因此，本发明的分离的核酸分子包括本文公开的拟南芥或大豆序列的直系同源物，即，拟南芥或大豆以外的生物中的对应的核苷酸序列，包括但不限于拟南芥或大豆以外的植物，优选双子叶植物，例如紫花苜蓿、向日葵、油菜、棉花、花生、烟草或甜菜，以及谷类植物，如玉米、小麦、黑麦、草坪草、高粱、小米、甘蔗、大麦和香蕉。直系同源基因是来自不同物种的基因，编码具有相同或相似功能的产物，例如与参照生物的基因编码的产物催化相同的反应。因此，直系同源物包括具有少于例如50%氨基酸序列同一性的多肽，但该直系同源物编码具有相同或相似的功能的多肽。可以应用数据库(如GenBank)鉴别与拟南芥或大豆序列相关的序列，例如，其他双子叶植物中的直系同源物。备选地,可应用重组DNA技术(如杂交或PCR)鉴别与拟南芥或大豆序列相关的序列，或从不同的DNA中克隆等价序列。
[0186]可从任何植物或非植物来源获得或分离，或通过纯化学手段合成生产本发明的转录调节核苷酸序列或其功能等价物。优选的来源包括但不限于上文定义章节定义的植物。
[0187]因此，本发明的另一个优选的实施方案涉及用于鉴别和/或分离转录调节核苷酸分子的方法，其特征是所述鉴别和/或分离利用了编码包含SEQ ID N0:221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253 和 255 所述序列的多肽的核酸分子，或所述核酸序列的一部分。优选的是包含这样的核酸序列或其部分的核酸分子，所述核酸序列由 SEQ ID N0:220、222、224、226、228、230、232、234、236、238、240、242、244、246、248,250,252 和 254 中的任一项所描述，或包含 SEQ ID NO:220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252 和 254 中的任一项。“部分”在本上下文中意指至少15个连续的核苷酸，优选至少25个连续的核苷酸,更优选至少50个连续的核苷酸的核酸序列。
[0188]用于鉴别和/或分离的方法可基于(但不限于)上述方法，例如聚合酶链式反应、杂交或数据库筛选。优选的，本发明的这一方法基于聚合酶链式反应，其中利用所述核酸序列或其部分作为寡核苷酸引物。本领域技术人员了解从部分的编码序列(例如，部分cDNA)开始，扩增和分离基因的启动子的若干方法。这类方法可包括但不限于例如反向PCR(“iPCR”)或“热不对称交错PCR”(“TAIL PCR”)。
[0189]因此，本发明的另一个实施方案涉及用于提供或生产用于在植物中异源表达的转基因表达盒的方法，包括步骤:
[0190]1.利用至少一个包含 SEQ ID NO:220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252和254中任一项的核酸序列，或所述核酸序列的至少15，优选至少20个连续的核苷酸的部分，分离植物基因的转录调节核苷酸分子，和
[0191]I1.功能性连接所述转录调节核苷酸分子与另一个目标核苷酸分子，后者相对于所述转录调节核苷酸分子是异源的。
[0192]本发明的其他实施方案还涉及用于提供用于表达的转基因表达盒的方法，包括步骤:
[0193]1.利用至少一个核酸分子或其部分，分离转录调节核苷酸分子，其中所述分子编码包含 SEQ ID N0:221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251,253和255中任一项的蛋白质，或是其至少15个连续的核苷酸的部分，和
[0194]I1.功能性连接所述转录调节核苷酸分子与另一种目标核苷酸分子，后者相对于所述转录调节核苷酸分子是异源的。
[0195]优选的，用于分离的核酸分子包含这样的核酸分子的至少15个连续的核苷酸，优选至少25个连续的核苷酸，更优选至少50个连续的核苷酸，所述核酸分子包含SEQ IDN0:220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252 和 254任一项所述的序列。优选的，通过利用所述核酸序列作为引物的聚合酶链式反应，实现转录调节核苷酸分子的分离。可以通过本领域已知的标准克隆方法，例如连接介导的克隆或重组介导的克隆，实现有效连接。
[0196]优选的，本发明的转录调节核苷酸序列和启动子包括SEQ ID NO: 1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17和18的任一项的约250个连续的碱基，优选至少300个连续的碱基，更优选至少400个连续的碱基，甚至更优选至少500个连续的碱基，最优选至少750个连续的碱基的连续序列段，或其启动子直系同源物，其中包括最小启动子区。
[0197]优选的，本发明的转录调节核苷酸序列和启动子包括SEQ ID NO: 1、2、3、4、5、6、7、
8、9、10、11、12、13、14、15、16、17和18的任一项的约250个连续的碱基，优选至少300个连续的碱基，更优选至少400个连续的碱基，甚至更优选至少500个连续的碱基，最优选至少750个连续的碱基的连续序列段，或其启动子直系同源物，其中包括最小启动子区。在本发明的特别的实施方案中，所述约250个连续的碱基，优选至少300个连续的碱基，更优选至少400个连续的碱基，甚至更优选至少500个连续的碱基，最优选至少750个连续的碱基的连续序列段与 SEQ ID N0:l、2、3、4、5、6、7、8、9、10、ll、12、13、14、15、16、17 和 18 的任一项的约250个连续的碱基，优选至少300个连续的碱基，更优选至少400个连续的碱基，甚至更优选至少500个连续的碱基，最优选至少750个连续的碱基的对应的连续的序列段，或其启动子直系同源物(其中包括最小启动子区)具有至少50%或60%，优选至少70%或80%，更优选至少90%，甚至更优选至少95%或97%，最优选98%或99%的核酸序列同一性。上文定义的连续的核苷酸的序列段优选地包含一个或多个启动子基序，所述基序选自TATA框、GC框、CAAT框和转录起始位点。
[0198]本发明的转录调节核苷酸序列或其功能性等价物能够驱动编码序列在靶细胞，特别是在植物细胞中的表达。本文公开的启动子序列和方法可分别用于调节任何异源核苷酸序列在宿主植物或其部分中的表达，以改变该植物的表型。这些启动子可以与可在植物中表达的结构基因的5’侧翼区的增强子、上游元件和/或激活序列组合使用。类似地，可以组合使用上游元件和多种植物启动子序列。
[0199]本发明的转录调节核苷酸序列和启动子可用于修饰植物的表型。转基因植物的多种表型改变是理想的，即，修饰植物中的脂肪酸组成、改变植物的氨基酸含量、改变植物的病原体防御机制等。这些结果可通过提供异源产物在植物中的表达或增加内源产物在植物中的表达来实现。备选地，可以通过提供降低一种或多种内源产物，特别是酶或辅助因子在植物中的表达,实现上述结果。这些改变导致经转化的植物的表型改变。
[0200]一般而言，本发明的转录调节核苷酸序列和启动子可用于在植物中表达与所述启动子有效连接的核酸区段，例如开放阅读框或其部分、反义序列、编码双链RNA序列的序列，或转基因。
[0201]例如，有效连接可包含本发明的转录调节核苷酸分子(例如，SEQ ID N0:l、2、3、4、
5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、
32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、
57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、
82、83、84、85、86、87、88和89所述序列)与待表达的核酸序列，以及任选的额外的调节元件(例如多聚腺苷酸化或转录终止元件、增强子、内含子等)的顺序排列，所述排列方式使得转录调节核苷酸分子在恰当的条件下可以实现其在表达目标核酸序列的过程中的功能。术语“恰当的条件”优选意指在植物细胞中存在表达。优选的是将待表达的目标核酸序列放置在本发明的转录调节核苷酸分子的下游(即，3’方向)的排列，所述放置方式是两种序列是共价连接的。任选的，可以在两条序列之间插入额外的序列。这类序列可以是例如接头或多克隆位点。此外，可以插入编码融合蛋白的部分的序列(如果预期表达由目标核酸编码的蛋白质的融合蛋白)。优选的，在待表达的目标核酸序列和本发明的转录调节核苷酸分子之间的距离不多于200个碱基对，优选不多于100个碱基对，更优选不多于50个碱基对。
[0202]可以通过本领域已知的多种方法实现关于本发明的任何表达盒的有效连接，包括在体外和体内方法。因此，可以通过使用本领域普遍已知的标准重组和克隆技术，实现本发明的表达盒或包含这类表达盒的载体(参见例如，Maniatisl989 ；Silhavyl984 ；Ausubell987)。
[0203]还可以通过向植物基因组中插入本发明的转录调节核苷酸分子(例如，SEQ IDNO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83 、84、85、86、87、88和89所述序列)装配表达盒。这类插入将导致与本身已存在于基因组中的目标核酸序列的有效连接。通过插入，目标核酸由于转录调节核苷酸序列的转录调节特性而表达。插入可以是受指导的或偶然的。优选的，插入是受指导的，并且是通过例如同源重组实现的。通过该方法，可以将天然的启动子转换为本发明的转录调节核苷酸分子，从而修饰内源基因的表达谱。还可以以这种方式插入转录调节核苷酸分子，使得表达内源基因的反义mRNA，从而诱导基因沉默。
[0204]相似的，可以以这样的方式将待表达的目标核酸序列插入到在其天然基因组环境中包含转录调节核苷酸分子的植物基因组中(即，与其天然基因相连接)，使得插入的序列与转录调节核苷酸序列有效连接，从而形成本发明的表达盒。
[0205]表达盒可用于多种表达目的，例如表达蛋白质或表达反义RNA、有义或双链RNA。优选的，核酸序列的表达赋予植物农业上有价值的性状。
[0206]可以从这样的基因中获得与本发明的转录调节核苷酸分子相关联的开放阅读框，所述基因是昆虫抗性基因、疾病抗性基因，例如，细菌性疾病抗性基因、真菌性疾病抗性基因、病毒性疾病抗性基因、线虫疾病抗性基因、除草剂抗性基因、影响谷物组成或质量的基因、营养物利用基因、毒枝菌素还原基因、雄性不育基因、可选择的标志物基因、可筛选的标志物基因、可负选择的标志物、可正选择的标志物、影响植物的农业特征(即，产量、直立性等)的基因或环境或胁迫抗性基因，即，一种或多种基因，所述基因赋予除草剂抗性或耐受性、昆虫抗性或耐受性、疾病抗性或耐受性(病毒性、细菌性、真菌性、线虫)、胁迫耐受性或抗性(示例如对干旱、热、寒冷、冰冻、湿度过大、盐胁迫或氧化胁迫的抗性或耐受性)、增加的产量、食物含量和组成、生理表现、雄性不育、干倒、直立性、繁殖性、淀粉性质或量、油量和质量、氨基酸或蛋白质组成等。“抗性”意指基本不表现出由于施用活性剂、用病原体感染或暴露于胁迫的表型改变的植物。“耐受”意指虽然由于感染表现出一些表型改变，但基本不具有减少的繁殖能力或基本不具有改变的代谢的植物。[0207]上述表达调节核苷酸序列可任选的与其他合适的调节序列(例如转录终止子序列、操纵子、阻遏子结合位点、转录因子结合位点和/或增强子)有效连接。
[0208]本发明还提供了含有本发明的表达盒的重组载体，和包含表达盒或载体，例如包含质粒的宿主细胞。表达盒或载体可增强经转化的植物的基因组，或者可以维持在染色体夕卜。本发明的表达盒或载体可存在于植物细胞的核、叶绿体、线粒体和/或质体中。优选的，本发明的表达盒或载体包含在植物核的染色体DNA中。本发明还提供了通过该方法制备的转基因植物、这类植物的种子和这类植物的后代植物，包括杂种和近交系。表达盒可以与结构基因、其开放阅读框、或其部分有效连接。表达盒可以还包含Ti质粒，并包含在根癌农杆菌细胞中；可以携带在微颗粒上，其中微颗粒适合基因枪转化植物细胞；或者可以包含在植物细胞或原生质体中。此外，表达盒或载体可以包含在经转化的植物或其细胞中，植物可以是双子叶或单子叶植物。特别的是，植物可以是双子叶植物。优选的转基因植物是转基因玉米、大豆、大麦、紫花苜蓿、向日葵、卡诺拉、大豆、棉花、花生、高粱、烟草、甜菜、稻、小麦、黑麦、草坪草、小米、甘蔗、西红柿或土豆。
[0209]本发明还提供了植物育种的方法，例如制备杂交的可育转基因植物。方法包括将包含本发明的特别的表达盒的可育转基因植物与自身或与第二种植物(例如缺少特别的表达盒的植物)杂交，以制备包含特别的表达盒的杂交的可育转基因植物的种子。然后，种植种子，获得杂交的可育转基因植物。植物可以是单子叶或双子叶植物。在特别的实施方案中，植物是双子叶植物。杂交的可育转基因植物可具有通过雌性亲本或通过雄性亲本遗传的特别的表达盒。第二种植物可以是自交系植物.杂交的可育转基因可以是杂种。这些杂交的可育转基因植物的任一种的种子也包括在本发明中。
[0210]本发明的转录调节核苷酸序列还包含与在严格条件下与SEQ ID N0:l、2、3、4、5、
6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、
33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、
58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、
83、84、85、86、87、88和89所述核酸分子杂交的序列(下文的“测试”序列)互补的序列，以及从所述核酸分子转录的RNA。当在严格条件下实施杂交时，优选在例如膜或DNA芯片上提供测试分子或本发明的核酸分子。因此，首先优选将变性的测试分子或本发明的核酸分子结合在支持物上，并在例如55至70°C之间的温度，在含有0.1%SDS的双倍强度的柠檬酸缓冲盐溶液(SC)中实施杂交指定的一段时间，随后在相同的温度，但用具有降低的SC浓度的缓冲液漂洗支持物。根据所需的严格程度，这类浓度降低的缓冲液通常是含有0.P/oSDS的单倍强度的SC、含有0.P/oSDS的一半强度的SC和含有0.P/oSDS的十分之一强度的SC。更优选的，在高严格条件下(如上文定义)进行杂交。
[0211]实际上，可以使用任何DNA组合物向受体植物细胞(如双子叶细胞)递送，以最终产生根据本发明的可育的转基因植物。例如，可以应用载体和质粒形式的DNA区段或片段，或线性DNA区段或片段，所述DNA片段在一些情况下仅含待在植物中表达的DNA元件等。可与本发明联合应用的载体构建是本领域技术人员根据现有公开内容已知的(参见例如Sambrookl989 ;Gelvinl990)。
[0212]与一个或多个本发明的转录调节核苷酸序列连接的目标核苷酸序列可以编码例如核糖体RNA、反义RNA或不翻译成蛋白质的任何其他类型RNA。在本发明的另一个优选的实施方案中，所述目标核苷酸序列被翻译成蛋白质产物。转录调节核苷酸分子和/或与其连接的目标核苷酸序列与待转化的植物可以是同源或异源起源的。用于导入植物细胞中的重组DNA分子包括从任何来源衍生或分离的DNA分子，并且随后可根据结构、大小和/或功能表征、化学改变和之后导入植物中。“源自”来源的目标核苷酸序列或区段的例子可以是在给定的生物中鉴别为有用片段的核苷酸序列或区段，然后以基本纯的形式化学合成的。这类从来源“分离的”目标核苷酸序列或区段的例子可以是通过化学手段，例如通过使用限制性内切核酸酶，从所述来源切出或移出的核苷酸序列或区段，使其可以经过遗传工程的方法进一步操作(例如扩增)而用于本发明。这类核苷酸序列或区段通常被称为“重组体”。
[0213]因此，有用的目标核苷酸序列、区段或片段包括完全合成的DNA、半合成的DNA、从生物学来源分离的DNA，和源自导入的RNA的DNA。一般而言，导入的DNA不是DNA受体的植物基因型中原始存在的，但从给定的植物基因型中分离基因，之后向相同的基因型中导入多个基因拷贝，例如以增强给定基因产物，如储藏蛋白质或赋予对缺水的耐受性或抗性的蛋白质的生产，是落入本发明的范围内的。
[0214]导入的重组DNA分子包括但不限于来自植物基因和非植物基因，例如来自细菌、酵母、动物或病毒的DNA。导入的DNA可包括经修饰的基因、基因的部分或嵌合基因，包括来自相同或不同基因型的基因。术语“嵌合基因”或“嵌合DNA”定义为包含至少两个来自这样的物种的基因或DNA序列或区段，所述物种在天然条件下不组合所述DNA，或所述DNA序列或区段以不是未转化植物的天然基因组中正常存在的方式定位或连接。
[0215]导入的用于本文中转化的重组DNA分子可以是环状或线性、双链或单链的。一般而言，DNA是处于嵌合DNA的形式，例如还可以含有侧翼是调节序列的编码区的质粒DNA，所述调节序列促进存在于获得的植物中的重组DNA的表达。一般而言，导入的重组DNA分子是相对较小的，即，小于约30kb，从而使对已知随核苷酸分子大小增加而增加的生理学、化学或酶促降解的任何易感性最小化。如上所述，优选预先选择和定义导入到植物基因组中的蛋白质、RNA转录物或其混合物的数量，例如可以形成从一种至约5-10种此类导入的DNA的产物。
[0216]控制表达的两种主要方法是已知的，S卩:过表达和低表达。可以通过插入选定基因的一个或多于一个的额外拷贝实现过表达。然而，对于植物或其后代而言，最初用一个或多于一个的额外的核苷酸序列拷贝转化以表现出低表达以及过表达的效应不是未知的。对于低表达存在有两种主要的方法，在本领域中通常被称为“反义下调”和“有义下调”(有义下调也被称为“共抑制”)。这些方法一般被称为“基因沉默”。这些方法都导致靶基因的表达抑制。
[0217]在恰当的植物组织中获得充分的转基因表达水平是生产遗传改造的农作物的重要方面。在植物宿主中表达异源DNA序列依赖于存在在植物宿主中有功能的、有效连接的启动子。启动子序列的选择将决定在何时以及在生物中的何处表达异源DNA序列。
[0218]本发明人尤其考虑了可以诱变启动子来潜在地改善用于在植物中表达转基因的元件的运用。这些元件的诱变可以随机进行，并在试错方法中筛选经诱变的启动子序列的活性。可选的，可以鉴别为启动子提供理想表达特征或表达增强活性的特别的序列，并通过突变向序列中导入这些或相似的序列。还考虑了可以诱变这些序列，从而增强转基因在特别的物种中的表达。[0219]诱变编码本发明的启动子序列的DNA区段的手段是本领域技术人员普遍已知的。如所示，可以通过随机的或位点特异性的诱变方法，对启动子或其他调节元件进行修饰。可以通过从编码对应的未修饰的序列的序列中添加或缺失一个或多个核苷酸改变其结构，来修饰启动子和其他调节元件。
[0220]可以根据任何本领域已知的技术实施诱变，例如但不限于合成在特别的调节区的序列中具有一个或多个突变的寡核苷酸。特别的是，点特异性诱变是可用于通过特异性诱变潜在的DNA，制备启动子突变体的技术。技术还提供了制备和测试序列变体的准备好的能力，例如通过向DNA中导入一个或多个核苷酸序列改变,掺入一个或多个上述考虑内容。点特异性诱变允许通过使用编码具有理想突变的DNA序列以及充足数量的邻接核苷酸的特异性的寡核苷酸序列生产突变体，以提供具有充分大小和序列复杂性的引物序列，以在被横跨的缺失接合处两侧形成稳定的双链体。通常，长度为约17至约75个核苷酸或更长的引物是优选的，被改变的序列接合处两侧具有约10至约25或更多个残基。
[0221]一般而言，点特异性诱变的技术是本领域普遍已知的，如多种出版物示例。如将意识到的，技术通常应用噬菌体载体，所述载体以单链和双链形式存在。可用于定点诱变的典型载体包括载体，如M13噬菌体。这些噬菌体是可方便的商业获得的，其用途是本领域技术人员普遍已知的。双链质粒也是常规用于定点诱变中的，其排除了将目标基因从质粒转移到噬菌体中的步骤。
[0222]一般而言，通过首先获得单链载体，或将双链载体的两条链融解分开，来实施根据本文的定点诱变，所述载体在其序列中包括编码启动子的DNA序列。通常是合成地制备具有理想的突变的序列的寡核苷酸引物。然后，将该引物与单链载体退火，并对其施用DNA聚合酶例如大肠杆菌聚合酶IKlenow片段，从而完成具有突变的链的合成。因此形成异源双链体，其中一条链编码原始的未突变的序列，并且第二链具有理想的突变。然后，使用该异源双链体载体转化或转染恰当的细胞，如大肠杆菌细胞，并选择包括具有突变的序列排列的重组载体的细胞。然后，可以从这些细胞中分离载体DNA，并用于植物转化。Kunkel等人(1987)设计了遗传选择方案，用于富集掺入诱变的寡核苷酸的克隆。可选的，使用具有可商业获得的热稳定性酶(如Taq 聚合酶)的PCR，可用于将诱变的寡核苷酸引物掺入到扩增的DNA片段中，然后再将所述DNA片段克隆到恰当的克隆载体或表达载体中。Tomic等人(1990)和Upender等人(1995)的PCR介导的诱变方法提供了这类操作规程的两个例子。除热稳定的聚合酶外，应用了热稳定连接酶的PCR也可用于将磷酸化的诱变的寡核苷酸掺入到扩增的DNA片段中，然后可以将所述DNA片段克隆到恰当的克隆载体或表达载体中。Michael (1994)描述的诱变方法提供了一种这类操作规程的例子。
[0223]使用定点诱变制备编码选定的启动子的DNA区段的序列变体是作为生产潜在有用的物种的手段提供的，而并非意在限制，因为存在可以获得DNA序列的序列变体的其他方式。例如，可以用诱变剂(如羟胺)处理编码理想的启动子序列的重组载体，以获得序列变体。
[0224]如本文中使用，术语“寡核苷酸定向的诱变方法”指模板依赖性的方法和载体介导的扩增，导致特异性核酸分子相对于其初始浓度的浓度增加，或可检测信号(例如扩增)的浓度增加。如本文中使用的，术语“寡核苷酸定向的诱变方法”还意指涉及模板依赖性延伸引物分子的方法。术语模板依赖性方法指RNA或DNA分子的核酸合成，其中新合成的核酸链的序列符合普遍已知的互补碱基配对规则(参见例如Watson和Rarnstad，1987)。通常，载体介导的方法涉及将核酸片段导入到DNA或RNA载体中、载体的克隆扩增和扩增的核酸片段的回收。美国专利号4，237，224提供了这类方法的例子。可利用多种模板依赖性的方法，扩增样品中存在的目标靶序列，这类方法是本领域普遍已知的，具体公开在下文中。
[0225]当已经根据本发明分离包含启动子的克隆时，可以期望划定克隆中的必需启动子区的界限。一种制备诱变启动子的有效的靶向手段依赖于鉴别启动子序列中的假定的调节元件。这可以通过与已知以相似的组织特异性或发育独有方式表达的启动子序列对比来开始。在具有相似的表达模式的启动子中共享的序列可能是结合转录因子的候选对象，并因此可能是赋予表达模式的元件。可以通过每个假定的调节区的缺失分析，随后通过与每个构建体功能性附着的报告子基因的测定，对每个缺失构建体进行功能性分析，实现对这些假定的调节元件的验证。由此，一旦提供了起始的启动子序列，就可以方便的制备起始启动子的多种不同缺失突变体中的任一种。
[0226]还可以通过移出或缺失非必需序列，而不缺失必需序列，来获得本发明的转录调节核苷酸分子的功能性等价的片段。可以通过试错缺失突变在体外，或使用启动子元件查找常规途径在计算机上实现将转录调节核苷酸分子缩小至其必需的转录介导元件。对启动子活性必需的区通常表现出成簇的某些已知的启动子元件。可以使用可获得的计算机算法，例如PLACE (“植物顺式作用调节DNA元件”;Higol999)、B10BASE数据库“Transfac”(Biologische Datenbanken GmbH, Braunschweig ；Wingender2001)或数据库 PlantCARE(Lescot2002),实施这类分析。
[0227]生产这类具有突变的序列、调节与亲本序列或参照序列相同的表达特异性的调节核酸分子的方法定义在例如US61/419895和EP10193800.9中。
[0228]优选的，本发明的转录调节核苷酸序列之一的功能性等价的片段包含SEQ IDN0:l、2、3、4、5、6、7、8、9、10、ll、12、13、14、15、16、17 或 18 所述转录调节核苷酸分子的至少250个碱基对，优选至少300 个碱基对，更优选至少400个碱基对，甚至更优选500个碱基对，最优选750个碱基对。更优选的，该片段从所示序列的3’末端开始。
[0229]尤其优选的是通过缺失编码mRNA的5’-非翻译区的区域，因此仅提供(非转录的)启动子区获得的转录调节核苷酸序列的等价片段。可以通过本领域已知的方法(如5’-RACE分析)简单地确定5’ -非翻译区。因此，本发明的一些转录调节核苷酸序列是其他序列的等价片段。
[0230]本发明的表达盒还可包含调节元件。在上下文中，术语以广义理解，意为包含可以影响表达盒构建或功能的所有的序列。调节元件可以例如修饰原核或真核生物中的转录和/或翻译。在优选的实施方案中，本发明的表达盒在待表达的核酸序列的下游(3’方向)包含转录终止序列，和任选地另外的调节元件-每者与待表达的核酸序列(或转录调节核苷酸序列)有效连接。
[0231]另外的调节元件可包含另外的启动子、最小启动子或启动子元件,所述元件可修饰表达调节性质。例如，可以取决于某些胁迫因子，如水胁迫、脱落素(Laml991)或热胁迫(Schoffll989)进行表达。此外，可以应用可在其他生物(例如大肠杆菌或农杆菌)中实现表达的另外的启动子或启动子元件。可以在细菌的启动子序列(例如amy和SP02)或酵母或真菌启动子的启动子序列(例如ADC1、Mfa、AC、P_60、CYCU GAPDH、TEF, rp28和ADH)中发现这类调节元件。
[0232]此外，认为组合来自多于一个启动子的元件的启动子可以是有效的。例如US5，491，288公开了组合花椰菜花叶病毒启动子与组蛋白启动子。因此，可以组合本文公开的启动子的元件与来自其他启动子的元件。可用于表达植物转基因的启动子包括诱导型、病毒的、合成的、组成型(Ode111985 )、时间调节的、空间调节的、组织特异性和时空调节的启动子。
[0233]当需要在特异性的组织或器官中表达时，可以使用组织特异性启动子。相反，当需要响应刺激表达基因时，诱导型启动子是选择的调节元件。这类诱导型启动子还可以是组织或器官特异性表达的和/或诱导的。当需要在植物的所有细胞中持续表达时，利用组成型启动子。转化载体的表达构建体中可以包括来自核心启动子序列上游和/或下游的另外的调节序列，以在转基因植物中产生异源核苷酸序列的不同的表达水平。
[0234]可获得多种5’和3’转录调节序列用于本发明。转录终止子负责转录终止和校正mRNA多聚腺苷酸化。3’未翻译的调节DNA序列优选包括约50至约1，000个，更优选约100至约1，000个核苷酸碱基对，并含有植物转录和翻译终止序列。恰当的转录终止子和已知在植物中有功能的那些转录终止子包括CaMV35S终止子、tml终止子、胭脂氨酸合酶终止子、豌豆rbcSE9终止子、根癌农杆菌的章鱼碱合酶基因的T7转录物的终止子，和土豆或西红柿的蛋白酶抑制剂I或II基因的3’末端，虽然也可以应用本领域技术人员已知的其他3’元件。可选的,还可以使用Y-coixin、油质蛋白3或薏该属(Coix)的其他终止子。
[0235]优选的3’元件包括根癌农杆菌的胭脂氨酸合酶基因的3’元件(Bevanl983)、根癌农杆菌的章鱼碱合酶基因的T7转录物的终止子，和土豆或西红柿的蛋白酶抑制剂I或II基因的3’末端。
[0236]由于转录起始位点和编码序列起始之间的DNA序列(B卩，非翻译前导序列)可以影响基因表达，因此也可以期望应用特别的前导序列。优选的前导序列被认为包括这样的序列，所述序列包括经预测指导附着的基因最佳表达的序列，即，包括优选的共有前导序列，所述共有前导序列可增加或维持mRNA稳定性和阻止不适当的翻译起始。根据本公开内容，这类序列的选择是本领域技术人员已知的。源自在植物中高表达的基因的序列是最优选的。
[0237]优选的调节元件还包括基因的5’ -非翻译区、内含子和3’ -非翻译区。已发现增强转基因植物中的基因表达的这类序列包括内含子序列(例如来自Adhl、bronzel、肌动蛋白 1、肌动蛋白 2 (W000/760067)，或其他植物内含子，如 W02011/023537、W02011/023539、W02006/094976 中公开的。
[0238]另外的优选的调节元件是增强子序列或多聚腺苷酸化序列。
[0239]待表达的异源核苷酸序列还优选与3’ -非翻译区、转录终止和/或多聚腺苷酸化信号有效连接。3 非翻译区适合稳定mRNA表达和结构。这可以导致mRNA的存在延长，并因此导致增强的表达水平。终止信号和多聚腺苷酸化信号适合稳定mRNA表达，从而确保恒定的mRNA转录物长度和阻止通读转录。这尤其是多基因表达构建体中的重要特征。此夕卜，转录的正确终止与导致增强的表达水平的从调节性5'核苷酸序列的转录重新起始相关。上述信号可以是任何在植物中有功能的信号，并且可以例如从植物基因、植物病毒基因或其他植物病原体中分离。然而，在优选的实施方案中，3’ -非翻译区、转录终止和多聚腺苷酸化信号来自被用作本发明的启动子来源的基因。
[0240]优选的多聚腺苷酸化序列是来自植物基因或农杆菌T-DNA基因的序列(例如OCS(章鱼碱合酶)或NOS (胭脂氨酸合酶)基因的终止子序列)。
[0241]增强子的例子包括来自CaMV35S启动子、章鱼碱合酶基因(Ellis等人，1987)、稻肌动蛋白I基因、玉米醇脱氢酶基因(Callisl987)、玉米shrunken I基因(Vasill989)、TMVOmega元件(Galliel989)和非植物真核生物的启动子(例如酵母；Mal988)的元件。根据本发明使用的载体可以被构建为包括ocs增强子元件。该元件首先被鉴别为ultilane的章鱼碱合酶(ocs)基因的16bp回文结构增强子(Ellisl987)，并且存在于至少10种其他启动子中(Bouchezl989)。当在植物转化的上下文中应用时,使用增强子元件(如ocs元件)并且特别是元件的多拷贝，可发挥增加邻接启动子的转录水平的作用。
[0242]本发明的表达盒(或源自它的载体)可包含另外的功能性元件，所述另外的功能性元件广义上理解为影响表达盒或载体或包含所述表达盒或载体的转基因生物的构建、增殖或功能的所有元件。这类功能性元件可包括复制起点(允许在细菌中的复制；pBR322的ORI或P15A ori ；Sambrookl989),或农杆菌T-DNA转移所需的元件(例如T-DNA的左边界和/或右边界)。
[0243]最终，用于导入到例如双子叶植物基因组中的最理想的DNA区段可以是编码理想性状的(例如，增加的每英亩产量、真菌抗性)和被导入处于新型启动子或增强子等的控制之下的同源基因或基因家族，或者甚至可能是同源的或组织特异性的(例如，根、根颈/叶鞘、轮生体、茎杆、earshank、核或叶特异性的)启动子或控制元件。实际上，设想本发明的特别的用途是在表皮或叶肉中的基因表达，或在表皮和/或叶肉中的诱导型基因表达。
[0244]另外，可以构建载体并用于在转基因植物的细胞内胞内靶向特异性的基因产物，或将蛋白质导向至胞外环境。这一般可以通过联结编码转运肽或信号肽序列的DNA序列与特别的基因的编码序列来实现。所获得的转运肽或信号肽可分别将蛋白质运输到特别的胞内或胞外目的地，然后被翻译后去除。转运或信号肽的作用是促进蛋白质通过胞内膜(例如液泡、囊泡、质体和线粒体膜)的运输，而信号肽指导蛋白质通过胞外膜。
[0245]这类用途的特别的例子涉及将除草剂抗性基因(如EPSPS基因)导向至特别的细胞器(例如叶绿体)而非导向至细胞质。这是通过使用赋予蛋白质的质体特异性靶向的rbcs转运肽来示例的。此外，提出将某些负责雄性不育的基因靶向至线粒体，或将某些植物病原体生物抗性的基因靶向至胞外空间，或将蛋白质靶向至液泡可被认为是理想的。
[0246]通过促进蛋白质运输到细胞内外的区室中，这些序列可以增加保护所述序列免受蛋白水解降解的基因产物的积累。这些序列还允许将来自高表达基因的另外的mRNA序列附着至基因的编码序列。因为被核糖体翻译的mRNA比裸露的mRNA更稳定，在基因前面存在可翻译的mRNA可以增加来自基因的mRNA转录物的整体稳定性，并从而增加基因产物的合成。由于转运和信号序列通常是在翻译后从初始翻译产物中去除的，这类序列的使用允许添加不出现在最终多肽中的额外的翻译序列。靶向某些蛋白质是理想的，为了增强蛋白质的稳定性(US5，545,818)。
[0247]靶向细胞内的DNA自身是有用的。例如，可以将导入的DNA靶向至核，因为这可以增加转化的频率。在核本身内，靶向基因是有用的，为了实现位点特异性整合。例如，通过转化导入基因，替代细胞内现有的基因是有用的。其他元件包括可以受内源或外源活性剂，例如受锌指蛋白调节的元件，所述锌指蛋白包括天然存在的锌指蛋白或嵌合的锌指蛋白(参见例如 US5, 789，538 ；W099/48909 ；W099/45132 ；W098/53060 ；W098/53057 ；W098/53058 ；W000/23464 ；W095/19431 ;和W098/54311)或myb样转录因子。例如，嵌合锌指蛋白可包括与特异性的DNA序列结合的氨基酸序列(锌指)和活化(例如GAL4序列)或阻遏与特异性的DNA序列连接的序列的转录的氨基酸序列。
[0248]本发明的一个目标是提供重组DNA分子，所述重组DNA分子包含与目标核苷酸区段有效连接的根据本发明的核苷酸序列。
[0249]目标核苷酸区段是涉及作物研发的商业市场和目标的反映。农作物和目标市场发生变化，以及发展中国家打开了世界市场，将出现新的农作物和技术。此外，随着对农业性状和特征(例如产量和杂种优势)的理解增加，对用于转化的基因的选择也将相应改变。目标核苷酸的常规目录包括例如参与信息的基因，如锌指；参与信息沟通的基因，如激酶；和参与持家的基因，如热激蛋白。更具体的转基因目录包括例如编码重要的农业性状、昆虫抗性、疾病抗性、除草剂抗性、不育、谷物特征和商业产物的基因。一般而言，目标基因包括参与淀粉、油、碳水化合物或营养物代谢的基因，以及影响核大小、蔗糖负载、锌指蛋白的基因，参见例如 US5, 789，538 ；W099/48909 ；W099/45132 ；W098/53060 ；W098/53057 ；W098/53058 ；W000/23464 ；W095/19431 ;和 W098/54311 等。
[0250]本领域技术人员可认识到，转基因在植物中的表达水平和调节可以随株系而显著不同。因此，必须测试若干个株系以发现具有理想的表达水平和调节的株系。一旦鉴别出具有理想的嵌合Cre转基因调节特异性的株系，就可以将其与携带不同的无活性的复制子或无活性的转基因的株系杂交进行激活。
[0251]可以与编码多肽的目标基因连接的其他序列是可以靶向植物细胞内的特异性细胞器(例如线粒体、核或质体)的序列。可以通过为多肽提供恰当的靶向肽序列实现靶向，所述靶向肽序列例如分泌信号肽(用于分泌，或细胞壁或膜靶向、质体转运肽、叶绿体转运肽，如叶绿素a/b结合蛋白、线粒体靶肽、液泡靶向肽或核靶向肽等。可使用例如核酮糖二磷酸羧化酶转运肽的小亚基、EPSPS转运肽或二氢吡啶二羧酸合酶转运肽的质体细胞器靶向序列(参见W000/12732)。质体是源自原质体的植物细胞器类别，包括叶绿体、白色体、淀粉体和有色体。质体是植物中的生物合成的主要位置。除叶绿体中的光合成外，质体也是脂类生物合成、硝酸盐还原成氨和淀粉储藏的位置。虽然质体自身含有环状基因组，位于质体中的大部分蛋白质是由核基因组编码，并从细胞质输入到细胞器中。
[0252]本发明使用的转基因通常是指导特别的蛋白质或多肽产物的表达的基因，但也可以是不可表达的DNA区段，例如转座子(如不指导自身转座的Ds)。如本文中使用的，“可表达的基因”是能够转录成RNA (例如，mRNA、反义RNA等)或翻译成蛋白质、作为目标性状表达等的任何基因，不限于可选择的、可筛选的或不可选择的标志物基因。本发明还考虑，当不必是标志物基因的可表达基因与标志物基因组合应用时，可以在用于转化的相同或不同的DNA区段上应用分离的基因。在后一情况下，将不同的载体同时递送给受体细胞，使共转化最大化。
[0253]向受体细胞递送的特别的DNA区段的选择通常取决于转化的目的。转化作物植物的一个主要目的是向植物增加一些商业上理想的、农业上重要的性状。这类性状包括但不限于除草剂抗性或耐受性；昆虫抗性或耐受性；疾病抗性或耐受性(病毒、细菌、真菌、线虫);胁迫耐受性和/或抗性，示例如对干旱、热、寒冷、冰冻、湿度过大、盐胁迫的抗性或耐受性；氧化胁迫；增加的产量；食物含量和组成；生理表现；雄性不育；干倒；直立性；增殖性；淀粉性质；油量和质量等。可以理想地掺入一个或多个赋予任何这类理想性状的基因，例如编码病原体抗性的基因。
[0254]在某些实施方案中，本发明考虑了用多于一种有利的转基因转化受体细胞。可以使用不同的转基因编码载体，或使用掺入了两个或多个基因编码序列的单个载体，在单次转化事件中提供两种或更多种转基因。例如，具有处于聚合、分离或共线性取向的bar和aroA表达单元的质粒被认为是特别有效的。其他优选的组合是昆虫抗性基因(如Bt基因)与蛋白酶抑制剂基因(如PinII)的组合，或组合使用bar与任何上述基因。当然，需要时可以使用任何两种或多种任何说明的转基因，例如赋予除草剂、昆虫、疾病(病毒性、细菌性、真菌性、线虫)或干旱抗性、雄性不育、干倒、站立性、增殖性、淀粉性质、油量和质量、或增加产量或营养质量的转基因。
实施例
[0255]材料和一般方法
[0256]除非另外指出，实施例中的化学品和试剂获得自Sigma Chemical Company (St.Louis, MO)o 限制性内切酶来自 New England Biolabs(Ipswich, MA, USA)或Roche (Indianapolis, IN),由 MWG Biotech Inc.(High Point, NC)合成寡核苷酸，而其他修饰的酶或涉及生物化学和分子生物学测定的试剂盒来自Clontech(Palo Alto, CA)、Pharmacia Biotech(Piscataway, NJ)、Promega Corporation (Madison,WI)或 Strata基因(La Jolla, CA )。用于细胞培养基的材料获得自Gibco/BRL (Gaithersburg, MD)或DIFCO(Detroit, Ml)。按Sambrook(1989)所述，实施用于本发明目的的克隆步骤，例如限制性酶切割、琼脂糖凝胶电泳、DNA片段纯化、将核酸转移至硝酸纤维素和尼龙膜、连接DNA片段、转化大肠杆菌细胞、生长细菌、扩增噬菌体和重组DNA的序列分析。按Sanger方法(Sanger, 1977)，用ABI激光荧光DNA测序仪实施重组DNA分子的测序。
[0257]实施例1:鉴别和验证大豆中假定赋予组成型表达或在植物表皮中表达的启动子
[0258]1.1鉴别假定赋予组成型表达或在表皮中表达的启动子
[0259]按商业供应商AFLP 比较表达技术(Keygene N.V.，P.0.Box216, 6700AEWageningen, The Netherlands),使用BASF生产的来自34个大豆组织的RNA样品，实施大豆基因表达制谱分析(表I)。就所有组织中的组成型表达和表皮中的表达选择AFLP条带。
[0260]表1:用于AFLP筛选的大丑样品
[0261]
【权利要求】
1.能够调节在植物中的表达的分离的核酸分子，所述核酸分子选自: i)由SEQ ID N0:3、27、28、29或30描述的序列，和 ?)由SEQ ID NO:3、27、28、29或30任一项描述的分子的至少250个连续碱基的片段，和 iii)与由SEQID NO:3、27、28、29或30任一项描述的转录调节核苷酸分子具有至少60%序列同一'I"生的核苷酸分子，和 iv)至少250个连续的碱基的核苷酸分子，所述核苷酸分子与由SEQID NO:3、27、28、29或30任一项描述的转录调节核苷酸分子具有至少60%序列同一性，和 V)至少250个碱基的核苷酸分子，所述核苷酸分子能够在下述条件下，与由SEQ IDNO:3、27、28、29或30任一项描述的转录调节核苷酸分子，或其互补序列杂交，所述条件等价于在50°C在7%十二烷基磺酸钠(SDS)、0.5M NaPO4UmM EDTA中杂交并在50°C在0.1XSSC,0.1%SDS 中洗涤; vi)至少250个碱基的核苷酸分子，所述核苷酸分子能够在下述条件下，与包含由SEQID N0:3、27、28、29或30任一项描述的转录调节核苷酸分子或其互补序列的250个或更多个连续核苷酸的核酸杂交，所述条件等价于在50°C在7%十二烷基磺酸钠(SDS)、0.5MNaPO4UmM EDTA 中杂交并在 50°C在(λ IX SSC,0.1% SDS 中洗涤； vii)核苷酸分子，所述核苷酸分子是上述i)至vi)中提及的任一核苷酸序列的互补序列或反向互补序列。
2.权利要求1的分离的核酸分子，其中分离的核酸分子可从植物基因组DNA的基因获得，所述基因编码多肽，所述多肽包含与SEQ ID NO: 225描述的多肽具有至少80%氨基酸序列同源性的氨基酸序列。
3.权利要求1的分离的核酸分子，其中所述分离的核酸分子可从植物基因组DNA的基因获得，所述基因与SEQ ID N0:224描述的核酸分子具有至少80%序列同一性。
4.权利要求1至3的任一项的分离的核酸分子,其中权利要求1的ii)、iii)、iv)、v)、vi)和vii)中指定的序列能够修饰在植物或其部分中的转录。
5.权利要求1至4的任一项的分离的核酸分子,其中权利要求1的ii)、iii)、iv)、v)、vi)和vii)中指定的序列与SEQ ID N0:3所述的转录调节核苷酸序列具有基本相同的转录调节活性。
6.用于调节在植物中的表达的表达盒，所述表达盒包含 a)至少一个如权利要求1-5的任一项中定义的分离的核酸分子，所述分离的核酸分子能够调节在植物中的表达，和与其功能性连接的 b)至少一个核酸分子，所述核酸分子与所述能够调节在植物中的表达的分离的核酸分子异源。
7.载体，所述载体包含权利要求1-5的任一项的分离的核酸分子,或权利要求6的表达盒。
8.转基因宿主细胞或非人生物，所述转基因宿主细胞或非人生物包含权利要求1-5的任一项的分离的核酸序列、权利要求6的表达盒、或权利要求7的载体。
9.转基因植物或植物细胞，所述转基因植物或植物细胞包含权利要求1-5的任一项的分离的核酸序列、权利要求6的表达盒、或权利要求7的载体。
10.权利要求9的转基因植物或植物细胞，其中所述植物或植物细胞来自双子叶植物。
11.权利要求1-5的任一项的分离的核酸分子、权利要求6的表达盒、或权利要求7的载体用于调节在植物或植物细胞中的表达的用途。
12.生产权利要求6的表达盒或权利要求7的载体的方法，所述方法包括步骤 a.提供权利要求1-5的任一项的分离的核酸分子,和 b.功能性连接权利要求1-5的任一项的所述分离的核酸分子和与所述分离的核酸分子异源的核酸分子。
13.生产转基因植物的方法，所述方法包括步骤 a.提供权利要求6的表达盒或权利要求7的载体，和 b.将所述表达盒或载体转化到植物部分或植物细胞中，和 c.从所述经转化的植物部分或植物细胞再生植物。
【文档编号】A01H1/00GK103429740SQ201280014133
【公开日】2013年12月4日申请日期:2012年3月15日优先权日:2011年3月18日
【发明者】J·M·库恩, H·舒尔塞斯, J·V·哈廷格, L·P·洛亚尔, E·杜维尼格, M·萨利克, M·H·斯图维勒, O·奥斯瓦德申请人:巴斯夫植物科学有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：J·M·库恩;H·舒尔塞斯;J·V·哈廷格;L·P·洛亚尔;E·杜维尼格;M·萨利克;M·H·斯图维勒;O·奥斯瓦德
技术所有人：巴斯夫植物科学有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1. 木质生物质转化利用 2. 绿色包装材料
2、刘老师：1. 木质生物质化学及材料 2. 纸基功能材料
3、温老师：1. 纤维素纳米纤维材料的制备、改性及应用 2. 造纸法再造烟叶、新型烟草开发 3.生物质资源基油田助剂（封堵、驱油和钻井） 4. 改性植物纤维开发
4、张老师：1.合成生物学 2. 微生物代谢工程
5、李老师：1.水平基因转移的分子机制及应用研究 2.植物细胞工厂构建
如您是高校老师，可以点此联系我们加入专家库。