基因表达或活性增强性元件的制作方法_5

文档序号：9756469阅读：来源：国知局

6%、77%、78%、至79%、通常至少80%、例如，81%-84%、至少 85%、例如，86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、至98% 和99 %核巧酸序列同一'性。
[0204] 可W使用Smith-Waterman序列比对算法(参见例如，Wate;rman( 1995))实施序列比较。优选地在W下参数情况下使用locals程序第1.16版:匹配：1，错配罚分:0.33,空位开放罚分:2,空位延伸罚分:2。
[0205] 使用W下术语来描述两个或多个核酸或多核巧酸之间的序列关系：（a)"参考序列"、（b)"比较窗口"、（C)"序列同一性"、（d)"序列同一性百分数"和(e)"实质同一性"。
[0206] 如本文中所用，"参考序列"是作为序列比较基础所用的定义序列。参考序列可W 是指定序列的亚集合或全部；例如，作为能够调节植物中表达的全长cDNA或基因序列或分离的核酸序列的区段;优选地，能够调节植物中表达的完整cDNA或基因序列或分离的核酸序列是参考序列。
[0207] 如本文中所用，"比较窗口"指多核巧酸序列的连续和指定区段，其中与参考序列 (其不包含添加或缺失)相比，在比较窗口中的多核巧酸序列可W包含添加或缺失（即空位） W最佳地比对两个序列。通常，比较窗口是至少20个连续核巧酸长度，并且任选地可W是 30、40、50、100个或更长的连续核巧酸长度。在一个优选实施方案中，定义序列同源性的比较窗口由整个查询序列组成。本领域技术人员理解为了避免因多核巧酸序列中包含空位而致与参考序列的高度相似性，一般引入空位罚分并且从匹配数中扣除空位罚分。
[0208] 比对序列用于比较的方法是本领域熟知的。因此，可W使用数学算法完成任意两个序列之间同一性百分数的确定。运类数学算法的优选的非限制性例子是Myers和Miller， 1988的算法;Smith等人，1981的局部同源性算法;Needleman和Wunsch，1970的同源性比对算法;？6曰^〇11和^91]1曰]1，1988的检索相似性法;1(曰1'1;[]1和4113证111，1990的算法，如1(曰1'1;[]1 和A1 tschul，1993中修改的算法。
[0209] 运些数学算法的计算机执行可W用于序列的比较W确定序列同一性。此类执行包括但不限于：PC/Gene程序（从Intelligenetics，Moun1:ain View，Moun1:ain View，&lif.可获得）中的CLUSTAL ALIGN程序（第2.0版）和Wi scons in Genet i cs软件包第8版（从Genet i cs Computer G;roup(GCG)，575 Science Drive,Madison,Wis.，USA可获得）中的GAP、邸STFIT、 BLAST、FASTA和TFASTA。可W利用默认参数进行使用运些程序的比对。充分描述了化USTAL 程序化 iggins 1988，1989;Co 巧 et 1988;Huang 1992;Pearson 1994)〇ALIGN 程序基于上文的Myers和Miller算法。A1 tschul等人，1990的BLAST程序基于上文的Karl in和A1 tschul算法。优选地使用Clustal W算法（Thompson 1994;例如，在软件VectorNTI?，第9版中； Invitrogen Inc.)，采用评分矩阵化0SUM62MT2，用默认设置(空位开口罚分15/19，空位延伸罚分6.66/0.05;缺口分离罚分范围8; %比对延迟同一性40;使用残基特异性开口和亲水残基开口），执行多重比对(即超过2个序列的比对）。
[0210] 用于进行BLAST分析的软件是通过国家生物技术信息中屯、可公开获得的化ttp:// WWW. ncbi . nlm. nih. gov/)。运种算法设及首先通过确定查询序列中长度为W的短字，鉴定高评分序列对化SP)，其中与数据库序列中具有相同长度的字比对时，所述短字匹配或满足某些正值阔评分T。将T称作相邻字评分阔值(Altschul，1990)。运些初始相邻字命中充当种子，所述种子用于启动检索W找到含有运些种子的更长HSP。所述字命中随后在两个方向沿每个序列尽可能远地延伸，只要可W提高累积比对评分即可。对于核巧酸序列，使用参数Μ (一对匹配残基的报酬评分；总是>0)和Ν(错配残基的惩罚评分；总是<0)计算累积评分。对于氨基酸序列，使用评分矩阵计算累积评分。字命中在每个方向上的延伸在W下情况时停止:累积比对评分从其最大实现值跌落达量X，累积评分因积累一个或更多负评分残基比对而达到或低于零，或抵达两个序列中任一序列的末端。
[0211] 除计算序列同一性百分数之外，BLAST算法也执行两个序列之间相似性的统计分析(参见，例如，Karlin和Altschul(1993))。由BLAST算法提供的一种相似性量度是最小总和概率(P(N))，其提供2个核巧酸序列或氨基酸序列之间的匹配会因偶然发生的概率指示。例如，如果最小总和概率在测试核酸序列与参考核酸序列的比较中小于约0.1、更优选小于约0.01并且最优选小于约0.001，则测试核酸序列视为类似于参考序列。
[0引引为了出于比较目的获得空位比对，可W如Altschul等人，1997中所述那样使用空位BLAST(在BLAST 2.0中）。备选地，（BLAST2.0中的）PSI-BLAST可W用来执行检测分子之间远缘关系的迭代检索。参见Altschul等人，上文。当使用BLAST、空位BLAST和PSI-BLAST时，可W使用相应程序(例如用于核巧酸序列的BLASTN、用于蛋白质的BLASTX)的默认参数。（用于核巧酸序列的)BLASTN程序使用字长度(W)ll、期望化）10、临界值100、M = 5、N = -4和两条链比较作为默认。对于氨基酸序列，BLASTP程序使用字长度(W)3、期望化）10和化OSUM62评分矩阵作为默认（参见Henikoff和Henikoff，1989)。参见ht1:p://www.ncbi .nlm.nih.gov。比对也可W通过视检W手工进行。
[0引引为了本发明的目的，优选地使用BlastN程序(第1.4.7版或更近版本)连同其默认参数或任何等同程序，将用于确定序列同一性百分数的核巧酸序列与本文公开的启动子序列比较。"等同程序"意指任何序列比较程序，其中对于所讨论的任意两个序列而言，与通过优选程序生成的相应比对结果比较时，所述的序列比较程序生成了具有相同核巧酸或氨基酸残基匹配和相同序列同一性百分数的比对结果。
[0214]如本文中所用，"序列同一性"或"同一性"在两个核酸或多肤序列的背景下意指，当为了指定比较窗口范围内的最大对应性进行比对时，在运两个序列中相同的残基。当序列同一性百分数就蛋白质而使用时，认识到不相同的残基位置往往差异在于保守性氨基酸置换，其中氨基酸残基被置换为具有相似化学属性(例如电荷或疏水性)的其他氨基酸残基并且因而不改变该分子的功能性属性。当序列差异在于保守性置换时，可W向上调节序列同一性百分数W针对该置换的保守本质进行校正。将因此类保守性置换而不同的序列称作具有"序列相似性"或"相似性"。用于进行运种调节的方法是本领域技术人员熟知的。通常地，运设及将保守性置换计算为部分而非完全的错配，因而提高序列同一性百分数。因此，例如，将记分1给予一个相同氨基酸并且将记分0给予一个非保守性置换的情况下，向一个保守性置换给予一个在0至1之间的记分。计算保守性置换的记分，例如，如在程序PC/GE肥 (Intelligenetics，Moun1:ain View,&lif.)中执行那样。
[0引引如本文中所用，"序列同一性百分数"意指通过在比较窗口、优选地如SEQ ID N0:x 所定义的完整查询对象或参考序列范围内比较两个最佳比对的序列而测定的值，其中与参考序列(其不包含添加或缺失)相比时，所述多核巧酸序列在比较窗口中的部分可W包含添加或缺失（即空位）W最佳地比对运两个序列。通过W下方式计算百分数，即确定其中相同的核酸碱基或氨基酸残基在两个序列中出现的位置的数目W产生匹配位置的数目，将匹配位置的数目除W比较窗口中的位置总数并且将结果乘W100W产生序列同一性百分数。
[0216] 术语多核巧酸序列的"实质同一性"意指包含下述序列的多核巧酸，其中使用所述的比对程序之一，使用标准参数时，所述序列与参考序列相比具有至少90%、91%、92%、 93%或94%和最优选地至少95%、96%、97%、98%或99%序列同一性。本领域技术人员将会认识到通过考虑密码子简并性、氨基酸相似性、可读框定位等，可W适当调整运些值W确定两个核巧酸序列编码的蛋白质的相应同一性。用于运些目的的氨基酸序列的实质同一性通常情况下意指至少90%、95%和最优选地至少98%的序列同一性。
[0217] 核巧酸序列基本上同一的另一个指标是运两个分子是否在严格条件下彼此杂交 (见下文）。通常，将严格条件选择是在确定的离子强度和pH，低于特定序列的热解链溫度 (Tm)约5°C。但是，严格条件涵盖约rC至约20°C范围内的溫度，运取决于如本文中另行规定的所需严格程度。如果严格条件下彼此不杂交的核酸编码的多肤基本上同一，则所述核酸仍是基本上同一的。例如当使用遗传密码所允许的最大密码子简并性产生核酸拷贝时，运种情况可W出现。两个核酸序列基本上同一的另一个指标是当第一核酸编码的多肤与第二核酸编码的多肤在免疫上发生交叉反应时。
[0218] 术语"实质同一性"在多肤的背景下表示肤包含在指定的比较窗口范围内与参考序列具有至少90%、91%、92%、93%或94%、或甚至更优选地，95%、96%、97%、98%或 99%序列同一性的序列。优选地，使用化edleman和Wunsch(1970)同源性比对算法实施最佳比对。两个肤序列基本上同一的一个指标是一种肤与针对第二肤产生的抗体发生免疫反应。因而，例如，在两个肤仅因保守性置换而不同的情况下，一个肤与第二肤基本上同一。
[0219] 对于序列比较，一般地一个序列充当与受试序列比较的参考序列。当使用序列比较算法时，将受试序列和参考序列输入计算机，根据需要，指定子序列坐标，并指定序列算法程序参数。基于指定的程序参数，序列比较算法随后相对于参考序列计算受试序列的序列同一性百分数。本发明的参考序列由SEQ ID N0:x定义。
[0220] 两个核酸序列基本上同一的一个指标是运两个分子在严格条件下彼此杂交。短语 "特异性杂交至"指某分子在严格条件下仅与特定核巧酸序列结合、形成双链体或杂交，此时所述序列存在于复杂混合物(例如，总细胞DNA或RNA)中。"基本上结合"指探针核酸和祀核酸之间的互补性杂交并且包含可W通过降低杂交介质的严格性而容许的少量错配W实现所需的对祀核酸序列的检测。
[0221] 在核酸杂交实验如DNA印迹和RNA印迹杂交的背景下，"严格杂交条件"和"严格杂交洗涂条件"是序列依赖性的，并且在不同的环境参数下不同。Tm是(在确定的离子强度和 pH下)运样的溫度，在所述溫度，50%的祀序列与完美匹配的探针杂交。特异性一般是杂交后的洗涂、作为关键因素的离子强度和终末洗涂溶液的溫度的函数。对于DNA-DNA杂交分子，Tm可W从Me inko化和W址1，1984的等式逼近：
[0222] Tm=81.5°C+16.6(l〇gi〇M)+0.41 ( %GC)-0.61 ( % 甲酯胺）-500/L
[0223] 其中Μ是一价阳离子的体积摩尔浓度，％GC是DNA中鸟巧和胞喀晚核巧酸的百分数，％form是杂交溶液中甲酯胺的百分数，并且L是W碱基对计的杂交分子长度。对于每1% 的错配，Tm下降约rC;因此，可W调节Tm、杂交和/或洗涂条件W与具有目的同一性的序列杂交。例如，如果寻求具有>90%同一性的序列，则可W将Tm降低10°C。通常，将严格条件选择成比确定的离子强度和pH时特定序列及其互补序列的热解链点I低约5°C。然而，极严格条件可W利用比热解链点I低1、2、3、4、5、6、7、8、9或10°C时的杂交和/或洗涂；中等严格条件可W利用比热解链点I低6、7、8、9或10°C时的杂交和/或洗涂;低严格性条件可W利用比热解链点I低11、12、13、14、15或20°C时的杂交和/或洗涂。使用该等式、杂交组合物和洗涂组合物和所需的Tm，普通技术人员将理解，内在描述了杂交和/或洗涂溶液的严格性的变化。如果想要的错配程度产生小于45°C(水溶液)或32°C(甲酯胺溶液）的Tm，则优选增加 SS切农度，从而可W使用更高的溫度。对核酸杂交的广泛指导存在Tijssen，1993中。通常，将高度严格杂交和洗涂条件选择成比确定的离子强度和抑时特定序列的热解链点Tm低约5°C。
[0224] 高度严格的洗涂条件的例子是在72°C时0.15M化Cl持续约15分钟。严格洗涂条件的例子是在65°C时0.2XSSC洗涂持续15分钟（对于SSC缓冲液的描述，参见Sambrook，上文）。经常，高严格性洗涂之前是低严格性洗涂W除去背景探针信号。用于例如多于100个核巧酸的双链体的中等严格性洗涂的例子是在45°C时IX SSC持续15分钟。用于例如多于100 个核巧酸的双链体的低严格性洗涂的例子是在40°C时4X至6 X SSC持续15分钟。对于短探针 (例如，约10个至50个核巧酸），严格条件一般地设及在抑7.0至8.3时小于约1.5M、更优选地约0.01至1.0M钢离子浓度(或其他盐）的盐浓度，并且溫度一般是至少约30°C并且对于长探针(例如，>50个核巧酸），是至少约60°C。也可W通过添加去稳定剂如甲酯胺实现严格性条件。通常，2X(或高于)特定杂交测定法中对不相关探针所观察的信噪比表示检测到特异性杂交。在严格条件下彼此不杂交的核酸如果它们编码的蛋白质是基本上同一的，则所述核酸仍是基本上同一的。例如，当使用遗传密码所允许的最大密码子简并性产生核酸拷贝时，出现运种情况。
[0225] 将非常严格的条件选择成等于特定探针的Tm。用于DNA印迹法或RNA印迹法中的滤膜上杂交具有多于100个互补性残基的互补性核酸的严格杂交条件的例子是例如，在37°c 于50 %甲酯胺、1M化Cl、1 % SDS中杂交，并且在60°C至65°C于0.1 X SSC中洗涂。示例性低严格性条件包括在37°〇用30%至35%甲酯胺，11化(：1，1%505(十二烷基硫酸钢）的缓冲溶液杂交，并且在50°C至55°C于IX至2 X SSC(20 X SSC = 3.0M化C1/0.3M巧樣酸Ξ钢）中洗涂。示例性中等严格性条件包括在37°C于40 %至45 %甲酯胺，1.0M化C1，1 % SDS中杂交，并且在 55°C至60°C于0.5X至1 X SSC中洗涂。
[0226] W下是可W用来克隆与本发明参考核巧酸序列基本上同一的直向同源核巧酸序列的成组杂交/洗涂条件的例子:参考核巧酸序列优选地与该参考核巧酸序列在50°C于7 % 十二烷基硫酸钢（SDS)，0.5M化P〇4，ImM抓TA中杂交，在50°C于2 X SSC，0.1 %SDS中洗涂；更合乎需要地在50°C于7%十二烷基硫酸钢(SDS)，0.5M NaP化，ImM抓TA中杂交，在50°C于 1XSSC，0.1%SDS中洗涂；更合乎需要地仍在50°C于7%十二烷基硫酸钢（SDS)，0.5M 化P〇4，ImM抓TA中杂交，在50°C于0.5 X SSC，0.1 % SDS中洗涂;优选地在50°C于7 %十二烧基硫酸钢（SDS)，0.5M NaP〇4，ImM抓TA中杂交，在50°C于0.1 X SSC，0.1 % SDS中洗涂；更优选地在50°C于7%十二烷基硫酸钢（SDS)，0.5M NaP化，ImM抓TA中杂交，在65°C于0.1X SSC，0.1%SDS 中洗涂。
[0227] 术语"脂肪酸"指链长度从约C12至C22变动的长链脂族酸(链烧酸）（虽然链长度更长和更短的酸是已知的）。优势的链长度在Ci6和C22之间。W0 2004/101757中提供了关于"饱和脂肪酸"与"不饱和脂肪酸"、"单不饱和脂肪酸"与"多不饱和脂肪酸"（或"PUFA")和"ω -6 脂肪酸"（ω-6或η-6)与"ω-3脂肪酸"（ω-3或η-3)之间的区别的额外细节。
[0228] 本文中通过简单注释系统^:r描述了脂肪酸，其中冒号前的数字表示脂肪酸中碳原子的数目并且冒号后的数字表示存在的双键的数目。脂肪酸名称后的数字表示从脂肪酸的簇基末端起双键的位置，后缀V'用于双键的顺式构型[例如，栋桐酸（16:0)、硬脂酸 (18:0)、油酸（18:1，9c)、岩芹酸（18:1，6c)、LA( 18:2，9c，12c)、GLA( 18:3，6c，9c，12c)和ALA (18:3,9c，12c，15c)]。除非另外说明，否则18:1、18:2和18:3指油酸、LA和亚麻脂肪酸。如果不另外专口书写，则认为双键呈顺式构型。例如，认为18:2(9,12)中的双键呈顺式构型。
[0229] 多不饱和脂肪酸(PUFA)的命名：
[0230]
[0232] 术语"脂肪"指在25°C为固态并通常饱和的脂质物质。
[0233] 术语"油"指在25°C为液态并通常为多不饱和的脂质物质。PUFA存在于一些藻类、产油酵母和丝状真菌的油中。"微生物油"或"单细胞油"是由微生物在其寿命期间天然产生的那些油。运类油可W含有长链PUFA。
[0234] 术语"PUFA生物合成途径"指将油酸转化成LA、EDA、GLA、DGLA、ARA、ALA、STA、ETrA、 ETA、EPA、DPA和DHA的代谢过程。文献中充分描述了运个过程(例如，参见WO 2005/003322)。简而言之，运种过程设及借助内质网膜中存在的一系列专用去饱和酶和延伸酶（即，"PUFA 生物合成途径酶"），添加碳原子延伸碳链及添加双键使分子去饱和。更具体地/'PUFA生物合成途径酶"指与生物合成PUFA相关的W下任何酶(及编码所述酶的基因），包括：Δ 4去饱和酶、A S去饱和酶、Δ 6去饱和酶、Δ 12去饱和酶、Δ 15去饱和酶、Δ 17去饱和酶、A 9去饱和酶、Δ 8去饱和酶、C14/16延伸酶、C16/18延伸酶、C18/2Q延伸酶和/或C2Q/22延伸酶。
[0235] "去饱和酶"是可W使一种或多种脂肪酸去饱和W产生有意义的单不饱和或多不饱和脂肪酸或前体的多肤。本文中特别感兴趣的是A 8去饱和酶，所述酶将使脂肪酸在从分子的簇基末端编号的第8个和第9个碳原子之间去饱和并且可W例如催化EDA转化成DGLA 和/或ETr A转化成ETA。其他有用的脂肪酸去饱和酶例如包括：
[0236] a.催化DGLA转化成ARA和/或ETA转化成EPA的Δ 5去饱和酶；
[0237] b.催化LA转化成GLA和/或ALA转化成STA的A 6去饱和酶；
[023引 C.催化DPA转化成DHA的Δ 4去饱和酶；
[0239] d.催化油酸转化成LA的Δ 12去饱和酶；
[0240] e.催化LA转化成ALA和/或GLA转化成STA的Δ 15去饱和酶；
[0241 ] f.催化ARA转化成EPA和/或DGLA转化成ETA的Δ 17去饱和酶;和
[0242] g.催化栋桐酸醋转化成栋桐油酸（16:1)和/或硬脂酸转化成油酸（18:1)的Δ 9去饱和酶。
[0243] 术语"延伸酶系统"指一套四种酶，运些酶负责延伸脂肪酸碳链W产生比延伸酶系统作用的脂肪酸底物长两个碳的脂肪酸。更具体地，延伸过程与脂肪酸合酶相关地出现，而 CoA是酷基载体化assner等人，The Plant Cell 8:281-292(1996))。在已经发现其具有底物特异性及还具有限速性的第一步骤中，丙二酸单酷-GoA与长链酷基-CoA缩合W产生C〇2 和β-酬酷辅酶A(其中酷基部分已经延长两个碳原子）。后续反应包括还原成β-径酷基-CoA、脱水成締酷辅酶A和第二次还原W产生延长的酷基-CoA。受延伸酶系统催化的反应的例子是化A转化成DGLA、STA转化成ETA和EPA转化成DPA。出于本文的目的，催化第一缩合反应 (即，丙二酸单酷-GoA转化成β-酬酷辅酶A)的酶将类属地称作"延伸酶"。通常而言，延伸酶的底物选择性或多或少地宽泛，但按链长度和不饱和度二者区分。因此，延伸酶可W具有不同特异性。例如，C16/1诞伸酶将利用Cl6底物（例如，栋桐酸醋），C18/20延伸酶将利用Cl8底物 (例如，GLA、STA)和C2Q/22延伸酶将利用C2Q底物(例如，EPA)。^类似方式，Δ9延伸酶能够催化LA和ALA分别转化成抓A和ETrA(参见W0 2002/077213)。重要的是指出，一些延伸酶具有宽泛特异性并且因此单一酶可能能够催化几种延伸酶反应(例如，因而作为C16/18延伸酶和 C18/20延伸酶发挥作用）。
[0244] W下附图和实施例W进一步的细节描述本发明。运些附图和实施例不意图W任何方式限制本发明的或权利要求的范围。
[024引图1描述用于多不饱和脂肪酸合成直至花生四締酸和二十碳五締酸的一般途径。 [0246]图2描述实施例中所用的一般克隆策略。
[0247 ]图3描述了本发明序列和现有序列的比对。
[0248]图4描述本申请中提到的序列。实施例
[0249] 就本发明而言，术语"双元载体"、"含有T-DNA的质粒"和"T-质粒"可互换使用。对双元载体及其使用的综述由Hellens等人Trends in Plant Science(2000)5,446-451给出。
[0250] 实施例1: 一般克隆方法
[0巧1]如Sambrook等人（1989) (Cold Spring 化rbor LaboratoiT Press : ISBN 0-87965-309-6)中所述那样开展多种克隆方法，例如，使用限制性核酸内切酶在特异性位点处切割双链DNA、琼脂糖凝胶电泳、DNA片段的纯化、转移核酸到硝酸纤维素膜和尼龙膜上，连接DNA片段、转化大肠杆菌细胞和细菌的培养。使用化usion?高保真DM聚合酶(肥B，法兰克福，德国），根据制造商的说明，进行聚合酶链反应。通

完整全部详细技术资料下载

当前第5页1 2 3 4 5 6