植物调控元件及其使用方法_2

文档序号:9932325阅读:来源:国知局
序列,变体包含在天然多核巧酸中的一个或多个内部位点处的一个或 多个核巧酸的缺失和/或添加,和/或在天然多核巧酸中的一个或多个位点处的一个或多个 核巧酸的置换。如本文所用,"天然"或"基因组"核巧酸序列包括天然存在的核巧酸序列。就 核巧酸序列来说,可使用本领域熟知的分子生物学技术来鉴定天然存在的变体,例如,用下 文概述的聚合酶链反应(PCR)和杂交技术来鉴定。核巧酸序列变体还包括人工合成的核巧 酸序列,比如那些采用定点诱变技术产生的核巧酸序列。一般来讲,本公开的特定核巧酸序 列的变体与运种特定核巧酸序列具有至少约40 %、45 %、50 %、55 %、60 %、65 %、70 %、 75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 或更高的序列 同一性,运通过本文别处描述的序列比对程序和参数确定。本公开的核巧酸序列的生物活 性变体与该序列不同的核酸残基数可能只有1至15个,只有1至10个(诸如6至10个),只有5 个,只有4、3、2个,或甚至只有1个。
[0038] 在一些实施方案中,编码调控区的核酸分子是"非基因组核酸序列"。如本文所用, "非基因组核酸序列"是指与天然或基因组核酸序列相比,在核酸序列中具有一个或多个改 变的核酸分子。
[0039] 核巧酸序列变体还涵盖由诱变和引起重组的工序(诸如DNA改组)产生的序列。采 用运种工序时,可操纵PVCV调控元件核巧酸序列,生成全新的PVCV调控元件。W此方式,从 一组相关的多核巧酸序列产生重组多核巧酸的文库,所述相关的多核巧酸序列包含具有实 质的序列同一性且可W在体外或体内同源重组的序列区域。运种DNA改组的策略是本领域 已知的。参见例如StemmeH 1994)Proc .Natl .Acad. Sci . USA 91:10747-10751; Stemmer (1994)NaUire 370:389-391;Crameri等人(1997)化Uire Biotech. 15:436-438;Moore等人 (1997) J.Mol. Biol. 272:336-347; Zhang 等人(1997)Proc.化 tl. Acad. Sci. USA 94:4504-4509;Crameri等人(1998)NaUire 391:288-291; W及美国专利5,605,793和5,837,458。
[0040] 本公开的核巧酸序列可用于分离来自其他生物,尤其其他植物,更具体地,其他单 子叶植物的相应序列。按此方式,可使用诸如PCR、杂交等之类的方法,基于运类序列与本文 所示序列的序列同一性来鉴定运类序列。因此,本公开涵盖W与本文所示的完整PVCV调控 元件序列或其片段的序列同一性为基础分离的序列。
[0041] 在PCR方法中,可W设计寡核巧酸引物用于PCR反应,W便从提取自任何感兴趣的 植物的基因组DNA中扩增出相应DNA序列。设计PCR引物和PCR克隆的方法是本领域公知的, 在下列文献中公开:Sambrook等人(1989)Molecular Cloning:A LaboratoiT Manual(第2 片反,Cold Spring Harbor Laboratory Press,Plainview,New York),下文称"Sambrook"。 还可参见Innis等人编辑(1990)PCR P;rotocols:A Guide to Methods and Applications (Academic Press ,New York); Innis 和Gelfand 编辑(1995)PCR Strategies(Academic Press,New 化rk);Innis和Gelfand编辑(1999)PCR Methods ManuaKAcademic Press,New 化rk)。已知的PCR方法包括但不限于利用成对引物、巢式引物、单一特异性引物、简并引物、 基因特异性引物、载体特异性引物、部分错配引物等的方法。
[0042] 在杂交技术中,将已知核巧酸序列的全部或一部分用作探针,所述探针与来自所 选生物体的一组克隆的基因组DNA片段中存在的其他相应核巧酸序列选择性杂交。杂交探 针可W用可检测基团(诸如32P)或任何其他可检测标记物标记。因此,例如,杂交用探针可 通过在本公开的PVCV调控元件序列基础上,对合成的寡核巧酸进行标记来制备。制备杂交 用探针和构建基因组文库的方法是本领域公知的,并且在Sambrook中有公开。
[0043] 例如,本文所公开的完整PVCV调控元件序列或其一个或多个部分,可用作能够与 相应的PVCV调控元件序列和信使RNA特异性杂交的探针。要在多种条件下实现特异性杂交, 此类探针包含的序列是PVCV调控元件序列中独一无二的,并且其长度为至少约10个核巧酸 或者其长度为至少约20个核巧酸。可采用PCR,用此类探针由选择的植物扩增相应的PVCV调 控元件序列。运项技术可W用于来从所需生物体分离另外的编码序列,或者用作诊断测定 法W确定编码序列在生物体中的存在。杂交技术包括杂交筛选铺板的DNA文库(隧菌斑或菌 落;参见例如,Sambrook)。
[0044] 此类序列的杂交可在严格条件下进行。术语"严格条件"或"严格杂交条件"意指探 针与其祀标序列杂交的程度比其与其他序列杂交的程度可检测地更高(例如比背景高至少 2倍)的条件。严格条件是序列依赖性的,在不同的情况中将会不同。通过控制杂交和/或洗 涂条件的严格性,可W鉴定与探针100%互补的祀标序列(同源探测)。另选地,可W调节严 格性条件W允许序列中的一些错配,使得检测到较低程度的相似性(异源探测)。探针长度 通常小于约1000个核巧酸,最佳地,其长度小于500个核巧酸。
[0045] 通常,严格条件为下列条件:盐浓度低于约1.5M钢离子(通常为约0.01至1.OM钢离 子浓度(或其他盐)),抑为7.0至8.3,对于短探针(例如10至50个核巧酸)的溫度为至少约30 °C,对于长探针(例如超过50个核巧酸)的溫度为至少约60°C。严格条件还可W通过添加去 稳定剂诸如甲酯胺来实现。示例性的低严格条件包括用30 %至35%甲酯胺、IM化Cl、1 % SDS(十二烷基硫酸钢)的缓冲溶液在37°C下杂交,然后在50至55°C下用1倍至2倍SSC(20倍 SSC = 3 . OM NaCl/0.3M巧樣酸S钢)洗涂。示例性的中等严格条件包括在40%至45 %甲酯 胺、1. OM化Cl、1 % SDS中在37°C下杂交,然后在55至60°C下用0.5倍至1倍SSC洗涂。示例性 的高严格条件包括在50 %甲酯胺、IM化Cl、1 % SDS中在37 °C下杂交,最后在60至65 °C下用 0.1倍SSC至少洗涂30分钟。杂交持续时间通常少于约24小时,一般约4至约12小时。洗涂的 持续时间将为至少足W达到平衡的时间长度。
[0046] 特异性通常随杂交后的洗涂条件而变化,关键因素为最终洗涂溶液的离子强度和 溫度。就DNA-DNA杂交体来说,可根据Meinkoth和Wahl (1984)Anal. Biochem. 138:267-284中 提出的方程Tm=81.5°C+16.6aogM)+0.41(%GC)-0.61(%form)-500/L来计算Tm(热解链 溫度);其中M为单价阳离子的摩尔浓度,%GC为DNA中鸟嚷岭核巧酸和胞喀晚核巧酸的百分 比,%form为杂交溶液中甲酯胺的百分比,并且L为杂交体的长度(单位为碱基对)。时1为 50%的互补祀标序列与完美匹配的探针杂交时的溫度(在确定的离子强度和抑下)。错配率 每增加1% ,Tm下降约rC;因此,可通过调节时1、杂交条件和/或洗涂条件,来与具有所需同 一性的序列杂交。例如,如果寻求同一性>90%的序列,则Tm可降低10°C。通常情况下,将严 格条件选择为比特定序列及其互补序列在确定的离子强度和抑下的Tm低约5°C。然而,极严 格条件可W利用比Tm低1、2、3或4°C的杂交和/或洗涂;中等严格条件可W利用比Tm低6、7、 8、9或10°C的杂交和/或洗涂;低严格条件可W利用比Tm低11、12、13、14、15或20°C的杂交 和/或洗涂。利用所述公式,杂交和洗涂组成W及所需的Tm,普通技术人员将认识到,杂交 和/或洗涂溶液的严格性的变化固有地得到了描述。如果所需的错配程度导致Tm低于45°C (水溶液)或32°C (甲酯胺溶液),则优选增大SS切农度,W便可使用较高的溫度。有关核酸杂 交的详尽指导参见Tijssen( 1993)1 曰bor曰tory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes ,第I部分,第2章 化lsevie;r,New York);和Ausubel等人编辑(1995)Cu;rrent Protocols in Molecular Biology,第2 章 (Greene Publishing and Wiley-Interscience ,New York)。另参见 "Sambrook"。
[0047] 因此,本公开涵盖具有组成型启动子活性的分离序列,运种分离序列在严格条件 下与本文所公开的PVCV调控元件序列或其片段杂交。
[0048] 下列术语用来描述两条或更多条核酸或多核巧酸之间的序列关系:(a)"参考序 列",(b)"比较窗口",(C)"序列同一性",(d)"序列同一性百分比",(e)"实质同一性"。
[0049] (a)本文所用的"参考序列"是用作序列比较的基础的确定的序列。参考序列可W 是指定序列的子集或全部;例如,为全长CDNA或基因序列的区段或完整的CDNA或基因序列。
[0050] (b)本文所用的"比较窗口"是指多核巧酸序列的连续的且指定的区段,其中该比 较窗口中的多核巧酸序列相比于参考序列(不包含添加或缺失)可包含添加或缺失(即空 位),W便两条序列进行最佳比对。通常,比较窗口长度为至少20个连续的核巧酸,并且任选 地可为30、40、50、100个或更长。本领域技术人员认识到,为避免由于在多核巧酸序列中加 入空位所致的与参考序列的高度相似性,通常引入空位罚分并从匹配数扣除空位罚分。
[0051] 将序列比对W作比较的方法是本领域公知的。因此,任何两条序列之间的序列同 一性百分比的确定可使用数学算法来完成。此类数学算法的非限制性示例是Myers和 Miller 的算法(Myers 和 Miller(1988)CABI0S4:11-17); Smith 等人的局部比对算法(Smith 等人(1981)Adv .Appl .Math. 2:482);Needleman和Wunsch的全局比对算法(Needleman和 Wunsch(1970)J.Mol.Biol.48:443-453) ;Pearson和Lipman的捜索局部比对方法(Pearson 和Lipman(1988)P;roc.化tl .Acad. Sci . 85:2444-2448);KarIin和Altschul的算法化arIin 和Altschul(1990)Proc.化tl.Acad.Sci.USA 872264,该算法在Karlin和Altschul(1993) Proc. Natl. Acad. Sci . USA 90:5873-5877 中进行 了修改)。
[0052] 运些数学算法的计算机执行可W用来比较序列W确定序列同一性。此类执行包括 但不限于:PC/Gene程序(可从InteIligenetics(Mountain ViewsCalifornia)购买)中的 化USTAL;GCG Wisconsin Genetics SoftwarePackage''版本 1〇(可从Accelrys有限公司 (9685Scranton RoacUSan Diego,化Iifornia,USA)购买)中的ALIGN程序(版本2.0)和GAP、 BESTFIT、BLAST、FASTA和TFASTA。使用运些程序的比对可用默认参数执行。W下文献对 CLUSTAL程序进行了详细描述:Higgins等人(1988)Gene 73:237-244( 1988) ;Higgins等人 (1989) CABI0S 5:151-153;Co;rpet等人(1988)Nucleic Acids Res.l6:10881-90;Huang等 人(1992)CABI0S 8:155-65;Pearson等人(1994)Meth.Mol.Biol.24:307-33UALIGN程序是 基于Myers和MilleH 1988)(出处同上)的算法。当比较氨基酸序列时,ALIGN程序可使用 PAM120加权残基表(wei曲t residue table)、空位长度罚分12和空位罚分4aAltschul等人 (1990) J.Mol. Biol. 215:403 中提出的 BLAST 程序基于上文 Karlin 和 Altschul (1990)中的算 法。BLAST核巧酸捜索可用化ASTN程序,得分=100,字长=12来进行,W获得与编码本公开 蛋白质的核巧酸序列同源的核巧酸序列。BLAST蛋白质捜索可W用BLASTX程序,得分= 50, 字长=3来进行,W获得与本公开蛋白质或多肤同源的氨基酸序列。为获得空位比对结果进 行比较,可按Altschul等人(1997)Nucleic Acids Res. 25 :3389中所述,利用空位化AST (BLAST 2.0)。另选地,可使用PSI-BLAST(BLAST 2.0)执行迭代捜索,检测分子间的远源关 系。参见Altschul等人,(1997),出处同上。当采用BLAST、Gapped BLAST、PSI-BLAST时,可 W 使用各个程序的默认参数(例如BLASTN用于核巧酸序列,BLAST'S用于蛋白质)。参见美国国 家生物技术信息中屯、的网站。还可依靠手动检查,来完成序列比对。
[0053] 除非另外指明,否则本文提供的序列同一性/相似性值是指使用采用W下参数的 GAP版本10或其任何等同程序获得的值:核巧酸序列的%同一性和%相似性采用GAP权重50 和长度权重3 W及nwsgapdna. cmp评分矩阵;氨基酸序列的%同一性和%相似性采用GAP权 重8和长度权重2W及化0SUM62评分矩阵。所谓"等同程序"意指任何序列比较程序,所述程 序对于所考虑的任何两个序列,与GAP版本10所产生的相应比对结果相比时,产生具有相同 核巧酸残基或氨基酸残基匹配和相同序列同一性百分比的比对结果。
[0化4] GAP 使用Needleman 和 Wunsch(1970)J.Mol.Biol.48:443-453 中的算法,W 找到两 个完全序列的比对,该比对能使匹配数最大、空位数最小。GAP考虑所有可能的比对和空位 位置,并产生具有最大数目的匹配碱基和最少的空位的比对。它使得可W提供W匹配碱基 数为单位的空位产生罚分和空位延伸罚分。GAP对于其插入的每个空位,必须利用匹配的空 位产生罚分数。如果选择大于零的空位延伸罚分,GAP对于每个插入的空位必须另外利用空 位长度乘W空位延伸罚分。对于蛋白质序列,GCG Wisconsin Genetics Software Package 的版本10中的默认空位产生罚分值和空位延伸罚分值分别为8和2。对于核巧酸序列,默认 空位产生罚分为50,而默认空位延伸罚分为3。空位产生罚分和空位延伸罚分可WW选自0 至200的整数来表示。因此,例如,空位产生罚分和空位延伸罚分可W为0、1、2、3、4、5、6、7、 8、9、10、15、20、25、30、35、40、45、50、55、60、65 或更大。
[0055] GAP给出该家族中的具有最佳比对的一个成员。可能存在运个家族的许多成员,但 其他成员没有更好的品质。GAP显示用于比对的四个优值因素:品质、比率、同一性和相似 性。品质是为了将序列进行比对而最大化的指标(metric)。比率是品质除W较短区段中的 碱基数。同一性百分比是实际匹配的符号的百分比。相似性百分比是相似的符号的百分比。 将相应于空位的符号忽略。当一对符号的评分矩阵值大于或等于0.50(相似性阔值)时,评 定为相似性。GCG Wisconsin Genetics Software Pac
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1