基因表达的调控的制作方法_3

文档序号:8908820阅读:来源:国知局
多核苷酸的全长范围的比较窗口上,存在同一性。
[0220] 可以如下方式测定多核苷酸序列同一性。在bl2seq (Tatiana A. Tatusova, Thomas L.Madden(1999), "Blast 2sequences-a new tool for comparing protein and nucleotide sequences",FEMS Microbiol Lett. 174:247-250)中,使用BLASTN(来自 BLAST 程序套件,2. 2. 5版[2002年11月]),将主题多核苷酸序列与候选多核苷酸序列进行比较, 所述bl2seq可从NCBI (ftp://ftp. ncbi. nih. gov/blast/)公开获得。除应关闭对低复杂 性部分的过滤以外,利用bl2seq的预设参数。
[0221] 可使用以下unix命令行参数检验多核苷酸序列的同一性:
[0222] bl2seq - i nucleotideseql - j nucleotideseq2 -FF- p blastn
[0223] 参数_F F关闭对低复杂性区段的过滤。参数_p为序列对选出适当算法。bl2seq 程序在"Identities ="行中将序列同一性报告为相同核苷酸的数量及百分比。
[0224] 使用总体序列比对程序(例如 Needleman, S. B.*Wunsch,C.D.(1970)J.Mol. Biol. 48, 443-453),也可以在候选序列与主题多核苷酸序列之间的重叠部分的整个长度上 计算多核苷酸序列同一性。Needleman-Wunsch总体比对算法的一个完整实现,参见EMBOSS 套件(Rice, P.Longden, I.and Bleasby, A. EMBOSS:The European Molecular Biology Open Software Suite, Trends in Genetics June 2000,第 16 卷,第 6 期,第 276-277 页)中的 needle 程序。该 EMBOSS 套件可从 http://www. hgmp. mrc. ac. uk/Software/EMBOSS/ 得到。 EuropeanBioinformatics Institute 月艮务器也在 http:/www. ebi. ac. uk/emboss/align/ 上在线提供执行两个序列之间的EMBOSS-needle总体比对的工具。
[0225] 或者,可使用GAP程序,其计算两个序列在无处罚末端空隙的情况下的最佳总体 比对。GAP 描述在以下论文中:Huang, X. (1994)0n Global Sequence Alignment. Computer Applications in the Biosciences 10, 227-235。
[0226] 计算多核苷酸%序列同一,性的优选方法是基于使用Clustal X(Jeanmougin等 人,1998, Trends Biochem. Sci. 23, 403-5.)对比待比较的序列。
[0227] 本发明的多核苷酸变体也涵盖这样的变体:所述变体展现与可能保留那些序列的 功能等效性的一个或多个特别鉴别的序列的相似性,且不能恰当地预期随机发生。使用从 来从 NCBI (ftp://ftp. ncbi. nih. gov/blast/)的 BLAST 程序套件(2. 2. 5 版[2002 年 11 月])可公开获得的bl2seq程序,可以测定有关多肽的这种序列相似性。
[0228] 可使用以下unix命令行参数检验多核苷酸序列的相似性:
[0229] bl2seq - i nucleotideseql - j nucleotideseq2 -FF- p tblastx
[0230] 参数_FF关闭对低复杂性区段的过滤。参数_p为序列对选出适当算法。该程序 发现序列之间的相似性区域,且为每个这样的区域报导一个"E值",所述E值为预期在含有 随机序列的固定参考尺寸的数据库中找到该偶然匹配的预期次数。此数据库的尺寸是由 bl2seq程序中的默认值设定。对于远小于1的小E值而言,E值大致为这样的随机匹配的 机率。
[0231] 当与任一个特别鉴别的序列相比较时,变体多核苷酸序列优选地表现出小于lx 10'更优选地小于lx 1(T9、更优选地小于lxl(T12、更优选地小于lx 1(T15、更优选地小于lx 1(T18、更优选地小于lx 1(T21、更优选地小于lx 1(T3°、更优选地小于lx 1(T4°、更优选地小于 lx 1(T5°、更优选地小于lx 1(T6°、更优选地小于lx 1(T7°、更优选地小于lx 1(T8°、更优选地 小于lx 1(T9°和最优选地小于1x10%°的E值。
[0232] 或者,本发明的变体多核苷酸在严谨条件下与指定的多核苷酸序列或其互补序列 杂交。
[0233]术语"在严谨条件下杂交"及其语法等效描述是指,多核苷酸分子在限定的温度及 盐浓度条件下与靶多核苷酸分子(诸如固定于DNA或RNA印迹(诸如DNA印迹或RNA印 迹)上的靶多核苷酸分子)杂交的能力。通过最初在更低严谨性条件下杂交,随后将严谨 性增加至希望的严谨性,可以测定在严谨杂交条件下杂交的能力。
[0234] 关于长度大于约100个碱基的多核苷酸分子,典型的严谨杂交条件为,比天然 双链体的解链温度(Tm)低不超过25至30°C (例如10°C )(-般参见,Sambrook等人 编,1987,Molecular Cloning, A Laboratory Manual,第 2版? Cold Spring Harbor Press ; Ausubel 等人,1987, Current Protocols in Molecular Biology, Greene Publishing)。 大于约100个碱基的多核苷酸分子的Tm可通过下式来计算:Tm = 81. 5+0. 41 % (G+C_log(Na+) ? (Sambrook等人,Eds, 1987, Molecular Cloning, A Laboratory Manual,第 2版.Cold Spring Harbor Press ;Bolton and McCarthy, 1962, PNAS 84:1390)。长度大 于100个碱基的多核苷酸的典型严谨条件是这样的杂交条件,诸如在6XSSC、0. 2% SDS的 溶液中预洗涤;在65°C,在6XSSC、0. 2% SDS中杂交过夜;随后在1XSSC、0. 1% SDS中在 65°C进行两次各30分钟的洗涤,并在0. 2XSSC、0. 1% SDS中在65°C进行两次各30分钟的 洗绦。
[0235] 关于长度小于100个碱基的多核苷酸分子,示例性的严谨杂交条件是,比Tm低5 至10°C。平均而言,长度小于100碱基对的多核苷酸分子的Tm降低大约(500/寡核苷酸长 度)。。。
[0236] 关于称为肽核酸(PNA)的DNA模拟物(Nielsen等人,Science. 1991年12月6日; 254 (5037) : 1497-500),Tm 值高于 DNA-DNA 或 DNA-RNA 杂交物的 Tm 值,且可使用 Giesen 等 人,Nucleic Acids Res. 1998年11月1日;26 (21): 5004-6中所述的公式来计算。长度小 于100个碱基的DNA-PNA杂交物的示例性的严谨杂交条件为,比Tm低5至10°C。
[0237] 本发明的变体多核苷酸也涵盖这样的多核苷酸:其不同于本发明的序列,但因遗 传密码的简并性而编码具有与由本发明的多核苷酸所编码的多肽相似的活性的多肽。不改 变多肽的氨基酸序列的序列变化是"沉默修饰"。除ATG(甲硫氨酸)和TGG(色氨酸)以 外,同一氨基酸的其它密码子可通过本领域认可的技术发生改变,例如,以优化在特定宿主 有机体中的密码子表达。
[0238] 引起编码的多肽序列中的一个或若干个氨基酸的保守置换但不显著改变其生物 活性的多核苷酸序列变化,也包括于本发明中。技术人员知晓制造表型沉默的氨基酸置换 的方法(参见,例如,Bowie等人,1990,Science247, 1306) 〇
[0239] 使用从NCBI(ftp://ftp.ncbi.nih.gov/blast/)公开获得的来自BLAST程序套件 (2. 2. 5版[2002年11月])的bl2seq程序,通过先前所述的tblastx算法,可以测定由于 编码的多肽序列中的沉默修饰及保守置换而产生的变体多核苷酸。
[0240] 本发明所述的变体多核苷酸作为GGP的功能可通过(例如)如在实施例的部分所 述的通过这种序列在细菌中的表达,并检测其编码的蛋白质的活性而评价。变体的功能还 可通过其改变植物中的GGP活性或抗坏血酸含量的能力而检测,该方法在本文的实施例的 部分也做了描述。
[0241] 本发明所述的变体多核苷酸作为GDP-D-甘露糖差向异构酶的功能可通过(例如) 如在实施例的部分所述的通过这种序列在细菌中的表达,并检测其编码的蛋白质的活性而 评价。变体的功能还可通过其改变植物中的GDP-D-甘露糖差向异构酶活性或抗坏血酸含 量的能力而检测,该方法在本文的实施例的部分也做了描述。
[0242] 多肽变体
[0243] 就多肽而言,术语"变体"涵盖天然存在的、重组地和合成地生产的多肽。变体多 肽序列优选地与本发明的序列表现出至少50%、更优选至少51%、更优选至少52%、更优 选至少53%、更优选至少54%、更优选至少55%、更优选至少56%、更优选至少57%、更优 选至少58%、更优选至少59%、更优选至少60%、更优选至少61%、更优选至少62%、更优 选至少63 %、更优选至少64 %、更优选至少65 %、更优选至少66 %、更优选至少67 %、更优 选至少68%、更优选至少69%、更优选至少70%、更优选至少71%、更优选至少72%、更优 选至少73%、更优选至少74%、更优选至少75%、更优选至少76%、更优选至少77%、更优 选至少78%、更优选至少79%、更优选至少80%、更优选至少81%、更优选至少82%、更优 选至少83 %、更优选至少84 %、更优选至少85 %、更优选至少86 %、更优选至少87 %、更优 选至少88%、更优选至少89%、更优选至少90%、更优选至少91%、更优选至少92%、更优 选至少93 %、更优选至少94 %、更优选至少95 %、更优选至少96 %、更优选至少97 %、更优 选至少98 %和最优选至少99%同一,性。在本发明的多肽的至少20个氨基酸位置、优选至 少50个氨基酸位置、更优选至少100个氨基酸位置且最优选整个长度的比较窗上,存在同 一性。
[0244] 多肽序列同一性可以如下方式测定。在bl2seq中使用BLASTP(来自BLAST程序 套件,2. 2. 5版[2002年11月])将主题多肽序列与候选多肽序列进行比较,bl2seq可从 NCBI(ftp://ftp.ncbi.nih.gov/blast/)公开获得。除应关闭对低复杂性区域的过滤以外, 利用bl2seq的默认参数。
[0245] 使用总体序列比对程序,也可在候选序列与主题多核苷酸序列之间的重叠部分的 整个长度上计算多肽序列同一性。如上文所论述的EMB0SS_needle(可获自111^口:/\¥¥¥. ebi.ac.uk/emboss/align/)及GAP(Huang.X. (1994)OnGlobalSequenceAlignment. ComputerApplicationsintheBiosciences10, 227-235.),也是适用于计算多肽序列同 一性的总体序列比对程序。
[0246] 用于计算多肽%序列同一,性的优选方法,是基于使用ClustalX(Jeanmougin等 人,1998,TrendsBiochem.Sci. 23, 403-5)比对待比较的序列。
[0247] 本发明的多肽变体也涵盖这样的多肽变体:其展现与可能保留序列的功能等效性 的一个或多个特别鉴别的序列的相似性,且不能恰当预期随机发生。使用从NCBI (ftp:// ftp. ncbi. nih. gov/blast/)公开获得的来自 BLAST 程序套件(2. 2. 5 版[2002 年 11 月]) 的bl2seq程序,可以测定有关多肽的这种序列相似性。可使用以下unix命令行参数检验 多肽序列的相似性:
[0248] bl2seq-ipeptideseql-jpeptideseq2_FF-pblastp
[0249] 当与任一个特别鉴别的序列相比较时,变体多肽序列优选地表现出小于lx 10' 更优选地小于lx 1(T9、更优选地小于lx 1(T12、更优选地小于lx 1(T15、更优选地小于lx 1(T18、更优选地小于lxl(T21、更优选地小于lx 1(T3°、更优选地小于lx 1(T4°、更优选地小于 lx 1(T5°、更优选地小于lx 1(T6°、更优选地小于lx 1(T7°、更优选地小于lx 1(T8°、更优选地 小于lx 1(T9°和最优选地小于lx 10%°的E值。
[0250] 参数-F F关闭对低复杂性区段的过滤。参数-p为序列对选出适当算法。该程序 发现序列之间的相似性区域,且为每一个这样的区域报导一个"E值",所述E值为预期在含 有随机序列的固定参考尺寸的数据库中找到该偶然匹配的预期次数。对于远小于1的小E 值而言,E值大致为该随机匹配的机率。
[0251] 所述多肽序列的一个或若干个氨基酸的保守置换(不显著改变其生物活性)也 包括于本发明中。技术人员知晓制造表型沉默的氨基酸置换的方法(参见,例如,Bowie等 人,1990,Science247, 1306) 〇
[0252] 变体多肽包括这样的多肽,其中氨基酸序列与本文的多肽存在一个或多个保守的 氨基酸置换、缺失、添加或插入而不影响所述多肽的生物学活性。保守置换通常包括用另 一个具有类似性质的另一个氨基酸置换一个氨基酸,例如在下列组内的置换:缬氨酸、甘氨 酸;甘氨酸、丙氨酸;缬氨酸、异亮氨酸、亮氨酸;天冬氨酸、谷氨酸酸;天冬酰胺、谷氨酰胺; 丝氨酸、苏氨酸;赖氨酸,精氨酸;以及苯丙氨酸、酪氨酸。
[0253] 非保守置换将引起这些组中一个组中的成员变为另一组中的成员。
[0254] 对进化生物学序列的分析示出并非所有序列改变的可能性相等,这至少部分反应 了在生物学水平上保守置换与非保守置换之间的差异。例如,某些氨基酸置换可能频繁发 生,而其它氨基酸置换却很少发生。氨基酸残基的进化修饰或置换可由记分矩阵(也称为 置换矩阵)作为模型。这些矩阵用于生物统计学分析仪鉴定序列之间的关系,一个例子为 如下示出的BL0SUM62矩阵(表A)。
[0255] 表A:含有所有可能置换分数的BL0SUM62矩阵[Henikoff和Henikoff,1992]。
[0257] 所示的BL0SUM62矩阵用于在对应列和行交叉处的每个比对的氨基酸对生成分 数。例如,谷氨酸残基(E)置换为天冬氨酸残基(D)的置换分数为2。对角线示出了未改变 的氨基酸的分数。大部分置换的改变分数为负。该矩阵仅包含整数。
[0258] 据信本领域技术人员熟知如何确定合适的记分矩阵为指定组的序列产生最佳的 比对。尽管未做限定,表1所示的BL0SUM62矩阵也用作BLAST检索中的缺省矩阵。
[0259] 其它变体包括具有能影响肽稳定性的修饰的肽。这样的类似物可包含例如肽序列 中的一个或多个非肽键(其替换肽键)。也包括含有天然存在的L-氨基酸之外的残基(如 D-氨基酸)、或非天然存在的合成氨基酸(如0或Y氨基酸和环形类似物)的类似物,
[0260] 多肽变体作为GGP的功能可由本文中实施例的部分所述的方法来评价。
[0261] 多肽变体作为GDP-D-甘露糖差向异构酶的功能可由本文中实施例的部分所述的 方法来评价。
[0262] 构建体、载体及其组分
[0263] 术语"遗传构建体"是指多核苷酸分子,通常为双链DNA,其中可能已插入另一个多 核苷酸分子(插入多核苷酸分子),例如,但不限于,cDNA分子。遗传构建体可含有允许转 录所述插入多核苷酸分子且任选地将转录物翻译为多肽的必需元件。所述插入多核苷酸分 子可源自宿主细胞,或可源自不同细胞或有机体,和/或可为重组多核苷酸。一旦在宿主细 胞内,遗传构建体则可整合进宿主染色体DNA中。所述遗传构建体可连接至载体上。
[0264] 术语"载体"是指多核苷酸分子,通常为双链DNA,其用于将遗传构建体转运至宿主 细胞中。所述载体可能能够在至少一个额外宿主系统(诸如大肠杆菌)中复制。
[0265] 术语"表达构建体"是指这样的遗传构建体:其包括允许转录所述插入多核苷酸分 子且任选地将转录物翻译为多肽的必需元件。表达构建体通常在5'至3'方向包含:
[0266] a)在宿主细胞(构建体将转化进其中)中具有功能的启动子,
[0267] b)待表达的多核苷酸,和
[0268] c)在宿主细胞(构建体将转化进其中)中具有功能的终止子。
[0269] 术语"编码区"或"开放读码框"(0RF)是指,能够在适当调控序列控制下生产转录 产物和/或多肽的基因组DNA序列或cDNA序列的有义链。在某些情况下,编码序列可通过 5'翻译起始密码子和3'翻译终止密码子的存在来鉴别。当插入遗传构建体中时,"编码序 列"在可操作地连接至启动子及终止子序列的情况下能够被表达。
[0270] "可操作地连接"是指,将目的序列,如待表达的序列放置在与含有调控元件的另 一序列的控制下,并且通常与所述的另一序列连接,所述调控元件可包括启动子、组织特异 性调控元件、临时调控元件、增强子、抑制子及终止子、5' -UTR序列、包括uORF的5' -UTR序 列以及uORF。
[0271] 在一个优选的实施方案中,所述调控元件包括本发明的多核苷酸序列。
[0272] 优选地,本发明的序列包含5' -UTR序列。优选地所述5' -UTR序列包含uORF。
[0273] 术语"非编码区"是指,在翻译起始位点的上游并在翻译终止位点的下游的非翻译 序列。这些序列也分别称为5'UTR和3'UTR。这些区域包括转录起始及终止及调节翻译效 率所需的元件。
[0274] 5' -UTR序列位于转录起始位点以及翻译起始位点之间。
[0275] 5'-UTR序列是由基因组DNA编码的mRNA序列。然而,如本文所用,术语5'-UTR序 列包括编码5'-UTR序列的基因组序列、以及该基因组序列的互补序列、以及5'-UTRmRNA 序列。
[0276] 终止子为终止转录的序列,且见于翻译序列的下游基因的3'不翻译端。终止子为 mRNA稳定性的重要决定因素,且在有些情况下,已发现具有空间调节功能。
[0277] 术语"uORF"或"上游开放读码框"为这样的mRNA元件,其在5' -UTR由起始密码 子(任意三个碱基对密码子,其中至少两个碱基为如下顺序:AUG)限定,其中框终止密码子 (UAA、UAG、UGA)主要编码序列的上游(即以5'方向)并且与其不重叠。
[0278] 术语"启动子"是指,在编码区上游的调苄基因转录的顺式调控元件。启动子包含 指定转录起始位点的顺式引发元件及保守盒(诸如TATA盒),及被转录因子结合的基序。
[0279] "转基因"是这样的多核苷酸:其取自一种有机体,且通过转化引入不同的有机体 中。转基因可源自与引入该转基因的有机体物种相同的物种或不同的物种。
[0280] "转基因植物"是指,含有经遗传操纵或转化而得到的新遗传物质的植物。所述新 遗传物质可源自与所得转基因植物相同的物种或不同物种的植物。
[0281] "反向重复序列"是存在重复的序列,其中重复序列的另一半是在互补链中,例如
[0282] (5 ')GATCTA......?TAGATC(3 ')
[0283] (3 ')CTAGAT......?ATCTAG(5 ')
[0284] 通读转录将产生这样的转录物:其经历互补碱基配对,以形成发夹结构,条件是, 在重复区之间存在3-5碱基对间隔物。
[0285] 涉及本发明的多核苷酸或多肽的术语"改变...的表达"和"表达改变"旨在包含 这种情况:本发明的多核苷酸对应的基因组DNA经修饰,从而改变本发明的多核苷酸或多 肽的表达。基因组DNA的修饰可通过遗传转化或本领域已知引入突变的其它方法。"表达 改变"能与信使RNA和/或产生的多肽的量的增加或减少相关,且还可由于多核苷酸和所产 生多肽的序列改变而导致多肽活性改变。
[0286] 分离或制备多核苷酸的方法
[0287] 使用本领域普通技术人员已知的多种技术,可以分离本发明的多核苷 酸分子。作为实例,通过使用在Mullis等人编,1994版,The Polymerase Chain Reaction, Birkhauser (通过引用并入本文)中所述的聚合酶链式反应(PCR),可以分离这 样的多肽。使用源自本发明的多核苷酸序列的如本文所定义的引物,可以扩增本发明的多 肽。
[0288] 用于分离本发明的多核苷酸的其它方法包括:使用具有本文所述的序列的所有或 部分多肽作为杂交探针。使标记的多核苷酸探针与固定在固体支持物(诸如硝化纤维素滤 膜或尼龙膜)上的多核苷酸杂交的技术,可以用于筛选基因组或cDNA文库。示例性的杂交 及洗涤条件为:在65°C,在5. OX SSC、0. 5%十二烷基硫酸钠、IX登哈特溶液中杂交20小时; 在1.0X SSC、1% (w/v)十二烷基硫酸钠中洗涤(在55°C进行三次各20分钟的洗涤),和任 选地在60°C、在0. 5XSSC、1% (w/v)十二烷基硫酸钠中洗涤一次(20分钟)。可选的进一 步洗涤(20分钟)可在60°C、在0. 1XSSC、1% (w/v)十二烷基硫酸钠的条件下进行。
[0289] 通过本领域中熟知的技术,诸如限制性核酸内切酶消化、寡核苷酸合成及PCR扩 增,可以生产本发明的多核苷酸片段。
[0290] 可在本领域熟知的方法中使用部分多核苷酸序列来鉴别相应的全长多核 苷酸序列。这样的方法包括基于PCR的方法、5' RACE (Frohman MA, 1993, Methods Enzymol. 218:340-56)及基于杂交的方法、基于计算机/数据库的方法。此外,作为实例,反 向PCR允许获取未知序列,所述序列侧接本文中所公开的多核苷酸序列,从基于已知区域 的引物起始(Triglia等人,1998, Nucleic Acids Res 16,8186,通过引用并入本文)。该 方法使用若干限制酶,以产生在基因的已知区域中的合适片段。随后通过分子内连接环化 该片段,且将其用作PCR模板。从已知区域设计不同引物。为了以物理方式装配全长克隆, 可利用标准分子生物学方法(Sambrook 等,Molecular Cloning:A Laboratory Manual,第 2 版,Cold Spring Harbor Press, 1987)。
[0291] 当从特定物种生产转基因植物时,有益地用源自该物种的一个或多个序列转化这 样的植物。所述益处可以是,减少公众对于生产转基因有机体中的跨物种转化的关注。另 外,当基因减量调节是希望的结果时,可能必须利用与需要减少其表达的植物中的序列相 同(或至少高度相似)的序列。尤其出于这些原因,希望能够在若干不同植物物种中鉴别 及分离特定基因的直系同源物。
[0292] 变体(包括直系同源物)可通过所述方法来鉴别。
[0293] 鉴别变体的方法
[0294] 物理方法
[0295] 变体多肽可使用基于PCR的方法来鉴别(Mullis等人编,1994The Polymerase Chain Reaction, Birkhauser)。通常,引物的多核
当前第3页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1