设计趋异的密码子优化大重复dna序列的方法_4

文档序号:9221191阅读:来源:国知局
es, urv. es/OPTIMIZER供公众使用),和 OPHMUMGENETM(GenSCript)。在优化核苷酸序列(例如,编码感兴趣多肽的核苷酸序列)过 程中可以考虑的因素包括,但不仅限于:可能影响所编码感兴趣多肽的表达的因素,可能影 响转录本翻译起始速度的因素,和可能影响所编码多肽或其前体翻译延伸速度的因素。在 这些因素中选择哪些在设计一组密码子优化序列过程中加以考虑属于技术人员的自由裁 量范围。
[0100] 可能影响由核酸序列编码的感兴趣多肽的表达的因素可能受到所选用来编码该 多肽的氨基酸的特定密码子的影响。影响从模板核酸序列产生mRNA的速度的因素可能包 括:用于转录的RNA聚合酶类型;表达系统中存在的RNA聚合酶水平;和所用的转录启动子 序列。mRNA水平还可能受到mRNA降解速度的影响,后者则可能受到mRNA去稳定性基序的影 响;RNA酶识别序列;mRNA二级结构;和多聚腺苷酸添加信号。mRNA水平还可能受到下述因 素的影响:翻译起始位点处、核糖体结合位点处、起始密码子处,和/或编码序列起始10-50 个密码子附近(或者开放阅读框内部或之后的其他地方)的mRNA结构;在开放阅读框之前 或内部存在的转录终止基序;和所转录序列内的信号,例如指导、改变或修饰mRNA剪切和/ 或细胞核输出的信号。影响从模板序列产生mRNA的速度的因素的一个具体实例是核苷酸 重复诱导的聚合酶滑移(slippage)。核苷酸重复诱导的聚合酶滑移涉及核苷酸序列重复, 其已经显示可造成DNA聚合酶的滑移或停顿(stuttering),这会导致移码突变。这些核苷 酸重复还会导致RNA聚合酶滑移。例如,在具有高G+C含量偏好的生物中,可能有更高程度 的G或C核苷酸重复。因此,减少诱导RNA聚合酶滑移的可能性的一个方法包括改变G或 C核苷酸的延伸重复。
[0101] 可能影响特定转录本翻译起始速度的因素包括:核糖体结合位点的序列;核糖体 结合位点上游的序列;起始密码子周围的序列(例如Kozak共有序列);内部核糖体进入位 点的存在、相对位置和序列;核糖体进入位点(或者mRNA的核糖体结合位点或5'端)与 起始密码子之间的序列和距离;翻译起始位点处的mRNA结构;核糖体结合位点处的mRNA 结构;起始密码子处的mRNA结构;编码序列最初10-50个密码子周围的mRNA结构;最先 10-20个密码子对的序列;最先1-20个密码子的GC偏好;在临近起始密码子的密码子处所 用的密码子;起码密码子的序列(AUG,UUG,或GUG);核糖体浓度;诱导表达前的生长条件; 表达期间的生长条件;诱导表达前的温度;和表达期间的温度。
[0102] 可能影响特定转录本翻译起始速度的因素的具体实例包括替代翻译起始 (alternate translational initiation)和干扰性的mRNA二级结构。若人造多核苷酸序 列意外地含有一个或多个能够发挥核糖体结合位点(RBS)功能的基序,就可能发生替代翻 译起始。这些位点能够导致从基因内部的位点起始翻译截短的蛋白质。减少产生截短蛋白 质(其在纯化过程中可能难以除去)的可能性的一个方法包括修改优化的多核苷酸序列中 假定的内部RBS序列。干扰性二级结构可能会隔离RBS序列或起始密码子,人们已经将干 扰性二级结构与蛋白质表达降低关联起来。茎环结构也能够导致转录暂停和减弱。因此, 优化的多核苷酸序列在RBS和核苷酸序列的基因编码区中可能含有最少的二级结构,以便 为提高转录和翻译提供条件。
[0103] 可能影响翻译延伸速度的因素包括带电tRNA的水平(Elf et al. (2003) Science 300:1718-22),其取决于tRNA的浓度、tRNA带电率、和氨基酸可得性。例如,由根据宿主生 物密码子使用偏好的稀有(非优选)密码子导致的翻译暂停可能会降低异源蛋白质的表 达速度。稀有密码子诱导的翻译暂停包括在感兴趣的多核苷酸中存在宿主生物中罕用的 密码子,并可能由于它们在可得tRNA池中的稀缺而对蛋白质翻译产生负面影响。这些因 素还包括核糖体的RNA选择速度(解码速率),其取决于:密码子-反密码子相互作用的 强度;在前密码子(P-位密码子);在前密码子的摆动碱基;以及正在被阅读的密码子的摆 动碱基。可能影响核糖体保真度的因素包括那些影响核糖体移码的因素,例如均聚物区段 (stretches),G/C岛,A/T岛屿,和暂停位点附近的同聚物区段。此外,某些多肽在核糖体 出口通道中可能受阻,这部分地取决于该多肽的最先10-20个氨基酸的序列。鉴于上述情 况,改进宿主生物中最佳翻译的一个方法包括实施可能导致人造核酸序列中的稀有宿主密 码子被修饰的密码子优化。
[0104] 另一类可能影响(虽然是间接地影响)异源蛋白质表达的核酸序列元件包括限制 位点。因此,核酸序列的优化可以包括对可能例如对后续的转录单元亚克隆到宿主表达载 体内的克隆造成干扰的限制位点进行修饰。
[0105] 可以优化核酸序列的全部或一部分。在一些实例中,期望的表达调制可以通过优 化基本上整个基因来实现。在其它实例中,期望的调制可以通过优化基因的一部分,而非全 部,而实现。而且,可以对任何编码序列的密码子用法加以调整来实现期望的性质,例如,在 特定的表达宿主细胞中的高水平表达。这种优化的起点可以是这样的编码序列,其仅由遵 从表达宿主密码子使用偏好的常用或优选密码子组成,或者这样的编码序列,其含有常用 和非常用密码子的混合。优化核酸序列可能对基因表达和蛋白质产生具有负面或正面的影 响。例如,用更常用的密码子代替稀有或非优选密码子可能影响从包含该替换密码子的序 列转录出来的mRNA分子的半衰期,或者通过导入二级结构而改变其结构,而影响其翻译。 因此,在某些情况下,必须进一步对优化的序列进行改变。
[0106] 在一些实施方案中,包含编码氨基酸重复区的趋异的、密码子优化的核酸序列的 人造核酸序列可以包括多于一个经优化的序列。例如,这样的序列可以编码这样的融合多 肽,其包括多个如本文所述的多肽,或者包括至少一个如本文所述的多肽和无关序列。融合 多肽可以用标准技术,包括化学缀合来加以制备,以便允许翻译成保留两个组分多肽的至 少一种生物活性的单一的融合多肽。可利用肽接头(linker)序列将融合多肽的多肽组分 分隔一定的距离,其足以确保每个多肽折叠成适当的二级和三级结构。这样的肽接头序列 可以用本领域众所周知的标准技术整合到融合多肽中。
[0107] 包含编码氨基酸重复区的趋异的、密码子优化的核酸序列的人造核酸序列可以表 达供用于多种用途,例如产生重组多肽;开发新型表达系统;与其它核酸序列比较表达特 性;和用于诊断用途。
[0108] V.趋异的、密码子优化的核酸序列的表达
[0109] 本公开提供了在细胞的细胞质和/或周质中产生包含氨基酸重复的感兴趣多肽 的方法。一些实施方案利用被优化用于在宿主生物(例如细菌宿主生物)中异源表达的人 造核酸序列。编码包含氨基酸重复区的多肽的优化人造核酸序列可以包含编码氨基酸重复 区的趋异的、密码子优化的核酸序列。在特定的实施方案中,可以将这样的优化人造核酸序 列连接到表达载体中,可以将该包含优化核酸序列的表达载体导入表达宿主细胞中(例如 通过转化),在其中从该优化的人造核酸序列表达所述多肽。
[0110] 包含编码感兴趣多肽的人造核酸序列的核酸分子可以通过本领域技术人员已知 的方法产生。例如,在一些实施方案中,可以可靠地合成期望核酸序列的相对短的区段 (segment),随后将它们串联。DNA合成领域的进步已经允许人们可靠地合成更长的核酸序 列,以及相对更短的核酸区段。合成技术允许以合理的准确度合成300个碱基或者更长的 寡核苷酸。因此,在一些实施方案中,可以合成更长的序列,从而可能不需要串联。然而,合 成化学产生的寡核苷酸的长度通常是20-100bp。在一些实施方案中,合成的基因或基因片 段可以用PCR以分步的方式,通过交替(alternating)、重叠(overlapping)的合成有义和 反义寡聚物(例如长度为90-110bp)的退火和延伸来制备,这些寡聚物被设计为编码最终 的期望序列。
[0111] 寡核苷酸的生产可以包括寡聚合成(oligo-synthesis),其是依照亚磷酰胺方案 以固相合成的形式实施的。简而言之,可以将具有用5' -0-二甲氧基三苯甲基(DMT)保护 的5' -OH官能团的第一个核苷酸与作为固相的聚苯乙烯珠偶联。接着,可通过酸处理除去 DMT基团,产生游离的5' -OH基。然后,可添加选定的亚磷酰胺,其在弱酸条件下转变成反 应性中间产物,并与游离的5'-OH基偶联,产生新的亚磷酸酯键。这些反应可以在四氢呋喃 或二甲亚砜中发生。因为所添加的核苷酸的5' -OH被保护,所以只有一个核苷酸被添加到 生长中的链上。对不反应的5'_0H基可以予以封端(capped),从而使它们无法继续参与合 成过程,并产生具有缺失的寡核苷酸。这可以在用乙酸和1-甲基咪唑处理后通过乙酰化实 现。最后,可添加水和碘将亚磷酸酯键氧化成磷酸二酯键。在步骤与步骤之间,生产系统可 以通过用合适的溶剂洗涤来预处理(condition)。在根据需要重复该步骤序列之后,可以最 终从柱上切离寡核苷酸,并在高温下用氢氧化铵处理之,以除去所有残余的保护基团。通过 使用光刻方法(photolithography approach),例如由 NIMBLEGEN?(Febit, Germany)提供 的,可以使这一过程变得更加高效。
[0112] 在通过固相合成产生出短的寡核苷酸之后,可以将寡核苷酸组装成更大的DNA片 段,例如大约500bp的尺寸。这通常通过多种酶辅助的方法之一来实现。例如,短的重复 寡核苷酸对可用于通过Klenow延伸反应产生更长的dsDNA分子。可以将相应的寡核苷酸 混合、杂交,并随后通过PCA转变成更大的组装物。在PCA反应中,合起来代表靶定的双链 DNA片段的所有寡核苷酸均存在。通过反复熔解和再杂交,这些寡核苷酸被逐步延伸成更 长的区段,直到某一群体达到期望的长度。注意,这一反应是在没有过量的末端寡核苷酸的 条件下进行的,因此它不是扩增反应。相反,每个全长片段均由寡核苷酸和其延伸物构成, 从而减少了通过聚合酶作用导入错误的机会。PCA的一个可替代方法是聚合酶组件复用 (polymerase assembly multiplexing) (PAM),其中向寡核苷酸池中添加末端引物,从而使 只有特定亚组的寡核苷酸被扩增。在第二轮PAM反应中,使用新的一组引物将多个寡核苷 酸重组成单个DNA分子。
[0113] 大寡核苷酸(例如,通过PCA、PM等产生的寡核苷酸)可以被组装成更大的DNA 分子,例如通过限制性消化和连接。
[0114] 有多种多样的表达系统可用于从本发明的优化核酸序列表达多肽。在一些实施方 案中,表达系统可以是,例如但不仅限于:细菌表达系统,如大肠杆菌、沙门菌属、芽孢杆菌 属、链霉菌属、假单胞菌属(例如,焚光假单胞菌)、富养罗尔氏菌(Ralstonia eutropha)、 衣藻属(Chlamydomonas spp.);酵母表达系统,包括酵母属、毕赤酵母属、克雷伯氏菌属和 念珠菌属、酿酒酵母、巴斯德毕赤酵母、甲醇毕赤酵母,和乳酸克鲁维酵母;真菌表达系统, 包括隐孢子虫属(Cryptosporidium spp.)和木霉属(Trichoderma spp.);丝状真菌蛋白 生产系统;原生动物表达系统,包括恶性疟原虫和利什曼原虫;模式生物,包括秀丽隐杆线 虫、果蝇和非洲爪蟾;植物,包括大豆、矮菜豆(bushbean)、玉米、棉花、烟草、和拟南芥;哺 乳动物组织培养表达系统,包括COS细胞、中国仓鼠卵巢细胞、和成纤维细胞如3T3细胞; 感染了腺病毒的细胞系;昆虫细胞系,例如那些来自用于生长杆状病毒的夜蛾属的细胞系; 从活细胞提取物,例如大肠杆菌提取物、小麦胚芽提取物、兔网织红细胞裂解物制备的体外 表达系统;和通过组装纯化的个别组分而制备的体外表达系统。
[0115] 按照在原核生物细胞或表达系统中表达包含氨基酸重复区的感兴趣多肽的实施 方案,可以首先将编码感兴趣多肽的优化核酸序列克隆到原核生物载体中:将具有复制原 点和用于插入核酸序列的方便的限制位点(其可能包含多接头(polylinker))的载体线性 化。用于插入核酸序列的载体还可以具有用于选择的标记基因,其可以赋予抗生素抗性或 提供另一种区别特征(例如发色团或荧光团形成)。可用于标记辅助选择的抗生素试剂种 类繁多(例如,四环素、氯霉素、放线菌素、新霉素、氨苄青霉素、潮霉素、重金属等)。其他 标记包括β-半乳糖苷酶,其若被表达可转化底物X-gal从而提供蓝色。用于在细菌中克 隆的市售载体有很多,并且这些载体是本领域技术人员所熟知的。在一些实施方案中,对于 包含一个或多个优化人造核酸序列、所述优化人造核酸序列包括编码氨基酸重复区的趋异 的、密码子优化的核酸序列的原核生物载体,随后可以通过任何方便的手段导入到合适的 克隆宿主中,该手段包括但不仅限于:磷酸钙沉淀DNA、融合、转染、和接合(conjugation)。 然后,细胞可以生长在合适的选择性营养培养基中。存活的细胞可以收获、裂解并分离质 粒。
[0116] 原核生物表达载体可能有下述特征:具有能够在合适表达宿主中发挥功能(常 用于附加体维持(episomal maintenance))的复制原点,和用于选择的标记。对于非整合 (unintegrated)的载体或构建体,复制原点通常提供多个拷贝,例如平均至少大约5个拷 贝。表达载体通常还具有能够在表达宿主中发挥功能的启动子。有多种启动子可供使用, 并且特定的启动子可以,例如,提供高水平的可诱导型或组成型转录。可以在一些实施方案 中使用的示例启动子包括,但不仅限于:β -内酰胺酶;α -半乳糖苷酶;λ λ P 1;启动 子;trpE启动子;trp-lac启动子;Τ7启动子(特别是基因9和10);和clts。
[0117] 包含优化序列的核酸分子,其中该优化序列包括编码氨基酸重复区的趋异、密码 子优化的核酸序列,可以通过杂交(例如连接作用)与线性化的载体合并。当优化序列不具 有起始密码子时,可以添加这种密码子。在一些实施方案中,可以将核酸分子插入到(以合 适的阅读框)载体中存在的处于启动子的转录控制之下的编码序列中。在编码序列的5'端 可以包含信号序列,以便允许多肽产物被分泌到周质空间中。通常,产物会产生在细胞内。
[0118] 除了载体之外,可以利用DNA构建体转化表达宿主,在那里该构建体可以整合到 表达宿主的基因组中。构建体可能缺少可提供附加体维持的复制起点。构建体可以至少包 括转录和翻译起始和终止区,且编码包含氨基酸重复区的多肽的优化序列可以位于起始区 和终止区之间,并处于它们的调节性控制之下。构建体可以进一步包括选择标记和/或其 它功能序列,例如但不仅限于,用于整合到宿主基因组中的同源序列;与PCR引物杂交的序 列;和限制位点。
[0119] 在一些实施方案中,表达宿主可以是植物细胞,例如,植物组织培养物中或整株植 物中的植物细胞。本发明的实施方案可以包括来自任何组织或者可以在任何地方发现的 植物细胞,包括但不仅限于,胚胎、分生组织细胞、愈伤组织、花粉、叶、花药、根、根尖、花、种 子、豆荚、茎,和组织培养物。本发明的人造优化核酸序列可以整合到合适的载体中,并通 过本领域技术人员已知的任何方法导入到植物细胞中。例如,核酸分子可以通过如下方法 导入植物细胞中,包括但不仅限于,用病毒载体转染,用质粒载体转化,电穿孔(Fromm et al. (1986) Nature 319:791-3),脂质转染(Feigner et al. (1987) Proc. Natl. Acad. Sci. USA 84:7413-7),显微注射(Mueller et al. (1978) Celll5:579-85),土壤杆菌介导的转移 (Fraley et al. (1983) Proc. Natl. Acad ScL USA80:4803-7),直接 DNA 摄取,和微粒轰击 (Klein et al. (1987)Nature 327:70)〇
[0120] 在一些实施方案中,可以被导入到植物细胞的特定部分(例如,通过纳米颗粒轰 击)。可以导入核酸分子的植物细胞特定部分的实例包括,但不仅限于:胞质溶胶、细胞核、 液泡膜、质体、黄化体(etioplasts)、有色体、白色体(Ieucoplast)、造油体(elaioplast)、 造蛋白体(proteinoplasts)、淀粉体、叶绿体,和具有双层膜的内腔。
[0121] 细胞转化(包括植物细胞转化)可以涉及构建在特定细胞中发挥功能的表达载 体。这样的载体可以包括
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1