设计趋异的密码子优化大重复dna序列的方法_6

文档序号:9221191阅读:来源:国知局
在实施方案的一个实例中,含有本发明核酸序列和可选择标记的质粒被导入到植物 细胞中,例如通过本文前面列举的任何方法被导入到植物细胞中。可以从这些植物细胞中 选出稳定整合了核酸序列和/或可选择标记的稳定转化体。在一些实施方案中,包含该核 酸序列的植物细胞(例如,已经被选出的稳定转化体)可以繁殖产生包含该核酸序列的新 植物细胞。包含本发明核酸序列的植物细胞可以是可再生细胞,其可用于再生整个植物。这 些植物细胞和从其产生整株植物可以表达由该核酸分子编码的、包含氨基酸重复区的感兴 趣多肽。
[0138] 在这些和进一步的实施方案中,可以提供用于生成包含本发明的人造优化核酸序 列的可再生的植物细胞(例如,用于组织培养)的方法,其中该植物细胞。组织培养物能够 再生具有与可再生细胞基本上相同基因型的植物。这些组织培养物中的可再生细胞可以是 胚,原生质体,分生细胞,愈伤组织,花粉,叶,花药,根,根尖,花,种子,荚果或茎。本发明的 一些实施方案提供了从本发明的组织培养物再生的植物。
[0139] 本发明还提供了用于产生稳定植物品系的方法,该植物品系包含本发明的人造优 化核酸序列,其中该稳定植物品系的细胞可以表达由该核酸序列编码的包含氨基酸重复区 的感兴趣多肽。产生稳定植物系的方法是本领域普通技术人员已知的,并可以包括如下技 术,例如但不仅限于,自交、回交、杂交生产,和群体杂交(crosses to population)。包含本 发明人造优化核酸序列的所有植物和植物细胞均在本发明的范围内。这些植物和植物细胞 在自然界中不存在,并且与包含编码相同的含有氨基酸重复的多肽、但未依照本文公开的 方法优化的核酸序列的植物或植物细胞相比,它们可以展示感兴趣多肽的有利表达特性。 包含本发明核酸序列的植物细胞可用于和其它不同的植物细胞杂交,从而产生具有更优或 期望特征的第一代(F1)杂交细胞、种子和/或植物。
[0140] 在特定的实施方案中,本发明的人造优化核酸序列用于产生遗传修饰的欧洲油菜 植物。在进一步的实施方案中,使用本发明的人造优化核酸序列产生的遗传修饰植物可以 是,例如但不仅限于:烟草,胡萝卜,玉米,加拿大油菜,油菜籽,棉花,棕榈,花生,大豆,甘 蔗,稻属,拟南芥属,蓖麻属。
[0141] 本发明进一步的实施方案提供了在细菌宿主中从人造优化核酸序列异源表达包 含氨基酸重复区的感兴趣多肽。还包括能够用基于细菌的异源表达系统表达的、编码包含 氨基酸重复区的重组蛋白的人造优化核酸序列。一些实例包括在细菌宿主细胞的细胞质中 从人造优化核酸序列异源表达包含氨基酸重复区的感兴趣多肽。额外的实施方案包括在细 菌宿主细胞的细胞周质中从人造优化核酸序列异源表达包含氨基酸重复区的感兴趣多肽。
[0142] 在一些实施方案中,细菌宿主细胞可以选自大肠杆菌细胞或假单胞菌细胞的合适 群体。在特定的实施方案中,宿主细胞可以是假单胞菌目的任何变形菌。宿主细胞可以是 假单胞菌科的任何变形菌。在特定的实施方案中,宿主细胞可以从下列的一个或多个中选 出:革兰氏阴性变形菌亚群1,2, 3, 5, 7, 12, 15, 17, 18或19。
[0143] 特定的实例包括在假单胞菌(pseudomonads)或与之密切相关的细菌中异源表达 这样的感兴趣多肽。如本文所使用的,假单胞菌和与之密切相关的细菌与本文定义为"革兰 (_)变形菌亚群1"的族群同延。"革兰㈠ 变形菌亚群1"是属于所述科和/或属的变形菌 族群的更具体的定义,其属于在 R. E. Buchanan and N. E. Gibbons (eds. ) (1974),Bergey' s Manual of Determinative Bacteriology, 217-289 页,第 8 版,The ffilliams&ffilkins Co.,Baltimore,Md.,USA中命名为"革兰氏阴性需氧菌棒和球菌"的分类学"部分"。细菌 宿主细胞可以选自革兰氏阴性变形菌亚群18,其定义为荧光假单胞菌物种的所有亚种、变 异体、菌株和其它亚种单元的族群,包括那些例如属于下列的菌(括号中显示的是举例菌 株的ATCC或其它保藏编号):荧光假单胞菌生物型A,也被称为生物型1或生物型I (ATCC 13525);荧光假单胞菌生物型B,也称为生物型2或生物型II (ATCC 17816);荧光假单胞菌 生物型C,也被称为生物型3或生物型III (ATCC 17400);荧光假单胞菌生物型F,也被称 为生物型4或生物型IV (ATCC 12983);荧光假单胞菌生物型G,也称为生物型5或生物型 V(ATCC 17518);荧光假单胞菌生物型VI;荧光假单胞菌PfO-I;荧光假单胞菌Pf-5(ATCC BAA-477);荧光假单胞菌SBW25 ;和荧光假单胞菌纤维素亚种(subsp. cellulosa) (NCMB 10462)。细菌宿主细胞还可以从革兰氏阴性变形菌亚群19中选出,后者定义为荧光假单胞 菌生物型A的所有菌株的族群,包括荧光假单胞菌菌株MB101,及其衍生物。
[0144] 本发明的人造优化核酸序列可以通过任何本领域技术人员已知的方法,例如通过 转化被导入到细菌宿主细胞中。用本发明的核酸序列转化细菌宿主细胞可以使用本领域已 知的转化方法实施,并且细菌宿主细胞可以作为完整细胞或者作为原生质体(即,包含细 胞质)被转化。转化方法包括穿孔方法(例如,电穿孔,原生质体融合,细菌接合,和二价阳 离子处理,例如氯化钙处理或CaCl2/Mg2+处理),以及其它本领域已知的方法。参见,例如 Morrison(1977)J. Bacteriol. 132:349-51 ;Clark-Curtiss and Curtiss, (1983)Methods in Enzymology 101:347-62 ;Sambrook et al. (1989)Molecular Cloning, A Laboratory Manual, 2nd ed. ;Kriegler(1990)Gene Transfer and Expression:A Laboratory Manual ; 和 Ausubel et al. (eds. ) (1994)Current Protocols in Molecular Biology。
[0145] 提供了如下的实施例来例示某些特定的特征和/或实施方案。这些实施例不应被 认为将本公开限制于所举例的特定特征或实施方案。 实施例
[0146] 实施例1 :含有大重复DNA序列的编码序列的密码子优化
[0147] 为了例示编码包含氨基酸重复区的多肽的核酸序列的优化,为由裂殖壶菌多不饱 和脂肪酸(PUFA)合酶的"0RFA"编码的蛋白质设计了欧洲油菜优化的密码子区。
[0148] 由裂殖壶菌PUFA合酶的"0RFA"编码的蛋白质的结构如图1所示。该蛋白质包含 10个重复的"Pro-Ala"结构域,大小范围是17-29个氨基酸(SEQ ID NOs :1-10和图2)。重 复的Pro-Ala结构域之间(见图1)散在有9个更长的包含87个氨基酸的重复序列结构域 (SEQ ID NOs :11-19和图3)。这些重复的氨基酸序列仅在4个位置有不同,并且在每个变异 位置处仅有2种氨基酸选择。9个重复的氨基酸序列的CLUSTALW?分析(图3)产生的同源 性值为100%,同一,性值为95. 4%。在DNA水平上,编码所述9个重复的天然裂殖壶菌序列 100%同源,并且89. 7%相同,在编码每个重复的261个碱基中只有27个位置不同(图4)。 该27个改变中的23个是"沉默"差异,其中相同氨基酸的同义密码子互换。使用常规的基 因设计方法难以为这种大小的多个重复开发新的密码子偏好的DNA序列,因为必须在单个 重复中的所有密码子选择与其它8个重复中在相同位置做出的密码子选择之间保持平衡, 以避免产生高度相关的DNA序列。
[0149] 对于每一个87残基的重复,同一氨基酸序列有超过4. 5xl043种可能的DNA序列来 编码。这个数字是作为序列中每个氨基酸的同义密码子数目的乘积计算出的(图3中比对 的最下一行)。因此,可供用于产生相同编码的DNA序列的密码子空间非常大。为每个单独 的重复生成了多个序列设计(在计算机上),随后对所有序列版本进行批量比较,以鉴定一 个代表编码这些重复的高度趋异的序列的组。
[0150] 首先,编码每个重复氨基酸结构域的天然DNA序列被提取作为单独的序列,如图4 所示。然后,各个重复DNA序列被作为单独序列导入到OPTGENE?基因设计程序中(Ocimum Biosolutions)。随后对每个单独的序列分别执行步骤3-5〇
[0151] 步骤3 :各个DNA序列用标准遗传编码进行翻译。
[0152] 步骤4 :使用标准遗传密码和欧洲油菜偏好表对从各个DNA序列翻译而得的氨基 酸序列进行逆向翻译。使用从530个欧洲油菜蛋白编码区汇编而得的偏好密码子表,并且 每个所生成的序列被编码命名为"nap"(即"napus")加版本编号。因此,在重复1的实例 中,第一个逆向翻译的密码子偏好序列被命名为"rptlnapl"。在这一特定的示例中,本过程 实施10次,产生10个编码重复1蛋白序列的DNA序列版本,如图5所示。也可以实施多于 (或少于)10次迭代。图5例示了对重复1的前17个氨基酸进行10次迭代产生的可观的 序列多样性。
[0153] 步骤5 :将密码子优化编码区的10个序列版本输出为相应编号的文本文件。
[0154] 对其它重复序列结构域的每一个执行步骤3-5。因此,在本例示中,总共产生了 90 个"nap"序列版本(每个重复元件10个)。然后将90个序列文件输入到CLUSTALW?程序 Mega 3. 1中(在WWW. megasoftware· net/访问),并使用全部90个序列作为输入实施多重 序列比对。因为这些序列是蛋白编码区的区段,所以实施比对时不允许有缺口。
[0155] 在CLUSTALW?比对之后,组装邻接树并使之可视化。对于蛋白质9个重复结构域 的每一个,从10个密码子优化序列中选出1个。每个所选序列版本从树的深分支部分选出。 图6。从总共90个序列中,为每一个重复元件仅选出一个序列。
[0156] 将每个重复结构域的选定序列整合到编码整个蛋白质的密码子优化DNA序列中, 置于对每个特定重复而言合适的位置处。注意保持正确的阅读框。对整个密码子优化序列 (包括另行设计的趋异重复元件)进行最终分析,以确保不存在非期望的基序、限制酶识别 位点等。对整个密码子优化序列进行最终分析之后,在向编码重复元件的序列中导入变化 时要注意确保维持密码子和序列的多样性。
[0157] 在本实例中,选定的序列不大可能是可能达到的最高度趋异的,因为1)每个重复 结构域仅进行了 10次序列迭代;和2)序列是目测拾取的。然而,可以肯定的是,选定的序 列接近于最佳(即可能达到的最高度趋异)的序列,因为它们是从邻接树的最深分支选出 的(即,它们是本序列组中彼此之间距离最远的)。对所有成对组合进行Smith-Wasserman 全局比对,同源性范围是74-81%,可能的中值是76-77%。图7。图8显示了对9个重复结 构域的所选9个新设计的发散编码区的CLUSTALW?比对结果。总体而言,它们93. 1%同源 和61. 7%相同(与之相对的是,天然序列为100%同源和89. 7%相同)。
[0158] 实施例2 :含有大重复DNA序列的优化编码序列的表达
[0159] 实施例1中设计的整个优化编码序列的相应DNA序列由供应商根据标准工业实践 合成。
[0160] 将由整个优化的编码序列构成的合成寡核苷酸分子导入到欧洲油菜细胞中,从而 产生包含该优化编码序列的欧洲油菜细胞;其方法是例如将该寡核苷酸连接到合适的载体 中,随后进行土壤杆菌介导的转化。
[0161] 包含优化编码区的欧洲油菜细胞表达由裂殖壶菌PUFA合酶ORFA编码的蛋白质, 其表达水平高于包含裂殖壶菌PUFA合酶ORFA天然编码序列的欧洲油菜细胞。
[0162] 实施例3 :包含含有大重复DNA序列的优化编码序列的欧洲油菜植物
[0163] 对于包含含有在实施例2中产生的趋异的、密码子优化的氨基酸重复区的优化编 码序列的欧洲油菜细胞,用于再生欧洲油菜植物。然后使欧洲油菜植物繁殖,产生包含该优 化编码序列的后代。
[0164] 虽然本文中对具体的实施方案进行了详细描述并在附图中加以例示,但本发明的 各种修改和改变形式是可以容易地获得的。然而,应当理解,本发明并不意图限制于所公开 的具体形式。相反,以附随的权利要求的为限,本发明涵盖属于本发明范围内的及其法律等 同物的所有修改、等同物和替代物。
【主权项】
1. 一种获得人造核酸分子的方法,该方法包括: (i) 提供来自多肽的氨基酸重复区的氨基酸序列; (ii) 推导分别编码所述氨基酸序列的多个样本密码子优化核酸序列; (iii) 根据序列同源性对所述多个样本密码子优化核酸序列进行比对,并组装包含该 多个样本密码子优化核酸序列的邻接树; (iv) 从该多个样本密码子优化核酸序列中选出唯 个;和 (V)获得包含该选定的样本密码子优化核酸序列的核酸分子。2. 根据权利要求1的方法,其中所述来自多肽的氨基酸重复区的氨基酸序列是通过提 供编码所述来自多肽的氨基酸重复区的核酸序列、并从所提供的核酸序列推导氨基酸序列 而提供的。3. 根据权利要求2的方法,其中所述编码氨基酸重复区的核酸序列是从生物克隆的。4. 根据权利要求1的方法,其中推导分别编码所述氨基酸序列的多个样本密码子优化 核酸序列包括利用生物的密码子使用偏好。5. 根据权利要求1的方法,其中选定的样本密码子优化核酸序列是从所述邻接树的深 分支部分选出的。6. 根据权利要求1的方法,其中该多肽在生物中表达。7. 根据权利要求1的方法,其中该多肽是未知在生物中表达的人造多肽。8. 根据权利要求1的方法,还包括将所述选定的样本密码子优化核酸序列整合入编码 感兴趣多肽的核酸序列中,其中所得的核酸分子包含含有所述选定的样本密码子优化核酸 序列的编码感兴趣多肽的核酸序列。9. 根据权利要求8的方法,其中所述感兴趣多肽与提供所述氨基酸重复区序列的多肽 具有相同的氨基酸序列。10. 根据权利要求8的方法,其中含有所述选定的样本密码子优化核酸序列的编码感 兴趣多肽的核酸序列自身已被优化。11. 根据权利要求8的方法,其中所述感兴趣多肽包括多个氨基酸重复区,并且其中对 该感兴趣多肽中的多个氨基酸重复区中的至少一些独立地实施(i) _(iv)。12. 根据权利要求11的方法,其中对所述感兴趣多肽中的多个氨基酸重复区中的每一 个独立地实施(i)-(iv)。13. 根据权利要求8的方法,其中所得的核酸分子包括与至少一个调节元件可操作连 接的所述编码感兴趣多肽的核酸序列。14. 根据权利要求8的方法,其中该核酸分子适合于导入到宿主生物中。15. 根据权利要求13的方法,其中该核酸分子适合于导入到宿主生物中。16. 根据权利要求15的方法,其中该核酸分子是表达载体。17. -种核酸分子,其是通过根据权利要求8的方法获得的。18. -种产生遗传修饰生物的方法,该方法包括将权利要求17的核酸分子导入到宿主 生物中。19. 根据权利要求18的方法,其中该宿主生物是植物。20. 根据权利要求19的方法,其中该宿主生物是欧洲油菜(Brassicanapus)。21. 根据权利要求18的方法,其中该宿主生物选自下组:酵母、藻类和原核生物。22. -种遗传修饰生物,其是通过根据权利要求18的方法产生的。23. -种遗传修饰植物,其是通过根据权利要求19的方法产生的。24. -种产生重组蛋白质的方法,该方法包括将权利要求17的核酸分子导入到细胞 中,其中该感兴趣多肽在该细胞中表达。25. 权利要求24的方法,还包括分离该感兴趣多肽。
【专利摘要】本公开涉及用于设计编码多肽氨基酸重复区的合成核酸序列的方法。本公开还涉及这些序列表达包含氨基酸重复区的感兴趣多肽的用途,以及包含这些序列的生物。
【IPC分类】C12N15/63, C12N15/10
【公开号】CN104937101
【申请号】CN201380047742
【发明人】D·J·默洛, I·拉里努亚, S·贝文
【申请人】美国陶氏益农公司
【公开日】2015年9月23日
【申请日】2013年7月16日
【公告号】CA2879199A1, EP2872630A1, US20150175672, WO2014014950A1
当前第6页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1