采用评分技术的用于工程化核酸构建体的系统和方法

文档序号:8287885阅读:275来源:国知局
采用评分技术的用于工程化核酸构建体的系统和方法
【专利说明】采用评分技术的用于工程化核酸构建体的系统和方法
[0001] 本申请要求2011年11月17日提交的美国临时申请号61/561,241的35U. S.C. § 119(e)下的权益,通过引用将其全部内容结合到本文中。本申请进一步要求2012年 4月9日提交的美国专利申请号13/442,625的优先权,通过引用将其全部内容结合到本文 中。
[0002] 1.领域
[0003] 本公开一般地涉及重组DNA技术领域,以及更具体地,涉及以一种快速并且具有 成本效益的方式使用可用资源将预定的组件多核苷酸装配进工程化核酸构建体中的改进 的系统、组合物以及方法。
[0004] 2.背景
[0005] 合成生物学的一个主要目的是生产实现指定所需功能的新生物系统,如将生物合 成通路整合于宿主细胞中。因此,合成生物学需要用于选择插入到宿主细胞内或从宿主细 胞移除的遗传元件的工具,以及选择性突变宿主细胞中的遗传元件的工具。
[0006] 合成生物学的一种应用是开发酵母菌中的新型类异戊二烯合成通路从而以相对 于常规技术降低的成本来制造类异戊二烯。用于制造超过40, 000种独立化合物的一个多 样性家族的多种类异戊二烯的常规技术需要从自然来源如植物、微生物和动物中对它们进 行提取。对甲羟戊酸盐依赖的(MEV)和脱氧木酮糖-5-磷酸盐(DXP)代谢通路的阐述已使 一些类异戊二烯的生物合成变得可行。例如,已将微生物工程化以过表达用于生产名为紫 穗槐-4, 11-二烯的类异戊二烯的完整MEV代谢通路的一部分。参见美国专利号7, 172, 886 和7, 192, 751,通过引用将其内容结合到本文中。
[0007] 美国专利号7, 659, 097披露了如何能以一些方法改变这些MEV和DXP通路的的活 性,以提高多种类异戊二烯的合成。这些改变包括但不限于:表达在这些MEV或DXP通路 中任意的各酶的一种改造形式,以使它们在该宿主细胞中表现出提高的溶解度;表达缺乏 一个结构域的各酶的一种改变形式,酶的活性通过该结构域来抑制;表达对其底物具有更 高Kcat或更低Km的各酶的改变形式;或者表达不受该途径中其它分子的反馈或前馈条件 影响的各酶的改变形式。此外,可以改造在这样的合成通路中的这些编码酶的核酸序列,以 反映该宿主细胞的密码子优先权,从而产生这种酶在该宿主细胞中更高的表达。此外,可将 在这样的生物合成通路中的酶的多个拷贝引入宿主细胞中以产生这样的酶的更高表达。此 夕卜,这样的酶可置于在该宿主细胞中在强启动子的控制之下,以产生更高的这样的酶的表 达。参见美国专利号7, 659, 097,通过引用将其结合到本文中。上文仅阐述了一个宿主细胞 或生物体的位点的许多变化中的一部分,制造这些变化以实现一个合成生物学的一个设计 目标,例如制造类异戊二烯。
[0008] 如上文所述,通过一种试错迭代法最好地达到了合成生物学目的,在该方法中,在 一个宿主细胞或生物体中基于一个周期(例如,每日、每周、每月)对数十种、数百种或甚至 数千种不同的设计尝试进行体内测试,以确定是否达到一个设计目标并且基于这样的设计 目标进行改进。因此,清楚的是,在本领域中所需要的是为更快、更高效以及在甚至更经济 的方式中实现这样的设计目标的改进平台。
[0009] 用于实现合成生物学设计目标的一个平台的一方面是将设计目标缩减成通 过一个编辑器可解读的形式。在一种方法中,Pedersen和Phillips, 2009,"Towards programming languages for genetic engineering of living cells,',J. R. Soc. InterfaCe6,S437-S450提供了一种用于活细胞遗传工程(GEC)的形式语言,其中通过一个 编译器从一台或多台计算机的组件数据库中搜索一套满足设计目标的组件。还参见美国专 利申请出版物号2011/0054654,其中也描述了 GEC。Pedersen与同事的工作为在计算机中 建模复杂通路提供了一个令人满意的框架。然后,这样的计算机模型可用于在计算机中对 该模型的哪些变化将达到一个期望的设计目标做出预测。然而,会使这样的计算机建模更 有用的该数据,如在一些不同反应条件下的一些分子通路组件的分子性质,不久将不可用。 结果,迄今为止,Pederson与同事的工作尚未消除对一种试错迭代法的需求以实现合成生 物学的设计目标,在该方法中,基于一个周期(例如,每天、每周、每月)对数十种、数百种或 甚至数千种不同设计尝试进行体内测试。
[0010] 试错迭代法的缺点是此类方法所花费的时间和成本。它耗费了多种昂贵的资源, 包括时间和金钱,以为设计尝试制造所有需要的构建体,以及在体内对该设计尝试进行测 试。对于每种设计尝试,需要制造构建体,称为工程化核酸构建体,其产生对一个宿主细胞 或生物体位点的多种需要的变化。这常常需要委托合成寡核苷酸引物以从一个基因组文库 中亚克隆期望的核苷酸组件,并且/或者产生在现有的核苷酸序列中需要的突变。然后将 这样的工程化核酸构建体引入到一个宿主细胞或生物体内,其中构建体或者与该宿主基因 组的一个位点重组,或者以一种稳定的载体形式存在。因此,即使是有限数量的工程化核酸 构建体的设计可能也需要合成数十次或甚至数百次的定制的寡核苷酸引物,以使用现有的 模板核酸,如现有构建体或一个基因组文库中的核酸,来制造需要的工程化核酸构建体。
[0011] 因此,尽管合成生物学领域有进步,但是仍然需要改进的系统、组合物和方法,将 核酸组件快速有序地装配于工程化核酸构建体中。特别需要的是降低用于合成生物学 应用,包括多个工程化核酸构建体的构建的试错迭代法的成本并且提高其速度的系统和方 法。通过本公开的系统、组合物和方法,满足了这些需要和其他需要。
[0012] 3.概述
[0013] 本公开克服了已知合成生物学的方法的缺点。在本公开中,提供了 一种强有力的 语言描述核酸请求。这些核酸请求被解译并扩展成一个连续排布的组件核酸群。
[0014] 在一些实施方案中,搜索一个物理存在的组件核酸的数据库,以观察是否已经存 在这些连续排列的组件核酸中的任意一个。在一些实施方案中,以及可能的地方,常常数次 重排在该组件核酸群中独立的多个组件核酸的顺序,以观察这样的连续重排是否导致在该 物理存在的组件核酸的数据库中鉴定出更大数目的组件核酸。在一些实施方案中,选择最 好由该物理存在的组件核酸的数据库代表的组件核酸群的一个连续排列。在一些实施方案 中,对不存在于该数据库中的所选连续排列的部分生成多个引物对。由该一个或多个引物 对来扩增该连续排列的部分,并且鉴定所选连续排列的数据库中的一个或多个组件多核苷 酸可以通过比常规的试错迭代法更快、更高效的方式用于快速组装工程化核酸构建体,以 追求合成一个生物学设计目标。
[0015] 一个方面提供了一种限定用于整合进入目标生物体或宿主细胞的基因组位点L 的工程化核酸构建体的方法。通过计算机界面从请求者处接受核酸请求群(NR1,…,NRJ。 此处,η为大于1的正整数。在一些实施方案中,η为1至100之间的整数。在(NR1,…,NRJ 中的每个核酸请求NRi规定对L的遗传变化,例如,在L中插入外源启动子-基因单元的请 求。将在该核酸请求群(NR 1, ···,"}中的每个核酸请求NRjr展成相应的组件多核苷酸, 从而形成组件多核苷酸群。在该步骤中进行的扩展的类型取决每个NR i的性质。在一些实 施方案中,NRi包括待插入于L中的该全核酸序列。在这样的实施方案中,因为该核酸序列 是经过充分描述的,所以该扩展步骤没有伴随任何实际的该核酸请求的扩展。在一些实施 方案中,NR i是对给定基因的点突变的请求。为了使该请求工作容易,有利地,NR 1可采用缩 写表示法以区别所要求的该基因和该点突变。在下文中充分描述了这样的缩写表示法。在 这种情况下,该扩展步骤确认在NR i中所鉴定的该基因名称是有效基因,检索对于该基因的 核酸序列,并且制造所请求的点突变。当该扩展步骤完成后,群(NR 1,…,NRJ表示为组件多 核苷酸群。
[0016] 在一些实施方案中,采用连接子核酸序列将该组件多核苷酸群排列成连续的排列 ARi以形成该排列ARi。在一些实施方案中,这些连接子核酸序列选自预先确定的连接子核 酸序列文库。在一些实施方案中,该排列在或同时或序贯的多个排列步骤中完成了数次,直 至形成一组UR 1,…,ARJ连续排列的集合。完成这个是因为,通常存在一些不同的组件多 核苷酸排列,每个排列完全遵照(NR 1,…,NRJ的请求。因此,m为大于1的正整数,并且,事 实上,常常远大于1。例如,在一些实施方案中m可为5或更大。对在(AR 1,…,ARJ中的每 个各自的连续排列八氏确定评分S i。在一些实施方案中,该评分步骤在完成每个排列八氏后 而不是等待直到定义了集合UR1,…,ARJ之后完成。在这样的实施方案中,在找到一个令 人满意的排列后就终止该排列与评分循环。
[0017] 在一些实施方案中,对于每个各自的连续排列ARi,当一个或多个源构建体被鉴定 为物理存在于冷冻储库中时,即对该连续排列的评分SjA出了一次贡献。每个这样物理存 在的源构建体编码一个或多个组件多核苷酸。此外,在一些实施方案中,由一个或多个物理 存在的源构建体编码的一个或多个组件多核苷酸的每个各自的组件多核苷酸3'或5'末 端,或者3'与5'末端二者,与用于在该排列中的相应的组件多核苷酸相应的连接子核酸序 列结合,以形成AR itl为了阐述,考虑这样的情况,其中在ARi*有具有3'连接子核酸序列 LB2 (即,5'-CP-LB2-3')的组件多核苷酸CP。期望的是由该物理存在的具有3'连接子核酸 序列LB2 (即,5' -CP-LB2-3')的一个或多个源构建体编码的组件多核苷酸CP。
[0018] 在一些实施方案中,选择在UR1,…,ARJ中的具有满足一个选入标准的评分SjA 最终连续排列ARf。在一些实施方案中,ARf限定该工程化核酸构建体。在一些实施方案中, 响应该AR f的选择,基于该AR f计算了一个或多个引物对,其中在该一个或多个引物对中的 每个引物对能够扩增-部分,该部分不在用于AR f鉴定的任何鉴定的一个或多个物 理存在的源构建体中体现。在这样的实施方案中,由一个或多个引物对扩增的该连续排列 中的部分和在用于AR f鉴定的一个或多个物理存在的源构建体中的一个或多个组件多核苷 酸,以该ARf规定的顺序,共同限定该工程化核酸构建体。在一些实施方案中,使用一台或 多台适当程序化的计算机来执行至少部分的上述鉴定的方法(例如,上述的扩展、排列、重 复、确定、选择或计算)。
[0019] 另一个方面提供了一种设备,该设备包括一个或多个存储器和一个或多个处理 器。该一个或多个存储器以及该一个或多个处理器相互电连通。该一个或多个存储器使 用该一个或多个处理器确确实实地编码指令集合,用于定义用于整合到目的生物体或宿主 细胞的基因组位点L中的工程化核酸构建体。该指令集合包含指令用于接受核酸请求群 (NR1,…,NRJ,其中η为大于1的正整数,在(NR 1,…,NRJ中的每个核酸请求NRi规定对L 的遗传变化。该指令集合进一步包含指令用于将(NR1,…,NRJ中的每个核酸请求NRi扩展 成相应的组件多核苷酸,从而形成组件多核苷酸群。在一些实施方案中,该指令集合进一 步包括指令用于将该组件多核苷酸群排列成连续排列AR i,其中该排列使用连接子核酸序 列来将在该组件多核苷酸群中的组件多核苷酸组合成连续的排列ARitl在一些实施方案中, 这些连接子核酸序列选自预先确定的连接子核酸序列文库。在一些实施方案中,该指令集 合还包括指令重复用于排列直至形成连续排列的集合UR 1,…,ARJ,其中m为大于1的正 整数。该连续排列的集合UR1,…,ARJ表示在该组件多核苷酸群中组件多核苷酸的不同连 续排列的群。在一些实施方案中,该指令集合进一步包括指令用于确定对在UR 1,…,ARJ 中的每个各自的连续排列ARi的评分S i。在一些实施方案中,对于每个各自的连续排列ARi, 当一个或多个源构建体被鉴定为物理地存在于冷冻储库中时,即对该评分S i做出了贡献, 其中一个或多个物理存在的源构建体中的每个都编码一个或多个组件多核苷酸。在一些实 施方案中,由一个或多个物理存在的源构建体编码的一个或多个组件多核苷酸的每个各自 的组件多核苷酸3'或5'末端,或者3'与5'末端二者,与在用于排列成八氏的指令中的相 应的组件多核苷酸相应的连接子结合。在一些实施方案中,该指令集合进一步包括指令用 于选择在UR 1,…,ARJ中具有满足选入标准的评分Si最终连续排列ARJt为最优的连续 排列。在一些实施方案中,AR f限定该工程化核酸构建体。在一些实施方案中,该指令集合 进一步包含指令用于基于该最终连续排列ARJ+算一个或多个引物对,其中在该一个或多 个引物对中的每个引物对能够扩增-部分,该部分不在用于AR f鉴定的任何鉴定的一 个或多个物理存在的源构建体中的任何鉴定的一个或多个组件多核苷酸中体现。在这样的 实施方案中,由该一个或多个引物对扩增的该连续排列的部分和在用于AR f鉴定的该一个 或多个物理存在的源构建体中的一个或多个组件多核苷酸,按照由ARf规定的顺序,共同限 定该工程化核酸构建体。
[0020] 另一个方面提供了一种限定用于整合到目标生物体或宿主细胞内的基因组位点 L的工程化核酸构建体的方法。该方法包括接收核酸请求群(NR1,…,NR1J,其中η为大 于1的正整数。在(NR 1,…,NRJ中的每个核酸请求顺^卩规定了对L的遗传变化。将在 (NR1,…,NRJ中的每个核酸请求NIMf展成相应的组件多核苷酸,从而形成组件多核苷酸 群。在一些实施方案中,将该组件多核苷酸群排列成连续排列ARp在一些实施方案中,该 排列使用连接子核酸序列以将在该组件多核苷酸群中的多组件多核苷酸组合成ARp在一 些实施方案中,这些连接子核酸序列选自预先确定的连接子核酸序列文库。在一些实施方 案中,响应该排列,从物理存在于冷冻储库中的源构建体群中选择一个或多个源构建体。一 个或多个物理存在的源构建体中的每个都编码一个或多个组件多核苷酸。在一些实施方案 中,由一个或多个物理存在的源构建体编码的一个或多个组件多核苷酸的每个各自的组件 多核苷酸3'或5'末端,或者3'与5'末端二者,与用于排列成八氏的相应的组件多核苷酸 相应的连接子结合。在一些实施方案中,基于AR i计算一个或多个引物对。在一些实施方 案中,每个引物对都能够扩增ARi的一部分,该部分不在用于 AR i鉴定的任何鉴定的一个或 多个物理存在的源构建体中体现。在这样的实施方案中,由该一个或多个引物对扩增的连 续排列ARi的一部分和在该一个或多个用于AR i鉴定的物理存在的源构建体中的一个或多 个组件多核苷酸,按照由ARi规定的顺序,共同限定该工程化核酸构建体。在一些实施方案 中,使用一台或多台适当程序化的计算机来执行至少一部分的上述鉴定的方法(例如,该 扩展、排列、选择和/或计算)。
[0021] 本公开的另一个方面提供了一种设备,该设备包括一个或多个存储器以及一个或 多个处理器。该一个或多个存储器以及该一个或多个处理器相互电连通。该一个或多个存 储器使用该一个或多个处理器确确实实地编码指令集合,用于限定用于整合到目的生物 体或宿主细胞的基因组位点L中的工程化核酸构建体。在本发明公开的这个方面中,该指 令集合包括指令用于接收核酸请求群(NR 1,…,NRJ,其中η为大于1的正整数。在(NR1,… ,NRn}中的每个核酸请求定了对L的遗传变化。该指令集合进一步包括指令用于 将在(NR 1,…,NRJ中的每个NRd,展成具有核酸序列的相应的组件多核苷酸,从而形成组 件多核苷酸群。在一些实施方案中,该指令集合进一步包含指令用于将该组件多核苷酸群 排列成连续排列AR i。在一些实施方案中,该排列使用连接子核酸序列以将在该组件多核苷 酸群中的组件多核苷酸组合成连续排列AR i。在一些实施方案中,这些连接子核酸序列选自 预先确定的连接子核酸序列文库。在一些实施方案中,该指令集合进一步包括指令用于从 物理存在于冷冻储库中的源构建体群中选择一个或多个源构建体。一个或多个物理存在的 源构建体中的每个都编码一个或多个组件多核苷酸。在一些实施方案中,由该一个或多个 物理存在的源构建体编码的一个或多个组件多核苷酸的每个各自的组件多核苷酸3'或5' 末端,或者3'与5'末端二者,与在用于排列成AR i的各自的组件多核苷酸相应的连接子结 合。在一些实施方案中,该指令集合进一步包括指令用于基于ARi计算一个或多个引物对。 在该一个或多个引物对中的每个引物对能够扩增该八氏的一部分,该部分不在用于八1鉴定 的任何鉴定的一个或多个物理存在的源构建体中体现。在这样的实施方案中,由该一个或 多个引物对扩增的该八氏的部分和在该一个或多个用于AR 1鉴定的物理存在的源构建体中 的一个或多个组件多核苷酸,按照由ARi规定的顺序,共同限定该工程化核酸构建体。
[0022] 本公开的另一个方面提供了用于限定工程化核酸构建体群(EN1,…,EN k}的方法, 其中k为大于1的正整数。将在(EN1,…,ENJ中的每个工程化核酸构建体EN iS计成整 合于目标生物体或宿主细胞的基因组位点L之中。该方法包括对于在(EN1,…,EN k}* 的每个各自的EN^收相应的核酸请求群{NRu,...,NRiJ。在{{NRu,...,NR iJ中的每 个核酸请求NRu规定对L的遗传变化。对于在{EN i,…,ENJ中每个各自的ENi, η是与对 于在BN1,…,ENk}中的每个其他的ENJ^n相同或不同的正整数。在该方法中,对于在 (EN 1,…,ENJ中每个各自的ENi,在{NRu,...,·。中的每个NRi;j被扩展成具有核酸序 列的相应的组件多核苷酸,从而形成相应的组件多核苷酸群。在一些实施方案中,对于在 (EN 1,…,ENk}中每个各自的ENi,将来自该扩展的相应的组件核酸构建体群排列成连续排列 ARp在一些实施方案中,该排列使用连接子核酸序列以将在该相应的组件多核苷酸群中的 组件多核苷酸组合成ARi,从而形成连续排列群UR 1,…,ARJ,在UR1,…,ARJ中每个ARi 表示在BN1,…,ENJ中的ENitl在一些实施方案中,这些连接子核酸序列选自预先确定的连 接子核酸序列文库。对于在(EN 1,…,ENk}中的每个各自的ENi,从物理地存在于冷冻储库中 的源构建体群中选择一个或多个源构建体。对于在(EN 1,…,ENk}中的各自的ENi,该一个或 多个物理存在的源构建体中的每个都为该各自的EN i编码在该件多核苷酸群中的一个或多 个组件多核苷酸。在一些实施方案中,由该用于各自的ENi的一个或多个物理存在的源构建 体编码的该一个或多个组件多核苷酸的每个各自的组件多核苷酸3'或5'末端,或者3'与 5'末端二者,与用于排列成ARi的上述步骤中各自的组件多核苷酸相应的连接子结合。对 于在(EN 1,…,ENk}中的每个各自的ENi,基于代表ENi的在UR 1,…,ARJ中的AR^计算一 个或多个引物对。在该一个或多个八氏引物对中的每个引物对能够扩增AR ^勺一部分,该部 分不在用于ARi鉴定的任何鉴定的一个或多个物理存在的源构建体中体现。在这样的实施 方案中,由该一个或多个引物对扩增的连续排列八氏的部分和在该一个或多个用于八1鉴定 的物理存在的源构建体中的一个或多个组件多核苷酸,按照由AR i规定的顺序,共同限定 该工程化核酸构建体ENit5在一些实施方案中,使用一台或多台适当程序化的计算机来执行 至少一部分的前述步骤(例如,该扩展、排列、选择和/或计算)。
[0023] 另一个方面提供了一种设备,该设备包括一个或多个存储器和一个或多个处理 器。该一个或多个存储器以及该一个或多个处理器相互电连通。该一个或多个存储器使用 该一个或多个处理器编码一组用于定义工程化核酸构建体群BN 1,…,ENk}的指令,其中k 为大于1的正整数。在(EN1,…,ENJ中的每个工程化核酸构建体ENi用于在目标生物体或 宿主细胞的基因组位点L之中的整合。该指令集合包括指令用于对在(EN 1,…,ENJ中的每 个各自的ENi接收相对应群{NR i;1,…,NRi, J核酸请求。{NRi;1,…,NRi, J中的每个核酸请 求NRi;j规定对L的遗传变化。对于在{EN i,…,ENJ中的每个各自的ENi, η是与在(EN1,… ,ENk}中的每个其他的EN1J^n相同或不同的正整数。该指令集合进一步包含指令用于对在 (EN 1,…,ENJ中的每个各自的ENi,将在{NRi;1,…,NRi, J中的每个NRi,』扩展成具有核酸序 列的组件多核苷酸,从而形成对于在(EN1,…,EN k}中的每个各自的ENi相对应的组件多核 苷酸群。在一些实施方案中,该指令集合进一步包含指令用于对在(EN 1,…,ENk}中的每个 各自的ENi,将来自扩展的相对应的多个多核苷酸排列成连续的排列AR i,其中该排列过程 使用连接子核酸序列来将在相对应的组件多核苷酸群中的组件多核苷酸组合成ARi,从而 形成连续排列群UR 1,…,ARJ,在UR1,…,ARJ中的每个ARjP表示在{EN i,…,ENJ中的 ENp在一些实施方案中,这些连接子核酸序列选自预先确定的连接子核酸序列文库。在一 些实施方案中,该指令集合进一步包含指令用于对在(EN 1,…,ENk}中的每个各自的ENi,从 物理存在于冷冻储库中的源构建体群选择一个或多个源构建体,其中对于在IEN 1,…,ENJ 中的各自的ENi的一个或多个物理存在的源构建体中的每个都为各自的EN i编码在组件多 核苷酸群中的一个或多个组件核苷酸。在一些实施方案中,由用于各自的ENi的一个或多个 物理存在的源构建体编码的一个或多个组件多核苷酸的每个各自的组件多核苷酸3'或5' 末端,或者3'与5'末端二者,与用于排列成AR i的各自的组件多核苷酸
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1