采用评分技术的用于工程化核酸构建体的系统和方法

文档序号：8287885阅读：275来源：国知局

采用评分技术的用于工程化核酸构建体的系统和方法
【专利说明】采用评分技术的用于工程化核酸构建体的系统和方法
[0001] 本申请要求2011年11月17日提交的美国临时申请号61/561,241的35U. S.C. § 119(e)下的权益，通过引用将其全部内容结合到本文中。本申请进一步要求2012年 4月9日提交的美国专利申请号13/442,625的优先权，通过引用将其全部内容结合到本文中。
[0002] 1.领域
[0003] 本公开一般地涉及重组DNA技术领域，以及更具体地，涉及以一种快速并且具有成本效益的方式使用可用资源将预定的组件多核苷酸装配进工程化核酸构建体中的改进的系统、组合物以及方法。
[0004] 2.背景
[0005] 合成生物学的一个主要目的是生产实现指定所需功能的新生物系统，如将生物合成通路整合于宿主细胞中。因此,合成生物学需要用于选择插入到宿主细胞内或从宿主细胞移除的遗传元件的工具，以及选择性突变宿主细胞中的遗传元件的工具。
[0006] 合成生物学的一种应用是开发酵母菌中的新型类异戊二烯合成通路从而以相对于常规技术降低的成本来制造类异戊二烯。用于制造超过40, 000种独立化合物的一个多样性家族的多种类异戊二烯的常规技术需要从自然来源如植物、微生物和动物中对它们进行提取。对甲羟戊酸盐依赖的（MEV)和脱氧木酮糖-5-磷酸盐（DXP)代谢通路的阐述已使一些类异戊二烯的生物合成变得可行。例如，已将微生物工程化以过表达用于生产名为紫穗槐-4, 11-二烯的类异戊二烯的完整MEV代谢通路的一部分。参见美国专利号7, 172, 886 和7, 192, 751，通过引用将其内容结合到本文中。
[0007] 美国专利号7, 659, 097披露了如何能以一些方法改变这些MEV和DXP通路的的活性，以提高多种类异戊二烯的合成。这些改变包括但不限于：表达在这些MEV或DXP通路中任意的各酶的一种改造形式，以使它们在该宿主细胞中表现出提高的溶解度；表达缺乏一个结构域的各酶的一种改变形式，酶的活性通过该结构域来抑制；表达对其底物具有更高Kcat或更低Km的各酶的改变形式；或者表达不受该途径中其它分子的反馈或前馈条件影响的各酶的改变形式。此外，可以改造在这样的合成通路中的这些编码酶的核酸序列，以反映该宿主细胞的密码子优先权，从而产生这种酶在该宿主细胞中更高的表达。此外，可将在这样的生物合成通路中的酶的多个拷贝引入宿主细胞中以产生这样的酶的更高表达。此夕卜，这样的酶可置于在该宿主细胞中在强启动子的控制之下，以产生更高的这样的酶的表达。参见美国专利号7, 659, 097,通过引用将其结合到本文中。上文仅阐述了一个宿主细胞或生物体的位点的许多变化中的一部分，制造这些变化以实现一个合成生物学的一个设计目标，例如制造类异戊二烯。
[0008] 如上文所述，通过一种试错迭代法最好地达到了合成生物学目的，在该方法中，在一个宿主细胞或生物体中基于一个周期（例如，每日、每周、每月）对数十种、数百种或甚至数千种不同的设计尝试进行体内测试，以确定是否达到一个设计目标并且基于这样的设计目标进行改进。因此，清楚的是，在本领域中所需要的是为更快、更高效以及在甚至更经济的方式中实现这样的设计目标的改进平台。
[0009] 用于实现合成生物学设计目标的一个平台的一方面是将设计目标缩减成通过一个编辑器可解读的形式。在一种方法中，Pedersen和Phillips, 2009，"Towards programming languages for genetic engineering of living cells，'，J. R. Soc. InterfaCe6，S437-S450提供了一种用于活细胞遗传工程（GEC)的形式语言，其中通过一个编译器从一台或多台计算机的组件数据库中搜索一套满足设计目标的组件。还参见美国专利申请出版物号2011/0054654,其中也描述了 GEC。Pedersen与同事的工作为在计算机中建模复杂通路提供了一个令人满意的框架。然后，这样的计算机模型可用于在计算机中对该模型的哪些变化将达到一个期望的设计目标做出预测。然而，会使这样的计算机建模更有用的该数据，如在一些不同反应条件下的一些分子通路组件的分子性质，不久将不可用。结果，迄今为止，Pederson与同事的工作尚未消除对一种试错迭代法的需求以实现合成生物学的设计目标，在该方法中，基于一个周期（例如，每天、每周、每月）对数十种、数百种或甚至数千种不同设计尝试进行体内测试。
[0010] 试错迭代法的缺点是此类方法所花费的时间和成本。它耗费了多种昂贵的资源，包括时间和金钱，以为设计尝试制造所有需要的构建体，以及在体内对该设计尝试进行测试。对于每种设计尝试，需要制造构建体，称为工程化核酸构建体，其产生对一个宿主细胞或生物体位点的多种需要的变化。这常常需要委托合成寡核苷酸引物以从一个基因组文库中亚克隆期望的核苷酸组件，并且/或者产生在现有的核苷酸序列中需要的突变。然后将这样的工程化核酸构建体引入到一个宿主细胞或生物体内，其中构建体或者与该宿主基因组的一个位点重组，或者以一种稳定的载体形式存在。因此，即使是有限数量的工程化核酸构建体的设计可能也需要合成数十次或甚至数百次的定制的寡核苷酸引物，以使用现有的模板核酸，如现有构建体或一个基因组文库中的核酸，来制造需要的工程化核酸构建体。
[0011] 因此，尽管合成生物学领域有进步，但是仍然需要改进的系统、组合物和方法，将核酸组件快速有序地装配于工程化核酸构建体中。特别需要的是降低用于合成生物学应用，包括多个工程化核酸构建体的构建的试错迭代法的成本并且提高其速度的系统和方法。通过本公开的系统、组合物和方法，满足了这些需要和其他需要。
[0012] 3.概述
[0013] 本公开克服了已知合成生物学的方法的缺点。在本公开中，提供了一种强有力的语言描述核酸请求。这些核酸请求被解译并扩展成一个连续排布的组件核酸群。
[0014] 在一些实施方案中，搜索一个物理存在的组件核酸的数据库，以观察是否已经存在这些连续排列的组件核酸中的任意一个。在一些实施方案中，以及可能的地方，常常数次重排在该组件核酸群中独立的多个组件核酸的顺序，以观察这样的连续重排是否导致在该物理存在的组件核酸的数据库中鉴定出更大数目的组件核酸。在一些实施方案中，选择最好由该物理存在的组件核酸的数据库代表的组件核酸群的一个连续排列。在一些实施方案中，对不存在于该数据库中的所选连续排列的部分生成多个引物对。由该一个或多个引物对来扩增该连续排列的部分，并且鉴定所选连续排列的数据库中的一个或多个组件多核苷酸可以通过比常规的试错迭代法更快、更高效的方式用于快速组装工程化核酸构建体，以追求合成一个生物学设计目标。
[0015] 一个方面提供了一种限定用于整合进入目标生物体或宿主细胞的基因组位点L 的工程化核酸构建体的方法。通过计算机界面从请求者处接受核酸请求群（NR1，…，NRJ。此处，η为大于1的正整数。在一些实施方案中，η为1至100之间的整数。在（NR1，…，NRJ 中的每个核酸请求NRi规定对L的遗传变化，例如，在L中插入外源启动子-基因单元的请求。将在该核酸请求群（NR 1, ···，"}中的每个核酸请求NRjr展成相应的组件多核苷酸，从而形成组件多核苷酸群。在该步骤中进行的扩展的类型取决每个NR i的性质。在一些实施方案中，NRi包括待插入于L中的该全核酸序列。在这样的实施方案中，因为该核酸序列是经过充分描述的，所以该扩展步骤没有伴随任何实际的该核酸请求的扩展。在一些实施方案中，NR i是对给定基因的点突变的请求。为了使该请求工作容易，有利地，NR 1可采用缩写表示法以区别所要求的该基因和该点突变。在下文中充分描述了这样的缩写表示法。在这种情况下，该扩展步骤确认在NR i中所鉴定的该基因名称是有效基因，检索对于该基因的核酸序列，并且制造所请求的点突变。当该扩展步骤完成后，群（NR 1，…，NRJ表示为组件多核苷酸群。
[0016] 在一些实施方案中，采用连接子核酸序列将该组件多核苷酸群排列成连续的排列 ARi以形成该排列ARi。在一些实施方案中，这些连接子核酸序列选自预先确定的连接子核酸序列文库。在一些实施方案中，该排列在或同时或序贯的多个排列步骤中完成了数次，直至形成一组UR 1，…，ARJ连续排列的集合。完成这个是因为，通常存在一些不同的组件多核苷酸排列，每个排列完全遵照（NR 1,…，NRJ的请求。因此，m为大于1的正整数，并且，事实上，常常远大于1。例如，在一些实施方案中m可为5或更大。对在（AR 1，…，ARJ中的每个各自的连续排列八氏确定评分S i。在一些实施方案中，该评分步骤在完成每个排列八氏后而不是等待直到定义了集合UR1，…，ARJ之后完成。在这样的实施方案中，在找到一个令人满意的排列后就终止该排列与评分循环。
[0017] 在一些实施方案中，对于每个各自的连续排列ARi,当一个或多个源构建体被鉴定为物理存在于冷冻储库中时，即对该连续排列的评分SjA出了一次贡献。每个这样物理存在的源构建体编码一个或多个组件多核苷酸。此外，在一些实施方案中，由一个或多个物理存在的源构建体编码的一个或多个组件多核苷酸的每个各自的组件多核苷酸3'或5'末端，或者3'与5'末端二者，与用于在该排列中的相应的组件多核苷酸相应的连接子核酸序列结合，以形成AR itl为了阐述，考虑这样的情况，其中在ARi*有具有3'连接子核酸序列 LB2 (即，5'-CP-LB2-3'）的组件多核苷酸CP。期望的是由该物理存在的具有3'连接子核酸序列LB2 (即，5' -CP-LB2-3'）的一个或多个源构建体编码的组件多核苷酸CP。
[0018] 在一些实施方案中，选择在UR1，…，ARJ中的具有满足一个选入标准的评分SjA 最终连续排列ARf。在一些实施方案中，ARf限定该工程化核酸构建体。在一些实施方案中，响应该AR f的选择，基于该AR f计算了一个或多个引物对，其中在该一个或多个引物对中的每个引物对能够扩增-部分，该部分不在用于AR f鉴定的任何鉴定的一个或多个物理存在的源构建体中体现。在这样的实施方案中，由一个或多个引物对扩增的该连续排列中的部分和在用于AR f鉴定的一个或多个物理存在的源构建体中的一个或多个组件多核苷酸，以该ARf规定的顺序，共同限定该工程化核酸构建体。在一些实施方案中，使用一台或多台适当程序化的计算机来执行至少部分的上述鉴定的方法（例如，上述的扩展、排列、重复、确定、选择或计算）。
[0019] 另一个方面提供了一种设备，该设备包括一个或多个存储器和一个或多个处理器。该一个或多个存储器以及该一个或多个处理器相互电连通。该一个或多个存储器使用该一个或多个处理器确确实实地编码指令集合，用于定义用于整合到目的生物体或宿主细胞的基因组位点L中的工程化核酸构建体。该指令集合包含指令用于接受核酸请求群 (NR1，…，NRJ，其中η为大于1的正整数，在（NR 1，…，NRJ中的每个核酸请求NRi规定对L 的遗传变化。该指令集合进一步包含指令用于将（NR1，…，NRJ中的每个核酸请求NRi扩展成相应的组件多核苷酸，从而形成组件多核苷酸群。在一些实施方案中，该指令集合进一步包括指令用于将该组件多核苷酸群排列成连续排列AR i,其中该排列使用连接子核酸序列来将在该组件多核苷酸群中的组件多核苷酸组合成连续的排列ARitl在一些实施方案中，这些连接子核酸序列选自预先确定的连接子核酸序列文库。在一些实施方案中，该指令集合还包括指令重复用于排列直至形成连续排列的集合UR 1，…，ARJ，其中m为大于1的正整数。该连续排列的集合UR1，…，ARJ表示在该组件多核苷酸群中组件多核苷酸的不同连续排列的群。在一些实施方案中，该指令集合进一步包括指令用于确定对在UR 1，…，ARJ 中的每个各自的连续排列ARi的评分S i。在一些实施方案中，对于每个各自的连续排列ARi, 当一个或多个源构建体被鉴定为物理地存在于冷冻储库中时，即对该评分S i做出了贡献，其中一个或多个物理存在的源构建体中的每个都编码一个或多个组件多核苷酸。在一些实施方案中，由一个或多个物理存在的源构建体编码的一个或多个组件多核苷酸的每个各自的组件多核苷酸3'或5'末端，或者3'与5'末端二者，与在用于排列成八氏的指令中的相应的组件多核苷酸相应的连接子结合。在一些实施方案中，该指令集合进一步包括指令用于选择在UR 1，…，ARJ中具有满足选入标准的评分Si最终连续排列ARJt为最优的连续排列。在一些实施方案中，AR f限定该工程化核酸构建体。在一些实施方案中，该指令集合进一步包含指令用于基于该最终连续排列ARJ+算一个或多个引物对，其中在该一个或多个引物对中的每个引物对能够扩增-部分，该部分不在用于AR f鉴定的任何鉴定的一个或多个物理存在的源构建体中的任何鉴定的一个或多个组件多核苷酸中体现。在这样的实施方案中，由该一个或多个引物对扩增的该连续排列的部分和在用于AR f鉴定的该一个或多个物理存在的源构建体中的一个或多个组件多核苷酸，按照由ARf规定的顺序，共同限定该工程化核酸构建体。
[0020] 另一个方面提供了一种限定用于整合到目标生物体或宿主细胞内的基因组位点 L的工程化核酸构建体的方法。该方法包括接收核酸请求群（NR1,…，NR1J，其中η为大于1的正整数。在（NR 1，…，NRJ中的每个核酸请求顺^卩规定了对L的遗传变化。将在 (NR1，…，NRJ中的每个核酸请求NIMf展成相应的组件多核苷酸，从而形成组件多核苷酸群。在一些实施方案中，将该组件多核苷酸群排列成连续排列ARp在一些实施方案中，该排列使用连接子核酸序列以将在该组件多核苷酸群中的多组件多核苷酸组合成ARp在一些实施方案中，这些连接子核酸序列选自预先确定的连接子核酸序列文库。在一些实施方案中，响应该排列，从物理存在于冷冻储库中的源构建体群中选择一个或多个源构建体。一个或多个物理存在的源构建体中的每个都编码一个或多个组件多核苷酸。在一些实施方案中，由一个或多个物理存在的源构建体编码的一个或多个组件多核苷酸的每个各自的组件多核苷酸3'或5'末端，或者3'与5'末端二者，与用于排列成八氏的相应的组件多核苷酸相应的连接子结合。在一些实施方案中，基于AR i计算一个或多个引物对。在一些实施方案中，每个引物对都能够扩增ARi的一部分，该部分不在用于 AR i鉴定的任何鉴定的一个或多个物理存在的源构建体中体现。在这样的实施方案中，由该一个或多个引物对扩增的连续排列ARi的一部分和在该一个或多个用于AR i鉴定的物理存在的源构建体中的一个或多个组件多核苷酸，按照由ARi规定的顺序，共同限定该工程化核酸构建体。在一些实施方案中，使用一台或多台适当程序化的计算机来执行至少一部分的上述鉴定的方法（例如，该扩展、排列、选择和/或计算）。
[0021] 本公开的另一个方面提供了一种设备，该设备包括一个或多个存储器以及一个或多个处理器。该一个或多个存储器以及该一个或多个处理器相互电连通。该一个或多个存储器使用该一个或多个处理器确确实实地编码指令集合，用于限定用于整合到目的生物体或宿主细胞的基因组位点L中的工程化核酸构建体。在本发明公开的这个方面中，该指令集合包括指令用于接收核酸请求群（NR 1，…，NRJ，其中η为大于1的正整数。在（NR1，… ，NRn}中的每个核酸请求定了对L的遗传变化。该指令集合进一步包括指令用于将在（NR 1，…，NRJ中的每个NRd，展成具有核酸序列的相应的组件多核苷酸，从而形成组件多核苷酸群。在一些实施方案中，该指令集合进一步包含指令用于将该组件多核苷酸群排列成连续排列AR i。在一些实施方案中，该排列使用连接子核酸序列以将在该组件多核苷酸群中的组件多核苷酸组合成连续排列AR i。在一些实施方案中，这些连接子核酸序列选自预先确定的连接子核酸序列文库。在一些实施方案中，该指令集合进一步包括指令用于从物理存在于冷冻储库中的源构建体群中选择一个或多个源构建体。一个或多个物理存在的源构建体中的每个都编码一个或多个组件多核苷酸。在一些实施方案中，由该一个或多个物理存在的源构建体编码的一个或多个组件多核苷酸的每个各自的组件多核苷酸3'或5' 末端，或者3'与5'末端二者，与在用于排列成AR i的各自的组件多核苷酸相应的连接子结合。在一些实施方案中，该指令集合进一步包括指令用于基于ARi计算一个或多个引物对。在该一个或多个引物对中的每个引物对能够扩增该八氏的一部分，该部分不在用于八1鉴定的任何鉴定的一个或多个物理存在的源构建体中体现。在这样的实施方案中，由该一个或多个引物对扩增的该八氏的部分和在该一个或多个用于AR 1鉴定的物理存在的源构建体中的一个或多个组件多核苷酸，按照由ARi规定的顺序，共同限定该工程化核酸构建体。
[0022] 本公开的另一个方面提供了用于限定工程化核酸构建体群（EN1，…，EN k}的方法，其中k为大于1的正整数。将在（EN1，…，ENJ中的每个工程化核酸构建体EN iS计成整合于目标生物体或宿主细胞的基因组位点L之中。该方法包括对于在（EN1，…，EN k}* 的每个各自的EN^收相应的核酸请求群{NRu，...，NRiJ。在{{NRu，...，NR iJ中的每个核酸请求NRu规定对L的遗传变化。对于在{EN i，…，ENJ中每个各自的ENi, η是与对于在BN1，…，ENk}中的每个其他的ENJ^n相同或不同的正整数。在该方法中，对于在 (EN 1，…，ENJ中每个各自的ENi,在{NRu，...，·。中的每个NRi;j被扩展成具有核酸序列的相应的组件多核苷酸，从而形成相应的组件多核苷酸群。在一些实施方案中，对于在 (EN 1，…，ENk}中每个各自的ENi,将来自该扩展的相应的组件核酸构建体群排列成连续排列 ARp在一些实施方案中，该排列使用连接子核酸序列以将在该相应的组件多核苷酸群中的组件多核苷酸组合成ARi,从而形成连续排列群UR 1，…，ARJ，在UR1，…，ARJ中每个ARi 表示在BN1，…，ENJ中的ENitl在一些实施方案中，这些连接子核酸序列选自预先确定的连接子核酸序列文库。对于在（EN 1，…，ENk}中的每个各自的ENi,从物理地存在于冷冻储库中的源构建体群中选择一个或多个源构建体。对于在（EN 1，…，ENk}中的各自的ENi,该一个或多个物理存在的源构建体中的每个都为该各自的EN i编码在该件多核苷酸群中的一个或多个组件多核苷酸。在一些实施方案中，由该用于各自的ENi的一个或多个物理存在的源构建体编码的该一个或多个组件多核苷酸的每个各自的组件多核苷酸3'或5'末端，或者3'与 5'末端二者，与用于排列成ARi的上述步骤中各自的组件多核苷酸相应的连接子结合。对于在（EN 1，…，ENk}中的每个各自的ENi,基于代表ENi的在UR 1，…，ARJ中的AR^计算一个或多个引物对。在该一个或多个八氏引物对中的每个引物对能够扩增AR ^勺一部分，该部分不在用于ARi鉴定的任何鉴定的一个或多个物理存在的源构建体中体现。在这样的实施方案中，由该一个或多个引物对扩增的连续排列八氏的部分和在该一个或多个用于八1鉴定的物理存在的源构建体中的一个或多个组件多核苷酸，按照由AR i规定的顺序，共同限定该工程化核酸构建体ENit5在一些实施方案中，使用一台或多台适当程序化的计算机来执行至少一部分的前述步骤（例如，该扩展、排列、选择和/或计算）。
[0023] 另一个方面提供了一种设备，该设备包括一个或多个存储器和一个或多个处理器。该一个或多个存储器以及该一个或多个处理器相互电连通。该一个或多个存储器使用该一个或多个处理器编码一组用于定义工程化核酸构建体群BN 1，…，ENk}的指令，其中k 为大于1的正整数。在（EN1，…，ENJ中的每个工程化核酸构建体ENi用于在目标生物体或宿主细胞的基因组位点L之中的整合。该指令集合包括指令用于对在（EN 1，…，ENJ中的每个各自的ENi接收相对应群{NR i;1，…，NRi, J核酸请求。{NRi;1，…，NRi, J中的每个核酸请求NRi;j规定对L的遗传变化。对于在{EN i，…，ENJ中的每个各自的ENi, η是与在（EN1，… ，ENk}中的每个其他的EN1J^n相同或不同的正整数。该指令集合进一步包含指令用于对在 (EN 1，…，ENJ中的每个各自的ENi,将在{NRi;1，…，NRi, J中的每个NRi,』扩展成具有核酸序列的组件多核苷酸，从而形成对于在（EN1，…，EN k}中的每个各自的ENi相对应的组件多核苷酸群。在一些实施方案中，该指令集合进一步包含指令用于对在（EN 1，…，ENk}中的每个各自的ENi,将来自扩展的相对应的多个多核苷酸排列成连续的排列AR i,其中该排列过程使用连接子核酸序列来将在相对应的组件多核苷酸群中的组件多核苷酸组合成ARi,从而形成连续排列群UR 1，…，ARJ，在UR1，…，ARJ中的每个ARjP表示在{EN i，…，ENJ中的 ENp在一些实施方案中，这些连接子核酸序列选自预先确定的连接子核酸序列文库。在一些实施方案中，该指令集合进一步包含指令用于对在（EN 1，…，ENk}中的每个各自的ENi,从物理存在于冷冻储库中的源构建体群选择一个或多个源构建体，其中对于在IEN 1，…，ENJ 中的各自的ENi的一个或多个物理存在的源构建体中的每个都为各自的EN i编码在组件多核苷酸群中的一个或多个组件核苷酸。在一些实施方案中，由用于各自的ENi的一个或多个物理存在的源构建体编码的一个或多个组件多核苷酸的每个各自的组件多核苷酸3'或5' 末端，或者3'与5'末端二者，与用于排列成AR i的各自的组件多核苷酸

完整全部详细技术资料下载

当前第1页1 2 3 4 5 6

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：D·M·普拉特;M·W·比斯尔;S·S·钱德拉;B·L·霍索恩;C·多兰;J·E·迪安;
技术所有人：阿迈瑞斯公司;
我是此专利的发明人

上一篇：智能移动终端的扫描方法及系统的制作方法
上一篇：表型整合社交搜索数据库和方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。