核酸文库及其制造方法

文档序号:10573730阅读:492来源:国知局
核酸文库及其制造方法
【专利摘要】本发明提供了用于设计和产生非随机核酸文库的方法。具体地,采用通过多重多聚核苷酸合成进行的非随机文库合成。各文库成员可编码启动子、核糖体结合位点和多肽。
【专利说明】核酸文库及其制造方法
[0001] 相关申请
[0002] 本申请要求2013年11月27日提交的美国临时申请号61/909,537的权益和优先权, 其全部内容通过引用纳入本文。
[0003] 关于序列表
[0004] 本说明书包括所附序列表,其包括创建于20 14年11月25日,名为"127662- 014601PCT_ST25.txt"、大小为6,327字节的文件,其内容通过引用全文纳入本文。 发明领域
[0005] 本发明的方法和组合物设及核酸文库,具体设及包含非随机变体的核酸文库的设 计和组装。
[0006] 背景
[0007]重组和合成核酸在研究、工业、农业和医学中有许多应用。可W使用重组和合成核 酸来表达和获得大量的多肤,包含酶、抗体、生长因子、受体和其它可用于多种医学、工业或 农业目的的多肤。也可W使用重组和合成核酸来产生遗传修饰的生物体,包含修饰的细菌、 酵母、哺乳动物、植物和其它生物体。遗传修饰的生物体可W用于研究(例如,疾病的动物模 型、理解生物过程的工具等)、工业(例如,作为蛋白表达的宿主生物体、用于产生工业产物 的生物反应器、环境补救的工具、分离或修饰具有工业应用的天然化合物等)、农业(例如, 具有增加的产率或增加的对疾病或环境压力的抗性的经修饰作物等)和用于其它应用。重 组和合成核酸也可W用作治疗组合物(例如,用于修饰基因表达、用于基因治疗等)或用作 诊断工具(例如,病症的探针等)。
[000引已经开发了多种技术用于修饰存在的核酸(例如,天然存在的核酸)来产生重组核 酸和核酸变体。具体而言,已采用变体文库来选择或筛选具有所需性质的核酸或蛋白质产 物。因此,极其需要核酸的从头合成法,用于更广泛的应用。

【发明内容】

[0009] 本发明的方面设及生成非随机核酸文库的方法,所述非随机核酸文库包含多种感 兴趣的预选定或预定序列。本发明的其它方面设及非随机核酸文库,其包含多种感兴趣的 预选定或预定序列。
[0010] 本发明的方面设及生成非随机核酸文库的方法,所述方法包括如下步骤:(a)提供 第一体积的第一组部分双链核酸(partial double-stranded nucleic acid),其中第一组 双链核酸中的各核酸具有相同的单链突出端,其中第一组部分双链核酸中的各核酸具有不 同于第一组部分双链核酸中的另一核酸的预定序列的预定序列;(b)提供第二体积的第二 组部分双链核酸,其中第二组部分双链核酸中的各核酸具有与第一组部分双链核酸中的突 出端互补的相同的单链突出端,和(C)通过将第一组部分双链核酸与第二组部分双链核酸 混合来组装所述核酸文库,所述混合在使互补的突出端杂交的条件下进行,W形成非随机 变体祀核酸的文库。在一些实施方式中,第二组部分双链核酸具有预定序列,所述预定序列 可W不同于第二组部分双链核酸中的另一序列。而在其它实施方式中,第二组部分双链核 酸具有预定序列,所述预定序列可与第二组部分双链核酸中的另一序列相同。
[0011] 在一些实施方式中,第一和第二组部分双链核酸具有3'突出端。而在其它实施方 式中,第一和第二组部分双链核酸具有5 '突出端。
[0012] 在一些实施方式中,组装步骤可W在单一反应体积中进行。
[0013] 在一些实施方式中,在组装步骤中,互补的突出端杂交W形成无缺口的接合 (gapless化nction)。在一些实施方式中,连接所述无缺口的接合。
[0014] 在一些实施方式中,所述方法包括:提供第一体积的第一组纯端双链核酸集,其中 第一纯端双链核酸集里的第一核酸具有从第一纯端双链核酸集里的第二核酸偏移n个碱基 的序列,并且,其中各纯端双链核酸集中的各双链核酸是该集中另一双链核酸的变体。在一 些实施方式中,所述方法还包括提供第二体积的第二组纯端双链核酸集,其中第二纯端双 链核酸集里的第一核酸具有从第二纯端双链核酸集里的第二核酸偏移n个碱基的序列。在 一些实施方式中,n可W是2、3、4、5、6、7,或8个碱基。在一些实施方式中,n可W是大于8个碱 基。例如,n可W是9、10、11、12、13、14、15、16、17、18、19、20或更多碱基。第一组纯端双链核 酸集可W在第一体积中解链或去杂交,W形成第一体积的单链核酸。类似地,第二体积的第 二组纯端双链核酸集可W经变性或去杂交W形成第二体积的单链核酸。多个单链寡核巧酸 可退火W形成第一体积的具有单链突出端的第一组部分双链寡核巧酸和第二体积的具有 单链突出端的第二组部分双链寡核巧酸。
[0015] 在一些实施方式中,第二组纯端双链核酸集中的各双链核酸是该集中的另一双链 核酸的变体。
[0016] 在一些实施方式中,所述方法还包括第=体积的第=组部分双链核酸,其中第= 组双链核酸中的各核酸具有相同的单链突出端,其中第=组部分双链核酸中的各核酸具有 预定序列,该预定序列不同于第=组部分双链核酸中的另一核酸的预定序列。
[0017] 在一些实施方式中,所述方法还包括组装变体核酸的文库,该组装通过在足W与 互补的突出端杂交的条件下混合第一、第二和第=组部分双链核酸来进行,由此形成非随 机变体祀核酸的文库。
[0018] 在一些实施方式中,所生成的文库可W是基因文库。在一些实施方式中,各双链核 酸的大小可W是约20个碱基对-约200个碱基对。
[0019] 在一些实施方式中,所生成的文库可W是基因文库。在一些实施方式中,各双链核 酸的大小可W是约200个碱基对-约500个碱基对。
[0020] 而在其它实施方式中,所生成的文库可W是代谢通路文库。在一些实施方式中,各 双链核酸的大小可W是约500个碱基对-约3,000个碱基对。在一些实施方式中,各双链核酸 可W是基因或基因的集。在一些实施方式中,各双链核酸可包含遗传元件。在一些实施方式 中,各双链核酸可W是操纵子,其包括启动子序列、核糖体结合位点序列、基因或基因的集、 终止子或其任何组合。在一些实施方式中,所述文库可W是操纵子文库,其包含具有不同强 度的启动子。在一些实施方式中,所述文库可W是操纵子文库,其包含具有不同强度的核糖 体结合位点。
[0021] 根据本发明的一些方面,生成核酸文库的方法包括如下步骤:鉴定祀核酸、在祀核 酸中鉴定第一区域,其中第一区域包含变体核酸序列;和在祀核酸中鉴定第二区域,其中第 二区域包含非变体序列。在一些实施方式中,祀核酸可包含一个或多个非变体区或恒定区、 一个或多个可变区及其组合。
[0022] 然后,可在包含变体核酸序列的至少第一组寡核巧酸和包含非变体核酸序列的至 少第二组寡核巧酸中解析祀核酸。可提供并组装至少第一和第二组寡核巧酸。在一些实施 方式中,该文库可W采用基于聚合酶的组装反应、基于连接酶的组装反应,或其组合来组 装。
[0023] 在一些实施方式中,祀核酸可编码具有一个或多个结构域的多肤。在一些实施方 式中,变体核酸序列可包含编码一个或多个结构域的至少部分的核酸序列的缺失、编码一 个或多个结构域的至少部分的核酸序列的插入,或其组合。在一些实施方式中,所述变体核 酸序列可具有如下任何情况:一个或多个核酸序列的缺失、一个或多个核酸序列的插入、一 个或多个取代,或前述任何情况的两种或更多种的任意组合。在一些实施方式中,所述缺失 可W是编码一个或多个结构域的至少部分的核酸序列的缺失。在一些实施方式中,所述插 入可W是编码一个或多个结构域的至少部分的核酸序列的插入。在一些实施方式中,所述 取代可W是编码一个或多个结构域的至少部分的核酸序列中的核巧酸的取代。在一些实施 方式中,所述缺失、插入或取代(或前述任何组合)可W是一个或多个倍数的3核巧酸。在一 些实施方式中,所述缺失、插入或取代(或前述任何组合)可包含单一倍数的3个连续核巧 酸。在其它实施方式中,所述缺失、插入或取代(或前述任何组合)可包含五组或更少组的3 个连续核巧酸。在一些实施方式中,所述缺失、插入或取代(或前述任何组合)可包含6个或 更少,7个或更少,8个或更少,10个或更少,11个或更少,11个或更少,12个或更少,或更多组 的3个连续核巧酸。在一些实施方式中,取代可W是3个连续核巧酸取代的倍数,或可涵盖任 何数量的核巧酸,包括但不限于,一个核巧酸,或两个核巧酸,或多于两个核巧酸。
[0024] 在一些实施方式中,所述祀核酸是基因或基因的集。在一些实施方式中,所述缺 失、插入或取代(或前述任何组合)在所述基因或基因的集的非编码序列中。在一些实施方 式中,基因或基因的集的非编码序列可包含缺失、插入或取代(或前述任何组合)。尤其在位 于非编码序列时,缺失、插入或取代(或前述任何组合)可包含任何数量的核巧酸,包括一个 或多个倍数(一组或多组)的3个连续核巧酸。根据本发明的一个实施方式,缺失、插入或取 代(或前述任何组合)可见于编码区、非编码区,或两者。
[0025] 在一些实施方式中,用于生成核酸文库的方法包括:选择祀核酸序列,选择待在一 个或多个选定位置缺失或插入的至少一个核酸序列,设计在该选定位置具有变体序列的第 一集的寡核巧酸和具有非变体序列的至少第二集的寡核巧酸,和组装第一和至少第二集的 寡核巧酸。在一些实施方式中,在所述选择步骤中,待缺失、插入或取代(或前述任何组合) 的核酸序列可W是一组或多组的3核巧酸。在一些实施方式中,在所述选择步骤中,待缺失、 插入或取代(或前述任何组合)的核酸序列可包含5组或更少组的3个连续核巧酸。在一些实 施方式中,在所述选择步骤中,待缺失、插入或取代(或前述任何组合)的核酸序列可包含6 个或更少,7个或更少,8个或更少,10个或更少,11个或更少,11个或更少,12个或更少,或更 多组的3个连续核巧酸。在一些实施方式中,取代可W是3个连续核巧酸取代的倍数,或可涵 盖任何数量的核巧酸,包括但不限于,一个核巧酸,或两个核巧酸,或多于两个核巧酸。
[0026] 在一些实施方式中,第一和第二集一起可包含祀核酸序列。在一些实施方式中,第 一和第二集一起可包含祀核酸序列的片段。在一些实施方式中,所述选定位置可包含核巧 酸、密码子、核巧酸序列或其组合。
[0027] 在一些实施方式中,祀核酸是基因或基因的集。在一些实施方式中,所述缺失、插 入或取代(或前述任何组合)在所述基因或基因的集的非编码序列中。尤其在位于非编码序 列时,缺失、插入或取代(或前述任何组合)可包含任何数量的核巧酸,包括一组或多组的3 核巧酸。根据本发明的一个实施方式,插入和/或缺失可见于编码区、非编码区,或上述两 者。
【附图说明】
[0028] 图1A-1B说明产生用于构建非随机变体文库的突出端核酸的非限制性示例性方 法。图IA显示在第一集合中产生具有3'突出端的核酸双链体。图IB显示在第二集合中产生 具有3 '突出端的核酸双链体。
[0029] 图2A和2B说明用于产生非随机变体文库的,组装具有突出端的核酸双链体的非限 制性示例性方法。
[0030] 图3A-3C说明构建非随机变体文库的非限制性示例性方法。图3A显示在第一单一 反应体积中制备的双链文库核酸或片段。图3B显示在第一单一反应体积中制备的双链文库 片段。图3C显示单一体积中双链文库片段混合物的生成。
[0031] 图4A-B说明构建非随机变体文库的非限制性示例性方法。图4A显示一个实施方 式,其中两个片段A交错杂交产物{A1,A2}、四个片段B交错杂交产物邮,82,83,84},和两个 片段C交错杂交产物{C1,C2}合并形成核酸的非随机文库。图4B显示运些集的交错杂交产物 A、B、C在单一反应体积的连接。
[0032] 图5说明在密码子、核巧酸和多个核巧酸水平具有缺失和/或插入的离散合成的序 列和所述序列的组合组装的非限制性实施方式。缺失和插入W下划线标示。合成在密码子 水平具有缺失和/或插入的离散序列:寡聚物1,寡聚物Ia具有核巧酸CTG的缺失和3核巧酸 CCG的插入(下划线标示),寡聚物化具有3核巧酸插入CTG、3核巧酸插入CCG(下划线标示)和 3核巧酸CCG(下划线标示)。合成在核巧酸水平具有缺失和/或插入的离散序列:寡聚物2,寡 聚物2a具有单一核巧酸缺失,寡聚物化具有单一核巧酸A插入(下划线标示)。合成在多重核 巧酸水平具有缺失和/或插入的离散序列:寡聚物3,寡聚物3a具有12个核巧酸缺失(下划线 标示),寡聚物3b具有12个核巧酸插入(下划线标示)。可将寡核巧酸组装成具有由用户指定 的精确序列的完全变体构建体:变体1:寡聚物1+寡聚物2+具有12个核巧酸缺失的寡聚物 3a,和变体2:具有3核巧酸缺失和3核巧酸插入的寡聚物Ia+具有单一核巧酸缺失的寡聚物 2a+具有12个核巧酸缺失的寡聚物3曰。
[0033] 发明详述
[0034] 本发明的方面设及用于生成非随机核酸文库的方法和组合物,所述非随机核酸文 库包含多种感兴趣的预选定或预定序列。本发明的一些方面设及化学合成用于广泛应用的 核酸文库,包括抗体设计和代谢通路最优化。制造核酸文库的一般方法是由终产物的单一 示例开始(例如,可能编码抗体的基因),然后随机突变该基因,例如通过采用易错聚合酶进 行扩增。用于产生变体文库的另一方法是将变异引入DNA合成,例如,通过在DNA合成反应的 具体偶联步骤中偶联核巧酸碱基(例如a、c、t和g)的混合物。运些方法的不足之处在于,运 些方法产生的随机文库包含大量的文库成员,其不太可能是感兴趣的变体,但又必须经过 筛选。此外,运些方法可能会占据可用筛选资源的大部分。
[0035] 本发明的方面设及合理设计并生成合理设计的变体文库的方法,其中所述文库的 基本每个成员或所述文库成员的大部分经设计或工程改造W具有非随机序列。所述方法能 够限制经合成和筛选的文库成员的数量,W更好地利用可用的文库筛选资源。因此,本发明 的方面设及能够减小变体核酸文库的复杂性的方法和组合物,由此减少在筛选过程中对运 些文库的过度取样,并提高筛选效率。
[0036] 本发明的方面可纳入核酸组装过程来,例如,提高组装保真度、通量和/或效率,降 低成本,和/或缩短组装时间。在一些实施方式中,本发明的方面可W自动化和/或在高通量 组装环境下进行来促进平行产生祀核酸序列的许多不同变体。
[0037] 本文使用的术语"核酸"、"多核巧酸"、"寡核巧酸"可互换使用,并且指核巧酸的天 然产生或合成的聚合物形式。本发明所述寡核巧酸和核酸分子可W从天然产生的核巧酸形 成,例如形成脱氧核糖核酸化NA)或核糖核酸(RNA)分子。在一些实施方式中,寡核巧酸和核 酸分子可被甲基化。或者,该天然产生的寡核巧酸可W包含改变其性质的结构修饰,例如肤 核酸(PM)或锁核酸(LNA)。用天然产生碱基或人工碱基的寡核巧酸和核酸分子的固相合成 为本领域熟知。应理解,运些术语包含从核巧酸类似物中生成的RNA或DNA的等同物、类似物 和应用于要描述的实施方式时的单链或双链多核巧酸。本发明中可用的核巧酸包含例如天 然产生的核巧酸(例如核糖核巧酸或脱氧核糖核巧酸),或者核巧酸的天然或合成修饰、或 者人工碱基。本文使用的术语单体指小分子组成员,其是并且能结合在一起W形成低聚物、 聚合物或由两个或更多成员构成的化合物。聚合物中所述单体的特定顺序在本文中称为聚 合物的"序狎'。所述单体组包含但不限于例如常见k氨基酸组、D-氨基酸组、合成和/或天 然氨基酸组、核巧酸组及戊糖和己糖组。本发明所述方面主要设及制备和应用寡核巧酸,也 可容易地用于制备其它聚合物例如肤或多肤、多糖、憐脂、异聚物、聚醋、聚碳酸醋、聚脈、聚 酷胺、聚乙締亚胺、聚芳撑硫、聚硅氧烷、聚酷亚胺、聚乙酸醋或任何其它聚合物。
[0038] 术语"基因"指的是,表达特定蛋白质的核酸片段,包括调控序列,例如处于编码序 列之前巧/非编码序列)和之后(3/非编码序列)的调控序列。
[0039] "启动子"指的是能够控制编码序列或功能性RNA的表达的核巧酸序列。通常,编码 序列位于启动子序列的3'。
[0040] 本文使用的术语"预确定序列"、"预定序列"或"预选定序列"可互换使用,并且指 在所述聚合物合成或组装前已知并选择聚合物的序列。具体地,本文所述本发明的各方面 主要设及核酸分子的制备,在核酸分子合成或组装前已知且已选择核酸的序列。在本文所 提供技术的一些实施方式中,固定的寡核巧酸或多核巧酸被用作材料来源。在各种实施方 式中,本文所述方法使用合成的寡核巧酸,其序列基于待合成的最终多核巧酸构建体的序 列确定。在一个实施方式中,寡核巧酸是短核酸分子。例如,寡核巧酸的长度可W是10至约 300个核巧酸、20至约400个核巧酸、30至约500个核巧酸、40至约600个核巧酸,或超过约600 个核巧酸。然而,可W使用更短或更长的寡核巧酸。寡核巧酸可设计成具有不同长度。在一 些实施方式中,多核巧酸构建体序列可W分成多个更短序列,该序列能使用本文所述方法 平行合成并组装成单个或多个所需多核巧酸构建体。在一些实施方式中,所述组装过程可 W包括数种平行和/或顺序反应步骤,其中多个不同核酸或寡核巧酸被合成或固定、引物延 伸或扩增,并且合并W组装(如通过本文所述延伸或连接)生成更长核酸产物,从而用于进 一步组装、克隆或其它应用。
[0041] 本文所用的"非随机"核酸文库序列指的是所述文库中的祀核酸序列在组装之前 是基本预选定或预定的,运与经变性或随机衍生不同。本文所用的术语"非随机变体文库" 和"通过多重多核巧酸合成的变体文库(VL-MPS)"可互换使用。在一些实施方式中,根据本 发明方面的非随机文库基本不含随机序列变异(例如包含少于10%,少于5%,少于1%,少 于0.1%,或少于0.01%的随机变异)。本领域技术人员应理解,变体核酸可包括待变化的参 照核酸序列的任意各种变异位点。
[0042] 在一些实施方式中,非随机文库的变体成员可W是基于预定的参照序列而言包含 单一或多个序列变异的相关序列。根据本发明的一些方面,非随机文库可W从多种核酸(例 如,多核巧酸、寡核巧酸等)组装,W形成较长的核酸产物。文库可包含包括相同的(非变异) 区域和序列变异区域的核酸。因此,某些待组装的核酸可与非变体序列区域相对应,而其它 待组装的核酸可与预定的序列变异区域中的若干预定序列变体之一相对应。在一些实施方 式中,非随机核酸文库可包含编码两种或更多种感兴趣的多肤的两种或更多种核酸。在一 些实施方式中,非随机文库可经设计W表达任何类型的多肤,例如支架蛋白质、抗体、酶 ......
[00创合成寡核巧酸
[0044] 在一些实施方式中,本文提供的方法和装置使用固定在表面或基底上的寡核巧酸 (如结合支持物的寡核巧酸)。结合支持物的寡核巧酸包括例如与构建寡核巧酸互补的寡核 巧酸、错定寡核巧酸和/或间隔子寡核巧酸。本文使用的术语"支持物"、"基底"和"表面"可 互换使用,并且指聚合物例如核酸在上面合成或固定的多孔或非多孔溶剂不溶性材料。本 文使用的"多孔"是指所述材料包含有基本一致直径(例如nm范围内)的孔。多孔材料包括 纸、合成滤器等。在运种多孔材料中,所述反应可W在孔中进行。所述支持物能具有很多形 状中的任何一种,例如销型、条、板、平盘、杆状、弯曲、圆柱形结构、颗粒(包含珠、纳米颗粒) 等。所述支持物可有可变宽度。所述支持物可W是亲水性的,或可W制成亲水性的,并且包 含无机粉末(如二氧化娃、硫酸儀和氧化侣)、天然聚合材料(特别是纤维素材料和纤维素衍 生材料,例如包含纤维的纸(如滤纸、色谱纸等))、合成或改性天然产生的聚合物(如硝酸纤 维素、乙酸纤维素、聚(氯乙締)、聚丙締酷胺、交联的葡聚糖、琼脂糖、聚丙締酸醋、聚乙締、 聚丙締、聚(4-甲基下締)、聚苯乙締、聚甲基丙締酸醋、聚(对苯二甲酸乙二醋)、尼龙、聚(下 酸乙締醋)、聚偏二氣乙締(PVDF)膜、玻璃、可控孔度玻璃、磁性可控孔度玻璃、陶瓷、金属 等),或者单独使用或与其它材料联用。在一些实施方式中,W阵列形式合成寡核巧酸。例 如,在常见支持物上原位合成单链寡核巧酸,其中在基底上的单独或离散的部位(或点)上 合成各寡核巧酸。在一个实施方式中,单链寡核巧酸结合到所述支持物或特征部位的表面 上。本文所用的术语"阵列"是指用于存储、扩增和释放寡核巧酸或互补寡核巧酸用于进一 步反应的离散特征的排列。在一个优选实施方式中,所述支持物或阵列是可寻址的:所述支 持物在该支持物上具体的预定位置(即,"地址")处包括两个或更多个离散的可寻址特征。 因此,阵列上的各寡核巧酸分子位于所述支持物上已知和确定的位置。各寡核巧酸序列能 从其在所述支持物上的位置来确定。所述阵列可W包含特征部位之间的区域。特征部位之 间可W在其表面载有任何寡核巧酸,并且可对应惰性空间。
[0045] 在一些实施方式中,寡核巧酸在表面或阵列的离散特征上连接、点样、固定、表面 结合、支持或合成。
[0046] 本发明的一些方面设及多核巧酸组装过程,其中,合成的寡核巧酸经设计并且用 作引物延伸反应、合成互补寡核巧酸的模板,并用于组装多核巧酸成为更长多核巧酸构建 体。在一些实施方式中,该方法包含在链延伸反应中使用第一组单链寡核巧酸作为模板合 成多个寡核巧酸或多核巧酸。如前所述,可W首先在表面的多个离散特征部位上或在多个 支持物(如珠)上合成寡核巧酸,或可将寡核巧酸置于支持物的多个特征部位上或多个支持 物上。支持物可W包含至少100、至少1,000、至少1〇4、至少1〇5、至少1〇6、至少1〇 7、至少IO8个 特征。在一些实施方式中,所述寡核巧酸共价连接至所述支持物。在一些实施方式中,所述 多个寡核巧酸固定在固体表面上。
[0047] 在一些实施方式中,所述结合支持物的寡核巧酸可通过其5'末端连接。在其它实 施方式中,所述结合支持物的寡核巧酸通过其3'末端连接。在一些实施方式中,所述结合支 持物的寡核巧酸可W通过核巧酸序列(如简并结合序列)、接头或间隔子(如光可切割的接 头或化学接头)固定在支持物上。应理解,3 '末端是指所述5 '末端的下游序列,和5 '末端是 指所述3'末端的上游序列。例如,寡核巧酸可通过不参与杂交的间隔子、核巧酸序列或接头 固定在支持物上。然后,所述结合支持物的寡核巧酸的3'末端表示接头或间隔子的上游序 列。
[0048] 在某些实施方式中,寡核巧酸可W设计成具有与要组装的预测定祀标多核巧酸序 列的不同部分相同或互补的序列。因此,在一些实施方式中,每条寡核巧酸可W具有与双链 祀核酸的两条链之一的部分相同或互补的序列。本文使用的术语"互补"指两个核巧酸之间 精确配对的能力。例如,如果在核酸给定位点的核巧酸能与另一核酸的核巧酸形成氨键,贝U 认为两个核酸分子在该位点彼此互补。两条单链核酸间的互补性可W是"部分的",其中仅 有一些核巧酸结合,或者当单链分子间存在完全互补性时为完全互补。术语"正交"表示所 述序列不同、不具干扰性或不互补。
[0049] 在一些实施方式中,提供多种传导寡核巧酸(conduction oligonucleotide)。在 一些实施方式中,构建寡核巧酸山〇邮化11(31:;[0]1 oligonucleotide)采用结合支持物的寡核 巧酸作为模板来合成。
[0050] 在一些实施方式中,设计多个构建寡核巧酸,例如多个构建寡核巧酸各在其5 '末 端具有与另一个构建寡核巧酸5'末端的序列区域互补的序列区域,和在其3'末端具有与不 同构建寡核巧酸3'末端的序列区域互补的序列区域。在一些实施方式中,设计多个构建寡 核巧酸,例如多个构建寡核巧酸各在其5'末端具有与另一个构建寡核巧酸5'末端的序列区 域相同的序列区域,和在其3'末端具有与不同构建寡核巧酸3'末端的序列区域相同的序列 区域。本文所用的"构建"寡核巧酸指的是,用于生成偏移二聚体W用于核酸组装的多个单 链或双链寡核巧酸或其群之一。多个构建寡核巧酸可W是双链的,并且可包含针对祀多核 巧酸的正义和反义链的寡核巧酸。构建寡核巧酸可W是纯端寡核巧酸双链体。构建寡核巧 酸可有任何长度,所述长度设计为适合重叠或互补序列。构建寡核巧酸可具有相同大小或 不同大小。在优选实施方式中,所述构建寡核巧酸跨越祀多核巧酸的整个序列且无缺口。在 其他实施方式中,所述构建寡核巧酸部分重叠,使得在互相杂交时产生构建寡核巧酸之间 的缺口。在一些实施方式中,构建寡核巧酸可具有除所述祀多核巧酸序列W外的其它序列。 例如,构建寡核巧酸可W是具有插入和/或缺失的经修饰的构建寡核巧酸。在一些实施方式 中,所述构建寡核巧酸可具有一个或多个取代。在一些实施方式中,所述构建寡核巧酸可具 有一个或多个插入、一个或多个缺失、一个或多个取代,或前述任何组合。在一些实施方式 中,构建寡核巧酸的集合或群包含具有重叠序列(互补的或相同)的构建寡核巧酸。
[0051] 本文所用术语"二聚体"指寡核巧酸双链体或双链寡核巧酸分子。术语"偏移二聚 体"和"偏移双链体"可互换使用,并且指具有3 '和/或5 '突出端(或粘性末端,即,非纯端)的 寡核巧酸双链体。在一些实施方式中,偏移二聚体是部分双链核酸(例如寡核巧酸),由此, 所述核酸包含第一单链突出端和第二单链突出端。例如,所述偏移二聚体可具有3 '突出端 或所述偏移二聚体可具有5 '突出端。
[0052] 在一些实施方式中,所述偏移二聚体通过对集合中的构建寡核巧酸进行变性和重 新杂交来产生。
[0053] 应该理解不同的寡核巧酸可W设计成有重叠序列区域的不同长度。重叠序列区域 可W是相同的(即对应核酸片段的相同链)或互补的(即对应核酸片段的互补链)。重叠序列 可W具有任何合适的长度。重叠序列可W长约5-约500个核巧酸(如长约10-100、约10-75、 约10-50、约20、约25、约30、约35、约40、约45、约50个核巧酸等)。然而,可W使用更短、更长 或中间的重叠长度。应该理解用于组装反应的不同输入核酸之间的重叠(5'或3'区域)可W 有不同长度。
[0054] 在一些实施方式中,核酸采用基于连接酶的组装技术组装。在一些实施方式中,寡 核巧酸经设计W提供祀多核巧酸构建体的全长正义(或正链)和反义(或负链)链。在正义和 反义寡核巧酸杂交W形成偏移二聚体之后,偏移二聚体经历连接,W形成祀多核巧酸构建 体或亚组装产物。参考美国专利号5,942,609,其全文纳入本文。基于连接酶的组装技术可 W设及一种或多种合适的连接酶,所述酶能催化临近3'和5'核酸末端的共价连接(如在互 补模板核酸上退火的核酸的5'憐酸和3'径基,从而所述3'末端紧邻5'末端)。因此,如果第 一和第二核酸在模板核酸上互相临近退火,连接酶可W催化第一核酸的5'憐酸和第二核酸 的3'径基之间的连接反应。连接酶可W获自重组或天然来源。连接酶可W是热稳定的连接 酶。在一些实施方式中,可W使用来自嗜热生物的热稳定连接酶。热稳定DNA连接酶的例子 包括但不限于:Tth DNA连接酶(来自嗜热栖热菌(Thermus thermophiIus),可来自例如欧 基公司化urogentec)和GeneCraft公司);P化DNA连接酶(来自激烈火球菌(Pyrococcus 化riosus)的超嗜热连接酶);Taq连接酶(来自水生栖热菌(Thermus aquaticus)) ,Ampli 连?酶?(来自化icenter生物技术公司)任何其它合适的热稳定连接酶,或其任意组合。在 一些实施方式中,可W使用一种或多种较低溫度的连接酶(如T4DNA连接酶)。较低溫度的连 接酶可W用于可能在较高溫度下不稳定的更短突出端(如约3、约4、约5、或约6个碱基的突 出端)。非酶促技术,例如化学连接,可用于连接核酸。
[00巧]多重多核巧酸合成
[0056]本发明的方面设及用于广泛应用的核酸文库的化学合成。本发明的一些实施方式 设及用于合成核酸文库的快速且经济的方法。应理解,多核巧酸合成成本的主要部分是进 行多核巧酸合成反应的试剂成本。为了降低成本,反应可在较小体积中进行。在一些实施方 式中,反应可在个体微体积(例如液滴)中进行。根据本发明的一些方面,多种不同核酸可W 在多重核酸合成中的单一合成反应体积中合成。本领域技术人员应理解,所述文库可通过 依序、平行或分级多重组装过程来组装。在一些实施方式中,可在单一反应中组装所述文 库,或分开组装中间核酸片段然后在一轮或多轮组装(例如杂交和连接)中将其合并。
[0057] 应理解,在第一步中,设计构建核酸序列或构建寡核巧酸。构建核酸可W是合成的 寡核巧酸,如本文中所述,扩增产物、限制片段或其它合适的核酸。在一些实施方式中,某些 构建核酸可包括一种或多种序列变异。在一些实施方式中,可设计所述构建核酸,从而在第 一集合中的第一构建核酸的5'端与第二集合中的第二构建核酸的3'端相同。
[0058] 根据本发明的一些方面,非随机文库可通过合并两个或更多个核酸集合(各核酸 具有预定序列)来组装。在一些实施方式中,一个或多个池可具有核酸变体序列。例如,所述 核酸文库可通过合并一个核酸变体集合和具有不可变(或恒定)序列的一个核酸集合来组 装。而在其它实施方式中,所述核酸文库可通过合并多个核酸变体集合来组装。因此,可设 计并组装具有不同类型或变体或不同变体密度的不同文库。
[0059] 在一些实施方式中,合并的各核酸的浓度可W经调节W改善组装反应并驱动所述 反应,W形成全长核酸。在一些实施方式中,各核酸的浓度是偏向(biased)的,W改变代表 的核酸变体的比例。在一些实施方式中,可W预确定的比例添加各构建核酸,W使所得核酸 文库偏向。例如,如果需要该文库具有某一水平的特定变异并在相同或不同位点具有较低 水平的另一变异,可通过添加较高水平的所需变异来使该文库偏向。在一些实施方式中,具 有可变序列的核酸可与具有不可变序列的核酸W预定比例合并,W使核酸文库偏向。
[0060] 用于产生具有预定序列的核酸的文库的多重核酸组装反应的某些实施方式参照 图1-4进行说明。应理解,本文所述的合成和组装方法(包含,例如,寡核巧酸合成、分步组 装、多重核酸组装、核酸片段的等级组装或其任意组合)可W任意合适的模式实施,包含在 反应试管中、在多孔平板中、在表面上、在柱中、在微流体装置(例如,微流体管)中、毛细管 中等。
[0061] 在多重组装反应(例如,多重的酶介导反应、多重化学组装反应或其组合)中可W 从多个不同起始核酸(例如,寡核巧酸)组装成文库的预定核酸成员。通过对多重寡核巧酸 组装反应的某些实施方式的W下描述显示了多重核酸组装反应的某些方面。应该理解寡核 巧酸环境下组装反应的描述并不意在构成限制。可W使用从一个或多个不同来源(例如,合 成或天然多核巧酸、核酸扩增产物、核酸降解产物、合成或天然寡核巧酸、合成或天然基因 等)得到的起始核酸,来实施本文所述的组装反应。起始核酸可W被称为组装核酸(例如,组 装寡核巧酸)。如本文所用,组装核酸或偏移二聚体具有的序列设计为待纳入组装过程所产 生核酸产物中的序列。然而,应该理解在双链核酸环境下组装反应的描述并不意在构成限 审IJ。在一些实施方式中,在图中所示和本文所述的起始核酸的一个或多个可W单链核酸提 供。因此,应理解,当图和说明表示粘性末端双链核酸的组装时,考虑一个或多个单链核酸 的存在。
[0062] 在各个实施方式中,祀核酸首先可被分成两个或更多重叠的核酸片段(亚组装片 段)。每个核酸片段然后被再分为两个或更多的重叠的更小核酸片段。
[0063] 可W使用任意合适的技术来合成寡核巧酸。例如,可W在柱或其它支持物(例如, 忍片或阵列)上合成寡核巧酸。基于忍片的合成技术的例子包括自CombiMatrix、安捷伦 (Agilent)、艾菲美特(Affymetrix)或其它来源可得的合成装置或方法中使用的技术。合成 寡核巧酸可W是任意合适的大小,例如10-1000个核巧酸长(例如,10-200、200-500、500- 1000个核巧酸长或其任意组合)。组装反应可W包含多个寡核巧酸,每个寡核巧酸的长度可 W各自独立为10-300个核巧酸(例如,20-250、30-200、50-150、50-1OO或任意中间数的核巧 酸)。然而,在某些实施方式中可W使用一个或多个较短或较长的寡核巧酸。
[0064] 如本文所用,寡核巧酸可W是包括至少两个共价结合的核巧酸残基的核酸分子。 在一些实施方式中,寡核巧酸长度可W是10-1000个核巧酸。例如,寡核巧酸长度可W是约 10~约500个核巧酸,或约500~约1,000个核巧酸。在一些实施方式中,寡核巧酸长度可W 是约20-约300个核巧酸(例如,约30-250、40-220、50-200、60-180,或约65或约150个核巧 酸)、约100-约200、约200-约300个核巧酸、约300-约400,或约400-约500个核巧酸。然而,可 W使用更短或更长的寡核巧酸。寡核巧酸可W是单链核酸。然而,在一些实施方式中,可W 如本文所述使用双链寡核巧酸。在某些实施方式中,寡核巧酸可W是化学合成的,如W下详 述。在一些实施方式中,可W在使用前扩增输入的核酸(例如,合成寡核巧酸或核酸片段)。 所得的产物可W是双链的。
[0065] 在某些实施方式中,每条寡核巧酸可W设计成具有与待组装的预定祀核酸的序列 的不同部分相同的序列。因此,在一些实施方式中,每条寡核巧酸可W具有与双链祀核酸的 两条链之一的部分相同的序列。为清楚起见,双链核酸的两条互补链在本文中被称为正链 (P)和负链(N)。运种名称并不意在暗示链是编码序列的正义链和反义链。它们仅仅是指核 酸(例如,祀核酸,中间体核酸片段等)的两条互补链,无关核酸的序列或功能。因此,在一些 实施方式中,P链可W是编码序列的正义链,而在其它实施方式中,P链可W是编码序列的反 义链。应理解,本文提及的互补核酸或互补核酸区域是指具有互相反向互补使得它们能够 W天然DNA典型的反向平行方式杂交的核酸或其区域。
[0066] 按照本发明的一个方面,祀核酸可W是P链、N链或包括P链和N链的双链核酸。应理 解,不同的寡核巧酸可W被设计为具有不同的长度。在一些实施方式中,一种或多种不同的 偏移寡核巧酸可W具有重叠的序列区域或突出端(例如,重叠的5'区域和/或重叠的3'区 域)。重叠序列区域可W是相同的(即对应核酸片段的相同链)或互补的(即对应核酸片段的 互补链)。多种偏移寡核巧酸二聚体可W包含有相同重叠序列区域的一个或多个寡核巧酸 对、有重叠互补序列区域的一个或多个寡核巧酸对,或其组合。重叠序列可W具有任何合适 的长度。例如,重叠序列可W包括在组装反应中使用的一个或多个核酸的全长。重叠序列可 W是约2-约50(例如,3-20、3-10、3-8、或4、5、6、7、8、9个等核巧酸长)。然而,可W使用更短、 更长或中间的重叠长度。应该理解用于组装反应的不同偏移寡核巧酸二聚体之间的重叠可 W有不同长度和/或序列。例如,重叠序列可W与另一个序列差异至少1个核巧酸、2个核巧 酸、3个核巧酸或更多。
[0067] 在一个设计为产生预定核酸片段的多重寡核巧酸组装反应中,在反应中不同寡核 巧酸的合并序列可W在正链、负链、两条链或正链的部分和负链的部分的结合上跨越完整 核酸片段的序列。多个不同的寡核巧酸可W对应待组装核酸片段的完整序列提供正链序 列、负链序列或正链和负链序列的组合。
[0068] 在本发明的一个方面,核酸片段可W在连接酶介导的组装反应中组装自多个在一 轮或多轮连接酶介导的连接中合并并且连接的寡核巧酸。基于连接酶的组装技术可W设及 一种或多种合适的连接酶,所述酶能催化临近3'和5'核酸末端的共价连接(如在互补模板 核酸上退火的核酸的5'憐酸和3'径基,从而所述3'末端紧邻5'末端)。因此,如果第一和第 二核酸彼此相邻地在模板核酸上退火,连接酶可W催化所述第一核酸的5'憐酸和第二核酸 的3'径基之间的连接反应。
[0069] 应理解,多重多核巧酸组装反应可在单一体积例如孔中进行,或可在局部单独微 体积中进行。在一些实施方式中,所述延伸和/或组装反应在微滴中进行(见PCT申请PCT/ US2009/55267和PCT申请PCT/US2010/055298,各通过引用全文纳入本文)。
[0070] 文库构建
[0071] 本发明的一些方面设及具有粘性末端的偏移双链体(本文中也称为偏移二聚体) 的设计和产生,W及该偏移双链体的组装,W形成变体文库。图1A-1B显示多重偏移双链体 (或二聚体)制备的示例方法。图1A-1B说明偏移二聚体结构模块(本文中也称为具有双链突 出端的寡核巧酸)的多重制备。
[0072] 在一些实施方式中,第一和至少第二组具有双链突出端的核酸W结构模块的形式 生成,用于非随机核酸文库的组装。在一些实施方式中,来自该文库的各核酸通过对具有互 补的突出端(或粘性末端)的核酸进行杂交和连接来组装。
[0073] 根据本发明的一些方面,所述方法包括,提供部分双链寡核巧酸的第一群,由此各 第一寡核巧酸包含第一和第二单链突出端,和提供部分双链寡核巧酸的第二群,由此各第 二寡核巧酸包含第一单链突出端和第二单链突出端。在一些实施方式中,第一群中的第一 突出端是相同的,且第一群中的第二突出端是相同的。在一些实施方式中,第一群的寡核巧 酸的相同的第一突出端与第二寡核巧酸群的相同第一突出端互补。根据本发明的一些方 面,第一寡核巧酸可W通过第一寡核巧酸的单链突出端和第二寡核巧酸的单链突出端连接 至第二寡核巧酸,产生第一连接产物。第一连接产物可包含第一寡核巧酸的第一突出端和 第二寡核巧酸的第二突出端。
[0074] 参照图1A,产生具有交错突出端的第一组核酸(A)。在一些实施方式中,构建寡核 巧酸可W从模板支持物结合的寡核巧酸扩增。例如,寡核巧酸〇\'九、〇\'北、〇\"九、〇\"北可 W从模板寡核巧酸扩增,W形成单一第一反应体积的多种纯端双链寡核巧酸。应理解,多种 双链构建寡核巧酸可获自市售来源,或可设计和/或合成至固体支持物(例如阵列)之上。然 而,应理解,可采用其它核酸(例如,单链或双链核酸降解产物、限制片段、扩增产物、天然产 生的小核酸、其它多核巧酸等)。
[0075] 在一些实施方式中,设计第一集的纯端双链寡核巧酸(例如KAli、KA"孔)的寡核巧 酸,从而各序列从该集的另一序列偏移n个碱基。在一些实施方式中,偏移n可W是2~8个碱 基。例如,该偏移可W是2个碱基、3个碱基、4个碱基、5个碱基、6个碱基、7个碱基、8个碱基或 更多。例如,参照图1A,设计寡核巧酸,从而第一集的纯端双链寡核巧酸KA'化和KA"孔W及第 二集的纯端双链寡核巧酸KA '北和〇〇2具有彼此偏移4个碱基的序列。
[0076] 在一些实施方式中,提供第二集的纯端双链寡核巧酸。在一些实施方式中,纯端双 链寡核巧酸的第二集的纯端双链寡核巧酸可W是纯端双链寡核巧酸的第一集的纯端双链 寡核巧酸的序列变体。例如,第二集的寡核巧酸可包含突变、取代等。所述突变可W位于预 定的位点或随机位点。在一些实施方式中,第二集的纯端双链寡核巧酸包含来自核酸变体 文库的核酸。在一些实施方式中,核酸变体文库可从参照基因设计,并且可包含预定数量的 突变(n)。各集中的突变可位于相同或不同位置;和位于任何位置。
[0077] 在一些实施方式中,各集中的纯端双链寡核巧酸可经历促进变性的条件(例如通 过将溫度升高至高于解链溫度),然后允许重新杂交W形成具有突出端的双链寡核巧酸。
[007引参照图 IA 下部,双链寡核巧酸 KA'3i(SEQ ID N0:1)、KA']2(SEQ ID N0:2)、KA"九 (SEQ ID N0;3)、DTl2(SEQ ID N0;4)可去杂交或变性(例如通过解链)并重新杂交W形成 交错杂交产物。根据一些实施方式,具有突出端的双链寡核巧酸可具有不同的内部双链序 列但相同的单链突出端。仍参照图1A,偏移二聚体产物(例如Al和A2)可具有相同的n个碱基 突出端(例如3'端突出端)但可具有不同内部序列。如图IA中所示,偏移二聚体Al具有序列 (tccgatttacgggt,沈Q ID N0:1),其与偏移二聚体A2(tccgat却acgggt,沈Q ID N0:2)的不 同之处在于存在't'核巧酸替代'C'核巧酸。参照图IA,杂交产生产物AUSEQ ID NO: 1,SEQ ID N0:7)和A2(SEQ ID N0:2和SEQ ID N0:8)。杂交反应还可产生产物Al*(沈Q ID N0:1, 沈Q ID N0:9)和A2*(沈Q ID N0:2,沈Q ID N0:10)。
[0079] 参照图1B,具有交错突出端的第二组核酸(B)可W是按照对于第一组核酸(例如核 酸A)描述的相同方法来生成。在变性和重新杂交后,所述核酸能形成具有单链突出端的部 分双链核酸。例如,如图IB所示,可形成具有3'突出端的核酸Bi(SEQ ID NO: 5,SEQ ID NO: 11)。此外,也可形成具有5'突出端的核酸Bi*(SEQ ID N0:6,SEQ ID N0:12)。
[0080] 图2A-2B说明采用S个偏移二聚体组装两种核酸变体的非限制性示例。根据一些 实施方式,具有互补的突出端的核酸可杂交W形成无缺口可连接的接合,并且可经连接W 形成较长的核酸序列。例如,具有3'突出端的核酸可与具有互补的3'单链突出端的核酸杂 交。参照图2A-2B,变体文库可通过混合并组装具有图1的互补的突出端的核酸来产生。仍参 照图2A-2B,具有与变体Al和A2互补的突出端的偏移二聚体Bl可在单一反应体积中连接至变 体八1(图24)和42(图28),^形成变体文库产物4181(569 10顯:13,569 10^):14)和八281 (沈Q ID NO: 15,沈Q ID NO: 16)。
[0081] 本发明的方面设及复杂变体文库的合成。图3A-3C和图4A-4B说明通过多重多核巧 酸组装产生更复杂的变体文库的实施方式。参照图3A,双链文库核酸或片段化A'm、KA' ?、KA'?…KA'?}可在第一单一反应体积中制备。例如,双链核酸可通过阵列上结合支持物 的寡核巧酸的扩增来合成。双链文库片段化B'化、防'龙、防'北…防'恥}可在第二单一反应 体积中制备,并且双链文库片段化C'孔、防'北、防13…防'M可在第S反应体积中制备等。
[0082] 参照图3B,双链文库片段化A"九、〇\"龙、〇\"恥''〇\"恥}可在第一单一反应体积中 制备。在一个示例性实施方式中,双链寡核巧酸可采用阵列上模板结合支持物的寡核巧酸 来扩增。双链文库片段化B"化、防"龙,…防"恥}可在第二单一反应体积中制备,化(Tli、防" 北、防"孔…防"亦何在第S反应体积中制备等。
[0083] 参照图3C,双链文库片段化4'九、〇\'龙,〇\'北。'〇\'恥}与双链文库片段{:〇\"九、^ A"恥、KA"]3…KA"3n}在单一体积中合并。双链核酸可经历一定条件W去杂交(例如通过解 链),然后经历促进重新杂交的条件W形成交错杂交产物{Al、A2、A3…AN},如上所述。类似 地,双链文库片段化B'孔、防'恥,阳'北…防'恥}可W与双链文库片段化B"孔、阳"恥,防" 孔…防"亦}在单一体积中合并,然后去杂交(例如通过解链)并重新杂交,W形成交错杂交产 物{Bi,化,B3...Bn}等。
[0084] 图4A显示特定示例,其中两个片段A交错杂交产物{Ai,A2},四个片段B交错杂交产 物{Bi,化,B3,B4},和两个片段C交错杂交产物ICi,C2}合并,W形成非随机核酸文库。
[0085] 交错杂交产物A的上游单链突出端序列(全部右端的序列)经设计W彼此相同,并 且与交错杂交产物B的下游单链突出端序列(全部左端的序列)(其进而全部设计为相同)互 补(且能够杂交)。类似地,交错杂交产物B的上游单链突出端序列(全部右端的序列)经设计 W彼此相同,并且与交错杂交产物C的下游单链突出端序列(全部左端的序列)(其均设计为 相同)互补并杂交。
[0086] 参照图4B,然后,运些集的交错杂交产物A、B、C可在单一反应体积中连接,W形成 16 ( = 2*4*2)个变体{A巧iCi,AiBiC2,A巧iC3.... A2B4C2}。
[0087] 在一些实施方式中,变体文库的成员总数与各片段A,B,C等的变体数量的产物相 等。实践中,连接反应可对连接的2~10个片段而言高效。在示例性的实施方式中,10个片段 (八,8,〇,^),各自有4个变体,将产生410~1百万个成员的变体文库。
[0088] 一些实施方式中,所述片段的尺寸可W是约20bp、约30bp、约40bp、约50bp、约 6化P、约70bp、约SObp、约90bp、约10化P或更大。而在一些实施方式中,所述片段的尺寸可W 是约 200bp、约 300bp、约 400bp、约 400bp、约 500bp、约 600bp、约 700bp、约 800bp、约 900bp、约 1000 bp、约 2000bp、约 3000bp 或更大。
[0089] 应理解,如果片段A、B、C等是寡核巧酸(约20bp~2(K)bp)的尺寸,那么10个片段的 组装产生的文库产物可在个体基因(约200bp~2肺P)的尺寸范围内。其中各成员可W是基 因变体的所述变体文库可能高度有利于感兴趣的蛋白质的最优化。例如,该变体文库可有 利于抗体(例如具有特定或改善的结合性质的抗体)的最优化。在一些实施方式中,筛选可 W通过采用隧菌体或酵母展示或本领域已知的任何合适的方法来高效地完成。感兴趣的产 物可经反向测序W寻求对具有所需性质(例如结合性质)的文库成员的鉴定。
[0090] 还应理解,如果片段A、B、C等是基因尺寸(例如5(K)bp~2.5Kbp,包括启动子和核糖 体结合位点(RBS)),那么该文库产物可导致代谢通路。由此,所述变体文库可导致代谢通路 变体文库。在一些实施方式中,对于具有包含启动子或核糖体结合位点的M个核酸和编码蛋 白质的基因的代谢通路,可优化M个酶,从而来自各酶反应的催化输出产物与下一酶的输入 匹配,并且最优化代谢物的整体输出流。假设启动子保持恒定并且2个RBS水平足W用于产 生足够的变体W调节代谢通路,运代表2*2M个通路。如果M=IO,那么所需通路的数量是巧 2iD = 2,048个通路。如果各由平均长度为约10肺P的序列编码,则通路的总数可由约20Mbp的 DNA合成(其代表数百万美元)来表示。通过采用本文所述的方法,变体文库(例如通过多重 通路合成法(化-MPS)的变体文库)有可能在单一反应中构建,其中各片段(A、B、C等)可代表 启动子+RBS+酶编码基因,并且其中各片段集合(A、B、C等)具有针对启动子或RBS的强度的 若干(例如2-4)个变异。可通过通路变体文库的鸟枪(shotgun)转化进入表达宿主细胞来筛 选所述文库。质谱可用于所需代谢物生成的读出。或者,基于细胞的传感器(例如基于转录 因子的那些)可用于检测所需代谢物生成(参考文献:化OU,化ward H.和化y D.Keasling." 改进增加的代谢物产生的编程适应性控制(Programming adaptive conhol to evolve increased metabolite production)."化 1:ure Communications 4(2013))。例如,可产生 允许细胞通过流式细胞术分选的视觉信号(例如通过启动绿色巧光蛋白)。在一些实施方式 中,可产生允许所述代谢物生产型细胞在药物标志物或缺陷型培养基下存活的因子,因此 选择最佳代谢生产通路。
[0091 ]插入和/或缺失变体文库
[0092]插入和/或缺失可W是生成可具有所需性质的独特序列的变体文库的有力工具。 然而,本领域技术人员应理解,易错聚合酶链式反应(PCR),或采用简并碱基的核酸合成,可 能不足W产生预定序列(本文中也称为离散特定序列)的插入或缺失。同样地,取代可W是 产生独特序列的变体文库的有力工具。根据本发明,取代可单独利用,或与插入和/或缺失 联用。在一些实施方式中,取代可通过如下组合来实现:在核酸序列的编码区的相同位置中 发生的至少(1)1、2、3或更多个核巧酸的缺失,和(2)相同数量的核巧酸的插入。在一些实施 方式中,取代可W是3个连续核巧酸取代的倍数,或可涵盖任何数量的核巧酸,包括但不限 于,一个核巧酸,或两个核巧酸,或多于两个核巧酸。
[0093] 易错PCR是用于将变异引入DNA序列的群的成熟方法,其中易错聚合酶在扩增DNA 时产生错误。然而,该方法会导致位于随机位置上的变体,并且不允许设计排除不需要的变 体的具体序列。类似地,当显示具体位置上的简并碱基导致在该位置添加任何可能的核巧 酸来确定变体时,进行采用简并碱基的DNA的合成。在合成过程中,核巧酸可随机选自可能 的核巧酸的集合。因为相对于先前随机选择的核巧酸的下一个简并碱基不受控制,该方法 不允许排除或纳入具体的序列段,例如不需要的密码子或相关序列的较长片段。由此,运些 方法均不允许预定位置上具体碱基的插入或缺失。
[0094] 在本发明的一些方面中,精确预定序列的核酸合成和组装可W是独特适合的,W 产生包含插入和/或缺失的遗传物质文库。在一些实施方式中,所述方法允许产生几乎不包 含或不包含具有预定序列的祀核酸的外源序列变体的文库。在一些实施方式中,提供合成 在个体碱基水平、密码子水平或较长核巧酸序列水平具有核酸序列插入和/或核酸序列缺 失的核酸的方法。在一些实施方式中,所述方法可采用核酸合成法,例如DNA合成法,W允许 在个体碱基、密码子水平或W较大核酸序列部分包括DNA区段插入和/或缺失的用户定制序 列。参照图5,合成在密码子水平(例如56〇10顯:17,569 10^:18,56〇10^:19),核巧 酸水平(例如沈Q ID N0:20,沈Q ID N0:21,沈Q ID N0:22)和多重核巧酸水平(例如沈Q ID NO:23,SEQ ID NO:24,SEQ ID NO:25)具有缺失和/或插入的离散序列。解析各特定序列,从 而寡核巧酸可被分开合成并组装成具有由用户定制的精确序列的完整变体构建体(参见图 5,SEQ ID N0:26和SEQ ID N0:27)。仍参照图5,合成并组装在密码子、核巧酸和多重核巧酸 水平具有缺失和/或插入的离散序列。合成在密码子水平具有缺失和/或插入的离散序列: 寡聚物1,具有核巧酸CTG的缺失和3核巧酸CCG的插入(下划线标示)的寡聚物la,具有CTG、 CCG(下划线标示)和CCG(下划线标示)的插入的寡聚物化。合成在核巧酸水平具有缺失和/ 或插入的离散序列:寡聚物2,具有单一核巧酸缺失的寡聚物2a,具有单一核巧酸A插入(下 划线标示)的寡聚物化。合成在多重核巧酸水平具有缺失和/或插入的离散序列:寡聚物3, 具有12个核巧酸缺失(下划线标示)的寡聚物3a,具有12个核巧酸插入(下划线标示)的寡聚 物3b。可将寡核巧酸组装成具有由用户指定的精确序列的完全变体构建体:变体1:寡聚物1 +寡聚物2+具有12个核巧酸缺失的寡聚物3a,和变体2:具有3核巧酸缺失和3核巧酸插入的 寡聚物Ia+具有单一核巧酸缺失的寡聚物2a+具有12个核巧酸缺失的寡聚物3曰。在一些其它 实施方式中,在多重核巧酸水平具有缺失和/或插入的离散序列可包含不是3核巧酸的倍数 的缺失和/或插入,例如,13个核巧酸缺失和/或插入。
[0095] 核酸合成(例如脱氧多核巧酸合成)化学是成熟方法。近期,可被合成的序列的长 度已经变长,而合成的成本已下降。此外,新组装方法允许多重连续的合成产物的构建形成 用于合成生物学的相关模块,例如基因、小遗传网络、甚至基因组。在已经拥有了产生该遗 传物质的能力的情况下,在一些实施方式中,核酸合成能够杠杆式地产生许多个体序列的 独特变体。所述序列可用于产生,例如,药物和化学生产者或可用于学术研究。
[0096] 核酸(例如DNA)个体序列的高度多样化的文库可通过相关筛选和/或选择来发掘, W寻找具有用于所需应用的希望的性质的文库个体成员。因此,可采用相对较小的文库来 筛选或选择感兴趣的功能或结构。在一些实施方式中,变体文库在预定数量的位置具有大 量的可能有用的氨基酸取代,或在更多位置具有可能有用的氨基酸取代,或其组合。
[0097] 在一些实施方式中,为了产生包含插入和/或缺失的不同但可控的序列含量,各离 散、独特的序列可分开合成并组装。在一些实施方式中,可采用特别设计的构建寡核巧酸的 各种组合。本文所用的术语"构建寡核巧酸"指的是可用于组装比构建寡核巧酸本身要长的 核酸分子的单链或双链寡核巧酸。构建寡核巧酸可用于通过本文所述的方法组装核酸分 子。术语"多核巧酸构建体"指的是具有比构建寡核巧酸长的预定序列的核酸分子。多核巧 酸构建体可从构建寡核巧酸的集和/或亚组装物的集组装。
[0098] 在一些实施方式中,具有指示变体的参照序列可首先被断裂或解析成处于可被合 成的长度范围内的较小的寡核巧酸。一些寡核巧酸可W是当与原先的"野生型"序列相比包 括插入或缺失的碱基的变体寡核巧酸。具有缺失、插入、变异、其组合或无变化的全部可能 的寡核巧酸可被合成,组成整体所需序列的部分。在一些实施方式中,待组装的变体寡核巧 酸的纳入需要W运样的方式解析运些序列:避免寡核巧酸待组装的接合处附近的变异。然 后可合成组成整体较大序列的所有部分的个体寡核巧酸。运些变体序列可W组合地组装, 产生包含插入和/或缺失的构建体序列的所有可能的变体。
[0099] 根据一些实施方式,所述方法可允许采用单独合成的寡核巧酸中的各指定变体从 寡核巧酸区段构建每个特定序列。组装后,各核酸序列(例如完整构建体或亚组装构建体) 可仅包含明确指示的变体,由此,通过组合将会产生较少的外来的构建体变体至不产生外 来的构建体变体。
[0100] 因此,本发明的方面特别有用于产生包含大量指定序列变体的文库。本发明的一 些方面设及具有包含大量的指定序列变体和较少或没有指定序列的外来变体的文库。本发 明的文库可用于选择性地筛选或分析大量的不同预定核酸和/或由所述核酸编码的不同的 肤。
[0101] 在一些实施方式中,本发明的方法允许核酸文库,例如DNA文库,编码具有缺失和/ 或插入的变体序列。在一些实施方式中,插入可W是3核巧酸的倍数。在一些实施方式中,缺 失可W是3核巧酸的倍数。在一些实施方式中,插入可包含5组或更少组3核巧酸。在一些实 施方式中,插入可包含6或更少、7或更少、8或更少、9或更少、10或更少、11或更少、12或更 少,或更多组3核巧酸。在一些实施方式中,缺失可包含5组或更少组3核巧酸。在一些实施方 式中,缺失可包含6或更少、7或更少、8或更少、9或更少、10或更少、11或更少、12或更少,或 更多组3核巧酸。而在一些实施方式中,插入或缺失不是3核巧酸的倍数。所述文库可允许新 蛋白质修饰。在一些实施方式中,本发明的方法允许核酸文库编码具有较大缺失和/或较大 插入的变体序列。所述文库可允许,例如,编码一种或多种蛋白质结构域或蛋白质结构域的 部分的核酸序列的入环(loop-in)或出环(loop-out)。
[0102] 本发明的方面设及合并和组装构建寡核巧酸变体的一个或多个(例如,1、2、3、4、 5、6、7、8、9、10或更多)集合和构建寡核巧酸变体或非变体序列的一个或多个集合,各集合 对应于祀文库的不同区域。各集合包含针对祀核酸区域选择的核酸序列。因此,本发明的方 面特别有用于产生包含大量的预定序列变体的文库。
[0103] 根据本发明的一些方面,生成核酸文库的方法包括如下步骤:鉴定祀核酸、在祀核 酸中鉴定第一区域,其中第一区域包含变体核酸序列;和在祀核酸中鉴定第二区域,其中第 二区域包含非变体序列。在一些实施方式中,祀核酸可包含一个或多个恒定区、一个或多个 可变区及其组合。本文中所用的术语"恒定"、"非变体"和"不可变"序列可互换使用。
[0104] 然后,可在包含变体核酸序列的至少第一组寡核巧酸和包含非变体核酸序列的至 少第二组寡核巧酸中解析祀核酸。可提供,例如,合成并组装至少第一和第二组寡核巧酸。 在一些实施方式中,该文库可W采用基于聚合酶的组装反应、基于连接酶的组装反应,或其 组合来组装。
[0105] 在一些实施方式中,祀核酸可编码具有一个或多个结构域的多肤。在一些实施方 式中,变体核酸序列可包含编码一个或多个结构域的至少部分的核酸序列的缺失、编码一 个或多个结构域的至少部分的核酸序列的插入,或其组合。在一些实施方式中,所述缺失 和/或插入可W是3核巧酸的倍数。在一些实施方式中,所述缺失和/或插入可包含五组或更 少组3核巧酸。在一些实施方式中,所述缺失和/或插入可包含6或更少、7或更少、8或更少、 10或更少、11或更少、11或更少、12或更少,或更多组3核巧酸。
[0106] 在一些实施方式中,所述插入和/或缺失可在核酸的非编码区中,例如在基因的非 编码调控元件中。例如,所述插入和/或缺失可W是非编码序列。在一些实施方式中,所述缺 失和 / 或插入可 W是单一核巧酸,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20 或更多核巧酸。在一些实施方式中,所述缺失和/或插入可W是多于20、多于25、多于30、多 于35、多于40、多于45、多于50、多于55、多于60个核巧酸。
[0107] 在一些实施方式中,用于生成核酸文库的方法包括:选择祀核酸序列,选择待在一 个或多个选定位置缺失或插入的至少一个核酸序列,设计在该选定位置具有变体序列的第 一集的寡核巧酸和具有非变体序列的至少第二集的寡核巧酸,和组装第一和至少第二集的 寡核巧酸。在一些实施方式中,在选择步骤中,待缺失或插入的核酸序列可W是3核巧酸的 倍数。在一些实施方式中,在选择步骤中,待缺失或插入的核酸序列可包含五组或更少组3 核巧酸。在一些实施方式中,在选择步骤中,待缺失或插入的核酸序列可包含6或更少、7或 更少、8或更少、9或更少、10或更少、11或更少、12或更少,或更多组3核巧酸。在一些实施方 式中,第一和第二集一起可包含所述祀核酸序列。在一些实施方式中,第一和第二集一起可 包含祀核酸序列的片段。在一些实施方式中,所述选定位置可包含核巧酸、密码子、核巧酸 序列或其组合。
[0…引单链突出端
[0109] 在某些实施方式中,相邻核酸片段之间的重叠互补区域设计(或选择)成有足够的 差异来促进(例如,热力学上有利)核酸片段的唯一排列(例如,选定或设计的片段排列)。例 如,可设计或选择相邻核酸片段之间的重叠互补区域W实现核酸片段的独特比对(例如,选 定或设计的片段比对)的足够热动力有利的组装。惊人地,在合适的连接条件下,少至一个 核巧酸的差异在完美匹配(100%互补粘性末端)和错配(低于100%的互补粘性末端)之间 产生足够的区分力。如此,4-碱基突出端能允许高至(4~4+1) = 257个不同片段的高特异性 和高保真连接。
[0110] 应理解,可W使用不同长度的重叠区域。在一些实施方式中,当组装较大数量的核 酸片段时,可W使用较长的粘性末端。较长的粘性末端可W提供更多的灵活性来设计或选 择充分区别的序列来区分正确粘性末端退火(例如,设及设计互相退火结合的粘性末端)和 错误粘性末端退火(例如,在非互补粘性末端之间)。
[0111] 为了实现运样的高保真组装,可W使用一种或多种合适的连接酶。连接酶可W获 自重组或天然来源。在一些实施方式中,可W使用T3DNA连接酶、T4DNA连接酶、T7DNA连接酶 和/或大肠杆菌DNA连接酶。运些连接酶可W在相对低的溫度下(例如,室溫)使用并且特别 用于相对短的突出端(例如,约3、约4、约5或约6个碱基的突出端)。在某些连接反应(例如, 室溫下30分钟的解育)中,对于多重方式的连接,T7DNA连接酶可W比其它连接酶更高效。也 可W使用热稳定的连接酶,如Tth DNA连接酶、P化DNA连接酶、Taq连接酶、任意其它合适的 热稳定的连接酶或其任意组合中的一种或多种。
[0112] 在一些实施方式中,可W在不同核酸片段间设计或选择两对或更多对互补粘性末 端使其具有相同或相似的序列来促进含有相对随机排列(和/或数量)的具有相似或相同粘 性末端的片段的产物的组装。运可W用于产生具有某些内部序列区域的不同序列排列和/ 或不同拷贝数量的核酸产物的库。
[0113] 应注意为了确保连接特异性,突出端可W被选择或设计为对每个连接位点唯一, 即被设计为在组装产物中相邻的两个片段的每对互补突出端应该是唯一的并且与任何其 它对互补突出端的差异至少1个核巧酸。
[0114] 也可W使用其它用于产生粘性末端的方法。例如,可W使用基于聚合酶的方法(例 如,T4DNA聚合酶)来合成需要的粘性末端。无论用何种方法产生特异性突出端(例如,用于 设计在组装核酸产物中相邻的核酸的互补突出端),可W设计和/或产生不同长度的突出 端。在一些实施方式中,可W使用长单链突出端(3'或5')来促进特异性和/或高效组装。例 如,3'或5'单链突出端可W长于8个碱基长,例如长S-HaA-SOJO-SSJS-SCKSO-lOOaOO- SOO 个或更多碱基。
[0115] 在一些实施方式中,突出端的长度可W是1~4个碱基、5-12个碱基、1-12个碱基、 5-13个碱基、6-12个碱基。在一些实施方式中,突出端的长度可W是至多12、至多13、至多 14、至多15、至多16、至多17、至多18、至多19、至多20个碱基。
[0116] 在一些实施方式中,突出端可W由IIS型限制酶产生。例如,突出端长度可W是1~ 4个碱基,或更长。有特异性结合和/或切割位点的多种限制性内切核酸酶市售可得,例如来 自肥B公司巧萨诸塞州贝弗利)。在各种实施方式中,可采用产生3'突出端、5'突出端的限 制性核酸内切酶。在一些实施方式中,特异性限制性内切核酸酶形成的粘性末端可W用于 促进W所需排列组装子组件。所述术语"IIs型限制性内切核酸酶"指有非回文识别序列和 在所述识别位点外(如识别位点远端0-约20核巧酸)出现的剪切位点的限制性内切核酸酶。 IIs型限制性内切核酸酶可W在双链核酸分子上生成切口,或者生成产生纯末端或粘性末 端的双链断裂(如5'或3 '突出端)。IIS型限制性内切核酸酶的示例包括例如生成3 '突出端 的酶,例如但不限于Bsr I、Bsm I、BstF5I、BsrD I、Bts I、Mnl I、BciV I、H地 I、Mbo II、 Eci I、Acu I、Bpm I、Mme KBsaX I、Bc邑 I、Bae I、Bfi KTspDT KTspGW I、Taq II、 Eco57I、Eco57M I、Gsu I、Ppi I、和Psr I;生成5'突出端的酶,如BsmA I、Ple I、Fau I、Sap I、BspM I、SfaN I、Hga I、Bvb I、Fok I、BceA I、BsmF I、Ksp632I、Eco31I、Esp3I、Aar I;和 生成纯末端的酶,如Mly I和化r KIIs型限制性内切核酸酶市售可得并且为本领域所熟知 (马萨诸塞州贝弗利的肥B公司)。
[0117]在一些实施方式中,可设计突出端,从而它们具有最小的自互补。例如,可将突出 端设计成5~12个碱基长,并且具有最小的形成发卡的趋势。而在其它实施方式中,突出端 可经设计W具有自互补。例如,突出端可经设计W具有3~12个碱基的长度,具有形成发夹 的趋势。
[011引高保真组装
[0119] 按照本发明的方面,可W在单个过程中组装多个核酸片段,其中在促进片段的共 价组装的条件下将多个片段混合在一起来产生特异性的较长核酸。按照本发明的方面,可 W使用连接酶在体外共价组装多个核酸片段。在一些实施方式中,可W组装5个或更多(例 如,10 个或更多、15 个或更多、15-20、20-25、25-30、30-35、35-40、40-45、45-50、50个或更多 等)不同的核酸片段。然而,应理解,可W使用合适的组装技术组装任意数量的核酸(例如, 2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个等)。组装的每个核酸片段可^ 是约100个核巧酸-约1000个核巧酸长(例如,约200、约300、约400、约500、约600、约700、约 800、约900)。然而,可W使用组装技术(例如,鸟枪组装进入质粒载体)组装更长(例如,约 2500个或更多核巧酸长、约5000个或更多核巧酸长、约7500个或更多核巧酸长、约10000个 或更多核巧酸长等)或更短的核酸片段。应理解,每个核酸片段的大小独立于加入组装的其 它核酸片段的大小。然而,在一些实施方式中,每个核酸片段可W是大约相同的大小或长度 (例如,约100个核巧酸长-约400个核巧酸长)。例如,寡核巧酸的长度可W是中值长度在约 100个核巧酸长和约400个核巧酸长之间,并且变化范围为约+/-1个核巧酸、+/-4个核巧酸、 +/-10个核巧酸。应理解,双链核酸片段的长度可W由碱基对的数量来表示。如本文所用,当 称为V'个核巧酸长的核酸片段用于双链核酸片段的内容中时对应于V'个碱基对的长度。 在一些实施方式中,在一个反应中组装的一个或多个核酸(例如,1-5、5-10、10-15、15-20个 等)可W是密码子优化的和/或非天然存在的。在一些实施方式中,在一个反应中组装的所 有核酸都是密码子优化的和/或非天然存在的。
[0120] 在本发明的一些方面中,组装的核酸片段被设计为具有重叠互补序列。在一些实 施方式中,核酸片段是具有3'和/或5'单链突出端的双链核酸片段。运些突出端可W是能与 不同核酸片段上的互补粘性末端退火结合的粘性末端。按照本发明的方面,在两个核酸片 段上的互补序列(和特定互补粘性末端)的存在促进了它们的共价组装。在一些实施方式 中,组装了具有不同重叠互补单链粘性末端的多个核酸片段并且通过在每个片段上的粘性 末端的特性确定它们在组装的核酸产物中的顺序。例如,可W设计核酸片段使得第一核酸 具有与第二核酸的第一个粘性末端互补的第一粘性末端W及与第=核酸的第一个粘性末 端互补的第二粘性末端。第二核酸的第二个粘性末端可W与第四核酸的第一个粘性末端互 补。第=核酸的第二个粘性末端可W与第五核酸的第一个粘性末端互补。W此类推至最后 的核酸。按照本发明的一些方面,可W使用该技术来产生含有W预定线性顺序(例如,第一、 第二、第=、第四……最后)组装的核酸片段的线性排列。
[0121] 在某些实施方式中,相邻核酸片段之间的重叠互补区域设计(或选择)成有足够的 差异来促进(例如,热力学上有利)核酸片段的唯一排列(例如,选定或设计的片段排列)的 组装。惊人地,在合适的连接条件下,少至一个核巧酸的差异在完美匹配(100%互补粘性末 端)和错配(低于100%的互补粘性末端)之间产生足够的区分力。如此,4-碱基突出端理论 上能允许高至(4~4+1)=257个不同片段的高特异性和高保真连接。
[0122] 应理解,可W使用不同长度的重叠区域。在一些实施方式中,当组装较大数量的核 酸片段时,可W使用较长的粘性末端。较长的粘性末端可W提供更多的灵活性来设计或选 择充分区别的序列来区分正确粘性末端退火(例如,设及设计互相退火结合的粘性末端)和 错误粘性末端退火(例如,在非互补粘性末端之间)。
[0123] 为了实现运样的高保真组装,可W使用一种或多种合适的连接酶。连接酶可W获 自重组或天然来源。在一些实施方式中,可W使用T3DNA连接酶、T4DNA连接酶、T7DNA连接酶 和/或大肠杆菌DNA连接酶。运些连接酶可W在相对低的溫度下(例如,室溫)使用并且特别 用于相对短的突出端(例如,约3、约4、约5或约6个碱基的突出端)。在某些连接反应(例如, 室溫下30分钟的解育)中,对于多重方式的连接,T7DNA连接酶可W比其它连接酶更高效。也 可W使用热稳定的连接酶,如Tth DNA连接酶、P化DNA连接酶、Taq连接酶、任意其它合适的 热稳定的连接酶或其任意组合中的一种或多种。
[0124] 在一些实施方式中,可W在不同核酸片段间设计或选择两对或更多对互补粘性末 端使其具有相同或相似的序列来促进含有相对随机排列(和/或数量)的具有相似或相同粘 性末端的片段的产物的组装。运可W用于产生具有某些内部序列区域的不同序列排列和/ 或不同拷贝数量的核酸产物的库。
[0125] 在一些实施方式中,混合核酸片段并且用连接酶解育。应理解,在促进粘性末端的 特异性退火的条件下的解育可W增加组装(例如,正确组装)频率。在一些实施方式中,设计 具有相似解链溫度(例如,互相差5°C W内)的不同粘性末端,使得在相同的条件下促进所有 片段的正确退火。不同溫度可W促进正确退火,所述溫度取决于所用粘性末端长度。在一些 实施方式中,可W使用约4-约30个核巧酸长度的粘性末端(例如,约5、约10、约15、约20、约 25或约30个核巧酸长度)。解育溫度可W为约20°C-约50°C (包含,例如室溫)。然而,可W使 用更高或更低的溫度。解育的长度可W基于混合在一起的不同核酸的数量(和因此不同突 出端的数量)、突出端的长度、突出端的复杂度来优化。解育时间也可W取决于退火溫度和 混合物中是否存在其它试剂。例如,可W加入核酸结合蛋白和/或重组酶(例如,RecA,例如 热稳定的RecA蛋白)。
[0126] 所得的核酸复合物可W在一对祀序列特异性引物的存在下经过聚合酶链反应,来 扩增并且选择正确的连接产物(例如,祀核酸)。或者,所得的核酸复合物可W被连接入合适 的载体中并转化到宿主细胞中用于进一步菌落筛选。
[0127] 支持物
[0128] 本文使用的术语"支持物"和"基底"可互换使用,并且是指多孔或非孔的溶剂不溶 性材料,在其上合成或固定聚合物例如核酸。本文使用的"多孔"是指所述材料包含有基本 一致直径(例如纳米范围内)的孔。多孔材料可W包含但不限于,纸张、合成过滤器等。在运 种多孔材料中,所述反应可W在孔中进行。所述支持物能有很多形状中的任意一种,例如 销、条、板、盘、杆、弯曲、圆柱形结构、颗粒(包含珠、纳米颗粒)等。所述支持物可有可变宽 度。
[0129] 支持物可W是亲水性的或能够呈现出亲水性的。所述支持物可W包含无机粉末如 二氧化娃、硫酸儀、和氧化侣;天然聚合材料,特别是纤维素材料和纤维素衍生材料,例如包 含纤维的纸,如滤纸、色谱纸等;合成或改性天然产生的聚合物,如硝酸纤维素、乙酸纤维 素、聚(氯乙締)、聚丙締酷胺、交联葡聚糖、琼脂糖、聚丙締酸醋、聚乙締、聚丙締、聚(4-甲基 下締)、聚苯乙締、聚甲基丙締酸醋、聚(对苯二甲酸乙二醋)、尼龙、聚(下酸乙締醋)、聚偏二 氣乙締(PVDF)膜、玻璃、可控孔度玻璃、磁性可控孔度玻璃、陶瓷、金属等;运些材料或单独 使用或与其它材料联用。
[0130]在一些实施方式中,在阵列形式上合成寡核巧酸。例如,在常见支持物上原位合成 单链寡核巧酸,其中在基底上的单独或离散的特征(或点)上合成各寡核巧酸。在优选实施 方式中,单链寡核巧酸结合到所述支持物或特征的表面上。本文所用的术语"阵列"是指为 进一步反应存储、定向(routing)、扩增和释放寡核巧酸或互补寡核巧酸的离散特征的排 列。在优选实施方式中,所述支持物或阵列是可寻址的:所述支持物包含在所述支持物上特 定预定位置(即"地址")上的两个或更多离散的可寻址特征。因此,阵列上的各寡核巧酸分 子位于所述支持物上已知和确定的位置。各寡核巧酸序列能从其在所述支持物上的位置来 确定。另外,可寻址的支持物或阵列能够直接控制单独分离的体积如液滴。可W选择限定特 征的大小来使得在所述特征上形成微体积的液滴,每个液滴保持互相分离。如本文所述,多 个特征通常(但不必需)由特征间的间隔分离从而确保两个相邻部位之间的液滴不会融合。 特征间通常在其表面上不携带任何寡核巧酸,并且对应惰性空间。在一些实施方式中,特征 间和特征通常在其亲水性或疏水性性质上不同。在一些实施方式中,特征间和特征可W包 含本文所述的改性剂。
[0131]阵列可W被构建、定制或购自供应商(例如,CombiMatrix、Agilent (安捷伦)、 Affymetrix(艾菲美特)、Nimblegen)。寡核巧酸被连接、点样、固定、表面结合、支持或合成 在表面或阵列的离散特征上。寡核巧酸可W共价连接到表面或在表面上沉积。各种构建方 法为本领域熟知,如无掩膜阵列合成器、利用掩膜的光导向法、流动通道方法、点样法等。
[0132] 在另一个实施方式中,多个寡核巧酸可W合成或固定(连接)在多个支持物,如珠 上。一个示例是描述于例如美国专利号5,770,358、5,639,603和5,541,061的基于珠的合成 方法。为了在珠上合成分子例如寡核巧酸,大量的珠悬浮于容器中的合适运载体(如水)中。 所述珠具有任选的间隔子分子,所述分子有供复合的活性位点,任选地是保护基团。在合成 的各步骤中,所述珠分到多个容器中来偶联。新生寡核巧酸链脱保护后,不同单体溶液加入 到各容器中,从而在给定容器内的所有珠上,发生相同的核巧酸加成反应。然后,所述珠用 过量试剂洗涂,并入单个容器中,混合并重新分到另一组多个容器W准备下一轮合成。应注 意到由于在开始利用了大量珠,相似地在容器内随机分布了大量珠,在多轮随机加入碱基 后,各自在其表面具有合成的独特寡核巧酸序列。个体珠可标记有对其上的双链寡核巧酸 而言独特的序列,W允许应用过程中的鉴定。
[0133] 在另一个实施方式中,可W在纳米颗粒上连接或合成多个寡核巧酸。纳米颗粒包 括但不限于金属(例如,金、银、铜和销)、半导体(例如,CdSe、CdS和用化S涂覆的CdS)和磁性 (例如,铁磁体)胶体材料。将寡核巧酸连接到纳米颗粒的方法在本领域中已知。在另一个实 施方式中,纳米颗粒连接到基底上。含有或不含固定的寡核巧酸的纳米颗粒可W连接到基 底上,如Grabar等,Anal}ft.化em. ,67,73-743(1995) ;Bethell等,J.Electroanal.化em., 409,137( 1996) ;Bar等,Langmuir ,12,1172( 1996);Colvin等,J.Am.Chem. Soc. ,114,5221 (1992)中所述。裸纳米颗粒可W首先连接到基底上并且寡核巧酸可W连接到固定的纳米颗 粒上。
[0134] 预合成的寡核巧酸和/或多核巧酸序列可连接至支持物或用下述方法原位合成: 本领域已知的光定向法、流体通道和定点法、喷墨法、销型方法(pin-basedmethod)和珠基 方法。在一些实施方式中,预合成的寡核巧酸连接到支持物上或使用点样方法合成,其中单 体溶液通过从区域到区域移动的分配器(如喷墨)逐滴置入。在一些实施方式中,使用例如 机械波驱动的分配器将寡核巧酸点样在支持物上。
[0135] 麵
[0136] 本发明各方面可W用于设及合成核酸的生成和/或使用的多种应用。如本文所述, 本发明提供了具有提高的效率的组装合成核酸的方法。所得组装核酸可W体外扩增(如使 用PCR、LCR,或任何合适的扩增技术),体内扩增(如通过克隆到合适的载体中),分离和/或 纯化。组装的核酸(单独或克隆到载体中)可W转化入宿主细胞(如原核、真核、昆虫、哺乳动 物或其它宿主细胞)。在一些实施方式中,所述宿主细胞可W用于增殖所述核酸。在某些实 施方式中,所述核酸可W整合到所述宿主细胞的基因组中。在一些实施方式中,所述核酸可 W取代细胞基因组上的对应核酸区域(如通过同源重组)。因此,核酸可W用于生成重组生 物体。在一些实施方式中,祀核酸可W是用于取代全部或部分宿主生物体的基因组的整个 基因组或基因组大片段。重组生物体也可W用于多种研究、工业、农业、和/或医学应用。
[0137] 许多本文所述的技术可W-起使用,在一个或多个点上应用合适的组装技术来产 生长核酸分子。例如,可W使用基于连接酶的组装来组装低于100到超过10000个碱基对长 度(例如,100聚体-500聚体、500聚体-1000聚体、1000聚体-5000聚体、5000聚体-10000聚 体、25000聚体、50000聚体、75000聚体、100000聚体等)的寡核巧酸双链体和核酸片段。在示 例性实施方式中,本文所述方法可W在组装生物体(如病毒、细菌、酵母或其它原核或真核 生物)的整个基因组(或其大片段,如约10%、20%、30%、40%、50%、60%、70%、80%、90% 或更多)中使用,可选将特异性修饰整合到序列中一个或多个所需位置处。
[0138] 可W任意合适的形式(例如,在稳定的缓冲液中,冻干等)包装任意的核酸产物(例 如,包含经扩增、克隆、纯化、分离等的核酸)用于存储和/或运输(例如,用于运输至分配中 屯、或客户)。相似地,可W在合适的缓冲液中制备任意的宿主细胞(例如,用载体转化的或具 有经修饰基因组的细胞)用于储存和/或运输(例如,用于分配至客户)。在一些实施方式中, 可W冷冻细胞。然而,也可W使用其它稳定的细胞制品。
[0139] 宿主细胞可W在培养中生长和扩增。可W使用宿主细胞来表达一个或多个感兴趣 的RNA或多肤(例如,治疗用、工业用、农业用和/或医用蛋白)。表达的多肤可W是天然多肤 或非天然多肤。可W分离或纯化多肤用于后续使用。
[0140] 因此,使用本发明的方法产生的核酸分子可W被纳入到载体中。载体可W是克隆 载体或表达载体。在一些实施方式中,载体可W是病毒载体。病毒载体可W包含能够感染祀 细胞的核酸序列。相似地,在一些实施方式中,可操作地连接至合适启动子系统的原核表达 载体可W用于转化祀细胞。在其它实施方式中,可操作连接至合适启动子系统的真核载体 可W用于转染祀细胞或组织。
[0141] 本文所述的构建体的转录和/或翻译可W在体外(例如,使用不含细胞的系统)或 体内(例如,在细胞中表达)进行。在一些实施方式中,可W制备细胞裂解液。在某些实施方 式中,可W分离或纯化表达的RNA或多肤。本发明的核酸也可W用于向表达的多肤或其片段 添加检测和/或纯化标签。基于多肤的融合/标签的例子包含但不限于六组氨酸化is6)Myc 和HA,和其它有用的多肤,如GFPsGST、MBP、几下质等。在一些实施方式中,多肤可W包含一 个或多个非天然氨基酸残基。
[0142] 在一些实施方式中,可W针对由一个或多个合成核酸编码的多肤或其片段制备抗 体。在某些实施方式中,合成核酸可W提供为文库用于研究和开发中的筛选(例如,鉴定潜 在的治疗性蛋白或多肤,鉴定用于药物开发的潜在蛋白祀标等)。在一些实施方式中,合成 核酸可用作治疗物(例如,用于基因治疗,或用于基因调控)。例如,可W向患者提供足量合 成核酸W表达治疗量的蛋白。在其它实施方式中,可向患者给予足量合成核酸W调控(例 如,下调)基因表达。
[0143] 应理解,本文所述的不同行动或实施方式可W独立实施并且可W在美国或美国W 外的不同地方实施。例如,接受祀核酸的订单、分析祀核酸序列、设计一个或多个起始核酸 (例如,寡核巧酸)、合成起始核酸、纯化起始核酸、组装起始核酸、分离组装的核酸、确认组 装的核酸的序列、处理组装的核酸(例如,扩增、克隆、插入宿主基因组等)中的每个行动和 任意其它行动或运些行动中的任意部分可W在美国或美国W外的一个位置或不同地点单 独实施。在一些实施方式中,组装过程可W包括在一个地点(在美国或美国W外)实施的多 个行动和在一个或多个远程地点(在美国W内或美国W外)实施的多个行动的组合。
[0144] 自动化应用
[0145] 本文提供的方法和设备方面可W包含自动操作本文所述的一个或多个行动 (act)。在一些实施方式中,扩增和/或组装反应中的一个或多个步骤可W使用一个或多个 自动化样品处理装置(如一个或多个自动化液体或流体处理设备)来自动操作。自动化设备 和方法可W用于递送反应试剂,包含下列中的一种或多种:起始核酸、缓冲液、酶(如一种或 多种连接酶和/或聚合酶)、核巧酸、盐、和任何其它试剂如稳定剂。自动化设备和方法也可 W用于控制反应条件。例如,自动化热循环仪可W用于控制可W使用的反应溫度和任何溫 度循环。在一些实施方式中,扫描激光器可W被自动化W提供适于解育多核巧酸的一个或 多个反应溫度或溫度循环。相似地,经组装多核巧酸产物的后续分析可W自动进行。例如, 测序可W使用测序设备和自动化测序方案自动进行。其它步骤(如扩增、克隆等)也可W使 用一种或多种合适设备和相关方案自动进行。应理解,本文所述的一个或多个设备或设备 组件可W组合在某一系统(如机器人系统)或微环境(如微流体反应室)中。组装反应混合物 (如液体反应样品)可W从所述系统的一个组件向另一个组件转移,使用自动化设备和过程 (如样品和/或样品容器的机械化操作和/或转移,包含自动化移液设备、微系统等)。所述系 统和其任何组件可W通过控制系统来控制。
[0146] 由此,本文所提供设备的方法步骤和/或方面可W使用例如计算机系统(如计算机 控制系统)自动进行。能实施本文所提供技术方面的计算机系统可W包含用于任何处理类 型(如本文所述序列分析和/或自动化设备控制)的计算机。然而,应该理解某些处理步骤可 W通过作为所述组装系统一部分的一种或多种自动化设备来提供。在一些实施方式中,计 算机系统可包含两台或更多台计算机。例如,一台计算机可W通过网络连接第二台计算机。 一台计算机可W进行序列分析。第二台计算机可W控制系统中的一个或多个自动化合成和 组装设备。其它方面中,其它计算机可W包含在网络中W控制一个或多个分析或处理运行。 各计算机可W包含内存和处理器。所述计算机可采用任何形式,因为本文提供的技术方面 对在任何特定计算机平台上实施没有限制。相似地,所述网络能采用任何形式,包含专用网 络或公共网络(如互联网)。显示设备能与一个或多个设备和计算机关联。替代或补充地,根 据本文提供的技术,显示设备可W位于远程位点并且连接用于显示分析输出。所述系统不 同组件之间的连接可W通过有线、光纤、无线传送,卫星传送,任何其它合适的传送,或者上 述两种或多个的任意组合。
[0147] 本文所提供技术的各个不同方面、实施方式、或行动能W多种方式中的任一种独 立自动进行和实施。例如,各个方面、实施方式或运行能使用硬件、软件或其组合独立实施。 当W软件实施时,所述软件密码能在任何合适的处理器或处理器集合上执行,无论在单独 计算机中提供或分布在多个计算机上。应该理解完成上述功能的任何组件或组件集合能通 常看作控制上面所讨论功能的一个或多个控制器。所述一个或多个控制器能W多种方式实 施,例如有使用微码或软件程序控制的专用硬件或通用目的硬件(例如,一个或多个处理 器)W完成上述功能。
[0148] 在运方面,应该理解本文所提供技术实施方式的一种实现中包含了编码有计算机 程序(例如,多种指令)的至少一种计算机可读介质(例如,计算机内存、软盘、光盘、磁带 等),当在处理器上运行时,完成本文所提供技术的一种或多种上述功能。所述计算机可读 介质可运输,从而其上存储的程序能加载到任何计算机系统来源W运行本文所提供技术的 一种或多种功能。另外,应该理解执行时,提及完成上面讨论功能的计算机程序不限于在主 机上运行应用程序。相反,所述术语计算机程序在本文W-般意义使用,指任何类型的计算 机编码(如软件或微码),能用于编程处理器W进行上面讨论的本文所提供的技术方面。
[0149] 应该理解与处理存储于计算机可读介质上的数个本文所提供技术的实施方式一 致,所述计算机实施的处理在其执行过程中可W接收手工输入(如来自用户)。
[0150] 因此,本文所述组装设备或组件的整体系统水平控制可W通过系统控制器进行, 所述系统控制器可W提供控制信号给:相关的核酸合成器、液体处理设备、热循环仪、测序 设备、相关的机械化组件,W及其它合适系统来运行所需的输入/输出或其它控制功能。因 此,所述系统控制器与任何设备控制器一起形成控制核酸组装系统运作的控制器。所述控 制器可W包含通用目的数据处理系统和其它相关设备,所述通用目的数据处理系统可W是 通用目的计算机或通用目的计算机的网络,所述其它相关设备包含通信设备、调制解调器、 和/或其它回路或组件,W进行所需的输入/输出或其它功能。所述控制器也能(至少部分) 作为单个特定目的集成电路(例如,ASIC)或ASIC阵来实施,各有用于整体、系统水平控制的 主要或中央处理器部分,和专用的分离部分W在中央处理器部分控制下进行多种不同特定 计算、功能和其它处理。所述控制器也能使用多种分离的专用程序集成或其它电子回路或 设备实施,例如硬连线电子或逻辑回路如分立元件电路或可编程逻辑设备。所述控制器也 能包含任何其它组件或设备,如用户输入/输出设备(监控器、显示器、打印机、键盘、用户点 击设备、触摸屏、或其它用户界面等)、数据存储设备、驱动马达、连接、阀控制器、机械化设 备、真空和其它累、压力传感器、检测器、电源供应、脉冲源、通信设备或其它电子电路或组 件等。所述控制器也可W控制系统其它部分的运作,如自动化客户订单处理、质量控制、包 装、运输、开票等,W进行本领域已知而本文没有详述的其它合适功能。
[0151] 本发明的各方面可W单独使用、联用或W前述实施方式未具体讨论的各种排列来 使用,并且因此其应用并不限制于前面描述或【附图说明】所示组件的细节和排列。例如,一个 实施方式的所述方面可与其它实施方式所述方面W任何方式组合。
[0152] 权利要求中修饰所提要素使用的顺序术语"第一"、"第二"、"第="等本身并不暗 指所提要素其一相对另一个的任何优先、居先或级别高低,或实行方法多个行动的时间顺 序,而是仅仅用作标记把有某一名称的所提要素与有相同名称的另一要素(但是就顺序术 语使用而言)区分开W区别所提的多个要素。
[0153] 而且,本文所用的词语和术语是为了描述目的,而不是限制性的。本文使用"包 含"、"包括"、或"具有"、"含有"、"设及"及其变化意味着涵盖其后列出的项目及其等价物, W及额外的项目。
[0154] 等同形式
[0155] 本发明提供合成核酸文库的新方法。尽管讨论了本发明的【具体实施方式】,但W上 说明书仅为说明性而非限制性的。本领域的技术人员在阅读本说明书后将清楚了解本发明 的许多变化。本发明的全部范围应该通过参考所附权利要求书连同其等同物的全部范围, W及说明书连同此类变化来确定。
[0156] 通过引用纳入
[0157] 参考国际专利申请公开号口机/11512/052036和美国临时申请序列号61/792,245 (2013年3月15日提交),题为"用于多重核酸合成的组合物和方法",其各自通过引用其全文 纳入本文。本文提到的所有发表物、专利和序列数据库条目在此通过引用全文纳入,就好像 各个单独发表物或专利特定和单独地表明通过引用纳入。
【主权项】
1. 一种用于产生核酸文库的方法,所述核酸文库包含多个非随机变体靶核酸,所述方 法包括: (a) 提供第一体积的第一组部分双链核酸,其中所述第一组双链核酸中的各核酸具有 相同的单链突出端,其中所述第一组部分双链核酸中的各核酸具有预定序列,所述预定序 列不同于所述第一组部分双链核酸中的另一核酸的预定序列; (b) 提供第二体积的第二组部分双链核酸,其中所述第二组部分双链核酸中的各核酸 具有与所述第一组部分双链核酸中的突出端互补的相同的单链突出端;和 (c) 通过将第一组部分双链核酸与第二组部分双链核酸混合来组装核酸文库,所述混 合在使互补的突出端杂交的条件下进行,以形成非随机变体靶核酸的文库。2. 如权利要求1所述的方法,其中,在组装步骤中,所述互补的突出端杂交以形成无缺 口的接合,并被连接。3. 如权利要求1所述的方法,其中,在提供步骤中,第一和第二组部分双链核酸具有3 ' 突出端,或者第一和第二组部分双链核酸具有5 '突出端。4. 如权利要求1所述的方法,其中,组装步骤在单一反应体积中进行。5. 如权利要求1所述的方法,其中,提供第一和第二组部分双链核酸的步骤包括: (i)提供第一体积的第一组钝端双链核酸集, 其中,第一钝端双链核酸集里的第一核酸具有从第一钝端双链核酸集里的第二核酸偏 移η个碱基的序列,和 其中,各钝端双链核酸集里的各双链核酸是所述集里另一双链核酸的变体; (i i)提供第二体积的第二组钝端双链核酸集,其中第二钝端双链核酸集里的第一核 酸具有从第二钝端双链核酸集里的第二核酸偏移η个碱基的序列; (i ii)使第一体积的第一组钝端双链核酸集解链,由此形成第一体积的单链核酸,和, 使第二体积的第二组钝端双链核酸集解链,由此形成第一体积的单链核酸;和 (i V)使多个单链寡核苷酸退火,以形成第一体积的具有单链突出端的第一组部分双链 寡核苷酸和第二体积的具有单链突出端的第二组部分双链寡核苷酸。6. 如权利要求5所述的方法,其中,η是2、3、4、5、6、7或8个碱基。7. 如权利要求5所述的方法,其中,第二组钝端双链核酸集里的各双链核酸是所述集里 的另一双链核酸的变体。8. 如权利要求1所述的方法,其中,第二组部分双链核酸中的各核酸具有预定序列,所 述预定序列不同于第二组部分双链核酸中的另一序列。9. 如权利要求1所述的方法,其中,第二组部分双链核酸中的各核酸具有相同的预定序 列。10. 如权利要求1-9中任一项所述的方法,其还包括:第三体积的第三组部分双链核酸, 其中,所述第三组双链核酸中的各核酸具有相同的单链突出端,其中,所述第三组部分双链 核酸中的各核酸具有预定序列,所述预定序列不同于所述第一组部分双链核酸中的另一核 酸的预定序列。11. 如权利要求10所述的方法,其还包括:通过将第一、第二和第三组部分双链核酸混 合来组装变体核酸的文库,所述混合在使互补的突出端杂交的条件下进行,以形成非随机 变体靶核酸的文库。12. 如权利要求1所述的方法,其中,所述文库是基因文库。13. 如权利要求1所述的方法,其中,各双链核酸的大小是约20个碱基对-约200个碱基 对。14. 如权利要求1所述的方法,其中,所述文库是代谢通路文库。15. 如权利要求1所述的方法,其中,各双链核酸的大小是约500个碱基对-约3000个碱 基对。16. 如权利要求1所述的方法,其中,各双链核酸是基因或基因的集。17. 如权利要求1所述的方法,其中,各双链核酸是操纵子,其包含启动子序列、核糖体 结合位点序列,和基因或基因的集,及其任何组合。18. 如权利要求1所述的方法,其中,所述文库是包含不同长度的启动子的操纵子的文 库。19. 如权利要求1所述的方法,其中,所述文库是包含不同长度的核糖体结合位点的操 纵子的文库。20. -种产生核酸文库的方法,所述方法包括: (a) 鉴定靶核酸; (b) 在所述靶核酸中鉴定第一区域,其中所述第一区域包含变体核酸序列; (c) 在所述靶核酸中鉴定第二区域,其中所述第二区域包含非变体序列; (d) 在包含所述变体核酸序列的至少第一组寡核苷酸和包含所述非变体核酸序列的至 少第二组寡核苷酸中解析所述靶核酸; (e) 提供所述至少第一组寡核苷酸和至少第二组寡核苷酸;和 (f) 组装所述至少第一组寡核苷酸和至少第二组寡核苷酸。21. 如权利要求20所述的方法,其中,所述靶核酸编码具有一个或多个结构域的多肽。22. 如权利要求20所述的方法,其中,在提供步骤中,第一组寡核苷酸包含编码所述一 个或多个结构域的至少部分的核酸序列的缺失。23. 如权利要求20所述的方法,其中,在提供步骤中,第一组寡核苷酸包含编码所述一 个或多个结构域的至少部分的核酸序列的插入。24. 如权利要求20所述的方法,其中,在提供变体核酸序列的步骤中,第一组寡核苷酸 包含编码所述一个或多个结构域的至少部分的核酸序列的插入、编码所述一个或多个结构 域的至少部分的核酸序列的缺失,或其组合。25. 如权利要求20所述的方法,其中,所述靶核酸包含一个或多个恒定区。26. 如权利要求20所述的方法,其中,所述靶核酸包含一个或多个可变区。27. 如权利要求20所述的方法,其中,所述文库采用基于聚合酶、基于连接酶或其组合 的方式组装。28. 如权利要求22-24中任一项所述的方法,其中,所述缺失或所述插入是3核苷酸的倍 数。29. 如权利要求22-24中任一项所述的方法,其中,所述缺失或所述插入包含5组或更少 组的3核苷酸。30. 如权利要求22-24中任一项所述的方法,其中,所述缺失或所述插入包含至多12组 的3核苷酸。31. 如权利要求20所述的方法,其中,所述靶核酸是基因或基因的集。32. 如权利要求31所述的方法,其中,所述核酸文库在所述基因或基因的集的非编码序 列中包含缺失、插入或其组合。33. -种产生核酸文库的方法,所述方法包括: (a) 选择靶核酸序列; (b) 选择至少在一个或多个选定位置待缺失或插入的核酸序列; (c) 设计在所述选定位置具有变体序列的第一寡核苷酸集,和具有非变体序列的至少 第二寡核苷酸集;和 (d) 组装所述第一寡核苷酸集和所述至少第二寡核苷酸集。34. 如权利要求33所述的方法,其中,第一和第二集一起包含所述靶核酸序列。35. 如权利要求33所述的方法,其中,第一和第二集一起包含所述靶核酸序列的片段。36. 如权利要求33-35中任一项所述的方法,其中,所述选定位置包含核苷酸、密码子、 核苷酸序列或其组合。37. 如权利要求33所述的方法,其中,在选择步骤中,待缺失或插入的核酸序列是3核苷 酸的倍数。38. 如权利要求33所述的方法,其中,在选择步骤中,待缺失或插入的核酸序列包含5组 或更少组的3核苷酸。39. 如权利要求33所述的方法,其中,所述缺失或所述插入包含至多12组的3核苷酸。40. 如权利要求33所述的方法,其中,所述靶核酸是基因或基因的集。41. 如权利要求40所述的方法,其中,所述核酸文库在所述基因或基因的集的非编码序 列中包含缺失、插入或其组合。
【文档编号】C40B50/00GK105934541SQ201480074047
【公开日】2016年9月7日
【申请日】2014年11月25日
【发明人】J·雅各布森, D·辛德勒, I·萨奥尔默, N·J·圭多
【申请人】Gen9股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1