用于核酸的高保真组装的组合物和方法与流程

文档序号:11808909阅读:248来源:国知局
用于核酸的高保真组装的组合物和方法与流程
用于核酸的高保真组装的组合物和方法相关申请本申请要求2012年8月23日提交的美国临时专利申请系列号13/592,827、2011年8月26日提交的美国临时专利申请系列号61/527,922和2011年9月9日提交的美国临时专利申请系列号61/532,825的优先权和权益,上述各申请通过引用全文纳入本文。发明领域本发明的方法和组合物涉及核酸组装,并且具体地涉及高保真、多重核酸组装反应。背景重组和合成核酸在研究、工业、农业和医学中有许多应用。可以使用重组和合成核酸来表达和获得大量的多肽,包含酶、抗体、生长因子、受体和其它可用于多种医学、工业或农业目的的多肽。也可以使用重组和合成核酸来产生遗传修饰的生物体,包含修饰的细菌、酵母、哺乳动物、植物和其它生物体。遗传修饰的生物体可以用于研究(例如,疾病的动物模型、理解生物过程的工具等)、工业(例如,作为蛋白表达的宿主生物体、用于产生工业产物的生物反应器、环境补救的工具、分离或修饰具有工业应用的天然化合物等)、农业(例如,具有增加的产率或增加的对疾病或环境压力的抗性的经修饰作物)和用于其它应用。重组和合成核酸也可以用作治疗组合物(例如,用于修饰基因表达、用于基因治疗等)或用作诊断工具(例如,病症的探针等)。已经开发了多种技术用于修饰存在的核酸(例如,天然存在的核酸)来产生重组核酸。例如,可以使用核酸扩增、诱变、核酸酶消化、连接、克隆和其它技术的多种组合来产生许多不同的重组核酸。经常使用化学合成的多核苷酸作为用于核酸扩增、诱变和克隆的引物或衔接子。也发展了用于从头核酸组装的技术,其中制备(例如,化学合成)和组装核酸来产生较长的感兴趣的靶核酸。例如,已经开发了不同的多重组装技术用于将寡核苷酸组装成能用于研究、工业、农业和/或医学的较大的合成核酸。然而,现有可用的组装技术的一个限制是相对高的错误率。因此,需要高保真、低成本的组装方法。

技术实现要素:
本发明的方面涉及产生靶核酸的方法。按照一些实施方式,所述方法包含:(1)提供多个钝末端双链核酸片段,其中所述多个钝末端双链核酸片段的每个在两个末端都具有限制性酶识别序列;(2)通过在所述多个钝末端双链核酸片段的靠近限制性酶识别序列处酶消化来产生多个粘性末端双链核酸片段,其中多个粘性末端双链核酸片段各自具有两个不同且非互补的突出端;(3)用连接酶连接多个粘性末端双链核酸片段,其中第一个粘性末端双链核酸片段的第一突出端与第二个粘性末端双链核酸片段的第二突出端唯一地互补;和(4)形成多个粘性末端双链核酸片段的线性排列,其中唯一的排列包含靶核酸。在特定的实施方式中,可以通过释放在固体支持物上合成的多个寡核苷酸来提供多个钝末端双链核酸片段,并且使用基于聚合酶的反应来合成多个寡核苷酸的互补链。在本发明的另一方面,提供了用于设计多个待组装成靶核酸的起始核酸的方法。按照一些实施方式,所述方法可包含:(1)得到靶核酸的靶序列;(2)选择多个其中的子序列,使得两个相邻的子序列通过N个碱基互相重叠;(3)在存储器中储存所得的重叠N-碱基序列;(4)将重叠N-碱基序列彼此比较来确保它们彼此至少差别1个碱基;并且(5)重复步骤(2)-(4)直到得到多个满意的起始核酸,其中任意两个相邻的起始核酸通过N个碱基唯一地互相重叠。本发明的另一个方面涉及按照本文所述的方法设计的多个待组装成靶核酸的起始核酸。在某些实施方式中,多个起始核酸还可以各自包含工程改造的通用引物结合位点,用于从此扩增多个起始核酸。多个起始核酸也可以各自进一步包含工程改造的限制性酶识别序列。在另一个方面,提供了用于组装靶核酸的系统。所述系统包含:(1)用于合成本文所述的多个起始核酸的固体支持物,其中每个起始核酸还包括工程改造的通用引物结合位点和工程改造的限制性酶识别序列;(2)聚合酶反应单元,用于使用与通用引物结合位点互补的通用引物来基于聚合酶反应合成多个起始核酸的互补链,从而产生多个钝端双链核酸片段;(3)消化单元,用于通过在多个钝端双链核酸片段的靠近限制性酶识别序列处酶消化来产生多个粘性末端双链核酸片段,其中多个粘性末端双链核酸片段各自具有两个不同且非互补的突出端;和(4)连接单元,用于用连接酶连接多个粘性末端双链核酸片段,其中第一粘性末端双链核酸片段的第一突出端与第二粘性末端双链核酸片段的第二突出端唯一地互补。本发明的另一个方面提供了用于设计待组装成靶核酸的多个起始核酸的计算机程序产品,所述程序驻留在硬件计算机可读储存介质上并且具有多个指令,当由处理器执行时,所述指令导致处理器进行以下操作:(1)得到靶核酸的靶序列;(2)选择其中的多个子序列,使得每两个相邻的子序列通过N个碱基互相重叠;(3)储存所得的重叠N-碱基序列至存储器中;(4)比较重叠N-碱基彼此的序列来确保它们彼此至少相差1个碱基;以及(5)重复步骤(2)-(4)直到得到多个满意的起始核酸,其中任意两个相邻的起始核酸通过N个碱基唯一地互相重叠。附图说明图1显示了用于多重寡核苷酸组装反应的寡核苷酸的示例性设计。图2显示了用于测试来自多重组装反应的产物的引物的相对位置。图3显示了配对寡核苷酸组装反应的实施方式。图4显示了多重寡核苷酸组装反应的实施方式。图5显示了图4的多重寡核苷酸组装反应的产物的基于PCR的测试。图6显示了图4的多重寡核苷酸组装反应的产物的测序确认。图7A和7B显示了配对错配连接试验的实施方式。图8显示了基于图1设计的替代组装产物。图9A和9B显示了用于序列侧接组装片段的两种设计策略。图10A和10B显示了两种补偿组装策略。发明详述本发明的方面涉及用于在单个组装步骤中共价连接多个核酸片段来产生较长核酸产物的方法和组合物。本发明的方面可用来高效组装大量的核酸片段,和/或减少产生大核酸产物所需步骤的数量,同时降低组装错误率。本发明的方面可纳入核酸组装过程来提高组装保真度、通量和/或效率,减少成本,和/或缩短组装时间。在一些实施方式中,本发明的方面可以自动化和/或在高通量组装环境下进行来促进平行产生许多不同的靶核酸产物。多重寡核苷酸组装在多重组装反应(例如,多重的酶介导反应、多重化学组装反应或其组合)中可以从多个不同起始核酸(例如,寡核苷酸)组装成预定的核酸片段。通过对多重寡核苷酸组装反应的某些实施方式的以下描述显示了多重核酸组装反应的某些方面。应该理解寡核苷酸环境下组装反应的描述并不意在构成限制。可以使用从一个或多个不同来源(例如,合成或天然多核苷酸、核酸扩增产物、核酸降解产物、寡核苷酸等)得到的起始核酸来实施本文所述的组装反应。起始核酸可以被称为组装核酸(例如,组装寡核苷酸)。如本文所用,组装核酸具有的序列设计为待纳入组装过程所产生核酸产物的序列。然而,应该理解在双链核酸环境下组装反应的描述并不意在构成限制。在一些实施方式中,在图中所示和本文所述的起始核酸的一个或多个可以单链核酸提供。因此,应理解当图和说明表示粘性末端双链核酸的组装时,考虑了一个或多个单链核酸的存在。如本文所用,寡核苷酸可以是包括至少两个共价结合的核苷酸残基的核酸分子。在一些实施方式中,寡核苷酸长度可以是10-1000个核苷酸。例如,寡核苷酸长度可以是10-500个核苷酸,或500-1000个核苷酸。在一些实施方式中,寡核苷酸长度可以是约20-约300个核苷酸(例如,约30-250、40-220、50-200、60-180,或约65或约150个核苷酸)、约100-约200、约200-约300个核苷酸、约300-约400、或约400-约500个核苷酸。然而,可以使用更短或更长的寡核苷酸。寡核苷酸可以是单链核酸。然而,在一些实施方式中,可以如本文所述使用双链寡核苷酸。在某些实施方式中,寡核苷酸可以是化学合成的,如以下详述。在一些实施方式中,可以在使用前扩增输入的核酸(例如,合成寡核苷酸)。所得的产物可以是双链的。在某些实施方式中,每条寡核苷酸可以设计成具有与待组装的预定靶核酸的序列的不同部分相同的序列。因此,在一些实施方式中,每条寡核苷酸可以具有与双链靶核酸的两条链之一的部分相同的序列。为清楚起见,双链核酸的两条互补链在本文中被称为正链(P)和负链(N)。这种名称并不意在暗示链是编码序列的正义链和反义链。它们仅仅是指核酸(例如,靶核酸,中间体核酸片段等)的两条互补链,无关核酸的序列或功能。因此,在一些实施方式中,P链可以是编码序列的正义链,而在其它实施方式中,P链可以是编码序列的反义链。应理解本文提及的互补核酸或互补核酸区域是指具有互相反向互补使得它们能够以天然DNA典型的反向平行方式杂交的核酸或其区域。按照本发明的一个方面,靶核酸可以是P链、N链或包括P链和N链的双链核酸。应理解不同的寡核苷酸可以被设计为具有不同的长度。在一些实施方式中,一种或多种不同的寡核苷酸可以具有重叠的序列区域(例如,重叠的5′区域和/或重叠的3′区域)。重叠序列区域可以是相同的(即对应核酸片段的相同链)或互补的(即对应核酸片段的互补链)。多个寡核苷酸可以包含一个或多个有重叠相同序列区域的寡核苷酸对、一个或多个有重叠互补序列区域的寡核苷酸对或其组合。重叠序列可以具有任何合适的长度。例如,重叠序列可以包括在组装反应中使用的一个或多个核酸的全长。重叠序列可以是约2-约50(例如,3-20、3-10、3-8、或4、5、6、7、8、9个等核苷酸长)。然而,可以使用更短、更长或中间的重叠长度。应该理解用于组装反应的不同输入核酸之间的重叠可以有不同长度和/或序列。例如,重叠序列可以与另一个序列差异至少1个核苷酸、2个核苷酸、3个核苷酸或更多。假定重叠序列间彼此差异x个核苷酸,那么最多(4x+1)段的不同输入核酸可以在一个反应中组装在一起。在一个设计为产生预定核酸片段的多重寡核苷酸组装反应中,在反应中不同寡核苷酸的合并序列可以在正链、负链、两条链或正链的部分和负链的部分的结合上跨越完整核酸片段的序列。多个不同的寡核苷酸可以对应待组装核酸片段的完整序列提供正链序列、负链序列或正链和负链序列的组合。在一个实施方式中,多个寡核苷酸可以包含一个或多个具有与核酸片段正链序列的一个或多个部分相同的序列的寡核苷酸,以及一个或多个具有与核酸片段负链序列的一个或多个部分相同的序列的寡核苷酸。一对或多对不同的寡核苷酸可以包含与本文所述的预定核酸片段序列的重叠部分相同的序列(例如,来自核酸片段相同链或核酸片段互补链的重叠序列部分)。在一些实施方式中,多个寡核苷酸包含一组所含序列联合跨越预定核酸片段的完整正链序列的寡核苷酸和一组所含序列联合跨越预定核酸片段的完整负链序列的寡核苷酸。然而,在某些实施方式中,多个寡核苷酸可以包含一个或多个所含序列与核酸片段的一条链(正链或负链)上的序列部分相同的寡核苷酸,但是不包含所含序列与这些序列部分互补的寡核苷酸。在一个实施方式中,多个寡核苷酸仅包含所含序列与预定核酸片段的正链序列的部分相同的寡核苷酸。在一个实施方式中,多个寡核苷酸仅包含所含序列与预定核酸片段的负链序列的部分相同的寡核苷酸。这些寡核苷酸可以通过依次连接或在基于延伸的反应(例如,如果向反应中加入具有3′区域与多个寡核苷酸其中之一互补的寡核苷酸)中组装。在一个方面,核酸片段可以在连接酶介导的组装反应中组装自多个在一轮或多轮连接酶介导的连接中合并并且连接的寡核苷酸。基于连接酶的组装技术可以涉及一种或多种合适的连接酶,所述酶能催化临近3′和5′核酸末端的共价连接(如核酸的5′磷酸和3′羟基,该核酸在互补模板核酸上退火成所述3′末端紧邻5′末端)。因此,如果第一和第二核酸彼此相邻地在模板核酸上退火,连接酶可以催化所述第一核酸的5′磷酸和第二核酸的3′羟基之间的连接反应。连接酶可以获自重组或天然来源。在一些实施方式中,可以使用一种或多种低温(例如,室温或更低)连接酶(例如,T3DNA连接酶、T4DNA连接酶、T7DNA连接酶和/或大肠杆菌(E.coli)DNA连接酶)。更低温度的连接酶可以用于可能在更高温度下不稳定的更短突出端(如约3、约4、约5、或约6个碱基的突出端)。连接酶也可以是热稳定的连接酶。在一些实施方式中,可以使用来自嗜热生物的热稳定连接酶。热稳定DNA连接酶的例子包括但不限于:TthDNA连接酶(来自嗜热栖热菌(Thermusthermophilus),可购自例如欧基公司(Eurogentec)和GeneCraft公司);PfuDNA连接酶(来自激烈火球菌(Pyrococcusfuriosus)的超嗜热连接酶);Taq连接酶(来自水生栖热菌(Thermusaquaticus)),任何其他合适的热稳定连接酶,或其任意组合。可以使用本发明的一些方面来增强不同类型的核酸组装反应(例如,多重核酸组装反应)。本发明的一些方面可以与一个或多个组装反应结合使用,例如以下所述,Carr等,2004,NucleicAcidsResearch,32卷20期,e162(9页);Richmond等,2004,NucleicAcidsResearch,32卷17期,第5011-5018页;Caruthers等,1972,J.Mo1.Bio1.72,475-492;Hecker等,1998,Biotechniques24:256-260;Kodumal等,2004,PNAS101卷44期,第15573-15578页;Tian等,2004,Nature,432卷,第1050-1054页;和美国专利号6,008,031和5,922,539,其公开内容通过引用纳入本文。用于产生预定核酸片段的多重核酸组装反应的某些实施方式参照图1-10来说明。应理解本文所述的合成和组装方法(包含,例如,寡核苷酸合成、分步组装、多重核酸组装、核酸片段的等级组装或其任意组合)可以任意合适的模式实施,包含在反应试管中、在多孔平板中、在表面上、在柱中、在微流体装置(例如,微流体管)中、毛细管中等。例如,在一些实施方式中,可以通过“递归组装”或“等级组装”来组装靶核酸。在这个实施方式中,靶核酸首先被分成两个或更多重叠的核酸片段(子组件片段)。每个核酸片段然后被细分为两个或更多重叠的更小核酸片段。合成寡核苷酸可以使用任意合适的技术来合成寡核苷酸。例如,可以在柱或其它支持物(例如,芯片)上合成寡核苷酸。基于芯片的合成技术的例子包含自CombiMatrix、安捷伦(Agilent)、艾菲美特(Affymetrix)或其它来源可得的合成装置或方法中使用的技术。合成寡核苷酸可以是任意合适的大小,例如10-1000个核苷酸长(10-200、200-500、500-1000个核苷酸长或其任意组合)。组装反应可以包含多个寡核苷酸,每个寡核苷酸的长度可以各自独立为10-300个核苷酸(例如,20-250、30-200、50-150、50-100或任意中间数的核苷酸)。然而,在某些实施方式中可以使用一个或多个较短或较长的寡核苷酸。本文使用的术语“支持物”和“基底”可互换使用,并且是指多孔或非孔的溶剂不溶性材料,在其上合成或固定聚合物例如核酸。本文使用的“多孔”是指所述材料包含有基本一致直径(例如nm范围内)的孔。多孔材料可以包含但不限于,纸张、合成过滤器等。在这种多孔材料中,所述反应可以在孔中进行。所述支持物能有很多形状中的任意一种,例如销、条、板、盘、杆、弯曲、圆柱形结构、颗粒(包含珠、纳米颗粒)等。所述支持物能有可变宽度。支持物可以是亲水性的或能够呈现出亲水性的。所述支持物可以包含无机粉末如二氧化硅、硫酸镁、和氧化铝;天然聚合材料,特别是纤维素材料和纤维素衍生材料,例如包含纤维的纸,如滤纸、色谱纸等;合成或改性天然产生的聚合物,如硝酸纤维素、乙酸纤维素、聚(氯乙烯)、聚丙烯酰胺、交联葡聚糖、琼脂糖、聚丙烯酸酯、聚乙烯、聚丙烯、聚(4-甲基丁烯)、聚苯乙烯、聚甲基丙烯酸酯、聚(对苯二甲酸乙二酯)、尼龙、聚(丁酸乙烯酯)、聚偏二氟乙烯(PVDF)膜、玻璃、可控孔度玻璃、磁性可控孔度玻璃、陶瓷、金属等;这些材料或单独使用或与其他材料联用。在一些实施方式中,在阵列形式上合成寡核苷酸。例如,在常见支持物上原位合成单链寡核苷酸,其中在基底上的单独或离散的部位(或点)上合成各寡核苷酸。在优选实施方式中,单链寡核苷酸结合到所述支持物或部位的表面上。本文所用的术语“阵列”是指为进一步反应存储、定向(routing)、扩增和释放寡核苷酸或互补寡核苷酸的离散部位的排列。在优选实施方式中,所述支持物或阵列是可寻址的:所述支持物包含在所述支持物上特定预定位置(即“地址”)上的两个或更多离散的可寻址部位。因此,阵列上的各寡核苷酸分子位于所述支持物上已知和确定的位置。各寡核苷酸序列能从所述支持物上其位点来确定。另外,可寻址的支持物或阵列能够直接控制单独分离的体积如液滴。可以选择限定部位的大小来使得在所述部位上形成微体积的液滴,每个液滴保持互相分离。如本文所述,多个部位通常通常(但不必需)由部位间的间隔分离来确保两个相邻部位之间的液滴不会融合。部位间通常在其表面上不携带任何寡核苷酸,并且对应惰性空间。在一些实施方式中,部位间和部位通常在其亲水性或疏水性性质上不同。在一些实施方式中,部位间和部位可以包含本文所述的改性剂。阵列可以被构建、定制或购自供应商(例如,CombiMatrix、安捷伦公司(Agilent)、艾菲美特公司(Affymetrix)、Nimblegen)。寡核苷酸被连接、点样、固定、表面结合、支持或合成在表面或阵列的离散部位上。寡核苷酸可以共价连接到表面或在表面上沉积。各种构建方法为本领域熟知,如无掩膜阵列合成器、利用掩膜的光导向法、流动通道方法、点样法(spottingmethod)等。在一些实施方式中,构建和/或选择寡核苷酸可以使用无掩膜阵列合成器(MAS)合成在固体支持物上。无掩膜阵列合成器在例如PCT申请号WO99/42813和相应的美国专利号6,375,903中描述。已知无掩膜设备的其他示例,这些设备能制造定制的DNA微阵列,其中所述阵列上的各特征有所需序列的单链DNA分子。其他合成构建和/或选择寡核苷酸的方法包含例如利用掩模的光导向法、流动通道方法、点样法、销型方法(pin-basedmethod)和利用多个支持物的方法。用于合成寡核苷酸的利用掩模的光导向法(例如,VLSIP8TM方法)在美国专利号5,143,854、5,510,270和5,527,681中描述。这些方法包括活化固体支持物上的预定区域,然后使所述支持物与预选择的单体溶液接触。能以集成电路制造中使用的光刻法技术的大致方式用穿过掩模的光源辐射来活化选定的区域。该支持物的其他区域保持无活性,因为照射被掩模封闭并且其仍然受到化学保护。因此,光模式定义所述支持物上的哪些区域与给定的单体反应。通过重复活化不同预定区域组和使不同单体溶液接触所述支持物,在所述支持物上生产聚合物的多种阵列。能可选使用其他步骤,例如从所述支持物上洗涤未反应的单体溶液。其他可应用方法包含机械技术如描述于美国专利号5,384,261中的那些。可应用于在单个支持物上合成构建和/或选择寡核苷酸的其他方法在例如美国专利号5,384,261中描述。例如,可以通过(1)在预定区域上确定的通道中流动,或者(2)“点样”至预定区域上,来递送试剂到所述支持物上。也可以使用其他方法以及点样和流动的组合。在各情况中,当所述单体溶液递送到多个反应位点时,所述支持物上的某些活化区域与其他区域机械分开。流动通道方法包括,例如微流体系统,以控制在固体支持物上寡核苷酸的合成。例如,多种聚合物序列可以通过在所述支持物表面上形成流动通道而在固体支持物的选定区域上合成,合适试剂流经所述流动通道或合适试剂置于所述流动通道。制备固体支持物上寡核苷酸的点样法涉及通过将相对少量的反应物直接置于选定区域而递送所述反应物。在一些步骤中,整个支持物表面可用溶液喷洒或另行覆盖,如果这样做更有效的话。精确测定的单体溶液等分样品可由分配器逐滴置入,所述分配器从区域到区域移动。用于在固体支持物上合成寡核苷酸的销型方法在例如美国专利号5,288,514中描述。销型方法利用有多个销型或其他延伸部的支持物。所述销型各自同时插入到盘内的个体试剂容器中。96销型的阵列通常利用96容器的盘,例如96孔微量滴定皿。各个盘填充有特定试剂以供个体销型上特定化学反应中偶联。因此,所述盘经常包含不同试剂。由于所述化学反应业已优化使得各反应能在相对相似的反应条件组下进行,可能同时进行多个化学偶联步骤。其它合适的用于合成寡核苷酸的微阵列和方法包含在美国专利号7,323,320和7,563,600中所述的那些,其全部公开内容通过引用全文纳入本文。在一个实施例中,由此形成的寡核苷酸被从微阵列上化学、酶或物理切割或另行释放用于进一步扩增、限制性酶消化和/或组装。在另一个实施方式中,多个寡核苷酸可以合成或固定在多个支持物,如珠上。一个示例是描述于例如美国专利号5,770,358、5,639,603和5,541,061的基于珠的合成方法。为了在珠上合成分子例如寡核苷酸,大量的珠悬浮于容器中的合适运载体(如水)中。所述珠提供有可选的间隔子分子,所述分子有其复合的活性位点,可选为保护基团。在合成的各步骤中,所述珠分到多个容器中来偶联。新生寡核苷酸链脱保护后,不同单体溶液加入到各容器中,从而在给定容器内的所有珠上,发生相同的核苷酸加成反应。所述珠然后用过量试剂洗涤,并入单个容器中,混合并重新分到另一组多个容器以准备下一轮合成。应注意到由于在开始利用了大量珠,相似地在容器内随机分布了大量珠,在多轮随机加入碱基后,各自在其表面具有合成的独特寡核苷酸序列。个体珠可标记有对其上的双链寡核苷酸是唯一的序列,使得可在应用中鉴定。在另一个实施方式中,可以在纳米颗粒上连接或合成多个寡核苷酸。纳米颗粒包括但不限于金属(例如,金、银、铜和铂)、半导体(例如,CdSe、CdS和用ZnS涂覆的CdS)和磁性(例如,铁磁体)胶体材料。将寡核苷酸连接到纳米颗粒的方法在本领域中已知。在另一个实施方式中,纳米颗粒连接到基底上。含有或不含固定的寡核苷酸的纳米颗粒可以连接到基底上,如Grabar等,Analyt.Chem.,67,73-743(1995);Bethell等,J.Electroanal.Chem.,409,137(1996);Bar等,Langmuir,12,1172(1996);Colvin等,J.Am.Chem.Soc.,114,5221(1992)中所述。裸纳米颗粒可以首先连接到基底上并且寡核苷酸可以连接到固定的纳米颗粒上。预合成的寡核苷酸和/或多核苷酸序列可以连接到支持物上或使用下列方法原位合成:光导向方法、流动通道和点样法、喷墨法、销型方法和基于珠的方法,示于下列参考文献中:McGall等,(1996)Proc.Natl.Acad.Sci.U.S.A.93:13555;《基因工程中的合成DNA阵列》(SyntheticDNAArraysInGeneticEngineering),卷20:111,普莱南出版社(PlenumPress)(1998);Duggan等,(1999)Nat.Genet.S21:10;《微阵列:制作和用于微阵列生物信息学》(Microarrays:MakingThemandUsingThemInMicroarrayBioinformatics),剑桥大学出版社(CambridgeUniversityPress),2003;美国专利申请公开号2003/0068633和2002/0081582;美国专利号6,833,450、6,830,890、6,824,866、6,800,439、6,375,903和5,700,637;和PCT公开号WO04/031399、WO04/031351、WO04/029586、WO03/100012、WO03/066212、WO03/065038、WO03/064699、WO03/064027、WO03/064026、WO03/046223、WO03/040410和WO02/24597;所述公开内容通过引用全文纳入本文以用于所有目的。在一些实施方式中,预合成的寡核苷酸连接到支持物上或使用点样方法合成,其中单体溶液通过从区域到区域移动的分配器(如喷墨)逐滴置入。在一些实施方式中,使用例如机械波驱动的分配器将寡核苷酸点样在支持物上。设计为具有特定序列的寡核苷酸的制品可含有具有所设计序列的寡核苷酸分子以及含有错误的寡核苷酸分子(例如,在至少一个位点上不同于所设计序列的寡核苷酸分子)。序列错误可能包含一个或多个核苷酸缺失、插入、取代(例如,颠换或转换)、倒位、重复或其两种或更多种的任意组合。寡核苷酸错误可能在寡核苷酸合成期间产生。不同的合成技术可能易于出现不同的错误分布和频率。在一些实施方式中,根据使用的合成方案,错误率可能在每个碱基1/10-1/200个错误之间变化。然而,在一些实施方式中,可以实现较低的错误率。另外,错误的类型可能取决于使用的合成技术。例如,在一些实施方式中,基于芯片的寡核苷酸合成相比基于柱的合成技术可能产生相对更多的缺失。在一些实施方式中,一个或多个寡核苷酸制品可以经过错误降低或错误过滤过程来去除含有错误的寡核苷酸(或降低其数量或频率)。可以使用这样的过程来增加寡核苷酸制品中无错误寡核苷酸的数量。进行错误降低或错误过滤的方法可以包含,例如与选择寡核苷酸杂交、与错配结合试剂或错配结合蛋白结合或其组合。在一些实施方式中,可以使用杂交技术,其中在严谨条件下将寡核苷酸制品(例如,构建寡核苷酸)与设计具有互补序列的固定的寡核苷酸制品(例如,选择寡核苷酸)杂交一次或多次。本文使用的术语“选择寡核苷酸”是指与构建寡核苷酸的至少一部分互补(或构建寡核苷酸的补体)的单链寡核苷酸。可以使用选择寡核苷酸来从构建寡核苷酸池中去除含有序列错误(例如,自所需序列的偏差)的构建寡核苷酸的拷贝。在一些实施方式中,选择寡核苷酸可以末端固定在基底上。在其它的实施方式中,选择寡核苷酸可以在溶液中。在一个实施方式中,选择寡核苷酸可以是如本文所述在基底上平行合成的寡核苷酸。可以去除不结合或形成不稳定双链体的构建寡核苷酸以选择性地或特异性地去除会在使用条件下使杂交不稳定的含有错误的寡核苷酸。应理解,这个过程可能不能去除所有含有错误的寡核苷酸,因为这个选择过程中一些含有错误的寡核苷酸仍可能与固定的选择寡核苷酸以足够的亲和力结合。例如,含有错误的寡核苷酸可能与选择寡核苷酸差异1个或2个碱基并且在选择过程反应条件下仍然与选择寡核苷酸结合。在一些实施方式中,可以在一个或多个寡核苷酸处理步骤中包含核酸结合蛋白或重组酶(例如,RecA)以改善无错误的寡核苷酸的选择。例如,通过优选促进与固定的寡核苷酸完全互补的寡核苷酸的杂交,可以降低结合的含有错误的寡核苷酸的量。结果,本文所述的寡核苷酸处理过程可以去除更多含有错误的寡核苷酸并且产生具有更低错误频率(例如,每个碱基低于1/50、低于1/100、低于1/200、低于1/300、低于1/400、低于1/500、低于1/1000或低于1/2000个错误的错误率)的寡核苷酸制品。在一些实施方式中,错误校正可以纳入各过程重复之间和/或在合成过程末期,从而增加未偏离所需序列的合成多核苷酸的相对群。这种错误校正可包含直接测序和/或基于校正酶(correctingenzyme)的错误校正的应用,所述校正酶例如错误校正核酸酶(如CELI)、基于MutS或MutS同源物结合或其他错配结合蛋白(参见,例如国际申请号PCT/US2010/057405)的错误校正、本领域已知的其他错误校正方式,或其任何组合。在示例性实施方式中,CELI可以加入到液体培养基中的寡核苷酸双链体。CELI是切割所有错配类型的错配特异性内切核酸酶,例如单核苷酸多态性、小插入或删除。内切核酸酶的加入引起错配位点或区域处双链寡核苷酸的切割。应理解一个或多个核酸结合蛋白或重组酶优选不包含在合成后高保真优化技术中(例如,使用MutS或MutS同源物的筛选技术),因为优化过程包含通过异源双链的产生和去除来去除含有错误的核酸。因此,优选在合成之后和高保真优化之前去除(例如,通过失活、柱纯化或其它合适的技术)在合成步骤中包含的任意核酸结合蛋白或重组酶(例如,RecA)。在某些实施方式中,包含一个或多个修饰的寡核苷酸是有帮助的。可以通过在合成期间纳入修饰的碱基(例如,核苷酸类似物)、通过在合成后修饰寡核苷酸或其任意组合来修饰寡核苷酸。修饰的例子包括但不限于下述的一种或多种:通用碱基如硝基吲哚、dP和dK、肌苷、尿嘧啶;卤代碱基如BrdU;荧光标记的碱基;非-放射性标记如生物素(dT的衍生物)和地高辛(DIG);2,4-二硝基苯基(DNP);放射性核苷酸;偶联后修饰如dR-NH2(脱氧核糖-Neb);吖啶(6-氯-2-甲氧基吖啶);和间隔磷酰胺,其在合成中用于向序列添加间隔“臂”,如C3、C8(辛二醇)、C9、C12、HEG(六甘醇)和C18。扩增寡核苷酸可以单链合成产物提供或合成寡核苷酸。在一些实施方式中,也可以包含退火的互补链的双链制品提供或合成寡核苷酸。寡核苷酸可以是DNA、RNA、PNA或其任意组合的分子。可以通过扩增单链合成寡核苷酸或其它合适的模板(例如,在核酸制品如核酸载体或基因组核酸中的序列)来产生双链寡核苷酸。因此,设计为具有本文所述序列特征的多个寡核苷酸可以提供为多个具有所述特征的单链寡核苷酸,或与互补寡核苷酸一起提供。在一些实施方式中,寡核苷酸可以被磷酸化(例如有5′磷酸酯)。在一些实施方式中,寡核苷酸可以是非磷酸化的。在一些实施方式中,可以使用合适的引物对来扩增寡核苷酸,引物对中各一条引物对应于寡核苷酸的每个末端(例如,一条与寡核苷酸的3′末端互补而一条与寡核苷酸的5′末端相同)。在一些实施方式中,寡核苷酸可以被设计成含有由5′扩增序列(例如,5′通用序列)和/或3′扩增序列(例如,3′通用序列)侧接的中心组装序列(设计纳入靶核酸)。可以使用对应于侧接扩增序列的扩增引物(例如,10-50个核苷酸长,15-45个核苷酸长,约25个核苷酸长等)来扩增寡核苷酸(例如,一条引物可与3′扩增序列互补而一条引物具有与5′扩增序列相同的序列)。然后可以使用任意合适的技术从扩增的寡核苷酸中去除扩增序列来产生仅含有组装序列的寡核苷酸。在一些实施方式中,多个具有不同中心组装序列的不同寡核苷酸(例如,约5、10、50、100或更多)可以具有相同的5′扩增序列和/或相同的3′扩增序列。这些寡核苷酸都可以在相同的反应中使用相同的扩增引物来扩增。在组装反应中使用的多个寡核苷酸可以含有合成寡核苷酸、单链寡核苷酸、双链寡核苷酸、扩增产物、被处理去除含有错误的变体(或降低频率)的寡核苷酸等,或其两种或更多种的任意组合的制品。在一些方面,可以使用双链扩增产物作为组装寡核苷酸并且如本文所述加入到组装反应中。在一些实施方式中,寡核苷酸可以在仍然与支持物连接时得以扩增。在一些实施方式中,可以在扩增之前或之后从支持物上移去或切割寡核苷酸。在一些实施方式中,合成寡核苷酸可以包含由5′和3′扩增序列侧接的中心组装序列。中心组装序列设计为纳入到组装的靶核酸或目标子组件中。侧接序列被设计用于扩增并且不意在被纳入到组装的核酸中。可以使用侧接扩增序列作为通用引物序列来扩增多个有相同扩增序列但是不同中心组装序列的不同组装寡核苷酸。在一些实施方式中,在扩增后去除侧接序列来得到仅含有组装序列的寡核苷酸。在某些实施方式中,双链扩增产物可以经过限制性酶消化来去除侧接序列。为此,侧接序列可以被设计为包含一个或多个限制性位点或限制性酶识别位点。限制性位点可以在扩增序列的5’或3’末端,只要切割位点位于待去除的侧接序列和中心组装序列之间。限制性位点可以包含在扩增序列中(例如,引物结合位点)。限制性位点也可以在扩增序列之外。在限制性酶消化之后,可以使用任意合适的技术分离和去除切割的侧接序列。在一些实施方式中,切割的侧接序列长度可以小于约40、约35、约30、约25、约20或约15个碱基。由此,可以使用本领域已知的尺寸依赖性分离技术,如对二氧化硅的不同亲和力、尺寸过滤、用PEG(聚乙二醇)或CTAB(十六烷基三乙基溴化铵)示差沉淀或其任意组合,来将切割的侧接序列与可设计为尺寸长于侧接序列的中心组装序列相分离。在一些实施方式中,扩增引物可以被生物素化。因此所得的扩增产物也在两个末端都变为生物素化。在限制性酶消化之后,具有生物素化引物的切割的侧接序列保留了生物素标记,而中心组装序列是非生物素化的。因此,切割的侧接序列可以被亲和纯化并且用链霉亲和素(例如,结合到珠、柱或其它表面)去除。在一些实施方式中,扩增引物也可以被设计为包含可用于在扩增后去除引物区域的特定序列特征(例如,限制性位点)以产生包含组装序列而没有侧接扩增序列的双链组装片段。单链突出端本发明的某些方面涉及具有单链突出端的双链核酸。可以使用任意合适的技术来产生突出端。在一些实施方式中,可以用合适的限制性酶来消化双链核酸片段(例如,在多重组装中组装的片段)来产生末端的单链突出端。在一些实施方式中,被设计为在组装的产物中互相邻接的片段可以用相同的酶消化来暴露互补突出端。也可以使用产生互补突出端的不同的酶。在一些实施方式中,可以使用IIS型限制性酶产生突出端。IIS型限制性酶是在称为识别位点的位点上与双链核酸结合的酶,并且在识别位点外产生单个双链切割。称为切割位点的双链切割处通常位于距离识别0-20个碱基处。识别位点长度通常是约4-8bp。所有的IIS型限制性酶展现出至少部分的不对称识别。不对称识别表示对核酸每条链的5′→3′识别序列是不同的。酶活性也显示表示切割位点仅位于识别位点一侧的极性。因此,通常每个识别位点仅对应于一个双链切割。切割通常产生含5′或3′末端的1-6个核苷酸的单链突出端,虽然一些酶产生钝性末端。任一切割可用于本发明的内容中,虽然在一些情况下出现产生单链突出端的那些切割。迄今为止,已经鉴定了大约80种IIS型酶。合适的例子包含,但不限于BstF5I、BtsCI、BsrDI、BtsI、AlwI、BccI、BsmAI、EarI、MlyI(钝末端)、PleI、BmrI、BsaI、BsmBI、BspQI、FauI、MnII、SapI、BbsI、BciVI、HphI、MboII、BfuAI、BspCNI、BspMI、SfaNI、HgaI、BseRI、BbvI、EciI、FokI、BceAI、BsmFI、BtgZI、BpuEI、BsgI、MmeI、BseGI、Bse3DI、BseMI、AclWI、Alw261、Bst61、BstMAI、Eaml1041、Ksp632I、PpsI5SchI(钝末端)、BfiI、Bso311、BspTNI、Eco31I、Esp3I、SmuI、BfuI、BpiI、BpuAI、BstV2I、AsuHPI、Acc36I、LweI、AarI、BseMII、TspDTI、TspGWI、BseXI、BstVlI、Eco5715Eco57MI5GsuI5和BegI。在一些实施方式中,可以使用BsaI、BsmBI、BspQI、BtgZI、BsmFI、FokI、BbvI或其任意变体。这样的酶和关于它们的识别位点和切割位点的信息可从供应商如新英格兰生物实验室公司(NewEnglandBiolabs)处得到。在一些实施方式中,多个设计用于组装的核酸片段中的每个可以在每个末端具有IIS型限制性位点。可以导向IIS型限制性位点使得切割位点相对于识别序列在内部。结果,酶消化暴露了内部序列(例如,在内部序列内的突出端)并且从末端去除识别序列。因此,所有制备用于组装的核酸片段的两个末端都可以使用相同的IIS型位点。然而,也可以使用不同的IIS型位点。设计在组装的产物中邻接的两个片段各自可以包含相同的重叠末端序列和适当位置的侧接IIS型位点以在限制性酶消化后在重叠序列内暴露互补突出端。因此,可以不同的互补突出端来产生多个核酸片段。在核酸片段的每个末端上的限制性位点可以定位使得用合适的IIS型酶消化去除限制性位点并且暴露与设计为在组装核酸产物中相邻的核酸片段上的单链区域互补的单链区域。在某些实施方式中,可以选择限制性酶使得组装核酸片段不含相应的限制性位点。如上述,限制性位点可以位于扩增序列的内部或外部、5’或3’。如图9A所示,限制性位点(粗体表示)可以包含在扩增序列(斜体表示)中并且位于中心组装片段(黑体)的远端。例如,在双链组装片段的任一末端处使用BtgZI和BsmFI位点,并且由箭头表示它们相应的切割位点。BtgZI和BsmFI都切割距离它们的识别位点10个核苷酸/14个核苷酸处。也可以使用在离识别位点短距离(例如,5-25、10-20或约15个核苷酸)处切割的其它限制性酶。另外,如图9B所示,限制性位点(粗体表示)可以在扩增序列(斜体表示)外部并且位于中心组装片段(普通字体)的近端。作为示例,在双链组装片段的两个末端处使用BsaI位点,也由箭头表示其切割位点。如图9A和9B中看出,当限制性位点位于中心组装片段的远端并且包含在扩增序列中时,起始核酸的总长度短于限制性位点位于中心组装片段的近端并且不包含在扩增序列中时。因此,第一种策略(图9A)对于合成较短的起始核酸(例如,在芯片上)可以是更有经济效益和较少错误的。第一种策略也使用较短的通用引物(用于扩增片段)并且因此进一步降低成本。在限制性酶消化之后,待从中心组装片段中去除的末端片段也较短,并且因此在第一种策略中去除末端片段比第二种策略更容易、更便宜和更快。使用IIS型或其它位点特异性限制性酶的DNA酶促消化通常产生4-6个核苷酸的突出端。在本发明中意外显示,这些短粘性末端足够连接含有互补末端的多重核酸片段来形成靶核酸。通常为了确保效率,连接反应通常包含两个片段,因为3个或更多片段显著降低连接效率。另外,由于错配经常发生,常规的方法需要较长的粘性末端来改善特异性。另外,为了选择正确的连接产物,需要耗力耗时的克隆和筛选过程。本发明还提供了:(1)在单个反应(例如,单个反应池)中多个片段(例如,至少4、至少5、至少6、至少7、至少8或更多个)的成功连接;(2)快速和廉价的连接反应(例如,室温下30分钟);(3)区分错配的高特异性;和(4)快速PCR步骤来选择正确的产物,而不需要克隆和筛选。本发明的另一个优势是直接使用市售芯片或微阵列的合成寡核苷酸来构建任意感兴趣的靶核酸的能力,靶核酸可以是任意序列和/或任意长度(例如,至少500bp、至少1kb、至少2kb、至少5kb、至少10kb或更长)。这样的合成寡核苷酸可以是基本相同的大小(例如,约50个碱基、约100个碱基、约200个碱基、约300个碱基或更长),并且因此易于处理。在一个实施例中,假设在芯片上的每个寡核苷酸或片段具有100个核苷酸的载荷并且片段具有4-碱基突出端,如果片段的数量是n,那么连接产物的长度=(n*100)-(4*(n-1)),有(n-1)个连接接头。应注意为了确保连接特异性,突出端可以被选择或设计为对每个连接位点唯一,即被设计为在组装产物中相邻的两个片段的每对互补突出端应该是唯一的并且与任何其它对互补突出端的差异至少1个核苷酸。在图10A中表示了暴露粘性末端的另一个策略(补偿组装)。从芯片开始,可以合成多个寡核苷酸(例如,A1-A10)。寡核苷酸可以被设计为具有中心组装序列,当其适当组装时,形成靶核酸5’-A1-A3-A5-A7-A9-3’(反向链是3’-A2-A4-A6-A8-A10-5’)。即,两个相邻的寡核苷酸An和An+1可以被设计为重叠。如本文所用,相邻的寡核苷酸是指第一个寡核苷酸沿着线性核酸序列位于第二个寡核苷酸的5’末端或3’末端处的寡核苷酸。在一些实施方式中,相邻的寡核苷酸可以是毗连的。如本文所用,毗连的寡核苷酸是指第一个寡核苷酸结束于任意设定的-1位置处而第二个片段沿着线性核酸序列从任意设定的0位置处开始的两个寡核苷酸。中心组装序列可以是任意需要的长度,如约50-500个核苷酸、约60-300个核苷酸、约70-200个核苷酸或更短或更长。多个寡核苷酸可以有均一的长度来易于处理。例如,合成的寡核苷酸也可以在各末端包含扩增序列,其中可构建有限制性位点。扩增序列可以是约10-30个核苷酸、约15-25个核苷酸或更短或更长。图10A显示了70-聚体的中心组装序列和120-聚体的全寡核苷酸。合成的寡核苷酸可以从芯片上洗脱、切割或另行释放,并且使用引物对AL和AR进行PCR扩增。可以切割(例如,用限制性酶)扩增的产物来去除扩增序列(箭头),并且可以从中纯化中心70-聚体双链组装序列。然后这些双链组装序列可以在单个改组步骤中解链(例如,在95℃下)和重新退火(例如,在65℃下)。在单链寡核苷酸改组之后,25%的产物会是具有粘性末端的补偿组装产物(例如,A1/A2、A2/A3、A3/A4、A4/A5等)。这些粘性末端可以用连接酶组装在一起(逐步或在单个反应中分级),从而形成靶核酸5’-A1-A3-A5-A7-A9-3’(反向链是3’-A2-A4-A6-A8-A10-5’)。应理解也可以设计寡核苷酸使得靶核酸是5’-A1...A3...A5...A7...A9-3’(例如,在An和An+2之间允许有缺口,其可以用An+1序列作为模板来填充)。为此,在连接之前可以使用聚合酶和dNTP来延伸和填充缺口。第二种补偿组装策略示于图10B,其中可以使用单个组合的组装-(延伸)-连接步骤,而不是两个单独的步骤(例如,组装步骤和连接步骤)。例如,在改组步骤(例如,在95℃下解链和在65℃下重新退火)之后,无缺口的解析(parse)寡核苷酸可以连接以形成全长的产物或子组件产物。如果在解析中存在缺口,寡核苷酸可以在聚合酶和dNTP存在下孵育以在连接之前通过链延伸填充缺口。在一些实施方式中,有缺口的解析可以同时进行聚合酶链延伸和连接。本文使用的术语“子组件”是指已经从一组构建寡核苷酸中组装的核酸分子。优选地,子组件至少长约构建寡核苷酸的2-倍、3-倍、4-倍、5-倍、10-倍、20-倍、50-倍、100-倍或更长。也可以使用其它用于产生粘性末端的方法。例如,可以使用基于聚合酶的方法(例如,T4DNA聚合酶)来合成需要的粘性末端。无论用何种方法产生特异性突出端(例如,用于设计在组装核酸产物中相邻的核酸的互补突出端),可以设计和/或产生不同长度的突出端。在一些实施方式中,可以使用长单链突出端(3′或5′)来促进特异性和/或高效组装。例如,3′或5′单链突出端可以长于8个碱基长,例如长8-14、14-20、20-25、25-50、50-100、100-500个或更多碱基。高保真组装按照本发明的方面,可以在单个过程中组装多个核酸片段,其中在促进片段的共价组装的条件下将多个片段混合在一起来产生特异性的较长核酸。按照本发明的方面,可以使用连接酶在体外共价组装多个核酸片段。在一些实施方式中,可以组装5个或更多(例如,10个或更多、15个或更多、15-20、20-25、25-30、30-35、35-40、40-45、45-50、50个或更多等)不同的核酸片段。然而,应理解可以使用合适的组装技术组装任意数量的核酸(例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个等)。组装的每个核酸片段可以是约100个核苷酸-约1000个核苷酸长(例如,约200、约300、约400、约500、约600、约700、约800、约900)。然而,可以使用组装技术(例如,鸟枪组装进入质粒载体)组装更长(例如,约2500个或更多核苷酸长、约5000个或更多核苷酸长、约7500个或更多核苷酸长、约10000个或更多核苷酸长等)或更短的核酸片段。应理解每个核酸片段的大小独立于加入组装的其它核酸片段的大小。然而,在一些实施方式中,每个核酸片段可以是大约相同的大小或长度(例如,约100个核苷酸长-约400个核苷酸长)。例如,寡核苷酸的长度可以是中值长度在约100个核苷酸长和约400个核苷酸长之间,并且变化范围为约+/-1个核苷酸、+/-4个核苷酸、+/-10个核苷酸。应理解双链核酸片段的长度可以由碱基对的数量来表示。如本文所用,当称为“x”个核苷酸长的核酸片段用于双链核酸片段的内容中时对应于“x”个碱基对的长度。在一些实施方式中,在一个反应中组装的一个或多个核酸(例如,1-5、5-10、10-15、15-20个等)可以是密码子优化的和/或非天然存在的。在一些实施方式中,在一个反应中组装的所有核酸都是密码子优化的和/或非天然存在的。在本发明的一些方面中,组装的核酸片段被设计为具有重叠互补序列。在一些实施方式中,核酸片段是具有3′和/或5′单链突出端的双链核酸片段。这些突出端可以是能与不同核酸片段上的互补粘性末端退火结合的粘性末端。按照本发明的方面,在两个核酸片段上的互补序列(和特定互补粘性末端)的存在促进了它们的共价组装。在一些实施方式中,组装了具有不同重叠互补单链粘性末端的多个核酸片段并且通过在每个片段上的粘性末端的身份(identity)确定它们在组装的核酸产物中的顺序。例如,可以设计核酸片段使得第一核酸具有与第二核酸的第一个粘性末端互补的第一粘性末端以及与第三核酸的第一个粘性末端互补的第二粘性末端。第二核酸的第二个粘性末端可以与第四核酸的第一个粘性末端互补。第三核酸的第二个粘性末端可以与第五核酸的第一个粘性末端互补。以此类推至最后的核酸。按照本发明的一些方面,可以使用该技术来产生含有以预定线性顺序(例如,第一、第二、第三、第四……最后)组装的核酸片段的线性排列。在某些实施方式中,相邻核酸片段之间的重叠互补区域设计(或选择)成有足够的差异来促进(例如,热力学上有利)核酸片段的唯一排列(例如,选定或设计的片段排列)。令人惊讶地,在合适的连接条件下,少至一个核苷酸的差异在完美匹配(100%互补粘性末端)和错配(低于100%的互补粘性末端)之间产生足够的区分力。如此,4-碱基突出端能允许高至(4∧4+1)=257个不同片段的高特异性和高保真连接。应理解可以使用不同长度的重叠区域。在一些实施方式中,当组装较大数量的核酸片段时,可以使用较长的粘性末端。较长的粘性末端可以提供更多的灵活性来设计或选择充分区别的序列来区分正确粘性末端退火(例如,涉及设计互相退火结合的粘性末端)和错误粘性末端退火(例如,在非互补粘性末端之间)。为了实现这样的高保真组装,可以使用一个或多个合适的连接酶。连接酶可以获自重组或天然来源。在一些实施方式中,可以使用T3DNA连接酶、T4DNA连接酶、T7DNA连接酶和/或大肠杆菌DNA连接酶。这些连接酶可以在相对低的温度下(例如,室温)使用并且特别用于相对短的突出端(例如,约3、约4、约5或约6个碱基的突出端)。在某些连接反应(例如,室温下30分钟的孵育)中,对于多重方式的连接,T7DNA连接酶可以比其它连接酶更高效。也可以使用热稳定的连接酶,如TthDNA连接酶、PfuDNA连接酶、Taq连接酶、任意其它合适的热稳定的连接酶或其任意组合中的一个或多个。在一些实施方式中,可以在不同核酸片段间设计或选择两对或更多对互补粘性末端使其具有相同或相似的序列来促进含有相对随机排列(和/或数量)的具有相似或相同粘性末端的片段的产物的组装。这可以用于产生具有某些内部序列区域的不同序列排列和/或不同拷贝数量的核酸产物的库。应理解单个待组装的片段的浓度的变化可能造成不完整中间构建体的组装。在使用寡核苷酸A、B、C、D、E、F组装靶核酸序列(ABCDEF)中,每个寡核苷酸具有合适的粘性突出末端,如果个体片段的浓度不是等摩尔的(例如,如果A、B和C的浓度高于D、E和F的浓度),可能形成终止物质(如AB和BC)产生未连接的中间产物的混合物。为了避免形成不完整的中间构建体,可以从个体片段的至少两个池(例如,池1:A、C、E和池2:B、D、F)组装靶核酸。在一些实施方式中,两个池中的每个包含多个核酸片段,第一池的每个核酸片段具有与第二池中的核酸片段的末端互补的末端。在一些实施方式中,可以通过将寡核苷酸群分为至少两个池并且在每个反应池中单独扩增寡核苷酸来形成至少两个池。在其他实施方式中,可以通过从第一寡核苷酸阵列释放(例如,通过洗脱、切割或扩增)寡核苷酸到第一池中并且通过释放第二寡核苷酸阵列的寡核苷酸到第二池中来形成至少两个池。在另一个实施方式中,可以如本文所述通过使用至少两组不同的扩增标签扩增寡核苷酸序列来形成至少两个不同的池。例如,可以稀释包含寡核苷酸B、D和F的第二池使得在第二池中存在的寡核苷酸B、D和F的摩尔浓度低于在第一池中存在的寡核苷酸A、C和E的摩尔浓度。例如,在第二池中的寡核苷酸的摩尔浓度可以低至第一反应池中寡核苷酸的摩尔浓度约1/2、1/10、1/20、1/50、1/100或更低。在混合和连接两个池之后,所得的产物包含具有预定序列的靶核酸并且可以与第一池的过量寡核苷酸相分离。在某些实施方式中,需要形成具有不同摩尔浓度的寡核苷酸二聚体的池。例如,可以使用至少两个不同的池进行靶核酸序列ABCDEFGH的组装,第一池包含寡核苷酸A、B、E、F而第二池包含寡核苷酸C、D、G、H。可以稀释第二池使得寡核苷酸C、D、G、H的摩尔浓度低于寡核苷酸A、B、E、F的摩尔浓度(例如,1/10或1/100)。具有合适粘性突出末端的寡核苷酸可以在第一池中连接形成中间产物AB和EF并在第二池中形成中间产物CD和GH。由于C、D、G、H的摩尔浓度低于A、B、E、F的摩尔浓度,CD和GH的摩尔浓度低于AB和EF的摩尔浓度。在连接条件下混合中间产物AB、CD、EF、GH之后,可以从过量的二聚体AB和EF中分离出所得的包含具有预定序列的靶核酸的产物。在一些实施方式中,混合核酸片段并且用连接酶孵育。应理解在促进粘性末端的特异性退火的条件下的孵育可以增加组装的频率(例如,正确组装)。在一些实施方式中,设计具有相似解链温度(例如,互相差5℃以内)的不同粘性末端,使得在相同的条件下促进所有片段的正确退火。在取决于所用粘性末端长度的不同温度下可以促进正确退火。在一些实施方式中,可以使用约4-约30个核苷酸长度的粘性末端(例如,约5、约10、约15、约20、约25或约30个核苷酸长度)。孵育温度可以为约20℃-约50℃(包含,例如室温)。然而,可以使用更高或更低的温度。孵育的长度可以基于混合在一起的不同核酸的突出端的长度、突出端的复杂度和数量(和因此不同突出端的数量)来优化。孵育时间也可以取决于退火温度和在混合物中其它试剂的存在与否。例如,可以加入核酸结合蛋白和/或重组酶(例如,RecA,例如热稳定的RecA蛋白)。所得的核酸复合物可以在一对靶序列特异性引物的存在下经过聚合酶链反应,来扩增并且选择正确的连接产物(例如,靶核酸)。或者,所得的核酸复合物可以被连接入合适的载体中并转化到宿主细胞中用于进一步菌落筛选。序列分析以及片段设计和选择本发明一些方面包含在靶核酸序列内基于区域的鉴定,分析靶核酸的序列并且设计组装策略,鉴定的区域可用于产生合适的粘性末端(例如,单链突出端)。可以使用这些区域来限定可以被组装(例如,在一个反应中)来产生靶核酸的核酸片段的末端。然后核酸片段可得以提供或制备(例如,在多重组装反应中)。可以选择核酸片段,使得它们具有相对均一的大小以易于处理(例如,纯化)。按照一些实施方式,可以计算机辅助方式设计和/或分析核酸序列来产生一组经解析的双链或单链寡核苷酸。如本文所用,术语“经解析的”表示靶核酸的序列已有描绘,例如以计算机辅助的方式,使得能鉴定一系列相邻的寡核苷酸序列。相邻的寡核苷酸或核酸片段优选由合适数量的核苷酸重叠来促进按照本发明的方法的组装。可以单独合成寡核苷酸序列并且用本发明的方法组装。在一些实施方式中,可以分析靶核酸序列来鉴定在靶核酸的一条链上含有至少一个不同核苷酸的多个区域。可以使用这些区域来产生粘性末端。应理解粘性末端的长度优选足以提供特异性。例如,粘性末端可以足够长以具有足够不同的序列(例如,至少1-碱基差异)来防止或减少相似粘性末端之间的错配。然而,它们的长度优选不会长至使相似粘性末端之间的错配稳定。在一些实施方式中,可以使用约3-约10个碱基的长度。然而,对于用于产生粘性突出端的区域,可以选择任意合适的长度。特异性的重要性可以取决于同时组装的不同片段的数量。另外,为避免使错配区域稳定所需要的合适长度可能取决于用于退火不同粘性末端的条件。在一些实施方式中,可以选择交替的区域,如果它们相隔的距离限定的片段具有组装设计的合适长度。在一些实施方式中,可以由约100-约500个碱基分隔交替的区域。然而,可以选择任意合适的更短或更长的距离。例如,可以由约200-约1000个碱基来分隔粘性区域。应理解可以得到交替区域的不同模式,这取决于几个因素(例如,取决于靶核酸的序列、粘性末端的选择长度和需要的片段长度)。在一些实施方式中,如果数个选项可选,可以选择区域来最大化不同粘性末端之间的序列差异。粘性区域的选择限定了会被组装产生靶核酸的片段。因此,根据靶核酸,片段可以为约100-约500个碱基对长、约200-约1000个碱基长,或更短或更长。可以使用任意合适的技术产生或得到片段。在一些实施方式中,可以组装(例如,在多重双链组装反应中)每个片段使得其由可用于产生粘性单链区域的双链区域侧接。在一些实施方式中,用于允许靶多核苷酸组装的方法基于靶核酸的序列的信息。在一些实施方式中,可以使用计算机软件来解析靶序列(例如,A1-An)将其分为一组特定长度的重叠寡核苷酸(A1,A2,A3,...An)。可以从芯片或微阵列上合成寡核苷酸A1,A2,A3,...An。在一些实施方式中,寡核苷酸序列可以被设计为包含:扩增引物序列、限制性酶如IIS型限制性酶的识别位点、填充序列、载荷、填充序列、限制性酶的识别位点的反向互补(相同或不同)、不同扩增引物序列的反向互补。载荷可以是靶基因(或任意核酸序列)的重叠亚群。如果需要,载荷可以填充有m个核苷酸M(Mm)来使得在用限制性酶切割后产生唯一互补的粘性末端。引物允许扩增。限制性酶的识别位点使得引物从载荷上切割下来。在某些实施方式中,在多重靶序列之间使用相同的识别位点是有优势的。然而,应该注意到如果靶序列已经含有识别位点,那么含有该识别位点(在从左到右或从右到左的解析中)的寡核苷酸会被切割,阻碍正确组装。在一些实施方式中,如果靶序列仅含有一次出现的识别位点,可以通过在位点内开始解析来解决该问题,并且在识别位点的左侧解析一组寡核苷酸,在其右侧解析另一组寡核苷酸。由于所述位点会分裂在两个寡核苷酸之间,不会以完整的序列存在并且因此不会被识别或切割。如果存在需要的寡核苷酸长度或长度范围,在解析的每侧中的最后一个寡核苷酸可填充有合适数量的m个核苷酸M(Mm)。这个方法可以被扩展至超过一次出现的识别位点,如果这些识别位点出现在载荷的允许长度范围的整数倍内。作为最简单情况的例子(并且为了这个例子的目的忽视任意需要的重叠),如果对于需要的100bp载荷大小,任意部分的2个限制性位点精确地隔开100bp,那么从任一个内开始的分析会自动分裂另一个。如果载荷可在90-110bp间变化,那么可以容许在该距离范围内的一对限制性位点。对于这个相同的载荷范围,一对也可在更长的距离处分裂:180-220bp、270-330bp等。当解析靶序列成寡核苷酸时,最后的寡核苷酸(或如果从内部解析则在每个方向上最后的寡核苷酸)的长度可以落在需要的寡核苷酸长度以外。最后的寡核苷酸可以填充至需要的长度。然而,这可能以产生另外的碱基对的代价出现,这些碱基对不另有作用,尤其是当组装大量的靶序列时。在一些实施方式中,解决这个问题的方案是将每个靶序列压缩到单个长拟靶(pseudo-target,在实际靶序列之间具有任选引物序列)中,并且然后分裂为较小的、所需长度的重叠片段(例如,通过切割或由PCR扩增)。片段长度的计算如下所示:长度=(段数*最大寡核苷酸长度)-(接头数*重叠)其中接头数=段数-1例如:长度484=(段数5*最大寡核苷酸长度100)-(接头数4*重叠4)长度504=(段数5*最大寡核苷酸长度104)-(接头数4*重叠4)如果一些靶序列含有限制性位点,那么在一些情况中,可以选择靶序列连接的顺序使其限制性位点在接头处(并且在需要的寡核苷酸长度范围内)。在通常情况下,可以仅向含有限制性位点的靶序列的子集加入额外的填充序列,仍然产生消除在大多数靶序列上的填充序列的全部益处。本发明的实施例显示在某些连接酶在某些条件下正确地区分所含突出端具有相同的最后一个碱基和不同的倒数第二个碱基的2个寡核苷酸。在一些情况下,可能需要设计寡核苷酸使得在每个突出端的最后一个碱基是唯一的。在末端唯一的A、C、G、T(4个接头)允许连接最多5段,这是商业上可用的组装的数量。也在本发明中考虑较大数量的连接段,如以下举例:-最后2个碱基唯一:4∧2=16个接头,最高17段-最后3个碱基唯一:4∧3=64个接头,最高65段-最后4个碱基唯一:4∧4=256个接头,最高257段本发明的一些方面涉及解析输入的靶核酸序列的算法。在一些实施方式中,可以使用算法来确保多个寡核苷酸的最后碱基(或最后2、3或4个碱基)是唯一的。例如,可以使用本发明的算法来限定多个经解析的寡核苷酸来一起组成靶序列(天然存在的、非天然存在的或任意核酸序列),所述寡核苷酸具有大约相同长度并且具有4个碱基重叠的寡核苷酸,最后一个碱基(或最后2、3或4个碱基)是唯一的。在另一些实施方式中,可以限定寡核苷酸使得倒数第二或倒数第三个碱基等或其组合是唯一的。在一些实施方式中,第一个算法包含以下设计或分解步骤:步骤1:移动目标量,例如100bp,步骤2:储存相关的1-4个碱基到组中(例如,在存储器中),步骤3:退回到重叠序列(4bp),步骤4:再次移动。对于这个第二和每个后续的100bp移动,如果相关的1-4个碱基已经在组中存在,那么一次移转一个碱基直到遇到在组中还没有的1-4个碱基序列。步骤5:向装置中添加新的1-4个碱基序列,步骤6:然后重复。如果在到达DNA序列的末端之前达到需要的段数,那么开始一个新组,倒退合适的用于片段组装的重叠(其可以是或可以不是不同于将寡核苷酸组装成片段的方法)。本领域技术人员会注意到1-碱基移转可能在方向上不同,例如,如果名义长度是需要的最大长度,总是向左(更短),如果名义长度是最小需要的长度,总是向右(更长),或它们的一些组合。为了集中在名义长度周围,移转可以交替,例如按以下顺序检查位置:-1、+1、-2、+2等。调换也可经加权用以偏向例如较短但是也允许较长序列,例如-1、-2、+1、-3、-4、+2等。这个算法可能限于设计某些靶序列,由于自由度随着组中的每个后续添加而降低,需要的移转可能很大。例如,第一个末端可以是“A”,但是最后的末端可能在几个碱基内没有“A”,因此使得最后的寡核苷酸非常短或非常长,这可能是不理想的。解决这个问题的一个方案是对每个接头储存一组数据,然后选择最少数量的寡核苷酸来移转,或在所有寡核苷酸之间最小的总移转距离,或它们的一些组合。对随机的1000bp序列中出现任意给定的短序列(例如,限制性位点)的频率的统计如下。例如,如果使用未从靶序列的中间开始解析的6-bp的限制性位点,那么22%的序列并不构建有那个限制性位点。用相同的6-bp位点并且从中间解析,只有3%的含有2个位点的序列不能被构建(或需要另外的解析)。更具体地:-如果一次出现限制性位点阻止构建:对于量1的长度5bp,62%会有至少1个位点对于量1的长度6bp,22%会有至少1个位点对于量1的长度7bp,6%会有至少1个位点-如果从内部解析允许2次出现:对于量1的长度5bp,25%会有至少2个位点对于量1的长度6bp,3%会有至少2个位点对于量1的长度7bp,<1%会有至少2个位点(大约0.2%)-如果使用超过一个限制性酶(及相应位点)并且如果允许单次出现:对于量2的长度5bp,38%会有至少1个位点对于量2的长度6bp,5%会有至少1个位点对于长度7bp和长度6bp,1%会有至少1个位点对于量3的长度5bp,24%会有至少1个位点。对于量3的长度6bp,1%会有至少1个位点-如果超过一个限制性酶,允许2次出现:对于量2的长度5bp,6%会有至少2个位点对于量2的长度6bp,<1%会有至少2个位点(大约0.06%)对于量3的长度5bp,2%会具有至少2个位点。应用本发明各方面可以用于涉及合成核酸的生成和/或使用的多种应用。如本文所述,本发明提供了具有提高的效率的组装合成核酸的方法。所得组装核酸可以体外扩增(如使用PCR、LCR,或任何合适的扩增技术),体内扩增(如通过克隆到合适的载体中),分离和/或纯化。组装的核酸(单独或克隆到载体中)可以转化入宿主细胞(如原核、真核、昆虫、哺乳动物或其他宿主细胞)。在一些实施方式中,所述宿主细胞可以用于增殖所述核酸。在某些实施方式中,所述核酸可以整合到所述宿主细胞的基因组中。在一些实施方式中,所述核酸可以取代细胞基因组上的对应核酸区域(如通过同源重组)。因此,核酸可以用于生成重组生物。在一些实施方式中,靶核酸可以是用于取代全部或部分宿主生物体的基因组的整个基因组或基因组大片段。重组生物也可以用于多种研究、工业、农业、和/或医学应用。许多本文所述的技术可以一起使用,在一个或多个点上应用合适的组装技术来产生长核酸分子。例如,可以使用基于连接酶的组装来组装低于100到超过10000个碱基对长度(例如,100聚体-500聚体、500聚体-1000聚体、1000聚体-5000聚体、5000聚体-10000聚体、25000聚体、50000聚体、75000聚体、100000聚体等)的寡核苷酸双链体和核酸片段。在示例性实施方式中,本文所述方法可以在组装生物(如病毒、细菌、酵母或其他原核或真核生物)的整个基因组(或其大片段,如约10%、20%、30%、40%、50%、60%、70%、80%、90%或更多)中使用,可选将特异性修饰整合到序列中一个或多个所需位置处。可以任意合适的形式(例如,在稳定的缓冲液中,冻干等)包装任意的核酸产物(例如,包含经扩增、克隆、纯化、分离等的核酸)用于存储和/或运输(例如,用于运输至分配中心或客户)。相似地,可以在合适的缓冲液中制备任意的宿主细胞(例如,用载体转化的或具有经修饰基因组的细胞)用于储存和/或运输(例如,用于分配至客户)。在一些实施方式中,可以冷冻细胞。然而,也可以使用其它稳定的细胞制品。宿主细胞可以在培养中生长和扩增。可以使用宿主细胞来表达一个或多个RNA或感兴趣的多肽(例如,治疗用、工业用、农业用和/或医用蛋白)。表达的多肽可以是天然多肽或非天然多肽。可以分离或纯化多肽用于后续使用。因此,使用本发明的方法产生的核酸分子可以被纳入到载体中。载体可以是克隆载体或表达载体。在一些实施方式中,载体可以是病毒载体。病毒载体可以包含能够感染目标细胞的核酸序列。相似地,在一些实施方式中,可操作地连接至合适启动子系统的原核表达载体可以用于转化目标细胞。在其他实施方式中,可操作连接至合适启动子系统的真核载体可以用于转染目标细胞或组织。本文所述的构建体的转录和/或翻译可以在体外(例如,使用不含细胞的系统)或体内(例如,在细胞中表达)进行。在一些实施方式中,可以制备细胞裂解液。在某些实施方式中,可以分离或纯化表达的RNA或多肽。本发明的核酸也可以用于向表达的多肽或其片段添加检测和/或纯化标签。基于多肽的融合/标签的例子包含但不限于六组氨酸(His6)Myc和HA,和其他有用的多肽,如GFP5GST、MBP、几丁质等。在一些实施方式中,多肽可以包含一个或多个非天然氨基酸残基。在一些实施方式中,可以针对由一个或多个合成核酸编码的多肽或其片段制备抗体。在某些实施方式中,合成核酸可以提供为文库用于研究和开发中的筛选(例如,鉴定潜在的治疗性蛋白或多肽,鉴定用于药物开发的潜在蛋白靶标等)。在一些实施方式中,合成核酸可用作治疗物(例如,用于基因治疗,或用于基因调控)。例如,可以向患者提供足量合成核酸以表达治疗量的蛋白。在其他实施方式中,可向患者给予足量合成核酸以调控(例如,下调)基因表达的量。应理解本文所述的不同行动或实施方式可以独立实施并且可以在美国或美国以外的不同地方实施。例如,接受靶核酸的订单、分析靶核酸序列、设计一个或多个起始核酸(例如,寡核苷酸)、合成起始核酸、纯化起始核酸、组装起始核酸、分离组装的核酸、确认组装的核酸的序列、处理组装的核酸(例如,扩增、克隆、插入宿主基因组等)中的每个行动和任意其它行动或这些行动中的任意部分可以在美国以内或美国以外的一个位置或不同地点单独实施。在一些实施方式中,组装过程可以包括在一个地点(在美国以内或美国以外)实施的多个行动和在一个或多个远程地点(在美国以内或美国以外)实施的多个行动的组合。自动化应用本文提供的方法和设备方面可以包含自动操作本文所述的一个或多个行动(act)。在一些实施方式中,扩增和/或组装反应中的一个或多个步骤可以使用一个或多个自动化样品处理装置(如一个或多个自动化液体或流体处理设备)来自动操作。自动化设备和方法可以用于递送反应试剂,包含下列中的一种或多种:起始核酸、缓冲液、酶(如一种或多种连接酶和/或聚合酶)、核苷酸、盐、和任何其他试剂如稳定剂。自动化设备和方法也可以用于控制反应条件。例如,自动化热循环仪可以用于控制可以使用的反应温度和任何反应循环。在一些实施方式中,扫描激光器可以被自动化以提供适于孵育多核苷酸的一个或多个反应温度或温度循环。相似地,经组装多核苷酸产物的后续分析可以自动进行。例如,测序可以使用测序设备和自动化测序方案自动进行。其他步骤(如扩增、克隆等)也可以使用一种或多种合适设备和相关方案自动进行。应该理解本文所述的一个或多个设备或设备组件可以组合在某一系统(如机器人系统)或微环境(如微流体反应室)中。组装反应混合物(如液体反应样品)可以从所述系统的一个组件向另一个组件转移,使用自动化设备和过程(如样品和/或样品容器的机械化操作和/或转移,包含自动化移液设备、微系统等)。所述系统和其任何组件可以通过控制系统来控制。由此,本文所提供设备的方法步骤和/或方面可以使用例如计算机系统(如计算机控制系统)自动进行。能实施本文所提供技术方面的计算机系统可以包含用于任何处理类型(如本文所述序列分析和/或自动化设备控制)的计算机。然而,应该理解某些处理步骤可以通过作为所述组装系统一部分的一种或多种自动化设备来提供。在一些实施方式中,计算机系统可包含两台或更多台计算机。例如,一台计算机可以通过网络连接第二台计算机。一台计算机可以进行序列分析。第二台计算机可以控制系统中的一个或多个自动化合成和组装设备。其他方面中,其他计算机可以包含在网络中以控制一个或多个分析或处理行动。各计算机可以包含内存和处理器。所述计算机可采用任何形式,因为本文提供的技术方面对在任何特定计算机平台上实施没有限制。相似地,所述网络能采用任何形式,包含专用网络或公共网络(如互联网)。显示设备能与一个或多个设备和计算机关联。替代或补充地,显示设备可以位于远程位点,并且连接用于显示根据本文提供的技术连接以显示分析输出。所述系统不同组件之间的连接可以通过有线、光纤、无线传送,卫星传送,任何其他合适的传送,或者上述两种或多种的任意组合。本文所提供技术的各个不同方面、实施方式、或行动能以多种方式独立自动进行和实施。例如,各个方面、实施方式或行动能使用硬件、软件或其组合独立实施。当以软件实施时,所述软件密码能在任何合适的处理器或处理器集合上执行,可在单独计算机中提供或分布在多个计算机上。应该理解完成上述功能的任何组件或组件集合能通常看作控制上面所讨论功能的一个或多个控制器。所述一个或多个控制器能以多种方式实施,例如有使用微码或软件程序控制的专用硬件或通用目的硬件(例如,一个或多个处理器)以完成上述功能。在这方面,应该理解本文所提供技术实施方式的一种实现中包含了编码有计算机程序(例如,多种指令)的至少一种计算机可读介质(例如,计算机内存、软盘、光盘、磁带等),当在处理器上运行时,完成本文所提供技术的一种或多种上述功能。所述计算机可读介质可运输,从而其上存储的程序能加载到任何计算机系统来源以运行本文所提供技术的一种或多种功能。另外,应该理解执行时,提及完成上面讨论功能的计算机程序不限于在主机上运行应用程序。相反,所述术语计算机程序在本文以一般意义使用,指任何类型的计算机编码(如软件或微码),能用于编程处理器以进行上面讨论的本文所提供的技术方面。应该理解与处理器存储于计算机可读介质上的数个本文所提供技术的实施方式一致,所述计算机实施的处理在其执行过程中可以接收手工输入(如来自用户)。因此,本文所述组装设备或组件的整体系统水平控制可以通过系统控制器进行,所述系统控制器可以提供控制信号给:相关的核酸合成器、液体处理设备、热循环仪、测序设备、相关的机械化组件,以及其他合适系统来运行所需的输入/输出或其他控制功能。因此,所述系统控制器与任何设备控制器一起形成控制核酸组装系统运作的控制器。所述控制器可以包含通用目的数据处理系统和其他相关设备,所述通用目的数据处理系统可以是通用目的计算机或通用目的计算机的网络,所述其他相关设备包含通信设备、调制解调器、和/或其他回路或组件,以进行所需的输入/输出或其他功能。所述控制器也能(至少部分)作为单个特定目的集成电路(例如,ASIC)或ASIC阵来实施,各有用于整体、系统水平控制的主要或中央处理器部分,和专用的分离部分以在中央处理器部分控制下进行多种不同特定计算、功能和其他处理。所述控制器也能使用多种分离的专用程序集成或其他电子回路或设备实施,例如硬连线电子或逻辑回路如分立元件电路或可编程逻辑设备。所述控制器也能包含任何其他组件或设备,如用户输入/输出设备(监控器、显示器、打印机、键盘、用户点击设备、触摸屏、或其他用户界面等)、数据存储设备、驱动马达、连接、阀控制器、机械化设备、真空和其他泵、压力传感器、检测器、电源供应、脉冲源、通信设备或其他电子电路或组件等。所述控制器也可以控制系统其他部分的运作,如自动化客户订单处理、质量控制、包装、运输、开票等,以进行本领域已知而本文没有详述的其他合适功能。本发明的各方面可以单独使用、联用或以前述实施方式未具体讨论的各种排列来使用,并且因此其应用并不限制于前面描述或附图说明所示组件的细节和排列。例如,一个实施方式的所述方面可与其他实施方式所述方面以任何方式组合。权利要求中修饰所提要素使用的顺序术语“第一”、“第二”、“第三”等本身并不暗指所提要素其一相对另一个的任何优先、居先或级别高低,或实行方法多个行动的时间顺序,而是仅仅用作标记把有某一名称的所提要素与有相同名称的另一要素(但是就顺序术语使用而言)区分开以区别所提的多个要素。而且,本文所用的词语和术语是为了描述目的,而不是限制性的。本文使用“包含”、“包括”、或“具有”、“含有”、“涉及”及其变化意味着涵盖其后列出的项目及其等价物,以及额外的项目。实施例图1显示任意选择的大约836bp长的双链序列的序列。选择60-bp的片段并且标记为1-28(片段1-14在正链上;片段15-28在负链上)。这些60-bp的片段从IDT(爱荷华州克拉威尔的集成DNA技术公司(IntegratedDNATechnologies,Coralville,Iowa))订购,具有以下的侧接序列:GTCACTACCGCTATCATGGCGGTCTC.....GAGACCAGGAGACAGGACCGACCAAACAGTGATGGCGATAGTACCGCCAGAG.....CTCTGGTCCTCTGTCCTGGCTGGTTT下划线的部分是BsaI-HF的识别位点,其产生4-碱基的突出端:5′...GGTCTC...3′3′...CCAGAG(N)5▲...5-BsaI-HF识别位点侧接有用于扩增这些片段的通用引物。也设计PCR引物A-E(图1中的虚线箭头)用于扩增正确的连接产物。图2以箭头显示引物的相对位置(“寡核苷酸A”到“寡核苷酸E”),并显示相应PCR产物的预期大小。双链IDT寡核苷酸在以下条件下进行BsaI-HF消化:-1XNE缓冲液4-加有100μg/ml牛血清白蛋白-在37℃下孵育。具有粘性末端的消化的双链寡核苷酸(寡核苷酸1-28)在4%胶上用电泳纯化。然后纯化的寡核苷酸1-28的各种组合进行连接反应。测试了几个不同的连接酶、温度和孵育时间来优化连接条件。测试的连接酶包括:T4DNA连接酶T4DNA连接酶+300mM盐(用于降低活性,较高的特异性)T3DNA连接酶T7DNA连接酶PfuDNA连接酶TaqDNA连接酶大肠杆菌DNA连接酶在室温下进行30分钟的示例性的结果示于图3-5。图3显示(两条寡核苷酸的)配对连接的电泳结果,胶从左到右是:梯标、无连接酶、T4DNA连接酶、T4DNA连接酶+盐、T3DNA连接酶、T7DNA连接酶。从胶的底部到顶部的条带分别对应于:游离的寡核苷酸、正确连接的产物、倍半体连接产物、连接产物的二聚体。T7DNA连接酶产生最多的正确的连接产物并且因此在这个实验条件下显示出最高的效率,其它都相当。图4显示寡核苷酸1-10(泳道1-6)和寡核苷酸11-14(泳道7-10)的连接结果,在胶的顶部标明不同的连接酶。观察到多个条带,表明不同连接产物的存在。然而,在使用寡核苷酸A和B作为引物的PCR扩增后,在约300bp处观察到强条带。因为来自寡核苷酸A和B的预期PCR产物是337bp(参见图2),这个条带对应于包含寡核苷酸1-6的正确的连接产物(参见图1)。从胶上切出条带、纯化并且测序。测序结果示于图6,证实连接产物与期望的序列相比有100%的保真度。TaqDNA连接酶未产生任何连接产物,可能是由于反应温度低(室温),因为TaqDNA连接酶仅在升高的温度(45℃-65℃)下有活性。进行配对的错配试验来测试各种连接酶的特异性。设计具有4-碱基突出端的寡核苷酸对,其中完美匹配(“P”)序列是GGTG而错配(“M”)序列是GCTG,其与正确的序列相差1个核苷酸。如图7A和7B所示,可以观察到两个主要条带,较低的条带对应于未连接的寡核苷酸(如无连接酶的对照所示),而较高的条带对应于连接产物。当使用完美匹配突出端时,T4DNA连接酶+盐、T3DNA连接酶、T7DNA连接酶和大肠杆菌DNA连接酶都产生对应于连接产物的强条带。相反,当使用错配突出端时,大多数的产物是未连接的寡核苷酸。这些实验显示在这些反应条件下,T4DNA连接酶+盐、T3DNA连接酶、T7DNA连接酶和大肠杆菌DNA连接酶都证明可高特异性并且区分小至1个核苷酸差异的错配。除了上述显示的具有寡核苷酸1-6连接产物以外,也产生了其它的连接产物,包括更长的产物。一个产物看来连接寡核苷酸1-6与寡核苷酸14。原因在于寡核苷酸7和14有相同的粘性末端(GTTC,图8中的框)这一事实。等同形式本发明提供了用于高保真基因组装的新方法和设备等。尽管讨论了本发明的具体实施方式,但以上说明书仅为说明性而非限制性的。本领域的技术人员在阅读本说明书后将清楚了解本发明的许多变化。本发明的全部范围应该通过参考所附权利要求书连同其等同物的全部范围,以及说明书连同此类变化来决定。通过引用纳入本文提到的所有发表物、专利和序列数据库条目在此通过引用全文纳入,就好像各个单独发表物或专利特定和单独地表明通过引用纳入。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1