大核酸的装配的制作方法

文档序号:571228阅读:315来源:国知局
专利名称:大核酸的装配的制作方法
技术领域
本发明涉及组合使用体外和体内装配步骤来装配大核酸分子的方法,以及多个重 叠核酸片段在酵母内的装配。本发明此方面涉及评估酵母用大量组分装配长DNA分子的能 力。
背景技术
现在人们已可以用自动分步合成法(automated step-wise synthesis)来合成适 当(reasonably)大的核酸分子。但此类方法的实用上限约为5_30 kb。本发明人所知的合 成的最长 DNA 序列是 Kodumal,S. J.,等 Proc. Natl. Acad. Sci. USA (2004) 101 15573-15578 所报道的32 kb的聚酮合成酶基因簇。很多令人感兴趣的核酸分子相当大,包括已知在纯培 养物中增殖的任何细胞中最小的基因组,生殖道支原体(M. genitalium)的基因组约为600 kb。迄今报导的完整合成的基因组只有病毒基因组,包括合成的脊髓灰质炎病毒(Cello, J.,等Science,(2003)297 1016-1018);用合成的寡核苷酸装配的φ X174噬菌体(Smith, H. 0.,等 Proc. Natl. Acad. Sci. USA (2003) 100 15440-15445);和 HCV (Blight, K. J.,等 Science(2000)290 1972-1974)。合成较大的DNA分子是有益的。这样做的一种用途是可以提供确定必需和非必需 基因的基础。另一种用途则可以构建天然不存在的完整合成基因组。本发明中使用了体外和体内装配方法。对体外装配方法的描述例如参见基于PCT/ US2006/031394 的 PCT 公开申请 WO 2007/021944 和基于 PCT/US2006/031214 的 PCT 公开申 it WO 2007/032837。在酵母体内重组也是已知的。目前酵母重组应用于构建质粒和酵母人工合成染 色体(YACs)。1987年Ma等人用共同转化的两段含同源区域的DNA片段构建了质粒。在 另一种叫做接头介导装配(linker-mediated assembly)的方法中,任何DNA序列都可用 桥连(bridge)多个末端的合成性短接头连接到酵母中的载体DNA上(Raymond,C. K.,等 Biotechniques (1999) 26 134-138,140-141 ;和 Raymond, C. K.,等 Genome Res. (2002) 12 190-197)。同样,可以装配四或五个重叠的DNA片段并连接到载体DNA上(Raymond,C. K., 等 Biotechniques(1999) 26 :134-138,140-141 ;和 Ebersol,Τ·,等 Nucleic Acids Res. (2005)33 el30),这表明(i)酵母细胞可以摄入多个DNA片段,而且(ii)同源酵母重组足 以有效地将所述片段正确装配为单一重组分子。之前的研究已经发现,可以将人基因组中相对大的节段(> IOOkb)克隆到
4环状酵母载体中,前提是该载体携带位于人基因组节段侧翼的末端60个bp的同源物 (homologies)( “钩(hooks)”) (Noskov,V. N.,等 Nucleic Acids Res. (2001)29 :E32)。另 外,如Marschall,P.,等Gene Ther. (1999)6 1634-1637所述已知酵母支持在线状着丝粒 酵母人工合成染色体(YAC)中的至少2Mb的DNA,且如Kouprina,N.,等EMBO Rep. (2003)4 257-262所述这已经用于克隆在大肠杆菌(E.coli)中不稳定的序列。人们也探索了其它生物体重组核酸片段的能力。Holt,R. Α.,等 Bioessays (2007) 29 :580_590提议用λ Red重组系统在大肠杆菌细胞中装配1830kb的 iJlt^Bf ilffS' (Haemophilus influenzae) ·@ 。 Itaya, Μ.,等 Proc. Natl. Acad. Sci. USA (2005) 102 :15971-15976 和 Yonemura, I.,等 Gene (2007) 391 171-177 已经开发了在枯 草芽孢杆菌(Bacillus subtilis)中装配大DNA节段的方法。通过每次加入一个重叠节段, 只有在分步加入亚片段(sub-fragment)后,才能在宿主生物体内构筑这些DNA分子。完整合成性生殖道支原体基因组的装配采用了组合方式,在早期阶段进行体外 酶重组,在最后阶段进行体内酵母重组,从而制成完整的基因组,本发明人对其的描述见 Gibson, D. G.,等 Science (2008) 319 :1215_1220。发明概述本发明一方面涉及装配大的(可选是合成的)核酸分子的方法,所述核酸分子基 于目的核苷酸序列或具有任意所需序列。所述方法方便地适用于任何包含大约50千碱基 对或更大的序列。通常,鉴定所需核酸序列,并用它作为设计所需核酸序列的构件(buildingblock) 的模板。该靶分子可包含天然存在的序列,或可由工作人员设计而成。设计代表了此序列 重叠节段的盒(cassette),来覆盖完整的所需序列。在优选实施方案中,设计的一些盒含 可用于鉴定的水印(watermark)序列。所述水印可以是非编码序列或是编码序列。通常, 水印位于已知耐受插入转座子的位置,从而使其对最后获得的所需核酸序列的生物作用最 小。所述盒一经设计就用常规技术合成或从天然来源获得,所述常规技术如用单个核苷酸 从头合成(denovo)序列。在本发明的一个实施方案中,在体外装配通常约为2-10kb的盒,例如用上述PCT 公开申请所述的技术,来获得所需核苷酸序列的亚序列(subset)。可进行几步体外步骤来 装配所需序列的越来越大的部分。以这种方式,就能获得含大小在IOOkb级别的序列的亚 序列。然后将所需序列的这些较大的亚序列引入要对它们进行重组和装配的宿主细胞。如 果必需,重复此步骤直至获得所需的大核酸分子。制备的合成核酸盒和亚序列形式可以是质粒、巨型质粒(megaplasmid)、合成染色 体如植物合成染色体、细菌合成染色体、哺乳动物合成染色体、酵母合成染色体、卫星合成 染色体(satellite synthetic chromosomes)、腊肠染色体(sausage chromosome)、巨型染 色体(gigachromosome)和大型染色体(megachromosome)。原核和真核的宿主细胞都考虑 用已公开的方法来使用,它们包括但不限于细菌宿主细胞如大肠杆菌,酵母宿主细胞如酿 酒酵母(S. cerevisiae)和昆虫宿主细胞如草地夜蛾(Spodoptera frugiperda)。因此本发明一方面针对合成所需核酸分子的方法,其包括a)提供多个盒,每个盒包含所需核酸的部分核苷酸序列,其中所述盒含有的所需 核酸分子的核苷酸序列有重叠部分,且其中所述盒如根据所述重叠部分组合,会得到所需核酸的完整核苷酸序列;b)体外组合所述盒来获得多个亚序列,其中所述亚序列含有的所需序列有重叠部 分,且其中所述亚序列如根据所述重叠部分组合,会得到所需核酸的核苷酸序列;和c)体内装配所述亚序列来获得所需核酸分子,其中所述装配体还包含复制起点。如上所述,可重复步骤b)和/或C),这取决于原始盒的大小及所需核酸分子的长 度。步骤c)的装配体应包含其它代表复制起点的核酸序列,还可包含着丝粒和/或选择标 记。它们可存在于分开的载体或多个载体上,或者可以包含在体内重组所用的一或多个亚 序列中。至少一些盒也可包含“水印”,其为异源DNA,用于鉴定装配的亚序列或所需核酸中的盒。在另一个实施方案中,利用了酵母或其它宿主细胞能够装配大量有重叠序列的核 酸片段的优势,从而可以在体内用很多盒装配成很大的核酸分子。由此,本发明另一个方 面涉及在宿主细胞中同时装配至少10个具有重叠序列的核酸片段的方法,该方法包括用 所述片段的混合物转化所述细胞的培养物,其中所述片段中包括编码复制起点(优选着 丝粒)的DNA,并培养所述宿主或转移了所述装配片段的另外的(alternative)复制细胞 (replication cell)。在一个实施方案中,所述片段中还包括选择标记。在此实施方案的变形(variation)中,所述片段中的两个在它们的末端之一含抵 御外切核酸酶活性的端粒序列。在此实施方案的另一个变形中,所述片段中包括在不同宿 主中可使用的复制起点。这些变形也可用于上述体外/体内步骤组合方法中的体内步骤。在体内重组方面,所述片段可以是双链的或单链的。双链片段通常为100-5X106 个碱基对,单链片段通常较短,但在40-1,000个核苷酸的范围内。所述片段大小的宽范围 应包括所有中间的整数值。当然所有片段不一定大小相同,或者甚至大小不一定在同一数 量级。因此本发明这方面涉及将10或更多种DNA片段装配成靶DNA分子的方法,该方法 包括(a)用含所述至少10种片段中每一种的足量拷贝的混合物转染宿主细胞培养物, 使所述培养物中每个细胞平均摄入的拷贝数为不同片段数目的至少约两倍,其中所述片段包含至少10个碱基对的重叠序列且其中所述重叠序列的排列方式使所述序列经过重叠能得到所需的装配顺序且其中所述片段中包括复制起点;(b)允许所述片段在所述宿主培养物中装配足够长的时间;和(c)选项(i)培养所述宿主以获得装配的核酸分子的足量拷贝用于回收,或(ii)从所述宿主提取DNA并转染另外的培养物,使该另外的培养物复制出所述装 配的核酸分子的足量拷贝用于回收。如果采用选项(i),复制起点就会是在宿主细胞中可用的(operable)复制起点。 如果采用选项(ii),那么复制起点必须与另外的培养物相容。如果采用选项(i),可选包 含着丝粒,因为缺乏它的结果仅仅是复制的DNA会积聚在单个细胞中而不会分散到子细胞中。确保复制的DNA分子分散到子细胞中并不是绝对必要的。另外可以包括选择标记。编码复制起点(和/或两个可选元件_着丝粒和选择标记)的DNA可以作为单独 的片段来提供(supplied),或作为待装配的一或多个片段的一部分来提供。另外,如下所解 释,可作为复制起点使用的DNA序列可能天然(indigenously)存在于待装配片段中,并不 必额外提供。可将DNA分子装配成环状装配体(assembly)从而使其抗外切核酸酶活性,或者两 个待装配片段可在每个的一个末端包含端粒,从而获得受端粒围护(bracket)的线状装配 体。在一些实施方案中,选择标记包含在片段中并于选择条件进行培养,本发明方法 还包括从原始培养物或另外的培养物中回收装配的DNA。可以从培养物或从单个细胞培养 的菌落(colonies)中回收装配的片段。根据本发明方法,尽管必须用10或更多种片段装 配至少一个靶DNA分子,多个DNA分子装配体可同时在同一细胞中起作用。所有上述特征也适用于上述体外/体内组合合成中的最终体内步骤。本发明其它方面涉及用本发明方法合成的不天然存在的合成大核酸分子。通常, 因为体内重组步骤至少需要包括在宿主细胞内可用的复制起点,所以方法的产物就是新 的。本发明还涉及细胞培养物,其包含用本发明方法合成的合成大核酸分子及使用这些培 养物的方法。


图1显示根据计算机模拟得到的整套25种DNA片段被(成功)摄入的概率相对 于每个细胞摄入的DNA片段数的图。图2是582,970bp的生殖道支原体JCVI-1. 0的合成基因组图。图3显示了生殖道支原体染色体的五步装配策略。图4A-4C显示了通过体外重组进行的盒装配。图5A-5D显示了 A,B,和C系列装配反应的选定实例及它们的克隆产物的凝胶电 泳分析。图6显示了对含非同源的3'和5' Not I序列的退火接头(junction)的修复。 在回噬(chew back)反应中去掉3' _GC核苷酸。在修复反应中,通过Taq聚合酶具有的 5' _外切核酸酶活性去掉5' -GGCCGC Not I突出端。图7A-7C显示了酵母TAR的克隆图及克隆子的特性。图8显示了完整装配的酵母TAR克隆的大小。图9是在酵母中构建生殖道支原体的合成基因组的示意图。图10A-10D显示了多重PCR分析,来筛选出转染了 25种DNA节段的酵母细胞。图11A-11C显示了用限制性分析验证完整无损的生殖道支原体基因组的准确性 的结果。图12A-B显示了对图11所检测的克隆1的进一步分析。

发明内容
本发明方法适用于灵活构建由于太大而不适于简单的体外构建的核酸分子。现在体外装配大于约300kb的核酸分子有问题。较大的片段虽可以装配,但需要在合适的宿主 细胞中重组,所述宿主细胞要既能重组有重叠末端的序列还能耐受2-10Mb或更大的大DNA 分子。 因此本发明一个申请涉及基于从生物体获得的遗传信息来构建合成的基因组或 基因组片段。可用源自完整基因组的遗传信息作为设计感兴趣的合成序列的基础。比如, 完整的哺乳动物染色体或其片段的核酸序列可以是人工制备的构建体的模板。多种生物 体的基因组序列是公众可获得的,可用于已经公开的方法。这些基因组序列包括但不限 于得自如下的信息敏捷气热菌/嗜热古菌(Aeropyrum pernix);根瘤农杆菌/根瘤土 壤杆菌(Agrobacteriumtumefaciens);鱼腥蓝细菌属/鱼腥藻属(Anabaena) ; R比亚按 岐(Anophelesgambiae);西方蜜蜂(Apis mellifera);风产液菌(Aquifex aeolicus);拟
(Arabidopsis thaliana) ; iXJj^t t 王求胃(Archaeoglobus fulgidus) ; (Ashbya gossypii);炭疽芽胞杆菌(Bacillus anthracis);蜡样芽胞杆菌/蜡状芽胞杆 胃(Bacillus cereus) MMM^Vi'M (Bacillus halodurans) ;iikHf包|干胃(Bacillus licheniformis);枯草芽孢杆菌;脆弱拟杆菌(Bacteroides fragilis);多形拟杆菌 (Bacteroides thetaiotaomicron) ;i^K/(Bartonella
henselae);五日热巴尔通氏体(Bartonella quintana);噬菌蛭弧菌/食菌蛭弧菌 (Bdellovibrio bacteriovorus);长双歧!flif (Bifidobacteriumlongum) ;Blochmannia floridanus ;支气管炎博德特氏菌(Bordetellabronchis印tica);副百日咳博德特氏菌 (Bordetella parapertussis);百日咳博德特氏菌(Bordetella pertussis);布氏疏螺 旋体(Borrelia burgdorferi);大豆t曼生t艮瘤菌(Bradyrhizobium japonicum);马尔他 布鲁氏菌/山羊布鲁氏菌(Brucellamelitensis);猪布鲁氏菌(Brucella suis);蚜虫 巴克纳氏菌(Buchneraaphidicola);鼻疽伯克霍尔德菌/鼻疽伯克氏菌(Burkholderia mallei);类鼻疽伯克霍尔德菌/类鼻疽伯克氏菌(Burkholderia pseudomallei); Caenorhabditisbriggsae ;秀丽 Hi 杆线虫(Caenorhabditis elegans);空肠弯曲杆菌 (Campylobacter jejuni)(Candida glabrata) ;Mit (Canisfamiliaris);
新月柄杆菌(Caulobacter crescentus);鼠型砂目艮衣原体(Ch 1 amydiamuridarum); 砂眼衣原体(Chlamydia trachomatis);豚鼠嗜衣原体(Chlamydophila caviae);肺 炎衣原体(Chlamydophila pneumoniae);參录硫菌(Chlorobium tepidum);青紫色素 ff 胃(Chromobacterium violaceum) ; ^ ^ |f| (Ciona intestinalis) ; M T II It 菌(Clostridium acetobutylicum);产气荚膜梭菌(Clostridium perfringens);破 伤风梭菌(Clostridium tetani);白喉棒状杆菌(Corynebacterium diphtheriae); Corynebacterium efficiens ; {白氏考克斯氏体(Coxiella burnetii);人疼急 f包子 虫(Cryptosporidium hominis);小球隐抱子虫(Cryptosporidium parvum);红 藻(Cyanidioschyzon merolae);狄逊德 EL 禾1J _ 母(Debaryomyces hansenii);而f fg 身寸奇异王求 lif (Deinococcus radiodurans) ;Desulfotalea psychrophila ;胃 ffl 月兑 Ij/li 弧菌(Desulfovibrio vulgaris);果 M (Drosophila melanogaster);兔脑炎原虫 (Encephalitozoon cuniculi) ; M Ml W-M (Enterococcus faecalis);古月萝卜软腐欧 文氏菌(Erwinia carotovora);大肠杆菌(Escherichia coli);核粒梭杆菌/核粒梭 菌(Fusobacterium nucleatum);原鸡(Gallus gallus);硫还原地杆菌(Geobacter
8sulfurreducens);紫色粘杆菌(Gloeobacter violaceus) ;Guillardia theta ;杜克 口f ifl ff (Haemophilusducreyi) ; ^ 胃口f ifl 木干胃(Haemophilus influenzae) ; 口f ff M / 4k ff M (Halobacterium);月干虫f、木干胃(Helicobacter hepaticus) ; ft n ii 旋杆菌(Helicobacter pylori);人(Homo sapiens) ;Kluyveromyces waltii ;约氏 乳杆菌(Lactobacillus johnsonii);植物乳杆菌(Lactobacillus pi ant arum);嗜 肺军团菌(Legionella pneumophila);木质部赖氏菌(Leifsonia xyli);乳酸乳球 菌(Lactococcus lactis);问号钩端螺旋体(Leptospira interrogans);无害李斯 特氏菌(Listeria innocua);单核细胞增生李斯特氏菌(Listeria monocytogenes); 禾S 痕菌(Magnaporthe grisea) ;Mannheimia succiniciproducens ;花中间原体 (Mesoplasma florum);百脉根中慢生根瘤菌(Mesorhizobium loti);嗜热自养甲烷杆 菌(Methanobacterium thermoautotrophicum);布氏拟甲焼球菌(Methanococcoides burtonii);詹氏甲;^王求菌(Methanococcus jannaschii);海沼甲;^王求菌(Methanococcus maripaludis) ;Methmogenium frigidum ;坎德勒氏甲烷嗜热菌/坎氏甲烷嗜热菌 (Methanopyrus kandleri);唾乙酸甲焼乂V叠球菌(Methanosarcina acetivorans);马氏 甲焼7V叠球菌(Methanosarcina mazei);荚膜甲基球菌(Methylococcus capsulatus); 小家鼠(Mus musculus);牛分枝杆菌(Mycobacterium bovis);麻风分枝杆菌 (Mycobacterium leprae);副结核分支杆菌(Mycobacterium paratuberculosis);结核 分支杆菌(Mycobacteriumtuberculosis);鸡败血支原体(Mycoplasma gallisepticum); 生殖道支原体(Mycoplasma genitalium);蕈状支原体(Mycoplasma mycoides);穿 透支原体(Mycoplasma penetrans);月市炎支原体(Mycoplasma pneumoniae);月市 支原体(Mycoplasma pulmonis);运云力支原体(Mycoplasma mobile);骑行纳古 菌(Nanoarchaeum equitans);脑膜炎奈瑟氏菌(Neisseria meningitidis);粗糖 链孢霉(Neurospora crassa);欧洲亚石肖化单胞菌(Nitrosomonas europaea);皮 疽诺卡氏菌(Nocardia farcinica) ;Oceanobacillus iheyensis ;洋葱黄化植原体 (Onionsyellows phytoplasma);禾§ (Oryza sativa);優漂猩猩(Pan troglodytes);出 血败血性巴氏杆菌/出血败血性巴斯德氏菌(Pasteurella multocida);黄孢亮毛伏 革菌(Phanerochaete chrysosporium);发光光杆状菌(Photorhabdus luminescens); 嗜酸耐热广古生菌(Picrophilus torridus);恶性疱原虫(Plasmodiumfalciparum); 约氏疱原虫(Plasmodium yoelii yoelii);毛果杨 / 三叶杨(Populustrichocarpa); 牙銀红掠色单胞菌(Porphyromonas gingivalis) ;Prochlorococcusmarinus ;痤疫 丙酸杆菌(Propionibacterium acnes) ;Protochlamydiaamoebophila ;绿月农假单胞 胃(Pseudomonas aeruginosa) ; mgUfi 胃(Pseudomonas putida) ;了 i^^Ufi 胃 (Pseudomonas syringae) ;Pyrobaculumaerophilum ;Pyrococcus abyssi ;激烈热球菌 (Pyrococcus furiosus);掘越氏热球菌(Pyrococcus horikoshii);烟孔火叶菌 / 烟孔热 球菌(Pyrolobus fumarii);青枯病菌/前青雷尔氏菌(Ralstoniasolanacearum);褐家 鼠(Rattus norvegicus) ;Rhodopirellula baltica ;沼泽红假单胞菌(Rhodopseudomonas palustris);康氏立克次氏体/斑疹热立克次氏体(Rickettsia conorii);斑疹伤寒立克 次氏体(Rickettsia typhi);普氏立克次氏体(Rickettsia prowazekii);西伯利亚立克 次氏体(Rickettsia sibirica);酿酒酵母(Saccharomyces cerevisiae);红色糖多孢菌(Saccharopolyspora erythraea) ; M^n / l^^n (Salmonellaenterica) ; it 伤寒沙门氏菌(Salmonella typhimurium);粟酒裂殖酵母(Schizosaccharomyces pombe); Shewanella oneidensis ;福氏志贺氏菌(Shigellaflexneria);苜蓿根瘤菌/苜蓿中华根 瘤菌(Sinorhizobium meliloti);金黄色葡萄球菌(Staphylococcus aureus);表皮葡萄 球菌(Staphylococcus epidermidis);无乳链球菌(Streptococcus agalactiae);变形链 球菌(Streptococcus mutans);月市炎链球菌(Streptococcus pneumoniae);化月农链球菌 / 酉良月农链球菌(Streptococcuspyogenes);嗜热链球菌(Streptococcus thermophilus); 除虫链霉菌(Streptomycesavermitilis);天蓝色链霉菌(Streptomyces coelicolor); 硫磺矿硫化叶菌 / 硫化裂片菌(Sulfolobus solfataricus) ;Sulfolobus tokodaii ;聚 球蓝细菌属/聚球藻属(Synechococcus);集胞蓝细菌属/集胞藻属(Synechocystis); 红鳍东方飩(Takifugu rubripes);黑青斑河豚(Tetraodon nigroviridis);假微型海 链藻/假矮海链藻(Thalassiosira pseudonana);腾冲嗜热厌氧杆菌/腾冲嗜热厌氧 胃(Thermoanaerobacter tengcongensis) ;^mW-^JMW (Thermop 1 asmaacidophilum) ;JJ(, 山热原体(Thermoplasma volcanium);细长嗜热蓝细菌聚球藻(Thermosynechococcus elongatus) ;Thermotagoa maritima ;嗜热栖热菌(Thermus thermophilus);齿柜密 !fli Ji! (Treponema denticola) ; _ _ lili M {本(Treponema pallidum) ;Tropheryma whipplei ;角军脲脲原体(Ureap 1 asmaurea 1 yticum);霍舌匕弧菌(Vibrio cholerae);畐lj 溶血弧菌(Vibrioparahaemolyticus);仓ij 伤弧菌(Vibrio vulnificus);魏格沃菌 (ffigglesworthiaglossinidia);尖音库蚊沃尔巴克氏体(ffolbachia pipientis);产琥珀 酸沃林氏菌(ffolinella succinogenes);地毪草黄单胞菌(Xanthomonas axonopodis);里予 油菜黄单胞菌(Xanthomonas campestris);昔养木杆菌(Xylella fastidiosa);角军月旨耳口氏 酵母(Yarrowia lipolytica);假结核耳口尔森氏菌(Yersiniapseudotuberculosis);禾口鼠 疫耶尔森氏菌(Yersinia pestis)。另外,对于现在还未公开的核苷酸序列,在那些序列可以获得时,本发明描述的方 法同样适用,所述序列包括表征(characterize)多细胞生物体的那些,所述多细胞生物体 如高等植物,如玉米和水稻,哺乳动物如小鼠、猪、母牛、和陪伴动物(companion animal)。 这些中的很多现在都可以获得了。浏览下面的实施例以及对于本发明方法的讨论之后,可以明显得知其应用不限于 构建模拟那些天然存在的基因组的合成基因组。可用工作人员所需的任何方式选择用于构 建较大DNA分子的初始盒。因此,同一个DNA分子中可包含多个生物体的基因组部分,或者 可采用盒的任意设计(arbitrarydesigns of the cassette)。获得原来的盒可以通过合 成、或从天然存在的DNA分离、或通过RNA的逆转录。根据此方法只装配单一代谢途径的多个成员或者装配多条代谢途径也是可取的。 可用此方式构建天然不存在的代谢途径。因此,存在于一个生物体中的酶在作用于缺乏一 种下游酶的不同生物体所产生的理想底物时,可以借助于构建编码这两种酶的装配体而在 同一生物体中编码。因此可以用多种酶来构建复合代谢途径。另外,制备组合文库可以通 过混合片段,其中的一或多个片段具有相同的重叠序列,而不是编码酶或其它蛋白质的不 同间插序列。可以组合方式构建遗传途径(genetic pathway),从而使组合文库中的每个成员都有不同的基因变体组合。例如,可以用30个单个DNA元件构建65个变体的组合文库,其 中装配了 5个片段,而且其中所述5个片段中的每个都有6个变体。在一个实施方案中,本发明方法采用了两步合成法。在第一步骤中,在体外连接反 应中装配了相对小的核酸分子。在上述PCT公开文献中公开的方法中使用了双链DNA;然而 这些方法及其它方法也可用于装配单链DNA。对于单链或双链DNA,除了这些方法,还可使 用等温法。在一种方式中使用了可以用于双链核酸的有效反应组合物。它利用了三种酶-T5 外切核酸酶、前进(processive)聚合酶和Taq连接酶。此系统的细节如下反应混合物包 含T-5外切核酸酶、Phusion 聚合酶、Taq DNA连接酶、合适的缓冲液如ISO缓冲液(Tris pH 7. 5,MgCl2,dNTP,s,NAD, DTT,PEG 8,000)及在等温条件于1小时或更短时间内出现的 装配体。可以冷冻此反应混合物,并通过将其加入寡聚片段,包括其双链形式,在50°C温育 10-60分钟来直接使用。使用此组合物的方法应用了双链核酸,因为T-5外切核酸酶回噬双 链的一条链来暴露重叠序列。在重叠的链退火后,Phusion 聚合酶和DNA连接酶起修复作 用。所述ISO缓冲液的常用浓度的组分为lOOmM Tris-Cl 5% PEG 8,000,10mM MgCl2, lOmM DTT, ImM NAD,禾口 200 ii M dNTP,s。在第二步骤,当已获得所需序列的较大亚序列时,应用体内重组技术。在有些情况 下,特别是在所述亚序列相对小的时候,可使用原核细胞。但连接较大亚序列时,优选真核 系统,特别是酵母。参照应用下述完整体内装配的候补实施方案,将详细讨论体内重组的特 征。多个DNA片段,通常是10或更多个DNA片段的体内装配,在下文的例子中用酵母 作为宿主培养物。然而,其它宿主可以代替酵母,如耐辐射奇异球菌。其它利于重组的生物 体也是已知的。另外,突变或缺失那些已知进行非同源连接(enjoining)的基因可能有好处。在 酿酒酵母中,这些基因包括Ku和DNA连接酶IV及Rad 50、Mrell和)Crs2。这会使不需要 的背景重组最少。因此对多个片段在酵母中的装配的证实仅仅是为了说明目的。本文定义的“密切 相关的(close)”培养物是向其中转染片段用于装配的培养物。“另外的(alternate)”培 养物指一类另外的生物体或细胞培养物,可以向其中转移装配的DNA用于进一步复制。体内重组的应用在酵母中举例说明,它为在单步有效装配步骤中装配多个DNA片 段提供了有效工具,因此在候补的实施方案中就不需要进行之前的体外亚序列装配操作。 此实施方案利用了酵母或其它宿主接受并重组多个片段、以及耐受并增殖此重组所产生的 大装配体的能力。体内装配适合装配多达10-500个片段。如下所述,已经成功装配了 25 个片段。所述的基本技术能装配50,75,100,200,300,400或500个这样的片段。所述待装 配的片段可以是双链的,包含100-5 X 106个碱基对或任何中间的值,包括200,500,1,000, 5,000,10, 000,100, 000或106个碱基对,或者可以是单链的,包含40-1,000个核苷酸或任 何中间的整数,如100或500个核苷酸。需装配的数目可取决于片段自身大小。如上述,不 是所有片段的大小都需要相同,或甚至不在同一数量级。因此,在一个混合物中的片段可能 处于各个不同的范围。可以耐受很大的装配体。可以在酵母细胞中装配任何大小的构建体,前提是亚片段能进入胞核,而且所构 建的DNA节段是完整正确复制的,并且对宿主细胞无毒。
11
所装配分子在酵母中的DNA复制取决于是否存在高度保守并必需的A元件或自主 复制序列(ARS)共有序列(5,-taTTTAtcagTTTta-3,)(综述见 Bell,S. P.,Curr. Op in. Genet. Dev. (1995)6:1634-1637)。统计学上,在所有4个碱基以同等几率出现时,在装配的构建 体的每 262个kb上应出现一次此序列。如上述,这些复制起点可自动存在于需要装配 的片段中,这样就不必特意提供特定的复制起点。在下述实施例4的说明中,这些元件会 在代表生殖道支原体基因组的片段中出现得更频繁(平均26. 9次,或每 16kb —次),因 为该基因组自身的A+T组成高。这个说法已经得到确认,因为在装配的基因组中出现了 20 例ARS共有序列,其中包括来自载体的两个ARS共有序列。这是一项重要的考虑因素,因为 170kb的缺乏有效复制起点的YAC已显示能引起酵母中的细胞周期关卡反应(checkpoint response)(van Brabant, A. J.,等 Mol. Cell(2001) 7 :705_713)。因此在酵母中可以装配大到5Mb至20Mb的装配体,本发明方法的体内部分提供了 机会用本发明方法装配6-1,000或中间数目的独立的DNA片段,从而装配出长达20Mb的序 列。无论宿主是哪一种,为了能够装配,待装配的片段必须在其末端包含重叠序列。在 一个实施方案中,重叠约为10bp ;在其它实施方案中,重叠可为15,25,50,60或8(^ 及此 范围内的所有整数。所有片段的重叠长度不一定相同。但为了避免错误装配,片段间的各 重叠应该不同。在装配的体内方法中,使用常用的转染技术,用所有待装配片段的混合物来转染 用于重组和装配的宿主细胞。混合物中片段分子的数目与培养物中待转染细胞数目的比例 必须足够高,以使至少一些所述细胞能摄入比混合物中不同片段数多的片段分子。如下实 施例对此进行了说明,当一份混合物含25种不同的片段,估计该混合物中存在足量的片段 分子时,则平均每个细胞会摄入至少40个片段;根据说明,1,000个细胞中约有1个会包含 25种不同片段的每一种。然而,通过提高摄入水平,平均每个细胞会摄入至少100个片段, 也就会有更高百分比的细胞会包含所有25种不同的片段。平均每个细胞摄入的数目越多, 每种不同片段都被摄入的概率就越大。因此,为装配10种片段,含足量片段分子数的混合物给平均每个细胞提供15-20 个片段是理想的;同样,如果一个实施方案中存在100种不同片段,提供的混合物浓度应足 以使平均每个细胞能摄入150-200个片段。为提供可行方法,待装配的片段中必须包括提供复制起点的DNA,可选并优选着丝 粒,还可选并优选选择标记。所述复制起点可能仅可用于初始细胞,或在可用于打算复制的 替换细胞种类,或者可使用穿梭载体来,比如在初始宿主中进行复制,随后在替换宿主如大 肠杆菌或芽孢杆菌中转染待装配的序列。在单一片段中包含所有这两个或三个元件是方便 的,但不必须包含。存在这些元件时,只有成功装配了序列的细胞才需回收。因为不受端粒 保护的线性DNA会被降解,只有装配的环状DNA或受端粒保护的装配DNA能进行复制。复制起点可由工作人员选择,其可包含在需要装配的一个片段中,或可包含在装 配体所包括的一个分开的载体片段中。但取决于片段的性质,可能并不需要补充的复制起 点,因为碰巧会存在用作片段自身原有复制起点的序列。事实上,真的存在这样序列的概率 相当高。存在着丝粒仅可保证复制的DNA会在复制过程中分布于亲代细胞和子细胞中。一些实施方案中,可允许多个拷贝的装配DNA保留在同一细胞中,并仍可有效回收。因此,尽 管优选存在着丝粒,但并不是完全必要的。同样,存在选择标记是可选的,其利于从那些DNA 已装配成环状或受端粒保护的细胞中成功回收转化体。一些实施方案中,如上述形成环状DNA。但其它实施方案中,可使其中的两个片段 带有端粒,从而装配出不被降解的线状分子,这样会更像酵母基因组。而且,选择标记有利 于鉴定出成功的菌落。—些实施方案中,单个宿主细胞中的片段不只形成单个靶DNA分子,还可产生多 个片段装配体。因此,比如在单个宿主细胞中就可以形成两个分别的产物,一个装配自10 个片段,另一个装配自5个片段,或者一个装配自20个片段而另一个装配自50个片段。一个实施方案中,成功装配了环状或受端粒保护的DNA序列的细胞在宿主中繁 殖,再从宿主培养物或从得自单个宿主细胞菌落的培养物中分离。在候补实施方案中,用片 段混合物处理宿主培养物短时间,约15分钟到2小时,然后提取总DNA并转染到另外的细 胞类型如大肠杆菌或芽孢杆菌中。此实施方案中,可使用含对替换细胞类型合适的复制起 点的载体。此实施方案有时会有利地缩短回收足量的装配DNA所需的时间,因为这些替换 细胞的增殖时间较短。例如,虽然自酵母获得足量装配分子用于分析需要2-3天,但大肠杆 菌的复制时间却可使回收在几小时内完成。在接受处理的培养物中,只有少量百分比的细胞需要摄入足够数目的片段并对它 们进行重组从而进行成功装配。那些失败的细胞不会出现在培养物中,因为没进行装配的 细胞中的DNA不会复制。如上所述,如果需要的话,在一些实施方案中也可包含选择标记, 这提供了其它的也可能是多余的方法,来限制提取DNA的细胞为具有所需构建体的那些细 胞。将多个DNA片段装配成单个环状的或受端粒围护的分子可以用于构建任何需要 的装配体。天然存在的基因组,如下文说明的生殖道支原体,可以此种方式装配,然后通过 合成来制备。备选基因组,如大肠杆菌的那些基因组,或其它基因组,如流感嗜血杆菌 (H. influenzae),可用此种方式来装配。分离基因组并在初始宿主中复制它可能会很简单, 这是因为宿主具有装配多片段的能力,所以不需从生物体中完整提取所述基因组。装配不 好的形式会自动含有再装配所需的重叠序列。在装配了足够的DNA分子后,可以从宿主或替换宿主的细胞培养物中分离它们。 可使用常用的分离技术,这些技术是本领域公知的。“分离”指的是DNA存在于其天然环境 之外。因此,从这个角度说,即使是培养物中包含的再装配的DNA(已被迫再装配)也是“分 离的”。但从这些细胞回收所述DNA可能是理想的,因为可进一步操作装配的DNA,或者在其 它细胞,包括哺乳动物、植物或昆虫细胞中培养它。如上所述,测定转染宿主细胞培养物如酵母所必需的片段浓度由经验决定。需要 大量细胞来确保足量细胞能摄入适当的片段数目,并且必须提供足量片段来实现摄入。针 对下文实施例4已实现的对25个片段的装配,如下进行举例性质的说明根据说明,单个宿主细胞必须摄入25种DNA片段中每一种的至少一个片段,来装 配出25种片段的完整装配体。如果一个细胞随机摄入恰好25个片段,它摄入每一种片段 的概率很低,为25! /2525 = 1.7X 10,。因此理想的是平均每个宿主细胞基本摄入25个以上的片段。如果宿主细胞随机摄入N >25个均勻分散的(equally represented)片段, 那么获得所有25种不同片段的概率是多大?对这个版本的“收集者问题(collector’ s problem) ”的答案在整个概率范畴内都很难计算(Feller,W.,An Introduction to Probability Theory andlts Applications (1950)ffiley,New York);但可以通过计算机模 拟很容易地获得大概的答案,如图1所示,其中Y轴表示成功概率,X轴表示宿主细胞摄入 的拷贝数。为了获得这个图,从一袋25个对象(DNA片段)作N次抽签(draw),每次抽签后 替换对象。如果所有25个对象都至少被抽到一次,则试验是成功的。对每个N进行一百万 次试验,来获得真实成功概率的最近似值。图1显示如果一个细胞摄入 90个片段,它有 约50%几率摄入所有25种不同片段。如果IO8个宿主细胞接触到DNA,即使平均每个细胞 仅摄入40个片段,1,000个细胞中约有1个也会摄入一整套的片段。人们尚不了解酵母及其它装配宿主摄入并装配DNA的效率。如果重组很高效,那 么一群细胞中只需有几个摄入一整套重叠片段即可。如果效率低,那么相对较多的细胞需 要摄入整套片段。用本发明方法可装配任何任意大的DNA分子。一个特别有用的用途是装配来自 微生物的基因组。一个用途中,待装配的序列可包含生物体整个基因组或其部分的核苷酸 序列。用公开方法装配的核苷酸序列可得自任何生物体,无论是原生生物(Protista)、古 细菌(Archaebacteria)、真细菌(Eubacteria)、真菌(Fungi)、植物(Platae)、还是动物 (Animalia)。已公开的方法也应该可用于病毒基因组的序列信息。在体外/体内组合合成法或全体内重组合成法中所用到的“盒”指含所需靶核酸 分子序列的部分的起始核酸分子,它是自单个核苷酸合成的,或者通过限制性消化基因组 DNA分级分离(fractionation)得自生物体自身的基因组,或者得自从生物体mRNA逆转录 得到的cDNA。最初的盒常在2-10kb的范围,可以是所有中间的值,优选在大约5kb的范围。 这些盒也可用较小的寡核苷酸连接来进行装配。通常,盒是双链的,但单链盒也可使用。术 语“盒”也包括初始盒的其它得自体外连接法的组合。通过体外连接所需序列的初始部分 而获得的盒通常大小在约15kb到约200kb的范围,及所有中间的整数值。这些装配体可以 称为“盒”或“亚序列”,其中“亚序列”指所需靶核酸分子序列的亚序列;这指的是用于体外 /体内法中的体内重组的片段。“亚序列”指的是盒的装配体,其大小适用于体外/体内法中的体内重组。它们可 以是单链或双链。取决于靶核酸分子的大小,这些亚序列常在50-500kb的范围,可以为这 些极值间的整数值。因此,本发明方法的这个实施方案由最初的盒开始,通过对其进行装 配,得到随后在体内装配的“亚序列”。体外将盒装配到约75-200kb的大小,然后在体内对 此大小的亚序列进行进一步装配,这虽然方便但并不必须。如下实施例1-3所述,基于生殖道支原体G37制备完整的生殖道支原体JCVI-1. 0 染色体,并用TARBAC克隆载体在酵母中增殖。此构建体比原来报道的DNA合成产物大 一个数量级以上。可将此染色体安装到接受的支原体胞质内来制出活体的“合成”细胞 (Lartigue, C.,等Science (2007) 317 =632-638)。合成的染色体在耐受转座子插入的基因 间位置包含五条短水印序列,期望这些插入不会影响活力。在基因MG408上也有一个插 入来除去致病性,合成的基因组携带氨基糖苷(aminoglycoside)抗性基因,可用于移植 (transplantation)试验中的选择。因为这个插入恰好存在于活的生殖道支原体菌株上,期
14望它不会影响活力。当装配体变得越来越大,体外步骤的有效性就会降低。这可能是由于形成了多联 体,它可能在反应中比环状优先形成。另外,大的细菌合成染色体(BAC’s) ( > IOOkb)转化 得不太有效。Sheng,等发现在相同的受体大肠杆菌菌株中,240kb的BAC转化效率比80kb 的 BAC 低 30 倍(Sheng,Y.,等 NucleicAcids Res. (1995)23:1990-1996。在下文的实施例2和4中,采用了体内酵母重组。在实施例2中,高效装配重叠片 段,每个重叠片段末端都有与相邻片段同源的80bp同源物,然后通过酵母中的转化相关重 组(TAR)机制连接到重叠的载体DNA上。两个四分之一部分的生殖道支原体基因组可高效 克隆为酵母载体中的半个基因组,更令人惊讶的是,四个四分之一部分的生殖道支原体基 因组可重组并克隆为完整基因组。构建合成染色体并成功转移到支原体物种中,是利用合成遗传方法制备最小细胞 (minimal cell)的第一步。盒式(cassette-based)装配策略利于构建最小细胞。可以从 单个盒中缺失公知(putative)可以分离的基因。之后可以装配天然的和经过缺失的盒的 混合物。此方法会产生文库,其各个成员包括完全天然的到大范围缺失的基因组。将基因 组文库移植到受体支原体可产生很多新的活变体。然后可以通过对植入的基因组DNA作凝 胶电泳来选出最小的基因组,研究它是不是较小的(reduced)或可能是最小的基因组。生殖道支原体JCVI-1. 0是个小基因组,其特定利用终止密码子UGA产生色氨酸。 这使得在大肠杆菌及其它生物体中进行克隆的毒性较低,因为大多数生殖道支原体蛋白质 都会被截短。如果其它构型使用了此密码,就需要在胞质中进行移植来制备合成细胞将UGA 适当翻译成色氨酸。只要存在适当利用密码子的受体胞质,可能就可以使用其它的密码子 改变。如下实施例中,研究对象要制备出克隆的582,970个碱基对长的合成基因组,其 序列与所设计的完全一样。这是艰巨的,因为实际序列同设计序列间的差异(错误)会以 多种方式产生,包括制备盒的序列出现错误,制备的盒出现错误,或在修复装配体接头时出 现错误。大肠杆菌或酵母装配体的增殖也会导致错误。后两种情况中,错误在装配的晚期 发生。因此,要在装配中的多个时间点(points)审慎地测定基因组装配体克隆的序列。在 下述实施例中,会发现上述的各种错误,但错误数量很少,而且它们都被成功纠正了。比如,在核实下述C50-77 1/4分子的序列时,就检测出缺失了两个碱基对。一 个缺失经回顾发现是盒54的合成错误。盒68出现错误是因为把不正确的序列传送到了 该盒的合成仪上。盒54的错误用合成仪进行了纠正。盒68的错误通过用新合成的片段 替换错误的限制性片段进行了纠正。重新装配了 C50-77并测序。两个错误都得到了纠 正,但又出现了两个新的碱基替代错误。其中一个错误可能是由于Taq聚合酶错误地掺入 (misincorporation) 了接头区(joint region)而导致。另一个目前仍无法解释,有可能是 在大肠杆菌中增殖时产生的。最后的重装配体具有了正确的C50-77序列,将它用来装配整 个染色体。准备工作A确认生殖道支原体基因组的序列对生殖道支原体G37基因组的测序最初是在1995年。但因为发现序列中的错误 会使合成的基因组无活力,所以分离并再次测序了该基因组。测得的序列与原来的序列有 34处不同。参见Glass,J. I.,等PNAS (USA) (2006) 103 :425_430。修订的序列准确反映了有活力的生殖道支原体G37的基因组。如下实施例是为了说明而不是为了限制本发明,它们详细描述了生殖道支原体完 整基因组的合成过程。在实施例1-3所介绍的组合体外/体内合成中,对合成的综述可概 括如下此合成的582,970bp生殖道支原体JCVI 1. 0基因组含有野生型生殖道支原体G37 的除MG408之外的其它所有基因,破坏MG408是为了阻断致病性。该基因组也在已知耐受 转座子插入的基因间位点包含添加的“水印”序列,用于鉴定该基因组是合成的基因组。它 还包含抗生素抗性标记物来对其进行选择。从化学合成的寡核苷酸装配的5-7kb的重叠 “盒”,经体外连接制备出 24kb、 72kb (“基因组的1/8”)、和 144kb (“基因组的1/4”) 的中间阶段的装配体,这些装配体都克隆为大肠杆菌内的细菌合成染色体(BAC)。测序大多 数这些中间阶段的克隆,鉴定出序列正确的所有四个1/4基因组的克隆。通过在酿酒酵母 中作转化相关重组(TAR)克隆来装配完整的合成基因组,然后分离并测序。鉴定出序列正 确的克隆。也可分离此合成的生殖道支原体基因组。图2显示的是合成基因组。显示的特征包括水印和氨基糖苷抗性标记物,有活力 的Tn4001转座子插入点位置,包含整个基因组序列的重叠、合成性DNA盒的位置,485个生 殖道支原体蛋白编码基因的位置,和43个生殖道支原体的rRNA、tRNA及结构性RNA基因的 位置。图3用示意介绍了整个计划。在装配的第一阶段,将4个盒连接制成A系列装配 体,长度约为24kb。在下一阶段,将3个A装配体拼为总共八个约72kb的B系列装配体。 一次取2个1/8基因组的B装配体,制成1/4基因组的C系列装配体。这些装配体全都是 通过用BAC载体体外重组并克隆到大肠杆菌中制成的。半个基因组和全基因组的装配体是 通过体内酵母重组制成的。测序粗体框中的装配体以验证它们是正确的。在第一阶段,将4个相邻盒的组通过如下所述的体外重组进行装配,并连接到BAC 载体DNA上形成带有 24kb插入子的环状重组质粒。例如,将盒1至4连接形成A1-4装配 体,将盒5至8装配形成A5-8,以此类推。将盒40和41合并形成标记为41*的单个盒,由 此101个原来的盒就减少成为100个,得到25个A系列装配体。在第二阶段,25个A系列 装配体每次取3个,制成B系列装配体。例如,用Α1-4、Α5-8和A9-12构建Bl-12。B62-77 是个例外,它是用5个A装配体制备的。这使25个A装配体减少为只有8个B装配体,每 个大小为基因组的约1/8 ( 72kb)。在第三阶段,一次取2个占基因组1/8的B装配体来 制备4个C装配体。每个大小约为基因组的1/4 ( 144kb)。前三个阶段的这些装配体是 通过体外重组制备的,并克隆到大肠杆菌中。实施例1体外装配生殖道支原体的部分基因组将天然的580,076kb生殖道支原体基因组序列(生殖道支原体G37ATCC 33530基 因组序列;登录号 L43967(Glass,J. I.,等 PNAS (USA) (2006) 103 425-430)分割为 101 个长 度约为5-7kb的盒,分别合成并进行测序。通常在基因间设置盒边界,以使每个盒含一或多 个完整基因,使得未来在各个盒中缺失或操作基因变简单。大多数盒与它们相邻的盒重叠 SObp ;但一些节段的重叠长达360bp。盒101与盒1重叠,从而完成环。将短“水印”序列插入盒14,29,39,55和61的已知耐受转座子插入的基因间位点, 以使合成的基因组区分于天然基因组。另外,在基因MG408中插入的包含氨基糖苷抗性基因的2,520bp(msrA)位于盒89。已显示有此毒力因子特异性缺陷的菌株不能粘附于哺乳动 物细胞上,由此从最好获得的模型系统中去除了致病性。用GENEART (Regensburg, Germany) 合成此盒。带所有上述插入子的合成基因组的大小为582,970bp。用Blue Heron Technology (Bothell,WA)合成盒 1 至 31、盒 36 至 39、盒 52 至 88 以及盒90至101,核实它们的序列。以重组质粒DNA和携所述重组质粒的大肠杆菌克隆的 形式提供所述盒。每个盒都配有序列、追踪信息及用于测序的引物。用Type IIS限制性酶 可将所述盒从它们的载体DNA上切割释放出来。用DNA2. O(Menlc) Park, CA)制备盒32至 35和盒40至51。从已用Not I切割的A系列克隆构建八个B系列装配体。通常不需从切割的载体 DNA中凝胶纯化插入子,因为它们没有互补的突出端,因此在随后反应中是无活性的。一次 取3个A装配体制备B装配体,B62-77是个例外,它是用4个A装配体构建的(图3)。如 图3所示,用2个1/8基因组的B装配体构建一个ι/4,基因组的C系列装配体,共构建4个。 鉴定大小正确的克隆、核实序列并储藏于-80°C。用合适的Type IIS限制性酶切割携各个盒DNA插入子的重组质粒,释放插入的 DNA。在用苯酚-氯仿提取并用乙醇沉淀后,不需去除载体DNA就可以使用所述盒。如图3 说明,通过体外重组反应,在存在BAC载体DNA时,一次装配4个所述盒。反应的步骤是一 开始用3'-外切核酸酶消化重叠的DNA分子,暴露出重叠,然后使互补的重叠退火,修复接 头。为了说明,通过混合等摩尔量的4个盒的DNA及带有盒66和69的末端重叠体的 线状BAC载体,来构建装配体66-69。为了产生重叠,用位于BamHI克隆位点旁的引物通过 PCR扩增BAC。引物66 (68bp)在BamHI位点右侧与载体重叠20bp,然后是Not I位点,然后 与盒66的前40bp重叠。引物69(68bp)在该位点左侧与载体重叠20bp,然后是Not I位 点,然后与盒69的最后40bp重叠。然后消化双链(duplex)载体和盒DNA的混合物的3, 末端,在无dNTP时用T4聚合酶暴露重叠区。通过在75 °C温育来灭活T4聚合酶,之后慢慢 冷却来使互补的重叠区域退火。用Taq聚合酶及Taq连接酶,于45°C在存在所有四种dNTP 和烟酰胺腺嘌呤二核苷酸(NAD)时,修复退火的接头。如图4A所示,在无dNTP时用T4聚合酶的3'-外切核酸酶活性从四个盒DNA (66 至69)的3'末端消化,直至足以暴露与相邻片段重叠的区域(80bp)。在75°C灭活T4聚合 酶,再通过缓慢冷却来使互补的重叠退火。然后在另一分开的反应中用Taq聚合酶和dNTP 修复装配体,填平缺口,用Taq连接酶关闭切口(nick),制成共价的装配体。如图4B所示, 用两个引物通过PCR扩增制备用于装配反应的BAC载体,所述引物各与BamHI克隆位点的 一侧重叠20bp,之后是Not I位点,然后与盒66或盒69有40bp的重叠。在图A的装配反 应中包含经凝胶纯化后的线性扩增产物,使所需的装配体成为含所述4个盒及BAC DNA的 环状DNA,如图C所示。如图5所示,对装配反应的样本进行倒转电场凝胶电泳(FIGE)来评价装配是否 成功。在图A中,在MJ-Research PTC-200热循环仪中,于250 μ 1 PCR管内,其中含有5% PEG-8000,200mM Tris-Cl pH 7. 5, IOmM MgC12, ImMDTT, 100 μ g/ml BSA,4. 8U 的 T4 聚合 酶(陬8),盒66,67,68,和69各150叫,以及150叫BAC66-69 DNA,进行Α66-69的回噬装 配(chew-back assembly, CBA)反应(80 μ 1)。在 37°C温育 5 分钟,在 75°C温育 20 分钟,以-6°C /分钟冷却至60°C,维持30分钟,然后以_6°C /分钟冷却至4°C再维持。修复(TRB) 反应体系(40 μ 1)含10 μ 1的回噬反应体系,40 U Taq DNA连接酶(NEB),1. 2UTaq DNA聚 合酶(NEB),5%PEG-8000,50mM Tris-Cl pH 7. 5, IOmM MgC12, IOmM DTT,25y g/ml BSA,每 种dNTP 200 μ M和ImM NAD。在45°C温育15分钟。将5 μ 1 CBA反应体系样本和20 μ 1 TRB 反应体系样本上样到0. 8%E-gel (Cat. No. G5018-08,BioRad),用U-5程序(2)进行3小时 FIGE0用Gel Doc (BioRad)观察DNA带。DNA大小的标准品为Ikb延伸梯带(extension ladder) (Invitrogen Cat. No. 10511-012)。图B显示了如图A所述进行的B50-61的装配反应。A50-53,A54-57,和A58-61 DNA的量约为每种450ng。BAC50-61 DNA为150ng。对CBA反应体系样本如图A进行分析。图C显示了如图A所述进行的C25-49的装配反应。各使用了约300ng、250ng、和 60ng的凝胶纯化的B25-36,B37-49,及BAC25-49 DNA。将10 μ 1的CBA反应体系样本上样 到 BioRad "Ready Agarose Mini Gel (目录号 161-3016),于 23°C在 Hoeffer HE33 微型 水平潜艇电泳托盘(mini horizontal submarine electrophoresis tray)中进行 14 小时 FIGE (U-9程序(2)),电泳使用的是含0. 5 μ g/ml EtBr的1 X TAE缓冲液并且无循环。DNA 大小的标准品为低分子量范围(low range)Pi7G标记物#N0350S (NEB)。用Typhoon 9410荧 光成像仪(Fluorescence Imager) (Amersham)以激发波长532nm和发射波长610nm观察电 泳带。图D显示了如图C所述用U-9程序通过FIGE测定的经Not I切割的装配体的大将其它样本电穿孔至DHlOB(InvitroGen), EPI300 (Epicentre),和 / 或 Stbl4 (InvitroGen)细胞中,涂于含12. 5 μ g/ml氯霉素的LB琼脂平板上。菌落在24到 48小时后出现。挑取菌落,在3ml含氯霉素的LB肉汤中过夜培养。用碱裂法从1. 5ml培养 物中制备质粒DNA。然后用Not I切割DNA并通过FIGE分析核实这些装配体的正确大小。 将大小正确的克隆冻于含15%甘油的LB培养基中,储藏于-80°C。测序一些经过克隆的装 配体来确保图3粗体框所示的合成是准确的。将25个A系列装配体和所有较大的装配体克隆到Epicentre的pCClBAC载体中。 pCClBAC克隆可以单拷贝水平在EPI300细胞中增殖,然后根据Epicentre方案诱导到每个 细胞10个拷贝。经诱导的100ml培养物产出最多200 μ g的质粒DNA。BAC中的装配体插入 子的每侧紧挨着Not I位点,从而通过切割可以高效产出在其每个末端连有部分Not I位 点的插入子DNA (生殖道支原体基因组无Not I位点)。当将侧翼有Not I的装配体用于较 高级的装配时,通过回噬反应去掉Not I位点的3'部分(2个核苷酸)。退火后Not I位点 的5'部分产生6个核苷酸的突出端,但如图6所示,在修复中通过Taq聚合酶的5'-外 切核酸酶活性会去除该突出端。实施例2酵母体内重组如上述,半个基因组的克隆不会通过体外重组方法在大肠杆菌中增殖。甚至 C78-101克隆都难以维持,仅Stbl4 大肠杆菌细胞例外。因此,用酿酒酵母作为克隆宿主。构建线状YAC克隆通常是通过将插入子连接到限制性酶切克隆位点(Burke, D. Τ.,等Science,(1987) 236 :806_812。对此方法的改进是使重叠的插入子和载体DNA共 转化到酵母的原生质球中,在那里,它们通过同源重组来连接(图7A)。这会产生环状克隆,称为 TAR 克隆(Larionov,V.,等 Proc. Natl. Acad. Sci. USA (1996) 93 :491_496)。TAR 克隆, 如同线状YAC —样,含有着丝粒,因此维持与天然酵母基因组相伴的染色体拷贝数。TAR克 隆的环状特征使它们可以容易地与线状酵母染色体分离。图7A显示了用于TAR克隆的载体。其包含BAC和YAC序列(按比例显示)。载 体与插入子的重组出现在通过PCR扩增添加到TARBAC的“钩”上。酵母复制起点(ARS)可 使克隆增殖,因为生殖道支原体基因组中不存在ARS样序列(Newlon,C. S.,等Curr. Opin. Genet. Dev. (1993) 3 :752_758)。酵母中的选择是通过弥补宿主菌株中的组氨酸营养缺陷型 来进行。BAC序列可使从酵母纯化的克隆有效电穿孔到大肠杆菌中。为在酵母中将1/4基因组装配至半个基因组和整个基因组,使用pTARBAC3载体 (Zeng,C.,等 Genomics (2001) 11 :27-34)。此载体含 YAC 和 BAC 序列(图 7A)。用类似于上 述对BAC载体应用的策略来制备载体。通过PCR扩增用引物在末端产生重叠,所述引物与一 段1/4基因组内的单切限制性位点的任一端有60bp重叠,随后是Not I位点及来自载体末 端的20bp。将该载体插入第三个1/4基因组C50-77的基因间BsmBI位点。在TAR克隆过 程中,在双链断口 (break)的重组受刺激增强约20倍(Leem, S. H.,等nucleicAcids Res. (2003)31 :E29。待转化的DNA有6个片段(载体,第3个四分之一基因组(quarter)的2 个片段,和第1,2,和4个四分之一基因组)。为获得插入PTARBAC3中的全长基因组,单个 酵母细胞必须摄入所有6个片段,并通过同源重组来装配它们。图7B显示了生殖道支原体JCVI-1.0 1/4基因组的装配。从大肠杆菌纯化它们, 经Not I消化,与TARBAC载体混合来共转化到酿酒酵母中,其中在60_264bp的重叠区处的 重组将这六个片段组合为一个克隆。将此TARBAC插入C50-77中的BsmBI位点。用公开方法转化酵母细胞(Kouprina,N.,等 Methods Mol. Biol. (2006)349 85-101)。自过夜培养物收获酵母细胞,然后用水再用IM山梨醇清洗。在有IM山梨醇时用 Zymolyase 和β -巯基乙醇处理将细胞转变为原生质球。所述原生质球用山梨醇清洗,重 悬于含山梨醇和CaCl2的缓冲液中。将等同于5ml原始酵母培养物的原生质球以200 μ 1的 体积与IOng载体和每种1/4基因组各120ng在室温温育10分钟。然后加入800 μ 1的20% 聚乙二醇(PEG) 8000 (US Biochemicals),继续温育10分钟。在富集培养基(rich medium) 中回收后,在30°C于无组氨酸的山梨醇平板的顶层琼脂上选出转化细胞。先用PCR然后用 Southern印迹筛选转化体(图7C)。图C中,最初用PCR筛选TAR克隆。然后通过Southern印迹鉴定出对所有插入 片段的扩增都呈阳性的克隆。在琼脂糖块(Plug)中制备酵母总DNA(每个都按照BioRad CHEF DRIII手册方案)I消化将载体与生殖道支原体序列分开,用脉冲场凝胶电 泳(Bio-Rad CHEF DRII 或 DRIII)分辨,真空转移(BioRad Model 785 Vacuum Blotter) 至Amersham Hybond-N+膜,用在九个生殖道支原体MgPa重复区内杂交的洋地黄毒苷 (digoxigenin)标记(Roche)的两个PCR产物的混合物作探针来探测,用抗洋地黄毒苷AP Fab片段随后用荧光底物HNPP(Roche)来检测。所需克隆显示出一条带,其大小与从天然 生殖道支原体基因组的琼脂糖块分辨出的染色体大小相同。这里显示的是经脉冲场电泳测 序的最终得到的克隆的更具体的消化分析结果。各泳道(lane)如下1)低分子量范围脉 冲场凝胶标记物(NEB),2)宿主酵母菌株 VL6-48N(Larionov, V.,等 Proc. Natl. Acad. Sci. USA(1997)94 :7384-7387,未经消化,3)天然生殖道支原体Δ MG408 (尽管此基因组是环状的,琼脂糖块中的部分分子破裂了,这些线状分子以约600kb的大小泳动,为TAR克隆提供 了大小标记物和印迹信号的对照),4)未经消化的酵母菌株sMgTARBAC37,和5)经Not I消 化的酵母菌株sMgTARBAC37。第4泳道显示出克隆的拓扑结构为600kb的环状,它因太大而 不能在凝胶中泳动。小部分的克隆破裂了,这些线状分子可以检测到微弱的印迹信号。第 5泳道是经Not I消化的样本,它显示出插入的生殖道支原体DNA与TARBAC载体分离后的 大小。通过对亚克隆进行进一步的Southern印迹来测试PCR和Southern印迹阳性克隆 的稳定性。通过这两个试验发现,约10%的转化菌落携带完整的合成基因组。选这些克隆 之一 sMgTARBAC37 测序。也对由两个相邻的1/4基因组组成一套、一共四套中的每一套,以及第1到第3个 四分之一基因组,进行TAR克隆。分离来自这些不同试验的转化体的DNA并电穿孔至大肠 杆菌中(Silverman,G. A. ,Methods Mol. Biol. (1996)54:65-68)。用这种方式,我们获得了 BAC克隆,根据其大小预测是Dl-49,D50-101,还获得了装配体,根据其大小预测是25-77及 1-77。从中选出D1-49测序,其序列是正确的。棚列3入人_■☆成■賺棚本細體■人·歹丨丨根据针对酵母的Bio-Rad CHEF手册方案,从在30°C生长到OD 0. 5的1.5L CM-HIS 培养物中制备sMgTARBAC37的琼脂糖块。清洗所述块,在IXNEB缓冲液4中透析,然后在 37°C与限制性酶Rsr II、Fse I JPAsiS I (它们只切割酵母不切割sMgTARBAC37)温育过 夜。用琼脂糖凝胶电泳(4. 5V/cm,2小时)从块中去除消化后的线状酵母DNA。在这些条件 下,完整的环状SMGTARBAC37DNA会保留在块中。为了评价该sMgTARBAC37DNA的大小和纯 度,将一个块与Not I温育,通过电泳分析此块内的DNA。用SYBR金染色凝胶。图8显示了经Not I消化约590kb大小的带,但未经消化的对照没有显示出带。用 剩余块的DNA来制备测序文库。测序sMgTARBAC37DNA的X覆盖度(coverage),确认它同设 计的一样。实施例4在酵母中装配25种DNA片段所用的DNA片段是生殖道支原体基因组的重叠部分,对其的详细描述见Gibson, D. G.,等 Science (2008) 319 :1215_1220 (见上文)。A.制备A系列装配体将表1所示的25种A系列装配体中的每一个包含在 pCClBAC 中,并在EPI300 大肠杆菌菌株(Epicentre ·)中增殖。表1构建生殖道支原体JCVI-1. 1合成基因组所用的25种A系列装配体的概述装配体Jr .K释放载体所需5’末端与相邻3’末端与相邻的消化装配体的重叠量装配体的重叠量A1-423,636 bpBsmBI80 bp80 bpA5-826,166 bpNotI80 bp80 bpA9-1223,872 bpBsmBI80 bp80 bpA13-1623,653 bpSail 和 NotI80 bp80 bpAl 7-2023,312 bpNotI80 bp80 bpA21-2423,211 bpNotI80 bp80 bpA25-2824,992 bpNotI80 bp80 bpA29-3226,257 bpNotI80 bp209 bpA33-3620,448 bpNotI209 bp80 bpA37-4125,706 bpNotI80 bp257 bpA42-4519,223 bpNotI257 bp257 bpA46-4919,895 bpNotI257 bp257 bpA50-5324,390 bpNotI257 bp80 bpA54-5724,789 bpNotI80 bp80 bpA58-6124,534 bpNotI80 bp80 bpA62-6525,055 bpNotI80 bp80 bpA66-6923,128 bpNotI80 bp80 bpA70-7323,345 bpNotI80 bp80 bpA74-7721,396 bpNotI80 bp165 bpA78-8122,320 bpNotI165 bp360 bpA82-8523,460 bpNotI360 bp85 bpA86-89 变体 34,950 bpNotI85 bp80 bpA90-9323,443 bpNotI80 bp80 bpA94-9724,511 bpNotI80 bp80 bpA98-10117,372 bpNotI80 bp80 bp使用了不同于公开描述的A86-89变体,其在非必需基因中插入了载体。该载体含 组蛋白缺陷型标记,着丝粒和复制起点用于在酵母中的选择和维持。含不含带有酵母增殖 元件的载体可用来评价装配结果。克隆系统允许每个细胞有这些BAC的10个或更多个拷贝。将带有这25种装配体 的大肠杆菌菌株接种到150ml的LB加12. 5 μ g/ml氯霉素和IX诱导液(Epicentre ·)中, 在37°C温育16小时。收获培养物,并用Qiagen,sHiSpeed Plasmid Maxi Kit纯化BAC。 用500 μ 1的TE缓冲液洗脱DNA。在37°C限制性消化16小时,使片段从它们的BAC释放, 然后用苯酚氯仿提取加乙醇沉淀来终止反应。将产物溶于TE缓冲液,终浓度达120ng/y 1。在消化后,25种装配体中的每一种在其任一端都含有与目的邻接分子重叠至少 80bp的序列。
21
B.酵母原牛质球转化用Zymolyase 处理酵母细胞来使细胞壁变脆弱,然后用 PEG和CaCl2处理使细胞处于感受态来摄入异源DNA,所用的酵母细胞是VL6-48N酵母菌株 (Kouprina, N.,等见上文)。在制备酵母原生质球之前,使细胞生长至0D_为1. 3 ( 5 X IO7 细胞/ml)。通过加入25种经消化的A系列装配体各96ng(0.8y 1,120ng/y 1)来汇总它 们,然后与 IO8个酵母原生质球混合。将等量( IOOng或 4 X IO9基因组当量)的来自 步骤A的各种消化片段汇总在一起,不进行凝胶纯化。将约IO8个酵母原生质球加入此DNA 池,进行酵母转化(Kouprina, N.,等Nat. Protoc. (2008) 3 :371_377)。这相当于每个酵母 原生质球对应 40生殖道支原体基因组当量或 1000个DNA分子(40X25)。转化后,使 酵母原生质球再生,并在加腺嘌呤、无组氨酸的完全补加培养基(complete supplemental medium) (CSM-His)上以及IM山梨醇琼脂平板上于30°C选择3天。在30°C于选择培养基上 温育3天后,获得约800个菌落。然后将单菌落以小块形式转移到CSM-His琼脂平板上,在 30°C温育2天。一经筛选确认具有所需装配体,就分析这些平板上的各个菌落。整个过程参见图9的示意图。如图所示,用含生殖道支原体基因组的25种不同的 重叠A系列DNA节段(每个大小为 17kb至 35kb)转化酵母细胞。为了将它们装配成 完整基因组,一个酵母细胞必须摄入25种不同DNA片段的至少一个代表,并将每一个掺入 核中,在那里发生同源重组。图中标记为JCVI-1. 1的装配成的基因组大小为590,011bp,其 包括位于A86-89内部的载体序列(三角形)。如上述,载体中包含的酵母增殖元件是复制 起点(ARSH4),着丝粒(Cen6)和组氨酸选择标记(His3)。C.多重 PCR 分析用 ChargeSwitch Plasmid Yeast Mini Kit (Invitrogen,目 i 号CS10203)根据提供的手册,从培养的酵母细胞中提取DNA。在 10 μ 1反应体系中进行多 重PCR,使用的主(master)混合物组成如下PCR缓冲液,dNTP混合物,和HotStarTaq DNA 聚合酶(Qiagen,目录号206143)。将2 μ 1 DNA和1 μ 1的10Χ引物贮存液(stock)加入每 个反应体系,该贮存液中含20种寡聚物各5 μ M。循环参数为94°C 15分钟,然后94°C 30 秒,45°C (第1套引物)或55°C (第2-第4套引物)90秒,72°C 90秒,循环35次,之后是 单次在72°C温育3分钟。将2μ 1的各种反应体系上样到2% Ε-gel (Invitrogen)上,通 72V电30分钟。用Amersham Typhoon 9410荧光成像仪观察带。我们首先筛选摄入所有25种片段的酵母细胞。设计40对引物,使它们产生大小 在IOObp和1075bp之间的扩增子,从而使所述引物可以在四个多重PCR反应的每个中产 生10种扩增子。之前已对第1和第2套多重引物作了描述(Gibson,D.G.,等见上文)。所 述40种扩增子位于生殖道支原体基因组每间隔约15kb的位置上。所有25种节段都需要 存在,才能通过PCR得到所有40种扩增子,从而很好地表明所有25种片段都掺入了酵母细 胞。图10A-10B示意了此过程。如图10A所示,设计40种扩增子,从而使4个单独的多重 PCR反应(第1套-第4套)各产生10种产物。如图10B所示,所述40套引物各扩增生殖 道支原体基因组的一小部分,大约每15kb—小部分。25种节段(箭头)中的每一种给40 种扩增子中的至少一种(以线来显示)提供引物结合位点。将呈小块的10个单菌落转移 到单个选择平板上。在30°C温育2天后,将来自这10片中每一片的约IO7个细胞刮至Iml 水中。用第1套多重引物和从这10个克隆提取的DNA,进行多重PCR,并用凝胶电泳分析。 1号和4号克隆产生了所有10种扩增子。当接触时间延长时,扩增子l_h产生了可见的弱 信号(数据未示)。此PCR分析结果证明在1号和4号克隆内存在25种A系列装配体中的10种。PCR产物大小在IOObp至1075bp的范围,可以容易地在2%琼脂糖凝胶上进行电 泳分离。图IOC所示的结果中,从10个酵母克隆提取DNA,并用第一套引物进行多重PCR。 1号和4号克隆(cl和c4)高效产生了 10种预期扩增子中的9种。当从凝胶传出的信号增 强时可见扩增子l_h。P.对4号克降的详细分析。用第1-第4套多重引物,进行多重PCR,并用凝胶电 泳分析。除扩增子l_h之外,从4号克隆提取的DNA高效产生了所有40种PCR产物。这证 实存在所有25种A系列装配体(与图IOB相比)。A70-73由扩增子l_h和3_h代表。尽 管扩增子l_h较其它扩增子的产量低,但扩增子3-h可高效制备,这提供了强有力的证据表 明4号克隆中存在A70-73。选择4号克隆进行进一步分析。图IOD的结果显示,用所有4 套引物在4号克隆上进行多重PCR。除扩增子Ι-h之外,此克隆可高效制备所有40种扩增 子。在标记为“L”的泳道中,上样IOObp梯带(NEB),标示大小。E.对TCVI-1. 1合成件牛殖道支原体基因组的限制件分析用Bio-RadYeast DNA plug Kit,根据提供的说明手册(目录号170-3593)从1 %琼脂糖中的克隆制备DNA。完成 此步骤后,将胶块浸没于水平潜艇电泳托盘的IXTAE中,通电5. 4V/cm2小时。然后取出所 述胶块,贮存于TE缓冲液中。根据Bio-Rad手册用EagI、BSSHII、或AatII(NEB提供限制性 酶和缓冲液)消化胶块。在37°C温育16小时后,将等量的各个胶块(约20 μ 1)上样到 BioRad Ready AgaroseMini Ge Is 上,然后在 23 °C 于 Hoef er HE 33 微型水平潜艇电泳托 盘中用U-2程序进行倒转电场凝胶电泳(FIGE) 14小时,电泳使用的是含0. 5 μ g/ml溴化乙 锭的IXTAE缓冲液,无循环。FIGE U-2的参数是正向(forward) 90V,初始转向(initial switch) 5. O秒,末次转向30秒,带线性渐变(linear ramp),逆向(reverse) 60V,初始转向 5. 0秒,末次转向30秒。用Typhoon 9410荧光成像仪(Amersham)在激发波长532nm和 发射波长eiOnm观察带。为核实所有25种片段都装配到4号克隆的完整基因组中,从琼脂糖块中的这些 酵母细胞制备DNA,如上述作限制性分析。还从未转化的宿主菌株提取DNA作为阴性对照。 为富集块中的环状基因组,通过恒压电泳去除大多线状酵母染色体DNA。如图IlC所示,用 EagI, BssHIIjn AatII消化后,在对消化后的块作倒转电场凝胶电泳时,观察到了预测这 样消化完整的基因组装配体会产生的5个限制性片段。宿主酵母对照不显示这些带中的 任何一条,只观察到了小于 150kb的DNA成片条带。此成片条带使所装配基因组的其它 预测片段模糊不可见。与多重PCR结果一起(图10),这些结果表明4号克隆含有装配的 JCVI-1. 1合成基因组,已经摄入了至少25种重叠的DNA节段,并在体内将它们重组。在分析用第1套引物扩增得到的多重PCR产物时,1号克隆的模式与4号克隆的类 似(图10C)。因此我们进一步分析1号克隆。用图10所示的4套多重PCR引物,从1号克 隆观察到了所有40种扩增子,在图11所示的EagI消化后,图12显示出存在预期的590kb 的带。图12A中,用图10中的所有4套引物,对从1号克隆提取的DNA作多重PCR。在 2%琼脂糖凝胶上电泳后,观察到所有40种扩增子。图12B中,从琼脂糖块中的1号克隆制 备DNA,然后用EagI消化,并如图11进行分析。在琼脂糖凝胶上作倒转电场凝胶电泳 后,可观察到预测的590kb的带(用*标注)。
23
所以在检测的10个酵母克隆中有2个含有完整的基因组。
权利要求
合成所需核酸分子的方法,其包括a)提供多个盒,每个盒包含所需核酸的部分核苷酸序列,其中所述盒含有的所需核酸分子的核苷酸序列有重叠部分,且其中所述盒根据所述重叠部分进行组合会得到所需核酸的完整核苷酸序列;b)体外组合所述盒来获得多个亚序列,其中所述亚序列含有的所需序列有重叠部分,且其中所述亚序列根据所述重叠部分进行组合会得到所需核酸的核苷酸序列;和c)在宿主培养物中体内装配所述亚序列来获得所需核酸分子,其中所述装配体还包含复制起点。
2.权利要求1的方法,其中所述重叠部分每个至少包含20个碱基。
3.权利要求1的方法,其中所述步骤b)和/或步骤c)重复至少一次。
4.权利要求1的方法,其中所述步骤c)在酵母中进行,所述复制起点可用于酵母中。
5.权利要求4的方法,其中所述步骤c)的装配体包含着丝粒和/或选择标记。
6.权利要求1的方法,其中所述复制起点包含在另外的载体中。
7.权利要求5的方法,其中所述着丝粒和/或选择标记包含在另外的载体中。
8.权利要求1的方法,其中步骤a)中的一或多个盒包含水印。
9.将10个或更多个DNA片段装配成单个DNA分子的方法,该方法包括(a)用含所述10个片段中每一个的足量拷贝的混合物转染宿主细胞培养物,使所述培 养物中每个细胞平均摄入的拷贝总数为这些不同片段的数目的至少两倍,其中所述片段包含至少10个碱基对的重叠序列,且其中所述重叠序列的排列方式使所述序列经过重叠能得到所需的装配顺序,且 其中所述片段包括复制起点;(b)允许所述片段在所述酵母培养物中装配足够长的时间;和(C)(i)培养所述宿主以获得装配的核酸分子的足量拷贝用于回收,或 ( )从所述宿主提取DNA并转染另外的培养物,使该另外的培养物复制出所述装配的 核酸分子的足量拷贝用于回收。
10.权利要求9的方法,其还包括从宿主培养物或另外的培养物分离出所装配的DNA分 子的步骤。
11.权利要求9的方法,其中在所述宿主培养物中至少装配两个靶DNA分子。
12.权利要求9的方法,其中所述复制起点在宿主中是可用的,所述片段包括在宿主中 可用的着丝粒。
13.权利要求9的方法,其中所述片段中包括在另外的系统中可用的复制起点。
14.权利要求9的方法,其中所述片段包括选择标记,并且其中所述培养在选择条件下 进行。
15.权利要求9的方法,其中所述片段是双链的并包含100-5xl06个碱基对。
16.权利要求9的方法,其中所述片段是单链的并包含40-1,000个核苷酸。
17.权利要求9的方法,其中所述片段中的两个各在其一端包含端粒。
18.权利要求9的方法,其中所述装配的DNA分子代表天然存在的基因组。
19.权利要求9的方法,其中所述装配的DNA分子包括所需的代谢途径。
20.权利要求9-19任一项的方法,其中所述宿主培养物是酵母。
21.用权利要求1-19任一项的方法装配的分离的DNA分子。
22.宿主培养物或另外的培养物,其包含根据权利要求1-19任一项的方法装配的DNA 分子。
23.权利要求22的宿主培养物,其为酵母,及权利要求22的另外的培养物,其为大肠杆 菌或芽孢杆菌培养物。
24.评价基因的临界状态的方法,该方法包括缺失或破坏来自转染入细胞培养物的权 利要求21所述合成性核酸分子的候选基因,并评估该缺失或破坏对培养物存活的影响。
全文摘要
本发明描述了装配任何所需核酸分子的方法,该方法通过体外组合盒来形成进一步在体内组合的装配体,或者通过在酵母培养物中重组来装配许多DNA片段,从而获得大的所需DNA分子。
文档编号C12Q1/68GK101932725SQ200880119758
公开日2010年12月29日 申请日期2008年10月7日 优先权日2007年10月8日
发明者J·克雷格·文特尔, 丹尼尔·G·吉布森, 克莱德·A·哈奇森, 杨磊, 格威内德·A·本德斯, 汉密尔顿·O·史密斯, 约翰·I·格拉斯 申请人:合成基因组股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1