在真核细胞中产生基因嵌合体的方法

文档序号:511383阅读:709来源:国知局
在真核细胞中产生基因嵌合体的方法
【专利摘要】本发明涉及一种通过体细胞在体内重组产生基因嵌合体的方法,包括:a)在单个步骤过程中(i)用至少一种基因A转化一细胞,所述基因A与待重组的另一基因序列同源性小于99.5%,所述待重组的另一基因为细胞基因组的一整体部分或存在于遗传结构的框架中,(ii)将两个所述基因重组;(iii)在目标基因组的整合位点处产生基因的基因嵌合体,其中所述至少一种基因A在5'末端或3'末端具有单个旁侧目标序列,锚定到所述整合位点的5'或3'末端,以及b)选择包含所述基因嵌合体的克隆,其中所述细胞为敲除了至少一个DNA修复基因的真核株系。本发明还涉及一种产生大量基因嵌合体和基因组装体的方法。
【专利说明】在真核细胞中产生基因嵌合体的方法

【技术领域】
[0001] 本发明涉及通过真核细胞内的部分同源体内重组产生基因嵌合体的方法。

【背景技术】
[0002] 蛋白质设计的一个主要目标是产生具有新性质或改良性质的蛋白质。赋予蛋白质 或酶所需活性的能力在化学和制药行业有大量的实际应用。定向蛋白质进化在蛋白质工程 中作为强大的技术平台出现,其通过实验搜寻变体库中具有所需性质的克隆。
[0003] 定向蛋白质进化利用自然选择的力量来使自然界中没有找到的带有所需性质的 蛋白质或核酸进化。已有各种技术用于产生蛋白质突变体和变体以及用于选择所需的 功能。重组DNA技术能够将单个结构基因或一整个途径的基因转移到合适的代理宿主 (surrogate host)中用于快速增殖和/或高水平蛋白质生产。活性或其它性质的累积性改 进通常通过重复突变和筛选来获得。定向进化主要应用在学术和工业实验室中以改进蛋白 质的稳定性和增强活性或增强酶和生物体的整体性能,或改变酶底物特异性,以及用以设 计新的活性。大多数定向进化项目试图使在农业、医学或工业环境(生物催化)方面对人 类有用的性质进化。
[0004] 整个代谢途径的进化是一个特别具有吸引力的概念,因为大多数天然或新的化合 物都是通过各种途径而不是通过单酶产生的。代谢途径工程通常需要途径中的所有酶的协 同操作。新代谢途径的进化和生物处理的增强通常是通过重组和筛选或选择的重复循环过 程来进行的,以使单独的基因、整个质粒、多基因簇或甚至整个基因组进化。
[0005] Shao 等人(Nucleic Acids Research37 (2) : el6Epub2008Decl2) [Shao 等人(2008 年12月12日电子出版的《核酸研究》37卷第2期el6页)]描述了编码整个生化途径或基 因组的大重组DNA的组装,其在单个步骤中在酿酒酵母(Saccharomyces cerevisiae)中通 过5'和3'末端的两个旁侧(锚定)区域的体内同源重组进行组装,所述区域包含相邻片 段的5'或3'末端的序列。
[0006] Elefanty 等人(Proc. Natl. Acad. Sci. 95, 11897-11902(1998)[Elefanty 等人 (《美国科学院院刊》1998年95期第11897-11902页)]描述了基因靶向技术以产生突变 小鼠,其中lacZ报告基因被敲入SCL基因座。参考他们的文章的图1,显示了 SCL-lacZ基 因靶向策略,其采用两个锚定序列,即5'和3'末端各一个锚定序列。
[0007] 定向进化可在活细胞中进行,称为体内进化,或根本不包含细胞(体外进化)。体 内进化具有在细胞环境中选择性质的优势,当进化的蛋白质或核酸是用在活生物体中时, 这很有用。酵母中的体内同源重组已广泛用于基因克隆、质粒构建和文库建立。
[0008] 文库差异性(diversity)通过诱变或重组获得。DNA改组(DNA shuffling)能够 直接重组多基因的有利突变。在DNA改组中,DNA序列群随机片段化,然后重组装成全长杂 交序列。
[0009] 为了达到同源重组的目的,使用天然存在的同源基因作为起始差异性的来源。单 基因改组文库成员通常超过95%相同。但是,家族改组能够使通常超过60%相同的序列进 行块交换。功能性序列差异性来自于相关的从自然选择中存活下来的亲本序列;因此,在一 给定的序列中,能容纳数量大得多的突变而不会对结构或功能造成不利影响。
[0010] 高达30%差异性的不同来源的DNA片段的重组描述于W01990007576A1中。杂交 基因通过属间和/或种间重组,在错配修复缺陷细菌中或在错配修复(MMR)系统短暂失活 的细菌中在体内产生。从而,避免了受损DNA的修复过程,否则,将会对不同序列之间的重 组频率产生抑制作用,即,部分同源重组。
[0011] Kunz 等人(Cell. Mol. Life Sci. 66 (2009) 1021-1038)(《细胞和分子生命科学》 2009年第66期第1021-1038页)提供了 MMR基本机制的综述。
[0012] 祀向半同源重组描述于《MMR deficient plants (MMR缺陷植物)》中 (W02006/134496A2)。用高达10%差异的序列靶向一基因座是可能的。
[0013] W003/095658A1公开了同源重组到细菌中用于产生多核苷酸文库。其产生了一多 核苷酸的表达文库,其中每个多核苷酸通过同源重组整合到感受态细菌宿主细胞的基因组 中,其使用包含该多核苷酸和与宿主细胞基因组的区域同源的两个旁侧序列的非复制型线 性整合盒(cassette)。
[0014] 利用单倍体细胞高效配对引起二倍体生物体形成的能力可增加文库的差异性。在 其营养生命周期中,酿酒酵母(S.cerevisiae)具有单倍体基因组,即每条染色体都以单拷 贝存在。在某些条件下,单倍体细胞可以配对。通过这种方式,形成二倍体细胞。二倍体细 胞可再次形成单倍体细胞,特别是当某些营养缺失时。然后,它们经历一称为减数分裂的过 程,然后形成孢子,以形成4个单倍体孢子。在减数分裂过程中,两个亲本基因组的不同染 色体重组。在减数分裂的重组过程中,DNA片段被交换,导致形成重组的DNA材料。
[0015] W02005/075654A1公开了一种用于在酿酒酵母中产生重组DNA序列的系统,其基 于酿酒酵母的有性生殖周期。在诱导减数分裂和孢子形成过程的条件下培养杂交的二倍体 细胞。减数分裂的特征通常在于遗传重组频率的提高。因此,减数分裂的产物,即单倍体细 胞或孢子,可包含由两个分开的DNA序列之间的重组形成的重组DNA序列。通过重复的方 法,选择重组的单倍体后代并相互配对,将所得的二倍体再次变为孢子,使它们的后代孢子 经历合适的选择条件以鉴定新的重组事件。此过程在野生型或错配修复缺陷的酿酒酵母细 胞中描述。因此,目标基因(每个目标基因旁侧为两个选择标记)被整合到错配修复缺陷 二倍体株系的两条姐妹染色体中每一条的相同基因座中。将DNA序列加到新的DNA片段的 5'或3'末端,所述新的DNA片段与DNA必须整合到的基因座的旁侧DNA序列100%相同。 这些旁侧目标序列长约400-450个核苷酸。然后,细胞进入减数分裂周期,并被迫启动孢子 形成。在孢子形成过程中,重组过程发生。所得孢子和重组序列通过选择合适的旁侧标记 进行辨别。
[0016] 还可利用酵母高效重组同源DNA序列的能力以提高文库的差异性。当具有89. 9% 同源性的两个基因通过PCR进行突变并转化到野生型酵母内时,通过体内同源重组创建 了一 10e7的嵌合文库,显示了遍及两个基因的几个交换点(Swers等人,Nucleic Acids Research32 (3) e36 (2004)) (Swers 等人,《核酸研究》,2004 年 32 卷第 3 期第 e36 页)。
[0017] Nicholson 等人(Geneticsl54:133-146(2000))(《遗传学》2000 年第 154 期第 133-146页)描述了有丝分裂半同源重组的方法。其研究了短的反向重复序列中包含的限 定的错配对野生型或MMR缺陷株系(strain)中重组率的影响。
[0018] 本发明的一个目的是提供一种制备和组装多种基因嵌合体,特别是用于重组长 DNA片段的改进方法。因此,需要提供各变体的文库用于选择改进的重组体。
[0019] 该目标是通过提供本申请的【具体实施方式】来达到的。


【发明内容】

[0020] 本发明提供了一种通过在体细胞体内重组而产生基因嵌合体的新方法,包括:
[0021] a)在单个步骤过程中
[0022] (i)用至少一种基因 A转化一细胞,所述基因 A与待重组的另一基因的序列同源性 小于99. 5%,所述待重组的另一基因为细胞基因组的一整体部分或存在于遗传结构的框架 中,优选采用待重组的至少一种基因 B,
[0023] (ii)将两种所述基因重组;
[0024] (iii)在目标基因组的整合位点处产生基因的基因嵌合体,其中所述至少一种基 因 A在5'末端或3'末端具有单个旁侧目标序列,锚定到所述整合位点的5'或3'末端,以 及
[0025] b)选择包含所述基因嵌合体的克隆,
[0026] 其中所述细胞为敲除了至少一个DNA修复基因的真核株系。当基因 A要与至少一 个基因 B重组时,基因 A的单个旁侧靶向序列优选锚定到整合位点的5'末端,而基因 B具 有锚定到3'末端的单个旁侧靶向序列。
[0027] 特别地,所述真核株系为敲除了至少一个DNA修复基因的活株系。
[0028] 特别地,所述DNA修复基因为DNA修复机制中包含的基因,例如MSH/Mut、RecQ和 RAD家族的基因。
[0029] 根据一个特定的方面,DNA修复基因完全或暂时被敲除,优选通过突变,例如删除 和/或插入和/或取代一个或多个核苷酸实现。
[0030] 此处理解的术语"敲除"指DNA结构和/或功能的任何类型的损害。这种损害可通 过至少一个DNA修复基因的突变造成,例如,通过DNA修复基因的删除,或通过减弱其功能 的工程突变体。替代的方法可以是通过添加各试剂,或过表达其它基因,或通过回避表达所 述基因或其功能来灭活或抑制这种DNA修复。这种敲除可以是完全例如丧失功能性DNA修 复、部分地或暂时地丧失,包括可逆敲除。敲除株系此处特别地理解为敲除了至少一个DNA 修复基因的株系。
[0031] DNA修复基因通常是支持细胞中DNA修复过程并积极应答DNA结构破坏的基因。根 据强加到DNA的双螺旋结构上的破坏类型,有多种恢复丢失信息的修复策略。如果可以,细 胞使用DNA或姐妹染色单体未经修饰的互补条带作为模板来恢复原始信息。不接触模板, 细胞使用被称为翻译合成的易错恢复机制。对DNA的破坏改变了螺旋的空间构造,而这种 改变可被细胞检测到。一旦破坏被定位,特定的DNA修复分子结合在破坏位点处或附近,弓丨 起其它分子结合并形成能够使实际的修复发生的复合体。DNA修复基因功能的丧失会导致 基因组完整性维护的崩溃。
[0032] 如本发明使用的真核株系中适当地敲除的这种DNA修复基因的实例是螺旋酶,例 如真核生物中螺旋酶的RecQ同源物或RecQ家族,其中有芽殖酵母(budding yeast)例如 酿酒酵母中的Sgsl,以及裂殖酵母例如粟酒裂殖酵母中的Rqhl。进一步的实例是核苷酸剪 切修复中涉及的基因,例如真核生物中的RAD同源物或RAD基因家族。
[0033] 这种DNA修复基因被理解为不同于DNA错配修正的特定基因,如MutS或MutL。因 此,本发明使用的真核细胞特别地为无错配修复缺陷细胞。
[0034] 特别优选的敲除是,通过删除或突变对于DNA修复必不可少的基因,特别是删除 或突变RAD或RECQ家族基因,例如真核细胞中的RAD1和/或RECQ同源物。根据本发明的 一个特定的实施方式,所述DNA修复基因选自RAD1和RECQ的同源物或类似物。
[0035] 优选的实施方式是选自真菌、酵母、植物、昆虫和哺乳类动物的敲除株。
[0036] 特别优选的是选自酿酒酵母、裂殖酵母、酿酒酵母、假丝酵母(Candida)、克鲁维酵 母(Kluyveromyces)、汉逊氏酵母(Hansenula)、裂殖酵母(Schizosaccaromyces)、耶氏酵 母(Yarrowia)、毕赤酵母(Pichia)、曲霉、果蝇和隐杆线虫属的株系。
[0037] 优选采用单倍体株系,例如单倍体酵母株系。
[0038] 或者,可使用哺乳动物细胞如HeLa细胞或Jurkat细胞,或植物细胞如拟南芥。
[0039] 优选的株系是例如选自敲除了至少SGS1基因的酿酒酵母、敲除了至少RQH1基因 的粟酒裂殖酵母、敲除了至少dmblm基因的黑腹果蝇(Drosophila melanogaster)、敲除了 至少F18C5. 2和T04A11. 6基因之一的秀_隐杆线虫(Caenorhabditis elegans)、敲除了 至少AtRECQLl-4和4B基因之一的植物以及敲除了至少BLM、WRN、RECQL、RECQL4和RECQL5 基因之一的哺乳动物细胞。
[0040] 特别地,本发明涉及一种通过在体细胞体内重组产生基因嵌合体的方法,包括:
[0041] a)在单个步骤过程中
[0042] (i)用至少一种基因 A转化一细胞,所述基因 A与不同的基因 B的序列同源性小于 99. 5%,所述基因 B为细胞基因组的一整体部分或存在于遗传结构的框架或表达盒中,
[0043] (ii)将两个所述基因重组;
[0044] (iii)在目标基因组的整合位点处产生基因 A和基因 B的基因嵌合体,其中所述至 少一种基因 A在遗传构造的5'末端或3'末端连接到单个旁侧目标序列,所述单个旁侧目 标序列锚定到所述整合位点的5'或3'末端;以及
[0045] b)选择包含所述基因嵌合体的克隆,
[0046] 其中所述细胞为敲除了至少一个DNA修复基因的真核株系。
[0047] 特别优选地,在基因嵌合体中使用选择标记,并根据选择标记的存在选择克隆。例 如,基因嵌合体包含一选择标记,例如其中所述基因 A与选择标记连接。或者,也可通过重 组所得的任何产物的存在来进行选择,例如通过确定产量或功能性特征。特别是,可用一个 或多个不同的选择标记来辨别不同类型的基因嵌合体。
[0048] 特别地,本发明的方法采用所述另一基因,该基因为目标基因组例如细胞基因组 的一部分。在一个优选的实施方案中,所述另一基因是基因 B,其为细胞基因组的一部分。 [0049] 根据另一优选实施方案,所述另一基因是与目标基因组分开的遗传构造,例如线 性多核苷酸,并可选地在重组过程中整合到目标基因组中。
[0050] 根据本发明的一个特定实施方案,所述细胞用至少一种基因 A和至少一种基因 B 共转化,其中基因 A的所述单个旁侧目标序列锚定到所述目标基因组整合位点的5'末端, 以及其中基因 B与锚定到整合位点3'末端的单个旁侧目标序列连接。
[0051] 特别是,细胞可用带有选择标记的至少一种基因 A和至少一种基因 B共转化,其中 基因 A的所述单个旁侧目标序列锚定到所述目标基因组整合位点的5'末端,以及其中基因 B连接到一不同的选择标记和一单个旁侧目标序列,所述单个旁侧目标序列锚定到整合位 点的3'末端,以及其中选择带有至少两种选择标记的克隆。
[0052] 特别是,细胞可用至少两种不同的基因 A1和A2以及可选地用至少两种不同的基 因 B1和B2共转化。
[0053] 根据一个特定的实施方案,至少又一种基因 C被共转化,其具有与基因 A和/或所 述另一基因杂交的序列,以将所述又一基因 C组装到基因 A和/或所述另一基因上,优选其 中至少一种组装基因具有基因内的基因嵌合体。
[0054] 特别是,至少又一种基因 C被共转化,其具有与基因 A和/或B的序列(例如全长 基因 A或基因 B或基因 A和/或B的部分序列)杂交的序列,以获得重组并将所述又一基 因 C组装到基因 A和/或B。
[0055] 特别是,所述基因 C的杂交序列与所述序列的序列同源性小于99. 5%,优选至少 30 %序列同源性。
[0056] 特别地,选择基因内至少一种核苷酸进行了交换或互换(cross-over)的基因嵌 合体,即具有基因内互换的嵌合体,例如包含部分基因 A和部分所结合的所述另一基因的 那些嵌合体,其理解为部分基因的混合物,用以获得重组的基因内基因嵌合体,例如适用于 以不同的方式表达产物的基因,例如,具有改进的性质或改进的产量。这种基因内基因嵌合 体可由重组产生,优选还可通过一系列基因的组装产生,其中一种或多种组装的基因具有 这种基因内基因嵌合体。
[0057] 根据一个优选的实施方案,可获得至少三种不同基因 A和/或B和/或C的嵌合 体。
[0058] 优选地,所述基因 A和/或所述另一基因编码多肽或具有活性的多肽部分。
[0059] 特别地,本发明方法采用编码具有活性的多肽部分的基因 A、B和/或C。因此,基 因,例如基因 A和/或B和/或C,优选它们全部不单独编码生物活性多肽本身,而仅编码其 部分,并仅在基因组装后带来相应的活性或改进的活性。
[0060] 使用本发明方法,可组装和重组编码生化途径多肽的多种基因。
[0061] 在另一特定的实施方案中,本发明方法提供了得到非编码序列的基因重组和可能 的组装(eventual assembly),例如启动子、非翻译区、核糖体结合位点、终止子等。
[0062] 根据本发明,可使用任何重组感受态真核细胞通过体细胞体内重组产生基因嵌合 体。
[0063] 根据一个特定的实施方案,旁侧目标序列为至少5bp,优选至少10bp,更优选至 少20bp、50bp、100bp直至5000bp长。特别地,旁侧目标序列连接到所述基因,或为所述 基因的整个终端部分。与所述整合位点的锚定序列杂交的所述旁侧目标序列优选具有 30% -99. 5%,优选小于95%,小于90%,小于80%,甚至小于70%或小于60%的同源性或 相应的序列一致性。结果,本发明的方法提供了高效的基因嵌合体形成和文库形成,同源性 或相应的序列一致性甚至小于50%,例如同源性为47%,即差异性为53%。优选地,同源性 为至少35%或40%。
[0064] 当根据本发明使用至少两种不同的旁侧目标序列锚定到基因组的目标整合位点 时,优选它们不相互重组,优选地,它们具有小于30%的同源性。
[0065] 对本发明方法有用的选择标记可选自任何已知营养缺陷性标记、抗生素抗性标 记、荧光标记、敲入标记、活化剂/结合区域标记和显性隐性标记和比色标记。优选的标记 可以是短暂失活或功能性敲除的,并可重建以恢复其标记性质。进一步优选的标记是可追 踪基因,其中,标记是基因序列A和/或其它基因例如基因 B的功能,不需要用标记功能来 分开序列,这样,基因嵌合体的表达可直接通过检测嵌合体自身来确定。在这种情况下,基 因嵌合体是直接可追踪的。
[0066] 根据一个特定的实施方案,所述基因包含在线性多核苷酸、载体或酵母人工 染色体中。特别地,基因 A和/或待重组的其它基因的形式是线性多核苷酸,优选为 300-20000bp。特别地,不需要构建或采用质粒或巨大质粒。因此,可使用基因本身,即没有 载体。
[0067] 用于重组和整合的基因也可包含在例如用作载体来携带所述基因的任何遗传构 造中。因此所述基因可包含在一遗传构造中,例如线性多核苷酸、载体或酵母人工染色体。 这些构造优选包括线性多核苷酸、质粒、PCR构造体、人工染色体如酵母人工染色体、病毒载 体或可换位元件。
[0068] 根据本发明一个特定的实施方案,目标基因组的整合位点位于任一基因上,例如 在线性多核苷酸、质粒或染色体包括人工染色体内。
[0069] 本发明方法特别地提供了具有基因内基因嵌合体的至少一种克隆的选择。特别 地,选择具有基因组装体和至少一种基因内基因嵌合体的至少一种克隆。
[0070] 使用本发明方法,可获得至少3,优选至少9,直至20000个碱基对的基因嵌合 体,以及例如包含至少一种基因内嵌合体的基因嵌合体,优选每700个碱基对,更优选每 600bp、每500bp或甚至更少碱基对具有至少3个交换事件,优选至少4、5或10个交换事件。 一般,高度交换事件提供了大量重组基因,这可用以产生选择合适文库成员的文库。嵌合体 或交换事件的程度可理解为这种文库的质量参数。
[0071] 根据本发明方法修饰的基因可以是用于科学或工业目的的任何基因。这些基因 可以是例如非编码序列,例如,可用于重组表达系统或多肽变体的那些,可以是整体或部 分,包括不编码具有生物活性的多肽的那些部分序列,其中多肽特别地选自酶、抗体或其部 分、细胞激素、疫苗抗原、生长因子或肽。如果基因被修饰,所述基因编码作为具有生物活 性的多肽的部分的非编码序列或氨基酸序列,也称为"部分基因",优选这种部分基因的组 装具有功能性特征,例如编码具有生物活性的多肽。优选地,重组许多不同的基因,例如不 同的部分基因,大小为3bp-20000bp,特别是至少100bp,优选300bp-20000bp,特别地高达 lOOOObp,其中不同基因的数目为至少2个,更特别地为至少3、4、5、6、7、8、9或至少10个, 以产生重组的基因序列,该基因序列为非编码或编码重组多肽,例如具有生物活性,其有利 地被调整,例如生物活性提高。用在此方面的术语"生物活性"特别地指酶活性,例如将特 定底物转化为特定产物的活性。根据本发明差异化的优选基因编码多链多肽。
[0072] 本发明一个特定实施方案提供了基因变体的细胞展示方法,包括使用本发明方法 在细胞内产生大量基因嵌合体,以及将所述大量基因嵌合体展示在所述细胞表面以获得嵌 合体文库。
[0073] 通过这种优选展示可获得的文库特别地在功能性开放阅读框(0RF)内包含高百 分比的基因嵌合体,优选至少80%。
[0074] 本发明的文库特别地可以是任何合适的形式,特别地,生物文库包括大量含有基 因变体的生物体。本发明的生物文库可包含在生物体群中和/或由生物体群表达,以产生 生物体清单(repertoire),其中单独的生物体包括至少一种文库成员。
[0075] 本发明的一个特定方面提供了来自这种文库的包含基因变体的生物体,例如,选 自生物体清单的生物体。本发明提供的生物体可用以在合适的表达系统中表达基因表达产 物,例如作为生产宿主细胞。

【专利附图】

【附图说明】
[0076] 图1 :非减数分裂体内重组
[0077] 半同源基因 A和B(同源性小于99. 5% )被重组。由于标记序列和旁侧目标序列 并非同源,因此,重组/组装仅发生在基因 A和B之间。结果,杂交体/嵌合体DNA包含重 组的基因 A和B、两种标记和两旁侧目标序列。基因嵌合体整合到目标染色体的目标基因座 中。具有整合整个构造的克隆在选择两种标记的合适的培养基上生长。
[0078] T5'和T3'对应于酵母基因组(大约400bp)上的目标序列(同源性小于99. 5% ), 处理染色体位点上的同源整合。Ml和M2是旁侧标记,用于双重选择。基因 A和基因 B是具 有给定同源性(小于99. 5%)的相关半同源版本。重叠序列对应于两个基因的整个0RF。 通过在MMR缺陷酵母转化体中的半同源重组组装后,双重选择可以分离重组体。
[0079] 图2 :通过半同源重组的DNA重组和组装
[0080] 此图显示了一个特定实施方案的示意图展示,其中细胞用至少两种基因(此处为 DNA片段A和B)共转化,这两种基因在它们的80bp重叠片段上具有小于99. 5%的同源性。 每个DNA片段旁侧有一个选择标记。
[0081] 片段A包含对应于染色体上的5'端正确整合位点的旁侧目标序列和与片段B重 叠的杂交区域,片段B包含对应于3'整合位点的旁侧目标序列以及与片段A重叠的杂交区 域。用所得的片段转化错配缺陷型酵母细胞。所得转化体涂布在培养基上,该培养基对于 两种标记具有选择性。分离能够通过两种标记被选择的克隆,通过对选出的重组体基因组 DNA进行分子分析,证实组装的/整合的基因簇的完整性以及基因 A和B的0RF的重建。
[0082] T5'和T3'对应于酵母基因组(大约400bp)上的目标序列(同源性小于99. 5% ), 负责染色体位点上的同源整合。Ml和M2是旁侧标记,用于双重选择。DNA片段A和B可以 组装到一个基因中,该基因可追踪如GFP,或者代表由这种方法组装的两个基因。所有基因 的重叠序列的同源性小于99. 5% (120bp),使得同源重组进行组装后能够重建0RF。双重选 择可以使重组体分离并用作组装的初步证实。
[0083] 图3:基因 A、B和C的重组和组装
[0084] 此图显示了又一基因 C的共转化,所述基因 C具有与基因 A和/B的旁侧序列杂交 的序列,以将所述基因 C组装到基因 A和B。
[0085] T5'和T3'对应于酵母基因组(大约400bp)上的目标序列(同源性小于99. 5% ), 负责染色体位点上的同源整合。Ml和M2是旁侧标记,用于双重选择。基因 A、基因 B和基 因 C是具有给定同源度(小于99. 5%)的相关同源序列。重叠序列对应于基因的5'部分 和3'部分。基因 B连接旁侧序列,通过序列相似性重建新的ORF ABC。通过在MMR缺陷酵 母转化体内的同源重组进行组装后,双重选择可以分离重组体。
[0086] 图4 :0xa重组底物
[0087] 四种基因编码β-内酰胺酶的变体。它们是在DNA水平具有不同程度的同源 性(从95 %到47 % )的相关序列。对于0ΧΑ11和0ΧΑ5,父本基因序列的来源是绿脓假 单胞菌(Pseudomonas aeruginosa),对于0ΧΑ7和Oxal,父本基因序列的来源是大肠杆菌 (Escherichia coli)。面板(panel)上部显示了基因的0RF退火示意图,比对后产生了系 统树图(dendrogramme)。基因的大小约为800bp。ATG和TAA是起始和终止密码子。表的 底部显不了四种基因之间在DNA水平的序列相似性。每种基因的四种DNA序列见图7。
[0088] 图5 :基因和蛋白质嵌合体0XA11/0XA7的序列(SEQ ID N0sl-14)
[0089] 来源于0XA7的核苷酸序列加粗并加下划线,突变核苷酸序列加粗并为斜体。
[0090] 克隆通过双重选择和用于扩增和测序的DNA进行分离。只使用两条条带中清楚可 读的序列。所得色谱图用类Clustal方案进行比对。
[0091] 图 6 :基因和蛋白质嵌合体 0XA11/0XA5(SEQ ID N0sl5-38)和 0XA11/0XA1(SEQ ID N0s67-70)序列
[0092] 来源于0XA5或0XA1的核苷酸序列加粗和加下划线,突变核苷酸序列加粗并为斜 体。
[0093] 克隆通过双重选择和用于扩增和测序的DNA进行分离。只使用两条条带中清楚可 读的序列。所得色谱图用类Clustal方案进行比对。
[0094] 图 7 :父本基因 0XA11、0XA7 和 0XA5 以及 0XA1 (SEQ ID N0s39-41 和 SEQ ID N066) 序列
[0095] 图8 :包含复合嵌合体基因的克隆序列,对应于半同源组装的0XA11/0XA5/0XA7
[0096] 序列克隆,以及各蛋白质退火的结果:图8a)0XAll/0XA5/0XA7的0UL3-05-II (SEQ ID N0s42 和 43),图 8b)0XAll/0XA5/0XA7 的 0UL3-05-III(SEQ ID N0s44 和 45),图 8c)0XAll/0XA5/0XA7 的 0UL3-05-IV(SEQ ID N0s46 和 47),图 8d)0XAll/0XA5/0XA7 的 0UL3-05-IX(SEQ ID N0s48 和 49)和图 8e)0XAll/0XA5/0XA7 的 0UL3-05-X(SEQ ID N0s50 和 51)。
[0097] 0XA5的核苷酸序列加粗,而对应于0XA7的那些序列加下划线。非加粗无下划线的 序列对应于0XA11。
[0098] 图9 :乳酸克鲁维酵母(Kluyveromyces lactis)、酿酒酵母的ADH1基因序列和重 组序列
[0099] 来源于乳酸克鲁维酵母的核苷酸序列加下划线。
[0100] 图 9a) : (SEQ ID N0s52)ADH 克鲁维酵母,图 9b) : (SEQ ID N0s53)酿酒酵母,图 9c) :(SEQ ID N0s54)克隆 A02,图 9d) :(SEQ ID N0s55)A03,图 9e) :(SEQ ID N0s56)A05, 图 9f) :(SEQ ID N0s57)A06,图 9g) :(SEQ ID N0s58)A10,图 9h) :(SEQ ID N0s59)All。
[0101] 图10 :包含复合嵌合体基因的克隆序列,对应于酿酒酵母的DNA修复缺陷株中的 半同源组装 0XA11/0XA5/0XA7。
[0102] 序列显示了多个互换,甚至带有同源性小于50 %的基因 。SEQ ID60:0UL-Y00-I(DNA),SEQ ID61:0UL-Y00-I(蛋白质),SEQ ID62:0UL-Y00-IV(DNA),SEQ ID63:0UL-Y00-IV(蛋白质),SEQ ID64:0UL14-15(DNA),SEQ ID65:0UL14-15(蛋白质),SEQ ID N069:0UL-Y00-15(DNA),SEQ ID N070:0UL-Y00-15(蛋白质)。

【具体实施方式】
[0103] 因此,本发明涉及到一种新的和非常高效的方法,用于半同源DNA序列(S卩,类似 但不相同的序列)的体内重组。以下,术语同源重组(当半同源序列重组时有时称为半同 源重组),是指具有一定同源性的序列的重组,所述序列可以相同,也可以不同。与传统克 隆方法依赖于位点特异性消化和连接不同,同源重组将互补序列进行排列,并使片段之间 进行交换。重组嵌合体基因,也称为杂交基因,在细胞中通过具有错配碱基的序列杂交而产 生。通过这种有创造力的诱变方法,可以容易地以时间高效的方式建立差异性用于合适的 选择和目标多肽的再设计。
[0104] 特别地,本发明通过采用体内重组的功能性系统,第一次能够在单个步骤过程中 有效地重组和形成嵌合体,差异化和组装不同的基因。
[0105] 术语"单个步骤过程"是指设计重组体的几个处理步骤,如用基因转化细胞、基因 重组、产生嵌合体基因和将基因整合到目标基因组内,技术上在一个方法步骤中实施。因 此,在体内重组前就不需要在体外重组DNA载体,或处理步骤的任何重复循环,包括采用减 数分裂的那些。有利地,可以避免使用减数分裂的酵母细胞。
[0106] 本发明单个步骤过程甚至可包括同时通过宿主表达这种经设计的重组体。从而, 不需要进一步的操作以获得表达产物。
[0107] 本发明的术语"基因嵌合体"是指发生至少一次互换事件的至少两种不同的基因 的结合。特别地,这种交换提供了 DNA序列的结合或混合。基因嵌合体可通过基因的基因 内混合、基因内的基因嵌合,和/或基因组装,可选地两种都用的基因组装、基因内和基因 间交换或基因嵌合来产生。
[0108] 术语"互换"是指在两条DNA条带可交换遗传信息(即至少一个核苷酸)的位点 处基因之间的重组。互换过程导致产物嵌合基因具有来源于父本基因的基因或序列的不同 结合。
[0109] 或者,可提供不基于互换的其它修复机制例如核苷酸剪切修复,或非同源末端连 接机制,包括链连接后识别不正确的核苷酸、剪切和/或替换。
[0110] 术语"旁侧目标序列"是指与目标序列互补的核苷酸序列区域,例如基因组目标整 合位点,包括基因 A和/或待重组的其它基因、线性多核苷酸、线性或环形质粒YAC的序列 等的位点。由于具有特定程度的互补或同源性,旁侧目标序列可基因杂交并整合到目标整 合位点。
[0111] 术语细胞的"基因组"是指生物体遗传信息的整体,表示为基因和DNA非编码序 列,染色体的或非染色体的遗传元件例如线性多核苷酸,例如包括基因 A和/或其它待重组 的基因、病毒、自复制携带体和载体、质粒和可换位元件,包括人工染色体等。人工染色体是 线性或环状DNA分子,其包含引入细胞时保持稳定所需的全部序列,在细胞中,它们表现得 与天然染色体类似,因此被视为基因组的一部分。
[0112] 术语"同源性"表示两个或多个核苷酸序列在相应的位置处具有(至一特定程度, 高达100% )相同或保守碱基对。同源序列,也称为互补序列、对应的序列或配对的序列(如 本发明所使用),优选与同源相对序列杂交,例如,对于全长天然DNA序列或本文公开的DNA 序列片段,其与各自的互补序列具有至少30%序列一致性,但小于99. 5%序列一致性,序 列一致性可低于95%、低于90%、低于85%或低于80%,甚至低于70%、低于60%或低于 50%。序列一致性理解为是指相同或互补序列。百分比序列一致性在本文中也称为百分比 同源性。优选地,本文使用的特定同源性序列具有至少约30%的核苷酸序列一致性,总是包 括相应或互补的一致性,优选至少约40%-致性,更优选至少约50%-致性,更优选至少 约60%-致性,更优选至少约70%-致性,更优选至少约80%-致性,更优选至少约90% 一致性,更优选至少约95%-致性。上面提到的上限和下限的优选范围在30% -99. 5%对 应序列一致性的范围内。如本文所使用的,一致性或同源性的程度总是指相同或互补核苷 酸序列。
[0113] 存在于不同种的基因家族的基因也称为"同源"。优选的DNA修复基因适合的敲除 是如本文描述的特定DNA修复基因的同源物,例如多种不同真核细胞的RAD基因的同源物 或RECQ家族的基因,包括优选酵母菌株中的同源物。这些同源物是已知的并存在于许多种 真核生物中,它们互不相同,例如,存在或不存在某些区域,非保守区域的长度和序列不同。
[0114] 基因的核苷酸序列的"百分比(%) -致性"定义为候选DNA序列中核苷酸的百分 比,所述候选DNA序列与DNA序列中的核苷酸或其相应的或互补的序列相同,在比对序列和 引入缺口后,如果需要,达到最大百分比序列一致性,并且不将任何保守取代作为序列一致 性的一部分。用于确定百分比核苷酸序列一致性的比对可利用本领域内的各种方法实现, 例如,使用公开的可获得的计算机软件。本领域技术人员可确定测量比对的合适参数,包括 获得待比较的全长序列的最大比对需要的任何运算法则。
[0115] 术语"锚定"是指基因或基因嵌合体通过称为"锚定序列"的具有部分或全部序 列同源性的片段与整合序列结合,以使这种基因或基因嵌合体整合到基因组的整合位点 中。特别地,锚定序列可以是与基因组序列的整合位点同源或部分同源的旁侧目标区域。 优选的锚定序列最好与目标整合位点具有至少约70 %的序列同源性,更优选地至少80%、 90%、95%直至99. 55%或完全与基因组的杂交部分匹配。
[0116] 整合位点可合适地为限定在宿主基因组上的基因座,其中会发生高频的重组事 件。一种优选的基因座是,例如,酿酒酵母染色体ΠΙ上的BUD31-HCM1基因座。一般来说, 优选显示出高频重组但不改变细胞活力的酵母染色体上的任何另外的基因座。
[0117] 术语"表达"或"表达系统"或"表达盒"是指可操纵连锁中包含所需的编码序列和 控制序列的核酸分子,使得用这些序列转化或转染的宿主能够产生编码的蛋白质。为了产 生转化,表达系统可包含在载体上;但是,相关的DNA接着也会整合到宿主染色体中。
[0118] 术语"基因"还可包括基因的DNA片段,特别是那些部分基因。片段还可包含几个 相同0RF或不同0RF的重复的开放阅读框。该术语可特别地包括非编码(例如非转录或非 翻译序列)或编码多肽的核苷酸序列,可以是整体的,也可以是部分的。
[0119] 本发明使用的术语"基因 A"可指非编码序列或编码目标多肽或多个多肽的序列的 任何核苷酸序列。基因 A的特征在于其展示在遗传构造的框架内,所述遗传构造例如表达 盒、线性多核苷酸、质粒或载体,其优选包含至少一标记序列并具有位于基因 A或遗传构造 的5'末端或3'末端的单个旁侧目标序列。在本发明的方法中,基因 A通常是用于形成基 因嵌合体的待重组的一些基因的第一基因。基因 A与待重组的另一基因是同源的,所述另 一基因最终为基因 A的变体,或根据情况,为基因匕(:、044、6、!1等的任一种。因此,为了 达到最大的保真度的目的,通常仅为每个基因 A提供一个旁侧目标序列。基因 A的变体称 为基因 A1、A2、A3等,其具有某一程度的序列同源性,并可选地具有相似的功能性特点。术 语"至少一种基因 A"指至少基因 A,以及可选的基因 A的变体。
[0120] 本发明使用的术语"基因 B"指非编码序列或编码目标多肽或多个多肽的序列的任 何核苷酸序列,其经选择用于与待重组的另一基因形成基因嵌合体,所述待重组的另一基 因最终为基因 A、基因 B的变体,或根据情况,为基因(:、0』、?、6、!1等的任一种。基因8与 基因 A或其它基因具有一定程度的同源性,以与基因 A或其它待重组的基因形成嵌合体。在 本发明的方法中,基因 B通常是用于形成基因嵌合体的待重组的一系列基因的最后基因。 基因 B可以是细胞基因组整体的一部分,或展示在遗传构造的框架中,所述遗传构造例如 表达盒、线性多核苷酸、质粒或载体,优选在基因 B或遗传构造的5'末端或3'末端包含至 少一标记序列并具有单个旁侧目标序列,作为基因 A旁侧目标序列的对应物,S卩,在该基因 的相对末端。如果基因 A的旁侧目标序列位于基因 A的5'末端,那么,基因 B的旁侧目标 序列通常会在3'末端,反之亦然。因此,为了达到最大保真度的目的,通常仅为每个基因 B 提供一个芳侧目标序列。基因 B可以是基因 A的变体。基因 B的变体称为基因 Bl、B2、B3 等,其具有一定程度的序列同源性,并可选地具有相似的功能性特点。术语"至少一种基因 B"指至少基因 B,以及可选的基因 B的变体。
[0121] 本发明使用的术语"基因 C "指非编码序列或编码目标多肽的序列的任何核苷酸 序列。基因 C的特征在于其展示在遗传构造的框架中,所述遗传构造例如表达盒、线性多 核苷酸、质粒或载体,其可选包含标记序列,基因 c进一步的特征在于与基因 A和/或基因 B、基因 C的变体或最终地根据情况与基因 D、E、F、G、Η等的序列同源的核苷酸序列的片 段。基因 C优选在基因 C的5'末端或3'末端处具有单个旁侧目标序列,或在两侧均具有 旁侧目标序列。因此,基因 C可部分或全部与基因 Α和/或待重组的其它基因杂交、连接并 组装基因。本发明的方法中,基因 C通常为用于形成基因嵌合体的一系列待重组基因中基 因 A后的第二基因。基因 C的变体称为C1、C2、C3等,其具有一定程度的序列同源性,并可 选地具有相似的功能性特点。
[0122] 另一基因 D可通过其核苷酸序列或其核苷酸序列的片段的杂交额外地被重组并 组装,所述片段与基因 C、基因 D的变体或根据情况与最终的其它基因 A、B、E、F、G、Η等的 序列同源,以提供相应的重组和连接。基因 D优选在基因 D的5'末端或3'末端具有单个 旁侧目标序列,或在两侧都具有旁侧目标序列。在本发明的方法中,基因 D通常是用于形成 基因嵌合体的待重组的一系列基因中基因 C后的下一基因。基因 D变体称为D1、D2、D3等, 其具有一定程度的序列同源性,并可选地具有相似的功能性特点。
[0123] 另一基因 E可通过其核苷酸序列的片段额外地被重组并组装,所述片段与基因 D、 基因 E的变体或根据情况与最终的其它基因 A、B、C、F、G、H等的序列同源,以提供相应的重 组和连接。基因 E优选在基因 E的5'末端或3'末端具有单个旁侧目标序列,或在两侧都 具有旁侧目标序列。在本发明的方法中,基因 E通常是用于形成基因嵌合体的待重组的一 系列基因中基因 D后的下一基因。基因 E的变体称为E1、E2、E3等,其具有一定程度的序列 同源性,并可选地具有相似的功能性特点。
[0124] 相应地可使用进一步的基因 F、G、H等。进一步的基因系列理解为不受字母数目的 限制。最终的目标基因链可通过与基因 A和B连接来获得,以在基因组的整合位点处获得基 因组装体。这样组装的目标基因可操作地连接,以分别支持相应目标多肽和代谢产物的表 达。一个特定的组装方法通过体内重组采用表达盒的结合来组装甚至大量的DNA片段,以 获得尺寸十分大的所需DNA分子。代表重叠序列的盒经合适地设计以覆盖整个所需序列。 在一个实施方案中,优选的重叠为至少约5bp,优选地至少约10bp。在另一个实施方案中, 重叠为至少15bp,优选地至少20直至lOOObp。
[0125] 在一个优选的实施方案中,某些盒经设计包含能够用于鉴定的标记序列。通常,标 记序列位于容纳转座子插入的位点,以使对最终所需核酸序列的生物作用最小化。
[0126] 在一个特定的实施方案中,宿主细胞能够重组或组装甚至大量的带有重叠序列的 核酸基因或DNA片段(例如,宿主细胞中至少2,优选至少3、4、5、6、7、8、9,更优选至少10 个基因或核酸片段),其方式是通过与所述基因或片段混合物一起共转化,并培养所述宿主 至重组或组装序列被转化。
[0127] 本发明使用的整体或部分的基因或DNA片段,可以是双链的或单链的。双链核酸 序列通常为300-20000个碱基对,单链片段通常较短,范围为40-10000个核苷酸。例如,数 量为2Mb直至500Mb的组装体可在酵母中组装。
[0128] 来自大量生物体的基因组序列是公开可获得的,并可用在本发明的方法中。这些 基因组序列优选包括获自不同宿主细胞株或不同种的信息,以提供具有特定差异性的同源 序列。
[0129] 用作重组底物的最初基因通常为包含基因的变体形式的多核苷酸集合体。变体形 式显示出在底物之间足以同源重组的相互的相当的序列一致性。多核苷酸之间的差异性 可以是天然的,例如等位基因或种的变体,可以是诱导的,例如易错PCR或易错循环序列重 组、或可以是体外重组的结果。差异性可来自利用其它密码子编码天然蛋白的再合成基因。 底物之间应有至少足够的差异性,这样,重组可产生比起始材料更多差异性的产物。必须有 至少两种在至少一个或多个位置上不同的底物。差异性程度取决于将要重组的底物的长度 和待引起的功能性转变的程度。位置差异性通常高达69%。
[0130] 根据本发明方法,优选基因 A、B、C和进一步的基因至少在设计用于杂交的特定片 段处具有至少30%的同源性,所述特定片段可包括全长基因。优选的同源性百分比为至少 40%,更优选为至少50%,更优选为至少60%,更优选为至少70%,更优选为至少80%,更 优选为至少90%,甚至更优选为至少95%,直至小于99. 5%。
[0131] 根据本发明,特别地产生了基因嵌合体,其中具有某一同源性的基因被重组,例如 同源性为至少30%,以及产生了至少一种基因内基因嵌合体。因此,基因,例如基因变体,可 被重组。
[0132] 根据一个特定的实施方案,产生了一基因嵌合体,其中基因被组装。在这种情况 下,基因可在待重组的特定区域内具有同源性或部分同源性,即重叠,或甚至无同源性。优 选至少3bp的重叠。在没有重叠的情况下,基因被组装以将一个基因的3'末端与另一基因 的5'末端联合(align)。
[0133] 从而,编码不同功能的序列或蛋白质(例如参与微生物代谢途径的蛋白质)的基 因可优选被组装。
[0134] 本文使用的术语"组装体"特别地指将核苷酸序列联合并可选地融合以产生基因 构造体,这些基因一起发挥作用以提供相连的活性或处理。因此,本文中基因组装体理解为 一系列基因(术语"基因"在本文中总是理解为包括非编码序列、部分基因或基因,例如至 少3直至20000bp)或一串基因,例如一基因队列,不考虑顺序。本发明的组装体特别地提供 用于基因内基因嵌合体。优选地,用本发明方法,组装体额外地提供至少一个基因内基因嵌 合体,例如通过利用基因变体加上各种不同基因以提供两者,基因内和基因间基因嵌合体。
[0135] 在许多情况下,可能希望简单地组装,例如串联在一起以及可选地将这些基因与 基因变体混合,以使较大基因差异化,较大基因例如独立的代谢途径的成员,或使多重代谢 途径根据此方法组装。在自然界中不存在的代谢途径可以这种方式构建。因此,一种生物 体中存在的酶,所述酶作用于缺乏这种下游酶的不同生物体产生的目标底物,可以通过构 建基因或部分基因的组装体以获得重组酶来编码在相同的生物体中。因此,可将多种酶包 括在内以构建复合代谢途径。这是有利的,如果一簇多核苷酸或部分多核苷酸按照途径内 它们的生物化学功能进行布置。示例性目标基因途径编码酶,用于合成工业目的的次级代 谢产物,例如黄酮醇、大环内酯、聚酮等。
[0136] 此外,组合文库可通过混合片段来制备,其中一个或多个片段带有相同的杂交序 列,但是具有编码酶或其它蛋白质的不同中间序列。
[0137] 遗传途径可以组合方式构建,使得组合文库的每个成员具有基因变体的不同组 合。例如,变体的组合文库可从单独的DNA元件构建,其中不同的片段被重组和组装,以及 其中每个不同的片段具有几种变体。代谢途径的重组和组装可能不需要存在标记序列来证 实设计成功。可行实施例早已表明代谢产物以所需方式表达。代谢途径的成功重组和组装 可,例如,通过检测细胞培养基中的次级代谢产物来确定。
[0138] 真核宿主细胞被考虑用于本文公开的方法,包括酵母宿主细胞,例如酿酒酵母、 昆虫宿主细胞,例如草地夜蛾(Spodooptera frugiperda),或人宿主细胞,例如HeLa和 Jurkat〇
[0139] 优选的宿主细胞是单倍体细胞,例如来自假丝酵母属(Candida sp)、毕赤酵母属 (Pichia sp)和酿酒酵母属。
[0140] 本发明方法不使用有性周期或减数分裂重组。DNA片段可以转化到单倍体细胞中。 转化体可立即划线接种在选择平板上。然后,通过PCR或其它方法,如缺口修复,分离重组 体。
[0141] 本发明方法在敲除了 DNA修复基因(优选那些RAD1和RECQ基因缺陷同系物)的 任何真核细胞内实施。
[0142] 特别地,DNA修复基因的敲除可为整体或部分基因删除、这些基因的突变(包括删 除、插入和/或取代),或任何其它短暂或永久损害DNA修复的策略,包括DNA修复内包含的 基因的突变、用UV线处理、用化学物质例如2-氨基嘌呤处理、诱导表达或抑制DNA修复中 包含的基因,例如通过可调节的启动子,其能够短暂灭活和激活。
[0143] 细菌DNA修复系统已被广泛地研究。在其它系统例如酵母中,已鉴定出几种基因, 其产物与细菌DNA修复系统同源,例如参考RAD1或RECQ的同系物。
[0144] 在真核细胞中,RECQ DNA解旋酶包括基因组稳定性和抗DNA损伤剂所需的蛋白质 家族。酵母酿酒酵母和粟酒裂殖酵母每种分别包含单个RECQ解旋酶、Sgsl和Rqhl。SGS1 的突变导致重组率和受损孢子率增加,以及对DNA损伤剂的敏感度提高。从DNA合成抑制 恢复通常被认为是RECQ DNA解旋酶的保守功能。因此,令人惊讶的是,根据本发明,敲除了 这类基因的真核株系可用作体内重组的宿主以提供基因嵌合体,而无需显著地损害细胞。
[0145] 优选的DNA修复缺陷细胞的实例是特定的酵母细胞,例如删除了相应基因如 SGS1的酿酒酵母株。示例性宿主细胞可从市面上购买,例如删除了 SGS1的株系(Acc. N° Y00775, Euroscarf Frankfurt)〇
[0146] 本发明的方法主要采用标记辅助选择成功重组的产物。使用工具例如分子标记或 DNA指纹可绘制目标基因图谱。这能够筛选大量细胞以获得具有目标特征的细胞选择。筛 选基于是否存在或不存在某种基因。
[0147] 本发明使用的术语"选择标记"指蛋白质编码或非编码DNA序列,其提供了成功整 合后的标记。特别地,蛋白质编码标记序列选自:营养标记、色素标记、抗生素抗性标记、抗 生素敏感标记、荧光标记、敲入标记、激活剂/结合区域标记以及显性隐性标记、比色标记 以及编码酶的不同亚单元的序列,所述酶仅在两个或多个亚单元在相同细胞内表达时发挥 作用。该术语还指待重组的可追踪基因,其可用于直接确定基因嵌合体,而无需使用另外的 标记序列。
[0148] "营养标记"是编码基因产物的标记序列,所述基因产物可补偿细胞的营养缺陷, 并因此赋予营养缺陷细胞原养型。根据本发明,术语"营养缺陷"指细胞必须在包含不能由 营养缺陷细胞自身产生的必须营养素的培养基中生长。营养标记基因的基因产物促进了营 养缺陷细胞中缺失的这种必须营养素的合成。通过成功地表达营养标记基因,就不需要将 这种必须营养素添加到细胞生长的培养基中。
[0149] 优选的标记序列是 URA3、LEU2、CAN1、CYH2、TRP1、ADE1 和 ΜΕΤ5。
[0150] 编码"色素标记"的基因将编码色素合成中包含的基因产物,其表达时可将细胞染 色。从而提供了成功表达色素标记的细胞的快速表型检测。
[0151] "抗生素抗性标记"是编码一基因产物的基因,所述基因产物能够使细胞在存在一 浓度的抗生素下生长,其中不表达所述产物的细胞不能生长。
[0152] "抗生素敏感标记"是标记基因,其中基因产物在抗生素存在下抑制表达所述标记 的细胞的生长。
[0153] "敲入"标记理解为一核苷酸序列,其代表敲除细胞的缺失连接,从而使细胞在成 功重组后生长和发挥作用。敲除细胞是经遗传改造的细胞,其中一个或多个基因通过定向 突变被关闭。这类缺失基因可合适地用作敲入标记。
[0154] "荧光标记"是指编码荧光团的核苷酸序列,所述荧光团可通过发射相应的荧光信 号来检测。在不同荧光标签的基础上,细胞可通过熟知的流式细胞技术容易地进行分类。
[0155] 用于差异化或重组的基因可以是非编码序列或编码多肽的序列或蛋白质编码序 列或它们具有足够序列长度用于成功的重组事件的部分或片段。更特别地,所述基因具有 3bp的最小长度,优选至少100bp,更优选至少300bp。
[0156] 根据本发明获得的优选基因嵌合体为至少3,优选多达20000个碱基对,优选的范 围为300-10000bp ;特别优选的是至少500bp或至少lOOObp的大DNA序列。
[0157] 特别地优选的基因嵌合体的特征在于每700个碱基对至少3个互换事件,优选地, 每700个碱基对至少4个互换事件,更优选每700个碱基对或每500个碱基对至少5、6、7 个互换事件,包括单个核苷酸或至少1,优选至少2、3、4、5、10、20到更多个核苷酸序列的片 段的交叉。
[0158] 根据本发明的方法,在一个单次重组的基因内不仅可获得奇数而且还可以获得偶 数个重组事件。这相对于减数分裂体内重组来说是一个特别的优势。
[0159] 重组嵌合体的复合形式可通过本发明方法获得,在一个单分子内获得大量不同长 度的重组序列段。此外,可获得对应于一条模板的核苷酸的点状取代,作为有关开放阅读框 的框的差异性的重要来源。嵌合性和点状交换在蛋白质水平无需是保守的。实际上,不同 极性的新氨基酸可在重组后产生,给予通过这种方法获得的重组蛋白质新的潜力和酶蛋白 性质。
[0160] 优选地,基因为蛋白质编码序列或其编码治疗或工业应用的酶和蛋白质的片段部 分。在下文中,术语"多肽"包括具有至少2个氨基酸的目标肽,优选至少3个多肽和蛋白 质。优选选出目标多肽,但不限于酶、免疫球蛋白超家族的成员,例如抗体或抗体区域或片 段、细胞因子、疫苗抗原、生长因子和肽。
[0161] 酶催化剂由于具有高选择性而合适地用在许多工业过程中。本发明用于差异化 的优选的酶包括蛋白水解酶,例如枯草杆菌蛋白酶;纤维素分解酶,例如纸浆和纸张工业中 使用的细胞壁松弛酶,葡萄糖内切酶,淀粉蔗糖酶,醛缩酶,糖激酶,纤维素,淀粉酶,木聚糖 酶,葡萄糖脱氢酶和β -葡萄糖苷酶,漆酶;用在精细化合物、农用化学品和药品合成中的 脂肪酶;酯酶,例如用于生产生物燃料。酶改进的一个优选实例是乙醇脱氢酶的生产,其具 有改进的热稳定性。
[0162] 根据显示,甚至是编码具有复杂结构和折叠的多链多肽的基因也可以被重组和组 装。优选的实例是免疫球蛋白超家族的成员,其中免疫球蛋白和多肽具有相同的结构特征, 免疫球蛋白具有称为免疫球蛋白域或折叠的域,包括细胞表面抗原受体、免疫系统的共受 体和共刺激分子、包含于呈递至淋巴细胞的抗原呈递中的分子、细胞粘附分子、某些细胞激 素受体和细胞内肌肉蛋白。优选地,抗体或抗体片段,如Fab、Fv或scFv被重组和组装。
[0163] 或者,嵌合体基因也可以是非蛋白编码序列,例如包括在蛋白编码序列的表达调 节中的序列,甚至是作为短或长的非编码RNA的调节序列。这些可以是,但不限于是启动子 序列、内含子序列、编码用于多腺苷酸化信号的序列。
[0164] 在本发明的一个优选实施方案中,嵌合体基因的组装、其与宿主基因组的重组,以 及进一步,嵌合体基因的表达在单个步骤过程中进行,以产生目标重组多肽或所述宿主细 胞的代谢产物。
[0165] 根据本发明,可以采用本领域中的常规分子生物学、微生物学、和重组DNA技 术。这些技术在文献中得到充分的解释。参见,例如,Maniatis,Fritsch&Sambrook, "《Molecular Cloning:A Laboratory Manual (分子克隆:实验室手册)》(1982) "。
[0166] 对于体内重组,利用标准的转染技术,使用待与基因组或其它基因重组的基因转 染宿主。在一个合适的实施方案中,提供复制原点的DNA包括在构造体内。复制原点可合 适地由本领域技术人员进行选择。根据基因的性质,如果序列已在基因或基因组中存在,其 自身可用作复制原点,可能不需要附加的复制原点。
[0167] 合成核酸序列或盒以及子集可以以线性多核苷酸、质粒、巨大质粒、合成或人工染 色体,例如植物、细菌、哺乳动物或酵母人工染色体的形式产生。
[0168] 当这类DNA引入到细胞内部时,细胞可被外源性或异源性DNA转化。转化DNA可 以被整合,也可以不被整合,所述整合即共价连接到细胞基因组内。例如在酵母和哺乳动物 细胞中,转化DNA可保持在附加元件例如质粒上。对于真核细胞,稳定转化细胞是转化DNA 已整合到染色体内使得子细胞可通过染色体复制而遗传的细胞。这种稳定性被真核细胞建 立包含转化DNA的子细胞群的细胞系或克隆的能力所证实。
[0169] 可将不同的基因底物纳入质粒内。质粒常为标准克隆载体,例如细菌多拷贝质粒。 底物可纳入相同或不同的质粒内。通常使用具有不同类型可选标记的至少两种不同类型的 质粒,以选择包含至少两种类型载体的细胞。
[0170] 包含不同基因底物的质粒开始时通过任何方法(例如,化学转化、自然能力、电穿 孔、基因枪、包装到噬菌体或病毒系统内)引入细胞内。通常,质粒以饱和浓度或接近饱和 浓度(相对于最大转染能力)存在,以提高多于一种质粒进入相同细胞的几率。包含不同底 物的质粒可同时或分多轮进行转染。例如,在后一种方法中,细胞可用第一等分质粒、选定 并增殖的转染体转染,然后用第二等分质粒感染。优选的质粒是,例如,pUC和pBluscribe 衍生物如PMXY9、pMXY12以及pMIX-LAM或YAC衍生物如YCp50。
[0171] 可通过使所有基因底物参与重组来提高进化比率。这可通过将转染的细胞电穿孔 来达到。电穿孔的条件与传统用来将外源性DNA引入细胞的那些条件相同。进化比率也可 通过融合细胞以引起质粒或染色体交换来提高。
[0172] 融合可通过化学试剂如PEG或病毒蛋白质如流感病毒血球凝集素 HSV-lgB和gD 来诱导。进化比率也可以通过使用突变体宿主细胞(例如,细菌中的Mut L,S,D,T,H,酵母 中的类似突变体以及共济失调毛细血管扩张症(Ataxia telangiectasia)人细胞系)来提 商。
[0173] 带有重组基因的细胞对于所需的功能经历筛选或选择。例如,如果设计的底物包 含抗药性基因,本领域技术人员会对抗药性进行选择。
[0174] 一般来说,在本发明的重组方法中,获得所需表型的重组的最终产物在 0. 1% -50 %的位置上不同于起始底物,并且比率数量级超过(例如,超过10倍、100倍、 1000倍或10000倍)自然获得突变的比率。最终的基因嵌合体产物可转移到对于利用改组 DNA来生产的目的更理想的另一宿主中。
[0175] 在本发明优选的方法中,利用熟知的细胞展示系统,宿主细胞将基因嵌合体展示 在细胞表面上。通过这种杂交的差异化产生了大量变体,其可被合适地展示,以产生这些变 体的文库。
[0176] 合适的展示方法包括酵母展示和细菌细胞展示。特别优选的文库是酵母表面展示 文库,其在蛋白质工程和文库筛选中具有许多应用。这些文库提供用于多肽变体的合适选 择,其相对于野生型多肽具有增强的表型性状。优选地,使用基于细胞的选择方法,例如相 对于表面固定的配体。常用的选择技术包括分析和比较获自这种文库的突变多肽的属性和 野生型多肽的属性。改善所需属性包括改变配体多肽结合属性的特异性或亲和性,所述配 体多肽可以与受体结合。多肽亲和性的成熟(maturation)是本发明的一个特别优选实施 方案。变体的进一步所需属性是稳定性,例如热稳定性、pH稳定性、蛋白酶稳定性、溶解性、 目标重组多肽的产量或分泌水平。
[0177] 本发明方法获得的文库包括高百分比的功能性嵌合基因的潜在先导候选物,其可 在功能性0RF中表达。优选的文库在功能性0RF内具有至少80%的基因嵌合体,优选至少 85%、至少90%,甚至至少95%。本发明提供的文库特别地进一步的特征在于标记序列的 存在,表明成功杂交的百分比高。根据本发明,不仅可获得奇数而且可获得偶数数目的嵌合 块(mosaic patches),其增加了所述方法产生的重组文库中变体或文库成员的数目。
[0178] 通常,本发明文库包括基因嵌合体的至少10种变体,优选至少100,更优选至少 1000,更优选至少1〇4,更优选至少1〇5,更优选至少1〇6,更优选至少1〇 7,更优选至少1〇8,更 优选至少1〇9,更优选至少1〇1(1,更优选至少10 11,直至1〇12,甚至数目更高的变体是可行的。
[0179] 本发明的方法可提供包含至少102个表达基因嵌合体的功能性变体的独立克隆的 文库。本发明还提供了一池(pool)预先选定的独立克隆,例如亲和力成熟的克隆,这池克 隆优选包括至少10个,更优选至少100个,更优选至少1000个,更优选至少10000个,甚至 多于100000个独立克隆。根据本发明,那些文库包含预先选定的池,是选择高亲和力变体 的优选来源。
[0180] 本发明使用的文库优选包括至少1〇2个文库成员,更优选至少1〇3个,更优选至少 1〇4个,更优选至少1〇5个,更优选至少1〇6个文库成员,更优选至少1〇 7个,更优选至少1〇8 个,更优选至少1〇9个,更优选至少101°个,更优选至少1011个,直至1〇 12个文库成员,优选 获自父本基因,以为相应的目标多肽设计新的属性。
[0181] 优选地,文库为酵母文库,以及酵母宿主细胞优选将有生物活性的目标多肽展示 在细胞表面。或者,产物可停留在细胞内,或分泌到细胞外面。酵母宿主细胞优选选自酿 酒酵母属、毕赤酵母属、汉逊氏酵母属、裂殖酵母属、克鲁维酵母属、耶氏酵母属和假丝酵母 属。最优选的是,宿主细胞为酿酒酵母。
[0182] 此处描述的实例是对本发明的说明,并不构成对本发明的限制。本发明的不同实 施方案已根据本发明进行了描述。对此处描述和阐明的技术的许多改动和变化并不背离本 发明的精神和范围。因此,应当理解,实施例仅为说明,并非对发明范围的限制。
[0183] 实施例
[0184] 实施例1
[0185] 描述
[0186] 在我们的实验开始时,我们使用0ΧΑ类的β内酰胺酶基因作为待重组的底物。0ΧΑ 基因的优点在于存在可用的不同差异性(从5-50%)的半同源基因。因此,这些基因是良 好的候选物以测试体内重组差异性的极限。这些基因也容易处理(大约800bp长)。
[0187] 图4显示了 0ΧΑ重组底物:基因和同源性
[0188] 表1 :0xa基因的序列一致性
[0189]

【权利要求】
1. 一种通过体细胞在体内重组产生基因嵌合体的方法,包括: a) 在单个步骤过程中 (i) 用至少一种基因 A转化一细胞,所述基因 A与待重组的另一基因的序列同源性小于 99. 5%,所述待重组的另一基因为细胞基因组的一整体部分或存在于遗传结构的框架中, (ii) 将两种所述基因重组; (iii) 在目标基因组的整合位点处产生基因的基因嵌合体,其中所述至少一种基因 A 在5'末端或3'末端具有单个旁侧目标序列,锚定到所述整合位点的5'或3'末端,以及 b) 选择包含所述基因嵌合体的克隆, 其中所述细胞为敲除了至少一个DNA修复基因的真核株系。
2. 根据权利要求1所述的方法,其中所述DNA修复基因完全或短暂被敲除,优选通过突 变,例如删除和/或插入和/或取代一个或多个核苷酸。
3. 根据权利要求1或2所述的方法,其中所述DNA修复基因选自由RAD1和RECQ的同 源物组成的组。
4. 根据权利要求1-3中任一项所述的方法,其中所述株系选自:真菌、酵母、植物、昆虫 和哺乳动物细胞。
5. 根据权利要求1-3中任一项所述的方法,其中所述株系选自:酿酒酵母、裂殖酵母、 酿酒酵母、假丝酵母、克鲁维酵母、汉逊氏酵母、裂殖酵母、耶氏酵母、毕赤酵母、曲霉、果蝇 和隐杆线虫属。
6. 根据权利要求5所述的方法,其中所述株系选自:敲除了至少SGS1基因的酿酒酵 母、敲除了至少RQH1基因的粟酒裂殖酵母、敲除了至少dmblm基因的黒腹果蝇、敲除了至少 F18C5. 2和T04A11. 6基因之一的秀丽隐杆线虫、敲除了至少AtRECQLl-4和4B基因之一的 植物,以及敲除了至少BLM、WRN、RECQL、RECQL4和RECQL5基因之一的哺乳动物细胞。
7. 根据权利要求1-6中任一项所述的方法,其中选择标记用在基因嵌合体中以及根据 选择标记的存在选择克隆。
8. 根据权利要求1-7中任一项所述的方法,其中所述另一基因为细胞基因组的一部 分。
9. 根据权利要求1-8中任一项所述的方法,其中所述细胞用至少一种基因 A和至少一 种基因 B共转化,其中所述基因 A的单个旁侧目标序列锚定到所述目标基因组上整合位点 的5'末端,以及其中基因 B与锚定到整合位点3'末端的单个旁侧目标序列连接。
10. 根据权利要求1-9中任一项所述的方法,其中所述细胞用至少两种不同的基因 A1 和A2以及可选地与至少两种不同的基因 B1和B2共转化。
11. 根据权利要求1-10中任一项所述的方法,其中至少一种又一基因 C被共转化,所述 基因 C具有与基因 A和/或所述另一基因的序列杂交的序列,以获得所述又一基因 C与基 因 A和/或所述另一基因的组装体。
12. 根据权利要求1-11中任一项所述的方法,其中所述基因 A和/或所述另一基因编 码多肽或具有活性的多肽部分。
13. 根据权利要求11或12所述的方法,其中编码生物化学途径多肽的多个基因被重组 和组装。
14. 根据权利要求1-13中任一项所述的方法,其中所述旁侧目标序列为至少5bp。
15. 根据权利要求1-14中任一项所述的方法,其中所述旁侧目标序列与所述整合位点 的锚定序列具有30% -99. 5%的同源性,优选至少50%的同源性。
16. 根据权利要求1-15中任一项所述的方法,其中使用了选择标记,所述选择标记选 自:营养缺陷标记、抗生素抗性标记、荧光标记、敲入标记、激活/结合域标记和显性隐性标 记以及着色标记。
17. 根据权利要求1-16中任一项所述的方法,其中所述基因包含在线性多核苷酸、载 体或酵母人工染色体中。
18. 根据权利要求1-17中任一项所述的方法,其中所述基因为线性多核苷酸,优选 300-20000bp〇
19. 根据权利要求1-18中任一项所述的方法,其中具有基因内基因嵌合体的至少一个 克隆被选出。
20. 根据权利要求1-19中任一项所述的方法,其中具有基因组装体和至少一个基因内 基因嵌合体的至少一个克隆被选出。
21. 根据权利要求1-20中任一项所述的方法,其中获得至少3个直至20000个碱基对 的基因嵌合体,优选每700bp至少3个互换事件。
22. 根据权利要求1-20中任一项所述的方法,其中所述基因为非编码序列或编码选自 以下多肽的变体:酶、抗体及其部分、细胞因子、生长因子、疫苗抗原和肽。
23. -种基因变体的细胞展示方法,包括:使用权利要求1-22中任一项所述的方法产 生大量基因嵌合体,以及将所述大量基因嵌合体展示在所述细胞的表面上以获得嵌合体的 文库。
24. 可根据权利要求1-22中任一项所述的方法获得的基因嵌合体文库,其中至少80% 的基因嵌合体包含在功能性ORF中。
25. 根据权利要求24所述的文库,其包括大量含有所述基因变体的生物体。
26. -种生物体,其包含来自权利要求24或25任一项的文库的基因变体。
【文档编号】C12N15/90GK104105793SQ201280054695
【公开日】2014年10月15日 申请日期:2012年10月12日 优先权日:2011年10月12日
【发明者】R·潘查伊坦, A·卢克 申请人:埃微杰尼克斯有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1