转基因的位点特异性整合的制作方法

文档序号:16044783发布日期:2018-11-24 10:46阅读:353来源:国知局

本申请要求2016年4月11日提交的美国临时申请62/320,863的优先权,其全部内容在此参考并入。

发明领域

本发明一般涉及将转基因整合到细胞中特定基因组基因座中的方法。

背景技术

将转基因位点特异性地整合(即,敲入)到哺乳动物细胞染色体中的技术在基础和应用生物学中具有广泛的应用。用于位点特异性整合的典型方法涉及以下步骤:1)将含有目的基因的靶向性载体引入哺乳动物细胞中;和2)筛选和选择在特定基因组基因座上整合了所述目的基因的转染细胞。在特定基因组基因座处的整合效率通常非常低,并且筛选和选择的过程通常通过单细胞克隆实现,这很耗时且费力。此外,目的基因与载体骨架dna一起整合到基因组中通常会导致非期望的结果,例如目的基因的沉默。因此,一直需要开发方法来使得能够加速敲入的过程并产生不含靶向性载体的骨架dna整合的细胞。

发明概述

在一个方面,本公开提供了一种用于将目的转基因插入细胞基因组的方法。在一个实施方案中,所述方法包括这样的步骤:将靶向性构建体引入所述细胞中,所述细胞的基因组包含着陆架。所述着陆架依次包含(i)第一重组酶识别位点(rrs),(ii)第一负选择标记,和(iii)第二rrs。所述靶向性构建体包含(a)交换盒和(b)可选择的盒。所述交换盒依次包含(i)第三rrs,(ii)目的转基因,和(iii)第四rrs。所述可选择的盒包含第二负选择标记。所述方法还包括这样的步骤:在所述细胞中表达位点特异性重组酶,其中所述位点特异性重组酶识别至少所述第一和所述第三rrs。然后将所述细胞维持在这样的条件下:所述条件促进所述第一和所述第三rrs之间的重组,以及所述第二和所述第四rrs之间的重组,其中至少所述第一和所述第三rrs之间的重组由所述位点特异性重组酶介导。选择具有所述转基因的位点特异性整合的细胞。

在某些实施方案中,所述着陆架位于所述细胞的所述基因组的增强的基因表达区(ridge)。ridge的实例包括,但不限于,hipp11(h11)基因座、rosa26基因座或aavs1基因座。

在某些实施方案中,所述靶向性构建体是线性的或环状的。

在某些实施方案中,所述第一负选择标记可以与所述第二负选择标记相同。在某些实施方案中,所述第一负选择标记和所述第二负选择标记可以不同。在某些实施方案中,所述第一或所述第二负选择标记是胸苷激酶基因。

在某些实施方案中,所述着陆架还包括正选择标记。在某些实施方案中,所述正选择标记是氨基糖苷磷酸转移酶基因(新霉素抗性基因)、嘌呤霉素-n-乙酰转移酶(嘌呤霉素抗性基因)、杀稻瘟素s脱氨酶(杀稻瘟素s抗性基因)或潮霉素b磷酸转移酶基因(潮霉素抗性基因)。

在某些实施方案中,所述第一rrs与所述第二rrs相同。在某些实施方案中,所述第一rrs与所述第二rrs不同。在某些实施方案中,所述第三rrs与所述第四rrs相同。在某些实施方案中,所述第三rrs与所述第四rrs不同。在某些实施方案中,所述第一,所述第二,所述第三和所述第四rrs中的每一个均独立地选自下组:attb、attp、frt、loxp、其突变体和其串联重复序列。

在某些实施方案中,所述位点特异性重组酶选自下组:cre、flp、λ整合酶、γ-δ解离酶、tn3解离酶、sin解离酶、gin转化酶、hin转化酶、tn5044解离酶、is607转座酶、bxb1、wbeta、bl3、phir4、a118、tg1、mr11、phi370、spbc、tp901-1、phirv、fc1、k38、phibt1和phic31。

在某些实施方案中,所述第二和所述第四rrs之间的重组由第二位点特异性重组酶介导。

在某些实施方案中,所述着陆架还包含编码所述位点特异性重组酶的序列。

在某些实施方案中,所述细胞是哺乳动物细胞。在某些实施方案中,所述细胞是啮齿动物细胞。在某些实施方案中,所述细胞是人细胞。在某些实施方案中,所述细胞是胚胎干细胞或受精卵。

在某些实施方案中,所述选择步骤包括将所述细胞暴露于选择剂。在某些实施方案中,所述选择剂是更昔洛韦。

在另一个方面,本公开提供了一种分离的细胞,所述细胞包含着陆架,所述着陆架位于所述细胞基因组中的ridge处。所述着陆架依次包括(i)第一rrs,(ii)负选择标记,和(iii)第二rrs。在某些实施方案中,所述着陆架还包含正选择标记。在某些实施方案中,所述着陆架还包含编码位点特异性重组酶的多核苷酸序列,所述位点特异性重组酶识别至少所述第一或所述第二rrs。在某些实施方案中,所述第一和所述第二rrs是phic31attp(seqidno:1)。

在又一个方面,本公开提供了一种核酸构建体,其包含(a)交换盒和(b)可选择的盒。所述交换盒依次包含(i)第一rrs,(ii)所述目地转基因,和(iii)第二rrs。所述可选择的盒包含负选择标记。在某些实施方案中,所述第一和所述第二rrs是phic31attp(seqidno:2)。

参考以下描述、所附权利要求和附图,将更好地理解本发明的这些和其他的特征、方面和优点。

附图简述

图1的示意图显示了位点特异性整合目的基因的示例性方法。实心三角代表rrs1和rrs2,空心三角代表rrs3和rrs4。半实心三角代表重组后的杂合rrs。goi:目的基因。负选择标记:负选择标记。重组后,只有goi细胞的ki通过了负选择。

图2显示了细胞基因组安全港基因座中的示例性着陆架。所述着陆架含有通过t2a编码序列与胸苷激酶基因融合的嘌呤霉素抗性基因,然后其经由ires与phic31整合酶基因连接。嘌呤霉素抗性基因、胸苷激酶基因和phic31整合酶基因的侧翼为phic31识别位点attp。

图3显示了示例性的靶向性构建体,其在载体骨架中含有目的基因(goi)和胸苷激酶基因,所述目的基因的侧翼为两个phic31attb位点。

发明详述

在更详细地描述本公开之前,应理解,本公开不限于所描述的特定实施方案,因此当然可以改变。还应理解,本文使用的术语仅用于描述特定实施方案的目的,并不旨在进行限制,因为本公开的范围仅受所附权利要求的限制。

除非另外定义,否则本文使用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常理解的含义相同的含义。虽然与本文描述的方法和材料类似或等同的任何方法和材料也可用于本公开的实践或测试,但是现在描述的是优选的方法和材料。

本说明书中引用的所有出版物和专利均通过引用并入本文,如同每个单独的出版物或专利被具体和单独地指出通过引用并入本文并且通过引用并入本文以公开和描述与出版物所引用的方法和/或材料有关的方法和/或材料。任何出版物的引用都是针对其在提交日之前的公开内容的,并且不应被解释为承认本公开内容无权凭借在先公开而先于此类出版物。此外,所提供的出版日期可能与实际的出版日期不同,所述实际的出版日期可能需要独立地确认。

在阅读本公开内容时,对于本领域技术人员显而易见的是,本文描述和示出的每个单独实施方案具有离散的组件和特征,在不脱离本公开的范围或精神的情况下,其可以容易地与任何其他几个实施方案的特征分离或组合。任何列举的方法都可以按照所述事件的顺序或以逻辑上可能的任何其他顺序进行。

定义

除非上下文另有明确说明,否则本文使用的单数形式“一(a)”,“一个(an)”和“所述”包括复数指代。

本文使用的“细胞”可以是原核的或真核的。原核细胞包括例如细菌。真核细胞包括例如真菌、植物细胞和动物细胞。动物细胞(例如,哺乳动物细胞或人细胞)的类型包括,例如,来自循环/免疫系统或器官的细胞(例如,b细胞,t细胞,(细胞毒性t细胞、自然杀伤t细胞、调节性t细胞、t辅助细胞)、自然杀伤细胞、粒细胞(例如嗜碱性粒细胞,嗜酸性粒细胞,中性粒细胞和分叶过多的中性粒细胞)、单核细胞或巨噬细胞、红细胞(例如网织红细胞)、肥大细胞、血小板或巨核细胞、和树突细胞);来自内分泌系统或器官的细胞(例如,甲状腺细胞(如甲状腺上皮细胞、滤泡旁细胞)、甲状旁腺细胞(如甲状旁腺主细胞、嗜酸细胞)、肾上腺细胞(如嗜铬细胞)和松果体细胞(如松果体细胞));来自神经系统或器官的细胞(例如,成胶质细胞(如星形胶质细胞和少突胶质细胞)、小胶质细胞,大细胞神经分泌细胞、星状细胞、卜歇细胞和垂体细胞(如促性腺激素细胞、促皮质激素细胞、促甲状腺素细胞、亲躯体细胞和催乳细胞));来自呼吸系统或器官的细胞(例如,肺细胞(i型肺细胞和ii型肺细胞)、克拉拉细胞、杯状细胞、肺泡巨噬细胞);来自循环系统或器官的细胞(例如,心肌细胞和周细胞);来自消化系统或器官的细胞(例如,胃主细胞、壁细胞、杯状细胞、潘氏细胞、g细胞、d细胞、ecl细胞、i细胞、k细胞、s细胞、肠内分泌细胞、肠嗜铬细胞、apud细胞、肝细胞(如肝细胞和库普弗细胞));来自外皮系统或器官的细胞(例如,骨细胞(如成骨细胞、骨细胞和破骨细胞)、牙齿细胞(如成牙骨质细胞和成釉细胞)、软骨细胞(例如成软骨细胞和软骨细胞)、皮肤/毛细胞(如毛囊细胞、角质形成细胞和黑素细胞(痣细胞))、肌肉细胞(例如肌细胞),、脂肪细胞、成纤维细胞和肌腱细胞)、来自泌尿系统或器官的细胞(例如足细胞、肾小球旁细胞、肾小球内系膜细胞、肾小球外系膜细胞、肾近曲小管刷状缘细胞和致密斑细胞)、以及来自生殖系统或器官的细胞(例如,精子、足细胞、睾丸间质细胞、卵子、卵母细胞)。细胞可以是正常的,健康的细胞;或患病或不健康的细胞(例如,癌细胞)。细胞还包括哺乳动物受精卵或干细胞,其包括胚胎干细胞,胎儿干细胞,诱导的万能干细胞和成体干细胞。干细胞是能够经历细胞分裂周期同时保持未分化状态并分化成特化细胞类型的细胞。干细胞可以是全能干细胞、万能干细胞、多能干细胞、寡能干细胞和单能干细胞,其中任何一种都可以从体细胞诱导。干细胞还可包括癌症干细胞。哺乳动物细胞可以是啮齿动物细胞,如小鼠、大鼠、仓鼠细胞。哺乳动物细胞可以是兔形目细胞,例如兔细胞。哺乳动物细胞也可以是灵长类动物细胞,例如人细胞。在某些实例中,所述细胞是用于大规模生物生产的细胞,例如cho细胞。

应当注意,在本公开中,诸如“包含(comprises)”、“包括(comprised)”、“包含(comprising)”、“含有(contains)”、“含有(containing)”等术语具有美国专利法中所赋予的含义;它们是包容性的或开放式的,并且不排除其他未列举的元件或方法步骤。诸如“基本上由......组成”和“基本上由......组成”之类的术语具有美国专利法所赋予的含义;它们允许包括不会对要求保护的发明的基础特征的和新颖的特征产生实质性影响的其他成分或步骤。术语“由...组成(consistsof)”和“由...组成(consistingof)”具有美国专利法中所赋予的含义;即这些术语是封闭的。

本文使用的术语“构建体”或“核酸构建体”是指核酸,其中将目的多核苷酸序列插入到载体中。

术语“核酸”和“多核苷酸”可互换使用,并且是指任何长度的核苷酸聚合形式,脱氧核糖核苷酸或核糖核苷酸,或其类似物。多核苷酸可以具有任何三维结构,并且可以执行已知或未知的任何功能。多核苷酸的非限制性实例包括基因、基因片段、外显子、内含子、信使rna(mrna)、转移rna、核糖体rna、核酶、cdna、shrna、单链短或长rna、重组多核苷酸、分支多核苷酸、质粒、载体、任意序列的分离dna、对照区、任意序列的分离rna、核酸探针和引物。核酸分子可以是线性的或环状的。

在将核酸序列插入细胞的背景下,术语“引入”是指“转染”,或“转化”,或“转导”,并且包括提及将核酸序列掺入真核或原核细胞中,其中所述核酸序列可以瞬时存在于所述细胞中,或者可以被掺入到所述细胞的基因组中(例如,染色体,质粒,质体或线粒体dna),转化成自主复制子。可以使用本领域已知的任何方法将本公开所述的构建体引入细胞中。可以利用用于转染动物细胞的各种技术,包括,例如:显微注射,逆转录病毒介导的基因转移,电穿孔,转染等(参见,例如,keown等人,methodsinenzymology1990,185:527-537)。在一个实施方案中,通过病毒将所述构建体引入所述细胞。

术语“可操作地连接”是指这样的元件排列:其中所描述的组件被配置成执行它们的通常功能。因此,与多肽可操作地连接的给定信号肽指导所述多肽从细胞的分泌。在启动子情况下,与编码序列可操作地连接的启动子将指导编码序列的表达。启动子或其他控制元件不需要与所述编码序列邻接,只要它们起到指导其表达的作用即可。例如,介于中间的未翻译但已转录的序列可以存在于所述启动子序列和所述编码序列之间,并且所述启动子序列仍然可被认为与所述编码序列“可操作地连接”。

本文使用的“目的多核苷酸序列”是指人们希望插入基因组中的任何核酸片段。目的核酸片段的实例包括任何基因(如编码蛋白质,编码mirna、编码shrna、编码ncrna的基因等),例如治疗基因、标记基因、控制区域、产生性状的片段等。

本文使用的“启动子”包括涉及这样的dna区域:其位于转录起始的上游并参与识别和结合rna聚合酶和其他蛋白质以起始转录。启动子的实例包括但不限于cmv启动子、sv40启动子、ef1a启动子、pgk启动子等。

本文使用的“可选择标记”或“选择标记”是指这样的基因:其在细胞中的表达允许所述细胞在特定培养条件下富集或耗尽。可选择标记可以是外源基因或非天然表达的细胞基因,或者是在靶细胞群中天然表达但具有不适当水平的基因。如果基因的表达允许细胞在特定条件下富集,则可选择标记是“正选择标记”。通常,正选择标记是编码抗生素抗性的基因并且选择表达选择标记的细胞,所述选择包括将抗生素引入培养物中。在使用中,应用抗生素选择性地杀死或消除不表达所述标记物的细胞,留下表达抗生素抗性的细胞,得到纯化或富集的细胞群。正选择标记的实例包括氨基糖苷磷酸转移酶(新霉素抗性基因)、嘌呤霉素-n-乙酰转移酶(嘌呤霉素抗性基因)、潮霉素抗性基因和杀稻瘟素s脱氨酶(杀稻瘟素s抗性基因)。正选择标记的其他实例包括可用于通过细胞分选进行选择的基因,例如荧光蛋白和细胞表面标记物。相反,如果基因的表达允许细胞在特定培养条件下耗尽,则所述可选择标记是“负选择标记”。负选择标记的实例包括胸苷激酶基因。在使用中,应用更昔洛韦杀死表达有胸苷激酶的细胞。负选择标记的其他实例包括dt毒素、细胞死亡基因如trail、半胱天冬酶和bcl2家族基因。

本文使用的术语“重组酶”或“位点特异性重组酶”是指促进特定靶位点之间dna重排的高度特化的酶家族(greindley等人,2006;esposito,d.和scocca,j.j.,nucleicacidsresearch25,3605-3614(1997);nunes-duby,s.e.,等人,nucleicacidsresearch26,391-406(1998);stark,w.m.,等人,trendsingenetics8,432-439(1992))。事实上,所有位点特异性重组酶都可分为结构和机制各异的两组中的一组:酪氨酸(如cre,flp和λ整合酶)或丝氨酸(如phic31整合酶,γ-δ解离酶,tn3解离酶和gin转化酶)重组酶。两个重组酶家族都识别由两个反向重复的结合元件组成的靶位点,所述结合元件在间隔序列的侧翼,在间隔序列发生dna断裂和再连接。重组过程需要两个重组酶单体同时结合到各自靶位点:两个与dna结合的二聚体(四聚体)随后结合以形成突触复合物,导致交叉和链交换。在tn3解离酶中含有活化突变的tn3解离酶的“超活化”形式可以在没有辅助位点的28bp的核心位点处催化链交换,有可能通过所述四聚体的三级/四级结构的重构进行。

当用于描述两个多核苷酸序列时,术语“依次”表示所述两个序列不重叠,而所述第一序列可以位于所述第二序列的上游(5')或下游(3')。

本文使用的“位点特异性重组酶”是指这样的酶家族:其介导酶识别的特定dna序列之间的位点特异性重组。位点特异性重组酶的实例包括,但不限于,cre重组酶、flp重组酶、λ整合酶、γ-δ解离酶、tn3解离酶、sin解离酶、gin转化酶、hin转化酶、tn5044解离酶、tn3转座酶、睡美人转座酶、is607转座酶、bxb1整合酶、wbeta整合酶、bl3整合酶、phir4整合酶、a118整合酶、tg1整合酶、mr11整合酶、phi370整合酶、spbc整合酶、tp901-1整合酶、phirv整合酶、fc1整合酶、k38整合酶、phibt1整合酶和phic31整合酶。在某些实施方案中,所述位点特异性重组酶是单向重组酶。本文使用的“单向重组酶”是指这样的重组酶类酶:其识别位点在重组发生后被破坏。换句话说,在发生由所述重组酶介导的重组时,所述重组酶识别的序列转变为不被所述重组酶识别的序列,并且所述重组酶的持续存在不能逆转先前的重组事件。单向重组酶的实例包括,但不限于,phic31整合酶和bxb1整合酶。

本文使用的术语“载体”是指这样的媒介物:可以可操作地向其中插入编码蛋白质的多核苷酸以引起该蛋白质的表达。载体可用于转化、转导或转染宿主细胞,以使其携带的遗传元件在所述宿主细胞内表达。载体的实例包括质粒、噬菌粒、粘粒、人工染色体如酵母人工染色体(yac)、细菌人工染色体(bac)或p1衍生的人工染色体(pac)、细菌噬菌体如λ噬菌体或m13噬菌体、以及动物病毒。用作载体的动物病毒类包括逆转录病毒(包括慢病毒)、腺病毒、腺相关病毒、疱疹病毒(例如单纯疱疹病毒)、痘病毒、杆状病毒、乳头瘤病毒和乳头多瘤空泡病毒(例如sv40)。载体可含有多种用于控制表达的元件,包括启动子序列、转录起始序列、增强子序列、可选择元件和报告基因。此外,所述载体可以包含复制起点。载体还可包括有助于其进入细胞的材料,包括但不限于病毒颗粒、脂质体或蛋白质衣壳。

用于位点特异性整合的方法和组合物

在一个方面,本公开提供了用于将目的多核苷酸序列插入细胞中特定基因组基因座的方法和组合物。图1显示了用于位点特异性插入多核苷酸序列的方法的示例性实例。

如图1所示,所述方法涉及将靶向性构建体引入细胞中。所述细胞在特定的基因座中含有着陆架,其含有用于与所述靶向性构建体中的序列重组的序列,从而指导异源多核苷酸序列在所述特定的基因组基因座处的整合或“着陆”。所述着陆架包括第一负选择标记,其侧翼为一对重组酶识别位点(rrs1和rrs2)。rrs1可以与rrs2相同,也可以不同。所述着陆架可以在rrs1和rrs2之间含有其他元件。在一个实施方案中,所述着陆架包含识别至少rrs1或rrs2的重组酶。

在一个实施方案中,所述负选择标记是病毒胸苷激酶(tk)。胸苷激酶是atp-胸苷5'-磷酸转移酶,其将脱氧胸苷转化为脱氧胸苷5'-单磷酸,其进一步被磷酸化为脱氧胸苷二磷酸,然后分别被病毒胸苷激酶和核苷二磷酸激酶磷酸化为脱氧胸苷三磷酸。通过dna聚合酶将脱氧胸苷三磷酸掺入合成的dna分子中。一些dntp类似物如更昔洛韦(gcv)(一种2'-脱氧鸟苷的合成类似物)在其掺入合成的dna后具有能终止dna合成的能力。合成的终止触发凋亡信号级联。虽然gcv不被哺乳动物胸苷激酶识别,但其被某些病毒胸苷激酶例如单纯疱疹病毒-1胸苷激酶(hsv-tk)识别为底物。结果,表达hsv-tk的哺乳动物细胞将gcv转化为gcv磷酸盐,其被进一步磷酸化并掺入所述合成的dna中,导致合成终止和凋亡。

在另一个实施方案中,所述负选择标记是胞嘧啶脱氨酶。胞嘧啶脱氨酶将胞嘧啶水解成尿嘧啶并释放氨。在生理条件下,修饰的位点被内切核酸酶识别,然后dna中的磷酸二酯键被破坏,从而通过掺入新的胞嘧啶开始修复。然而,胞嘧啶脱氨酶也可以将5-氟胞嘧啶转化为5-氟尿嘧啶(5-fu)。因此,在提供无毒的前药5-fc时,胞嘧啶脱氨酶将其转化为高毒性的5-fu(一种胸苷酸合成酶的自杀抑制剂),导致细胞生长的抑制和凋亡。

在某些实施方案中,所述着陆架位于增强的基因表达区(ridge)。通过转录组图谱(transcriptomemapping)已经在全基因组中鉴定了ridge,其中高表达基因簇存在于其中(参见,zhou等人,2003,can.res.63:5781-5784;caron等人,2001,science291:1289-1292)。ridge的实例包括hipp11(h11)基因座、rosa26基因座、aavs1和多个抗生素抗性(mar)基因座。

可以使用本领域已知的方法将所述着陆架插入所述细胞中。例如,可以基于同源重组将所述着陆架插入特定的基因组基因座。通常,将含有着陆架序列的构建体引入细胞中,所述着陆架序列的侧翼为与所述特定基因组基因座(同源臂)中的序列同源的序列。由位点特异性核酸酶(例如cas9、talen、锌指核酸酶)产生的所述特定基因组基因座中的双链断裂或切口可以显著提升同源重组的效率。所述构建体还可含有可选择标记,例如正选择标记,以便于选择具有同源重组的克隆。因此,在一些实施方案中,所述着陆架还可包含正选择标记。

在某些实施方案中,所述着陆架中的元件如所述负选择标记可操作地与启动子连接。在某些实施方案中,所述着陆架还含有增强可选择标记或重组酶表达的序列或元件,例如polya序列、t2a编码序列、ires(内部核糖体进入位点)等。

所述靶向性构建体含有交换盒,所述交换盒包含侧翼为一对rrs(rrs3和rrs4)的目的基因(goi)。所述靶向性构建体的载体骨架含有第二负选择标记。在某些实施方案中,所述目的基因或所述第二负选择标记与启动子可操作地连接。在某些实施方案中,所述目的基因或所述第二负选择标记与polya序列可操作地连接。

为了促进所述目的基因的整合,配置所述着陆架和所述靶向性构建体,使得在存在合适的位点特异性重组酶的条件下,在rrs1和rrs3之间以及rrs2和rrs4之间发生重组。在某些实施方案中,rrs1和rrs3被同一种位点特异性重组酶识别,并且rrs2和rrs4被同一种位点特异性重组酶识别。在某些实施方案中,rrs1与rrs2相同,并且rrs3与rrs4相同。在这种情况下,一个位点特异性重组酶介导rrs1和rrs3之间的重组以及rrs2和rrs4之间的重组。在一些实施方案中,rrs1和rrs2具有不同的序列但可以被同一种位点特异性重组酶识别,例如,rrs2是rrs1的变体。在这种情况下,一种位点特异性重组酶可介导rrs1和rrs3之间的重组以及rrs2和rrs4之间的重组。由于rrs1和rrs2具有不同的序列,所以避免了rrs1和rrs4之间的重组或rrs2和rrs3之间的重组。在某些实施方案中,两种不同的位点特异性重组酶分别介导rrs1和rrs3之间的重组以及rrs2和rrs4之间的重组。

在某些实施方案中,可以通过将所述重组酶基因插入所述细胞的基因组中来实现所述位点特异性重组酶的表达。在一个实例中,所述重组酶基因包含在所述着陆架中。或者,可以通过向所述细胞中引入所述重组酶蛋白,mrna或含有所述重组酶基因的质粒来实现所述位点特异性重组酶的表达。

当将所述靶向性构建体引入所述细胞并表达所述位点特异性重组酶时,会发生一系列情形。第一种可能是,发生两个重组事件,一个在rrs1和rrs3之间,另一个在rrs2和rrs4之间。结果,所述目的基因被整合到特定的基因组基因座并取代所述负选择标记。第二种可能是,在rrs1和rrs4之间发生重组,并且在rrs2和rrs3之间发生另一个重组,导致所述负选择标记替换所述着陆架中的可选择标记。第三种可能是,没有发生重组或插入,并且所述着陆架是完整的。第四种可能是,所述靶向性构建体被随机插入到所述细胞的基因组中。在这种情况下,所述着陆架的序列会是完整的,并且所述第二负选择标记可以被插入到所述基因组中。第五种可能是,可以通过一个重组事件将所述靶向性构建体插入到所述着陆架中。图1列出了在这种可能性下的四种可能的结果。例如,如果在rrs1和rrs3之间发生重组,则所述第一负选择标记将持续存在于所述着陆架中。在所有上述可能性中,除第一种可能性外,所述细胞都含有负选择标记,即所述目的基因通过两个重组事件取代所述第一负选择标记。在存在合适的选择剂的情况下,所有含有所述负选择标记的细胞都将被耗尽。因此将选择适当整合了所述目的基因的细胞。

实施例

以下实施例描述了用于将目的多核苷酸序列插入细胞中特定基因组基因座的方法的示例性实施方案。它无意以任何方式进行限制。

我们使用了crispr介导的同源重组来产生hek293主细胞系,所述hek293主细胞系在rosa26基因座中含有插入的着陆架。如图2所示,所述着陆架含有与胸苷激酶基因(tk)连接的嘌呤霉素抗性基因(puro)(tk的氨基酸序列为seqidno:3,tk的核酸序列为seqidno:4)和t2a自切割肽基因(t2a)(t2a的氨基酸序列为seqidno:7,t2a的核酸序列为seqidno:8)。所述着陆架还在puro-t2a-tk融合基因的下游含有ires和phic31整合酶基因(phic31整合酶的氨基酸序列为seqidno:5,phic31整合酶的核酸序列为seqidno:6)。puro-t2a-tk融合基因,ires整合酶基因的侧翼是一对phic31识别位点attp。

然后我们用靶向性构建体转染了hek293主细胞系(如图3所示)。所述靶向性构建体含有gfp基因(goi),其侧翼是一对phic31识别位点attb。所述靶向性构建体还在所述构建体的骨架中含有tk表达盒。所述phic31整合酶的表达介导attp和attb位点之间的重组。观察到了具有gfp的高水平表达的细胞。

然后我们将更昔洛韦添加到了细胞混合物中,能存活下来的细胞只能是带有gfp基因通过整合酶介导的重组取代puro-tk-整合酶盒的细胞。结果,富集了在rosa26基因座插入了gfp基因的细胞,并且所述富集的细胞不含有所述靶向性构建体的骨架序列。

序列表

<110>应用干细胞有限公司

<120>转基因的位点特异性整合

<130>044903-8009wo01

<160>8

<170>patentin3.5版本

<210>1

<211>70

<212>dna

<213>人工序列

<220>

<223>合成

<400>1

gttttcgggagtagtgccccaactggggtaacctttgagttctctcagttgggggcgtag60

ggtcgccgac70

<210>2

<211>275

<212>dna

<213>人工序列

<220>

<223>合成

<400>2

cgatgtaggtcacggtctcgaagccgcggtgcgggtgccagggcgtgcccttgggctccc60

cgggcgcgtactccacctcacccatctggtccatcatgatgaacgggtcgaggtggcggt120

agttgatcccggcgaacgcgcggcgcaccgggaagccctcgccctcgaaaccgctgggcg180

cggtggtcacggtgagcacgggacgtgcgacggcgtcggcgggtgcggatacgcggggca240

gcgtcagcgggttctcgacggtcacggcgggcatg275

<210>3

<211>376

<212>prt

<213>人工序列

<220>

<223>合成

<400>3

metalasertyrproglyhisglnhisalaseralapheaspglnala

151015

alaargserargglyhisserasnargargthralaleuargproarg

202530

argglnglnglualathrgluvalargprogluglnlysmetprothr

354045

leuleuargvaltyrileaspglyprohisglymetglylysthrthr

505560

thrthrglnleuleuvalalaleuglyserargaspaspilevaltyr

65707580

valprogluprometthrtyrtrpargvalleuglyalasergluthr

859095

ilealaasniletyrthrthrglnhisargleuaspglnglygluile

100105110

seralaglyaspalaalavalvalmetthrseralaglnilethrmet

115120125

glymetprotyralavalthraspalavalleualaprohisilegly

130135140

glyglualaglyserserhisalaproproproalaleuthrleuile

145150155160

pheasparghisproilealaalaleuleucystyrproalaalaarg

165170175

tyrleumetglysermetthrproglnalavalleualaphevalala

180185190

leuileproprothrleuproglythrasnilevalleuglyalaleu

195200205

progluasparghisileaspargleualalysargglnargprogly

210215220

gluargleuaspleualametleualaalaileargargvaltyrgly

225230235240

leuleualaasnthrvalargtyrleuglncysglyglysertrparg

245250255

gluasptrpglyglnleuserglythralavalproproglnglyala

260265270

gluproglnserasnalaglyproargprohisileglyaspthrleu

275280285

phethrleupheargalaprogluleuleualaproasnglyaspleu

290295300

tyrasnvalphealatrpalaleuaspvalleualalysargleuarg

305310315320

sermethisvalpheileleuasptyraspglnserproalaglycys

325330335

argaspalaleuleuglnleuthrserglymetvalglnthrhisval

340345350

thrthrproglyserileprothrilecysaspleualaargthrphe

355360365

alaargglumetglyglualaasn

370375

<210>4

<211>1131

<212>dna

<213>人工序列

<220>

<223>合成

<400>4

atggcttcgtaccccggccatcaacacgcgtctgcgttcgaccaggctgcgcgttctcgc60

ggccatagcaaccgacgtacggcgttgcgccctcgccggcagcaagaagccacggaagtc120

cgcccggagcagaaaatgcccacgctactgcgggtttatatagacggtccccacgggatg180

gggaaaaccaccaccacgcaactgctggtggccctgggttcgcgcgacgatatcgtctac240

gtacccgagccgatgacttactggcgggtgctgggggcttccgagacaatcgcgaacatc300

tacaccacacaacaccgcctcgaccagggtgagatatcggccggggacgcggcggtggta360

atgacaagcgcccagataacaatgggcatgccttatgccgtgaccgacgccgttctggct420

cctcatatcgggggggaggctgggagctcacatgccccgcccccggccctcaccctcatc480

ttcgaccgccatcccatcgccgccctcctgtgctacccggccgcgcggtaccttatgggc540

agcatgaccccccaggccgtgctggcgttcgtggccctcatcccgccgaccttgcccggc600

accaacatcgtgcttggggcccttccggaggacagacacatcgaccgcctggccaaacgc660

cagcgccccggcgagcggctggacctggctatgctggctgcgattcgccgcgtttacggg720

ctacttgccaatacggtgcggtatctgcagtgcggcgggtcgtggcgggaggactgggga780

cagctttcggggacggccgtgccgccccagggtgccgagccccagagcaacgcgggccca840

cgaccccatatcggggacacgttatttaccctgtttcgggcccccgagttgctggccccc900

aacggcgacctgtataacgtgtttgcctgggccttggacgtcttggccaaacgcctccgt960

tccatgcacgtctttatcctggattacgaccaatcgcccgccggctgccgggacgccctg1020

ctgcaacttacctccgggatggtccagacccacgtcaccacccccggctccataccgacg1080

atatgcgacctggcgcgcacgtttgcccgggagatgggggaggctaactga1131

<210>5

<211>612

<212>prt

<213>人工序列

<220>

<223>合成

<400>5

metaspthrtyralaglyalatyraspargglnserarggluargglu

151015

asnserseralaalaserproalathrglnargseralaasngluasp

202530

lysalaalaaspleuglnarggluvalgluargaspglyglyargphe

354045

argphevalglyhispheserglualaproglythrseralaphegly

505560

thralagluargprogluphegluargileleuasnglucysargala

65707580

glyargleuasnmetileilevaltyraspvalserargpheserarg

859095

leulysvalmetaspalaileproilevalsergluleuleualaleu

100105110

glyvalthrilevalserthrglngluglyvalpheargglnglyasn

115120125

valmetaspleuilehisleuilemetargleuaspalaserhislys

130135140

gluserserleulysseralalysileleuaspthrlysasnleugln

145150155160

arggluleuglyglytyrvalglyglylysalaprotyrglypheglu

165170175

leuvalsergluthrlysgluilethrargasnglyargmetvalasn

180185190

valvalileasnlysleualahisserthrthrproleuthrglypro

195200205

phegluphegluproaspvalileargtrptrptrparggluilelys

210215220

thrhislyshisleuprophelysproglyserglnalaalailehis

225230235240

proglyserilethrglyleucyslysargmetaspalaaspalaval

245250255

prothrargglygluthrileglylyslysthralaserseralatrp

260265270

aspproalathrvalmetargileleuargaspproargilealagly

275280285

phealaalagluvaliletyrlyslyslysproaspglythrprothr

290295300

thrlysilegluglytyrargileglnargaspproilethrleuarg

305310315320

provalgluleuaspcysglyproileilegluproalaglutrptyr

325330335

gluleuglnalatrpleuaspglyargglyargglylysglyleuser

340345350

argglyglnalaileleuseralametasplysleutyrcysglucys

355360365

glyalavalmetthrserlysargglyglugluserilelysaspser

370375380

tyrargcysargargarglysvalvalaspproseralaproglygln

385390395400

hisgluglythrcysasnvalsermetalaalaleuasplyspheval

405410415

alagluargilepheasnlysilearghisalagluglyaspgluglu

420425430

thrleualaleuleutrpglualaalaargargpheglylysleuthr

435440445

glualaproglulysserglygluargalaasnleuvalalagluarg

450455460

alaaspalaleuasnalaleuglugluleutyrgluaspargalaala

465470475480

glyalatyraspglyprovalglyarglyshisphearglysglngln

485490495

alaalaleuthrleuargglnglnglyalaglugluargleualaglu

500505510

leuglualaalaglualaprolysleuproleuaspglntrpphepro

515520525

gluaspalaaspalaaspprothrglyprolyssertrptrpglyarg

530535540

alaservalaspasplysargvalphevalglyleuphevalasplys

545550555560

ilevalvalthrlysserthrthrglyargglyglnglythrproile

565570575

glulysargalaserilethrtrpalalysproprothraspaspasp

580585590

gluaspaspalaglnaspglythrgluaspvalalaalaprolyslys

595600605

lysarglysval

610

<210>6

<211>1839

<212>dna

<213>人工序列

<220>

<223>合成

<400>6

atggatacctacgccggagcctacgacagacagagccgggagagagagaacagcagcgcc60

gccagccccgccacccagagaagcgccaacgaggataaggccgccgatctgcagagagag120

gtggagagggacggcggcagattcagatttgtgggccacttcagcgaggcccctggcacc180

agcgccttcggcaccgccgagagacccgagttcgagagaatcctgaacgagtgtagggcc240

ggcaggctgaacatgatcatcgtgtacgacgtgtcccggttcagcaggctgaaggtgatg300

gacgccatccctatcgtgtccgagctgctggccctgggcgtgaccatcgtgtccacccag360

gaaggcgtctttagacagggcaacgtgatggacctgatccacctgatcatgaggctggac420

gccagccacaaggagagcagcctgaagagcgccaagatcctggacaccaagaacctgcag480

agggagctgggcggctatgtgggcggcaaggccccctacggcttcgagctggtgtccgag540

accaaggagatcacccggaacggcaggatggtgaacgtggtgatcaacaagctggcccac600

agcaccacccccctgaccggccccttcgagtttgagcccgacgtgatcaggtggtggtgg660

cgggagatcaagacccacaagcacctgcctttcaagcccggcagccaggccgccatccac720

cccggcagcatcaccggcctgtgtaagagaatggacgccgacgccgtgcccaccagaggc780

gagaccatcggcaagaaaaccgccagcagcgcctgggaccccgccaccgtgatgagaatc840

ctgagggaccctaggatcgccggcttcgccgccgaggtgatctacaagaagaagcccgac900

ggcacccccaccaccaagatcgagggctacagaatccagagagaccccatcaccctgaga960

cctgtggagctggactgtggccctatcatcgagcctgccgagtggtacgagctgcaggcc1020

tggctggacggcagaggcagaggcaagggcctgagcagaggccaggccatcctgagcgcc1080

atggacaagctgtactgtgagtgtggcgccgtgatgaccagcaagagaggcgaggagagc1140

atcaaggacagctaccggtgccggagaagaaaggtggtggaccccagcgcccctggccag1200

cacgagggcacctgtaatgtgagcatggccgccctggacaagttcgtggccgagcggatc1260

ttcaacaagatccggcacgccgagggcgacgaggagaccctggccctgctgtgggaggcc1320

gccagaagattcggcaagctgaccgaggcccccgagaagagcggcgagagggccaacctg1380

gtggccgagagagccgacgccctgaacgccctggaggagctgtacgaggacagagccgcc1440

ggagcctatgacggccctgtgggcaggaagcacttcagaaagcagcaggccgccctgacc1500

ctgagacagcagggcgccgaggaaagactggccgagctggaggccgccgaggcccctaag1560

ctgcccctggatcagtggttccccgaggatgccgacgccgaccccaccggccccaagtcc1620

tggtggggcagagccagcgtggacgacaagagggtgttcgtgggcctgttcgtggataag1680

atcgtggtgaccaagagcaccaccggcaggggccagggcacccccatcgagaagagagcc1740

agcatcacctgggccaagcctcccaccgacgacgacgaggatgacgcccaggacggcacc1800

gaggacgtggccgcccctaagaaaaagcggaaagtgtga1839

<210>7

<211>18

<212>prt

<213>人工序列

<220>

<223>合成

<400>7

gluglyargglyserleuleuthrcysglyaspvalglugluasnpro

151015

glypro

<210>8

<211>54

<212>dna

<213>人工序列

<220>

<223>合成

<400>8

gagggcaggggcagcctgctgacctgcggcgacgtggaggagaaccccggcccc54

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1