基因靶向序列盒的制作方法

文档序号:903783阅读:545来源:国知局
专利名称:基因靶向序列盒的制作方法
技术领域
本发明涉及基因靶向修饰和基因治疗,尤其涉及一种用于体细胞的基因敲出或置换的基因靶向序列盒。
背景技术
基因靶向(Gene Targeting)是利用同源重组原理改变或修饰细胞基因组的手段,其最突出的结果是能够精确地修正基因缺陷,是治疗已知基因异常所引起的疾病的一种理想方法(即基因治疗),近年来,人类基因组序列的完成更为改变或敲出目的基因提供了可行性。目前的功能基因组研究均不可避免地采用基因靶向研究某基因的功能,而绝大部分的研究都是利用小鼠为模型,定位敲出或改变小鼠胚胎干细胞的基因,并通过小鼠的杂交获得子代纯合子。但是对于转基因鼠的表型的研究用于推断人类基因的功能有很大的局限性,而且,转基因小鼠需经过胚胎发育而获得,限制了研究在胚胎发育中起作用的基因功能,例如敲出ATR会使小鼠早期胚胎致死(EricJ.Brownand David Baltimore,ATR disruption leads to chromosomal fragmentation andearly embryonic lethality,Genes & Dev.,Feb 2000;14397-402);BRCA1基因的破坏也会导致小鼠在胚胎期死亡(Chu-Xia Deng and Rui-Hong Wang,Roles of BRCA1 in DNA damage repaira link between development and cancer,Hum.Mol.Genet.,Apr 2003;12113-123)。因此生物科学家们在近年来越来越多地研究和采用直接改变体细胞基因位点研究其结构与功能。
与小鼠的胚胎干细胞(ES)不同,体细胞的同源重组(HR)率很低(约为10-7),而非同源性末端连接(NHEJ)的几率比前者高1000倍(Keren M.Vasquez,Kathleen Marburger,Zsofia Intody,and John H.Wilson,Manipulating themammalian genome by homologous recombination,PNAS 988403-8410,2001)。因此富集同源重组克隆是体细胞基因修饰的瓶颈难点。目前,一种被称为启动子陷阱(Promoter trap)的策略已被用于体细胞的靶向基因替换或敲出,并以取得成功(Brown,J.P.,Wei,W.and Sedivy,J.M.Bypass ofsenescence after disruption of p21CIP1/WAF1 gene in normal diploid humanfibroblasts.Science 277831-834,1997.和Chan,T.A.,Hermeking,H.,Lengauer,C.,Kinzler,K.W.and Vogelstein,B.14-3-3s is required to prevent mitotic catastropheafter DNA damage.Nature 401616-620,1999.)。其原理是利用被修饰的基因本身的启动子表达抗药标记基因,这就要求标记基因通过同源重组整合到正确的位置才能使克隆具有抗药性。这样可使同源重组子富集至少100倍(Sedivy,J.M.and Dutriaux,A.Gene targeting and somatic cell genetics-a rebirthor a coming of age?Trands Genet.,15,88-90,1999.)。可见体细胞基因靶向技术和策略对研究基因的结构和功能、研究染色体动态、以及基因治疗的应用有很关键性的帮助,也已经为越来越多的研究组列入研究计划中。
但是在构建基因靶向的载体(Gene targeting vector)中,各个实验室均从头拼凑各种所需的元件,也就是制备任何一个基因,均需要先专门构建一个序列盒,放置该基因序列(Chan,T.A.,Hermeking,H.,Lengauer,C.,Kinzler,K.W.and Vogelstein,B.14-3-3s is required to prevent mitotic catastrophe afterDNA damage.Nature 401616-620,1999.),费时费力,且实验成本高。本发明的创作人研究制成便于构建其他任何基因靶向载体的两种无启动子序列盒,使用者只需将5’-同源区和3’-同源区连接到序列盒的两侧的多酶克隆位点(MCS)即可获得用于目的基因导向载体。

发明内容
本发明的主要目的在于克服现有研究手段中存在的上述缺点,而提供一种无启动子的基因靶向序列盒(Cassette for gene targeting),构建一个含有与目的基因同源序列的靶向质粒,可在基因修饰(包括敲出、置换、和异源基因插入)中起到非常关键的作用,提高后续步骤的成功几率,并使构建操作更为方便,为使用者提供实用性广泛的载体骨架,通过本发明研制成功的便于构建其他任何基因导向载体的序列盒,使研究者只需将目的基因5’-同源区和3,-同源区连接到序列盒的两侧的MCS,即可获得用于目的基因导向载体;所述的MCS含有多个单一酶切点,为下游的质粒构建和线性化提供了多种选择性;可以有效地节省人力、物力、财力;本载体设计巧妙,用途广泛,填补目前国内和国际基因修饰载体构建领域的空白。
本发明的目的是由以下技术方案实现的。
本发明基因靶向序列盒,其特征在于,其包括内部核糖体进入位点(IRES)引导的抗药性标记基因区和两端的同向LoxP序列LoxP-IRES-Neor-PolyA-LoxP,该片段的上游端和下游端分别连接多个克隆酶切位点,以闭环质粒形式存在。
本发明基因靶向序列盒的构建方法,其特征在于,其构建方法是(1)以pLP-IRESneo(Clontech,USA)为模板,通过多聚酶链式反应(PCR)扩增基因片段IRES-Neor-PolyA合成寡聚脱氧核糖核酸为PCR反应的引物设计如下正向引物为24-30个核苷酸组成的寡核苷酸(24-30mer),其5’端含有一个平末端内切酶位点(如本案中PmeI),后接与模板IRES起始序列一致的寡聚核苷酸序列;反向引物为54-66mer寡核苷酸,其5’端含有一个34寡核苷酸的LoxP序列,其后续序列为与模板中的PolyA尾端反义链相同的20-27寡核苷酸;进行多聚酶链式反应(PCR),步骤和条件采用该反应(PCR)试剂盒的通常构建方法,即向反应混合物中加入正、反、两引物及四种脱氧核糖核苷酸,加入Taq聚合酶,将该混合物在92-98℃,加热5分钟,使模板DNA变性,经过94℃,10-30秒钟→50℃-60℃,15-40秒→72℃,1-2分钟的20-30个循环,合成1768碱基对(bp)的DNA片段,经凝胶电泳分离并纯化后连接入pCR2.1-TA(Invitrogen),转化大肠杆菌DH5α,获得质粒A;(2)5’端LoxP序列的插入和YC-Neo序列盒的构成设计并合成具有LoxP序列的寡核苷酸,正链5’端起为一限制性内切酶酶解后的粘性末端(本案用SpeI的粘性末端5’-CTAGT)后接LoxP的正链序列;反链为与之互补的LoxP负链序列,但在其5’端为PmeI内切酶水解后的序列,即5’-AAAC;将上述两寡核苷酸等量混合,用T4激酶磷酸化以上核苷酸的混合物,加热至90-98℃后退火至室温,得到双链DNA,一端为SpeI内切酶的粘性末端,另一端为PmeI内切酶的平末端;将之与上述A质粒用SpeI和PmeI限制性内切酶水解获得的开口质粒连接,即获得序列盒YC-Neo的5.6kb质粒(如图1所示;其DNA序列如表1所示)。
本发明基因靶向序列盒的应用,其特征在于,所述序列盒可用于无启动子基因靶向敲出和基因置换。
本发明基因靶向序列盒的应用,其特征在于,所述序列盒可用于培养包括悬浮细胞和贴壁细胞在内的哺乳动物细胞系。
上述为本发明的序列盒1,其指标及特点是1、以pLP-IRESneo(Clontech,USA)为模板,通过多聚酶链式反应(PCR)扩增基因片段IRES-Neor-PolyA;2、合成5’端LoxP序列,退火成双链DNA片段并连接到(1)的上游端,构成YC-Neo;3、该序列盒所在质粒为5.6Kb,(核苷酸序列见表1所示);
4、与pCR2.1骨架共存,为卡那霉素抗性,可保存于E.coli中,用一般的质粒DNA提取方法即可得到大量的载体,用于构建其他基因的靶向重组质粒。
5、两端都有MCS5’端单一限制性酶切点为Ecl136II,EcoICRI,Psp124BI,SacI,SstI,AclNI,BcuI,SpeI,SspI;3’端单一限制性酶切点为Eco32I,EcoRV,CciNI,NotI,Ama87I,AvaI,BcoI,BsoBI,Eco88O,PaeR7I,Sfr274I,XhoI,EcoT22I,Mph1103I,NsiI,Ppu10I,Zsp2I,XbaI.
本发明基因靶向序列盒,其特征在于,其包括抗药性标记基因和绿色荧光蛋白(EGFP)的基因在内的分别由IRES序列介导的双顺反子区域及两端的同向LoxP序列LoxP-IRES-GFP-IRES-Neor-PolyA-LoxP,该片段的上游端和下游端分别连接多个克隆酶切位点,且在Neor标记基因上游,连接有另一个基因,该基因为编码增强的绿色荧光蛋白。
本发明基因靶向序列盒的构建方法,其特征在于,其构建方法是(1)以pLP-IRESneo(Clontech,USA)为模板,通过多聚酶链式反应(PCR)扩增基因片段IRES-Neor-PolyA合成寡聚脱氧核糖核酸为多聚酶链式(PCR)反应的引物设计如下正向引物为24-30个核苷酸组成的寡核苷酸(24-30mer),其5’端含有一个平末端内切酶位点(如本案中PmeI)后接与模板IRES起始序列一致的寡聚核苷酸序列;反向引物为54-66mer寡核苷酸,其5’端含有一个34寡核苷酸的LoxP序列,后续序列为模板中的PolyA尾端反义链相同的20-27寡核苷酸;进行多聚酶链式反应(PCR),步骤和条件采用该反应(PCR)试剂盒通常的构建方法,即,向反应混合物中加入正、反、两引物、及四种脱氧核糖核苷酸,加入Taq聚合酶,将该混合物在92-98℃,加热5分钟,使模板DNA变性,将该混合物在92-98℃,加热5分钟,使模板DNA变性,经过94℃,10-30秒钟→50℃-60℃,15-40秒→72℃,1-2分钟的20-30个循环,合成1768碱基对(bp)的DNA片段,经凝胶电泳分离并纯化后连接入pCR2.1-TA(Invitrogen),转化大肠杆菌DH5α,获得质粒A;(2)5’端LoxP序列的插入和YC-Neo序列盒的构成设计并合成具有LoxP序列的寡核苷酸,正链5’端起为一限制性内切酶酶解后的粘性末端(本案用SpeI的粘性末端5’-CTAGT)后接LoxP的正链序列;反链为与之互补的LoxP负链序列,但在其5’端为PmeI内切酶水解后的序列5’-AAAC;将上述两寡核苷酸等量混合,用T4激酶磷酸化以上核苷酸的混合物,加热至90-98℃后退火至室温,得到双链DNA,一端为SpeI内切酶的粘性末端,另一端为PmeI内切酶的平末端;将之与上述A质粒用SpeI和PmeI限制性内切酶水解获得的开口质粒连接,即获得序列盒YC-Neo的5.6kb质粒;(3)荧光蛋白表达序列IRES2-EGFP片段的扩增以pIRES2-EGFP(Clontech)为模板进行多聚酶链式反应(PCR反应),其中,所用正向引物为21-27个核苷酸,其为序列与IRES2起始部位相同的寡核苷酸;反向引物为21-27个核苷酸,其为与EGFP的PolyA区结尾的序列互补的寡核苷酸;即向反应混合物中加入正、反、两引物、及四种脱氧核糖核苷酸,加入Taq聚合酶,将该混合物在92-98℃,加热5分钟,使模板DNA变性,将该混合物在92-98℃,加热5分钟,使模板DNA变性,经过94℃,10-30秒钟→50℃-60℃,15-40秒→72℃,1-2分钟的20-30个循环,获得1320碱基对(bp)的DNA片段,末端用Klenow酶作用补齐为平末端;(4)将(2)中得到的YC-Neo质粒用PmeI内切酶水解,获得平末端质粒,将(3)中得到的1320碱基对(bp)片段连入在YC-Neo质粒中,用限制性内切酶NcoI鉴定顺反子的连接方向,选择正确连接方向的克隆,即获得具有双顺反子的YC-GN载体的7.1kb质粒(如图2所示;其DNA序列为表2所示)。
本发明基因靶向序列盒的应用,其特征在于,所述序列盒可用于无启动子基因靶向敲出和基因置换。
本发明基因靶向序列盒的应用,其特征在于,所述序列盒可用于培养包括悬浮细胞和贴壁细胞的哺乳动物细胞系。
本发明基因靶向序列盒的应用,其特征在于,所述序列盒可用于根据克隆细胞的荧光强度,利用流式细胞仪的荧光激活细胞分选功能(Fluorescence-activated cell sorter,缩写为FACS)进行分选和富集目的克隆。
上述为本发明的序列盒2,其指标及特点是1、以pLP-IRESneo为模板,通过多聚酶链式反应(PCR)扩增基因片段IRES-Neor-PolyA;2、合成5’端LoxP序列,退火成双链DNA片段并连接到1)的上游端,构成YC-Neo(即序列盒1);3、以pIRES2-EGFP为模板,通过多聚酶链式反应(PCR)扩增1320bp的基因片段IRES2-EGFP;4、将(2)中得到的YC-Neo质粒用PmeI切获得平末端质粒,将(3)中得到的IRES2-EGFP片段连入在YC-Neo质粒中,构成双顺反子的序列盒2(YC-GN);
5、该序列盒所在质粒为7.1Kb,(核苷酸序列见表2);6、与pCR2.1骨架共存,为卡那霉素抗性,可保存于E.coli中,用一般的质粒DNA提取方法即可得到大量的载体用于构建其他基因的靶向重组质粒;7、两端都有MCS5’端单一限制性酶切点为Ecl136II,EcoICRI,Psp124BI,SacI,SstI,AclNI,BcuI,SpeI,SspI;3’端单一限制性酶切点为Eco32I,EcoRV,CciNI,NotI,Ama87I,AvaI,BcoI,BsoBI,Eco88O,PaeR7I,Sfr274I,XhoI,EcoT22I,Mph1103I,NsiI,Ppu10I,Zsp2I,XbaI;8、双顺反子共存。EGFP可作为目的基因启动子强度的指示,提供利用流式细胞仪分选单克隆的优越性。
本发明的有益效果是目前在国际市场上尚无此类产品,本发明填补了目前国内和国际靶向基因修饰载体的空白;本发明人已利用该产品构建并成功获得了国际第一个悬浮体细胞培养的基因敲出细胞系(Cao,Y,Janssen,E.M.,Duncan,A.W.,Altman,A.,Billadeau,D.D.,and Abraham,R.T.Pleiotropic defects in TCRsignaling in a Vav-1-null Jurkat T-cell line.EMBO J.21,4809-4819,2002)。本发明的设计使在体细胞中进行同源基因靶向重组和基因敲出成为可能,使研究者走出体细胞中进行同源基因靶向重组“可望而不可及”的观念,本发明的应用实例不仅证明了这两种序列盒的巧妙设计和方便实用性,也是悬浮细胞基因定位敲出的国际的第一例。


图1是基因靶向序列盒1的构建模式示意图(Schematic display of genetargeting cassette 1)。
图2是基因靶向序列盒2的构建模式示意图(Schematic display of genetargeting cassette 2)。
图3是Vav1基因靶向敲出示意图(Vav1 gene targeting strategy)。
图4是Western Blot检测Vav1蛋白的表达(Western blot analysis of Vav1expression)。
图中标号说明LoxP为由34个核苷酸组成的具有徊文结构的碱基序列,该序列可被重组酶Cre识别并催化重组反应,其结果是具有两个同样方向的LoxP序列之间的DNA被圈出(looped out);IRES为内部核糖体进入位点;
Poly A为聚腺苷酸;Neo-r为抗药性标记;GFP为增强的绿色荧光蛋白EGFP(enhanced green fluorescence protein);MCS为多克隆位点(multiple cloning site)。
具体实施例方式
本发明是根据体细胞定位同源重组原理和基因敲出的需要,设计制作了能够方便用于任何基因重组和敲出的载体序列盒。
实施例1、Vav1基因靶向敲出质粒的构建。
Vav1的基因产物(即Vav1蛋白)是免疫T细胞被抗原激活通路中不可缺少的重要元件之一。用人白血病T细胞Jurkat系做模式系统研究Vav1在T细胞信号转导的作用。由于内源Vav1的存在干扰对Vav1结构与功能关系的研究,建造一个Vav1缺失细胞系是本实施例的目的。体细胞基因定位重组和敲出的基本内容包括1)构建一个含有与目的基因同源序列的靶向质粒;2)在体细胞中进行同源重组介导的靶向基因敲出。本实施例是为Vav1基因敲出构建载体质粒。
一、实验内容1、基因靶向序列盒(YC-GN)的构建(1)PCR扩增基因片段IRES-Neor-PolyA,合成寡聚脱氧核糖核酸引物如下正向引物5’-GTTTAAACTACCTAGAGAATTCC-3’,反向引物5’-TTATAACTTCGTATAATGTATGCTATACGAAGTTATTTACTTTACTTGTACAGGCTCAGGC-3’;以pLP-IRESneo(Clontech,USA)为模板,向反应混合物中加入正、反、两引物各0.8pM、缓冲液、及四种脱氧核糖核苷酸(dATP,dTTP,dCTP,和dGTP)0.2mM,加入2.5U Taq多聚酶,进行多聚酶链式反应(PCR),具体条件是反应混合物在94℃被加热5分钟使模板DNA变性,并在94℃,15秒→56℃,30秒→72℃,1分30秒,反复进行25个循环,合成1768碱基对(bp)的DNA片段,经凝胶电泳分离并纯化后连接入pCR2.1-TA(Invitrogen),转化大肠杆菌DH5α,获得质粒A;(2)5’端LoxP序列的插入和YC-Neo序列盒的构成合成具有LoxP的寡核苷酸,正链5’-CTAGTTTTGGAATATTGATAACTTCGTATAGCATACATTATACGAAGTTATGTTT-3’和与之互补的负链5’-AAACATAACTTCGTATAATGTATGCTATACGAAGTTATCAATATTCCAAAA-3’;将上述两寡核苷酸等量混合,用T4激酶磷酸化以上核苷酸的混合物,加热至95℃,5分钟后退火至室温,得到双链DNA,一端为SpeI的粘性末端,另一端为PmeI的平末端;将之与上述A质粒用SpeI和PmeI限制性内切酶水解获得的开口质粒连接,即获得序列盒YC-Neo的质粒(5.6kb);(3)分别合成用于扩增IRES2-EGFP的寡核苷酸,正向引物5’-ACGGTACCGCGGGCCCGGGAT-3’和反向引物5’-GCTTTACTTGTACAGCTCGTCC-3’,以pIRES2-EGFP(Clontech)为模板,向反应混合物中加入正、反两引物各0.8pM、缓冲液、及四种脱氧核糖核苷酸(dATP,dTTP,dCTP,和dGTP)0.2mM,加入2.5U Taq多聚酶进行多聚酶链式反应(PCR),具体条件是反应混合物在94℃被加热5分钟使模板DNA变性,并在94℃,15秒→56℃,30秒→72℃,1分30秒,反复进行25个循环,获得1320碱基对(bp)的DNA片段,经凝胶电泳分离纯化;(4)将得到的YC-Neo用PmeI切获得平末端质粒,将1320碱基对(bp)片段连入该质粒,以限制性内切酶NcoI鉴定顺反子的连接方向,即获得具有双顺反子的YC-GN载体质粒(7.1kb)。
2、Vav1基因靶向载体(pKO-Vav1-GN)质粒的构建(1)采用Qiagen试剂盒,Jurkat细胞基因组DNA被抽提和纯化;(2)合成以下寡核苷酸作为引物,分别用于扩增Vav1的从外显子2到4和内显子24到27的基因组DNA作为上游(5’-flanking region)和下游(3’-flanking region)的同源序列;外显子2-4的扩增正向引物5’-AAACTAGTCTCCTCACAGTTCCTGTGCCTTA-3,(下划线部分为SpeI切点),反向引物5‘-GAGCACTCACTCGATCTGGTCG-3’;将以上两引物各各0.8pM、缓冲液、及四种脱氧核糖核苷酸(dATP,dTTP,dCTP,和dGTP)0.2mM,加入2.5U Taq多聚酶进行多聚酶链式反应(PCR),扩增外显子程序为94℃,5分钟→(94℃,15秒→56℃,30秒→72℃,1分钟),反复25个循环,进行多聚酶链式反应(PCR),获得1.1Kb的DNA片段,并用琼脂糖凝胶电泳分离、纯化;所得的DNA用SpeI酶解、并由T4连接酶催化接入被SpeI和SspI消化过的YC-GN(序列盒2)质粒中,所得质粒为含有5’Vav1基因同源区的中间产物,命名为pKO-5’V-GN。
外显子24-27的扩增正向引物5’-AATCTAGATGGTTCCAGATATAACGTCGA-3’(下划线部分为XbaI切点),反向引物5‘-TCAGCAGTATTCAGAATAATCT-3’;将上述两套引物分别以Jurkat基因组DNA为模板,加入反应缓冲液及四种脱氧核糖核苷酸(dATP,dTTP,dCTP,和dGTP)各0.2mM,并加入适合长链DNA合成的多聚酶(Expand Long System,Roch Inc.USA)进行多聚酶链式反应(PCR),扩增外显子程序为94℃,5分钟→(94℃,25秒→56℃,30秒→72℃,5分钟),反复25个循环,进行多聚酶链式反应(PCR)获得7.0Kb的DNA片段,并用琼脂糖凝胶电泳分离、纯化;所得的DNA用XbaI酶解、并由T4连接酶催化接入被XbaI和SmaI消化过的pKO-5’V-GN(见上面)质粒中。所得质粒即为含有Vav1基因同源区靶向质粒,pKO-Vav1-GN。
该质粒约为14Kb,在权利要求5中所述的序列盒两侧分别连接有Vav1的外显子2-4和外显子24-27的基因组DNA片段,用于Vav1的基因敲出(图3所示)。
实施例2、Jurkat细胞Vav1的基因靶向敲出。
Vav1的基因产物(即Vav1蛋白)是免疫T细胞被抗原激活通路中不可缺少的重要元件之一;用人白血病T细胞Jurkat系做模式系统研究Vav1在T细胞信号转导中的作用;由于内源Vav1的存在干扰我们对Vav1结构与功能关系的研究,建造一个Vav1缺失细胞系是本实施例的目的。体细胞基因定位重组和敲出的基本内容包括1)构建一个含有与目的基因同源序列的靶向质粒;2)在体细胞中进行同源重组介导的靶向基因敲出。由于体细胞是双倍染色体,在体细胞中进行同源重组介导的靶向基因敲出需分为以下步骤(1)导入靶向载体质粒;(2)药物筛选同源重组的杂合子克隆;(3)将含有药物标记基因切除;(4)再导入靶向载体质粒;(5)药物筛选敲出基因的纯合子克隆。本实施例用实施例1中构建的载体进行悬浮细胞系Jurkat的Vav1基因的敲出。
实验内容(1)Vav1靶向载体的导入及杂合子克隆的筛选(即一条染色体被同源重组的标记基因取代)研究表明,线性的DNA比闭环状DNA利于细胞的染色体重组,因此,实施例1所得Vav1靶向载体首先用SpeI和位于Vav1外显子序列末端的酶切点Bsu36I进行水解,使得载体线性化且保持了靶向序列的完整性,所得的线性DNA示意图见图三的第一行。用这已线性化的质粒DNA以电穿孔法转染人白血病淋巴细胞株Jurkat,具体方法收集107Jurkat细胞与30μg上述DNA混合,用BTX830电穿孔仪电击,(320V,10mSec)后,于补充了10%FBS的RMPI1640培养基中,在37度,5%CO2中培养24小时后,加入1mg/ml的G418选择抗药性细胞,5-7天后,存活的细胞群根据另一个顺反子表达的EGFP(绿色荧光蛋白)的强度不同,用流式细胞仪(FACS)分选阳性单个细胞入96孔板进行培养(每孔1个细胞),细胞长到一定密度时取出100μl用于PCR高通量筛选同源DNA重组克隆(vav1+/-)。所得到的同源重组率在低荧光区为零,在中等荧光区为2/163,在高荧光区为零。可见中等荧光区体现了Vav1基因启动子的强度,同源重组子在该区域得到了富集。分离出的同源DNA重组克隆(vav1+/-)用反转录-PCR(RT-PCR)和Westem印迹检测Vav1的mRNA和蛋白质水平(见图四和图五相应的泳道)。重组克隆(vav1+/-)的基因型为一个正常的等位基因,和一个外显子5-23被靶向序列盒的序列所取代(图3所示,第一和第二行),其表现为具有荧光蛋白表达和Neo-抗药性。
(2)抗药性标记基因的圈除在序列盒的设计和构建中,荧光蛋白基因和抗药性标记基因位于两端的同向LoxP序列间。上述得到的杂合子克隆具有荧光蛋白表达和Neo-抗药性,在进行另一个等位基因的敲出时,会干扰重组子的筛选,所以应首先将细胞用表达重组酶(Cre)的质粒pBS185转染(电穿孔条件如上述),将细胞在不含有药物G418的培养基中培养24-48小时,利用FACS分选不含荧光蛋白的细胞进行克隆。增殖后PCR检测确认是失掉标记基因的克隆。所得的克隆为标记基因序列被除掉的vav1+/-杂合子,其基因型如图3第三行所示。
(3)另一个(第二个)Vav1等位基因的敲出将上述(2)中所得的杂合细胞培养至107,收集并与Vav1靶向质粒混合,如上所述进行转染,重复(1)的步骤,分选中等荧光强度的细胞做为候选克隆,以同样的检测方法筛选到靶位重组的克隆。此时得到的重组后的基因结构如图2中第四行所示,至此,体细胞双倍染色体的两个vav1等位基因已被全部敲出,以vav1-/-表示。为了证实所得细胞的确是Vav1-零背景细胞,我们用反转录PCR和Western印迹分别鉴定细胞内Vav1的mRNA水平和蛋白质水平。所的结果(分别参阅图4和附件所示),确证了该细胞没有Vav1的mRNA和蛋白质的表达。利用此Vav1-缺失细胞系,我研究组成功地研究和证明了Vav1蛋白在T细胞激活的信号转导中的重要作用(Cao,Y.,Janssen,E.M.,Duncan,A.W.,Altman,A.,Billadeau,D.D.,and Abraham,R.T.Pleiotropic defects in TCR signaling in a Vav-1-null JurkatT-cell line.EMBO J.21,4809-4819,2002)。
附件中,RT-PCR检测Vav1基因在细胞中的mRNA(RT-PCRanalysis of Vav1 mRNA)。其中+/+表示野生型细胞;+/-表示杂合子;-/-为双敲出基因型,其中D和E分别代表两个克隆。从图中可见野生型细胞只有2.0kb的一条带;而杂合子有2.0kb带代表正常的vav1基因,还有一条0.25kb的带代表了被靶向敲出的vav1位点;D和E只有一条对应与基因敲出的带(0.25kb)。
图4中,Western Blot检测Vav1蛋白的表达(Western blotanalysis of Vav1 expression)。在这个实验中我们用另外一个蛋白(ZAP70)作为样品量的内对照。在蛋白水平上,杂合子(+/-)中Vav1蛋白的含量小于野生型(+/+),敲出型(-/-)D和E没有Vav1蛋白的表达。
通过此实例,成功地在体细胞内先后敲除了vav1基因,说明了本发明构建的序列盒的实用性和优越性A、多个克隆酶切点为目的基因同源区的插入提供方便,也为靶向质粒的线性化提供了多种酶的选择。
B、用目的基因的启动子控制neo-抗药标记基因的表达可大大富集目的细胞(104以上),省去大量筛选所需的人力物力。
C、双顺反子的表达又使同源重组子得到进一步的富集,而且绿色荧光蛋白的引入使克隆单个细胞工作得到大大的简化,其优势用于悬浮细胞克隆尤为突出。
D、跨在标记基因两侧的LoxP序列可使抗药基因和绿荧光蛋白基因从细胞基因组中排除,为第二个等位基因的敲出提供方便条件。
E、两次基因靶向敲出可用同一构建的质粒,省去构建两种携带不同抗药标记质粒的时间和人力,一般可以节省3到5个月的时间。
F、带有荧光蛋白的序列盒与流式细胞仪分选的结合,在分离和收集所要的克隆中显示出极大的优势。
基因靶向敲出或交换技术在哺乳类体细胞中的实现,是一个很复杂且成功率低的实验,仅仅近期才有报告用这类技术在体细胞中实现。而在哺乳类体细胞中,又以悬浮细胞最难,至今(写稿为止),国际上尚未有过用悬浮细胞实现基因定位敲出的报告。本发明所举的实施例采用的是最为复杂的悬浮细胞,但本发明申请权项的序列盒也适用于包括贴壁细胞在内的多种可培养细胞,一些合作者的实验室已用本发明的序列盒成功地将ATM基因从贴壁细胞系(HCT116)中敲出。
表一基因靶向序列盒1的DNA序列。
1 AGCGCCCAAT ACGCAAACCG CCTCTCCCCG CGCGTTGGCC GATTCATTAA TGCAGCTGGC
61 ACGACAGGTT TCCCGACTGG AAAGCGGGCA GTGAGCGCAA CGCAATTAAT GTGAGTTAGC121 TCACTCATTA GGCACCCCAG GCTTTACACT TTATGCTTCC GGCTCGTATG TTGTGTGGAA181 TTGTGAGCGG ATAACAATTT CACACAGGAA ACAGCTATGA CCATGATTAC GCCAAGCTTG241 GTACCGAGCT CGGATCCACT AGTTTTGGAA TATTGATAAC TTCGTATAGC ATACATTATA301 CGAAGTTATG TTTAAACTAC CTAGAGAATT CCGCCCCCCC CCCCCCCCCC CCCCCCCCCC361 CCCCCCCCAA CGTTACTGGC CGAAGCCGCT TGGAATAAGG CCGGTGTGCG TTTGTCTATA421 TGTTATTTCT ACCACATCAC CGTCTTTTGG TGGTGTGAGG GCCCGGAACC TGGCCCTGTC481 TTCTTGACGA GCATTCCTAG GGGTCTTTCC CCTCTCGCCA AAGGAATGTA AGGTCTGTTG541 AATGTCGTGA AGGAAGCAGT TCCTCTGGAA GCTTCTTGAA GACAAGCAAC GTCTGTAGCG601 ACCCTTTGCA GGCAGCGGAA ATCCCCACCT GGTAACAGGT GCCTCTGCGG CCAAAACTGC661 GGCCAAAAGC CACGTGTATA AGATACACCT GCAAAGGCGG CACAACCCCA GTGCCACGTT721 GTGAGTTGGA TAGTTGTGGA AAGAGTCAAA TGGCTCTCCT CAAGCGTATT CAACAAGGGG781 CTGAAGGATG CCCAGAAGGT ACCCCATTGT ATGGGATCTG ATCTGGGGCC TCGGTGCACA841 TGCTTTACAT GTGTTTAGTC GAGGTTAAAA AAACGTCTAG GCCCCCCGAA CCACGGGGAC901 GTGGTTTTCC TTTGAAAAAC ACGATGATAA GCTTGCCACA ACCATGGCTG AACAAGATGG961 ATTGCACGCA GGTTCTCCGG CCGCTTGGGT GGAGAGGCTA TTCGGCTATG ACTGGGCACA1021 ACAGACAATC GGCTGCTCTG ATGCCGCCGT GTTCCGGCTG TCAGCGCAGG GGCGCCCGGT1081 TCTTTTTGTC AAGACCGACC TGTCCGGTGC CCTGAATGAA CTGCAGGACG AGGCAGCGCG1141 GCTATCGTGG CTGGCCACGA CGGGCGTTCC TTGCGCAGCT GTGCTCGACG TTGTCACTGA1201 AGCGGGAAGG GACTGGCTGC TATTGGGCGA AGTGCCGGGG CAGGATCTCC TGTCATCTCA1261 CCTTGCTCCT GCCGAGAAAG TATCCATCAT GGCTGATGCA ATGCGGCGGC TGCATACGCT1321 TGATCCGGCT ACCTGCCCAT TCGACCACCA AGCGAAACAT CGCATCGAGC GAGCACGTAC1381 TCGGATGGAA GCCGGTCTTG TCGATCAGGA TGATCTGGAC GAAGAGCATC AGGGGCTCGC1441 GCCAGCCGAA CTGTTCGCCA GGCTCAAGGC GCGCATGCCC GACGGCGAGG ATCTCGTCGT1501 GACCCATGGC GATGCCTGCT TGCCGAATAT CATGGTGGAA AATGGCCGCT TTTCTGGATT1561 CATCGACTGT GGCCGGCTGG GTGTGGCGGA CCGCTATCAG GACATAGCGT TGGCTACCCG1621 TGATATTGCT GAAGAGCTTG GCGGCGAATG GGCTGACCGC TTCCTCGTGC TTTACGGTAT1681 CGCCGCTCCC GATTCGCAGC GCATCGCCTT CTATCGCCTT CTTGACGAGT TCTTCTGAGC1741 GGGACTCTGG GGTTCGGGGG ATCCAGACAT GATAAGATAC ATTGATGAGT TTGGACAAAC1801 CACAACTAGA ATGCAGTGAA AAAAATGCTT TATTTGTGAA ATTTGTGATG CTATTGCTTT1861 ATTTGTAACC ATTATAAGCT GCAATAAACA AGTTAACAAC AACAATTGCA TTCATTTTAT1921 GTTTCAGGTT CAGGGGGAGG TGTGGGAGGT TTTTTCTAGG GCCGCTGCCA AACTGGTCTC1981 CGAGAAGCTG GCCTCTTACC AGGCTGCGCG CAAAGACAGC ACCAGCCTGA GCCTGTACAA2041 GTAAATAACT TCGTATAGCA TACATTATAC GAAGTTATAA GCCGAATTCT GCAGATATCC2101 ATCACACTGG CGGCCGCTCG AGCATGCATC TAGAGGGCCC AATTCGCCCT ATAGTGAGTC2161 GTATTACAAT TCACTGGCCG TCGTTTTACA ACGTCGTGAC TGGGAAAACC CTGGCGTTAC2221 CCAACTTAAT CGCCTTGCAG CACATCCCCC TTTCGCCAGC TGGCGTAATA GCGAAGAGGC2281 CCGCACCGAT CGCCCTTCCC AACAGTTGCG CAGCCTGAAT GGCGAATGGG ACGCGCCCTG2341 TAGCGGCGCA TTAAGCGCGG CGGGTGTGGT GGTTACGCGC AGCGTGACCG CTACACTTGC2401 CAGCGCCCTA GCGCCCGCTC CTTTCGCTTT CTTCCCTTCC TTTCTCGCCA CGTTCGCCGG2461 CTTTCCCCGT CAAGCTCTAA ATCGGGGGCT CCCTTTAGGG TTCCGATTTA GAGCTTTACG2521 GCACCTCGAC CGCAAAAAAC TTGATTTGGG TGATGGTTCA CGTAGTGGGC CATCGCCCTG2581 ATAGACGGTT TTTCGCCCTT TGACGTTGGA GTCCACGTTC TTTAATAGTG GACTCTTGTT2641 CCAAACTGGA ACAACACTCA ACCCTATCGC GGTCTATTCT TTTGATTTAT AAGGGATTTT2701 GCCGATTTCG GCCTATTGGT TAAAAAATGA GCTGATTTAA CAAATTCAGG GCGCAAGGGC2761 TGCTAAAGGA ACCGGAACAC GTAGAAAGCC AGTCCGCAGA AACGGTGCTG ACCCCGGATG
2821 AATGTCAGCT ACTGGGCTAT CTGGACAAGG GAAAACGCAA GCGCAAAGAG AAAGCAGGTA2881 GCTTGCAGTG GGCTTACATG GCGATAGCTA GACTGGGCGG TTTTATGGAC AGCAAGCGAA2941 CCGGAATTGC CAGCTGGGGC GCCCTCTGGT AAGGTTGGGA AGCCCTGCAA AGTAAACTGG3001 ATGGCTTTCT TGCCGCCAAG GATCTGATGG CGCAGGGGAT CAAGATCTGA TCAAGAGACA3061 GGATGAGGAT CGTTTCGCAT GATTGAACAA GATGGATTGC ACGCAGGTTC TCCGGCCGCT3121 TGGGTGGAGA GGCTATTCGG CTATGACTGG GCACAACAGA CAATCGGCTG CTCTGATGCC3181 GCCGTGTTCC GGCTGTCAGC GCAGGGGCGC CCGGTTCTTT TTGTCAAGAC CGACCTGTCC3241 GGTGCCCTGA ATGAACTGCA GGACGAGGCA GCGCGGCTAT CGTGGCTGGC CACGACGGGC3301 GTTCCTTGCG CAGCTGTGCT CGACGTTGTC ACTGAAGCGG GAAGGGACTG GCTGCTATTG3361 GGCGAAGTGC CGGGGCAGGA TCTCCTGTCA TCTCGCCTTG CTCCTGCCGA GAAAGTATCC3421 ATCATGGCTG ATGCAATGCG GCGGCTGCAT ACGCTTGATC CGGCTACCTG CCCATTCGAC3481 CACCAAGCGA AACATCGCAT CGAGCGAGCA CGTACTCGGA TGGAAGCCGG TCTTGTCGAT3541 CAGGATGATC TGGACGAAGA GCATCAGGGG CTCGCGCCAG CCGAACTGTT CGCCAGGCTC3601 AAGGCGCGCA TGCCCGACGG CGAGGATCTC GTCGTGATCC ATGGCGATGC CTGCTTGCCG3661 AATATCATGG TGGAAAATGG CCGCTTTTCT GGATTCAACG ACTGTGGCCG GCTGGGTGTG3721 GCGGACCGCT ATCAGGACAT AGCGTTGGAT ACCCGTGATA TTGCTGAAGA GCTTGGCGGC3781 GAATGGGCTG ACCGCTTCCT CGTGCTTTAC GGTATCGCCG CTCCCGATTC GCAGCGCATC3841 GCCTTCTATC GCCTTCTTGA CGAGTTCTTC TGAATTGAAA AAGGAAGAGT ATGAGTATTC3901 AACATTTCCG TGTCGCCCTT ATTCCCTTTT TTGCGGCATT TTGCCTTCCT GTTTTTGCTC3961 ACCCAGAAAC GCTGGTGAAA GTAAAAGATG CTGAAGATCA GTTGGGTGCA CGAGTGGGTT4021 ACATCGAACT GGATCTCAAC AGCGGTAAGA TCCTTGAGAG TTTTCGCCCC GAAGAACGTT4081 TTCCAATGAT GAGCACTTTT AAAGTTCTGC TATGTCATAC ACTATTATCC CGTATTGACG4141 CCGGGCAAGA GCAACTCGGT CGCCGGGCGC GGTATTCTCA GAATGACTTG GTTGAGTACT4201 CACCAGTCAC AGAAAAGCAT CTTACGGATG GCATGACAGT AAGAGAATTA TGCAGTGCTG4261 CCATAACCAT GAGTGATAAC ACTGCGGCCA ACTTACTTCT GACAACGATC GGAGGACCGA4321 AGGAGCTAAC CGCTTTTTTG CACAACATGG GGGATCATGT AACTCGCCTT GATCGTTGGG4381 AACCGGAGCT GAATGAAGCC ATACCAAACG ACGAGAGTGA CACCACGATG CCTGTAGCAA4441 TGCCAACAAC GTTGCGCAAA CTATTAACTG GCGAACTACT TACTCTAGCT TCCCGGCAAC4501 AATTAATAGA CTGGATGGAG GCGGATAAAG TTGCAGGACC ACTTCTGCGC TCGGCCCTTC4561 CGGCTGGCTG GTTTATTGCT GATAAATCTG GAGCCGGTGA GCGTGGGTCT CGCGGTATCA4621 TTGCAGCACT GGGGCCAGAT GGTAAGCCCT CCCGTATCGT AGTTATCTAC ACGACGGGGA4681 GTCAGGCAAC TATGGATGAA CGAAATAGAC AGATCGCTGA GATAGGTGCC TCACTGATTA4741 AGCATTGGTA ACTGTCAGAC CAAGTTTACT CATATATACT TTAGATTGAT TTAAAACTTC4801 ATTTTTAATT TAAAAGGATC TAGGTGAAGA TCCTTTTTGA TAATCTCATG ACCAAAATCC4861 CTTAACGTGA GTTTTCGTTC CACTGAGCGT CAGACCCCGT AGAAAAGATC AAAGGATCTT4921 CTTGAGATCC TTTTTTTCTG CGCGTAATCT GCTGCTTGCA AACAAAAAAA CCACCGCTAC4981 CAGCGGTGGT TTGTTTGCCG GATCAAGAGC TACCAACTCT TTTTCCGAAG GTAACTGGCT5041 TCAGCAGAGC GCAGATACCA AATACTGTCC TTCTAGTGTA GCCGTAGTTA GGCCACCACT5101 TCAAGAACTC TGTAGCACCG CCTACATACC TCGCTCTGCT AATCCTGTTA CCAGTGGCTG5161 CTGCCAGTGG CGATAAGTCG TGTCTTACCG GGTTGGACTC AAGACGATAG TTACCGGATA5221 AGGCGCAGCG GTCGGGCTGA ACGGGGGGTT CGTGCACACA GCCCAGCTTG GAGCGAACGA5281 CCTACACCGA ACTGAGATAC CTACAGCGTG AGCATTGAGA AAGCGCCACG CTTCCCGAAG5341 GGAGAAAGGC GGACAGGTAT CCGGTAAGCG GCAGGGTCGG AACAGGAGAG CGCACGAGGG5401 AGCTTCCAGG GGGAAACGCC TGGTATCTTT ATAGTCCTGT CGGGTTTCGC CACCTCTGAC5461 TTGAGCGTCG ATTTTTGTGA TGCTCGTCAG GGGGGCGGAG CCTATGGAAA AACGCCAGCA5521 ACGCGGCCTT TTTACGGTTC CTGGCCTTTT GCTGGCCTTT TGCTCACATG TTCTTTCCTG
5581 CGTTATCCCC TGATTCTGTG GATAACCGTA TTACCGCCTT TGAGTGAGCT GATACCGCTC5641 GCCGCAGCCG AACGACCGAG CGCAGCGAGT CAGTGAGCGA GGAAGCGCAA G表二基因靶向序列盒2的DNA序列。
1 AGCGCCCAAT ACGCAAACCG CCTCTCCCCG CGCGTTGGCC GATTCATTAA TGCAGCTGGC61 ACGACAGGTT TCCCGACTGG AAAGCGGGCA GTGAGCGCAA CGCAATTAAT GTGAGTTAGC121 TCACTCATTA GGCACCCCAG GCTTTACACT TTATGCTTCC GGCTCGTATG TTGTGTGGAA181 TTGTGAGCGG ATAACAATTT CACACAGGAA ACAGCTATGA CCATGATTAC GCCAAGCTTG241 GTACCGAGCT CGGATCCACT AGTTTTGGAA TATTGATAAC TTCGTATAGC ATACATTATA301 CGAAGTTAAT AACTTCGTAT AGCATACATT ATACGAAGTT ATGTTTCCCG GGATCCGCCC361 CTCTCCCTCC CCCCCCCCTA ACGTTACTGG CCGAAGCCGC TTGGAATAAG GCCGGTGTGC421 GTTTGTCTAT ATGTTATTTT CCACCATATT GCCGTCTTTT GGCAATGTGA GGGCCCGGAA481 ACCTGGCCCT GTCTTCTTGA CGAGCATTCC TAGGGGTCTT TCCCCTCTCG CCAAAGGAAT541 GCAAGGTCTG TTGAATGTCG TGAAGGAAGC AGTTCCTCTG GAAGCTTCTT GAAGACAAAC601 AACGTCTGTA GCGACCCTTT GCAGGCAGCG GAACCCCCCA CCTGGCGACA GGTGCCTCTG661 CGGCCAAAAG CCACGTGTAT AAGATACACC TGCAAAGGCG GCACAACCCC AGTGCCACGT721 TGTGAGTTGG ATAGTTGTGG AAAGAGTCAA ATGGCTCTCC TCAAGCGTAT TCAACAAGGG781 GCTGAAGGAT GCCCAGAAGG TACCCCATTG TATGGGATCT GATCTGGGGC CTCGGTGCAC841 ATGCTTTACA TGTGTTTAGT CGAGGTTAAA AAAACGTCTA GGCCCCCCGA ACCACGGGGA901 CGTGGTTTTC CTTTGAAAAA CACGATGATA ATATGGCCAC AACCATGGTG AGCAAGGGCG961 AGGAGCTGTT CACCGGGGTG GTGCCCATCC TGGTCGAGCT GGACGGCGAC GTAAACGGCC1021 ACAAGTTCAG CGTGTCCGGC GAGGGCGAGG GCGATGCCAC CTACGGCAAG CTGACCCTGA1081 AGTTCATCTG CACCACCGGC AAGCTGCCCG TGCCCTGGCC CACCCTCGTG ACCACCCTGA1141 CCTACGGCGT GCAGTGCTTC AGCCGCTACC CCGACCACAT GAAGCAGCAC GACTTCTTCA1201 AGTCCGCCAT GCCCGAAGGC TACGTCCAGG AGCGCACCAT CTTCTTCAAG GACGACGGCA1261 ACTACAAGAC CCGCGCCGAG GTGAAGTTCG AGGGCGACAC CCTGGTGAAC CGCATCGAGC1321 TGAAGGGCAT CGACTTCAAG GAGGACGGCA ACATCCTGGG GCACAAGCTG GAGTACAACT1381 ACAACAGCCA CAACGTCTAT ATCATGGCCG ACAAGCAGAA GAACGGCATC AAGGTGAACT1441 TCAAGATCCG CCACAACATC GAGGACGGCA GCGTGCAGCT CGCCGACCAC TACCAGCAGA1501 ACACCCCCAT CGGCGACGGC CCCGTGCTGC TGCCCGACAA CCACTACCTG AGCACCCAGT1561 CCGCCCTGAG CAAAGACCCC AACGAGAAGC GCGATCACAT GGTCCTGCTG GAGTTCGTGA1621 CCGCCGCCGG GATCACTCTC GGCATGGACG AGCTGTACAA GTAAAGCAAA CTACCTAGAG1681 AATTCCGCCC CCCCCCCCCC CCCCCCCCCC CCCCCCCCCC CCAACGTTAC TGGCCGAAGC1741 CGCTTGGAAT AAGGCCGGTG TGCGTTTGTC TATATGTTAT TTCTACCACA TCACCGTCTT1801 TTGGTGGTGT GAGGGCCCGG AACCTGGCCC TGTCTTCTTG ACGAGCATTC CTAGGGGTCT1861 TTCCCCTCTC GCCAAAGGAA TGTAAGGTCT GTTGAATGTC GTGAAGGAAG CAGTTCCTCT1921 GGAAGCTTCT TGAAGACAAG CAACGTCTGT AGCGACCCTT TGCAGGCAGC GGAAATCCCC1981 ACCTGGTAAC AGGTGCCTCT GCGGCCAAAA CTGCGGCCAA AAGCCACGTG TATAAGATAC2041 ACCTGCAAAG GCGGCACAAC CCCAGTGCCA CGTTGTGAGT TGGATAGTTG TGGAAAGAGT2101 CAAATGGCTC TCCTCAAGCG TATTCAACAA GGGGCTGAAG GATGCCCAGA AGGTACCCCA2161 TTGTATGGGA TCTGATCTGG GGCCTCGGTG CACATGCTTT ACATGTGTTT AGTCGAGGTT2221 AAAAAAACGT CTAGGCCCCC CGAACCACGG GGACGTGGTT TTCCTTTGAA AAACACGATG2281 ATAAGCTTGC CACAACCATG GCTGAACAAG ATGGATTGCA CGCAGGTTCT CCGGCCGCTT2341 GGGTGGAGAG GCTATTCGGC TATGACTGGG CACAACAGAC AATCGGCTGC TCTGATGCCG2401 CCGTGTTCCG GCTGTCAGCG CAGGGGCGCC CGGTTCTTTT TGTCAAGACC GACCTGTCCG2461 GTGCCCTGAA TGAACTGCAG GACGAGGCAG CGCGGCTATC GTGGCTGGCC ACGACGGGCG
2521 TTCCTTGCGC AGCTGTGCTC GACGTTGTCA CTGAAGCGGG AAGGGACTGG CTGCTATTGG2581 GCGAAGTGCC GGGGCAGGAT CTCCTGTCAT CTCACCTTGC TCCTGCCGAG AAAGTATCCA2641 TCATGGCTGA TGCAATGCGG CGGCTGCATA CGCTTGATCC GGCTACCTGC CCATTCGACC2701 ACCAAGCGAA ACATCGCATC GAGCGAGCAC GTACTCGGAT GGAAGCCGGT CTTGTCGATC2761 AGGATGATCT GGACGAAGAG CATCAGGGGC TCGCGCCAGC CGAACTGTTC GCCAGGCTCA2821 AGGCGCGCAT GCCCGACGGC GAGGATCTCG TCGTGACCCA TGGCGATGCC TGCTTGCCGA2881 ATATCATGGT GGAAAATGGC CGCTTTTCTG GATTCATCGA CTGTGGCCGG CTGGGTGTGG2941 CGGACCGCTA TCAGGACATA GCGTTGGCTA CCCGTGATAT TGCTGAAGAG CTTGGCGGCG3001 AATGGGCTGA CCGCTTCCTC GTGCTTTACG GTATCGCCGC TCCCGATTCG CAGCGCATCG3061 CCTTCTATCG CCTTCTTGAC GAGTTCTTCT GAGCGGGACT CTGGGGTTCG GGGGATCCAG3121 ACATGATAAG ATACATTGAT GAGTTTGGAC AAACCACAAC TAGAATGCAG TGAAAAAAAT3181 GCTTTATTTG TGAAATTTGT GATGCTATTG CTTTATTTGT AACCATTATA AGCTGCAATA3241 AACAAGTTAA CAACAACAAT TGCATTCATT TTATGTTTCA GGTTCAGGGG GAGGTGTGGG3301 AGGTTTTTTC TAGGGCCGCT GCCAAACTGG TCTCCGAGAA GCTGGCCTCT TACCAGGCTG3361 CGCGCAAAGA CAGCACCAGC CTGAGCCTGT ACAAGTAAAT AACTTCGTAT AGCATACATT3421 ATACGAAGTT ATAGCCGAAT TCTGCAGATA TCCATCACAC TGGCGGCCGC TCGAGCATGC3481 ATCTAGAGGG CCCAATTCGC CCTATAGTGA GTCGTATTAC AATTCACTGG CCGTCGTTTT3541 ACAACGTCGT GACTGGGAAA ACCCTGGCGT TACCCAACTT AATCGCCTTG CAGCACATCC3601 CCCTTTCGCC AGCTGGCGTA ATAGCGAAGA GGCCCGCACC GATCGCCCTT CCCAACAGTT3661 GCGCAGCCTG AATGGCGAAT GGGACGCGCC CTGTAGCGGC GCATTAAGCG CGGCGGGTGT3721 GGTGGTTACG CGCAGCGTGA CCGCTACACT TGCCAGCGCC CTAGCGCCCG CTCCTTTCGC3781 TTTCTTCCCT TCCTTTCTCG CCACGTTCGC CGGCTTTCCC CGTCAAGCTC TAAATCGGGG3841 GCTCCCTTTA GGGTTCCGAT TTAGAGCTTT ACGGCACCTC GACCGCAAAA AACTTGATTT3901 GGGTGATGGT TCACGTAGTG GGCCATCGCC CTGATAGACG GTTTTTCGCC CTTTGACGTT3961 GGAGTCCACG TTCTTTAATA GTGGACTCTT GTTCCAAACT GGAACAACAC TCAACCCTAT4021 CGCGGTCTAT TCTTTTGATT TATAAGGGAT TTTGCCGATT TCGGCCTATT GGTTAAAAAA4081 TGAGCTGATT TAACAAATTC AGGGCGCAAG GGCTGCTAAA GGAACCGGAA CACGTAGAAA4141 GCCAGTCCGC AGAAACGGTG CTGACCCCGG ATGAATGTCA GCTACTGGGC TATCTGGACA4201 AGGGAAAACG CAAGCGCAAA GAGAAAGCAG GTAGCTTGCA GTGGGCTTAC ATGGCGATAG4261 CTAGACTGGG CGGTTTTATG GACAGCAAGC GAACCGGAAT TGCCAGCTGG GGCGCCCTCT4321 GGTAAGGTTG GGAAGCCCTG CAAAGTAAAC TGGATGGCTT TCTTGCCGCC AAGGATCTGA4381 TGGCGCAGGG GATCAAGATC TGATCAAGAG ACAGGATGAG GATCGTTTCG CATGATTGAA4441 CAAGATGGAT TGCACGCAGG TTCTCCGGCC GCTTGGGTGG AGAGGCTATT CGGCTATGAC4501 TGGGCACAAC AGACAATCGG CTGCTCTGAT GCCGCCGTGT TCCGGCTGTC AGCGCAGGGG4561 CGCCCGGTTC TTTTTGTCAA GACCGACCTG TCCGGTGCCC TGAATGAACT GCAGGACGAG4621 GCAGCGCGGC TATCGTGGCT GGCCACGACG GGCGTTCCTT GCGCAGCTGT GCTCGACGTT4681 GTCACTGAAG CGGGAAGGGA CTGGCTGCTA TTGGGCGAAG TGCCGGGGCA GGATCTCCTG4741 TCATCTCGCC TTGCTCCTGC CGAGAAAGTA TCCATCATGG CTGATGCAAT GCGGCGGCTG4801 CATACGCTTG ATCCGGCTAC CTGCCCATTC GACCACCAAG CGAAACATCG CATCGAGCGA4861 GCACGTACTC GGATGGAAGC CGGTCTTGTC GATCAGGATG ATCTGGACGA AGAGCATCAG4921 GGGCTCGCGC CAGCCGAACT GTTCGCCAGG CTCAAGGCGC GCATGCCCGA CGGCGAGGAT4981 CTCGTCGTGA TCCATGGCGA TGCCTGCTTG CCGAATATCA TGGTGGAAAA TGGCCGCTTT5041 TCTGGATTCA ACGACTGTGG CCGGCTGGGT GTGGCGGACC GCTATCAGGA CATAGCGTTG5101 GATACCCGTG ATATTGCTGA AGAGCTTGGC GGCGAATGGG CTGACCGCTT CCTCGTGCTT5161 TACGGTATCG CCGCTCCCGA TTCGCAGCGC ATCGCCTTCT ATCGCCTTCT TGACGAGTTC5221 TTCTGAATTG AAAAAGGAAG AGTATGAGTA TTCAACATTT CCGTGTCGCC CTTATTCCCT
5281 TTTTTGCGGC ATTTTGCCTT CCTGTTTTTG CTCACCCAGA AACGCTGGTG AAAGTAAAAG5341 ATGCTGAAGA TCAGTTGGGT GCACGAGTGG GTTACATCGA ACTGGATCTC AACAGCGGTA5401 AGATCCTTGA GAGTTTTCGC CCCGAAGAAC GTTTTCCAAT GATGAGCACT TTTAAAGTTC5461 TGCTATGTCA TACACTATTA TCCCGTATTG ACGCCGGGCA AGAGCAACTC GGTCGCCGGG5521 CGCGGTATTC TCAGAATGAC TTGGTTGAGT ACTCACCAGT CACAGAAAAG CATCTTACGG5581 ATGGCATGAC AGTAAGAGAA TTATGCAGTG CTGCCATAAC CATGAGTGAT AACACTGCGG5641 CCAACTTACT TCTGACAACG ATCGGAGGAC CGAAGGAGCT AACCGCTTTT TTGCACAACA5701 TGGGGGATCA TGTAACTCGC CTTGATCGTT GGGAACCGGA GCTGAATGAA GCCATACCAA5761 ACGACGAGAG TGACACCACG ATGCCTGTAG CAATGCCAAC AACGTTGCGC AAACTATTAA5821 CTGGCGAACT ACTTACTCTA GCTTCCCGGC AACAATTAAT AGACTGGATG GAGGCGGATA5881 AAGTTGCAGG ACCACTTCTG CGCTCGGCCC TTCCGGCTGG CTGGTTTATT GCTGATAAAT5941 CTGGAGCCGG TGAGCGTGGG TCTCGCGGTA TCATTGCAGC ACTGGGGCCA GATGGTAAGC6001 CCTCCCGTAT CGTAGTTATC TACACGACGG GGAGTCAGGC AACTATGGAT GAACGAAATA6061 GACAGATCGC TGAGATAGGT GCCTCACTGA TTAAGCATTG GTAACTGTCA GACCAAGTTT6121 ACTCATATAT ACTTTAGATT GATTTAAA C TTCATTTTTA ATTTAAAAGG ATCTAGGTGA6181 AGATCCTTTT TGATAATCTC ATGACCAAAA TCCCTTAACG TGAGTTTTCG TTCCACTGAG6241 CGTCAGACCC CGTAGAAAAG ATCAAAGGAT CTTCTTGAGA TCCTTTTTTT CTGCGCGTAA6301 TCTGCTGCTT GCAAACAAAA AAACCACCGC TACCAGCGGT GGTTTGTTTG CCGGATCAAG6361 AGCTACCAAC TCTTTTTCCG AAGGTAACTG GCTTCAGCAG AGCGCAGATA CCAAATACTG6421 TCCTTCTAGT GTAGCCGTAG TTAGGCCACC ACTTCAAGAA CTCTGTAGCA CCGCCTACAT6481 ACCTCGCTCT GCTAATCCTG TTACCAGTGG CTGCTGCCAG TGGCGATAAG TCGTGTCTTA6541 CCGGGTTGGA CTCAAGACGA TAGTTACCGG ATAAGGCGCA GCGGTCGGGC TGAACGGGGG6601 GTTCGTGCAC ACAGCCCAGC TTGGAGCGAA CGACCTACAC CGAACTGAGA TACCTACAGC6661 GTGAGCATTG AGAAAGCGCC ACGCTTCCCG AAGGGAGAAA GGCGGACAGG TATCCGGTAA6721 GCGGCAGGGT CGGAACAGGA GAGCGCACGA GGGAGCTTCC AGGGGGAAAC GCCTGGTATC6781 TTTATAGTCC TGTCGGGTTT CGCCACCTCT GACTTGAGCG TCGATTTTTG TGATGCTCGT6841 CAGGGGGGCG GAGCCTATGG AAAAACGCCA GCAACGCGGC CTTTTTACGG TTCCTGGCCT6901 TTTGCTGGCC TTTTGCTCAC ATGTTCTTTC CTGCGTTATC CCCTGATTCT GTGGATAACC6961 GTATTACCGC CTTTGAGTGA GCTGATACCG CTCGCCGCAG CCGAACGACC GAGCGCAGCG7021 AGTCAGTGAG CGAGGAAGCG GAAG以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
权利要求
1.一种基因靶向序列盒,其特征在于,其包括内部核糖体进入位点引导的抗药性标记基因区和两端的同向LoxP序列LoxP-IRES-Neor-PolyA-LoxP,该片段的上游端和下游端分别连接多个克隆酶切位点,以闭环质粒形式存在。
2.一种如权利要求1所述的基因靶向序列盒的构建方法,其特征在于,其构建方法是(1)以pLP-IRESneo为模板,通过多聚酶链式反应扩增基因片段IRES-Neor-PolyA合成寡聚脱氧核糖核酸为多聚酶链式反应的引物设计如下正向引物为24-30个核苷酸组成的寡核苷酸,其5’端含有一个PmeI平末端内切酶位点,后接与模板IRES起始序列一致的寡聚核苷酸序列;反向引物为54-66mer寡核苷酸,其5’端含有一个34寡核苷酸的LoxP序列,其后续序列为与模板中的PolyA尾端反义链相同的20-27寡核苷酸;进行多聚酶链式反应,即向反应混合物中加入正、反两引物及四种脱氧核糖核苷酸,加入Taq聚合酶,将该混合物在92-98℃,加热5分钟,使模板DNA变性,经过94℃,10-30秒钟→50℃-60℃,15-40秒→72℃,1-2分钟的20-30个循环,合成1768碱基对(bp)的DNA片段,经凝胶电泳分离并纯化后连接入pCR2.1-TA,转化大肠杆菌DH5α,获得质粒A;(2)5’端LoxP序列的插入和YC-Neo序列盒的构成设计并合成具有LoxP序列的寡核苷酸,正链5’端起为一限制性内切酶酶解后的SpeI粘性末端,该粘性末端5’-CTAGT后接LoxP的正链序列;反链为与之互补的LoxP负链序列,但在其5’端为PmeI内切酶水解后的序列,即5’-AAAC;将上述两寡核苷酸等量混合,用T4激酶磷酸化以上核苷酸的混合物,加热至90-98℃后退火至室温,得到双链DNA,一端为SpeI内切酶的粘性末端,另一端为PmeI内切酶的平末端;将之与上述A质粒用SpeI和PmeI限制性内切酶水解获得的开口质粒连接,即获得序列盒YC-Neo的5.6kb质粒。
3.一种如权利要求1所述的基因靶向序列盒的应用,其特征在于,所述序列盒可用于无启动子基因靶向敲出和基因置换。
4.一种如权利要求1所述的基因靶向序列盒的应用,其特征在于,所述序列盒可用于培养包括悬浮细胞和贴壁细胞在内的哺乳动物细胞系。
5.一种基因靶向序列盒,其特征在于,其包括抗药性标记基因和绿色荧光蛋白的基因在内的分别由IRES序列介导的双顺反子区域及两端的同向LoxP序列LoxP-IRES-GFP-IRES-Neor-PolyA-LoxP,该片段的上游端和下游端分别连接多个克隆酶切位点,且在Neor标记基因上游,连接有另一个基因,该基因为编码增强的绿色荧光蛋白。
6.一种如权利要求5所述的基因靶向序列盒的构建方法,其特征在于,其构建方法是(1)以pLP-IRESneo为模板,通过多聚酶链式反应扩增基因片段IRES-Neor-PolyA合成寡聚脱氧核糖核酸为多聚酶链式反应的引物设计如下正向引物为24-30个核苷酸组成的寡核苷酸,其5’端含有一个PmeI平末端内切酶位点,后接与模板IRES起始序列一致的寡聚核苷酸序列;反向引物为54-66mer寡核苷酸,其5’端含有一个34寡核苷酸的LoxP序列,后续序列为模板中的PolyA尾端反义链相同的20-27寡核苷酸;进行多聚酶链式反应,即,向反应混合物中加入正、反两引物及四种脱氧核糖核苷酸,加入Taq聚合酶,将该混合物在92-98℃,加热5分钟,使模板DNA变性,将该混合物在92-98℃,加热5分钟,使模板DNA变性,经过94℃,10-30秒钟→50℃-60℃,15-40秒→72℃,1-2分钟的20-30个循环,合成1768碱基对(bp)的DNA片段,经凝胶电泳分离并纯化后连接入pCR2.1-TA(Invitrogen),转化大肠杆菌DH5α,获得质粒A;(2)5’端LoxP序列的插入和YC-Neo序列盒的构成设计并合成具有LoxP序列的寡核苷酸,正链5’端起为一限制性内切酶酶解后的SpeI粘性末端,该SpeI的粘性末端5’-CTAGT后接LoxP的正链序列;反链为与之互补的LoxP负链序列,但在其5’端为PmeI内切酶水解后的序列5’-AAAC;将上述两寡核苷酸等量混合,用T4激酶磷酸化以上核苷酸的混合物,加热至90-98℃后退火至室温,得到双链DNA,一端为SpeI内切酶的粘性末端,另一端为PmeI内切酶的平末端;将之与上述A质粒用SpeI和PmeI限制性内切酶水解获得的开口质粒连接,即获得序列盒YC-Neo的5.6kb质粒;(3)荧光蛋白表达序列IRES2-EGFP片段的扩增以pIRES2-EGFP为模板进行多聚酶链式反应,其中,所用正向引物为21-27个核苷酸,其为序列与IRES2起始部位相同的寡核苷酸;反向引物为21-27个核苷酸,其为与EGFP的PolyA区结尾的序列互补的寡核苷酸;即向反应混合物中加入正、反两引物及四种脱氧核糖核苷酸,加入Taq聚合酶,将该混合物在92-98℃,加热5分钟,使模板DNA变性,将该混合物在92-98℃,加热5分钟,使模板DNA变性,经过94℃,10-30秒钟→50℃-60℃,15-40秒→72℃,1-2分钟的20-30个循环,获得1320碱基对的DNA片段,末端用Klenow酶作用补齐为平末端;(4)将(2)中得到的YC-Neo质粒用PmeI内切酶水解,获得平末端质粒,将(3)中得到的1320碱基对片段连入在YC-Neo质粒中,用限制性内切酶NcoI鉴定顺反子的连接方向,选择正确连接方向的克隆,即获得具有双顺反子的YC-GN载体的7.1kb质粒。
7.一种如权利要求5所述的基因靶向序列盒的应用,其特征在于,所述序列盒可用于无启动子基因靶向敲出和基因置换。
8.一种如权利要求5所述的基因靶向序列盒的应用,其特征在于,所述序列盒可用于培养包括悬浮细胞和贴壁细胞的哺乳动物细胞系。
9.一种如权利要求5所述的体细胞基因导向序列盒的应用,其特征在于,所述序列盒可用于根据克隆细胞的荧光强度,利用流式细胞仪的荧光激活细胞分选功能进行分选和富集目的克隆。
全文摘要
本发明提供一种基因靶向序列盒,其包括内部核糖体进入位点(IRES)引导的抗药性标记基因区和两端的同向LoxP序列LoxP-IRES-Neo
文档编号A61K48/00GK1539988SQ0313040
公开日2004年10月27日 申请日期2003年7月15日 优先权日2003年7月15日
发明者曹又佳, 张翠竹 申请人:南开大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1