一对转录激活子样效应因子核酸酶l3和r1及其编码基因与应用的制作方法

文档序号:412122阅读:310来源:国知局
专利名称:一对转录激活子样效应因子核酸酶l3和r1及其编码基因与应用的制作方法
技术领域
本发明涉及基因工程领域,尤其涉及一对转录激活子样效应因子核酸酶及其编码基因与应用。
背景技术
常见的血型系统除了 ABO血型,还有Rh血型。Rh血型分为Rh+和Rh-。RH阳性者可以接受RH阴性者的血液,但RH阴性者不能接受RH阳性者血液,因为RH阳性血液中的抗原将刺激RH阴性人体产生RH抗体。如果再次输入RH阳性血液,即可导致溶血性输血反应。而根据有关资料介绍,Rh阳性血型在中国汉族及大多数民族人中约占99. 7%,所以造成在我国Rh-的血型极为稀少,有很多病人因为没有合适配型的血液而失去生命。因此Rh-血 也有熊猫血之称。已经鉴定出的Rh血型系统的抗原有50多种,其中抗原D,C,c,E,和e是最要的。其中抗原D由RHD基因表达,抗原C,c,E,e由RHCE基因表达,如果能把该两个基因敲除,则RH阳性的血液则变成RH阴性。因RHD基因和RHCE基因同源性较高,本发明针对RHD基因和RHCE基因中的一段完全相同的序列,设计TALEN,已达到基因敲除的目的按照人类的意愿对基因组进行定向靶向修饰一直是许多科学家的梦想。在内源的基因组上特异地删除或加入我们需要的序列,这样可以构建出各种动物模型用于生物学基础研究和疾病机理研究人们一直没有找到简单高效的方法对基因组进行基因组靶向修饰。传统的基因打靶技术依赖于细胞内自然发生的同源染色体随机交换,其打靶效率非常低,通常只有10_6-10_8,这种打靶方法只在小鼠中得到了广泛了应用,而在其他模式动物及大型哺乳动物中都因效率太低而得不到广泛应用。近年发展很快的序列特异的核酸酶可以用于精确的基因组靶向修饰。一般由序列特异的核酸酶由一个DNA识别结构域和一个非特异性核酸内切酶结构域构成。原理是首先由DNA识别域把核酸酶定位到需要编辑的基因组区域,然后非特异性核酸内切酶切断双链DNA从而造成DNA双链断裂(double-strand break,DSB),引入的DSB激活的DNA自我修复可以引起基因的突变和促进该位点DNA同源重组。锌指核酸酶(Zinc-finger nucleases,ZFN)是现在研究最清楚也是应用最广的序列特异的核酸酶。其原理是两个锌指蛋白特异识别两段相隔5-7bp的DNA序列,并把与之融合表达的非特异性DNA切割蛋白Fokl的两个单聚体定位到了一起,DNA切割蛋白形成双聚体时可以切断该位置的双链DNA,从而造成DSB。ZFN的出现使基因组靶向修饰技术向前迈进了一大步,然而,ZFN技术还存在靶向不确定性、效率低、拖把率高等问题,研究者很难自行设计出特异和高效的靶向基因组目的序列的锌指核酸酶仍然是制约ZFN广泛应用的瓶颈。而商业购买高效特异的锌指核酸酶又价格昂贵(20万人民币/基因),一般研究者或商业公司根本无法承受这笔费用。
2009年两个研究组发现植物病原体Xanthomonas中的一种可以调节植物基因表达的转录激活子样效应因子(transcription activator-like effector,TALE)表现出DNA结合特异性,而其识别密码具有模块化和简单化的特点,为科学家们开发出更简易的新型基因组祀向修饰技术带来了新希望。TALE与Fokl融合后即形成转录激活子样效应因子核酸酶(transcriptionactivator-like effector nucleases, TALEN)。TALEN 的打祀原理与 ZFN 相同,只是识别特异DNA的蛋白不同。TALEs由数十个特异性识别DNA的串联“蛋白模块”和两侧的N-末端及C-末端序列组成。每个“蛋白模块”包含34个氨基酸,第12和13位残基是靶向识别的关键位点,被称作重复可变的di-residues (RVDs)位点。然而不同于每个锌指蛋白识别特异性的三联体碱基,TALEs上的每个RVDs仅能识别一个碱基。Sangamo BioSciences公司和哈佛大学的两个研究小组分别利用TALEs技术进行了基因组靶向修饰相关研究,两篇研究论文发表在同一期的《自然生物技术》(Nature
Biotechnology)杂志上。Edward Rebar领导的研究小组将带有不同C-末端TALE的截短片段连接到核酸酶FokI的催化结构域上。当研究人员将构建的TALENs靶向内源性的人类NTF3和CCR5基因时,证实TALENs能够特异性地对这些基因片段进行剪切。哈佛大学研究小组开发了一种基于分层连接的策略来构建包含12个重复模块的TALEs。他们在保留RVDs的基础上减少了每个模块的DNA序列,同时将剩余序列的重复性降到最低。进而通过12重PCR获得了带有特异性连接序列的单体,并将其克隆至包含TALE N-末端和C-末端序列的骨架载体中。为了构建TALE转录因子,研究人员又将TALE融合到一个转录因子的激活域。在接下来的靶向性检测中,研究人员证实其能特异地使四个检测内源基因中的两个基因表达上调。今年7月MIT的Rudolf Jaenisch小组也验证了 TALEN在人胚胎干细胞和人iPSC中的打靶效果。其通过在五个位点的TALENs与之前其在相同位置的ZFNs的打靶效果作对t匕,得出五组TALENs在打靶效率和精确度上都与从Sangamo BioSciences公司购买的ZFNs相似,进一步验证了 TALENs是非常好的基因组编辑工具。

发明内容
本发明提供了一对短肽,利用这对短肽构建获得的一对转录激活子样效应因子(TALE)能够特异性地识别人RHD基因或RHCE基因组上的二段相邻核苷酸;利用这对转录激活子样效应因子构建获得的一对转录激活子样效应因子核酸酶(TALEN),能够对人RHD基因或RHCE基因进行准确、高效地打靶。一对短肽,所述一对短肽分别具有如SEQ ID NO. I和SEQ ID NO. 2所示的氨基酸序列。本发明提供了一对多核苷酸,所述一对多核苷酸分别编码上述的一对短肽。优选地,所述一对多核苷酸分别具有如SEQ ID NO. 3和SEQ ID NO. 4所示的碱基序列。其中,所述的多核苷酸由分别识别人RHCE基因或RHD基因上核苷酸序列中相应碱基的TALENs识别模块依序连接而成,其中,识别碱基A的TALENs识别模块为NIA,识别碱基T的TALENs识别模块为NG-T,识别碱基C的TALENs识别模块为HD-C,识别碱基G的TALENs识别模块为NK-G。本发明还提供了一对蛋白质,所述一对蛋白质由上述的一对短肽两端分别加上转录激活子样效应因子氨基酸序列框架的N端和C端组成;其中,所述的转录激活子样效应因子氨基酸序列框架的N端和C端为天然的或经过人工改造的序列。这对蛋白质可以分别特异性地识别人RHD基因或RHCE基因上的二段核苷酸序列,所述二段核苷酸序列分别选自以下二个核苷酸序列(l)ctcattctcctct (SEQ ID NO: 17序列)或者该序列的一个或二个核苷酸经过取代所衍生的核苷酸序列;(2) ctaaggaagcgtcatagt (SEQ ID NO: 18序列)或该序列的一个或二个核苷酸经过取代所衍生的核苷酸序列。优选地,所述的这对蛋白质分别具有如SEQ ID NO. 5和SEQ ID NO. 6所示的氨基·酸序列。该蛋白质为转录激活子样效应因子,命名为RH-TALE-L3和RH-TALE-Rl。本发明还提供了一对多核苷酸,所述一对多核苷酸分别编码上述的一对蛋白质。优选地,所述一对多核苷酸分别具有如SEQ ID NO. 7和SEQ ID NO. 8所示的碱基序列。本发明还提供了一对融合蛋白,所述一对融合蛋白由上述的一对蛋白质分别与DNA切割蛋白融合而成。优选地,所述的DNA切割蛋白为DNA内切酶。优选地,所述的一对蛋白质分别与DNA切割蛋白的二个亚基融合。更优选地,所述的DNA切割蛋白为天然的或经过人工改造的Fokl DNA内切酶。最优选地,所述一对融合蛋白分别具有如SEQ ID NO. 9和SEQ ID NO. 10所示的氨基酸序列。该融合蛋白为转录激活子样效应因子核酸酶,命名为RH-TALEN-L3和RH-TALEN-R1。本发明还提供了一对多核苷酸,所述一对多核苷酸分别编码上述的一对融合蛋白质。优选地,所述一对多核苷酸分别具有如SEQ ID NO. 11和SEQ ID NO. 12所示的碱
基序列。本发明还提供了一种包含上述一对多核苷酸中的任意一条多核苷酸的重组载体。优选地,可以先将能特异性识别SEQ ID NO. 17或SEQ ID NO. 22所示碱基序列的多核苷酸连接到中间载体pCMV-NLS-TALE backbone-Fokl (R) -intermediate上,再将该中间载体连接到最终载体 pEFla-NLS-TALE backbone-Fokl (R) -pA 或最终载体 pEFIa-NLS-TALEbackbone-Fokl (L) -IRES-PUROpA上,构建获得包含编码转录激活子样效应因子核酸酶基因的质粒载体,能表达转录激活子样效应因子核酸酶。本发明还提供了一种用上述重组载体转化的宿主细胞。优选地,所述宿主细胞为人离体细胞;更优选地,所述宿主细胞为人293T细胞。本发明还提供了一种上述一对融合蛋白或上述一对多核苷酸在对人RHD基因或RHCE基因靶向修饰中的应用。优选地,所述一对融合蛋白分别具有如SEQ ID NO. 9和SEQ ID NO. 10所示的氨基酸序列;所述一对多核苷酸分别具有如SEQ ID NO. 11和SEQ ID NO. 12所示的碱基序列。
本发明还提供了一种人RHD基因或RHCE基因基因打靶的方法,包括将上述一对融合蛋白或者上述一对多核苷酸或者含有这对多核苷酸的载体转入人离体细胞,于30-37°C扩增培养1-4天,得到朊蛋白基因被靶向修饰的细胞。优选地,所述一对融合蛋白分别具有如SEQ ID NO. 9和SEQ ID NO. 10所示的氨基酸序列;所述一对多核苷酸分别具有如SEQ ID NO. 11和SEQ ID NO. 12所示的碱基序列。优选地,所述人离体细胞中还转入有抗puro蛋白或能表达抗puro蛋白的质粒,便于筛选。本发明针对人RHD基因或RHCE基因的一个位点设计了一对转录激活子样效应因子核酸酶(RH-TALEN-L3和RH-TALEN-R1 ),这对TALENs分别由可以识别RHD或RHCE基因上一段核苷酸的DNA识别结构域与一个Fokl DNA内切酶的两个异源亚基融合得到。将这对转录激活子样效应因子核酸酶同时转入宿主细胞时,其能对宿主细胞RHD基因或RHCE基因的位点打靶,并使打靶位点发生基因突变,包括碱基缺失、碱基插入等,从而实现对人RHD 基因或RHCE基因的靶向修饰,具有特异性强、打靶效率高、准确度高等优点。


图I为人工设计的转录激活子样效应因子核酸酶识别的DNA序列及位点;图2为18个识别模块连接策略示意图;其中,A =PCR为每个识别模块添加酶切识别序列和连接接头过程示意图;B =PCR为每个识别模块添加酶切识别序列和连接接头后示意图;C =PCR扩增6模块片段与中间载体示意图;D:最终构建的TALEN质粒示意图;图3 为中间载体 pCMV-NLS-TALE backbone-Fokl (R)-intermediate 不意图;图4 为最终载体 pEFla-NLS-TALE backboneFokl (R) pA 不意图;图5 为最终载体 pEF la-NLS-TALE backboneFokl (L) -IRESPUR0-pA 示意图;图6为基因在打靶位点的基因型变化;其中,-表示碱基缺失,+表示碱基插入。
具体实施例方式以下实施例中所使用的技术,包括PCR扩增与检测、细胞转染等分子生物学技术,以及细胞培养、检测技术等,除非特别说明,均为本领域内的技术人员已知的常规技术;所使用的仪器设备、试剂和细胞系等,除非是本说明书特别注明,均为一般本领域的研究和技术人员可以通过公共途径获得的。实施例ITALENs靶序列的设计I、从NCBI 上下载人RHCE基因(GENE ID :6006)和 RHD基因组序列(GENE ID :6007)2、设计引物并PCR扩增基因组上打靶位点片段,并测序,其中,PCR引物及测序引物见表I ;表I
权利要求
1.一对短肽,其特征在于,所述一对短肽分别具有如SEQ ID NO. I和SEQ ID NO. 2所示的氨基酸序列。
2.—对多核苷酸,其特征在于,所述一对多核苷酸分别编码如权利要求I所述的一对短肽。
3.权利要求2所述一对多核苷酸,其特征在于,所述一对多核苷酸分别具有如SEQIDNO. 3和SEQ ID NO. 4所不的喊基序列。
4.一对蛋白质,其特征在于,所述一对蛋白质由权利要求I所述的一对短肽两端分别加上转录激活子样效应因子氨基酸序列框架的N端和C端组成;其中,所述的转录激活子样效应因子氨基酸序列框架的N端和C端为天然的或经过人工改造的序列。
5.权利要求4所述一对蛋白质,其特征在于,所述一对蛋白质分别具有如SEQID NO. 5和SEQ ID NO. 6所示的氨基酸序列。
6.—对多核苷酸,其特征在于,所述一对多核苷酸分别编码如权利要求4或5所述的一对蛋白质。
7.权利要求6所述一对多核苷酸,其特征在于,所述一对多核苷酸分别具有如SEQIDNO. 7和SEQ ID NO. 8所示的碱基序列。
8.一对融合蛋白,其特征在于,所述一对融合蛋白为转录激活子样效应因子核酸酶,由权利要求4所述的一对蛋白质分别与DNA切割蛋白融合而成。
9.权利要求8所述一对融合蛋白,其特征在于,由权利要求4所述的一对蛋白质分别与DNA切割蛋白的二个亚基融合。
10.权利要求9所述一对融合蛋白,其特征在于,所述的DNA切割蛋白为天然的或经过人工改造的Fokl DNA内切酶。
11.权利要求8 10任一权利要求所述一对融合蛋白,其特征在于,所述一对融合蛋白分别具有如SEQ ID NO. 9和SEQ ID NO. 10所示的氨基酸序列。
12.—对多核苷酸,其特征在于,所述一对多核苷酸分别编码如权利要求8 10任一权利要求所述的一对融合蛋白。
13.—对多核苷酸,其特征在于,所述一对多核苷酸分别编码如权利要求11所述的一对融合蛋白。
14.权利要求13所述的一对多核苷酸,其特征在于,所述一对多核苷酸分别具有如SEQID NO. 11和SEQ ID NO. 12所示的碱基序列。
15.—种重组载体,其特征在于,包含权利要求2、3、6、7、13或14任一权利要求所述一对多核苷酸中的任意一条多核苷酸。
16.一种宿主细胞,其特征在于,含有权利要求15所述重组载体。
17.—种重组载体,其特征在于,包含权利要求12所述一对多核苷酸中的任意一条多核苷酸。
18.一种宿主细胞,其特征在于,含有权利要求17所述重组载体。
19.权利要求16或18所述的宿主细胞,其特征在于,所述宿主细胞为人离体细胞。
20.权利要求11所述一对融合蛋白在对人RHD基因或RHCE基因靶向修饰中的应用。
21.如权利要求14所述一对多核苷酸在对人RHD基因或RHCE基因靶向修饰中的应用。
22.—种人RHD基因或RHCE基因打靶的方法,其特征在于,包括将权利要求11所述一对融合蛋白或者权利要求13或14所述一对多核苷酸或者含有权利要求13或14所述一对多核苷酸的重组载体转入人离体细胞,于30-37°C扩增培养3-7天,得到RHD基因或RHCE基因被靶向修饰的细胞。
23.权利要求22所述的方法,其特征在于,所述人离体细胞中还转入有抗puro蛋白或能表达抗puro蛋白的质粒。蛋白、寡核苷酸或质粒转入细胞后并加入puro药杀筛选成功转入的细胞,于37°C药杀3天,30-37°C扩增培养1_4天,得到RHD基因或RHCE基因被靶向修饰的细胞
全文摘要
本发明公开了一对转录激活子样效应因子核酸酶及其编码基因与应用。这对转录激活子样效应因子核酸酶(TALEN)由一对DNA识别蛋白分别与Fok1DNA内切酶的两个异源亚基融合得到,可以特异性地识别人RHD或RHCE基因exon1上的两个相邻位点。将这对转录激活子样效应因子核酸酶同时转入宿主细胞时,其能对宿主细胞基因的exon1位点打靶,并使打靶位点发生基因突变,从而实现对人RHCE或RHD基因的靶向修饰,具有特异性强、打靶效率高、准确度高等优点。
文档编号C12N15/55GK102850444SQ20121025591
公开日2013年1月2日 申请日期2012年7月21日 优先权日2012年7月21日
发明者吴昭, 赵金龙 申请人:上海斯丹赛生物技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1