一对转录激活子样效应因子核酸酶及其编码基因与应用的制作方法

文档序号:409486阅读:280来源:国知局
专利名称:一对转录激活子样效应因子核酸酶及其编码基因与应用的制作方法
技术领域
本发明涉及基因工程领域,尤其涉及一对转录激活子样效应因子核酸酶及其编码基因与应用。
背景技术
按照人类的意愿对基因组进行定向靶向修饰一直是许多科学家的梦想。在内源的基因组上特异地删除或加入我们需要的序列,一方面可以构建出各种动物模型用于生物学基础研究和疾病机理研究,另一方面可以生产动物反应器用以廉价生产我们需要的又很难从其他途径得到的生物组分。朊蛋白类疾病,也叫传染性海绵状脑病,是一类致命的传染性中枢神经系统退行性疾病,主要包括发生在绵羊和山羊的羊搔痒病,发生在牛的牛海绵状脑病(即疯牛病),以及发生在人的克雅氏病(CJD)、G综合症、致死性家族失眠症(FFI)等。动物基因组编码的朊蛋白(prpC,一种锚定在神经细胞、淋巴细胞和别的细胞外表面的膜糖蛋白)是一种与传染性海绵状脑病的发生直接相关的分子。虽然已有实验证明缺失PrpC的小鼠不仅能够正常发育和繁殖后代并且具有抵抗传染性海绵状脑病的能力,然而缺失PrpC的大型动物,尤其是那些在自然条件下可以自发感染该类疾病的大型动物,目前的研究距离实用性差距仍然很远。2001年英国的科学家使用绵羊胎儿成纤维细胞基因打靶再通过体细胞克隆获得了四只Prnp+/-的羊羔,但其中三只都在出生后死亡,存活最久的也仅仅在世12天。2004年Kuroiwa等使用胎牛成纤维细胞敲除了牛编码PrP的基因。2006年,Golding MC等利用RNAi干涉技术针对引起牛疯牛病和羊搔痒病的PRNP基因序列设计有效的siRNA,获得一头转基因羊胎儿,对其检测发现siRNA很好地抑制了体内PRNP基因的表达。我国科学家也致力于羊瘙痒症的研究,成国祥等获得了 5只成活的Prnp+/-山羊。此后,他们将Prnp+/-的成年山羊体细胞进行二次基因打靶,将获得的Prnp-/-体细胞进行克隆,但仅仅获得了孕73天的Prnp-/-山羊胎儿,未得到成活的转基因羊。从中我们可以推测Prnp+/-山羊的繁育情况并不容乐观,二次基因打靶加再次的体细胞克隆的难度远远大于Prnp+/-山羊的自然交配获得纯合体。目前为止,虽然国内外的科学家们付出了艰苦的努力,但仍未获得Prnp-/-的成年羊。此外,绵羊和山羊虽然都可能得羊瘙痒症,但该病是主要发生于绵羊中的,而绵羊与山羊是同科而不同属的动物,绵羊和山羊之间不能交配产羔,因此获得PRNP基因敲除的绵羊是具有重要的科学和经济价值的。但人们一直没有找到简单高效的方法对基因组进行基因组靶向修饰。传统的基因打靶技术依赖于细胞内自然发生的同源染色体随机交换,其打靶效率非常低,通常只有10_6-10_8,这种打靶方法只在小鼠中得到了广泛了应用,而在其他模式动物及大型哺乳动物中都因效率太低而得不到广泛应用。近年发展很快的序列特异的核酸酶可以用于精确的基因组靶向修饰。一般由序列特异的核酸酶由一个DNA识别结构域和一个非特异性核酸内切酶结构域构成。原理是首先由DNA识别域把核酸酶定位到需要编辑的基因组区域,然后非特异性核酸内切酶切断双链DNA从而造成DNA双链断裂(double-strand break,DSB),引入的DSB激活的DNA自我修复可以引起基因的突变和促进该位点DNA同源重组。锌指核酸酶(Zinc-finger nucleases,ZFN)是现在研究最清楚也是应用最广的序列特异的核酸酶。其原理是两个锌指蛋白特异识别两段相隔5-7bp的DNA序列,并把与之融合表达的非特异性DNA切割蛋白Fokl的两个单聚体定位到了一起,DNA切割蛋白形成双聚体时可以切断该位置的双链DNA,从而造成DSB0 ZFN的出现使基因组靶向修饰技术向前迈进了一大步,然而,ZFN技术还存在靶向不确定性、效率低、拖把率高等问题,研究者很难自行设计出特异和高效的靶向基因组目的序列的锌指核酸酶仍然是制约ZFN广泛应用的瓶颈。而商业购买高效特异的锌指核酸酶又价格昂贵(20万人民币/基因),一般研究者或商业公司根本无法承受这笔费用。2009年两个研究组发现植物病原体Xanthomonas中的一种可以调节植物基因表达的转录激活子样效应因子(transcription activator-like effector, TALE)表现出DNA结合特异性,而其识别密码具有模块化和简单化的特点,为科学家们开发出更简易的新型基因组祀向修饰技术带来了新希望。TALE与Fokl融合后即形成转录激活子样效应因子核酸酶(transcriptionactivator-like effector nucleases, TALEN)。TALEN 的打革E原理与 ZFN 相同,只是识别特异DNA的蛋白不同。TALEs由数十个特异性识别DNA的串联“蛋白模块”和两侧的N-末端及C-末端序列组成。每个“蛋白模块”包含34个氨基酸,第12和13位残基是靶向识别的关键位点,被称作重复可变的di-residues (RVDs)位点。然而不同于每个锌指蛋白识别特异性的三联体碱基,TALEs上的每个RVDs仅能识别一个碱基。Sangamo BioSciences公司和哈佛大学的两个研究小组分别利用TALEs技术进行了基因组靶向修饰相关研究,两篇研究论文发表在同一期的《自然生物技术》(NatureBiotechnology)杂志上。Edward Rebar领导的研究小组将带有不同C-末端TALE的截短片段连接到核酸酶FokI的催化结构域上。当研究人员将构建的TALENs靶向内源性的人类NTF3和CCR5基因时,证实TALENs能够特异性地对这些基因片段进行剪切。哈佛大学研究小组开发了一种基于分层连接的策略来构建包含12个重复模块的TALEs。他们在保留RVDs的基础上减少了每个模块的DNA序列,同时将剩余序列的重复性降到最低。进而通过12重PCR获得了带有特异性连接序列的单体,并将其克隆至包含TALE N-末端和C-末端序列的骨架载体中。为了构建TALE转录因子,研究人员又将TALE融合到一个转录因子的激活域。在接下来的靶向性检测中,研究人员证实其能特异地使四个检测内源基因中的两个基因表达上调。今年7月MIT的Rudolf Jaenisch小组也验证了 TALEN在人胚胎干细胞和人iPSC中的打靶效果。其通过在五个位点的TALENs与之前其在相同位置的ZFNs的打靶效果作对t匕,得出五组TALENs在打靶效率和精确度上都与从Sangamo BioSciences公司购买的ZFNs相似,进一步验证了 TALENs是非常好的基因组编辑工具。

发明内容
本发明提供了一对短肽,利用这对短肽构建获得的一对转录激活子样效应因子(TALE)能够特异性地识别山羊或绵羊朊蛋白基因(PRNP)基因组上的二段相邻核苷酸;利用这对转录激活子样效应因子构建获得的一对转录激活子样效应因子核酸酶(TALEN),能够对山羊或绵 羊朊蛋白基因进行准确、高效地打靶。一对短肽,所述一对短肽分别具有如SEQ ID NO. I和SEQ ID NO. 2所示的氨基酸序列。本发明提供了一对多核苷酸,所述一对多核苷酸分别编码上述的一对短肽。优选地,所述一对多核苷酸分别具有如SEQ ID NO. 3和SEQ ID NO. 4所示的碱基序列。其中,所述的多核苷酸由分别识别山羊或绵羊朊蛋白基因上核苷酸序列SEQ IDNO 17和SEQ ID NO 20中相应碱基的TALENs识别模块依序连接而成,其中,识别碱基A的TALENs识别模块为NI-A (如SEQ ID NO 22所示),识别碱基T的TALENs识别模块为NG-T (如SEQ ID NO 23所示),识别碱基C的TALENs识别模块为HD-C (如SEQ ID NO 24所示),识别碱基G的TALENs识别模块为NK-G (如SEQ ID NO 25所示)。本发明还提供了一对蛋白质,所述一对蛋白质由上述的一对短肽两端分别加上转录激活子样效应因子氨基酸序列框架的N端和C端组成;其中,所述的转录激活子样效应因子氨基酸序列框架的N端和C端为天然的或经过人工改造的序列。这对蛋白质可以分别特异性地识别山羊或绵羊朊蛋白基因(PRNP)上的二段核苷酸序列,所述二段核苷酸序列分别选自以下二个核苷酸序列(I)SEQ ID N0:17序列或SEQ ID NO : 17序列的一个或二个核苷酸经过取代所衍生的核苷酸序列;(2) SEQ ID NO :20序列或SEQ ID NO :20序列的一个或二个核苷酸经过取代所衍
生的核苷酸序列。优选地,所述的这对蛋白质分别具有如SEQ ID NO. 5和SEQ ID NO. 6所示的氨基酸序列。该蛋白质为转录激活子样效应因子,命名为PRNP-TALE-L614和PRNP-TALE-R629。本发明还提供了一对多核苷酸,所述一对多核苷酸分别编码上述的一对蛋白质。优选地,所述一对多核苷酸分别具有如SEQ ID NO. 7和SEQ ID NO. 8所示的碱基序列。本发明还提供了一对融合蛋白,所述一对融合蛋白由上述的一对蛋白质分别与DNA切割蛋白融合而成。优选地,所述的DNA切割蛋白为DNA内切酶。优选地,所述的一对蛋白质分别与DNA切割蛋白的二个亚基融合。更优选地,所述的DNA切割蛋白为天然的或经过人工改造的FoklDNA内切酶。最优选地,所述一对融合蛋白分别具有如SEQ ID NO. 9和SEQ ID NO. 10所示的氨基酸序列。该融合蛋白为转录激活子样效应因子核酸酶,命名为PRNP-TALEN-L614和PRNP-TALEN-R629。本发明还提供了一对多核苷酸,所述一对多核苷酸分别编码上述的一对融合蛋白质。优选地,所述一对多核苷酸分别具有如SEQ ID NO. 11和SEQ ID NO. 12所示的碱
基序列。本发明还提供了一种包含上述一对多核苷酸中的任意一条多核苷酸的载体。
优选地,可以先将能特异性识别SEQ ID NO. 17或SEQ ID NO. 20所示碱基序列的多核苷酸连接到中间载体pCMV-NLS-TALE backbone-Fokl (R) -intermediate上,再将该中间载体连接到最终载体PEF la-NLS-TALE backbone-Fokl (R) -pA或最终载体pEFla-NLS-TALE backbone-Fokl (L) -IRES-PURO-pA上,构建获得包含编码转录激活子样效应因子核酸酶基因的质粒载体,能表达转录激活子样效应因子核酸酶。本发明还提供了一种用上述载体转化的宿主细胞。
优选地,所述宿主细胞为山羊或绵羊细胞;更优选地,所述宿主细胞为山羊或绵羊IPS细胞。本发明还提供了一种上述一对融合蛋白或上述一对多核苷酸在对山羊或绵羊朊蛋白基因靶向修饰中的应用。优选地,所述一对融合蛋白分别具有如SEQ ID NO. 9和SEQ ID NO. 10所示的氨基酸序列;所述一对多核苷酸分别具有如SEQ ID NO. 11和SEQ ID NO. 12所示的碱基序列。本发明还提供了一种山羊或绵羊朊蛋白基因打靶的方法,包括将上述一对融合蛋白或者上述一对多核苷酸或者含有这对多核苷酸的载体转入山羊或绵羊IPS细胞,于30-37°C扩增培养3-7天,得到朊蛋白基因被靶向修饰的细胞。优选地,所述一对融合蛋白分别具有如SEQ ID NO. 9和SEQ ID NO. 10所示的氨基酸序列;所述一对多核苷酸分别具有如SEQ ID NO. 11和SEQ ID NO. 12所示的碱基序列。优选地,所述山羊或绵羊IPS细胞中还转入有抗puro蛋白或能表达抗puro蛋白的质粒,便于筛选。优选地,所述扩增培养过程中至少有I天在30°C下进行,能获得更好的打靶效果。本发明针对山羊或绵羊PRNP基因的一个位点设计了一对转录激活子样效应因子核酸酶(PRNP-TALEN-L614和PRNP-TALEN-R629),这对TALENs分别由可以识别PRNP基因上一段核苷酸的DNA识别结构域与一个Fokl DNA内切酶的两个异源亚基融合得到。将这对转录激活子样效应因子核酸酶同时转入宿主细胞时,其能对宿主细胞PRNP基因的位点打靶,并使打靶位点发生基因突变,包括碱基缺失、碱基插入等,从而实现对山羊或绵羊PRNP基因的靶向修饰,具有特异性强、打靶效率高、准确度高等优点。


图I为人工设计的转录激活子样效应因子核酸酶识别的DNA序列及位点;图2为18个识别模块连接策略示意图;其中,A =PCR为每个识别模块添加酶切识别序列和连接接头过程示意图;B =PCR为每个识别模块添加酶切识别序列和连接接头后示意图;C =PCR扩增6模块片段与中间载体示意图;D :最终构建的TALEN质粒示意图;图3 为中间载体 pCMV-NLS-TALE backbone-Fokl (R)-intermediate 不意图;图4 为最终载体 pEF la-NLS-TALE backbone-Fokl (R)-pA 不意图;图5 为最终载体 pEF la-NLS-TALE backbone-Fokl (L)-IRES-PURO-pA 示意图;图6为PRNP基因在打靶位点的基因型变化;其中,-表示碱基缺失。具体实施 方式以下实施例中所使用的技术,包括PCR扩增与检测、细胞转染等分子生物学技术,以及细胞培养、检测技术等,除非特别说明,均为本领域内的技术人员已知的常规技术;所使用的仪器设备、试剂和细胞系等,除非是本说明书特别注明,均为一般本领域的研究和技术人员可以通过公共途径获得的。实施例I TALENs靶序列的设计I、从NCBI上下载山羊和绵羊PRNP基因组序列(绵羊Gene ID :493887,山羊PRNP基因序列与绵羊的相同)2、设计引物并PCR扩增基因组上打靶位点片段,并测序,其中,PCR引物及测序引物见表I ;表I
权利要求
1.一对短肽,其特征在于,所述ー对短肽分别具有如SEQ ID NO. I和SEQ ID NO. 2所示的氨基酸序列。
2.—对多核苷酸,其特征在于,所述ー对多核苷酸分别编码如权利要求I所述的ー对短肽。
3.如权利要求2所述ー对多核苷酸,其特征在于,所述ー对多核苷酸分别具有如SEQID NO. 3和SEQ ID NO. 4所示的碱基序列。
4.ー对蛋白质,其特征在于,所述ー对蛋白质由权利要求I所述的ー对短肽两端分别加上转录激活子样效应因子氨基酸序列框架的N端和C端组成;其中,所述的转录激活子样效应因子氨基酸序列框架的N端和C端为天然的或经过人工改造的序列。
5.如权利要求4所述ー对蛋白质,其特征在于,所述ー对蛋白质分别具有如SEQIDNO. 5和SEQ ID NO. 6所示的氨基酸序列。
6.—对多核苷酸,其特征在于,所述ー对多核苷酸分别编码如权利要求4或5所述的ー对蛋白质。
7.如权利要求6所述ー对多核苷酸,其特征在于,所述ー对多核苷酸分别具有如SEQID NO. 7和SEQ ID NO. 8所示的碱基序列。
8.ー对融合蛋白,其特征在于,所述ー对融合蛋白由权利要求4所述的ー对蛋白质分别与DNA切割蛋白融合而成。
9.如权利要求8所述ー对融合蛋白,其特征在于,所述的ー对蛋白质分别与DNA切割蛋白的ニ个亚基融合。
10.如权利要求9所述ー对融合蛋白,其特征在于,所述的DNA切割蛋白为天然的或经过人工改造的FoklDNA内切酶。
11.如权利要求8-10任ー权利要求所述ー对融合蛋白,其特征在于,所述ー对融合蛋白分别具有如SEQ ID NO. 9和SEQ ID NO. 10所示的氨基酸序列。
12.—对多核苷酸,其特征在于,所述ー对多核苷酸分别编码如权利要求8-10任ー权利要求所述的ー对融合蛋白。
13.—对多核苷酸,其特征在于,所述ー对多核苷酸分别编码如权利要求11所述的ー对融合蛋白。
14.如权利要求13所述的ー对多核苷酸,其特征在于,所述ー对多核苷酸分别具有如SEQ ID NO. 11和SEQ ID NO. 12所示的碱基序列。
15.—种包含权利要求2_3、6_7、13或14任一权利要求所述一对多核苷酸中的任意一条多核苷酸的载体。
16.一种用权利要求15所述载体转化的宿主细胞。
17.—种包含权利要求12所述ー对多核苷酸中的任意一条多核苷酸的载体。
18.一种用权利要求17所述载体转化的宿主细胞。
19.如权利要求16或18所述宿主细胞,其特征在于,所述宿主细胞为山羊或绵羊IPS细胞。
20.一种如权利要求11所述ー对融合蛋白或如权利要求14所述ー对多核苷酸在对山羊或绵羊朊蛋白基因靶向修饰中的应用。
21.—种山羊或绵羊朊蛋白基因打靶的方法,其特征在于,包括将权利要求11所述ー对融合蛋白或者权利要求13或14所述ー对多核苷酸或者含有权利要求13或14所述ー对多核苷酸的载体转入山羊或绵羊IPS细胞,于30-37°C扩增培养3-7天,得到朊蛋白基因被靶向修饰的细胞。
22.如权利要求21所述的方法,其特征在于,所述山羊或绵羊IPS细胞中还转入有抗puro蛋白或能表达抗puro蛋白的质粒。
23.如权利要求21或22所述的方法,其特征在于,所述扩增培养过程中至少有I天在30°C下进行。
全文摘要
本发明公开了一对转录激活子样效应因子核酸酶及其编码基因与应用。这对转录激活子样效应因子核酸酶(TALEN)由一对DNA识别蛋白分别与Fok1 DNA内切酶的两个异源亚基融合得到,可以特异性地识别山羊或绵羊朊蛋白基因(PRNP)exon2上的两个相邻位点。将这对转录激活子样效应因子核酸酶同时转入宿主细胞时,其能对宿主细胞PRNP基因的exon2位点打靶,并使打靶位点发生基因突变,从而实现对山羊或绵羊PRNP基因的靶向修饰,具有特异性强、打靶效率高、准确度高等优点。
文档编号C12N15/85GK102627692SQ20121009777
公开日2012年8月8日 申请日期2012年4月5日 优先权日2012年4月5日
发明者庄庆刚, 肖磊 申请人:浙江大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1