在受体细胞的目的基因组序列引入变异的系统和方法

文档序号:491225阅读:301来源:国知局
在受体细胞的目的基因组序列引入变异的系统和方法
【专利摘要】本发明提供了一种在受体细胞的目的基因组序列引入变异的系统,所述系统包括:a)一个基因组DNA诱变序列GSMS表达盒,其中所述的GSMS表达盒包括一段和所述目的基因组序列同源的多聚核苷酸序列和一个引物结合序列,其中所述的GSMS表达盒产生GSMS RNAs;b)一个反转录酶表达盒,其中所述的反转录酶表达盒包括一段编码反转录酶的多聚核苷酸序列。本发明还提供了在受体细胞目的基因组序列引入变异的方法以及获得在目的基因组序列有随机变异的细胞群的方法。利用本发明所提供的系统和方法,可以在一段相对长的时间内在受体细胞中大量且持续的提供基因改造序列,提高靶向基因变异成功率。并且能够在靶向基因组区域引入大量随机突变。
【专利说明】在受体细胞的目的基因组序列引入变异的系统和方法

【技术领域】
[0001]本发明基于分子遗传领域,具体说,是利用瞬时表达和反转录系统在受体细胞基因组序列中引入特定变异。

【背景技术】
[0002]遗传修饰技术为在由活体细胞或组织的基因组核糖核酸序列编码的遗传信息中引入变异提供了可能。传统的基因改造技术涉及将一段外源核酸序列整合到受体基因组的随机位点。这些方法是基于将含有外源序列的载体引入受体细胞,外源DNA随机整合到受体基因组,并分离含有外源序列的细胞。这些遗传信息在受体基因组的非自然整合有一些局限性。外源序列的随机整合,整合位点可能在组织存活必须的基因内,而扰乱其功能。就算外源基因的插入没有损坏宿主基因,外源基因的表达也会受到周围基因DNA的影响(位点效应)。在某些情形下,周围基因组环境的负面影响如此之大,以至于外源基因无法表达。在另一些情形下,周围基因组环境可能导致外源基因的过渡表达从而损害受体细胞。外源基因的多位点整合有时会导致RNA干扰(RNAi)。这些方法的另一个问题是在受体基因组中加入不必要或无用的遗传物质,例如病毒或其他载体残余,调控序列和标记基因。这些无用遗传物质可能在长时期内对受体组织产生不可知的影响,并且标记基因,比如抗除草剂基因和抗抗生素基因对健康和环境的可能的影响,值得担忧。
[0003]为解决这些传统基因改造技术的问题,发展了在宿主基因组特定位点上引入变异的靶向基因改造技术。这些技术是通过特异位点校正或定点突变修饰游离体或染色体中的目标序列。其中一些技术利用不同类型的寡聚或多聚核苷酸,如:双链DNA(dsDNA),单链DNA(ssDNA),含有5’和/或3’端修饰以抵御细胞内核酸酶降解的寡聚核苷酸(Campbell et al., 1989),杂合 RNA/DNA 或 DNA/DNA 分子(Igoucheva et al., 2004a ;Parekh-Olmedo et al., 2005),RNA寡聚核苷酸(Storici, 2008),和三合寡聚核苷酸(Simonet al.,2008)。Campbell及其同事用单链核酸成功地在由共同转化的质粒编码的卡那霉素磷酸转移酶基因中诱导了一个变异。Zorin及其同事将一段外源单链DNA插入到蓝藻(Chlamydomonas reinhardti)基因组的特定位点并报道单链DNA非同源重组的几率明显小于双链DNA (Zorin et al.,2005)。Kmeic及其同事研发了利用杂合RNA/DNA 二元寡聚核苷酸在高等真核细胞目的基因的特定位点诱导变异,并报道杂合RNA/DNA 二元引物的变异转化率高于未修饰的单链寡聚核苷酸(美国专利,专利号5,565,350)。同源基因改造的分子机制并不完全清楚。一种可能的机制是变异诱导序列与目的基因序列杂交,从而产生触发DNA修复机制的错配泡,DNA修复机制利用变异诱导序列为模板“纠正”受体细胞目的基因组序列。其他机制可能涉及链入侵(strand invas1n)或同源重组。
[0004]基于寡聚核苷酸的靶向修饰技术的一个主要缺陷是成功率低,部分原因可以归咎于外源寡聚/多聚核苷酸的降解和有限供应(Zorin et al.,2005)。Kmeic et al.描述了一个利用经过抗核酸酶修饰的单链寡聚核苷酸进行靶向修饰的技术。经抗核酸酶修饰如硫代磷酸酯键(phosphoroth1ate linkage), LNA键,和2_0_甲基修饰的寡聚核苷酸和未经修饰的单链寡聚核苷酸相比,胞内降解度低,诱变成功率高。经优化修饰的单链寡聚核苷酸的诱变成功率可比RNA/DNA 二元杂合引物高2-3倍(美国专利,专利号6,936,497)。但化学修饰对参与变异诱导的酶的影响并不十分清楚。尽管经过优化修饰,在多数情况下,变异诱导率仍然相对较低,大约在Ix 10_4左右(Zhu,2000)。靶向基因改造的另一个问题是来自外源DNA非同源整合的竞争。同源整合和非同源整合的比率随不同组织和细胞类型而变化。例如酵母同源整合和几率相对较高,而高等真核生物如植物和动物的非同源整合频率显著高于同源整合。Zorin et al.发现单链(ssDNA)和双链(dsDNA)DNA同源重组的效率相似,但单链DNA(ssDNA)相对于双链DNA (dsDNA),非同源重组的倾向性要小得多(Zorin, 2005),这项发明为减少非同源整合提供了一个简单的解决方法。
[0005]其他靶向基因技术涉及利用靶向核酸内切酶,如转录激活因子样效应因子核酸酶(transcript1nal activator-like effector nucleases) (Miller, et al.,2010),锋指核酸酶(zinc finger nuclease) (Bibikova, Beumer, Trautman, &Carroll, 2003),归位内切酶(homing endonucleases) (Grizot, et al.,2009),与含有和革巴向基因同源的序列的基因改造载体结合使用。载体同时含有报告和/或选择标记基因。其机制据信是同源重组。这些技术相当有效,但一次处理只能产生一个特定变异。
[0006]就靶向基因改造来说,需要一项能在相对长的时间内大量并且持续地提供基因改造序列,从而提高靶向基因变异成功率的技术。本发明不仅满足了这些需求并且提供了在靶向基因组区域引入随机突变的可能。


【发明内容】

[0007]本发明的第一个目的在于提供一种在基因组特异位点产生预先确定的或随机产生的变异的系统。
[0008]本发明的第二个目的在于提供一种在受体细胞目的基因组序列引入变异的方法。
[0009]本发明的第三个目的在于获得在目的基因组序列有随机变异的细胞群的方法。
[0010]为了达到本发明的第一个目的,本发明提供了一种在受体细胞的目的基因组序列引入变异的系统,所述系统包括:a) —个基因组DNA诱变序列GSMS表达盒,其中所述的GSMS表达盒包括一段和所述目的基因组序列同源的多聚核苷酸序列和一个引物结合序列,其中所述的GSMS表达盒产生GSMS RNAs ;b) 一个反转录酶表达盒,其中所述的反转录酶表达盒包括一段编码反转录酶的多聚核苷酸序列,所编码的反转录酶可以是天然的或工程改造的反转录酶,并且所述反转录酶可以是有较好的校对功能或较差的校对功能;(图10)以及在受体细胞中,所述GSMS RNAs被所述反转录酶反转录为ssGSMS cDNAs (图7),并且所述ssGSMS cDNAs在细胞核中通过细胞DNA修复或同源重组机制导致目的基因组序列的改变。目的基因组序列可以是受体细胞的任意基因组序列,包括像外显子序列,内含子序列,未转录调控序列,直接或反转重复序列,和重组热点序列。
[0011]在一些实施方式中,GSMS和反转录酶可以被连接在一起放入同一个表达盒中,反转录酶在近5’端,反转录酶和GSMS之间由一段在被转录为RNA后形成发卡型结构的序列隔开,发卡型的二级结构可以终止反转录(图12)。
[0012]在一些实施方式中,所述的GSMS包括一段与所述目的基因组序列完全互补的序列在被引入到受体细胞中后所述GSMS可与受体细胞基因组序列配对杂交;或者,除在所述GSMS预先设定的位置有一个或几个核苷酸的区别外,所述的GSMS包括一段与所述目的基因组序列完全互补的序列,所述的核苷酸的区别是错配、删除、插入或以上所列的组合。在一些实施方式中,所述GSMS包括一段非同源多聚核苷酸序列,夹在与受体细胞基因组序列同源的序列间;优选的,所述的非同源多聚核苷酸序列编码一个选择标记基因。在一些实施方式中,所述的GSMS包括一段与目的基因组序列的同源重组热点区域同源的序列,或者,所述的GSMS包括一段与含有正向和反向重复的目的基因组序列同源的序列。
[0013]在一些实施方式中,与目的基因组序列完全吻合的GSMS和纠错功能较弱的反转录酶被同时引入到受体细胞中。由于反转录酶的纠错能力较弱,在反转录过程中,随机突变被引入到GSMS cDNA中。这些具有随机突变的单链GSMS cDNA可以通过DNA修复或同源重组整合结合到目的基因组序列,从而得到一个在目的基因组序列有随机突变的细胞库。这个随机突变库可以被用来筛选在目的基因组区域的有价值的突变。在一些实施方式中,所述反转录酶具有较好的校对功能。
[0014]在一些实施方式中,GSMS RNA的5’端可以形成二级结构,当反转录酶到达二级结构时反转录被终止(图9)。
[0015]在一些实施方式中,本发明所提供的系统还包括引物表达盒,其中所述的引物表达盒产生天然的或人工的引物tRNA,弓丨物tRNA与所述GSMS RNAs上的所述弓丨物结合序列结合,起始反转录。
[0016]GSMS有一个引物结合位点可以和引物结合启动反转录。在一些实施方式中,引物结合位点序列和天然或人工tRNA 3’端序列互补。GSMS RNA可以利用天然tRNA或与之同时表达的合成tRNA为引物启动反转录(图9)。在一些实施方式中,GSMS RNA 3’端包括一个poly(U)尾巴。在真核生物中,一个poly (A)尾巴会被加到已转录的RNA的3’端。具有poly(U)-poly(A)尾巴的GSMS RNA可以自身退火启动反转录(图8)。
[0017]在一些实施方式中,反转录酶是一个天然的具有依赖于RNA的DNA聚合酶活性的反转录酶,如HIV,M_MLV和AMV反转录酶。天然存在的反转录酶一般不具备或只有很少的校对活性,因此可以用来产生携带随机突变的GSMS cDNA。如果GSMS cDNA上的随机突变并非所需,则应使用具有高校对活性的经过改造的工程反转录酶或天然反转录酶。
[0018]在一些实施方式中,所述系统可以包括一个单链DNA(ssDNA)结合蛋白表达盒,所表达的ssDNA结合蛋白可结合到ssGSMS cDNA,保护它们不被降解并协助转移ssGSMS cDNA进入细胞核。更或者,ssDNA结合蛋白会在DNA修复和同源重组中起到重要作用。这些ssDNA结合蛋白包括,复制酶A(replicat1n protein A)、RecA的同源蛋白、Rad51、Rad51的同源蛋白、DMCUDMC1的同源蛋白、ICP8、ICP8的同源蛋白、SSB和SSB的同源蛋白等。其中,Rad5和DMCl可以结合到ssDNA上形成核酸蛋白丝从而参与到诸如同源搜索,DNA链入侵及同源序列配对等同源重组的重要步骤(Holthausen, 2010)(图3)。
[0019]在一些实施方式中,所述系统包括一个编码革巴向核酸内切酶的革巴向核酸内切酶表达盒。(图2)靶向核酸内切酶攻击目的基因组序列中与GSMS同源的区域。靶向核酸内切酶是经过工程改造的内切酶包括一个用以识别预先设定的DNA序列的序列识别结构域,和一个DNA核酸内切酶结构域。并且其中所述靶向核酸内切酶和所述GSMS指向所述目的基因组序列的同一同源区域;所述DNA序列识别结构域可来自锌指蛋白DNA序列识别结构域,转录激活因子样效应因子DNA识别结构域(TALE),和大型核酸酶(meganuclease)的序列识别结构域。DNA内切酶结构域具有内切酶活性,所述靶向核酸内切酶的所述DNA核酸内切酶结构域能够切割一段双链多聚核苷酸序列产生双链断裂,或者,只切割双链DNA中的一条链从而在双链DNA上造成一个缺口。
[0020]在一些实施方式中,所述系统包括一个SiRNA表达盒,所述SiRNA表达盒产生的siRNA促使从目的基因组序列转录产生的mRNA的降解,但siRNA与GSMS RNAs无同源区域。所述siRNA能够保持所述目的基因组序列处于解旋状态,从而增加所述ssGSMS cDNA与目的基因组序列互相作用的机会。siRNA也可经由化学合成然后与所述GSMS及反转录酶表达盒一同引入受体细胞。
[0021]在一些实施方式中,GSMS反转录酶表达盒,ssDNA结合蛋白表达盒,革巴向核酸内切酶表达盒等可以是RNA形态被直接翻译为蛋白质或作为cDNA合成模板。
[0022]在一些实施方式中,所述GSMS表达盒、反转录酶表达盒、引物表达盒,ssDNA结合蛋白表达盒,祀向核酸内切酶表达盒和siRNA表达盒可以位于不同的表达载体或者同时在同一载体上,并且反转录酶编码序列,ssDNA结合蛋白编码序列和靶向核酸内切酶编码序列中至少两个序列可以同时存在于一个表达盒中,形成合并表达盒;其中一个单一操纵子被连接到两个或更多个蛋白编码序列,其中相邻蛋白编码序列被翻译跳跃序列分隔开;或者,其中一个单一操纵子被连接到两个或更多个蛋白编码序列并且继续连接到GSMS,其中相邻蛋白编码序列被翻译跳跃序列分隔开,并且GSMS和上游蛋白编码序列被能编码一段发卡型RNA结构的序列分隔开。例如,反转录酶和ssDNA结合蛋白序列可以被线性链接到GSMS序列由同一个启动子操纵。蛋白质编码序列在近5’端,而GSMS在近3’端,一个翻译跳跃序列被插入到两个蛋白质编码序列之间,同时在GSMS5’端插入一个转录后可以形成发卡型RNA的序列,用来终止反转录(图12)。
[0023]本发明所提供的系统能够大量和持续地产生与目的基因组同源的单链DNA,这些单链DNA可以被转移到细胞核内,通过DNA修复或同源重组路径,改变目的基因组序列的遗传信息。
[0024]为了达到本发明的第二个目的,本发明提供了一种在受体细胞目的基因组序列引入变异的方法,包括a)构建一个GSMS表达盒,其中所述GSMS含有一段与所述目的基因组序列同源的多聚核苷酸序列和一个引物结合序列,并且其中所述GSMS表达盒产生GSMSRNAs ;b)构建一个反转录酶表达盒,其中所述反转录酶表达盒编码一个反转录酶;并且,c)将所述GSMS表达盒和所述反转录酶表达盒同时引入受体细胞,其中所述GSMS RNAs被反转录酶反转录为ssGSMS cDNAs,并且所述ssGSMS cDNAs在目的基因组序列导致变异;d)选择目的基因组序列被改变的受体细胞。
[0025]在一些实施方式中,本发明所提供的方法还包括从下列一组表达盒中选出的一个或多个表达盒将它们同时引入到受体细胞中,他们包括引物表达盒,ssDNA结合蛋白表达盒,靶向核酸内切酶表达盒和siRNA表达盒。
[0026]其中,基因组被改变的细胞可以通过传统方式来选择;例如,基因组改变导致的生长优势,抗药性,代谢改变和荧光等特别的可用作选择的变异。另外,目的基因组序列的PCR和DNA测序也可用来选择具有变异的细胞克隆。
[0027]为了达到本发明的第三个目的,本发明提供了获得在目的基因组序列有随机变异的细胞群的方法,包括以下步骤:a)构建一个GSMS表达盒,其中所述GSMS含有一段与所述目的基因组序列完全同源的多聚核苷酸序列和一个引物结合序列,并且其中所述GSMS表达盒产生GSMS RNAs ;b)构建一个反转录酶表达盒,其中所述反转录酶表达盒编码一个纠错功能弱的反转录酶;c)将所述GSMS表达盒和所述反转录酶表达盒同时引入受体细胞,其中所述GSMS RNAs被纠错功能弱的反转录酶反转录为含有随机变异的ssGSMS cDNAs,并且所述ssGSMS cDNAs导致随机变异被整合到所述的目的基因组序列;并且,d)选择在所述目的基因组序列具有随机变异的细胞。
[0028]在本发明的一些实施方式中,所述方法还包括从下列一组表达盒中选出的一个或多个表达盒将它们同时引入到受体细胞中,他们包括引物表达盒,ssDNA结合蛋白表达盒,靶向核酸内切酶表达盒和siRNA表达盒。
[0029]本发明提供了一个可以持续大量地产生和供给单链cDNA的瞬时表达系统,所产生的单链cDNA至少有一部分与目的基因组同源,并且可以被转移到细胞核内改变基因组序列。本发明同时提供了一个生成在靶向基因组区域含有随机突变的细胞库的方法。本发明另外还将ssGSMS cDNA和转录激活因子样效应因子核酸酶(transcript1nalactivator-like effector nucleases)(Miller, et al., 2010),锋指核酸酶(zincfinger nuclease) (Bibikova, Beumer, Trautman, &Carroll, 2003),归位内切酶(homingendonucleases) (Grizot, et al., 2009)等革巴向核酸内切酶的使用结合到一起,在特定序列中引入突变。同时提供的还有细胞学和分子生物学组件来提高靶向基因组改造的效率。
[0030]本发明的核心是一个模仿反转录病毒和反转录转座子复制系统的瞬时表达系统,它可以在细胞内通过转录和反转录扩增基因组DNA诱变序列(Genomic SequenceModificat1n Sequence) (GSMS)。由于有两轮扩增,它能持续提供大量的ssGSMS cDNA,ssGSMS cDNA与细胞基因组互做导致目的基因组产生需要的变异。几天后,细胞内的瞬时表达系统会被完全降解,除目的序列中的变异外,没有任何外源遗传物质的残留。与寡聚核苷酸技术相比较,本发明可以在几天,甚至几星期,而不是几小时内提供相对持续的和高水平的ssGSMS cDNA。本发明特别适用于难转化(hard-to_transfect)的细胞,如植物细胞。极少量被转入细胞的表达载体可以提供大量的以同源重组为方式进行基因改造的ssGSMScDNA。此外,由于双链DNA参与同源重组的几率较单链DNA高100倍(Zorin et al.,2005),利用单链DNA进行基因改造的本发明同利用双链DNA(如质粒)进行基因改造的方法相比可以极大地减低异常变异的发生。
[0031]本发明还利用了校对能力差的反转录酶。采用校对能力差的反转录酶可以在细胞内持续产生具有随机突变的ssGSMS cDNA,这些ssGSMS cDNA可以以同源重组机制将随机突变整合到目的基因中。目的基因组随机突变细胞库可用来筛选所需的表现型和性状。
[0032]发明的系统同时提供了能够稳定和协助ssGSMS cDNA进入细胞核的单链DNA结合蛋白,以及在希望变异的位点产生单链或双链断裂的靶向核酸内切酶。本发明还提供了一个利用siRNA迫使靶向序列处于松弛状态以利DNA杂交和酶处理。本发明可以用来在特定内源基因中引入变异,也可将一段外源DNA插入到染色体或游离体的特定位点。

【专利附图】

【附图说明】
[0033]图1.GSMS瞬时表达基础系统。质粒包含一个GSMS表达盒,一个反转录酶表达盒,和一个ssDNA结合蛋白表达盒,每一个表达盒都有各自的启动子和终结子。
[0034]图2.携带靶向核酸内切酶的GSMS瞬时表达系统。质粒包含一个GSMS表达盒,一个反转录酶表达盒,一个ssDNA结合蛋白表达盒,一个tRNA表达盒,和一个革巴向核酸内切酶表达盒,每一个表达盒都有各自的启动子和终结子。
[0035]图3.图示ssGSMS cDNAs在细胞中的产生过程。GSMS首先被转录为RNA然后以同时表达的tRNA为引物,被同时表达的反转录酶反转录为sscDNA。ssGSMS cDNA与ssDNA结合蛋白结合进入细胞核。靶向核酸内切酶可以参与到此过程中。
[0036]图4.当靶向核酸内切酶被包括在系统中时,ssGSMS cDNA进入细胞核后可能的用途。ssGSMS cDNA结合蛋白不仅保护ssGSMS cDNA不受降解和形成二级结构,还帮助ssGSMScDNA搜寻同源基因组区域并与之对齐。在列队找齐的时候,ssGSMS cDNA上无论预先设定的还是由易错反转录酶引入的单核苷酸变异会与基因组序列形成错配泡,错配泡会触发受体细胞的错配修复系统(Mismatch Repair, MMR)从而将突变引入到基因组DNA。ssGSMS cDNA也可以通过同源重组或相类似的方式,如链侵入(Strand Invas1n)和链交换(StrandExchange)被整合进入受体细胞基因组。
[0037]图5.当靶向双链核酸内切酶被包含在系统中时,ssGSMS cDNA进入细胞核后可能的用途。ssGSMS cDNA结合蛋白不仅保护ssGSMS cDNA不受降解和形成二级结构,还帮助ssGSMS cDNA搜寻同源基因组区域并与之对齐。靶向核酸内切酶切割基因组靶向位点产生双链断裂(DSB),ssGSMS cDNA与靶向基因组序列杂交。杂交配对后,ssGSMS cDNA可以被用作模板来合成靶向基因组序列或者通过同源链交叉整合到基因组序列中。
[0038]图6.当靶向单链核酸内切酶被包含在系统中时,ssGSMS cDNA进入细胞核后可能的用途。ssGSMS cDNA结合蛋白不仅保护ssGSMS cDNA不受降解和形成二级结构,还帮助ssGSMS cDNA搜寻同源基因组区域并与之对齐。靶向核酸内切酶切割基因组靶向位点产生单链断裂(SSB),ssGSMS cDNA与靶向基因组序列杂交。杂交配对后,ssGSMS cDNA可以被用作模板来合成靶向基因组序列或者通过同源链交叉整合到基因组序列中。相对于靶向双链核酸内切酶,使用靶向单链核酸内切酶较少产生异位突变或染色体重排。
[0039]图7.展示利用tRNA为引物产生ssGSMS cDNA。在GSMS RNA 3’端有一个引物结合位点,与tRNA的3’端互补。tRNA结合到GSMS RNA的引物结合位点并被用作反转录的引物。
[0040]图8.展示ssGSMS cDNA合成中多聚T/A,poly(T/A)引物。在设计中,一段多聚T,poly(dT)被加到GSMS正链的3’端,因此在GSMS RNA的3’端包括一段多聚U,poly (U)。转录时一段多聚A,poly(A)尾巴被加到GSMS RNA3’端多聚U,poly (U)的后面。Poly(A)尾巴可以反转互补结合到poly (U)上并被用作反转录过程的引物,合成ssGSMS cDNA。
[0041]图9.展示GSMS RNA 5’端的二级结构被用来终止反转录。GSMS设计使得在GSMSRNA的5’端形成一个发卡型的二级结构。当反转录酶抵达GSMS RNA 5’端的二级结构时,反转录过程被终止。
[0042]图10.展示具有好的和差的校对性能的反转录酶的行为。如果使用校对性能较好的反转录酶,GSMS RNA被反转录为与设计一致的ssGSMS cDNA。而当使用校对性能差的反转录酶时,随机突变经常会被引入到ssGSMS cDNA中,导致产生一个ssGSMS cDNA的受体细胞随机突变库。
[0043]图11.可以包括在系统中的,协助目的基因组改造的一些表达盒。
[0044]表达盒1:操纵子/GSMS/终结子
[0045]表达盒2:操纵子/指向GSMS目的基因的siRNA/终结子
[0046]表达盒3:操纵子/反转录酶/终结子
[0047]表达盒4:操纵子/能互补结合到GSMS上引物结合位点的人工tRNA/终结子
[0048]表达盒5:操纵子/能互补结合到GSMS上引物结合位点的天然tRNA/终结子
[0049]表达盒6:荧光蛋白表达盒
[0050]表达盒7:其他干扰RNA运输,降解的RNAi表达盒
[0051]表达盒8:操纵子/锌指核酸酶或转录激活因子样效应因子核酸酶/终结子
[0052]表达盒9:操纵子/单链DNA (ssDNA)结合蛋白/终结子
[0053]图12.展示一个合并表达盒的设计,在这个合并表达盒中,超过一种蛋白质编码序列(如反转录酶,单链DNA结合蛋白)和GSMS被线性连接在一起并由同一个操纵子控制。蛋白编码序列靠近表达盒的5’端,GSMS靠近3’端。一个翻译跳跃序列被插入到两个相邻蛋白编码序列之间,同时一个在被翻译成RNA时能形成发卡结构的序列被加在GSMS的5’端。表达盒被转录为RNA后,核糖体开始从RNA的5’端开始合成蛋白质并在遇到终止码时停止,而反转录酶从RNA的3’端开始合成cDNA并在遇到发卡型二级结构时停止,很少进入RNA蛋白质编码区域。翻译跳跃序列编码一个自剪多肽保证生成独立的反转录酶和单链DNA结合蛋白而不是二者结合在一起的大融合蛋白。

【具体实施方式】
[0054]在本文中,除非另有定义,所使用的技术和科学术语均能够被一个在与本发明相关领域工作的掌握一般技能的人员所理解。如本文所用,以下术语具有指定含义,除非在文中对所使用的不同定义另有清晰的表述。
[0055]术语“基因组DNA改造序列,,(genomic sequence modifying sequence - GSMS)。如本文所用,指一段可以在受体染色体或游离体特定位点序列引发改变的核酸。改变可以指一个或多个核苷酸变异,核苷酸插入,删除,或以上的任意组合。改变还可以指插入一段可以导致所需表现型的外源DNA。术语“游离体DNA”指细胞中独立于染色体外的可以独立复制的DNA,如质粒,粘粒,细菌人工染色体(BAC)和酵母人工染色体(YAC)。基因组DNA改造序列(GSMS)含有一个引物结合序列和与受体染色体或游离体目的序列同源的序列。GSMS的同源序列可以是除一个或几个碱基外与目的序列完全互补的序列。GSMS也可以和目的序列有不同程度的互补,如10-20%,30-40%,50-60%, 70%, 80%, 90%, 95%的同源互补。在有些实施方式中,GSMS包括一段外源序列,它和与目的序列同源的序列从一端或两端相连接;GSMS的同源序列应该有足够的长度让它能够确认受体细胞的目的序列并与其杂交。同源序列的长度可以是,例如10个碱基,但也可以是40-60个碱基长,或几百,几千碱基长。目的序列可以是任何感兴趣的需要改变和改造的序列,包括编码序列,非编码序列(调控序列,内含子和重复序列)。目的序列还可以是重组热点序列或正向或反向重复序列等有较高同源重组率的序列。
[0056]在本文中使用的术语,如“异源DNA”,“外源多聚核苷酸”,“外源核酸”,或“外源序列”,指那些对于特定受体细胞起源于外源的序列,或者起于同源但处于受体细胞非天然所见的位点。外源DNA表达产生外源多肽,如标记基因。
[0057]如本文所用,术语“同源序列”,“同源核酸”,或“同源多聚核苷酸”指特定受体细胞的内源性核苷酸序列(如DNA或RNA)。同源序列可以从受体细胞中提取和克隆,或者根据序列资料化学合成。同源序列可以和受体细胞内源DNA或RNA完全互补。同源序列也可以和内源序列存在某些碱基差异,但它应该与相对应的内源序列有足够高的同源性,以至于当被引入到受体细胞中能够确认并和相对应的内源序列杂交。同源基因改变指利用同源核苷酸序列改变受体细胞相对应的内源基因。
[0058]本文所用的“表达盒”指一个载体的部分核酸序列,它包括指导细胞机器生产RNA或蛋白所需的遗传组件。一个DNA表达盒的基本组件包括操纵子序列,编码RNA或蛋白的序列,和一个转录终止序列。操纵子是一个与启动特定基因转录所需蛋白(如RNA聚合酶,转录因子)结合的DNA区域。根据受体细胞类型的不同(如原核细胞,真核细胞),多个操纵子可以应用于表达盒中。原核细胞操纵子包括,如Lac操纵子,Trp操纵子,Tac操纵子和T7操纵子。高效病毒操纵子可以应用于真核细胞中,如CMV-1E操纵子,SV40操纵子,RSV-LTR操纵子,(MoMLV) LTR操纵子,和(CaMV) 35S操纵子。真核生物操纵子一般来说弱于病毒操纵子,但有利的一面是有组织表达特异性,如Apo A-1操纵子(De Geest et al.,2000)和ApoE操纵子(Kim et al., 2001)是肝脏特异操纵子,MCK操纵子(Hauser et al.,2000)和肌球重链操纵子(myosin heavy-chain promoter, Skarli et al., 1998)是肌肉特异操纵子。转录终止子是造成RNA聚合酶终止转录的一段DNA序列。原核和真核生物有不同的转录终止信号系统,因此使用不同的终止序列。一个表达盒中的操纵子和终止子可以来源于同一个或不同的基因。例如,T7终止子和T7操纵子用于细菌细胞的表达盒,CMV-1E操纵子和兔β球蛋白终止子用于动物细胞表达盒(如pTandem-Ι载体,Navagen, Madison, WI)。有时,可以用一段合成的多聚(A)终止序列(如pTargeTTM载体,Promega, Madison, WI)。
[0059]除了用串联在一起的表达盒表达多个蛋白,2到3个蛋白可以被合并到一个表达单位中由同一个操纵子驱动;在这种情形下,编码不同蛋白的DNA序列被翻译跳跃序列分隔开来,翻译跳跃序列编码一个具有自切功能的2A多肽(Halpin et al.,1999)(Zhang, 2013)。2A多肽是一个18-22个氨基酸的具有自切功能的小核糖核酸病毒多肽。在翻译蛋白的时候,核糖体跳过合成一个2A蛋白C端的肽键,导致2A间肽键断裂,下游多肽分离(Kim, 2011)。如图12所示,一个或多个蛋白编码序列可以和GSMS序列合并放入同一个表达盒中。蛋白编码序列被翻译跳跃序列分隔。GSMS在表达盒内靠近3’端并由一个发卡结构形成序列与上游蛋白编码序列隔开,例如,当反转录酶和单链DNA结合蛋白与GSMS合并放入同一个表达盒中,表达盒的转录生成一个RNA分子(从5’端到3’端)依次为反转录酶编码序列,翻译跳跃序列,单链DNA结合蛋白编码序列,发卡结构形成序列,GSMS序列(图12)。翻译跳跃序列翻译为一个自切多肽,导致生成一个独立的反转录酶和一个独立的单链DNA结合蛋白。在单链DNA结合蛋白末端的终止码阻止下游GSMS RNA被翻译,而GSMS 5’端的发卡结构阻碍反转录进入蛋白编码区。这种构造可以让多个蛋白或蛋白亚基在冋一表达盒中表达,简化表达盒构建,促成相关蛋白的协调表达。
[0060]表达盒用来生成RNA或有功能的蛋白质。例如,GSMS表达盒用来生成GSMS RNA,然后被反转录为ssGSMS cDNA。反转录酶表达盒,ssDNA结合蛋白表达盒,以及革巴向核酸内切酶表达盒被用来表达功能蛋白。这些蛋白表达盒用以生成所需功能的蛋白或多肽,而没有具体蛋白/多肽序列的限制。反转录酶表达盒用以生成能够以RNA为模板合成互补DNA的天然的或经人工改造的反转录酶。反转录酶可以具备或不具备RNA酶H(RNase H)活性,RNase H活性是指剪切RNA-DNA杂合体中的RNA分子,和依赖于DNA模板的DNA合成酶活性。反转录酶可以从反转录病毒中获取,如莫洛尼鼠白血病病毒(M-MuLV),人类免疫缺陷病毒(HIV)和禽成髓细胞瘤病毒(AMV)。天然存在的反转录酶一般只有很少的或不具备校对功能,因此在反转录中易出错。人工改造的工程反转录酶具有较好的校对功能,可从商业渠道获得,如 Superscript? 反转录酶(Life Technologies, Carlsbad, CA)和 AccuScript 高保真反转录酶(Agilent Technologies, Santa Clara, CA)。在 ssGSMS cDNA 中需要维持特定变异时,需要使用高保真反转录酶。校对能力差的反转录酶可以用来在ssGSMS cDNA中制造随机突变。
[0061]ssDNA结合蛋白表达盒用来生成能够和单链DNA结合的天然的或人工改造的ssDNA结合蛋白,用以保护,稳定单链DNA并协助将单链DNA转运至细胞核。这些ssDNA结合蛋白还有可能是细胞同源重组机制的一部分,参与到GSMS的同源重组。ssDNA结合蛋白可以包括,如复制蛋白 A (replicat1n protein A), Rec A, Rad51, DMC I, ICP8, SSB 以及任何具有相似功能的同源蛋白。大肠杆菌(E.colDRecA蛋白及其同系物是同源重组的重要蛋白,参与同源确认,同源DNA配对,和链交换。RecA及其真核生物中的同系物RAD51可以结合到单链DNA上形成动态核酸蛋白丝,在双链DNA上寻找同源区,然后协助同源DNA链入侵(Li,2008)。RecA及其相似蛋白的过度表达可能增加由GSMS主导的同源基因改造的效率。靶向核酸内切酶表达盒用来生成能够识别预先指定的特异核酸序列的核酸内切酶。靶向核酸内切酶是经过工程改造的内切酶,它将一个DNA序列识别结构域链接到一个DNA核酸内切酶结构域。序列识别结构域可包括转录激活因子样效应因子(TALE)DNA序列识别结构域,锌指蛋白DNA序列识别结构域,和大型核酸酶的序列识别结构域。
[0062]在某些实施方式中,siRNA表达盒用来生成能够引起目的基因转录产物RNA降解的小干扰RNA(SiRNA)。siRNA被设计成识别GSMS同源区域以外的序列,从而引起目的基因转录RNA的降解而不是GSMS RNA的降解。目的基因RNA的降解可以向细胞核发出信号,维持目的基因转录活跃,致使目的基因序列处于解旋或半解旋状态。这为GSMS与目的位点同源序列的杂交提供了方便。siRNA表达盒有多种构建方式。例如,它可以由RNA聚合酶III操纵子驱动一小段发卡型siRNA,并由一段鸟苷酸终止转录而无需多聚腺嘌呤信号(Sui etal., 2002 ;Brummelkamp et al., 2002)。siRNA表达质粒和病毒载体可以从商业渠道如LifeTechnologies, Gene Script, BMC B1technology 等获得。
[0063]表达盒最好是DNA但也可以是RNA形式。RNA表达盒中的蛋白编码序列可以被直接翻译为蛋白质,而RNA表达盒中的GSMS RNA可以被直接用作模板合成ssGSMS cDNA。例如,含有GSMS和反转录酶表达盒的非整合型慢病毒载体(integrat1n deficient lentiviralvector) (Chick, 2012)可以被用来产生ssGSMS cDNA。非整合型反转录病毒载体,因其能降低反转录病毒载体自身的非常规整合,因此更加适合。含有由同一个操纵子驱动的多个蛋白编码序列以及一段GSMS序列的人工合成的RNA可以被引入受体细胞并以协调的方式生成蛋白质和ssGSMS cDNA。
[0064]GSMS的产牛:GSMS首先与一个操纵子和一个终结子一同被克隆到一个表达盒中,然后和一个在同一个载体或不同载体上的反转录酶表达盒一同被引入受体细胞(图1)。GSMS也可与反转录酶合并入同一个表达盒中(图12)。同时被引入到受体细胞的还有在同一个或不同载体上的一个单链DNA结合蛋白表达盒(如RecA,Rad51, RPA)。一旦进入受体细胞,GSMS先被转录为RNA,GSMS RNA然后被同时表达的反转录酶反转录为ssGSMS cDNA (例如用tRNA作引物)。ssGSMS cDNA随后与同时表达的单链DNA结合蛋白结合形成核酸蛋白复合体或核酸蛋白丝。单链DNA结合蛋白保护ssGSMS cDNA,抵御降解,减少二级结构的形成,协助ssGSMS cDNA进入细胞核并与同源基因组序列对准(Robyn L.Maher, 2013)。在随后的几天或几周内,只要载体存在,GSMS就会通过转录和反转录被扩增成千上万倍。
[0065]上述过程提供了持续的和大量的ssGSMS cDNA进入受体细胞的细胞核中,配对受体细胞基因组的特定区域,促成特定基因的改变。基于同源的基因改造的细胞机制并不完全清楚。可能的机制包括不同类型的同源重组过程和DNA修复路径。一个可能的通过DNA错配修复(MMR)路径的DNA改造机制是ssGSMS cDNA首先与受体细胞基因组DNA特定区域的同源序列杂交,如果ssGSMS cDNA含有变异,变异或者是事先设计的或者是由易出错的反转录酶随机引入的,ssGSMS cDNA和目的序列对准时就会产生错配的碱基对。错配的碱基对会触发受体细胞的基因修复或纠错系统,修复时有时会错误地以ssGSMS cDNA为模板而改变受体细胞基因组序列从而引入突变(图4)。GSMS中与目的基因组序列同源的部分可以参与到不同的同源重组的过程,特别是当目的基因组序列被靶向核酸内切酶或其他自然因素损坏。同源重组过程一般涉及到同源搜索,DNA链入侵,和模板指导的DNA合成而导致的目的序列的基因改造。同源重组包括但并不局限于下列路径,双链断裂修复路径(DSBR),基于合成的单链退火路径(SDSA),单链退火路径(SSA),断链诱导的复制路径(BIR),RecB⑶路径和RecF路径。
[0066]不同应用目的的GSMS设计:如果本发明系统被用来改变目的基因预先设定的碱基对,则除预先设定的核苷酸变异外GSMS应和目的基因完全互补。变异核苷酸最好位于GSMS同源序列的中心或靠近中心。应当使用高保真反转录酶以减少在ssGSMS cDNA合成过程中随机弓I入的非所需的变异的几率。
[0067]本发明的一个有吸引力的地方是可以将随机突变引入目的基因从而构建在目的基因区域含有随机突变的细胞库。如以此为目的,可以使用与目的基因完全互补的GSMS序列以及校对能力差的反转录酶生成含有随机突变的ssGSMS cDNA。
[0068]本发明还可以用来将外源DNA整合到受体基因组的目的位点。例如,它可以以插入一段无用DNA序列的方式敲除一个内源基因,或在预先设定的基因组位点上插入一个所需的基因。如以此为目的,GSMS包括一段外源序列和与目的序列同源的序列,同源序列可在一端或两端与外源序列相连。位于两端的同源序列一般来说和目的序列100%互补,并且具有足够的长度以支持同源重组(图5,图6)。目的位点可以是基因组的任何位点,例如,为增加靶向整合的几率,目的序列可以是重组热点序列,以及直向或反向重复序列。
[0069]GSMS DNA序列可以设计成在被转录为RNA时,在GSMS RNA的5’端会形成一个发卡型二级结构,反转录时,当反转录酶遭遇这个二级结构会从RNA上脱落从而终止cDNA合成。这样不需要的核苷酸不会被添加到ssGSMS cDNA的5’端(图9)。
[0070]ssGSMS cDNA合成中的引物:牛成ssGSMS cDNA常用的引物是天然tRNA和人工tRNA。其它如Poly(T/A)引物也可以使用。cDNA合成的引物可以是天然tRNA或人工tRNA。tRNA的3’端一直被反转录病毒和反转录转座子用作引物(Kleiman,1997)(R Marquet, 1995) (Voytas, 1993) (S.B.Sandmeyer, 1996) (Wakefield, 1995)。一般情况下,tRNA3’端的10-18个碱基对被反转录病毒和反转录转座子用作反转录的起始引物(Kleiman, 1997)。不同的反转录病毒的反转录酶使用不同的tRNA作为反转录的起始引物。例如,人类免疫缺陷病毒(HIV),莫洛尼鼠白血病病毒(M-MuLV)和禽成髓细胞瘤病毒(AMV)的反转录酶分别使用tRNA31ys,tRNApro,和tRNAtrp作为cDNA合成的起始引物(Kleiman, 1997)。GSMS上的引物结合序列可以被设计成完全与所选反转录酶所需的tRNA的3’端互补。GSMS RNA可以直接使用受体细胞的tRNA起始反转录。天然tRNA表达盒可以加入到含有GSMS和反转录酶表达盒的瞬时表达系统中,增加引物tRNA的量,以提高ssGSMScDNA的产量。
[0071]除使用受体细胞本身的tRNA作引物外,可以设计使用(如A.H.Lund, 1997)所描述的与GSMS引物结合位点完全互补的人工tRNA。人工tRNA表达盒可以与GSMS和反转录酶表达盒构建在同一或不同的载体上同时导入受体细胞。人工tRNA被用作起始ssGSMS cDNA合成的引物如图9所示(图9)。
[0072]Poly (T/A)引物法是以加在mRNA 3’端的Poly(A)尾巴为引物。要实现这个目的,一段poly (U)必须加到GSMS RNA的3’端,相应的,一段dT序列要被加到GSMS DNA有意义链的3’端。当poly⑷尾巴被加在GSMS RNA 3’端的poly⑶区域后,poly⑷尾巴折回与poly(U)区段退火作为引物起始cDNA的合成(图8)。一个可能的问题是,添加poly (U)可能会妨碍RNA转移到细胞质。如果情况属实,一个核定位序列(NLS)可以被添加到反转录酶上将其转移至细胞核中合成GSMS cDNA。
[0073]反转录酶的选择:本发明系统最好采用具有RNase H活性的反转录酶,用来将ssGSMS cDNA从RNA/cDNA杂合分子中游离出来。如以改变目的序列特定核苷酸或在目的位点插入外源基因为目标,需要在转录和反转录中严格保持原有GSMS序列,应当使用高保真反转录酶以避免在反转录中不需要的变异被引入到ssGSMS cDNA中。由于大多数天然反转录酶不具有3’ -5’核酸外切酶活性(即校对功能),因此容易出错。具有较好校对功能的工程反转录酶如Life Technologies的Superscript反转录酶可被用作此目的。
[0074]校对能力较差的反转录酶(BattulaN, 1974) (Battula N, 1976) (KunkelTA, 1981)另有用途。例如,易出错HIV反转录酶的出错率约为1/1500碱基。对于一个2kb长的GSMS DNA来说,平均每个ssGSMS cDNA分子会含有一个随机变异。在反转录中易出错反转录酶可以用来在ssGSMS cDNA上生成随机变异,含有随机变异的ssGSMS cDNA可以将随机变异引入到目的基因,从而产生一个在目的基因区域含有随机突变的细胞库,这个细胞库可被用来筛选所需要的基因突变。
[0075]ssGSMS cDNA的应用:无论是否有靶向核酸内切酶的协助,ssGSMS cDNA都可被用来修饰目的基因。在某些实施例中,如果靶向核酸内切酶没有被包括在瞬时表达系统中,ssGSMS cDNA仍可进入到细胞核中并与受体细胞的同源基因组序列杂交。如果ssGSMS cDNA含有预先设计的或是由易出错反转录酶引入的变异,ssGSMS cDNA和目的序列对准时就会产生错配的碱基对。错配的碱基对会触发受体细胞的基因修复或纠错系统如MMR,受体细胞的基因修复或纠错系统会错误地以ssGSMS cDNA为模板而改变受体细胞基因组序列从而引入突变(图4)。还有可能ssGSMS cDNA与同源目的序列杂交,主导祀向修饰或通过同源重组将外源DNA序列整合进受体细胞基因组中。
[0076]在某些实施方式中,瞬时表达系统包括一个革巴向核酸内切酶表达盒。革巴向核酸内切酶是经过工程改造的内切酶,它将一个定制的DNA序列识别结构域和一个非特异DNA核酸内切酶结构域连接在一起。DNA序列识别结构域可被设计成能够识别一段10到50个碱基的特异基因组序列,靶向核酸内切酶因此能够在靠近期望引入变异的靶向位点切割DNA。当有大量的ssGSMS cDNA进入细胞核中,靶向序列的DNA链断裂会激活同源重组路径对DNA进行修复。ssGSMS cDNA与单链DNA结合蛋白形成核酸蛋白复合体或核酸蛋白丝,通过同源搜索发现靶向同源区的DNA断裂,很可能在单链DNA结合蛋白如RecA及相似蛋白的协助下,入侵同源区域并作为模板指导DNA合成,从而将变异整合到靶向位点。联合ssGSMScDNA和靶向核酸内切酶可以极大地提高通过同源重组在特异位点修饰基因的效率。可能介入的同源重组的机制包括(但不局限于),双链断裂修复路径(DSBR),基于合成的单链退火路径(SDSA),单链退火路径(SSA),断裂诱导复制路径(BIR),RecBCD路径和RecF路径。
[0077]靶向核酸内切酶的例子包括转录激活因子样效应因子核酸酶(TALEN),锌指核酸酶(ZFN)和大型核酸酶等。这些靶向核酸内切酶可以经工程改造而能够辨认和切割一段10到15个碱基长的特异双链核苷酸序列,这使它们成为靶向基因修饰的卓越工具。TALEN是一个很不错的选择,因为TALEN的DNA识别结构域含有和单个核苷酸相关的微基序重复,使得设计一个能够识别所需序列的微基序组合成为可能(美国专利,专利号8440431和8440432)。TALEN和ZFN可以经过进一步工程改造以切割双链DNA或者产生双链断裂(DSB),或者在双链DNA的一条链上产生缺刻(Kim, et al.,2012)。Kim发现,和双链DNA断裂(DSB)核酸内切酶相比,缺刻核酸内切酶的整合效率较低。但缺刻核酸内切酶所引发的的非特异整合和染色体重排率也较低。如果避免非特异整合和染色体重排是较为重要的方面,如基因疗法,则靶向缺刻核酸内切酶是更好的选择。在某些实施例中,具有高亲和性的多肽可以分别与靶向核酸内切酶(如ZFN,TALEN)和单链DNA结合蛋白连接在一起。通过亲和多肽间的互作,与单链DNA结合蛋白一起的ssGSMS cDNA可以被吸引到靶向位点的切害I]点和缺刻点。
[0078]修饰目的基因的瞬时表达系统的组件:
[0079]以上描述的系统的一些基本组件,可以根据不同的目的加入其它表达盒(图11)。系统的表达盒包括但并不局限于:
[0080]表达盒1:启动子/GSMS/终结子;表达盒2:启动子/SiRNA-用以降解目的基因的RNA/终结子;表达盒3:启动子/反转录酶/终结子;表达盒4:启动子/用作反转录引物的人工tRNA/终结子;表达盒5:启动子/用作反转录引物的天然tRNA/终结子;表达盒6:启动子/荧光蛋白基因/终结子(荧光蛋白表达盒被用来监测转化,瞬时表达和选择被转化的细胞;表达盒7:其它RNAi表达盒用来干扰RNA运输,降解等过程。其他RNA干扰方法如siRNA也可以采用;表达盒8:启动子/ZFN或TALEN/终结子;表达盒9:启动子/单链DNA结合蛋白/终结子。
[0081]这个瞬时表达系统发明的最基本的组件是GSMS和反转录酶表达盒,它们可以在同一个或不同的表达载体上,也可以在同一个表达盒中。最好在同一个载体或不同载体上加上一个天然或人工tRNA表达盒,产生起始反转录所需的引物tRNA。一个单链DNA结合蛋白表达盒也可以被加入到系统中,所产生的单链DNA结合蛋白与ssGSMS cDNA结合,稳定ssGSMS cDNA并协助ssGSMS cDNA向细胞核的运输。加入特别设计的能够降解目的基因但同时不干扰ssGSMS cDNA的RNAi表达盒也是有益的。目的基因的降解可能会反馈信息给细胞核,刺激目的基因的转录,使目的基因区域维持解旋或松弛状态。这会为ssGSMS cDNA接近染色体中的目的基因提供更多机会。另外,靶向核酸内切酶表达盒可以被包括在系统中增加基于同源的基因修饰的效率。如图12所示,一个或更多蛋白也可以和GSMS—起整合到一个表达盒中。
[0082]以上提到的表达盒可以构建在一个载体上,也可以构建在不同的载体上同时引入受体细胞。瞬时表达系统的载体可以是任何适于RNA转录和蛋白表达的载体。它可以是DNA或RNA,环状或直线型,病毒或非病毒载体。将载体转化进入细胞的方法,这一领域的研究者都已知晓。这些方法的例子包括电击法,PEG转化,DEAE-detran或CaPO4沉淀法,脂质体转化,纳米微粒转化,病毒感染和直接注射法。受体细胞可以是适合的原核及真核生物,如哺乳动物,植物,昆虫,蓝藻,真菌,酵母,细菌,培养的细胞等。被修饰和改变的可以是受体细胞的任意基因组序列,包括外显子,内含子,启动子,终结子,UTRs和调控序列或基序。
[0083]这项技术或许能够用于治疗传染性疾病,遗传疾病和如癌症等其它疾病;培育作物,林木,家畜,和鱼类的新性状;产生细菌,酵母,蓝藻和动物新的培养细胞类型用于药物和性状筛选;及用于发酵,油料,蛋白和其它医药,生物的工业原料的生产和科学研究。
[0084]实施例
[0085]以下的实施例只做说明用途而不对发明起限制或限定作用。
[0086]实施例1.利用GSMS ssDNAs恢复GFP荧光。
[0087]在本实施例中,一个GFP GSMS ssDNA被用来校正已经稳定整合到酵母细胞基因组中的删除移码GFP变异基因。一个完整的GFP编码序列在靠近5’端处由于单碱基删除造成移码,将这个删除移码的GFP序列稳定地整合到酵母细胞中。利用测序方法核实酵母基因组中GFP的变异。证实删除移码导致了 GFP失效。
[0088]本实施例中所利用的系统包括GSMS表达盒、反转录酶表达盒、ssDNA结合蛋白表达盒和引物表达盒。
[0089]首先构建GSMS表达盒,将一段包含变异GFP碱基删除点的野生型GFP与一个酵母强组成型启动子TEFl连接,再与引物结合序列和酵母转录终止子连接。400bp长的野生型GFP编码序列缺乏起始密码子因此不能被翻译成蛋白。只有当酵母基因组中的变异GFP被校正后才可以产生正常发光的GFP蛋白。GSMS的引物结合序列有18个碱基与tRNApix)3’端序列互补,tRNApro被M-MuLV反转录酶用作tRNA引物。由于这个例子需要一段准确的野生型GFP编码序列来校正变异GFP序列,使用高保真反转录酶SuperScriptTMII构建反转录酶表达盒。反转录酶表达盒有一个强酵母启动子TEFl,编码SuperScriptTMII M-MuLV反转录酶的序列和一个酵母转录终止序列(酵母ADHl终止子)。一个tRNApro表达盒由一个连接到编码tRNAproDNA序列的酵母启动子(酵母ADH启动子)和一个紧随其后的转录终止序列(酵母ADHl终止子)构建而成。
[0090]在合并表达盒中,一个酵母启动子首先被连接到RAD51编码序列,随后是一个发卡二级结构形成序列,然后是GSMS序列,和一个3’端的转录终止序列。RAD51和GSMS合并表达盒可以使RAD51蛋白和ssGSMS cDNA几乎同时同地一起表达,有利于GSMS-RAD51核酸蛋白丝的形成,GFP序列同源搜索,和GSMS链入侵以及变异GFP基因的校正。
[0091]以上表达盒在同一个酵母载体上,或分别在不同载体上。酵母载体可以是环形的或是直线型的,但不要使用可整合载体以避免整个载体被整合到酵母基因组中,本实施例中使用的是直线型酵母载体。包含有SuperScriptTMII反转录酶,利用LiAc/SS CarrierDNA/PEG将RAD51和GSMS表达盒的载体引入含有变异GFP的酵母细胞中。校正后的变异基因组GFP基因可以产生能发出荧光的GFP蛋白,利用荧光显微镜进行检测;利用流式细胞仪捕获到含有正确GFP基因的细胞;通过DNA测序鉴定证实GFP序列正确。
[0092]实施例2.利用单链GSMS DNA和GFP siRNA敲除受体细胞GFP基因。
[0093]本实施例演示利用GSMS ssDNA敲除动物细胞中具正常功能的GFP基因。
[0094]本实施例中所使用的系统包括GSMS表达盒、反转录酶表达盒、ssDNA结合蛋白表达盒,引物表达盒和siRNA表达盒。
[0095]选择具有正常功能的和被整合到细胞核中的GFP cDNA的能产生绿色荧光的293T-GFP细胞系。GSMS是一段300碱基长的靠近GFP cDNA 5’端的GFP编码序列,它含有一个移码删除和两个提早终止密码子(ATG)。GSMS(+)链的引物结合序列是在3’端的20个dT转录后形成GSMS RNA中的20个U。在转录终止后,将一段多聚A尾巴加到GSMS RNA的3’端,它与在其之前的20个U序列自身退火,成为反转录的引物。同样靠近GFP cDNA5’端,但在这300碱基GFP cDNA区域之外的GFP序列被用来设计双链GFP siRNA,并克隆到表达盒中。GFP siRNA诱导GFP mRNA的降解,发出信号维持GFP基因活跃转录,并使GFP基因所在的基因组位点处于解旋或半解旋状态。SuperScriptTMII反转录酶表达盒的构建如实施例1。
[0096]化学合成的GFP siRNA和含有GSMS和SuperScriptTMII反转录酶表达盒的载体用脂体转染剂(Iipofectamine)导入293T-GFP细胞中。转化后正常培养293T-GFP,并寻找没有GFP荧光的细胞。利用细胞流量仪分离无荧光细胞,再通过PCR和DNA测序证实了GFP基因已经被敲除。
[0097]实施例3.利用GSMS ssDNA的GFP基因的同源重组热点的靶向整合。
[0098]本实施例中所使用的系统包括GSMS表达盒、反转录酶表达盒、ssDNA结合蛋白表达盒,靶向核酸内切酶表达盒和弓I物表达盒。
[0099]本实施例利用GSMS ssDNA将一段外源DNA弓丨入到受体细胞中的特定位点,具体说就是同源重组热点区域。首先确认将要靶击的基因组同源重组热点。GSMS设计是一个具正常功能的GFP编码序列和启动子以及两端100碱基长的和基因组同源重组热点序列互补的序列。如同在实施例1中的描述,GSMS的引物结合序列是与tRNAPro3’端互补的18个碱基序列。一个SuperScriptTMII反转录酶表达盒和一个如上所述的GSMS及动物GAD51蛋白编码序列的合并表达盒按实施例1所述构建。将含有上述表达盒的载体转入到HEK293胞系中并培养一周,直至瞬时表达载体被降解和消失。寻找和分离有GFP荧光的细胞克隆,通过DNA测序确认发生了同源重组。
[0100]实施例4.利用GSMS ssDNA和TALEN构建一个在目的基因组序列含有随机突变的细胞库
[0101]本实施例演示利用GSMS ssDNA,校对功能差的反转录酶和靶向核酸内切酶TALEN构建一个在目的基因组序列含有随机突变的细胞库的方法。本实施例中所使用的系统包括GSMS表达盒、校对功能差的反转录酶表达盒、ssDNA结合蛋白表达盒,和引物表达盒。
[0102]这个方法可以用来在目的基因组位点的DNA序列中导入随机突变,构建随机突变细胞库用以筛选新的性状或所需要的表现型。需要改变的目的基因组位点可以是连续的外显子序列,调控区域,或者整合到基因组中的cDNA序列。在本实施例改变的目的基因组位点为已经整合到受体细胞基因组的正常GFP基因编码序列。变异细胞可因减弱的GFP或失效GFP (无荧光)被容易地筛选。
[0103]GSMS和目的基因组序列完全相同,易出错的HIV反转录酶(平均出错率1/1500碱基)用来在反转录时将随机突变引入到ssGSMS cDNA中。迎合HIV反转录酶自用的tRNA3Lys,GSMS引物结合序列含有18个碱基与tRNA3Lys3’端互补。TELEN的DNA结合结构域被定制成能够确认在目的基因组序列中GFP蛋白编码区域,并用来在此区域内进行双链切割。利用TALEN在受体细胞内产生双链断裂可以极大地提高同源整合的效率,促成产生一个细胞群体,每一个细胞含有不同变异。GSMS,HIV反转录酶,GAD51,和TALEN表达盒如实施例1所述。含有GSMS,HIV反转录酶,和TALEN的表达盒用电击方法导入受体细胞。进入细胞后GSMS表达盒表达GSMS RNA,GSMS RNA然后被反转录为含有随机突变的ssGSMScDNA, ssGSMS cDNA与GAD51蛋白结合形成核蛋白丝并被转运至细胞核。被同时表达的TALEN酶进入细胞核,在靶向基因组序列造成双链断裂,GSMS-GAD51核蛋白丝进行同源搜索并与目的基因组序列的同源区域退火,促成含有随机突变的GSMS的同源整合。利用荧光细胞流量仪检测培养几天后的细胞并挑选荧光减弱或无荧光的活细胞。培养这些细胞并对GFP编码区域进行测序,确定造成GFP失效或功能减弱的基因突变的位点。
[0104]本发明尽管出于阐述明确和方便理解对某些细节进行了描述,任何在这一领域具有一般技能的人都能认同对本发明在形式和细节上的诸多改变仍然涵盖于本发明。所有有关的图,表,附录,专利,专利申请及出版物均包括在参考文献中。
【权利要求】
1.一种在受体细胞的目的基因组序列引入变异的系统,所述系统包括: a)一个基因组DNA诱变序列GSMS表达盒,其中所述的GSMS表达盒包括一段和所述目的基因组序列同源的多聚核苷酸序列和一个引物结合序列,其中所述的GSMS表达盒产生GSMS RNAs ; b)一个反转录酶表达盒,其中所述的反转录酶表达盒包括一段编码反转录酶的多聚核苷酸序列,所编码的反转录酶可以是天然的或工程改造的反转录酶,并且所述反转录酶可以是有较好的校对功能或较差的校对功能;以及 所述GSMS表达盒与反转录酶表达盒通过同一表达载体或不同表达载体导入到受体细胞中,在受体细胞中,所述GSMS RNAs被所述反转录酶反转录为ssGSMS cDNAs,并且所述ssGSMS cDNAs在所述目的基因组序列导致变异。
2.根据权利要求1所述的系统,其中,所述的GSMS包括一段与所述目的基因组序列完全互补的序列在被引入到受体细胞中后所述GSMS可与受体细胞基因组序列配对杂交;或者,除在所述GSMS预先设定的位置有一个或几个核苷酸的区别外,所述的GSMS包括一段与所述目的基因组序列完全互补的序列,所述的核苷酸的区别是错配、删除、插入或以上所列的组合。
3.根据权利要求1所述的系统,其中,所述GSMS包括一段非同源多聚核苷酸序列,夹在与受体细胞基因组序列同源的序列间;优选的,所述的非同源多聚核苷酸序列编码一个选择标记基因。
4.根据权利要求1所述的系统,其中所述的GSMS包括一段与目的基因组序列的同源重组热点区域同源的序列,或者,所述的GSMS包括一段与含有正向和反向重复的目的基因组序列同源的序列。
5.根据权利要求1-4中任意一项所述的系统,其中所述GSMS的引物结合序列与天然或人工tRNA序列的3’端互补。
6.根据权利要求5所述的系统,其中GSMSRNA的5’端可以形成二级结构,当所述反转录酶遇到所述二级结构时终止反转录。
7.根据权利要求6所述的系统,还包括一个引物表达盒,其中所述的引物表达盒产生天然的或人工的引物tRNA,引物tRNA与所述GSMS RNAs上的所述引物结合序列结合,起始反转录。
8.根据权利要求1_4、6或7所述的系统,还包括 ssDNA结合蛋白表达盒,其中所述的ssDNA结合蛋白表达盒编码一个ssDNA结合蛋白; 其中,所述的ssDNA结合蛋白包括:RecA、RecA的同源蛋白、Rad51、Rad51的同源蛋白、DMCl、DMCl的同源蛋白、ICP8、ICP8的同源蛋白、SSB和SSB的同源蛋白。
9.根据权利要求1-4、6-8中任意一项所述的系统,还包括 一个靶向核酸内切酶表达盒,所述靶向核酸内切酶表达盒编码一个靶向核酸内切酶,而且所述靶向核酸内切酶包括一个DNA序列识别结构域和一个DNA核酸内切酶结构域,并且所述靶向核酸内切酶和所述GSMS指向所述目的基因组序列的同一同源区域; 其中,所述的靶向核酸内切酶的所述DNA序列识别结构域选自这样一组蛋白,这组蛋白包括,锌指蛋白DNA序列识别结构域,转录激活因子样效应因子DNA序列识别结构域,和大型核酸酶的序列识别结构域。
10.根据权利要求9所述的系统,其中所述靶向核酸内切酶的所述DNA核酸内切酶结构域能够切割一段双链多聚核苷酸序列产生双链断裂,或者,只切割双链DNA中的一条链从而在双链DNA上造成一个缺口。
11.根据权利要求1-4和6-10中任意一项所述的系统,还包括一个siRNA表达盒,其中所述的siRNA表达盒产生siRNA引发所述目的基因组序列的mRNA的降解,并且siRNA与所述GSMS RNAs没有同源序列。
12.根据权利要求6-11中任意一项所述的系统,其中,所述系统包括引物表达盒,ssDNA结合蛋白表达盒,革巴向核酸内切酶表达盒和siRNA表达盒中的至少一种; 其中,所述GSMS表达盒、反转录酶表达盒、引物表达盒,ssDNA结合蛋白表达盒,祀向核酸内切酶表达盒和siRNA表达盒可以位于不同的表达载体或者同时在同一载体上,并且反转录酶编码序列,ssDNA结合蛋白编码序列和靶向核酸内切酶编码序列中至少两个序列可以同时存在于一个表达盒中,形成合并表达盒; 在所述合并表达盒中,一个单一操纵子被连接到两个或更多个蛋白编码序列,其中相邻蛋白编码序列被翻译跳跃序列分隔开;或者,其中一个单一操纵子被连接到两个或更多个蛋白编码序列并且继续连接到GSMS,其中相邻蛋白编码序列被翻译跳跃序列分隔开,并且GSMS和上游蛋白编码序列被能编码一段发卡型RNA结构的序列分隔开。
13.一个在受体细胞目的基因组序列引入变异的方法,包括以下步骤: a)构建一个GSMS表达盒,其中所述GSMS含有一段与所述目的基因组序列同源的多聚核苷酸序列和一个引物结合序列,并且其中所述GSMS表达盒产生GSMS RNAs ; b)构建一个反转录酶表达盒,其中所述反转录酶表达盒编码一个反转录酶;并且 c)将所述GSMS表达盒和所述反转录酶表达盒同时引入受体细胞,其中所述GSMSRNAs被反转录酶反转录为ssGSMS cDNAs,并且所述ssGSMS cDNAs在目的基因组序列导致变异; d)选择目的基因组序列被改变的受体细胞。
14.根据权利要求13所述的方法,还包括从下列一组表达盒中选出的一个或多个表达盒将它们同时引入到受体细胞中,他们包括引物表达盒,ssDNA结合蛋白表达盒,靶向核酸内切酶表达盒和siRNA表达盒。
15.获得在目的基因组序列有随机变异的细胞群的方法,包括以下步骤: a)构建一个GSMS表达盒,其中所述GSMS含有一段与所述目的基因组序列完全同源的多聚核苷酸序列和一个引物结合序列,并且其中所述GSMS表达盒产生GSMS RNAs ; b)构建一个反转录酶表达盒,其中所述反转录酶表达盒编码一个纠错功能弱的反转录酶; c)将所述GSMS表达盒和所述反转录酶表达盒同时引入受体细胞,其中所述GSMSRNAs被纠错功能弱的反转录酶反转录为含有随机变异的ssGSMS cDNAs,并且所述ssGSMS cDNAs导致随机变异被整合到所述的目的基因组序列;并且 d)选择在所述目的基因组序列具有随机变异的细胞。
16.根据权利要求15所述的方法,还包括从下列一组表达盒中选出的一个或多个表达盒将它们同时引入到受体细胞中,他们包括引物表达盒,ssDNA结合蛋白表达盒,靶向核酸内切酶表达盒和siRNA表达盒。
【文档编号】C12N15/63GK104372016SQ201410559802
【公开日】2015年2月25日 申请日期:2014年10月20日 优先权日:2013年10月19日
【发明者】刘立新 申请人:刘立新
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1