一种新型向导RNA表达盒及在CRISPR/Cas系统中的应用的制作方法

文档序号:11246293阅读:3413来源:国知局
一种新型向导RNA表达盒及在CRISPR/Cas系统中的应用的制造方法与工艺

本发明属于生物技术领域;具体地说,本发明涉及一种以5srrna基因为启动子的新型向导rna表达盒及其在crispr/cas系统中的应用。



背景技术:

crispr/cas(clusteredregularlyinterspacedshortpalindromicrepeats/crispr-associatedproteins)系统为细菌与古生菌中抵御外源病毒或质粒dna入侵的获得性免疫系统。该系统的核酸酶在crrna的指导下识别并降解外源dna。其中,ii型crispr/cas系统组成简单,仅包括一个核酸酶cas9与tracrrna:crrna二聚体便可完成识别和切割功能。crispr/cas9系统以其设计操纵简便、编辑高效与通用性广等优势迅速成为新一代的基因组编辑技术,已被广泛应用于人、小鼠、大鼠、斑马鱼、秀丽隐杆线虫、植物、真菌与细菌等不同物种(hsuetal.2014)。

基于crispr/cas9的基因组编辑技术中,hsu等(hsuetal.2013)将tracrrna:crrna二聚体被进一步设计为单一的嵌合向导rna(singlechimericguiderna,sgrna),其包含位于5’-端的靶dna的互补序列以及位于3’-端的tracrrna:crrna的类似序列,利用靶dna的互补序列来定位需编辑的位点,利用tracrrna:crrna的骨架序列(scaffoldsequence)与cas9结合。该技术中仅只需改变向导rna中的位于pam(protospacer-adjacentmotif,5’-nggdnamotif)上游17-20bp的原间隔序列(protospacer),即可使cas9定位到不同的靶dna序列,并引入dna双链断裂。crispr/cas9介导的基因组编辑技术依赖于细胞自身的dna修复机制。在特定位点产生的双链dna断裂可通过非同源末端连接(non-homologousend-joining,nhej)或同源重组(homologydirectedrepair,hdr)得以修复。nhej是易错修复,会在双链dna断裂处引入碱基的插入或缺失,从而造成特定基因的失活。若细胞中引入hdr所需要的带有同源臂的供体dna(donordna,ddna),则可实现定点突变或特定序列的插入与敲除。

在crispr/cas9系统中,向导rna的表达水平对cas9的定位与切割效率都有显著的影响。向导rna的表达是限制真核生物crispr技术开发应用的关键。虽然在哺乳动物中建立了以u6启动子启动向导rna转录的crispr/cas9技术,但由于真核生物的启动子序列物种间差别很大,在一些物种中u6等小rna的启动子并不容易找到,且通常需要耗费时间优化其效率。比如,周志华等(liuetal.2015)首次在丝状真菌里氏木霉中测试crispr/cas9系统的可行性时,由于真菌小rna转录机制认识的缺乏,不得不采用向导rna体外转录然后再转化至细胞的方法。虽然向导rna体外转录后以rna的形式也可导入细胞中,引导cas9蛋白的定位,但向导rna的稳定性与转化效率会影响基因组编辑效率,且增加操作难度。

在真菌中,也有研究通过与人类u6snrna的序列比对来寻找内源的u6snrna,用来引导向导rna的转录。但在研究案例(zhangetal.2016)中初级转化平板上不容易获得直接编辑转化子或获得的转化子较少。再如烟曲霉(fulleretal.2015)与粗糙脉孢霉(matsu-uraetal.2015)中直接采用酵母snr52的启动子,但效率较低。另外,在产黄青霉(pohletal.2016)中,测试了以trna为由rna聚合酶iii识别的启动子启动向导rna的转录,在所检测的转化子中也可发生基因敲除。但在解脂酵母(schwartzetal.2016)中,发现使用trnagly为启动子时,其基因失活效率仅为30%左右。

一些高强度的rna聚合酶ii所识别的启动子如ptrpc与pgpda等也可起始向导rna的转录,在稻瘟霉(arazoeetal.2015)与曲霉(nodvigetal.2015)中获得了应用,但与由rna聚合酶iii识别的启动子相比,其介导的基因失活效率较低。这可能由于ii型启动子所引起向导rna的转录通读或5’-加帽与3’-加尾等转录后修饰干扰了向导rna与cas9结合,也可能由于转录活性相对较低所致。曲霉中在使用pgpda进行向导rna转录时,研究者在向导rna的5’-端与3’-端分别加入了锤头核酶hh(hammerhead,hh)与肝炎病毒核酶hdv(hepatitisdeltavirus,hdv)以减少干扰,但由于锤头核酶hh中有六个碱基需与向导rna中的靶序列互补配对,导致向导rna表达系统构建较为繁琐。

因此,本领域急需跨物种、通用性高的、能够有效提高向导rna表达水平的技术手段。



技术实现要素:

本发明的目的提供一种能够应用于crispr/cas系统的向导rna表达盒,该表达盒能够具备通用性和高效性;同时利用该新型crispr/cas9系统进行基于同源重组的基因组精确编辑时,能够提高基因组编辑的简便性以及显著提高基因打靶的准确性。

在第一方面,本发明提供一种应用于crispr/cas系统的向导rna表达盒,所述向导rna表达盒是由真核生物的rna聚合酶iii识别的type1启动子来起始向导rna的表达。

在具体的实施方式中,所述由真核生物的rna聚合酶iii识别的type1启动子具有真核生物的5srrna基因的序列。

在优选的实施方式中,所述真核生物的5srrna基因的序列是黑曲霉的5srrna基因的序列。

在优选的实施方式中,所述真核生物的5srrna基因的序列如seqidno:6的1-118位所示。

在优选的实施方式中,所述由真核生物的rna聚合酶iii识别的type1启动子是真核生物的5srrna的内部启动子。

在具体的实施方式中,所述向导rna的表达盒从5’-3’具有以下结构:

a-b-c

其中,

a为真核生物的rna聚合酶iii识别的type1启动子;

b为无或可自我切割的核酶;

c为向导rna。

在具体的实施方式中,所述可自我切割的核酶选自hh核酶(hammerhead,hhribozyme)、hp核酶(hairpinhpribozyme)、glms核酶(glucosamine6-phosphatesynthase,glmsribozyme)、vs核酶(varkudsatellite,vsribozyme)、hdv核酶(hepatitisdeltavirus,hdvribozyme)与类hdv核酶(hepatitisdeltavirus-like,hdv-likeribozyme)等;更优选地,所述核酶是hdv核酶与hh核酶。

在第二方面,本发明提供一种载体,所述载体包含本发明第一方面所述的表达盒。

在第三方面,本发明提供一种crispr/cas系统,所述crispr/cas系统包含权利要求1-4中任一项所述的向导rna表达盒。

在具体的实施方式中,所述的crispr/cas系统是crispr/cas9系统、crispr/ncas9系统或crispr/dcas9系统;优选地,所述crispr/cas系统是crispr/cas9系统。

在优选的实施方式中,所述crispr/cas系统用于基因组编辑。

在优选的实施方式中,所述crispr/cas系统用于基因表达调控。

在优选的实施方式中,利用所述crispr/cas9系统进行基因失活编辑,获得的基因失活率高于95%,更优选达到100%。

在优选的实施方式中,所述的crispr/cas系统,特别是crispr/cas9系统可利用15-3000bp的同源臂的供体dna进行基因精准编辑;在进一步的优选实施方式中,所述的crispr/cas系统,特别是crispr/cas9系统可利用20-200bp的同源臂的供体dna进行基因精准编辑;例如,供体dna的同源臂可以低于100bp,甚至低于40bp,更甚至低于20bp,而所述crispr/cas9系统利用短同源臂的供体dna进行基因组编辑的效率可以达到60%以上,甚至75%以上,更甚至95%以上。

在优选的实施方式中,所述crispr/cas系统用于对黑曲霉进行基因组编辑。

在第四方面,本发明提供一种基因组编辑方法,所述方法利用本发明第三方面所述的crispr/cas系统进行基因组编辑。

在优选的实施方式中,利用所述crispr/cas9系统进行基因失活编辑,获得的基因失活率高于95%,更优选达到100%。

在优选的实施方式中,所述的crispr/cas系统,特别是crispr/cas9系统可利用15-3000bp的同源臂的供体dna进行基因精准编辑;在进一步的优选例中,在进一步的优选实施方式中,所述的crispr/cas系统,特别是crispr/cas9系统可利用20-200bp的同源臂的供体dna进行基因精准编辑;例如,供体dna的同源臂可以低于100bp,甚至低于40bp,更甚至低于20bp,而所述crispr/cas9系统利用短同源臂的供体dna进行基因组编辑的效率可以达到60%以上,甚至75%以上,更甚至95%以上。

在优选的实施方式中,所述基因组编辑方法用于基因失活。

在优选的实施方式中,所述基因组编辑方法用于调控基因的转录表达强度。

在优选的实施方式中,所述基因组编辑方法用于基因的精确编辑,其中所述精确编辑包括但不限于点突变、序列敲除、序列插入等。

在具体的实施方式中,该方法用于真核生物的基因组编辑和转录调控。

在优选的实施方式中,所述真核生物包括但不限于:真菌、昆虫、植物、禽类、哺乳动物、鱼类;更优选地,所述真菌包括但不限于酵母、丝状真菌与大型真菌;所述昆虫包括但不限于果蝇、家蚕、秀丽线虫;所述植物包括但不限于拟南芥、烟草、水稻、小麦、玉米、大豆;所述禽类包括但不限于鸡、鸭、鹅,所述哺乳动物包括但不限于人类、小鼠、大鼠、家兔、猪、牛、马、羊、狗与猫,所述鱼类包括但不限于斑马鱼。

在优选的实施方式中,所述的酵母包括但不限于酿酒酵母、毕赤酵母与解脂耶氏酵母;所述的丝状真菌包括但不限于黑曲霉、米曲霉、烟曲霉、构巢曲霉、产黄青霉、里氏木霉、粗糙脉孢霉、嗜热毁丝霉、黑粉菌。

在优选的实施方式中,所述的丝状真菌为黑曲霉。

在具体的实施方式中,所述基因组编辑方法应用于nhej系统活性弱化的真核生物。

在具体的实施方式中,所述nhej系统活性弱化是通过kusa基因失活实现。

在优选的实施方式中,所述kusa基因失活的真核生物通过crispr/cas系统对真核生物的编辑获得。

在优选的实施方式中,所述的基因组编辑方法利用含有不同长度同源臂的供体dna对nhej系统活性弱化的真核生物进行精确基因组编辑;优选地,同源臂长度为15-3000bp;更优选地,同源臂长度为20-200bp。

在优选的实施方式中,所述的基因组编辑方法利用含有同源臂的供体dna对kusa基因失活的黑曲霉进行精确基因组编辑;优选地,同源臂长度为15-3000bp;更优选地,同源臂长度为20-200bp。

在进一步的优选实施方式中,供体dna的同源臂可以低于100bp,甚至低于40bp,更甚至低于20bp;而所述方法的基因组编辑的效率可以达到100%。

在第五方面,本发明提供真核生物的rna聚合酶iii识别的type1启动子在向导rna介导的crispr/cas系统中作为启动子起始向导rna转录的应用。

在优选的实施方式中,所述rna聚合酶iii识别的type1启动子具有5srrna基因的序列。

在优选的实施方式中,所述5srrna是黑曲霉的5srrna。

在优选的实施方式中,所述5srrna基因的序列如seqidno:6的1-118位所示;

在优选的实施方式中,所述rna聚合酶iii识别的type1启动子是5srrna基因的内部启动子。

在优选的实施方式中,所述向导rna介导的基因组编辑系统是crispr/cas系统;优选地所述crispr/cas系统是crispr/cas9系统、crispr/ncas9系统或crispr/dcas9系统;更优选地,所述crispr/cas系统是crispr/cas9系统。

在优选的实施方式中,所述向导rna介导的基因组编辑系统所应用的物种包括但不限于:真菌、昆虫、植物、禽类、哺乳动物、鱼类;更优选地,所述真菌包括但不限于酵母、丝状真菌与大型真菌;所述昆虫包括但不限于果蝇、家蚕、秀丽线虫;所述植物包括但不限于拟南芥、烟草、水稻、小麦、玉米、大豆;所述禽类包括但不限于鸡、鸭、鹅,所述哺乳动物包括但不限于人类、小鼠、大鼠、家兔、猪、马、羊、狗与猫,所述鱼类包括但不限于斑马鱼。

在进一步的优选实施方式中,酵母包括但不限于酿酒酵母、毕赤酵母与解脂耶氏酵母;丝状真菌包括但不限于黑曲霉、米曲霉、烟曲霉、构巢曲霉、产黄青霉、里氏木霉、粗糙脉孢霉、嗜热毁丝霉、黑粉菌。

应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。

附图说明

图1显示了cas9的蛋白表达载体pcas9的质粒图谱;

图2显示了本发明中一系列向导rna表达盒设计;

图3显示了以5srrna为启动子的向导rna表达盒的克隆载体p5s-sgrna(a)与p5s-hdv-sgrna(b);

图4显示了不同启动子起始向导rna转录的crispr/cas9系统介导的alba基因失活转化子的检测结果;

图5显示了以5srrna为启动子起始向导rna转录的crispr/cas9系统介导的alba不同靶序列的基因失活转化子的检测结果;

图6显示了在黑曲霉中新型crispr/cas9系统介导alba基因插入编辑;其中:a为alba基因插入编辑菌株的构建与重组的示意图;b为crispr/cas9系统介导的alba基因插入编辑转化子的基因组pcr检测结果;

图7显示了新型crispr/cas9系统中cas9与sgrna位于同一质粒的pcas9sgrna的质粒图谱;

图8显示了新型crispr/cas9系统中cas9与sgrna位于同一质粒的alba基因失活突变与定点插入效率检测结果;其中:a为alba基因失活转化子的初级转化平板;b为alba基因插入编辑转化子的初级转化平板;c为alba基因插入编辑转化子的基因组pcr检测结果;

图9显示了在黑曲霉中新型crispr/cas9系统介导的kusa基因插入编辑菌株构建;其中:a为nhej系统关键基因kusa失活菌株的构建与重组的示意图;b为crispr/cas9系统介导的kusa基因编辑转化子的基因组pcr检测结果;

图10显示了在黑曲霉kusa基因失活菌株中利用长同源臂黑曲霉新型crispr/cas9系统介导alba基因敲除菌株构建;其中:a为alba基因长同源臂介导的基因敲除菌株构建与重组示意图;b为crispr/cas9系统介导的alba基因长同源臂介导的基因敲除转化子的基因组pcr检测结果;

图11显示了在黑曲霉kusa基因失活菌株中利用短同源臂黑曲霉新型crispr/cas9系统介导alba基因敲除菌株构建;其中:a为alba基因短同源臂介导的基因敲除菌株构建与重组示意图;b为crispr/cas9系统介导的alba基因短同源臂介导的基因敲除转化子的基因组pcr检测结果;

图12显示了不同5srrna上游序列的向导rna表达盒的crispr/cas9系统介导alba基因突变,其中,a为黑曲霉5srrna启动子的核心元件与一系列含有不同长度的5srrna上游序列的向导rna表达盒的设计;b为一系列含有不同长度的5srrna上游序列的向导rna表达盒的构建结果(其中:1-6为分别为δ5’-338,δ5’-160,δ5’-106,δ5’-65,δ5’-35与δ5’+1的5srrna-hdv-sgrna表达盒);c为利用这一系列向导rna表达盒组成的crispr/cas9系统介导alba基因失活效率的检测结果;

图13显示了来源于真菌、植物与动物的不同物种5srrna基因的生物信息学分析,其中,a为基于不同物种来源的5srrna基因序列的进化树分析;b为针对于来源于真菌、植物与动物的不同物种5srrna基因序列的保守结构分析。

具体实施方式

发明人经过广泛而深入的研究,出乎意料地发现以核糖体rna为启动子来介导向导rna的转录,可实现100%的特定基因失活,从而大幅度提高了基因组编辑效率。此外,本发明在基因组定位的编辑或转录调控系统中还具有通用性、简便性以及准确性等有益效果。在此基础上完成了本发明。

本发明首次提出以核糖体rna为启动子来介导向导rna的转录,例如采用黑曲霉5srrna作为启动子,可实现100%特定dna位点的切割。由于5srrna在不同物种中保守性较强,因此该新型crispr/cas9系统的设计在不同物种中具有更好的通用性,同时与传统的u6启动子相比,由于表达丰度更高使该系统的基因组编辑效率更高。

基因组上特定基因序列的准确编辑,通常在靶基因的上下游选取同源臂,设计构建含同源臂的供体dna片段供体dna片段,以此通过同源重组来实现点突变、序列的敲除和敲入。丝状真菌中,dna修复机制以非同源末端连接(nhej)为主,同源重组效率小于5%。因此在传统基因敲除工作中,多通过增加同源臂的长度来提高同源重组效率。在黑曲霉ab4.1中,当同源臂设计为100bp时,基因敲除的效率仅为4%;只有当同源臂达到1500bp时,基因敲除效率才提高至29%。这意味着为完成一个基因的敲除,就需要较为繁琐的供体dna片段供体dna片段的构建与非常繁重的转化子筛选工作,如之前粗糙脉孢霉与构巢曲霉的单基因缺失库的构建就花费了10年以上的时间。真核生物中,crispr/cas9系统在基因组特定位点上所引起的dna双链断裂,在存在供体dna时,可大大提高同源重组效率。本发明在黑曲霉新型crispr/cas9系统中测试了含有40bp的同源臂的供体dna片段即可实现对单个靶基因或多个基因的高效插入与敲除,仅需要一个pcr反应即可完成供体dna的构建,并且仅需验证十个以内的转化子即可获得多个阳性转化子。这将大大简化基因组编辑工作,实现单个基因功能与多个基因关联的快速研究。

由rna聚合酶iii识别的启动子

本文所述的“rna聚合酶iii识别的启动子”是真核生物的rna聚合酶iii识别的启动子。真核生物中有3种依赖dna的rna聚合酶,即rna聚合酶i、ii与iii。rna聚合酶i主要负责18s-5.8s-28srrna基因簇的转录,rna聚合酶ii负责所有mrna、大多数snrna、snorna与microrna的转录,而rna聚合酶iii则负责5srrna、trna以及一些小的非翻译rna(smrna)的转录。这些小rna多参与转录、剪接与翻译过程。rna聚合酶iii可识别三类不同的启动子,分别为type1、type2、与type3。type1与type2启动子为内部启动子,启动子位于基因的内部、转录起始位点的下游,而type3启动子则主要位于转录起始位点的上游。已知的type1启动子主要是5srrna的内部启动子,由a-box、中间元件ie与c-box等转录调控元件组成。

在本发明的具体实施方式中,利用由rna聚合酶iii识别的type1启动子来起始向导rna的表达。所述由rna聚合酶iii识别的type1启动子包括但不限于5srrna基因;优选黑曲霉的5srrna。在优选的实施方式中,所述5srrna基因如seqidno:6所示。在进一步优选的实施方式中,所述5srrna基因的序列如seqidno:6的1-118位所示。在优选的实施方式中,所述由rna聚合酶iii识别的type1启动子是5srrna的内部启动子。

基于本发明的教导,本领域技术人员应知晓,本文所述的“5srrna”、“5srrna基因”或“本发明的启动子”具有相同的含义。基于本领域的常规知识以及本发明的教导,本领域技术人员还应知晓,本文所述的“5srrna”或“5srrna基因”还包括其关键核心元件;即,包含在所述5srrna基因内部的核苷酸序列如a-box、中间元件ie与c-box等转录调控元件,并且该核苷酸序列同样能够起到起始向导rna的表达的核苷酸序列。

crispr/cas技术

本发明所称的“crispr/cas技术”、“crispr/cas基因组编辑”、“crispr/cas基因组编辑技术”、“crispr/cas基因组编辑方法”一般是指利用crispr/cas系统对目的dna序列进行修改的技术。“crispr/cas技术”也可以包含利用类似原理进行基因表达调控的方法,如基于crispr/dcas9的基因表达调控技术。

本发明的向导rna表达盒

本发明利用真核细胞的rna聚合酶iii识别的type1启动子(例如5srrna)启动crispr/cas9系统中向导rna的转录,在真核细胞内产生具有生物活性的向导rna,从而快速实现基因组内特定位点的基因失活、基因插入与基因敲除。

以5srrna-sgrna的结构为例,这种由5srrna作为启动子的新型向导rna表达盒,可转录产生向导rna,在真核细胞中向导rna准确识别基因组上的靶序列,指导cas9蛋白在特定位点进行高效的切割,为基因组定点编辑奠定基础。相比于传统由u6启动子介导的向导rna表达系统,本发明的结构简单,打靶效率更高,基因组编辑效率更高,在不同真核物种中的普适性更广。

在5srrna启动子与向导rna之间也选择加入可自我切割的核酶所形成的向导rna表达盒也可起到类似的作用,在本发明中,测试了如hdv与hh等自我切割的核酶,其均可实现向导rna的转录后加工,生产有活性的向导rna。

cas9蛋白

本领域技术人员知晓,crispr/cas的核心是cas蛋白以及向导rna。基于本发明的教导,本领域技术人员可以理解本发明的向导rna表达盒可以与各种cas蛋白联用,从而用于各种crispr/cas系统,如crispr/cas9系统、crispr/ncas9系统、crispr/dcas9系统。

cas9蛋白为多功能蛋白,其蛋白结构包括α-螺旋组成的识别区(rec)、由hnh结构域与ruvc结构域组成的核酸酶区以及位于c-端的pam结合区。这两个重要的核酸酶结构域ruvc与hnh可分别对grna的dna互补链与非互补链进行切割,产生平末端的dna双链断裂。当ruvc结构域中的d10a发生突变时可导致ruvc结构域的失活,当hnh结构域中的h840a发生突变时则可导致hnh结构域的失活。单点突变体可使cas9成为切口酶(nickase),简称为ncas9,可形成单链dna断裂。目前,crispr/ncas9系统也被广泛开发应用,利用两个向导rna介导的两个单链断裂的形成,可提高该系统打靶的准确性,减少脱靶率。另外,cas9的双突变体d10ah840a可使cas9丧失对dna的切割活性但保留dna结合活性,从而开发出可被向导rna介导实现靶向结合的crispr/dcas9系统,该系统则可用于基因组靶序列的转录调控。

在具体的实施方式中,所述crispr/cas系统包括但不限于crispr/cas9系统、crispr/ncas9系统或crispr/dcas9系统;优选地,所述crispr/cas系统是crispr/cas9系统。

核酶

如本文所用,术语“核酶(ribozyme)”具有本领域技术人员通常理解的含义,其是指具有催化活性的rna分子,即化学本质是核糖核酸(rna),却具有酶的催化功能。核酶的作用底物可以是不同的分子,有些作用底物就是同一rna分子中的某些部位。核酶的功能很多,有的能够切割rna、有的能够切割dna,有些还具有rna连接酶、磷酸酶等活性。与蛋白质酶相比,核酶的催化效率较低,是一种较为原始的催化酶。核酶的发现打破了酶是蛋白质的传统观念。

本领域技术人员鉴于本发明的教导,不难理解,本发明可利用各种具有自我切割活性的核酶,包括但不限于hdv核酶、发夹状核酶(hairpinribozyme)、锤头状核酶(hammerheadribozyme)等。另外,其它可以自催化切割或通过蛋白因子介导进行切割的核苷酸序列,都可以用于本发明,并且典型地位于本发明的向导rna表达盒中核糖体rna和向导rna之间。在优选的实施方式中,本发明所用的核酶是hdv核酶与hh核酶。

本发明的向导rna介导的crispr/cas系统

在本发明的向导rna表达盒的基础上,本发明提供包含所述的向导rna表达盒的crispr/cas系统。

本领域技术人员知晓,crispr/cas系统可以用于各种领域,包括但不限于基因组编辑、基因表达调控与基因工程等等。在具体的实施方式中,本发明的crispr/cas系统用于基因组编辑和基因表达调控。

本发明的crispr/cas系统包括但不限于crispr/cas9系统、crispr/ncas9系统或crispr/dcas9系统;优选crispr/cas9系统。

如上所述,本发明的crispr/cas系统的核心是cas9蛋白以及向导rna,二者可以在同一表达载体中也可以在不同的表达载体中。然而,由于向导rna和cas9蛋白在不同表达载体中减少了向导rna表达盒亚克隆至cas9质粒的过程,使得操作更为简便,因此,在优选的实施方式中,将向导rna的表达盒与cas9的表达质粒共转化。

基于本发明的技术内容以及本领域的技术常识,本领域技术人员知晓关于cas9的表达、靶向序列的选择以及dna转化系统的各种技术要点,例如本领域技术人员可以参照nodvig等(nodvigetal.,2015)所述进行cas9的表达、靶向序列的选择以及实施dna转化。

在本文中,术语“基因失活”是指在不涉及供体dna的基础上,由cas9在向导rna的引导下对特定位点进行双链切割后,在真核生物中由非同源末端连接系统引入dna序列插入或碱基缺失等而使得某一基因丧失生物学功能;而术语“基因精准编辑”是指在特定dna位点进行精准的、可预测的遗传学操作,例如目标dna片段的敲除、插入、替换、点突变等等,涉及供体dna以及同源重组机制。因此,本领域技术人员知晓,基因精准编辑的难度要远高于基因失活。此外,本领域技术人员知晓,供体dna片段供体dna的长度对于基因组编辑的效率也有很大影响。供体dna片段供体dna同源臂长度增加可提高dna同源重组效率从而提高dna编辑效率,但多数真核野生菌株中其同源重组的效率很低,有时仅有百分之几的效率,主要是非同源末端连接系统发挥作用。而对于短同源臂的供体dna片段供体dna片段,其基因组编辑效率则更低。

然而,本发明的向导rna介导的基因组编辑系统相比于现有技术具备优异的基因组编辑能力。在具体的实施方式例中,利用本发明的基因组编辑系统获得的基因失活率高于95%,更优选达到100%。

本发明中,“同源臂”具有与本领域技术人员常规理解相同的意义,是指供体dna上位于靶序列两侧的、与基因组序列完全一致的侧翼序列,用于识别并发生重组的区域。因此,鉴于本发明的内容,本领域技术人员可以自行选择和决定同源臂的长度。同时,本领域技术人员也知晓,利用长同源臂获得的基因组编辑效率通常会高于利用短同源臂的。而相比于现有技术,本发明的显著优点在于可以进行基因精准编辑,特别是利用短同源臂的供体dna进行基因精准编辑的效率显著提高。

在一优选例中,所述crispr/cas9系统可利用15-3000bp的同源臂的供体dna进行基因精准编辑;在进一步的优选例中,所述crispr/cas9系统可利用20-200bp的同源臂的供体dna进行基因精准编辑,例如,供体dna的同源臂可以低于100bp,甚至低于40bp,更甚至低于20bp,而所述crispr/cas9系统利用短同源臂的供体dna进行基因组编辑的效率可以达到60%以上,甚至75%以上,更甚至95%以上。

基于5srrna在不同物种之间的高度保守性,本领域技术人员基于本发明公开的内容可以合理知晓,本发明的基因组编辑系统可以应用于各物种;所述真核生物包括但不限于:真菌、昆虫、植物、禽类、哺乳动物、鱼类;更优选地,所述真菌包括但不限于酵母、丝状真菌与大型真菌;所述昆虫包括但不限于果蝇、家蚕、秀丽线虫;所述植物包括但不限于拟南芥、烟草、水稻、小麦、玉米、大豆;所述禽类包括但不限于鸡、鸭、鹅,所述哺乳动物包括但不限于人类、小鼠、大鼠、家兔、猪、牛、马、羊、狗与猫,所述鱼类包括但不限于斑马鱼。

特别是,黑曲霉是重要的工业发酵微生物,在工业酶制剂与有机酸发酵方面应用广泛。因为黑曲霉出色的蛋白质分泌能力、强大的复杂多聚物的利用能力、极端的酸耐受性与鲁棒性等特点在本领域中得到尤其的重视。因此,在优选的实施方式中,本发明的基因组编辑系统尤其用于在黑曲霉中进行基因组编辑。

kusa基因失活菌株

在传统研究中,除增加同源臂的长度外,非同源末端连接修复系统(nhej)关键基因的失活可提高同源重组(hr)的效率。在黑曲霉kusa基因失活的菌株中,当同源臂为1500bp时,基因敲除效率可由29%提高至98%。但非同源末端连接修复系统(nhej)是主要的dna修复机制,其完全失活后细胞对外界刺激会更加敏感,遗传稳定性降低。kusa基因的暂时失活策略可解决这一问题。在本文中,“kusa基因失活菌株”与“kusa失活底盘菌株”具有相同的含义。

本发明中对nhej系统的关键基因kusa进行重新设计,在筛选标记amds两端各含有一段与kusa同源的同向重复序列,构成基因插入供体dna片段,以此为供体dna与cas9表达质粒、向导rna-kusa一起共转化黑曲霉ab4.1菌株,从而构建nhej失活菌株。以nhej失活菌株为底盘细胞,进行后续各种基因组编辑策略的测试。

本发明利用本发明的crispr/cas9系统构建出kusa失活的底盘菌株,进一步提高同源重组的效率。结合kusa失活底盘菌株,在超短同源臂的介导下,本发明的crispr/cas9系统高效快速实现基因组编辑。从而将kusa基因的失活底盘菌株与新型crispr/cas9系统结合后可进一步提升对基因组靶序列的精确编辑效率。

在本发明得到的nhej系统失活菌株中,短同源臂介导的基因组编辑具备显著的高效性与简便性。

在具体的实施方式中,利用含有不同长度同源臂的供体dna对nhej系统活性弱化的真核生物,特别是kusa基因失活的黑曲霉进行精确基因组编辑;优选地,同源臂长度为15-3000bp;更优选地,同源臂长度为20-200bp。在进一步的优选例中,供体dna的同源臂可以低于100bp,甚至低于40bp,更甚至低于20bp;而所述方法的基因组编辑的效率均可以达到100%。在具体的实施方式中,短同源臂因其构建简单而更为优选。

在具体的实施方式中,所述kusa失活底盘菌株包括但不限于真菌的菌株,所述真菌包括但不限于黑曲霉、米曲霉、烟曲霉、构巢曲霉、产黄青霉、里氏木霉、粗糙脉孢霉;优选黑曲霉。

本发明的优点:

1.通用性:利用5srrna(核糖体rna)基因本身包含内部启动子的特性,以5srrna基因作为启动子起始向导rna的转录而建立起新型的crispr/cas系统,这种设计思路中,由于5srrna(核糖体rna)在不同物种中保守性强,容易找到和构建,因而在不同物种中开发crispr系统时具有更大的通用性。另外,作为向导rna的新型表达方式,除了在crispr/cas9系统中用于基因组编辑外,也同样在crispr/ncas9系统与crispr/dcas9系统以及其他借助向导rna进行基因组定位的编辑或转录调控系统中具有通用性;

2.高效性:利用如5srrna作为启动子起始向导rna的转录,转录活性高,可在体内提供足量有活性的向导rna,显著提升cas9的定位与切割效率,从而大大提高基因组编辑效率,为高效基因组编辑技术奠定基础;

3.简便性:利用该新型crispr/cas9系统进行基于同源重组的基因组精确编辑时,可允许超短同源臂介导下的基因组定点编辑,大大减少了同源臂的前期构建工作,提高基因组编辑的简便性;

4.准确性:结合kusa失活底盘菌株,该新型crispr/cas9系统基于同源重组的dna精准编辑效率可进一步提高,在超短同源臂的介导下也可实现100%的精准编辑。该新型crispr/cas9系统结合kusa基因失活底盘菌株可显著提高基因打靶的准确性,为基因组上的原位定点突变、dna片段的插入、敲除与替换等基因组高效快速编辑奠定基础。

下面结合具体实施例,进一步详陈本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明详细条件的实验方法,通常按照常规条件如sambrook等人,分子克隆:实验室手册(newyork:coldspringharborlaboratorypress,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数按重量计算。本发明实施例中所用的实验材料如无特殊说明均可从市售渠道获得。

除非另行定义,文中所使用的所有专业与科学用语与本领域熟练人员所熟悉的意义相同。此外,任何与所记载内容相似或均等的方法及材料皆可应用于本发明中。文中所述的较佳实施方法与材料仅作示范之用。

实施例1.利用5srrna为启动子起始向导rna表达的新型crispr/cas9系统的建立

本实施例采用黑曲霉的5srrna作为启动子,以此来构建向导rna的表达盒。测试中以聚酮合成酶alba为靶基因,alba参与黑曲霉孢子色素的合成,alba基因失活将导致孢子白化,菌落呈现白色,而alba基因没有失活的菌株呈现为黑色菌落。白化菌落占所有菌落的比例,可以用来代表基因组编辑系统的效率。

1.1靶序列的选择

本发明选择alba基因的以下四个位点作为靶序列,用于新型crispr/cas9系统的基因组编辑效率的检测。具体序列如下:

向导rna-alba-188:agtgggatctcaagaactac(seqidno:1);

向导rna-alba-192:atttcctgactcggatggta(seqidno:2);

向导rna-alba-194:ctggagatgatgggaataac(seqidno:3);

向导rna-alba-196:tcgctacctaatccttgaag(seqidno:4)。

1.2cas9蛋白表达载体的构建

为实现cas9的核定位表达,在密码子优化后的嗜热链球菌(streptococcusthermophilus)cas9的n-端与c-端分别加入sv40的核定位信号(pkkkrkv)与核质蛋白的核定位信号(krpaatkkagqakkkk)。将优化后的cas9序列(ancas9)克隆至蛋白表达载体中,构建cas9的蛋白表达载体pcas9,具体载体图谱如图1所示。ancas9的表达盒由启动子pglaa与tglaa终止子组成。

带有核定位信号的ancas9的编码序列如下所示(seqidno:5):

注:黑色下划线字是密码子-优化的ancas9基因,斜体字表明5’-末端的sv40的nls序列和3’-末端的核定位信号。

1.3向导rna表达盒的设计与构建

本发明人采用黑曲霉自身的5srrna作为启动子来起始向导rna的表达,并以此构建向导rna的表达盒5srrna-sgrna,如图2所示。

5srrna-sgrna序列如下所示(seqidno:6):

aaacacatacgaccacagggtgtggaaaacagggcttcccgtccgctcagccgtacttaagccacacgccgggaggttagtagttgggtgggtgaccaccagcgaatcccttctgttgtatgaaaggacgaaacaccgggtcttcgagaagacctgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttttt

注:其中第1-118位表示黑曲霉(a.niger)5srrna(an12e05410)基因序列;第119-231位表示向导rna的骨架序列。第232-237位表示终止子;第140-145与148-153表示bbsi的识别位点(gaagac|gtcttc)。

向导rna表达盒5srrna-sgrna的构建采用融合pcr的方法完成。引物序列设计如表1所示。将462bp的5srrna序列及其上游序列采用5s-fm与5s-rm为引物以黑曲霉基因组为模板进行第一轮的融合pcr。108bp的向导rna的骨架序列采用sgrna-fm与sgrna-rm为引物进行第一轮的融合pcr。第一轮pcr反应体系为采用transgene的fastpfudna聚合酶的50μl反应体系,touchdownpcr反应条件为本领域常规反应条件。不同u6启动子的grna表达盒直接采用人工合成的方法获得。

表1.向导rna表达盒的构建所用引物

然后将第一轮的pcr产物稀释50倍后,取1ul作为第二轮pcr的模板。以5s-fm与sgrna-rm为引物进行第二轮的融合pcr,获得以5srrna为启动子的向导rna表达盒。第二轮pcr反应体系为采用transgene的fastpfudna聚合酶的50μl反应体系,touchdownpcr反应条件为本领域常规反应条件。

为方便后续不同靶序列的插入,将获得的向导rna表达盒克隆至peasy-blunt载体,标记为p5s-sgrna与p5s-hdv-sgrna,具体图谱如图3所示。

1.4不同靶序列的向导rna表达盒的构建

构建含有不同靶序列的向导rna-alba,采用靶序列双链合成后退火磷酸化直接连接至经过酶切与去磷酸化处理的向导rna表达盒克隆载体p5s-sgrna中。具体操作如下:

(1)向导rna表达盒克隆载体p5s-sgrna的bbsi酶切

首先,将向导rna表达盒克隆载体p5s-sgrna进行bbsi酶切,获得其含有特定粘性末端的载体酶切片段。酶切体系为采用fermentas的bbsi50μl反应体系,37℃酶切2h。酶切产物进行酶切产物纯化后进行后续操作,大小为4499bp。

(2)p5s-sgrnabbsi酶切片段的去磷酸化处理

为防止向导rna表达盒克隆载体p5s-sgrna的自连,将获得的含有特定粘性末端的载体酶切片段进行去磷酸化处理。去磷酸化体系为采用neb的cip50μl反应体系,37℃酶切30min。去磷酸化产物进行胶回收,大小为4499bp。

(3)靶序列的dna双链合成

为获得带有粘性末端的不同靶序列,将不同靶序列的双链以引物的形式进行合成,具体引物信息如表2所示。

表2.向导rna-alba不同靶序列的引物

注:小写字母为与p5s-sgrna载体进行互补配对的粘性末端,大写字母为不同的靶序列。

(4)不同靶序列单链引物的溶解

向各管引物中加入适当的去离子水,使其终浓度为2nmol/μl。例如,如一管引物含有10nmol的单链dna,则加入5μl的去离子水。在完成双链退火与磷酸化后,经稀释后可用于连接反应。

(5)不同靶序列的双链退火与磷酸化

由于引物合成后,在其5’-端并没有磷酸化的修饰,所以需在完成双链退火后,进行磷酸化处理。双链退火与磷酸化体系为采用neb的t4pnk50μl反应体系,反应条件为37℃磷酸化反应30min;95℃变性5min;缓慢降温至25℃(每min降低5℃)。去磷酸化产物可稀释后直接与处理后的载体酶切片段连接反应。

(6)不同靶序列的寡核苷酸与p5s-sgrna的连接与转化

将磷酸化后的不同靶序列的寡核苷酸稀释8倍,至终浓度为0.5nmol/μl与去磷酸化处理后的载体酶切片段进行连接反应。反应条件为22℃反应4h。将连接体系转化大肠杆菌dh5α感受态细胞,涂lb/amp平板。

(7)含有不同靶序列的p5s-sgrna-alba的菌落pcr与测序验证

挑取单克隆分别以进行不同靶序列的正向引物如alba-188-f与向导rna骨架的下游引物sgrna-rm为引物进行菌落pcr验证,目的条带大小为108bp。挑取阳性单克隆并在lb/amp液体培养基中37℃培养8h。提取质粒进行测序分析,结果表明成功构建不同靶序列的向导rna的质粒,其序列均与理论序列相一致。

1.5基于crispr/cas9的多元共转化系统

真菌的dna转化方法有peg-介导的原生质体转化法、孢子电击转化法与农杆菌介导的生物转化法。由于peg-介导的原生质体转化法可以高效地实现多种不同大分子化合物如质粒dna、线性dna片段、rna片段甚至大分子蛋白向原生质细胞的导入。因此本发明采用将cas9蛋白表达载体与向导rna-alba片段共转化至原生质细胞中,建立基于crispr/cas9的多元共转化系统,可实现不同靶序列向导rna-alba的快速验证,提高新型crispr/cas9系统的操作简便性。

(1)向导rna-alba片段的pcr扩增

向导rna-alba片段采用以5s-fm与sgrna-rm为引物以p5s-sgrna-alba为模板进行pcr而获得。引物序列设计如表1所示。pcr反应体系为采用transgene的fastpfudna聚合酶的50μl反应体系pcr反应条件为本领域常规反应条件。pcr产物进行pcr产物纯化后进行peg-介导的原生质体转化,大小为236bp。

(2)peg-介导的原生质体转化

按照文献carvalhoetal.2010的方法制备黑曲霉ab4.1的原生质体,然后在冰上向预先冷却的15ml离心管中加入100μl原生质体悬液、10μgpcas9与10μg向导rna-alba片段,向其加入1ml溶液c(tris-hcl10mm,cacl25.54g/l,peg600050%(w/v),ph7.5,过滤除菌)冰浴10min,2ml溶液b并混匀后作为实验组。在阴性对照组中,转化体系中不加向导rna-alba片段,其他操作与实验组相同。向3个融化的上层mmsa试管中各加入1ml上述混合液混匀并立即倒于mmsa平板中,将平板在30℃培养箱中培养3-5d直到长出转化子为止。

1.6不同启动子下的crispr/cas9系统基因组编辑效率的检测

在本发明的crispr/cas9系统中,以alba为测试基因,当以5srrna-sgrna来介导向导rna的转录时,在初级转化平板上可获得大量转化子,且分别与100%(49/49)均为发生基因失活的转化子,其基因组编辑效率最高可达100%,如图4所示。这表明以5srrna为启动子可启动向导rna高效转录,以保证胞内向导rna的丰度。

为进一步测试cas9介导的基因组编辑系统,明确不同靶序列对基因失活效率的影响。针对alba的不同外显子进行靶序列的设计,在第三外显子中选取了三个靶序列,在第五个外显子中选取了一个靶序列。利用黑曲霉新型crispr/cas9系统进行突变检测,结果发现对不同位点的基因失活效率均可达到100%,如图5所示。

实施例2.利用5srrna-核酶-向导rna表达盒的新型crispr/cas9系统的建立

为测试hdv核酶的作用,设计了以5srrna作为启动子,中间添加hdv为核酶完成向导rna转录的自我加工,以此来构建向导rna的表达盒5srrna-hdv-sgrna,如图2所示。为测试hh核酶的作用,设计了以5srrna作为启动子,中间添加hh为核酶完成向导rna转录的自我加工,以此来构建向导rna的表达盒5srrna-hh-sgrna,如图2所示。5srrna-hdv-sgrna与5srrna-hh-sgrna表达盒的构建采用融合pcr的方法完成。引物序列设计如表1所示。具体构建与黑曲霉转化过程如前所述,不再赘述。

5srrna-hdv-sgrna序列如下所示(seqidno:21):

acatacgaccacagggtgtggaaaacagggcttcccgtccgctcagccgtacttaagccacacgccgggaggttagtagttgggtgggtgaccaccagcgaatcccttctgttgtatgggacaacgaaatcggcctctgcaacctccacgtggtgttgtctgggaacctgatcaaaactaccgagtttgatcaggccaatgcagagaaaggacgaaacaccgggtcttcgagaagacctgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttttt

注:其中第1-118位表示黑曲霉(a.niger)5srrna(an12e05410)基因序列;第119-206位表示深绿木霉(trichodermaatroviride)drz-tatr-1核酶基因hdv(bk006897.1);第207-315位表示向导rna的骨架序列。第316-321位表示终止子;第224-229与232-237表示bbsi的识别位点(gaagac|gtcttc)。

5srrna-hh-sgrna序列如下所示(seqidno:22):

acatacgaccacagggtgtggaaaacagggcttcccgtccgctcagccgtacttaagccacacgccgggaggttagtagttgggtgggtgaccaccagcgaatcccttctgttgtatgnnnnnnctgatgagtccgtgaggacgaaacgagtaagctcgtccaccgggtcttcgagaagacctgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttttt

注:其中第1-118位表示黑曲霉(a.niger)5srrna(an12e05410)基因序列;第119-124位表示hh核酶中需与靶序列互补配对的六个碱基;第115-161位表示hh核酶基因(kj796498.1);第162-259位表示向导rna的骨架序列。第260-265位表示终止子;第168-173与176-181表示bbsi的识别位点(gaagac|gtcttc)。

在本发明的crispr/cas9系统中,以alba为测试基因,当以5srrna-hdv-sgrna来介导向导rna的转录与后加工时,在初级转化平板上可获得大量转化子,且分别96.16%(101/105)均为发生基因失活的转化子,其基因组编辑效率最高可达100%,如图4所示。当核酶为hh核酶时,也可成功实现向导rna的加工编辑,其基因组编辑效率也可达到93.75%(15/16)。这表明当向导rna的表达盒中存在hdv核酶或hh核酶时,均可成功实现向导rna的转录后加工,获得有活性构象的向导rna,引导cas9蛋白结合到特定位点实现高效的切割。

比对例1.利用u6启动子起始向导rna表达crispr/cas9系统

为与传统的u6启动子的效率进行比较,本发明人同时设计了一系列不同来源的u6启动子来介导向导rna的转录,将来源于人类的hu6序列在黑曲霉基因组与ncbi数据库中进行blast。然后选取来源于人类的hu6、来源于酵母的yu6以及黑曲霉自身的anu6的启动子起始向导rna的体内转录,以此分别来构建向导rna的表达盒phu6-sgrna、pyu6-sgrna与panu6-sgrna,如图2所示。

phu6-sgrna序列如下所示(seqidno:23):

gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagagataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtagaaagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcatatgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaaggacgaaacaccgggtcttcgagaagacctgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttttt

注:第1-253位表明人的rnu6的启动子区域;第254位表明转录起点;第255-351位表明向导rna的骨架序列;第352-357位表明rnu6基因的终止子;第260-265与第268-273位表明bbsi的识别位点。

pyu6-sgrna序列如下所示(seqidno:24):

gatcgataattctccataatagttctgttatttataatctccagcactaataaatgctatacgtatatttgtacacaatataatttcagaatttatattgctaccatgactgtctgagaattgggggaataacttgataattgttgggattccattgttcgtaaacgcaataatattaggtatatagaagatactaaatgttctctccgaggatataggaatgctcacaatggaatcgatatatttctacataatagtattgagattattcctcttttagttttatataattcattatcctattacattatcaatccttgcatttcagcttccattagacttaatgactgtttctcaatttttatgtcatcttcctggacctcatgtgatactataccagtagcatgaatactactgaatcgatgatactttagagtttcattgcaacagtttcaacacagcctggcatgaacagtggtaaaagtatttcgtccactattttcggctactataaataaatgtttttttcgcaactatgtgcaccgggtcttcgagaagacctgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttttt

注:第1-539位表明酵母菌的rnu6的启动子区域;第540位表明转录起点;第541-638位表明向导rna的骨架序列;第639-644位表明rnu6基因的终止子;第547-552与第555-560位表明bbsi的识别位点。

panu6-sgrna序列如下所示(seqidno:25):

cccaagcttgatcgataattcgccatggcggccgcgggaattcgattcccaagcttgatcgataattctccatcctgctcagacctcaccaccccggagcagccgcgtcgtagcaaccatcagcttccattaagactaatgactgtttctcaattctttatgtcatctttcctgaggaccggcctagagcggaaacacatgtgcagatcccttcatgtgatactataccagtagcatgaatacctactgggcattggcggtttaatcgatgatactttagagtttcatggcaatcagcaacagtttcaacaaccgccggtataaggcatgaacagtggtcaagtccgctgtaaagtatttcgtcctactatctcggctactataaataaatgttttttcgatctatgtgcaccgggtcttcgagaagacctgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttttt

注:第1-408位表明黑曲霉的rnu6的启动子区域;第409位表明转录起点;第410-507位表明向导rna的骨架序列;第508-513位表明rnu6基因的终止子;第416-421与第424-429位表明bbsi的识别位点。

值得一提的是,在选择u6启动子的过程中,虽然在ncbi数据库中检索到一条黑曲霉的u6snrna序列,但在黑曲霉cbs513.88中未能检索到u6snrna序列,这表明u6snrna的基因序列即使在同一物种的不同菌株中由于基因组注释的限制而存在无法有效鉴别的问题。采用来源于人类的hu6snrna(p330)、来源于酵母的yu6snrna(x12565.1)以及黑曲霉自身anu6snrna(ay136823.1)的启动子起始向导rna的体内转录,所构建的crispr/cas9系统,在初级转化平板上所获得的转化子分别为23.33%(7/30)、20%(1/5)、23.07%(3/13),如图4所示,与实施例1和实施例2相比,初级转化子明显偏少,且发生基因失活的转化子更少,表明其基因组编辑效率较低。通过比对可见,采用本发明的5srrna启动子构建的crispr/cas9系统,其基因失活效率提升了五倍,达到100%。

实施例4.超短同源臂介导下crispr/cas9系统的基因组定向插入编辑

在本发明的crispr/cas9系统的基础上,本发明实现了超短同源臂介导的基因组精准定位编辑,大大简化了基因精确编辑中供体dna片段的构建工作。在本实施例中,展示以40bp同源臂介导在alba基因特定位点靶向插入一段dna序列。

4.1alba基因供体dna片段的设计与构建

供体dna片段mhai-alba-hph携带有潮霉素抗性基因hph表达盒ptrpc-hph-ttrpc,供体dna片段上下游各有一个alba基因的同源序列,称为同源臂,长度分别为40bp。两个同源臂在alba基因中的同源位置分别紧邻cas9切割位点alba-188的上游与下游,具体设计与序列位置如图8所示。

mhai-alba-hph序列如下所示(seqidno:26):

cctccgcctcccagcctacaagtgggatctcaagaactacgacgttaactgatattgaaggagcactttttgggcttggctggagctagtggaggtcaacaatgaatgcctattttggtttagtcgtccaggcggtgagcacaaaatttgtgtcgtttgacaagatggttcatttaggcaactggtcagatcagccccacttgtagcagtagcggcggcgctcgaagtgtgactcttattagcagacaggaacgaggacattattatcatctgctgcttggtgcacgataacttggtgcgtttgtcaagcaaggtaagtgaacgacccggtcataccttcttaagttcgcccttcctccctttatttcagattcaatctgacttacctattctacccaagcatcgatatgaaaaagcctgaactcaccgcgacgtctgtcgagaagtttctgatcgaaaagttcgacagcgtctccgacctgatgcagctctcggagggcgaagaatctcgtgctttcagcttcgatgtaggagggcgtggatatgtcctgcgggtaaatagctgcgccgatggtttctacaaagatcgttatgtttatcggcactttgcatcggccgcgctcccgattccggaagtgcttgacattggggaattcagcgagagcctgacctattgcatctcccgccgtgcacagggtgtcacgttgcaagacctgcctgaaaccgaactgcccgctgttctgcagccggtcgcggaggccatggatgcgatcgctgcggccgatcttagccagacgagcgggttcggcccattcggaccgcaaggaatcggtcaatacactacatggcgtgatttcatatgcgcgattgctgatccccatgtgtatcactggcaaactgtgatggacgacaccgtcagtgcgtccgtcgcgcaggctctcgatgagctgatgctttgggccgaggactgccccgaagtccggcacctcgtgcacgcggatttcggctccaacaatgtcctgacggacaatggccgcataacagcggtcattgactggagcgaggcgatgttcggggattcccaatacgaggtcgccaacatcttcttctggaggccgtggttggcttgtatggagcagcagacgcgctacttcgagcggaggcatccggagcttgcaggatcgccgcggctccgggcgtatatgctccgcattggtcttgaccaactctatcagagcttggttgacggcaatttcgatgatgcagcttgggcgcagggtcgatgcgacgcaatcgtccgatccggagccgggactgtcgggcgtacacaaatcgcccgcagaagcgcggccgtctggaccgatggctgtgtagaagtactcgccgatagtggaaaccgacgccccagcactcgtccgagggcaaaggaatagagtagatgccgaccggatcgatccacttaacgttactgaaatcatcaaacagcttgacgaatctggatataagatcgttggtgtcgatgtcagctccggagttgagacaaatggtgttcaggatctcgataagatacgttcatttgtccaagcagcaaagagtgccttctagtgatttaatagctccatgtcaacaagaataaaacgcgtttcgggtttacctcttccagatacagctcatctgcaatgcattaatgcattggacctcgcaaccctagtacgcccttcaggctccggcgaagcagaagaatagcttagcagagtctattttcattttcgggagacgagatcaagcagatcaacggtcgtcaagagacctacgagactgaggaatccgctcttggctccacgcgactatatatttgtctctaattgtactttgacatgctcctcttctttactctgatagcttgactatgaaaattccgtcaccagcccctgggttattccctataccaacaacttctgcctgagcaagggcgctc

注:下划线标出alba-188的5’侧翼区域和3’侧翼区域;小写字母表明ptrpc-hph-ttrpc表达盒。

mhai-alba-hph的构建采用一步pcr的方法来完成。引物序列设计如表3所示。直接以mhai-alba-f与mhai-alba-r为引物以psilent-1为模板进行pcr扩增,来获得供体dna片段mhai-alba-hph。pcr反应体系为采用transgene的fastpfudna聚合酶的50μl反应体系touchdownpcr反应条件为本领域常规反应条件。pcr产物进行pcr产物纯化后进行peg-介导的原生质体转化,大小为1978bp。

表3.mhai-alba-hph的构建所用引物

4.2超短同源臂介导的基因精准编辑效率的检测

将含有超短同源臂的供体dna片段mhai-alba-hph、实施例1中构建的cas9表达质粒、向导rna-alba188一起共转化黑曲霉ab4.1菌株,过程原理如图6a所示。黑曲霉ab4.1菌株的原生质体制备和转化方法参考实施例1之1.5所述,在转化体系中除100μl原生质体悬液、10μgpcas9与10μg向导rna-alba片段外,再加入10μg供体dna片段mhai-alba-hph,其余操作均相同。转化的平板为不带潮霉素的mmsa培养基平板。3天后平板上白化菌落占所有菌落的比例为95.68%(111/116)。通过联合使用插入片段内部和外部的引物对随机挑选的转化子进行基因组的pcr检测,结果表明,crispr/cas9系统介导的同源重组可达到75%(图6b)。dna测序数据表明,供体dna片段非常准确地定位在所设计的同源臂处,未出现其他片段的插入或dna碱基缺失的现象。这是首次在黑曲霉中成功使用短同源臂实现基因插入失活,且效率非常高。采用短同源臂进行基因的插入失活,可大大减少长同源臂的供体dna片段的构建工作量,仅需用带有短同源臂的引物对筛选标记进行扩增即可。

实施例5.基于cas9基因与向导rna表达盒整合质粒的基因组编辑

在crispr/cas9系统中,cas9基因、向导rna表达盒等可以分别以独立的片段进行共转化,也可以构建为整合质粒。本发明测试了基于cas9-向导rna整合dna片段的crispr/cas9系统在基因失活与基因插入的编辑效率。下面具体针对alba基因的特定位点3s196的基因失活与靶向插入为例,进行论述。

5.1整合dna片段的设计与构建

将向导rna-alba-188的表达盒克隆至cas9的表达质粒pcas9上,构建整合质粒pcas9sgrna,具体设计如图7所示。

质粒pcas9sgrna的构建采用clonexpresstmmultis多片段一步克隆试剂盒(vazyme,c113)将向导rna-alba-188表达盒的pcr产物直接重组至pcas9的sbfi酶切片段中来完成。引物序列设计如表4。

表4.整合质粒pcas9sgrna的构建所用引物

首先,以5srrna-fm2-sbfi与向导rna-rm2-sbfi为引物,以p5s-sgrna-188为模板进行pcr扩增,获得向导rna-alba-188表达盒。pcr产物进行pcr产物纯化后进行后续操作,向导rna-alba-188大小为327bp。将cas9表达质粒pcas9进行sbfi酶切,获得其含有特定粘性末端的酶切片段。酶切产物进行纯化后进行后续操作。将纯化后的向导rna-alba-188的pcr片段与pcas9的sbfi酶切产物,采用clonexpresstmmultis多片段一步克隆试剂盒进行一步重组反应。然后将连接体系热激转化大肠杆菌dh5α感受态细胞,涂lb/amp平板。

5.2基因组编辑效率的检测

在针对alba的特定基因位点失活的基因组编辑中,直接将含有向导rna-alba-188表达盒的质粒pcas9向导rna转化至黑曲霉菌株ab4.1中。原生质体的转化方法如实施例1之1.5所述,转化体系为100μl原生质体悬液与10μgpcas9向导rna,其余操作均相同。结果表明,与向导rna-alba-188表达盒的pcr片段与pcas9质粒共转化的结果相似,在初级转化平板上也可获得大量转化子,在106个转化子中,仅有5个转化子为未发生编辑的黑色菌落,基因失活效率可达95.28%(101/106)(图8a)。

测试超短同源臂介导下质粒pcas9向导rna的dna精准编辑效率。将pcas9向导rna质粒与超短同源臂alba基因供体dna片段mhai-alba-hph进行共转化。原生质体的转化方法如实施例1之1.5所述,转化体系为100μl原生质体悬液、10μgpcas9向导rna与10μgmhai-alba-hph片段,其余操作均相同。结果表明,在初级转化平板上,获得86个转化子,仅1个为黑色孢子,基因组编辑效率为98.85%(图8b)。采用hph-f/hph-r对随机挑选的8个白色转化子进行基因型验证,结果如图8c所示,在8个转化子中有6个发生了精确的同源重组,这表明cas9-向导rna整合系统在野生型的菌株中基因精准编辑效率为75%,与实施例2中cas9、向导rna共转化的crispr/cas9系统的效率相似。

实施例6.利用新型crispr/cas9系统构建kusa失活底盘菌株

在真菌中,非同源末端连接系统nhej的失活可大大提高同源重组效率,但会影响细胞对外界刺激的敏感性。本发明对nhej系统的关键基因kusa进行改造,供体dna包含了筛选标记amds基因,在供体dna两端各有一段kusa的同源片段,以此为供体dna,与cas9表达质粒、sgrna-kusa表达盒共转化黑曲霉ab4.1菌株,从而构建nhej失活菌株。以nhej失活菌株为底盘细胞,进行后续各种基因组编辑策略的测试。

6.1kusa失活供体dna片段的设计与构建

nhej系统的关键基因kusa的失活供体dna片段lhai-kusa-amds的设计为在筛选标记amds两端含有kusa的上下游同源臂基因插入供体dna片段。

lhai-kusa-amds序列如下所示(seqidno:31):

attcgcctcttccatgacttcgagatccagctcatacagggtctcaatgtggtcgctggtgaaggcgatcggtacgaggacaatgtcggtctgtccacgcttcacgtactcttggacggtatcgcttgtctgcgctcccagccaagcccttggtccgacctgagactgccagcagaggcggtaagggttgctaaaattgagcctttgcatcaccgcatgcactgttgccgcaacctcggccgggtatggatcacctaaaggagaagttgtcggttagctaccgggagttggtcaccaagacccttgagactcacctctgttcacaacactcatgggcaaactgtgggccgagaacaagagaaccactccatttctcttatcttccggataggttttgagttgatcctcaatgtttctcgcaaacgcctccacaaggccagggtgcgtaggccatctgtcgataacgctccactggatagctccggaagtgtccacgtttccgtttgctcgcttgccctccagccgattcctccatttccacagctcattcagagagctacccgtagtagaacaggaatactgggggtattgtgagaacgcgaccgcacgaccgcccttcccattgccaaagccatcttccagcaattgtgtgtacatttgttccgtcagcgggttggcgtaacggaaggcaacgtacggcttgtgaggcgcagtctccgggttgatcttgtccagcagcttgcacatttccttgcattggtattccgaccattttcttatgggtgagcctccgccgatgtccgcatactgcttttgaatcttgggtgtgcgtcgtttcgaaataagaggcccgaggtaatgctggaacttgccaagaggaatcaaatcgccgtcggccttgaatagaagtagaatgttagaaacgtagcaaccagaatgacagcttgccatagtcggagacgtacaaagagccggctgaggaaatcctctacttcgtctgtcgtcgagggccctcccatgttcaggaagaccatggctgtagggcccttagagcctgttgcatcctgggtaaccggaggcactgttgttgccagcccacatctttgttcttgcttgtatccgaacagggtgcgagaagccggtcgcagcaattgccggggcagggtaaacgggcggcggagagccatgacaggtaattgtactgaattcggttgacctagtcaatggaggtaataagaaaagaccgttcgtatcgcgcaagcagatgaactattcacgccgcattaaatattcaaaagatagacgagtggcaagaacaggtagtgggtgtatacaacagcgcaaggccttctggaagctgaaaagtccagaacggcttgatgacggagcaccgagaccacgaccaactccgactcccgacagccaatgaccggccagctagcgtcatcaattaccgggcggacatcacatgatgttcgtgtctccccgcgtctttctgcccaccggtttgatcgcgtccctcgcgaccggatccagtgacgatatagatagatctatctccggctgcaggcagcagaggccaaacaggcagacacaacagccccacttgttcctggttacgattcaagttgtcttaacctttatacttccctctttcaatttcgataatatcttgaatgctttaaacgattccacaacattctactatggcggacggcaacccacatcgggaagatgaggcggccgaggaagaagaggagattgatgagactgtacgcaaatttacccatgaacttggactggaactctggaactgacaataagatcagagctacaaaccagtcaaagatgcggtcctcttcgcaatcgatgtcagcgattccatgttgattttgaatagctcgcccgctggagagcatcctgaatgcaagtaacaaccgtagaggctgacacggcaggtgttgctagggagcgtcgtgttctacaaggccagacgtcttcgcggttgatatatatgtatgtttgactgcaggctgctcagcgacgacagtcaagttcgccctcgctgcttgtgcaataatcgcagtggggaagccacaccgtgactcccatctttcagtaaagctctgttggtgtttatcagcaatacacgtaatttaaactcgttagcatggggctgatagcttaattaccgtttaccagtgccgcggttctgcagctttccttggcccgtaaaattcggcgaagccagccaatcaccagctaggcaccagctaaaccctataattagtctcttatcaacaccatccgctcccccgggatcaatgaggagaatgagggggatgcggggctaaagaagcctacataaccctcatgccaactcccagtttacactcgtcgagccaacatcctgactataagctaacacagaatgcctcaatcctgggaagaactggccgctgataagcgcgcccgcctcgcaaaaaccatccctgatgaatggaaagtccagacgctgcctgcggaagacagcgttattgatttcccaaagaaatcggggatcctttcagaggccgaactgaagatcacagaggcctccgctgcagatcttgtgtccaagctggcggccggagagttgacctcggtggaagttacgctagcattctgtaaacgggcagcaatcgcccagcagttagtagggtcccctctacctctcagggagatgtaacaacgccaccttatgggactatcaagctgacgctggcttctgtgcagacaaactgcgcccacgagttcttccctgacgccgctctcgcgcaggcaagggaactcgatgaatactacgcaaagcacaagagacccgttggtccactccatggcctccccatctctctcaaagaccagcttcgagtcaaggtacaccgttgcccctaagtcgttagatgtccctttttgtcagctaacatatgccaccagggctacgaaacatcaatgggctacatctcatggctaaacaagtacgacgaaggggactcggttctgacaaccatgctccgcaaagccggtgccgtcttctacgtcaagacctctgtcccgcagaccctgatggtctgcgagacagtcaacaacatcatcgggcgcaccgtcaacccacgcaacaagaactggtcgtgcggcggcagttctggtggtgagggtgcgatcgttgggattcgtggtggcgtcatcggtgtaggaacggatatcggtggctcgattcgagtgccggccgcgttcaacttcctgtacggtctaaggccgagtcatgggcggctgccgtatgcaaagatggcgaacagcatggagggtcaggagacggtgcacagcgttgtcgggccgattacgcactctgttgagggtgagtccttcgcctcttccttcttttcctgctctataccaggcctccactgtcctcctttcttgctttttatactatatacgagaccggcagtcactgatgaagtatgttagacctccgcctcttcaccaaatccgtcctcggtcaggagccatggaaatacgactccaaggtcatccccatgccctggcgccagtccgagtcggacattattgcctccaagatcaagaacggcgggctcaatatcggctactacaacttcgacggcaatgtccttccacaccctcctatcctgcgcggcgtggaaaccaccgtcgccgcactcgccaaagccggtcacaccgtgaccccgtggacgccatacaagcacgatttcggccacgatctcatctcccatatctacgcggctgacggcagcgccgacgtaatgcgcgatatcagtgcatccggcgagccggcgattccaaatatcaaagacctactgaacccgaacatcaaagctgttaacatgaacgagctctgggacacgcatctccagaagtggaattaccagatggagtaccttgagaaatggcgggaggctgaagaaaaggccgggaaggaactggacgccatcatcgcgccgattacgcctaccgctgcggtacggcatgaccagttccggtactatgggtatgcctctgtgatcaacctgctggatttcacgagcgtggttgttccggttacctttgcggataagaacatcgataagaagaatgagagtttcaaggcggttagtgagcttgatgccctcgtgcaggaagagtatgatccggaggcgtaccatggggcaccggttgcagtgcaggttatcggacggagactcagtgaagagaggacgttggcgattgcagaggaagtggggaagttgctgggaaatgtggtgactccatagctaataagtgtcagatagcaatttgcacaagaaatcaataccagcaactgtaaataagcgctgaagtgaccatgccatgctacgaaagagcagaaaaaaacctgccgtagaaccgaagagatatgacacgcttccatctctcaaaggaagaatcccttcagggttgcgtttccagtctagcgcctcgcccctcagcagatcctaagaaacacacccaagaatcacccaccacggcagcgctcaaatgcgcctatcacttcatgcaacaacgaatcatatcaaatccacaagacatgatgggtgttttgctgttcgggacccaggcgtccaagttctttgaagaagatgaagacagtcggggagacctgtcctaccccaactgctacctcttcactgatctggatgttccttcggctcatgaggtcaaagaacttcgagcactggtagatgatgaaggagactcaagggaggttctatctccagcgaaagagcaggtctctatggcaaacgtcctattttgcgccaaccagatattcacatccagagcgccaaatttcctctcccggcgtttgttcatcataaccgacaatgacaacccccatggtgatgataaaaccctgcggtcagcggcgactgtacgtgctaaggatctttacgatcttggtgtcacaattgagctgtttccgatctcacgccctgagcatgagttcaagaacagcaagttctatgacgtaagctatcatactctatagcaaagtggcaggggtcgatactcactacagatacaaaggatattatctacaagtcattgcccagcgatccagaggcgcctgcatatctacaatctgattcaaaagcggcgactgcgaccggggacgggatttcactcctcaacacgcttctgtccagtattaattcgagaacggttccgcgtcgcactcatttttcgaacatgcctttagaacttggcccagacttcagaatttcggtatcgggctatatactcttacgaaggcaagcgcccgctagaaactccttcatctggctgaacggcgagaagcctgtggtcgcgaaaggagtgacttcccactccgcagatgatactggccggactgtcgagaaatgggagatcagaaaggcatataagttcggtggcgaccaagtaaccttttcgcctgatgagcagaaggcgcttagggatttcggtgagccagtaatccgggttattgggttcaagcctatcactgcgcttccattctgggcaaacgtcaagcacccatattttatctatccatccgaggaagactatgtaggctcctcgcgagtattttccgcattgcatcagactcttttgcgttccaagaagatggcactcgtctggttcattgcacgcaagggtgctggccccgttctcgccgctatgatcgcaggcgaagaaaagcttgatgagaatggcgtacaaaaataccctcctggcatgtggattcttcccctccccttcgcagacgatatccggcagaaccccgaaacaacgttgaatgtcgccccggagtcattgattgatcagatgcgcgtggtcgtccagcaactgcagctgccgaagggagtgtacgagcctctcaaataccccaatccatgtaagtcactgctgtcttgcattgctcgtatacgatgaacgagaagttgacagcccgtgatcagcccttcaatggcattaccgcatcctacaagctctcgcattagacgaagatctccctgaaaaaccagaagacaaaaccattccgaaataccgccaaatcgacaaggtaaaaccactacacccaagaaacaaccctccacgcattcaacctactgacaattgcaccgcagcgcgccggtgactacgtattatcctgggccgacgaactcgaaaagcaatacgccaaaacctcagcagcggcccctcgcccaaccagcaccctcgtgaaacgaggatcaaaagaccgagcaagcgaaaccgaggactccaag

注:下划线字表示kusa的5’侧翼区域和3’侧翼区域;黑色小写字母表示pglaa-amds-ttrpc表达盒。

6.2kusa失活供体dna片段的构建

kusa的失活供体dna片段lhai-kusa-amds的构建先采用clonexpresstmmultis多片段一步克隆试剂盒(vazyme,c113)来完成多片段体内拼接,构建出无同向重复序列的供体dna片段;然后再采用酶切连接的方法将同向重复序列插入至amds的下游,完成整个供体dna片段的构建,具体设计如图9a所示。引物序列设计如表5所示。具体操作如下:

(1)各供体dna片段的pcr扩增

首先,以kusa-up-fm与kusa-up-rm为引物,以黑曲霉基因组为模板进行pcr扩增,获得供体dna片段的上游同源臂kusa-up;以kusa-down-fm与kusa-down-rm为引物,以黑曲霉基因组为模板进行pcr扩增,获得供体dna片段的下游同源臂kusa-down;以amds-f与amds-r为引物,以pgm为模板进行pcr扩增,获得供体dna片段的筛选标记amds的表达盒。引物如表5所示,pcr反应体系为采用transgene的fastpfudna聚合酶的50μl反应体系,touchdownpcr反应条件为本领域常规反应条件。pcr产物进行pcr产物纯化后进行后续操作,kusa-up大小为1890bp,kusa-down大小为1830bp,amds的表达盒大小为2621bp。

表5.lhai-kusa-amds的构建所用引物

(2)载体peasy-blunt的反向pcr

以peasy-blunt-f与peasy-blunt-r为引物,以p5s-sgrna为模板进行该载体的反向pcr扩增,获得peasy-blunt的线性化载体骨架。具体引物序列如表5所示,pcr反应体系为采用transgene的fastpfudna聚合酶的50μl反应体系,touchdownpcr反应条件为本领域常规反应条件。pcr产物进行pcr产物纯化后进行后续操作,peasy-blunt的线性化载体骨架大小为3830bp。

(3)各dna片段与peasy-blunt线性化载体的重组与转化

将纯化后的各pcr产物kusa-up、amds的表达盒与kusa-down共同与peasy-blunt线性化载体采用clonexpresstmmultis多片段一步克隆试剂盒进行一步重组反应。反应条件为37℃反应30min。然后将连接体系热激转化大肠杆菌dh5α感受态细胞,涂lb/amp平板。

(4)打靶载体plhai-kusa-amds的菌落pcr与测序验证

挑取单克隆分别以peasy-blunt的载体引物如m13f与m13r为引物进行菌落pcr验证,目的条带大小为6389bp。挑取阳性单克隆并在lb/amp液体培养基中37℃培养8h。提取质粒进行测序分析,结果表明成功构建针对kusa的打靶质粒,其序列均与理论序列相一致。

4.3向导rna-kusa-198表达盒构建

针对kusa基因设计了其靶序列kusa-198,的双链以引物的形式进行合成,具体引物信息如表6所示。p5s-sgrna的bbsi酶切与去磷酸化、靶序列的引物溶解、双链退火与磷酸化以及连接转化等分子实验操作如实施例1.4所述。

表6.kusa-198靶序列的引物

4.4kusa失活底盘菌株的构建

以plhai-kusa-amds为供体dna,与cas9表达质粒与向导rna-kusa-198共转化黑曲霉ab4.1菌株。随机选取10个转化子,以amds内外引物进行pcr扩增。结果表明,本发明的crispr/cas9系统成功实现了野生型ab4.1菌株kusa的插入失活,其精准基因组编辑效率可达到80%以上,如图9b所示。由测序结果可见,供体dna片段非常准确地定位在所设计的同源臂处,并无其他未知dna的插入或个别碱基的丢失与插入。

实施例7.kusa失活底盘菌株中长同源臂介导下新型crispr/cas9系统的基因组编辑

在本发明crispr/cas9系统的基础上,针对大片段的基因敲除,本发明设计采用双向导rna-alba的策略,通过cas9同时在两个位点的切割,为同源重组提供游离的dna末端,增加与供体dna的可及性,来实现了超短同源臂介导的基因组精准定位编辑。为进一步的提高同源重组的效率,在kusa失活底盘菌株中实现了特定位点的大片段dna的精确敲除。在本实施例中,以同源臂的长度设计为2.5kb的长同源臂打靶片段,结合kusa失活的底盘菌株,利用本发明的crispr/cas9系统在alba基因特定位点进行大片段dna敲除。

7.1长同源臂的大片段dna敲除打靶片段的设计

长同源臂alba大片段dna敲除打靶片段lhad-alba-hph序列中,上下游同源臂位置分别分别位于alba基因的上游与下游,上游同源臂位于靶序列alba-192的上游1163bp与靶序列alba-196下游,具体设计与序列位置如图10所示。

lhad-alba-hph序列如下所示(seqidno:42):

actgtagcagcggagtaagatggaaggttgtcattccagccaggctcgaggatacacgtgccacccacaagtttacgacccaacctggaacacgctagtctagtaaatcacctggcagttttctcaaccgggcgttagattgcgcttgtctacaattaatactgtacagcgaaatttgtcttctattgtgtgacatcaactaatagtccaggtctcatgatgcttactggcacaggtatccgaccaaagaagttcttccttcggaagtatgggtggaagggtacgcggttcggaaaagtctctgcagcgtcgacaacagaaccaccaaggttcacgagaggctcacgccaagtaaccttattgagacccgtatccgggatggctggtaccagatggcttgtgtgctacttcttattgacagtaagcgtctttgtcgattgtgtttgctcgctcctgcgtacggaggattgtaagctgatagtctcgtggaccataacgtgacatgatattccaggaaatcagagagctgacaaatacatctgaacctgctagataggcctacgttgtcttctgtatcctttgctgagacatgtttgggattatcctccattgttaagggtttccgaagccgagggatatgcactatatttatcggaccacacatgatccttgagcaaaccactgctcctatgactaagaacgcttgataaacccactgcgaggcttttcgggagaggcttggcaatgtctcactaccagatcatagggataccgcctcttggttcatacttcctgcattggcttcttctgcaaacagcccattttcagctgtctagcctgaccatgctgaccgtaatgagggataacaataggcttgaaagttgctgatggtgtgtaagattgactaacctctaggaatacttatgaaaatgccaactcagaacaaatttggaccgcaatggcacgagtggaacgcagggtggcagcacggcttatgaaccttatcaatgcgacgcctcgagaggggcctcaaatacctgtctaggatcacacattctcggaggttaaagttctagtttggttattcgggcgagttattgaaccttgacatttgtgggacacatgtcaagcatgacccgccactcgaatggaaggttcggtggctgaagcaaatttgagacgatcctgattcaacacaaacccctcgagccctgccatcagagctgtccgagcacggtgtgcaagagctctgccagttaaactactcagtactagccaaatggtactcagcatgttggttatatattcgagcatcatgcagggtttcaaaccaggggaaggagtgcagagtcgagtcgaacctgcaggatactgaacaagccgtgaactaaaacagttcatatccctagcaaggcaaatgaaccggccatgctcgagaaccgggtagatatggcaggaagaatgatccgtcggtcaggctgcttcgagcatgtcatgtcaccactactactccaccgactacattccagcaacaataaccttgtttctccagacatcgttcgctgactagtttgtccgagtttcggaagttgaataagccaacatacacttcgggggatctcgttggtagaaaacgcaaggtacatgcagggcagcagggcacggatcttgactgcctggtctttcggcatgcgtctttctgcgtctttcccaccgatatcatcggcgaagcgagaaatccttcggcctggcccgtggaattttgtgtctcatgcctagggaggaaagatgttaggggaatcttcaccccagacttctttgtcgtttgtcacgtgctcgctgcaacctgctgatcgtcgccaaatggggcggcgacgactttcctctgtaggactccttcccccctagccaaacggacgctgctcgccatcgcaacgccgtcccttgatgcatctccagaacacggctgcctagttgttcgattaccaccagaagcaggggttgagacaccgatatccccttgataaacgttgtggcctgacggttgaggtagccccacaggatgtcggcctcatggaccagagtcccaagtctagaatttccaaacagggtaactccacagagtgcccagatggtgtgctcctgatccaccgccatggttgtgtccattcacagccagtccctgtcagtatgcgaaggatccccagaagcggaaactgaaggatactactggaagctcaccagaacaatttagtgcctgtcaactaattgtaacatcacgattcgctgcatgtgttgcaatgcaacccaattgagctgctctgctgaattcaactctttacaatcgccccctagatgcgccatggaatgcaccttaaccagttcagcgcatgccgtagttgagacaccctcccccacctagctatgggggccttaaatctacatgtgtataaagtgtgcgtctcatcgacacggatgtggaaggccagatggactttggtctgacaacggcgattgaccgatcaatagacatcttccgcaaacatggagggtccatctcgtgtgtacctttttggagaccagaccagcgacatcgaagctggcctgcgccgtctgctccaagcgaagaatagtaccattgtttaaacgacgttaactgatattgaaggagcactttttgggcttggctggagctagtggaggtcaacaatgaatgcctattttggtttagtcgtccaggcggtgagcacaaaatttgtgtcgtttgacaagatggttcatttaggcaactggtcagatcagccccacttgtagcagtagcggcggcgctcgaagtgtgactcttattagcagacaggaacgaggacattattatcatctgctgcttggtgcacgataacttggtgcgtttgtcaagcaaggtaagtgaacgacccggtcataccttcttaagttcgcccttcctccctttatttcagattcaatctgacttacctattctacccaagcatcgatatgaaaaagcctgaactcaccgcgacgtctgtcgagaagtttctgatcgaaaagttcgacagcgtctccgacctgatgcagctctcggagggcgaagaatctcgtgctttcagcttcgatgtaggagggcgtggatatgtcctgcgggtaaatagctgcgccgatggtttctacaaagatcgttatgtttatcggcactttgcatcggccgcgctcccgattccggaagtgcttgacattggggaattcagcgagagcctgacctattgcatctcccgccgtgcacagggtgtcacgttgcaagacctgcctgaaaccgaactgcccgctgttctgcagccggtcgcggaggccatggatgcgatcgctgcggccgatcttagccagacgagcgggttcggcccattcggaccgcaaggaatcggtcaatacactacatggcgtgatttcatatgcgcgattgctgatccccatgtgtatcactggcaaactgtgatggacgacaccgtcagtgcgtccgtcgcgcaggctctcgatgagctgatgctttgggccgaggactgccccgaagtccggcacctcgtgcacgcggatttcggctccaacaatgtcctgacggacaatggccgcataacagcggtcattgactggagcgaggcgatgttcggggattcccaatacgaggtcgccaacatcttcttctggaggccgtggttggcttgtatggagcagcagacgcgctacttcgagcggaggcatccggagcttgcaggatcgccgcggctccgggcgtatatgctccgcattggtcttgaccaactctatcagagcttggttgacggcaatttcgatgatgcagcttgggcgcagggtcgatgcgacgcaatcgtccgatccggagccgggactgtcgggcgtacacaaatcgcccgcagaagcgcggccgtctggaccgatggctgtgtagaagtactcgccgatagtggaaaccgacgccccagcactcgtccgagggcaaaggaatagagtagatgccgaccggatcgatccacttaacgttactgaaatcatcaaacagcttgacgaatctggatataagatcgttggtgtcgatgtcagctccggagttgagacaaatggtgttcaggatctcgataagatacgttcatttgtccaagcagcaaagagtgccttctagtgatttaatagctccatgtcaacaagaataaaacgcgtttcgggtttacctcttccagatacagctcatctgcaatgcattaatgcattggacctcgcaaccctagtacgcccttcaggctccggcgaagcagaagaatagcttagcagagtctattttcattttcgggagacgagatcaagcagatcaacggtcgtcaagagacctacgagactgaggaatccgctcttggctccacgcgactatatatttgtctctaattgtactttgacatgctcctcttctttactctgatagcttgactatgaaaattccgtcaccagcccctgggttgtttaaactgatgccgctcgctacctaatccttgaagagggcgaacaggttgaccgattgcttcttcttgactcgcccttccccattggcttagagaagttgcccactcggctgtacggcttcatcaactcaatgggtctctttggtgaaggcaacaaggctcccccggcctggttgctccctcatttcctggccttcattgattccctcgatacctacaaggccgtccccctcccctttgacgatccgaagtgggccaagaagatgccaaagacattcatggtctgggccaaggacggtatctgcagcaagccggatgacccgtggcccgagccggacccggacggcaagccggacacgagagagatggtctggctcctcaagaaccggaccgacatgggacccaacaagtgggacacactcgtcgggccccaaaacgtcggtggaatcactgtgatagagggtgcgaatcatttcaccatgactttgggacccaaggctaaagaattgggctcgttcattggcaacgccatggccaattaaattgttatgcattacgccttcctccaagactcgcgctaggactgacaacactaccatcctattgatggaactcgcataataatccactaatgctggtgttgtaccccctcaggattcaagcacactattgttgtgattgcaatcggcgaattccgtggtgctaatggtctacctggttccgggttccttggagtgaagtgatgatgttgatgaaaaagacgaacgatgtgatatacgaacccctcatgtcatttgctacatccttatcggagttagttgatatgtctcatctacgtacctatgttacttgatttatgatagaatgccaatacgaaaaaaaagtcatatcaaatcagtgcccatgcccaatttgtgataagaatagagcactcgtagaatggaaaattgggagtctcacatctcccataacctagactaaccgataatacaaaacctctgcaagtttagatggtgactagaaccccaacaacactggcaccgcaatcggcgataggaaacaaagaaacgtcccgatgaatgcaaggtaatccatctattccatctcatatcgagatgaatgcatagcatgcacagtatgcatgtgagcatggataggagactaaagaggatggtgggaacgaatttgtttgtatgtttcattgggttgattggttatctggttgaacttctaatgcactgtaacccaatctagtcactcctgggagggacagaacaagaccaggacttagcagcgcgtaaatactgagtaagaagatgcatatggtggacattcactccgcacctacatacatgatgggaagggaggaagagagacaagatgaagctgatttagaggattattcggtaatcgggatgagatcggcgaggtatatgcactgtatgctgcggtggtcgggtaagtttgatggagcaggtagatagggaggcggggggaggtgatagataggatagataggcagggagtagtatgaacagggaaagagaacctgatgcagagccgaaataggtatgtatgcatgaatgtatgcaaggaggcgaatacgagggaggccgaacgtcgattgatgagtggcgtctgggtcggttggtggttggctgatggactgacggatcggtcgaattggaaggaagaagttggtaggtagtgagaggtagggtggtatcgatgtatcgaactaaagaggcatttcggagctgaatctgagcgcactaccgcgacctgcaagcgatgaaccattgttgatgccaggactcgtgggccggctattacctgcagtccatttggggcttcgcggctgtgtgctggttgagcgagtggacgggcgatttttccgaatttcccgaagttcttcttccttccggcggagcagatcttcgcgggacgtgagggttgcttcgagttcgagaacccgcgcgagatggcgggcttcgtcgttcttcgcgttgagttcgcgcagatgggtggcgtctccttcgaccttccgtttcagggtttcgttctcgctgcgcagttggcgaagctcgttgcctgattgtgcggccactgtcgaggcggtctggtactgttcgcgcgtgtattccgcttgtcgggcttcgtactcggctttgcgttctagcgatgcattgtctttagtcagacgccgaatgtcttcccttgctgattcgagttcggctgcgctgcccccgcctgctttgagggatgcgcgggcctcttcgagttcgtgtcggagctgggtccgttcgtccttcaatttcatgagctcttccttctgcttttcgactcgctggtcggatgtggtcttagcttgggtgagacggtcatgctcccgtcggagtttgtggaagtctttggttcttgtctcgtaacggtgctgcagcttttccagcacgttctctctttcctgaagacgggcttgggctcc

注:下划线表示alba的5’侧翼区域和3’侧翼区域。黑色小写字母表示ptrpc-hph-ttrpc表达盒。

7.2长同源臂的大片段dna敲除打靶片段的构建

长同源臂的大片段dna敲除打靶片段lhad-alba-hph的构建采用clonexpresstmmultis多片段一步克隆试剂盒(vazyme,c113)来完成。引物序列设计如表7所示。具体操作如下:

(1)各打靶片段的pcr扩增

首先,以alba-up-fm与alba-up-rm为引物,以黑曲霉基因组为模板进行pcr扩增,获得打靶片段的上游同源臂alba-up;以alba-down-fm与alba-down-rm为引物,以黑曲霉基因组为模板进行pcr扩增,获得打靶片段的下游同源臂alba-down;以hph-fm与hph-rm为引物,以psilent-1为模板进行pcr扩增,获得打靶片段的筛选标记hph的表达盒。pcr反应体系为采用transgene的fastpfudna聚合酶的50μl反应体系,touchdownpcr反应条件为本领域常规反应条件。pcr产物进行pcr产物纯化后进行后续操作,alba-up大小为2640bp,alba-down大小为2478bp,hph的表达盒大小为1914bp。

表7.lhad-alba-hph的构建所用引物

(2)载体peasy-blunt的反向pcr

以peasy-blunt-f与peasy-blunt-r为引物,以p5s-sgrna为模板进行该载体的反向pcr扩增,获得peasy-blunt的线性化载体骨架。具体引物序列如表5所示。pcr反应体系为采用transgene的fastpfudna聚合酶的50μl反应体系,touchdownpcr反应条件为本领域常规反应条件。pcr产物进行pcr产物纯化后进行后续操作,peasy-blunt的线性化载体骨架大小为3830bp。

(3)各dna片段与peasy-blunt线性化载体的重组与转化

将纯化后的各pcr产物alba-up、hph的表达盒与alba-down共同与peasy-blunt线性化载体采用clonexpresstmmultis多片段一步克隆试剂盒进行一步重组反应。反应条件为37℃反应30min。然后将连接体系热激转化大肠杆菌dh5α感受态细胞,涂lb/amp平板。

(4)打靶载体plhad-alba-hph的菌落pcr与测序验证

挑取单克隆分别以peasy-blunt的载体引物如m13f与m13r为引物进行菌落pcr验证,目的条带大小为7097bp。挑取阳性单克隆并在lb/amp液体培养基中37℃培养8h。提取质粒进行测序分析,结果表明成功构建含有长同源臂针对alba的打靶质粒,其序列均与理论序列相一致。

7.3长同源臂介导的基因精准编辑效率的检测

将长同源臂alba大片段dna敲除打靶片段lhad-alba-hph为供体dna与cas9表达质粒以及两个sgrna-alba一起共转化黑曲霉kusa失活菌株dkusa,从而测试在kusa失活的遗传背景下的同源重组效率。原生质体的转化方法如实施例2.5所述,分别制备kusa失活菌株dkusa的原生质体,在转化体系中分别加入100μl原生质体悬液、10μgpcas9,5μgsgrna-alba-192,5μgsgrna-alba-196片段与5μglhad-alba-hph片段,其余操作均相同。

在kusa失活的菌株中,该新型crispr/cas9系统在长同源臂的打靶片段下介导的同源重组下的基因组编辑效率可高达100%,说明kusa的存在还是会影响同源重组的效率,kusa基因失活后,基因组编辑的效率可有5倍的提升,如图10所示。这表明该新型crispr/cas9系统结合kusa基因失活底盘菌株可显著提高基因打靶的准确性,为基因组上的原位定点突变、dna片段的插入、敲除与替换等基因组高效编辑奠定基础。

实施例8.kusa失活底盘菌株中超短同源臂介导下的基因组编辑

在新型crispr/cas9系统的基础上,为简化基因精确编辑的敲除供体dna片段构建工作,本发明实现了超短同源臂介导的基因组精准定位编辑。为进一步的提高同源重组的效率,在kusa失活的底盘菌株中实现了特定位点的大片段dna的精确敲除。下面具体以同源臂的长度设计为40bp,结合kusa失活的底盘菌株,利用新型crispr/cas9系统在alba基因特定位点的大片段dna敲除为例,进行论述。

8.1大片段dna敲除供体dna片段的设计与构建

超短同源臂alba大片段dna敲除供体dna片段mhad-alba-hph序列中,上下游同源臂位置分别紧邻靶序列alba-192的上游与靶序列alba-196下游,具体设计与序列位置如图11a所示。

mhad-alba-hph序列如下所示(seqidno:49):

atcattggtatgtctggaagatttcctgactcggatggtgacgttaactgatattgaaggagcactttttgggcttggctggagctagtggaggtcaacaatgaatgcctattttggtttagtcgtccaggcggtgagcacaaaatttgtgtcgtttgacaagatggttcatttaggcaactggtcagatcagccccacttgtagcagtagcggcggcgctcgaagtgtgactcttattagcagacaggaacgaggacattattatcatctgctgcttggtgcacgataacttggtgcgtttgtcaagcaaggtaagtgaacgacccggtcataccttcttaagttcgcccttcctccctttatttcagattcaatctgacttacctattctacccaagcatcgatatgaaaaagcctgaactcaccgcgacgtctgtcgagaagtttctgatcgaaaagttcgacagcgtctccgacctgatgcagctctcggagggcgaagaatctcgtgctttcagcttcgatgtaggagggcgtggatatgtcctgcgggtaaatagctgcgccgatggtttctacaaagatcgttatgtttatcggcactttgcatcggccgcgctcccgattccggaagtgcttgacattggggaattcagcgagagcctgacctattgcatctcccgccgtgcacagggtgtcacgttgcaagacctgcctgaaaccgaactgcccgctgttctgcagccggtcgcggaggccatggatgcgatcgctgcggccgatcttagccagacgagcgggttcggcccattcggaccgcaaggaatcggtcaatacactacatggcgtgatttcatatgcgcgattgctgatccccatgtgtatcactggcaaactgtgatggacgacaccgtcagtgcgtccgtcgcgcaggctctcgatgagctgatgctttgggccgaggactgccccgaagtccggcacctcgtgcacgcggatttcggctccaacaatgtcctgacggacaatggccgcataacagcggtcattgactggagcgaggcgatgttcggggattcccaatacgaggtcgccaacatcttcttctggaggccgtggttggcttgtatggagcagcagacgcgctacttcgagcggaggcatccggagcttgcaggatcgccgcggctccgggcgtatatgctccgcattggtcttgaccaactctatcagagcttggttgacggcaatttcgatgatgcagcttgggcgcagggtcgatgcgacgcaatcgtccgatccggagccgggactgtcgggcgtacacaaatcgcccgcagaagcgcggccgtctggaccgatggctgtgtagaagtactcgccgatagtggaaaccgacgccccagcactcgtccgagggcaaaggaatagagtagatgccgaccggatcgatccacttaacgttactgaaatcatcaaacagcttgacgaatctggatataagatcgttggtgtcgatgtcagctccggagttgagacaaatggtgttcaggatctcgataagatacgttcatttgtccaagcagcaaagagtgccttctagtgatttaatagctccatgtcaacaagaataaaacgcgtttcgggtttacctcttccagatacagctcatctgcaatgcattaatgcattggacctcgcaaccctagtacgcccttcaggctccggcgaagcagaagaatagcttagcagagtctattttcattttcgggagacgagatcaagcagatcaacggtcgtcaagagacctacgagactgaggaatccgctcttggctccacgcgactatatatttgtctctaattgtactttgacatgctcctcttctttactctgatagcttgactatgaaaattccgtcaccagcccctgggtttcgctacctaatccttgaagagggcgaacaggttgaccgattgcttcttcttgactcgccctt

注:下划线表示alba的5’侧翼区域和3’侧翼区域;黑色小写字母表示ptrpc-hph-ttrpc表达盒。

mhad-alba-hph的构建采用一步pcr的方法来完成。引物序列设计如表8所示。直接以mhad-alba-f与mhad-alba-r为引物以psilent-1为模板进行pcr扩增,来获得供体dna片段mhad-alba-hph。pcr反应体系为采用transgene的fastpfudna聚合酶的50μl反应体系,touchdownpcr反应条件为本领域常规反应条件。pcr产物进行pcr产物纯化后进行peg-介导的原生质体转化,大小为1978bp。

表8.mhad-alba-hph的构建所用引物

8.2超短同源臂介导的基因精准编辑效率的检测

将超短同源臂alba大片段dna敲除供体dna片段mhad-alba-hph为供体dna与cas9表达质粒以及两个向导rna-alba一起共转化kusa失活菌株dkusa,从而测试在kusa失活的遗传背景下的同源重组效率,具体同源重组过程如图11a所示。原生质体的转化方法如实施例2.5所述,分别制备野生型ab4.1与kusa失活菌株dkusa的原生质体,在转化体系中分别加入100μl原生质体悬液、10μgpcas9,5μg向导rna-alba-192,5μg向导rna-alba-196片段与5μgmhad-alba-hph片段,其余操作均相同。

在kusa失活的菌株中,crispr/cas9系统介导的同源重组可达到100%,非常准确地定位在所设计的同源臂处,未出现其他片段的插入或基因片段缺失的现象,如图11b所示。nhej失活后,即使采用短同源臂,基因敲除的效率可达100%。这该新型crispr/cas9系统结合kusa基因失活底盘菌株即使在超短同源臂的介导下也可显著提高基因打靶的准确性,为基因组上的原位定点突变、dna片段的插入、敲除与替换等基因组高效快速编辑奠定基础。

实施例9.包含5srrna不同长度的上游序列的向导rna表达盒对crispr/cas9系统基因组编辑效率的影响

为进一步鉴定5srrna启动子的核心元件,本发明人首先将黑曲霉的5srrna(an12e05410)与人类与酵母的5srrna进行序列比对。比对结果发现,在黑曲霉5srrna的基因内部分别包括a-box(+51-+62)、c-box(+82-+92)与中间元件ie(+68-+73),这些元件为tfiiia与tfiiic的结合关键位点,是介导rna聚合酶iii启动转录的关键位点。但在黑曲霉5srrna基因的上游,与人类5srrna不同,不存在人类5srrna上游中的d-box元件,而是与iii类启动子的相似,分别具有远端序列元件(distalsequenceelement,dse;-96--88)、近端序列元件(proximalsequenceelement,pse;-65--48)与tata-likebox(-33--22)(图12a)。为检测这些可能的调控元件对crispr/cas9系统的基因组编辑效率的影响,本发明设计了一系列包括不同元件的5srrna-hdv-sgrna表达盒(δ5’-338,δ5’-160,δ5’-106,δ5’-65,δ5’-35与δ5’+1,图12a)。

这一系列包括不同元件的5srrna-hdv-sgrna表达盒(δ5’-338,δ5’-160,δ5’-106,δ5’-65,δ5’-35与δ5’+1)的构建采用一步pcr的方法来完成。引物序列设计如表9所示。分别采用5s_fm1-338、5s_fm2-160、5s_fm3-106、5s_fm4-65、5s_fm5-35与5s_fm6+1为上游引物,以sgrna_r为下游引物,以p5s-hdv-sgrna-alba-188为模板进行pcr扩增,来分别获得不同的5srrna-hdv-sgrna表达盒δ5’-338,δ5’-160,δ5’-106,δ5’-65,δ5’-35与δ5’+1,dna大小分别为661、502、429、388、358与327bp(图12b)。pcr产物进行pcr产物纯化后进行peg-介导的原生质体转化。

表9.一系列不同上游序列5srrna-hdv-sgrna表达盒的构建所用引物

将这一系列包括不同元件的5srrna-hdv-sgrna表达盒(δ5’-338,δ5’-160,δ5’-106,δ5’-65,δ5’-35与δ5’+1)的pcr纯化产物与cas9表达质粒共转化黑曲霉野生型ab4.1。原生质体的转化方法如实施例2.5所述,分别制备野生型ab4.1的原生质体,在转化体系中分别加入100μl原生质体悬液、5μgpcas9,5μg一系列包括不同元件的5srrna-hdv-sgrna表达盒(δ5’-338,δ5’-160,δ5’-106,δ5’-65,δ5’-35与δ5’+1),其余操作均相同。

在野生型ab4.1菌株中,一系列包括不同元件的5srrna-hdv-sgrna表达盒(δ5’-338,δ5’-160,δ5’-106,δ5’-65,δ5’-35与δ5’+1)均可实现对alba基因的高效失活,其基因组编辑效率分别为100±0.6%,93.33±5.3%,100±0.4%,95.45±4.2%,93.75±2.2%,100±0.5%(图12c)。这表明虽然在黑曲霉5srrna的上游存在如远端序列元件(distalsequenceelement,dse;-96--88)、近端序列元件(proximalsequenceelement,pse;-65--48)与tata-likebox(-33--22)等可能的转录起始调控元件,但是这些元件对5srrna的转录起始效率的影响不大。而在5srrna基因内部的a-box(+51-+62)、c-box(+82-+92)与中间元件ie(+68-+73)等转录因子结合位点则足以起始5srrna以及下游hdv与sgrna的转录,因此只以5srrna基因为启动子的表达盒δ5’+1也可高效介导的基因组编辑。

实施例10.不同物种的5srrna基因的发现

本实施例用于说明,如何在任意真核物种中发现其5srna,以便用于构建本发明的crispr/cas系统。

首先,在5srrna数据库(http://combio.pl/rrna/)存在810个真核物种2861条5srrna的基因序列。这些序列可用于按照本发明的新型向导rna表达盒构建策略,在不同真核物种中快速建立crispr/cas系统。

其次,从5srrna数据库中收集一系列5srrna基因序列,分别来源于酿酒酵母、解脂耶氏酵母、乳酸克鲁维酵母、白色念珠菌、近光滑念珠菌与裂殖酵母菌等酵母;黑曲霉、黄曲霉、构巢曲霉、产黄青霉、灰黄青霉、哈次木霉、绿色木霉、粗糙脉孢霉、稻瘟霉以及玉米黑粉霉等丝状真菌;拟南芥、烟草、水稻、野生稻、小麦、玉米、大豆、油菜、棉花、甘蓝与甜菜等植物;果蝇、家蚕与秀丽线虫等昆虫;斑马鱼与鲤鱼等鱼类;北欧爪蟾与非洲爪蟾等两栖类;鸡与鸿雁等禽类;人、小鼠、大鼠、家兔、牛、狗、猫与猪等哺乳动物。采用mage进行了进化树分析以及利用5srrna数据库的结构比对工具进行了多序列间保守结构域的分析。如图13a和b所示,不同物种来源的5srrna基因序列在同一门中的保守性较强,即在真菌、植物与动物等大类中在序列与结构上都非常保守。由此可推断,即使在5srrna基因序列未知的物种中,通过与近缘已公布的5srrna基因的序列比对,也可非常方便地鉴定出其5srrna基因序列,用于按照本发明的新型向导rna表达盒构建策略,在该物种中快速建立crispr/cas系统。

另外,鉴于5srrna基因的保守性,也可直接采用已公布的近缘5srrna基因作为启动子来起始向导rna的表达,建立crispr/cas系统。

因此,按照本发明中的新型向导rna表达盒构建策略,可以在不同物种中快速构建适用于该物种的crispr/cas系统。

实施例11.利用新型crispr/dcas9系统对绿色荧光蛋白基因进行基因表达调控

本发明中以5srrna为启动子的向导rna表达盒除用于crispr/cas9系统进行基因组高效编辑外,也可用于crispr/dcas9系统实现特定基因的表达调控。在本实施例中,展示crispr/dcas9系统对增强型绿色荧光蛋白基因sgfp进行基因表达调控。

针对sgfp基因设计了其靶序列sgfp-130,的双链以引物的形式进行合成,具体引物信息如表10所示。p5s-sgrna的bbsi酶切与去磷酸化、靶序列的引物溶解、双链退火与磷酸化以及连接转化等分子实验操作如实施例1.4所述。

表10.crispr/dcas9系统构建的相关引物

注:加粗碱基为突变为丙氨酸的位点。

dcas9(d10ah840a)表达质粒的构建通过site-directedmutagenesiskit(neb)定点突变试剂盒,分别采用引物cas9d10a-f与cas9d10a-r对pcas9进行反向扩增,获得d10a单突变的质粒pncas9-d10a。然后再采用引物cas9h840a-f与cas9h840a-r对pncas9-d10a进行反向扩增,获得d10ah840a双突变的质粒pdcas9。

将dcas9(d10ah840a)表达质粒与向导rna-sgfp-130共转化黑曲霉ab4.1-sgfp菌株。原生质体的转化方法如实施例1.5所述,在转化体系中分别加入100μl原生质体悬液、5μgpdcas9,5μg向导rna-sgfp-130表达盒,其余操作均相同。

随机选取10个转化子,将其孢子悬液在微孔板中培养12h后,采用spectramaxm2型多功能酶标仪(美国)在480nm下检测各转化子的荧光强度,以表征各转化子中的绿色荧光蛋白表达强度。结果表明,本发明的crispr/dcas9系统对ab4.1-sgfp菌株中对于sgfp的表达水平实现了不同程度的抑制,其基因下调76.5±3.5%以上。这表明该新型向导rna的表达盒在crispr/dcas9系统中高效发挥作用。

序列表

<110>中国科学院天津工业生物技术研究所

<120>一种新型向导rna表达盒及在crispr/cas系统中的应用

<130>p2017-0161

<160>64

<170>patentinversion3.5

<210>1

<211>20

<212>dna

<213>artificialsequence

<220>

<223>alba基因的靶序列188

<400>1

agtgggatctcaagaactac20

<210>2

<211>20

<212>dna

<213>artificialsequence

<220>

<223>alba基因的靶序列192

<400>2

atttcctgactcggatggta20

<210>3

<211>20

<212>dna

<213>artificialsequence

<220>

<223>alba基因的靶序列194

<400>3

ctggagatgatgggaataac20

<210>4

<211>20

<212>dna

<213>artificialsequence

<220>

<223>alba基因的靶序列196

<400>4

tcgctacctaatccttgaag20

<210>5

<211>4245

<212>dna

<213>artificialsequence

<220>

<223>带有核定位信号的ancas9的编码序列

<400>5

atgccaaagaagaagcggaaggtcatggataagaagtactccatcggcctcgacatcggc60

accaactccgtcggctgggccgtcatcaccgatgagtacaaggtcccttccaagaagttc120

aaggtcctcggcaacaccgatcgccattccatcaagaagaacctgatcggcgccctcctg180

ttcgattccggcgaaaccgccgaggccacccgccttaaacgcaccgcccgtcgccgctac240

acccgccgcaagaaccgcatctgctacctccaagaaatcttctccaacgagatggccaag300

gtcgatgatagcttcttccaccgcctcgaagagtccttcctggtcgaagaggataagaag360

cacgagcgccatcctatcttcggcaacatcgtcgatgaggtcgcctaccatgagaagtac420

cctaccatctaccatctccgcaagaagctcgtcgattccaccgataaggccgatctccgc480

ctcatctacctcgccctcgcccatatgatcaagttccgcggccatttcctcatcgagggc540

gatctcaaccctgataactccgatgtcgataagctgttcatccagctcgtccagacctac600

aaccagctgttcgaggaaaaccctatcaacgcctccggcgtcgatgccaaggccatcctc660

tccgctcgcctctccaagtctcgccgccttgagaaccttatcgcccagctccctggcgag720

aagaagaacggcctcttcggcaacctgatcgccctctccctcggcctcacccctaacttc780

aagtccaacttcgatctcgccgaggatgccaagctccagctctccaaggatacctacgat840

gatgatctcgataacctcctcgcccagatcggcgatcagtacgccgatctgttcctcgcc900

gccaagaacctctccgatgccatcctcctctccgacatcctccgcgtcaacaccgagatc960

accaaggcccctctgtccgcctccatgatcaagcgctacgatgagcatcatcaggacctc1020

accctgctcaaggccctcgtccgccagcagctccctgagaagtacaaagagattttcttc1080

gatcagtccaagaacggctacgccggctacatcgatggcggcgcttcccaagaagagttc1140

tacaagttcatcaagcctatccttgagaagatggatggcaccgaggaactcctcgtcaag1200

ctcaaccgcgaggacctcctccgcaagcagcgcaccttcgataacggctccatccctcat1260

caaatccatctcggcgagctgcatgccatcttgcgccgccaagaggatttctacccattc1320

ctcaaggataaccgcgagaagatcgaaaagattctcaccttccgcatcccttactacgtc1380

ggccctctcgctcgcggcaactcccgcttcgcctggatgacccgcaagtccgaggaaacc1440

atcaccccttggaacttcgaggaagtcgtcgataagggcgcctccgcccagtccttcatc1500

gagcgcatgaccaacttcgataagaacctccctaacgagaaggtcctccctaagcactcc1560

ctgctctacgagtacttcaccgtctacaacgagctgaccaaggtcaagtacgtcaccgag1620

ggtatgcgcaagcctgccttcctgtccggcgagcagaagaaggccatcgtcgatctgctg1680

ttcaagaccaaccgcaaggtcaccgtcaagcagctcaaagaggattacttcaagaaaatc1740

gagtgcttcgattccgtcgagatcagcggcgtcgaggaccgcttcaacgcctccctcgga1800

acctaccatgatctcctcaagattatcaaggataaggatttcctcgacaacgaggaaaac1860

gaggacatccttgaggacatcgtcctcaccctcaccctcttcgaggaccgcgaaatgatc1920

gaggaacgcctcaagacctacgcccatctcttcgatgataaggtcatgaagcagctcaag1980

cgccgtcgctacaccggctggggtcgcctctcccgcaagctcatcaacggcatccgcgat2040

aagcagtccggcaagactatcctcgatttcctcaagtccgatggcttcgccaaccgcaac2100

ttcatgcagctcatccatgatgattccctcaccttcaaagaggacatccagaaggcccag2160

gtcagcggccagggcgattccctccatgagcatatcgccaacctcgccggctcccctgcc2220

atcaagaagggcatcctccagaccgtcaaggtcgtcgatgagctggtcaaggtcatgggc2280

cgccataagcctgagaacatcgtcatcgagatggcccgcgagaaccagaccacccagaag2340

ggccagaagaactcccgcgagcgcatgaagcgcatcgaggaaggcatcaaagagctgggc2400

agccaaatcctcaaagagcatcctgtcgagaacacccagctccagaacgagaagctctac2460

ctctactacctccagaacggccgcgatatgtacgtcgatcaagagctggacatcaaccgc2520

ctctccgattacgatgtcgatcatatcgtccctcagtccttcctgaaggatgattccatc2580

gataacaaggtcctcacccgctccgataagaaccgcggcaagtccgataacgtcccttcc2640

gaagaggtcgtcaagaagatgaagaactactggcgccagctcctcaacgccaagctcatc2700

acccagcgcaagttcgataacctcaccaaggccgagcgcggtggcctctccgagctggat2760

aaggccggcttcatcaagcgccagctcgtcgaaacccgccagatcaccaagcacgtcgcc2820

caaatcctcgattcccgcatgaacaccaagtacgatgagaacgataagctcatccgcgaa2880

gtcaaggtcatcaccctcaagtccaagctcgtcagcgatttccgcaaggatttccagttc2940

tacaaggtccgcgagatcaacaactaccatcatgcccatgatgcctacctcaacgccgtc3000

gtcggcaccgccctcatcaagaagtaccccaagctcgaatccgagttcgtctacggtgat3060

tacaaggtctacgatgtccgcaagatgatcgccaagtccgagcaagagatcggcaaggct3120

accgccaagtacttcttctactccaacatcatgaatttcttcaagaccgaaatcaccctc3180

gccaacggcgaaatccgcaagcgccctctcatcgagactaacggcgagactggcgagatc3240

gtctgggataagggccgcgatttcgccaccgtccgcaaggtcctctccatgcctcaggtc3300

aacatcgtcaagaaaaccgaggtccagaccggcggcttctccaaagagtccatcctcccc3360

aagcgcaactccgataagctgatcgcccgcaagaaggattgggaccctaagaagtacggc3420

ggcttcgattcccctaccgtcgcctactccgtcctcgtcgtcgccaaggtcgagaagggc3480

aagtccaagaagctcaagtccgtcaaagagctgctcggcatcactattatggaacgctcc3540

agcttcgagaagaaccctatcgatttccttgaggccaagggctacaaagaggtcaagaag3600

gacctcatcatcaagctccccaagtactccctgttcgagcttgagaacggccgcaagcgc3660

atgctcgcctccgccggtgagcttcagaagggcaacgagctggccctgccttccaagtac3720

gtcaacttcctctacctcgcctcccattacgagaagctcaagggctcccctgaggataac3780

gagcagaagcagctgttcgtcgagcagcataagcactacctcgatgagatcatcgagcag3840

atcagcgagttctccaagcgcgtcatcctcgccgatgccaacctcgataaggtcctgtcc3900

gcctacaacaagcaccgcgataagcctatccgcgagcaggccgagaacatcatccatctc3960

ttcaccctcaccaacctcggtgcccctgccgccttcaagtacttcgataccaccatcgat4020

cgcaagcgctacacctccaccaaagaggtcctggacgccaccctcatccatcagtccatc4080

accggcctctacgaaacccgcatcgatctctcccagctcggcggcgacaagcgccccgcc4140

gccaccaagaaggccggccaggctaagaagaagaagtga4179

<210>6

<211>237

<212>dna

<213>artificialsequence

<220>

<223>5srrna-sgrna序列

<400>6

aaacacatacgaccacagggtgtggaaaacagggcttcccgtccgctcagccgtacttaa60

gccacacgccgggaggttagtagttgggtgggtgaccaccagcgaatcccttctgttgta120

tgaaaggacgaaacaccgggtcttcgagaagacctgttttagagctagaaatagcaagtt180

aaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttttt237

<210>7

<211>21

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>7

ggttggagattccagactcag21

<210>8

<211>41

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>8

cagaggccgatttcgttgtcccatacaacagaagggattcg41

<210>9

<211>41

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>9

cgaatcccttctgttgtatgggacaacgaaatcggcctctg41

<210>10

<211>75

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>10

cgaatcccttctgttgtatgctgatgagtccgtgaggacgaaacgagtaagctcgtccac60

cgggtcttcgagaag75

<210>11

<211>38

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>11

cgaatcccttctgttgtatgaaaggacgaaacaccggg38

<210>12

<211>20

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>12

cttgtgccacaccatagtag20

<210>13

<211>24

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>13

caccagtgggatctcaagaactac24

<210>14

<211>24

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>14

aaacgtagttcttgagatcccact24

<210>15

<211>24

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>15

caccatttcctgactcggatggta24

<210>16

<211>24

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>16

aaactaccatccgagtcaggaaat24

<210>17

<211>24

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>17

caccctggagatgatgggaataac24

<210>18

<211>24

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>18

aaacgttattcccatcatctccag24

<210>19

<211>24

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>19

cacctcgctacctaatccttgaag24

<210>20

<211>24

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>20

aaaccttcaaggattaggtagcga24

<210>21

<211>321

<212>dna

<213>artificialsequence

<220>

<223>5srrna-hdv-sgrna序列

<400>21

acatacgaccacagggtgtggaaaacagggcttcccgtccgctcagccgtacttaagcca60

cacgccgggaggttagtagttgggtgggtgaccaccagcgaatcccttctgttgtatggg120

acaacgaaatcggcctctgcaacctccacgtggtgttgtctgggaacctgatcaaaacta180

ccgagtttgatcaggccaatgcagagaaaggacgaaacaccgggtcttcgagaagacctg240

ttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtg300

gcaccgagtcggtgctttttt321

<210>22

<211>265

<212>dna

<213>artificialsequence

<220>

<223>5srrna-hh-sgrna序列

<220>

<221>misc_feature

<222>(119)..(124)

<223>nisa,c,g,ort

<400>22

acatacgaccacagggtgtggaaaacagggcttcccgtccgctcagccgtacttaagcca60

cacgccgggaggttagtagttgggtgggtgaccaccagcgaatcccttctgttgtatgnn120

nnnnctgatgagtccgtgaggacgaaacgagtaagctcgtccaccgggtcttcgagaaga180

cctgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaa240

agtggcaccgagtcggtgctttttt265

<210>23

<211>357

<212>dna

<213>artificialsequence

<220>

<223>phu6-sgrna序列

<400>23

gagggcctatttcccatgattccttcatatttgcatatacgatacaaggctgttagagag60

ataattggaattaatttgactgtaaacacaaagatattagtacaaaatacgtgacgtaga120

aagtaataatttcttgggtagtttgcagttttaaaattatgttttaaaatggactatcat180

atgcttaccgtaacttgaaagtatttcgatttcttggctttatatatcttgtggaaagga240

cgaaaggacgaaacaccgggtcttcgagaagacctgttttagagctagaaatagcaagtt300

aaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttttt357

<210>24

<211>644

<212>dna

<213>artificialsequence

<220>

<223>pyu6-sgrna序列

<400>24

gatcgataattctccataatagttctgttatttataatctccagcactaataaatgctat60

acgtatatttgtacacaatataatttcagaatttatattgctaccatgactgtctgagaa120

ttgggggaataacttgataattgttgggattccattgttcgtaaacgcaataatattagg180

tatatagaagatactaaatgttctctccgaggatataggaatgctcacaatggaatcgat240

atatttctacataatagtattgagattattcctcttttagttttatataattcattatcc300

tattacattatcaatccttgcatttcagcttccattagacttaatgactgtttctcaatt360

tttatgtcatcttcctggacctcatgtgatactataccagtagcatgaatactactgaat420

cgatgatactttagagtttcattgcaacagtttcaacacagcctggcatgaacagtggta480

aaagtatttcgtccactattttcggctactataaataaatgtttttttcgcaactatgtg540

caccgggtcttcgagaagacctgttttagagctagaaatagcaagttaaaataaggctag600

tccgttatcaacttgaaaaagtggcaccgagtcggtgctttttt644

<210>25

<211>513

<212>dna

<213>artificialsequence

<220>

<223>panu6-sgrna序列

<400>25

cccaagcttgatcgataattcgccatggcggccgcgggaattcgattcccaagcttgatc60

gataattctccatcctgctcagacctcaccaccccggagcagccgcgtcgtagcaaccat120

cagcttccattaagactaatgactgtttctcaattctttatgtcatctttcctgaggacc180

ggcctagagcggaaacacatgtgcagatcccttcatgtgatactataccagtagcatgaa240

tacctactgggcattggcggtttaatcgatgatactttagagtttcatggcaatcagcaa300

cagtttcaacaaccgccggtataaggcatgaacagtggtcaagtccgctgtaaagtattt360

cgtcctactatctcggctactataaataaatgttttttcgatctatgtgcaccgggtctt420

cgagaagacctgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaa480

cttgaaaaagtggcaccgagtcggtgctttttt513

<210>26

<211>1978

<212>dna

<213>artificialsequence

<220>

<223>mhai-alba-hph序列

<400>26

cctccgcctcccagcctacaagtgggatctcaagaactacgacgttaactgatattgaag60

gagcactttttgggcttggctggagctagtggaggtcaacaatgaatgcctattttggtt120

tagtcgtccaggcggtgagcacaaaatttgtgtcgtttgacaagatggttcatttaggca180

actggtcagatcagccccacttgtagcagtagcggcggcgctcgaagtgtgactcttatt240

agcagacaggaacgaggacattattatcatctgctgcttggtgcacgataacttggtgcg300

tttgtcaagcaaggtaagtgaacgacccggtcataccttcttaagttcgcccttcctccc360

tttatttcagattcaatctgacttacctattctacccaagcatcgatatgaaaaagcctg420

aactcaccgcgacgtctgtcgagaagtttctgatcgaaaagttcgacagcgtctccgacc480

tgatgcagctctcggagggcgaagaatctcgtgctttcagcttcgatgtaggagggcgtg540

gatatgtcctgcgggtaaatagctgcgccgatggtttctacaaagatcgttatgtttatc600

ggcactttgcatcggccgcgctcccgattccggaagtgcttgacattggggaattcagcg660

agagcctgacctattgcatctcccgccgtgcacagggtgtcacgttgcaagacctgcctg720

aaaccgaactgcccgctgttctgcagccggtcgcggaggccatggatgcgatcgctgcgg780

ccgatcttagccagacgagcgggttcggcccattcggaccgcaaggaatcggtcaataca840

ctacatggcgtgatttcatatgcgcgattgctgatccccatgtgtatcactggcaaactg900

tgatggacgacaccgtcagtgcgtccgtcgcgcaggctctcgatgagctgatgctttggg960

ccgaggactgccccgaagtccggcacctcgtgcacgcggatttcggctccaacaatgtcc1020

tgacggacaatggccgcataacagcggtcattgactggagcgaggcgatgttcggggatt1080

cccaatacgaggtcgccaacatcttcttctggaggccgtggttggcttgtatggagcagc1140

agacgcgctacttcgagcggaggcatccggagcttgcaggatcgccgcggctccgggcgt1200

atatgctccgcattggtcttgaccaactctatcagagcttggttgacggcaatttcgatg1260

atgcagcttgggcgcagggtcgatgcgacgcaatcgtccgatccggagccgggactgtcg1320

ggcgtacacaaatcgcccgcagaagcgcggccgtctggaccgatggctgtgtagaagtac1380

tcgccgatagtggaaaccgacgccccagcactcgtccgagggcaaaggaatagagtagat1440

gccgaccggatcgatccacttaacgttactgaaatcatcaaacagcttgacgaatctgga1500

tataagatcgttggtgtcgatgtcagctccggagttgagacaaatggtgttcaggatctc1560

gataagatacgttcatttgtccaagcagcaaagagtgccttctagtgatttaatagctcc1620

atgtcaacaagaataaaacgcgtttcgggtttacctcttccagatacagctcatctgcaa1680

tgcattaatgcattggacctcgcaaccctagtacgcccttcaggctccggcgaagcagaa1740

gaatagcttagcagagtctattttcattttcgggagacgagatcaagcagatcaacggtc1800

gtcaagagacctacgagactgaggaatccgctcttggctccacgcgactatatatttgtc1860

tctaattgtactttgacatgctcctcttctttactctgatagcttgactatgaaaattcc1920

gtcaccagcccctgggttattccctataccaacaacttctgcctgagcaagggcgctc1978

<210>27

<211>64

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>27

cctccgcctcccagcctacaagtgggatctcaagaactacgacgttaactgatattgaag60

gagc64

<210>28

<211>60

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>28

gagcgcccttgctcaggcagaagttgttggtatagggaataacccaggggctggtgacgg60

<210>29

<211>49

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>29

ccgccgcacacgaacatcgacctgcaggggttggagattccagactcag49

<210>30

<211>50

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>30

ccagtgccaagcttgcatgcctgcaggaaaaaagcaccgactcggtgcca50

<210>31

<211>6722

<212>dna

<213>artificialsequence

<220>

<223>lhai-kusa-amds序列

<400>31

attcgcctcttccatgacttcgagatccagctcatacagggtctcaatgtggtcgctggt60

gaaggcgatcggtacgaggacaatgtcggtctgtccacgcttcacgtactcttggacggt120

atcgcttgtctgcgctcccagccaagcccttggtccgacctgagactgccagcagaggcg180

gtaagggttgctaaaattgagcctttgcatcaccgcatgcactgttgccgcaacctcggc240

cgggtatggatcacctaaaggagaagttgtcggttagctaccgggagttggtcaccaaga300

cccttgagactcacctctgttcacaacactcatgggcaaactgtgggccgagaacaagag360

aaccactccatttctcttatcttccggataggttttgagttgatcctcaatgtttctcgc420

aaacgcctccacaaggccagggtgcgtaggccatctgtcgataacgctccactggatagc480

tccggaagtgtccacgtttccgtttgctcgcttgccctccagccgattcctccatttcca540

cagctcattcagagagctacccgtagtagaacaggaatactgggggtattgtgagaacgc600

gaccgcacgaccgcccttcccattgccaaagccatcttccagcaattgtgtgtacatttg660

ttccgtcagcgggttggcgtaacggaaggcaacgtacggcttgtgaggcgcagtctccgg720

gttgatcttgtccagcagcttgcacatttccttgcattggtattccgaccattttcttat780

gggtgagcctccgccgatgtccgcatactgcttttgaatcttgggtgtgcgtcgtttcga840

aataagaggcccgaggtaatgctggaacttgccaagaggaatcaaatcgccgtcggcctt900

gaatagaagtagaatgttagaaacgtagcaaccagaatgacagcttgccatagtcggaga960

cgtacaaagagccggctgaggaaatcctctacttcgtctgtcgtcgagggccctcccatg1020

ttcaggaagaccatggctgtagggcccttagagcctgttgcatcctgggtaaccggaggc1080

actgttgttgccagcccacatctttgttcttgcttgtatccgaacagggtgcgagaagcc1140

ggtcgcagcaattgccggggcagggtaaacgggcggcggagagccatgacaggtaattgt1200

actgaattcggttgacctagtcaatggaggtaataagaaaagaccgttcgtatcgcgcaa1260

gcagatgaactattcacgccgcattaaatattcaaaagatagacgagtggcaagaacagg1320

tagtgggtgtatacaacagcgcaaggccttctggaagctgaaaagtccagaacggcttga1380

tgacggagcaccgagaccacgaccaactccgactcccgacagccaatgaccggccagcta1440

gcgtcatcaattaccgggcggacatcacatgatgttcgtgtctccccgcgtctttctgcc1500

caccggtttgatcgcgtccctcgcgaccggatccagtgacgatatagatagatctatctc1560

cggctgcaggcagcagaggccaaacaggcagacacaacagccccacttgttcctggttac1620

gattcaagttgtcttaacctttatacttccctctttcaatttcgataatatcttgaatgc1680

tttaaacgattccacaacattctactatggcggacggcaacccacatcgggaagatgagg1740

cggccgaggaagaagaggagattgatgagactgtacgcaaatttacccatgaacttggac1800

tggaactctggaactgacaataagatcagagctacaaaccagtcaaagatgcggtcctct1860

tcgcaatcgatgtcagcgattccatgttgattttgaatagctcgcccgctggagagcatc1920

ctgaatgcaagtaacaaccgtagaggctgacacggcaggtgttgctagggagcgtcgtgt1980

tctacaaggccagacgtcttcgcggttgatatatatgtatgtttgactgcaggctgctca2040

gcgacgacagtcaagttcgccctcgctgcttgtgcaataatcgcagtggggaagccacac2100

cgtgactcccatctttcagtaaagctctgttggtgtttatcagcaatacacgtaatttaa2160

actcgttagcatggggctgatagcttaattaccgtttaccagtgccgcggttctgcagct2220

ttccttggcccgtaaaattcggcgaagccagccaatcaccagctaggcaccagctaaacc2280

ctataattagtctcttatcaacaccatccgctcccccgggatcaatgaggagaatgaggg2340

ggatgcggggctaaagaagcctacataaccctcatgccaactcccagtttacactcgtcg2400

agccaacatcctgactataagctaacacagaatgcctcaatcctgggaagaactggccgc2460

tgataagcgcgcccgcctcgcaaaaaccatccctgatgaatggaaagtccagacgctgcc2520

tgcggaagacagcgttattgatttcccaaagaaatcggggatcctttcagaggccgaact2580

gaagatcacagaggcctccgctgcagatcttgtgtccaagctggcggccggagagttgac2640

ctcggtggaagttacgctagcattctgtaaacgggcagcaatcgcccagcagttagtagg2700

gtcccctctacctctcagggagatgtaacaacgccaccttatgggactatcaagctgacg2760

ctggcttctgtgcagacaaactgcgcccacgagttcttccctgacgccgctctcgcgcag2820

gcaagggaactcgatgaatactacgcaaagcacaagagacccgttggtccactccatggc2880

ctccccatctctctcaaagaccagcttcgagtcaaggtacaccgttgcccctaagtcgtt2940

agatgtccctttttgtcagctaacatatgccaccagggctacgaaacatcaatgggctac3000

atctcatggctaaacaagtacgacgaaggggactcggttctgacaaccatgctccgcaaa3060

gccggtgccgtcttctacgtcaagacctctgtcccgcagaccctgatggtctgcgagaca3120

gtcaacaacatcatcgggcgcaccgtcaacccacgcaacaagaactggtcgtgcggcggc3180

agttctggtggtgagggtgcgatcgttgggattcgtggtggcgtcatcggtgtaggaacg3240

gatatcggtggctcgattcgagtgccggccgcgttcaacttcctgtacggtctaaggccg3300

agtcatgggcggctgccgtatgcaaagatggcgaacagcatggagggtcaggagacggtg3360

cacagcgttgtcgggccgattacgcactctgttgagggtgagtccttcgcctcttccttc3420

ttttcctgctctataccaggcctccactgtcctcctttcttgctttttatactatatacg3480

agaccggcagtcactgatgaagtatgttagacctccgcctcttcaccaaatccgtcctcg3540

gtcaggagccatggaaatacgactccaaggtcatccccatgccctggcgccagtccgagt3600

cggacattattgcctccaagatcaagaacggcgggctcaatatcggctactacaacttcg3660

acggcaatgtccttccacaccctcctatcctgcgcggcgtggaaaccaccgtcgccgcac3720

tcgccaaagccggtcacaccgtgaccccgtggacgccatacaagcacgatttcggccacg3780

atctcatctcccatatctacgcggctgacggcagcgccgacgtaatgcgcgatatcagtg3840

catccggcgagccggcgattccaaatatcaaagacctactgaacccgaacatcaaagctg3900

ttaacatgaacgagctctgggacacgcatctccagaagtggaattaccagatggagtacc3960

ttgagaaatggcgggaggctgaagaaaaggccgggaaggaactggacgccatcatcgcgc4020

cgattacgcctaccgctgcggtacggcatgaccagttccggtactatgggtatgcctctg4080

tgatcaacctgctggatttcacgagcgtggttgttccggttacctttgcggataagaaca4140

tcgataagaagaatgagagtttcaaggcggttagtgagcttgatgccctcgtgcaggaag4200

agtatgatccggaggcgtaccatggggcaccggttgcagtgcaggttatcggacggagac4260

tcagtgaagagaggacgttggcgattgcagaggaagtggggaagttgctgggaaatgtgg4320

tgactccatagctaataagtgtcagatagcaatttgcacaagaaatcaataccagcaact4380

gtaaataagcgctgaagtgaccatgccatgctacgaaagagcagaaaaaaacctgccgta4440

gaaccgaagagatatgacacgcttccatctctcaaaggaagaatcccttcagggttgcgt4500

ttccagtctagcgcctcgcccctcagcagatcctaagaaacacacccaagaatcacccac4560

cacggcagcgctcaaatgcgcctatcacttcatgcaacaacgaatcatatcaaatccaca4620

agacatgatgggtgttttgctgttcgggacccaggcgtccaagttctttgaagaagatga4680

agacagtcggggagacctgtcctaccccaactgctacctcttcactgatctggatgttcc4740

ttcggctcatgaggtcaaagaacttcgagcactggtagatgatgaaggagactcaaggga4800

ggttctatctccagcgaaagagcaggtctctatggcaaacgtcctattttgcgccaacca4860

gatattcacatccagagcgccaaatttcctctcccggcgtttgttcatcataaccgacaa4920

tgacaacccccatggtgatgataaaaccctgcggtcagcggcgactgtacgtgctaagga4980

tctttacgatcttggtgtcacaattgagctgtttccgatctcacgccctgagcatgagtt5040

caagaacagcaagttctatgacgtaagctatcatactctatagcaaagtggcaggggtcg5100

atactcactacagatacaaaggatattatctacaagtcattgcccagcgatccagaggcg5160

cctgcatatctacaatctgattcaaaagcggcgactgcgaccggggacgggatttcactc5220

ctcaacacgcttctgtccagtattaattcgagaacggttccgcgtcgcactcatttttcg5280

aacatgcctttagaacttggcccagacttcagaatttcggtatcgggctatatactctta5340

cgaaggcaagcgcccgctagaaactccttcatctggctgaacggcgagaagcctgtggtc5400

gcgaaaggagtgacttcccactccgcagatgatactggccggactgtcgagaaatgggag5460

atcagaaaggcatataagttcggtggcgaccaagtaaccttttcgcctgatgagcagaag5520

gcgcttagggatttcggtgagccagtaatccgggttattgggttcaagcctatcactgcg5580

cttccattctgggcaaacgtcaagcacccatattttatctatccatccgaggaagactat5640

gtaggctcctcgcgagtattttccgcattgcatcagactcttttgcgttccaagaagatg5700

gcactcgtctggttcattgcacgcaagggtgctggccccgttctcgccgctatgatcgca5760

ggcgaagaaaagcttgatgagaatggcgtacaaaaataccctcctggcatgtggattctt5820

cccctccccttcgcagacgatatccggcagaaccccgaaacaacgttgaatgtcgccccg5880

gagtcattgattgatcagatgcgcgtggtcgtccagcaactgcagctgccgaagggagtg5940

tacgagcctctcaaataccccaatccatgtaagtcactgctgtcttgcattgctcgtata6000

cgatgaacgagaagttgacagcccgtgatcagcccttcaatggcattaccgcatcctaca6060

agctctcgcattagacgaagatctccctgaaaaaccagaagacaaaaccattccgaaata6120

ccgccaaatcgacaaggtaaaaccactacacccaagaaacaaccctccacgcattcaacc6180

tactgacaattgcaccgcagcgcgccggtgactacgtattatcctgggccgacgaactcg6240

aaaagcaatacgccaaaacctcagcagcggcccctcgcccaaccagcaccctcgtgaaac6300

gaggatcaaaagaccgagcaagcgaaaccgaggactccaag6341

<210>32

<211>48

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>32

gattacgccaagctgcccttattcgcctcttccatgacttcgagatcc48

<210>33

<211>52

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>33

ctctccagcgggcgagctattcaaaaggcgtcaacatggaatcgctgacatc52

<210>34

<211>26

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>34

ttttgaatagctcgcccgctggagag26

<210>35

<211>25

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>35

ctagactggaaacgcaaccctgaag25

<210>36

<211>63

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>36

cttcagggttgcgtttccagtctagggtaccctcgagtcgcccctcagcagatcctaaga60

aac63

<210>37

<211>46

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>37

ggcgaattgaagctgcccttcttggagtcctcggtttcgcttgctc46

<210>38

<211>21

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>38

aagggcagcttcaattcgccc21

<210>39

<211>23

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>39

aagggcagcttggcgtaatcatg23

<210>40

<211>24

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>40

cacccgagcactggtagatgatga24

<210>41

<211>24

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>41

aaactcatcatctaccagtgctcg24

<210>42

<211>7032

<212>dna

<213>artificialsequence

<220>

<223>lhad-alba-hph序列

<400>42

actgtagcagcggagtaagatggaaggttgtcattccagccaggctcgaggatacacgtg60

ccacccacaagtttacgacccaacctggaacacgctagtctagtaaatcacctggcagtt120

ttctcaaccgggcgttagattgcgcttgtctacaattaatactgtacagcgaaatttgtc180

ttctattgtgtgacatcaactaatagtccaggtctcatgatgcttactggcacaggtatc240

cgaccaaagaagttcttccttcggaagtatgggtggaagggtacgcggttcggaaaagtc300

tctgcagcgtcgacaacagaaccaccaaggttcacgagaggctcacgccaagtaacctta360

ttgagacccgtatccgggatggctggtaccagatggcttgtgtgctacttcttattgaca420

gtaagcgtctttgtcgattgtgtttgctcgctcctgcgtacggaggattgtaagctgata480

gtctcgtggaccataacgtgacatgatattccaggaaatcagagagctgacaaatacatc540

tgaacctgctagataggcctacgttgtcttctgtatcctttgctgagacatgtttgggat600

tatcctccattgttaagggtttccgaagccgagggatatgcactatatttatcggaccac660

acatgatccttgagcaaaccactgctcctatgactaagaacgcttgataaacccactgcg720

aggcttttcgggagaggcttggcaatgtctcactaccagatcatagggataccgcctctt780

ggttcatacttcctgcattggcttcttctgcaaacagcccattttcagctgtctagcctg840

accatgctgaccgtaatgagggataacaataggcttgaaagttgctgatggtgtgtaaga900

ttgactaacctctaggaatacttatgaaaatgccaactcagaacaaatttggaccgcaat960

ggcacgagtggaacgcagggtggcagcacggcttatgaaccttatcaatgcgacgcctcg1020

agaggggcctcaaatacctgtctaggatcacacattctcggaggttaaagttctagtttg1080

gttattcgggcgagttattgaaccttgacatttgtgggacacatgtcaagcatgacccgc1140

cactcgaatggaaggttcggtggctgaagcaaatttgagacgatcctgattcaacacaaa1200

cccctcgagccctgccatcagagctgtccgagcacggtgtgcaagagctctgccagttaa1260

actactcagtactagccaaatggtactcagcatgttggttatatattcgagcatcatgca1320

gggtttcaaaccaggggaaggagtgcagagtcgagtcgaacctgcaggatactgaacaag1380

ccgtgaactaaaacagttcatatccctagcaaggcaaatgaaccggccatgctcgagaac1440

cgggtagatatggcaggaagaatgatccgtcggtcaggctgcttcgagcatgtcatgtca1500

ccactactactccaccgactacattccagcaacaataaccttgtttctccagacatcgtt1560

cgctgactagtttgtccgagtttcggaagttgaataagccaacatacacttcgggggatc1620

tcgttggtagaaaacgcaaggtacatgcagggcagcagggcacggatcttgactgcctgg1680

tctttcggcatgcgtctttctgcgtctttcccaccgatatcatcggcgaagcgagaaatc1740

cttcggcctggcccgtggaattttgtgtctcatgcctagggaggaaagatgttaggggaa1800

tcttcaccccagacttctttgtcgtttgtcacgtgctcgctgcaacctgctgatcgtcgc1860

caaatggggcggcgacgactttcctctgtaggactccttcccccctagccaaacggacgc1920

tgctcgccatcgcaacgccgtcccttgatgcatctccagaacacggctgcctagttgttc1980

gattaccaccagaagcaggggttgagacaccgatatccccttgataaacgttgtggcctg2040

acggttgaggtagccccacaggatgtcggcctcatggaccagagtcccaagtctagaatt2100

tccaaacagggtaactccacagagtgcccagatggtgtgctcctgatccaccgccatggt2160

tgtgtccattcacagccagtccctgtcagtatgcgaaggatccccagaagcggaaactga2220

aggatactactggaagctcaccagaacaatttagtgcctgtcaactaattgtaacatcac2280

gattcgctgcatgtgttgcaatgcaacccaattgagctgctctgctgaattcaactcttt2340

acaatcgccccctagatgcgccatggaatgcaccttaaccagttcagcgcatgccgtagt2400

tgagacaccctcccccacctagctatgggggccttaaatctacatgtgtataaagtgtgc2460

gtctcatcgacacggatgtggaaggccagatggactttggtctgacaacggcgattgacc2520

gatcaatagacatcttccgcaaacatggagggtccatctcgtgtgtacctttttggagac2580

cagaccagcgacatcgaagctggcctgcgccgtctgctccaagcgaagaatagtaccatt2640

gtttaaacgacgttaactgatattgaaggagcactttttgggcttggctggagctagtgg2700

aggtcaacaatgaatgcctattttggtttagtcgtccaggcggtgagcacaaaatttgtg2760

tcgtttgacaagatggttcatttaggcaactggtcagatcagccccacttgtagcagtag2820

cggcggcgctcgaagtgtgactcttattagcagacaggaacgaggacattattatcatct2880

gctgcttggtgcacgataacttggtgcgtttgtcaagcaaggtaagtgaacgacccggtc2940

ataccttcttaagttcgcccttcctccctttatttcagattcaatctgacttacctattc3000

tacccaagcatcgatatgaaaaagcctgaactcaccgcgacgtctgtcgagaagtttctg3060

atcgaaaagttcgacagcgtctccgacctgatgcagctctcggagggcgaagaatctcgt3120

gctttcagcttcgatgtaggagggcgtggatatgtcctgcgggtaaatagctgcgccgat3180

ggtttctacaaagatcgttatgtttatcggcactttgcatcggccgcgctcccgattccg3240

gaagtgcttgacattggggaattcagcgagagcctgacctattgcatctcccgccgtgca3300

cagggtgtcacgttgcaagacctgcctgaaaccgaactgcccgctgttctgcagccggtc3360

gcggaggccatggatgcgatcgctgcggccgatcttagccagacgagcgggttcggccca3420

ttcggaccgcaaggaatcggtcaatacactacatggcgtgatttcatatgcgcgattgct3480

gatccccatgtgtatcactggcaaactgtgatggacgacaccgtcagtgcgtccgtcgcg3540

caggctctcgatgagctgatgctttgggccgaggactgccccgaagtccggcacctcgtg3600

cacgcggatttcggctccaacaatgtcctgacggacaatggccgcataacagcggtcatt3660

gactggagcgaggcgatgttcggggattcccaatacgaggtcgccaacatcttcttctgg3720

aggccgtggttggcttgtatggagcagcagacgcgctacttcgagcggaggcatccggag3780

cttgcaggatcgccgcggctccgggcgtatatgctccgcattggtcttgaccaactctat3840

cagagcttggttgacggcaatttcgatgatgcagcttgggcgcagggtcgatgcgacgca3900

atcgtccgatccggagccgggactgtcgggcgtacacaaatcgcccgcagaagcgcggcc3960

gtctggaccgatggctgtgtagaagtactcgccgatagtggaaaccgacgccccagcact4020

cgtccgagggcaaaggaatagagtagatgccgaccggatcgatccacttaacgttactga4080

aatcatcaaacagcttgacgaatctggatataagatcgttggtgtcgatgtcagctccgg4140

agttgagacaaatggtgttcaggatctcgataagatacgttcatttgtccaagcagcaaa4200

gagtgccttctagtgatttaatagctccatgtcaacaagaataaaacgcgtttcgggttt4260

acctcttccagatacagctcatctgcaatgcattaatgcattggacctcgcaaccctagt4320

acgcccttcaggctccggcgaagcagaagaatagcttagcagagtctattttcattttcg4380

ggagacgagatcaagcagatcaacggtcgtcaagagacctacgagactgaggaatccgct4440

cttggctccacgcgactatatatttgtctctaattgtactttgacatgctcctcttcttt4500

actctgatagcttgactatgaaaattccgtcaccagcccctgggttgtttaaactgatgc4560

cgctcgctacctaatccttgaagagggcgaacaggttgaccgattgcttcttcttgactc4620

gcccttccccattggcttagagaagttgcccactcggctgtacggcttcatcaactcaat4680

gggtctctttggtgaaggcaacaaggctcccccggcctggttgctccctcatttcctggc4740

cttcattgattccctcgatacctacaaggccgtccccctcccctttgacgatccgaagtg4800

ggccaagaagatgccaaagacattcatggtctgggccaaggacggtatctgcagcaagcc4860

ggatgacccgtggcccgagccggacccggacggcaagccggacacgagagagatggtctg4920

gctcctcaagaaccggaccgacatgggacccaacaagtgggacacactcgtcgggcccca4980

aaacgtcggtggaatcactgtgatagagggtgcgaatcatttcaccatgactttgggacc5040

caaggctaaagaattgggctcgttcattggcaacgccatggccaattaaattgttatgca5100

ttacgccttcctccaagactcgcgctaggactgacaacactaccatcctattgatggaac5160

tcgcataataatccactaatgctggtgttgtaccccctcaggattcaagcacactattgt5220

tgtgattgcaatcggcgaattccgtggtgctaatggtctacctggttccgggttccttgg5280

agtgaagtgatgatgttgatgaaaaagacgaacgatgtgatatacgaacccctcatgtca5340

tttgctacatccttatcggagttagttgatatgtctcatctacgtacctatgttacttga5400

tttatgatagaatgccaatacgaaaaaaaagtcatatcaaatcagtgcccatgcccaatt5460

tgtgataagaatagagcactcgtagaatggaaaattgggagtctcacatctcccataacc5520

tagactaaccgataatacaaaacctctgcaagtttagatggtgactagaaccccaacaac5580

actggcaccgcaatcggcgataggaaacaaagaaacgtcccgatgaatgcaaggtaatcc5640

atctattccatctcatatcgagatgaatgcatagcatgcacagtatgcatgtgagcatgg5700

ataggagactaaagaggatggtgggaacgaatttgtttgtatgtttcattgggttgattg5760

gttatctggttgaacttctaatgcactgtaacccaatctagtcactcctgggagggacag5820

aacaagaccaggacttagcagcgcgtaaatactgagtaagaagatgcatatggtggacat5880

tcactccgcacctacatacatgatgggaagggaggaagagagacaagatgaagctgattt5940

agaggattattcggtaatcgggatgagatcggcgaggtatatgcactgtatgctgcggtg6000

gtcgggtaagtttgatggagcaggtagatagggaggcggggggaggtgatagataggata6060

gataggcagggagtagtatgaacagggaaagagaacctgatgcagagccgaaataggtat6120

gtatgcatgaatgtatgcaaggaggcgaatacgagggaggccgaacgtcgattgatgagt6180

ggcgtctgggtcggttggtggttggctgatggactgacggatcggtcgaattggaaggaa6240

gaagttggtaggtagtgagaggtagggtggtatcgatgtatcgaactaaagaggcatttc6300

ggagctgaatctgagcgcactaccgcgacctgcaagcgatgaaccattgttgatgccagg6360

actcgtgggccggctattacctgcagtccatttggggcttcgcggctgtgtgctggttga6420

gcgagtggacgggcgatttttccgaatttcccgaagttcttcttccttccggcggagcag6480

atcttcgcgggacgtgagggttgcttcgagttcgagaacccgcgcgagatggcgggcttc6540

gtcgttcttcgcgttgagttcgcgcagatgggtggcgtctccttcgaccttccgtttcag6600

ggtttcgttctcgctgcgcagttggcgaagctcgttgcctgattgtgcggccactgtcga6660

ggcggtctggtactgttcgcgcgtgtattccgcttgtcgggcttcgtactcggctttgcg6720

ttctagcgatgcattgtctttagtcagacgccgaatgtcttcccttgctgattcgagttc6780

ggctgcgctgcccccgcctgctttgagggatgcgcgggcctcttcgagttcgtgtcggag6840

ctgggtccgttcgtccttcaatttcatgagctcttccttctgcttttcgactcgctggtc6900

ggatgtggtcttagcttgggtgagacggtcatgctcccgtcggagtttgtggaagtcttt6960

ggttcttgtctcgtaacggtgctgcagcttttccagcacgttctctctttcctgaagacg7020

ggcttgggctcc7032

<210>43

<211>42

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>43

gattacgccaagctgcccttactgtagcagcggagtaagatg42

<210>44

<211>35

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>44

catcagtttaaacaatggtactattcttcgcttgg35

<210>45

<211>50

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>45

gcgaagaatagtaccattgtttaaacgacgttaactgatattgaaggagc50

<210>46

<211>48

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>46

ttaggtagcgagcggcatcagtttaaacaacccaggggctggtgacgg48

<210>47

<211>38

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>47

gtaccattgtttaaactgatgccgctcgctacctaatc38

<210>48

<211>39

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>48

ggcgaattgaagctgcccttggagcccaagcccgtcttc39

<210>49

<211>2000

<212>dna

<213>artificialsequence

<220>

<223>mhad-alba-hph序列

<400>49

atcattggtatgtctggaagatttcctgactcggatggtgacgttaactgatattgaagg60

agcactttttgggcttggctggagctagtggaggtcaacaatgaatgcctattttggttt120

agtcgtccaggcggtgagcacaaaatttgtgtcgtttgacaagatggttcatttaggcaa180

ctggtcagatcagccccacttgtagcagtagcggcggcgctcgaagtgtgactcttatta240

gcagacaggaacgaggacattattatcatctgctgcttggtgcacgataacttggtgcgt300

ttgtcaagcaaggtaagtgaacgacccggtcataccttcttaagttcgcccttcctccct360

ttatttcagattcaatctgacttacctattctacccaagcatcgatatgaaaaagcctga420

actcaccgcgacgtctgtcgagaagtttctgatcgaaaagttcgacagcgtctccgacct480

gatgcagctctcggagggcgaagaatctcgtgctttcagcttcgatgtaggagggcgtgg540

atatgtcctgcgggtaaatagctgcgccgatggtttctacaaagatcgttatgtttatcg600

gcactttgcatcggccgcgctcccgattccggaagtgcttgacattggggaattcagcga660

gagcctgacctattgcatctcccgccgtgcacagggtgtcacgttgcaagacctgcctga720

aaccgaactgcccgctgttctgcagccggtcgcggaggccatggatgcgatcgctgcggc780

cgatcttagccagacgagcgggttcggcccattcggaccgcaaggaatcggtcaatacac840

tacatggcgtgatttcatatgcgcgattgctgatccccatgtgtatcactggcaaactgt900

gatggacgacaccgtcagtgcgtccgtcgcgcaggctctcgatgagctgatgctttgggc960

cgaggactgccccgaagtccggcacctcgtgcacgcggatttcggctccaacaatgtcct1020

gacggacaatggccgcataacagcggtcattgactggagcgaggcgatgttcggggattc1080

ccaatacgaggtcgccaacatcttcttctggaggccgtggttggcttgtatggagcagca1140

gacgcgctacttcgagcggaggcatccggagcttgcaggatcgccgcggctccgggcgta1200

tatgctccgcattggtcttgaccaactctatcagagcttggttgacggcaatttcgatga1260

tgcagcttgggcgcagggtcgatgcgacgcaatcgtccgatccggagccgggactgtcgg1320

gcgtacacaaatcgcccgcagaagcgcggccgtctggaccgatggctgtgtagaagtact1380

cgccgatagtggaaaccgacgccccagcactcgtccgagggcaaaggaatagagtagatg1440

ccgaccggatcgatccacttaacgttactgaaatcatcaaacagcttgacgaatctggat1500

ataagatcgttggtgtcgatgtcagctccggagttgagacaaatggtgttcaggatctcg1560

ataagatacgttcatttgtccaagcagcaaagagtgccttctagtgatttaatagctcca1620

tgtcaacaagaataaaacgcgtttcgggtttacctcttccagatacagctcatctgcaat1680

gcattaatgcattggacctcgcaaccctagtacgcccttcaggctccggcgaagcagaag1740

aatagcttagcagagtctattttcattttcgggagacgagatcaagcagatcaacggtcg1800

tcaagagacctacgagactgaggaatccgctcttggctccacgcgactatatatttgtct1860

ctaattgtactttgacatgctcctcttctttactctgatagcttgactatgaaaattccg1920

tcaccagcccctgggtttcgctacctaatccttgaagagggcgaacaggttgaccgattg1980

cttcttcttgactcgccctt2000

<210>50

<211>64

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>50

atcattggtatgtctggaagatttcctgactcggatggtagacgttaactgatattgaag60

gagc64

<210>51

<211>60

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>51

aagggcgagtcaagaagaagcaatcggtcaacctgttcgcaacccaggggctggtgacgg60

<210>52

<211>21

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>52

ggttggagattccagactcag21

<210>53

<211>22

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>53

ggatttctcaccaccagataag22

<210>54

<211>25

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>54

gatagatcgtatttcaaatgatacc25

<210>55

<211>27

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>55

ctctcctttgcctaattagatatgtgg27

<210>56

<211>35

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>56

gactctatataatttgagtcaataaccgaataaac35

<210>57

<211>21

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>57

acatacgaccacagggtgtgg21

<210>58

<211>23

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>58

aaaaaagcaccgactcggtgcca23

<210>59

<211>24

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>59

caccttcaagtccgccatgcccga24

<210>60

<211>24

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>60

aaactcgggcatggcggacttgaa24

<210>61

<211>28

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>61

catcggcctcgccatcggcaccaactcc28

<210>62

<211>28

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>62

ggtgccgatggcgaggccgatggagtac28

<210>63

<211>28

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>63

cgatgtcgatgccatcgtccctcagtcc28

<210>64

<211>28

<212>dna

<213>artificialsequence

<220>

<223>引物

<400>64

gagggacgatggcatcgacatcgtaatc28

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1