一种基因组编辑载体、其组成的基因组编辑系统及应用的制作方法

文档序号:14657812发布日期:2018-06-12 07:30阅读:477来源:国知局

本发明属于基因工程和生物技术领域,涉及一种CRISPR/Cas9系统的开发,具体涉及一种基因组编辑载体、其组成的基因组编辑系统及应用,尤其涉及一种嗜热真菌基因组DNA编辑载体、其组成的基因组编辑系统CRISPR/Cas9及编辑方法和应用。



背景技术:

毁丝霉属菌株(Myceliophthora)是一种能够快速降解纤维素的嗜热丝状真菌,有较快的代谢率,能够分泌大量的木质纤维素水解酶,其酶系的种类和数量相当丰富。与工业纤维素酶生产菌里氏木霉、斜卧青霉相比,嗜热毁丝霉的高温发酵和所产酶系在高温下有高活力和高稳定性优势,成为天然耐高温纤维素酶储存库,是一类非常具有开发潜力的木质纤维素产酶体系。虽然近年来随着基因组测序的完成和发布,嗜热毁丝霉基因组内各类酶的开发取得了相当的进展,2011年嗜热毁丝霉基因组测序的完成和发布,这将会极大促进对其的开发研究。但是嗜热毁丝霉本身的遗传改造研究少之又少,更缺乏成熟的可回收基因筛选标记,导致嗜热毁丝霉的基因组多位点编辑更是难以企及。因此,对嗜热毁丝霉进行基因组遗传的操作编辑,已经成为当前研究的热点,一直受到各国政府,企业,科研机构的广泛关注。

基因组的定点编辑技术是基因功能研究的重要手段之一,对基因治疗、育种研究和代谢改造等都具有重要的意义和价值,是当前的研究热点。研究表明,如果在基因组DNA靶位点上引入双链断裂(Double Strand Breaks,DSBs),细胞中相应的同源重组效率比自发同源重组大大提高,这一发现给基因组靶向修饰技术带来了希望。为了能够在基因组DNA上引入位点特异性的DSBs,近年来研究者们先后开发了几代特异性的人工核酸内切酶技术,其中包括锌指核酸酶(Zinc finger nucleases,ZFNs),TALE核酸酶(Transcription activator-like effector nuclease,TALENs)技术和近期迅猛崛起的CRISPR/Cas9核酸酶技术。

CRISPR位点和Cas相关基因共同构成CRISPR/Cas系统,该系统是细菌和古细菌中存在的一种获得性免疫系统,通过编码一些特殊的蛋白及RNA共同对抗噬菌体和质粒等外来DNA的入侵。对来源于酿脓链球菌II型CRISPR/Cas系统的体外研究表明,只需要Cas9、crRNA及tracrRNA(trans-activating crRNA)三者共同存在的情况便可以实现对DNA分子的特异性识别和切割。研究者发现将crRNA和tracrRNA用一个Loop环(GAAA)连接成一个单链的嵌合体结构即单链的导向RNA(single guide RNA,sgRNA),采用单一的sgRNA成功地指导了Cas9对靶序列DNA的切割,这一发现为CRISPR/Cas9核酸酶技术的开发奠定了基础。基于上述研究的发现,CRISPR/Cas9系统已经被报道在许多哺乳动物和植物的基因组编辑研究中获得了成功应用,与此同时,也有研究者尝试对微生物进行基因编辑,包括对酵母、丝状真菌、细菌、噬菌体及病毒进行基因编辑也取得了相应的成功。

尽管在一些中温的真菌中CRISPR/Cas9系统被成功的开发,但是CRISPR/Cas9系统能否在耐高温的丝状真菌细胞内工作,尤其是能否发现高效诱导引导RNA(gRNA)在嗜热真菌体内表达的RNA聚合酶III型启动子,包括Cas9和gRNA是否能够通过体内转录的方式引入嗜热毁丝霉细胞中对靶位点进行成功编辑,以及能否特异性地打靶嗜热真菌基因组DNA,至今这些研究尚未有报道和阐释。

因此,开发能够显著提高嗜热真菌基因组辑效率的方法成为本领域迫切需要解决的一个技术问题。



技术实现要素:

本发明的目的是提供一种基因组编辑载体、其组成的基因组编辑系统及应用,尤其涉及一种嗜热真菌基因组DNA编辑载体、其组成的基因组编辑系统CRISPR/Cas9及编辑方法和 应用,所述系统能够显著提高丝状真菌基因组的编辑效率,所述基因组编辑系统可以对嗜热真菌的多个靶标位点进行编辑,从而获得一种稳定的遗传性状的基因编辑突变株,能够高产纤维素酶。

为达此目的,本发明采用以下技术方案:

第一方面,本发明提供一种基因组编辑载体,所述基因组编辑载体包括启动sgRNA的编码DNA转录的启动子,所述启动子为RNA聚合酶III型U6型启动子。

现有技术目前没有在嗜热真菌中发现RNA聚合酶III型U6启动子,本发明通过blast比对发现,发现本发明的RNA聚合酶III型U6型启动子同源性极低,小于25%,再通过上下游,核苷酸序列结构等综合分析,申请人确定了一个启动子序列,命名为U6p,申请人在后续的实验的验证测试中意外发现其具有转录sgRNA的功能。

根据本发明,所述RNA聚合酶III型U6型启动子为嗜热毁丝霉RNA聚合酶III型U6型启动子。

优选地,所述RNA聚合酶III型U6型启动子的核苷酸序列如SEQ ID NO.1所示。

根据本发明,所述基因组编辑载体还包括所述RNA聚合酶III型U6型启动子调控的sgRNA转录的表达框。

优选地,所述sgRNA转录的表达框为RNA聚合酶III型U6型启动子调控的sgRNA转录,其中包括对基因amdS,cre1,res1,gh1-1和alp1的靶向位点,U6p-amdS-sgRNA、U6p-cre1-sgRNA、U6p-res1-sgRNA、U6p-gh1-1-sgRNA或U6p-alp1-sgRNA中的任意一种或至少两种的组合。

优选地,所述U6p-amdS-sgRNA的核苷酸序列如SEQ ID NO.2所示;

优选地,所述U6p-cre1-sgRNA的核苷酸序列如SEQ ID NO.3所示;

优选地,所述U6p-res1-sgRNA的核苷酸序列如SEQ ID NO.4所示;

优选地,所述U6p-gh1-1-sgRNA的核苷酸序列如SEQ ID NO.5所示;

优选地,所述U6p-alp1-sgRNA的核苷酸序列如SEQ ID NO.6所示。

本发明中,所述cre1为碳分解代谢物阻遏效应转录因子cre1(MYCTH_2310085),所述res1为内质网压力响应的调控因子res1(MYCTH_2302052),所述gh1-1为葡萄糖苷酶基因gh1-1(MYCTH_115968),所述alp1为碱性蛋白酶alp1(MYCTH_2303011)。

优选地,所述基因组编辑载体还包括Cas9蛋白的表达框。

优选地,所述Cas9蛋白的表达框包括Ptef1启动子、Ptef1启动子调控的Cas9蛋白和TrprC终止子。

优选地,所述Ptef1启动子为嗜热毁丝霉翻译延伸因子TEF1A的启动子。

优选地,所述Ptef1启动子的核苷酸序列如SEQ ID NO.7所示。

优选地,所述Cas9蛋白的氨基酸序列如SEQ ID NO.8所示,所述Cas9蛋白的核苷酸序列如SEQ ID NO.9所示。

任选地,所述Cas9蛋白的表达框还包括绿色荧光标记蛋白。

本发明中,所述绿色荧光标记蛋白为eGFP基因,其作用主要是用来示踪基因组编辑的过程,在实际实验中,绿色荧光标记蛋白可选择性串联。

优选地,所述Cas9蛋白的表达框的核苷酸序列如SEQ ID NO.10-11所示。

本发明中,所述SEQ ID NO.10是没有串联绿色荧光标记蛋白的Cas9蛋白的表达框,所述SEQ ID NO.11是串联绿色荧光标记蛋白的Cas9蛋白的表达框。

本发明sgRNA转录的表达框和Cas9蛋白的表达框可以对丝状真菌的多个靶标位点进行编辑,sgRNA转录的表达框可对所述5个基因位点(amdS、cre1、res1、gh1-1和alp1)进行识别,再通过Cas9蛋白的表达框进行编辑任意一个基因位点,根据所要编辑的基因位点导入相应的sgRNA转录的表达框即可实现该基因位点的编辑,且本发明可同时编辑所述的5个基因位点,也可以单独编辑其中一个基因位点。

第二方面,本发明提供一种基因组编辑的系统,所述系统包括如第一方面所述的基因组编辑载体。

根据本发明,所述系统还包括同源供体DNA序列;

优选地,所述同源供体DNA序列包括donor-cre1、donor-res1、donor-gh1-1或donor-alp1中的任意一种或至少两种的组合;

优选地,所述donor-cre1的核苷酸序列如SEQ ID NO.12所示;

优选地,所述donor-res1的核苷酸序列如SEQ ID NO.13所示;

优选地,所述donor-gh1-1的核苷酸序列如SEQ ID NO.14所示;

优选地,所述donor-alp1的核苷酸序列如SEQ ID NO.15所示。

本发明所述的供体DNA序列是由donor-cre1、donor-res1、donor-gh1-1和donor-alp1左右两条同源片段与抗性基因neo通过Gibson Assembly的方法扩增而成,通过将所述同源供体DNA序列一起导入丝状真菌细胞,可实现同源重组,效率高达90-100%,若不导入供体DNA序列也能通过非同源端连接(NHEJ)实现所述基因位点的编辑。

本发明中,将Cas9蛋白的表达框和U6p-amdS-sgRNA转录的表达框共转化进入嗜热毁丝霉Δubx8::amdS的原生质体细胞后,通过非同源端连接(NHEJ)对amdS位点特异性DSB的不精确修复,进而得到基因组编辑突变株Δubx8ΔamdS。

本发明中,将Cas9蛋白的表达框和U6p-cre1-sgRNA转录的表达框及donor-cre1分别共转化进入野生型菌株M.thermophile ATCC 42464和M.heterothallica CBS 203.75原生质体细胞后,通过同源重组获得基因编辑突变株ΔMtcre1和ΔMhcre1,其同源重组效率高达90-95%。

本发明中,将sgRNA转录的表达框及其供体DNA序列共转化进入嗜热毁丝霉Δubx8ΔamdS的原生质体细胞后,通过同源重组得到基因编辑突变株,包括单基因突变株Δubx8ΔamdSΔcre1,Δubx8ΔamdSΔres1,Δubx8ΔamdSΔalp1和Δubx8ΔamdSΔgh1-1,和基因组多位点同时编辑突变株Δubx8ΔamdSΔcre1Δres1,Δubx8ΔamdSΔcre1Δgh1-1,Δubx8ΔamdSΔgh1-1Δres1,Δubx8ΔamdSΔcre1Δgh1-1Δres1和Δubx8ΔamdSΔcre1Δgh1-1Δres1Δalp1。

本发明中,通过通过构建CRISPR-Cas9介导的基因编辑系统在两种毁丝霉属菌株M.thermophile和M.heterothallica基因组编辑系统,可显著提高其编辑效率,单基因缺失的同源重组效率高达100%,还可以同时编辑多基因位点,其中双基因缺失的同源重组效率为61-69%,三基因的同源重组效率为30%,四基因的同源重组效率为21%。

本发明中,通过基因组多位点编辑获得的突变体菌株Δubx8ΔamdSΔcre1Δgh1-1Δalp1,Δubx8ΔamdSΔcre1Δgh1-1Δres1和Δubx8ΔamdSΔcre1Δgh1-1Δres1Δalp1,这些突变菌株能够纤维素为诱导物表达生产纤维素酶,提升木质纤维素降解能力和纤维素酶生产能力,在添加有机氮源蛋白胨的条件下,摇瓶发酵蛋白产量均超过0.80g/L,其对照野生型菌株蛋白产量仅为0.12g/L。

第三方面,本发明提供一种宿主细胞,包含有如第一方面所述的基因组编辑的载体或如第二方面所述的基因组编辑的系统。

优选地,所述宿主细胞为真菌细胞,优选为丝状真菌细胞,进一步优选为嗜热真菌细胞。

优选地,所述宿主细胞选自但不限于毁丝霉属、梭孢壳霉属、木霉、脉孢菌、青霉、镰刀霉、曲霉属或根霉属中的任意一种或至少两种的混合,优选为嗜热毁丝霉属和/或异梭毁丝霉。

第四方面,本发明提供一种基因组编辑的方法,包括如下步骤:利用CRISPR/Cas技术对第三方面所述的宿主细胞进行基因组编辑。

根据本发明,使用原生质体共转化的方法将第二方面所述的基因组编辑的系统导入到第三方面所述的宿主细胞中,在所述宿主细胞中的待编辑的基因组位点进行基因组编辑,利用筛选标记挑选转化子并获得具有稳定遗传性状的基因编辑突变株。

优选地,所述基因组编辑的系统导入的过程中的所述Cas9蛋白的表达框和所述sgRNA转录的表达框的分子摩尔比为1:(0.1-3),例如可以是1:0.1、1:0.2、1:0.3、1:0.4、1:0.5、1:0.6、1:0.7、1:0.8、1:0.9、1:1、1:1.2、1:1.3、1:1.5、1:1.6、1:1.9、1:2、1:2.1、1:2.2、1:2.3、1:2.5、1:2.6、1:2.8或1:3,优选为1:(0.5-2),进一步优选为1:1,以及上述数值之间的具体点值,限于篇幅及出于简明的考虑,本发明不再穷尽列举所述范围包括的具体点值。

优选地,所述基因组编辑的系统导入的过程中的所述Cas9蛋白的表达框、所述sgRNA转录的表达框和所述同源供体DNA序列的分子摩尔比为1:(0.1-3):(0.1-3),例如可以是1:0.1:0.1、1:0.2:0.1、1:0.3:0.2、1:0.4:0.2、1:0.5:0.5、1:0.6:0.5、1:0.7:0.6、1:0.8:0.8、1:0.9:0.9、1:0.9:0.8、1:1:0.1、1:1:0.3、1:1:0.5、1:1:0.8、1:1:1、1:1.2:1、1:1.3:1、1:1.5:1.2、1:1.6:1.5、1:1.9:1.8、1:2:1、1:2.1:2、1:2.2:1、1:2.3:2、1:2.5:2.3、1:2.6:2.5、1:2.8:2.8、1:2.8:3或1:3:3,优选为1:(0.5-2):(0.5-2),进一步优选为1:1:1,以及上述数值之间的具体点值,限于篇幅及出于简明的考虑,本发明不再穷尽列举所述范围包括的具体点值。

本发明中,具体的将基因编辑的载体和供体DNA序列共转化进入宿主细胞中的方法不作限定,本领域技术人员可以根据实际需要采用本领域公知的技术进行。

本发明通过所述方法对嗜热毁丝霉进行基因编辑,所述基因组编辑载体的转化子包括Cas9OE、Cas9-gfp和基因编辑突变菌株,所述Cas9OE和Cas9-gfp能够在嗜热毁丝霉中稳定表达Cas9,且对菌株生长形态、产孢能力、对蛋白的分泌水平和纤维素酶酶活力均无影响,结果与野生型一致;将基因编辑突变菌株能够以纤维素为碳源的显著提高蛋白分泌水平和纤维素酶活力和高产纤维素酶系菌株,以及生物质降解能力得到提升。

本发明是以丝状真菌为出发菌株,敲除其中碳分解代谢物阻遏效应转录因子cre1(MYCTH_2310085)、内质网压力响应的调控因子res1(MYCTH_2302052)、葡萄糖苷酶基因gh1-1(MYCTH_115968)和碱性蛋白酶alp1(MYCTH_2303011),或上述将任意4个基因部分碱基突变而得到,或是减弱上述4个基因的表达而得到所述宿主细胞,所述宿主细胞能够高产纤维酶素。

第五方面,本发明提供一种如第一方面所述的基因组编辑载体、如第二方面所述的基因组编辑的系统或如第四方面所述的基因组编辑的方法用于真菌细胞中基因功能的研究和/或基因工程改造育种。

优选地,所述真菌细胞为丝状真菌细胞,优选为嗜热真菌细胞,进一步优选为毁丝霉属、梭孢壳霉属、木霉、脉孢菌、青霉、镰刀霉、曲霉属或根霉属中的任意一种或至少两种的混合,最优选为优选为嗜热毁丝霉属和/或异梭毁丝霉。

与现有技术相比,本发明具有的有益效果:

(1)本发明提供一种高效快速的CRISPR-Cas9介导的基因组编辑载体和基因组编辑的系统,应用该系统能够显著提高毁丝霉菌株M.thermophile和M.heterothallica基因组编辑效率,可以实现毁丝霉基因组多位点的同时编辑,进而获得多基因突变体菌株,该系列突变菌株能够显著提升纤维素酶生产能力,能够用于高产纤维素酶的嗜热真菌基因工程的改造;

(2)本发明开发CRISPR-Cas9基因组编辑系统能够促进嗜热毁丝霉基因功能的研究,同时对嗜热工业纤维素酶生产菌株的基因组定向编辑和代谢工程改造有着重要意义。

附图说明

图1为Cas9表达载体p0380-bar-Ptef1-Cas9-TtprC和sgRNA表达载体U6p-sgRNA示意图;

图2为表达载体p0380-bar-Ptef1-Cas9-eGFP-TtprC转化嗜热毁丝霉细胞后Cas9定位示意图;

图3为转化子Cas9OE和野生菌株WT菌落生长(A),在2%微晶纤维素生长条件下发酵上清的蛋白分泌(B),发酵上清的SDS-PAGE电泳分析图(C),纤维素酶活力(D)-(F) 和菌丝干重图(G);

图4为靶基因amdS的编缉示意图(A)和测序结果(B);

图5为嗜热毁丝霉(A)和异梭毁丝霉(B)靶基因cre1突变菌株的PCR鉴定核酸电泳图;

图6为嗜热毁丝霉靶基因cre1、res1、gh1-1和alp1单基因编缉突变菌株的PCR鉴定核酸电泳图;

图7为嗜热毁丝霉靶基因cre1、res1和gh1-1双基因同时编缉突变菌株的PCR鉴定核酸电泳图;

图8为嗜热毁丝霉靶基因cre1、res1和gh1-1三基因同时编缉突变菌株的PCR鉴定核酸电泳图;

图9为嗜热毁丝霉靶基因cre1、res1、gh1-1和alp1四基因同时编缉突变菌株的PCR鉴定核酸电泳图;

图10为嗜热毁丝霉和异梭毁丝霉cre1基因编辑突变菌株ΔMtcre1和ΔMhcre1在微晶纤维素条件下发酵上清的蛋白分泌(A),发酵上清的SDS-PAGE电泳分析图(B),内切纤维素酶活力(C),木聚糖酶活力图(D)和外切纤维素酶活力图(E);

图11(A)为嗜热毁丝霉基因编辑突变菌株发酵上清的SDS-PAGE电泳分析图,图11(B)为嗜热毁丝霉基因编辑突变菌株在微晶纤维素条件下发酵上清的蛋白分泌,图11(C)为嗜热毁丝霉基因编辑突变菌株的内切纤维素酶活力;图11(D)为嗜热毁丝霉基因编辑突变菌株的木聚糖酶活力图,图(E)为嗜热毁丝霉基因编辑突变菌株的外切纤维素酶活力图。

具体实施方式

本发明人经过广泛而深入的研究,设计和开发了特异性识别和切割毁丝霉基因组指定位点序列的CRISPR/Cas9基因编辑系统,该系统能够显著提高两种毁丝霉属菌株包括嗜热毁丝霉M.thermophila和异梭毁丝霉M.heterothallica基因组编辑效率,利用本发明基因编辑系统可以对嗜热毁丝霉的基因组同时进行多位点编辑,获得多基因缺失的突变体工程菌株,突变体工程菌株能够显著提升纤维素酶生产能力,从而提供一种提高嗜热真菌产纤维素酶分泌能力的菌种改造方法。在此基础上,完成了本发明。

下述实施例中所用方法如无特别说明均为常规方法,具体步骤可参见:《Molecular Cloning:A Laboratory Manual》(Sambrook,J.,Russell,David W.,Molecular Cloning:A Laboratory Manual,3rd edition,2001,NY,Cold Spring Harbor)。

所出现的百分比浓度如无特别说明均为质量百分浓度。

实施例中描述到的各种生物材料的取得途径仅是提供一种实验获取的途径以达到具体公开的目的,不应成为对本发明生物材料来源的限制。事实上,所用到的生物材料的来源是广泛的,任何不违反法律和道德伦理能够获取的生物材料都可以按照实施例中的提示替换使用。

实施例中所采用的原始出发菌株嗜热毁丝霉ATCC 42464购自美国模式培养物集存库(American type culture collection),实施例中所采用的原始出发菌株异梭毁丝霉CBS 203.75均购买于Centraalbureau voor Schimmelcultures CBS Fungal Biodiversity Centre真菌生物多样性中心,为商业渠道获得。

“MYCTH_……”为嗜热毁丝霉的基因位点编号。

Cas9蛋白密码子偏好性优化和人工合成均由上海英潍捷基贸易有限公司Invitrogen完成。gRNA由上海英潍捷基贸易有限公司Invitrogen合成。

所用引物和核酸测序均由金唯智生物科技有限公司合成。

基因组编辑

如本文所用,“基因组编辑”是指对生物的基因组DNA进行删除、插入或者替换,从而达到对目的序列修改的目的。

靶标位点

如本文所用,术语“靶标位点”或“protospacer”是限定核酸的一部分的核酸序列,是指gRNA 5′端的20碱基的序列,这段序列与目的DNA序列相同,在存在足以结合的条件下,gRNA需要这段序列与目的DNA结合,Cas9与gRNA的复合体对目的DNA进行剪切。

非同源端连接(NHEJ)

如本文所用,“非同源端连接(NHEJ)”是指细胞内普遍存在的DNA双链断裂(DSB)后的一种修复方式,NHEJ可在整个细胞周期发生,因为修复不需要模板,只基于断裂末端的结构而容易产生错误,包括缺失、插入和点突变。

同源重组

如本文所用,“重组”是指两个多核苷酸之间交换遗传信息的过程。就本发明而言,“同源重组(HR)”是指在通过同源定向修复机制修复细胞内双链断裂期间所发生的此类交换的特殊形式。这一过程需要核苷酸序列同源,使用“供体”分子为模板来修复“靶标位点”分子(即发生双链断裂的分子),因为其导致遗传信息从供体转移到靶上。

供体DNA序列

如本文所用,“序列”是指任意长度的核苷酸序列,其可以是DNA或RNA;可以是线状、环状或分支状,而且可以是单链或者双链。术语“供体DNA序列”是指被插入基因组中的核苷酸序列。供体序列可以为任意长度,例如,优选长度在约500个与3,000个核苷酸之间(或它们之间的任意整数值)。

为更进一步阐述本发明所采取的技术手段及其效果,以下结合本发明的优选实施例来进一步说明本发明的技术方案,但本发明并非局限在实施例范围内。

实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件,或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可通过正规渠道商购获得的常规产品。

实施例1:构建CRISPR-Cas9介导的毁丝霉基因组编辑载体

(1)Cas9表达框载体的构建

以p0380-bar(Liu Q,Li J,Ying S,Wang J,Sun W,Tian C,Feng M.2015.Unveiling equal importance of two 14-3-3 proteins for morphogenesis,conidiation,stress tolerance and virulence of an insect pathogen.Environ Microbiol.17:1444–1462)为骨架构建表达载体。参照嗜热毁丝霉的基因组,对来自酿脓链球菌的Cas9蛋白进行密码子偏好性优化,同时在Cas9蛋白的N-端和C-端添加嗜热毁丝霉转录因子hacI(MYCTH_2310995)的核定位序列(PPRKRAKTEDE),其氨基酸序列和核苷酸序列分别为SEQ ID No.8和SEQ ID No.9所示。

将密码子优化的Cas9置于翻译延伸因子TEF1A(MYCTH_2298136)的启动子Ptef1下进行转录表达,Ptef1核苷酸序列如SEQ ID NO.7所示,同时选用构巢曲霉TtrpC为终止子,以带有草丁膦抗性基因bar为真菌转化筛选标记。载体构建所需的PCR引物序列如表1所示,PCR反应体系为:5×phusion HF buffer 10μL,10mM dNTPs 1μL,GLT-F 2.5μL,GLT-R 2.5μL,模板DNA 1μL,Phusion DNA聚合酶0.5μL,水32.5μL;PCR反应条件为:先98℃30s;然后98℃10s,65℃30s,72℃2.5min,34个循环;最后72℃10min,4℃10min。

如图1所示,采用Gibson Assembly技术体系对上述多个PCR片段进行快速组装到由限制性内切酶SpeI和EcoRI双酶切的质粒p0380-bar上,从而构建Cas9表达框质粒p0380-bar-Ptef1-Cas9-TtprC和带有绿色荧光蛋白eGFP融合蛋白Cas9-eGFP的质粒p0380-bar-Ptef1-Cas9-eGFP-TtprC,其序列分别为SEQ ID No.9和SEQ ID No.10所示。

(2)sgRNA表达框载体的构建

以Homo sapiens U6 small nuclear RNA序列为参照,在嗜热毁丝霉的基因组中进行生物信息的分析比对,发现了RNA polymerase III U6 snRNA基因,以嗜热毁丝霉RNA polymerase III U6 snRNA以上游464bp为启动子U6p转录表达sgRNA,U6p启动子核苷酸序列如序列表中SEQ ID NO.1所示,根据软件sgRNACas9 tool设计protospacer即靶标位点。采用融合PCR的方法将序列U6p启动子、protospacer及sgRNA连接在一起,具体方法为采用基因重叠延伸(SOE)方法,由Horton et al.1989发明(Horton RM,Hunt HD,Ho SN,Pullen JK,Pease LR.1989.Engineering hybrid genes without the useof restriction enzymes:gene splicing-by-overlap extension.Gene 77:61-68)。

载体构建所需的PCR引物序列如表1所示,PCR反应体系为:5×phusion HF buffer 10μL,10mM dNTPs 1μL,GLT-F 2.5μL,GLT-R 2.5μL,模板DNA 1μL,Phusion DNA聚合酶0.5μL,水32.5μL;PCR反应条件为:先98℃30s;然后98℃10s,65℃30s,72℃1min,34个循环;最后72℃10min,4℃10min。

如图1所示,通过SOE-PCR的扩增形成sgRNA表达质粒U6p-amdS-gRNA,U6p-cre1-gRNA,U6p-res1-gRNA,U6p-gh1-1-gRNA和U6p-alp1-gRNA,其序列分别为SEQ ID No.2,SEQ ID No.3,SEQ ID No.4,SEQ ID No.5和SEQ ID No.6所示。

(3)供体DNA序列的构建

所述的供体DNA序列(donor-cre1,donor-res1,donor-gh1-1和donor-alp1)片段由左右两条600bp同源片段与带有G418抗性基因neo构成,其所需的PCR引物序列如表1所示,PCR反应体系为:5×phusion GC buffer 10μL,10mM dNTPs 1μL,GLT-F 2.5μL,GLT-R 2.5μL,模板DNA 1μL,Phusion DNA聚合酶0.5μL,水32.5μL;PCR反应条件为:先98℃30s;然后98℃10s,65℃30s,72℃1min,34个循环;最后72℃10min,4℃10min。

左右两条600bp同源片段与带有G418抗性neo基因3个PCR片段通过Gibson Assembly的方法连接到由限制性内切酶SpeI和EcoRI双酶切的质粒pCAMBIA-0380(其NCBI编号为AF234290),其序列分别为SEQ ID No.12,SEQ ID No.13,SEQ ID No.14和SEQ ID No.15所示。

表1

实施例2:在嗜热毁丝霉中稳定表达Cas9

将带有Cas9表达框的质粒p0380-bar-Ptef1-Cas9-TtprC和带有绿色荧光蛋白融合蛋白的质粒p0380-bar-Ptef1-Cas9-eGFP-TtprC通过根瘤农杆菌介导的转化技术导入到嗜热毁丝霉中。

(1)嗜热毁丝霉菌株的培养

将嗜热毁丝霉ATCC 42464在MM斜面培养基]上45℃培养10天后待用。

MM斜面培养基:50×Vogel’s盐20mL,蔗糖20g,琼脂15g,定容体积到1L,高压灭菌。50×Vogel’s盐(1L):柠檬酸三钠(1/2H2O)150g,无水KH2PO4 250g,无水NH4NO3 100g,MgSO4·7H2O 10g,CaCl2·2H2O 5g,微量元素盐溶液5mL,生物素(0.1mg/mL)2.5mL,定容体积到1L。

(2)根癌农杆菌介导的嗜热毁丝霉转化

载体的农杆菌转化质粒p0380-bar-Ptef1-Cas9-TtprC和p0380-bar-Ptef1-Cas9-eGFP-TtprC通过化学转化法导入农杆菌AGL-1中。转化程序简述如下,首先将1μL质粒加入到农杆菌感受态细胞中,混匀,置于液氮中速冻5min后再于37℃热激5min,冰上处理2min后迅速转入装有1mL LB培养液(不加抗生素)的试管中,28℃下220r/min振荡培养2~3h。取100μL菌液涂布于LB(含50μg/mL羧苄霉素和50μg/mL卡那霉素)平板上,于28℃继续培养2~3天后,挑斑鉴定,阳性转化子保存备用。

根癌农杆菌介导的真菌转化将上述带有敲除载体的农杆菌划线于LB平板(含50μg/mL羧苄霉素和50μg/mL卡那霉素)上,28℃活化培养36h后,挑取单菌落于3mL LB培养液(羧苄霉素、卡那霉素含量同上)中,28℃下250r/min振荡培养24h。离心(10000r/min)2min收集菌体,用IM培养基(含10mM葡萄糖和400μM乙酰丁香酮)重悬菌体至OD值0.15,体积约为5~10mL(50mL三角瓶中)。相同条件下继续避光孵育6h至菌液OD600达到0.4左右,待用。制备嗜热毁丝霉ATCC 42464孢子悬液,从培养10天的MM平板上挑取适量孢子粉于1.5mL 0.02%吐温20中,涡旋震荡分散均匀后用脱脂棉过滤除去菌丝,滤液3000r/min离心1min收集孢子。去上清,用1mL 0.02%吐温20重悬孢子,血球计数板计数,将孢子悬液调到107个/mL。取孢子悬液和上述农杆菌菌液各100μL,充分混匀后,涂布于IMAS(含5mM葡萄糖和400μM乙酰丁香酮)平板上,25℃避光共孵育2天后,用3~5mL无菌水洗板。取200μL共孵育洗涤液涂布于M-100平板(200μg/ml草丁膦和300μg/ml噻孢霉素)上,45℃下培养3天,挑选转化子于继续培养7天后进行鉴定。

(3)嗜热毁丝霉转化子验证

I)基因组提取

采用酚氯仿法从上述转化过程中挑选的转化子提取基因组DNA,具体包括以下操作:

1)2.0mL的无菌的DNA提取管中加入200mg的锆珠及1mL的裂解液(lysis buffer,配方:0.2M Tris·HCl(pH 7.5),0.5M NaCl,10mM EDTA,1%SDS(w/v)),挑取平板中生长的嗜热毁丝霉菌丝于DNA提取管中;

2)将所有DNA提取管置于助磨器上,最大转速振荡30s,重复两次;

3)65℃水浴30分,在水浴过程中每个几分钟取出漩涡振荡;

4)水浴结束后取出,每管加入80μL pH 7.5的1M的Tris·HCl中和;

5)加入400μl的酚:氯仿(1:1),13000rpm离心5分钟;

6)取300μl上清液于新的1.5mL EP管中,加入600μL 95%的乙醇(DNA级);

7)冰上孵育一小时,随后4℃、13000rpm离心,可看到白色的DNA沉淀到EP管底部;

8)用75%的酒精(DNA级)400μL清洗,4℃13000rpm离心,轻轻取出上清液;

9)将EP管置于真空浓缩仪中,真空干燥酒精;

10)加入50μL ddH2O溶解DNA,用NanoDrop测DNA浓度,测完浓度后将提取的DNA 置于-20℃冰箱保存,以备下一步进行PCR验证。

II)PCR验证嗜热毁丝霉转化子

以提取的基因组DNA为模版,用引物Ptef1-SF及Cas9-SF对转化子进行基因PCR验证。PCR反应体系为:5×phusion GC buffer 4μL,10mM dNTPs 0.2μL,引物各1μL,基因组1μL,DMSO 0.6μL,Phusion DNA聚合酶0.1μL,水12.1μL;PCR反应条件为:先98℃30s;然后98℃10s,62℃30s,72℃1.5min,30个循环;最后72℃10min,4℃10min。

III)对PCR扩增产物进行1%琼脂糖凝胶电泳(110V电压,30分钟),在凝胶成像系统下看基因扩增条带,显示在上游引物Ptef1-SF和下游引物Cas9-SF引导下经PCR扩增获得了2857bp目的条带,该条带表明表达框Ptef1-Cas9-TtprC和Ptef1-Cas9-eGFP-TtprC经整合到了嗜热毁丝霉基因组中。

引物如下所示

Ptef1-SF(SEQ ID NO.:60):TCCCACTTAAAGGCCAGCGTGACAT;

Cas9-SR(SEQ ID NO.:61):TAGTAAGGGATGCGGAAGGTGAGAA。

(3)嗜热毁丝霉稳定表达Cas9的工程菌的生物学表型分析

将PCR验证正确的表达框Ptef1-Cas9-TtprC和Ptef1-Cas9-eGFP-TtprC整合到嗜热毁丝霉基因组中转化子命名为Cas9OE和Cas9-gfp。

a)Cas9-gfp在嗜热毁丝霉细胞中的定位

通过荧光显微镜观察,融合蛋白Cas9-gfp在嗜热毁丝霉细胞中的定位。首先将转化子Cas9-gfp以分子孢子终浓度2.5×105个/mL接种于MM液体培养基(配方:50×Vogel’s盐2mL,蔗糖2g,定容体积到100mL,高压灭菌)45℃培养2天,收集菌丝,用ddH2O洗涤2次后,用DAPI二氢氯化物(工作浓度为1μg/mL)进行染色15min后,用ddH2O洗涤2次后,进行荧光显微镜观察,结果如图2所示,Cas9-gfp定位在嗜热毁丝霉细胞核内,这说明Cas9将可能在嗜热毁丝霉细胞核内对基因组的DNA靶位点上进行双链断裂。

b)Cas9OE的生长和蛋白分泌水平

结果如图3A所示,Cas9OE和野生型菌株ATCC 42464(WT)在MM斜面培养基上45℃培养8天后观察其菌落的形态生长一致和产孢能力无差别。

Cas9OE和WT以分子孢子终浓度2.5×105个/mL分别在2%微晶纤维素培养基(配方:50×Vogel’s盐2mL,微晶纤维素2g,定容体积到100mL,高压灭菌)中45℃培养4d,样品离心取上清液,测定蛋白浓度,SDS-PAGE电泳分析和测定纤维素酶活。

上清蛋白浓度测定使用伯乐Bradford蛋白快速测试试剂盒检测上清中的蛋白浓度,结果如图2B示。Cas9OE分泌蛋白浓度与WT一致,无差异。

上清SDS-PAGE电泳检测吸取等体积上清液进行4-12%SDS-PAGE电泳检测,结果如图2C所示。发现Cas9OE分泌蛋白条带类型和浓度与WT一致。

c)纤维素酶活测定

(1)内切-1,4-β-葡聚糖酶活力的测定方法:将粗酶液用0.1M醋酸钠缓冲液稀释适宜的倍数,终体积为0.5mL,放入40℃水浴锅内预热,取出,加入0.5mL Megazyme AZO-CM-CELLULOSE底物溶液,混匀,40℃温育10min,用2.5mL沉淀溶液终止反应,室温静置10min,混匀,1000g离心10min,590nm波长下测OD。空白组使用灭活的酶液作对照。

(2)内切-1,4-β-木聚糖酶活力的测定方法:将粗酶液用0.1M醋酸钠缓冲液稀释适宜的倍数,终体积为0.5mL,放入40℃水浴锅内预热,取出,加入0.5mL Megazyme AZO-XYLAN底物溶液,混匀,40℃温育10min,用2.5mL沉淀溶液终止反应,室温静置10min,混匀,1000g离心10min,590nm波长下测OD。空白组使用灭活的酶液作对照。

(3)外切纤维素酶活(Cellobiohydrolase active)的测定方法:取50μL酶液,加入200μL pH4.8的0.05M的乙酸钠缓冲液,再加入250μL 1mg/mL p-NPC和1mg/ml D-glucono-1,5-σ-lactone底物溶液后,50℃反应10min,加入500μL 1M碳酸钠溶液终止反应,420nm波长下测OD。空白组使用灭活的酶液作对照。

(3)活性定义:1mL酶液于每min水解底物产生1μmol产物的酶量定义为1个酶活力单位。

上清纤维素酶酶活检测,根据蛋白浓度稀释上清进行外切纤维素酶酶活,内切纤维素酶酶活和木聚糖酶酶活测定,结果如图3D-F所示。微晶纤维素生长条件下,Cas9OE的纤维素酶酶活力与WT相比较,无差异。

对Cas9OE和WT在蔗糖和微晶纤维素培养下的菌丝干重的测定,结果如图3G所示,无差异。

综述上述,在嗜热毁丝霉中稳定表达Cas9对菌株生长形态和产孢能力无影响,对蛋白的分泌水平和纤维素酶酶活力均无影响,结果与野生型一致,该结果说明CRISPR-Cas9介导的毁丝霉属基因组编辑载体可以在高产纤维素酶菌株基因工程改造育种中的进行应用。

实施例3:CRISPR-Cas9系统编辑毁丝霉基因组的突变菌株的获得

(1)毁丝霉原生质体转化

1)菌丝体准备

将成熟的毁丝霉孢子,用0.05%吐温-80灭菌水收集,经擦镜纸过滤出去菌丝后,涂布于铺有玻璃纸的MM平板,45℃培养16h。

2)原生质体制备

将带有菌丝的玻璃纸放置于30mL裂解液(配方:0.15g裂解酶,无菌操作加入30mL溶液A,过滤除菌;溶液A:1.0361g磷酸二氢钾,21.864g山梨醇,溶于90mL去离子水,氢氧化钾调pH到5.6,定量至100mL,高温灭菌)中,30℃裂解2h,每隔20min轻轻摇动。而后经过玻璃纸过滤后,2000rpm 4℃离心10min,弃上清,加入4mL溶液B(0.735g氯化钙,18.22g山梨醇,1mL Tris-HCl 1M pH 7.5,溶于90mL去离子水,盐酸调pH到7.6,定量至100mL,高温灭菌),2000rpm 4℃离心10min;弃上清,按200μL/质粒加入一定体积溶液B。

3)原生质体转化

预冷的15mL离心管,依次加入50μL预冷PEG(12.5g PEG6000,0.368g氯化钙,500μL Tris HCl 1M pH 7.5),将转化的DNA片段加入200μL原生质体。放置冰上20min后加入2mL预冷PEG,室温5min,加入4mL溶液B,轻轻混匀。取3mL上述溶液加入12mL融化的含相应抗生素MM培养基中,置于平板中,35℃培养,3d后于挑取单个菌丝体于相应抗性平板生长。

(2)CRISPR-Cas9系统对毁丝霉amdS基因的编辑

将表达质粒p0380-bar-Ptef1-Cas9-TtprC和U6p-amdS-gRNA表达质粒以1:1的分子摩尔比例共转化进入嗜热毁丝霉M.thermophile菌株Δubx8::amdS(由本实验室构建)的原生质体细胞后,Cas9在gRNA介导下,通过protospacer与宿主细胞基因组上的目标基因amdS的DNA链配对来识别靶标位点进行切割,通过非同源端连接(NHEJ)对位点特异性DSB的不精确修复,通过在平板中加入5′fluoroacetamide(FAA)和草丁膦(PPT)筛选出转化子。

a)嗜热毁丝霉转化子验证

1)基因组提取方法与上述一致。

2)PCR和测序验证嗜热毁丝霉amdS突变转化子

以提取的基因组DNA为模版,用引物amdS-in-F和amdS-in-R(表2)对转化子进行基因PCR验证。PCR反应体系为:5×phusion GC buffer 4μL,10mM dNTPs 0.2μL,引物各1μL,基因组1μL,DMSO 0.6μL,Phusion DNA polymerase 0.1μL,水12.1μL。PCR反应条件为:先98℃30s;然后98℃10s,62℃30s,72℃1.5min,30个循环;最后72℃10min,4℃10min.

3)对PCR扩增产物进行1%琼脂糖凝胶电泳(110V电压,30分钟),在凝胶成像系统下看基因扩增条带,显示在上游引物amdS-in-F和下游引物amdS-in-R引导下经PCR扩增获得了~1300bp目的条带,并对目的片段进行测序验证,测序结果如图4所示,表明Cas9在gRNA介导下对protospacer的第三个核酸碱基进行了切割,并通过非同源端连接(NHEJ)对位点特异性DSB的不精确修复,得到基因组编辑突变株Δubx8ΔamdS。

(3)CRISPR-Cas9系统对嗜热毁丝霉和异梭毁丝霉cre1基因的编辑

将表达质粒p0380-bar-Ptef1-Cas9-TtprC和U6p-cre1-sgRNA表达质粒及其供体DNA donor-cre1以分子摩尔比1:1:1的比例分别共转化进入嗜热毁丝霉M.thermophile野生型菌株ATCC 42464和M.heterothallica野生型菌株CBS 203.75的原生质体细胞后,Cas9在gRNA介导下,通过protospacer与宿主细胞基因组上的目标基因的DNA链配对来识别靶标位点进行切割,随后供体DNA片段与靶标位点两侧序列发生同源重组,通过在平板中加入G418和PPT筛选转化子。

a)嗜热毁丝霉转化子验证

1)基因组提取方法与上述一致。

2)PCR验证嗜热毁丝霉cre1突变转化子

以提取的基因组DNA为模版,用引物cre1-out-F和cre1-in-R(表2)对转化子进行基因PCR验证。PCR反应体系为:5×phusion GC buffer 4μL,10mM dNTPs 0.2μL,引物各1μL,基因组1μL,DMSO 0.6μL,Phusion DNA polymerase 0.1μL,水12.1μL。PCR反应条件为:先98℃30s;然后98℃10s,62℃30s,72℃1.5min,30个循环;最后72℃10min,4℃10min.

3)对PCR扩增产物进行1%琼脂糖凝胶电泳(110V电压,30分钟),在凝胶成像系统下看基因扩增条带,显示在上游引物cre1-out-F和下游引物cre1-in-R引导下经PCR扩增获得了1900bp目的条带,野生型菌株目的条带为1000bp,结果如图5所示,表明供体DNA片段与靶标位点两侧序列发生同源重组,进而得到基因编辑突变株ΔMtcre1和ΔMhcre1,其同源重组效率高达100%。

(4)CRISPR-Cas9系统对嗜热毁丝霉多基因的同时编辑

将sgRNA表达质粒U6p-cre1-sgRNA,U6p-res1-sgRNA,U6p-gh1-1-sgRNA和U6p-alp1-sgRNA及其供体DNA donor-cre1,donor-res1,donor-gh1-1和donor-alp1以分子摩尔比1:1的比例共转化进入嗜热毁丝霉Δubx8ΔamdS的原生质体细胞后,Cas9在sgRNA介导下,通过protospacer与宿主细胞基因组上的目标基因的DNA链配对来识别靶标位点进行切割,随后供体DNA片段与靶标位点两侧序列发生同源重组,通过在平板中加入G418和PPT筛选转化子。

a)嗜热毁丝霉转化子验证

1)基因组提取方法与上述一致。

2)PCR验证嗜热毁丝霉cre1、res1、gh1-1和alp1突变转化子

以提取的基因组DNA为模版,用引物cre1-out-F和cre1-in-R,res1-out-F和res-in-R,gh1-1-out-F和gh1-1-in-R,alp1-out-F和alp1-in-R(表2)分别对转化子进行基因PCR验证。PCR反应体系为:5×phusion GC buffer 4μL,10mM dNTPs 0.2μL,引物各1μL,基因组1μL,DMSO 0.6μL,Phusion DNA polymerase 0.1μL,水12.1μL。PCR反应条件为:先98℃30s;然后98℃10s,62℃30s,72℃1.5min,30个循环;最后72℃10min,4℃10min.

3)对PCR扩增产物进行1%琼脂糖凝胶电泳(110V电压,30分钟),在凝胶成像系统下看基因扩增条带,显示在上游引物cre1-out-F和下游引物cre1-in-R,上游引物res1-out-F和下游引物res-in-R,上游引物gh1-1-out-F和下游引物gh1-1-in-R,上游引物alp1-out-F和下游引物alp1-in-R引导下经PCR扩增获得了1900bp目的条带,野生型菌株目的条带为1000bp,结果如图6-9所示,表明供体DNA片段与靶标位点两侧序列发生同源重组,进而 得到基因编辑突变株,包括单基因位点编辑突变株Δubx8ΔamdSΔcre1,Δubx8ΔamdSΔres1,Δubx8ΔamdSΔalp1和Δubx8ΔamdSΔgh1-1,其同源重组效率高达100%;基因组多位点同时编辑突变株Δubx8ΔamdSΔcre1Δres1,Δubx8ΔamdSΔcre1Δgh1-1,Δubx8ΔamdSΔgh1-1Δres1,Δubx8ΔamdSΔcre1Δgh1-1Δres1,Δubx8ΔamdSΔcre1Δgh1-1Δalp1和Δubx8ΔamdSΔcre1Δgh1-1Δres1Δalp1,其中双基因的同源重组效率为61-69%,三基因的同源重组效率为30%,四基因的同源重组效率为22%。

表2

实施例4:突变菌株的生物学表型评价

(1)嗜热毁丝霉和异梭毁丝霉cre1突变菌株在简单微晶纤维素培养基中纤维素产酶功能验证实验

将嗜热毁丝霉M.thermophile野生型菌株ATCC 42464(MtWT)、异梭毁丝霉M.heterothallica野生型菌株CBS 203.75(MhWT)、ΔMtcre1和ΔMhcre1分别在2%(2g/100mL)微晶纤维素培养基(配方:50×Vogel’s盐2mL,微晶纤维素2g,定容体积到100mL,高压灭菌)上45℃培养4d,样品离心取上清液,测定蛋白浓度,SDS-PAGE电泳分析和测定纤维素酶活。

a)上清蛋白浓度测定

使用伯乐Bradford蛋白快速测试试剂盒检测上清中的蛋白浓度,结果如图10A所示。与野生型相比,ΔMtcre1和ΔMhcre1蛋白产量都有非常显著的提高。

b)上清SDS-PAGE电泳检测

根据蛋白浓度吸取等体积上清液进行4-12%SDS-PAGE电泳检测,结果如图10B所示。ΔMtcre1和ΔMhcre1相比野生型菌株,纤维素酶对应条带都显著加深。

c)上清纤维素酶酶活检测

酶活测定方法同实施例2。

根据蛋白浓度稀释上清进行外外切纤维素酶酶活,内切纤维素酶酶活和木聚糖酶酶活测定。结果如图10(C)-(E)所示。微晶纤维素生长条件下,ΔMtcre1和ΔMhcre1相比野生型菌株,纤维素酶的酶活都有非常显著的提高。

(2)多基因突变菌株在添加有机氮源的微晶纤维素培养基中纤维素产酶功能验证实验

将嗜热毁丝霉M.thermophile野生型菌株ATCC 42464(WT)、Δubx8ΔamdSΔcre1,Δubx8ΔamdSΔres1,Δubx8ΔamdSΔalp1,Δubx8ΔamdSΔgh1-1,Δubx8ΔamdSΔcre1Δres1,Δubx8ΔamdSΔcre1Δgh1-1,Δubx8ΔamdSΔgh1-1Δres1,Δubx8ΔamdSΔcre1Δgh1-1Δres1,Δubx8ΔamdSΔcre1Δgh1-1Δalp1和Δubx8ΔamdSΔcre1Δgh1-1Δres1Δalp1分别在2%(2g/100mL)微晶纤维素培养基(配方:50×Vogel’s盐2mL,微晶纤维素2g,蛋白胨提取物0.5g,定容体积到100mL,高压灭菌)上45℃培养6d,样品离心取上清液,测定蛋白浓度,SDS-PAGE电泳分析和测定纤维素酶活。

a)上清蛋白浓度测定

使用伯乐Bradford蛋白快速测试试剂盒检测上清中的蛋白浓度,结果如图11(A)所示。与野生型相比,所有突变菌株的蛋白产量都有非常显著的提高,特别是五基因突变菌株Δubx8ΔamdSΔcre1Δgh1-1Δres1和Δubx8ΔamdSΔcre1Δgh1-1Δalp1和六基因突变菌株Δubx8ΔamdSΔcre1Δgh1-1Δres1Δalp1,其蛋白产量比野生型高达6.4-6.7倍。

b)上清SDS-PAGE电泳检测

根据蛋白浓度吸取等体积上清液进行4-12%SDS-PAGE电泳检测,结果如图11(B)所示。与野生型菌株相比,所有突变菌株的纤维素酶对应条带都显著加深,尤其是五基因突变菌株Δubx8ΔamdSΔcre1Δgh1-1Δres1和Δubx8ΔamdSΔcre1Δgh1-1Δalp1和六基因突变菌株Δubx8ΔamdSΔcre1Δgh1-1Δres1Δalp1,七纤维素酶对应条带浓度的加深都极为显著。

c)上清纤维素酶酶活检测

根据蛋白浓度稀释上清进行外切纤维素酶酶活,内切纤维素酶酶活和木聚糖酶酶活测定(酶活测定方法同实施例2)。结果如图11(C)-(E)所示。微晶纤维素生长条件下,同野生型菌株对比,所有突变菌株的纤维素酶的酶活力都表现出极为显著的提高,特别是五基因突变菌株Δubx8ΔamdSΔcre1Δgh1-1Δres1和Δubx8ΔamdSΔcre1Δgh1-1Δalp1和六基因突变菌株Δubx8ΔamdSΔcre1Δgh1-1Δres1Δalp1,其内切纤维素酶酶活力比野生型提高6-7倍,外切纤维素酶酶活比野生型提高8-10倍,木聚糖酶酶活力比野生型提高15-19倍。

申请人声明,本发明通过上述实施例来说明本发明的详细方法,但本发明并不局限于上述详细方法,即不意味着本发明必须依赖上述详细方法才能实施。所属技术领域的技术人员应该明了,对本发明的任何改进,对本发明产品各原料的等效替换及辅助成分的添加、具体方式的选择等,均落在本发明的保护范围和公开范围之内。

SEQUENCE LISTING

<110> 中国科学院天津工业生物技术研究所

<120> 一种基因组编辑载体、其组成的基因组编辑系统及应用

<130> 2016

<160> 71

<170> PatentIn version 3.3

<210> 1

<211> 464

<212> DNA

<213> 人工合成序列

<400> 1

aggatcggtg gagtgaagtt cggaatcgag gttcggcgat gggtcgtaag catggcgact 60

tcgaacttac ttgcactggc aagcgttgcc agaacggcga gaaaaagaag ggtaagcgat 120

attcgcgtca tgatggactg ttccttttgg aacagtagtt gttgtgggaa gactatgtca 180

cacttgccca cctgcaaggc cagggtcgtg gtcgaacgag accagcctcg gcgctgctgg 240

gagctcaaga tgggcacgtt tgattcgtta gacgtcaaca aggctggagt tcctagtgac 300

agccaaaggc acagccacat taagtggcgc tttatctgtc cactaaggtt caattgtggc 360

tttgagccgc gcagtgtgca gtcgtgcatt ggccacctag ctagcagtat ttaagatcct 420

cttctctccc gagatcttcc tcctcttctt ttctttcttt cctc 464

<210> 2

<211> 567

<212> DNA

<213> 人工合成序列

<400> 2

aggatcggtg gagtgaagtt cggaatcgag gttcggcgat gggtcgtaag catggcgact 60

tcgaacttac ttgcactggc aagcgttgcc agaacggcga gaaaaagaag ggtaagcgat 120

attcgcgtca tgatggactg ttccttttgg aacagtagtt gttgtgggaa gactatgtca 180

cacttgccca cctgcaaggc cagggtcgtg gtcgaacgag accagcctcg gcgctgctgg 240

gagctcaaga tgggcacgtt tgattcgtta gacgtcaaca aggctggagt tcctagtgac 300

agccaaaggc acagccacat taagtggcgc tttatctgtc cactaaggtt caattgtggc 360

tttgagccgc gcagtgtgca gtcgtgcatt ggccacctag ctagcagtat ttaagatcct 420

cttctctccc gagatcttcc tcctcttctt ttctttcttt cctcggcgaa cagcatggag 480

ggtcgtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 540

aagtggcacc gagtcggtgc ttttttt 567

<210> 3

<211> 567

<212> DNA

<213> 人工合成序列

<400> 3

aggatcggtg gagtgaagtt cggaatcgag gttcggcgat gggtcgtaag catggcgact 60

tcgaacttac ttgcactggc aagcgttgcc agaacggcga gaaaaagaag ggtaagcgat 120

attcgcgtca tgatggactg ttccttttgg aacagtagtt gttgtgggaa gactatgtca 180

cacttgccca cctgcaaggc cagggtcgtg gtcgaacgag accagcctcg gcgctgctgg 240

gagctcaaga tgggcacgtt tgattcgtta gacgtcaaca aggctggagt tcctagtgac 300

agccaaaggc acagccacat taagtggcgc tttatctgtc cactaaggtt caattgtggc 360

tttgagccgc gcagtgtgca gtcgtgcatt ggccacctag ctagcagtat ttaagatcct 420

cttctctccc gagatcttcc tcctcttctt ttctttcttt cctcgcaacg cgcaaagtct 480

gcaggtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 540

aagtggcacc gagtcggtgc ttttttt 567

<210> 4

<211> 567

<212> DNA

<213> 人工合成序列

<400> 4

aggatcggtg gagtgaagtt cggaatcgag gttcggcgat gggtcgtaag catggcgact 60

tcgaacttac ttgcactggc aagcgttgcc agaacggcga gaaaaagaag ggtaagcgat 120

attcgcgtca tgatggactg ttccttttgg aacagtagtt gttgtgggaa gactatgtca 180

cacttgccca cctgcaaggc cagggtcgtg gtcgaacgag accagcctcg gcgctgctgg 240

gagctcaaga tgggcacgtt tgattcgtta gacgtcaaca aggctggagt tcctagtgac 300

agccaaaggc acagccacat taagtggcgc tttatctgtc cactaaggtt caattgtggc 360

tttgagccgc gcagtgtgca gtcgtgcatt ggccacctag ctagcagtat ttaagatcct 420

cttctctccc gagatcttcc tcctcttctt ttctttcttt cctcgcccta tgagccctcg 480

taccgtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 540

aagtggcacc gagtcggtgc ttttttt 567

<210> 5

<211> 567

<212> DNA

<213> 人工合成序列

<400> 5

aggatcggtg gagtgaagtt cggaatcgag gttcggcgat gggtcgtaag catggcgact 60

tcgaacttac ttgcactggc aagcgttgcc agaacggcga gaaaaagaag ggtaagcgat 120

attcgcgtca tgatggactg ttccttttgg aacagtagtt gttgtgggaa gactatgtca 180

cacttgccca cctgcaaggc cagggtcgtg gtcgaacgag accagcctcg gcgctgctgg 240

gagctcaaga tgggcacgtt tgattcgtta gacgtcaaca aggctggagt tcctagtgac 300

agccaaaggc acagccacat taagtggcgc tttatctgtc cactaaggtt caattgtggc 360

tttgagccgc gcagtgtgca gtcgtgcatt ggccacctag ctagcagtat ttaagatcct 420

cttctctccc gagatcttcc tcctcttctt ttctttcttt cctcgacaca ttctgcgcca 480

tcccgtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 540

aagtggcacc gagtcggtgc ttttttt 567

<210> 6

<211> 567

<212> DNA

<213> 人工合成序列

<400> 6

aggatcggtg gagtgaagtt cggaatcgag gttcggcgat gggtcgtaag catggcgact 60

tcgaacttac ttgcactggc aagcgttgcc agaacggcga gaaaaagaag ggtaagcgat 120

attcgcgtca tgatggactg ttccttttgg aacagtagtt gttgtgggaa gactatgtca 180

cacttgccca cctgcaaggc cagggtcgtg gtcgaacgag accagcctcg gcgctgctgg 240

gagctcaaga tgggcacgtt tgattcgtta gacgtcaaca aggctggagt tcctagtgac 300

agccaaaggc acagccacat taagtggcgc tttatctgtc cactaaggtt caattgtggc 360

tttgagccgc gcagtgtgca gtcgtgcatt ggccacctag ctagcagtat ttaagatcct 420

cttctctccc gagatcttcc tcctcttctt ttctttcttt cctcgtctac cgcggcaagt 480

tcaggtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 540

aagtggcacc gagtcggtgc ttttttt 567

<210> 7

<211> 1200

<212> DNA

<213> 人工合成序列

<400> 7

tcctccgagg ttcgacatca gggttcgtca tagggagtga aacacccgcc atgattccgt 60

agccgcgcgc gaagatacga agcagatatt tcacggacat ggcggagata cttgtttccc 120

gtactaaggt agtcatgtcg gagacatctg aacgacagag ctggccaaga gaaccgacca 180

gttgccccag gacgatctag acaaaaaaaa agagagatga gtgggccact tttgccacaa 240

catcgacggc cctgcgaccg cccccaggca aacaaacaaa ccgccgaaca ataatacttt 300

tgtcatttta ggaggagcgt tgtatggata aaaacaacat ctcgttgctg cagaatgtgg 360

acttcaaact tgcagaaaat gggaggcgga tttgcatgat cggagggtag ttgactcacg 420

ccgcaggctg caaatccgtc ctccattatt ccatgaacaa cttcgtaagg ttgggctgag 480

cgccaatgcc taacggaccg ggggccacag cgcaacgtcc cacttaaagg ccagcgtgac 540

atgccagttc cataccaagt agtggcacca gaggcggcca atgctcagta agggcaggga 600

gggaggctca aacgattggc aaaaagaggg gcttgccagt tcagttccct gtgcgagcgc 660

gagaggggca gtttcaaatc tggaggggtg tgttgcgctg gtctgaagag aaagagaaga 720

ctgtacttaa taattgttca aagagtccat catcgcgttg cggactcctc tagctgtatt 780

tagagcccta tcattacttg tcgggtgcga atcaaaatac cgggatgcag ccctctggcg 840

atttgcatgc ggttgtggag gaagtgaagc ctgaatcgcg gggctgggcg gcaaagcacg 900

acgtgaaatt cctggcgaaa ttcgagggct tgccccaccg tggttgaagt ttttgtgctg 960

cgtaacccca ccaacccgcc ttgcccctcc cgcctgccca taaaaacttc gacccctcct 1020

caaatcttct tcgattcttc ctcttcactt ccttcgtcgg catacctgat tcaagcaatc 1080

acctgccact ttcaagtgcg tataccatca tcgatacact ggttcttgac aagtacatcg 1140

tctctaactt tcctttttgc agttttcatt aagcgcaagt cgccagtttc gttcttcaga 1200

<210> 8

<211> 1413

<212> PRT

<213> 人工合成序列

<400> 8

Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp

1 5 10 15

Tyr Lys Asp Asp Asp Asp Lys Pro Pro Arg Lys Arg Ala Lys Thr Glu

20 25 30

Asp Glu Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn

35 40 45

Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys

50 55 60

Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn

65 70 75 80

Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr

85 90 95

Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg

100 105 110

Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp

115 120 125

Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp

130 135 140

Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val

145 150 155 160

Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu

165 170 175

Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu

180 185 190

Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu

195 200 205

Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln

210 215 220

Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val

225 230 235 240

Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu

245 250 255

Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe

260 265 270

Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser

275 280 285

Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr

290 295 300

Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr

305 310 315 320

Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu

325 330 335

Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser

340 345 350

Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu

355 360 365

Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile

370 375 380

Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly

385 390 395 400

Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys

405 410 415

Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu

420 425 430

Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile

435 440 445

His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr

450 455 460

Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe

465 470 475 480

Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe

485 490 495

Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe

500 505 510

Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg

515 520 525

Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys

530 535 540

His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys

545 550 555 560

Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly

565 570 575

Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys

580 585 590

Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys

595 600 605

Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser

610 615 620

Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe

625 630 635 640

Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr

645 650 655

Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr

660 665 670

Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg

675 680 685

Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile

690 695 700

Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp

705 710 715 720

Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu

725 730 735

Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp

740 745 750

Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys

755 760 765

Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val

770 775 780

Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu

785 790 795 800

Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys

805 810 815

Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu

820 825 830

His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr

835 840 845

Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile

850 855 860

Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe

865 870 875 880

Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys

885 890 895

Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys

900 905 910

Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln

915 920 925

Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu

930 935 940

Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln

945 950 955 960

Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys

965 970 975

Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu

980 985 990

Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys

995 1000 1005

Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu

1010 1015 1020

Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu

1025 1030 1035

Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg

1040 1045 1050

Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala

1055 1060 1065

Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu

1070 1075 1080

Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu

1085 1090 1095

Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp

1100 1105 1110

Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile

1115 1120 1125

Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser

1130 1135 1140

Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys

1145 1150 1155

Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val

1160 1165 1170

Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser

1175 1180 1185

Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met

1190 1195 1200

Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala

1205 1210 1215

Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro

1220 1225 1230

Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu

1235 1240 1245

Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro

1250 1255 1260

Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys

1265 1270 1275

Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val

1280 1285 1290

Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser

1295 1300 1305

Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys

1310 1315 1320

Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu

1325 1330 1335

Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly

1340 1345 1350

Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys

1355 1360 1365

Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His

1370 1375 1380

Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln

1385 1390 1395

Leu Gly Gly Asp Pro Pro Arg Lys Arg Ala Lys Thr Glu Asp Glu

1400 1405 1410

<210> 9

<211> 4245

<212> DNA

<213> 人工合成序列

<400> 9

atggactaca aggaccatga tggcgattac aaggaccacg acatcgatta taaggatgat 60

gatgacaagc ctccgaggaa acgtgccaaa acagaagatg agatggataa gaagtactcc 120

atcggcctcg acatcggcac caactccgtc ggctgggccg tcatcaccga tgagtacaag 180

gtcccttcca agaagttcaa ggtcctcggc aacaccgatc gccattccat caagaagaac 240

ctgatcggcg ccctcctgtt cgattccggc gaaaccgccg aggccacccg ccttaaacgc 300

accgcccgtc gccgctacac ccgccgcaag aaccgcatct gctacctcca agaaatcttc 360

tccaacgaga tggccaaggt cgatgatagc ttcttccacc gcctcgaaga gtccttcctg 420

gtcgaagagg ataagaagca cgagcgccat cctatcttcg gcaacatcgt cgatgaggtc 480

gcctaccatg agaagtaccc taccatctac catctccgca agaagctcgt cgattccacc 540

gataaggccg atctccgcct catctacctc gccctcgccc atatgatcaa gttccgcggc 600

catttcctca tcgagggcga tctcaaccct gataactccg atgtcgataa gctgttcatc 660

cagctcgtcc agacctacaa ccagctgttc gaggaaaacc ctatcaacgc ctccggcgtc 720

gatgccaagg ccatcctctc cgctcgcctc tccaagtctc gccgccttga gaaccttatc 780

gcccagctcc ctggcgagaa gaagaacggc ctcttcggca acctgatcgc cctctccctc 840

ggcctcaccc ctaacttcaa gtccaacttc gatctcgccg aggatgccaa gctccagctc 900

tccaaggata cctacgatga tgatctcgat aacctcctcg cccagatcgg cgatcagtac 960

gccgatctgt tcctcgccgc caagaacctc tccgatgcca tcctcctctc cgacatcctc 1020

cgcgtcaaca ccgagatcac caaggcccct ctgtccgcct ccatgatcaa gcgctacgat 1080

gagcatcatc aggacctcac cctgctcaag gccctcgtcc gccagcagct ccctgagaag 1140

tacaaagaga ttttcttcga tcagtccaag aacggctacg ccggctacat cgatggcggc 1200

gcttcccaag aagagttcta caagttcatc aagcctatcc ttgagaagat ggatggcacc 1260

gaggaactcc tcgtcaagct caaccgcgag gacctcctcc gcaagcagcg caccttcgat 1320

aacggctcca tccctcatca aatccatctc ggcgagctgc atgccatctt gcgccgccaa 1380

gaggatttct acccattcct caaggataac cgcgagaaga tcgaaaagat tctcaccttc 1440

cgcatccctt actacgtcgg ccctctcgct cgcggcaact cccgcttcgc ctggatgacc 1500

cgcaagtccg aggaaaccat caccccttgg aacttcgagg aagtcgtcga taagggcgcc 1560

tccgcccagt ccttcatcga gcgcatgacc aacttcgata agaacctccc taacgagaag 1620

gtcctcccta agcactccct gctctacgag tacttcaccg tctacaacga gctgaccaag 1680

gtcaagtacg tcaccgaggg tatgcgcaag cctgccttcc tgtccggcga gcagaagaag 1740

gccatcgtcg atctgctgtt caagaccaac cgcaaggtca ccgtcaagca gctcaaagag 1800

gattacttca agaaaatcga gtgcttcgat tccgtcgaga tcagcggcgt cgaggaccgc 1860

ttcaacgcct ccctcggaac ctaccatgat ctcctcaaga ttatcaagga taaggatttc 1920

ctcgacaacg aggaaaacga ggacatcctt gaggacatcg tcctcaccct caccctcttc 1980

gaggaccgcg aaatgatcga ggaacgcctc aagacctacg cccatctctt cgatgataag 2040

gtcatgaagc agctcaagcg ccgtcgctac accggctggg gtcgcctctc ccgcaagctc 2100

atcaacggca tccgcgataa gcagtccggc aagactatcc tcgatttcct caagtccgat 2160

ggcttcgcca accgcaactt catgcagctc atccatgatg attccctcac cttcaaagag 2220

gacatccaga aggcccaggt cagcggccag ggcgattccc tccatgagca tatcgccaac 2280

ctcgccggct cccctgccat caagaagggc atcctccaga ccgtcaaggt cgtcgatgag 2340

ctggtcaagg tcatgggccg ccataagcct gagaacatcg tcatcgagat ggcccgcgag 2400

aaccagacca cccagaaggg ccagaagaac tcccgcgagc gcatgaagcg catcgaggaa 2460

ggcatcaaag agctgggcag ccaaatcctc aaagagcatc ctgtcgagaa cacccagctc 2520

cagaacgaga agctctacct ctactacctc cagaacggcc gcgatatgta cgtcgatcaa 2580

gagctggaca tcaaccgcct ctccgattac gatgtcgatc atatcgtccc tcagtccttc 2640

ctgaaggatg attccatcga taacaaggtc ctcacccgct ccgataagaa ccgcggcaag 2700

tccgataacg tcccttccga agaggtcgtc aagaagatga agaactactg gcgccagctc 2760

ctcaacgcca agctcatcac ccagcgcaag ttcgataacc tcaccaaggc cgagcgcggt 2820

ggcctctccg agctggataa ggccggcttc atcaagcgcc agctcgtcga aacccgccag 2880

atcaccaagc acgtcgccca aatcctcgat tcccgcatga acaccaagta cgatgagaac 2940

gataagctca tccgcgaagt caaggtcatc accctcaagt ccaagctcgt cagcgatttc 3000

cgcaaggatt tccagttcta caaggtccgc gagatcaaca actaccatca tgcccatgat 3060

gcctacctca acgccgtcgt cggcaccgcc ctcatcaaga agtaccccaa gctcgaatcc 3120

gagttcgtct acggtgatta caaggtctac gatgtccgca agatgatcgc caagtccgag 3180

caagagatcg gcaaggctac cgccaagtac ttcttctact ccaacatcat gaatttcttc 3240

aagaccgaaa tcaccctcgc caacggcgaa atccgcaagc gccctctcat cgagactaac 3300

ggcgagactg gcgagatcgt ctgggataag ggccgcgatt tcgccaccgt ccgcaaggtc 3360

ctctccatgc ctcaggtcaa catcgtcaag aaaaccgagg tccagaccgg cggcttctcc 3420

aaagagtcca tcctccccaa gcgcaactcc gataagctga tcgcccgcaa gaaggattgg 3480

gaccctaaga agtacggcgg cttcgattcc cctaccgtcg cctactccgt cctcgtcgtc 3540

gccaaggtcg agaagggcaa gtccaagaag ctcaagtccg tcaaagagct gctcggcatc 3600

actattatgg aacgctccag cttcgagaag aaccctatcg atttccttga ggccaagggc 3660

tacaaagagg tcaagaagga cctcatcatc aagctcccca agtactccct gttcgagctt 3720

gagaacggcc gcaagcgcat gctcgcctcc gccggtgagc ttcagaaggg caacgagctg 3780

gccctgcctt ccaagtacgt caacttcctc tacctcgcct cccattacga gaagctcaag 3840

ggctcccctg aggataacga gcagaagcag ctgttcgtcg agcagcataa gcactacctc 3900

gatgagatca tcgagcagat cagcgagttc tccaagcgcg tcatcctcgc cgatgccaac 3960

ctcgataagg tcctgtccgc ctacaacaag caccgcgata agcctatccg cgagcaggcc 4020

gagaacatca tccatctctt caccctcacc aacctcggtg cccctgccgc cttcaagtac 4080

ttcgatacca ccatcgatcg caagcgctac acctccacca aagaggtcct ggacgccacc 4140

ctcatccatc agtccatcac cggcctctac gaaacccgca tcgatctctc ccagctcggc 4200

ggcgaccctc cgaggaaacg tgccaaaaca gaagatgagt gatga 4245

<210> 10

<211> 6153

<212> DNA

<213> 人工合成序列

<400> 10

tcctccgagg ttcgacatca gggttcgtca tagggagtga aacacccgcc atgattccgt 60

agccgcgcgc gaagatacga agcagatatt tcacggacat ggcggagata cttgtttccc 120

gtactaaggt agtcatgtcg gagacatctg aacgacagag ctggccaaga gaaccgacca 180

gttgccccag gacgatctag acaaaaaaaa agagagatga gtgggccact tttgccacaa 240

catcgacggc cctgcgaccg cccccaggca aacaaacaaa ccgccgaaca ataatacttt 300

tgtcatttta ggaggagcgt tgtatggata aaaacaacat ctcgttgctg cagaatgtgg 360

acttcaaact tgcagaaaat gggaggcgga tttgcatgat cggagggtag ttgactcacg 420

ccgcaggctg caaatccgtc ctccattatt ccatgaacaa cttcgtaagg ttgggctgag 480

cgccaatgcc taacggaccg ggggccacag cgcaacgtcc cacttaaagg ccagcgtgac 540

atgccagttc cataccaagt agtggcacca gaggcggcca atgctcagta agggcaggga 600

gggaggctca aacgattggc aaaaagaggg gcttgccagt tcagttccct gtgcgagcgc 660

gagaggggca gtttcaaatc tggaggggtg tgttgcgctg gtctgaagag aaagagaaga 720

ctgtacttaa taattgttca aagagtccat catcgcgttg cggactcctc tagctgtatt 780

tagagcccta tcattacttg tcgggtgcga atcaaaatac cgggatgcag ccctctggcg 840

atttgcatgc ggttgtggag gaagtgaagc ctgaatcgcg gggctgggcg gcaaagcacg 900

acgtgaaatt cctggcgaaa ttcgagggct tgccccaccg tggttgaagt ttttgtgctg 960

cgtaacccca ccaacccgcc ttgcccctcc cgcctgccca taaaaacttc gacccctcct 1020

caaatcttct tcgattcttc ctcttcactt ccttcgtcgg catacctgat tcaagcaatc 1080

acctgccact ttcaagtgcg tataccatca tcgatacact ggttcttgac aagtacatcg 1140

tctctaactt tcctttttgc agttttcatt aagcgcaagt cgccagtttc gttcttcaga 1200

atggactaca aggaccatga tggcgattac aaggaccacg acatcgatta taaggatgat 1260

gatgacaagc ctccgaggaa acgtgccaaa acagaagatg agatggataa gaagtactcc 1320

atcggcctcg acatcggcac caactccgtc ggctgggccg tcatcaccga tgagtacaag 1380

gtcccttcca agaagttcaa ggtcctcggc aacaccgatc gccattccat caagaagaac 1440

ctgatcggcg ccctcctgtt cgattccggc gaaaccgccg aggccacccg ccttaaacgc 1500

accgcccgtc gccgctacac ccgccgcaag aaccgcatct gctacctcca agaaatcttc 1560

tccaacgaga tggccaaggt cgatgatagc ttcttccacc gcctcgaaga gtccttcctg 1620

gtcgaagagg ataagaagca cgagcgccat cctatcttcg gcaacatcgt cgatgaggtc 1680

gcctaccatg agaagtaccc taccatctac catctccgca agaagctcgt cgattccacc 1740

gataaggccg atctccgcct catctacctc gccctcgccc atatgatcaa gttccgcggc 1800

catttcctca tcgagggcga tctcaaccct gataactccg atgtcgataa gctgttcatc 1860

cagctcgtcc agacctacaa ccagctgttc gaggaaaacc ctatcaacgc ctccggcgtc 1920

gatgccaagg ccatcctctc cgctcgcctc tccaagtctc gccgccttga gaaccttatc 1980

gcccagctcc ctggcgagaa gaagaacggc ctcttcggca acctgatcgc cctctccctc 2040

ggcctcaccc ctaacttcaa gtccaacttc gatctcgccg aggatgccaa gctccagctc 2100

tccaaggata cctacgatga tgatctcgat aacctcctcg cccagatcgg cgatcagtac 2160

gccgatctgt tcctcgccgc caagaacctc tccgatgcca tcctcctctc cgacatcctc 2220

cgcgtcaaca ccgagatcac caaggcccct ctgtccgcct ccatgatcaa gcgctacgat 2280

gagcatcatc aggacctcac cctgctcaag gccctcgtcc gccagcagct ccctgagaag 2340

tacaaagaga ttttcttcga tcagtccaag aacggctacg ccggctacat cgatggcggc 2400

gcttcccaag aagagttcta caagttcatc aagcctatcc ttgagaagat ggatggcacc 2460

gaggaactcc tcgtcaagct caaccgcgag gacctcctcc gcaagcagcg caccttcgat 2520

aacggctcca tccctcatca aatccatctc ggcgagctgc atgccatctt gcgccgccaa 2580

gaggatttct acccattcct caaggataac cgcgagaaga tcgaaaagat tctcaccttc 2640

cgcatccctt actacgtcgg ccctctcgct cgcggcaact cccgcttcgc ctggatgacc 2700

cgcaagtccg aggaaaccat caccccttgg aacttcgagg aagtcgtcga taagggcgcc 2760

tccgcccagt ccttcatcga gcgcatgacc aacttcgata agaacctccc taacgagaag 2820

gtcctcccta agcactccct gctctacgag tacttcaccg tctacaacga gctgaccaag 2880

gtcaagtacg tcaccgaggg tatgcgcaag cctgccttcc tgtccggcga gcagaagaag 2940

gccatcgtcg atctgctgtt caagaccaac cgcaaggtca ccgtcaagca gctcaaagag 3000

gattacttca agaaaatcga gtgcttcgat tccgtcgaga tcagcggcgt cgaggaccgc 3060

ttcaacgcct ccctcggaac ctaccatgat ctcctcaaga ttatcaagga taaggatttc 3120

ctcgacaacg aggaaaacga ggacatcctt gaggacatcg tcctcaccct caccctcttc 3180

gaggaccgcg aaatgatcga ggaacgcctc aagacctacg cccatctctt cgatgataag 3240

gtcatgaagc agctcaagcg ccgtcgctac accggctggg gtcgcctctc ccgcaagctc 3300

atcaacggca tccgcgataa gcagtccggc aagactatcc tcgatttcct caagtccgat 3360

ggcttcgcca accgcaactt catgcagctc atccatgatg attccctcac cttcaaagag 3420

gacatccaga aggcccaggt cagcggccag ggcgattccc tccatgagca tatcgccaac 3480

ctcgccggct cccctgccat caagaagggc atcctccaga ccgtcaaggt cgtcgatgag 3540

ctggtcaagg tcatgggccg ccataagcct gagaacatcg tcatcgagat ggcccgcgag 3600

aaccagacca cccagaaggg ccagaagaac tcccgcgagc gcatgaagcg catcgaggaa 3660

ggcatcaaag agctgggcag ccaaatcctc aaagagcatc ctgtcgagaa cacccagctc 3720

cagaacgaga agctctacct ctactacctc cagaacggcc gcgatatgta cgtcgatcaa 3780

gagctggaca tcaaccgcct ctccgattac gatgtcgatc atatcgtccc tcagtccttc 3840

ctgaaggatg attccatcga taacaaggtc ctcacccgct ccgataagaa ccgcggcaag 3900

tccgataacg tcccttccga agaggtcgtc aagaagatga agaactactg gcgccagctc 3960

ctcaacgcca agctcatcac ccagcgcaag ttcgataacc tcaccaaggc cgagcgcggt 4020

ggcctctccg agctggataa ggccggcttc atcaagcgcc agctcgtcga aacccgccag 4080

atcaccaagc acgtcgccca aatcctcgat tcccgcatga acaccaagta cgatgagaac 4140

gataagctca tccgcgaagt caaggtcatc accctcaagt ccaagctcgt cagcgatttc 4200

cgcaaggatt tccagttcta caaggtccgc gagatcaaca actaccatca tgcccatgat 4260

gcctacctca acgccgtcgt cggcaccgcc ctcatcaaga agtaccccaa gctcgaatcc 4320

gagttcgtct acggtgatta caaggtctac gatgtccgca agatgatcgc caagtccgag 4380

caagagatcg gcaaggctac cgccaagtac ttcttctact ccaacatcat gaatttcttc 4440

aagaccgaaa tcaccctcgc caacggcgaa atccgcaagc gccctctcat cgagactaac 4500

ggcgagactg gcgagatcgt ctgggataag ggccgcgatt tcgccaccgt ccgcaaggtc 4560

ctctccatgc ctcaggtcaa catcgtcaag aaaaccgagg tccagaccgg cggcttctcc 4620

aaagagtcca tcctccccaa gcgcaactcc gataagctga tcgcccgcaa gaaggattgg 4680

gaccctaaga agtacggcgg cttcgattcc cctaccgtcg cctactccgt cctcgtcgtc 4740

gccaaggtcg agaagggcaa gtccaagaag ctcaagtccg tcaaagagct gctcggcatc 4800

actattatgg aacgctccag cttcgagaag aaccctatcg atttccttga ggccaagggc 4860

tacaaagagg tcaagaagga cctcatcatc aagctcccca agtactccct gttcgagctt 4920

gagaacggcc gcaagcgcat gctcgcctcc gccggtgagc ttcagaaggg caacgagctg 4980

gccctgcctt ccaagtacgt caacttcctc tacctcgcct cccattacga gaagctcaag 5040

ggctcccctg aggataacga gcagaagcag ctgttcgtcg agcagcataa gcactacctc 5100

gatgagatca tcgagcagat cagcgagttc tccaagcgcg tcatcctcgc cgatgccaac 5160

ctcgataagg tcctgtccgc ctacaacaag caccgcgata agcctatccg cgagcaggcc 5220

gagaacatca tccatctctt caccctcacc aacctcggtg cccctgccgc cttcaagtac 5280

ttcgatacca ccatcgatcg caagcgctac acctccacca aagaggtcct ggacgccacc 5340

ctcatccatc agtccatcac cggcctctac gaaacccgca tcgatctctc ccagctcggc 5400

ggcgaccctc cgaggaaacg tgccaaaaca gaagatgagt gatgaggatc cacttaacgt 5460

tactgaaatc atcaaacagc ttgacgaatc tggatataag atcgttggtg tcgatgtcag 5520

ctccggagtt gagacaaatg gtgttcagga tctcgataag atacgttcat ttgtccaagc 5580

agcaaagagt gccttctagt gatttaatag ctccatgtca acaagaataa aacgcgtttt 5640

cgggtttacc tcttccagat acagctcatc tgcaatgcat taatgcattg actgcaacct 5700

agtaacgcct tacaggctcc ggcgaagaga agaatagctt agcagagcta ttttcatttt 5760

cgggagacga gatcaagcag atcaacggtc gtcaagagac ctacgagact gaggaatccg 5820

ctcttggctc cacgcgacta tatatttgtc tctaattgta ctttgacatg ctcctcttct 5880

ttactctgat agcttgacta tgaaaattcc gtcaccagct cctgggttcg caaagataat 5940

tgcatgtttc ttccttgaac tctcaagcct acaggacaca cattcatcgt aggtataaac 6000

ctcgaaatca tttcctacta agatggtata caatagtaac catgcatggt tgcctagtga 6060

atgctccgta acacccaata cgccggccga aactttttta caactctcct atgagtcgtt 6120

tacccagaat gcacaggtac acttgtttag agg 6153

<210> 11

<211> 6870

<212> DNA

<213> 人工合成序列

<400> 11

tcctccgagg ttcgacatca gggttcgtca tagggagtga aacacccgcc atgattccgt 60

agccgcgcgc gaagatacga agcagatatt tcacggacat ggcggagata cttgtttccc 120

gtactaaggt agtcatgtcg gagacatctg aacgacagag ctggccaaga gaaccgacca 180

gttgccccag gacgatctag acaaaaaaaa agagagatga gtgggccact tttgccacaa 240

catcgacggc cctgcgaccg cccccaggca aacaaacaaa ccgccgaaca ataatacttt 300

tgtcatttta ggaggagcgt tgtatggata aaaacaacat ctcgttgctg cagaatgtgg 360

acttcaaact tgcagaaaat gggaggcgga tttgcatgat cggagggtag ttgactcacg 420

ccgcaggctg caaatccgtc ctccattatt ccatgaacaa cttcgtaagg ttgggctgag 480

cgccaatgcc taacggaccg ggggccacag cgcaacgtcc cacttaaagg ccagcgtgac 540

atgccagttc cataccaagt agtggcacca gaggcggcca atgctcagta agggcaggga 600

gggaggctca aacgattggc aaaaagaggg gcttgccagt tcagttccct gtgcgagcgc 660

gagaggggca gtttcaaatc tggaggggtg tgttgcgctg gtctgaagag aaagagaaga 720

ctgtacttaa taattgttca aagagtccat catcgcgttg cggactcctc tagctgtatt 780

tagagcccta tcattacttg tcgggtgcga atcaaaatac cgggatgcag ccctctggcg 840

atttgcatgc ggttgtggag gaagtgaagc ctgaatcgcg gggctgggcg gcaaagcacg 900

acgtgaaatt cctggcgaaa ttcgagggct tgccccaccg tggttgaagt ttttgtgctg 960

cgtaacccca ccaacccgcc ttgcccctcc cgcctgccca taaaaacttc gacccctcct 1020

caaatcttct tcgattcttc ctcttcactt ccttcgtcgg catacctgat tcaagcaatc 1080

acctgccact ttcaagtgcg tataccatca tcgatacact ggttcttgac aagtacatcg 1140

tctctaactt tcctttttgc agttttcatt aagcgcaagt cgccagtttc gttcttcaga 1200

atggactaca aggaccatga tggcgattac aaggaccacg acatcgatta taaggatgat 1260

gatgacaagc ctccgaggaa acgtgccaaa acagaagatg agatggataa gaagtactcc 1320

atcggcctcg acatcggcac caactccgtc ggctgggccg tcatcaccga tgagtacaag 1380

gtcccttcca agaagttcaa ggtcctcggc aacaccgatc gccattccat caagaagaac 1440

ctgatcggcg ccctcctgtt cgattccggc gaaaccgccg aggccacccg ccttaaacgc 1500

accgcccgtc gccgctacac ccgccgcaag aaccgcatct gctacctcca agaaatcttc 1560

tccaacgaga tggccaaggt cgatgatagc ttcttccacc gcctcgaaga gtccttcctg 1620

gtcgaagagg ataagaagca cgagcgccat cctatcttcg gcaacatcgt cgatgaggtc 1680

gcctaccatg agaagtaccc taccatctac catctccgca agaagctcgt cgattccacc 1740

gataaggccg atctccgcct catctacctc gccctcgccc atatgatcaa gttccgcggc 1800

catttcctca tcgagggcga tctcaaccct gataactccg atgtcgataa gctgttcatc 1860

cagctcgtcc agacctacaa ccagctgttc gaggaaaacc ctatcaacgc ctccggcgtc 1920

gatgccaagg ccatcctctc cgctcgcctc tccaagtctc gccgccttga gaaccttatc 1980

gcccagctcc ctggcgagaa gaagaacggc ctcttcggca acctgatcgc cctctccctc 2040

ggcctcaccc ctaacttcaa gtccaacttc gatctcgccg aggatgccaa gctccagctc 2100

tccaaggata cctacgatga tgatctcgat aacctcctcg cccagatcgg cgatcagtac 2160

gccgatctgt tcctcgccgc caagaacctc tccgatgcca tcctcctctc cgacatcctc 2220

cgcgtcaaca ccgagatcac caaggcccct ctgtccgcct ccatgatcaa gcgctacgat 2280

gagcatcatc aggacctcac cctgctcaag gccctcgtcc gccagcagct ccctgagaag 2340

tacaaagaga ttttcttcga tcagtccaag aacggctacg ccggctacat cgatggcggc 2400

gcttcccaag aagagttcta caagttcatc aagcctatcc ttgagaagat ggatggcacc 2460

gaggaactcc tcgtcaagct caaccgcgag gacctcctcc gcaagcagcg caccttcgat 2520

aacggctcca tccctcatca aatccatctc ggcgagctgc atgccatctt gcgccgccaa 2580

gaggatttct acccattcct caaggataac cgcgagaaga tcgaaaagat tctcaccttc 2640

cgcatccctt actacgtcgg ccctctcgct cgcggcaact cccgcttcgc ctggatgacc 2700

cgcaagtccg aggaaaccat caccccttgg aacttcgagg aagtcgtcga taagggcgcc 2760

tccgcccagt ccttcatcga gcgcatgacc aacttcgata agaacctccc taacgagaag 2820

gtcctcccta agcactccct gctctacgag tacttcaccg tctacaacga gctgaccaag 2880

gtcaagtacg tcaccgaggg tatgcgcaag cctgccttcc tgtccggcga gcagaagaag 2940

gccatcgtcg atctgctgtt caagaccaac cgcaaggtca ccgtcaagca gctcaaagag 3000

gattacttca agaaaatcga gtgcttcgat tccgtcgaga tcagcggcgt cgaggaccgc 3060

ttcaacgcct ccctcggaac ctaccatgat ctcctcaaga ttatcaagga taaggatttc 3120

ctcgacaacg aggaaaacga ggacatcctt gaggacatcg tcctcaccct caccctcttc 3180

gaggaccgcg aaatgatcga ggaacgcctc aagacctacg cccatctctt cgatgataag 3240

gtcatgaagc agctcaagcg ccgtcgctac accggctggg gtcgcctctc ccgcaagctc 3300

atcaacggca tccgcgataa gcagtccggc aagactatcc tcgatttcct caagtccgat 3360

ggcttcgcca accgcaactt catgcagctc atccatgatg attccctcac cttcaaagag 3420

gacatccaga aggcccaggt cagcggccag ggcgattccc tccatgagca tatcgccaac 3480

ctcgccggct cccctgccat caagaagggc atcctccaga ccgtcaaggt cgtcgatgag 3540

ctggtcaagg tcatgggccg ccataagcct gagaacatcg tcatcgagat ggcccgcgag 3600

aaccagacca cccagaaggg ccagaagaac tcccgcgagc gcatgaagcg catcgaggaa 3660

ggcatcaaag agctgggcag ccaaatcctc aaagagcatc ctgtcgagaa cacccagctc 3720

cagaacgaga agctctacct ctactacctc cagaacggcc gcgatatgta cgtcgatcaa 3780

gagctggaca tcaaccgcct ctccgattac gatgtcgatc atatcgtccc tcagtccttc 3840

ctgaaggatg attccatcga taacaaggtc ctcacccgct ccgataagaa ccgcggcaag 3900

tccgataacg tcccttccga agaggtcgtc aagaagatga agaactactg gcgccagctc 3960

ctcaacgcca agctcatcac ccagcgcaag ttcgataacc tcaccaaggc cgagcgcggt 4020

ggcctctccg agctggataa ggccggcttc atcaagcgcc agctcgtcga aacccgccag 4080

atcaccaagc acgtcgccca aatcctcgat tcccgcatga acaccaagta cgatgagaac 4140

gataagctca tccgcgaagt caaggtcatc accctcaagt ccaagctcgt cagcgatttc 4200

cgcaaggatt tccagttcta caaggtccgc gagatcaaca actaccatca tgcccatgat 4260

gcctacctca acgccgtcgt cggcaccgcc ctcatcaaga agtaccccaa gctcgaatcc 4320

gagttcgtct acggtgatta caaggtctac gatgtccgca agatgatcgc caagtccgag 4380

caagagatcg gcaaggctac cgccaagtac ttcttctact ccaacatcat gaatttcttc 4440

aagaccgaaa tcaccctcgc caacggcgaa atccgcaagc gccctctcat cgagactaac 4500

ggcgagactg gcgagatcgt ctgggataag ggccgcgatt tcgccaccgt ccgcaaggtc 4560

ctctccatgc ctcaggtcaa catcgtcaag aaaaccgagg tccagaccgg cggcttctcc 4620

aaagagtcca tcctccccaa gcgcaactcc gataagctga tcgcccgcaa gaaggattgg 4680

gaccctaaga agtacggcgg cttcgattcc cctaccgtcg cctactccgt cctcgtcgtc 4740

gccaaggtcg agaagggcaa gtccaagaag ctcaagtccg tcaaagagct gctcggcatc 4800

actattatgg aacgctccag cttcgagaag aaccctatcg atttccttga ggccaagggc 4860

tacaaagagg tcaagaagga cctcatcatc aagctcccca agtactccct gttcgagctt 4920

gagaacggcc gcaagcgcat gctcgcctcc gccggtgagc ttcagaaggg caacgagctg 4980

gccctgcctt ccaagtacgt caacttcctc tacctcgcct cccattacga gaagctcaag 5040

ggctcccctg aggataacga gcagaagcag ctgttcgtcg agcagcataa gcactacctc 5100

gatgagatca tcgagcagat cagcgagttc tccaagcgcg tcatcctcgc cgatgccaac 5160

ctcgataagg tcctgtccgc ctacaacaag caccgcgata agcctatccg cgagcaggcc 5220

gagaacatca tccatctctt caccctcacc aacctcggtg cccctgccgc cttcaagtac 5280

ttcgatacca ccatcgatcg caagcgctac acctccacca aagaggtcct ggacgccacc 5340

ctcatccatc agtccatcac cggcctctac gaaacccgca tcgatctctc ccagctcggc 5400

ggcgacatgg tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 5460

ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 5520

acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 5580

cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 5640

atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 5700

atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 5760

accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 5820

gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 5880

aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 5940

ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 6000

aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 6060

atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 6120

aagcctccga ggaaacgtgc caaaacagaa gatgagtgat gaggatccac ttaacgttac 6180

tgaaatcatc aaacagcttg acgaatctgg atataagatc gttggtgtcg atgtcagctc 6240

cggagttgag acaaatggtg ttcaggatct cgataagata cgttcatttg tccaagcagc 6300

aaagagtgcc ttctagtgat ttaatagctc catgtcaaca agaataaaac gcgttttcgg 6360

gtttacctct tccagataca gctcatctgc aatgcattaa tgcattgact gcaacctagt 6420

aacgccttac aggctccggc gaagagaaga atagcttagc agagctattt tcattttcgg 6480

gagacgagat caagcagatc aacggtcgtc aagagaccta cgagactgag gaatccgctc 6540

ttggctccac gcgactatat atttgtctct aattgtactt tgacatgctc ctcttcttta 6600

ctctgatagc ttgactatga aaattccgtc accagctcct gggttcgcaa agataattgc 6660

atgtttcttc cttgaactct caagcctaca ggacacacat tcatcgtagg tataaacctc 6720

gaaatcattt cctactaaga tggtatacaa tagtaaccat gcatggttgc ctagtgaatg 6780

ctccgtaaca cccaatacgc cggccgaaac ttttttacaa ctctcctatg agtcgtttac 6840

ccagaatgca caggtacact tgtttagagg 6870

<210> 12

<211> 2368

<212> DNA

<213> 人工合成序列

<400> 12

accggggtaa ggtactctgt aagttacggt acctctggag ccggtgccgc accccactat 60

tttttttctt tttccccgag atcccccctg gcatcagacc ctcctggtcc ccccccctgt 120

tccctcctca ctgaatcgct gcgttcccga gcccacctaa gcccccgctg ttcccacacc 180

acatgccagc acaccacacg cccctccccc tatgtcagcc cgcccgcgtc atttaaaacg 240

agtgccgcat ccccccaagc aaactcgccc aacttttgtt acttccccat gccactttga 300

gtttccccaa catcagcacc ccagacccca gataacaaag tcaaaataaa ggttcccatt 360

gtctcccgac acagctcaac acgctgtgtc agacgagcaa ccaccaaaca catatcgctt 420

cgatactcga ccaagaacga cgtgcctgac atcagtaccc ctcgtcccac actcgaagtt 480

gggcggcttg ttgtttttct ccggttgcgt gctccgcgtg caaccaagtt gaaagagtcc 540

gggaacaaca tcaggctgag atctggtgtt ggagcaactc cgcttgggag ggtggacata 600

cgacgttaac tgatattgaa ggagcatttt ttgggcttgg ctggagctag tggaggtcaa 660

caatgaatgc ctattttggt ttagtcgtcc aggcggtgag cacaaaattt gtgtcgtttg 720

acaagatggt tcatttaggc aactggtcag atcagcccca cttgtagcag tagcggcggc 780

gctcgaagtg tgactcttat tagcagacag gaacgaggac attattatca tctgctgctt 840

ggtgcacgat aacttggtgc gtttgtcaag caaggtaagt ggacgacccg gtcatacctt 900

cttaagttcg cccttcctcc ctttatttca gattcaatct gacttaccta ttctacccaa 960

gcatccaaat gattgaacaa gatggattgc acgcaggttc tccggccgct tgggtggaga 1020

ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc gccgtgttcc 1080

ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc ggtgccctga 1140

atgaactgca agacgaggca gcgcggctat cgtggctggc cacgacgggc gttccttgcg 1200

cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg ggcgaagtgc 1260

cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc atcatggctg 1320

atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac caccaagcga 1380

aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat caggatgatc 1440

tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc aaggcgagca 1500

tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg aatatcatgg 1560

tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg gcggaccgct 1620

atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc gaatgggctg 1680

accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc gccttctatc 1740

gccttcttga cgagttcttc tgaagttccc cgggtgtagc aaacgcttct cgaggtccga 1800

cgagctcacc cggcactcga ggatacacaa caatcccaac tcgcggagag gaaacaaggg 1860

ccatcatcag cacgccgcca tgatccagag gatgcagcac gacgccatgg caccgccacc 1920

ggggcccaag atgatccgct cggcgccccc cacggcattg tcttcaccca acgtgtcgcc 1980

tcctcactac agctcctatc ccatgaatct tcccccgccg ctcagtctcg gcccgtacaa 2040

ccgcggtgcc ttgagcagcc agagtggttc ggatgtggca atgttggcga ggacggccga 2100

ccgggacacc accccgagtc agtctcatta cccgccgtcg agacagcacc cgtactacgg 2160

cgggtcgctc cactcgtcgc ggaacccgct gcccggtctg ggcgcctacc acatgtcgcg 2220

gtcgcactcg aacgatgacc acgacgacca ctatgcgcaa agttacaggc agccgaagag 2280

gtcgaggccc aactccccca actcgacggc tccttcctct cctacctttt cccacaactc 2340

gttgtccccg acgccggacc acacccca 2368

<210> 13

<211> 2363

<212> DNA

<213> 人工合成序列

<400> 13

aaccaaccct ccttcgactt tccggccgcc aaagcgccag gattcgttgg tgagtcgtca 60

cagatcccta ggtcctctcc ttctcgtcct tctccgcctc cgcccagtca cggcggacca 120

gcccgccgtg gctctctctc ttcttccgag tcttgcgctt ccgagtccac ggtcgtcgcc 180

gcccccaagc cctccagtcc cggcctggcg gtcgacacac gccttgcgcg gcagacgacc 240

accatgtctg catccctggc gtccacccct gcctcttcct cttctggcct cctcgtgacg 300

ccgcccacga cctctgcttc ttccttttct tcttcttctt cttcttcttt ttcttcttct 360

tcctcttctc tcgccgcctg gagcagcccg cccgcggcct gcggctcgcc ctcgcgcacg 420

ggcaccccca acgcccgcat gctctcttct ttcttttttc aatcttctgg gcatttcgtc 480

ccgcctctcg agacctgttg gtttcctctc tcgcgattgc gagatcccac cgcacgaccg 540

ggttttgctg acatgaaaaa ccctcgcgcc tacagatccc tccttaattc acccggacgt 600

cgacgttaac tgatattgaa ggagcatttt ttgggcttgg ctggagctag tggaggtcaa 660

caatgaatgc ctattttggt ttagtcgtcc aggcggtgag cacaaaattt gtgtcgtttg 720

acaagatggt tcatttaggc aactggtcag atcagcccca cttgtagcag tagcggcggc 780

gctcgaagtg tgactcttat tagcagacag gaacgaggac attattatca tctgctgctt 840

ggtgcacgat aacttggtgc gtttgtcaag caaggtaagt ggacgacccg gtcatacctt 900

cttaagttcg cccttcctcc ctttatttca gattcaatct gacttaccta ttctacccaa 960

gcatccaaat gattgaacaa gatggattgc acgcaggttc tccggccgct tgggtggaga 1020

ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc gccgtgttcc 1080

ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc ggtgccctga 1140

atgaactgca agacgaggca gcgcggctat cgtggctggc cacgacgggc gttccttgcg 1200

cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg ggcgaagtgc 1260

cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc atcatggctg 1320

atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac caccaagcga 1380

aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat caggatgatc 1440

tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc aaggcgagca 1500

tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg aatatcatgg 1560

tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg gcggaccgct 1620

atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc gaatgggctg 1680

accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc gccttctatc 1740

gccttcttga cgagttcttc tgagtcttgt ctcgtaccag tcccacttct ctggcgagca 1800

gccattcggt ggcgacgagt cgagggacaa gcagcgctgc ccgcaccagg actgcggcaa 1860

gaccttcaag gacctcaagg ctcatatgct cacccaccag aacgagcggc ccgagaagtg 1920

ccccatcacg acgtgcgagt atcacgtaaa aggcttcgcg agaaagtgag tagtaatata 1980

gtagtagcct gtgtgcccgg ctcttcaaga acccctgaac acaacaacaa acacaaggct 2040

cagagcgcta accgtgccaa tcttgatcag gtacgacaag aaccgccaca cgctcaccca 2100

ctacaagggc accatggtgt gcggcttctg cccggggtcg ggctccgcgg cggagaagtc 2160

gttcaaccgg gccgatgtgt tcaagaggca cttgacggcc gtgcacggag tcgagcagac 2220

gcctcccaac ggtcggaaga agacggccgg cggcagcagc agcgggaacg acgcgaagct 2280

cacgggctat gcgcccgacg cgacgggcaa gtgctcgacg tgctcgcaaa ctttcagcaa 2340

cgcacaagac ttttacgagc acc 2363

<210> 14

<211> 2363

<212> DNA

<213> 人工合成序列

<400> 14

actatcaaca gccccccgga ttgctgaccg ttggccattc acggcccttc gtttgccagt 60

ccttcgccag ggtcaaccta ccccgcggtg gggggttgtt cttggatcct tgtcgaggcc 120

ccggctgccc acatcgccca cgctgtgcac tcagcgtaac acagggcccg gatctctcaa 180

gcgatgccca gctttttttc atcggtgttg acggtccgaa actcgcggga gagatggggg 240

cagatcatgg cgggaaacgg ccgtgatggt tcctggatat aaaggagatc aggccttccc 300

tcctcggctc attggggcct actagcacat catcatccgt cttccatccc tcctcagaac 360

ttccttcccc ttcctcctat ccacctttcc cttactcaca cagacaatcg tccatcgtcc 420

accatgtctc ttcccaagga cttcaagtgg ggcttcgcca ccgcctcgta agttcaagga 480

cccgggcttt tcgatcaagc tcacagaacc gtccttggct gactgtgtgt tccctttctc 540

tcctcaccca caggtaccag attgagggct ccgtcaacga ggatggccgt ggcccctcca 600

cgacgttaac tgatattgaa ggagcatttt ttgggcttgg ctggagctag tggaggtcaa 660

caatgaatgc ctattttggt ttagtcgtcc aggcggtgag cacaaaattt gtgtcgtttg 720

acaagatggt tcatttaggc aactggtcag atcagcccca cttgtagcag tagcggcggc 780

gctcgaagtg tgactcttat tagcagacag gaacgaggac attattatca tctgctgctt 840

ggtgcacgat aacttggtgc gtttgtcaag caaggtaagt ggacgacccg gtcatacctt 900

cttaagttcg cccttcctcc ctttatttca gattcaatct gacttaccta ttctacccaa 960

gcatccaaat gattgaacaa gatggattgc acgcaggttc tccggccgct tgggtggaga 1020

ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc gccgtgttcc 1080

ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc ggtgccctga 1140

atgaactgca agacgaggca gcgcggctat cgtggctggc cacgacgggc gttccttgcg 1200

cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg ggcgaagtgc 1260

cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc atcatggctg 1320

atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac caccaagcga 1380

aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat caggatgatc 1440

tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc aaggcgagca 1500

tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg aatatcatgg 1560

tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg gcggaccgct 1620

atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc gaatgggctg 1680

accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc gccttctatc 1740

gccttcttga cgagttcttc tgatgttcaa ggccatcccc aagtgcaagc actggatcac 1800

cttcaacgag ccgtggtgca cgtccatcct gggctacaac acgggctact tcgcgcccgg 1860

ccgcacgtcg gaccgcagca agtcgcccgt cggcgacagc gcgcgcgagc cgtggatcgt 1920

cggccacaac atcctcatcg cgcacgggag ggccgtcaag gcgtaccgcg aggacttcaa 1980

gcccacgcag ggcggcgaga tcggcatcac gctcaacggc gacgccacgc tcccctggga 2040

cccggaggac ccggccgacg tcgaggcgtg cgaccgcaag atcgagttcg ccatctcgtg 2100

gttcgccgac cccatctact ttggcgagta cccggcgtcg atgcgcaagc agctgggcga 2160

ccgcctgccc aagttcacgg ccgaggaggt ggcgctcgtc aagggctcca acgacttcta 2220

cggcatgaac cactacacgg ccaactacat caagcacaag aagggcgtgc cgcccgagga 2280

cgacttcctg ggcaacctcg agacgctctt ctacaacaag aacgccgact gcatcgggcc 2340

cgagacgcag tccttctggc tgc 2363

<210> 15

<211> 2363

<212> DNA

<213> 人工合成序列

<400> 15

ccttcctagt cctcgcagca aactcgagct gctatcagat tcccgggaag cggcctgcca 60

cagccgctca acccggcctt ggcatggcca ggcggccctt tcatgtgtcg aaagcggcag 120

gtcatcagca cagatctcga gggtgggaaa gagagggggg ggaggggcga tgctggggcg 180

atgctgcttg gagccgcatc cggggagggg gccctgctgt tcatccatat ccaggatgat 240

gcgagattga agcaagataa ataacacggc ttccccctcc cctttcgatc cggaccagac 300

catcgtctcc aacaccccaa agtcgatccg acaagtccca atccaccccg cccgcccctc 360

cctccgtcgc cgtcccggtc ttccgatttc gtcaagatgc acttctccac cgctctcctg 420

gccttcctgc ccgccgccct cgcggcccct actgccgaga ccctcgacaa gcgcgccccg 480

atcctgactg ctcgcgctgg ccaggtcgtc ccgggcaagt acatcatcaa gctccgcgac 540

ggagccagcg acgatgtcct tgaggccgcc atcggcaagc tccgctccaa ggccgaccac 600

cgacgttaac tgatattgaa ggagcatttt ttgggcttgg ctggagctag tggaggtcaa 660

caatgaatgc ctattttggt ttagtcgtcc aggcggtgag cacaaaattt gtgtcgtttg 720

acaagatggt tcatttaggc aactggtcag atcagcccca cttgtagcag tagcggcggc 780

gctcgaagtg tgactcttat tagcagacag gaacgaggac attattatca tctgctgctt 840

ggtgcacgat aacttggtgc gtttgtcaag caaggtaagt ggacgacccg gtcatacctt 900

cttaagttcg cccttcctcc ctttatttca gattcaatct gacttaccta ttctacccaa 960

gcatccaaat gattgaacaa gatggattgc acgcaggttc tccggccgct tgggtggaga 1020

ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc gccgtgttcc 1080

ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc ggtgccctga 1140

atgaactgca agacgaggca gcgcggctat cgtggctggc cacgacgggc gttccttgcg 1200

cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg ggcgaagtgc 1260

cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc atcatggctg 1320

atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac caccaagcga 1380

aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat caggatgatc 1440

tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc aaggcgagca 1500

tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg aatatcatgg 1560

tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg gcggaccgct 1620

atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc gaatgggctg 1680

accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc gccttctatc 1740

gccttcttga cgagttcttc tgaggctcca ccacctacac ctacgacacc agcgccggcg 1800

agggcacctg tgcctatgtg atcgacacgg gcatctacac tagccactcc gtatgtctcg 1860

cggttacctc ccctttcgga agaaggggca tccatatgct gacccctcct gatcacagga 1920

cttcggcggc cgtgccactt tcgccgccaa cttcgtcgac agctctaaca ccgatggcaa 1980

cggccacggc acccacgtcg ccggcaccat cggcggcacc acgtacggtg ttgccaagaa 2040

gaccaagctc tacgccgtca aggttctcgg ctccgacggc tctggcacca cgtatgcctc 2100

gcacccgcgc acccgcacac ccgcccggcc gttatcttct gactgacatt cctctttctc 2160

ctctctagtt ctggtgtcat tgctggcatc aacttcgtcg ctgacgacgc gcccaagcgc 2220

agctgcccca agggcgtcgt cgccaacatg tcgctcggcg gtagctactc ggcctccatc 2280

aacaacgccg ccgccgccct cgtcaggtcg ggcgtcttcc tggccgtcgc cgccggcaac 2340

gagaaccaga acgccgccaa ctc 2363

<210> 16

<211> 50

<212> DNA

<213> 人工合成序列

<400> 16

gccagtttcg ttcttcagaa agcttatgga ctacaaggac catgatggcg 50

<210> 17

<211> 55

<212> DNA

<213> 人工合成序列

<400> 17

tgatgatttc agtaacgtta agtggatcct catcactcat cttctgtttt ggcac 55

<210> 18

<211> 55

<212> DNA

<213> 人工合成序列

<400> 18

ctaggccacc atgttgggcc cggcgcgccg aattctcctc cgaggttcga catca 55

<210> 19

<211> 50

<212> DNA

<213> 人工合成序列

<400> 19

cgccatcatg gtccttgtag tccataagct ttctgaagaa cgaaactggc 50

<210> 20

<211> 55

<212> DNA

<213> 人工合成序列

<400> 20

gtgccaaaac agaagatgag tgatgaggat ccacttaacg ttactgaaat catca 55

<210> 21

<211> 55

<212> DNA

<213> 人工合成序列

<400> 21

tcctgcccgt cacagagatt tgaccatggg agctccctct aaacaagtgt acctg 55

<210> 22

<211> 55

<212> DNA

<213> 人工合成序列

<400> 22

tctctcccag ctcggcggcg acgaattcat ggtgagcaag ggcgaggagc tgttc 55

<210> 23

<211> 77

<212> DNA

<213> 人工合成序列

<400> 23

tcagtaacgt taagtggatc cttactcatc ttctgttttg gcacgtttcc tcggaggctt 60

gtacagctcg tccatgc 77

<210> 24

<211> 25

<212> DNA

<213> 人工合成序列

<400> 24

aggatcggtg gagtgaagtt cggaa 25

<210> 25

<211> 49

<212> DNA

<213> 人工合成序列

<400> 25

ctaaaacgac cctccatgct gttcgccgag gaaagaaaga aaagaagag 49

<210> 26

<211> 49

<212> DNA

<213> 人工合成序列

<400> 26

ctaaaacctg cagactttgc gcgttgcgag gaaagaaaga aaagaagag 49

<210> 27

<211> 49

<212> DNA

<213> 人工合成序列

<400> 27

ctaaaacggt acgagggctc atagggcgag gaaagaaaga aaagaagag 49

<210> 28

<211> 49

<212> DNA

<213> 人工合成序列

<400> 28

ctaaaacggg atggcgcaga atgtgtcgag gaaagaaaga aaagaagag 49

<210> 29

<211> 49

<212> DNA

<213> 人工合成序列

<400> 29

ctaaaacctg aacttgccgc ggtagacgag gaaagaaaga aaagaagag 49

<210> 30

<211> 50

<212> DNA

<213> 人工合成序列

<400> 30

tcctcggcga acagcatgga gggtcgtttt agagctagaa atagcaagtt 50

<210> 31

<211> 50

<212> DNA

<213> 人工合成序列

<400> 31

tcctcgcaac gcgcaaagtc tgcaggtttt agagctagaa atagcaagtt 50

<210> 32

<211> 50

<212> DNA

<213> 人工合成序列

<400> 32

tcctcgccct atgagccctc gtaccgtttt agagctagaa atagcaagtt 50

<210> 33

<211> 50

<212> DNA

<213> 人工合成序列

<400> 33

tcctcgacac attctgcgcc atcccgtttt agagctagaa atagcaagtt 50

<210> 34

<211> 50

<212> DNA

<213> 人工合成序列

<400> 34

tcctcgtcta ccgcggcaag ttcaggtttt agagctagaa atagcaagtt 50

<210> 35

<211> 27

<212> DNA

<213> 人工合成序列

<400> 35

aaaaaaagca ccgactcggt gccactt 27

<210> 36

<211> 57

<212> DNA

<213> 人工合成序列

<400> 36

ttgggcccgg cgcgccgaat tcccggggat ccaccggggt aaggtactct gtaagtt 57

<210> 37

<211> 50

<212> DNA

<213> 人工合成序列

<400> 37

gctccttcaa tatcagttaa cgtcgtatgt ccaccctccc aagcggagtt 50

<210> 38

<211> 50

<212> DNA

<213> 人工合成序列

<400> 38

aactccgctt gggagggtgg acatacgacg ttaactgata ttgaaggagc 50

<210> 39

<211> 50

<212> DNA

<213> 人工合成序列

<400> 39

aagcgtttgc tacacccggg gaacttcaga agaactcgtc aagaaggcga 50

<210> 40

<211> 50

<212> DNA

<213> 人工合成序列

<400> 40

tcgccttctt gacgagttct tctgaagttc cccgggtgta gcaaacgctt 50

<210> 41

<211> 58

<212> DNA

<213> 人工合成序列

<400> 41

cagatctacc atggtggact cctcttaaag ctttggggtg tggtccggcg tcggggac 58

<210> 42

<211> 57

<212> DNA

<213> 人工合成序列

<400> 42

ttgggcccgg cgcgccgaat tcccggggat ccaaccaacc ctccttcgac tttccgg 57

<210> 43

<211> 50

<212> DNA

<213> 人工合成序列

<400> 43

gctccttcaa tatcagttaa cgtcgacgtc cgggtgaatt aaggagggat 50

<210> 44

<211> 50

<212> DNA

<213> 人工合成序列

<400> 44

atccctcctt aattcacccg gacgtcgacg ttaactgata ttgaaggagc 50

<210> 45

<211> 50

<212> DNA

<213> 人工合成序列

<400> 45

aagtgggact ggtacgagac aagactcaga agaactcgtc aagaaggcga 50

<210> 46

<211> 50

<212> DNA

<213> 人工合成序列

<400> 46

tcgccttctt gacgagttct tctgagtctt gtctcgtacc agtcccactt 50

<210> 47

<211> 58

<212> DNA

<213> 人工合成序列

<400> 47

cagatctacc atggtggact cctcttaaag cttggtgctc gtaaaagtct tgtgcgtt 58

<210> 48

<211> 57

<212> DNA

<213> 人工合成序列

<400> 48

ttgggcccgg cgcgccgaat tcccggggat ccactatcaa cagccccccg gattgct 57

<210> 49

<211> 50

<212> DNA

<213> 人工合成序列

<400> 49

gctccttcaa tatcagttaa cgtcgtggag gggccacggc catcctcgtt 50

<210> 50

<211> 50

<212> DNA

<213> 人工合成序列

<400> 50

aacgaggatg gccgtggccc ctccacgacg ttaactgata ttgaaggagc 50

<210> 51

<211> 50

<212> DNA

<213> 人工合成序列

<400> 51

ttgcacttgg ggatggcctt gaacatcaga agaactcgtc aagaaggcga 50

<210> 52

<211> 50

<212> DNA

<213> 人工合成序列

<400> 52

tcgccttctt gacgagttct tctgatgttc aaggccatcc ccaagtgcaa 50

<210> 53

<211> 58

<212> DNA

<213> 人工合成序列

<400> 53

cagatctacc atggtggact cctcttaaag cttgcagcca gaaggactgc gtctcggg 58

<210> 54

<211> 57

<212> DNA

<213> 人工合成序列

<400> 54

ttgggcccgg cgcgccgaat tcccggggat ccccttccta gtcctcgcag caaactc 57

<210> 55

<211> 50

<212> DNA

<213> 人工合成序列

<400> 55

caagctccgc tccaaggccg accaccgacg ttaactgata ttgaaggagc 50

<210> 56

<211> 50

<212> DNA

<213> 人工合成序列

<400> 56

caagctccgc tccaaggccg accaccgacg ttaactgata ttgaaggagc 50

<210> 57

<211> 50

<212> DNA

<213> 人工合成序列

<400> 57

tgtcgtaggt gtaggtggtg gagcctcaga agaactcgtc aagaaggcga 50

<210> 58

<211> 50

<212> DNA

<213> 人工合成序列

<400> 58

tcgccttctt gacgagttct tctgaggctc caccacctac acctacgaca 50

<210> 59

<211> 58

<212> DNA

<213> 人工合成序列

<400> 59

cagatctacc atggtggact cctcttaaag cttgagttgg cggcgttctg gttctcgt 58

<210> 60

<211> 25

<212> DNA

<213> 人工合成序列

<400> 60

tcccacttaa aggccagcgt gacat 25

<210> 61

<211> 25

<212> DNA

<213> 人工合成序列

<400> 61

tagtaaggga tgcggaaggt gagaa 25

<210> 62

<211> 25

<212> DNA

<213> 人工合成序列

<400> 62

ctccccatct ctctcaaaga ccagc 25

<210> 63

<211> 25

<212> DNA

<213> 人工合成序列

<400> 63

gctcactaac cgccttgaaa ctctc 25

<210> 64

<211> 25

<212> DNA

<213> 人工合成序列

<400> 64

atacagtacc tctgcacaac catcc 25

<210> 65

<211> 25

<212> DNA

<213> 人工合成序列

<400> 65

agttgggatt gttgtgtatc ctcga 25

<210> 66

<211> 25

<212> DNA

<213> 人工合成序列

<400> 66

aaccccaggc atcgtagatc agggc 25

<210> 67

<211> 25

<212> DNA

<213> 人工合成序列

<400> 67

gcatatgagc cttgaggtcc ttgaa 25

<210> 68

<211> 25

<212> DNA

<213> 人工合成序列

<400> 68

cctcagtctc cgcaatatcg tgcat 25

<210> 69

<211> 25

<212> DNA

<213> 人工合成序列

<400> 69

gaagtagccc gtgttgtagc ccagg 25

<210> 70

<211> 25

<212> DNA

<213> 人工合成序列

<400> 70

ttctggcctg cccttttctt tcaac 25

<210> 71

<211> 25

<212> DNA

<213> 人工合成序列

<400> 71

gccccttctt ccgaaagggg aggta 25

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1