本发明属于基因工程和生物技术领域,涉及一种CRISPR/Cas9系统的开发,具体涉及一种基因组编辑载体、其组成的基因组编辑系统及应用,尤其涉及一种嗜热真菌基因组DNA编辑载体、其组成的基因组编辑系统CRISPR/Cas9及编辑方法和应用。
背景技术:
毁丝霉属菌株(Myceliophthora)是一种能够快速降解纤维素的嗜热丝状真菌,有较快的代谢率,能够分泌大量的木质纤维素水解酶,其酶系的种类和数量相当丰富。与工业纤维素酶生产菌里氏木霉、斜卧青霉相比,嗜热毁丝霉的高温发酵和所产酶系在高温下有高活力和高稳定性优势,成为天然耐高温纤维素酶储存库,是一类非常具有开发潜力的木质纤维素产酶体系。虽然近年来随着基因组测序的完成和发布,嗜热毁丝霉基因组内各类酶的开发取得了相当的进展,2011年嗜热毁丝霉基因组测序的完成和发布,这将会极大促进对其的开发研究。但是嗜热毁丝霉本身的遗传改造研究少之又少,更缺乏成熟的可回收基因筛选标记,导致嗜热毁丝霉的基因组多位点编辑更是难以企及。因此,对嗜热毁丝霉进行基因组遗传的操作编辑,已经成为当前研究的热点,一直受到各国政府,企业,科研机构的广泛关注。
基因组的定点编辑技术是基因功能研究的重要手段之一,对基因治疗、育种研究和代谢改造等都具有重要的意义和价值,是当前的研究热点。研究表明,如果在基因组DNA靶位点上引入双链断裂(Double Strand Breaks,DSBs),细胞中相应的同源重组效率比自发同源重组大大提高,这一发现给基因组靶向修饰技术带来了希望。为了能够在基因组DNA上引入位点特异性的DSBs,近年来研究者们先后开发了几代特异性的人工核酸内切酶技术,其中包括锌指核酸酶(Zinc finger nucleases,ZFNs),TALE核酸酶(Transcription activator-like effector nuclease,TALENs)技术和近期迅猛崛起的CRISPR/Cas9核酸酶技术。
CRISPR位点和Cas相关基因共同构成CRISPR/Cas系统,该系统是细菌和古细菌中存在的一种获得性免疫系统,通过编码一些特殊的蛋白及RNA共同对抗噬菌体和质粒等外来DNA的入侵。对来源于酿脓链球菌II型CRISPR/Cas系统的体外研究表明,只需要Cas9、crRNA及tracrRNA(trans-activating crRNA)三者共同存在的情况便可以实现对DNA分子的特异性识别和切割。研究者发现将crRNA和tracrRNA用一个Loop环(GAAA)连接成一个单链的嵌合体结构即单链的导向RNA(single guide RNA,sgRNA),采用单一的sgRNA成功地指导了Cas9对靶序列DNA的切割,这一发现为CRISPR/Cas9核酸酶技术的开发奠定了基础。基于上述研究的发现,CRISPR/Cas9系统已经被报道在许多哺乳动物和植物的基因组编辑研究中获得了成功应用,与此同时,也有研究者尝试对微生物进行基因编辑,包括对酵母、丝状真菌、细菌、噬菌体及病毒进行基因编辑也取得了相应的成功。
尽管在一些中温的真菌中CRISPR/Cas9系统被成功的开发,但是CRISPR/Cas9系统能否在耐高温的丝状真菌细胞内工作,尤其是能否发现高效诱导引导RNA(gRNA)在嗜热真菌体内表达的RNA聚合酶III型启动子,包括Cas9和gRNA是否能够通过体内转录的方式引入嗜热毁丝霉细胞中对靶位点进行成功编辑,以及能否特异性地打靶嗜热真菌基因组DNA,至今这些研究尚未有报道和阐释。
因此,开发能够显著提高嗜热真菌基因组辑效率的方法成为本领域迫切需要解决的一个技术问题。
技术实现要素:
本发明的目的是提供一种基因组编辑载体、其组成的基因组编辑系统及应用,尤其涉及一种嗜热真菌基因组DNA编辑载体、其组成的基因组编辑系统CRISPR/Cas9及编辑方法和 应用,所述系统能够显著提高丝状真菌基因组的编辑效率,所述基因组编辑系统可以对嗜热真菌的多个靶标位点进行编辑,从而获得一种稳定的遗传性状的基因编辑突变株,能够高产纤维素酶。
为达此目的,本发明采用以下技术方案:
第一方面,本发明提供一种基因组编辑载体,所述基因组编辑载体包括启动sgRNA的编码DNA转录的启动子,所述启动子为RNA聚合酶III型U6型启动子。
现有技术目前没有在嗜热真菌中发现RNA聚合酶III型U6启动子,本发明通过blast比对发现,发现本发明的RNA聚合酶III型U6型启动子同源性极低,小于25%,再通过上下游,核苷酸序列结构等综合分析,申请人确定了一个启动子序列,命名为U6p,申请人在后续的实验的验证测试中意外发现其具有转录sgRNA的功能。
根据本发明,所述RNA聚合酶III型U6型启动子为嗜热毁丝霉RNA聚合酶III型U6型启动子。
优选地,所述RNA聚合酶III型U6型启动子的核苷酸序列如SEQ ID NO.1所示。
根据本发明,所述基因组编辑载体还包括所述RNA聚合酶III型U6型启动子调控的sgRNA转录的表达框。
优选地,所述sgRNA转录的表达框为RNA聚合酶III型U6型启动子调控的sgRNA转录,其中包括对基因amdS,cre1,res1,gh1-1和alp1的靶向位点,U6p-amdS-sgRNA、U6p-cre1-sgRNA、U6p-res1-sgRNA、U6p-gh1-1-sgRNA或U6p-alp1-sgRNA中的任意一种或至少两种的组合。
优选地,所述U6p-amdS-sgRNA的核苷酸序列如SEQ ID NO.2所示;
优选地,所述U6p-cre1-sgRNA的核苷酸序列如SEQ ID NO.3所示;
优选地,所述U6p-res1-sgRNA的核苷酸序列如SEQ ID NO.4所示;
优选地,所述U6p-gh1-1-sgRNA的核苷酸序列如SEQ ID NO.5所示;
优选地,所述U6p-alp1-sgRNA的核苷酸序列如SEQ ID NO.6所示。
本发明中,所述cre1为碳分解代谢物阻遏效应转录因子cre1(MYCTH_2310085),所述res1为内质网压力响应的调控因子res1(MYCTH_2302052),所述gh1-1为葡萄糖苷酶基因gh1-1(MYCTH_115968),所述alp1为碱性蛋白酶alp1(MYCTH_2303011)。
优选地,所述基因组编辑载体还包括Cas9蛋白的表达框。
优选地,所述Cas9蛋白的表达框包括Ptef1启动子、Ptef1启动子调控的Cas9蛋白和TrprC终止子。
优选地,所述Ptef1启动子为嗜热毁丝霉翻译延伸因子TEF1A的启动子。
优选地,所述Ptef1启动子的核苷酸序列如SEQ ID NO.7所示。
优选地,所述Cas9蛋白的氨基酸序列如SEQ ID NO.8所示,所述Cas9蛋白的核苷酸序列如SEQ ID NO.9所示。
任选地,所述Cas9蛋白的表达框还包括绿色荧光标记蛋白。
本发明中,所述绿色荧光标记蛋白为eGFP基因,其作用主要是用来示踪基因组编辑的过程,在实际实验中,绿色荧光标记蛋白可选择性串联。
优选地,所述Cas9蛋白的表达框的核苷酸序列如SEQ ID NO.10-11所示。
本发明中,所述SEQ ID NO.10是没有串联绿色荧光标记蛋白的Cas9蛋白的表达框,所述SEQ ID NO.11是串联绿色荧光标记蛋白的Cas9蛋白的表达框。
本发明sgRNA转录的表达框和Cas9蛋白的表达框可以对丝状真菌的多个靶标位点进行编辑,sgRNA转录的表达框可对所述5个基因位点(amdS、cre1、res1、gh1-1和alp1)进行识别,再通过Cas9蛋白的表达框进行编辑任意一个基因位点,根据所要编辑的基因位点导入相应的sgRNA转录的表达框即可实现该基因位点的编辑,且本发明可同时编辑所述的5个基因位点,也可以单独编辑其中一个基因位点。
第二方面,本发明提供一种基因组编辑的系统,所述系统包括如第一方面所述的基因组编辑载体。
根据本发明,所述系统还包括同源供体DNA序列;
优选地,所述同源供体DNA序列包括donor-cre1、donor-res1、donor-gh1-1或donor-alp1中的任意一种或至少两种的组合;
优选地,所述donor-cre1的核苷酸序列如SEQ ID NO.12所示;
优选地,所述donor-res1的核苷酸序列如SEQ ID NO.13所示;
优选地,所述donor-gh1-1的核苷酸序列如SEQ ID NO.14所示;
优选地,所述donor-alp1的核苷酸序列如SEQ ID NO.15所示。
本发明所述的供体DNA序列是由donor-cre1、donor-res1、donor-gh1-1和donor-alp1左右两条同源片段与抗性基因neo通过Gibson Assembly的方法扩增而成,通过将所述同源供体DNA序列一起导入丝状真菌细胞,可实现同源重组,效率高达90-100%,若不导入供体DNA序列也能通过非同源端连接(NHEJ)实现所述基因位点的编辑。
本发明中,将Cas9蛋白的表达框和U6p-amdS-sgRNA转录的表达框共转化进入嗜热毁丝霉Δubx8::amdS的原生质体细胞后,通过非同源端连接(NHEJ)对amdS位点特异性DSB的不精确修复,进而得到基因组编辑突变株Δubx8ΔamdS。
本发明中,将Cas9蛋白的表达框和U6p-cre1-sgRNA转录的表达框及donor-cre1分别共转化进入野生型菌株M.thermophile ATCC 42464和M.heterothallica CBS 203.75原生质体细胞后,通过同源重组获得基因编辑突变株ΔMtcre1和ΔMhcre1,其同源重组效率高达90-95%。
本发明中,将sgRNA转录的表达框及其供体DNA序列共转化进入嗜热毁丝霉Δubx8ΔamdS的原生质体细胞后,通过同源重组得到基因编辑突变株,包括单基因突变株Δubx8ΔamdSΔcre1,Δubx8ΔamdSΔres1,Δubx8ΔamdSΔalp1和Δubx8ΔamdSΔgh1-1,和基因组多位点同时编辑突变株Δubx8ΔamdSΔcre1Δres1,Δubx8ΔamdSΔcre1Δgh1-1,Δubx8ΔamdSΔgh1-1Δres1,Δubx8ΔamdSΔcre1Δgh1-1Δres1和Δubx8ΔamdSΔcre1Δgh1-1Δres1Δalp1。
本发明中,通过通过构建CRISPR-Cas9介导的基因编辑系统在两种毁丝霉属菌株M.thermophile和M.heterothallica基因组编辑系统,可显著提高其编辑效率,单基因缺失的同源重组效率高达100%,还可以同时编辑多基因位点,其中双基因缺失的同源重组效率为61-69%,三基因的同源重组效率为30%,四基因的同源重组效率为21%。
本发明中,通过基因组多位点编辑获得的突变体菌株Δubx8ΔamdSΔcre1Δgh1-1Δalp1,Δubx8ΔamdSΔcre1Δgh1-1Δres1和Δubx8ΔamdSΔcre1Δgh1-1Δres1Δalp1,这些突变菌株能够纤维素为诱导物表达生产纤维素酶,提升木质纤维素降解能力和纤维素酶生产能力,在添加有机氮源蛋白胨的条件下,摇瓶发酵蛋白产量均超过0.80g/L,其对照野生型菌株蛋白产量仅为0.12g/L。
第三方面,本发明提供一种宿主细胞,包含有如第一方面所述的基因组编辑的载体或如第二方面所述的基因组编辑的系统。
优选地,所述宿主细胞为真菌细胞,优选为丝状真菌细胞,进一步优选为嗜热真菌细胞。
优选地,所述宿主细胞选自但不限于毁丝霉属、梭孢壳霉属、木霉、脉孢菌、青霉、镰刀霉、曲霉属或根霉属中的任意一种或至少两种的混合,优选为嗜热毁丝霉属和/或异梭毁丝霉。
第四方面,本发明提供一种基因组编辑的方法,包括如下步骤:利用CRISPR/Cas技术对第三方面所述的宿主细胞进行基因组编辑。
根据本发明,使用原生质体共转化的方法将第二方面所述的基因组编辑的系统导入到第三方面所述的宿主细胞中,在所述宿主细胞中的待编辑的基因组位点进行基因组编辑,利用筛选标记挑选转化子并获得具有稳定遗传性状的基因编辑突变株。
优选地,所述基因组编辑的系统导入的过程中的所述Cas9蛋白的表达框和所述sgRNA转录的表达框的分子摩尔比为1:(0.1-3),例如可以是1:0.1、1:0.2、1:0.3、1:0.4、1:0.5、1:0.6、1:0.7、1:0.8、1:0.9、1:1、1:1.2、1:1.3、1:1.5、1:1.6、1:1.9、1:2、1:2.1、1:2.2、1:2.3、1:2.5、1:2.6、1:2.8或1:3,优选为1:(0.5-2),进一步优选为1:1,以及上述数值之间的具体点值,限于篇幅及出于简明的考虑,本发明不再穷尽列举所述范围包括的具体点值。
优选地,所述基因组编辑的系统导入的过程中的所述Cas9蛋白的表达框、所述sgRNA转录的表达框和所述同源供体DNA序列的分子摩尔比为1:(0.1-3):(0.1-3),例如可以是1:0.1:0.1、1:0.2:0.1、1:0.3:0.2、1:0.4:0.2、1:0.5:0.5、1:0.6:0.5、1:0.7:0.6、1:0.8:0.8、1:0.9:0.9、1:0.9:0.8、1:1:0.1、1:1:0.3、1:1:0.5、1:1:0.8、1:1:1、1:1.2:1、1:1.3:1、1:1.5:1.2、1:1.6:1.5、1:1.9:1.8、1:2:1、1:2.1:2、1:2.2:1、1:2.3:2、1:2.5:2.3、1:2.6:2.5、1:2.8:2.8、1:2.8:3或1:3:3,优选为1:(0.5-2):(0.5-2),进一步优选为1:1:1,以及上述数值之间的具体点值,限于篇幅及出于简明的考虑,本发明不再穷尽列举所述范围包括的具体点值。
本发明中,具体的将基因编辑的载体和供体DNA序列共转化进入宿主细胞中的方法不作限定,本领域技术人员可以根据实际需要采用本领域公知的技术进行。
本发明通过所述方法对嗜热毁丝霉进行基因编辑,所述基因组编辑载体的转化子包括Cas9OE、Cas9-gfp和基因编辑突变菌株,所述Cas9OE和Cas9-gfp能够在嗜热毁丝霉中稳定表达Cas9,且对菌株生长形态、产孢能力、对蛋白的分泌水平和纤维素酶酶活力均无影响,结果与野生型一致;将基因编辑突变菌株能够以纤维素为碳源的显著提高蛋白分泌水平和纤维素酶活力和高产纤维素酶系菌株,以及生物质降解能力得到提升。
本发明是以丝状真菌为出发菌株,敲除其中碳分解代谢物阻遏效应转录因子cre1(MYCTH_2310085)、内质网压力响应的调控因子res1(MYCTH_2302052)、葡萄糖苷酶基因gh1-1(MYCTH_115968)和碱性蛋白酶alp1(MYCTH_2303011),或上述将任意4个基因部分碱基突变而得到,或是减弱上述4个基因的表达而得到所述宿主细胞,所述宿主细胞能够高产纤维酶素。
第五方面,本发明提供一种如第一方面所述的基因组编辑载体、如第二方面所述的基因组编辑的系统或如第四方面所述的基因组编辑的方法用于真菌细胞中基因功能的研究和/或基因工程改造育种。
优选地,所述真菌细胞为丝状真菌细胞,优选为嗜热真菌细胞,进一步优选为毁丝霉属、梭孢壳霉属、木霉、脉孢菌、青霉、镰刀霉、曲霉属或根霉属中的任意一种或至少两种的混合,最优选为优选为嗜热毁丝霉属和/或异梭毁丝霉。
与现有技术相比,本发明具有的有益效果:
(1)本发明提供一种高效快速的CRISPR-Cas9介导的基因组编辑载体和基因组编辑的系统,应用该系统能够显著提高毁丝霉菌株M.thermophile和M.heterothallica基因组编辑效率,可以实现毁丝霉基因组多位点的同时编辑,进而获得多基因突变体菌株,该系列突变菌株能够显著提升纤维素酶生产能力,能够用于高产纤维素酶的嗜热真菌基因工程的改造;
(2)本发明开发CRISPR-Cas9基因组编辑系统能够促进嗜热毁丝霉基因功能的研究,同时对嗜热工业纤维素酶生产菌株的基因组定向编辑和代谢工程改造有着重要意义。
附图说明
图1为Cas9表达载体p0380-bar-Ptef1-Cas9-TtprC和sgRNA表达载体U6p-sgRNA示意图;
图2为表达载体p0380-bar-Ptef1-Cas9-eGFP-TtprC转化嗜热毁丝霉细胞后Cas9定位示意图;
图3为转化子Cas9OE和野生菌株WT菌落生长(A),在2%微晶纤维素生长条件下发酵上清的蛋白分泌(B),发酵上清的SDS-PAGE电泳分析图(C),纤维素酶活力(D)-(F) 和菌丝干重图(G);
图4为靶基因amdS的编缉示意图(A)和测序结果(B);
图5为嗜热毁丝霉(A)和异梭毁丝霉(B)靶基因cre1突变菌株的PCR鉴定核酸电泳图;
图6为嗜热毁丝霉靶基因cre1、res1、gh1-1和alp1单基因编缉突变菌株的PCR鉴定核酸电泳图;
图7为嗜热毁丝霉靶基因cre1、res1和gh1-1双基因同时编缉突变菌株的PCR鉴定核酸电泳图;
图8为嗜热毁丝霉靶基因cre1、res1和gh1-1三基因同时编缉突变菌株的PCR鉴定核酸电泳图;
图9为嗜热毁丝霉靶基因cre1、res1、gh1-1和alp1四基因同时编缉突变菌株的PCR鉴定核酸电泳图;
图10为嗜热毁丝霉和异梭毁丝霉cre1基因编辑突变菌株ΔMtcre1和ΔMhcre1在微晶纤维素条件下发酵上清的蛋白分泌(A),发酵上清的SDS-PAGE电泳分析图(B),内切纤维素酶活力(C),木聚糖酶活力图(D)和外切纤维素酶活力图(E);
图11(A)为嗜热毁丝霉基因编辑突变菌株发酵上清的SDS-PAGE电泳分析图,图11(B)为嗜热毁丝霉基因编辑突变菌株在微晶纤维素条件下发酵上清的蛋白分泌,图11(C)为嗜热毁丝霉基因编辑突变菌株的内切纤维素酶活力;图11(D)为嗜热毁丝霉基因编辑突变菌株的木聚糖酶活力图,图(E)为嗜热毁丝霉基因编辑突变菌株的外切纤维素酶活力图。
具体实施方式
本发明人经过广泛而深入的研究,设计和开发了特异性识别和切割毁丝霉基因组指定位点序列的CRISPR/Cas9基因编辑系统,该系统能够显著提高两种毁丝霉属菌株包括嗜热毁丝霉M.thermophila和异梭毁丝霉M.heterothallica基因组编辑效率,利用本发明基因编辑系统可以对嗜热毁丝霉的基因组同时进行多位点编辑,获得多基因缺失的突变体工程菌株,突变体工程菌株能够显著提升纤维素酶生产能力,从而提供一种提高嗜热真菌产纤维素酶分泌能力的菌种改造方法。在此基础上,完成了本发明。
下述实施例中所用方法如无特别说明均为常规方法,具体步骤可参见:《Molecular Cloning:A Laboratory Manual》(Sambrook,J.,Russell,David W.,Molecular Cloning:A Laboratory Manual,3rd edition,2001,NY,Cold Spring Harbor)。
所出现的百分比浓度如无特别说明均为质量百分浓度。
实施例中描述到的各种生物材料的取得途径仅是提供一种实验获取的途径以达到具体公开的目的,不应成为对本发明生物材料来源的限制。事实上,所用到的生物材料的来源是广泛的,任何不违反法律和道德伦理能够获取的生物材料都可以按照实施例中的提示替换使用。
实施例中所采用的原始出发菌株嗜热毁丝霉ATCC 42464购自美国模式培养物集存库(American type culture collection),实施例中所采用的原始出发菌株异梭毁丝霉CBS 203.75均购买于Centraalbureau voor Schimmelcultures CBS Fungal Biodiversity Centre真菌生物多样性中心,为商业渠道获得。
“MYCTH_……”为嗜热毁丝霉的基因位点编号。
Cas9蛋白密码子偏好性优化和人工合成均由上海英潍捷基贸易有限公司Invitrogen完成。gRNA由上海英潍捷基贸易有限公司Invitrogen合成。
所用引物和核酸测序均由金唯智生物科技有限公司合成。
基因组编辑
如本文所用,“基因组编辑”是指对生物的基因组DNA进行删除、插入或者替换,从而达到对目的序列修改的目的。
靶标位点
如本文所用,术语“靶标位点”或“protospacer”是限定核酸的一部分的核酸序列,是指gRNA 5′端的20碱基的序列,这段序列与目的DNA序列相同,在存在足以结合的条件下,gRNA需要这段序列与目的DNA结合,Cas9与gRNA的复合体对目的DNA进行剪切。
非同源端连接(NHEJ)
如本文所用,“非同源端连接(NHEJ)”是指细胞内普遍存在的DNA双链断裂(DSB)后的一种修复方式,NHEJ可在整个细胞周期发生,因为修复不需要模板,只基于断裂末端的结构而容易产生错误,包括缺失、插入和点突变。
同源重组
如本文所用,“重组”是指两个多核苷酸之间交换遗传信息的过程。就本发明而言,“同源重组(HR)”是指在通过同源定向修复机制修复细胞内双链断裂期间所发生的此类交换的特殊形式。这一过程需要核苷酸序列同源,使用“供体”分子为模板来修复“靶标位点”分子(即发生双链断裂的分子),因为其导致遗传信息从供体转移到靶上。
供体DNA序列
如本文所用,“序列”是指任意长度的核苷酸序列,其可以是DNA或RNA;可以是线状、环状或分支状,而且可以是单链或者双链。术语“供体DNA序列”是指被插入基因组中的核苷酸序列。供体序列可以为任意长度,例如,优选长度在约500个与3,000个核苷酸之间(或它们之间的任意整数值)。
为更进一步阐述本发明所采取的技术手段及其效果,以下结合本发明的优选实施例来进一步说明本发明的技术方案,但本发明并非局限在实施例范围内。
实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件,或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可通过正规渠道商购获得的常规产品。
实施例1:构建CRISPR-Cas9介导的毁丝霉基因组编辑载体
(1)Cas9表达框载体的构建
以p0380-bar(Liu Q,Li J,Ying S,Wang J,Sun W,Tian C,Feng M.2015.Unveiling equal importance of two 14-3-3 proteins for morphogenesis,conidiation,stress tolerance and virulence of an insect pathogen.Environ Microbiol.17:1444–1462)为骨架构建表达载体。参照嗜热毁丝霉的基因组,对来自酿脓链球菌的Cas9蛋白进行密码子偏好性优化,同时在Cas9蛋白的N-端和C-端添加嗜热毁丝霉转录因子hacI(MYCTH_2310995)的核定位序列(PPRKRAKTEDE),其氨基酸序列和核苷酸序列分别为SEQ ID No.8和SEQ ID No.9所示。
将密码子优化的Cas9置于翻译延伸因子TEF1A(MYCTH_2298136)的启动子Ptef1下进行转录表达,Ptef1核苷酸序列如SEQ ID NO.7所示,同时选用构巢曲霉TtrpC为终止子,以带有草丁膦抗性基因bar为真菌转化筛选标记。载体构建所需的PCR引物序列如表1所示,PCR反应体系为:5×phusion HF buffer 10μL,10mM dNTPs 1μL,GLT-F 2.5μL,GLT-R 2.5μL,模板DNA 1μL,Phusion DNA聚合酶0.5μL,水32.5μL;PCR反应条件为:先98℃30s;然后98℃10s,65℃30s,72℃2.5min,34个循环;最后72℃10min,4℃10min。
如图1所示,采用Gibson Assembly技术体系对上述多个PCR片段进行快速组装到由限制性内切酶SpeI和EcoRI双酶切的质粒p0380-bar上,从而构建Cas9表达框质粒p0380-bar-Ptef1-Cas9-TtprC和带有绿色荧光蛋白eGFP融合蛋白Cas9-eGFP的质粒p0380-bar-Ptef1-Cas9-eGFP-TtprC,其序列分别为SEQ ID No.9和SEQ ID No.10所示。
(2)sgRNA表达框载体的构建
以Homo sapiens U6 small nuclear RNA序列为参照,在嗜热毁丝霉的基因组中进行生物信息的分析比对,发现了RNA polymerase III U6 snRNA基因,以嗜热毁丝霉RNA polymerase III U6 snRNA以上游464bp为启动子U6p转录表达sgRNA,U6p启动子核苷酸序列如序列表中SEQ ID NO.1所示,根据软件sgRNACas9 tool设计protospacer即靶标位点。采用融合PCR的方法将序列U6p启动子、protospacer及sgRNA连接在一起,具体方法为采用基因重叠延伸(SOE)方法,由Horton et al.1989发明(Horton RM,Hunt HD,Ho SN,Pullen JK,Pease LR.1989.Engineering hybrid genes without the useof restriction enzymes:gene splicing-by-overlap extension.Gene 77:61-68)。
载体构建所需的PCR引物序列如表1所示,PCR反应体系为:5×phusion HF buffer 10μL,10mM dNTPs 1μL,GLT-F 2.5μL,GLT-R 2.5μL,模板DNA 1μL,Phusion DNA聚合酶0.5μL,水32.5μL;PCR反应条件为:先98℃30s;然后98℃10s,65℃30s,72℃1min,34个循环;最后72℃10min,4℃10min。
如图1所示,通过SOE-PCR的扩增形成sgRNA表达质粒U6p-amdS-gRNA,U6p-cre1-gRNA,U6p-res1-gRNA,U6p-gh1-1-gRNA和U6p-alp1-gRNA,其序列分别为SEQ ID No.2,SEQ ID No.3,SEQ ID No.4,SEQ ID No.5和SEQ ID No.6所示。
(3)供体DNA序列的构建
所述的供体DNA序列(donor-cre1,donor-res1,donor-gh1-1和donor-alp1)片段由左右两条600bp同源片段与带有G418抗性基因neo构成,其所需的PCR引物序列如表1所示,PCR反应体系为:5×phusion GC buffer 10μL,10mM dNTPs 1μL,GLT-F 2.5μL,GLT-R 2.5μL,模板DNA 1μL,Phusion DNA聚合酶0.5μL,水32.5μL;PCR反应条件为:先98℃30s;然后98℃10s,65℃30s,72℃1min,34个循环;最后72℃10min,4℃10min。
左右两条600bp同源片段与带有G418抗性neo基因3个PCR片段通过Gibson Assembly的方法连接到由限制性内切酶SpeI和EcoRI双酶切的质粒pCAMBIA-0380(其NCBI编号为AF234290),其序列分别为SEQ ID No.12,SEQ ID No.13,SEQ ID No.14和SEQ ID No.15所示。
表1
实施例2:在嗜热毁丝霉中稳定表达Cas9
将带有Cas9表达框的质粒p0380-bar-Ptef1-Cas9-TtprC和带有绿色荧光蛋白融合蛋白的质粒p0380-bar-Ptef1-Cas9-eGFP-TtprC通过根瘤农杆菌介导的转化技术导入到嗜热毁丝霉中。
(1)嗜热毁丝霉菌株的培养
将嗜热毁丝霉ATCC 42464在MM斜面培养基]上45℃培养10天后待用。
MM斜面培养基:50×Vogel’s盐20mL,蔗糖20g,琼脂15g,定容体积到1L,高压灭菌。50×Vogel’s盐(1L):柠檬酸三钠(1/2H2O)150g,无水KH2PO4 250g,无水NH4NO3 100g,MgSO4·7H2O 10g,CaCl2·2H2O 5g,微量元素盐溶液5mL,生物素(0.1mg/mL)2.5mL,定容体积到1L。
(2)根癌农杆菌介导的嗜热毁丝霉转化
载体的农杆菌转化质粒p0380-bar-Ptef1-Cas9-TtprC和p0380-bar-Ptef1-Cas9-eGFP-TtprC通过化学转化法导入农杆菌AGL-1中。转化程序简述如下,首先将1μL质粒加入到农杆菌感受态细胞中,混匀,置于液氮中速冻5min后再于37℃热激5min,冰上处理2min后迅速转入装有1mL LB培养液(不加抗生素)的试管中,28℃下220r/min振荡培养2~3h。取100μL菌液涂布于LB(含50μg/mL羧苄霉素和50μg/mL卡那霉素)平板上,于28℃继续培养2~3天后,挑斑鉴定,阳性转化子保存备用。
根癌农杆菌介导的真菌转化将上述带有敲除载体的农杆菌划线于LB平板(含50μg/mL羧苄霉素和50μg/mL卡那霉素)上,28℃活化培养36h后,挑取单菌落于3mL LB培养液(羧苄霉素、卡那霉素含量同上)中,28℃下250r/min振荡培养24h。离心(10000r/min)2min收集菌体,用IM培养基(含10mM葡萄糖和400μM乙酰丁香酮)重悬菌体至OD值0.15,体积约为5~10mL(50mL三角瓶中)。相同条件下继续避光孵育6h至菌液OD600达到0.4左右,待用。制备嗜热毁丝霉ATCC 42464孢子悬液,从培养10天的MM平板上挑取适量孢子粉于1.5mL 0.02%吐温20中,涡旋震荡分散均匀后用脱脂棉过滤除去菌丝,滤液3000r/min离心1min收集孢子。去上清,用1mL 0.02%吐温20重悬孢子,血球计数板计数,将孢子悬液调到107个/mL。取孢子悬液和上述农杆菌菌液各100μL,充分混匀后,涂布于IMAS(含5mM葡萄糖和400μM乙酰丁香酮)平板上,25℃避光共孵育2天后,用3~5mL无菌水洗板。取200μL共孵育洗涤液涂布于M-100平板(200μg/ml草丁膦和300μg/ml噻孢霉素)上,45℃下培养3天,挑选转化子于继续培养7天后进行鉴定。
(3)嗜热毁丝霉转化子验证
I)基因组提取
采用酚氯仿法从上述转化过程中挑选的转化子提取基因组DNA,具体包括以下操作:
1)2.0mL的无菌的DNA提取管中加入200mg的锆珠及1mL的裂解液(lysis buffer,配方:0.2M Tris·HCl(pH 7.5),0.5M NaCl,10mM EDTA,1%SDS(w/v)),挑取平板中生长的嗜热毁丝霉菌丝于DNA提取管中;
2)将所有DNA提取管置于助磨器上,最大转速振荡30s,重复两次;
3)65℃水浴30分,在水浴过程中每个几分钟取出漩涡振荡;
4)水浴结束后取出,每管加入80μL pH 7.5的1M的Tris·HCl中和;
5)加入400μl的酚:氯仿(1:1),13000rpm离心5分钟;
6)取300μl上清液于新的1.5mL EP管中,加入600μL 95%的乙醇(DNA级);
7)冰上孵育一小时,随后4℃、13000rpm离心,可看到白色的DNA沉淀到EP管底部;
8)用75%的酒精(DNA级)400μL清洗,4℃13000rpm离心,轻轻取出上清液;
9)将EP管置于真空浓缩仪中,真空干燥酒精;
10)加入50μL ddH2O溶解DNA,用NanoDrop测DNA浓度,测完浓度后将提取的DNA 置于-20℃冰箱保存,以备下一步进行PCR验证。
II)PCR验证嗜热毁丝霉转化子
以提取的基因组DNA为模版,用引物Ptef1-SF及Cas9-SF对转化子进行基因PCR验证。PCR反应体系为:5×phusion GC buffer 4μL,10mM dNTPs 0.2μL,引物各1μL,基因组1μL,DMSO 0.6μL,Phusion DNA聚合酶0.1μL,水12.1μL;PCR反应条件为:先98℃30s;然后98℃10s,62℃30s,72℃1.5min,30个循环;最后72℃10min,4℃10min。
III)对PCR扩增产物进行1%琼脂糖凝胶电泳(110V电压,30分钟),在凝胶成像系统下看基因扩增条带,显示在上游引物Ptef1-SF和下游引物Cas9-SF引导下经PCR扩增获得了2857bp目的条带,该条带表明表达框Ptef1-Cas9-TtprC和Ptef1-Cas9-eGFP-TtprC经整合到了嗜热毁丝霉基因组中。
引物如下所示
Ptef1-SF(SEQ ID NO.:60):TCCCACTTAAAGGCCAGCGTGACAT;
Cas9-SR(SEQ ID NO.:61):TAGTAAGGGATGCGGAAGGTGAGAA。
(3)嗜热毁丝霉稳定表达Cas9的工程菌的生物学表型分析
将PCR验证正确的表达框Ptef1-Cas9-TtprC和Ptef1-Cas9-eGFP-TtprC整合到嗜热毁丝霉基因组中转化子命名为Cas9OE和Cas9-gfp。
a)Cas9-gfp在嗜热毁丝霉细胞中的定位
通过荧光显微镜观察,融合蛋白Cas9-gfp在嗜热毁丝霉细胞中的定位。首先将转化子Cas9-gfp以分子孢子终浓度2.5×105个/mL接种于MM液体培养基(配方:50×Vogel’s盐2mL,蔗糖2g,定容体积到100mL,高压灭菌)45℃培养2天,收集菌丝,用ddH2O洗涤2次后,用DAPI二氢氯化物(工作浓度为1μg/mL)进行染色15min后,用ddH2O洗涤2次后,进行荧光显微镜观察,结果如图2所示,Cas9-gfp定位在嗜热毁丝霉细胞核内,这说明Cas9将可能在嗜热毁丝霉细胞核内对基因组的DNA靶位点上进行双链断裂。
b)Cas9OE的生长和蛋白分泌水平
结果如图3A所示,Cas9OE和野生型菌株ATCC 42464(WT)在MM斜面培养基上45℃培养8天后观察其菌落的形态生长一致和产孢能力无差别。
Cas9OE和WT以分子孢子终浓度2.5×105个/mL分别在2%微晶纤维素培养基(配方:50×Vogel’s盐2mL,微晶纤维素2g,定容体积到100mL,高压灭菌)中45℃培养4d,样品离心取上清液,测定蛋白浓度,SDS-PAGE电泳分析和测定纤维素酶活。
上清蛋白浓度测定使用伯乐Bradford蛋白快速测试试剂盒检测上清中的蛋白浓度,结果如图2B示。Cas9OE分泌蛋白浓度与WT一致,无差异。
上清SDS-PAGE电泳检测吸取等体积上清液进行4-12%SDS-PAGE电泳检测,结果如图2C所示。发现Cas9OE分泌蛋白条带类型和浓度与WT一致。
c)纤维素酶活测定
(1)内切-1,4-β-葡聚糖酶活力的测定方法:将粗酶液用0.1M醋酸钠缓冲液稀释适宜的倍数,终体积为0.5mL,放入40℃水浴锅内预热,取出,加入0.5mL Megazyme AZO-CM-CELLULOSE底物溶液,混匀,40℃温育10min,用2.5mL沉淀溶液终止反应,室温静置10min,混匀,1000g离心10min,590nm波长下测OD。空白组使用灭活的酶液作对照。
(2)内切-1,4-β-木聚糖酶活力的测定方法:将粗酶液用0.1M醋酸钠缓冲液稀释适宜的倍数,终体积为0.5mL,放入40℃水浴锅内预热,取出,加入0.5mL Megazyme AZO-XYLAN底物溶液,混匀,40℃温育10min,用2.5mL沉淀溶液终止反应,室温静置10min,混匀,1000g离心10min,590nm波长下测OD。空白组使用灭活的酶液作对照。
(3)外切纤维素酶活(Cellobiohydrolase active)的测定方法:取50μL酶液,加入200μL pH4.8的0.05M的乙酸钠缓冲液,再加入250μL 1mg/mL p-NPC和1mg/ml D-glucono-1,5-σ-lactone底物溶液后,50℃反应10min,加入500μL 1M碳酸钠溶液终止反应,420nm波长下测OD。空白组使用灭活的酶液作对照。
(3)活性定义:1mL酶液于每min水解底物产生1μmol产物的酶量定义为1个酶活力单位。
上清纤维素酶酶活检测,根据蛋白浓度稀释上清进行外切纤维素酶酶活,内切纤维素酶酶活和木聚糖酶酶活测定,结果如图3D-F所示。微晶纤维素生长条件下,Cas9OE的纤维素酶酶活力与WT相比较,无差异。
对Cas9OE和WT在蔗糖和微晶纤维素培养下的菌丝干重的测定,结果如图3G所示,无差异。
综述上述,在嗜热毁丝霉中稳定表达Cas9对菌株生长形态和产孢能力无影响,对蛋白的分泌水平和纤维素酶酶活力均无影响,结果与野生型一致,该结果说明CRISPR-Cas9介导的毁丝霉属基因组编辑载体可以在高产纤维素酶菌株基因工程改造育种中的进行应用。
实施例3:CRISPR-Cas9系统编辑毁丝霉基因组的突变菌株的获得
(1)毁丝霉原生质体转化
1)菌丝体准备
将成熟的毁丝霉孢子,用0.05%吐温-80灭菌水收集,经擦镜纸过滤出去菌丝后,涂布于铺有玻璃纸的MM平板,45℃培养16h。
2)原生质体制备
将带有菌丝的玻璃纸放置于30mL裂解液(配方:0.15g裂解酶,无菌操作加入30mL溶液A,过滤除菌;溶液A:1.0361g磷酸二氢钾,21.864g山梨醇,溶于90mL去离子水,氢氧化钾调pH到5.6,定量至100mL,高温灭菌)中,30℃裂解2h,每隔20min轻轻摇动。而后经过玻璃纸过滤后,2000rpm 4℃离心10min,弃上清,加入4mL溶液B(0.735g氯化钙,18.22g山梨醇,1mL Tris-HCl 1M pH 7.5,溶于90mL去离子水,盐酸调pH到7.6,定量至100mL,高温灭菌),2000rpm 4℃离心10min;弃上清,按200μL/质粒加入一定体积溶液B。
3)原生质体转化
预冷的15mL离心管,依次加入50μL预冷PEG(12.5g PEG6000,0.368g氯化钙,500μL Tris HCl 1M pH 7.5),将转化的DNA片段加入200μL原生质体。放置冰上20min后加入2mL预冷PEG,室温5min,加入4mL溶液B,轻轻混匀。取3mL上述溶液加入12mL融化的含相应抗生素MM培养基中,置于平板中,35℃培养,3d后于挑取单个菌丝体于相应抗性平板生长。
(2)CRISPR-Cas9系统对毁丝霉amdS基因的编辑
将表达质粒p0380-bar-Ptef1-Cas9-TtprC和U6p-amdS-gRNA表达质粒以1:1的分子摩尔比例共转化进入嗜热毁丝霉M.thermophile菌株Δubx8::amdS(由本实验室构建)的原生质体细胞后,Cas9在gRNA介导下,通过protospacer与宿主细胞基因组上的目标基因amdS的DNA链配对来识别靶标位点进行切割,通过非同源端连接(NHEJ)对位点特异性DSB的不精确修复,通过在平板中加入5′fluoroacetamide(FAA)和草丁膦(PPT)筛选出转化子。
a)嗜热毁丝霉转化子验证
1)基因组提取方法与上述一致。
2)PCR和测序验证嗜热毁丝霉amdS突变转化子
以提取的基因组DNA为模版,用引物amdS-in-F和amdS-in-R(表2)对转化子进行基因PCR验证。PCR反应体系为:5×phusion GC buffer 4μL,10mM dNTPs 0.2μL,引物各1μL,基因组1μL,DMSO 0.6μL,Phusion DNA polymerase 0.1μL,水12.1μL。PCR反应条件为:先98℃30s;然后98℃10s,62℃30s,72℃1.5min,30个循环;最后72℃10min,4℃10min.
3)对PCR扩增产物进行1%琼脂糖凝胶电泳(110V电压,30分钟),在凝胶成像系统下看基因扩增条带,显示在上游引物amdS-in-F和下游引物amdS-in-R引导下经PCR扩增获得了~1300bp目的条带,并对目的片段进行测序验证,测序结果如图4所示,表明Cas9在gRNA介导下对protospacer的第三个核酸碱基进行了切割,并通过非同源端连接(NHEJ)对位点特异性DSB的不精确修复,得到基因组编辑突变株Δubx8ΔamdS。
(3)CRISPR-Cas9系统对嗜热毁丝霉和异梭毁丝霉cre1基因的编辑
将表达质粒p0380-bar-Ptef1-Cas9-TtprC和U6p-cre1-sgRNA表达质粒及其供体DNA donor-cre1以分子摩尔比1:1:1的比例分别共转化进入嗜热毁丝霉M.thermophile野生型菌株ATCC 42464和M.heterothallica野生型菌株CBS 203.75的原生质体细胞后,Cas9在gRNA介导下,通过protospacer与宿主细胞基因组上的目标基因的DNA链配对来识别靶标位点进行切割,随后供体DNA片段与靶标位点两侧序列发生同源重组,通过在平板中加入G418和PPT筛选转化子。
a)嗜热毁丝霉转化子验证
1)基因组提取方法与上述一致。
2)PCR验证嗜热毁丝霉cre1突变转化子
以提取的基因组DNA为模版,用引物cre1-out-F和cre1-in-R(表2)对转化子进行基因PCR验证。PCR反应体系为:5×phusion GC buffer 4μL,10mM dNTPs 0.2μL,引物各1μL,基因组1μL,DMSO 0.6μL,Phusion DNA polymerase 0.1μL,水12.1μL。PCR反应条件为:先98℃30s;然后98℃10s,62℃30s,72℃1.5min,30个循环;最后72℃10min,4℃10min.
3)对PCR扩增产物进行1%琼脂糖凝胶电泳(110V电压,30分钟),在凝胶成像系统下看基因扩增条带,显示在上游引物cre1-out-F和下游引物cre1-in-R引导下经PCR扩增获得了1900bp目的条带,野生型菌株目的条带为1000bp,结果如图5所示,表明供体DNA片段与靶标位点两侧序列发生同源重组,进而得到基因编辑突变株ΔMtcre1和ΔMhcre1,其同源重组效率高达100%。
(4)CRISPR-Cas9系统对嗜热毁丝霉多基因的同时编辑
将sgRNA表达质粒U6p-cre1-sgRNA,U6p-res1-sgRNA,U6p-gh1-1-sgRNA和U6p-alp1-sgRNA及其供体DNA donor-cre1,donor-res1,donor-gh1-1和donor-alp1以分子摩尔比1:1的比例共转化进入嗜热毁丝霉Δubx8ΔamdS的原生质体细胞后,Cas9在sgRNA介导下,通过protospacer与宿主细胞基因组上的目标基因的DNA链配对来识别靶标位点进行切割,随后供体DNA片段与靶标位点两侧序列发生同源重组,通过在平板中加入G418和PPT筛选转化子。
a)嗜热毁丝霉转化子验证
1)基因组提取方法与上述一致。
2)PCR验证嗜热毁丝霉cre1、res1、gh1-1和alp1突变转化子
以提取的基因组DNA为模版,用引物cre1-out-F和cre1-in-R,res1-out-F和res-in-R,gh1-1-out-F和gh1-1-in-R,alp1-out-F和alp1-in-R(表2)分别对转化子进行基因PCR验证。PCR反应体系为:5×phusion GC buffer 4μL,10mM dNTPs 0.2μL,引物各1μL,基因组1μL,DMSO 0.6μL,Phusion DNA polymerase 0.1μL,水12.1μL。PCR反应条件为:先98℃30s;然后98℃10s,62℃30s,72℃1.5min,30个循环;最后72℃10min,4℃10min.
3)对PCR扩增产物进行1%琼脂糖凝胶电泳(110V电压,30分钟),在凝胶成像系统下看基因扩增条带,显示在上游引物cre1-out-F和下游引物cre1-in-R,上游引物res1-out-F和下游引物res-in-R,上游引物gh1-1-out-F和下游引物gh1-1-in-R,上游引物alp1-out-F和下游引物alp1-in-R引导下经PCR扩增获得了1900bp目的条带,野生型菌株目的条带为1000bp,结果如图6-9所示,表明供体DNA片段与靶标位点两侧序列发生同源重组,进而 得到基因编辑突变株,包括单基因位点编辑突变株Δubx8ΔamdSΔcre1,Δubx8ΔamdSΔres1,Δubx8ΔamdSΔalp1和Δubx8ΔamdSΔgh1-1,其同源重组效率高达100%;基因组多位点同时编辑突变株Δubx8ΔamdSΔcre1Δres1,Δubx8ΔamdSΔcre1Δgh1-1,Δubx8ΔamdSΔgh1-1Δres1,Δubx8ΔamdSΔcre1Δgh1-1Δres1,Δubx8ΔamdSΔcre1Δgh1-1Δalp1和Δubx8ΔamdSΔcre1Δgh1-1Δres1Δalp1,其中双基因的同源重组效率为61-69%,三基因的同源重组效率为30%,四基因的同源重组效率为22%。
表2
实施例4:突变菌株的生物学表型评价
(1)嗜热毁丝霉和异梭毁丝霉cre1突变菌株在简单微晶纤维素培养基中纤维素产酶功能验证实验
将嗜热毁丝霉M.thermophile野生型菌株ATCC 42464(MtWT)、异梭毁丝霉M.heterothallica野生型菌株CBS 203.75(MhWT)、ΔMtcre1和ΔMhcre1分别在2%(2g/100mL)微晶纤维素培养基(配方:50×Vogel’s盐2mL,微晶纤维素2g,定容体积到100mL,高压灭菌)上45℃培养4d,样品离心取上清液,测定蛋白浓度,SDS-PAGE电泳分析和测定纤维素酶活。
a)上清蛋白浓度测定
使用伯乐Bradford蛋白快速测试试剂盒检测上清中的蛋白浓度,结果如图10A所示。与野生型相比,ΔMtcre1和ΔMhcre1蛋白产量都有非常显著的提高。
b)上清SDS-PAGE电泳检测
根据蛋白浓度吸取等体积上清液进行4-12%SDS-PAGE电泳检测,结果如图10B所示。ΔMtcre1和ΔMhcre1相比野生型菌株,纤维素酶对应条带都显著加深。
c)上清纤维素酶酶活检测
酶活测定方法同实施例2。
根据蛋白浓度稀释上清进行外外切纤维素酶酶活,内切纤维素酶酶活和木聚糖酶酶活测定。结果如图10(C)-(E)所示。微晶纤维素生长条件下,ΔMtcre1和ΔMhcre1相比野生型菌株,纤维素酶的酶活都有非常显著的提高。
(2)多基因突变菌株在添加有机氮源的微晶纤维素培养基中纤维素产酶功能验证实验
将嗜热毁丝霉M.thermophile野生型菌株ATCC 42464(WT)、Δubx8ΔamdSΔcre1,Δubx8ΔamdSΔres1,Δubx8ΔamdSΔalp1,Δubx8ΔamdSΔgh1-1,Δubx8ΔamdSΔcre1Δres1,Δubx8ΔamdSΔcre1Δgh1-1,Δubx8ΔamdSΔgh1-1Δres1,Δubx8ΔamdSΔcre1Δgh1-1Δres1,Δubx8ΔamdSΔcre1Δgh1-1Δalp1和Δubx8ΔamdSΔcre1Δgh1-1Δres1Δalp1分别在2%(2g/100mL)微晶纤维素培养基(配方:50×Vogel’s盐2mL,微晶纤维素2g,蛋白胨提取物0.5g,定容体积到100mL,高压灭菌)上45℃培养6d,样品离心取上清液,测定蛋白浓度,SDS-PAGE电泳分析和测定纤维素酶活。
a)上清蛋白浓度测定
使用伯乐Bradford蛋白快速测试试剂盒检测上清中的蛋白浓度,结果如图11(A)所示。与野生型相比,所有突变菌株的蛋白产量都有非常显著的提高,特别是五基因突变菌株Δubx8ΔamdSΔcre1Δgh1-1Δres1和Δubx8ΔamdSΔcre1Δgh1-1Δalp1和六基因突变菌株Δubx8ΔamdSΔcre1Δgh1-1Δres1Δalp1,其蛋白产量比野生型高达6.4-6.7倍。
b)上清SDS-PAGE电泳检测
根据蛋白浓度吸取等体积上清液进行4-12%SDS-PAGE电泳检测,结果如图11(B)所示。与野生型菌株相比,所有突变菌株的纤维素酶对应条带都显著加深,尤其是五基因突变菌株Δubx8ΔamdSΔcre1Δgh1-1Δres1和Δubx8ΔamdSΔcre1Δgh1-1Δalp1和六基因突变菌株Δubx8ΔamdSΔcre1Δgh1-1Δres1Δalp1,七纤维素酶对应条带浓度的加深都极为显著。
c)上清纤维素酶酶活检测
根据蛋白浓度稀释上清进行外切纤维素酶酶活,内切纤维素酶酶活和木聚糖酶酶活测定(酶活测定方法同实施例2)。结果如图11(C)-(E)所示。微晶纤维素生长条件下,同野生型菌株对比,所有突变菌株的纤维素酶的酶活力都表现出极为显著的提高,特别是五基因突变菌株Δubx8ΔamdSΔcre1Δgh1-1Δres1和Δubx8ΔamdSΔcre1Δgh1-1Δalp1和六基因突变菌株Δubx8ΔamdSΔcre1Δgh1-1Δres1Δalp1,其内切纤维素酶酶活力比野生型提高6-7倍,外切纤维素酶酶活比野生型提高8-10倍,木聚糖酶酶活力比野生型提高15-19倍。
申请人声明,本发明通过上述实施例来说明本发明的详细方法,但本发明并不局限于上述详细方法,即不意味着本发明必须依赖上述详细方法才能实施。所属技术领域的技术人员应该明了,对本发明的任何改进,对本发明产品各原料的等效替换及辅助成分的添加、具体方式的选择等,均落在本发明的保护范围和公开范围之内。
SEQUENCE LISTING
<110> 中国科学院天津工业生物技术研究所
<120> 一种基因组编辑载体、其组成的基因组编辑系统及应用
<130> 2016
<160> 71
<170> PatentIn version 3.3
<210> 1
<211> 464
<212> DNA
<213> 人工合成序列
<400> 1
aggatcggtg gagtgaagtt cggaatcgag gttcggcgat gggtcgtaag catggcgact 60
tcgaacttac ttgcactggc aagcgttgcc agaacggcga gaaaaagaag ggtaagcgat 120
attcgcgtca tgatggactg ttccttttgg aacagtagtt gttgtgggaa gactatgtca 180
cacttgccca cctgcaaggc cagggtcgtg gtcgaacgag accagcctcg gcgctgctgg 240
gagctcaaga tgggcacgtt tgattcgtta gacgtcaaca aggctggagt tcctagtgac 300
agccaaaggc acagccacat taagtggcgc tttatctgtc cactaaggtt caattgtggc 360
tttgagccgc gcagtgtgca gtcgtgcatt ggccacctag ctagcagtat ttaagatcct 420
cttctctccc gagatcttcc tcctcttctt ttctttcttt cctc 464
<210> 2
<211> 567
<212> DNA
<213> 人工合成序列
<400> 2
aggatcggtg gagtgaagtt cggaatcgag gttcggcgat gggtcgtaag catggcgact 60
tcgaacttac ttgcactggc aagcgttgcc agaacggcga gaaaaagaag ggtaagcgat 120
attcgcgtca tgatggactg ttccttttgg aacagtagtt gttgtgggaa gactatgtca 180
cacttgccca cctgcaaggc cagggtcgtg gtcgaacgag accagcctcg gcgctgctgg 240
gagctcaaga tgggcacgtt tgattcgtta gacgtcaaca aggctggagt tcctagtgac 300
agccaaaggc acagccacat taagtggcgc tttatctgtc cactaaggtt caattgtggc 360
tttgagccgc gcagtgtgca gtcgtgcatt ggccacctag ctagcagtat ttaagatcct 420
cttctctccc gagatcttcc tcctcttctt ttctttcttt cctcggcgaa cagcatggag 480
ggtcgtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 540
aagtggcacc gagtcggtgc ttttttt 567
<210> 3
<211> 567
<212> DNA
<213> 人工合成序列
<400> 3
aggatcggtg gagtgaagtt cggaatcgag gttcggcgat gggtcgtaag catggcgact 60
tcgaacttac ttgcactggc aagcgttgcc agaacggcga gaaaaagaag ggtaagcgat 120
attcgcgtca tgatggactg ttccttttgg aacagtagtt gttgtgggaa gactatgtca 180
cacttgccca cctgcaaggc cagggtcgtg gtcgaacgag accagcctcg gcgctgctgg 240
gagctcaaga tgggcacgtt tgattcgtta gacgtcaaca aggctggagt tcctagtgac 300
agccaaaggc acagccacat taagtggcgc tttatctgtc cactaaggtt caattgtggc 360
tttgagccgc gcagtgtgca gtcgtgcatt ggccacctag ctagcagtat ttaagatcct 420
cttctctccc gagatcttcc tcctcttctt ttctttcttt cctcgcaacg cgcaaagtct 480
gcaggtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 540
aagtggcacc gagtcggtgc ttttttt 567
<210> 4
<211> 567
<212> DNA
<213> 人工合成序列
<400> 4
aggatcggtg gagtgaagtt cggaatcgag gttcggcgat gggtcgtaag catggcgact 60
tcgaacttac ttgcactggc aagcgttgcc agaacggcga gaaaaagaag ggtaagcgat 120
attcgcgtca tgatggactg ttccttttgg aacagtagtt gttgtgggaa gactatgtca 180
cacttgccca cctgcaaggc cagggtcgtg gtcgaacgag accagcctcg gcgctgctgg 240
gagctcaaga tgggcacgtt tgattcgtta gacgtcaaca aggctggagt tcctagtgac 300
agccaaaggc acagccacat taagtggcgc tttatctgtc cactaaggtt caattgtggc 360
tttgagccgc gcagtgtgca gtcgtgcatt ggccacctag ctagcagtat ttaagatcct 420
cttctctccc gagatcttcc tcctcttctt ttctttcttt cctcgcccta tgagccctcg 480
taccgtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 540
aagtggcacc gagtcggtgc ttttttt 567
<210> 5
<211> 567
<212> DNA
<213> 人工合成序列
<400> 5
aggatcggtg gagtgaagtt cggaatcgag gttcggcgat gggtcgtaag catggcgact 60
tcgaacttac ttgcactggc aagcgttgcc agaacggcga gaaaaagaag ggtaagcgat 120
attcgcgtca tgatggactg ttccttttgg aacagtagtt gttgtgggaa gactatgtca 180
cacttgccca cctgcaaggc cagggtcgtg gtcgaacgag accagcctcg gcgctgctgg 240
gagctcaaga tgggcacgtt tgattcgtta gacgtcaaca aggctggagt tcctagtgac 300
agccaaaggc acagccacat taagtggcgc tttatctgtc cactaaggtt caattgtggc 360
tttgagccgc gcagtgtgca gtcgtgcatt ggccacctag ctagcagtat ttaagatcct 420
cttctctccc gagatcttcc tcctcttctt ttctttcttt cctcgacaca ttctgcgcca 480
tcccgtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 540
aagtggcacc gagtcggtgc ttttttt 567
<210> 6
<211> 567
<212> DNA
<213> 人工合成序列
<400> 6
aggatcggtg gagtgaagtt cggaatcgag gttcggcgat gggtcgtaag catggcgact 60
tcgaacttac ttgcactggc aagcgttgcc agaacggcga gaaaaagaag ggtaagcgat 120
attcgcgtca tgatggactg ttccttttgg aacagtagtt gttgtgggaa gactatgtca 180
cacttgccca cctgcaaggc cagggtcgtg gtcgaacgag accagcctcg gcgctgctgg 240
gagctcaaga tgggcacgtt tgattcgtta gacgtcaaca aggctggagt tcctagtgac 300
agccaaaggc acagccacat taagtggcgc tttatctgtc cactaaggtt caattgtggc 360
tttgagccgc gcagtgtgca gtcgtgcatt ggccacctag ctagcagtat ttaagatcct 420
cttctctccc gagatcttcc tcctcttctt ttctttcttt cctcgtctac cgcggcaagt 480
tcaggtttta gagctagaaa tagcaagtta aaataaggct agtccgttat caacttgaaa 540
aagtggcacc gagtcggtgc ttttttt 567
<210> 7
<211> 1200
<212> DNA
<213> 人工合成序列
<400> 7
tcctccgagg ttcgacatca gggttcgtca tagggagtga aacacccgcc atgattccgt 60
agccgcgcgc gaagatacga agcagatatt tcacggacat ggcggagata cttgtttccc 120
gtactaaggt agtcatgtcg gagacatctg aacgacagag ctggccaaga gaaccgacca 180
gttgccccag gacgatctag acaaaaaaaa agagagatga gtgggccact tttgccacaa 240
catcgacggc cctgcgaccg cccccaggca aacaaacaaa ccgccgaaca ataatacttt 300
tgtcatttta ggaggagcgt tgtatggata aaaacaacat ctcgttgctg cagaatgtgg 360
acttcaaact tgcagaaaat gggaggcgga tttgcatgat cggagggtag ttgactcacg 420
ccgcaggctg caaatccgtc ctccattatt ccatgaacaa cttcgtaagg ttgggctgag 480
cgccaatgcc taacggaccg ggggccacag cgcaacgtcc cacttaaagg ccagcgtgac 540
atgccagttc cataccaagt agtggcacca gaggcggcca atgctcagta agggcaggga 600
gggaggctca aacgattggc aaaaagaggg gcttgccagt tcagttccct gtgcgagcgc 660
gagaggggca gtttcaaatc tggaggggtg tgttgcgctg gtctgaagag aaagagaaga 720
ctgtacttaa taattgttca aagagtccat catcgcgttg cggactcctc tagctgtatt 780
tagagcccta tcattacttg tcgggtgcga atcaaaatac cgggatgcag ccctctggcg 840
atttgcatgc ggttgtggag gaagtgaagc ctgaatcgcg gggctgggcg gcaaagcacg 900
acgtgaaatt cctggcgaaa ttcgagggct tgccccaccg tggttgaagt ttttgtgctg 960
cgtaacccca ccaacccgcc ttgcccctcc cgcctgccca taaaaacttc gacccctcct 1020
caaatcttct tcgattcttc ctcttcactt ccttcgtcgg catacctgat tcaagcaatc 1080
acctgccact ttcaagtgcg tataccatca tcgatacact ggttcttgac aagtacatcg 1140
tctctaactt tcctttttgc agttttcatt aagcgcaagt cgccagtttc gttcttcaga 1200
<210> 8
<211> 1413
<212> PRT
<213> 人工合成序列
<400> 8
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Pro Pro Arg Lys Arg Ala Lys Thr Glu
20 25 30
Asp Glu Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn
35 40 45
Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys
50 55 60
Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn
65 70 75 80
Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr
85 90 95
Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg
100 105 110
Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp
115 120 125
Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp
130 135 140
Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val
145 150 155 160
Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu
165 170 175
Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu
180 185 190
Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu
195 200 205
Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln
210 215 220
Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val
225 230 235 240
Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu
245 250 255
Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe
260 265 270
Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser
275 280 285
Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr
290 295 300
Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr
305 310 315 320
Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu
325 330 335
Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser
340 345 350
Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu
355 360 365
Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile
370 375 380
Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly
385 390 395 400
Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys
405 410 415
Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu
420 425 430
Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile
435 440 445
His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr
450 455 460
Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe
465 470 475 480
Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe
485 490 495
Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe
500 505 510
Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg
515 520 525
Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys
530 535 540
His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys
545 550 555 560
Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly
565 570 575
Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys
580 585 590
Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys
595 600 605
Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser
610 615 620
Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe
625 630 635 640
Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr
645 650 655
Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr
660 665 670
Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg
675 680 685
Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile
690 695 700
Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp
705 710 715 720
Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu
725 730 735
Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp
740 745 750
Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys
755 760 765
Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val
770 775 780
Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu
785 790 795 800
Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys
805 810 815
Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu
820 825 830
His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr
835 840 845
Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile
850 855 860
Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe
865 870 875 880
Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys
885 890 895
Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys
900 905 910
Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln
915 920 925
Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu
930 935 940
Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln
945 950 955 960
Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys
965 970 975
Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu
980 985 990
Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
995 1000 1005
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu
1010 1015 1020
Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu
1025 1030 1035
Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg
1040 1045 1050
Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala
1055 1060 1065
Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu
1070 1075 1080
Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu
1085 1090 1095
Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp
1100 1105 1110
Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile
1115 1120 1125
Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser
1130 1135 1140
Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys
1145 1150 1155
Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val
1160 1165 1170
Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser
1175 1180 1185
Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met
1190 1195 1200
Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1205 1210 1215
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro
1220 1225 1230
Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu
1235 1240 1245
Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro
1250 1255 1260
Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys
1265 1270 1275
Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val
1280 1285 1290
Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser
1295 1300 1305
Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys
1310 1315 1320
Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu
1325 1330 1335
Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly
1340 1345 1350
Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys
1355 1360 1365
Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His
1370 1375 1380
Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln
1385 1390 1395
Leu Gly Gly Asp Pro Pro Arg Lys Arg Ala Lys Thr Glu Asp Glu
1400 1405 1410
<210> 9
<211> 4245
<212> DNA
<213> 人工合成序列
<400> 9
atggactaca aggaccatga tggcgattac aaggaccacg acatcgatta taaggatgat 60
gatgacaagc ctccgaggaa acgtgccaaa acagaagatg agatggataa gaagtactcc 120
atcggcctcg acatcggcac caactccgtc ggctgggccg tcatcaccga tgagtacaag 180
gtcccttcca agaagttcaa ggtcctcggc aacaccgatc gccattccat caagaagaac 240
ctgatcggcg ccctcctgtt cgattccggc gaaaccgccg aggccacccg ccttaaacgc 300
accgcccgtc gccgctacac ccgccgcaag aaccgcatct gctacctcca agaaatcttc 360
tccaacgaga tggccaaggt cgatgatagc ttcttccacc gcctcgaaga gtccttcctg 420
gtcgaagagg ataagaagca cgagcgccat cctatcttcg gcaacatcgt cgatgaggtc 480
gcctaccatg agaagtaccc taccatctac catctccgca agaagctcgt cgattccacc 540
gataaggccg atctccgcct catctacctc gccctcgccc atatgatcaa gttccgcggc 600
catttcctca tcgagggcga tctcaaccct gataactccg atgtcgataa gctgttcatc 660
cagctcgtcc agacctacaa ccagctgttc gaggaaaacc ctatcaacgc ctccggcgtc 720
gatgccaagg ccatcctctc cgctcgcctc tccaagtctc gccgccttga gaaccttatc 780
gcccagctcc ctggcgagaa gaagaacggc ctcttcggca acctgatcgc cctctccctc 840
ggcctcaccc ctaacttcaa gtccaacttc gatctcgccg aggatgccaa gctccagctc 900
tccaaggata cctacgatga tgatctcgat aacctcctcg cccagatcgg cgatcagtac 960
gccgatctgt tcctcgccgc caagaacctc tccgatgcca tcctcctctc cgacatcctc 1020
cgcgtcaaca ccgagatcac caaggcccct ctgtccgcct ccatgatcaa gcgctacgat 1080
gagcatcatc aggacctcac cctgctcaag gccctcgtcc gccagcagct ccctgagaag 1140
tacaaagaga ttttcttcga tcagtccaag aacggctacg ccggctacat cgatggcggc 1200
gcttcccaag aagagttcta caagttcatc aagcctatcc ttgagaagat ggatggcacc 1260
gaggaactcc tcgtcaagct caaccgcgag gacctcctcc gcaagcagcg caccttcgat 1320
aacggctcca tccctcatca aatccatctc ggcgagctgc atgccatctt gcgccgccaa 1380
gaggatttct acccattcct caaggataac cgcgagaaga tcgaaaagat tctcaccttc 1440
cgcatccctt actacgtcgg ccctctcgct cgcggcaact cccgcttcgc ctggatgacc 1500
cgcaagtccg aggaaaccat caccccttgg aacttcgagg aagtcgtcga taagggcgcc 1560
tccgcccagt ccttcatcga gcgcatgacc aacttcgata agaacctccc taacgagaag 1620
gtcctcccta agcactccct gctctacgag tacttcaccg tctacaacga gctgaccaag 1680
gtcaagtacg tcaccgaggg tatgcgcaag cctgccttcc tgtccggcga gcagaagaag 1740
gccatcgtcg atctgctgtt caagaccaac cgcaaggtca ccgtcaagca gctcaaagag 1800
gattacttca agaaaatcga gtgcttcgat tccgtcgaga tcagcggcgt cgaggaccgc 1860
ttcaacgcct ccctcggaac ctaccatgat ctcctcaaga ttatcaagga taaggatttc 1920
ctcgacaacg aggaaaacga ggacatcctt gaggacatcg tcctcaccct caccctcttc 1980
gaggaccgcg aaatgatcga ggaacgcctc aagacctacg cccatctctt cgatgataag 2040
gtcatgaagc agctcaagcg ccgtcgctac accggctggg gtcgcctctc ccgcaagctc 2100
atcaacggca tccgcgataa gcagtccggc aagactatcc tcgatttcct caagtccgat 2160
ggcttcgcca accgcaactt catgcagctc atccatgatg attccctcac cttcaaagag 2220
gacatccaga aggcccaggt cagcggccag ggcgattccc tccatgagca tatcgccaac 2280
ctcgccggct cccctgccat caagaagggc atcctccaga ccgtcaaggt cgtcgatgag 2340
ctggtcaagg tcatgggccg ccataagcct gagaacatcg tcatcgagat ggcccgcgag 2400
aaccagacca cccagaaggg ccagaagaac tcccgcgagc gcatgaagcg catcgaggaa 2460
ggcatcaaag agctgggcag ccaaatcctc aaagagcatc ctgtcgagaa cacccagctc 2520
cagaacgaga agctctacct ctactacctc cagaacggcc gcgatatgta cgtcgatcaa 2580
gagctggaca tcaaccgcct ctccgattac gatgtcgatc atatcgtccc tcagtccttc 2640
ctgaaggatg attccatcga taacaaggtc ctcacccgct ccgataagaa ccgcggcaag 2700
tccgataacg tcccttccga agaggtcgtc aagaagatga agaactactg gcgccagctc 2760
ctcaacgcca agctcatcac ccagcgcaag ttcgataacc tcaccaaggc cgagcgcggt 2820
ggcctctccg agctggataa ggccggcttc atcaagcgcc agctcgtcga aacccgccag 2880
atcaccaagc acgtcgccca aatcctcgat tcccgcatga acaccaagta cgatgagaac 2940
gataagctca tccgcgaagt caaggtcatc accctcaagt ccaagctcgt cagcgatttc 3000
cgcaaggatt tccagttcta caaggtccgc gagatcaaca actaccatca tgcccatgat 3060
gcctacctca acgccgtcgt cggcaccgcc ctcatcaaga agtaccccaa gctcgaatcc 3120
gagttcgtct acggtgatta caaggtctac gatgtccgca agatgatcgc caagtccgag 3180
caagagatcg gcaaggctac cgccaagtac ttcttctact ccaacatcat gaatttcttc 3240
aagaccgaaa tcaccctcgc caacggcgaa atccgcaagc gccctctcat cgagactaac 3300
ggcgagactg gcgagatcgt ctgggataag ggccgcgatt tcgccaccgt ccgcaaggtc 3360
ctctccatgc ctcaggtcaa catcgtcaag aaaaccgagg tccagaccgg cggcttctcc 3420
aaagagtcca tcctccccaa gcgcaactcc gataagctga tcgcccgcaa gaaggattgg 3480
gaccctaaga agtacggcgg cttcgattcc cctaccgtcg cctactccgt cctcgtcgtc 3540
gccaaggtcg agaagggcaa gtccaagaag ctcaagtccg tcaaagagct gctcggcatc 3600
actattatgg aacgctccag cttcgagaag aaccctatcg atttccttga ggccaagggc 3660
tacaaagagg tcaagaagga cctcatcatc aagctcccca agtactccct gttcgagctt 3720
gagaacggcc gcaagcgcat gctcgcctcc gccggtgagc ttcagaaggg caacgagctg 3780
gccctgcctt ccaagtacgt caacttcctc tacctcgcct cccattacga gaagctcaag 3840
ggctcccctg aggataacga gcagaagcag ctgttcgtcg agcagcataa gcactacctc 3900
gatgagatca tcgagcagat cagcgagttc tccaagcgcg tcatcctcgc cgatgccaac 3960
ctcgataagg tcctgtccgc ctacaacaag caccgcgata agcctatccg cgagcaggcc 4020
gagaacatca tccatctctt caccctcacc aacctcggtg cccctgccgc cttcaagtac 4080
ttcgatacca ccatcgatcg caagcgctac acctccacca aagaggtcct ggacgccacc 4140
ctcatccatc agtccatcac cggcctctac gaaacccgca tcgatctctc ccagctcggc 4200
ggcgaccctc cgaggaaacg tgccaaaaca gaagatgagt gatga 4245
<210> 10
<211> 6153
<212> DNA
<213> 人工合成序列
<400> 10
tcctccgagg ttcgacatca gggttcgtca tagggagtga aacacccgcc atgattccgt 60
agccgcgcgc gaagatacga agcagatatt tcacggacat ggcggagata cttgtttccc 120
gtactaaggt agtcatgtcg gagacatctg aacgacagag ctggccaaga gaaccgacca 180
gttgccccag gacgatctag acaaaaaaaa agagagatga gtgggccact tttgccacaa 240
catcgacggc cctgcgaccg cccccaggca aacaaacaaa ccgccgaaca ataatacttt 300
tgtcatttta ggaggagcgt tgtatggata aaaacaacat ctcgttgctg cagaatgtgg 360
acttcaaact tgcagaaaat gggaggcgga tttgcatgat cggagggtag ttgactcacg 420
ccgcaggctg caaatccgtc ctccattatt ccatgaacaa cttcgtaagg ttgggctgag 480
cgccaatgcc taacggaccg ggggccacag cgcaacgtcc cacttaaagg ccagcgtgac 540
atgccagttc cataccaagt agtggcacca gaggcggcca atgctcagta agggcaggga 600
gggaggctca aacgattggc aaaaagaggg gcttgccagt tcagttccct gtgcgagcgc 660
gagaggggca gtttcaaatc tggaggggtg tgttgcgctg gtctgaagag aaagagaaga 720
ctgtacttaa taattgttca aagagtccat catcgcgttg cggactcctc tagctgtatt 780
tagagcccta tcattacttg tcgggtgcga atcaaaatac cgggatgcag ccctctggcg 840
atttgcatgc ggttgtggag gaagtgaagc ctgaatcgcg gggctgggcg gcaaagcacg 900
acgtgaaatt cctggcgaaa ttcgagggct tgccccaccg tggttgaagt ttttgtgctg 960
cgtaacccca ccaacccgcc ttgcccctcc cgcctgccca taaaaacttc gacccctcct 1020
caaatcttct tcgattcttc ctcttcactt ccttcgtcgg catacctgat tcaagcaatc 1080
acctgccact ttcaagtgcg tataccatca tcgatacact ggttcttgac aagtacatcg 1140
tctctaactt tcctttttgc agttttcatt aagcgcaagt cgccagtttc gttcttcaga 1200
atggactaca aggaccatga tggcgattac aaggaccacg acatcgatta taaggatgat 1260
gatgacaagc ctccgaggaa acgtgccaaa acagaagatg agatggataa gaagtactcc 1320
atcggcctcg acatcggcac caactccgtc ggctgggccg tcatcaccga tgagtacaag 1380
gtcccttcca agaagttcaa ggtcctcggc aacaccgatc gccattccat caagaagaac 1440
ctgatcggcg ccctcctgtt cgattccggc gaaaccgccg aggccacccg ccttaaacgc 1500
accgcccgtc gccgctacac ccgccgcaag aaccgcatct gctacctcca agaaatcttc 1560
tccaacgaga tggccaaggt cgatgatagc ttcttccacc gcctcgaaga gtccttcctg 1620
gtcgaagagg ataagaagca cgagcgccat cctatcttcg gcaacatcgt cgatgaggtc 1680
gcctaccatg agaagtaccc taccatctac catctccgca agaagctcgt cgattccacc 1740
gataaggccg atctccgcct catctacctc gccctcgccc atatgatcaa gttccgcggc 1800
catttcctca tcgagggcga tctcaaccct gataactccg atgtcgataa gctgttcatc 1860
cagctcgtcc agacctacaa ccagctgttc gaggaaaacc ctatcaacgc ctccggcgtc 1920
gatgccaagg ccatcctctc cgctcgcctc tccaagtctc gccgccttga gaaccttatc 1980
gcccagctcc ctggcgagaa gaagaacggc ctcttcggca acctgatcgc cctctccctc 2040
ggcctcaccc ctaacttcaa gtccaacttc gatctcgccg aggatgccaa gctccagctc 2100
tccaaggata cctacgatga tgatctcgat aacctcctcg cccagatcgg cgatcagtac 2160
gccgatctgt tcctcgccgc caagaacctc tccgatgcca tcctcctctc cgacatcctc 2220
cgcgtcaaca ccgagatcac caaggcccct ctgtccgcct ccatgatcaa gcgctacgat 2280
gagcatcatc aggacctcac cctgctcaag gccctcgtcc gccagcagct ccctgagaag 2340
tacaaagaga ttttcttcga tcagtccaag aacggctacg ccggctacat cgatggcggc 2400
gcttcccaag aagagttcta caagttcatc aagcctatcc ttgagaagat ggatggcacc 2460
gaggaactcc tcgtcaagct caaccgcgag gacctcctcc gcaagcagcg caccttcgat 2520
aacggctcca tccctcatca aatccatctc ggcgagctgc atgccatctt gcgccgccaa 2580
gaggatttct acccattcct caaggataac cgcgagaaga tcgaaaagat tctcaccttc 2640
cgcatccctt actacgtcgg ccctctcgct cgcggcaact cccgcttcgc ctggatgacc 2700
cgcaagtccg aggaaaccat caccccttgg aacttcgagg aagtcgtcga taagggcgcc 2760
tccgcccagt ccttcatcga gcgcatgacc aacttcgata agaacctccc taacgagaag 2820
gtcctcccta agcactccct gctctacgag tacttcaccg tctacaacga gctgaccaag 2880
gtcaagtacg tcaccgaggg tatgcgcaag cctgccttcc tgtccggcga gcagaagaag 2940
gccatcgtcg atctgctgtt caagaccaac cgcaaggtca ccgtcaagca gctcaaagag 3000
gattacttca agaaaatcga gtgcttcgat tccgtcgaga tcagcggcgt cgaggaccgc 3060
ttcaacgcct ccctcggaac ctaccatgat ctcctcaaga ttatcaagga taaggatttc 3120
ctcgacaacg aggaaaacga ggacatcctt gaggacatcg tcctcaccct caccctcttc 3180
gaggaccgcg aaatgatcga ggaacgcctc aagacctacg cccatctctt cgatgataag 3240
gtcatgaagc agctcaagcg ccgtcgctac accggctggg gtcgcctctc ccgcaagctc 3300
atcaacggca tccgcgataa gcagtccggc aagactatcc tcgatttcct caagtccgat 3360
ggcttcgcca accgcaactt catgcagctc atccatgatg attccctcac cttcaaagag 3420
gacatccaga aggcccaggt cagcggccag ggcgattccc tccatgagca tatcgccaac 3480
ctcgccggct cccctgccat caagaagggc atcctccaga ccgtcaaggt cgtcgatgag 3540
ctggtcaagg tcatgggccg ccataagcct gagaacatcg tcatcgagat ggcccgcgag 3600
aaccagacca cccagaaggg ccagaagaac tcccgcgagc gcatgaagcg catcgaggaa 3660
ggcatcaaag agctgggcag ccaaatcctc aaagagcatc ctgtcgagaa cacccagctc 3720
cagaacgaga agctctacct ctactacctc cagaacggcc gcgatatgta cgtcgatcaa 3780
gagctggaca tcaaccgcct ctccgattac gatgtcgatc atatcgtccc tcagtccttc 3840
ctgaaggatg attccatcga taacaaggtc ctcacccgct ccgataagaa ccgcggcaag 3900
tccgataacg tcccttccga agaggtcgtc aagaagatga agaactactg gcgccagctc 3960
ctcaacgcca agctcatcac ccagcgcaag ttcgataacc tcaccaaggc cgagcgcggt 4020
ggcctctccg agctggataa ggccggcttc atcaagcgcc agctcgtcga aacccgccag 4080
atcaccaagc acgtcgccca aatcctcgat tcccgcatga acaccaagta cgatgagaac 4140
gataagctca tccgcgaagt caaggtcatc accctcaagt ccaagctcgt cagcgatttc 4200
cgcaaggatt tccagttcta caaggtccgc gagatcaaca actaccatca tgcccatgat 4260
gcctacctca acgccgtcgt cggcaccgcc ctcatcaaga agtaccccaa gctcgaatcc 4320
gagttcgtct acggtgatta caaggtctac gatgtccgca agatgatcgc caagtccgag 4380
caagagatcg gcaaggctac cgccaagtac ttcttctact ccaacatcat gaatttcttc 4440
aagaccgaaa tcaccctcgc caacggcgaa atccgcaagc gccctctcat cgagactaac 4500
ggcgagactg gcgagatcgt ctgggataag ggccgcgatt tcgccaccgt ccgcaaggtc 4560
ctctccatgc ctcaggtcaa catcgtcaag aaaaccgagg tccagaccgg cggcttctcc 4620
aaagagtcca tcctccccaa gcgcaactcc gataagctga tcgcccgcaa gaaggattgg 4680
gaccctaaga agtacggcgg cttcgattcc cctaccgtcg cctactccgt cctcgtcgtc 4740
gccaaggtcg agaagggcaa gtccaagaag ctcaagtccg tcaaagagct gctcggcatc 4800
actattatgg aacgctccag cttcgagaag aaccctatcg atttccttga ggccaagggc 4860
tacaaagagg tcaagaagga cctcatcatc aagctcccca agtactccct gttcgagctt 4920
gagaacggcc gcaagcgcat gctcgcctcc gccggtgagc ttcagaaggg caacgagctg 4980
gccctgcctt ccaagtacgt caacttcctc tacctcgcct cccattacga gaagctcaag 5040
ggctcccctg aggataacga gcagaagcag ctgttcgtcg agcagcataa gcactacctc 5100
gatgagatca tcgagcagat cagcgagttc tccaagcgcg tcatcctcgc cgatgccaac 5160
ctcgataagg tcctgtccgc ctacaacaag caccgcgata agcctatccg cgagcaggcc 5220
gagaacatca tccatctctt caccctcacc aacctcggtg cccctgccgc cttcaagtac 5280
ttcgatacca ccatcgatcg caagcgctac acctccacca aagaggtcct ggacgccacc 5340
ctcatccatc agtccatcac cggcctctac gaaacccgca tcgatctctc ccagctcggc 5400
ggcgaccctc cgaggaaacg tgccaaaaca gaagatgagt gatgaggatc cacttaacgt 5460
tactgaaatc atcaaacagc ttgacgaatc tggatataag atcgttggtg tcgatgtcag 5520
ctccggagtt gagacaaatg gtgttcagga tctcgataag atacgttcat ttgtccaagc 5580
agcaaagagt gccttctagt gatttaatag ctccatgtca acaagaataa aacgcgtttt 5640
cgggtttacc tcttccagat acagctcatc tgcaatgcat taatgcattg actgcaacct 5700
agtaacgcct tacaggctcc ggcgaagaga agaatagctt agcagagcta ttttcatttt 5760
cgggagacga gatcaagcag atcaacggtc gtcaagagac ctacgagact gaggaatccg 5820
ctcttggctc cacgcgacta tatatttgtc tctaattgta ctttgacatg ctcctcttct 5880
ttactctgat agcttgacta tgaaaattcc gtcaccagct cctgggttcg caaagataat 5940
tgcatgtttc ttccttgaac tctcaagcct acaggacaca cattcatcgt aggtataaac 6000
ctcgaaatca tttcctacta agatggtata caatagtaac catgcatggt tgcctagtga 6060
atgctccgta acacccaata cgccggccga aactttttta caactctcct atgagtcgtt 6120
tacccagaat gcacaggtac acttgtttag agg 6153
<210> 11
<211> 6870
<212> DNA
<213> 人工合成序列
<400> 11
tcctccgagg ttcgacatca gggttcgtca tagggagtga aacacccgcc atgattccgt 60
agccgcgcgc gaagatacga agcagatatt tcacggacat ggcggagata cttgtttccc 120
gtactaaggt agtcatgtcg gagacatctg aacgacagag ctggccaaga gaaccgacca 180
gttgccccag gacgatctag acaaaaaaaa agagagatga gtgggccact tttgccacaa 240
catcgacggc cctgcgaccg cccccaggca aacaaacaaa ccgccgaaca ataatacttt 300
tgtcatttta ggaggagcgt tgtatggata aaaacaacat ctcgttgctg cagaatgtgg 360
acttcaaact tgcagaaaat gggaggcgga tttgcatgat cggagggtag ttgactcacg 420
ccgcaggctg caaatccgtc ctccattatt ccatgaacaa cttcgtaagg ttgggctgag 480
cgccaatgcc taacggaccg ggggccacag cgcaacgtcc cacttaaagg ccagcgtgac 540
atgccagttc cataccaagt agtggcacca gaggcggcca atgctcagta agggcaggga 600
gggaggctca aacgattggc aaaaagaggg gcttgccagt tcagttccct gtgcgagcgc 660
gagaggggca gtttcaaatc tggaggggtg tgttgcgctg gtctgaagag aaagagaaga 720
ctgtacttaa taattgttca aagagtccat catcgcgttg cggactcctc tagctgtatt 780
tagagcccta tcattacttg tcgggtgcga atcaaaatac cgggatgcag ccctctggcg 840
atttgcatgc ggttgtggag gaagtgaagc ctgaatcgcg gggctgggcg gcaaagcacg 900
acgtgaaatt cctggcgaaa ttcgagggct tgccccaccg tggttgaagt ttttgtgctg 960
cgtaacccca ccaacccgcc ttgcccctcc cgcctgccca taaaaacttc gacccctcct 1020
caaatcttct tcgattcttc ctcttcactt ccttcgtcgg catacctgat tcaagcaatc 1080
acctgccact ttcaagtgcg tataccatca tcgatacact ggttcttgac aagtacatcg 1140
tctctaactt tcctttttgc agttttcatt aagcgcaagt cgccagtttc gttcttcaga 1200
atggactaca aggaccatga tggcgattac aaggaccacg acatcgatta taaggatgat 1260
gatgacaagc ctccgaggaa acgtgccaaa acagaagatg agatggataa gaagtactcc 1320
atcggcctcg acatcggcac caactccgtc ggctgggccg tcatcaccga tgagtacaag 1380
gtcccttcca agaagttcaa ggtcctcggc aacaccgatc gccattccat caagaagaac 1440
ctgatcggcg ccctcctgtt cgattccggc gaaaccgccg aggccacccg ccttaaacgc 1500
accgcccgtc gccgctacac ccgccgcaag aaccgcatct gctacctcca agaaatcttc 1560
tccaacgaga tggccaaggt cgatgatagc ttcttccacc gcctcgaaga gtccttcctg 1620
gtcgaagagg ataagaagca cgagcgccat cctatcttcg gcaacatcgt cgatgaggtc 1680
gcctaccatg agaagtaccc taccatctac catctccgca agaagctcgt cgattccacc 1740
gataaggccg atctccgcct catctacctc gccctcgccc atatgatcaa gttccgcggc 1800
catttcctca tcgagggcga tctcaaccct gataactccg atgtcgataa gctgttcatc 1860
cagctcgtcc agacctacaa ccagctgttc gaggaaaacc ctatcaacgc ctccggcgtc 1920
gatgccaagg ccatcctctc cgctcgcctc tccaagtctc gccgccttga gaaccttatc 1980
gcccagctcc ctggcgagaa gaagaacggc ctcttcggca acctgatcgc cctctccctc 2040
ggcctcaccc ctaacttcaa gtccaacttc gatctcgccg aggatgccaa gctccagctc 2100
tccaaggata cctacgatga tgatctcgat aacctcctcg cccagatcgg cgatcagtac 2160
gccgatctgt tcctcgccgc caagaacctc tccgatgcca tcctcctctc cgacatcctc 2220
cgcgtcaaca ccgagatcac caaggcccct ctgtccgcct ccatgatcaa gcgctacgat 2280
gagcatcatc aggacctcac cctgctcaag gccctcgtcc gccagcagct ccctgagaag 2340
tacaaagaga ttttcttcga tcagtccaag aacggctacg ccggctacat cgatggcggc 2400
gcttcccaag aagagttcta caagttcatc aagcctatcc ttgagaagat ggatggcacc 2460
gaggaactcc tcgtcaagct caaccgcgag gacctcctcc gcaagcagcg caccttcgat 2520
aacggctcca tccctcatca aatccatctc ggcgagctgc atgccatctt gcgccgccaa 2580
gaggatttct acccattcct caaggataac cgcgagaaga tcgaaaagat tctcaccttc 2640
cgcatccctt actacgtcgg ccctctcgct cgcggcaact cccgcttcgc ctggatgacc 2700
cgcaagtccg aggaaaccat caccccttgg aacttcgagg aagtcgtcga taagggcgcc 2760
tccgcccagt ccttcatcga gcgcatgacc aacttcgata agaacctccc taacgagaag 2820
gtcctcccta agcactccct gctctacgag tacttcaccg tctacaacga gctgaccaag 2880
gtcaagtacg tcaccgaggg tatgcgcaag cctgccttcc tgtccggcga gcagaagaag 2940
gccatcgtcg atctgctgtt caagaccaac cgcaaggtca ccgtcaagca gctcaaagag 3000
gattacttca agaaaatcga gtgcttcgat tccgtcgaga tcagcggcgt cgaggaccgc 3060
ttcaacgcct ccctcggaac ctaccatgat ctcctcaaga ttatcaagga taaggatttc 3120
ctcgacaacg aggaaaacga ggacatcctt gaggacatcg tcctcaccct caccctcttc 3180
gaggaccgcg aaatgatcga ggaacgcctc aagacctacg cccatctctt cgatgataag 3240
gtcatgaagc agctcaagcg ccgtcgctac accggctggg gtcgcctctc ccgcaagctc 3300
atcaacggca tccgcgataa gcagtccggc aagactatcc tcgatttcct caagtccgat 3360
ggcttcgcca accgcaactt catgcagctc atccatgatg attccctcac cttcaaagag 3420
gacatccaga aggcccaggt cagcggccag ggcgattccc tccatgagca tatcgccaac 3480
ctcgccggct cccctgccat caagaagggc atcctccaga ccgtcaaggt cgtcgatgag 3540
ctggtcaagg tcatgggccg ccataagcct gagaacatcg tcatcgagat ggcccgcgag 3600
aaccagacca cccagaaggg ccagaagaac tcccgcgagc gcatgaagcg catcgaggaa 3660
ggcatcaaag agctgggcag ccaaatcctc aaagagcatc ctgtcgagaa cacccagctc 3720
cagaacgaga agctctacct ctactacctc cagaacggcc gcgatatgta cgtcgatcaa 3780
gagctggaca tcaaccgcct ctccgattac gatgtcgatc atatcgtccc tcagtccttc 3840
ctgaaggatg attccatcga taacaaggtc ctcacccgct ccgataagaa ccgcggcaag 3900
tccgataacg tcccttccga agaggtcgtc aagaagatga agaactactg gcgccagctc 3960
ctcaacgcca agctcatcac ccagcgcaag ttcgataacc tcaccaaggc cgagcgcggt 4020
ggcctctccg agctggataa ggccggcttc atcaagcgcc agctcgtcga aacccgccag 4080
atcaccaagc acgtcgccca aatcctcgat tcccgcatga acaccaagta cgatgagaac 4140
gataagctca tccgcgaagt caaggtcatc accctcaagt ccaagctcgt cagcgatttc 4200
cgcaaggatt tccagttcta caaggtccgc gagatcaaca actaccatca tgcccatgat 4260
gcctacctca acgccgtcgt cggcaccgcc ctcatcaaga agtaccccaa gctcgaatcc 4320
gagttcgtct acggtgatta caaggtctac gatgtccgca agatgatcgc caagtccgag 4380
caagagatcg gcaaggctac cgccaagtac ttcttctact ccaacatcat gaatttcttc 4440
aagaccgaaa tcaccctcgc caacggcgaa atccgcaagc gccctctcat cgagactaac 4500
ggcgagactg gcgagatcgt ctgggataag ggccgcgatt tcgccaccgt ccgcaaggtc 4560
ctctccatgc ctcaggtcaa catcgtcaag aaaaccgagg tccagaccgg cggcttctcc 4620
aaagagtcca tcctccccaa gcgcaactcc gataagctga tcgcccgcaa gaaggattgg 4680
gaccctaaga agtacggcgg cttcgattcc cctaccgtcg cctactccgt cctcgtcgtc 4740
gccaaggtcg agaagggcaa gtccaagaag ctcaagtccg tcaaagagct gctcggcatc 4800
actattatgg aacgctccag cttcgagaag aaccctatcg atttccttga ggccaagggc 4860
tacaaagagg tcaagaagga cctcatcatc aagctcccca agtactccct gttcgagctt 4920
gagaacggcc gcaagcgcat gctcgcctcc gccggtgagc ttcagaaggg caacgagctg 4980
gccctgcctt ccaagtacgt caacttcctc tacctcgcct cccattacga gaagctcaag 5040
ggctcccctg aggataacga gcagaagcag ctgttcgtcg agcagcataa gcactacctc 5100
gatgagatca tcgagcagat cagcgagttc tccaagcgcg tcatcctcgc cgatgccaac 5160
ctcgataagg tcctgtccgc ctacaacaag caccgcgata agcctatccg cgagcaggcc 5220
gagaacatca tccatctctt caccctcacc aacctcggtg cccctgccgc cttcaagtac 5280
ttcgatacca ccatcgatcg caagcgctac acctccacca aagaggtcct ggacgccacc 5340
ctcatccatc agtccatcac cggcctctac gaaacccgca tcgatctctc ccagctcggc 5400
ggcgacatgg tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 5460
ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 5520
acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 5580
cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 5640
atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 5700
atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 5760
accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 5820
gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 5880
aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 5940
ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 6000
aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 6060
atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 6120
aagcctccga ggaaacgtgc caaaacagaa gatgagtgat gaggatccac ttaacgttac 6180
tgaaatcatc aaacagcttg acgaatctgg atataagatc gttggtgtcg atgtcagctc 6240
cggagttgag acaaatggtg ttcaggatct cgataagata cgttcatttg tccaagcagc 6300
aaagagtgcc ttctagtgat ttaatagctc catgtcaaca agaataaaac gcgttttcgg 6360
gtttacctct tccagataca gctcatctgc aatgcattaa tgcattgact gcaacctagt 6420
aacgccttac aggctccggc gaagagaaga atagcttagc agagctattt tcattttcgg 6480
gagacgagat caagcagatc aacggtcgtc aagagaccta cgagactgag gaatccgctc 6540
ttggctccac gcgactatat atttgtctct aattgtactt tgacatgctc ctcttcttta 6600
ctctgatagc ttgactatga aaattccgtc accagctcct gggttcgcaa agataattgc 6660
atgtttcttc cttgaactct caagcctaca ggacacacat tcatcgtagg tataaacctc 6720
gaaatcattt cctactaaga tggtatacaa tagtaaccat gcatggttgc ctagtgaatg 6780
ctccgtaaca cccaatacgc cggccgaaac ttttttacaa ctctcctatg agtcgtttac 6840
ccagaatgca caggtacact tgtttagagg 6870
<210> 12
<211> 2368
<212> DNA
<213> 人工合成序列
<400> 12
accggggtaa ggtactctgt aagttacggt acctctggag ccggtgccgc accccactat 60
tttttttctt tttccccgag atcccccctg gcatcagacc ctcctggtcc ccccccctgt 120
tccctcctca ctgaatcgct gcgttcccga gcccacctaa gcccccgctg ttcccacacc 180
acatgccagc acaccacacg cccctccccc tatgtcagcc cgcccgcgtc atttaaaacg 240
agtgccgcat ccccccaagc aaactcgccc aacttttgtt acttccccat gccactttga 300
gtttccccaa catcagcacc ccagacccca gataacaaag tcaaaataaa ggttcccatt 360
gtctcccgac acagctcaac acgctgtgtc agacgagcaa ccaccaaaca catatcgctt 420
cgatactcga ccaagaacga cgtgcctgac atcagtaccc ctcgtcccac actcgaagtt 480
gggcggcttg ttgtttttct ccggttgcgt gctccgcgtg caaccaagtt gaaagagtcc 540
gggaacaaca tcaggctgag atctggtgtt ggagcaactc cgcttgggag ggtggacata 600
cgacgttaac tgatattgaa ggagcatttt ttgggcttgg ctggagctag tggaggtcaa 660
caatgaatgc ctattttggt ttagtcgtcc aggcggtgag cacaaaattt gtgtcgtttg 720
acaagatggt tcatttaggc aactggtcag atcagcccca cttgtagcag tagcggcggc 780
gctcgaagtg tgactcttat tagcagacag gaacgaggac attattatca tctgctgctt 840
ggtgcacgat aacttggtgc gtttgtcaag caaggtaagt ggacgacccg gtcatacctt 900
cttaagttcg cccttcctcc ctttatttca gattcaatct gacttaccta ttctacccaa 960
gcatccaaat gattgaacaa gatggattgc acgcaggttc tccggccgct tgggtggaga 1020
ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc gccgtgttcc 1080
ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc ggtgccctga 1140
atgaactgca agacgaggca gcgcggctat cgtggctggc cacgacgggc gttccttgcg 1200
cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg ggcgaagtgc 1260
cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc atcatggctg 1320
atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac caccaagcga 1380
aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat caggatgatc 1440
tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc aaggcgagca 1500
tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg aatatcatgg 1560
tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg gcggaccgct 1620
atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc gaatgggctg 1680
accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc gccttctatc 1740
gccttcttga cgagttcttc tgaagttccc cgggtgtagc aaacgcttct cgaggtccga 1800
cgagctcacc cggcactcga ggatacacaa caatcccaac tcgcggagag gaaacaaggg 1860
ccatcatcag cacgccgcca tgatccagag gatgcagcac gacgccatgg caccgccacc 1920
ggggcccaag atgatccgct cggcgccccc cacggcattg tcttcaccca acgtgtcgcc 1980
tcctcactac agctcctatc ccatgaatct tcccccgccg ctcagtctcg gcccgtacaa 2040
ccgcggtgcc ttgagcagcc agagtggttc ggatgtggca atgttggcga ggacggccga 2100
ccgggacacc accccgagtc agtctcatta cccgccgtcg agacagcacc cgtactacgg 2160
cgggtcgctc cactcgtcgc ggaacccgct gcccggtctg ggcgcctacc acatgtcgcg 2220
gtcgcactcg aacgatgacc acgacgacca ctatgcgcaa agttacaggc agccgaagag 2280
gtcgaggccc aactccccca actcgacggc tccttcctct cctacctttt cccacaactc 2340
gttgtccccg acgccggacc acacccca 2368
<210> 13
<211> 2363
<212> DNA
<213> 人工合成序列
<400> 13
aaccaaccct ccttcgactt tccggccgcc aaagcgccag gattcgttgg tgagtcgtca 60
cagatcccta ggtcctctcc ttctcgtcct tctccgcctc cgcccagtca cggcggacca 120
gcccgccgtg gctctctctc ttcttccgag tcttgcgctt ccgagtccac ggtcgtcgcc 180
gcccccaagc cctccagtcc cggcctggcg gtcgacacac gccttgcgcg gcagacgacc 240
accatgtctg catccctggc gtccacccct gcctcttcct cttctggcct cctcgtgacg 300
ccgcccacga cctctgcttc ttccttttct tcttcttctt cttcttcttt ttcttcttct 360
tcctcttctc tcgccgcctg gagcagcccg cccgcggcct gcggctcgcc ctcgcgcacg 420
ggcaccccca acgcccgcat gctctcttct ttcttttttc aatcttctgg gcatttcgtc 480
ccgcctctcg agacctgttg gtttcctctc tcgcgattgc gagatcccac cgcacgaccg 540
ggttttgctg acatgaaaaa ccctcgcgcc tacagatccc tccttaattc acccggacgt 600
cgacgttaac tgatattgaa ggagcatttt ttgggcttgg ctggagctag tggaggtcaa 660
caatgaatgc ctattttggt ttagtcgtcc aggcggtgag cacaaaattt gtgtcgtttg 720
acaagatggt tcatttaggc aactggtcag atcagcccca cttgtagcag tagcggcggc 780
gctcgaagtg tgactcttat tagcagacag gaacgaggac attattatca tctgctgctt 840
ggtgcacgat aacttggtgc gtttgtcaag caaggtaagt ggacgacccg gtcatacctt 900
cttaagttcg cccttcctcc ctttatttca gattcaatct gacttaccta ttctacccaa 960
gcatccaaat gattgaacaa gatggattgc acgcaggttc tccggccgct tgggtggaga 1020
ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc gccgtgttcc 1080
ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc ggtgccctga 1140
atgaactgca agacgaggca gcgcggctat cgtggctggc cacgacgggc gttccttgcg 1200
cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg ggcgaagtgc 1260
cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc atcatggctg 1320
atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac caccaagcga 1380
aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat caggatgatc 1440
tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc aaggcgagca 1500
tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg aatatcatgg 1560
tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg gcggaccgct 1620
atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc gaatgggctg 1680
accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc gccttctatc 1740
gccttcttga cgagttcttc tgagtcttgt ctcgtaccag tcccacttct ctggcgagca 1800
gccattcggt ggcgacgagt cgagggacaa gcagcgctgc ccgcaccagg actgcggcaa 1860
gaccttcaag gacctcaagg ctcatatgct cacccaccag aacgagcggc ccgagaagtg 1920
ccccatcacg acgtgcgagt atcacgtaaa aggcttcgcg agaaagtgag tagtaatata 1980
gtagtagcct gtgtgcccgg ctcttcaaga acccctgaac acaacaacaa acacaaggct 2040
cagagcgcta accgtgccaa tcttgatcag gtacgacaag aaccgccaca cgctcaccca 2100
ctacaagggc accatggtgt gcggcttctg cccggggtcg ggctccgcgg cggagaagtc 2160
gttcaaccgg gccgatgtgt tcaagaggca cttgacggcc gtgcacggag tcgagcagac 2220
gcctcccaac ggtcggaaga agacggccgg cggcagcagc agcgggaacg acgcgaagct 2280
cacgggctat gcgcccgacg cgacgggcaa gtgctcgacg tgctcgcaaa ctttcagcaa 2340
cgcacaagac ttttacgagc acc 2363
<210> 14
<211> 2363
<212> DNA
<213> 人工合成序列
<400> 14
actatcaaca gccccccgga ttgctgaccg ttggccattc acggcccttc gtttgccagt 60
ccttcgccag ggtcaaccta ccccgcggtg gggggttgtt cttggatcct tgtcgaggcc 120
ccggctgccc acatcgccca cgctgtgcac tcagcgtaac acagggcccg gatctctcaa 180
gcgatgccca gctttttttc atcggtgttg acggtccgaa actcgcggga gagatggggg 240
cagatcatgg cgggaaacgg ccgtgatggt tcctggatat aaaggagatc aggccttccc 300
tcctcggctc attggggcct actagcacat catcatccgt cttccatccc tcctcagaac 360
ttccttcccc ttcctcctat ccacctttcc cttactcaca cagacaatcg tccatcgtcc 420
accatgtctc ttcccaagga cttcaagtgg ggcttcgcca ccgcctcgta agttcaagga 480
cccgggcttt tcgatcaagc tcacagaacc gtccttggct gactgtgtgt tccctttctc 540
tcctcaccca caggtaccag attgagggct ccgtcaacga ggatggccgt ggcccctcca 600
cgacgttaac tgatattgaa ggagcatttt ttgggcttgg ctggagctag tggaggtcaa 660
caatgaatgc ctattttggt ttagtcgtcc aggcggtgag cacaaaattt gtgtcgtttg 720
acaagatggt tcatttaggc aactggtcag atcagcccca cttgtagcag tagcggcggc 780
gctcgaagtg tgactcttat tagcagacag gaacgaggac attattatca tctgctgctt 840
ggtgcacgat aacttggtgc gtttgtcaag caaggtaagt ggacgacccg gtcatacctt 900
cttaagttcg cccttcctcc ctttatttca gattcaatct gacttaccta ttctacccaa 960
gcatccaaat gattgaacaa gatggattgc acgcaggttc tccggccgct tgggtggaga 1020
ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc gccgtgttcc 1080
ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc ggtgccctga 1140
atgaactgca agacgaggca gcgcggctat cgtggctggc cacgacgggc gttccttgcg 1200
cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg ggcgaagtgc 1260
cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc atcatggctg 1320
atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac caccaagcga 1380
aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat caggatgatc 1440
tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc aaggcgagca 1500
tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg aatatcatgg 1560
tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg gcggaccgct 1620
atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc gaatgggctg 1680
accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc gccttctatc 1740
gccttcttga cgagttcttc tgatgttcaa ggccatcccc aagtgcaagc actggatcac 1800
cttcaacgag ccgtggtgca cgtccatcct gggctacaac acgggctact tcgcgcccgg 1860
ccgcacgtcg gaccgcagca agtcgcccgt cggcgacagc gcgcgcgagc cgtggatcgt 1920
cggccacaac atcctcatcg cgcacgggag ggccgtcaag gcgtaccgcg aggacttcaa 1980
gcccacgcag ggcggcgaga tcggcatcac gctcaacggc gacgccacgc tcccctggga 2040
cccggaggac ccggccgacg tcgaggcgtg cgaccgcaag atcgagttcg ccatctcgtg 2100
gttcgccgac cccatctact ttggcgagta cccggcgtcg atgcgcaagc agctgggcga 2160
ccgcctgccc aagttcacgg ccgaggaggt ggcgctcgtc aagggctcca acgacttcta 2220
cggcatgaac cactacacgg ccaactacat caagcacaag aagggcgtgc cgcccgagga 2280
cgacttcctg ggcaacctcg agacgctctt ctacaacaag aacgccgact gcatcgggcc 2340
cgagacgcag tccttctggc tgc 2363
<210> 15
<211> 2363
<212> DNA
<213> 人工合成序列
<400> 15
ccttcctagt cctcgcagca aactcgagct gctatcagat tcccgggaag cggcctgcca 60
cagccgctca acccggcctt ggcatggcca ggcggccctt tcatgtgtcg aaagcggcag 120
gtcatcagca cagatctcga gggtgggaaa gagagggggg ggaggggcga tgctggggcg 180
atgctgcttg gagccgcatc cggggagggg gccctgctgt tcatccatat ccaggatgat 240
gcgagattga agcaagataa ataacacggc ttccccctcc cctttcgatc cggaccagac 300
catcgtctcc aacaccccaa agtcgatccg acaagtccca atccaccccg cccgcccctc 360
cctccgtcgc cgtcccggtc ttccgatttc gtcaagatgc acttctccac cgctctcctg 420
gccttcctgc ccgccgccct cgcggcccct actgccgaga ccctcgacaa gcgcgccccg 480
atcctgactg ctcgcgctgg ccaggtcgtc ccgggcaagt acatcatcaa gctccgcgac 540
ggagccagcg acgatgtcct tgaggccgcc atcggcaagc tccgctccaa ggccgaccac 600
cgacgttaac tgatattgaa ggagcatttt ttgggcttgg ctggagctag tggaggtcaa 660
caatgaatgc ctattttggt ttagtcgtcc aggcggtgag cacaaaattt gtgtcgtttg 720
acaagatggt tcatttaggc aactggtcag atcagcccca cttgtagcag tagcggcggc 780
gctcgaagtg tgactcttat tagcagacag gaacgaggac attattatca tctgctgctt 840
ggtgcacgat aacttggtgc gtttgtcaag caaggtaagt ggacgacccg gtcatacctt 900
cttaagttcg cccttcctcc ctttatttca gattcaatct gacttaccta ttctacccaa 960
gcatccaaat gattgaacaa gatggattgc acgcaggttc tccggccgct tgggtggaga 1020
ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc gccgtgttcc 1080
ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc ggtgccctga 1140
atgaactgca agacgaggca gcgcggctat cgtggctggc cacgacgggc gttccttgcg 1200
cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg ggcgaagtgc 1260
cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc atcatggctg 1320
atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac caccaagcga 1380
aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat caggatgatc 1440
tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc aaggcgagca 1500
tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg aatatcatgg 1560
tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg gcggaccgct 1620
atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc gaatgggctg 1680
accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc gccttctatc 1740
gccttcttga cgagttcttc tgaggctcca ccacctacac ctacgacacc agcgccggcg 1800
agggcacctg tgcctatgtg atcgacacgg gcatctacac tagccactcc gtatgtctcg 1860
cggttacctc ccctttcgga agaaggggca tccatatgct gacccctcct gatcacagga 1920
cttcggcggc cgtgccactt tcgccgccaa cttcgtcgac agctctaaca ccgatggcaa 1980
cggccacggc acccacgtcg ccggcaccat cggcggcacc acgtacggtg ttgccaagaa 2040
gaccaagctc tacgccgtca aggttctcgg ctccgacggc tctggcacca cgtatgcctc 2100
gcacccgcgc acccgcacac ccgcccggcc gttatcttct gactgacatt cctctttctc 2160
ctctctagtt ctggtgtcat tgctggcatc aacttcgtcg ctgacgacgc gcccaagcgc 2220
agctgcccca agggcgtcgt cgccaacatg tcgctcggcg gtagctactc ggcctccatc 2280
aacaacgccg ccgccgccct cgtcaggtcg ggcgtcttcc tggccgtcgc cgccggcaac 2340
gagaaccaga acgccgccaa ctc 2363
<210> 16
<211> 50
<212> DNA
<213> 人工合成序列
<400> 16
gccagtttcg ttcttcagaa agcttatgga ctacaaggac catgatggcg 50
<210> 17
<211> 55
<212> DNA
<213> 人工合成序列
<400> 17
tgatgatttc agtaacgtta agtggatcct catcactcat cttctgtttt ggcac 55
<210> 18
<211> 55
<212> DNA
<213> 人工合成序列
<400> 18
ctaggccacc atgttgggcc cggcgcgccg aattctcctc cgaggttcga catca 55
<210> 19
<211> 50
<212> DNA
<213> 人工合成序列
<400> 19
cgccatcatg gtccttgtag tccataagct ttctgaagaa cgaaactggc 50
<210> 20
<211> 55
<212> DNA
<213> 人工合成序列
<400> 20
gtgccaaaac agaagatgag tgatgaggat ccacttaacg ttactgaaat catca 55
<210> 21
<211> 55
<212> DNA
<213> 人工合成序列
<400> 21
tcctgcccgt cacagagatt tgaccatggg agctccctct aaacaagtgt acctg 55
<210> 22
<211> 55
<212> DNA
<213> 人工合成序列
<400> 22
tctctcccag ctcggcggcg acgaattcat ggtgagcaag ggcgaggagc tgttc 55
<210> 23
<211> 77
<212> DNA
<213> 人工合成序列
<400> 23
tcagtaacgt taagtggatc cttactcatc ttctgttttg gcacgtttcc tcggaggctt 60
gtacagctcg tccatgc 77
<210> 24
<211> 25
<212> DNA
<213> 人工合成序列
<400> 24
aggatcggtg gagtgaagtt cggaa 25
<210> 25
<211> 49
<212> DNA
<213> 人工合成序列
<400> 25
ctaaaacgac cctccatgct gttcgccgag gaaagaaaga aaagaagag 49
<210> 26
<211> 49
<212> DNA
<213> 人工合成序列
<400> 26
ctaaaacctg cagactttgc gcgttgcgag gaaagaaaga aaagaagag 49
<210> 27
<211> 49
<212> DNA
<213> 人工合成序列
<400> 27
ctaaaacggt acgagggctc atagggcgag gaaagaaaga aaagaagag 49
<210> 28
<211> 49
<212> DNA
<213> 人工合成序列
<400> 28
ctaaaacggg atggcgcaga atgtgtcgag gaaagaaaga aaagaagag 49
<210> 29
<211> 49
<212> DNA
<213> 人工合成序列
<400> 29
ctaaaacctg aacttgccgc ggtagacgag gaaagaaaga aaagaagag 49
<210> 30
<211> 50
<212> DNA
<213> 人工合成序列
<400> 30
tcctcggcga acagcatgga gggtcgtttt agagctagaa atagcaagtt 50
<210> 31
<211> 50
<212> DNA
<213> 人工合成序列
<400> 31
tcctcgcaac gcgcaaagtc tgcaggtttt agagctagaa atagcaagtt 50
<210> 32
<211> 50
<212> DNA
<213> 人工合成序列
<400> 32
tcctcgccct atgagccctc gtaccgtttt agagctagaa atagcaagtt 50
<210> 33
<211> 50
<212> DNA
<213> 人工合成序列
<400> 33
tcctcgacac attctgcgcc atcccgtttt agagctagaa atagcaagtt 50
<210> 34
<211> 50
<212> DNA
<213> 人工合成序列
<400> 34
tcctcgtcta ccgcggcaag ttcaggtttt agagctagaa atagcaagtt 50
<210> 35
<211> 27
<212> DNA
<213> 人工合成序列
<400> 35
aaaaaaagca ccgactcggt gccactt 27
<210> 36
<211> 57
<212> DNA
<213> 人工合成序列
<400> 36
ttgggcccgg cgcgccgaat tcccggggat ccaccggggt aaggtactct gtaagtt 57
<210> 37
<211> 50
<212> DNA
<213> 人工合成序列
<400> 37
gctccttcaa tatcagttaa cgtcgtatgt ccaccctccc aagcggagtt 50
<210> 38
<211> 50
<212> DNA
<213> 人工合成序列
<400> 38
aactccgctt gggagggtgg acatacgacg ttaactgata ttgaaggagc 50
<210> 39
<211> 50
<212> DNA
<213> 人工合成序列
<400> 39
aagcgtttgc tacacccggg gaacttcaga agaactcgtc aagaaggcga 50
<210> 40
<211> 50
<212> DNA
<213> 人工合成序列
<400> 40
tcgccttctt gacgagttct tctgaagttc cccgggtgta gcaaacgctt 50
<210> 41
<211> 58
<212> DNA
<213> 人工合成序列
<400> 41
cagatctacc atggtggact cctcttaaag ctttggggtg tggtccggcg tcggggac 58
<210> 42
<211> 57
<212> DNA
<213> 人工合成序列
<400> 42
ttgggcccgg cgcgccgaat tcccggggat ccaaccaacc ctccttcgac tttccgg 57
<210> 43
<211> 50
<212> DNA
<213> 人工合成序列
<400> 43
gctccttcaa tatcagttaa cgtcgacgtc cgggtgaatt aaggagggat 50
<210> 44
<211> 50
<212> DNA
<213> 人工合成序列
<400> 44
atccctcctt aattcacccg gacgtcgacg ttaactgata ttgaaggagc 50
<210> 45
<211> 50
<212> DNA
<213> 人工合成序列
<400> 45
aagtgggact ggtacgagac aagactcaga agaactcgtc aagaaggcga 50
<210> 46
<211> 50
<212> DNA
<213> 人工合成序列
<400> 46
tcgccttctt gacgagttct tctgagtctt gtctcgtacc agtcccactt 50
<210> 47
<211> 58
<212> DNA
<213> 人工合成序列
<400> 47
cagatctacc atggtggact cctcttaaag cttggtgctc gtaaaagtct tgtgcgtt 58
<210> 48
<211> 57
<212> DNA
<213> 人工合成序列
<400> 48
ttgggcccgg cgcgccgaat tcccggggat ccactatcaa cagccccccg gattgct 57
<210> 49
<211> 50
<212> DNA
<213> 人工合成序列
<400> 49
gctccttcaa tatcagttaa cgtcgtggag gggccacggc catcctcgtt 50
<210> 50
<211> 50
<212> DNA
<213> 人工合成序列
<400> 50
aacgaggatg gccgtggccc ctccacgacg ttaactgata ttgaaggagc 50
<210> 51
<211> 50
<212> DNA
<213> 人工合成序列
<400> 51
ttgcacttgg ggatggcctt gaacatcaga agaactcgtc aagaaggcga 50
<210> 52
<211> 50
<212> DNA
<213> 人工合成序列
<400> 52
tcgccttctt gacgagttct tctgatgttc aaggccatcc ccaagtgcaa 50
<210> 53
<211> 58
<212> DNA
<213> 人工合成序列
<400> 53
cagatctacc atggtggact cctcttaaag cttgcagcca gaaggactgc gtctcggg 58
<210> 54
<211> 57
<212> DNA
<213> 人工合成序列
<400> 54
ttgggcccgg cgcgccgaat tcccggggat ccccttccta gtcctcgcag caaactc 57
<210> 55
<211> 50
<212> DNA
<213> 人工合成序列
<400> 55
caagctccgc tccaaggccg accaccgacg ttaactgata ttgaaggagc 50
<210> 56
<211> 50
<212> DNA
<213> 人工合成序列
<400> 56
caagctccgc tccaaggccg accaccgacg ttaactgata ttgaaggagc 50
<210> 57
<211> 50
<212> DNA
<213> 人工合成序列
<400> 57
tgtcgtaggt gtaggtggtg gagcctcaga agaactcgtc aagaaggcga 50
<210> 58
<211> 50
<212> DNA
<213> 人工合成序列
<400> 58
tcgccttctt gacgagttct tctgaggctc caccacctac acctacgaca 50
<210> 59
<211> 58
<212> DNA
<213> 人工合成序列
<400> 59
cagatctacc atggtggact cctcttaaag cttgagttgg cggcgttctg gttctcgt 58
<210> 60
<211> 25
<212> DNA
<213> 人工合成序列
<400> 60
tcccacttaa aggccagcgt gacat 25
<210> 61
<211> 25
<212> DNA
<213> 人工合成序列
<400> 61
tagtaaggga tgcggaaggt gagaa 25
<210> 62
<211> 25
<212> DNA
<213> 人工合成序列
<400> 62
ctccccatct ctctcaaaga ccagc 25
<210> 63
<211> 25
<212> DNA
<213> 人工合成序列
<400> 63
gctcactaac cgccttgaaa ctctc 25
<210> 64
<211> 25
<212> DNA
<213> 人工合成序列
<400> 64
atacagtacc tctgcacaac catcc 25
<210> 65
<211> 25
<212> DNA
<213> 人工合成序列
<400> 65
agttgggatt gttgtgtatc ctcga 25
<210> 66
<211> 25
<212> DNA
<213> 人工合成序列
<400> 66
aaccccaggc atcgtagatc agggc 25
<210> 67
<211> 25
<212> DNA
<213> 人工合成序列
<400> 67
gcatatgagc cttgaggtcc ttgaa 25
<210> 68
<211> 25
<212> DNA
<213> 人工合成序列
<400> 68
cctcagtctc cgcaatatcg tgcat 25
<210> 69
<211> 25
<212> DNA
<213> 人工合成序列
<400> 69
gaagtagccc gtgttgtagc ccagg 25
<210> 70
<211> 25
<212> DNA
<213> 人工合成序列
<400> 70
ttctggcctg cccttttctt tcaac 25
<210> 71
<211> 25
<212> DNA
<213> 人工合成序列
<400> 71
gccccttctt ccgaaagggg aggta 25