本发明属于生物领域,涉及一种长基因合成方法。
背景技术:
现代分子生物学、基因工程以及合成生物学对长基因合成的需求越来越大。在分子生物学领域,研究者为了表达蛋白或者探究某一通路的功能,经常需要重新设计并且从头构建大于10kb的质粒。合成生物学科学家构建的基因线路和代谢通路经常包含十几个甚至几十个原件,单个模块的长度经常在10kb甚至20kb以上。
基因组的重新设计和合成是合成生物学的研究热点之一。在2010年,venter研究院从头合成了一种支原体基因组,并将其移植到一个细胞中,首次成功构建了人工合成生命。由约翰霍普金斯大学boeke教授领导的一个国际团队也正在进行酿酒酵母基因组的重新设计及合成。在2016年,由哈佛大学church教授和boeke教授组织的一次研讨会正式将合成人类基因组的计划提上日程。这些基因组级别的dna重新合成的研究对大片段的基因合成能力提出了新的挑战。
对绝大多数技术,一轮基因合成只能合成小于1kb的dna片段。长基因的合成是通过dna组装的方法来进行的。目前可用的dna组装的技术有很多种,下面分别描述一些这些方法。传统的酶切连接技术可以分步的将合成的短基因片段连入目标载体,从而合成目标的长基因片段。然而酶切连接方法一般只能将单一片段连入目标载体,不能进行多片段的连接,使整个方法非常低效。同时,酶切连接方法非常依赖目标片段上独一无二的酶切位点,如果目标片段比较长,会严重限制酶切连接策略的选择。
gibson组装是venter研究院合成支原体基因组的过程中发明的组装技术。该技术利用体外同源重组的方法对多个dna片段进行组装,但是重组过程需要片段之间存在同源臂。通常情况下,组装片段之间同源臂需要利用pcr的方法通过合成在引物5’端加入,这个特点致使组装大片段的时候比较容易发生突变。而且当gibson组装的片段个数大于5个的时候,组装效率显著下降。
goldengate克隆技术利用iis型核酸酶,通过边切边连的方法将多个片段组装在一起。有报道称goldengate克隆可以一次性将10个片段拼接在一起。但是goldengate克隆的一个最大的缺点是,当拼接序列内部存在所使用的iis型核酸酶酶切位点的情况下,就无法使用该技术。
利用酿酒酵母的体内同源重组系统也是一种常用的拼接大片段的方法。但是酵母的生长周期为两天,而且将片段组装后,还需要转化大肠杆菌获得高浓度的片段。因此酵母体内组装的周期显著高于体外组装的周期,而且操作上也比体外组装复杂很多。这些都限制了酵母体内重组的广泛应用。
综上所述,每一种组装技术都有内在的优点和缺点,某一个技术可能适用于某一类特征的序列拼接,但是没有一种技术是普遍适用于所有的序列的合成。在提供长片段基因合成的服务过程中,客户的需求通常是多种多样的。比如,目标基因中或许会有存在iis型核酸酶酶切位点,就无法使用goldengate克隆的方法。
技术实现要素:
本发明的目的是针对现有技术的上述不足,提供一种适用于3kb-50kb的长基因的合成方法,尤其是适用于长度大于8kb以上长基因的合成。
一种长基因合成方法,包含以下步骤:
1)按照基因片段内部的iis型限制性内切酶酶切位点对长基因进行两级分段:首先计算iis型限制性内切酶酶切位点的个数,选择位点个数最少的两个酶切位点对整个序列进行一级分段,在一级分段酶切位点处的分段方式为:将识别位点的前几个碱基分到上一段序列,同时将后几个碱基分到下一段序列,达到的效果是使每一段都没有完整的此iis型核酸酶酶切位点;如果有一大段序列超过5kb,其中没有合适的iis型核酸酶酶切位点将其分段,则人为的将其从靠中间的任意位置分成两段;之后再对一级片段进行二级分段,以使各个二级片段能够通过goldengate的方法进行拼接;
2)获得二级片段;
3)由二级片段利用goldengate拼接成一级片段;
4)由一级片段利用酶切-lcr的方法,或者pcr-lcr的方法拼接成全长基因。
二级片段通常通过传统基因合成方法获得,也可通过其他制备基因的方法得到。
长基因的合成流程每一步的详细操作步骤:
1.长基因进行两级分段方法优选如下:
首先计算整个序列中的bsai、bsmbi、bbsi、bspqi等iis型核酸酶酶切位点的个数,选择位点个数最少的两个酶切位点对整个序列进行一级分段。例如序列中有一个bsai位点,两个bsmbi位点,而bbsi和bspqi位点比较多,则可以用序列中的bsai和bsmbi共计三个位点将整段序列分成a1、a2、a3、a4共4段(图2)。如果有一大段序列超过5kb,其中没有合适的iis型核酸酶酶切位点将其分段,可以人为的将其从靠中间的任意位置分成两段。将所选择的两个酶切位点,其中一个酶(比如bsai)定义为a酶切位点,另一个(bsmbi)为b酶切位点(图2)。
在酶切位点处的分段方式为:将识别位点的前几个碱基分到上一段序列,同时将后几个碱基分到下一段序列,达到的效果是使每一段都没有完整的此iis型核酸酶酶切位点(图3)。具体的,对bbsi(gaagac),将gaaga分在前一段序列,将aagac分在后一段序列。bsai(ggtctc),bsmbi(cgtctc),bspqi(gctcttc)处理方式于bsai类似(图3)。
当一级片段拼接成全长基因采用酶切-lcr的方法,在每个一级分段片段的两端加上a酶切识别位点,作为最终的一级片段序列,对应的酶切-lcr中使用a酶进行酶切;当一级片段拼接成全长基因采用pcr-lcr的方法,则a酶切位点的加入不是必须的,即一级分段的两端可以加上a酶切识别位点,也可以不加上a酶切识别位点。
之后再对一级片段进行二级分段,以使各个二级片段可以通过goldengate的方法进行拼接。二级片段的分段的原则为:每个片段尽量等长但是每个片段不超过700bp;同一个片段内部没有大于20bp的重复;片段之间会有4bp的粘性末端,同一个一级片段内选择的粘性末端两两之间不能相同,且不能为回文序列。例如对于一个3kb的a2片段可以分成5段,每段约600bp(图4)。最后,在每个二级片段的两端加上b酶切识别位点(一级分段中的另一个酶切位点),作为最终的二级片段序列。
为了方便分段的粘性末端的选择以及后续获得稳定的组装效率,我们设计并测试了一组4bp的粘性末端:ccct;tatg;atcc;gctg;taca;gagt;gtcg;tgcc;gaac。
经过两级分段,可以将一段3kb-50kb的基因分成小于700bp若干段。将这些短片段分别合成后,可以利用两级合成方法拼接成全长。
2.二级片段的合成优选:
二级片段通过普通的基因合成获得,克隆到amp抗性的puc57载体上。
3.由二级片段拼接一级片段优选:
二级片段组装成一级片段通过b酶介导的goldengate克隆的方法实现(图5)。具体的,将各二级片段和对应的二级辅助载体混合,进行goldengate克隆反应,转化大肠杆菌感受态,涂布kan抗性平板,挑取正确克隆。
4.由一级片段拼接基因全长优选:
一级片段拼接为全长可以通过两种方法实现:
1)通过pcr-lcr的方法拼接全长(图6)。具体的,设计pcr引物,将一级片段所有片段和puc57载体骨架扩增出来。pcr引物的设计应使扩增片段首尾相接同时没有重叠区域。之后,将pcr片段和bridgingoligo合并进行lcr反应。反应液转化大肠杆菌感受态,涂布amp抗性平板,挑取正确克隆。
2)通过酶切-lcr的方法拼接全长(图7)。具体的,将所有的一级片段和一级辅助载体混合在一起,用a酶进行酶切。之后将酶切混合物和bridgingoligo合并进行lcr反应。反应液转化大肠杆菌感受态,涂布amp抗性平板,挑取正确克隆。
其中,bridgingoligo为lcr反应术语,指辅助两个片段拼接的oligo,与两个片段的末端均有同源片段。
二级辅助载体是拼接二级片段用的,一级辅助载体是拼接一级片段用的。辅助载体对应片段的数量不确定,从2-12都可以,优选2-5条。图4和图5有具体的展示。
辅助载体的构建:
此基因合成流程需要使用一级辅助载体和二级辅助载体,它们均由puc57载体改造而来。其中二级载体需要满足:带有kan抗性标记;laczα片段两端各带有一个iis型核酸酶酶切位点;两端的iis型核酸酶酶切位点分别切出“aacg”和“ccga”的4bp的粘性末端或者“tct”的3bp的粘性末端;整个载体的其他位置没有所对应iis型核酸酶酶切位点(图1)。二级辅助载体可以直接作为goldengate克隆的载体骨架来使用,同时还可以进行蓝白斑筛选。在本技术方案中,二级辅助载体与二级片段组装,得到一级载体。
一级辅助载体需要满足:带有amp抗性,laczalpha片段两端各带有一段linker序列和一个iis型限制性内切酶酶切位点,整个载体的其他位置没有所对应iis型核酸酶酶切位点(图1)。一级辅助载体可以直接作为载体骨架用于酶切-lcr克隆,同时还可以进行蓝白斑筛选。在本技术方案中,一级辅助载体与一级片段进行组装,获得合成基因的全长。
有益效果
1.此方法使用iis型核酸酶酶切位点对大片段基因进行分段,iis型核酸酶酶切位点有很多可供选择,因此方法适用于绝大部分的序列。
2.如果使用酶切-lcr的方法将一级片段组装成基因全长,整个组装流程可以完全避免pcr的反应,从而将突变发生的可能性降到最低。
3.能够快速的将短片段拼接成长片段。由二级片段拼接成全长可以在五天内实现。
4.整个技术方案流程化,可以利用软件进行自动化设计,同时可以使用自动化平台进行生产。
附图说明
图1:二级辅助载体图谱
图2:一级片段分段方法示例。
图3:一级片段断点处酶切位点序列处理方法
图4:二级片段分段方法示例
图5:由二级片段利用goldengate克隆拼接成一级片段
图6:通过pcr-lcr的方法拼接全长
图7:通过酶切-lcr的方法拼接全长
图8:序列一的一级分段
图9:序列一的一级和二级分段片段大小
图10:序列二的一级分段
图11:序列二的一级和二级分段片段大小
具体实施方式
实施例1:辅助载体的构建
以puc57-kan-bsmbi-free1为模板,利用引物level1puc57-kan-bbsi-1/level1puc57-kan-bbsi-2扩增获得puc57-kan骨架,level1lacza-kan-bbsi-1/level1lacza-kan-bbsi-2扩增获得laczα片段。所使用的引物序列为:
level1puc57-kan-bbsi-1tgacgaagactaggcagctgcatgtgtcagagg
level1puc57-kan-bbsi-2tgacgaagacattgagctcgctcactgactcgct
level1lacza-kan-bbsi-1gtacgaagactatgccaacgcgagacccacgacaggtttcccgactgga
level1lacza-kan-bbsi-2gatcgaagacgcctcatcggcgagacctgtcggggctggcttaactat
pcr反应体系为:10xpbobuffer5μl,10mmdntps0.8μl、上游引物1μl、下游引物1μl、模板dna1μl、pbodnapolymerase1μl、无菌水至50μl。反应程序为:95℃预变性5min;95℃变性15s,55℃退火15s,72℃延伸30s,30个循环;最后72℃延伸反应10min。
通过bbsi介导的goldengate将puc57-kan和laczα片段拼接获得puc57level1-kan-bsai。配制如下的反应体系:puc57-kan和laczα片段各1μl、t4dnaligasebuffer(neb)2μl、bbsi(neb)1μl、t4dnaligase(neb)1μl、无菌水至20μl。反应程序为:step1:37℃3min;step2:16℃5min;step1-step2共10个循环。step3:37℃15min;step4:55℃5min;step580℃5min;完成goldengate组装。获得的最终载体puc57level1-kan-bsai序列见seqidno.1。
puc57-kan-bsmbi-free1为不含bsmbi的puc57载体,其序列见seqidno.2。
puc57level1-kan-bsmbi的构建与puc57level1-kan-bsai构建过程相同,其使用的引物序列为:
level1puc57-kan-bsmbi-1tgacgaagactaggcagctgcatgtgtcagagg
level1puc57-kan-bsmbi-2tgacgaagacattgagctcgctcactgactcgct
level1lacza-kan-bsmbi-3gtacgaagactatgccaacgcgagacgcacgacaggtttcccgactgga
level1lacza-kan-bsmbi-4gatcgaagacgcctcatcggcgagacgtgtcggggctggcttaactat
puc57level1-kan-bbsi的构建与puc57level1-kan-bsai构建过程相同,其使用的引物序列为:
level1puc57-kan-bbsi-1tgacggtctcaggcagctgcatgtgtcagagg
level1puc57-kan-bbsi-2tgacggtctcttgagctcgctcactgactcgct
level1lacza-kan-bbsi-3gtacggtctcatgccaacgcggtcttccacgacaggtttcccgactgga
level1lacza-kan-bbsi-4gatcggtctccctcatcggcggtcttctgtcggggctggcttaactat
puc57level1-kan-bspqi的构建与puc57level1-kan-bsai构建过程相同,其使用的引物序列为:
level1puc57-kan-bspqi-1tgacggtctcaggcagctgcatgtgtcagagg
level1puc57-kan-bspqi-2tgacggtctcttgagctcgctcactgactcgct
level1lacza-kan-bspqi-3gtacggtctcatgcctctagaagagccacgacaggtttcccgactgga
level1lacza-kan-bspqi-4gatcggtctccctcaagacgaagagctgtcggggctggcttaactat
puc57level2-amp-bsai的构建方法如下:
以puc57-bsaifree(seqidno.3)为模板,利用引物puc57-bsmbi-1/puc57-bsmbi-2扩增获得puc57骨架,laczα-bsmbi-1/laczα-bsmbi-2扩增获得laczα片段。pcr反应体系为:10xpbobuffer5μl,10mmdntps0.8μl、上游引物1μl、下游引物1μl、模板dna1μl、pbodnapolymerase1μl、无菌水至50μl。反应程序为:95℃预变性5min;95℃变性15s,55℃退火15s,72℃延伸30s,30个循环;最后72℃延伸反应10min。
通过bsmbi介导的goldengate将puc57和laczα片段拼接获得puc57level2-amp-bsai。配置如下的反应体系:puc57和laczα片段各1μl、t4dnaligasebuffer(neb)2μl、bsmbi(neb)1μl、t4dnaligase(neb)1μl、无菌水至20μl。反应程序为:step1:42℃2min;step2:16℃5min;step1-step2共20个循环。step3:55℃10min;step4:80℃10min;完成goldengate组装。如果使用的typiis是bsai或者bbsi,反应程序如下:step1:37℃3min;step2:16℃5min;step1-step2共10个循环。step3:37℃15min;step4:55℃5min;step580℃5min。
将上述反应液中取出10μl转化至dh5α感受态细胞,涂布在amp抗性显色平板上。长出的蓝色克隆活化后直接测序,确认正确后,将此克隆保种。
过程中使用的引物序列如下:
level2puc57-bsai-1:
tcagcgtctccggattacgccgctttcctatcttgggcctcgtgatacgcctat
level2puc57-bsai-2:
tcagcgtctcccccttttacagcaggacaaccgcctcgctcactgactcgctgcgc
level2lacza-bsai-1::
tcagcgtctctatcccaggcaatagcgaaaagggaacgcgagacccacgacaggtttcccgactgg
level2lacza-bsai-2:
tcagcgtctctagggttcccgatagttctgcgtatcggcgagacctgtcggggctggcttaactatg
puc57level2-amp-bsmbi的构建与puc57level1-amp-bsai构建过程相同,其使用的引物序列为:
level2puc57-bsmbi-1:
tcagggtctccggattacgccgctttcctatcttgggcctcgtgatacgcctat
level2puc57-bsmbi-2:
tcagggtctcccccttttacagcaggacaaccgcctcgctcactgactcgctgcgct
level2lacza-bsmbi-1:
tcagggtctctatcccaggcaatagcgaaaagggaacgcgagacgcacgacaggtttcccgactgg
level2lacza-bsmbi-2:
tcagggtctctagggttcccgatagttctgcgtatcggcgagacgtgtcggggctggcttaactatg
puc57level2-amp-bbsi的构建与puc57level1-amp-bsai构建过程相同,其使用的引物序列为:
level2puc57-bbsi-1:
tcagggtctccggattacgccgctttcctatcttgggcctcgtgatacgcctat
level2puc57-bbsi-2:
tcagggtctcccccttttacagcaggacaaccgcctcgctcactgactcgctgcgct
level2lacza-bbsi-3:
tcagggtctctatcccaggcaatagcgaaaagggaacgcggtcttccacgacaggtttcccgactgg
level2lacza-bbsi-4:
tcagggtctctagggttcccgatagttctgcgtatcggcggtcttctgtcggggctggcttaactatg
puc57level2-amp-bsmbi的构建与puc57level1-amp-bsai构建过程相同,其使用的引物序列为:
level2puc57-bsai-1:
tcagggtctccggattacgccgctttcctatcttgggcctcgtgatacgcctat
level2puc57-bsai-2:
tcagggtctcccccttttacagcaggacaaccgcctcgctcactgactcgctgcgct
level2lacza-bsai-5:
tcagggtctctatcccaggcaatagcgaaaagggtctagaagagccacgacaggtttcccgactg
level2lacza-bsai-6:
tcagggtctcgagggttcccgatagttctgcgtaagacgaagagctgtcggggctggcttaactat
puc57level2-amp-bspqi的构建与puc57level1-amp-bsai构建过程相同,其使用的引物序列为:
level2puc57-bspqi-1:
tcagggtctccggattacgccgctttcctatcttgggcctcgtgatacgcctat
level2puc57-bspqi-2:
tcagggtctcccccttttacagcaggacaaccgcctcgctcactgactcgctgcgct
level2lacza-bspqi-5:
tcagggtctctatcccaggcaatagcgaaaagggtctagaagagccacgacaggtttcccgactg
level2lacza-bspqi-6:
tcagggtctcgagggttcccgatagttctgcgtaagacgaagagctgtcggggctggcttaactat
实施例2:序列一的合成示例
序列一(seqidno.4)的分析显示,序列共含有1个bsai位点、7个bbsi位点、2个bsmbi位点和1个bspqi位点,选择bsai和bsmbi对序列进行分段。在进行长基因合成的过程中,二级组装采用bsaigoldengate,一级组装采用pcr产物进行lcr反应。利用bsai和bsmbi位点将序列分为四段,对于其中大于5kb的一段再利用特定的碱基(在后续组装中作为粘性末端)将其分为两段,最终将全长分成a,b,c,d,e共5个片段,如图8所示。
将a,b,c,d,e五个一级片段再次继续的分成二级片段,便于进行基因合成。分段的原则为:每个片段尽量等长但是每个片段不超过700bp;同一个片段内部没有大于20bp的重复;片段之间会有4bp的粘性末端,同一个一级片段内选择的粘性末端两两之间不能相同,且不能为回文序列。由此分成的二级的片段共16个,序列见seqidno.5-seqidno.20。一级和二级片段大小如图9所示。
二级片段通过普通的基因合成获得。设计引物。合成得到的引物,将每条引物稀释至50μm,将所有的引物进行混合并稀释10倍(oligomix中每条引物浓度为5μm)。配制第一轮pcr反应体系:10xpbobuffer5μl、10mmdntps1μl、oligomix10μl、pbodnapolymerase1μl、无菌水至50μl。反应程序为:95℃预变性5min;95℃变性30s,58℃退火30s,72℃延伸30s,25个循环;最后72℃延伸反应10min。第二轮pcr以第一轮pcr反应的产物作为模板,反应体系:一轮pcr产物10μl、10xpbobuffer5μl、10mmdntps1μl、首尾引物各1μl、pbodnapolymerase1μl、无菌水至50μl。反应程序为:95℃预变性5min;95℃变性30s,58℃退火30s,72℃延伸30s,30循环;最后72℃延伸反应10min。pcr产物进行纯化。将基因合成得到的片段通过平末端连接至ecorv酶切后的puc57-bsaifree载体,酶连产物转入top10感受态细胞,涂布在amp抗性显色平板上,将白斑活化后测序。
利用bsaigoldengate把二级片段拼接成a,b,c,d,e一级片段。
反应体系:含二级片段的载体各100ng、puc57level1-kan-bsai100ng、t4dnaligasebuffer(neb)2μl、bsai(neb)1μl、t4dnaligase(neb)1μl、无菌水至20μl。反应条件:step1:37℃3min;step2:16℃5min;step1-step2共10个循环。step3:37℃15min;step4:55℃5min;step580℃5min;完成goldengate组装。将上述反应液中取出10μl转化至top10感受态细胞,涂布在kan抗性显色平板上。取两个白斑抽提质粒,进行酶切验证(如bsmbi),正确的质粒命名为puc57level1-kan-a,puc57level1-kan-b,puc57level1-kan-c,puc57level1-kan-d,puc57level1-kan-e。
一级组装利用pcr产物进行lcr。具体的,以二级片段中验证正确的质粒为模板,通过以下引物分别扩增得到a,b,c,d,e五个片段;一级载体采用pcr的方式扩增获得。引物序列如下:
具体操作步骤为,以扩增a片段为例,pcr反应体系:10xpbobuffer5μl,10mmdntps0.8μl、a-f1μl、a-r1μl、模板(puc57level1-kan-a)50ng、pbodnapolymerase1μl、无菌水至50μl。反应程序为:95℃预变性5min;95℃变性15s,55℃退火15s,72℃延伸90s,30个循环;最后72℃延伸反应10min。b,c,d,e片段获取方式与a片段一致。一级载体骨架的获取以puc57level2-amp-bsmbi为模板,以vector-f和vector-r为引物进行扩增,体系与获取a片段的体系一致。
之后,片段和载体进行磷酸化处理,具体的,将需要进行组装的片段和载体骨架混合起来进行磷酸化。反应体系为:10xt4pnkbuffer:5μl;片段abcde和一级载体骨架每个片段各3nm;10mmatp:5μl;t4polynucleotidekinase:1μl;total:50μl。
片段的加入量需要根据片段的大小和浓度,及其磷酸化产物回收效率进行计算后添加,保证各个片段的量符合后续lcr反应要求(每个片段需要3nm)。37℃反应30min后,按照纯化pcr产物的方式进行过柱回收或者乙醇沉淀法进行回收。lcr反应中dnaparts在片段和载体骨架磷酸化处理时已经混合在一起,因此在此步骤时只需要加入磷酸化后的回收产物。lcr体系为:dnaparts(a,b,c,d,e,一级载体骨架),3nmeach;10xampligasebuffer,2.5μl;ssdnabridgingoligo,30nmeach;dmso,8%(v/v);betaine,0.45m;ampligase,2μl;h2o至25μl。反应条件为:step1:94℃2min;step2:94℃10sec;step3:55℃30sec;step4:66℃60sec;repeat2-450cycles;step5:4℃hold。
其中ssdnabridgingoligo序列如下:
bridgingoligo1:
gcaacgatctgcatcagccatcgttcccttttcgctattgcctgggattacg
bridgingoligo2:
cacgtacgtttcatcggtttacccatcatctgttcgttatcaaacagttcaccgtgccagg
bridgingoligo3:
gctgactttcagattgctacgaccgcctgagacggtacacagataaacgtcacgattgtt
bridgingoligo4:
cgcgacggggtgcctgagaccatgtcgatgcgttgacctgaaatcagg
bridgingoligo5:
ttcgttgatcggcgaaaattcgacgcgagacgtacgcatttcgtgcgg
bridgingoligo6:
agggttcccgatagttctgcgtatcggttacaggttacaatcagcacgacaaatggaatacac
反应产物取2.5μl转化至top10感受态细胞,涂布于amp抗性显色平板。对白斑进行pcr验证,正确的克隆送测序。测序结果显示合成的基因序列正确。
实施例3:序列二的合成示例
对序列二(seqidno.21)的分析显示序列共含有1个bsai位点、3个bbsi位点、1个bsmbi位点,在进行长基因合成的过程中,二级组装采用bsaigoldengate或者bsmbigoldengate,一级组装采用bspqi酶切产物进行lcr反应。利用碱基tct将全长分成a,b,c共3个片段,如图10所示。将a,b,c三个一级片段的两端均加上bspqi的酶切识别位点,之后再次继续的分成二级片段,便于进行基因合成。二级片段分段的原则为:每个片段尽量等长但是每个片段不超过700bp;同一个片段内部没有大于20bp的重复;片段之间会有4bp的粘性末端,同一个一级片段内选择的粘性末端两两之间不能相同,且不能为回文序列。由此分成的二级的片段共12个,序列见(seqidno.22-seqidno.33)。一级和二级片段大小如图11所示。
该序列二级片段的合成过程与序列一相同。
序列二的的二级组装过程使用goldengate进行。其中a和b片段使用bsaigoldengate连接。c片段使用bsmbigoldengate连接。反应体系:二级片段各100ng、puc57level1-kan-bsai100ng、t4dnaligasebuffer(neb)2μl、bsai(neb)或者bsmbi(neb)1μl、t4dnaligase(neb)1μl、无菌水至20μl。bsaigoldengate反应条件:step1:37℃3min;step2:16℃5min;step1-step2共10个循环。step3:37℃15min;step4:55℃5min;step580℃5min;完成goldengate组装。bsmbigoldengate反应条件:step1:42℃2min;step2:16℃5min;step1-step2共20个循环。step4:55℃10min;step580℃10min;完成goldengate组装。将上述反应液中取出10μl转化至top10感受态细胞,涂布在kan抗性显色平板上。取两个白斑抽提质粒,进行酶切验证(如bspqi),正确的质粒命名为puc57level1-kan-a,puc57level1-kan-b,puc57level1-kan-c。
一级组装通过bspqi酶切lcr完成。具体的将puc57level2-amp-bspqi用bspqi进行酶切,酶切产物进行胶回收。puc57level1-kan-a,puc57level1-kan-b,puc57level1-kan-c可以分别用bspqi进行酶切,酶切产物分别进行胶回收。在此步骤中,可以将puc57level1-kan-a,puc57level1-kan-b,puc57level1-kan-c混合在一起酶切;进行混合酶切时需要保证每个质粒加入的摩尔数一致。
lcr体系为:dnaparts(a,b,c,d,e,一级载体骨架),3nmeach;10xampligasebuffer,2.5μl;ssdnabridgingoligo,30nmeach;dmso,8%(v/v);betaine,0.45m;ampligase,2μl;h2o至25μl。反应条件为:step1:94℃2min;step2:94℃10sec;step3:55℃30sec;step4:66℃60sec;repeat2-450cycles;step5:4℃hold。
其中ssdnabridgingoligo序列如下:
bridgingoligo1:
aaagatccgcttgacgagcctatatggaagacccttttcgctattgcctgggattacg
bridgingoligo2:
gacttgtatctagctatacgtgggcggcaagaagctgacctacagctgttgcgaactgttg
bridgingoligo3:
ggtgaccattgtgaaggcttaggtgttttagaagataattgtggcaatgctgatccacataagggt
bridgingoligo4:
tgtaaaagggttcccgatagttctgcgtaagactcttgtctactcaattcaactaaacgaaattttgtccttc
反应产物取2.5μl转化至top10感受态细胞,涂布于amp抗性显色平板。对白斑进行pcr验证,正确的克隆送测序。测序结果显示合成的基因序列正确。
sequencelisting
<110>南京金斯瑞生物科技有限公司
<120>一种长基因合成方法
<130>1
<160>33
<210>1
<211>2453
<212>dna
<213>人工序列
<223>载体puc57level1-kan-bsai
<400>1
tcgcgcgtttcggtgatgacggtgaaaacctctgacacatgcagctgccaacgcgagacc60
cacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttag120
ctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtgga180
attgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgccaagctt240
gcatgcaggcctctgcagtcgacgggcccgggatccgatatctagatgcattcgcgaggt300
accgagctcgaattcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgt360
tacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaaga420
ggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatggcgcctgat480
gcggtattttctccttacgcatctgtgcggtatttcacaccgcatatggtgcactctcag540
tacaatctgctctgatgccgcatagttaagccagccccgacaggtctcgccgatgagctc600
gctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaa660
ggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaa720
aggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggct780
ccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgac840
aggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttcc900
gaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttc960
tcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctg1020
tgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttga1080
gtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattag1140
cagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggcta1200
cactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaag1260
agttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttg1320
caagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctac1380
ggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatc1440
aaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaagcccaat1500
ctgaataatgttacaaccaattaaccaattctgattagaaaaactcatcgagcatcaaat1560
gaaactgcaatttattcatatcaggattatcaataccatatttttgaaaaagccgtttct1620
gtaatgaaggagaaaactcaccgaggcagttccataggatggcaagatcctggtatcggt1680
ctgcgattccgactcgtccaacatcaatacaacctattaatttcccctcgtcaaaaataa1740
ggttatcaagtgagaaatcaccatgagtgacgactgaatccggtgagaatggcaaaagtt1800
tatgcatttctttccagacttgttcaacaggccagccattacgctcgtcatcaaaatcac1860
tcgcatcaaccaaaccgttattcattcgtgattgcgcctgagcgaggcgaaatacgcgat1920
cgctgttaaaaggacaattacaaacaggaatcgaatgcaaccggcgcaggaacactgcca1980
gcgcatcaacaatattttcacctgaatcaggatattcttctaatacctggaatgctgttt2040
ttccggggatcgcagtggtgagtaaccatgcatcatcaggagtacggataaaatgcttga2100
tggtcggaagaggcataaattccgtcagccagtttagtctgaccatctcatctgtaacat2160
cattggcaacgctacctttgccatgtttcagaaacaactctggcgcatcgggcttcccat2220
acaagcgatagattgtcgcacctgattgcccgacattatcgcgagcccatttatacccat2280
ataaatcagcatccatgttggaatttaatcgcggcctcgacgtttcccgttgaatatggc2340
tcataacaccccttgtattactgtttatgtaagcagacagttttattgttcatgatgata2400
tatttttatcttgtgcaatgtaacatcagagattttgagacacgggccagagc2453
<210>2
<211>2453
<212>dna
<213>人工序列
<223>载体puc57-kan-bsmbi-free1
<400>2
tcgcgcgtttcggtgatgacggtgaaaacctctgacacatgcagctgccaacgcgagacg60
cacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttag120
ctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtgga180
attgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgccaagctt240
gcatgcaggcctctgcagtcgacgggcccgggatccgatatctagatgcattcgcgaggt300
accgagctcgaattcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgt360
tacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaaga420
ggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatggcgcctgat480
gcggtattttctccttacgcatctgtgcggtatttcacaccgcatatggtgcactctcag540
tacaatctgctctgatgccgcatagttaagccagccccgacacgtctcgccgatgagctc600
gctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaa660
ggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaa720
aggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggct780
ccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgac840
aggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttcc900
gaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttc960
tcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctg1020
tgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttga1080
gtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattag1140
cagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggcta1200
cactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaag1260
agttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttg1320
caagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctac1380
ggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatc1440
aaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaagcccaat1500
ctgaataatgttacaaccaattaaccaattctgattagaaaaactcatcgagcatcaaat1560
gaaactgcaatttattcatatcaggattatcaataccatatttttgaaaaagccgtttct1620
gtaatgaaggagaaaactcaccgaggcagttccataggatggcaagatcctggtatcggt1680
ctgcgattccgactcgtccaacatcaatacaacctattaatttcccctcgtcaaaaataa1740
ggttatcaagtgagaaatcaccatgagtgacgactgaatccggtgagaatggcaaaagtt1800
tatgcatttctttccagacttgttcaacaggccagccattacgctcgtcatcaaaatcac1860
tcgcatcaaccaaaccgttattcattcgtgattgcgcctgagcgaggcgaaatacgcgat1920
cgctgttaaaaggacaattacaaacaggaatcgaatgcaaccggcgcaggaacactgcca1980
gcgcatcaacaatattttcacctgaatcaggatattcttctaatacctggaatgctgttt2040
ttccggggatcgcagtggtgagtaaccatgcatcatcaggagtacggataaaatgcttga2100
tggtcggaagaggcataaattccgtcagccagtttagtctgaccatctcatctgtaacat2160
cattggcaacgctacctttgccatgtttcagaaacaactctggcgcatcgggcttcccat2220
acaagcgatagattgtcgcacctgattgcccgacattatcgcgagcccatttatacccat2280
ataaatcagcatccatgttggaatttaatcgcggcctcgacgtttcccgttgaatatggc2340
tcataacaccccttgtattactgtttatgtaagcagacagttttattgttcatgatgata2400
tatttttatcttgtgcaatgtaacatcagagattttgagacacgggccagagc2453
<210>3
<211>2710
<212>dna
<213>人工序列
<223>载体puc57-bsaifree
<400>3
tcgcgcgtttcggtgatgacggtgaaaacctctgacacatgcagctcccggagacggtca60
cagcttgtctgtaagcggatgccgggagcagacaagcccgtcagggcgcgtcagcgggtg120
ttggcgggtgtcggggctggcttaactatgcggcatcagagcagattgtactgagagtgc180
accatatgcggtgtgaaataccgcacagatgcgtaaggagaaaataccgcatcaggcgcc240
attcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcctcttcgctat300
tacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgccagggt360
tttcccagtcacgacgttgtaaaacgacggccagtgaattcgagctcggtacctcgcgaa420
tgcatctagatatcggatcccgggcccgtcgactgcagaggcctgcatgcaagcttggcg480
taatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaac540
atacgagccggaagcataaagtgtaaagcctggggtgcctaatgagtgagctaactcaca600
ttaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcat660
taatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcc720
tcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactca780
aaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagca840
aaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccatagg900
ctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccg960
acaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgtt1020
ccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctt1080
tctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggc1140
tgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtctt1200
gagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggatt1260
agcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggc1320
tacactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaa1380
agagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtt1440
tgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttct1500
acggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagatta1560
tcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaa1620
agtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatc1680
tcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataact1740
acgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagatccacgc1800
tcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagt1860
ggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagta1920
agtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtg1980
tcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagtt2040
acatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtc2100
agaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctctt2160
actgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattc2220
tgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataatacc2280
gcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaa2340
ctctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaac2400
tgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaa2460
aatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctt2520
tttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaa2580
tgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacct2640
gacgtctaagaaaccattattatcatgacattaacctataaaaataggcgtatcacgagg2700
ccctttcgtc2710
<210>4
<211>10654
<212>dna
<213>人工序列
<223>序列一
<400>4
atggctgatgcagatcgttgcctgatgtgtttccgtccggtgtgtgacctggtttgtccg60
gctgatgttcgtccggcggctgttatccaggctctgcatctggataacgaatcaggcgcg120
ggtctgcgtctgggcgacggtacggcatgcctgaattgcaatgatccgaaatgcgaaaaa180
gcgtgtgcacgcggccgtattgatcatgcaattcagattcgtgacatctgccgtgccctg240
agcggtcaagaaaagaaacaagttaacggtaaagcggatctgagcgtggacttctgtggt300
gtgcgttgcgaaaacccgtttctgctggcttccagcccggtcgccagcagttacgaaatg360
tgctgtcgcgcgtttgaccagggttgggcaggtgttgcgtacaaaaccattagcttttat420
caaacgcgcgaagtgagcccgcgtttcgactgcctgccgccgcgttcatcgtcgagcttt480
cagggttttaaaaacctggaacagctgagcccgtataccgccgaagaaaacttcgatatt540
ctgtgtcgcctgaaagaaaaatatccggaaaaagtgatcattgcgtctatcatgggtcag600
acgaccgaagaatggaccacgctggcgcgtatggcagaagaagcgggcgcagacatggtg660
gaatgcaacttcagctgtccgcagatggcgaaacagggcctgggtagcgacattggccag720
tccccggaactgatcagcctgtatacccagacgacccgtaaaggttgtggtctgccgatt780
atcgcgaaaatgaccccgaacgcaggtaatatggaaccgctggcagtcgcggcagtgacg840
tcaggcgcagatagcgtggcagcgatcaacacgattaaatccatcacccgtatccatccg900
gaaaactacagctcgtttccggatattgaaggtaaaagcgctgtcggtggctacagcggt960
cgtgcggtgaaaccgattgcgctgcgtttcattcgcgatctggcggtgtatccgccgctg1020
gcaggtgttagcctgtgcggtattggcggtattacgacctggcgtgatgcgatggatttt1080
ctgctgctgggttgtgataccgtgcaagtttgtaccagcgtgatggaatacggttatcgc1140
atcatcgaccacctgaaagaaggtctgtcgatctatatgcaagaaaaaggctacaatcgc1200
gtcgaagaatttcgtggcaaagcgctgccgcatatcgtcctgccggaacagctgaaccgt1260
aaccgccgtctggtttgcgaaatcgatcgtcaatcgtgtatcggttgtggccgttgctat1320
ctgtcgtgtcaagatggcggtcatcaggcaatccgttgggacggtcatcgtccgcaggtg1380
gaagaaaccaaatgcgtgggctgtggtctgtgcaccctggtctgcccgacggaagcgatt1440
ggtctgaaagaagtccacgacattggctaatatgaatcctatctaataatcttgtattat1500
gaaacaaaccgcaccgctgagcaaatcacagtatggcatctatgtcgaatgtatgaacca1560
cgttggcgaaatctattataacaccgcattcgtcttccgcctggacggctcgctggatgg1620
tcaaaaactgtgcaaagccgtggaagctacggtgatggcccacccggccctgtttacccg1680
cattgctctgaacgatgataatgaaccggtgcagagcgttggtctgtccgaagaaacctg1740
gagcctggacgtggaaccggtcgaagacattgatcaagcactgtcaggcctgattcaacc1800
gttcgatctgcataaagatcgcctgtttcgcatccgtctgttcaaagatgcagaatattt1860
tcacctgtttgttgacattcatcacatcgtgaacgatggcacgtcacaggcgatctttct1920
gcaagacattgaaacggcatataacggcgaaccgattgctccggaatgcatcacgctgtg1980
tgaacaggcgaccgaagaagttggcctgcgtgcaaccgctgaatttgaagaaggcaaaca2040
atggtacgcacgcaattttgattgtgcggatacgtttacgggcctgaccccggatctgga2100
agaagaaggccgtgaagaaggcacgctgcgccgcacgctggccgttaacctggaagcagt2160
ggatgcgttttgtaaagaacacggcatctttaaatcgaactttttcacgatggcgtatgc2220
atttctgctggcaaaatacaacaacgaacaggaatctttcttcacgatggtgtataacgg2280
ccgctcagacaaacgtctggctcgtacgatcggcatgttcgtgaaaagcgtcccggtttt2340
cacgaaattcacgagcgatacgtcagtgatggaactgctgcgtaatggccaagaacaaat2400
gggtggctgtcgcaaacatgaagcatacagcttcgtggattttatgcaggatattgcacc2460
gcagtacgacaatatgtttgcctggcacggtgaactgtttgataacgaacagatgatggg2520
taaaccgatgaaacgtacgtggctgatggattctccgctggacatccaactgtacctgaa2580
agcgtttattgaaaatggtaaatgtcagattgtggcagaatacaatgcaaaagcgtactc2640
acaagaactggtctgccaattcatggaatcctatgaagcggtcgtcaatggctttctgag2700
ccaagaatttctgcgtgatattagcatcgtgaccgaatcgcagaccacggtcctggactc2760
ctttaatcgcaccgactgcgaatatgatgacacccagacgatcgtgagtctgttccgtcg2820
ccaggctgaagccaccccggataatgtggcactgatctataaagataaacgttttaccta2880
tagccagatcgacgaaattagcgaccgcatcgcggcacgcatcgcttcgatgggcctggg2940
cgccgaagacgtggtttcaattctgatttcacgttgcgaatggatgggcatcattccgat3000
gggtgtgctgaaagcaggctgcgcgtaccagccgctggacccgacgtacccgaaagaacg3060
cctgaacttcatgatgaaagatgcgggtgtgtcactgctgatcgcggatgaaggcctgcg3120
tccgctggcagatgaatttcaaggtgaaacgctgtttaccggtgaactgatggatctgcc3180
gcgtgcggaagtgcaaccggttgcaccgagtccgtctagcctgtttatcctgctgtatac3240
gagcggctcgaccggtattccgaaaggttgtcagctggaacatggcaatctggttgcttt3300
ctgtcactggtatcagtcgtactacggtctgcatgcgggtgataaagtggcagcatacgc3360
atctttcggtttcgatgcttccatgatggatatgtatccggcactgacctgcggcgcaac3420
ggtgtgcatcattccggaagaaatccgtctggacctgatggcgctgaatgaatatctgga3480
acaaaatggtgtcacgcactcgtttatgaccacgcaggtcggctatcagtttgcaaccag3540
cattgaaaatcgctcgctgcgtcatctgtccaccggcggcgaaaaactggtttcgctggc3600
accgccgcaagaatataatttttataatgtgtatggtccgaccgaaaccacgattctggt3660
tacggcataccgtatcacgcaaaaactgaaagaaatcccgattggtaaaccgctggataa3720
tatgaaactgtacattgtggataatcatggccaccgcctgccggtgggtgcggctggtga3780
actgtggatttccggcccgcaggtgtcacgcggttacctgaaccgtccggaaaaaaccca3840
ggaagtgtatatcgcgaacccgttcaccgacaatgaaaaatatgcgcgtatctaccgctc3900
aggcgatgtggtccgctatctgccgtcaggcgacatccaatttgtgggccgtcgtgatgg3960
tcaagtgaaaattcgtggctttcgcatcgaactgaaagaagtcgaaggtatcatccgcga4020
atttccgggtattaaagacgccacggttcaggcattcgatgaagaaggtggtggcaaatt4080
catcgcagcgtatatcgtttcggatgaacaaatcgacattgaagcgctgaaccgctttat4140
cctggaagaaaaaccgccgtatatggtgccggcagttaccatgcagattgatagcattcc4200
gctgaaccaaaaccaaaaagttaacaaacgtgtcctgccgaaaccggaaaagaaaccggt4260
gtccgttgccgaaggtaatgtgccgatgaatgtgctggaaacggaactgcatcaactgat4320
cgcggccatcgtcaatcatgaaaactttggcgtcaccacggtgctgggctatgcaggcct4380
gaccagcatcacggcaattaaactggcagtgcaaatcaacaaacgctatggcgttgtggt4440
ggacgcgaaatcgctggttaaaaatggtacgctgcaaagcatcgaaaacgaaatcctgcg4500
taaaatgctgcacgatgcgtcggcggacggtcgtcaggaagaagcggtgaaaaaggaaat4560
tgttacgtcggcgccgctgtcgtacgcgcaaaccggtgtctatttcgaatgcatgaaaaa4620
cccgtttagcaccgtttataacatcccgtgcctgctgacctatccgagcggtacggacgc4680
atgccaactggcagatgcagtgaaaaccgttatccatgcacatacggcgatgaacattcg4740
ttttgaaacccagggcgaaggtgttcgtcagtatctggatgccgacctggcgattcaagt4800
tccggtcaaagcgatgacggaagaagaactgaccctgtacaaagaagaatttgtgcgtcc4860
gtttaacctgcaaaaagccccgctgtggcgttttgaagtcatcgaaaccccgtcggccgt4920
gcacctgctgatggatgtgcatcacctgatctttgacggcggttcggttgacctgtttat4980
tcgtcaggttagcgaagcactggaaggccaaaccgtttcgaaagaaacgtataccttcct5040
ggatttcgtgcacgaccaaatgcaggccgaacagaccgaatccttccgtaaagcggaaaa5100
attcttcgcagaaaaactgcaagcatgcgaaggtgcgtcggaagttccggccgatctgca5160
aaaaaccgataaagaatcacgtatcggtgaagcatgctgtccggtgaatcatgaagaagt5220
ggcacgcttctgtcgtagccacgacattaccccggcacacctgttctacgcagcagttac5280
gtatgttgtgtcccgttacacgaacaatcgtgacgtttatctgtgtaccgtctcaggcgg5340
tcgtagcaatctgaaagtcagcgaaaccgtgggcatgtttgtgaataccctggccctggg5400
tctgtccgttgacgatgtcacggttgaagacttcctgcaaacggcgagccgtacctttac5460
cgaaaccctggaaaacgaaaactatccgttcgcgcgcatcgcatcagattatggcttcca5520
gccggccattgcttacgcttatcaagtcggtgtgctgtccgcttattcgctgaaaggtca5580
atcaattggtcaggaagtcctggaactggacgtcccgaaatttaaaattaacatccagat5640
ccagtcacaaggtgtggtggtggaatacgacgatgccctgtattcccgttcggtcggcga5700
agcactggcagaaagcattgtcgccgtggttgaacgcatgatgcaaatgccgtccgaacg5760
tattcgttcactgagcatcgtgagccgtaaacaggctacggcactggacaaagttcgcac5820
gacgggcagcggtgaatctccgtttcgcctgttccacgaatgcattcaccattatgcggt5880
ggtggcgccggatcgcgaagccctggttgcgtgcgatgcaacgttcacctatgctgaaat5940
ggatgaactgaccgatcgcatcgcaagtggtctgcgcgctcgcggtgtgctgccgcgcga6000
ccgtgtggcgctgctgctgccgcgtagctcgcgcctgattctgtcgctgtttggcgtgct6060
gaaagccgaagcatcttacattccgtgtgatccggaatatccggctgatcgcgtcaaata6120
tatcctggaagattcgggctcagcatacatcatcacggatggcaatcatgctaaaggcct6180
gccgaaagacaaagtgatcgatgtggaaggcctggtcaaacatccgattgaacgctgggc6240
accgtcgattacgagtgacgatctggcctatattatttatacgtctggctcgaccggtaa6300
accgaaaggtgtgatgctgcgtcatgaaggtatttgtaactatctgaccgcgcacccggc6360
aaatgtgctggcacatgcagtgcaggccgatacggaacgtatcctgagtgtgacgacgat6420
tagctttgacgcggcgctgcaagacattggcacggcattctttaatggcaaaaccctggt6480
cctggctacggaagaacaggcaaataacccgattgaactggcacgcctgatttcaggtca6540
acgcatcgacatggtctcaggcaccccgtcgcgctggctgacgtggctgaccagcggcga6600
ctttgctgaagcaatccgttacattcgcatcgctcgtgcgggcggtgaaaaattctccgg6660
tcagctgctggaactgctgaaagcgaaaacgtcggcgcgcatttttaactgctatggccc6720
gacggaaaccaccgtcgcctcaaataataaagaactgacgcacgcggtttcggtgaccgt6780
tggtaaaccgcagctgaacgttaaagaatttgtggttgatcaggacggcaatgaactgcc6840
ggtcggtgttgtcggcgaactgtatattggcggtcgtggcgtggcgcgcggttacaataa6900
tctggatgacatgacccgcgaacgcttcatcgcctaccagggcgaacgtgtttataaatc6960
cggcgactacgcgaaatggaacgcggatggcgacatcgttatcctgggccgcaccgacaa7020
tcaaatcaaactgcgtggtctgcgcattgaactgggtgaaattgaaaacgtgatgctgaa7080
agtcgaaggcctggaaaaagtcgtgatcctgattcgtaaactgaacgacaaagaacatct7140
gtgtgcgtactacacggccgatcgcccgatcgcgccggatgctctgaaagcagaaatctc7200
aaaatcgctgacccaatatatggttccgaccgcatatctgcaagtcgataaaatgccgat7260
gaccccgtcgggcaaaaccgacgtgaaagcgctgccggaaccggtgctggccgtgtctag7320
tgcgtatgaagccccggccaatccgacggaacatattttctgcgatatttttgcaagcgt7380
gctgcaaatcgacaaagtcggcgcaaccgataacttcttcgaaagcggtggcaccagcct7440
ggtggtcacgcgcgttattattgaagcggacaaagcaggtctgcgcatcacgtacggtga7500
cgtgttcgcgcatccgaccccgcgtcaactggcacgtctggtcaacggtgataaagaaac7560
cgacggtcaggatgaagttgcagactatgactatggtatcattaactcgctgctgaaaag7620
caatacgctggaagcatttaaaaagggcgaacgtctgtcgctgggcaatgtgctgctgac7680
cggcgctaccggctatctgggtattcacatcctgaaagaactgatcggttcggacattgc7740
acacatctattgcctggtgcgtgacaaaaacctggaagcggcagaacgccgtctgaaaac7800
cctgctgttttattaccatgatgacgaattttcttcactgttcggtaaccgtattcatct7860
ggtcctgggtgatgtgacccaaaccatcgacgaaacgctgccggttgacaccgtgttcaa7920
ttgcgcagccgttgtcaaacatttcagcgaaggcacgttcatcgaagacgttaatatcgg7980
tggcgcccagcattgtgtggatttctgcctgaaaaagaatgcacgtctggtgcatatctc8040
taccgcctccacccgtggtctgtcggttaatggtattccggactcccaggaagtgtttac8100
cgaacaaaaactgtatatgggtcagtatctgggtaacaaatatatctacagcaaattcat8160
ggcggaacgtctgatcctggaagctattgccacgcagggcctgagtgcaaaaattatgcg8220
cgtgggtaacctggccgcgcgcagcaccgatggcgaatttcaaatcaactttctgacgaa8280
tagctttatgggccgcattaaagtgtacaatatgctgggttgctgcccgcacgaaatgcg8340
tacgtctcgcgtcgaattttcgccgatcaacgaagtgagcaaagcgattctgctgctggc8400
gagcaccccgaaagaatgctgcgtctttcatccgtttaacattcacacgcagttcctggg8460
cgacgtcctggaagtgctgaaatcggtcacgggcggtattgactttgttgaaatggaaca8520
atttgaagaagtgatggaaaaagcaaaatcagacccgaccaaagcaaaaatcctgtcctc8580
gctgctggcatatcaggacatggcgcacggccaaaaaacgtctgacgtcaatcgcgataa8640
ttcgtacaccacccaggttctgtttcgtctgggctttaattggagcgccacgtcttggga8700
ttacattgaacgtatgctgcacgctatctgcggtctgggtttctttgacatctaaatgaa8760
agaaaccaatgaaaaagaccgtgaactgagcgttgtgttctggcgttacctgtggagcag8820
catcctgattagcctgtcggcgtcggtgggcaccgttgtcgatggtatcattgtgggcaa8880
tctgattggtgaagatggtgtctcggcagtgaacctgagcagtccgatgattcagctgct8940
gttcaccatcagcctggtcgttgcatcaggcgcgggcatgctgatcggttttgcactggg9000
ccaaaaagacggtcgtcgtgtccgctacatttttaccctgagcatggtggcgtcgctgct9060
ggttggtgtgctgtttacgggtgcgggtttttacttctcggattctattacccgcgcatt9120
ttgccacgatgattacctgttcacgtacacccatgattatctgaaagtgatcctgattgg9180
cgcgccgagcttcatgatgctgtgggaaatcagcgcagtgattggtgtggacggctcgcc9240
gcgtctggcatcgctggcgattatcgtggataatctggtcaacctgtgtctggacattgt9300
gtttatcgaatatgtgggctggggcattgcgggctcggcagcagcgaccgttgtgggtca9360
cctggtgggcattctgatcatgctgcgtcattttaaaggtaaaggcaattcgctgacgtt9420
ttcgctgacgcacgataaaccggaatttctgaacatcgtgctgcaaggcgcgccgctggc9480
gatcgcatccgtgtgcctgaccctgctgctggtgtcagcaaatcacgtgtttctgagtgc9540
gaaaggccaaaatggtatcttcgtgtttgctgtgtgcatgaacctgctgcaaatttacaa9600
tatgtatatcagcggcacctgtcgtaccctgcaatcactgggtgcggtgcagattggcaa9660
aaatgatgaccatgcgttcagtctgatcctgcgcaaatcatttctgttcattaccgtgag9720
catggctgtgacctgcctgctgatttgcctgtttccgggtgtgatttcgcgtgcctttgg9780
tgcagatagcccggaagtgattgcggaatgcaatcatgtcttccgcatttttgcggtgtc9840
cttcattccgttttgttacatctacctgattatgatcgtttataaactgtacaaacagga9900
ttgcatggccctgttcattagctttgcactgtcgctgaccgtgatcccggtgctgctgct9960
gtttttccactatgcgccgcagtatctgtggtacagctatctggtggcgtacctgctgga10020
aatcgtcgcaatctttgtgctgcataaactgacccacgctcgtctgtccctgtgaaatga10080
tatggtgctgctgacggaagacatctggagttttaacctggacgctgcctggcaagaaat10140
ctcgggtcaacgccgcgaatacgccctgaaatatcgtaccgaactggatcgtcgcctgtg10200
tgtgcgtgcatatctgctgctgtgtgaaggtctgcgtaaaggctatggtattaccagcgt10260
gccgctgtttgaatttggcaaatacggtaaaccgatgctggtcggttatccggatattca10320
tttcagcatttcgcattgcccggaagcagtgatctgtgtgctggatgacaatccggtggg10380
cgtcgatattgaactggtgtcgagctttgacgaacaggttgcgcgttatgcgatgaacca10440
ggaagaactgcgccagatcaaaagctcttcacgcccggatgtggaatttgcgtgtctgtg10500
gacccgtaaagaagccgtgctgaaacagtccggttttggcctgagcgataacgtgaaaga10560
agttctgaccgcacatccgctgccggtggaaacgtttatttcccgcaacctgcattatgt10620
gtattccatttgtcgtgctgattgtaacctgtaa10654
<210>5
<211>668
<212>dna
<213>人工序列
<223>序列一二级片段a1
<400>5
agtcggtctcgaacgtctcgaacgatggctgatgcagatcgttgcctgatgtgtttccgt60
ccggtgtgtgacctggtttgtccggctgatgttcgtccggcggctgttatccaggctctg120
catctggataacgaatcaggcgcgggtctgcgtctgggcgacggtacggcatgcctgaat180
tgcaatgatccgaaatgcgaaaaagcgtgtgcacgcggccgtattgatcatgcaattcag240
attcgtgacatctgccgtgccctgagcggtcaagaaaagaaacaagttaacggtaaagcg300
gatctgagcgtggacttctgtggtgtgcgttgcgaaaacccgtttctgctggcttccagc360
ccggtcgccagcagttacgaaatgtgctgtcgcgcgtttgaccagggttgggcaggtgtt420
gcgtacaaaaccattagcttttatcaaacgcgcgaagtgagcccgcgtttcgactgcctg480
ccgccgcgttcatcgtcgagctttcagggttttaaaaacctggaacagctgagcccgtat540
accgccgaagaaaacttcgatattctgtgtcgcctgaaagaaaaatatccggaaaaagtg600
atcattgcgtctatcatgggtcagacgaccgaagaatggaccacgctggcgcgtatgcga660
gaccgact668
<210>6
<211>588
<212>dna
<213>人工序列
<223>序列一二级片段a2
<400>6
agtcggtctcgtatggcagaagaagcgggcgcagacatggtggaatgcaacttcagctgt60
ccgcagatggcgaaacagggcctgggtagcgacattggccagtccccggaactgatcagc120
ctgtatacccagacgacccgtaaaggttgtggtctgccgattatcgcgaaaatgaccccg180
aacgcaggtaatatggaaccgctggcagtcgcggcagtgacgtcaggcgcagatagcgtg240
gcagcgatcaacacgattaaatccatcacccgtatccatccggaaaactacagctcgttt300
ccggatattgaaggtaaaagcgctgtcggtggctacagcggtcgtgcggtgaaaccgatt360
gcgctgcgtttcattcgcgatctggcggtgtatccgccgctggcaggtgttagcctgtgc420
ggtattggcggtattacgacctggcgtgatgcgatggattttctgctgctgggttgtgat480
accgtgcaagtttgtaccagcgtgatggaatacggttatcgcatcatcgaccacctgaaa540
gaaggtctgtcgatctatatgcaagaaaaaggctacacgagaccgact588
<210>7
<211>666
<212>dna
<213>人工序列
<223>序列一二级片段a3
<400>7
agtcggtctcgtacaatcgcgtcgaagaatttcgtggcaaagcgctgccgcatatcgtcc60
tgccggaacagctgaaccgtaaccgccgtctggtttgcgaaatcgatcgtcaatcgtgta120
tcggttgtggccgttgctatctgtcgtgtcaagatggcggtcatcaggcaatccgttggg180
acggtcatcgtccgcaggtggaagaaaccaaatgcgtgggctgtggtctgtgcaccctgg240
tctgcccgacggaagcgattggtctgaaagaagtccacgacattggctaatatgaatcct300
atctaataatcttgtattatgaaacaaaccgcaccgctgagcaaatcacagtatggcatc360
tatgtcgaatgtatgaaccacgttggcgaaatctattataacaccgcattcgtcttccgc420
ctggacggctcgctggatggtcaaaaactgtgcaaagccgtggaagctacggtgatggcc480
cacccggccctgtttacccgcattgctctgaacgatgataatgaaccggtgcagagcgtt540
ggtctgtccgaagaaacctggagcctggacgtggaaccggtcgaagacattgatcaagca600
ctgtcaggcctgattcaaccgttcgatctgcataaagatcgcctgtttcgcatcccgaga660
ccgact666
<210>8
<211>715
<212>dna
<213>人工序列
<223>序列一二级片段a4
<400>8
agtcggtctcgatccgtctgttcaaagatgcagaatattttcacctgtttgttgacattc60
atcacatcgtgaacgatggcacgtcacaggcgatctttctgcaagacattgaaacggcat120
ataacggcgaaccgattgctccggaatgcatcacgctgtgtgaacaggcgaccgaagaag180
ttggcctgcgtgcaaccgctgaatttgaagaaggcaaacaatggtacgcacgcaattttg240
attgtgcggatacgtttacgggcctgaccccggatctggaagaagaaggccgtgaagaag300
gcacgctgcgccgcacgctggccgttaacctggaagcagtggatgcgttttgtaaagaac360
acggcatctttaaatcgaactttttcacgatggcgtatgcatttctgctggcaaaataca420
acaacgaacaggaatctttcttcacgatggtgtataacggccgctcagacaaacgtctgg480
ctcgtacgatcggcatgttcgtgaaaagcgtcccggttttcacgaaattcacgagcgata540
cgtcagtgatggaactgctgcgtaatggccaagaacaaatgggtggctgtcgcaaacatg600
aagcatacagcttcgtggattttatgcaggatattgcaccgcagtacgacaatatgtttg660
cctggcacggtgaactgtttgataacgaacagacgagacgccgacgagaccgact715
<210>9
<211>752
<212>dna
<213>人工序列
<223>序列一二级片段b1
<400>9
agtcggtctcgaacgtctcgcagatgatgggtaaaccgatgaaacgtacgtggctgatgg60
attctccgctggacatccaactgtacctgaaagcgtttattgaaaatggtaaatgtcaga120
ttgtggcagaatacaatgcaaaagcgtactcacaagaactggtctgccaattcatggaat180
cctatgaagcggtcgtcaatggctttctgagccaagaatttctgcgtgatattagcatcg240
tgaccgaatcgcagaccacggtcctggactcctttaatcgcaccgactgcgaatatgatg300
acacccagacgatcgtgagtctgttccgtcgccaggctgaagccaccccggataatgtgg360
cactgatctataaagataaacgttttacctatagccagatcgacgaaattagcgaccgca420
tcgcggcacgcatcgcttcgatgggcctgggcgccgaagacgtggtttcaattctgattt480
cacgttgcgaatggatgggcatcattccgatgggtgtgctgaaagcaggctgcgcgtacc540
agccgctggacccgacgtacccgaaagaacgcctgaacttcatgatgaaagatgcgggtg600
tgtcactgctgatcgcggatgaaggcctgcgtccgctggcagatgaatttcaaggtgaaa660
cgctgtttaccggtgaactgatggatctgccgcgtgcggaagtgcaaccggttgcaccga720
gtccgtctagcctgtttatcccgagaccgact752
<210>10
<211>680
<212>dna
<213>人工序列
<223>序列一二级片段b2
<400>10
agtcggtctcgatcctgctgtatacgagcggctcgaccggtattccgaaaggttgtcagc60
tggaacatggcaatctggttgctttctgtcactggtatcagtcgtactacggtctgcatg120
cgggtgataaagtggcagcatacgcatctttcggtttcgatgcttccatgatggatatgt180
atccggcactgacctgcggcgcaacggtgtgcatcattccggaagaaatccgtctggacc240
tgatggcgctgaatgaatatctggaacaaaatggtgtcacgcactcgtttatgaccacgc300
aggtcggctatcagtttgcaaccagcattgaaaatcgctcgctgcgtcatctgtccaccg360
gcggcgaaaaactggtttcgctggcaccgccgcaagaatataatttttataatgtgtatg420
gtccgaccgaaaccacgattctggttacggcataccgtatcacgcaaaaactgaaagaaa480
tcccgattggtaaaccgctggataatatgaaactgtacattgtggataatcatggccacc540
gcctgccggtgggtgcggctggtgaactgtggatttccggcccgcaggtgtcacgcggtt600
acctgaaccgtccggaaaaaacccaggaagtgtatatcgcgaacccgttcaccgacaatg660
aaaaatatgcgagaccgact680
<210>11
<211>721
<212>dna
<213>人工序列
<223>序列一二级片段b3
<400>11
agtcggtctcgtatgcgcgtatctaccgctcaggcgatgtggtccgctatctgccgtcag60
gcgacatccaatttgtgggccgtcgtgatggtcaagtgaaaattcgtggctttcgcatcg120
aactgaaagaagtcgaaggtatcatccgcgaatttccgggtattaaagacgccacggttc180
aggcattcgatgaagaaggtggtggcaaattcatcgcagcgtatatcgtttcggatgaac240
aaatcgacattgaagcgctgaaccgctttatcctggaagaaaaaccgccgtatatggtgc300
cggcagttaccatgcagattgatagcattccgctgaaccaaaaccaaaaagttaacaaac360
gtgtcctgccgaaaccggaaaagaaaccggtgtccgttgccgaaggtaatgtgccgatga420
atgtgctggaaacggaactgcatcaactgatcgcggccatcgtcaatcatgaaaactttg480
gcgtcaccacggtgctgggctatgcaggcctgaccagcatcacggcaattaaactggcag540
tgcaaatcaacaaacgctatggcgttgtggtggacgcgaaatcgctggttaaaaatggta600
cgctgcaaagcatcgaaaacgaaatcctgcgtaaaatgctgcacgatgcgtcggcggacg660
gtcgtcaggaagaagcggtgaaaaaggaaattgttacgtcggcgccgctgcgagaccgac720
t721
<210>12
<211>790
<212>dna
<213>人工序列
<223>序列一二级片段b4
<400>12
agtcggtctcggctgtcgtacgcgcaaaccggtgtctatttcgaatgcatgaaaaacccg60
tttagcaccgtttataacatcccgtgcctgctgacctatccgagcggtacggacgcatgc120
caactggcagatgcagtgaaaaccgttatccatgcacatacggcgatgaacattcgtttt180
gaaacccagggcgaaggtgttcgtcagtatctggatgccgacctggcgattcaagttccg240
gtcaaagcgatgacggaagaagaactgaccctgtacaaagaagaatttgtgcgtccgttt300
aacctgcaaaaagccccgctgtggcgttttgaagtcatcgaaaccccgtcggccgtgcac360
ctgctgatggatgtgcatcacctgatctttgacggcggttcggttgacctgtttattcgt420
caggttagcgaagcactggaaggccaaaccgtttcgaaagaaacgtataccttcctggat480
ttcgtgcacgaccaaatgcaggccgaacagaccgaatccttccgtaaagcggaaaaattc540
ttcgcagaaaaactgcaagcatgcgaaggtgcgtcggaagttccggccgatctgcaaaaa600
accgataaagaatcacgtatcggtgaagcatgctgtccggtgaatcatgaagaagtggca660
cgcttctgtcgtagccacgacattaccccggcacacctgttctacgcagcagttacgtat720
gttgtgtcccgttacacgaacaatcgtgacgtttatctgtgtaccgtctcaggcgccgac780
gagaccgact790
<210>13
<211>634
<212>dna
<213>人工序列
<223>序列一二级片段c1
<400>13
agtcggtctcgaacgcgtctcaggcggtcgtagcaatctgaaagtcagcgaaaccgtggg60
catgtttgtgaataccctggccctgggtctgtccgttgacgatgtcacggttgaagactt120
cctgcaaacggcgagccgtacctttaccgaaaccctggaaaacgaaaactatccgttcgc180
gcgcatcgcatcagattatggcttccagccggccattgcttacgcttatcaagtcggtgt240
gctgtccgcttattcgctgaaaggtcaatcaattggtcaggaagtcctggaactggacgt300
cccgaaatttaaaattaacatccagatccagtcacaaggtgtggtggtggaatacgacga360
tgccctgtattcccgttcggtcggcgaagcactggcagaaagcattgtcgccgtggttga420
acgcatgatgcaaatgccgtccgaacgtattcgttcactgagcatcgtgagccgtaaaca480
ggctacggcactggacaaagttcgcacgacgggcagcggtgaatctccgtttcgcctgtt540
ccacgaatgcattcaccattatgcggtggtggcgccggatcgcgaagccctggttgcgtg600
cgatgcaacgttcacctatgctgcgagaccgact634
<210>14
<211>657
<212>dna
<213>人工序列
<223>序列一二级片段c2
<400>14
agtcggtctcggctgaaatggatgaactgaccgatcgcatcgcaagtggtctgcgcgctc60
gcggtgtgctgccgcgcgaccgtgtggcgctgctgctgccgcgtagctcgcgcctgattc120
tgtcgctgtttggcgtgctgaaagccgaagcatcttacattccgtgtgatccggaatatc180
cggctgatcgcgtcaaatatatcctggaagattcgggctcagcatacatcatcacggatg240
gcaatcatgctaaaggcctgccgaaagacaaagtgatcgatgtggaaggcctggtcaaac300
atccgattgaacgctgggcaccgtcgattacgagtgacgatctggcctatattatttata360
cgtctggctcgaccggtaaaccgaaaggtgtgatgctgcgtcatgaaggtatttgtaact420
atctgaccgcgcacccggcaaatgtgctggcacatgcagtgcaggccgatacggaacgta480
tcctgagtgtgacgacgattagctttgacgcggcgctgcaagacattggcacggcattct540
ttaatggcaaaaccctggtcctggctacggaagaacaggcaaataacccgattgaactgg600
cacgcctgatttcaggtcaacgcatcgacatggtcttgagacgccgacgagaccgac657
<210>15
<211>632
<212>dna
<213>人工序列
<223>序列一二级片段d1
<400>15
agtcggtctcgaacgtctcagtctcaggcaccccgtcgcgctggctgacgtggctgacca60
gcggcgactttgctgaagcaatccgttacattcgcatcgctcgtgcgggcggtgaaaaat120
tctccggtcagctgctggaactgctgaaagcgaaaacgtcggcgcgcatttttaactgct180
atggcccgacggaaaccaccgtcgcctcaaataataaagaactgacgcacgcggtttcgg240
tgaccgttggtaaaccgcagctgaacgttaaagaatttgtggttgatcaggacggcaatg300
aactgccggtcggtgttgtcggcgaactgtatattggcggtcgtggcgtggcgcgcggtt360
acaataatctggatgacatgacccgcgaacgcttcatcgcctaccagggcgaacgtgttt420
ataaatccggcgactacgcgaaatggaacgcggatggcgacatcgttatcctgggccgca480
ccgacaatcaaatcaaactgcgtggtctgcgcattgaactgggtgaaattgaaaacgtga540
tgctgaaagtcgaaggcctggaaaaagtcgtgatcctgattcgtaaactgaacgacaaag600
aacatctgtgtgcgtactacacgagaccgact632
<210>16
<211>584
<212>dna
<213>人工序列
<223>序列一二级片段d2
<400>16
agtcggtctcgtacacggccgatcgcccgatcgcgccggatgctctgaaagcagaaatct60
caaaatcgctgacccaatatatggttccgaccgcatatctgcaagtcgataaaatgccga120
tgaccccgtcgggcaaaaccgacgtgaaagcgctgccggaaccggtgctggccgtgtcta180
gtgcgtatgaagccccggccaatccgacggaacatattttctgcgatatttttgcaagcg240
tgctgcaaatcgacaaagtcggcgcaaccgataacttcttcgaaagcggtggcaccagcc300
tggtggtcacgcgcgttattattgaagcggacaaagcaggtctgcgcatcacgtacggtg360
acgtgttcgcgcatccgaccccgcgtcaactggcacgtctggtcaacggtgataaagaaa420
ccgacggtcaggatgaagttgcagactatgactatggtatcattaactcgctgctgaaaa480
gcaatacgctggaagcatttaaaaagggcgaacgtctgtcgctgggcaatgtgctgctga540
ccggcgctaccggctatctgggtattcacatcccgagaccgact584
<210>17
<211>671
<212>dna
<213>人工序列
<223>序列一二级片段d3
<400>17
agtcggtctcgatcctgaaagaactgatcggttcggacattgcacacatctattgcctgg60
tgcgtgacaaaaacctggaagcggcagaacgccgtctgaaaaccctgctgttttattacc120
atgatgacgaattttcttcactgttcggtaaccgtattcatctggtcctgggtgatgtga180
cccaaaccatcgacgaaacgctgccggttgacaccgtgttcaattgcgcagccgttgtca240
aacatttcagcgaaggcacgttcatcgaagacgttaatatcggtggcgcccagcattgtg300
tggatttctgcctgaaaaagaatgcacgtctggtgcatatctctaccgcctccacccgtg360
gtctgtcggttaatggtattccggactcccaggaagtgtttaccgaacaaaaactgtata420
tgggtcagtatctgggtaacaaatatatctacagcaaattcatggcggaacgtctgatcc480
tggaagctattgccacgcagggcctgagtgcaaaaattatgcgcgtgggtaacctggccg540
cgcgcagcaccgatggcgaatttcaaatcaactttctgacgaatagctttatgggccgca600
ttaaagtgtacaatatgctgggttgctgcccgcacgaaatgcgtacgtctcgcgtcccga660
cgagaccgact671
<210>18
<211>833
<212>dna
<213>人工序列
<223>序列一二级片段e1
<400>18
agtcggtctcgaacgcgtctcgcgtcgaattttcgccgatcaacgaagtgagcaaagcga60
ttctgctgctggcgagcaccccgaaagaatgctgcgtctttcatccgtttaacattcaca120
cgcagttcctgggcgacgtcctggaagtgctgaaatcggtcacgggcggtattgactttg180
ttgaaatggaacaatttgaagaagtgatggaaaaagcaaaatcagacccgaccaaagcaa240
aaatcctgtcctcgctgctggcatatcaggacatggcgcacggccaaaaaacgtctgacg300
tcaatcgcgataattcgtacaccacccaggttctgtttcgtctgggctttaattggagcg360
ccacgtcttgggattacattgaacgtatgctgcacgctatctgcggtctgggtttctttg420
acatctaaatgaaagaaaccaatgaaaaagaccgtgaactgagcgttgtgttctggcgtt480
acctgtggagcagcatcctgattagcctgtcggcgtcggtgggcaccgttgtcgatggta540
tcattgtgggcaatctgattggtgaagatggtgtctcggcagtgaacctgagcagtccga600
tgattcagctgctgttcaccatcagcctggtcgttgcatcaggcgcgggcatgctgatcg660
gttttgcactgggccaaaaagacggtcgtcgtgtccgctacatttttaccctgagcatgg720
tggcgtcgctgctggttggtgtgctgtttacgggtgcgggtttttacttctcggattcta780
ttacccgcgcattttgccacgatgattacctgttcacgtacacgagaccgact833
<210>19
<211>789
<212>dna
<213>人工序列
<223>序列一二级片段e2
<400>19
agtcggtctcgtacacccatgattatctgaaagtgatcctgattggcgcgccgagcttca60
tgatgctgtgggaaatcagcgcagtgattggtgtggacggctcgccgcgtctggcatcgc120
tggcgattatcgtggataatctggtcaacctgtgtctggacattgtgtttatcgaatatg180
tgggctggggcattgcgggctcggcagcagcgaccgttgtgggtcacctggtgggcattc240
tgatcatgctgcgtcattttaaaggtaaaggcaattcgctgacgttttcgctgacgcacg300
ataaaccggaatttctgaacatcgtgctgcaaggcgcgccgctggcgatcgcatccgtgt360
gcctgaccctgctgctggtgtcagcaaatcacgtgtttctgagtgcgaaaggccaaaatg420
gtatcttcgtgtttgctgtgtgcatgaacctgctgcaaatttacaatatgtatatcagcg480
gcacctgtcgtaccctgcaatcactgggtgcggtgcagattggcaaaaatgatgaccatg540
cgttcagtctgatcctgcgcaaatcatttctgttcattaccgtgagcatggctgtgacct600
gcctgctgatttgcctgtttccgggtgtgatttcgcgtgcctttggtgcagatagcccgg660
aagtgattgcggaatgcaatcatgtcttccgcatttttgcggtgtccttcattccgtttt720
gttacatctacctgattatgatcgtttataaactgtacaaacaggattgcatggccctcg780
agaccgact789
<210>20
<211>783
<212>dna
<213>人工序列
<223>序列一二级片段e3
<400>20
agtcggtctcgccctgttcattagctttgcactgtcgctgaccgtgatcccggtgctgct60
gctgtttttccactatgcgccgcagtatctgtggtacagctatctggtggcgtacctgct120
ggaaatcgtcgcaatctttgtgctgcataaactgacccacgctcgtctgtccctgtgaaa180
tgatatggtgctgctgacggaagacatctggagttttaacctggacgctgcctggcaaga240
aatctcgggtcaacgccgcgaatacgccctgaaatatcgtaccgaactggatcgtcgcct300
gtgtgtgcgtgcatatctgctgctgtgtgaaggtctgcgtaaaggctatggtattaccag360
cgtgccgctgtttgaatttggcaaatacggtaaaccgatgctggtcggttatccggatat420
tcatttcagcatttcgcattgcccggaagcagtgatctgtgtgctggatgacaatccggt480
gggcgtcgatattgaactggtgtcgagctttgacgaacaggttgcgcgttatgcgatgaa540
ccaggaagaactgcgccagatcaaaagctcttcacgcccggatgtggaatttgcgtgtct600
gtggacccgtaaagaagccgtgctgaaacagtccggttttggcctgagcgataacgtgaa660
agaagttctgaccgcacatccgctgccggtggaaacgtttatttcccgcaacctgcatta720
tgtgtattccatttgtcgtgctgattgtaacctgtaaccgacgagacgccgacgagaccg780
act783
<210>21
<211>8190
<212>dna
<213>人工序列
<223>序列二
<400>21
tcttccatataggctcgtcaagcggatctttgattactcgtgcaaaggtttagatgaaaa60
ggtactgcgttcccctcatgacagtgctatggtaatatccttcttgcactgacattacca120
ctggcttaccgttgtgtgcaagaccaagaccgctagttagagggcaaagccatagcccag180
cagccaagtcgctagaaaaacactcagtaataacagtgtaatggcactaccctgggacat240
agccaggataagccagtcaaacattgtttaatttcctgtgtcgaagatctcgttgataat300
ttcaacggccgtgtcaccaccatcaacagctgtgtcccattccaaattggcatgagtcac360
atcagatggcacacccacatcatcgtagatggcctcttcattcagctgctgcgtggtttc420
acgcttgttcttcttttccttctttctctggggttttgcattcccagttttaaatgcatc480
cacctgtgaaacaagaagctctacatttggatcagactttggcacagtcattttataatt540
atatgtaatctcgtaagagtccgctagctcacgaacagccacattaccaccaaagagcaa600
tgctgcaacatttggtgctaaactggcgatctgagcatagcctgaggcatcaacaccttt660
ttcgacaaattccgcatctccaaaatttttgaagcctcccctgggtccgaagcaagctgc720
tacgctattttcgcccttgggaattctcctccactctgggatgtctttgaggtcacgttc780
tttcgaagtggctctggatttgttcttcttaggtgtatttttgccgctgctgtcagacct840
ttcctgtttgggcttctgctgttgcttaagcttgtcagggttttcgccaatacccaaaga900
tttaagggcatccttgacagcagccaccagatcatcgcgtgatgttacaccaccacggtc960
atttgactggtttctgttcttggactggttacgagacttgttattgttattattattgcc1020
tcctctgttctgagaagctccacgaccctggttatttccacgattctgtgaattaccgcg1080
ggactggttattgcctctgttgttacttggagatctggacctgttgttgccattaccacg1140
actcctgctacgtgaatttgcacgtgaagtaggaggtgtgttaggttcaacaatctcaac1200
tacgctgggaagctgttgagagaaatttggaataattggcttttcagacgcctttctgac1260
acccaggttagtgggttcagtctttgcgccttctttagcaacccagaaaacaccctcagt1320
acgagtcctatagcggaggtcggcgtgaggtcctgttccgaggtagtagaaatgccaatt1380
ggaaggttgttcaattcgctcaccacggcgcatgcgccagcgaatttgctcattccagta1440
tccaatttgctggtccttatttcctttattagtgggtacagcattatttgcaagtacctt1500
agaaaggggtttgtcattagtaaccctaagaggggcatagagggataatggcacccgttt1560
gcggccacgatcctgaaaactgacagaagccataaagtttctgtttagactaaatgaagc1620
actttctcactatctgtgagaaccgaactcggattactcacagctgagtagtcgccgtgt1680
ttggaccggacatagaaagcccaaccagtgccagatgaagcattgactgaacgaccaaca1740
cgtccgtagacaattgttgtagtggccttggcgactgtgacgaaattaggtaattgactt1800
acctgtacgccagtagcaaccttatagccctctacaagcaatgtaccactaaggagtgtt1860
agcgttacaccagttggtgctccaagcactggaatgcagacctgtcggcccatcacagaa1920
gtagtgagaagcgcgtctgtttcaggattgaaagaccaccaagaatgtgtcctgcgccac1980
aaccgaatgctattgacaaagtacattatccacagcataagagtgatgcaagccataagg2040
atgctgaaagcaaaaaagacccaattgacctgaaagctagcccatgcatcaaaaagtgac2100
agtgctaacacaagaggccaaagtatccatagaatagccatcttgacaccatacaagaac2160
gcagagtacttgtaatggccatactgaagcactacaagtagtatcgtcagtatgatattc2220
catgtgaaattccagtttctaaggtgttgaatcacctcatcaacgggaatagaaccgtta2280
gacatatttcgtttatacgtcaataacagtactagggagggggtctatttgcatgtaaga2340
cttataaactctatacaaacgccctataggtatgtaaactgcgctattacacaaccggtg2400
acaagtgaagcacagattaaccaattggacgaaagtaatgcttataataagcaggaaaaa2460
gagtacgaaaagccaaagtataacattaactactagaccattatcattcactaattgtag2520
catactcgtctagttgaattgagtcaaatgcagcattagtaatgccaacaatttgatgtt2580
gcgaaaagacataaagcttcttgccatcaagaagctcaacagttcgcaacagctgtaggt2640
cagcttcttgccgcccacgtatagctagatacaagtcgatgctactaacaaaagcaacaa2700
aagagttgccaaaagtgatgtaatggtcaccaccttctaaaatcacaatggatttgccgt2760
cataataagctgctttaccattgaggaaagaaagtgtcgtagtattaaaaataataaaga2820
gcgcatttttatagcgccaggagtaaaagcagactaaacaaagcctgccaataagtgtgc2880
aacaaataatagttgcatctaaaaatgcaccacaataatataaaagtgggcaataaagaa2940
caatgacagcaaaacgcgctgccaacataatataattgcgcctcaaagaagacgctttaa3000
acagtgcaaagaagtagataaaaacactggtgaaaagaaaacccgtcacatttgaagctt3060
gtctaattggaactacattgagctccaactcttggacagcatccaaagacaagttagcag3120
actttgagacatctttgacaactgtgtcaatcgtgtattgaaaaagtccaagaaacatca3180
ctgcacgtggaccttttcaaaaacttcgtaaggttgaagtctaggacccctacaacaacc3240
tgagaaacaagcacagcagcagccgcagcatccacaacaacccgtggaaatgcagcagaa3300
cactagtaatgacacaacaaagatgagaacaatgaaaataatcaaccaaacccaccacgg3360
ccactttcacatacatttcatatgtgccaacttccttgaggttgatgtagctctcattta3420
acttcttaattgcatcctgaatcctgttcatctcatacgtcaggtccagcaaagtaacat3480
ttaacttctcgaaatcgagagataaatcaggcgcaatagacgtctgattcttaaaccatt3540
tatctaactcctccttaaagtcgggtggattaggtattgaagtgttcaagaaaacttcag3600
gtgcctttgtgtagtttactgcgcaactactcataatgacactgtttttatctgtaatgg3660
gttcagggtagtaatatgaactgcctgtgaacttccattctccatcatcttgaacaaaat3720
atccagctttaggtgctaatcctctatcaccagaaatgcaaagtccaggactcacatttg3780
cggttgtaaaggatattggcacatagctgaagtgtataaaatataagccataaggcgcat3840
tctggacaagagataatatatgattaccattgccacagaaattaatacgcgtggtttggc3900
tcttaacgcactcattgaccttttctatggcctgagcagcactaactttaataagcgtac3960
tatcactaagttgcttggatatatacgcattaagtgcagttaacctgccattaataagac4020
gatctatctgggcttttgcttctacagcctcaagccgagttagaatttcttgtaaagaag4080
cactaatagcaccaaacctgttagaaagttgatttagtaagttattgagtgcttcagcat4140
ttgcattaacaacggactggatcttacctaaagcagaattggttgcatcaaacccatcct4200
ggatagcacccagcgcattgttaaaagcactagcaatcatcttttggttctcactaagca4260
cattcatagtgacacctaaaccattaattctatattgaacacttaaactaaatggcacac4320
cggcagctgctgaccacggtgggaacatagctgccgcagtagcaccggttgtgtagccag4380
agatctgactctctgacaacacaggaggtaatactttgatgccattaaaagattgtacac4440
aaaggaggtcacgaacttcttgaccaccggtgcaattattataagcctcgacaaagccaa4500
catcagataatttgaccttgtcaaataacaaatcctctatagcagaacgccctcggattg4560
cactaggtccattgccgtcttcagcacatgttgaacctatgcatccaagtagaggactaa4620
aattaatgtcatctatagggcctgagatgccgtctggcagtctcgagcttatagtaacac4680
cctgcattaatgcactagcaacttgtagttgcatattatccaagaggttattaacctcat4740
taagaatggcattaacattaacacagaaagagccatactcaaccaactgctgcctgcatg4800
cagtgttatcaccacagacaaatgcagcacaatctatagtcacctttggagatctagttt4860
gaatgaactcctcatggtgcccaatagtaaaattggttggtatttgcatctcatataatc4920
catcaacggattggacactatcattaactaacatcggagtgtatggctcaaatgtagtta4980
accgatagccagtagaaactgatcggtgagccctgcgtgattttgaataatcaacgcata5040
agccagcacccatacggagatcacaattaggaagcgcctcatccgtgcggttatcagcat5100
taacaacacaacccaaataactatcaaagtaattaagtgggttctcctcacgggaaatat5160
tattgctaaaaacatagctacaatttatattacgatagagcagagccggttcgggtgcat5220
ctttatgaaatgcagcagaaacacggccactataacagctccttatcgtataagtcttgt5280
tagtggtaagatcacgaaaaccattcaaattaccattaacatcatacagaagggtttgcc5340
agctattataatagtcagccttaacctctttaaaaacaccttgtccagtaataccgtaga5400
ggtcatatttgacacaaatgccagtaaccacttcagtattaggcaactgcaaatctgtgg5460
aacatgtggtaccactattaatgccatttaacaatatattagcaaaaatttggcagcgat5520
cattaacaaggcaggtatcatgtgaccatccaataaatgaattgttggcacagatacaac5580
ccttatgtggatcagcattgccacaattatcttctaaaacacctaagccttcacaatggt5640
cacccacattaacaaaagcagacttaggcttagtctgagtagtgcaagggctaactatgt5700
ccggttgagcacacgggcaataactagatcttacagtaaaacattgctgagcgtaaacaa5760
cgtcatgttggtttttgccaaagacgccagcatcattaaagccatacctcctattccaag5820
acgaggggttatggttgtttatggtgacattattcttaggcaaggtgtaatgcagctgac5880
acgaagtggcagctgtatcaatcttataattagcagtctgcagaaatccagagttaccaa5940
gctgtaaatcaacttgcctacttcggggtacagcaaacttatcaactgaaatactaccaa6000
agcacctgccatacactttggaagcatcgatattattacaaaacaaactctcagcctgaa6060
cataacgtaacaggctgcttaaattaaaattacaattctgaaaagtcttacgctcccagt6120
tgagaggggaggggactgacctagcagtaagccactcctctatattacaagctgggaggt6180
tagcaacacgccggtatacaactccaactggttggaccgtataaccggataactcataga6240
caccagtgctaggtaacatgctctgggtcttacattttatttcactggtataactactag6300
cacaatcaacagcactagtaatgacacccttctggttgaaattaaacaaatattggcgct6360
taaccaaaggtgtaacccaatagcgcggagcaaaagtgctaccagctgttgggttgcaga6420
tgaaaggtaacacataatactgtgttaaaatatcgccaatatatacactaaacaaaaacg6480
tagtagcggagggtttatccgcatagtacgcataaaaagtaccaccatgttggtaaaaat6540
gaaaataaaatgcatcagcattaacattaagcgtgaaatttcgctttaacacacaaattg6600
ggggttttacatccgtgtgccaaaaccctattaatttattaccattagtgttaggcttac6660
aatcagtgtaaggtaactgacaaatggtatactggcacactgaggccattataacaccat6720
tatatggctctattacaacggtataggaagtatagccaaacaaactacctataactatag6780
taggaaaatatgcagttgcacctgatggcgtacttgtcttaaggttctgcaccttcgcaa6840
atatgccatcattaaactgacttaaatagggtggttgaaaccacgacaagctaactgagt6900
tagttcccgtaagagcgaggtttctaaacttagaaccatcgaccgggtagtaaccagtaa6960
gcaataatgtggcatttaaataaactcgatctaacacataatatgtccccaggccttgtg7020
aaacttcaacggtctcagtgctaatgcttggagcactaacattagcaccgtttgaattca7080
caagctggatacatctaaaatcaccaatataccctaaacaagagggcaaaaatagaataa7140
acacgaacagcattcatttgtttacgttgaccaaatgattagaaaaaccacaaatggcgt7200
cattattacgcactagcaacttaccattcttcaacaaacctaacacaacatcactaatgg7260
atgaatcttttaaattaatgacaactgtagccttatgcttacaattgaacttgcttaaat7320
caagtacactattgtaagacatagtcataattgtggaattacgccagaagatataattgg7380
catgcatagtgttgccgtcaatcacagcgccacttgcaaaatcacctaaatagtgaacac7440
caattaagaatgcctctgacgatgacgtgttaacactggtacagaacattgtccaatact7500
caaacctctgaatgagttcatacaacttcttattccaactaaactccgtcaccttaatag7560
ctacagtaccaccaagtgccaacttttcggtgagtcaactggcacgatgttaccaccacg7620
acgaccaaaagtaagctctaactcttcaaggaagtaattacagttagaaaataacagcca7680
accacaaatgtttttggggcggctaccaaaagtgtccacatacgcactaagcttggtagt7740
gccgaccaccaccatgacatagtcttcgggaagcaatccctcaacagtgtcagcgagatc7800
gaaggacacgaaacggcattgcataaatccactagcggcggcctcagaatagtatgagac7860
ggcttcactagcagtgcaaaagccaagagctgaaatttctgcatcattggcaaaagccaa7920
tgtaacatggttgctagccatagccgacagttactggtttcaaactagacggaactagtt7980
atccacacaacccccagacggaaccggaggaaggctgtttgtctagtatgtagaaggcga8040
cggaacgccaaccaggaactagaggacagcacagcacttgcgatggctacttaagcaaac8100
ctaatgaaattccacgtcagcttccagcagcatggacatgcggccggaaggacaaaattt8160
cgtttagttgaattgagtagacaagagtct8190
<210>22
<211>770
<212>dna
<213>人工序列
<223>序列二二级片段a1
<400>22
atcgggtctcaaacggctcttcatcttccatataggctcgtcaagcggatctttgattac60
tcgtgcaaaggtttagatgaaaaggtactgcgttcccctcatgacagtgctatggtaata120
tccttcttgcactgacattaccactggcttaccgttgtgtgcaagaccaagaccgctagt180
tagagggcaaagccatagcccagcagccaagtcgctagaaaaacactcagtaataacagt240
gtaatggcactaccctgggacatagccaggataagccagtcaaacattgtttaatttcct300
gtgtcgaagatctcgttgataatttcaacggccgtgtcaccaccatcaacagctgtgtcc360
cattccaaattggcatgagtcacatcagatggcacacccacatcatcgtagatggcctct420
tcattcagctgctgcgtggtttcacgcttgttcttcttttccttctttctctggggtttt480
gcattcccagttttaaatgcatccacctgtgaaacaagaagctctacatttggatcagac540
tttggcacagtcattttataattatatgtaatctcgtaagagtccgctagctcacgaaca600
gccacattaccaccaaagagcaatgctgcaacatttggtgctaaactggcgatctgagca660
tagcctgaggcatcaacacctttttcgacaaattccgcatctccaaaatttttgaagcct720
cccctgggtccgaagcaagctgctacgctattttcgccctcgagacccat770
<210>23
<211>768
<212>dna
<213>人工序列
<223>序列二二级片段a2
<400>23
atcgggtctcacccttgggaattctcctccactctgggatgtctttgaggtcacgttctt60
tcgaagtggctctggatttgttcttcttaggtgtatttttgccgctgctgtcagaccttt120
cctgtttgggcttctgctgttgcttaagcttgtcagggttttcgccaatacccaaagatt180
taagggcatccttgacagcagccaccagatcatcgcgtgatgttacaccaccacggtcat240
ttgactggtttctgttcttggactggttacgagacttgttattgttattattattgcctc300
ctctgttctgagaagctccacgaccctggttatttccacgattctgtgaattaccgcggg360
actggttattgcctctgttgttacttggagatctggacctgttgttgccattaccacgac420
tcctgctacgtgaatttgcacgtgaagtaggaggtgtgttaggttcaacaatctcaacta480
cgctgggaagctgttgagagaaatttggaataattggcttttcagacgcctttctgacac540
ccaggttagtgggttcagtctttgcgccttctttagcaacccagaaaacaccctcagtac600
gagtcctatagcggaggtcggcgtgaggtcctgttccgaggtagtagaaatgccaattgg660
aaggttgttcaattcgctcaccacggcgcatgcgccagcgaatttgctcattccagtatc720
caatttgctggtccttatttcctttattagtgggtacacgagacccat768
<210>24
<211>698
<212>dna
<213>人工序列
<223>序列二二级片段a3
<400>24
atcgggtctcatacagcattatttgcaagtaccttagaaaggggtttgtcattagtaacc60
ctaagaggggcatagagggataatggcacccgtttgcggccacgatcctgaaaactgaca120
gaagccataaagtttctgtttagactaaatgaagcactttctcactatctgtgagaaccg180
aactcggattactcacagctgagtagtcgccgtgtttggaccggacatagaaagcccaac240
cagtgccagatgaagcattgactgaacgaccaacacgtccgtagacaattgttgtagtgg300
ccttggcgactgtgacgaaattaggtaattgacttacctgtacgccagtagcaaccttat360
agccctctacaagcaatgtaccactaaggagtgttagcgttacaccagttggtgctccaa420
gcactggaatgcagacctgtcggcccatcacagaagtagtgagaagcgcgtctgtttcag480
gattgaaagaccaccaagaatgtgtcctgcgccacaaccgaatgctattgacaaagtaca540
ttatccacagcataagagtgatgcaagccataaggatgctgaaagcaaaaaagacccaat600
tgacctgaaagctagcccatgcatcaaaaagtgacagtgctaacacaagaggccaaagta660
tccatagaatagccatcttgacaccatacgagacccat698
<210>25
<211>532
<212>dna
<213>人工序列
<223>序列二二级片段a4
<400>25
atcgggtctcacatacaagaacgcagagtacttgtaatggccatactgaagcactacaag60
tagtatcgtcagtatgatattccatgtgaaattccagtttctaaggtgttgaatcacctc120
atcaacgggaatagaaccgttagacatatttcgtttatacgtcaataacagtactaggga180
gggggtctatttgcatgtaagacttataaactctatacaaacgccctataggtatgtaaa240
ctgcgctattacacaaccggtgacaagtgaagcacagattaaccaattggacgaaagtaa300
tgcttataataagcaggaaaaagagtacgaaaagccaaagtataacattaactactagac360
cattatcattcactaattgtagcatactcgtctagttgaattgagtcaaatgcagcatta420
gtaatgccaacaatttgatgttgcgaaaagacataaagcttcttgccatcaagaagctca480
acagttcgcaacagctgtaggtcagcttcttgaagagcccgatgagaccgct532
<210>26
<211>772
<212>dna
<213>人工序列
<223>序列二二级片段b1
<400>26
atcgggtctcaaacggctcttcatcttgccgcccacgtatagctagatacaagtcgatgc60
tactaacaaaagcaacaaaagagttgccaaaagtgatgtaatggtcaccaccttctaaaa120
tcacaatggatttgccgtcataataagctgctttaccattgaggaaagaaagtgtcgtag180
tattaaaaataataaagagcgcatttttatagcgccaggagtaaaagcagactaaacaaa240
gcctgccaataagtgtgcaacaaataatagttgcatctaaaaatgcaccacaataatata300
aaagtgggcaataaagaacaatgacagcaaaacgcgctgccaacataatataattgcgcc360
tcaaagaagacgctttaaacagtgcaaagaagtagataaaaacactggtgaaaagaaaac420
ccgtcacatttgaagcttgtctaattggaactacattgagctccaactcttggacagcat480
ccaaagacaagttagcagactttgagacatctttgacaactgtgtcaatcgtgtattgaa540
aaagtccaagaaacatcactgcacgtggaccttttcaaaaacttcgtaaggttgaagtct600
aggacccctacaacaacctgagaaacaagcacagcagcagccgcagcatccacaacaacc660
cgtggaaatgcagcagaacactagtaatgacacaacaaagatgagaacaatgaaaataat720
caaccaaacccaccacggccactttcacatacatttcatatgcgagacccat772
<210>27
<211>840
<212>dna
<213>人工序列
<223>序列二二级片段b2
<400>27
atcgggtctcatatgtgccaacttccttgaggttgatgtagctctcatttaacttcttaa60
ttgcatcctgaatcctgttcatctcatacgtcaggtccagcaaagtaacatttaacttct120
cgaaatcgagagataaatcaggcgcaatagacgtctgattcttaaaccatttatctaact180
cctccttaaagtcgggtggattaggtattgaagtgttcaagaaaacttcaggtgcctttg240
tgtagtttactgcgcaactactcataatgacactgtttttatctgtaatgggttcagggt300
agtaatatgaactgcctgtgaacttccattctccatcatcttgaacaaaatatccagctt360
taggtgctaatcctctatcaccagaaatgcaaagtccaggactcacatttgcggttgtaa420
aggatattggcacatagctgaagtgtataaaatataagccataaggcgcattctggacaa480
gagataatatatgattaccattgccacagaaattaatacgcgtggtttggctcttaacgc540
actcattgaccttttctatggcctgagcagcactaactttaataagcgtactatcactaa600
gttgcttggatatatacgcattaagtgcagttaacctgccattaataagacgatctatct660
gggcttttgcttctacagcctcaagccgagttagaatttcttgtaaagaagcactaatag720
caccaaacctgttagaaagttgatttagtaagttattgagtgcttcagcatttgcattaa780
caacggactggatcttacctaaagcagaattggttgcatcaaacccatcccgagacccat840
<210>28
<211>789
<212>dna
<213>人工序列
<223>序列二二级片段b3
<400>28
atcgggtctcaatcctggatagcacccagcgcattgttaaaagcactagcaatcatcttt60
tggttctcactaagcacattcatagtgacacctaaaccattaattctatattgaacactt120
aaactaaatggcacaccggcagctgctgaccacggtgggaacatagctgccgcagtagca180
ccggttgtgtagccagagatctgactctctgacaacacaggaggtaatactttgatgcca240
ttaaaagattgtacacaaaggaggtcacgaacttcttgaccaccggtgcaattattataa300
gcctcgacaaagccaacatcagataatttgaccttgtcaaataacaaatcctctatagca360
gaacgccctcggattgcactaggtccattgccgtcttcagcacatgttgaacctatgcat420
ccaagtagaggactaaaattaatgtcatctatagggcctgagatgccgtctggcagtctc480
gagcttatagtaacaccctgcattaatgcactagcaacttgtagttgcatattatccaag540
aggttattaacctcattaagaatggcattaacattaacacagaaagagccatactcaacc600
aactgctgcctgcatgcagtgttatcaccacagacaaatgcagcacaatctatagtcacc660
tttggagatctagtttgaatgaactcctcatggtgcccaatagtaaaattggttggtatt720
tgcatctcatataatccatcaacggattggacactatcattaactaacatcggagtgtac780
gagacccat789
<210>29
<211>687
<212>dna
<213>人工序列
<223>序列二二级片段b4
<400>29
atcgggtctcatgtatggctcaaatgtagttaaccgatagccagtagaaactgatcggtg60
agccctgcgtgattttgaataatcaacgcataagccagcacccatacggagatcacaatt120
aggaagcgcctcatccgtgcggttatcagcattaacaacacaacccaaataactatcaaa180
gtaattaagtgggttctcctcacgggaaatattattgctaaaaacatagctacaatttat240
attacgatagagcagagccggttcgggtgcatctttatgaaatgcagcagaaacacggcc300
actataacagctccttatcgtataagtcttgttagtggtaagatcacgaaaaccattcaa360
attaccattaacatcatacagaagggtttgccagctattataatagtcagccttaacctc420
tttaaaaacaccttgtccagtaataccgtagaggtcatatttgacacaaatgccagtaac480
cacttcagtattaggcaactgcaaatctgtggaacatgtggtaccactattaatgccatt540
taacaatatattagcaaaaatttggcagcgatcattaacaaggcaggtatcatgtgacca600
tccaataaatgaattgttggcacagatacaacccttatgtggatcagcattgccacaatt660
atcttgaagagcccgatgagaccgcta687
<210>30
<211>698
<212>dna
<213>人工序列
<223>序列二二级片段c1
<400>30
atcgcgtctcaaacggctcttcatcttctaaaacacctaagccttcacaatggtcaccca60
cattaacaaaagcagacttaggcttagtctgagtagtgcaagggctaactatgtccggtt120
gagcacacgggcaataactagatcttacagtaaaacattgctgagcgtaaacaacgtcat180
gttggtttttgccaaagacgccagcatcattaaagccatacctcctattccaagacgagg240
ggttatggttgtttatggtgacattattcttaggcaaggtgtaatgcagctgacacgaag300
tggcagctgtatcaatcttataattagcagtctgcagaaatccagagttaccaagctgta360
aatcaacttgcctacttcggggtacagcaaacttatcaactgaaatactaccaaagcacc420
tgccatacactttggaagcatcgatattattacaaaacaaactctcagcctgaacataac480
gtaacaggctgcttaaattaaaattacaattctgaaaagtcttacgctcccagttgagag540
gggaggggactgacctagcagtaagccactcctctatattacaagctgggaggttagcaa600
cacgccggtatacaactccaactggttggaccgtataaccggataactcatagacaccag660
tgctaggtaacatgctctgggtcttacacgagacgcat698
<210>31
<211>598
<212>dna
<213>人工序列
<223>序列二二级片段c2
<400>31
atcgcgtctcatacattttatttcactggtataactactagcacaatcaacagcactagt60
aatgacacccttctggttgaaattaaacaaatattggcgcttaaccaaaggtgtaaccca120
atagcgcggagcaaaagtgctaccagctgttgggttgcagatgaaaggtaacacataata180
ctgtgttaaaatatcgccaatatatacactaaacaaaaacgtagtagcggagggtttatc240
cgcatagtacgcataaaaagtaccaccatgttggtaaaaatgaaaataaaatgcatcagc300
attaacattaagcgtgaaatttcgctttaacacacaaattgggggttttacatccgtgtg360
ccaaaaccctattaatttattaccattagtgttaggcttacaatcagtgtaaggtaactg420
acaaatggtatactggcacactgaggccattataacaccattatatggctctattacaac480
ggtataggaagtatagccaaacaaactacctataactatagtaggaaaatatgcagttgc540
acctgatggcgtacttgtcttaaggttctgcaccttcgcaaatatgcccgagacgcat598
<210>32
<211>586
<212>dna
<213>人工序列
<223>序列二二级片段c3
<400>32
atcgcgtctcatgccatcattaaactgacttaaatagggtggttgaaaccacgacaagct60
aactgagttagttcccgtaagagcgaggtttctaaacttagaaccatcgaccgggtagta120
accagtaagcaataatgtggcatttaaataaactcgatctaacacataatatgtccccag180
gccttgtgaaacttcaacggtctcagtgctaatgcttggagcactaacattagcaccgtt240
tgaattcacaagctggatacatctaaaatcaccaatataccctaaacaagagggcaaaaa300
tagaataaacacgaacagcattcatttgtttacgttgaccaaatgattagaaaaaccaca360
aatggcgtcattattacgcactagcaacttaccattcttcaacaaacctaacacaacatc420
actaatggatgaatcttttaaattaatgacaactgtagccttatgcttacaattgaactt480
gcttaaatcaagtacactattgtaagacatagtcataattgtggaattacgccagaagat540
ataattggcatgcatagtgttgccgtcaatcacagccgagacgcat586
<210>33
<211>820
<212>dna
<213>人工序列
<223>序列二二级片段c4
<400>33
atcgcgtctcacagcgccacttgcaaaatcacctaaatagtgaacaccaattaagaatgc60
ctctgacgatgacgtgttaacactggtacagaacattgtccaatactcaaacctctgaat120
gagttcatacaacttcttattccaactaaactccgtcaccttaatagctacagtaccacc180
aagtgccaacttttcggtgagtcaactggcacgatgttaccaccacgacgaccaaaagta240
agctctaactcttcaaggaagtaattacagttagaaaataacagccaaccacaaatgttt300
ttggggcggctaccaaaagtgtccacatacgcactaagcttggtagtgccgaccaccacc360
atgacatagtcttcgggaagcaatccctcaacagtgtcagcgagatcgaaggacacgaaa420
cggcattgcataaatccactagcggcggcctcagaatagtatgagacggcttcactagca480
gtgcaaaagccaagagctgaaatttctgcatcattggcaaaagccaatgtaacatggttg540
ctagccatagccgacagttactggtttcaaactagacggaactagttatccacacaaccc600
ccagacggaaccggaggaaggctgtttgtctagtatgtagaaggcgacggaacgccaacc660
aggaactagaggacagcacagcacttgcgatggctacttaagcaaacctaatgaaattcc720
acgtcagcttccagcagcatggacatgcggccggaaggacaaaatttcgtttagttgaat780
tgagtagacaagagtcttgaagagcccgatgagacggcta820