一种长基因合成方法与流程

文档序号:15457432发布日期:2018-09-15 01:29阅读:430来源:国知局

本发明属于生物领域,涉及一种长基因合成方法。



背景技术:

现代分子生物学、基因工程以及合成生物学对长基因合成的需求越来越大。在分子生物学领域,研究者为了表达蛋白或者探究某一通路的功能,经常需要重新设计并且从头构建大于10kb的质粒。合成生物学科学家构建的基因线路和代谢通路经常包含十几个甚至几十个原件,单个模块的长度经常在10kb甚至20kb以上。

基因组的重新设计和合成是合成生物学的研究热点之一。在2010年,venter研究院从头合成了一种支原体基因组,并将其移植到一个细胞中,首次成功构建了人工合成生命。由约翰霍普金斯大学boeke教授领导的一个国际团队也正在进行酿酒酵母基因组的重新设计及合成。在2016年,由哈佛大学church教授和boeke教授组织的一次研讨会正式将合成人类基因组的计划提上日程。这些基因组级别的dna重新合成的研究对大片段的基因合成能力提出了新的挑战。

对绝大多数技术,一轮基因合成只能合成小于1kb的dna片段。长基因的合成是通过dna组装的方法来进行的。目前可用的dna组装的技术有很多种,下面分别描述一些这些方法。传统的酶切连接技术可以分步的将合成的短基因片段连入目标载体,从而合成目标的长基因片段。然而酶切连接方法一般只能将单一片段连入目标载体,不能进行多片段的连接,使整个方法非常低效。同时,酶切连接方法非常依赖目标片段上独一无二的酶切位点,如果目标片段比较长,会严重限制酶切连接策略的选择。

gibson组装是venter研究院合成支原体基因组的过程中发明的组装技术。该技术利用体外同源重组的方法对多个dna片段进行组装,但是重组过程需要片段之间存在同源臂。通常情况下,组装片段之间同源臂需要利用pcr的方法通过合成在引物5’端加入,这个特点致使组装大片段的时候比较容易发生突变。而且当gibson组装的片段个数大于5个的时候,组装效率显著下降。

goldengate克隆技术利用iis型核酸酶,通过边切边连的方法将多个片段组装在一起。有报道称goldengate克隆可以一次性将10个片段拼接在一起。但是goldengate克隆的一个最大的缺点是,当拼接序列内部存在所使用的iis型核酸酶酶切位点的情况下,就无法使用该技术。

利用酿酒酵母的体内同源重组系统也是一种常用的拼接大片段的方法。但是酵母的生长周期为两天,而且将片段组装后,还需要转化大肠杆菌获得高浓度的片段。因此酵母体内组装的周期显著高于体外组装的周期,而且操作上也比体外组装复杂很多。这些都限制了酵母体内重组的广泛应用。

综上所述,每一种组装技术都有内在的优点和缺点,某一个技术可能适用于某一类特征的序列拼接,但是没有一种技术是普遍适用于所有的序列的合成。在提供长片段基因合成的服务过程中,客户的需求通常是多种多样的。比如,目标基因中或许会有存在iis型核酸酶酶切位点,就无法使用goldengate克隆的方法。



技术实现要素:

本发明的目的是针对现有技术的上述不足,提供一种适用于3kb-50kb的长基因的合成方法,尤其是适用于长度大于8kb以上长基因的合成。

一种长基因合成方法,包含以下步骤:

1)按照基因片段内部的iis型限制性内切酶酶切位点对长基因进行两级分段:首先计算iis型限制性内切酶酶切位点的个数,选择位点个数最少的两个酶切位点对整个序列进行一级分段,在一级分段酶切位点处的分段方式为:将识别位点的前几个碱基分到上一段序列,同时将后几个碱基分到下一段序列,达到的效果是使每一段都没有完整的此iis型核酸酶酶切位点;如果有一大段序列超过5kb,其中没有合适的iis型核酸酶酶切位点将其分段,则人为的将其从靠中间的任意位置分成两段;之后再对一级片段进行二级分段,以使各个二级片段能够通过goldengate的方法进行拼接;

2)获得二级片段;

3)由二级片段利用goldengate拼接成一级片段;

4)由一级片段利用酶切-lcr的方法,或者pcr-lcr的方法拼接成全长基因。

二级片段通常通过传统基因合成方法获得,也可通过其他制备基因的方法得到。

长基因的合成流程每一步的详细操作步骤:

1.长基因进行两级分段方法优选如下:

首先计算整个序列中的bsai、bsmbi、bbsi、bspqi等iis型核酸酶酶切位点的个数,选择位点个数最少的两个酶切位点对整个序列进行一级分段。例如序列中有一个bsai位点,两个bsmbi位点,而bbsi和bspqi位点比较多,则可以用序列中的bsai和bsmbi共计三个位点将整段序列分成a1、a2、a3、a4共4段(图2)。如果有一大段序列超过5kb,其中没有合适的iis型核酸酶酶切位点将其分段,可以人为的将其从靠中间的任意位置分成两段。将所选择的两个酶切位点,其中一个酶(比如bsai)定义为a酶切位点,另一个(bsmbi)为b酶切位点(图2)。

在酶切位点处的分段方式为:将识别位点的前几个碱基分到上一段序列,同时将后几个碱基分到下一段序列,达到的效果是使每一段都没有完整的此iis型核酸酶酶切位点(图3)。具体的,对bbsi(gaagac),将gaaga分在前一段序列,将aagac分在后一段序列。bsai(ggtctc),bsmbi(cgtctc),bspqi(gctcttc)处理方式于bsai类似(图3)。

当一级片段拼接成全长基因采用酶切-lcr的方法,在每个一级分段片段的两端加上a酶切识别位点,作为最终的一级片段序列,对应的酶切-lcr中使用a酶进行酶切;当一级片段拼接成全长基因采用pcr-lcr的方法,则a酶切位点的加入不是必须的,即一级分段的两端可以加上a酶切识别位点,也可以不加上a酶切识别位点。

之后再对一级片段进行二级分段,以使各个二级片段可以通过goldengate的方法进行拼接。二级片段的分段的原则为:每个片段尽量等长但是每个片段不超过700bp;同一个片段内部没有大于20bp的重复;片段之间会有4bp的粘性末端,同一个一级片段内选择的粘性末端两两之间不能相同,且不能为回文序列。例如对于一个3kb的a2片段可以分成5段,每段约600bp(图4)。最后,在每个二级片段的两端加上b酶切识别位点(一级分段中的另一个酶切位点),作为最终的二级片段序列。

为了方便分段的粘性末端的选择以及后续获得稳定的组装效率,我们设计并测试了一组4bp的粘性末端:ccct;tatg;atcc;gctg;taca;gagt;gtcg;tgcc;gaac。

经过两级分段,可以将一段3kb-50kb的基因分成小于700bp若干段。将这些短片段分别合成后,可以利用两级合成方法拼接成全长。

2.二级片段的合成优选:

二级片段通过普通的基因合成获得,克隆到amp抗性的puc57载体上。

3.由二级片段拼接一级片段优选:

二级片段组装成一级片段通过b酶介导的goldengate克隆的方法实现(图5)。具体的,将各二级片段和对应的二级辅助载体混合,进行goldengate克隆反应,转化大肠杆菌感受态,涂布kan抗性平板,挑取正确克隆。

4.由一级片段拼接基因全长优选:

一级片段拼接为全长可以通过两种方法实现:

1)通过pcr-lcr的方法拼接全长(图6)。具体的,设计pcr引物,将一级片段所有片段和puc57载体骨架扩增出来。pcr引物的设计应使扩增片段首尾相接同时没有重叠区域。之后,将pcr片段和bridgingoligo合并进行lcr反应。反应液转化大肠杆菌感受态,涂布amp抗性平板,挑取正确克隆。

2)通过酶切-lcr的方法拼接全长(图7)。具体的,将所有的一级片段和一级辅助载体混合在一起,用a酶进行酶切。之后将酶切混合物和bridgingoligo合并进行lcr反应。反应液转化大肠杆菌感受态,涂布amp抗性平板,挑取正确克隆。

其中,bridgingoligo为lcr反应术语,指辅助两个片段拼接的oligo,与两个片段的末端均有同源片段。

二级辅助载体是拼接二级片段用的,一级辅助载体是拼接一级片段用的。辅助载体对应片段的数量不确定,从2-12都可以,优选2-5条。图4和图5有具体的展示。

辅助载体的构建:

此基因合成流程需要使用一级辅助载体和二级辅助载体,它们均由puc57载体改造而来。其中二级载体需要满足:带有kan抗性标记;laczα片段两端各带有一个iis型核酸酶酶切位点;两端的iis型核酸酶酶切位点分别切出“aacg”和“ccga”的4bp的粘性末端或者“tct”的3bp的粘性末端;整个载体的其他位置没有所对应iis型核酸酶酶切位点(图1)。二级辅助载体可以直接作为goldengate克隆的载体骨架来使用,同时还可以进行蓝白斑筛选。在本技术方案中,二级辅助载体与二级片段组装,得到一级载体。

一级辅助载体需要满足:带有amp抗性,laczalpha片段两端各带有一段linker序列和一个iis型限制性内切酶酶切位点,整个载体的其他位置没有所对应iis型核酸酶酶切位点(图1)。一级辅助载体可以直接作为载体骨架用于酶切-lcr克隆,同时还可以进行蓝白斑筛选。在本技术方案中,一级辅助载体与一级片段进行组装,获得合成基因的全长。

有益效果

1.此方法使用iis型核酸酶酶切位点对大片段基因进行分段,iis型核酸酶酶切位点有很多可供选择,因此方法适用于绝大部分的序列。

2.如果使用酶切-lcr的方法将一级片段组装成基因全长,整个组装流程可以完全避免pcr的反应,从而将突变发生的可能性降到最低。

3.能够快速的将短片段拼接成长片段。由二级片段拼接成全长可以在五天内实现。

4.整个技术方案流程化,可以利用软件进行自动化设计,同时可以使用自动化平台进行生产。

附图说明

图1:二级辅助载体图谱

图2:一级片段分段方法示例。

图3:一级片段断点处酶切位点序列处理方法

图4:二级片段分段方法示例

图5:由二级片段利用goldengate克隆拼接成一级片段

图6:通过pcr-lcr的方法拼接全长

图7:通过酶切-lcr的方法拼接全长

图8:序列一的一级分段

图9:序列一的一级和二级分段片段大小

图10:序列二的一级分段

图11:序列二的一级和二级分段片段大小

具体实施方式

实施例1:辅助载体的构建

以puc57-kan-bsmbi-free1为模板,利用引物level1puc57-kan-bbsi-1/level1puc57-kan-bbsi-2扩增获得puc57-kan骨架,level1lacza-kan-bbsi-1/level1lacza-kan-bbsi-2扩增获得laczα片段。所使用的引物序列为:

level1puc57-kan-bbsi-1tgacgaagactaggcagctgcatgtgtcagagg

level1puc57-kan-bbsi-2tgacgaagacattgagctcgctcactgactcgct

level1lacza-kan-bbsi-1gtacgaagactatgccaacgcgagacccacgacaggtttcccgactgga

level1lacza-kan-bbsi-2gatcgaagacgcctcatcggcgagacctgtcggggctggcttaactat

pcr反应体系为:10xpbobuffer5μl,10mmdntps0.8μl、上游引物1μl、下游引物1μl、模板dna1μl、pbodnapolymerase1μl、无菌水至50μl。反应程序为:95℃预变性5min;95℃变性15s,55℃退火15s,72℃延伸30s,30个循环;最后72℃延伸反应10min。

通过bbsi介导的goldengate将puc57-kan和laczα片段拼接获得puc57level1-kan-bsai。配制如下的反应体系:puc57-kan和laczα片段各1μl、t4dnaligasebuffer(neb)2μl、bbsi(neb)1μl、t4dnaligase(neb)1μl、无菌水至20μl。反应程序为:step1:37℃3min;step2:16℃5min;step1-step2共10个循环。step3:37℃15min;step4:55℃5min;step580℃5min;完成goldengate组装。获得的最终载体puc57level1-kan-bsai序列见seqidno.1。

puc57-kan-bsmbi-free1为不含bsmbi的puc57载体,其序列见seqidno.2。

puc57level1-kan-bsmbi的构建与puc57level1-kan-bsai构建过程相同,其使用的引物序列为:

level1puc57-kan-bsmbi-1tgacgaagactaggcagctgcatgtgtcagagg

level1puc57-kan-bsmbi-2tgacgaagacattgagctcgctcactgactcgct

level1lacza-kan-bsmbi-3gtacgaagactatgccaacgcgagacgcacgacaggtttcccgactgga

level1lacza-kan-bsmbi-4gatcgaagacgcctcatcggcgagacgtgtcggggctggcttaactat

puc57level1-kan-bbsi的构建与puc57level1-kan-bsai构建过程相同,其使用的引物序列为:

level1puc57-kan-bbsi-1tgacggtctcaggcagctgcatgtgtcagagg

level1puc57-kan-bbsi-2tgacggtctcttgagctcgctcactgactcgct

level1lacza-kan-bbsi-3gtacggtctcatgccaacgcggtcttccacgacaggtttcccgactgga

level1lacza-kan-bbsi-4gatcggtctccctcatcggcggtcttctgtcggggctggcttaactat

puc57level1-kan-bspqi的构建与puc57level1-kan-bsai构建过程相同,其使用的引物序列为:

level1puc57-kan-bspqi-1tgacggtctcaggcagctgcatgtgtcagagg

level1puc57-kan-bspqi-2tgacggtctcttgagctcgctcactgactcgct

level1lacza-kan-bspqi-3gtacggtctcatgcctctagaagagccacgacaggtttcccgactgga

level1lacza-kan-bspqi-4gatcggtctccctcaagacgaagagctgtcggggctggcttaactat

puc57level2-amp-bsai的构建方法如下:

以puc57-bsaifree(seqidno.3)为模板,利用引物puc57-bsmbi-1/puc57-bsmbi-2扩增获得puc57骨架,laczα-bsmbi-1/laczα-bsmbi-2扩增获得laczα片段。pcr反应体系为:10xpbobuffer5μl,10mmdntps0.8μl、上游引物1μl、下游引物1μl、模板dna1μl、pbodnapolymerase1μl、无菌水至50μl。反应程序为:95℃预变性5min;95℃变性15s,55℃退火15s,72℃延伸30s,30个循环;最后72℃延伸反应10min。

通过bsmbi介导的goldengate将puc57和laczα片段拼接获得puc57level2-amp-bsai。配置如下的反应体系:puc57和laczα片段各1μl、t4dnaligasebuffer(neb)2μl、bsmbi(neb)1μl、t4dnaligase(neb)1μl、无菌水至20μl。反应程序为:step1:42℃2min;step2:16℃5min;step1-step2共20个循环。step3:55℃10min;step4:80℃10min;完成goldengate组装。如果使用的typiis是bsai或者bbsi,反应程序如下:step1:37℃3min;step2:16℃5min;step1-step2共10个循环。step3:37℃15min;step4:55℃5min;step580℃5min。

将上述反应液中取出10μl转化至dh5α感受态细胞,涂布在amp抗性显色平板上。长出的蓝色克隆活化后直接测序,确认正确后,将此克隆保种。

过程中使用的引物序列如下:

level2puc57-bsai-1:

tcagcgtctccggattacgccgctttcctatcttgggcctcgtgatacgcctat

level2puc57-bsai-2:

tcagcgtctcccccttttacagcaggacaaccgcctcgctcactgactcgctgcgc

level2lacza-bsai-1::

tcagcgtctctatcccaggcaatagcgaaaagggaacgcgagacccacgacaggtttcccgactgg

level2lacza-bsai-2:

tcagcgtctctagggttcccgatagttctgcgtatcggcgagacctgtcggggctggcttaactatg

puc57level2-amp-bsmbi的构建与puc57level1-amp-bsai构建过程相同,其使用的引物序列为:

level2puc57-bsmbi-1:

tcagggtctccggattacgccgctttcctatcttgggcctcgtgatacgcctat

level2puc57-bsmbi-2:

tcagggtctcccccttttacagcaggacaaccgcctcgctcactgactcgctgcgct

level2lacza-bsmbi-1:

tcagggtctctatcccaggcaatagcgaaaagggaacgcgagacgcacgacaggtttcccgactgg

level2lacza-bsmbi-2:

tcagggtctctagggttcccgatagttctgcgtatcggcgagacgtgtcggggctggcttaactatg

puc57level2-amp-bbsi的构建与puc57level1-amp-bsai构建过程相同,其使用的引物序列为:

level2puc57-bbsi-1:

tcagggtctccggattacgccgctttcctatcttgggcctcgtgatacgcctat

level2puc57-bbsi-2:

tcagggtctcccccttttacagcaggacaaccgcctcgctcactgactcgctgcgct

level2lacza-bbsi-3:

tcagggtctctatcccaggcaatagcgaaaagggaacgcggtcttccacgacaggtttcccgactgg

level2lacza-bbsi-4:

tcagggtctctagggttcccgatagttctgcgtatcggcggtcttctgtcggggctggcttaactatg

puc57level2-amp-bsmbi的构建与puc57level1-amp-bsai构建过程相同,其使用的引物序列为:

level2puc57-bsai-1:

tcagggtctccggattacgccgctttcctatcttgggcctcgtgatacgcctat

level2puc57-bsai-2:

tcagggtctcccccttttacagcaggacaaccgcctcgctcactgactcgctgcgct

level2lacza-bsai-5:

tcagggtctctatcccaggcaatagcgaaaagggtctagaagagccacgacaggtttcccgactg

level2lacza-bsai-6:

tcagggtctcgagggttcccgatagttctgcgtaagacgaagagctgtcggggctggcttaactat

puc57level2-amp-bspqi的构建与puc57level1-amp-bsai构建过程相同,其使用的引物序列为:

level2puc57-bspqi-1:

tcagggtctccggattacgccgctttcctatcttgggcctcgtgatacgcctat

level2puc57-bspqi-2:

tcagggtctcccccttttacagcaggacaaccgcctcgctcactgactcgctgcgct

level2lacza-bspqi-5:

tcagggtctctatcccaggcaatagcgaaaagggtctagaagagccacgacaggtttcccgactg

level2lacza-bspqi-6:

tcagggtctcgagggttcccgatagttctgcgtaagacgaagagctgtcggggctggcttaactat

实施例2:序列一的合成示例

序列一(seqidno.4)的分析显示,序列共含有1个bsai位点、7个bbsi位点、2个bsmbi位点和1个bspqi位点,选择bsai和bsmbi对序列进行分段。在进行长基因合成的过程中,二级组装采用bsaigoldengate,一级组装采用pcr产物进行lcr反应。利用bsai和bsmbi位点将序列分为四段,对于其中大于5kb的一段再利用特定的碱基(在后续组装中作为粘性末端)将其分为两段,最终将全长分成a,b,c,d,e共5个片段,如图8所示。

将a,b,c,d,e五个一级片段再次继续的分成二级片段,便于进行基因合成。分段的原则为:每个片段尽量等长但是每个片段不超过700bp;同一个片段内部没有大于20bp的重复;片段之间会有4bp的粘性末端,同一个一级片段内选择的粘性末端两两之间不能相同,且不能为回文序列。由此分成的二级的片段共16个,序列见seqidno.5-seqidno.20。一级和二级片段大小如图9所示。

二级片段通过普通的基因合成获得。设计引物。合成得到的引物,将每条引物稀释至50μm,将所有的引物进行混合并稀释10倍(oligomix中每条引物浓度为5μm)。配制第一轮pcr反应体系:10xpbobuffer5μl、10mmdntps1μl、oligomix10μl、pbodnapolymerase1μl、无菌水至50μl。反应程序为:95℃预变性5min;95℃变性30s,58℃退火30s,72℃延伸30s,25个循环;最后72℃延伸反应10min。第二轮pcr以第一轮pcr反应的产物作为模板,反应体系:一轮pcr产物10μl、10xpbobuffer5μl、10mmdntps1μl、首尾引物各1μl、pbodnapolymerase1μl、无菌水至50μl。反应程序为:95℃预变性5min;95℃变性30s,58℃退火30s,72℃延伸30s,30循环;最后72℃延伸反应10min。pcr产物进行纯化。将基因合成得到的片段通过平末端连接至ecorv酶切后的puc57-bsaifree载体,酶连产物转入top10感受态细胞,涂布在amp抗性显色平板上,将白斑活化后测序。

利用bsaigoldengate把二级片段拼接成a,b,c,d,e一级片段。

反应体系:含二级片段的载体各100ng、puc57level1-kan-bsai100ng、t4dnaligasebuffer(neb)2μl、bsai(neb)1μl、t4dnaligase(neb)1μl、无菌水至20μl。反应条件:step1:37℃3min;step2:16℃5min;step1-step2共10个循环。step3:37℃15min;step4:55℃5min;step580℃5min;完成goldengate组装。将上述反应液中取出10μl转化至top10感受态细胞,涂布在kan抗性显色平板上。取两个白斑抽提质粒,进行酶切验证(如bsmbi),正确的质粒命名为puc57level1-kan-a,puc57level1-kan-b,puc57level1-kan-c,puc57level1-kan-d,puc57level1-kan-e。

一级组装利用pcr产物进行lcr。具体的,以二级片段中验证正确的质粒为模板,通过以下引物分别扩增得到a,b,c,d,e五个片段;一级载体采用pcr的方式扩增获得。引物序列如下:

具体操作步骤为,以扩增a片段为例,pcr反应体系:10xpbobuffer5μl,10mmdntps0.8μl、a-f1μl、a-r1μl、模板(puc57level1-kan-a)50ng、pbodnapolymerase1μl、无菌水至50μl。反应程序为:95℃预变性5min;95℃变性15s,55℃退火15s,72℃延伸90s,30个循环;最后72℃延伸反应10min。b,c,d,e片段获取方式与a片段一致。一级载体骨架的获取以puc57level2-amp-bsmbi为模板,以vector-f和vector-r为引物进行扩增,体系与获取a片段的体系一致。

之后,片段和载体进行磷酸化处理,具体的,将需要进行组装的片段和载体骨架混合起来进行磷酸化。反应体系为:10xt4pnkbuffer:5μl;片段abcde和一级载体骨架每个片段各3nm;10mmatp:5μl;t4polynucleotidekinase:1μl;total:50μl。

片段的加入量需要根据片段的大小和浓度,及其磷酸化产物回收效率进行计算后添加,保证各个片段的量符合后续lcr反应要求(每个片段需要3nm)。37℃反应30min后,按照纯化pcr产物的方式进行过柱回收或者乙醇沉淀法进行回收。lcr反应中dnaparts在片段和载体骨架磷酸化处理时已经混合在一起,因此在此步骤时只需要加入磷酸化后的回收产物。lcr体系为:dnaparts(a,b,c,d,e,一级载体骨架),3nmeach;10xampligasebuffer,2.5μl;ssdnabridgingoligo,30nmeach;dmso,8%(v/v);betaine,0.45m;ampligase,2μl;h2o至25μl。反应条件为:step1:94℃2min;step2:94℃10sec;step3:55℃30sec;step4:66℃60sec;repeat2-450cycles;step5:4℃hold。

其中ssdnabridgingoligo序列如下:

bridgingoligo1:

gcaacgatctgcatcagccatcgttcccttttcgctattgcctgggattacg

bridgingoligo2:

cacgtacgtttcatcggtttacccatcatctgttcgttatcaaacagttcaccgtgccagg

bridgingoligo3:

gctgactttcagattgctacgaccgcctgagacggtacacagataaacgtcacgattgtt

bridgingoligo4:

cgcgacggggtgcctgagaccatgtcgatgcgttgacctgaaatcagg

bridgingoligo5:

ttcgttgatcggcgaaaattcgacgcgagacgtacgcatttcgtgcgg

bridgingoligo6:

agggttcccgatagttctgcgtatcggttacaggttacaatcagcacgacaaatggaatacac

反应产物取2.5μl转化至top10感受态细胞,涂布于amp抗性显色平板。对白斑进行pcr验证,正确的克隆送测序。测序结果显示合成的基因序列正确。

实施例3:序列二的合成示例

对序列二(seqidno.21)的分析显示序列共含有1个bsai位点、3个bbsi位点、1个bsmbi位点,在进行长基因合成的过程中,二级组装采用bsaigoldengate或者bsmbigoldengate,一级组装采用bspqi酶切产物进行lcr反应。利用碱基tct将全长分成a,b,c共3个片段,如图10所示。将a,b,c三个一级片段的两端均加上bspqi的酶切识别位点,之后再次继续的分成二级片段,便于进行基因合成。二级片段分段的原则为:每个片段尽量等长但是每个片段不超过700bp;同一个片段内部没有大于20bp的重复;片段之间会有4bp的粘性末端,同一个一级片段内选择的粘性末端两两之间不能相同,且不能为回文序列。由此分成的二级的片段共12个,序列见(seqidno.22-seqidno.33)。一级和二级片段大小如图11所示。

该序列二级片段的合成过程与序列一相同。

序列二的的二级组装过程使用goldengate进行。其中a和b片段使用bsaigoldengate连接。c片段使用bsmbigoldengate连接。反应体系:二级片段各100ng、puc57level1-kan-bsai100ng、t4dnaligasebuffer(neb)2μl、bsai(neb)或者bsmbi(neb)1μl、t4dnaligase(neb)1μl、无菌水至20μl。bsaigoldengate反应条件:step1:37℃3min;step2:16℃5min;step1-step2共10个循环。step3:37℃15min;step4:55℃5min;step580℃5min;完成goldengate组装。bsmbigoldengate反应条件:step1:42℃2min;step2:16℃5min;step1-step2共20个循环。step4:55℃10min;step580℃10min;完成goldengate组装。将上述反应液中取出10μl转化至top10感受态细胞,涂布在kan抗性显色平板上。取两个白斑抽提质粒,进行酶切验证(如bspqi),正确的质粒命名为puc57level1-kan-a,puc57level1-kan-b,puc57level1-kan-c。

一级组装通过bspqi酶切lcr完成。具体的将puc57level2-amp-bspqi用bspqi进行酶切,酶切产物进行胶回收。puc57level1-kan-a,puc57level1-kan-b,puc57level1-kan-c可以分别用bspqi进行酶切,酶切产物分别进行胶回收。在此步骤中,可以将puc57level1-kan-a,puc57level1-kan-b,puc57level1-kan-c混合在一起酶切;进行混合酶切时需要保证每个质粒加入的摩尔数一致。

lcr体系为:dnaparts(a,b,c,d,e,一级载体骨架),3nmeach;10xampligasebuffer,2.5μl;ssdnabridgingoligo,30nmeach;dmso,8%(v/v);betaine,0.45m;ampligase,2μl;h2o至25μl。反应条件为:step1:94℃2min;step2:94℃10sec;step3:55℃30sec;step4:66℃60sec;repeat2-450cycles;step5:4℃hold。

其中ssdnabridgingoligo序列如下:

bridgingoligo1:

aaagatccgcttgacgagcctatatggaagacccttttcgctattgcctgggattacg

bridgingoligo2:

gacttgtatctagctatacgtgggcggcaagaagctgacctacagctgttgcgaactgttg

bridgingoligo3:

ggtgaccattgtgaaggcttaggtgttttagaagataattgtggcaatgctgatccacataagggt

bridgingoligo4:

tgtaaaagggttcccgatagttctgcgtaagactcttgtctactcaattcaactaaacgaaattttgtccttc

反应产物取2.5μl转化至top10感受态细胞,涂布于amp抗性显色平板。对白斑进行pcr验证,正确的克隆送测序。测序结果显示合成的基因序列正确。

sequencelisting

<110>南京金斯瑞生物科技有限公司

<120>一种长基因合成方法

<130>1

<160>33

<210>1

<211>2453

<212>dna

<213>人工序列

<223>载体puc57level1-kan-bsai

<400>1

tcgcgcgtttcggtgatgacggtgaaaacctctgacacatgcagctgccaacgcgagacc60

cacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttag120

ctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtgga180

attgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgccaagctt240

gcatgcaggcctctgcagtcgacgggcccgggatccgatatctagatgcattcgcgaggt300

accgagctcgaattcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgt360

tacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaaga420

ggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatggcgcctgat480

gcggtattttctccttacgcatctgtgcggtatttcacaccgcatatggtgcactctcag540

tacaatctgctctgatgccgcatagttaagccagccccgacaggtctcgccgatgagctc600

gctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaa660

ggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaa720

aggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggct780

ccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgac840

aggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttcc900

gaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttc960

tcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctg1020

tgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttga1080

gtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattag1140

cagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggcta1200

cactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaag1260

agttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttg1320

caagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctac1380

ggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatc1440

aaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaagcccaat1500

ctgaataatgttacaaccaattaaccaattctgattagaaaaactcatcgagcatcaaat1560

gaaactgcaatttattcatatcaggattatcaataccatatttttgaaaaagccgtttct1620

gtaatgaaggagaaaactcaccgaggcagttccataggatggcaagatcctggtatcggt1680

ctgcgattccgactcgtccaacatcaatacaacctattaatttcccctcgtcaaaaataa1740

ggttatcaagtgagaaatcaccatgagtgacgactgaatccggtgagaatggcaaaagtt1800

tatgcatttctttccagacttgttcaacaggccagccattacgctcgtcatcaaaatcac1860

tcgcatcaaccaaaccgttattcattcgtgattgcgcctgagcgaggcgaaatacgcgat1920

cgctgttaaaaggacaattacaaacaggaatcgaatgcaaccggcgcaggaacactgcca1980

gcgcatcaacaatattttcacctgaatcaggatattcttctaatacctggaatgctgttt2040

ttccggggatcgcagtggtgagtaaccatgcatcatcaggagtacggataaaatgcttga2100

tggtcggaagaggcataaattccgtcagccagtttagtctgaccatctcatctgtaacat2160

cattggcaacgctacctttgccatgtttcagaaacaactctggcgcatcgggcttcccat2220

acaagcgatagattgtcgcacctgattgcccgacattatcgcgagcccatttatacccat2280

ataaatcagcatccatgttggaatttaatcgcggcctcgacgtttcccgttgaatatggc2340

tcataacaccccttgtattactgtttatgtaagcagacagttttattgttcatgatgata2400

tatttttatcttgtgcaatgtaacatcagagattttgagacacgggccagagc2453

<210>2

<211>2453

<212>dna

<213>人工序列

<223>载体puc57-kan-bsmbi-free1

<400>2

tcgcgcgtttcggtgatgacggtgaaaacctctgacacatgcagctgccaacgcgagacg60

cacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttag120

ctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtgga180

attgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgccaagctt240

gcatgcaggcctctgcagtcgacgggcccgggatccgatatctagatgcattcgcgaggt300

accgagctcgaattcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgt360

tacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaaga420

ggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatggcgcctgat480

gcggtattttctccttacgcatctgtgcggtatttcacaccgcatatggtgcactctcag540

tacaatctgctctgatgccgcatagttaagccagccccgacacgtctcgccgatgagctc600

gctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaa660

ggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaa720

aggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggct780

ccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgac840

aggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttcc900

gaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttc960

tcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctg1020

tgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttga1080

gtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattag1140

cagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggcta1200

cactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaag1260

agttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttg1320

caagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctac1380

ggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatc1440

aaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaagcccaat1500

ctgaataatgttacaaccaattaaccaattctgattagaaaaactcatcgagcatcaaat1560

gaaactgcaatttattcatatcaggattatcaataccatatttttgaaaaagccgtttct1620

gtaatgaaggagaaaactcaccgaggcagttccataggatggcaagatcctggtatcggt1680

ctgcgattccgactcgtccaacatcaatacaacctattaatttcccctcgtcaaaaataa1740

ggttatcaagtgagaaatcaccatgagtgacgactgaatccggtgagaatggcaaaagtt1800

tatgcatttctttccagacttgttcaacaggccagccattacgctcgtcatcaaaatcac1860

tcgcatcaaccaaaccgttattcattcgtgattgcgcctgagcgaggcgaaatacgcgat1920

cgctgttaaaaggacaattacaaacaggaatcgaatgcaaccggcgcaggaacactgcca1980

gcgcatcaacaatattttcacctgaatcaggatattcttctaatacctggaatgctgttt2040

ttccggggatcgcagtggtgagtaaccatgcatcatcaggagtacggataaaatgcttga2100

tggtcggaagaggcataaattccgtcagccagtttagtctgaccatctcatctgtaacat2160

cattggcaacgctacctttgccatgtttcagaaacaactctggcgcatcgggcttcccat2220

acaagcgatagattgtcgcacctgattgcccgacattatcgcgagcccatttatacccat2280

ataaatcagcatccatgttggaatttaatcgcggcctcgacgtttcccgttgaatatggc2340

tcataacaccccttgtattactgtttatgtaagcagacagttttattgttcatgatgata2400

tatttttatcttgtgcaatgtaacatcagagattttgagacacgggccagagc2453

<210>3

<211>2710

<212>dna

<213>人工序列

<223>载体puc57-bsaifree

<400>3

tcgcgcgtttcggtgatgacggtgaaaacctctgacacatgcagctcccggagacggtca60

cagcttgtctgtaagcggatgccgggagcagacaagcccgtcagggcgcgtcagcgggtg120

ttggcgggtgtcggggctggcttaactatgcggcatcagagcagattgtactgagagtgc180

accatatgcggtgtgaaataccgcacagatgcgtaaggagaaaataccgcatcaggcgcc240

attcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcctcttcgctat300

tacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgccagggt360

tttcccagtcacgacgttgtaaaacgacggccagtgaattcgagctcggtacctcgcgaa420

tgcatctagatatcggatcccgggcccgtcgactgcagaggcctgcatgcaagcttggcg480

taatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaac540

atacgagccggaagcataaagtgtaaagcctggggtgcctaatgagtgagctaactcaca600

ttaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcat660

taatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcc720

tcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactca780

aaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagca840

aaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccatagg900

ctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccg960

acaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgtt1020

ccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctt1080

tctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggc1140

tgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtctt1200

gagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggatt1260

agcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggc1320

tacactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaa1380

agagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtt1440

tgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttct1500

acggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagatta1560

tcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaa1620

agtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatc1680

tcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataact1740

acgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagatccacgc1800

tcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagt1860

ggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagta1920

agtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtg1980

tcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagtt2040

acatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtc2100

agaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctctt2160

actgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattc2220

tgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataatacc2280

gcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaa2340

ctctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaac2400

tgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaa2460

aatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctt2520

tttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaa2580

tgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacct2640

gacgtctaagaaaccattattatcatgacattaacctataaaaataggcgtatcacgagg2700

ccctttcgtc2710

<210>4

<211>10654

<212>dna

<213>人工序列

<223>序列一

<400>4

atggctgatgcagatcgttgcctgatgtgtttccgtccggtgtgtgacctggtttgtccg60

gctgatgttcgtccggcggctgttatccaggctctgcatctggataacgaatcaggcgcg120

ggtctgcgtctgggcgacggtacggcatgcctgaattgcaatgatccgaaatgcgaaaaa180

gcgtgtgcacgcggccgtattgatcatgcaattcagattcgtgacatctgccgtgccctg240

agcggtcaagaaaagaaacaagttaacggtaaagcggatctgagcgtggacttctgtggt300

gtgcgttgcgaaaacccgtttctgctggcttccagcccggtcgccagcagttacgaaatg360

tgctgtcgcgcgtttgaccagggttgggcaggtgttgcgtacaaaaccattagcttttat420

caaacgcgcgaagtgagcccgcgtttcgactgcctgccgccgcgttcatcgtcgagcttt480

cagggttttaaaaacctggaacagctgagcccgtataccgccgaagaaaacttcgatatt540

ctgtgtcgcctgaaagaaaaatatccggaaaaagtgatcattgcgtctatcatgggtcag600

acgaccgaagaatggaccacgctggcgcgtatggcagaagaagcgggcgcagacatggtg660

gaatgcaacttcagctgtccgcagatggcgaaacagggcctgggtagcgacattggccag720

tccccggaactgatcagcctgtatacccagacgacccgtaaaggttgtggtctgccgatt780

atcgcgaaaatgaccccgaacgcaggtaatatggaaccgctggcagtcgcggcagtgacg840

tcaggcgcagatagcgtggcagcgatcaacacgattaaatccatcacccgtatccatccg900

gaaaactacagctcgtttccggatattgaaggtaaaagcgctgtcggtggctacagcggt960

cgtgcggtgaaaccgattgcgctgcgtttcattcgcgatctggcggtgtatccgccgctg1020

gcaggtgttagcctgtgcggtattggcggtattacgacctggcgtgatgcgatggatttt1080

ctgctgctgggttgtgataccgtgcaagtttgtaccagcgtgatggaatacggttatcgc1140

atcatcgaccacctgaaagaaggtctgtcgatctatatgcaagaaaaaggctacaatcgc1200

gtcgaagaatttcgtggcaaagcgctgccgcatatcgtcctgccggaacagctgaaccgt1260

aaccgccgtctggtttgcgaaatcgatcgtcaatcgtgtatcggttgtggccgttgctat1320

ctgtcgtgtcaagatggcggtcatcaggcaatccgttgggacggtcatcgtccgcaggtg1380

gaagaaaccaaatgcgtgggctgtggtctgtgcaccctggtctgcccgacggaagcgatt1440

ggtctgaaagaagtccacgacattggctaatatgaatcctatctaataatcttgtattat1500

gaaacaaaccgcaccgctgagcaaatcacagtatggcatctatgtcgaatgtatgaacca1560

cgttggcgaaatctattataacaccgcattcgtcttccgcctggacggctcgctggatgg1620

tcaaaaactgtgcaaagccgtggaagctacggtgatggcccacccggccctgtttacccg1680

cattgctctgaacgatgataatgaaccggtgcagagcgttggtctgtccgaagaaacctg1740

gagcctggacgtggaaccggtcgaagacattgatcaagcactgtcaggcctgattcaacc1800

gttcgatctgcataaagatcgcctgtttcgcatccgtctgttcaaagatgcagaatattt1860

tcacctgtttgttgacattcatcacatcgtgaacgatggcacgtcacaggcgatctttct1920

gcaagacattgaaacggcatataacggcgaaccgattgctccggaatgcatcacgctgtg1980

tgaacaggcgaccgaagaagttggcctgcgtgcaaccgctgaatttgaagaaggcaaaca2040

atggtacgcacgcaattttgattgtgcggatacgtttacgggcctgaccccggatctgga2100

agaagaaggccgtgaagaaggcacgctgcgccgcacgctggccgttaacctggaagcagt2160

ggatgcgttttgtaaagaacacggcatctttaaatcgaactttttcacgatggcgtatgc2220

atttctgctggcaaaatacaacaacgaacaggaatctttcttcacgatggtgtataacgg2280

ccgctcagacaaacgtctggctcgtacgatcggcatgttcgtgaaaagcgtcccggtttt2340

cacgaaattcacgagcgatacgtcagtgatggaactgctgcgtaatggccaagaacaaat2400

gggtggctgtcgcaaacatgaagcatacagcttcgtggattttatgcaggatattgcacc2460

gcagtacgacaatatgtttgcctggcacggtgaactgtttgataacgaacagatgatggg2520

taaaccgatgaaacgtacgtggctgatggattctccgctggacatccaactgtacctgaa2580

agcgtttattgaaaatggtaaatgtcagattgtggcagaatacaatgcaaaagcgtactc2640

acaagaactggtctgccaattcatggaatcctatgaagcggtcgtcaatggctttctgag2700

ccaagaatttctgcgtgatattagcatcgtgaccgaatcgcagaccacggtcctggactc2760

ctttaatcgcaccgactgcgaatatgatgacacccagacgatcgtgagtctgttccgtcg2820

ccaggctgaagccaccccggataatgtggcactgatctataaagataaacgttttaccta2880

tagccagatcgacgaaattagcgaccgcatcgcggcacgcatcgcttcgatgggcctggg2940

cgccgaagacgtggtttcaattctgatttcacgttgcgaatggatgggcatcattccgat3000

gggtgtgctgaaagcaggctgcgcgtaccagccgctggacccgacgtacccgaaagaacg3060

cctgaacttcatgatgaaagatgcgggtgtgtcactgctgatcgcggatgaaggcctgcg3120

tccgctggcagatgaatttcaaggtgaaacgctgtttaccggtgaactgatggatctgcc3180

gcgtgcggaagtgcaaccggttgcaccgagtccgtctagcctgtttatcctgctgtatac3240

gagcggctcgaccggtattccgaaaggttgtcagctggaacatggcaatctggttgcttt3300

ctgtcactggtatcagtcgtactacggtctgcatgcgggtgataaagtggcagcatacgc3360

atctttcggtttcgatgcttccatgatggatatgtatccggcactgacctgcggcgcaac3420

ggtgtgcatcattccggaagaaatccgtctggacctgatggcgctgaatgaatatctgga3480

acaaaatggtgtcacgcactcgtttatgaccacgcaggtcggctatcagtttgcaaccag3540

cattgaaaatcgctcgctgcgtcatctgtccaccggcggcgaaaaactggtttcgctggc3600

accgccgcaagaatataatttttataatgtgtatggtccgaccgaaaccacgattctggt3660

tacggcataccgtatcacgcaaaaactgaaagaaatcccgattggtaaaccgctggataa3720

tatgaaactgtacattgtggataatcatggccaccgcctgccggtgggtgcggctggtga3780

actgtggatttccggcccgcaggtgtcacgcggttacctgaaccgtccggaaaaaaccca3840

ggaagtgtatatcgcgaacccgttcaccgacaatgaaaaatatgcgcgtatctaccgctc3900

aggcgatgtggtccgctatctgccgtcaggcgacatccaatttgtgggccgtcgtgatgg3960

tcaagtgaaaattcgtggctttcgcatcgaactgaaagaagtcgaaggtatcatccgcga4020

atttccgggtattaaagacgccacggttcaggcattcgatgaagaaggtggtggcaaatt4080

catcgcagcgtatatcgtttcggatgaacaaatcgacattgaagcgctgaaccgctttat4140

cctggaagaaaaaccgccgtatatggtgccggcagttaccatgcagattgatagcattcc4200

gctgaaccaaaaccaaaaagttaacaaacgtgtcctgccgaaaccggaaaagaaaccggt4260

gtccgttgccgaaggtaatgtgccgatgaatgtgctggaaacggaactgcatcaactgat4320

cgcggccatcgtcaatcatgaaaactttggcgtcaccacggtgctgggctatgcaggcct4380

gaccagcatcacggcaattaaactggcagtgcaaatcaacaaacgctatggcgttgtggt4440

ggacgcgaaatcgctggttaaaaatggtacgctgcaaagcatcgaaaacgaaatcctgcg4500

taaaatgctgcacgatgcgtcggcggacggtcgtcaggaagaagcggtgaaaaaggaaat4560

tgttacgtcggcgccgctgtcgtacgcgcaaaccggtgtctatttcgaatgcatgaaaaa4620

cccgtttagcaccgtttataacatcccgtgcctgctgacctatccgagcggtacggacgc4680

atgccaactggcagatgcagtgaaaaccgttatccatgcacatacggcgatgaacattcg4740

ttttgaaacccagggcgaaggtgttcgtcagtatctggatgccgacctggcgattcaagt4800

tccggtcaaagcgatgacggaagaagaactgaccctgtacaaagaagaatttgtgcgtcc4860

gtttaacctgcaaaaagccccgctgtggcgttttgaagtcatcgaaaccccgtcggccgt4920

gcacctgctgatggatgtgcatcacctgatctttgacggcggttcggttgacctgtttat4980

tcgtcaggttagcgaagcactggaaggccaaaccgtttcgaaagaaacgtataccttcct5040

ggatttcgtgcacgaccaaatgcaggccgaacagaccgaatccttccgtaaagcggaaaa5100

attcttcgcagaaaaactgcaagcatgcgaaggtgcgtcggaagttccggccgatctgca5160

aaaaaccgataaagaatcacgtatcggtgaagcatgctgtccggtgaatcatgaagaagt5220

ggcacgcttctgtcgtagccacgacattaccccggcacacctgttctacgcagcagttac5280

gtatgttgtgtcccgttacacgaacaatcgtgacgtttatctgtgtaccgtctcaggcgg5340

tcgtagcaatctgaaagtcagcgaaaccgtgggcatgtttgtgaataccctggccctggg5400

tctgtccgttgacgatgtcacggttgaagacttcctgcaaacggcgagccgtacctttac5460

cgaaaccctggaaaacgaaaactatccgttcgcgcgcatcgcatcagattatggcttcca5520

gccggccattgcttacgcttatcaagtcggtgtgctgtccgcttattcgctgaaaggtca5580

atcaattggtcaggaagtcctggaactggacgtcccgaaatttaaaattaacatccagat5640

ccagtcacaaggtgtggtggtggaatacgacgatgccctgtattcccgttcggtcggcga5700

agcactggcagaaagcattgtcgccgtggttgaacgcatgatgcaaatgccgtccgaacg5760

tattcgttcactgagcatcgtgagccgtaaacaggctacggcactggacaaagttcgcac5820

gacgggcagcggtgaatctccgtttcgcctgttccacgaatgcattcaccattatgcggt5880

ggtggcgccggatcgcgaagccctggttgcgtgcgatgcaacgttcacctatgctgaaat5940

ggatgaactgaccgatcgcatcgcaagtggtctgcgcgctcgcggtgtgctgccgcgcga6000

ccgtgtggcgctgctgctgccgcgtagctcgcgcctgattctgtcgctgtttggcgtgct6060

gaaagccgaagcatcttacattccgtgtgatccggaatatccggctgatcgcgtcaaata6120

tatcctggaagattcgggctcagcatacatcatcacggatggcaatcatgctaaaggcct6180

gccgaaagacaaagtgatcgatgtggaaggcctggtcaaacatccgattgaacgctgggc6240

accgtcgattacgagtgacgatctggcctatattatttatacgtctggctcgaccggtaa6300

accgaaaggtgtgatgctgcgtcatgaaggtatttgtaactatctgaccgcgcacccggc6360

aaatgtgctggcacatgcagtgcaggccgatacggaacgtatcctgagtgtgacgacgat6420

tagctttgacgcggcgctgcaagacattggcacggcattctttaatggcaaaaccctggt6480

cctggctacggaagaacaggcaaataacccgattgaactggcacgcctgatttcaggtca6540

acgcatcgacatggtctcaggcaccccgtcgcgctggctgacgtggctgaccagcggcga6600

ctttgctgaagcaatccgttacattcgcatcgctcgtgcgggcggtgaaaaattctccgg6660

tcagctgctggaactgctgaaagcgaaaacgtcggcgcgcatttttaactgctatggccc6720

gacggaaaccaccgtcgcctcaaataataaagaactgacgcacgcggtttcggtgaccgt6780

tggtaaaccgcagctgaacgttaaagaatttgtggttgatcaggacggcaatgaactgcc6840

ggtcggtgttgtcggcgaactgtatattggcggtcgtggcgtggcgcgcggttacaataa6900

tctggatgacatgacccgcgaacgcttcatcgcctaccagggcgaacgtgtttataaatc6960

cggcgactacgcgaaatggaacgcggatggcgacatcgttatcctgggccgcaccgacaa7020

tcaaatcaaactgcgtggtctgcgcattgaactgggtgaaattgaaaacgtgatgctgaa7080

agtcgaaggcctggaaaaagtcgtgatcctgattcgtaaactgaacgacaaagaacatct7140

gtgtgcgtactacacggccgatcgcccgatcgcgccggatgctctgaaagcagaaatctc7200

aaaatcgctgacccaatatatggttccgaccgcatatctgcaagtcgataaaatgccgat7260

gaccccgtcgggcaaaaccgacgtgaaagcgctgccggaaccggtgctggccgtgtctag7320

tgcgtatgaagccccggccaatccgacggaacatattttctgcgatatttttgcaagcgt7380

gctgcaaatcgacaaagtcggcgcaaccgataacttcttcgaaagcggtggcaccagcct7440

ggtggtcacgcgcgttattattgaagcggacaaagcaggtctgcgcatcacgtacggtga7500

cgtgttcgcgcatccgaccccgcgtcaactggcacgtctggtcaacggtgataaagaaac7560

cgacggtcaggatgaagttgcagactatgactatggtatcattaactcgctgctgaaaag7620

caatacgctggaagcatttaaaaagggcgaacgtctgtcgctgggcaatgtgctgctgac7680

cggcgctaccggctatctgggtattcacatcctgaaagaactgatcggttcggacattgc7740

acacatctattgcctggtgcgtgacaaaaacctggaagcggcagaacgccgtctgaaaac7800

cctgctgttttattaccatgatgacgaattttcttcactgttcggtaaccgtattcatct7860

ggtcctgggtgatgtgacccaaaccatcgacgaaacgctgccggttgacaccgtgttcaa7920

ttgcgcagccgttgtcaaacatttcagcgaaggcacgttcatcgaagacgttaatatcgg7980

tggcgcccagcattgtgtggatttctgcctgaaaaagaatgcacgtctggtgcatatctc8040

taccgcctccacccgtggtctgtcggttaatggtattccggactcccaggaagtgtttac8100

cgaacaaaaactgtatatgggtcagtatctgggtaacaaatatatctacagcaaattcat8160

ggcggaacgtctgatcctggaagctattgccacgcagggcctgagtgcaaaaattatgcg8220

cgtgggtaacctggccgcgcgcagcaccgatggcgaatttcaaatcaactttctgacgaa8280

tagctttatgggccgcattaaagtgtacaatatgctgggttgctgcccgcacgaaatgcg8340

tacgtctcgcgtcgaattttcgccgatcaacgaagtgagcaaagcgattctgctgctggc8400

gagcaccccgaaagaatgctgcgtctttcatccgtttaacattcacacgcagttcctggg8460

cgacgtcctggaagtgctgaaatcggtcacgggcggtattgactttgttgaaatggaaca8520

atttgaagaagtgatggaaaaagcaaaatcagacccgaccaaagcaaaaatcctgtcctc8580

gctgctggcatatcaggacatggcgcacggccaaaaaacgtctgacgtcaatcgcgataa8640

ttcgtacaccacccaggttctgtttcgtctgggctttaattggagcgccacgtcttggga8700

ttacattgaacgtatgctgcacgctatctgcggtctgggtttctttgacatctaaatgaa8760

agaaaccaatgaaaaagaccgtgaactgagcgttgtgttctggcgttacctgtggagcag8820

catcctgattagcctgtcggcgtcggtgggcaccgttgtcgatggtatcattgtgggcaa8880

tctgattggtgaagatggtgtctcggcagtgaacctgagcagtccgatgattcagctgct8940

gttcaccatcagcctggtcgttgcatcaggcgcgggcatgctgatcggttttgcactggg9000

ccaaaaagacggtcgtcgtgtccgctacatttttaccctgagcatggtggcgtcgctgct9060

ggttggtgtgctgtttacgggtgcgggtttttacttctcggattctattacccgcgcatt9120

ttgccacgatgattacctgttcacgtacacccatgattatctgaaagtgatcctgattgg9180

cgcgccgagcttcatgatgctgtgggaaatcagcgcagtgattggtgtggacggctcgcc9240

gcgtctggcatcgctggcgattatcgtggataatctggtcaacctgtgtctggacattgt9300

gtttatcgaatatgtgggctggggcattgcgggctcggcagcagcgaccgttgtgggtca9360

cctggtgggcattctgatcatgctgcgtcattttaaaggtaaaggcaattcgctgacgtt9420

ttcgctgacgcacgataaaccggaatttctgaacatcgtgctgcaaggcgcgccgctggc9480

gatcgcatccgtgtgcctgaccctgctgctggtgtcagcaaatcacgtgtttctgagtgc9540

gaaaggccaaaatggtatcttcgtgtttgctgtgtgcatgaacctgctgcaaatttacaa9600

tatgtatatcagcggcacctgtcgtaccctgcaatcactgggtgcggtgcagattggcaa9660

aaatgatgaccatgcgttcagtctgatcctgcgcaaatcatttctgttcattaccgtgag9720

catggctgtgacctgcctgctgatttgcctgtttccgggtgtgatttcgcgtgcctttgg9780

tgcagatagcccggaagtgattgcggaatgcaatcatgtcttccgcatttttgcggtgtc9840

cttcattccgttttgttacatctacctgattatgatcgtttataaactgtacaaacagga9900

ttgcatggccctgttcattagctttgcactgtcgctgaccgtgatcccggtgctgctgct9960

gtttttccactatgcgccgcagtatctgtggtacagctatctggtggcgtacctgctgga10020

aatcgtcgcaatctttgtgctgcataaactgacccacgctcgtctgtccctgtgaaatga10080

tatggtgctgctgacggaagacatctggagttttaacctggacgctgcctggcaagaaat10140

ctcgggtcaacgccgcgaatacgccctgaaatatcgtaccgaactggatcgtcgcctgtg10200

tgtgcgtgcatatctgctgctgtgtgaaggtctgcgtaaaggctatggtattaccagcgt10260

gccgctgtttgaatttggcaaatacggtaaaccgatgctggtcggttatccggatattca10320

tttcagcatttcgcattgcccggaagcagtgatctgtgtgctggatgacaatccggtggg10380

cgtcgatattgaactggtgtcgagctttgacgaacaggttgcgcgttatgcgatgaacca10440

ggaagaactgcgccagatcaaaagctcttcacgcccggatgtggaatttgcgtgtctgtg10500

gacccgtaaagaagccgtgctgaaacagtccggttttggcctgagcgataacgtgaaaga10560

agttctgaccgcacatccgctgccggtggaaacgtttatttcccgcaacctgcattatgt10620

gtattccatttgtcgtgctgattgtaacctgtaa10654

<210>5

<211>668

<212>dna

<213>人工序列

<223>序列一二级片段a1

<400>5

agtcggtctcgaacgtctcgaacgatggctgatgcagatcgttgcctgatgtgtttccgt60

ccggtgtgtgacctggtttgtccggctgatgttcgtccggcggctgttatccaggctctg120

catctggataacgaatcaggcgcgggtctgcgtctgggcgacggtacggcatgcctgaat180

tgcaatgatccgaaatgcgaaaaagcgtgtgcacgcggccgtattgatcatgcaattcag240

attcgtgacatctgccgtgccctgagcggtcaagaaaagaaacaagttaacggtaaagcg300

gatctgagcgtggacttctgtggtgtgcgttgcgaaaacccgtttctgctggcttccagc360

ccggtcgccagcagttacgaaatgtgctgtcgcgcgtttgaccagggttgggcaggtgtt420

gcgtacaaaaccattagcttttatcaaacgcgcgaagtgagcccgcgtttcgactgcctg480

ccgccgcgttcatcgtcgagctttcagggttttaaaaacctggaacagctgagcccgtat540

accgccgaagaaaacttcgatattctgtgtcgcctgaaagaaaaatatccggaaaaagtg600

atcattgcgtctatcatgggtcagacgaccgaagaatggaccacgctggcgcgtatgcga660

gaccgact668

<210>6

<211>588

<212>dna

<213>人工序列

<223>序列一二级片段a2

<400>6

agtcggtctcgtatggcagaagaagcgggcgcagacatggtggaatgcaacttcagctgt60

ccgcagatggcgaaacagggcctgggtagcgacattggccagtccccggaactgatcagc120

ctgtatacccagacgacccgtaaaggttgtggtctgccgattatcgcgaaaatgaccccg180

aacgcaggtaatatggaaccgctggcagtcgcggcagtgacgtcaggcgcagatagcgtg240

gcagcgatcaacacgattaaatccatcacccgtatccatccggaaaactacagctcgttt300

ccggatattgaaggtaaaagcgctgtcggtggctacagcggtcgtgcggtgaaaccgatt360

gcgctgcgtttcattcgcgatctggcggtgtatccgccgctggcaggtgttagcctgtgc420

ggtattggcggtattacgacctggcgtgatgcgatggattttctgctgctgggttgtgat480

accgtgcaagtttgtaccagcgtgatggaatacggttatcgcatcatcgaccacctgaaa540

gaaggtctgtcgatctatatgcaagaaaaaggctacacgagaccgact588

<210>7

<211>666

<212>dna

<213>人工序列

<223>序列一二级片段a3

<400>7

agtcggtctcgtacaatcgcgtcgaagaatttcgtggcaaagcgctgccgcatatcgtcc60

tgccggaacagctgaaccgtaaccgccgtctggtttgcgaaatcgatcgtcaatcgtgta120

tcggttgtggccgttgctatctgtcgtgtcaagatggcggtcatcaggcaatccgttggg180

acggtcatcgtccgcaggtggaagaaaccaaatgcgtgggctgtggtctgtgcaccctgg240

tctgcccgacggaagcgattggtctgaaagaagtccacgacattggctaatatgaatcct300

atctaataatcttgtattatgaaacaaaccgcaccgctgagcaaatcacagtatggcatc360

tatgtcgaatgtatgaaccacgttggcgaaatctattataacaccgcattcgtcttccgc420

ctggacggctcgctggatggtcaaaaactgtgcaaagccgtggaagctacggtgatggcc480

cacccggccctgtttacccgcattgctctgaacgatgataatgaaccggtgcagagcgtt540

ggtctgtccgaagaaacctggagcctggacgtggaaccggtcgaagacattgatcaagca600

ctgtcaggcctgattcaaccgttcgatctgcataaagatcgcctgtttcgcatcccgaga660

ccgact666

<210>8

<211>715

<212>dna

<213>人工序列

<223>序列一二级片段a4

<400>8

agtcggtctcgatccgtctgttcaaagatgcagaatattttcacctgtttgttgacattc60

atcacatcgtgaacgatggcacgtcacaggcgatctttctgcaagacattgaaacggcat120

ataacggcgaaccgattgctccggaatgcatcacgctgtgtgaacaggcgaccgaagaag180

ttggcctgcgtgcaaccgctgaatttgaagaaggcaaacaatggtacgcacgcaattttg240

attgtgcggatacgtttacgggcctgaccccggatctggaagaagaaggccgtgaagaag300

gcacgctgcgccgcacgctggccgttaacctggaagcagtggatgcgttttgtaaagaac360

acggcatctttaaatcgaactttttcacgatggcgtatgcatttctgctggcaaaataca420

acaacgaacaggaatctttcttcacgatggtgtataacggccgctcagacaaacgtctgg480

ctcgtacgatcggcatgttcgtgaaaagcgtcccggttttcacgaaattcacgagcgata540

cgtcagtgatggaactgctgcgtaatggccaagaacaaatgggtggctgtcgcaaacatg600

aagcatacagcttcgtggattttatgcaggatattgcaccgcagtacgacaatatgtttg660

cctggcacggtgaactgtttgataacgaacagacgagacgccgacgagaccgact715

<210>9

<211>752

<212>dna

<213>人工序列

<223>序列一二级片段b1

<400>9

agtcggtctcgaacgtctcgcagatgatgggtaaaccgatgaaacgtacgtggctgatgg60

attctccgctggacatccaactgtacctgaaagcgtttattgaaaatggtaaatgtcaga120

ttgtggcagaatacaatgcaaaagcgtactcacaagaactggtctgccaattcatggaat180

cctatgaagcggtcgtcaatggctttctgagccaagaatttctgcgtgatattagcatcg240

tgaccgaatcgcagaccacggtcctggactcctttaatcgcaccgactgcgaatatgatg300

acacccagacgatcgtgagtctgttccgtcgccaggctgaagccaccccggataatgtgg360

cactgatctataaagataaacgttttacctatagccagatcgacgaaattagcgaccgca420

tcgcggcacgcatcgcttcgatgggcctgggcgccgaagacgtggtttcaattctgattt480

cacgttgcgaatggatgggcatcattccgatgggtgtgctgaaagcaggctgcgcgtacc540

agccgctggacccgacgtacccgaaagaacgcctgaacttcatgatgaaagatgcgggtg600

tgtcactgctgatcgcggatgaaggcctgcgtccgctggcagatgaatttcaaggtgaaa660

cgctgtttaccggtgaactgatggatctgccgcgtgcggaagtgcaaccggttgcaccga720

gtccgtctagcctgtttatcccgagaccgact752

<210>10

<211>680

<212>dna

<213>人工序列

<223>序列一二级片段b2

<400>10

agtcggtctcgatcctgctgtatacgagcggctcgaccggtattccgaaaggttgtcagc60

tggaacatggcaatctggttgctttctgtcactggtatcagtcgtactacggtctgcatg120

cgggtgataaagtggcagcatacgcatctttcggtttcgatgcttccatgatggatatgt180

atccggcactgacctgcggcgcaacggtgtgcatcattccggaagaaatccgtctggacc240

tgatggcgctgaatgaatatctggaacaaaatggtgtcacgcactcgtttatgaccacgc300

aggtcggctatcagtttgcaaccagcattgaaaatcgctcgctgcgtcatctgtccaccg360

gcggcgaaaaactggtttcgctggcaccgccgcaagaatataatttttataatgtgtatg420

gtccgaccgaaaccacgattctggttacggcataccgtatcacgcaaaaactgaaagaaa480

tcccgattggtaaaccgctggataatatgaaactgtacattgtggataatcatggccacc540

gcctgccggtgggtgcggctggtgaactgtggatttccggcccgcaggtgtcacgcggtt600

acctgaaccgtccggaaaaaacccaggaagtgtatatcgcgaacccgttcaccgacaatg660

aaaaatatgcgagaccgact680

<210>11

<211>721

<212>dna

<213>人工序列

<223>序列一二级片段b3

<400>11

agtcggtctcgtatgcgcgtatctaccgctcaggcgatgtggtccgctatctgccgtcag60

gcgacatccaatttgtgggccgtcgtgatggtcaagtgaaaattcgtggctttcgcatcg120

aactgaaagaagtcgaaggtatcatccgcgaatttccgggtattaaagacgccacggttc180

aggcattcgatgaagaaggtggtggcaaattcatcgcagcgtatatcgtttcggatgaac240

aaatcgacattgaagcgctgaaccgctttatcctggaagaaaaaccgccgtatatggtgc300

cggcagttaccatgcagattgatagcattccgctgaaccaaaaccaaaaagttaacaaac360

gtgtcctgccgaaaccggaaaagaaaccggtgtccgttgccgaaggtaatgtgccgatga420

atgtgctggaaacggaactgcatcaactgatcgcggccatcgtcaatcatgaaaactttg480

gcgtcaccacggtgctgggctatgcaggcctgaccagcatcacggcaattaaactggcag540

tgcaaatcaacaaacgctatggcgttgtggtggacgcgaaatcgctggttaaaaatggta600

cgctgcaaagcatcgaaaacgaaatcctgcgtaaaatgctgcacgatgcgtcggcggacg660

gtcgtcaggaagaagcggtgaaaaaggaaattgttacgtcggcgccgctgcgagaccgac720

t721

<210>12

<211>790

<212>dna

<213>人工序列

<223>序列一二级片段b4

<400>12

agtcggtctcggctgtcgtacgcgcaaaccggtgtctatttcgaatgcatgaaaaacccg60

tttagcaccgtttataacatcccgtgcctgctgacctatccgagcggtacggacgcatgc120

caactggcagatgcagtgaaaaccgttatccatgcacatacggcgatgaacattcgtttt180

gaaacccagggcgaaggtgttcgtcagtatctggatgccgacctggcgattcaagttccg240

gtcaaagcgatgacggaagaagaactgaccctgtacaaagaagaatttgtgcgtccgttt300

aacctgcaaaaagccccgctgtggcgttttgaagtcatcgaaaccccgtcggccgtgcac360

ctgctgatggatgtgcatcacctgatctttgacggcggttcggttgacctgtttattcgt420

caggttagcgaagcactggaaggccaaaccgtttcgaaagaaacgtataccttcctggat480

ttcgtgcacgaccaaatgcaggccgaacagaccgaatccttccgtaaagcggaaaaattc540

ttcgcagaaaaactgcaagcatgcgaaggtgcgtcggaagttccggccgatctgcaaaaa600

accgataaagaatcacgtatcggtgaagcatgctgtccggtgaatcatgaagaagtggca660

cgcttctgtcgtagccacgacattaccccggcacacctgttctacgcagcagttacgtat720

gttgtgtcccgttacacgaacaatcgtgacgtttatctgtgtaccgtctcaggcgccgac780

gagaccgact790

<210>13

<211>634

<212>dna

<213>人工序列

<223>序列一二级片段c1

<400>13

agtcggtctcgaacgcgtctcaggcggtcgtagcaatctgaaagtcagcgaaaccgtggg60

catgtttgtgaataccctggccctgggtctgtccgttgacgatgtcacggttgaagactt120

cctgcaaacggcgagccgtacctttaccgaaaccctggaaaacgaaaactatccgttcgc180

gcgcatcgcatcagattatggcttccagccggccattgcttacgcttatcaagtcggtgt240

gctgtccgcttattcgctgaaaggtcaatcaattggtcaggaagtcctggaactggacgt300

cccgaaatttaaaattaacatccagatccagtcacaaggtgtggtggtggaatacgacga360

tgccctgtattcccgttcggtcggcgaagcactggcagaaagcattgtcgccgtggttga420

acgcatgatgcaaatgccgtccgaacgtattcgttcactgagcatcgtgagccgtaaaca480

ggctacggcactggacaaagttcgcacgacgggcagcggtgaatctccgtttcgcctgtt540

ccacgaatgcattcaccattatgcggtggtggcgccggatcgcgaagccctggttgcgtg600

cgatgcaacgttcacctatgctgcgagaccgact634

<210>14

<211>657

<212>dna

<213>人工序列

<223>序列一二级片段c2

<400>14

agtcggtctcggctgaaatggatgaactgaccgatcgcatcgcaagtggtctgcgcgctc60

gcggtgtgctgccgcgcgaccgtgtggcgctgctgctgccgcgtagctcgcgcctgattc120

tgtcgctgtttggcgtgctgaaagccgaagcatcttacattccgtgtgatccggaatatc180

cggctgatcgcgtcaaatatatcctggaagattcgggctcagcatacatcatcacggatg240

gcaatcatgctaaaggcctgccgaaagacaaagtgatcgatgtggaaggcctggtcaaac300

atccgattgaacgctgggcaccgtcgattacgagtgacgatctggcctatattatttata360

cgtctggctcgaccggtaaaccgaaaggtgtgatgctgcgtcatgaaggtatttgtaact420

atctgaccgcgcacccggcaaatgtgctggcacatgcagtgcaggccgatacggaacgta480

tcctgagtgtgacgacgattagctttgacgcggcgctgcaagacattggcacggcattct540

ttaatggcaaaaccctggtcctggctacggaagaacaggcaaataacccgattgaactgg600

cacgcctgatttcaggtcaacgcatcgacatggtcttgagacgccgacgagaccgac657

<210>15

<211>632

<212>dna

<213>人工序列

<223>序列一二级片段d1

<400>15

agtcggtctcgaacgtctcagtctcaggcaccccgtcgcgctggctgacgtggctgacca60

gcggcgactttgctgaagcaatccgttacattcgcatcgctcgtgcgggcggtgaaaaat120

tctccggtcagctgctggaactgctgaaagcgaaaacgtcggcgcgcatttttaactgct180

atggcccgacggaaaccaccgtcgcctcaaataataaagaactgacgcacgcggtttcgg240

tgaccgttggtaaaccgcagctgaacgttaaagaatttgtggttgatcaggacggcaatg300

aactgccggtcggtgttgtcggcgaactgtatattggcggtcgtggcgtggcgcgcggtt360

acaataatctggatgacatgacccgcgaacgcttcatcgcctaccagggcgaacgtgttt420

ataaatccggcgactacgcgaaatggaacgcggatggcgacatcgttatcctgggccgca480

ccgacaatcaaatcaaactgcgtggtctgcgcattgaactgggtgaaattgaaaacgtga540

tgctgaaagtcgaaggcctggaaaaagtcgtgatcctgattcgtaaactgaacgacaaag600

aacatctgtgtgcgtactacacgagaccgact632

<210>16

<211>584

<212>dna

<213>人工序列

<223>序列一二级片段d2

<400>16

agtcggtctcgtacacggccgatcgcccgatcgcgccggatgctctgaaagcagaaatct60

caaaatcgctgacccaatatatggttccgaccgcatatctgcaagtcgataaaatgccga120

tgaccccgtcgggcaaaaccgacgtgaaagcgctgccggaaccggtgctggccgtgtcta180

gtgcgtatgaagccccggccaatccgacggaacatattttctgcgatatttttgcaagcg240

tgctgcaaatcgacaaagtcggcgcaaccgataacttcttcgaaagcggtggcaccagcc300

tggtggtcacgcgcgttattattgaagcggacaaagcaggtctgcgcatcacgtacggtg360

acgtgttcgcgcatccgaccccgcgtcaactggcacgtctggtcaacggtgataaagaaa420

ccgacggtcaggatgaagttgcagactatgactatggtatcattaactcgctgctgaaaa480

gcaatacgctggaagcatttaaaaagggcgaacgtctgtcgctgggcaatgtgctgctga540

ccggcgctaccggctatctgggtattcacatcccgagaccgact584

<210>17

<211>671

<212>dna

<213>人工序列

<223>序列一二级片段d3

<400>17

agtcggtctcgatcctgaaagaactgatcggttcggacattgcacacatctattgcctgg60

tgcgtgacaaaaacctggaagcggcagaacgccgtctgaaaaccctgctgttttattacc120

atgatgacgaattttcttcactgttcggtaaccgtattcatctggtcctgggtgatgtga180

cccaaaccatcgacgaaacgctgccggttgacaccgtgttcaattgcgcagccgttgtca240

aacatttcagcgaaggcacgttcatcgaagacgttaatatcggtggcgcccagcattgtg300

tggatttctgcctgaaaaagaatgcacgtctggtgcatatctctaccgcctccacccgtg360

gtctgtcggttaatggtattccggactcccaggaagtgtttaccgaacaaaaactgtata420

tgggtcagtatctgggtaacaaatatatctacagcaaattcatggcggaacgtctgatcc480

tggaagctattgccacgcagggcctgagtgcaaaaattatgcgcgtgggtaacctggccg540

cgcgcagcaccgatggcgaatttcaaatcaactttctgacgaatagctttatgggccgca600

ttaaagtgtacaatatgctgggttgctgcccgcacgaaatgcgtacgtctcgcgtcccga660

cgagaccgact671

<210>18

<211>833

<212>dna

<213>人工序列

<223>序列一二级片段e1

<400>18

agtcggtctcgaacgcgtctcgcgtcgaattttcgccgatcaacgaagtgagcaaagcga60

ttctgctgctggcgagcaccccgaaagaatgctgcgtctttcatccgtttaacattcaca120

cgcagttcctgggcgacgtcctggaagtgctgaaatcggtcacgggcggtattgactttg180

ttgaaatggaacaatttgaagaagtgatggaaaaagcaaaatcagacccgaccaaagcaa240

aaatcctgtcctcgctgctggcatatcaggacatggcgcacggccaaaaaacgtctgacg300

tcaatcgcgataattcgtacaccacccaggttctgtttcgtctgggctttaattggagcg360

ccacgtcttgggattacattgaacgtatgctgcacgctatctgcggtctgggtttctttg420

acatctaaatgaaagaaaccaatgaaaaagaccgtgaactgagcgttgtgttctggcgtt480

acctgtggagcagcatcctgattagcctgtcggcgtcggtgggcaccgttgtcgatggta540

tcattgtgggcaatctgattggtgaagatggtgtctcggcagtgaacctgagcagtccga600

tgattcagctgctgttcaccatcagcctggtcgttgcatcaggcgcgggcatgctgatcg660

gttttgcactgggccaaaaagacggtcgtcgtgtccgctacatttttaccctgagcatgg720

tggcgtcgctgctggttggtgtgctgtttacgggtgcgggtttttacttctcggattcta780

ttacccgcgcattttgccacgatgattacctgttcacgtacacgagaccgact833

<210>19

<211>789

<212>dna

<213>人工序列

<223>序列一二级片段e2

<400>19

agtcggtctcgtacacccatgattatctgaaagtgatcctgattggcgcgccgagcttca60

tgatgctgtgggaaatcagcgcagtgattggtgtggacggctcgccgcgtctggcatcgc120

tggcgattatcgtggataatctggtcaacctgtgtctggacattgtgtttatcgaatatg180

tgggctggggcattgcgggctcggcagcagcgaccgttgtgggtcacctggtgggcattc240

tgatcatgctgcgtcattttaaaggtaaaggcaattcgctgacgttttcgctgacgcacg300

ataaaccggaatttctgaacatcgtgctgcaaggcgcgccgctggcgatcgcatccgtgt360

gcctgaccctgctgctggtgtcagcaaatcacgtgtttctgagtgcgaaaggccaaaatg420

gtatcttcgtgtttgctgtgtgcatgaacctgctgcaaatttacaatatgtatatcagcg480

gcacctgtcgtaccctgcaatcactgggtgcggtgcagattggcaaaaatgatgaccatg540

cgttcagtctgatcctgcgcaaatcatttctgttcattaccgtgagcatggctgtgacct600

gcctgctgatttgcctgtttccgggtgtgatttcgcgtgcctttggtgcagatagcccgg660

aagtgattgcggaatgcaatcatgtcttccgcatttttgcggtgtccttcattccgtttt720

gttacatctacctgattatgatcgtttataaactgtacaaacaggattgcatggccctcg780

agaccgact789

<210>20

<211>783

<212>dna

<213>人工序列

<223>序列一二级片段e3

<400>20

agtcggtctcgccctgttcattagctttgcactgtcgctgaccgtgatcccggtgctgct60

gctgtttttccactatgcgccgcagtatctgtggtacagctatctggtggcgtacctgct120

ggaaatcgtcgcaatctttgtgctgcataaactgacccacgctcgtctgtccctgtgaaa180

tgatatggtgctgctgacggaagacatctggagttttaacctggacgctgcctggcaaga240

aatctcgggtcaacgccgcgaatacgccctgaaatatcgtaccgaactggatcgtcgcct300

gtgtgtgcgtgcatatctgctgctgtgtgaaggtctgcgtaaaggctatggtattaccag360

cgtgccgctgtttgaatttggcaaatacggtaaaccgatgctggtcggttatccggatat420

tcatttcagcatttcgcattgcccggaagcagtgatctgtgtgctggatgacaatccggt480

gggcgtcgatattgaactggtgtcgagctttgacgaacaggttgcgcgttatgcgatgaa540

ccaggaagaactgcgccagatcaaaagctcttcacgcccggatgtggaatttgcgtgtct600

gtggacccgtaaagaagccgtgctgaaacagtccggttttggcctgagcgataacgtgaa660

agaagttctgaccgcacatccgctgccggtggaaacgtttatttcccgcaacctgcatta720

tgtgtattccatttgtcgtgctgattgtaacctgtaaccgacgagacgccgacgagaccg780

act783

<210>21

<211>8190

<212>dna

<213>人工序列

<223>序列二

<400>21

tcttccatataggctcgtcaagcggatctttgattactcgtgcaaaggtttagatgaaaa60

ggtactgcgttcccctcatgacagtgctatggtaatatccttcttgcactgacattacca120

ctggcttaccgttgtgtgcaagaccaagaccgctagttagagggcaaagccatagcccag180

cagccaagtcgctagaaaaacactcagtaataacagtgtaatggcactaccctgggacat240

agccaggataagccagtcaaacattgtttaatttcctgtgtcgaagatctcgttgataat300

ttcaacggccgtgtcaccaccatcaacagctgtgtcccattccaaattggcatgagtcac360

atcagatggcacacccacatcatcgtagatggcctcttcattcagctgctgcgtggtttc420

acgcttgttcttcttttccttctttctctggggttttgcattcccagttttaaatgcatc480

cacctgtgaaacaagaagctctacatttggatcagactttggcacagtcattttataatt540

atatgtaatctcgtaagagtccgctagctcacgaacagccacattaccaccaaagagcaa600

tgctgcaacatttggtgctaaactggcgatctgagcatagcctgaggcatcaacaccttt660

ttcgacaaattccgcatctccaaaatttttgaagcctcccctgggtccgaagcaagctgc720

tacgctattttcgcccttgggaattctcctccactctgggatgtctttgaggtcacgttc780

tttcgaagtggctctggatttgttcttcttaggtgtatttttgccgctgctgtcagacct840

ttcctgtttgggcttctgctgttgcttaagcttgtcagggttttcgccaatacccaaaga900

tttaagggcatccttgacagcagccaccagatcatcgcgtgatgttacaccaccacggtc960

atttgactggtttctgttcttggactggttacgagacttgttattgttattattattgcc1020

tcctctgttctgagaagctccacgaccctggttatttccacgattctgtgaattaccgcg1080

ggactggttattgcctctgttgttacttggagatctggacctgttgttgccattaccacg1140

actcctgctacgtgaatttgcacgtgaagtaggaggtgtgttaggttcaacaatctcaac1200

tacgctgggaagctgttgagagaaatttggaataattggcttttcagacgcctttctgac1260

acccaggttagtgggttcagtctttgcgccttctttagcaacccagaaaacaccctcagt1320

acgagtcctatagcggaggtcggcgtgaggtcctgttccgaggtagtagaaatgccaatt1380

ggaaggttgttcaattcgctcaccacggcgcatgcgccagcgaatttgctcattccagta1440

tccaatttgctggtccttatttcctttattagtgggtacagcattatttgcaagtacctt1500

agaaaggggtttgtcattagtaaccctaagaggggcatagagggataatggcacccgttt1560

gcggccacgatcctgaaaactgacagaagccataaagtttctgtttagactaaatgaagc1620

actttctcactatctgtgagaaccgaactcggattactcacagctgagtagtcgccgtgt1680

ttggaccggacatagaaagcccaaccagtgccagatgaagcattgactgaacgaccaaca1740

cgtccgtagacaattgttgtagtggccttggcgactgtgacgaaattaggtaattgactt1800

acctgtacgccagtagcaaccttatagccctctacaagcaatgtaccactaaggagtgtt1860

agcgttacaccagttggtgctccaagcactggaatgcagacctgtcggcccatcacagaa1920

gtagtgagaagcgcgtctgtttcaggattgaaagaccaccaagaatgtgtcctgcgccac1980

aaccgaatgctattgacaaagtacattatccacagcataagagtgatgcaagccataagg2040

atgctgaaagcaaaaaagacccaattgacctgaaagctagcccatgcatcaaaaagtgac2100

agtgctaacacaagaggccaaagtatccatagaatagccatcttgacaccatacaagaac2160

gcagagtacttgtaatggccatactgaagcactacaagtagtatcgtcagtatgatattc2220

catgtgaaattccagtttctaaggtgttgaatcacctcatcaacgggaatagaaccgtta2280

gacatatttcgtttatacgtcaataacagtactagggagggggtctatttgcatgtaaga2340

cttataaactctatacaaacgccctataggtatgtaaactgcgctattacacaaccggtg2400

acaagtgaagcacagattaaccaattggacgaaagtaatgcttataataagcaggaaaaa2460

gagtacgaaaagccaaagtataacattaactactagaccattatcattcactaattgtag2520

catactcgtctagttgaattgagtcaaatgcagcattagtaatgccaacaatttgatgtt2580

gcgaaaagacataaagcttcttgccatcaagaagctcaacagttcgcaacagctgtaggt2640

cagcttcttgccgcccacgtatagctagatacaagtcgatgctactaacaaaagcaacaa2700

aagagttgccaaaagtgatgtaatggtcaccaccttctaaaatcacaatggatttgccgt2760

cataataagctgctttaccattgaggaaagaaagtgtcgtagtattaaaaataataaaga2820

gcgcatttttatagcgccaggagtaaaagcagactaaacaaagcctgccaataagtgtgc2880

aacaaataatagttgcatctaaaaatgcaccacaataatataaaagtgggcaataaagaa2940

caatgacagcaaaacgcgctgccaacataatataattgcgcctcaaagaagacgctttaa3000

acagtgcaaagaagtagataaaaacactggtgaaaagaaaacccgtcacatttgaagctt3060

gtctaattggaactacattgagctccaactcttggacagcatccaaagacaagttagcag3120

actttgagacatctttgacaactgtgtcaatcgtgtattgaaaaagtccaagaaacatca3180

ctgcacgtggaccttttcaaaaacttcgtaaggttgaagtctaggacccctacaacaacc3240

tgagaaacaagcacagcagcagccgcagcatccacaacaacccgtggaaatgcagcagaa3300

cactagtaatgacacaacaaagatgagaacaatgaaaataatcaaccaaacccaccacgg3360

ccactttcacatacatttcatatgtgccaacttccttgaggttgatgtagctctcattta3420

acttcttaattgcatcctgaatcctgttcatctcatacgtcaggtccagcaaagtaacat3480

ttaacttctcgaaatcgagagataaatcaggcgcaatagacgtctgattcttaaaccatt3540

tatctaactcctccttaaagtcgggtggattaggtattgaagtgttcaagaaaacttcag3600

gtgcctttgtgtagtttactgcgcaactactcataatgacactgtttttatctgtaatgg3660

gttcagggtagtaatatgaactgcctgtgaacttccattctccatcatcttgaacaaaat3720

atccagctttaggtgctaatcctctatcaccagaaatgcaaagtccaggactcacatttg3780

cggttgtaaaggatattggcacatagctgaagtgtataaaatataagccataaggcgcat3840

tctggacaagagataatatatgattaccattgccacagaaattaatacgcgtggtttggc3900

tcttaacgcactcattgaccttttctatggcctgagcagcactaactttaataagcgtac3960

tatcactaagttgcttggatatatacgcattaagtgcagttaacctgccattaataagac4020

gatctatctgggcttttgcttctacagcctcaagccgagttagaatttcttgtaaagaag4080

cactaatagcaccaaacctgttagaaagttgatttagtaagttattgagtgcttcagcat4140

ttgcattaacaacggactggatcttacctaaagcagaattggttgcatcaaacccatcct4200

ggatagcacccagcgcattgttaaaagcactagcaatcatcttttggttctcactaagca4260

cattcatagtgacacctaaaccattaattctatattgaacacttaaactaaatggcacac4320

cggcagctgctgaccacggtgggaacatagctgccgcagtagcaccggttgtgtagccag4380

agatctgactctctgacaacacaggaggtaatactttgatgccattaaaagattgtacac4440

aaaggaggtcacgaacttcttgaccaccggtgcaattattataagcctcgacaaagccaa4500

catcagataatttgaccttgtcaaataacaaatcctctatagcagaacgccctcggattg4560

cactaggtccattgccgtcttcagcacatgttgaacctatgcatccaagtagaggactaa4620

aattaatgtcatctatagggcctgagatgccgtctggcagtctcgagcttatagtaacac4680

cctgcattaatgcactagcaacttgtagttgcatattatccaagaggttattaacctcat4740

taagaatggcattaacattaacacagaaagagccatactcaaccaactgctgcctgcatg4800

cagtgttatcaccacagacaaatgcagcacaatctatagtcacctttggagatctagttt4860

gaatgaactcctcatggtgcccaatagtaaaattggttggtatttgcatctcatataatc4920

catcaacggattggacactatcattaactaacatcggagtgtatggctcaaatgtagtta4980

accgatagccagtagaaactgatcggtgagccctgcgtgattttgaataatcaacgcata5040

agccagcacccatacggagatcacaattaggaagcgcctcatccgtgcggttatcagcat5100

taacaacacaacccaaataactatcaaagtaattaagtgggttctcctcacgggaaatat5160

tattgctaaaaacatagctacaatttatattacgatagagcagagccggttcgggtgcat5220

ctttatgaaatgcagcagaaacacggccactataacagctccttatcgtataagtcttgt5280

tagtggtaagatcacgaaaaccattcaaattaccattaacatcatacagaagggtttgcc5340

agctattataatagtcagccttaacctctttaaaaacaccttgtccagtaataccgtaga5400

ggtcatatttgacacaaatgccagtaaccacttcagtattaggcaactgcaaatctgtgg5460

aacatgtggtaccactattaatgccatttaacaatatattagcaaaaatttggcagcgat5520

cattaacaaggcaggtatcatgtgaccatccaataaatgaattgttggcacagatacaac5580

ccttatgtggatcagcattgccacaattatcttctaaaacacctaagccttcacaatggt5640

cacccacattaacaaaagcagacttaggcttagtctgagtagtgcaagggctaactatgt5700

ccggttgagcacacgggcaataactagatcttacagtaaaacattgctgagcgtaaacaa5760

cgtcatgttggtttttgccaaagacgccagcatcattaaagccatacctcctattccaag5820

acgaggggttatggttgtttatggtgacattattcttaggcaaggtgtaatgcagctgac5880

acgaagtggcagctgtatcaatcttataattagcagtctgcagaaatccagagttaccaa5940

gctgtaaatcaacttgcctacttcggggtacagcaaacttatcaactgaaatactaccaa6000

agcacctgccatacactttggaagcatcgatattattacaaaacaaactctcagcctgaa6060

cataacgtaacaggctgcttaaattaaaattacaattctgaaaagtcttacgctcccagt6120

tgagaggggaggggactgacctagcagtaagccactcctctatattacaagctgggaggt6180

tagcaacacgccggtatacaactccaactggttggaccgtataaccggataactcataga6240

caccagtgctaggtaacatgctctgggtcttacattttatttcactggtataactactag6300

cacaatcaacagcactagtaatgacacccttctggttgaaattaaacaaatattggcgct6360

taaccaaaggtgtaacccaatagcgcggagcaaaagtgctaccagctgttgggttgcaga6420

tgaaaggtaacacataatactgtgttaaaatatcgccaatatatacactaaacaaaaacg6480

tagtagcggagggtttatccgcatagtacgcataaaaagtaccaccatgttggtaaaaat6540

gaaaataaaatgcatcagcattaacattaagcgtgaaatttcgctttaacacacaaattg6600

ggggttttacatccgtgtgccaaaaccctattaatttattaccattagtgttaggcttac6660

aatcagtgtaaggtaactgacaaatggtatactggcacactgaggccattataacaccat6720

tatatggctctattacaacggtataggaagtatagccaaacaaactacctataactatag6780

taggaaaatatgcagttgcacctgatggcgtacttgtcttaaggttctgcaccttcgcaa6840

atatgccatcattaaactgacttaaatagggtggttgaaaccacgacaagctaactgagt6900

tagttcccgtaagagcgaggtttctaaacttagaaccatcgaccgggtagtaaccagtaa6960

gcaataatgtggcatttaaataaactcgatctaacacataatatgtccccaggccttgtg7020

aaacttcaacggtctcagtgctaatgcttggagcactaacattagcaccgtttgaattca7080

caagctggatacatctaaaatcaccaatataccctaaacaagagggcaaaaatagaataa7140

acacgaacagcattcatttgtttacgttgaccaaatgattagaaaaaccacaaatggcgt7200

cattattacgcactagcaacttaccattcttcaacaaacctaacacaacatcactaatgg7260

atgaatcttttaaattaatgacaactgtagccttatgcttacaattgaacttgcttaaat7320

caagtacactattgtaagacatagtcataattgtggaattacgccagaagatataattgg7380

catgcatagtgttgccgtcaatcacagcgccacttgcaaaatcacctaaatagtgaacac7440

caattaagaatgcctctgacgatgacgtgttaacactggtacagaacattgtccaatact7500

caaacctctgaatgagttcatacaacttcttattccaactaaactccgtcaccttaatag7560

ctacagtaccaccaagtgccaacttttcggtgagtcaactggcacgatgttaccaccacg7620

acgaccaaaagtaagctctaactcttcaaggaagtaattacagttagaaaataacagcca7680

accacaaatgtttttggggcggctaccaaaagtgtccacatacgcactaagcttggtagt7740

gccgaccaccaccatgacatagtcttcgggaagcaatccctcaacagtgtcagcgagatc7800

gaaggacacgaaacggcattgcataaatccactagcggcggcctcagaatagtatgagac7860

ggcttcactagcagtgcaaaagccaagagctgaaatttctgcatcattggcaaaagccaa7920

tgtaacatggttgctagccatagccgacagttactggtttcaaactagacggaactagtt7980

atccacacaacccccagacggaaccggaggaaggctgtttgtctagtatgtagaaggcga8040

cggaacgccaaccaggaactagaggacagcacagcacttgcgatggctacttaagcaaac8100

ctaatgaaattccacgtcagcttccagcagcatggacatgcggccggaaggacaaaattt8160

cgtttagttgaattgagtagacaagagtct8190

<210>22

<211>770

<212>dna

<213>人工序列

<223>序列二二级片段a1

<400>22

atcgggtctcaaacggctcttcatcttccatataggctcgtcaagcggatctttgattac60

tcgtgcaaaggtttagatgaaaaggtactgcgttcccctcatgacagtgctatggtaata120

tccttcttgcactgacattaccactggcttaccgttgtgtgcaagaccaagaccgctagt180

tagagggcaaagccatagcccagcagccaagtcgctagaaaaacactcagtaataacagt240

gtaatggcactaccctgggacatagccaggataagccagtcaaacattgtttaatttcct300

gtgtcgaagatctcgttgataatttcaacggccgtgtcaccaccatcaacagctgtgtcc360

cattccaaattggcatgagtcacatcagatggcacacccacatcatcgtagatggcctct420

tcattcagctgctgcgtggtttcacgcttgttcttcttttccttctttctctggggtttt480

gcattcccagttttaaatgcatccacctgtgaaacaagaagctctacatttggatcagac540

tttggcacagtcattttataattatatgtaatctcgtaagagtccgctagctcacgaaca600

gccacattaccaccaaagagcaatgctgcaacatttggtgctaaactggcgatctgagca660

tagcctgaggcatcaacacctttttcgacaaattccgcatctccaaaatttttgaagcct720

cccctgggtccgaagcaagctgctacgctattttcgccctcgagacccat770

<210>23

<211>768

<212>dna

<213>人工序列

<223>序列二二级片段a2

<400>23

atcgggtctcacccttgggaattctcctccactctgggatgtctttgaggtcacgttctt60

tcgaagtggctctggatttgttcttcttaggtgtatttttgccgctgctgtcagaccttt120

cctgtttgggcttctgctgttgcttaagcttgtcagggttttcgccaatacccaaagatt180

taagggcatccttgacagcagccaccagatcatcgcgtgatgttacaccaccacggtcat240

ttgactggtttctgttcttggactggttacgagacttgttattgttattattattgcctc300

ctctgttctgagaagctccacgaccctggttatttccacgattctgtgaattaccgcggg360

actggttattgcctctgttgttacttggagatctggacctgttgttgccattaccacgac420

tcctgctacgtgaatttgcacgtgaagtaggaggtgtgttaggttcaacaatctcaacta480

cgctgggaagctgttgagagaaatttggaataattggcttttcagacgcctttctgacac540

ccaggttagtgggttcagtctttgcgccttctttagcaacccagaaaacaccctcagtac600

gagtcctatagcggaggtcggcgtgaggtcctgttccgaggtagtagaaatgccaattgg660

aaggttgttcaattcgctcaccacggcgcatgcgccagcgaatttgctcattccagtatc720

caatttgctggtccttatttcctttattagtgggtacacgagacccat768

<210>24

<211>698

<212>dna

<213>人工序列

<223>序列二二级片段a3

<400>24

atcgggtctcatacagcattatttgcaagtaccttagaaaggggtttgtcattagtaacc60

ctaagaggggcatagagggataatggcacccgtttgcggccacgatcctgaaaactgaca120

gaagccataaagtttctgtttagactaaatgaagcactttctcactatctgtgagaaccg180

aactcggattactcacagctgagtagtcgccgtgtttggaccggacatagaaagcccaac240

cagtgccagatgaagcattgactgaacgaccaacacgtccgtagacaattgttgtagtgg300

ccttggcgactgtgacgaaattaggtaattgacttacctgtacgccagtagcaaccttat360

agccctctacaagcaatgtaccactaaggagtgttagcgttacaccagttggtgctccaa420

gcactggaatgcagacctgtcggcccatcacagaagtagtgagaagcgcgtctgtttcag480

gattgaaagaccaccaagaatgtgtcctgcgccacaaccgaatgctattgacaaagtaca540

ttatccacagcataagagtgatgcaagccataaggatgctgaaagcaaaaaagacccaat600

tgacctgaaagctagcccatgcatcaaaaagtgacagtgctaacacaagaggccaaagta660

tccatagaatagccatcttgacaccatacgagacccat698

<210>25

<211>532

<212>dna

<213>人工序列

<223>序列二二级片段a4

<400>25

atcgggtctcacatacaagaacgcagagtacttgtaatggccatactgaagcactacaag60

tagtatcgtcagtatgatattccatgtgaaattccagtttctaaggtgttgaatcacctc120

atcaacgggaatagaaccgttagacatatttcgtttatacgtcaataacagtactaggga180

gggggtctatttgcatgtaagacttataaactctatacaaacgccctataggtatgtaaa240

ctgcgctattacacaaccggtgacaagtgaagcacagattaaccaattggacgaaagtaa300

tgcttataataagcaggaaaaagagtacgaaaagccaaagtataacattaactactagac360

cattatcattcactaattgtagcatactcgtctagttgaattgagtcaaatgcagcatta420

gtaatgccaacaatttgatgttgcgaaaagacataaagcttcttgccatcaagaagctca480

acagttcgcaacagctgtaggtcagcttcttgaagagcccgatgagaccgct532

<210>26

<211>772

<212>dna

<213>人工序列

<223>序列二二级片段b1

<400>26

atcgggtctcaaacggctcttcatcttgccgcccacgtatagctagatacaagtcgatgc60

tactaacaaaagcaacaaaagagttgccaaaagtgatgtaatggtcaccaccttctaaaa120

tcacaatggatttgccgtcataataagctgctttaccattgaggaaagaaagtgtcgtag180

tattaaaaataataaagagcgcatttttatagcgccaggagtaaaagcagactaaacaaa240

gcctgccaataagtgtgcaacaaataatagttgcatctaaaaatgcaccacaataatata300

aaagtgggcaataaagaacaatgacagcaaaacgcgctgccaacataatataattgcgcc360

tcaaagaagacgctttaaacagtgcaaagaagtagataaaaacactggtgaaaagaaaac420

ccgtcacatttgaagcttgtctaattggaactacattgagctccaactcttggacagcat480

ccaaagacaagttagcagactttgagacatctttgacaactgtgtcaatcgtgtattgaa540

aaagtccaagaaacatcactgcacgtggaccttttcaaaaacttcgtaaggttgaagtct600

aggacccctacaacaacctgagaaacaagcacagcagcagccgcagcatccacaacaacc660

cgtggaaatgcagcagaacactagtaatgacacaacaaagatgagaacaatgaaaataat720

caaccaaacccaccacggccactttcacatacatttcatatgcgagacccat772

<210>27

<211>840

<212>dna

<213>人工序列

<223>序列二二级片段b2

<400>27

atcgggtctcatatgtgccaacttccttgaggttgatgtagctctcatttaacttcttaa60

ttgcatcctgaatcctgttcatctcatacgtcaggtccagcaaagtaacatttaacttct120

cgaaatcgagagataaatcaggcgcaatagacgtctgattcttaaaccatttatctaact180

cctccttaaagtcgggtggattaggtattgaagtgttcaagaaaacttcaggtgcctttg240

tgtagtttactgcgcaactactcataatgacactgtttttatctgtaatgggttcagggt300

agtaatatgaactgcctgtgaacttccattctccatcatcttgaacaaaatatccagctt360

taggtgctaatcctctatcaccagaaatgcaaagtccaggactcacatttgcggttgtaa420

aggatattggcacatagctgaagtgtataaaatataagccataaggcgcattctggacaa480

gagataatatatgattaccattgccacagaaattaatacgcgtggtttggctcttaacgc540

actcattgaccttttctatggcctgagcagcactaactttaataagcgtactatcactaa600

gttgcttggatatatacgcattaagtgcagttaacctgccattaataagacgatctatct660

gggcttttgcttctacagcctcaagccgagttagaatttcttgtaaagaagcactaatag720

caccaaacctgttagaaagttgatttagtaagttattgagtgcttcagcatttgcattaa780

caacggactggatcttacctaaagcagaattggttgcatcaaacccatcccgagacccat840

<210>28

<211>789

<212>dna

<213>人工序列

<223>序列二二级片段b3

<400>28

atcgggtctcaatcctggatagcacccagcgcattgttaaaagcactagcaatcatcttt60

tggttctcactaagcacattcatagtgacacctaaaccattaattctatattgaacactt120

aaactaaatggcacaccggcagctgctgaccacggtgggaacatagctgccgcagtagca180

ccggttgtgtagccagagatctgactctctgacaacacaggaggtaatactttgatgcca240

ttaaaagattgtacacaaaggaggtcacgaacttcttgaccaccggtgcaattattataa300

gcctcgacaaagccaacatcagataatttgaccttgtcaaataacaaatcctctatagca360

gaacgccctcggattgcactaggtccattgccgtcttcagcacatgttgaacctatgcat420

ccaagtagaggactaaaattaatgtcatctatagggcctgagatgccgtctggcagtctc480

gagcttatagtaacaccctgcattaatgcactagcaacttgtagttgcatattatccaag540

aggttattaacctcattaagaatggcattaacattaacacagaaagagccatactcaacc600

aactgctgcctgcatgcagtgttatcaccacagacaaatgcagcacaatctatagtcacc660

tttggagatctagtttgaatgaactcctcatggtgcccaatagtaaaattggttggtatt720

tgcatctcatataatccatcaacggattggacactatcattaactaacatcggagtgtac780

gagacccat789

<210>29

<211>687

<212>dna

<213>人工序列

<223>序列二二级片段b4

<400>29

atcgggtctcatgtatggctcaaatgtagttaaccgatagccagtagaaactgatcggtg60

agccctgcgtgattttgaataatcaacgcataagccagcacccatacggagatcacaatt120

aggaagcgcctcatccgtgcggttatcagcattaacaacacaacccaaataactatcaaa180

gtaattaagtgggttctcctcacgggaaatattattgctaaaaacatagctacaatttat240

attacgatagagcagagccggttcgggtgcatctttatgaaatgcagcagaaacacggcc300

actataacagctccttatcgtataagtcttgttagtggtaagatcacgaaaaccattcaa360

attaccattaacatcatacagaagggtttgccagctattataatagtcagccttaacctc420

tttaaaaacaccttgtccagtaataccgtagaggtcatatttgacacaaatgccagtaac480

cacttcagtattaggcaactgcaaatctgtggaacatgtggtaccactattaatgccatt540

taacaatatattagcaaaaatttggcagcgatcattaacaaggcaggtatcatgtgacca600

tccaataaatgaattgttggcacagatacaacccttatgtggatcagcattgccacaatt660

atcttgaagagcccgatgagaccgcta687

<210>30

<211>698

<212>dna

<213>人工序列

<223>序列二二级片段c1

<400>30

atcgcgtctcaaacggctcttcatcttctaaaacacctaagccttcacaatggtcaccca60

cattaacaaaagcagacttaggcttagtctgagtagtgcaagggctaactatgtccggtt120

gagcacacgggcaataactagatcttacagtaaaacattgctgagcgtaaacaacgtcat180

gttggtttttgccaaagacgccagcatcattaaagccatacctcctattccaagacgagg240

ggttatggttgtttatggtgacattattcttaggcaaggtgtaatgcagctgacacgaag300

tggcagctgtatcaatcttataattagcagtctgcagaaatccagagttaccaagctgta360

aatcaacttgcctacttcggggtacagcaaacttatcaactgaaatactaccaaagcacc420

tgccatacactttggaagcatcgatattattacaaaacaaactctcagcctgaacataac480

gtaacaggctgcttaaattaaaattacaattctgaaaagtcttacgctcccagttgagag540

gggaggggactgacctagcagtaagccactcctctatattacaagctgggaggttagcaa600

cacgccggtatacaactccaactggttggaccgtataaccggataactcatagacaccag660

tgctaggtaacatgctctgggtcttacacgagacgcat698

<210>31

<211>598

<212>dna

<213>人工序列

<223>序列二二级片段c2

<400>31

atcgcgtctcatacattttatttcactggtataactactagcacaatcaacagcactagt60

aatgacacccttctggttgaaattaaacaaatattggcgcttaaccaaaggtgtaaccca120

atagcgcggagcaaaagtgctaccagctgttgggttgcagatgaaaggtaacacataata180

ctgtgttaaaatatcgccaatatatacactaaacaaaaacgtagtagcggagggtttatc240

cgcatagtacgcataaaaagtaccaccatgttggtaaaaatgaaaataaaatgcatcagc300

attaacattaagcgtgaaatttcgctttaacacacaaattgggggttttacatccgtgtg360

ccaaaaccctattaatttattaccattagtgttaggcttacaatcagtgtaaggtaactg420

acaaatggtatactggcacactgaggccattataacaccattatatggctctattacaac480

ggtataggaagtatagccaaacaaactacctataactatagtaggaaaatatgcagttgc540

acctgatggcgtacttgtcttaaggttctgcaccttcgcaaatatgcccgagacgcat598

<210>32

<211>586

<212>dna

<213>人工序列

<223>序列二二级片段c3

<400>32

atcgcgtctcatgccatcattaaactgacttaaatagggtggttgaaaccacgacaagct60

aactgagttagttcccgtaagagcgaggtttctaaacttagaaccatcgaccgggtagta120

accagtaagcaataatgtggcatttaaataaactcgatctaacacataatatgtccccag180

gccttgtgaaacttcaacggtctcagtgctaatgcttggagcactaacattagcaccgtt240

tgaattcacaagctggatacatctaaaatcaccaatataccctaaacaagagggcaaaaa300

tagaataaacacgaacagcattcatttgtttacgttgaccaaatgattagaaaaaccaca360

aatggcgtcattattacgcactagcaacttaccattcttcaacaaacctaacacaacatc420

actaatggatgaatcttttaaattaatgacaactgtagccttatgcttacaattgaactt480

gcttaaatcaagtacactattgtaagacatagtcataattgtggaattacgccagaagat540

ataattggcatgcatagtgttgccgtcaatcacagccgagacgcat586

<210>33

<211>820

<212>dna

<213>人工序列

<223>序列二二级片段c4

<400>33

atcgcgtctcacagcgccacttgcaaaatcacctaaatagtgaacaccaattaagaatgc60

ctctgacgatgacgtgttaacactggtacagaacattgtccaatactcaaacctctgaat120

gagttcatacaacttcttattccaactaaactccgtcaccttaatagctacagtaccacc180

aagtgccaacttttcggtgagtcaactggcacgatgttaccaccacgacgaccaaaagta240

agctctaactcttcaaggaagtaattacagttagaaaataacagccaaccacaaatgttt300

ttggggcggctaccaaaagtgtccacatacgcactaagcttggtagtgccgaccaccacc360

atgacatagtcttcgggaagcaatccctcaacagtgtcagcgagatcgaaggacacgaaa420

cggcattgcataaatccactagcggcggcctcagaatagtatgagacggcttcactagca480

gtgcaaaagccaagagctgaaatttctgcatcattggcaaaagccaatgtaacatggttg540

ctagccatagccgacagttactggtttcaaactagacggaactagttatccacacaaccc600

ccagacggaaccggaggaaggctgtttgtctagtatgtagaaggcgacggaacgccaacc660

aggaactagaggacagcacagcacttgcgatggctacttaagcaaacctaatgaaattcc720

acgtcagcttccagcagcatggacatgcggccggaaggacaaaatttcgtttagttgaat780

tgagtagacaagagtcttgaagagcccgatgagacggcta820

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1