一种长基因合成方法与流程

文档序号:15457432发布日期:2018-09-15 01:29

本发明属于生物领域,涉及一种长基因合成方法。



背景技术:

现代分子生物学、基因工程以及合成生物学对长基因合成的需求越来越大。在分子生物学领域,研究者为了表达蛋白或者探究某一通路的功能,经常需要重新设计并且从头构建大于10kb的质粒。合成生物学科学家构建的基因线路和代谢通路经常包含十几个甚至几十个原件,单个模块的长度经常在10kb甚至20kb以上。

基因组的重新设计和合成是合成生物学的研究热点之一。在2010年,Venter研究院从头合成了一种支原体基因组,并将其移植到一个细胞中,首次成功构建了人工合成生命。由约翰霍普金斯大学Boeke教授领导的一个国际团队也正在进行酿酒酵母基因组的重新设计及合成。在2016年,由哈佛大学Church教授和Boeke教授组织的一次研讨会正式将合成人类基因组的计划提上日程。这些基因组级别的DNA重新合成的研究对大片段的基因合成能力提出了新的挑战。

对绝大多数技术,一轮基因合成只能合成小于1kb的DNA片段。长基因的合成是通过DNA组装的方法来进行的。目前可用的DNA组装的技术有很多种,下面分别描述一些这些方法。传统的酶切连接技术可以分步的将合成的短基因片段连入目标载体,从而合成目标的长基因片段。然而酶切连接方法一般只能将单一片段连入目标载体,不能进行多片段的连接,使整个方法非常低效。同时,酶切连接方法非常依赖目标片段上独一无二的酶切位点,如果目标片段比较长,会严重限制酶切连接策略的选择。

Gibson组装是Venter研究院合成支原体基因组的过程中发明的组装技术。该技术利用体外同源重组的方法对多个DNA片段进行组装,但是重组过程需要片段之间存在同源臂。通常情况下,组装片段之间同源臂需要利用PCR的方法通过合成在引物5’端加入,这个特点致使组装大片段的时候比较容易发生突变。而且当Gibson组装的片段个数大于5个的时候,组装效率显著下降。

Golden Gate克隆技术利用IIs型核酸酶,通过边切边连的方法将多个片段组装在一起。有报道称Golden Gate克隆可以一次性将10个片段拼接在一起。但是Golden Gate克隆的一个最大的缺点是,当拼接序列内部存在所使用的IIs型核酸酶酶切位点的情况下,就无法使用该技术。

利用酿酒酵母的体内同源重组系统也是一种常用的拼接大片段的方法。但是酵母的生长周期为两天,而且将片段组装后,还需要转化大肠杆菌获得高浓度的片段。因此酵母体内组装的周期显著高于体外组装的周期,而且操作上也比体外组装复杂很多。这些都限制了酵母体内重组的广泛应用。

综上所述,每一种组装技术都有内在的优点和缺点,某一个技术可能适用于某一类特征的序列拼接,但是没有一种技术是普遍适用于所有的序列的合成。在提供长片段基因合成的服务过程中,客户的需求通常是多种多样的。比如,目标基因中或许会有存在IIs型核酸酶酶切位点,就无法使用Golden Gate克隆的方法。



技术实现要素:

本发明的目的是针对现有技术的上述不足,提供一种适用于3kb-50kb的长基因的合成方法,尤其是适用于长度大于8kb以上长基因的合成。

一种长基因合成方法,包含以下步骤:

1)按照基因片段内部的IIs型限制性内切酶酶切位点对长基因进行两级分段:首先计算IIs型限制性内切酶酶切位点的个数,选择位点个数最少的两个酶切位点对整个序列进行一级分段,在一级分段酶切位点处的分段方式为:将识别位点的前几个碱基分到上一段序列,同时将后几个碱基分到下一段序列,达到的效果是使每一段都没有完整的此IIs型核酸酶酶切位点;如果有一大段序列超过5kb,其中没有合适的IIs型核酸酶酶切位点将其分段,则人为的将其从靠中间的任意位置分成两段;之后再对一级片段进行二级分段,以使各个二级片段能够通过Golden Gate的方法进行拼接;

2)获得二级片段;

3)由二级片段利用Golden Gate拼接成一级片段;

4)由一级片段利用酶切-LCR的方法,或者PCR-LCR的方法拼接成全长基因。

二级片段通常通过传统基因合成方法获得,也可通过其他制备基因的方法得到。

长基因的合成流程每一步的详细操作步骤:

1.长基因进行两级分段方法优选如下:

首先计算整个序列中的BsaI、BsmBI、BbsI、BspQI等IIs型核酸酶酶切位点的个数,选择位点个数最少的两个酶切位点对整个序列进行一级分段。例如序列中有一个BsaI位点,两个BsmBI位点,而BbsI和BspQI位点比较多,则可以用序列中的BsaI和BsmBI共计三个位点将整段序列分成A1、A2、A3、A4共4段(图2)。如果有一大段序列超过5kb,其中没有合适的IIs型核酸酶酶切位点将其分段,可以人为的将其从靠中间的任意位置分成两段。将所选择的两个酶切位点,其中一个酶(比如BsaI)定义为A酶切位点,另一个(BsmBI)为B酶切位点(图2)。

在酶切位点处的分段方式为:将识别位点的前几个碱基分到上一段序列,同时将后几个碱基分到下一段序列,达到的效果是使每一段都没有完整的此IIs型核酸酶酶切位点(图3)。具体的,对BbsI(GAAGAC),将GAAGA分在前一段序列,将AAGAC分在后一段序列。BsaI(GGTCTC),BsmBI(CGTCTC),BspQI(GCTCTTC)处理方式于BsaI类似(图3)。

当一级片段拼接成全长基因采用酶切-LCR的方法,在每个一级分段片段的两端加上A酶切识别位点,作为最终的一级片段序列,对应的酶切-LCR中使用A酶进行酶切;当一级片段拼接成全长基因采用PCR-LCR的方法,则A酶切位点的加入不是必须的,即一级分段的两端可以加上A酶切识别位点,也可以不加上A酶切识别位点。

之后再对一级片段进行二级分段,以使各个二级片段可以通过Golden Gate的方法进行拼接。二级片段的分段的原则为:每个片段尽量等长但是每个片段不超过700bp;同一个片段内部没有大于20bp的重复;片段之间会有4bp的粘性末端,同一个一级片段内选择的粘性末端两两之间不能相同,且不能为回文序列。例如对于一个3kb的A2片段可以分成5段,每段约600bp(图4)。最后,在每个二级片段的两端加上B酶切识别位点(一级分段中的另一个酶切位点),作为最终的二级片段序列。

为了方便分段的粘性末端的选择以及后续获得稳定的组装效率,我们设计并测试了一组4bp的粘性末端:CCCT;TATG;ATCC;GCTG;TACA;GAGT;GTCG;TGCC;GAAC。

经过两级分段,可以将一段3kb-50kb的基因分成小于700bp若干段。将这些短片段分别合成后,可以利用两级合成方法拼接成全长。

2.二级片段的合成优选:

二级片段通过普通的基因合成获得,克隆到Amp抗性的pUC57载体上。

3.由二级片段拼接一级片段优选:

二级片段组装成一级片段通过B酶介导的Golden Gate克隆的方法实现(图5)。具体的,将各二级片段和对应的二级辅助载体混合,进行Golden Gate克隆反应,转化大肠杆菌感受态,涂布Kan抗性平板,挑取正确克隆。

4.由一级片段拼接基因全长优选:

一级片段拼接为全长可以通过两种方法实现:

1)通过PCR-LCR的方法拼接全长(图6)。具体的,设计PCR引物,将一级片段所有片段和pUC57载体骨架扩增出来。PCR引物的设计应使扩增片段首尾相接同时没有重叠区域。之后,将PCR片段和Bridging Oligo合并进行LCR反应。反应液转化大肠杆菌感受态,涂布Amp抗性平板,挑取正确克隆。

2)通过酶切-LCR的方法拼接全长(图7)。具体的,将所有的一级片段和一级辅助载体混合在一起,用A酶进行酶切。之后将酶切混合物和Bridging Oligo合并进行LCR反应。反应液转化大肠杆菌感受态,涂布Amp抗性平板,挑取正确克隆。

其中,Bridging Oligo为LCR反应术语,指辅助两个片段拼接的Oligo,与两个片段的末端均有同源片段。

二级辅助载体是拼接二级片段用的,一级辅助载体是拼接一级片段用的。辅助载体对应片段的数量不确定,从2-12都可以,优选2-5条。图4和图5有具体的展示。

辅助载体的构建:

此基因合成流程需要使用一级辅助载体和二级辅助载体,它们均由pUC57载体改造而来。其中二级载体需要满足:带有Kan抗性标记;lacZα片段两端各带有一个IIs型核酸酶酶切位点;两端的IIs型核酸酶酶切位点分别切出“AACG”和“CCGA”的4bp的粘性末端或者“TCT”的3bp的粘性末端;整个载体的其他位置没有所对应IIs型核酸酶酶切位点(图1)。二级辅助载体可以直接作为Golden Gate克隆的载体骨架来使用,同时还可以进行蓝白斑筛选。在本技术方案中,二级辅助载体与二级片段组装,得到一级载体。

一级辅助载体需要满足:带有Amp抗性,lacZalpha片段两端各带有一段Linker序列和一个IIs型限制性内切酶酶切位点,整个载体的其他位置没有所对应IIs型核酸酶酶切位点(图1)。一级辅助载体可以直接作为载体骨架用于酶切-LCR克隆,同时还可以进行蓝白斑筛选。在本技术方案中,一级辅助载体与一级片段进行组装,获得合成基因的全长。

有益效果

1.此方法使用IIs型核酸酶酶切位点对大片段基因进行分段,IIs型核酸酶酶切位点有很多可供选择,因此方法适用于绝大部分的序列。

2.如果使用酶切-LCR的方法将一级片段组装成基因全长,整个组装流程可以完全避免PCR的反应,从而将突变发生的可能性降到最低。

3.能够快速的将短片段拼接成长片段。由二级片段拼接成全长可以在五天内实现。

4.整个技术方案流程化,可以利用软件进行自动化设计,同时可以使用自动化平台进行生产。

附图说明

图1:二级辅助载体图谱

图2:一级片段分段方法示例。

图3:一级片段断点处酶切位点序列处理方法

图4:二级片段分段方法示例

图5:由二级片段利用Golden Gate克隆拼接成一级片段

图6:通过PCR-LCR的方法拼接全长

图7:通过酶切-LCR的方法拼接全长

图8:序列一的一级分段

图9:序列一的一级和二级分段片段大小

图10:序列二的一级分段

图11:序列二的一级和二级分段片段大小

具体实施方式

实施例1:辅助载体的构建

以pUC57-Kan-BsmBI-free1为模板,利用引物Level1pUC57-Kan-BbsI-1/Level1pUC57-Kan-BbsI-2扩增获得pUC57-Kan骨架,Level1lacZa-Kan-BbsI-1/Level1lacZa-Kan-BbsI-2扩增获得lacZα片段。所使用的引物序列为:

Level1pUC57-Kan-BbsI-1 tgacGAAGACtaGGCAGCTGCATGTGTCAGAGG

Level1pUC57-Kan-BbsI-2 tgacGAAGACatTGAGCTCGCTCACTGACTCGCT

Level1lacZa-Kan-BbsI-1 gtacGAAGACtaTGCCaacgCgagaccCACGACAGGTTTCCCGACTGGA

Level1lacZa-Kan-BbsI-2 gatcGAAGACgcCTCAtcggCgagaccTGTCGGGGCTGGCTTAACTAT

PCR反应体系为:10XPBO Buffer 5μL,10mM dNTPs 0.8μL、上游引物1μL、下游引物1μL、模板DNA1μL、PBO DNA Polymerase 1μL、无菌水至50μL。反应程序为:95℃预变性5min;95℃变性15s,55℃退火15s,72℃延伸30s,30个循环;最后72℃延伸反应10min。

通过BbsI介导的Golden Gate将pUC57-Kan和lacZα片段拼接获得pUC57level1-Kan-BsaI。配制如下的反应体系:pUC57-Kan和lacZα片段各1μL、T4DNA ligase buffer(NEB)2μL、BbsI(NEB)1μL、T4DNA ligase(NEB)1μL、无菌水至20μL。反应程序为:step 1:37℃3min;step 2:16℃5min;Step1-step2共10个循环。Step3:37℃15min;Step 4:55℃5min;Step 5 80℃5min;完成Golden Gate组装。获得的最终载体pUC57level1-Kan-BsaI序列见SEQ ID NO.1。

pUC57-Kan-BsmBI-free1为不含BsmBI的pUC57载体,其序列见SEQ ID NO.2。

pUC57level1-Kan-BsmBI的构建与pUC57level1-Kan-BsaI构建过程相同,其使用的引物序列为:

Level1pUC57-Kan-BsmBI-1 tgacGAAGACtaGGCAGCTGCATGTGTCAGAGG

Level1pUC57-Kan-BsmBI-2 tgacGAAGACatTGAGCTCGCTCACTGACTCGCT

Level1lacZa-Kan-BsmBI-3 gtacGAAGACtaTGCCaacgCgagacgCACGACAGGTTTCCCGACTGGA

Level1lacZa-Kan-BsmBI-4 gatcGAAGACgcCTCAtcggCgagacgTGTCGGGGCTGGCTTAACTAT

pUC57level1-Kan-BbsI的构建与pUC57level1-Kan-BsaI构建过程相同,其使用的引物序列为:

Level1pUC57-Kan-BbsI-1 tgacGGTCTCaGGCAGCTGCATGTGTCAGAGG

Level1pUC57-Kan-BbsI-2 tgacGGTCTCtTGAGCTCGCTCACTGACTCGCT

Level1lacZa-Kan-BbsI-3 gtacGGTCTCaTGCCaacgCggtcttcCACGACAGGTTTCCCGACTGGA

Level1lacZa-Kan-BbsI-4 gatcGGTCTCcCTCAtcggCggtcttcTGTCGGGGCTGGCTTAACTAT

pUC57level1-Kan-BspQI的构建与pUC57level1-Kan-BsaI构建过程相同,其使用的引物序列为:

Level1pUC57-Kan-BspQI-1 tgacGGTCTCaGGCAGCTGCATGTGTCAGAGG

Level1pUC57-Kan-BspQI-2 tgacGGTCTCtTGAGCTCGCTCACTGACTCGCT

Level1lacZa-Kan-BspQI-3 gtacGGTCTCaTGCCtctAgaagagcCACGACAGGTTTCCCGACTGGA

Level1lacZa-Kan-BspQI-4 gatcGGTCTCcCTCAagaCgaagagcTGTCGGGGCTGGCTTAACTAT

pUC57level2-Amp-BsaI的构建方法如下:

以pUC57-BsaI free(SEQ ID NO.3)为模板,利用引物pUC57-BsmBI-1/pUC57-BsmBI-2扩增获得pUC57骨架,lacZα-BsmBI-1/lacZα-BsmBI-2扩增获得lacZα片段。PCR反应体系为:10XPBO Buffer 5μL,10mM dNTPs 0.8μL、上游引物1μL、下游引物1μL、模板DNA1μL、PBO DNA Polymerase 1μL、无菌水至50μL。反应程序为:95℃预变性5min;95℃变性15s,55℃退火15s,72℃延伸30s,30个循环;最后72℃延伸反应10min。

通过BsmBI介导的Golden Gate将pUC57和lacZα片段拼接获得pUC57level2-Amp-BsaI。配置如下的反应体系:pUC57和lacZα片段各1μL、T4DNA ligase buffer(NEB)2μL、BsmBI(NEB)1μL、T4DNA ligase(NEB)1μL、无菌水至20μL。反应程序为:step 1:42℃2min;step 2:16℃5min;Step1-step2共20个循环。Step 3:55℃10min;Step 4:80℃10min;完成Golden Gate组装。如果使用的TypIIs是BsaI或者BbsI,反应程序如下:step 1:37℃3min;step 2:16℃5min;Step1-step2共10个循环。Step3:37℃15min;Step 4:55℃5min;Step 5 80℃5min。

将上述反应液中取出10μl转化至DH5α感受态细胞,涂布在Amp抗性显色平板上。长出的蓝色克隆活化后直接测序,确认正确后,将此克隆保种。

过程中使用的引物序列如下:

Level2pUC57-BsaI-1:

TCAGcgtctcCggattacgccgctttcctatcttgggcctcgtgatacgcctat

Level2pUC57-BsaI-2:

TCAGcgtctcCcccttttacagcaggacaaccgcctcgctcactgactcgctgcgc

Level2lacZa-BsaI-1::

TCAGcgtctcTatcccaggcaatagcgaaaagggaacgCgagaccCACGACAGGTTTCCCGACTGG

Level2lacZa-BsaI-2:

TCAGcgtctcTagggttcccgatagttctgcgtatcggCgagaccTGTCGGGGCTGGCTTAACTATG

pUC57level2-Amp-BsmBI的构建与pUC57level1-Amp-BsaI构建过程相同,其使用的引物序列为:

Level2pUC57-BsmBI-1:

TCAGggtctcCggattacgccgctttcctatcttgggcctcgtgatacgcctat

Level2pUC57-BsmBI-2:

TCAGggtctcCcccttttacagcaggacaaccgcctcgctcactgactcgctgcgct

Level2lacZa-BsmBI-1:

TCAGggtctcTatcccaggcaatagcgaaaagggaacgCgagacgCACGACAGGTTTCCCGACTGG

Level2lacZa-BsmBI-2:

TCAGggtctcTagggttcccgatagttctgcgtatcggCgagacgTGTCGGGGCTGGCTTAACTATG

pUC57level2-Amp-BbsI的构建与pUC57level1-Amp-BsaI构建过程相同,其使用的引物序列为:

Level2pUC57-BbsI-1:

TCAGggtctcCggattacgccgctttcctatcttgggcctcgtgatacgcctat

Level2pUC57-BbsI-2:

TCAGggtctcCcccttttacagcaggacaaccgcctcgctcactgactcgctgcgct

Level2lacZa-BbsI-3:

TCAGggtctcTatcccaggcaatagcgaaaagggaacgCGgtcttcCACGACAGGTTTCCCGACTGG

Level2lacZa-BbsI-4:

TCAGggtctcTagggttcccgatagttctgcgtatcggCGgtcttcTGTCGGGGCTGGCTTAACTATG

pUC57level2-Amp-BsmBI的构建与pUC57level1-Amp-BsaI构建过程相同,其使用的引物序列为:

Level2pUC57-BsaI-1:

TCAGggtctcCggattacgccgctttcctatcttgggcctcgtgatacgcctat

Level2pUC57-BsaI-2:

TCAGggtctcCcccttttacagcaggacaaccgcctcgctcactgactcgctgcgct

Level2lacZa-BsaI-5:

TCAGggtctcTatcccaggcaatagcgaaaagggtctAgaagagcCACGACAGGTTTCCCGACTG

Level2lacZa-BsaI-6:

TCAGggtctcGagggttcccgatagttctgcgtaagaCgaagagcTGTCGGGGCTGGCTTAACTAT

pUC57level2-Amp-BspQI的构建与pUC57level1-Amp-BsaI构建过程相同,其使用的引物序列为:

Level2pUC57-BspQI-1:

TCAGggtctcCggattacgccgctttcctatcttgggcctcgtgatacgcctat

Level2pUC57-BspQI-2:

TCAGggtctcCcccttttacagcaggacaaccgcctcgctcactgactcgctgcgct

Level2lacZa-BspQI-5:

TCAGggtctcTatcccaggcaatagcgaaaagggtctAgaagagcCACGACAGGTTTCCCGACTG

Level2lacZa-BspQI-6:

TCAGggtctcGagggttcccgatagttctgcgtaagaCgaagagcTGTCGGGGCTGGCTTAACTAT

实施例2:序列一的合成示例

序列一(SEQ ID NO.4)的分析显示,序列共含有1个BsaI位点、7个BbsI位点、2个BsmBI位点和1个BspQI位点,选择BsaI和BsmBI对序列进行分段。在进行长基因合成的过程中,二级组装采用BsaI Golden Gate,一级组装采用PCR产物进行LCR反应。利用BsaI和BsmBI位点将序列分为四段,对于其中大于5Kb的一段再利用特定的碱基(在后续组装中作为粘性末端)将其分为两段,最终将全长分成A,B,C,D,E共5个片段,如图8所示。

将A,B,C,D,E五个一级片段再次继续的分成二级片段,便于进行基因合成。分段的原则为:每个片段尽量等长但是每个片段不超过700bp;同一个片段内部没有大于20bp的重复;片段之间会有4bp的粘性末端,同一个一级片段内选择的粘性末端两两之间不能相同,且不能为回文序列。由此分成的二级的片段共16个,序列见SEQ ID NO.5-SEQ ID NO.20。一级和二级片段大小如图9所示。

二级片段通过普通的基因合成获得。设计引物。合成得到的引物,将每条引物稀释至50μM,将所有的引物进行混合并稀释10倍(Oligo Mix中每条引物浓度为5μM)。配制第一轮PCR反应体系:10XPBO Buffer 5μL、10mM dNTPs 1μL、Oligo Mix 10μL、PBO DNA Polymerase1μL、无菌水至50μL。反应程序为:95℃预变性5min;95℃变性30s,58℃退火30s,72℃延伸30s,25个循环;最后72℃延伸反应10min。第二轮PCR以第一轮PCR反应的产物作为模板,反应体系:一轮PCR产物10μL、10XPBO Buffer 5μL、10mM dNTPs 1μL、首尾引物各1μL、PBO DNA Polymerase 1μL、无菌水至50μL。反应程序为:95℃预变性5min;95℃变性30s,58℃退火30s,72℃延伸30s,30循环;最后72℃延伸反应10min。PCR产物进行纯化。将基因合成得到的片段通过平末端连接至EcoRV酶切后的pUC57-BsaI free载体,酶连产物转入Top10感受态细胞,涂布在Amp抗性显色平板上,将白斑活化后测序。

利用BsaI Golden Gate把二级片段拼接成A,B,C,D,E一级片段。

反应体系:含二级片段的载体各100ng、pUC57level1-Kan-BsaI 100ng、T4DNA ligase buffer(NEB)2μL、BsaI(NEB)1μL、T4DNA ligase(NEB)1μL、无菌水至20μL。反应条件:step 1:37℃3min;step 2:16℃5min;Step1-step2共10个循环。Step3:37℃15min;Step 4:55℃5min;Step 5 80℃5min;完成Golden Gate组装。将上述反应液中取出10μl转化至Top10感受态细胞,涂布在Kan抗性显色平板上。取两个白斑抽提质粒,进行酶切验证(如BsmBI),正确的质粒命名为pUC57level1-Kan-A,pUC57level1-Kan-B,pUC57level1-Kan-C,pUC57level1-Kan-D,pUC57level1-Kan-E。

一级组装利用PCR产物进行LCR。具体的,以二级片段中验证正确的质粒为模板,通过以下引物分别扩增得到A,B,C,D,E五个片段;一级载体采用PCR的方式扩增获得。引物序列如下:

具体操作步骤为,以扩增A片段为例,PCR反应体系:10XPBO Buffer 5μL,10mM dNTPs0.8μL、A-F 1μL、A-R 1μL、模板(pUC57level1-Kan-A)50ng、PBO DNA Polymerase 1μL、无菌水至50μL。反应程序为:95℃预变性5min;95℃变性15s,55℃退火15s,72℃延伸90s,30个循环;最后72℃延伸反应10min。B,C,D,E片段获取方式与A片段一致。一级载体骨架的获取以pUC57level2-Amp-BsmBI为模板,以Vector-F和Vector-R为引物进行扩增,体系与获取A片段的体系一致。

之后,片段和载体进行磷酸化处理,具体的,将需要进行组装的片段和载体骨架混合起来进行磷酸化。反应体系为:10XT4PNK Buffer:5μL;片段ABCDE和一级载体骨架每个片段各3nM;10mM ATP:5μL;T4Polynucleotide Kinase:1μL;Total:50μL。

片段的加入量需要根据片段的大小和浓度,及其磷酸化产物回收效率进行计算后添加,保证各个片段的量符合后续LCR反应要求(每个片段需要3nM)。37℃反应30min后,按照纯化PCR产物的方式进行过柱回收或者乙醇沉淀法进行回收。LCR反应中DNA parts在片段和载体骨架磷酸化处理时已经混合在一起,因此在此步骤时只需要加入磷酸化后的回收产物。LCR体系为:DNA parts(A,B,C,D,E,一级载体骨架),3nM each;10xAmpligase Buffer,2.5μL;ssDNA bridging oligo,30nM each;DMSO,8%(v/v);Betaine,0.45M;Ampligase,2μL;H2O至25μL。反应条件为:Step 1:94℃2min;Step 2:94℃10sec;Step 3:55℃30sec;Step 4:66℃60sec;Repeat 2-4 50cycles;Step 5:4℃Hold。

其中ssDNA bridging oligo序列如下:

bridging oligo1:

gcaacgatctgcatcagccatCGTTcccttttcgctattgcctgggattacg

bridging oligo2:

cacgtacgtttcatcggtttacccatcatctgttcgttatcaaacagttcaccgtgccagg

bridging oligo3:

gctgactttcagattgctacgaccgcctgagacggtacacagataaacgtcacgattgtt

bridging oligo4:

cgcgacggggtgcctgagaccatgtcgatgcgttgacctgaaatcagg

bridging oligo5:

ttcgttgatcggcgaaaattcgacgcgagacgtacgcatttcgtgcgg

bridging oligo6:

agggttcccgatagttctgcgtatcggttacaggttacaatcagcacgacaaatggaatacac

反应产物取2.5μL转化至Top10感受态细胞,涂布于Amp抗性显色平板。对白斑进行PCR验证,正确的克隆送测序。测序结果显示合成的基因序列正确。

实施例3:序列二的合成示例

对序列二(SEQ ID NO.21)的分析显示序列共含有1个BsaI位点、3个BbsI位点、1个BsmBI位点,在进行长基因合成的过程中,二级组装采用BsaI Golden Gate或者BsmBI Golden Gate,一级组装采用BspQI酶切产物进行LCR反应。利用碱基TCT将全长分成A,B,C共3个片段,如图10所示。将A,B,C三个一级片段的两端均加上BspQI的酶切识别位点,之后再次继续的分成二级片段,便于进行基因合成。二级片段分段的原则为:每个片段尽量等长但是每个片段不超过700bp;同一个片段内部没有大于20bp的重复;片段之间会有4bp的粘性末端,同一个一级片段内选择的粘性末端两两之间不能相同,且不能为回文序列。由此分成的二级的片段共12个,序列见(SEQ ID NO.22-SEQ ID NO.33)。一级和二级片段大小如图11所示。

该序列二级片段的合成过程与序列一相同。

序列二的的二级组装过程使用Golden Gate进行。其中A和B片段使用BsaI Golden Gate连接。C片段使用BsmBI Golden Gate连接。反应体系:二级片段各100ng、pUC57level1-Kan-BsaI 100ng、T4DNA ligase buffer(NEB)2μL、BsaI(NEB)或者BsmBI(NEB)1μL、T4DNA ligase(NEB)1μL、无菌水至20μL。BsaI Golden Gate反应条件:step 1:37℃3min;step 2:16℃5min;Step1-step2共10个循环。Step3:37℃15min;Step 4:55℃5min;Step 5 80℃5min;完成Golden Gate组装。BsmBI Golden Gate反应条件:step 1:42℃2min;step 2:16℃5min;Step1-step2共20个循环。Step 4:55℃10min;Step 5 80℃10min;完成Golden Gate组装。将上述反应液中取出10μl转化至Top10感受态细胞,涂布在Kan抗性显色平板上。取两个白斑抽提质粒,进行酶切验证(如BspQI),正确的质粒命名为pUC57level1-Kan-A,pUC57level1-Kan-B,pUC57level1-Kan-C。

一级组装通过BspQI酶切LCR完成。具体的将pUC57level2-Amp-BspQI用BspQI进行酶切,酶切产物进行胶回收。pUC57level1-Kan-A,pUC57level1-Kan-B,pUC57level1-Kan-C可以分别用BspQI进行酶切,酶切产物分别进行胶回收。在此步骤中,可以将pUC57level1-Kan-A,pUC57level1-Kan-B,pUC57level1-Kan-C混合在一起酶切;进行混合酶切时需要保证每个质粒加入的摩尔数一致。

LCR体系为:DNA parts(A,B,C,D,E,一级载体骨架),3nM each;10xAmpligase Buffer,2.5μL;ssDNA bridging oligo,30nM each;DMSO,8%(v/v);Betaine,0.45M;Ampligase,2μL;H2O至25μL。反应条件为:Step 1:94℃2min;Step 2:94℃10sec;Step 3:55℃30sec;Step 4:66℃60sec;Repeat 2-4 50cycles;Step 5:4℃Hold。

其中ssDNA bridging oligo序列如下:

bridging oligo1:

aaagatccgcttgacgagcctatatggaagacccttttcgctattgcctgggattacg

bridging oligo2:

gacttgtatctagctatacgtgggcggcaagaagctgacctacagctgttgcgaactgttg

bridging oligo3:

ggtgaccattgtgaaggcttaggtgttttagaagataattgtggcaatgctgatccacataagggt

bridging oligo4:

tgtaaaagggttcccgatagttctgcgtaagactcttgtctactcaattcaactaaacgaaattttgtccttc

反应产物取2.5μL转化至Top10感受态细胞,涂布于Amp抗性显色平板。对白斑进行PCR验证,正确的克隆送测序。测序结果显示合成的基因序列正确。

SEQUENCE LISTING

<110> 南京金斯瑞生物科技有限公司

<120> 一种长基因合成方法

<130> 1

<160> 33

<210> 1

<211> 2453

<212> DNA

<213> 人工序列

<223> 载体pUC57level1-Kan-BsaI

<400> 1

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctgcca acgcgagacc 60

cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa tgtgagttag 120

ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat gttgtgtgga 180

attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta cgccaagctt 240

gcatgcaggc ctctgcagtc gacgggcccg ggatccgata tctagatgca ttcgcgaggt 300

accgagctcg aattcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt 360

tacccaactt aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga 420

ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg aatggcgaat ggcgcctgat 480

gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatatggt gcactctcag 540

tacaatctgc tctgatgccg catagttaag ccagccccga caggtctcgc cgatgagctc 600

gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 660

ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 720

aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 780

ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 840

aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 900

gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 960

tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 1020

tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 1080

gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 1140

cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 1200

cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 1260

agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 1320

caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 1380

ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 1440

aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caagcccaat 1500

ctgaataatg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg agcatcaaat 1560

gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa agccgtttct 1620

gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc tggtatcggt 1680

ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg tcaaaaataa 1740

ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat ggcaaaagtt 1800

tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca tcaaaatcac 1860

tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgaggcga aatacgcgat 1920

cgctgttaaa aggacaatta caaacaggaa tcgaatgcaa ccggcgcagg aacactgcca 1980

gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg aatgctgttt 2040

ttccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata aaatgcttga 2100

tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca tctgtaacat 2160

cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg ggcttcccat 2220

acaagcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat ttatacccat 2280

ataaatcagc atccatgttg gaatttaatc gcggcctcga cgtttcccgt tgaatatggc 2340

tcataacacc ccttgtatta ctgtttatgt aagcagacag ttttattgtt catgatgata 2400

tatttttatc ttgtgcaatg taacatcaga gattttgaga cacgggccag agc 2453

<210> 2

<211> 2453

<212> DNA

<213> 人工序列

<223> 载体pUC57-Kan-BsmBI-free1

<400> 2

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctgcca acgcgagacg 60

cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa tgtgagttag 120

ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat gttgtgtgga 180

attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta cgccaagctt 240

gcatgcaggc ctctgcagtc gacgggcccg ggatccgata tctagatgca ttcgcgaggt 300

accgagctcg aattcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt 360

tacccaactt aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga 420

ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg aatggcgaat ggcgcctgat 480

gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatatggt gcactctcag 540

tacaatctgc tctgatgccg catagttaag ccagccccga cacgtctcgc cgatgagctc 600

gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 660

ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 720

aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 780

ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 840

aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 900

gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 960

tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 1020

tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 1080

gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 1140

cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 1200

cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 1260

agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 1320

caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 1380

ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 1440

aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caagcccaat 1500

ctgaataatg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg agcatcaaat 1560

gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa agccgtttct 1620

gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc tggtatcggt 1680

ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg tcaaaaataa 1740

ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat ggcaaaagtt 1800

tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca tcaaaatcac 1860

tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgaggcga aatacgcgat 1920

cgctgttaaa aggacaatta caaacaggaa tcgaatgcaa ccggcgcagg aacactgcca 1980

gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg aatgctgttt 2040

ttccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata aaatgcttga 2100

tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca tctgtaacat 2160

cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg ggcttcccat 2220

acaagcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat ttatacccat 2280

ataaatcagc atccatgttg gaatttaatc gcggcctcga cgtttcccgt tgaatatggc 2340

tcataacacc ccttgtatta ctgtttatgt aagcagacag ttttattgtt catgatgata 2400

tatttttatc ttgtgcaatg taacatcaga gattttgaga cacgggccag agc 2453

<210> 3

<211> 2710

<212> DNA

<213> 人工序列

<223> 载体pUC57-BsaI free

<400> 3

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt acctcgcgaa 420

tgcatctaga tatcggatcc cgggcccgtc gactgcagag gcctgcatgc aagcttggcg 480

taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat tccacacaac 540

atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca 600

ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat 660

taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc 720

tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 780

aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 840

aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 900

ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 960

acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 1020

ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 1080

tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 1140

tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 1200

gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 1260

agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 1320

tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 1380

agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 1440

tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 1500

acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 1560

tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa 1620

agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc 1680

tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact 1740

acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg agatccacgc 1800

tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt 1860

ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta 1920

agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg 1980

tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt 2040

acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc 2100

agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt 2160

actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc 2220

tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc 2280

gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa 2340

ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac 2400

tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa 2460

aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt 2520

tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa 2580

tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct 2640

gacgtctaag aaaccattat tatcatgaca ttaacctata aaaataggcg tatcacgagg 2700

ccctttcgtc 2710

<210> 4

<211> 10654

<212> DNA

<213> 人工序列

<223> 序列一

<400> 4

atggctgatg cagatcgttg cctgatgtgt ttccgtccgg tgtgtgacct ggtttgtccg 60

gctgatgttc gtccggcggc tgttatccag gctctgcatc tggataacga atcaggcgcg 120

ggtctgcgtc tgggcgacgg tacggcatgc ctgaattgca atgatccgaa atgcgaaaaa 180

gcgtgtgcac gcggccgtat tgatcatgca attcagattc gtgacatctg ccgtgccctg 240

agcggtcaag aaaagaaaca agttaacggt aaagcggatc tgagcgtgga cttctgtggt 300

gtgcgttgcg aaaacccgtt tctgctggct tccagcccgg tcgccagcag ttacgaaatg 360

tgctgtcgcg cgtttgacca gggttgggca ggtgttgcgt acaaaaccat tagcttttat 420

caaacgcgcg aagtgagccc gcgtttcgac tgcctgccgc cgcgttcatc gtcgagcttt 480

cagggtttta aaaacctgga acagctgagc ccgtataccg ccgaagaaaa cttcgatatt 540

ctgtgtcgcc tgaaagaaaa atatccggaa aaagtgatca ttgcgtctat catgggtcag 600

acgaccgaag aatggaccac gctggcgcgt atggcagaag aagcgggcgc agacatggtg 660

gaatgcaact tcagctgtcc gcagatggcg aaacagggcc tgggtagcga cattggccag 720

tccccggaac tgatcagcct gtatacccag acgacccgta aaggttgtgg tctgccgatt 780

atcgcgaaaa tgaccccgaa cgcaggtaat atggaaccgc tggcagtcgc ggcagtgacg 840

tcaggcgcag atagcgtggc agcgatcaac acgattaaat ccatcacccg tatccatccg 900

gaaaactaca gctcgtttcc ggatattgaa ggtaaaagcg ctgtcggtgg ctacagcggt 960

cgtgcggtga aaccgattgc gctgcgtttc attcgcgatc tggcggtgta tccgccgctg 1020

gcaggtgtta gcctgtgcgg tattggcggt attacgacct ggcgtgatgc gatggatttt 1080

ctgctgctgg gttgtgatac cgtgcaagtt tgtaccagcg tgatggaata cggttatcgc 1140

atcatcgacc acctgaaaga aggtctgtcg atctatatgc aagaaaaagg ctacaatcgc 1200

gtcgaagaat ttcgtggcaa agcgctgccg catatcgtcc tgccggaaca gctgaaccgt 1260

aaccgccgtc tggtttgcga aatcgatcgt caatcgtgta tcggttgtgg ccgttgctat 1320

ctgtcgtgtc aagatggcgg tcatcaggca atccgttggg acggtcatcg tccgcaggtg 1380

gaagaaacca aatgcgtggg ctgtggtctg tgcaccctgg tctgcccgac ggaagcgatt 1440

ggtctgaaag aagtccacga cattggctaa tatgaatcct atctaataat cttgtattat 1500

gaaacaaacc gcaccgctga gcaaatcaca gtatggcatc tatgtcgaat gtatgaacca 1560

cgttggcgaa atctattata acaccgcatt cgtcttccgc ctggacggct cgctggatgg 1620

tcaaaaactg tgcaaagccg tggaagctac ggtgatggcc cacccggccc tgtttacccg 1680

cattgctctg aacgatgata atgaaccggt gcagagcgtt ggtctgtccg aagaaacctg 1740

gagcctggac gtggaaccgg tcgaagacat tgatcaagca ctgtcaggcc tgattcaacc 1800

gttcgatctg cataaagatc gcctgtttcg catccgtctg ttcaaagatg cagaatattt 1860

tcacctgttt gttgacattc atcacatcgt gaacgatggc acgtcacagg cgatctttct 1920

gcaagacatt gaaacggcat ataacggcga accgattgct ccggaatgca tcacgctgtg 1980

tgaacaggcg accgaagaag ttggcctgcg tgcaaccgct gaatttgaag aaggcaaaca 2040

atggtacgca cgcaattttg attgtgcgga tacgtttacg ggcctgaccc cggatctgga 2100

agaagaaggc cgtgaagaag gcacgctgcg ccgcacgctg gccgttaacc tggaagcagt 2160

ggatgcgttt tgtaaagaac acggcatctt taaatcgaac tttttcacga tggcgtatgc 2220

atttctgctg gcaaaataca acaacgaaca ggaatctttc ttcacgatgg tgtataacgg 2280

ccgctcagac aaacgtctgg ctcgtacgat cggcatgttc gtgaaaagcg tcccggtttt 2340

cacgaaattc acgagcgata cgtcagtgat ggaactgctg cgtaatggcc aagaacaaat 2400

gggtggctgt cgcaaacatg aagcatacag cttcgtggat tttatgcagg atattgcacc 2460

gcagtacgac aatatgtttg cctggcacgg tgaactgttt gataacgaac agatgatggg 2520

taaaccgatg aaacgtacgt ggctgatgga ttctccgctg gacatccaac tgtacctgaa 2580

agcgtttatt gaaaatggta aatgtcagat tgtggcagaa tacaatgcaa aagcgtactc 2640

acaagaactg gtctgccaat tcatggaatc ctatgaagcg gtcgtcaatg gctttctgag 2700

ccaagaattt ctgcgtgata ttagcatcgt gaccgaatcg cagaccacgg tcctggactc 2760

ctttaatcgc accgactgcg aatatgatga cacccagacg atcgtgagtc tgttccgtcg 2820

ccaggctgaa gccaccccgg ataatgtggc actgatctat aaagataaac gttttaccta 2880

tagccagatc gacgaaatta gcgaccgcat cgcggcacgc atcgcttcga tgggcctggg 2940

cgccgaagac gtggtttcaa ttctgatttc acgttgcgaa tggatgggca tcattccgat 3000

gggtgtgctg aaagcaggct gcgcgtacca gccgctggac ccgacgtacc cgaaagaacg 3060

cctgaacttc atgatgaaag atgcgggtgt gtcactgctg atcgcggatg aaggcctgcg 3120

tccgctggca gatgaatttc aaggtgaaac gctgtttacc ggtgaactga tggatctgcc 3180

gcgtgcggaa gtgcaaccgg ttgcaccgag tccgtctagc ctgtttatcc tgctgtatac 3240

gagcggctcg accggtattc cgaaaggttg tcagctggaa catggcaatc tggttgcttt 3300

ctgtcactgg tatcagtcgt actacggtct gcatgcgggt gataaagtgg cagcatacgc 3360

atctttcggt ttcgatgctt ccatgatgga tatgtatccg gcactgacct gcggcgcaac 3420

ggtgtgcatc attccggaag aaatccgtct ggacctgatg gcgctgaatg aatatctgga 3480

acaaaatggt gtcacgcact cgtttatgac cacgcaggtc ggctatcagt ttgcaaccag 3540

cattgaaaat cgctcgctgc gtcatctgtc caccggcggc gaaaaactgg tttcgctggc 3600

accgccgcaa gaatataatt tttataatgt gtatggtccg accgaaacca cgattctggt 3660

tacggcatac cgtatcacgc aaaaactgaa agaaatcccg attggtaaac cgctggataa 3720

tatgaaactg tacattgtgg ataatcatgg ccaccgcctg ccggtgggtg cggctggtga 3780

actgtggatt tccggcccgc aggtgtcacg cggttacctg aaccgtccgg aaaaaaccca 3840

ggaagtgtat atcgcgaacc cgttcaccga caatgaaaaa tatgcgcgta tctaccgctc 3900

aggcgatgtg gtccgctatc tgccgtcagg cgacatccaa tttgtgggcc gtcgtgatgg 3960

tcaagtgaaa attcgtggct ttcgcatcga actgaaagaa gtcgaaggta tcatccgcga 4020

atttccgggt attaaagacg ccacggttca ggcattcgat gaagaaggtg gtggcaaatt 4080

catcgcagcg tatatcgttt cggatgaaca aatcgacatt gaagcgctga accgctttat 4140

cctggaagaa aaaccgccgt atatggtgcc ggcagttacc atgcagattg atagcattcc 4200

gctgaaccaa aaccaaaaag ttaacaaacg tgtcctgccg aaaccggaaa agaaaccggt 4260

gtccgttgcc gaaggtaatg tgccgatgaa tgtgctggaa acggaactgc atcaactgat 4320

cgcggccatc gtcaatcatg aaaactttgg cgtcaccacg gtgctgggct atgcaggcct 4380

gaccagcatc acggcaatta aactggcagt gcaaatcaac aaacgctatg gcgttgtggt 4440

ggacgcgaaa tcgctggtta aaaatggtac gctgcaaagc atcgaaaacg aaatcctgcg 4500

taaaatgctg cacgatgcgt cggcggacgg tcgtcaggaa gaagcggtga aaaaggaaat 4560

tgttacgtcg gcgccgctgt cgtacgcgca aaccggtgtc tatttcgaat gcatgaaaaa 4620

cccgtttagc accgtttata acatcccgtg cctgctgacc tatccgagcg gtacggacgc 4680

atgccaactg gcagatgcag tgaaaaccgt tatccatgca catacggcga tgaacattcg 4740

ttttgaaacc cagggcgaag gtgttcgtca gtatctggat gccgacctgg cgattcaagt 4800

tccggtcaaa gcgatgacgg aagaagaact gaccctgtac aaagaagaat ttgtgcgtcc 4860

gtttaacctg caaaaagccc cgctgtggcg ttttgaagtc atcgaaaccc cgtcggccgt 4920

gcacctgctg atggatgtgc atcacctgat ctttgacggc ggttcggttg acctgtttat 4980

tcgtcaggtt agcgaagcac tggaaggcca aaccgtttcg aaagaaacgt ataccttcct 5040

ggatttcgtg cacgaccaaa tgcaggccga acagaccgaa tccttccgta aagcggaaaa 5100

attcttcgca gaaaaactgc aagcatgcga aggtgcgtcg gaagttccgg ccgatctgca 5160

aaaaaccgat aaagaatcac gtatcggtga agcatgctgt ccggtgaatc atgaagaagt 5220

ggcacgcttc tgtcgtagcc acgacattac cccggcacac ctgttctacg cagcagttac 5280

gtatgttgtg tcccgttaca cgaacaatcg tgacgtttat ctgtgtaccg tctcaggcgg 5340

tcgtagcaat ctgaaagtca gcgaaaccgt gggcatgttt gtgaataccc tggccctggg 5400

tctgtccgtt gacgatgtca cggttgaaga cttcctgcaa acggcgagcc gtacctttac 5460

cgaaaccctg gaaaacgaaa actatccgtt cgcgcgcatc gcatcagatt atggcttcca 5520

gccggccatt gcttacgctt atcaagtcgg tgtgctgtcc gcttattcgc tgaaaggtca 5580

atcaattggt caggaagtcc tggaactgga cgtcccgaaa tttaaaatta acatccagat 5640

ccagtcacaa ggtgtggtgg tggaatacga cgatgccctg tattcccgtt cggtcggcga 5700

agcactggca gaaagcattg tcgccgtggt tgaacgcatg atgcaaatgc cgtccgaacg 5760

tattcgttca ctgagcatcg tgagccgtaa acaggctacg gcactggaca aagttcgcac 5820

gacgggcagc ggtgaatctc cgtttcgcct gttccacgaa tgcattcacc attatgcggt 5880

ggtggcgccg gatcgcgaag ccctggttgc gtgcgatgca acgttcacct atgctgaaat 5940

ggatgaactg accgatcgca tcgcaagtgg tctgcgcgct cgcggtgtgc tgccgcgcga 6000

ccgtgtggcg ctgctgctgc cgcgtagctc gcgcctgatt ctgtcgctgt ttggcgtgct 6060

gaaagccgaa gcatcttaca ttccgtgtga tccggaatat ccggctgatc gcgtcaaata 6120

tatcctggaa gattcgggct cagcatacat catcacggat ggcaatcatg ctaaaggcct 6180

gccgaaagac aaagtgatcg atgtggaagg cctggtcaaa catccgattg aacgctgggc 6240

accgtcgatt acgagtgacg atctggccta tattatttat acgtctggct cgaccggtaa 6300

accgaaaggt gtgatgctgc gtcatgaagg tatttgtaac tatctgaccg cgcacccggc 6360

aaatgtgctg gcacatgcag tgcaggccga tacggaacgt atcctgagtg tgacgacgat 6420

tagctttgac gcggcgctgc aagacattgg cacggcattc tttaatggca aaaccctggt 6480

cctggctacg gaagaacagg caaataaccc gattgaactg gcacgcctga tttcaggtca 6540

acgcatcgac atggtctcag gcaccccgtc gcgctggctg acgtggctga ccagcggcga 6600

ctttgctgaa gcaatccgtt acattcgcat cgctcgtgcg ggcggtgaaa aattctccgg 6660

tcagctgctg gaactgctga aagcgaaaac gtcggcgcgc atttttaact gctatggccc 6720

gacggaaacc accgtcgcct caaataataa agaactgacg cacgcggttt cggtgaccgt 6780

tggtaaaccg cagctgaacg ttaaagaatt tgtggttgat caggacggca atgaactgcc 6840

ggtcggtgtt gtcggcgaac tgtatattgg cggtcgtggc gtggcgcgcg gttacaataa 6900

tctggatgac atgacccgcg aacgcttcat cgcctaccag ggcgaacgtg tttataaatc 6960

cggcgactac gcgaaatgga acgcggatgg cgacatcgtt atcctgggcc gcaccgacaa 7020

tcaaatcaaa ctgcgtggtc tgcgcattga actgggtgaa attgaaaacg tgatgctgaa 7080

agtcgaaggc ctggaaaaag tcgtgatcct gattcgtaaa ctgaacgaca aagaacatct 7140

gtgtgcgtac tacacggccg atcgcccgat cgcgccggat gctctgaaag cagaaatctc 7200

aaaatcgctg acccaatata tggttccgac cgcatatctg caagtcgata aaatgccgat 7260

gaccccgtcg ggcaaaaccg acgtgaaagc gctgccggaa ccggtgctgg ccgtgtctag 7320

tgcgtatgaa gccccggcca atccgacgga acatattttc tgcgatattt ttgcaagcgt 7380

gctgcaaatc gacaaagtcg gcgcaaccga taacttcttc gaaagcggtg gcaccagcct 7440

ggtggtcacg cgcgttatta ttgaagcgga caaagcaggt ctgcgcatca cgtacggtga 7500

cgtgttcgcg catccgaccc cgcgtcaact ggcacgtctg gtcaacggtg ataaagaaac 7560

cgacggtcag gatgaagttg cagactatga ctatggtatc attaactcgc tgctgaaaag 7620

caatacgctg gaagcattta aaaagggcga acgtctgtcg ctgggcaatg tgctgctgac 7680

cggcgctacc ggctatctgg gtattcacat cctgaaagaa ctgatcggtt cggacattgc 7740

acacatctat tgcctggtgc gtgacaaaaa cctggaagcg gcagaacgcc gtctgaaaac 7800

cctgctgttt tattaccatg atgacgaatt ttcttcactg ttcggtaacc gtattcatct 7860

ggtcctgggt gatgtgaccc aaaccatcga cgaaacgctg ccggttgaca ccgtgttcaa 7920

ttgcgcagcc gttgtcaaac atttcagcga aggcacgttc atcgaagacg ttaatatcgg 7980

tggcgcccag cattgtgtgg atttctgcct gaaaaagaat gcacgtctgg tgcatatctc 8040

taccgcctcc acccgtggtc tgtcggttaa tggtattccg gactcccagg aagtgtttac 8100

cgaacaaaaa ctgtatatgg gtcagtatct gggtaacaaa tatatctaca gcaaattcat 8160

ggcggaacgt ctgatcctgg aagctattgc cacgcagggc ctgagtgcaa aaattatgcg 8220

cgtgggtaac ctggccgcgc gcagcaccga tggcgaattt caaatcaact ttctgacgaa 8280

tagctttatg ggccgcatta aagtgtacaa tatgctgggt tgctgcccgc acgaaatgcg 8340

tacgtctcgc gtcgaatttt cgccgatcaa cgaagtgagc aaagcgattc tgctgctggc 8400

gagcaccccg aaagaatgct gcgtctttca tccgtttaac attcacacgc agttcctggg 8460

cgacgtcctg gaagtgctga aatcggtcac gggcggtatt gactttgttg aaatggaaca 8520

atttgaagaa gtgatggaaa aagcaaaatc agacccgacc aaagcaaaaa tcctgtcctc 8580

gctgctggca tatcaggaca tggcgcacgg ccaaaaaacg tctgacgtca atcgcgataa 8640

ttcgtacacc acccaggttc tgtttcgtct gggctttaat tggagcgcca cgtcttggga 8700

ttacattgaa cgtatgctgc acgctatctg cggtctgggt ttctttgaca tctaaatgaa 8760

agaaaccaat gaaaaagacc gtgaactgag cgttgtgttc tggcgttacc tgtggagcag 8820

catcctgatt agcctgtcgg cgtcggtggg caccgttgtc gatggtatca ttgtgggcaa 8880

tctgattggt gaagatggtg tctcggcagt gaacctgagc agtccgatga ttcagctgct 8940

gttcaccatc agcctggtcg ttgcatcagg cgcgggcatg ctgatcggtt ttgcactggg 9000

ccaaaaagac ggtcgtcgtg tccgctacat ttttaccctg agcatggtgg cgtcgctgct 9060

ggttggtgtg ctgtttacgg gtgcgggttt ttacttctcg gattctatta cccgcgcatt 9120

ttgccacgat gattacctgt tcacgtacac ccatgattat ctgaaagtga tcctgattgg 9180

cgcgccgagc ttcatgatgc tgtgggaaat cagcgcagtg attggtgtgg acggctcgcc 9240

gcgtctggca tcgctggcga ttatcgtgga taatctggtc aacctgtgtc tggacattgt 9300

gtttatcgaa tatgtgggct ggggcattgc gggctcggca gcagcgaccg ttgtgggtca 9360

cctggtgggc attctgatca tgctgcgtca ttttaaaggt aaaggcaatt cgctgacgtt 9420

ttcgctgacg cacgataaac cggaatttct gaacatcgtg ctgcaaggcg cgccgctggc 9480

gatcgcatcc gtgtgcctga ccctgctgct ggtgtcagca aatcacgtgt ttctgagtgc 9540

gaaaggccaa aatggtatct tcgtgtttgc tgtgtgcatg aacctgctgc aaatttacaa 9600

tatgtatatc agcggcacct gtcgtaccct gcaatcactg ggtgcggtgc agattggcaa 9660

aaatgatgac catgcgttca gtctgatcct gcgcaaatca tttctgttca ttaccgtgag 9720

catggctgtg acctgcctgc tgatttgcct gtttccgggt gtgatttcgc gtgcctttgg 9780

tgcagatagc ccggaagtga ttgcggaatg caatcatgtc ttccgcattt ttgcggtgtc 9840

cttcattccg ttttgttaca tctacctgat tatgatcgtt tataaactgt acaaacagga 9900

ttgcatggcc ctgttcatta gctttgcact gtcgctgacc gtgatcccgg tgctgctgct 9960

gtttttccac tatgcgccgc agtatctgtg gtacagctat ctggtggcgt acctgctgga 10020

aatcgtcgca atctttgtgc tgcataaact gacccacgct cgtctgtccc tgtgaaatga 10080

tatggtgctg ctgacggaag acatctggag ttttaacctg gacgctgcct ggcaagaaat 10140

ctcgggtcaa cgccgcgaat acgccctgaa atatcgtacc gaactggatc gtcgcctgtg 10200

tgtgcgtgca tatctgctgc tgtgtgaagg tctgcgtaaa ggctatggta ttaccagcgt 10260

gccgctgttt gaatttggca aatacggtaa accgatgctg gtcggttatc cggatattca 10320

tttcagcatt tcgcattgcc cggaagcagt gatctgtgtg ctggatgaca atccggtggg 10380

cgtcgatatt gaactggtgt cgagctttga cgaacaggtt gcgcgttatg cgatgaacca 10440

ggaagaactg cgccagatca aaagctcttc acgcccggat gtggaatttg cgtgtctgtg 10500

gacccgtaaa gaagccgtgc tgaaacagtc cggttttggc ctgagcgata acgtgaaaga 10560

agttctgacc gcacatccgc tgccggtgga aacgtttatt tcccgcaacc tgcattatgt 10620

gtattccatt tgtcgtgctg attgtaacct gtaa 10654

<210> 5

<211> 668

<212> DNA

<213> 人工序列

<223> 序列一二级片段A1

<400> 5

agtcggtctc gaacgtctcg aacgatggct gatgcagatc gttgcctgat gtgtttccgt 60

ccggtgtgtg acctggtttg tccggctgat gttcgtccgg cggctgttat ccaggctctg 120

catctggata acgaatcagg cgcgggtctg cgtctgggcg acggtacggc atgcctgaat 180

tgcaatgatc cgaaatgcga aaaagcgtgt gcacgcggcc gtattgatca tgcaattcag 240

attcgtgaca tctgccgtgc cctgagcggt caagaaaaga aacaagttaa cggtaaagcg 300

gatctgagcg tggacttctg tggtgtgcgt tgcgaaaacc cgtttctgct ggcttccagc 360

ccggtcgcca gcagttacga aatgtgctgt cgcgcgtttg accagggttg ggcaggtgtt 420

gcgtacaaaa ccattagctt ttatcaaacg cgcgaagtga gcccgcgttt cgactgcctg 480

ccgccgcgtt catcgtcgag ctttcagggt tttaaaaacc tggaacagct gagcccgtat 540

accgccgaag aaaacttcga tattctgtgt cgcctgaaag aaaaatatcc ggaaaaagtg 600

atcattgcgt ctatcatggg tcagacgacc gaagaatgga ccacgctggc gcgtatgcga 660

gaccgact 668

<210> 6

<211> 588

<212> DNA

<213> 人工序列

<223> 序列一二级片段A2

<400> 6

agtcggtctc gtatggcaga agaagcgggc gcagacatgg tggaatgcaa cttcagctgt 60

ccgcagatgg cgaaacaggg cctgggtagc gacattggcc agtccccgga actgatcagc 120

ctgtataccc agacgacccg taaaggttgt ggtctgccga ttatcgcgaa aatgaccccg 180

aacgcaggta atatggaacc gctggcagtc gcggcagtga cgtcaggcgc agatagcgtg 240

gcagcgatca acacgattaa atccatcacc cgtatccatc cggaaaacta cagctcgttt 300

ccggatattg aaggtaaaag cgctgtcggt ggctacagcg gtcgtgcggt gaaaccgatt 360

gcgctgcgtt tcattcgcga tctggcggtg tatccgccgc tggcaggtgt tagcctgtgc 420

ggtattggcg gtattacgac ctggcgtgat gcgatggatt ttctgctgct gggttgtgat 480

accgtgcaag tttgtaccag cgtgatggaa tacggttatc gcatcatcga ccacctgaaa 540

gaaggtctgt cgatctatat gcaagaaaaa ggctacacga gaccgact 588

<210> 7

<211> 666

<212> DNA

<213> 人工序列

<223> 序列一二级片段A3

<400> 7

agtcggtctc gtacaatcgc gtcgaagaat ttcgtggcaa agcgctgccg catatcgtcc 60

tgccggaaca gctgaaccgt aaccgccgtc tggtttgcga aatcgatcgt caatcgtgta 120

tcggttgtgg ccgttgctat ctgtcgtgtc aagatggcgg tcatcaggca atccgttggg 180

acggtcatcg tccgcaggtg gaagaaacca aatgcgtggg ctgtggtctg tgcaccctgg 240

tctgcccgac ggaagcgatt ggtctgaaag aagtccacga cattggctaa tatgaatcct 300

atctaataat cttgtattat gaaacaaacc gcaccgctga gcaaatcaca gtatggcatc 360

tatgtcgaat gtatgaacca cgttggcgaa atctattata acaccgcatt cgtcttccgc 420

ctggacggct cgctggatgg tcaaaaactg tgcaaagccg tggaagctac ggtgatggcc 480

cacccggccc tgtttacccg cattgctctg aacgatgata atgaaccggt gcagagcgtt 540

ggtctgtccg aagaaacctg gagcctggac gtggaaccgg tcgaagacat tgatcaagca 600

ctgtcaggcc tgattcaacc gttcgatctg cataaagatc gcctgtttcg catcccgaga 660

ccgact 666

<210> 8

<211> 715

<212> DNA

<213> 人工序列

<223> 序列一二级片段A4

<400> 8

agtcggtctc gatccgtctg ttcaaagatg cagaatattt tcacctgttt gttgacattc 60

atcacatcgt gaacgatggc acgtcacagg cgatctttct gcaagacatt gaaacggcat 120

ataacggcga accgattgct ccggaatgca tcacgctgtg tgaacaggcg accgaagaag 180

ttggcctgcg tgcaaccgct gaatttgaag aaggcaaaca atggtacgca cgcaattttg 240

attgtgcgga tacgtttacg ggcctgaccc cggatctgga agaagaaggc cgtgaagaag 300

gcacgctgcg ccgcacgctg gccgttaacc tggaagcagt ggatgcgttt tgtaaagaac 360

acggcatctt taaatcgaac tttttcacga tggcgtatgc atttctgctg gcaaaataca 420

acaacgaaca ggaatctttc ttcacgatgg tgtataacgg ccgctcagac aaacgtctgg 480

ctcgtacgat cggcatgttc gtgaaaagcg tcccggtttt cacgaaattc acgagcgata 540

cgtcagtgat ggaactgctg cgtaatggcc aagaacaaat gggtggctgt cgcaaacatg 600

aagcatacag cttcgtggat tttatgcagg atattgcacc gcagtacgac aatatgtttg 660

cctggcacgg tgaactgttt gataacgaac agacgagacg ccgacgagac cgact 715

<210> 9

<211> 752

<212> DNA

<213> 人工序列

<223> 序列一二级片段B1

<400> 9

agtcggtctc gaacgtctcg cagatgatgg gtaaaccgat gaaacgtacg tggctgatgg 60

attctccgct ggacatccaa ctgtacctga aagcgtttat tgaaaatggt aaatgtcaga 120

ttgtggcaga atacaatgca aaagcgtact cacaagaact ggtctgccaa ttcatggaat 180

cctatgaagc ggtcgtcaat ggctttctga gccaagaatt tctgcgtgat attagcatcg 240

tgaccgaatc gcagaccacg gtcctggact cctttaatcg caccgactgc gaatatgatg 300

acacccagac gatcgtgagt ctgttccgtc gccaggctga agccaccccg gataatgtgg 360

cactgatcta taaagataaa cgttttacct atagccagat cgacgaaatt agcgaccgca 420

tcgcggcacg catcgcttcg atgggcctgg gcgccgaaga cgtggtttca attctgattt 480

cacgttgcga atggatgggc atcattccga tgggtgtgct gaaagcaggc tgcgcgtacc 540

agccgctgga cccgacgtac ccgaaagaac gcctgaactt catgatgaaa gatgcgggtg 600

tgtcactgct gatcgcggat gaaggcctgc gtccgctggc agatgaattt caaggtgaaa 660

cgctgtttac cggtgaactg atggatctgc cgcgtgcgga agtgcaaccg gttgcaccga 720

gtccgtctag cctgtttatc ccgagaccga ct 752

<210> 10

<211> 680

<212> DNA

<213> 人工序列

<223> 序列一二级片段B2

<400> 10

agtcggtctc gatcctgctg tatacgagcg gctcgaccgg tattccgaaa ggttgtcagc 60

tggaacatgg caatctggtt gctttctgtc actggtatca gtcgtactac ggtctgcatg 120

cgggtgataa agtggcagca tacgcatctt tcggtttcga tgcttccatg atggatatgt 180

atccggcact gacctgcggc gcaacggtgt gcatcattcc ggaagaaatc cgtctggacc 240

tgatggcgct gaatgaatat ctggaacaaa atggtgtcac gcactcgttt atgaccacgc 300

aggtcggcta tcagtttgca accagcattg aaaatcgctc gctgcgtcat ctgtccaccg 360

gcggcgaaaa actggtttcg ctggcaccgc cgcaagaata taatttttat aatgtgtatg 420

gtccgaccga aaccacgatt ctggttacgg cataccgtat cacgcaaaaa ctgaaagaaa 480

tcccgattgg taaaccgctg gataatatga aactgtacat tgtggataat catggccacc 540

gcctgccggt gggtgcggct ggtgaactgt ggatttccgg cccgcaggtg tcacgcggtt 600

acctgaaccg tccggaaaaa acccaggaag tgtatatcgc gaacccgttc accgacaatg 660

aaaaatatgc gagaccgact 680

<210> 11

<211> 721

<212> DNA

<213> 人工序列

<223> 序列一二级片段B3

<400> 11

agtcggtctc gtatgcgcgt atctaccgct caggcgatgt ggtccgctat ctgccgtcag 60

gcgacatcca atttgtgggc cgtcgtgatg gtcaagtgaa aattcgtggc tttcgcatcg 120

aactgaaaga agtcgaaggt atcatccgcg aatttccggg tattaaagac gccacggttc 180

aggcattcga tgaagaaggt ggtggcaaat tcatcgcagc gtatatcgtt tcggatgaac 240

aaatcgacat tgaagcgctg aaccgcttta tcctggaaga aaaaccgccg tatatggtgc 300

cggcagttac catgcagatt gatagcattc cgctgaacca aaaccaaaaa gttaacaaac 360

gtgtcctgcc gaaaccggaa aagaaaccgg tgtccgttgc cgaaggtaat gtgccgatga 420

atgtgctgga aacggaactg catcaactga tcgcggccat cgtcaatcat gaaaactttg 480

gcgtcaccac ggtgctgggc tatgcaggcc tgaccagcat cacggcaatt aaactggcag 540

tgcaaatcaa caaacgctat ggcgttgtgg tggacgcgaa atcgctggtt aaaaatggta 600

cgctgcaaag catcgaaaac gaaatcctgc gtaaaatgct gcacgatgcg tcggcggacg 660

gtcgtcagga agaagcggtg aaaaaggaaa ttgttacgtc ggcgccgctg cgagaccgac 720

t 721

<210> 12

<211> 790

<212> DNA

<213> 人工序列

<223> 序列一二级片段B4

<400> 12

agtcggtctc ggctgtcgta cgcgcaaacc ggtgtctatt tcgaatgcat gaaaaacccg 60

tttagcaccg tttataacat cccgtgcctg ctgacctatc cgagcggtac ggacgcatgc 120

caactggcag atgcagtgaa aaccgttatc catgcacata cggcgatgaa cattcgtttt 180

gaaacccagg gcgaaggtgt tcgtcagtat ctggatgccg acctggcgat tcaagttccg 240

gtcaaagcga tgacggaaga agaactgacc ctgtacaaag aagaatttgt gcgtccgttt 300

aacctgcaaa aagccccgct gtggcgtttt gaagtcatcg aaaccccgtc ggccgtgcac 360

ctgctgatgg atgtgcatca cctgatcttt gacggcggtt cggttgacct gtttattcgt 420

caggttagcg aagcactgga aggccaaacc gtttcgaaag aaacgtatac cttcctggat 480

ttcgtgcacg accaaatgca ggccgaacag accgaatcct tccgtaaagc ggaaaaattc 540

ttcgcagaaa aactgcaagc atgcgaaggt gcgtcggaag ttccggccga tctgcaaaaa 600

accgataaag aatcacgtat cggtgaagca tgctgtccgg tgaatcatga agaagtggca 660

cgcttctgtc gtagccacga cattaccccg gcacacctgt tctacgcagc agttacgtat 720

gttgtgtccc gttacacgaa caatcgtgac gtttatctgt gtaccgtctc aggcgccgac 780

gagaccgact 790

<210> 13

<211> 634

<212> DNA

<213> 人工序列

<223> 序列一二级片段C1

<400> 13

agtcggtctc gaacgcgtct caggcggtcg tagcaatctg aaagtcagcg aaaccgtggg 60

catgtttgtg aataccctgg ccctgggtct gtccgttgac gatgtcacgg ttgaagactt 120

cctgcaaacg gcgagccgta cctttaccga aaccctggaa aacgaaaact atccgttcgc 180

gcgcatcgca tcagattatg gcttccagcc ggccattgct tacgcttatc aagtcggtgt 240

gctgtccgct tattcgctga aaggtcaatc aattggtcag gaagtcctgg aactggacgt 300

cccgaaattt aaaattaaca tccagatcca gtcacaaggt gtggtggtgg aatacgacga 360

tgccctgtat tcccgttcgg tcggcgaagc actggcagaa agcattgtcg ccgtggttga 420

acgcatgatg caaatgccgt ccgaacgtat tcgttcactg agcatcgtga gccgtaaaca 480

ggctacggca ctggacaaag ttcgcacgac gggcagcggt gaatctccgt ttcgcctgtt 540

ccacgaatgc attcaccatt atgcggtggt ggcgccggat cgcgaagccc tggttgcgtg 600

cgatgcaacg ttcacctatg ctgcgagacc gact 634

<210> 14

<211> 657

<212> DNA

<213> 人工序列

<223> 序列一二级片段C2

<400> 14

agtcggtctc ggctgaaatg gatgaactga ccgatcgcat cgcaagtggt ctgcgcgctc 60

gcggtgtgct gccgcgcgac cgtgtggcgc tgctgctgcc gcgtagctcg cgcctgattc 120

tgtcgctgtt tggcgtgctg aaagccgaag catcttacat tccgtgtgat ccggaatatc 180

cggctgatcg cgtcaaatat atcctggaag attcgggctc agcatacatc atcacggatg 240

gcaatcatgc taaaggcctg ccgaaagaca aagtgatcga tgtggaaggc ctggtcaaac 300

atccgattga acgctgggca ccgtcgatta cgagtgacga tctggcctat attatttata 360

cgtctggctc gaccggtaaa ccgaaaggtg tgatgctgcg tcatgaaggt atttgtaact 420

atctgaccgc gcacccggca aatgtgctgg cacatgcagt gcaggccgat acggaacgta 480

tcctgagtgt gacgacgatt agctttgacg cggcgctgca agacattggc acggcattct 540

ttaatggcaa aaccctggtc ctggctacgg aagaacaggc aaataacccg attgaactgg 600

cacgcctgat ttcaggtcaa cgcatcgaca tggtcttgag acgccgacga gaccgac 657

<210> 15

<211> 632

<212> DNA

<213> 人工序列

<223> 序列一二级片段D1

<400> 15

agtcggtctc gaacgtctca gtctcaggca ccccgtcgcg ctggctgacg tggctgacca 60

gcggcgactt tgctgaagca atccgttaca ttcgcatcgc tcgtgcgggc ggtgaaaaat 120

tctccggtca gctgctggaa ctgctgaaag cgaaaacgtc ggcgcgcatt tttaactgct 180

atggcccgac ggaaaccacc gtcgcctcaa ataataaaga actgacgcac gcggtttcgg 240

tgaccgttgg taaaccgcag ctgaacgtta aagaatttgt ggttgatcag gacggcaatg 300

aactgccggt cggtgttgtc ggcgaactgt atattggcgg tcgtggcgtg gcgcgcggtt 360

acaataatct ggatgacatg acccgcgaac gcttcatcgc ctaccagggc gaacgtgttt 420

ataaatccgg cgactacgcg aaatggaacg cggatggcga catcgttatc ctgggccgca 480

ccgacaatca aatcaaactg cgtggtctgc gcattgaact gggtgaaatt gaaaacgtga 540

tgctgaaagt cgaaggcctg gaaaaagtcg tgatcctgat tcgtaaactg aacgacaaag 600

aacatctgtg tgcgtactac acgagaccga ct 632

<210> 16

<211> 584

<212> DNA

<213> 人工序列

<223> 序列一二级片段D2

<400> 16

agtcggtctc gtacacggcc gatcgcccga tcgcgccgga tgctctgaaa gcagaaatct 60

caaaatcgct gacccaatat atggttccga ccgcatatct gcaagtcgat aaaatgccga 120

tgaccccgtc gggcaaaacc gacgtgaaag cgctgccgga accggtgctg gccgtgtcta 180

gtgcgtatga agccccggcc aatccgacgg aacatatttt ctgcgatatt tttgcaagcg 240

tgctgcaaat cgacaaagtc ggcgcaaccg ataacttctt cgaaagcggt ggcaccagcc 300

tggtggtcac gcgcgttatt attgaagcgg acaaagcagg tctgcgcatc acgtacggtg 360

acgtgttcgc gcatccgacc ccgcgtcaac tggcacgtct ggtcaacggt gataaagaaa 420

ccgacggtca ggatgaagtt gcagactatg actatggtat cattaactcg ctgctgaaaa 480

gcaatacgct ggaagcattt aaaaagggcg aacgtctgtc gctgggcaat gtgctgctga 540

ccggcgctac cggctatctg ggtattcaca tcccgagacc gact 584

<210> 17

<211> 671

<212> DNA

<213> 人工序列

<223> 序列一二级片段D3

<400> 17

agtcggtctc gatcctgaaa gaactgatcg gttcggacat tgcacacatc tattgcctgg 60

tgcgtgacaa aaacctggaa gcggcagaac gccgtctgaa aaccctgctg ttttattacc 120

atgatgacga attttcttca ctgttcggta accgtattca tctggtcctg ggtgatgtga 180

cccaaaccat cgacgaaacg ctgccggttg acaccgtgtt caattgcgca gccgttgtca 240

aacatttcag cgaaggcacg ttcatcgaag acgttaatat cggtggcgcc cagcattgtg 300

tggatttctg cctgaaaaag aatgcacgtc tggtgcatat ctctaccgcc tccacccgtg 360

gtctgtcggt taatggtatt ccggactccc aggaagtgtt taccgaacaa aaactgtata 420

tgggtcagta tctgggtaac aaatatatct acagcaaatt catggcggaa cgtctgatcc 480

tggaagctat tgccacgcag ggcctgagtg caaaaattat gcgcgtgggt aacctggccg 540

cgcgcagcac cgatggcgaa tttcaaatca actttctgac gaatagcttt atgggccgca 600

ttaaagtgta caatatgctg ggttgctgcc cgcacgaaat gcgtacgtct cgcgtcccga 660

cgagaccgac t 671

<210> 18

<211> 833

<212> DNA

<213> 人工序列

<223> 序列一二级片段E1

<400> 18

agtcggtctc gaacgcgtct cgcgtcgaat tttcgccgat caacgaagtg agcaaagcga 60

ttctgctgct ggcgagcacc ccgaaagaat gctgcgtctt tcatccgttt aacattcaca 120

cgcagttcct gggcgacgtc ctggaagtgc tgaaatcggt cacgggcggt attgactttg 180

ttgaaatgga acaatttgaa gaagtgatgg aaaaagcaaa atcagacccg accaaagcaa 240

aaatcctgtc ctcgctgctg gcatatcagg acatggcgca cggccaaaaa acgtctgacg 300

tcaatcgcga taattcgtac accacccagg ttctgtttcg tctgggcttt aattggagcg 360

ccacgtcttg ggattacatt gaacgtatgc tgcacgctat ctgcggtctg ggtttctttg 420

acatctaaat gaaagaaacc aatgaaaaag accgtgaact gagcgttgtg ttctggcgtt 480

acctgtggag cagcatcctg attagcctgt cggcgtcggt gggcaccgtt gtcgatggta 540

tcattgtggg caatctgatt ggtgaagatg gtgtctcggc agtgaacctg agcagtccga 600

tgattcagct gctgttcacc atcagcctgg tcgttgcatc aggcgcgggc atgctgatcg 660

gttttgcact gggccaaaaa gacggtcgtc gtgtccgcta catttttacc ctgagcatgg 720

tggcgtcgct gctggttggt gtgctgttta cgggtgcggg tttttacttc tcggattcta 780

ttacccgcgc attttgccac gatgattacc tgttcacgta cacgagaccg act 833

<210> 19

<211> 789

<212> DNA

<213> 人工序列

<223> 序列一二级片段E2

<400> 19

agtcggtctc gtacacccat gattatctga aagtgatcct gattggcgcg ccgagcttca 60

tgatgctgtg ggaaatcagc gcagtgattg gtgtggacgg ctcgccgcgt ctggcatcgc 120

tggcgattat cgtggataat ctggtcaacc tgtgtctgga cattgtgttt atcgaatatg 180

tgggctgggg cattgcgggc tcggcagcag cgaccgttgt gggtcacctg gtgggcattc 240

tgatcatgct gcgtcatttt aaaggtaaag gcaattcgct gacgttttcg ctgacgcacg 300

ataaaccgga atttctgaac atcgtgctgc aaggcgcgcc gctggcgatc gcatccgtgt 360

gcctgaccct gctgctggtg tcagcaaatc acgtgtttct gagtgcgaaa ggccaaaatg 420

gtatcttcgt gtttgctgtg tgcatgaacc tgctgcaaat ttacaatatg tatatcagcg 480

gcacctgtcg taccctgcaa tcactgggtg cggtgcagat tggcaaaaat gatgaccatg 540

cgttcagtct gatcctgcgc aaatcatttc tgttcattac cgtgagcatg gctgtgacct 600

gcctgctgat ttgcctgttt ccgggtgtga tttcgcgtgc ctttggtgca gatagcccgg 660

aagtgattgc ggaatgcaat catgtcttcc gcatttttgc ggtgtccttc attccgtttt 720

gttacatcta cctgattatg atcgtttata aactgtacaa acaggattgc atggccctcg 780

agaccgact 789

<210> 20

<211> 783

<212> DNA

<213> 人工序列

<223> 序列一二级片段E3

<400> 20

agtcggtctc gccctgttca ttagctttgc actgtcgctg accgtgatcc cggtgctgct 60

gctgtttttc cactatgcgc cgcagtatct gtggtacagc tatctggtgg cgtacctgct 120

ggaaatcgtc gcaatctttg tgctgcataa actgacccac gctcgtctgt ccctgtgaaa 180

tgatatggtg ctgctgacgg aagacatctg gagttttaac ctggacgctg cctggcaaga 240

aatctcgggt caacgccgcg aatacgccct gaaatatcgt accgaactgg atcgtcgcct 300

gtgtgtgcgt gcatatctgc tgctgtgtga aggtctgcgt aaaggctatg gtattaccag 360

cgtgccgctg tttgaatttg gcaaatacgg taaaccgatg ctggtcggtt atccggatat 420

tcatttcagc atttcgcatt gcccggaagc agtgatctgt gtgctggatg acaatccggt 480

gggcgtcgat attgaactgg tgtcgagctt tgacgaacag gttgcgcgtt atgcgatgaa 540

ccaggaagaa ctgcgccaga tcaaaagctc ttcacgcccg gatgtggaat ttgcgtgtct 600

gtggacccgt aaagaagccg tgctgaaaca gtccggtttt ggcctgagcg ataacgtgaa 660

agaagttctg accgcacatc cgctgccggt ggaaacgttt atttcccgca acctgcatta 720

tgtgtattcc atttgtcgtg ctgattgtaa cctgtaaccg acgagacgcc gacgagaccg 780

act 783

<210> 21

<211> 8190

<212> DNA

<213> 人工序列

<223> 序列二

<400> 21

tcttccatat aggctcgtca agcggatctt tgattactcg tgcaaaggtt tagatgaaaa 60

ggtactgcgt tcccctcatg acagtgctat ggtaatatcc ttcttgcact gacattacca 120

ctggcttacc gttgtgtgca agaccaagac cgctagttag agggcaaagc catagcccag 180

cagccaagtc gctagaaaaa cactcagtaa taacagtgta atggcactac cctgggacat 240

agccaggata agccagtcaa acattgttta atttcctgtg tcgaagatct cgttgataat 300

ttcaacggcc gtgtcaccac catcaacagc tgtgtcccat tccaaattgg catgagtcac 360

atcagatggc acacccacat catcgtagat ggcctcttca ttcagctgct gcgtggtttc 420

acgcttgttc ttcttttcct tctttctctg gggttttgca ttcccagttt taaatgcatc 480

cacctgtgaa acaagaagct ctacatttgg atcagacttt ggcacagtca ttttataatt 540

atatgtaatc tcgtaagagt ccgctagctc acgaacagcc acattaccac caaagagcaa 600

tgctgcaaca tttggtgcta aactggcgat ctgagcatag cctgaggcat caacaccttt 660

ttcgacaaat tccgcatctc caaaattttt gaagcctccc ctgggtccga agcaagctgc 720

tacgctattt tcgcccttgg gaattctcct ccactctggg atgtctttga ggtcacgttc 780

tttcgaagtg gctctggatt tgttcttctt aggtgtattt ttgccgctgc tgtcagacct 840

ttcctgtttg ggcttctgct gttgcttaag cttgtcaggg ttttcgccaa tacccaaaga 900

tttaagggca tccttgacag cagccaccag atcatcgcgt gatgttacac caccacggtc 960

atttgactgg tttctgttct tggactggtt acgagacttg ttattgttat tattattgcc 1020

tcctctgttc tgagaagctc cacgaccctg gttatttcca cgattctgtg aattaccgcg 1080

ggactggtta ttgcctctgt tgttacttgg agatctggac ctgttgttgc cattaccacg 1140

actcctgcta cgtgaatttg cacgtgaagt aggaggtgtg ttaggttcaa caatctcaac 1200

tacgctggga agctgttgag agaaatttgg aataattggc ttttcagacg cctttctgac 1260

acccaggtta gtgggttcag tctttgcgcc ttctttagca acccagaaaa caccctcagt 1320

acgagtccta tagcggaggt cggcgtgagg tcctgttccg aggtagtaga aatgccaatt 1380

ggaaggttgt tcaattcgct caccacggcg catgcgccag cgaatttgct cattccagta 1440

tccaatttgc tggtccttat ttcctttatt agtgggtaca gcattatttg caagtacctt 1500

agaaaggggt ttgtcattag taaccctaag aggggcatag agggataatg gcacccgttt 1560

gcggccacga tcctgaaaac tgacagaagc cataaagttt ctgtttagac taaatgaagc 1620

actttctcac tatctgtgag aaccgaactc ggattactca cagctgagta gtcgccgtgt 1680

ttggaccgga catagaaagc ccaaccagtg ccagatgaag cattgactga acgaccaaca 1740

cgtccgtaga caattgttgt agtggccttg gcgactgtga cgaaattagg taattgactt 1800

acctgtacgc cagtagcaac cttatagccc tctacaagca atgtaccact aaggagtgtt 1860

agcgttacac cagttggtgc tccaagcact ggaatgcaga cctgtcggcc catcacagaa 1920

gtagtgagaa gcgcgtctgt ttcaggattg aaagaccacc aagaatgtgt cctgcgccac 1980

aaccgaatgc tattgacaaa gtacattatc cacagcataa gagtgatgca agccataagg 2040

atgctgaaag caaaaaagac ccaattgacc tgaaagctag cccatgcatc aaaaagtgac 2100

agtgctaaca caagaggcca aagtatccat agaatagcca tcttgacacc atacaagaac 2160

gcagagtact tgtaatggcc atactgaagc actacaagta gtatcgtcag tatgatattc 2220

catgtgaaat tccagtttct aaggtgttga atcacctcat caacgggaat agaaccgtta 2280

gacatatttc gtttatacgt caataacagt actagggagg gggtctattt gcatgtaaga 2340

cttataaact ctatacaaac gccctatagg tatgtaaact gcgctattac acaaccggtg 2400

acaagtgaag cacagattaa ccaattggac gaaagtaatg cttataataa gcaggaaaaa 2460

gagtacgaaa agccaaagta taacattaac tactagacca ttatcattca ctaattgtag 2520

catactcgtc tagttgaatt gagtcaaatg cagcattagt aatgccaaca atttgatgtt 2580

gcgaaaagac ataaagcttc ttgccatcaa gaagctcaac agttcgcaac agctgtaggt 2640

cagcttcttg ccgcccacgt atagctagat acaagtcgat gctactaaca aaagcaacaa 2700

aagagttgcc aaaagtgatg taatggtcac caccttctaa aatcacaatg gatttgccgt 2760

cataataagc tgctttacca ttgaggaaag aaagtgtcgt agtattaaaa ataataaaga 2820

gcgcattttt atagcgccag gagtaaaagc agactaaaca aagcctgcca ataagtgtgc 2880

aacaaataat agttgcatct aaaaatgcac cacaataata taaaagtggg caataaagaa 2940

caatgacagc aaaacgcgct gccaacataa tataattgcg cctcaaagaa gacgctttaa 3000

acagtgcaaa gaagtagata aaaacactgg tgaaaagaaa acccgtcaca tttgaagctt 3060

gtctaattgg aactacattg agctccaact cttggacagc atccaaagac aagttagcag 3120

actttgagac atctttgaca actgtgtcaa tcgtgtattg aaaaagtcca agaaacatca 3180

ctgcacgtgg accttttcaa aaacttcgta aggttgaagt ctaggacccc tacaacaacc 3240

tgagaaacaa gcacagcagc agccgcagca tccacaacaa cccgtggaaa tgcagcagaa 3300

cactagtaat gacacaacaa agatgagaac aatgaaaata atcaaccaaa cccaccacgg 3360

ccactttcac atacatttca tatgtgccaa cttccttgag gttgatgtag ctctcattta 3420

acttcttaat tgcatcctga atcctgttca tctcatacgt caggtccagc aaagtaacat 3480

ttaacttctc gaaatcgaga gataaatcag gcgcaataga cgtctgattc ttaaaccatt 3540

tatctaactc ctccttaaag tcgggtggat taggtattga agtgttcaag aaaacttcag 3600

gtgcctttgt gtagtttact gcgcaactac tcataatgac actgttttta tctgtaatgg 3660

gttcagggta gtaatatgaa ctgcctgtga acttccattc tccatcatct tgaacaaaat 3720

atccagcttt aggtgctaat cctctatcac cagaaatgca aagtccagga ctcacatttg 3780

cggttgtaaa ggatattggc acatagctga agtgtataaa atataagcca taaggcgcat 3840

tctggacaag agataatata tgattaccat tgccacagaa attaatacgc gtggtttggc 3900

tcttaacgca ctcattgacc ttttctatgg cctgagcagc actaacttta ataagcgtac 3960

tatcactaag ttgcttggat atatacgcat taagtgcagt taacctgcca ttaataagac 4020

gatctatctg ggcttttgct tctacagcct caagccgagt tagaatttct tgtaaagaag 4080

cactaatagc accaaacctg ttagaaagtt gatttagtaa gttattgagt gcttcagcat 4140

ttgcattaac aacggactgg atcttaccta aagcagaatt ggttgcatca aacccatcct 4200

ggatagcacc cagcgcattg ttaaaagcac tagcaatcat cttttggttc tcactaagca 4260

cattcatagt gacacctaaa ccattaattc tatattgaac acttaaacta aatggcacac 4320

cggcagctgc tgaccacggt gggaacatag ctgccgcagt agcaccggtt gtgtagccag 4380

agatctgact ctctgacaac acaggaggta atactttgat gccattaaaa gattgtacac 4440

aaaggaggtc acgaacttct tgaccaccgg tgcaattatt ataagcctcg acaaagccaa 4500

catcagataa tttgaccttg tcaaataaca aatcctctat agcagaacgc cctcggattg 4560

cactaggtcc attgccgtct tcagcacatg ttgaacctat gcatccaagt agaggactaa 4620

aattaatgtc atctataggg cctgagatgc cgtctggcag tctcgagctt atagtaacac 4680

cctgcattaa tgcactagca acttgtagtt gcatattatc caagaggtta ttaacctcat 4740

taagaatggc attaacatta acacagaaag agccatactc aaccaactgc tgcctgcatg 4800

cagtgttatc accacagaca aatgcagcac aatctatagt cacctttgga gatctagttt 4860

gaatgaactc ctcatggtgc ccaatagtaa aattggttgg tatttgcatc tcatataatc 4920

catcaacgga ttggacacta tcattaacta acatcggagt gtatggctca aatgtagtta 4980

accgatagcc agtagaaact gatcggtgag ccctgcgtga ttttgaataa tcaacgcata 5040

agccagcacc catacggaga tcacaattag gaagcgcctc atccgtgcgg ttatcagcat 5100

taacaacaca acccaaataa ctatcaaagt aattaagtgg gttctcctca cgggaaatat 5160

tattgctaaa aacatagcta caatttatat tacgatagag cagagccggt tcgggtgcat 5220

ctttatgaaa tgcagcagaa acacggccac tataacagct ccttatcgta taagtcttgt 5280

tagtggtaag atcacgaaaa ccattcaaat taccattaac atcatacaga agggtttgcc 5340

agctattata atagtcagcc ttaacctctt taaaaacacc ttgtccagta ataccgtaga 5400

ggtcatattt gacacaaatg ccagtaacca cttcagtatt aggcaactgc aaatctgtgg 5460

aacatgtggt accactatta atgccattta acaatatatt agcaaaaatt tggcagcgat 5520

cattaacaag gcaggtatca tgtgaccatc caataaatga attgttggca cagatacaac 5580

ccttatgtgg atcagcattg ccacaattat cttctaaaac acctaagcct tcacaatggt 5640

cacccacatt aacaaaagca gacttaggct tagtctgagt agtgcaaggg ctaactatgt 5700

ccggttgagc acacgggcaa taactagatc ttacagtaaa acattgctga gcgtaaacaa 5760

cgtcatgttg gtttttgcca aagacgccag catcattaaa gccatacctc ctattccaag 5820

acgaggggtt atggttgttt atggtgacat tattcttagg caaggtgtaa tgcagctgac 5880

acgaagtggc agctgtatca atcttataat tagcagtctg cagaaatcca gagttaccaa 5940

gctgtaaatc aacttgccta cttcggggta cagcaaactt atcaactgaa atactaccaa 6000

agcacctgcc atacactttg gaagcatcga tattattaca aaacaaactc tcagcctgaa 6060

cataacgtaa caggctgctt aaattaaaat tacaattctg aaaagtctta cgctcccagt 6120

tgagagggga ggggactgac ctagcagtaa gccactcctc tatattacaa gctgggaggt 6180

tagcaacacg ccggtataca actccaactg gttggaccgt ataaccggat aactcataga 6240

caccagtgct aggtaacatg ctctgggtct tacattttat ttcactggta taactactag 6300

cacaatcaac agcactagta atgacaccct tctggttgaa attaaacaaa tattggcgct 6360

taaccaaagg tgtaacccaa tagcgcggag caaaagtgct accagctgtt gggttgcaga 6420

tgaaaggtaa cacataatac tgtgttaaaa tatcgccaat atatacacta aacaaaaacg 6480

tagtagcgga gggtttatcc gcatagtacg cataaaaagt accaccatgt tggtaaaaat 6540

gaaaataaaa tgcatcagca ttaacattaa gcgtgaaatt tcgctttaac acacaaattg 6600

ggggttttac atccgtgtgc caaaacccta ttaatttatt accattagtg ttaggcttac 6660

aatcagtgta aggtaactga caaatggtat actggcacac tgaggccatt ataacaccat 6720

tatatggctc tattacaacg gtataggaag tatagccaaa caaactacct ataactatag 6780

taggaaaata tgcagttgca cctgatggcg tacttgtctt aaggttctgc accttcgcaa 6840

atatgccatc attaaactga cttaaatagg gtggttgaaa ccacgacaag ctaactgagt 6900

tagttcccgt aagagcgagg tttctaaact tagaaccatc gaccgggtag taaccagtaa 6960

gcaataatgt ggcatttaaa taaactcgat ctaacacata atatgtcccc aggccttgtg 7020

aaacttcaac ggtctcagtg ctaatgcttg gagcactaac attagcaccg tttgaattca 7080

caagctggat acatctaaaa tcaccaatat accctaaaca agagggcaaa aatagaataa 7140

acacgaacag cattcatttg tttacgttga ccaaatgatt agaaaaacca caaatggcgt 7200

cattattacg cactagcaac ttaccattct tcaacaaacc taacacaaca tcactaatgg 7260

atgaatcttt taaattaatg acaactgtag ccttatgctt acaattgaac ttgcttaaat 7320

caagtacact attgtaagac atagtcataa ttgtggaatt acgccagaag atataattgg 7380

catgcatagt gttgccgtca atcacagcgc cacttgcaaa atcacctaaa tagtgaacac 7440

caattaagaa tgcctctgac gatgacgtgt taacactggt acagaacatt gtccaatact 7500

caaacctctg aatgagttca tacaacttct tattccaact aaactccgtc accttaatag 7560

ctacagtacc accaagtgcc aacttttcgg tgagtcaact ggcacgatgt taccaccacg 7620

acgaccaaaa gtaagctcta actcttcaag gaagtaatta cagttagaaa ataacagcca 7680

accacaaatg tttttggggc ggctaccaaa agtgtccaca tacgcactaa gcttggtagt 7740

gccgaccacc accatgacat agtcttcggg aagcaatccc tcaacagtgt cagcgagatc 7800

gaaggacacg aaacggcatt gcataaatcc actagcggcg gcctcagaat agtatgagac 7860

ggcttcacta gcagtgcaaa agccaagagc tgaaatttct gcatcattgg caaaagccaa 7920

tgtaacatgg ttgctagcca tagccgacag ttactggttt caaactagac ggaactagtt 7980

atccacacaa cccccagacg gaaccggagg aaggctgttt gtctagtatg tagaaggcga 8040

cggaacgcca accaggaact agaggacagc acagcacttg cgatggctac ttaagcaaac 8100

ctaatgaaat tccacgtcag cttccagcag catggacatg cggccggaag gacaaaattt 8160

cgtttagttg aattgagtag acaagagtct 8190

<210> 22

<211> 770

<212> DNA

<213> 人工序列

<223> 序列二二级片段A1

<400> 22

atcgggtctc aaacggctct tcatcttcca tataggctcg tcaagcggat ctttgattac 60

tcgtgcaaag gtttagatga aaaggtactg cgttcccctc atgacagtgc tatggtaata 120

tccttcttgc actgacatta ccactggctt accgttgtgt gcaagaccaa gaccgctagt 180

tagagggcaa agccatagcc cagcagccaa gtcgctagaa aaacactcag taataacagt 240

gtaatggcac taccctggga catagccagg ataagccagt caaacattgt ttaatttcct 300

gtgtcgaaga tctcgttgat aatttcaacg gccgtgtcac caccatcaac agctgtgtcc 360

cattccaaat tggcatgagt cacatcagat ggcacaccca catcatcgta gatggcctct 420

tcattcagct gctgcgtggt ttcacgcttg ttcttctttt ccttctttct ctggggtttt 480

gcattcccag ttttaaatgc atccacctgt gaaacaagaa gctctacatt tggatcagac 540

tttggcacag tcattttata attatatgta atctcgtaag agtccgctag ctcacgaaca 600

gccacattac caccaaagag caatgctgca acatttggtg ctaaactggc gatctgagca 660

tagcctgagg catcaacacc tttttcgaca aattccgcat ctccaaaatt tttgaagcct 720

cccctgggtc cgaagcaagc tgctacgcta ttttcgccct cgagacccat 770

<210> 23

<211> 768

<212> DNA

<213> 人工序列

<223> 序列二二级片段A2

<400> 23

atcgggtctc acccttggga attctcctcc actctgggat gtctttgagg tcacgttctt 60

tcgaagtggc tctggatttg ttcttcttag gtgtattttt gccgctgctg tcagaccttt 120

cctgtttggg cttctgctgt tgcttaagct tgtcagggtt ttcgccaata cccaaagatt 180

taagggcatc cttgacagca gccaccagat catcgcgtga tgttacacca ccacggtcat 240

ttgactggtt tctgttcttg gactggttac gagacttgtt attgttatta ttattgcctc 300

ctctgttctg agaagctcca cgaccctggt tatttccacg attctgtgaa ttaccgcggg 360

actggttatt gcctctgttg ttacttggag atctggacct gttgttgcca ttaccacgac 420

tcctgctacg tgaatttgca cgtgaagtag gaggtgtgtt aggttcaaca atctcaacta 480

cgctgggaag ctgttgagag aaatttggaa taattggctt ttcagacgcc tttctgacac 540

ccaggttagt gggttcagtc tttgcgcctt ctttagcaac ccagaaaaca ccctcagtac 600

gagtcctata gcggaggtcg gcgtgaggtc ctgttccgag gtagtagaaa tgccaattgg 660

aaggttgttc aattcgctca ccacggcgca tgcgccagcg aatttgctca ttccagtatc 720

caatttgctg gtccttattt cctttattag tgggtacacg agacccat 768

<210> 24

<211> 698

<212> DNA

<213> 人工序列

<223> 序列二二级片段A3

<400> 24

atcgggtctc atacagcatt atttgcaagt accttagaaa ggggtttgtc attagtaacc 60

ctaagagggg catagaggga taatggcacc cgtttgcggc cacgatcctg aaaactgaca 120

gaagccataa agtttctgtt tagactaaat gaagcacttt ctcactatct gtgagaaccg 180

aactcggatt actcacagct gagtagtcgc cgtgtttgga ccggacatag aaagcccaac 240

cagtgccaga tgaagcattg actgaacgac caacacgtcc gtagacaatt gttgtagtgg 300

ccttggcgac tgtgacgaaa ttaggtaatt gacttacctg tacgccagta gcaaccttat 360

agccctctac aagcaatgta ccactaagga gtgttagcgt tacaccagtt ggtgctccaa 420

gcactggaat gcagacctgt cggcccatca cagaagtagt gagaagcgcg tctgtttcag 480

gattgaaaga ccaccaagaa tgtgtcctgc gccacaaccg aatgctattg acaaagtaca 540

ttatccacag cataagagtg atgcaagcca taaggatgct gaaagcaaaa aagacccaat 600

tgacctgaaa gctagcccat gcatcaaaaa gtgacagtgc taacacaaga ggccaaagta 660

tccatagaat agccatcttg acaccatacg agacccat 698

<210> 25

<211> 532

<212> DNA

<213> 人工序列

<223> 序列二二级片段A4

<400> 25

atcgggtctc acatacaaga acgcagagta cttgtaatgg ccatactgaa gcactacaag 60

tagtatcgtc agtatgatat tccatgtgaa attccagttt ctaaggtgtt gaatcacctc 120

atcaacggga atagaaccgt tagacatatt tcgtttatac gtcaataaca gtactaggga 180

gggggtctat ttgcatgtaa gacttataaa ctctatacaa acgccctata ggtatgtaaa 240

ctgcgctatt acacaaccgg tgacaagtga agcacagatt aaccaattgg acgaaagtaa 300

tgcttataat aagcaggaaa aagagtacga aaagccaaag tataacatta actactagac 360

cattatcatt cactaattgt agcatactcg tctagttgaa ttgagtcaaa tgcagcatta 420

gtaatgccaa caatttgatg ttgcgaaaag acataaagct tcttgccatc aagaagctca 480

acagttcgca acagctgtag gtcagcttct tgaagagccc gatgagaccg ct 532

<210> 26

<211> 772

<212> DNA

<213> 人工序列

<223> 序列二二级片段B1

<400> 26

atcgggtctc aaacggctct tcatcttgcc gcccacgtat agctagatac aagtcgatgc 60

tactaacaaa agcaacaaaa gagttgccaa aagtgatgta atggtcacca ccttctaaaa 120

tcacaatgga tttgccgtca taataagctg ctttaccatt gaggaaagaa agtgtcgtag 180

tattaaaaat aataaagagc gcatttttat agcgccagga gtaaaagcag actaaacaaa 240

gcctgccaat aagtgtgcaa caaataatag ttgcatctaa aaatgcacca caataatata 300

aaagtgggca ataaagaaca atgacagcaa aacgcgctgc caacataata taattgcgcc 360

tcaaagaaga cgctttaaac agtgcaaaga agtagataaa aacactggtg aaaagaaaac 420

ccgtcacatt tgaagcttgt ctaattggaa ctacattgag ctccaactct tggacagcat 480

ccaaagacaa gttagcagac tttgagacat ctttgacaac tgtgtcaatc gtgtattgaa 540

aaagtccaag aaacatcact gcacgtggac cttttcaaaa acttcgtaag gttgaagtct 600

aggaccccta caacaacctg agaaacaagc acagcagcag ccgcagcatc cacaacaacc 660

cgtggaaatg cagcagaaca ctagtaatga cacaacaaag atgagaacaa tgaaaataat 720

caaccaaacc caccacggcc actttcacat acatttcata tgcgagaccc at 772

<210> 27

<211> 840

<212> DNA

<213> 人工序列

<223> 序列二二级片段B2

<400> 27

atcgggtctc atatgtgcca acttccttga ggttgatgta gctctcattt aacttcttaa 60

ttgcatcctg aatcctgttc atctcatacg tcaggtccag caaagtaaca tttaacttct 120

cgaaatcgag agataaatca ggcgcaatag acgtctgatt cttaaaccat ttatctaact 180

cctccttaaa gtcgggtgga ttaggtattg aagtgttcaa gaaaacttca ggtgcctttg 240

tgtagtttac tgcgcaacta ctcataatga cactgttttt atctgtaatg ggttcagggt 300

agtaatatga actgcctgtg aacttccatt ctccatcatc ttgaacaaaa tatccagctt 360

taggtgctaa tcctctatca ccagaaatgc aaagtccagg actcacattt gcggttgtaa 420

aggatattgg cacatagctg aagtgtataa aatataagcc ataaggcgca ttctggacaa 480

gagataatat atgattacca ttgccacaga aattaatacg cgtggtttgg ctcttaacgc 540

actcattgac cttttctatg gcctgagcag cactaacttt aataagcgta ctatcactaa 600

gttgcttgga tatatacgca ttaagtgcag ttaacctgcc attaataaga cgatctatct 660

gggcttttgc ttctacagcc tcaagccgag ttagaatttc ttgtaaagaa gcactaatag 720

caccaaacct gttagaaagt tgatttagta agttattgag tgcttcagca tttgcattaa 780

caacggactg gatcttacct aaagcagaat tggttgcatc aaacccatcc cgagacccat 840

<210> 28

<211> 789

<212> DNA

<213> 人工序列

<223> 序列二二级片段B3

<400> 28

atcgggtctc aatcctggat agcacccagc gcattgttaa aagcactagc aatcatcttt 60

tggttctcac taagcacatt catagtgaca cctaaaccat taattctata ttgaacactt 120

aaactaaatg gcacaccggc agctgctgac cacggtggga acatagctgc cgcagtagca 180

ccggttgtgt agccagagat ctgactctct gacaacacag gaggtaatac tttgatgcca 240

ttaaaagatt gtacacaaag gaggtcacga acttcttgac caccggtgca attattataa 300

gcctcgacaa agccaacatc agataatttg accttgtcaa ataacaaatc ctctatagca 360

gaacgccctc ggattgcact aggtccattg ccgtcttcag cacatgttga acctatgcat 420

ccaagtagag gactaaaatt aatgtcatct atagggcctg agatgccgtc tggcagtctc 480

gagcttatag taacaccctg cattaatgca ctagcaactt gtagttgcat attatccaag 540

aggttattaa cctcattaag aatggcatta acattaacac agaaagagcc atactcaacc 600

aactgctgcc tgcatgcagt gttatcacca cagacaaatg cagcacaatc tatagtcacc 660

tttggagatc tagtttgaat gaactcctca tggtgcccaa tagtaaaatt ggttggtatt 720

tgcatctcat ataatccatc aacggattgg acactatcat taactaacat cggagtgtac 780

gagacccat 789

<210> 29

<211> 687

<212> DNA

<213> 人工序列

<223> 序列二二级片段B4

<400> 29

atcgggtctc atgtatggct caaatgtagt taaccgatag ccagtagaaa ctgatcggtg 60

agccctgcgt gattttgaat aatcaacgca taagccagca cccatacgga gatcacaatt 120

aggaagcgcc tcatccgtgc ggttatcagc attaacaaca caacccaaat aactatcaaa 180

gtaattaagt gggttctcct cacgggaaat attattgcta aaaacatagc tacaatttat 240

attacgatag agcagagccg gttcgggtgc atctttatga aatgcagcag aaacacggcc 300

actataacag ctccttatcg tataagtctt gttagtggta agatcacgaa aaccattcaa 360

attaccatta acatcataca gaagggtttg ccagctatta taatagtcag ccttaacctc 420

tttaaaaaca ccttgtccag taataccgta gaggtcatat ttgacacaaa tgccagtaac 480

cacttcagta ttaggcaact gcaaatctgt ggaacatgtg gtaccactat taatgccatt 540

taacaatata ttagcaaaaa tttggcagcg atcattaaca aggcaggtat catgtgacca 600

tccaataaat gaattgttgg cacagataca acccttatgt ggatcagcat tgccacaatt 660

atcttgaaga gcccgatgag accgcta 687

<210> 30

<211> 698

<212> DNA

<213> 人工序列

<223> 序列二二级片段C1

<400> 30

atcgcgtctc aaacggctct tcatcttcta aaacacctaa gccttcacaa tggtcaccca 60

cattaacaaa agcagactta ggcttagtct gagtagtgca agggctaact atgtccggtt 120

gagcacacgg gcaataacta gatcttacag taaaacattg ctgagcgtaa acaacgtcat 180

gttggttttt gccaaagacg ccagcatcat taaagccata cctcctattc caagacgagg 240

ggttatggtt gtttatggtg acattattct taggcaaggt gtaatgcagc tgacacgaag 300

tggcagctgt atcaatctta taattagcag tctgcagaaa tccagagtta ccaagctgta 360

aatcaacttg cctacttcgg ggtacagcaa acttatcaac tgaaatacta ccaaagcacc 420

tgccatacac tttggaagca tcgatattat tacaaaacaa actctcagcc tgaacataac 480

gtaacaggct gcttaaatta aaattacaat tctgaaaagt cttacgctcc cagttgagag 540

gggaggggac tgacctagca gtaagccact cctctatatt acaagctggg aggttagcaa 600

cacgccggta tacaactcca actggttgga ccgtataacc ggataactca tagacaccag 660

tgctaggtaa catgctctgg gtcttacacg agacgcat 698

<210> 31

<211> 598

<212> DNA

<213> 人工序列

<223> 序列二二级片段C2

<400> 31

atcgcgtctc atacatttta tttcactggt ataactacta gcacaatcaa cagcactagt 60

aatgacaccc ttctggttga aattaaacaa atattggcgc ttaaccaaag gtgtaaccca 120

atagcgcgga gcaaaagtgc taccagctgt tgggttgcag atgaaaggta acacataata 180

ctgtgttaaa atatcgccaa tatatacact aaacaaaaac gtagtagcgg agggtttatc 240

cgcatagtac gcataaaaag taccaccatg ttggtaaaaa tgaaaataaa atgcatcagc 300

attaacatta agcgtgaaat ttcgctttaa cacacaaatt gggggtttta catccgtgtg 360

ccaaaaccct attaatttat taccattagt gttaggctta caatcagtgt aaggtaactg 420

acaaatggta tactggcaca ctgaggccat tataacacca ttatatggct ctattacaac 480

ggtataggaa gtatagccaa acaaactacc tataactata gtaggaaaat atgcagttgc 540

acctgatggc gtacttgtct taaggttctg caccttcgca aatatgcccg agacgcat 598

<210> 32

<211> 586

<212> DNA

<213> 人工序列

<223> 序列二二级片段C3

<400> 32

atcgcgtctc atgccatcat taaactgact taaatagggt ggttgaaacc acgacaagct 60

aactgagtta gttcccgtaa gagcgaggtt tctaaactta gaaccatcga ccgggtagta 120

accagtaagc aataatgtgg catttaaata aactcgatct aacacataat atgtccccag 180

gccttgtgaa acttcaacgg tctcagtgct aatgcttgga gcactaacat tagcaccgtt 240

tgaattcaca agctggatac atctaaaatc accaatatac cctaaacaag agggcaaaaa 300

tagaataaac acgaacagca ttcatttgtt tacgttgacc aaatgattag aaaaaccaca 360

aatggcgtca ttattacgca ctagcaactt accattcttc aacaaaccta acacaacatc 420

actaatggat gaatctttta aattaatgac aactgtagcc ttatgcttac aattgaactt 480

gcttaaatca agtacactat tgtaagacat agtcataatt gtggaattac gccagaagat 540

ataattggca tgcatagtgt tgccgtcaat cacagccgag acgcat 586

<210> 33

<211> 820

<212> DNA

<213> 人工序列

<223> 序列二二级片段C4

<400> 33

atcgcgtctc acagcgccac ttgcaaaatc acctaaatag tgaacaccaa ttaagaatgc 60

ctctgacgat gacgtgttaa cactggtaca gaacattgtc caatactcaa acctctgaat 120

gagttcatac aacttcttat tccaactaaa ctccgtcacc ttaatagcta cagtaccacc 180

aagtgccaac ttttcggtga gtcaactggc acgatgttac caccacgacg accaaaagta 240

agctctaact cttcaaggaa gtaattacag ttagaaaata acagccaacc acaaatgttt 300

ttggggcggc taccaaaagt gtccacatac gcactaagct tggtagtgcc gaccaccacc 360

atgacatagt cttcgggaag caatccctca acagtgtcag cgagatcgaa ggacacgaaa 420

cggcattgca taaatccact agcggcggcc tcagaatagt atgagacggc ttcactagca 480

gtgcaaaagc caagagctga aatttctgca tcattggcaa aagccaatgt aacatggttg 540

ctagccatag ccgacagtta ctggtttcaa actagacgga actagttatc cacacaaccc 600

ccagacggaa ccggaggaag gctgtttgtc tagtatgtag aaggcgacgg aacgccaacc 660

aggaactaga ggacagcaca gcacttgcga tggctactta agcaaaccta atgaaattcc 720

acgtcagctt ccagcagcat ggacatgcgg ccggaaggac aaaatttcgt ttagttgaat 780

tgagtagaca agagtcttga agagcccgat gagacggcta 820

再多了解一些
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1