本发明属于林业分子生物技术领域,具体涉及樟树分子标记技术,更具体涉及一种樟树全基因组ssr分子标记及其制备方法和在古樟遗传多样性分析及亲缘关系鉴定中的应用。
背景技术:
微卫星(microsatellite)又称作短串连重复(shorttandemrepeats,strs)、简单重复序列(simplesequencerepeat,ssrs)、简单序列长度多态性(sslp)。是指以1~6个核苷酸为单位,多次串联重复的dna序列,其普遍存在于真核生物和原核生物的基因组中,甚至在病毒基因组中亦有存在。ssr分子标记具有以下特点:重复单元和重复次数高度可变,多态性信息容量高;呈共显性,遵循孟德尔法则遗传;侧翼序列相对保守;选择中性等等。
基于以上特点,微卫星分子标记被广泛应用于物种的指纹鉴定、遗传图谱构建、群体遗传结构分析、比较基因组及进化研究等诸多研究领域。根据建立ssr标记的序列性质不同,ssr标记可分为基因组ssr(gssr)和表达序列标签ssr(est-ssr)。与est-ssr分子标记相比,基因组ssr有如下优势:(1)est-ssr源于表达的基因序列,信息不全面,缺乏基因组调控序列、内含子序列等基因组重要信息;(2)与源自基因组的ssr分子标记相比较,est-ssr分子标记多态性低;(3)est-ssr受est测序错误、开发软件及参数影响。随着高通量测序技术的迅猛发展及基因组ssr标记独特的优势,gssr分子标记将会得到广泛开发和应用。
樟树cinnamomumcamphora(l.)presl广泛分布于我国南方各省区,包括海南、台湾、福建、江西、广东、广西、湖北、湖南、四川、重庆、云南、贵州、浙江等地。樟树用途广泛,是一类集材用、药用、香料、油用、化工、观赏、生态环境和生态文化建设等于一体的多用途树种,具有极重要的开发利用价值。按叶精油主要化学成分的不同,樟树可分为芳樟(主含芳樟醇)、脑樟(主含樟脑)、油樟(主含桉叶油)、异樟(主含异橙花叔醇)、龙脑樟(主含右旋龙脑)等5种化学类型,它们均有不同的开发价值。目前,多采用闻香分类法来对其化学类型进行鉴别,带有一定的随机性和主观性,因此,获得可靠的樟树基因组ssr分子标记可用于樟树不同化学类型的鉴别,对苗期定向选择具有重要意义。
樟树是遗传研究和遗传背景信息比较缺乏的物种。目前,樟树可有效利用的标记数量非常有限。从深度和广度进一步开展樟树基因组研究,需要开发新的dna分子标记。己有的研究证实,以est数据库为基础,利用生物信息学的手段可以经济快速地进行ssr和snp标记的大批量开发。然而,与其他物种如水稻、玉米、葡萄等比较,美国国立生物技术信息中心(ncbi)的数据库中所收录的樟树est数据相当缺乏,难以满足樟树est-ssr标记开发的需求,不能为樟树的dna分子标记开发研究提供足够的信息。这同时也极大的限制了樟树分子生物学研究的发展。
技术实现要素:
本发明目的在于,以自主测定完成的樟树全基因组序列为基础,提供一种适用于樟树的全基因组ssr分子标记开发方法,开发一批樟树的gssr分子标记,并应用于古樟的遗传多样性检测及亲缘关系分析。
本发明的樟树全基因组ssr分子标记的引物分别是:
cc-19:f:5'-atttgcctcgtgttccattc-3'r:5'-tggaatttcagatccccaaa-3';(来源于seqidno.1的序列)
cc-25:f:5'-gcgccatttgttttcttcat-3'r:5'-aatcactagggtcggaaggg-3';(来源于seqidno.2的序列)
cc-49:f:5'-gcatctccctaccaaatcca-3'r:5'-ttgctcattttgaagcatcg-3';(来源于seqidno.3的序列)
cc-55:f:5'-cagccattcagaagggaaag-3'r:5'-caacttcttctatgggggca-3';(来源于seqidno.4的序列)
cc-60:f:5'-ccgaacgtcaactcaaacaa-3'r:5'-tttgatgggttcattggtga-3';(来源于seqidno.5的序列)
cc-76:f:5'-tggaatgcaaagaaggaacc-3'r:5'-ctctggtcccctgatttctg-3';(来源于seqidno.6的序列)
cc-80:f:5'-tctctctcatggtcaaattgttg-3'r:5'-aggtccccaaggttcctaga-3';(来源于seqidno.7的序列)
cc-81:f:5'-ccatttctcaataggaatattgattgt-3'r:5'-agcccataccttttcatttca-3';(来源于seqidno.8的序列)
cc-83:f:5'-cacggtccccaatctctaaa-3'r:5'-tcaaatttgggttggaccat-3';(来源于seqidno.9的序列)
cc-85:f:5'-ggaacgtccggctatgtaaa-3'r:5'-aaagtggcaaacaaaaccct-3';(来源于seqidno.10的序列)
cc-96:f:5'-cacggtactgaccagggttc-3'r:5'-ggcccagttgttccacatta-3';(来源于seqidno.11的序列)
cc-100:f:5'-agagatcgaaagggcgatg-3'r:5'-cgctccctacagaacccat-3';(来源于seqidno.12的序列)
cc-114:f:5'-tgatgaggatggggtcattt-3'r:5'-tgccatgttttggaggtaaa-3';(来源于seqidno.13的序列)
cc-131:f:5'-agaatagggaaaggggcaga-3'r:5'-cccttccttgatcaaaccct-3';(来源于seqidno.14的序列)
cc-133:f:5'-atgagcgtcatccaatgtca-3'r:5'-gcacatacccagttccgatt-3';(来源于seqidno.15的序列)
cc-134:f:5'-gggtcggggtaaattaggtc-3'r:5'-gaccggtttgctaaggtcaa-3';(来源于seqidno.16的序列)
cc-143:f:5'-ctatccacttccctgccgta-3'r:5'-ccagaatcttcgagaaagcg-3';(来源于seqidno.17的序列)
cc-185:f:5'-tgctctaattcaccccttgc-3'r:5'-aggctccacactaaaaccca-3';(来源于seqidno.18的序列)
cc-188:f:5'-accatccagagtttgatcgg-3'r:5'-gagggttctccttcggattc-3';(来源于seqidno.19的序列)
cc-191:f:5'-gttctccttctgatccacgg-3'r:5'-gacccattatgcgttgaacc-3'。(来源于seqidno.20的序列)
编号分别为cc-19、cc-25、cc-49、cc-55、cc-60、cc-76、cc-80、cc-81、cc-83、cc-85、cc-96、cc-100、cc-114、cc-131、cc-133、cc-134、cc-143、cc-185、cc-188、cc-191的ssr分子标记的引物两端的退火温度分别为cc-19:57℃;cc-25:58℃;cc-49:56℃;cc-55:58℃;cc-60:55℃;cc-76:58℃;cc-80:59℃;cc-81:55℃;cc-83:55℃;cc-85:55℃;cc-96:58℃;cc-100:59℃;cc-114:54℃;cc-131:58℃;cc-133:56℃;cc-134:58℃;cc-143:58℃;cc-185:58℃;cc-188:58℃;cc-191:58℃。
本发明的第二个目的是提供上述樟树全基因组ssr分子标记的引物在古樟群体遗传多样性的检测和/或古樟亲缘关系聚类分析中的应用。
具体应用方法如下:
(1)提取待测樟树样品基因组dna;
(2)以提取的待测dna样品为模板,利用上述樟树全基因组ssr分子标记的引物中的每对引物分别进行pcr扩增,得到pcr扩增产物;
(3)对pcr扩增产物进行分型。
根据分型统计结果进行樟树群体遗传多样性分析、樟树遗传亲缘关系分析。
所述的pcr扩增,其pcr扩增的体系为:10×buffer1μl,25mmol/lmgcl20.6μl,10mmol/ldntp0.6μl,5u/μldna聚合酶0.1μl,dna模板50ng,25mmol/lssr分子标记的引物f和r各0.5μl,双蒸水定容至10μl。
所述的pcr扩增,其扩增反应程序为:94℃预变性4min;94℃变性30sec,各樟树全基因组ssr分子标记的引物对退火温度下复性30sec,72℃延伸30sec,32个循环;最后70℃延伸5min,编号分别为cc-19、cc-25、cc-49、cc-55、cc-60、cc-76、cc-80、cc-81、cc-83、cc-85、cc-96、cc-100、cc-114、cc-131、cc-133、cc-134、cc-143、cc-185、cc-188、cc-191的ssr分子标记的引物两端的退火温度分别为cc-19:57℃;cc-25:58℃;cc-49:56℃;cc-55:58℃;cc-60:55℃;cc-76:58℃;cc-80:59℃;cc-81:55℃;cc-83:55℃;cc-85:55℃;cc-96:58℃;cc-100:59℃;cc-114:54℃;cc-131:58℃;cc-133:56℃;cc-134:58℃;cc-143:58℃;cc-185:58℃;cc-188:58℃;cc-191:58℃。
所述的对pcr扩增产物进行电泳检测是采用6%变性聚丙烯酰胺凝胶电泳检测pcr扩增产物,银染显色。
本发明的第三个目的是提供一种基于樟树基因组开发的ssr分子标记的引物的制备方法,其特征在于,包括以下步骤:
(1)樟树全基因组序列获得
ctab法提取樟树基因组dna,将提取的dna样品建库,进行高通量测序,获得樟树全基因组数据库;
(2)樟树全基因组微卫星dna序列的筛选
用微卫星分析程序对樟树全基因组数据库进行微卫星位点的搜索,在线微卫星位点分析软件对得到的微卫星位点进行筛选,最终获得含有微卫星位点的樟树dna序列;
(3)批量引物设计:针对上述含有微卫星位点的樟树dna序列,采用批量引物设计软件设计扩增含有微卫星位点的dna聚合酶链式反应引物,并用oligo7对获得的ssr引物进行综合评价;
(4)引物e-pcr扩增检测:
将批量设计出来的引物在樟树基因组序列中用e-pcr进行模拟扩增,输出理论上可以扩出预期扩增产物的引物,以检测所设计的引物能否扩增出产物及产物的多态性,可得到樟树基因组数据库中相匹配的引物序列、预期扩增的产物长度以及起始点的位置,同时,在ncbiprimer-blast进行模拟扩增,根据得到的模拟扩增产物进行筛选,剔除重复的引物,最终得到特异引物;
(5)引物多态性检测
以樟树基因组dna为模板,对以上挑选的特异引物进行dna聚合酶链式反应扩增,然后进行扩增产物的电泳分离和银染检测,选定符合要求的即为樟树基因组ssr分子标记的引物。
本发明的有益效果是:
1.本发明建立了樟树全基因组ssr分子标记开发方法,相对于樟树的其它开发方法,本方法具有全面、完整、准确和可靠的优点,对樟科植物的分子标记开发具有重要的实用价值。
2.樟树遗传背景信息缺乏,est序列数据有限,难以满足樟树est-ssr标记开发的需求,可有效利用的标记数量非常有限,本发明开发了新一批的樟树ssr分子标记,解决了樟树gssr缺乏的问题,也为其它樟科植物dna分子标记开发研究提供足够的信息和可利用的gssr分子标记。
3.本发明开发的樟树微卫星分子标记,可应用于古樟树的群体遗传多样性检测和亲缘关系分析,为樟科植物提供了新一批的微卫星分子标记,也为樟科植物的群体遗传分化与结构、群体的遗传多样性水平、群体间的基因流及交配系统、物种演化、分子辅助育种等研究提供了新的工具。
附图说明
图1是所有引物的dna聚合酶链式反应扩增初筛结果;
图2是引物cc-19在古樟中的dna聚合酶链式反应扩增结果;
图3是引物cc-25在古樟中的dna聚合酶链式反应扩增结果;
图4是引物cc-49在古樟中的dna聚合酶链式反应扩增结果;
图5是引物cc-55在古樟中的dna聚合酶链式反应扩增结果;
图6是引物cc-60在古樟中的dna聚合酶链式反应扩增结果;
图7是引物cc-76在古樟中的dna聚合酶链式反应扩增结果;
图8是引物cc-80在古樟中的dna聚合酶链式反应扩增结果;
图9是引物cc-81在古樟中的dna聚合酶链式反应扩增结果;
图10是引物cc-83在古樟中的dna聚合酶链式反应扩增结果;
图11是引物cc-85在古樟中的dna聚合酶链式反应扩增结果;
图12是引物cc-96在古樟中的dna聚合酶链式反应扩增结果;
图13是引物cc-100在古樟中的dna聚合酶链式反应扩增结果;
图14是引物cc-114在古樟中的dna聚合酶链式反应扩增结果;
图15是引物cc-131在古樟中的dna聚合酶链式反应扩增结果;
图16是引物cc-133在古樟中的dna聚合酶链式反应扩增结果;
图17是引物cc-134在古樟中的dna聚合酶链式反应扩增结果;
图18是引物cc-143在古樟中的dna聚合酶链式反应扩增结果;
图19是引物cc-185在古樟中的dna聚合酶链式反应扩增结果;
图20是引物cc-188在古樟中的dna聚合酶链式反应扩增结果;
图21是引物cc-191在古樟中的dna聚合酶链式反应扩增结果;
图22是古樟upgm聚类结果;
图23是采用ntsys-pcversion2.11软件upgm法对古樟进行聚类分析图。
具体实施方式:
以下实施例是对本发明的进一步说明,而不适合对本发明的限制。
实施例1:
一、基于樟树基因组开发的ssr分子标记的引物的制备方法,包括下列步骤:
1.樟树dna提取
采用ctab法对樟树叶片基因组dna进行提取,提取后用试剂盒和分光光度计对其dna浓度及纯度进行检测,用琼脂糖凝胶电泳dna样品进行检测,检测其完整性和有无其他组分存在。
2.樟树全基因组序列获得
将提取的质量优良的基因组dna样品送到测序公司,构建文库,然后进行高通量测序分析,并过滤甄选去除掉低质量的数据,获得首个樟树全基因组数据库。樟树全基因组序列和基因组注释文件均来源于国家林业局樟树工程技术研究中心。樟树全基因组测序利用深圳华大基因股份有限公司illuminahiseq2000测序平台完成,组装后的基因组总大小为727mb,序列数据以fasta格式保存,用于ssr位点的搜索。
3.樟树全基因组微卫星dna序列的筛选
用perl语言编制的微卫星分析程序(misa)和在线微卫星位点分析软件(microsatelliterepeatsfinder),对处理后的序列进行微卫星位点的筛选,获得含有微卫星位点的樟树dna序列。
4.批量引物设计:针对含有微卫星位点的樟树dna序列,采用批量引物设计软件primer3.0设计扩增含有微卫星位点的dna聚合酶链式反应引物(ssr引物),并用oligo7对获得的ssr引物进行综合评价。引物设计原则为:1)引物碱基数控制在18-24个,最佳引物长度为20bp;2)退火温度范围50℃-60℃,两个引物退火温度差<4℃;3)gc含量范围40%-60%之间,最佳gc含量为50%;4)扩增得到的dna片段大小在400个碱基以内。当一条dna序列中含有两个微卫星位点,且两个微卫星位点相距100个碱基以上时,对两个微卫星位点分别设计引物;当两个微卫星位点在同一序列中相距100个碱基以内时,引物设计时放弃将两个位点放在一对引物的扩增范围内,由此得到批量设计出来的引物。
5.引物e-pcr扩增检测:将批量设计出来的引物在樟树基因组序列中用e-pcr进行模拟扩增,输出理论上可以扩出预期扩增产物的引物,以检测所设计的引物能否扩增出产物及产物的多态性。可得到樟树基因组数据库中相匹配的引物序列、预期扩增的产物长度以及起始点的位置。同时,在ncbiprimer-blast进行模拟扩增,参数设置为默认值。根据得到的模拟扩增产物进行筛选,剔除重复的引物,得到挑选的特异引物。
6.微卫星位点的最终获得
选取5棵古樟样品,提取叶片基因组dna,构建混合dna池,对以上挑选的特异引物进行dna聚合酶链式反应扩增,初步筛选得到条带清晰、重复性较好的ssr引物;采用古樟树群体,对初步筛选获得的引物进行再次筛选,最终得到20对稳定、多态性良好的特异引物,即为樟树基因组ssr分子标记的引物。
20对樟树基因组ssr分子标记的引物具体序列如下:
cc-19:f:5'-atttgcctcgtgttccattc-3'r:5'-tggaatttcagatccccaaa-3';
cc-25:f:5'-gcgccatttgttttcttcat-3'r:5'-aatcactagggtcggaaggg-3';
cc-49:f:5'-gcatctccctaccaaatcca-3'r:5'-ttgctcattttgaagcatcg-3';
cc-55:f:5'-cagccattcagaagggaaag-3'r:5'-caacttcttctatgggggca-3';
cc-60:f:5'-ccgaacgtcaactcaaacaa-3'r:5'-tttgatgggttcattggtga-3';
cc-76:f:5'-tggaatgcaaagaaggaacc-3'r:5'-ctctggtcccctgatttctg-3';
cc-80:f:5'-tctctctcatggtcaaattgttg-3'r:5'-aggtccccaaggttcctaga-3';
cc-81:f:5'-ccatttctcaataggaatattgattgt-3'r:5'-agcccataccttttcatttca-3';
cc-83:f:5'-cacggtccccaatctctaaa-3'r:5'-tcaaatttgggttggaccat-3';
cc-85:f:5'-ggaacgtccggctatgtaaa-3'r:5'-aaagtggcaaacaaaaccct-3';
cc-96:f:5'-cacggtactgaccagggttc-3'r:5'-ggcccagttgttccacatta-3';
cc-100:f:5'-agagatcgaaagggcgatg-3'r:5'-cgctccctacagaacccat-3';
cc-114:f:5'-tgatgaggatggggtcattt-3'r:5'-tgccatgttttggaggtaaa-3';
cc-131:f:5'-agaatagggaaaggggcaga-3'r:5'-cccttccttgatcaaaccct-3';
cc-133:f:5'-atgagcgtcatccaatgtca-3'r:5'-gcacatacccagttccgatt-3';
cc-134:f:5'-gggtcggggtaaattaggtc-3'r:5'-gaccggtttgctaaggtcaa-3';
cc-143:f:5'-ctatccacttccctgccgta-3'r:5'-ccagaatcttcgagaaagcg-3';
cc-185:f:5'-tgctctaattcaccccttgc-3'r:5'-aggctccacactaaaaccca-3';
cc-188:f:5'-accatccagagtttgatcgg-3'r:5'-gagggttctccttcggattc-3';
cc-191:f:5'-gttctccttctgatccacgg-3'r:5'-gacccattatgcgttgaacc-3'。
二、樟树全基因组ssr分子标记的引物在古樟群体遗传多样性的检测和/或古樟亲缘关系聚类分析中的应用,包括下列步骤:
(1)dna聚合酶链式反应扩增
使用优化好的反应条件和扩增程序,对以上挑选的20对樟树基因组ssr分子标记的引物进行dna聚合酶链式反应扩增,扩增体系和条件如下:10×buffer1μl,25mmol/lmgcl20.6μl,10mmol/ldntp0.6μl,5u/μldna聚合酶0.1μl,dna模板50ng,25mmol/l引物f和r各0.5μl,双蒸水定容至10μl。聚合酶链式反应程序为:94℃预变性4min;94℃变性30sec,各樟树全基因组ssr分子标记的引物对退火温度下复性30sec,72℃延伸30sec,32个循环;最后70℃延伸5min,退火温度为:编号分别为cc-19、cc-25、cc-49、cc-55、cc-60、cc-76、cc-80、cc-81、cc-83、cc-85、cc-96、cc-100、cc-114、cc-131、cc-133、cc-134、cc-143、cc-185、cc-188、cc-191的ssr分子标记的引物两端的退火温度分别为cc-19:57℃;cc-25:58℃;cc-49:56℃;cc-55:58℃;cc-60:55℃;cc-76:58℃;cc-80:59℃;cc-81:55℃;cc-83:55℃;cc-85:55℃;cc-96:58℃;cc-100:59℃;cc-114:54℃;cc-131:58℃;cc-133:56℃;cc-134:58℃;cc-143:58℃;cc-185:58℃;cc-188:58℃;cc-191:58℃。由此获得扩增产物。各引物的序列、退火温度、重复基元等详见附表1。
表120对ssr引物信息
(2)电泳分离和银染检测
扩增产物中加变性缓冲液(包含98%甲酰胺,10mmol/lph8.0的edta,0.25%溴酚蓝和0.2%二甲苯氰),用8%(质量含量)变性聚丙烯酰胺凝胶(厚度1.0毫米左右)和1×tbe电泳缓冲液,上样20ng,恒压120v电泳90分钟后银染检测。银染方法主要过程如下:电泳完毕后,将粘有凝胶的玻璃板置入用于银染的塑料盆中;加入固定液(含10%无水乙醇和0.5%的乙酸),在摇床上轻微震荡15分钟进行固定,然后去离子水漂洗2次,每次2分钟;放入0.1%硝酸银染色液中摇床上轻微震荡10分钟染色,然后用去离子水漂洗2次,每次5秒钟;将凝胶置入显色液中(含有1.5%氢氧化钠,0.014%的四硼酸钠),在摇床上轻微震荡直至条带清晰且条带数不再增加为止;加入固定液,终止显色反应,用蒸馏水漂洗几分钟;去除凝胶和玻璃板上的水珠。放在白光灯下观察并用数码相机拍照。结果如附图1所示。
(3)微卫星分子标记在古樟群体遗传多样性检测中的应用
由于樟树原始自然群体现存较少,现有多为人工栽培群体和个体,因此选取树龄在100年以上的古樟树样品来检测樟树基因组ssr分子标记引物的有效性和多态性。从江西省安义、安福和瑞金三个县采集古樟树样品,样本数见表2,采用ctab法提取樟树基因组dna,以提取的待测dna样品为模板,通过dna聚合酶链式反应扩增、电泳分离和银染检测,将获得的樟树基因组ssr分子标记的引物应用于古樟群体的遗传多样性检测。采用popgene1.32(yehandboyle,1997)分析基因型数据及基因频率,计算古樟观测杂合度和期望杂合度,并进行哈代-温伯格(hardy-weinbergequilibrium,hwe)及连锁不平衡检验,以此来描述42个古樟dna多态位点的特征。由附图2-21和表3可以看出,本发明的20对樟树基因组ssr分子标记的引物在供试的42个古樟个体中表现出多态性,由此可见,本发明的20对樟树基因组ssr分子标记的引物能用于分析古樟的遗传多样性和遗传结构,是一种有效可靠的分子标记。
表2实验采集的古樟树及其来源
表3古樟的遗传多样性
(4)微卫星分子标记在古樟树亲缘关系聚类分析中的应用
从江西省安义、安福和瑞金三个县采集古樟树样品,样本数见表2,采用ctab法提取樟树基因组dna,以提取的待测dna样品为模板,利用所开发的20对樟树基因组ssr分子标记的引物进行pcr扩增,得到pcr扩增产物(具体步骤参见步骤(1)-(2));采用6%变性聚丙烯酰胺凝胶电泳检测pcr扩增产物,银染显色,统计电泳结果;采用popgene1.32(yehandboyle,1997)分析三个群体的亲缘关系(见附图22),同时,采用ntsys-pcversion2.11软件upgm法对古樟进行聚类分析(见附图23),由附图22、23可以看出,安义、安福和瑞金三个群体中,安福县和瑞金县群体的亲缘关系更近,与现有的有关樟树谱系地理研究中基因流走向的研究结果一致。由此可见,本发明的20对樟树基因组ssr分子标记的引物能用于分析樟树的遗传多样性和亲缘关系分析,是一种有效可靠的分子标记。
序列表
<110>江西省林业科学院
<120>樟树全基因组ssr分子标记及其制备方法和应用
<160>20
<170>siposequencelisting1.0
<210>1
<211>296
<212>dna
<213>人工序列(artificialsequence)
<400>1
cgttctcggatacgaacgattgcatcaaacacttctgcgagctatcgagttcgaaaagga60
aaggattaaggtttctcaaagttaaacccaaagatgtttttttttttttttttttttttt120
tttttttttttttttttggaagatccctaacggactcatcaaagagaagagatgccccat180
tccccgacacgaacgattgcatcaaacatttctatgagctatcgagttcgaagaggaaaa240
gattaaggcttctcaaagttgaacccaaagatgagaaatctgaaaaaaaaaatttg296
<210>2
<211>154
<212>dna
<213>人工序列(artificialsequence)
<400>2
gcgccatttgttttcttcatatcttttttaccactagtatttcctccttgaaatataata60
catgttaccattccaaaaataaataaataaataaataaataaatagtgcattaggtgagt120
agcagtactcctgccccttccgaccctagtgatt154
<210>3
<211>214
<212>dna
<213>人工序列(artificialsequence)
<400>3
gcatctccctaccaaatccatccaatatctaggcatcattgatcatatctgatacaatct60
caaaatgcatgttcatggatatgatatgaggttaacaattttttctgtaattgagcaaga120
actttagagcctcataaaaaaaaaaacccgattagaccatgtgaggtaaaatccgtgtca180
tatcccatgatgcccgatgcttcaaaatgagcaa214
<210>4
<211>261
<212>dna
<213>人工序列(artificialsequence)
<400>4
cagccattcagaagggaaagatagagggagggatagtttaagaactaatatatatatata60
tatatgcaaagtgaaaagcaatgtacatgcagcagctctcaaaaataagtttccacaagt120
gggaattccttcgtgaattcgttttagaattcaaaagtgaaaaagatctcgacttaaata180
tttctgggcaagacaagtggatcacatttggtcggatggtcaaataaatcaccgaaccac240
gtgcccccatagaagaagttg261
<210>5
<211>142
<212>dna
<213>人工序列(artificialsequence)
<400>5
ccgaacgtcaactcaaacaattctgcgagctattgtcctaaaagggaaagaactaaagtt60
tctcaaatttgattccaaaggtgagaaatctgattatatatatatatatattttttgaaa120
gatcaccaatgaacccatcaaa142
<210>6
<211>157
<212>dna
<213>人工序列(artificialsequence)
<400>6
tggaatgcaaagaaggaacctaatttacaacatattgaaaaaagaaaaaaaaaaagaact60
ccaactctgtgacaatagaagactgtaattcctgtaaacaaagataacaaactgatattt120
tgttttagagcgagcaccagaaatcaggggaccagag157
<210>7
<211>234
<212>dna
<213>人工序列(artificialsequence)
<400>7
tctctctcatggtcaaattgttgactctaggaaccttggggaccttccagctctctctct60
ctctctctctcatggtcaaattgttgactctaggaaccttggggaccttccagctctctc120
tctctctctctctcatggtcaaattgttgactctaggaaccttggggaccttccagctct180
ctctctctctctctctcatggtcaaattgttgactctaggaaccttggggacct234
<210>8
<211>162
<212>dna
<213>人工序列(artificialsequence)
<400>8
ccatttctcaataggaatattgattgtggaaaaaaaaaagtactgaaataaaaaagtatg60
ggctatttacaaataatagaaccagagatagttacccatttctcaataggaatattgttt120
gtggaaaaaaaaaaaaagtactgaaatgaaaaggtatgggct162
<210>9
<211>162
<212>dna
<213>人工序列(artificialsequence)
<400>9
cacggtccccaatctctaaaattgtccacacgacaattaaatctaattcagcctaaagaa60
taattagttgaaaaaaatttaaaaaaatagaatgattagttgaaaaaaaaacagagagag120
agagagagattagcctcatcacatggtccaacccaaatttga162
<210>10
<211>280
<212>dna
<213>人工序列(artificialsequence)
<400>10
ggaacgtccggctatgtaaaagactaaggagaagcattctctactttaaaatttatctct60
atatattaaaaaatttgcatctcactttctctctctacatttaaaacacactctctctct120
ctcagaaatctgagaagcatttattcaatttatctcgaagatcatcacgtcagtaagctg180
tagacgactctctcaatttctatttgcttctttttcttcttcttctcctcttcattcgtc240
tctttcgattctctattattagggttttgtttgccacttt280
<210>11
<211>184
<212>dna
<213>人工序列(artificialsequence)
<400>11
cacggtactgaccagggttcgattccctggatgcgcattcttttttggatattttttgtt60
ttttttttgttgctagaattcaagtaatgtggaacaactgacccctcaaatgtatcacat120
gtgcatttttttttttggatcttgttttttgctaagaattcaagtaatgtggaacaactg180
ggcc184
<210>12
<211>131
<212>dna
<213>人工序列(artificialsequence)
<400>12
agagatcgaaagggcgatggaaatgggttctgcagggagcgatcaaaagggagagagaga60
gagagagagagagagcagagagattgagtggagagatcgagcggcgatggaaatgggttc120
tgtagggagcg131
<210>13
<211>190
<212>dna
<213>人工序列(artificialsequence)
<400>13
tgatgaggatggggtcattttcctccaaaacatggcaaaagattgaacttaaaagctgcc60
atccatcattggcccatatgatgattgattggtcgtagctaaaaaatgactccatttcat120
aatcccaaccattaaagttgatggattgtatgatgatgatgatgggttcatttacctcca180
aaacatggca190
<210>14
<211>122
<212>dna
<213>人工序列(artificialsequence)
<400>14
agaatagggaaaggggcagaaacaaagaggaaagagagactagccaaaatagtgggatgg60
agagagagagagagagggtgttttttttctgttcagagaacaagggtttgatcaaggaag120
gg122
<210>15
<211>122
<212>dna
<213>人工序列(artificialsequence)
<400>15
atgagcgtcatccaatgtcatttgatgtgtgaagtgaggtaacttctctctctctctcta60
tatatatatatatatgtatgtatgagagatatttaaggtcttaatcggaactgggtatgt120
gc122
<210>16
<211>157
<212>dna
<213>人工序列(artificialsequence)
<400>16
gggtcggggtaaattaggtcaggccaaagattttatatatatatatatatatatgaagcg60
aaatggtttcaaattgaaatcactttcaattcatttcaattgattttaactaatccaatt120
taccaatttaatttagtttgaccttagcaaaccggtc157
<210>17
<211>223
<212>dna
<213>人工序列(artificialsequence)
<400>17
ctatccacttccctgccgtactaggtaaaattcaacctgagccgaccaccttgtctcaat60
tgcaagtggcttaaccggcccgtaaaggtgtttgtttccatctcacaagaaaaagtagta120
ataataataataaaaagatttccatcattccaaaatccagcccaaggaaacaaacgcgtg180
gcactacttttctctgctttcaacgctttctcgaagattctgg223
<210>18
<211>204
<212>dna
<213>人工序列(artificialsequence)
<400>18
tgctctaattcaccccttgcattgatgggtttgtatgagtcaatgctgaaacctttttat60
gggtttgttggatgattgtgttatgttctaattactgggatttctttctttctttctttc120
ctcctctgtatctaattttgaagattttcttgagaaatgtttttgcagttttcccttttt180
ttgatgggttttagtgtggagcct204
<210>19
<211>207
<212>dna
<213>人工序列(artificialsequence)
<400>19
accatccagagtttgatcggaaagagggagaagacttattttaggaagcaattgagaagt60
gagaatttgtttatttatttatttatttaactttcagtcattgtttgggccatacaacta120
ttccgcttgattttcttgcgttaatattgggacccaggtgggccaccagatgactcatcc180
aatccatgaatccgaaggagaaccctc207
<210>20
<211>259
<212>dna
<213>人工序列(artificialsequence)
<400>20
gttctccttctgatccacggatcgaatgggtcatcgggtggcctacctgggtttcagtat60
caacgcaagaaactaaatagcccaaacaatgactaaaacttaaaaaataaataaataaat120
aaataaataacaaataaacaaaaacaaattccctattcttaattgtttcctaaaacacgt180
actctccctctctctaatcagacgcaagatggtgtaccaaatagggctcacatcacatgg240
gttcaacgcataatgggtc259