本发明涉及生物技术领域,具体涉及源于一种深渊新物种的线粒体基因组序列。
背景技术:
线粒体是细胞中进行生物氧化及能量供应的重要细胞器。真核生物的线粒体基因组dna通常为裸露的共价双链闭合环状分子,由重链和轻链两条链组成。线粒体基因组dna一般由37个编码基因及非编码的控制区组成,其中编码基因包括:13个疏水蛋白基因、22个trna基因及两个rrna基因。与细胞核基因组dna相比,线粒体基因组具有分子量小、母系遗传、拷贝数多、重组率低、进化速率快等特点,已广泛应用于系统发育及物种鉴定、遗传学、生物地理学、保护生物学等各领域的研究;同时,对于濒危物种及新物种,线粒体基因组亦是一类重要的基因资源。
海斗深渊是大洋的最深处,其深度范围在6000m-11000m。深渊端足类(amphipoda)是深渊环境中主要生物群落之一,对高压、低温、寡营养源等极端环境具有良好的适应能力,同时,深渊端足类在深渊生态系统的维持中起到重要作用。端足类在节肢动物门中种类繁多,分类关系复杂,对深渊端足类线粒体基因组的研究有利于了解其分类学地位及解析对深海极端环境的适应机制。目前,针对深渊端足类线粒体基因组的研究非常稀少。仅有的一例则是马里亚纳海沟hirondelleagigas的线粒体基因组序列。中国科学院深海科学与工程研究所利用自制诱捕装置于马里亚纳海沟,于深度10908m诱捕到体长不足1cm的小型端足类,目前,对于该物种的线粒体基因组研究尚未见报道。
技术实现要素:
针对以上现有技术的不足之处,本发明获得了一种深渊新物种的线粒体基因组序列,并结合深渊端足类hirondelleagigas及非深渊物种线粒体基因组的比较分析,揭示了深渊端足类线粒体基因组的组成、结构特点,明确了该物种独特的分类学地位,为解析深渊端足类适应深渊极端环境奠定理论基础。
本发明采取的技术方案如下:
源于一种深渊新物种的线粒体基因组序列,所述基因组序列如seqidno:1所示。
优选的,所述线粒体基因组序列通过以下方法获得:
(1)小型端足类基因组dna的提取;
(2)获取线粒体基因组dna中12srdna,16srdna及coi基因的部分序列:
三个基因各对应一对节肢动物线粒体dna的通用引物,名称分别为12sf,12sr;16sf,16sr;coif,coir;
以小型端足类dna作为模板,进行pcr反应,对扩增产物进行测序,得到12srdna,16srdna及coi基三个基因的部分序列;
(3)利用步骤(2)得到的序列,进行长片段pcr反应引物的设计,获得coi至12srdna的间隔序列与coi至16srdna的间隔序列,引物名称分别为:lcoif,l12sr及l16sf,lcoir;以小型端足类dna作为模板,进行la-pcr反应,对扩增产物进行测序,实现间隔序列的获得;
(4)对步骤(2)和(3)得到的序列进行拼接。
优选的,所述12sf的序列如seqidno:2所示,所述12sr的序列如seqidno:3所示,所述16sf的序列如seqidno:4所示,所述16sr的序列如seqidno:5所示,所述coif的序列如seqidno:6所示,所述coir的序列如seqidno:7所示。
优选的,所述lcoif的序列如seqidno:8所示,所述l12sr的序列如seqidno:9所示,所述l16sf的序列如seqidno:10所示,所述lcoir的序列如seqidno:11所示。
优选的,所述步骤(1)为:
1)取3-10mg小型端足类组织冷冻样品,放入到加有wtlbuffer的离心管中,将组织剪碎;
2)向离心管中加入蛋白酶k,涡旋震荡15-20s,60-65℃放置6小时以上,离心以除去挂在管壁的水珠;
3)离心管冷却至室温,加入pcpbuffer,涡旋震荡25-30s,冰浴5-10min;
4)以13000-15000g的转速离心3-5min,将上清液转移到另外一个离心管中;
5)向离心管中加入300-350μl异丙醇溶液,将溶液混合,冰浴1-2h;
6)以13000-15000g的转速离心3-5min,倒掉上清液;
7)加入700-750μl乙醇溶液,13000-15000g的转速离心3-5min,倒掉上清液;
8)重复步骤7);
9)于无菌环境中将离心管中残余酒精风干10-15min;
10)加入50-100μl无菌水将dna充分溶解后保存。
更优选的,所述步骤(1)为:
1)取3mg小型端足类组织冷冻样品,放入到加有300μlwtlbuffer的离心管中,将组织剪碎;
2)向离心管中加入5μl20mg/ml的蛋白酶k,涡旋震荡15s,60℃放置6小时以上,离心以除去挂在管壁的水珠;
3)离心管冷却至室温,加入100μl的pcpbuffer,涡旋震荡30s,冰浴5min;
4)以13000g的转速离心3min,将上清液转移到另外一个离心管中;
5)向离心管中加入300μl异丙醇溶液,将溶液混合,冰浴1h;
6)以13000g的转速离心5min,倒掉上清液;
7)加入700μl70%乙醇溶液,颠倒离心管使溶液混匀,13000g的转速离心5min,倒掉上清液;
8)重复步骤7);
9)于无菌环境中将离心管中残余酒精风干10min;
10)加入50μl无菌水将dna充分溶解后于-20℃冰箱中保存。
与现有技术相比,本发明的有益效果是:
本发明获得的深渊小型端足类线粒体基因组有助于了解深渊物种线粒体基因组特有的碱基组成及结构特点。
通过分析发现:深渊端足类的线粒体基因组蛋白编码基因与非深渊物种相比,其atskew为-0.204~-0.302,低于非深渊物种(-0.143~-0.176),gcskew为0.200~0.299高于非深渊物种(-0.087~0.082),trna序列与非深渊物种相比也呈现atskew低,gcskew高的特点。深渊端足类线粒体基因组的有效密码子数目(enc)在31.8~41.8之间,而非深渊物种的enc范围在36.5~52.3之间,表明深渊端足类对密码子的使用有较强的偏好性。深渊端足类线粒体基因组对非极性氨基酸的使用比例在64.0%~64.5%之间,高于浅海种所对应的比例(61.1%~63.4%),而对极性不带电氨基酸及极性带负点氨基酸的使用比例(25.3%~25.5%;4.0%~4.2%)低于浅海种(25.9%~27.5%;4.0%~4.4%)。深渊端足类22个trna中trna-ser(ucu)及trna-val(uac)具有非典型的trna三叶草结构,其d-loop臂消失;大部分非深渊端足类trna-cln(uug)的tψc臂消失,而深渊端足类的trna-cln(uug)具有完整的三叶草结构。甲壳动物祖先种pancrustacea的线粒体基因需要经过一次移位(transposition),两次反向移位(reversetransposition),两次反向变换(reversal)及三次tdrl变换(tandemduplicationswithsubsequentrandomloss)才能形成现有的小型深渊端足类的线粒体基因组,并且其中一次反向变换竟涉及到20个线粒体基因同时参与,该现象在其他端足类线粒体基因组中从未发现。由于反向变换,导致其两个rrna基因同时位于线粒体轻链中,而其他端足类的两个rrna基因均位于线粒体的重链。通过系统发育分析,该小型深渊端足类与ncbi中已经公布线粒体基因组信息的端足类均不属于同一超科(图1),表明该物种具有独特的进化地位。
本发明获得的深渊小型端足类线粒体基因组序列是宝贵的深海生物基因资源,其线粒体基因组序列的组成、结构的分析,可对端足类系统发育、种质资源库的扩充及对深渊环境的适应机制奠定重要的分子生物学理论基础。
附图说明
图1为利用本发明得到的深渊端足类线粒体基因组与其他端足类线粒体基因组构建的系统发育树;
图中椭圆中标注为本发明中的深渊物种。
图2为本发明得到的小型端足类线粒体基因组扩增产物的凝胶电泳图;
图中从左至右分别是分子标记物,引物12sf,12sr扩增得到的条带,引物16sf,16sr扩增得到的条带,引物coif,coir扩增得到的条带,分子标记物。
图3为本发明得到的小型端足类线粒体基因组扩增产物的凝胶电泳图;
图中从左至右分别是分子标记物,引物lcoif,l12sr扩增得到的条带,引物l16sf,lcoir扩增得到的条带,分子标记物。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。
1.样品采集:利用诱捕装置对马里亚纳海沟10908m处的深渊端足类进行采集,采集后的样品于-80℃冰箱中进行保存。
2.dna提取:使用omegabiotek公司的sqtissuednakit,对深渊小型端足类的基因组进行提取,具体方法如下:
1)取10mg小型端足类组织冷冻样品,放入到加有300μlwtlbuffer的1.5ml灭菌后的离心管中,用清洗并灼烧后的剪刀将组织剪碎;
2)向离心管中加入5μl20mg/ml的蛋白酶k,涡旋震荡20s;65℃放置6小时以上,简短离心以出去挂在管壁的水珠;
3)离心管冷却至室温,加入100μl的pcpbuffer,涡旋震荡30s,冰浴10min;
4)以15000g的转速离心5min,将上清液转移到另外一个无菌的1.5ml离心管中,弃去留有沉淀的离心管;
5)向离心管中加入350μl纯度100%的异丙醇溶液,轻轻将溶液混合,冰浴2h;
6)以15000g的转速离心3min,倒掉上清液;
7)加入750μl70%乙醇溶液,轻轻颠倒离心管数次,15000g的转速离心3min,倒掉上清液;
8)重复步骤7);
9)于无菌环境中将离心管中残余酒精风干15min;
10)加入100μl无菌水将dna充分溶解后于-20℃冰箱中保存。
3.普通pcr扩增及测序:对小型端足类线粒体基因组dna的12srdna,16srdna及coi基因的部分序列进行扩增,具体方法如下:
用于扩增小型端足类线粒体基因组dna的12srdna,16srdna及coi基因部分序列的引物序列为:
12sf:gtacayctactatgttacgactt
12sr:gtgccagcagyygcggttanac
16sf:gaccgtgckaaggtagcataatc
16sr:agatagaaaccaacctgg
coif:ggtcwacaaaycataaagayattgg
coir:taaacytcaggrtgaccraaraayca
利用takara公司高保真酶试剂盒进行上述三个片段的扩增反应:模板为上述提取的深渊小型端足类基因组dna50ng,每个反应50μl体系,其中2.0μl浓度为10μm的引物,10.0μl5×primestarbuffer(mg2+plus),4.0μl浓度为10mm的dntp,1.0μl高保真酶(primestarhsdnapolymerase),用无菌水将反应体系补齐到50μl。
12srdna的pcr反应条件为:98℃预变性10s;98℃变性10s,48℃退火15s,72℃延伸30s,循环30次,最终72℃延伸5min。
16srdna的pcr反应条件为:98℃预变性10s;98℃变性10s,45℃退火15s,72℃延伸30s,循环30次,最终72℃延伸5min。
coi的pcr反应条件为:98℃预变性10s;98℃变性10s,40℃退火15s,72℃延伸30s,循环30次,最终72℃延伸5min。
pcr产物利用1%琼脂糖凝胶电泳进行检测。
4.长片段pcr扩增及测序:
利用primerpremier5.0软件,以前期得到的12srdna,16srdna及coi基因的部分序列为模板,设计引物,用来扩增基因的间隔区,引物设计结果如下:
lcoif:gtggaaagtggagttgggacaggatg
l12sr:cttatctcaaagagagtgacgggcaat
l16sf:gaacgggaatgaatggtttgacaat
lcoir:caaatccacagaagcccccctatg
利用takara公司lataq试剂盒对coi至12srdna的间隔序列与coi至16srdna的间隔序列进行扩增反应:模板为上述提取的深渊小型端足类基因组dna100ng,每个反应50μl体系,其中5μl浓度为10μm的引物,5.0μl10×lataqbufferii(mg2+plus),8.0μl浓度为2.5mm的dntp,0.5μllataq酶,用无菌水将反应提取补齐到50μl。
pcr反应条件均为:94℃预变性1min;98℃变性10s,55℃退火12min,循环30次,最终72℃延伸10min。
pcr产物利用1%琼脂糖凝胶电泳进行检测。
5.序列拼接
利用dnaman软件对测序得到的各dna片段进行拼接。
实施例2
1.样品采集:利用诱捕装置对马里亚纳海沟10908m处的深渊端足类进行采集,采集后的样品于-80℃冰箱中进行保存。
2.dna提取:使用omegabiotek公司的sqtissuednakit,对深渊小型端足类的基因组进行提取,具体方法如下:
1)取3mg小型端足类组织冷冻样品,放入到加有300μlwtlbuffer的1.5ml灭菌后的离心管中,用清洗并灼烧后的剪刀将组织剪碎;
2)向离心管中加入5μl20mg/ml的蛋白酶k,涡旋震荡15s;60℃放置6小时以上,简短离心以出去挂在管壁的水珠;
3)离心管冷却至室温,加入100μl的pcpbuffer,涡旋震荡30s,冰浴5min;
4)以13000g的转速离心3min,将上清液转移到另外一个无菌的1.5ml离心管中,弃去留有沉淀的离心管;
5)向离心管中加入300μl纯度100%的异丙醇溶液,轻轻将溶液混合,冰浴1h;
6)以13000g的转速离心5min,倒掉上清液;
7)加入700μl70%乙醇溶液,轻轻颠倒离心管数次,13000g的转速离心5min,倒掉上清液;
8)重复步骤7);
9)于无菌环境中将离心管中残余酒精风干10min;
10)加入50μl无菌水将dna充分溶解后于-20℃冰箱中保存。
3.普通pcr扩增及测序:对小型端足类线粒体基因组dna的12srdna,16srdna及coi基因的部分序列进行扩增,具体方法如下:
用于扩增小型端足类线粒体基因组dna的12srdna,16srdna及coi基因部分序列的引物序列为:
12sf:gtacayctactatgttacgactt
12sr:gtgccagcagyygcggttanac
16sf:gaccgtgckaaggtagcataatc
16sr:agatagaaaccaacctgg
coif:ggtcwacaaaycataaagayattgg
coir:taaacytcaggrtgaccraaraayca
利用takara公司高保真酶试剂盒进行上述三个片段的扩增反应:模板为上述提取的深渊小型端足类基因组dna50ng,每个反应50μl体系,其中2.0μl浓度为10μm的引物,10.0μl5×primestarbuffer(mg2+plus),4.0μl浓度为10mm的dntp,1.0μl高保真酶(primestarhsdnapolymerase),用无菌水将反应体系补齐到50μl。
12srdna的pcr反应条件为:98℃预变性10s;98℃变性10s,48℃退火15s,72℃延伸30s,循环30次,最终72℃延伸5min。
16srdna的pcr反应条件为:98℃预变性10s;98℃变性10s,45℃退火15s,72℃延伸30s,循环30次,最终72℃延伸5min。
coi的pcr反应条件为:98℃预变性10s;98℃变性10s,40℃退火15s,72℃延伸30s,循环30次,最终72℃延伸5min。
pcr产物利用1%琼脂糖凝胶电泳进行检测,如图2所示,其pcr产物片段大小范围在450bp-750bp之间,将扩增的pcr片段送往北京六合华大基因科技有限公司广州分公司进行测序,扩增结果利用blastn程序于genbank数据库中进行比对,结果发现,三条序列均与节肢动物相似度最高,可以作为后续长片段pcr实验的引物设计参考。
4.长片段pcr扩增及测序:
利用primerpremier5.0软件,以前期得到的12srdna,16srdna及coi基因的部分序列为模板,设计引物,用来扩增基因的间隔区,引物设计结果如下:
lcoif:gtggaaagtggagttgggacaggatg
l12sr:cttatctcaaagagagtgacgggcaat
l16sf:gaacgggaatgaatggtttgacaat
lcoir:caaatccacagaagcccccctatg
利用takara公司lataq试剂盒对coi至12srdna的间隔序列与coi至16srdna的间隔序列进行扩增反应:模板为上述提取的深渊小型端足类基因组dna100ng,每个反应50μl体系,其中5μl浓度为10μm的引物,5.0μl10×lataqbufferii(mg2+plus),8.0μl浓度为2.5mm的dntp,0.5μllataq酶,用无菌水将反应体系补齐到50μl。
pcr反应条件均为:94℃预变性1min;98℃变性10s,55℃退火12min,循环30次,最终72℃延伸10min。
pcr产物利用1%琼脂糖凝胶电泳进行检测,如图3所示,其pcr产物片段大小范围在5.5kb-8.5kb到之间,将扩增的pcr片段送往北京六合华大基因科技有限公司广州分公司进行测序。
5.序列拼接
利用dnaman软件对测序得到的各dna片段进行拼接,最终得到小型深渊端足类的线粒体基因组的长度为13831bp(如seqidno:1所示),利用blastn程序将该序列于genbank数据库中进行比对,该序列与端足目中parhyalehawaiensis的线粒体基因组(登录号:ay639937.1)相似度最高为75%,从而确定该测序方法得到了新的、有效的端足类线粒体基因组。
6.基因注释
参考已经报道的端足类线粒体基因组dna序列,利用在线工具mitos及ncbi的blast查找该线粒体基因组的13个蛋白编码序列,利用在线工具arwen及mitos查找到22个trna基因及2个rrna基因。
7.碱基成分分析:利用dnaman软件分别对蛋白编码基因、trna基因及rrna基因进行at含量分析、atskew分析及gcskew分析并与其他端足类(hirondelleagigas、metacrangonyxlongipes、gondogeneiaantarctica、pseudoniphargusgorbeanus、pseudoniphargussorbasiensis、onisimusnanseni、brachyuropusgrewingkii、caprellascaura、caprellamutica、longipodacrangonyxsp.、eulimnogammarusvittatus、parhyalehawaiensis)线粒体基因组进行比较,其中hirondelleagigas也为深渊种。atskew=(a-t)/(a+t),gcskew=(g-c)/(g+c)。
通过分析发现:深渊端足类的线粒体基因组蛋白编码基因与非深渊物种相比,其atskew为-0.204~-0.302,低于非深渊物种(-0.143~-0.176),gcskew为0.200~0.299高于非深渊物种(-0.087~0.082),trna序列与非深渊物种相比也呈现atskew低,gcskew高的特点。
8、密码子及氨基酸偏好性分析:利用在线工具sequencemanipulationsuite对蛋白编码基因的64个密码子及20种氨基酸进行统计及偏好性分析,利用inca2.1软件计算有效密码子数目(enc),其数值越低表明密码子使用的偏好度越大。
通过分析发现:深渊端足类线粒体基因组的有效密码子数目(enc)在31.8~41.8之间,而非深渊物种的enc范围在36.5~52.3之间,表明深渊端足类对密码子的使用有较强的偏好性。深渊端足类线粒体基因组对非极性氨基酸的使用比例在64.0%~64.5%之间,高于浅海种所对应的比例(61.1%~63.4%),而对极性不带电氨基酸及极性带负点氨基酸的使用比例(25.3%~25.5%;4.0%~4.2%)低于浅海种(25.9%~27.5%;4.0%~4.4%)。
9、trna结构分析:基于6中得到的trna序列利用arwen及mitos在线工具对22个trna基因的结构进行预测,并与另外12个端足类的线粒体基因组进行比较。
10、基因重排分析:利用在线工具crex以甲壳动物祖先种pancrustacea线粒体基因组的各基因顺序作为参考,推演深渊新物种线粒体基因组各基因顺序的衍生过程,并与另外12个端足类的线粒体基因组进行比较。
通过分析发现:深渊端足类22个trna中trna-ser(ucu)及trna-val(uac)具有非典型的trna三叶草结构,其d-loop臂消失;大部分非深渊端足类trna-cln(uug)的tψc臂消失,而深渊端足类的trna-cln(uug)具有完整的三叶草结构。甲壳动物祖先种pancrustacea的线粒体基因需要经过一次移位(transposition),两次反向移位(reversetransposition),两次反向变换(reversal)及三次tdrl变换(tandemduplicationswithsubsequentrandomloss)才能形成现有的小型深渊端足类的线粒体基因组,并且其中一次反向变换竟涉及到20个线粒体基因同时参与,该现象在其他端足类线粒体基因组中从未发现。由于反向变换,导致其两个rrna基因同时位于线粒体轻链中,而其他端足类的两个rrna基因均位于线粒体的重链。
11、系统发育树的构建:利用muscle软件,将6中注释得到的13个蛋白编码基因与另外已报到的12个端足类线粒体基因组中的蛋白编码基因分别进行比对;利用dambe去除碱基替换饱和的基因;利用gblock软件将未饱和的基因中比对效果不好的区域进行去除,并将各基因的比对结果进行连接;利用jmodeltest预测构建系统发育树的最优模型,根据预测结果,利用raxmlgui软件中的gtr+g模型进行系统发育树的构建(如图1),bootstrap值为1000。
通过系统发育分析,该小型深渊端足类与ncbi中已经公布线粒体基因组信息的端足类均不属于同一超科(图1),表明该物种具有独特的进化地位。
以上内容是结合具体的实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换。
序列表
<110>中国科学院深海科学与工程研究所
<120>源于一种深渊新物种的线粒体基因组序列
<160>11
<170>siposequencelisting1.0
<210>4
<211>13831
<212>dna
<213>深渊端足类(amphipoda)
<400>4
gtagcataatcatttgttttttaattaagaacgggaatgaatggtttgacaataataaac60
tttaattttttttaaagtcaaaaaatttttagtttaagtaaaaatgcttaaataaattag120
agggacgataagaccctaaaagctttttttaggcaataatttaaaagtaattttatttag180
ataaaattaactggggaagtagttatttatatataataatttattttacagaaaaaatgg240
tatatgatcttttaaataagaataaattgagttagttactttagggataacagcataata300
gttttgaagagttcttatttataaaactgattatgacctcgatgttgaattaaaaattct360
taacaaggaaaaaggtgttagagaaggtttgttcaacctttaaatttttacatgatttga420
gttcaaaccggtttaagccaggttggtttctatcttttaaacataacaaatttattttag480
tacgaaaggattaaataatttttatactatactatattggcagaagtatgtgatagggtt540
aggtcctagtaaagagattatttattctcatgtagtaatatttttagtattaaaagtaat600
tattagatatggttttttggttatttgtgttttattgagagtggcaattgttactttaat660
ggaacagaaaattattggggcatctcaagtacgtattggacctaatgttgtaggatactg720
aggattattacagccttttgcagatgctgtaaaattattttttaaagagggattaattcc780
tcttataagatttaatttaatgatttattttatttccccggcagttatattattattagc840
tttattattttgggttttatacccgtatattactggtggtatagactataaactaggggt900
tttatgatttttatgtattagaggtttgggggtatatcctattttaagggggggttgggt960
gtctaattgtaaatattctttattaggtagattacgaagagttgctcaaataatctctta1020
tgaagtaagattattattaattttattaaggatgatttgatgttttaatacttatgattt1080
attattaattataaaaagtcagatatatatttgggcaggtattatgtttatacctttaat1140
aatagtttggttagtatctagtctagctgagactaatcgttctccatatgatttttcaga1200
aggagaatctgaattagtttctggatttaatacggaatattcggcaggtgggtttacttt1260
gatctttataagggaatatagaaatattttattcataagcttattatttgtaatgttatt1320
ttttaggagagagtttaattgattttcggtaataaaaggtatattagttatatatttgtt1380
tgtatgagtgcgcactagttatcctcgttatcgatatgataaattaatatatttagcttg1440
aaaaaagtttttgccttttattttaatgaggttcatttttttttttttgttaagttagta1500
atgataagtgttgagtataatttcaaaaaatagttttaagctaaaaatattaattttggg1560
aattaaagatatatatttatttttttgaattatagtgtattttaaaatgacacagtttta1620
taatgtttaaaattaatataatctataaattttgggggtatagattaagggtatttttat1680
tattttcattgtgggggtatatacatttttgtttaaaagagtataggtgatttattgaat1740
gggaaatttttagtttaaggggagtgcatattactgtaagattaatttttgattctataa1800
gatgtatttttttgagagtagtaattttaatttctattagtattttatattataggattt1860
attatataagtggagataaaagggtgcttcgatttattttattaatattattttttattg1920
gttcaataattattttaattattaggcctaatttaattagtttattgttaggttgagatg1980
gattgggattaacttcttatttattagtgatttattatcaaaatgaagcagttagatctg2040
ctggaatgttgactattttaagtaatcgtattggagacgtggccattttaatagctatta2100
gtttgttatttgtgaaggggagttgaaattttatattattatcttattatgactatatgt2160
ttgggttattaattattttagctggtttaactaagagagcacaaatacccttttcagcat2220
gactacccgcggctatagccgcgcctactcccgtatcagccttggttcactcttctactt2280
tagtaacggctggggtttatttattaatccgatttaatgatattttaataaataaatatt2340
taatattattattaacagtagtcgcaattattactatattagtatccgggataagagcta2400
ttatagaaagagatttaaaaaaagtagtggctttttcaactttaagacaacttgggctta2460
taatattaacattaagtttaggttatagaacaatagctttttttcatcttttaactcatg2520
ccttatttaaatctactttatttatatgtgcggggtatataattcattgtttatctaata2580
gtcaagatattcgtaaattgtcagggttaaatttttatgccccagtgttaataagagtgt2640
ttaatgtaactaattttgctctgtgtggtataccatttttaacaggattttattctaaag2700
atacgatcttagaaattttatttagtcatggaatgaggtttattcttttaatattaacat2760
gatttactacatgtttgactcttatttatagcttacggtttatatatttaagagttaatt2820
ttgttcctaacttagtattagttatatgtaataggttagaaatatatttagtacaaggaa2880
ttttattactattttttttaagtgtagtagggggtagaagtcttatgtggttaatatttc2940
cagtaaaaggaattagaattttattgggaggaataaaatatatagtatatgggggcatgt3000
taatagggggaatatcgttaataatgaaaaaaaaaacttttttaaaaatttatagtgtat3060
ataattatgttttttttaggagtatttgatatactcccttttttaggggtcaatttttta3120
ctgggcaatttttaagaagcggcggaataagggataagattagagattcaggttgattag3180
aattatacggggctcgtggaggacaatctaaacttgtttttttaagggcttatggtcaat3240
taagtcagataagtattttggtaagaacatttttttttagttttatattttgggggttag3300
ttatctatatatgagtttagtttaaataacttaatgagagtattatattgaagttgtaat3360
tgtgattttttatctttagacaatatttatattaatttttaaaaattttttagctttatc3420
ttgaaaggataatgtgtttatatttacactataaaaataattagttaagataatattatc3480
aataagattattaacaataatctacctctatttggttttaaactagtaagataaaacgat3540
taatcgctttaggcagattagaaatctgatttatatttatcttaaaaagagattagtctg3600
taaacattttttaagtgcaaattaaatatttttattaaattatagtctctaagttgttat3660
aggatgatttagtttaatagattaatagttaattttattaactttaaaaatcaaaatttt3720
atgtgctcgttacactaaactaatcaataatataattctaattaaaagttttttcaagtt3780
tgcaacttgacgtgttagatttaatacactatagaatataagatttttaattatagaata3840
taataattcatttataagtttacaacttactatctagttttcgatcatataattttgttt3900
ataaagtgcctgaggattaaagggctattttgatgtaatagagatgtagtaattaccttt3960
ataataaaagataagctaatttaaagcttatgggttcatacctcatttatgagtaatttc4020
tcttttaatattttttttcatcctgttaatattttatttataggaacattaattttttct4080
ttatgtttaatcttttctataaacacatgagttatagtgtggttaggattggaacttaac4140
cttttatcgtttattcctattatattaaaaaaaaataataagtataatgtagaagcggga4200
ttaaaatattttttaattcaatctcttggttcaatatatttattaatgagatttattttt4260
ggatttttaatatttagtaagggagttagattttttattttagtagctctgtttataaaa4320
atgggggcggctcccactcattcttgatttccgtctgttattgaaggattgacatgacct4380
catgcttttgttttaatgacgttgcagaagttaggacctttgtctttaatcccttttgta4440
ttgatgaattcaagatcattttatattgtttatttttatttggtttcatcggctcttgta4500
ggtgctgtaataggtcttaatcagtcttctttacgtaagattttagctttttcttctatt4560
aatcatacaggctgaatattagcttgttgttgtttaactaagctgtattgaattatttat4620
attttagtgtatagacttattttggtacctattattctagtattgtataaattacaatta4680
ttttttattaatcatgtatttaagattcctaattttttttttaacattatatttagggtt4740
tcatttatatctttaggaggtttacctccttttacagggtttatattaaaattgttagta4800
gtaaaggaattaattaattttataactaattattttattttatttattttgttgttttca4860
tctttttttagtttgttttattattttcgtttaatactttattattttatactttcgttt4920
acaaataggattaatttttttttttttaataagttttctttctttttagttatgttgaat4980
gtgtcaggtatttttattttggtttttttttattttatttaataaattttaagttataaa5040
aaactataaaccttcaaagtttaaaatgagagtattcttaagtttaaattttagggcgat5100
gatttttttctaccaatcataaagatattgggactctttattttattttaggggcatggg5160
ccagtgcgttaggtacttctttaagagtagttattcgatcagagttaataactccaggat5220
ttttaattggagatgatcaaatctataatgtcattgtaactgctcatgcatttgtgataa5280
ttttttttatggtaatacctattatgatcggagggtttggaaactggcttatccctttaa5340
tattgggaagtcccgatatggcatttccccgaataaataatataagattttgattacttc5400
cacctgctctatctttgttaatattgagtggattagtggaaagtggagttgggacaggat5460
gaactgtctatcctcccttagctagggcagtagcccataggggggcttctgtggatttgg5520
caattttttcattgcatttggcaggagcgtcttctattctcggggctgtaaattttattt5580
caactgtgattaatatacgaagcccgggtataacgtgggaacaagttcctttgtttgtgt5640
ggtcagttttagtaactactgtcttgttattattatctttacctgtattggcaggggcaa5700
ttactatattattaacagatcgaaatttaaatacttcattttttgatccttcgggaggtg5760
gagatcctattttatatcaacatttattttggttttttggccatcctgaagtttatattt5820
tagttttacccgcttttggaatagtatctcatgtagtaacccatgaagctagaaaaaaag5880
aaacgtttggtactttaggaataattcatgctatattggcaattggtattatagggtttt5940
tagtgtgggcacatcatatatttacggtagggatagatgttgatactcgggcttatttta6000
cctctgccactatattaattgcagtacctacagggattaaagtatttagttggttgagga6060
ctttgcaggggggtaaattgtatttatctccacctttattatggtctttgggttttattt6120
ttttatttactgtaggtggcttaacaggcattattttggcaaattcttcattagatattg6180
ttttacatgatacttattacgtagtagctcattttcattatgtattatctatgggggcag6240
tgtttggaatttttactgggttattttattgatacccacttataaccggtttagtgttta6300
actcaaagtttacaaagcctcatttttttttaatatttttaggagtaaatttaacatttt6360
ttcctcagcattttttagggttgtctggaatacctcgtcgttattcagattatcctgatt6420
ctttctcttgttggaatattgtctcatctataggtagtactttgactataatttctttta6480
ttttatttattattatattattagaatctataatttctcgacgtgaagtattatttaagt6540
tttatttatctacgtctttggagtgaactcatagatatcctcctgctgatcatagttatt6600
ctgatttaccactattaactaatttttaaaatggcagattagtgcattagggttaagttc6660
tataaatgagatatttctcttttaaaaatagctacatggtctatattaaggtttcaagat6720
acggcttcacctgttatgacacaattaataatattttatgattttgtaatgattgtagtt6780
attataattatgactgtggttggtttgattataatatttatagtaaggtataaatttact6840
aataagtatatacttcaagaacaatgggtagaaacaatttggactattttacctatgcta6900
gtcatgtttgttattgtattacctgcttttcgtactctttatttattggacgatccgttt6960
atgtctaggttaaccctaaaaactacgggacatcaatggtattgatcgtatgaatattct7020
gattttccaaatgtggagtttgactcttatatagttcctaaggaattaagtttaaatcgt7080
ttgttagatgtagacaataatactattttaccagtatacactcaggtacgggtaattttg7140
tctagtacagatgtaattcatgcatgaacggttccggcattaggtattaagtcagatgcc7200
gtaccggggcggttaaatcaagttttattttttattgaccgattgggaaattattatggt7260
caatgttctgaaatttgtggagcaaatcatagatttatgcctattaaaattgagtctact7320
tttataaaaaattttttaagttggttatcacatatattttttttaggtgactgaattaag7380
tgtaaatcttttaaatttattatagtgttcaatttagcacttctaaaaaattagttaatt7440
attataatattagtttgtcagactaaagttactcgggagtatttttttatccctcaaata7500
agacctatattgtgagttcctattactatatttgtgcaagttagatttctaagttttgta7560
tttattatttatttttatggttatgtgagtatatttgatcaacaaagtgcatctgttagg7620
gttattaaaagagttataagatgataagaaatctgttttcaatttttgatccgagaacta7680
cgttttttttaagtttaaatttgtgttcgacggttatttttttattgttttttccaagat7740
tagtaatggttatatcttctcgttatagatctttttattttggcttattaaattatttaa7800
agagagaatatttgccattaaggttaaaggttccatattttgtattattttttgtttctt7860
tatttatatttattatatttaataatgtattaggattatttccatatatttttacagcta7920
caagtcatatatctttttctttagcattagcgctacctctatgattagggttgatatttt7980
acggatgaagaagaaatatatataatttattcgcacatttaattcccgtaggaactccgg8040
cggttcttgtttcttttatagttttaattgaaacagtaagaaatattattcgtccaggta8100
cgttagctattcgattgagggctaatatagtagctggacatttgttaattacattattga8160
ggtcttcaactcctattactccttgaggagtgttgccacttttagttggggctcagttgg8220
ctctaagaatactagagattgctgtggcgataattcaagcttatgtctttagaattttga8280
ttacattatacacaaatgaagtaatttaatgataaatttattacataatcacccttttca8340
tatagtcgaaaagagcccttgaccagttattgcttcgttaaatgcttttcttataactac8400
tgggttggctagtcttttccacagaaaaaatagttttattttaatattgggattggtttc8460
gatacttatggctagttttcaatggtgacgtgatattagtcgagaaaggacccatcaagg8520
attacatactataaaagttcagacaaatttacagtttggtataatcttatttattgtatc8580
agaagtaatattttttttttcatttttttgggccttttttcatagtaggttggttcctac8640
agatgttttagggggagtatgacctcctattttggtaattccttttaatccttttcagat8700
tcctttattaaatacagccattttattatctagaggtgttagagtcacttgggcccatca8760
ttctttaattaggggtaatcattctcaagccttacagggtttatgtttgactgttttttt8820
aggattttattttacgattttacagttgatcgagtatatagagtctagattttcgattgc8880
ggattcagtatatggggcaactttttttgtggctactggatttcacggattacatgttat8940
tatcgggtctatatttttatttgtgtgtacactgcgtcattttataaaacatttttcttc9000
taatcatcattttggggtagaagcggctatttgatattggcattttgtagacgtggtttg9060
gttatttttatttgtgtctatttattgatgaggatgttaatttctttagtataataagta9120
cagatagtttccatttataaagttaaaagttaaagaaataatttatacagttttaagagt9180
taggttattttctttcattgtggcgtatggtattatattattagcattgatgttagggat9240
taagtcaaaaaaaacacgggagaaattatcttcttttgagtgtgggtttgatcctatgac9300
taaagtacgggcccccttttcgttaaaattttttttaattacaattatttttttaatttt9360
tgatgtagaaattgctctattattaccattgggggttgttatagattctctttcttatat9420
ttatttgagggttacttgcttatttattattttaattttaattgttgggttattccatga9480
gtggaatgagggggccttagattgaaactattaaaaatcaaaagtaaaaattacattcag9540
tttcggtttgaaaatattagatattatctattgatttaaattgtatattttaaactttaa9600
agtgtttttatttccacaaaataatgatttaataattaatctattaaaatagattatata9660
atgagatctgtgcatatgattaataatcctaagaggcttcagtgcaagaatgagataaaa9720
tggtttattaggtagtttatgttatatttattatgaaaaaaaattctttcaccatgttga9780
gatatggaaaacaggtaaagcctgtaggcggccctaaaaaatgaaatacccctcagaaga9840
gcaattcttgtaatttctcaattgattatactaataaataaattaatttctcctaaaagg9900
tttactgtgggaggggcggccatattacttgcgagtaataaaaatcatctaagggacaaa9960
ctaggtattatgtttattattcccttactaaaaattattctgcggctatgagtacgctca10020
tatactaaattagctaaaaaaaaaagtccggcagaacatagtccatgtcctactattaca10080
catattctaccttttagtcctcaatcatttagggttagtagtcctcctaaacagaggcct10140
atatgaaccactgaagaataggcaataatagattttatatctattattcgtaaacaattt10200
aacctaataataattcctcctcatagacttaaagacaaaaaaaaaataaaaaggatggag10260
ttagtttctattaaaattgaaaatatacggattaggccatagcctcccagttttagtaaa10320
atacccgctaaaattattgagcctgcaacgggggcttctacgtgggctttaggaagtcat10380
aaatgtactatgtatataggaaattttattataaacgcaagtacaaagaaaattgtccac10440
actaattttatttttaaaataaaaaaaaaataatcatgaccaatattagttttaattcat10500
aagatggtcattagaaggggtaatgaagctaaaaaagtgtaaaaaaatatatagatcccg10560
gcacggatacgttctggctgatagccccaccccagaatcaagaaaaatgttggaatcaac10620
gatagttcaaatattatataaaataataaataattggaaaaagaaaatcttataattaag10680
gttaataataagattacacaggttaaactaaatatagttataaaattattgtatcattta10740
atttttactctactgaaaatagataaaataatgattcatactcttaggatgattagaact10800
ttgtttactcaatcaatttcattgtatattataactactaatctatagtcatttcttata10860
ataaggaggaggattataactaatattataattaatagtaattctcctcagaaggagcct10920
aatcatagtagggtaattaatgaaatataaaactttaacatataaggacatctaatcttt10980
ttaaatagtctgaggaatatctaaagatcactacaactaatagtactagtcctagtactc11040
cttctcttactattagtactagtaagtataaggaaaaataattttctactcctaaatata11100
aaaatcttaaaaaaagtcctataaatagacctaatgaaataaattctaatcttaggagtc11160
tgtttaataaatggttataatttaaaattaaactcacaattcccgctatagagatataaa11220
ttcagatatttaatacacagaacattttaagataaatgaataagtaattgtagtttttat11280
agtttaacaaaaacattaattttgtatattaaaattagattttttcttaaaaattagctt11340
tattatatatttttttttacttttaaatatgtctttaatgtttatttatactgtaggtcc11400
tttaggtcttgggttaattattgtaattcagacactttttatctcgggggcgttatttat11460
agttaggactataacttgattttcttatgtgttaattataatttttttaagtggtataat11520
agtgttatttatttatgtagcttgtttagcttctaatgaaatagtttctatctcttattt11580
taatataattactggaggagtatttaggggggtgtttagtatttatatttgaagtaatca11640
agagagagaagatatgccgttagttggtataaattttttttatgagggggtttcttctag11700
attggtgtataaagttttctctgagatagttgtactaatatcattttttatgatcttata11760
tctgttattggttttaattgtttctgtctatatttcttatttatctaaagggcctataca11820
aataaaaatttaatgatagttaataatactacaactcataatccgtcaattttaagtata11880
aaccacatattaataaatttaccggcccctattaatttgtcttttatatggaatttagga11940
tttatattatttaggtgtttgattattcaagtaattactgggttggttttagcttcatac12000
tatgcccctagtgcagaattaaggttttatagtgtaaggttaatggttgaattcactgaa12060
tttaattgattagcccggagtattcatgctaatggagcgacacttttttttttttttttg12120
tatattcatatagcccggggcatttattatcattcgtatggtttggtatatacgtgaata12180
gtgggagttgtgattttaatcttagtaatggctacagcttttataggttatgtgttaccc12240
tataaccagatgtcttattgaggggcgtcagttattactaacttattttcagaagttccg12300
tatattgggaaagatttagtacgtttaatttgggggagtgcgtcagtgagggatcctact12360
attactcgattttttacgttccattttatattaccttttgtaattatggctatgactata12420
gtgcatttaaattatttacatctaagaggttcaaggaatccaattggggttacggtaaaa12480
aaaggtttatttcatttatcttcgtctttgaaggatgttactcttttaagagttataata12540
ttaatttttatgtttatttttatatttttacctttgctgtttagggataatgataatttt12600
gttatagcagactctttagtgacacctaatcatattcagcctgaatgatattttttattt12660
gcttatgcaattttacgttctattccaaataaattagggggggtaattgctctaggtatg12720
tctatcatagtttttttttctttaccttatacaggtacttatataagtaagagtaaatat12780
gtttttatttcggcaaaggcggttttttggtgatttattgtgattgtcattttgttaact12840
tgggcaggggcttgtcctgtggaggatccttatattgttataagtcagatgttaactttt12900
gtgtattttttatattttgttctaaacccccttttttttccaaagtgataaaaggtttat12960
aattattaagtttaaatacatatgttttgaaaacataaataagaatatatttctattaat13020
ttttattaaaggttagagtatatttatctttaattaagtatttatttttattgaggtaaa13080
atttattttatggataagtatattataaaaatagatttttatttaaggtatacatataca13140
ataaaaaaaaaattaattcttgctaaagattaagtaataagatgagagatataaaaaatt13200
tttgttcttttagttaaatatagattattaaattttgttgttgaaggtgtcaggttcttt13260
ttattatatgtaaatagtttaggtatttttattaattagtagtaaaatttgtgccagcaa13320
ctgcggttagactaatactaaattaatttttttaaagatatagttaataaattaaaataa13380
tgtagtatattttattggtgaaatgaaattttgtatatttaaataatattttatatgaga13440
gatataataaaactaggattagataccctattataaataaaaaattaaaagagtatagat13500
aaaataaaagaatttggcggccttagaagtctatttagaggaacttgttttataatcgat13560
aatcctcgagataaataactggttttttttttatataccgccatttaagcatttttttaa13620
aaaaaagtttatttagtttttaaaaaataggtcaaggtgtagatatgagtcagtaaaaat13680
tagttacattataaattaataagcggaatgttgattagttatttggcataaagtaggatt13740
taatggtaaattattaaattatatttaattgaaatagcgctttttggtgtacaaattgcc13800
cgtcactctctttgagataagtcgtaacata13831
<210>2
<211>23
<212>dna
<213>人工序列(artificialsequence)
<400>2
gtacayctactatgttacgactt23
<210>3
<211>22
<212>dna
<213>人工序列(artificialsequence)
<400>3
gtgccagcagyygcggttanac22
<210>4
<211>23
<212>dna
<213>人工序列(artificialsequence)
<400>4
gaccgtgckaaggtagcataatc23
<210>5
<211>18
<212>dna
<213>人工序列(artificialsequence)
<400>5
agatagaaaccaacctgg18
<210>6
<211>25
<212>dna
<213>人工序列(artificialsequence)
<400>6
ggtcwacaaaycataaagayattgg25
<210>7
<211>26
<212>dna
<213>人工序列(artificialsequence)
<400>7
taaacytcaggrtgaccraaraayca26
<210>8
<211>26
<212>dna
<213>人工序列(artificialsequence)
<400>8
gtggaaagtggagttgggacaggatg26
<210>9
<211>27
<212>dna
<213>人工序列(artificialsequence)
<400>9
cttatctcaaagagagtgacgggcaat27
<210>10
<211>25
<212>dna
<213>人工序列(artificialsequence)
<400>10
gaacgggaatgaatggtttgacaat25
<210>11
<211>24
<212>dna
<213>人工序列(artificialsequence)
<400>11
caaatccacagaagcccccctatg24