本发明属于生物技术领域,具体涉及一种具有高催化活性的ppmar1转座酶d332s突变体及其应用。
背景技术:
转座子(transposon)是指在基因组上能从一个位点转移到另一个位点的一段dna序列。自20世纪40年代美国遗传学家mcclintock首先在玉米中发现转座子(ac/ds)以来,科学家们发现了多种类型的转座子,它们广泛存在于细菌、酵母和高等动植物中。随着人们在分子水平上对转座子结构和功能认识的不断深化,一些转座子已被改造为基因标签应用于基因分析,并逐渐成为大规模分离基因的重要手段之一。
mariner-like转座子(mariner-likeelements,mle)是转座子中一个重要家族,最早是在研究毛里塔尼亚果蝇(drosophilamauristiana)白眼基因的一个不稳定突变时发现的。此后在其他动物以及植物基因组中也发现了大量mle转座子的存在。与其它转座子相比较,mle转座子具有结构简单、异源转座率高、在基因组插入位点接近随机等特点,在开发基因标签,分离基因,研究基因功能上,远远优于其他转座子。
mle转座子由两端反向重复序列(terminalinvertedrepeats,tirs)和编码转座酶的基因组成,转座酶负责催化转座子转座,因此转座酶的活性是影响转座子的转座频率的主要因素。然而自然界分离的mle转座酶由于在进化过程中“垂直失活”效应积累了或多或少的突变,部分或全部丧失了催化转座能力,成为低活性或非活性的转座酶,严重影响了mle转座子的应用,因此人工构建高活性的转座酶就显得十分重要。
技术实现要素:
本发明的目的是提供一种具有高催化活性的ppmar1转座酶d332s突变体及其应用,解决了现有自然界分离的mle转座酶催化活性较低或者不具备催化活性的问题。
本发明提供了一种具有高催化活性的ppmar1转座酶d332s突变体,所述的ppmar1转座酶d332s突变体的氨基酸序列如seqidno.1所示。
本发明还提供了一种编码所述ppmar1转座酶d332s突变体的基因,编码所述ppmar1转座酶d332s突变体的基因的核苷酸序列如seqidno.2所示。
本发明还提供了一种重组质粒,所述重组质粒携带有编码所述ppmar1转座酶d332s突变体的基因。
本发明还提供了一种工程菌株,所述工程菌株携带有上述重组质粒。
本发明还提供了一种具有高催化活性的ppmar1转座酶d332s突变体在构建酵母突变体中的应用。
与现有技术相比,本发明提供的一种具有高催化活性的ppmar1转座酶d332s突变体,具有以下有益效果:
本发明从毛竹中克隆到的活性转座酶,对其进行人工改造之后获得较高活性的mle转座酶突变体(ppmar1转座酶d332s突变体),ppmar1转座酶d332s突变体催化转座子转座的活性是野生型转座酶的活性的2.56倍,为利用mle转座子开发基因标签奠定了基础,为后基因组时代大规模分离和标记基因,研究基因的功能提供了新工具。
具体实施方式
下面结合具体实施方式对本发明进行详细说明,但应当理解本发明的保护范围并不受具体实施方式的限制。下列实施例中未注明具体条件的试验方法,通常按照常规条件操作,如sambrook等主编的《分子克隆实验指南》中所述条件,或按照试剂盒陈述的步骤进行操作,由于不涉及发明点,故不对其步骤进行详细描述。
当实施例给出数值范围时,应理解,除非本发明另有说明,每个数值范围的两个端点以及两个端点之间任何一个数值均可选用。除非另外定义,本发明中使用的所有技术和科学术语与本技术领域技术人员通常理解的意义相同。除实施例中使用的具体方法、设备、材料外,根据本技术领域的技术人员对现有技术的掌握及本发明的记载,还可以使用与本发明实施例中所述的方法、设备、材料相似或等同的现有技术的任何方法、设备和材料来实现本发明。
一、野生型mle转座酶和去除转座酶的非自主性转座子的获得
步骤1.1,采集新鲜的毛竹叶片(phyllostachyspubescens,采集于浙江农林大学植物园,北纬n30°15′14.67″东经e119°43′33.47″),利用ctab法提取毛竹基因组dna,根据mle转座子tir保守序列设计引物ppmar1-5-3(ppmar1-5-3的序列信息见表1),进行pcr扩增,得到mle转座子扩增产物。
pcr扩增的体系为20μl,包括0.2μlrtaqpolymerase(5u/μl),1μlppmar1-5-3(10μmol/l),2μl10×rtaqbuffer(mg2+plus),1.6μldntpmix(2.5mmol/l),100ng毛竹基因组dna,加无菌水补齐20μl。
pcr扩增的反应条件为:预变性94℃5min;变性94℃30s,60℃30s,延伸72℃40s,35个循环;72℃2min,4℃10min。
步骤1.2,扩增出序列后,采用takara公司pmdtm18-tvectorcloningkit试剂盒的方法将步骤1.1的mle转座子扩增产物连接到pmd18-t载体,测序确认后,命名为ppmar1转座子,ppmar1转座子全长序列如seqidno.3所示。
步骤1.3,采用qiagen公司的rneasyminikit试剂盒提取毛竹叶片rna,通过invitrogen公司的superscripttmvilotmcdnasynthesiskit试剂盒将rna反转录为cdna,根据ppmar1转座酶序列设计一对引物pptpase1-5和pptpase1-3(pptpase1-5和pptpase1-3的序列信息见表1),进行pcr扩增,回收得到ppmar1转座酶扩增产物,即为ppmar1转座酶核苷酸序列。
pcr扩增的体系为20μl,包括0.2μlrtaqpolymerase(5u/μl),0.5μlpptpase1-5(10μmol/l),0.5μlpptpase1-3(10μmol/l),2μl10×rtaqbuffer(mg2+plus),1.6μldntpmix(2.5mmol/l),10ng毛竹叶片cdna,加无菌水补齐20μl。
pcr扩增的反应条件为:预变性94℃5min;变性94℃30s,55℃30s,延伸72℃40s,35个循环;72℃2min,4℃10min。
步骤1.4,采用takara公司pmdtm18-tvectorcloningkit试剂盒的方法将步骤1.3的ppmar1转座酶核苷酸序列连接到pmd18-t载体克隆,测序确认,ppmar1转座酶核苷酸序列和相应的氨基酸序列分别如seqidno.4和seqidno.5所示。
将含有ppmar1转座子全长序列的pmd18-t载体用bseri切除ppmar1中间转座酶的大部分序列。
酶切体系为50μl,包括5μl10×buffer,1μlbseri(1u/μl),1μg质粒(含有ppmar1全长序列的pmd18-t载体),加无菌水补齐50μl,37℃温浴6小时。回收质粒大片段,用t4dnaligase将质粒大片段自连接,得到ppmar1的非自主性转座子pmd18-t-ppmar1-tn(tn表示非自主性转座子)。
其中,自连接的体系为10μl,包括1μl10×t4dnaligasebuffer,1μlt4dnaligase(10u/μl),50ng质粒大片段,加无菌水补齐10μl,16℃温浴8小时。
ppmar1的非自主性转座子的序列如seqidno.6所示。
二、酵母转座表达载体的构建
步骤2.1,ppmar1转座酶表达载体的构建
将步骤1.3的ppmar1转座酶核苷酸序列经noti和ecorv双酶切,回收ppmar1转座酶酶切产物的大片段;将pag413-gal-ccdb载体经noti和ecorv双酶切,回收pag413-gal-ccdb载体酶切产物的大片段;且ppmar1转座酶核苷酸序列的双酶切体系、双酶切条件与pag413-gal-ccdb载体的双酶切体系、双酶切条件均相同;
其中双酶切体系为50μl,包括5μl10×buffer,1μlnoti(1u/μl),1μlecor(1u/μl),1μg质粒(ppmar1转座酶核苷酸序列或者pag413-gal-ccdb载体),加无菌水补齐50μl,双酶切条件为:37℃温浴6小时。
将ppmar1转座酶酶切产物的大片段和pag413-gal-ccdb载体酶切产物的大片段相连接;
连接体系为10μl,包括1μl10×t4dnaligasebuffer,1μlt4dnaligase(10u/μl),50ngpag413-gal-ccdb载体酶切产物的大片段,20ngppmar1转座酶酶切产物的大片段,加无菌水补齐10μl,16℃温浴8小时。
此时完成了用ppmar1转座酶核苷酸序列替换pag413-gal-ccdb质粒中的ccdb核苷酸序列,得到重组质粒pag413-gal-tpase(tpase表示转座酶);
该重组质粒pag413-gal-tpase即为ppmar1转座酶表达载体,其携带有编码所述ppmar1转座酶的基因。该表达载体具有his(组氨酸)筛选标记,使导入pag413-gal-tpase载体的宿主能够缺乏his的缺失培养基上生长。
步骤2.2,ppmar1非自主转座子供体载体的构建
以步骤1.4的ppmar1的非自主性转座子pmd18-t-ppmar1-tn为模板,利用ppmar1-5-3引物扩增ppmar1的非自主性转座子,进行pcr扩增,得到ppmar1的非自主性转座子扩增产物。
pcr扩增的体系为20μl,包括0.2μlrtaqpolymerase(5u/μl),1μlppmar1-5-3(10μmol/l),2μl10×rtaqbuffer(mg2+plus),1.6μldntpmix(2.5mmol/l),10ngpmd18-t-ppmar1-tn,加无菌水补齐20μl。
pcr扩增的反应条件为:预变性94℃5min;变性94℃30s,60℃30s,延伸72℃40s,35个循环;72℃2min,4℃10min。
同时,将载体pwl89a用xhoⅰ酶切(酶切位点位于ade2基因内),回收载体pwl89a骨架。酶切体系为50μl,包括5μl10×buffer,1μlxhoⅰ(1u/μl),1μg载体pwl89a,加无菌水补齐50μl,37℃温浴6小时。
然后用in-fusionadvantagepcrcloningkit(takara公司,日本)将ppmar1的非自主性转座子扩增产物插入到载体pwl89a骨架的ade2基因中,导致报告基因ade2插入失活,得到pwl89a-tn重组质粒,即为ppmar1非自主转座子供体载体。若转座子发生转座从ade2基因上离开,那么ade2基因阅读框得到回复。该载体具有ura3筛选标记,使导入pwl89a-tn的宿主能够在缺乏ura(尿素)的缺失培养基上生长。
三、ppmar1转座酶d332s突变体的获得
将ppmar1转座酶核苷酸序列与其他植物mle转座酶的核苷酸序列进行同源性比对,选取ppmar1转座酶核苷酸序列332位置上的天冬氨酸开展突变,计划将其突变为丝氨酸(d332s)。
步骤3.1,根据quikchangetmsite-directedmutagenesiskit(stratagene公司,美国)试剂盒说明书,设计定点突变引物d332s-f和d332s-r(d332s-f和d332s-r的序列信息见表1),按照quikchangetmsite-directedmutagenesiskit试剂盒方法,以步骤2.1的重组质粒pag413-gal-tpase为模板,利用pfuturbotmdnapolymerase重新合成含有ppmar1转座酶d332s突变体的质粒dna;
步骤3.2,然后在合成的质粒dna中加入2μl的dpni限制性内切酶,于37℃条件下反应5min,将原始模板序列彻底降解。将新合成的质粒dna测序确认后得到ppmar1转座酶d332s突变体;
ppmar1转座酶d332s突变体的氨基酸序列如seqidno.1所示,编码所述ppmar1转座酶d332s突变体的基因的核苷酸序列如seqidno.2所示。
四、转座酶活性的检测
实验组是将步骤3.1的含有ppmar1转座酶d332s突变体的质粒dna和步骤2.2的pwl89a-tn重组质粒,用peg/liac法共同转化到酵母中,用his/ura双缺固体培养基上进行选择培养。用半乳糖诱导转座酶表达,促使非自主转座子发生转座。
以野生型ppmar1转座酶为对照组,步骤2.1的带有野生型的ppmar1转座酶的重组质粒pag413-gal-tpase和步骤2.2的pwl89a-tn重组质粒,用peg/liac法共同转化到酵母中,用his/ura双缺固体培养基上进行选择培养。用半乳糖诱导转座酶表达,促使非自主转座子发生转座。
实验组和对照组的经诱导培养的酵母用缺失his/ura/ade固体培养基上进行选择培养,计算培养基上长出的酵母菌斑。如果转座发生,pwl89a-tn重组质粒上的ade2基因就能表达,因此阳性酵母株能够在缺乏腺嘌呤的培养基上生长。
以野生型ppmar1转座酶为对照,比较转化有ppmar1转座酶d332s突变体的酵母菌落数目,筛选出较高活性的转座酶突变株,结果如表2所示。
由表2可知,野生型ppmar1转座酶的阳性酵母菌落数量明显小于ppmar1转座酶d332s突变体,且ppmar1转座酶d332s突变体催化转座能力提高到原来的256%。这个高活性人工改造的ppmar1转座酶d332s突变体将为利用ppmar1转座子开发基因标签奠定了重要基础。
表1本发明应用的引物序列
表2不同转座酶诱导的阳性酵母菌落数量和催化活性
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
序列表
<110>浙江农林大学
<120>一种具有高催化活性的ppmar1转座酶d332s突变体及其应用
<160>6
<170>patentinversion3.3
<210>1
<211>499
<212>prt
<213>人工序列
<400>1
metalaaspproileaspserglypheaspleuasnvalargleuglu
151015
gluaspaspaspglyasnleupropheaspleuasngluproileleu
202530
gluasphisasnasnglyileaspleuasnleuproleuaspgluphe
354045
glyalavalasppheasptyrvalglnasnleualagluglnaspval
505560
glualaprovalglnvalhisproprolyshisasptyrprogluhis
65707580
valarglysleuvaltyrglnalaleuleumetargserlysasngly
859095
lysleuglyasnhisaspthrthrilevalserserglnpheglyval
100105110
lysileargservalglnargiletrplysglnglylysasnglnleu
115120125
alaglnasnileprovalvalvalalaasnleulyslysglyargser
130135140
glyarglysalathrproleuaspleugluglnleuargasnilepro
145150155160
leulysglnargmetthrilegluaspvalserserargleuglyile
165170175
serlysserargileglnargtyrleulyslysglyleuleuargarg
180185190
hisserserserilelysprotyrleuthraspalaasnlyslysthr
195200205
argleulystrpcysileaspmetilegluglnglyleuvalaspasp
210215220
prolyspheargaspleupheaspphevalpheileaspglulystrp
225230235240
pheasnleuserglnlyssergluargtyrtyrleuleuproaspglu
245250255
aspgluprohisargthrcyslysasnlysasntyrileproargile
260265270
metpheleucysvalcysalaargproargpheargasnglyglucys
275280285
valpheaspglylysileglycyspheproleuvalthrpheglugln
290295300
alaileargglyserglnasnargleuargglygluglnvalilelys
305310315320
proileglnserileasnarggluvalileargserphemetileasn
325330335
argvalleuproalaileargalalystrpproarggluaspvalhis
340345350
lysproilepheileglnglnaspasnvalproserhisleulysval
355360365
aspaspproglnphearggluvalalalysglnaspglypheaspile
370375380
argleuilecysglnproproasnserproasppheasnileleuasp
385390395400
leuglyphepheargalaileglnalaileglntyrlyslysaspala
405410415
lysthrleulysaspleuileproalavalglnglnalapheleuglu
420425430
tyrserprotrplysalaasnargilephevalthrleuglnthrval
435440445
leulysglualametlysilelysglycysasnlysilelysilepro
450455460
hisileglnlysglnargleugluarggluaspargleuproleugln
465470475480
ileprocysglualaserleuleualaglualaleualaserleupro
485490495
alaalaasn
<210>2
<211>1500
<212>dna
<213>人工序列
<400>2
atggctgacccaatagattctggcttcgatctgaacgttcggttagaagaagatgatgac60
ggcaatcttccctttgatctcaacgagccaatattggaagatcacaacaatggaattgat120
ttgaacttgccattagatgagtttggtgccgtcgacttcgactatgtacaaaacctcgct180
gaacaagatgttgaggctcccgttcaagtacaccctccgaagcatgactatcctgaacat240
gttagaaaactagtgtaccaagcattgttgatgagaagcaagaatgggaaactaggcaat300
catgatacaacaattgtttccagtcaatttggagtaaagattcgatcagttcagcgcata360
tggaagcaaggtaaaaaccaacttgctcaaaacattccggtcgtggttgctaatctaaag420
aaaggtagaagtggccgtaaagcaacccctcttgatttggaacaattgcgcaacattcct480
ctcaagcaaagaatgaccatagaagatgtgtctagtagacttggtattagcaaatctagg540
atacaaaggtatttgaaaaagggtttgcttaggcgccactctagtagcataaaaccttac600
ctcaccgatgctaacaagaagactaggttgaagtggtgcattgacatgattgagcaaggt660
ttggttgatgatccaaagttcagggatttgtttgactttgtgtttattgatgagaagtgg720
ttctacctctctcaaaaatccgagagatactacttgctacccgacgaagatgaaccacat780
cgcacttgcaagaacaagaattacatccctaggatcatgtttttgtgtgtttgtgctcgg840
ccaagatttagaaatggagaatgtgtgtttgatggcaaaataggttgttttccactagtc900
acttttgaacaagctattagaggaagccaaaaccgtcttcgtggagaacaagtaatcaag960
ccaattcaatcaattaatagggaagtgataagaagtttcatgataaatagagtgttgcct1020
gcaattagagcaaagtggccaagagaagatgtacacaagccaattttcatacaacaagat1080
aatgttccatctcatttaaaggtggatgatcctcagtttcgtgaggttgctaagcaagat1140
gggtttgacattaggctcatatgtcaaccacccaattctccagattttaacattctagat1200
ttgggtttttttcgagctattcaagcaattcaatacaagaaagatgctaagacattgaaa1260
gatctaattccagcagtccaacaggcatttttggagtactctccatggaaagcaaatagg1320
atatttgtgacactacaaactgttttgaaggaagcaatgaagataaaaggttgcaacaaa1380
atcaaaattcctcacatccagaaacaaagacttgagagagaagataggctgccattgcaa1440
atcccttgtgaagcttccttgctagccgaagcacttgcaagccttcctgcagctaattag1500
<210>3
<211>3435
<212>dna
<213>毛竹基因组
<400>3
tactccctccatacccgaaattcctgacgtttaggacatgattgtggtaaccaaggagtg60
attaattaggggttagttttccatctttgcccctaataaatatggttacgggtgctcttt120
gtacgagaaagtaaaccagctcgactggctagcgcgcggaggcctcagtcctgtggtgcg180
cgttcgatacctcgcggacgcaggtttttttcttgttgctgtttattcatttttgcatgg240
cactgtttaggcaacgcacgtcgcgcgcgcttagccgctgcgggcgttagttttcgagtg300
gatttgggcctggcgcacggaggaggttgcatggctgcccgaaaatttcgttgcatgcac360
tggattttcaaaattttgtcctcgcgctgtggaggctcgtttgaggccgcgttttttttc420
atctggcgcgctggaaggccgacgtttggagtgctcgttgcttgttctatttaaacgcct480
ggaaccttccttgttgtcttcctatgccggactcctgtactatggctgacccaatagatt540
ctggcttcgatctgaacgttcggttagaagaagatgatgacggcaatcttccctttgatc600
tcaacgagccaatattggaagatcacaacaatggtaagcaaaaacgtcaaattagtttct660
cagtttctcgtttccttttttctttactgagcttgtcgtttcctttttcgataggaattg720
atttgaacttgccattagatgagtttggtgctgtcgacttcgactatgtacaaaacctcg780
ctggtaagcatggctagtattatgaattcgcttgtttttttatttccttttgctggaaca840
tgccgtgaataatagtattatgaactcgcttgttttttatttccttttactagaacatgt900
gcttgttttattcctatagctagatcatgacgtcaatactttttacgatgaatatgctcg960
ttacagtatagctagaacatgccgtgactacatagtagtatgaatatgcttgttttattt1020
ctataactataacatgccgtgagtatatttagatcatgccgtgagtactaagtactatta1080
aaatgcttgttttttatttccttttgctagaacaagatgttgaggctcccgttcaagtac1140
accctccgaagcatgactatcctgaacatgttagaaaactagtgtaccaagcattgttga1200
tgagaagcaagaatgggaaactaggcaatcatgatacaacaattgtttccagtcaatttg1260
gagtaaagattcgatcagttcagcgcatatggaagcaaggtaaaaaccaacttgctcaaa1320
acattccggtcgtggttgctaatctaaagaaaggtagaagtggccgtaaagcaacccctc1380
ttgatttggaacaattgcgcaacattcctctcaagcaaagaatgaccatagaagatgtgt1440
ctagtagacttggtattagcaaatctaggatacaaaggtatttgaaaaagggtttgctta1500
ggcgccactctagtagcataaaaccttacctcaccgatgctaacaagaagactaggttga1560
agtggtgcattgacatgattgagcaaggtttggttgatgatccaaagttcagggatttgt1620
ttgactttgtgtttattgatgagaagtggttctacctctctcaaaaatccgagagatact1680
acttgctacccgacgaagatgaaccacatcgcacttgcaagaacaagaattacatcccta1740
ggatcatgtttttgtgtgtttgtgctcggccaagatttagaaatggagaatgtgtgtttg1800
atggcaaaataggttgttttccactagtcacttttgaacaagctattagaggaagccaaa1860
accgtcttcgtggagaacaagtaatcaagccaattcaatcaatcaatagggaagtgataa1920
gagatttcatgataaatagagtgttgcctgcaattagagcaaagtggccaagagaagatg1980
tacacaagccaattttcatacaacaagataatgctccatctcatttaaaggtggatgatc2040
ctcagttttgtgaggttgctaagcaagatgggtttgacattaggctcatatgtcaaccac2100
ccaattctccagattttaacattctagatttgggtttttttcgagctattcaagcaattc2160
aatacaagaaagatgctaagacattgaaagatctaattccagcagtccaacaggtaaatg2220
atcatccattacagtgtttaaattgatcttgaacaaataatataatcactgatcttgaac2280
atgttttgtaggcatttttggagtactctccatggaaagcaaataggatatttgtgacac2340
tacaaactgttttgaaggaagcaatgaagataaaaggttgcaacaaaatcaaaattcctc2400
acatccagaaacaaagacttgagagagaagataggctgccattgcaaatcccttgtgaag2460
cttccttgctagccgaagcacttgcaagccttcctgcggctaattagaagatgcaagcat2520
gttactcttttgcagcagcaagcatgtaagaagacgcgagcatgttagtagcaaactatg2580
aacaaactagtttatgcatgtagtagtatgttagcttgtgcaccttagtcatctcgtccc2640
aaccgcttgataacatgctcaggaagaagtattgtgtcaccatccatttcaagtttctcc2700
acatcaggaatgtagacctcacaatcaaacttttccatgtcatcgagccacttcgctgtc2760
atgtcgtagtcttcatgtaaaaggccacaacgggcacacatgcgagcttcgcggcgagct2820
tggtagcaggcttctccgaagacgccgccggcgtggaacgtaacacagcgaggacacaga2880
gactcgacggagtcgggatcgacggtgtcgggcaccatctcgagggagtctgcaaccatg2940
tcgacggagtccggcagctcctcgacggagtccggcaccatgtcgacggtgtccggcagc3000
tcctcgacggagtctggcacctcctgcggcgccatgtccacggtgtccagcgacgctatg3060
gagcccgacgagatgtcctgcacggcgacgtccagcgccgcaacggactccgtcgtttcc3120
atctgatccgacgaggcatcgacgtcctgcgacgagcgtggcggcgagagcacggcgagc3180
gggcaggcgagcgggcaggcgagcgagccattcgcgcgagcgatgaatgcgagctgctgt3240
accaggcgcacacacgcgcaatcaatgcgggcgagtaacgatgcgagcatgcgcggcgga3300
agcgcaacagacgggcagcagcgcatggccaggggcaaacgcgtgaaaagaagaccacgc3360
gaggccacaacgtcagcttttgcgcaaacgggcacttcgcctagaacgtcaggaatttcg3420
ggtatggagggagta3435
<210>4
<211>1500
<212>dna
<213>人工序列
<400>4
atggctgacccaatagattctggcttcgatctgaacgttcggttagaagaagatgatgac60
ggcaatcttccctttgatctcaacgagccaatattggaagatcacaacaatggaattgat120
ttgaacttgccattagatgagtttggtgccgtcgacttcgactatgtacaaaacctcgct180
gaacaagatgttgaggctcccgttcaagtacaccctccgaagcatgactatcctgaacat240
gttagaaaactagtgtaccaagcattgttgatgagaagcaagaatgggaaactaggcaat300
catgatacaacaattgtttccagtcaatttggagtaaagattcgatcagttcagcgcata360
tggaagcaaggtaaaaaccaacttgctcaaaacattccggtcgtggttgctaatctaaag420
aaaggtagaagtggccgtaaagcaacccctcttgatttggaacaattgcgcaacattcct480
ctcaagcaaagaatgaccatagaagatgtgtctagtagacttggtattagcaaatctagg540
atacaaaggtatttgaaaaagggtttgcttaggcgccactctagtagcataaaaccttac600
ctcaccgatgctaacaagaagactaggttgaagtggtgcattgacatgattgagcaaggt660
ttggttgatgatccaaagttcagggatttgtttgactttgtgtttattgatgagaagtgg720
ttctacctctctcaaaaatccgagagatactacttgctacccgacgaagatgaaccacat780
cgcacttgcaagaacaagaattacatccctaggatcatgtttttgtgtgtttgtgctcgg840
ccaagatttagaaatggagaatgtgtgtttgatggcaaaataggttgttttccactagtc900
acttttgaacaagctattagaggaagccaaaaccgtcttcgtggagaacaagtaatcaag960
ccaattcaatcaattaatagggaagtgataagagatttcatgataaatagagtgttgcct1020
gcaattagagcaaagtggccaagagaagatgtacacaagccaattttcatacaacaagat1080
aatgttccatctcatttaaaggtggatgatcctcagtttcgtgaggttgctaagcaagat1140
gggtttgacattaggctcatatgtcaaccacccaattctccagattttaacattctagat1200
ttgggtttttttcgagctattcaagcaattcaatacaagaaagatgctaagacattgaaa1260
gatctaattccagcagtccaacaggcatttttggagtactctccatggaaagcaaatagg1320
atatttgtgacactacaaactgttttgaaggaagcaatgaagataaaaggttgcaacaaa1380
atcaaaattcctcacatccagaaacaaagacttgagagagaagataggctgccattgcaa1440
atcccttgtgaagcttccttgctagccgaagcacttgcaagccttcctgcagctaattag1500
<210>5
<211>499
<212>prt
<213>人工序列
<400>5
metalaaspproileaspserglypheaspleuasnvalargleuglu
151015
gluaspaspaspglyasnleupropheaspleuasngluproileleu
202530
gluasphisasnasnglyileaspleuasnleuproleuaspgluphe
354045
glyalavalasppheasptyrvalglnasnleualagluglnaspval
505560
glualaprovalglnvalhisproprolyshisasptyrprogluhis
65707580
valarglysleuvaltyrglnalaleuleumetargserlysasngly
859095
lysleuglyasnhisaspthrthrilevalserserglnpheglyval
100105110
lysileargservalglnargiletrplysglnglylysasnglnleu
115120125
alaglnasnileprovalvalvalalaasnleulyslysglyargser
130135140
glyarglysalathrproleuaspleugluglnleuargasnilepro
145150155160
leulysglnargmetthrilegluaspvalserserargleuglyile
165170175
serlysserargileglnargtyrleulyslysglyleuleuargarg
180185190
hisserserserilelysprotyrleuthraspalaasnlyslysthr
195200205
argleulystrpcysileaspmetilegluglnglyleuvalaspasp
210215220
prolyspheargaspleupheaspphevalpheileaspglulystrp
225230235240
phetyrleuserglnlyssergluargtyrtyrleuleuproaspglu
245250255
aspgluprohisargthrcyslysasnlysasntyrileproargile
260265270
metpheleucysvalcysalaargproargpheargasnglyglucys
275280285
valpheaspglylysileglycyspheproleuvalthrpheglugln
290295300
alaileargglyserglnasnargleuargglygluglnvalilelys
305310315320
proileglnserileasnarggluvalileargaspphemetileasn
325330335
argvalleuproalaileargalalystrpproarggluaspvalhis
340345350
lysproilepheileglnglnaspasnvalproserhisleulysval
355360365
aspaspproglnphearggluvalalalysglnaspglypheaspile
370375380
argleuilecysglnproproasnserproasppheasnileleuasp
385390395400
leuglyphepheargalaileglnalaileglntyrlyslysaspala
405410415
lysthrleulysaspleuileproalavalglnglnalapheleuglu
420425430
tyrserprotrplysalaasnargilephevalthrleuglnthrval
435440445
leulysglualametlysilelysglycysasnlysilelysilepro
450455460
hisileglnlysglnargleugluarggluaspargleuproleugln
465470475480
ileprocysglualaserleuleualaglualaleualaserleupro
485490495
alaalaasn
<210>6
<211>779
<212>dna
<213>人工序列
<400>6
tactccctccatacccgaaattcctgacgtttaggacatgattgtggtaaccaaggagtg60
attaattaggggttagttttccatctttgcccctaataaatatggttacgggtgctcttt120
gtacgagaaagtaaaccagctcgactggctagcgcgcggaggcctcagtcctgtggtgcg180
cgttcgatacctcgcggacgcaggtttttttcttgttgctgtttattcatttttgcatgg240
cactgtttaggcaacgcacgtcgcgcgcgcttagccgctgcgggcgttagttttcgagtg300
gatttgggcctggcgcacggaggaggttgcatggctccggcagctcctcgacggagtctg360
gcacctcctgcggcgccatgtccacggtgtccagcgacgctatggagcccgacgagatgt420
cctgcacggcgacgtccagcgccgcaacggactccgtcgtttccatctgatccgacgagg480
catcgacgtcctgcgacgagcgtggcggcgagagcacggcgagcgggcaggcgagcgggc540
aggcgagcgagccattcgcgcgagcgatgaatgcgagctgctgtaccaggcgcacacacg600
cgcaatcaatgcgggcgagtaacgatgcgagcatgcgcggcggaagcgcaacagacgggc660
agcagcgcatggccaggggcaaacgcgtgaaaagaagaccacgcgaggccacaacgtcag720
cttttgcgcaaacgggcacttcgcctagaacgtcaggaatttcgggtatggagggagta779