本发明属于基因工程领域,具体涉及一种促进马克斯克鲁维酵母目的基因的表达的载体。
背景技术:
马克斯克鲁维酵母(kluyveromycesmarxianus)能够在高达45℃条件下生长并进行乙醇发酵,其在分类学上与酿酒酵母具有一定的亲缘性,并与乳酸克鲁维酵母一样获得美国食品添加剂的安全性指标(generallyregardedassafe,gras)认证和欧洲“安全资格认定”(qualifiedpresumptionofsafety,qps)认证。与前两者相比,马克斯克鲁维酵母因其可利用底物广泛、生长速率快、耐热、蛋白分泌能力强以及更适合于生物工程改造与应用而备受工业生产的青睐。
crispr/cas9系统是原核微生物(细菌和古生菌)抵御外部遗传元件(如质粒和噬菌体)的一种免疫系统。其中,crispr即成簇规律间隔短回文重复序列(clusteredregularly-interspacedshortpalindromicrepeats)的英文缩写,cas为crispr关联蛋白(crispr-associated)的英文缩写。crispr/cas9系统仅仅依赖单一蛋白cas9,由一个crrna(crispr-derivedrna)和一个tracrrna(trans-activatingrna)融合形成的sgrna(singleguiderna)引导cas9对dna上与sgrna互补的目的dna中前20个nt靶定特征序列进行识别与切割,从而引入一个dna双键断裂(dsb)。研究表明,通过失活cas9的核酸内切酶的活性而获得了deadcas9(dcas9),dcas9只会在sgrna的引导下特异性的结合到目的位点,而不会产生切割。
技术实现要素:
本发明的目的是在马克斯克鲁维酵母中促进目的基因表达。
本发明首先保护一种载体,可包括表达盒甲和表达盒乙;
所述表达盒甲依次可包括如下元件:启动子甲、dcas9蛋白的编码基因、转录激活因子和终止序列甲;
所述表达盒乙依次可包括如下元件:启动子乙、sgrna骨架结构和终止序列乙。
所述启动子甲和所述启动子乙可以相同,也可以不同。
所述终止序列甲和所述终止序列乙可以相同,也可以不同。
所述表达盒甲中,dcas9蛋白的氨基酸序列可如序列表中的序列6所示。dcas9蛋白的编码基因可如序列表中序列1自5’末端起第7171至11271位所示。
所述表达盒甲中,转录激活因子可为转录激活因子vp64。所述转录激活因子vp64的核苷酸序列可如序列表中序列1自5’末端起第11308至11457位所示。
所述表达盒甲中还可包括一个以上细胞核定位序列。所述细胞核定位序列可为细胞核定位序列sv40。细胞核定位序列sv40的氨基酸序列可为pro-lys-lys-lys-arg-lys-val。
所述表达盒甲中具体可包括一个细胞核定位序列sv40。所述细胞核定位序列sv40的核苷酸序列可如序列表中序列1自5’末端起第7141至7161位所示。该细胞核定位序列sv40具体可位于启动子甲的下游、dcas9蛋白的编码基因的上游。
所述表达盒甲中,启动子甲可为adh1启动子。终止序列甲可为adh1终止子。所述adh1启动子的核苷酸序列可如序列表中序列1自5’末端起第6715至7110位所示。所述adh1终止子的核苷酸序列可如序列表中序列1自5’末端起第11473至11660位所示。
所述表达盒乙中,sgrna骨架结构的核苷酸序列可如序列表中序列1自5’末端起第11791至11873位的反向互补序列所示。
所述表达盒乙中,所述启动子乙可为kmsnr52启动子。所述终止序列乙可为sup4终止子。所述kmsnr52启动子的核苷酸序列可如序列表中序列1自5’末端起第11882至12412位的反向互补序列所示。所述sup4终止子的核苷酸序列可如序列表中序列1自5’末端起第11778至11788位的反向互补序列所示。
所述表达盒乙中,启动子乙和sgrna骨架结构之间中可具有单克隆位点。所述单克隆位点具体可为限制性内切酶noti的酶切位点。
上述任一所述表达盒甲的核苷酸序列如序列表中序列1自5’末端起第6715至11660位所示。
上述任一所述表达盒乙的核苷酸序列可如序列表中序列1自5’末端起第11778至12412位的反向互补序列所示。
上述任一所述载体还可包括表达盒丙;所述表达盒丙依次可包括如下元件:启动子丙、选择标记基因和终止序列丙。
所述表达盒丙中,选择标记基因可为g418抗性基因。所述g418抗性基因可为kanmx6基因。
上述任一所述表达盒丙的核苷酸序列如序列表中序列1自5’末端起第4348至5704位所示。
上述任一所述载体还可包括特异序列;所述特异序列的功能可为细胞分裂时进行自主复制。所述细胞可为酵母细胞。所述酵母可为马克斯克鲁维酵母。
所述特异序列可包括自主复制序列和着丝粒序列。
所述特异序列的核苷酸序列可如序列表中序列1自5’末端起第2457至3723位所示。
上述任一所述的载体的核苷酸序列具体可如序列表中序列1所示。
本发明还保护x1)或x2)。
x1)上述任一所述载体在促进目的基因的表达中的应用。
x2)上述任一所述载体在促进酵母目的基因的表达中的应用。
本发明还保护促进酵母中目的基因表达的方法。
本发明所保护的促进酵母中目的基因表达的方法,具体为方法一,可包括如下步骤:将上述任一所述载体中表达盒乙的单克隆位点替换为sgrna特征序列,然后转化出发酵母,筛选,得到重组酵母;所述sgrna特征序列在出发酵母中的识别的靶标dna为目的基因转录起始位点上游300bp至下游100bp的dna片段;与出发酵母相比,重组酵母中目的基因的表达量增加。
本发明所保护的促进酵母中目的基因表达的方法,具体为方法二,可包括如下步骤:向上述任一所述载体中的启动子乙的下游、sgrna骨架结构的上游导入sgrna特征序列,然后转化出发酵母,筛选,得到重组酵母;所述sgrna特征序列在出发酵母中的识别的靶标dna为目的基因转录起始位点上游300bp至下游100bp的dna片段;与出发酵母相比,重组酵母中目的基因的表达量增加。
上述任一所述的方法中,所述筛选为借助选择标记基因进行筛选。
上述任一所述的方法中,所述sgrna特征序列在酵母基因组中识别的靶标dna具有如下结构5’-n20ngg-3’或5’-n20nag-3’,n为a、g、c或t。
在本发明的一个实施例中,上述任一所述目的基因可为hsf1基因。
上述任一所述酵母可为马克斯克鲁维酵母。
在本发明的实施例中,根据hsf1基因(genebank号为:ap012213.1)转录起始位点上游300bp至下游100bp的核苷酸序列,设计靶向hsf1基因的sgrna特征序列ghsf1,ghsf1的核苷酸序列如序列表中序列2所示;然后将pkmcrpa质粒(序列表中序列1所示)自5’至3’起第11874至11881位所示的dna小片段替换为序列表中序列2所示的核苷酸序列的反向互补序列,得到重组质粒pkmcrpa-ghsf1;向马克斯克鲁维酵母中导入重组质粒pkmcrpa-ghsf1,得到重组马克斯克鲁维酵母。与马克斯克鲁维酵母相比,重组马克斯克鲁维酵母中hsf1基因的相对表达量显著增加。由此可见,本发明提供的载体可以用于促进马克斯克鲁维酵母目的基因的表达。本发明具有重要的应用价值。
附图说明
图1为pkmcrpa质粒的图谱。
图2为重组马克斯克鲁维酵母中hsf1基因的相对表达量。
具体实施方式
以下的实施例便于更好地理解本发明,但并不限定本发明。
下述实施例中的实验方法,如无特殊说明,均为常规方法。
下述实施例中所用的试验材料,如无特殊说明,均为自常规生化试剂商店购买得到的。
马克斯克鲁维酵母为日本nite生物资源中心的产品,编号为dmku3-1042(nbrc104275)。
ypd固体培养基和ypd液体培养基均为生工生物工程(上海)股份有限公司的产品。
ypd平板为将55℃的ypd固体培养基倒入无菌培养皿,自然冷却而成。
实施例1、pkmcrpa质粒的构建及其在马克斯克鲁维酵母中促进目的基因表达的应用
本实施例中,目的基因为hsf1基因。
一、pkmcrpa质粒的构建
本发明的发明人构建了pkmcrpa质粒。pkmcrpa质粒的图谱见图1。
pkmcrpa质粒(环形)的核苷酸序列如序列表中序列1所示。序列1中,自5’至3’起,第2457至3723位为马克斯克鲁维酵母的自主复制序列和着丝粒序列,第4348至5704位为含有g418抗性基因kanmx6的表达盒的核苷酸序列,第6715至7110位为adh1启动子的核苷酸序列,第7141至7161位为细胞核定位序列sv40的核苷酸序列,第7171至11271位为dcas9蛋白的编码基因,第11308至11457位为转录激活因子vp64的核苷酸序列,第11473至11660位为adh1终止子的核苷酸序列,第11778至11788位为sup4终止子核苷酸序列的反向互补序列,第11791至11873位为sgrna骨架结构的核苷酸序列的反向互补序列,第11874至11881位为限制性内切酶noti识别位点的核苷酸序列,第11882至12412位为kmsnr52启动子的核苷酸序列的反向互补序列。
表达盒甲的核苷酸序列如序列表中序列1自5’末端起第6715至11660位所示。
表达盒乙的核苷酸序列可如序列表中序列1自5’末端起第11778至12412位的反向互补序列所示。
二、pkmcrpa质粒在马克斯克鲁维酵母中促进hsf1基因表达的应用
1、根据hsf1基因(genebank号为:ap012213.1)转录起始位点上游300bp至下游100bp的核苷酸序列,设计靶向hsf1基因的sgrna特征序列ghsf1。
ghsf1的核苷酸序列为:5’-agctttcgactacaacttta-3’(序列表中序列2)。
2、完成步骤1后,根据pkmcrpa质粒和ghsf1的核苷酸序列,设计并由生工生物工程(上海)股份有限公司合成引物ghsf1-f和引物ghsf1-r。
引物ghsf1-f:
引物ghsf1-r:
3、完成步骤2后,用去离子水分别将引物ghsf1-f和引物ghsf1-r稀释至100μm,得到引物ghsf1-f稀释液和引物ghsf1-r稀释液;然后将引物ghsf1-f稀释液和引物ghsf1-r稀释液混合,进行退火、延伸反应,得到含有ghsf1的dna片段。该dna片段的核苷酸序列为:5’-caacgtccgcagttcgaatcagctttcgactacaactttagttttagagctagaaatagc-3’(序列表中序列5)。
4、取pkmcrpa质粒,用限制性内切酶noti酶切,得到线性化的pkmcrpa质粒。
5、采用gibsonassembly技术将步骤3得到的dna片段和步骤4得到的线性化的pkmcrpa质粒进行重组,得到重组质粒pkmcrpa-ghsf1。
将重组质粒pkmcrpa-ghsf1进行测序。根据测序结果,对重组质粒pkmcrpa-ghsf1的结构描述如下:将序列表中序列1自5’至3’起第11874至11881位所示的dna小片段替换为序列表中序列2所示的核苷酸序列的反向互补序列,得到重组质粒。
6、将重组质粒pkmcrpa-ghsf1电击转化马克斯克鲁维酵母,然后涂布于含200μg/mlg418硫酸盐的ypd平板上,30℃培养48h,得到若干个重组马克斯克鲁维酵母。
7、完成步骤6后,随机将其中一个重组马克斯克鲁维酵母的单克隆接种于5mlypd液体培养基,30℃培养16h,得到培养菌液。
8、完成步骤7后,取所述培养菌液,4℃、12000离心10min,收集菌体。
9、完成步骤8后,取所述菌体,提取总rna,然后反转录,得到重组马克斯克鲁维酵母的cdna。
10、完成步骤9后,以重组马克斯克鲁维酵母的cdna为模板,通过荧光定量pcr检测重组马克斯克鲁维酵母中hsf1基因的相对表达量(以taf10基因(genebank号为:nc_036029.1)为内参基因)。
检测hsf1基因的引物为5’-cggagtcgtcaagaagggag-3’和5’-gtggtgcgtttggctgtatc-3’。
检测taf10基因的引物为5’-atggacaagcaagagccagg-3’和5’-aaccgtattcagcgacagca-3’。
11、按照步骤6-10的方法,将步骤6中的重组质粒pkmcrpa-ghsf1替换为pkmcrpa质粒,其它步骤均不变,得到重组马克斯克鲁维酵母(空载体)中hsf1基因的相对表达量,作为对照。
12、按照步骤7-10的方法,将步骤7中的“随机将其中一个重组马克斯克鲁维酵母的单克隆”替换为马克斯克鲁维酵母的单克隆,其它均不变,得到马克斯克鲁维酵母中hsf1基因的相对表达量,作为对照。
将马克斯克鲁维酵母中hsf1基因的相对表达量作为1,重组马克斯克鲁维酵母和重组马克斯克鲁维酵母(空载体)中hsf1基因的相对表达量见图2(pkmcrpa-ghsf1为重组马克斯克鲁维酵母,pkmcrpa为重组马克斯克鲁维酵母(空载体))。结果表明,与马克斯克鲁维酵母相比,重组马克斯克鲁维酵母中hsf1基因的相对表达量显著增加;重组马克斯克鲁维酵母(空载体)和马克斯克鲁维酵母中hsf1基因的相对表达量无显著差异。
由此可见,向马克斯克鲁维酵母中导入重组质粒pkmcrpa-ghsf1可以促进hsf1基因的表达。
<110>清华大学
<120>一种促进马克斯克鲁维酵母目的基因的表达的载体
<160>6
<170>patentinversion3.5
<210>1
<211>12542
<212>dna
<213>人工序列
<220>
<223>
<400>1
gaacgtggcgagaaaggaagggaagaaagcgaaaggagcgggcgctagggcgctggcaag60
tgtagcggtcacgctgcgcgtaaccaccacacccgccgcgcttaatgcgccgctacaggg120
cgcgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttcta180
aatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataata240
ttgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgc300
ggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctga360
agatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatcct420
tgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatg480
tggcgcggtattatcccgtgttgacgccgggcaagagcaactcggtcgccgcatacacta540
ttctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcat600
gacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaactt660
acttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatggggga720
tcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacga780
gcgtgacaccacgatgcctgcagcaatggcaacaacgttgcgcaaactattaactggcga840
actacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgc900
aggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagc960
cggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccg1020
tatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagat1080
cgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcata1140
tatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcct1200
ttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcaga1260
ccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctg1320
cttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctacc1380
aactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttct1440
agtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgc1500
tctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggtt1560
ggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtg1620
cacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagct1680
atgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcag1740
ggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatag1800
tcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggg1860
gcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctg1920
gccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattac1980
cgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagt2040
gagcgaggaagcggaagagcgcctgatgcggtattttctccttacgcatctgtgcggtat2100
ttcacaccgcatatggtgcactctcagtacaatctgctctgatgccgcatagttaagcca2160
gtatacactccgctatcgctacgtgactgggtcatggctgcgccccgacacccgccaaca2220
cccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagacaagctgtg2280
accgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgagg2340
cagctgggccattctcatgaagaatatcttgaatttattgtcatattactagttggtgtg2400
gaagtccatatatcggtgatcaatatagtggttgacatgctggctagtcaacattggagc2460
tcctttcatttctgataaaagtaagattactccatttatcttttcaccaacatattcata2520
gttgaaagttatccttctaagtacgtatacaatattaattaaacgtaaaaacaaaactga2580
ctgtaaaaatgtgtaaaaaaaaaatatcaaattcatagcagtttcaaggaatgaaaacta2640
ttatgatctggtcacgtgtatataaattattaattttaaacccatataatttattatttt2700
tttattctaaagtttaaagtaattttagtagtattttatattttgaataaatatacttta2760
aatttttatttttatattttattacttttaaaaataatgtttttatttaaaacaaaatta2820
taagttaaaaagttgttccgaaagtaaaatatattttatagtttttacaaaaataaatta2880
tttttaacgtattttttttaattatatttttgtatgtgattatatccacaggtattatgc2940
tgaatttagctgtttcagtttaccagtgtgatagtatgattttttttgcctctcaaaagc3000
tatttttttagaagcttcgtcttagaaataggtggtgtataaattgcggttgacttttaa3060
ctatatatcattttcgatttatttattacatagagaggtgcttttaattttttaattttt3120
attttcaataattttaaaagtgggtacttttaaattggaacaaagtgaaaaatatctgtt3180
atacgtgcaactgaattttactgaccttaaaggactatctcaatcctggttcagaaatcc3240
ttgaaatgattgatatgttggtggattttctctgattttcaaacaagaggtattttattt3300
catatttattatattttttacatttattttatatttttttattgtttggaagggaaagcg3360
acaatcaaattcaaaatatattaattaaactgtaatacttaataagagacaaataacagc3420
caagaatcaaatactgggtttttaatcaaaagatctctctacatgcacccaaattcatta3480
tttaaatttactatactacagacagaatatacgaacccagattaagtagtcagacgcttt3540
tccgctttattgagtatatagccttacatattttctgcccataatttctggatttaaaat3600
aaacaaaaatggttactttgtagttatgaaaaaaggcttttccaaaatgcgaaatacgtg3660
ttatttaaggttaatcaacaaaacgcatatccatatgggtagttggacaaaacttcaatc3720
gattgcaggcaagtgcacaaacaatacttaaataaatactactcagtaataacctatttc3780
ttagcatttttgacgaaatttgctattttgttagagtcttttacaccatttgtctccaca3840
cctccgcttacatcaacaccaataacgccatttaatctaagcgcatcaccaacattttct3900
ggcgtcagtccaccagctaacataaaatgtaagctcgaatttcgagaaagtgcccatcag3960
tgttcatatttgttacaaagtggttttctgatttggtactactgcagaggcgtatttttt4020
gcttcagttaccatagcgtaagaacactagcgacttttgttcgtgaaccaacagagtagg4080
atttctactgctacatctcttaggtagttggttagtccgatcgctcacttttggttgttg4140
ttaagtacttcataagtttatccttttcctttttcacactgagctactttgggtatagct4200
tttggcccaaggatctttgaattttctccaaaagtactttattttatatcctacaggttg4260
cggttttcatattttaaaaagcttttaatcattcctttgcgtagatctgtttagcttgcc4320
tcgtccccgccgggtcacccggccagcgacatggaggcccagaataccctccttgacagt4380
cttgacgtgcgcagctcaggggcatgatgtgactgtcgcccgtacatttagcccatacat4440
ccccatgtataatcatttgcatccatacattttgatggccgcacggcgcgaagcaaaaat4500
tacggctcctcgctgcagacctgcgagcagggaaacgctcccctcacagacgcgttgaat4560
tgtccccacgccgcgcccctgtagagaaatataaaaggttaggatttgccactgaggttc4620
ttctttcatatacttccttttaaaatcttgctaggatacagttctcacatcacatccgaa4680
cataaacaaccatgggtaaggaaaagactcacgtttcgaggccgcgattaaattccaaca4740
tggatgctgatttatatgggtataaatgggctcgcgataatgtcgggcaatcaggtgcga4800
caatctatcgattgtatgggaagcccgatgcgccagagttgtttctgaaacatggcaaag4860
gtagcgttgccaatgatgttacagatgagatggtcagactaaactggctgacggaattta4920
tgcctcttccgaccatcaagcattttatccgtactcctgatgatgcatggttactcacca4980
ctgcgatccccggcaaaacagcattccaggtattagaagaatatcctgattcaggtgaaa5040
atattgttgatgcgctggcagtgttcctgcgccggttgcattcgattcctgtttgtaatt5100
gtccttttaacagcgatcgcgtatttcgtctcgctcaggcgcaatcacgaatgaataacg5160
gtttggttgatgcgagtgattttgatgacgagcgtaatggctggcctgttgaacaagtct5220
ggaaagaaatgcataagcttttgccattctcaccggattcagtcgtcactcatggtgatt5280
tctcacttgataaccttatttttgacgaggggaaattaataggttgtattgatgttggac5340
gagtcggaatcgcagaccgataccaggatcttgccatcctatggaactgcctcggtgagt5400
tttctccttcattacagaaacggctttttcaaaaatatggtattgataatcctgatatga5460
ataaattgcagtttcatttgatgctcgatgagtttttctaatcagtactgacaataaaaa5520
gattcttgttttcaagaacttgtcatttgtatagtttttttatattgtagttgttctatt5580
ttaatcaaatgttagcgtgatttatattttttttcgcctcgacatcatctgcccagatgc5640
gaagttaagtgcgcagaaagtaatatcatgcgtcaatcgtatgtgaatgctggtcgctat5700
actgctgtcgattcgatactaacgccgccatccagtttaaactgagtattttatctgcaa5760
ttacggatacggttggtcttatgtagatacatataaatatatatctttttctttcttttt5820
cttagtcaggattgtcgtttagcataatatacatgtagtttatttaatcacataccactg5880
attatctttagaattttataaatttttgaaataaatgggtggcttttaatggtgtctatg5940
ttaagtgaggcttttagaatgctcttcctgctttgtttattatatgtgtatgaaagatat6000
gtatgtatttacatgtgtttgtagcgtccccagtcaaaacctgtgcgctatacctaaatg6060
gattgataatcttcattcactaattctaaaatagacttcttccccaaagaacggtgtaac6120
gatgaggctctatccagctgcttatctaaatcaactttaacgatggatgatcttatgaca6180
cggggatctttctttaaagttcttagaatttcagactgtaccgcagctgatgaatcaaac6240
agcattaaaaagtgatatgctcgaaaatgtttttcctggtctttcttcattattttagga6300
agataccttatgcccatgggtacaatgtccctcaccacacctctgttttgaataatcagt6360
ttcccgattgtggaagacaattcttttgcttccaactttggcgcattggagttggttatg6420
cgaacaagtccgatcagctcataaagcatcttagtgaaaagggtggttttgcgttattct6480
ttcctctggatcctctagctccctaacatgtaggtggcggaggggagatatacaatagaa6540
cagataccagacaagacataatgggctaaacaagactacaccaattacactgcctcattg6600
atggtggtacataacgaactaatactgtagccctagacttgatagccatcatcatatcga6660
agtttcactaccctttttccatttgccatctattgaagtaataataggcgcatgcaactt6720
cttttctttttttttcttttctctctcccccgttgttgtctcaccatatccgcaatgaca6780
aaaaaatgatggaagacactaaaggaaaaaattaacgacaaagacagcaccaacagatgt6840
cgttgttccagagctgatgaggggtatctcgaagcacacgaaactttttccttccttcat6900
tcacgcacactactctctaatgagcaacggtatacggccttccttccagttacttgaatt6960
tgaaataaaaaaagtttgctgtcttgctatcaagtataaatagacctgcaattattaatc7020
ttttgtttcctcgtcattgttctcgttccctttcttccttgtttctttttctgcacaata7080
tttcaagctataccaagcatacaatcaactggtacccgggccgccaccatgtctagagcc7140
ccaaagaagaagagaaaagttagacccggggataagaaatactctattggtttggctatc7200
ggtacaaactctgttggttgggctgttattactgatgaatacaaggttccatccaagaag7260
ttcaaggttttgggtaacactgatagacactccatcaaaaagaacttgattggtgccttg7320
ttgttcgattctggtgaaactgctgaagctactagattgaaaagaaccgctagaagaaga7380
tacaccagaagaaagaacagaatctgctacttgcaagaaatcttctccaacgaaatggcc7440
aaggttgatgattcattcttccacagattggaagaatccttcttggtcgaagaagataag7500
aagcacgaaagacatccaatcttcggtaacatcgttgatgaagttgcttaccacgaaaag7560
tacccaactatctaccatttgagaaagaagttggttgactctaccgataaggctgatttg7620
agattgatctatttggctttggcccacatgattaagttcagaggtcatttcttgatcgaa7680
ggtgatttgaacccagataactccgatgttgataagttgttcatccaattagtccaaacc7740
tacaatcaattattcgaagaaaacccaatcaacgcctctggtgttgatgctaaagctatt7800
ttgtctgccagattgtccaagtccagaagattagaaaatttgatcgcccaattaccaggt7860
gaaaagaagaatggtttgttcggtaatttgattgccttgtctttgggtttgactccaaac7920
ttcaagtccaatttcgatttggctgaagatgccaagttgcaattatctaaggatacctac7980
gatgacgatttggataacttgttggctcaaatcggtgatcaatacgctgatttgtttttg8040
gctgctaagaacttgtccgatgccattttgttgtccgatattttgagagtcaacaccgaa8100
attactaaggctccattgtctgcctctatgatcaaaagatacgatgaacaccaccaagac8160
ttgactttgttgaaggctttggtcagacaacaattacctgaaaagtacaaagaaattttc8220
ttcgatcaatccaagaacggttacgccggttatattgatggtggtgcttctcaagaagaa8280
ttttacaagttcatcaagccaatcttggaaaagatggacggtactgaagaattattggtc8340
aagttgaacagagaagatttgttgagaaagcaaagaaccttcgacaacggttctattcca8400
catcaaattcacttgggtgaattgcacgcaattttgagaagacaagaagatttttatcca8460
ttcttgaaggacaacagagaaaagatcgaaaagattctgaccttcagaatcccttactac8520
gttggtccattggctagaggtaattcaagatttgcctggatgactagaaagtccgaagaa8580
actattactccttggaacttcgaagaagttgtagataagggtgcttctgcccaatccttt8640
attgaaagaatgaccaacttcgacaagaacttgccaaacgaaaaggttttgccaaagcac8700
tctttgttgtacgaatacttcaccgtctacaacgaattgactaaggttaagtacgtcacc8760
gaaggtatgagaaaaccagcttttttatccggtgaacaaaagaaggctatcgtcgatttg8820
ttgttcaagaccaacagaaaggttactgtcaagcaattaaaagaagattacttcaagaaa8880
atcgaatgcttcgactccgttgaaatttctggtgtcgaagatagattcaatgcctcttta8940
ggtacttaccatgacttgttgaaaatcatcaaggacaaggatttcttggacaacgaagaa9000
aacgaagatattttggaagatattgtcttgacattgaccttgtttgaagatagagaaatg9060
attgaagaaagattgaaaacctacgcccacttgttcgatgataaggttatgaagcaatta9120
aagagaagaagatacactggttggggtagattgtccagaaaattgattaacggtatcaga9180
gacaagcaatccggtaagaccattttggactttttgaagtctgatggtttcgctaacaga9240
aacttcatgcaattaatccacgacgattccttgactttcaaagaagatatacaaaaggcc9300
caagtctctggtcaaggtgattctttacatgaacatatcgctaacttggctggttctcca9360
gctattaagaagggtattttacaaaccgttaaggtcgttgacgaattggtcaaagttatg9420
ggtagacataagccagaaaacatcgttatcgaaatggctagagaaaatcaaaccacccaa9480
aagggtcaaaagaactccagagaaagaatgaagagaatcgaagaaggtatcaaagaattg9540
ggttcccaaattttgaaagaacacccagttgaaaacacccaattacaaaacgaaaagttg9600
tacttgtactacttgcaaaacggtagagatatgtacgttgaccaagaattggacatcaac9660
agattgtctgattacgatgttgacgctatcgttccacaatcttttttgaaggatgactcc9720
attgacaacaaggtcttgactagatccgataagaatagaggtaagtccgataacgttcca9780
tctgaagaagtcgttaagaaaatgaagaactattggagacaattattgaacgccaagttg9840
atcacccaaagaaagtttgacaatttgaccaaggctgaaagaggtggtttgtctgaattg9900
gataaggcaggtttcatcaaaagacaattagtagaaaccagacaaatcaccaagcacgtt9960
gctcaaattttggatagtagaatgaacactaagtacgacgaaaacgacaaattgatcaga10020
gaagttaaggtcattaccttgaagtccaagttggtttccgatttcagaaaggacttccaa10080
ttctacaaggtcagagaaatcaacaactaccatcatgcacatgatgcttacttgaatgct10140
gttgttggtactgccttgattaagaagtatccaaagttggaatccgaatttgtctacggt10200
gattacaaggtttacgacgttagaaagatgatcgccaagtccgaacaagaaattggtaaa10260
gctactgccaaatacttcttctactccaatattatgaatttctttaagaccgaaatcact10320
ttggccaacggtgaaattagaaaaagaccattgattgaaactaatggtgaaacaggtgaa10380
atcgtttgggataagggtagagattttgccactgttagaaaggtattgtccatgccacaa10440
gtaaacatcgtcaaaaagaccgaagttcaaactggtggtttctccaaagaatccattttg10500
cctaagagaaactccgataagttgatcgctagaaaaaaagactgggacccaaaaaagtac10560
ggtggttttgattctccaactgttgcttactctgttttggttgttgctaaggtcgaaaag10620
ggtaagagtaagaagttgaagtccgtcaaagaattattaggtatcactatcatggaaaga10680
tcctcattcgaaaagaatcctatcgactttttggaagccaagggttacaaagaagtcaag10740
aaggacttgatcattaagttgccaaagtacagtttgttcgaattggaaaatggtagaaag10800
agaatgttggcttctgccggtgaattacaaaagggtaatgaattggctttgccatccaag10860
tacgttaatttcttatacttggcctcccactacgaaaaattgaaaggttctcctgaagat10920
aacgaacaaaagcaattatttgtcgaacaacacaagcactacttggacgaaatcattgaa10980
caaatttccgaattttccaaaagagtcattttggctgacgccaatttggacaaagttttg11040
tcagcttacaacaagcacagagataagccaattagagaacaagctgaaaacatcattcac11100
ttgttcactttgactaacttgggtgctccagctgcttttaagtatttcgataccactatc11160
gacagaaagagatacacctctaccaaagaagttttggacgctactttgatccaccaatct11220
attactggtttgtacgaaactagaatcgacttgtctcaattaggtggtgatggttctggt11280
agatctggagtcgacggtggaggttctgacgctttggacgacttcgacttggatatgctg11340
ggttctgatgcgctagatgactttgacctcgacatgcttggaagtgacgccttagatgat11400
tttgacctggatatgcttggatcagacgctctggacgatttcgacttagacatgctttcc11460
taggaactcgaggcgaatttcttatgatttatgatttttattattaaataagttataaaa11520
aaaataagtgtatacaaattttaaagtgactcttaggttttaaaacgaaaattcttattc11580
ttgagtaactctttcctgtaggtcaggttgctttctcaggtatagcatgaggtcgctctt11640
attgaccacacctctaccggcatgccgagcaaatgcctgcaaatcgctccccatttctct11700
agagcggccgtggtatcgtttagattggcaattacagtgtcttagctcacatgcttataa11760
ctaattacatgactcgacataaaaaacaaaaaaagcaccaccgactcggtgccacttttt11820
caagttgataacggactagccttattttaacttgctatttctagctctaaaacgcggccg11880
cgattcgaactgcggacgttgcgaatcccgccctgtcaggcgagaatacagcgcgcgcac11940
tccgggcggaccgcctgatccgcgcttttcaacttattttttttgttgtttttctcgaaa12000
cacatcgcaatctgggggcccggaccgctacactacgaggggtcctaaggcagtacaaga12060
tgcgaggggggaaacacagggccagggtaacgtcacgtggccttctcattcccaaaagaa12120
aaaataaaaaaaggggaccgtaccgtaccgtgtccgccaagtccacctgatacgagcatc12180
atcaccctgcacgaagtgtacttcgcgtacatttcaaagtcagggtaatacaggggcaca12240
cacctgggtaactgttttttcttccctctggggccatactcaagctggcgatttcgcccg12300
gcaatgcctcctgacaatgcctcctgacaatgcctccaggcataccgtctggcatacgcc12360
ttgtataccgccctgtataccgccttgtatatcgcctgccctatttgcggcaacccaatt12420
gtagatatgctaactccagcaatgagttgatgaatctcggtgtgtattttatgtcctcag12480
aggacaacacctgttgtaatcgttcttccacacggatccacagcctagccttcagtcgag12540
gc12542
<210>2
<211>20
<212>dna
<213>人工序列
<220>
<223>
<400>2
agctttcgactacaacttta20
<210>3
<211>40
<212>dna
<213>人工序列
<220>
<223>
<400>3
caacgtccgcagttcgaatcagctttcgactacaacttta40
<210>4
<211>40
<212>dna
<213>人工序列
<220>
<223>
<400>4
gctatttctagctctaaaactaaagttgtagtcgaaagct40
<210>5
<211>60
<212>dna
<213>人工序列
<220>
<223>
<400>5
caacgtccgcagttcgaatcagctttcgactacaactttagttttagagctagaaatagc60
<210>6
<211>1367
<212>dna
<213>prt
<220>
<223>
<400>6
asplyslystyrserileglyleualaileglythrasnservalgly
151015
trpalavalilethraspglutyrlysvalproserlyslysphelys
202530
valleuglyasnthrasparghisserilelyslysasnleuilegly
354045
alaleuleupheaspserglygluthralaglualathrargleulys
505560
argthralaargargargtyrthrargarglysasnargilecystyr
65707580
leuglngluilepheserasnglumetalalysvalaspaspserphe
859095
phehisargleuglugluserpheleuvalglugluasplyslyshis
100105110
gluarghisproilepheglyasnilevalaspgluvalalatyrhis
115120125
glulystyrprothriletyrhisleuarglyslysleuvalaspser
130135140
thrasplysalaaspleuargleuiletyrleualaleualahismet
145150155160
ilelyspheargglyhispheleuilegluglyaspleuasnproasp
165170175
asnseraspvalasplysleupheileglnleuvalglnthrtyrasn
180185190
glnleupheglugluasnproileasnalaserglyvalaspalalys
195200205
alaileleuseralaargleuserlysserargargleugluasnleu
210215220
ilealaglnleuproglyglulyslysasnglyleupheglyasnleu
225230235240
ilealaleuserleuglyleuthrproasnphelysserasnpheasp
245250255
leualagluaspalalysleuglnleuserlysaspthrtyraspasp
260265270
aspleuaspasnleuleualaglnileglyaspglntyralaaspleu
275280285
pheleualaalalysasnleuseraspalaileleuleuseraspile
290295300
leuargvalasnthrgluilethrlysalaproleuseralasermet
305310315320
ilelysargtyraspgluhishisglnaspleuthrleuleulysala
325330335
leuvalargglnglnleuproglulystyrlysgluilephepheasp
340345350
glnserlysasnglytyralaglytyrileaspglyglyalasergln
355360365
glugluphetyrlyspheilelysproileleuglulysmetaspgly
370375380
thrglugluleuleuvallysleuasnarggluaspleuleuarglys
385390395400
glnargthrpheaspasnglyserileprohisglnilehisleugly
405410415
gluleuhisalaileleuargargglngluaspphetyrpropheleu
420425430
lysaspasnargglulysileglulysileleuthrpheargilepro
435440445
tyrtyrvalglyproleualaargglyasnserargphealatrpmet
450455460
thrarglysserglugluthrilethrprotrpasnpheglugluval
465470475480
valasplysglyalaseralaglnserpheilegluargmetthrasn
485490495
pheasplysasnleuproasnglulysvalleuprolyshisserleu
500505510
leutyrglutyrphethrvaltyrasngluleuthrlysvallystyr
515520525
valthrgluglymetarglysproalapheleuserglygluglnlys
530535540
lysalailevalaspleuleuphelysthrasnarglysvalthrval
545550555560
lysglnleulysgluasptyrphelyslysileglucyspheaspser
565570575
valgluileserglyvalgluaspargpheasnalaserleuglythr
580585590
tyrhisaspleuleulysileilelysasplysasppheleuaspasn
595600605
glugluasngluaspileleugluaspilevalleuthrleuthrleu
610615620
phegluaspargglumetileglugluargleulysthrtyralahis
625630635640
leupheaspasplysvalmetlysglnleulysargargargtyrthr
645650655
glytrpglyargleuserarglysleuileasnglyileargasplys
660665670
glnserglylysthrileleuasppheleulysseraspglypheala
675680685
asnargasnphemetglnleuilehisaspaspserleuthrphelys
690695700
gluaspileglnlysalaglnvalserglyglnglyaspserleuhis
705710715720
gluhisilealaasnleualaglyserproalailelyslysglyile
725730735
leuglnthrvallysvalvalaspgluleuvallysvalmetglyarg
740745750
hislysprogluasnilevalileglumetalaarggluasnglnthr
755760765
thrglnlysglyglnlysasnserarggluargmetlysargileglu
770775780
gluglyilelysgluleuglyserglnileleulysgluhisproval
785790795800
gluasnthrglnleuglnasnglulysleutyrleutyrtyrleugln
805810815
asnglyargaspmettyrvalaspglngluleuaspileasnargleu
820825830
serasptyraspvalaspalailevalproglnserpheleulysasp
835840845
aspserileaspasnlysvalleuthrargserasplysasnarggly
850855860
lysseraspasnvalproserglugluvalvallyslysmetlysasn
865870875880
tyrtrpargglnleuleuasnalalysleuilethrglnarglysphe
885890895
aspasnleuthrlysalagluargglyglyleusergluleuasplys
900905910
alaglypheilelysargglnleuvalgluthrargglnilethrlys
915920925
hisvalalaglnileleuaspserargmetasnthrlystyraspglu
930935940
asnasplysleuilearggluvallysvalilethrleulysserlys
945950955960
leuvalseraspphearglysasppheglnphetyrlysvalargglu
965970975
ileasnasntyrhishisalahisaspalatyrleuasnalavalval
980985990
glythralaleuilelyslystyrprolysleugluserglupheval
99510001005
tyrglyasptyrlysvaltyraspvalarglysmetilealalys
101010151020
sergluglngluileglylysalathralalystyrphephetyr
102510301035
serasnilemetasnphephelysthrgluilethrleualaasn
104010451050
glygluilearglysargproleuilegluthrasnglygluthr
105510601065
glygluilevaltrpasplysglyargaspphealathrvalarg
107010751080
lysvalleusermetproglnvalasnilevallyslysthrglu
108510901095
valglnthrglyglypheserlysgluserileleuprolysarg
110011051110
asnserasplysleuilealaarglyslysasptrpaspprolys
111511201125
lystyrglyglypheaspserprothrvalalatyrservalleu
113011351140
valvalalalysvalglulysglylysserlyslysleulysser
114511501155
vallysgluleuleuglyilethrilemetgluargserserphe
116011651170
glulysasnproileasppheleuglualalysglytyrlysglu
117511801185
vallyslysaspleuileilelysleuprolystyrserleuphe
119011951200
gluleugluasnglyarglysargmetleualaseralaglyglu
120512101215
leuglnlysglyasngluleualaleuproserlystyrvalasn
122012251230
pheleutyrleualaserhistyrglulysleulysglyserpro
123512401245
gluaspasngluglnlysglnleuphevalgluglnhislyshis
125012551260
tyrleuaspgluileilegluglnileserglupheserlysarg
126512701275
valileleualaaspalaasnleuasplysvalleuseralatyr
128012851290
asnlyshisargasplysproilearggluglnalagluasnile
129513001305
ilehisleuphethrleuthrasnleuglyalaproalaalaphe
131013151320
lystyrpheaspthrthrileasparglysargtyrthrserthr
132513301335
lysgluvalleuaspalathrleuilehisglnserilethrgly
134013451350
leutyrgluthrargileaspleuserglnleuglyglyasp
135513601365