本发明属于生物技术、基因工程和发酵工程领域,具体涉及利用乙酸和丙酸生产聚羟基脂肪酸酯的基因工程菌及其构建方法和应用。
背景技术:
基于农业与种植业的可再生生物质资源,包括葡萄糖、木糖、淀粉和纤维素等,是发酵工业中微生物普遍利用的碳源和能源物质。2014年,我国生物发酵行业主要产品的总产量为2420万吨(我国生物发酵产业发展现状及发展趋势,工业微生物,2015,45:62-66),生产过程中消耗了大量的淀粉等农副产品,存在“与人争粮、与粮争地”的难题。随着粮食短缺和农产品价格的上涨,原料问题逐渐成为制约生物发酵产业健康发展的重要因素,迫切需要开发新的微生物能够利用的大宗生物质资源。一些非传统碳源,例如甲醇、乙酸和合成气等,逐渐成为工业生物技术领域中的研究热点。
乙酸又名醋酸,是一种简单的二碳羧酸。工业制备乙酸的方法包括乙醛氧化法、液态烃液相氧化法、甲醇羰基合成法等。近年来,合成气直接制乙酸工艺等新技术也在开发之中。目前,乙酸市场存在产能严重过剩、市场持续低迷的困境。如果能开发市场前景广阔的下游产品,延伸产业链,将能推动乙酸产业可持续发展。
大肠杆菌、产油酵母、梭菌和盐单胞菌等可以利用乙酸作为碳源生长。产油酵母可以利用乙酸废液作为主要碳源积累油脂。虽然乙酸是一种臭名昭著的细胞生长抑制剂,但代谢工程改造的大肠杆菌已经被用来转化乙酸获得脂肪酸
(engineeringescherichiacolitoconvertaceticacidtofreefattyacids.biochem.eng.j.76,60–69)和琥珀酸
(productionofsuccinatefromacetatebymetabolicallyengineeredescherichiacoli.acs.synth.biol.5,1299–1307)。
聚羟基脂肪酸酯(polyhydroxyalkanoates,pha)是一类广泛存在于微生物细胞内的高分子化合物,一般作为碳源和能量的贮藏物质,在微生物生长代谢不平衡的条件下,由葡萄糖或者脂肪酸等合成。迄今为止,一些pha产品已经进行了商业化的试生产,包括聚-3-羟基丁酸酯(p3hb)、3-羟基丁酸和4-羟基丁酸共聚酯(p3hb4hb)和3-羟基丁酸和3-羟基戊酸共聚酯(phbv)等。pha具有与石油来源的塑料类似的材料学性质,可以作为包装材料和组织工程材料,但其较高的生产成本是限制pha大规模工业化生产和应用的主要因素。
技术实现要素:
本发明的目的是提供一种利用乙酸生产聚羟基脂肪酸酯的基因工程菌。
本发明所提供的制备用于生产聚羟基脂肪酸酯的工程菌的方法,可包括如下步骤:提高受体菌中乙酸激酶、磷酸转乙酰酶、聚羟基脂肪酸酯合成酶、β-酮硫解酶、乙酰乙酰辅酶a还原酶、琥珀酸半缩醛脱氢酶、4-羟基丁酸脱氢酶、4-羟基丁酰辅酶a:辅酶a转移酶、丙酰辅酶a转移酶的表达和/或活性,且降低所述受体菌中非辅酶a循环的琥珀酸半缩醛脱氢酶的表达和/或活性,从而获得所述用于生产聚羟基脂肪酸酯的工程菌;所述受体菌为能够以乙酸作为碳源生长的菌。
所述乙酸激酶,可为如下a1)或a2)或a3):
a1)氨基酸序列是序列表中序列8所示的蛋白质;
a2)在序列表中序列8所示的蛋白质的n端或/和c端连接标签得到的融合蛋白质;
a3)将a1)或a2)所示的蛋白质经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的具有乙酸激酶活性的蛋白质。
所述磷酸转乙酰酶,可为如下b1)或b2)或b3):
b1)氨基酸序列是序列表中序列9所示的蛋白质;
b2)在序列表中序列9所示的蛋白质的n端或/和c端连接标签得到的融合蛋白质;
b3)将b1)或b2)所示的蛋白质经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的具有磷酸转乙酰酶活性的蛋白质。
所述聚羟基脂肪酸酯合成酶,可为如下c1)或c2)或c3):
c1)氨基酸序列是序列表中序列10所示的蛋白质;
c2)在序列表中序列10所示的蛋白质的n端或/和c端连接标签得到的融合蛋白质;
c3)将c1)或c2)所示的蛋白质经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的具有聚羟基脂肪酸酯合成酶活性的蛋白质。
所述β-酮硫解酶,可为如下d1)或d2)或d3):
d1)氨基酸序列是序列表中序列11所示的蛋白质;
d2)在序列表中序列11所示的蛋白质的n端或/和c端连接标签得到的融合蛋白质;
d3)将d1)或d2)所示的蛋白质经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的具有β-酮硫解酶活性的蛋白质。
所述乙酰乙酰辅酶a还原酶,可为如下e1)或e2)或e3):
e1)氨基酸序列是序列表中序列12所示的蛋白质;
e2)在序列表中序列12所示的蛋白质的n端或/和c端连接标签得到的融合蛋白质;
e3)将e1)或e2)所示的蛋白质经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的具有乙酰乙酰辅酶a还原酶活性的蛋白质。
所述琥珀酸半缩醛脱氢酶,可为如下f1)或f2)或f3):
f1)氨基酸序列是序列表中序列13所示的蛋白质;
f2)在序列表中序列13所示的蛋白质的n端或/和c端连接标签得到的融合蛋白质;
f3)将f1)或f2)所示的蛋白质经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的具有琥珀酸半缩醛脱氢酶活性的蛋白质。
所述4-羟基丁酸脱氢酶,可为如下g1)或g2)或g3):
g1)氨基酸序列是序列表中序列14所示的蛋白质;
g2)在序列表中序列14所示的蛋白质的n端或/和c端连接标签得到的融合蛋白质;
g3)将g1)或g2)所示的蛋白质经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的具有4-羟基丁酸脱氢酶活性的蛋白质。
所述4-羟基丁酰辅酶a:辅酶a转移酶,可为如下h1)或h2)或h3):
h1)氨基酸序列是序列表中序列15所示的蛋白质;
h2)在序列表中序列15所示的蛋白质的n端或/和c端连接标签得到的融合蛋白质;
h3)将h1)或h2)所示的蛋白质经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的具有4-羟基丁酰辅酶a:辅酶a转移酶活性的蛋白质。
所述丙酰辅酶a转移酶,可为如下i1)或i2)或i3):
i1)氨基酸序列是序列表中序列16所示的蛋白质;
i2)在序列表中序列16所示的蛋白质的n端或/和c端连接标签得到的融合蛋白质;
i3)将i1)或i2)所示的蛋白质经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的具有丙酰辅酶a转移酶活性的蛋白质。
所述非辅酶a循环的琥珀酸半缩醛脱氢酶可为如下j1)或j2)或j3):
j1)氨基酸序列是序列表中序列17和/或序列19所示的蛋白质;
j2)在序列表中序列17和/或序列19所示的蛋白质的n端或/和c端连接标签得到的融合蛋白质;
j3)将j1)或j2)所示的蛋白质经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的具有非辅酶a循环的琥珀酸半缩醛脱氢酶活性的蛋白质。
上述方法中,所述“提高受体菌中乙酸激酶、磷酸转乙酰酶、聚羟基脂肪酸酯合成酶、β-酮硫解酶、乙酰乙酰辅酶a还原酶、琥珀酸半缩醛脱氢酶、4-羟基丁酸脱氢酶、4-羟基丁酰辅酶a:辅酶a转移酶、丙酰辅酶a转移酶的表达和/或活性”具体是通过向所述受体菌中导入乙酸激酶的编码基因(acka基因)、磷酸转乙酰酶的编码基因(pta基因)、聚羟基脂肪酸酯合成酶的编码基因(phac基因)、β-酮硫解酶的编码基因(phaa基因)、乙酰乙酰辅酶a还原酶的编码基因(phab基因)、琥珀酸半缩醛脱氢酶的编码基因(sucd基因)、4-羟基丁酸脱氢酶的编码基因(4hbd基因)、4-羟基丁酰辅酶a:辅酶a转移酶的编码基因(orfz基因)和丙酰辅酶a转移酶的编码基因(pct基因)来实现的。所述“降低所述受体菌中非辅酶a循环的琥珀酸半缩醛脱氢酶的表达和/或活性”是通过敲除所述受体菌中非辅酶a循环的琥珀酸半缩醛脱氢酶的编码基因(sad基因和gabd基因)来实现的。
所述乙酸激酶的编码基因(acka基因)可为如下a1)或a2)或a3)或a4)所示的dna分子:a1)编码区是序列表中序列1自5’末端起第70-1272位所示的dna分子;a2)核苷酸序列是序列表中序列1自5’末端起第70-1272位所示的dna分子;a3)与a1)或a2)限定的核苷酸序列具有75%或75%以上同一性,且编码所述乙酸激酶的dna分子;a4)在严格条件下与a1)或a2)限定的核苷酸序列杂交,且编码所述乙酸激酶的dna分子。
所述磷酸转乙酰酶的编码基因(pta基因)可为如下b1)或b2)或b3)或b4)所示的dna分子:b1)编码区是序列表中序列1自5’末端起第1347-3491位所示的dna分子;b2)核苷酸序列是序列表中序列1自5’末端起第1347-3491位所示的dna分子;b3)与b1)或b2)限定的核苷酸序列具有75%或75%以上同一性,且编码所述磷酸转乙酰酶的dna分子;b4)在严格条件下与b1)或b2)限定的核苷酸序列杂交,且编码所述磷酸转乙酰酶的dna分子。
所述聚羟基脂肪酸酯合成酶的编码基因(phac基因)可为如下c1)或c2)或c3)或c4)所示的dna分子:c1)编码区是序列表中序列2自5’末端起第70-1839位所示的dna分子;c2)核苷酸序列是序列表中序列2自5’末端起第70-1839位所示的dna分子;c3)与c1)或c2)限定的核苷酸序列具有75%或75%以上同一性,且编码所述聚羟基脂肪酸酯合成酶的dna分子;c4)在严格条件下与c1)或c2)限定的核苷酸序列杂交,且编码所述聚羟基脂肪酸酯合成酶的dna分子。
所述β-酮硫解酶的编码基因(phaa基因)可为如下d1)或d2)或d3)或d4)所示的dna分子:d1)编码区是序列表中序列2自5’末端起第1924-3105位所示的dna分子;d2)核苷酸序列是序列表中序列2自5’末端起第1924-3105位所示的dna分子;d3)与d1)或d2)限定的核苷酸序列具有75%或75%以上同一性,且编码所述β-酮硫解酶的dna分子;d4)在严格条件下与d1)或d2)限定的核苷酸序列杂交,且编码所述β-酮硫解酶的dna分子。
所述乙酰乙酰辅酶a还原酶的编码基因(phab基因)为如下e1)或e2)或e3)或e4)所示的dna分子:e1)编码区是序列表中序列2自5’末端起第3180-3920位所示的dna分子;e2)核苷酸序列是序列表中序列2自5’末端起第3180-3920位所示的dna分子;e3)与e1)或e2)限定的核苷酸序列具有75%或75%以上同一性,且编码所述乙酰乙酰辅酶a还原酶的dna分子;e4)在严格条件下与e1)或e2)限定的核苷酸序列杂交,且编码所述乙酰乙酰辅酶a还原酶的dna分子。
所述琥珀酸半缩醛脱氢酶的编码基因(sucd基因)可为如下f1)或f2)或f3)或f4)所示的dna分子:f1)编码区是序列表中序列3自5’末端起第70-1431位所示的dna分子;f2)核苷酸序列是序列表中序列3自5’末端起第70-1431位所示的dna分子;f3)与f1)或f2)限定的核苷酸序列具有75%或75%以上同一性,且编码所述琥珀酸半缩醛脱氢酶的dna分子;f4)在严格条件下与f1)或f2)限定的核苷酸序列杂交,且编码所述琥珀酸半缩醛脱氢酶的dna分子。
所述4-羟基丁酸脱氢酶的编码基因(4hbd基因)可为如下g1)或g2)或g3)或g4)所示的dna分子:g1)编码区是序列表中序列3自5’末端起第1468-2583位所示的dna分子;g2)核苷酸序列是序列表中序列3自5’末端起第1468-2583位所示的dna分子;g3)与g1)或g2)限定的核苷酸序列具有75%或75%以上同一性,且编码所述4-羟基丁酸脱氢酶的dna分子;g4)在严格条件下与g1)或g2)限定的核苷酸序列杂交,且编码所述4-羟基丁酸脱氢酶的dna分子。
所述4-羟基丁酰辅酶a:辅酶a转移酶的编码基因(orfz基因)可为如下h1)或h2)或h3)或h4)所示的dna分子:h1)编码区是序列表中序列4自5’末端起第70-1359位所示的dna分子;h2)核苷酸序列是序列表中序列4自5’末端起第70-1359位所示的dna分子;h3)与h1)或h2)限定的核苷酸序列具有75%或75%以上同一性,且编码所述4-羟基丁酰辅酶a:辅酶a转移酶的dna分子;h4)在严格条件下与h1)或h2)限定的核苷酸序列杂交,且编码所述4-羟基丁酰辅酶a:辅酶a转移酶的dna分子。
所述丙酰辅酶a转移酶的编码基因(pct基因)可为如下i1)或i2)或i3)或i4)所示的dna分子:i1)编码区是序列表中序列5自5’末端起第70-1623位所示的dna分子;i2)核苷酸序列是序列表中序列5自5’末端起第70-1623位所示的dna分子;i3)与i1)或i2)限定的核苷酸序列具有75%或75%以上同一性,且编码所述丙酰辅酶a转移酶的dna分子;i4)在严格条件下与i1)或i2)限定的核苷酸序列杂交,且编码所述丙酰辅酶a转移酶的dna分子。
所述非辅酶a循环的琥珀酸半缩醛脱氢酶的编码基因(sad基因和/或gabd基因)可为如下j1)或j2)或j3)或j4)所示的dna分子:j1)编码区是序列表中序列18和/或序列20所示的dna分子;j2)核苷酸序列是序列表中序列18和/或序列20所示的dna分子;j3)与j1)或j2)限定的核苷酸序列具有75%或75%以上同一性,且编码所述非辅酶a循环的琥珀酸半缩醛脱氢酶的dna分子;j4)在严格条件下与j1)或j2)限定的核苷酸序列杂交,且编码所述非辅酶a循环的琥珀酸半缩醛脱氢酶的dna分子。
sad基因的核苷酸序列如序列表中序列18所示,编码序列表中序列17所示的蛋白质。gabd基因的核苷酸序列如序列表中序列20所示,编码序列表中序列19所示的蛋白质。
上述方法中,所述乙酸激酶的编码基因(acka基因)和磷酸转乙酰酶的编码基因(pta基因)是通过序列表中序列1所示的dna分子导入所述受体菌中的。所述聚羟基脂肪酸酯合成酶的编码基因(phac基因)、所述β-酮硫解酶的编码基因(phaa基因)和所述乙酰乙酰辅酶a还原酶的编码基因(phab基因)是通过序列表中序列2所示的dna分子导入所述受体菌中的。所述琥珀酸半缩醛脱氢酶的编码基因(sucd基因)和所述4-羟基丁酸脱氢酶的编码基因(4hbd基因)是通过序列表中序列3所示的dna分子导入所述受体菌中的。所述4-羟基丁酰辅酶a:辅酶a转移酶的编码基因(orfz基因)是通过序列表中序列4所示的dna分子导入所述受体菌中的。所述丙酰辅酶a转移酶的编码基因(pct基因)是通过序列表中序列5所示的dna分子导入所述受体菌中的。
上述方法中,所述非辅酶a循环的琥珀酸半缩醛脱氢酶的编码基因(sad基因和gabd基因)是通过λ-red同源重组的方式进行敲除的,其中同源重组片段的核苷酸序列为序列表中序列6和序列7。
更加具体的,在本发明中,所述乙酸激酶的编码基因(acka基因)、所述磷酸转乙酰酶的编码基因(pta基因)、所述琥珀酸半缩醛脱氢酶的编码基因(sucd基因)和所述4-羟基丁酸脱氢酶的编码基因(4hbd基因)是通过重组表达载体1导入到所述受体菌中的;所述聚羟基脂肪酸酯合成酶的编码基因(phac基因)、所述β-酮硫解酶的编码基因(phaa基因)、所述乙酰乙酰辅酶a还原酶的编码基因(phab基因)和所述4-羟基丁酰辅酶a:辅酶a转移酶的编码基因(orfz基因)是通过重组表达载体2导入到所述受体菌中的;所述丙酰辅酶a转移酶的编码基因(pct基因)是通过重组表达载体3导入到所述受体菌中的。所述重组表达载体1为将质粒pbbr1mcs-2的ecori识别序列和xbai识别序列间的dna小片段替换为核苷酸序列是序列表中序列1自5’末端起第9至3491位所示的dna分子,xbai识别序列和saci识别序列间的dna小片段替换为核苷酸序列是序列表中序列3自5’末端起第9至2583位所示的dna分子。所述重组表达载体2为将质粒puc19的hindiii识别序列和bamhi识别序列间的dna小片段替换为核苷酸序列是序列表中序列2自5’末端起第9至3920位所示的dna分子,bamhi识别序列和ecori识别序列间的dna小片段替换为核苷酸序列是序列表中序列4自5’末端起第9至1359位所示的dna分子。所述重组表达载体3为将质粒puc19的hindiii识别序列和bamhi识别序列间的dna小片段替换为核苷酸序列是序列表中序列2自5’末端起第9至3920位所示的dna分子,bamhi识别序列和ecori识别序列间的dna小片段替换为核苷酸序列是序列表中序列5自5’末端起第9至1623位所示的dna分子。
上述方法中,所述受体菌可为大肠杆菌。所述大肠杆菌具体可为大肠杆菌e.colijm109。
由上述任一所述的方法制备得到的用于生产聚羟基脂肪酸酯的工程菌也属于本发明的保护范围。
上述任一所述用于生产聚羟基脂肪酸酯的工程菌在生产聚羟基脂肪酸酯中的应用也属于本发明的保护范围。
上述应用中,所述生产聚羟基脂肪酸酯(如p3hb、p3hb4hb)以乙酸作为底物。
上述应用中,所述生产聚羟基脂肪酸酯(如phbv)以乙酸和丙酸作为底物。
本发明还保护一种生产聚羟基脂肪酸酯的方法,包括如下步骤:以乙酸作为碳源,发酵培养所述工程菌,收集发酵产物,从中获得聚羟基脂肪酸酯。
上述方法中,根据生产聚羟基脂肪酸酯的种类(如phbv),还可以在发酵体系中同时加入丙酸作为底物。
其中,所述发酵培养的条件可为:37℃摇瓶震荡培养24-72h(如48h)。摇瓶的转速具体可为200rpm。所采用的培养基可为mmye液体培养基。
所述mmye液体培养基的组成可如下:每升培养基含6g乙酸、2gnh4cl、5.0g(nh4)2so4、6.0gkh2po4、8.214gmops、0.5gnacl、1ml微量元素溶液、0.1g氨苄青霉素、0.05g卡那霉素和10g酵母粉,余量为水。所述微量元素溶液的组成可如下:每升微量元素溶液含3.6gfecl2·4h2o、5gcacl2·2h2o、1.3gmncl2·2h2o、0.38gcucl2·2h2o、0.5gcocl2·6h2o、0.94gzncl2、0.0311gh3bo3、0.4gna2edta·2h2o、1.01gthiamine-hcl,其余为0.5mhcl。
上述任一所述聚羟基脂肪酸酯具体可为p3hb、p3hb4hb或phbv。
本发明通过在大肠杆菌中表达9个代谢途径相关的基因和敲除2个内源基因,获得以乙酸为主要碳源生产pha的工程菌(中phbv的合成还需要添加丙酸作为辅助碳源),并且该工程菌生产pha的产量达到较高的水平,具有较好的工业化应用前景。本发明提供了一种将乙酸转变为高附加值生物可降解材料(即pha)的方法,对拓展乙酸应用和降低pha的发酵成本具有重要意义。
具体实施方式
以下的实施例便于更好地理解本发明,但并不限定本发明。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的实验材料,如无特殊说明,均为自常规生化试剂公司购买得到的。以下实施例中的定量实验,均设置三次重复实验,结果取平均值。
下述实施例中涉及分子生物学操作所用的酶,均购于neb(newenglandbiolabs,http://www.neb-china.com/)公司;质粒提取和dna片段回收所用的试剂盒购自北京博迈德生物技术公司;e.colijm109为宝生物工程(大连)有限公司的产品;实施例中涉及的dna合成和测序工作由北京博迈德生物技术公司完成。质粒puc19为neb(newenglandbiolabs)公司的产品,货号n3041s。
质粒pkd13、质粒pkd46和质粒pcp20公众均可以从e.coligeneticresourcesatyalecgsc,thecoligeneticstockcenter(http://cgsc2.biology.yale.edu/)获得,编号依次为cgsc#7633、cgsc#7739和cgsc#7637。
质粒pbbr1mcs-2:公众可根据ncbiaccessionnumberu23751.1的序列自行提交基因合成公司获得,该质粒记载在如下文献中:
fournewderivativesofthebroad-host-rangecloningvectorpbbr1mcs,
carryingdifferentantibiotic-resistancecassettes,1995,gene,166:175-176。
mmye液体培养基的组成如下:每升培养基含6g乙酸、2gnh4cl、5.0g(nh4)2so4、6.0gkh2po4、8.214gmops、0.5gnacl、1ml微量元素溶液、0.1g氨苄青霉素、0.05g卡那霉素和10g酵母粉,余量为水。其中,微量元素溶液的组成如下:每升微量元素溶液含3.6gfecl2·4h2o、5gcacl2·2h2o、1.3gmncl2·2h2o、0.38gcucl2·2h2o、0.5gcocl2·6h2o、0.94gzncl2、0.0311gh3bo3、0.4gna2edta·2h2o、1.01gthiamine-hcl,其余为0.5mhcl。
实施例1、重组菌e.colijm109(puc19-phacab+pmcs-pta-acka)的构建
一、重组质粒pmcs-pta-acka的构建
1、人工合成序列表中序列1所示的dna,含有pta-acka表达盒,上游为ecori位点,下游为xbai位点,其中第9-51位核苷酸为启动子序列,第70-1272位核苷酸为acka基因序列,第1347-3491位核苷酸为pta基因序列。
2、用ecori和xbai双酶切步骤1中合成的dna序列,回收大小为3489bp的dna片段;用ecori和xbai双酶切质粒pbbr1mcs-2,回收大小为5114bp的dna片段;将上述3489bp和5114bp的两个dna片段连接,得到连接产物通过化学转化的方法导入到e.colijm109中,并涂布于含有卡那霉素的lb固体培养基,37℃培养16h,得到转化子。提取转化子的质粒,用ecori和xbai进行酶切验证,酶切产物大小为3489bp和5114bp的质粒为阳性质粒,将此重组质粒命名为重组质粒pmcs-pta-acka或pmcs-pta-acka。将重组质粒pmcs-pta-acka进行测序。根据测序结果,对重组质粒pmcs-pta-acka进行结构描述如下:将质粒pbbr1mcs-2的ecori识别序列和xbai识别序列间的dna小片段替换为核苷酸序列是序列表中序列1自5’末端起第9至3491位所示的dna分子。
重组质粒pmcs-pta-acka表达序列表的序列8所示的乙酸激酶(由acka基因编码)和序列表的序列9所示的磷酸转乙酰酶(由pta基因编码)。
二、重组质粒puc19-phacab的构建
1、人工合成序列表中序列2所示的dna,含有phacab表达盒,上游为hindiii位点,下游为bamhi位点,其中第9-51位核苷酸为启动子序列,第70-1839位核苷酸为phac基因序列,第1924-3105位核苷酸为phaa基因序列,第3180-3920位核苷酸为phab基因序列。
2、用hindiii和bamhi双酶切步骤1中合成的dna序列,回收大小为3918bp的dna片段;用hindiii和bamhi双酶切质粒puc19,回收大小为2656bp的dna片段;将上述3918bp和2656bp的两个dna片段连接,得到连接产物通过化学转化的方法导入到e.colijm109中,并涂布于含有氨苄青霉素的lb固体培养基,37℃培养16h,得到转化子。提取转化子的质粒,用hindiii和bamhi进行酶切验证,酶切产物大小为3918bp和2656bp的质粒为阳性质粒,将此重组质粒命名为重组质粒puc19-phacab或puc19-phacab。将重组质粒puc19-phacab进行测序。根据测序结果,对重组质粒puc19-phacab进行结构描述如下:将质粒puc19的hindiii识别序列和bamhi识别序列间的dna小片段替换为核苷酸序列是序列表中序列2自5’末端起第9至3920位所示的dna分子。
重组质粒puc19-phacab表达序列表的序列10所示的聚羟基脂肪酸酯合成酶合成酶(由phac基因编码)、序列表的序列11所示的β-酮硫解酶(由phaa基因编码)和序列表的序列12所示的乙酰乙酰辅酶a还原酶(由phab基因编码)。
三、重组菌e.colijm109(puc19-phacab+pmcs-pta-acka)的构建
1、将上述一得到的重组质粒pmcs-pta-acka和上述二得到的重组质粒puc19-phacab通过化学转化的方法转化到大肠杆菌e.colijm109,并涂布于含有氨苄青霉素和卡那霉素的lb固体培养基,37℃培养24h。
2、挑取单克隆于含有氨苄青霉素和卡那霉素的lb液体培养基,37℃培养24h。
3、提取转化子的质粒,验证转化的正确性,得到含有两个重组质粒的重组菌e.colijm109(puc19-phacab+pmcs-pta-acka)。
e.colijm109(puc19-phacab+pmcs-pta-acka)为将pta基因、acka基因、phac基因、phab基因和phaa基因转入大肠杆菌e.colijm109中得到的重组菌。
四、对照菌株e.colijm109(puc19-phacab+pbbr1mcs-2)的构建
1、将质粒pbbr1mcs-2和上述二得到的重组质粒puc19-phacab通过化学转化的方法转化到大肠杆菌e.colijm109,并涂布于含有氨苄青霉素和卡那霉素的lb固体培养基,37℃培养24h。
2、挑取单克隆于含有氨苄青霉素和卡那霉素的lb液体培养基,37℃培养24h。
3、提取转化子的质粒,验证转化的正确性,得到含有两个质粒的重组菌e.colijm109(puc19-phacab+pbbr1mcs-2)。
e.colijm109(puc19-phacab+pbbr1mcs-2)为将phac基因、phab基因和phaa基因转入大肠杆菌e.colijm109中得到的重组菌。
实施例2、重组菌e.colijm109sg(puc19-phacab-orfz+pmcs-pta-acka-sucd-4hbd)的构建
一、重组质粒pmcs-pta-acka-sucd-4hbd的构建
1、人工合成序列表中序列3所示的dna,含有sucd-4hbd表达盒,上游为xbai位点,下游为saci位点,其中第9-51位核苷酸为启动子序列,第70-1431位核苷酸为sucd基因序列,第1468-2583位核苷酸为4hbd基因序列。
2、用xbai和saci双酶切步骤1中合成的dna序列,回收大小为2585bp的dna片段;用xbai和saci双酶切质粒pbbr1mcs-2,回收大小为5116bp的dna片段;将上述2585bp和5116bp的两个dna片段连接,得到连接产物通过化学转化的方法导入到e.colijm109中,并涂布于含有卡那霉素的lb固体培养基,37℃培养16h,得到转化子。提取转化子的质粒,用xbai和saci进行酶切验证,酶切产物大小为2585bp和5116bp的质粒为阳性质粒,将此重组质粒命名为重组质粒pmcs-sucd-4hbd。将重组质粒pmcs-sucd-4hbd进行测序。根据测序结果,对重组质粒pmcs-sucd-4hbd进行结构描述如下:将质粒pbbr1mcs-2的xbai识别序列和saci识别序列间的dna小片段替换为核苷酸序列是序列表中序列3自5’末端起第9至2583位所示的dna分子。
重组质粒pmcs-sucd-4hbd表达序列表的序列13所示的琥珀酸半缩醛脱氢酶(由sucd基因编码)和序列表的序列14所示的4-羟基丁酸脱氢酶(由4hbd基因编码)。
3、用xbai和saci双酶切步骤1中合成的dna序列,回收大小为2585bp的dna片段;用xbai和saci双酶切重组质粒pmcs-pta-acka,回收大小为8575bp的dna片段;将上述2585bp和8575bp的两个dna片段连接,得到连接产物通过化学转化的方法导入到e.colijm109中,并涂布于含有卡那霉素的lb固体培养基,37℃培养16h,得到转化子。提取转化子的质粒,用xbai和saci进行酶切验证,酶切产物大小为2585bp和8575bp的质粒为阳性质粒,将此重组质粒命名为重组质粒pmcs-pta-acka-sucd-4hbd。将重组质粒pmcs-pta-acka-sucd-4hbd进行测序。根据测序结果,对重组质粒pmcs-pta-acka-sucd-4hbd进行结构描述如下:将重组质粒pmcs-pta-acka的xbai识别序列和saci识别序列间的dna小片段替换为核苷酸序列是序列表中序列3自5’末端起第9至2583位所示的dna分子。重组质粒pmcs-pta-acka-sucd-4hbd表达序列表的序列8所示的乙酸激酶(由acka基因编码)、序列表的序列9所示的磷酸转乙酰酶(由pta基因编码)、序列表的序列13所示的琥珀酸半缩醛脱氢酶(由sucd基因编码)和序列表的序列14所示的4-羟基丁酸脱氢酶(由4hbd基因编码)。
二、重组质粒puc19-phacab-orfz的构建
1、人工合成序列表中序列4所示的dna,含有orfz表达盒,上游为bamhi位点,下游为ecori位点,其中第9-51位核苷酸为启动子序列,第70-1359位核苷酸为orfz基因序列。
2、用bamhi和ecori双酶切步骤1中合成的dna序列,回收大小为1357bp的dna片段;用bamhi和ecori双酶切重组质粒puc19-phacab,回收大小为6553bp的dna片段;将上述1357bp和6553bp的两个dna片段连接,得到连接产物通过化学转化的方法导入到e.colijm109中,并涂布于含有氨苄青霉素的lb固体培养基,37℃培养16h,得到转化子。提取转化子的质粒,用bamhi和ecori进行酶切验证,酶切产物大小为1357bp和6553bp的质粒为阳性质粒,将此重组质粒命名为重组质粒puc19-phacab-orfz。将重组质粒puc19-phacab-orfz进行测序。根据测序结果,对重组质粒puc19-phacab-orfz进行结构描述如下:将重组质粒puc19-phacab的bamhi识别序列和ecori识别序列间的dna小片段替换为核苷酸序列是序列表中序列4自5’末端起第9至1359位所示的dna分子。
重组质粒puc19-phacab-orfz表达序列表的序列15所示的4-羟基丁酰辅酶a:辅酶a转移酶(由orfz基因编码)。
三、大肠杆菌e.colijm109sg的构建
1、敲除sad基因
1)合成sad基因敲除所用的引物sadf和引物sadr。
引物sadf(从5’到3’):
atgaccattactccggcaactcatgcaatttcgataaatcctgccacgggtgaacaacttgtgtaggctggagctgcttcg引物sadr(从5’到3’):
tcttttccccgcccagtaacaaacgcgcaccctgcgccagggttttctccacctgatgatattccggggatccgtcgacc。
2)以质粒pkd13为模板,采用引物sadf和引物sadr,pcr扩增得到1500bp左右的dna片段,命名为sad同源重组片段,琼脂糖凝胶电泳对得到的dna片段进行纯化。
经过测序,sad同源重组片段的核苷酸序列为序列6,其中,第1-60位为sad基因上游同源臂,第61-1364位为frt序列和kan抗性基因,第1365-1424位为sad基因下游同源臂。
3)利用电转化的方法将质粒pkd46转化至受体菌株e.colijm109中,并涂布于含有氨苄青霉素的lb固体培养基,30℃培养24h,得到转化子,提质粒验证,获得e.colijm109(pkd46)。
4)将e.colijm109(pkd46)接种到含有氨苄青霉素的lb液体培养基中,30℃培养1h,加入阿拉伯糖至终浓度5g/l,继续培养1.5h,接下来制备e.colijm109(pkd46)的感受态细胞,将步骤2)中获得的dna片段转入e.colijm109(pkd46)的感受态细胞中,并涂布于含有卡那霉素的lb固体培养基,37℃培养24h,得到转化子。
5)利用菌落pcr的方法,以引物sadf和引物sadr为引物,将pcr产物纯化之后测序,筛选正确的sad基因已经被替换为kan抗性基因的克隆,得到e.colijm109sad-k(pkd46)。
6)将e.colijm109sad-k(pkd46)接种于lb液体培养基中,42℃培养传代三次,除去质粒pkd46,得到e.colijm109sad-k;e.colijm109sad-k是sad基因被kan基因替换了的e.colijm109。
7)将e.colijm109sad-k接种到含有卡那霉素的lb液体培养基中,37℃培养24h,转接到含有卡那霉素的lb液体培养基中,37℃培养3h,制备e.colijm109sad-k感受态细胞。
8)利用电转化的方法将质粒pcp20转化到e.colijm109sad-k感受态细胞中,并涂布于含有氨苄青霉素的lb固体培养基,30℃培养48h,得到转化子。
利用菌落pcr的方法验证转化子,以引物sadf引物和sadr为引物,得到202bp片段的为阳性克隆。
将该阳性克隆送去测序,其为敲除e.colijm109基因组上的sad基因得到的菌,将该菌接种到lb液体培养基中,42℃传代三次,除去质粒pcp20,命名为突变体e.colijm109s。
2、敲除gabd基因
与上述1的方法基本相同,不同的是如下:
gabd敲除引物为引物gabdf和引物gabdr。
引物gabdf(从5’到3’):
atgaaacttaacgacagtaacttattccgccagcaggcgttgattaacggggaatggctggtgtaggctggagctgcttcg;引物gabdr(从5’到3’):
tgctcttccacttttgctaccgctttttcatcgatcagcggcccgatggtgacgccgttaattccggggatccgtcgacc。
gabd同源重组片段的核苷酸序列为序列7,其中,第1-60位为gabd基因上游同源臂,第61-1364位为frt序列和kan抗性基因,第1365-1424位为gabd基因下游同源臂。
转化受体菌株为上述1得到的突变体e.colijm109s。
利用菌落pcr的方法验证转化子,以引物gabdf和引物gabdr为引物,得到202bp的片段阳性克隆。
将该阳性克隆送去测序,其为敲除e.colijm109s基因组上的gabd基因得到的菌,将该菌接种到lb液体培养基中,42℃传代三次,除去质粒pcp20,命名为突变体e.colijm109sg。突变体e.colijm109sg敲除了非辅酶a循环的琥珀酸半缩醛脱氢酶的编码基因(即sad基因和gabd基因)。
四、重组菌e.colijm109sg(puc19-phacab-orfz+pmcs-pta-acka-4hbd-sucd)的构建
1、将上述一得到的重组质粒pmcs-pta-acka-sucd-4hbd和上述二得到的重组质粒puc19-phacab-orfz通过电转化的方法转化到大肠杆菌e.colijm109sg,并涂布于含有氨苄青霉素和卡那霉素的lb固体培养基,37℃培养24h。
2、挑取单克隆于含有氨苄青霉素和卡那霉素的lb液体培养基,37℃培养24h。
3、提取转化子的质粒,验证转化的正确性,得到含有两个质粒的重组菌e.colijm109sg(puc19-phacab-orfz+pmcs-pta-acka-4hbd-sucd)。
e.colijm109sg(puc19-phacab-orfz+pmcs-pta-acka-4hbd-sucd)为将pta基因、acka基因、phac基因、phab基因、phaa基因、orfz基因、4hbd基因和sucd基因转入大肠杆菌e.colijm109sg中得到的重组菌。
五、对照菌株e.colijm109sg(puc19-phacab-orfz+pmcs-4hbd-sucd)的构建
1、将上述一得到的重组质粒pmcs-4hbd-sucd和上述二得到的重组质粒puc19-phacab-orfz通过电转的方法转化到大肠杆菌e.colijm109sg,并涂布于含有氨苄青霉素和卡那霉素的lb固体培养基,37℃培养24h。
2、挑取单克隆于含有氨苄青霉素和卡那霉素的lb液体培养基,37℃培养24h。
3、提取转化子的质粒,验证转化的正确性,得到含有质粒的重组菌e.colijm109sg(puc19-phacab-orfz+pmcs-4hbd-sucd)。
e.colijm109sg(puc19-phacab-orfz+pmcs-4hbd-sucd)为将phac基因、phab基因、phaa基因、orfz基因、4hbd基因和sucd基因转入大肠杆菌e.colijm109sg中得到的重组菌。
实施例3、重组菌e.colijm109(puc19-phacab-pct+pmcs-pta-acka)的构建
一、重组质粒puc19-phacab-pct的构建
1、人工合成序列表中序列5所示的dna,含有pct表达盒,上游为bamhi位点,下游为ecori位点,其中第9-51位核苷酸为启动子序列,第70-1623位核苷酸为pct基因序列。
2、用bamhi和ecori双酶切步骤1中合成的dna序列,回收大小为1621bp的dna片段;用bamhi和ecori双酶切重组质粒puc19-phacab,回收大小为6553bp的dna片段;将上述1621bp和6553bp的两个dna片段连接,得到连接产物通过化学转化的方法导入到e.colijm109中,并涂布于含有氨苄青霉素的lb固体培养基,37℃培养16h,得到转化子。提取转化子的质粒,用bamhi和ecori进行酶切验证,酶切产物大小为1621bp和6553bp的质粒为阳性质粒,将此重组质粒命名为重组质粒puc19-phacab-pct。将重组质粒puc19-phacab-pct进行测序。根据测序结果,对重组质粒puc19-phacab-pct进行结构描述如下:将重组质粒puc19-phacab的bamhi识别序列和ecori识别序列间的dna小片段替换为核苷酸序列是序列表中序列5自5’末端起第9至1623位所示的dna分子。
重组质粒puc19-phacab-pct表达序列表的序列16所示的丙酰辅酶a转移酶(由pct基因编码)。
二、重组菌e.colijm109(puc19-phacab-pct+pmcs-pta-acka)的构建
1、将实施例1中一构建的重组质粒pmcs-pta-acka和上述二得到的重组质粒puc19-phacab-pct通过化学转化的方法转化到大肠杆菌e.colijm109,并涂布于含有氨苄青霉素和卡那霉素的lb固体培养基,37℃培养24h。
2、挑取单克隆于含有氨苄青霉素和卡那霉素的lb液体培养基,37℃培养24h。
3、提取转化子的质粒,验证转化的正确性,得到含有两个质粒的重组菌e.colijm109(puc19-phacab-pct+pmcs-pta-acka)。
e.colijm109(puc19-phacab-pct+pmcs-pta-acka)为将pta基因、acka基因、phac基因、phab基因、phaa基因和pct基因转入大肠杆菌e.colijm109中得到的重组菌。
三、对照菌株e.colijm109(puc19-phacab-pct)的构建
1、把上述二得到的重组质粒puc19-phacab-pct通过化学转化的方法转化到大肠杆菌e.colijm109,并涂布于含有氨苄青霉素的lb固体培养基,37℃培养24h。
2、挑取单克隆于含有氨苄青霉素的lb液体培养基,37℃培养24h。
3、提取转化子的质粒,验证转化的正确性,得到含有一个质粒的重组菌e.colijm109(puc19-phacab-pct)。
e.colijm109(puc19-phacab-pct)为将phac基因、phab基因、phaa基因和pct基因转入大肠杆菌e.colijm109中得到的重组菌。
四、对照菌株e.colijm109(puc19-phacab+pmcs-pta-acka)的构建
如实施例1中三所述。
实施例4、重组菌e.colijm109(puc19-phacab+pmcs-pta-acka)在生产p3hb中的应用
一、重组菌e.colijm109(puc19-phacab+pmcs-pta-acka)摇瓶培养生产p3hb
1、将实施例1中三构建的重组菌e.colijm109(puc19-phacab+pmcs-pta-acka)在含有氨苄青霉素和卡那霉素的lb液体培养基中,于37℃、转速200rpm条件下培养16h,作为种子液。
2、按体积比4%的接种量,将种子液接种到mmye液体培养基中,500ml摇瓶中装液量为50ml,于37℃、转速200rpm条件下培养48h,收集菌体,冷冻干燥,酯化。
3、通过气相色谱对基因工程菌产生的p3hb进行定量检测。具体条件如下:
使用福立公司gc-9790ii型气相色谱仪,色谱柱为db-5毛细管柱,非极性。用氮气作为载气,氢气作为燃气,空气为助燃气。进样量为1μl。进样口:温度为200℃,使用分流模式,分流比为30。检测器:温度为220℃,氢气流量40ml/min,空气流量400ml/min。升温程序如下:第一步,温度80℃,维持时间为2min;第二步,温度变化由80℃到140℃,升温速率30℃/min,然后维持0.5min;第三步,温度变化由140℃到220℃,升温速率40℃/min,然后维持3min。
重组菌e.colijm109(puc19-phacab+pmcs-pta-acka)在摇瓶培养中获得的细胞干重为3.02g/l,其中p3hb含量为42.02%,p3hb产量为1.27g/l。结果表明,该重组菌具有较好的将乙酸转化为p3hb的能力。
二、对照菌株e.colijm109(puc19-phacab+pbbr1mcs-2)摇瓶培养生产p3hb
按照一的方法,将“重组菌e.colijm109(puc19-phacab+pmcs-pta-acka)”替换为实施例1中四构建的重组菌e.colijm109(puc19-phacab+pbbr1mcs-2),其它步骤均不变。
重组菌e.colijm109(puc19-phacab+pbbr1mcs-2)在摇瓶培养中获得的细胞干重为2.22g/l,其中p3hb含量为13.80%,p3hb产量为0.31g/l。
上述结果表明,pta基因和acka基因的表达能够明显提高在乙酸为碳源时p3hb的产量,由0.31g/l提高到1.27g/l。由此可见,含有pta基因和acka基因的重组菌在乙酸为碳源合成p3hb时具有明显的优势。
三、重组菌e.colijm109(puc19-phacab+pmcs-pta-acka)在无乙酸条件下的摇瓶培养
按照一的方法,将mmye液体培养基替换为不含乙酸的mmye培养基(与mmye液体培养基的区别仅在于组分中不含有乙酸),其它步骤均不变。
结果如下:重组菌e.colijm109(puc19-phacab+pbbr1mcs-2)在摇瓶培养中获得的细胞干重为1.15g/l,其中p3hb含量为3.23%,p3hb产量为0.04g/l。结果表明,虽然重组菌能够在不含乙酸的mmye培养基中生长,但p3hb的产量很低。由此可见,在不添加乙酸的条件下,重组菌能够在培养基中生长,但酵母粉等所含的碳源不足以支撑有效的p3hb合成。上述一中所积累的p3hb主要由乙酸产生,乙酸是该培养条件下用于合成p3hb的主要碳源。
实施例5、e.colijm109sg(puc19-phacab-orfz+pmcs-pta-acka-4hbd-sucd)在生产p3hb4hb中的应用
一、重组菌e.colijm109sg(puc19-phacab-orfz+pmcs-pta-acka-4hbd-sucd)摇瓶培养生产p3hb4hb
1、将实施例2中四构建的重组菌e.colijm109sg
(puc19-phacab-orfz+pmcs-pta-acka-4hbd-sucd)在含有氨苄青霉素和卡那霉素的lb液体培养基中,于37℃、转速200rpm条件下培养16h,作为种子液。
2、按体积比4%的接种量,将种子液接种到mmye液体培养基中,500ml摇瓶中装液量为50ml,于37℃、转速200rpm条件下培养48h,收集菌体,冷冻干燥,酯化。
3、通过气相色谱对基因工程菌产生的p3hb4hb进行定量检测。
重组菌e.colijm109sg(puc19-phacab-orfz+pmcs-pta-acka-4hbd-sucd)在摇瓶培养中获得的细胞干重为2.96g/l,其中p3hb4hb含量为58.00%,p3hb4hb产量为1.71g/l,4hb单体含量为5.79mol%。结果表明,该重组菌具有较好的将乙酸转化为p3hb4hb的能力。
二、对照菌株e.colijm109sg(puc19-phacab-orfz+pmcs-4hbd-sucd)摇瓶培养生产p3hb4hb
按照一的方法,将“重组菌e.colijm109sg(puc19-phacab-orfz+pmcs-pta-acka-4hbd-sucd)”替换为实施例2中五构建的重组菌e.colijm109sg(puc19-phacab-orfz+pmcs-4hbd-sucd),其它步骤均不变。
重组菌e.colijm109sg(puc19-phacab-orfz+pmcs-4hbd-sucd)在摇瓶培养中获得的细胞干重为2.37g/l,其中p3hb4hb含量为35.79%,p3hb4hb产量为0.85g/l,4hb单体含量为9.48mol%。
上述结果表明,pta基因和acka基因的表达能够明显提高在乙酸为碳源时p3hb4hb的产量,由0.85g/l提高到1.71g/l。由此可见,含有pta基因和acka基因的重组菌在乙酸为碳源合成p3hb4hb时具有明显的优势。
实施例6、e.colijm109(puc19-phacab-pct+pmcs-pta-acka)在生产phbv中的应用
一、重组菌e.colijm109(puc19-phacab-pct+pmcs-pta-acka)摇瓶培养生产phbv
1、将实施例3中二构建的重组菌e.colijm109(puc19-phacab-pct+pmcs-pta-acka)在含有氨苄青霉素和卡那霉素的lb液体培养基中,于37℃、转速200rpm条件下培养16h,作为种子液。
2、按体积比4%的接种量,将种子液接种到mmye液体培养基中,500ml摇瓶中装液量为50ml,于37℃、转速200rpm条件下培养6h;然后加入丙酸并使丙酸在体系中的浓度为1.5g/l,继续培养42h,收集菌体,冷冻干燥,酯化。
3、通过气相色谱对基因工程菌产生的phbv进行定量检测。
重组菌e.colijm109(puc19-phacab-pct+pmcs-pta-acka)在摇瓶培养中获得的细胞干重为2.42g/l,其中phbv含量为13.43%,phbv产量为0.33g/l,3hv单体含量为13.71mol%。结果表明,该重组菌具有较好的将乙酸和丙酸转化为phbv的能力。
二、对照菌株e.colijm109(puc19-phacab-pct)摇瓶培养生产phbv
按照一的方法,将“重组菌e.colijm109(puc19-phacab-pct+pmcs-pta-acka)”替换为实施例3中三构建的重组菌e.colijm109(puc19-phacab-pct),其它步骤均不变。
重组菌e.colijm109(puc19-phacab-pct)在摇瓶培养中获得的细胞干重为2.21g/l,其中phbv含量为9.43%,phbv产量为0.19g/l,3hv单体含量为10.11mol%。
根据一和二的结果,pta基因和acka基因的表达能够明显提高在乙酸和丙酸为碳源时phbv的产量,由0.19g/l提高到0.33g/l。由此可见,含有pta基因和acka基因的重组菌在乙酸和丙酸为碳源合成phbv时具有明显的优势。
三、对照菌株e.colijm109(puc19-phacab+pmcs-pta-acka)摇瓶培养生产phbv
按照一的方法,将“重组菌e.colijm109(puc19-phacab-pct+pmcs-pta-acka)”替换为实施例3中四构建的重组菌e.colijm109(puc19-phacab+pmcs-pta-acka),其它步骤均不变。
重组菌e.colijm109(puc19-phacab+pmcs-pta-acka)在摇瓶培养中获得的细胞干重为2.40g/l,其中phbv含量为39.37%,phbv产量为0.959g/l,3hv单体含量仅为2.43mol%。
根据一和三的结果,pct基因的表达能够明显提高在乙酸和丙酸为碳源时phbv中3hv单体的含量,其丙酰辅酶a转移酶活性有助于提供更多的丙酰辅酶a前体,用于3hv的聚合。
<110>北京化工大学
<120>利用乙酸和丙酸生产聚羟基脂肪酸酯的基因工程菌及其构建方法和应用
<160>20
<170>patentinversion3.5
<210>1
<211>3499
<212>dna
<213>人工序列
<220>
<223>
<400>1
aagaattcttgacagctagctcagtcctaggtataatgctagctactagagaaagaggag60
aaatataccatgtcgagtaagttagtactggttctgaactgcggtagttcttcactgaaa120
tttgccatcatcgatgcagtaaatggtgaagagtacctttctggtttagccgaatgtttc180
cacctgcccgaagcacgtatcaaatggaaaatggacggcaataaacaggaagcggcttta240
ggtgcaggcgccgctcacagcgaagcgctcaactttatcgttaatactattctggcacaa300
aaaccagaactgtctgcgcagctgactgctatcggtcaccgtatcgtacacggcggcgaa360
aagtataccagctccgtagtgatcgatgagtctgttattcagggtatcaaagatgcagct420
tcttttgcaccgctgcacaacccggctcacctgatcggtatcgaagaagctctgaaatct480
ttcccacagctgaaagacaaaaacgttgctgtatttgacaccgcgttccaccagactatg540
ccggaagagtcttacctctacgccctgccttacaacctgtacaaagagcacggcatccgt600
cgttacggcgcgcacggcaccagccacttctatgtaacccaggaagcggcaaaaatgctg660
aacaaaccggtagaagaactgaacatcatcacctgccacctgggcaacggtggttccgtt720
tctgctatccgcaacggtaaatgcgttgacacctctatgggcctgaccccgctggaaggt780
ctggtcatgggtacccgttctggtgatatcgatccggcgatcatcttccacctgcacgac840
accctgggcatgagcgttgacgcaatcaacaaactgctgaccaaagagtctggcctgctg900
ggtctgaccgaagtgaccagcgactgccgctatgttgaagacaactacgcgacgaaagaa960
gacgcgaagcgcgcaatggacgtttactgccaccgcctggcgaaatacatcggtgcctac1020
actgcgctgatggatggtcgtctggacgctgttgtattcactggtggtatcggtgaaaat1080
gccgcaatggttcgtgaactgtctctgggcaaactgggcgtgctgggctttgaagttgat1140
catgaacgcaacctggctgcacgtttcggcaaatctggtttcatcaacaaagaaggtacc1200
cgtcctgcggtggttatcccaaccaacgaagaactggttatcgcgcaagacgcgagccgc1260
ctgactgcctgatttcacaccgccagctcagctggcggtgctgttttgtaacccgccaaa1320
tcggcggtaacgaaagaggataaaccatgtcccgtattattatgctgatccctaccggaa1380
ccagcgtcggtctgaccagcgtcagccttggcgtgatccgtgcaatggaacgcaaaggcg1440
ttcgtctgagcgttttcaaacctatcgctcagccgcgtaccggtggcgatgcgcccgatc1500
agactacgactatcgtgcgtgcgaactcttccaccacgacggccgctgaaccgctgaaaa1560
tgagctacgttgaaggtctgctttccagcaatcagaaagatgtgctgatggaagagatcg1620
tcgcaaactaccacgctaacaccaaagacgctgaagtcgttctggttgaaggtctggtcc1680
cgacacgtaagcaccagtttgcccagtctctgaactacgaaatcgctaaaacgctgaatg1740
cggaaatcgtcttcgttatgtctcagggcactgacaccccggaacagctgaaagagcgta1800
tcgaactgacccgcaacagcttcggcggtgccaaaaacaccaacatcaccggcgttatcg1860
ttaacaaactgaacgcaccggttgatgaacagggtcgtactcgcccggatctgtccgaga1920
ttttcgacgactcttccaaagctaaagtaaacaatgttgatccggcgaagctgcaagaat1980
ccagcccgctgccggttctcggcgctgtgccgtggagctttgacctgatcgcgactcgtg2040
cgatcgatatggctcgccacctgaatgcgaccatcatcaacgaaggcgacatcaatactc2100
gccgcgttaaatccgtcactttctgcgcacgcagcattccgcacatgctggagcacttcc2160
gtgccggttctctgctggtgacttccgcagaccgtcctgacgtgctggtggccgcttgcc2220
tggcagccatgaacggcgtagaaatcggtgccctgctgctgactggcggttacgaaatgg2280
acgcgcgcatttctaaactgtgcgaacgtgctttcgctaccggcctgccggtatttatgg2340
tgaacaccaacacctggcagacctctctgagcctgcagagcttcaacctggaagttccgg2400
ttgacgatcacgaacgtatcgagaaagttcaggaatacgttgctaactacatcaacgctg2460
actggatcgaatctctgactgccacttctgagcgcagccgtcgtctgtctccgcctgcgt2520
tccgttatcagctgactgaacttgcgcgcaaagcgggcaaacgtatcgtactgccggaag2580
gtgacgaaccgcgtaccgttaaagcagccgctatctgtgctgaacgtggtatcgcaactt2640
gcgtactgctgggtaatccggcagagatcaaccgtgttgcagcgtctcagggtgtagaac2700
tgggtgcagggattgaaatcgttgatccagaagtggttcgcgaaagctatgttggtcgtc2760
tggtcgaactgcgtaagaacaaaggcatgaccgaaaccgttgcccgcgaacagctggaag2820
acaacgtggtgctcggtacgctgatgctggaacaggatgaagttgatggtctggtttccg2880
gtgctgttcacactaccgcaaacaccatccgtccgccgctgcagctgatcaaaactgcac2940
cgggcagctccctggtatcttccgtgttcttcatgctgctgccggaacaggtttacgttt3000
acggtgactgtgcgatcaacccggatccgaccgctgaacagctggcagaaatcgcgattc3060
agtccgctgattccgctgcggccttcggtatcgaaccgcgcgttgctatgctctcctact3120
ccaccggtacttctggtgcaggtagcgacgtagaaaaagttcgcgaagcaactcgtctgg3180
cgcaggaaaaacgtcctgacctgatgatcgacggtccgctgcagtacgacgctgcggtaa3240
tggctgacgttgcgaaatccaaagcgccgaactctccggttgcaggtcgcgctaccgtgt3300
tcatcttcccggatctgaacaccggtaacaccacctacaaagcggtacagcgttctgccg3360
acctgatctccatcgggccgatgctgcagggtatgcgcaagccggttaacgacctgtccc3420
gtggcgcactggttgacgatatcgtctacaccatcgcgctgactgcgattcagtctgcac3480
agcagcagtaatctagaaa3499
<210>2
<211>3928
<212>dna
<213>人工序列
<220>
<223>
<400>2
aaaagcttttgacagctagctcagtcctaggtataatgctagctactagagaaagaggag60
aaatataccatggcgaccggcaaaggcgcggcagcttccacgcaggaaggcaagtcccaa120
ccattcaaggtcacgccggggccattcgatccagccacatggctggaatggtcccgccag180
tggcagggcactgaaggcaacggccacgcggccgcgtccggcattccgggcctggatgcg240
ctggcaggcgtcaagatcgcgccggcgcagctgggtgatatccagcagcgctacatgaag300
gacttctcagcgctgtggcaggccatggccgagggcaaggccgaggccaccggtccgctg360
cacgaccggcgcttcgccggcgacgcatggcgcaccaacctcccatatcgcttcgctgcc420
gcgttctacctgctcaatgcgcgcgccttgaccgagctggccgatgccgtcgaggccgat480
gccaagacccgccagcgcatccgcttcgcgatctcgcaatgggtcgatgcgatgtcgccc540
gccaacttccttgccaccaatcccgaggcgcagcgcctgctgatcgagtcgggcggcgaa600
tcgctgcgtgccggcgtgcgcaacatgatggaagacctgacacgcggcaagatctcgcag660
accgacgagagcgcgtttgaggtcggccgcaatgtcgcggtgaccgaaggcgccgtggtc720
ttcgagaacgagtacttccagctgttgcagtacaagccgctgaccgacaaggtgcacgcg780
cgcccgctgctgatggtgccgccgtgcatcaacaagtactacatcctggacctgcagccg840
gagagctcgctggtgcgccatgtggtggagcagggacatacggtgtttctggtgtcgtgg900
cgcaatccggacgccagcatggccggcagcacctgggacgactacatcgagcacgcggcc960
atccgcgccatcgaagtcgcgcgcgacatcagcggccaggacaagatcaacgtgctcggc1020
ttctgcgtgggcggcaccattgtctcgaccgcgctggcggtgctggccgcgcgcggcgag1080
cacccggccgccagcgtcacgctgctgaccacgctgctggactttgccgacacgggcatc1140
ctcgacgtctttgtcgacgagggccatgtgcagttgcgcgaggccacgctgggcggcggc1200
gccggcgcgccgtgcgcgctgctgcgcggccttgagctggccaataccttctcgttcttg1260
cgcccgaacgacctggtgtggaactacgtggtcgacaactacctgaagggcaacacgccg1320
gtgccgttcgacctgctgttctggaacggcgacgccaccaacctgccggggccgtggtac1380
tgctggtacctgcgccacacctacctgcagaacgagctcaaggtaccgggcaagctgacc1440
gtgtgcggcgtgccggtggacctggccagcatcgacgtgccgacctatatctacggctcg1500
cgcgaagaccatatcgtgccgtggaccgcggcctatgcctcgaccgcgctgctggcgaac1560
aagctgcgcttcgtgctgggtgcgtcgggccatatcgccggtgtgatcaacccgccggcc1620
aagaacaagcgcagccactggactaacgatgcgctgccggagtcgccgcagcaatggctg1680
gccggcgccatcgagcatcacggcagctggtggccggactggaccgcatggctggccggg1740
caggccggcgcgaaacgcgccgcgcccgccaactatggcaatgcgcgctatcgcgcaatc1800
gaacccgcgcctgggcgatacgtcaaagccaaggcatgacgcttgcatgagtgccggcgt1860
gcgtcatgcacggcgccggcaggcctgcaggttccctcccgtttccattgaaaggactac1920
acaatgactgacgttgtcatcgtatccgccgcccgcaccgcggtcggcaagtttggcggc1980
tcgctggccaagatcccggcaccggaactgggtgccgtggtcatcaaggccgcgctggag2040
cgcgccggcgtcaagccggagcaggtgagcgaagtcatcatgggccaggtgctgaccgcc2100
ggttcgggccagaaccccgcacgccaggccgcgatcaaggccggcctgccggcgatggtg2160
ccggccatgaccatcaacaaggtgtgcggctcgggcctgaaggccgtgatgctggccgcc2220
aacgcgatcatggcgggcgacgccgagatcgtggtggccggcggccaggaaaacatgagc2280
gccgccccgcacgtgctgccgggctcgcgcgatggtttccgcatgggcgatgccaagctg2340
gtcgacaccatgatcgtcgacggcctgtgggacgtgtacaaccagtaccacatgggcatc2400
accgccgagaacgtggccaaggaatacggcatcacacgcgaggcgcaggatgagttcgcc2460
gtcggctcgcagaacaaggccgaagccgcgcagaaggccggcaagtttgacgaagagatc2520
gtcccggtgctgatcccgcagcgcaagggcgacccggtggccttcaagaccgacgagttc2580
gtgcgccagggcgccacgctggacagcatgtccggcctcaagcccgccttcgacaaggcc2640
ggcacggtgaccgcggccaacgcctcgggcctgaacgacggcgccgccgcggtggtggtg2700
atgtcggcggccaaggccaaggaactgggcctgaccccgctggccacgatcaagagctat2760
gccaacgccggtgtcgatcccaaggtgatgggcatgggcccggtgccggcctccaagcgc2820
gccctgtcgcgcgccgagtggaccccgcaagacctggacctgatggagatcaacgaggcc2880
tttgccgcgcaggcgctggcggtgcaccagcagatgggctgggacacctccaaggtcaat2940
gtgaacggcggcgccatcgccatcggccacccgatcggcgcgtcgggctgccgtatcctg3000
gtgacgctgctgcacgagatgaagcgccgtgacgcgaagaagggcctggcctcgctgtgc3060
atcggcggcggcatgggcgtggcgctggcagtcgagcgcaaataaggaaggggttttccg3120
gggccgcgcgcggttggcgcggacccggcgacgataacgaagccaatcaaggagtggaca3180
tgactcagcgcattgcgtatgtgaccggcggcatgggtggtatcggaaccgccatttgcc3240
agcggctggccaaggatggctttcgtgtggtggccggttgcggccccaactcgccgcgcc3300
gcgaaaagtggctggagcagcagaaggccctgggcttcgatttcattgcctcggaaggca3360
atgtggctgactgggactcgaccaagaccgcattcgacaaggtcaagtccgaggtcggcg3420
aggttgatgtgctgatcaacaacgccggtatcacccgcgacgtggtgttccgcaagatga3480
cccgcgccgactgggatgcggtgatcgacaccaacctgacctcgctgttcaacgtcacca3540
agcaggtgatcgacggcatggccgaccgtggctggggccgcatcgtcaacatctcgtcgg3600
tgaacgggcagaagggccagttcggccagaccaactactccaccgccaaggccggcctgc3660
atggcttcaccatggcactggcgcaggaagtggcgaccaagggcgtgaccgtcaacacgg3720
tctctccgggctatatcgccaccgacatggtcaaggcgatccgccaggacgtgctcgaca3780
agatcgtcgcgacgatcccggtcaagcgcctgggcctgccggaagagatcgcctcgatct3840
gcgcctggttgtcgtcggaggagtccggtttctcgaccggcgccgacttctcgctcaacg3900
gcggcctgcatatgggctgaggatccaa3928
<210>3
<211>2591
<212>dna
<213>人工序列
<220>
<223>
<400>3
aatctagattgacagctagctcagtcctaggtataatgctagctactagagaaagaggag60
aaatataccatgagtaatgaagtatctataaaagaattaattgaaaaggcaaaggtggca120
caaaaaaaattggaagcctatagtcaagaacaagttgatgtactagtaaaagcactagga180
aaagtggtttatgataatgcagaaatgtttgcaaaagaagcagttgaagaaacagaaatg240
ggtgtttatgaagataaagtagctaaatgtcatttgaaatcaggagctatttggaatcat300
ataaaagacaagaaaactgtaggcataataaaagaagaacctgaaagggcacttgtttat360
gttgctaagccaaagggagttgtggcagctactacgcctataactaatccagtggtaact420
cctatgtgtaatgcaatggctgctataaagggcagaaatacaataatagtagcaccacat480
cctaaagcaaagaaagtttcagctcatactgtagaacttatgaatgctgagcttaaaaaa540
ttgggagcaccagaaaatatcatacagatagtagaagcaccatcaagagaagctgctaag600
gaacttatggaaagtgctgatgtagttattgctacaggcggtgctggaagagttaaagct660
gcttactccagtggaagaccagcttatggcgttggacctggaaattcacaggtaatagtt720
gataagggatacgattataacaaagctgcacaggatataataacaggaagaaaatatgac780
aatggaattatatgttcttcagagcaatcagttatagctcctgctgaagattatgataag840
gtaatagcagcttttgtagaaaatggggcattctatgtagaagatgaggaaacagtagaa900
aagtttagatcaactttatttaaagatggaaaaataaacagcaagattataggtaaatcc960
gtccaaattattgcggatcttgcaggagtaaaagtaccagaaggtactaaggttatagta1020
cttaagggtaaaggtgcaggagaaaaagatgtactttgtaaagaaaaaatgtgtccagtt1080
ttagtagcattgaaatatgatacttttgaagaagcagttgaaatagctatggctaattat1140
atgtatgaaggagctggtcatacagcaggcatacattctgacaatgacgagaacataaga1200
tatgcaggaactgtattacctataagcagattagttgtaaatcagcctgcaactactgct1260
ggaggaagtttcaataatggatttaaccctactactacactaggctgcggatcatggggc1320
agaaacagtatttcagaaaatcttacttacgagcatcttataaatgtttcaagaataggg1380
tatttcaataaagaagcaaaagttcctagctatgaggaaatatggggataagtcctgtta1440
ttaaaaagtatataaggaggaaaaaatatgaagttattaaaattggcacctgatgtttat1500
aaatttgatactgcagaggagtttatgaaatactttaaggttggaaaaggtgactttata1560
cttactaatgaatttttatataaacctttccttgagaaattcaatgatggtgcagatgct1620
gtatttcaggagaaatatggactcggtgaaccttctgatgaaatgataaacaatataatt1680
aaggatattggagataaacaatataatagaattattgctgtagggggaggatctgtaata1740
gatatagccaaaatcctcagtcttaagtatactgatgattcattggatttgtttgaggga1800
aaagtacctcttgtaaaaaacaaagaattaattatagttccaactacatgtggaacaggt1860
tcagaagttacaaatgtatcagttgcagaattaaagagaagacatactaaaaaaggaatt1920
gcttcagacgaattatatgcaacttatgcagtacttgtaccagaatttataaaaggactt1980
ccatataagttttttgtaaccagctccgtagatgccttaatacatgcaacagaagcttat2040
gtatctccaaatgcaaatccttatactgatatgtttagtgtaaaagctatggagttaatt2100
ttaaatggatacatgcaaatggtagagaaaggaaatgattacagagttgaaataattgag2160
gattttgttataggcagcaattatgcaggtatagcttttggaaatgcaggagtgggagcg2220
gttcacgcactctcatatccaataggcggaaattatcatgtgcctcatggagaagcaaat2280
tatctgttttttacagaaatatttaaaacttattatgagaaaaatccaaatggcaagatt2340
aaagatgtaaataaactattagcaggcatactaaaatgtgatgaaagtgaagcttatgac2400
agtttatcacaacttttagataaattattgtcaagaaaaccattaagagaatatggaatg2460
aaagaggaagaaattgaaacttttgctgattcagtaatagaaggacagcagagactgttg2520
gtaaacaattatgaacctttttcaagagaagacatagtaaacacatataaaaagttatat2580
taagagctcaa2591
<210>4
<211>1367
<212>dna
<213>人工序列
<220>
<223>
<400>4
aaggatccttgacagctagctcagtcctaggtataatgctagctactagagaaagaggag60
aaatataccatggagtgggaagagatatataaagagaaactggtaactgcagaaaaagct120
gtttcaaaaatagaaaaccatagcagggtagtttttgcacatgcagtaggagaacccgta180
gatttagtaaatgcactagttaaaaataaggataattatataggactagaaatagttcac240
atggtagctatgggcaaaggtgaatatacaaaagagggtatgcaaagacattttagacat300
aatgctttatttgtaggcggatgtactagagatgcagtaaattcaggaagagcagattat360
acaccttgttttttctatgaagtgccaagtttgtttaaagaaaaacgtttgcctgtagat420
gtagcacttattcaggtaagtgagccagataaatatggctactgcagttttggagtttcc480
aatgactataccaagccagcagcagaaagtgctaagcttgtaattgcagaagtgaataaa540
aacatgccaagaactcttggagattcttttatacatgtatcagatattgattatatagtg600
gaagcttcacacccattgttagaattgcagcctcctaaattgggagatgtagaaaaagcc660
ataggagaaaactgtgcatctttaattgaagatggagctactcttcagcttggaataggt720
gctataccagatgcggtacttttattcttaaagaacaaaaagaatttaggaatacattct780
gagatgatatcagatggtgtgatggaactggtgaaggcaggggttatcaataacaagaaa840
aagaccctccatccaggcaaaatagttgtaacatttttaatgggaacaaaaaaattatat900
gattttgtaaacaataatccaatggtagaaacttattctgtagattatgtaaataatcca960
ctggtaattatgaaaaatgacaatatggtttcaataaattcttgtgttcaagtagactta1020
atgggacaagtatgttctgaaagtataggattgaaacagataagtggagtgggaggccag1080
gtagattttattagaggagctaatctatcaaagggtggaaaggctattatagctatacct1140
tccacagctggaaaaggaaaagtttcaagaataactccacttctagatactggtgctgca1200
gttacaacttctagaaatgaagtagattatgtagttactgaatatggtgttgctcatctt1260
aagggcaaaactttaagaaatagggcaagagctctaataaatatcgctcatccaaaattc1320
agagaatcattaatgaatgaatttaaaaagagattttaggaatccaa1367
<210>5
<211>1631
<212>dna
<213>人工序列
<220>
<223>
<400>5
aaggatccttgacagctagctcagtcctaggtataatgctagctactagagaaagaggag60
aaatataccatgagaaaagtagaaatcattacagctgaacaagcagctcagctcgtaaaa120
gacaacgacacgattacgtctatcggctttgtcagcagcgcccatccggaagcactgacc180
aaagctttggaaaaacggttcctggacacgaacaccccgcagaacttgacctacatctat240
gcaggctctcagggcaaacgcgatggccgtgccgctgaacatctggcacacacaggcctt300
ttgaaacgcgccatcatcggtcactggcagactgtaccggctatcggtaaactggctgtc360
gaaaacaagattgaagcttacaacttctcgcagggcacgttggtccactggttccgcgcc420
ttggcaggtcataagctcggcgtcttcaccgacatcggtctggaaactttcctcgatccc480
cgtcagctcggcggcaagctcaatgacgtaaccaaagaagacctcgtcaaactgatcgaa540
gtcgatggtcatgaacagcttttctacccgaccttcccggtcaacgtagctttcctccgc600
ggtacgtatgctgatgaatccggcaatatcaccatggacgaagaaatcgggcctttcgaa660
agcacttccgtagcccaggccgttcacaactgtggcggtaaagtcgtcgtccaggtcaaa720
gacgtcgtcgctcacggcagcctcgacccgcgcatggtcaagatccctggcatctatgtc780
gactacgtcgtcgtagcagctccggaagaccatcagcagacgtatgactgcgaatacgat840
ccgtccctcagcggtgaacatcgtgctcctgaaggcgctaccgatgcagctctccccatg900
agcgctaagaaaatcatcggccgccgcggcgctttggaattgactgaaaacgctgtcgtc960
aacctcggcgtcggtgctccggaatacgttgcttctgttgccggtgaagaaggtatcgcc1020
gataccattaccctgaccgtcgaaggtggcgccatcggtggcgtaccgcagggcggtgcc1080
cgcttcggttcgtcccgcaatgccgatgccatcatcgaccacacctatcagttcgacttc1140
tacgatggcggcggtctggacatcgcttacctcggcctggcccagtgcgatggctcgggc1200
aacatcaacgtcagcaagttcggtactaacgttgccggctgcggcggtttccccaacatt1260
tcccagcagacaccgaatgtttacttctgcggcaccttcacggctggcggcttgaaaatc1320
gctgtcgaagacggcaaagtcaagatcctccaggaaggcaaagccaagaagttcatcaaa1380
gctgtcgaccagatcactttcaacggttcctatgcagcccgcaacggcaaacacgttctc1440
tacatcacagaacgctgcgtatttgaactgaccaaagaaggcttgaaactcatcgaagtc1500
gcaccgggcatcgatattgaaaaagatatcctcgctcacatggacttcaagccgatcatt1560
gataatccgaaactcatggatgcccgcctcttccaggacggtcccatgggactgaaaaaa1620
taagaatccaa1631
<210>6
<211>1424
<212>dna
<213>人工序列
<220>
<223>
<400>6
atgaccattactccggcaactcatgcaatttcgataaatcctgccacgggtgaacaactt60
gtgtaggctggagctgcttcgaagttcctatactttctagagaataggaacttcggaata120
ggaacttcaagatccccttattagaagaactcgtcaagaaggcgatagaaggcgatgcgc180
tgcgaatcgggagcggcgataccgtaaagcacgaggaagcggtcagcccattcgccgcca240
agctcttcagcaatatcacgggtagccaacgctatgtcctgatagcggtccgccacaccc300
agccggccacagtcgatgaatccagaaaagcggccattttccaccatgatattcggcaag360
caggcatcgccatgggtcacgacgagatcctcgccgtcgggcatgcgcgccttgagcctg420
gcgaacagttcggctggcgcgagcccctgatgctcttcgtccagatcatcctgatcgaca480
agaccggcttccatccgagtacgtgctcgctcgatgcgatgtttcgcttggtggtcgaat540
gggcaggtagccggatcaagcgtatgcagccgccgcattgcatcagccatgatggatact600
ttctcggcaggagcaaggtgagatgacaggagatcctgccccggcacttcgcccaatagc660
agccagtcccttcccgcttcagtgacaacgtcgagcacagctgcgcaaggaacgcccgtc720
gtggccagccacgatagccgcgctgcctcgtcctgcagttcattcagggcaccggacagg780
tcggtcttgacaaaaagaaccgggcgcccctgcgctgacagccggaacacggcggcatca840
gagcagccgattgtctgttgtgcccagtcatagccgaatagcctctccacccaagcggcc900
ggagaacctgcgtgcaatccatcttgttcaatcatgcgaaacgatcctcatcctgtctct960
tgatcagatcttgatcccctgcgccatcagatccttggcggcaagaaagccatccagttt1020
actttgcagggcttcccaaccttaccagagggcgccccagctggcaattccggttcgctt1080
gctgtccataaaaccgcccagtctagctatcgccatgtaagcccactgcaagctacctgc1140
tttctctttgcgcttgcgttttcccttgtccagatagcccagtagctgacattcatccgg1200
ggtcagcaccgtttctgcggactggctttctacgtgttccgcttcctttagcagcccttg1260
cgccctgagtgcttgcggcagcgtgagcttcaaaagcgctctgaagttcctatactttct1320
agagaataggaacttcgaactgcaggtcgacggatccccggaatatcatcaggtggagaa1380
aaccctggcgcagggtgcgcgtttgttactgggcggggaaaaga1424
<210>7
<211>1424
<212>dna
<213>人工序列
<220>
<223>
<400>7
atgaaacttaacgacagtaacttattccgccagcaggcgttgattaacggggaatggctg60
gtgtaggctggagctgcttcgaagttcctatactttctagagaataggaacttcggaata120
ggaacttcaagatccccttattagaagaactcgtcaagaaggcgatagaaggcgatgcgc180
tgcgaatcgggagcggcgataccgtaaagcacgaggaagcggtcagcccattcgccgcca240
agctcttcagcaatatcacgggtagccaacgctatgtcctgatagcggtccgccacaccc300
agccggccacagtcgatgaatccagaaaagcggccattttccaccatgatattcggcaag360
caggcatcgccatgggtcacgacgagatcctcgccgtcgggcatgcgcgccttgagcctg420
gcgaacagttcggctggcgcgagcccctgatgctcttcgtccagatcatcctgatcgaca480
agaccggcttccatccgagtacgtgctcgctcgatgcgatgtttcgcttggtggtcgaat540
gggcaggtagccggatcaagcgtatgcagccgccgcattgcatcagccatgatggatact600
ttctcggcaggagcaaggtgagatgacaggagatcctgccccggcacttcgcccaatagc660
agccagtcccttcccgcttcagtgacaacgtcgagcacagctgcgcaaggaacgcccgtc720
gtggccagccacgatagccgcgctgcctcgtcctgcagttcattcagggcaccggacagg780
tcggtcttgacaaaaagaaccgggcgcccctgcgctgacagccggaacacggcggcatca840
gagcagccgattgtctgttgtgcccagtcatagccgaatagcctctccacccaagcggcc900
ggagaacctgcgtgcaatccatcttgttcaatcatgcgaaacgatcctcatcctgtctct960
tgatcagatcttgatcccctgcgccatcagatccttggcggcaagaaagccatccagttt1020
actttgcagggcttcccaaccttaccagagggcgccccagctggcaattccggttcgctt1080
gctgtccataaaaccgcccagtctagctatcgccatgtaagcccactgcaagctacctgc1140
tttctctttgcgcttgcgttttcccttgtccagatagcccagtagctgacattcatccgg1200
ggtcagcaccgtttctgcggactggctttctacgtgttccgcttcctttagcagcccttg1260
cgccctgagtgcttgcggcagcgtgagcttcaaaagcgctctgaagttcctatactttct1320
agagaataggaacttcgaactgcaggtcgacggatccccggaattaacggcgtcaccatc1380
gggccgctgatcgatgaaaaagcggtagcaaaagtggaagagca1424
<210>8
<211>400
<212>prt
<213>人工序列
<220>
<223>
<400>8
metserserlysleuvalleuvalleuasncysglyserserserleu
151015
lysphealaileileaspalavalasnglygluglutyrleusergly
202530
leualaglucysphehisleuproglualaargilelystrplysmet
354045
aspglyasnlysglnglualaalaleuglyalaglyalaalahisser
505560
glualaleuasnpheilevalasnthrileleualaglnlysproglu
65707580
leuseralaglnleuthralaileglyhisargilevalhisglygly
859095
glulystyrthrserservalvalileaspgluservalileglngly
100105110
ilelysaspalaalaserphealaproleuhisasnproalahisleu
115120125
ileglyilegluglualaleulysserpheproglnleulysasplys
130135140
asnvalalavalpheaspthralaphehisglnthrmetprogluglu
145150155160
sertyrleutyralaleuprotyrasnleutyrlysgluhisglyile
165170175
argargtyrglyalahisglythrserhisphetyrvalthrglnglu
180185190
alaalalysmetleuasnlysprovalglugluleuasnileilethr
195200205
cyshisleuglyasnglyglyservalseralaileargasnglylys
210215220
cysvalaspthrsermetglyleuthrproleugluglyleuvalmet
225230235240
glythrargserglyaspileaspproalaileilephehisleuhis
245250255
aspthrleuglymetservalaspalaileasnlysleuleuthrlys
260265270
gluserglyleuleuglyleuthrgluvalthrseraspcysargtyr
275280285
valgluaspasntyralathrlysgluaspalalysargalametasp
290295300
valtyrcyshisargleualalystyrileglyalatyrthralaleu
305310315320
metaspglyargleuaspalavalvalphethrglyglyileglyglu
325330335
asnalaalametvalarggluleuserleuglylysleuglyvalleu
340345350
glyphegluvalasphisgluargasnleualaalaargpheglylys
355360365
serglypheileasnlysgluglythrargproalavalvalilepro
370375380
thrasnglugluleuvalilealaglnaspalaserargleuthrala
385390395400
<210>9
<211>714
<212>prt
<213>人工序列
<220>
<223>
<400>9
metserargileilemetleuileprothrglythrservalglyleu
151015
thrservalserleuglyvalileargalametgluarglysglyval
202530
argleuservalphelysproilealaglnproargthrglyglyasp
354045
alaproaspglnthrthrthrilevalargalaasnserserthrthr
505560
thralaalagluproleulysmetsertyrvalgluglyleuleuser
65707580
serasnglnlysaspvalleumetglugluilevalalaasntyrhis
859095
alaasnthrlysaspalagluvalvalleuvalgluglyleuvalpro
100105110
thrarglyshisglnphealaglnserleuasntyrgluilealalys
115120125
thrleuasnalagluilevalphevalmetserglnglythraspthr
130135140
progluglnleulysgluargilegluleuthrargasnserphegly
145150155160
glyalalysasnthrasnilethrglyvalilevalasnlysleuasn
165170175
alaprovalaspgluglnglyargthrargproaspleusergluile
180185190
pheaspaspserserlysalalysvalasnasnvalaspproalalys
195200205
leuglngluserserproleuprovalleuglyalavalprotrpser
210215220
pheaspleuilealathrargalaileaspmetalaarghisleuasn
225230235240
alathrileileasngluglyaspileasnthrargargvallysser
245250255
valthrphecysalaargserileprohismetleugluhisphearg
260265270
alaglyserleuleuvalthrseralaaspargproaspvalleuval
275280285
alaalacysleualaalametasnglyvalgluileglyalaleuleu
290295300
leuthrglyglytyrglumetaspalaargileserlysleucysglu
305310315320
argalaphealathrglyleuprovalphemetvalasnthrasnthr
325330335
trpglnthrserleuserleuglnserpheasnleugluvalproval
340345350
aspasphisgluargileglulysvalglnglutyrvalalaasntyr
355360365
ileasnalaasptrpilegluserleuthralathrsergluargser
370375380
argargleuserproproalapheargtyrglnleuthrgluleuala
385390395400
arglysalaglylysargilevalleuprogluglyaspgluproarg
405410415
thrvallysalaalaalailecysalagluargglyilealathrcys
420425430
valleuleuglyasnproalagluileasnargvalalaalasergln
435440445
glyvalgluleuglyalaglyilegluilevalaspprogluvalval
450455460
argglusertyrvalglyargleuvalgluleuarglysasnlysgly
465470475480
metthrgluthrvalalaarggluglnleugluaspasnvalvalleu
485490495
glythrleumetleugluglnaspgluvalaspglyleuvalsergly
500505510
alavalhisthrthralaasnthrileargproproleuglnleuile
515520525
lysthralaproglyserserleuvalserservalphephemetleu
530535540
leuprogluglnvaltyrvaltyrglyaspcysalaileasnproasp
545550555560
prothralagluglnleualagluilealaileglnseralaaspser
565570575
alaalaalapheglyilegluproargvalalametleusertyrser
580585590
thrglythrserglyalaglyseraspvalglulysvalarggluala
595600605
thrargleualaglnglulysargproaspleumetileaspglypro
610615620
leuglntyraspalaalavalmetalaaspvalalalysserlysala
625630635640
proasnserprovalalaglyargalathrvalpheilepheproasp
645650655
leuasnthrglyasnthrthrtyrlysalavalglnargseralaasp
660665670
leuileserileglyprometleuglnglymetarglysprovalasn
675680685
aspleuserargglyalaleuvalaspaspilevaltyrthrileala
690695700
leuthralaileglnseralaglnglngln
705710
<210>10
<211>589
<212>prt
<213>人工序列
<220>
<223>
<400>10
metalathrglylysglyalaalaalaserthrglngluglylysser
151015
glnprophelysvalthrproglypropheaspproalathrtrpleu
202530
glutrpserargglntrpglnglythrgluglyasnglyhisalaala
354045
alaserglyileproglyleuaspalaleualaglyvallysileala
505560
proalaglnleuglyaspileglnglnargtyrmetlysasppheser
65707580
alaleutrpglnalametalagluglylysalaglualathrglypro
859095
leuhisaspargargphealaglyaspalatrpargthrasnleupro
100105110
tyrargphealaalaalaphetyrleuleuasnalaargalaleuthr
115120125
gluleualaaspalavalglualaaspalalysthrargglnargile
130135140
argphealaileserglntrpvalaspalametserproalaasnphe
145150155160
leualathrasnproglualaglnargleuleuilegluserglygly
165170175
gluserleuargalaglyvalargasnmetmetgluaspleuthrarg
180185190
glylysileserglnthraspgluseralaphegluvalglyargasn
195200205
valalavalthrgluglyalavalvalphegluasnglutyrphegln
210215220
leuleuglntyrlysproleuthrasplysvalhisalaargproleu
225230235240
leumetvalproprocysileasnlystyrtyrileleuaspleugln
245250255
progluserserleuvalarghisvalvalgluglnglyhisthrval
260265270
pheleuvalsertrpargasnproaspalasermetalaglyserthr
275280285
trpaspasptyrilegluhisalaalaileargalailegluvalala
290295300
argaspileserglyglnasplysileasnvalleuglyphecysval
305310315320
glyglythrilevalserthralaleualavalleualaalaarggly
325330335
gluhisproalaalaservalthrleuleuthrthrleuleuaspphe
340345350
alaaspthrglyileleuaspvalphevalaspgluglyhisvalgln
355360365
leuargglualathrleuglyglyglyalaglyalaprocysalaleu
370375380
leuargglyleugluleualaasnthrpheserpheleuargproasn
385390395400
aspleuvaltrpasntyrvalvalaspasntyrleulysglyasnthr
405410415
provalpropheaspleuleuphetrpasnglyaspalathrasnleu
420425430
proglyprotrptyrcystrptyrleuarghisthrtyrleuglnasn
435440445
gluleulysvalproglylysleuthrvalcysglyvalprovalasp
450455460
leualaserileaspvalprothrtyriletyrglyserarggluasp
465470475480
hisilevalprotrpthralaalatyralaserthralaleuleuala
485490495
asnlysleuargphevalleuglyalaserglyhisilealaglyval
500505510
ileasnproproalalysasnlysargserhistrpthrasnaspala
515520525
leuprogluserproglnglntrpleualaglyalailegluhishis
530535540
glysertrptrpproasptrpthralatrpleualaglyglnalagly
545550555560
alalysargalaalaproalaasntyrglyasnalaargtyrargala
565570575
ilegluproalaproglyargtyrvallysalalysala
580585
<210>11
<211>393
<212>prt
<213>人工序列
<220>
<223>
<400>11
metthraspvalvalilevalseralaalaargthralavalglylys
151015
pheglyglyserleualalysileproalaprogluleuglyalaval
202530
valilelysalaalaleugluargalaglyvallysprogluglnval
354045
sergluvalilemetglyglnvalleuthralaglyserglyglnasn
505560
proalaargglnalaalailelysalaglyleuproalametvalpro
65707580
alametthrileasnlysvalcysglyserglyleulysalavalmet
859095
leualaalaasnalailemetalaglyaspalagluilevalvalala
100105110
glyglyglngluasnmetseralaalaprohisvalleuproglyser
115120125
argaspglypheargmetglyaspalalysleuvalaspthrmetile
130135140
valaspglyleutrpaspvaltyrasnglntyrhismetglyilethr
145150155160
alagluasnvalalalysglutyrglyilethrargglualaglnasp
165170175
gluphealavalglyserglnasnlysalaglualaalaglnlysala
180185190
glylyspheaspglugluilevalprovalleuileproglnarglys
195200205
glyaspprovalalaphelysthraspgluphevalargglnglyala
210215220
thrleuaspsermetserglyleulysproalapheasplysalagly
225230235240
thrvalthralaalaasnalaserglyleuasnaspglyalaalaala
245250255
valvalvalmetseralaalalysalalysgluleuglyleuthrpro
260265270
leualathrilelyssertyralaasnalaglyvalaspprolysval
275280285
metglymetglyprovalproalaserlysargalaleuserargala
290295300
glutrpthrproglnaspleuaspleumetgluileasnglualaphe
305310315320
alaalaglnalaleualavalhisglnglnmetglytrpaspthrser
325330335
lysvalasnvalasnglyglyalailealaileglyhisproilegly
340345350
alaserglycysargileleuvalthrleuleuhisglumetlysarg
355360365
argaspalalyslysglyleualaserleucysileglyglyglymet
370375380
glyvalalaleualavalgluarglys
385390
<210>12
<211>246
<212>prt
<213>人工序列
<220>
<223>
<400>12
metthrglnargilealatyrvalthrglyglymetglyglyilegly
151015
thralailecysglnargleualalysaspglypheargvalvalala
202530
glycysglyproasnserproargargglulystrpleugluglngln
354045
lysalaleuglypheasppheilealasergluglyasnvalalaasp
505560
trpaspserthrlysthralapheasplysvallyssergluvalgly
65707580
gluvalaspvalleuileasnasnalaglyilethrargaspvalval
859095
phearglysmetthrargalaasptrpaspalavalileaspthrasn
100105110
leuthrserleupheasnvalthrlysglnvalileaspglymetala
115120125
aspargglytrpglyargilevalasnileserservalasnglygln
130135140
lysglyglnpheglyglnthrasntyrserthralalysalaglyleu
145150155160
hisglyphethrmetalaleualaglngluvalalathrlysglyval
165170175
thrvalasnthrvalserproglytyrilealathraspmetvallys
180185190
alaileargglnaspvalleuasplysilevalalathrileproval
195200205
lysargleuglyleuproglugluilealaserilecysalatrpleu
210215220
serserglugluserglypheserthrglyalaasppheserleuasn
225230235240
glyglyleuhismetgly
245
<210>13
<211>453
<212>prt
<213>人工序列
<220>
<223>
<400>13
metserasngluvalserilelysgluleuileglulysalalysval
151015
alaglnlyslysleuglualatyrserglngluglnvalaspvalleu
202530
vallysalaleuglylysvalvaltyraspasnalaglumetpheala
354045
lysglualavalglugluthrglumetglyvaltyrgluasplysval
505560
alalyscyshisleulysserglyalailetrpasnhisilelysasp
65707580
lyslysthrvalglyileilelysglugluprogluargalaleuval
859095
tyrvalalalysprolysglyvalvalalaalathrthrproilethr
100105110
asnprovalvalthrprometcysasnalametalaalailelysgly
115120125
argasnthrileilevalalaprohisprolysalalyslysvalser
130135140
alahisthrvalgluleumetasnalagluleulyslysleuglyala
145150155160
progluasnileileglnilevalglualaproserargglualaala
165170175
lysgluleumetgluseralaaspvalvalilealathrglyglyala
180185190
glyargvallysalaalatyrserserglyargproalatyrglyval
195200205
glyproglyasnserglnvalilevalasplysglytyrasptyrasn
210215220
lysalaalaglnaspileilethrglyarglystyraspasnglyile
225230235240
ilecyssersergluglnservalilealaproalagluasptyrasp
245250255
lysvalilealaalaphevalgluasnglyalaphetyrvalgluasp
260265270
glugluthrvalglulyspheargserthrleuphelysaspglylys
275280285
ileasnserlysileileglylysservalglnileilealaaspleu
290295300
alaglyvallysvalprogluglythrlysvalilevalleulysgly
305310315320
lysglyalaglyglulysaspvalleucyslysglulysmetcyspro
325330335
valleuvalalaleulystyraspthrphegluglualavalgluile
340345350
alametalaasntyrmettyrgluglyalaglyhisthralaglyile
355360365
hisseraspasnaspgluasnileargtyralaglythrvalleupro
370375380
ileserargleuvalvalasnglnproalathrthralaglyglyser
385390395400
pheasnasnglypheasnprothrthrthrleuglycysglysertrp
405410415
glyargasnserilesergluasnleuthrtyrgluhisleuileasn
420425430
valserargileglytyrpheasnlysglualalysvalprosertyr
435440445
glugluiletrpgly
450
<210>14
<211>371
<212>prt
<213>人工序列
<220>
<223>
<400>14
metlysleuleulysleualaproaspvaltyrlyspheaspthrala
151015
glugluphemetlystyrphelysvalglylysglyasppheileleu
202530
thrasnglupheleutyrlyspropheleuglulyspheasnaspgly
354045
alaaspalavalpheglnglulystyrglyleuglygluproserasp
505560
glumetileasnasnileilelysaspileglyasplysglntyrasn
65707580
argileilealavalglyglyglyservalileaspilealalysile
859095
leuserleulystyrthraspaspserleuaspleuphegluglylys
100105110
valproleuvallysasnlysgluleuileilevalprothrthrcys
115120125
glythrglysergluvalthrasnvalservalalagluleulysarg
130135140
arghisthrlyslysglyilealaseraspgluleutyralathrtyr
145150155160
alavalleuvalproglupheilelysglyleuprotyrlysphephe
165170175
valthrserservalaspalaleuilehisalathrglualatyrval
180185190
serproasnalaasnprotyrthraspmetpheservallysalamet
195200205
gluleuileleuasnglytyrmetglnmetvalglulysglyasnasp
210215220
tyrargvalgluileilegluaspphevalileglyserasntyrala
225230235240
glyilealapheglyasnalaglyvalglyalavalhisalaleuser
245250255
tyrproileglyglyasntyrhisvalprohisglyglualaasntyr
260265270
leuphephethrgluilephelysthrtyrtyrglulysasnproasn
275280285
glylysilelysaspvalasnlysleuleualaglyileleulyscys
290295300
aspgluserglualatyraspserleuserglnleuleuasplysleu
305310315320
leuserarglysproleuargglutyrglymetlysgluglugluile
325330335
gluthrphealaaspservalilegluglyglnglnargleuleuval
340345350
asnasntyrglupropheserarggluaspilevalasnthrtyrlys
355360365
lysleutyr
370
<210>15
<211>429
<212>prt
<213>人工序列
<220>
<223>
<400>15
metglutrpglugluiletyrlysglulysleuvalthralaglulys
151015
alavalserlysilegluasnhisserargvalvalphealahisala
202530
valglygluprovalaspleuvalasnalaleuvallysasnlysasp
354045
asntyrileglyleugluilevalhismetvalalametglylysgly
505560
glutyrthrlysgluglymetglnarghisphearghisasnalaleu
65707580
phevalglyglycysthrargaspalavalasnserglyargalaasp
859095
tyrthrprocysphephetyrgluvalproserleuphelysglulys
100105110
argleuprovalaspvalalaleuileglnvalsergluproasplys
115120125
tyrglytyrcysserpheglyvalserasnasptyrthrlysproala
130135140
alagluseralalysleuvalilealagluvalasnlysasnmetpro
145150155160
argthrleuglyaspserpheilehisvalseraspileasptyrile
165170175
valglualaserhisproleuleugluleuglnproprolysleugly
180185190
aspvalglulysalaileglygluasncysalaserleuilegluasp
195200205
glyalathrleuglnleuglyileglyalaileproaspalavalleu
210215220
leupheleulysasnlyslysasnleuglyilehisserglumetile
225230235240
seraspglyvalmetgluleuvallysalaglyvalileasnasnlys
245250255
lyslysthrleuhisproglylysilevalvalthrpheleumetgly
260265270
thrlyslysleutyraspphevalasnasnasnprometvalgluthr
275280285
tyrservalasptyrvalasnasnproleuvalilemetlysasnasp
290295300
asnmetvalserileasnsercysvalglnvalaspleumetglygln
305310315320
valcyssergluserileglyleulysglnileserglyvalglygly
325330335
glnvalasppheileargglyalaasnleuserlysglyglylysala
340345350
ileilealaileproserthralaglylysglylysvalserargile
355360365
thrproleuleuaspthrglyalaalavalthrthrserargasnglu
370375380
valasptyrvalvalthrglutyrglyvalalahisleulysglylys
385390395400
thrleuargasnargalaargalaleuileasnilealahisprolys
405410415
phearggluserleumetasngluphelyslysargphe
420425
<210>16
<211>517
<212>prt
<213>人工序列
<220>
<223>
<400>16
metarglysvalgluileilethralagluglnalaalaglnleuval
151015
lysaspasnaspthrilethrserileglyphevalserseralahis
202530
proglualaleuthrlysalaleuglulysargpheleuaspthrasn
354045
thrproglnasnleuthrtyriletyralaglyserglnglylysarg
505560
aspglyargalaalagluhisleualahisthrglyleuleulysarg
65707580
alaileileglyhistrpglnthrvalproalaileglylysleuala
859095
valgluasnlysileglualatyrasnpheserglnglythrleuval
100105110
histrppheargalaleualaglyhislysleuglyvalphethrasp
115120125
ileglyleugluthrpheleuaspproargglnleuglyglylysleu
130135140
asnaspvalthrlysgluaspleuvallysleuilegluvalaspgly
145150155160
hisgluglnleuphetyrprothrpheprovalasnvalalapheleu
165170175
argglythrtyralaaspgluserglyasnilethrmetaspgluglu
180185190
ileglyprophegluserthrservalalaglnalavalhisasncys
195200205
glyglylysvalvalvalglnvallysaspvalvalalahisglyser
210215220
leuaspproargmetvallysileproglyiletyrvalasptyrval
225230235240
valvalalaalaprogluasphisglnglnthrtyraspcysglutyr
245250255
aspproserleuserglygluhisargalaprogluglyalathrasp
260265270
alaalaleuprometseralalyslysileileglyargargglyala
275280285
leugluleuthrgluasnalavalvalasnleuglyvalglyalapro
290295300
glutyrvalalaservalalaglyglugluglyilealaaspthrile
305310315320
thrleuthrvalgluglyglyalaileglyglyvalproglnglygly
325330335
alaargpheglyserserargasnalaaspalaileileasphisthr
340345350
tyrglnpheaspphetyraspglyglyglyleuaspilealatyrleu
355360365
glyleualaglncysaspglyserglyasnileasnvalserlysphe
370375380
glythrasnvalalaglycysglyglypheproasnileserglngln
385390395400
thrproasnvaltyrphecysglythrphethralaglyglyleulys
405410415
ilealavalgluaspglylysvallysileleuglngluglylysala
420425430
lyslyspheilelysalavalaspglnilethrpheasnglysertyr
435440445
alaalaargasnglylyshisvalleutyrilethrgluargcysval
450455460
phegluleuthrlysgluglyleulysleuilegluvalalaprogly
465470475480
ileaspileglulysaspileleualahismetaspphelysproile
485490495
ileaspasnprolysleumetaspalaargleupheglnaspglypro
500505510
metglyleulyslys
515
<210>17
<211>462
<212>prt
<213>人工序列
<220>
<223>
<400>17
metthrilethrproalathrhisalaileserileasnproalathr
151015
glygluglnleuservalleuprotrpalaglyalaaspaspileglu
202530
asnalaleuglnleualaalaalaglypheargasptrparggluthr
354045
asnileasptyrargalaglulysleuargaspileglylysalaleu
505560
argalaargsergluglumetalaglnmetilethrargglumetgly
65707580
lysproileasnglnalaargalagluvalalalysseralaasnleu
859095
cysasptrptyralagluhisglyproalametleulysalaglupro
100105110
thrleuvalgluasnglnglnalavalileglutyrargproleugly
115120125
thrileleualailemetprotrpasnpheproleutrpglnvalmet
130135140
argglyalavalproileileleualaglyasnglytyrleuleulys
145150155160
hisalaproasnvalmetglycysalaglnleuilealaglnvalphe
165170175
lysaspalaglyileproglnglyvaltyrglytrpleuasnalaasp
180185190
asnaspglyvalserglnmetilelysaspserargilealaalaval
195200205
thrvalthrglyservalargalaglyalaalaileglyalaglnala
210215220
glyalaalaleulyslyscysvalleugluleuglyglyserasppro
225230235240
pheilevalleuasnaspalaaspleugluleualavallysalaala
245250255
valalaglyargtyrglnasnthrglyglnvalcysalaalaalalys
260265270
argpheileileglugluglyilealaseralaphethrgluargphe
275280285
valalaalaalaalaalaleulysmetglyaspproargaspgluglu
290295300
asnalaleuglyprometalaargpheaspleuargaspgluleuhis
305310315320
hisglnvalglulysthrleualaglnglyalaargleuleuleugly
325330335
glyglulysmetalaglyalaglyasntyrtyrproprothrvalleu
340345350
alaasnvalthrproglumetthralaphearggluglumetphegly
355360365
provalalaalailethrilealalysaspalagluhisalaleuglu
370375380
leualaasnaspserglupheglyleuseralathrilephethrthr
385390395400
aspgluthrglnalaargglnmetalaalaargleuglucysglygly
405410415
valpheileasnglytyrcysalaseraspalaargvalalaphegly
420425430
glyvallyslysserglypheglyarggluleuserhispheglyleu
435440445
hisgluphecysasnileglnthrvaltrplysaspargile
450455460
<210>18
<211>1389
<212>dna
<213>人工序列
<220>
<223>
<400>18
atgaccattactccggcaactcatgcaatttcgataaatcctgccacgggtgaacaactt60
tctgtgctgccgtgggctggcgctgacgatatcgaaaacgcacttcagctggcggcagca120
ggctttcgcgactggcgcgagacaaatatagattatcgtgctgaaaaactgcgtgatatc180
ggtaaggctctgcgcgctcgtagcgaagaaatggcgcaaatgatcacccgcgaaatgggc240
aaaccaatcaaccaggcgcgcgctgaagtggcgaaatcggcgaatttgtgtgactggtat300
gcagaacatggtccggcaatgctgaaggcggaacctacgctggtggaaaatcagcaggcg360
gttattgagtatcgaccgttggggacgattctggcgattatgccgtggaattttccgtta420
tggcaggtgatgcgtggcgctgttcccatcattcttgcaggtaacggctacttacttaaa480
catgcgccgaatgtgatgggctgtgcacagctcattgcccaggtgtttaaagatgcgggt540
atcccacaaggcgtatatggctggctgaatgccgacaacgacggtgtcagtcagatgatt600
aaagactcgcgcattgctgctgtcacggtgaccggaagtgttcgtgcgggagcggctatt660
ggcgcacaggctggagcggcactgaaaaaatgcgtactggaactgggcggttcggatccg720
tttattgtgcttaacgatgccgatctggaactggcggtgaaagcggcggtagccggacgt780
tatcagaataccggacaggtatgtgcagcggcaaaacgctttattatcgaagagggaatt840
gcttcggcatttaccgaacgttttgtggcagctgcggcagccttgaaaatgggcgatccc900
cgtgacgaagagaacgctctcggaccaatggctcgttttgatttacgtgatgagctgcat960
catcaggtggagaaaaccctggcgcagggtgcgcgtttgttactgggcggggaaaagatg1020
gctggggcaggtaactactatccgccaacggttctggcgaatgttaccccagaaatgacc1080
gcgtttcgggaagaaatgtttggccccgttgcggcaatcaccattgcgaaagatgcagaa1140
catgcactggaactggctaatgatagtgagttcggcctttcagcgaccatttttaccact1200
gacgaaacacaggccagacagatggcggcacgtctggaatgcggtggggtgtttatcaat1260
ggttattgtgccagcgacgcgcgagtggcctttggtggcgtgaaaaagagtggctttggt1320
cgtgagctttcccatttcggcttacacgaattctgtaatatccagacggtgtggaaagac1380
cggatctga1389
<210>19
<211>482
<212>prt
<213>人工序列
<220>
<223>
<400>19
metlysleuasnaspserasnleupheargglnglnalaleuileasn
151015
glyglutrpleuaspalaasnasnglyglualaileaspvalthrasn
202530
proalaasnglyasplysleuglyservalprolysmetglyalaasp
354045
gluthrargalaalaileaspalaalaasnargalaleuproalatrp
505560
argalaleuthralalysgluargalathrileleuargasntrpphe
65707580
asnleumetmetgluhisglnaspaspleualaargleumetthrleu
859095
gluglnglylysproleualaglualalysglygluilesertyrala
100105110
alaserpheileglutrpphealaglugluglylysargiletyrgly
115120125
aspthrileproglyhisglnalaasplysargleuilevalilelys
130135140
glnproileglyvalthralaalailethrprotrpasnpheproala
145150155160
alametilethrarglysalaglyproalaleualaalaglycysthr
165170175
metvalleulysproalaserglnthrpropheseralaleualaleu
180185190
alagluleualaileargalaglyvalproalaglyvalpheasnval
195200205
valthrglyseralaglyalavalglyasngluleuthrserasnpro
210215220
leuvalarglysleuserphethrglyserthrgluileglyarggln
225230235240
leumetgluglncysalalysaspilelyslysvalserleugluleu
245250255
glyglyasnalapropheilevalpheaspaspalaaspleuasplys
260265270
alavalgluglyalaleualaserlyspheargasnalaglyglnthr
275280285
cysvalcysalaasnargleutyrvalglnaspglyvaltyrasparg
290295300
phealaglulysleuglnglnalavalserlysleuhisileglyasp
305310315320
glyleuaspasnglyvalthrileglyproleuileaspglulysala
325330335
valalalysvalglugluhisilealaaspalaleuglulysglyala
340345350
argvalvalcysglyglylysalahisgluargglyglyasnphephe
355360365
glnprothrileleuvalaspvalproalaasnalalysvalserlys
370375380
glugluthrpheglyproleualaproleupheargphelysaspglu
385390395400
alaaspvalilealaglnalaasnaspthrglupheglyleualaala
405410415
tyrphetyralaargaspleuserargvalpheargvalglygluala
420425430
leuglutyrglyilevalglyileasnthrglyileileserasnglu
435440445
valalapropheglyglyilelysalaserglyleuglyargglugly
450455460
serlystyrglyilegluasptyrleugluilelystyrmetcysile
465470475480
glyleu
<210>20
<211>1449
<212>dna
<213>人工序列
<220>
<223>
<400>20
atgaaacttaacgacagtaacttattccgccagcaggcgttgattaacggggaatggctg60
gacgccaacaatggtgaagccatcgacgtcaccaatccggcgaacggcgacaagctgggt120
agcgtgccgaaaatgggcgcggatgaaacccgcgccgctatcgacgccgccaaccgcgcc180
ctgcccgcctggcgcgcgctcaccgccaaagaacgcgccaccattctgcgcaactggttc240
aatttgatgatggagcatcaggacgatttagcgcgcctgatgaccctcgaacagggtaaa300
ccactggccgaagcgaaaggcgaaatcagctacgccgcctcctttattgagtggtttgcc360
gaagaaggcaaacgcatttatggcgacaccattcctggtcatcaggccgataaacgcctg420
attgttatcaagcagccgattggcgtcaccgcggctatcacgccgtggaacttcccggcg480
gcgatgattacccgcaaagccggtccggcgctggcagcaggctgcaccatggtgctgaag540
cccgccagtcagacgccgttctctgcgctggcgctggcggagctggcgatccgcgcgggc600
gttccggctggggtatttaacgtggtcaccggttcggcgggcgcggtcggtaacgaactg660
accagtaacccgctggtgcgcaaactgtcgtttaccggttcgaccgaaattggccgccag720
ttaatggaacagtgcgcgaaagacatcaagaaagtgtcgctggagctgggcggtaacgcg780
ccgtttatcgtctttgacgatgccgacctcgacaaagccgtggaaggcgcgctggcctcg840
aaattccgcaacgccgggcaaacctgcgtctgcgccaaccgcctgtatgtgcaggacggc900
gtgtatgaccgttttgccgaaaaattgcagcaggcagtgagcaaactgcacatcggcgac960
gggctggataacggcgtcaccatcgggccgctgatcgatgaaaaagcggtagcaaaagtg1020
gaagagcatattgccgatgcgctggagaaaggcgcgcgcgtggtttgcggcggtaaagcg1080
cacgaacgcggcggcaacttcttccagccgaccattctggtggacgttccggccaacgcc1140
aaagtgtcgaaagaagagacgttcggccccctcgccccgctgttccgctttaaagatgaa1200
gctgatgtgattgcgcaagccaatgacaccgagtttggccttgccgcctatttctacgcc1260
cgtgatttaagccgcgtcttccgcgtgggcgaagcgctggagtacggcatcgtcggcatc1320
aataccggcattatttccaatgaagtggccccgttcggcggcatcaaagcctcgggtctg1380
ggtcgtgaaggttcgaagtatggcatcgaagattacttagaaatcaaatatatgtgcatc1440
ggtctttaa1449