本发明涉及基因工程领域,具体涉及一种产n-乙酰-5-羟色胺的重组大肠杆菌及其构建方法和应用。
背景技术:
n-乙酰-5-羟色胺(n-acetyl-serotonin,c12h14n2o2)属于色氨酸的衍生物,是褪黑素合成的前体,其合成途径广泛存在于自然界生物中,细胞内经典的合成途径为:色氨酸—5-羟色氨酸—5-羟色胺—n-乙酰-5-羟色胺。n-乙酰-5-羟色胺在生物体内发挥着许多重要作用,作为褪黑素前体,n-乙酰-5-羟色胺也具有良好的抗氧化能力,如可以有效地防护紫外光可能引起的光致癌及dna损伤,同时n-乙酰-5-羟色胺对脑损伤/中风/神经损伤恢复中发挥重要作用,具有神经保护剂的功能。
目前为止,n-乙酰-5-羟色胺生产是由化学合成完成的,其合成步骤繁琐、得率较低、手性不唯一,不可避免地产生原料浪费和化学污染。随着合成生物学的发展,越来越多的化合物实现了生物绿色生产,通过推测化合物在原宿主中的可能合成路线,鉴定出涉及的基因,解析出目标化合物的合成途径,在生产菌株中通过分子生物学技术引入相关基因重现合成途径,从廉价的原料如葡萄糖催化出高附加值的目标产物。虽然,色氨酸衍生物的合成途径解析的非常清楚,但其中涉及的蛋白本身比活较低,多数难以在现有的成熟表达系统中表达,基本形成包涵体或表达量极低,因此,目前为止还有没有高产n-乙酰-5-羟色胺的工程菌株。
技术实现要素:
本发明所要解决的技术问题为提供n-乙酰-5-羟色胺高产菌株,以实现发酵法高效大规模工业化生产n-乙酰-5-羟色胺。
为解决上述技术问题,本发明首先提供了一种重组大肠杆菌。
本发明所述重组大肠杆菌与受体大肠杆菌相比,所述重组大肠杆菌中色氨酸衍生物合成相关蛋白的基因的表达量增加和/或所述色氨酸衍生物合成相关蛋白的含量增加和/或所述色氨酸衍生物合成相关蛋白的活性增加;
所述色氨酸衍生物合成相关蛋白选自如下至少一种:
p1)苯丙氨酸羟化酶;
p2)二氢单磷酸还原酶(folm);
p3)4a-羟基四氢生物蝶呤脱水酶(phhb);
p4)天冬氨酸转氨酶家族蛋白(aspartateaminotransferasefamilyprotein);
p5)n-乙酰转移酶(n-acetyltransferase)。
上述重组大肠杆菌中,所述苯丙氨酸羟化酶(记为x)来自野油菜黄单胞菌(xanthomonascampestrispv.campestrisstr.atcc33913)、二氢单磷酸还原酶(folm,记为m)来自大肠杆菌(escherichiacolistr.k-12substr.mg1655)、4a-羟基四氢生物蝶呤脱水酶(phhb,记为p)来自铜绿假单胞菌(pseudomonasaeruginosapao1)、天冬氨酸转氨酶家族蛋白(aspartateaminotransferasefamilyprotein,ncbireferencesequence:wp_103377132.1,记为h)和n-乙酰转移酶(n-acetyltransferase,ncbireferencesequencwp_020929557.1,记为f)来自小白链霉菌(streptomycesalbulus)。
上述重组大肠杆菌中,所述受体大肠杆菌可为大肠杆菌k12;具体为大肠杆菌k12菌株bw25113。
在本发明具体的实施方式中,所述苯丙氨酸羟化酶可为如下a1)或a2)所示的蛋白质:
a1)seqidno.1第319-1209位所示的dna分子编码的蛋白质;
a2)将a1)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与a1)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述二氢单磷酸还原酶可为如下a3)或a4)所示的蛋白质:
a3)seqidno.1第1615-2337位所示的dna分子编码的蛋白质;
a4)将a3)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与a3)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述4a-羟基四氢生物蝶呤脱水酶可为如下a5)或a6)所示的蛋白质:
a5)seqidno.1第1234-1590位所示的dna分子编码的蛋白质;
a6)将a5)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与a5)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述天冬氨酸转氨酶家族蛋白可为如下a7)或a8)所示的蛋白质:
a7)seqidno.1第2362-3831位所示的dna分子编码的蛋白质;
a8)将a7)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与a7)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述n-乙酰转移酶可为如下a9)或a10)所示的蛋白质:
a9)seqidno.1第3856-4404位所示的dna分子编码的蛋白质;
a10)将a9)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与a9)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质。
其中,seqidno.1第319-1209位由891个核苷酸组成,第319-1209位为编码序列,编码seqidno.6所示的苯丙氨酸羟化酶。
seqidno.1第1615-2337位由723个核苷酸组成,第1615-2337位为编码序列,编码seqidno.7所示的二氢单磷酸还原酶。
seqidno.1第1234-1590位由357个核苷酸组成,第1234-1590位为编码序列,编码seqidno.8所示的4a-羟基四氢生物蝶呤脱水酶。
seqidno.1第2362-3831位由1470个核苷酸组成,第2362-3831位为编码序列,编码seqidno.9所示的天冬氨酸转氨酶家族蛋白。
seqidno.1第3856-4404位由549个核苷酸组成,第3856-4404位为编码序列,编码seqidno.10所示的n-乙酰转移酶。
上述重组大肠杆菌中,同一性是指氨基酸序列的同一性。可使用国际互联网上的同源性检索站点测定氨基酸序列的同一性,如ncbi主页网站的blast网页。例如,可在高级blast2.1中,通过使用blastp作为程序,将expect值设置为10,将所有filter设置为off,使用blosum62作为matrix,将gapexistencecost,perresiduegapcost和lambdaratio分别设置为11,1和0.85(缺省值)并进行检索一对氨基酸序列的同一性进行计算,然后即可获得同一性的值(%)。
上述重组大肠杆菌中,所述90%以上的同一性可为至少91%、92%、95%、96%、98%、99%或100%的同一性。
上述重组大肠杆菌中,所述苯丙氨酸羟化酶的基因可为如下b1)或b2)所示:
b1)编码序列为seqidno.1第319-1209位所示的dna分子;
b2)将seqidno.1第319-1209位所示的dna分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与seqidno.1第319-1209位所示的dna分子具有相同功能的dna分子;
所述二氢单磷酸还原酶的基因可为如下b3)或b4)所示:
b3)编码序列为seqidno.1第1615-2337位所示的dna分子;
b4)将seqidno.1第1615-2337位所示的dna分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与seqidno.1第1615-2337位所示的dna分子具有相同功能的dna分子;
所述4a-羟基四氢生物蝶呤脱水酶的基因可为如下b5)或b6)所示:
b5)编码序列为seqidno.1第1234-1590位所示的dna分子;
b6)将seqidno.1第1234-1590位所示的dna分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与seqidno.1第1234-1590位所示的dna分子具有相同功能的dna分子;
所述天冬氨酸转氨酶家族蛋白的基因可为如下b7)或b8)所示:
b7)编码序列为seqidno.1第2362-3831位所示的dna分子;
b8)将seqidno.1第2362-3831位所示的dna分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与seqidno.1第2362-3831位所示的dna分子具有相同功能的dna分子;
所述n-乙酰转移酶的基因可为如下b9)或b10)所示:
b9)编码序列为seqidno.1第3856-4404位所示的dna分子;
b10)将seqidno.1第3856-4404位所示的dna分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与seqidno.1第3856-4404位所示的dna分子具有相同功能的dna分子。
本发明进一步提供了重组大肠杆菌的构建方法。
本发明重组大肠杆菌的构建方法,包括如下步骤:将色氨酸衍生物合成相关蛋白的基因导入受体大肠杆菌,得到重组大肠杆菌;
所述色氨酸衍生物合成相关蛋白的基因选自如下至少一种:
p1)苯丙氨酸羟化酶基因;
p2)二氢单磷酸还原酶(folm)基因;
p3)4a-羟基四氢生物蝶呤脱水酶(phhb)基因;
p4)天冬氨酸转氨酶家族蛋白(aspartateaminotransferasefamilyprotein)基因;
p5)n-乙酰转移酶(n-acetyltransferase)基因。
上述重组大肠杆菌中,所述苯丙氨酸羟化酶(记为x)来自野油菜黄单胞菌(xanthomonascampestrispv.campestrisstr.atcc33913)、二氢单磷酸还原酶(folm,记为m)来自大肠杆菌(escherichiacolistr.k-12substr.mg1655)、4a-羟基四氢生物蝶呤脱水酶(phhb,记为p)来自铜绿假单胞菌(pseudomonasaeruginosapao1)、天冬氨酸转氨酶家族蛋白(aspartateaminotransferasefamilyprotein,ncbireferencesequence:wp_103377132.1,记为h)和n-乙酰转移酶(n-acetyltransferase,ncbireferencesequencwp_020929557.1,记为f)来自小白链霉菌(streptomycesalbulus)。
上述构建方法中,所述色氨酸衍生物合成相关蛋白的基因导入受体大肠杆菌是对所述受体大肠杆菌基因组进行下述m1)-m5)全部、任四种、任三种、任两种或任一种的改造得到的:
m1)过表达苯丙氨酸羟化酶基因;
m2)过表达二氢单磷酸还原酶(folm)基因;
m3)过表达4a-羟基四氢生物蝶呤脱水酶(phhb)基因;
m4)过表达天冬氨酸转氨酶家族蛋白(aspartateaminotransferasefamilyprotein)基因;
m5)过表达n-乙酰转移酶(n-acetyltransferase)基因。
在本发明具体的实施方式中,所述色氨酸衍生物合成相关蛋白的基因通过方式甲或方式乙或方式丙导入所述受体大肠杆菌中;
所述方式甲为所述苯丙氨酸羟化酶(记为x)的基因构建在一个表达载体上,所述天冬氨酸转氨酶家族蛋白(记为h)、n-乙酰转移酶(记为f)、4a-羟基四氢生物蝶呤脱水酶(记为p)和二氢单磷酸还原酶(记为m)的基因构建在另一个表达载体上,所述表达载体中四个基因的位置关系为天冬氨酸转氨酶家族蛋白(记为h)、n-乙酰转移酶(记为f)、4a-羟基四氢生物蝶呤脱水酶(记为p)和二氢单磷酸还原酶(记为m)的基因依次连接(即天冬氨酸转氨酶家族蛋白基因位于n-乙酰转移酶基因的上游、n-乙酰转移酶基因位于4a-羟基四氢生物蝶呤脱水酶基因的上游、4a-羟基四氢生物蝶呤脱水酶位于二氢单磷酸还原酶基因的上游),然后均导入到受体大肠杆菌中;
所述方式乙为所述苯丙氨酸羟化酶(记为x)、4a-羟基四氢生物蝶呤脱水酶(记为p)和二氢单磷酸还原酶(记为m)的基因构建在一个表达载体上,所述表达载体中三个基因的位置关系为苯丙氨酸羟化酶基因(记为x)、4a-羟基四氢生物蝶呤脱水酶基因(记为p)和二氢单磷酸还原酶基因(记为m)依次连接(即苯丙氨酸羟化酶基因位于4a-羟基四氢生物蝶呤脱水酶基因的上游、4a-羟基四氢生物蝶呤脱水酶基因位于二氢单磷酸还原酶基因的上游);所述天冬氨酸转氨酶家族蛋白基因(记为h)和n-乙酰转移酶基因(记为f)构建在同一个表达载体上,然后均导入到受体大肠杆菌中;
所述方式丙为所述苯丙氨酸羟化酶(记为x)、4a-羟基四氢生物蝶呤脱水酶基因(记为p)、二氢单磷酸还原酶基因(记为m)、天冬氨酸转氨酶家族蛋白基因(记为h)和n-乙酰转移酶基因(记为f)构建在一个表达载体上,所述表达载体中苯丙氨酸羟化酶基因(记为x)、4a-羟基四氢生物蝶呤脱水酶基因(记为p)、二氢单磷酸还原酶基因(记为m)、天冬氨酸转氨酶家族蛋白基因(记为h)和n-乙酰转移酶基因(记为f)依次连接(即苯丙氨酸羟化酶基因位于4a-羟基四氢生物蝶呤脱水酶基因的上游,4a-羟基四氢生物蝶呤脱水酶位于二氢单磷酸还原酶基因的上游,二氢单磷酸还原酶基因位于天冬氨酸转氨酶家族蛋白基因的上游,天冬氨酸转氨酶家族蛋白基因位于n-乙酰转移酶的上游),然后导入到受体大肠杆菌中。
在本发明具体的实施方式中,所述方式甲为利用无缝拼接方法将苯丙氨酸羟化酶的基因(记为x)构建到载体pbad中得到重组载体pbad-x(seqidno.4所示),利用无缝拼接方法按照天冬氨酸转氨酶家族蛋白基因(记为h)、n-乙酰转移酶基因(记为f)、4a-羟基四氢生物蝶呤脱水酶基因(记为p)和二氢单磷酸还原酶基因(记为m)的连接顺序构建到载体pzh中得到重组载体pzh-hfpm(seqidno.5所示),然后将pbad-x和pzh-hfpm导入到受体大肠杆菌中;
所述方式乙为利用无缝拼接方法按照苯丙氨酸羟化酶基因(记为x)、4a-羟基四氢生物蝶呤脱水酶基因(记为p)和二氢单磷酸还原酶基因(记为m)的连接顺序构建到载体pbad中得到重组载体pbad-xpm(seqidno.2所示),利用无缝拼接方法按照天冬氨酸转氨酶家族蛋白基因(记为h)和n-乙酰转移酶基因(记为f)的基因的连接顺序构建到载体pzh中得到重组载体pzh-hf(seqidno.3所示),然后将重组载体pbad-xpm和pzh-hf导入到受体大肠杆菌中;
所述方式丙为利用无缝拼接方法按照苯丙氨酸羟化酶基因(记为x)、4a-羟基四氢生物蝶呤脱水酶基因(记为p)、二氢单磷酸还原酶基因(记为m)、天冬氨酸转氨酶家族蛋白基因(记为h)和n-乙酰转移酶基因(记为f)的连接顺序构建重组载体pbad-xpmhf(seqidno.1所示),然后将重组载体pbad-xpmhf导入到受体大肠杆菌中。
上述构建方法中,所述受体大肠杆菌可为大肠杆菌k12;具体为大肠杆菌k12菌株bw25113。
上述构建方法中,所述苯丙氨酸羟化酶可为如下a1)或a2)所示的蛋白质:
a1)seqidno.1第319-1209位所示的dna分子编码的蛋白质;
a2)将a1)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与a1)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述二氢单磷酸还原酶可为如下a3)或a4)所示的蛋白质:
a3)seqidno.1第1615-2337位所示的dna分子编码的蛋白质;
a4)将a3)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与a3)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述4a-羟基四氢生物蝶呤脱水酶可为如下a5)或a6)所示的蛋白质:
a5)seqidno.1第1234-1590位所示的dna分子编码的蛋白质;
a6)将a5)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与a5)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述天冬氨酸转氨酶家族蛋白可为如下a7)或a8)所示的蛋白质:
a7)seqidno.1第2362-3831位所示的dna分子编码的蛋白质;
a8)将a7)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与a7)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;
所述n-乙酰转移酶可为如下a9)或a10)所示的蛋白质:
a9)seqidno.1第3856-4404位所示的dna分子编码的蛋白质;
a10)将a9)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与a9)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质。
其中,seqidno.1第319-1209位由891个核苷酸组成,第319-1209位为编码序列,编码seqidno.6所示的苯丙氨酸羟化酶。
seqidno.1第1615-2337位由723个核苷酸组成,第1615-2337位为编码序列,编码seqidno.7所示的二氢单磷酸还原酶。
seqidno.1第1234-1590位由357个核苷酸组成,第1234-1590位为编码序列,编码seqidno.8所示的4a-羟基四氢生物蝶呤脱水酶。
seqidno.1第2362-3831位由1470个核苷酸组成,第2362-3831位为编码序列,编码seqidno.9所示的天冬氨酸转氨酶家族蛋白。
seqidno.1第3856-4404位由549个核苷酸组成,第3856-4404位为编码序列,编码seqidno.10所示的n-乙酰转移酶。
上述方法中,同一性是指氨基酸序列的同一性。可使用国际互联网上的同源性检索站点测定氨基酸序列的同一性,如ncbi主页网站的blast网页。例如,可在高级blast2.1中,通过使用blastp作为程序,将expect值设置为10,将所有filter设置为off,使用blosum62作为matrix,将gapexistencecost,perresiduegapcost和lambdaratio分别设置为11,1和0.85(缺省值)并进行检索一对氨基酸序列的同一性进行计算,然后即可获得同一性的值(%)。
上述方法中,所述90%以上的同一性可为至少91%、92%、95%、96%、98%、99%或100%的同一性。
上述方法中,所述苯丙氨酸羟化酶的基因可为如下b1)或b2)所示:
b1)编码序列为seqidno.1第319-1209位所示的dna分子;
b2)将seqidno.1第319-1209位所示的dna分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与seqidno.1第319-1209位所示的dna分子具有相同功能的dna分子;
所述二氢单磷酸还原酶的基因可为如下b3)或b4)所示:
b3)编码序列为seqidno.1第1615-2337位所示的dna分子;
b4)将seqidno.1第1615-2337位所示的dna分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与seqidno.1第1615-2337位所示的dna分子具有相同功能的dna分子;
所述4a-羟基四氢生物蝶呤脱水酶的基因可为如下b5)或b6)所示:
b5)编码序列为seqidno.1第1234-1590位所示的dna分子;
b6)将seqidno.1第1234-1590位所示的dna分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与seqidno.1第1234-1590位所示的dna分子具有相同功能的dna分子;
所述天冬氨酸转氨酶家族蛋白的基因可为如下b7)或b8)所示:
b7)编码序列为seqidno.1第2362-3831位所示的dna分子;
b8)将seqidno.1第2362-3831位所示的dna分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与seqidno.1第2362-3831位所示的dna分子具有相同功能的dna分子;
所述n-乙酰转移酶的基因可为如下b9)或b10)所示:
b9)编码序列为seqidno.1第3856-4404位所示的dna分子;
b10)将seqidno.1第3856-4404位所示的dna分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与seqidno.1第3856-4404位所示的dna分子具有相同功能的dna分子。
上述构建方法得到的重组大肠杆菌及其在制备n-乙酰-5-羟色胺的应用也在本发明的保护范围之内。
本发明进一步公开了一种制备n-乙酰-5-羟色胺的方法。
本发明制备n-乙酰-5-羟色胺的方法,包括:利用上述重组大肠杆菌催化色氨酸反应得到n-乙酰-5-羟色胺。
具体的,所述重组大肠杆菌经阿拉伯糖诱导培养后催化色氨酸反应得到n-乙酰-5-羟色胺。
上述方法中,所述阿拉伯糖为l-阿拉伯糖。
本发明通过在大肠杆菌中过表达色氨酸衍生物合成相关蛋白的基因,构建了能高效合成n-乙酰-5-羟色胺的重组大肠杆菌,开发了一套高效合成n-乙酰-5-羟色胺的方法。本发明的产n-乙酰-5-羟色胺的重组大肠杆菌菌株,单位菌体的n-乙酰-5-羟色胺合成效率显著高于其它现有菌株,且绝大部分产物分泌至胞外,便于产物的下游纯化分离。因此本发明对n-乙酰-5-羟色胺的工业化生产和大规模应用具有重大意义。
附图说明
图1为sds-page分析色氨酸衍生物合成相关蛋白的基因在大肠杆菌中的表达。
图2为三株重组大肠杆菌摇瓶试验中n-乙酰-5-羟色胺合成水平的分析。
图3为两株重组大肠杆菌发酵罐试验中n-乙酰-5-羟色胺合成水平的分析。
具体实施方式
以下的实施例便于更好地理解本发明,但并不限定本发明。下述实施例中所使用的实验方法如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
下述实施例中用到的材料来源如下:
pbad/hisa购自invitrogen,产品目录号为v430-01;
pzh是在pbad/hisa基础上改变复制起始位点和抗性为氯霉素得到。
实施例1、n-乙酰-5-羟色胺高产的重组大肠杆菌菌株的构建
1、pcr扩增色氨酸衍生物合成相关蛋白的编码序列
以合成的来源于野油菜黄单胞菌的苯丙氨酸羟化酶基因(seqidno.1第319-1209位所示)为模板,用引物f1和r1进行pcr扩增,得到包含苯丙氨酸羟化酶基因的pcr扩增产物x(seqidno.1第299-1232位所示)。
以合成的来源于铜绿假单胞菌的4a-羟基四氢生物蝶呤脱水酶基因phhb(seqidno.1第1234-1590位所示)为模板用引物f3和r3进行pcr扩增,得到包含4a-羟基四氢生物蝶呤脱水酶基因phhb的pcr扩增产物p(seqidno.1第1210-1614位所示)。
以合成的来源于大肠杆菌的二氢单磷酸还原酶(folm)基因(seqidno.1第1615-2337位所示)为模板,用引物f2和r2进行pcr扩增,得到包含二氢单磷酸还原酶(folm)基因的pcr扩增产物m(seqidno.1第1592-2337位所示)。
以合成的来源于小白链霉菌的天冬氨酸转氨酶家族蛋白(aspartateaminotransferasefamilyprotein)基因(seqidno.1第2362-3831位所示)为模板用引物f4和r4进行pcr扩增,得到包含天冬氨酸转氨酶家族蛋白(aspartateaminotransferasefamilyprotein)的pcr扩增产物h(seqidno.1第2362-3831位所示)。
以合成的来源于小白链霉菌的n-乙酰转移酶(n-acetyltransferase)基因(seqidno.1第3856-4404位所示)为模板用引物f5和r5进行pcr扩增,得到包含n-乙酰转移酶(n-acetyltransferase)基因的pcr扩增产物f(seqidno.1第3814-4404位所示)。
具体引物序列如下:
f1:gctaacaggaggaattaaccatgaacacagcgccgcgccgc
r1:tatatctccttcttaaagttaaattacacgtcgccgtcgcggctc
f2:ttaactttaagaaggagatatacatgggtaaaacccagccctt
r2:ttaacgcagatgacgaccgc
f3:tttaagaaggagatatacatgaccgcactcacccaagc
r3:gtatatctccttcttaaagttaaattatttgcgcccctcggcgg
f4:atgaagcccgctgacgcg
r4:ctactcgggcagcgcatcagc
f5:gatgcgctgcccgagtagtttaactttaagaaggagatatacatgaacaccttccggacc
r5:tcagtcgcagtggtcatggatcg
2、无缝拼接
以pbad/hisa为载体,利用无缝拼接方法按照x、p、m、h、f的连接顺序构建重组载体pbad-xpmhf(seqidno.1所示),并命名为nas-1;
以pbad为载体,利用无缝拼接方法按照x、p、m的连接顺序构建重组载体pbad-xpm(seqidno.2所示),以pzh为载体,利用无缝拼接方法按照h、f的连接顺序构建重组载体pzh-hf(seqidno.3所示),并将pbad-xpm和pzh-hf命名为nas-2;
以pbad为载体,利用无缝拼接方法构建载体pbad-x(seqidno.4所示),以pzh为载体,利用无缝拼接方法按照h、f、p、m的连接顺序构建重组载体pzh-hfpm(seqidno.5所示),并将pbad-x和pzh-hfpm命名为nas-3。
3、转化、筛选以及序列验证
用氯化钙化学转化法将重组载体pbad-xpmhf、pbad-xpm、pzh-hf、pbad-x、pzh-hfpm分别转化至大肠杆菌dh5α,用含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的lb培养基进行筛选培养,挑取单菌落,并进行扩大培养,获得重组菌并提取质粒,进行测序验证,结果获得的序列如seqidno.1、seqidno.2、seqidno.3、seqidno.4和seqidno.5所示,证明构建的重组质粒及重组菌正确。将阳性克隆的重组菌记作dh5α-pbad-xpmhf,dh5α-pbad-xpm,dh5α-pzh-hf,dh5α-pbad-x,dh5α-pzh-hfpm,阳性质粒记作pbad-xpmhf,pbad-xpm,pzh-hf,pbad-x,pzh-hfpm。
4、重组表达菌株的构建
用氯化钙化学转化法将重组质粒pbad-xpmhf、pbad-xpm和pzh-hf、pbad-xc和pzh-hfpm分别转化至大肠杆菌k-12系列表达菌株bw25113(购买自北京江晨文轩生物科技有限责任公司,货号:g6058,rrnb3δlacz4787hsdr514δ(arabad)567δ(rhabad)568rph-1),用含有氨苄青霉素(100μg/ml)和或含氯霉素(34ug/ml)的lb培养基进行筛选培养,挑取单菌落,获得重组大肠杆菌菌株bw-pbad-xpmhf(命名为bw-pbad-nas1)、bw-pbad-xpm/pzh-hf(命名为bw-pbad-nas2)、bw-pbad-x/pzh-hfpm(命名为bw-pbad-nas3)。
5、蛋白表达
以bw-pbad-nas3为例:
挑取bw-pbad-nas3的单菌落接入含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的lb培养基中,于37℃过夜培养,得到过夜培养物;将过夜培养物接种于100ml含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的lb培养基,37℃剧烈振荡(200rpm)培养,至发酵液的od600值达到0.6-0.8左右,向发酵体系中加入l-阿拉伯糖(终浓度0.1%),30℃条件下继续培养10-12小时。
发酵完毕后,5000rpm离心15分钟,收集菌体;用ph7.0的pbs缓冲液重悬菌体,超声波破碎后12,000rpm离心15min。收集上清液,即为含有目的蛋白的粗酶液,sds-page检测蛋白表达情况,结果如图1中a所示,表明bw-pbad-nas3中5种蛋白在大肠杆菌生产菌株内得到良好表达。
利用上述方法,分别对bw-pbad-nas1和bw-pbad-nas2进行实验,sds-page检测蛋白表达情况,如图1中b所示bw-pbad-nas1中n-乙酰转移酶没有表达,图1中c所示bw-pbad-nas2中5种蛋白均获得表达,对比bw-pbad-nas3其二氢单磷酸还原酶和4a-羟基四氢生物蝶呤脱水酶表达量较高,天冬氨酸转氨酶家族蛋白和n-乙酰转移酶表达量较低。
6、n-乙酰-5-羟色胺的生物转化摇瓶试验
以bw-pbad-nas3为例进行摇瓶试验:
挑取bw-pbad-nas3的单菌落接入含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的lb培养基中,于37℃过夜培养,得到过夜培养物;将过夜培养物接种于500ml含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的lb培养基,37℃剧烈振荡(200rpm)培养,至发酵液的od600值达到0.6-0.8左右,再向发酵体系中加入l-阿拉伯糖(终浓度0.1%),30℃条件下继续培养10-12小时。5000rpm离心15分钟,收集菌体。
离心后菌体加入转化液重悬菌体至od600值达到10,取25ml重悬菌液于250ml三角瓶中,30℃振荡(100rpm)反应96小时,分别检测24h、48h、72h和96h的n-乙酰-5-羟色胺的产量。
其中,转化液的成分:10g/l葡萄糖,6g/lna2hpo4,0.5g/lnacl,3g/lkh2po4,1g/lnh4cl,246.5mg/lmgso4·7h2o,14.7mg/lcacl2·2h2o,27.8mg/lfeso4·7h2o,2g/lyeastextract(酵母提取物);1%甘油;1g/ltryptophan(色氨酸)。
利用上述方法,分别对bw-pbad-nas1和bw-pbad-nas2进行实验,分别检测24h、48h、72h和96h的n-乙酰-5-羟色胺的产量。
结果如图2所示,结果显示三株重组大肠杆菌菌株n-乙酰-5-羟色胺的产量具有显著的差异,其中,bw-pbad-nas3(即bw-pbad-x/pzh-hfpm,图中以“菌株3”表示)的产量最高,在72h便将底物1.0g/l色氨酸全部消耗殆尽,产生了519mg/l的n-乙酰5-羟色胺,bw-pbad-nas2(即bw-pbad-xpm/pzh-hf,图中以“菌株2”表示)次之,bw-pbad-nas1(即bw-pbad-xhfpm,图中以“菌株1”表示)产量最低。
7、n-乙酰-5-羟色胺的生物转化发酵罐试验
以摇瓶试验n-乙酰-5-羟色胺产量最高的bw-pbad-nas3菌株和较高的bw-pbad-nas2做上罐发酵:
以bw-pbad-nas3为例进行发酵罐试验:
1)种子液制备:挑取所述重组大肠杆菌bw-pbad-nas3单菌落接入20ml含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的lb培养基中,于37℃、200rpm培养12小时;然后将20ml培养物转接至300ml含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的种子培养基中,37℃、200rpm振荡培养12小时,即得种子液;
其中,所述种子培养基的配制:蛋白胨16g,酵母膏10g,氯化钠5g,用水定容至1l,ph7.0。
2)菌体培养:以10%的接种量将种子液接种到1l含氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的发酵罐的发酵培养基中,发酵采用2.5l的发酵罐,培养过程中控制温度为37℃,通过搅拌速度(500-800转/分钟)和通气量(3l/min)控制菌体培养体系的溶氧在20%以上,通过流加1m磷酸和3m氨水维持ph值稳定在6.8-7.2,培养至葡萄糖消耗完时流加补料培养基,补料培养基的流加速度为50ml/h,流加至菌体密度od600达到20,菌体培养过程结束,得到菌体培养后的发酵液,进入诱导培养阶段;
其中,每1l发酵培养基的配制:葡萄糖10g,(nh4)2hpo48g,kh2po413.3g,mgso4·7h2o1.2g,柠檬酸1.7g,微量盐溶液10ml,用水定溶至1l,5mnaoh调至ph7.0;
每1l补料培养基的配制:葡萄糖400g,mgso4·7h2o10g,微量盐溶液20ml,用水定容至1l;
每1l微量盐溶液的配制:feso4·7h2o10g,znso4·7h2o2.25g,cuso4·5h2o1g,mnso4·5h2o0.5g,na2b4o7·10h2o0.23g,cacl2·2h2o2g,(nh4)6mo7o240.1g,用5m盐酸水溶液定容,定容至1l。
3)诱导培养:将上述菌体培养后的发酵液的温度降至30℃,加入l-阿拉伯糖,使得l-阿拉伯糖终浓度为1g/l,进行诱导培养,同时加入色氨酸终浓度为4g/l,甘油终浓度为体积占比5%;诱导培养过程中要一直流加补料培养基,补料培养基的流加速度调至20ml/h;流加至菌体密度od600达到40,诱导培养过程结束,得到转化液;
所述诱导培养的条件为:培养温度为30℃,控制诱导培养体系的溶氧在20%以上和维持ph至7.0。
4)hplc检测:上述转化液5000rpm离心15min吸取上清液,按照上清液:水:甲醇体积比1:7.5:1.5制成待检测样品,0.22um有机型滤器过滤除去不溶物后每隔5-8小时hplc检测n-乙酰-5-羟色胺浓度。hplc检测仪为agilent1260infinitylc,检测柱为agilentzobaxc18柱。n-乙酰-5-羟色胺的紫外检测波长为275nm,流动相15%(v/v)甲醇,流速为1.0ml/min,进样量为10ul,采用外标法按峰面积定量。sigma生产n-乙酰-5-羟色胺标准品作为定量标准。
利用上述方法,对bw-pbad-nas2进行实验,每隔5-8小时hplc检测n-乙酰-5-羟色胺浓度。
结果如图3所示,结果显示:结果显示两株重组大肠杆菌菌株发酵罐中n-乙酰-5-羟色胺的浓度具有显著的差异,其中,bw-pbad-nas3(即bw-pbad-x/pzh-hfpm,图中以“菌株3”表示)的产量明显高于bw-pbad-nas2(即bw-pbad-xpm/pzh-hf,图中以“菌株2”表示),bw-pbad-nas3最终发酵64hn-乙酰5-羟色胺的产量达到2.7g/l。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
sequencelisting
<110>中国科学院微生物研究所
<120>产n-乙酰-5-羟色胺的重组大肠杆菌及其构建方法和应用
<130>gncfy200075
<160>10
<170>patentinversion3.5
<210>1
<211>8042
<212>dna
<213>人工序列(artificialsequence)
<400>1
aagaaaccaattgtccatattgcatcagacattgccgtcactgcgtcttttactggctct60
tctcgctaaccaaaccggtaaccccgcttattaaaagcattctgtaacaaagcgggacca120
aagccatgacaaaaacgcgtaacaaaagtgtctataatcacggcagaaaagtccacattg180
attatttgcacggcgtcacactttgctatgccatagcatttttatccataagattagcgg240
atcctacctgacgctttttatcgcaactctctactgtttctccatacccgttttttgggc300
taacaggaggaattaaccatgaacacagcgccgcgccgcgtcgagaaccagctcaccgac360
aagggctatgtgccggtctacaccaccgcggtggtggagcagccgtgggatggttacagc420
gccgacgaccatgccacctggggcacgctgtaccggcggcagcgcgcgctgctggtcggg480
cgggcctgcgatgagttcctgcaggcgcaggacgcaatgggcatggacgacacccagatt540
ccgcgcttcgacgcgctcaacgcggtgctgcaggcgaccaccggctggacgctggtcggt600
gtggaagggctgctgccggagctggatttcttcgatcatctggccaaccggcgcttcccg660
gtgacctggtggatccgccgcccggaccagatcgactacatcgccgaaccggacctgttc720
catgatctgttcgggcacgtgccgctgctgatgaatccgctgtttgccgacttcatgcag780
gcctatgggcgcggtggcgtcaaggcgcacggaattggcccggacgcgttgcaaaatctc840
acccggctgtacttctacacggtggaattcggcctgattgccacgccgcaggggttgcgc900
atctacggtgcgggcatcgtctcgtccaagggcgaatcgctgcattcgctggaatcggcg960
gcgccgaaccgggtgggcttcgatctgcagcgggtgatgcgcacgcgctaccgcatcgac1020
agtttccaaaagacctacttcgtcatcgacagctttacgcagctgatggacgccaccgcc1080
ccggatttcaccccgatctatgccgcgctggcgcaacagccgcaggtgccggccggcgag1140
gtgctggcaaccgaccacgtcctgcagcgcggcagcggcgaaggctggagccgcgacggc1200
gacgtgtaatttaactttaagaaggagatatacatgaccgcactcacccaagcccattgc1260
gaagcctgccgcgcagacgccccgcacgtcagcgacgaagaactgcccgtgctgctgcgg1320
caaatcccggattggaacatcgaagtccgcgacggcatcatgcagctagagaaggtctac1380
ctgttcaagaacttcaagcatgccctggccttcaccaatgccgtcggcgagatatccgag1440
gccgaaggccaccatccgggcctgctgaccgagtggggcaaagtcaccgtgacctggtgg1500
agccactcgatcaagggcctgcaccgcaacgatttcatcatggcggcgcgcaccgatgag1560
gtagcgaaaaccgccgaggggcgcaaataatttaactttaagaaggagatatacatgggt1620
aaaacccagcccttgccaatattaattactggcggaggtcgtcgcatcggcctcgccctc1680
gcatggcatttcattaatcaaaagcaaccggtgattgtcagctatcggacacactatcca1740
gccattgatggactgattaatgcaggtgcgcagtgtattcaggctgatttttcgaccaac1800
gacggtgtgatggcgtttgccgatgaagtactaaaaagcacccatggtctgcgtgctatt1860
ttgcataacgccagtgcgtggatggcggaaaaaccgggtgcgccactggccgacgtactg1920
gcttgcatgatgcagatccacgttaataccccatacctgctcaaccatgcgctggaaaga1980
ttactgcgtgggcacggacacgccgccagcgatatcattcactttaccgattatgtggtg2040
gagcgcggtagcgacaaacatattgcgtatgctgcaagcaaagcggcactggataatatg2100
acccgctcgtttgcccgcaagctggcaccggaagtgaaagtgaattctattgcgccatcg2160
ctgatcctgtttaatgaacatgatgatgccgaatatcgacaacaggcgctgaataaatca2220
ctgatgaaaaccgcgcctggcgagaaagaagtgatcgacctggtcgattacttacttacc2280
agttgctttgtcaccggacgcagtttcccacttgatggcggtcgtcatctgcgttaattt2340
aactttaagaaggagatatacatgaagcccgctgacgcgaaaccgccccacatggaccac2400
gacaccttccgctccctgggccatcaggccatcgactggatcgccgactactggcagcgt2460
ttggcggagcgacccgtcgctccccccgtcgaacccggcagcatccgcgcccagttaccg2520
acggccccacccgagtgcggcgaggactttcccgtactgctgtccgacctcgaacggatc2580
gtgctgccgggcctgctgcactggcagcacccccgtttcttcggttacttccccgcgaac2640
gcttccggccccgccgtcctggccgagctgttgtccgcgggcctgggcatccaggggatg2700
aactggaacaccagcccggcctgcaccgagatcgaacagcagatgctggactggttcgtg2760
cacctgctcggcctacccgagcacctccgcggtgggggagtcatccaggacaccgcctcc2820
agcgccctcctggtggcactgctcaccgccctgcaccaggccagtgcgggccgcacccgc2880
gaccacggcaccggcgagtgcggctaccgggtgtacctgaccgccgagacgcactcggcg2940
gcccgcaaggccgccgtcatcaccggactgggcctgcgggccatgtgcgaggtggccacc3000
gacgccgacggcgccatggacgcagtcgatctggaaagacacctccgggccgaccgggcc3060
gcaggtctgaccccgctgatggtcgtggccacccgaggcaccacctcccatctctccttc3120
gaccccctggaggacatcggccccgtgtgtcgtcggcacggcgtgtggctccacgtcgac3180
gccgcatacgccggagtggccgcggtctgcgacgaactgcgctgggtcaacgacggcgtg3240
cgctacgcggactcctactgcaccaacccgcacaagtggctgctgaccaacttcgactgc3300
gacctgctgtgggtggcccaccccgaagtcctcgtcagcgccctgagcgtgctccccgaa3360
tacctgcgcaactcggcctccgaatcgggccgggtgaccgactaccggcactggcaggtc3420
ccactgggccggcgcttccgcgcactgaaactgtggtccgtcctccactggtacggcgcc3480
gaggggctgcgcgcccacatccgcaccggcgttcggcatgcccagctcttcgcggacctg3540
gtcggcgccgacgaccgcttcaccctggtcacccctcccgccctcggcctggtgacgttc3600
cgtcagaccggaacggacgaggagaaccggaacctcctgcaagccatcaacaccgaggga3660
accaccttcctcacccactccgagaagaacggcaccttcttcctgcgcttcgccgccggc3720
ggcaccctcaccgaggaccaccacgtacgcgaagcatggcgcgccgtccagaacgcgatc3780
cctcgcgcacaacacctcgccggcggctcggctgatgcgctgcccgagtagtttaacttt3840
aagaaggagatatacatgaacaccttccggaccgcgacggcacgcgatctccccgatgtc3900
gccgccaccttgaccgaggcgttcgccgccgacccgccgacccaatgggtcttcccggac3960
ggtgccgctgcggtctcccgtttcttcttcggtgtcgccgaccgtgcccgcgaggccggc4020
gggatcgtcgaactactccccggcaccgccgcgatgatcgccctacccccgcacgtacga4080
ctacccgacgccccagcctgcggccgacaggccgagatgcagcgcaggctgggcgaacgc4140
cgcccccgcactccgcactactacctcctcttctacggcgtgcgcaccgcccatcagagc4200
tccggcctggggggacggatgctctccgacctcatctccctggccgaccgcgaccgcgtg4260
ggcacctacaccgaggccagcacctggcgcggcgcccgcctgatgttgcgtcacggcttc4320
cacaccgcacagccgctgcggcttccccacgggccacccatgttccccctctggagagac4380
ccgatccatgaccactgcgactgaaagcttggctgttttggcggatgagagaagattttc4440
agcctgatacagattaaatcagaacgcagaagcggtctgataaaacagaatttgcctggc4500
ggcagtagcgcggtggtcccacctgaccccatgccgaactcagaagtgaaacgccgtagc4560
gccgatggtagtgtggggtctccccatgcgagagtagggaactgccaggcatcaaataaa4620
acgaaaggctcagtcgaaagactgggcctttcgttttatctgttgtttgtcggtgaacgc4680
tctcctgagtaggacaaatccgccgggagcggatttgaacgttgcgaagcaacggcccgg4740
agggtggcgggcaggacgcccgccataaactgccaggcatcaaattaagcagaaggccat4800
cctgacggatggcctttttgcgtttctacaaactcttttgtttatttttctaaatacatt4860
caaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaa4920
ggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcatttt4980
gccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagt5040
tgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagtt5100
ttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcgg5160
tattatcccgtgttgacgccgggcaagagcaactcggtcgccgcatacactattctcaga5220
atgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaa5280
gagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctga5340
caacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaa5400
ctcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgaca5460
ccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaactggcgaactactta5520
ctctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccac5580
ttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagc5640
gtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtag5700
ttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgaga5760
taggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatacttt5820
agattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgata5880
atctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtag5940
aaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaa6000
caaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactcttt6060
ttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagc6120
cgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaa6180
tcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaa6240
gacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagc6300
ccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaa6360
gcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaa6420
caggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcg6480
ggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcc6540
tatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttg6600
ctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttg6660
agtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgagg6720
aagcggaagagcgcctgatgcggtattttctccttacgcatctgtgcggtatttcacacc6780
gcatatggtgcactctcagtacaatctgctctgatgccgcatagttaagccagtatacac6840
tccgctatcgctacgtgactgggtcatggctgcgccccgacacccgccaacacccgctga6900
cgcgccctgacgggcttgtctgctcccggcatccgcttacagacaagctgtgaccgtctc6960
cgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgaggcagcagat7020
caattcgcgcgcgaaggcgaagcggcatgcataatgtgcctgtcaaatggacgaagcagg7080
gattctgcaaaccctatgctactccgtcaagccgtcaattgtctgattcgttaccaatta7140
tgacaacttgacggctacatcattcactttttcttcacaaccggcacggaactcgctcgg7200
gctggccccggtgcattttttaaatacccgcgagaaatagagttgatcgtcaaaaccaac7260
attgcgaccgacggtggcgataggcatccgggtggtgctcaaaagcagcttcgcctggct7320
gatacgttggtcctcgcgccagcttaagacgctaatccctaactgctggcggaaaagatg7380
tgacagacgcgacggcgacaagcaaacatgctgtgcgacgctggcgatatcaaaattgct7440
gtctgccaggtgatcgctgatgtactgacaagcctcgcgtacccgattatccatcggtgg7500
atggagcgactcgttaatcgcttccatgcgccgcagtaacaattgctcaagcagatttat7560
cgccagcagctccgaatagcgcccttccccttgcccggcgttaatgatttgcccaaacag7620
gtcgctgaaatgcggctggtgcgcttcatccgggcgaaagaaccccgtattggcaaatat7680
tgacggccagttaagccattcatgccagtaggcgcgcggacgaaagtaaacccactggtg7740
ataccattcgcgagcctccggatgacgaccgtagtgatgaatctctcctggcgggaacag7800
caaaatatcacccggtcggcaaacaaattctcgtccctgatttttcaccaccccctgacc7860
gcgaatggtgagattgagaatataacctttcattcccagcggtcggtcgataaaaaaatc7920
gagataaccgttggcctcaatcggcgttaaacccgccaccagatgggcattaaacgagta7980
tcccggcagcaggggatcattttgcgcttcagccatacttttcatactcccgccattcag8040
ag8042
<210>2
<211>5975
<212>dna
<213>人工序列(artificialsequence)
<400>2
aagaaaccaattgtccatattgcatcagacattgccgtcactgcgtcttttactggctct60
tctcgctaaccaaaccggtaaccccgcttattaaaagcattctgtaacaaagcgggacca120
aagccatgacaaaaacgcgtaacaaaagtgtctataatcacggcagaaaagtccacattg180
attatttgcacggcgtcacactttgctatgccatagcatttttatccataagattagcgg240
atcctacctgacgctttttatcgcaactctctactgtttctccatacccgttttttgggc300
taacaggaggaattaaccatgaacacagcgccgcgccgcgtcgagaaccagctcaccgac360
aagggctatgtgccggtctacaccaccgcggtggtggagcagccgtgggatggttacagc420
gccgacgaccatgccacctggggcacgctgtaccggcggcagcgcgcgctgctggtcggg480
cgggcctgcgatgagttcctgcaggcgcaggacgcaatgggcatggacgacacccagatt540
ccgcgcttcgacgcgctcaacgcggtgctgcaggcgaccaccggctggacgctggtcggt600
gtggaagggctgctgccggagctggatttcttcgatcatctggccaaccggcgcttcccg660
gtgacctggtggatccgccgcccggaccagatcgactacatcgccgaaccggacctgttc720
catgatctgttcgggcacgtgccgctgctgatgaatccgctgtttgccgacttcatgcag780
gcctatgggcgcggtggcgtcaaggcgcacggaattggcccggacgcgttgcaaaatctc840
acccggctgtacttctacacggtggaattcggcctgattgccacgccgcaggggttgcgc900
atctacggtgcgggcatcgtctcgtccaagggcgaatcgctgcattcgctggaatcggcg960
gcgccgaaccgggtgggcttcgatctgcagcgggtgatgcgcacgcgctaccgcatcgac1020
agtttccaaaagacctacttcgtcatcgacagctttacgcagctgatggacgccaccgcc1080
ccggatttcaccccgatctatgccgcgctggcgcaacagccgcaggtgccggccggcgag1140
gtgctggcaaccgaccacgtcctgcagcgcggcagcggcgaaggctggagccgcgacggc1200
gacgtgtaatttaactttaagaaggagatatacatgaccgcactcacccaagcccattgc1260
gaagcctgccgcgcagacgccccgcacgtcagcgacgaagaactgcccgtgctgctgcgg1320
caaatcccggattggaacatcgaagtccgcgacggcatcatgcagctagagaaggtctac1380
ctgttcaagaacttcaagcatgccctggccttcaccaatgccgtcggcgagatatccgag1440
gccgaaggccaccatccgggcctgctgaccgagtggggcaaagtcaccgtgacctggtgg1500
agccactcgatcaagggcctgcaccgcaacgatttcatcatggcggcgcgcaccgatgag1560
gtagcgaaaaccgccgaggggcgcaaataatttaactttaagaaggagatatacatgggt1620
aaaacccagcccttgccaatattaattactggcggaggtcgtcgcatcggcctcgccctc1680
gcatggcatttcattaatcaaaagcaaccggtgattgtcagctatcggacacactatcca1740
gccattgatggactgattaatgcaggtgcgcagtgtattcaggctgatttttcgaccaac1800
gacggtgtgatggcgtttgccgatgaagtactaaaaagcacccatggtctgcgtgctatt1860
ttgcataacgccagtgcgtggatggcggaaaaaccgggtgcgccactggccgacgtactg1920
gcttgcatgatgcagatccacgttaataccccatacctgctcaaccatgcgctggaaaga1980
ttactgcgtgggcacggacacgccgccagcgatatcattcactttaccgattatgtggtg2040
gagcgcggtagcgacaaacatattgcgtatgctgcaagcaaagcggcactggataatatg2100
acccgctcgtttgcccgcaagctggcaccggaagtgaaagtgaattctattgcgccatcg2160
ctgatcctgtttaatgaacatgatgatgccgaatatcgacaacaggcgctgaataaatca2220
ctgatgaaaaccgcgcctggcgagaaagaagtgatcgacctggtcgattacttacttacc2280
agttgctttgtcaccggacgcagtttcccacttgatggcggtcgtcatctgcgttaaaag2340
cttggctgttttggcggatgagagaagattttcagcctgatacagattaaatcagaacgc2400
agaagcggtctgataaaacagaatttgcctggcggcagtagcgcggtggtcccacctgac2460
cccatgccgaactcagaagtgaaacgccgtagcgccgatggtagtgtggggtctccccat2520
gcgagagtagggaactgccaggcatcaaataaaacgaaaggctcagtcgaaagactgggc2580
ctttcgttttatctgttgtttgtcggtgaacgctctcctgagtaggacaaatccgccggg2640
agcggatttgaacgttgcgaagcaacggcccggagggtggcgggcaggacgcccgccata2700
aactgccaggcatcaaattaagcagaaggccatcctgacggatggcctttttgcgtttct2760
acaaactcttttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaat2820
aaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttcc2880
gtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaa2940
cgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaac3000
tggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatga3060
tgagcacttttaaagttctgctatgtggcgcggtattatcccgtgttgacgccgggcaag3120
agcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtca3180
cagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataacca3240
tgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaa3300
ccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagc3360
tgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaa3420
cgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatag3480
actggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggct3540
ggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcac3600
tggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaa3660
ctatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggt3720
aactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaat3780
ttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtg3840
agttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatc3900
ctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtgg3960
tttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagag4020
cgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaact4080
ctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtg4140
gcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagc4200
ggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccg4260
aactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaagg4320
cggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccag4380
ggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtc4440
gatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcct4500
ttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatccc4560
ctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagcc4620
gaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcctgatgcggtatt4680
ttctccttacgcatctgtgcggtatttcacaccgcatatggtgcactctcagtacaatct4740
gctctgatgccgcatagttaagccagtatacactccgctatcgctacgtgactgggtcat4800
ggctgcgccccgacacccgccaacacccgctgacgcgccctgacgggcttgtctgctccc4860
ggcatccgcttacagacaagctgtgaccgtctccgggagctgcatgtgtcagaggttttc4920
accgtcatcaccgaaacgcgcgaggcagcagatcaattcgcgcgcgaaggcgaagcggca4980
tgcataatgtgcctgtcaaatggacgaagcagggattctgcaaaccctatgctactccgt5040
caagccgtcaattgtctgattcgttaccaattatgacaacttgacggctacatcattcac5100
tttttcttcacaaccggcacggaactcgctcgggctggccccggtgcattttttaaatac5160
ccgcgagaaatagagttgatcgtcaaaaccaacattgcgaccgacggtggcgataggcat5220
ccgggtggtgctcaaaagcagcttcgcctggctgatacgttggtcctcgcgccagcttaa5280
gacgctaatccctaactgctggcggaaaagatgtgacagacgcgacggcgacaagcaaac5340
atgctgtgcgacgctggcgatatcaaaattgctgtctgccaggtgatcgctgatgtactg5400
acaagcctcgcgtacccgattatccatcggtggatggagcgactcgttaatcgcttccat5460
gcgccgcagtaacaattgctcaagcagatttatcgccagcagctccgaatagcgcccttc5520
cccttgcccggcgttaatgatttgcccaaacaggtcgctgaaatgcggctggtgcgcttc5580
atccgggcgaaagaaccccgtattggcaaatattgacggccagttaagccattcatgcca5640
gtaggcgcgcggacgaaagtaaacccactggtgataccattcgcgagcctccggatgacg5700
accgtagtgatgaatctctcctggcgggaacagcaaaatatcacccggtcggcaaacaaa5760
ttctcgtccctgatttttcaccaccccctgaccgcgaatggtgagattgagaatataacc5820
tttcattcccagcggtcggtcgataaaaaaatcgagataaccgttggcctcaatcggcgt5880
taaacccgccaccagatgggcattaaacgagtatcccggcagcaggggatcattttgcgc5940
ttcagccatacttttcatactcccgccattcagag5975
<210>3
<211>6142
<212>dna
<213>人工序列(artificialsequence)
<400>3
gttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagc60
tgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcgga120
agagcgcctgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcatatg180
gtgcactctcagtacaatctgctctgatgccgcatagttaagccagtatacactccgcta240
tcgctacgtgactgggtcatggctgcgccccgacacccgccaacacccgctgacgcgccc300
tgacgggcttgtctgctcccggcatccgcttacagacaagctgtgaccgtctccgggagc360
tgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgaggcagcagatcaattcg420
cgcgcgaaggcgaagcggcatgcataatgtgcctgtcaaatggacgaagcagggattctg480
caaaccctatgctactccgtcaagccgtcaattgtctgattcgttaccaattatgacaac540
ttgacggctacatcattcactttttcttcacaaccggcacggaactcgctcgggctggcc600
ccggtgcattttttaaatacccgcgagaaatagagttgatcgtcaaaaccaacattgcga660
ccgacggtggcgataggcatccgggtggtgctcaaaagcagcttcgcctggctgatacgt720
tggtcctcgcgccagcttaagacgctaatccctaactgctggcggaaaagatgtgacaga780
cgcgacggcgacaagcaaacatgctgtgcgacgctggcgatatcaaaattgctgtctgcc840
aggtgatcgctgatgtactgacaagcctcgcgtacccgattatccatcggtggatggagc900
gactcgttaatcgcttccatgcgccgcagtaacaattgctcaagcagatttatcgccagc960
agctccgaatagcgcccttccccttgcccggcgttaatgatttgcccaaacaggtcgctg1020
aaatgcggctggtgcgcttcatccgggcgaaagaaccccgtattggcaaatattgacggc1080
cagttaagccattcatgccagtaggcgcgcggacgaaagtaaacccactggtgataccat1140
tcgcgagcctccggatgacgaccgtagtgatgaatctctcctggcgggaacagcaaaata1200
tcacccggtcggcaaacaaattctcgtccctgatttttcaccaccccctgaccgcgaatg1260
gtgagattgagaatataacctttcattcccagcggtcggtcgataaaaaaatcgagataa1320
ccgttggcctcaatcggcgttaaacccgccaccagatgggcattaaacgagtatcccggc1380
agcaggggatcattttgcgcttcagccatacttttcatactcccgccattcagagaagaa1440
accaattgtccatattgcatcagacattgccgtcactgcgtcttttactggctcttctcg1500
ctaaccaaaccggtaaccccgcttattaaaagcattctgtaacaaagcgggaccaaagcc1560
atgacaaaaacgcgtaacaaaagtgtctataatcacggcagaaaagtccacattgattat1620
ttgcacggcgtcacactttgctatgccatagcatttttatccataagattagcggatcct1680
acctgacgctttttatcgcaactctctactgtttctccatacccgttttttgggctaaca1740
ggaggaattaaccatgaagcccgctgacgcgaaaccgccccacatggaccacgacacctt1800
ccgctccctgggccatcaggccatcgactggatcgccgactactggcagcgtttggcgga1860
gcgacccgtcgctccccccgtcgaacccggcagcatccgcgcccagttaccgacggcccc1920
acccgagtgcggcgaggactttcccgtactgctgtccgacctcgaacggatcgtgctgcc1980
gggcctgctgcactggcagcacccccgtttcttcggttacttccccgcgaacgcttccgg2040
ccccgccgtcctggccgagctgttgtccgcgggcctgggcatccaggggatgaactggaa2100
caccagcccggcctgcaccgagatcgaacagcagatgctggactggttcgtgcacctgct2160
cggcctacccgagcacctccgcggtgggggagtcatccaggacaccgcctccagcgccct2220
cctggtggcactgctcaccgccctgcaccaggccagtgcgggccgcacccgcgaccacgg2280
caccggcgagtgcggctaccgggtgtacctgaccgccgagacgcactcggcggcccgcaa2340
ggccgccgtcatcaccggactgggcctgcgggccatgtgcgaggtggccaccgacgccga2400
cggcgccatggacgcagtcgatctggaaagacacctccgggccgaccgggccgcaggtct2460
gaccccgctgatggtcgtggccacccgaggcaccacctcccatctctccttcgaccccct2520
ggaggacatcggccccgtgtgtcgtcggcacggcgtgtggctccacgtcgacgccgcata2580
cgccggagtggccgcggtctgcgacgaactgcgctgggtcaacgacggcgtgcgctacgc2640
ggactcctactgcaccaacccgcacaagtggctgctgaccaacttcgactgcgacctgct2700
gtgggtggcccaccccgaagtcctcgtcagcgccctgagcgtgctccccgaatacctgcg2760
caactcggcctccgaatcgggccgggtgaccgactaccggcactggcaggtcccactggg2820
ccggcgcttccgcgcactgaaactgtggtccgtcctccactggtacggcgccgaggggct2880
gcgcgcccacatccgcaccggcgttcggcatgcccagctcttcgcggacctggtcggcgc2940
cgacgaccgcttcaccctggtcacccctcccgccctcggcctggtgacgttccgtcagac3000
cggaacggacgaggagaaccggaacctcctgcaagccatcaacaccgagggaaccacctt3060
cctcacccactccgagaagaacggcaccttcttcctgcgcttcgccgccggcggcaccct3120
caccgaggaccaccacgtacgcgaagcatggcgcgccgtccagaacgcgatccctcgcgc3180
acaacacctcgccggcggctcggctgatgcgctgcccgagtagtttaactttaagaagga3240
gatatacatgaacaccttccggaccgcgacggcacgcgatctccccgatgtcgccgccac3300
cttgaccgaggcgttcgccgccgacccgccgacccaatgggtcttcccggacggtgccgc3360
tgcggtctcccgtttcttcttcggtgtcgccgaccgtgcccgcgaggccggcgggatcgt3420
cgaactactccccggcaccgccgcgatgatcgccctacccccgcacgtacgactacccga3480
cgccccagcctgcggccgacaggccgagatgcagcgcaggctgggcgaacgccgcccccg3540
cactccgcactactacctcctcttctacggcgtgcgcaccgcccatcagagctccggcct3600
ggggggacggatgctctccgacctcatctccctggccgaccgcgaccgcgtgggcaccta3660
caccgaggccagcacctggcgcggcgcccgcctgatgttgcgtcacggcttccacaccgc3720
acagccgctgcggcttccccacgggccacccatgttccccctctggagagacccgatcca3780
tgaccactgcgactgaaagcttggctgttttggcggatgagagaagattttcagcctgat3840
acagattaaatcagaacgcagaagcggtctgataaaacagaatttgcctggcggcagtag3900
cgcggtggtcccacctgaccccatgccgaactcagaagtgaaacgccgtagcgccgatgg3960
tagtgtggggtctccccatgcgagagtagggaactgccaggcatcaaataaaacgaaagg4020
ctcagtcgaaagactgggcctttcgttttatctgttgtttgtcggtgaacgctctcctga4080
gtaggacaaatccgccgggagcggatttgaacgttgcgaagcaacggcccggagggtggc4140
gggcaggacgcccgccataaactgccaggcatcaaattaagcagaaggccatcctgacgg4200
atggccttacaacttatatcgtatggggctgacttcaggtgctacatttgaagagataaa4260
ttgcactgaaatctagaaatattttatctgattaataagatgatcttcttgagatcgttt4320
tggtctgcgcgtaatctcttgctctgaaaacgaaaaaaccgccttgcagggcggtttttc4380
gaaggttctctgagctaccaactctttgaaccgaggtaactggcttggaggagcgcagtc4440
accaaaacttgtcctttcagtttagccttaaccggcgcatgacttcaagactaactcctc4500
taaatcaattaccagtggctgctgccagtggtgcttttgcatgtctttccgggttggact4560
caagacgatagttaccggataaggcgcagcggtcggactgaacggggggttcgtgcatac4620
agtccagcttggagcgaactgcctacccggaactgagtgtcaggcgtggaatgagacaaa4680
cgcggccataacagcggaatgacaccggtaaaccgaaaggcaggaacaggagagcgcacg4740
agggagccgccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccaccac4800
tgatttgagcgtcagatttcgtgatgcttgtcaggggggcggagcctatggaaaaacggc4860
tttgccgcggccctctcacttccctgttaagtatcttcctggcatcttccaggaaatctc4920
cgccccgttcgtaagccatttccgctcgccgcagtcgaacgaccgagcgtagcgagtcag4980
tgagcgaggaagcggaatatatcctgtatcacatattctgctgacgcaccggtgcagcct5040
tttttctcctgccacatgaagcacttcactgacaccctcatcagtgccaacatagtaagc5100
cagtatacactccgctagcgctgatgtccggcggtgcttttgccgttacgcaccaccccg5160
tcagtagctgaacaggagggacagctgatagaaacagaagccactggagcacctcaaaaa5220
caccatcatacactaaatcagtaagttggcagcatcacccgacgcactttgcgccgaata5280
aatacctgtgacggaagatcacttcgcagaataaataaatcctggtgtccctgttgatac5340
cgggaagccctgggccaacttttggcgaaaatgagacgttgatcggcacgtaagaggttc5400
caactttcaccataatgaaataagatcactaccgggcgtattttttgagttatcgagatt5460
ttcaggagctaaggaagctaaaatggagaaaaaaatcactggatataccaccgttgatat5520
atcccaatggcatcgtaaagaacattttgaggcatttcagtcagttgctcaatgtaccta5580
taaccagaccgttcagctggatattacggcctttttaaagaccgtaaagaaaaataagca5640
caagttttatccggcctttattcacattcttgcccgcctgatgaatgctcatccggaatt5700
ccgtatggcaatgaaagacggtgagctggtgatatgggatagtgttcacccttgttacac5760
cgttttccatgagcaaactgaaacgttttcatcgctctggagtgaataccacgacgattt5820
ccggcagtttctacacatatattcgcaagatgtggcgtgttacggtgaaaacctggccta5880
tttccctaaagggtttattgagaatatgtttttcgtctcagccaatccctgggtgagttt5940
caccagttttgatttaaacgtggccaatatggacaacttcttcgcccccgttttcaccat6000
gggcaaatattatacgcaaggcgacaaggtgctgatgccgctggcgattcaggttcatca6060
tgccgtctgtgatggcttccatgtcggcagaatgcttaatgaattacaacagtactgcga6120
tgagtggcagggcggggcgtaa6142
<210>4
<211>4847
<212>dna
<213>人工序列(artificialsequence)
<400>4
aagaaaccaattgtccatattgcatcagacattgccgtcactgcgtcttttactggctct60
tctcgctaaccaaaccggtaaccccgcttattaaaagcattctgtaacaaagcgggacca120
aagccatgacaaaaacgcgtaacaaaagtgtctataatcacggcagaaaagtccacattg180
attatttgcacggcgtcacactttgctatgccatagcatttttatccataagattagcgg240
atcctacctgacgctttttatcgcaactctctactgtttctccatacccgttttttgggc300
taacaggaggaattaaccatgaacacagcgccgcgccgcgtcgagaaccagctcaccgac360
aagggctatgtgccggtctacaccaccgcggtggtggagcagccgtgggatggttacagc420
gccgacgaccatgccacctggggcacgctgtaccggcggcagcgcgcgctgctggtcggg480
cgggcctgcgatgagttcctgcaggcgcaggacgcaatgggcatggacgacacccagatt540
ccgcgcttcgacgcgctcaacgcggtgctgcaggcgaccaccggctggacgctggtcggt600
gtggaagggctgctgccggagctggatttcttcgatcatctggccaaccggcgcttcccg660
gtgacctggtggatccgccgcccggaccagatcgactacatcgccgaaccggacctgttc720
catgatctgttcgggcacgtgccgctgctgatgaatccgctgtttgccgacttcatgcag780
gcctatgggcgcggtggcgtcaaggcgcacggaattggcccggacgcgttgcaaaatctc840
acccggctgtacttctacacggtggaattcggcctgattgccacgccgcaggggttgcgc900
atctacggtgcgggcatcgtctcgtccaagggcgaatcgctgcattcgctggaatcggcg960
gcgccgaaccgggtgggcttcgatctgcagcgggtgatgcgcacgcgctaccgcatcgac1020
agtttccaaaagacctacttcgtcatcgacagctttacgcagctgatggacgccaccgcc1080
ccggatttcaccccgatctatgccgcgctggcgcaacagccgcaggtgccggccggcgag1140
gtgctggcaaccgaccacgtcctgcagcgcggcagcggcgaaggctggagccgcgacggc1200
gacgtgtaaaagcttggctgttttggcggatgagagaagattttcagcctgatacagatt1260
aaatcagaacgcagaagcggtctgataaaacagaatttgcctggcggcagtagcgcggtg1320
gtcccacctgaccccatgccgaactcagaagtgaaacgccgtagcgccgatggtagtgtg1380
gggtctccccatgcgagagtagggaactgccaggcatcaaataaaacgaaaggctcagtc1440
gaaagactgggcctttcgttttatctgttgtttgtcggtgaacgctctcctgagtaggac1500
aaatccgccgggagcggatttgaacgttgcgaagcaacggcccggagggtggcgggcagg1560
acgcccgccataaactgccaggcatcaaattaagcagaaggccatcctgacggatggcct1620
ttttgcgtttctacaaactcttttgtttatttttctaaatacattcaaatatgtatccgc1680
tcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagta1740
ttcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttg1800
ctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgg1860
gttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaac1920
gttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtgttg1980
acgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagt2040
actcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtg2100
ctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggac2160
cgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgtt2220
gggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtag2280
caatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggc2340
aacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggccc2400
ttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggta2460
tcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacgg2520
ggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactga2580
ttaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaac2640
ttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaa2700
tcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggat2760
cttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgc2820
taccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactg2880
gcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccacc2940
acttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtgg3000
ctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccgg3060
ataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaa3120
cgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccg3180
aagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacga3240
gggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctct3300
gacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgcca3360
gcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttc3420
ctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccg3480
ctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcc3540
tgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcatatggtgcactc3600
tcagtacaatctgctctgatgccgcatagttaagccagtatacactccgctatcgctacg3660
tgactgggtcatggctgcgccccgacacccgccaacacccgctgacgcgccctgacgggc3720
ttgtctgctcccggcatccgcttacagacaagctgtgaccgtctccgggagctgcatgtg3780
tcagaggttttcaccgtcatcaccgaaacgcgcgaggcagcagatcaattcgcgcgcgaa3840
ggcgaagcggcatgcataatgtgcctgtcaaatggacgaagcagggattctgcaaaccct3900
atgctactccgtcaagccgtcaattgtctgattcgttaccaattatgacaacttgacggc3960
tacatcattcactttttcttcacaaccggcacggaactcgctcgggctggccccggtgca4020
ttttttaaatacccgcgagaaatagagttgatcgtcaaaaccaacattgcgaccgacggt4080
ggcgataggcatccgggtggtgctcaaaagcagcttcgcctggctgatacgttggtcctc4140
gcgccagcttaagacgctaatccctaactgctggcggaaaagatgtgacagacgcgacgg4200
cgacaagcaaacatgctgtgcgacgctggcgatatcaaaattgctgtctgccaggtgatc4260
gctgatgtactgacaagcctcgcgtacccgattatccatcggtggatggagcgactcgtt4320
aatcgcttccatgcgccgcagtaacaattgctcaagcagatttatcgccagcagctccga4380
atagcgcccttccccttgcccggcgttaatgatttgcccaaacaggtcgctgaaatgcgg4440
ctggtgcgcttcatccgggcgaaagaaccccgtattggcaaatattgacggccagttaag4500
ccattcatgccagtaggcgcgcggacgaaagtaaacccactggtgataccattcgcgagc4560
ctccggatgacgaccgtagtgatgaatctctcctggcgggaacagcaaaatatcacccgg4620
tcggcaaacaaattctcgtccctgatttttcaccaccccctgaccgcgaatggtgagatt4680
gagaatataacctttcattcccagcggtcggtcgataaaaaaatcgagataaccgttggc4740
ctcaatcggcgttaaacccgccaccagatgggcattaaacgagtatcccggcagcagggg4800
atcattttgcgcttcagccatacttttcatactcccgccattcagag4847
<210>5
<211>7270
<212>dna
<213>人工序列(artificialsequence)
<400>5
gttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagc60
tgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcgga120
agagcgcctgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcatatg180
gtgcactctcagtacaatctgctctgatgccgcatagttaagccagtatacactccgcta240
tcgctacgtgactgggtcatggctgcgccccgacacccgccaacacccgctgacgcgccc300
tgacgggcttgtctgctcccggcatccgcttacagacaagctgtgaccgtctccgggagc360
tgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgaggcagcagatcaattcg420
cgcgcgaaggcgaagcggcatgcataatgtgcctgtcaaatggacgaagcagggattctg480
caaaccctatgctactccgtcaagccgtcaattgtctgattcgttaccaattatgacaac540
ttgacggctacatcattcactttttcttcacaaccggcacggaactcgctcgggctggcc600
ccggtgcattttttaaatacccgcgagaaatagagttgatcgtcaaaaccaacattgcga660
ccgacggtggcgataggcatccgggtggtgctcaaaagcagcttcgcctggctgatacgt720
tggtcctcgcgccagcttaagacgctaatccctaactgctggcggaaaagatgtgacaga780
cgcgacggcgacaagcaaacatgctgtgcgacgctggcgatatcaaaattgctgtctgcc840
aggtgatcgctgatgtactgacaagcctcgcgtacccgattatccatcggtggatggagc900
gactcgttaatcgcttccatgcgccgcagtaacaattgctcaagcagatttatcgccagc960
agctccgaatagcgcccttccccttgcccggcgttaatgatttgcccaaacaggtcgctg1020
aaatgcggctggtgcgcttcatccgggcgaaagaaccccgtattggcaaatattgacggc1080
cagttaagccattcatgccagtaggcgcgcggacgaaagtaaacccactggtgataccat1140
tcgcgagcctccggatgacgaccgtagtgatgaatctctcctggcgggaacagcaaaata1200
tcacccggtcggcaaacaaattctcgtccctgatttttcaccaccccctgaccgcgaatg1260
gtgagattgagaatataacctttcattcccagcggtcggtcgataaaaaaatcgagataa1320
ccgttggcctcaatcggcgttaaacccgccaccagatgggcattaaacgagtatcccggc1380
agcaggggatcattttgcgcttcagccatacttttcatactcccgccattcagagaagaa1440
accaattgtccatattgcatcagacattgccgtcactgcgtcttttactggctcttctcg1500
ctaaccaaaccggtaaccccgcttattaaaagcattctgtaacaaagcgggaccaaagcc1560
atgacaaaaacgcgtaacaaaagtgtctataatcacggcagaaaagtccacattgattat1620
ttgcacggcgtcacactttgctatgccatagcatttttatccataagattagcggatcct1680
acctgacgctttttatcgcaactctctactgtttctccatacccgttttttgggctaaca1740
ggaggaattaaccatgaagcccgctgacgcgaaaccgccccacatggaccacgacacctt1800
ccgctccctgggccatcaggccatcgactggatcgccgactactggcagcgtttggcgga1860
gcgacccgtcgctccccccgtcgaacccggcagcatccgcgcccagttaccgacggcccc1920
acccgagtgcggcgaggactttcccgtactgctgtccgacctcgaacggatcgtgctgcc1980
gggcctgctgcactggcagcacccccgtttcttcggttacttccccgcgaacgcttccgg2040
ccccgccgtcctggccgagctgttgtccgcgggcctgggcatccaggggatgaactggaa2100
caccagcccggcctgcaccgagatcgaacagcagatgctggactggttcgtgcacctgct2160
cggcctacccgagcacctccgcggtgggggagtcatccaggacaccgcctccagcgccct2220
cctggtggcactgctcaccgccctgcaccaggccagtgcgggccgcacccgcgaccacgg2280
caccggcgagtgcggctaccgggtgtacctgaccgccgagacgcactcggcggcccgcaa2340
ggccgccgtcatcaccggactgggcctgcgggccatgtgcgaggtggccaccgacgccga2400
cggcgccatggacgcagtcgatctggaaagacacctccgggccgaccgggccgcaggtct2460
gaccccgctgatggtcgtggccacccgaggcaccacctcccatctctccttcgaccccct2520
ggaggacatcggccccgtgtgtcgtcggcacggcgtgtggctccacgtcgacgccgcata2580
cgccggagtggccgcggtctgcgacgaactgcgctgggtcaacgacggcgtgcgctacgc2640
ggactcctactgcaccaacccgcacaagtggctgctgaccaacttcgactgcgacctgct2700
gtgggtggcccaccccgaagtcctcgtcagcgccctgagcgtgctccccgaatacctgcg2760
caactcggcctccgaatcgggccgggtgaccgactaccggcactggcaggtcccactggg2820
ccggcgcttccgcgcactgaaactgtggtccgtcctccactggtacggcgccgaggggct2880
gcgcgcccacatccgcaccggcgttcggcatgcccagctcttcgcggacctggtcggcgc2940
cgacgaccgcttcaccctggtcacccctcccgccctcggcctggtgacgttccgtcagac3000
cggaacggacgaggagaaccggaacctcctgcaagccatcaacaccgagggaaccacctt3060
cctcacccactccgagaagaacggcaccttcttcctgcgcttcgccgccggcggcaccct3120
caccgaggaccaccacgtacgcgaagcatggcgcgccgtccagaacgcgatccctcgcgc3180
acaacacctcgccggcggctcggctgatgcgctgcccgagtagtttaactttaagaagga3240
gatatacatgaacaccttccggaccgcgacggcacgcgatctccccgatgtcgccgccac3300
cttgaccgaggcgttcgccgccgacccgccgacccaatgggtcttcccggacggtgccgc3360
tgcggtctcccgtttcttcttcggtgtcgccgaccgtgcccgcgaggccggcgggatcgt3420
cgaactactccccggcaccgccgcgatgatcgccctacccccgcacgtacgactacccga3480
cgccccagcctgcggccgacaggccgagatgcagcgcaggctgggcgaacgccgcccccg3540
cactccgcactactacctcctcttctacggcgtgcgcaccgcccatcagagctccggcct3600
ggggggacggatgctctccgacctcatctccctggccgaccgcgaccgcgtgggcaccta3660
caccgaggccagcacctggcgcggcgcccgcctgatgttgcgtcacggcttccacaccgc3720
acagccgctgcggcttccccacgggccacccatgttccccctctggagagacccgatcca3780
tgaccactgcgactgatttaactttaagaaggagatatacatgaccgcactcacccaagc3840
ccattgcgaagcctgccgcgcagacgccccgcacgtcagcgacgaagaactgcccgtgct3900
gctgcggcaaatcccggattggaacatcgaagtccgcgacggcatcatgcagctagagaa3960
ggtctacctgttcaagaacttcaagcatgccctggccttcaccaatgccgtcggcgagat4020
atccgaggccgaaggccaccatccgggcctgctgaccgagtggggcaaagtcaccgtgac4080
ctggtggagccactcgatcaagggcctgcaccgcaacgatttcatcatggcggcgcgcac4140
cgatgaggtagcgaaaaccgccgaggggcgcaaataatttaactttaagaaggagatata4200
catgggtaaaacccagcccttgccaatattaattactggcggaggtcgtcgcatcggcct4260
cgccctcgcatggcatttcattaatcaaaagcaaccggtgattgtcagctatcggacaca4320
ctatccagccattgatggactgattaatgcaggtgcgcagtgtattcaggctgatttttc4380
gaccaacgacggtgtgatggcgtttgccgatgaagtactaaaaagcacccatggtctgcg4440
tgctattttgcataacgccagtgcgtggatggcggaaaaaccgggtgcgccactggccga4500
cgtactggcttgcatgatgcagatccacgttaataccccatacctgctcaaccatgcgct4560
ggaaagattactgcgtgggcacggacacgccgccagcgatatcattcactttaccgatta4620
tgtggtggagcgcggtagcgacaaacatattgcgtatgctgcaagcaaagcggcactgga4680
taatatgacccgctcgtttgcccgcaagctggcaccggaagtgaaagtgaattctattgc4740
gccatcgctgatcctgtttaatgaacatgatgatgccgaatatcgacaacaggcgctgaa4800
taaatcactgatgaaaaccgcgcctggcgagaaagaagtgatcgacctggtcgattactt4860
acttaccagttgctttgtcaccggacgcagtttcccacttgatggcggtcgtcatctgcg4920
ttaaaagcttggctgttttggcggatgagagaagattttcagcctgatacagattaaatc4980
agaacgcagaagcggtctgataaaacagaatttgcctggcggcagtagcgcggtggtccc5040
acctgaccccatgccgaactcagaagtgaaacgccgtagcgccgatggtagtgtggggtc5100
tccccatgcgagagtagggaactgccaggcatcaaataaaacgaaaggctcagtcgaaag5160
actgggcctttcgttttatctgttgtttgtcggtgaacgctctcctgagtaggacaaatc5220
cgccgggagcggatttgaacgttgcgaagcaacggcccggagggtggcgggcaggacgcc5280
cgccataaactgccaggcatcaaattaagcagaaggccatcctgacggatggccttacaa5340
cttatatcgtatggggctgacttcaggtgctacatttgaagagataaattgcactgaaat5400
ctagaaatattttatctgattaataagatgatcttcttgagatcgttttggtctgcgcgt5460
aatctcttgctctgaaaacgaaaaaaccgccttgcagggcggtttttcgaaggttctctg5520
agctaccaactctttgaaccgaggtaactggcttggaggagcgcagtcaccaaaacttgt5580
cctttcagtttagccttaaccggcgcatgacttcaagactaactcctctaaatcaattac5640
cagtggctgctgccagtggtgcttttgcatgtctttccgggttggactcaagacgatagt5700
taccggataaggcgcagcggtcggactgaacggggggttcgtgcatacagtccagcttgg5760
agcgaactgcctacccggaactgagtgtcaggcgtggaatgagacaaacgcggccataac5820
agcggaatgacaccggtaaaccgaaaggcaggaacaggagagcgcacgagggagccgcca5880
gggggaaacgcctggtatctttatagtcctgtcgggtttcgccaccactgatttgagcgt5940
cagatttcgtgatgcttgtcaggggggcggagcctatggaaaaacggctttgccgcggcc6000
ctctcacttccctgttaagtatcttcctggcatcttccaggaaatctccgccccgttcgt6060
aagccatttccgctcgccgcagtcgaacgaccgagcgtagcgagtcagtgagcgaggaag6120
cggaatatatcctgtatcacatattctgctgacgcaccggtgcagccttttttctcctgc6180
cacatgaagcacttcactgacaccctcatcagtgccaacatagtaagccagtatacactc6240
cgctagcgctgatgtccggcggtgcttttgccgttacgcaccaccccgtcagtagctgaa6300
caggagggacagctgatagaaacagaagccactggagcacctcaaaaacaccatcataca6360
ctaaatcagtaagttggcagcatcacccgacgcactttgcgccgaataaatacctgtgac6420
ggaagatcacttcgcagaataaataaatcctggtgtccctgttgataccgggaagccctg6480
ggccaacttttggcgaaaatgagacgttgatcggcacgtaagaggttccaactttcacca6540
taatgaaataagatcactaccgggcgtattttttgagttatcgagattttcaggagctaa6600
ggaagctaaaatggagaaaaaaatcactggatataccaccgttgatatatcccaatggca6660
tcgtaaagaacattttgaggcatttcagtcagttgctcaatgtacctataaccagaccgt6720
tcagctggatattacggcctttttaaagaccgtaaagaaaaataagcacaagttttatcc6780
ggcctttattcacattcttgcccgcctgatgaatgctcatccggaattccgtatggcaat6840
gaaagacggtgagctggtgatatgggatagtgttcacccttgttacaccgttttccatga6900
gcaaactgaaacgttttcatcgctctggagtgaataccacgacgatttccggcagtttct6960
acacatatattcgcaagatgtggcgtgttacggtgaaaacctggcctatttccctaaagg7020
gtttattgagaatatgtttttcgtctcagccaatccctgggtgagtttcaccagttttga7080
tttaaacgtggccaatatggacaacttcttcgcccccgttttcaccatgggcaaatatta7140
tacgcaaggcgacaaggtgctgatgccgctggcgattcaggttcatcatgccgtctgtga7200
tggcttccatgtcggcagaatgcttaatgaattacaacagtactgcgatgagtggcaggg7260
cggggcgtaa7270
<210>6
<211>296
<212>prt
<213>人工序列(artificialsequence)
<400>6
metasnthralaproargargvalgluasnglnleuthrasplysgly
151015
tyrvalprovaltyrthrthralavalvalgluglnprotrpaspgly
202530
tyrseralaaspasphisalathrtrpglythrleutyrargarggln
354045
argalaleuleuvalglyargalacysaspglupheleuglnalagln
505560
aspalametglymetaspaspthrglnileproargpheaspalaleu
65707580
asnalavalleuglnalathrthrglytrpthrleuvalglyvalglu
859095
glyleuleuprogluleuaspphepheasphisleualaasnargarg
100105110
pheprovalthrtrptrpileargargproaspglnileasptyrile
115120125
alagluproaspleuphehisaspleupheglyhisvalproleuleu
130135140
metasnproleuphealaaspphemetglnalatyrglyargglygly
145150155160
vallysalahisglyileglyproaspalaleuglnasnleuthrarg
165170175
leutyrphetyrthrvalglupheglyleuilealathrproglngly
180185190
leuargiletyrglyalaglyilevalserserlysglygluserleu
195200205
hisserleugluseralaalaproasnargvalglypheaspleugln
210215220
argvalmetargthrargtyrargileaspserpheglnlysthrtyr
225230235240
phevalileaspserphethrglnleumetaspalathralaproasp
245250255
phethrproiletyralaalaleualaglnglnproglnvalproala
260265270
glygluvalleualathrasphisvalleuglnargglyserglyglu
275280285
glytrpserargaspglyaspval
290295
<210>7
<211>240
<212>prt
<213>人工序列(artificialsequence)
<400>7
metglylysthrglnproleuproileleuilethrglyglyglyarg
151015
argileglyleualaleualatrphispheileasnglnlysglnpro
202530
valilevalsertyrargthrhistyrproalaileaspglyleuile
354045
asnalaglyalaglncysileglnalaasppheserthrasnaspgly
505560
valmetalaphealaaspgluvalleulysserthrhisglyleuarg
65707580
alaileleuhisasnalaseralatrpmetalaglulysproglyala
859095
proleualaaspvalleualacysmetmetglnilehisvalasnthr
100105110
protyrleuleuasnhisalaleugluargleuleuargglyhisgly
115120125
hisalaalaseraspileilehisphethrasptyrvalvalgluarg
130135140
glyserasplyshisilealatyralaalaserlysalaalaleuasp
145150155160
asnmetthrargserphealaarglysleualaprogluvallysval
165170175
asnserilealaproserleuileleupheasngluhisaspaspala
180185190
glutyrargglnglnalaleuasnlysserleumetlysthralapro
195200205
glyglulysgluvalileaspleuvalasptyrleuleuthrsercys
210215220
phevalthrglyargserpheproleuaspglyglyarghisleuarg
225230235240
<210>8
<211>118
<212>prt
<213>人工序列(artificialsequence)
<400>8
metthralaleuthrglnalahiscysglualacysargalaaspala
151015
prohisvalseraspglugluleuprovalleuleuargglnilepro
202530
asptrpasnilegluvalargaspglyilemetglnleuglulysval
354045
tyrleuphelysasnphelyshisalaleualaphethrasnalaval
505560
glygluileserglualagluglyhishisproglyleuleuthrglu
65707580
trpglylysvalthrvalthrtrptrpserhisserilelysglyleu
859095
hisargasnasppheilemetalaalaargthraspgluvalalalys
100105110
thralagluglyarglys
115
<210>9
<211>492
<212>prt
<213>人工序列(artificialsequence)
<400>9
metargargarglysproalaaspalalysproprohismetasphis
151015
aspthrpheargserleuglyhisglnalaileasptrpilealaasp
202530
tyrtrpglnargleualagluargprovalalaproprovalglupro
354045
glyserileargalaglnleuprothralaproproglucysglyglu
505560
asppheprovalleuleuseraspleugluargilevalleuprogly
65707580
leuleuhistrpglnhisproargphepheglytyrpheproalaasn
859095
alaserglyproalavalleualagluleuleuseralaglyleugly
100105110
ileglnglymetasntrpasnthrserproalacysthrgluileglu
115120125
glnglnmetleuasptrpphevalhisleuleuglyleuprogluhis
130135140
leuargglyglyglyvalileglnaspthralaserseralaleuleu
145150155160
valalaleuleuthralaleuhisglnalaseralaglyargthrarg
165170175
asphisglythrglyglucysglytyrargvaltyrleuthralaglu
180185190
thrhisseralaalaarglysalaalavalilethrglyleuglyleu
195200205
argalametcysgluvalalathraspalaaspglyalametaspala
210215220
valaspleugluarghisleuargalaaspargalaalaglyleuthr
225230235240
proleumetvalvalalathrargglythrthrserhisleuserphe
245250255
aspproleugluaspileglyprovalcysargarghisglyvaltrp
260265270
leuhisvalaspalaalatyralaglyvalalaalavalcysaspglu
275280285
leuargtrpvalasnaspglyvalargtyralaaspsertyrcysthr
290295300
asnprohislystrpleuleuthrasnpheaspcysaspleuleutrp
305310315320
valalahisprogluvalleuvalseralaleuservalleuproglu
325330335
tyrleuargasnseralasergluserglyargvalthrasptyrarg
340345350
histrpglnvalproleuglyargargpheargalaleulysleutrp
355360365
servalleuhistrptyrglyalagluglyleuargalahisilearg
370375380
thrglyvalarghisalaglnleuphealaaspleuvalglyalaasp
385390395400
aspargphethrleuvalthrproproalaleuglyleuvalthrphe
405410415
argglnthrglythraspglugluasnargasnleuleuglnalaile
420425430
asnthrgluglythrthrpheleuthrhisserglulysasnglythr
435440445
phepheleuargphealaalaglyglythrleuthrgluasphishis
450455460
valargglualatrpargalavalglnasnalaileproargalagln
465470475480
hisleualaglyglyseralaaspalaleuproglu
485490
<210>10
<211>182
<212>prt
<213>人工序列(artificialsequence)
<400>10
metasnthrpheargthralathralaargaspleuproaspvalala
151015
alathrleuthrglualaphealaalaaspproprothrglntrpval
202530
pheproaspglyalaalaalavalserargphephepheglyvalala
354045
aspargalaargglualaglyglyilevalgluleuleuproglythr
505560
alaalametilealaleuproprohisvalargleuproaspalapro
65707580
alacysglyargglnalaglumetglnargargleuglygluargarg
859095
proargthrprohistyrtyrleuleuphetyrglyvalargthrala
100105110
hisglnserserglyleuglyglyargmetleuseraspleuileser
115120125
leualaaspargaspargvalglythrtyrthrglualaserthrtrp
130135140
argglyalaargleumetleuarghisglyphehisthralaglnpro
145150155160
leuargleuprohisglyproprometpheproleutrpargasppro
165170175
ilehisasphiscysasp
180