产N-乙酰-5-羟色胺的重组大肠杆菌及其构建方法和应用与流程

文档序号:21190460发布日期:2020-06-20 18:26阅读:189来源:国知局
产N-乙酰-5-羟色胺的重组大肠杆菌及其构建方法和应用与流程

本发明涉及基因工程领域,具体涉及一种产n-乙酰-5-羟色胺的重组大肠杆菌及其构建方法和应用。



背景技术:

n-乙酰-5-羟色胺(n-acetyl-serotonin,c12h14n2o2)属于色氨酸的衍生物,是褪黑素合成的前体,其合成途径广泛存在于自然界生物中,细胞内经典的合成途径为:色氨酸—5-羟色氨酸—5-羟色胺—n-乙酰-5-羟色胺。n-乙酰-5-羟色胺在生物体内发挥着许多重要作用,作为褪黑素前体,n-乙酰-5-羟色胺也具有良好的抗氧化能力,如可以有效地防护紫外光可能引起的光致癌及dna损伤,同时n-乙酰-5-羟色胺对脑损伤/中风/神经损伤恢复中发挥重要作用,具有神经保护剂的功能。

目前为止,n-乙酰-5-羟色胺生产是由化学合成完成的,其合成步骤繁琐、得率较低、手性不唯一,不可避免地产生原料浪费和化学污染。随着合成生物学的发展,越来越多的化合物实现了生物绿色生产,通过推测化合物在原宿主中的可能合成路线,鉴定出涉及的基因,解析出目标化合物的合成途径,在生产菌株中通过分子生物学技术引入相关基因重现合成途径,从廉价的原料如葡萄糖催化出高附加值的目标产物。虽然,色氨酸衍生物的合成途径解析的非常清楚,但其中涉及的蛋白本身比活较低,多数难以在现有的成熟表达系统中表达,基本形成包涵体或表达量极低,因此,目前为止还有没有高产n-乙酰-5-羟色胺的工程菌株。



技术实现要素:

本发明所要解决的技术问题为提供n-乙酰-5-羟色胺高产菌株,以实现发酵法高效大规模工业化生产n-乙酰-5-羟色胺。

为解决上述技术问题,本发明首先提供了一种重组大肠杆菌。

本发明所述重组大肠杆菌与受体大肠杆菌相比,所述重组大肠杆菌中色氨酸衍生物合成相关蛋白的基因的表达量增加和/或所述色氨酸衍生物合成相关蛋白的含量增加和/或所述色氨酸衍生物合成相关蛋白的活性增加;

所述色氨酸衍生物合成相关蛋白选自如下至少一种:

p1)苯丙氨酸羟化酶;

p2)二氢单磷酸还原酶(folm);

p3)4a-羟基四氢生物蝶呤脱水酶(phhb);

p4)天冬氨酸转氨酶家族蛋白(aspartateaminotransferasefamilyprotein);

p5)n-乙酰转移酶(n-acetyltransferase)。

上述重组大肠杆菌中,所述苯丙氨酸羟化酶(记为x)来自野油菜黄单胞菌(xanthomonascampestrispv.campestrisstr.atcc33913)、二氢单磷酸还原酶(folm,记为m)来自大肠杆菌(escherichiacolistr.k-12substr.mg1655)、4a-羟基四氢生物蝶呤脱水酶(phhb,记为p)来自铜绿假单胞菌(pseudomonasaeruginosapao1)、天冬氨酸转氨酶家族蛋白(aspartateaminotransferasefamilyprotein,ncbireferencesequence:wp_103377132.1,记为h)和n-乙酰转移酶(n-acetyltransferase,ncbireferencesequencwp_020929557.1,记为f)来自小白链霉菌(streptomycesalbulus)。

上述重组大肠杆菌中,所述受体大肠杆菌可为大肠杆菌k12;具体为大肠杆菌k12菌株bw25113。

在本发明具体的实施方式中,所述苯丙氨酸羟化酶可为如下a1)或a2)所示的蛋白质:

a1)seqidno.1第319-1209位所示的dna分子编码的蛋白质;

a2)将a1)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与a1)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;

所述二氢单磷酸还原酶可为如下a3)或a4)所示的蛋白质:

a3)seqidno.1第1615-2337位所示的dna分子编码的蛋白质;

a4)将a3)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与a3)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;

所述4a-羟基四氢生物蝶呤脱水酶可为如下a5)或a6)所示的蛋白质:

a5)seqidno.1第1234-1590位所示的dna分子编码的蛋白质;

a6)将a5)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与a5)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;

所述天冬氨酸转氨酶家族蛋白可为如下a7)或a8)所示的蛋白质:

a7)seqidno.1第2362-3831位所示的dna分子编码的蛋白质;

a8)将a7)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与a7)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;

所述n-乙酰转移酶可为如下a9)或a10)所示的蛋白质:

a9)seqidno.1第3856-4404位所示的dna分子编码的蛋白质;

a10)将a9)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与a9)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质。

其中,seqidno.1第319-1209位由891个核苷酸组成,第319-1209位为编码序列,编码seqidno.6所示的苯丙氨酸羟化酶。

seqidno.1第1615-2337位由723个核苷酸组成,第1615-2337位为编码序列,编码seqidno.7所示的二氢单磷酸还原酶。

seqidno.1第1234-1590位由357个核苷酸组成,第1234-1590位为编码序列,编码seqidno.8所示的4a-羟基四氢生物蝶呤脱水酶。

seqidno.1第2362-3831位由1470个核苷酸组成,第2362-3831位为编码序列,编码seqidno.9所示的天冬氨酸转氨酶家族蛋白。

seqidno.1第3856-4404位由549个核苷酸组成,第3856-4404位为编码序列,编码seqidno.10所示的n-乙酰转移酶。

上述重组大肠杆菌中,同一性是指氨基酸序列的同一性。可使用国际互联网上的同源性检索站点测定氨基酸序列的同一性,如ncbi主页网站的blast网页。例如,可在高级blast2.1中,通过使用blastp作为程序,将expect值设置为10,将所有filter设置为off,使用blosum62作为matrix,将gapexistencecost,perresiduegapcost和lambdaratio分别设置为11,1和0.85(缺省值)并进行检索一对氨基酸序列的同一性进行计算,然后即可获得同一性的值(%)。

上述重组大肠杆菌中,所述90%以上的同一性可为至少91%、92%、95%、96%、98%、99%或100%的同一性。

上述重组大肠杆菌中,所述苯丙氨酸羟化酶的基因可为如下b1)或b2)所示:

b1)编码序列为seqidno.1第319-1209位所示的dna分子;

b2)将seqidno.1第319-1209位所示的dna分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与seqidno.1第319-1209位所示的dna分子具有相同功能的dna分子;

所述二氢单磷酸还原酶的基因可为如下b3)或b4)所示:

b3)编码序列为seqidno.1第1615-2337位所示的dna分子;

b4)将seqidno.1第1615-2337位所示的dna分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与seqidno.1第1615-2337位所示的dna分子具有相同功能的dna分子;

所述4a-羟基四氢生物蝶呤脱水酶的基因可为如下b5)或b6)所示:

b5)编码序列为seqidno.1第1234-1590位所示的dna分子;

b6)将seqidno.1第1234-1590位所示的dna分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与seqidno.1第1234-1590位所示的dna分子具有相同功能的dna分子;

所述天冬氨酸转氨酶家族蛋白的基因可为如下b7)或b8)所示:

b7)编码序列为seqidno.1第2362-3831位所示的dna分子;

b8)将seqidno.1第2362-3831位所示的dna分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与seqidno.1第2362-3831位所示的dna分子具有相同功能的dna分子;

所述n-乙酰转移酶的基因可为如下b9)或b10)所示:

b9)编码序列为seqidno.1第3856-4404位所示的dna分子;

b10)将seqidno.1第3856-4404位所示的dna分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与seqidno.1第3856-4404位所示的dna分子具有相同功能的dna分子。

本发明进一步提供了重组大肠杆菌的构建方法。

本发明重组大肠杆菌的构建方法,包括如下步骤:将色氨酸衍生物合成相关蛋白的基因导入受体大肠杆菌,得到重组大肠杆菌;

所述色氨酸衍生物合成相关蛋白的基因选自如下至少一种:

p1)苯丙氨酸羟化酶基因;

p2)二氢单磷酸还原酶(folm)基因;

p3)4a-羟基四氢生物蝶呤脱水酶(phhb)基因;

p4)天冬氨酸转氨酶家族蛋白(aspartateaminotransferasefamilyprotein)基因;

p5)n-乙酰转移酶(n-acetyltransferase)基因。

上述重组大肠杆菌中,所述苯丙氨酸羟化酶(记为x)来自野油菜黄单胞菌(xanthomonascampestrispv.campestrisstr.atcc33913)、二氢单磷酸还原酶(folm,记为m)来自大肠杆菌(escherichiacolistr.k-12substr.mg1655)、4a-羟基四氢生物蝶呤脱水酶(phhb,记为p)来自铜绿假单胞菌(pseudomonasaeruginosapao1)、天冬氨酸转氨酶家族蛋白(aspartateaminotransferasefamilyprotein,ncbireferencesequence:wp_103377132.1,记为h)和n-乙酰转移酶(n-acetyltransferase,ncbireferencesequencwp_020929557.1,记为f)来自小白链霉菌(streptomycesalbulus)。

上述构建方法中,所述色氨酸衍生物合成相关蛋白的基因导入受体大肠杆菌是对所述受体大肠杆菌基因组进行下述m1)-m5)全部、任四种、任三种、任两种或任一种的改造得到的:

m1)过表达苯丙氨酸羟化酶基因;

m2)过表达二氢单磷酸还原酶(folm)基因;

m3)过表达4a-羟基四氢生物蝶呤脱水酶(phhb)基因;

m4)过表达天冬氨酸转氨酶家族蛋白(aspartateaminotransferasefamilyprotein)基因;

m5)过表达n-乙酰转移酶(n-acetyltransferase)基因。

在本发明具体的实施方式中,所述色氨酸衍生物合成相关蛋白的基因通过方式甲或方式乙或方式丙导入所述受体大肠杆菌中;

所述方式甲为所述苯丙氨酸羟化酶(记为x)的基因构建在一个表达载体上,所述天冬氨酸转氨酶家族蛋白(记为h)、n-乙酰转移酶(记为f)、4a-羟基四氢生物蝶呤脱水酶(记为p)和二氢单磷酸还原酶(记为m)的基因构建在另一个表达载体上,所述表达载体中四个基因的位置关系为天冬氨酸转氨酶家族蛋白(记为h)、n-乙酰转移酶(记为f)、4a-羟基四氢生物蝶呤脱水酶(记为p)和二氢单磷酸还原酶(记为m)的基因依次连接(即天冬氨酸转氨酶家族蛋白基因位于n-乙酰转移酶基因的上游、n-乙酰转移酶基因位于4a-羟基四氢生物蝶呤脱水酶基因的上游、4a-羟基四氢生物蝶呤脱水酶位于二氢单磷酸还原酶基因的上游),然后均导入到受体大肠杆菌中;

所述方式乙为所述苯丙氨酸羟化酶(记为x)、4a-羟基四氢生物蝶呤脱水酶(记为p)和二氢单磷酸还原酶(记为m)的基因构建在一个表达载体上,所述表达载体中三个基因的位置关系为苯丙氨酸羟化酶基因(记为x)、4a-羟基四氢生物蝶呤脱水酶基因(记为p)和二氢单磷酸还原酶基因(记为m)依次连接(即苯丙氨酸羟化酶基因位于4a-羟基四氢生物蝶呤脱水酶基因的上游、4a-羟基四氢生物蝶呤脱水酶基因位于二氢单磷酸还原酶基因的上游);所述天冬氨酸转氨酶家族蛋白基因(记为h)和n-乙酰转移酶基因(记为f)构建在同一个表达载体上,然后均导入到受体大肠杆菌中;

所述方式丙为所述苯丙氨酸羟化酶(记为x)、4a-羟基四氢生物蝶呤脱水酶基因(记为p)、二氢单磷酸还原酶基因(记为m)、天冬氨酸转氨酶家族蛋白基因(记为h)和n-乙酰转移酶基因(记为f)构建在一个表达载体上,所述表达载体中苯丙氨酸羟化酶基因(记为x)、4a-羟基四氢生物蝶呤脱水酶基因(记为p)、二氢单磷酸还原酶基因(记为m)、天冬氨酸转氨酶家族蛋白基因(记为h)和n-乙酰转移酶基因(记为f)依次连接(即苯丙氨酸羟化酶基因位于4a-羟基四氢生物蝶呤脱水酶基因的上游,4a-羟基四氢生物蝶呤脱水酶位于二氢单磷酸还原酶基因的上游,二氢单磷酸还原酶基因位于天冬氨酸转氨酶家族蛋白基因的上游,天冬氨酸转氨酶家族蛋白基因位于n-乙酰转移酶的上游),然后导入到受体大肠杆菌中。

在本发明具体的实施方式中,所述方式甲为利用无缝拼接方法将苯丙氨酸羟化酶的基因(记为x)构建到载体pbad中得到重组载体pbad-x(seqidno.4所示),利用无缝拼接方法按照天冬氨酸转氨酶家族蛋白基因(记为h)、n-乙酰转移酶基因(记为f)、4a-羟基四氢生物蝶呤脱水酶基因(记为p)和二氢单磷酸还原酶基因(记为m)的连接顺序构建到载体pzh中得到重组载体pzh-hfpm(seqidno.5所示),然后将pbad-x和pzh-hfpm导入到受体大肠杆菌中;

所述方式乙为利用无缝拼接方法按照苯丙氨酸羟化酶基因(记为x)、4a-羟基四氢生物蝶呤脱水酶基因(记为p)和二氢单磷酸还原酶基因(记为m)的连接顺序构建到载体pbad中得到重组载体pbad-xpm(seqidno.2所示),利用无缝拼接方法按照天冬氨酸转氨酶家族蛋白基因(记为h)和n-乙酰转移酶基因(记为f)的基因的连接顺序构建到载体pzh中得到重组载体pzh-hf(seqidno.3所示),然后将重组载体pbad-xpm和pzh-hf导入到受体大肠杆菌中;

所述方式丙为利用无缝拼接方法按照苯丙氨酸羟化酶基因(记为x)、4a-羟基四氢生物蝶呤脱水酶基因(记为p)、二氢单磷酸还原酶基因(记为m)、天冬氨酸转氨酶家族蛋白基因(记为h)和n-乙酰转移酶基因(记为f)的连接顺序构建重组载体pbad-xpmhf(seqidno.1所示),然后将重组载体pbad-xpmhf导入到受体大肠杆菌中。

上述构建方法中,所述受体大肠杆菌可为大肠杆菌k12;具体为大肠杆菌k12菌株bw25113。

上述构建方法中,所述苯丙氨酸羟化酶可为如下a1)或a2)所示的蛋白质:

a1)seqidno.1第319-1209位所示的dna分子编码的蛋白质;

a2)将a1)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与a1)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;

所述二氢单磷酸还原酶可为如下a3)或a4)所示的蛋白质:

a3)seqidno.1第1615-2337位所示的dna分子编码的蛋白质;

a4)将a3)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与a3)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;

所述4a-羟基四氢生物蝶呤脱水酶可为如下a5)或a6)所示的蛋白质:

a5)seqidno.1第1234-1590位所示的dna分子编码的蛋白质;

a6)将a5)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与a5)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;

所述天冬氨酸转氨酶家族蛋白可为如下a7)或a8)所示的蛋白质:

a7)seqidno.1第2362-3831位所示的dna分子编码的蛋白质;

a8)将a7)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与a7)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质;

所述n-乙酰转移酶可为如下a9)或a10)所示的蛋白质:

a9)seqidno.1第3856-4404位所示的dna分子编码的蛋白质;

a10)将a9)中的蛋白质的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与a9)所示的蛋白质具有90%以上的同一性且功能相同的蛋白质。

其中,seqidno.1第319-1209位由891个核苷酸组成,第319-1209位为编码序列,编码seqidno.6所示的苯丙氨酸羟化酶。

seqidno.1第1615-2337位由723个核苷酸组成,第1615-2337位为编码序列,编码seqidno.7所示的二氢单磷酸还原酶。

seqidno.1第1234-1590位由357个核苷酸组成,第1234-1590位为编码序列,编码seqidno.8所示的4a-羟基四氢生物蝶呤脱水酶。

seqidno.1第2362-3831位由1470个核苷酸组成,第2362-3831位为编码序列,编码seqidno.9所示的天冬氨酸转氨酶家族蛋白。

seqidno.1第3856-4404位由549个核苷酸组成,第3856-4404位为编码序列,编码seqidno.10所示的n-乙酰转移酶。

上述方法中,同一性是指氨基酸序列的同一性。可使用国际互联网上的同源性检索站点测定氨基酸序列的同一性,如ncbi主页网站的blast网页。例如,可在高级blast2.1中,通过使用blastp作为程序,将expect值设置为10,将所有filter设置为off,使用blosum62作为matrix,将gapexistencecost,perresiduegapcost和lambdaratio分别设置为11,1和0.85(缺省值)并进行检索一对氨基酸序列的同一性进行计算,然后即可获得同一性的值(%)。

上述方法中,所述90%以上的同一性可为至少91%、92%、95%、96%、98%、99%或100%的同一性。

上述方法中,所述苯丙氨酸羟化酶的基因可为如下b1)或b2)所示:

b1)编码序列为seqidno.1第319-1209位所示的dna分子;

b2)将seqidno.1第319-1209位所示的dna分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与seqidno.1第319-1209位所示的dna分子具有相同功能的dna分子;

所述二氢单磷酸还原酶的基因可为如下b3)或b4)所示:

b3)编码序列为seqidno.1第1615-2337位所示的dna分子;

b4)将seqidno.1第1615-2337位所示的dna分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与seqidno.1第1615-2337位所示的dna分子具有相同功能的dna分子;

所述4a-羟基四氢生物蝶呤脱水酶的基因可为如下b5)或b6)所示:

b5)编码序列为seqidno.1第1234-1590位所示的dna分子;

b6)将seqidno.1第1234-1590位所示的dna分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与seqidno.1第1234-1590位所示的dna分子具有相同功能的dna分子;

所述天冬氨酸转氨酶家族蛋白的基因可为如下b7)或b8)所示:

b7)编码序列为seqidno.1第2362-3831位所示的dna分子;

b8)将seqidno.1第2362-3831位所示的dna分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与seqidno.1第2362-3831位所示的dna分子具有相同功能的dna分子;

所述n-乙酰转移酶的基因可为如下b9)或b10)所示:

b9)编码序列为seqidno.1第3856-4404位所示的dna分子;

b10)将seqidno.1第3856-4404位所示的dna分子经过一个或几个核苷酸的取代和/或缺失和/或添加且与seqidno.1第3856-4404位所示的dna分子具有相同功能的dna分子。

上述构建方法得到的重组大肠杆菌及其在制备n-乙酰-5-羟色胺的应用也在本发明的保护范围之内。

本发明进一步公开了一种制备n-乙酰-5-羟色胺的方法。

本发明制备n-乙酰-5-羟色胺的方法,包括:利用上述重组大肠杆菌催化色氨酸反应得到n-乙酰-5-羟色胺。

具体的,所述重组大肠杆菌经阿拉伯糖诱导培养后催化色氨酸反应得到n-乙酰-5-羟色胺。

上述方法中,所述阿拉伯糖为l-阿拉伯糖。

本发明通过在大肠杆菌中过表达色氨酸衍生物合成相关蛋白的基因,构建了能高效合成n-乙酰-5-羟色胺的重组大肠杆菌,开发了一套高效合成n-乙酰-5-羟色胺的方法。本发明的产n-乙酰-5-羟色胺的重组大肠杆菌菌株,单位菌体的n-乙酰-5-羟色胺合成效率显著高于其它现有菌株,且绝大部分产物分泌至胞外,便于产物的下游纯化分离。因此本发明对n-乙酰-5-羟色胺的工业化生产和大规模应用具有重大意义。

附图说明

图1为sds-page分析色氨酸衍生物合成相关蛋白的基因在大肠杆菌中的表达。

图2为三株重组大肠杆菌摇瓶试验中n-乙酰-5-羟色胺合成水平的分析。

图3为两株重组大肠杆菌发酵罐试验中n-乙酰-5-羟色胺合成水平的分析。

具体实施方式

以下的实施例便于更好地理解本发明,但并不限定本发明。下述实施例中所使用的实验方法如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。

下述实施例中用到的材料来源如下:

pbad/hisa购自invitrogen,产品目录号为v430-01;

pzh是在pbad/hisa基础上改变复制起始位点和抗性为氯霉素得到。

实施例1、n-乙酰-5-羟色胺高产的重组大肠杆菌菌株的构建

1、pcr扩增色氨酸衍生物合成相关蛋白的编码序列

以合成的来源于野油菜黄单胞菌的苯丙氨酸羟化酶基因(seqidno.1第319-1209位所示)为模板,用引物f1和r1进行pcr扩增,得到包含苯丙氨酸羟化酶基因的pcr扩增产物x(seqidno.1第299-1232位所示)。

以合成的来源于铜绿假单胞菌的4a-羟基四氢生物蝶呤脱水酶基因phhb(seqidno.1第1234-1590位所示)为模板用引物f3和r3进行pcr扩增,得到包含4a-羟基四氢生物蝶呤脱水酶基因phhb的pcr扩增产物p(seqidno.1第1210-1614位所示)。

以合成的来源于大肠杆菌的二氢单磷酸还原酶(folm)基因(seqidno.1第1615-2337位所示)为模板,用引物f2和r2进行pcr扩增,得到包含二氢单磷酸还原酶(folm)基因的pcr扩增产物m(seqidno.1第1592-2337位所示)。

以合成的来源于小白链霉菌的天冬氨酸转氨酶家族蛋白(aspartateaminotransferasefamilyprotein)基因(seqidno.1第2362-3831位所示)为模板用引物f4和r4进行pcr扩增,得到包含天冬氨酸转氨酶家族蛋白(aspartateaminotransferasefamilyprotein)的pcr扩增产物h(seqidno.1第2362-3831位所示)。

以合成的来源于小白链霉菌的n-乙酰转移酶(n-acetyltransferase)基因(seqidno.1第3856-4404位所示)为模板用引物f5和r5进行pcr扩增,得到包含n-乙酰转移酶(n-acetyltransferase)基因的pcr扩增产物f(seqidno.1第3814-4404位所示)。

具体引物序列如下:

f1:gctaacaggaggaattaaccatgaacacagcgccgcgccgc

r1:tatatctccttcttaaagttaaattacacgtcgccgtcgcggctc

f2:ttaactttaagaaggagatatacatgggtaaaacccagccctt

r2:ttaacgcagatgacgaccgc

f3:tttaagaaggagatatacatgaccgcactcacccaagc

r3:gtatatctccttcttaaagttaaattatttgcgcccctcggcgg

f4:atgaagcccgctgacgcg

r4:ctactcgggcagcgcatcagc

f5:gatgcgctgcccgagtagtttaactttaagaaggagatatacatgaacaccttccggacc

r5:tcagtcgcagtggtcatggatcg

2、无缝拼接

以pbad/hisa为载体,利用无缝拼接方法按照x、p、m、h、f的连接顺序构建重组载体pbad-xpmhf(seqidno.1所示),并命名为nas-1;

以pbad为载体,利用无缝拼接方法按照x、p、m的连接顺序构建重组载体pbad-xpm(seqidno.2所示),以pzh为载体,利用无缝拼接方法按照h、f的连接顺序构建重组载体pzh-hf(seqidno.3所示),并将pbad-xpm和pzh-hf命名为nas-2;

以pbad为载体,利用无缝拼接方法构建载体pbad-x(seqidno.4所示),以pzh为载体,利用无缝拼接方法按照h、f、p、m的连接顺序构建重组载体pzh-hfpm(seqidno.5所示),并将pbad-x和pzh-hfpm命名为nas-3。

3、转化、筛选以及序列验证

用氯化钙化学转化法将重组载体pbad-xpmhf、pbad-xpm、pzh-hf、pbad-x、pzh-hfpm分别转化至大肠杆菌dh5α,用含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的lb培养基进行筛选培养,挑取单菌落,并进行扩大培养,获得重组菌并提取质粒,进行测序验证,结果获得的序列如seqidno.1、seqidno.2、seqidno.3、seqidno.4和seqidno.5所示,证明构建的重组质粒及重组菌正确。将阳性克隆的重组菌记作dh5α-pbad-xpmhf,dh5α-pbad-xpm,dh5α-pzh-hf,dh5α-pbad-x,dh5α-pzh-hfpm,阳性质粒记作pbad-xpmhf,pbad-xpm,pzh-hf,pbad-x,pzh-hfpm。

4、重组表达菌株的构建

用氯化钙化学转化法将重组质粒pbad-xpmhf、pbad-xpm和pzh-hf、pbad-xc和pzh-hfpm分别转化至大肠杆菌k-12系列表达菌株bw25113(购买自北京江晨文轩生物科技有限责任公司,货号:g6058,rrnb3δlacz4787hsdr514δ(arabad)567δ(rhabad)568rph-1),用含有氨苄青霉素(100μg/ml)和或含氯霉素(34ug/ml)的lb培养基进行筛选培养,挑取单菌落,获得重组大肠杆菌菌株bw-pbad-xpmhf(命名为bw-pbad-nas1)、bw-pbad-xpm/pzh-hf(命名为bw-pbad-nas2)、bw-pbad-x/pzh-hfpm(命名为bw-pbad-nas3)。

5、蛋白表达

以bw-pbad-nas3为例:

挑取bw-pbad-nas3的单菌落接入含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的lb培养基中,于37℃过夜培养,得到过夜培养物;将过夜培养物接种于100ml含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的lb培养基,37℃剧烈振荡(200rpm)培养,至发酵液的od600值达到0.6-0.8左右,向发酵体系中加入l-阿拉伯糖(终浓度0.1%),30℃条件下继续培养10-12小时。

发酵完毕后,5000rpm离心15分钟,收集菌体;用ph7.0的pbs缓冲液重悬菌体,超声波破碎后12,000rpm离心15min。收集上清液,即为含有目的蛋白的粗酶液,sds-page检测蛋白表达情况,结果如图1中a所示,表明bw-pbad-nas3中5种蛋白在大肠杆菌生产菌株内得到良好表达。

利用上述方法,分别对bw-pbad-nas1和bw-pbad-nas2进行实验,sds-page检测蛋白表达情况,如图1中b所示bw-pbad-nas1中n-乙酰转移酶没有表达,图1中c所示bw-pbad-nas2中5种蛋白均获得表达,对比bw-pbad-nas3其二氢单磷酸还原酶和4a-羟基四氢生物蝶呤脱水酶表达量较高,天冬氨酸转氨酶家族蛋白和n-乙酰转移酶表达量较低。

6、n-乙酰-5-羟色胺的生物转化摇瓶试验

以bw-pbad-nas3为例进行摇瓶试验:

挑取bw-pbad-nas3的单菌落接入含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的lb培养基中,于37℃过夜培养,得到过夜培养物;将过夜培养物接种于500ml含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的lb培养基,37℃剧烈振荡(200rpm)培养,至发酵液的od600值达到0.6-0.8左右,再向发酵体系中加入l-阿拉伯糖(终浓度0.1%),30℃条件下继续培养10-12小时。5000rpm离心15分钟,收集菌体。

离心后菌体加入转化液重悬菌体至od600值达到10,取25ml重悬菌液于250ml三角瓶中,30℃振荡(100rpm)反应96小时,分别检测24h、48h、72h和96h的n-乙酰-5-羟色胺的产量。

其中,转化液的成分:10g/l葡萄糖,6g/lna2hpo4,0.5g/lnacl,3g/lkh2po4,1g/lnh4cl,246.5mg/lmgso4·7h2o,14.7mg/lcacl2·2h2o,27.8mg/lfeso4·7h2o,2g/lyeastextract(酵母提取物);1%甘油;1g/ltryptophan(色氨酸)。

利用上述方法,分别对bw-pbad-nas1和bw-pbad-nas2进行实验,分别检测24h、48h、72h和96h的n-乙酰-5-羟色胺的产量。

结果如图2所示,结果显示三株重组大肠杆菌菌株n-乙酰-5-羟色胺的产量具有显著的差异,其中,bw-pbad-nas3(即bw-pbad-x/pzh-hfpm,图中以“菌株3”表示)的产量最高,在72h便将底物1.0g/l色氨酸全部消耗殆尽,产生了519mg/l的n-乙酰5-羟色胺,bw-pbad-nas2(即bw-pbad-xpm/pzh-hf,图中以“菌株2”表示)次之,bw-pbad-nas1(即bw-pbad-xhfpm,图中以“菌株1”表示)产量最低。

7、n-乙酰-5-羟色胺的生物转化发酵罐试验

以摇瓶试验n-乙酰-5-羟色胺产量最高的bw-pbad-nas3菌株和较高的bw-pbad-nas2做上罐发酵:

以bw-pbad-nas3为例进行发酵罐试验:

1)种子液制备:挑取所述重组大肠杆菌bw-pbad-nas3单菌落接入20ml含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的lb培养基中,于37℃、200rpm培养12小时;然后将20ml培养物转接至300ml含有氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的种子培养基中,37℃、200rpm振荡培养12小时,即得种子液;

其中,所述种子培养基的配制:蛋白胨16g,酵母膏10g,氯化钠5g,用水定容至1l,ph7.0。

2)菌体培养:以10%的接种量将种子液接种到1l含氨苄青霉素(100μg/ml)和氯霉素(34ug/ml)的发酵罐的发酵培养基中,发酵采用2.5l的发酵罐,培养过程中控制温度为37℃,通过搅拌速度(500-800转/分钟)和通气量(3l/min)控制菌体培养体系的溶氧在20%以上,通过流加1m磷酸和3m氨水维持ph值稳定在6.8-7.2,培养至葡萄糖消耗完时流加补料培养基,补料培养基的流加速度为50ml/h,流加至菌体密度od600达到20,菌体培养过程结束,得到菌体培养后的发酵液,进入诱导培养阶段;

其中,每1l发酵培养基的配制:葡萄糖10g,(nh4)2hpo48g,kh2po413.3g,mgso4·7h2o1.2g,柠檬酸1.7g,微量盐溶液10ml,用水定溶至1l,5mnaoh调至ph7.0;

每1l补料培养基的配制:葡萄糖400g,mgso4·7h2o10g,微量盐溶液20ml,用水定容至1l;

每1l微量盐溶液的配制:feso4·7h2o10g,znso4·7h2o2.25g,cuso4·5h2o1g,mnso4·5h2o0.5g,na2b4o7·10h2o0.23g,cacl2·2h2o2g,(nh4)6mo7o240.1g,用5m盐酸水溶液定容,定容至1l。

3)诱导培养:将上述菌体培养后的发酵液的温度降至30℃,加入l-阿拉伯糖,使得l-阿拉伯糖终浓度为1g/l,进行诱导培养,同时加入色氨酸终浓度为4g/l,甘油终浓度为体积占比5%;诱导培养过程中要一直流加补料培养基,补料培养基的流加速度调至20ml/h;流加至菌体密度od600达到40,诱导培养过程结束,得到转化液;

所述诱导培养的条件为:培养温度为30℃,控制诱导培养体系的溶氧在20%以上和维持ph至7.0。

4)hplc检测:上述转化液5000rpm离心15min吸取上清液,按照上清液:水:甲醇体积比1:7.5:1.5制成待检测样品,0.22um有机型滤器过滤除去不溶物后每隔5-8小时hplc检测n-乙酰-5-羟色胺浓度。hplc检测仪为agilent1260infinitylc,检测柱为agilentzobaxc18柱。n-乙酰-5-羟色胺的紫外检测波长为275nm,流动相15%(v/v)甲醇,流速为1.0ml/min,进样量为10ul,采用外标法按峰面积定量。sigma生产n-乙酰-5-羟色胺标准品作为定量标准。

利用上述方法,对bw-pbad-nas2进行实验,每隔5-8小时hplc检测n-乙酰-5-羟色胺浓度。

结果如图3所示,结果显示:结果显示两株重组大肠杆菌菌株发酵罐中n-乙酰-5-羟色胺的浓度具有显著的差异,其中,bw-pbad-nas3(即bw-pbad-x/pzh-hfpm,图中以“菌株3”表示)的产量明显高于bw-pbad-nas2(即bw-pbad-xpm/pzh-hf,图中以“菌株2”表示),bw-pbad-nas3最终发酵64hn-乙酰5-羟色胺的产量达到2.7g/l。

以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。

sequencelisting

<110>中国科学院微生物研究所

<120>产n-乙酰-5-羟色胺的重组大肠杆菌及其构建方法和应用

<130>gncfy200075

<160>10

<170>patentinversion3.5

<210>1

<211>8042

<212>dna

<213>人工序列(artificialsequence)

<400>1

aagaaaccaattgtccatattgcatcagacattgccgtcactgcgtcttttactggctct60

tctcgctaaccaaaccggtaaccccgcttattaaaagcattctgtaacaaagcgggacca120

aagccatgacaaaaacgcgtaacaaaagtgtctataatcacggcagaaaagtccacattg180

attatttgcacggcgtcacactttgctatgccatagcatttttatccataagattagcgg240

atcctacctgacgctttttatcgcaactctctactgtttctccatacccgttttttgggc300

taacaggaggaattaaccatgaacacagcgccgcgccgcgtcgagaaccagctcaccgac360

aagggctatgtgccggtctacaccaccgcggtggtggagcagccgtgggatggttacagc420

gccgacgaccatgccacctggggcacgctgtaccggcggcagcgcgcgctgctggtcggg480

cgggcctgcgatgagttcctgcaggcgcaggacgcaatgggcatggacgacacccagatt540

ccgcgcttcgacgcgctcaacgcggtgctgcaggcgaccaccggctggacgctggtcggt600

gtggaagggctgctgccggagctggatttcttcgatcatctggccaaccggcgcttcccg660

gtgacctggtggatccgccgcccggaccagatcgactacatcgccgaaccggacctgttc720

catgatctgttcgggcacgtgccgctgctgatgaatccgctgtttgccgacttcatgcag780

gcctatgggcgcggtggcgtcaaggcgcacggaattggcccggacgcgttgcaaaatctc840

acccggctgtacttctacacggtggaattcggcctgattgccacgccgcaggggttgcgc900

atctacggtgcgggcatcgtctcgtccaagggcgaatcgctgcattcgctggaatcggcg960

gcgccgaaccgggtgggcttcgatctgcagcgggtgatgcgcacgcgctaccgcatcgac1020

agtttccaaaagacctacttcgtcatcgacagctttacgcagctgatggacgccaccgcc1080

ccggatttcaccccgatctatgccgcgctggcgcaacagccgcaggtgccggccggcgag1140

gtgctggcaaccgaccacgtcctgcagcgcggcagcggcgaaggctggagccgcgacggc1200

gacgtgtaatttaactttaagaaggagatatacatgaccgcactcacccaagcccattgc1260

gaagcctgccgcgcagacgccccgcacgtcagcgacgaagaactgcccgtgctgctgcgg1320

caaatcccggattggaacatcgaagtccgcgacggcatcatgcagctagagaaggtctac1380

ctgttcaagaacttcaagcatgccctggccttcaccaatgccgtcggcgagatatccgag1440

gccgaaggccaccatccgggcctgctgaccgagtggggcaaagtcaccgtgacctggtgg1500

agccactcgatcaagggcctgcaccgcaacgatttcatcatggcggcgcgcaccgatgag1560

gtagcgaaaaccgccgaggggcgcaaataatttaactttaagaaggagatatacatgggt1620

aaaacccagcccttgccaatattaattactggcggaggtcgtcgcatcggcctcgccctc1680

gcatggcatttcattaatcaaaagcaaccggtgattgtcagctatcggacacactatcca1740

gccattgatggactgattaatgcaggtgcgcagtgtattcaggctgatttttcgaccaac1800

gacggtgtgatggcgtttgccgatgaagtactaaaaagcacccatggtctgcgtgctatt1860

ttgcataacgccagtgcgtggatggcggaaaaaccgggtgcgccactggccgacgtactg1920

gcttgcatgatgcagatccacgttaataccccatacctgctcaaccatgcgctggaaaga1980

ttactgcgtgggcacggacacgccgccagcgatatcattcactttaccgattatgtggtg2040

gagcgcggtagcgacaaacatattgcgtatgctgcaagcaaagcggcactggataatatg2100

acccgctcgtttgcccgcaagctggcaccggaagtgaaagtgaattctattgcgccatcg2160

ctgatcctgtttaatgaacatgatgatgccgaatatcgacaacaggcgctgaataaatca2220

ctgatgaaaaccgcgcctggcgagaaagaagtgatcgacctggtcgattacttacttacc2280

agttgctttgtcaccggacgcagtttcccacttgatggcggtcgtcatctgcgttaattt2340

aactttaagaaggagatatacatgaagcccgctgacgcgaaaccgccccacatggaccac2400

gacaccttccgctccctgggccatcaggccatcgactggatcgccgactactggcagcgt2460

ttggcggagcgacccgtcgctccccccgtcgaacccggcagcatccgcgcccagttaccg2520

acggccccacccgagtgcggcgaggactttcccgtactgctgtccgacctcgaacggatc2580

gtgctgccgggcctgctgcactggcagcacccccgtttcttcggttacttccccgcgaac2640

gcttccggccccgccgtcctggccgagctgttgtccgcgggcctgggcatccaggggatg2700

aactggaacaccagcccggcctgcaccgagatcgaacagcagatgctggactggttcgtg2760

cacctgctcggcctacccgagcacctccgcggtgggggagtcatccaggacaccgcctcc2820

agcgccctcctggtggcactgctcaccgccctgcaccaggccagtgcgggccgcacccgc2880

gaccacggcaccggcgagtgcggctaccgggtgtacctgaccgccgagacgcactcggcg2940

gcccgcaaggccgccgtcatcaccggactgggcctgcgggccatgtgcgaggtggccacc3000

gacgccgacggcgccatggacgcagtcgatctggaaagacacctccgggccgaccgggcc3060

gcaggtctgaccccgctgatggtcgtggccacccgaggcaccacctcccatctctccttc3120

gaccccctggaggacatcggccccgtgtgtcgtcggcacggcgtgtggctccacgtcgac3180

gccgcatacgccggagtggccgcggtctgcgacgaactgcgctgggtcaacgacggcgtg3240

cgctacgcggactcctactgcaccaacccgcacaagtggctgctgaccaacttcgactgc3300

gacctgctgtgggtggcccaccccgaagtcctcgtcagcgccctgagcgtgctccccgaa3360

tacctgcgcaactcggcctccgaatcgggccgggtgaccgactaccggcactggcaggtc3420

ccactgggccggcgcttccgcgcactgaaactgtggtccgtcctccactggtacggcgcc3480

gaggggctgcgcgcccacatccgcaccggcgttcggcatgcccagctcttcgcggacctg3540

gtcggcgccgacgaccgcttcaccctggtcacccctcccgccctcggcctggtgacgttc3600

cgtcagaccggaacggacgaggagaaccggaacctcctgcaagccatcaacaccgaggga3660

accaccttcctcacccactccgagaagaacggcaccttcttcctgcgcttcgccgccggc3720

ggcaccctcaccgaggaccaccacgtacgcgaagcatggcgcgccgtccagaacgcgatc3780

cctcgcgcacaacacctcgccggcggctcggctgatgcgctgcccgagtagtttaacttt3840

aagaaggagatatacatgaacaccttccggaccgcgacggcacgcgatctccccgatgtc3900

gccgccaccttgaccgaggcgttcgccgccgacccgccgacccaatgggtcttcccggac3960

ggtgccgctgcggtctcccgtttcttcttcggtgtcgccgaccgtgcccgcgaggccggc4020

gggatcgtcgaactactccccggcaccgccgcgatgatcgccctacccccgcacgtacga4080

ctacccgacgccccagcctgcggccgacaggccgagatgcagcgcaggctgggcgaacgc4140

cgcccccgcactccgcactactacctcctcttctacggcgtgcgcaccgcccatcagagc4200

tccggcctggggggacggatgctctccgacctcatctccctggccgaccgcgaccgcgtg4260

ggcacctacaccgaggccagcacctggcgcggcgcccgcctgatgttgcgtcacggcttc4320

cacaccgcacagccgctgcggcttccccacgggccacccatgttccccctctggagagac4380

ccgatccatgaccactgcgactgaaagcttggctgttttggcggatgagagaagattttc4440

agcctgatacagattaaatcagaacgcagaagcggtctgataaaacagaatttgcctggc4500

ggcagtagcgcggtggtcccacctgaccccatgccgaactcagaagtgaaacgccgtagc4560

gccgatggtagtgtggggtctccccatgcgagagtagggaactgccaggcatcaaataaa4620

acgaaaggctcagtcgaaagactgggcctttcgttttatctgttgtttgtcggtgaacgc4680

tctcctgagtaggacaaatccgccgggagcggatttgaacgttgcgaagcaacggcccgg4740

agggtggcgggcaggacgcccgccataaactgccaggcatcaaattaagcagaaggccat4800

cctgacggatggcctttttgcgtttctacaaactcttttgtttatttttctaaatacatt4860

caaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaa4920

ggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcatttt4980

gccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagt5040

tgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagtt5100

ttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcgg5160

tattatcccgtgttgacgccgggcaagagcaactcggtcgccgcatacactattctcaga5220

atgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaa5280

gagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctga5340

caacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaa5400

ctcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgaca5460

ccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaactggcgaactactta5520

ctctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccac5580

ttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagc5640

gtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtag5700

ttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgaga5760

taggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatacttt5820

agattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgata5880

atctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtag5940

aaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaa6000

caaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactcttt6060

ttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagc6120

cgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaa6180

tcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaa6240

gacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagc6300

ccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaa6360

gcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaa6420

caggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcg6480

ggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcc6540

tatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttg6600

ctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttg6660

agtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgagg6720

aagcggaagagcgcctgatgcggtattttctccttacgcatctgtgcggtatttcacacc6780

gcatatggtgcactctcagtacaatctgctctgatgccgcatagttaagccagtatacac6840

tccgctatcgctacgtgactgggtcatggctgcgccccgacacccgccaacacccgctga6900

cgcgccctgacgggcttgtctgctcccggcatccgcttacagacaagctgtgaccgtctc6960

cgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgaggcagcagat7020

caattcgcgcgcgaaggcgaagcggcatgcataatgtgcctgtcaaatggacgaagcagg7080

gattctgcaaaccctatgctactccgtcaagccgtcaattgtctgattcgttaccaatta7140

tgacaacttgacggctacatcattcactttttcttcacaaccggcacggaactcgctcgg7200

gctggccccggtgcattttttaaatacccgcgagaaatagagttgatcgtcaaaaccaac7260

attgcgaccgacggtggcgataggcatccgggtggtgctcaaaagcagcttcgcctggct7320

gatacgttggtcctcgcgccagcttaagacgctaatccctaactgctggcggaaaagatg7380

tgacagacgcgacggcgacaagcaaacatgctgtgcgacgctggcgatatcaaaattgct7440

gtctgccaggtgatcgctgatgtactgacaagcctcgcgtacccgattatccatcggtgg7500

atggagcgactcgttaatcgcttccatgcgccgcagtaacaattgctcaagcagatttat7560

cgccagcagctccgaatagcgcccttccccttgcccggcgttaatgatttgcccaaacag7620

gtcgctgaaatgcggctggtgcgcttcatccgggcgaaagaaccccgtattggcaaatat7680

tgacggccagttaagccattcatgccagtaggcgcgcggacgaaagtaaacccactggtg7740

ataccattcgcgagcctccggatgacgaccgtagtgatgaatctctcctggcgggaacag7800

caaaatatcacccggtcggcaaacaaattctcgtccctgatttttcaccaccccctgacc7860

gcgaatggtgagattgagaatataacctttcattcccagcggtcggtcgataaaaaaatc7920

gagataaccgttggcctcaatcggcgttaaacccgccaccagatgggcattaaacgagta7980

tcccggcagcaggggatcattttgcgcttcagccatacttttcatactcccgccattcag8040

ag8042

<210>2

<211>5975

<212>dna

<213>人工序列(artificialsequence)

<400>2

aagaaaccaattgtccatattgcatcagacattgccgtcactgcgtcttttactggctct60

tctcgctaaccaaaccggtaaccccgcttattaaaagcattctgtaacaaagcgggacca120

aagccatgacaaaaacgcgtaacaaaagtgtctataatcacggcagaaaagtccacattg180

attatttgcacggcgtcacactttgctatgccatagcatttttatccataagattagcgg240

atcctacctgacgctttttatcgcaactctctactgtttctccatacccgttttttgggc300

taacaggaggaattaaccatgaacacagcgccgcgccgcgtcgagaaccagctcaccgac360

aagggctatgtgccggtctacaccaccgcggtggtggagcagccgtgggatggttacagc420

gccgacgaccatgccacctggggcacgctgtaccggcggcagcgcgcgctgctggtcggg480

cgggcctgcgatgagttcctgcaggcgcaggacgcaatgggcatggacgacacccagatt540

ccgcgcttcgacgcgctcaacgcggtgctgcaggcgaccaccggctggacgctggtcggt600

gtggaagggctgctgccggagctggatttcttcgatcatctggccaaccggcgcttcccg660

gtgacctggtggatccgccgcccggaccagatcgactacatcgccgaaccggacctgttc720

catgatctgttcgggcacgtgccgctgctgatgaatccgctgtttgccgacttcatgcag780

gcctatgggcgcggtggcgtcaaggcgcacggaattggcccggacgcgttgcaaaatctc840

acccggctgtacttctacacggtggaattcggcctgattgccacgccgcaggggttgcgc900

atctacggtgcgggcatcgtctcgtccaagggcgaatcgctgcattcgctggaatcggcg960

gcgccgaaccgggtgggcttcgatctgcagcgggtgatgcgcacgcgctaccgcatcgac1020

agtttccaaaagacctacttcgtcatcgacagctttacgcagctgatggacgccaccgcc1080

ccggatttcaccccgatctatgccgcgctggcgcaacagccgcaggtgccggccggcgag1140

gtgctggcaaccgaccacgtcctgcagcgcggcagcggcgaaggctggagccgcgacggc1200

gacgtgtaatttaactttaagaaggagatatacatgaccgcactcacccaagcccattgc1260

gaagcctgccgcgcagacgccccgcacgtcagcgacgaagaactgcccgtgctgctgcgg1320

caaatcccggattggaacatcgaagtccgcgacggcatcatgcagctagagaaggtctac1380

ctgttcaagaacttcaagcatgccctggccttcaccaatgccgtcggcgagatatccgag1440

gccgaaggccaccatccgggcctgctgaccgagtggggcaaagtcaccgtgacctggtgg1500

agccactcgatcaagggcctgcaccgcaacgatttcatcatggcggcgcgcaccgatgag1560

gtagcgaaaaccgccgaggggcgcaaataatttaactttaagaaggagatatacatgggt1620

aaaacccagcccttgccaatattaattactggcggaggtcgtcgcatcggcctcgccctc1680

gcatggcatttcattaatcaaaagcaaccggtgattgtcagctatcggacacactatcca1740

gccattgatggactgattaatgcaggtgcgcagtgtattcaggctgatttttcgaccaac1800

gacggtgtgatggcgtttgccgatgaagtactaaaaagcacccatggtctgcgtgctatt1860

ttgcataacgccagtgcgtggatggcggaaaaaccgggtgcgccactggccgacgtactg1920

gcttgcatgatgcagatccacgttaataccccatacctgctcaaccatgcgctggaaaga1980

ttactgcgtgggcacggacacgccgccagcgatatcattcactttaccgattatgtggtg2040

gagcgcggtagcgacaaacatattgcgtatgctgcaagcaaagcggcactggataatatg2100

acccgctcgtttgcccgcaagctggcaccggaagtgaaagtgaattctattgcgccatcg2160

ctgatcctgtttaatgaacatgatgatgccgaatatcgacaacaggcgctgaataaatca2220

ctgatgaaaaccgcgcctggcgagaaagaagtgatcgacctggtcgattacttacttacc2280

agttgctttgtcaccggacgcagtttcccacttgatggcggtcgtcatctgcgttaaaag2340

cttggctgttttggcggatgagagaagattttcagcctgatacagattaaatcagaacgc2400

agaagcggtctgataaaacagaatttgcctggcggcagtagcgcggtggtcccacctgac2460

cccatgccgaactcagaagtgaaacgccgtagcgccgatggtagtgtggggtctccccat2520

gcgagagtagggaactgccaggcatcaaataaaacgaaaggctcagtcgaaagactgggc2580

ctttcgttttatctgttgtttgtcggtgaacgctctcctgagtaggacaaatccgccggg2640

agcggatttgaacgttgcgaagcaacggcccggagggtggcgggcaggacgcccgccata2700

aactgccaggcatcaaattaagcagaaggccatcctgacggatggcctttttgcgtttct2760

acaaactcttttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaat2820

aaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttcc2880

gtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaa2940

cgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaac3000

tggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatga3060

tgagcacttttaaagttctgctatgtggcgcggtattatcccgtgttgacgccgggcaag3120

agcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtca3180

cagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataacca3240

tgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaa3300

ccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagc3360

tgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaa3420

cgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatag3480

actggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggct3540

ggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcac3600

tggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaa3660

ctatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggt3720

aactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaat3780

ttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtg3840

agttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatc3900

ctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtgg3960

tttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagag4020

cgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaact4080

ctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtg4140

gcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagc4200

ggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccg4260

aactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaagg4320

cggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccag4380

ggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtc4440

gatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcct4500

ttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatccc4560

ctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagcc4620

gaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcctgatgcggtatt4680

ttctccttacgcatctgtgcggtatttcacaccgcatatggtgcactctcagtacaatct4740

gctctgatgccgcatagttaagccagtatacactccgctatcgctacgtgactgggtcat4800

ggctgcgccccgacacccgccaacacccgctgacgcgccctgacgggcttgtctgctccc4860

ggcatccgcttacagacaagctgtgaccgtctccgggagctgcatgtgtcagaggttttc4920

accgtcatcaccgaaacgcgcgaggcagcagatcaattcgcgcgcgaaggcgaagcggca4980

tgcataatgtgcctgtcaaatggacgaagcagggattctgcaaaccctatgctactccgt5040

caagccgtcaattgtctgattcgttaccaattatgacaacttgacggctacatcattcac5100

tttttcttcacaaccggcacggaactcgctcgggctggccccggtgcattttttaaatac5160

ccgcgagaaatagagttgatcgtcaaaaccaacattgcgaccgacggtggcgataggcat5220

ccgggtggtgctcaaaagcagcttcgcctggctgatacgttggtcctcgcgccagcttaa5280

gacgctaatccctaactgctggcggaaaagatgtgacagacgcgacggcgacaagcaaac5340

atgctgtgcgacgctggcgatatcaaaattgctgtctgccaggtgatcgctgatgtactg5400

acaagcctcgcgtacccgattatccatcggtggatggagcgactcgttaatcgcttccat5460

gcgccgcagtaacaattgctcaagcagatttatcgccagcagctccgaatagcgcccttc5520

cccttgcccggcgttaatgatttgcccaaacaggtcgctgaaatgcggctggtgcgcttc5580

atccgggcgaaagaaccccgtattggcaaatattgacggccagttaagccattcatgcca5640

gtaggcgcgcggacgaaagtaaacccactggtgataccattcgcgagcctccggatgacg5700

accgtagtgatgaatctctcctggcgggaacagcaaaatatcacccggtcggcaaacaaa5760

ttctcgtccctgatttttcaccaccccctgaccgcgaatggtgagattgagaatataacc5820

tttcattcccagcggtcggtcgataaaaaaatcgagataaccgttggcctcaatcggcgt5880

taaacccgccaccagatgggcattaaacgagtatcccggcagcaggggatcattttgcgc5940

ttcagccatacttttcatactcccgccattcagag5975

<210>3

<211>6142

<212>dna

<213>人工序列(artificialsequence)

<400>3

gttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagc60

tgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcgga120

agagcgcctgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcatatg180

gtgcactctcagtacaatctgctctgatgccgcatagttaagccagtatacactccgcta240

tcgctacgtgactgggtcatggctgcgccccgacacccgccaacacccgctgacgcgccc300

tgacgggcttgtctgctcccggcatccgcttacagacaagctgtgaccgtctccgggagc360

tgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgaggcagcagatcaattcg420

cgcgcgaaggcgaagcggcatgcataatgtgcctgtcaaatggacgaagcagggattctg480

caaaccctatgctactccgtcaagccgtcaattgtctgattcgttaccaattatgacaac540

ttgacggctacatcattcactttttcttcacaaccggcacggaactcgctcgggctggcc600

ccggtgcattttttaaatacccgcgagaaatagagttgatcgtcaaaaccaacattgcga660

ccgacggtggcgataggcatccgggtggtgctcaaaagcagcttcgcctggctgatacgt720

tggtcctcgcgccagcttaagacgctaatccctaactgctggcggaaaagatgtgacaga780

cgcgacggcgacaagcaaacatgctgtgcgacgctggcgatatcaaaattgctgtctgcc840

aggtgatcgctgatgtactgacaagcctcgcgtacccgattatccatcggtggatggagc900

gactcgttaatcgcttccatgcgccgcagtaacaattgctcaagcagatttatcgccagc960

agctccgaatagcgcccttccccttgcccggcgttaatgatttgcccaaacaggtcgctg1020

aaatgcggctggtgcgcttcatccgggcgaaagaaccccgtattggcaaatattgacggc1080

cagttaagccattcatgccagtaggcgcgcggacgaaagtaaacccactggtgataccat1140

tcgcgagcctccggatgacgaccgtagtgatgaatctctcctggcgggaacagcaaaata1200

tcacccggtcggcaaacaaattctcgtccctgatttttcaccaccccctgaccgcgaatg1260

gtgagattgagaatataacctttcattcccagcggtcggtcgataaaaaaatcgagataa1320

ccgttggcctcaatcggcgttaaacccgccaccagatgggcattaaacgagtatcccggc1380

agcaggggatcattttgcgcttcagccatacttttcatactcccgccattcagagaagaa1440

accaattgtccatattgcatcagacattgccgtcactgcgtcttttactggctcttctcg1500

ctaaccaaaccggtaaccccgcttattaaaagcattctgtaacaaagcgggaccaaagcc1560

atgacaaaaacgcgtaacaaaagtgtctataatcacggcagaaaagtccacattgattat1620

ttgcacggcgtcacactttgctatgccatagcatttttatccataagattagcggatcct1680

acctgacgctttttatcgcaactctctactgtttctccatacccgttttttgggctaaca1740

ggaggaattaaccatgaagcccgctgacgcgaaaccgccccacatggaccacgacacctt1800

ccgctccctgggccatcaggccatcgactggatcgccgactactggcagcgtttggcgga1860

gcgacccgtcgctccccccgtcgaacccggcagcatccgcgcccagttaccgacggcccc1920

acccgagtgcggcgaggactttcccgtactgctgtccgacctcgaacggatcgtgctgcc1980

gggcctgctgcactggcagcacccccgtttcttcggttacttccccgcgaacgcttccgg2040

ccccgccgtcctggccgagctgttgtccgcgggcctgggcatccaggggatgaactggaa2100

caccagcccggcctgcaccgagatcgaacagcagatgctggactggttcgtgcacctgct2160

cggcctacccgagcacctccgcggtgggggagtcatccaggacaccgcctccagcgccct2220

cctggtggcactgctcaccgccctgcaccaggccagtgcgggccgcacccgcgaccacgg2280

caccggcgagtgcggctaccgggtgtacctgaccgccgagacgcactcggcggcccgcaa2340

ggccgccgtcatcaccggactgggcctgcgggccatgtgcgaggtggccaccgacgccga2400

cggcgccatggacgcagtcgatctggaaagacacctccgggccgaccgggccgcaggtct2460

gaccccgctgatggtcgtggccacccgaggcaccacctcccatctctccttcgaccccct2520

ggaggacatcggccccgtgtgtcgtcggcacggcgtgtggctccacgtcgacgccgcata2580

cgccggagtggccgcggtctgcgacgaactgcgctgggtcaacgacggcgtgcgctacgc2640

ggactcctactgcaccaacccgcacaagtggctgctgaccaacttcgactgcgacctgct2700

gtgggtggcccaccccgaagtcctcgtcagcgccctgagcgtgctccccgaatacctgcg2760

caactcggcctccgaatcgggccgggtgaccgactaccggcactggcaggtcccactggg2820

ccggcgcttccgcgcactgaaactgtggtccgtcctccactggtacggcgccgaggggct2880

gcgcgcccacatccgcaccggcgttcggcatgcccagctcttcgcggacctggtcggcgc2940

cgacgaccgcttcaccctggtcacccctcccgccctcggcctggtgacgttccgtcagac3000

cggaacggacgaggagaaccggaacctcctgcaagccatcaacaccgagggaaccacctt3060

cctcacccactccgagaagaacggcaccttcttcctgcgcttcgccgccggcggcaccct3120

caccgaggaccaccacgtacgcgaagcatggcgcgccgtccagaacgcgatccctcgcgc3180

acaacacctcgccggcggctcggctgatgcgctgcccgagtagtttaactttaagaagga3240

gatatacatgaacaccttccggaccgcgacggcacgcgatctccccgatgtcgccgccac3300

cttgaccgaggcgttcgccgccgacccgccgacccaatgggtcttcccggacggtgccgc3360

tgcggtctcccgtttcttcttcggtgtcgccgaccgtgcccgcgaggccggcgggatcgt3420

cgaactactccccggcaccgccgcgatgatcgccctacccccgcacgtacgactacccga3480

cgccccagcctgcggccgacaggccgagatgcagcgcaggctgggcgaacgccgcccccg3540

cactccgcactactacctcctcttctacggcgtgcgcaccgcccatcagagctccggcct3600

ggggggacggatgctctccgacctcatctccctggccgaccgcgaccgcgtgggcaccta3660

caccgaggccagcacctggcgcggcgcccgcctgatgttgcgtcacggcttccacaccgc3720

acagccgctgcggcttccccacgggccacccatgttccccctctggagagacccgatcca3780

tgaccactgcgactgaaagcttggctgttttggcggatgagagaagattttcagcctgat3840

acagattaaatcagaacgcagaagcggtctgataaaacagaatttgcctggcggcagtag3900

cgcggtggtcccacctgaccccatgccgaactcagaagtgaaacgccgtagcgccgatgg3960

tagtgtggggtctccccatgcgagagtagggaactgccaggcatcaaataaaacgaaagg4020

ctcagtcgaaagactgggcctttcgttttatctgttgtttgtcggtgaacgctctcctga4080

gtaggacaaatccgccgggagcggatttgaacgttgcgaagcaacggcccggagggtggc4140

gggcaggacgcccgccataaactgccaggcatcaaattaagcagaaggccatcctgacgg4200

atggccttacaacttatatcgtatggggctgacttcaggtgctacatttgaagagataaa4260

ttgcactgaaatctagaaatattttatctgattaataagatgatcttcttgagatcgttt4320

tggtctgcgcgtaatctcttgctctgaaaacgaaaaaaccgccttgcagggcggtttttc4380

gaaggttctctgagctaccaactctttgaaccgaggtaactggcttggaggagcgcagtc4440

accaaaacttgtcctttcagtttagccttaaccggcgcatgacttcaagactaactcctc4500

taaatcaattaccagtggctgctgccagtggtgcttttgcatgtctttccgggttggact4560

caagacgatagttaccggataaggcgcagcggtcggactgaacggggggttcgtgcatac4620

agtccagcttggagcgaactgcctacccggaactgagtgtcaggcgtggaatgagacaaa4680

cgcggccataacagcggaatgacaccggtaaaccgaaaggcaggaacaggagagcgcacg4740

agggagccgccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccaccac4800

tgatttgagcgtcagatttcgtgatgcttgtcaggggggcggagcctatggaaaaacggc4860

tttgccgcggccctctcacttccctgttaagtatcttcctggcatcttccaggaaatctc4920

cgccccgttcgtaagccatttccgctcgccgcagtcgaacgaccgagcgtagcgagtcag4980

tgagcgaggaagcggaatatatcctgtatcacatattctgctgacgcaccggtgcagcct5040

tttttctcctgccacatgaagcacttcactgacaccctcatcagtgccaacatagtaagc5100

cagtatacactccgctagcgctgatgtccggcggtgcttttgccgttacgcaccaccccg5160

tcagtagctgaacaggagggacagctgatagaaacagaagccactggagcacctcaaaaa5220

caccatcatacactaaatcagtaagttggcagcatcacccgacgcactttgcgccgaata5280

aatacctgtgacggaagatcacttcgcagaataaataaatcctggtgtccctgttgatac5340

cgggaagccctgggccaacttttggcgaaaatgagacgttgatcggcacgtaagaggttc5400

caactttcaccataatgaaataagatcactaccgggcgtattttttgagttatcgagatt5460

ttcaggagctaaggaagctaaaatggagaaaaaaatcactggatataccaccgttgatat5520

atcccaatggcatcgtaaagaacattttgaggcatttcagtcagttgctcaatgtaccta5580

taaccagaccgttcagctggatattacggcctttttaaagaccgtaaagaaaaataagca5640

caagttttatccggcctttattcacattcttgcccgcctgatgaatgctcatccggaatt5700

ccgtatggcaatgaaagacggtgagctggtgatatgggatagtgttcacccttgttacac5760

cgttttccatgagcaaactgaaacgttttcatcgctctggagtgaataccacgacgattt5820

ccggcagtttctacacatatattcgcaagatgtggcgtgttacggtgaaaacctggccta5880

tttccctaaagggtttattgagaatatgtttttcgtctcagccaatccctgggtgagttt5940

caccagttttgatttaaacgtggccaatatggacaacttcttcgcccccgttttcaccat6000

gggcaaatattatacgcaaggcgacaaggtgctgatgccgctggcgattcaggttcatca6060

tgccgtctgtgatggcttccatgtcggcagaatgcttaatgaattacaacagtactgcga6120

tgagtggcagggcggggcgtaa6142

<210>4

<211>4847

<212>dna

<213>人工序列(artificialsequence)

<400>4

aagaaaccaattgtccatattgcatcagacattgccgtcactgcgtcttttactggctct60

tctcgctaaccaaaccggtaaccccgcttattaaaagcattctgtaacaaagcgggacca120

aagccatgacaaaaacgcgtaacaaaagtgtctataatcacggcagaaaagtccacattg180

attatttgcacggcgtcacactttgctatgccatagcatttttatccataagattagcgg240

atcctacctgacgctttttatcgcaactctctactgtttctccatacccgttttttgggc300

taacaggaggaattaaccatgaacacagcgccgcgccgcgtcgagaaccagctcaccgac360

aagggctatgtgccggtctacaccaccgcggtggtggagcagccgtgggatggttacagc420

gccgacgaccatgccacctggggcacgctgtaccggcggcagcgcgcgctgctggtcggg480

cgggcctgcgatgagttcctgcaggcgcaggacgcaatgggcatggacgacacccagatt540

ccgcgcttcgacgcgctcaacgcggtgctgcaggcgaccaccggctggacgctggtcggt600

gtggaagggctgctgccggagctggatttcttcgatcatctggccaaccggcgcttcccg660

gtgacctggtggatccgccgcccggaccagatcgactacatcgccgaaccggacctgttc720

catgatctgttcgggcacgtgccgctgctgatgaatccgctgtttgccgacttcatgcag780

gcctatgggcgcggtggcgtcaaggcgcacggaattggcccggacgcgttgcaaaatctc840

acccggctgtacttctacacggtggaattcggcctgattgccacgccgcaggggttgcgc900

atctacggtgcgggcatcgtctcgtccaagggcgaatcgctgcattcgctggaatcggcg960

gcgccgaaccgggtgggcttcgatctgcagcgggtgatgcgcacgcgctaccgcatcgac1020

agtttccaaaagacctacttcgtcatcgacagctttacgcagctgatggacgccaccgcc1080

ccggatttcaccccgatctatgccgcgctggcgcaacagccgcaggtgccggccggcgag1140

gtgctggcaaccgaccacgtcctgcagcgcggcagcggcgaaggctggagccgcgacggc1200

gacgtgtaaaagcttggctgttttggcggatgagagaagattttcagcctgatacagatt1260

aaatcagaacgcagaagcggtctgataaaacagaatttgcctggcggcagtagcgcggtg1320

gtcccacctgaccccatgccgaactcagaagtgaaacgccgtagcgccgatggtagtgtg1380

gggtctccccatgcgagagtagggaactgccaggcatcaaataaaacgaaaggctcagtc1440

gaaagactgggcctttcgttttatctgttgtttgtcggtgaacgctctcctgagtaggac1500

aaatccgccgggagcggatttgaacgttgcgaagcaacggcccggagggtggcgggcagg1560

acgcccgccataaactgccaggcatcaaattaagcagaaggccatcctgacggatggcct1620

ttttgcgtttctacaaactcttttgtttatttttctaaatacattcaaatatgtatccgc1680

tcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagta1740

ttcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttg1800

ctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgg1860

gttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaac1920

gttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtgttg1980

acgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagt2040

actcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtg2100

ctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggac2160

cgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgtt2220

gggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtag2280

caatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggc2340

aacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggccc2400

ttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggta2460

tcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacgg2520

ggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactga2580

ttaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaac2640

ttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaa2700

tcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggat2760

cttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgc2820

taccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactg2880

gcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccacc2940

acttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtgg3000

ctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccgg3060

ataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaa3120

cgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccg3180

aagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacga3240

gggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctct3300

gacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgcca3360

gcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttc3420

ctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccg3480

ctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcc3540

tgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcatatggtgcactc3600

tcagtacaatctgctctgatgccgcatagttaagccagtatacactccgctatcgctacg3660

tgactgggtcatggctgcgccccgacacccgccaacacccgctgacgcgccctgacgggc3720

ttgtctgctcccggcatccgcttacagacaagctgtgaccgtctccgggagctgcatgtg3780

tcagaggttttcaccgtcatcaccgaaacgcgcgaggcagcagatcaattcgcgcgcgaa3840

ggcgaagcggcatgcataatgtgcctgtcaaatggacgaagcagggattctgcaaaccct3900

atgctactccgtcaagccgtcaattgtctgattcgttaccaattatgacaacttgacggc3960

tacatcattcactttttcttcacaaccggcacggaactcgctcgggctggccccggtgca4020

ttttttaaatacccgcgagaaatagagttgatcgtcaaaaccaacattgcgaccgacggt4080

ggcgataggcatccgggtggtgctcaaaagcagcttcgcctggctgatacgttggtcctc4140

gcgccagcttaagacgctaatccctaactgctggcggaaaagatgtgacagacgcgacgg4200

cgacaagcaaacatgctgtgcgacgctggcgatatcaaaattgctgtctgccaggtgatc4260

gctgatgtactgacaagcctcgcgtacccgattatccatcggtggatggagcgactcgtt4320

aatcgcttccatgcgccgcagtaacaattgctcaagcagatttatcgccagcagctccga4380

atagcgcccttccccttgcccggcgttaatgatttgcccaaacaggtcgctgaaatgcgg4440

ctggtgcgcttcatccgggcgaaagaaccccgtattggcaaatattgacggccagttaag4500

ccattcatgccagtaggcgcgcggacgaaagtaaacccactggtgataccattcgcgagc4560

ctccggatgacgaccgtagtgatgaatctctcctggcgggaacagcaaaatatcacccgg4620

tcggcaaacaaattctcgtccctgatttttcaccaccccctgaccgcgaatggtgagatt4680

gagaatataacctttcattcccagcggtcggtcgataaaaaaatcgagataaccgttggc4740

ctcaatcggcgttaaacccgccaccagatgggcattaaacgagtatcccggcagcagggg4800

atcattttgcgcttcagccatacttttcatactcccgccattcagag4847

<210>5

<211>7270

<212>dna

<213>人工序列(artificialsequence)

<400>5

gttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagc60

tgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcgga120

agagcgcctgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcatatg180

gtgcactctcagtacaatctgctctgatgccgcatagttaagccagtatacactccgcta240

tcgctacgtgactgggtcatggctgcgccccgacacccgccaacacccgctgacgcgccc300

tgacgggcttgtctgctcccggcatccgcttacagacaagctgtgaccgtctccgggagc360

tgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgaggcagcagatcaattcg420

cgcgcgaaggcgaagcggcatgcataatgtgcctgtcaaatggacgaagcagggattctg480

caaaccctatgctactccgtcaagccgtcaattgtctgattcgttaccaattatgacaac540

ttgacggctacatcattcactttttcttcacaaccggcacggaactcgctcgggctggcc600

ccggtgcattttttaaatacccgcgagaaatagagttgatcgtcaaaaccaacattgcga660

ccgacggtggcgataggcatccgggtggtgctcaaaagcagcttcgcctggctgatacgt720

tggtcctcgcgccagcttaagacgctaatccctaactgctggcggaaaagatgtgacaga780

cgcgacggcgacaagcaaacatgctgtgcgacgctggcgatatcaaaattgctgtctgcc840

aggtgatcgctgatgtactgacaagcctcgcgtacccgattatccatcggtggatggagc900

gactcgttaatcgcttccatgcgccgcagtaacaattgctcaagcagatttatcgccagc960

agctccgaatagcgcccttccccttgcccggcgttaatgatttgcccaaacaggtcgctg1020

aaatgcggctggtgcgcttcatccgggcgaaagaaccccgtattggcaaatattgacggc1080

cagttaagccattcatgccagtaggcgcgcggacgaaagtaaacccactggtgataccat1140

tcgcgagcctccggatgacgaccgtagtgatgaatctctcctggcgggaacagcaaaata1200

tcacccggtcggcaaacaaattctcgtccctgatttttcaccaccccctgaccgcgaatg1260

gtgagattgagaatataacctttcattcccagcggtcggtcgataaaaaaatcgagataa1320

ccgttggcctcaatcggcgttaaacccgccaccagatgggcattaaacgagtatcccggc1380

agcaggggatcattttgcgcttcagccatacttttcatactcccgccattcagagaagaa1440

accaattgtccatattgcatcagacattgccgtcactgcgtcttttactggctcttctcg1500

ctaaccaaaccggtaaccccgcttattaaaagcattctgtaacaaagcgggaccaaagcc1560

atgacaaaaacgcgtaacaaaagtgtctataatcacggcagaaaagtccacattgattat1620

ttgcacggcgtcacactttgctatgccatagcatttttatccataagattagcggatcct1680

acctgacgctttttatcgcaactctctactgtttctccatacccgttttttgggctaaca1740

ggaggaattaaccatgaagcccgctgacgcgaaaccgccccacatggaccacgacacctt1800

ccgctccctgggccatcaggccatcgactggatcgccgactactggcagcgtttggcgga1860

gcgacccgtcgctccccccgtcgaacccggcagcatccgcgcccagttaccgacggcccc1920

acccgagtgcggcgaggactttcccgtactgctgtccgacctcgaacggatcgtgctgcc1980

gggcctgctgcactggcagcacccccgtttcttcggttacttccccgcgaacgcttccgg2040

ccccgccgtcctggccgagctgttgtccgcgggcctgggcatccaggggatgaactggaa2100

caccagcccggcctgcaccgagatcgaacagcagatgctggactggttcgtgcacctgct2160

cggcctacccgagcacctccgcggtgggggagtcatccaggacaccgcctccagcgccct2220

cctggtggcactgctcaccgccctgcaccaggccagtgcgggccgcacccgcgaccacgg2280

caccggcgagtgcggctaccgggtgtacctgaccgccgagacgcactcggcggcccgcaa2340

ggccgccgtcatcaccggactgggcctgcgggccatgtgcgaggtggccaccgacgccga2400

cggcgccatggacgcagtcgatctggaaagacacctccgggccgaccgggccgcaggtct2460

gaccccgctgatggtcgtggccacccgaggcaccacctcccatctctccttcgaccccct2520

ggaggacatcggccccgtgtgtcgtcggcacggcgtgtggctccacgtcgacgccgcata2580

cgccggagtggccgcggtctgcgacgaactgcgctgggtcaacgacggcgtgcgctacgc2640

ggactcctactgcaccaacccgcacaagtggctgctgaccaacttcgactgcgacctgct2700

gtgggtggcccaccccgaagtcctcgtcagcgccctgagcgtgctccccgaatacctgcg2760

caactcggcctccgaatcgggccgggtgaccgactaccggcactggcaggtcccactggg2820

ccggcgcttccgcgcactgaaactgtggtccgtcctccactggtacggcgccgaggggct2880

gcgcgcccacatccgcaccggcgttcggcatgcccagctcttcgcggacctggtcggcgc2940

cgacgaccgcttcaccctggtcacccctcccgccctcggcctggtgacgttccgtcagac3000

cggaacggacgaggagaaccggaacctcctgcaagccatcaacaccgagggaaccacctt3060

cctcacccactccgagaagaacggcaccttcttcctgcgcttcgccgccggcggcaccct3120

caccgaggaccaccacgtacgcgaagcatggcgcgccgtccagaacgcgatccctcgcgc3180

acaacacctcgccggcggctcggctgatgcgctgcccgagtagtttaactttaagaagga3240

gatatacatgaacaccttccggaccgcgacggcacgcgatctccccgatgtcgccgccac3300

cttgaccgaggcgttcgccgccgacccgccgacccaatgggtcttcccggacggtgccgc3360

tgcggtctcccgtttcttcttcggtgtcgccgaccgtgcccgcgaggccggcgggatcgt3420

cgaactactccccggcaccgccgcgatgatcgccctacccccgcacgtacgactacccga3480

cgccccagcctgcggccgacaggccgagatgcagcgcaggctgggcgaacgccgcccccg3540

cactccgcactactacctcctcttctacggcgtgcgcaccgcccatcagagctccggcct3600

ggggggacggatgctctccgacctcatctccctggccgaccgcgaccgcgtgggcaccta3660

caccgaggccagcacctggcgcggcgcccgcctgatgttgcgtcacggcttccacaccgc3720

acagccgctgcggcttccccacgggccacccatgttccccctctggagagacccgatcca3780

tgaccactgcgactgatttaactttaagaaggagatatacatgaccgcactcacccaagc3840

ccattgcgaagcctgccgcgcagacgccccgcacgtcagcgacgaagaactgcccgtgct3900

gctgcggcaaatcccggattggaacatcgaagtccgcgacggcatcatgcagctagagaa3960

ggtctacctgttcaagaacttcaagcatgccctggccttcaccaatgccgtcggcgagat4020

atccgaggccgaaggccaccatccgggcctgctgaccgagtggggcaaagtcaccgtgac4080

ctggtggagccactcgatcaagggcctgcaccgcaacgatttcatcatggcggcgcgcac4140

cgatgaggtagcgaaaaccgccgaggggcgcaaataatttaactttaagaaggagatata4200

catgggtaaaacccagcccttgccaatattaattactggcggaggtcgtcgcatcggcct4260

cgccctcgcatggcatttcattaatcaaaagcaaccggtgattgtcagctatcggacaca4320

ctatccagccattgatggactgattaatgcaggtgcgcagtgtattcaggctgatttttc4380

gaccaacgacggtgtgatggcgtttgccgatgaagtactaaaaagcacccatggtctgcg4440

tgctattttgcataacgccagtgcgtggatggcggaaaaaccgggtgcgccactggccga4500

cgtactggcttgcatgatgcagatccacgttaataccccatacctgctcaaccatgcgct4560

ggaaagattactgcgtgggcacggacacgccgccagcgatatcattcactttaccgatta4620

tgtggtggagcgcggtagcgacaaacatattgcgtatgctgcaagcaaagcggcactgga4680

taatatgacccgctcgtttgcccgcaagctggcaccggaagtgaaagtgaattctattgc4740

gccatcgctgatcctgtttaatgaacatgatgatgccgaatatcgacaacaggcgctgaa4800

taaatcactgatgaaaaccgcgcctggcgagaaagaagtgatcgacctggtcgattactt4860

acttaccagttgctttgtcaccggacgcagtttcccacttgatggcggtcgtcatctgcg4920

ttaaaagcttggctgttttggcggatgagagaagattttcagcctgatacagattaaatc4980

agaacgcagaagcggtctgataaaacagaatttgcctggcggcagtagcgcggtggtccc5040

acctgaccccatgccgaactcagaagtgaaacgccgtagcgccgatggtagtgtggggtc5100

tccccatgcgagagtagggaactgccaggcatcaaataaaacgaaaggctcagtcgaaag5160

actgggcctttcgttttatctgttgtttgtcggtgaacgctctcctgagtaggacaaatc5220

cgccgggagcggatttgaacgttgcgaagcaacggcccggagggtggcgggcaggacgcc5280

cgccataaactgccaggcatcaaattaagcagaaggccatcctgacggatggccttacaa5340

cttatatcgtatggggctgacttcaggtgctacatttgaagagataaattgcactgaaat5400

ctagaaatattttatctgattaataagatgatcttcttgagatcgttttggtctgcgcgt5460

aatctcttgctctgaaaacgaaaaaaccgccttgcagggcggtttttcgaaggttctctg5520

agctaccaactctttgaaccgaggtaactggcttggaggagcgcagtcaccaaaacttgt5580

cctttcagtttagccttaaccggcgcatgacttcaagactaactcctctaaatcaattac5640

cagtggctgctgccagtggtgcttttgcatgtctttccgggttggactcaagacgatagt5700

taccggataaggcgcagcggtcggactgaacggggggttcgtgcatacagtccagcttgg5760

agcgaactgcctacccggaactgagtgtcaggcgtggaatgagacaaacgcggccataac5820

agcggaatgacaccggtaaaccgaaaggcaggaacaggagagcgcacgagggagccgcca5880

gggggaaacgcctggtatctttatagtcctgtcgggtttcgccaccactgatttgagcgt5940

cagatttcgtgatgcttgtcaggggggcggagcctatggaaaaacggctttgccgcggcc6000

ctctcacttccctgttaagtatcttcctggcatcttccaggaaatctccgccccgttcgt6060

aagccatttccgctcgccgcagtcgaacgaccgagcgtagcgagtcagtgagcgaggaag6120

cggaatatatcctgtatcacatattctgctgacgcaccggtgcagccttttttctcctgc6180

cacatgaagcacttcactgacaccctcatcagtgccaacatagtaagccagtatacactc6240

cgctagcgctgatgtccggcggtgcttttgccgttacgcaccaccccgtcagtagctgaa6300

caggagggacagctgatagaaacagaagccactggagcacctcaaaaacaccatcataca6360

ctaaatcagtaagttggcagcatcacccgacgcactttgcgccgaataaatacctgtgac6420

ggaagatcacttcgcagaataaataaatcctggtgtccctgttgataccgggaagccctg6480

ggccaacttttggcgaaaatgagacgttgatcggcacgtaagaggttccaactttcacca6540

taatgaaataagatcactaccgggcgtattttttgagttatcgagattttcaggagctaa6600

ggaagctaaaatggagaaaaaaatcactggatataccaccgttgatatatcccaatggca6660

tcgtaaagaacattttgaggcatttcagtcagttgctcaatgtacctataaccagaccgt6720

tcagctggatattacggcctttttaaagaccgtaaagaaaaataagcacaagttttatcc6780

ggcctttattcacattcttgcccgcctgatgaatgctcatccggaattccgtatggcaat6840

gaaagacggtgagctggtgatatgggatagtgttcacccttgttacaccgttttccatga6900

gcaaactgaaacgttttcatcgctctggagtgaataccacgacgatttccggcagtttct6960

acacatatattcgcaagatgtggcgtgttacggtgaaaacctggcctatttccctaaagg7020

gtttattgagaatatgtttttcgtctcagccaatccctgggtgagtttcaccagttttga7080

tttaaacgtggccaatatggacaacttcttcgcccccgttttcaccatgggcaaatatta7140

tacgcaaggcgacaaggtgctgatgccgctggcgattcaggttcatcatgccgtctgtga7200

tggcttccatgtcggcagaatgcttaatgaattacaacagtactgcgatgagtggcaggg7260

cggggcgtaa7270

<210>6

<211>296

<212>prt

<213>人工序列(artificialsequence)

<400>6

metasnthralaproargargvalgluasnglnleuthrasplysgly

151015

tyrvalprovaltyrthrthralavalvalgluglnprotrpaspgly

202530

tyrseralaaspasphisalathrtrpglythrleutyrargarggln

354045

argalaleuleuvalglyargalacysaspglupheleuglnalagln

505560

aspalametglymetaspaspthrglnileproargpheaspalaleu

65707580

asnalavalleuglnalathrthrglytrpthrleuvalglyvalglu

859095

glyleuleuprogluleuaspphepheasphisleualaasnargarg

100105110

pheprovalthrtrptrpileargargproaspglnileasptyrile

115120125

alagluproaspleuphehisaspleupheglyhisvalproleuleu

130135140

metasnproleuphealaaspphemetglnalatyrglyargglygly

145150155160

vallysalahisglyileglyproaspalaleuglnasnleuthrarg

165170175

leutyrphetyrthrvalglupheglyleuilealathrproglngly

180185190

leuargiletyrglyalaglyilevalserserlysglygluserleu

195200205

hisserleugluseralaalaproasnargvalglypheaspleugln

210215220

argvalmetargthrargtyrargileaspserpheglnlysthrtyr

225230235240

phevalileaspserphethrglnleumetaspalathralaproasp

245250255

phethrproiletyralaalaleualaglnglnproglnvalproala

260265270

glygluvalleualathrasphisvalleuglnargglyserglyglu

275280285

glytrpserargaspglyaspval

290295

<210>7

<211>240

<212>prt

<213>人工序列(artificialsequence)

<400>7

metglylysthrglnproleuproileleuilethrglyglyglyarg

151015

argileglyleualaleualatrphispheileasnglnlysglnpro

202530

valilevalsertyrargthrhistyrproalaileaspglyleuile

354045

asnalaglyalaglncysileglnalaasppheserthrasnaspgly

505560

valmetalaphealaaspgluvalleulysserthrhisglyleuarg

65707580

alaileleuhisasnalaseralatrpmetalaglulysproglyala

859095

proleualaaspvalleualacysmetmetglnilehisvalasnthr

100105110

protyrleuleuasnhisalaleugluargleuleuargglyhisgly

115120125

hisalaalaseraspileilehisphethrasptyrvalvalgluarg

130135140

glyserasplyshisilealatyralaalaserlysalaalaleuasp

145150155160

asnmetthrargserphealaarglysleualaprogluvallysval

165170175

asnserilealaproserleuileleupheasngluhisaspaspala

180185190

glutyrargglnglnalaleuasnlysserleumetlysthralapro

195200205

glyglulysgluvalileaspleuvalasptyrleuleuthrsercys

210215220

phevalthrglyargserpheproleuaspglyglyarghisleuarg

225230235240

<210>8

<211>118

<212>prt

<213>人工序列(artificialsequence)

<400>8

metthralaleuthrglnalahiscysglualacysargalaaspala

151015

prohisvalseraspglugluleuprovalleuleuargglnilepro

202530

asptrpasnilegluvalargaspglyilemetglnleuglulysval

354045

tyrleuphelysasnphelyshisalaleualaphethrasnalaval

505560

glygluileserglualagluglyhishisproglyleuleuthrglu

65707580

trpglylysvalthrvalthrtrptrpserhisserilelysglyleu

859095

hisargasnasppheilemetalaalaargthraspgluvalalalys

100105110

thralagluglyarglys

115

<210>9

<211>492

<212>prt

<213>人工序列(artificialsequence)

<400>9

metargargarglysproalaaspalalysproprohismetasphis

151015

aspthrpheargserleuglyhisglnalaileasptrpilealaasp

202530

tyrtrpglnargleualagluargprovalalaproprovalglupro

354045

glyserileargalaglnleuprothralaproproglucysglyglu

505560

asppheprovalleuleuseraspleugluargilevalleuprogly

65707580

leuleuhistrpglnhisproargphepheglytyrpheproalaasn

859095

alaserglyproalavalleualagluleuleuseralaglyleugly

100105110

ileglnglymetasntrpasnthrserproalacysthrgluileglu

115120125

glnglnmetleuasptrpphevalhisleuleuglyleuprogluhis

130135140

leuargglyglyglyvalileglnaspthralaserseralaleuleu

145150155160

valalaleuleuthralaleuhisglnalaseralaglyargthrarg

165170175

asphisglythrglyglucysglytyrargvaltyrleuthralaglu

180185190

thrhisseralaalaarglysalaalavalilethrglyleuglyleu

195200205

argalametcysgluvalalathraspalaaspglyalametaspala

210215220

valaspleugluarghisleuargalaaspargalaalaglyleuthr

225230235240

proleumetvalvalalathrargglythrthrserhisleuserphe

245250255

aspproleugluaspileglyprovalcysargarghisglyvaltrp

260265270

leuhisvalaspalaalatyralaglyvalalaalavalcysaspglu

275280285

leuargtrpvalasnaspglyvalargtyralaaspsertyrcysthr

290295300

asnprohislystrpleuleuthrasnpheaspcysaspleuleutrp

305310315320

valalahisprogluvalleuvalseralaleuservalleuproglu

325330335

tyrleuargasnseralasergluserglyargvalthrasptyrarg

340345350

histrpglnvalproleuglyargargpheargalaleulysleutrp

355360365

servalleuhistrptyrglyalagluglyleuargalahisilearg

370375380

thrglyvalarghisalaglnleuphealaaspleuvalglyalaasp

385390395400

aspargphethrleuvalthrproproalaleuglyleuvalthrphe

405410415

argglnthrglythraspglugluasnargasnleuleuglnalaile

420425430

asnthrgluglythrthrpheleuthrhisserglulysasnglythr

435440445

phepheleuargphealaalaglyglythrleuthrgluasphishis

450455460

valargglualatrpargalavalglnasnalaileproargalagln

465470475480

hisleualaglyglyseralaaspalaleuproglu

485490

<210>10

<211>182

<212>prt

<213>人工序列(artificialsequence)

<400>10

metasnthrpheargthralathralaargaspleuproaspvalala

151015

alathrleuthrglualaphealaalaaspproprothrglntrpval

202530

pheproaspglyalaalaalavalserargphephepheglyvalala

354045

aspargalaargglualaglyglyilevalgluleuleuproglythr

505560

alaalametilealaleuproprohisvalargleuproaspalapro

65707580

alacysglyargglnalaglumetglnargargleuglygluargarg

859095

proargthrprohistyrtyrleuleuphetyrglyvalargthrala

100105110

hisglnserserglyleuglyglyargmetleuseraspleuileser

115120125

leualaaspargaspargvalglythrtyrthrglualaserthrtrp

130135140

argglyalaargleumetleuarghisglyphehisthralaglnpro

145150155160

leuargleuprohisglyproprometpheproleutrpargasppro

165170175

ilehisasphiscysasp

180

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1