生产L-天冬氨酸的平台菌、基于该平台菌构建的生产β-丙氨酸的重组菌及其构建方法与流程

文档序号:22553645发布日期:2020-10-17 02:33阅读:1119来源:国知局
生产L-天冬氨酸的平台菌、基于该平台菌构建的生产β-丙氨酸的重组菌及其构建方法与流程

本发明属于微生物领域,具体涉及生产l-天冬氨酸的平台菌、基于该平台菌构建的生产β-丙氨酸的重组菌及其构建方法。



背景技术:

l-天冬氨酸(l-aspartate,l-asp)又名α-氨基丁酸,是一种常用的有机化工原料,为无色片状结晶或白色结晶性粉末,无臭,略带酸味。l-天冬氨酸主要作为食品添加剂、化工产品中间体和医药原料来使用:在食品工业方面,l-天冬氨酸是一种良好的营养增补剂,是糖代用品阿斯巴甜的主要生产原料;在化工方面,可以作为制造合成树脂的原料,大量用于合成环保材料聚天冬氨酸,聚天冬氨酸具有极佳的生物相溶性和生物降解特性,因此广泛地用于农业生长促进剂、水处理剂、洗涤剂、化妆品、分散剂、螯合剂、制革、制药、石油开采等领域,是一种用途极为广泛、无毒、无污染的环境友好型化学产品,深受国内外化学工业的关注;在医药方面,是多种药物的组成成分或合成原料。

目前l-天冬氨酸的合成方法主要有传统发酵法和化学与生物酶结合法。传统发酵法是早期工业化生产l-天冬氨酸的主要方法,是以葡萄糖为碳源,利用微生物发酵生产l-天冬氨酸。传统发酵法生产周期长、副产物多、生产成本较高且技术风险大,极大的限制了l-天冬氨酸的应用。化学与生物酶结合法是生产l-天冬氨酸的现有工艺,具体如下:以顺丁烯二酸为原料,在无机催化剂作用下,在强酸性条件(ph值1左右)下转化成富马酸;分离纯化后的富马酸在天冬氨酸酶和过量氨的作用下转化生成天冬氨酸,反应液用硫酸中和过量的氨后,分离纯化得到天冬氨酸。化学与生物酶结合法中,顺丁烯二酸的异构化需要在强酸性条件下进行,对设备的腐蚀性大;而且工艺中还使用大量的硫酸,并有大量的副产物外排,容易引起环境污染。

β-丙氨酸(β-alanine)又名β-氨基丙酸,是一种具有重要价值的非蛋白质氨基酸。β-丙氨酸作为生化原料,在医药、饲料和食品等领域具有广泛的应用前景。例如,β-丙氨酸可以用于合成泛酸(维生素b5),是多种代谢所必需的辅酶a的组成部分。

目前β-丙氨酸的合成方法主要有化学合成法和生物转化法。

化学合成法具体如下:

(1)丙烯酸法

主要通过将丙烯酸、丙烯酸酯或丙烯酸盐与氨水在较高的温度和压力下发生氨化反应,得到β-丙氨酸。丙烯酸法的主要问题是副产物多,需要高温高压等条件。此外,丙烯酸本身的腐蚀性很强,对设备的要求也较高。

(2)丙烯腈法

丙烯腈法包括直接氨化法和氨化水解法。直接氨化法采用烯腈与氨水在高温高压下一步反应合成β-丙氨酸。氨化水解法则是丙烯腈与氨在高温高压下反应生成氨基丙腈,然后在酸性或碱性条件下水解反应生成β-丙氨酸。丙烯腈法也需要高温高压且对设备的要求较高,同时由于使用的丙烯腈为剧毒原料,需要较高的安全防护措施。丙烯腈法收率较低,而且由于水解过程中生成大量无机盐,产品纯度也不高。

(3)β-氨基丙腈法

β-氨基丙腈在酸性或碱性条件下水解生成β-丙氨酸。β-氨基丙腈法的优点是反应产率高,缺点是β-氨基丙腈的价格较高且水解过程中生成大量无机盐。

生物转化法主要是通过酶法转化或利用表达相关酶的全细胞催化获得β-丙氨酸。主要采用如下两类酶的催化作用,将不同的底物转化为β-丙氨酸。

(1)丙烯酸加氨酶法

主要是利用藤黄八叠球菌表达的β-丙氨酸加氨酶将丙烯酸转化为β-丙氨酸,但原料丙烯酸为强腐蚀性和刺激性液体,对人员安全和设备的要求较高。

(2)l-天冬氨酸-α-脱羧酶法

利用l-天冬氨酸-α-脱羧酶将l-天冬氨酸转化为β-丙氨酸,该方法的成本取决于l-天冬氨酸原料的成本。

综上所述,化学合成法普遍面临反应条件苛刻、不宜分离纯化、容易造成环境污染等问题;而生物转化法需要建立廉价的原料路线,提高产物转化率,才能降低生产成本,形成具有推广前景的生产模式。



技术实现要素:

本发明的目的生产l-天冬氨酸及其下游产品(如β-丙氨酸)。

本发明首先提供了制备重组菌的方法。

本发明首先保护制备重组菌的方法一,可包括如下步骤:

步骤(a1):在大肠杆菌中表达磷酸烯醇式丙酮酸羧化酶。

当大肠杆菌为大肠杆菌bw25113时,使用方法一获得的重组菌具体可为实施例中提及的xy01。

本发明还保护制备重组菌的方法二,可包括如下步骤:

所述步骤(a1);

步骤(a2):完成步骤(a1)后,降低所述大肠杆菌中丙酮酸激酶的表达量和/或活性。

当大肠杆菌为大肠杆菌bw25113时,使用方法二获得的重组菌具体可为实施例中提及的xy02。

本发明还保护制备重组菌的方法三,可包括如下步骤:

所述步骤(a1);

所述步骤(a2);

步骤(a3):完成步骤(a2)后,降低所述大肠杆菌中丙酮酸激酶ⅰ的表达量和/或活性。

当大肠杆菌为大肠杆菌bw25113时,使用方法三获得的重组菌具体可为实施例中提及的xy05。

本发明还保护制备重组菌的方法四,可包括如下步骤:

所述步骤(a1);

所述步骤(a2);

所述步骤(a3);

步骤(a4):完成步骤(a3)后,降低所述大肠杆菌中苹果酸脱氢酶的表达量和/或活性。

当大肠杆菌为大肠杆菌bw25113时,使用方法四获得的重组菌具体可为实施例中提及的xy06。

本发明还保护制备重组菌的方法五,可包括如下步骤:

所述步骤(a1);

所述步骤(a2);

所述步骤(a3);

所述步骤(a4);

步骤(a5):完成步骤(a4)后,降低所述大肠杆菌中天冬氨酸氨化酶的表达量和/或活性。

当大肠杆菌为大肠杆菌bw25113时,使用方法五获得的重组菌具体可为实施例中提及的xy11。

本发明还保护制备重组菌的方法六,可包括如下步骤:

所述步骤(a1);

所述步骤(a2);

所述步骤(a3);

所述步骤(a4);

所述步骤(a5);

步骤(a6):完成步骤(a5)后,降低所述大肠杆菌中磷酸转移酶g亚基的表达量和/或活性且在所述大肠杆菌中表达葡萄糖激酶。

当大肠杆菌为大肠杆菌bw25113时,使用方法六获得的重组菌具体可为实施例中提及的xy12。

本发明还保护制备重组菌的方法七,可包括如下步骤:

所述步骤(a1);

所述步骤(a2);

所述步骤(a3);

所述步骤(a4);

所述步骤(a5);

所述步骤(a6);

步骤(a7):完成步骤(a6)后,降低所述大肠杆菌中半乳糖抑制子的表达量和/或活性。

当大肠杆菌为大肠杆菌bw25113时,使用方法七获得的重组菌具体可为实施例中提及的xy13。

本发明还保护制备重组菌的方法八,可包括如下步骤:

所述步骤(a1);

所述步骤(a2);

所述步骤(a3);

所述步骤(a4);

所述步骤(a5);

所述步骤(a6);

所述步骤(a7);

步骤(a8):完成步骤(a7)后,降低所述大肠杆菌中丙酮酸氧化酶的表达量和/或活性且在所述大肠杆菌中表达乙酰辅酶a合成酶。

当大肠杆菌为大肠杆菌bw25113时,使用方法八获得的重组菌具体可为实施例中提及的xy21。

本发明还保护制备重组菌的方法九,可包括如下步骤:

所述步骤(a1);

所述步骤(a2);

所述步骤(a3);

所述步骤(a4);

所述步骤(a5);

所述步骤(a6);

所述步骤(a7);

所述步骤(a8);

步骤(a9):完成步骤(a8)后,降低所述大肠杆菌中富马酸还原酶的表达量和/或活性。

当大肠杆菌为大肠杆菌bw25113时,使用方法九获得的重组菌具体可为实施例中提及的xy22。

本发明还保护制备重组菌的方法十,可包括如下步骤:

所述步骤(a1);

所述步骤(a2);

所述步骤(a3);

所述步骤(a4);

所述步骤(a5);

所述步骤(a6);

所述步骤(a7);

所述步骤(a8);

所述步骤(a9);

步骤(a10):完成步骤(a9)后,在所述大肠杆菌中表达碳酸氢根转运蛋白和碳酸酐酶。

当大肠杆菌为大肠杆菌bw25113时,使用方法十获得的重组菌具体可为实施例中提及的xy23。

本发明还保护制备重组菌的方法十一,可包括如下步骤:

所述步骤(a1);

所述步骤(a2);

所述步骤(a3);

所述步骤(a4);

所述步骤(a5);

所述步骤(a6);

所述步骤(a7);

所述步骤(a8);

所述步骤(a9);

所述步骤(a10);

步骤(a11):完成步骤(a10)后,在所述大肠杆菌中表达磷酸烯醇式丙酮酸羧激酶。

当大肠杆菌为大肠杆菌bw25113时,使用方法十一获得的重组菌具体可为实施例中提及的xy28。

本发明还保护制备重组菌的方法十二,可包括如下步骤:

所述步骤(a1);

所述步骤(a2);

所述步骤(a3);

所述步骤(a4);

所述步骤(a5);

所述步骤(a6);

所述步骤(a7);

所述步骤(a8);

所述步骤(a9);

所述步骤(a10);

所述步骤(a11);

步骤(a12):完成步骤(a11)后,降低所述大肠杆菌中乳酸脱氢酶的表达量和/或活性且在所述大肠杆菌中表达天冬氨酸转氨酶和谷氨酸脱氢酶。

当大肠杆菌为大肠杆菌bw25113时,使用方法十二获得的重组菌具体可为实施例中提及的xy41。

上述任一所述的方法中,所述大肠杆菌可为以葡萄糖作为碳源的大肠杆菌。

上述任一所述“在大肠杆菌中表达磷酸烯醇式丙酮酸羧化酶”是通过向大肠杆菌中导入磷酸烯醇式丙酮酸羧化酶的编码基因(即ppc基因)来实现的。

上述任一所述降低大肠杆菌中丙酮酸激酶的表达量和/或活性是通过敲除大肠杆菌中丙酮酸激酶的编码基因(即pyka基因)来实现的。

上述任一所述降低大肠杆菌中丙酮酸激酶ⅰ的表达量和/或活性是通过敲除大肠杆菌中丙酮酸激酶ⅰ的编码基因(即pykf基因)来实现的。

上述任一所述降低大肠杆菌中苹果酸脱氢酶的表达量和/或活性是通过敲除大肠杆菌中苹果酸脱氢酶的编码基因(即mdh基因)来实现的。

上述任一所述降低大肠杆菌中天冬氨酸氨化酶的表达量和/或活性是通过敲除大肠杆菌中天冬氨酸氨化酶的编码基因(即aspa基因)来实现的。

上述任一所述“在大肠杆菌中表达葡萄糖激酶”是通过向大肠杆菌中导入葡萄糖激酶的编码基因(即glk基因)来实现的。

上述任一所述降低大肠杆菌中磷酸转移酶g亚基的表达量和/或活性是通过敲除大肠杆菌中磷酸转移酶g亚基的编码基因(即ptsg基因)来实现的。

上述任一所述降低大肠杆菌中半乳糖抑制子的表达量和/或活性是通过敲除大肠杆菌中半乳糖抑制子的编码基因(即galr基因)来实现的。

上述任一所述“在大肠杆菌中表达乙酰辅酶a合成酶”是通过向大肠杆菌中导入乙酰辅酶a合成酶的编码基因(即acs基因)来实现的。

上述任一所述降低大肠杆菌中丙酮酸氧化酶的表达量和/或活性是通过敲除大肠杆菌中丙酮酸氧化酶的编码基因(即poxb基因)来实现的。

上述任一所述降低大肠杆菌中富马酸还原酶的表达量和/或活性是通过敲除大肠杆菌中富马酸还原酶的编码基因(即frdabcd基因簇)来实现的。

上述任一所述“在大肠杆菌中表达碳酸氢根转运蛋白和碳酸酐酶”是通过向大肠杆菌中导入碳酸氢根转运蛋白的编码基因(即ca基因)和碳酸酐酶的编码基因(即bt基因)来实现的。

上述任一所述“在大肠杆菌中表达磷酸烯醇式丙酮酸羧激酶”是通过向大肠杆菌中导入磷酸烯醇式丙酮酸羧激酶的编码基因(即mspck基因)来实现的。

上述任一所述“在大肠杆菌中表达天冬氨酸转氨酶和谷氨酸脱氢酶”是通过向大肠杆菌中导入天冬氨酸转氨酶的编码基因(即cgaspc基因)和谷氨酸脱氢酶的编码基因(rocg基因)来实现的。

上述任一所述降低大肠杆菌中乳酸脱氢酶的表达量和/或活性是通过敲除大肠杆菌中乳酸脱氢酶的编码基因(即ldha基因)来实现的。

上述任一所述“向大肠杆菌中导入磷酸烯醇式丙酮酸羧化酶的编码基因”具体可为将大肠杆菌外膜蛋白的编码基因(即ompt基因)替换为磷酸烯醇式丙酮酸羧化酶的编码基因(即ppc基因)。

上述任一所述“向大肠杆菌中导入葡萄糖激酶的编码基因”和上述任一所述“敲除大肠杆菌中磷酸转移酶g亚基的编码基因”具体可为将大肠杆菌磷酸转移酶g亚基的编码基因(即ptsg基因)替换为葡萄糖激酶的编码基因(即glk基因)。

上述任一所述“向大肠杆菌中导入乙酰辅酶a合成酶的编码基因”和上述任一所述“敲除大肠杆菌中丙酮酸氧化酶的编码基因”具体可为将大肠杆菌丙酮酸氧化酶的编码基因(即poxb基因)替换为乙酰辅酶a合成酶(即acs基因)的编码基因。

上述任一所述“向大肠杆菌中导入碳酸氢根转运蛋白的编码基因和碳酸酐酶的编码基因”具体可为将大肠杆菌富马酸还原酶的编码基因(即frdabcd基因簇)替换为碳酸氢根转运蛋白的编码基因(即ca基因)和碳酸酐酶的编码基因(即bt基因)。

上述任一所述“向大肠杆菌中导入磷酸烯醇式丙酮酸羧激酶的编码基因”具体可为将大肠杆菌丙酮酸激酶的编码基因(即pyka基因)替换为磷酸烯醇式丙酮酸羧激酶的编码基因(即mspck基因)。

上述任一所述“向大肠杆菌中导入天冬氨酸转氨酶的编码基因和谷氨酸脱氢酶的编码基因”和上述任一所述“敲除大肠杆菌中乳酸脱氢酶的编码基因”具体可为将大肠杆菌乳酸脱氢酶的编码基因(即ldha基因)替换为天冬氨酸转氨酶的编码基因(即cgaspc基因)和谷氨酸脱氢酶的编码基因(即rocg基因)。

本发明还保护制备重组菌的方法十三,可包括如下步骤:

所述步骤(a1);

所述步骤(a2);

所述步骤(a3);

所述步骤(a4);

所述步骤(a5);

所述步骤(a6);

所述步骤(a7);

所述步骤(a8);

所述步骤(a9);

所述步骤(a10);

所述步骤(a11);

所述步骤(a12);

步骤(a13):完成步骤(a12)后,在所述大肠杆菌中表达天冬氨酸脱羧酶。

当大肠杆菌为大肠杆菌bw25113时,使用方法十三获得的重组菌具体可为实施例中提及的xy51。

所述“在大肠杆菌中表达天冬氨酸脱羧酶”是通过向大肠杆菌中导入天冬氨酸脱羧酶的编码基因(即bspand基因)来实现的。

上述任一所述“向大肠杆菌中导入天冬氨酸脱羧酶的编码基因”具体可为将大肠杆菌半乳糖抑制子的编码基因(即galr基因)替换为天冬氨酸脱羧酶的编码基因(即bspand基因)。

上述任一所述磷酸烯醇式丙酮酸羧化酶具体可来源于谷氨酸棒状杆菌。

上述任一所述碳酸氢根转运蛋白具体可来源于聚球藻。

上述任一所述碳酸酐酶具体可来源于藻青菌项圈藻。

上述任一所述磷酸烯醇式丙酮酸羧激酶具体可来源于牛瘤胃产琥珀酸菌。

上述任一所述天冬氨酸转氨酶具体可来源于谷氨酸棒状杆菌。

上述任一所述谷氨酸脱氢酶和上述任一所述天冬氨酸脱羧酶具体可来源于枯草芽孢杆菌。

上述任一所述磷酸烯醇式丙酮酸羧化酶的编码基因是通过同源重组的方式进行导入的,其中同源重组片段的核苷酸序列可如序列表中序列9所示。

上述任一所述富马酸还原酶的编码基因是通过同源重组的方式进行敲除的,其中同源重组片段的核苷酸序列可如序列表中序列10所示。

上述任一所述碳酸氢根转运蛋白的编码基因和碳酸酐酶的编码基因是通过同源重组的方式进行导入的,其中同源重组片段的核苷酸序列可如序列表中序列11所示。

上述任一所述磷酸烯醇式丙酮酸羧激酶的编码基因是通过同源重组的方式进行导入的,其中同源重组片段的核苷酸序列可如序列表中序列12所示。

上述任一所述天冬氨酸转氨酶的编码基因和谷氨酸脱氢酶的编码基因是通过同源重组的方式进行导入的,其中同源重组片段的核苷酸序列可如序列表中序列13所示。

上述任一所述天冬氨酸脱羧酶的编码基因是通过同源重组的方式进行导入的,其中同源重组片段的核苷酸序列可如序列表中序列14所示。

上述任一所述大肠杆菌可为大肠杆菌k-12系列菌株或大肠杆菌b系列菌株。

上述任一所述大肠杆菌k-12系列菌株具体可为大肠杆菌bw25113、大肠杆菌mg1655或大肠杆菌w3110。

上述任一所述大肠杆菌b系列菌株具体可为大肠杆菌de3或大肠杆菌bl21。

方法一至方法十三任一所述的方法制备的重组菌也属于本发明的保护范围。

本发明还保护制备产l-天冬氨酸重组菌的方法,可为方法s1)或方法s2)。

方法s1)在方法一至方法十二任一所述的方法制备的重组菌中表达天冬氨酸转氨酶和谷氨酸脱氢酶,从而获得产l-天冬氨酸重组菌。

方法s2)在方法一至方法十二任一所述的方法制备的重组菌中表达天冬氨酸转氨酶,从而获得产l-天冬氨酸重组菌。

本发明还保护制备产β-丙氨酸重组菌的方法,为方法t1)或方法t2):

方法t1)在方法一至方法十三任一所述的方法制备的重组菌中表达天冬氨酸转氨酶、谷氨酸脱氢酶和天冬氨酸脱羧酶,从而获得产β-丙氨酸重组菌;

方法t2)在方法一至方法十三任一所述的方法制备的重组菌中表达天冬氨酸转氨酶和天冬氨酸脱羧酶,从而获得产β-丙氨酸重组菌。

所述方法s1)或所述方法t1)中,“表达天冬氨酸转氨酶和谷氨酸脱氢酶”是通过导入天冬氨酸转氨酶的编码基因(即aspc基因)和谷氨酸脱氢酶的编码基因来实现的。

所述方法s2)或所述方法t2)中,“表达天冬氨酸转氨酶”是通过导入天冬氨酸转氨酶的编码基因(即aspc基因)来实现的。

所述方法t1)或所述方法t2)中,“表达天冬氨酸脱羧酶”是通过导入天冬氨酸脱羧酶的编码基因来实现的。

上述任一所述天冬氨酸转氨酶可来源于大肠杆菌。

上述任一所述谷氨酸脱氢酶可来源于枯草芽孢杆菌或大肠杆菌。

上述任一所述天冬氨酸脱羧酶可来源于赤拟谷盗或枯草芽孢杆菌。

所述aspc基因的核苷酸序列可如序列表中序列2所示。

所述来源于枯草芽孢杆菌的谷氨酸脱氢酶的编码基因(即rocg基因)的核苷酸序列可如序列表中序列4自5’末端起第18-1292位所示。

所述来源于大肠杆菌bw25113的谷氨酸脱氢酶的编码基因(即gdha基因)的核苷酸序列可如序列表中序列3自5’末端起第15-1358位所示。

所述来源于枯草芽孢杆菌的天冬氨酸脱羧酶的编码基因(即bspand基因)的核苷酸序列可如序列表中序列5所示

所述来源于赤拟谷盗的天冬氨酸脱羧酶的编码基因(即tcpand基因)的核苷酸序列可如序列表中序列7所示。

所述方法s1)具体可为向方法一至方法十二任一所述的方法制备的重组菌中导入实施例提及的重组质粒plb1a-ea或重组质粒plb1a-eg,从而获得产l-天冬氨酸重组菌。

所述方法s2)具体可为向方法一至方法十二任一所述的方法制备的重组菌中导入实施例提及的重组质粒plb1a-e,从而获得产l-天冬氨酸重组菌。

所述方法t1)具体可为向方法一至方法十三任一所述的方法制备的重组菌中导入重组质粒1(实施例提及的重组质粒plb1a-eg或重组质粒plb1a-ea)和重组质粒2(实施例提及的重组质粒pyb1s-bspand或重组质粒pxb1k-tcpand),从而获得产β-丙氨酸重组菌。

所述方法t2)具体可为向方法一至方法十三任一所述的方法制备的重组菌中导入实施例提及的重组质粒plb1a-e和重组质粒2(实施例提及的重组质粒pyb1s-bspand或重组质粒pxb1k-tcpand),从而获得产β-丙氨酸重组菌。

由上述任一所述方法s1)或上述任一所述方法s2)制备的产l-天冬氨酸重组菌也属于本发明的保护范围。

方法一至方法十二任一所述的方法制备的重组菌、或、上述任一所述方法s1)或上述任一所述方法s2)制备的产l-天冬氨酸重组菌在生产l-天冬氨酸或l-天冬氨酸的上下游产品中的应用也属于本发明的保护范围。

本发明还保护一种生产l-天冬氨酸的方法,可包括如下步骤:发酵培养上述任一所述产l-天冬氨酸重组菌,收集发酵产物,从中获得l-天冬氨酸。

上述方法中,发酵培养时可以葡萄糖作为碳源。

由上述任一所述方法t1)或上述任一所述方法t2)制备的产β-丙氨酸重组菌也属于本发明的保护范围。

方法一至方法十三任一所述的方法所述的方法制备的重组菌、或、上述任一所述方法t1)或上述任一所述方法t2)制备的产β-丙氨酸重组菌在生产β-丙氨酸或β-丙氨酸的上下游产品中的应用也属于本发明的保护范围。

本发明还保护一种生产β-丙氨酸的方法,可包括如下步骤:发酵培养上述任一所述产β-丙氨酸重组菌,收集发酵产物,从中获得β-丙氨酸。

上述方法中,发酵培养时可以葡萄糖作为碳源。

上述任一所述l-天冬氨酸的上游产品可为草酰乙酸或草酰乙酸的下游产品。

上述任一所述l-天冬氨酸的下游产品可为β-丙氨酸或β-丙氨酸的下游产品。

上述任一所述β-丙氨酸的下游产品具体可为泛酸。

上文中,所述富马酸还原酶由富马酸还原酶黄蛋白亚基frda、富马酸还原酶铁硫蛋白frdb、富马酸还原酶膜蛋白frdc和富马酸还原酶膜蛋白frdd组成。所述富马酸还原酶的编码基因由富马酸还原酶黄蛋白亚基frda的编码基因、富马酸还原酶铁硫蛋白frdb的编码基因、富马酸还原酶膜蛋白frdc的编码基因和富马酸还原酶膜蛋白frdd的编码基因组成。

本发明的发明人通过改变大肠杆菌bw25113的葡萄糖摄入途径及糖酵解途径使磷酸烯醇式丙酮酸大量积累,进而增强固碳途径以获得大量的前体物质草酰乙酸,加强l-天冬氨酸合成途径相关基因靶点,通过引入辅因子循环系统解决共底物不足的问题,并改造中心代谢途径三羧酸循环以及敲除副产物竞争旁路,从而获得合成l-天冬氨酸的最短、转化率最高的途径的重组菌甲。在此基础上,通过增强天冬氨酸脱羧酶的表达获得高效合成β-丙氨酸的能力的重组菌乙。本发明还提供了一种利用重组菌甲、以葡萄糖为原料合成l-天冬氨酸的方法,该方法能够以廉价的葡萄糖为原料进行发酵,转化高效合成l-天冬氨酸,其中xy41/plb1a-eg(向xy41中导入重组质粒plb1a-eg获得的重组大肠杆菌)合成l-asp的效果最好(为国际研究中的最高转化率水平),能够合成约50.10±2.10mml-asp,转化率达到1.00m/m葡萄糖。本发明还提供了一种利用重组菌乙、以葡萄糖为原料合成β-丙氨酸的方法,该方法能够以廉价的葡萄糖为原料进行发酵,转化高效合成β-丙氨酸,其中xy51/plb1a-eg.pxb1k-tcpand(即向xy51中导入重组质粒plb1a-eg和重组质粒pxb1k-tcpand获得的重组大肠杆菌)合成β-丙氨酸的效果最好(为国际研究中的最高转化率水平),能够合成约76.01±2.80mmβ-丙氨酸,转化率为1.52m/m葡萄糖。本发明具有重要的应用价值,在工业生产中具有潜在的优势。

附图说明

图1为标准品溶液的hplc检测结果。

图2为以葡萄糖为原料,重组大肠杆菌生产l-天冬氨酸的产量。

图3为以葡萄糖为原料,重组大肠杆菌生产β-丙氨酸的产量。

图4为mdh基因和aspa基因的敲除能够使l-asp有效积累。

图5为来源于大肠杆菌的gdha基因和来源于枯草芽孢杆菌rocg基因对l-天冬氨酸和β-丙氨酸的产量的影响。

图6为ptsg基因替换为glk基因、poxb基因替换为acs基因和galr基因的敲除能够提高β-丙氨酸的产量和降低副产物的产量。

图7为frdabcd基因簇的敲除能够提高β-丙氨酸的产量和降低丁二酸的产量。

图8为ca基因、bt基因和mspck基因的导入能够提高l-天冬氨酸的生产强度。

图9为来源于赤拟谷盗的tcpand基因和来源于枯草芽孢杆菌的bspand基因对l-天冬氨酸产量的影响。

具体实施方式

以下的实施例便于更好地理解本发明,但并不限定本发明。

下述实施例中的实验方法,如无特殊说明,均为常规方法。

下述实施例中所用的试验材料,如无特殊说明,均为自常规生化试剂商店购买得到的。

下述实施例中,大肠杆菌bw25113(记载于如下文献中:datsenkoka,wannerbl.one-stepinactivationofchromosomalgenesinescherichiacolik-12usingpcrproducts.proc.natl.acad.sci.u.s.a.2000;97(12):6640-6645.)是一株非病原菌,遗传背景清楚,世代时间短、容易培养且培养基原料低廉。公众可从中国科学院微生物研究所获得大肠杆菌bw25113,该生物材料只为重复本发明的相关实验所用,不可作为其它用途使用。

下述实施例中,gibson组装方法记载与如下文献中:gibsondg,youngl,etal.enzymaticassemblyofdnamoleculesuptoseveralhundredkilobases.nat.methods.2009;6(5):343-345。

下述实施例中涉及的引物及其核苷酸序列见表1。

表1

细菌基因组提取试剂盒为天根生化科技(北京)有限公司的产品,产品目录为dp302。高保真transstartfastpfudna聚合酶和大肠杆菌dh5α感受态细胞均为北京全式金生物技术有限公司的产品,产品目录号分别为ap221和cd201。pkd46质粒和质粒pcp20均为clontech公司的产品。

实施例1、基因工程菌株的构建

一、构建表达大肠杆菌天冬氨酸转氨酶的重组质粒(即重组质粒plb1a-e)

1、采用细菌基因组提取试剂盒提取大肠杆菌bw25113基因组dna。

2、以步骤1提取的大肠杆菌基因组dna为模板,以aspc-gf和aspc-gr为引物,用高保真transstartfastpfudna聚合酶进行pcr扩增,得到pcr扩增产物。

3、将步骤2得到的pcr扩增产物进行琼脂糖凝胶电泳,然后回收约1240bp的dna片段。该dna片段含有aspc基因,aspc基因的核苷酸序列如序列表中序列2所示。aspc基因编码大肠杆菌的天冬氨酸转氨酶。

4、用限制性内切酶ncoi和xhoi酶切载体plb1a,回收约4kb的lb1a-nx片段。

载体plb1a(环形)的核苷酸序列如序列表中序列1所示。序列表中序列1中,自5’末端起,第86-964位为arac基因的核苷酸序列,第1238-1266位为pbad启动子的核苷酸序列,第1295-1299位为rbs序列,第1307-1312位为限制性内切酶ncoi的位点,第1366-1371位为限制性内切酶xhoi的位点,第1384-1389位为限制性内切酶spei的位点,第1393-1398位为限制性内切酶ecori的位点,第1501-1658位为trrnb终止子的核苷酸序列,第1674-2060位为r6k复制起始位点orir6k序列,第2150-3067位为r6k复制起始位点pir基因的核苷酸序列,第3333-4193位为氨苄青霉素抗性基因的核苷酸序列。

5、用gibson组装方法将步骤3回收的dna片段和步骤4回收的lb1a-nx片段进行连接,然后用cacl2法转化大肠杆菌dh5α感受态细胞,均匀涂布于含氨苄青霉素的lb平板上,37℃培养过夜。

6、完成步骤5后,分别挑选克隆,用f105-f和aspc-gr进行菌液pcr扩增,得到pcr扩增产物;如果pcr扩增产物中含有约2000bp的dna片段,则相应的克隆为阳性克隆。

7、挑选阳性克隆提取质粒,该质粒即为重组质粒plb1a-e。

重组质粒plb1a-e表达大肠杆菌的天冬氨酸转氨酶。

二、构建协同表达天冬氨酸转氨酶和谷氨酸脱氢酶的重组质粒

1、构建协同表达大肠杆菌的天冬氨酸转氨酶和大肠杆菌的谷氨酸脱氢酶的重组质粒(即重组质粒plb1a-ea)

(1)采用细菌基因组提取试剂盒提取大肠杆菌bw25113基因组dna。

(2)以步骤(1)提取的大肠杆菌基因组dna为模板,采用gdha-gf和gdha-gr组成的引物对进行pcr扩增,得到pcr扩增产物。

(3)将步骤(2)得到的pcr扩增产物进行琼脂糖凝胶电泳,然后回收约1400bp的dna片段。该dna片段含有rbs序列和gdha基因,rbs序列的核苷酸序列如序列表中序列3自5’末端起第2-7位所示,gdha基因的核苷酸序列如序列表中序列3自5’末端起第15-1358位所示。gdha基因编码大肠杆菌的谷氨酸脱氢酶。

(4)用限制性内切酶xhoi和spei酶切重组质粒plb1a-e,回收约5.5kb的lb1a-aspc-xp片段。

(5)用gibson组装方法将步骤(3)回收的dna片段和步骤(4)回收的lb1a-aspc-xp片段进行连接,然后用cacl2法转化大肠杆菌dh5α感受态细胞,均匀涂布于含氨苄青霉素的lb平板上,37℃培养过夜。

(6)完成步骤(5)后,分别挑选克隆,用gdha-gf和t58-r进行菌液pcr扩增,得到pcr扩增产物;如果pcr扩增产物中含有约1500bp的dna片段,则相应的克隆为阳性克隆。

(7)挑选阳性克隆提取质粒,该质粒即为重组质粒plb1a-ea。

重组质粒plb1a-ea表达大肠杆菌的天冬氨酸转氨酶和谷氨酸脱氢酶。

2、构建协同表达大肠杆菌的天冬氨酸转氨酶和枯草芽孢杆菌的谷氨酸脱氢酶的重组质粒(即重组质粒plb1a-eg)

(1)采用细菌基因组提取试剂盒提取枯草芽孢杆菌基因组dna。

(2)以步骤(1)提取的枯草芽孢杆菌基因组dna为模板,采用rocg-gf和rocg-gr组成的引物对进行pcr扩增,得到pcr扩增产物。

(3)将步骤(2)得到的pcr扩增产物进行琼脂糖凝胶电泳,然后回收约1340bp的dna片段。该dna片段含有rbs序列和rocg基因,rbs序列的核苷酸序列如序列表中序列4自5’末端起第7-12位所示,rocg基因的核苷酸序列如序列表中序列4自5’末端起第18-1292位所示。rocg基因编码枯草芽孢杆菌的谷氨酸脱氢酶。

(4)用限制性内切酶xhoi和spei酶切重组质粒plb1a-e,回收约5.5kb的lb1a-aspc-xp片段。

(5)用gibson组装方法将步骤(3)回收的dna片段和步骤(4)回收的lb1a-aspc-xp片段进行连接,然后用cacl2法转化大肠杆菌dh5α感受态细胞,均匀涂布于含氨苄青霉素的lb平板上,37℃培养过夜。

(6)完成步骤(5)后,分别挑选克隆,用rocg-gf和t58-r进行菌液pcr扩增,得到pcr扩增产物;如果pcr扩增产物中含有约1500bp的dna片段,则相应的克隆为阳性克隆。

(7)挑选阳性克隆提取质粒,该质粒即为重组质粒plb1a-eg。

重组质粒plb1a-eg表达大肠杆菌的天冬氨酸转氨酶和枯草芽孢杆菌的谷氨酸脱氢酶。

三、构建表达天冬氨酸脱羧酶的重组质粒

1、构建表达枯草芽孢杆菌的天冬氨酸脱羧酶的重组质粒(即重组质粒pyb1s-bspand)

(1)人工合成枯草芽孢杆菌(bacillussubtilis)的bspand基因。bspand基因的核苷酸序列如序列表中序列5所示。bspand基因编码枯草芽孢杆菌的天冬氨酸脱羧酶。

(2)将步骤(1)合成的dna分子和puc57载体连接,得到重组质粒puc57-bspand。

(3)以重组质粒puc57-bspand为模板,以bspand-gf和bspand-gr为引物,采用高保真transstartfastpfudna聚合酶进行pcr扩增,得到pcr扩增产物。

(4)将步骤(3)得到的pcr扩增产物进行琼脂糖凝胶电泳,然后回收约470bp的dna片段。

(5)用限制性内切酶ncoi和spei酶切载体pyb1s,回收约3.5kb的yb1s-ns片段。

载体pyb1s(环形)的核苷酸序列如序列表中序列6所示。序列表中序列6中,自5’末端起,第86-964位为arac基因的核苷酸序列,第1238-1266位为pbad启动子的核苷酸序列,第1295-1299位为rbs序列,第1307-1312位为限制性内切酶ncoi的位点,第1372-1377位为限制性内切酶spei的位点,第1489-1646位为trrnb终止子的核苷酸序列,第1655-2445位为p15a复制起始位点的序列,第2556-3344位为链霉素抗性基因的核苷酸序列。

(6)用gibson组装方法将步骤(4)回收的dna片段和步骤(5)回收的yb1s-ns片段进行连接,然后用cacl2法转化大肠杆菌dh5α感受态细胞,均匀涂布于含链霉素的lb平板上,37℃培养过夜。

(7)完成步骤(6)后,分别挑选克隆,用f105-f和bspand-gr进行菌液pcr扩增,得到pcr扩增产物;如果pcr扩增产物中含有约500bp的dna片段,则相应的克隆为阳性克隆。

(8)挑选阳性克隆提取质粒,该质粒即为重组质粒pyb1s-bspand。

重组质粒pyb1s-bspand表达枯草芽孢杆菌的天冬氨酸脱羧酶。

2、构建表达赤拟谷盗的天冬氨酸脱羧酶的重组质粒(即重组质粒pxb1k-tcpand)

(1)人工合成赤拟谷盗(triboliumcastaneum)的tcpand基因。tcpand基因的核苷酸序列如序列表中序列7所示。tcpand基因编码赤拟谷盗的天冬氨酸脱羧酶。

(2)将步骤(1)合成的dna分子和puc57载体连接,得到重组质粒puc57-tcpand。

(3)以重组质粒puc57-tcpand为模板,以tcpand-gf和tcpand-gr为引物,采用高保真transstartfastpfudna聚合酶进行pcr扩增,得到pcr扩增产物。

(4)将步骤(3)得到的pcr扩增产物进行琼脂糖凝胶电泳,然后回收约1700bp的dna片段。

(5)用限制性内切酶ncoi和xhoi酶切载体pxb1k,回收约3.5kb的xb1k-nx片段。

载体pxb1k(环形)的核苷酸序列如序列表中序列8所示。序列表中序列8中,自5’末端起,第86-964位为arac基因的核苷酸序列,第1238-1266位为pbad启动子的核苷酸序列,第1295-1299位为rbs序列,第1308-1313位为限制性内切酶ncoi的位点,第1367-1372位为限制性内切酶xhoi的位点,第1501-1658位为trrnb终止子的核苷酸序列,第1667-2579位为p15a复制起始位点的序列,第2684-3499位为卡那霉素抗性基因的核苷酸序列。

(6)用gibson组装方法将步骤(4)回收的dna片段和步骤(5)回收的xb1k-nx片段进行连接,然后用cacl2法转化大肠杆菌dh5α感受态细胞,均匀涂布于含卡那霉素的lb平板上,37℃培养过夜。

(7)完成步骤(6)后,分别挑选克隆,用f105-f和tcpand-gr进行菌液pcr扩增,得到pcr扩增产物;如果pcr扩增产物中含有约1700bp的dna片段,则相应的克隆为阳性克隆。

(8)挑选阳性克隆提取质粒,该质粒即为重组质粒pxb1k-tcpand。

重组质粒pxb1k-tcpand表达赤拟谷盗的天冬氨酸脱羧酶。

四、基因工程菌株的构建

1、宿主菌的获得

以大肠杆菌bw25113作为出发菌株,宿主菌的性状包括下列一种或多种性状,各宿主菌的基因型如表2所示。

表2.宿主菌及其基因型

(1)将编码外膜蛋白的ompt基因替换为编码磷酸烯醇式丙酮酸羧化酶(来源于谷氨酸棒状杆菌)的ppc基因

(1-a)宿主菌的制备

将pkd46质粒化学转入无抗性的大肠杆菌bw25113,得到含有质粒pkd46的重组大肠杆菌pkd46/bw。将重组大肠杆菌pkd46/bw在30℃进行转接,并加入阿拉伯糖进行诱导以使其表达λ噬菌体的red重组蛋白,并将其制成电转感受态(即重组大肠杆菌pkd46/bw的电转感受态细胞),使其具有了同源重组的能力。

(1-b)打靶片段omptup-tac-cgppc-kan-omptdown的制备

人工合成序列表中序列9所述的dna片段,该dna片段即为打靶片段omptup-tac-cgppc-kan-omptdown。

序列表中序列9中,自5’末端起,第1至200位为ompt基因的上游同源臂序列,第201至344位为tac启动子的核苷酸序列,第345至356位为rbs序列,第357至3116位为编码磷酸烯醇式丙酮酸羧化酶(来源于谷氨酸棒状杆菌)的ppc基因的核苷酸序列,第3216至3373位为trrnb终止子的核苷酸序列,第3401至3435位和第4610至4657位均为frt序列,第3803至4597位为卡那霉素抗性基因的核苷酸序列,第4658至4803位为ompt基因的下游同源臂序列。两个frt序列和卡那霉素抗性基因的核苷酸序列共同组成带frt侧翼的卡那霉素抗性基因(其结构为frt-kan-frt)。

(1-c)同源重组

(1-c-1)将打靶片段omptup-tac-cgppc-kan-omptdown电转入重组大肠杆菌pkd46/bw的电转感受态细胞,然后涂布于含卡那霉素的lb平板上(卡那霉素浓度为50μg/ml),37℃培养过夜。

(1-c-2)分别挑选单克隆,用cgppc-if(插入基因cgppc的内部正向引物)和ompt-d-r(敲除基因ompt的下游引物)进行菌液pcr扩增,得到pcr扩增产物;如果pcr扩增产物中含有约3600bp的dna片段,则相应的单克隆为阳性单克隆。

将获得的阳性单克隆命名为△ompt::cgppc-bw-kan。

(1-d)抗性消除

(1-d-1)将△ompt::cgppc-bw-kan在lb无抗平板上划线,然后置于42℃培养箱中培养过夜(目的为丢失温敏质粒pkd46),获得若干阳性单克隆。

(1-d-2)将步骤(1-d-1)得到的阳性单克隆分别在lb无抗平板和lb抗性平板(氨苄青霉素抗性)上点板,26℃倒置培养36h。如果某阳性单克隆在lb无抗平板出现克隆,而lb抗性平板没有出现克隆,说明该阳性单克隆的pkd46质粒已消除。

(1-d-3)利用氯化钙转化法将质粒pcp20(表达flp重组酶)转入消除了pkd46质粒的阳性单克隆的感受态细胞,然后涂布于含氨苄青霉素的lb平板上,30℃培养过夜,获得若干单克隆。这些单克隆即为含有质粒pcp20的重组大肠杆菌,命名为pcp20/△ompt::cgppc-kan-bw。

(1-d-4)将步骤(1-d-3)得到的单克隆在lb无抗平板上划线,然后置于42℃培养箱中培养过夜(目的为丢失温敏质粒pcp20),获得若干单克隆。

(1-d-5)将步骤(1-d-4)得到的单克隆分别在lb无抗平板、lb抗性平板(卡那霉素抗性)和lb抗性平板(氨苄青霉素抗性)上点板,26℃倒置培养36h。如果某单克隆在lb无抗平板出现克隆,而lb抗性平板(卡那霉素抗性)和lb抗性平板(氨苄青霉素抗性)上均没有出现克隆,说明该单克隆消除了卡那抗性筛选标记同时消除了温敏型质粒pcp20。将该无抗单克隆命名为xy01:△ompt::cgppc-bw,简称xy01。

(2)丙酮酸激酶基因pyka的敲除

(2-a)p1virδpyka的制备

制备含有大肠杆菌基因片段的p1噬菌体,所含有的基因片段具有pyka敲除性状。含有pyka敲除性状的大肠杆菌基因片段来自大肠杆菌菌株jw1843,该菌株为含有pyka敲除性状的w3110系列菌株,购自日本国立遗传学研究所(nig,japan),其中的编码丙酮酸激酶的基因pyka替换为两端带有frt位点的卡那霉素抗性基因(约1300bp)从而将pyka基因敲除(babat,arat,etal.constructionofescherichiacolik-12in-frame,single-geneknockoutmutants:thekeiocollection.mol.syst.biol.2006;2:2006.0008.)。

p1virδpyka制备过程如下:将大肠杆菌菌株jw184337℃过夜培养后转接于含5mmol/lcacl2和0.1%(m/v)葡萄糖的lb液体培养基中,37℃培养1h;然后加入野生型p1噬菌体继续培养至菌液裂解,有细胞碎片产生;最后加几滴氯仿再培养5min,离心,收集上清液;将上清液用孔径为0.22μm的滤膜过滤,收集滤液。滤液即为即为制备的p1virδpyka。

(2-b)p1转导

(2-b-1)将xy01单克隆接种至lb液体培养基,37℃培养12h,得到培养菌液。

(2-b-2)取1.5ml培养菌液,10000g离心2min,收集菌体。

(2-b-3)取步骤(2-b-2)收集的菌体,用0.75mlp1盐溶液(含10mmcacl2和5mmmgso4的水溶液)重悬,得到受体菌细胞悬浮液。

(2-b-4)将100μl步骤(2-a)制备的噬菌体p1virδpyka和100μl受体菌细胞悬浮液混合,先37℃培养30min;然后加入1mllb液体培养基和200μl浓度为1mol/l的柠檬酸钠水溶液,混匀,37℃继续培养1h,离心,收集菌体;最后取所述菌体,用100μllb液体培养基重悬后涂布在含卡那霉素的lb平板(卡那霉素的浓度为50μg/ml)上,37℃培养过夜。

(2-b-5)完成步骤(2-b-4)后,分别挑选克隆,用pyka-up-f和pyka-d-r进行菌液pcr扩增,得到pcr扩增产物;如果pcr扩增产物中含有约2600bp的dna片段,则相应的克隆为阳性克隆。将该阳性克隆命名为△pyka-kan-xy01。

(2-c)抗性的消除

(2-c-1)利用氯化钙转化法将质粒pcp20(表达flp重组酶)转化至步骤(2-b)得到的阳性克隆,然后涂布于含氨苄青霉素的lb平板上,30℃培养过夜,获得若干单克隆。这些单克隆即为含有质粒pcp20的重组大肠杆菌,命名为pcp20/△pyka-kan-xy01。

(2-c-2)将步骤(2-c-1)得到的单克隆在lb无抗平板上划线,然后置于43℃培养箱中培养过夜。

(2-c-3)完成步骤(2-c-2)后,分别挑选克隆,用pyka-up-f和pyka-d-r进行菌液pcr扩增,得到pcr扩增产物;如果pcr扩增产物中含有约1200bp的dna片段,则相应的克隆为阳性克隆。将该阳性克隆命名为xy02:△pyka-xy01,简称xy02。

(3)丙酮酸激酶ⅰ基因pykf的敲除

(3-a)p1virδpykf的制备

按照步骤(2)中(2-a)的方法,将大肠杆菌菌株jw1843替换为大肠杆菌菌株jw1666(日本国立遗传学研究所的产品),其它步骤均不变,得到p1virδpykf。

(3-b)p1转导

按照步骤(2)中(2-b)的方法,将xy01替换为xy02,噬菌体p1virδpyka替换为p1virδpykf,其它步骤均不变,得到阳性克隆。将该阳性克隆命名为δpykf-kan-xy02。

(3-c)抗性的消除

(3-c-1)同步骤(2)中(2-c-1)。

(3-c-2)同步骤(2)中(2-c-2)。

(3-c-3)完成步骤(3-c-2)后,分别挑选克隆,用pykf-up-f和pykf-d-r进行菌液pcr扩增,得到pcr扩增产物;如果pcr扩增产物中含有约420bp的dna片段,则相应的克隆为阳性克隆。将该阳性克隆命名为xy05:δpykf-xy02,简称xy05。

(4)苹果酸脱氢酶基因mdh的敲除

(4-a)p1virδmdh的制备

按照步骤(2)中(2-a)的方法,将大肠杆菌菌株jw1843替换为大肠杆菌菌株jw3205(日本国立遗传学研究所的产品),其它步骤均不变,得到p1virδmdh。

(4-b)p1转导

按照步骤(2)中(2-b)的方法,将xy01替换为xy05,噬菌体p1virδpyka替换为p1virδmdh,其它步骤均不变,得到阳性克隆。将该阳性克隆命名为δmdh-kan-xy05。

(4-c)抗性的消除

(4-c-1)同步骤(2)中(2-c-1)。

(4-c-2)同步骤(2)中(2-c-2)。

(4-c-3)完成步骤(4-c-2)后,分别挑选克隆,用mdh-up-f和mdh-d-r进行菌液pcr扩增,得到pcr扩增产物;如果pcr扩增产物中含有约1570bp的dna片段,则相应的克隆为阳性克隆。将该阳性克隆命名为xy06:δmdh-xy05,简称xy06。

(5)天冬氨酸氨化酶aspa的敲除

(5-a)p1virδaspa的制备

按照步骤(2)中(2-a)的方法,将大肠杆菌菌株jw1843替换为大肠杆菌菌株jw4099(日本国立遗传学研究所的产品),其它步骤均不变,得到p1virδaspa。

(5-b)p1转导

按照步骤(2)中(2-b)的方法,将xy01替换为xy06,噬菌体p1virδpyka替换为p1virδaspa,其它步骤均不变,得到阳性克隆。将该阳性克隆命名为δaspa-kan-xy06。

(5-c)抗性的消除

(5-c-1)同步骤(2)中(2-c-1)。

(5-c-2)同步骤(2)中(2-c-2)。

(5-c-3)完成步骤(5-c-2)后,分别挑选克隆,用aspa-up-f和aspa-d-r进行菌液pcr扩增,得到pcr扩增产物;如果pcr扩增产物中含有约700bp的dna片段,则相应的克隆为阳性克隆。将该阳性克隆命名为xy11:δaspa-xy06,简称xy11。

(6)替换磷酸转移酶g亚基ptsg基因为葡萄糖激酶基因glk

(6-a)参照中国专利文献cn105002105b中实施例1的方法,以xy11为受体菌,利用ptsg-up-f和ptsg-d-r验证,构建得到阳性克隆,将该阳性克隆命名为δptsg::glk-kan-xy11。

(6-b)抗性的消除

(6-b-1)同步骤(2)中(2-c-1)。

(6-b-2)同步骤(2)中(2-c-2)。

(6-b-3)完成步骤(6-b-2)后,分别挑选克隆,用ptsg-up-f和ptsg-d-r进行菌液pcr扩增,得到pcr扩增产物;如果pcr扩增产物中含有约2000bp的dna片段,则相应的克隆为阳性克隆。将该阳性克隆命名为xy12:δptsg::glk-xy11,简称xy12。

(7)编码半乳糖抑制子galr的基因galr的敲除

(7-a)参照中国专利文献cn105002105b中实施例1的方法,以xy12为受体菌,利用galr-up-f和galr-d-r验证,构建得到阳性克隆,将该阳性克隆命名为δgalr-kan-xy12。

(7-b)抗性的消除

(7-b-1)同步骤(2)中(2-c-1)。

(7-b-2)同步骤(2)中(2-c-2)。

(7-b-3)完成步骤(7-b-2)后,分别挑选克隆,用galr-up-f和galr-d-r进行菌液pcr扩增,得到pcr扩增产物;如果pcr扩增产物中含有约500bp的dna片段,则相应的克隆为阳性克隆。将该阳性克隆命名为xy13:δgalr-xy12,简称xy13。

(8)将丙酮酸氧化酶基因poxb替换为乙酰辅酶a合成酶基因acs

(8-a)参照中国专利文献cn104805047b中实施例2-6的方法,以xy13为受体菌,利用poxb-up-f和poxb-d-r验证,构建得到阳性克隆,将该阳性克隆命名为δpoxb::acs-kan-xy13。

(8-b)抗性的消除

(8-b-1)同步骤(2)中(2-c-1)。

(8-b-2)同步骤(2)中(2-c-2)。

(8-b-3)完成步骤(8-b-2)后,分别挑选克隆,用poxb-up-f和poxb-d-r进行菌液pcr扩增,得到pcr扩增产物;如果pcr扩增产物中含有约3500bp的dna片段,则相应的克隆为阳性克隆。将该阳性克隆命名为xy21:δpoxb::acs-xy13,简称xy21。

(9)富马酸还原酶frdabcd基因簇的敲除

(9-a)宿主菌的制备

按照步骤(1)中(1-a)的方法,将无抗性的大肠杆菌bw25113替换为xy21,其它步骤均不变,得到含有质粒pkd46的重组大肠杆菌pkd46/xy21及其电转感受态(即重组大肠杆菌pkd46/xy21的电转感受态细胞)。

(9-b)打靶片段frdaup-kan-frdddown的制备

人工合成序列表中序列10所述的dna片段,该dna片段即为打靶片段frdaup-kan-frdddown。

序列表中序列10中,自5’末端起,第1至200位为frda基因的上游同源臂序列,第228至262位和第1437至1484位均为frt序列,第630至1424位为卡那霉素抗性基因的核苷酸序列,第1485至1671位为frdd基因的下游同源臂序列。两个frt序列和卡那霉素抗性基因的核苷酸序列共同组成带frt侧翼的卡那霉素抗性基因(其结构为frt-kan-frt)。

(9-c)同源重组

(9-c-1)将打靶片段frdaup-kan-frdddown电转入重组大肠杆菌pkd46/xy21的电转感受态细胞,然后涂布于含卡那霉素的lb平板上(卡那霉素浓度为50μg/ml),37℃培养过夜。

(9-c-2)分别挑选单克隆,用frda-up-f和frdd-d-r进行菌液pcr扩增,得到pcr扩增产物;如果pcr扩增产物中含有约1600bp的dna片段,则相应的单克隆为阳性单克隆。

(9-d)抗性消除

按照步骤(1)中(1-d)的方法,将△ompt::cgppc-bw-kan替换为步骤(9-c)得到的阳性单克隆,其它步骤均不变,得到无抗单克隆。将该无抗单克隆命名为xy22:△frdabcd-xy21,简称xy22。

(10)富马酸还原酶frdabcd基因簇替换为编码碳酸氢根转运蛋白(来源于聚球藻)的ca基因和编码碳酸酐酶(来源于藻青菌项圈藻)的bt基因

(10-a)宿主菌的制备

按照步骤(1)中(1-a)的方法,将无抗性的大肠杆菌bw25113替换为xy22,其它步骤均不变,得到含有质粒pkd46的重组大肠杆菌pkd46/xy22及其电转感受态(即重组大肠杆菌pkd46/xy22的电转感受态细胞)。

(10-b)打靶片段frdaup-cpa1-btca-kan-frdddown的制备

人工合成序列表中序列11所述的dna片段,该dna片段即为打靶片段frdaup-cpa1-btca-kan-frdddown。

序列表中序列11中,自5’末端起,第1至200位为frda基因的上游同源臂序列,第201至367位为cpa1启动子的核苷酸序列,第368至373位和第1803至1808位均为rbs序列,第381至1802位为bt基因的核苷酸序列,第1814至2566位为ca基因的核苷酸序列,第2759至2916位为trrnb终止子的核苷酸序列,第2944至2978位和第4153至4200位均为frt序列,第3346至4140位为卡那霉素抗性基因的核苷酸序列,第4200至4387位为frdd基因的下游同源臂序列。两个frt序列和卡那霉素抗性基因的核苷酸序列共同组成带frt侧翼的卡那霉素抗性基因(其结构为frt-kan-frt)。

(10-c)同源重组

(10-c-1)将打靶片段frdaup-cpa1-btca-kan-frdddown电转入重组大肠杆菌pkd46/xy22的电转感受态细胞,然后涂布于含卡那霉素的lb平板上(卡那霉素浓度为50μg/ml),37℃培养过夜。

(10-c-2)分别挑选单克隆,用frda-up-f和ca-ir进行菌液pcr扩增,得到pcr扩增产物;如果pcr扩增产物中含有约2500bp的dna片段,则相应的单克隆为阳性单克隆。

(10-d)抗性消除

按照步骤(1)中(1-d)的方法,将△ompt::cgppc-bw-kan替换为步骤(10-c)得到的阳性单克隆,其它步骤均不变,得到无抗单克隆。将该无抗单克隆命名为xy23:△frdabcd::btca-xy22,简称xy23。

(11)编码丙酮酸激酶的pyka基因替换为编码磷酸烯醇式丙酮酸羧激酶(来源牛瘤胃产琥珀酸菌)的mspck基因

(11-a)宿主菌的制备

按照步骤(1)中(1-a)的方法,将无抗性的大肠杆菌bw25113替换为xy23,其它步骤均不变,得到含有质粒pkd46的重组大肠杆菌pkd46/xy23及其电转感受态(即重组大肠杆菌pkd46/xy23的电转感受态细胞)。

(11-b)打靶片段pykaup-119-mspck-kan-pykadown的制备

人工合成序列表中序列12所述的dna片段,该dna片段即为打靶片段pykaup-119-mspck-kan-pykadown。

序列表中序列12中,自5’末端起,第1至156位为pyka基因的下游同源臂序列,第184至218位和第1393至1440位均为frt序列,第586至1380位为卡那霉素抗性基因的核苷酸序列,第1461至1489位为119启动子的核苷酸序列,第368至373位和第1803至1808位均为rbs序列,第1788至3404位为mspck基因的核苷酸序列,第3414至3571位为trrnb终止子的核苷酸序列,第3766至4635位为pyka基因的上游同源臂序列。两个frt序列和卡那霉素抗性基因的核苷酸序列共同组成带frt侧翼的卡那霉素抗性基因(其结构为frt-kan-frt)。

(11-c)同源重组

(11-c-1)将打靶片段pykaup-119-mspck-kan-pykadown电转入重组大肠杆菌pkd46/xy23的电转感受态细胞,然后涂布于含卡那霉素的lb平板上(卡那霉素浓度为50μg/ml),37℃培养过夜。

(11-c-2)分别挑选单克隆,用mspck-if和pyka-up-f进行菌液pcr扩增,得到pcr扩增产物;如果pcr扩增产物中含有约1100bp的dna片段,则相应的单克隆为阳性单克隆。

(11-d)抗性消除

按照步骤(1)中(1-d)的方法,将△ompt::cgppc-bw-kan替换为步骤(11-c)得到的阳性单克隆,其它步骤均不变,得到无抗单克隆。将该无抗单克隆命名为xy28:△pyka::mspck-xy23,简称xy28。

(12)将编码乳酸脱氢酶的ldha基因替换为编码天冬氨酸转氨酶(来源于谷氨酸棒状杆菌)的cgaspc基因和编码谷氨酸脱氢酶(来源于枯草芽孢杆菌)的rocg基因

(12-a)宿主菌的制备

按照步骤(1)中(1-a)的方法,将无抗性的大肠杆菌bw25113替换为xy28,其它步骤均不变,得到含有质粒pkd46的重组大肠杆菌pkd46/xy28及其电转感受态(即重组大肠杆菌pkd46/xy28的电转感受态细胞)。

(12-b)打靶片段ldhaup-119-cgaspc-rocg-kan-ldhadown的制备

人工合成序列表中序列13所述的dna片段,该dna片段即为打靶片段ldhaup-119-cgaspc-rocg-kan-ldhadown。

序列表中序列13中,自5’末端起,第1至100位为ldha基因的上游同源臂序列,第101至129位为119启动子的核苷酸序列,第195至199和第1491至1495位均为rbs序列,第209至1489位为cgaspc基因的核苷酸序列,第1501至2775位为rocg基因的核苷酸序列,第2968至3125位为trrnb终止子的核苷酸序列,第3153至3187位和第4362至4409位均为frt序列,第3555至4349位为卡那霉素抗性基因的核苷酸序列,第4410至4519位为ldha基因的下游同源臂序列。两个frt序列和卡那霉素抗性基因的核苷酸序列共同组成带frt侧翼的卡那霉素抗性基因(其结构为frt-kan-frt)。

(12-c)同源重组

(12-c-1)将打靶片段ldhaup-119-cgaspc-rocg-kan-ldhadown电转入重组大肠杆菌pkd46/xy28的电转感受态细胞,然后涂布于含卡那霉素的lb平板上(卡那霉素浓度为50μg/ml),37℃培养过夜。

(12-c-2)分别挑选单克隆,用ldha-up-f和rocg-ir进行菌液pcr扩增,得到pcr扩增产物;如果pcr扩增产物中含有约1900bp的dna片段,则相应的单克隆为阳性单克隆。

(12-d)抗性消除

按照步骤(1)中(1-d)的方法,将△ompt::cgppc-bw-kan替换为步骤(12-c)得到的阳性单克隆,其它步骤均不变,得到无抗单克隆。将该无抗单克隆命名为xy41:△ldha::cgaspc-rocg-xy28,简称xy41。

(13)将编码半乳糖抑制子的galr基因替换为编码天冬氨酸脱羧酶(来源于枯草芽孢杆菌)的bspand基因

(13-a)宿主菌的制备

按照步骤(1)中(1-a)的方法,将无抗性的大肠杆菌bw25113替换为xy41,其它步骤均不变,得到含有质粒pkd46的重组大肠杆菌pkd46/xy41及其电转感受态(即重组大肠杆菌pkd46/xy41的电转感受态细胞)。

(13-b)打靶片段galrup-119-bspand-kan-galrdown的制备

人工合成序列表中序列14所述的dna片段,该dna片段即为打靶片段galrup-119-bspand-kan-galrdown。

序列表中序列13中,自5’末端起,第1至100位为galr基因的上游同源臂序列,第101至129位为119启动子的核苷酸序列,第195至199位和第1491至1495位均为rbs序列,第209至616位为bspand基因的核苷酸序列,第809至966位为trrnb终止子的核苷酸序列,第994至1028位和第2203至2250位均为frt序列,第1396至2190位为卡那霉素抗性基因的核苷酸序列,第2251至2417位为galr基因的下游同源臂序列。两个frt序列和卡那霉素抗性基因的核苷酸序列共同组成带frt侧翼的卡那霉素抗性基因(其结构为frt-kan-frt)。

(13-c)同源重组

(13-c-1)将打靶片段galrup-119-bspand-kan-galrdown电转入重组大肠杆菌pkd46/xy41的电转感受态细胞,然后涂布于含卡那霉素的lb平板上(卡那霉素浓度为50μg/ml),37℃培养过夜。

(13-c-2)分别挑选单克隆,用galr-up-f和galr-d-r进行菌液pcr扩增,得到pcr扩增产物;如果pcr扩增产物中含有约2600bp的dna片段,则相应的单克隆为阳性单克隆。

(13-d)抗性消除

按照步骤(1)中(1-d)的方法,将△ompt::cgppc-bw-kan替换为步骤(13-c)得到的阳性单克隆,其它步骤均不变,得到无抗单克隆。将该无抗单克隆命名为xy51:△ldha::cgaspc-rocg-xy41,简称xy51。

2、基因工程菌株的构建

宿主菌为大肠杆菌bw25113、xy01、xy02、xy05、xy06、xy11、xy12、xy13、xy21、xy22、xy23、xy28、xy41或xy51。

(1)将重组质粒plb1a-e、重组质粒plb1a-ea或重组质粒plb1a-eg导入宿主菌,得到重组大肠杆菌甲。

(2)将重组质粒1(重组质粒plb1a-e、重组质粒plb1a-ea或重组质粒plb1a-eg)和重组质粒2(重组质粒pyb1s-bspand或重组质粒pxb1k-tcpand)导入宿主菌,得到重组大肠杆菌乙。

(3)将载体plb1a、载体pyb1s或载体pxb1k导入宿主菌,得到重组大肠杆菌丙(作为空载对照菌)。

重组大肠杆菌甲、重组大肠杆菌乙和重组大肠杆菌丙即为构建的基因工程菌株。

实施例2、利用实施例1构建的基因工程菌株制备l-天冬氨酸或β-丙氨酸

自诱导培养基zym由100ml溶液a、2ml溶液b、2ml溶液c、200μl溶液d和100μl溶液e组成。

溶液a:含1%(m/m)胰蛋白胨和0.5%(m/m)酵母粉的水溶液。

溶液b:含1.25mna2hpo4、1.25mkh2po4、2.5mnh4cl和0.25mna2so4的水溶液。

溶液c:含25%(m/m)甘油、2.5%(m/m)葡萄糖和10%(m/m)l-阿拉伯糖的水溶液。

溶液d:浓度为1m的mgso4水溶液。

溶液e:含50mmfecl3、20mmcacl2、10mmmncl2、10mmznso4、2mmcocl2、2mmnicl2、2mmna2mo4、2mmna2seo3和2mmh3bo3的水溶液。

实验重复三次取平均值,每次重复的步骤如下:

1、将实施例1构建的基因工程菌株(重组大肠杆菌甲、重组大肠杆菌乙或重组大肠杆菌丙)在lb抗性平板上划线(lb抗性平板的抗性由相应的菌株的抗性决定),37℃培养12h,得到单克隆。

2、完成步骤1后,挑取单克隆,接种至5mllb液体抗性培养基中(lb液体抗性培养基的抗性由相应的菌株的抗性决定),37℃、220rpm振荡培养过夜,得到培养菌液。

3、完成步骤2后,将培养菌液接种至自诱导培养基zym中(即接种体积比为1%),30℃、220rpm振荡培养16h,得到诱导菌液。

4、完成步骤3后,取诱导菌液,4℃、8000g离心10min,收集菌体。

5、完成步骤4后,取所述菌体,用0.85%生理盐水洗涤两次。

6、完成步骤5后,取所述菌体,用500μl转化液重悬,得到od600nm值为15的重悬液。

转化液:含50mm葡萄糖、100mm碳酸氢铵和50μm磷酸吡哆醛的ph7.0、50mm的kh2po4-k2hpo4缓冲液。

7、完成步骤6后,取所述重悬液,37℃、200rpm反应3h。

8、取完成步骤7的反应体系,12000rpm离心10min,收集上清;将上清先用无菌水稀释10倍,然后使用0.22μm滤膜过滤,收集滤液。

9、完成步骤8后,取所述滤液,采用hplc检测氨基酸(如l-天冬氨酸、β-丙氨酸)、有机酸、葡萄糖的产量。

10、取浓度为10mm的标准品溶液,采用hplc检测。检测波长为360nm。

标准品溶液的溶质为l-asp、l-glu和β-ala。

标准品溶液的hplc检测结果见图1(3.995min出峰为l-asp,5.751min出峰为l-glu,14.046min出峰为β-ala,10.939min出峰为溶剂峰)。

部分实验结果见图2至图9。具体结论如下:

(1)向大肠杆菌(大肠杆菌bw25113、xy01、xy02、xy05、xy06、xy11、xy12、xy13、xy21、xy22、xy23、xy28或xy41)中导入重组质粒1(重组质粒plb1a-e、重组质粒plb1a-ea或重组质粒plb1a-eg),得到的重组大肠杆菌均可以合成l-asp。其中xy41/plb1a-eg(向xy41中导入重组质粒plb1a-eg获得的重组大肠杆菌)合成l-asp的效果最好(为国际研究中的最高转化率水平),能够合成约50.10±2.10mml-asp,转化率达到1.00m/m葡萄糖(见图2)。

(2)向大肠杆菌(大肠杆菌bw25113、xy01、xy02、xy05、xy06、xy11、xy12、xy13、xy21、xy22、xy23、xy28、xy41或xy51)中导入重组质粒1(重组质粒plb1a-e、重组质粒plb1a-ea或重组质粒plb1a-eg)和重组质粒2(重组质粒pyb1s-bspand或重组质粒pxb1k-tcpand),得到的重组大肠杆菌均可以合成β-丙氨酸。其中xy51/plb1a-eg.pxb1k-tcpand(即向xy51中导入重组质粒plb1a-eg和重组质粒pxb1k-tcpand获得的重组大肠杆菌)合成β-丙氨酸的效果最好(为国际研究中的最高转化率水平),能够合成约76.01±2.80mmβ-丙氨酸,转化率为1.52m/m葡萄糖(见图3)。

(3)将xy05中mdh基因(编码苹果酸脱氢酶)和aspa基因(编码天冬氨酸氨化酶)敲除,获得xy11。向xy05或xy11中导入重组质粒plb1a-e,得到的重组大肠杆菌均可以合成l-asp。与xy05/plb1a-e(向xy05中导入重组质粒plb1a-e获得的重组大肠杆菌)相比,xy11/plb1a-e(向xy11中导入重组质粒plb1a-e获得的重组大肠杆菌)能够有效积累l-asp,l-asp的产量由0.5mm提高到6.95mm(见图4)。

(4)谷氨酸脱氢酶能够有效将共底物l-谷氨酸变为辅因子,自身辅因子循环系统的建立能够有效提高l-asp的产量,进而也提高了β-丙氨酸的产量。来源于大肠杆菌的gdha基因(编码谷氨酸脱氢酶)使l-asp由6.95mm提高到12.5mm;来源于枯草芽孢杆菌rocg基因(编码谷氨酸脱氢酶)使l-asp由6.95mm提高到30mm。来源于大肠杆菌的gdha基因(编码谷氨酸脱氢酶)使β-丙氨酸由10mm提高到33.5mm;来源于枯草芽孢杆菌rocg基因(编码谷氨酸脱氢酶)使β-丙氨酸由10mm提高到40mm。由此可见,rocg基因的作用优于gdha基因(见图5)。

(5)将xy11中的ptsg基因(编码磷酸转移酶g亚基)替换为glk基因(编码葡萄糖激酶),poxb基因(编码丙酮酸氧化酶)替换为acs基因(编码乙酰辅酶a合成酶),并将galr基因(编码半乳糖抑制子)敲除,获得xy21。

向xy11或xy21中导入重组质粒plb1a-eg和重组质粒pyb1s-bspand,得到的重组大肠杆菌均可以合成β-丙氨酸。与xy11/plb1a-eg.pyb1s-bspand相比,xy21/plb1a-eg.pyb1s-bspand能够有效积累β-丙氨酸,β-丙氨酸的产量由46.8±2.9mm提高到65.2±5.2mm,同时减少副产物(如丁二酸(suc)、乙酸(ace)、乳酸(lac)、甲酸(for))的合成(见图6)。

(6)将xy21中frdabcd基因簇(编码富马酸还原酶)敲除,获得xy22。

向xy21或xy22中导入重组质粒plb1a-eg和重组质粒pyb1s-bspand,得到的重组大肠杆菌均可以合成β-丙氨酸。与xy21/plb1a-eg.pyb1s-bspand相比,xy22/plb1a-eg.pyb1s-bspand能够有效积累β-丙氨酸,β-丙氨酸的产量由55.3±4.8mm提高到72±3.6mm(见图7中左图),同时减少副产物(如丁二酸)的合成(见图7中右图)。

向xy21或xy22中导入重组质粒plb1a-eg,得到的重组大肠杆菌均可以合成l-asp。与xy21/plb1a-eg相比,xy22/plb1a-eg能够有效积累l-asp,l-asp的产量由40±1.0mm提高到45±1.2mm,同时减少副产物(如丁二酸)的合成。

(7)向xy22中导入ca基因(编码碳酸氢根转运蛋白)、bt基因(编码碳酸酐酶)和mspck基因(编码磷酸烯醇式丙酮酸羧激酶),获得xy28。

向xy22或xy28中导入重组质粒plb1a-eg,得到的重组大肠杆菌均可以合成l-asp。与xy22/plb1a-eg(即图8中的eg/xy22)相比,xy28/plb1a-eg(即图8中的eg/xy28)生产l-asp的强度显著提高(见图8)。

(8)向xy41中导入重组质粒plb1a-eg和重组质粒2(重组质粒pyb1s-bspand或重组质粒pxb1k-tcpand),得到的重组大肠杆菌均可以合成l-asp。xy41/plb1a-eg.tcpand比xy41/plb1a-eg.bspand合成l-asp的产量提高。由此可见,tcpand基因(来源于赤拟谷盗)的作用优于bspand基因(来源于枯草芽孢杆菌)(见图9)。

(9)将大肠杆菌bw25113的ompt基因(编码外膜蛋白)替换为ppc基因(编码磷酸烯醇式丙酮酸羧化酶),得到xy01。

向xy01或大肠杆菌bw25113中导入重组质粒plb1a-e和重组质粒pyb1s-bspand,得到的重组大肠杆菌均可以合成β-丙氨酸。xy01/plb1a-e.pyb1s-bspand比bw25113/plb1a-e.pyb1s-bspand合成β-丙氨酸的产量提高,达到10mmβ-丙氨酸。磷酸烯醇式丙酮酸羧化酶能够有效增强固碳途径,提高前体草酰乙酸供应,进而提高β-丙氨酸产量。

在高产l-天冬氨酸的平台菌(xy01-xy41)基础上通过引入天冬氨酸脱羧酶能够有效合成β-丙氨酸。xy01-xy51不仅能够作为生产l-天冬氨酸及其衍生物(例如β-丙氨酸)的平台菌,也可以作为供应前体物质草酰乙酸的平台菌,以生产由草酰乙酸衍生得到的系列产品。

按照上述方法,将大肠杆菌bw25113替换为大肠杆菌mg1655、大肠杆菌w3110、大肠杆菌de3或大肠杆菌bl21,其它步骤均不变,得到相应的重组大肠杆菌。相应的重组大肠杆菌可以合成l-asp且与大肠杆菌bw25113改造的重组大肠杆菌合成l-asp的能力无显著差异。相应的重组大肠杆菌可以合成β-丙氨酸且与大肠杆菌bw25113改造的重组大肠杆菌合成β-丙氨酸的能力无显著差异。

<110>中国科学院微生物研究所

<120>生产l-天冬氨酸的平台菌、基于该平台菌构建的生产β-丙氨酸的重组菌及其构建方法

<160>14

<170>patentinversion3.5

<210>1

<211>4293

<212>dna

<213>artificialsequence

<400>1

aatgtgcctgtcaaatggacgaagcagggattctgcaaaccctatgctactccgtcaagc60

cgtcaattgtctgattcgttaccaattatgacaacttgacggctacatcattcacttttt120

cttcacaaccggcacggaactcgctcgggctggccccggtgcattttttaaatacccgcg180

agaaatagagttgatcgtcaaaaccaacattgcgaccgacggtggcgataggcatccggg240

tggtgctcaaaagcagcttcgcctggctgatacgttggtcctcgcgccagcttaagacgc300

taatccctaactgctggcggaaaagatgtgacagacgcgacggcgacaagcaaacatgct360

gtgcgacgctggcgatatcaaaattgctgtctgccaggtgatcgctgatgtactgacaag420

cctcgcgtacccgattatccatcggtggatggagcgactcgttaatcgcttccatgcgcc480

gcagtaacaattgctcaagcagatttatcgccagcagctccgaatagcgcccttcccctt540

gcccggcgttaatgatttgcccaaacaggtcgctgaaatgcggctggtgcgcttcatccg600

ggcgaaagaaccccgtattggcaaatattgacggccagttaagccattcatgccagtagg660

cgcgcggacgaaagtaaacccactggtgataccattcgcgagcctccggatgacgaccgt720

agtgatgaatctctcctggcgggaacagcaaaatatcacccggtcggcaaacaaattctc780

gtccctgatttttcaccaccccctgaccgcgaatggtgagattgagaatataacctttca840

ttcccagcggtcggtcgataaaaaaatcgagataaccgttggcctcaatcggcgttaaac900

ccgccaccagatgggcattaaacgagtatcccggcagcaggggatcattttgcgcttcag960

ccatacttttcatactcccgccattcagagaagaaaccaattgtccatattgcatcagac1020

attgccgtcactgcgtcttttactggctcttctcgctaaccaaaccggtaaccccgctta1080

ttaaaagcattctgtaacaaagcgggaccaaagccatgacaaaaacgcgtaacaaaagtg1140

tctataatcacggcagaaaagtccacattgattatttgcacggcgtcacactttgctatg1200

ccatagcatttttatccataagattagcggatcctacctgacgctttttatcgcaactct1260

ctactgtttctccatacccgttttttgggctaacaggaggaattaaccatgggtacctct1320

catcatcatcatcatcacagcagcggcctggtgccgcgcggcagcctcgagggtagatct1380

ggtactagtggtgaattcggtgagctcggtctgcagctggtgccgcgcggcagccaccac1440

caccaccaccactaatacagattaaatcagaacgcagaagcggtctgataaaacagaatt1500

tgcctggcggcagtagcgcggtggtcccacctgaccccatgccgaactcagaagtgaaac1560

gccgtagcgccgatggtagtgtggggtctccccatgcgagagtagggaactgccaggcat1620

caaataaaacgaaaggctcagtcgaaagactgggcctttcgtcgacctaattcccatgtc1680

agccgttaagtgttcctgtgtcactgaaaattgctttgagaggctctaagggcttctcag1740

tgcgttacatccctggcttgttgtccacaaccgttaaaccttaaaagctttaaaagcctt1800

atatattcttttttttcttataaaacttaaaaccttagaggctatttaagttgctgattt1860

atattaattttattgttcaaacatgagagcttagtacgtgaaacatgagagcttagtacg1920

ttagccatgagagcttagtacgttagccatgagggtttagttcgttaaacatgagagctt1980

agtacgttaaacatgagagcttagtacgtgaaacatgagagcttagtacgtactatcaac2040

aggttgaactgcggatcttgatgagtggatagtacgttgctaaaacatgagataaaaatt2100

gactctcatgttattggcgttaagatatacagaatgatgaggtttttttatgagactcaa2160

ggtcatgatggacgtgaacaaaaaaacgaaaattcgccaccgaaacgagctaaatcacac2220

cctggctcaacttcctttgcccgcaaagcgagtgatgtatatggcgcttgctcccattga2280

tagcaaggaacctcttgaacgagggcgagttttcaaaattagggctgaagaccttgcagc2340

gctcgccaaaatcaccccatcgcttgcttatcgacaattaaaagagggtggtaagttact2400

tggtgccagcaaaatttcgctaagaggggatgatatcattgcttcagctaaagagcttaa2460

cctgctctttactgctaaagactcccctgaagagttagatcttaacattattgagtggat2520

agcttattcaaatgatgaaggatacttgtctttaaaattcaccagaaccatagaaccata2580

tatctctagccttattgggaaaaaaaataaattcacaacgcaattgttaacggcaagctt2640

acgcttaagtagccagtattcatcttctctttatcaacttatcaggaagcattactctaa2700

ttttaagaagaaaaattattttattatttccgttgatgagttaaaggaagagttaatagc2760

ttatacttttgataaagatggaagtattgagtacaaataccctgactttcctatttttaa2820

aagggatgtattaaataaagccattgctgaaattaaaaagaaaacagaaatatcgtttgt2880

tggctttactgttcatgaaaaagaaggaagaaaaattagtaagctgaagttcgaatttgt2940

cgttgatgaagatgaattttctggcgataaagatgatgaagctttttttatgaatttatc3000

tgaagctaatgcagcttttctcaaggtatttgatgaaaccgtacctcccaaaaaagctaa3060

ggggtgatatatggctaaaatttacgatttccctcaaggagccgaacgccgcaggatgca3120

ccgcaaaatccagtggaacaacgctgtaaaattatctaaaaatggctggagtaagccaga3180

ggttaaacgctggtcttttttagcattcatctcaactggctggcggccgcggaaccccta3240

tttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgat3300

aaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgccc3360

ttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtga3420

aagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctca3480

acagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcactt3540

ttaaagttctgctatgtgatacactattatcccgtattgacgccgggcaagagcaactcg3600

gtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagc3660

atcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgata3720

acactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttt3780

tgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaag3840

ccataccaaacgacgagcgtgacaccacgatgcctgtagcaatgccaacaacgttgcgca3900

aactattaactggcgaactacttactctagcttcccggcaacaattaatagactgaatgg3960

aggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattg4020

ctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccag4080

atggtaagcgctcccgtatcgtagttatctacaccacggggagtcaggcaactatggatg4140

aacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcag4200

accaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaagga4260

tctaggtgaagatcctttttgataatcgcatgc4293

<210>2

<211>1191

<212>dna

<213>artificialsequence

<400>2

atgtttgagaacattaccgccgctcctgccgacccgattctgggcctggccgatctgttt60

cgtgccgatgaacgtcccggcaaaattaacctcgggattggtgtctataaagatgagacg120

ggcaaaaccccggtactgaccagcgtgaaaaaggctgaacagtatctgctcgaaaatgaa180

accaccaaaaattacctcggcattgacggcatccctgaatttggtcgctgcactcaggaa240

ctgctgtttggtaaaggtagcgccctgatcaatgacaaacgtgctcgcacggcacagact300

ccggggggcactggcgcactacgcgtggctgccgatttcctggcaaaaaataccagcgtt360

aagcgtgtgtgggtgagcaacccaagctggccgaaccataagagcgtctttaactctgca420

ggtctggaagttcgtgaatacgcttattatgatgcggaaaatcacactcttgacttcgat480

gcactgattaacagcctgaatgaagctcaggctggcgacgtagtgctgttccatggctgc540

tgccataacccaaccggtatcgaccctacgctggaacaatggcaaacactggcacaactc600

tccgttgagaaaggctggttaccgctgtttgacttcgcttaccagggttttgcccgtggt660

ctggaagaagatgctgaaggactgcgcgctttcgcggctatgcataaagagctgattgtt720

gccagttcctactctaaaaactttggcctgtacaacgagcgtgttggcgcttgtactctg780

gttgctgccgacagtgaaaccgttgatcgcgcattcagccaaatgaaagcggcgattcgc840

gctaactactctaacccaccagcacacggcgcttctgttgttgccaccatcctgagcaac900

gatgcgttacgtgcgatttgggaacaagagctgactgatatgcgccagcgtattcagcgt960

atgcgtcagttgttcgtcaatacgctgcaggaaaaaggcgcaaaccgcgacttcagcttt1020

atcatcaaacagaacggcatgttctccttcagtggcctgacaaaagaacaagtgctgcgt1080

ctgcgcgaagagtttggcgtatatgcggttgcttctggtcgcgtaaatgtggccgggatg1140

acaccagataacatggctccgctgtgcgaagcgattgtggcagtgctgtaa1191

<210>3

<211>1358

<212>dna

<213>artificialsequence

<400>3

caggaggaattaacatggatcagacatattctctggagtcattcctcaaccatgtccaaa60

agcgcgacccgaatcaaaccgagttcgcgcaagccgttcgtgaagtaatgaccacactct120

ggccttttcttgaacaaaatccaaaatatcgccagatgtcattactggagcgtctggttg180

aaccggagcgcgtgatccagtttcgcgtggtatgggttgatgatcgcaaccagatacagg240

tcaaccgtgcatggcgtgtgcagttcagctctgccatcggcccgtacaaaggcggtatgc300

gcttccatccgtcagttaacctttccattctcaaattcctcggctttgaacaaaccttca360

aaaatgccctgactactctgccgatgggcggtggtaaaggcggcagcgatttcgatccga420

aaggaaaaagcgaaggtgaagtgatgcgtttttgccaggcgctgatgactgaactgtatc480

gccacctgggcgcggataccgacgttccggcaggtgatatcggggttggtggtcgtgaag540

tcggctttatggcggggatgatgaaaaagctctccaacaataccgcctgcgtcttcaccg600

gtaagggcctttcatttggcggcagtcttattcgcccggaagctaccggctacggtctgg660

tttatttcacagaagcaatgctaaaacgccacggtatgggttttgaagggatgcgcgttt720

ccgtttctggctccggcaacgtcgcccagtacgctatcgaaaaagcgatggaatttggtg780

ctcgtgtgatcactgcgtcagactccagcggcactgtagttgatgaaagcggattcacga840

aagagaaactggcacgtcttatcgaaatcaaagccagccgcgatggtcgagtggcagatt900

acgccaaagaatttggtctggtctatctcgaaggccaacagccgtggtctctaccggttg960

atatcgccctgccttgcgccacccagaatgaactggatgttgacgccgcgcatcagctta1020

tcgctaatggcgttaaagccgtcgccgaaggggcaaatatgccgaccaccatcgaagcga1080

ctgaactgttccagcaggcaggcgtactatttgcaccgggtaaagcggctaatgctggtg1140

gcgtcgctacatcgggcctggaaatggcacaaaacgctgcgcgcctgggctggaaagccg1200

agaaagttgacgcacgtttgcatcacatcatgctggatatccaccatgcctgtgttgagc1260

atggtggtgaaggtgagcaaaccaactacgtgcagggcgcgaacattgccggttttgtga1320

aggttgccgatgcgatgctggcgcagggtgtgatttaa1358

<210>4

<211>1292

<212>dna

<213>artificialsequence

<400>4

gaattcaaggagatataatgtcagcaaagcaagtctcgaaagatgaagaaaaagaagctc60

ttaacttatttctgtctacccaaacaatcattaaggaagcccttcggaagctgggttatc120

cgggagatatgtatgaactcatgaaagagccgcagagaatgctcactgtccgcattccgg180

tcaaaatggacaatgggagcgtcaaagtgttcacaggctaccggtcacagcacaatgatg240

ctgtcggtccgacaaaggggggcgttcgcttccatccagaagttaatgaagaggaagtaa300

aggcattatccatttggatgacgctcaaatgcgggattgccaatcttccttacggcggcg360

ggaagggcggtattatttgtgatccgcggacaatgtcatttggagaactggaaaggctga420

gcagggggtatgtccgtgccatcagccagatcgtcggtccgacaaaggatattccagctc480

ccgatgtgtacaccaattcgcagattatggcgtggatgatggatgagtacagccggctgc540

gggaattcgattctccgggctttattacaggtaaaccgcttgttttgggaggatcgcaag600

gacgggaaacagcgacggcacagggcgtcacgatttgtattgaagaggcggtgaagaaaa660

aagggatcaagctgcaaaacgcgcgcatcatcatacagggctttggaaacgcgggtagct720

tcctggccaaattcatgcacgatgcgggcgcgaaggtgatcgggatttctgatgccaatg780

gcgggctctacaacccagacggccttgatatcccttatttgctcgataaacgggacagct840

ttggtatggtcaccaatttatttactgacgtcatcacaaatgaggagctgcttgaaaagg900

attgcgatattttagtgcctgccgcgatctccaatcaaatcacagccaaaaacgcacata960

acattcaggcgtcaatcgtcgttgaagcggcgaacggcccgacaaccattgatgccacta1020

agatcctgaatgaaagaggcgtgctgcttgtgccggatatcctagcgagtgccggcggcg1080

tcacggtttcttattttgaatgggtgcaaaacaaccaaggatattattggtcggaagaag1140

aggttgcagaaaaactgagaagcgtcatggtcagctcgttcgaaacaatttatcaaacag1200

cggcaacacataaagtggatatgcgtttggcggcttacatgacgggcatcagaaaatcgg1260

cagaagcatcgcgtttccgcggatgggtctaa1292

<210>5

<211>408

<212>dna

<213>artificialsequence

<400>5

atgggtcaccaccaccaccaccacatgtatcgcactatgatgtccgggaagctgcaccgt60

gccaccgtgaccgaagctaacctgaactacgtaggtagcatcaccattgacgaagacctg120

atcgatgcggttggcatgctgccgaacgaaaaagtgcaaatcgtaaacaacaacaatggt180

gctcgtctggagacctacatcattccgggtaaacgtggctctggcgttatctgcttaaac240

ggtgcagctgcacgtcttgtacaggaaggtgacaaagttatcatcatctcctacaaaatg300

atgtctgatcaagaggcagcttctcacgagccaaaagtagctgtgctgaacgaccagaac360

aaaatcgaacagatgcttggtaacgaaccggctcgcaccatcctgtaa408

<210>6

<211>3444

<212>dna

<213>artificialsequence

<400>6

aatgtgcctgtcaaatggacgaagcagggattctgcaaaccctatgctactccgtcaagc60

cgtcaattgtctgattcgttaccaattatgacaacttgacggctacatcattcacttttt120

cttcacaaccggcacggaactcgctcgggctggccccggtgcattttttaaatacccgcg180

agaaatagagttgatcgtcaaaaccaacattgcgaccgacggtggcgataggcatccggg240

tggtgctcaaaagcagcttcgcctggctgatacgttggtcctcgcgccagcttaagacgc300

taatccctaactgctggcggaaaagatgtgacagacgcgacggcgacaagcaaacatgct360

gtgcgacgctggcgatatcaaaattgctgtctgccaggtgatcgctgatgtactgacaag420

cctcgcgtacccgattatccatcggtggatggagcgactcgttaatcgcttccatgcgcc480

gcagtaacaattgctcaagcagatttatcgccagcagctccgaatagcgcccttcccctt540

gcccggcgttaatgatttgcccaaacaggtcgctgaaatgcggctggtgcgcttcatccg600

ggcgaaagaaccccgtattggcaaatattgacggccagttaagccattcatgccagtagg660

cgcgcggacgaaagtaaacccactggtgataccattcgcgagcctccggatgacgaccgt720

agtgatgaatctctcctggcgggaacagcaaaatatcacccggtcggcaaacaaattctc780

gtccctgatttttcaccaccccctgaccgcgaatggtgagattgagaatataacctttca840

ttcccagcggtcggtcgataaaaaaatcgagataaccgttggcctcaatcggcgttaaac900

ccgccaccagatgggcattaaacgagtatcccggcagcaggggatcattttgcgcttcag960

ccatacttttcatactcccgccattcagagaagaaaccaattgtccatattgcatcagac1020

attgccgtcactgcgtcttttactggctcttctcgctaaccaaaccggtaaccccgctta1080

ttaaaagcattctgtaacaaagcgggaccaaagccatgacaaaaacgcgtaacaaaagtg1140

tctataatcacggcagaaaagtccacattgattatttgcacggcgtcacactttgctatg1200

ccatagcatttttatccataagattagcggatcctacctgacgctttttatcgcaactct1260

ctactgtttctccatacccgttttttgggctaacaggaggaattaaccatgggtacctct1320

catcatcatcatcatcacagcagcggcctggtgccgcgcggcagcctcgagactagtggt1380

gaattcggtgagctcggtctgcagctggtgccgcgcggcagccaccaccaccaccaccac1440

taatacagattaaatcagaacgcagaagcggtctgataaaacagaatttgcctggcggca1500

gtagcgcggtggtcccacctgaccccatgccgaactcagaagtgaaacgccgtagcgccg1560

atggtagtgtggggtctccccatgcgagagtagggaactgccaggcatcaaataaaacga1620

aaggctcagtcgaaagactgggcctttcgtcgacgtgcgtcagcagaatatgtgatacag1680

gatatattccgcttcctcgctcactgactcgctacgctcggtcgttcgactgcggcgagc1740

ggaaatggcttacgaacggggcggagatttcctggaagatgccaggaagatacttaacag1800

ggaagtgagagggccgcggcaaagccgtttttccataggctccgcccccctgacaagcat1860

cacgaaatctgacgctcaaatcagtggtggcgaaacccgacaggactataaagataccag1920

gcgtttccccctggcggctccctcgtgcgctctcctgttcctgcctttcggtttaccggt1980

gtcattccgctgttatggccgcgtttgtctcattccacgcctgacactcagttccgggta2040

ggcagttcgctccaagctggactgtatgcacgaaccccccgttcagtccgaccgctgcgc2100

cttatccggtaactatcgtcttgagtccaacccggaaagacatgcaaaagcaccactggc2160

agcagccactggtaattgatttagaggagttagtcttgaagtcatgcgccggttaaggct2220

aaactgaaaggacaagttttggtgactgcgctcctccaagccagttacctcggttcaaag2280

agttggtagctcagagaaccttcgaaaaactgccctgcaaggcggttttttcgttttcag2340

agcaagagattacgcgcagaccaaaacgatctcaagaagatcatcttattaatcagataa2400

aatatttctagatttcagtgcaatttatctcttcaaatgtagcacgcggccgcggaaccc2460

ctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccct2520

gataaatgcttcaataatattgaaaaaggaagagtatgagggaagcggtgatcgccgaag2580

tatcgactcaactatcagaggtagttggcgtcatcgagcgccatctcgaaccgacgttgc2640

tggccgtacatttgtacggctccgcagtggatggcggcctgaagccacacagtgatattg2700

atttgctggttacggtgaccgtaaggcttgatgaaacaacgcggcgagctttgatcaacg2760

accttttggaaacttcggcttcccctggagagagcgagattctccgcgctgtagaagtca2820

ccattgttgtgcacgacgacatcattccgtggcgttatccagctaagcgcgaactgcaat2880

ttggagaatggcagcgcaatgacattcttgcaggtatcttcgagccagccacgatcgaca2940

ttgatctggctatcttgctgacaaaagcaagagaacatagcgttgccttggtaggtccag3000

cggcggaggaactctttgatccggttcctgaacaggatctatttgaggcgctaaatgaaa3060

ccttaacgctatggaactcgccgcccgactgggctggcgatgagcgaaatgtagtgctta3120

cgttgtcccgcatttggtacagcgcagtaaccggcaaaatcgcgccgaaggatgtcgctg3180

ccgactgggcaatggagcgcctgccggcccagtatcagcccgtcatacttgaagctagac3240

aggcttatcttggacaagaagaagatcgcttggcctcgcgcgcagatcagttggaagaat3300

ttgtccactacgtgaaaggcgagatcaccaaggtagtcggcaaactgtcagaccaagttt3360

actcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtga3420

agatcctttttgataatcgcatgc3444

<210>7

<211>1683

<212>dna

<213>artificialsequence

<400>7

atgggtacctctcatcatcatcatcatcacagcagcggcctggtgccgcgcggcagcctc60

gagccagcaaccggtgaggatcaggatctggtgcaggacctaattgaagagccagcgaca120

ttcagtgatgcagtactgtctagcgacgaagaattgttccaccagaaatgtccgaaaccg180

gctccgatttactctccggtatccaaaccagtgtcttttgaaagcctgccgaaccgtcgc240

ctgcatgaagaatttctgcgcagctctgtggacgttttgttgcaggaagccgtgttcgaa300

ggtaccaaccgtaaaaaccgtgtgttacagtggcgtgaaccggaagaactgcgccgtcta360

atggatttcggtgttcgttctgctccgtcaactcacgaagagctgctggaggtgctgaag420

aaagttgtcacctactccgtgaaaacgggtcacccttatttcgtaaaccagctgttcagt480

gcggtggacccgtatggcctggttgcccaatgggcaaccgatgccctgaacccatccgtt540

tatacctatgaagtgtctccggtgttcgtactgatggaagaggtggttctgcgcgaaatg600

cgtgcgatcgttggttttgagggcggaaaaggtgatggtatcttctgcccaggcggttct660

attgccaacggttacgcaatcagctgcgctcgttaccgtttcatgccggacatcaagaaa720

aagggcctgcattctctgccgcgtctggtcctgtttacctccgaggacgctcattacagc780

attaagaaactggcgtccttccagggtatcggcacggataacgtgtatctcatccgtacc840

gatgcgcgtggtcgtatggacgtgtcccatctcgttgaggaaatcgaacgttctctgcgt900

gaaggcgcagctccattcatggtctcggctactgccggtactactgttatcggtgctttc960

gacccgatcgaaaaaatcgcggatgtatgtcagaaatacaaactctggttgcacgtagac1020

gcagcgtggggtggcggtgcactggtgagcgcaaagcatcgtcacctgctgaaaggtatc1080

gaacgtgccgactccgttacatggaacccgcacaaactgcttaccgcaccgcagcagtgc1140

agcactctgctgttgcgtcacgaaggcgtgctggcagaagcacactctactaacgcagca1200

tatctgttccagaaggacaagttctacgataccaagtatgacactggcgataaacacatc1260

cagtgtggtcgccgtgcagacgttctgaaattctggttcatgtggaaagcaaaaggtact1320

tctggactggaaaaacacgttgacaaagttttcgaaaatgcacgtttcttcaccgattgc1380

atcaaaaaccgtgaaggctttgaaatggtgatcgcggagccggaatataccaacatttgc1440

ttctggtacgtgccgaaatctctgcgtggccgtaaagatgaagcagactacaaagataaa1500

ctccacaaagtagcaccgcgtattaaagaacgtatgatgaaagaaggttctatgatggtt1560

acctaccaggcacagaaaggccatccgaacttcttccgcatcgtttttcagaactccggc1620

ctggataaagcggatatggttcacctggtagaagaaattgaacgtctgggcagcgacctt1680

taa1683

<210>8

<211>3650

<212>dna

<213>artificialsequence

<400>8

aatgtgcctgtcaaatggacgaagcagggattctgcaaaccctatgctactccgtcaagc60

cgtcaattgtctgattcgttaccaattatgacaacttgacggctacatcattcacttttt120

cttcacaaccggcacggaactcgctcgggctggccccggtgcattttttaaatacccgcg180

agaaatagagttgatcgtcaaaaccaacattgcgaccgacggtggcgataggcatccggg240

tggtgctcaaaagcagcttcgcctggctgatacgttggtcctcgcgccagcttaagacgc300

taatccctaactgctggcggaaaagatgtgacagacgcgacggcgacaagcaaacatgct360

gtgcgacgctggcgatatcaaaattgctgtctgccaggtgatcgctgatgtactgacaag420

cctcgcgtacccgattatccatcggtggatggagcgactcgttaatcgcttccatgcgcc480

gcagtaacaattgctcaagcagatttatcgccagcagctccgaatagcgcccttcccctt540

gcccggcgttaatgatttgcccaaacaggtcgctgaaatgcggctggtgcgcttcatccg600

ggcgaaagaaccccgtattggcaaatattgacggccagttaagccattcatgccagtagg660

cgcgcggacgaaagtaaacccactggtgataccattcgcgagcctccggatgacgaccgt720

agtgatgaatctctcctggcgggaacagcaaaatatcacccggtcggcaaacaaattctc780

gtccctgatttttcaccaccccctgaccgcgaatggtgagattgagaatataacctttca840

ttcccagcggtcggtcgataaaaaaatcgagataaccgttggcctcaatcggcgttaaac900

ccgccaccagatgggcattaaacgagtatcccggcagcaggggatcattttgcgcttcag960

ccatacttttcatactcccgccattcagagaagaaaccaattgtccatattgcatcagac1020

attgccgtcactgcgtcttttactggctcttctcgctaaccaaaccggtaaccccgctta1080

ttaaaagcattctgtaacaaagcgggaccaaagccatgacaaaaacgcgtaacaaaagtg1140

tctataatcacggcagaaaagtccacattgattatttgcacggcgtcacactttgctatg1200

ccatagcatttttatccataagattagcggatcctacctgacgctttttatcgcaactct1260

ctactgtttctccatacccgttttttgggctaacaggaggaattaaccatgggtacctct1320

catcatcatcatcatcacagcagcggcctggtgccgcgcggcagcctcgagggtagatct1380

ggtactagtggtgaattcggtgagctcggtctgcagctggtgccgcgcggcagccaccac1440

caccaccaccactaatacagattaaatcagaacgcagaagcggtctgataaaacagaatt1500

tgcctggcggcagtagcgcggtggtcccacctgaccccatgccgaactcagaagtgaaac1560

gccgtagcgccgatggtagtgtggggtctccccatgcgagagtagggaactgccaggcat1620

caaataaaacgaaaggctcagtcgaaagactgggcctttcgtcgacgcgctagcggagtg1680

tatactggcttactatgttggcactgatgagggtgtcagtgaagtgcttcatgtggcagg1740

agaaaaaaggctgcaccggtgcgtcagcagaatatgtgatacaggatatattccgcttcc1800

tcgctcactgactcgctacgctcggtcgttcgactgcggcgagcggaaatggcttacgaa1860

cggggcggagatttcctggaagatgccaggaagatacttaacagggaagtgagagggccg1920

cggcaaagccgtttttccataggctccgcccccctgacaagcatcacgaaatctgacgct1980

caaatcagtggtggcgaaacccgacaggactataaagataccaggcgtttccccctggcg2040

gctccctcgtgcgctctcctgttcctgcctttcggtttaccggtgtcattccgctgttat2100

ggccgcgtttgtctcattccacgcctgacactcagttccgggtaggcagttcgctccaag2160

ctggactgtatgcacgaaccccccgttcagtccgaccgctgcgccttatccggtaactat2220

cgtcttgagtccaacccggaaagacatgcaaaagcaccactggcagcagccactggtaat2280

tgatttagaggagttagtcttgaagtcatgcgccggttaaggctaaactgaaaggacaag2340

ttttggtgactgcgctcctccaagccagttacctcggttcaaagagttggtagctcagag2400

aaccttcgaaaaaccgccctgcaaggcggttttttcgttttcagagcaagagattacgcg2460

cagaccaaaacgatctcaagaagatcatcttattaatcagataaaatatttctagatttc2520

agtgcaatttatctcttcaaatgtagcacctgaagtcagccccatacgatataagttgtg2580

cggccgccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagaca2640

ataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagccatattcaacg2700

ggaaacgtcttgctctaggccgcgattaaattccaacatggatgctgatttatatgggta2760

taaatgggctcgcgataatgtcgggcaatcaggtgcgacaatctatcgattgtatgggaa2820

gcccgatgcgccagagttgtttctgaaacatggcaaaggtagcgttgccaatgatgttac2880

agatgagatggtcagactaaactggctgacggaatttatgcctcttccgaccatcaagca2940

ttttatccgtactcctgatgatgcatggttactcaccactgcgatccccgggaaaacagc3000

attccaggtattagaagaatatcctgattcaggtgaaaatattgttgatgcgctggcagt3060

gttcctgcgccggttgcattcgattcctgtttgtaattgtccttttaacagcgaccgcgt3120

atttcgtctcgctcaggcgcaatcacgaatgaataacggtttggttgatgcgagtgattt3180

tgatgacgagcgtaatggctggcctgttgaacaagtctggaaagaaatgcataaactttt3240

gccattctcaccggattcagtcgtcactcatggtgatttctcacttgataaccttatttt3300

tgacgaggggaaattaataggttgtattgatgttggacgagtcggaatcgcagaccgata3360

ccaggatcttgccatcctatggaactgcctcggtgagttttctccttcattacagaaacg3420

gctttttcaaaaatatggtattgataatcctgatatgaataaattgcagtttcatttgat3480

gctcgatgagtttttctaagaattaattcatgagcggatacatatttgaatgtatttaga3540

aaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacttgcggagaccc3600

ggtcgtcagcttgtcgtcggttcagggcagggtcgttaaatagcgcatgc3650

<210>9

<211>4803

<212>dna

<213>artificialsequence

<400>9

cacaaaagcataaaaaaaccacacagtaaaaccgaaatatgaaacaataacagataatta60

aaccaaaaacagatagcgcattgtgataatcattcaatactaaacaaaatataaacagtg120

gagcaatatgtaattgactcattaagttagatataaaaaatacatattcaatcattaaaa180

cgattgaatggagaacttttgtgtcgattgtggtgcagcagggatagacgacgggatcca240

gatactcaccaacgacctattgaactgtcgatcgagtcaggatccatattacgatcgtcc300

ctctggtgttgccaaagggagatgtttattaaaacaaattgaaatcctccttaattatga360

ctgattttttacgcgatgacatcaggttcctcggtcaaatcctcggtgaggtaattgcgg420

aacaagaaggccaggaggtttatgaactggtcgaacaagcgcgcctgacttcttttgata480

tcgccaagggcaacgccgaaatggatagcctggttcaggttttcgacggcattactccag540

ccaaggcaacaccgattgctcgcgcattttcccacttcgctctgctggctaacctggcgg600

aagacctctacgatgaagagcttcgtgaacaggctctcgatgcaggcgacacccctccgg660

acagcactcttgatgccacctggctgaaactcaatgagggcaatgttggcgcagaagctg720

tggccgatgtgctgcgcaatgctgaggtggcgccggttctgactgcgcacccaactgaga780

ctcgccgccgcactgtttttgatgcgcaaaagtggatcaccacccacatgcgtgaacgcc840

acgctttgcagtctgcggagcctaccgctcgtacgcaaagcaagttggatgagatcgaga900

agaacatccgccgtcgcatcaccattttgtggcagaccgcgttgattcgtgtggcccgcc960

cacgtatcgaggacgagatcgaagtagggctgcgctactacaagctgagccttttggaag1020

agattccacgtatcaaccgtgatgtggctgttgagcttcgtgagcgtttcggcgagggtg1080

ttcctttgaagcccgtggtcaagccaggttcctggattggtggagaccacgacggtaacc1140

cttatgtcaccgcggaaacagttgagtattccactcaccgcgctgcggaaaccgtgctca1200

agtactatgcacgccagctgcattccctcgagcatgagctcagcctgtcggaccgcatga1260

ataaggtcaccccgcagctgcttgcgctggcagatgcagggcacaacgacgtgccaagcc1320

gcgtggatgagccttatcgacgcgccgtccatggcgttcgcggacgtatcctcgcgacga1380

cggccgagctgatcggcgaggacgccgttgagggcgtgtggttcaaggtctttactccat1440

acgcatctccggaagaattcttaaacgatgcgttgaccattgatcattctctgcgtgaat1500

ccaaggacgttctcattgccgatgatcgtttgtctgtgctgatttctgccatcgagagct1560

ttggattcaacctttacgcactggatctgcgccaaaactccgaaagctacgaggacgtcc1620

tcaccgagcttttcgaacgcgcccaagtcaccgcaaactaccgcgagctgtctgaagcag1680

agaagcttgaggtgctgctgaaggaactgcgcagccctcgtccgctgatcccgcacggtt1740

cagatgaatacagcgaggtcaccgaccgcgagctcggcatcttccgcaccgcgtcggagg1800

ctgttaagaaattcgggccacggatggtgcctcactgcatcatctccatggcatcatcgg1860

tcaccgatgtgctcgagccgatggtgttgctcaaggaattcggactcatcgcagccaacg1920

gcgacaacccacgcggcaccgtcgatgtcatcccactgttcgaaaccatcgaagatctcc1980

aggccggcgccggaatcctcgacgaactgtggaaaattgatctctaccgcaactacctcc2040

tgcagcgcgacaacgtccaggaagtcatgctcggttactccgattccaacaaggatggcg2100

gatatttctccgcaaactgggcgctttacgacgcggaactgcagctcgtcgaactatgcc2160

gatcagccggggtcaagcttcgcctgttccacggccgtggtggcaccgtcggccgcggtg2220

gcggaccttcctacgacgcgattcttgcccagcccaggggggctgtccaaggttccgtgc2280

gcatcaccgagcagggcgagatcatctccgctaagtacggcaaccccgaaaccgcgcgcc2340

gaaacctcgaagccctggtctcagccacgcttgaggcatcgcttctcgacgtctccgaac2400

tcaccgatcaccaacgcgcgtacgacatcatgagtgagatctctgagctcagcttgaaga2460

agtacgcctccttggtgcacgaggatcaaggcttcatcgattacttcacccagtccacgc2520

cgctgcaggagattggatccctcaacatcggatccaggccttcctcacgcaagcagacct2580

cctcggtggaagatttgcgagccatcccatgggtgctcagctggtcacagtctcgtgtca2640

tgctgccaggctggtttggtgtcggaaccgcattagagcagtggattggcgaaggggagc2700

aggccacccaacgcattgccgagctgcaaacactcaatgagtcctggccatttttcacct2760

cagtgttggataacatggctcaggtgatgtccaaggcagagctgcgtttggcaaagctct2820

acgcagacctgatcccagatacggaagtagccgagcgagtctattccgtcatccgcgagg2880

agtacttcctgaccaagaagatgttctgcgtaatcaccggctctgatgatctgcttgatg2940

acaacccacttctcgcacgctctgtccagcgccgatacccctacctgcttccactcaacg3000

tgatccaggtagagatgatgcgacgctaccgaaaaggcgaccaaagcgagcaagtgtccc3060

gcaacattcagctgaccatgaacggtctttccactgcgctgcgcaactccggctaggagc3120

tcggtctgcagctggtgccgcgcggcagccaccaccaccaccaccactaatacagattaa3180

atcagaacgcagaagcggtctgataaaacagaatttgcctggcggcagtagcgcggtggt3240

cccacctgaccccatgccgaactcagaagtgaaacgccgtagcgccgatggtagtgtggg3300

gtctccccatgcgagagtagggaactgccaggcatcaaataaaacgaaaggctcagtcga3360

aagactgggccttattccggggatccgtcgacctgcagttcgaagttcctattctctaga3420

aagtataggaacttcagagcgcttttgaagctcacgctgccgcaagcactcagggcgcaa3480

gggctgctaaaggaagcggaacacgtagaaagccagtccgcagaaacggtgctgaccccg3540

gatgaatgtcagctactgggctatctggacaagggaaaacgcaagcgcaaagagaaagca3600

ggtagcttgcagtgggcttacatggcgatagctagactgggcggttttatggacagcaag3660

cgaaccggaattgccagctggggcgccctctggtaaggttgggaagccctgcaaagtaaa3720

ctggatggctttcttgccgccaaggatctgatggcgcaggggatcaagatctgatcaaga3780

gacaggatgaggatcgtttcgcatgattgaacaagatggattgcacgcaggttctccggc3840

cgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctga3900

tgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacct3960

gtccggtgccctgaatgaactgcaggacgaggcagcgcggctatcgtggctggccacgac4020

gggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgct4080

attgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagt4140

atccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccatt4200

cgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgt4260

cgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccag4320

gctcaaggcgcgcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgctt4380

gccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctggg4440

tgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttgg4500

cggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcg4560

catcgccttctatcgccttcttgacgagttcttctaataaggggatcttgaagttcctat4620

tccgaagttcctattctctagaaagtataggaacttcgaacgccaactaaaatttccccg4680

aggtgaaaatcgccccggggaataactagccatttcaatgtaacaattaacccttaaaat4740

aaacccagaaggttattaactaaatcacatagaaaaccatcaattatagtatgtataaaa4800

tag4803

<210>10

<211>1671

<212>dna

<213>artificialsequence

<400>10

taattaaattaatcatcttcagtgataatttagccctcttgcgcactaaaaaaatcgatc60

tcgtcaaatttcagacttatccatcagactatactgttgtacctataaaggagcagtgga120

atagcgttcgcagaccgtaactttcaggtacttaccctgaagtacgtggctgtgggataa180

aaacaatctggaggaatgtcattccggggatccgtcgacctgcagttcgaagttcctatt240

ctctagaaagtataggaacttcagagcgcttttgaagctcacgctgccgcaagcactcag300

ggcgcaagggctgctaaaggaagcggaacacgtagaaagccagtccgcagaaacggtgct360

gaccccggatgaatgtcagctactgggctatctggacaagggaaaacgcaagcgcaaaga420

gaaagcaggtagcttgcagtgggcttacatggcgatagctagactgggcggttttatgga480

cagcaagcgaaccggaattgccagctggggcgccctctggtaaggttgggaagccctgca540

aagtaaactggatggctttcttgccgccaaggatctgatggcgcaggggatcaagatctg600

atcaagagacaggatgaggatcgtttcgcatgattgaacaagatggattgcacgcaggtt660

ctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggct720

gctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaaga780

ccgacctgtccggtgccctgaatgaactgcaggacgaggcagcgcggctatcgtggctgg840

ccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggact900

ggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccg960

agaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacct1020

gcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccg1080

gtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgt1140

tcgccaggctcaaggcgcgcatgcccgacggcgaggatctcgtcgtgacccatggcgatg1200

cctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggcc1260

ggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaag1320

agcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgatt1380

cgcagcgcatcgccttctatcgccttcttgacgagttcttctaataaggggatcttgaag1440

ttcctattccgaagttcctattctctagaaagtataggaacttcgcatcgccaatgtaaa1500

tccggcccgcctatggcgggccgttttgtatggaaaccagaccctatgttcaaaacgacg1560

ctctgcgccttattaattaccgcctcttgctccacatttgctgcccctcaacaaatcaac1620

gatattgtgcatcgcacaattaccccgcttatagagcaacaaaagatcccg1671

<210>11

<211>4387

<212>dna

<213>artificialsequence

<400>11

taattaaattaatcatcttcagtgataatttagccctcttgcgcactaaaaaaatcgatc60

tcgtcaaatttcagacttatccatcagactatactgttgtacctataaaggagcagtgga120

atagcgttcgcagaccgtaactttcaggtacttaccctgaagtacgtggctgtgggataa180

aaacaatctggaggaatgtcttatcaaaaagagtattgacataaagtctaacctatagat240

aattacagccatcgagagggacacggcgatttgctgtcaccggatgtgctttccggtctg300

atgagtccgtgaggacgaaacagcctctacaaataattttgtttaagaattcaaaagatc360

ttttaagaaggagatataccatggccctgagtcctacaatttttagcggtagcctgccgg420

gcctgacagacttcgttccgagcctgagtctggccaccaccccggaagcagattatggca480

gcttcgtgctgaccggtgttctgatgaccctggtggttatctacgccatgagtaagctgg540

gtggtgaactgagtaagcgcgtgggtctgccgccggttttaggtgaactggttggcggtg600

ttctggtgggtgtgagtgccctgcatctgatcgtgtttccggaaaccggtgccaccgcag660

ccgacagtagtctgatgctgttcctgcagcaactgggcggtctggatggtaccgcactgg720

agcacatcttcgcaagccagagcgaagtgattagcgtgctggccgagttaggcgtgatcg780

ttctgctgttcgagatcggcctggaaagcgatctgcgtgaactgagcaaagtgggtagcc840

aggccgccgttgttgccatcgttggcgttgttgcaccgttcctgttaggcaccgttggcc900

tggttacactgttccataccccgatcattccggcaatttttgccggcgccgcactgacag960

ccaccagcattggtatcaccagcaaggtgctgagcgatctgggccagttaaaaagcaccg1020

aaggcaagattatcgtgggtgccgccgttatcgacgatgtgctgggcatcatcgttctgg1080

ccgtggtggcaagtctggccaaaaccggtgaagtggacctgctgaatgtggtgtacctga1140

tcattggtgccagcgcctttctgctgggcagcattctgctgggtaaattctttaatcagg1200

gtttcgaagccattgccgccaagctgaaaacccgtggtgcactgctgatcccggcatttg1260

cattcgcactggtgatggccattattgccaacctgatccacctggaagcaatcctgggcg1320

ccttcgccgcaggcttagtgctggacgagaccgatctgcgtaaagaactggatcgccagg1380

tgatgccgatcgcagacttcctggtgcctatcttctttgtgacagtgggcgcaaaagccg1440

acctgggtgttctgaaccctttcgagagtgccaatcgcgccggcctggttattgccgcct1500

tcttaatcgtggtggccatcgtgggcaaagttattaccggctgggccgtgtttggtcagc1560

cgggtgtgaatcgcctggcaattggcttcggcatgatccctcgcggtgaagtgggtctgg1620

ttttcgcaggcattggtagcgcaagtggtgtgctggataaaccgctggaagcagccatta1680

tcgtgatggtgattctgaccacctttttagccccgccgctgctgcaggcagttctgaaca1740

aaccgcaggatcctgacgtgccggcagatcgcgaggccctggaaaagagtttaagtgttt1800

aaaaggagatataatggccaagaagctgattcgcggtctggacaagttcaagcagagcta1860

tgtggccagccatcaggatctgtttgaacagctgagccacggccagaaaccgcgtgtgct1920

gtttatctgctgcagcgatagccgcgttgatccggccctgattacccagaccgatatcgg1980

cgagatctttgtgatccgcaacgcaggtaatatcattccgccgtatggtgccgccaatgg2040

tggcgaaggtggtaccctggaatatgcactgcagggcctggacatccgtcagatcatcgt2100

gtgcggtcatagccattgtggcgccatgaaaggcctgctgaagctgaacaaactgcaggc2160

cgatatgccgctggtgtatgattggctgaagcatgccgaagccacccgtcgtctggtgcg2220

cgatacctatccgcattgcgaaggtgaggaactggttgaaaccctggtggccgaaaacgt2280

tctggtgcagatcgacaacctgaagacctatccggtggttcgtagccgcctgcaccaggg2340

caaactgaaaatctacggctggatttataacattgagaacggcgaggtgctggcatatga2400

tgagaccaaacacgcctacgtgaaaccggattacagcctgatcgatgaaaccccgctgac2460

cgaacgcgaagccctggaaggttgcccgctgccgtatacagtggccagcggtcagagtct2520

ggcaggctggtatggcgaaaccgatacctttagtgtgagcggctaactcgagggtagatc2580

tggtactagtggtgaattcggtgagctcggtctgcagctggtgccgcgcggcagccacca2640

ccaccaccaccactaaggatcctaagcggccgcaagtcctgcaggaagtggcgcgccaag2700

tcgccggcgataatacagattaaatcagaacgcagaagcggtctgataaaacagaatttg2760

cctggcggcagtagcgcggtggtcccacctgaccccatgccgaactcagaagtgaaacgc2820

cgtagcgccgatggtagtgtggggtctccccatgcgagagtagggaactgccaggcatca2880

aataaaacgaaaggctcagtcgaaagactgggccttattccggggatccgtcgacctgca2940

gttcgaagttcctattctctagaaagtataggaacttcagagcgcttttgaagctcacgc3000

tgccgcaagcactcagggcgcaagggctgctaaaggaagcggaacacgtagaaagccagt3060

ccgcagaaacggtgctgaccccggatgaatgtcagctactgggctatctggacaagggaa3120

aacgcaagcgcaaagagaaagcaggtagcttgcagtgggcttacatggcgatagctagac3180

tgggcggttttatggacagcaagcgaaccggaattgccagctggggcgccctctggtaag3240

gttgggaagccctgcaaagtaaactggatggctttcttgccgccaaggatctgatggcgc3300

aggggatcaagatctgatcaagagacaggatgaggatcgtttcgcatgattgaacaagat3360

ggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggca3420

caacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccg3480

gttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaggacgaggcagcg3540

cggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcact3600

gaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatct3660

caccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacg3720

cttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgt3780

actcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctc3840

gcgccagccgaactgttcgccaggctcaaggcgcgcatgcccgacggcgaggatctcgtc3900

gtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctgga3960

ttcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacc4020

cgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggt4080

atcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctaa4140

taaggggatcttgaagttcctattccgaagttcctattctctagaaagtataggaacttc4200

gcatcgccaatgtaaatccggcccgcctatggcgggccgttttgtatggaaaccagaccc4260

tatgttcaaaacgacgctctgcgccttattaattaccgcctcttgctccacatttgctgc4320

ccctcaacaaatcaacgatattgtgcatcgcacaattaccccgcttatagagcaacaaaa4380

gatcccg4387

<210>12

<211>4708

<212>dna

<213>artificialsequence

<400>12

gtacgttgccggatgcggcgaaaacgccacatccggcctacagttcaatgatagttcaac60

agatttcgaatattctgaagcaaacttgaacttatcatcaggcgaaggcctctcctcgcg120

agaggcttttttatttgatgggataaagatctttgcattccggggatccgtcgacctgca180

gttcgaagttcctattctctagaaagtataggaacttcagagcgcttttgaagctcacgc240

tgccgcaagcactcagggcgcaagggctgctaaaggaagcggaacacgtagaaagccagt300

ccgcagaaacggtgctgaccccggatgaatgtcagctactgggctatctggacaagggaa360

aacgcaagcgcaaagagaaagcaggtagcttgcagtgggcttacatggcgatagctagac420

tgggcggttttatggacagcaagcgaaccggaattgccagctggggcgccctctggtaag480

gttgggaagccctgcaaagtaaactggatggctttcttgccgccaaggatctgatggcgc540

aggggatcaagatctgatcaagagacaggatgaggatcgtttcgcatgattgaacaagat600

ggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggca660

caacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccg720

gttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaggacgaggcagcg780

cggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcact840

gaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatct900

caccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacg960

cttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgt1020

actcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctc1080

gcgccagccgaactgttcgccaggctcaaggcgcgcatgcccgacggcgaggatctcgtc1140

gtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctgga1200

ttcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacc1260

cgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggt1320

atcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctaa1380

taaggggatcttgaagttcctattccgaagttcctattctctagaaagtataggaacttc1440

gcatcgccaatgtaaatccggcccgcctatggcgggccgttttgtatggaaaccagaccc1500

tatgttcaaaacgacgctctgcgccttattaattaccgcctcttgctccacattcacagc1560

taacaccacgtcgtccctatctgctgccctaggtctatgagtggttgctggataacttga1620

cagctagctcagtcctaggtataatgctagcagggagaccacaacggtttccctctacaa1680

ataattttgtttaactttcgcgcgcgtaacaggaggaattaaccatgggtacctctcatc1740

atcatcatcatcacagcagcggcctggtgccgcgcggcagcctcgagatgacagacctga1800

accagctgacccaggaactgggtgccctgggcatccatgatgtgcaggaagtggtgtaca1860

atccgagctacgagctgctgtttgccgaagaaaccaagccgggcctggaaggctatgaga1920

aaggcacagtgaccaatcagggtgcagtggcagtgaacacaggtatttttaccggccgca1980

gcccgaaggataagtatattgtgctggatgataaaacaaaggacaccgtttggtggacca2040

gcgagaaggtgaagaacgacaataagccgatgagccaggacacctggaatagcctgaagg2100

gcctggtggccgatcagctgagcggtaaacgcctgttcgtggtggatgccttttgcggtg2160

ccaacaaggatacacgtctggccgttcgtgtggttaccgaagttgcctggcaggcccatt2220

ttgtgaccaacatgtttatccgtccgagtgccgaggagctgaagggcttcaaacctgatt2280

tcgtggtgatgaacggcgccaagtgcaccaatccgaactggaaagagcagggcttaaata2340

gcgaaaatttcgttgcctttaacattaccgaaggcgtgcagctgatcggcggtacctggt2400

atggcggcgagatgaaaaaaggtatgtttagcatgatgaattatttcctgccgctgcgcg2460

gcattgcaagtatgcattgtagtgccaacgtgggcaaagacggtgataccgccatcttct2520

ttggtctgagcggcaccggtaagaccaccttaagcacagacccgaaacgccagctgattg2580

gcgacgacgaacatggttgggatgacgagggtgtgttcaacttcgaaggtggctgctatg2640

ccaaaaccatcaacctgagcgcagagaatgagccggacatctatggtgccattaagcgcg2700

atgccctgctggagaacgttgttgtgctggataacggtgacgtggactacgcagatggta2760

gcaagaccgaaaacacccgcgtgagctatccgatctaccacattcagaatattgtgaagc2820

ctgtgagcaaggccggtcctgccaccaaggtgatttttctgagtgccgatgcctttggcg2880

tgttaccgccggtgagtaaactgaccccggaacagaccaaatactattttctgagcggtt2940

ttacagccaagctggcaggcaccgaacgcggtatcaccgagccgaccccgacctttagtg3000

catgcttcggcgccgcctttctgagtctgcatcctacccagtatgccgaggttctggtga3060

aacgcatgcaggagagcggcgcagaggcctatctggtgaataccggttggaatggcaccg3120

gcaaacgcattagcatcaaggacacccgcggcatcattgatgccattctggatggcagca3180

tcgacaaggccgaaatgggcagcttacctatttttgatttcagcattcctaaggccctgc3240

cgggcgtgaatcctgcaattctggacccgcgcgatacctatgcagataaagcccagtggg3300

aggaaaaggcccaggacctggccggtcgcttcgtgaaaaacttcgaaaaatacaccggta3360

ccgcagaaggccaagcactggttgccgccggcccgaaagcctaagaattcggtgagctcg3420

gtctgcagctggtgccgcgcggcagccaccaccaccaccaccactaaggatcctaagcgg3480

ccgcaagtcctgcaggaagtggcgcgccaagtcgccggcgataatacagattaaatcaga3540

acgcagaagcggtctgataaaacagaatttgcctggcggcagtagcgcggtggtcccacc3600

tgaccccatgccgaactcagaagtgaaacgccgtagcgccgatggtagtgtggggtctcc3660

ccatgcgagagtagggaactgccaggcatcaaataaaacgaaaggctcagtcgaaagact3720

gggccttggcgcgcccgtataagattaggacagtgacagtcgtttttagcgatcgtcact3780

taaattaagtaactgcttatcaaaacgcgattccttcagcgcttctttgacccgcttcaa3840

gttatctctgaattttgcaccgcgtcgcaaagtaaatcctgtcgccagcacatctatcac3900

ggtcagctgtgcaagtcgagaaaccatgggcatataaatgtcagtatcttccggtacgtc3960

gagggtaattgccagcgttgcttcccgggcgagcggggtacccgcagaggtgagggcaat4020

caccatggcgtcgttttcgcgtgccagctgcgccagctcgaccagattttttgttcttcc4080

agtgtgagaaatcagcaccaccacgtctccgtcgctacaattcatacaactcatgcgttg4140

cagcacgatatcatcggagtacaccaccggaacattaaaacgaaagaacttattcatcgc4200

atcgtgggcaacggcggctgaagagcctaatccgaaaaaggcgattttttttgcctgagt4260

gagcaagtcgacggcgcggttgatggcagatttatccagtgaatgacggacatgatcaag4320

cgttgccattgcggactcaaatattttccctgtgtatgattcaacgctgtcatcttcatt4380

gacattgcgattaacatagggagtgccattcgccagactctgtgccagatgaagtttaaa4440

atcaggaaaaccgcgcgtgtccatgctgcgacagaaacgattcaccgtcggttcgctaac4500

attggcttccagtgccatagcagcaatactcgaatggatcgcgttatcgggcgaagccag4560

aatgacctcggcaactttgcgctctgatttgctcaaatgttccagctgagactggatttt4620

ttccagcatattcattgctgcccctcaacaaatcaacgatattgtgcatcgcacaattac4680

cccgcttatagagcaacaaaagatcccg4708

<210>13

<211>4519

<212>dna

<213>artificialsequence

<400>13

atgaatttttcaatatcgccatagctttcaattaaatttgaaattttgtaaaatattttt60

agtagcttaaatgtgattcaacatcactggagaaagtcttttgacagctagctcagtcct120

aggtataatgctagcagggagaccacaacggtttccctctacaaataattttgtttaact180

ttcgcgcgcgtaacaggaggaattaaccatgagttcagtttcgctgcaggattttgatgc240

agagcgaattggtttgttccacgaggacattaagcgcaagtttgatgagctcaagtcaaa300

aaatctgaagctggatcttactcgcggtaagccttcgtcggagcagttggatttcgctga360

tgagttgttggcgttgcctggtaagggtgatttcaaggctgcggatggtactgatgtccg420

taactatggcgggctggatggcatcgttgatattcgccagatttgggcggatttgctggg480

tgttcctgtggagcaggtcttggcgggggatgcttcgagcttgaacatcatgtttgatgt540

gatcagctggtcgtacattttcggtaacaatgattcggttcagccttggtcgaaggaaga600

aaccgttaagtggatttgccctgttccgggctatgatcgccatttctccatcacggagcg660

tttcggctttgagatgatttctgtgccaatgaatgaagacggccctgatatggatgctgt720

tgaggaattggtgaagaatccgcaggttaagggcatgtgggttgttccggtgttttctaa780

cccgactggtttcacggtgacagaagacgtcgcaaagcgtctaagcgcaatggaaaccgc840

agctccggacttccgcgttgtgtgggataatgcctacgccgttcatacgctgaccgatga900

attccctgaggttatcgatatcgtcgggcttggtgaggccgctggcaacccgaaccgttt960

ctgggcgttcacttctacttcgaagatcactctcgcgggtgcgggcgtgtcgttcttcct1020

cacctctgcggagaaccgcaagtggtacaccggccatgcgggtatccgtggcattggccc1080

taacaaggtcaatcagttggctcatgcgcgttactttggcgatgctgagggagtgcgcgc1140

ggtgatgcgtaagcatgctgcgtcgttggctccgaagttcaacaaggttctggagattct1200

ggattctcgccttgctgagtacggtgtcgcgcagtggactgtccctgcgggcggttactt1260

catttcccttgatgtggttcctggtacggcgtctcgcgtggctgagttggctaaggaagc1320

cggcatcgcgttgacgggtgcgggttcttcttacccgctgcgtcaggatccggagaacaa1380

aaatctccgtttggcaccgtcgctgcctccagttgaggaacttgaggttgccatggatgg1440

cgtggctacctgtgtgctgttggcagcagcggagcattacgctaactaaaaggagatata1500

atgtcagcaaagcaagtctcgaaagatgaagaaaaagaagctcttaacttatttctgtct1560

acccaaacaatcattaaggaagcccttcggaagctgggttatccgggagatatgtatgaa1620

ctcatgaaagagccgcagagaatgctcactgtccgcattccggtcaaaatggacaatggg1680

agcgtcaaagtgttcacaggctaccggtcacagcacaatgatgctgtcggtccgacaaag1740

gggggcgttcgcttccatccagaagttaatgaagaggaagtaaaggcattatccatttgg1800

atgacgctcaaatgcgggattgccaatcttccttacggcggcgggaagggcggtattatt1860

tgtgatccgcggacaatgtcatttggagaactggaaaggctgagcagggggtatgtccgt1920

gccatcagccagatcgtcggtccgacaaaggatattccagctcccgatgtgtacaccaat1980

tcgcagattatggcgtggatgatggatgagtacagccggctgcgggaattcgattctccg2040

ggctttattacaggtaaaccgcttgttttgggaggatcgcaaggacgggaaacagcgacg2100

gcacagggcgtcacgatttgtattgaagaggcggtgaagaaaaaagggatcaagctgcaa2160

aacgcgcgcatcatcatacagggctttggaaacgcgggtagcttcctggccaaattcatg2220

cacgatgcgggcgcgaaggtgatcgggatttctgatgccaatggcgggctctacaaccca2280

gacggccttgatatcccttatttgctcgataaacgggacagctttggtatggtcaccaat2340

ttatttactgacgtcatcacaaatgaggagctgcttgaaaaggattgcgatattttagtg2400

cctgccgcgatctccaatcaaatcacagccaaaaacgcacataacattcaggcgtcaatc2460

gtcgttgaagcggcgaacggcccgacaaccattgatgccactaagatcctgaatgaaaga2520

ggcgtgctgcttgtgccggatatcctagcgagtgccggcggcgtcacggtttcttatttt2580

gaatgggtgcaaaacaaccaaggatattattggtcggaagaagaggttgcagaaaaactg2640

agaagcgtcatggtcagctcgttcgaaacaatttatcaaacagcggcaacacataaagtg2700

gatatgcgtttggcggcttacatgacgggcatcagaaaatcggcagaagcatcgcgtttc2760

cgcggatgggtctaactcgagggtagatctggtactagtggtgaattcggtgagctcggt2820

ctgcagctggtgccgcgcggcagccaccaccaccaccaccactaaggatcctaagcggcc2880

gcaagtcctgcaggaagtggcgcgccaagtcgccggcgataatacagattaaatcagaac2940

gcagaagcggtctgataaaacagaatttgcctggcggcagtagcgcggtggtcccacctg3000

accccatgccgaactcagaagtgaaacgccgtagcgccgatggtagtgtggggtctcccc3060

atgcgagagtagggaactgccaggcatcaaataaaacgaaaggctcagtcgaaagactgg3120

gccttattccggggatccgtcgacctgcagttcgaagttcctattctctagaaagtatag3180

gaacttcagagcgcttttgaagctcacgctgccgcaagcactcagggcgcaagggctgct3240

aaaggaagcggaacacgtagaaagccagtccgcagaaacggtgctgaccccggatgaatg3300

tcagctactgggctatctggacaagggaaaacgcaagcgcaaagagaaagcaggtagctt3360

gcagtgggcttacatggcgatagctagactgggcggttttatggacagcaagcgaaccgg3420

aattgccagctggggcgccctctggtaaggttgggaagccctgcaaagtaaactggatgg3480

ctttcttgccgccaaggatctgatggcgcaggggatcaagatctgatcaagagacaggat3540

gaggatcgtttcgcatgattgaacaagatggattgcacgcaggttctccggccgcttggg3600

tggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccg3660

tgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtg3720

ccctgaatgaactgcaggacgaggcagcgcggctatcgtggctggccacgacgggcgttc3780

cttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcg3840

aagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatca3900

tggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccacc3960

aagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcagg4020

atgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaagg4080

cgcgcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaata4140

tcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcgg4200

accgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaat4260

gggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgcct4320

tctatcgccttcttgacgagttcttctaataaggggatcttgaagttcctattccgaagt4380

tcctattctctagaaagtataggaacttctcttgccgctcccctgcattccaggggagct4440

gattcagataatccccaatgacctttcatcctctattcttaaaatagtcctgagtcagaa4500

actgtaattgagaaccaca4519

<210>14

<211>2417

<212>dna

<213>artificialsequence

<400>14

tggctcacattcccacgatgaaaacacgccaccccttgaaccaacgggcgttttccgtaa60

cactgaaagaatgtaagcgtttacccactaaggtattttcttgacagctagctcagtcct120

aggtataatgctagcagggagaccacaacggtttccctctacaaataattttgtttaact180

ttcgcgcgcgtaacaggaggaattaaccatgggtcaccaccaccaccaccacatgtatcg240

cactatgatgtccgggaagctgcaccgtgccaccgtgaccgaagctaacctgaactacgt300

aggtagcatcaccattgacgaagacctgatcgatgcggttggcatgctgccgaacgaaaa360

agtgcaaatcgtaaacaacaacaatggtgctcgtctggagacctacatcattccgggtaa420

acgtggctctggcgttatctgcttaaacggtgcagctgcacgtcttgtacaggaaggtga480

caaagttatcatcatctcctacaaaatgatgtctgatcaagaggcagcttctcacgagcc540

aaaagtagctgtgctgaacgaccagaacaaaatcgaacagatgcttggtaacgaaccggc600

tcgcaccatcctgtaactcgagggtagatctggtactagtggtgaattcggtgagctcgg660

tctgcagctggtgccgcgcggcagccaccaccaccaccaccactaaggatcctaagcggc720

cgcaagtcctgcaggaagtggcgcgccaagtcgccggcgataatacagattaaatcagaa780

cgcagaagcggtctgataaaacagaatttgcctggcggcagtagcgcggtggtcccacct840

gaccccatgccgaactcagaagtgaaacgccgtagcgccgatggtagtgtggggtctccc900

catgcgagagtagggaactgccaggcatcaaataaaacgaaaggctcagtcgaaagactg960

ggccttattccggggatccgtcgacctgcagttcgaagttcctattctctagaaagtata1020

ggaacttcagagcgcttttgaagctcacgctgccgcaagcactcagggcgcaagggctgc1080

taaaggaagcggaacacgtagaaagccagtccgcagaaacggtgctgaccccggatgaat1140

gtcagctactgggctatctggacaagggaaaacgcaagcgcaaagagaaagcaggtagct1200

tgcagtgggcttacatggcgatagctagactgggcggttttatggacagcaagcgaaccg1260

gaattgccagctggggcgccctctggtaaggttgggaagccctgcaaagtaaactggatg1320

gctttcttgccgccaaggatctgatggcgcaggggatcaagatctgatcaagagacagga1380

tgaggatcgtttcgcatgattgaacaagatggattgcacgcaggttctccggccgcttgg1440

gtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgcc1500

gtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggt1560

gccctgaatgaactgcaggacgaggcagcgcggctatcgtggctggccacgacgggcgtt1620

ccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggc1680

gaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatc1740

atggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccac1800

caagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcag1860

gatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaag1920

gcgcgcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaat1980

atcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcg2040

gaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaa2100

tgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgcc2160

ttctatcgccttcttgacgagttcttctaataaggggatcttgaagttcctattccgaag2220

ttcctattctctagaaagtataggaacttcccgcagttaaagcaattccagcgccagtaa2280

ttcttcgatggtctggcgacggcgaatcaaccgcgcctgaccattatcaaacagaacttc2340

tggtaacagcggacggctattgtagttggatgacattgatgcgccatatgcccctgtatc2400

atgcagtaccagataat2417

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1