用含有维生素b的制作方法

文档序号:560415阅读:720来源:国知局
专利名称:用含有维生素b的制作方法
技术领域
本发明涉及分子生物学领域以及使用重组生物体生产1,3-丙二醇。更具体而言它描述了影响细胞内维生素B12的转运和有效地将碳源底物转化为1,3-丙二醇的基因的克隆表达。
许多合成1,3-丙二醇的化学途径是已知的。例如,可以这样制备1,3-丙二醇,1)在膦、水、一氧化碳、氢气和酸存在的情况下在催化剂上由环氧乙烷制备得到;2)通过催化丙烯醛的溶液相氢化,然后还原;或3)由碳氢化合物如甘油在一氧化碳和氢气存在的情况下在含有元素周期表上第Ⅷ组原子的催化剂上进行反应。尽管可能通过这些方法产生1,3-丙二醇,但是这些方法费用昂贵,并且产生含有环境污染物质的废液。
一个多世纪以来已知可通过甘油的发酵生产1,3-丙二醇。已经在细菌,例如柠檬酸杆菌属(Citrobacter),梭菌属(Clostridium),肠杆菌属(Enterobacter),泥杆菌属(Ilyobacter),克雷伯氏菌属(Klebsiella),乳杆菌属(Lactobacillus),和暗杆菌属(Pelobacter)中发现了能产生1,3-丙二醇的菌株。在研究的每种情况中甘油通过两步酶催化的系列反应被转化成1,3-丙二醇。在第一步反应中脱水酶催化甘油转化为3-羟基丙醛(3-HP)和水(反应式1)。在第二步反应中3-HP被NAD+相关的氧化还原酶还原成1,3-丙二醇(反应式2)。
(反应式1)(反应式2)1,3-丙二醇不被进一步代谢,从而在培养基中高浓度富集。该整体反应消耗辅酶形式的还原型对等物,还原型β-烟酰胺腺嘌呤二核苷酸(NADH),其被氧化成烟酰胺腺嘌呤二核苷酸(NAD+)。
从甘油生产1,3-丙二醇通常是在厌氧并且没有其他还原对等物接受体(reducing equivalent acceptors)的条件下用甘油作为唯一碳源得到的。在这些条件下,在柠檬酸杆菌属,梭菌属和克雷伯氏菌属中,例如,进行着一条平行的途径,该途径首先由NAD+(或NADP+)相关的甘油脱氢酶将甘油氧化成二羟基丙酮(DHA)(反应式3)。DHA被DHA激酶磷酸化成磷酸二羟基丙酮(DHAP)后(反应式4)可被用于生物合成或通过,例如,糖酵解支持ATP的生成。
(反应式3)(反应式4)与1,3-丙二醇途径相反,此途径可为细胞提供碳和能量并产生而不是消耗NADH。
在肺炎克雷伯氏菌(Klebsiella pneumoniae)和弗氏梭菌(Citrobacter freundii)中编码功能上活性相关的甘油脱水酶(dhaB),1,3-丙二醇氧化还原酶(dhaT),甘油脱氢酶(dhaD)和二羟基丙酮激酶(dhaK)的基因包含于dha调节子中。源自柠檬酸杆菌属和克雷伯氏菌属的dha调节子已经在大肠杆菌(Escherichiacoli)中表达并且能将甘油转化为1,3-丙二醇。
1,3-丙二醇的生物学方法生产需要甘油作为两步顺序反应的底物,其中脱水酶(通常为辅酶B12依赖的脱水酶)将甘油转化成中间产物3-羟基丙醛,然后-羟基丙醛被NADH-(或NADPH)依赖的氧化还原酶还原。这些辅酶条件很复杂,在使用了这种顺序反应生产1,3-丙二醇的工业方法中要求使用全细胞催化剂。一种从甘油生产1,3-丙二醇的含有辅酶B12依赖的二元醇脱水酶的方法在US5,633,362(Nagarajan et al.)中有所描述。然而,该方法不限于用甘油作为原料。葡萄糖和其他碳水化合物是适当的原料并且,近来这些原料被用于1,3-丙二醇的生产。利用混合微生物碳水化合物被转化成1,3-丙二醇,其中碳水化合物首先被一种微生物发酵成甘油,然后被另一种微生物转化成1,3-丙二醇。US5,599,689(Haynie et al.)。为了简化以及经济起见能将碳水化合物转化成1,3-丙二醇的单一生物体是优选的。这样的生物体在US5,686,279(Laffend et al.)中有所描述。
一些细菌,如沙门氏菌属或克雷伯氏菌属能合成辅酶B12以使二元醇或甘油脱水酶发挥作用,但是其他种属必须从细胞外转运B12。术语“B12”整体上用于指辅酶B12,上部轴向5’-脱氧腺苷配基被其他配基取代(例如水-,氰-或甲基基团)的辅酶B12衍生物;和基因类型,钴胺素(Ⅱ)。
B12向细胞的转运存在两个问题。首先,B12分子太大了,不能通过外膜孔蛋白,从而需要特殊的外膜转运系统。第二,由于环境中的B12很少,外外膜转运系统必须对B12具有很高的亲和性并将其运送到质周腔以便随后被另一系统转运跨过内膜。对于不能合成B12的咕啉环的大肠杆菌而言在一定条件B12的外部供应对生长是必需的。这些要求可能是适度的;当存在功能性MetH基团时时需要大约25个B12分子(甲基钴胺素),而对于依赖乙醇胺氨裂解酶的生长则需要大约500个辅酶B12分子。
转运过程需要几种蛋白。66kDa的外膜蛋白BtuB是腺苷-,水-,氰-和甲基钴胺素和相应的钴胺素(cobinamides)的高亲和性(Kd=0.3nM)受体。在没有B12或B12水平很低(<1nM)的条件下生长时每个细胞存在-200拷贝的BtuB。但是在含含高水平(>0.1μM)B12的培养基中生长时抑制了BtuB的合成,甚至在5nM的水平时摄入活力被抑制80-90%。与沙门氏菌不同,大肠杆菌的BtuB不为需氧代谢所抑制。转运到质周腔需要BtuB和26kDa内膜蛋白TonB在能量依赖的途径中的相互作用,在该途径中还需要共转运钙。事实上,B12和BtuB的高亲和性结合是钙依赖的,有证据表明存在可逆的B12依赖的钙结合位点,在pH6.6和饱和水平的B12的条件下对钙的Kd值为-30nM。上述对钙的亲和性随着pH的降低而降低。TonB利用质子驱动力驱动转运所需要的结构变化。在没有TonB的情况下,B12穿过外膜的效率很低。TonB还加强铁的外膜转运系统,包括FepA和FhuA系统。这样BtuB与这些系统竞争TonB的活性。没有蛋白合成时B12转运的速率以-20分钟的半衰期降低,这可归结于TonB活性的丧失。对B12从BtuB向质周腔结合蛋白的转移的了解还很少,可能涉及btuF位点所编码的蛋白,至少在沙门氏菌中是这样的。
跨过内膜的转运是由btuCED操纵子所编码的BtuC和BtuD蛋白所介导的。BtuC和BtuD类似于需要质周腔结合蛋白的转运蛋白,并且BtuD具有ATP结合位点。这两种基因的突变体的表型可通过适当升高外界B12的浓度而被校正,有人认为BtuB/TonB系统使得B12在质周腔集中,从而促进B12向细胞质的随机转运。BtuE可能不参与转运,其功能未知。BtuCED操纵子似乎为组成型表达,不为生长培养基中B12的存在所调节。
上述转运途径可被总结为首先B12与外膜蛋白BtuB结合,然后然后是与内膜蛋白TonB相互作用并进行能量依赖的移位,接着与质周腔的BtuF结合,最后转移到内膜蛋白BtuCD并移位到细胞质。
B12转运的一个重要控制机制是辅酶B12对外膜蛋白BtuB水平的影响。由btuR基因所编码的ATP类咕啉腺苷转移酶的活性导致了细胞辅酶B12的形成。如上文所述,培养基中B12的存在导致了BtuB功能的减弱,很有必要强调这种直接的抑制仅仅在辅酶B12的情况中观察到而未在辅酶B12前体中观察到,如通过向btuR缺陷菌株添加各种B12分子所看到的那样。培养基中补充的辅酶B12前体可能由于转变成辅酶B12而导致抑制。调控似乎是通过改变信号的合成而不是信号的起始,因此使用外源启动子表达btuB并不一定能阻止辅酶B12的调控。BtuB调控不同寻常之处在于当btuB基因处于多拷贝质粒和单拷贝质粒上时阻遏似乎同样有效。这种表观上缺乏过量靶序列的滴定效应暗示着细胞中阻遏蛋白(辅酶B12)大大过量。
通过融合基因的研究发现转录水平和翻译水平的调控都适用于表达,将这些综合在一起,各种特征暗示了辅酶B12和mRNA前导序列直接作用的机制。这种作用可能诱导mRNA折叠以稳定发夹结构从而阻止核糖体接近翻译的起始部位。BtuB转录产物的相当一部分需要参与对其自身的表达和调控的控制,这意味着涉及前导序列和btuB编码区域的转录后事件影响了翻译的通读和起始。在氨基酸生物合成途径的衰减调控中已有报道转录区域参与调控,但是btuB调控的不同寻常之处在于重要的调节位点位于btuB的编码序列并且该调控同时影响转录和翻译。
本发明将要解决的问题是如何;利用一种含有辅酶B12依赖的脱水酶的重组生物体通过生物学方法生产1,3-丙二醇;上述重组生物体通过引入编码负责B12转运的活性的基因而增强辅酶B12的可获得性。
发明概述本专利的申请人通过提供能进行由脱水酶介导的从可发酵碳源向1,3-丙二醇直接转化的一种微生物而解决了上述问题,其中通过引入B12转运基因而增强了辅酶B12对上述脱水酶的可获得性。在包括可发酵碳水化合物,单碳底物和它们的混合物的一组较大的底物中优选的底物为葡萄糖和甘油。
本发明提供了一种1,3-丙二醇的生物生产方法,包括(ⅰ)使转化的宿主细胞和至少一种可发酵碳源以及有效量的维生素B12接触,从而生产1,3-丙二醇,上述转化的宿主细胞含有(a)至少一个拷贝编码具有脱水酶活性的蛋白的基因;(b)至少一个拷贝编码具有氧化还原酶活性的蛋白的基因;(c)至少一个拷贝编码维生素B12受体前体蛋白的基因;(d)至少一个拷贝编码维生素B12转运系统通透酶蛋白的基因;(e)至少一个拷贝编码具有维生素B12转运ATP-或GTP结合蛋白的基因;其中(c),(d),或(e)基因中的至少一个被引入到宿主细胞,以及(ⅱ)回收步骤(ⅰ)中生产的1,3-丙二醇。有效剂量的维生素B12和存在的脱水酶的摩尔比为0.1至10倍。
本发明进而提供了表达脱水酶的转化宿主细胞,含有(a)至少一个拷贝编码具有脱水酶活性的蛋白的基因;(b)至少一个拷贝编码具有氧化还原酶活性的蛋白的基因;(c)至少一个拷贝编码维生素B12受体前体(BtuB)蛋白的基因;(d)至少一个拷贝编码维生素B12转运系统通透酶蛋白的基因(BtuC);(e)至少一个拷贝编码具有维生素B12转运ATP-或GTP结合蛋白的基因(BtuD);其中(c),(d),或(e)基因中的至少一个被引入到宿主细胞。
序列表简述发明者按照专利申请中核苷酸和氨基酸序列标准表示法的规则(EPO局长决议附录Ⅰ和Ⅱ,发表于OJ EPO,12/1992的增刊2),根据世界知识产权组织(WIPO)(1998)的37C.F.R.1.821-1.825和附录A和B(对含有核苷酸和/或氨基酸序列的申请说明书的要求)以及EPO和PCT的序列表要求(Administrative Instruction中的规则5.2和49.5(a-bis)和Section208以及附件C)提供了25个序列。根据在此引入作为参考的Nucleic Acid Research 13:3021-3030(1985)和Biochemical Journal 219(No.2):345-373(1984)中所描述的IUPAC-IYUB的标准上述序列描述中含有编码核苷酸序列的单字母码和编码氨基酸序列的三字母码。
SEQ ID NO:1是大肠杆菌butB的核苷酸序列,编码维生素B12受体前体蛋白。
SEQ ID NO:2是沙门氏菌butB的核苷酸序列,编码维生素B12受体前体蛋白。
SEQ ID NO:3是大肠杆菌butC的核苷酸序列,编码维生素B12转运系统通透酶蛋白。
SEQ ID NO:4是大肠杆菌butD的核苷酸序列,编码维生素B12转运ATP结合蛋白。
SEQ ID NO:5是大肠杆菌butE的核苷酸序列,编码维生素B12受体周质蛋白。
SEQ ID NO:6是dha B1的核苷酸序列,编码甘油脱水酶α亚基。
SEQID NO:7是dhaB2的核苷酸序列,编码甘油脱水酶β亚基。
SEQ ID NO:8是dhaB3的核苷酸序列,编码甘油脱水酶γ亚基。
SEQ ID NO:9是dhaT的核苷酸序列,编码克雷伯氏菌氧化还原酶。
SEQ ID NO:10是含有dha启动子的编码PHK28-26的一个12.1kbEcoR1-SalI片段的核苷酸序列。
SEQ ID NO:11是用于构建表达载体pTacIQ的多克隆位点和终止子的核苷酸序列。
SEQ ID NO:12-23是用于构建本发明载体的引物。
SEQ ID NO:24是pCL1920中的一段插入序列的核苷酸序列,用于构建dhaT和dha B(1,2,3)的表达盒(expression cassette)。
SEQ ID NO:25是链霉菌的葡萄糖异构酶启动子的核苷酸序列。发明详述本发明提供了在单一重组生物生物体中利用生物学方法从可发酵碳源中生产1,3-丙二醇的方法。该方法利用了一种微生物,该微生物含有编码甘油脱水酶,1,3-丙二醇氧化还原酶基因以及编码维生素B12受体前体(BtuB)的基因,编码维生素B12转运系统通透酶蛋白的基因,和编码维生素B12转运ATP结合蛋白(BtuD)的基因。上述微生物和碳底物接触,1,3-丙二醇分离自培养基。
本发明提供了一种快速,便宜和环保的可用于生产聚酯和其他多聚体的1,3-丙二醇单体来源。
下列定义用于解释权利要求和说明书。
术语“维生素B12受体”,“BtuB”或”“外膜维生素B12受体蛋白”指位于细菌外膜负责从培养基向周质空间转运辅酶B12,氰钴氨素,水合钴氨素,甲基钴氨素和钴啉醇酰胺的多肽。为了本发明的目的,BtuB包括,例如,由大肠杆菌的btuB基因(GenBank M10112)(SEQ ID NO:3)所编码的蛋白以及鼠伤寒沙门氏菌(Salmonella typhimurium)(GenBank M89481)(SEQ ID NO:2)。
术语“BtuC”或“维生素B12转运系统通透酶蛋白”指位于细菌内膜的多肽,和BtuD一起从周质空间向细胞质转运维生素B12和辅酶B12。BtuC包括,例如,由大肠杆菌的btuC基因(GenBank M14031)(SEQ IDNO:3)编码的多肽。
术语“BtuD”或“维生素B12转运ATP结合蛋白”指位于细菌内膜的多肽,和BtuC一起从周质空间向细胞质转运维生素B12和辅酶B12。BtuD包括,例如,由大肠杆菌的btuD基因(GenBank M14031)(SEQ IDNO:4)编码的多肽。
术语“BtuE”指位由大肠杆菌的btuE基因(GenBank M14031)(SEQID NO:5)编码的多肽,是上述转运系统的辅助成分。
术语”甘油脱水酶”或“脱水酶”指负责辅酶B12依赖的酶活性的多肽,上述辅酶B12依赖的酶活性能将甘油异构化或转化产物成为3-羟基丙酐。为了本发明的目的,脱水酶包括优选底物分别为甘油和1,3-丙二醇的甘油脱水酶(GenBank U09771,U30903)和二醇脱水酶(Genbank D45071)。肺炎克雷伯氏菌ATCC 25955的甘油脱水酶由基因dhaB1,dhaB2和dhaB3编码,分别用SEQ ID NO:6,7和8标识。基因dhaB1,dhaB2和dhaB3分别编码甘油脱水酶的α,β和γ亚基。甘油脱水酶和二醇脱水酶是复合体(亚基组成为α2β2γ2),和辅酶B12以1∶1的比例结合。
“有效剂量”的辅酶B12前体(或维生素B12)的意思为系统中存在的辅酶B12前体(或维生素B12)相对脱水酶的摩尔比为0.1至10。
术语“氧化还原酶”或“1,3-丙二醇氧化还原酶”指负责能催化3-羟基丙醛还原成1,3-丙二醇的活性的多肽。1,3-丙二醇氧化还原酶包括,例如,由dhaT基因编码的多肽被标识为SEQ ID NO:9。
术语“辅酶B12”和“腺苷基钴氨素”和5’-脱氧腺苷基钴氨素可以互换使用。羟基钴氨素是辅酶B12的衍生物,其中上轴向的5,-脱氧腺苷基配基为羟基所取代。水合钴氨素是羟基钴氨素的质子化形式。甲基钴氨素是辅酶B12的衍生物,其中上轴向的5’-脱氧腺苷基配基为甲基所取代。术语“氰钴氨素”用于指辅酶B12的上轴向5’-脱氧’5’-腺苷基配基为氰所取代的衍生物。术语“维生素B12”和“B12”用于可互换地整体上指辅酶B12;辅酶B12的上轴向5’-脱氧腺苷基配基为其他配基所取代的衍生物,例如,水合-,氰-,或甲基;以及基因类型,钴胺素(Ⅱ)。术语“辅酶B12前体”指辅酶B12的上轴向5’-脱氧腺苷基配基被取代的衍生物。“有效剂量”的辅酶B12前体的意思为系统中存在的辅酶B12前体(或维生素B12)相对脱水酶的摩尔比约为0.1至10。
术语“多肽”和“蛋白”可以互换使用。
术语“可发酵碳底物”和“可发酵碳源”指能被本发明的宿主生物体代谢的碳源,尤其是选自单糖,寡聚糖,多糖,甘油,二羟基丙酮和单碳底物以及它们混合物的碳源。
术语“宿主细胞”或“宿主生物体”指能接受外源或异源基因或多拷贝内源基因并表达这些基因产生活性基因产物的微生物。
“基因”指表达特定蛋白的核酸片段,包括编码序列之前(5’非编码序列)和之后(3’非编码序列)的调节序列。“天然基因”指在自然中发现的带有自身调节序列的基因。“融合基因”指任何不是天然基因的,含有不是在自然中发现的调节和编码序列的基因。因此,任何基因可以含有源自不同来源的调节序列和编码序列,或调节序列和编码序列源自同一来源但是排列的方式和自然中发现的方式不同。“内源基因”指在一个生物体基因组的天然位置的天然基因。“外源”或“异源”基因指通常不会在宿主生物体中发现的基因,但是通过基因转化被引入宿主生物体。外源基因可以含有插入到非天然有机体,或融合基因,的天然基因。“转基因”是通过转化的方法被引入到基因组的基因。
术语“编码”(encoding and coding)指一个基因通过转录和翻译的机制产生蛋白质的过程。编码特定氨基酸序列的过程包括DNA序列,DNA序列可能发生不会导致所编码的氨基酸变化的碱基变化,或发生可能发生改变一个或几个编码的氨基酸但是不影响DNA序列所编码的蛋白质的功能的碱基变化。因此认为本发明不仅仅包括特定的示例性序列。对序列的修改,如在序列中进行基本上不影响所得到的蛋白分子的功能的产生静息变化的缺失、插入、或替代也是本发明所预期的。例如,基因序列中反应了遗传密码的简并性的改变或在特定位点导致产生化学对等氨基酸的变化是预期的。因此,一个丙氨酸,一种疏水氨基酸,的密码子可以为编码另一疏水性较弱的残基(如甘氨酸)的密码子或为疏水性更强的残基(如缬氨酸,亮氨酸或异亮氨酸)的密码子所取代。类似地,导致一个带负电残基取代另一带负电残基(例如天冬氨酸取代谷氨酸)的变化,或一个带正电残基取代另一带正电残基(例如赖氨酸取代精氨酸)的变化也可预期产生生物学上对等的产物。可以预期导致蛋白N末端或C末端部分变化的核苷酸变化可能改变蛋白的活性。在一些情况下制备序列的突变体以研究变化对蛋白生物学活性的影响也是合乎需要的。以上列出的这些变化都在本领域的常规技术之内,确定在编码的产物中保留生物学活性也是。进而,本领域的技术人员认识到本发明所包括的序列也可被定义为能与此处列出的示例性序列在严紧条件下(0.1×SSC,0.1%SDS,65℃)杂交的序列。
术语“表达”指从编码基因产物的基因转录和翻译得到基因产物。
术语“质粒”“载体”和“盒(cassette)”指通常带有基因的另加染色体元件,上述基因不是细胞核心代谢的一个部分,并通常为环状双链DNA分子的形式。这样的元件可以是自动复制的序列,基因组整合序列,噬菌体或核苷酸序列,线性或环状的,单链或双链的DNA,源自任何来源,其中许多核苷酸序列被连接或重组成独特的构建体,该构建体能将编码选择的基因产物的DNA序列和启动子片段引入细胞。“转化盒”指含有外源基因以及外源基因之外的元件,能促进特定宿主细胞的转化的特定载体。“表达盒”指含有外源基因和含有外源基因以及外源基因之外的元件并允许增强该基因在其宿主中表达的特定载体。
术语“转化”和“转染”指吸收核酸后细胞获得新基因。获得的基因可以被整合入染色体DNA或作为染色体外复制序列被引入。术语“转化体”指转化的产物。
术语“遗传上发生改变的”指通过转化或突变改变遗传物质。
本发明涉及构建一种生产生物体,其含有将可发酵碳底物转化为1,3-丙二醇所必需的遗传机制,以及编码细胞内转运维生素B12所必需的酶的基因。参与1,3-丙二醇生产的基因包括脱水酶基因(通常为甘油或二元醇脱水酶)和氧化还原酶基因以及其它预期能辅助脱水酶的组装或维持其稳定性的蛋白的基因。这些基因可以是转基因并被引入到宿主细胞,或可以是内源基因。负责细胞内维生素B12转运的基因包括至少一种编码维生素B12受体前体蛋白的基因(BtuB),至少一种编码维生素B12转运系统通透酶的基因(BtuC)以及至少一种编码维生素B12转运ATP结合蛋白的基因(BtuD)。这些基因中至少一个是转基因并被引入生产细胞。然后在适当的条件下生长转化后的生产细胞以生产1,3-丙二醇。
含有编码将碳源底物转化成1,3-丙二醇的酶学途径所必需的基因的重组生物体的构建可利用本领域中众所周知的技术。在本发明中分离自天然宿主如克雷伯氏菌属的编码甘油脱水酶(dhaB)和1,3-丙二醇氧化还原酶(dhaT)的基因,以及分离自天然宿主如大肠杆菌和鼠伤寒沙门氏菌的编码BtuB(btub),BtuC(btuC),BtuD(btuD)和BtuE(btuE)α或FM5;肺炎克雷伯氏菌菌株ATCC25955;产酸克雷伯氏菌(K.oxytoca)菌株ATCC8724或M5a1,啤酒糖酵母(S.cerevisiae)菌株YPH499,巴斯德毕赤酵母(P.pastoris)菌株GTS115,或黑曲霉(A.niger)菌株FS1。DhaB,dhaT的基本原理从葡萄糖生产1,3-丙二醇可通过以下一系列步骤来完成。这一系列代表了许多本领域中技术熟练人员所已知的途径。葡萄糖被糖酵解途径的酶通过许多步骤转化成磷酸二羟基丙酮(DHAP)和3-磷酸甘油醛(3-PG)。DHAP水解成二羟基丙酮DHA后还原形成甘油,或者DHAP还原成甘油3-磷酸(G3P)后水解形成甘油。水解步骤可为任何细胞磷酸酶催化,已知它们对于它们的底物是非特异性的,或者该活性可通过重组被引入宿主。还原步骤可以由NAD+(或NADP+)相关的宿主酶催化或该活性可通过重组被引入。值得注意的是dha调节子含有催化反应式3的可逆反应的脱氢酶(E.C.1.1.1.6)(反应式1)
(反应式2)(反应式3)上文详细描述了甘油通过中间产物3-羟基丙酐(3-HP)被转化成1,3-丙二醇。中间产物3-HP是从甘油,反应式1,通过脱水酶得到的,上述脱水酶为宿主所编码或可通过重组被引入宿主。该脱水酶可以是甘油脱水酶(E.C.4.2.1.30)二元醇脱水酶(E.C4.2.1.28)或任何其他能催化这种转变的酶。甘油脱水酶,而不是二醇脱水酶,是由dha调节子所编码的。1,3-丙二醇是由NAD+(或NADP+)相关的宿主酶从3-HP产生,反应式2,上述宿主酶的活性也可通过重组被引入宿主。产生1,3丙二醇的终反应可由1,3-丙二醇脱氢酶(E.C1.1.1.202)或其它醇脱氢酶催化。
dha调节子由几种功能元件组成包括编码二羟基丙酮激酶的dhaK,编码甘油脱氢酶的dhaD和编码调节蛋白的dhaR,编码1,3-丙二醇氧化还原酶的dhaT以及分别编码该酶α、β、γ亚基的dhaB1,dhaB2和dhaB3。基因产物被命名为蛋白X,蛋白1,蛋白2和蛋白3(分别相应于dhaBX,orfY,orfX,和orfW)也被编码于dha调节子内。这些基因产物的确切功能还不是很清楚,这些基因是与甘油脱水酶(dhaB)或1,3-丙二醇氧化还原酶(dhaT)相关的,并且已知对于1,3-丙二醇的生产是有用的。结合于甘油脱水酶的辅酶B12有时发生不可逆的裂解形成与脱水酶紧密结合的无活性的修饰辅酶。该酶的重新活化是通过结合的修饰的辅酶与自由的完整的辅酶B12的交换。蛋白X和其它蛋白1,蛋白2和蛋白3中的至少一种参与这种交换过程。(参见USSN08/969,683)。在独立的二醇脱水酶系统中被命名为ddrA和ddrB的基因,相应于编码蛋白X和蛋白2的基因,被认为参与了该交换过程。Morri et al.,J.Biol.Chem.272,32034-32041(1997)。
有人认为甘油-3-磷酸脱氢酶和甘油-3-磷酸酶在葡萄糖转化为甘油中特别有效,在1,3-丙二醇的生产中是必需的。术语“甘油-3-磷酸脱氢酶”指负责催化磷酸二羟基丙酮(DHAP)向甘油-3-磷酸(G3P)转化的酶活性的多肽。在体内G3PDH可以是NADH、NADPH或FAD依赖的。NADH依赖的酶(EC.1.1.1.8)是由,例如几种基因编码的,包括GPD1(GenBank Z74971x2)或GPD2(GenBank Z35169x1)或GPD3(GenBank G984182),或DAR1(GenBank Z74071x2)。NADPH依赖的酶(EC1.1.1.94)是由gpsA(Genbank U321643,(cds 197911-196892)和G4667646和L45246)。FAD依赖的酶(EC1.1.99.5)是由GUT2(GenBank Z47047x23)或glpD(GenBank G147838)或glpABC(GenBank M20938)编码。术语“甘油-3-磷酸酶”指负责催化甘油3-磷酸向水和甘油和无机磷酸转化的酶活性的多肽。甘油-3-磷酸酶是由,例如,GPP1(GenBank Z47041x125),或GPP2(GenBankU18813x11)编码。基因分离从细菌基因组获得所需基因的方法是常规的并且在分子生物学领域是已知的。例如,如果该基因的序列是已知的,则可以通过限制性内切酶消化建立基因组文库并用与所需序列互补的探针筛选。一旦分离得到了该序列,则可以通过常规的引物定位的扩增方法如聚合酶链式反应(PCR)(US4,683,202)扩增DNA以得到适用于用恰当的载体转化的一定量的DNA。
替代地,可以建立粘粒(cosmid)文库,在粘粒文库中大片段的基因组DNA可被装入载体并用于转化使得的宿主。粘粒载体的独特之处在于能容纳大量DNA。通常,粘粒载体具有至少一个可拷贝的cosDNA序列,该序列对于外源DNA的装入和随后的环化是必需的。除了cos序列外这些载体还含有复制起点如ColE1和药物抗性标记如抗氨苄青霉素或新霉素的基因。用粘粒载体转化适当的细菌宿主的方法在Sambrook et al.,Molecular Cloning:A Laboratory Manual,SecondEdition(1989)Cold Spring Harbor Laboratory Press,Cold SpringHrbor,NY(1989)中有很好的描述。
通常对于克隆的粘粒而言通过适当的限制性内切酶外源DNA被分离并连接到和粘粒载体的cos区域相邻的区域上。然后含有线性外源DNA的粘粒载体与DNA包装载体如噬菌体λ反应。在包装过程中cos位点被切开并且外源DNA被包装成细菌病毒颗粒的头部。这些颗粒然后被用于转染适当的宿主菌如大肠杆菌一旦注入细胞,外源DNA在cos粘性末端的作用下环化。通过这种方式大片段的外源DNA可被引入重组宿主细胞并在其中表达。编码甘油脱水酶(dhaB)基因以及1,3-丙二醇氧化还原酶基因(dhaT)的分离和克隆dhaB和dhaT的鉴定和分离的方法基本上按照US5,686,276中所描述的进行,US5,686,276在此引入作为参考。在本发明的情况下,粘粒载体和粘粒转化方法被用于从已知具有能将甘油加工为1,3-丙二醇的基因的细菌种属中克隆大片段基因组DNA。分析了两个1,3-丙二醇阳性转化子并且DNA测序表明和弗氏柠檬酸杆菌中的甘油脱水酶基因(dhaB)具有广泛的同源性,这表明这些转化子含有表明甘油脱水酶基因的DNA。dhaB和dhaT被分离并克隆到适当的表达盒中以在具有编码B12转运功能的基因的重组宿主中共表达。
虽然本发明直接使用了分离自克雷伯氏菌粘粒的基因,脱水酶基因的替代来源还包括,但不限于,柠檬酸杆菌属,梭菌属和沙门氏菌。B12转运基因的基本原理腺苷基-钴铵素(辅酶B12)是甘油脱水酶活性的必需辅酶。该辅酶是已知的最复杂的非多聚体天然产物,其合成直接使用了约30个基因的产物。辅酶B12的合成发现于原核生物,其中一些能从头合成该复合物,而另一些能进行部分反应。例如,大肠杆菌不能制造咕啉环结构,但能催化钴啉醇酰胺向类咕啉的转化并能引入5’-脱氧腺苷基。
B12向大肠杆菌内的转运可能是产生具有功能的Dha B酶的限制性因素,在这样的情况下提高细胞内辅酶B12的可获得性对于优化甘油脱水酶活性(并且,最终地,1,3-丙二醇的生产)是必需的。这可通过提高B12向细胞内的转运速率而实现。考虑到辅酶B12是btuB表达的抑制剂,并且考虑到发酵时辅酶B12所需要的水平,很可能由于其周转或者细胞分裂造成的BtuB的稀释B12转运随时间降低。细胞中可获得的辅酶B12库将受到吸收速率或BtuB mRNA的影响以及需要辅酶B12的DhaB和mRNA以及DhaB浓度的影响。由于使用富含B12的培养基时吸收减少,决定吸收机制是否恢复的一个重要因素是辅酶B12在其对btuB的调节作用以及DhaB之间的分配。这表现一个不同寻常的问题所需要的辅酶(辅酶B12)对其自身进行限制。使用辅酶B12前体取代辅酶B12将减轻此问题,但这只有暂时的效果,因为被转运进去的前体将被btu-R编码的腺苷基转移酶转化为辅酶B12。一种避免该基因调节问题的方法是使BtuB的合成与辅酶B12的调节解偶联。通过在多拷贝质粒上克隆而扩增btuB的表达将导致B12与膜的结合增加并提高吸收的速率,并且如果使用了btuB天然启动子也将使BtuB的合成与辅酶B12的调节解偶联。
B12向细胞的转运需要特定的转运系统。该转运过程需要几种蛋白。66kDa的外膜蛋白BtuB是腺苷基-,水合-,氰-和甲基-钴氨素或相应的钴啉醇酰胺类的受体。转运入质周腔需要BtuB与26kDa内膜蛋白TonB通过能量依赖的过程相互作用。跨内膜的转运是由btuCED操纵子编码的BtuC和BtuD蛋白介导。BtuC和BtuD类似于需要质周腔结合的蛋白的转运蛋白,并且BtuD具有一个ATP结合位点。转运途径可被归结成首先B12与外膜蛋白BtuB结合,然后与内膜蛋白TonB相互作用,然后是能量依赖的转运以及与质周腔Btuf(鼠伤寒沙门氏菌中)的结合,最后转移到内膜蛋白BtuCD并转运到细胞质中。通过在多拷贝质粒上的克隆扩增btuCED的表达导致了B12与膜的结合增加并增加了其被吸收入细胞的速率。B12转运基因的分离和表达为4种B12转运基因,btuB,btuC,btuD和btuE构建了能在大肠杆菌中作为复制元件存在的表达质粒。利用对基因特异的引物和大肠杆菌染色体DNA分离了4种基因。这4中基因在表达质粒上被组装在一起。所有的表达质粒都用trc启动子进行转录,用天然btu核糖体结合位点进行翻译。每个质粒还含有1)用于在含氨苄青霉素的培养基中进行选择的β-内酰胺酶基因或2)用于在含氯霉素的培养基中进行选择的氯霉素乙酰转移酶基因之中的一个。质粒的复制起点是ColE1或p15A。宿主细胞用于通过编码脱水酶的基因以及负责细胞内B12转运的基因的共表达而重组生产1,3-丙二醇的适当的宿主细胞可以是原核细胞或真核细胞,限制条件仅仅是它们表达活性酶的能力。优选的宿主将是这些尤其有用于生产1,3-丙二醇或甘油的宿主,例如柠檬酸杆菌属,肠杆菌属,梭菌属,克雷伯氏菌属,气杆属(Aerobacter),乳杆菌属,曲霉属(Aspergillus),糖酵母属(Sacharomyces),裂殖糖酵母属(Schizosaccharomyces),结合糖酵母属(Zygosaccharomyces),毕赤酵母属(Pichia),克鲁维氏酵母属(Kluyveromyces),假丝酵母属(Candida),汉逊氏酵母属(Hansenula),德巴利氏酵母(Debaryomyces),毛霉属(Muor),球拟酵母属(Torulopsis),甲基杆菌(Methylobacter),大肠杆菌属,沙门氏菌属(Salmonella),芽孢杆菌属(Bacillus),链霉菌属(Streptomyces)和假单胞菌类(Pseudomonas)。
大肠杆菌,糖酵母类和克雷伯氏酵母类是尤其优选的宿主。已知肺炎克雷伯氏菌的菌株在用甘油作为唯一碳源时能生产1,3-丙二醇。预期克雷伯氏菌属可通过基因手段被改变成能从单糖,寡糖,多糖或单碳底物生产1,3-丙二醇。载体和表达盒本发明提供了许多适用于编码适当的脱水酶的基因和执行B12向适当的宿主细胞转运功能的基因的克隆转化和表达的载体、转化盒和表达盒。适用的载体将与所使用的细菌相兼容。适当的载体可源自,例如,细菌、病毒(例如T7噬菌体或源自M13的噬菌体)粘粒、酵母或植物。使用和获得这样的载体的方法在本领域中是已知的(Sambrook etal.,Molecular Cloning:A Laboratory Manual-volumes 1,2,3(ColdSpring Laboratory,Cold Spring Harbor,NY,(1989))。
通常载体或盒含有引导相关基因的转录和翻译的序列、选择标记和允许自主复制或染色体整合的序列。适合的载体基因的5’端区域带有对转录启动的控制,DNA片段的3’端控制转录的终止。最为优选的是两种控制区域都源自和转化宿主细胞同源的基因,尽管认为这样的控制区域不需要源自被选择作为生产宿主的特定种的天然基因。
可用于启动本发明的相关基因在所需的宿主细胞中表达的启动控制区域或启动子有很多,并且为本领域的技术熟练人员所熟悉。基本上能驱动这些基因表达的任何启动子都适用于本发明,包括但不限于,CYC1,HIS3,GAL1,GAL10,ADH1,PGK,PHO5,GAPDH,ADC1,TRP1,URA3,LEU2,ENO,TPI(可用于在糖酵母属中表达);AOX1(可用于在毕赤酵母中表达);和lac,trp,λPR,T7,tac,和trc(可用于在大肠杆菌中表达)。
终止控制区域也可源自各种对优选的宿主天然的基因。供选地,终止位点可以是不必要的;然而,如果包含的话是最为优选的。
为了酶的有效表达,编码该酶的DNA通过起始密码子可操作地连接到表达控制区域上以使得表达导致形成适当的信使RNA。适当宿主的转化和基因的表达以生产1,3-丙二醇一旦构建了适当的盒,它们即被用于转化适当的宿主细胞。可通过已知的方法,例如通过转化(例如用钙渗透细胞,电穿孔)或通过用重组噬菌体病毒转染(Sambrook et al.,supra)将分别含有或同时含有负责细胞内B12转运的基因以及负责甘油脱水酶(dhaB),和1,3-丙二醇氧化还原酶基因(dhaT)的上述盒导入宿主细胞。
在本发明中,含有编码甘油脱水酶(dhaB),1,3-丙二醇氧化还原酶(dhaT),BtuB(btuB),BtuC(btuC),BtuD(btuD)和BtuE(btuE)的E.coli FM5被用于从培养基向细胞质转运维生素B12或辅酶B12以使得甘油脱水酶发挥功能。培养基和碳源底物本发明中发酵培养基必需含有适当的碳源底物。适当的碳源底物包括单不限于甘油、二羟基丙酮、单糖如葡萄糖和果糖,寡糖如乳糖或蔗糖,多糖如淀粉或纤维素,或它们的混合物,以及源自补充给料的未纯化混合物如奶酪乳清渗透物(cheese whey permeate),谷物浸泡液,甜菜糖蜜和大麦麦芽。此外,碳源底物也可以是向关键生化中间产物的转化已经被证明的单碳底物(如二氧化碳或甲醇)。
已有报道在甲基营养酵母(Methylotrophic yeasts)(Yamada etal.,Agric.Biol Chem.,53(2)541-543(1989))中和细菌中(Hunteret al,Biochemistry,24,4148-4155)从单碳碳源生产甘油。这些生物体能同化氧化状态在甲烷和甲酸之间的单碳化合物并产生甘油。碳同化的途径可以是通过核酮糖单磷酸途径,通过丝氨酸途径或通过木酮糖单磷酸途径(Gottschalk,Bacterial Metabolism,SecondEdition,Springer-Verlag:New York(1986))。核酮糖单磷酸途径需要缩合甲酸和核酮糖-5-磷酸形成6碳糖,6碳糖转化为果糖并最终成为3碳产物甘油醛-3-磷酸。类似地,丝氨酸途径将单碳化合物通过亚甲基四羟基叶酸同化进入糖酵解途径。
除了利用单碳或二碳底物,已知甲基营养生物体还利用许多其它含碳化合物如甲胺,葡萄糖胺和许多氨基酸进行代谢活动。例如,已知甲基营养酵母利用甲胺的碳形成海藻糖或甘油(Bellion et al.,Micro.Growth Cl Compd.,[Int.Symp.]7th(1993),415-32.Editor(s):Murrell,J.Collin;Kelley,Don p.Publisher:Intercept,Andover,UK)。类似地,几种假丝酵母的种能代谢丙氨酸或油酸(Sulter et al.,Arch.Microbiol.,153(5),485-9(1990))。因此,本发明中所利用的碳的来源可以包括许多含碳底物并且仅仅受宿主组织的需要的限制。
尽管认为所有上述的碳源底物及它们的混合物都适用于本发明,优选的底物是甘油,二羟基丙酮,单糖,寡糖,多糖,和单碳底物。更为优选的是如葡萄糖、果糖、蔗糖这样的糖类和单碳底物如甲醇和二氧化碳。最为优选的是蔗糖。
除了适当的碳源外,发酵培养基还必须含有适当的矿物质,盐,辅酶,缓冲剂和适于培养物的生长以及促进甘油产生所需要的酶途径的其它组分,这些是本领域的技术熟练人员所已知的。尤其值得注意的是Co(Ⅱ)盐和辅酶B12前体。例如,大肠杆菌和真核细胞不能从头合成辅酶B12,但能利用辅酶B12前体。优选的辅酶B12前体是氰钴氨素和羟基钴氨素。宿主细胞内辅酶B12的量在摩尔浓度上大约等于脱水酶的量是赫赫需要的。培养条件通常,细胞在适当的培养基中在30℃生长。本发明中优选的培养基通常为商业上已经制备好的培养基如Luria Bertani(LB)肉汤培养基,Sabouraud Dextrose(SD)肉汤培养基或酵母麦芽抽提物(YM)肉汤培养基。也可使用其它描述的或合成的培养基,特定微生物生长的适当培养基对于在微生物或发酵科学中的技术熟练人员是已知的。已知的直接或间接调节分解代谢抑制作用的制剂,例如,环腺苷3’∶5’-单磷酸,也可被加入到反应培养基中。类似地,也可以联合使用已知调节酶活性增强甘油的产生的制剂(例如,亚硫酸盐,亚硫酸氢盐和碱)以及基因操作,或作为基因操作的替代手段。
适当的发酵pH范围是在pH5.0至pH9.0之间,而pH6.0至pH8.0是初始条件的优选范围。
反应可以在需氧或厌氧的条件下进行,其中厌氧或微厌氧的条件是优选的。发酵本发明的实践可以用批量方式,进料批量方式(Fed-Batch),或连续过程发方式,或任何适当的已知发酵方式进行。进而,认为细胞可被固定到底物上作为全细胞催化剂并在发酵条件下进行1,3-丙二醇的生产。
此处示例的本方法为发酵的批量方法。一种经典的批量方法是密闭的系统,其中培养基的成分在发酵起始时是固定的并且在发酵过程中不进行人工改变。这样,在发酵的开始时用所需的一种或几种生物体接种培养基并且允许发酵进行,并且不向系统添加任何东西。然而,通常批量发酵的“批量”是相对于碳源的添加而言的,并且经常尝试调节控制因子如pH和氧浓度。批量系统中的代谢物和生物数量组分经常改变,直至发酵停止。在批量系统中培养细胞经过静态延迟期到高生长的对数生长期并最终到静止期,在静止期中生长速度减慢或停止。如果不进行处理,静止期的细胞将最终死亡。对数生长期的细胞通常负责生产终产物或中间产物。
标准批量系统的一种变化是进料-批量发酵系统,该系统也适用于本发明。在这种经典批量系统的变型中底物随着发酵过程的发展而添加。当代谢产物抑制易于抑制细胞的代谢以及需要限制培养基中底物的数量时进料-批量系统是有用的。测量进料-批量系统中真正的底物浓度是困难的,因此是在可测量因素如pH,溶解氧和废气如CO2的分压的基础上经常估计的。批量和进料批量发酵在本领域中是常用并且众所周知的,例子可参见Brock.上文。
该方法也适用于连续发酵方法。连续发酵是开发系统其中给定的发酵培养基被连续添加到生物反应器中并同时取出等量培养基进行处理。连续发酵通常维持着高密度的培养物,其中细胞主要处于对数期生长。
连续发酵允许调节影响细胞生长或终产物浓度的一个因素或任何数量的因素。例如,一种方法将按照固定的水平维持有限的营养如碳源或氮水平并使所有其它参数处于适中的水平。在其它系统中影响生长的因素的数量可以被连续地改变而通过培养基混浊度测量得到的细胞浓度保持恒定。连续系统努力维持恒定生长状态,因此由于培养基的取出而导致的细胞损失必须和发酵中细胞的增长速率保持平衡。连续发酵方法中调节营养和生长因素的方法以及使产物形成速率最大化的技术在工业微生物的领域中是广为人知的。许多方法在Brock,上文中有详细描述。1,3-丙二醇的鉴定和纯化从发酵培养基中纯化1,3-丙二醇的方法是已知的。例如,例如通过将反应混合物用有机溶剂进行抽提,蒸馏和柱层析(US5,356,812)。对于此方法特别好的有机溶剂是环己烷(US5,008,473)。
可以通过将培养基直接进行高压液相色谱(HPLC)分析以鉴定1,3-丙二醇。在本发明的一种优选的方法中发酵培养基在分析型离子交换柱上用0.01N硫酸作为流动相以等度洗脱的方式进行。
本发明将在随后的实施例中被进一步定义。应当理解这些实施例在说明本发明的优选实施方案的同时仅仅是以举例说明的方式给出的。从以上的讨论和这些实施例,本领域中技术熟练的人员将确认本发明的本质特征,并且能在不偏离本发明的精神和范围的前提下进行本发明各种变化和修正以使之适用于各种用途和条件。
实施例一般方法磷酸化、连接和转化的方法在本领域中是众所周知的。适用于以下实施例的技术可在Sambrook,J.et al.,Molecular Cloning:ALaboratory Manual,Second Edition,Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY(1989)中找到。
适用于维持和生长细菌培养物的材料和方法在本领域中是众所周知的。适用于以下实施例的技术可在Manual of Methods for GeneralBacteriology(Philipp Gerhardt,R.G.E.Murray,Ralph N.Costilow,Eugene W.Nester,Willis A.Wood,Noel R.Krieg andG,.Briggs Phillips,eds),American Society for Microbiology,Washington,DC.(1994)或Thomas D.Brock in Biotechnology:ATextbook of Industrial Microbiology,Second Edition,SinauerAssociate,Inc.,Sunderland,MA(1989)中找到。除非特别说明,所有用于细菌细胞的维持和生长的试剂和材料都可从AldrichChemicals(Milwaukee,WI),DIFCO Laboratories(Detroit,MI),GIBCO/BRL(Gaithersburg,MD),或Sigma Chemical Company(St.Louis,MO)得到。
缩写的含义如下“h”的意思是小时,“min”的意思是分钟,“sec”的意思是秒,“d”的意思是天,“mL”的意思是毫升,“L”的意思是升。
1,3-丙二醇的分离和鉴定甘油向1,3-丙二醇的转化是通过HPLC监测的。进行分析所用的常规技术和材料对于层析领域中的技术熟练人员都是可以得到的。一种适用的方法使用了Water Maxima 820 HPLC system用UV(210nm)和RI进行检测。样品被注射入配备了Shodex SH-1011P precolumn(6mm×50mm)的Shodex SH-1011层析柱(8mm×300mm,购自Waters,Milford,MA)中,温度控制在50℃,用0.01N H2SO4作为流动相,流速0.5mL/min。当需要定量分析时以三甲基作为外标。通常,甘油(RI检测),1,3-丙二醇(RI检测)和三甲基乙酸(UV和RI检测)的持留时间分别为20.67min,26.08min和35.03min。
1,3-丙二醇的生产通过GC/MS确认。分析用的常规技术和材料对于GC/MS中的技术熟练人员都是可以得到的。一种适用的方法使用了连接到Hewlett Packard 5971 Series mass selective detector(EI)和HP-INNOWax层析柱(长30m,i.d.0.25mm,膜厚0.25微米)上的Hewlett Packard 5890 SeriesⅡ气相色谱。将产生的1,3-丙二醇的持留时间和质谱与真正的1,3-丙二醇的进行比较(m/e:57,58)。
GC/MS的一种替代方法需要对样品进行衍生化.在1.0mL的样品(例如培养上清)中加入30μL浓缩的高氯酸(70%v/v)。混合后样品被冷冻并冰冻干燥。往冻干物质中加入1∶1混合的二(三甲基硅氧烷基)三氟乙酰胺∶吡啶,剧烈混合并置于65℃1h.通过离心沉淀不溶解物质使样品澄清。得到的液体分成两相,上相用于分析。样品在DB-5层析柱(48m,0.25 I.D.,膜厚0.25μM,购自J&W Scientific)上进行层析,将从培养物上清得到的1,3-丙二醇衍生物的持留时间和质谱与从真正的标准得到的衍生物的进行比较。TMS衍生化的1,3-丙二醇含有的特征离子为205,177,130和115AMU。维生素或辅酶B12的鉴定将无细胞样品进行HPLC以定量辅酶B12和氰钴氨素。钴氨素的定量首先将278nm和261nm的峰面积比与标准的峰面积比进行比较,然后将峰面积对应于钴氨素的标准曲线。HPLC方法层析柱 Suelcosil LC-18-DB,25cm×4.6mm(Supelco,Inc.,Bellefonte,PA)Supelcosil LC-18-DB Precolumn kit层析柱温度 环境温度样品室 黑暗,5℃检测254nm,和360nm注射体积25μL流动相A 8.95g乙酸钠.3H2O5.88mL 1.0M四丁基季铵盐氢氧化物(TBAH)4L MQ H2O冰醋酸调pH至4.6加入210mL流动相B(见下文)流动相B 4LMeOH5.88mL TBAH0.89ml冰醋酸梯度
编码甘油脱水酶基因(dhaB)以及编码1,3-丙二醇氧化还原酶(dhaT)基因的分离和克隆dhaB和dhaT的鉴定和分离方法基本上按照US5,686,276进行,US5,686,276在此引入作为参考。在本发明中粘粒载体粘粒转化方法被用于从已知含有能将甘油加工成1,3-丙二醇的基因的细菌中克隆大片段染色体组DNA。特别是,用本领域中众所周知的方法分离了源自肺炎克雷伯氏菌ATCC 25955的基因组DNA并用限制性内切酶Sau3A消化以插入粘粒载体Supercos1并用GigapackⅡ包装抽提物包装。构建后用用带有粘粒DNA的载体转化了数字大肠杆菌XL1-Blue MR细胞。通过使转化子在含甘油的情况下生长并且分析培养基中1,3-丙二醇的形成,从而筛选转化子将甘油转化为1,3-丙二醇的能力。
分析了两个1,3-丙二醇阳性转化子,并且它们的粘粒分别被命名为pKP1和pKP2。DNA测序表明和源自弗氏柠檬酸杆菌的甘油脱水酶基因(dhaB)具有很高的同源性,表明这些转化子含有表明甘油脱水酶的基因。
源自pKP1的一个12.1kb的EcoRⅠ-SalⅠ片段被亚克隆到pIBl31(IBI Biosystem,New Havn,CN),并测序和命名为pHK28-26(SEQ ID NO:10)。测序结果揭示了dha操纵子编码甘油脱水酶以及调节所必需的基因相关的开放阅读框的位点.参见SEQ ID NO:10,dhaK(编码二羟基丙酮激酶)开放阅读框一个片段被发现位于碱基1-399;dhaD(编码甘油脱水酶)的开放阅读框被发现位于碱基983-2107;dhaR(编码抑制蛋白)的开放阅读框被发现位于碱基2209-4134;开放阅读框dhaT(编码1,3-丙二醇氧化还原酶)被发现位于5017-6180;开放阅读框dhaB1(编码甘油脱水酶α亚基)被发现位于碱基744-8711;开放阅读框dhaB2(编码甘油脱水酶β亚基)被发现位于8724-9308;开放阅读框dhaB3(编码甘油脱水酶γ亚基)被发现位于9311-9736;开放阅读框dhaBX(编码功能未知的蛋白)被发现位于9749-11572。此外,开放阅读框orfY(编码功能未知蛋白)被发现位于6202-6630;开放阅读框orfX(编码功能未知蛋白)被发现位于4643-4996;开放阅读框orfW(编码功能未知蛋白)被发现位于4112-4642。用于转化大肠杆菌的常用目的质粒的构建表达载体pTacIQ的构建大肠杆菌表达载体pTacIQ是通过将lacIq基因(Farabaugh,(1978),Nature274(5673)765-769)和tac启动子(Amann et al.,(19830,Gene 25,167-178)插入到pBR322(Sutcliffe,(1979),ColdSpring Harb.Symp.Quant.Biol.43,77-90)的限制性内切酶位点EcoRⅠ而构建的。一个多克隆位点和终止子序列取代了pBR322从EcoRⅠ到SphⅠ的序列。
甘油脱水酶基因(dhaB1,3,3,X)的亚克隆利用在5’端带有EcoRⅠ位点和3’端带有XbaⅠ位点的引物(SEQ IDNO:12和SEQ ID NO:13)通过PCR从pHK28-26中克隆了dhaB3基因的开放阅读框。产物被亚克隆到pLitmus29(New England Biolab,Inc.,Beverly,MA)中以产生含有dhaB3基因的质粒pDHAB3。
用限制性内切酶KpnⅠ和EcoRⅠ将含有dhaB操纵子的dhaB1,dhaB2,dhaB3和dhaBX全部编码区域的区域克隆到pBluescriptIIKS-+(Stragagene,La Jolla,CA)中以建立质粒pM7。
通过用ApaⅠ和XbaⅠ消化质粒pM7除去了dhaBX基因,纯化5.9kb的片段并连接到源自质粒pDHAB3的325-bp ApaⅠ-XbaⅠ片段以建立含有dhaB1,dhaB2和dhaB3的pM11。
利用在5’端带有HindⅢ位点和共有核糖体结合位点(consensusribosome binding site),3’端带有XbaⅠ位点的引物(SEQ ID NO:14和SEQ ID NO:15)通过PCR从pHK28-26扩增了dhaB1基因的开放阅读框。扩增产物被亚克隆到pLitmus28(New England Biolab Inc.)中以产生含dhaB1的质粒pDT1。
含有一部分dhaB1基因的NotⅠ-XbaⅠ片段和dhaB2基因以及dhaB3基因被插入到pDT1以产生dhaB表达质粒,pDT2。pDT2的含有dhaB(1,2,3)基因的HindⅢ-XbaⅠ片段被插入到pTacIQ中以建立pDT3。
1,3-丙二醇脱水酶基因(dhaT)的亚克隆pHK-28-26的KpnⅠ-SacⅠ片段,含有1,3-丙二醇脱水酶(dhaT),被亚克隆到pBluescriptⅡKS+中以建立质粒pAH1。
利用pAH1作为模板DNA和在5端带有XbaⅠ位点,3’端带有BamHⅠ位点的合成引物(SEQ ID NO:16,SEQ ID NO:17)通过PCR扩增了dhaT基因。上述产物被亚克隆到pCR-Script(Stratagene)的SrfⅠ位点以产生含有dhaT的质粒pAH4和pAH5。质粒pAH4在正向含有dhaT基因以在pCR-Script中从lac启动子表达,pAH5在反向含有dhaT基因。源自pAH4的含有dhaT基因的XbaⅠ-BamHⅠ片段被插入到pTacIQ中以产生质粒pAH8。源自质粒pAH8的含有RBS和dhaT基因的HindⅢ-BamHⅠ片段被插入到pBluescriptⅡKS+以建立pAH11。构建dhaT和dhaB(1,2,3)表达盒利用常规分子生物学方法从先前描述的单独的dhaB(1,2,3)和dhaT亚克隆装配了dhaT和dhaB(1,2,3)的表达盒。源自pDT3的含有dhaB(1,2,3)的SpeⅠ-SacⅠ片段被插入到pAH11的SpeⅠ-SacⅠ位点以建立pAH24。SalⅠ-XbaⅠ连接序列(SEQ ID NO:22和SEQ ID NO:23)被插入到用限制性内切酶SalⅠ-XbaⅠ消化了的pAH5中以建立pDT16。该连接序列破坏了XbaⅠ位点。然后源自pDT16的1kb的SalⅠ-MluⅠ片段被插入到pAH24中取代存在的SalⅠ-NotⅠ片段以建立pDT18,并且源自pM7的NotⅠ-XbaⅠ片段被插入到pCL1920(SEQ ID NO:24)。源自Streptomyces的葡萄糖异构酶启动子序列(SEQ ID NO:25)通过PCR被克隆并插入到pLitmus28的EcoRⅠ-HindⅢ位点以构建pDT5。通过将pDT5的EcoRⅠ-PvuⅡ片段插入到pCL1920的EcoRⅠ-PvuⅡ位点构建了pCL1925质粒。通过将pDT21的HindⅢ-MluⅡ片段以及pDT21的MluⅠ-XbaⅠ片段克隆到pCL1925的HindⅢ-XbaⅠ位点构建了pDT24质粒。
实施例1B12转运基因表达盒的构建构建了B12转运基因,btuB,btuC,btuD和btuE的可作为复制元件存在的表达质粒。所有的表达质粒都用trc启动子进行转录。每个质粒还含有用于在含氨苄青霉素的培养基中筛选大肠杆菌的β-内酰胺酶的基因,或用于在含氯霉素的培养基中进行筛选的氯霉素乙酰基转移酶基因。质粒的复制起始点为ColE或p15A。
用在5’端添加了NcoⅠ位点和在3’端添加了BamHⅠ的引物(SEQIDNO18及SEQ ID NO:19)通过PCR从大肠杆菌染色体DNA扩增了btuB基因。反应混合物含有10mM Tris,pH8.3,50mM KCl,1.5mM MgCl2,0.0001%明胶,200μM dATP,200μM dCTP,200μM dGTP,200μM dTTP,1μM各种引物,1-10ng靶DNA,25单位/mL AmplitaqTMDNA聚合酶(Perkin-Elmer Cetus,Norwalk CT)。PCR参数是94℃1min,52℃1min,72℃2min,25循环。在质粒pTrc99A(Pharmacia,Piscataway,NJ)的NcoⅠ位点和BamHⅠ位点之间克隆了1905bp的PCR产物以产生质粒pBtuB1。质粒pBtuB1基因复制起始点ColE1,氨苄青霉素抗性,lacIq基因,btuB从Ptrc开始表达。
为了构建质粒pBtuB2,从pBtuB1取出编码lacIq,Ptrc和btuB的SphⅠ/BamHⅠ片段并克隆到质粒pACYC184的SphⅠ/BamHⅠ位点。质粒pBtuB2具有复制起点p15A,氯霉素抗性和lacIq基因,并且btuB从PtrC开始表达。
利用在5’端添加了BamHⅠ位点和在3’端添加了HindⅢ的引物(SEQID NO:20及SEQ ID NO:219)通过PCR从大肠杆菌染色体DNA扩增了btuCED基因。其2557bp的PCR产物被克隆到质粒pACYC184的BamHⅠ和HindHⅢ位点以产生质粒pCED。质粒pCED基因复制起点p15A,和氯霉素抗性基因。
为了构建质粒pBCED,从pBtuB1取出编码lacIq,Ptrc和btuB的SphⅠ/BamHⅠ片段并克隆到质粒pCED的SphⅠ/BamHⅠ位点。质粒pBtuB2从trc启动子的下游开始依次具有复制起点p15A,氯霉素抗性,lacIq基因,和btu基因。
实施例2具有B12转运基因和DhaB活性的转化子用dha质粒pDT24(specR),btuB质粒pBtuB1(ampR)或pBtuB2(chlR),或btuBCED质粒pBCED(chlR)转化大肠杆菌菌株FM5。筛选是在含50mg/ml壮观霉素,50mg/ml氨苄青霉素或50mg/ml氯霉素的LB平板上进行的。抗适当抗生素的菌落被用于1,3-丙二醇生产和维生素B12摄取。
实施例3在转化了pBCED的FM5中辅酶B12的摄取提高在含有25mL培养基(培养基用NH4OH滴定至pH6.8,含有0.2MKH2OH,2.0g/L柠檬酸,2.0g/L mgSO4·7H2O,1.2mL98%H2SO4,0.3g/L柠檬酸铵铁,0.2g/L CaCl2·2H2O,5mL痕量金属混合物,5g/L酵母抽提物,10g/LD-葡萄糖,和适当的抗生素。痕量金属混合物含有(g/L):Na2SO4(4.0),MnSO4·H2O(0.80),ZnSO4·7H2O(1.6),CoSO4(0.52),CuSO4·7H2O(0.12)和FeSO4·7H2O(4.0))的250ml三角烧瓶中37℃过夜生长适当的菌株,转速250rpm。用25mlM9培养基稀释过夜培养物(1/100)并继续生长直至达到OD660~1.0。当加入IPTG时,在此时间点将IPTG浓度添加至0.2mM并继续培养1hr。
在该浓度往M9培养物中加入氰钴氨素(氰钴氨素,CNCbl)或辅酶B12。所有涉及辅酶B12的操作都在暗处进行(红光)。加入钴氨素后立即取出1ml样品并沉淀细胞。然后继续在250rpm的转速下培养直至取出如下表1和表所列出的终点样品。
每1mL无细胞上清样品进行HPLC以定量钴氨素。钴氨素的定量首先将278nm和261nm的峰面积比与标准的峰面积比进行比较,然后将峰面积对应于钴氨素的标准曲线。
终点分析涉及从培养基中分离细胞,然后从细胞质中分离周质腔。方法基本上按照Kaback(Methods of Enzymology,vol.22,pg.99,1971)。
回收的细胞沉淀称重,用10mM Tris,pH8.0洗两次。沉淀用1g/80mL30mM Tris,pH8.0/20%蔗糖从悬浮。在磁力搅拌板上搅拌时加入EDTA至10mM,溶菌酶至0.5mg/ml。这些悬浮液在室温搅拌30min。溶菌酶/EDTA温育后细胞结块并且如预期的那样沉淀。每份悬浮液在15K rpm4℃沉淀20min。收集由稀释的质周腔组成的上清,记录体积并将样品进行HPLC分析。
回收的原生质体沉淀用3ml 50mM磷酸钾缓冲液pH7.0在组织匀浆器中匀浆。匀浆后加入DNase和RNase至5mg/ml,并且悬浮液在37℃水浴中温育。加入EDTA至10mM,继续温育15min。加入MgSO4至15mM,继续温育15min。
得到的悬浮液在4℃39K超速离心1小时。收集由稀释的细胞质组成的上清,记录体积,将样品继续HPLC分析。
根据假设1μg细胞(湿重)等于1,000,000细胞,细胞的体积是9×10-13mL,质周腔的体积为总细胞体积的30%计算质周腔和细胞质中的钴氨素浓度。
表1pBtuB1A对菌株FM5摄取5μM氰钴氨素的影响
表2pBCED对菌株FM5摄取10μM辅酶B12的影响
实施例4转化了pBCED的FM5/pDT24中1,3-丙二醇的产生提高在含有25mL培养基的250ml三角烧瓶中30℃避光过夜培养大肠杆菌菌株FM5/pDT24和FM5/pDT4/pBCED,转速250rpm。培养基用NH4OH滴定至pH6.8,含有0.2M KH2OH,2.0g/L柠檬酸,2.0g/L MgSO4·7H2O,1.2mL98%H2SO4,0.3g/L柠檬酸铵铁,0.2g/L CaCl2·2H2O,5mL痕量金属混合物,5g/L酵母抽提物,10g/LD-葡萄糖,和适当的抗生素。痕量金属混合物含有(g/L):Na2SO4(4.0),MnSO4·H2O(0.80),ZnSO4·7H2O(1.6),CoSO4(0.52),CuSO4·7H2O(0.12)和FeSO4·7H2O(4.0)。此外,pDT24和pBCED分别需要50μg/ml壮观霉素和20μg/ml氯霉素。
FM5/pDT24和FM5/pDT4/pBCED在如上文所描述的条件下加上氰钴氨素,羟基钴氨素(羟基B12)或辅酶B12至终浓度0.40μM或4.0μM。烧瓶中接种至起始OD600约0.01AU,通过加入0.5N KOH将pH保持在6.2以上,通过加入50%(W/W)将葡萄糖浓度保持在2g/L以上。PH用ColorpHast strips(EM Science,Gibbstown,NJ)检测。葡萄糖浓度用Trinder enzymatic assay(Sigma,St.Louis,MO)检测。在不同的时间取出小样以确定3G浓度(hplc分析)和细胞密度(OD600)。结果在以下的表3和4出示。
表3在0.4μM维生素,羟基,和辅酶B12存在的条件下DBCED对1,3-丙二醇生产的影响
表4在4.0μM维生素,羟基,和辅酶B12存在的条件下pBCED对1,3-丙二醇生产的影响
序列表(1)一般信息(ⅰ)申请人(A)通信人E.I.DUPONT DE NEMOURS AND COMPANY(B)街道10007 MARKET STREET(C)城市WILMINGTON(D)州特拉华(E)国家美国(F)邮编19898(G)电话302-892-8112(H)传真302-773-0164(I)电传6717325(A)地址GenenCOR.International,Inc.
(B)街道925 Page Mill Road(C)城市Palo Alto(D)州加利福尼亚(E)国家美国(F)邮编94304-1013(ⅱ)发明标题用含有维生素B12转运基因的重组生物体生产1,3-丙二醇的方法(ⅲ)序列数25(ⅳ)计算机可读形式(A)介质类型软盘,3.5英寸(B)计算机IBM PC计算机(C)操作系统微软视窗97(D)软件微软OFFICE97(ⅴ)目前的申请数据(A)申请号(B)归档日期(C)分类(ⅵ)优先的申请数据(A)申请号60/085,190
(B)归档日期1998年6月30号(C)分类(ⅶ)律师/代理人信息(A)名称FLOYD,LINDA AXAMETHY(B)注册号33,692(C)参考/文档号CL-1245-A(2)SEQ ID NO:1的信息(ⅰ)序列特征(A)长度1845碱基对(B)类型核酸(C)链双链(D)拓扑性质线性(ⅱ)分子类型DNA(基因组)(ⅲ)是否假设否(ⅳ)是否反义否(ⅹⅰ)序列描述SEQ ID NO:1ATGATTAAAA AAGCTTCCCT GCTGACGGCG TGTTCCGTCA CGGCATTTTC CGCTTGGGCA60CAGGATACCA GCCCGGATAC TCTCGTCGTT ACTGCTAACC GTTTTGAACA GCCGCGCAGC 120ACTGTGCTTG CACCAACCAC CGTTGTGACC CGTCAGGATA TCGACCGCTG GCAGTCGACC 180TCGGTCAATG ATGTGCTGCG CCGTCTTCCG GGCGTCGATA TCACCCAAAA CGGCGGTTCA 240GGTCAGCTCT CATCTATTTT TATTCGCGGT ACAAATGCCA GTCATGTGTT GGTGTTAATT 300GATGGCGTAC GCCTGAATCT GGCGGGGGTG AGTGGTTCTG CCGACCTTAG CCAGTTCCCT 360ATTGCGCTTG TCCAGCGTGT TGAATATATC CGTGGGCCGC GCTCCGCTGT TTATGGTTCC 420GATGCAATAG GCGGGGTGGT GAATATCATC ACGACGCGCG ATGAACCCGG AACGGAAATT 480TCAGGAGGGT GGGGAAGCAA TAGTTATCAG AACTATGATG TCTCTACGCA GCAACAACTG 540GGGGATAAGA CACGGGTAAC GCTGTTGGGC GATTATGCCC ATACTCATGG TTATGATGTT 600GTTGCCTATG GTAATACCGG AACGCAAGCG CAGACAGATA ACGATGGTTT TTTAAGTAAA 660ACGCTTTATG GCGCGCTGGA GCATAACTTT ACTGATGCCT GGAGCGGCTT TGTGCGCGGC 720TATGGCTATG ATAACCGTAC CAATTATGAC GCGTATTATT CTCCCGGTTC ACCGTTGCTC 780GATACCCGTA AACTCTATAG CCAAAGTTGG GACGCCGGGC TGCGCTATAA CGGCGAACTG 840ATTAAATCAC AACTCATTAC CAGCTATAGC CATAGCAAAG ATTACAACTA CGATCCCCAT 900TATGGTCGTT ATGATTCGTC GGCGACGCTC GATGAGATGA AGCAATACAC CGTCCAGTGG 960GCAAACAATG TCATCGTTGG TCACGGTAGT ATTGGTGCGG GTGTCGACTG GCAGAAACAG 1020ACTACGACGC CGGGTACAGG TTATGTTGAG GATGGATATG ATCAACGTAA TACCGGCATC 1080TATCTGACCG GGCTGCAACA AGTCGGCGAT TTTACCTTTG AAGGCGCCAG ACGCAGTGAC 1140GATAACTCAC AGTTTGGTCG TCATGGAACC TGGCAAACCA GCGCCGGTTG GGAATTCATC 1200GAAGGTTATC GCTTCATTGC TTCCTACGGG ACATCTTATA AGGCACCAAA TCTGGGGCAA 1260CTGTATGGCT TCTACGGAAA TCCGAATCTG GACCCGGAGA AAAGCAAACA GTGGGAAGGC 1320GCGTTTGAAG GCTTAACCGC TGGGGTGAAC TGGCGTATTT CCGGATATCG TAACGATGTC 1380AGTGACTTGA TCGATTATGA TGATCACACC CTGAAATATT ACAACGAAGG GAAAGCGCGG 1440ATTAAGGGCG TCGAGGCGAC CGCCAATTTT GATACCGGAC CACTGACGCA TACTGTGAGT 1500TATGATTATG TCGATGCGCG CAATGCGATT ACCGACACGC CGTTGTTACG CCGTGCTAAA 1560CAGCAGGTGA AATACCAGCT CGACTGGCAG TTGTATGACT TCGACTGGGG TATTACTTAT 1620CAGTATTTAG GCACTCGCTA TGATAAGGAT TACTCATCTT ATCCTTATCA AACCGTTAAA 1680ATGGGCGGTG TGAGCTTGTG GGATCTTGCG GTTGCGTATC CGGTCACCTC TCACCTGACA 1740GTTCGTGGTA AAATAGCCAA CCTGTTCGAC AAAGATTATG AGACAGTCTA TGGCTACCAA 1800ACTGCAGGAC GGGAATACAC CTTGTCTGGC AGCTACACCT TCTGA 1845(2)SEQ ID NO:2的信息(ⅰ)序列特征(A)长度1844碱基对(B)类型核酸(C)链双链(D)拓扑性质线性(ⅱ)分子类型DNA(基因组)(ⅲ)是否假设否(ⅳ)是否反义否
(ⅹⅰ)序列描述SEQ ID NO:2ATGATTAAAA AAGCTACGCT GCTGACGGCG TTCTCCGTCA CGGCCTTTTC CGCTTGGGCG60CAGGACACTA GCCCGGATAC CCTGGTTGTC ACCGCCAACC GTTTTCAGCA GCCGCGCAGC 120GCGGTTCTGG CGCCCGTTAC CATCGTGACG CGTCAGGATA TTGAACGCTG GCAATCGACC 180TCCGTAAATG ATGTTCTGCG CCGTTTGCCT GGCGTCGATA TTGCGCAGAG CGGCGGCGCG 240CGACAAAACT CCTCCATTTT CATTCGCGGC ACCAACTCCA GCCATGTACT GGTATTGATT 300GACGGCGTGC GTCTGAATTT AGCAGGCGTG AGCGGGTCCG CCGATCTCAG CCAGTTCCCG 360GTGTCGCTGG TACAGCGTAT TGAATATATA CGCGGTCCGC CCTCCGCTAT TTATGGTTCC 420GATGCTATCG GCGGCGTAGT GAATATCATT ACGACGCGCG ATAACCCAGG CACAGAATTA 480ACCGCTGGAT GGGGAAGCAA TAGCTACCAG AATTACGACA TCTCGACGCA ACAGCAACTT 540GGCGAAATCA CGCGGGCGAC GTTGATCGGC GATTACGAAT ACACCAAAGG GTTTGACGTG 600GTAGCGAAAG GCGGTACCGG GATGCAGGCG CAGCCTGACC GGGACGGCTT TTTGAGTAAA 660ACGCTTTATG GCGCGTTAGA GCATACCTTT TCTGATCGCT GGAGCGGATT CGTGCGTGGT 720TATGGCTACG ATAACCGTAC CGATTACGAC GCCTATTACT CGCCGGGCTC GCCGCTGATT 780GATACACGCA AACTTTATAG CCAAAGCTGG GACGCCGGGC TGCACTTTAA TGGCGAAAGT 840ATTCAGTCTC AGCTGGTTTC AAGCTATAGC CACAGTAAAG ATTACAACTA TGATCCGCAC 900TATGGCCGGT ATGATACCTC CGCCACGCTG GATGAGATGA AACAGTACAA TGTTCAATGG 960ACCAACAGTG TGGTCGTGGG GACGGTAATG TTGGGGCGGG CGTAGACTGG CAGAAACAGA 1020CTACCACGCC AGGTACCGGC TATGTGCCCG AGGGATATGA CCAGCGTAAT ACCGGGGTTT 1080ACCTGACAGG ATTACAACAG TTGGGTGACT TCACTCTGGA AGCGGCGGCG CGCAGTGATG 1140ACAACTCCCA GTTTGGTCGT CATGGTACAT GGCAAACCAG CGCGGGATGG GAGTTTATAG 1200AAGGTTATCG CTTTATTGCC TCCTACGGAA CCTCCTACAA AGCGCCTAAT TTGGGCCAAC 1260TGTATGGTTA TTACGGTAAT CCGAACCTGA ATCCTGAAAA GAGTAAACAG TGGGAAGGCG 1320CATTTGAAGG GCTAACCGCT GGCGTCAGCT GGCGTATTTC AGGTTATCGT AACGATATTA 1380ATGACATGAT CGATTATGAC GATCATCTGC AAAAATATTA CAACGAAGGT AAGGCGCGCA 1440TTAAAGGTAT TGAGGCGACG GCGAATTTCG ATACCGGACC GTTAACGCAT ACGGTCAGTT 1500ATGATTACGT TGATGCGCGT AATGCGATTA CCGATACGCC ATTACCCCGG CGTTCCAAAC 1560AGATGGCAAA ATATCAACTT GACTGGGACG TTTACGATTT TGACTGGGGG ATGACATATC 1620AATACCTTGG TTCCCGCTAT GATTCGGATT ACTCCGCTTA CCCATACCGG ACAGTAAAAA 1680TGGGCGGCGT CAGTTTATGG GATCTTACGG TTGCATATCC GGTCACCTCA CATCTGACAG 1740TTCGTGGTAA AATAGCCAAC CTGTTCGACA AAGATTACGA GACAGTTTAT GGCTACCAAA 1800CTGCAGGACG AGAATACACC TTGTCTGGCA GCTACACCTT CTGA 1844(2)SEQ ID NO:3的信息(ⅰ)序列特征(A)长度981碱基对(B)类型核酸(C)链双链(D)拓扑性质线性(ⅱ)分子类型DNA(基因组)(ⅲ)是否假设否(ⅳ)是否反义否(ⅹⅰ)序列描述SEQ ID NO:3ATGCTGACAC TTGCCCGCCA ACAACAGCGA CAAAATATTC GCTGGTTATT ATGCCTGTCA60GTTTTGATGC TGCTGGCGCT TCTCTTAAGC CTTTGCGCCG GTGAACAATG GATCTCGCCA 120GGTGACTGGT TTACTCCTCG TGGCGAACTG TTCGTCTGGC AAATTCGCCT GCCACGTACG 180CTGGCTGTAT TGCTGGTTGG TGCGGCGCTG GCTATATCCG GCGCTGTAAT GCAGGCGTTG 240TTTGAAAATC CTCTGGCAGA ACCTGGACTA CTTGGCGTCT CTAACGGCGC AGGCGTGGGG 300CTTATCGCCG CGGTATTGCT TGGGCAAGGG CTAACTCCCA ACTGGGCGCT AGGGCTGTGT 360GCGATTCGTG GCGCGCTTAT CATCACTTTA ATACTCTTAC GTTTCGCCCG TCGTCATCTT 420TCGACCAGTC GGTTATTGCT GGCTGGCGTT GCATTAGGGA TTATCTGTAG CGCACTAATG 480ACGTGGGCTA TCTACTTTTC CACCTCAGTT GATTTGCGTC AGCTGATGTA CTGGATGATG 540GGCGGTTTTG GCGGCGTAGA CTGGCGGCAA AGCTGGCTGA TGCTGGCATT GATCCCCGTG 600TTGTTGTGGA TCTGTTGTCA GTCCAGGCCG ATGAATATGT TAGCACTTGG CGAGATCTCG 660GCGCGGCAAC TGGGTTTACC CCTGTGGTTC TGGCGCAATG TGCTGGTGGC AGCGACCGGC 720TGGATGGTTG GCGTCAGTGT GGCGCTGGCG GGTGCTATCG GCTTTATTGG TCTGGTGATC 780CCCCATATTC TCCGGTTGTG TGGTTTAACC GATCATCGCG TATTACTTCC CGGCTGCGCG 840CTGGCAGGGG CGAGCGCATT GCTGCTGGCC GATATTGTAG CGCGCCTGGC ATTAGCTGCC 900GCAGAGCTGC CTATTGGCGT GGTCACCGCA ACGTTAGGTG CGCCGGTGTT TATCTGGTTA 960TTGTTAAAAG CAGGACGTTA G 981(2)SEQ ID NO:4的信息(ⅰ)序列特征(A)长度750碱基对(B)类型核酸(C)链双链(D)拓扑性质线性(ⅱ)分子类型DNA(基因组)(ⅲ)是否假设否(ⅳ)是否反义否(ⅹⅰ)序列描述SEQ ID NO:4ATGTCTATTG TGATGCAGTT ACAAGATGTT GCGGAATCTA CCCGCCTGGG GCCGCTTTCT 60GGCGAGGTTC GGGCTGGGGA GATCCTGCAC CTGGTGGGGC CGAATGGCGC GGGTAAGAGT 120ACCTTACTGG CGCGAATGGC CGGAATGACC AGCGGTAAGG GAAGCATTCA GTTCGCGGGG 180CAACCACTGG AAGCATGGTC CGCAACAAAA CTCGCGCTGC ATCGCGCCTA TCTTTCACAA 240CAGCAGACGC CGCCGTTTGC AACGCCGGTC TGGCACTACC TGACACTGCA TCAGCACGAT 300AAAACGCGTA CCGAACTACT GAATGATGTC GCAGGGGCGC TGGCTCTTGA TGACAAACTC 360GGACGTAGCA CCAATCAACT TTCCGGCGGT GAATGGCAAC GCGTACGTCT TGCTGCGGTG 420GTGTTGCAAA TCACACCACA AGCCAATCCC GCAGGCCAAT TGCTGCTTCT TGATGAGCCG 480ATGAACAGTC TTGATGTTGC GCAACAAAGT GCGTTAGACA AAATTCTGAG CGCGCTGTGT 540CAGCAAGGAC TGGCGATTGT GATGAGCAGT CACGATCTCA ACCACACATT GCGTCATGCG 600CATCGGGCGT GGTTGCTAAA AGGTGGAAAA ATGCTGGCCA GTGGACGCAG GGAAGAGGTG 660CTCACGCCGC CAAATCTGGC GCAGGCCTAT GGGATGAATT TTCGCCGTCT GGATATCGAA 720GGTCACAGAA TGCTGATTTC GACCATCTGA 750(2)SEQ ID NO:5的信息(ⅰ)序列特征(A)长度552碱基对(B)类型核酸(C)链双链(D)拓扑性质线性(ⅱ)分子类型DNA(基因组)(ⅲ)是否假设否(ⅳ)是否反义否(ⅹⅰ)序列描述SEQ ID NO:5ATGCAAGATT CCATTCTGAC GACCGTAGTG AAAGATATCG ACGGTGAAGT GACCACGCTG60GAGAAGTTCG CCGGTAATGT GCTGTTGATT GTCAATGTCG CCTCAAAGTG TGGCTTAACG 120CCGCAATATG AGCAGTTGGA GAATATTCAG AAAGCCTGGG TCGATCGAGG TTTTATGGTG 180CTGGGATTCC CGTGCAACCA GTTTCTGGAA CAAGAACCGG GCAGCGATGA AGAGATTAAA 240ACTTACTGTA CCACCACATG GGGGGTGACG TTCCCGATGT TCAGTAAGAT TGAAGTTAAT 300GGCGAAGGAC GCCATCCGCT GTATCAAAAA TTGATTGCCG CAGCGCCGAC CGCAGTCGCG 360CCGGAAGAGA GCGGATTCTA TGCCCGTATG GTCAGCAAAG GCCGTGCACC GCTGTACCCG 420GATGATATTT TATGGAATTT TGAAAAATTC CTGGTTGGCA GGGACGGAAA AGTCATCCAG 480CGTTTTTCCC CGGATATGAC GCCGGAAGAT CCCATTGTGA TGGAAAGCAT TAAACTGGCG 540TTGGCAAAAT AA 552(2)SEQ ID NO:6的信息(ⅰ)序列特征(A)长度1668碱基对(B)类型核酸(C)链双链(D)拓扑性质线性(ⅱ)分子类型DNA(基因组)(ⅲ)是否假设否(ⅳ)是否反义否(ⅹⅰ)序列描述SEQ ID NO:6ATGAAAAGAT CAAAACGATT TGCAGTACTG GCCCAGCGCC CCGTCAATCA GGACGGGCTG60ATTGGCGAGT GGCCTGAAGA GGGGCTGATC GCCATGGACA GCCCCTTTGA CCCGGTCTCT 120TCAGTAAAAG TGGACAACGG TCTGATCGTC GAACTGGACG GCAAACGCCG GGACCAGTTT 180GACATGATCG ACCGATTTAT CGCCGATTAC GCGATCAACG TTGAGCGCAC AGAGCAGGCA 240ATGCGCCTGG AGGCGGTGGA AATAGCCCGT ATGCTGGTGG ATATTCACGT CAGCCGGGAG 300GAGATCATTG CCATCACTAC CGCCATCACG CCGGCCAAAG CGGTCGAGGT GATGGCGCAG 360ATGAACGTGG TGGAGATGAT GATGGCGCTG CAGAAGATGC GTGCCCGCCG GACCCCCTCC 420AACCAGTGCC ACGTCACCAA TCTCAAAGAT AATCCGGTGC AGATTGCCGC TGACGCCGCC 480GAGGCCGGGA TCCGCGGCTT CTCAGAACAG GAGACCACGG TCGGTATCGC GCGCTACGCG 540CCGTTTAACG CCCTGGCGCT GTTGGTCGGT TCGCAGTGCG GCCGCCCCGG CGTGTTGACG 600CAGTGCTCGG TGGAAGAGGC CACCGAGCTG GAGCTGGGCA TGCGTGGCTT AACCAGCTAC 660GCCGAGACGG TGTCGGTCTA CGGCACCGAA GCGGTATTTA CCGACGGCGA TGATACGCCG 720TGGTCAAAGG CGTTCCTCGC CTCGGCCTAC GCCTCCCGCG GGTTGAAAAT GCGCTACACC 780TCCGGCACCG GATCCGAAGC GCTGATGGGC TATTCGGAGA GCAAGTCGAT GCTCTACCTC 840GAATCGCGCT GCATCTTCAT TACTAAAGGC GCCGGGGTTC AGGGACTGCA AAACGGCGCG 900GTGAGCTGTA TCGGCATGAC CGGCGCTGTG CCGTCGGGCA TTCGGGCGGT GCTGGCGGAA 960AACCTGATCG CCTCTATGCT CGACCTCGAA GTGGCGTCCG CCAACGACCA GACTTTCTCC 1020CACTCGGATA TTCGCCGCAC CGCGCGCACC CTGATGCAGA TGCTGCCGGG CACCGACTTT 1080ATTTTCTCCG GCTACAGCGC GGTGCCGAAC TACGACAACA TGTTCGCCGG CTCGAACTTC 1140GATGCGGAAG ATTTTGATGA TTACAACATC CTGCAGCGTG ACCTGATGGT TGACGGCGGC 1200CTGCGTCCGG TGACCGAGGC GGAAACCATT GCCATTCGCC AGAAAGCGGC GCGGGCGATC 1260CAGGCGGTTT TCCGCGAGCT GGGGCTGCCG CCAATCGCCG ACGAGGAGGT GGAGGCCGCC 1320ACCTACGCGC ACGGCAGCAA CGAGATGCCG CCGCGTAACG TGGTGGAGGA TCTGAGTGCG 1380GTGGAAGAGA TGATGAAGCG CAACATCACC GGCCTCGATA TTGTCGGCGC GCTGAGCCGC 1440AGCGGCTTTG AGGATATCGC CAGCAATATT CTCAATATGC TGCGCCAGCG GGTCACCGGC 1500GATTACCTGC AGACCTCGGC CATTCTCGAT CGGCAGTTCG AGGTGGTGAG TGCGGTCAAC 1560GACATCAATG ACTATCAGGG GCCGGGCACC GGCTATCGCA TCTCTGCCGA ACGCTGGGCG 1620GAGATCAAAA ATATTCCGGG CGTGGTTCAG CCCGACACCA TTGAATAA 1668(2)SEQ ID NO:7的信息(ⅰ)序列特征(A)长度585碱基对(B)类型核酸(C)链双链(D)拓扑性质线性(ⅱ)分子类型DNA(基因组)(ⅲ)是否假设否(ⅳ)是否反义否(ⅹⅰ)序列描述SEQ ID NO:7GTGCAACAGA CAACCCAAAT TCAGCCCTCT TTTACCCTGA AAACCCGCGA GGGCGGGGTA60GCTTCTGCCG ATGAACGCGC CGATGAAGTG GTGATCGGCG TCGGCCCTGC CTTCGATAAA 120CACCAGCATC ACACTCTGAT CGATATGCCC CATGGCGCGA TCCTCAAAGA GCTGATTGCC 180GGGGTGGAAG AAGAGGGGCT TCACGCCCGG GTGGTGCGCA TTCTGCGCAC GTCCGACGTC 240TCCTTTATGG CCTGGGATGC GGCCAACCTG AGCGGCTCGG GGATCGGCAT CGGTATCCAG 300TCGAAGGGGA CCACGGTCAT CCATCAGCGC GATCTGCTGC CGCTCAGCAA CCTGGAGCTG 360TTCTCCCAGG CGCCGCTGCT GACGCTGGAG ACCTACCGGC AGATTGGCAA AAACGCTGCG 420CGCTATGCGC GCAAAGAGTC ACCTTCGCCG GTGCCGGTGG TGAACGATCA GATGGTGCGG 480CCGAAATTTA TGGCCAAAGC CGCGCTATTT CATATCAAAG AGACCAAACA TGTGGTGCAG 540GACGCCGAGC CCGTCACCCT GCACATCGAC TTAGTAAGGG AGTGA 585(2)SEQ ID NO:8的信息(ⅰ)序列特征(A)长度426碱基对(B)类型核酸(C)链双链(D)拓扑性质线性(ⅱ)分子类型DNA(基因组)(ⅲ)是否假设否(ⅳ)是否反义否
(ⅹⅰ)序列描述SEQ ID NO:8ATGAGCGAGA AAACCATGCG CGTGCAGGAT TATCCGTTAG CCACCCGCTG CCCGGAGCAT60ATCCTGACGC CTACCGGCAA ACCATTGACC GATATTACCC TCGAGAAGGT GCTCTCTGGC 120GAGGTGGGCC CGCAGGATGT GCGGATCTCC CGCCAGACCC TTGAGTACCA GGCGCAGATT 180GCCGAGCAGA TGCAGCGCCA TGCGGTGGCG CGCAATTTCC GCCGCGCGGC GGAGCTTATC 240GCCATTCCTG ACGAGCGCAT TCTGGCTATC TATAACGCGC TGCGCCCGTT CCGCTCCTCG 300CAGGCGGAGC TGCTGGCGAT CGCCGACGAG CTGGAGCACA CCTGGCATGC GACAGTGAAT 360GCCGCCTTTG TCCGGGAGTC GGCGGAAGTG TATCAGCAGC GGCATAAGCT GCGTAAAGGA 420AGCTAA 426(2)SEQ ID NO:9的信息(ⅰ)序列特征(A)长度1164碱基对(B)类型核酸(C)链双链(D)拓扑性质线性(ⅱ)分子类型DNA(基因组)(ⅲ)是否假设否(ⅳ)是否反义否(ⅹⅰ)序列描述SEQ ID NO:9ATGAGCTATC GTATGTTTGA TTATCTGGTG CCAAACGTTA ACTTTTTTGG CCCCAACGCC60ATTTCCGTAG TCGGCGAACG CTGCCAGCTG CTGGGGGGGA AAAAAGCCCT GCTGGTCACC 120GACAAAGGCC TGCGGGCAAT TAAAGATGGC GCGGTGGACA AAACCCTGCA TTATCTGCGG 180GAGGCCGGGA TCGAGGTGGC GATCTTTGAC GGCGTCGAGC CGAACCCGAA AGACACCAAC 240GTGCGCGACG GCCTCGCCGT GTTTCGCCGC GAACAGTGCG ACATCATCGT CACCGTGGGC 300GGCGGCAGCC CGCACGATTG CGGCAAAGGC ATCGGCATCG CCGCCACCCA TGAGGGCGAT 360CTGTACCAGT ATGCCGGAAT CGAGACCCTG ACCAACCCGC TGCCGCCTAT CGTCGCGGTC 420AATACCACCG CCGGCACCGC CAGCGAGGTC ACCCGCCACT GCGTCCTGAC CAACACCGAA 480ACCAAAGTGA AGTTTGTGAT CGTCAGCTGG CGCAAACTGC CGTCGGTCTC TATCAACGAT 540CCACTGCTGA TGATCGGTAA ACCGGCCGCC CTGACCGCGG CGACCGGGAT GGATGCCCTG 600ACCCACGCCG TAGAGGCCTA TATCTCCAAA GACGCTAACC CGGTGACGGA CGCCGCCGCC 660ATGCAGGCGA TCCGCCTCAT CGCCCGCAAC CTGCGCCAGG CCGTGGCCCT CGGCAGCAAT 720CTGCAGGCGC GGGAAAACAT GGCCTATGCT TCTCTGCTGG CCGGGATGGC TTTCAATAAC 780GCCAACCTCG GCTACGTGCA CGCCATGGCG CACCAGCTGG GCGGCCTGTA CGACATGCCG 840CACGGCGTGG CCAACGCTGT CCTGCTGCCG CATGTGGCGC GCTACAACCT GATCGCCAAC 900CCGGAGAAAT TCGCCGATAT CGCTGAACTG ATGGGCGAAA ATATCACCGG ACTGTCCACT 960CTCGACGCGG CGGAAAAAGC CATCGCCGCT ATCACGCGTC TGTCGATGGA TATCGGTATT 1020CCGCAGCATC TGCGCGATCT GGGGGTAAAA GAGGCCGACT TCCCCTACAT GGCGGAGATG 1080GCTCTAAAAG ACGGCAATGC GTTCTCGAAC CCGCGTAAAG GCAACGAGCA GGAGATTGCC 1140GCGATTTTCC GCCAGGCATT CTGA 1164(2)SEQ ID NO:10的信息(ⅰ)序列特征(A)长度12145碱基对(B)类型核酸(C)链双链(D)拓扑性质线性(ⅱ)分子类型DNA(基因组)(ⅲ)是否假设否
(ⅳ)是否反义否(ⅹⅰ)序列描述SEQ ID NO:10GTCGACCACC ACGGTGGTGA CTTTAATGCC GCTCTCATGC AGCAGCTCGG TGGCGGTCTC60AAAATTCAGG ATGTCGCCGG TATAGTTTTT GATAATCAGC AAGACGCCTT CGCCGCCGTC 120AATTTGCATC GCGCATTCAA ACATTTTGTC CGGCGTCGGC GAGGTGAATA TTTCCCCCGG 180ACAGGCGCCG GAGAGCATGC CCTGGCCGAT ATAGCCGCAG TGCATCGGTT CATGTCCGCT 240GCCGCCGCCG GAGAGCAGGG CCACCTTGCC AGCCACCGGC GCGTCGGTGC GGGTCACATA 300CAGCGGGTCC TGATGCAGGG TCAGCTGCGG ATGGGCTTTA GCCAGCCCCT GTAATTGTTC 360ATTCAGTACA TCTTCAACAC GGTTAATCAG CTTTTTCATT ATTCAGTGCT CCGTTGGAGA 420AGGTTCGATG CCGCCTCTCT GCTGGCGGAG GCGGTCATCG CGTAGGGGTA TCGTCTGACG 480GTGGAGCGTG CCTGGCGATA TGATGATTCT GGCTGAGCGG ACGAAAAAAA GAATGCCCCG 540ACGATCGGGT TTCATTACGA AACATTGCTT CCTGATTTTG TTTCTTTATG GAACGTTTTT 600GCTGAGGATA TGGTGAAAAT GCGAGCTGGC GCGCTTTTTT TCTTCTGCCA TAAGCGGCGG 660TCAGGATAGC CGGCGAAGCG GGTGGGAAAA AATTTTTTGC TGATTTTCTG CCGACTGCGG 720GAGAAAAGGC GGTCAAACAC GGAGGATTGT AAGGGCATTA TGCGGCAAAG GAGCGGATCG 780GGATCGCAAT CCTGACAGAG ACTAGGGTTT TTTGTTCCAA TATGGAACGT AAAAAATTAA 840CCTGTGTTTC ATATCAGAAC AAAAAGGCGA AAGATTTTTT TGTTCCCTGC CGGCCCTACA 900GTGATCGCAC TGCTCCGGTA CGCTCCGTTC AGGCCGCGCT TCACTGGCCG GCGCGGATAA 960CGCCAGGGCT CATCATGTCT ACATGCGCAC TTATTTGAGG GTGAAAGGAA TGCTAAAAGT 1020TATTCAATCT CCAGCCAAAT ATCTTCAGGG TCCTGATGCT GCTGTTCTGT TCGGTCAATA 1080TGCCAAAAAC CTGGCGGAGA GCTTCTTCGT CATCGCTGAC GATTTCGTAA TGAAGCTGGC 1140GGGAGAGAAA GTGGTGAATG GCCTGCAGAG CCACGATATT CGCTGCCATG CGGAACGGTT 1200TAACGGCGAA TGCAGCCATG CGGAAATCAA CCGTCTGATG GCGATTTTGC AAAAACAGGG 1260CTGCCGCGGC GTGGTCGGGA TCGGCGGTGG TAAAACCCTC GATACCGCGA AGGCGATCGG 1320TTACTACCAG AAGCTGCCGG TGGTGGTGAT CCCGACCATC GCCTCGACCG ATGCGCCAAC 1380CAGCGCGCTG TCGGTGATCT ACACCGAAGC GGGCGAGTTT GAAGAGTATC TGATCTATCC 1440GAAAAACCCG GATATGGTGG TGATGGACAC GGCGATTATC GCCAAAGCGC CGGTACGCCT 1500GCTGGTCTCC GGCATGGGCG ATGCGCTCTC CACCTGGTTC GAGGCCAAAG CTTGCTACGA 1560TGCGCGCGCC ACCAGCATGG CCGGAGGACA GTCCACCGAG GCGGCGCTGA GCCTCGCCCG 1620CCTGTGCTAT GATACGCTGC TGGCGGAGGG CGAAAAGGCC CGTCTGGCGG CGCAGGCCGG 1680GGTAGTGACC GAAGCGCTGG AGCGCATCAT CGAGGCGAAC ACTTACCTCA GCGGCATTGG 1740CTTTGAAAGC AGTGGCCTGG CCGCTGCCCA TGCAATCCAC AACGGTTTCA CCATTCTTGA 1800AGAGTGCCAT CACCTGTATC ACGGTGAGAA AGTGGCCTTC GGTACCCTGG CGCAGCTGGT 1860GCTGCAGAAC AGCCCGATGG ACGAGATTGA AACGGTGCAG GGCTTCTGCC AGCGCGTCGG 1920CCTGCCGGTG ACGCTCGCGC AGATGGGCGT CAAAGAGGGG ATCGACGAGA AAATCGCCGC 1980GGTGGCGAAA GCTACCTGCG CGGAAGGGGA AACCATCCAT AATATGCCGT TTGCGGTGAC 2040CCCGGAGAGC GTCCATGCCG CTATCCTCAC CGCCGATCTG TTAGGCCAGC AGTGGCTGGC 2100GCGTTAATTC GCGGTGGCTA AACCGCTGGC CCAGGTCAGC GGTTTTTCTT TCTCCCCTCC 2160GGCAGTCGCT GCCGGAGGGG TTCTCTATGG TACAACGCGG AAAAGGATAT GACTGTTCAG 2220ACTCAGGATA CCGGGAAGGC GGTCTCTTCC GTCATTGCCC AGTCATGGCA CCGCTGCAGC 2280AAGTTTATGC AGCGCGAAAC CTGGCAAACG CCGCACCAGG CCCAGGGCCT GACCTTCGAC 2340TCCATCTGTC GGCGTAAAAC CGCGCTGCTC ACCATCGGCC AGGCGGCGCT GGAAGACGCC 2400TGGGAGTTTA TGGACGGCCG CCCCTGCGCG CTGTTTATTC TTGATGAGTC CGCCTGCATC 2460CTGAGCCGTT GCGGCGAGCC GCAAACCCTG GCCCAGCTGG CTGCCCTGGG ATTTCGCGAC 2520GGCAGCTATT GTGCGGAGAG CATTATCGGC ACCTGCGCGC TGTCGCTGGC CGCGATGCAG 2580GGCCAGCCGA TCAACACCGC CGGCGATCGG CATTTTAAGC AGGCGCTACA GCCATGGAGT 2640TTTTGCTCGA CGCCGGTGTT TGATAACCAC GGGCGGCTGT TCGGCTCTAT CTCGCTTTGC 2700TGTCTGGTCG AGCACCAGTC CAGCGCCGAC CTCTCCCTGA CGCTGGCCAT CGCCCGCGAG 2760GTGGGTAACT CCCTGCTTAC CGACAGCCTG CTGGCGGAAT CCAACCGTCA CCTCAATCAG 2820ATGTACGGCC TGCTGGAGAG CATGGACGAT GGGGTGATGG CGTGGAACGA ACAGGGCGTG 2880CTGCAGTTTC TCAATGTTCA GGCGGCGAGA CTGCTGCATC TTGATGCTCA GGCCAGCCAG 2940GGGAAAAATA TCGCCGATCT GGTGACCCTC CCGGCGCTGC TGCGCCGCGC CATCAAACAC 3000GCCCGCGGCC TGAATCACGT CGAAGTCACC TTTGAAAGTC AGCATCAGTT TGTCGATGCG 3060GTGATCACCT TAAAACCGAT TGTCGAGGCG CAAGGCAACA GTTTTATTCT GCTGCTGCAT 3120CCGGTGGAGC AGATGCGGCA GCTGATGACC AGCCAGCTCG GTAAAGTCAG CCACACCTTT 3180GAGCAGATGT CTGCCGACGA TCCGGAAACC CGACGCCTGA TCCACTTTGG CCGCCAGGCG 3240GCGCGCGGCG GCTTCCCGGT GCTACTGTGC GGCGAAGAGG GGGTCGGGAA AGAGCTGCTG 3300AGCCAGGCTA TTCACAATGA AAGCGAACGG GCGGGCGGCC CCTACATCTC CGTCAACTGC 3360CAGCTATATG CCGACAGCGT GCTGGGCCAG GACTTTATGG GCAGCGCCCC TACCGACGAT 3420GAAAATGGTC GCCTGAGCCG CCTTGAGCTG GCCAACGGCG GCACCCTGTT TCTGGAAAAG 3480ATCGAGTATC TGGCGCCGGA GCTGCAGTCG GCTCTGCTGC AGGTGATTAA GCAGGGCGTG 3540CTCACCCGCC TCGACGCCCG GCGCCTGATC CCGGTGGATG TGAAGGTGAT TGCCACCACC 3600ACCGTCGATC TGGCCAATCT GGTGGAACAG AACCGCTTTA GCCGCCAGCT GTACTATGCG 3660CTGCACTCCT TTGAGATCGT CATCCCGCCG CTGCGCGCCC GACGCAACAG TATTCCGTCG 3720CTGGTGCATA ACCGGTTGAA GAGCCTGGAG AAGCGTTTCT CTTCGCGACT GAAAGTGGAC 3780GATGACGCGC TGGCACAGCT GGTGGCCTAC TCGTGGCCGG GGAATGATTT TGAGCTCAAC 3840AGCGTCATTG AGAATATCGC CATCAGCAGC GACAACGGCC ACATTCGCCT GAGTAATCTG 3900CCGGAATATC TCTTTTCCGA GCGGCCGGGC GGGGATAGCG CGTCATCGCT GCTGCCGGCC 3960AGCCTGACTT TTAGCGCCAT CGAAAAGGAA GCTATTATTC ACGCCGCCCG GGTGACCAGC 4020GGGCGGGTGC AGGAGATGTC GCAGCTGCTC AATATCGGCC GCACCACCCT GTGGCGCAAA 4080ATGAAGCAGT ACGATATTGA CGCCAGCCAG TTCAAGCGCA AGCATCAGGC CTAGTCTCTT 4140CGATTCGCGC CATGGAGAAC AGGGCATCCG ACAGGCGATT GCTGTAGCGT TTGAGCGCGT 4200CGCGCAGCGG ATGCGCGCGG TCCATGGCCG TCAGCAGGCG TTCGAGCCGA CGGGACTGGG 4260TGCGCGCCAC GTGCAGCTGG GCAGAGGCGA GATTCCTCCC CGGGATCACG AACTGTTTTA 4320ACGGGCCGCT CTCGGCCATA TTGCGGTCGA TAAGCCGCTC CAGGGCGGTG ATCTCCTCTT 4380CGCCGATCGT CTGGCTCAGG CGGGTCAGGC CCCGCGCATC GCTGGCCAGT TCAGCCCCCA 4440GCACGAACAG CGTCTGCTGA ATATGGTGCA GGCTTTCCCG CAGCCCGGCG TCGCGGGTCG 4500TGGCGTAGCA GACGCCCAGC TGGGATATCA GTTCATCGAC GGTGCCGTAG GCCTCGACGC 4560GAATATGGTC TTTCTCGATG CGGCTGCCGC CGTACAGGGC GGTGGTGCCT TTATCCCCGG 4620TGCGGGTATA GATACGATAC ATTCAGTTTC TCTCACTTAA CGGCAGGACT TTAACCAGCT 4680GCCCGGCGTT GGCGCCGAGC GTACGCAGTT GATCGTCGCT ATCGGTGACG TGTCCGGTAG 4740CCAGCGGCGC GTCCGCCGGC AGCTGGGCAT GAGTGAGGGC TATCTCGCCG GACGCGCTGA 4800GCCCGATACC CACCCGCAGG GGCGAGCTTC TGGCCGCCAG GGCGCCCAGC GCAGCGGCGT 4860CACCGCCTCC GTCATAGGTT ATGGTCTGGC AGGGGACCCC CTGCTCCTCC AGCCCCCAGC 4920ACAGCTCATT GATGGCGCCG GCATGGTGCC CGCGCGGATC GTAAAACAGG CGTACGCCTG 4980GCGGTGAAAG CGACATGACG GTCCCCTCGT TAACACTCAG AATGCCTGGC GGAAAATCGC 5040GGCAATCTCC TGCTCGTTGC CTTTACGCGG GTTCGAGAAC GCATTGCCGT CTTTTAGAGC 5100CATCTCCGCC ATGTAGGGGA AGTCGGCCTC TTTTACCCCC AGATCGCGCA GATGCTGCGG 5160AATACCGATA TCCATCGACA GACGCGTGAT AGCGGCGATG GCTTTTTCCG CCGCGTCGAG 5220AGTGGACAGT CCGGTGATAT TTTCGCCCAT CAGTTCAGCG ATATCGGCGA ATTTCTCCGG 5280GTTGGCGATC AGGTTGTAGC GCGCCACATG CGGCAGCAGG ACAGCGTTGG CCACGCCGTG 5340CGGCATGTCG TACAGGCCGC CCAGCTGGTG CGCCATGGCG TGCACGTAGC CGAGGTTGGC 5400GTTATTGAAA GCCATCCCGG CCAGCAGAGA AGCATAGGCC ATGTTTTCCC GCGCCTGCAG 5460ATTGCTGCCG AGGGCCACGG CCTGGCGCAG GTTGCGGGCG ATGAGGCGGA TCGCCTGCAT 5520GGCGGCGGCG TCCGTCACCG GGTTAGCGTC TTTGGAGATA TAGGCCTCTA CGGCGTGGGT 5580CAGGGCATCC ATCCCGGTCG CCGCGGTCAG GGCGGCCGGT TTACCGATCA TCAGCAGTGG 5640ATCGTTGATA GAGACCGACG GCAGTTTGCG CCAGCTGACG ATCACAAACT TCACTTTGGT 5700TTCGGTGTTG GTCAGGACGC AGTGGCGGGT GACCTCGCTG GCGGTGCCGG CGGTGGTATT 5760GACCGCGACG ATAGGCGGCA GCGGGTTGGT CAGGGTCTCG ATTCCGGCAT ACTGGTACAG 5820ATCGCCCTCA TGGGTGGCGG CGATGCCGAT GCCTTTGCCG CAATCGTGCG GGCTGCCGCC 5880GCCCACGGTG ACGATGATGT CGCACTGTTC GCGGCGAAAC ACGGCGAGGC CGTCGCGCAC 5940GTTGGTGTCT TTCGGGTTCG GCTCGACGCC GTCAAAGATC GCCACCTCGA TCCCGGCCTC 6000CCGCAGATAA TGCAGGGTTT TGTCCACCGC GCCATCTTTA ATTGCCCGCA GGCCTTTGTC 6060GGTGACCAGC AGGGCTTTTT TCCCCCCCAG CAGCTGGCAG CGTTCGCCGA CTACGGAAAT 6120GGCGTTGGGG CCAAAAAAGT TAACGTTTGG CACCAGATAA TCAAACATAC GATAGCTCAT 6180AATATACCTT CTCGCTTCAG GTTATAATGC GGAAAAACAA TCCAGGGCGC ACTGGGCTAA 6240TAATTGATCC TGCTCGACCG TACCGCCGCT AACGCCGACG GCGCCAATTA CCTGCTCATT 6300AAAAATAACT GGCAGGCCGC CGCCAAAAAT AATAATTCGC TGTTGGTTGG TTAGCTGCAG 6360ACCGTACAGA GATTGTCCTG GCTGGACCGC TGACGTAATT TCATGGGTAC CTTGCTTCAG 6420GCTGCAGGCG CTCCAGGCTT TATTCAGGGA AATATCGCAG CTGGAGACGA AGGCCTCGTC 6480CATCCGCTGG ATAAGCAGCG TGTTGCCTCC GCGGTCAACT ACGGAAAACA CCACCGCCAC 6540GTTGATCTCA GTGGCTTTTT TTTCCACCGC CGCCGCCATT TGCTGGGCGG CGGCCAGGGT 6600GATTGTCTGA ACTTGTTGGC TCTTGTTCAT CATTCTCTCC CGCACCAGGA TAACGCTGGC 6660GCGAATAGTC AGTAGGGGGC GATAGTAAAA AACTATTACC ATTCGGTTGG CTTGCTTTAT 6720TTTTGTCAGC GTTATTTTGT CGCCCGCCAT GATTTAGTCA ATAGGGTTAA AATAGCGTCG 6780AAAAACGTA ATTAAGGGCG TTTTTTATTA ATTGATTTAT ATCATTGCGG GCGATCACAT 6840TTTTTATTTT TGCCGCCGGA GTAAAGTTTC ATAGTGAAAC TGTCGGTAGA TTTCGTGTGC 6900CAAATTGAAA CGAAATTAAA TTTATTTTTT TCACCACTGG CTCATTTAAA GTTCCGCTAT 6960TGCCGGTAAT GGCCGGGCGG CAACGACGCT GGCCCGGCGT ATTCGCTACC GTCTGCGGAT 7020TTCACCTTTT GAGCCGATGA ACAATGAAAA GATCAAAACG ATTTGCAGTA CTGGCCCAGC 7080GCCCCGTCAA TCAGGACGGG CTGATTGGCG AGTGGCCTGA AGAGGGGCTG ATCGCCATGG 7140ACAGCCCCTT TGACCCGGTC TCTTCAGTAA AAGTGGACAA CGGTCTGATC GTCGAACTGG 7200ACGGCAAACG CCGGGACCAG TTTGACATGA TCGACCGATT TATCGCCGAT TACGCGATCA 7260ACGTTGAGCG CACAGAGCAG GCAATGCGCC TGGAGGCGGT GGAAATAGCC CGTATGCTGG 7320TGGATATTCA CGTCAGCCGG GAGGAGATCA TTGCCATCAC TACCGCCATC ACGCCGGCCA 7380AAGCGGTCGA GGTGATGGCG CAGATGAACG TGGTGGAGAT GATGATGGCG CTGCAGAAGA 7440TGCGTGCCCG CCGGACCCCC TCCAACCAGT GCCACGTCAC CAATCTCAAA GATAATCCGG 7500TGCAGATTGC CGCTGACGCC GCCGAGGCCG GGATCCGCGG CTTCTCAGAA CAGGAGACCA 7560CGGTCGGTAT CGCGCGCTAC GCGCCGTTTA ACGCCCTGGC GCTGTTGGTC GGTTCGCAGT 7620GCGGCCGCCC CGGCGTGTTG ACGCAGTGCT CGGTGGAAGA GGCCACCGAG CTGGAGCTGG 7680GCATGCGTGG CTTAACCAGC TACGCCGAGA CGGTGTCGGT CTACGGCACC GAAGCGGTAT 7740TTACCGACGG CGATGATACG CCGTGGTCAA AGGCGTTCCT CGCCTCGGCC TACGCCTCCC 7800GCGGGTTGAA AATGCGCTAC ACCTCCGGCA CCGGATCCGA AGCGCTGATG GGCTATTCGG 7860AGAGCAAGTC GATGCTCTAC CTCGAATCGC GCTGCATCTT CATTACTAAA GGCGCCGGGG 7920TTCAGGGACT GCAAAACGGC GCGGTGAGCT GTATCGGCAT GACCGGCGCT GTGCCGTCGG 7980GCATTCGGGC GGTGCTGGCG GAAAACCTGA TCGCCTCTAT GCTCGACCTC GAAGTGGCGT 8040CCGCCAACGA CCAGACTTTC TCCCACTCGG ATATTCGCCG CACCGCGCGC ACCCTGATGC 8100AGATGCTGCC GGGCACCGAC TTTATTTTCT CCGGCTACAG CGCGGTGCCG AACTACGACA 8160ACATGTTCGC CGGCTCGAAC TTCGATGCGG AAGATTTTGA TGATTACAAC ATCCTGCAGC 8220GTGACCTGAT GGTTGACGGC GGCCTGCGTC CGGTGACCGA GGCGGAAACC ATTGCCATTC 8280GCCAGAAAGC GGCGCGGGCG ATCCAGGCGG TTTTCCGCGA GCTGGGGCTG CCGCCAATCG 8340CCGACGAGGA GGTGGAGGCC GCCACCTACG CGCACGGCAG CAACGAGATG CCGCCGCGTA 8400ACGTGGTGGA GGATCTGAGT GCGGTGGAAG AGATGATGAA GCGCAACATC ACCGGCCTCG 8460ATATTGTCGG CGCGCTGAGC CGCAGCGGCT TTGAGGATAT CGCCAGCAAT ATTCTCAATA 8520TGCTGCGCCA GCGGGTCACC GGCGATTACC TGCAGACCTC GGCCATTCTC GATCGGCAGT 8580TCGAGGTGGT GAGTGCGGTC AACGACATCA ATGACTATCA GGGGCCGGGC ACCGGCTATC 8640GCATCTCTGC CGAACGCTGG GCGGAGATCA AAAATATTCC GGGCGTGGTT CAGCCCGACA 8700CCATTGAATA AGGCGGTATT CCTGTGCAAC AGACAACCCA AATTCAGCCC TCTTTTACCC 8760TGAAAACCCG CGAGGGCGGG GTAGCTTCTG CCGATGAACG CGCCGATGAA GTGGTGATCG 8820GCGTCGGCCC TGCCTTCGAT AAACACCAGC ATCACACTCT GATCGATATG CCCCATGGCG 8880CGATCCTCAA AGAGCTGATT GCCGGGGTGG AAGAAGAGGG GCTTCACGCC CGGGTGGTGC 8940GCATTCTGCG CACGTCCGAC GTCTCCTTTA TGGCCTGGGA TGCGGCCAAC CTGAGCGGCT 9000CGGGGATCGG CATCGGTATC CAGTCGAAGG GGACCACGGT CATCCATCAG CGCGATCTGC 9060TGCCGCTCAG CAACCTGGAG CTGTTCTCCC AGGCGCCGCT GCTGACGCTG GAGACCTACC 9120GGCAGATTGG CAAAAACGCT GCGCGCTATG CGCGCAAAGA GTCACCTTCG CCGGTGCCGG 9180TGGTGAACGA TCAGATGGTG CGGCCGAAAT TTATGGCCAA AGCCGCGCTA TTTCATATCA 9240AAGAGACCAA ACATGTGGTG CAGGACGCCG AGCCCGTCAC CCTGCACATC GACTTAGTAA 9300GGGAGTGACC ATGAGCGAGA AAACCATGCG CGTGCAGGAT TATCCGTTAG CCACCCGCTG 9360CCCGGAGCAT ATCCTGACGC CTACCGGCAA ACCATTGACC GATATTACCC TCGAGAAGGT 9410GCTCTCTGGC GAGGTGGGCC CGCAGGATGT GCGGATCTCC CGCCAGACCC TTGAGTACCA 9480GGCGCAGATT GCCGAGCAGA TGCAGCGCCA TGCGGTGGCG CGCAATTTCC GCCGCGCGGC 9540GGAGCTTATC GCCATTCCTG ACGAGCGCAT TCTGGCTATC TATAACGCGC TGCGCCCGTT 9600CCGCTCCTCG CAGGCGGAGC TGCTGGCGAT CGCCGACGAG CTGGAGCACA CCTGGCATGC 9660GACAGTGAAT GCCGCCTTTG TCCGGGAGTC GGCGGAAGTG TATCAGCAGC GGCATAAGCT 9720GCGTAAAGGA AGCTAAGCGG AGGTCAGCAT GCCGTTAATA GCCGGGATTG ATATCGGCAA 9780CGCCACCACC GAGGTGGCGC TGGCGTCCGA CTACCCGCAG GCGAGGGCGT TTGTTGCCAG 9840CGGGATCGTC GCGACGACGG GCATGAAAGG GACGCGGGAC AATATCGCCG GGACCCTCGC 9900CGCGCTGGAG CAGGCCCTGG CGAAAACACC GTGGTCGATG AGCGATGTCT CTCGCATCTA 9960TCTTAACGAA GCCGCGCCGG TGATTGGCGA TGTGGCGATG GAGACCATCA CCGAGACCAT 10020TATCACCGAA TCGACCATGA TCGGTCATAA CCCGCAGACG CCGGGCGGGG TGGGCGTTGG 10080CGTGGGGACG ACTATCGCCC TCGGGCGGCT GGCGACGCTG CCGGCGGCGC AGTATGCCGA 10140GGGGTGGATC GTACTGATTG ACGACGCCGT CGATTTCCTT GACGCCGTGT GGTGGCTCAA 10200TGAGGCGCTC GACCGGGGGA TCAACGTGGT GGCGGCGATC CTCAAAAAGG ACGACGGCGT 10260GCTGGTGAAC AACCGCCTGC GTAAAACCCT GCCGGTGGTG GATGAAGTGA CGCTGCTGGA 10320GCAGGTCCCC GAGGGGGTAA TGGCGGCGGT GGAAGTGGCC GCGCCGGGCC AGGTGGTGCG 10380GATCCTGTCG AATCCCTACG GGATCGCCAC CTTCTTCGGG CTAAGCCCGG AAGAGACCCA 10440GGCCATCGTC CCCATCGCCC GCGCCCTGAT TGGCAACCGT TCCGCGGTGG TGCTCAAGAC 10500CCCGCAGGGG GATGTGCAGT CGCGGGTGAT CCCGGCGGGC AACCTCTACA TTAGCGGCGA 10560AAAGCGCCGC GGAGAGGCCG ATGTCGCCGA GGGCGCGGAA GCCATCATGC AGGCGATGAG 10620CGCCTGCGCT CCGGTACGCG ACATCCGCGG CGAACCGGGC ACCCACGCCG GCGGCATGCT 10680TGAGCGGGTG CGCAAGGTAA TGGCGTCCCT GACCGGCCAT GAGATGAGCG CGATATACAT 10740CCAGGATCTG CTGGCGGTGG ATACGTTTAT TCCGCGCAAG GTGCAGGGCG GGATGGCCGG 10800CGAGTGCGCC ATGGAGAATG CCGTCGGGAT GGCGGCGATG GTGAAAGCGG ATCGTCTGCA 10860AATGCAGGTT ATCGCCCGCG AACTGAGCGC CCGACTGCAG ACCGAGGTGG TGGTGGGCGG 10920CGTGGAGGCC AACATGGCCA TCGCCGGGGC GTTAACCACT CCCGGCTGTG CGGCGCCGCT 10980GGCGATCCTC GACCTCGGCG CCGGCTCGAC GGATGCGGCG ATCGTCAACG CGGAGGGGCA 11040GATAACGGCG GTCCATCTCG CCGGGGCGGG GAATATGGTC AGCCTGTTGA TTAAAACCGA 11100GCTGGGCCTC GAGGATCTTT CGCTGGCGGA AGCGATAAAA AAATACCCGC TGGCCAAAGT 11160GGAAAGCCTG TTCAGTATTC GTCACGAGAA TGGCGCGGTG GAGTTCTTTC GGGAAGCCCT 11220CAGCCCGGCG GTGTTCGCCA AAGTGGTGTA CATCAAGGAG GGCGAACTGG TGCCGATCGA 11280TAACGCCAGC CCGCTGGAAA AAATTCGTCT CGTGCGCCGG CAGGCGAAAG AGAAAGTGTT 11340TGTCACCAAC TGCCTGCGCG CGCTGCGCCA GGTCTCACCC GGCGGTTCCA TTCGCGATAT 11400CGCCTTTGTG GTGCTGGTGG GCGGCTCATC GCTGGACTTT GAGATCCCGC AGCTTATCAC 11460GGAAGCCTTG TCGCACTATG GCGTGGTCGC CGGGCAGGGC AATATTCGGG GAACAGAAGG 11520GCCGCGCAAT GCGGTCGCCA CCGGGCTGCT ACTGGCCGGT CAGGCGAATT AAACGGGCGC 11580TCGCGCCAGC CTCTCTCTTT AACGTGCTAT TTCAGGATGC CGATAATGAA CCAGACTTCT 11640ACCTTAACCG GGCAGTGCGT GGCCGAGTTT CTTGGCACCG GATTGCTCAT TTTCTTCGGC 11700GCGGGCTGCG TCGCTGCGCT GCGGGTCGCC GGGGCCAGCT TTGGTCAGTG GGAGATCAGT 11760ATTATCTGGG GCCTTGGCGT CGCCATGGCC ATCTACCTGA CGGCCGGTGT CTCCGGCGCG 11820CACCTAAATC CGGCGGTGAC CATTGCCCTG TGGCTGTTCG CCTGTTTTGA ACGCCGCAAG 11880GTGCTGCCGT TTATTGTTGC CCAGACGGCC GGGGCCTTCT GCGCCGCCGC GCTGGTGTAT 11940GGGCTCTATC GCCAGCTGTT TCTCGATCTT GAACAGAGTC AGCATATCGT GCGCGGCACT 12000GCCGCCAGTC TTAACCTGGC CGGGGTCTTT TCCACGTACC CGCATCCACA TATCACTTTT 12060ATACAAGCGT TTGCCGTGGA GACCACCATC ACGGCAATCC TGATGGCGAT GATCATGGCC 12120CTGACCGACG ACGGCAACGG AATTC12145(2)SEQ ID NO:11的信息(ⅰ)序列特征(A)长度94碱基对(B)类型核酸(C)链双链(D)拓扑性质线性(ⅱ)分子类型DNA(基因组)(ⅲ)是否假设否(ⅳ)是否反义否(ⅹⅰ)序列描述SEQ ID NO:11AGCTTAGGAG TCTAGAATAT TGAGCTCGAA TTCCCGGGCA TGCGGTACCG GATCCAGAAA60AAAGCCCGCA CCTGACAGTG CGGGCTTTTT TTTT94(2)SEQ ID NO:12的信息(ⅰ)序列特征(A)长度37碱基对(B)类型核酸(C)链单链(D)拓扑性质线性(ⅱ)分子类型其它核酸(A)描述/desc=”引物’(ⅲ)是否假设否(ⅳ)是否反义否(ⅹⅰ)序列描述SEQ ID NO:12GGAATTCAGA TCTCAGCAAT GAGCGAGAAA ACCATGC 37(2)SEQ ID NO:13的信息(ⅰ)序列特征(A)长度27碱基对(B)类型核酸(C)链单链(D)拓扑性质线性(ⅱ)分子类型其它核酸(A)描述/desc=”引物’(ⅲ)是否假设否(ⅳ)是否反义否(ⅹⅰ)序列描述SEQ ID NO:13GCTCTAGATT AGCTTCCTTT ACGCAGC 27(2)SEQ ID NO:14的信息(ⅰ)序列特征(A)长度33碱基对(B)类型核酸
(C)链单链(D)拓扑性质线性(ⅱ)分子类型其它核酸(A)描述/desc=”引物’(ⅲ)是否假设否(ⅳ)是否反义否(ⅹⅰ)序列描述SEQ ID NO:14GGCCAAGCTT AAGGAGGTTA ATTAAATGAA AAG 33(2)SEQ ID NO:15的信息(ⅰ)序列特征(A)长度26碱基对(B)类型核酸(C)链单链(D)拓扑性质线性(ⅱ)分子类型其它核酸(A)描述/desc=”引物’(ⅲ)是否假设否(ⅳ)是否反义否(ⅹⅰ)序列描述SEQ ID NO:15GCTCTAGATT ATTCAATGGT GTCGGG 26(2)SEQ ID NO:16的信息(ⅰ)序列特征(A)长度42碱基对(B)类型核酸(C)链单链(D)拓扑性质线性(ⅱ)分子类型其它核酸(A)描述/desc=”引物’
(ⅲ)是否假设否(ⅳ)是否反义否(ⅹⅰ)序列描述SEQ ID NO:16GCGCCGTCTA GAATTATGAG CTATCGTATG TTTGATTATC TG42(2)SEQ ID NO:17的信息(ⅰ)序列特征(A)长度36碱基对(B)类型核酸(C)链单链(D)拓扑性质线性(ⅱ)分子类型其它核酸(A)描述/desc=”引物’(ⅲ)是否假设否(ⅵ)是否反义否(ⅹⅰ)序列描述SEQ ID NO:17TCTGATACGG GATCCTCAGA ATGCCTGGCG GAAAAT 36(2)SEQ ID NO:18的信息(ⅰ)序列特征(A)长度30碱基对(B)类型核酸(C)链单链(D)拓扑性质线性(ⅱ)分子类型其它核酸(A)描述/desc=”引物’(ⅲ)是否假设否(ⅳ)是否反义否(ⅹⅰ)序列描述SEQ ID NO:18TCTATTGTGG ATGCTTTACC ATGGTTAAAA 30(2)SEQ ID NO:19的信息(ⅰ)序列特征(A)长度26碱基对(B)类型核酸(C)链单链(D)拓扑性质线性(ⅱ)分子类型其它核酸(A)描述/desc=”引物’(ⅴ)是否假设否(ⅵ)是否反义否(ⅹⅰ)序列描述SEQ ID NO:19CACCGACGCC GGATCCAAAC ACCAGC 26(2)SEQ ID NO:20的信息(ⅰ)序列特征(A)长度38碱基对(B)类型核酸(C)链单链(D)拓扑性质线性(ⅱ)分子类型其它核酸(A)描述/desc=”引物’(ⅲ)是否假设否(ⅳ)是否反义否(ⅹⅰ)序列描述SEQ ID NO:20TCACTGTCGA AGAGGATCCG TAAAATCAAC GCCATGAC 38(2)SEQ ID NO:21的信息(ⅰ)序列特征(A)长度34碱基对(B)类型核酸(C)链单链(D)拓扑性质线性(ⅱ)分子类型其它核酸(A)描述/desc=”引物’(ⅲ)是否假设否(ⅳ)是否反义否(ⅹⅰ)序列描述SEQ ID NO:21GGCATTTGGC GGCGAAGCTT TATGGTGGCT ACAC 34(2)SEQ ID NO:22的信息(ⅰ)序列特征(A)长度18碱基对(B)类型核酸(C)链单链(D)拓扑性质线性(ⅱ)分子类型其它核酸(A)描述/desc=”引物’(ⅲ)是否假设否(ⅳ)是否反义否(ⅹⅰ)序列描述SEQ ID NO:22TCGACGAATT CAGGAGGA 18(2)SEQ ID NO:23的信息(ⅰ)序列特征(A)长度18碱基对(B)类型核酸
(C)链单链(D)拓扑性质线性(ⅱ)分子类型其它核酸(A)描述/desc=”引物’(ⅲ)是否假设否(ⅳ)是否反义否(ⅹⅰ)序列描述SEQ ID NO:23CTAGTCCTCC TGAATTCG 18(2)SEQ ID NO:24的信息(ⅰ)序列特征(A)长度4549碱基对(B)类型核酸(C)链双链(D)拓扑性质线性(ⅱ)分子类型DNA(基因组)(ⅲ)是否假设否(ⅳ)是否反义否(ⅹⅰ)序列描述SEQ ID NO:24AGCTCGTCAG CGGGTGTTGG CGGGTGTCGG GGCTGGCTTA ACTATGCGGC ATCAGAGCAG60ATTGTACTGA GAGTGCACCA TATGCGGTGT GAAATACCGC ACAGATGCGT AAGGAGAAAA 120TACCGCATCA GGCGCCATTC GCCATTCAGG CTGCGCAACT GTTGGGAAGG GCGATCGGTG 180CGGGCCTCTT CGCTATTACG CCAGCTGGCG AAAGGGGGAT GTGCTGCAAG GCGATTAAGT 240TGGGTAACGC CAGGGTTTTC CCAGTCACGA CGTTGTAAAA CGACGGCCAG TGAATTCGAG 300CTCGGTACCC GGGGATCCTC TAGAGTCGAC CTGCAGGCAT GCAAGCTTGG CGTAATCATG 360GTCATAGCTG TTTCCTGTGT GAAATTGTTA TCCGCTCACA ATTCCACACA ACATACGAGC 420CGGAAGCATA AAGTGTAAAG CCTGGGGTGC CTAATGAGTG AGCTAACTCA CATTAATTGC 480GTTGCGCTCA CTGCCCGCTT TCCAGTCGGG AAACCTGTCG TGCCAGCTGC ATTAATGAAT 540CGGCCAACGC GAATTCCCGA CAGTAAGACG GGTAAGCCTG TTGATGATAC CGCTGCCTTA 600CTGGGTGCAT TAGCCAGTCT GAATGACCTG TCACGGGATA ATCCGAAGTG GTCAGACTGG 660AAAATCAGAG GGCAGGAACT GCTGAACAGC AAAAAGTCAG ATAGCACCAC ATAGCAGACC 720CGCCATAAAA CGCCCTGAGA AGCCCGTGAC GGGCTTTTCT TGTATTATGG GTAGTTTCCT 780TGCATGAATC CATAAAAGGC GCCTGTAGTG CCATTTACCC CCATTCACTG CCAGAGCCGT 840GAGCGCAGCG AACTGAATGT CACGAAAAAG ACAGCGACTC AGGTGCCTGA TGGTCGGAGA 900CAAAAGGAAT ATTCAGCGAT TTGCCCGAGC TTGCGAGGGT GCTACTTAAG CCTTTAGGGT 960TTTAAGGTCT GTTTTGTAGA GGAGCAAACA GCGTTTGCGA CATCCTTTTG TAATACTGCG 1020GAACTGACTA AAGTAGTGAG TTATACACAG GGCTGGGATC TATTCTTTTT ATCTTTTTTT 1080ATTCTTTCTT TATTCTATAA ATTATAACCA CTTGAATATA AACAAAAAAA ACACACAAAG 1140GTCTAGCGGA ATTTACAGAG GGTCTAGCAG AATTTACAAG TTTTCCAGCA AAGGTCTAGC 1200AGAATTTACA GATACCCACA ACTCAAAGGA AAAGGACTAG TAATTATCAT TGACTAGCCC 1260ATCTCAATTG GTATAGTGAT TAAAATCACC TAGACCAATT GAGATGTATG TCTGAATTAG 1320TTGTTTTCAA AGCAAATGAA CTAGCGATTA GTCGCTATGA CTTAACGGAG CATGAAACCA 1380AGCTAATTTT ATGCTGTGTG GCACTACTCA ACCCCACGAT TGAAAACCCT ACAAGGAAAG 1440AACGGACGGT ATCGTTCACT TATAACCAAT ACGCTCAGAT GATGAACATC AGTAGGGAAA 1500ATGCTTATGG TGTATTAGCT AAAGCAACCA GAGAGCTGAT GACGAGAACT GTGGAAATCA 1560GGAATCCTTT GGTTAAAGGC TTTGAGATTT TCCAGTGGAC AAACTATGCC AAGTTCTCAA 1620GCGAAAAATT AGAATTAGTT TTTAGTGAAG AGATATTGCC TTATCTTTTC CAGTTAAAAA 1680AATTCATAAA ATATAATCTG GAACATGTTA AGTCTTTTGA AAACAAATAC TCTATGAGGA 1740TTTATGAGTG GTTATTAAAA GAACTAACAC AAAAGAAAAC TCACAAGGCA AATATAGAGA 1800TTAGCCTTGA TGAATTTAAG TTCATGTTAA TGCTTGAAAA TAACTACCAT GAGTTTAAAA 1860GGCTTAACCA ATGGGTTTTG AAACCAATAA GTAAAGATTT AAACACTTAC AGCAATATGA 1920AATTGGTGGT TGATAAGCGA GGCCGCCCGA CTGATACGTT GATTTTCCAA GTTGAACTAG 1980ATAGACAAAT GGATCTCGTA ACCGAACTTG AGAACAACCA GATAAAAATG AATGGTGACA 2040AAATACCAAC AACCATTACA TCAGATTCCT ACCTACATAA CGGACTAAGA AAAACACTAC 2100ACGATGCTTT AACTGCAAAA ATTCAGCTCA CCAGTTTTGA GGCAAAATTT TTGAGTGACA 2160TGCAAAGTAA GTATGATCTC AATGGTTCGT TCTCATGGCT CACGCAAAAA CAACGAACCA 2220CACTAGAGAA CATACTGGCT AAATACGGAA GGATCTGAGG TTCTTATGGC TCTTGTATCT 2280ATCAGTGAAG CATCAAGACT AACAAACAAA AGTAGAACAA CTGTTCACCG TTACATATCA 2340AAGGGAAAAC TGTCCATATG CACAGATGAA AACGGTGTAA AAAAGATAGA TACATCAGAG 2400CTTTTACGAG TTTTTGGTGC ATTCAAAGCT GTTCACCATG AACAGATCGA CAATGTAACA 2460GATGAACAGC ATGTAACACC TAATAGAACA GGTGAAACCA GTAAAACAAA GCAACTAGAA 2520CATGAAATTG AACACCTGAG ACAACTTGTT ACAGCTCAAC AGTCACACAT AGACAGCCTG 2580AAACAGGCGA TGCTGCTTAT CGAATCAAAG CTGCCGACAA CACGGGAGCC AGTGACGCCT 2640CCCGTGGGGA AAAAATCATG GCAATTCTGG AAGAAATAGC GCTTTCAGCC GGCAAACCGG 2700CTGAAGCCGG ATCTGCGATT CTGATAACAA ACTAGCAACA CCAGAACAGC CCGTTTGCGG 2760GCAGCAAAAC CCGTGGGAAT TAATTCCCCT GCTCGCGCAG GCTGGGTGCC AAGCTCTCGG 2820GTAACATCAA GGCCCGATCC TTGGAGCCCT TGCCCTCCCG CACGATGATC GTGCCGTGAT 2880CGAAATCCAG ATCCTTGACC CGCAGTTGCA AACCCTCACT GATCCGCATG CCCGTTCCAT 2940ACAGAAGCTG GGCGAACAAA CGATGCTCGC CTTCCAGAAA ACCGAGGATG CGAACCACTT 3000CATCCGGGGT CAGCACCACC GGCAAGCGCC GCGACGGCCG AGGTCTTCCG ATCTCCTGAA 3060GCCAGGGCAG ATCCGTGCAC AGCACCTTGC CGTAGAAGAA CAGCAAGGCC GCCAATGCCT 3120GACGATGCGT GGAGACCGAA ACCTTGCGCT CGTTCGCCAG CCAGGACAGA AATGCCTCGA 3180CTTCGCTGCT GCCCAAGGTT GCCGGGTGAC GCACACCGTG GAAACGGATG AAGGCACGAA 3240CCCAGTGGAC ATAAGCCTGT TCGGTTCGTA AGCTGTAATG CAAGTAGCGT ATGCGCTCAC 3300GCAACTGGTC CAGAACCTTG ACCGAACGCA GCGGTGGTAA CGGCGCAGTG GCGGTTTTCA 3360TGGCTTGTTA TGACTGTTTT TTTGGGGTAC AGTCTATGCC TCGGGCATCC AAGCAGCAAG 3420CGCGTTACGC CGTGGGTCGA TGTTTGATGT TATGGAGCAG CAACGATGTT ACGCAGCAGG 3480GCAGTCGCCC TAAAACAAAG TTAAACATCA TGAGGGAAGC GGTGATCGCC GAAGTATCGA 3540CTCAACTATC AGAGGTAGTT GGCGTCATCG AGCGCCATCT CGAACCGACG TTGCTGGCCG 3600TACATTTGTA CGGCTCCGCA GTGGATGGCG GCCTGAAGCC ACACAGTGAT ATTGATTTGC 3660TGGTTACGGT GACCGTAAGG CTTGATGAAA CAACGCGGCG AGCTTTGATC AACGACCTTT 3720TGGAAACTTC GGCTTCCCCT GGAGAGAGCG AGATTCTCCG CGCTGTAGAA GTCACCATTG 3780TTGTGCACGA CGACATCATT CCGTGGCGTT ATCCAGCTAA GCGCGAACTG CAATTTGGAG 3840AATGGCAGCG CAATGACATT CTTGCAGGTA TCTTCGAGCC AGCCACGATC GACATTGATC 3900TGGCTATCTT GCTGACAAAA GCAAGAGAAC ATAGCGTTGC CTTGGTAGGT CCAGCGGCGG 3960AGGAACTCTT TGATCCGGTT CCTGAACAGG ATCTATTTGA GGCGCTAAAT GAAACCTTAA 4020CGCTATGGAA CTCGCCGCCC GACTGGGCTG GCGATGAGCG AAATGTAGTG CTTACGTTGT 4080CCCGCATTTG GTACAGCGCA GTAACCGGCA AAATCGCGCC GAAGGATGTC GCTGCCGACT 4140GGGCAATGGA GCGCCTGCCG GCCCAGTATC AGCCCGTCAT ACTTGAAGCT AGACAGGCTT 4200ATCTTGGACA AGAAGAAGAT CGCTTGGCCT CGCGCGCAGA TCAGTTGGAA GAATTTGTCC 4260ACTACGTGAA AGGCGAGATC ACCAAGGTAG TCGGCAAATA ATGTCTAACA ATTCGTTCAA 4320GCCGACGCCG CTTCGCGGCG CGGCTTAACT CAAGCGTTAG ATGCACTAAG CACATAATTG 4380CTCACAGCCA AACTATCAGG TCAAGTCTGC TTTTATTATT TTTAAGCGTG CATAATAAGC 4440CCTACACAAA TTGGGAGATA TATCATGAAA GGCTGGCTTT TTCTTGTTAT CGCAATAGTT 4500GGCGAAGTAA TCGCAACATC CGCATTAAAA TCTAGCGAGG GCTTTACTA 4549(2)SEQ ID NO:25的信息(ⅰ)序列特征(A)长度199碱基对(B)类型核酸(C)链双链(D)拓扑性质线性
(ⅱ)分子类型DNA(基因组)(ⅲ)是否假设否(ⅳ)是否反义否(ⅹⅰ)序列描述SEQ ID NO:25GAATTCACTA GTCGATCTGT GCTGTTTGCC ACGGTATGCA GCACCAGCGC GAGATTATGG60GCTCGCACGC TCGACTGTCG GACGGGGGCA CTGGAACGAG AAGTCAGGCG AGCCGTCACG 120CCCTTGACAA TGCCACATCC TGAGCAAATA ATTCAACCAC TAAACAAATC AACCGCGTTT 180CCCGGAGGTA ACCAAGCTT199
权利要求
1.一种1,3-丙二醇的生物生产方法,包括(ⅱ)将转化的细胞与至少一种可发酵碳源以及有效剂量的维生素B12接触从而生产1,3-丙二醇,转化的宿主细胞含有(a)至少一个拷贝的基因,该基因编码一种具有脱水酶活性的蛋白;(b)至少一个拷贝的基因,该基因编码一种具有氧化还原酶活性的蛋白;(c)至少一个拷贝的基因,该基因编码一种维生素B12受体前体蛋白;(d)至少一个拷贝的基因,该基因编码一种维生素B12转运系统通透酶蛋白;和(e)至少一个拷贝的基因,该基因编码一种维生素B12转运ATP-或GTP-结合蛋白;其中(c),(d)或(e)中的任何一个基因的至少一个拷贝的基因被引入宿主细胞,并且(ⅲ)回收从步骤(ⅰ)产生的1,3-丙二醇。
2.权利要求1的方法,其中编码具有1(a)中脱水酶活性的蛋白的基因编码的酶选自甘油脱水酶和二元醇脱水酶。
3.权利要求1的方法,其中1(a)和1(b)的基因分别独立地分离自克雷伯氏菌类,沙门氏菌类或梭菌类。
4.权利要求1的方法,其中1(c)和1(d)的基因分别独立地分离自大肠杆菌类,沙门氏菌类,克雷伯氏菌类,假单胞菌类或柠檬酸杆菌类。
5.权利要求1中方法,其中(ⅰ)(ⅰ)(c)的基因是选自SEQ ID NO:1和SEQ ID NO:2的btuB基因;(ⅱ)(ⅰ)(d)的基因是选自SEQ ID NO:3的btuC基因;(ⅲ)(ⅰ)(e)的基因是选自SEQ ID NO:4的btuD基因。
6.权利要求1的方法,其中可发酵碳源选自可发酵碳水化合物,单碳底物和它们的混合物。
7.权利要求1的方法,其中可发酵碳源选自单糖类、寡糖类、多糖类、单碳底物类、甘油、二羟基丙酮和含碳胺类。
8.权利要求1中方法,其中转化的宿主细胞进而含有至少一个拷贝的编码甘油-3-磷酸脱氢酶的基因以及至少一个拷贝的编码甘油-3-磷酸酶的基因。
9.权利要求1中方法,其中宿主细胞选自细菌、酵母和丝状真菌。
10.权利要求9中方法,其中宿主细胞选自这些属柠檬酸杆菌属,肠杆菌属,梭菌属,克雷伯氏菌属,气杆属,乳杆菌属,曲霉属,糖酵母属,裂殖糖酵母属,结合糖酵母属,毕赤酵母属,克鲁维氏酵母属,假丝酵母属,汉逊氏酵母属,德巴利氏酵母,毛霉属,球拟酵母属,甲基杆菌属,大肠杆菌属,沙门氏菌属,芽孢杆菌属,链霉菌属和假单胞菌属。
11.权利要求1中方法,其中有效剂量的维生素B12为存在的脱水酶摩尔比的0.1-10倍。
12.一种转化的宿主细胞,含有(a)至少一个拷贝的基因,该基因编码一种具有脱水酶活性的蛋白;(b)至少一个拷贝的基因,该基因编码一种具有氧化还原酶活性的蛋白;(c)至少一个拷贝的基因,该基因编码一种维生素B12受体前体蛋白;(d)至少一个拷贝的基因,该基因编码一种维生素B12转运系统通透酶蛋白;和(e)至少一个拷贝的基因,该基因编码一种维生素B12转运ATP-或GTP-结合蛋白;其中至少一个拷贝的(c),(d)或(e)基因被引入宿主细胞。
13.一种1,3-丙二醇的生物生产方法,包括(ⅰ)将转化的细胞与(a)至少一种选自单糖类、寡糖类、多糖类,单碳底物,甘油,二羟基丙酮和含碳胺类的可发酵碳源以及(b)有效剂量的维生素B12接触从而生产1,3-丙二醇,转化的宿主细胞含有(a)至少一个拷贝的基因,该基因编码一种具有脱水酶活性的蛋白;(b)至少一个拷贝的基因,该基因编码一种具有氧化还原酶活性的蛋白;(c)至少一个拷贝的基因,该基因编码一种维生素B12受体前体蛋白;(d)至少一个拷贝的基因,该基因编码一种维生素B12转运系统通透酶蛋白;和(e)至少一个拷贝的基因,该基因编码一种维生素B12转运ATP-或GTP-结合蛋白;(f)至少一个拷贝的基因,该基因编码一种一种具有甘油-3-磷酸脱氢酶活性的蛋白;和(g)至少一个拷贝的基因编码一种一种具有甘油-3-磷酸酶活性的蛋白其中(ⅰ)(c),(i)(d)或(i)(e)中的任何一个基因的至少一个拷贝的基因被引入宿主细胞,并且(ⅱ)回收从步骤(ⅰ)产生的1,3-丙二醇。
全文摘要
提供了含有编码甘油脱水酶,1,3-丙二醇基因,1,3-丙二醇氧化还原酶基因,编码维生素B
文档编号C12N1/21GK1300321SQ99806120
公开日2001年6月20日 申请日期1999年5月12日 优先权日1998年5月12日
发明者G·M·怀特德, B·布尔图伊斯, D·E·特林布尔, A·A·加滕拜 申请人:纳幕尔杜邦公司, 詹伦卡国际有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1