分离突变体及克隆互补基因的新方法

文档序号:450152阅读:1843来源:国知局
专利名称:分离突变体及克隆互补基因的新方法
背景技术
本发明属于微生物突变及筛选突变体领域,具体地,本发明涉及以一种简单、直接和特异性的方式获得代谢突变体。在一优选实施方案中,还可以获得不包括重组DNA的所需的突变体,从而由于立法程序较短而促进所述的突变体掺入供人类消费和应用的产品中。本发明的方法涉及随机突变及特异性筛选所需的代谢突变体,该方法可以合适地自动化进行。这种突变体能显示出增加的或降低的代谢活性。本发明的特异性在于所用的筛选条件。得到的突变体的突变之处在于其针对预定的代谢部分的调控功能的变化。根据筛选条件,可以分离到去阻遏突变体,由此展现过量表达,或者可分离到丧失了特定代谢酶活性的突变体,因此可以消除不需要的代谢酶活性或者增加所需的代谢活性。
本发明的方法可以在已广泛应用于工业上的各种熟知来源上进行,例如,过量表达的突变体可以用作高产、低成本的主要酶来源。待突变的原始菌株取决于本领域熟练技术人员公知的几种因素如对蛋白的有效分泌、大规模生产过程的适应性、发酵液的下游处理的经验、深入的遗传学知识以及确保使用安全的微生物。
根据本发明的另一方面,其也可以确定和鉴别特异的代谢基因调控功能。
目前可以工业应用的并能自动化的制备突变体的方法是没有筛选过程以及后续分析突变体过程的突变方法,这一方面需改进。一种带有筛选过程的替代方法总是需要一富集步骤,而后基于生长或不生长而筛选,这意味着首先需除去大量的不希望的突变体。而且现存方法会产生大量带有不正确表型的突变体,因而筛选率很低。
几年以前,Gist-Brocades开发并介绍了一种用于黑曲霉的pluGBug标记基因自由技术,在G.Selten的GIST94/60 p5-7中描述了一种用于黑曲霉的载体,其包括糖淀粉酶调控区以使其调控的基因高水平表达,选择这种调控区是因为天然黑曲霉天然表达的糖淀粉酶水平很高。使用重组DNA技术将该调控区与感兴趣的基因以及选择标记黑曲霉AmdS合适地融合,使得在将表达盒转移至黑曲霉宿主中后可以筛选所需的转化子,然后多拷贝的表达盒随机整合进黑曲霉基因组。在该文献中描述的所生产的酶是植酸酶。随后可产生不带标记的转化子。在已知系统中,产生不带标记的重组菌株实际是一两步过程,因为amdS基因可以双向使用。首先在一轮转化中筛选含有所提供的表达盒的原始转化子,然后在第二轮中反选择又丧失了amdS基因的最终重组菌株。amdS基因编码能够将乙酰胺转化成铵和乙酸酯的酶,乙酰胺在上述第一轮转化中用作唯一的氮源,在第二轮重组中氟乙酰胺用作选择性氮源,并含有第二种合适的氮源如脲。由于产物氟乙酸酯对于其它细胞是毒性的,因此仅有那些由于在表达盒内DNA重复序列上发生了内部重组而丧失了amdS基因的细胞能繁殖。该已知方法的最大问题是得到的菌株是重组菌株,所需的特征只能通过掺入“外源”核酸而引入,这会延长立法批准所需的时间,甚至有时不能得到批准。另外,该方法不适于开发带有补充代谢的菌株。由于存在酶级联系统和多重反馈环,仅仅掺入一特定的基因不能总是导致所需的结果,该基因所编码的特定产物的过量产生可能会被另一产物的伴随过量表达而补偿或者负调节,从而使掺入基因达不到效果。因此,DNA的掺入经常是不断摸索出错的过程,即所需的核酸的掺入可以筛选到,但是所需的表型不一定能伴随产生。而且,标记基因的丢失是一自发过程,其耗时并且不能保证对于所有含核酸盒的转化子都能发生这一过程。
已知微生物菌株的改良可以通过在不同水平修饰微生物而达到,在转录水平改善基因表达通常通过使用强启动子并增加表达盒中的基因剂量而达到,产生高水平的编码感兴趣产物的mRNA。尽管这一策略可以增加所形成的产物,但是其有原则性的不利之处,由于存在多拷贝的启动子,驱动转录的转录调节物的量可能受到限制,导致调节物的靶基因的表达降低,这一点在携带许多拷贝的amdS基因的构巢曲霉中观察到(Kelly and Hynes,1987;Andrianopoulos andHynes,1988),在携带多拷贝的处于alcA启动子下的异源基因的构巢曲霉菌株中也观察到(Gwynne et al.,1987)。在后一种情况下,编码alcA基因的转录调节物的alcR基因的增加导致表达盒的表达增加(Gwynne et al.,1987;Davies,1991)。与在构巢曲霉中发现的作用类似,在使用糖淀粉酶(glaA)启动子的黑曲霉中也观察到类似的限制,这是由于驱动转录的转录调节物受到限制(Verdoes et al.,1993;Verdoes et al.,1995;Verdoes,1994)。因此目前由于缺乏筛选策略而大大阻碍了对glaA调节基因的克隆。
在一个阿糖胶酶(arabinase)基因表达的例子中,增加阿糖胶酶基因的剂量时发现对转录调节物有明显的竞争(Flipphi et al,1994),反应出在所研究的三个基因中转录调节物的限制是共同的。
现有技术中除了上述缺点外,到目前为止分离和确定调节基因仍非常困难,这是由于大多数调节蛋白在细胞中的浓度非常低,使得很难确定哪种物质负责调节作用。另外,通常调节产物不是酶,而只能通过DNA结合分析来筛选,这使得很难确定和分离并且非常耗时。目前应用的克隆调节基因的策略例如-通过互补作用,但其需要提供突变体,-通过纯化调控蛋白,但其非常复杂耗时,因为该蛋白仅能通过其结合DNA的特性加以鉴定。一些纯化方法包括使用结合的DNA片段作为基质的亲和层析,这种纯化方法的一个缺点是通常多于一个蛋白与所述的片段特异性及非特异性结合。
-基于基因群集,其中调控基因与通过其基因产物调控的结构基因在基因组内群集,例如prn簇,alc簇。
发明的详细描述我们现已获得一种系统,其可用于缩短能过量产生特定需要的酶的突变微生物的登记所需时间,该系统克服了“外源”核酸尤其是选择标记基因的多重随机插入的问题,该系统甚至不需要外源核酸来达到所需的特征。得到的突变菌株将不包括异源核酸。另外,本发明的系统能实现代谢的特异突变并不需导致不希望的表型的大量实验工作。
本发明涉及一种核酸盒,其包括编码一双向标记的核酸序列,所述的核酸盒进一步包括与编码双向标记的核酸序列可操作地连接的一个基本转录单位,所述的核酸盒还包括与基本转录单位以如下方式连接的可诱导增强序列或激活序列,所述的连接方式为当诱导增强序列或激活序列时能使编码双向标记的核酸序列表达,所述的可诱导增强序列或激活序列从与代谢系统的一部分的活性相关的基因衍生而来,所述的可诱导增强序列或激活序列从代谢相关基因衍生而来。
基本转录单位包括任何为基因的转录所需的因子,其可包括具有或不具有增强序列的启动子。基本转录单位必须是在宿主生物体内可操作的,其定位必须是可操作地与双向标记基因连接,以使该基因的转录成为可能。对于各种宿主细胞如曲霉、木霉、青霉、镰孢、酿酒酵母、克鲁维酵母菌和乳杆菌已熟知作为基本转录单位的合适的例子。在实施例中,举例示出了从黑曲霉goxC转录单位(Whittington等,1990)衍生的基本转录单位tGOX作为本发明的实施方案。
优选的是可诱导增强序列或激活序列正常参与酶级联系统的调控,或者参与涉及一或多个反馈环的代谢的一部分。在一实施方案中,本发明的核酸盒包括正常参与碳代谢的可诱导增强序列或激活序列。可用于本发明的核酸盒的可诱导增强序列或激活序列的合适的例子是包括在下述任一核酸片段上的上游激活序列(UAS)-源自分别编码阿拉伯糖呋喃糖苷酶A、阿拉伯糖呋喃糖苷酶B和内切阿糖胶酶的abfA、abfB和abnA基因的启动子的片段,-源自编码糖淀粉酶的glaA基因的片段,-含有如在alcR和alcA启动子上的alcR结合位点的片段,-源自CUP1基因的片段,-源自PHO5基因的片段,-源自GAL1、GAL7或GAL10基因的片段,-源自xlnA基因的片段,-源自pgaII基因的片段,例如,这些片段可以来源于如文献中所述的下列微生物-源自分别编码黑曲霉阿拉伯糖呋喃糖苷酶A、阿拉伯糖呋喃糖苷酶B和内切阿糖胶酶的abfA、abfB和abnA基因的启动子的片段(Flipphi M.J.A.et al.1994),-源自编码黑曲霉的糖淀粉酶的glaA基因的片段(Fowler T.etal 1990),-含有如在构巢曲霉的alcR启动子上的alcR结合位点的片段(Felenbok B.et al.1994),-源自啤酒酵母CUP1基因的片段(Hinnen A.et al.1995),-源自啤酒酵母PHO5基因的片段(Hinnen A.et al.1995),-源自啤酒酵母GAL1、GAL7或GAL10基因的片段(HinnenA.et al.1995),-源自构巢曲霉的xlnA、xlnB、xlnC或xlnD基因的片段,-源自黑曲霉的xlnB、xlnC或xlnD基因的片段(见本说明书的其它处),-源自塔宾曲霉的xlnA或xlnD基因的片段(de Graaff et al.1994),-源自黑曲霉的pgaII基因的片段(见本说明书的其它处)。
在实施例中,举出xlnA的UAS为本发明的实施方案的例子。
双向标记是本领域熟知的术语,它包括能根据所用的选择条件而指示是否存在表达的选择标记,一个优选的双向标记将赋予以致死性或生长极度降低为基础的可选择性。另外,根据双向标记基因的表达与否而使菌落颜色不同也是可行的实施方案。已知的双向标记的合适例子包括facB、NiaD、AmdS、Can1、Ura3、Ura4和PyrA基因。我们在此指出,PyrA同系物在文献中也称作PyrG、Ura3、Ura4、Pyr4和Pyr1。这些基因可在下述微生物中发现,facB基因见于构巢曲霉,NiaD基因见于黑曲霉,NiaD基因见于米曲霉,AmdS基因见于构巢曲霉,Can1基因见于粟酒裂殖糖酵母,Ura3基因见于啤酒糖酵母,Ura4基因见于粟酒糖酵母,PyrA基因见于曲霉、木霉、青霉、镰孢、酿酒酵母、克鲁维酵母菌。
选择facB突变体即具有阴性表型可以根据氟乙酸抗性为基础,选择FAC B+即阳性表型可以以乙酸盐为碳源进行(Katz,M.E.andHynes M.J.1989)。选择niaD突变体即具有阴性表型可以根据氯酸盐抗性为基础,选择NIA D+即阳性表型可以以硝酸盐为氮源进行(Unkels S.E.et al.1989a and 1989b)。选择amdS突变体即具有阴性表型可以根据氟乙酰胺抗性为基础,选择AMD S+即阳性表型可以以乙酰胺为氮源进行,由于大多数真菌不具有编码乙酰胺酶功能的基因,所以AMD S对于此类真菌是显性标记,其可用在黑曲霉、黑曲霉塔宾变种、黑曲霉泡盛变种、臭曲霉、米曲霉、萨氏曲霉、日本曲霉、棘孢曲霉、曲霉属各种、木霉属各种(Kelly and Hynes 1985 andBailey et al.1991)。选择can1突变体即具有阴性表型可以根据canavanine抗性为基础,其中canavanine是一种精氨酸类似物,选择CAN 1+即阳性表型可以在精氨酸上进行(Ekwall K.1991)。编码乳清酸核苷5’-P-脱羧酶的基因已知为pyrA、pyrG或ura3,其已在各种微生物中发现,如曲霉、木霉、青霉、镰孢、酿酒酵母和克鲁维酵母。选择pyrA突变体即具有阴性表型,也称为pyrG或ura3可以根据氟乳清酸抗性为基础,选择PYR A+及其同系物即阳性表型可以根据尿苷或尿嘧啶原养型为基础进行,在实施例中,举出黑曲霉的pyrA(Wilson et al.1988)作为本发明的实施方案的例子。其它的例子是本领域熟练技术人员公知的并可在文献中容易地找到。选择标记的使用取决于待突变的宿主微生物以及其它次一级的考虑如选择的容易性、可靠性以及所用底物的成本等。掺入到转化或表达载体中的核酸盒也包括在本发明的范围内,还包括这种核酸盒或载体在转化和选择方法中的应用。本发明特别涉及产生这样的突变体的方法,所述的突变体显示过量表达一种参与预定代谢部分的酶;以及产生这样的突变体的方法,所述的突变体显示降低或抑制一种参与预定代谢部分的酶的表达;以及确定和分离参与预定代谢部分的的调控基因的方法。
因此,本发明涉及一种制备和筛选微生物突变菌株的方法,所述的突变与未突变的菌株相比能促进预定部分的代谢,所述的方法包括-将根据前述任一项权利要求的核酸盒导入宿主,所述的宿主在导入核酸盒之前不具有与双向标记表达相关的表型,-在如下的条件下培养得到的微生物,所述的条件为能使核酸盒上包括的增强序列或激活序列有正常活性,并且双向标记基因可表达,优选的是所述的双向标记基因的表达将导致生长,而不表达则不生长,-在上述培养条件下选择具有与双向标记基因表达相应的表型的转化子,-将所选的转化子以已知方式诱变,-在预定代谢部分的可代谢底物存在下,在如下条件下培养得到的菌株,所述的条件为具有与双向标记的表达相应的表型的菌株可接受的条件,以及导致未突变的含核酸盒的亲本菌株不表达双向标记的条件,-选择从诱变后的培养步骤得到的菌株,所述的菌株具有与在选择条件下表达双向标记基因相应的表型,该条件下未突变的含核酸盒亲本菌株不表达双向标记。
在本方法的合适实施方案中,-可诱导的增强序列或激活序列是衍生于xlnA基因的上游激活序列(UAS),-预定代谢部分是碳代谢的木聚糖裂解部分,-培养步骤,其中得到的微生物在增强序列或激活序列有正常活性并且双向标记基因能表达的条件下培养,包括在UAS的诱导物的存在下、UAS的阻遏物以及可代谢碳源不存在下培养,-选择具有与双向标记基因表达相应的表型的转化子是在上述培养条件下进行,-所选的转化子诱变后的培养步骤是在如下条件下进行,所述的条件为具有与双向标记的表达相应的表型的菌株可接受的条件,以及导致未突变的含核酸盒的亲本菌株不表达双向标记的条件,即在UAS阻遏物存在下和在可代谢碳源存在下,以及任选地在UAS的诱导物存在下,-选择从诱变后的培养步骤得到的具有与双向标记基因表达相应的表型的菌株是在如下的选择条件下进行,所述的条件为导致未突变的含核酸盒亲本菌株不表达双向标记的条件。
在本方法的更进一步的实施方案中,-核酸盒包括编码双向标记pyrA的核酸序列,-在导入核酸盒之前,宿主不具有与双向标记的表达相关的pyrA+表型,-培养步骤,其中得到的微生物在增强序列或激活序列有正常活性并且双向标记基因能表达的条件下培养,包括在增强序列或激活序列有正常活性的条件下培养,即在增强子或激活物的诱导物的存在下、增强子或激活物的阻遏物不存在下以及双向标记基因能表达的条件下培养,-选择具有与双向标记基因表达相应的表型的转化子是在上述培养条件下进行,-所选的转化子诱变后的培养步骤是在如下条件下进行,所述的条件为具有与双向标记的表达相应的表型的菌株可接受的条件,并且导致未突变的含核酸盒的亲本菌株不表达双向标记的条件,即在增强子或激活物的诱导物不存在下或在增强子或激活物的阻遏物存在下和在预定代谢部分的可代谢底物的存在下,-选择从诱变后的培养步骤得到的具有与双向标记基因表达相应的表型的菌株是在如下的选择条件下进行,所述的条件为导致未突变的含核酸盒亲本菌株不表达双向标记的条件,即在增强子或激活物的诱导物不存在下或者在增强子或激活物的阻遏物存在下。
合适的是,以上所述的实施方案可以进一步具有如下特征-核酸盒包括编码双向标记pyrA的核酸序列,-在导入核酸盒之前,宿主不具有与双向标记的表达相关的pyrA+表型,-可诱导的增强序列或激活序列是从xlnA基因衍生的UAS,-培养步骤,其中得到的微生物在增强序列或激活序列有正常活性并且双向标记基因能表达的条件下培养,包括在UAS有正常活性的条件下培养,即在UAS的诱导物如木糖或木聚糖的存在下,并且在UAS的阻遏物不存在下,即不存在葡萄糖,以及双向标记基因能表达的条件下培养,
-选择具有与双向标记基因表达相应的表型的转化子是在上述培养条件下进行,-所选的转化子诱变后的培养步骤是在如下条件下进行,所述的条件为具有与双向标记的表达相应的表型的菌株可接受的条件,并且导致未突变的含核酸盒的亲本菌株不表达双向标记的条件,即在UAS的诱导物如木糖或木聚糖不存在下,或者在UAS的阻遏物存在下即存在葡萄糖和在可代谢碳源的存在下,-选择从诱变后的培养步骤得到的具有与双向标记基因表达相应的表型的菌株是在如下的选择条件下进行,所述的条件为导致未突变的含核酸盒亲本菌株不表达双向标记的条件,即在UAS的诱导物如木糖或木聚糖不存在下,或者在UAS的阻遏物存在下即存在葡萄糖。
另外,本发明优选的是制备和筛选未重组的微生物突变菌株的方法,所述的突变与未突变的菌株相比增强了预定代谢部分,所述的方法包括进行以上段落所述的本发明方法的步骤,然后以公知的方式交换除去(crossing out)导入的核酸盒的核酸。
如前所述,本发明提供了制备和筛选微生物突变株的方法,所述的突变与未突变株相比抑制预定的碳代谢部分,所述的方法包括-将上述本发明的核酸盒导入宿主,所述的宿主在导入核酸盒之前不具有与双向标记表达相关的表型,所述的宿主具有待降低或抑制的预定代谢部分的特征活性类型,-在如下的条件下培养得到的微生物,所述的条件为能使核酸盒的增强序列或激活序列有正常活性,并且核酸盒的双向标记基因的不表达可使得到的微生物生长和被检测到,并且优选的是所述的双向标记的表达将导致死亡或强烈抑制生长,-在上述培养条件下选择具有与双向标记基因表达相应的表型的转化子,-将所选的转化子以已知方式诱变,-在可代谢底物存在下,在如下条件下培养诱变后得到的菌株,所述的条件为具有与双向标记的不表达相应的表型的菌株可接受的,并且能反应出与具有或不具有核酸盒的未突变宿主相比有降低的或受抑制的预定代谢部分的活性,-选择从诱变后的培养步骤得到的菌株,所述的菌株具有与在选择条件下降低的或受抑制的预定代谢部分的活性相应的表型,该选择条件能反应出与具有或不具有核酸盒的未突变宿主相比有降低的或受抑制的预定代谢部分的活性,如在底物上生长时的水解透明区减小,所述的底物为活性待降低或抑制的代谢部分的底物。
在本方法的进一步实施方案中,-可诱导的增强序列或激活序列是衍生于xlnA基因的上游激活序列(UAS),-预定代谢部分是碳代谢的木聚糖裂解部分,-培养步骤,其中得到的微生物在增强序列或激活序列有正常活性并且双向标记基因能表达的条件下培养,包括在核酸盒的UAS的阻遏物不存在下、在可代谢碳源存在下、以及优选地在UAS的诱导物的存在下培养,-选择具有与双向标记基因表达相应的表型的转化子是在上述培养条件下进行,-所选的转化子诱变后的培养步骤是在如下条件下进行,所述的条件为对于具有与双向标记的不表达相应的表型的菌株的生长和检测是可接受的;并且对于具有与双向标记的表达相应的表型的菌株的生长和检测是不可接受的即存在尿苷和氟乳清酸;以及导致未突变的含核酸盒的亲本菌株具有预定碳代谢部分活性的条件,即存在UAS的诱导物和可代谢碳源并且不存在UAS阻遏物,例如存在山梨糖醇或与诱导物如木聚糖或D-木糖联合使用的另一种非阻遏碳源,-选择从诱变后的培养步骤得到的具有与降低的或受抑制的预定碳代谢部分的活性相应的表型的菌株是在如下的选择条件下进行,该选择条件能反应出与具有或不具有核酸盒的未突变宿主相比有降低的或受抑制的预定碳代谢部分的活性,如在木聚糖上生长时的水解透明区减小。
提供了前一段落所述的方法的例子,其中-核酸盒包括编码双向标记pyrA的核酸序列,-在导入核酸盒之前,宿主不具有与双向标记的表达相关的PYRA+表型,-培养步骤,其中得到的微生物在增强序列或激活序列有正常活性并且双向标记pyrA能表达的条件下培养,包括在增强子或激活物的诱导物存在下、并且在增强子或激活物的阻遏物不存在下以及在双向标记pyrA能表达的条件下培养,-选择具有与双向标记基因pyrA表达相应的表型的转化子是在上述培养条件下进行,-所选的转化子诱变后的培养步骤是在如下条件下进行,所述的条件为对于具有与双向标记的不表达相应的表型即PYRA-表型的菌株的生长和检测是可接受的;并且对于具有PYRA+表型即与双向标记的表达相应的表型的菌株的生长和检测是不可接受的即存在尿苷和氟乳清酸;以及导致未突变的含核酸盒的亲本菌株具有预定代谢部分活性的条件,即存在增强子或激活物的诱导物和可代谢底物并且不存在增强子或激活物的阻遏物或者与诱导物联合使用的另一种非阻遏底物。
在一优选的实施方案中,前述两个段落所述的方法是如下一种方法,其中进一步-核酸盒包括编码双向标记pyrA的核酸序列,-在导入核酸盒之前,宿主不具有与双向标记的表达相关的PYRA+表型,-可诱导增强序列或激活序列是衍生于xlnA基因的UAS,-培养步骤,其中得到的微生物在增强序列或激活序列有正常活性并且双向标记pyrA能表达的条件下培养,包括在UAS有正常活性条件下培养,即在UAS的诱导物如木糖或木聚糖的存在下,并且在UAS的阻遏物不存在下,即不存在葡萄糖,以及双向标记pyrA能表达的条件下培养,-选择具有与双向标记基因pyrA表达相应的表型的转化子是在上述培养条件下进行,-所选的转化子诱变后的培养步骤是在如下条件下进行,所述的条件为对于具有与双向标记的不表达相应的表型即pyrA-表型的菌株的生长和检测是可接受的;并且对于具有PYRA+表型即与双向标记的表达相应的表型的菌株的生长和检测是不可接受的即存在尿苷和氟乳清酸;以及导致未突变的含核酸盒的亲本菌株具有预定碳代谢部分活性的条件,即存在UAS的诱导物和可代谢碳源并且不存在UAS阻遏物,例如存在山梨糖醇或与诱导物如木聚糖或D-木糖联合使用的另一种非阻遏碳源,-选择从诱变后的培养步骤得到的具有与降低的或受抑制的预定碳代谢部分的活性相应的表型的菌株是在如下的选择条件下进行,该选择条件能反应出与具有或不具有核酸盒的未突变宿主相比有降低的或受抑制的预定碳代谢部分的活性,如在木聚糖上生长时的水解透明区减小。
上述的所有方法可以有利地使用具有如下特征的宿主进行,所述的宿主在导入核酸盒之前就具有与编码双向标记的核酸序列的至少一部分对应的核酸,所述的对应程度足以使包含在核酸盒上的编码双向标记的核酸同源重组在染色体上。这一方面确保了核酸盒在预定的位置进行整合。
在一优选的实施方案中,将掺入多拷贝的核酸盒以确保诱变步骤不会失活双向标记,因为当检测标记阴性表型时双向标记的失活会给出不正确的结果,双向标记的失活也能降低标记阳性表型的数量。
在本发明的优选的实施方案中,已构建了一种核酸盒,其可用于产生显示参与预定代谢部分的酶的过量表达的突变体的方法中,可用于产生显示参与预定代谢部分的酶的降低的或受抑制的表达的突变体的方法中,以及可用于确定和分离参与预定代谢部分的调控基因的方法中。我们具体地举例描述了用于碳代谢的突变体的系统。在实施例中描述了具有改变的木聚糖裂解特征的突变体以及导致阿拉伯糖裂解和果胶裂解途径的突变体的阿糖胶酶和聚半乳糖醛酸酶突变体。在实施例中使用曲霉作为待突变的菌株,但是其它工业可接受的微生物均适用,这类微生物的例子包括酿酒酵母,例如啤酒酵母,粟酒糖酵母,曲霉,例如构巢曲霉,木霉,青霉,镰孢,克鲁维酵母和乳杆菌。其它例子是本领域熟练技术人员显而易见的并在本说明书的其它部分有描述。现在可以产生过量表达或不表达预定代谢部分的菌株。我们还可确定可诱导增强序列或激活序列的激活调节物的特征及核酸序列,特别是当这种激活调节物参与代谢时,更具体地当这种激活调节物参与具有酶级联系统或反馈环或多重反馈环的代谢部分时。这种调控基因的核酸序列随后可用于增强靶基因的表达,所述的靶基因为由该调控基因调控的基因。在一优选的实施方案中,这种靶基因具有调控基因的表达产物的结合位点。在一表达盒中将与调节物的靶基因正常相关的启动子与调控基因联合(其中所述的启动子与编码待表达的同源或异源蛋白质或肽的同源或异源序列可操作地连接)能使表达盒在表达同源甚至异源蛋白质或肽方面特别有用。编码调节物的基因可在其天然启动子的控制之下或者在能在所选宿主细胞中表达的任何其它启动子的控制之下。启动子可以是组成型的或诱导型的,这取决于特定生产过程的需要。这种联合表达盒属于本发明的范围,包括这种盒的载体或质粒也属于本发明的范围。表达程度不再受仅存在很少量的调节物的限制,因此待表达基因的表达程度比在相应的待表达基因在相同启动子控制下但是不存在调控基因的宿主细胞中的表达程度高得多。这种增加的表达优选的是在正常包括欲影响的代谢途径部分的组分的生物体细胞中达到,合适的宿主细胞是丝状真菌细胞。将上述类型的组合表达盒掺入到具有调节物的靶基因的宿主细胞中可以增加靶基因的表达或者若存在多个靶基因的话增加所有靶基因的表达。优选的是靶基因相对于宿主细胞是内源的。包括联合表达盒的宿主细胞属于本发明的范围。
在实施例中,提供了木聚糖裂解途径xylR的调节物的核酸序列xlnR,已发现这一调节物的靶基因包括基因xlnA、xlnB、xlnC和xlnD以及axeA。证明了木聚糖酶A表达的增加,并且可用于示意xlyR对xylR调节物的靶基因的作用的通用性。现有技术中已知许多序列,包括上述的xlnA、xlnB、xlnC和xlnD以及axeA基因的序列,这些信息对于本领域熟练技术人员是容易获得的,并认为掺入本文。与xlnR核酸联合应用的优选的感兴趣的启动子可以选自xlnA、xlnB、xlnC和xlnD,使用axeA启动子也是本发明的合适的实施方案。启动子对于本领域熟练技术人员是已知的,并认为掺入本文。xlnA启动子由de Graaff等人1994年描述,xlnB启动子由Kinoshita等人1995年描述,xlnD启动子在EP95201707.7中有描述,并包括在这一文献的序列表的序列号8中。启动子序列可以根据已知的序列容易地合成或者以标准的已知方法得自生物体或包含启动子的载体。当使用术语启动子、增强子或调节物时,包括启动子、增强子或调节物的天然的片段也可采用,只要其可操作性不改变即可。在本发明的构建体中不需要仅掺入相关序列,也可存在任何侧翼的非干扰序列。本发明不仅包括编码表达产物xylR的核酸序列xlnR,而且包括编码等价表达产物和突变表达产物的序列以及本发明的核酸序列的表达产物本身。本文公开的任何xylR或xylR编码序列(=xlnR)的应用也适用于突变体和编码突变体的核酸序列,这些均认为掺入本文。
用于表达本发明的核酸序列和盒的合适的真菌细胞的例子有曲霉如黑曲霉、塔宾曲霉、棘孢曲霉,泡盛曲霉,米曲霉,构巢曲霉,炭黑曲霉,臭曲霉,土曲霉,萨氏曲霉,川地曲霉,日本曲霉和木霉属、青霉属和镰孢属的种。其它细胞如植物细胞也是可行的宿主细胞,在本文的其它地方描述了其它宿主细胞。
用本发明的表达盒表达或者与本发明的核酸序列联合的特别感兴趣的基因是编码酶的基因。用于表达的合适的基因是编码木聚糖酶、葡聚糖酶、氧化还原酶如己糖氧化酶、α-葡糖醛酸酶、脂酶、酯酶、阿魏酸酯酶和蛋白酶的基因,这些是所需的表达产物的非限制性例子。包括上述基因的许多序列是本领域已知的并且这种信息对于本领域熟练技术人员来说是容易获得的,并被认为掺入本文。所述的基因可以根据文献或数据库中已知的序列容易地合成或者从生物体或包括这些基因的载体中以已知的标准方式衍生,这些均是本领域熟练技术人员容易获得的知识,在此不需进一步的论证。
与序列号9的xylR的氨基酸序列或由序列号9的xlnR的核酸序列(从948位核苷酸开始)编码的氨基酸序列有80-100%的相同性的表达产物被认为是本发明的木聚糖酶调节物(xylR)的等价表达产物,因此属于本发明的范围。该等价表达产物应具有DNA结合活性,优选地,这种DNA结合活性应是表达产物与靶基因的核酸的结合程度与具有序列号9提供的氨基酸序列的表达产物结合的程度相同或更好。用于确定结合活性的优选的靶基因是编码xylA、xylB、xylC和xylD的基因,即xlnA、xlnB、xlnC和xlnD基因。本发明也要求保护至少保持相同程度的靶结合活性的根据序列号9的xlnR基因表达产物xylR的突变体和编码核酸序列xlnR的突变体。被认为属于等价表达产物的定义内的突变体特别包括与序列号9的氨基酸序列相比有氨基酸改变的突变体,这些等价物及其编码核酸序列被认为是本发明的合适的实施方案。具有1-15个氨基酸取代的突变体是合适的,有例如1-5个氨基酸取代的突变体也被认为是本发明特别合适的形成等价表达产物的实施方案。用同类型的其它氨基酸取代特定的氨基酸不会严重影响肽活性这一点是本领域熟练技术人员的常识。根据水疗法(hydropathy)曲线,本领域熟练技术人员将清楚何种取代可以进行。用其它疏水性氨基酸取代疏水性氨基酸以及用其它亲水性氨基酸取代亲水性氨基酸例如能产生本发明的合适的表达产物。这种取代被认为是由本发明的范围所覆盖。在序列号9的编码核酸序列中的点突变被认为能产生属于本发明范围的核酸序列,这种点突变可以导致氨基酸水平的静止突变或者导致上述的取代突变体。本发明也包括任何类型的取代突变体。优选地,与序列号9的氨基酸序列相比突变体的相同性应为85-100%,更优选为90-100%,最优选为95-100%。如上所述,与序列号9的氨基酸序列有80-100%的相同性的氨基酸序列属于本发明的等价物,因此包括了至多为20%、优选少于15%、更优选少于10%、最优选少于5%的本发明氨基酸序列的缺失和/或取代。这种突变体可以包括在氨基酸序列的一或多个部分中的缺失和/或取代,然而,这种缺失和/或取代突变体包括相应于锌指结合区的氨基酸序列以及相应于RRRLWW基序的氨基酸序列。1-5个氨基酸的缺失突变体被认为属于本发明的范围,超过5个氨基酸的缺失的缺失突变体和/或具有多于5个氨基酸取代和/或点突变的突变体也能保持DNA结合活性,这种较大的缺失和/或取代和/或点突变优选地发生在氨基酸序列的N末端部分以及编码核酸序列的相应部分。据信参与调控和活化的最重要的区域存在于从锌指结合区开始的氨基酸序列的C末端部分,因此,缺失突变体优选地包括至少这一部分的氨基酸序列。优选地在锌指结合区即相应于序列号9的第1110-1260位核苷酸的区域没有突变,如果存在一个突变,则优选地其不涉及与锌配位的6个半胱氨酸间的间隔区,最优选地任何突变均不涉及6个半胱氨酸中的任一个。另外,优选地,在序列号9的氨基酸序列中存在的RRRLWW基序中不存在突变。在所述的氨基酸序列的一或多个片段中可能会发生缺失,然而这种缺失突变体应包括相应于锌指结合区的氨基酸序列以及相应于RRRLWW基序的氨基酸序列。缺失1-15个氨基酸、优选缺失1-10个氨基酸、最优选缺失1-5个氨基酸是保证等价性的合适的实施方案。等价的核酸序列的实施方案是编码如下表达产物的核酸序列,所述的表达产物具有与序列号9的xylR相同的氨基酸序列或者由序列号9的xlnR核酸序列编码的相同氨基酸序列。与序列号9的xylR的氨基酸序列或由编码序列号9的xylR的核酸序列编码的氨基酸序列有80-100%的相同性的表达产物的编码核酸序列也被认为是xlnR的等价核酸序列,因此属于本发明的范围。本发明的等价核酸序列的另一个实施方案是在如实施例所述的特异性最小严格条件下能与从序列号9的核酸序列衍生的引物或探针杂交的核酸序列,所述的引物或探针是从非锌指结合区衍生的,并且所述的引物或探针的长度至少为20个核苷酸。通常合适的探针和引物的长度为20-60个核苷酸、优选为25-60个核苷酸。优选地,探针或引物从序列号9的从锌指结合区开始的C末端编码部分衍生。本发明的核酸序列的一个优选的实施方案是在至少为实施例中所述的严格程度的特异条件下能与序列号9的核酸序列杂交。等价的核酸序列应能例如通过PCR用上述的基于序列号9的核酸序列的引物从其它生物体中衍生。上述定义的等价核酸序列的表达产物也属于本发明的范围,反过来,编码本发明的等价氨基酸序列的核酸序列也属于术语等价核酸序列的范畴。从丝状真菌和植物中衍生的等价核酸序列及这些序列的表达产物是本发明的优选实施方案。优选地,等价核酸序列包括编码相应于序列号9中的1110-1260位核苷酸编码的锌指结合区的核酸序列。在一优选的实施方案中,等价核酸序列应编码与锌配位的6个半胱氨酸,在进一步的实施方案中,半胱氨酸之间的间隔应对应于序列号9中的间隔区。
包括将实施的等价核酸序列和表达产物的各种实施方案的特征结合在一起的实施方案也属于本发明的范围。在锌指结合区具有突变但能显示增加的DNA结合性能的突变体也属于本发明范围,具有降低的DNA结合性能的突变体也属于本发明的范围,这种突变体可能在锌指结合区有突变。特别要求的是在序列号9中提供的氨基酸序列的突变体。
具有序列号9的至少15个核苷酸的核酸序列的片段也属于本发明范围,这些片段能用作探针或引物来检测和分离等价序列。特别是两个或更多个这种片段的组合可用在试剂盒中以检测和/或分离这种等价序列。优选地,片段应从序列号9的氨基酸序列的C末端部分衍生。在试剂盒的一个合适的实施方案中,片段应不包括形成锌指结合区的核酸序列的一部分。在实施例中举例示出了用作引物的片段的合适组合,任何可通过如实施例所述的PCR利用这些引物获得的序列均属于本发明的范围。在实施例中所用的杂交条件提供了筛选所需的最低的严格程度,可以使用更严格的条件,如由Sambrook等所述的用于获得的序列与序列号9有增加的同源性的杂交条件,低盐浓度通常意味着更严格的条件。编码具有完整序列的靶基因结合活性的多肽的序列号9的序列的任何片段均属于本发明的等价核酸序列或其氨基酸序列的范围,等价的定义如上所述涉及完整序列的杂交和/或突变和/或遗传密码的简并。
包括编码xylR的核酸序列或其如上定义的等价序列的载体或质粒也属于本发明的范围,包括这种序列的载体或质粒以及包括这种额外的序列的宿主细胞也属于本发明的范围。携带至少一个额外拷贝的根据序列号9的编码核酸序列或其等价物的转化宿主细胞如微生物或植物细胞属于本发明的范围。优选地,各种实施方案如此组织以使序列能在载体、质粒或宿主细胞中表达。调控基因可以包括与在宿主细胞中可操作的可变启动子组合的序列号9的完整序列或者仅仅是其编码序列。宿主细胞的合适例子在本说明书的其它部分有描述。针对各种宿主细胞的可以与序列号9的编码序列一起掺入的合适的可操作启动子对于本领域熟练技术人员是清楚的。针对在说明书中例举的宿主细胞的组成型启动子或诱导型启动子是已知的并且不需创造性劳动即可利用它们实施本发明。
提供了生产同源或异源蛋白或肽的方法,所述的方法包括在宿主细胞中表达编码同源或异源蛋白或肽的核酸序列,所述的宿主还包括附加的编码调控基因如xlnR或其等价物的核酸序列,该核酸序列也表达。所述的方法优选地用一种联合核酸序列表达盒进行,所述的表达盒包括可操作地与第一个启动子相连的调控基因,并且所述的表达盒还包括第二个启动子,所述的第二个启动子与调节物的靶基因正常相关,所述的靶基因启动子与编码待表达的同源甚至异源蛋白或肽的核酸序列可操作地相连。第一个启动子可以是与调控基因天然相关的启动子或者可以是能在宿主细胞中操作的启动子。表达程度不再受仅存在非常少量的调节物这一点的限制,因此待表达基因的表达程度比在相应的不存在调控基因的宿主细胞中的表达程度高许多。这种增加的表达优选地在正常包括需影响的代谢途径部分的成分的生物体细胞中实现,合适的宿主细胞是植物细胞或微生物,合适的微生物可以是真菌,特别是丝状真菌。合适的宿主细胞的例子在本说明书的其它处有描述并可认为掺入在此。在包括调节物的靶基因的宿主细胞中掺入上述类型的联合表达盒可以增加靶基因的表达,或者如果存在多个靶基因的话,可以使这些靶基因均增加表达。优选地,靶基因相对于调节物是天然的,这种靶基因优选地是宿主细胞内源性的。在实施例中提供了木聚糖裂解途径xlnR的调节物的核酸序列,已发现这一调节物的天然靶基因包括xlnA、xlnB、xlnC和xlnD以及axeA基因,因此,这些基因是优选的靶基因,也存在其它的靶并认为其包括在术语靶基因中。本发明的宿主细胞的各种实施方案均包括在权利要求书中。如果调控序列和靶基因均天然存在于宿主细胞中,则调控序列应以多个拷贝存在,这种微生物与天然微生物相比将过量表达由靶基因启动子调控的基因。
由于现在已知木聚糖酶调节物的序列,所有可以剔除木聚糖酶调节物,一旦已知待剔除的基因的核酸序列,制备剔除宿主细胞的技术是标准技术。这种方法可参考Berka等(1990)描述的方法以及EP95201707.7的实施例11类似地进行,所述的欧洲专利申请的拷贝在递交本申请时也已附上,该实施例本身也掺入了本申请的实施例中。这种剔除可使宿主细胞缺失木聚糖裂解活性,由于剔除xlnR基因而缺失了木聚糖裂解活性的宿主细胞可以用作产生无木聚糖裂解活性的所选的同源或异源表达产物,具有剔除xlnR基因的宿主细胞属于本发明的范围,这种宿主细胞优选地是植物细胞或丝状真菌,这种丝状真菌优选地是曲霉。各种合适的宿主细胞的例子在本说明书的其它处有描述。
使用本发明的筛选和突变方法产生的在调控基因中具有突变的宿主细胞可以用来与调控基因的调节活性拷贝进行互补。这种互补菌株将随后表达由调节物调控的任何靶基因的产物,这些靶基因产物在未互补的调节物阴性突变体中不存在。比较根据已知方法从两种菌株中获得的蛋白条带,可以明显地看到何种靶产物由调节物调控,随后一旦确定其表达产物即可以以已知的方式确定相应的新的靶基因。以这种方式可以在实施例中发现木聚糖酶调节物xylR的除已知的靶基因之外的其它靶基因。
实施例实施例1构建质粒实施例1.1构建选择质粒pIM130如

图1所示构建选择质粒pIM130,在PCR1中用寡核苷酸1(SEQ ID NO1)5’-CACAATGCATCCCCTTTATCCGCCTGCCGT-3’(式1)和寡核苷酸A(SEQ ID NO2)5’-CAATTGCGACTTGGAGGACATGATGGGCAGATGAGGG-3’(式2)从pIM120(de Graaff等,1994)产生一个片段。寡核苷酸1衍生于塔宾曲霉xlnA启动子(de Graaff等,1994)的位置600-619(SEQ ID NO5),其中加入了含有NsiI位点的10个核苷酸。寡核苷酸A的3’末端衍生于终止于翻译起始位点之前的黑曲霉goxC转录单位(Whittington等,1990)(位置708-723)(SEQ ID NO6),而其5’末端衍生于起自翻译起始位点的黑曲霉pyrA基因的编码区(Wilson等,1988)(位置341-359,SEQ ID NO7)。
通过含10μl 10×反应缓冲液(100mM Tris-HCl,pH8.3,500mMKCl,15mM MgCl2,0.01%明胶),16μl 1.25mM每种脱氧核苷三磷酸,1ng质粒pIM120 DNA和各1μg寡核苷酸1和寡核苷酸A,终体积为100μl的PCR产生片段A。混合这一反应混合物并加入1μlTAQ聚合酶(5U/μl)(Life Technologies)。通过在92℃保温3分钟变性DNA,接着进行92℃1分钟、48℃1分钟、72℃1分钟的25个循环,25个循环后将混合物在72℃保温5分钟。根据琼脂糖凝胶电泳对反应产物的分析揭示有一约250bp的片段,该片段相应于根据基因序列预期的大小。
在PCR2中使用寡核苷酸2(SEQ ID NO3)5’-AGAGAGGATATCGATGTGGG-3’(式3)和寡核苷酸B(SEQ IDNO4)5’-CCCTCATCTGCCCATCATGTCCTCCAAGTCGCAATTG-3’(式4)从质粒pGW635(Goosen et al.,1987)产生一个片段。寡核苷酸B的5’末端衍生自黑曲霉goxC基本转录单位(位置708-723,SEQ ID NO6)(Whittington et al.,1990),而其3’末端衍生于起自翻译起始位点的黑曲霉pyrA基因的编码区。寡核苷酸2衍生自pyrA编码区(位置339-359,SEQ ID NO7)并跨越第602位(SEQ ID NO7)的EcoRV限制性内切酶位点。
片段B以类似片段A相同的方式产生,只是在这一情况下反应混合物含有各1μg寡核苷酸2和寡核苷酸B以及1ng质粒pGW635DNA。根据琼脂糖凝胶电泳对反应产物的分析揭示有一约250bp的片段,该片段相应于根据基因序列预期的大小。
电泳后从琼脂糖凝胶中分离片段A和片段B,从琼脂糖凝胶中切下片段,之后用ISCO杯通过电洗脱将它们从琼脂糖小块中回收出来。在这一杯的大小容器上各覆盖一透析膜,在杯中注入0.005×TAE(每1000ml 50×TAE缓冲液含242.0g Trizma碱(Sigma),7.1ml冰醋酸,100ml 0.5M EDTA pH8.0),将琼脂糖小块置于杯的大容器中。随后将杯置于电洗脱装置中,使大容器位于含1×TAE的阳极室,小容器位于含1×TAE/3M NaAc的阴极室。在1小时内以100V电洗脱片段,之后从电洗脱装置中取出杯,并除去大容器中的缓冲液,而小容器中的缓冲液仅除去上面的部分,含有DNA片段的剩余缓冲液(200μl)在杯中对蒸馏水透析30分钟。最后通过加入0.1倍体积的3M NaAc,pH5.6和2倍体积的冷(-20℃)乙醇沉淀DNA,在4℃、14,000×g离心30分钟(Eppendoff离心机)收集DNA。除去上清后用Savant Speedvac真空离心机干燥DNA沉淀,将DNA溶于10μl TE缓冲液(TE10mM Tris/HCl pH7.2,1mMEDTA pH8.0)中,用已知浓度的λDNA作为参考以及检测DNA的溴乙锭染色通过琼脂糖凝胶电泳测定浓度。
在PCR3中融合片段A和片段B,PCR3与PCR1的不同之处是其反应混合物含有各1μg寡核苷酸1和寡核苷酸2以及各约50ng片段A和片段B。根据琼脂糖凝胶电泳对反应产物的分析揭示有一约500bp的片段,该片段相应于根据基因序列预期的大小。
如上所述从琼脂糖凝胶中分离得到的片段C,随后用限制性内切酶NsiI和EcoRV消化,在由下述溶液组成的反应混合物中在37℃消化DNA3小时,所述的溶液为5μl(约0.5μg)DNA溶液、2μl合适的10×反应缓冲液(Life Technologies)、10U限制性内切酶(Life Technologies)和无菌蒸馏水至终体积20μl。消化后通过琼脂糖凝胶电泳分析DNA片段并如上所述从凝胶中分离片段。
为了最终构建pIM130,如上所述在500μl的终体积中用50U的限制性内切酶EcoRV和XbaI消化5μg质粒pGW635,产物分离后通过电洗脱从琼脂糖凝胶中分离2.2kb的EcoRV/XbaI片段(片段D)。类似地,用限制性内切酶NsiI/XbaI消化制备1μg载体pGEM-7Zf(+)(Promega),随后电泳并通过电洗脱从琼脂糖凝胶中分离。
通过如下连接反应构建质粒pIM130将100ng pGEM-7Zf(+)NsiI/XbaI片段与50ng片段C和50ng片段D混合,向这一混合物中加入4μl 5×连接缓冲液(组成500mM Tris-HCl,pH7.6;100mMMgCl2;10mM ATP;10mM二硫苏糖醇;25%PEG-6000)和1μl(1.2U/μl)T4 DNA连接酶(Life Technologies),终体积为20μl。在14℃保温16小时后用无菌水将混合物稀释至100μl,用10μl稀释的混合物转化大肠杆菌DH5α感受态细胞,所述感受态细胞的制备见Sambrook等人,1989所述。
将两个得到的菌落在含100μg/ml氨苄青霉素的LB培养基(每1000ml LB培养基含10g胰化蛋白胨(BBL),5g酵母提取物(BBL),10g NaCl,0.5mM Tris-HCl pH7.5)中培养过夜,通过Maniatis等人(1982)所述的碱裂解法从培养物中分离质粒DNA,将质粒DNA用于限制酶分析以筛选携带所需质粒pIM130的克隆。从500ml的在含100μg/ml氨苄青霉素的LB培养基中培养的含pIM130的大肠杆菌DH5α培养物这大量分离质粒DNA(Maniatis等人,1982)。通过CsCl离心、酚抽提、乙醇沉淀纯化质粒并溶于400μl TE,产量约为500μg。
实施例1.2质粒pIM135的构建从质粒pIM120构建第二个质粒,该质粒含有与pyrA编码区和终止区融合的goxC基本转录单位。在PCR4中使用寡核苷酸3和寡核苷酸2(式3)从质粒pIM120产生了一个片段,所述的寡核苷酸3序列为5’-CACAATGCATCGTATAAGTAACCTCGTTCG-3’(式5)其衍生自goxC基本转录单位(位置640-660,SEQ ID NO6),并且加入了含一个NsiI位点的10个核苷酸。如实施例1.1所述,从凝胶中分离产生的片段,用NsiI和EcoRV消化并与pGW635的2.2kbEcoRV/XbaI片段一起克隆到用XbaI/NsiI消化的质粒pGEM-7Zf(+)中,得到质粒pIM135。
质粒pIM135可用作构建载体来制备本发明的携带任何所需的可诱导增强序列或激活序列、参与代谢的基因的UAS的载体。pIM135包括可操作地与双向标记基因(pyrA)连接的基本转录单位(tGOX)。
实施例2使用质粒pIM130转化黑曲霉以1×106个孢子/ml在250ml由曲霉基本培养基(MM)组成的培养基(每升含有6.0g NaNO3,1.5gKH2PO4,0.5gMgSO4·7H2O,0.5g KCl,所指出的碳源,pH6.0,以及1mlVishniac溶液(每升含有10g EDTA,4.4g ZnSO4·7H2O,1.0gMnCl2·4H2O,0.32g CoCl2·6H2O,0.32g CuSO4·5H2O,0.22g(NH4)6Mo7O24·4H2O,1.47g CaCl2·2H2O,1.0gFeSO4·7H2O,pH4.0),添加了2%葡萄糖,0.5%酵母抽提物,0.2%酪蛋白氨基酸(不含维生素),10mML-精氨酸,10μM烟酰胺,10mM尿苷)中接种NW205菌株(cspAl,pyrA6,nicA1,argB13)的孢子,30℃下在250rpm有轨New Brunswick摇床中培养菌丝体16-18小时。使用Büchner漏斗和温和抽吸在Myracloth(尼龙纱布)上收集菌丝体,并且用SP6(SP60.8%NaCl,10mM磷酸钠缓冲液,pH6.0)洗涤几次。将150mg的Novozyme 234溶解在20ml SMC(SMC1.33M山梨醇,50mM CaCl2,20mM MES缓冲液,pH5.8)中,加入1g菌丝体(湿重)并且小心地悬浮。30℃下温和振荡培养悬浮液1-2小时,每隔30分钟将菌丝体小心地悬浮,取样后用血细胞测定仪计数原生质体以检测原生质体的形成。当存在足够的原生质体(大于1×108)时,小心地悬浮这些原生质体并通过无菌玻璃棉管塞过滤除去菌丝体碎片。使用台式离心机在4℃以3000rpm离心10分钟收集原生质体,将其小心地悬浮在5ml STC(STC1.33M山梨醇,50mM CaCl2,10mMTris/HCl,pH7.5)中。这一洗涤步骤重复两次,最后将原生质体以1×108/ml密度悬浮在STC中。
通过以下步骤进行转化将溶解在10-20μl的TE中的1μg pIM130DNA与50μl的PEG缓冲液(PEG缓冲液25%PEG-6000,50mM CaCl2,10mM Tris/HCl,pH7.2)一起加入到200μl的原生质体悬浮液中,然后使用移液管抽吸几次轻轻地将上述液体混合,并在室温下温育20分钟。此后,加入2ml的PEG缓冲液,将溶液轻轻地混合并在室温下温育5分钟,接下来加入4ml的STC并在涡旋混合器中轻轻混合。使用5μg pIM130和1μg和5μg质粒pGW635 DNA进行上述相同步骤。向原生质体中加入20μl TE作为阴性对照。
然后将1ml的悬浮液加入到4ml渗透稳定的上层琼脂中,然后倒入含有MMS(以100mM D-葡萄糖或100mM D-木糖作为碳源)的平板中(轻轻旋转以用上层琼脂覆盖平板)。这些培养基(MMS)用0.8M KCl或1.33M山梨醇渗透稳定。
为确定再生百分比,制备转化前的原生质体(未处理的原生质体,保存于冰上)和转化后的原生质体(从阴性对照获得)的系列稀释液。将100μl 10-3、10-4、10-5和10-6稀释液分别以双份涂布在补加10mM尿苷的MMS平板上。
对于使用pGW635转化真菌的阳性对照,在所有平板上均发现菌落,而在KCl稳定的培养基上的转化率(1-10个转化子/μg质粒DNA)比在山梨醇稳定的培养基上的转化率(100-1000个转化子/μg质粒DNA)低许多,这是由于在后一培养基上的再生率非常高,约为90%,而在KCl稳定的培养基上的再生率为2-5%。
在用质粒pIM130进行转化的情况下,在含D-木糖作为碳源的培养基上发现转化子,而在含D-葡萄糖的培养基上未发现转化子。在山梨醇稳定的培养基上的转化率为100个转化子/μg质粒DNA,而在KCl稳定的培养基上的转化率为少于1个转化子/μg质粒DNA。
实施例3转化子的分析通过将在实施例2中获得的pIM130转化子涂布在含有100mM D-葡萄糖、100mM D-葡萄糖/1%燕麦二粒小麦木聚糖(Sigma#X0627)和1%燕麦二粒小麦木聚糖的MM培养基上来分析其表型。筛选转化子影印到这些培养基上并在30℃保温。约75%的转化子在含木聚糖的培养基上生长,而在含D-葡萄糖的培养基上未发现生长。其余的25%的菌落在所测的三种培养基上均生长。
用Southern分析对所选的具有期望表型(在含木聚糖培养基上生长,在含D-葡萄糖培养基上不生长)的5个转化子进行分析。基本上如de Graaff等人(1988)所述通过经修改的用于分离植物RNA的程序分离真菌DNA。收集在培养基中生长过夜的菌丝体,用冷盐水洗涤,在液氮中冷冻并储存于-80℃。用微切机(Braun)破碎0.5g冷冻菌丝体分离核酸。得到的菌丝体粉末用新制备的抽提缓冲液抽提,抽提缓冲液如下制备将1ml三异丙基萘磺酸(TNA)(20mg/ml)与1ml对氨基水杨酸(PAS)(120mg/ml)充分混合,加入0.5ml 5×RNB缓冲液(1升5×RNB含有121.10g Tris,73.04gNaCl和95.10g EGTA,pH8.5)。加入1.5ml苯酚后在55℃平衡抽提缓冲液10分钟,然后将热的缓冲液加入到菌丝体粉末中,用涡旋振荡器充分混合该悬浮液1分钟。加入1ml氯仿后再次混合悬浮液1分钟。用Sorvall高速离心机以104×g离心10分钟后用等体积苯酚/氯仿(1∶1)再抽提水相一次,然后用氯仿抽提两次。用下述程序从水相中分离DNA用2倍体积乙醇在室温立即从水相中沉淀DNA,随后用Sorvall高速离心机以104×g离心10分钟收集DNA,通过将DNA重溶于无菌蒸馏水并用乙醇沉淀而洗二次,通过向终溶液中加入RNA酶(20μg/ml)而除去RNA。
如上所述用HpaI(Life Technologies)根据厂商指导消化从野生型黑曲霉N402(cspA1)和5个pIM130转化子分离的高分子量DNA(1-2μg),得到的片段通过琼脂糖凝胶电泳分离,并如Maniatis等人(1982)所述转移至High-bond N膜。根据下述程序(Sambrook等人),用如Sambrook等人(1989)所述制备的含黑曲霉pyrA基因的32P标记的3.8kb XbaI片段作为探针进行杂交于68℃在6×SSC(每1000ml 20×SSC含有175.3g NaCl,107.1g柠檬酸钠·5.5H2O,pH7.0),0.1%SDS,0.05%焦磷酸钠,5×Denhardt’s溶液(每500ml 100×Denhardt’s溶液含有10g Ficoll-400,10g聚丙烯吡咯烷酮,10g牛血清白蛋白(Pentax Fraction V))和20μg/ml变性鲱精DNA中预杂交3-5小时,并在含变性放射性标记探针的相同缓冲液中于68℃杂交15-18小时,随后在3×SSC,0.1%SDS中于68℃洗两次,在0.2×SSC,0.1%SDS中于68℃洗两次。用Saran包裹纸覆盖膜,用Konica X光胶片和带常规增感屏的KodakX-Omatic暗盒在-70℃放射自显影过夜。
结果发现在N402泳道中有一10kb杂交带,而在转化子NW205∷130#1,NW205∷130#2和NW205∷130#3中没有这一杂交带。在转化子NW205∷130#1和NW205∷130#3中发现一15kb杂交片段,而在NW205∷130#2中发现一20kb带。这些结果分别对应于在同源pyrA基因座上的单拷贝和双拷贝整合。在转化子NW205∷130#4和NW205∷130#5中,质粒在非同源基因座上整合。选择转化子NW205∷130#2进行诱变。
pIM130的UAS片段包括阳性调节物所需的结合位点以显示UAS的刺激活性,因此在包括pIM130的宿主细胞中对xlnR的抑制将导致存在于pIM130上的双向标记不表达。xlnR的表达由木聚糖或木糖诱导,因此如果宿主具有xlnR则这些底物的存在应导致pIM130的双向标记的表达。
pIM130的UAS片段不包括存在于黑曲霉xlnA基因的天然UAS上的creA的抑制活性所需的位点,因此葡萄糖的存在赋予黑曲霉CRE A+,随后抑制xlnA和其它木聚糖裂解酶编码基因如xlnD和axeA的UAS,并且抑制编码上述木聚糖裂解酶编码基因的UAS激活物的xlnR基因,即阻遏木聚糖裂解酶的表达,导致pIM130不表达。
实施例4突变体的筛选实施例4.1去阻遏突变体的筛选在以高频率振荡的5ml ST(ST0.8%NaCl,0.05%Tween 20)中收集NW205∷130#2的孢子,并通过在无菌玻璃棉塞中过滤除去菌丝体碎片。通过在台式离心机中于室温以3000rpm离心10分钟收集孢子,重悬于5ml盐水中,这一洗涤步骤重复两次并将孢子以1×107个/ml的密度最终重悬于盐水中。将10ml孢子悬液移至玻璃皿中用紫外线以18erg/mm2/min的剂量照射2分钟,诱变后将105和106个孢子涂布于含3% D-葡萄糖的MM+10mM L-精氨酸+10μM烟酰胺平板上(每种10个平板)和含3%D-葡萄糖/3%燕麦二粒小麦木聚糖(Sigma#XO627)的平板上。
4-7天后在每个平板(接种106个孢子的平板)上发现5-10个突变菌落,根据其形态学可以将这些突变菌落分为三类孢子形成完全的大菌落,孢子形成完全的中等大小菌落,孢子形成能力差的小菌落。随机选择20个这些突变体并在含有不同碳源或底物的培养基上测试所选的这些突变体,发现突变体能在含D-葡萄糖的培养基、含D-葡萄糖/木聚糖的培养基和含木聚糖的培养基上生长,而亲本菌株NW205∷130#2仅能在含木聚糖作为碳源的培养基上生长。另外在不同的生色底物上测试了这些突变体4-甲基伞形花内酯基(methylumbelliferyl)-β-D-木糖苷(β-木糖苷酶,内切木聚糖酶)(Sigma #M7008)、4-甲基伞形花内酯乙酸酯(乙酰木聚糖酯酶)(Sigma #M0883)、4-甲基伞形花内酯基-α-L-阿拉伯呋喃糖苷(阿拉伯呋喃糖苷酶)(Sigma #M9519)以及Remazol亮蓝修饰的木聚糖(内切木聚糖酶)(Sigma #M5019)。甲基伞形花内酯衍生物以1mM的终浓度加入到含D-葡萄糖、D-葡萄糖/木聚糖和木聚糖的培养基中,而RBB-木聚糖以1mg/ml的浓度加入到含D-葡萄糖/木聚糖和木聚糖的培养基中。对于所有这些测试的底物,发现突变体在含D-葡萄糖的培养基上生长后具有酶活性,而在亲本菌株NW205∷pIM130#2中未发现表达。在含木聚糖的培养基上发现与NW205∷pIM130相比这些酶表达增加,在所有测试的突变体中5B具有最高的表达水平。在本例中筛选是在作为木聚糖裂解的抑制物有正常活性的底物即葡萄糖上进行的。为确定表达可在不存在阻遏的情况下发生,也包括了木聚糖裂解基因的诱导物木聚糖。这种对照试验优选地包括在本发明的方法中。突变体明显地显示去阻遏。
为比较所产生的活性水平,将黑曲霉N402和突变体5B在含1.5%粗制小麦阿糖基木聚糖作为碳源的MM培养基上培养,在24、42、72和96小时取样测定α-L-阿拉伯呋喃糖苷酶、内切木聚糖酶和β-木糖苷酶的活性。结果(图2A、B、C)显示突变菌株的三种酶活性均增加,α-L-阿拉伯呋喃糖苷酶和内切木聚糖酶活性非常强地增加。
实施例4.2非表达突变体(non-expression mutant)的筛选收获菌株NW205∷130#2的孢子并如实施例4.1所述进行突变,随后涂布于含有100mM D-木糖、补加10mM尿苷、10mM L-精氨酸和0.8mg/ml 5-氟乳清酸(Sigma #F5013)的MM上,将这些平板在30℃保温4-7天。通过涂布在含有1%木聚糖+10mM尿苷+10mM L-精氨酸+10μM烟酰胺的MM上分析具有PYR-表型的64个生长菌落的木聚糖酶表达,在所测的这64个突变体中,有10个突变体在这些含木聚糖的平板上具有缩小的透明区,具有潜在的降低的木聚糖酶水平。在存在和不存在尿苷的含D-葡萄糖、D-葡萄糖/木聚糖和木聚糖的培养基上证实了这些突变体的表型,所有10个突变体在不含尿苷的培养基上均不生长。
为进行进一步的分析,将这些突变体在含50mM果糖+10mM尿苷+10mM L-精氨酸+10μM烟酰胺的MM上于30℃预培养18小时,之后收获菌丝体并将1克湿菌丝体转移至含1%木聚糖的MM上以及转移至含10mM D-木糖+10mM尿苷+10mM L-精氨酸+10μM烟酰胺的MM上。在30℃培养5.5小时后收获菌丝体和培养物滤液,将培养物滤液对1mM NaPi pH5.6透析,之后测定木聚糖酶(Bailey等人,1991)和β-木糖苷酶活性(表1)。发现在这些所选的突变体中木聚糖酶和β-木糖苷酶的表达水平均大大降低。
<p>实施例5非表达突变体的互补5.1构建黑曲霉基因组质粒文库为构建质粒文库,将如实施例3所述分离的10μg黑曲霉NW128(cspA1,nicA1,pyrA6,goxC17)的基因组DNA在100μl终体积中用3.5U Sau3A(Life Technologies)根据厂商指导于37℃部分消化30分钟,通过琼脂糖凝胶电泳分离片段后,从低熔点琼脂糖凝胶中切下6.7kb-9.4kb大小的片段,并如Sambrook等人(1989)所述进行分离。从总共6次消化中分离4μg片段,终浓度为100ng/μl。根据厂商指导将600ng得到的片段连接进100ng BamHI消化的pUC18(Pharmacia #27526201),连接后根据厂商指导用4μl连接混合物转化100μl E.coli DH5α Max Efficiency感受态细胞(LifeTechnologies,#18258-012)。6个随后的转化实验得到约5×104个菌落,将这些菌落重悬于含100μg/ml氨苄青霉素的TY培养基(每100ml培养基含16克Select蛋白胨140(Life Technologies),10克NaCl和10克酵母提取物)并于37℃培养3小时,之后分离质粒DNA并通过CsCl离心纯化。
5.2非表达突变体的互补为了在非表达突变体中的互补,制备三种突变体NW205∷130Ac1-4,NW205∷130 Ac1-15,NW205∷130 Ac4-4的原生质体并如实施例2所述进行转化。在这些转化实验中使用108个原生质体并与下述物质混合如实施例5.1所述的20μg黑曲霉质粒文库的DNA,10μg质粒文库的DNA和10μg自主复制质粒pHELP1的DNA(Gems andClutterbuck,1993),20μg质粒文库的DNA和10μg自主复制质粒pHELP1的DNA,使用2μg pGW635作为阳性对照。转化程序后将混合物涂布于含50mM D-木糖作为碳源并补加10μM烟酰胺和10mM L-精氨酸的用1.33M山梨醇的MM上,约4天后在阳性对照平板上出现菌落并计数,而6天后可以从互补平板上挑取菌落。
通过将得到的转化子菌落涂布于含1%燕麦二粒小麦木聚糖、1mM4-甲基伞形花内酯-β-D-木糖苷、10μM烟酰胺和10mML-精氨酸的培养基上而进行分析。在30℃培养6-7天后检测到荧光菌落,2-3天后这些菌落周围出现木聚糖透明区。
实施例6黑曲霉xlnR基因的克隆实施例6.1黑曲霉xlnR基因的分离黑曲霉xlnR基因是从如实施例5.2所述获得并筛选的转化子中分离。如de Graaff等人(1988)所述从得自NW205∷130 Ac1-4,NW205∷130 Ac1-15,NW205∷130 Ac4-4的13个转化子中分离总DNA。在针对pyrA的选择性(即诱导)条件下培养菌丝体并在作为碳源的1.5%粗制小麦阿糖基木聚糖上木聚糖裂解表达后,用Nucleobond AX100柱(Macherey &amp; Nagel)从其中分离独立复制的质粒。将溶于400μl无菌水中的200μg总DNA与2ml S1缓冲液(50mM Tris-HCl pH8.0,10mM EDTA,100μg RNase A)、2ml S2(200mM NaOH,1%SDS)混合并在室温保温5分钟,然后与2ml S3(2.60M KAc,pH5.2)在冰上保温5分钟,在15000g离心30分钟澄清悬液后,根据厂商指导“纯化质粒和粘粒的方法”(5.3改进的碱/SDS裂解)进行质粒的吸附、洗涤、洗脱和沉淀。得到的质粒DNA溶于150μl无菌水中,用其中20μl转化大肠杆菌DH5α(Sambrook等人,1989)。将从每种质粒制备物中得到的12个大肠杆菌菌落在含50μg/ml氨苄青霉素的250ml LB培养基中于37℃培养9-12小时后,根据Sambrook等人(1989)所述的煮沸裂解程序用1.5ml培养物进行质粒DNA微量制备分离,而细胞经离心沉淀储存于-20℃。HinDIII消化后用琼脂糖凝胶电泳分析这些DNA制备物,揭示有三类质粒,分别为pHELP1型质粒、基因组文库型质粒和大的复合型质粒。从含有后一类型质粒的菌落用250ml培养物冷冻沉淀进行大规模质粒分离,使用的是Nucleobond AX100柱,根据厂商提供的改进的碱/SDS裂解法(Macherey-Nagel)进行。分离得到A和B两种类型质粒,分别为互补子(complementant)A和B。用SalI,PstI,EcoRI,HinDIII消化这两种质粒,琼脂糖凝胶电泳后用变性的放射性标记的pHELP1、质粒A和质粒B经Southern分析得到的片段,实验以三份重复进行。结果显示质粒A和质粒B除pHELP部分外还共享相同的基因组区。根据使用pHELP1质粒发现的杂交信号之间的差异(显示载体和AMA1序列和质粒A和质粒B信号),鉴别和亚克隆与质粒A和质粒B杂交但不与pHELP1杂交的片段。发现质粒B的4kbEcoRI片段和6.5kb HinDIII片段以及质粒A的3kb PstI片段与质粒A和质粒B均杂交,将它们亚克隆进pGEM7/EcoRI,pGEM7/HinDIII和pBluescript/PstI,分别得到质粒pNP1、pNP2和pNP3。繁殖和纯化后将这些质粒用于实施例5.2所述的使用突变体NW205∷130 Ac4-4的互补实验,在这些实验中突变体不使用pHELP1而直接转化,在这些实验中含有6.5kb HinDIII片段的质粒pNP2能互补突变。对pN2衍生质粒的亚克隆和转化揭示亚克隆进pBluescript的5kb BamHI-XbaI片段(得到质粒pNP8)能互补菌株NW205∷130Ac4-4。
实施例6.2黑曲霉xlnR基因的亚克隆为了亚克隆xlnR基因,用pNP1的4kb EcoRI片段作为探针筛选如Harmsen等(1990)的描述构建的黑曲霉基因组文库中的含xlnR区的噬菌体。如Maniatis等(1982)的描述,使用大肠杆菌LE392作为铺平板细菌将噬菌体在含0.7%琼脂糖的NZYCM顶层琼脂糖中以3×103pfu/平板接种在5个直径为85mm的NZYCM(1.5%琼脂)平板上。平板在37℃下过夜培养后,如Maniatis等(1982)的描述将平板转移到HybondN+滤膜(Amersham)上,每个平板重复两次。滤膜在3×SSC中浸湿后,室温下将此滤膜在3×SSC中洗涤60分钟。使用如Sambrook等(1989)描述的方法制备的32P标记的4kb EcoRI片段按照下列方法(Sambrook等,1989)进行杂交68℃下在6×SSC(1000毫升20×SSC含有175.3g NaCl,107.1g柠檬酸钠.5.5H2O,pH7.0),0.1%SDS,0.05%焦磷酸钠,5×Denhardt溶液(500毫升100×Denhardt溶液含有10g Ficoll-400,10g聚乙烯吡咯烷酮,10g牛血清清蛋白(Pentax组分V)),20μg/ml变性鲱精DNA中预杂交3-5小时;68℃下在相同的含有变性的标记探针的缓冲液中杂交15-18小时,然后68℃下在2×SSC,0.1%SDS中洗涤两次,0.2×SSC,0.1%SDS中洗涤两次。用Saran包装膜覆盖此膜,并在-70℃下使用Konica X-光胶片和带有常规增感屏的X-Omatic暗盒进行过夜放射自显影。
此筛选得到了大约12个阳性噬菌体,纯化了其中的8个。使用巴氏吸管从平板上挑取每一个阳性噬斑,并如Maniatis等(1982)的描述在含有20μl氯仿的1ml SM缓冲液中将所说的噬斑从琼脂填料中洗脱下来。使用影印滤膜通过重复上述的方法从包含50-100个分离噬菌体之噬斑的平板上纯化得到的噬菌体。
纯化后,通过在NZYCM培养基上接种5×103个噬菌体来繁殖这些噬菌体。37℃下过夜培养后,得到铺满的平板,通过加入5毫升SM缓冲液并将平板在4℃下间歇摇动贮存2小时来从平板中洗脱这些噬菌体。使用吸管收集上清液后,通过4℃下以4,000×g离心10分钟从此溶液中除去细菌。向上清液中加入0.3%氯仿,确定pfu数值。这些噬菌体原液(A-R/H-R)含有大约109pfu/ml。
经Southern分析方法分析如Sambrook等(1989)描述的方法分离的5个选中的噬菌体A-R、B-R、C-R、E-R、F-R的DNA。37℃下在含有下列溶液的反应混合物中将DNA消化5小时5μl(≈1μg)DNA溶液;2μl合适的10×反应缓冲液(Life Technologies);限制性内切酶10 U(Life Technologies);无菌蒸馏水定容至20μl。65℃下将样品保温10分钟,在溶解在1×TAE缓冲液中上样到0.6%琼脂糖凝胶中之前,在冰上快速冷却。在25V下通过电泳15-18小时分离这些DNA片段。
在电泳后,通过碱性真空印迹法(VacuGene XL,Pharmacia LKB)如VacuGene XL操作说明(pp.25-26)的描述将所说的DNA变性并转移到尼龙膜(Hpbond N,Amserham)上,接下来进行预杂交和使用变性的标记的质粒pNP8的5 kb BamHI-XbaI片段杂交,杂交条件如上所述。在-70℃下通过使用增感屏在Kodak XAR-5 X-光胶片上曝光18小时获得杂交图式。在所有5个克隆中,发现了来源于同一个基因组区的片段,并构建了这些片段的限制图谱。
以限制图谱为基础,筛选5kb BamHI-XbaI片段用于亚克隆。将100ng pBluescript BamHI-XbaI消化的片段与250ng的噬菌体B-R的5kb BamHI-XbaI片段混合,并向混合物中加入4μl 5×连接缓冲液(组成500mM Tris-HCl,pH7.6;100mM MgCl2;10mM ATP;10mM二硫苏糖醇;25%PEG-6000)和1μl(1.2U/μl)T4DNA连接酶(LifeTechnologies),混合物的最终体积为20μl。14℃下保温16小时后,用无菌水将混合物稀释到100μl。用10μl稀释的混合物转化大肠杆菌DH5α感受态细胞(如Sambrook等(1989)的描述进行制备)。得到的6个克隆在含有100μg/ml氨苄青霉素的LB培养基(每1000毫升的LB培养基含有10g胰酶化蛋白胨(BBL),5g酵母抽提物(BBL),10gNaCl,0.5mM Tris-HCl pH7.5)中过夜生长。通过如Maniatis等(1982)描述的煮沸裂解法从培养物中分离质粒DNA,在限制性分析中使用此质粒筛选含有所需要的质粒pIM230的克隆。从生长在含有100μg/ml氨苄青霉素的LB培养基中的500毫升包含pIM230的大肠杆菌DH5α培养物中大规模分离质粒DNA(Maniatis等,1982)。通过CsCl离心,乙醇沉淀纯化质粒,并溶解在400μl TE中。所得的产量大约为500μg。根据布达佩斯条约于1996年6月在真菌菌种保藏中心以保藏号CBS 678.96保藏含有质粒pIM230的大肠杆菌。
实施例6.3黑曲霉xlnR cDNA的亚克隆为获得xlnR基因的锌指区部分的cDNA克隆,以类似于ZAPTM-cDNA合成试剂盒(Stratagene)中所述的方法,用起始自位置1476-1496(SEQ ID NO9)的寡核苷酸在1μg来自培养在木聚糖上30小时的黑曲霉N402野生型菌株的polyA+RNA上进行反转录酶和第二条链合成反应。用第二条链反应的一部分样品(1/50)作为模板,利用引物RO26和RO25(从SEQ ID NO9的946-970位衍生而来)进行PCR,依次为95℃、58℃和72℃各60秒,共35个循环,而后在72℃保温5分钟。将得到的500bp片段亚克隆到pGEM-T载体(Promega)中并测序。
实施例7xlnR基因的一级结构实施例7.1xlnR基因的序列分析通过从pNP8和pIM230中亚克隆这些片段和使用特异性的寡核苷酸作为测序反应中的引物测定黑曲霉xlnR基因、它的启动子/调节区、基因的结构部分和终止区的序列。
为分析核苷酸序列,分离出限制性片段,然后将其克隆到用适当的限制酶消化的pEMBL、pUC、pBluescript、pGEM DNA载体中。通过双脱氧核苷酸链终止法(Sanger等,1977)使用Pharmacia ALFexpress自动测序仪和Thermosequenase测序试剂盒(Amersham)测定核苷酸序列。在基因特异性寡核苷酸情况下,联合使用PharmaciaCy5内部标记试剂盒和T7 DNA聚合酶测序试剂盒(Pharmacia)。根据厂商指导进行反应和电泳,用PC/GENE程序(Intelligenetics)进行计算机分析。在SEQ ID NO9中给出了测定的序列。
实施例7.2xlnR基因的描述包含xlnR结构基因的序列(SEQ ID NO9)的前端是一个947个核苷酸长的上游区。在上游非编码区发现富CT序列但未发现TATAA框。xlnR基因的结构部分从948到3690位,由两个内含子间断,1174-1237位的内含子已由测定如实施例6.2中所述的pIM230中的基因组片段和实施例6.3中所述的cDNA的一部分的序列所证实。第二个内含子在3496-3549位,该第二个内含子的序列符合正常在真菌中发现的保守内含子序列,用于剪接连接和套索序列。
xlnR基因编码一种875个氨基酸的蛋白质。该衍生的多肽含有一典型的N-末端锌双核簇区,由1110-1260位核苷酸编码,其具有典型的与锌配位的6个半胱氨酸。在这一区域中还有几处与例如Kraulis等人(1992)(引入本文作参考)的图1列出的其它真菌调控蛋白相似处。
在2623-2649位发现一典型的RRRLWW基序,这一基序在几个双核锌簇调控蛋白中均有发现(但略有差异),如Suarez等人(1995)所注意到的。
实施例7.3黑曲霉突变体中的xlnR的序列分析为确定在如实施例4.2所述的不表达木聚糖裂解系统的黑曲霉突变体中的突变是否位于xlnR,测定这些突变体的xlnR基因的序列。为此,针对每种NW205∷130Ac突变体制备富含5.5kb BamHI xlnR片段的文库。为构建这种富含xlnR的文库,从每一菌株中分离用BamHI,HinDIII,XhoI,SstI和KpnI消化的基因组DNA的5.5kb片段,将这些片段与BamHI消化的去磷酸化pUC18载体(Ready-To-GoTMpUC18BamHI/BAP+连接酶,Pharmacia)混合并连接。根据厂商指导用连接混合物转化大肠杆菌DH5α(MAX Efficiency DH5αTM感受态细胞,Gibco-BRL),筛选Amp抗性菌落,得到5×102-103个菌落的初级文库。在主平板上复制初级文库后,根据标准程序(Sambrook等人,1989)用变性的放射性标记的pIM230的BamHI-XbaI插入片段作为探针通过菌落滤膜杂交筛选这些黑曲霉xlnR富集文库。
对于每种突变菌株,用牙签从主平板上挑取阳性菌落,在含100μg/ml氨苄青霉素的5ml LB培养基中于37℃培养15-18小时,之后如Sambrook等人(1989)所述用煮沸裂解进行质粒DNA的微量制备分离。用琼脂糖凝胶电泳分析这些DNA制备物并将消化图谱与xlnR特异性图谱比较,揭示出菌落含有正确的5.5kb BamHI xlnR片段。如实施例7.2所述,用特异性xlnR寡核苷酸作为引物在测序反应中测定黑曲霉突变体的序列。对于突变体NW205∷130 Ac 1-15,在3479位测定有一单碱基对取代,导致SEQ ID NO9中823位亮氨酸变为丝氨酸。对于突变体NW205∷130 Ac 2-5,在3655位测定有一单碱基对取代,导致SEQ ID NO9中864位酪氨酸变为天冬氨酸。这些突变证实两个突变体均为xlnR突变体。
实施例8xlnR在黑曲霉中的表达实施例8.1不表达木聚糖裂解系统的黑曲霉突变体的互补为了在所有非表达突变体中的互补,根据实施例2所述转化实施例4所述的所有10种NW205∷130 Ac突变体,转化是将原生质体与作为转化率对照的pGW635和测试pIM230的互补能力的pIM230DNA进行合并。
通过涂布于含1%燕麦二粒小麦木聚糖作为碳源的合适培养基上,分析得到的转化菌落的木聚糖裂解能力并与它们的亲本突变菌株比较,2-3天后在所有10种突变体的转化菌落周围有木聚糖透明区,但亲本突变菌株没有该透明区,因此显示木聚糖裂解能力的恢复。
实施例9xlnR基因的剂量对黑曲霉木聚糖裂解系统表达的作用为了研究xlnR基因在改进菌株增加木聚糖裂解表达方面潜在的应用,如实施例2所述使用19μg的包含xlnR的质粒pIM230和2μg包含构巢曲霉argB基因(Johnstone等,1985)的质粒pIM650在共转化实验中将含有多拷贝(大约6个)的编码β-木糖苷酶的黑曲霉xlnD基因的菌株N902∷200-18转化成精氨酸原养型。在含有1%燕麦二粒小麦木聚糖的MM平板中筛选获得的增加了内切木聚糖酶表达的转化子。选择4个水解圈形成最快最大的菌落确定xlnR拷贝数。为此,分离这些转化子和受体菌株的DNA,并将系列稀释液点到Hybond N膜上。使用跨越xlnR基因的编码序列的标记的4.5kb SmaI/Xbal片段,从杂交后获得的信号计算拷贝数。基于与受体菌株比较,确定N902∷200-18-R14中的xlnR拷贝数为8,而N902∷200-18-R16中的拷贝数为32。对于这两种转化子,在菌株在液体培养基中生长后,通过Northern分析方法分析增加基因xlnR的剂量的效应。在1%果糖上预培养18小时后,在转移到2%燕麦二粒小麦木聚糖作为碳源的转移实验中进行此项分析。在转移后8和24小时取样(菌丝样品),使用TfiZol(Life Technologies)按照厂商的说明从中分离总RNA,并经Northern印迹分析方法进行分析(Sambrook等,1989)。在这些转化子中,木聚糖酶B的表达水平相对于受体菌株明显增加,这一点是在通过使用标记的黑曲霉xlnB的1kb EcoRI/XhoI片段杂交后确定的(Kinoshita等,1995)。
为了进一步研究xlnR基因在改进菌株增加内切木聚糖酶表达方面潜在的应用,如实施例2所述根据下述策略转化黑曲霉1、pGW635(pyrA)(阳性对照),2、pDB-K(XA),3、pDB-K(XA)+pIM230,4、pGW635+pIM230。质粒pDB-K(XA)含有在载体pEMBL18中的黑曲霉pyrA基因和来自塔宾曲霉的黑曲霉木聚糖酶A基因。获得所有使用条件的转化子,根据在燕麦二粒小麦木聚糖平板上的水解圈大小筛选过量表达内切木聚糖酶的菌株(测试了来自每组的20个转化子)。
每组选一个转化子培养进行活性分析,将菌株在含果糖的培养基上预培养18小时,之后将菌丝体(50ml中有2.5g湿重菌丝体)转移到含1.4%粗阿糖基木聚糖的培养基,所有培养均在摇瓶中进行。在30℃培养40小时,通过HPLC分析确定木聚糖酶A的水平,同时测定β-木糖苷酶和内切木聚糖酶活性。在标准Pharmacia-LKBHPLC装置(Uppsala,瑞典)中进行层析,以1.5ml/min运行SOURCE15Q.HR5/5柱,缓冲液A=20mM TRIS缓冲液,pH7.5,缓冲液B=含有1M NaCl的20mM TRIS缓冲液,pH7.5,在30分钟内缓冲液B梯度为0-50%,在280nm检测,Pharmacia-LKB UV-MII,吸收值为0.1-0.2,见图3。用1000μl 20mM TRIS缓冲液,pH7.5稀释100μl培养物培养基,将1000μl稀释样品加到柱中,然后可见以约30% B缓冲液洗脱的峰代表木聚糖酶A的活性。图3中示出了每组转化子中在HPLC分析中显示最高木聚糖酶A活性/峰的一个菌株。内切木聚糖酶活性的测定是通过测定从来自Megazyme,Warriewood,澳大利亚的天青蛋白染色的交联小麦阿糖基木聚糖(Xylazyme片)释放的染色片段而进行。通过在40℃、0.1M乙酸盐缓冲液,pH3.4中与100XU/g(木聚糖酶单位)的内标酶比较而计算木聚糖酶活性。在仅有木聚糖酶A发挥内切木聚糖酶活性的pH条件下,在水不溶性阿糖基木聚糖上分析了相同的4个转化子,分析结果如表2所示。
表2<
<p>从图3和表2所示的结果可清楚地看出用木聚糖酶A编码基因进行的转化如预期地大大增加了木聚糖酶A的酶活性,更令人吃惊的是,转化后使用激活基因xlnR也大大增加了木聚糖酶A的水平,这提示在未转化的亲本中存在对激活物XYL R(=xlnR基因产物)水平的限制。因此,预计在pDB-K(XA)多拷贝转化子中反式作用调控因子的量更加有限,这一点通过pDB-K(XA)/pIM230转化子的木聚糖酶A水平是pDB-K(XA)多拷贝转化子的两倍这一结果而证实。
实施例10筛选丝状真菌的xlnR基因为了分析是否可通过异源杂交从其它真菌分离xlnR对应物,使用xlnR基因的4.5kb SmaI/XbaI片段作为探针。从下述菌株中分离DNA黑曲霉N902(argB15,cspA1,fwnA1,metB10,pyrA5),塔宾曲霉NW184(cspA1,fwnA1,pyrA22),保藏号为FGSC187的构巢曲霉WG096(pabaA1,yA2),保藏号为CBS101.43的A.aculeatusNW240(pyrA3),保藏号为CBS115.80的A.aculeatus NW217(fwnA1,cspA1,pyrA4,lysA1),保藏号为CBS115.52的A.foetidus(awamori)NW183(cspA1,fwnA1,pyrA13,lysA1),日本曲霉CBS114.51和Trichoderma reesei QM9414。用BamHI或XhoI消化1-2μg DNA后如实施例3所述用Southern分析进行分析。所用杂交条件为56℃下在6×SSC(1000毫升20×SSC含有175.3g NaCl,107.1g柠檬酸钠.5.5H2O,pH7.0),0.1%SDS,0.05%焦磷酸钠,5×Denhardt溶液(500毫升100×Denhardt溶液含有10g Ficoll-400,10g聚乙烯吡咯烷酮,10g牛血清清蛋白(Pentax组分V)),20μg/ml变性鲱精DNA中杂交18-24小时;然后68℃下在5×SSC,0.1%SDS中洗涤两次,每次30分钟,在56℃下在2×SSC,0.1%SDS中洗涤两次,每次30分钟。杂交后用Saran包装膜覆盖此膜,并在-70℃下使用KonicaX-光胶片和带有常规增感屏的X-Omatic暗盒进行过夜放射自显影。
结果是在所有分析的真菌中均发现杂交片段,在黑曲霉、塔宾曲霉和臭曲霉中发现非常强的杂交信号,而在其它所研究的菌株中也发现了明显的杂交信号。
实施例11利用其它启动子片段的筛选系统的应用构建含有来自黑曲霉abfA基因(Flipphi等人,1994)和黑曲霉abfB基因(Flipphi等人,1993)的启动子片段的质粒。为了构建含abfA启动子片段的质粒,如实施例1所述将来自pIM900(Flipphi等人,1994)的1.4kb XhoI/PstI片段连接进SalI/PstI消化的pAlter(Promega)。利用Altered Sites II体外诱变系统(Promega)在相对于翻译起始位点为-83至-88位创建一XhoI限制位点(Flipphi等人,1994)。从得到的质粒分离953bp SstI/XhoI片段,将这一片段和来自pIM130的1.5kb XhoI片段连接进用SstI/XhoI消化的pBluescript(Stratagene)。通过用BglII消化鉴别含有正确方向的1.5kb XhoI片段的质粒,得到的质粒命名为pAP8。
类似地从pIM991(Flipphi等人,1993)分离来自abfB启动子的910bp PstI片段并连接进PstI消化的pEMBL19,用SalI消化得到的质粒并与来自pIM130的1.5kb XhoI片段连接。通过用BamHI消化鉴别含有正确方向的两个片段的质粒,得到的质粒命名为pIM132。
含有来自黑曲霉pgaII的片段的第三个质粒的构建是将1450bpXbaI/XhoI片段克隆进载体pAlter。利用Altered Sites II体外诱变系统(Promega)在相对于翻译起始位点为-107至-112位创建一XhoI限制位点(Bussink等人,1991)。从得到的质粒分离1.2kbXbaI/XhoI片段,将这一片段和来自pIM1 30的1.5kb XhoI片段连接进用XbaI/XhoI消化的pBluescript(Stratagene)。通过用HinDIII消化鉴别含有正确方向的1.5kb XhoI片段的质粒,得到的质粒命名为pIIP7。从相同的pgaII基因分离来自223bp HinDIII/PstI片段(Bussink等人,1992)并连接进HinDIII/PstI消化的pEMBL19,用SalI消化得到的质粒并与来自pIM130的1.5kb XhoI片段连接。通过用HinDIII消化鉴别含有正确方向的两个片段的质粒,得到的质粒命名为pHPII。
通过如实施例2所述的转化将全部4个质粒导入黑曲霉NW219,在使用具有abf启动子片段的构建物(质粒AP8和pIM132)的转化实验中用10mM L-阿拉伯糖醇作为诱导物,在使用携带pgaII片段的质粒的转化实验中用1%聚半乳糖醛酸(USB化学品)作为诱导物。尽管发现质粒转化率很高,但是使用含pgaII启动子片段的质粒pIIP7和pHPII的转化实验仅分别发现5和7个转化子。
如实施例3所述对从利用质粒pAP8和pIM132(abf启动子片段)的转化实验得到的转化子进行表型分析,使用的是含10mM L-阿拉伯糖醇/50mM山梨醇,10mM L-阿拉伯糖醇/50mM D-葡萄糖和50mM D-葡萄糖的MM。在从质粒pAP8得到的29个转化子中的10个转化子中以及从质粒pIM132得到的30个转化子中的13个转化子中发现了预期表型,即在10mM L-阿拉伯糖醇/50mM山梨醇上生长,在10mM L-阿拉伯糖醇/50mM D-葡萄糖和50mM D-葡萄糖上不生长。在含1%聚半乳糖醛酸,1%聚半乳糖醛酸/50mM D-葡萄糖和50mM D-葡萄糖的MM上测试了从质粒pIIP7和pHPII得到的转化子,然而所有转化子均不显示预期的表型,所有转化子在三种培养基上均能生长,这提示这些转化子来自pyrA基因座的双交换。
基于含pgaII启动子片段的质粒的结果,我们测试了通过增强诱导是否能提高转化频率。我们假定转化失败或多或少地由缺少诱导物所致,因为没有聚半乳糖醛酸酶的单体诱导物,因此需降解聚合物以释放诱导物,导致表达。我们测试了用少量uridin补加到培养基中是否能克服这一问题。为此,将NW219和转化子NW219∷pIM132#30在含有诱导abfB的1%燕麦二粒小麦木聚糖和分别为0、0.001、0.005、0.01、0.1、1、5和10mM的增加浓度的uridin的培养基上进行测试。在这一实验中,受体菌株NW219在含低于0.01mM uridin的培养基上不生长,而NW219∷pIM132#30转化菌株在所有条件下均生长,然而孢子形成程度和菌落形态有变化,给出类似野生型孢子形成程度的最低uridin浓度约为0.01mM uridin。
基于这些结果,用质粒pIIP7和pHPII重复对黑曲霉NW219的转化,使用的培养基是含有1%柠檬果胶(酯化度45%)(CopenhagenPectin factory)以及分别补加0.01mM和0.005mM uridin的实施例2所述的MMS培养基。这导致转化子数增加,将这些转化子在含如上所述的1%柠檬果胶、1%柠檬果胶/50mM D-葡萄糖和50mM D-葡萄糖的培养基上进行测试,预期表型分别为生长、不生长和不生长。30个pIIP7转化子中有10个转化子以及30个pHPII转化子中有9个转化子具有预期表型。
通过Southern分析法分析具有预期表型的转化子,如实施例3所述分离DNA并分析。对于从含abfA启动子片段的质粒pAP8产生的转化子,用ClaI消化DNA,对于从pIM132(abfB)质粒产生的转化子用ClaI消化DNA,对于从pgaII质粒pIIP7和pHPII产生的转化子用ClaI消化DNA。基于用下述放射性标记的片段的杂交获得的放射自显影图,根据预期拷贝数筛选转化子,所述的标记片段为pyrA基因的3.8kb XbaI和1.2kb ClaI片段。选定了下述转化子AP8/16(abfA),NW219∷132#8(2拷贝)和NW219∷132#30(3-4拷贝)(abfB),NW219∷pIIP7#3(2拷贝)和NW219∷pIIP7#9(2拷贝)(pgaII)。
将选定的转化子如实施例4所述进行诱变,在MM+50mM D-葡萄糖和MM+10mM L-阿拉伯糖醇/50mM D-葡萄糖上筛选阿拉伯呋喃糖苷酶去阻遏突变体,而在MM+50mM D-葡萄糖和MM+1%柠檬果胶/50mM D-葡萄糖上筛选聚半乳糖醛酸酶去阻遏突变体。4-7天后在每个平板上分析5-10个突变体菌落,基于这些菌落的形态学可将其分为三类孢子形成完全的大菌落,孢子形成完全的中等大小菌落和孢子形成差的小菌落。随机选择20个这些突变体并在含有不同碳源或底物的培养基上测试所选的这些突变体,发现阿拉伯呋喃糖苷酶突变体菌落能在含D-葡萄糖的培养基、含D-葡萄糖/L-阿拉伯糖醇的培养基和含L-阿拉伯糖醇的培养基上生长,而亲本菌株仅能在含L-阿拉伯糖醇作为碳源的培养基上生长。类似地,聚半乳糖醛酸酶突变体也能在MM+50mM D-葡萄糖和MM+1%柠檬果胶/50mM D-葡萄糖和MM+1%柠檬果胶上生长,而亲本菌株仅能在MM+1%柠檬果胶上生长。另外如实施例4所述在生色底物甲基伞形花内酯基-α-L-阿拉伯呋喃糖苷上测试了阿拉伯呋喃糖苷酶突变体(每种20个)。尽管通过底物荧光检测到亲本菌株在含D-葡萄糖/L-阿拉伯糖醇培养基上不表达阿拉伯呋喃糖苷酶,但是突变体具有不同水平的表达,在D-葡萄糖培养基上选择的突变体中发现了最高水平。
在MM+1%柠檬果胶/50mM D-葡萄糖上测试聚半乳糖醛酸酶突变体,接种平板2-3天后通过如Ried and Collmer(1985)所述染色而使聚半乳糖醛酸酶活性肉眼可见。在亲本菌株情况下发现了小水解圈,而在突变体中检测到各种程度的水解圈形成的增大。
根据实施例4,在含FOA的培养基上还筛选了非表达突变体,为此,将NW219∷132#30(abfB)进行突变并涂布在MM+10mM L-阿拉伯糖醇+1mg/ml FOA+10mM uridin上。7-10天后选择突变体并涂布在含10mM L-阿拉伯糖醇/50mM山梨醇、10mM uridin并具有用于检测内切arabinan表达的含0.5% AZCL-阿拉伯聚糖(Megazyme,Sydney,澳大利亚)的顶层琼脂的MM上。所检测的30个转化子中的2个即132/30 F12和F26不能从底物释放染料,指示缺乏内切arabinan活性。在含10mM L-阿拉伯糖醇和10mM uridin的液体MM中培养这些转化子,随后在培养物滤液中测量阿拉伯呋喃糖苷酶活性,发现活性降低至少4倍。
将NW219∷pIIP7#3进行突变并涂布在含1%柠檬果胶/50mM山梨醇、10mM uridin和1mg/ml FOA的MM上。培养6-10天后挑选突变体并如上所述筛选聚半乳糖醛酸酶活性。在所选65个突变体中有3个突变体在聚半乳糖醛酸酶活性染色后有降低的水解圈形成,提示聚半乳糖醛酸酶表达降低。
EP95201707.7是共同未决的欧洲专利申请,本文在此将该申请的实施例7、8和11附上。
EP95201707.7的实施例7使用质粒pIM200转化黑曲霉以1×106个孢子/ml在250ml由MM组成的培养基(添加了2%葡萄糖,0.5%酵母抽提物,0.2%酪蛋白氨基酸(不含维生素),2mM亮氨酸,10μM烟酰胺,10mM尿苷)中接种NW155菌株(cspAl,argBl3,pyrA6,nicA1,leuA1,prtF28)(来源于NW228,Van den Hombergh等,1995)的孢子,30℃下在250rpm有轨New Brunswick摇床中培养菌丝体16-18小时。使用Büchner漏斗和温和抽吸在Myracloth(尼龙纱布)上收集菌丝体,并且用SP6(SP60.8%NaCl,10mM磷酸钠缓冲液,pH6.0)洗涤几次。将150ml的Novozyme 234溶解在已加入1g菌丝体(湿重)的20ml SMC(SMC1.33M山梨醇,50mM CaCl2,20mMEMS缓冲液,pH5.8)中,并且小心地悬浮。30℃下用温和振荡器培养悬浮液1-2小时,每隔30分钟将菌丝体小心地悬浮,取样后用血细胞测定仪计数原生质体以检测原生质体的形成。当存在足够的原生质体(大于1×108)时,小心地悬浮并通过无菌玻璃棉管塞过滤除去菌丝体碎片。使用台式离心机在4℃以3000rpm离心10分钟收集菌丝体,除去上清液,将沉淀物小心地悬浮在5ml STC(STC1.33M山梨醇,50mM CaCl2,10mM Tris/HCl,pH7.2)中。洗涤步骤重复两次,最后将原生质体以1×108/ml密度悬浮在STC中。
通过以下步骤进行转化将20μg的pIM200 DNA和含有黑曲霉pyrA基因的5μg pGW635(溶解在10-20μl的TE中)与5μl的PEG缓冲液(PEG缓冲液25%PEG-6000,50mM CaCl2,10mM Tris/HCl,pH7.2)一起加入到200μl的原生质体悬浮液中,然后使用移液管上下移动多次慢慢地将上述液体混合,并在室温下温育20分钟。此后,加入2μl的PEG缓冲液,将溶液慢慢混合并在室温下温育5分钟,接下来加入4ml的STC并在涡旋混合器中慢慢混合。然后将1ml的悬浮液加入到4ml含有0.95M蔗糖渗透稳定的优质琼脂中,然后倒入渗透稳定的平板中。另外使用pGW635转化黑曲霉作为对照。
EP95201707.7的实施例8转化子的分析通过将在实施例7中获得的pIM200转化子接种在含有1%燕麦二粒小麦木聚糖和1mM 4-甲基伞形花内酯基-β-木糖苷的MM培养基上来分析其表型。检验了26个转化子,其中5个显示出增加了的荧光。将这些转化子和转化子PYR+(作为参考)一起培养在含有1%燕麦二粒小麦木聚糖的MM上,培养20、27和42小时。此后测量β-木糖苷酶对PNP-X的活性。结果列于表C中。
在全部5个选择的转化子中都发现了β-木糖苷酶活性水平的增加,最高水平比野生活性多30多倍。使用如EP95201707.7的实施例3中的描述制备的抗β-木糖苷酶的抗体通过Western印迹和使用Bio-Rad免疫印迹GAR-AP测定试剂盒按照供应商的说明证实了这些结果。
表C在下述保温时间后的黑曲霉转化子的β-木糖苷酶活性(mU/ml培养物滤液)20hr 27hr42hrpGW635 15 16 17XlsA1 82 86 51XlsA4 90 112 78XlsA8 211 239 384XlsA9 63 110 74XlsA12 96 295 527EP95201707.7的实施例11黑曲霉xlnD基因的破坏实施例11.1破坏(disruption)质粒pIM203和pIM204的构建通过经PCR产生xlnD基因的内部片段来构建此基因的破坏质粒pIM203和plM204。使用衍生于xlnD序列(SEQ ID NO1)的寡核苷酸产生所说的片段。xylos001是从1157至1176的位置上产生的,xylos004是从3147至3164位置上产生的。通过包含10μl 10×反应缓冲液(100mM Tris-HCl,pH8.3,500mM KCl,15mM MgCl2,0.01%明胶),4种脱氧核苷三磷酸各16μl 1.25mM,1ng质粒pIM200 DNA,每种寡核苷酸各1μg(定容到100μl)的PCR产生此片段。混合反应混合物,并加入1μlTAQ聚合酶(5U/μl)(Life Technologies)。通过在92℃下温育3分钟使此DNA变性,接下来进行25个循环(92℃,1分钟;52℃,1.5分钟;72℃,1.5分钟)。25个循环后,将混合物在72℃下温育5分钟。经琼脂糖电泳的反应产物分析显示出一个大约2000bp的片段,基于此基因的序列,此片段的大小在预料之内。将所得的片段亚克隆到载体pGEM-T(Promega)中,形成质粒pIM202。在EcoRV/PstI消化的pIM202载体中通过连接pILJ16的SmaI/PstI片段(Johnstone等,1985)(包含构巢曲霉的argB基因(Upshall等,1986))构建质粒pIM203。在SpeI/NsiI消化的pIM202载体中通过连接pIM130(EP 95202346.3)的NsiI/XbaI片段(包含在塔宾曲霉xlnA启动子UAS控制之下的pyrA基因)构建质粒pIM204。
实施例11.2黑曲霉xlnD基因的破坏如实施例11.1中所述的包含xlnD内部片段和argB基因(pIM203)或pyrA基因(pIM201)的质粒作为在转化中的选择标记用于破坏黑曲霉xlnD基因。为此,如实施例7中所述,分别利用选择精氨酸或尿苷原养型的质粒pIM203和pIM204转化黑曲霉N902(argB15、cspA1、fwnA1、metB10、pyrA5)。如实施例8所述在1%木聚糖平板上筛选得到的转化体对甲基伞形花内酯基-β-木糖苷的活性。在这两组转化体中筛选了20个转化体。生长24小时后,在这些转化体中每一组的MUX活性水平都有明显减少。选择的转化体的Southern分析表明pIM203转化体在同源的xlnD位点有多拷贝的整合。pIM204转化体在xlnD位点发生单一同源整合。如实施例8中所述的,分析这些转化体的PMP-X的活性表明β-木糖苷酶降低至少100倍。
实施例11.3xlnD基因的过量表达和失活对黑曲霉木聚糖裂解系统表达的作用为了确定xlnD表达对木聚糖裂解系统(spectrum)表达的作用效应,将黑曲霉N902、两个在N902中的xlnD多拷贝转化体、xlnD基因破坏菌株在液体培养基上培养。在1%果糖上预培养18小时后,转移到2%燕麦二粒小麦木聚糖或3%D-木糖作为碳源的培养基上培养。在培养物滤液中按照PNP-X活性测定方法确定β-木糖苷酶活性。在这两种碳源中,对于pIM200转化体能够发现明显的过量表达,而对于两种(pIM203和pIM204)失活转化体几乎没有PNP-X活性。xlnD基因破坏转化体表明最初内切木聚糖酶表达水平降低,然而在16小时后其活性最终增加,结果相对于黑曲霉野生型其活性增加,因此,所形成的木聚糖制剂中不含β-木糖苷酶。
接下来使用Dionex系统和脉冲Amperometric检测通过HPLC分析方法分析培养物滤液。为此,收获后立即煮沸1ml培养物滤液,以便失活木聚糖裂解酶,然后将样品离心10分钟(14,000rpm,4℃,Eppendorf离心机)。将得到的上清液用bidest稀释5倍,使用DionexCarbofac 100柱通过HPLC分析20μl上清液。分析结果表明在野生型和过量表达的转化体中仅在最初阶段能够在培养物滤液中检测到木糖寡聚物的存在。在破坏突变体中,在培养物滤液中积累木乙糖,而很少积累木丙糖,所以得到木寡聚物尤其是木乙糖和木丙糖的源。
参考文献Andrianopoulos,A.和Hynes,M.J.(1988),分子细胞生物学83532-3541。
Aviv,H.和Leder,P.(1972)美国科学院院刊111408-1412。
Balance D.J.和Turner G.C.(1985)基因36321-331。
Bailey,A.M.等人(1991)核酸研究195273-4278。
Bailey,A.M.,Biely.,P.和Poutanen,K.(1992)生物工程杂志23257-270。
Berka,R.M.,Ward,M.,Wilson,L.J.,Hayenga,K.J.,Kodama,K.H.,Carlomagno,L.P.和Tahompson,S.A.(1990),基因86153-162。
Bussink,H.J.D.,van den Hombergh.J.P.T.W.,van den IJssel,P.R.L.A.和Visser J.(1992),应用微生物学和生物工程37,324-329.
Davies,R.W.(1991),曲霉属中的高水平重组蛋白生产系统的分子生物学,见Leong,S.A.和Berka,R.M.和Berka,R.M.编辑的《分子工业真菌学用于丝状真菌的系统及应用》Marcel Dekker,Inc.,第45-82页。
Ekwall,K.和Ruusla,T.(1991),核酸研究191150。
Felenbok,B.和Sealy-Lewis H.M.(1994),见《曲霉50年》Martinelli,S.D.和Kinghorn,J.R.编辑,141-179页。
Flipphi,M.J.A.,van den Heuvel,M.,van der Veen,P.,Visser,J.,和deGraaff,L.H.(1993)当今遗传学24525-532。
Flipphi,M.J.A.,Visser,J.,van der Veen,P.和de Graaff.L.H.(1994)微生物学1402673-2682。
Fowler,T.等人(1990),当今遗传学18537-545。
Gems D.H.和Clutterbuck A.J.(1993),当今遗传学24520-524。
Goosen T,Bloemheuvel G,Gysler C,Bie DA de,Broek HWJvan den,Swart K(1987),当今遗传学11499-503。
Graaff LH de(1988)构巢曲霉和黑曲霉的丙酮酸激酶基因的结构和表达,PhD论文,Landbouw大学,Wageningen,荷兰。
Graaff L.H.de,van den Broeck,H.C.,van Ooijen A.J.J.和Visser,J.(1994),分子微生物学12479-490。
Gwynne.D.I.,Buxton.F.P.,Gleeson,M.A.和DaviesR.W.(1987),外源蛋白质从曲霉属各物种的基因工程分泌,见Burgess.R.编辑的《蛋白质纯化微量至常量》Alan R.Liss,纽约,第355-365页。
Harmsen,J.A.M.,Kusters-van Someren,M.A.,Visser,J.(1990)当今遗传学18161-166。
c.f.Hinnen,A.等人(1995).见《在重组微生物中的基因表达》Smith,A.编辑,Marcel Dekker Inc.,纽约,121-193页。
Hombergh van den,J.P.T.W.,van de Vodervoort,P.J.I.,van derHeijden,N.C.B.A.,和Visser,J.(1995),当今遗传学28299-308。
Johnstone,I.L.,Hughes,J.和Clutterbuck,A.J.(1985),EMBOJ.41307-1331。
Katz,M.E.和Hynes,M.J.(1989),分子细胞生物学95696-5701。
Kelly J.M.和Hynes M.J.(1985),EMBO J 4475-479。
Kelly,J.M.和Hynes,M.J.(1987),当今遗传学1221-31。
Kinoshita K.,Takano,M.,Koseki.T.,Ito.和Iwano,K.(1995),发酵及生物工程杂志79,no5,422-428。
Kraulis,P.F.,Raine,A.R.,Gadhavi,P.L.和Laue E.D.(1992)自然356448-455。
Maniatis,T.,Fritsch,E.F.和Sambrook,J.,(1982),《分子克隆实验手册》,冷泉港,纽约,冷泉港实验室出版社。
Sambrook,J.,Fritsch,E.F.和Maniatis T.(1989),《分子克隆实验手册》第二版,冷泉港,纽约,冷泉港实验室出版社。
Sanger,F.,Nickelsen,S.和Coulson A.R.(1977)美国科学院院刊745463-5467。
Schutte,J.B.(1991),D-木糖和L-阿拉伯糖对家禽和猪的营养价值和生理作用,Datapress &amp; Datavisions,Wageningen,第173页。
Suarez,T.,Vieira de Queiroz,M.,Oestreicher,N.和Scazzocchio,C.(1995),EMBO J.14,no 71453-1467。
a)Unkles,S.E.,等人(1989),基团78157-166和b)Unkles,S.E.,等人(1989),分子及普通遗传学21899-104。
Verdodes,J.C.,Punt,P.J.,Schrinckx,J.M.,van Verseveld,H.W.,Stouthamer A.H.和van den Hondel,C.A.M.J.J.(1993),转基因研究284-92。
Verdoes,J.C.,Punt,P.J.和van den Hondel C.A.M.J.J.(1995),应用微生物学及生物工程43195-205。
Verdoes,J.C.(1994),黑曲霉中的糖淀粉酶的过量产生的分子遗传学研究,论文,Vrije大学,阿姆斯特丹,荷兰。
Vishniac,W.和Santer.M.(1957),细菌学综述21195-213.
Wilson,L.J.,Carmona,C.L.和Ward,M.(1988),核酸研究162389
Whittington,H.,Kerry-Williams,S.,Bidgood,K.,Dodsworth,N.,Peberdy,J.,Dobson,M.,Hinchcliffe,E.和Ballance.D.J(1990),当今遗传学18531-536。
序 列 表(1)一般信息(i)申请人(A)姓名Agricultural University Wageningen(B)街道Costerweg 50(C)城市Wageningen(E)国家荷兰(F)邮码6701 BH(ii)发明名称分离突变体及克隆互补基因的新方法(iii)序列数9(iv)计算机可读形式(A)介质类型软盘(B)计算机IBM PC兼容机(C)操作系统PC-DOS/MS-DOS(D)软件PatentIn Release #1.0,Version #1.25(EPO)(2)SEQ ID NO1信息(i)序列特征(A)长度30个碱基对(B)类型核酸(C)类型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO1CACAATGCAT CCCCTTTATC CGCCTGCCGT 30(2)SEQ ID NO2信息(i)序列特征(A)长度37个碱基对(B)类型核酸(C)类型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO2CAATTGCGAC TTGGAGGACA TGATGGGCAG ATGAGGG 37(2)SEQ ID NO3信息(i)序列特征(A)长度20个碱基对(B)类型核酸(C)类型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO3AGAGAGGATA TCGATGTGGG 20(2)SEQ ID NO4信息(i)序列特征(A)长度37个碱基对(B)类型核酸(C)类型单链
(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO4CCCTCATCTG CCCATCATGT CCTCCAAGTC GCAATTG37(2)SEQ ID NO5信息(i)序列特征(A)长度2054个碱基对(B)类型核酸(C)类型双链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iii)反义否(vi)最初来源(A)生物体塔宾曲霉(ix)特征(A)名称/关键TATA_信号(B)位置848..854(ix)特征(A)名称/关键外显子(B)位置950..1179(ix)特征(A)名称/关键内含子(B)位置1179..1228(ix)特征(A)名称/关键外显子(B)位置1229..1631(ix)特征(A)名称/关键CDS(B)位置连接区(950..1179,1229..1631)(D)其它信息/EC_号=3.2.1.8/产物=“1,4-β-木聚糖木聚糖水解酶”
/基因=″xlnA″/标准名称=″内切木聚糖酶″(ix)特征(A)名称/关键成熟肽(B)位置1031..1631(ix)特征(A)名称/关键信号肽(B)位置950..1031(xi)序列描述SEQ ID NO5AACGTCTGCA GTCCCGTACT GTTTACCAAA ATGCCAGGCC ACTGGTGGAT ATACAACTTT 60GTAATACGTT GCCGGAGTCA GCCCCTACTC CCTGATGGGT TCCCACTCCC TAGTTACTTC120CTACTGGGTA GTAGGCTCCT AGAGTGGGGT AAAGTTTGCC AAGGGTTTAG CCCCAGTCTT180GTTTATGCTT GGCTAGGCAG GACCTGGGTA AGTTGATGGC TCCTGCATTC CTACCTGAGT240ATTTCCAGCT ATAAGCGAGA TTTGCCATAC TCTTCAGCGA GTCCGGATGG TCCGCGCCGA300GGTTGACCCT GCCTTCATCA CCTACACAAA GAACTCCTCG GCCAACTCCC GGTGGCCTTC360GAGCTCCAAA GTACCTTCGC GACCTTTGGC CAGTGTTTCT CGCAGCGTTT ACTGAGCCTA420AGGCTTGCTA CAATAAATAA AGAGACATAA CCTTGCAGTA CATACGTCTT GTATGAGCAG480GGAACTGTGT TCAGTAGTAG ATCAGTGGGT ACATAATCAT GAACATGACT TCTGAGCCAG540AAAACCTTCT GCAGGGAACC GGTGAAGAAA CCCCACTTCC CCGCCTCCAC TAACTGCAGC600CCCTTTATCC GCCTGCCGTC CATTTAGCCA AATGTAGTCC ATTTAGCCAA GTGCGGTCCA660TTTAGCCAAG TCCAGTGCTT ACGTTGGTGG CTACACAGGA AACGGCCATG AATGTAGACA720CAACTATAGA ACTGTCCCTA GAAATAGGCT CGAGGTTGTT AGAGCGTTTA AGGTGATGCG780GCAAAATGCA TATGACTGAG TTGCTTCAAC GTGCAGGGGA AAGGGATAAA TAGTCTTTTT840CGCAGAATAT AAATAGAGGT AGAGCGGGCT CGCAGCAATA TTGACCAGGA CAGGGCTTCT900TTTCCAGTTG CATACATCCA TTCACAGCAT TCAGCTTTCT TCAATCATC ATG AAG955Met Lys-27GTC ACT GCG GCT TTT GCA GGT CTT TTG GTC ACG GCA TTC GCC GCT CCT 1003Val Thr Ala Ala Phe Ala Gly Leu Leu Val Thr Ala Phe Ala Ala Pro-25 -20 -15 -10GCC CCA GAA CCT GAT CTG GTGT CG CGA AGT GCC GGT ATC AAC TAC GTG 1051Ala Pro Glu Pro Asp Leu Val Ser Arg Ser Ala Gly Ile Asn Tyr Val-5 1 5CAA AAC TAC AAC GGC AAC CTT GGT GAT TTC ACC TAC GAC GAG AGT GCC 1099Gln Asn Tyr Asn Gly Asn Leu Gly Asp Phe Thr Tyr Asp Glu Ser Ala10 15 20GGA ACA TTT TCC ATG TAC TGG GAA GAT GGA GTG AGC TCC GAC TTT GTC 1147Gly Thr Phe Ser Met Tyr Trp Glu Asp Gly Val Ser Ser Asp Phe Val25 30 35GTT GGT CTG GGC TGG ACC ACT GGT TCT TCT AA GTGAGTGACT1189Val Gly Leu Gly Trp Thr Thr Gly Ser Ser Asn40 45 50GTATTCTTTA ACCAAGGTCT AGGATCTAAC GTCTTTCAG C GCT ATC ACC TAC TCT 1244Ala Ile Thr Tyr Ser55GCC GAA TAC AGC GCT TCT GGC TCC GCT TCC TAC CTC GCT GTG TAC GGC 1292Ala Glu Tyr Ser Ala Ser Gly Ser Ala Ser Tyr Leu Ala Val Tyr Gly60 65 70TGG GTC AAC TAT CCT CAA GCT GAG TAC TAC ATC GTC GAG GAT TAC GGT 1340Trp Val Asn Tyr Pro Gln Ala Glu Tyr Tyr Ile Val Glu Asp Tyr Gly75 80 85GAT TAT AAC CCT TGC AGT TCG GCC ACA AGC CTT GGT ACC GTG TAC TCT 1388Asp Tyr Asn Pro Cys Ser Ser Ala Thr Ser Leu Gly Thr Val Tyr Ser90 95 100GAT GGA AGC ACC TAC CAA GTC TGC ACC GAC ACT CGA ACA AAC GAA CCG 1436Asp Gly Ser Thr Tyr Gln Val Cys Thr Asp Thr Arg Thr Asn Glu Pro105 110 115TCC ATC ACG GGA ACA AGC ACG TTC ACG CAG TAC TTC TCC GTT CGA GAG 1484Ser Ile Thr Gly Thr Ser Thr Phe Thr Gln Tyr Phe Ser Val Arg Glu120 125 130 135AGC ACG CGC ACA TCT GGA ACG GTG ACT GTT GCC AAC CAT TTC AAC TTC 1532Ser Thr Arg Thr Ser Gly Thr Val Thr Val Ala Asn His Phe Asn Phe140 145 150TGG GCG CAC CAT GGG TTC GGC AAT AGC GAC TTC AAT TAT CAG GTC GTG 1580Trp Ala His His Gly Phe Gly Asn Ser Asp Phe Asn Tyr Gln Val Val155 160 165GCG GTG GAA GCA TGG AGC GGT GCT GGC AGC GCT AGT GTC ACA ATC TCT 1628Ala Val Glu Ala Trp Ser Gly Ala Gly Ser Ala Ser Val Thr Ile Ser170 175 180TCT TGAGAGATTA GTGCCCTAGT AGTCGGAAGA TATCAACGCG GCAGTTTGCT 1681SerCTCAGGTGGT GTGATGATCG GATCCGGTCT CTGGGGTTAC ATTGAGGCTG TATAAGTTGT1741TGTGGGGCCG AGCTGTCAGC GGCTGCGTTT TCAGCTTGCA CAGATAATCA ACTCTCGTTT1801TCTATCTCTT GCGTTTCCTC GCTGCTTATC CTATCCATAG ATAATTATTT TGCCCACTAC1861CACAACTTGT TCGGTCGCAG TAGTCACTCC GAGCAAGGCA TTGGGAAATG GGGGATGCGG1921GGTGCTGCGT ACCCTCTAAC CTAGGGCATT TTAAAGGATA TTTACCCTCC AGATATTCTA1981TAGATACAGA CTTCTTAGGA CTGCGGGTAA TATAGAGAGC GAAATTTCTA CAGTTCGATG2041CAGTTCAATG CGA 2054(2)SEQ ID NO6信息(i)序列特征(A)长度3026个碱基对(B)类型核酸(C)类型双链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iii)反义否(vi)最初来源(A)生物体黑曲霉(B)菌株N400(CBS 120.49)(ix)特征(A)名称/关键TATA_信号(B)位置643..648(ix)特征(A)名称/关键CDS(B)位置724..2538(D)其它信息/EC_号=1.1.3.4/产物=“葡萄糖氧化酶″/基因=″goxC″(ix)特征(A)名称/关键成熟肽(B)位置790..2538(ix)特征(A)名称/关键信号肽(B)位置724..790(xi)序列描述SEQ ID NO6CTGCAGGTAC CTGAAGCCTG CCTAGTTTGA TCACCCTGAA ACCAGCACTG CCTGTCTTGA60CCTTGGTGGT GAGTTTGCAC GTGGGCTGGC TGTTCAAATA AACTCTCCAA TTGACCCTCT 120CCCCGTGGAG AACACAGCAA ACACTATAGG CTTTCCATTG AGGGCATGAC GAGGACCCTA 180TGGTTTGTGC ACTTGGCGAG GGCTGACCGG AGCACGAATC GGGAAGGGCA GAACTCAGAA 240TTCGGTGTTC TCGGCATGCC GAAAGTCGGT ATCCCTTGGC GCCACGATGA TTTGCGTCCA300GGATTCGTAT AGTTCCTCGT CCACGAGGCT GCCTACCGTC AGCGTGAGGC AGTGAGCTAA360TATGGGGCCA ATAAGCCACT ACGAGGATGA CATGGCCTCT ACAGAACGAG AGACGCAGAG420GATCAGGACG CCAATCCTGC GCTCCACCTG TCTAAGGATT CGCTTTTGGA CTATCCAGGG480ATTATGGCTT CGGATTATTG TATTCGGGAT ACCGACGGCT GAGCACACGG AGGATGAGGT540TCAGCTCACG GCCCCTATCA GTATGCATTA TGAGGATGGC TTCTTGGAAA GCAGAGGAAT600TGGATTATCG AACAAGTTGG TTCTGGACCA TTGACTCGAG CGTATAAGTA ACCTCGTTCG660GTCCTCCTGT CACGTTCTGA TCAGCAACCA GCCTTTCCTC TCTCATTCCC TCATCTGCCC720ATC ATG CAG ACT CTC CTT GTG AGC TCG CTT GTG GTC TCC CTC GCT GCG 768Met Gln Thr Leu Leu Val Ser Ser Leu Val Val Ser Leu Ala Ala-22 -20 -15 -10GCC CTG CCA CAC TAC ATC AGG AGC AAT GGC ATT GAA GCC AGC CTC CTG 816Ala Leu Pro His Tyr Ile Arg Ser Asn Gly Ile Glu Ala Ser Leu Leu-5 1 5ACT GAT CCC AAG GAT GTC TCC GGC CGC ACG GTC GAC TAC ATC ATC GCT 864Thr Asp Pro Lys Asp Val Ser Gly Arg Thr Val Asp Tyr Ile Ile Ala10 15 20 25GGT GGA GGT CTG ACT GGA CTC ACC ACC GCT GCT CGT CTG ACG GAG AAC 912Gly Gly Gly Leu Thr Gly Leu Thr Thr Ala Ala Arg Leu Thr Glu Asn30 35 40CCC AAC ATC AGT GTG CTC GTC ATC GAA AGT GGC TCC TAC GAG TCG GAC 960Pro Asn Ile Ser Val Leu Val Ile Glu Ser Gly Ser Tyr Glu Ser Asp45 50 55AGA GGT CCT ATC ATT GAG GAC CTG AAC GCC TAC GGC GAC ATC TTT GGC 1008Arg Gly Pro Ile Ile Glu Asp Leu Asn Ala Tyr Gly Asp Ile Phe Gly60 65 70AGC AGT GTA GAC CAC GCC TAC GAG ACC GTG GAG CTC GCT ACC AAC AAT 1056Ser Ser Val Asp His Ala Tyr Glu Thr Val Glu Leu Ala Thr Asn Asn75 80 85CAA ACC GCG CTG ATC CGC TCC GGA AAT GCT CTC GGT GGC TCT ACT CTA 1104Gln Thr Ala Leu Ile Arg Ser Gly Asn Gly Leu Gly Gly Ser Thr Leu90 95 100 105GTG AAT GGT GGC ACC TGG ACT CGC CCC CAC AAG GCA CAG GTT GAC TCT 1152Val Asn Gly Gly Thr Trp Thr Arg Pro His Lys Ala Gln Val Asp Ser110 115 120TGG GAG ACT GTC TTT GGA AAT GAG GGC TGG AAC TGG GAC AAT GTG GCC 1200Trp Glu Thr Val Phe Gly Asn Glu Gly Trp Asn Trp Asp Asn Val Ala125 130 135GCC TAC TCC CTC CAG GCT GAG CGT GCT CGC GCA CCA AAT GCC AAA CAG1248Ala Tyr Ser Leu Gln Ala Glu Arg Ala Arg Ala Pro Asn Ala Lys Gln140 145 150ATC GCT GCT GGC CAC TAC TTC AAC GCA TCC TGC CAT GGT GTT AAT GGT1296Ile Ala Ala Gly His Tyr Phe Asn Ala Ser Cys His Gly Val Asn Gly155 160 165ACT GTC CAT GCC GGA CCC CGC GAC ACC GGC GAT GAC TAT TCT CCC ATC1344Thr Val His Ala Gly Pro Arg Asp Thr Gly Asp Asp Tyr Ser Pro Ile170 175 180 185GTC AAG GCT CTC ATG AGC GCT GTC GAA GAC CGG GGC GTT CCC ACC AAG1392Val Lys Ala Leu Met Ser Ala Val Glu Asp Arg Gly Val Pro Thr Lys190195 200AAA GAC TTC GGA TGC GGT GAC CCC CAT GGT GTG TCC ATG TTC CCC AAC1440Lys Asp Phe Gly Cys Gly Asp Pro His Gly Val Ser Met Phe Pro Asn205 210 215ACC TTG CAC GAA GAC CAA GTG CGC TCC GAT GCC GCT CGC GAA TGG CTA1488Thr Leu His Glu Asp Gln Val Arg Ser Asp Ala Ala Arg Glu Trp Leu220 225 230CTT CCC AAC TAC CAA CGT CCC AAC CTG CAA GTC CTG ACC GGA CAG TAT1536Leu Pro Asn Tyr Gln Arg Pro Asn Leu Gln Val Leu Thr Gly Gln Tyr235 240 245GTT GGT AAG GTG CTC CTT AGC CAG AAC GGC ACC ACC CCT CGT GCC GTT1584Val Gly Lys Val Leu Leu Ser Gln Asn Gly Thr Thr Pro Arg Ala Val250 255 260 265GGC GTG GAA TTC GGC ACC CAC AAG GGC AAC ACC CAC AAC GTT TAC GCT1632Gly Val Glu Phe Gly Thr His Lys Gly Asn Thr His Asn Val Tyr Ala270 275 280AAG CAC GAG GTC CTC CTG GCC GCG GGC TCC GCT GTC TCT CCC ACA ATC1680Lys His Glu Val Leu Leu Ala Ala Gly Ser Ala Val Ser Pro Thr Ile285 290 295CTC GAA TAT TCC GGT ATC GGA ATG AAG TCC ATC CTG GAG CCC CTT GGT1728Leu Glu Tyr Ser Gly Ile Gly Met Lys Ser Ile Leu Glu Pro Leu Gly300 305 310ATC GAC ACC GTC GTT GAC CTG CCC GTC GGC TTG AAC CTG CAG GAC CAG1776Ile Asp Thr Val Val Asp Leu Pro Val Gly Leu Asn Leu Gln Asp Gln315 320 325ACC ACC GCT ACC GTC CGC TCC CGC ATC ACC TCT GCT GGT GCA GGA CAG1824Thr Thr Ala Thr Val Arg Ser Arg Ile Thr Ser Ala Gly Ala Gly Gln330 335 340 345GGA CAG GCC GCT TGG TTC GCC ACC TTC AAC GAG ACC TTT GGT GAC TAT1872Gly Gln Ala Ala Trp Phe Ala Thr Phe Asn Glu Thr Phe Gly Asp Tyr350 355 360TCC GAA AAG GCA CAC GAG CTG CTC AAC ACC AAG CTG GAG CAG TGG GCC1920Ser Glu Lys Ala His Glu Leu Leu Asn Thr Lys Leu Glu Gln Trp Ala365 370 375GAA GAG GCC GTC GCC CGT GGC GGA TTC CAC AAC ACC ACC GCC TTG CTC1968Glu Glu Ala Val Ala Arg Gly Gly Phe His Asn Thr Thr Ala Leu Leu380 385 390ATC CAG TAC GAG AAC TAC CGC GAC TGG ATT GTC AAC CAC AAC GTC GCG2016Ile Gln Tyr Glu Asn Tyr Arg Asp Trp Ile Val Asn His Asn Val Ala395 400 405TAC TCG GAA CTC TTC CTC GAC ACT GCC GGA GTA GCC AGC TTC GAT GTG2064Tyr Ser Glu Leu Phe Leu Asp Thr Ala Gly Val Ala Ser Phe Asp Val410 415 420 425TGG GAC CTT CTG CCC TTC ACC CGA GGA TAC GTT CAC ATC CTC GAC AAG2112Trp Asp Leu Leu Pro Phe Thr Arg Gly Tyr Val His Ile Leu Asp Lys430 435 440GAC CCC TAC CTT CAC CAC TTC GCC TAC GAC CCT CAG TAC TTC CTC AAC2160Asp Pro Tyr Leu His His Phe Ala Tyr Asp Pro Gln Tyr Phe Leu Asn445 450 455GAG CTG GAC CTG CTC GGT CAG GCT GCC GCT ACT CAA CTG GCC CGC AAC2208Glu Leu Asp Leu Leu Gly Gln Ala Ala Ala Thr Gln Leu Ala Arg Asn460 465 470ATC TCC AAC TCC GGT GCC ATG CAG ACC TAC TTC GCT GGG GAG ACT ATC2256Ile Ser Asn Ser Gly Ala Met Gln Thr Tyr Phe Ala Gly Glu Thr Ile475 480 485CCC GGT GAT AAC CTC GCG TAT GAT GCC GAT TTG AGC GCC TGG ACT GAG2304Pro Gly Asp Asn Leu Ala Tyr Asp Ala Asp Leu Ser Ala Trp Thr Glu490 495 500 505TAC ATC CCG TAC CAC TTC CGT CCT AAC TAC CAT GGC GTG GGT ACT TGC2352Tyr Ile Pro Tyr His Phe Arg Pro Asn Tyr His Gly Val Gly Thr Cys510 515 520TCC ATG ATG CCG AAG GAG ATG GGC GGT GTT GTT GAT AAT GCT GCC CGT2400Ser Met Met Pro Lys Glu Met Gly Gly Val Val Asp Asn Ala Ala Arg525 530 535GTG TAT GGT GTG CAG GGA CTG CGT GTC ATT GAT GGT TCT ATT CCT CCT2448Val Tyr Gly Val Gln Gly Leu Arg Val Ile Asp Gly Ser Ile Pro Pro540 545 550ACG CAA ATG TCG TCC CAT GTC ATG ACG GTG TTC TAT GCC ATG GCG CTA2496Thr Gln Met Ser Ser His Val Met Thr Val Phe Tyr Ala Met Ala Leu555 560 565AAA ATT TCG GAT GCT ATC TTG GAA GAT TAT GCT TCC ATG CAG2538Lys Ile Ser Asp Ala Ile Leu Glu Asp Tyr Ala Ser Met Gln570 575 580TGAGTGGTAT GATGGGGATA TGAGTGAGGA TATTAGGGGA TGGTACTTAG ATGCTGGGGA 2598GGTATAATCA TAGATTGGAT AGAATTGGTA GGTTACATAG ACAGGTTACA TGAATAGACG2658TTCGTTATAT GTGAGCAGAC ATTACTACCA AACAAGGGCA TTGTTCAGTT AGTCGAACGA2718TAGTCATATG TTTTGTACGG GAAGAAAGTT TCACTAATTA TTAAGCAAAC GGATCAGGGG2778TTGCCAGCTA AAATACAATC ATCCGATGTT CTATTTTCTT CAAATTGATC GACCAGTCAG2838TTAATGAATG CATGAGAGCA ACTCTGCGCA TCCTCTAGCT ATCTAGTCAA TAATAAGCAT2898GTTGTTTAAG ATGAAACACC GCCATAGACA TATTCTGTTG CTGGTGAAGC AAGCCCTCGC2958TAAATATGCT GATAACTTCC TATGCCAGTA GAATATTTTC CCACTCTGCT GCGCGCTCTC3018AAAAGCTT 3026(2)SEQ ID NO7信息(i)序列特征(A)长度1517个碱基对(B)类型核酸(C)类型双链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iii)反义否(vi)最初来源(A)生物体黑曲霉(B)菌株L112(ix)特征(A)名称/关键外显子(B)位置339..495(ix)特征(A)名称/关键内含子(B)位置496..563(ix)特征(A)名称/关键外显子(B)位置564..1237(ix)特征(A)名称/关键CDS(B)位置连接区(339..495,564..1237)(D)其它信息/产物=“乳清苷-5’-磷酸脱羧酶”(xi)序列描述SEQ ID NO7GCAGGGAAAA ATACGAGCTC CAATGAACCT GGGTGTGGCA ACTTCAATGG AAAGGAACTG 60CCTTTGCAGG TGTGGCTGAA CCCCACGGTT CCGGTCGGAG GCGGCGAAAT CACCCGATGT120GGCTGGTGCG TGGAGGGTCG CGATGATTTA CTGAGCTCCT CTTTTGCTCG ACATTGAATG180TGCATTGTTC ACCTCATATA AGGGCCAGTC GCTGCTAAAT TATTCGGTAG TATTTGCGCA240TCTCTGGATC TACCAATTAG GGCCTATCAG TCGAAACTCC AAGCTACTCA TATTGCACAA300GCCTCTTTCA TCCCCGCATT AACCCCTCCA CCGACACC ATG TCC TCC AAG TCG353Met Ser Ser Lys Ser1 5CAA TTG ACC TAC ACT GCC CGT GCC AGC AAG CAC CCC AAT GCT CTG GCC 401Gln Leu Thr Tyr Thr Ala Arg Ala Ser Lys His Pro Asn Ala Leu Ala10 15 20AAG CGG CTG TTC GAA ATT GCT GAG GCC AAG AAG ACC AAT GTG ACC GTC 449Lys Arg Leu Phe Glu Ile Ala Glu Ala Lys Lys Thr Asn Val Thr Val25 30 35TCT GCC GAC GTT ACC ACC ACT AAG GAG CTA CTA GAT CTT GCT GAC C 495Ser Ala Asp Val Thr Thr Thr Lys Glu Leu Leu Asp Leu Ala Asp40 45 50GTAGGCCGAC CCGCCATTCT GCCTGTTTAT GCTGCATACA AACTTATTAA CGGTGATACC555GGACTGAG GT CTC GGT CCC TAC ATC GCC GTG ATC AAA ACC CAC ATC GAT 604Arg Leu Gly Pro Tyr Ile Ala Val Ile Lys Thr His Ile Asp55 60 65ATC CTC TCT GAC TTC AGC GAC GAG ACC ATT GAG GGC CTC AAG GCT CTT 652Ile Leu Ser Asp Phe Ser Asp Glu Thr Ile Glu Gly Leu Lys Ala Leu70 75 80GCG CAG AAG CAC AAC TTC CTC ATC TTC GAG GAC CGC AAA TTC ATC GAC 700Ala Gln Lys His Asn Phe Leu Ile Phe Glu Asp Arg Lys Phe Ile Asp85 90 95ATT GGC AAC ACT GTC CAG AAG CAA TAC CAC CGT GGT ACC CTC CGC ATC 748Ile Gly Asn Thr Val Gln Lys Gln Tyr His Arg Gly Thr Leu Arg Ile100 105 110TCA GAA TGG GCC CAT ATC ATC AAC TGC AGC ATC CTG CCT GGC GAG GGT 796Ser Glu Trp Ala His Ile Ile Asn Cys Ser Ile Leu Pro Gly Glu Gly115 120 125 130ATC GTC GAG GCT CTC GCT CAG ACG GCG TCT GCA CCG GAC TTC TCC TAC 844Ile Val Glu Ala Leu Ala Gln Thr Ala Ser Ala Pro Asp Phe Ser Tyr135 140 145GGC CCC GAA CGT GGT CTG TTG ATC TTG GCG GAA ATG ACC TCT AAG GGT 892Gly Pro Glu Arg Gly Leu Leu Ile Leu Ala Glu Met Thr Ser Lys Gly150 155 160TCC TTG GCC ACC GGC CAG TAC ACT ACT TCT TCG GTT GAT TAT GCC CGG 940Ser Leu Ala Thr Gly Gln Tyr Thr Thr Ser Ser Val Asp Tyr Ala Arg165 170 175AAA TAC AAG AAC TTC GTC ATG GGA TTT GTG TCG ACC CGC TCG TTG GGT 988Lys Tyr Lys Asn Phe Val Met Gly Phe Val Ser Thr Arg Ser Leu Gly180 185 190GAG GTG CAG TCG GAA GTC AGC TCT CCT TCG GAT GAG GAG GAC TTT GTG 1036Glu Val Gln Ser Glu Val Ser Ser Pro Ser Asp Glu Glu Asp Phe Val195 200 205 210GTC TTC ACG ACT GGT GTG AAC ATT TCG TCC AAG GGA GAT AAG CTC GGT 1084Val Phe Thr Thr Gly Val Asn Ile Ser Ser Lys Gly Asp Lys Leu Gly215 220 225CAG CAG TAC CAG ACT CCC GCA TCG GCT ATC GGT CGG GGT GCT GAC TTC 1132Gln Gln Tyr Gln Thr Pro Ala Ser Ala Ile Gly Arg Gly Ala Asp Phe230 235 240ATT ATC GCG GGT CGC GGT ATC TAC GCC GCG CCG GAC CCG GTG CAG GCT 1180Ile Ile Ala Gly Arg Gly Ile Tyr Ala Ala Pro Asp Pro Val Gln Ala245 250 255GCG CAA CAG TAC CAG AAG GAA GGT TGG GAG GCG TAC CTG GCC CGT GTC 1228Ala Gln Gln Tyr Gln Lys Glu Gly Trp Glu Ala Tyr Leu Ala Arg Val260 265 270GGC GGA AAC TAATACTATA AAATGAGGAA AAAAGTTTTG ATGGTTATGA 1277Gly Gly Asn275ATGATATAGA AATGCAACTT GCCGCTACGA TACGCATACA AACTAATGTC GAGCACGGGT1337AGTCAGACTG CGGCATCGGA TGTCAAAACG GTATTGATCC TGCAGGCTAT TATAGGGTGG1397CACGGGATTA ATGCGGTACG ACGATTTGAT GCAGATAAGC AGGGTGCGAA GTACTTAGTC1457CTGTAACTCT TGCGTAGAGC AAATGGCGAC GGGTGGCTGA TAAGGGACGG TGATAAGCTT1517(2)SEQ ID NO8信息(i)序列特征(A)长度4108个碱基对(B)类型核酸(C)类型双链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iii)反义否(vi)最初来源(A)生物体黑曲霉(CBS 120.49)(B)菌株NW147(ix)特征(A)名称/关键TATA_信号(B)位置787..794(ix)特征(A)名称/关键CDS(B)位置855..3266(D)其它信息/EC_号=3.2.1.37/产物=“1,4-β-D-木聚糖木聚糖水解酶″/基因=″xlnD″/标准名称=″β-木糖苷酶″(ix)特征(A)名称/关键信号肽(B)位置855..932(ix)特征(A)名称/关键成熟肽(B)位置933..3266(ix)特征(A)名称/关键polyA_位点(B)位置3383(ix)特征(A)名称/关键polyA_位点(B)位置3404(xi)序列描述SEQ ID NO8CTGCAGGCCA TGTATCCTGC GAAGATGGGT GAGTGGAAGA AAATCGTCAA GATTGAGGCG 60GAGATGGCGA GGGCCGCGAT GAAGAAGGGT GGCTGGGCAC CGGAGAAGCC AGCCACCGCC120ACGGCGGCGC AGATGAGTAT ACCGTATGCG GTGGCGTTGC AGGTTCTGGA TGGGGAGATT180GTGCCGGGGC AGTTTGCGCC GGGCATGTTG AATCGGGAGG AGTTATGGGA TGTGATTAGG240CTGGTGGAAT GTCGGGAGGC CAAGGAGCTG GATAATACGT GGGCGCAGAG GGTCAAGATC300ACGTTTGAGG ATGGGGAGGT GGTGGAGAAG TTGTTGAAGG CTCCGAAGGG AGTCCATCCT360GGGGTGACGA ATGAGGAGGT GTTGCAGAAG TGGCGGGCTG TGACGAAGGG GGTAATTTCG420GAAGAGAGGC AGAAGAAGAT CGAGGAGATT GTGTTGAATT TGGAAGAGGT GGAGGATGTG480GCTGGTGTTT TGGGCGAGTT GTTGAGGGAA GAGACGGTGA ATGTGCTGCA GTAGACGGTT540ACCCCATTTG GACGGGGATG GCTTCATATT TCCCAAGCGA TGTCACGCCA TAGAAAGGGC600ACATTTACCC GGTGCCTGAG CGAAACTCTA CTTCGAAGAC AATGCCAATG TTTAACTATC660TTGTTTTAAT TGCTAAATGC AAACATTCCA GGTTCTTCCT AATGCCGGCT AAATCATTCA720GGCTAAACCC CCGCGATGAA GTCAATCGGT CATTCTCCGG CGCATCTCCG CATCTCCGCA780AACCGCTATA AAATCTACCC CAGATTCAGT CCCCGGCCAC CTTTCTATCC CCCCCCCCAC840AGACTGGCTC AACC ATG GCG CAC TCA ATG TCT CGT CCC GTG GCT GCC ACT 890Met Ala His Ser Met Ser Arg Pro Val Ala Ala Thr-26 -25 -20 -15GCC GCT GCT CTG CTG GCT CTG GCT CTT CCT CAA GCT CTT GCC CAG GCC 938Ala Ala Ala Leu Leu Ala Leu Ala Leu Pro Gln Ala Leu Ala Gln Ala-10 -5 1AAC ACC AGC TAC GTC GAC TAC AAC ATC GAA GCC AAC CCG GAC TTG TAT 986Asn Thr Ser Tyr Val Asp Tyr Asn Ile Glu Ala Asn Pro Asp Leu Tyr5 10 15CCT TTG TGC ATA GAA ACC ATC CCA CTG AGC TTC CCC GAC TGC CAG AAT1034Pro Leu Cys Ile Glu Thr Ile Pro Leu Ser Phe Pro Asp Cys Gln Asn20 25 30GGT CCC CTG CGC AGC CAT CTC ATC TGT GAT GAA ACA GCC ACC CCC TAT1082Gly Pro Leu Arg Ser His Leu Ile Cys Asp Glu Thr Ala Thr Pro Tyr35 40 45 50GAC CGA GCA GCA TCG CTC ATC TCG CTC TTC ACC CTG GAC GAG CTG ATC1130Asp Arg Ala Ala Ser Leu Ile Ser Leu Phe Thr Leu Asp Glu Leu Ile55 60 65GCC AAC ACC GGC AAC ACC GGC CTC GGT GTC TCC CGA CTG GGC CTC CCT1178Ala Asn Thr Gly Asn Thr Gly Leu Gly Val Ser Arg Leu Gly Leu Pro70 75 80GCA TAC CAA GTA TGG AGT GAA GCT CTT CAC GGC CTC GAC CGT GCC AAT1226Ala Tyr Gln Val Trp Ser Glu Ala Leu His Gly Leu Asp Arg Ala Asn85 90 95TTC AGC GAC TCA GGA GCC TAC AAT TGG GCC ACC TCA TTC CCC CAG CCC1274Phe Ser Asp Ser Gly Ala Tyr Asn Trp Ala Thr Ser Phe Pro Gln Pro100 105 110ATC CTG ACC ACC GCG GCC CTC AAC CGC ACC CTC ATC CAC CAA ATC GCC1322Ile Leu Thr Thr Ala Ala Leu Asn Arg Thr Leu Ile His Gln Ile Ala115 120125 130TCC ATC ATC TCT ACC CAA GGC CGC GCC TTC AAC AAC GCC GGC CGC TAC1370Ser Ile Ile Ser Thr Gln Gly Arg Ala Phe Asn Asn Ala Gly Arg Tyr135 140 145GGC CTC GAC GTC TAC GCC CCC AAC ATC AAC ACC TTC CGC CAC CCC GTC1418Gly Leu Asp Val Tyr Ala Pro Asn Ile Asn Thr Phe Arg His Pro Val150 155 160TGG GGT CGC GGA CAA GAA ACC CCA GGA GAG GAC GTC TCT CTC GCC GCC1466Trp Gly Arg Gly Gln Glu Thr Pro Gly Glu Asp Val Ser Leu Ala Ala165 170 175GTC TAC GCC TAC GAA TAC ATC ACC GGC ATC CAG GGT CCC GAC CCA GAA1514Val Tyr Ala Tyr Glu Tyr Ile Thr Gly Ile Gln Gly Pro Asp Pro Glu180 185 190TCA AAC CTC AAA CTC GCC GCC ACG GCC AAG CAC TAC GCC GGC TAT GAC1562Ser Asn Leu Lys Leu Ala Ala Thr Ala Lys His Tyr Ala Gly Tyr Asp195 200 205 210ATC GAG AAC TGG CAC AAC CAC TCC CGC CTG GGC AAC GAC ATG AAC ATC1610Ile Glu Asn Trp His Asn His Ser Arg Leu Gly Asn Asp Met Asn Ile215 220 225ACC CAG CAA GAC CTC TCC GAA TAC TAC ACG CCC CAA TTC CAC GTC GCC1658Thr Gln Gln Asp Leu Ser Glu Tyr Tyr Thr Pro Gln Phe His Val Ala230 235 240GCC CGC GAC GCC AAA GTC CAG AGT GTC ATG TGC GCC TAC AAC GCC GTC1706Ala Arg Asp Ala Lys Val Gln Ser Val Met Cys Ala Tyr Asn Ala Val245 250 255AAC GGC GTC CCT GCC TGC GCC GAC TCC TAC TTC CTC CAG ACC CTC CTC1754Asn Gly Val Pro Ala Cys Ala Asp Ser Tyr Phe Leu Gln Thr Leu Leu260 265 270CGC GAC ACC TTC GGA TTT GTC GAC CAC GGA TAC GTC TCC AGC GAC TGC1802Arg Asp Thr Phe Gly Phe Val Asp His Gly Tyr Val Ser Ser Asp Cys275 280 285 290GAT GCC GCC TAT AAC ATC TAC AAC CCC CAC GGC TAT GCC TCC TCC CAG1850Asp Ala Ala Tyr Asn Ile Tyr Asn Pro His Gly Tyr Ala Ser Ser Gln295 300 305GCT GCC GCT GCC GCT GAG GCC ATC CTC GCC GGC ACC GAC ATC GAC TGC1898Ala Ala Ala Ala Ala Glu Ala Ile Leu Ala Gly Thr Asp Ile Asp Cys310 315 320GGT ACC ACC TAC CAA TGG CAC CTG AAC GAG TCC ATC GCT GCG GGA GAT1946Gly Thr Thr Tyr Gln Trp His Leu Asn Glu Ser Ile Ala Ala Gly Asp325 330 335CTC TCT CGC GAT GAT ATT GAG CAG GGT GTG ATT CGT CTC TAC ACG ACC1994Leu Ser Arg Asp Asp Ile Glu Gln Gly Val Ile Arg Leu Tyr Thr Thr340 345 350CTC GTG CAG GCC GGA TAC TTC GAC TCC AAC ACC ACA AAG GCG AAC AAC2042Leu Val Gln Ala Gly Tyr Phe Asp Ser Asn Thr Thr Lys Ala Asn Asn355 360 365 370CCC TAC CGC GAC CTC TCC TGG TCC GAC GTC CTT GAG ACG GAC GCA TGG2090Pro Tyr Arg Asp Leu Ser Trp Ser Asp Val Leu Glu Thr Asp Ala Trp375 380 385AAC ATC TCC TAC CAA GCC GCG ACG CAG GGC ATT GTC CTT CTC AAG AAC2138Asn Ile Ser Tyr Gln Ala Ala Thr Gln Gly Ile Val Leu Leu Lys Asn390 395 400TCC AAC AAC GTC CTC CCC CTC ACC GAG AAA GCT TAC CCA CCA TCC AAC2186Ser Asn Asn Val Leu Pro Leu Thr Glu Lys Ala Tyr Pro Pro Ser Asn405 410 415ACC ACC GTC GCC CTC ATC GGT CCC TGG GCC AAC GCC ACC ACC CAA CTC2234Thr Thr Val Ala Leu Ile Gly Pro Trp Ala Asn Ala Thr Thr Gln Leu420 425 430CTG GGC AAC TAC TAC GGC AAC GCT CCC TAC ATG ATC AGC CCC CGC GCC2282Leu Gly Asn Tyr Tyr Gly Asn Ala Pro Tyr Met Ile Ser Pro Arg Ala435 440 445 450GCC TTC GAA GAA GCC GGA TAC AAA GTC AAC TTC GCC GAG GGC ACC GGT2330Ala Phe Glu Glu Ala Gly Tyr Lys Val Asn Phe Ala Glu Gly Thr Gly455 460 465ATC TCC TCC ACA AGC ACC TCG GGC TTC GCT GCC GCC TTA TCC GCC GCA2378Ile Ser Ser Thr Ser Thr Ser Gly Phe Ala Ala Ala Leu Ser Ala Ala470 475 480CAA TCC GCC GAC GTG ATA ATC TAC GCC GGT GGT ATC GAC AAT ACC CTT2426Gln Ser Ala Asp Val Ile Ile Tyr Ala Gly Gly Ile Asp Asn Thr Leu485 490 495GAA GCG GAG GCA CTG GAT CGA GAG AGT ATC GCG TGG CCG GGT AAC CAA2474Glu Ala Glu Ala Leu Asp Arg Glu Ser Ile Ala Trp Pro Gly Asn Gln500 505 510CTG GAC TTG ATC CAG AAG CTC GCC TCG GCG GCC GGA AAG AAG CCG CTC2522Leu Asp Leu Ile Gln Lys Leu Ala Ser Ala Ala Gly Lys Lys Pro Leu515 520 525 530ATC GTC CTC CAA ATG GGC GGC GGA CAG GTC GAT TCC TCT TCG CTC AAG2570Ile Val Leu Gln Met Gly Gly Gly Gln Val Asp Ser Ser Ser Leu Lys535 540 545AAC AAC ACC AAT GTT TCT GCA CTT CTC TGG GGC GGA TAC CCC GGC CAA2618Asn Asn Thr Asn Val Ser Ala Leu Leu Trp Gly Gly Tyr Pro Gly Gln550 555 560TCT GGC GGC TTC GCT TTG CGG GAT ATC ATC ACG GGG AAG AAG AAC CCC2666Ser Gly Gly Phe Ala Leu Arg Asp Ile Ile Thr Gly Lys Lys Asn Pro565 570 575GCG GGT AGA CTA GTC ACG ACG CAG TAC CCT GCC AGC TAC GCG GAG GAG2714Ala Gly Arg Leu Val Thr Thr Gln Tyr Pro Ala Ser Tyr Ala Glu Glu580 585 590TTC CCG GCG ACA GAT ATG AAC CTT CGT CCT GAG GGT GAT AAC CCT GGT2762Phe Pro Ala Thr Asp Met Asn Leu Arg Pro Glu Gly Asp Asn Pro Gly595 600 605 610CAG ACG TAT AAA TGG TAC ACC GGC GAA GCC GTG TAC GAG TTC GGC CAC2810Gln Thr Tyr Lys Trp Tyr Thr Gly Glu Ala Val Tyr Glu Phe Gly His615 620 625GGG TTA TTC TAC ACG ACC TTC GCG GAA TCC TCC AGC AAT ACC ACT ACA2858Gly Leu Phe Tyr Thr Thr Phe Ala Glu Ser Ser Ser Asn Thr Thr Thr630 635 640AAG GAA GTT AAG CTC AAC ATC CAG GAC ATT CTT TCC CAG ACA CAC GAA2906Lys Glu Val Lys Leu Asn Ile Gln Asp Ile Leu Ser Gln Thr His Glu645 650 655GAC CTG GCG TCG ATT ACC CAG CTC CCT GTG CTG AAC TTC ACC GCC AAT2954Asp Leu Ala Ser Ile Thr Gln Leu Pro Val Leu Asn Phe Thr Ala Asn660 665 670ATC AGG AAC ACT GGA AAG CTG GAA TCG GAT TAC ACC GCT ATG GTA TTC3002Ile Arg Asn Thr Gly Lys Leu Glu Ser Asp Tyr Thr Ala Met Val Phe675 680 685 690GCC AAT ACC TCT GAT GCC GGG CCG GCG CCG TAT CCC AAG AAG TGG CTG3050Ala Asn Thr Ser Asp Ala Gly Pro Ala Pro Tyr Pro Lys Lys Trp Leu695 700 705GTC GGG TGG GAT CGG CTT GGG GAG GTG AAG GTC GGG GAG ACG AGG GAG3098Val Gly Trp Asp Arg Leu Gly Glu Val Lys Val Gly Glu Thr Arg Glu710 715 720TTG AGG GTC CCC GTT GAG GTG GGG AGC TTT GCG AGG GTG AAT GAG GAT3146Leu Arg Val Pro Val Glu Val Gly Ser Phe Ala Arg Val Asn Glu Asp725 730 735GGC GAT TGG GTG GTG TTT CCG GGA ACG TTT GAG TTG GCG TTG AAT TTG3194Gly Asp Trp Val Val Phe Pro Gly Thr Phe Glu Leu Ala Leu Asn Leu740 745 750GAG AGG AAG GTT CGG GTG AAG GTT GTT CTT GAG GGT GAG GAG GAA GTC3242Glu Arg Lys Val Arg Val Lys Val Val Leu Glu Gly Glu Glu Glu Val755 760 765 770GTG CTG AAG TGG CCG GGG AAG GAG TAGAAAATAC TATTCTGTTG ATGGCTCTAG 3296Val Leu Lys Trp Pro Gly Lys Glu775GGGATGAGAG TCAGCCTATT ACTGGATATG CATAGTGGTG ATACGATGTA TATAGCTCTA 3356TGAAGTAATT AGTTCAAGTG GGAATACCCC TTTCACACAT ATAGTATGCT GTTATTCCGA 3416AATAGGGATC ATTTCTGATT AATAGTAGCG GTAGCGATGG TCACACACGA CTTAATGTTC 3476CCCATTGTAC CGGAAGTAAC AATTCCAGTG ACCTCTTAGA AGAAAGACAG CAAGAAAAAG 3536TAAGAAAGGG AAATTGATCA AAAAATAAGG CCATCTACAG CCTATTCACA TTTAGCCGGA 3596TCTGCAATAC AGCTACAGAA ATAAAGTTTG TTAGGCTGCT TGCTAGCATA GCTCCTACTA 3656TACTAAACCA ACACAATGGG ACAATACCCC AATTAACCAG CCCTCACTCA ACACAAGTGA 3716ATCCTACCGA CAACATGCAT AAACCACTGC TTCCCCACCC AGCACCCTTC TTCACGATCA 3776GATCACGGAG AATTACCAAC TACTCTTCGC ATAAAACGTA AACAACGGCC TCGGGCCAGG 3836ATCCGTCCGA CTCAAAAGCA ACAAATCCCT CGTTCGCATA CTAGCCACAT GAACCTGTTG 3896CTCCGAGACC TCCTCAACTG GGTCTTCAAA TGCCCAGAAG ACGCTTTCTT CTCGATATCC 3956ATCGGATACT CGCTGGCCGC TTAGACATAT GAACGATGAG TCTCGTCTGC CAAAGGAAAC 4016AACCGTGTTC CCGAATCCAG TGTCAAAGTC GTAGGTCTGG AATTTGAAAA GTGTTCGGGC 4076GTTTCCTTGG AGGGTCGGGA GTGCGACTGC AG4108(2)SEQ ID NO9信息(i)序列特征(A)长度4173个碱基对(B)类型核酸(C)链型双链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设无(iii)反义否(vi)最初来源(A)生物体黑曲霉(B)菌株CRS 120.49(C)个体分离物N400(ix)特征(A)名称/关键CDS(B)位置连接(948..1173,1238..3495,3550..3690)(C)鉴定方法通过实验(D)其它信息/功能=″木聚糖裂解基因的转录激活物″/产物=″双核锌指DNA结合蛋白质″/基因=″xlnR″/标准名称=″XYL R″(ix)特征(A)名称/关键外显子(B)位置948..1173(ix)特征(A)名称/关键内含子(B)位置1174..1237(ix)特征(A)名称/关键外显子(B)位置1238..3495(ix)特征(A)名称/关键内含子(B)位置3496..3549(ix)特征(A)名称/关键外显子(B)位置3550..3690(xi)序列描述SEQ ID NO9CCCGGGCTTG GTTGGTCTCC GTCTGGCTTC CCCGCCTTTT TCCCCTGCAA TTCTGCATCC 60CCAATCCTTC TTTTTTCTTT GCCTCGCCAG GCTGTGTCTT TTTTCCCCCT CCCCCTCCTC120CCTCGTCAGC TTCTCTTCGA CAGCATGCGT GAGGGTCTGC TACCAACTAC AATCCTTGTT180CTCACTGTCT GATGGTCTGA CCCGACCGTG GTGTCTGTGG TGTGTGTGTG AGAGAGAAAG240GAAAGCTAGT CAGTCCAGTC ACTCTTTCTC GTGGGTTCTT CACCTTCCCC GGACCTGCCC300TCCGACACTA AAAAGCCACT TCCCCCCAAC TGGTTAGTTG CTGCTAGTCT CCTTAGTTCA360TGGTCGGCCT TGTCGCTTCT CCGGCTGACA TTCTCCTCTT CTGCTGCCTT CTAGGTCCCT420GTTTTTTAGT CCCTGTTTTA GTTGCCCCGC AGACTGAATC GGCAATGCCG TGGAGTTGAT480CGTTCCGTGG TTTCCTTGCG ACCGCTCCTC TGCTTCATCA TCTTTTTCCT CCTGCCCTCC540TGGTCTTGAA TCGCCTGGCC CTCGTCTAGG ATCTGTTGCG CCAGTGTCGC CTTAATCTCC600TTTCCCGCTA GCGTAGTGCC CTTTCACGCT TGGGGCCTTA CGGCCCTTCC ATTCGCCAGC660GGTCTGAATA CCTCACTTTC CCCCCCAACG ACCGGGGTCT TCATGACCCG CTGGGGTGAT720TGTTCCGCCC GGTGAGGATG TCAACCCCCT CGATTCCTCA ATTCACCAGT CCTTTCTCTC780CCTTCTCTTC CGGATCGCAC TCGACTGGCA TGGCGCCGTC TCAGACTGTC GGGTTGGATA840CGCTCGCCGA GGGCTCGCAG TACGTCCTGG AACAATTGCA GCTGTCGCGA GACGCTGCGG900GAACCGGTGC CGGCGATGGC GCGACCTCCA CTTCCTTGCG AAATTCC ATG TCG CAT 956Met Ser His1ACG AAG GAT CAA CCA CCC TTT GAT AAT GAG AAG AAC CAG AGC ACT GGC 1004Thr Lys Asp Gln Pro Pro Phe Asp Asn Glu Lys Asn Gln Ser Thr Gly5 10 15TCG GGT TTT AGG GAC GCT CTG CAA AGA GAT CCC CTC GTG GAG GCT CGC 1052Ser Gly Phe Arg Asp Ala Leu Gln Arg Asp Pro Leu Val Glu Ala Arg20 25 30 35TCT GCC GTC CGC AAA ACC TCG TCT TCA GCT CCG GTT CGC CGC CGA ATC 1100Ser Ala Val Arg Lys Thr Ser Ser Ser Ala Pro Val Arg Arg Arg Ile40 45 50AGC CGT GCG TGT GAC CAG TGT AAC CAA CTC CGA ACG AAA TGC GAC GGG 1148Ser Arg Ala Cys Asp Gln Cys Asn Gln Leu Arg Thr Lys Cys Asp Gly55 60 65CAG CAT CCG TGC GCT CAT TGC ATT G GTAGGCTTCC GCTCTTTCTC1193Gln His Pro Cys Ala His Cys Ile70 75CGATGCCGGC GATGAGGCGG ACGCTTGACT GACCTGTTCT GTAG AA TTC GGA CTG 1248Glu Phe Gly LeuACC TGC GAG TAT GCG CGA GAA CGC AAG AAG CGT GGA AAA GCG TCG AAG 1296Thr Cys Glu Tyr Ala Arg Glu Arg Lys Lys Arg Gly Lys Ala Ser Lys80 85 90 95AAG GAT CTG GCG GCG GCA GCT GCG GCG GCT ACC CAA GGG TCG AAT GGT1344Lys Asp Leu Ala Ala Ala Ala Ala Ala Ala Thr Gln Gly Ser Asn Gly100 105 110CAT TCC GGG CAG GCC AAC GCG TCG CTA ATG GGC GAG CGA ACG TCG GAA1392His Ser Gly Gln Ala Asn Ala Ser Leu Met Gly Glu Arg Thr Ser Glu115 120 125GAC AGC CGG CCA GGA CAA GAC GTG AAC GGC ACA TAC GAC TCG GCT TTT1440Asp Ser Arg Pro Gly Gln Asp Val Asn Gly Thr Tyr Asp Ser Ala Phe130 135 140GAG AGC CAC CAT CTT AGC TCG CAG CCA TCG CAT ATG CAG CAT GCA AGC1488Glu Ser His His Leu Ser Ser Gln Pro Ser His Met Gln His Ala Ser145 150 155ACT GCA GGG ATA TCC GGC CTG CAC GAG TCT CAG ACG GCA CCG TCG CAT1536Thr Ala Gly Ile Ser Gly Leu His Glu Ser Gln Thr Ala Pro Ser His160 165 170 175TCG CAA TCA TCG CTA GGA ACG ACT ATC GAT GCG ATG CAT TTG AAT CAT1584Ser Gln Ser Ser Leu Gly Thr Thr Ile Asp Ala Met His Leu Asn His180 185 190TTC AAC ACG ATG AAC GAT TCC GGT CGC CCG GCA ATG TCC ATA TCC GAT1632Phe Asn Thr Met Asn Asp Ser Gly Arg Pro Ala Met Ser Ile Ser Asp195 200 205CTG CGT TCG CTA CCC CCG TCC GTC TTA CCA CCG CAA GGA CTA AGC TCC1680Leu Arg Ser Leu Pro Pro Ser Val Leu Pro Pro Gln Gly Leu Ser Ser210 215 220GGG TAC AAC GCG AGC GCC TTC GCT TTG GTG AAC CCG CAA GAG CCG GGC1728Gly Tyr Asn Ala Ser Ala Phe Ala Leu Val Asn Pro Gln Glu Pro Gly225 230 235TCA CCA GCT AAC CAG TTT CGC TTG GGA AGC TCA GCG GAA AAC CCA ACC1776Ser Pro Ala Asn Gln Phe Arg Leu Gly Ser Ser Ala Glu Asn Pro Thr240 245 250 255GCA CCG TTT CTT GGT CTC TCG CCT CCA GGA CAG TCG CCT GGA TGG CTC1824Ala Pro Phe Leu Gly Leu Ser Pro Pro Gly Gln Ser Pro Gly Trp Leu260 265 270CCT CTT CCC TCG CCA TCT CCT GCC AAC TTT CCT TCT TTC AGC TTG CAT1872Pro Leu Pro Ser Pro Ser Pro Ala Asn Phe Pro Ser Phe Ser Leu His275 280 285CCG TTT TCC AGC ACT TTA CGA TAC CCT GTT TTG CAG CCG GTC CTG CCT1920Pro Phe Ser Ser Thr Leu Arg Tyr Pro Val Leu Gln Pro Val Leu Pro290 295 300CAC ATC GCC TCC ATT ATT CCG CAG TCG CTA GCG TGT GAC CTT CTG GAT1968His Ile Ala Ser Ile Ile Pro Gln Ser Leu Ala Cys Asp Leu Leu Asp305 310 315TTT TAC TTC ACT AGT TCC TCT TCG TCC CAC CTG TCT CCC TTG TCC CCA2016Val Tyr Phe Thr Ser Ser Ser Ser Ser His Leu Ser Pro Leu Ser Pro320 325 330 335TAC GTG GTG GGC TAC ATC TTC CGC AAG CAG TCT TTC CTT CAC CCG ACA2064Tyr Val Val Gly Tyr Ile Phe Arg Lys Gln Ser Phe Leu His Pro Thr340 345 350AAA CCC CGA ATA TGC AGC CCC GGT CTC CTG GCG AGT ATG GTC TGG GTA2112Lys Pro Arg Ile Cys Ser Pro Gly Leu Leu Ala Ser Met Leu Trp Val355 360 365GCC GCA CAA ACG AGT GAA GCT GCG TTT CTG ACA TCG CCG CCC TCG GCT2160Ala Ala Gln Thr Ser Glu Ala Ala Phe Leu Thr Ser Pro Pro Ser Ala370 375 380CGG GGG CGT GTA TGC CAG AAA CTG CTA GAA CTG ACC ATT GGT TTG CTC2208Arg Gly Arg Val Cys Gln Lys Leu Leu Glu Leu Thr Ile Gly Leu Leu385 390 395CGA CCG TTG GTC CAT GGT CCT GCT ACC GGA GAA GCG TCG CCC AAC TAT2256Arg Pro Leu Val His Gly Pro Ala Thr Gly Glu Ala Ser Pro Asn Tyr400 405 410 415GCG GCG AAT ATG GTC ATC AAT GGC GTC GCT CTG GGC GGA TTT GGG GTC2304Ala Ala Asn Met Val Ile Asn Gly Val Ala Leu Gly Gly Phe Gly Val420 425 430TCC ATG GAT CAG CTG GGC GCG CAA AGT AGC GCC ACC GGC GCC GTG GAT2352Ser Met Asp Gln Leu Gly Ala Gln Ser Ser Ala Thr Gly Ala Val Asp435 440 445GAT GTA GCA ACT TAT GTG CAT CTT GCG ACA GTA GTA TCC GCC AGC GAG2400Asp Val Ala Thr Tyr Val His Leu Ala Thr Val Val Ser Ala Ser Glu450 455 460TAC AAG GCG GCC AGC ATG CGC TGG TGG ACT GCG GCG TGG TCT CTA GCG2448Tyr Lys Ala Ala Ser Met Arg Trp Trp Thr Ala Ala Trp Ser Leu Ala465 470 475CGT GAG CTG AAG CTA GGC CGT GAG CTG CCA CCC AAT GTT TCC CAC GCA2496Arg Glu Leu Lys Leu Gly Arg Glu Leu Pro Pro Asn Val Ser His Ala480 485 490 495CGG CAA GAT GGA GAG CGA GAT GGG GAT GGC GAG GCG GAC AAA CGA CAT2544Arg Gln Asp Gly Glu Arg Asp Gly Asp Gly Glu Ala Asp Lys Arg His500 505 510CCT CCG ACC CTC ATC ACG TCA CTG GGT CAT GGA TCG GGA AGC TCC GGC2592Pro Pro Thr Leu Ile Thr Ser Leu Gly His Gly Ser Gly Ser Ser Gly515 520 525ATT AAT GTC ACC GAA GAG GAG CGT GAG GAG CGT CGA CGC CTA TGG TGG2640Ile Asn Val Thr Glu Glu Glu Arg Glu Glu Arg Arg Arg Leu Trp Trp530 535 540CTC TTA TAT GCG ACC GAT CGG CAC CTG GCG CTG TGC TAC AAC CGG CCC2688Leu Leu Tyr Ala Thr Asp Arg His Leu Ala Leu Cys Tyr Asn Arg Pro545 550 555CTC ACG CTG CTG GAC AAG GAA TGT GGC GGG CTG CTG CAG CCG ATG AAC2736Leu Thr Leu Leu Asp Lys Glu Cys Gly Gly Leu Leu Gln Pro Met Asn560 565 570 575GAT GAT CTG TGG CAG GTC GGC GAC TTT GCA GCG GCT GCC TAC CGC CAG2784Asp Asp Leu Trp Gln Val Gly Asp Phe Ala Ala Ala Ala Tyr Arg Gln580 585 590GTC GGA CCG CCC GTC GAG TGT ACG GGT CAC AGC ATG TAT GGA TAC TTT2832Val Gly Pro Pro Val Glu Cys Thr Gly His Ser Met Tyr Gly Tyr Phe595 600 605CrA CCG CTG ATG ACG ATT CTT GGA GGG ATC GTC GAT CTG CAC CAC GCT2880Leu Pro Leu Met Thr Ile Leu Gly Gly Ile Val Asp Leu His His Ala610 615 620GAG AAT CAT CCG CGC TTT GGC CTG GCG TTC CGC AAT AGC CCG GAG TGG2928Glu Asn His Pro Arg Phe Gly Leu Ala Phe Arg Asn Ser Pro Glu Trp625 630 635GAG CGT CAG GTA CTG GAC GTT ACG CGG CAG CTG GAC ACA TAT GGG CGC2976Glu Arg Gln Val Leu Asp Val Thr Arg Gln Leu Asp Thr Tyr Gly Arg640 645 650 655AGC TTG AAG GAA TTC GAG GCC CGC TAC ACC AGC AAC TTG ACT CTG GGG3024Ser Leu Lys Glu Phe Glu Ala Arg Tyr Thr Ser Asn Leu Thr Leu Gly660 665 670GCT ACG GAT AAC GAG CCT GTC GTC GAA GGT GCC CAC TTG GAT CAC ACG3072Ala Thr Asp Asn Glu Pro Val Val Glu Gly Ala His Leu Asp His Thr675 680 685AGT CCT TCG GGG CGC TCC AGC AGC ACC GTG GGA TCG CGG GTG AGC GAG3120Ser Pro Ser Gly Arg Ser Ser Ser Thr Val Gly Ser Arg Val Ser Glu690 695 700TCC ATC GTC CAC ACG AGG ATG GTG GTC GCC TAC GGG ACG CAT ATC ATG3168Ser Ile Val His Thr Arg Met Val Val Ala Tyr Gly Thr His Ile Met705 710 715CAC GTC CTG CAT ATT TTG CTC GCG GGA AAA TGG GAC CCG GTG AAT CTG3216His Val Leu His Ile Leu Leu Ala Gly Lys Trp Asp Pro Val Asn Leu720 725 730 735TTG GAA GAT CAT GAT CTG TGG ATC TCC TCG GAG TCG TTT GTC TCG GCC3264Leu Glu Asp His Asp Leu Trp Ile Ser Ser Glu Ser Phe Val Ser Ala740 745 750ATG AGC CAT GCG GTC GGT GCC GCA GAA GCA GCG GCA GAA ATC TTG GAG3312Met Ser His Ala Val Gly Ala Ala Glu Ala Ala Ala Glu Ile Leu Glu755 760 765TAC GAC CCG GAT CTC AGC TTC ATG CCG TTC TTC TTC GGG ATT TAC CTA 3360Tyr Asp Pro Asp Leu Ser Phe Met Pro Phe Phe Phe Gly Ile Tyr Leu770 775 780CTA CAG GGC AGT TTC TTG CTG CTA CTG GCG GCG GAC AAG TTG CAG GGC 3408Leu Gln Gly Ser Phe Leu Leu Leu Leu Ala Ala Asp Lys Leu Gln Gly785 790 795GAT GCC AGT CCC AGT GTC GTG CGG GCA TGC GAG ACG ATC GTG CGG GCG 3456Asp Ala Ser Pro Ser Val Val Arg Ala Cys Glu Thr Ile Val Arg Ala800 805 810815CAT GAA GCG TGC GTC GTG ACC TTG AAC ACG GAG TAC CAG GTAGGTTTTC 3505His Glu Ala Cys Val Val Thr Leu Asn Thr Glu Tyr Gln820 825TTGTTTCTCT CCCTAGCTTG GCAATAGTAG CTAACACAAT GTAG AGG ACA TTC CGC 3561Arg Thr Phe Arg830AAG GTC ATG CGA TCG GCG CTG GCA CAG GTT CGA GGA CGC ATC CCA GAG 3609Lys Val Met Arg Ser Ala Leu Ala Gln Val Arg Gly Arg Ile Pro Glu835 840 845GAC TTT GGG GAG CAG CAG CAG CGC CGA CGC GAA GTG CTT GCG CTA TAC 3657Asp Phe Gly Glu Gln Gln Gln Arg Arg Arg Glu Val Leu Ala Leu Tyr850 855 860CGC TGG AGC GGC GAT GGC AGT GGG CTG GCA CTG TAGTTTTGCA GTAACACGGC3710Arg Trp Ser Gly Asp Gly Ser Gly Leu Ala Leu865 870 875TGATGATGAG ATGCGATTTA TGGCGGTGCA TTGACCGGTC AATGGCTTCT TACATTCTGA3770TTTGATACTA CTTTTGGATT CGCTATTTCA CTCCGGGCTT ATGCTGGCTT CATTGTCAAG3830AGGGGTGGCA TGGCGAATGG AAATATGCTT ACTTCGTGTT GATACGGATT CGTACATATA3890CTTTGGTGAT ATATGTGGAT ATTTGTGGCA TGTACACTAT GCGTGATCTT TGGACATGAT3950ACTTTGATAC CAGGTCAATC TAATTGCGTT CTTTTCATTT GTTGCGCAAC AGCCGAGGTA4010TGACGCCATG GCTGAGATAA GCTGCCGATA AGCATTCGCA TTCCATCCTC CATCGAAGCA4070CCAAAATCTT CTTCATATAA CCAATCCATC AATTCAACAT TCGTAATGAC AATAGTATAA4130TCCCCAAAAT GCCCTCCCTA TTACACTCCC TCCGCACTTC CCC 417权利要求
1.一种核酸盒,包括编码一种双向标记的核酸序列,所述的核酸盒进一步包括与编码双向标记的核酸序列可操作地连接的一种基本转录单位,所述的核酸盒还包括以如此的方式与基本转录单位连接的一种可诱导增强序列或激活序列,所述的连接方式为在诱导增强序列或激活序列时能使编码双向标记的核酸序列表达,所述的可诱导增强序列或激活序列衍生自与一部分代谢的活性相关的基因,所述的可诱导增强序列或激活序列优选地衍生自与具有酶级联或反馈环或多重反馈环的代谢部分相关的基因。
2.权利要求1的核酸盒,其中双向标记选自由facB、NiaD、AmdS、Can1、Ura3、Ura4和PyrA基因及其同系物组成的一组。
3.权利要求2的核酸盒,其中双向标记选自由构巢曲霉的facB基因,黑曲霉的NiaD基因,米曲霉的NiaD基因,构巢曲霉的AmdS基因,粟酒裂殖糖酵母的Can1基因,啤酒糖酵母的Ura3基因,粟酒糖酵母的Ura4基因以及曲霉、木霉、青霉、镰孢、糖酵母和克鲁维氏酵母的PyrA基因组成的一组。
4.根据前述任一项权利要求所述的核酸盒,其中可诱导增强序列或激活序列正常参与调节酶级联。
5.根据前述任一项权利要求所述的核酸盒,其中可诱导增强序列或激活序列是包含在下述任一种核酸片段上的上游激活序列(UAS),所述的核酸片段为-来源于分别编码阿拉伯呋喃糖苷酶A、阿拉伯呋喃糖苷酶B及内切阿糖胶酶的abfA、abfB和abnA基因的启动子的片段,-来源于编码糖淀粉酶的glaA基因的片段,-含有如在alcR和alcA启动子上的alcR结合位点的片段,-来源于CUP1基因的片段,-来源于PHO5基因的片段,-来源于GAL1、GAL7或GAL10基因的片段,-来源于xlnA基因的片段,-来源于pgaII基因的片段。
6.根据前述任一项权利要求所述的核酸盒,其中可诱导增强序列或激活序列是包含在下述任一种核酸片段上的上游激活序列(UAS),所述的核酸片段为-来源于分别编码黑曲霉的阿拉伯呋喃糖苷酶A、阿拉伯呋喃糖苷酶B及内切阿糖胶酶的abfA、abfB和abnA基因的启动子的片段,-来源于编码黑曲霉的糖淀粉酶的glaA基因的片段,-含有如在构巢曲霉的alcR启动子上的alcR结合位点的片段,-来源于啤酒糖酵母的CUP1基因的片段,-来源于啤酒糖酵母的PHO5基因的片段,-来源于啤酒糖酵母的GAL1、GAL7或GAL10基因的片段,-来源于构巢曲霉的xlnA、xlnB、xlnC或xlnD基因的片段,-来源于黑曲霉的xlnB、xlnC或xlnD基因的片段,-来源于塔宾曲霉的xlnA或xlnD基因的片段,-来源于黑曲霉的pgaII基因的片段。
7.根据前述任一项权利要求所述的核酸盒,其中可诱导增强序列或激活序列正常参与碳代谢。
8.一种制备和筛选微生物突变株的方法,与未突变菌株相比所述突变能增强预定的代谢部分,所述方法包括-将前述任一项权利要求所述的核酸盒导入宿主,所述的宿主在导入核酸盒之前不显示与双向标记的表达相关的表型,-在使包含在核酸盒上的增强序列或激活序列正常活化并且双向标记能表达的条件下培养得到的微生物,-在上述培养条件下筛选具有与双向标记基因的表达相对应的表型的转化子,-将所选的转化子以已知方式诱变,-在预定的代谢部分的可代谢底物的存在下,在如下条件下培养得到的菌株,所述的条件为具有与双向标记基因的表达相对应的表型的菌株可接受的条件,以及导致未突变的含核酸盒的亲本菌株中不表达双向标记的条件,-在未突变的含核酸盒的亲本菌株中不表达双向标记的选择条件下筛选从诱变后的培养步骤得到的菌株,该菌株具有与双向标记基因的表达相对应的表型。
9.权利要求8的方法,其中-可诱导增强序列或激活序列是衍生自xlnA基因的上游激活序列(UAS),-预定的代谢部分是碳代谢的木聚糖裂解部分,-将得到的微生物在增强序列或激活序列正常活化以及表达双向标记的条件下进行培养的培养步骤包括在存在UAS的诱导物、不存在UAS的阻遏物以及不存在可代谢碳源的条件下进行培养,-筛选具有与双向标记基因的表达相对应的表型的转化子是在上述培养条件下进行,-所选转化子诱变后的培养步骤是在如下条件下进行,所述的条件为具有与双向标记基因的表达相对应的表型的菌株可接受的条件,以及导致未突变的含核酸盒的亲本菌株中不表达双向标记的条件,即在UAS阻遏物和可代谢碳源的存在下,及任选地在UAS的诱导物的存在下进行培养,-筛选从诱变后的培养步骤得到的菌株是在导致未突变的含核酸盒的亲本菌株不表达双向标记的选择条件下进行,该菌株具有与双向标记基因的表达相对应的表型。
10.权利要求9的方法,其中-核酸盒包括编码双向标记pyrA的核酸序列,-在导入核酸盒之前,宿主不具有与双向标记的表达相关的pyrA+表型,-培养步骤,其中得到的微生物在增强序列或激活序列有正常活性并且双向标记基因能表达的条件下培养,包括在增强序列或激活序列有正常活性的条件下培养,即在增强子或激活物的诱导物的存在下、增强子或激活物的阻遏物不存在下以及双向标记基因能表达的条件下培养,-筛选具有与双向标记基因表达相对应的表型的转化子是在上述培养条件下进行,-所选转化子诱变后的培养步骤是在如下条件下进行,所述的条件为具有与双向标记的表达相对应的表型的菌株可接受的条件,以及导致未突变的含核酸盒的亲本菌株中不表达双向标记的条件,即在增强子或激活物的诱导物不存在下或在增强子或激活物的阻遏物存在下和在预定代谢部分的可代谢底物的存在下进行培养,-筛选从诱变后的培养步骤得到的具有与双向标记基因表达相应的表型的菌株是在如下的选择条件下进行,所述的条件为导致未突变的含核酸盒亲本菌株不表达双向标记的条件,即在增强子或激活物的诱导物不存在下或者在增强子或激活物的阻遏物存在下。
11.权利要求9或10的方法,其中-核酸盒包括编码双向标记pyrA的核酸序列,-在导入核酸盒之前,宿主不具有与双向标记的表达相关的pyrA+表型,-可诱导的增强序列或激活序列是从xlnA基因衍生的UAS,-培养步骤,其中得到的微生物在增强序列或激活序列有正常活性并且双向标记基因能表达的条件下培养,包括在UAS有正常活性的条件下培养,即在UAS的诱导物如木糖或木聚糖的存在下,并且在UAS的阻遏物不存在下,即不存在葡萄糖,以及双向标记基因能表达的条件下培养,-筛选具有与双向标记基因表达相应的表型的转化子是在上述培养条件下进行,-所选转化子诱变后的培养步骤是在如下条件下进行,所述的条件为具有与双向标记的表达相应的表型的菌株可接受的条件,以及导致未突变的含核酸盒的亲本菌株不表达双向标记的条件,即在UAS的诱导物如木糖或木聚糖不存在下,或者在UAS的阻遏物存在下即存在葡萄糖和在可代谢碳源的存在下进行培养,-筛选从诱变后的培养步骤得到的具有与双向标记基因表达相应的表型的菌株是在如下的选择条件下进行,所述的条件为导致未突变的含核酸盒亲本菌株不表达双向标记的条件,即在UAS的诱导物如木糖或木聚糖不存在下,或者在UAS的阻遏物存在下即存在葡萄糖。
12.一种制备和筛选未重组的微生物突变菌株的方法,与未突变菌株相比所述突变能增强预定的代谢部分,所述的方法包括进行前述任一项权利要求所述方法的步骤,然后以公知的方式交换除去导入的核酸盒的核酸。
13.一种制备和筛选微生物突变株的方法,所述的突变与未突变株相比抑制预定的代谢部分,所述的方法包括-将权利要求1-7任一项所述的核酸盒导入宿主,所述的宿主在导入核酸盒之前不具有与双向标记表达相关的表型,所述的宿主具有待降低或抑制的预定代谢部分的特征活性类型,-在如下的条件下培养得到的微生物,所述的条件为能使增强序列或激活序列有正常活性,并且双向标记的不表达可使得到的微生物生长和被检测到,并且优选的是所述的双向标记的表达将导致死亡或强烈抑制生长,-在上述培养条件下筛选具有与双向标记基因表达相应的表型的转化子,-将所选的转化子以已知方式诱变,-在可代谢底物存在下,在如下条件下培养诱变后得到的菌株,所述的条件为具有与双向标记的不表达相应的表型的菌株的生长可接受的条件,以及能反应出与具有或不具有核酸盒的未突变宿主相比有降低的或受抑制的预定代谢部分的活性的条件,-筛选从诱变后的培养步骤得到的菌株,所述的菌株具有与在筛选条件下降低的或受抑制的预定代谢部分的活性相应的表型,该选择条件能反应出与具有或不具有核酸盒的未突变宿主相比有降低的或受抑制的预定代谢部分的活性,如在活性待降低或抑制的代谢部分的底物上生长时的水解透明区减小。
14.权利要求13的方法,其中-可诱导的增强序列或激活序列是衍生于xlnA基因的上游激活序列(UAS),-预定代谢部分是碳代谢的木聚糖裂解部分,-培养步骤,其中得到的微生物在增强序列或激活序列有正常活性并且双向标记基因能表达的条件下培养,包括在UAS的阻遏物不存在下、在可代谢碳源存在下、以及优选地在UAS的诱导物的存在下培养,-筛选具有与双向标记基因表达相应的表型的转化子是在上述培养条件下进行,-所选转化子诱变后的培养步骤是在如下条件下进行,所述的条件为对于具有与双向标记的不表达相应的表型的菌株的生长和检测是可接受的条件;以及对于具有与双向标记的表达相应的表型的菌株的生长和检测是不可接受的条件,即存在尿苷和氟乳清酸;以及导致未突变的含核酸盒的亲本菌株具有预定碳代谢部分活性的条件,即存在UAS的诱导物和可代谢碳源并且不存在UAS阻遏物,例如存在D-木糖或与诱导物如木聚糖或D-木糖联合使用的另一种非阻遏碳源,-筛选从诱变后的培养步骤得到的具有与降低的或受抑制的预定碳代谢部分的活性相应的表型的菌株是在如下的选择条件下进行,该选择条件能反应出与具有或不具有核酸盒的未突变宿主相比有降低的或受抑制的预定碳代谢部分的活性,如在木聚糖上生长时的水解透明区减小。
15.权利要求14的方法,其中-核酸盒包括编码双向标记pyrA的核酸序列,-在导入核酸盒之前,宿主不具有与双向标记的表达相关的PYRA+表型,-培养步骤,其中得到的微生物在增强序列或激活序列有正常活性并且双向标记pyrA能表达的条件下培养,包括在增强子或激活物的诱导物存在下、并且在增强子或激活物的阻遏物不存在下以及在双向标记pyrA能表达的条件下培养,-筛选具有与双向标记基因pyrA表达相应的表型的转化子是在上述培养条件下进行,-所选转化子诱变后的培养步骤是在如下条件下进行,所述的条件为对于具有与双向标记的不表达相应的表型即pyrA-表型的菌株的生长和检测是可接受的条件;对于具有pyrA+表型即与双向标记的表达相应的表型的菌株的生长和检测是不可接受的条件,即存在尿苷和氟乳清酸;以及导致未突变的含核酸盒的亲本菌株具有预定代谢部分活性的条件,即存在增强子或激活物的诱导物和可代谢底物并且不存在增强子或激活物的阻遏物或者与诱导物联合使用的另一种非阻遏底物。
16.权利要求14或15的方法,其中-核酸盒包括编码双向标记pyrA的核酸序列,-在导入核酸盒之前,宿主不具有与双向标记的表达相关的pyrA+表型,-可诱导增强序列或激活序列是衍生于xlnA基因的UAS,-培养步骤,其中得到的微生物在增强序列或激活序列有正常活性并且双向标记pyrA能表达的条件下培养,包括在UAS有正常活性条件下培养,即在UAS的诱导物如木糖或木聚糖的存在下,并且在UAS的阻遏物不存在下,即不存在葡萄糖,以及双向标记pyrA能表达的条件下培养,-筛选具有与双向标记基因pyrA表达相应的表型的转化子是在上述培养条件下进行,-所选转化子诱变后的培养步骤是在如下条件下进行,所述的条件为对于具有与双向标记的不表达相应的表型即pyrA-表型的菌株的生长和检测是可接受的条件;对于具有pyrA+表型即与双向标记的表达相应的表型的菌株的生长和检测是不可接受的条件,即存在尿苷和氟乳清酸;以及导致未突变的含核酸盒的亲本菌株具有预定碳代谢部分活性的条件,即存在UAS的诱导物和可代谢碳源并且不存在UAS阻遏物,例如存在D-木糖或与诱导物如木聚糖或D-木糖联合使用的另一种非阻遏碳源,-筛选从诱变后的培养步骤得到的具有与降低的或受抑制的预定碳代谢部分的活性相应的表型的菌株是在如下的选择条件下进行,该选择条件能反应出与具有或不具有核酸盒的未突变宿主相比有降低的或受抑制的预定碳代谢部分的活性,如在木聚糖上生长时的水解透明区减小。
17.一种制备和筛选未重组的微生物突变菌株的方法,与未突变菌株相比所述突变能抑制预定的代谢部分,所述的方法包括进行权利要求13-16任一项所述方法的步骤,然后以公知的方式交换除去导入的核酸盒的核酸。
18.一种确定可诱导增强序列或交换序列的激活调节物及其核酸序列的方法,包括-以公知的方式进行互补试验,其中以公知的方式用不含核酸盒序列的未突变亲本菌株基因组的一部分转化根据权利要求13-16中任一项所述得到的宿主,然后-基于双向标记的表达筛选激活物阳性转化子,以及-以公知的方式将来自激活物阳性转化子的核酸与根据权利要求13-16中任一项所述方法获得的突变体的核酸进行比较,并以公知的方式鉴定和分离包括存在于激活物阳性转化子中并在激活物阴性突变体中被突变的片段的核酸。
19.权利要求8-18任一项所述的方法,其中宿主在导入核酸盒之前包括至少部分相应于编码双向标记的核酸序列的核酸,所述的相应程度应足以使包含在核酸盒上的双向标记编码核酸在染色体上同源重组。
20.一种联合核酸盒,包括1)与可诱导增强序列或激活序列的激活调节物的靶基因正常相关的启动子,2)与另一启动子可操作连接的编码调节物的核酸序列,3)编码同源或异源蛋白质或肽的同源或异源序列,所述的启动子(1)与该同源或异源序列可操作连接,特别是这种激活调节物参与代谢,更特别的是这种激活调节物参与具有酶级联或反馈环或多重反馈环的代谢部分,并且靶基因具有与调节物基因的表达产物结合的结合位点。
21.权利要求22的联合核酸盒,其中与编码调节物的核酸序列可操作连接的另一启动子是与编码调节物的核酸序列天然相关的启动子。
22.权利要求20或21的联合核酸盒,其中编码调节物的核酸序列编码木聚糖裂解调节物,优选地该核酸序列编码xylR。
23.权利要求21-22任一项所述的联合核酸盒,其中编码调节物的核酸序列是权利要求41-46任一项所述的核酸序列或编码权利要求47-56任一项所述的多肽或蛋白质。
24.权利要求20-23任一项所述的联合核酸盒,其中启动子(1)选自与靶基因xlnA,xlnB,xlnC,xlnD和axeA相关的启动子。
25.权利要求20-24任一项所述的联合核酸盒,其中启动子(1)选自与靶基因xlnD相关的启动子。
26.权利要求20-25任一项所述的联合核酸盒,其中同源或异源序列编码一种酶。
27.权利要求20-26任一项所述的联合核酸盒,其中同源或异源序列编码木聚糖酶、葡聚糖酶、α-葡糖醛酸酶、脂酶、酯酶、阿魏酸酯酶、蛋白酶或氧化还原酶如己糖氧化酶。
28.一种载体,包括权利要求20-27任一项所述的联合核酸盒。
29.一种宿主细胞,包括包括权利要求20-27任一项所述的联合核酸盒和/或权利要求28的载体。
30.一种宿主细胞,包括权利要求20的组分,所述的宿主细胞天然地或经重组DNA技术包括调节物的靶基因,条件是当靶基因和调节物相对于宿主细胞是天然的时,调节物以多拷贝存在。
31.一种宿主细胞,包括多拷贝的权利要求20中定义的编码调节物的核酸序列或权利要求41-46任一项所述的核酸序列。
32.权利要求29-31任一项所述的宿主细胞,包括权利要求20中定义的编码调节物的核酸序列或权利要求41-46任一项所述的核酸序列以及权利要求20中定义的启动子(1),所述的启动子为与靶基因xlnD相关的启动子。
33.权利要求29-32任一项所述的宿主细胞,选自微生物和植物细胞。
34.权利要求29-33任一项所述的宿主细胞,选自真菌细胞,优选地选自丝状真菌细胞。
35.权利要求29-34任一项所述的宿主细胞,所述的宿主细胞选自曲霉属、木霉属、青霉属和镰孢属。
36.权利要求29-35任一项所述的宿主细胞,所述的宿主细胞为选自黑曲霉、塔宾曲霉、棘孢曲霉、泡盛曲霉、米曲霉、构巢曲霉、臭曲霉、土曲霉、萨氏曲霉、川地曲霉、炭黑曲霉和日本曲霉的菌株。
37.权利要求29-35任一项所述的宿主细胞,所述的宿主细胞为属于选自糖酵母属、克鲁维氏酵母属和乳杆菌属的菌株。
38.权利要求37的宿主细胞,所述的宿主细胞为选自啤酒糖酵母或粟酒糖酵母的菌株。
39.权利要求29-38任一项所述的宿主细胞,其中靶基因对于宿主细胞是内源的。
40.权利要求29-39任一项所述的宿主细胞,其中靶基因以多拷贝存在。
41.一种编码表达产物xylR的核酸序列xlnR,具有如序列号9的编码核酸序列,及其等价核酸序列。
42.权利要求41的核酸序列,所述的序列能在实施例中所述的特异的最低严格性条件下与衍生自序列号9的核酸序列的引物或探针杂交,所述的引物或探针从非锌指结合区衍生并且所述的引物或探针的长度至少为20个核苷酸。
43.权利要求41或42的核酸序列,所述的序列能在实施例中所述的特异的最低严格性条件下与序列号9的编码核酸序列杂交。
44.权利要求41-43任一项所述的核酸序列,其编码的表达产物与序列号9的xylR的氨基酸序列或由序列号9的编码xylR的核酸序列所编码的氨基酸序列有80-100%的相同性。
45.权利要求41-44任一项所述的核酸序列,具有序列号9的氨基酸序列。
46.权利要求41-45任一项所述的核酸序列,其中与序列号9的编码核酸序列相比,该序列在一或多个片段中包括缺失和/或取代。
47.由权利要求41-46任一项所述的核酸序列编码的氨基酸序列或其等价物。
48.权利要求47的氨基酸序列,其中该氨基酸序列是序列号9的氨基酸序列或其等价物。
49.权利要求47或48的氨基酸序列,其中与序列号9的氨基酸序列相比,等价物的相同性为80-100%、优选85-100%、更优选90-100%、最优选95-100%。
50.权利要求47-49任一项所述的氨基酸序列,其中等价的表达产物应具有DNA结合活性,优选地这种DNA结合活性应是表达产物与靶基因的核酸序列的结合程度应等于或优于具有序列号9中的氨基酸序列的表达产物与靶基因的核酸序列的结合程度。
51.权利要求47-50任一项所述的氨基酸序列,其中与序列号9的氨基酸序列相比,该序列在一或多个片段中包括缺失和/或取代。
52.权利要求47-51任一项所述的氨基酸序列,包括从锌指结合区开始的C末端部分氨基酸序列。
53.权利要求47-52任一项所述的氨基酸序列,所述的氨基酸序列包括相应于锌指结合区的片段。
54.权利要求47-53任一项所述的氨基酸序列,所述的氨基酸序列包括相应于RRRLWW基序的氨基酸序列。
55.权利要求47-54任一项所述的氨基酸序列,其中在相应于由序列号9的1110-1260位的核苷酸编码的氨基酸序列的锌指结合区不存在突变。
56.权利要求47-55任一项所述的氨基酸序列,其中在相应于序列号9的氨基酸序列中存在的基序RRRLWW的RRRLWW基序不存在突变。
57.一种突变宿主细胞,所述的宿主细胞不存在权利要求20中定义的调节物编码序列或者在该调节物编码序列中存在突变,从而所述的调节物不表达或者其不具备调节物活性,即所谓的剔除突变宿主细胞。
58.权利要求57的突变宿主细胞,进一步包括编码一种蛋白质或肽的同源或异源序列,所述的蛋白质或肽可不具有木聚糖裂解副活性。
59.一种产生不具有木聚糖裂解副活性的异源或同源蛋白质或多肽的方法,包括以已知的方式培养权利要求57或58的剔除突变体,获得异源或同源蛋白质。
60.权利要求20-27任一项所述的联合核酸盒用于以从编码蛋白质或肽的核酸序列生产蛋白质或肽的已知方式生产同源或异源蛋白质或肽的用途。
61.权利要求41-46任一项所述的核酸序列用于过量表达靶基因的用途,所述的过量表达是在包含靶基因的宿主细胞中表达该核酸序列,所述的靶基因与一种启动子可操作地连接,所述的启动子与由权利要求41-46任一项所述的核酸序列编码的可诱导增强序列或激活序列的结合调节物的靶基因正常相关,条件是当靶基因和权利要求41-46任一项所述的核酸序列相对于宿主细胞是天然的时,与野生型宿主细胞相比,权利要求41-46任一项所述的核酸序列以多拷贝存在于细胞中。
62.权利要求29-40任一项所述的宿主细胞用于以从编码蛋白质或肽的核酸序列生产蛋白质或肽的已知方式生产同源或异源蛋白质或肽的用途。
63.用作引物或探针的核酸片段,所述的片段是核酸序列号9,所述的引物或探针衍生自非锌指结合区并且所述的引物或探针的长度至少为20个核苷酸。
64.权利要求63的核酸片段,所述的片段衍生自从锌指结合区开始的序列号9的C-末端编码部分。
65.在用于检测和/或分离序列号9的等价序列的试剂盒中的两个或多个权利要求63或64的片段的组合。
66.权利要求65的组合,其中一个片段不包括形成锌指区的部分核酸序列。
67.序列号9的氨基酸序列的突变体,所述的突变位于锌指结合区并显示增加的DNA结合能力。
68.序列号9的氨基酸序列的突变体,所述的突变显示降低的DNA结合能力。
69.序列号9的氨基酸序列的突变体,所述的突变位于锌指结合区,所述突变体显示降低的DNA结合能力。
全文摘要
本发明属于微生物突变和突变体筛选的领域,具体地,本发明涉及以简单、直接和特异的方式获得代谢突变体。在一优选的实施方案中还可以获得不包括重组DNA的所需突变体,从而因缩短立法程序而加速将所述突变体参入供人类消费和应用的产品中。本发明的方法涉及随机突变和特异筛选所需的代谢突变体。本发明描述了一种核酸盒及其在筛选突变体的方法中的应用,所述的核酸盒包括编码一种双向标记的核酸序列,所述的核酸盒进一步包括与编码双向标记的核酸序列可操作地连接的一种基本转录单位,所述的核酸盒还包括以如此的方式与基本转录单位连接的一种可诱导增强序列或激活序列,所述的连接方式为在诱导增强序列或激活序列时能使编码双向标记的核酸序列表达,所述的可诱导增强序列或激活序列衍生自与一部分代谢的活性相关的基因。另外还描述了编码可诱导增强序列或激活序列的激活调节物的调节物基因x1nR,以及所述基因和/或其表达产物在过量表达同源或异源蛋白质或肽中的应用。本发明还涉及其中不存在所述基因或所述基因失活的剔除突变体,以及具有增加的或降低的DNA结合能力的突变体。
文档编号C12N15/10GK1207128SQ96196200
公开日1999年2月3日 申请日期1996年6月24日 优先权日1995年6月23日
发明者伦德特·亨德里克·德格拉夫, 亨丽埃特·凯瑟琳娜·范登布勒克, 雅克·菲瑟 申请人:丹尼斯科成分公司(丹尼斯科公司)
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1