丝状真菌中dna表达文库的高通量筛选的制作方法

文档序号:588583阅读:924来源:国知局
专利名称:丝状真菌中dna表达文库的高通量筛选的制作方法
丝状真菌中DNA表达文库的高通量筛选发明概述本发明提供了一种在丝状真菌宿主中表达和后继筛选DNA文库,尤其是合成文库、基因组文库和cDNA文库的方法。该系统采用转化或转染的丝状真菌,这些真菌在深层培养中通过诸如有效的孢子形成等途径产生可转移的复制单元。这些真菌优选表现这样一种形态,即很少或不形成纠缠的菌丝体。其中更为优选的菌株还能表达可分离量的外源蛋白,用于评测。本发明的突变的真菌菌株由于产生可转移的复制单元、可高水平的表达外源基因、以及非常低的培养粘度,因此它们非常适合高通量的筛选技术。
背景技术
天然微生物种群表现广泛的生化和代谢多样性。由于许多微生物的分离和培养非常困难,这些微生物中大量有潜在价值的蛋白质和多肽不能被发现。事实上,据估计目前全世界只有不到的微生物被分离和培养。发明新的方法从未被认知乃至已被分离的微生物中分离蛋白质、多肽和代谢物仍然是一个迫切的需求。(术语“蛋白质”在后面的文章中应被理解为包括蛋白质和多肽。)鉴定和分离编码这些蛋白质的基因,从而能修饰和/或生产这些蛋白质也是人们所需要的。Short在美国专利5938672、6001574、6030779和6057103(它们的内容通过参考合并到本发明中)中阐述了解决这一问题的一个途径。在该方法中,他们直接从环境样品(如土样)中制备了基因组DNA文库,而没有试图从中分离或培养任何可能存在的生物。该文库在大肠杆菌中被表达,并从获得资源甚至纯粹兴趣的角度筛选表达的蛋白。Short暗示, 但没有明确论述或肯定在该方法中使用了真菌宿主细胞。上述方法有许多重大缺陷,其中之一就是大肠杆菌不能有效地表达有内含子的基因。土壤中大约90%的物种是真核生物(主要是真菌),因此其中大部分生物的基因组 DNA中有内含子。虽然已经发现的真菌有大约10万种,但是估计大约有100万种真菌仍未被发现(B. Kendrick,《第五界》,Mycologue出版社,1999),真菌基因组编码蛋白质和代谢物的潜在多样性远比已知的真菌高,但是由于内含子的存在,使得绝大部分真菌特有蛋白和代谢物不能在细菌表达系统中有效表达。不仅许多种酶类(例如分泌形真菌木质素过氧化物酶和锰依赖型过氧化物酶)是真菌特有的,而且有许多真菌蛋白,包括酶类(例如木质素过氧化物酶和黑曲霉蔗糖酶)是糖基化的;但是如果这些蛋白在大肠杆菌中表达就不能被糖基化。由于真菌基因组的数量大,长度和复杂度非常高,许多蛋白是真菌特有的,并且许多真菌蛋白都要进行糖基化,所有这些都表明,如果将给定的环境微生物样品的基因组DNA 在细菌中进行表达,能被细菌识别并正确表达的微生物蛋白和代谢物的丰度不超过10%。部分由于爱滋病的蔓延和接受器官移植的人数量的增加,越来越多的人受到免疫损害或免疫抑制,导致真菌感染的数量和种类稳步增长(《传染病医学杂志》16 :380-382, 385-386(1999))。因此正在进行的研制新抗真菌药的过程中需要分离和鉴定来自致病真菌的蛋白质,而这又需要有筛选来源于真菌基因组的DNA文库的能力。由于真菌基因组中内含子的存在,使得在目前已知的绝大多数细菌宿主细胞中表达这些文库变得非常困难。同样,由于越来越多的细菌感染对抗生素产生抗药性,也需要对有抗生素活性的真菌代谢物进行高通量筛选。真核生物的基因组太复杂,以至于不能在细菌中完全表达其DNA文库。如果算上所有的真核生物,细菌只代表所有已知物种的0.3% (E.O.Wilson,“生物多样性的现状〃,《生物多样性》,国家学术出版社,华盛顿特区,1988,第一章);因而能在细菌中表达的全世界基因多样性是极其有限的。为了避免内含子的问题,可以构建cDNA文库在细菌中表达。但是这种方法必须有转录产物RNA的存在,而任何当时未被活跃转录的基因都不会出现在该文库中。而许多我们需要的蛋白只在特定条件下才表达(例如致病真菌中的毒性因子),并且不一定在收获 mRNA时存在。而且,为了获得足够量的RNA构建DNA文库,需要培养大量的菌体。对于环境样品中不易培养的生物,或者新的适宜培养条件还未找到的微生物而言,获得大量的RNA 是困难或不可靠的。相比之下,通过很少量的单个细胞,采用随机引物或适合某一类基因的引物进行PCR扩增,就能获得足够的基因组DNA。最后,在某个生物体中表达量高的基因也会导致其mRNA的超量合成,而在基因文库中,它的超量合成是以掩盖一些微量表达的基因为代价的。如果是构建cDNA文库而不是基因组文库,为了包括尽可能多的现存mRNA种类, 必须要筛选多得多的克隆,因为后者更能均衡地代表现存的基因种类。显然,如果可能的话,人们更愿意构建基因组DNA文库。并且,大肠杆菌不能将许多蛋白质分泌出来,这对于用于筛选目的,而筛选依赖于宿主细胞将外源基因产物分泌到胞外的宿主细胞是一个缺陷。对于大肠杆菌和所有细菌宿主细胞来说,另一个缺陷是,许多真核生物蛋白需要多种翻译后加工以获得活性,而细菌不能对它们进行翻译后加工。除了糖基化,亚基切分、二硫键形成和蛋白的正确折叠是生成有活性蛋白所常需的翻译后加工的范例。为了保证这些翻译后加工,有时可以利用哺乳动物细胞,但是这些细胞很难培养, 需要昂贵的培养基,并且不总是能高效地转化外源基因。虽然科学家们努力尝试用哺乳动物细胞做CDNA文库筛选的宿主(Schouten et al. , WO 99/64582),但这种转化系统显然不适合蛋白质的高通量筛选。一种在文库筛选前将转化的原生质体与哺乳动物细胞融合的方法已被报道(美国专利5,989,814),但是细菌或酵母细胞中蛋白质文库的表达发生在细胞融合之前。有人试图用酶在宿主细胞表达外源蛋白后对蛋白的糖基化方式进行改造(Meynial-salles 和 Combes,J. Biotechnol. ,46 1-14(1996)),但是这种方法必须针对不同的蛋白而改变,并且不适用于从DNA文库中表达蛋白。在更近一些时候,Maras et al.,Eur. J. Biochem.,249 :701-707(1997)(又见美国专利 5,834,251)报道一株里氏木霉 (Trichoderma reesei)基因工程菌表达人类乙酰糖苷(GlcNAc)转移酶I。该酶将所表达的其它外源基因的N-乙酰葡萄糖苷转化为甘露糖残基,这是向有天然活性的哺乳动物蛋白迈进的第一步。用酵母作为宿主细胞解决了上述的一些问题,但却引入了新的问题。酵母倾向于过度糖基化外源蛋白质(Bretthauer 和 Castellino, 1999,Biotechnol. Appl. · Biochem. 30 :193-200),而由于糖基化方式的改变,常使得表达的哺乳动物蛋白质具有高抗原性(C. Ballou, Molecular Biology of the yeast saccharomyces (酵母的分子生物学),J. Strathern et al.,eds.,Cold Spring Habor Laboratory Press, NY, 1982, 335-360)。虽然酵母可以应付少数一些内含子,但是它们基本上不能处理从高等物种,比如脊椎动物的复杂基因。即使来自丝状真菌的基因对于酵母来说也太复杂以至不能有效地转录,再加上酵母和丝状真菌的表达和基因拼接序列不同,使这一问题变得更加复杂(参见例如M. hnis et al.,Science 1985,228:21-26)。尽管有这些缺点,酵母转化和表达体系还是被广泛地开发,主要用作cDNA文库的表达。人们开发酵母表达系统,用来筛选源自哺乳动物的自然分泌蛋白和膜蛋白(Klein,et al. , Proc. Natl. Acad. Sci. USA 1996 93: 7108-7113 ;Treco,美国专利 5,783,385),异源的真菌蛋白(Dalboge 和 Heldt-Hansen,Mol. Gen. Genet. 243 :253-260 (1994)),和哺乳动物蛋白(Tekamp-Olson 和 Meryweather,美国专利 6,017,731)。术语“酵母”在本文酵母表达系统部分中是指分类上属于酵母目的生物,例如酿酒酵母和巴斯德毕赤氏酵母。为了明确上述定义,术语“真菌”和“真菌的”应被理解为担子菌纲、结合菌纲、卵菌纲、壶菌纲和隶属于真子囊菌纲的子囊菌,而不包括酵母目。丝状真菌和酵母可以通过它们在无性繁殖时菌丝体的延长和需要空气进行碳代谢来区别(酵母的无性繁殖是单个细胞的出芽生殖,而且酵母可以进行发酵生长代谢)。真菌宿主细胞能最有效地进行真菌基因产物正确的内含子的拼接、糖基化、折叠和其它翻译后加工,这使得丝状真菌成为最好的进行土壤样品基因组DNA筛选的宿主菌。同时丝状真菌也成为生产有商业价值的真菌酶类,如蛋白酶、纤维素酶和淀粉酶的最好宿主菌。人们同时发现,丝状真菌能够转录、翻译、加工和分泌其它真核生物基因产物,包括哺乳动物基因。该特性使得丝状真菌成为生产有生物医药价值的蛋白质的合适宿主菌。与酵母相比,丝状真菌引入的糖基化模式更接近于哺乳动物蛋白的糖基化模式。由于上述原因,科学家投入了巨大的努力来开发用来表达外源性蛋白的真菌宿主系统,并且已经开发出了许多真菌表达系统。欲了解该领域的工作,请参见Maras et al., glycoconjugate J. ,16 :99-107(1999) ;PEBERDY, Acta Microbiol. Immunol. Hung. 46 165-174(1999) ;Kruszewsa,Acta Biochim. Pol. 46 181-195 (1999) ;Archer et al. ,Crit. Rev. Biotechnol. 17 :273-306(1997); 禾口 Jeenes et al. , Biotech. Genet. Eng. Rev. 9 327-367(1991)。从真菌基因组构建的DNA文库的高通量表达和鉴定也可以被用来确定许多现在功能未知的哺乳动物基因的功能。例如,一旦发现了一个真菌蛋白质具有一种令人感兴趣的功能特性,可以将编码该蛋白的基因序列与人类基因组序列相比较来寻找同源基因。Yelton等在美国专利第4,816,405号中阐述了改造丝状子囊菌以使其生产并分泌异源蛋白质。Buxton等在美国专利第4,885,249号,以及Baxton和Radford,Mol. Gen. Genet. 196 :339-344(1994)中通过一个带有可以整合到宿主细胞中的选择标记的DNA载体对黑曲霉进行了转化。McKnight等在美国专利第4,935,349号,以及Boel在美国专利第 5,536,661号阐述了利用可以引导异源基因在根霉和其它丝状真菌中表达外源基因的启动子在曲霉中表达真核基因的方法。Royer等在美国专利第5,837,847号中,以及Berka等在 WO 00/56900中,介绍了一种采用天然或突变过的镰刀菌启动子的有毒镰刀菌表达系统。 Conneely等在美国专利第5,955,613号中介绍了所构建的适合在曲霉中表达和生产乳铁蛋白的质粒。枝孢菌的葡萄糖氧化酶已经在曲霉中被表达(美国专利第5,879,921号)。相似的技术也被应用在链孢霉中。Lambowitzr在美国专利第4,486,533号中,介绍了一种可以在丝状真菌中自动复制的DNA载体及其在链孢酶内弓丨入和表达外源基因中的应用。Stuart等在美国专利第5,695,965号中介绍了厚壁链孢菌(Neurospora crassa) 原生质球的哺乳动物基因和内源性转录调节因子的共转化,并在美国专利第5,776,730号中描述了一株经改良后减少了胞外蛋白酶的链孢菌。美国专利第5,834,191号中公开了用于链孢菌转化的载体。Taraki等在美国专利第5,436,158号中介绍了一种用于I^hizopus 中的转化系统。Sisniege-Barroso等在WO 99/51736中介绍了用于丝状真菌的转化系统, 该系统采用了来自于Aspergillus awamori的谷氨酸脱氢酶启动子。Dantas-Barbosa等在FERMS Microbiol. Lett. 1998 169 185-190中,介绍了通过醋酸锂法或电激法转化灰色腐殖菌(Humicola grisea)的Thermoidea变种,使它获得了对潮霉素B的抗性。更加成功的一些真菌表达系统是曲霉属和木霉菌属,相关例子请参见Berka等在美国专利第5,578,463号中的说明,在Devchand和Gwynne的文章J. Biotechnol. 17 3-9(1991),以及 Gouka 等的文章 Appl. Microbiol. Biotechnol. 47 :1-11 (1997)中也有论述。菌禾中 Myceliophthora thermophilia, Acremonium alabamense,陆生梭菌(Thielavia terrestris)和 Sporotrichum celluliphilum 转化株的例子分别在 WO 96/02563,美国专利第5,602, 004,5, 604, 129,5, 695,985号中有报道。这些报道称曲霉和木霉系统有一定的缺陷,暗示其它的真菌也许更适于大规模蛋白质生产。除子囊菌门外其它门的转化方法也有文章报道。请参见例子=Mimoz-Rivas 等,Mol. Gen. Genet. 1986 205 103-106 SchizophylIum commune ;van de Rhee 等, Mol. Gen. Genet. 1996 250 :252-258,双 胃(Agaricus bisporus) ;Arnau 等,Mol. Gen. Genet. 1991 225 :193-198,拳卷毛霉(Mucor circinnelloides) ;Liou 等,Biosci. Biotechnol. Biochem. 1992 56 1503-1504 光亮根霉(Rhizopus niveus) Judelson 等, Mol. Plant Microbe Interact. 1991 4 :602-607,致病疫霄(Phytophthora infestans);以 ^de Groot^,Nature Biotechnol. 1998 16 :839-842,) ^ (Agaricus bisporus)。丝状真菌除了例如原生质体融合等常规转化方法外,Chakraborty和Kapoor,在 Nucleic. Acids Res. 18 :6737 (1990)中介绍了利用电激法转化丝状真菌。De Groot等在 Natyre Biotechnol. 16 :839-842(1998)中采用根癌农杆菌(Agrobacterium tumefaciens) 介导的几种丝状真菌的转化。科学家也开始利用生物介质将外源DNA转入真菌;例子有:Christiansen 等,Curr. Genet. 29 100-102 (1995) ;Durand 等,Curr. Genet. 31 158-161(1997);以及 Barcellos 等,Can. J. Microbiol. 44 :1137-1141(1998)。以磁粒作为 “磁性生物介质”转化细胞的报道参见美国专利第5,516,670号和5,753,477号,科学家希望这种方法适用于丝状真菌。显然人们作了许多努力开发以真菌作为宿主菌的表达系统。然而,普通的真菌宿主都是丝状真菌,在不加搅拌的培养液中会形成纠缠的菌丝体,而在加以搅拌的生物反应器中培养液粘度又会很大。丝状真菌的这些特性也会在以之为宿主菌的工业化酶生产中导致问题。例如,高粘稠度和/或在局部形成的密集菌丝体堆积,将会对搅拌、通气和营养物分散造成困难。一般来说,由于培养液的粘度,用微量移液器将丝状真菌悬浮培养物吸到微量滴定板中有一定困难。而且,由于典型丝状真菌培养物的菌丝体互相纠缠,用它来表达 DNA文库时,大规模地将纠缠的菌丝体分离为单个克隆并不容易,这将使检测单个基因型这一高通量检测系统所需的步骤遇到困难。在不进行持续的搅拌时,典型的丝状真菌倾向于在液体培养基的表面生长并形成一层菌丝体,并在其上产气生孢子。而在培养基液面以下生长时又不总是产生孢子。这两个特性都对在微量滴定板中培养丝状真菌菌落,以及对有效地操作和利用这种培养物进行高通量的筛选制造了巨大的困难。悬浮的孢子和其它的可复制单元适于分离并分散到单个的微量滴定板孔中,但如果允许气生菌丝体的形成,气生孢子的产生会导致板孔间的交叉污染。在微量滴定板孔的培养基中进行搅拌以防止气生菌丝层的形成是不可行的。除了难以控制的气生孢子问题,气生菌丝层会干扰光的转移,使得许多检测(尤其是分光光度吸收检测)较难甚至无法进行。气生菌丝层还对诸如供氧、试剂和营养的添加以及取样等产生干扰。真菌的形态特征对其培养物的物理特性的影响已经被认知,人们已经找到了有更好特性的自然产生的菌株,Jenssen和Boominathan的美国专利第5,695,985号提供了一个例子。松散的菌丝体均一分布,有规律的分枝,都是所描述的有益的形态特征。khuster和 Royer在国际专利申请W097/26330和美国专利6,184,206中提到了相似的方法,用来分离鉴定形态特征更适合于工业化生产外源蛋白质的真菌。该方法不是直接筛选野生型菌株, 而是筛选亲本真菌细胞的突变株系,转化突变株,检测是否有转化子比亲本产生更多的外源蛋白。比亲本至少多出10%菌丝体分枝的突变株被特别注意。该方法被应用于木霉属、 镰刀霉属和曲霉属的筛选,他们还暗示此方法可以应用于其它许多属。Bock 等在 Biotechnol. Bioeng. 65 :638-648(1999)中检测了分枝频率对米曲霉突变株培养物粘度的影响;结果发现分枝越I的突变株培养物粘度越低。而Van Wezel等在 PCT应用WO 00/00613中,介绍了一种减少菌丝分枝和/或增加菌丝体片段的数量的方法, 培养液的粘度也被降低了。该方法将灰色链霉菌W^gA基因转入了微生物中。该方法采用的是放线菌目的丝状细菌,但宣称适用于丝状真菌。在WO 00/56893中,Durm-Co Ienman 等描述了一株构巢曲霉的HbrA2突变株在42°C以上生长时分枝数大大增加,并且观察到菌丝分枝度与培养物粘度之间呈线性关系。对丝状真菌表达系统的绝大多数前期研究都是为了分离鉴定适于工业化酶生产的菌株,因而人们的注意力主要集中在培养液粘度、转化的稳定性、单位体积的外源蛋白产量,以及产量占生物量的百分比这些方面。已经在真菌中表达了一些DNA文库,例如Gems 和Clutterbuck在Curr. Genet. 1993 24 :520-5 这篇论文中,用构巢曲霉系统表达了构巢曲霉文库。Gems等在Mol. Gen. Genet. 1994 242 :467-471这篇论文中,用曲霉系统表达了一个来源于青霉的基因组文库。但是这两个例子都没有透露或暗示对表达的蛋白进行了筛选;而是通过对宿主突变的等位基因的互补作用来证实来自DNA文库的基因已经获得了表达。这种互补的方法对每个想要检测活性的外源蛋白都需要一个特定的突变株做宿主菌, 因而不能对一般的文库筛选提供一个工具。Berges 等人在 Curr. Genet. 1993 24 :53-59 这篇论文中,阐述了用在 Trichoderma reesei中表达的方法克隆了一个黑曲霉蔗糖酶基因。具体方法是利用一个构建在有选择标记的粘粒上的黑曲霉基因组文库,并采用一株不能利用蔗糖的里氏木霉(T.reesei)作为宿主菌,用同胞选择的方法克隆了一个黑曲霉蔗糖酶基因。在这里,同样需要有特定性状的宿主菌来检测特定单个外源蛋白的表达,基因组文库的筛选没有被提及甚或不可能。—个适于表达DNA文库的宿主菌的特点在许多方面与适合于工业化蛋白质生产的宿主菌不同。总的来说,一株适合于高通量筛选的真菌宿主菌应具备许多条件,其中包括-宿主菌必须能进行高效转化。-宿主菌必须能处理含有内含子的基因,并能进行任何必要的拼接。-宿主菌必须能对表达的蛋白进行翻译后加工,以使蛋白变为有活性的形式。-当从文库中筛选一种蛋白质时,宿主菌必须能够生产足够多的该蛋白以供分析 Z用ο-宿主菌必须能接受许多种表达调控因子,并能轻松利用各种调控因子。-宿主菌培养物中的菌丝体不能相互纠缠而对分离单个克隆产生困难,也不能相互纠缠而升高粘度到不能在小型化的高通量筛选中(如微量取样)有效转移和复制的程度。-宿主菌不能在培养基表面形成菌丝层,而应优先在培养基液面以下生长。-在高通量筛选所提供的生长条件下,宿主菌必须能在培养基液面以下有效地形成孢子或其它无性繁殖体。当被筛选物是代谢产物时,如果宿主细胞能将代谢产物分泌到培养基是再好不过了。在培养基中代谢产物可以被很容易地检测和/或分析。在理想状态下,宿主菌应该只分泌外源蛋白。当对蛋白质进行分析时,如果宿主菌也能表达足够用来分离和纯化的外源蛋白就非常有利了。如果有具备这种特点的宿主菌,就可以只通过培养宿主细胞,而不用烦琐费时的分子生物学操作将基因转入其他生物体,来进一步鉴定所有感兴趣的外源蛋白。宿主菌能将蛋白质分泌到胞外是一个好的特性,这样可以进行更可靠和更多样的检测。如果宿主细胞能方便地分离外源DNA也将是非常有利的,这样进一步的研究以及改造基因本身也可以进行。除了上述的特性,这种转化系统还应具备一些其它的特点。转化的效率应该足够高,以产生有意义的筛选所必须的足够转化子数。在理想状态下,外源蛋白的表达应由一种诱导物诱导,并且该诱导物通过一条途径作用在一个启动子上。迄今为止,还没有任何宿主菌和转化系统的组合符合全部这些条件,甚至连能符合大部分的也没有。因此,人们仍然需要能有效表达DNA文库一尤其是基因组文库和/或真核基因组文库的基因产物的真菌宿主和转化系统。发明简述本发明采用在深层培养时能产生“可转移的复制单元”的丝状真菌。“可转移的复制单元”是指孢子、无性芽、菌丝片段、原生质体、皮层碎片,或其它符合下面两个特征的真菌单元(1)在培养基中能容易地与其它这类单元分离,和( 能够自身复制成一个单克隆培养物。优选真菌还表现出丝状形态不明显和/或生长紧密的优点,并且产生适于高通量 DNA文库筛选中涉及的物理操作的低粘度培养物。尤其优选的是,即使在不加搅拌的情况下仍然倾向于在培养基内部生长,而不是在培养基表面形成菌丝层的丝状真菌。本发明利用了在国际专利申请PCT/NL99/00618和PCT/EP99/202516中公开的转化系统的特点。这些申请描述了一种对诸如Chrysosporium lucknowense, Aspergillus sojae等丝状真菌宿主非常有效的转化系统。这些申请还公开已经获得了保留野生型宿主细胞所有优良性状,但部分失去其丝状表型的突变株,这种突变株降低了培养物的粘度。
本发明所采用的优选真菌能够大量表达并分泌外源蛋白质,与已知丝状真菌宿主相比蛋白质/生物量之比获得了提高。本发明提供了一个表现高转化子产量的转化系统。 本发明还提供了能有效表达外源cDNA插入体,尤其是基因组DNA插入体的蛋白产物的真菌转化株库。本发明的另一方面,转化的真菌库可以用来筛选外源蛋白的活性或特性,或者筛选转化真菌由于外源蛋白的作用而产生的代谢物,也可以用来筛选外源DNA或其转录产物 RNA。应该理解本发明还能够高通量筛选具有上述性状的非转化菌株的代谢物。本发明使用的术语“丝状真菌突变株”仅指在自然界找不到的真菌。导致例如紧密的生长状态、低粘度、低蛋白酶含量、在液面以下生长等可描述的表性特征的“突变”可以通过紫外线诱变和化学诱变等经典方法,或者通过如盒式突变等分子生物学手段随机产生, 还可以通过缜密的基因工程方法来获得。如果一株天然真菌具有这些必要特性,它将理所当然地可以被应用于本发明的方法中。在本发明的另一方面,转化的真菌库可以用来筛选真菌自身的有用性质,例如,一种特定表达的蛋白或代谢物的高水平生产。本发明的这一方面可以通过对目标表达蛋白的定量分析来说明,其中可以检测到有最优良的蛋白生产、蛋白加工和蛋白分泌特性组合的特殊菌株。在本发明的再一方面,转化真菌库可以用来筛选能够与目标核酸探针杂交的DNA 序列的存在。


图1是实施例中描述的Wfestern印迹图。图2是质粒pUT720的图谱。图3是质粒pUT970G的图谱。图4是质粒pUT1064的图谱。图5是质粒pUT1065的图谱。图6是质粒pF6g的图谱。图7是质粒pUT1150的图谱。图8是质粒pUT1152的图谱。图9是质粒pUT1155的图谱。图10是质粒pUT1160的图谱。图11是质粒pUT1162的图谱。图12是pclA蛋白的结构图。图13A是黑曲霉(Aspergillus niger)野生型的显微照相图。图13B是黑曲霉pclA突变株的显微照相照片。图14A是酱油曲霉(Aspergillus sojae)野生型的显微照相照片。图14B是酱油曲霉pclA突变株的显微照相照片。图15A-F是pyrE基因的测序结果。带下划线的是氨基酸序列;由于一些核酸序列不确定导致氨基酸序列不连续。标出的氨基酸序列是最可能的序列,黑体字代表推测的/ 可能的内含子。本发明的详细描述
从最广义的角度来说,本发明涉及在悬浮培养液中能产生可转移的复制单元的转化丝状真菌;涉及这种真菌库;还涉及从这种库中筛选诸如与表达的外源蛋白质或相关代谢产物(即由内源性和/或外源性酶产生的小分子量产物)有关的生物化学活性或生物学活性等所需生物学特性的方法。这个低粘度的丝状真菌库包括含有核酸序列的真菌,每段核酸序列编码一个外源蛋白,每段所述核酸序列都可操作地连接于一个表达调控区,并可选择地连接分泌信号编码区和/或载体蛋白编码区。本发明中的转化菌株优选可以分泌外源蛋白。本发明所使用的表达和筛选方法,和其中使用的真菌菌株,对生产真菌、蛋白质、 代谢物和DNA分子这些在各方面有广泛用途的物质很有用。本发明的方法对获得核酸和蛋白质序列信息也很有用,这些信息本身也被看作本方法的有用产品之一。本发明的优选丝状真菌特征在于培养基粘度低。典型的工业级丝状真菌的培养物粘度远大于200厘泊(cP),通常是1,OOOcP以上,甚至能达到10,OOOcP ;本发明的真菌在有充足营养及最适或接近最适生长条件下培养48小时或更长时间以后,培养物粘度在200cP 以下,优选IOOcP以下,更优选60cP以下,最优选IOcP以下。本发明的丝状真菌通常呈现短的、不连续、不相互纠缠的菌丝或小团的形态。这些小团是从一个单克隆产生的有轻微或无相互纠缠的菌丝集合体,与从多个相互缠绕的克隆产生的菌丝团是不一样的,后者要大得多。例如,Chrysoporium Iucknowense突变株UV18-25 (培养粘度< IOcP)和形态相似的 Tricoderma Iongbanchiatum突变株X-525 (培养粘度< 60cP),特征在于有短的、明显的、 不相互纠缠的菌丝,长度在100-200微米之间;低粘度基因工程突变株Aspergillus sojae pclA的形态特征是有多分枝和短菌丝的紧密形态(参见图14)。而W097/2630中提到的低培养粘度真菌在形态上“分枝更多”,本发明中的真菌与非突变菌株相比菌丝分枝与之相当甚或更少。看起来菌丝的长度在控制培养物粘度上起关键作用。特别优选的真菌菌株有高的外源分泌蛋白/生物量之比。这个比率大于1 1,较有大于2 1,更优选6 1或更高,最优选8 1或更高。这样高的比率在高通量筛选环境中是有利的,因为它会使外源蛋白的浓度更高,允许更灵敏和/或更快速的筛选检测。这在检测的体积减小时尤其有利,例如从96孔微量滴定板到384孔板,再到1536孔板时。本发明的方法适用于所有这些型号的微量滴定板,也适用于绝大多数其它采用液体样品的、 HTS样式的滴定板。我们期望用本发明所讲的突变方法,可以将所有丝状真菌转变为适合于在本发明中应用的突变株。优选的丝状真菌的属有金孢属(Chrysosporium),梭孢壳属 (Thielavia),链孢酶属(Neurospora),金色担子菌属(Aureobasidium),线黑粉菌属 (Filobasidium), Piromyces, Crylococcus, Acrimonium, Tolypocladium, Scrytalidium, 裂褶菌属Gchizophyllium),侧孢霉属(Sporotrichum),青霉属(Penicillium),赤霉菌属 (Gibberella),毁丝霉属(Myceliophthora),毛霉属(Mucor),曲霉属(Aspergillus),镰刀霉属(Fusarium),腐质霉属(Humicola),和木霉属(Trichoderma),和它们的无性型及远距离刺激变形型。其中优选金孢属,木霉属,曲霉属和镰刀霉属。更优选金孢属。真菌的种属可以根据与Barnett和Hunter所著的《不完善的真菌属的图解》第三版,1972,BUrgesS出版公司一一书中描绘的形态的一致性来定义。对金孢属真菌的分类提供详细原始资料的有 Van Oorschot,C. Α. N. (1980) “对金孢属及其相关属的修订”,Mudies in Mycology No. 20Cenntraal Bureau voor Schimmelcultures(CBS), Barrn, The Netherlands,^ 1_36 页。 根据这些资料,金孢属属于丝孢菌目的丛梗孢科(Moniliaceae).另一个提供真菌命名的方便资源是布达佩斯条约的保藏,尤其是那些提供在线数据库的(以下这些网址釆用HTTP传输协议)。美国的ATCC在www, atcc. org提供信息, CBS (NE)在 www. cbs. knaw. nl 提供信息,俄罗斯的 VKM 在 www, bdt. org, br. bdt. msdn. vkm/ general提供信息。另一个资料来源是NT. ars-grin. gov/fungaldatabases.所有这些机构都能提供区分真菌种的特征的教程。在www. ncbi. nlm. nih. gov/htbon-post/taxonomy/ wgetorg ? mode = Undef&id = 4890网站可以找到Ascomycota的另一种分类。根据这另夕卜一禾中分类,金孢属隶属于Ascomycota门、Onygenales目、Onygenaceae禾斗。金孢属的范围包括但不局限于这些菌株C.botryoides,C. carmichaelli, C. crassitunicatum, C. Europe, C. evolceannui, C. farinicola, C. fastdium, C. filiforme, c. georgiae,C. globiferum,C. globiferum var articulatum,C. globiferum var niveum,C. hirundo, C. hispanicum, C. holmii, C. indicum,C. inops,C. keratinophilum, C.kreiseii,C. kuzurovianum, C. lignorum,C. lobatum,C. lucknowense,C. Iucknowense Grag 27K,C.medium, C. medium var spissescens,C. mephiticum, C.merdarium, C. merdarium var roseum,C. minor, C.pannicola, C. parvum, C. parvium varcrescens, C. ρilosum, C. pseudomerdarium, C. periformis, C. queenslandium, C. sigleri, C. sulfureum,C. synchronum,C. tropicum,C. undulantum,C. vailenarense, C. vsepertilium,C. zonatum.C. Lucknowense是金孢属的一个人们特别感兴趣的种,因为在自然条件下它的纤维素酶蛋白的产量比较高(国际专利申请WO 98/15633,PCT/NL99/00618,和美国专利 5,511,381 和 6,015,707)。国际保藏号为 ATCC 44006,CBS 251. 72,CBS 143. 77,CBS 272. 77,和VKM F-3500D的菌种都是Chrysosporium lucknowense菌株的例子。金孢属的定义范围还包括从金孢属同一祖先衍生来的菌株,包括自发突变或诱变的突变株。本发明的方法,在一个具体方面,利用了一株通过辐射和化学诱变获得的金孢属突变株,该菌株在悬浮培养时倾向于产生可转移的复制单元,其形态特征是短的、不连续的、不相互纠缠的菌丝(紧密生长),还有一个表型特征是在悬浮培养时在液面以下生长,发酵培养基的粘度较低。在另一个方面,本发明采用了形态相似的木霉属突变株。在另一个方面,采用了形态相似的酱油曲霉或黑根霉突变株。例如,将VKM F_3500D(C1菌株)用紫外线照射,获得菌株UV13-6。随后,该菌株用N-甲基-N’ -硝基-N-亚硝基鸟嘌呤进一步诱变,产生菌株NG7C-19。后者接着被紫外线诱变,获得菌株UV18-2(VKM F-361D)。在突变过程中,该菌株在液体培养基或平板以及显微镜下的形态特征发生了一些变化。在每一次连续的突变后,在平板上培养的突变株的金孢属典型绒毛状和毡状的形态特征就会减少一些。野生型在某些培养基中生长时会产生棕色色素,而突变株的这种特征则不明显。在液体培养基中生长时,突变株UV18-25的粘度明显低于野生型菌株Cl和突变株UV13-6和NG7C-19。虽然所有菌株都大致保持着金孢属的显微镜下特征,但所有菌株每经过一代突变菌丝就变细一些,而UV18-25可以明显观察到菌丝呈片段状。这种菌丝片段可能是造成UV18-25的培养物粘度降低的原因之一。每进行一代突变,菌株产生气生孢子的能力就减弱一些。这些结果表明一个菌株可以总体上属于金孢属,而在形态上表现出与传统分类(形态上)定义有一些差异。特别是金孢属的无性型,我们发现它特别适合本发明所述的筛选应用。无性型的代谢使其特别适合高效表达。有性型也应该适合,因为无性型和有性型的基因组成是一样的。无性型和有性型的区别在于一个是无性状态,另一个是有性状态;这两种状态在特定培养条件下表现出不同的形态。另一个代表基因工程突变菌株的例子是酱油曲霉(Aspergillus sojae) 0这些突变株中的一株的编码一个特定内切蛋白酶的基因被阻断了。这一突变导致了菌丝变短,分枝增加,菌丝生长紧凑,在培养基液面以下形成菌丝小片。并且,在本应用中提到的 Aspergillus sojae在特定的液体培养基内生长可以被诱导表现出高效的生孢子能力,这使得它特别适合用于高通量筛选系统。在这个例子中,诱导产生可转移的复制单元的条件仅仅是由一种含0. 6克/毫升EDTA的合成培养基组成。诱导条件会随着不同的宿主而改变,但很明显的是如果一个宿主菌适合,这个条件应该早就为人所知了。人们喜欢用不产毒素和非致病的真菌菌株,现有技术已知道很多这种菌,因为这会降低操作者的危险性,并能简化总体的筛选过程。在优选的实施方式中真菌还将是蛋白酶缺陷型,这样可以最大程度地降低外源蛋白的降解,和/或易于抑制蛋白酶的产生。将蛋白酶缺失的菌株用作表达宿主菌是众所周知的,例如PCT申请WO 96/29391.蛋白酶缺失的菌株可以通过筛选突变株来产生,或者蛋白酶基因可以被”敲除”,或者可以用本文中的方法使其失活,例如Christensen和Hynes在美国专利6,025, 185号中所描述的(areA基因功能丧失的 Aspergillus sojae).人们发现可以处理金孢属突变株使其蛋白酶表达量下降,这就使它们更适合于生产蛋白类产品,尤其是当蛋白类产品对蛋白酶活性敏感时。因此本发明也可以使用一株金孢属突变株,该突变株比诸如C. Iucknowense菌株Cl (VKM F-3500D)等非突变金孢属菌株产生的蛋白酶少。这些突变株的特别之处是其蛋白酶活性(除了所有的有选择的用来切割分泌的融合蛋白的蛋白酶)小于Cl菌株产生的活性的一半,更好的情况下小于30%,最好时小于10%。被降低的蛋白酶的活性可以用已知的方法测定,例如测量脱脂牛奶平板上的抑菌圈或牛血清白蛋白降解。已经发现可以构建蛋白酶表达水平降低的金孢属突变株,以使它们更适于生产蛋白产物,尤其是当蛋白产物对该蛋白酶活性敏感时。因此,本发明也可以利用比金孢属非突变株例如C. Iucknowense Cl株(VKMF-3500D)产生更少蛋白酶的金孢属突变株。尤其是当该突变株的蛋白酶活性(而非裂解融合蛋白的蛋白酶)不及Cl株的一半或少于30%甚至 10%时更好。蛋白酶活性的减少用已知方法测定,如测定脱脂牛奶平板形成的抑菌圈或牛血清白蛋白的降解。为了减少分析时宿主蛋白的干扰,去除宿主丝状真菌的其它基因如编码纤维素酶和其它分泌较多的蛋白的基因的活性,是再好不过了。可以删除或突变编码分泌蛋白的基因,或者对非目的蛋白的诱导系统及表达的有关途径进行改造以降低其表达。本发明(见下面)中载体使用内源性操纵子,是为了灭活同一个诱导子控制下的其它的基因的活性。 蛋白酶分泌较易抑制的真菌的蛋白酶表达往往受环境调节因子如氨基酸浓度的控制,而通过这些环境因子可以减少蛋白酶的生产。转化载体中优选应用能够在选择的宿主中高表达的同源表达调节区。来源于异源宿主如木霉属或曲霉属的高表达调节区,众所周知而且都在使用。举例但并不限于这些,已知大量表达并因此为本发明的应用提供合适表达调节序列的蛋白质的例子是hydrophobin,蛋白酶、淀粉酶、木聚糖酶、果胶酶、酯酶、β-半乳糖苷酶、纤维素酶 (endo-glucanase, cellobiohydrolase)及多聚半乳糖醛酸酶。表达调节区包含一个可控制的启动子序列,和要表达的蛋白的核酸序列连接在一起。启动子和要表达序列的起始密码子紧密相连,以达到表达的目的。启动子序列可以是组成型的,但诱导型的更好。使用诱导型启动子和适当的诱导介质更利于和启动子相连的序列的表达。我们曾考察过一些来源于同源物种或异源株系的、能够促使蛋白质表达的表达调节序列。这种表达调节序列适合于真菌的表达调节区,例如子囊菌纲的调节区。合适的子囊菌纲的表达调节区是来自下列属任意一种的调节区曲霉属,木霉属,金孢属,腐质霉属,链孢霉属,Tolypocladium,镰刀霉属,青霉属,Talaromyces,或它们的另一种性别型例如Emericela及镰刀霉属。来自木霉属的cellobiohydrolase启动子;曲霉属的乙醇脱氢酶A,乙醇脱氢酶R,谷氨酸脱氢酶,RAKA淀粉酶,甘油淀粉酶,甘油醛磷酸脱氢酶启动子, 链孢霉属的磷酸甘油及旁路的启动子;Miizomucor miehei的脂酶、冬氨酸蛋白酶启动子; penicillium canescens的β-半乳糖苷酶的启动子;而cellobiohydrolase,葡聚糖内切酶,木聚糖酶,甘油醛磷酸脱氢酶和蛋白酶的启动子是典型代表。和宿主同属的表达调节序列是最佳选择,因为它更可能特别地适应宿主。来自表达巨大量蛋白质的金孢属菌株的天然表达调节序列特别优选。这些菌株的例子已经根据布达佩斯条约保藏于莫斯科的全俄菌种保藏机构(All Russian Collection,VKM)。野生型Cl株保藏号为VKM F_;3500D,保藏日为1996年8月四日, Cl UV13-6突变株保藏号VKM F-3632D,保藏日1998年9月2日,Cl NG7C-19突变株保藏号VKM F-3633D,保藏日为1998年9月2日,Cl UV18-25突变株,保藏号VKM F-3631D,保藏日为1998年9月2日。这些菌株也优选用来作为生产低-粘性突变株的菌源;事实上VKM F-3631D菌株已经表现必需的低粘度表型特征。经过对1Trichoderma longibrachiatuml8. 2kk的两轮辐射选择,已经得到木霉属的一个编号为X-252低粘度突变株,而X-252低粘度突变株是从iTrichoderma Iongibrachiatum的QM 9414株的突变体 (ATCC 26921)得到。本发明的其它实施方式利用了 Aspergillus sojae和Aspergillus niger表现型近似的突变株。当宿主是金孢属时,优选应用金孢属的启动子序列,以保证启动子被宿主正确识别。某些异源表达调节序列也和金孢属本身的表达调节序列一样在,金孢属中具有相同的调节效率。这样以来就使我们可以构建用于转化,金孢属的出色载体,并提供在此宿主中进行高效转化和表达的许多可能性。如,标准的曲霉属转化技术可参考Christiansen等在Bi0/Techn0l0gyl998 6 1419-1422 —文的描述,其它有关转化载体的详细描述包括美国专利 4,816,405,5, 198,345,5, 503,991,5, 364,770,5, 705,358,5, 728,547,5, 578,463、 EP-B-215. 594(也适用于木霉属),它们的内容通过参考并入本文。因为在金孢属中发现纤维素的表达率非常高,纤维素基因的表达调节区很受欢迎。本发明中载体允许插入编码酶(尤其对分泌出去的酶)的基因的启动子序列。 这些酶包括糖降解酶(纤维素酶,木聚糖酶,甘露聚糖酶,甘露糖苷酶,果胶酶,淀粉酶,例如葡萄糖淀粉酶,α -淀粉酶,α和β半乳糖苷酶,α和β葡萄糖苷酶,β -葡聚糖酶,几丁质酶),蛋白酶(内源蛋白酶,氨基蛋白酶,氨基及羧基多肽酶),其他水解酶(脂肪酶, 酯酶,肌醇六磷酸酶),和转移酶(糖基转移酶,谷氨酰胺转移酶,异构酶,转化酶)。来自 Chrysosporium Iucknowense的几个酶的例子见表A。表 A 来自 Chrysosporium Iucknowense 的部分酶的特性
样品氨基酸保留>50%活性的最高PH保留>70%活性的最高PH稳定性 20h, 50 °C pH 7.5/8数量CMC aseRBB CMC ase其它底物CMC aseRBB CMC ase 物保留的最高活性%30 Kd碱性蛋白酶--12.5--12.0-3OkD Xyl(碱性)333--10.0--8.58051kDXyl--8.0--7,5-60kDXyl--9.5--9.08530 IcD endo (EG3)24745 kD endo7.08.0-6.57.0-7555 kD endo2478.08.0-7.07.0-5525 kD(21.8 kD)endo (EG5)2257.510.0-6.59.0-8043 kD(39.6 kD')endo (EG6)3958.08.0-7.27.2--45 kD α,β-Gal/p-Gluc--6.8--5.7-48 kD CBH5.27.58.05.06.8--55 kD CBHl5268.09.0-7.48.5-7065 kD PGU--8.0--7.3-90kD蛋白酸--9.0--9.0-IOOkD蛋白雖--9.0--9.0-注通过MALDI测定的分子量;其它均为通过SDS PAGE测定的分子量xyl =木聚糖酶endo =葡聚糖内切酶gal =半乳糖苷酶glue =葡糖苷酶CBN=CellbiohydrolaseP⑶=半乳糖醛酸酶核酸构建体优选包括来自金孢属、最好是来自Chrysosporium Iucknowense或其衍生物的表达调控区,该调节区可操作地与一个编码待表达蛋白的核酸序列连接。特别优选的核酸构建体将包括来自表达纤维素酶或木聚糖酶的金孢属的表达调控区,优选包括来自表达cellobiohydrolase,更优选表达表A描述的 55kDa cellobiohydrolase (CBHl)的金孢属的表达调控区。再举些例子,金孢属的hydrophobin、蛋白酶、淀粉酶、木聚糖酶、酯酶、 果胶酶、β-半乳糖苷酶、纤维素酶(葡聚糖内切酶,cellobiohydrolase)和多聚半乳糖醛酸酶的启动子序列也在本发明的范围内。表A中公开的酶的所有启动子或表达调控区都可以恰当地得以使用。可以很容易地从金孢属得到这些启动子或表达调控区的核酸序列。确定启动子序列的方法多种多样而且众所周知。启动子序列通常紧靠在相关基因开始的起始密码子ATG的上游。举例来说, 可以用去除相关基因上游的序列、重组DNA技术、及检验去除这些序列对基因表达的影响来鉴别启动子序列。再例如,通过比较相关基因上游序列的同源启动子序列,也可以发现启动子序列。比如,Cl葡聚糖内切酶的启动子序列就是通过克隆相应基因得来的(见PCT/ NL99/00618)。本发明倾向于使用来自金孢属55kDacellobiohydrolase (CBHl)、甘油醛磷酸脱氢酶A、30k Da的木聚糖酶(XylF)的启动子,因为这些酶应用它们的启动子时表达水平较高。Chrysosporium Iucknowense 尤其是 C. Iucknowense GARG 27K 糖降解酶的启动子因可在其它真菌宿主中表达很多蛋白,很好使用。本发明核酸序列的具体实施方式
是已知的金孢属,曲霉属和木霉属的核酸序列。 金孢属的启动子序列见PCT/NL99/00618的描述。现有技术提供了大量可在曲霉属中应用的表达调控区,例如美国专利 4,935,349 ;5,198,345 ;5,252,726 ;5,705,358 ;5,965,384 和PCT申请W093/07277。在木霉属菌株中表达公开在美国专利6,002,725中。这些专利的内容通过参考其全文并入本发明。Hydrophobin基因是一个高表达的真菌基因。有人认为Hydrophobin基因的启动子序列、优选来自金孢属的启动子序列,适合用作本发明适当实施方式中的表达调节序歹Ij0 Trichoderma reesei 禾口 Trichoderma harzianum 白勺 Hydrophobin ―因·歹Ij 己经为3 有技术所公开,并且Aspergillus fumigatus禾口 Aspergillus nidulans的基因序列及相关序列信息被参考并入本发明(Nakari4etala 等,Eur. J. Biochem. 1996,235 :248-255 ; Parta 等,Infect. Immun. 1994 62 :4389-4395 ;Munoz 等,Curr. Genet. 1997,32 :225-230 ; Mringer等,Mol. Microbio. 1995 16 :33-44)。利用这些信息,本领域普通技术人员按照标准方法例如前面提到的技术,不必经过繁重实验即可得到金孢属hydrophobin基因的表达调控序列。根据本发明的一个重组金孢属菌株可以包含一个可操作地与编码外源蛋白的序列相连的hydrophobin调控区。表达调控序列也可以另外包含一个增强子或沉默子。它们也是现有技术已知的, 它们一般远离启动子。表达调控序列还包括具有激活物结合位点和阻抑物结合位点的启动子。在某些情况下,这些部位也可以得以修饰以去除这种类型的调控。例如,存在CreA位点的丝状真菌启动子的已有报道。可以使creA位点突变,以确保由于存在的creA被去除而导致葡萄糖的抑制。利用这样的启动子可以产生在葡萄糖存在下启动子控制的核酸序列编码的蛋白库。这种技术的例子见WO 94/13820及WO 97/09438。这些启动子在有后无其 creA位点的情况下均能使用。creA位点突变的突变体可用作本发明重组株的表达调控序列,而它所调控的核酸序列库可以在葡萄糖存在下得以表达。这类启动子如WO 97/09438 中所描述的类似方式确保去抑制。CreA位点的鉴别知识是现有技术已知的。另外,可以在抑制系统以外具有突变的宿主菌株中应用CreA结合位点未突变的启动子,从而该菌株尽管存在CreA结合位点,仍能够在葡萄糖存在下产生蛋白库。终止序列也属于表达调控序列,它们可操作地连接在要表达的序列的3’端。可能有许多已知的真菌终止子在本发明的宿主菌中起作用。如A. nidulans trpC的终止子, A. niger的α -葡糖苷酶终止子、A. niger的葡糖淀粉酶终止子、Mucor miehei的羧基蛋白酶终止子(参见 US 5578463),以及 Trichoderma reesei 的 cellobiohydrolase 终止子。金孢属的终止子序列,例如EG6终止子,当然在金孢属中发挥很好的得作用。用于本发明的合适转化载体可以任选具有可操作地与信号序列的编码序列连接的待表达外源核酸序列。而信号序列为一段氨基酸序列,当和待表达蛋白的氨基酸序列可操作地连在一起时,能够使该蛋白从宿主生物体中分泌出去。这样的一种信号序列可以是与异源蛋白有关的或是宿主本身的。编码信号肽的核酸序列必须定位在读码框中,以使信号肽和异源蛋白一同翻译。本发明信号肽的位置(包括单一的、分泌外源蛋白)最好处于分子进化该分子所处位置。一个载体上只连接一个信号序列来进行文库的表达,不是最好选择,因为这将减少表达目的蛋白的可能。随机剪断DNA而建立的基因组文库,然后再克隆到一个载体中, 库中基因正好和信号序列连接在一个阅读框架的可能性较小。而且,即便是连接到一起, 选择的信号序列可能不会对所有基因起作用。鉴于此,最好不要应用信号序列来筛选基因组库,而要通过检测细胞内外源蛋白的存在来筛选基因组库。细胞内蛋白的存在和活性分析可以通过用酶将真菌转化为原生质体、然后再溶解后得以实现。有关操作见kyl等, J. Biotechnol. 59 =221-224(1997)的描述。这种方法已经应用于生长在微量培养板上的金孢属转化子的PCR克隆检测。讲解一下能使金孢属菌株分泌蛋白的信号序列。此类序列以真菌的信号序列为好,但以Ascomycete的信号序列为最好。通常可以从真核细胞得到合适的信号序列,最好从酵母和以下各属的真菌得到曲霉属,金孢属,木霉属,Pichia,链孢霉属,Rhizomucor, Hansenula,腐质霉属,毛霉属,Tolypocladium,键刀霉属,青霉属,Saccharomyces, Talaromyces,或不同生殖方式的 Emericela、Hypocrea。那些禾口 cellobiohydrolase、葡聚糖内切酶、β -半乳糖苷酶、木聚糖酶、果胶酶、酯酶、蛋白酶、hydrophobin或淀粉酶生来就连在一起的信号肽特别有用。如曲霉属或腐质霉属的淀粉酶或葡糖淀粉酶,Aspergillus oryzae TAKA淀粉酶,AspergiIlus niger的α -淀粉酶,毛霉属的羧基肽酶(US 5578463), Rhizomucor miehei的脂肪酶或蛋白酶,木霉属的cellobiohydrolase,来自金孢属 Penicillium canecens CBHl株的β -半乳糖苷酶,Saccharomyces的α-交配因子的信号序列。另外信号序列也可以是杆状菌的淀粉酶或枯草杆菌蛋白的信号序列。从同一属的宿主菌株得到的信号序列尤其适合,因为它最可能会特别适应特定宿主的要求;因此当宿主是Chrysosporium Iucknowense时,信号序列最好是金孢属的信号序列,金孢属菌株分泌的蛋白量异常地高,当然来自这些株系的信号序列让人感兴趣。来自丝状真菌和酵母的信号序列,也许和非真菌的信号序列一样有用。按照本发明的任意实施方式,转化的重组真菌宿主可以进一步携带一个选择标记。此选择标记可用来选择转化或转染细胞。选择标记通常编码一种基因产物,进而导致宿主产生不同于非转化细胞的特定类型的抗性。通常可以是对重金属的抗性、抗生素或杀生剂抗性。原养型是非抗生素变种的一种有用选择型标记。自养型标记导致宿主产生营养缺陷,而纠正这些缺陷的基因可以用来作为选择的标记。经常使用的抗性和自养选择标记是amdS (己酰胺酶)、hph (潮霉素磷酸转移酶)、pyrG (乳清酸核苷_5,-磷酸脱羧酶)、 pyr (乳清酸P-核糖转移酶)、trpC (邻氨基苯甲酸合成酶)、argB (鸟氨酸氨甲酰基转移酶)、sC (硫酸腺苷转移酶)、bar (膦丝菌素乙酰转移酶)、niaD (硝酸还原酶)jh-ble (博来霉素-腐草霉素抗性)、突变的乙酰乳酸合成酶(磺酰脲抗性)、新霉素磷酸转移酶(氨基糖苷抗性)。金孢属菌株最好的选择标记是乳清酸P-核糖转移酶。选择标记单独在一个载体上或者选择标记和要表达异源蛋白的核酸序列在同一片段上,都能通过共转化进行选择。可以通过使用AMAl复制子序列进一步提高转化效率,这对Aspergillus niger(Verdoes等,Gene 146 :159-165(1994))是有用。该序列导致许多丝状真菌的转化效率增加10-100倍。另外,导入的DNA不整合到真菌的基因组中,而是以多拷贝、自主的形式保留在真菌细胞里。这对本发明中的高通量筛选方法有利,因为非整合状态减少不同转化子在基因表达水平上的差异。此外,因为导入的DNA不重组到宿主DNA中,宿主基因组不会发生非目的突变。借助于载体如AMAl的自主复制或在真菌端粒序列促进下的自主复制,外源基因得以均一表达。(参见 A. Alesenko 和 L. Ivaniva, Mol. Gen. Genet. 1998 260 159-164.)本发明中使用的术语“异源蛋白” 一词,是指不能在本发明的宿主菌株中正常表达或分泌的蛋白质或多肽。异源蛋白既可来自原核生物,也可开自真菌、植物、昆虫、或来自诸如哺乳动物的高等动物。对于药物筛选目的,则人蛋白是首选,因此一个优选的实施方式是 DNA文库属于人源的宿主。因此这样一些实施方式也被认为是本发明的适当实施例。用本发明的丝状真菌表达人的基因,即来源于人基因组文库的基因,有许多理由期望得到有效表达。现在知道人的基因平均大小为3000-5000bp,人的内含子平均为 75-150bp (总范围分布在40至> 50000),丝状真菌的内含子为40_7^ρ,但它们能处理碱基数高达500bp的内含子。人每个基因平均有3-5个内含子(M. Deutsch,M. Long,Nucl. Acids Res. 199927 :3219-32 ;见表B)。已知人的信号序列在真菌中也能正常工作。基于上述理由,很可能大量人基因可用本发明的方法高水平表达和分泌。表B
权利要求
1.一种产生由一组DNA载体库编码的多种具有所需活性或特性的蛋白质的方法,其中载体库包括多种不同的载体,每种不同的载体都包含一种不同的编码蛋白质的核酸序列, 所述核酸序列可操作地连接于一种表达调控区和任选连接一种分泌信号编码序列,所述方法包括以下步骤(a)提供一种具有悬浮生长表型特征的丝状真菌株,并且具有在悬浮条件下产生可转移性复制单元的特征,所述单元是单克隆的,并容易分散;(b)使用上述DNA载体库稳定转化上述丝状真菌株,使每个单一菌株都至少含有至少一种编码外源蛋白的核酸序列;(c)将转化的丝状真菌突变株在有利于形成可转移性复制单元的悬浮培养条件下培养,所述单元是单克隆的,并容易分散;(d)将多种悬浮的可转移性复制单元相互分离;和(e)将分离的可转移复制单元移到第二培养物;和(f)在有利于外源蛋白编码核酸序列表达外源蛋白的条件下,将在所述第二培养物中的单个可转移性复制单元培养成单克隆培养物或单克隆。
2.一种在由DNA载体库编码的多种蛋白质中筛选具有所需活性或特性蛋白质的方法, 包括以下步骤(a)按照权利要求1的方法在单克隆丝状真菌培养物或单克隆丝状真菌克隆中表达多种蛋白质;和(b)筛选单个克隆培养物或克隆菌落的所需活性或特性。
3.一种得到编码具有所需活性或特性的蛋白质的DNA分子的方法,包括以下步骤(a)按照权利要求1的方法,在单克隆丝状真菌培养物或单克隆丝状真菌克隆中表达多种蛋白;(b)在单个克隆培养物或克隆菌落中筛选具有所需特性或活性的蛋白;和(c)从表现出所需特性或活性的克隆培养物或克隆菌落中分离DNA。
4.一种得到编码具有所需特性或活性蛋白的DNA分子的核苷酸序列的方法,包括以下步骤(a)按照权利要求3的方法从表现出所需特性或活性的克隆培养物或克隆菌落中分离 DNA ;和(b)将上述DNA测序。
5.一种得到具有所需特性或活性蛋白的氨基酸序列的方法,包括以下步骤(a)按照权利要求4的方法,得到编码具有所需特性或活性蛋白的DNA序列;和(b)将上述DNA序列转化成氨基酸序列。
6.一种从多种单克隆丝状真菌培养物或单克隆丝状真菌克隆中筛选具有所需活性或特性的代谢物的方法,包括以下步骤(a)按照权利要求1的方法,在单克隆丝状真菌培养物或单克隆丝状真菌克隆中表达多种蛋白;和(b)在每个单一克隆培养物或克隆菌落中筛选所需特性或活性。
7.一种优化所需蛋白活性或特性的方法,包含如下步骤(a)提供一种包含编码蛋白质突变型的DNA序列的载体库;(b)提供一种表型特征为可悬浮生长和在悬浮条件下产生可转移复制单元的丝状真菌株,所述单元是单克隆的,并容易分散;(c)使用上述DNA载体库稳定转化上述丝状真菌株,使每个单一菌株都至少含有一种编码外源蛋白的核酸序列;(d)在有利于形成可转移复制单元的条件下培养转化的丝状真菌株,所述单元是单克隆的,并容易分散;(e)将多种悬浮的可转移性复制单元相互分离;(f)在有利于由外源蛋白编码核酸序列编码的外源蛋白表达的条件下,将单一可转移复制单元培养成单克隆培养物或克隆菌落;(g)在各生物体、克隆培养物或克隆菌落中筛选具有所需特性或活性的表达蛋白;(h)分离一个或多个表达具有所需活性或特性蛋白的单一生物体、克隆培养物或克隆菌落;(i)从编码表现所需活性或特性蛋白的分离的单一生物体、克隆培养物或克隆菌落中分离DNA,并对其进行突变;(j)提供包含⑴步骤中得到的突变DNA序列的载体库;和(k)重复步骤(b)到(g)直到所需活性或特性达到满意的水平或不再提高。
8.权利要求7的方法,在步骤(h)和(i)间进一步包含如下步骤培养一个或多个在步骤(h)中分离到的单一生物体,克隆培养物或克隆菌落;分离表现出所需特性或活性的表达蛋白;对所分离蛋白的所需活性进行评价。
9.权利要求2的方法,其中筛选步骤为高通量筛选。
10.权利要求3的方法,其中筛选步骤为高通量筛选。
11.权利要求4的方法,其中筛选步骤为高通量筛选。
12.权利要求5的方法,其中筛选步骤为高通量筛选。
13.权利要求6的方法,其中筛选步骤为高通量筛选。
14.权利要求7的方法,其中筛选步骤为高通量筛选。
15.权利要求8的方法,其中筛选步骤为高通量筛选。
16.权利要求1-15中任一权利要求的方法,其中真菌表型特征为在优化或近优化条件,有充分营养物的悬浮培养时,发酵终止时培养物粘度小于200cP。
17.权利要求1-15中任一权利要求的方法,其中丝状真菌表型特征为在优化或近优化条件,有充分营养物的悬浮培养时,发酵终止时培养物粘度小于lOOcP。
18.权利要求1-15中任一权利要求的方法,其中丝状真菌表型特征为在优化或近优化条件,有充分营养物的悬浮培养时,发酵终止时培养物粘度小于60cP。
19.权利要求1-15中任一权利要求的方法,其中丝状真菌表型特征为在优化或近优化条件,有充分营养物的悬浮培养时,发酵终止时培养物粘度小于10cP。
20.权利要求1-15中任一权利要求的方法,其中载体包含一种真菌信号序列。
21.权利要求20的方法,其中真菌信号序列是编码下列蛋白的真菌基因的信号序列 纤维素酶,β -半乳糖苷酶,木聚糖酶,果胶酶,酯酶,蛋白酶,淀粉酶,多聚半乳糖醛酸酶和 hydrophobin0
22.权利要求1-15中任一权利要求的方法,其中载体包含一种编码选择性标记的核苷酸序列。
23.权利要求1-15中任一权利要求的方法,其中载体包含一种可操作地与编码蛋白的核酸序列连接的表达调控区。
24.权利要求23的方法,其中表达调控区包含一种可诱导的启动子。
25.权利要求1-15中任一权利要求的方法,其中真菌为Euascomycetes类。
26.权利要求25的方法,其中真菌属于Onygenales目。
27.权利要求25的方法,其中真菌属于散囊菌目。
28.权利要求1-15中任一权利要求的方法,其中丝状真菌属于子囊菌类,限定条件是它们不属于酵母目。
29.权利要求1-15中任一权利要求的方法,其中丝状真菌属于选自曲霉属,木霉属,金 ?包属,链孢霉属,Rhizomucor, Hansenula,腐质霉属,毛霉属,Tolypocladium,镰刀霉属,青霄属,Talaromyces, Emericella 禾口 Hypocrea 之一的属。
30.权利要求四的方法,其中丝状真菌属于选自曲霉属,镰刀霉属,金孢属和木霉属之一的属。
31.权利要求30的方法,其中真菌是金孢属菌株UV18-25,保藏号是VKMF-3631D,具有低粘度表型的它的突变体或衍生物。
32.权利要求1-15中任一权利要求的方法,其中表达的蛋白与生物量之比至少是1 Io
33.权利要求32的方法,其中表达的蛋白与生物量之比至少是2 1。
34.权利要求33的方法,其中表达的蛋白与生物量之比至少是6 1。
35.权利要求34的方法,其中表达的蛋白与生物量之比至少是8 1。
36.权利要求1-15中任一权利要求的方法,其中可转移的复制单元是单一的真菌细胞。
37.权利要求1-15中任一权利要求的方法,其中可转移的复制单元是孢子。
38.权利要求1-15中任一权利要求的方法,其中可转移的复制单元是菌丝片段。
39.权利要求1-15中任一权利要求的方法,其中可转移的复制单元是菌丝体小块。
40.权利要求1-15中任一权利要求的方法,其中可转移的复制单元是原生质体。
41.一种获得具有所需活性或特征的蛋白质的方法,包括以下步骤(a)按照权利要求2的方法,从一个由DNA载体库编码的众多蛋白中筛选具有所需活性或特征的蛋白;(b)在有助于表达由编码外源蛋白质的核酸序列所编码的外源蛋白的条件下,培养适当规模的表达所需活性或特征的单克隆培养物或单克隆菌落;和(c)分离表达的蛋白。
42.一种获得具有所需活性或特征的蛋白质的方法,包括用权利要求7或权利要求8的方法优化所需活性或特征,以适当的规模培养最后一步(h)中分离的单一生物体,克隆培养物,或克隆菌落,并从培养物中分离表达的蛋白。
43.一种构建转化的丝状真菌库的方法,包括以下步骤(a)提供一种具有如下表型特征的丝状真菌,在培养液中悬浮生长并在悬浮培养时产生可转移的复制单元,所述单元是单克隆的,并容易分散;和(b)用一种DNA载体库稳定地转化所述丝状真菌,以使多种单一真菌的每一种都至少转入一个外源蛋白编码核酸序列;其中DNA载体库包括大量不同的载体,各不同载体包含一种不同的蛋白质编码核酸序列,所述核酸序列可操作地连接于一个表达调控区,并任选连接一个分泌信号编码序列。
44.按照权利要求40的方法制备的转化的丝状真菌库。
45.一种获得表达所需活性或特征的蛋白质的转化丝状真菌宿主的方法,包括以下步骤(a)用权利要求2的方法筛选大量由DNA载体库编码的蛋白质以获得所需活性或特征的蛋白;和(b)分离表达所需活性或特征的单克隆培养物或单克隆菌落。
全文摘要
本发明提供了一种在丝状真菌中表达外源基因DNA文库的方法。该真菌可以处理有内含子的真核基因,并且也可以进行诸如糖基化、蛋白质折叠的翻译后加工。本发明提供了形态学改变的真菌的用途,其允许高通量筛选和对表达蛋白直接改造。所述转化的真菌可以用于生产大量的蛋白质,用来进行蛋白质的分离、测定和应用测试,也许还适合于蛋白质的商业化生产。
文档编号C12P21/02GK102174551SQ20101062188
公开日2011年9月7日 申请日期2001年4月13日 优先权日2000年4月13日
发明者彼得·扬·蓬特, 科妮莉亚·范塞尔, 科尔内留斯·范登洪德 申请人:戴亚蒂克国际(美国)公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1