丝状真菌中dna表达文库的高通量筛选的制作方法

文档序号:584600阅读:502来源:国知局
专利名称:丝状真菌中dna表达文库的高通量筛选的制作方法
发明概述本发明提供了一种在丝状真菌宿主中表达和后继筛选DNA文库,尤其是合成文库、基因组文库和cDNA文库的方法。该系统采用转化或转染的丝状真菌,这些真菌在深层培养中通过诸如有效的孢子形成等途径产生可转移的复制单元。这些真菌优选表现这样一种形态,即很少或不形成纠缠的菌丝体。其中更为优选的菌株还能表达可分离量的外源蛋白,用于评测。本发明的突变的真菌菌株由于产生可转移的复制单元、可高水平的表达外源基因、以及非常低的培养粘度,因此它们非常适合高通量的筛选技术。
背景技术
天然微生物种群表现广泛的生化和代谢多样性。由于许多微生物的分离和培养非常困难,这些微生物中大量有潜在价值的蛋白质和多肽不能被发现。事实上,据估计目前全世界只有不到1%的微生物被分离和培养。发明新的方法从未被认知乃至已被分离的微生物中分离蛋白质、多肽和代谢物仍然是一个迫切的需求。(术语“蛋白质”在后面的文章中应被理解为包括蛋白质和多肽。)鉴定和分离编码这些蛋白质的基因,从而能修饰和/或生产这些蛋白质也是人们所需要的。
Short在美国专利5938672、6001574、6030779和6057103(它们的内容通过参考合并到本发明中)中阐述了解决这一问题的一个途径。在该方法中,他们直接从环境样品(如土样)中制备了基因组DNA文库,而没有试图从中分离或培养任何可能存在的生物。该文库在大肠杆菌中被表达,并从获得资源甚至纯粹兴趣的角度筛选表达的蛋白。Short暗示,但没有明确论述或肯定在该方法中使用了真菌宿主细胞。
上述方法有许多重大缺陷,其中之一就是大肠杆菌不能有效地表达有内含子的基因。土壤中大约90%的物种是真核生物(主要是真菌),因此其中大部分生物的基因组DNA中有内含子。虽然已经发现的真菌有大约10万种,但是估计大约有100万种真菌仍未被发现(B.Kendrick,《第五界》,Mycologue出版社,1999),真菌基因组编码蛋白质和代谢物的潜在多样性远比已知的真菌高,但是由于内含子的存在,使得绝大部分真菌特有蛋白和代谢物不能在细菌表达系统中有效表达。不仅许多种酶类(例如分泌形真菌木质素过氧化物酶和锰依赖型过氧化物酶)是真菌特有的,而且有许多真菌蛋白,包括酶类(例如木质素过氧化物酶和黑曲霉蔗糖酶)是糖基化的;但是如果这些蛋白在大肠杆菌中表达就不能被糖基化。由于真菌基因组的数量大,长度和复杂度非常高,许多蛋白是真菌特有的,并且许多真菌蛋白都要进行糖基化,所有这些都表明,如果将给定的环境微生物样品的基因组DNA在细菌中进行表达,能被细菌识别并正确表达的微生物蛋白和代谢物的丰度不超过10%。
部分由于爱滋病的蔓延和接受器官移植的人数量的增加,越来越多的人受到免疫损害或免疫抑制,导致真菌感染的数量和种类稳步增长(《传染病医学杂志》16380-382,385-386(1999))。因此正在进行的研制新抗真菌药的过程中需要分离和鉴定来自致病真菌的蛋白质,而这又需要有筛选来源于真菌基因组的DNA文库的能力。由于真菌基因组中内含子的存在,使得在目前已知的绝大多数细菌宿主细胞中表达这些文库变得非常困难。同样,由于越来越多的细菌感染对抗生素产生抗药性,也需要对有抗生素活性的真菌代谢物进行高通量筛选。
真核生物的基因组太复杂,以至于不能在细菌中完全表达其DNA文库。如果算上所有的真核生物,细菌只代表所有已知物种的0.3%(E.O.Wilson,"生物多样性的现状",《生物多样性》,国家学术出版社,华盛顿特区,1988,第一章);因而能在细菌中表达的全世界基因多样性是极其有限的。
为了避免内含子的问题,可以构建cDNA文库在细菌中表达。但是这种方法必须有转录产物RNA的存在,而任何当时未被活跃转录的基因都不会出现在该文库中。而许多我们需要的蛋白只在特定条件下才表达(例如致病真菌中的毒性因子),并且不一定在收获mRNA时存在。而且,为了获得足够量的RNA构建DNA文库,需要培养大量的菌体。对于环境样品中不易培养的生物,或者新的适宜培养条件还未找到的微生物而言,获得大量的RNA是困难或不可靠的。相比之下,通过很少量的单个细胞,采用随机引物或适合某一类基因的引物进行PCR扩增,就能获得足够的基因组DNA。最后,在某个生物体中表达量高的基因也会导致其mRNA的超量合成,而在基因文库中,它的超量合成是以掩盖一些微量表达的基因为代价的。如果是构建cDNA文库而不是基因组文库,为了包括尽可能多的现存mRNA种类,必须要筛选多得多的克隆,因为后者更能均衡地代表现存的基因种类。显然,如果可能的话,人们更愿意构建基因组DNA文库。
并且,大肠杆菌不能将许多蛋白质分泌出来,这对于用于筛选目的,而筛选依赖于宿主细胞将外源基因产物分泌到胞外的宿主细胞是一个缺陷。对于大肠杆菌和所有细菌宿主细胞来说,另一个缺陷是,许多真核生物蛋白需要多种翻译后加工以获得活性,而细菌不能对它们进行翻译后加工。除了糖基化,亚基切分、二硫键形成和蛋白的正确折叠是生成有活性蛋白所常需的翻译后加工的范例。
为了保证这些翻译后加工,有时可以利用哺乳动物细胞,但是这些细胞很难培养,需要昂贵的培养基,并且不总是能高效地转化外源基因。虽然科学家们努力尝试用哺乳动物细胞做cDNA文库筛选的宿主(Schouten et al.,WO 99/64582),但这种转化系统显然不适合蛋白质的高通量筛选。一种在文库筛选前将转化的原生质体与哺乳动物细胞融合的方法已被报道(美国专利5,989,814),但是细菌或酵母细胞中蛋白质文库的表达发生在细胞融合之前。有人试图用酶在宿主细胞表达外源蛋白后对蛋白的糖基化方式进行改造(Meynial-salles和Combes,J.Biotechnol.,461-14(1996)),但是这种方法必须针对不同的蛋白而改变,并且不适用于从DNA文库中表达蛋白。在更近一些时候,Maras et al.,Eur.J.Biochem.,249701-707(1997)(又见美国专利5,834,251)报道一株里氏木霉(Trichoderma reesei)基因工程菌表达人类乙酰糖苷(GlcNAc)转移酶I。该酶将所表达的其它外源基因的N-乙酰葡萄糖苷转化为甘露糖残基,这是向有天然活性的哺乳动物蛋白迈进的第一步。
用酵母作为宿主细胞解决了上述的一些问题,但却引入了新的问题。酵母倾向于过度糖基化外源蛋白质(Bretthauer和Castellino,1999,Biotechnol.Appl.Biochem.30193-200),而由于糖基化方式的改变,常使得表达的哺乳动物蛋白质具有高抗原性(C.Ballou,Molecular Biology ofthe yeast saccharomyces(酵母的分子生物学),J.Strathern et al.,eds.,ColdSpring Habor Laboratory Press,NY,1982,335-360)。虽然酵母可以应付少数一些内含子,但是它们基本上不能处理从高等物种,比如脊椎动物的复杂基因。即使来自丝状真菌的基因对于酵母来说也太复杂以至不能有效地转录,再加上酵母和丝状真菌的表达和基因拼接序列不同,使这一问题变得更加复杂(参见例如M.Innis et al.,Science 1985,22821-26)。尽管有这些缺点,酵母转化和表达体系还是被广泛地开发,主要用作cDNA文库的表达。人们开发酵母表达系统,用来筛选源自哺乳动物的自然分泌蛋白和膜蛋白(Klein,et al.,Proc.Natl.Acad.Sci.USA 1996 937108-7113;Treco,美国专利5,783,385),异源的真菌蛋白(Dalboge和Heldt-Hansen,Mol.Gen.Genet.243253-260(1994)),和哺乳动物蛋白(Tekamp-Olson和Meryweather,美国专利6,017,731)。
术语“酵母”在本文酵母表达系统部分中是指分类上属于酵母目的生物,例如酿酒酵母和巴斯德毕赤氏酵母。为了明确上述定义,术语“真菌”和“真菌的”应被理解为担子菌纲、结合菌纲、卵菌纲、壶菌纲和隶属于真子囊菌纲的子囊菌,而不包括酵母目。丝状真菌和酵母可以通过它们在无性繁殖时菌丝体的延长和需要空气进行碳代谢来区别(酵母的无性繁殖是单个细胞的出芽生殖,而且酵母可以进行发酵生长代谢)。
真菌宿主细胞能最有效地进行真菌基因产物正确的内含子的拼接、糖基化、折叠和其它翻译后加工,这使得丝状真菌成为最好的进行土壤样品基因组DNA筛选的宿主菌。同时丝状真菌也成为生产有商业价值的真菌酶类,如蛋白酶、纤维素酶和淀粉酶的最好宿主菌。人们同时发现,丝状真菌能够转录、翻译、加工和分泌其它真核生物基因产物,包括哺乳动物基因。该特性使得丝状真菌成为生产有生物医药价值的蛋白质的合适宿主菌。与酵母相比,丝状真菌引入的糖基化模式更接近于哺乳动物蛋白的糖基化模式。由于上述原因,科学家投入了巨大的努力来开发用来表达外源性蛋白的真菌宿主系统,并且已经开发出了许多真菌表达系统。欲了解该领域的工作,请参见Maras et al.,glycoconjugate J.,1699-107(1999);PEBERDY,Acta Microbiol.Immunol.Hung.46165-174(1999);Kruszewsa,Acta Biochim.Pol.46181-195(1999);Archer et al.,Crit.Rev.Biotechnol.17273-306(1997);和Jeenes et al.,Biotech.Genet.Eng.Rev.9327-367(1991)。
从真菌基因组构建的DNA文库的高通量表达和鉴定也可以被用来确定许多现在功能未知的哺乳动物基因的功能。例如,一旦发现了一个真菌蛋白质具有一种令人感兴趣的功能特性,可以将编码该蛋白的基因序列与人类基因组序列相比较来寻找同源基因。
Yelton等在美国专利第4,816,405号中阐述了改造丝状子囊菌以使其生产并分泌异源蛋白质。Buxton等在美国专利第4,885,249号,以及Baxton和Radford,Mol.Gen.Genet.196339-344(1994)中通过一个带有可以整合到宿主细胞中的选择标记的DNA载体对黑曲霉进行了转化。McKnight等在美国专利第4,935,349号,以及Boel在美国专利第5,536,661号阐述了利用可以引导异源基因在根霉和其它丝状真菌中表达外源基因的启动子在曲霉中表达真核基因的方法。Royer等在美国专利第5,837,847号中,以及Berka等在WO 00/56900中,介绍了一种采用天然或突变过的镰刀菌启动子的有毒镰刀菌表达系统。Conneely等在美国专利第5,955,613号中介绍了所构建的适合在曲霉中表达和生产乳铁蛋白的质粒。枝孢菌的葡萄糖氧化酶已经在曲霉中被表达(美国专利第5,879,921号)。
相似的技术也被应用在链孢霉中。Lambowitzr在美国专利第4,486,533号中,介绍了一种可以在丝状真菌中自动复制的DNA载体及其在链孢酶内引入和表达外源基因中的应用。Stuart等在美国专利第5,695,965号中介绍了厚壁链孢菌(Neurospora crassa)原生质球的哺乳动物基因和内源性转录调节因子的共转化,并在美国专利第5,776,730号中描述了一株经改良后减少了胞外蛋白酶的链孢菌。美国专利第5,834,191号中公开了用于链孢菌转化的载体。Taraki等在美国专利第5,436,158号中介绍了一种用于Rhizopus中的转化系统。Sisniege-Barroso等在WO 99/51736中介绍了用于丝状真菌的转化系统,该系统采用了来自于Aspergillus awamori的谷氨酸脱氢酶启动子。Dantas-Barbosa等在FERMS Microbiol.Lett.1998169185-190中,介绍了通过醋酸锂法或电激法转化灰色腐殖菌(Humicolagrisea)的Thermoidea变种,使它获得了对潮霉素B的抗性。
更加成功的一些真菌表达系统是曲霉属和木霉菌属,相关例子请参见Berka等在美国专利第5,578,463号中的说明,在Devchand和Gwynne的文章J.Biotechnol.173-9(1991),以及Gouka等的文章Appl.Microbiol.Biotechnol.471-11(1997)中也有论述。菌种Myceliophthora thermophilia,Acremonium alabamense,陆生梭菌(Thielavia terrestris)和Sporotrichumcelluliphilum转化株的例子分别在WO 96/02563,美国专利第5,602,004、5,604,129、5,695,985号中有报道。这些报道称曲霉和木霉系统有一定的缺陷,暗示其它的真菌也许更适于大规模蛋白质生产。
除子囊菌门外其它门的转化方法也有文章报道。请参见例子Munoz-Rivas等,Mol.Gen.Genet.1986 205103-106 Schizophyllum commune;van de Rhee等,Mol.Gen.Genet.1996 250252-258,双孢伞菌(Agaricusbisporus);Arnau等,Mol.Gen.Genet.1991 225193-198,拳卷毛霉(Mucorcircinnelloides);Liou等,Biosci.Biotechnol.Biochem.1992 561503-1504光亮根霉(Rhizopus niveus);Judelson等,Mol.Plant Microbe Interact.1991 4602-607,致病疫霉(Phytophthora infestans);以及de Groot等,NatureBiotechnol.1998 16839-842,双孢伞菌(Agaricus bisporus)。
丝状真菌除了例如原生质体融合等常规转化方法外,Chakraborty和Kapoor,在Nucleic.Acids Res.186737(1990)中介绍了利用电激法转化丝状真菌。De Groot等在Natyre Biotechnol.16839-842(1998)中采用根癌农杆菌(Agrobacterium tumefaciens)介导的几种丝状真菌的转化。科学家也开始利用生物介质将外源DNA转入真菌;例子有Christiansen等,Curr.Genet.29100-102(1995);Durand等,Curr.Genet.31158-161(1997);以及Barcellos等,Can.J.Microbiol.441137-1141(1998)。以磁粒作为“磁性生物介质”转化细胞的报道参见美国专利第5,516,670号和5,753,477号,科学家希望这种方法适用于丝状真菌。
显然人们作了许多努力开发以真菌作为宿主菌的表达系统。然而,普通的真菌宿主都是丝状真菌,在不加搅拌的培养液中会形成纠缠的菌丝体,而在加以搅拌的生物反应器中培养液粘度又会很大。丝状真菌的这些特性也会在以之为宿主菌的工业化酶生产中导致问题。例如,高粘稠度和/或在局部形成的密集菌丝体堆积,将会对搅拌、通气和营养物分散造成困难。一般来说,由于培养液的粘度,用微量移液器将丝状真菌悬浮培养物吸到微量滴定板中有一定困难。而且,由于典型丝状真菌培养物的菌丝体互相纠缠,用它来表达DNA文库时,大规模地将纠缠的菌丝体分离为单个克隆并不容易,这将使检测单个基因型这一高通量检测系统所需的步骤遇到困难。
在不进行持续的搅拌时,典型的丝状真菌倾向于在液体培养基的表面生长并形成一层菌丝体,并在其上产气生孢子。而在培养基液面以下生长时又不总是产生孢子。这两个特性都对在微量滴定板中培养丝状真菌菌落,以及对有效地操作和利用这种培养物进行高通量的筛选制造了巨大的困难。悬浮的孢子和其它的可复制单元适于分离并分散到单个的微量滴定板孔中,但如果允许气生菌丝体的形成,气生孢子的产生会导致板孔间的交叉污染。在微量滴定板孔的培养基中进行搅拌以防止气生菌丝层的形成是不可行的。除了难以控制的气生孢子问题,气生菌丝层会干扰光的转移,使得许多检测(尤其是分光光度吸收检测)较难甚至无法进行。气生菌丝层还对诸如供氧、试剂和营养的添加以及取样等产生干扰。
真菌的形态特征对其培养物的物理特性的影响已经被认知,人们已经找到了有更好特性的自然产生的菌株,Jenssen和Boominathan的美国专利第5,695,985号提供了一个例子。松散的菌丝体均一分布,有规律的分枝,都是所描述的有益的形态特征。Schuster和Royer在国际专利申请WO 97/26330和美国专利6,184,206中提到了相似的方法,用来分离鉴定形态特征更适合于工业化生产外源蛋白质的真菌。该方法不是直接筛选野生型菌株,而是筛选亲本真菌细胞的突变株系,转化突变株,检测是否有转化子比亲本产生更多的外源蛋白。比亲本至少多出10%菌丝体分枝的突变株被特别注意。该方法被应用于木霉属、镰刀霉属和曲霉属的筛选,他们还暗示此方法可以应用于其它许多属。
Bock等在Biotechnol.Bioeng.65638-648(1999)中检测了分枝频率对米曲霉突变株培养物粘度的影响;结果发现分枝越多的突变株培养物粘度越低。而Van Wezel等在PCT应用WO 00/00613中,介绍了一种减少菌丝分枝和/或增加菌丝体片段的数量的方法,培养液的粘度也被降低了。该方法将灰色链霉菌的SsgA基因转入了微生物中。该方法采用的是放线菌目的丝状细菌,但宣称适用于丝状真菌。在WO 00/56893中,Dunn-Colenman等描述了一株构巢曲霉的HbrA2突变株在42℃以上生长时分枝数大大增加,并且观察到菌丝分枝度与培养物粘度之间呈线性关系。
对丝状真菌表达系统的绝大多数前期研究都是为了分离鉴定适于工业化酶生产的菌株,因而人们的注意力主要集中在培养液粘度、转化的稳定性、单位体积的外源蛋白产量,以及产量占生物量的百分比这些方面。已经在真菌中表达了一些DNA文库,例如Gems和Clutterbuck在Curr.Genet.1993 24520-524这篇论文中,用构巢曲霉系统表达了构巢曲霉文库。Gems等在Mol.Gen.Genet.1994 242467-471这篇论文中,用曲霉系统表达了一个来源于青霉的基因组文库。但是这两个例子都没有透露或暗示对表达的蛋白进行了筛选;而是通过对宿主突变的等位基因的互补作用来证实来自DNA文库的基因已经获得了表达。这种互补的方法对每个想要检测活性的外源蛋白都需要一个特定的突变株做宿主菌,因而不能对一般的文库筛选提供一个工具。
Berges等人在Curr.Genet.1993 2453-59这篇论文中,阐述了用在Trichoderma reesei中表达的方法克隆了一个黑曲霉蔗糖酶基因。具体方法是利用一个构建在有选择标记的粘粒上的黑曲霉基因组文库,并采用一株不能利用蔗糖的里氏木霉(T.reesei)作为宿主菌,用同胞选择的方法克隆了一个黑曲霉蔗糖酶基因。在这里,同样需要有特定性状的宿主菌来检测特定单个外源蛋白的表达,基因组文库的筛选没有被提及甚或不可能。
一个适于表达DNA文库的宿主菌的特点在许多方面与适合于工业化蛋白质生产的宿主菌不同。总的来说,一株适合于高通量筛选的真菌宿主菌应具备许多条件,其中包括-宿主菌必须能进行高效转化。
-宿主菌必须能处理含有内含子的基因,并能进行任何必要的拼接。
-宿主菌必须能对表达的蛋白进行翻译后加工,以使蛋白变为有活性的形式。
-当从文库中筛选一种蛋白质时,宿主菌必须能够生产足够多的该蛋白以供分析之用。
-宿主菌必须能接受许多种表达调控因子,并能轻松利用各种调控因子。
-宿主菌培养物中的菌丝体不能相互纠缠而对分离单个克隆产生困难,也不能相互纠缠而升高粘度到不能在小型化的高通量筛选中(如微量取样)有效转移和复制的程度。
-宿主菌不能在培养基表面形成菌丝层,而应优先在培养基液面以下生长。
-在高通量筛选所提供的生长条件下,宿主菌必须能在培养基液面以下有效地形成孢子或其它无性繁殖体。
当被筛选物是代谢产物时,如果宿主细胞能将代谢产物分泌到培养基是再好不过了。在培养基中代谢产物可以被很容易地检测和/或分析。在理想状态下,宿主菌应该只分泌外源蛋白。
当对蛋白质进行分析时,如果宿主菌也能表达足够用来分离和纯化的外源蛋白就非常有利了。如果有具备这种特点的宿主菌,就可以只通过培养宿主细胞,而不用烦琐费时的分子生物学操作将基因转入其他生物体,来进一步鉴定所有感兴趣的外源蛋白。宿主菌能将蛋白质分泌到胞外是一个好的特性,这样可以进行更可靠和更多样的检测。
如果宿主细胞能方便地分离外源DNA也将是非常有利的,这样进一步的研究以及改造基因本身也可以进行。
除了上述的特性,这种转化系统还应具备一些其它的特点。转化的效率应该足够高,以产生有意义的筛选所必须的足够转化子数。在理想状态下,外源蛋白的表达应由一种诱导物诱导,并且该诱导物通过一条途径作用在一个启动子上。
迄今为止,还没有任何宿主菌和转化系统的组合符合全部这些条件,甚至连能符合大部分的也没有。因此,人们仍然需要能有效表达DNA文库—尤其是基因组文库和/或真核基因组文库的基因产物的真菌宿主和转化系统。
发明简述本发明采用在深层培养时能产生“可转移的复制单元”的丝状真菌。“可转移的复制单元”是指孢子、无性芽、菌丝片段、原生质体、皮层碎片,或其它符合下面两个特征的真菌单元(1)在培养基中能容易地与其它这类单元分离,和(2)能够自身复制成一个单克隆培养物。优选真菌还表现出丝状形态不明显和/或生长紧密的优点,并且产生适于高通量DNA文库筛选中涉及的物理操作的低粘度培养物。尤其优选的是,即使在不加搅拌的情况下仍然倾向于在培养基内部生长,而不是在培养基表面形成菌丝层的丝状真菌。
本发明利用了在国际专利申请PCT/NL99/00618和PCT/EP99/202516中公开的转化系统的特点。这些申请描述了一种对诸如Chrysosporiumlucknowense、Aspergillus sojae等丝状真菌宿主非常有效的转化系统。这些申请还公开已经获得了保留野生型宿主细胞所有优良性状,但部分失去其丝状表型的突变株,这种突变株降低了培养物的粘度。
本发明所采用的优选真菌能够大量表达并分泌外源蛋白质,与已知丝状真菌宿主相比蛋白质/生物量之比获得了提高。本发明提供了一个表现高转化子产量的转化系统。本发明还提供了能有效表达外源cDNA插入体,尤其是基因组DNA插入体的蛋白产物的真菌转化株库。本发明的另一方面,转化的真菌库可以用来筛选外源蛋白的活性或特性,或者筛选转化真菌由于外源蛋白的作用而产生的代谢物,也可以用来筛选外源DNA或其转录产物RNA。应该理解本发明还能够高通量筛选具有上述性状的非转化菌株的代谢物。
本发明使用的术语“丝状真菌突变株”仅指在自然界找不到的真菌。导致例如紧密的生长状态、低粘度、低蛋白酶含量、在液面以下生长等可描述的表性特征的“突变”可以通过紫外线诱变和化学诱变等经典方法,或者通过如盒式突变等分子生物学手段随机产生,还可以通过缜密的基因工程方法来获得。如果一株天然真菌具有这些必要特性,它将理所当然地可以被应用于本发明的方法中。
在本发明的另一方面,转化的真菌库可以用来筛选真菌自身的有用性质,例如,一种特定表达的蛋白或代谢物的高水平生产。本发明的这一方面可以通过对目标表达蛋白的定量分析来说明,其中可以检测到有最优良的蛋白生产、蛋白加工和蛋白分泌特性组合的特殊菌株。
在本发明的再一方面,转化真菌库可以用来筛选能够与目标核酸探针杂交的DNA序列的存在。


图1是实施例中描述的Western印迹图。
图2是质粒pUT720的图谱。
图3是质粒pUT970G的图谱。
图4是质粒pUT1064的图谱。
图5是质粒pUT1065的图谱。
图6是质粒pF6g的图谱。
图7是质粒pUT1150的图谱。
图8是质粒pUT1152的图谱。
图9是质粒pUT1155的图谱。
图10是质粒pUT1160的图谱。
图11是质粒pUT1162的图谱。
图12是pclA蛋白的结构图。
图13A是黑曲霉(Aspergillus niger)野生型的显微照相图。
图13B是黑曲霉pclA突变株的显微照相照片。
图14A是酱油曲霉(Aspergillus sojae)野生型的显微照相照片。
图14B是酱油曲霉pclA突变株的显微照相照片。
图15A-E是pyrE基因的测序结果。带下划线的是氨基酸序列;由于一些核酸序列不确定导致氨基酸序列不连续。标出的氨基酸序列是最可能的序列,黑体字代表推测的/可能的内含子。
本发明的详细描述从最广义的角度来说,本发明涉及在悬浮培养液中能产生可转移的复制单元的转化丝状真菌;涉及这种真菌库;还涉及从这种库中筛选诸如与表达的外源蛋白质或相关代谢产物(即由内源性和/或外源性酶产生的小分子量产物)有关的生物化学活性或生物学活性等所需生物学特性的方法。这个低粘度的丝状真菌库包括含有核酸序列的真菌,每段核酸序列编码一个外源蛋白,每段所述核酸序列都可操作地连接于一个表达调控区,并可选择地连接分泌信号编码区和/或载体蛋白编码区。本发明中的转化菌株优选可以分泌外源蛋白。
本发明所使用的表达和筛选方法,和其中使用的真菌菌株,对生产真菌、蛋白质、代谢物和DNA分子这些在各方面有广泛用途的物质很有用。本发明的方法对获得核酸和蛋白质序列信息也很有用,这些信息本身也被看作本方法的有用产品之一。
本发明的优选丝状真菌特征在于培养基粘度低。典型的工业级丝状真菌的培养物粘度远大于200厘泊(cP),通常是1,000cP以上,甚至能达到10,000cP;本发明的真菌在有充足营养及最适或接近最适生长条件下培养48小时或更长时间以后,培养物粘度在200cP以下,优选100cP以下,更优选60cP以下,最优选10cP以下。本发明的丝状真菌通常呈现短的、不连续、不相互纠缠的菌丝或小团的形态。这些小团是从一个单克隆产生的有轻微或无相互纠缠的菌丝集合体,与从多个相互缠绕的克隆产生的菌丝团是不一样的,后者要大得多。例如,Chrysoporiumlucknowense突变株UV18-25(培养粘度<10cP)和形态相似的Tricodermalongbanchiatum突变株X-525(培养粘度<60cP),特征在于有短的、明显的、不相互纠缠的菌丝,长度在100-200微米之间;低粘度基因工程突变株Aspergillus sojae pclA的形态特征是有多分枝和短菌丝的紧密形态(参见图14)。而WO97/2630中提到的低培养粘度真菌在形态上“分枝更多”,本发明中的真菌与非突变菌株相比菌丝分枝与之相当甚或更少。看起来菌丝的长度在控制培养物粘度上起关键作用。
特别优选的真菌菌株有高的外源分泌蛋白/生物量之比。这个比率大于1∶1,较有大于2∶1,更优选6∶1或更高,最优选8∶1或更高。这样高的比率在高通量筛选环境中是有利的,因为它会使外源蛋白的浓度更高,允许更灵敏和/或更快速的筛选检测。这在检测的体积减小时尤其有利,例如从96孔微量滴定板到384孔板,再到1536孔板时。本发明的方法适用于所有这些型号的微量滴定板,也适用于绝大多数其它采用液体样品的、HTS样式的滴定板。
我们期望用本发明所讲的突变方法,可以将所有丝状真菌转变为适合于在本发明中应用的突变株。优选的丝状真菌的属有金孢属(Chrysosporium),梭孢壳属(Thielavia),链孢酶属(Neurospora),金色担子菌属(Aureobasidium),线黑粉菌属(Filobasidium),Piromyces,Crylococcus,Acrimonium,Tolypocladium,Scrytalidium,裂褶菌属(Schizophyllium),侧孢霉属(Sporotrichum),青霉属(Penicillium),赤霉菌属(Gibberella),毁丝霉属(Myceliophthora),毛霉属(Mucor),曲霉属(Aspergillus),镰刀霉属(Fusarium),腐质霉属(Humicola),和木霉属(Trichoderma),和它们的无性型及远距离刺激变形型。其中优选金孢属,木霉属,曲霉属和镰刀霉属。更优选金孢属。真菌的种属可以根据与Barnett和Hunter所著的《不完善的真菌属的图解》第三版,1972,Burgess出版公司一一书中描绘的形态的一致性来定义。对金孢属真菌的分类提供详细原始资料的有Van Oorschot,C.A.N.(1980)“对金孢属及其相关属的修订”, Studies in Mycology No.20 Cenntraal Bureau voorSchimmelcultures(CBS),Barrn,The Netherlands,第1-36页。根据这些资料,金孢属属于丝孢菌目的丛梗孢科(Moniliaceae)。
另一个提供真菌命名的方便资源是布达佩斯条约的保藏,尤其是那些提供在线数据库的(以下这些网址采用HTTP传输协议)。美国的ATCC在www.atcc.org提供信息,CBS(NE)在www.cbs.knaw.nl提供信息,俄罗斯的VKM在www.bdt.org.br.bdt.msdn.vkm/general提供信息。另一个资料来源是NT.ars-grin.gov/fungaldatabases。所有这些机构都能提供区分真菌种的特征的教程。在www.ncbi.nlm.nih.gov/htbon-post/taxonomy/wgetorg?mode=Undef&id=4890网站可以找到Ascomycota的另一种分类。根据这另外一种分类,金孢属隶属于Ascomycota门、Onygenales目、Onygenaceae科。
金孢属的范围包括但不局限于这些菌株C.botryoides,C.carmichaelli,C.crassitunicatum,C.Europe,C.evolceannui,C.farinicola,C.fastdium,C.filiforme,c.georgiae,C.globiferum,C.globiferum var articulatum,C.globiferum var niveum,C.hirundo,C.hispanicum,C.holmii,C.indicum,C.inops,C.keratinophilum,C.kreiseii,C.kuzurovianum,C.lignorum,C.lobatum,C.lucknowense,C.lucknowense Grag 27K,C.medium,C.mediumvar spissescens,C.mephiticum,C.merdarium,C.merdarium var roseum,C.minor,C.pannicola,C.parvum,C.parvium varcrescens,C.pilosum,C.pseudomerdarium,C.periformis,C.queenslandium,C.sigleri,C.sulfureum,C.synchronum,C.tropicum,C.undulantum,C.vallenarense,C.vsepertilium,C.zonatum.
C.Lucknowense是金孢属的一个人们特别感兴趣的种,因为在自然条件下它的纤维素酶蛋白的产量比较高(国际专利申请WO 98/15633,PCT/NL99/00618,和美国专利5,511,381和6,015,707)。国际保藏号为ATCC 44006,CBS 251.72,CBS 143.77,CBS 272.77,和VKM F-3500D的菌种都是Chrysosporium lucknowense菌株的例子。金孢属的定义范围还包括从金孢属同一祖先衍生来的菌株,包括自发突变或诱变的突变株。本发明的方法,在一个具体方面,利用了一株通过辐射和化学诱变获得的金孢属突变株,该菌株在悬浮培养时倾向于产生可转移的复制单元,其形态特征是短的、不连续的、不相互纠缠的菌丝(紧密生长),还有一个表型特征是在悬浮培养时在液面以下生长,发酵培养基的粘度较低。在另一个方面,本发明采用了形态相似的木霉属突变株。在另一个方面,采用了形态相似的酱油曲霉或黑根霉突变株。
例如,将VKM F-3500D(C1菌株)用紫外线照射,获得菌株UV13-6。随后,该菌株用N-甲基-N’-硝基-N-亚硝基鸟嘌呤进一步诱变,产生菌株NG7C-19。后者接着被紫外线诱变,获得菌株UV18-2(VKM F-361D)。在突变过程中,该菌株在液体培养基或平板以及显微镜下的形态特征发生了一些变化。在每一次连续的突变后,在平板上培养的突变株的金孢属典型绒毛状和毡状的形态特征就会减少一些。野生型在某些培养基中生长时会产生棕色色素,而突变株的这种特征则不明显。在液体培养基中生长时,突变株UV18-25的粘度明显低于野生型菌株C1和突变株UV13-6和NG7C-19。虽然所有菌株都大致保持着金孢属的显微镜下特征,但所有菌株每经过一代突变菌丝就变细一些,而UV18-25可以明显观察到菌丝呈片段状。这种菌丝片段可能是造成UV18-25的培养物粘度降低的原因之一。每进行一代突变,菌株产生气生孢子的能力就减弱一些。这些结果表明一个菌株可以总体上属于金孢属,而在形态上表现出与传统分类(形态上)定义有一些差异。
特别是金孢属的无性型,我们发现它特别适合本发明所述的筛选应用。无性型的代谢使其特别适合高效表达。有性型也应该适合,因为无性型和有性型的基因组成是一样的。无性型和有性型的区别在于一个是无性状态,另一个是有性状态;这两种状态在特定培养条件下表现出不同的形态。
另一个代表基因工程突变菌株的例子是酱油曲霉(Aspergillus sojae)。这些突变株中的一株的编码一个特定内切蛋白酶的基因被阻断了。这一突变导致了菌丝变短,分枝增加,菌丝生长紧凑,在培养基液面以下形成菌丝小片。并且,在本应用中提到的Aspergillus sojae在特定的液体培养基内生长可以被诱导表现出高效的生孢子能力,这使得它特别适合用于高通量筛选系统。在这个例子中,诱导产生可转移的复制单元的条件仅仅是由一种含0.6克/毫升EDTA的合成培养基组成。诱导条件会随着不同的宿主而改变,但很明显的是如果一个宿主菌适合,这个条件应该早就为人所知了。
人们喜欢用不产毒素和非致病的真菌菌株,现有技术已知道很多这种菌,因为这会降低操作者的危险性,并能简化总体的筛选过程。在优选的实施方式中真菌还将是蛋白酶缺陷型,这样可以最大程度地降低外源蛋白的降解,和/或易于抑制蛋白酶的产生。将蛋白酶缺失的菌株用作表达宿主菌是众所周知的,例如PCT申请WO 96/29391。蛋白酶缺失的菌株可以通过筛选突变株来产生,或者蛋白酶基因可以被”敲除”,或者可以用本文中的方法使其失活,例如Christensen和Hynes在美国专利6,025,185号中所描述的(areA基因功能丧失的Aspergillus sojae)。
人们发现可以处理金孢属突变株使其蛋白酶表达量下降,这就使它们更适合于生产蛋白类产品,尤其是当蛋白类产品对蛋白酶活性敏感时。因此本发明也可以使用一株金孢属突变株,该突变株比诸如C.lucknowense菌株C1(VKM F-3500 D)等非突变金孢属菌株产生的蛋白酶少。这些突变株的特别之处是其蛋白酶活性(除了所有的有选择的用来切割分泌的融合蛋白的蛋白酶)小于C1菌株产生的活性的一半,更好的情况下小于30%,最好时小于10%。被降低的蛋白酶的活性可以用已知的方法测定,例如测量脱脂牛奶平板上的抑菌圈或牛血清白蛋白降解。
已经发现可以构建蛋白酶表达水平降低的金孢属突变株,以使它们更适于生产蛋白产物,尤其是当蛋白产物对该蛋白酶活性敏感时。因此,本发明也可以利用比金孢属非突变株例如C.lucknowense C1株(VKM F-3500 D)产生更少蛋白酶的金孢属突变株。尤其是当该突变株的蛋白酶活性(而非裂解融合蛋白的蛋白酶)不及C1株的一半或少于30%甚至10%时更好。蛋白酶活性的减少用已知方法测定,如测定脱脂牛奶平板形成的抑菌圈或牛血清白蛋白的降解。
为了减少分析时宿主蛋白的干扰,去除宿主丝状真菌的其它基因如编码纤维素酶和其它分泌较多的蛋白的基因的活性,是再好不过了。可以删除或突变编码分泌蛋白的基因,或者对非目的蛋白的诱导系统及表达的有关途径进行改造以降低其表达。本发明(见下面)中载体使用内源性操纵子,是为了灭活同一个诱导子控制下的其它的基因的活性。蛋白酶分泌较易抑制的真菌的蛋白酶表达往往受环境调节因子如氨基酸浓度的控制,而通过这些环境因子可以减少蛋白酶的生产。
转化载体中优选应用能够在选择的宿主中高表达的同源表达调节区。来源于异源宿主如木霉属或曲霉属的高表达调节区,众所周知而且都在使用。举例但并不限于这些,已知大量表达并因此为本发明的应用提供合适表达调节序列的蛋白质的例子是hydrophobin,蛋白酶、淀粉酶、木聚糖酶、果胶酶、酯酶、β-半乳糖苷酶、纤维素酶(endo-glucanase,cellobiohydrolase)及多聚半乳糖醛酸酶。
表达调节区包含一个可控制的启动子序列,和要表达的蛋白的核酸序列连接在一起。启动子和要表达序列的起始密码子紧密相连,以达到表达的目的。启动子序列可以是组成型的,但诱导型的更好。使用诱导型启动子和适当的诱导介质更利于和启动子相连的序列的表达。我们曾考察过一些来源于同源物种或异源株系的、能够促使蛋白质表达的表达调节序列。这种表达调节序列适合于真菌的表达调节区,例如子囊菌纲的调节区。合适的子囊菌纲的表达调节区是来自下列属任意一种的调节区曲霉属,木霉属,金孢属,腐质霉属,链孢霉属,Tolypocladium,镰刀霉属,青霉属,Talaromyces,或它们的另一种性别型例如Emericela及镰刀霉属。来自木霉属的cellobiohydrolase启动子;曲霉属的乙醇脱氢酶A,乙醇脱氢酶R,谷氨酸脱氢酶,RAKA淀粉酶,甘油淀粉酶,甘油醛磷酸脱氢酶启动子,链孢霉属的磷酸甘油及旁路的启动子;Rhizomucor miehei的脂酶、冬氨酸蛋白酶启动子;penicillium canescens的β-半乳糖苷酶的启动子;而cellobiohydrolase,葡聚糖内切酶,木聚糖酶,甘油醛磷酸脱氢酶和蛋白酶的启动子是典型代表。和宿主同属的表达调节序列是最佳选择,因为它更可能特别地适应宿主。
来自表达巨大量蛋白质的金孢属菌株的天然表达调节序列特别优选。这些菌株的例子已经根据布达佩斯条约保藏于莫斯科的全俄菌种保藏机构(All Russian Collection,VKM)。野生型C1株保藏号为VKM F-3500 D,保藏日为1996年8月29日,C1 UV13-6突变株保藏号VKM F-3632 D,保藏日1998年9月2日,C1 NG7C-19突变株保藏号VKM F-3633 D,保藏日为1998年9月2日,C1 UV18-25突变株,保藏号VKM F-3631 D,保藏日为1998年9月2日。这些菌株也优选用来作为生产低-粘性突变株的菌源;事实上VKM F-3631D菌株已经表现必需的低粘度表型特征。经过对Trichoderma longibrachiatum18.2kk的两轮辐射选择,已经得到木霉属的一个编号为X-252低粘度突变株,而X-252低粘度突变株是从Trichoderma longibrachiatum的QM 9414株的突变体(ATCC 26921)得到。本发明的其它实施方式利用了Aspergillus sojae和Aspergillus niger表现型近似的突变株。
当宿主是金孢属时,优选应用金孢属的启动子序列,以保证启动子被宿主正确识别。某些异源表达调节序列也和金孢属本身的表达调节序列一样在,金孢属中具有相同的调节效率。这样以来就使我们可以构建用于转化,金孢属的出色载体,并提供在此宿主中进行高效转化和表达的许多可能性。如,标准的曲霉属转化技术可参考Christiansen等在Bio/Technology1998 61419-1422一文的描述,其它有关转化载体的详细描述包括美国专利4,816,405、5,198,345、5,503,991、5,364,770、5,705,358、5,728,547、5,578,463、EP-B-215.594(也适用于木霉属),它们的内容通过参考并入本文。因为在金孢属中发现纤维素的表达率非常高,纤维素基因的表达调节区很受欢迎。
本发明中载体允许插入编码酶(尤其对分泌出去的酶)的基因的启动子序列。这些酶包括糖降解酶(纤维素酶,木聚糖酶,甘露聚糖酶,甘露糖苷酶,果胶酶,淀粉酶,例如葡萄糖淀粉酶,α-淀粉酶,α和β半乳糖苷酶,α和β葡萄糖苷酶,β-葡聚糖酶,几丁质酶),蛋白酶(内源蛋白酶,氨基蛋白酶,氨基及羧基多肽酶),其他水解酶(脂肪酶,酯酶,肌醇六磷酸酶),和转移酶(糖基转移酶,谷氨酰胺转移酶,异构酶,转化酶)。来自Chrysosporium lucknowense的几个酶的例子见表A。表A来自Chrysosporium lucknowense的部分酶的特性

注*通过MALDI测定的分子量;其它均为通过SDS PAGE测定的分子量xyl=木聚糖酶endo=葡聚糖内切酶
gal=半乳糖苷酶gluc=葡糖苷酶CBN=cellbiohydrolasePGU=半乳糖醛酸酶核酸构建体优选包括来自金孢属、最好是来自Chrysosporiumlucknowense或其衍生物的表达调控区,该调节区可操作地与一个编码待表达蛋白的核酸序列连接。特别优选的核酸构建体将包括来自表达纤维素酶或木聚糖酶的金孢属的表达调控区,优选包括来自表达cellobiohydrolase,更优选表达表A描述的55 kDa cellobiohydrolase(CBH1)的金孢属的表达调控区。再举些例子,金孢属的hydrophobin、蛋白酶、淀粉酶、木聚糖酶、酯酶、果胶酶、β-半乳糖苷酶、纤维素酶(葡聚糖内切酶,cellobiohydrolase)和多聚半乳糖醛酸酶的启动子序列也在本发明的范围内。
表A中公开的酶的所有启动子或表达调控区都可以恰当地得以使用。可以很容易地从金孢属得到这些启动子或表达调控区的核酸序列。确定启动子序列的方法多种多样而且众所周知。启动子序列通常紧靠在相关基因开始的起始密码子ATG的上游。举例来说,可以用去除相关基因上游的序列、重组DNA技术、及检验去除这些序列对基因表达的影响来鉴别启动子序列。再例如,通过比较相关基因上游序列的同源启动子序列,也可以发现启动子序列。
比如,C1葡聚糖内切酶的启动子序列就是通过克隆相应基因得来的(见PCT/NL99/00618)。本发明倾向于使用来自金孢属55kDacellobiohydrolase(CBH1)、甘油醛磷酸脱氢酶A、30k Da的木聚糖酶(XylF)的启动子,因为这些酶应用它们的启动子时表达水平较高。Chrysosporiumlucknowense尤其是C.lucknowense GARG 27K糖降解酶的启动子因可在其它真菌宿主中表达很多蛋白,很好使用。
本发明核酸序列的具体实施方式
是已知的金孢属,曲霉属和木霉属的核酸序列。金孢属的启动子序列见PCT/NL99/00618的描述。现有技术提供了大量可在曲霉属中应用的表达调控区,例如美国专利4,935,349;5,198,345;5,252,726;5,705,358;5,965,384和PCT申请WO93/07277。在木霉属菌株中表达公开在美国专利6,002,725中。这些专利的内容通过参考其全文并入本发明。
Hydrophobin基因是一个高表达的真菌基因。有人认为Hydrophobin基因的启动子序列、优选来自金孢属的启动子序列,适合用作本发明适当实施方式中的表达调节序列。Trichoderma reesei和Trichodermaharzianum的Hydrophobin基因序列已经为现有技术所公开,并且Aspergillus fumigatus和Aspergillus nidulans的基因序列及相关序列信息被参考并入本发明(Nakari-Setala等,Eur.J.Biochem.1996,235248-255;Parta等,Infect.Immun.1994 624389-4395;Munoz等,Curr.Genet.1997,32225-230;Stringer等,Mol.Microbio.1995 1633-44)。利用这些信息,本领域普通技术人员按照标准方法例如前面提到的技术,不必经过繁重实验即可得到金孢属hydrophobin基因的表达调控序列。根据本发明的一个重组金孢属菌株可以包含一个可操作地与编码外源蛋白的序列相连的hydrophobin调控区。
表达调控序列也可以另外包含一个增强子或沉默子。它们也是现有技术已知的,它们一般远离启动子。表达调控序列还包括具有激活物结合位点和阻抑物结合位点的启动子。在某些情况下,这些部位也可以得以修饰以去除这种类型的调控。例如,存在creA位点的丝状真菌启动子的已有报道。可以使creA位点突变,以确保由于存在的creA被去除而导致葡萄糖的抑制。利用这样的启动子可以产生在葡萄糖存在下启动子控制的核酸序列编码的蛋白库。这种技术的例子见WO 94/13820及WO97/09438。这些启动子在有后无其creA位点的情况下均能使用。creA位点突变的突变体可用作本发明重组株的表达调控序列,而它所调控的核酸序列库可以在葡萄糖存在下得以表达。这类启动子如WO 97/09438中所描述的类似方式确保去抑制。CreA位点的鉴别知识是现有技术已知的。另外,可以在抑制系统以外具有突变的宿主菌株中应用CreA结合位点未突变的启动子,从而该菌株尽管存在CreA结合位点,仍能够在葡萄糖存在下产生蛋白库。
终止序列也属于表达调控序列,它们可操作地连接在要表达的序列的3’端。可能有许多已知的真菌终止子在本发明的宿主菌中起作用。如A.nidulans trpC的终止子,A.niger的α-葡糖苷酶终止子、A.niger的葡糖淀粉酶终止子、Mucor miehei的羧基蛋白酶终止子(参见US 5578463),以及Trichoderma reesei的cellobiohydrolase终止子。金孢属的终止子序列,例如EG6终止子,当然在金孢属中发挥很好的得作用。
用于本发明的合适转化载体可以任选具有可操作地与信号序列的编码序列连接的待表达外源核酸序列。而信号序列为一段氨基酸序列,当和待表达蛋白的氨基酸序列可操作地连在一起时,能够使该蛋白从宿主生物体中分泌出去。这样的一种信号序列可以是与异源蛋白有关的或是宿主本身的。编码信号肽的核酸序列必须定位在读码框中,以使信号肽和异源蛋白一同翻译。本发明信号肽的位置(包括单一的、分泌外源蛋白)最好处于分子进化该分子所处位置。
一个载体上只连接一个信号序列来进行文库的表达,不是最好选择,因为这将减少表达目的蛋白的可能。随机剪断DNA而建立的基因组文库,然后再克隆到一个载体中,库中基因正好和信号序列连接在一个阅读框架的可能性较小。而且,即便是连接到一起,选择的信号序列可能不会对所有基因起作用。鉴于此,最好不要应用信号序列来筛选基因组库,而要通过检测细胞内外源蛋白的存在来筛选基因组库。细胞内蛋白的存在和活性分析可以通过用酶将真菌转化为原生质体、然后再溶解后得以实现。有关操作见Zeyl等,J.Biotechnol.59221-224(1997)的描述。这种方法已经应用于生长在微量培养板上的金孢属转化子的PCR克隆检测。
讲解一下能使金孢属菌株分泌蛋白的信号序列。此类序列以真菌的信号序列为好,但以Ascomycete的信号序列为最好。通常可以从真核细胞得到合适的信号序列,最好从酵母和以下各属的真菌得到曲霉属,金孢属,木霉属,Pichia,链孢霉属,Rhizomucor,Hansenula,腐质霉属,毛霉属,Tolypocladium,镰刀霉属,青霉属,Saccharomyces,Talaromyces,或不同生殖方式的Emericela、Hypocrea。那些和cellobiohydrolase、葡聚糖内切酶、β-半乳糖苷酶、木聚糖酶、果胶酶、酯酶、蛋白酶、hydrophobin或淀粉酶生来就连在一起的信号肽特别有用。如曲霉属或腐质霉属的淀粉酶或葡糖淀粉酶,Aspergillus oryzae TAKA淀粉酶,Aspergillus niger的α-淀粉酶,毛霉属的羧基肽酶(US 5578463),Rhizomucor miehei的脂肪酶或蛋白酶,木霉属的cellobiohydrolase,来自金孢属Penicilliumcanecens CBH1株的β-半乳糖苷酶,Saccharomyces的α-交配因子的信号序列。
另外信号序列也可以是杆状菌的淀粉酶或枯草杆菌蛋白的信号序列。从同一属的宿主菌株得到的信号序列尤其适合,因为它最可能会特别适应特定宿主的要求;因此当宿主是Chrysosporium lucknowense时,信号序列最好是金孢属的信号序列,金孢属菌株分泌的蛋白量异常地高,当然来自这些株系的信号序列让人感兴趣。来自丝状真菌和酵母的信号序列,也许和非真菌的信号序列一样有用。
按照本发明的任意实施方式,转化的重组真菌宿主可以进一步携带一个选择标记。此选择标记可用来选择转化或转染细胞。选择标记通常编码一种基因产物,进而导致宿主产生不同于非转化细胞的特定类型的抗性。通常可以是对重金属的抗性、抗生素或杀生剂抗性。原养型是非抗生素变种的一种有用选择型标记。自养型标记导致宿主产生营养缺陷,而纠正这些缺陷的基因可以用来作为选择的标记。经常使用的抗性和自养选择标记是amdS(已酰胺酶)、hph(潮霉素磷酸转移酶)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)、pyr(乳清酸P-核糖转移酶)、trpC(邻氨基苯甲酸合成酶)、argB(鸟氨酸氨甲酰基转移酶)、sC(硫酸腺苷转移酶)、bar(膦丝菌素乙酰转移酶)、niaD(硝酸还原酶)、Sh-ble(博来霉素-腐草霉素抗性)、突变的乙酰乳酸合成酶(磺酰脲抗性)、新霉素磷酸转移酶(氨基糖苷抗性)。金孢属菌株最好的选择标记是乳清酸P-核糖转移酶。选择标记单独在一个载体上或者选择标记和要表达异源蛋白的核酸序列在同一片段上,都能通过共转化进行选择。
可以通过使用AMA1复制子序列进一步提高转化效率,这对Aspergillus niger(Verdoes等,Gene 146159-165(1994))是有用。该序列导致许多丝状真菌的转化效率增加10-100倍。另外,导入的DNA不整合到真菌的基因组中,而是以多拷贝、自主的形式保留在真菌细胞里。这对本发明中的高通量筛选方法有利,因为非整合状态减少不同转化子在基因表达水平上的差异。此外,因为导入的DNA不重组到宿主DNA中,宿主基因组不会发生非目的突变。借助于载体如AMA1的自主复制或在真菌端粒序列促进下的自主复制,外源基因得以均一表达。(参见A.Alesenko和L.Ivaniva,Mol.Gen.Genet.1998 260159-164.)本发明中使用的术语“异源蛋白”一词,是指不能在本发明的宿主菌株中正常表达或分泌的蛋白质或多肽。异源蛋白既可来自原核生物,也可开自真菌、植物、昆虫、或来自诸如哺乳动物的高等动物。对于药物筛选目的,则人蛋白是首选,因此一个优选的实施方式是DNA文库属于人源的宿主。因此这样一些实施方式也被认为是本发明的适当实施例。
用本发明的丝状真菌表达人的基因,即来源于人基因组文库的基因,有许多理由期望得到有效表达。现在知道人的基因平均大小为3000-5000bp,人的内含子平均为75-150bp(总范围分布在40至>50000),丝状真菌的内含子为40-75bp,但它们能处理碱基数高达500bp的内含子。人每个基因平均有3-5个内含子(M.Deutsch,M.Long,Nucl.Acids Res.1999273219-3228;见表B)。已知人的信号序列在真菌中也能正常工作。基于上述理由,很可能大量人基因可用本发明的方法高水平表达和分泌。
表B

本发明的方法有望对来自原核和真核基因组的DNA文库的表达有所帮助。如上所述,该方法可以用来表达和检测分泌及细胞内蛋白,而且适应于多种基因和蛋白的情况。
本发明的另一方面包括构建和筛选真菌突变体库以及通过本发明方法构建的真菌突变体库。可以应用本领域技术人员熟知的方法,利用任何整合或非整合方法,转化本发明的真菌宿主得到上述突变体库。通过优选宿主菌株形成的真菌库可以用微量和/或高通量模式筛选方法处理和筛选外源蛋白的所需活性或特性。目的特性或活性意味着与文库中基因的外源蛋白有关的任何物理的、生理化学的、化学的、生物学的或催化特性,或所述特性的任何增加、减少及改进。该文库还可以筛选由于外源蛋白和/或内源蛋白的存在而产生的代谢物、或与代谢物有关的特性或活性。该文库还可以用来筛选蛋白或代谢产物的量增加或减少的真菌。
在本发明的再一方面,转化的真菌文库可以用来筛选具有所需特性的真菌代谢物的存在。例如,这些代谢产物包括聚酮化合物、生物碱、和萜类天然产物。多基因或基因簇(操纵子)预期能转导入本发明的宿主细胞中,而且不会因为编码的酶的活性而在宿主细胞中产生非蛋白产物。例如,已经公开编码生产lovastatin所必需的蛋白的DNA就能转入Aspergillus oryzae(US 5362638;也可参见US 5849541)。
在本发明的另一个实施方式中,真菌转化文库可以用来筛选与目标核酸探针杂交的DNA的存在。在这个实施方式中,外源蛋白的表达和/或分泌并非必需的,尽管这通常是期望的。其中蛋白表达不是必须的,可以理解载体上的调控序列也不是必须的。
在本发明的再一个实施方式中,真菌转化文库可以用来筛选真菌本身的某些期望特性,如真菌对物理、化学极端环境条件的耐受性或产生、修饰、降解或代谢目的物质的能力。此类期望特性也许归功于单个外源蛋白的存在、也许没有关系。当被用作定向进化过程的一部分时,该实施方式将会非常有用。
异源DNA可以是利用多种已知的方法从生物样品制备的基因组DNA或cDNA。生物样品可以是环境中取样(如混合肥料、森林垃圾、土壤、海水或新鲜水),或通过提取、过滤或离心或其它富集方法得到的样品。从环境中得到的样品进行的微生物混合培养也能拿来应用。生物样品也可以来自单个物种的生物,如培养的微生物,或植物,昆虫,或诸如哺乳动物的其它动物。另外,外源DNA可以是合成的或半合成的,如随机DNA片段或经过重组的、突变过的或其它方式改变过的DNA片段。一个半合成核酸库的例子参见Wagner等,WO 00/0632。从环境中取样(或其混合培养物)的DNA对发现新蛋白十分有利,而从单一物种得来的DNA则有下列优点(1)更加明智地选择合适的载体;和(2)如果已经鉴别了一种感兴趣的蛋白,操作者可以直接对相关或类似的物种进行深入的筛选。
和传统的真菌宿主相比较,呈现致密丝状形态的UV 18-25的金孢属菌株的转化、表达和分泌率惊人地高。根据本发明,重组菌株最好为这种形态。然而本发明也覆盖呈现这类特性的非重组菌株或通过其它方式得到的工程菌。本发明的另一吸引人的方面是,使用在相应或等同培条件下比NG7C-19菌株、最好比UV18-25粘性低的金孢属菌株。我们测量了UV18-25培养物的粘度低于10cP,相比之下,已知Trichoderma reesei的粘度为200-600cP,而传统的Aspergillus niger在最理想的培养条件下的发酵中期和晚期,粘度为1500-2000cP。因此,本发明可以使用具有低粘性的任何工程或突变丝状真菌,如金孢属的UV18-25(VKM F-3631D)菌株,木霉属X252菌株,A.sojae pclA菌株(源自ATCC 11906)或A.nigerpclA。
丝状真菌培养物的流动性可以在从近乎半固体到自由流动的液体的较宽范围内变化,粘性可以用Brookfield旋转粘度计、运动粘度试管、落球式粘度仪或杯状粘度仪轻而易举地进行定量。培养液为非牛顿型发酵液,总体粘性在某种程度上和收率相关(Goudar等,Appl.Microbiol.Biotechnol.1999 51310-315),本发明应用的低粘性培养物这种效应非常不明显。
应用这种低粘性的培养物对筛选本发明方法的表达文库十分有利。丝状真菌中表达的DNA文库的筛选曾受相对低效和烦琐的方法所限制。通常,真菌一旦转化(和任意选择的转化体),就必须制备孢子或分生胞子,或机械地打断菌丝体,以便将转化的真菌分散为单个生物,进一步培养成克隆化克隆或培养物。然后稀释孢子、分生胞子或菌丝体,在标准平板上铺开,对单个克隆进行颜色、对底物变化的检查、验证要寻找的蛋白特性或活性导致的其它可检测的指标。另外,可以将分泌蛋白印迹到膜上,然后用对膜上因存在目的蛋白活性或特性而产生的标记进行搜索或检测。应用膜的方法对那些存在降解问题的外源蛋白十分有用(Asgeirsdottir等,Appl.Environ.Microbiol.1999,652250-252)。这些操作的劳动强度大,尚未证明易于实现自动化,因此,对传统丝状真菌中真菌表达蛋白的检测尚未实现高通量检测。本申请中,高通量筛选就是指用部分、或全部自动化的筛选方法,即所述筛选方法一天能评估1,000个或更多转化体所表达的蛋白,优选指一天能评估5,000个或更多转化子所表达蛋白的方法,更优选一天能评估10,000个或更多转化子所表达蛋白的方法。
根据本发明,对转化真菌文库的高通量自动化筛选,可以用许多已知方法进行。对细菌或酵母适用的方法通常也适用于本发明的低粘性真菌。低粘度真菌通过可转移的复制单元的作用,使要用的突变菌丝体变得相对不再缠绕。在自动高通量筛选的机械操作时,突变的真菌和/或它们的可转移的复制单元行为方面在本质上和单个细菌或酵母类似。这和野生型真菌、许多工业上驯化的真菌产生缠绕的菌丝、彼此之间不能分离的情况形成鲜明的对比。
例如,根据本发明,转化真菌的稀释悬浮液可以通过机械微量加样器加到96孔微量反应板上。能向384孔和1536孔反应板加样的液体装置也可以用来向微量反应板添加微生物。悬浮的微生物的浓度可以根据需要进行调整,以便使每孔微生物(或其它的可转移复制单元)控制在平均数量上。最好反应孔内有多个微生物,对孔内的物质进行稀释、再培养为单个克隆化克隆或培养后,然后鉴别孔内目的蛋白的活性和性质。这样以来,系统的总处理能力就会增加,但以需要对每孔的物质进行鉴定而增加的“干扰”为代价。
本发明另外还包括,在液体流通途径中,可以加进去一个细胞分选器,根据分拣室的检测结果将培养物流向微量反应板不同的孔内。这可以准确地将一个细胞分到一个孔内,对鉴别转化子十分有用,因为本方法允许荧光激活的细胞分选器自动选择转化子。
在另一个实施方式中,固体培养基上生长的克隆可以用自动菌落挑选器挑选菌落,并且将微生物转移到微量培养板。每孔只有单个的菌落生长。
分散的微生物在微量反应板上长成克隆培养物。诱导剂、营养物等用自动液体分流系统按要求添加。这套系统也可用于添加检测目的蛋白的活性或特性所需要的试剂。例如,添加发光或荧光底物可用于分光光度检测或荧光检测酶的活性。微孔中培养物的低粘性和液面下生长的习性使试剂在培养物中扩散很快,大大地增加了分析的灵敏度和可靠性。氧和氮的扩散也得到了加强,保证了菌体的快速生长、外源蛋白表达和分泌的增加。某些分析方法,如闪烁亲近测定法,依赖于液体成分的扩散才能达到平衡状态;本发明中真菌的低粘性才能使高通量的检测成为可能。最后,对一个高度自动化系统,希望具有自动挑选菌落、供气、从微量反应板微孔中将目的克隆吸出的功能,而低粘性和在液面下生长习性才使这成为可能。就传统的丝状真菌培养物的粘性,尤其是培养物在微量培养板上长成搅不动、剪不开的一团的问题,使上述操作十分困难或者根本不可能。
在另一个实施方式中,单个细胞通过微量液体装置时,可就感兴趣的特性或活性进行光学检测(Wada等,WO99/67639)。低粘性对微量液体设备是必须的,本发明的培养物的低粘度就是为了适合微量液体操作。Short等在美国专利6,174,673中描述了如何利用荧光底物检测感兴趣的酶的活性,及如何利用宿主细胞表达的此活性来用荧光激活的细胞分选器分离细胞。本发明的方法和这种表达蛋白的鉴别方法是一致的。
本发明中,当转化子携带有荧光蛋白作为标记时,荧光可以定量,也可以作为基因表达或/和特定培养中表达蛋白的度量。在该实施方式中,即可以检测感兴趣的外源蛋白,也可以估计特定蛋白的活性,正如Blyna等在WO 00/78997中描述的那样。当本发明的筛选方法用作定向进化过程的一部分时,该实施方式将特别优选。
在较大粘性可以接受的情况下,培养真菌时用胶形成基质具有一定的优势,正如Bochner在美国6,046,021专利中描述的那样,在微量板上进行生化分析。
另一类筛选方法为光度测量分析,利用数字成像分光光度法,对生长在固体物质上的许多单个菌落进行筛选。参见Youvan等在1994,Meth.Enzymol.246732-748所述。在此方法中,特定试剂的总吸光值或发射光谱的变化代表了异源目的蛋白活性或性质的存在。本发明的变异真菌具有弱侧向生长趋势,在固体培养基上形成光滑的、致密且轮廓清晰的菌斑,对这种筛选系统有利。再者,和细菌相比,真菌的较好的表达和分泌特性可以提供较大数量的蛋白供光度分析。

发明者彼得·扬·蓬特, 科妮莉亚·范塞尔, 科尔内留斯·范登洪德 申请人:马克·阿龙·埃马尔法尔布
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1