编码黑曲霉信号识别颗粒的基因的制作方法

文档序号:449097阅读:364来源:国知局
专利名称:编码黑曲霉信号识别颗粒的基因的制作方法
技术领域
本发明涉及编码与真核细胞内蛋白转运有关的蛋白质的基因。更具体地讲,本发明涉及编码一种丝状真菌信号识别颗粒组分的基因。
已研究了原核细胞、酵母细胞和哺乳动物细胞中分泌性蛋白的途径。首先,必须将分泌性蛋白朝着其目标定向,其后,这种分泌性蛋白还必须能够通过靶细胞器膜。近年来,对于蛋白质的定向或从细胞质向内质网(ER)的转运已有很多了解。一级氨基酸序列上的一种分泌信号肽为该蛋白的分泌进行定向。分泌性蛋白向ER转运的过程始于细胞质里的核糖体。一旦信号肽合成并露出核糖体,就有一种胞质因子-即信号识别颗粒或SRP结合到该信号肽及核糖体上,导致翻译抑制。新生的肽/SRP/核糖体复合体可由ER膜中的一种SRP受体(SRP停靠蛋白)识别并与其结合;随后在需要GTP水解的步骤中所述信号肽离开SRP。然后,蛋白合成继续进行,而且新生的蛋白进入ER(Walter和Lingappa,Ann.Rev.Cell Biol.2499-516,1986;Simon,CurrentOpinion in Cell Biology 5581-588,1993)。
SRP是一种核糖核蛋白,它由一个RNA分子(7S RNA)和6种多肽组成,这6种多肽的分子量分别为9kDa、14kDa、19kDa、54kDa、68kDa和72kDa(Walter和Blobed,Nature 299691-698,1982;Siegel和Walter,J.Cell Biol.1001913-1921,1989)。已从高等真核生物(鼠类和犬类;Bernstein等,Nature 340482-486,1989;Romisch等,Nature 340478-482,1989)、酿酒酵母(Saccharomyces cerevisiae)和粟酒裂殖酵母(Schizosaccharomycespombe)(Hann等,J.Cell Biol.1093223-3230)、以及拟芥南(Arabidopsis thaliana)(Lindstrom等,Plant Molecular Biology 231265-1272,1993)克隆得到编码SRP的54kDa亚基的基因。对这些基因进行的分析表明,所述蛋白由两个功能域组成。通过新生分泌性肽链与SRP的精细分辨交联分析证实,该蛋白的C-末端那一半与所述信号肽结合(Kurzhchalia等,Natrue 320634-639,1986;Krieg等,Proc.Natl.Acad.Sci.838604-8606,1986)。该功能域被称为M-功能域,因为其具有高百分比的蛋氨酸残基。所述蛋白质的N-末端那一半被证实为GTP结合域,这是基于其氨基酸与共有GTP结合基序同源(Bernstein等,Nature,340482-486,1989;Romisch等,Nature 340478-482,1989)。
此前未对丝状真菌的SRP作过研究。现在,丝状真菌被普遍用作重组蛋白表达的宿主细胞,而且一直在寻求提高所感兴趣的蛋白的分泌水平的方法。分离编码分泌途径的决定性单元的基因,将有利于上述过程。为此,本发明提供了一种编码一种SRP亚基的基因,而且,还提供了一种提高异源蛋白在丝状真菌宿主细胞中的分泌水平的方法。
本发明涉及一种核酸结构,该结构带有一个编码一种丝状真菌信号识别肽(SRP)的一个因子的核酸序列。在一种优选实施方案中,所述因子为SRP亚基,最好是SRP54。在本文中,“核酸结构”是指cDNA、基因组DNA、合成DNA或RNA起点的任何核酸分子。“结构”一词是指一个核酸片段,它可以是单链或双链的,可以是从一个天然基因分离得到的全部或部分,或对其加以修饰,使其带有以自然界中所没有的形式组合和排列的核酸片段。所述结构可以有选择地带有其它核酸片段。在一种优选实施方案中,该结构带有一个编码曲霉属(Aspergillus)SRP54亚基的核酸序列。
本发明的结构可用于制备能用来提高所述亚基表达水平的新载体。然后可以将这种载体与一个编码一种感兴趣的蛋白的基因组合,用于转化宿主细胞,尤其是丝状真菌宿主细胞,以便表达感兴趣的蛋白。在带有编码感兴趣的蛋白的基因的宿主细胞中结合提高所述分泌性组分的产量,可以提高宿主细胞生产所述感兴趣的蛋白的产量。因此,本发明还提供了一种重组生产一种蛋白的方法,其中,在能诱导分泌性组分和感兴趣的蛋白表达的条件下培养一种丝状真菌宿主菌株,该菌株能比在相同条件下培养的野生型菌株产生更大数量的所述真核分泌途径的一种或几种组分。在一种优选实施方案中,所述组分是SRP54。


图1表示预计由两种SRP54 PCR产物编码的蛋白的序列。
图2表示黑曲霉(Aspergillus niger)Bol基因组克隆的核苷酸序列和预测的氨基酸序列。
图3表示黑曲霉SFAG2 cDNA克隆的核苷酸序列及预测的氨基酸序列。
为了分离曲霉属SRP54基因,设计4种互补于预先克隆的SRP54基因的保守序列的简并寡核苷酸引物,并将其用于与米曲霉(A.oryzae)基因组DNA的PCR反应中。与两个上述引物的组合的反应能得到若干反应产物。所述成功引物的一种有效扩增产物大约为500bp,这是预测的SRP54的大小。纯化该片段,并用作使用另一对引物的另一个PCR实验的模板,以便根据所公开的酵母氨基酸序列确定该片段对SRP54是否有特异性。得到了与预测的大小相当的390bp的产物。对500bp的产物进行亚克隆,并对5个亚克隆进行测弃。从其与预先分离的SRP54基因的同源性来看,两个亚克隆似乎编码曲霉属SRP54基因。不过,这些序列并不相同,暗示可能有两种SRP54基因(图1)。500bp产物与两个不同的曲霉菌种的基因组DNA的Southern杂交在每种消化产物中只显现一条带,表明要么只有一个基因,要么是两个基因紧密相连。
为了克隆所述基因组序列,用所述500bp的PCR产物筛选Bo-1黑曲霉λEMBL文库。对获自四种纯化的阳性文库的DNA进行限制酶作图;四者带有相同大小的BamHI、HindIII和SalI片段。对7.5kb的HindIII片段进行亚克隆和特征分析。发现SRP54探针的杂交局限于一个4.5kb的ClaI片段。发现该片段的开放读框有一个编码26个氨基酸N-末端的序列,所述26个氨基酸N-末端与酿酒酵母SRP54N-末端的同源性达67%。该基因组的完整序列如图2所示。
还分离了cDNA克隆。从一个黑曲霉SFAG2 cDNA文库中鉴定了一种全长拷贝的SRP54 cDNA。该cDNA的序列如图3所示;在DNA水平上,在相对于黑曲霉Bol SRP54基因的摆动位置上有若干碱基变化,使来自两种菌株的序列间的同源性为98%。靠近C-末端的插入在SFAG2上增加了两个甘氨酸残基。
黑曲霉SRP54蛋白是由两个78bp和1587bp的外显子编码,该外显子中有一个49bp的内含子。其氨基酸与酿酒酵母SRP54基因的总同源性为53%,不过,在GTP结合区的同源性为63%,而在M-域的同源性仅为43%。
本发明并不限于在图2和3中所披露的序列或其编码片段的应用。同一种的两个菌株的序列差异表明,同一种内的序列变异是允许的,并且可以用本文所述的技术很方便地鉴定这种变体。因此,当本文中提到“黑曲霉”时,应当理解为包括所有这类变异。另外,所分离的基因提供了一种从其它丝状真菌中分离同源基因的手段。所述其它丝状真菌包括其它的曲霉菌,如米曲霉、臭曲霉(A.foetidus)、日本曲霉(A.iaponicus)、棘孢曲霉(A.aculeatus)或构巢曲霉(A.nidulans)。其它非曲霉属丝状种包括镰孢菌,如禾本科镰孢(F.graminearum)、尖镰孢(F.oxysporum)、腐皮镰孢(F.solani)、大刀镰孢(F.culmorum)(或相应的远距离形态),粗糙脉孢菌(Neurosporacrassa)、Tichoderma reesei、绿色木霉(T.viridae)、T.harzianum、T.longibranchiatum、微紫青霉(Penicillium janthinellum)、特异青霉(P.notatum)、产黄青霉(P.chrysogenum)、沙门柏干酪青霉(P.camemberiti)、娄地青霉(P.roqueforti),中底腐质霉(Humicolainsolen)、灰腐质霉(H.grisea,thermoidea变种)、疏棉状毛腐质霉(H.lanuginosa),嗜热小柱孢菌(Scytalidium thermophilum),嗜热毁丝霉(Myceliophthora thermophila),和陆生梭孢壳(Thielaviaterrestris)。上述基因,即500bp的片段,或以该基因为基础的一个寡核苷酸可以用作Southern杂交的探针,用于分离上述其它种的同源基因。具体地讲,可以按照标准Southern印迹方法,在低至高严格条件下(例如,在42℃温度下在5XSSPE、0.3%SDS、200μg/ml剪切并变性的鲑精DNA中进行预杂交和杂交,在高、中、低三种严格条件下分别有50、35或25%的甲酰胺)与感兴趣的种的基因组或cDNA杂交,以便鉴定并分离其中的SRP54基因。由本文所提及的简并探针与来自一种丝状真菌的基因组DNA或第一链cDNA进行的PCR反应也能产生一种SRP54特异性产物,该产物又可以被用作克隆相应的基因组或cDNA的探针。在一种优选实施方案中,所述同源基因编码一种与图2和3所示氨基酸序列至少约有60%的同源性的蛋白质,这些同源性至少为70%更好,至少为80%最好。
本发明的基因可用于提高感兴趣的蛋白在宿主细胞中的重组表达,因为该基因可以优化真核宿主细胞的分泌途径。在一种特定实施方案中,SRP的量是这样提高的形成一种含有SRP基因或其亚基的一个或几个拷贝、以及编码感兴趣的蛋白质的基因的宿主细胞;并在能诱导所述基因表达的条件下培养该宿主细胞,使所述感兴趣的蛋白的产量相对于SRP拷贝数未增加的宿主细胞有所提高。上述目的可以用一个与所述宿主细胞同源或异源的SRP实现。可通过用一个表达结构转化一个菌株一次或几次的方式增加拷贝数。或者,通过完整细胞诱变的方法增加拷贝数。SRP54蛋白产量的提高可以通过使SRP54基因受一个强启动子控制的方式实现,该启动子可以是组成型的或是调节型的。这种启动子的例子之一是葡糖淀粉酶启动子。
上述方法也可用于通过提高所述分泌机构的其它组分表达的方式提高产量。例如,可以利用所述丝状真菌信号识别颗粒中的任一个或所有亚基的组合实现所述提高。通过生产抗SRP54亚基蛋白的多克隆或单克隆抗体,可以实现分离和鉴定其它真菌亚基,所述抗体反过来又可用于沉淀来自细胞材料的所述信号识别颗粒复合体。所述材料构成了对所述复合体中的其它亚基进行鉴定和克隆的基础。除上述信号识别颗粒外,诸如ER膜的蛋白质传导通道(Bio Essays 14535-540)、ER停靠蛋白或受体、BiP蛋白(Nature 35535-45)、Sec系列基因(如Sec-14、Sec-59、See-61、Sec-62和Sec-63)和信号肽酶之类的组分也可超量表达。而且,上述蛋白的突变序列也可用于蛋白的超量表达,其中,所述突变体可具有高于野生型蛋白的活性(Perez-Perez等,Bio/Technology 12178-180,1994)。
带有本发明结构的宿主细胞特别适用于异源蛋白的表达。优选的宿主细胞为丝状真菌,如上文所列举的种。在一种优选实施方案中,所述宿主细胞为曲霉属的一员。不过,也可将采用一种类似的分泌机理的任何真核宿主细胞用于上述目的。其它可以用的细胞包括酵母细胞,昆虫细胞和哺乳动物细胞。本文中“异源蛋白”是指一种并非所述宿主细胞所固有的蛋白,一种已改变其天然序列的修饰过的天然蛋白,或是其表达量已改变的一种天然蛋白,这种改变是通过重组DNA技术操作宿主细胞的结果。该术语还包括那些其在宿主细胞中的表达涉及并非该宿主细胞所固有的遗传因子的使用的蛋白,或涉及使用已对其进行过操作使其以不同于宿主细胞的正常方式起作用的固有因子的蛋白。
本发明的宿主细胞可用于通过人工识别方法进行重组蛋白生产。正如感兴趣的蛋白那样,可以用一种表达载体表达活性形式的所述SRP54基因、SRP亚基、或其它分泌性组分。一种可用的表达载体带有一个能使该载体稳定整合在宿主细胞基因组上或能使该载体在宿主细胞中独立于该宿主细胞的基因组进行自主复制的因子,而且,最好带有一个或几个表型标记,该标记可方便转化宿主细胞的选择。所述表达载体还可以包括编码一种启动子的控制序列、核糖体结合位点、翻译起始信号,以及有选择地包括一个抑制基因或各种激活基因。为了使感兴趣的蛋白能够分泌,可将编码一种信号序列的核苷酸插在该基因的编码序列前面。为了按控制序列的方向进行表达,将本发明要用的基因可操作地以正确读框连接于所述控制序列上。
所述表达载体可以是任何便于进行重组DNA操作的载体,载体的选择通常取决于载体有待导入其中的宿主细胞。在本发明的一种优选实施方案中,宿主细胞是曲霉属的菌株。因此,载体可以是自主复制的载体,即作为染色体外实体存在的载体,其复制独立于染色体复制,例如质粒,或染色体外因子、微型染色体或人工染色体。另外,所述载体也可以是当被导入宿主细胞时能整合到宿主细胞基因组上并与其所整合的染色体一起复制的载体。
在所述载体上,编码感兴趣的蛋白的基因应当可操作地同一个合适的启动子序列连接。该启动子可以是任何在所选择的宿主细胞中具有转录活性的DNA序列,它可以来自编码与宿主细胞同源或异源的蛋白的基因。对于真菌宿主中的转录来说,可用启动子的例子为来自以下基因的启动子编码米曲霉TAKA淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳α-淀粉酶、黑曲霉或泡盛曲霉(A.awamori)葡糖淀粉酶(glaA)、Rhizomucor miehei脂肪酶,米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶或构巢曲霉乙酰胺酶的基因。优选TAKA-淀粉酶和glaA启动子。
本发明的表达载体还可以包括一个合适的转录终止子,而在真核细胞中,有一个聚腺苷酸序列可操作地同编码感兴趣的蛋白的DNA序列连接。终止序列和聚腺苷酸序列可与启动子为同一来源。所述载体还可以包括一个使该载体在相关的宿主细胞中复制的DNA序列。
所述载体还可以包括一个选择标记,例如,一个其产物能弥补宿主细胞的某种缺陷的基因,或一个能产生抗生素抗性的基因,如氨苄青霉素抗性,卡那霉素抗性、氯霉素或四环素抗性。曲霉属选择标记的例子包括amdS、pyrG、argB、niaD、sC和hygB-一种能产生潮霉素抗性的基因。用于曲霉属宿主细胞的优选标记为构巢曲霉或米曲霉的amdS和pyrG标记。另外,可以通过共转化进行选择,如在WO91/17243中所述。
通常,希望感兴趣的蛋白的表达能产生一种胞外产物。因此,所述感兴趣的蛋白包括一个使表达的蛋白能够分泌到培养基中的前导区(Preregion)。如果必要,该前导区可以是本发明蛋白所固有的,或是被另一个不同的前导区或信号序列所置换,这种置换可通过置换编码相应前导区的DNA序列而方便地实现。例如,该前导区可来自曲霉菌的葡糖淀粉酶或淀粉酶基因,来自芽胞杆菌的淀粉酶基因、来自Rhizomucormiehei的脂肪酶或蛋白酶基因、来自酿酒酵母编码α-因子的基因或小牛前凝乳酶原(preprochymosin)基因。当宿主为真菌细胞时,特别推荐使用米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、来自芽胞杆菌NCIB11837的生麦淀粉酶、嗜热脂肪芽胞杆菌(B.stearothermophilus)α-淀粉酶或地衣型芽胞杆菌枯草蛋白酶的前导区。有效的信号序列为米曲霉TAKA淀粉酶信号、Rhizomucor miehei天冬氨酸蛋白酶信号和Rhizomucor miehei脂肪酶信号。
用于分别连接本发明的DNA结构、启动子、终止子和其它因子的方法,以及将连接后的产物插入带有复制所需的必要信息的合适载体的方法为本领域技术人员所熟知(见Sambrook等,Molecular Cloning,1989)。
包括增强分泌性组分的宿主细胞可用于表达任何感兴趣的原核或真核蛋白,最好用于表达真核蛋白。这种细胞特别适合于表达真菌酶,如过氧化氢酶、漆酶、酚氧化酶、氧化酶、氧化还原酶、纤维素酶、木聚糖酶、过氧化物酶、脂肪酶、水解酶、酯酶、角质酶、蛋白酶及其它蛋白酶、氨肽酶、羧肽酶、植酸酶、裂合酶、果胶酶及其它溶果胶酶、淀粉酶、葡糖淀粉酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡糖苷酶、β-葡糖苷酸、甘露糖苷酶、异构酶、转化酶、转移酶、核糖核酸酶、壳多糖酶和脱氧核糖核酸酶。本领域技术人员可以理解,“真菌酶”一词不仅包括天然真菌酶,而且还包括通过氨基酸取代、缺失、增加进行过修饰或进行过其它修饰的真菌酶,所述修饰可以提高其活性、热稳定性、pH耐力等。所述宿主细胞还可用于表达可以药用的异源蛋白,如激素、生长因子、受体等。
将通过以下非限定性实施例对本发明作进一步说明。
实施例I.材料和方法菌株在下述实验中使用了如下菌株大肠杆菌(Escherichiacoli)K802(el4-(mrcA)、mrcB、hsdR2、galK2、GalT22、supE44、metB1),大肠杆菌SOLR(el4-(mrcA)、D(mrcCB-hsdSMR-mrr)171、sbcC、recB、recJ、uvrC、umuC∷Tn5(kanr)、lac、gyrA96、relA1、thi-1、endA1、1R〔F′proAB lac IqZDM15〕Su-,大肠杆菌JM101 supE、thi-1、Δ(lac-proAB)、〔F′traD36、proAB、lacIQZDM15〕,大肠杆菌XL-1 Blue recA1、endA1、gyrA96、thi-1、hsdR17、supE44、relA1、lac、〔F′proAB、lacqZDM15、Tn10(tetr)〕、黑曲霉ATCC1040、黑曲霉Bol、黑曲霉SFAG、米曲霉HowB104。
SRP54的PCR扩增在以下条件下对来自米曲霉基因组DNA的SRP54基因片段进行扩增0.4单位Taq聚合酶、1μmole DNA引物、100ng DNA模板、各200μmole的dATP、dCTP、dGTP、TTP,在1X缓冲液(Boehringer Mannheim,Indianapolis,IN)中进行。在一台Ericomp PCR机上进行扩增反应,在94℃/5分钟条件下进行1轮反应,在94℃/1分钟、50℃/1分钟、72℃/1分钟条件下进行30轮反应。
引物A(93-840)CARGGNWSSGGKAARACNAC引物B(93-843)TTYGAYCARYTSAARCARAA引物C(93-842)TTYTGYTTSARYTGRTCRAA引物D(93-837)TTYTCSCCNGTSCCDARTAA在上述引物中,S表示肌苷,Y表示脱氧核糖核苷酸C或T,R表示核苷酸A或G,D表示核苷酸A、G或T,N表示脱氧核糖核苷酸G、A、T或C。
亚克隆PCR产物用TA克隆试剂盒(Invitrogen,San Diego,CA),按照生产商推荐的方案亚克隆PCR产物,以便测序。
λ文库用一种Pharmacia cDNA试剂盒制备黑曲霉SFAG2 mRNA的cDNA文库。该文库共含有830,000个噬菌体,其中重组噬菌体约为700,000个(84%)。按照Stratagene(La Jolla,CA)提供的方案从该SRP54λZap克隆中拯救Bluescript质粒。
通过以下方式制备黑曲霉Bol基因组文库用Sau 3A部分消化Bol基因组DNA,并分离大于10kb的DNA片段。将这些DNA片段连接到Bam HI消化的λEMBL4臂(Clontech,Palo Alto,CA)上。按照标准方法对该文库进行扩增。
DNA测序用Taq聚合酶循环测序法,用荧光标记的双脱氧核苷酸测定核苷酸的序列。测序反应物在一台Applied Biosystems自动DNA测序仪(Model 373A,1.2.0版)上进行电泳。除了SRP54特异性引物外,还采用了M13反向(-48)和M13(-20)正向引物(Sanger等,J.Mol.Biol.143163-178)。
II.结果和讨论将基于存在于已知SRP54基因上的3个保守区的4组简并寡核苷酸用于PCR实验,以米曲霉HowB104基因组DNA为模板。与组合的引物A和D进行的反应能产生几种反应产物。其它引物的组合不能产生任何产物。实验中,采用引物A和D的实验中的主要扩增产物大约为500bp,所预测的大小与已知SRP54序列一致。进一步纯化500bp的扩增片段,并将其用作第二轮PCR反应的模板,在该反应中使用引物C和D,以证实其对SRP54基因有专一性。在该反应中合成了单一的390bp产物,相当于预测的大小。用TA克隆试剂盒,将用引物A和D合成的500bp产物亚克隆。用M13反向引物和MB引物对5个亚克隆进行DNA测序。基于与先前克隆的SRP54基因的同源性,其中的2个克隆似乎编码SRP54(与酿酒酵母SRP54的同源性为71%)。然而,这两个亚克隆的序列并不相同,因此,有可能是两个SRP54基因。
为了测定曲霉属中的SRP54基因数,用所述500bp的PCR产物库探测来自黑曲霉ATCC1040和米曲霉HowB104的基因组DNA Southern印迹。杂交条件为5×SSPE,0.3%SDS,200μg/ml剪切鲑精DNA,以及50%、35%或25%甲酰胺,温度42℃,洗涤在42℃温度下进行,在2×SSC中15分钟;在1×SSC,0.1%SDS中15分钟;在0.5×SSC,0.1%SDS中15分钟。每种消化物中仅有一条带与SRP54探针杂交;因此,得到的结论是米曲霉和黑曲霉含有单拷贝SRP54基因。不过,不能排除是两个紧密连接的基因的可能。对上述序列差异的另一种解释是,在PCR扩增反应中由Taq DNA聚合酶引入了核苷酸错误。
为了克隆SRP54的基因组序列,以所述500bp的SRP54 PCR产物库为探针筛选黑曲霉BolλEMBL4文库(26,500个重组体)。检测了30,000以上的噬菌斑,并分离出6个阳性噬菌斑。纯化以后,将5个原始阳性克隆继续用SRP54探针杂交。通过Southern印迹对其作进一步分析,其中有4个克隆带有能与所述探针杂交的相同大小的BamHI、HindIII和SalI片段。对所有克隆都有的7.5kb HindIII片段进行亚克隆(pDSY16),并作进一步鉴定。SRP54探针与pDSY16的杂交定位于4.5kb的ClaI片段。对该片段的DNA测序表明,有一个开放读框始于ClaI位点之一的150bp。该开放读框编码一种26个氨基酸的肽,该肽与酿酒酵母SRP54蛋白N-末端的同源性为67%,从而证实其为黑曲霉SRP54同系物。测定了Bol SRP54基因的编码链和非编码链的完整DNA序列,该序列如图1所示。所述蛋白由两个分别为78和1587bp的外显子编码,两个外显子由一个49bp的内含子分开。该蛋白与来源于酿酒酵母的SRP54蛋白的氨基酸同源性为53%。当仅将其GTP结合域(氨基酸1-277)与酿酒酵母的相应结合域比较时,同源性提高到60%。相反,富含蛋氨酸的M-域(氨基酸278-533)与酿酒酵母的相应部位的同源性仅为43%。不过,两种M-域的蛋氨酸含量有11%是保守的(酿酒酵母有29个残基,而在黑曲霉中有30个残基)。
为了分离编码SRP54的黑曲霉cDNA克隆,用米曲霉500bp PCR片段库对建立于λZap II中的黑曲霉SFAG2 cDNA文库进行探测,所用的杂交条件如上文所述。筛选了42,000个以上的噬菌斑,并鉴定了5个阳性噬菌斑。纯化以后,4个克隆继续与上述探针杂交。从这些克隆中的两个分离质粒DNA,并通过DNA测序进行特征分析(对这4个克隆不再作进一步分析)。第一个被称为pShTh24的克隆编码曲霉属SRP54的全长拷贝。第二个克隆ShTh6.2编码始于SRP54的氨基酸残基230的一个不完整cDNA。对pShTh24的SRP54开放读框的编码链和非编码链的全DNA序列进行测定,结果如图2所示。在DNA水平上,SFAG2SRP54在其摆动位置有几个碱基变化,使得该DNA序列与Bol SRP54DNA序列的同源性为98%。由于在SFAG2 SRP54编码序列的C-末端附近插入了6bp,从而又增加了2个甘氨酸残基。
用载体pTOC68构建一个SRP54表达结构,方法是将所述基因置于TAKA启动子和AMG终止子的控制之下。首先,通过在以下PCR引物(94-648)的末端增加一个Bam HI位点的方式使一个Bam HI限制位点就位于SFAG2编码序列的上游处TAG GAT CCC CAA TGGTCC TTC AGG ATC TCGG。将该引物与第二个引物(94-678)结合使用,第二个引物与ATG起始密码下游的碱基448-467同源,第二个引物的序列为TTG GCT TTG GTG GCA TTC TG。在以下条件下进行PCR反应100ng pShTh24(一种在Bluescrip载体上的cDNA克隆),1μmole DNA引物,各为200mmole的dATP、dCTP、dGTP、TTP,0.4μTaq DNA聚合酶,将各种成分混合于1×Taq缓冲液(Boehringer Mannheim,Indianapolis,IN)中,并扩增30轮94℃/1分钟,58℃/1分钟,72℃/1分钟。纯化PCR产物,并用BamHI、AatI消化,然后在标准条件下与用BamHI、xhoI消化过的pTOC68和pShTh24 AatI、XhoI纯化的2kb片段连接。然后用XhoI对所得到的质粒ShTh29进行彻底消化,接着再用SfuI进行部分消化。将6.2kb的片段从其它片段中凝胶分离出来,并用T4 DNA聚合酶Klenow片段处理。然后使反应产物进行自身连接,并转化到DH5α感受态细胞中。所得到的质粒被命名为pShTh29Δ。
将该表达质粒用于转化事先为提高漆酶的表达水平而用pDSY10转化过的曲霉属菌株。漆酶质粒pDSY10带有完整长度的漆酶cDNA基因,包括来自Polyporus pinsitus的信号序列及一个TAKA启动子和AMG终止子。另一种质粒带有一个选择标记,amdS或pyrG,该质粒也被用于转化。
为了进行转化,用100μl待转化菌株的分生孢子悬浮液接种500mlYEG+1M蔗糖培养基,并在37℃下温育过夜。除去材料中的培养基,加入500μl OM(1.2M MgSO4,10mMNaPO4缓冲液,pH5.8)+Novozym5mg/ml和BSA 1mg/ml)。用移液管吸、放几次所述混合物,以破碎真菌材料。将培养皿放入34℃的摇床上培养,转速设定为90rpm。在大约1小时内完成原生质体的制备。将该原生质体混合物放入微量离心管中,加入1ml STC并混合。在一台离心机上以6000rpm的速度将该混合物离心8分钟。倾出上清液,加入1ml STC(0.8M山梨醇,50mM Tris pH8, 50mMCaCl2)并混合。混合物以3000rpm速度离心5分钟,接着重复以上过程。收集原生质体,并将其再悬浮于STC中,使其浓度为2-5×107原生质体/ml。
将100μl原生质体悬浮液与溶解在10μl STC中的5-10μg合适DNA混合。加入1ml PTC(40%PEG 4000,50mM Tris pH8,50mMCaCl2)并充分混合。混合物在室温下温育20分钟。然后将原生质体展布在含有适于转化中所用选择标记的适宜培养基的琼脂培养皿上。
首先筛选转化体的高漆酶产量。是这样做的将转化体展布在ABTS琼脂培养皿(1%葡萄糖,1μmABTS,溶于曲霉属极限培养基中)上,观察与未转化的亲本株相比绿色晕圈大小的增加。通过ABTS测试测具有较大晕圈的转化体的漆酶产量(在100mM乙酸缓冲液(pH5.0)中,用1mM ABTS对1ml液体样品进行测试,测试时间为1分钟。记录测试结果,即在418nm波长下每分钟每毫升的光吸收变化)。分离漆酶产量最大的4个转化体的DNA,用EcoRI消化,并通过用SRP54和OliC编码序列探测的方式进行Southern分析。通过比较由SRP54探针与SRP54杂交所产生的信号和由OliC探针与OliC(曲霉属的单拷贝基因)杂交所产生的信号进行定量分析,揭示出每个转化体中SRP54的基因拷贝数。
生物材料的保藏按照布达佩斯条约的规定已将下列生物材料交由the AgriculturalResearch Service Patent Culture Collection,Northern RegionalResearch Center(1815 University Street,Peoria,Illinois,61604)保藏,并取得以下保藏号细胞系保藏号含有pShTh24的大肠杆菌(EMCC#0121)NRRL B-21327序列表(1)一般信息(i)申请人(A)名称Novo Nordisk Biotech,Inc.
(B)街道1445 Drew Avenue(C)市Davis(D)州California(E)国家US(F)邮编95616-4880(G)电话(916)757-8100(H)传真(916)758-0317(ii)发明名称编码黑曲霉信号识别颗粒的基因(iii)序列数4(iv)相关地址(A)收件人Novo Nordisk of North America,Inc.
(B)街道405 Lexington Avenue,Suite 6400(C)市New York(D)州New York(E)国家U.S.A.
(F)邮编10174-6401(v)计算机可读形式(A)介质类型软盘(B)计算机IBM PC兼容(C)操作系统PC-DOS/MS-DOS(D)软件Patent In Release#1.0,Version#1.25(EPO)(vi)本申请的数据(A)申请号(B)申请日02-10-1995(vii)优先申请资料
(A)申请号US 08/317,401(B)申请日03-10-1994(viii)律师/代理人信息(A)姓名Lowney,Karen A.
(B)注册号31,274(C)文件/档案号4248.204-WO(ix)电信信息(A)电话212 867 0123(B)传真212 867 0298(2)SEQ ID NO1的信息(i)序列特征(A)长度2877bp(B)类型核酸(C)链型双链(D)拓扑结构线性(ii)分子类型DNA(基因组)(vi)来源(A)生物黑曲霉(Aspergillus niger)(xi)序列表述SEQ ID NO1(ix)特征(A)名称/键CDS(B)位置join(126..203,253..1776)(xi)序列表述SEQ ID NO1ATCCTCCATT CGCTCTCTCC TGTCCTCTCT GCCACCTTTC ACGATTTCTG GCAGNAAGTG 60ACGCATATTT TAATCTGTAC ATGCTTTAAT TTGATTTACC TCCTTTCGAC AAGAACTCCC 120CCGCC ATG GTC CTT CAG GAT CTC GGG CGG CGA ATC AAC GCC GCC GTC AAT 170Met Val Leu Gln Asp Leu Gly Arg Arg Ile Asn Ala Ala Val Asn1 5 10 15GAC CTG ACT CGC TCT AAC AAT TTG GAC GAG AAG GTGAGGATCA GCACTTTTCT 223Asp Leu Thr Arg Ser Asn Asn Leu Asp Glu Lys20 25CTCTGTCTGA TGTATGTACT GACTGTTAG CAG GCC TTT GAT GAC ATG ATC AAA 276Gln Ala Phe Asp Asp Met Ile Lys30GAG ATC TGC GCC GCC TTG CTG TCC GCC GAC GTC AAC GTC CGC CTG GTC 324Glu Ile Cys Ala Ala Leu Leu Ser Ala Asp Val Asn Val Arg Leu Val35 40 45 50CAG TCC CTC CGC AAA TCC ATC AAG TCC AGC GTC AAC TTT GCC TCT CTT 372Gln Ser Leu Arg Lys Ser Ile Lys Ser Ser Val Asn Phe Ala Ser Leu55 60 65CCT CCC GCC GTG AAC AAG AAG CGT TTG ATT CAG AAG GCC GTC TTC GAT 420Pro Pro Ala Val Asn Lys Lys Arg Leu Ile Gln Lys Ala Val Phe Asp70 75 80GAG CTG GTT TCC CTG GTT GAT CCC CAT GCG GAG CCA TTC CGT CCC AAG 468Glu Leu Val Ser Leu Val Asp Pro His Ala Glu Pro Phe Arg Pro Lys85 90 95AAG GGC CGC TCC AAC GTG ATC ATG TTC GTC GGT CTA CAG GGT GCC GGT 516Lys Gly Arg Ser Asn Val Ile Met Phe Val Gly Leu Gln Gly Ala Gly100 105 110AAA ACC ACC ACC TGT ACC AAG CTG GCC CGC CAC TAT CAG ATG CGC GGC 564Lys Thr Thr Thr Cys Thr Lys Leu Ala Arg His Tyr Gln Met Arg Gly115 120 125 130TTC AAG ACC GCC CTC GTC TGT GCC GAT ACC TTC CGA GCT GGT GCT TTC 612Phe Lys Thr Ala Leu Val Cys Ala Asp Thr Phe Arg Ala Gly Ala Phe135 140 145GAC CAG CTG AAA CAG AAT GCC ACC AAG GCC AAG ATC CCC TAC TAC GGT 660Asp Gln Leu Lys Gln Asn Ala Thr Lys Ala Lys Ile Pro Tyr Tyr Gly150 155 160AGC CTG ACG CAA ACC GAC CCC GCC ATC GTG GCA GCC GAG GGT GTG GCC 708Ser Leu Thr Gln Thr Asp Pro Ala Ile Val Ala Ala Glu Gly Val Ala165 170 175AAG TTC AAG AAG GAG CGT TTC GAA ATC ATC ATT GTC GAT ACC AGT GGT 756Lys Phe Lys Lys Glu Arg Phe Glu Ile Ile Ile Val Asp Thr Ser Gly180 185 190CGT CAT AAG CAG GAA GAA GAG CTC TTC ACC GAA ATG ACC CAG ATT CAG 804Arg His Lys Gln Glu Glu Glu Leu Phe Thr Glu Met Thr Gln Ile Gln195 200 205 210ACC GCC GTC ACC CCC GAC CAG ACC ATC CTC GTC CTC GAC AGC ACC ATC 852Thr Ala Val Thr Pro Asp Gln Thr Ile Leu Val Leu Asp Ser Thr Ile215 220 225GGT CAG GCT GCC GAA GCC CAG TCC TCC GCC TTC AAG GCC ACC GCA GAC900Gly Gln Ala Ala Glu Ala Gln Ser Ser Ala Phe Lys Ala Thr Ala Asp230 235 240TTC GGA GCC ATC ATC ATC ACC AAG ACG GAT GGT CAC GCC GCA GGT GGT948Phe Gly Ala Ile Ile Ile Thr Lys Thr Asp Gly His Ala Ala Gly Gly245 250 255GGT GCT ATT TCC GCC GTC GCC GCC ACA CAC ACT CCC ATT ATC TAC CTC996Gly Ala Ile Ser Ala Val Ala Ala Thr His Thr Pro Ile Ile Tyr Leu260 265 270GGT ACC GGT GAG CAC TTG ATG GAC CTG GAA CGT TTC GAG CCC AAG GCC 1044Gly Thr Gly Glu His Leu Met Asp Leu Glu Arg Phe Glu Pro Lys Ala275 280 285 290TTC ATC CAG AAG CTC CTG GGT ATG GGT GAT ATG GCC GGA CTG GTA GAG 1092Phe Ile Gln Lys Leu Leu Gly Met Gly Asp Met Ala Gly Leu Val Glu295 300 305CAC GTA CAA GCC GTG ACC AAG GAC TCG GCC TCC GCC AAG GAA ACA TAC 1140His Val Gln Ala Val Thr Lys Asp Ser Ala Ser Ala Lys Glu Thr Tyr310 315 320AAG CAC ATC TCA GAA GGT ATC TAC ACG CTG CGC GAC TTC CGC GAG AAC 1188Lys His Ile Ser Glu Gly Ile Tyr Thr Leu Arg Asp Phe Arg Glu Asn325 330 335ATC ACC TCC ATC ATG AAG ATG GGT CCT CTC TCC AAG CTC TCC GGC ATG 1236Ile Thr Ser Ile Met Lys Met Gly Pro Leu Ser Lys Leu Ser Gly Met340 345 350ATT CCC GGT CTC TCC AAC CTG ACC GCG GGA CTT GAT GAC GAA GAC GGC 1284Ile Pro Gly Leu Ser Asn Leu Thr Ala Gly Leu Asp Asp Glu Asp Gly355 360 365 370TCC ATG AAG CTC CGC CGC ATG ATC TAC ATT TTC GAC AGC ATG ACG GCC 1332Ser Met Lys Leu Arg Arg Met Ile Tyr Ile Phe Asp Ser Met Thr Ala375 380 385GCC GAA CTC GAC GGC GAC GGC AAG ATG TTC GTC GAA CAG CCT AGC CGC 1380Ala Glu Leu Asp Gly Asp Gly Lys Met Phe Val Glu Gln Pro Ser Arg390 395 400ATG GTC CGG ATC GCT TGC GGA AGC GGT ACC ACC GTC CGC GAA GTC GAA 1428Met Val Arg Ile Ala Cys Gly Ser Gly Thr Thr Val Arg Glu Val Glu405 410 415GAC CTG CTC TCC CAG CAC CGC ATG ATG GCT GGT ATG GCC AAG CGC GTC 1476Asp Leu Leu Ser Gln His Arg Met Met Ala Gly Met Ala Lys Arg Val420 425 430GGC GGA CAG AAG AAG CAG ATG CAG CGT GCC CAG AAC ATG CTC AAG GGC 1524Gly Gly Gln Lys Lys Gln Met Gln Arg Ala Gln Asn Met Leu Lys Gly435 440 445 450GGT AAC AAG GAA CAG CAG CTC GCC GCC ATG CAG AAG CGC ATG GCC GCC 1572Gly Asn Lys Glu Gln Gln Leu Ala Ala Met Gln Lys Arg Met Ala Ala455 460 465ATG GGT GGT GCT GGC GGT GGT GGA TTC CCC GGT ATG CCC GGC ATG GGC 1620Met Gly Gly Ala Gly Gly Gly Gly Phe Pro Gly Met Pro Gly Met Gly470 475 480GAC ATG GCC AAG ATG ATG CAA ATG CTG CAA GGT CAA GGA GGT GGC GGC 1668Asp Met Ala Lys Met Met Gln Met Leu Gln Gly Gln Gly Gly Gly Gly
485 490 495GGT GGT GGT CTT CCC GGC CTG GGT GGG ATG GAC CTA CAA AGT ATG ATG 1716Gly Gly Gly Leu Pro Gly Leu Gly Gly Met Asp Leu Gln Ser Met Met500 505 510AGC CAG ATG AGT GGA TTG ATG GGC GGT GGC GGT GGT GGT GGT GGC CGC 1764Ser Gln Met Ser Gly Leu Met Gly Gly Gly Gly Gly Gly Gly Gly Arg515 520 525 530GGT AGA GGA CGG TGATTGTGAT GATGACGATG ATGCACGCAT TCTGAAATTC 1816Gly Arg Gly ArgCTTCTTGACT TTTGATTTCG CGTTGTTACC ATTCCATGAT TATATTCTAC ACCTGTGCTC1876CGTCTCTTTT TTACGTTTGA TTCTTAAGAG ACTGGGATAT ATGGCCTTGC TTCAGTTCAG1936TCATCATTCA CCTCATTCGT CGATTGTAAC TAGCATATGA TGGCKKWTGG GCGTKACTTT1996GATTTTACTT GTKGYYTATC TTTTTTCTTY CTSGMTAATA TCYGACTGGC CCTSTGGGGM2056ATCAAATYTA TGCTATSRAA GCTCAKYRSC CGCRAWYTTC GCCAGGTSMK ATACTAAGTA2116TWRRMCAWSK GRAAATATAT CTACAGAWYS TMGGKTGACK GKYAGSCTGC CAGWYACMWT2176GGAGCTWACT ACTAAKAGCC STCGGACAGG TCATGACGAG TTTTCGTTGT TAATCGGGGC2236TTATTGGCTT GATTTGGCGC CGTGTGTTTG GCGCCTGTCT ATCTACTTCC TTTCCGCTGC2296TGCCTTGGCC GCGCATTCTC GAGATCAAGA TCGCTACAGG AAAGGCGCTG AGCACCACAC2356GCCACGATGG GTTCCGCAAC TAACTTTGCC AAAACCATCA TCATCCCCGC CGTGGATCTC2416CCTGAGCGCT TCWWAMTCCT GTTCTCCTTM STGATCATNC CACCCGTAAG ATGCTTTTCC2476TGTGACTGGT GAGTASTCAA CCCAGTCATT CTGAGAATAG TGTATGCGGC GACCGAGTTG2536CTCTTGCCCG NCGTCAATAC GGGATAATAC CCGCGCCACA TAGCAGAACT TTAAAAGTGC2596TCATCATTGG AAAACGTTCT TCGGGGCGRA AACTCTCAAG GATCTTACCG CTGTTGAGAT2656CCAGTTCGAT GTAACCCACT CGTGCACCCA ACTGATCTTC AGCATCTTTT ACTTTCACCA2716GCGTTTCTGG GTGASCAMAA ACAGGAAGSC AAAATSCCSC AMAAAAGGGA ATAAGGGCGA2776CACGGAAATG TTGAATACTC ATACTCTTCC TTTTTCAATA TTATTGAAGC ATTTATCAGG2836GTTATTGTCT CATCCCGTAA AACGACGGCC AGTGAGCGCG C2877(2)SEQ ID NO2的信息(i)序列特征(A)长度534个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ii)分子类型蛋白质(vi)来源(A)生物黑曲霉(xi)序列表述SEQ ID NO2Met Val Leu Gln Asp Leu Gly Arg Arg Ile Asn Ala Ala Val Asn Asp1 5 10 15Leu Thr Arg Ser Asn Asn Leu Asp Glu Lys Gln Ala Phe Asp Asp Met20 25 30Ile Lys Glu Ile Cys Ala Ala Leu Leu Ser Ala Asp Val Asn Val Arg35 40 45Leu Val Gln Ser Leu Arg Lys Ser Ile Lys Ser Ser Val Asn Phe Ala50 55 60Ser Leu Pro Pro Ala Val Asn Lys Lys Arg Leu Ile Gln Lys Ala Val65 70 75 80Phe Asp Glu Leu Val Ser Leu Val Asp Pro His Ala Glu Pro Phe Arg85 90 95Pro Lys Lys Gly Arg Ser Asn Val Ile Met Phe Val Gly Leu Gln Gly100 105 110Ala Gly Lys Thr Thr Thr Cys Thr Lys Leu Ala Arg His Tyr Gln Met115 120 125Arg Gly Phe Lys Thr Ala Leu Val Cys Ala Asp Thr Phe Arg Ala Gly130 135 140Ala Phe Asp Gln Leu Lys Gln Asn Ala Thr Lys Ala Lys Ile Pro Tyr145 150 155 160Tyr Gly Ser Leu Thr Gln Thr Asp Pro Ala Ile Val Ala Ala Glu Gly165 170 175Val Ala Lys Phe Lys Lys Glu Arg Phe Glu Ile Ile Ile Val Asp Thr180 185 190Ser Gly Arg His Lys Gln Glu Glu Glu Leu Phe Thr Glu Met Thr Gln195 200 205Ile Gln Thr Ala Val Thr Pro Asp Gln Thr Ile Leu Val Leu Asp Ser210 215 220Thr Ile Gly Gln Ala Ala Glu Ala Gln Ser Ser Ala Phe Lys Ala Thr225 230 235 240Ala Asp Phe Gly Ala Ile Ile Ile Thr Lys Thr Asp Gly His Ala Ala245 250 255Gly Gly Gly Ala Ile Ser Ala Val Ala Ala Thr His Thr Pro Ile Ile260 265 270Tyr Leu Gly Thr Gly Glu His Leu Met Asp Leu Glu Arg Phe Glu Pro275 280 285Lys Ala Phe Ile Gln Lys Leu Leu Gly Met Gly Asp Met Ala Gly Leu290 295 300Val Glu His Val Gln Ala Val Thr Lys Asp Ser Ala Ser Ala Lys Glu305 310 315 320Thr Tyr Lys His Ile Ser Glu Gly Ile Tyr Thr Leu Arg Asp Phe Arg325 330 335Glu Asn Ile Thr Ser Ile Met Lys Met Gly Pro Leu Ser Lys Leu Ser340 345 350Gly Met Ile Pro Gly Leu Ser Asn Leu Thr Ala Gly Leu Asp Asp Glu355 360 365Asp Gly Ser Met Lys Leu Arg Arg Met Ile Tyr Ile Phe Asp Ser Met
370 375 380Thr Ala Ala Glu Leu Asp Gly Asp Gly Lys Met Phe Val Glu Gln Pro385 390 395 400Ser Arg Met Val Arg Ile Ala Cys Gly Ser Gly Thr Thr Val Arg Glu405 410 415Val Glu Asp Leu Leu Ser Gln His Arg Met Met Ala Gly Met Ala Lys420 425 430Arg Val Gly Gly Gln Lys Lys Gln Met Gln Arg Ala Gln Asn Met Leu435 440 445Lys Gly Gly Asn Lys Glu Gln Gln Leu Ala Ala Met Gln Lys Arg Met450 455 460Ala Ala Met Gly Gly Ala Gly Gly Gly Gly Phe Pro Gly Met Pro Gly465 470 475 480Met Gly Asp Met Ala Lys Met Met Gln Met Leu Gln Gly Gln Gly Gly485 490 495Gly Gly Gly Gly Gly Leu Pro Gly Leu Gly Gly Met Asp Leu Gln Ser500 505 510Met Met Ser Gln Met Set Gly Leu Met Gly Gly Gly Gly Gly Gly Gly515 520 525Gly Arg Gly Arg Gly Arg530(2)SEQ ID NO3的信息(i)序列特征(A)长度2165bp(B)类型核酸(C)链型双链(D)拓扑结构线性(ii)分子类型cDNA(vi)来源(A)生物黑曲霉(xi)序列表述SEQ ID NO3GAATTCGCGG CCGCTAAGTG ACGCATCTTT TAATTTGTAC ATGCTTTAAT TTGGTTTATT 60CCCTTTCTAC AAGAATTCCC CCGCC ATG GTC CTT CAG GAT CTC GGG CGG CGA112Met Val Leu Gln Asp Leu Gly Arg Arg1 5ATC AAC GCC GCC GTC AAT GAC CTG ACT CGC TCC AAC AAT TTG GAC GAG160Ile Asn Ala Ala Val Asn Asp Leu Thr Arg Ser Asn Asn Leu Asp Glu10 15 20 25AAG GCC TTT GAT GAC ATG ATT AAA GAG ATC TGC GCC GCC CTG CTG TCC208Lys Ala Phe Asp Asp Met Ile Lys Glu Ile Cys Ala Ala Leu Leu Ser30 35 40GCC GAC GTC AAC GTC CGC CTG GTC CAG TCC CTC CGC AAG TCC ATC AAA256Ala Asp Val Asn Val Arg Leu Val Gln Ser Leu Arg Lys Ser Ile Lys45 50 55TCC AGC GTC AAC TTT GCC TCT CTT CCT GCC GCC GTG AAC AAG AAG CGT304Ser Ser Val Asn Phe Ala Ser Leu Pro Ala Ala Val Asn Lys Lys Arg60 65 70TTG ATT CAA AAG GCC GTC TTC GAT GAG CTG GTT TCC CTG GTT GAT CCC352Leu Ile Gln Lys Ala Val Phe Asp Glu Leu Val Ser Leu Val Asp Pro75 80 85CAT GCG GAG CCC TTC CGC CCC AAG AAG GGC CGC TCC AAC GTG ATC ATG400His Ala Glu Pro Phe Arg Pro Lys Lys Gly Arg Ser Asn Val Ile Met90 95 100 105TTC GTC GGT CTG CAG GGT GCC GGT AAA ACC ACC ACT TGT ACC AAG CTG448Phe Val Gly Leu Gln Gly Ala Gly Lys Thr Thr Thr Cys Thr Lys Leu110 115 120GCC CGC CAC TAC CAG ATG CGC GGC TTC AAG ACT GCC CTC GTC TGT GCC496Ala Arg His Tyr Gln Met Arg Gly Phe Lys Thr Ala Leu Val Cys Ala125 130 135GAT ACC TTC CGT GCT GGT GCT TTC GAC CAG CTG AAG CAG AAT GCC ACC544Asp Thr Phe Arg Ala Gly Ala Phe Asp Gln Leu Lys Gln Asn Ala Thr140 145 150AAA GCC AAG ATC CCC TAC TAC GGT AGC TTG ACG CAA ACC GAC CCC GCC592Lys Ala Lys Ile Pro Tyr Tyr Gly Ser Leu Thr Gln Thr Asp Pro Ala155 160 165ATT GTA GCA GCC GAG GGT GTG GCC AAG TTC AAG AAG GAG CGT TTC GAA640Thr Lys Ala Lys Ile Pro Tyr Tyr Gly Ser Leu Thr Gln Thr Asp Pro170 175 180 185ATC ATC ATC GTC GAT ACC AGT GGT CGT CAC AAG CAG GAA GAA GAG CTT688Ala Ile Val Ala Ala Glu Gly Val Ala Lys Phe Lys Lys Glu Arg Phe190 195 200TTC ACC GAA ATG ACC CAG ATT CAG ACC GCC GTC ACC CCC GAC CAG ACC736Glu Ile Ile Ile Val Asp Thr Ser Gly Arg His Lys Gln Glu Glu Glu205 210 215ATC CTC GTC CTC GAC AGC ACC ATC GGT CAG GCT GCC GAA GCC CAG TCC784Leu Phe Thr Glu Met Thr Gln Ile Gln Thr Ala Val Thr Pro Asp Gln220 225 230TCT GCC TTC AAG GCC ACC GCA GAC TTC GGA GCC ATC ATC ATC ACC AAG832Thr Ile Leu Val Leu Asp Ser Thr Ile Gly Gln Ala Ala Glu Ala Gln235 240 245ACG GAT GGT CAC GCC GCA GGT GGT GGT GCT ATT TCC GCC GTC GCC GCC880Ser Ser Ala Phe Lys Ala Thr Ala Asp Phe Gly Ala Ile Ile Ile Thr250 255 260 265ACA CAC ACT CCC ATT ATC TAC CTC GGT ACC GGT GAG CAC CTG ATG GAT928Lys Thr Asp Gly His Ala Ala Gly Gly Gly Ala Ile Ser Ala Val Ala270 275 280CTG GAA CGC TTT GAG CCG AAG GCC TTC ATC CAG AAG CTC CTG GGT ATG976Ala Thr His Thr Pro Ile Ile Tyr Leu Gly Thr Gly Glu His Leu Met285 290 295GGC GAT ATG GCT GGC CTG GTA GAG CAC GTA CAA GCC GTG ACC AAG GAC 1024Asp Leu Glu Arg Phe Glu Pro Lys Ala Phe Ile Gln Lys Leu Leu Gly300 305 310TCT GCC TCC GCC AAG GAA ACC TAC AAG CAC ATC TCC GAA GGT ATC TAC 1072Met Gly Asp Met Ala Gly Leu Val Glu His Val Gln Ala Val Thr Lys315 320 325ACG CTG CGT GAC TTC CGC GAG AAC ATC ACC TCC ATC ATG AAG ATG GGA 1120Asp Ser Ala Ser Ala Lys Glu Thr Tyr Lys His Ile Ser Glu Gly Ile330 335 340 345CCC CTC TCC AAG CTC TCC GGC ATG ATC CCC GGT CTA TCC AAC CTG ACC 1168Tyr Thr Leu Arg Asp Phe Arg Glu Asn Ile Thr Ser Ile Met Lys Met350 355 360GCG GGT CTC GAT GAC GAA GAC GGC TCC ATG AAG CTC CGT CGC ATG ATC 1216Gly Pro Leu Ser Lys Leu Ser Gly Met Ile Pro Gly Leu Ser Asn Leu365 370 375TAC ATT CTC GAC AGT ATG ACG GCC GCC GAA CTC GAT GGC GAT GGC AAG 1264Thr Ala Gly Leu Asp Asp Glu Asp Gly Ser Met Lys Leu Arg Arg Met380 385 390AAT TTC GTC GAA CAA CCC AGC CGC ATG GTC CGT ATC GCC TGC GGA AGC 1312Ile Tyr Ile Leu Asp Ser Met Thr Ala Ala Glu Leu Asp Gly Asp Gly395 400 405GGT ACC ACC GTC CGC GAA GTG GAA GAC CTG CTC TCC CAG CAC CGC ATG 1360Lys Asn Phe Val Glu Gln Pro Ser Arg Met Val Arg Ile Ala Cys Gly410 415 420 425ATG GCC GGC ATG GCC AAG CGT GTC GGT GGA CAG AAG AAG CAG ATG CAG 1408Ser Gly Thr Thr Val Arg Glu Val Glu Asp Leu Leu Ser Gln His Arg430 435 440CGC GCC CAG AAC ATG CTC AAG GGC GGT AAC AAG GAG CAG CAG CTC GCC 1456Met Met Ala Gly Met Ala Lys Arg Val Gly Gly Gln Lys Lys Gln Met445 450 455GCC ATG CAG AAG CGC ATG GCC GCA ATG GGT GGT GCC GGC GGT GGT GGA 1504Gln Arg Ala Gln Asn Met Leu Lys Gly Gly ASn Lys Glu Gln Gln Leu460 465 470TTC CCC GGT ATG CCC GGC ATG GGC GAC ATG GCC AAG ATG ATG CAA ATG 1552Ala Ala Met Gln Lys Arg Met Ala Ala Met Gly Gly Ala Gly Gly Gly475 480 485CTG CAA GGT CAG GGA GGT GGA GGC GGC GGT GGT CTG CCC GGT CTA GGT 1600Gly Phe Pro Gly Met Pro Gly Met Gly Asp Met Ala Lys Met Met Gln490 495 500 505GGA ATG GAT CTA CAA AGT ATG ATG AGC CAG ATG AGT GGG TTG ATG GGC 1648Met Leu Gln Gly Gln Gly Gly Gly Gly Gly Gly Gly Leu Pro Gly Leu510 515 520GGT GGC GGT GGT GGT GGT GGT GGA GGC CGC GGT AGA GGA CGG TGA TTG 1696Gly Gly Met Asp Leu Gln Ser Met Met Ser Gln Met Ser Gly Leu Met525 530 535TGA TGA TGA CGA TGA TGC ACG CAT TTC GAA ACT CCT TTT TGA TTC 1741Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Arg Gly Arg Gly Arg540 545 550ATGTTTTCGC GTTGTTACCA TTCCATGATT ATATTACTAC ACCTGTGTCT CCGTCTCTTC 1801TTTTCGTTTG ATTTTTAAGA GACTGGGGAT ATATCGCCTT GCTTCAGTTC AGTCATCATT 1861CACCTCATTC GTCGATTGTA ACTAGCATAT GATGGTGTTG GGCGTGACTT TGATTTTACT 1921TRTTGCTTAT CTTTTTTCTT TCTCGCTAAT ATCTGACTGG CCCTGTGGGG CATAAATTTA 1981TGCTATGGAA GCACGGCCGC ATTTCGCGGC CGCTAGAAGA CCAACTGGTA ACTCAGCGTC 2041GGGTGACGGT CAGCCTGCCA GTCACATTGG ACAACTCTAA GCGCCGTCAC AGGTCATGAC 2101CGAGTTTTTCG TTGTTAATCG GCTTATTGGC TTGATTTGGC GGTGTGTTTG GCGCCTGTCT 2160ATCTA2165(2)SEQ ID NO4的信息(i)序列特征(A)长度552个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ii)分子类型蛋白质(vi)来源(A)生物黑曲霉(xi)序列表述SEQ ID NO4Met Val Leu Gln Asp Leu Gly Arg Arg Ile Asn Ala Ala Val Asn Asp1 5 10 15Leu Thr Arg Ser Asn Asn Leu Asp Glu Lys Ala Phe Asp Asp Met Ile20 25 30Lys Glu Ile Cys Ala Ala Leu Leu Ser Ala Asp Val Asn Val Arg Leu35 40 45Val Gln Ser Leu Arg Lys Ser Ile Lys Ser Ser Val Asn Phe Ala Ser50 55 60Leu Pro Ala Ala Val Asn Lys Lys Arg Leu Ile Gln Lys Ala Val Phe65 70 75 80Asp Glu Leu Val Ser Leu Val Asp Pro His Ala Glu Pro Phe Arg Pro85 90 95Lys Lys Gly Arg Ser Asn Val Ile Met Phe Val Gly Leu Gln Gly Ala100 105 110Gly Lys Thr Thr Thr Cys Thr Lys Leu Ala Arg His Tyr Gln Met Arg115 120 125Gly Phe Lys Thr Ala Leu Val Cys Ala Asp Thr Phe Arg Ala Gly Ala130 135 140Phe Asp Gln Leu Lys Gln Asn Ala Thr Lys Ala Lys Ile Pro Tyr Tyr145 150 155 160Gly Ser Leu Thr Gln Thr Asp Pro Ala Thr Lys Ala Lys Ile Pro Tyr165 170 175Tyr Gly Ser Leu Thr Gin Thr Asp Pro Ala Ile Val Ala Ala Glu Gly180 185 190Val Ala Lys Phe Lys Lys Glu Arg Phe Glu Ile Ile Ile Val Asp Thr195 200 205Ser Gly Arg His Lys Gln Glu Glu Glu Leu Phe Thr Glu Met Thr Gln210 215 220Ile Gln Thr Ala Val Thr Pro Asp Gln Thr Ile Leu Val Leu Asp Ser225 230 235 240Thr Ile Gly Gln Ala Ala Glu Ala Gln Ser Ser Ala Phe Lys Ala Thr245 250 255Ala Asp Phe Gly Ala Ile Ile Ile Thr Lys Thr Asp Gly His Ala Ala260 265 270Gly Gly Gly Ala Ile Ser Ala Val Ala Ala Thr His Thr Pro Ile Ile275 280 285Tyr Leu Gly Thr Gly Glu His Leu Met Asp Leu Glu Arg Phe Glu Pro290 295 300Lys Ala Phe Ile Gln Lys Leu Leu Gly Met Gly Asp Met Ala Gly Leu305 310 315 320Val Glu His Val Gln Ala Val Thr Lys Asp Ser Ala Ser Ala Lys Glu325 330 335Thr Tyr Lys His Ile Ser Glu Gly Ile Tyr Thr Leu Arg Asp Phe Arg340 345 350Glu Asn Ile Thr Ser Ile Met Lys Met Gly Pro Leu Ser Lys Leu Ser355 360 365Gly Met Ile Pro Gly Leu Ser Asn Leu Thr Ala Gly Leu Asp Asp Glu370 375 380Asp Gly Ser Met Lys Leu Arg Arg Met Ile Tyr Ile Leu Asp Ser Met385 390 395 400Thr Ala Ala Glu Leu Asp Gly Asp Gly Lys Asn Phe Val Glu Gln Pro405 410 415Ser Arg Met Val Arg Ile Ala Cys Gly Ser Gly Thr Thr Val Arg Glu420 425 430Val Glu Asp Leu Leu Ser Gln His Arg Met Met Ala Gly Met Ala Lys435 440 445Arg Val Gly Gly Gln Lys Lys Gln Met Gln Arg Ala Gln Asn Met Leu450 455 460Lys Gly Gly Asn Lys Glu Gln Gln Leu Ala Ala Met Gln Lys Arg Met465 470 475 480Ala Ala Met Gly Gly Ala Gly Gly Gly Gly Phe Pro Gly Met Pro Gly485 490 495Met Gly Asp Met Ala Lys Met Met Gln Met Leu Gln Gly Gln Gly Gly500 505 510Gly Gly Gly Gly Gly Leu Pro Gly Leu Gly Gly Met Asp Leu Gln Ser515 520 525Met Met Ser Gln Met Ser Gly Leu Met Gly Gly Gly Gly Gly Gly Gly530 535 540Gly Gly Gly Arg Gly Arg Gly Arg545 550
权利要求
1.一种核酸结构,它带有一个编码一种丝状真菌信号识别颗粒(SRP)的一个或几个因子的核酸序列。
2.如权利要求1的结构,其中,所述因子是SRP的蛋白亚基。
3.如权利要求1的结构,其中,所述因子是7S RNA。
4.如权利要求1的结构,其中,所述SRP是SRP54。
5.如权利要求1的结构,其中,所述SRP是曲霉属(Aspergillus)SRP。
6.如权利要求1的结构,其中,所述SRP是一种黑曲霉(Aspergillus niger)SRP。
7.如权利要求1的结构,其中,所述核酸序列为图2所示的核酸序列,或其编码区,或其所编码的蛋白质与图2所示氨基酸序列有至少60%同源性的同系物。
8.如权利要求1的结构,其中,所述核酸序列为图3所示的核酸序列,或其所编码的蛋白质与图3所示氨基酸序列至少有60%同源性的同系物。
9.一种重组载体,它带有一种核酸结构,该核酸结构带有一个编码一种丝状真菌信号识别颗粒(SRP)的一个或几个因子的核酸序列。
10.如权利要求9的载体,它带有编码一种SRP因子的序列的一个以上拷贝。
11.如权利要求9的载体,其中,所述SRP是SRP54。
12.如权利要求9的载体,其中,所述SRP是一种曲霉属SRP。
13.如权利要求9的载体,其中,所述SRP是黑曲霉SRP。
14.一种重组宿主细胞,它带有一种核酸结构,该核酸结构带有一个编码一种丝状真菌信号识别颗粒(SRP)的核酸序列。
15.如权利要求14的细胞,它带有编码SRP的序列的一个以上的拷贝。
16.如权利要求14的细胞,它还包括一个编码一种感兴趣的异源蛋白的核酸序列。
17.如权利要求14的细胞,它是一种丝状真菌细胞。
18.如权利要求17的细胞,它是一种曲霉属细胞。
19.一种重组生产一种蛋白质的方法,包括在能诱导该蛋白表达的条件下培养一种宿主细胞,和从培养物中回收该蛋白,所述宿主细胞能比在相同条件下培养的野生型细胞产生更大数量的一种丝状真菌分泌性组分,该宿主细胞还含有编码该蛋白质的核酸序列。
20.如权利要求19的方法,其中,所述宿主细胞带有一种核酸结构,该核酸结构带有一个编码一种丝状真菌信号识别颗粒(SRP)的一个因子的核酸序列。
21.如权利要求20的方法,其中,所述宿主细胞带有编码一种SRP因子的核酸序列的一个以上拷贝。
22.如权利要求20的方法,其中,所述宿主细胞带有一种结构,该结构带有一个编码SRP54的核酸序列。
全文摘要
本发明涉及一种核酸结构,这种核酸结构带有编码一种丝状真菌信号识别颗粒的因子的核酸序列。
文档编号C12N15/11GK1162334SQ95196025
公开日1997年10月15日 申请日期1995年10月2日 优先权日1995年10月2日
发明者S·A·汤普森, D·S·亚沃 申请人:诺沃诺尔迪斯克生物技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1