在宿主细胞中表达克隆的改进方法

文档序号:431882阅读:560来源:国知局
专利名称:在宿主细胞中表达克隆的改进方法
技术领域
本发明涉及高度适合用于下述方法的启动子,所述方法通过表达克隆鉴定编码目的蛋白质的DNA序列。

背景技术
已知数量递增的基于表达克隆的筛选方法。这类方法先前被成功地用于在例如Bacillus(比较US 4,469,791、WO2005/38024)和E.coli(例如WO 95/18219和WO 95/34662)中鉴定原核基因产物。WO2005/38024描述筛选分泌蛋白质的重组Bacillus细胞的方法。然而,该方法缺乏高通量自动化检测技术。酵母也被用作用于表达克隆真核基因的宿主细胞。Strasser等(Eur.J.Biochem.(1989)184699-706)报导了通过在酵母Saccharomyces cerevisiae中表达克隆真菌基因组DNA来鉴定真菌α-淀粉酶。类似地,WO 93/11249报导了通过在S.cerevisiae中表达克隆真菌cDNA来鉴定真菌纤维素酶。最近,描述了在丝状真菌中的表达克隆(WO99/32617)。
在所有这些方法中,在可分离分泌具有目的特性蛋白质的转化体之前,不得不筛选大量转化体。因此存在对下述表达克隆方法的需要,所述方法可最优化检测编码被分泌蛋白质的DNA序列的机会。
附图简述

图1.描述了pPhtrA-gfp-amyE。该分泌报告子载体包含与GFP可操作连接的B.subtilis htrA启动子。该载体对pPhtrB-gfp-amyE是有代表性的。
图2.用于分泌-胁迫的B.subtilis报告子菌株的结构。htr启动子与GFP基因融合,最终产生质粒pPhtrA-gfp-amyE和pPhtrB-gfp-amyE。产生的质粒通过相应htr基因座中的单交换重组整合进Bacillus宿主细胞染色体中,得到VT210A和VT210B细胞。Cmr代表氯霉素抗性基因。
图3.描述了pUBnpr-2,其包含来自Bacillus amyloliquefaciens的中性蛋白酶基因npr(Genbank登录号K 02497) 图4.描述了pUBBAG,其包含来自Bacillus amyloliquefaciens的β-葡聚糖酶基因bag(Genbank登录号M 15674)。
图5.描述了使用荧光激活细胞分选术(Fluorescence Activated CellSorting)对用质粒pUB110(空对照载体)或质粒pKTH10(编码Bacillusamyloliquefaciens的α-淀粉酶基因amyQ)转化的Bacillus subtilis VT210A细胞的分析。y轴描述所观察到的事件数量,x轴描述相对荧光。在图A中,描述了对用空载体pUB110转化的Bacillus subtilis VT210A细胞的分析。在图B中,描述了对用amyQ载体pKTH10转化的Bacillus subtilisVT210A细胞的分析。在图C中,描述了对用1∶20比例的pUB110和pKTH10转化的Bacillus subtilis VT210A细胞混合种群的分析。在图D中,描述了对用pUB110和pKTH10二者转化的Bacillus subtilis VT210A细胞混合种群的细胞分选;细胞分选限制由垂直虚线指示。显示高于所述限制的细胞被分选出来。
图6.描述了对用质粒pUB110(空对照载体)或质粒pKTH10(编码Bacillus amyloliquefaciens的α-淀粉酶基因amyQ)转化的Bacillus subtilisVT210A细胞混合种群的分析。分析通过荧光激活细胞扫描(FluorescenceActivated Cell Scanning)进行。y轴描述所观察到的事件数量,x轴描述相对荧光。
图7.描述了用于在A.niger中表达绿色荧光蛋白(GFP,Chalfie,M et al.,Science(1994)263(5148)802-805)的pGBFINGFP-2载体。所述FIN载体的主链特征先前描述于WO 99/32617中。
图8.描述了用于在A.niger中表达植酸酶(PHY)(与WO99/32617中所述FytA相同的植酸酶基因PHY)的pGBFIN-32载体。
图9.描述了其中大部分植酸酶基因和整个葡萄糖淀粉酶启动子被去除的pGBFIN-40载体,该载体用作构建A.niger WT载体菌株的孔对照载体。
图10.描述了为确认分泌诱导的启动子身份而进行的Northern印迹分析。
图11.描述了用于在A.niger中基因表达的载体。该载体在构建分泌诱导的A.niger报告子构建体中用作主链。
图12.描述了pGBFINGFPBLE-1克隆载体。该分泌诱导型报告子构建体包含与本发明分泌诱导型启动子1可操作连接的GFP-BLE报告子融合基因。该构建体对于pGBFINGFPBLE-2、pGBFINGFPBLE-3、pGBFINGFPBLE-4和pGBFINGFPBLE-5是代表性的。
图13.描述了pGBTOPSEL-1,该载体用作构建最终分泌诱导型报告子质粒的主链。所述载体的主链特征先前描述于WO 99/32617。
图14.描述了最终分泌报告子构建体pGBTOPGFPBLE-1。该分泌诱导的报告子载体包含与本发明分泌诱导型启动子1可操作连接的GFP-BLE报告子构建体。该载体对pGBTOPGFPBLE-2、pGBTOPGFPBLE-3、pGBTOPGFPBLE-4和pGBTOPGFPBLE-5是代表性的。
图15.描述了含有下述报告子构建体的A.niger共转化体腐草霉素抗性的差异,所述报告子构建体带有与编码细胞内蛋白质(由黑点表示)或细胞外蛋白质(由黑方块表示)的文库构建体结合的分泌诱导型启动子P4。
图16.描述了含有下述报告子构建体的A.niger共转化体腐草霉素抗性的差异,所述报告子构建体带有与编码细胞内蛋白质(由黑点表示)或细胞外蛋白质(由黑方块表示)的文库构建体结合的分泌诱导型启动子P5。
图17.描述了E-PAGETM凝胶,其中各图代表包含下述报告子构建体的经共转化的A.niger克隆,所述报告子构建体带有与编码细胞外蛋白质的文库构建体结合的分泌诱导型启动子P1。M代表E-PAGE

预染标准(Invitrogen,U.K.)。
图18.描述了E-PAGETM凝胶,其中各图代表包含下述报告子构建体的经共转化的A.niger克隆,所述报告子构建体带有与编码细胞外蛋白质的文库构建体结合的分泌诱导型启动子P3。M代表E-PAGE

预染标准(Invitrogen,U.K.)。


发明内容
启动子DNA序列 根据本发明的第一方面,提供了启动子DNA序列,例如 (a)以下列表所示的DNA序列SEQ ID NO1、SEQ ID NO2、SEQID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ IDNO24, (b)能够与(a)的DNA序列杂交的DNA序列, (c)与(a)的DNA序列至少50%同源的DNA序列, (d)(a)到(c)的DNA序列中任何一种的变体,或 (e)(a)到(d)的DNA序列中任何一种的亚序列。
根据一种优选的实施方案,本发明的启动子序列为这样的一种启动子DNA序列,例如 (a)以下列表所示的一种DNA序列SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ IDNO24, (b)能够与(a)的DNA序列杂交的DNA序列, (c)与(a)的DNA序列至少50%同源的一个DNA序列, (d)(a)到(c)的DNA序列中任何一种的一个变体,或 (e)(a)到(d)的DNA序列中任何一种的一个亚序列。
在本申请上下文中,启动子DNA序列为下述DNA序列,当该启动子DNA序列与该编码序列可操作连接时,所述DNA序列能够控制编码序列的表达。术语“可操作连接”在本文定义为一种构型,其中启动子DNA序列适当地置于与编码序列相关的位置,使得所述启动子DNA序列指导由所述编码序列编码的多肽的产生。
术语“编码序列”在本文定义为被转录为下述mRNA的核酸序列,所述mRNA置于适当调控序列调控之下时被翻译为多肽。编码序列的边界通常由ATG起始密码子(其通常为mRNA5’末端开放读码框的起点)和转录终止序列(在mRNA 3’末端开放读码框的紧下游)确定。编码序列可包括但不仅限于基因组DNA、cDNA、半合成的、合成的和重组的核酸序列。优选地,启动子DNA序列被定义为位于其连接的编码序列上游的DNA序列,并定义为能够调控该编码序列的表达。
更具体地,术语“启动子”在本文定义为下述DNA序列,所述DNA序列结合RNA聚合酶,并指导聚合酶到达编码多肽的编码序列正确的下游转录起始位点以起始转录。RNA聚合酶能有效催化与编码区适当DNA链互补的信使RNA的装配。术语“启动子”还应被理解为包括用于转录为mRNA后翻译的5’非编码区(启动子和翻译起点之间)、顺式作用转录调控元件如增强子,和其它能够与转录因子相互作用的核苷酸序列。
在一种优选的实施方案中,本发明的启动子DNA序列为来自以下的DNA序列SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ IDNO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24。
根据另一优选的实施方案,本发明的启动子DNA序列为能够与以下列表所示的DNA序列杂交并仍保持启动子活性的DNA序列SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQID NO23或SEQ ID NO24。
启动子活性优选通过测量作为编码序列表达结果产生的蛋白质浓度来确定,所述编码序列与启动子可操作连接。或者启动子活性通过测量由编码序列编码的蛋白质的酶活性确定,所述编码序列与启动子可操作连接。根据优选的实施方案,启动子活性(及其强度)通过测量lacZ报告子基因表达来确定(In Luo,Gene 163(1995)127-131或Perkins and Youngman(1986)Proc Natl Acad Sci USA 83140;或Vagner et al.(1998)Microbiology1443097中)。根据另一优选的实施方案,通过使用绿色荧光蛋白作为编码序列确定启动子活性(In Microbiology.1999 Mar;145(Pt 3)729-34.Santerre Henriksen AL,Even S,Muller C,Punt PJ,van den Hondel CA,NielsenJ.Study)。在细菌细胞中,GFP和其它荧光蛋白已广泛用于表达和(动态)蛋白质定位研究(在Southward and Surette(2002)MoI.Microbiol.451191中综述)。另外,可通过测量在启动子调控下产生的转录物mRNA水平确定启动子活性。可例如通过Northern印迹、GeneChipsTM(Affymetrix)或斑点阵列技术或定量(实时)PCR测量mRNA水平(J.Sambrook,E.F.Fritsch,and T.Maniatis,2001,Molecular Cloning,A Laboratory Manual,3dedition,Cold Spring Harbor,N.Y.)。最优选地,通过使用Northern印迹的mRNA分析确定启动子活性。
优选地,本发明的(经分离的)启动子DNA序列在非常低严格度条件下,更优选低严格度条件下,更优选中严格度条件下,更优选中-高严格度条件下,甚至更优选高严格度条件下和最优选非常高严格度条件下与下述核酸探针杂交,所述核酸探针在相同条件下与 (i)SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQ IDNO22、SEQ ID NO23或SEQ ID NO24,或 (ii)(i)的亚序列,或 (iii)(i)、(ii)的互补链杂交。
术语互补链为本领域技术人员已知,并描述于(J.Sambrook,E.F.Fritsch,and T.Maniatus,1989,Molecular Cloning,A Laboratory Manual,2dedition,Cold Spring Harbor,N.Y.)。SEQ ID NO1、SEQ ID NO2、SEQ IDNO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24的亚序列可在20个核苷酸和编码区上游SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ IDNO24的相应全序列(SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24的相应编码区分别在SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28和SEQ ID NO29中给出)之间的范围。
SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQID NO22、SEQ ID NO23或SEQ ID NO24的核酸序列及其亚序列(如前一段中所定义)可用于设计核酸探针,以从不同属或种的菌株中根据本领域公知方法鉴定和克隆DNA启动子。具体地,这类探针可用于与目的属或种的基因组或cDNA根据标准Southern印迹方法杂交,从而从其中鉴定和分离相应的基因。这类探针可显著短于整个序列,但是应有至少15个,优选至少25个和更优选至少35个核苷酸长。另外,这类探针可用于通过PCR扩增DNA启动子。也可使用更长的探针。可使用DNA、RNA和肽核酸(PNA)探针。典型地,标记探针用于检测相应基因(例如用@32P、@33P、@3H、@35S、生物素或抗生物素蛋白或荧光标记物)。本发明包括这类探针。
因此从这类其它生物中制备的基因组DNA或cDNA可用于筛选下述DNA,所述DNA与上文所述探针杂交并编码多肽。来自这类其它生物的基因组DNA或其它DNA可通过琼脂糖或聚丙烯酰胺凝胶电泳或其它分离技术分离。来自文库或经分离的DNA的DNA可转移至并固定在硝酸纤维素或其它合适的载体材料上。为了鉴定与SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ IDNO24或其亚序列同源的克隆或DNA序列,载体材料可用于Southern印迹。就本发明的目的而言,杂交是指DNA序列在非常低到非常高严格度条件下与下述经标记的核酸探针杂交,所述探针对应于SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ IDNO23或SEQ ID NO24中所示DNA序列,对应于所述DNA序列的互补链,或对应于所述DNA序列的亚序列。在这些条件下与核酸探针杂交的分子使用例如X射线胶片检测。也可使用其它杂交技术,例如使用用于检测的荧光和玻片和/或DNA微阵列作为支持。DNA微阵列杂交检测的一个实例在FEMS Yeast Res.2003 Dec;4(3)259-69(Daran-Lapujade P,Daran JM,Kotter P,Petit T,Piper MD,Pronk JT.″Comparative genotyping of theSaccharomyces cerevisiae laboratory strains S288C and CEN.PK1 13-7D usingoligonucleotide microarrays″)中给出。另外,PNA微阵列用于杂交的用途描述于Nucleic Acids Res.2003 Oct 1;31(19)e119(Brandt O,Feldner J,Stephan A,Schroder M,Schnolzer M,Arlinghaus HF,Hoheisel JD,Jacob A.PNA microarrays for hybridisation of unlabelled DNA samples.)。
在一种优选的实施方案中,核酸或DNA探针为SEQ ID NO1、SEQID NO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24的DNA序列。在另一实施方案中,核酸探针为具有SEQID NO1的核苷酸100到150的DNA序列或具有SEQ ID NO2的核苷酸170到220的DNA序列。
在另一优选的实施方案中,核酸探针为具有以下的DNA序列 -SEQ ID NO20的核苷酸996到2797、SEQ ID NO21的核苷酸996到3561、SEQ ID NO22的核苷酸997到3536、SEQ ID NO23的核苷酸1034到3175或SEQ ID NO24的核苷酸1080到4054,更优选 -SEQ ID NO20的核苷酸1496到2497、SEQ ID NO21的核苷酸1496到3261、SEQ ID NO22的核苷酸1497到3236、SEQ ID NO23的核苷酸1534到2875或SEQ ID NO24的核苷酸1580到3754,甚至更优选 -SEQ ID NO20的核苷酸1896到2197、SEQ ID NO21的核苷酸1896到2861、SEQ ID NO22的核苷酸1897到2936、SEQ ID NO23的核苷酸1934到2575或SEQ ID NO24的核苷酸1980到3454,和最优选 -SEQ ID NO20的核苷酸1996到2100、SEQ ID NO21的核苷酸1996到2300、SEQ ID NO22的核苷酸1997到2400、SEQ ID NO23的核苷酸2034到2100或SEQ ID NO24的核苷酸2080到2800。
根据另一优选的实施方案,探针为位于编码序列上游的SEQ IDNO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24的DNA序列的一部分。SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24的相应的编码区分别在SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28和SEQ ID NO29中给出。
对于至少100个核苷酸长度的长探针而言,非常低到非常高严格度条件被定义为依照标准Southern印迹程序,在42℃下5倍SSPE、0.3%SDS、200毫克/ml经剪切且变性的鲑精DNA和甲酰胺中预杂交和杂交,所述甲酰胺对于非常低和低严格度而言为25%,对于中和中-高严格度而言为35%或对于高和非常高严格度而言为50%。对于至少100个核苷酸长度的长探针而言,最后用2倍SSC、0.2%SDS,在至少45℃(非常低严格度),更优选至少50℃(低严格度),更优选至少55℃(中严格度),更优选至少60℃(中-高严格度),进一步更优选至少65℃(高严格度)和最优选至少70℃(非常高严格度)下对载体材料洗涤三次,每次15分钟。
对于约15个核苷酸到约70个核苷酸长度的短探针而言,严格度条件定义为在比使用Bolton and McCarthy(1962,Proceedings of the NationalAcademy of Sciences USA 481390)算法计算的Tm低5℃到10℃下,在0.9M NaCl、0.09 M Tris-HCl pH 7.6、6 mM EDTA、0.5%NP-40、1倍Denhardfs溶液、1mM焦磷酸钠、1mM磷酸二氢钠、0.1mM ATP和0.2mg/ml酵母RNA中依照标准Southern印迹程序预杂交、杂交和杂交后洗涤。对于约15个核苷酸到约70个核苷酸长度的短探针而言,在6倍SCC加上0.1%SDS中15分钟对载体材料洗涤一次,并使用6倍SSC在低于所计算的Tm 5℃到10℃下洗涤两次,每次15分钟。
根据另一优选的实施方案,首先用来自SEQ ID NO 1、SEQ IDNO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24的本发明的启动子DNA序列克隆与其可操作连接的天然基因、编码序列或其部分。这可从SEQ ID NO 1、SEQ ID NO2、SEQ IDNO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24或先前定义的其亚序列开始来完成,其中使用该序列作为探针。将所述探针与给定宿主的cDNA或基因组文库杂交,所述宿主为Bacillus、Aspergillus niger或本申请文本中定义的任何其它宿主。一旦天然基因或其部分被克隆,可随后使用其自身作为探针,通过本文所述杂交实验克隆来自其它真菌的它的同源基因。在本发明上下文中,同源基因是指与天然基因至少50%同源的基因。优选地,同源基因与天然基因至少55%同源,更优选至少60%,更优选至少65%,更优选至少70%,进一步更优选至少75%,优选至少约80%,更优选约90%,进一步更优选约95%和最优选约97%。
同源基因编码序列上游的序列为本发明包含的启动子。或者,可通过使用SEQ ID NO 25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28或SEQ ID NO29或如前定义的其亚序列,用例如如本文所述的比对或BLAST算法搜索基因组数据库来鉴定与本发明启动子可操作连接的天然基因、编码序列或其部分的序列。随后可使用该经鉴定的序列来鉴定本申请中定义的任何其它真菌宿主中的直向同源基因或同源基因。经鉴定的直向同源基因或同源基因编码序列上游的序列为本发明所包括的启动子。
根据另一优选的实施方案,本发明的启动子DNA序列为来自SEQ IDNO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24并仍然具有较前定义的启动子活性的(经分离的)DNA序列。
根据另一优选的实施方案,本发明的启动子DNA序列为分别来自SEQ ID NO1、SEQ ID NO2、SEQ ID NO20、SEQ ID NO21、SEQ IDNO22、SEQ ID NO23或SEQ ID NO24的(经分离的)DNA序列,其与位于各自编码区(SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQID NO28或SEQ ID NO29)上游的各自相应的DNA序列SEQ IDNO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18或SEQ ID NO19的至少部分至少50%同源。优选地,所述DNA序列与位于各自相应编码区上游的SEQ ID NO 15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18或SEQ ID NO19的至少部分至少55%同源,更优选至少60%,更优选至少65%,更优选至少70%,进一步更优选至少75%,优选约80%,更优选约90%,进一步更优选约95%,最优选约97%同源。
就本发明目的而言,优选通过Wilbur-Lipman方法(Wilbur andLipman,1983,Proceedings of the National Academy of Science USA 80726-730)使用LASERGENE.TM.MEGALIGN.TM.软件(DNASTAR,Inc.,Madison,Wis.)用同一性表格和以下多重比对参数确定两个核酸序列之间的同源性程度缺口惩罚为10和缺口长度惩罚为10。配对比对参数为Ktuple=3、缺口惩罚=3和窗口=20。
根据另一优选的实施方案,本发明的启动子DNA序列来自下述(经分离的)DNA序列,所述分离的DNA序列为位于各自相应编码区上游的SEQ ID NO1、SEQ ID NO2、SEQ ID NO15、SEQ ID NO16、SEQ IDNO17、SEQ ID NO18或SEQ ID NO19或SEQ ID NO1、SEQ ID NO2、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18或SEQ IDNO19的部分的变体。术语“变体启动子”在本文被定义为具有下述核苷酸序列的启动子,所述核苷酸序列包含母体启动子的一个或多个核苷酸的取代、缺失和/或插入,其中所述变体启动子具有大于或小于相应母体启动子的启动子活性。术语“变体启动子”还应包括天然变体和使用本领域公知方法(例如经典诱变、定向诱变和DNA改组(shuffling))体外产生的变体。变体启动子可具有一个或多个突变。各突变为核苷酸的独立取代、缺失和/或插入。向启动子中引入核苷酸取代、缺失和/或核苷酸可使用任何本领域已知方法(例如经典诱变、定向诱变或DNA改组)完成。特别有用的为下述方法,所述方法利用带有目的插入的超螺旋的双链DNA载体和含有所需突变的两个合成引物。各自与载体相反链互补的寡核苷酸引物通过Pfu DNA聚合酶的手段在温度循环中延伸。掺入引物后,产生含有交错切口的经突变的质粒。温度循环之后,用Dpn1处理产物以消化亲代DNA模板并选择含有突变的经合成的DNA,所述Dpn1对经甲基化的和经半甲基化的DNA特异。也可使用本领域已知的其它方法。其它方法的实例为QuickChangeTM定点诱变试剂盒(Stratagene Cloning Systems,La JoIIa,CA)、改变的位点

II体外诱变体系(The Altered

in vitroMutagenesis Systems)(Promega Corporation)或通过使用如Gene.1989 Apr15;77(1)51-9.(Ho SN,Hunt HD,Horton RM,Pullen JK,Pease LR″Site-directed mutagenesis by overlap extension using the polymerase chain reaction″)所述PCR或使用如Molecular BiologyCurrent Innovations and Future Trends.(Eds.A.M.Griffin and H.G.Griffin.ISBN 1-898486-01-8 1995 HorizonScientific Press,PO Box 1,Wymondham,Norfolk,U.K.)所述PCR的重叠延伸。根据优选的实施方案,变体启动子为与最初来自SEQ ID NO1、SEQID NO2、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18或SEQ ID NO19的启动子序列相比,具有至少一个经修饰的调节位点的启动子。这类调节位点可以整体被去除或如上文所解释被特异突变。从而调节这类启动子变体使得例如其不再被葡萄糖诱导。这类启动子变体和如何获得它们的技术的实例描述于EP 673 429B或WO 94/04673。
启动子变体可以是等位变体。等位变体是指占据相同染色体位点的基因的两种或更多可选择的形式中的任何。等位变体通过突变天然发生,并可由种群中的多态性引起。可通过包含步骤(a)和(b)的以下方法获得变体启动子(a)在非常低、低、中、中-高、高或非常高严格度条件下将DNA与 (i)SEQ ID NO 1、SEQ ID NO2、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18或SEQ ID NO19,或 (ii)(i)的亚序列,或 (iii)(i)、(ii)的互补链杂交,和 (b)从所述DNA序列中分离变体启动子。严格度和洗涤条件如本文定义。
本发明的启动子可以是下述启动子,所述启动子的序列可用接头提供,所述接头用于引入特异限制性位点的目的,所述限制性位点便于连接启动子序列和编码多肽的核酸序列编码区。
在另一优选的实施方案中,启动子DNA序列来自SEQ ID NO1、SEQ ID NO2、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ IDNO18或SEQ ID NO19的亚序列。在本文上下文中亚序列优选被定义为位于先前定义的各相应编码序列上游的SEQ ID NO1、SEQ ID NO2、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18或SEQ IDNO19的部分。
亚序列优选含有至少约50个核苷酸,或优选至少约100个核苷酸,更优选至少约200个核苷酸,甚至更优选至少约230个核苷酸,甚至更优选至少约250个核苷酸和最优选至少约290个核苷酸。
根据另一优选的实施方案,亚序列与前述句子定义的亚序列区别在于一个或多个来自5’和/或3’端的核苷酸被缺失,所述DNA序列仍具有早先定义的启动子活性。
在另一优选的实施方案中,启动子亚序列为来自翻译起点和/或来自转录起点的“经修剪的(trimmed)”亚序列。修剪启动子并对其功能性分析的实例描述于Gene.1994 Aug 5;145(2)179-87the effect of multiple copiesof the upstream region on expression of the Aspergillus niger glucoamylase-encoding gene.Verdoes JC,Punt PJ,Stouthamer AH,van den Hondel CA). 本文所提供的序列信息不应狭义地解释为要求包括错误鉴定的碱基。本文所公开的特异序列可被容易地使用,并最终进行进一步的序列分析从而鉴定测序错误,以从丝状真菌(特别是Aspergillus niger)中分离最初的DNA序列。
除非另有说明,所有通过测序本文DNA分子确定的核苷酸序列都是使用自动DNA测序仪确定的。因此,如本领域已知,对于通过该自动途径确定的任何DNA序列而言,本文确定的任何核苷酸序列可能含有一些错误。通过自动化确定的核苷酸序列通常与经测序DNA分子的实际核苷酸序列至少约90%相同,更典型地至少约95%相同到至少约99.9%相同。可通过其它手段更为精确地确定实际序列,包括本领域公知的手工DNA测序方法。
本领域技术人员能够鉴定这类被错误鉴定的碱基,并知道如何改正这类错误。
功能性核酸等同物可典型地含有不改变其涉及的生物学功能的突变。术语“功能性等同物”还包括A.niger DNA序列的直向同源物。A.nigerDNA序列的直向同源物为能够从其它菌株或物种中分离,并具有类似或相同生物学活性的DNA序列。
还可通过使用“序列比较算法”确定同源(类似或同一)序列。可例如通过Smith & Waterman,Adv.Appl.Math.2482(1981)的局部同源性算法、通过Needleman & Wunsch,J.MoI.Biol.48443(1970)的同源性比对算法、通过Pearson & Lipman,Proc.Nat′l Acad.Sci.USA 852444(1988)的搜索相似性算法、通过这些算法的计算机实现(GAP,BESTFIT,FASTA,andTFASTA in the Wisconsin Genetics Software Package,Genetics ComputerGroup,575 Science Dr.,Madison,Wl)或通过目测进行用于查询序列的最佳比对。适用于确定序列相似性的算法的实例为BLAST算法,其描述于Altschul,et al.,J.MoI.Biol.215403-410(1990)。或者,其它程序可用于本文较早描述的序列比对。用于进行BLAST分析的软件通过National Centerfor Biotechnology Information(http://www.ncbi.nlm.nih.gov/)可公开获得。该算法涉及首先通过鉴定查询序列中W长度的短字词鉴定高分序列对(HSP),所述短字在与数据库序列中相同长度的字相比时,匹配或满足一些正值阈分值T。这些最初的相邻字击中(word hits)被用作为寻找含有它们的更长HSP的起点。字击中在两个方向上沿两条被比较序列中的各条延伸,直至积累的比对评分可以提高。当累积的比对评分从达到的最大值减少数量X时;累积的比对评分降为零或低于零时;或到达任一序列末端时,字击中的延伸停止。BLAST算法参数W、T和X确定比对的敏感性和速度。BLAST程序使用11的字长(W)、50的BLOSUM62评分矩阵(参阅Henikoff & Henikoff,Proc.Natl.Acad.Sci.USA 8910915(1989))比对(B)、10的期望值(E)、M=5、N=-4和双链比较作为默认值。然后BLAST算法进行两条序列间相似性的统计分析(参阅例如Karlin &Altschul,Proc.Nat′l.Acad.Sci.USA 905873-5787(1993))。由BLAST算法提供的一种相似性测量为最小和概率(P(N)),其提供了对两个核苷酸或氨基酸序列间偶然发生匹配的可能性的指示。例如,如果在测试氨基酸序列与蛋白质(如蛋白酶)氨基酸序列的比较中最小和可能性为小于约0.1,更优选小于约0.01和最优选小于约0.001时,认为氨基酸序列与蛋白质(如蛋白酶)相似。
优选地,变体启动子的相似性为与具有SEQ ID NO1、SEQ IDNO2、SEQ ID NO15、SEQ ID NO16、SEQ ID NO17、SEQ ID NO18或SEQ ID NO19的DNA序列之一至少40%同源。更优选地,相似性为与具有SEQ ID NO1、SEQ ID NO2、SEQ ID NO15、SEQ ID NO16、SEQ IDNO17、SEQ ID NO18或SEQ ID NO19的DNA序列至少50%,更优选至少60%,更优选至少70%,更优选至少80%,更优选至少90%和更优选至少95%或至少98%同源。
除天然存在的启动子序列等位变体外,技术人员知道可通过突变将改变引入来自SEQ ID NO1、SEQ ID NO2、SEQ ID NO15、SEQ IDNO16、SEQ ID NO17、SEQ ID NO18或SEQ ID NO19的启动子序列中,而本质上不改变其启动子功能。
本发明的启动子序列可得自任何属的微生物。就本发明的目的而言,在本文中与给定来源结合使用术语“得自”应指多肽由所述来源制造或由来插入了自所述来源的基因的细胞制造。优选微生物为原核生物。优选的原核生物为Bacillus和E.coli。优选的Bacilli为Bacillus subtilis、Bacillusamyloliquefaciens、Bacillus licheniformis、Bacillus alcalophilus、Bacillusclausii、Bacillus brevis、Bacillus circulans、Bacillus firmus、Bacilluspumilis、Bacillus stearothermophilus、Bacillus megaterium、Bacilluslentus或Bacillus thuringiensis。
或者,启动子序列得自真核生物,优选真菌来源,并更优选来自酵母菌株,如Candida、Hansenula、Kluyveromyces、Pichia、Saccharomyces、Schizosaccharomyces或Yarrowia菌株;或更优选地,来自丝状真菌菌株,如Acremonium、Aspergillus、Aureobasidium、Cryptococcus、Filibasidium、Fusarium、Humicola、Magnaporthe、Mucor、Myceliophthora、Neocallimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、Schizophyllum、Talaromyces、Thermoascus、Thielavia、Tolypocladium或Trichoderma菌株。
在优选的实施方案中,启动子序列得自Saccharomycescarlsbergensis、Saccharomyces cerevisiae、Saccharomyces diastaticus、Saccharomyces douglasii、Saccharomyces kluyveri、Saccharomycesnorbensis、Saccharomyces oviformis、Saccharomyces bayanus、Saccharomyces bayanus,var.uvarum或Saccharomyces pastorianus菌株。
在另一优选的实施方案中,启动子序列得自Aspergillus aculeatus、Aspergillus awamori、Aspergillus foetidus、Aspergillus japonicus、A.nidulans、A.niger优选A.niger CBS 513.88、A.sojae、Aspergillus oryzae(A.oryzae)、Humicola insolens、Humicola lanuginosa、Mucor miehei、Myceliophthora thermophila、Neurospora crassa、Penicilliumpurpurogenum、Trichoderma harzianum、Trichoderma koningii、Trichoderma longibrachiatum、Trichoderma reesei或Trichoderma viride菌株。
在另一优选的实施方案中,启动子序列得自Fusarium bactridioides、Fusarium cerealis、Fusarium crookwellense、Fusarium culmorum、Fusariumgraminearum、Fusarium graminum、Fusarium heterosporum Fusariumnegundi、Fusarium oxysporum、Fusarium reticulatum、Fusarium roseum、Fusarium sambucinum、Fusarium sarcochroum、Fusarium sporotrichioides、Fusarium sulphureum、Fusarium torulosum、Fusarium trichothecioides、Fusarium venenatum菌株。
应当理解对于上述物种而言,本发明包括完美和不完美的状态,和其它分类学等价物(例如无性型),而无论其被已知的物种名如何。本领域技术人员会容易地识别合适等价物的性质。公众可以在大量培养物收集中容易地得到这些物种的菌株,所述培养物收集如美国模式培养物保藏单位(ATCC)、Deutsche Sammlung von Mikroorganismen und ZellkulturenGmbH(DSM)、Centraalbureau Voor Schimmelcultures(CBS)和AgriculturalResearch Service Patent Culture Collection,Northern Regional Research Center(NRRL)。
此外,可使用上述探针从其它来源中鉴定或获得根据本发明的启动子序列,所述其它来源包括从自然(例如土壤、堆肥、水等)中分离的微生物。用于从天然生境中分离微生物的技术为本领域公知。然后可类似地筛选另一微生物的基因组DNA文库得到核酸序列。一旦用探针检测到了编码启动子的核酸序列,则可通过使用本领域常规技术人员已知地技术分离或克隆该序列(参阅例如Sambrook et al.,1989,上文)。
在本发明中,启动子DNA序列还可以是杂交启动子,其包含一个或多个本发明启动子的部分;本发明启动子的部分和另一已知启动子的部分(如一个启动子的前导序列和来自另一启动子的转录起始位点);或本发明一个或多个启动子的部分和一个或多个其它启动子的部分。其它启动子可以是在所选的宿主细胞中显示转录活性的任何启动子序列,包括变体的、截短的和杂交启动子,并可得自编码与所述宿主细胞同源或异源的细胞外或细胞内多肽的基因。其它启动子序列对于编码多肽的核酸序列来说可以是同源或异源的,并可对细胞来说是同源或异源的。
作为一种优选的实施方案,经鉴定的启动子的重要调节亚序列可与其它“基本”启动子融合以增强它们的启动子活性(例如描述于MolMicrobiol.1994May;12(3)479-90.Regulation of the xylanase-encoding xlnAgene of Aspergillus tubigensis.de Graaff LH,van den Broeck HC,van OoijenAJ,Visser J.) 适用于用本发明启动子构建杂交启动子的其它启动子的其它实例包括得自下述基因的启动子A.oryzae TAKA淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、A.niger中性α-淀粉酶、A.niger酸稳定α-淀粉酶、A.niger或Aspergillus awamori葡萄糖淀粉酶(glaA)、A.niger gpdA、A.niger葡萄糖氧化酶goxC、Rhizomucor miehei脂酶、A.oryzae碱性蛋白酶、A.oryzae磷酸丙糖异构酶、A.nidulans乙酰胺酶和Fusarium oxysporum胰蛋白酶样蛋白酶(WO 96/00787)以及NA2-tpi启动子(来自A.niger中性α-淀粉酶基因的启动子和A.oryzae磷酸丙糖异构酶的杂种)、Saccharomycescerevisiae烯醇化酶(ENO-1)、Saccharomyces cerevisiae半乳糖激酶(GAL1)、Saccharomyces cerevisiae醇脱氢酶/甘油醛-3-磷酸盐脱氢酶(ADH2/GAP)和Saccharomyces cerevisiae 3-磷酸甘油酸酯激酶,及其突变体、截短的启动子和杂交启动子。适用于酵母宿主细胞的其它启动子由Romanos et al.,1992,Yeast 8423-488描述。其它用于细菌细胞的有用启动子为以下基因的启动子B.subtilis碱性蛋白酶(apr)、B.subtilis中性蛋白酶(npr)、B.amyloliquefaciens α-淀粉酶(amyQ)、B.amyloliquefaciens碱性蛋白酶(apr)和B.amyloliquefaciens中性蛋白酶(npr)。
在本发明中,启动子DNA序列还可以是“串联启动子”。“串联启动子”在本文中被定义为两个或更多启动子序列,其各与编码序列可操作连接并介导编码序列到mRNA的转录。
串联启动子包含两个或更多本发明的启动子,或者一个或多个本发明的启动子和一个或多个其它已知启动子,如上举例适用于构建杂交启动子的那些。串联启动子的两个或更多启动子序列可同时启动核酸序列的转录。或者串联启动子的一个或多个启动子序列可在细胞生长的不同阶段、或在真菌宿主的情况下时在菌丝体形态学上不同的部分、或在成孢子的细菌(如bacilli)中孢子发育中不同的细胞区室内启动核酸序列的转录。
在本发明中,启动子可编码序列和/或对宿主细胞可以是外源的。本发明的变体、杂交或串联启动子应被理解为对编码多肽的DNA序列外源,即使野生型的启动子对编码序列或对宿主细胞是内源的。
本发明的变体、杂交或串联启动子具有为来自SEQ ID NO1、SEQ IDNO2、SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24和早先定义的任何启动子的至少约20%,优选至少约40%,更优选至少约60%,更优选至少约80%,更优选至少约90%,更优选至少约100%,进一步更优选至少约200%,最优选至少约300%,和进一步最优选至少约400%的启动子活性。启动子活性优选如先前所述来确定。最优选启动子活性使用Norhtern印迹通过mRNA分析确定。
DNA构建体 根据第二个方面,本发明提供下述DNA构建体,所述构建体包含与赋予可选择性状的报告基因可操作连接的如上部分所述的本发明启动子DNA序列。报告基因可以是对合适宿主赋予可选择性状的任何基因。优选报告基因为选择性标记基因。
“DNA构建体”在本文中被定义为单链或双链的核酸分子,其分离自天然存在的基因,或其经修饰而含有以天然不存在的方式组合和并置的核酸片段。
当DNA构建体含有编码序列和编码序列表达所需的全部调控序列时,术语“DNA构建体”与术语“表达盒”同义。在本申请上下文中,术语“DNA构建体”与术语“经分离的DNA构建体”可互换使用,其中两个术语理解为同义。
DNA构建体可包含选择性标记基因,其允许容易选择经转化的宿主细胞。DNA构建体包含两个选择性标记基因时,技术人员会理解这两个选择性标记基因不相同与本发明启动子连接的第一个选择性标记基因用于本发明的筛选方法中,DNA构建体中存在的第二个选择性标记基因允许经转化的宿主细胞的标准选择。
报告基因与本发明的启动子DNA序列可操作连接,从而在给定的宿主细胞中所述报告基因能够在启动子DNA序列调控下表达。由报告子基因编码的多肽对宿主细胞和/或对启动子DNA序列可以是同源或异源的。
在本文上下文中“一个”是指“至少一个”。因此DNA构建体包含至少一个报告基因。宿主可与至少两个DNA构建体共转化,其中一个包含选择性标记而另一个包含与报告基因连接的本发明启动子。或者根据更优选的实施方案,DNA构建体中包含的报告基因为包含至少一部分一个报告基因和至少一部分第二个报告基因的杂交报告基因,其中第一个和第二个报告基因的编码序列按读码框彼此配对,且其中所述杂交报告基因与本发明启动子可操作连接。第一个和/或第二个报告基因可以是赋予合适宿主可选择性状的任何基因。用于真菌的优选杂交报告基因包括Streptoalloteichus hindustanis(Drocourt et al.,NAR,1990)的GFP基因和腐草霉素抗性基因(BLE)。
选择性标记或可选择标记为下述基因,所述基因的产生提供抗微生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养型等。用于原核宿主细胞的合适可选择标记包括但不仅限于卡那霉素、新霉素、红霉素和其它MLS型标记物(大环内酯-林肯酰胺-蜜柑霉素B)、氯霉素、氨苄西林、四环素、链霉素和壮观霉素。用于酵母的合适标记物为ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于在丝状真菌宿主细胞中使用的可选择标记物包括但不仅限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲基转移酶)、bar(膦丝菌素乙酰转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸盐还原酶)、pyrG(乳清苷-5′-磷酸脱羧酶)、sC(硫酸腺嘌呤基转移酶)、trpC(邻氨基苯甲酸合酶)及其等效物。也可使用提供针对例如腐草霉素、潮霉素B或G418抗性的标记。优选用于Aspergillus细胞的为A.nidulans或A.oryzae的amdS和pyrG基因和Streptomyces hygroscopicus的bar基因。amdS标记基因优选应用EP 635574B或WO 97/06261中所述技术使用。优选的选择性标记基因为与A.nidulans gpdA启动子融合的A.nidulans amdS编码序列(EP635 574B)。也可使用来自其它丝状真菌的amdS基因(WO 97/06261)。
根据另一优选的实施方案,报告基因编码用于如上所述的原核、酵母和/或丝状真菌细胞的可选择标记物。或者报告基因编码如下的报告子蛋白β-半乳糖苷酶、β-葡萄糖苷酸酶、水母发光蛋白、绿色荧光蛋白(GFP)及其变体(红色、氰基、黄色荧光蛋白)、萤光素酶、lux、血红素、β-内酰胺酶或碱性磷酸酶。更优选地,报告基因为或包含编码荧光报告子蛋白的基因,所述荧光报告子蛋白例如但不仅限于GFP、YFP和CFP(分别为绿色、黄色和氰基荧光蛋白质)。转化体将显示荧光并可使用光电管分选技术(FACS,荧光活化的细胞分选)从非表达克隆中分离。该方法的一个重要优点为不需要将转化混合物涂布平板(其显著的提高了筛选方法的通量),并且阳性克隆可直接排列为MTP形式用于进一步的自动化处理。或者报告基因编码(跨)膜蛋白或细胞壁蛋白,抗体可出现在其上。可使用磁细胞分选技术(

,Magnetic cell sorting,www.miltenyibiotec.com)从非表达转化体中分离显示所述膜蛋白的转化体。
调控元件 DNA构建体除启动子DNA序列外可进一步包含一种或多种调控序列,其在宿主细胞中在与调控序列相容的条件下指导报告基因的表达。表达应被理解为包括多肽产生中涉及的任何步骤,其包括但不仅限于转录、转录后修饰、翻译、翻译后修饰和分泌。一个或多个调控序列对编码序列或宿主来说可以是内源的。或者可以用一个或多个对核酸序列外源的调控序列代替一个或多个调控序列,用于改善编码序列在宿主细胞中的表达。
术语“调控序列”在本文中被定义为包括编码序列(如报告基因)表达必需或有利的所有组件,包括本发明的启动子。各调控序列对编码多肽的编码序列来说可以是内源的或外源的。这类调控序列包括但不仅限于前导序列、最佳翻译起始序列(如Kozak,1991,J.Biol.Chem.26619867-19870中所述)、多腺苷酸化序列、前肽序列、信号肽序列、上游激活序列、本发明的启动子(包括其的变体、片段和杂交和串联启动子)和转录终止子。调控序列最少包括转录和翻译终止信号和本发明启动子(部分)。调控序列可以与用于引入特异限制性位点目的的接头一起提供,所述限制性位点便于连接调控序列与编码多肽的编码序列(如报告基因)的编码区。
调控序列可以是合适的转录终止子序列,即被宿主细胞识别终止转录的序列。终止子序列与编码多肽的编码序列3’末端可操作连接。任何在所选宿主细胞中有功能的终止子可用于本发明。
技术人员会理解序列的5’端和3’端根据各编码序列定义。对于给定的终止子序列和给定的编码序列而言,技术人员会知道如何将它们可操作连接在一起。
用于丝状真菌宿主细胞的优选终止子得自A.oryzae TAKA淀粉酶、A.niger葡萄糖淀粉酶、A.nidulans邻氨基苯甲酸合酶、A.niger α-葡萄糖苷酶、trpC基因和Fusarium oxysporum胰蛋白酶样蛋白酶基因。
用于酵母宿主细胞的优选终止子得自以下基因Saccharomycescerevisiae烯醇化酶、Saccharomyces cerevisiae细胞色素C(CYC1)和Saccharomyces cerevisiae甘油醛-3-磷酸盐脱氢酶。用于酵母宿主细胞的其它有用终止子由Romanos et al,1992,上文描述。调控序列还可为合适的前导序列,即mRNA的非翻译区,其对宿主细胞翻译是重要的。前导序列与编码多肽的核酸序列5’末端可操作地连接。在所选宿主细胞中有功能的任何前导序列可用于本发明。
用于丝状真菌宿主细胞的优选前导序列得自A.oryzae TAKA淀粉酶、A.nidulans磷酸丙糖异构酶和A.niger葡萄糖淀粉酶基因。
用于酵母宿主细胞的合适前导序列来自Saccharomyces cerevisiae烯醇化酶(ENO-1)、Saccharomyces cerevisiae 3-磷酸甘油酸酯激酶、Saccharomyces cerevisiaeα-因子和Saccharomyces cerevisiae醇脱氢酶和甘油醛-3-磷酸酯脱氢酶(ADH2/GAP)基因。
调控序列还可以是聚腺苷酸化序列,所述序列与核酸序列3’末端可操作连接。用于丝状真菌宿主细胞的优选的聚腺苷酸化序列得自A.oryzaeTAKA淀粉酶、A.niger葡萄糖淀粉酶、A.nidulans邻氨基苯甲酸合酶、Fusarium oxysporum胰蛋白酶样蛋白酶和A.nidulans α-葡萄糖苷酶。
用于酵母宿主细胞的有用聚腺苷酸化序列由Guo and Sherman,1995,Molecular Cellular Biology 155983-5990描述。
还可期望添加调节序列,其允许多肽表达的调节与宿主细胞的生长相关。调节体系的实例为响应化学或物理刺激(包括调节化合物的存在)引起基因的表达被打开或关闭的那些。原核体系中的调节体系包括E.coli的lac和trp操纵子体系,和B.subtilis的spac、xyl、sacB和citM体系(在Meima et al.(2004)Expression Systems in Bacillus.In″Protein ExpressionTechnologies.Current status and future trends″(F.Baneyx,ed.),HorizonBioscience,Wymondham,Norfolk,UK,pp.199-252中综述)。在杆菌中中适用于调控表达的其它启动子为在营养饥饿条件下被诱导的启动子,如分别位于磷酸盐和氮调控下的Pho调节子和TnrA/GlnR体系。在酵母中可使用ADH2体系或GAL1体系。在丝状真菌中,可使用如US 5,503,991中所述的TAKA α-淀粉酶启动子、A.niger葡萄糖淀粉酶启动子、A.oryzae葡萄糖淀粉酶启动子、A.tubingensis木聚糖内切酶(xlnA)启动子、A.niger硝酸盐还原酶(niaD)启动子、Trichoderma reesei纤维二糖水解酶启动子和A.nidulans醇和醛脱氢酶(分别为alcA和aldA)作为调节序列。调节序列的其它实例为允许基因扩增的调节序列。在真核体系中,这些调节序列包括二氢叶酸还原酶基因(其在存在甲氨喋呤时被扩增)和金属硫蛋白基因(其在有重金属时被扩增)。在这些情况下,编码多肽的核酸序列应与调节序列可操作地连接。
本发明启动子DNA序列中的内源调节序列可以被去除,例如去除creA结合位点(如早先在EP 673 429B中所述的碳分解代谢物阻遏)、改变pacC和areA(用于pH和氮调节)。在B.subtilis中,碳代谢物阻遏(CCR)涉及CcpA蛋白质与cre元件的结合。cre元件与木糖诱导型的xyl启动子组合用于开发表达体系,所述表达体系允许双重调控目的基因(Bhavsar et al.(2001)Appl Environ Microbiol67403)。
优选地,DNA构建体包含本发明的启动子DNA序列、与所述启动子DNA序列可操作连接的编码序列和翻译调控序列,如 -选自以下序列列表的依照5’到3’方向的一种翻译终止序列TAAG、TAGA和TAAA,优选TAAA,和/或 -选自以下序列列表的依照5’到3’方向的一种翻译起始编码序列GCTACCCCC;GCTACCTCC;GCTACCCTC;GCTACCTTC;GCTCCCCCC;GCTCCCTCC;GCTCCCCTC;GCTCCCTTC;GCTGCCCCC;GCTGCCTCC;GCTGCCCTC;GCTGCCTTC;GCTTCCCCC;GCTTCCTCC;GCTTCCCTC;和GCTTCCTTC,优选GCT TCC TTC和/或 -选自以下序列列表的一种转录起始序列5′-mwChkyCAAA-3′、5′-mwChkyCACA-3′或5′-mwChkyCAAG-3′,其中采用针对核苷酸的不确定编码m(A/C);w(A/T);y(C/T);k(G/T);h(A/C/T),优选5′-CACCGTCAAA-3′或5′-CGCAGTCAAG-3′。
在本发明上下文中,术语“翻译起始编码序列”被定义为DNA编码序列开放读码框的起始子或起始密码子紧邻上游的九个核苷酸。起始子或起始密码子编码AA甲硫氨酸。起始密码子典型地为ATG,但是也可以是任何功能性起始密码子如GTG。
在本发明上下文中,术语“翻译终止序列”被定义为从开放读码框或核苷酸编码序列3’端翻译终止密码子开始的,并依照5’到3’方向的三个或四个核苷酸。
在本发明上下文中,术语“翻译起始序列”被定义为编码多肽的DNA序列开放读码框起始子或起始密码子紧邻下游的十个核苷酸。起始子或起始密码子编码甲硫氨酸这种氨基酸。起始密码子典型为ATG,但是也可以是任何功能性起始密码子,如GTG。本领域公知在RNA中尿嘧啶U代替脱氧核苷酸胸腺嘧啶T。
用于原核生物的优选调控序列已在EP 284 126A中描述。
本发明还涉及重组表达载体,其包含与报告基因可操作连接的本发明启动子和转录和翻译起始和终止信号。上述多种报告基因和调控序列可以结合在一起,产生下述重组表达载体,所述重组表达载体可包括一个或多个便利的限制性位点,所述限制性位点允许在这类位点处插入或取代启动子和/或报告基因。或者可通过例如Gene.1989 Apr 15;77(1)51-9.Ho SN,Hunt HD,Horton RM,Pullen JK,Pease LR″Site-directed mutagenesis byoverlap extension using the polymerase chain reaction″中所述的使用PCR的序列重叠延伸(SOE-PCR),或通过使用GatewayTM克隆体系(Invitrogen)克隆完成编码序列和启动子的融合。
重组表达载体可以是能够转化宿主细胞的任何载体。对载体的选择典型地会取决于载体与其被引入的宿主细胞间的相容性。载体可以是线性或闭环质粒。载体可以是整合的或自主复制的载体。
载体可以是自主复制载体(即作为染色体外实体存在时其复制不依赖于染色体复制)例如质粒、染色体外因子、微型染色体或人工染色体。自主复制载体可包含确保自主复制的任何手段。载体可以是引入宿主细胞时被整合进基因组,并与其被整合进的染色体一起复制的载体。另外,可以使用包含要引入宿主细胞基因组中全部DNA或转座子的单个载体或质粒或两个或更多的载体或质粒,或转座子。自主维持克隆载体的一个实例为包含AMA1-序列的克隆载体。AMA1为从A.nidulans分离的6.0kb基因组DNA片段,其能够在Aspergillus中自主维持(参阅例如Aleksenko andClutterbuck(1997),Fungal Genet.Biol.21373-397)。适用于在革兰氏阳性细菌如B.subtilis和B.amyloliquefaciens中表达的自主复制载体的实例为葡萄球菌载体pUB110(McKenzie et al.(1986)Plasmid 1593)和内源B.subtilis质粒pTA1015、pTA1040和pTA1060和来自它们的载体(例如pHB201;Bron et al.(1998)J Biotechnol 643)。
本发明的载体优选含有下述元件,所述元件允许载体稳定整合进宿主细胞基因组或允许载体在细胞中独立于基因组自主复制。
就整合进宿主细胞基因组而言,载体可依赖于启动子序列和/或报告基因序列或载体的任何其它元件,用于通过同源重组或非同源重组将载体稳定整合进基因组。或者载体可含有用于指导通过同源重组整合进宿主细胞基因组的额外的核酸序列。所述额外的核酸序列使得载体能够在染色体中精确的靶位点整合进宿主细胞基因组。为了提高精确位点整合的可能性,整合元件应优选含有足够数量的核酸,例如20到50个,优选55到95个,优选100到1,500个碱基对,优选400到1,500个碱基对,更优选800到1,500个碱基对并最优选至少2kb,所述核酸与宿主细胞基因组中预先确定的靶基因座的DNA序列同源。整合元件可以是与宿主细胞基因组中靶序列同源的任何序列。另外,整合元件可以是非编码或编码核酸序列。为了促进靶向的整合,克隆载体优选在转化宿主细胞之前线性化。线性化优选以下述方式进行克隆载体的至少一端(但是优选两端)侧翼为与靶位点同源的序列。
优选地,表达载体中与靶位点同源的整合元件来自高度表达的基因座,即它们来自能够在真菌宿主细胞中高水平表达的基因。能够有高表达水平的基因(即高表达的基因)在本文中定义为下述基因,所述基因的mRNA可占据总细胞mRNA的至少0.5%(w/w)(例如在经诱导的条件下),或者,所述基因的基因产物可占据总细胞蛋白质的至少1%(w/w),或在经分泌的基因产物情况下,所述基因的基因产物可分泌至至少0.1g/l的水平(如EP 357127B1中所述)。大量优选的高表达真菌基因以实例的方式给出淀粉酶、葡萄糖淀粉酶、醇脱氢酶、木聚糖酶、磷酸甘油醛脱氢酶或来自Aspergilli或Trichoderma的纤维二糖水解酶基因。用于这些目的的最优选的高表达基因为葡萄糖淀粉酶基因,优选A.niger葡萄糖淀粉酶基因、A.oryzae TAKA-淀粉酶基因、A.nidulans gpdA基因、SEQ IDNO25、SEQ ID NO26、SEQ ID NO27、SEQ ID NO28和SEQ ID NO29基因座,优选SEQ ID NO25、SEQ ID NO26、SEQ ID NO27、SEQ IDNO28和SEQ ID NO29的A.niger基因座或Trichoderma reesei纤维二糖水解酶基因。
或者,载体可以通过非同源重组整合进宿主细胞基因组。
或者,和/或与上述实施方案组合,可在本发明步骤(e)中针对制造(优选分泌)目的蛋白质对细胞进行生产(筛选)后,从宿主细胞中缺失下述DNA构建体,所述DNA构建体包含与本发明启动子可操作连接的报告基因。步骤(e)稍后描述。这使得宿主细胞能够直接用于制造目的蛋白质,而所述宿主细胞不包含报告基因和/或可选择标记基因。为了能够缺失本发明的DNA构建体,DNA构建体优选包含报告基因和DNA重复之间的双向可选择标记。DNA重复允许通过内染色体同源重组缺失DNA构建体。该方法与EP 0635574所述的″MARKER-GENE FREE″方法类似。
对自主复制而言,载体可以还包含允许载体在所述宿主细胞中自主复制的复制起点。用于酵母宿主细胞的复制起点实例为2微米复制起点、ARS1、ARS4、ARS1和CEN3的组合,和ARS4和CEN6的组合。复制起点可以是具有下述突变的复制起点,所述突变使宿主细胞中复制起点的功能对于温度敏感(参阅例如Ehrlich,1978,Proceedings of the NationalAcademy of Sciences USA 751433)。
可将多于一个拷贝的本发明DNA构建体插入宿主细胞中。这可通过优选将数拷贝DNA序列整合进其基因组中,更优选通过将DNA序列的整合靶向高表达基因座(优选葡萄糖淀粉酶基因座或SEQ ID NO25、SEQID NO26、SEQ ID NO27、SEQ ID NO28和SEQ ID NO29的基因座)中完成。或者这可通过在核酸序列中包含可扩增的可选择标记基因,使细胞含有经扩增的拷贝的可选择标记基因,并从而可通过例如在存在适当可选择剂时培养细胞用于选择额外拷贝的核酸序列。为了进一步提高要过表达的DNA序列的拷贝数,可使用如WO98/46772中所述的基因转换技术。
用于连接上述元件以构建本发明重组表达载体的方法为本领域技术人员公知(参阅例如Sambrook et al.,1989,上文)。
宿主细胞 本发明还涉及用上一部分定义的DNA构建体转化的重组宿主细胞,所述DNA构建体包含与报告基因可操作连接的本发明的启动子DNA序列。优选地,经转化的宿主细胞还包含包含下述DNA序列的额外的DNA构建体,所述DNA序列包含来自下述生物DNA文库的编码序列,所述生物可能能够制造一种或多种具有目的特性的蛋白质。
这类细胞可有利地用于下一部分中描述的表达克隆方法中。包含与报告基因可操作连接的本发明启动子DNA序列的表达载体被引入宿主细胞。再用包含下述DNA序列的DNA构建体或表达载体转化宿主细胞,所述DNA序列包含来自DNA文库的编码序列。如先前所述,DNA构建体或表达载体均作为染色体整合体或作为自我复制染色体外载体。宿主细胞的选择在很大程度上取决于其中制造了DNA文库的生物和/或取决于所使用的启动子DNA序列的来源。
宿主细胞可以是任何微生物。优选地,宿主细胞与制备DNA文库的宿主细胞相同,和/或与如说明书中早先定义的本发明启动子来源的宿主细胞为相同生物。根据一种优选的实施方案,宿主细胞为原核生物或真核生物。根据一种更优选的实施方案,适用于本发明方法的宿主细胞为原核生物,更优选地,在启动子部分定义为启动子来源的原核生物。更优选地,原核宿主细胞为Bacillus宿主细胞,优选地,Bacillus Subtilis、Bacilluslicheniformis和/或Bacillus amyloliquefaciens种。
根据另一更优选的实施方案,适用于本发明方法的宿主细胞为真菌。
宿主细胞可以是野生型丝状真菌宿主细胞或变体、突变体或经遗传修饰的丝状真菌宿主细胞。在本发明优选的实施方案中,宿主细胞为蛋白酶缺陷或蛋白酶负型菌株。这可以是称为“alp”的碱性蛋白酶基因被缺失的蛋白酶缺陷菌株Aspergillus oryzae JaL 125(描述于WO 97/35956或EP429490)或公开于WO 96/14404中的A.niger三肽基氨基肽酶(TRAP)缺陷菌株。另外,根据本发明也考虑WO 01/68864中描述的转录激活子(prtT)产生减少的宿主细胞。另一特别考虑的宿主菌株为Aspergillus oryzaeBECh2,其中出现在亲本菌株IF04177中的三个TAKA淀粉酶基因被灭活。另外,两个蛋白酶(碱性蛋白酶和中性金属蛋白酶11)通过基因破坏被破坏。通过突变破坏了形成代谢产物环并偶氮酸和曲酸的能力。BECh2描述于WO 00/39322并来自JaL228(描述于WO 98/12300),所述JaL228也是US 5,766,912中公开为A1560的IF04177的突变体。
任选地,丝状真菌宿主细胞与野生型细胞相比包含提高的解折叠蛋白应答(UPR)以增强目的多肽的生产能力。UPR可通过US2004/0186070A1和/或US2001/0034045A1和/或WO01/72783A2和/或WO2005/123763中描述的技术提高。更具体地,HAC1和/或IRE1和/或PTC2的蛋白质水平被调节,和/或SEC61蛋白质被设计从而获得具有提高的UPR的宿主细胞。
或者,或与提高的UPR一起,宿主细胞可通常被遗传修饰以获得下述表型,所述表型与野生型细胞相比显示更低的蛋白酶表达和/或蛋白酶分泌,从而增强目的多肽的制造能力。这类表型可通过缺失和/或修饰和/或灭活蛋白酶表达的转录调节子获得。这类转录调节子为例如prtT。通过调节prtT降低蛋白酶的表达可通过US2004/0191864A1和EP2005/055145中所述技术进行。
或者,或与提高的UPR和/或显示更低蛋白酶表达和/或蛋白酶分泌的表型一起,宿主细胞显示草酸盐缺陷表型,从而增强目的多肽的制造量。草酸盐缺陷表型可通过WO2004/070022A2和WO2000/50576中描述的技术获得。
或者,或与提高的UPR和/或显示更低蛋白酶表达和/或蛋白酶分泌和/或草酸盐缺陷的表型一起,宿主细胞显示与野生型细胞相比表型差异的组合,从而提高目的多肽的制造量。这些差异可包括,但不仅限于降低的葡萄糖淀粉酶和/或中性α-淀粉酶A和/或中性α-淀粉酶B、α-1、6转葡萄糖基酶、蛋白酶和草酸水解酶的表达。所述由宿主细胞显示的表型差异可根据US2004/0191864A1中所述技术通过遗传修饰获得。
或者,或与上述表型组合,核酸构建体通过同源重组靶向整合进入宿主细胞基因组(即整合进预先确定的靶位点)的效率优选通过宿主细胞的增强的同源重组能力提高。细胞的这类表型优选涉及WO2005/095624中描述的缺陷hdfA或hdfB基因。WO2005/095624公开了获得具有提高的靶向整合能力的丝状真菌细胞的优选方法。
更优选地,本发明的宿主细胞选自以下列表Bacillus、酵母和丝状真菌,优选Aspergillus、Penicillium或Trichoderma种。进一步更优选Aspergillus宿主细胞为Aspergillus niger或Aspergillus sojae或Aspergillusoryzae种。
本发明还涉及重组的宿主细胞,所述宿主细胞包含多于一个本发明的启动子DNA序列,各启动子与一个报告基因可操作连接。这类宿主细胞可有利地用于下一部分种所述的表达克隆方法中。可通过多种方法转化细菌细胞,包括化学诱导的感受态(例如CaCl2)或电穿孔(Sambrook et al.(1989)″Molecular Cloninga laboratory manual″,Cold Spring HarborLaboratories,Cold Spring Harbor,New York)、原生质体转化(Chang andCohen(1979)Mol Gen Genet 168111)以及,在一些Bacillus种的情况下为天然感受态(Spizizen(1958)Proc Natl Acad Sci USA 441072)。可通过下述方法转化真菌细胞,所述方法涉及原生质体形成、原生质体转化和以本身已知的方式再生细胞壁。用于转化Aspergillus宿主细胞的合适方法描述于EP 238 023和Yelton et al.,1984,Proceedings of the National Academyof Sciences USA 811470-1474。使用Agrobacterium tumefaciens转化Aspergillus和其它丝状真菌宿主细胞的合适方法描述于例如Nat Biotechnol.1998 Sep;16(9)839-42.Erratum inNat Biotechnol 1998 Nov;16(11)1074.Agrobacterium tumefaciens-mediated transformation of filamentous fungi,deGroot MJ,Bundock P,Hooykaas PJ,Beijersbergen AG.Unilever ResearchLaboratory Vlaardingen,The Netherlands。用于转化Fusarium种的合适方法描述于Malardier et al.,1989,Gene 78147-156和WO 96/00787。可使用Becker and Guarente,In Abelson,J.N.and Simon,M.I.,editors,Guide toYeast Genetics and Molecular Biology,Methods in Enzymology,Volume 194,pp 182-187,Academic Press,Inc.,New York;lto et al.,1983,Journal ofBacteriology 153163;和Hinnen et al.,1978,Proceedings of the NationalAcademy of Sciences USA 751920中描述的方法转化酵母。原核生物的转化可如EP 284 126A中所述进行。
表达克隆方法 根据另一方面,本发明提供用于在宿主细胞中分离包含下述DNA序列的DNA序列的方法,所述DNA序列编码目的蛋白质,所述方法包含步骤 (a)制备第一DNA构建体,其包含与赋予可选择性状的报告基因可操作连接的启动子DNA序列;当所述DNA构建体存在于宿主细胞中和当宿主细胞产生目的蛋白质(优选地,被分泌的目的蛋白质)时,所述启动子DNA序列被诱导; (b)制备第二DNA构建体,其包含包含下述DNA序列的DNA序列,所述DNA序列编码来自下述生物DNA文库的目的蛋白质,所述生物被怀疑能够制造一种或多种目的蛋白质; (c)用(a)和(b)中制备的两种DNA构建体转化宿主细胞; (d)在有助于制造DNA文库中存在的目的蛋白质的条件下,培养(c)中获得的所有经转化的宿主细胞;和 (e)通过分析在(d)中制造的蛋白质,筛选制造目的蛋白质的经转化的宿主细胞。
步骤(a) 制备第一DNA构建体,其包含与赋予可选择性状的报告基因可操作连接的启动子DNA序列;当所述DNA构建体存在于宿主细胞中和当宿主细胞产生目的蛋白质(优选地,被分泌的目的蛋白质)时,所述启动子DNA序列被诱导。
第一DNA构建体中存在的启动子为当宿主细胞产生目的蛋白质(优选被分泌当目的蛋白质)时被诱导的启动子。
在本发明中,术语“被诱导的”定义为在相同培养条件下,与相应对照宿主细胞不(过量)产生目的蛋白质时的启动子活性相比,当宿主细胞(过量)产生(优选分泌)目的蛋白质时,本发明启动子的启动子活性提高。优选地,当宿主细胞中(过量)产生(优选分泌)目的蛋白质时,与相同培养条件下其中不(过量)产生目的蛋白质的相应对照宿主细胞相比,启动子活性提高至少约1.5倍,更优选至少约两倍,更优选至少约三倍,更优选至少约四倍,更优选至少约五倍,进一步更优选至少约六倍,进一步更优选至少约八倍,进一步更优选至少约十倍,进一步更优选至少约二十倍,进一步更优选至少约50倍,以及最优选至少约100倍。更优选地,启动子活性提高是无限的,即当不(过量)产生目的蛋白质时,未检测到启动子活性或启动子是无活性的,而当(过量)产生目的蛋白质时,启动子被诱导。优选如前所述确定启动子活性。最优选使用Northern印迹通过mRNA分析确定启动子活性。
可通过将制造目的蛋白质的细胞的基因表达谱与不制造所述蛋白质的对照菌株的基因表达谱比较,鉴定这类启动子。优选地,这类表达谱使用确立的DNA微阵列分析比较。或者可使用技术人员已知的其它方法(如Northern印迹或定量PCR分析)比较表达谱。比较表达谱的最优选的方法如下进行首先通过DNA微阵列分析比较表达谱,然后通过Northern印迹随后确证微阵列结果。根据优选的实施方案,启动子为启动子部分描述的本发明的启动子DNA序列。
根据另一优选的实施方案,当宿主细胞为Bacillus细胞时,启动子来自下列基因组DNA序列htrA(SEQ ID NO1)或htrB(SEQ ID NO2)。优选启动子DNA序列来自位于起始密码子上游的这些基因组DNA序列之一的非编码部分,或为位于上游的所述基因组序列的部分。更优选所使用的启动子为SEQ ID NO1或SEQ ID NO2的DNA序列。
根据另一优选的实施方案,当宿主细胞为丝状真菌细胞时,启动子来自下列基因组DNA序列SEQ ID NO20、SEQ NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24。优选地,启动子DNA序列来自位于起始密码子上游的这些基因组DNA序列之一的非编码部分,或为位于上游的所述基因组序列的部分。更优选地,所使用的启动子为SEQ IDNO15、SEQ NO16、SEQ ID NO17、SEQ ID NO18或SEQ ID NO19的DNA序列或其衍生物。
步骤(a)中制备的第一DNA构建体已经在相应的“DNA构建体”部分中描述,优选地,其包含如“DNA构建体”部分所述赋予可选择性状的报告基因。
步骤(b) 步骤(b)中制备的DNA构建体包含包含下述DNA序列的DNA序列,所述DNA序列编码来自下述生物DNA文库的目的蛋白质,所述生物被怀疑能够制造一种或多种目的蛋白质;可能制造一种或多种目的蛋白质的生物为原核生物或真核生物。优选的原核生物和真核生物的实例早先已在说明书中与本发明启动子的来源一起定义。根据另一优选的实施方案,该生物为Bacillus,更优选地,在启动子部分定义的Bacillus物种。根据另一优选的实施方案,该生物为真核生物,更优选为真菌,其中最优选丝状真菌。
在步骤(b)中制备的DNA构建体,优选包含如“DNA构建体”和“调控元件”部分中定义的调节序列。
在根据本发明的方法中,来自可能制造一种或多种目的蛋白质的DNA片段文库可以是基因组文库或cDNA文库。然而,在真核供体的情况下,优选使用cDNA文库以避免真菌宿主生物中启动子或剪接信号识别的问题。优选从分离自来源生物的mRNA中制备cDNA文库,所述来源生物在有助于目的蛋白质表达的条件下生长。
如果存在在宿主细胞表达蛋白质后可用于检测所述蛋白质的测定法,那么根据本发明的方法可应用于分离编码任何目的蛋白质或多肽的DNA序列。
步骤(c) 要用两种DNA构建体转化的宿主细胞的身份已描述于“宿主细胞”部分中。转化方法已在相同部分中描述。根据一个实施方案,用(a)和(b)中制备的构建体同时转化宿主细胞。或者,并根据另一实施方案,先用步骤(a)制备的DNA构建体转化宿主细胞,然后用用步骤(b)制备的DNA构建体转化宿主细胞。
根据优选的实施方案,宿主细胞为原核生物,优选Bacillus细胞,更优选为Bacillus subtilis,进一步更优选为htrA基因缺陷的Bacillus subtilis(其中htrA基因的至少部分编码区被缺失和/或取代和/或其中htrA基因的编码区仍然存在于所述Bacillus细胞的基因组中),最优选使用Bacillussubtilis BV2003(Hyyrylainen et al.(2001)MoI Microbiol 411159)。
或者,或与先前优选的实施方案结合,宿主细胞为Bacillus细胞,且报告基因编码如DNA构建体部分定义的荧光报告蛋白,最优选GFP。
或者,或与先前优选的实施方案结合,当宿主细胞为Bacillus细胞时,启动子来自以下列表所述基因组DNA序列htrA(SEQ ID NO1)或htrB(SEQ ID NO2)。优选地,启动子DNA序列来自位于起始密码子上游的这两个基因组DNA序列之一的非编码部分,或为位于上游的所述序列的部分。更优选地,所使用的启动子为来自SEQ ID NO1或SEQ ID NO2的启动子。根据最优选的实施方案,所使用的启动子和所使用的报告基因为与SEQ ID NO1可操作连接的GFP,或与SEQ ID NO2可操作连接的GFP。
根据另一优选的实施方案,所述生物为真核生物,更优选真菌,其中最优选丝状真菌。优选丝状真菌为Aspergillus、Penicillium或Trichoderma种。进一步更优选Aspergillus宿主细胞为Aspergillus niger或Aspergillussojae或Aspergillus oryzae种。最优选的宿主细胞为A.niger,优选CBS513.88或其衍生物。
或者,或与先前优选的实施方案结合,宿主细胞为丝状真菌细胞,报告基因编码如DNA构建体部分所定义的荧光报告蛋白,最优选GFP。或者报告基因编码可选择标记。更优选地,报告基因为荧光蛋白和可选择标记物的杂交报告基因。最优选杂交报告基因包含GFP和Streptoalloteichushindustanis的腐草霉素抗性基因(BLE)(Drocourt etal.,NAR,1990)。
或者,或与先前优选的实施方案结合,当宿主细胞为丝状真菌细胞时,启动子来自以下列表中存在的基因组DNA序列SEQ ID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24。优选启动子序列来自位于起始密码子上游的所列基因组DNA序列之一的非编码部分,或为位于上游的部分所述序列。更优选地,所使用的启动子为实施例3到7中所使用的启动子之一,并来自SEQ ID NO20、SEQ IDNO21、SEQ ID NO22、SEQ ID NO23或SEQ ID NO24。根据最优选的实施方案,所使用的启动子和所用的杂交报告基因为与启动子SEQ ID NO15可操作连接的GFP-BLE(SEQ ID NO61)、与启动子SEQ ID NO16可操作连接的GFP-BLE、与SEQ ID NO17可操作连接的GFP-BLE、与启动子SEQ ID NO18可操作连接的GFP-BLE或与启动子SEQ ID NO19可操作连接的GFP-BLE。
步骤(d) 用两种DNA构建体转化宿主细胞后,在有助于制造DNA文库中存在的目的蛋白质的条件下,培养所有获得的经转化的宿主细胞。根据检测目的蛋白质所需的测试法,将经转化的克隆传代并储存为固体培养基(例如琼脂平板)上或液体培养基中的菌落,由此在微孔滴定板的孔中培养、储存和/或测试个体文库克隆。
技术人员会理解通常对本领域已知克隆方法的适应可同样应用于本发明的方法中。所述适应包括但不仅限于例如筛选文库克隆池、筛选相同文库得到大量不同的目的蛋白质,以及再筛选、再分离和再克隆阳性克隆以确保更精确的结果。
技术人员可获得多种方法用于从筛选方法中鉴定为经转化的宿主细胞中分离编码目的蛋白质的DNA序列,和用于随后分析所分离的DNA序列。
步骤(e) 在步骤(d)之后,通过分析制造的蛋白质筛选经转化的宿主细胞用于制造目的蛋白质,优选地,分泌目的蛋白质。在步骤(e)中,通过监测由第一DNA构建体中存在的启动子DNA序列诱导的依赖于制造(优选依赖于分泌)的报告子表达,筛选制造(优选分泌)目的蛋白质的经转化的宿主细胞。
根据优选的实施方案,当宿主细胞为Bacillus细胞时,优选使用基于荧光的细胞分析测定法(例如荧光激活的细胞扫描、荧光激活的细胞分选(FACS)或荧光分析)进行筛选,以鉴定制造(优选分泌)目的蛋白质的经转化的宿主细胞,所述筛选通过监测由第一DNA构建体中存在的启动子DNA序列诱导的依赖于制造(优选地,依赖于分泌)的报告子表达。更优选宿主细胞为包含第一DNA构建体的Bacillus细胞,所述DNA构建体包含如SEQ ID NO1或其衍生物或SEQ ID NO2或其衍生物的启动子,所述DNA构建体还包含编码荧光报告子的报告基因,并且筛选使用基于荧光的细胞分析测定法进行。进一步更优选地,宿主细胞为Bacillus且第一DNA构建体包含 -与GFP可操作连接的启动子DNA序列SEQ ID NO1或其衍生物,或 -与GFP可操作连接的启动子DNA序列SEQ ID NO2或其衍生物 且筛选使用FACS进行。或者,或与先前的实施方案结合,筛选可使用例如比色测定法或使用选择性培养条件进行。技术人员会理解,根据所使用的报告基因,选择性培养条件是但不仅限于杀生物剂的使用、抗生素的使用、至少一种营养、原养型。
根据另一优选的实施方案,当宿主细胞为丝状真菌细胞时,优选通过在选择性培养条件下进行筛选,以鉴定制造(优选分泌)目的蛋白质的经转化的宿主细胞,所述筛选通过监测由本发明第一DNA构建体中存在的启动子DNA序列诱导的依赖于制造(优选依赖于分泌)的报告子表达。技术人员会理解基于所使用的报告基因,可相应选择选择性培养条件。选择性培养条件的实例是但不仅限于使用杀生物剂、使用抗生素、至少一种营养、原养型。或者,或与先前实施方案结合,筛选可使用比色、荧光的(如FACS)或基于酶活性的测定法进行。根据更优选的实施方案,宿主细胞为包含本发明第一DNA构建体的丝状真菌细胞,且筛选使用选择性培养条件进行。更优选地,宿主细胞为包含本发明第一DNA构建体的丝状真菌细胞时,所述DNA构建体包含选自下列的启动子SEQ IDNO15或其衍生物、SEQ ID NO16或其衍生物、SEQ ID NO17或其衍生物、SEQ ID NO18或其衍生物、SEQ ID NO19或其衍生物,所述DNA构建体还包含编码可选择标记的报告基因,且筛选使用选择性培养条件进行。进一步更优选地,宿主细胞为包含本发明第一DNA构建体的丝状真菌细胞,所述DNA构建体包含选自下列的启动子SEQ ID NO15或其衍生物、SEQ ID NO16或其衍生物、SEQ ID NO17或其衍生物、SEQ IDNO18或其衍生物、SEQ ID NO19或其衍生物,所述DNA构建体还包含杂交报告基因如SEQ ID NO61,且筛选使用选择性培养条件进行。
根据另一更优选的实施方案,宿主细胞为包含本发明第一DNA构建体的A.niger细胞,且筛选使用选择性培养条件进行。更优选地,宿主细胞为包含本发明第一DNA构建体的A.niger细胞,所述DNA构建体包含选自下列的启动子SEQ ID NO15或其衍生物、SEQ ID NO16或其衍生物、SEQ ID NO17或其衍生物、SEQ ID NO18或其衍生物、SEQ IDNO19或其衍生物,所述DNA构建体还包含编码可选择标记的报告子基因,且筛选使用选择性培养条件进行。进一步更优选地,宿主细胞为包含本发明第一DNA构建体的A.niger细胞,所述DNA构建体包含选自下列的启动子SEQ ID NO15或其衍生物、SEQ ID NO16或其衍生物、SEQID NO17或其衍生物、SEQ ID NO18或其衍生物、SEQ ID NO19或其衍生物,所述DNA构建体还包含杂交报告基因如SEQ ID NO61,且筛选使用选择性培养条件进行。进一步更优选地,宿主细胞为A.niger细胞且第一DNA构建体包含 -与启动子SEQ ID NO15可操作连接的杂交报告基因GFP-BLE(SEQID NO61),或 -与启动子SEQ ID NO16或其衍生物可操作连接的GFP-BLE,或 -与启动子SEQ ID NO17或其衍生物可操作连接的GFP-BLE,或 -与启动子SEQ ID NO18或其衍生物可操作连接的GFP-BLE,或 -与启动子SEQ ID NO19或其衍生物可操作连接的GFP-BLE,且筛选使用包含抗生素(优选腐草霉素)作为选择剂的选择性培养条件进行。
通过如上所述本发明的筛选方法分离的DNA序列用于制造目的蛋白质或改善目的蛋白质的制造,所述目的蛋白质由DNA序列编码。有利地,在上述筛选方法中分离的经转化的宿主细胞直接用于制造目的蛋白质的方法中,所述方法通过在有助于制造(优选分泌)目的蛋白质的条件下培养经转化的宿主细胞并可选地回收蛋白质。
根据一种优选的实施方案,宿主细胞能够直接用于制造目的蛋白质,所述宿主细胞不包含报告基因和/或可选择标记基因。因此,在细胞已被筛选用于制造(优选分泌)目的蛋白质后,从宿主细胞中缺失包含与本发明启动子可操作连接的报告基因的DNA构建体。为了能够缺失本发明的DNA构建体,所述DNA构建体优选在DNA重复之间包含报告基因和双向可选择标记基因。DNA重复允许通过内染色体同源重组缺失DNA构建体。该方法与EP 0 635 574B1所述的″MARKER-GENE FREE″方法类似。
在本发明筛选方法中分离的最初经转化的宿主细胞通常会具有足够用于筛选目的,但是可为经济制造目的显著改善的表达水平。为此,将DNA序列插入表达载体中,其随后用于转化合适的宿主细胞。在该表达载体中,DNA序列与适当的表达信号(如启动子、可选的信号序列和终止子)可操作连接,如“DNA构建体”和“调控元件”部分中所定义,所述表达信号能够指导蛋白质在宿主生物中的表达。用于制造蛋白质的合适宿主细胞可以是原核或真核细胞,优选真细菌、酵母或丝状真菌。优选的细菌宿主细胞选自如启动子部分定义的Bacillus属。根据另一优选的实施方案,宿主细胞为已在“宿主细胞”部分中定义的酵母或丝状真菌。优选的酵母宿主细胞选自Saccharomyces、Kluyveromyces、Yarrowia、Pichia和Hansenula属。优选的丝状真菌宿主细胞选自在上文列为用于筛选方法的优选宿主细胞的相同属。更优选地,丝状真菌为Aspergillus、Penicillium或Trichoderma种。进一步更优选地,Aspergillus宿主细胞为Aspergillusniger或Aspergillus sojae或Aspergillus oryzae种。最优选的宿主细胞为A.niger,优选CBS513.88或其衍生物。
通过技术人员可获得的多种流程中的任何流程,用表达载体转化合适的宿主细胞。然后将经转化的宿主细胞用于下述方法,所述方法通过在有助于表达编码蛋白质的DNA序列的条件下培养经转化的宿主细胞来制造目的蛋白质,并可选地回收蛋白质。
优选目的蛋白质为酶。
因此,本发明涉及本发明启动子在表达克隆方法中的用途。
本发明还涉及本发明启动子的其它用途。优选地,本发明启动子可DNA构建体或表达载体(均在前一部分中定义)中与任何编码序列可操作连接。这类DNA构建体或表达载体可被引入在“宿主细胞”部分中定义的任何宿主细胞中,并用于表达给定的有价值化合物。这类有价值化合物的实例为,但不仅限于代谢物或多肽。优选地,与本发明启动子可操作连接的编码序列编码有价值的化合物。或者,并根据本发明另一优选的实施方案,与本发明启动子可操作连接的编码序列涉及有价值化合物的制造。
或者,并根据本发明启动子另一优选的用途,本发明的启动子被整合进灭活或取代构建体中,转化进给定宿主细胞中,并用于灭活或取代靶基因。
本发明由以下实施例进一步说明。
实施例 材料和方法 一般程序 标准分子克隆技术,如DNA分离、凝胶电泳、核酸的限制性酶修饰、Northern分析、E.coli转化等,如Sambrook et al.(2001)″MolecularCloninga laboratory manual,3d edition″,Cold Spring Harbor Laboratories,Cold Spring Harbor,New York and lnnis et al.(1990)″PCR protocols,a guideto methods and applications″Academic Press,San Diego所述进行。合成的寡脱氧核苷酸得自Invitrogen(Breda,The Netherlands)。室温为20℃±2℃。
Aspergillus niger转化 A.niger转化根据Tilburn,J.et al.(1983)Gene 26,205-221和Kelly,J.&Hynes,M.(1985)EMBO J.,4,475-479所述方法进行,其中采用以下改变 使孢子发芽并在置于300rpm摇床中的摇瓶中Aspergillus最小培养基(100ml)中在30℃下培养16小时。每升Aspergillus最小培养基含有6gNaNO3、0.52g KCl、1.52g KH2PO4、1.12ml 4M KOH、0.52gMgSO4.7H2O、10g葡萄糖、1g酪蛋白氨基酸、22mg ZnSO4.7H2O、11mg H3BO3、5mg FeSO4.7H2O、1.7mg CoCl2.6H2O、1.6mg CuSO4.5H2O、5mg MnCl2.2H2O、1.5mg Na2MoO4.2H2O、50mg EDTA、2mg核黄素、2mg硫胺-HCl、2mg烟酰胺、1mg吡哆醇-HCL、0.2mg panthotenic acid、4g生物素、10ml青霉素(5000IU/ml)链霉素(5000UG/ml)溶液(Gibco)。
-用Novozym 234TM(Novo Industries)代替解螺旋酶用于制备原生质体; -形成原生质体后(60-90分钟),加入KC缓冲液(0.8M KCl、9.5mM柠檬酸,pH 6.2)至45ml的终体积,在浮桶式转头离心机中在4℃下3000rpm将原生质体悬浮液离心10分钟。原生质体重悬于20ml KC缓冲液中并随后加入25ml STC缓冲液(1.2M山梨糖、10mM Tris-HCI pH7.5,50mM CaCl2)。在浮桶式转头离心机中在4℃下3000rpm将原生质体悬浮液离心10分钟,在STC缓冲液中洗涤并在STC缓冲液中重悬为10E8原生质体/ml的浓度; -向200微升原生质体悬浮液中加入溶解在10微升TE缓冲液(10mMTris-HCI pH 7.5,0.1mM EDTA)和100微升PEG溶液(20%PEG 4000(Merck),0.8M山梨醇,10mM Tris-HCl pH 7.5,50mM CaCl2)中的DNA片段; -在室温下将DNA-原生质体悬浮液孵育10分钟后,缓慢加入1.5mlPEG溶液(60%PEG 4000(Merck),10mM Tris-HCl pH 7.5,50mM CaCl2)并重复混匀管。在室温下孵育20分钟后,用5ml 1.2M山梨醇稀释悬浮液,颠倒混匀并在室温下4000rpm离心10分钟。将原生质体柔和地重悬于1ml 1.2M山梨醇中并涂布在固体选择性培养基上,所述培养基由不含核黄素、硫胺-HCl、烟酰胺、吡哆醇、panthotenic acid、生物素、酪蛋白氨基酸和葡萄糖的Aspergillus最小培养基组成。对乙酰胺选择而言,培养基含有10mM乙酰胺作为唯一氮源和1M蔗糖作为渗压剂和C源。或者将原生质体涂布于添加有1-50微克/ml腐草霉素和1M蔗糖作为渗压剂的PDA(马铃薯葡萄糖琼脂,Oxoid)上。使用20%琼脂(琼脂No.1,OxoidL1 1)固化再生平板。在30℃下孵育6-10天后,将转化体的分生孢子转移至由含2%葡萄糖和1.5%琼脂糖(Invitrogen)的Aspergillus选择性培养基(在乙酰胺选择的情况下含有乙酰胺作为唯一氮源,或在腐草霉素选择情况下为添加了1-50微克/ml腐草霉素的PDA)上,并在30℃下孵育5-10天。分离单个转化体,并重复一次该选择性纯化步骤,藉此储存经纯化的转化体。
Aspergillus niger微量滴定板发酵和取样 为了获得A.niger的孢子,将菌丝体转移至根据供应商说明制备的填充有150微升固体PDA培养基(马铃薯葡萄糖琼脂,Oxoid)的微量滴定板上。在30℃(静止)生长3-7天后形成孢子。然后向各孔中添加100微升液体发酵培养基(70g/l葡萄糖.H2O、25g/l蛋白胨(来自酪蛋白)、12.5g/l酵母提取物(Difco)、2g/l K2SO4、1g/l KH2PO4、0.5g/lMgSO4.7H2O、0.03g/l ZnCL2、0.02g/l CaCL2、9mg/l MnSO4-H2O、3mg/lFeSO4.7H2O,用4N H2SO4调至pH 5.6)。上下吸打液体培养基20次以分离培养基中的孢子。将接种过的发酵培养基转移至另一微量滴定板并在34℃、550rpm和80%湿度下在轨道微量滴定板摇床(Infors HT)上孵育6天。在第6天收集上清液并用于检测所分泌的蛋白质。
质谱法分析 将上清液通过离心力在Ultracel滤板(Millipore,Billerica,MA,USA)上超滤。超滤根据制造商提供的流程进行。向经超滤的上清液中添加10微升200mM的碳酸氢铵,pH7.8(Riedel-de Haen AG,Seelze,Germany)和1微升250微克每ml的胰蛋白酶(Worthington,Lakewood,NJ,USA)。将上清液在37℃消化3小时。经消化的上清液以1∶1的比例与10毫克每ml的经再结晶的α-氰-4-羟基苯丙烯酸(?CHCA)(Laser Bio Labs,Sophia-AntipolisCedex,France)溶液混合;从这些混合物中将1微升点在MALDI靶标上。在vMALDI LTQ质谱仪(Thermo electron,Orlando,FL,USA)上用MALDIMS和MALDI MS/MS分析被点的样品。
所获得的MS/MS谱被转化为肽序列,与在预先推定的FASTA蛋白质数据库中可获得的蛋白质序列比较,以鉴定个体酶。
RNA分离 收集在培养皿中20ml液体选择性再生培养基(6g/l NaNO3,0.52g/lKCl,1.52g/l KH2PO4,0.25g/l KOH,0.52g/l MgSO4.7H2O,22mg/lZnSO4.7H2O,11mg/l H3BO3,5mg/l FeSO4.7H2O,1.7mg/l CoCl2.6H2O,1.6mg/l CuSO4.5H2O,5mg/l MnCl2.2H2O,1.5mg/l Na2MoO4.2H2O,50mg/lEDTA,341g/l蔗糖,10ml青霉素(5000lU/ml)链霉素(5000UG/ml)溶液(Gibco))上形成的Aspergillus niger菌丝体,用软化水洗涤并在纸巾之间挤压去除多余的水。立刻将菌丝体在液氮中冷冻,并用研钵和研杵研磨成精细的粉末。将产生的粉末转移至无菌的50ml管中并称量,藉此对酶1-1.2g被研磨的菌丝体加入10ml TRIzol试剂(Invitrogen)(每管最多25ml)。立刻通过充分混合(涡旋1分钟)增溶菌丝体粉末,然后室温孵育5分钟并随机搅拌。添加0.2(最初TRIzol)体积的氯仿(从而对每10ml最初使用的TRIzol添加2ml氯仿),涡旋并在室温下放置10分钟。然后将混合物在4℃,6000g离心30分钟。将上部水相转移至新管中并通过添加0.5(最初TRIzol)体积的100%异丙醇(从而每10ml最初使用的TRIzol添加5ml异丙醇)沉淀总RNA。在室温下沉淀10分钟后,通过在6000g离心30分钟回收RNA。去除上清液后,将RNA沉淀块用一倍(原始TRIzol)体积的70%乙醇洗涤。去除乙醇后,将RNA沉淀块晾干。干燥的RNA沉淀块溶于3ml GTS(100mM Tris-Cl,pH 7.5,4M硫氰酸胍,0.5%十二烷基肌氨酸钠)缓冲液。根据供应商手册使用Rneasy Maxi试剂盒(Qiagen)额外纯化RNA。使用10微升RNA溶液确定核酸的量和浓度。
Aspergillus niger菌株 A.niger WT-1该A.niger菌株为包含编码葡萄糖淀粉酶(glaA)、真菌淀粉酶和酸性淀粉酶的基因缺失的CBS513.88。A.niger WT-1使用如EP 0635574B1所述的″MARKER-GENE FREE″途径构建。该专利中广泛描述了如何缺失CBS 513.88基因组中的glaA特异DNA序列。第一个步骤得到了MARKER-GENE FREE?glaA重组A.niger CBS 513.88菌株,其最终完全不具有任何外源DNA序列。然后通过EP 0 635 574B1中所述方法从A.niger WT-1基因组中缺失编码真菌淀粉酶和酸性淀粉酶的基因。
如图7到9和11到14所描绘的用于克隆目的构建体的载体含有先前在WO 99/32617中描述的主链特征。
A.niger WT-GFP该A.niger菌株通过用图7所描述的表达载体pGBFINGFP-2转化A.niger WT-1获得,所述载体含有由葡萄糖淀粉酶启动子驱动的编码公知绿色荧光蛋白(GFP)的基因(Chalfie,M et al.,Science(1994)263(5148)802-805)。在选择性培养基上纯化后,基于PCR分析选择单拷贝整合体。
A.niger WT-PHY该A.niger菌株通过用图8所描述的表达载体pGBFIN-32转化A.niger WT-1获得,所述载体包含由葡萄糖淀粉酶启动子驱动的植酸酶基因PHY(与先前在WO 99/32617中描述的FytA相同)。在选择性培养基上纯化后,基于PCR分析选择单拷贝整合体。
A.niger WT-PHY-2该A.niger菌株通过用图8所描述的表达载体pGBFIN-32转化A.niger WT-1获得,所述载体包含由葡萄糖淀粉酶启动子驱动的植酸酶基因PHY(与先前在WO 99/32617中描述的FytA相同)。在选择性培养基上纯化后,基于PCR分析选择单拷贝整合体。
A.niger WT-载体该A.niger菌株通过用图9所描述的空对照载体pGBFIN-40转化A.niger WT-1菌株获得。空对照载体pGBFIN-40通过Xhol消化图8中所描述的pGBFIN-32并将最大片段重新连接,从而去除葡萄糖淀粉酶启动子和植酸酶基因PHY的5’部分构建。通过PCR分析选择单拷贝整合体。
实施例1构建Bacillus报告质粒和报告菌株 1.1构建报告质粒pPhtrA-gfp-amyE和pPhtrB-gfp-amyE 首先,如下构建报告质粒pPhtrA-gfp-amyE。使用pSG1151(P.J.Lewisand A.L.Marston,1999;GFP vectors for controlled expression and duallabelling of protein fusions in Bacillus subtilis,Gene 227,101.)作为模板DNA,用以下引物RN-lacZ-rv(SEQ ID NO3),GTGAGCGGATAACAATTTCACACAGG;和 gfp-terminator-rv,(SEQ IDNO4)GTGGCTCAGCTTTTTTAAGGAAGGGAGGCTCTCACCTCCCTTCCCTTTATTTGTAGAGC TCATCCATGCC,通过PCR扩增编码最佳化版本GFP——gfpmut-1的基因(P.Cormack,R.H.Valdivia,and S.Falkow,1996;FACS-optimized mutants of the green fluorescent protein(GFP),Gene 173,33.),其中所述引物分别得到gfpmut-1上游和下游的KpnI和Bpu1101I位点(黑体)。使用KpnI和Bpu1101I位点将913bp PCR产物连接在下述pDL中,得到pGFP-amyE,所述pDL包含用于位点特异重组的amyE基因座的同源侧翼区(G.Yuan and S.L.Wong,1995;Regulation of groEexpression in Bacillus subtilisthe involvement of the sigma A-like promoterand the roles of the inverted repeat sequence(CIRCE),J.Bacteriol.177,5427)。使用B.subtilis 168(Bacillus Genetic Stock Center ID1 A1)的染色体DNA作为模板DNA,通过PCR扩增htrA的启动子(PhtrA)(SEQ ID NO1)。所使用的引物为分别引入KpnI和HindIII位点(黑体)的PhtrA-fw,(SEQ ID NO5)CGTGAGGTACCGGCTTCTGTTTCTGCC;和Phtr-rv,(SEQ ID NO6)CATCACGAAGCTTATCCATCATGTTCACTCCG。用Kpn1和Hind3消化后,将531bp PCR产物连接进pGFP-amyE中gfp基因上游,得到报告质粒pPhtrA-gfp-amyE。该质粒的图谱描绘于图1中。质粒pPhtrB-gfp-AmyE以如上所述类似的方法构建。用于扩增htrB启动子(PhtrB)(SEQ ID NO 2)的引物为PhtrB-fw(SEQ ID NO 7)GACCGGTACCTCAGGATCTTTCGCC和PhtrA-rv(SEQ ID NO 8)GGCCATCAAGCTTATAATCCATGTTCTTACACTCC。
1.2构建Bacillus报告菌株VT210A和VT210B 将得到的质粒pPhtrA-gfp-amyE和pPhtrB-gfp-amyE引入DaprE、DnprE双突变体B.subtilis DB104中(F.Kawamura and R.H.Doi,1984;Construction of a Bacillus subtilis double mutant deficient in extra cellularalkaline and neutral proteases,J.Bacteriol.160,442)。通过对染色体DNA的PCR检查氯霉素抗性转化体通过amyE基因座上双交换的位点特异性整合。为了降低HtrA对PhtrA的负反馈调节(D.Noone,A.Howell,R.Collery,and K.M.Devine,2001;YkdA and YvtA,HtrA-like serine proteases in Bacillussubtilis,engage in negative auto regulation and reciprocal cross-regulation ofykdA and yvtA gene expression,J.Bacteriol.183,654),用B.subtilisBV2003的染色体DNA转化新菌株,所述B.subtilis BV2003具有通过pMutin2整合被破坏的htrA基因(H.L.Hyyrylainen,A.Bolhuis,E.Darmon,L.Muukkonen,P.Koski,M.Vitikainen,M.Sarvas,Z.Pragai,S.Bron,J.M.van Dij1,and V.P.Kontinen,2001;A novel two-component regulatory system in Bacillussubtilis for the survival of severe secretion stress,Mol.Microbiol.41,1159)。选择红霉素抗性的转化体并通过对染色体DNA的PCR检查htrA破坏。获得的菌株命名为VT200A和VT200B。
为了提高VT200A菌株的转化效率,设计了BsuMR破坏构建体。BsuMR体系通过由三个基因ydiR、ydiS和ydiA组成的操纵子形成,其中各基因对BsuMR功能是必须的(P.J.Lewis and A.L.Marston,1999;GFPvectors for controlled expression and dual labeling of protein fusions in Bacillussubtilis,Gene 227,101)。使用以下引物和B.subtilis染色体DNA作为模板扩增756bp的ydiR区——侧翼区1(flr1)flrBsul F,(SEQ ID NO 9)GAAAGATTGTTTCAGAAGCC;和flrBsuR,(SEQ ID NO10)ACAGCGTTGGGATCCAAGCCCTTCCATTTTGGACATTTGG。使用pDG1726(A.M.Guerout-Fleury,K.Shazand,N.Frandsen,and P.Stragier,1995;Antibiotic-resistance cassettes for Bacillus subtilis,Gene 167,335)作为模板DNA和以下引物扩增壮观霉素抗性标记specBsu-F,(SEQ ID NO11)GGGCTTGGATCCCAACGCTGTCGACGTTGTAAAACGACGG;和specBsu-R,(SEQ ID NO12)CGCATAGCTTTCCGGTCGCCGCAGCTATGACCATGATTACGC。1319bp PCR产物和flrBsu1片段用于第二轮PCR,其中由引物flrBsu1-R和specBsu-F(黑体)引入的其同源末端重组后,两个片段作为一个模板作用。使用引物flrBsu1-F和specBsu-R获得2075bp PCR片段flr1-specr,其被亚克隆进pCR-XL-TOPO(Invitrogen)中得到pCT-XL-TOPO-flr1-spec。覆盖ydiS(编码DNA内切核酸酶)的3’末端和相邻ydjA(未知功能)大部分的739bp区域——侧翼区2,使用引物flrBsu2-F,(SEQ ID NO 13)GATGATTCGTCTTTTTGTAGTG;和引物flrBsu2-R,(SEQ ID NO 14)CGATCAACATATGTGTTCACG和B.subtilis的染色体DNA作为模板扩增。将PCR产物克隆进pCR-XL-TOPO中得到pCR-XL-TOPO-flr2。利用pCR-XL-TOPO载体的多克隆位点,使用XhoI和NsiI将flr1-specr从pCR-XL-TOPO-flr1上限制性酶切下并连接进用XhoI和Pstl(与NsiI匹配)消化的pCR-XL-TOPO-flr2中。这引起构建体pTOPO-flr1-specr-flr2的删除,其被引入菌株VT200A。通过对染色体DNA的PCR检查壮观霉素抗性转化体的ydiS缺失。获得的最终报告菌株称为VT210A和VT210B并用于进一步的实验,构建这些菌株的一般性概括描绘于图2中。
1.3构建表达载体pUBnpr2和pUBBAG 质粒pUB110的构建及其序列之前已被描述过(McKenzie T.,HoshinoT.,and Sueoka,N.1986.The nucleotide sequence of pUB110;some salientfeatures in relation to replication and its regulation.Plasmid 1593-103)。将Bacillus amyloliquefaciens a-淀粉酶基因amyQ(Genbank登录号J 01542)克隆进pUB110,得到如先前所述的质粒pKTH10(Palva,I.1982.Molecularcloning of the alpha-amylase gene of Bacillus amyloliquefaciens and itsexpression in B.subtilis.Gene 1981-87)。
将均来自Bacillus amyloliquefaciens的中性蛋白酶基因npr(Genbank登录号K 02497)和β-葡聚糖酶基因bag(Genbank登录号M15674)克隆进载体pUB110的过程实质上根据用于克隆amyQ的方法进行,得到如图3和图4所描绘的质粒pUBnpr2和pUBBAG。
1.4将表达构建体pKTHIO、pUBnpr2和pUBBAG转化进Bacillus报告菌株VT210A中 Bacillus subtilis菌株VT210A的转化实际上如先前所述利用该生物的天然感受态进行(Anagnostopoulos,C.and Spizizen,J.1961.Requirements fortransformation in Bacillus subtilis.J.Bacteriology 81741-746)。DNA孵育后,将细胞涂布于2 x TY琼脂上,其含有0.1%淀粉和作为转化选择剂的抗生素卡那霉素(20μg/ml)。将板在37℃孵育过夜。当转化涉及质粒pKTH10时,用鲁戈溶液(lugol solution)覆盖菌落以检测分泌淀粉酶的细胞。
实施例2通过荧光激活的细胞测定法分析分泌胁迫的细胞 2.1通过荧光激活的细胞分选选择分泌胁迫的细胞 以1∶20的比例使用质粒pUB110(空对照载体)和pKTH10(编码Bacillus amyloliquefaciens a-淀粉酶基因amyQ)共转化Bacillus subtilis菌株VT210A。将一部分细胞涂布于选择性TY琼脂平板上,向另一部分中添加含卡那霉素的2 x TY培养基,并将细胞孵育过夜。同样用与共转化相同的操作转化分离的质粒。第二天,在FACS型流式细胞仪(Mo-FIo ofDakocytomation)上由熟练操作者GFP荧光分析培养物。使用80mWatt和488nm的蓝色激光。典型的FACS实验包含对20.000个事件(细胞)的分析。首先单独分析(图5A和5B)和作为混合(图5C)分析VT210A,pUB110(无分泌胁迫)和VT210A,pKTH10(由于过量生产α-淀粉酶AmyQ的分泌胁迫)细胞的荧光信号。在这些结果的基础上手动设置细胞分界限(图5D中的虚线),使得显示高于细胞分选界限的GFP荧光的细胞被分选。将共转化培养物应用于流式细胞仪并在管中收集被分选的细胞。为了验证经分选的荧光群体已经富集了分泌α-淀粉酶的细胞,将被收集的细胞的不同稀释液涂布在含淀粉的选择性琼脂上。对未经FACS分选的最初的过夜输入培养物进行相同处理。培养后用鲁戈溶液覆盖菌落,使α-淀粉酶活性引起的卤素形成显影。图表1所示,约90%的经分选的细胞的确分泌α-淀粉酶,而输入培养物中仅0.5%-0.7%的细胞分泌α-淀粉酶。该结果清除地说明了有力的本发明选择工具,其通过使用正常细胞和分泌胁迫细胞之间的荧光信号辨别来分离分泌蛋白质的细胞。

表1流式细胞术后富集形成amy+菌落的单位。
2.2通过荧光细胞扫描选择分泌胁迫的细胞 将质粒pUB110(空对照载体)和pKTH10(编码Bacillusamyloliquefaciens a-淀粉酶基因amyQ)单独地转化进Bacillus subtilis菌株VT210B中。将一部分细胞涂布于选择性TY琼脂平板上,向另一部分中添加含卡那霉素的2 x TY培养基,并将细胞孵育过夜。在流式细胞仪(Coulter Epics XL-MCL,Beckman Coulter)上由熟练操作者分析培养物。典型的实验包含20.000事件(细胞)的分析。使用FITC滤器并将光电倍增管电压设为700和800伏特之间检测荧光信号。正常细胞和受到分泌胁迫的细胞间的荧光信号差异描绘于图6中。
2.3使用荧光计选择分泌胁迫的VT21OA细胞 经转化的报告菌株细胞在存在卡那霉素的2 x TY培养基中孵育并在37℃过夜培养。用于转化质粒pUB110、pKTH10、pUBnpr2和pUBBAG的DNA数量相等。生长至稳定期后,将四种转化的培养细胞以96孔微量滴定板的形式等体积分为8份。孔在荧光计中分析荧光(MolecularDevices,type Spectra MAX Gemini)。刺激在490nm,发射在510nm和截断在495nm。表2说明通过清晰显著(P two-tail<0.05)的荧光信号差异而将非胁迫的细胞(pUB110)从胁迫的细胞(pKTH10、pUBnpr2和pUBBAG)中区别出来。
表2.假定不等方差的t检验。给定空宿主细胞(pUB110)对分泌胁迫(pKTH10、pUBnpr2、pUBBAG)细胞的P值。
比值表达了胁迫细胞的平均荧光值(n=8)对空宿主细胞的平均荧光值(n=8)。
实施例3基因组广泛表达分析A.niger以鉴定分泌诱导的启动子 进行基因组广泛表达分析以鉴定在A.niger WT-PHY中高度表达,并在A.niger WT-GFP,A.niger WT-载体和A.niger WT-1中不显示或显示较低表达的启动子序列。为了模拟将来的应用实验,获得A.niger WT-1,A.niger WT-GFP,A.niger WT-PHY和A.niger WT-vector菌株的原生质体。在A.niger WT-GFP,A.niger WT-PHY and A.niger WT-载体情况下将20ml数量补充有50mg/l phleomycin(Invitrogen)的液体选择性再生培养基在培养皿中与100微升10E7/ml原生质体孵育。在30℃(静止)生长3天的周期后,在液体培养基表面形成菌丝体小片,将其用于总RNA分离。在Affymetrix A.niger GeneChipsTM上的cDNA合成、cDNA标记和杂交根据供应商流程进行。随后的表达分析得到5个下述基因,所述基因在A.niger WT-PHY菌株中的表达水平为在A.niger WT-1,A.niger WT-GFP和A.niger WT-载体中基底表达水平的至少8.5倍。为了确认所述发现,进行Northern印迹分析。
实施例4Northern分析 为了确认Affymetrix A.niger GeneChipsTM实验的结果,进行Northern印迹分析。为此从A.niger菌株WT-1、WT-GFP、WT-FYT和WT-载体中分离总RNA。将RNA变性,在1%琼脂糖凝胶上通过凝胶电泳分离,并根据制造商说明通过毛细管印迹转移至尼龙膜(Hybond-N+,AmershamBiosciences)上。在GS Gene LinkerTM(BioRad,C3 setting,150mJoule)上将RNA紫外交联在尼龙膜上。用于产生32P-标记的DNA探针的DNA使用A.niger WT-1的基因组DNA作为模板并使用表3所列引物(SEQ ID NO′s 50到59)通过PCR分离。根据供应商说明(RadPrime DNA Labeling System,Invitrogen)将Northern印迹与随机引物32P-标记的DNA探针杂交,所述探针代表了分泌诱导的基因(SEQ ID NO′s 20到24)。Northern分析到结果显示在图10中。Northern印迹的杂交模式证实了通过表达分析AffymetrixA.niger GeneChipsTM数据获得的数据;分泌诱导的基因在A.niger菌株WT-1、WT-GFP、WT-载体中低表达并在A.niger WT-PHY中高表达。
表3用于分离用于经32P-标记探针的DNA的引物。
实施例5克隆GFP-BLE分泌诱导的报告构建体 通过PCR构建GFP(绿色荧光蛋白(Chalfie,M et al.,Science(1994)263(5148)802-805)和腐草霉素结合蛋白(BLE,存在于先前在WO99/32617中描述的pGBFIN-14中)的融合。使用SEQ ID NO62和SEQ ID NO63的引物组通过PCR扩增GFP片段。使用引物组SEQ ID NO64和SEQ IDNO65和pGBFIN-14作为模板通过PCR扩增BLE片段。获得的重叠PCR片段用于使用引物SEQ ID NO62和SEQ ID NO65的融合PCR中,得到PCR融合产物GFP-BLE(SEQ ID NO61)。用限制性酶PacI和AscI消化GFP-BLE融合物并与经PacI、AscI线性化的克隆载体pGBFIN-2(描述于WO99/32617和EP98/08577)连接,从而将GFP-BLE融合物置于葡萄糖淀粉酶启动子的调控下,得到的载体pGBFINBLE-2描绘于图11中。
使用来自A.niger WT-1的基因组DNA作为模板和表4所示引物通过PCR分离分泌诱导的基因的启动子序列。
表4用于扩增相应启动子的引物概述 用限制性酶XhoI和PacI消化得到的PCR片段(SEQ ID NO′s35到39),并连接进用XhoI、PacI线性化的图11所描述的克隆载体pGBFINBLE-2中,从而去除PgpdA-amdS并用各自的分泌诱导启动子Pind代替葡萄糖淀粉酶启动子,得到pGBFINGFPBLE-1到5。pGBFINGFPBLE-1描绘于图12中,并代表pGBFINGFPBLE-2到5。通过XhoI和FseI消化pGBFINGFPBLE-1并随后与XhoI、FseI线性化的图13所描绘的A.niger表达载体pGBTOPSEL-1连接来分离各诱导型启动子与GFP-BLE的融合构建体。得到的分泌报告构建体pGBTOPGFPBLE-1到5含有位于各分泌诱导型启动子P1、P2、P3、P4、P5调控下的GFP-BLE融合物。在图14中,pGBTOPGFPBLE-1作为pGBTOPGFPBLE-1到5的代表被描绘。在实施例6和7中使用这些载体转化A.niger WT-1。
实施例6过表达细胞外蛋白质赋予表达GFP-BLE报告构建体的A.niger腐草霉素抗性 根据材料和方法中描述的步骤进行分泌报告构建体pGBTOPGFPBLE-1到5到A.niger WT-PHY-2中的转化,所述A.niger WT-PHY-2过表达经分泌的蛋白质植酸酶。在补充有多种数量腐草霉素(0、5、10、15、20、25、30、35、40、45、50微克每毫升)作为选择剂的选择性再生平板上选择转化体。所有5个报告构建体能够在含腐草霉素的平板上正选择,而负对照WT-PHY-2野生型不能在含腐草霉素的任何平板上生长。分泌报告构建体pGBTOPGFPBLE-1到5能够在分别有50、35、50、35、25微克每毫升腐草霉素上成长。从而说明这些构建体的分泌诱导型启动子是有功能的,并且转化后在腐草霉素上的正选择是可能的。
实施例7cDNA文库和GFP-BLE报告构建体共转化后选择表达细胞外蛋白质的A.niger克隆 使用分泌报告构建体pGBTOPGFPBLE-1到5与经定义的A.nigercDNA文库组合共转化Aspergillus niger WT-1,所述cDNA文库编码50个细胞外蛋白质和50个细胞内蛋白质。通过菌落PCR确认共转化事件。含分泌报告构建体与表达文库构建体组合的共转化体的孢子在补充有不同数量腐草霉素(0、5、25、50、100、175微克每毫升)的选择性平板上生长。证明了含有分泌报告构建体与编码细胞外蛋白质的文库构建体组合的共转化体与含有分泌报告构建体与编码细胞内蛋白质的文库构建体组合的转化体相比,腐草霉素抗性的平均提高。代表分泌敏感性启动子P4和P5的这些结果的图片在图15和图16中显示。这些结果说明达到了至少多至20倍的腐草霉素抗性提高。
证明了下述共转化体制造的细胞外蛋白质的多样性,所述共转化体含有包含启动子P1或P3的分泌报告构建体与编码细胞外蛋白质的文库构建体的组合。共转化体在微量滴定板上个体生长,并在第6天将这些培养物的上清液通过E-PAGETM High-Throughput Pre-Cast Gel System(Invitrogen)和质谱法(MALDI MS/MS)进行蛋白质分析。
E-PAGETM 96,6%Gels(Invitrogen)含有用于蛋白质分离的微量滴定板格式的96个样品区和8个标记物区。根据供应商手册将上清液和标记物(E-PAGETM

预染标准(Invitrogen))上样在凝胶上。将凝胶电泳后,根据供应商手册将SimplyBlueTM Safestain(Invitrogen)用于染色。E-PAGETM凝胶的扫描图通过Invitrogen提供的E-editor程序编辑,所述程序将蛋白质样品排列为微量滴定板格式。由具有分泌敏感启动子P1和P3的共转化体制造的细胞外蛋白质展示在图17和18中,并在表5中概述。这些结果说明,至多70%的经分析的腐草霉素抗性菌落分泌通过E-PAGE可检测数量的蛋白质。根据凝胶上观察到的蛋白质片段的大小,评估用给定文库转化的菌落的多样性。这些结果说明根据E-PAGE分析可观察到至多35%的多样性。
质谱结果描绘于表5中。至多58%的被分析为腐草霉素抗性的菌落分泌通过质谱可检测数量的蛋白质。根据所检测的肽序列的同一性评估多样性。这些结果说明使用质谱可观察到至多100%的多样性。

表5E-PAGE和质谱结果概述。用于分析的测定法在第一列中描述;第二列鉴定了分泌敏感的启动子-报告子构建体;第三列描述了由测量法分析的转化体的数量;第四列和第五列说明了对蛋白质分泌评分为正的菌落数量和各自的阳性百分比;第六列和第七列说明了分泌不同蛋白质的菌落数量和各自的多样性百分比。

与被保藏的微生物相关的说明
(PCT Rule 13bis)
序列表
<110>帝斯曼知识产权资产管理有限公司
<120>在宿主细胞中表达克隆的改进方法
<130>24403WO
<160>65
<170>XML to WIPO ST.25Converter-http://www.biomax.de/
<210>1
<211>168
<212>DNA
<213>Bacillus subtilis
<400>1
CGACTCAGTC CTTTCATATA CAATATGAAG TGTACCGTTT TCCGCACTTT TTCACAATTT60
CCCATAATCT TTTCATTTTT ATCCCACAGT TTTTGTTTAT GATAAACTCA AGTCATAAAC120
CTATCAATAT AAATAGACAT GTGAAAATAG AGAAACGGAG TGAACATG 168
<210>2
<211>277
<212>DNA
<213>Bacillus subtilis
<400>2
GGCTCTTCAC ATCCTTTCAA CGTCATTATA AACTAGTTTT AACATACGGC AGGCAATTTT60
CATAATTTCA CATATTCTTT TCATTTTTAT CCCACAATGT TTGTTTATGA TATGGTTAAG120
GGAAGAAAGG AAGAGAAAAA GAGCGAGGAA GATGTAGGAT GATCAAACAT ATTCTATTTT180
GGTGCTTTGC TTTTCTCCTC ATTATTGGGA CAATTGAACT TGTACATGCG ATGAATATGT240
AACGATAAAT GAATAACCGT TAAAGGAGTG TAAGAAC 277
<210>3
<211>26
<212>DNA
<213>人工序列
<220>
<223>引物
<400>3
GTGAGCGGAT AACAATTTCA CACAGG26
<210>4
<211>70
<212>DNA
<213>人工序列
<220>
<223>引物
<400>4
GTGGCTCAGC TTTTTTAAGG AAGGGAGGCT CTCACCTCCC TTCCCTTTAT TTGTAGAGCT60
CATCCATGCC 70
<210>5
<211>27
<212>DNA
<213>人工序列
<220>
<223>引物
<400>5
CGTGAGGTAC CGGCTTCTGT TTCTGCC 27
<210>6
<211>32
<212>DNA
<213>人工序列
<220>
<223>引物
<400>6
CATCACGAAG CTTATCCATC ATGTTCACTC CG32
<210>7
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物
<400>7
GACCGGTACC TCAGGATCTT TCGCC25
<210>8
<211>35
<212>DNA
<213>人工序列
<220>
<223>引物
<400>8
GGCCATCAAG CTTATAATCC ATGTTCTTAC ACTCC 35
<210>9
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>9
GAAAGATTGT TTCAGAAGC 20
<210>10
<211>40
<212>DNA
<213>人工序列
<220>
<223>引物
<400>10
ACAGCGTTGG GATCCAAGCC CTTCCATTTT GGACATTTGG 40
<210>11
<211>40
<212>DNA
<213>人工序列
<220>
<223>引物
<400>11
GGGCTTGGAT CCCAACGCTG TCGACGTTGT AAAACGACGG 40
<210>12
<211>42
<212>DNA
<213>人工序列
<220>
<223>引物
<400>12
CGCATAGCTT TCCGGTCGCC GCAGCTATGA CCATGATTAC GC42
<210>13
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>13
GATGATTCGT CTTTTTGTAG TG 22
<210>14
<211>21
<212>DNA
<213>人工序列
<220>
<223>引物
<400>14
CGATCAACAT ATGTGTTCAC G21
<210>15
<211>1050
<212>DNA
<213>Aspergillus niger
<400>15
ATAATGTAGG CGACAAAGTA GCCGGGCATG CGACCGGAGG ACTCGGTCAG AGGCACGAAT60
ATGAGAGGCC AGAACGCCGC ACCCATGTTC CAAGATGTTG TGGCCCAGTA AAGGTTAGGA120
AATGGGGTGT TTTGAACGTG GAATCGTTCT TCCATCCAGT TGTTGCCGGA GCCGTAGGAA180
CCGGCCGGGA TACCAGTGAG GATGGAACTA TACCTATTAG CACTGCCATC TTCGAGAACA240
AGGCTAAGAC ATACATGAAA CAAACGGTGA CCGTGAGAAG CCATTTATAA GAGGTGCTCC300
AATTGAACCT GAATATGTTA AAACTAGTAT ACTAGCAACT GCATGCTTGA CGTACGGATT360
GTCCGGGTCA TCCTTGCCGT TCCAGGTATG GATCTCAAGG TCCTCCCTGT CACGCAGATC420
ATTGTGGCTG ACTACCCCGA CATGGGGGTC CCGGCGAAAG AACGACCGCA CCCTGCAACG480
TCACTTAGTG GCTGTCTGAC AGGGATTGAT TGGCAATGAT TGGCAGACTA ACCGTCCCAG540
AAACGAATCA TCGAACTCAT TGGTGTGCAC TGTGCTAGCG CGGCGCAGCG ACGGGCGTGG600
CTCCTCGGCA GGGGTGGACA TGACTTTCTC TGTGTAGATT CCTTGCAAGG TATCTGCTTG660
ACAGATGCAG AGATGATGTT GAGTAAAATA GGGTGCAGAG ACCCTGCAGA ACCTGCATCG720
GCCGGCGGCG ACATGTCGTC ATGACCGACC CGGGCCGAGC GGAATTAATG AAACTCGGAA780
CAGCCAGGGG AATCCGACGC TTTGAGTGGC CAATCCATGT CTATCCACAT CTGCATTGAA840
GTGGATGAAA GGTGGAGGAG GGCTGGTTGC CAAATTCTGT TAGGGCTTGG AATGTAAGCA900
ACCGGTTTCG GTCATGACAT CATCACAGCG ATGACTTCAT CACTCTCGGA CGAGCATATA960
TAGTTGTGCC TGTCGTCGTA TCTCAACAAA CATCAACAAC AACAACAATC ATCTACTGCA1020
TTTACCAAAC TCATCTCTAC CTCAATCAAC 1050
<210>16
<211>1032
<212>DNA
<213>Aspergillus niger
<400>16
TTCTCACAAG CAAATCCGAG AAACGCAATT GACCATATGT CCTTAGTATG AGGGCTAGCA60
GGAATACTTG TTTGTCGATG CATACCGACT AATAAAAATG GTTCTTCTTT TTCGCGCAGG120
GATTTGGTTT TTCATTTTTC ATTTTTCATA TTTTATGTTA TTTTATTTTA TTTTTTTGTT180
TTATTTTATT TTATTTTTTT TTTTTAAATA AGACTGGGTG TTTTCGTCTC CCACCCCTGC240
TGAGGAACTG TTTGATATAC AGAAGCCTGA GATACTTGAG ATTATGTGAC AAAGAAATTG300
TAAACCTGAA TGTGACTAAG GCAGAAGAGA GCAGGTGAGG CCACACAATA CTGTACACCC360
ACTTCCGATC GTCATCGAAA TGAGCGTTGT GGGTACTGGA ACGACAAACC ATAGATCGGA420
TCTGCATCCG AATAGGCTTT ACTTTGTACA TTGGTAGGAG TTTGAATGTT TGAAGATCCG480
GCAGATGATC ACCTGCTGCA GGGAATAATT TGAAACCTGT CCGTCTGCTT TGACCCAATT540
GACGAGGTAC GTGATTTGAT GCTACCCAAG CAGTATGAAT GCGACGGAGG TGGCTATCCT600
TACCTTGTCA TATGCAACTC ATAACGGGTA GTCCCCATGG AGCCACGGCT ATTTATTTCT660
AAGGGCCAAC AGTGAAAGAT TGTGAGATCG TATACCTCCT GGGTATGACG CAACCAGGGT720
GAGCACTGGC ATTGCTCCAA TCCATATGGT GGAGGTATGT CTCCGAGACC ATGACGCATG780
TAGACCCTGA CCTGTCCCTG ATCCAGGGAT CTGGTTTGTC ACTTGGCGTA TTTTAATTAA840
CTGCGGGTCA GGGTCTTGCC GTCCAGACCC AATGGATGAA TTGCCTGCGT GGCCCTGCAG900
TTCCAGCGAT CGGCACGGCA CGGCTATGAC GTCGGTGGGT GTTCCGTTTG ATATTTAACC960
ATAGAAGACA GCCTTGTTAT GCTGGTTCCT GCCGCAAAAT AAAGGTCTAT CCTTACCACG1020
TTAAGTGTCA AA1032
<210>17
<211>1035
<212>DNA
<213>Aspergillus niger
<400>17
TGGTGCCTGT GAACGAGGTC ACCACTGATA AATTGTCTGG ATCCGTAACG TCTGTATCAG60
TGGATGGTAC TGAAAAGTTC CAAAGATTGA GGGCAGCATA TGTAGCACAT GGTGGTAGCT120
CTAAGTGGTT CGAAACTTCG ATGAATGGGC GTGATATACA GGGGGGTAGC ACCTGTATAG180
TTGATGTCAG CGAAGGCACG GGCCATGCAG TGATAGACAA GAAAAGAGGG ATTGAATAAA240
AGACTCGATT CTGAAGGGGA GTAATACATC TTTCGGCTTC TCACCACCCC AGATGTAGGC300
GTGTGTAAGG TAAGCAAGCA CAACATATGC TCTCCGCCAC TCAGGTTCCC CCTTCAACTT360
CTTCGTAGAG AGTATACCCA GGTCATCGAC AGACCTCCTG ATAGTACCAG ACTGAATCAG420
GCCAGGCAAG TCCTGAGCGA TTTCCTCCCA CGGGGAATAG TAAGGGTCTT CCAATCTCCG480
TACGGGAGGA ACTTCCGGGA GGAACCCGTT CTGGAGGGAG ACACCGTACG CAACAAGTGA540
AATGTCTTGT GTATAAAGCA TGATAATATA TGCACTTCAG TAGACAACTT GATATTCAAG600
CCTCCTTGAA ATGATCCTCA TGCAGGTAAG AGTAGATCCA AGTGTTTATA TTGTATTCCC660
AAGGAGGGAC GGAAGAAAAC CGGATCCAGA GGGCTCGAGA TAGGGCCACC TGCATGAGCA720
AAGACGGGTC ATTTCCCGTT TCACAACGAC CATTCTCAGG CAGAAAGGCA GTGGATTAGC780
GGAAAACTTA GCAACCATCC GGATTTCTGG AGTGGATGCT TTGTTATCTC ACTTCCGGCA840
ACACGGATGG TGAGGCGGAA GCGGAACGGT ATCCGGATCC GGAGGGAGGG ACAAACCGAA900
GTGCCTTGTG TCACACGCCG GTCCATATAT AAATGTTAAT TGGTGACGGT CAGCGGATTG960
TTTCTGGTGT TCATCCATTT TTTCTTGATA TCCTGGACCC AGTTATTGCA CTTTAATTAC1020
TATCCAAAAT CCACA 1035
<210>18
<211>1071
<212>DNA
<213>Aspergillus niger
<400>18
GTCCACACTC TAATTGGGAT GAGCATTGCC TTTCAGGAAC TTGACTTTTT GTGGTTGCAT60
CTTTTGTTGC CTTACCCACG CAGGCTTCGT TTATGAGATA GCGATTTCAG GCCTCAAATT120
GCTGTCATCA CTTCCGGCCC CAAACTCGTG GGCGGTGCCC GCCCATCGCT GGCAAGAAGC180
ACAGACTAAC GCCTTACTTC GCCTAGTTGC ACACGATGCA TCAAGACTTC CTCCTATTTC240
ACAACGACCA GCTCCTTGCC ATTTGTTGTT TCGAATGCCC CCTTCCCCGT GCCTTGCATT300
TCTAATTCCC ATCTATACCC TTTTGCGCTC TCACGCCCGC CTGACTATCA ATTTTTCTGC360
CAGCATAACC CTGCGTGCAG AGCGGTTGAC AGCAGGCTTG CTAAGAGTCT TCGTCTAGAA420
GAACTGTCTG GGTGGATTCC TTTTCGGATT AACTTTTGCT ATTTTAAAAG CTGATTGCAC480
TACGGAGTAC ACCCGCAATC TGATTCTCAC TGATACTCCA ATTAAAGGCC ACTAATTGCT540
GACATTTGTA ACATATTTGC GTTTGCTTTC CGGTTGAAAT TGGCGGCTTT GTGCTTTCGA600
TCGCTAGCAG TCTCTGTGCA TGTACAACTG ATCGGCTATT CAGTCCTATT CGGAAGCGGC660
ACTGAGAGGC GGAGACAAGC CACAGATACG ACGAGTCTGA TTTTGAGACG GGCGCATCCA720
ACGAAAGCCT GCGATTGCAA TTGAAGATCT CAATTGGGGG ACTGACAACC TAATACCTAA780
ACATATCGAG GATTAGGCGC CAACACGAGC ATGGGAAGCT TTGGTGCATG CGACGGCTGA840
TCCATTTCTA ACAACCGTTT TGCGCGCGCG TCCGAGGTAA GGCTCCCGAT CCCTTGGCGC900
TTTGCATGTT TCACTCCGAT GCATCTACTG TTTATATGAG TGCGGTGGGC AAGCTGTGCC960
CACCGACTGA GCATTCTCAA CCGGCCCAAT GCTGTGGGAT CGATCCTCCC CTCCAAAGTT1020
GTCGCTCGGT TACACTTGAT CGGAGCTTGT TCTGTTATAC ACCAAACCAT C 1071
<210>19
<211>1116
<212>DNA
<213>Aspergillus niger
<400>19
GCCTTTGGAG AATGTAATAT CCCTTGATCA CCCCAGACTC ACATCCAGAT TCTGACTGAC60
CTCGTGCATA GCCATATTTA ACTTGGTCCC TGATGATCAA AACAGTACAT GGAACTGGGG120
CCGAACATTT CCCTAGCCAA AGGAGCATCA GGGATTCAAC GTGATCAGTA CAGCCTTGTA180
GCTCGCTGAA ACTGCCCTGG AGCCAAGCCA AAGCCTAGAC AGCAAGGTGC ATGGGCGAGC240
TTTGCGAGGA TTTAGTTGTT ATTTAGTATG CCAAGATTAA GCCACGCAGA ATGGCTTATG300
GCCATAGTAG CAACAACGGC CACGGAACGT TCTTCCATGT GGTATGGGGA AAGCCGCCGG360
ATATTTGGGG AGGGCGTGAT TGTTCCGGTG GCTATCTTTC CGGTGGAGAT AACGGCGGTG420
GACCATCAAA ACTCCTCAGC CCGGATTGCT CGGACTCCGC ATCGTCAAGT ATCGGTTTCA480
TGACAGCCAT TCGACTACTT AGAAGACACA AATAGCTATC CAACTTACCC GGACCTTTGA540
TAATAATTTT CAGCAGATCT GTCGATCTCA GAGACAATAA TGCCACCGTT CTGTGTGGAA600
GGCACTGCGC CGTGGTTTAA CAATAATAAA ACTCCAAATT GCCCAAAAGC TAGAGCGAAG660
GAAAGTCGAG AAGCCCAGTC TAGACTGGCG GGCTGATCGT CCGGTTCACA ACCTGATTGA720
CAAATCATCT GTGACCCTCG ATGTTCCGCG GCGTTGAGCG GGTGAGAATG TGGATCCTAG780
TGGGGAAGAC CCAATTGCCG CCGGAAAAGG TGAGCTTGTG CTGCACATGT CCGGTGGCTC840
AATTCAGGGC CATGCCAGGA CATTGCTCTT CAAAGGGATG CGATTGCTAT TCCCTATTTA900
CTTCTTTAAC CCGCTGACGG GCCTGTCTGG ACCGAGAATT CTTGGTCAAG TTTCAGTGGA960
GCGATCCAGG AAAGAACATC CGATATGGAC AGTTGCCCTC GATCTCAGGT CTGTAGTCGT1020
GTGACACAGA GGCCTCTACT CGCTTGCCTT GCATGTCGGA GCTCAAAGGT GCGATGTGAA1080
TTAACACGAG GAGCGACTGT CTGTCGCAGA TGCAAC 1116
<210>20
<211>3191
<212>DNA
<213>Aspergillus niger
<400>20
GGAGTTACGT CCCAGAGATG CTGCGGACAA TGCCGATGCG GCATACTTCT CATACGCATC60
CGTCAAGTAA TTCACAACAG CCATGTAGAT ACTGTAGATG CCAATACCGG TAGCCCCGAT120
GCCGAGGGTC GGGACAATCC AAGGCACAGA AGGAAAACTG GCCCAACCAT ACCAGAACAG180
CCCGCCTGCG AACAGCAAGC TGCCAATGAT ACTAGTATAC AGACGGGCCT CCGGGATGGG240
TTTCCCGGGC TTCTCTTTGT TGCGTTTCGC CGACCGCAAA TACAGCATAT CCTGAAGAGG300
ATTGACGAGA GTACCGATTA GAGCACCCAC GGAGATGGCC AATTGAATGC ACCCAGTTTG360
CAAAGTATTC ATGCCGTAGT TGGTGGAGAA GGTCTGAACG ACACTGCTGA AGAAGAGATA420
CAGGATACCC CAGGCGAAAG AGATCCAGAG GGTGAAGAAG GCAACGACGG GCTCGGTGAG480
GAGCATTCGT GTGGGCCGTT CGAAGGAGAT CTGCATCAGA CGCCAGACGC TGGTGTTGTC540
TAGCTCGGCT TCGGCGTAGA TGGGGCGCTG CTTTTCTTTG CGGAGCTTCT TGGCCCGACG600
GGTGAGGATC ACGTCCGCGC GGGTTTCGTA CAGGATGAAC CAGAAGATGG GTAGGAGCCC660
TGTTAGATAG ATAATTTGGA TGTAGAAGAT CCAGCGCCAC GGGGCGGTTT TGTGGATGGC720
TACGATGGCG GATCCGATGA ATGGGCCCAG GGCAATTCCA ACCACACTGG TAAAACCGAA780
GAGCGACATA GGGAGACTCC TCGCTTTGTC ACCATACCAG ACATCACTGA TGCTACCGCC840
GACGATGTTG ATCGATACGG AGGACGCACC ACCACCGAAG AAACGCGTCA CTACGAGAGT900
AGCGTAGTTT TGGGCGAAGG CGGAGGGGAA TAGCGAGATG ATGAGAATAA TGTAGGCGAC960
AAAGTAGCCG GGCATGCGAC CGGAGGACTC GGTCAGAGGC ACGAATATGA GAGGCCAGAA1020
CGCCGCACCC ATGTTCCAAG ATGTTGTGGC CCAGTAAAGG TTAGGAAATG GGGTGTTTTG1080
AACGTGGAAT CGTTCTTCCA TCCAGTTGTT GCCGGAGCCG TAGGAACCGG CCGGGATACC1140
AGTGAGGATG GAACTATACC TATTAGCACT GCCATCTTCG AGAACAAGGC TAAGACATAC1200
ATGAAACAAA CGGTGACCGT GAGAAGCCAT TTATAAGAGG TGCTCCAATT GAACCTGAAT1260
ATGTTAAAAC TAGTATACTA GCAACTGCAT GCTTGACGTA CGGATTGTCC GGGTCATCCT1320
TGCCGTTCCA GGTATGGATC TCAAGGTCCT CCCTGTCACG CAGATCATTG TGGCTGACTA1380
CCCCGACATG GGGGTCCCGG CGAAAGAACG ACCGCACCCT GCAACGTCAC TTAGTGGCTG1440
TCTGACAGGG ATTGATTGGC AATGATTGGC AGACTAACCG TCCCAGAAAC GAATCATCGA1500
ACTCATTGGT GTGCACTGTG CTAGCGCGGC GCAGCGACGG GCGTGGCTCC TCGGCAGGGG1560
TGGACATGAC TTTCTCTGTG TAGATTCCTT GCAAGGTATC TGCTTGACAG ATGCAGAGAT1620
GATGTTGAGT AAAATAGGGT GCAGAGACCC TGCAGAACCT GCATCGGCCG GCGGCGACAT1680
GTCGTCATGA CCGACCCGGG CCGAGCGGAA TTAATGAAAC TCGGAACAGC CAGGGGAATC1740
CGACGCTTTG AGTGGCCAAT CCATGTCTAT CCACATCTGC ATTGAAGTGG ATGAAAGGTG1800
GAGGAGGGCT GGTTGCCAAA TTCTGTTAGG GCTTGGAATG TAAGCAACCG GTTTCGGTCA1860
TGACATCATC ACAGCGATGA CTTCATCACT CTCGGACGAG CATATATAGT TGTGCCTGTC1920
GTCGTATCTC AACAAACATC AACAACAACA ACAATCATCT ACTGCATTTA CCAAACTCAT1980
CTCTACCTCA ATCAACATGC CTATCTCCAT TCCCTCCGCC TCCAGCGTCC ACGACCTCTT2040
CAGCCTGAAG GGCAAGGTCG TCGTTATCAC CGGCGCTTCC GGCCCTCGCG GCATGGGCAT2100
TGAAGCCGCG CGTGGCTGCG CCGAAATGGG CGCCAACATC GCCCTCACCT ACTCCTCTCG2160
TCCTCAGGGT GGTGAGAAGA ACGCCGAAGA ACTTCGCAAC ACCTACGGCG TCAAGGCCAA2220
GGCCTACCAG TGCAACGTGG GCGACTGGAA CAGCGTCAAG AAGCTCGTGG ACGACGTGCT2280
GGCCGAGTTT GGCCAGATTG ACGCCTTCAT TGCCAACGCT GGCAAGACAG CCAGCAGTGG2340
TATCCTGGAT GGTTCCGTTG AGGACTGGGA AGAGGTCATC CAGACAGACC TGACGGGTAC2400
CTTCCACTGC GCCAAGGCGG TGGGCCCGCA CTTCAAGCAG CGCGGAACGG GCAGCTTCAT2460
CATCACCTCC AGCATGTCGG GTCACATTGC CAACTTCCCG CAGGAGCAGA CGTCGTACAA2520
CGTTGCCAAG GCAGGCTGCA TCCATATGGC CCGGTCATTG GCCAACGAGT GGAGGGACTT2580
TGCCCGCGTG AACAGCATCT CCCCGGGTTA CATCGACACG GGGCTGTCGG ACTTTGTGGA2640
TAAGAAGACT CAGGATCTGT GGATGTCGAT GATCCCCATG GGACGCAACG GTGATGCCAA2700
GGAGCTGAAG GGTGCATATG TCTATCTCGC CAGTGATGCC AGCACATACA CGACGGGTGC2760
CGATTTGGTC ATTGACGGAG GATACACCGT GCGGTAAATT ATCATCCGCG GTCGGATAGA2820
AAATAATGTT TATGACATGT ATGTAATGAA TATGAATGTT CAACAATAGT CTTCAATTCT2880
TCACTTGCTA GTATCCTGAG TATCTTGTCG TATAGCTCAA CAACCTGGCA TGGCCGGGCG2940
CGCAGTGTAG CTCTCCCAAG TCTATGGATA CAACTTGCGT CAGTGTGGAT CTTTGGCTCA3000
GATTCGGAGG GGCAGTGGGG TAAACAAGAA CACGCAGCCA CTCTCGGCTT TGCGGATCCC3060
CACGGAACGC CAGTCAACCC TGAAGATTCA GTCCGGGCCT GGGCTCGGAC TGATTTGGTG3120
AGGGGATTCT GCATCCGTCC AAACCTTATC ATCGTTGGTG AGACGGACTC CGGACAGCCA3180
GGAGCCTTAT T 3191
<210>21
<211>4031
<212>DNA
<213>Aspergillus niger
<400>21
GGGGTCAAAG GACACAATGT CGAAATAGCG AGATTGCTGT GCATCATCGG GGCTGTCTAC60
AGTCCGCTGG ATTTCTTTCC CTCGGTTAAG TATTTCCTGC ACGCCGGACC CGCCAGGGCC120
ACCTGTATTC CTAGTAAGCG ACCGTGGTGG GGTGACAGAA TGGTGGCGGT GGTGGCATTG180
CTGCCTATAC CTGGGTTCAC GATTATGGAG CCACCGTAAC GCTCGTCGGC AGGATCTACC240
TGTGCAGGCA GTTTTATGAC GGCCAGGGCA GCCGTTTTAT TTTCAATGGC ACTAGCTGAC300
CAGTCTAGGG GAACTTCGAG ACGTGCACAT AGATAGTCCT GGTAGCAGGG GATGAAATTT360
AGTGCTGAGC CTGGCGCAGT CTGGTAGGAG CGGGTTAGAC TGTGAGAAAT TATAATAGGG420
CGGATGAGAT CAGTACGCTA CTCCAGGAGA AGTCCCCGGC TTGCACCGCA GACGGCATCA480
TGGGTTGGTG TCGCAGGGAG GAGGGTGAGT TGAGTAAGAG AGAATTAATG AAAAGGATGG540
AGTAGCCGAC CATATAAGTA CTGGATGAAG TGAGCGAGTT AGCGTCAGCC ACGACGGGCT600
GACATGCATG ATCGGGGCAC CGCCGGCAAC CGATACAGCC TCAGCTCGAC GGGAAAACGT660
GGTTACCTGG ACTTAGAAGA TGATAATACA ATGAAAAGAT AGCGTAGATT GCCATAAATA720
CGCCACAATC TATTTATTAG GCAACAATCA AGTAAGAGCA GATTTGGCGA CTCATAGTAG780
TCCCCATGGA GGGGCGCGAT GGTTTTCTTC GCCGAAATAA TCGCTTAATG CCTCTAACGA840
AGATCTCAGA ACCTCCAAAC TGTAGTATTC TTCTCACAAG CAAATCCGAG AAACGCAATT900
GACCATATGT CCTTAGTATG AGGGCTAGCA GGAATACTTG TTTGTCGATG CATACCGACT960
AATAAAAATG GTTCTTCTTT TTCGCGCAGG GATTTGGTTT TTCATTTTTC ATTTTTCATA1020
TTTTATGTTA TTTTATTTTA TTTTTTTGTT TTATTTTATT TTATTTTTTT TTTTTAAATA1080
AGACTGGGTG TTTTCGTCTC CCACCCCTGC TGAGGAACTG TTTGATATAC AGAAGCCTGA 1140
GATACTTGAG ATTATGTGAC AAAGAAATTG TAAACCTGAA TGTGACTAAG GCAGAAGAGA1200
GCAGGTGAGG CCACACAATA CTGTACACCC ACTTCCGATC GTCATCGAAA TGAGCGTTGT1260
GGGTACTGGA ACGACAAACC ATAGATCGGA TCTGCATCCG AATAGGCTTT ACTTTGTACA1320
TTGGTAGGAG TTTGAATGTT TGAAGATCCG GCAGATGATC ACCTGCTGCA GGGAATAATT1380
TGAAACCTGT CCGTCTGCTT TGACCCAATT GACGAGGTAC GTGATTTGAT GCTACCCAAG1440
CAGTATGAAT GCGACGGAGG TGGCTATCCT TACCTTGTCA TATGCAACTC ATAACGGGTA1500
GTCCCCATGG AGCCACGGCT ATTTATTTCT AAGGGCCAAC AGTGAAAGAT TGTGAGATCG1560
TATACCTCCT GGGTATGACG CAACCAGGGT GAGCACTGGC ATTGCTCCAA TCCATATGGT1620
GGAGGTATGT CTCCGAGACC ATGACGCATG TAGACCCTGA CCTGTCCCTG ATCCAGGGAT1680
CTGGTTTGTC ACTTGGCGTA TTTTAATTAA CTGCGGGTCA GGGTCTTGCC GTCCAGACCC1740
AATGGATGAA TTGCCTGCGT GGCCCTGCAG TTCCAGCGAT CGGCACGGCA CGGCTATGAC1800
GTCGGTGGGT GTTCCGTTTG ATATTTAACC ATAGAAGACA GCCTTGTTAT GCTGGTTCCT1860
GCCGCAAAAT AAAGGTCTAT CCTTACCACG TTAAGTGTCA AAATGAGTGG GGTAAGCTTT1920
GCCCGTCAGG CCTTACTCCA GGCTGCTCTT CTTTCGATTG TCTCCGCAAT CCCGGCGCCC1980
ACGGCCTTCG TCAACAATGT CGCTCCGCCC GAGCCCATCA TCACCCCTTC GCCGGTTCAA2040
CATCGACCTT CTCGAGTCGC TGGTCGAAAC ATTCTGAGTG ACGTCGATTC TGATATTAAC2100
AGCATCCTTT CTGGCCTTGG ATCCGACCTA CCCTCCTGGG TCGCATCGGG TGTGCCCAAC2160
TACTTCCAGG GTTTCCCTAC TGGGGATGCA GTGGTGAGCT CCTTGGGCTT GAACAGCGCT2220
GAGTTGGCAG CCTTGCCCAC CAATGTCTTG AATATCGACC CATATGCCAA CTGGACTAGC2280
TCTGGCTGGA ACGTTCGCTT CCACGGAAAC GTCTACAAGC AGCCCAACAC CTCCATCTCC2340
GACCTCAATG ATTTGGCTGA TGTTTTCCTC GGCAATACAA GCATCTCCGA CCTTTCCGAA2400
TCCGAGCAGA AACAGGCTCG GAATTTAACA GCGGAAATAT TAGTGGTCCA GCAAGCTCAC2460
GTCGCCGTAA ACACAATCCA CCTGGAGCCT GCACCGAGTC AGGGATCCAG CGGACAGTCA2520
GGCGGCGGTG GATCCTCTAA TACCACTGGC GGCACCCAAG ACCTCACTCT GCCCTACAAC2580
ACTACAGTTG AAGGCGATTT TGACACTTTC GTACCGATTA GCAGCAATGG CTTGACGGCA2640
GGTAATGAAA CTTCGGCGAT ACAACGGCTT AACGTCCATG TGGAGGGCGC GACAATAGGA2700
AACAGTACTG CCTATCTCGT ACCTCCGACC GGGCTCACTG TCGTTTCGGA CATCGATGAT2760
ATCCTACGCG TCACCAAAAT CTATGAACCA GAGCAAGGTT TACTCAACTC ATTTGCGCGC2820
CCCTTCAGGC CGTGGGAGAA TATGCCGGAC ATCTATCGCA ACTGGTCGAT CAGTCTCCCC2880
AACCTGCACT TTCACTACCT AGTAAGTCTG CTAGATGTCC CTGATTGCAT TGTTGCTGCA2940
TACTCACCAC TACACTACAG ACGACGACCC CCGAACAAGT CACCAGGAAC TACATGCAAT3000
TCATCTACGA CAACTACCCC GGTGGATCTT TCGACACCCG TCCCCTCAAC TTTAGCGACG3060
TTTCCGCCAC CTTGTCGATC CGGAAATTCC TCCTGCAAAA GGTCTTCGAG ACCTTTCCGC3120
AGCGCAAGTT CATCCTCATC GCCGACACCA GCAACAGCGA CGTCATGCGT GACTATCCTG3180
AAATGGCGAC CGACTTCCCT GGTCAAGTGC AATGTATTTT TCTCCGGAAC ACCAGCGCCA3240
CCGACTCAGG GGACAAATTC CCATACGATA CCTCTGGGTT TAAGAAGCTC AATCAGTCAA3300
ACTACATGTT CTTCTTGCAT CCCGATGACT TGACGAATCT AGACATCGCG AATGGCCAGT3360
GTTACAACAC ATCCATTCCG CAGAATTTAA CGTTTAGTTA TCAGGGTTTG CCATTGGGGC3420
TGGGTGATGA ACCCACAGCT GTCAATGGGT CTGCCAATCA TACTGCTGAG TCGGCGGCCG3480
GTTTGTCGGT AAAGGGTGGG ACTGATATGC AGGGTTTGAT CTTTCTGTTC ACCCTGGTTA3540
CGGCCTATTC CATTTTCTTG TAAATATCAG TTACGATGTA TGAGAGATAA CGACTTTGAT3600
ATACTCACGG CTCAATTTAC GTTCCAAAAC CGAATACAGC GGATATCTAT GCTCGATGCA3660
AGGACTACCA CTATGTTACA CTACTAAGGG TTTATCTACT ATGGGAAATA TTAGTGCTTG3720
GTTTGTTACA GCTCACTCGA GCTTGCGTTA CTAACCACTT TTATCGGTCC ATGGATCCAC3780
CGCCCAACGC AGTTATCCCA GGAGGTGGCC GCAATGGCCA GTCAAGTCAA TTAAATCTCC3840
TCTGCTAGGA ATTGCATGGG TTTTGACAGA CAGAACTCGG GGAAAGTATC GATATTCAAT3900
GATCTGACGG TGGCTCCGAA ATTCGCTAGG CTAGCCCTTC ATCACTAGTA ATATTAGTTG3960
TCCAACTTTC GCGCTTTACA CTTTCCATAG CAAACCCCCA ATTCCCAGCC AAATCCTCAT4020
ATCCTCTAGG A 4031
<210>22
<211>3771
<212>DNA
<213>Aspergillus niger
<400>22
GCTTCTATGG TATCAAGGGT CGCGTAGCCA AAAGTTTAAC TGCATCGCTG CGGTATTAGT60
CGGTGTAGCT GGCTGCAGCT TTCGTTGTGT CCCTGGTCTG TTTAAGAAAC GGTATCAGAT120
CTGTCCCGCC CGTCCCCCTG ACACCGGCAT TGAGTTTCTC ATGAGAATTG TCCACTATTG180
TCGACGTTGT TGTGGCTAGG TTTGTTCTCG AAGATACTTG GTTTGGCGGC GGAGTCCTTG240
CAGCCATGAT GATGTATCGA GTCACCATCC GCACATGCTT ATCGCGAAAT CCCCCAAGTG300
ACATAACCGC CATGTTATAT GCATCCCTCA AAGCAGATCC GGGCTTGTGA CTTAATACAT360
AGGATCTCAC ATTAGACGTG CGGAGCATCA TTTCCAAGAA GCGTCGGTGA GGGCCTGGCA420
TGTAGTTTCG CATGTTCTTG AATATACAGT CAGTATCGAC ATTGCTTTGT CTGGATAACT480
CCTCGAAGAT CAGTCCTTAC CTGCATAAAA CCAGTCATGA CTTGAGGATT CGACTTGCCG540
TGAGGCTTGG TCTCCCCAGT GGCCGAATGT TCCACACCCA AGAAAATGTC GAAGGCTTGG600
ATCAGAGAAC TTTGAGCATT GCTACCACCA CTGTATTGAT GCCATTCGCC TCGTCCTTCC660
CCAACATCAT AGAATACGCC GTTTGGCAGC CCGGCCGATG CCATGTTCTT GCTGCCGGCT720
AGGTATGGAC GTAATTGATG GTAAAAGACG GGCGGCGCAC ACTTTTCATA CATGCGTTCC780
AAGAGGTCAC CGAGTTCCTT GAGACCATAA TTGAGCTGCT CCAGACGAGA AATAACACGC840
TGGCTATCAT CAACATTAGC TGCATGCATA GCATCCAGCA TTAGCTCGAT GAGCTGTGCT900
CCCTTGGCCT CGATAGCGAC GGAGAGGACG AAAAACCATT CTTCGTCTTT GGTGCCTGTG960
AACGAGGTCA CCACTGATAA ATTGTCTGGA TCCGTAACGT CTGTATCAGT GGATGGTACT1020
GAAAAGTTCC AAAGATTGAG GGCAGCATAT GTAGCACATG GTGGTAGCTC TAAGTGGTTC1080
GAAACTTCGA TGAATGGGCG TGATATACAG GGGGGTAGCA CCTGTATAGT TGATGTCAGC1140
GAAGGCACGG GCCATGCAGT GATAGACAAG AAAAGAGGGA TTGAATAAAA GACTCGATTC1200
TGAAGGGGAG TAATACATCT TTCGGCTTCT CACCACCCCA GATGTAGGCG TGTGTAAGGT1260
AAGCAAGCAC AACATATGCT CTCCGCCACT CAGGTTCCCC CTTCAACTTC TTCGTAGAGA1320
GTATACCCAG GTCATCGACA GACCTCCTGA TAGTACCAGA CTGAATCAGG CCAGGCAAGT1380
CCTGAGCGAT TTCCTCCCAC GGGGAATAGT AAGGGTCTTC CAATCTCCGT ACGGGAGGAA1440
CTTCCGGGAG GAACCCGTTC TGGAGGGAGA CACCGTACGC AACAAGTGAA ATGTCTTGTG1500
TATAAAGCAT GATAATATAT GCACTTCAGT AGACAACTTG ATATTCAAGC CTCCTTGAAA1560
TGATCCTCAT GCAGGTAAGA GTAGATCCAA GTGTTTATAT TGTATTCCCA AGGAGGGACG1620
GAAGAAAACC GGATCCAGAG GGCTCGAGAT AGGGCCACCT GCATGAGCAA AGACGGGTCA1680
TTTCCCGTTT CACAACGACC ATTCTCAGGC AGAAAGGCAG TGGATTAGCG GAAAACTTAG1740
CAACCATCCG GATTTCTGGA GTGGATGCTT TGTTATCTCA CTTCCGGCAA CACGGATGGT1800
GAGGCGGAAG CGGAACGGTA TCCGGATCCG GAGGGAGGGA CAAACCGAAG TGCCTTGTGT1860
CACACGCCGG TCCATATATA AATGTTAATT GGTGACGGTC AGCGGATTGT TTCTGGTGTT1920
CATCCATTTT TTCTTGATAT CCTGGACCCA GTTATTGCAC TTTAATTACT ATCCAAAATC1980
CACAATGTCG AAGTCGAATG GCGTCAGCCT GGCATTCCCC GCCGAAGCAG CGACAAAGGA2040
ATATGCAGCA TCTCTAGACT CTTCTGATAG ACTTGCTGCA TTTCGGGAGA AGTTCATCGT2100
CCCATCGAAA GCAAATATTG CTTCCAAAAA GCTAGCAAAG CCTGGTGGGT TCCATCCTGG2160
CAACTGTAGA CCTCGTCACT AATGTCACAG GCCTTTCGCC CGAGTCATGC ATTTACTTCT2220
GCGGTAACTC ACTTGGCATT CAACCCAAGG CCACAGCAAA GTACTTAGAA GCACAGTTGG2280
ACACTTGGTC ATCTATTGGA GTTGGCGGCC ACTTCACTGA TCTTGAGGGC TCACCCTTGA2340
AGCAATGGCA GCTGCTCTCA GAGCAAGCAG CTGATTCAAT GAGCAAGATT GTGGGAGCAA2400
AGCCAGAAGA AGTCGCAGCG ATGGGAACAC TTACAACGAA CCTTCATCTT CTGCTGGCTA2460
GTTTCTATAA ACCGACTCAA ACAAAGCACA AGATCTTGAT GGATTGGAAG GCTTTCCCAA2520
GTGATCACGT AAGTTCGAAA GAAGCTGCCT TCTGCTATCA CGGCACTGAC GATTATATAG2580
TACGCTATCG AATCTCATAT TGCCTGGCAT GACCTGGATC CTAAGGAGTC TATGGTGCTC2640
ATCGGTCCAG ATGAAGGCGA ATACGAGATA TCCACCCAGA AGATTTTCTC TTATATCGAC2700
AAGCATGCTG ATGAGGCTGC TATGATTCTT CTTCCTGGTA TTCAATATTA TACTGGGCAA2760
CTGTTCGATA TCCAGAAAAT TACAAAATAT GCCCATTCGC GCAACATGGT TGTTGGCTGG2820
GATCTGGCCC ATGCGTTCGC TAATGTTGAG CTAAAGCTGC ATGATTGGAA CGTTGATTTT2880
GCAGCATGGT GCACATATAA GTACGGAAAC GCCGGTCCTG GAGCAATGGG GGGGCTTTTC2940
GTGCATGAAC AACACGGAGA GGTCGATTAC AGCGCGGGAG AAGATGCACC CAAATTCCGC3000
CATCGTCTGA CCGGGTGGTA TGGTGGCGAT CGATCGGTAA GATTCAAGAT GGACAACAGT3060
ATGTGTGCAC TTGGCTATAG AACAATTTTG TGGGCTAGTA AGCTGATACG ATTGATAACC3120
AGAGTTCAAA CCTATTCCTG GGGCAGGAGG ATTTCAGATA TCAAATCCTT CGGCCATCGA3180
CCTTGCGTGT CTTTGTGCCG CTTTATCGGT GTTTGATGAG ACGTCAATGG CAGATCTTCG3240
CAGAAAATCA TTGAAGCTAA CAGCATACCT TGAGTTCCTT TTGCTCAGGG ATTATGAAGA3300
AGAATCTAGG CCATTCAGCA TTATCACGCC CAAGGACCCC GAGGCGAGAG GCGCACAACT3360
GAGTCTATTG CTCAAGCCTG GTCTATTACA GAATGTTGCA CAGAAGTTGC AAGAAGCAGG3420
AATAGTCTGC GATAAACGGG AGCCGGGTGT TGTGCGTGTC GCTCCGGTTC CTTTGTACAA3480
CAGCTTCAGC GAGGTTTGGA CATTTGTGAA GATCTTCAAG GATGCACTGC AGCAGTGATG3540
GGTCTCACTA GATCATTTGG TCAGGACTGA GACCAGATTT GTCAAGTTCG CTCCGATGAA3600
TGATTTTTTA GATAGATACC AAATTATTTG ATTCTTAGAT TTGTTGAAGC TCTCACTGCG3660
ACATGGTCCA CAGCCACTGT GCAAAAGCAA ATAACTGAAG TAGGAACTCT ATGATAGACC3720
CGTACTGTTG AGGTTATAGA TTTCCAAAGC CGTTCCTTGG ATCACCACTT C 3771
<210>23
<211>3562
<212>DNA
<213>Aspergillus niger
<400>23
CCTGTGCTTG TGGTATGACA GAGCCACTGA TATCATCTCC TCTCATCTCC AGTTGTAATC60
GGAATTGATC GAGGGGGCCA ATCTTCCACA CAGCCCCATG GAAGACGCAC AGATGCTTTC120
GATGCCACGC TGGCAGACGG CCGCCAACTG TCATCGTCCA GTGCTGCCGC CATTCCCATG180
CAAAAGCCAA CGCTAAGAAG CGCGCGGGCG CCGAGTTTCC ACGCTTGCAG CTTAGTTCAG240
CGACCCAGCT CAGTGGCGGC TCGCTCATGC ATAGAAAGAT GGGTTTGGAC CCGCGCTGGG300
CCTTTCATCT GCAACACTGC TCGCAGACCA TGTGTGACTT TTGGCTGCAA AAAAAAAGAG360
GCTGGCGACA GCTGATCCAC TGTGCTATTC CTATCTCATC CTCCCCGGCT GGATCGAAAG420
CTGCACGGCA GGGGAAATCA ACAGTTGGGC TCTGACACGT ATCGAGCTAA CTGATGCGCT480
GTCCTTCCGC CTAATGCCTA CTAAGTCTTA GGGACGGGAC CATCATCCAA CATGCCACCT540
TGTCCTTCGT AATTCCTTTT TGATCTCGGT GATGGTGGCC ACCCAGGAAA TGACGTTCCT600
CACCTTGGCT GCAATTGGTG CCCGATGTCT CATCTCCGCT CAGAACGGCG GCGAGGGCAG660
AATAAAAATT GACGGGCACA GCAGGAACTA ATCAAACATA CCGGCGGTCT TCTAAATGAT720
CGTATCTCCC GGAATACTCC CTCTTTCTAC AGAAGCGGGG ATCCATTCGC CCTATATGTA780
TAGTGGAGCT TTGCCGCACT GATTCGCACG GCATTATACC TCCGCACTGC CGTGCCTTCA840
TCCACTTGAT TGTGGCCAGG GAAATATCAA CGGGGCAGAT AACTTGCCCT TGCATCATTA900
TTGCTCCGCA CATTCATTCA TTATCGCTCT GATCCCACAT CCTCACGCAG CTGCGACCGG960
AGTGTCCACA CTCTAATTGG GATGAGCATT GCCTTTCAGG AACTTGACTT TTTGTGGTTG1020
CATCTTTTGT TGCCTTACCC ACGCAGGCTT CGTTTATGAG ATAGCGATTT CAGGCCTCAA1080
ATTGCTGTCA TCACTTCCGG CCCCAAACTC GTGGGCGGTG CCCGCCCATC GCTGGCAAGA1140
AGCACAGACT AACGCCTTAC TTCGCCTAGT TGCACACGAT GCATCAAGAC TTCCTCCTAT1200
TTCACAACGA CCAGCTCCTT GCCATTTGTT GTTTCGAATG CCCCCTTCCC CGTGCCTTGC1260
ATTTCTAATT CCCATCTATA CCCTTTTGCG CTCTCACGCC CGCCTGACTA TCAATTTTTC1320
TGCCAGCATA ACCCTGCGTG CAGAGCGGTT GACAGCAGGC TTGCTAAGAG TCTTCGTCTA1380
GAAGAACTGT CTGGGTGGAT TCCTTTTCGG ATTAACTTTT GCTATTTTAA AAGCTGATTG1440
CACTACGGAG TACACCCGCA ATCTGATTCT CACTGATACT CCAATTAAAG GCCACTAATT1500
GCTGACATTT GTAACATATT TGCGTTTGCT TTCCGGTTGA AATTGGCGGC TTTGTGCTTT1560
CGATCGCTAG CAGTCTCTGT GCATGTACAA CTGATCGGCT ATTCAGTCCT ATTCGGAAGC1620
GGCACTGAGA GGCGGAGACA AGCCACAGAT ACGACGAGTC TGATTTTGAG ACGGGCGCAT1680
CCAACGAAAG CCTGCGATTG CAATTGAAGA TCTCAATTGG GGGACTGACA ACCTAATACC1740
TAAACATATC GAGGATTAGG CGCCAACACG AGCATGGGAA GCTTTGGTGC ATGCGACGGC1800
TGATCCATTT CTAACAACCG TTTTGCGCGC GCGTCCGAGG TAAGGCTCCC GATCCCTTGG1860
CGCTTTGCAT GTTTCACTCC GATGCATCTA CTGTTTATAT GAGTGCGGTG GGCAAGCTGT1920
GCCCACCGAC TGAGCATTCT CAACCGGCCC AATGCTGTGG GATCGATCCT CCCCTCCAAA1980
GTTGTCGCTC GGTTACACTT GATCGGAGCT TGTTCTGTTA TACACCAAAC CATCATGGAT2040
GTGACTAATT TGGCTGTCGA TTGTCCCGTT ATAGAGACCG GTTCCCTTGC TTTGTGGATG2100
GCTTCCTCCG AAGTGGACCA GAAGGCCTTG GGCAACTTTG CGGCCATAAC GGGCCTCGAG2160
AACCCGTTCC TGTCCGCGAT GCTGTACAAG ATTCTGGGGT TGTCTGTTAT GTTATCGAAG2220
AAACTCCTCC GTGCACGACG ATTGCGGCGC CTAGACCCCA CCCGAGAGAC TAAATCGCTT2280
CATCTTTATT ACCATATCAT CTGGCTTTCG CGTGAGGGTC TTCTGATATT AGAGGAGTTC2340
GTCCTGCCAC TGGTTGAGGG ATTTATGGAA CTCAAAATTT TAGCTTACAA GCTGCGCGCC2400
TCCTTTTACC ATATATTCGT CCTATTTCAG AACCAGCCTG CTGTCCACTC GCCGGGTATC2460
GTTAGTCTGC CGAGTAGTAC ACCTTTATCC AACGGCGTGA CAGAAGCGGA GTCACCATCC2520
AAGGATTCCA ATTTGAGATT TTCATTTCAG CTGAAGCCCG ACACGATAAC GGTTTCCGGG2580
AAGCCCAGTT CCGCCTCGGA TAGTGCGCCA CGAGGCAAGG TTACGCAGGC ACCCCCGGGC2640
TTTGCGCCGG TTCAACCGCC CAAGTCGAAC TCGGCGTTTC TCCTCCCTGC TCTCGATTAT2700
ACCCCTACAG CTACCGCATG CTTCAATCAT GCCGCCCTCT TGGCAGATCA ATTCCTCCCG2760
GGGTCGCACC CGCTCCGTCT GTCCATCAAG CTTGAATTTG CCGCCTACCT CTACGATTGC2820
CTACATGACG CTCATGCCTG TCGACGGTTG GCCAAGCAAG CCATTGCCGA TGTGTACAAT2880
GCGCAAGAGG GCATGGACGA CGAGAGCTTC GAGGATGCAG CTGAGATTGT GGGTATTTTG2940
GGCAAGATGG TGAAGCGGGG AAGGAACACA AGCAGTGCTG GAAATAGCAC CACGGCTGTG3000
AAAACGCCCC AGGAGGAGCG AAGTGAGGGC AGTCGAACAC CATCCTCTCA GACAACGTTG3060
AAAAGGCCGG CGCGAGTGCC GAAAAGCACC TCCTCACCGG CGCGCGCGAC CAAGCCGACG3120
ACTAGCGAGG GGATGTCCCC CGCTGTGCCC GACCCCACCA TGATGAATCC CATATGATGC3180
CTTTCCCTAC GACCTGTATA TGCTTCTTCT TGGAACTATG GAGTCGCGCA TGAGCGCTTG3240
GCCTGTGACT TCTACTTGAC TTGCACCTGT CTGTATCATC TCGGTAACGG AGTTGCGGCG3300
ATAGACTGGA ATTGGGCATC AGCTTGCGGG GAGCTGTGGA ATGAGCGATT AAGCGCGACA3360
AAAACTTGAG GTGGAAGGGA CAGACCAGCC AATTTGTGAT GGTGACTGTA GATAGATAGA3420
TGTGTGCAAT ACAAAGTATG TTGTTGATGT CATGCACCCC ACTTGTGTAT GCTTGTCTGG3480
ACAATGGACC TACACTTAGT CGCAACAACT GTATGTCTCA AGCCAATGGC CATGGGGCAG3540
GATGGATCGA TGGATCTCTT GT 3562
<210>24
<211>4361
<212>DNA
<213>Aspergillus niger
<400>24
CGACGGACTA ACGTCGCGCG CCCCATTTCA CGTCTTGAAG ACAGATGTGT ATGCGATTGC60
TCGCGAAATT CTCATCCGAT TCCGTCGGCT TGACCTGACA TCTGGAATAG ACGAACAGGA120
CTTGGAAGCT ATCATTCGTA TTACCGAAGA GTCCAACGTA CTTCTCACTG ACTGGTGGAA180
GTCCGTCCCG AAACTGTATG ACTTCGATTA CTGGAAAGCA GACGGTCGAT GGGAAATGAT240
TGAAGGCCAG CTGCAAAGGC TTCCCTCCGA AGCAAGGCAA CAGGTGGAGA CAATATATCT300
ACAGGCTGCT GTTCTCCAGT TGACGTACGA CGGCATGGTC ATCCAAGCAA ATAGACCACT360
GTTGGAGCGA AGAATCAACA GGCTAACATC TTCGCGGGCG ATCGTGGATG CGATGCATAG420
GGCGCTTGAC CGAGCCACTG CTGCTGCTCT CCGCATATCC CGTGTTCCAG TTCACAAGCT480
GAAAAATCAT TTTGCTATAG CAGTCGTATC GATGCAAGAG TTCACTGCTG GTGTGATTCT540
CTGTATACCT CCCACGGTGA AGCCTTTAAC GGCCACCGCT CATGAGGCGA AGGACGGGGT600
GGTAAGAATA ATACGCGCCA GTCGAAGTCT CAAGAGCCAC GATCGAATAG CAAGGCAAAC660
TGAACAACTT CTGACGGAAC TACTCAAAGT TACCACCCAA CGCGAGATAA CGCACGCCTT720
GGCCGATAAT CTCGACACCA ATTTCCCCTC CGATACGCGG CTAACAGGCT CCGTTGTTGC780
CGGCGCCTCA AGTGACTCCT TGGGTGCAGG ACGCTCCAGG CCAGTTCCCG GATCCGCAGC840
GCAGGCAGTT GTAGATCCTA TCCAAGGAGC CTGGGACTCA GAATTCAATG CCCTCCCTGC900
CGTAACGGGA CCTTATGATT TCCTCCCTGC TCAAGCCTTT CAACAGCTGG ACGATACATT960
TGGTGCCTTT GGAGAATGTA ATATCCCTTG ATCACCCCAG ACTCACATCC AGATTCTGAC1020
TGACCTCGTG CATAGCCATA TTTAACTTGG TCCCTGATGA TCAAAACAGT ACATGGAACT1080
GGGGCCGAAC ATTTCCCTAG CCAAAGGAGC ATCAGGGATT CAACGTGATC AGTACAGCCT1140
TGTAGCTCGC TGAAACTGCC CTGGAGCCAA GCCAAAGCCT AGACAGCAAG GTGCATGGGC1200
GAGCTTTGCG AGGATTTAGT TGTTATTTAG TATGCCAAGA TTAAGCCACG CAGAATGGCT1260
TATGGCCATA GTAGCAACAA CGGCCACGGA ACGTTCTTCC ATGTGGTATG GGGAAAGCCG1320
CCGGATATTT GGGGAGGGCG TGATTGTTCC GGTGGCTATC TTTCCGGTGG AGATAACGGC1380
GGTGGACCAT CAAAACTCCT CAGCCCGGAT TGCTCGGACT CCGCATCGTC AAGTATCGGT1440
TTCATGACAG CCATTCGACT ACTTAGAAGA CACAAATAGC TATCCAACTT ACCCGGACCT1500
TTGATAATAA TTTTCAGCAG ATCTGTCGAT CTCAGAGACA ATAATGCCAC CGTTCTGTGT1560
GGAAGGCACT GCGCCGTGGT TTAACAATAA TAAAACTCCA AATTGCCCAA AAGCTAGAGC1620
GAAGGAAAGT CGAGAAGCCC AGTCTAGACT GGCGGGCTGA TCGTCCGGTT CACAACCTGA1680
TTGACAAATC ATCTGTGACC CTCGATGTTC CGCGGCGTTG AGCGGGTGAG AATGTGGATC1740
CTAGTGGGGA AGACCCAATT GCCGCCGGAA AAGGTGAGCT TGTGCTGCAC ATGTCCGGTG1800
GCTCAATTCA GGGCCATGCC AGGACATTGC TCTTCAAAGG GATGCGATTG CTATTCCCTA1860
TTTACTTCTT TAACCCGCTG ACGGGCCTGT CTGGACCGAG AATTCTTGGT CAAGTTTCAG1920
TGGAGCGATC CAGGAAAGAA CATCCGATAT GGACAGTTGC CCTCGATCTC AGGTCTGTAG1980
TCGTGTGACA CAGAGGCCTC TACTCGCTTG CCTTGCATGT CGGAGCTCAA AGGTGCGATG2040
TGAATTAACA CGAGGAGCGA CTGTCTGTCG CAGATGCAAC ATGAGAAATT TGGAGTGTGT2100
CTACACAAAA TCACGAAGGT ATCCCTCGTC TATCTTTCCG TGTGTATTAT TAGCCGAGAG2160
TCACGCAATG CTCTTTGTAT ACAATGAAAT AATGTTGGAG CTAGAGAATG ATTTCTGATA2220
GTTATATGTT ACAGGACACT CAGGAGGTCG TCAACTAGTC CGAACACGGC GTCCTCTCCT2280
GACACTAATG CCTCATCTTC GCCATGCTCG GACTCTAGTG GGACCCATGC TGGCATTTCC2340
ATTCCCCACT CAGATAGTCC CGCCAGTGTG GACGAATGTG GGAACAACGG CCTTTTCGAC2400
GGGGGTAGGT AATATGTCAT GCTTACCTGC GACACTCACT CACCATTCTT CTAGAATCTC2460
TAACTCAATT ATTGGTCTCT GGGAGCAAAG CCATATCAGG CCAACCACAT ATCGCCATTA2520
AGCCACATGT TCTGTCTACC TATCCCCTTG ACAACCTCCT CTCAGACATT GAGGGACTCC2580
TCGAGCAGCC AGTCTCTCAT TTGGCTCAAA GCAAGGAAGA TCTAACAAAA CCGGACCGGA2640
TGTTTCGAAC TCGCCTTCCA GCGGTCTCAG GTGAGGACAA TGAGTATCTG CTAAGGAAAG2700
GAGCTCTGCT GCTCTTGCCA CCAGCCTTGC GCAACGAACT ATTGGCGGCA TATGTCAACT2760
ACGTCCATCC GCTATTACCG ATTCTTGATC TTGGAGACTT TCTCTCACAA ATCATTGTTG2820
GAGATGATGC TCAATTCAAG TCACCACTAT TATACCAAGC TGTCATGTTC GCGGGCAGTA2880
TTTTTGCTCA GCGAGACGGC ACAGACGAAC CTGAACAGCT AACGAGGGCT TTATTTGAAC2940
GTACAAAGGT TAGTAATGGT TACAATTAGA CATATCTTAG ATATACTGAG CGATTTCCAG3000
GTTCTATACG AGTTTGAATC CGAATCATGT GCCTACACTC AAATTCAAGC TCTCTTATTG3060
ATGACTCTCT GGCATGGAGA TATGTCACGC CACAAAGGCC CGTCTTACTG GCTTGACGTC3120
GCCTTCTCCA CTGCGGAAAG AATTGGCCTA CTCCATGATG AAGACTGGCC ATGCGATAGC3180
CGTTCCTTCC GATCCGCTAT GTGGTGTTGC CTTTACGTAC GTGATCGAAC AATCTCGCTT3240
GGGTCTCGTC GGCCTCCACG GATGCCAGTC AACAAATATC CGGACTCAAT TCTCCATCTT3300
ATGAGCGACG CACCTCGGGA ATATGACGAA ATAATTCTTG AGAGTCTAGG TAGCGCTTCT3360
CTGATGCTTA CAAGCACTTA CCAAGAACAA TCGACCATGC TCTTCAAGGA ACTTGTCAAA3420
CTCTCCTACT GCGTCGGGGC AATCTTAGAT TATCTATACG AAGGGGCCTG GGTCCGAATA3480
CCAACACGTC GCAGCAGCTT TTATTCACTC GCCCCTAAAT GCAGCATCTC GCCATCCATC3540
AGACCAAGCT GTGAGAAACT ACTTTACTCT TGGATTCAAT TCCTCCCTCT CAACGCAGTC3600
TACCATCCGC CACAGTTGCC CGCCGATGCG GAAGGGGAGT CAGCCGAAAC AGTCTTCCTT3660
GTCCACAAAG CCTTCCTTTA CTTGCTGTAC CTAGCCTCCA TGGCAGTCAT ATACCGCACA3720
GGCACTCATA GCCAACAAAC CAGCACGGCA ACTCCGAACA TGGAAGGTCT ACGGGCATCG3780
ACGTCACAAA TAAAAAAGGT CCTTGCGGAG CTGCAGGGCA TGGGACTGCT TCAGTTCCTT3840
CCAGGGGCAT CAGTCACTAT CCTGATGTTC GCTGTGGAGG CTAGTCTGTT GGATCTCCAG3900
GGCTCGGATA CCATGGTCCG AAGGCAGGCT ATGTCAAATC TATATGCCTG TGAGGAGGCT3960
GCGTTACACT TGATGCAGGC TTATCCTACG GCTGAGATGG CGGTATTGAA GACTAGGACA4020
GCCCGTGCAA ACCTTCTTGG GTTGGTTGAG ACATGAAGAC CAATCATGGA AGCTCTGCTT4080
CCATCAAAGC ATTGTGTCTT TGCTTAATGA ATGAATGGAT TATGAGCGTT TCGCAACCTT4140
CTTTAATGCA GCTACATAAT AGAGCATAAA CAGAGGCCCG GAAATATATA ATTTGGCTAA4200
GAACCCGGTT GCAAGCAGGC AAGTCACGAG GTGCAGAACA TACCATCAAG TTTATAGATT4260
ATTGTAGGGG ATATCCTCAA CAATATCTTA CTTCCACCAT TACGTACTGA AGATCGAGGT4320
TATCGGGGAC CATGCTGTCG TGTCAATAGG TACGACTCGT T4361
<210>25
<211>801
<212>DNA
<213>Aspergillus niger
<220>
<221>CDS
<222>(1)..(801)
<400>5
atg cct atc tcc att ccc tcc gcc tcc agc gtc cac gac ctc ttc agc48
Met Pro Ile Ser Ile Pro Ser Ala Ser Ser Val His Asp Leu Phe Ser
1 5 10 15
ctg aag ggc aag gtc gtc gtt atc acc ggc gct tcc ggc cct cgc ggc96
Leu Lys Gly Lys Val Val Val Ile Thr Gly Ala Ser Gly Pro Arg Gly
20 25 30
atg ggc att gaa gcc gcg cgt ggc tgc gcc gaa atg ggc gcc aac atc144
Met Gly Ile Glu Ala Ala Arg Gly Cys Ala Glu Met Gly Ala Asn Ile
35 40 45
gcc ctc acc tac tcc tct cgt cct cag ggt ggt gag aag aac gcc gaa192
Ala Leu Thr Tyr Ser Ser Arg Pro Gln Gly Gly Glu Lys Asn Ala Glu
50 55 60
gaa ctt cgc aac acc tac ggc gtc aag gcc aag gcc tac cag tgc aac240
Glu Leu Arg Asn Thr Tyr Gly Val Lys Ala Lys Ala Tyr Gln Cys Asn
65 70 75 80
gtg ggc gac tgg aac agc gtc aag aag ctc gtg gac gac gtg ctg gcc288
Val Gly Asp Trp Asn Ser Val Lys Lys Leu Val Asp Asp Val Leu Ala
85 90 95
gag ttt ggc cag att gac gcc ttc att gcc aac gct ggc aag aca gcc336
Glu Phe Gly Gln Ile Asp Ala Phe Ile Ala Asn Ala Gly Lys Thr Ala
100 105 110
agc agt ggt atc ctg gat ggt tcc gtt gag gac tgg gaa gag gtc atc384
Ser Ser Gly Ile Leu Asp Gly Ser Val Glu Asp Trp Glu Glu Val Ile
115 120 125
cag aca gac ctg acg ggt acc ttc cac tgc gcc aag gcg gtg ggc ccg432
Gln Thr Asp Leu Thr Gly Thr Phe His Cys Ala Lys Ala Val Gly Pro
130 135 140
cac ttc aag cag cgc gga acg ggc agc ttc atc atc acc tcc agc atg480
His Phe Lys Gln Arg Gly Thr Gly Ser Phe Ile Ile Thr Ser Ser Met
145 150 155 160
tcg ggt cac att gcc aac ttc ccg cag gag cag acg tcg tac aac gtt528
Ser Gly His Ile Ala Asn Phe Pro Gln Glu Gln Thr Ser Tyr Asn Val
165 170 175
gcc aag gca ggc tgc atc cat atg gcc cgg tca ttg gcc aac gag tgg576
Ala Lys Ala Gly Cys Ile His Met Ala Arg Ser Leu Ala Asn Glu Trp
180 185 190
agg gac ttt gcc cgc gtg aac agc atc tcc ccg ggt tac atc gac acg624
Arg Asp Phe Ala Arg Val Asn Ser Ile Ser Pro Gly Tyr Ile Asp Thr
195 200 205
ggg ctg tcg gac ttt gtg gat aag aag act cag gat ctg tgg atg tcg672
Gly Leu Ser Asp Phe Val Asp Lys Lys Thr Gln Asp Leu Trp Met Ser
210 215 220
atg atc ccc atg gga cgc aac ggt gat gcc aag gag ctg aag ggt gca720
Met Ile Pro Met Gly Arg Asn Gly Asp Ala Lys Glu Leu Lys Gly Ala
225 230 235 240
tat gtc tat ctc gcc agt gat gcc agc aca tac acg acg ggt gcc gat768
Tyr Val Tyr Leu Ala Ser Asp Ala Ser Thr Tyr Thr Thr Gly Ala Asp
245 250 255
ttg gtc att gac gga gga tac acc gtg cgg taa801
Leu Val Ile Asp Gly Gly Tyr Thr Val Arg
260 265
<210>26
<211>1602
<212>DNA
<213>Aspergillus niger
<220>
<221>CDS
<222>(1)..(1602)
<400>26
atg agt ggg gta agc ttt gcc cgt cag gcc tta ctc cag gct gct ctt48
Met Ser Gly Val Ser Phe Ala Arg Gln Ala Leu Leu Gln Ala Ala Leu
1 5 10 15
ctt tcg att gtc tcc gca atc ccg gcg ccc acg gcc ttc gtc aac aat96
Leu Ser Ile Val Ser Ala Ile Pro Ala Pro Thr Ala Phe Val Asn Asn
20 25 30
gtc gct ccg ccc gag ccc atc atc acc cct tcg ccg gtt caa cat cga144
Val Ala Pro Pro Glu Pro Ile Ile Thr Pro Ser Pro Val Gln His Arg
35 40 45
cct tct cga gtc gct ggt cga aac att ctg agt gac gtc gat tct gat192
Pro Ser Arg Val Ala Gly Arg Asn Ile Leu Ser Asp Val Asp Ser Asp
50 55 60
att aac agc atc ctt tct ggc ctt gga tcc gac cta ccc tcc tgg gtc240
Ile Asn Ser Ile Leu Ser Gly Leu Gly Ser Asp Leu Pro Ser Trp Val
65 70 75 80
gca tcg ggt gtg ccc aac tac ttc cag ggt ttc cct act ggg gat gca288
Ala Ser Gly Val Pro Asn Tyr Phe Gln Gly Phe Pro Thr Gly Asp Ala
85 90 95
gtg gtg agc tcc ttg ggc ttg aac agc gct gag ttg gca gcc ttg ccc336
Val Val Ser Ser Leu Gly Leu Asn Ser Ala Glu Leu Ala Ala Leu Pro
100 105 110
acc aat gtc ttg aat atc gac cca tat gcc aac tgg act agc tct ggc384
Thr Asn Val Leu Asn Ile Asp Pro Tyr Ala Asn Trp Thr Ser Ser Gly
115 120 125
tgg aac gtt cgc ttc cac gga aac gtc tac aag cag ccc aac acc tcc432
Trp Asn Val Arg Phe His Gly Asn Val Tyr Lys Gln Pro Asn Thr Ser
130 135 140
atc tcc gac ctc aat gat ttg gct gat gtt ttc ctc ggc aat aca agc480
Ile Ser Asp Leu Asn Asp Leu Ala Asp Val Phe Leu Gly Asn Thr Ser
145 150 155 160
atc tcc gac ctt tcc gaa tcc gag cag aaa cag gct cgg aat tta aca528
Ile Ser Asp Leu Ser Glu Ser Glu Gln Lys Gln Ala Arg Asn Leu Thr
165 170 175
gcg gaa ata tta gtg gtc cag caa gct cac gtc gcc gta aac aca atc576
Ala Glu Ile Leu Val Val Gln Gln Ala His Val Ala Val Asn Thr Ile
180 185 190
cac ctg gag cct gca ccg agt cag gga tcc agc gga cag tca ggc ggc624
His Leu Glu Pro Ala Pro Ser Gln Gly Ser Ser Gly Gln Ser Gly Gly
195 200 205
ggt gga tcc tct aat acc act ggc ggc acc caa gac ctc act ctg ccc672
Gly Gly Ser Ser Asn Thr Thr Gly Gly Thr Gln Asp Leu Thr Leu Pro
210 215 220
tac aac act aca gtt gaa ggc gat ttt gac act ttc gta ccg att agc720
Tyr Asn Thr Thr Val Glu Gly Asp Phe Asp Thr Phe Val Pro Ile Ser
225 230 235 240
agc aat ggc ttg acg gca ggt aat gaa act tcg gcg ata caa cgg ctt768
Ser Asn Gly Leu Thr Ala Gly Asn Glu Thr Ser Ala Ile Gln Arg Leu
245 250 255
aac gtc cat gtg gag ggc gcg aca ata gga aac agt act gcc tat ctc816
Asn Val His Val Glu Gly Ala Thr Ile Gly Asn Ser Thr Ala Tyr Leu
260 265 270
gta cct ccg acc ggg ctc act gtc gtt tcg gac atc gat gat atc cta864
Val Pro Pro Thr Gly Leu Thr Val Val Ser Asp Ile Asp Asp Ile Leu
275 280 285
cgc gtc acc aaa atc tat gaa cca gag caa ggt tta ctc aac tca ttt912
Arg Val Thr Lys Ile Tyr Glu Pro Glu Gln Gly Leu Leu Asn Ser Phe
290 295 300
gcg cgc ccc ttc agg ccg tgg gag aat atg ccg gac atc tat cgc aac960
Ala Arg Pro Phe Arg Pro Trp Glu Asn Met Pro Asp Ile Tyr Arg Asn
305 310 315 320
tgg tcg atc agt ctc ccc aac ctg cac ttt cac tac cta acg acg acc1008
Trp Ser Ile Ser Leu Pro Asn Leu His Phe His Tyr Leu Thr Thr Thr
325 330 335
ccc gaa caa gtc acc agg aac tac atg caa ttc atc tac gac aac tac1056
Pro Glu Gln Val Thr Arg Asn Tyr Met Gln Phe Ile Tyr Asp Asn Tyr
340 345 350
ccc ggt gga tct ttc gac acc cgt ccc ctc aac ttt agc gac gtt tcc1104
Pro Gly Gly Ser Phe Asp Thr Arg Pro Leu Asn Phe Ser Asp Val Ser
355 360 365
gcc acc ttg tcg atc cgg aaa ttc ctc ctg caa aag gtc ttc gag acc1152
Ala Thr Leu Ser Ile Arg Lys Phe Leu Leu Gln Lys Val Phe Glu Thr
370 375 380
ttt ccg cag cgc aag ttc atc ctc atc gcc gac acc agc aac agc gac1200
Phe Pro Gln Arg Lys Phe Ile Leu Ile Ala Asp Thr Ser Asn Ser Asp
385 390 395 400
gtc atg cgt gac tat cct gaa atg gcg acc gac ttc cct ggt caa gtg1248
Val Met Arg Asp Tyr Pro Glu Met Ala Thr Asp Phe Pro Gly Gln Val
405 410 415
caa tgt att ttt ctc cgg aac acc agc gcc acc gac tca ggg gac aaa1296
Gln Cys Ile Phe Leu Arg Asn Thr Ser Ala Thr Asp Ser Gly Asp Lys
420 425 430
ttc cca tac gat acc tct ggg ttt aag aag ctc aat cag tca aac tac1344
Phe Pro Tyr Asp Thr Ser Gly Phe Lys Lys Leu Asn Gln Ser Asn Tyr
435 440 445
atg ttc ttc ttg cat ccc gat gac ttg acg aat cta gac atc gcg aat1392
Met Phe Phe Leu His Pro Asp Asp Leu Thr Asn Leu Asp Ile Ala Asn
450 455 460
ggc cag tgt tac aac aca tcc att ccg cag aat tta acg ttt agt tat1440
GLy Gln Cys Tyr Asn Thr Ser Ile Pro Gln Asn Leu Thr Phe Ser Tyr
465 470 475 480
cag ggt ttg cca ttg ggg ctg ggt gat gaa ccc aca gct gtc aat ggg1488
Gln Gly Leu Pro Leu Gly Leu Gly Asp Glu Pro Thr Ala Val Asn Gly
485 490 495
tct gcc aat cat act gct gag tcg gcg gcc ggt ttg tcg gta aag ggt1536
Ser Ala Asn His Thr Ala Glu Ser Ala Ala Gly Leu Ser Val Lys Gly
500 505 510
ggg act gat atg cag ggt ttg atc ttt ctg ttc acc ctg gtt acg gcc 1584
Gly Thr Asp Met Gln Gly Leu Ile Phe Leu Phe Thr Leu Val Thr Ala
515 520 525
tat tcc att ttc ttg taa 1602
Tyr Ser Ile Phe Leu
530
<210>27
<211>1392
<212>DNA
<213>Aspergillus niger
<220>
<221>CDS
<222>(1)..(1392)
<400>27
atg tcg aag tcg aat ggc gtc agc ctg gca ttc ccc gcc gaa gca gcg48
Met Ser Lys Ser Asn Gly Val Ser Leu Ala Phe Pro Ala Glu Ala Ala
1 5 10 15
aca aag gaa tat gca gca tct cta gac tct tct gat aga ctt gct gca96
Thr Lys Glu Tyr Ala Ala Ser Leu Asp Ser Ser Asp Arg Leu Ala Ala
20 25 30
ttt cgg gag aag ttc atc gtc cca tcg aaa gca aat att gct tcc aaa144
Phe Arg Glu Lys Phe Ile Val Pro Ser Lys Ala Asn Ile Ala Ser Lys
35 40 45
aag cta gca aag cct ggc ctt tcg ccc gag tca tgc att tac ttc tgc192
Lys Leu Ala Lys Pro Gly Leu Ser Pro Glu Ser Cys Ile Tyr Phe Cys
50 55 60
ggt aac tca ctt ggc att caa ccc aag gcc aca gca aag tac tta gaa240
Gly Asn Ser Leu Gly Ile Gln Pro Lys Ala Thr Ala Lys Tyr Leu Glu
65 70 75 80
gca cag ttg gac act tgg tca tct att gga gtt ggc ggc cac ttc act288
Ala Gln Leu Asp Thr Trp Ser Ser Ile Gly Val Gly Gly His Phe Thr
85 90 95
gat ctt gag ggc tca ccc ttg aag caa tgg cag ctg ctc tca gag caa336
Asp Leu Glu Gly Ser Pro Leu Lys Gln Trp Gln Leu Leu Ser Glu Gln
100 105 110
gca gct gat tca atg agc aag att gtg gga gca aag cca gaa gaa gtc384
Ala Ala Asp Ser Met Ser Lys Ile Val Gly Ala Lys Pro Glu Glu Val
115 120 125
gca gcg atg gga aca ctt aca acg aac ctt cat ctt ctg ctg gct agt432
Ala Ala Met Gly Thr Leu Thr Thr Asn Leu His Leu Leu Leu Ala Ser
130 135 140
ttc tat aaa ccg act caa aca aag cac aag atc ttg atg gat tgg aag480
Phe Tyr Lys Pro Thr Gln Thr Lys His Lys Ile Leu Met Asp Trp Lys
145 150 155 160
gct ttc cca agt gat cac tac gct atc gaa tct cat att gcc tgg cat528
Ala Phe Pro Ser Asp His Tyr Ala Ile Glu Ser His Ile Ala Trp His
165 170 175
gac ctg gat cct aag gag tct atg gtg ctc atc ggt cca gat gaa ggc576
Asp Leu Asp Pro Lys Glu Ser Met Val Leu Ile Gly Pro Asp Glu Gly
180 185 190
gaa tac gag ata tcc acc cag aag att ttc tct tat atc gac aag cat624
Glu Tyr Glu Ile Ser Thr Gln Lys Ile Phe Ser Tyr Ile Asp Lys His
195 200 205
gct gat gag gct gct atg att ctt ctt cct ggt att caa tat tat act672
Ala Asp Glu Ala Ala Met Ile Leu Leu Pro Gly Ile Gln Tyr Tyr Thr
210 215 220
ggg caa ctg ttc gat atc cag aaa att aca aaa tat gcc cat tcg cgc720
Gly Gln Leu Phe Asp Ile Gln Lys Ile Thr Lys Tyr Ala His Ser Arg
225 230 235 240
aac atg gtt gtt ggc tgg gat ctg gcc cat gcg ttc gct aat gtt gag768
Asn Met Val Val Gly Trp Asp Leu Ala His Ala Phe Ala Asn Val Glu
245 250 255
cta aag ctg cat gat tgg aac gtt gat ttt gca gca tgg tgc aca tat816
Leu Lys Leu His Asp Trp Asn Val Asp Phe Ala Ala Trp Cys Thr Tyr
260 265 270
aag tac gga aac gcc ggt cct gga gca atg ggg ggg ctt ttc gtg cat864
Lys Tyr Gly Asn Ala Gly Pro Gly Ala Met Gly Gly Leu Phe Val His
275 280 285
gaa caa cac gga gag gtc gat tac agc gcg gga gaa gat gca ccc aaa912
Glu Gln His Gly Glu Val Asp Tyr Ser Ala Gly Glu Asp Ala Pro Lys
290 295 300
ttc cgc cat cgt ctg acc ggg tgg tat ggt ggc gat cga tcg gta aga960
Phe Arg His Arg Leu Thr Gly Trp Tyr Gly Gly Asp Arg Ser Val Arg
305 310 315 320
ttc aag atg gac aac aag ttc aaa cct att cct ggg gca gga gga ttt1008
Phe Lys Met Asp Asn Lys Phe Lys Pro Ile Pro Gly Ala Gly Gly Phe
325 330 335
cag ata tca aat cct tcg gcc atc gac ctt gcg tgt ctt tgt gcc gct1056
Gln Ile Ser Asn Pro Ser Ala Ile Asp Leu Ala Cys Leu Cys Ala Ala
340 345 350
tta tcg gtg ttt gat gag acg tca atg gca gat ctt cgc aga aaa tca1104
Leu Ser Val Phe Asp Glu Thr Ser Met Ala Asp Leu Arg Arg Lys Ser
355 360 365
ttg aag cta aca gca tac ctt gag ttc ctt ttg ctc agg gat tat gaa1152
Leu Lys Leu Thr Ala Tyr Leu Glu Phe Leu Leu Leu Arg Asp Tyr Glu
370 375 380
gaa gaa tct agg cca ttc agc att atc acg ccc aag gac ccc gag gcg1200
Glu Glu Ser Arg Pro Phe Ser Ile Ile Thr Pro Lys Asp Pro Glu Ala
385 390 395 400
aga ggc gca caa ctg agt cta ttg ctc aag cct ggt cta tta cag aat1248
Arg Gly Ala Gln Leu Ser Leu Leu Leu Lys Pro Gly Leu Leu Gln Asn
405 410 415
gtt gca cag aag ttg caa gaa gca gga ata gtc tgc gat aaa cgg gag1296
Val Ala Gln Lys Leu Gln Glu Ala Gly Ile Val Cys Asp Lys Arg Glu
420 425 430
ccg ggt gtt gtg cgt gtc gct ccg gtt cct ttg tac aac agc ttc agc1344
Pro Gly Val Val Arg Val Ala Pro Val Pro Leu Tyr Asn Ser Phe Ser
435 440 445
gag gtt tgg aca ttt gtg aag atc ttc aag gat gca ctg cag cag tga1392
Glu Val Trp Thr Phe Val Lys Ile Phe Lys Asp Ala Leu Gln Gln
450 455 460
<210>28
<211>1143
<212>DNA
<213>Aspergillus niger
<220>
<221>CDS
<222>(1)..(1143)
<400>28
atg gat gtg act aat ttg gct gtc gat tgt ccc gtt ata gag acc ggt48
Met Asp Val Thr Asn Leu Ala Val Asp Cys Pro Val Ile Glu Thr Gly
1 5 10 15
tcc ctt gct ttg tgg atg gct tcc tcc gaa gtg gac cag aag gcc ttg96
Ser Leu Ala Leu Trp Met Ala Ser Ser Glu Val Asp Gln Lys Ala Leu
20 25 30
ggc aac ttt gcg gcc ata acg ggc ctc gag aac ccg ttc ctg tcc gcg144
Gly Asn Phe Ala Ala Ile Thr Gly Leu Glu Asn Pro Phe Leu Ser Ala
35 40 45
atg ctg tac aag att ctg ggg ttg tct gtt atg tta tcg aag aaa ctc192
Met Leu Tyr Lys Ile Leu Gly Leu Ser Val Met Leu Ser Lys Lys Leu
50 55 60
ctc cgt gca cga cga ttg cgg cgc cta gac ccc acc cga gag act aaa240
Leu Arg Ala Arg Arg Leu Arg Arg Leu Asp Pro Thr Arg Glu Thr Lys
65 70 75 80
tcg ctt cat ctt tat tac cat atc atc tgg ctt tcg cgt gag ggt ctt288
Ser Leu His Leu Tyr Tyr His Ile Ile Trp Leu Ser Arg Glu Gly Leu
85 90 95
ctg ata tta gag gag ttc gtc ctg cca ctg gtt gag gga ttt atg gaa336
Leu Ile Leu Glu Glu Phe Val Leu Pro Leu Val Glu Gly Phe Met Glu
100 105 110
ctc aaa att tta gct tac aag ctg cgc gcc tcc ttt tac cat ata ttc384
Leu Lys Ile Leu Ala Tyr Lys Leu Arg Ala Ser Phe Tyr His Ile Phe
115 120 125
gtc cta ttt cag aac cag cct gct gtc cac tcg ccg ggt atc gtt agt432
Val Leu Phe Gln Asn Gln Pro Ala Val His Ser Pro Gly Ile Val Ser
130 135 140
ctg ccg agt agt aca cct tta tcc aac ggc gtg aca gaa gcg gag tca480
Leu Pro Ser Ser Thr Pro Leu Ser Asn Gly Val Thr Glu Ala Glu Ser
145 150 155 160
cca tcc aag gat tcc aat ttg aga ttt tca ttt cag ctg aag ccc gac528
Pro Ser Lys Asp Ser Asn Leu Arg Phe Ser Phe Gln Leu Lys Pro Asp
165 170 175
acg ata acg gtt tcc ggg aag ccc agt tcc gcc tcg gat agt gcg cca576
Thr Ile Thr Val Ser Gly Lys Pro Ser Ser Ala Ser Asp Ser Ala Pro
180 185 190
cga ggc aag gtt acg cag gca ccc ccg ggc ttt gcg ccg gtt caa ccg624
Arg Gly Lys Val Thr Gln Ala Pro Pro Gly Phe Ala Pro Val Gln Pro
195 200 205
ccc aag tcg aac tcg gcg ttt ctc ctc cct gct ctc gat tat acc cct672
Pro Lys Ser Asn Ser Ala Phe Leu Leu Pro Ala Leu Asp Tyr Thr Pro
210 215 220
aca gct acc gca tgc ttc aat cat gcc gcc ctc ttg gca gat caa ttc720
Thr Ala Thr Ala Cys Phe Asn His Ala Ala Leu Leu Ala Asp Gln Phe
225 230 235 240
ctc ccg ggg tcg cac ccg ctc cgt ctg tcc atc aag ctt gaa ttt gcc768
Leu Pro Gly Ser His Pro Leu Arg Leu Ser Ile Lys Leu Glu Phe Ala
245 250 255
gcc tac ctc tac gat tgc cta cat gac gct cat gcc tgt cga cgg ttg816
Ala Tyr Leu Tyr Asp Cys Leu His Asp Ala His Ala Cys Arg Arg Leu
260 265 270
gcc aag caa gcc att gcc gat gtg tac aat gcg caa gag ggc atg gac864
Ala Lys Gln Ala Ile Ala Asp Val Tyr Asn Ala Gln Glu Gly Met Asp
275 280 285
gac gag agc ttc gag gat gca gct gag att gtg ggt att ttg ggc aag912
Asp Glu Ser Phe Glu Asp Ala Ala Glu Ile Val Gly Ile Leu Gly Lys
290 295 300
atg gtg aag cgg gga agg aac aca agc agt gct gga aat agc acc acg960
Met Val Lys Arg Gly Arg Asn Thr Ser Ser Ala Gly Asn Ser Thr Thr
305 310 315 320
gct gtg aaa acg ccc cag gag gag cga agt gag ggc agt cga aca cca1008
Ala Val Lys Thr Pro Gln Glu Glu Arg Ser Glu Gly Ser Arg Thr Pro
325 330 335
tcc tct cag aca acg ttg aaa agg ccg gcg cga gtg ccg aaa agc acc1056
Ser Ser Gln Thr Thr Leu Lys Arg Pro Ala Arg Val Pro Lys Ser Thr
340 345 350
tcc tca ccg gcg cgc gcg acc aag ccg acg act agc gag ggg atg tcc1104
Ser Ser Pro Ala Arg Ala Thr Lys Pro Thr Thr Ser Glu Gly Met Ser
355 360 365
ccc gct gtg ccc gac ccc acc atg atg aat ccc ata tga1143
Pro Ala Val Pro Asp Pro Thr Met Met Asn Pro Ile
370 375 380
<210>29
<211>1779
<212>DNA
<213>Aspergillus niger
<220>
<221>CDS
<222>(1)..(1779)
<400>29
atg aga aat ttg gag tgt gtc tac aca aaa tca cga agg tat ccc tcg48
Met Arg Asn Leu Glu Cys Val Tyr Thr Lys Ser Arg Arg Tyr Pro Ser
1 5 10 15
tct atc ttt ccg aca ctc agg agg tcg tca act agt ccg aac acg gcg96
Ser Ile Phe Pro Thr Leu Arg Arg Ser Ser Thr Ser Pro Asn Thr Ala
20 25 30
tcc tct cct gac act aat gcc tca tct tcg cca tgc tcg gac tct agt144
Ser Ser Pro Asp Thr Asn Ala Ser Ser Ser Pro Cys Ser Asp Ser Ser
35 40 45
ggg acc cat gct ggc att tcc att ccc cac tca gat agt ccc gcc agt192
Gly Thr His Ala Gly Ile Ser Ile Pro His Ser Asp Ser Pro Ala Ser
50 55 60
gtg gac gaa tgt ggg aac aac ggc ctt ttc gac ggg gaa tct cta act240
Val Asp Glu Cys Gly Asn Asn Gly Leu Phe Asp Gly Glu Ser Leu Thr
65 70 75 80
caa tta ttg gtc tct ggg agc aaa gcc ata tca ggc caa cca cat atc288
Gln Leu Leu Val Ser Gly Ser Lys Ala Ile Ser Gly Gln Pro His Ile
85 90 95
gcc att aag cca cat gtt ctg tct acc tat ccc ctt gac aac ctc ctc336
Ala Ile Lys Pro His Val Leu Ser Thr Tyr Pro Leu Asp Asn Leu Leu
100 105 110
tca gac att gag gga ctc ctc gag cag cca gtc tct cat ttg gct caa384
Ser Asp Ile Glu Gly Leu Leu Glu Gln Pro Val Ser His Leu Ala Gln
115 120 125
agc aag gaa gat cta aca aaa ccg gac cgg atg ttt cga act cgc ctt432
Ser Lys Glu Asp Leu Thr Lys Pro Asp Arg Met Phe Arg Thr Arg Leu
130 135 140
cca gcg gtc tca ggt gag gac aat gag tat ctg cta agg aaa gga gct480
Pro Ala Val Ser Gly Glu Asp Asn Glu Tyr Leu Leu Arg Lys Gly Ala
145 150 155 160
ctg ctg ctc ttg cca cca gcc ttg cgc aac gaa cta ttg gcg gca tat528
Leu Leu Leu Leu Pro Pro Ala Leu Arg Asn Glu Leu Leu Ala Ala Tyr
165 170 175
gtc aac tac gtc cat ccg cta tta ccg att ctt gat ctt gga gac ttt576
Val Asn Tyr Val His Pro Leu Leu Pro Ile Leu Asp Leu Gly Asp Phe
180 185 190
ctc tca caa atc att gtt gga gat gat gct caa ttc aag tca cca cta624
Leu Ser Gln Ile Ile Val Gly Asp Asp Ala Gln Phe Lys Ser Pro Leu
195 200 205
tta tac caa gct gtc atg ttc gcg ggc agt att ttt gct cag cga gac672
Leu Tyr Gln Ala Val Met Phe Ala Gly Ser Ile Phe Ala Gln Arg Asp
210 215 220
ggc aca gac gaa cct gaa cag cta acg agg gct tta ttt gaa cgt aca720
Gly Thr Asp Glu Pro Glu Gln Leu Thr Arg Ala Leu Phe Glu Arg Thr
225 230 235 240
aag gtt cta tac gag ttt gaa tcc gaa tca tgt gcc tac act caa att768
Lys Val Leu Tyr Glu Phe Glu Ser Glu Ser Cys Ala Tyr Thr Gln Ile
245 250 255
caa gct ctc tta ttg atg act ctc tgg cat gga gat atg tca cgc cac816
Gln Ala Leu Leu Leu Met Thr Leu Trp His Gly Asp Met Ser Arg His
260 265 270
aaa ggc ccg tct tac tgg ctt gac gtc gcc ttc tcc act gcg gaa aga864
Lys Gly Pro Ser Tyr Trp Leu Asp Val Ala Phe Ser Thr Ala Glu Arg
275 280 285
att ggc cta ctc cat gat gaa gac tgg cca tgc gat agc cgt tcc ttc912
Ile Gly Leu Leu His Asp Glu Asp Trp Pro Cys Asp Ser Arg Ser Phe
290 295 300
cga tcc gct atg tgg tgt tgc ctt tac gta cgt gat cga aca atc tcg960
Arg Ser Ala Met Trp Cys Cys Leu Tyr Val Arg Asp Arg Thr Ile Ser
305 310 315 320
ctt ggg tct cgt cgg cct cca cgg atg cca gtc aac aaa tat ccg gac1008
Leu Gly Ser Arg Arg Pro Pro Arg Met Pro Val Asn Lys Tyr Pro Asp
325 330 335
tca att ctc cat ctt atg agc gac gca cct cgg gaa tat gac gaa ata1056
Ser Ile Leu His Leu Met Ser Asp Ala Pro Arg Glu Tyr Asp Glu Ile
340 345 350
att ctt gag agt cta ggt agc gct tct ctg atg ctt aca agc act tac1104
Ile Leu Glu Ser Leu Gly Ser Ala Ser Leu Met Leu Thr Ser Thr Tyr
355 360 365
caa gaa caa tcg acc atg ctc ttc aag gaa ctt gtc aaa ctc tcc tac1152
Gln Glu Gln Ser Thr Met Leu Phe Lys Glu Leu Val Lys Leu Ser Tyr
370 375 380
tgc gtc ggg gca atc tta gat tat cta tac gaa ggg gcc tgg gtc cga1200
Cys Val Gly Ala Ile Leu Asp Tyr Leu Tyr Glu Gly Ala Trp Val Arg
385 390 395 400
ata cca aca cgt cgc agc agc ttt tat tca ctc gcc cct aaa tgc agc1248
Ile Pro Thr Arg Arg Ser Ser Phe Tyr Ser Leu Ala Pro Lys Cys Ser
405 410 415
atc tcg cca tcc atc aga cca agc tgt gag aaa cta ctt tac tct tgg1296
Ile Ser Pro Ser Ile Arg Pro Ser Cys Glu Lys Leu Leu Tyr Ser Trp
420 425 430
att caa ttc ctc cct ctc aac gca gtc tac cat ccg cca cag ttg ccc1344
Ile Gln Phe Leu Pro Leu Asn Ala Val Tyr His Pro Pro Gln Leu Pro
435 440 445
gcc gat gcg gaa ggg gag tca gcc gaa aca gtc ttc ctt gtc cac aaa1392
Ala Asp Ala Glu Gly Glu Ser Ala Glu Thr Val Phe Leu Val His Lys
450 455 460
gcc ttc ctt tac ttg ctg tac cta gcc tcc atg gca gtc ata tac cgc1440
Ala Phe Leu Tyr Leu Leu Tyr Leu Ala Ser Met Ala Val Ile Tyr Arg
465 470 475 480
aca ggc act cat agc caa caa acc agc acg gca act ccg aac atg gaa1488
Thr Gly Thr His Ser Gln Gln Thr Ser Thr Ala Thr Pro Asn Met Glu
485 490 495
ggt cta cgg gca tcg acg tca caa ata aaa aag gtc ctt gcg gag ctg1536
Gly Leu Arg Ala Ser Thr Ser Gln Ile Lys Lys Val Leu Ala Glu Leu
500 505 510
cag ggc atg gga ctg ctt cag ttc ctt cca ggg gca tca gtc act atc1584
Gln Gly Met Gly Leu Leu Gln Phe Leu Pro Gly Ala Ser Val Thr Ile
515 520 525
ctg atg ttc gct gtg gag gct agt ctg ttg gat ctc cag ggc tcg gat1632
Leu Met Phe Ala Val Glu Ala Ser Leu Leu Asp Leu Gln Gly Ser Asp
530 535 540
acc atg gtc cga agg cag gct atg tca aat cta tat gcc tgt gag gag1680
Thr Met Val Arg Arg Gln Ala Met Ser Asn Leu Tyr Ala Cys Glu Glu
545 550 555 560
gct gcg tta cac ttg atg cag gct tat cct acg gct gag atg gcg gta1728
Ala Ala Leu His Leu Met Gln Ala Tyr Pro Thr Ala Glu Met Ala Val
565 570 575
ttg aag act agg aca gcc cgt gca aac ctt ctt ggg ttg gtt gag aca1776
Leu Lys Thr Arg Thr Ala Arg Ala Asn Leu Leu Gly Leu Val Glu Thr
580 585 590
tga1779
<210>30
<211>266
<212>PRT
<213>Aspergillus niger
<400>30
Met Pro Ile Ser Ile Pro Ser Ala Ser Ser Val His Asp Leu Phe Ser
1 5 10 15
Leu Lys Gly Lys Val Val Val Ile Thr Gly Ala Ser Gly Pro Arg Gly
20 25 30
Met Gly Ile Glu Ala Ala Arg Gly Cys Ala Glu Met Gly Ala Asn Ile
35 40 45
Ala Leu Thr Tyr Ser Ser Arg Pro Gln Gly Gly Glu Lys Asn Ala Glu
50 55 60
Glu Leu Arg Asn Thr Tyr Gly Val Lys Ala Lys Ala Tyr Gln Cys Asn
65 70 75 80
Val Gly Asp Trp Asn Ser Val Lys Lys Leu Val Asp Asp Val Leu Ala
85 90 95
Glu Phe Gly Gln Ile Asp Ala Phe Ile Ala Asn Ala Gly Lys Thr Ala
100 105 110
Ser Ser Gly Ile Leu Asp Gly Ser Val Glu Asp Trp Glu Glu Val Ile
115 120 125
Gln Thr Asp Leu Thr Gly Thr Phe His Cys Ala Lys Ala Val Gly Pro
130 135 140
His Phe Lys Gln Arg Gly Thr Gly Ser Phe Ile Ile Thr Ser Ser Met
145 150 155 160
Ser Gly His Ile Ala Asn Phe Pro Gln Glu Gln Thr Ser Tyr Asn Val
165 170 175
Ala Lys Ala Gly Cys Ile His Met Ala Arg Ser Leu Ala Asn Glu Trp
180 185 190
Arg Asp Phe Ala Arg Val Asn Ser Ile Ser Pro Gly Tyr Ile Asp Thr
195 200 205
Gly Leu Ser Asp Phe Val Asp Lys Lys Thr Gln Asp Leu Trp Met Ser
210 215 220
Met Ile Pro Met Gly Arg Asn Gly Asp Ala Lys Glu Leu Lys Gly Ala
225 230 235 240
Tyr Val Tyr Leu Ala Ser Asp Ala Ser Thr Tyr Thr Thr Gly Ala Asp
245 250 255
Leu Val Ile Asp Gly Gly Tyr Thr Val Arg
260 265
<210>31
<211>533
<212>PRT
<213>Aspergillus niger
<400>31
Met Ser Gly Val Ser Phe Ala Arg Gln Ala Leu Leu Gln Ala Ala Leu
1 5 10 15
Leu Ser Ile Val Ser Ala Ile Pro Ala Pro Thr Ala Phe Val Asn Asn
20 25 30
Val Ala Pro Pro Glu Pro Ile Ile Thr Pro Ser Pro Val Gln His Arg
35 40 45
Pro Ser Arg Val Ala Gly Arg Asn Ile Leu Ser Asp Val Asp Ser Asp
50 55 60
Ile Asn Ser Ile Leu Ser Gly Leu Gly Ser Asp Leu Pro Ser Trp Val
65 70 75 80
Ala Ser Gly Val Pro Asn Tyr Phe Gln Gly Phe Pro Thr Gly Asp Ala
85 90 95
Val Val Ser Ser Leu Gly Leu Asn Ser Ala Glu Leu Ala Ala Leu Pro
100 105 110
Thr Asn Val Leu Asn Ile Asp Pro Tyr Ala Asn Trp Thr Ser Ser Gly
115 120 125
Trp Asn Val Arg Phe His Gly Asn Val Tyr Lys Gln Pro Asn Thr Ser
130 135 140
Ile Ser Asp Leu Asn Asp Leu Ala Asp Val Phe Leu Gly Asn Thr Ser
145 150 155 160
Ile Ser Asp Leu Ser Glu Ser Glu Gln Lys Gln Ala Arg Asn Leu Thr
165 170 175
Ala Glu Ile Leu Val Val Gln Gln Ala His Val Ala Val Asn Thr Ile
180 185 190
His Leu Glu Pro Ala Pro Ser Gln Gly Ser Ser Gly Gln Ser Gly Gly
195 200 205
Gly Gly Ser Ser Asn Thr Thr Gly Gly Thr Gln Asp Leu Thr Leu Pro
210 215 220
Tyr Asn Thr Thr Val Glu Gly Asp Phe Asp Thr Phe Val Pro Ile Ser
225 230 235 240
Ser Asn Gly Leu Thr Ala Gly Asn Glu Thr Ser Ala Ile Gln Arg Leu
245 250 255
Asn Val His Val Glu Gly Ala Thr Ile Gly Asn Ser Thr Ala Tyr Leu
260 265 270
Val Pro Pro Thr Gly Leu Thr Val Val Ser Asp Ile Asp Asp Ile Leu
275 280 285
Arg Val Thr Lys Ile Tyr Glu Pro Glu Gln Gly Leu Leu Asn Ser Phe
290 295 300
Ala Arg Pro Phe Arg Pro Trp Glu Asn Met Pro Asp Ile Tyr Arg Asn
305 310 315 320
Trp Ser Ile Ser Leu Pro Asn Leu His Phe His Tyr Leu Thr Thr Thr
325 330 335
Pro Glu Gln Val Thr Arg Asn Tyr Met Gln Phe Ile Tyr Asp Asn Tyr
340 345 350
Pro Gly Gly Ser Phe Asp Thr Arg Pro Leu Asn Phe Ser Asp Val Ser
355 360 365
Ala Thr Leu Ser Ile Arg Lys Phe Leu Leu Gln Lys Val Phe Glu Thr
370 375 380
Phe Pro Gln Arg Lys Phe Ile Leu Ile Ala Asp Thr Ser Asn Ser Asp
385 390 395 400
Val Met Arg Asp Tyr Pro Glu Met Ala Thr Asp Phe Pro Gly Gln Val
405 410 415
Gln Cys Ile Phe Leu Arg Asn Thr Ser Ala Thr Asp Ser Gly Asp Lys
420 425 430
Phe Pro Tyr Asp Thr Ser Gly Phe Lys Lys Leu Asn Gln Ser Asn Tyr
435 440 445
Met Phe Phe Leu His Pro Asp Asp Leu Thr Asn Leu Asp Ile Ala Asn
450 455 460
Gly Gln Cys Tyr Asn Thr Ser Ile Pro Gln Asn Leu Thr Phe Ser Tyr
465 470 475 480
Gln Gly Leu Pro Leu Gly Leu Gly Asp Glu Pro Thr Ala Val Asn Gly
485 490 495
Ser Ala Asn His Thr Ala Glu Ser Ala Ala Gly Leu Ser Val Lys Gly
500 505 510
Gly Thr Asp Met Gln Gly Leu Ile Phe Leu Phe Thr Leu Val Thr Ala
515 520 525
Tyr Ser Ile Phe Leu
530
<210>32
<211>463
<212>PRT
<213>Aspergillus niger
<400>32
Met Ser Lys Ser Asn Gly Val Ser Leu Ala Phe Pro Ala Glu Ala Ala
1 5 10 15
Thr Lys Glu Tyr Ala Ala Ser Leu Asp Ser Ser Asp Arg Leu Ala Ala
20 25 30
Phe Arg Glu Lys Phe Ile Val Pro Ser Lys Ala Asn Ile Ala Ser Lys
35 40 45
Lys Leu Ala Lys Pro Gly Leu Ser Pro Glu Ser Cys Ile Tyr Phe Cys
50 55 60
Gly Asn Ser Leu Gly Ile Gln Pro Lys Ala Thr Ala Lys Tyr Leu Glu
65 70 75 80
Ala Gln Leu Asp Thr Trp Ser Ser Ile Gly Val Gly Gly His Phe Thr
85 90 95
Asp Leu Glu Gly Ser Pro Leu Lys Gln Trp Gln Leu Leu Ser Glu Gln
100 105 110
Ala Ala Asp Ser Met Ser Lys Ile Val Gly Ala Lys Pro Glu Glu Val
115 120 125
Ala Ala Met Gly Thr Leu Thr Thr Asn Leu His Leu Leu Leu Ala Ser
130 135 140
Phe Tyr Lys Pro Thr Gln Thr Lys His Lys Ile Leu Met Asp Trp Lys
145 150 155 160
Ala Phe Pro Ser Asp His Tyr Ala Ile Glu Ser His Ile Ala Trp His
165 170 175
Asp Leu Asp Pro Lys Glu Ser Met Val Leu Ile Gly Pro Asp Glu Gly
180 185 190
Glu Tyr Glu Ile Ser Thr Gln Lys Ile Phe Ser Tyr Ile Asp Lys His
195 200 205
Ala Asp Glu Ala Ala Met Ile Leu Leu Pro Gly Ile Gln Tyr Tyr Thr
210 215 220
Gly Gln Leu Phe Asp Ile Gln Lys Ile Thr Lys Tyr Ala His Ser Arg
225 230 235 240
Asn Met Val Val Gly Trp Asp Leu Ala His Ala Phe Ala Asn Val Glu
245 250 255
Leu Lys Leu His Asp Trp Asn Val Asp Phe Ala Ala Trp Cys Thr Tyr
260 265 270
Lys Tyr Gly Asn Ala Gly Pro Gly Ala Met Gly Gly Leu Phe Val His
275 280 285
Glu Gln His Gly Glu Val Asp Tyr Ser Ala Gly Glu Asp Ala Pro Lys
290 295 300
Phe Arg His Arg Leu Thr Gly Trp Tyr Gly Gly Asp Arg Ser Val Arg
305 310 315 320
Phe Lys Met Asp Asn Lys Phe Lys Pro Ile Pro Gly Ala Gly Gly Phe
325 330 335
Gln Ile Ser Asn Pro Ser Ala Ile Asp Leu Ala Cys Leu Cys Ala Ala
340 345 350
Leu Ser Val Phe Asp Glu Thr Ser Met Ala Asp Leu Arg Arg Lys Ser
355 360 365
Leu Lys Leu Thr Ala Tyr Leu Glu Phe Leu Leu Leu Arg Asp Tyr Glu
370 375 380
Glu Glu Ser Arg Pro Phe Ser Ile Ile Thr Pro Lys Asp Pro Glu Ala
385 390 395 400
Arg Gly Ala Gln Leu Ser Leu Leu Leu Lys Pro Gly Leu Leu Gln Asn
405 410 415
Val Ala Gln Lys Leu Gln Glu Ala Gly Ile Val Cys Asp Lys Arg Glu
420 425 430
Pro Gly Val Val Arg Val Ala Pro Val Pro Leu Tyr Asn Ser Phe Ser
435 440 445
Glu Val Trp Thr Phe Val Lys Ile Phe Lys Asp Ala Leu Gln Gln
450 455 460
<210>33
<211>380
<212>PRT
<213>Aspergillus niger
<400>33
Met Asp Val Thr Asn Leu Ala Val Asp Cys Pro Val Ile Glu Thr Gly
1 5 10 15
Ser Leu Ala Leu Trp Met Ala Ser Ser Glu Val Asp Gln Lys Ala Leu
20 25 30
Gly Asn Phe Ala Ala Ile Thr Gly Leu Glu Asn Pro Phe Leu Ser Ala
35 40 45
Met Leu Tyr Lys Ile Leu Gly Leu Ser Val Met Leu Ser Lys Lys Leu
50 55 60
Leu Arg Ala Arg Arg Leu Arg Arg Leu Asp Pro Thr Arg Glu Thr Lys
65 70 75 80
Ser Leu His Leu Tyr Tyr His Ile Ile Trp Leu Ser Arg Glu Gly Leu
85 90 95
Leu Ile Leu Glu Glu Phe Val Leu Pro Leu Val Glu Gly Phe Met Glu
100 105 110
Leu Lys Ile Leu Ala Tyr Lys Leu Arg Ala Ser Phe Tyr His Ile Phe
115 120 125
Val Leu Phe Gln Asn Gln Pro Ala Val His Ser Pro Gly Ile Val Ser
130 135 140
Leu Pro Ser Ser Thr Pro Leu Ser Asn Gly Val Thr Glu Ala Glu Ser
145 150 155 160
Pro Ser Lys Asp Ser Asn Leu Arg Phe Ser Phe Gln Leu Lys Pro Asp
165 170 175
Thr Ile Thr Val Ser Gly Lys Pro Ser Ser Ala Ser Asp Ser Ala Pro
180 185 190
Arg Gly Lys Val Thr Gln Ala Pro Pro Gly Phe Ala Pro Val Gln Pro
195 200 205
Pro Lys Ser Asn Ser Ala Phe Leu Leu Pro Ala Leu Asp Tyr Thr Pro
210 215 220
Thr Ala Thr Ala Cys Phe Asn His Ala Ala Leu Leu Ala Asp Gln Phe
225 230 235 240
Leu Pro Gly Ser His Pro Leu Arg Leu Ser Ile Lys Leu Glu Phe Ala
245 250 255
Ala Tyr Leu Tyr Asp Cys Leu His Asp Ala His Ala Cys Arg Arg Leu
260 265 270
Ala Lys Gln Ala Ile Ala Asp Val Tyr Asn Ala Gln Glu Gly Met Asp
275 280 285
Asp Glu Ser Phe Glu Asp Ala Ala Glu Ile Val Gly Ile Leu Gly Lys
290 295 300
Met Val Lys Arg Gly Arg Asn Thr Ser Ser Ala Gly Asn Ser Thr Thr
305 310 315 320
Ala Val Lys Thr Pro Gln Glu Glu Arg Ser Glu Gly Ser Arg Thr Pro
325 330 335
Ser Ser Gln Thr Thr Leu Lys Arg Pro Ala Arg Val Pro Lys Ser Thr
340 345 350
Ser Ser Pro Ala Arg Ala Thr Lys Pro Thr Thr Ser Glu Gly Met Ser
355 360 365
Pro Ala Val Pro Asp Pro Thr Met Met Asn Pro Ile
370 375 380
<210>34
<211>592
<212>PRT
<213>Aspergillus niger
<400>34
Met Arg Asn Leu Glu Cys Val Tyr Thr Lys Ser Arg Arg Tyr Pro Ser
1 5 10 15
Ser Ile Phe Pro Thr Leu Arg Arg Ser Ser Thr Ser Pro Asn Thr Ala
20 25 30
Ser Ser Pro Asp Thr Asn Ala Ser Ser Ser Pro Cys Ser Asp Ser Ser
35 40 45
Gly Thr His Ala Gly Ile Ser Ile Pro His Ser Asp Ser Pro Ala Ser
50 55 60
Val Asp Glu Cys Gly Asn Asn Gly Leu Phe Asp Gly Glu Ser Leu Thr
65 70 75 80
Gln Leu Leu Val Ser Gly Ser Lys Ala Ile Ser Gly Gln Pro His Ile
85 90 95
Ala Ile Lys Pro His Val Leu Ser Thr Tyr Pro Leu Asp Asn Leu Leu
100 105 110
Ser Asp Ile Glu Gly Leu Leu Glu Gln Pro Val Ser His Leu Ala Gln
115 120 125
Ser Lys Glu Asp Leu Thr Lys Pro Asp Arg Met Phe Arg Thr Arg Leu
130 135 140
Pro Ala Val Ser Gly Glu Asp Asn Glu Tyr Leu Leu Arg Lys Gly Ala
145 150 155 160
Leu Leu Leu Leu Pro Pro Ala Leu Arg Asn Glu Leu Leu Ala Ala Tyr
165 170 175
Val Asn Tyr Val His Pro Leu Leu Pro Ile Leu Asp Leu Gly Asp Phe
180 185 190
Leu Ser Gln Ile Ile Val Gly Asp Asp Ala Gln Phe Lys Ser Pro Leu
195 200 205
Leu Tyr Gln Ala Val Met Phe Ala Gly Ser Ile Phe Ala Gln Arg Asp
210 215 220
Gly Thr Asp Glu Pro Glu Gln Leu Thr Arg Ala Leu Phe Glu Arg Thr
225 230 235 240
Lys Val Leu Tyr Glu Phe Glu Ser Glu Ser Cys Ala Tyr Thr Gln Ile
245 250 255
Gln Ala Leu Leu Leu Met Thr Leu Trp His Gly Asp Met Ser Arg His
260 265 270
Lys Gly Pro Ser Tyr Trp Leu Asp Val Ala Phe Ser Thr Ala Glu Arg
275 280 285
Ile Gly Leu Leu His Asp Glu Asp Trp Pro Cys Asp Ser Arg Ser Phe
290 295 300
Arg Ser Ala Met Trp Cys Cys Leu Tyr Val Arg Asp Arg Thr Ile Ser
305 310 315 320
Leu Gly Ser Arg Arg Pro Pro Arg Met Pro Val Asn Lys Tyr Pro Asp
325 330 335
Ser Ile Leu His Leu Met Ser Asp Ala Pro Arg Glu Tyr Asp Glu Ile
340 345 350
Ile Leu Glu Ser Leu Gly Ser Ala Ser Leu Met Leu Thr Ser Thr Tyr
355 360 365
Gln Glu Gln Ser Thr Met Leu Phe Lys Glu Leu Val Lys Leu Ser Tyr
370 375 380
Cys Val Gly Ala Ile Leu Asp Tyr Leu Tyr Glu Gly Ala Trp Val Arg
385 390 395 400
Ile Pro Thr Arg Arg Ser Ser Phe Tyr Ser Leu Ala Pro Lys Cys Ser
405 410 415
Ile Ser Pro Ser Ile Arg Pro Ser Cys Glu Lys Leu Leu Tyr Ser Trp
420 425 430
Ile Gln Phe Leu Pro Leu Asn Ala Val Tyr His Pro Pro Gln Leu Pro
435 440 445
Ala Asp Ala Glu Gly Glu Ser Ala Glu Thr Val Phe Leu Val His Lys
450 455 460
Ala Phe Leu Tyr Leu Leu Tyr Leu Ala Ser Met Ala Val Ile Tyr Arg
465 470 475 480
Thr Gly Thr His Ser Gln Gln Thr Ser Thr Ala Thr Pro Asn Met Glu
485 490 495
Gly Leu Arg Ala Ser Thr Ser Gln Ile Lys Lys Val Leu Ala Glu Leu
500 505 510
Gln Gly Met Gly Leu Leu Gln Phe Leu Pro Gly Ala Ser Val Thr Ile
515 520 525
Leu Met Phe Ala Val Glu Ala Ser Leu Leu Asp Leu Gln Gly Ser Asp
530 535 540
Thr Met Val Arg Arg Gln Ala Met Ser Asn Leu Tyr Ala Cys Glu Glu
545 550 555 560
Ala Ala Leu His Leu Met Gln Ala Tyr Pro Thr Ala Glu Met Ala Val
565 570 575
Leu Lys Thr Arg Thr Ala Arg Ala Asn Leu Leu Gly Leu Val Glu Thr
580 585 590
<210>35
<211>1076
<212>DNA
<213>人工序列
<220>
<221>引物结合
<222>(1)..(35)
<220>
<221>启动子
<222>(13)..(1062)
<220>
<221>引物结合
<222>(1037)..(1076)
<400>35
ACTTCACTCG AGATAATGTA GGCGACAAAG TAGCCGGGCA TGCGACCGGA GGACTCGGTC60
AGAGGCACGA ATATGAGAGG CCAGAACGCC GCACCCATGT TCCAAGATGT TGTGGCCCAG120
TAAAGGTTAG GAAATGGGGT GTTTTGAACG TGGAATCGTT CTTCCATCCA GTTGTTGCCG180
GAGCCGTAGG AACCGGCCGG GATACCAGTG AGGATGGAAC TATACCTATT AGCACTGCCA240
TCTTCGAGAA CAAGGCTAAG ACATACATGA AACAAACGGT GACCGTGAGA AGCCATTTAT300
AAGAGGTGCT CCAATTGAAC CTGAATATGT TAAAACTAGT ATACTAGCAA CTGCATGCTT360
GACGTACGGA TTGTCCGGGT CATCCTTGCC GTTCCAGGTA TGGATCTCAA GGTCCTCCCT420
GTCACGCAGA TCATTGTGGC TGACTACCCC GACATGGGGG TCCCGGCGAA AGAACGACCG480
CACCCTGCAA CGTCACTTAG TGGCTGTCTG ACAGGGATTG ATTGGCAATG ATTGGCAGAC540
TAACCGTCCC AGAAACGAAT CATCGAACTC ATTGGTGTGC ACTGTGCTAG CGCGGCGCAG600
CGACGGGCGT GGCTCCTCGG CAGGGGTGGA CATGACTTTC TCTGTGTAGA TTCCTTGCAA660
GGTATCTGCT TGACAGATGC AGAGATGATG TTGAGTAAAA TAGGGTGCAG AGACCCTGCA720
GAACCTGCAT CGGCCGGCGG CGACATGTCG TCATGACCGA CCCGGGCCGA GCGGAATTAA780
TGAAACTCGG AACAGCCAGG GGAATCCGAC GCTTTGAGTG GCCAATCCAT GTCTATCCAC840
ATCTGCATTG AAGTGGATGA AAGGTGGAGG AGGGCTGGTT GCCAAATTCT GTTAGGGCTT900
GGAATGTAAG CAACCGGTTT CGGTCATGAC ATCATCACAG CGATGACTTC ATCACTCTCG960
GACGAGCATA TATAGTTGTG CCTGTCGTCG TATCTCAACA AACATCAACA ACAACAACAA1020
TCATCTACTG CATTTACCAA ACTCATCTCT ACCTCAATCA ACTTAATTAA TGAAGT1076
<210>36
<211>1057
<212>DNA
<213>人工序列
<220>
<221>引物结合
<222>(1)..(33)
<220>
<221>启动子
<222>(13)..(1043)
<220>
<221>引物结合
<222>(1022)..(1057)
<400>36
ACTTCACTCG AGTTCTCACA AGCAAATCCG AGAAACGCAA TTGACCATAT GTCCTTAGTA60
TGAGGGCTAG CAGGAATACT TGTTTGTCGA TGCATACCGA CTAATAAAAA TGGTTCTTCT120
TTTTCGCGCA GGGATTTGGT TTTTCATTTT TCATTTTTCA TATTTTATGT TATTTTATTT180
TATTTTTTTG TTTTATTTTA TTTTATTTTT TTTTTTTAAA TAAGACTGGG TGTTTTCGTC240
TCCCACCCCT GCTGAGGAAC TGTTTGATAT ACAGAAGCCT GAGATACTTG AGATTATGTG300
ACAAAGAAAT TGTAAACCTG AATGTGACTA AGGCAGAAGA GAGCAGGTGA GGCCACACAA360
TACTGTACAC CCACTTCCGA TCGTCATCGA AATGAGCGTT GTGGGTACTG GAACGACAAA420
CCATAGATCG GATCTGCATC CGAATAGGCT TTACTTTGTA CATTGGTAGG AGTTTGAATG480
TTTGAAGATC CGGCAGATGA TCACCTGCTG CAGGGAATAA TTTGAAACCT GTCCGTCTGC540
TTTGACCCAA TTGACGAGGT ACGTGATTTG ATGCTACCCA AGCAGTATGA ATGCGACGGA600
GGTGGCTATC CTTACCTTGT CATATGCAAC TCATAACGGG TAGTCCCCAT GGAGCCACGG660
CTATTTATTT CTAAGGGCCA ACAGTGAAAG ATTGTGAGAT CGTATACCTC CTGGGTATGA720
CGCAACCAGG GTGAGCACTG GCATTGCTCC AATCCATATG GTGGAGGTAT GTCTCCGAGA780
CCATGACGCA TGTAGACCCT GACCTGTCCC TGATCCAGGG ATCTGGTTTG TCACTTGGCG840
TATTTTAATT AACTGCGGGT CAGGGTCTTG CCGTCCAGAC CCAATGGATG AATTGCCTGC900
GTGGCCCTGC AGTTCCAGCG ATCGGCACGG CACGGCTATG ACGTCGGTGG GTGTTCCGTT960
TGATATTTAA CCATAGAAGA CAGCCTTGTT ATGCTGGTTC CTGCCGCAAA ATAAAGGTCT1020
ATCCTTACCA CGTTAAGTGT CAAATTAATT AAGAAGT 1057
<210>37
<211>1061
<212>DNA
<213>人工序列
<220>
<221>引物结合
<222>(1)..(33)
<220>
<221>启动子
<222>(13)..(1047)
<220>
<221>引物结合
<222>(1023)..(1061)
<400>37
ATCCTACTCG AGTGGTGCCT GTGAACGAGG TCACCACTGA TAAATTGTCT GGATCCGTAA60
CGTCTGTATC AGTGGATGGT ACTGAAAAGT TCCAAAGATT GAGGGCAGCA TATGTAGCAC120
ATGGTGGTAG CTCTAAGTGG TTCGAAACTT CGATGAATGG GCGTGATATA CAGGGGGGTA180
GCACCTGTAT AGTTGATGTC AGCGAAGGCA CGGGCCATGC AGTGATAGAC AAGAAAAGAG240
GGATTGAATA AAAGACTCGA TTCTGAAGGG GAGTAATACA TCTTTCGGCT TCTCACCACC300
CCAGATGTAG GCGTGTGTAA GGTAAGCAAG CACAACATAT GCTCTCCGCC ACTCAGGTTC360
CCCCTTCAAC TTCTTCGTAG AGAGTATACC CAGGTCATCG ACAGACCTCC TGATAGTACC420
AGACTGAATC AGGCCAGGCA AGTCCTGAGC GATTTCCTCC CACGGGGAAT AGTAAGGGTC480
TTCCAATCTC CGTACGGGAG GAACTTCCGG GAGGAACCCG TTCTGGAGGG AGACACCGTA540
CGCAACAAGT GAAATGTCTT GTGTATAAAG CATGATAATA TATGCACTTC AGTAGACAAC600
TTGATATTCA AGCCTCCTTG AAATGATCCT CATGCAGGTA AGAGTAGATC CAAGTGTTTA660
TATTGTATTC CCAAGGAGGG ACGGAAGAAA ACCGGATCCA GAGGGCTCGA GATAGGGCCA720
CCTGCATGAG CAAAGACGGG TCATTTCCCG TTTCACAACG ACCATTCTCA GGCAGAAAGG780
CAGTGGATTA GCGGAAAACT TAGCAACCAT CCGGATTTCT GGAGTGGATG CTTTGTTATC840
TCACTTCCGG CAACACGGAT GGTGAGGCGG AAGCGGAACG GTATCCGGAT CCGGAGGGAG900
GGACAAACCG AAGTGCCTTG TGTCACACGC CGGTCCATAT ATAAATGTTA ATTGGTGACG960
GTCAGCGGAT TGTTTCTGGT GTTCATCCAT TTTTTCTTGA TATCCTGGAC CCAGTTATTG1020
CACTTTAATT ACTATCCAAA ATCCACATTA ATTAATGAAG T1061
<210>38
<211>1097
<212>DNA
<213>人工序列
<220>
<221>引物结合
<222>(1)..(34)
<220>
<221>启动子
<222>(13)..(1083)
<220>
<221>引物结合
<222>(1060)..(1097)
<400>38
ACTTCACTCG AGGTCCACAC TCTAATTGGG ATGAGCATTG CCTTTCAGGA ACTTGACTTT60
TTGTGGTTGC ATCTTTTGTT GCCTTACCCA CGCAGGCTTC GTTTATGAGA TAGCGATTTC120
AGGCCTCAAA TTGCTGTCAT CACTTCCGGC CCCAAACTCG TGGGCGGTGC CCGCCCATCG180
CTGGCAAGAA GCACAGACTA ACGCCTTACT TCGCCTAGTT GCACACGATG CATCAAGACT240
TCCTCCTATT TCACAACGAC CAGCTCCTTG CCATTTGTTG TTTCGAATGC CCCCTTCCCC300
GTGCCTTGCA TTTCTAATTC CCATCTATAC CCTTTTGCGC TCTCACGCCC GCCTGACTAT360
CAATTTTTCT GCCAGCATAA CCCTGCGTGC AGAGCGGTTG ACAGCAGGCT TGCTAAGAGT420
CTTCGTCTAG AAGAACTGTC TGGGTGGATT CCTTTTCGGA TTAACTTTTG CTATTTTAAA480
AGCTGATTGC ACTACGGAGT ACACCCGCAA TCTGATTCTC ACTGATACTC CAATTAAAGG540
CCACTAATTG CTGACATTTG TAACATATTT GCGTTTGCTT TCCGGTTGAA ATTGGCGGCT600
TTGTGCTTTC GATCGCTAGC AGTCTCTGTG CATGTACAAC TGATCGGCTA TTCAGTCCTA660
TTCGGAAGCG GCACTGAGAG GCGGAGACAA GCCACAGATA CGACGAGTCT GATTTTGAGA720
CGGGCGCATC CAACGAAAGC CTGCGATTGC AATTGAAGAT CTCAATTGGG GGACTGACAA780
CCTAATACCT AAACATATCG AGGATTAGGC GCCAACACGA GCATGGGAAG CTTTGGTGCA840
TGCGACGGCT GATCCATTTC TAACAACCGT TTTGCGCGCG CGTCCGAGGT AAGGCTCCCG900
ATCCCTTGGC GCTTTGCATG TTTCACTCCG ATGCATCTAC TGTTTATATG AGTGCGGTGG960
GCAAGCTGTG CCCACCGACT GAGCATTCTC AACCGGCCCA ATGCTGTGGG ATCGATCCTC1020
CCCTCCAAAG TTGTCGCTCG GTTACACTTG ATCGGAGCTT GTTCTGTTAT ACACCAAACC1080
ATCTTAATTA ATAGGAT 1097
<210>39
<211>1142
<212>DNA
<213>人工序列
<220>
<221>引物结合
<222>(1)..(35)
<220>
<221>启动子
<222>(13)..(1128)
<220>
<221>引物结合
<222>(1118)..(1142)
<400>39
ATCCTACTCG AGGCCTTTGG AGAATGTAAT ATCCCTTGAT CACCCCAGAC TCACATCCAG60
ATTCTGACTG ACCTCGTGCA TAGCCATATT TAACTTGGTC CCTGATGATC AAAACAGTAC120
ATGGAACTGG GGCCGAACAT TTCCCTAGCC AAAGGAGCAT CAGGGATTCA ACGTGATCAG180
TACAGCCTTG TAGCTCGCTG AAACTGCCCT GGAGCCAAGC CAAAGCCTAG ACAGCAAGGT240
GCATGGGCGA GCTTTGCGAG GATTTAGTTG TTATTTAGTA TGCCAAGATT AAGCCACGCA300
GAATGGCTTA TGGCCATAGT AGCAACAACG GCCACGGAAC GTTCTTCCAT GTGGTATGGG360
GAAAGCCGCC GGATATTTGG GGAGGGCGTG ATTGTTCCGG TGGCTATCTT TCCGGTGGAG420
ATAACGGCGG TGGACCATCA AAACTCCTCA GCCCGGATTG CTCGGACTCC GCATCGTCAA480
GTATCGGTTTC ATGACAGCC ATTCGACTAC TTAGAAGACA CAAATAGCTA TCCAACTTAC540
CCGGACCTTTG ATAATAATT TTCAGCAGAT CTGTCGATCT CAGAGACAAT AATGCCACCG600
TTCTGTGTGGA AGGCACTGC GCCGTGGTTT AACAATAATA AAACTCCAAA TTGCCCAAAA660
GCTAGAGCGAA GGAAAGTCG AGAAGCCCAG TCTAGACTGG CGGGCTGATC GTCCGGTTCA720
CAACCTGATTG ACAAATCAT CTGTGACCCT CGATGTTCCG CGGCGTTGAG CGGGTGAGAA780
TGTGGATCCTA GTGGGGAAG ACCCAATTGC CGCCGGAAAA GGTGAGCTTG TGCTGCACAT840
GTCCGGTGGCT CAATTCAGG GCCATGCCAG GACATTGCTC TTCAAAGGGA TGCGATTGCT900
ATTCCCTATTT ACTTCTTTA ACCCGCTGAC GGGCCTGTCT GGACCGAGAA TTCTTGGTCA960
AGTTTCAGTGG AGCGATCCA GGAAAGAACA TCCGATATGG ACAGTTGCCC TCGATCTCAG1020
GTCTGTAGTCG TGTGACACA GAGGCCTCTA CTCGCTTGCC TTGCATGTCG GAGCTCAAAG1080
GTGCGATGTGA ATTAACACG AGGAGCGACT GTCTGTCGCA GATGCAACTT AATTAATAGG1140
AT 1142
<210>40
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物
<400>40
ACTTCATTAA TTAAGTTGAT TGAGGTAGAG ATGAGTTTG39
<210>41
<211>35
<212>DNA
<213>人工序列
<220>
<223>引物
<400>4I
ACTTCACTCG AGATAATGTA GGCGACAAAG TAGCC 35
<210>42
<211>36
<212>DNA
<213>人工序列
<220>
<223>引物
<400>42
ACTTCATTAA TTAATTTGAC ACTTAACGTG GTAAGG 36
<210>43
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物
<400>43
ACTTCACTCG AGTTCTCACA AGCAAATCCG AGA33
<210>44
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物
<400>44
ATCCTACTCG AGTGGTGCCT GTGAACGAGG TCA33
<210>45
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物
<400>45
ACTTCATTAA TTAATGTGGA TTTTGGATAG TAATTAAAG39
<210>46
<211>38
<212>DNA
<213>人工序列
<220>
<223>引物
<400>46
ATCCTATTAA TTAAGATGGT TTGGTGTATA ACAGAACA 38
<210>47
<211>34
<212>DNA
<213>人工序列
<220>
<223>引物
<400>47
ACTTCACTCG AGGTCCACAC TCTAATTGGG ATGA34
<210>48
<211>35
<212>DNA
<213>人工序列
<220>
<223>引物
<400>48
ATCCTATTAA TTAAGTTGCA TCTGCGACAG ACAGT 35
<210>49
<211>35
<212>DNA
<213>人工序列
<220>
<223>引物
<400>49
ACTTCACTCG AGGCCTTTGG AGAATGTAAT ATCCC35
<210>50
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>50
CAACACCTAC GGCGTCAAGG 20
<210>51
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>51
TAACCCGGGG AGATGCTGTT20
<210>52
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>52
CGATCCGGAA ATTCCTCCTG 20
<210>53
<211>19
<212>DNA
<213>人工序列
<220>
<223>引物
<400>53
GCCGCCGACT CAGCAGTAT 19
<210>54
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>54
GTGCATGAAC AACACGGAGA 20
<210>55
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>55
ACTCAGTTGT GCGCCTCTCG20
<210>56
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>56
GTCGAACTCG GCGTTTCTCC20
<210>57
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>57
CCGGTGAGGA GGTGCTTTTC20
<210>58
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>58
AGCATCTCGC CATCCATCAG20
<210>59
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>59
GCCTTCGGAC CATGGTATCC20
<210>60
<400>60
000
<210>61
<211>1226
<212>DNA
<213>人工序列
<220>
<221>基因
<222>(23)..(739)
<223>GFP
<220>
<221>基因
<222>(740)..(1212)
<223>BLE
<400>61
GTCCTGTTAA TTAACCTTCA CCATGGTGAG CAAGGGCGAG GAGCTGTTCA CCGGGGTGGT60
GCCCATCCTG GTCGAGCTGG ACGGCGACGT AAACGGCCAC AAGTTCAGCG TGTCCGGCGA120
GGGCGAGGGC GATGCCACCT ACGGCAAGCT GACCCTGAAG TTCATCTGCA CCACCGGCAA180
GCTGCCCGTG CCCTGGCCCA CCCTCGTGAC CACCCTGACC TACGGCGTGC AGTGCTTCAG240
CCGCTACCCC GACCACATGA AGCAGCACGA CTTCTTCAAG TCCGCCATGC CCGAAGGCTA300
CGTCCAGGAG CGCACCATCT TCTTCAAGGA CGACGGCAAC TACAAGACCC GCGCCGAGGT360
GAAGTTCGAG GGCGACACCC TGGTGAACCG CATCGAGCTG AAGGGCATCG ACTTCAAGGA420
GGACGGCAAC ATCCTGGGGC ACAAGCTGGA GTACAACTAC AACAGCCACA ACGTCTATAT480
CATGGCCGAC AAGCAGAAGA ACGGCATCAA GGTGAACTTC AAGATCCGCC ACAACATCGA540
GGACGGCAGC GTGCAGCTCG CCGACCACTA CCAGCAGAAC ACCCCCATCG GCGACGGCCC600
CGTGCTGCTG CCCGACAACC ACTACCTGAG CACCCAGTCC GCCCTGAGCA AAGACCCCAA660
CGAGAAGCGC GATCACATGG TCCTGCTGGA GTTCGTGACC GCCGCCGGGA TCACTCTCGG720
CATGGACGAG CTGTACAAGG CCAAGTTGAC CAGTGCCGTT CCGGTGCTCA CCGCGCGCGA780
CGTCGCCGGA GCGGTCGAGT TCTGGACCGA CCGGCTCGGG TTCTCCCGGG ACTTCGTGGA840
GGACGACTTC GCCGGTGTGG TCCGGGACGA CGTGACCCTG TTCATCAGCG CGGTCCAGGA900
CCAGGTGGTG CCGGACAACA CCCTGGCCTG GGTGTGGGTG CGCGGCCTGG ACGAGCTGTA960
CGCCGAGTGG TCGGAGGTCG TGTCCACGAA CTTCCGGGAC GCCTCCGGGC CGGCCATGAC1020
CGAGATCGGC GAGCAGCCGT GGGGGCGGGA GTTCGCCCTG CGCGACCCGG CCGGCAACTG1080
CGTGCACTTC GTGGCCGAGG AGCAGGACTA AAGGCGCGCC TGAAGT 1226
<210>62
<211>37
<212>DNA
<213>人工序列
<220>
<223>引物
<400>62
GTCCTGTTAA TTAACCTTCA CCATGGTGAG CAAGGGC37
<210>63
<211>36
<212>DNA
<213>人工序列
<220>
<223>引物
<400>63
GCACTGGTCA ACTTGGCCTT GTACAGCTCG TCCATG36
<210>64
<211>36
<212>DNA
<213>人工序列
<220>
<223>引物
<400>64
CATGGACGAG CTGTACAAGG CCAAGTTGAC CAGTGC36
<210>65
<211>35
<212>DNA
<213>人工序列
<220>
<223>引物
<400>65
ACTTCAGGCG CGCCTTTAGT CCTGCTCCTC GGCCA3权利要求
1.启动子DNA序列,例如
(a)以下列表所示的DNA序列SEQ ID NO1、SEQ ID NO2、SEQID NO20、SEQ ID NO21、SEQ ID NO22、SEQ ID NO23或SEQ IDNO24,
(b)能够与(a)的DNA序列杂交的DNA序列,
(c)与(a)的DNA序列至少50%同源的DNA序列,
(d)(a)到(c)中任何DNA序列的变体,或
(e)(a)到(d)中任何DNA序列的亚序列。
2.DNA构建体,其包含与报告基因可操作连接的如权利要求1所述的启动子DNA,所述报告基因赋予可选择性状,优选地,选择性标记基因。
3.包含如权利要求2所述的DNA构建体的表达载体,其中所述DNA构建体包含下述DNA片段,所述DNA片段与宿主细胞基因组中预先确定的靶基因座DNA序列同源,优选所述预先确定的靶基因座包含高表达的基因。
4.包含如权利要求2所述的DNA构建体的表达载体,其中所述DNA构建体能够在宿主细胞中自主维持,优选地,所述DNA构建体包含AMA1序列。
5.宿主细胞,其包含如权利要求2所述DNA构建体,或包含如权利要求3或4所述的表达载体。
6.如权利要求5所述的宿主细胞,其还包含包含下述DNA序列的DNA构建体,所述DNA序列包含来自下述DNA文库的编码序列,所述DNA文库来自被怀疑能够产生一种或多种目的蛋白质的生物。
7.如权利要求5或6所述的宿主细胞,其中所述宿主细胞为原核生物或真核生物。
8.如权利要求7所述的宿主细胞,其中所述宿主细胞选自以下列表Bacillus、酵母或丝状真菌,优选地,Aspergillus、Penicillium或Trichoderma种。
9.如权利要求8所述的宿主细胞,其中Aspergillus为Aspergillus niger或Aspergillus sojae或Aspergillus oryzae种。
10.用于分离下述DNA序列的方法,所述DNA序列包含在宿主细胞中编码目的蛋白质的DNA序列,所述方法包含如下步骤
(a)制备第一DNA构建体,其包含与赋予可选择性状的报告基因可操作连接的启动子DNA序列;当所述DNA构建体存在于宿主细胞中和当所述宿主细胞产生目的蛋白质,优选被分泌的目的蛋白质时,所述启动子DNA序列被诱导;
(b)制备第二DNA构建体,其包含包含下述DNA序列的DNA序列,所述DNA序列编码来自下述生物DNA文库的目的蛋白质,所述生物被怀疑能够制造一种或多种目的蛋白质;
(c)用(a)和(b)中制备的两种DNA构建体转化宿主细胞;
(d)在有助于产生所述DNA文库中存在的目的蛋白质的条件下,培养(c)中获得的所有经转化的宿主细胞;和
(e)通过分析在(d)中产生的蛋白质,筛选产生目的蛋白质的经转化的宿主细胞。
11.如权利要求10所述的方法,其中首先用步骤(a)中制备的DNA构建体转化所述宿主细胞,然后用步骤(b)中制备的DNA构建体转化所述宿主细胞。
12.如权利要求10或11所述的方法,其中步骤(a)中使用的所述启动子为权利要求1的启动子。
13.如权利要求10到12任一项所述的方法,其中所述被怀疑能够产生目的蛋白质的生物为真核生物或原核生物。
14.如权利要求10到13任一项所述的方法,其中所述目的蛋白质为酶。
全文摘要
帝斯曼知识产权资产管理有限公司B.V.24403WO,在宿主细胞中表达克隆的改进方法,本发明涉及高度适用于经改进的表达克隆方法中的启动子DNA序列和利用该启动子的经改进的表达克隆方法,所述经改进的表达克隆方法用于分离下述DNA序列,所述DNA序列包含在宿主细胞中编码目的蛋白质的DNA序列。所述经分离的DNA序列适用于制造目的蛋白质的方法。
文档编号C12N15/09GK101163790SQ200680008683
公开日2008年4月16日 申请日期2006年3月20日 优先权日2005年3月18日
发明者罗埃尔弗·伯恩哈德·梅玛, 蒂鲍特·乔斯·维恩策尔, 科尼利斯·玛丽亚·雅各布斯·沙吉, 约翰尼斯·翰德里克·德温德, 奥斯卡·保罗·柯伊伯斯, 鲁特格尔·简·洛尔延范, 马若兰·科纳拉·迪克, 布伦达·沃恩克 申请人:帝斯曼知识产权资产管理有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1