新的淀粉酶及其用途的制作方法

文档序号:3588757阅读:642来源:国知局
专利名称:新的淀粉酶及其用途的制作方法
技术领域
本发明涉及新鉴定的多核苷酸序列,包括编码从黑曲霉(Aspergillus niger)中分离的新淀粉酶的基因。本发明包括新基因的全长核酸序列,包含新淀粉酶全长编码序列的cDNA序列,以及全长功能蛋白的氨基酸序列及其功能等同物。本发明还涉及这些酶在工业生产中的应用方法和真菌感染诊断方法。本发明还包括用本发明的多核苷酸转化的细胞,和其中本发明的淀粉酶经遗传修饰使其活性和/或表达水平得以提高的细胞。
背景技术
工业生产中,依靠无机酸或酶的催化作用将淀粉水解成葡萄糖。目前优选使用酶,其可提高产量并带来有益经济效益等多种优势。酶促水解可在更大程度上控制淀粉水解、反应特异性和产物的稳定性。温和的反应条件包括较低的温度,接近中性的pH,由此减少不想要的副反应。少有风味不佳和颜色不佳的化合物特别是5-羟基-2-甲基糠醛、葡糖酐化合物和多余的盐产生。酶法还因其能耗低并可省去中和步骤而受到欢迎。
阿尔法-淀粉酶(E.C.3.2.1.1)或α-淀粉酶催化寡糖和多糖中的1,4-α-糖苷键的内水解(endohydrolysis)。它们也被称作1,4-α-D-葡聚糖葡聚糖水解酶(glucanohydrolase),高峰淀粉酶(Taka淀粉酶),内淀粉酶或糖原酶。α-淀粉酶以随机的方式作用于淀粉、糖原以及相关多糖和寡糖;还原基团以α-构型被释放出来。
β-淀粉酶(E.C.3.2.1.2)催化多糖中的1,4-α糖苷键水解,从链的非还原端去除连续麦芽糖单元。它还被称作1,4-α-D-葡聚糖麦芽糖水解酶,糖淀粉酶,糖原酶。β淀粉酶作用于淀粉,糖原和相关的多糖和寡糖,通过转化产生β-麦芽糖。
葡糖淀粉酶(E.C.3.2.1.3)催化末端1,4连接的α-D-葡萄糖残基从链的非还原端连续地水解,释放β-D-葡萄糖。它还被称作葡聚糖1,4-α-葡糖苷酶。1,4-α-D-葡聚糖葡糖水解酶(glucohydrolase)、淀粉葡糖苷酶、γ-淀粉酶、溶酶体α-葡糖苷酶、外-1,4-α-葡糖苷酶。当序列中接下来的键是1,4时大多数形式的该酶能迅速地水解1,6-α-D-糖苷键,有些这种酶的制剂在其他多糖中能水解1,6-和1,3-α-D-糖苷键。
淀粉酶可便利地由微生物产生。微生物淀粉酶可从多种来源获得;细菌酶通常来源于芽孢杆菌属,而真菌酶通常由曲霉菌属产生。
鉴于大多数真菌淀粉酶最适于低pH条件,所以易于利用酸性条件进行糖化作用。这种条件减少了多余的异构化反应形成的果糖和其他的糖,从而提高了葡萄糖的产量。而且酸性条件限制了在糖化作用反应器中的污染微生物的生长。
淀粉酶有多种工业用途,包括烘焙糕点、酿酒、玉米浆和乙醇生产以及醋发酵。
发芽小麦,大麦,细菌,和真菌是烘焙用α-淀粉酶的典型来源。真菌α-淀粉酶以稀释粉末、预包装剂量、或水分散性片剂的形式添加到面包面团中。所述的酶可能是在面包房,偶尔在制造厂时加入到面粉中。在制造厂中当下述谷物的面粉与终产品混合时,发芽的小麦和大麦也可以作为淀粉分解活性的来源。细菌α-淀粉酶的性质允许其可以应用于生产早餐点心、果料蛋糕、核仁巧克力饼、小甜饼、零食、和饼干。真菌α-淀粉酶,通常来自米曲霉(A.oryzae)、黑曲霉(A.niger)泡盛曲霉(A.Awamori)或根霉属菌种,用于补充面粉中的淀粉分解活性。这些来源的酶可使生面团中可发酵单糖和二糖的水平从天然的0.5%提高到可促进酵母生长的浓度。添加的真菌酶和内源酶持续释放葡萄糖和麦芽糖可为面团发酵过程中的酵母代谢和气体产生提供必需的营养物。在烘焙应用中,有时候使用米曲霉α-淀粉酶要优于使用来自芽孢杆菌的细菌酶,这是因为真菌酶在60-70℃下是热不稳定的所以经烘烤过程不能存活。其热不稳定性防止酶作用于制得的面包中的糊化淀粉而产生软或粘的面包屑。细菌α-淀粉酶的效果也不错,但需小心地控制使用剂量以免使生产的面包口感胶粘。由于白面包粉含有6.7-10.5%的残损淀粉(damaged starch),所以补充淀粉酶也是有益的并且有时是必要的。添加的酶可比小麦β-淀粉酶更有效地降解通常存在于粗面粉中的残损或断裂的淀粉颗粒(Bigelis R.Enzymes inFood processing,Nagodawithana和Reed编Acad.Press Inc p121-158及其中引用的参考文献)。
除改善面包卷、小圆面包和饼干的品质之外,在制造这些烘焙产品的过程中添加淀粉酶还可以改善面包的其他品质特性。在面包烘焙过程中使用真菌或细菌淀粉酶进行处理可以降低生面团的粘性,使其更易于人工或机器操作。适当剂量的酶还可以降低面包的压缩率,从而生产出更松软的面包。而且,这种生产过程通过降低凝胶淀粉的粘性以及在蛋白变性和酶失活使面包的体积固定下来以前的烘烤过程中使其进一步膨胀而增大面包的体积。同时也观察到其对口味、面包皮性质和烤吐司品质的良好作用。经品尝员测定,面包的贮存特性也得以改变,产品面包屑更松软、更具压缩性,变硬的过程更缓慢并可以保存更长时间。淀粉分解活性还可以提高面包中的糖浓度,从而生产出具有感官优势的更香甜的产品(Bigelis R.inEnzymes in Foodprocessing,Nagodawithana和Reed编,Acad.Press Inc p121-158及其中引用的参考文献)。
在酿造过程中,添加的酶可以促进内源大麦β-淀粉酶的作用,并对淀粉消化过程起辅助作用。这种添加酶在使用称作添加剂的未发芽谷粒如玉米和稻米时尤其重要。由于这些添加的谷粒缺乏碳水化合物分解酶,真菌β-淀粉酶和葡糖淀粉酶可以增加淀粉的消化,减少未发芽谷粒的比例,并保证混合物的均匀一致性。淀粉酶可以溶解大麦的直链淀粉和支链淀粉,使这些底物暴露于大麦β-淀粉酶进行进一步地降解。结果使麦芽糖和小分子糊精的水平提高,最终获得促进酵母发酵的麦芽汁组分。具有低转葡糖苷酶活性的淀粉酶制剂是有利的,这是由于微量水平的这种酶产生异麦芽糖和潘糖,而这两种糖都是不能被酵母发酵的。应用于酿造的淀粉酶活性的来源通常是来自曲霉菌,如黑曲霉或米曲霉的酶。这些来源的蛋白酶可以和淀粉酶一起添加来溶解蛋白质并释放酵母增殖所必需的氨基酸(Bigelis R.inEnzymes inFood processing,Nagodawithana和Reed编.Acad.Press Inc p121-158及其中引用的参考文献)。
在上述过程,使用由重组DNA方法获得的酶是有利的。这些重组酶与相应的传统纯化产物相比有许多优点。重组酶生产成本低、产量高、而且没有像细菌或病毒之类的污染媒介物,也没有细菌毒素或其他酶活性的污染。
真菌中淀粉酶的分子克隆已有描述。来自米曲霉,黑曲霉和A.shirousamii的某些α-淀粉酶的DNA以及推定的氨基酸序列已由Wirsel等Mol.Microbiol 1989,(1)3-14,Boel等,Biochemistry 1990(29)6244-6249,和Shibuya等,Biosci.Biotech.Biochem.1992(56)174-179公开。来自解淀粉芽孢杆菌(Bacillus amyloliquefaciens)的一种α-淀粉酶的分子克隆已由Takkinen等在J.Biol.Chem.1983,(258)1007-1013中描述。
重要的是淀粉酶,特别是α-淀粉酶,可以低成本生产。这可以通过提高生产效率(高表达水平)或应用比活性(每毫克酶活性更高)提高的酶来实现。因此,本发明的目的在于提供生产效率提高和/或比活性提高了的改进的酶。
当α淀粉酶用作面包改良剂时,将其以液体制剂的形式,优选与其他酶一起应用是有利的。酶稳定剂(像甘油)是液体面包改良剂的主要费用因素,因此需要在这种制剂中应用更稳定的α-淀粉酶以降低稳定剂的用量。提供更稳定的α-淀粉酶也是本发明的目的。
α-淀粉酶常常与抗坏血酸一同使用,其在较高pH值下趋于不稳定。另一方面α-淀粉酶在较低pH值下变得不稳定。在以上双重条件之间折衷的结果是,这种制剂通常保持在pH值4.7左右。因此能够提供一种最佳pH值更低和/或在低pH值,优选低于pH 4.7的条件下更稳定的α-淀粉酶是有利的。本发明即提供这样的酶。
在许多情况下抗坏血酸与α-淀粉酶联合应用,其中它可转化成多种螯合剂,如草酸盐。草酸盐能结合Ca离子,由于α-淀粉酶需要Ca离子来保持其稳定性,这样草酸盐就成了这些α-淀粉酶制剂的去稳定剂。由此本发明的一个目的是提供其稳定性较少依赖于Ca离子的酶。
现有技术中的α-淀粉酶的另一个特性在于其耐热性有限。真菌α-淀粉酶在大约65℃下失去活性,因此,它们在烘焙过程的开始阶段就被热灭活。同时,这种特性也使得真菌α-淀粉酶不适于用Hagberg降落值法(Hagberg falling number method)(AACC,1983,Method 56-81 A)和Brabender淀粉粘焙力测量法(AACC,1983,Method 22-1)进行活性测定。另外,在略高于室温的温度下延期储存时常损害酶活性。因此,本发明的目的在于提供耐热性提高的α-淀粉酶。
发明目的本发明的目的在于提供编码经改进的新淀粉酶的新多核苷酸。进一步地,本发明的目的在于提供经改进的天然及重组生产的淀粉酶,以及产生这些酶的重组菌株。本发明还涉及制造及使用本发明的多核苷酸和多肽的方法以及融合多肽。
发明简述本发明涉及具有α-淀粉酶活性以及一种或多种选自下组中所述特性的分离多肽1)具有下述氨基酸序列的分离多肽,所述的氨基酸序列选自SEQ ID NO13,SEQ ID NO14,SEQ ID NO15,SEQ ID NO16,SEQ ID NO17或SEQ ID NO18,或它们的功能等同物;2)可通过具有下述核苷酸序列的多核苷酸,或包含所述多核苷酸或其功能等同物的载体在合适的宿主细胞,如黑曲霉中表达而获得的分离多肽,所述核苷酸序列选自SEQ ID NO1,SEQ ID NO2,SEQ ID NO3,SEQ ID NO4,SEQ ID NO5或SEQ ID NO6,或选自SEQ ID NO7,SEQ ID NO8,SEQ ID NO9,SEQ ID NO10,SEQ ID NO11或SEQ ID NO12。
3)包含如(1)或(2)所述的多肽的功能性结构域的多肽,4)(1),(2)或(3)的等位基因变异体,5)(1),(2),(3)或(4)的片段,6)具有经改进的比活性和/或经改进的生产效率的多肽,所述的比活性和/或生产效率表示为每毫克纯化酶的酶活性,或表示为每毫升培养物体积或每毫克产生的生物量的酶活性,7)稳定性得以提高的多肽,优选在少于50%的甘油存在的情况下,优选在少于40%的甘油的情况下,更优选在少于30%的甘油的情况下,更优选在少于20%的甘油的情况下,更优选在少于10%的甘油的情况下,最优选在无甘油存在的情况下是稳定的。
8)在pH值低于4.7时,优选低于4.0时,更优选pH低于3.5时稳定的多肽。
9)对Ca离子稳定性得以提高的多肽。
特别提及,本发明的α-淀粉酶可以具有上述的一种或多种特性。确定比活性、生产效率、稳定性、最佳pH和酸稳定性的方法是本领域所公知的。它们可在WO 00/60058的材料和方法部分等处找到。
本发明还涉及编码上述任何多肽的多核苷酸。
更具体地说,本发明提供了具有优选在高度严格条件下与具有选自下组的核苷酸序列的序列杂交的核苷酸序列的多核苷酸,所述的组由SEQ ID NO1,SEQ ID NO2,SEQ ID NO3,SEQ ID NO4,SEQ ID NO5或SEQ ID NO6组成,或由SEQ ID NO7,SEQ IDNO8,SEQ ID NO9,SEQ ID NO10,SEQ ID NO11或SEQ IDNO12组成。因此,本发明提供与选自下组的任意序列约40%,优选65%,更优选70%,更优选75%,80%,85%,90%,95%,96%,97%,98%或99%同源的核酸,所述的组由SEQ ID NO1,SEQ ID NO2,SEQ ID NO3,SEQ ID NO4,SEQ ID NO5或SEQ ID NO6组成,或由SEQ ID NO7,SEQ ID NO8,SEQ ID NO9,SEQ ID NO10,SEQ ID NO11或SEQ ID NO12组成。
在本发明的一个更优选实施方案中提供了这样一种可从丝状真菌特别优选黑曲霉获得的分离的多核苷酸。
在一个实施方案中本发明提供了包含编码下述多肽的核酸序列的分离的多核苷酸,所述多肽具有选自下组的氨基酸序列SEQ ID NO13,SEQ ID NO14,SEQ ID NO15,SEQ ID NO16,SEQ ID NO17或SEQ ID NO18,或其功能等同物。
在另一个优选的实施方案中,本发明提供编码具有下述氨基酸序列的多肽中的至少一个功能性结构域的分离的多核苷酸,所述的氨基酸序列选自SEQ ID NO13,SEQ ID NO14,SEQ ID NO15,SEQID NO16,SEQ ID NO17或SEQ ID NO18,或其功能等同物。
本发明的一个优选的实施方案中提供了具有下述核苷酸序列的淀粉酶基因,所述的核苷酸序列选自SEQ ID NO1,SEQ ID NO2,SEQ ID NO3,SEQ ID NO4,SEQ ID NO5或SEQ ID NO6。本发明的另一方面提供一种多核苷酸,优选编码具有下述氨基酸序列的黑曲霉淀粉酶的cDNA,所述的氨基酸序列选自SEQ ID NO13,SEQID NO14,SEQ ID NO15,SEQ ID NO16,SEQ ID NO17或SEQID NO18,或该多肽的变异体或片段。在一个优选的实施方案中,所述的cDNA具有选自下组的核苷酸序列,所述的组由SEQ ID NO7,SEQ ID NO8,SEQ ID NO9,SEQ ID NO10,SEQ ID NO11或SEQ ID NO12或其功能等同物组成。
在更优选的实施方案中,本发明提供包含本发明多核苷酸的编码序列的多核苷酸,优选的是选自下组的多核苷酸序列,所述的组由SEQID NO1,SEQ ID NO2,SEQ ID NO3,SEQ ID NO4,SEQ ID NO5或SEQ ID NO6组成,或由SEQ ID NO7,SEQ ID NO8,SEQ IDNO9,SEQ ID NO10,SEQ ID NO11或SEQ ID NO12组成。
本发明还涉及包含本发明多核苷酸序列的载体,和可用于扩增或检测本发明DNA的引物、探针和片段。
在更优选的实施方案中提供了一种载体,所述载体中本发明的多核苷酸序列与适合于在合适的宿主细胞如黑曲霉和米曲霉中表达所编码的氨基酸序列的调节序列功能性地连接。本发明还提供了制备本发明中的多核苷酸和载体的方法。
本发明还涉及重组产生的宿主细胞,所述的宿主细胞包含根据本发明的同源或异源多核苷酸。
在另一个实施方案中,本发明提供重组的宿主细胞,其中本发明的淀粉酶的表达显著提高,或者所述淀粉酶的活性提高。
在本发明的另一个实施方案中提供了一种重组产生的宿主细胞,其包含了本发明的同源或异源DNA,并且所述的细胞能产生本发明的功能性淀粉酶,优选地提供一种能超表达本发明的淀粉酶的细胞,例如包含增加拷贝数的本发明的基因或cDNA的曲霉菌菌株。
在本发明的又一方面中提供了一种经纯化的多肽。本发明的多肽包括由本发明的多核苷酸所编码的多肽。特别优选的是具有下述氨基酸序列的多肽,所述的氨基酸序列选自SEQ ID NO13,SEQ ID NO14,SEQ ID NO15,SEQ ID NO16,SEQ ID NO17或SEQ ID NO18,或其功能等同物。
包含本发明的多肽的融合蛋白也属于本发明的范围之内。本发明还提供制备本发明的多肽的方法。
本发明还涉及本发明的淀粉酶在本文所述的任何工业生产过程中的用途。
发明详述多核苷酸本发明提供编码具有下述氨基酸序列的α-淀粉酶的多核苷酸,所述的氨基酸序列选自SEQ ID NO13,SEQ ID NO14,SEQ ID NO15,SEQ ID NO16,SEQ ID NO17或SEQ ID NO18,或其功能等同物。编码本发明的蛋白的基因序列通过对获自黑曲霉的基因组克隆进行测序确定。本发明提供多核苷酸序列,包含编码黑曲霉α-淀粉酶的基因,以及其完整的cDNA序列及其编码序列。因此,本发明涉及包含下述核苷酸序列的分离的多核苷酸,所述核苷酸序列选自SEQ IDNO1,SEQ ID NO2,SEQ ID NO3,SEQ ID NO4,SEQ ID NO5或SEQ ID NO6,或选自SEQ ID NO7,SEQ ID NO8,SEQ IDNO9,SEQ ID NO10,SEQ ID NO11或SEQ ID NO12,或其功能等同物。
更具体地,本发明涉及在严格条件下,优选高度严格条件下能和具有下述核苷酸序列的多核苷酸杂交的分离的多核苷酸,所述核苷酸序列选自SEQ ID NO1,SEQ ID NO2,SEQ ID NO3,SEQ IDNO4,SEQ ID NO5或SEQ ID NO6或选自SEQ ID NO7,SEQID NO8,SEQ ID NO9,SEQ ID NO10,SEQ ID NO11或SEQ IDNO12。有益的是,这种多核苷酸可来源于丝状真菌,特别是黑曲霉。更特别地,本发明涉及具有选自下组中核苷酸序列的核苷酸序列的分离的多核苷酸,所述的组由SEQ ID NO1,SEQ ID NO2,SEQ ID NO3,SEQ ID NO4,SEQ ID NO5或SEQ ID NO6或由SEQ ID NO7,SEQ ID NO8,SEQ ID NO9,SEQ ID NO10,SEQ ID NO11或S EQID NO12组成。
本发明还涉及编码具有下述氨基酸序列的多肽的至少一个功能性结构域的分离的多核苷酸,所述氨基酸序列选自SEQ ID NO13,SEQID NO14,SEQ ID NO15,SEQ ID NO16,SEQ ID NO17或SEQID NO18,或其功能等同物。
此处所用的术语″基因″和″重组基因″是指核酸分子,该核酸分子可从染色体DNA分离得来,其可包括编码某种蛋白如黑曲霉淀粉酶的可读框。基因可以包含编码序列、非-编码序列、内含子和调节序列。此外,基因指此处所定义的分离的核酸分子。
本发明的核酸分子,如具有下述核苷酸序列的核酸分子可通过标准的分子生物学技术分离,本申请中提供了序列信息,所述的核苷酸序列选自SEQ ID NO1,SEQ ID NO2,SEQ ID NO3,SEQ ID NO4,SEQ ID NO5或SEQ ID NO6或选自SEQ ID NO7,SEQ ID NO8,SEQ ID NO9,SEQ ID NO10,SEQ ID NO11或SEQ ID NO12或它们的功能等同物。例如,用全部或部分下述核酸序列作为杂交探针,即可利用标准的杂交和克隆技术(例如Sambrook,J.,Fritsh,E.F.,和Maniatis,T.Molecular CloningA Laboratory Manual.2nd,ed.,Cold Spring Harbor Laboratory,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,NY,1989中所述)将本发明的核酸分子分离出来,所述的核酸序列为SEQ ID NO1,SEQ ID NO2,SEQ IDNO3,SEQ ID NO4,SEQ ID NO5,SEQ ID NO6,SEQ ID NO7,SEQ ID NO8,SEQ ID NO9,SEQ ID NO10,SEQ ID NO11或SEQ ID NO12。
此外,包含全部或部分下述序列的核酸分子可利用根据本申请所提供的序列信息设计合成的寡核苷酸引物,通过聚合酶链式反应(PCR)分离获得,所述的序列为SEQ ID NO1,SEQ ID NO2,S EQ ID NO3,SEQ ID NO4,SEQ ID NO5,SEQ ID NO6,SEQ ID NO7,SEQID NO8,SEQ ID NO9,SEQ ID NO10,SEQ ID NO11或SEQ IDNO12。
本发明的核酸可利用cDNA,mRNA或可供选择地基因组DNA作为模板及合适的寡核苷酸引物,由标准的PCR扩增技术扩增出来。所扩增的核酸可以克隆到合适的载体中通过DNA序列分析进行特征描述。
另外,与本发明的核苷酸序列相应或能与之杂交的寡核苷酸序列可通过标准的合成技术,如利用自动DNA合成仪制备。
在一个优选的实施方案中,本发明的分离的核酸分子包含如SEQID NO7,SEQ ID NO8,SEQ ID NO9,SEQ ID NO10,SEQ ID NO11或SEQ ID NO12所示的核苷酸序列。如SEQ ID NO7,S EQ IDNO8,SEQ ID NO9,SEQ ID NO10,SEQ ID NO11或SEQ ID NO1 2所示的序列信息分别相应于由SEQ ID NO1,SEQ ID NO2,SEQID NO3,SEQ ID NO4,SEQ ID NO5或SEQ ID NO6所提供的黑曲霉α-淀粉酶基因的编码区。这种cDNA包含编码分别具有下述氨基酸序列的黑曲霉α-淀粉酶的序列,所述的氨基酸序列选自SEQ ID NO13,SEQ ID NO14,SEQ ID NO15,SEQ ID NO16,SEQ ID NO17或SEQ ID NO18。
在另一个优选实施方案中,本发明的分离的核酸分子包含与下述核苷酸序列互补的核酸分子,所述的核苷酸序列如SEQ ID NO1,SEQ ID NO2,SEQ ID NO3,SEQ ID NO4,SEQ ID NO5,SEQID NO6,SEQ ID NO7,SEQ ID NO8,SEQ ID NO9,SEQ IDNO10,SEQ ID NO11或SEQ ID NO12所示,或这些核苷酸序列的功能等同物。
互补于另一核苷酸序列的核酸分子是与另一核苷酸序列足够互补以至于可与之杂交从而形成稳定的双螺旋结构的核酸分子。
本发明的一方面涉及分离的核酸分子,其编码本发明的多肽或其功能等同物,如生物活性片段或结构域,同时也涉及足以用作杂交探针来鉴定编码本发明多肽的核酸分子的核酸分子,和适合用作用于扩增或突变核酸分子的PCR引物的这种核酸分子的片段。
″分离的多核苷酸″或″分离的核酸″是指DNA或RNA序列,其不直接与在其来源生物的天然存在基因组中直接紧邻的两编码序列(一个在5’末端,一个在3’末端)直接紧邻。因此在一个实施方案中,分离的核酸包括部分或全部的5′非-编码序列(例如,启动子),其与编码序列直接紧邻。该术语因而包括例如,掺入到载体、自主复制的质粒或病毒或原核或真核生物基因组DNA中的重组DNA,或者其可作为单独的分子(例如cDNA或经PCR或限制性内切酶处理而产生的基因组DNA片段)独立于其他序列而存在。它还包括作为编码附加多肽的杂合基因的一部分的重组DNA,其基本上脱离细胞物质、病毒物质或培养基(由重组DNA技术产生时),或化学前体或其他化学物质(当通过化学合成时)。此外,″分离的核酸片段″指非天然出现为片段也不会在自然状态中找到的核酸片段。
此处所用的术语″多核苷酸”或”核酸分子″试图包括DNA分子(例如,cDNA或基因组DNA)和RNA分子(例如,mRNA)以及使用核苷酸类似物产生的DNA或RNA的类似物。核酸分子可以是单链或双链,但优选双链DNA。所述核酸可利用寡核苷酸类似物或衍生物(例如,肌苷或硫代磷酸核苷酸)合成。这种寡核苷酸可用于例如制备碱基配对能力发生改变的或对核酸酶抗性增强的核酸。
本发明的另一个实施方案提供了一种分离的核酸分子,其是本发明的核酸分子的反义核酸分子。此处所述的核酸分子的互补链也包含在本发明的范围内。
在特定的应用中,生产出无淀粉酶活性的产品是有利的。这种产品可由微生物产生,所述微生物中本发明的淀粉酶基因被去除或其活性被减弱。这种微生物可通过重组DNA技术获得,例如可将本发明的基因表达敲除。淀粉酶缺陷突变体可有利地应用于生产凝乳酶,在该生产过程中不希望有淀粉酶污染。
除通过破坏或诱变来去除淀粉酶活性,还可以通过下调淀粉酶活性使其活性减弱。这可以通过遗传改变本发明基因的启动子或其他调节序列来实现。由本申请中所提供的序列信息,本领域的技术人员知道如何实现获得减弱或去除了淀粉酶活性的突变微生物的目的。
测序误差本申请中所提供的序列信息不应当狭义地解释为需要包括被错误鉴定的碱基。这里所公开的特异序列可容易地用于从丝状真菌,特别是黑曲霉中分离完整的基因,这些基因反过来又可以容易地进一步用于序列分析,从而鉴定出测序误差。
除非另有说明,本申请中通过DNA分子测序确定的所有核苷酸序列都是通过自动DNA测序仪确定的,由在此确定的DNA分子编码的多肽的所有氨基酸序列都是通过对如上确定的DNA序列进行翻译后推定的。因此,正如本领域对于任何由这种自动测序方法确定的DNA序列所知晓的,此处所确定的任何核苷酸序列都有可能存在误差。通过自动测序方法测得的核苷酸序列与被测DNA分子实际的核苷酸序列之间典型地为至少约90%,更典型地至少约95%到至少约99.9%相同。实际的序列可通过本领域已知的其他方法包括人工DNA测序方法进行更精确的测定。如本领域所公知的与实际的序列相比,在所确定的核苷酸序列中单一的插入或缺失将引起核苷酸序列翻译时的移码,由此从该插入或缺失点开始,推定由所确定的核苷酸序列编码的氨基酸序列将与被测序的DNA分子实际编码的氨基酸序列完全不同。
本领域的技术人员能够鉴定此种被错误鉴定的碱基并知道如何来纠正这种错误。
核酸片段,探针和引物本发明的核酸分子可包含如SEQ ID NO1,SEQ ID NO2,SEQID NO3,SEQ ID NO4,SEQ ID NO5,SEQ ID NO6,SEQ ID NO7,SEQ ID NO8,SEQ ID NO9,SEQ ID NO10,SEQ ID NO11或SEQ ID NO12所示核酸序列的一部分或片段,例如可用作探针或引物的片段或编码本发明蛋白的一部分的片段。由克隆α-淀粉酶基因和cDNA确定的核苷酸序列可用于制备探针和引物,所设计的探针和引物用于鉴定和/或克隆其他α-淀粉酶家族成员,以及其他物种中的同源物。所述的探针/引物典型地包含基本上纯化的寡核苷酸,所述的寡核苷酸典型地包含如下的核苷酸序列的区域,该核苷酸序列区域可与如SEQ ID NO1,SEQ ID NO2,SEQ ID NO3,SEQ ID NO4,SEQ IDNO5,SEQ ID NO6,SEQ ID NO7,SEQ ID NO8,SEQ ID NO9,SEQ ID NO10,SEQ ID NO11或SEQ ID NO12所示的核苷酸序列或其功能等同物的至少约12或15,优选约18或20,优选约22或25,更优选约30,35,40,45,50,55,60,65,或75或更多的连续核苷酸优选在高度严格条件下杂交。
基于本申请所提供的核苷酸序列的探针可用于检测例如其他生物中编码相同或同源蛋白的转录物或基因组序列。在优选的实施方案中,上述探针进一步包含与其相附着的标记基团,例如所述的标记基团可以是放射性同位素,荧光化合物,酶或酶辅因子。这种探针还可作为诊断试剂盒的一部分来鉴定表达α-淀粉酶的细胞。
同一性和同源性术语“同源性”和“百分比同一性”在此是可以互换使用的。针对本发明的目的进行如下定义为确定两氨基酸序列或两核酸序列的百分比同一性,为达到最佳比较目的对两序列进行比对(例如,为与第二氨基酸序列或核酸序列进行最佳比对,可向第一氨基酸或核酸序列的序列中引入缺口(gaps))。然后在相应的氨基酸位置或核苷酸位置进行氨基酸残基或核苷酸的对比。当第一个序列中的某个位置被与第二个序列相应位置相同的氨基酸残基或核苷酸所占据,则两分子在该位置上是同一的。两序列间的百分比同一性是两序列共有的同一位置数的函数(即,%同一性=同一位置的数目/位置的总数(即,相重叠的位置)x100)。优选地,两序列长度相同。
本领域的技术人员可以了解,有几种不同的计算机程序用于确定两序列之间的同源性。例如,两序列间的序列对比和百分比同一性的确定可通过数学算法来完成。在优选的实施方案中两氨基酸序列之间的百分比同一性是利用Needleman和Wunsch(J.Mol.Biol.(48)444-453(1970))算法确定的,该算法被引入了GCG软件包中的GAP程序(从前可由http//www.gcg.com获得,现在的网址是http//www.accelrys.com),利用Blossom 62矩阵或PAM250矩阵,缺口权数(gapweight)16,14,12,10,8,6,或4和长度权数(length weight)1,2,3,4,5,或6。本领域的技术人员可以理解,所有这些不同的参数将获得稍有不同的结果,但使用不同的算法得出的两序列间的大体百分比同一性不会显著改变。
在另一个实施方案中两核苷酸序列之间的百分比同一性是利用GCG软件包中的GAP程序(从前可由http//www.gcg.com获得,现在的网址是http//www.accelrys.com),应用NWSgapdna.CMP矩阵确定的,缺口权数40,50,60,70,或80,长度权数1,2,3,4,5,或6。在另一个实施方案中,两氨基酸或核苷酸序列的百分比同一性是利用E.Meyers和W.Miller算法(CABIOS,411-17(1989)确定的,该算法被引入了ALIGN程序(2.0版本)(可从http//vega.igh.cnrs.fr/bin/align-guess.cgi获得),使用PAM120权数残基表,缺口长度罚分为12而缺口罚分为4。
本发明的核酸和蛋白序列还可以用作″查询序列″在公共数据库中检索,例如鉴定其他家族成员或相关序列。这种检索可以利用Altschul,等(1990)J.Mol.Biol.215403-10中所述的NBLAST和XBLAST程序(2.0版本)进行。BLAST核苷酸检索可应用NBLAST程序进行,得分=100,字长=12以获得与本发明的核酸分子同源的核苷酸序列。BLAST蛋白检索可利用XBLAST程序进行,得分=50,字长=3,以获得与本发明的蛋白分子同源的氨基酸序列。为获得带缺口的比对以达到比较的目的,可以应用如Altschul等,(1997)Nucleic Acids Res.25(17)3389-3402中所述的Gapped BLAST。当应用BLAST和GappedBLAST程序时可使用各程序(例如,XBLAST和NBLAST)中的默认参数,参见http//www.ncbi.nlm.nih.gov。
杂交此处所用的术语″杂交″旨在描述杂交和洗涤的条件,在该条件下核苷酸序列间在至少约50%,至少约40%,至少约70%,更优选至少约80%,更优选至少约85%到90%,更优选至少95%同源的情况下典型地保持彼此杂交。
这种杂交条件的一个优选但非限定性的例子是在6X氯化钠/柠檬酸钠(SSC)中在约45℃下杂交,然后在1 X SSC,0.1%SDS中于50℃优选55℃,优选60℃,更优选65℃下洗涤一或多次。
高度严格条件包括,例如在68℃、5x SSC/5x Denhardt溶液/1.0%SDS条件下杂交,在0.2x SSC/0.1%SDS中于室温下洗涤。或者洗涤可在42℃下进行。
本领域的技术人员了解在什么情况下应用严格和高度严格的杂交条件。有关这种条件的其他指导在本领域容易得到,例如Sambrook等,1989,Molecular Cloning,A Laboratory Manual,Cold SpringHarbor Press,N.Y.;和Ausubel等(编),1995,Current Protocols inMolecular Biology,(John Wiley & Sons,N.Y.)。
当然,仅与poly A序列(例如,mRNA 3′末端的poly(A)序列片段)或互补的一段T(或U)残基杂交的多核苷酸不包括在用于特异性地与本发明的核酸的一部分杂交的本发明多核苷酸范围内,因为这种多核苷酸可与任意含有poly(A)片段或其互补片段的核酸分子(例如,事实上任何双链cDNA克隆)杂交。
由其他生物体中获得全长DNA在典型的方法中,可筛选从其他生物如丝状真菌,特别是曲霉菌菌种构建的cDNA文库。
例如,可通过Northern印迹分析从曲霉菌菌株中筛选同源的多核苷酸。在检测与本发明的多核苷酸同源的转录物时,可利用本领域技术人员已知的标准技术通过从合适的菌株中分离的RNA构建cDNA文库。或者利用可与本发明的多核苷酸杂交的探针筛选总基因组DNA文库。
例如,可利用根据此处公开的核苷酸序列设计的两个简并的寡核苷酸引物库通过PCR分离同源基因序列。
反应的模板可以是由已知或怀疑可表达本发明的多核苷酸的菌株制备的mRNA通过反转录所得的cDNA。可将PCR产物进行亚克隆并通过测序确定所扩增的序列代表新α-淀粉酶核酸序列或其功能等同物的序列。
然后可通过多种已知的方法利用所得的PCR片段分离全长cDNA克隆。例如,可对扩增片段进行标记,用于筛选噬菌体或粘粒cDNA文库。或者,所述的标记片段还可以用于筛选基因组文库。
也可利用PCR技术从其他生物中分离全长的cDNA序列。例如,通过标准方法从合适的细胞或组织来源中分离RNA。对该RNA进行反转录,利用特异于扩增片段最5’末端的寡核苷酸引物引导第一链合成。
可对所得的RNA/DNA杂合体通过标准的末端转移酶反应进行″加尾″(例如,用鸟嘌呤),用RNase H消化杂合体,然后引导第二链合成(例如用poly-C引物)。由此可易于分离出扩增片段上游的cDNA序列,有用的克隆策略综述,参见例如Sambrook等,出处同上;和Ausubel等,出处同上。
载体本发明的另一方面涉及载体,优选表达载体,包含编码本发明的蛋白或其功能等同物的核酸。此处所述的术语″载体″指能转运另一与其相连的核酸的核酸分子。一种类型的载体是″质粒″,指环状的双链DNA环,可向其中连接其他DNA片段。另一种类型的载体是病毒载体,其他的DNA片段可连接到病毒基因组中。特定的载体可在其所导入的宿主细胞中自主复制(例如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)。其他的载体(例如,非-附加型哺乳动物载体)在其进入宿主细胞后整合入到宿主细胞的基因组中,其后随宿主基因组一起复制。而且,某些载体还可以指导与其可操作连接的基因的表达。这种载体在此称为″表达载体″。一般而言,在重组DNA技术中所用的表达载体通常是质粒形式。鉴于质粒是最常用的载体形式,此处术语″质粒″和″载体″可互换使用。但本申请试图包括可起到同等作用的其他的表达载体形式,如病毒载体(例如,复制缺陷型反转录病毒,腺病毒和腺伴随病毒)。
本发明的重组表达载体包括以适合核酸在宿主细胞中表达的形式存在的本发明的核酸,指重组表达载体包含一个或多个根据表达所用的宿主细胞选择的调节序列,这些调节序列与待表达的核酸序列可操作地连接。在重组表达载体中″可操作地连接″是指所感兴趣的核苷酸序列以可使该核苷酸序列表达(例如,在体外转录/翻译系统中或在载体被引入宿主细胞时在宿主细胞中)的方式与调节序列相连。术语″调节序列″指包括启动子、增强子和其他表达调控元件(例如,多腺苷酸化信号)。这些调节序列在下述文献中有描述,例如,Goeddel;GeneExpression TechnologyMethods in Enzymology 185,Academic Press,San Diego,CA(1990)。调节序列包括那些在多种类型的宿主细胞中指导核苷酸序列组成型表达的调节序列和仅在特定宿主细胞中指导核苷酸序列表达的序列(例如组织特异性调节序列)。本领域的技术人员可以理解,表达载体的设计可依赖于下述因素,即待转化宿主细胞的选择,所需蛋白表达水平等等。本发明的表达载体可引入到宿主细胞中从而生产由本申请中所述核酸编码的蛋白或肽(例如,α-淀粉酶,突变的α-淀粉酶及其片段、变异体或其功能等同物,融合蛋白等)。
本发明的重组表达载体可设计成在原核或真核细胞中表达α-淀粉酶。例如,本发明的蛋白可在细菌细胞,如大肠杆菌(E coli)、昆虫细胞(利用杆状病毒表达载体)、酵母细胞或哺乳动物细胞中表达。合适的宿主细胞进一步参见Goeddel,Gene Expression TechnologyMethods in Enzymology 185,Academic Press,San Diego,CA(1990)。另外,重组表达载体也可在体外进行转录和翻译,例如利用T7启动子调节序列和T7聚合酶。
在本发明中有用的表达载体包括染色体、附加体和病毒衍生的载体,例如由细菌质粒,噬菌体,酵母附加体,酵母染色体元件衍生的载体,病毒例如杆状病毒、乳多空病毒、痘苗病毒、腺病毒、禽痘病毒、假狂犬病病毒和反转录病毒,以及它们相结合所衍生出的病毒,如由质粒和噬菌体的遗传元件衍生出的载体,如粘粒和噬菌粒。
DNA插入物应当与合适的启动子可操作地连接,如噬菌体λ-PL启动子,大肠杆菌lac,trp和tac启动子,SV40早期和晚期启动子和反转录病毒LTRs的启动子等等。其他合适的启动子是本领域的技术人员所熟悉的。在特定的实施方案中优选可以指导淀粉酶在丝状真菌中高水平表达的启动子。这种启动子是本领域已知的。所述的表达构建体可包含转录起始、终止位点和在转录的区域中包含用于翻译的核糖体结合位点。由该构建体表达的成熟转录物的编码部分包含位于起始处的翻译起始AUG和位于待翻译多肽末端合适位置处的终止密码子。
载体DNA可通过常规的转化或转染技术引入原核或真核细胞中。此处所用的术语″转化″和″转染″是指多种本领域公认的将外源核酸(例如,DNA)导入宿主细胞的技术,包括磷酸钙或氯化钙共沉淀法,DEAE-葡聚糖介导的转染,转导,感染,脂质转染,阳离子脂质介导的转染或电穿孔。合适的转化或转染宿主细胞的方法参见Sambrook,等(Molecular CloningA Laboratory Manual,2nd,ed.Cold SpringHarbor Laboratory,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,NY,1989),Davis等,Basic Methods in MolecularBiology(1986)以及其他实验操作手册。
对于哺乳动物细胞稳定转染,已知取决于所用的表达载体和转染技术,只有一小部分细胞可将外源DNA整合到自己的基因组中。为鉴定和筛选这些整合体,通常将编码可选择的标记(如抗生素抗性)的基因与感兴趣的基因一起引入宿主细胞。优选的可选择标记包括那些可赋予药物抗性的,如G418,潮霉素和氨甲喋呤。编码可选择标记的核酸可于与编码本发明蛋白的同一个载体中引入宿主细胞,也可以在单独的载体上引入宿主细胞。被所引入的核酸稳定转染的细胞可通过药物筛选进行鉴定(例如掺入有筛选标记基因的细胞可以存活而其他细胞不能存活)。
在原核生物中表达蛋白通常利用包含指导融合或非-融合蛋白表达的组成型或诱导型启动子的载体在大肠杆菌中进行。融合载体向在其中编码的蛋白,例如向重组蛋白的氨基末端添加多个氨基酸。这种融合载体典型地用于三种目的1)增加重组蛋白的表达;2)提高重组蛋白的溶解度;和3)作为亲和纯化的配基辅助重组蛋白的纯化。通常,在融合表达载体中,于融合部分与重组蛋白的连接处引入蛋白水解切割位点,以便于在融合蛋白纯化后将重组蛋白与融合部分分离。这种酶及其相关的识别序列包括Xa因子,凝血酶和肠激酶。
如上所述,表达载体优选地包含选择标记,这种选择标记包括用于真核细胞培养物的二氢叶酸还原酶或新霉素抗性和用于大肠杆菌和其他细菌培养的四环素或氨苄西林抗性。合适的宿主的代表性的例子包括细菌细胞,如大肠杆菌,链霉菌和鼠伤寒沙门氏菌(Salmonellatyphimurium);真菌细胞,如酵母;昆虫细胞,如果蝇S2和草地夜蛾Sf9;动物细胞,如CHO,COS和Bowes黑素瘤;以及植物细胞。上述宿主细胞的适宜培养基和培养条件是本领域已知的。
优选用于细菌的载体有pQE70,pQE60和PQE-9,可购自Qiagen;pBS载体,Phagescript载体,Bluescript载体,pNH8A,pNH16A,pNH18A,pNH46A,可购自Stratagene;和ptrc99a,pKK223-3,pKK233-3,pDR540,pRIT5,可购自Pharmacia。优选的真核载体有PWLNEO,pSV2CAT,pOG44,pZT1和pSG,可购自Stratagene;和pSVK3,pBPV,pMSG和pSVL,可购自Pharmacia。其他合适的载体对本领域的技术人员而言是显而易见的。
可用于本发明的已知细菌启动子包括大肠杆菌lacl和lacZ启动子,T3和T7启动子,gpt启动子,λ-PR,PL启动子和trp启动子,HSV胸苷激酶启动子,SV40早期和晚期启动子,反转录病毒LTR启动子,如劳氏肉瘤病毒(″RSV″)的启动子,和金属硫蛋白启动子,如小鼠金属硫蛋白-I启动子。
可通过向载体中插入增强子序列来提高编码本发明多肽的DNA在高等真核生物中转录。增强子是DNA的顺式作用元件,通常为约10到300bp,其在给定的宿主细胞类型中可提高启动子的转录活性。增强子的例子包括SV40增强子,其定位于迟于复制起点一侧100到270bp,巨细胞病毒早期启动子增强子,位于迟于复制起点一侧的多形瘤增强子和腺病毒增强子。
为使翻译后的蛋白分泌到内质网腔、周质间隙或胞外环境中,可将合适的分泌信号掺入到所表达的多肽中。所述的信号可以是多肽内源性的也可以是异源信号。
所述的多肽可以以经修饰的形式表达,如融合蛋白,并且不仅可以包括分泌信号还可以包括额外的异源功能区域。因此,例如可在所述多肽的N-末端添加附加的氨基酸区域,特别是带电氨基酸,以提高多肽在纯化过程中或后续操作和贮存过程中在宿主细胞中的稳定性和持久性。此外还可以向所述的多肽中添加肽部分以便于多肽纯化。
本发明的多肽本发明提供具有下述氨基酸序列的分离的多肽,所述氨基酸序列选自SEQ ID NO13,SEQ ID NO14,SEQ ID NO15,SEQ ID NO16,SEQ ID NO17或SEQ ID NO18,可通过在合适的宿主中表达下述多核苷酸而获得的氨基酸序列,所述多核苷酸为SEQ ID NO1,SEQ ID NO2,SEQ ID NO3,SEQ ID NO4,SEQ ID NO5,SEQ IDNO6,SEQ ID NO7,SEQ ID NO8,SEQ ID NO9,SEQ ID NO10,SEQ ID NO11或SEQ ID NO12。此外包含上述多肽的功能等同物的肽或多肽也在本发明的范围内。所述的多肽统统包含在术语“本发明的多肽”中。
术语″肽″和″寡肽″被认为是同义词(如普遍所公认的那样),在本申请中可互换使用,根据上下文需要用于表示由肽键偶联的至少两个氨基酸的链。此处所用的″多肽″一词是指包含7个氨基酸残基以上的链。本申请中所有的寡肽和多肽结构式或序列均从左向右,由氨基端向羧基端书写,此处所用的氨基酸一字母密码是本领域所公知的,参见Sambrook,等(Molecular CloningA Laboratory Manual,2nd,ed.Cold Spring Harbor Laboratory,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,NY,1989)。
″分离的″多肽或蛋白是指脱离了其天然环境的多肽或蛋白。例如,对本发明的目的而言,在宿主细胞中表达的重组产生的多肽和蛋白即被认为是分离的,如同利用任何适当技术基本上纯化的天然或重组的多肽,所述技术例如在Smith和Johnson,Gene 6731-40(1988)中公开的一步纯化法。
本发明的淀粉酶可通过已知的方法由重组细胞培养物中回收并纯化,所述方法包括硫酸铵或乙醇沉淀法,酸抽提法,阴离子或阳离子交换层析,磷酸纤维素层析,疏水性相互作用层析,亲和层析,羟磷灰石层析和凝集素层析。最优选,利用高效液相色谱(″HPLC″)进行纯化。
本发明的多肽包括天然纯化的产物,利用化学合成方法合成的产物以及利用原核和真核生物宿主通过重组技术获得的产物,所述的宿主包括例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞。根据重组生产方法中所用的宿主,本发明的多肽可能是糖基化的也可能是非糖基化的。此外,在有些情况下由于宿主细胞介导的加工过程,本发明的多肽还可以包括起始的经修饰的甲硫氨酸残基。
蛋白片段本发明还涉及本发明多肽的生物活性片段。
本发明多肽的生物活性片段包括含有与所述蛋白的氨基酸序列(例如SEQ ID NO13,SEQ ID NO14,SEQ ID NO15,SEQ ID NO16,SEQ ID NO17或SEQ ID NO18的氨基酸序列)足够同一或由所述蛋白氨基酸序列衍生的氨基酸序列的多肽,其包括少于全长蛋白的氨基酸,表现出相应全长蛋白的至少一种生物活性。典型的,生物活性片段包含具有α淀粉酶的至少一种活性的结构域或基序。本发明蛋白的生物活性片段可以是多肽,例如,具有10,25,50,100或更多个氨基酸的长度。而且,可通过重组技术制备其他的生物活性部分(其中该蛋白其它区域缺失),并评估天然形式本发明蛋白的一种或多种生物活性。
本发明还涉及编码上述α-淀粉酶生物活性片段的核酸片段。
融合蛋白本发明的蛋白或其功能等同物,例如,其生物活性部分可与非α-淀粉酶多肽(例如,异源氨基酸序列)可操作地连接以形成融合蛋白。此处所用的″嵌合蛋白”或”融合蛋白″包含与非α-淀粉酶多肽可操作地连接的α-淀粉酶多肽。在优选的实施方案中融合蛋白包含本发明蛋白的至少一个生物活性片段。在此上下文中术语″可操作地连接″是指α-淀粉酶和非-α-淀粉酶在α-淀粉酶的N-末端或C-末端彼此框内融合。
例如,在一个实施方案中,所述的融合蛋白是GST-融合蛋白,其中α-淀粉酶序列与GST序列的C-末端融合。这种融合蛋白可易于使本发明的蛋白得到纯化。在另一个实施方案中,所述的融合蛋白包含在其N-末端与异源信号序列融合的本发明的蛋白。在特定的宿主细胞(例如哺乳动物和酵母宿主细胞)中可通过异源信号序列提高本发明蛋白的表达和/或分泌。
另一个例子中,杆状病毒包膜蛋白的gp67分泌序列可用作异源信号序列(Current Protocols in Molecular Biology,Ausubel等,编,JohnWiley & Sons,1992)。其他真核生物异源信号序列的例子包括蜂毒肽和人胎盘碱性磷酸酶的分泌序列(Stratagene;La Jolla,California)。在又一个实施例中,有用的原核异源信号序列包括phoA分泌信号(Sambrook等,出处同上)和蛋白A分泌信号(Pharmacia Biotech;Piscataway,New Jersey)。
分泌信号可使分泌和分离本发明的蛋白或多肽易于进行。信号序列典型地以疏水氨基酸核心为特征,所述序列通常在分泌过程中经一或多次切割由成熟蛋白中去除。这种信号肽包含加工位点使其在经过分泌途径的时候由成熟蛋白上切割去除。信号序列指导蛋白分泌,如从转化入了表达载体的真核宿主细胞中分泌,信号序列随后或同时被切割。此后,易于通过本领域公认的方法将蛋白从胞外介质中纯化出来。或可利用一种易化纯化的序列,如具有GST结构域,将信号序列与所感兴趣的蛋白连接起来。由此,例如,编码所述多肽的序列可与标记序列如编码肽的序列融合,其可使融合多肽易于纯化。在本发明这一方面的优选的实施方案中,所述的标记序列是六组氨酸肽,如pQE载体(Qiagen,Inc.)所提供的标记物,许多标记序列是可商购的。如Gentz等,Proc.Natl.Acad.Sci.USA 86821-824(1989)中所述,六组氨酸使融合蛋白便于纯化。HA标记物是另一种对纯化有用的肽,其相应于由流感血细胞凝集素蛋白衍生的表位,参见Wilson等,Cell37767(1984)。
优选地,通过标准的重组DNA技术生产包含本发明蛋白的嵌合或融合蛋白。例如,利用常规的技术将编码不同多肽序列的DNA片段进行框内连接,如采用平末端或交错末端用于连接,通过限制酶消化以提供合适的末端,酌情将粘性末端补平,用碱性磷酸酶处理以避免不需要的连接,和进行酶促连接。在另一个实施方案中融合基因可通过常规的技术,包括自动DNA合成仪合成。此外基因片段的PCR扩增可利用锚定引物来进行,所述的引物可在两连续的基因片段间产生互补的突出端,然后退火、再扩增以产生嵌合基因序列(参见例如,CurrentProtocols in Molecular Biology,编者Ausubel等John Wiley & Sons1992)。此外,许多已编码了融合部分(如GST多肽)的表达载体是可商购的。可将本发明的核酸克隆到这种表达载体中使融合部分与融合部分框内相连以表达包含本发明蛋白的融合蛋白。
功能等同物此处所用的术语″功能等同物″和″功能性变异体″是可互换使用的。此处所述的编码α-淀粉酶的DNA片段的功能等同物是分离的DNA片段,其编码表现出此处所定义的黑曲霉淀粉酶特定功能的多肽。本发明多肽的功能等同物表现出此处所定义的黑曲霉淀粉酶的至少一种功能。因此功能等同物也包含生物活性片段。
功能性蛋白或多肽等同物可仅包含在如SEQ ID NO13,SEQ IDNO14,SEQ ID NO15,SEQ ID NO16,SEQ ID NO17或SEQ IDNO18所示序列中一个或多个氨基酸的保守置换,或非-必需氨基酸的置换、插入或缺失。相应地,非-必需氨基酸是可在SEQ ID NO13,SEQ ID NO14,SEQ ID NO15,SEQ ID NO16,SEQ ID NO17或SEQ ID NO18中改变而基本上不改变其生物功能的残基。例如推测在本发明的蛋白间保守的氨基酸残基是特别不能被改变的。而且,在本发明的蛋白与其他淀粉酶之间保守的氨基酸残基也不太可能被改变。
术语″保守置换″是指一种氨基酸残基被具有类似侧链的氨基酸残基替代的置换。这些氨基酸家族是本领域公知的,包括具有碱性侧链(例如赖氨酸,精氨酸和组氨酸),酸性侧链(例如天冬氨酸,谷氨酸),不带电的极性侧链(例如,甘氨酸,天冬酰胺,谷氨酰胺,丝氨酸,苏氨酸,酪氨酸,半胱氨酸),非-极性侧链(例如,丙氨酸,缬氨酸,亮氨酸,异亮氨酸,脯氨酸,苯丙氨酸,甲硫氨酸,色氨酸),β支链侧链(例如,苏氨酸,缬氨酸,异亮氨酸)和芳香侧链(例如,酪氨酸,苯丙氨酸,色氨酸,组氨酸)的氨基酸。
功能性核酸等同物可典型地包含沉默突变或不改变所编码多肽生物功能的突变。因此,本发明提供核酸分子,其编码包含对特定生物活性不是必需的氨基酸残基的改变的蛋白。这种蛋白的氨基酸序列与SEQ ID NO13,SEQ ID NO14,SEQ ID NO15,SEQ ID NO16,SEQ ID NO17或SEQ ID NO18所示不同,但保持至少一种生物活性。在一个实施方案中所述分离的核酸分子包含编码下述蛋白的核苷酸序列,所述蛋白包含与选自SEQ ID NO13,SEQ ID NO14;SEQID NO15,SEQ ID NO16,SEQ ID NO17或SEQ ID NO18的氨基酸序列具有至少约40%,65%,70%,75%,80%,85%,90%,95%,96%,97%,98%,99%或更高同源性的基本上同源的氨基酸序列。
例如,有关如何制备表型沉默的氨基酸置换的指导参见Bowie,J.U.等,Science 2471306-1310(1990),其中,作者描述了两种主要的研究氨基酸序列对改变的耐受性的方法。第一种方法依赖于进化过程,其中突变被自然选择接受或摒弃。第二种方法利用遗传工程的方法向克隆基因的特定位点引入氨基酸改变,通过选择或筛选鉴定保持功能的序列。如作者所述,这些研究揭示出蛋白可惊人地耐受氨基酸置换。作者进一步指出,哪些改变有可能在蛋白的特定位点是容许的。例如,大多数包埋的氨基酸残基需要非-极性的侧链,而几乎没有表面侧链的特征在通常状态下是保守的。其他这种表型沉默置换参见Bowie等,出处同上,及其中所引用的参考文献。
编码一种与具有选自下组的氨基酸序列的蛋白同源的蛋白的分离的核酸分子可通过下述方法制备,上述的氨基酸序列组由SEQ ID NO13,SEQ ID NO14,SEQ ID NO15,SEQ ID NO16,SEQ ID NO17或SEQ ID NO18组成;这种方法是向具有选自下组的核苷酸序列的编码核苷酸序列中引入一个或多个核苷酸的置换,添加或缺失,从而向所编码的蛋白中引入了一个或更多氨基酸的置换,缺失或插入,上述的核苷酸序列组由SEQ ID NO1,SEQ ID NO2,SEQ ID NO3,SEQ ID NO4,SEQ ID NO5或SEQ ID NO6组成或由SEQ ID NO7,SEQ ID NO8,SEQ ID NO9,SEQ ID NO10,SEQ ID NO11或SEQ ID NO12组成。这种突变可通过标准的技术引入,如定点诱变和PCR-介导的诱变。
术语″功能等同物″还包括此处所提供的黑曲霉α-淀粉酶的直向同源物。黑曲霉α-淀粉酶的直向同源物是可从其他菌株或菌种中分离到的蛋白,其具有类似的或相同的生物活性。这种直向同源物可容易地鉴定为包含与选自下组的氨基酸序列基本上同源的氨基酸序列,所述的组由SEQ ID NO13,SEQ ID NO14,SEQ ID NO15,SEQ IDNO16,SEQ ID NO17或SEQ ID NO18组成。
此处所定义的术语″基本上同源″是指第一氨基酸或核苷酸序列包含足够或最少数目的与第二氨基酸或核苷酸序列同一或等同(例如具有类似的侧链)的氨基酸或核苷酸,由此第一和第二氨基酸或核苷酸序列具有共同的结构域。例如,此处定义包含共同结构域的具有约40%,优选65%,更优选70%,更优选75%,80%,85%,90%,95%,96%,97%,98%或99%或更高同一性的氨基酸或核苷酸序列是充分同一的。
同样编码其他α-淀粉酶家族成员的核酸,其由此具有不同于下组中序列的核苷酸序列,也在本发明的范围内,所述的组由SEQ ID NO1,SEQ ID NO2,SEQ ID NO3,SEQ ID NO4,SEQ ID NO5或SEQ ID NO6或由SEQ ID NO7,SEQ ID NO8,SEQ ID NO9,SEQ ID NO10,SEQ ID NO11或SEQ ID NO12组成。此外,编码来自不同物种的α-淀粉酶的核酸具有不同于下组中序列的核苷酸序列,也在本发明的范围内,所述的组由SEQ ID NO1,SEQ ID NO2,SEQ ID NO3,SEQ ID NO4,SEQ ID NO5或SEQ ID NO6组成,或由SEQ ID NO7,SEQ ID NO8,SEQ ID NO9,SEQ ID NO10,SEQ ID NO11或SEQ ID NO12组成。
相应于本发明DNA的变异体(例如天然等位基因变异体)以及同源物的核酸分子可根据它们与此处所公开的核酸的同源性,利用此处所公开的cDNA或其合适的片段作为杂交探针依照标准的杂交技术,优选在高度严格的杂交条件下分离出来。
除了此处所公开的黑曲霉序列的天然存在的等位基因变异体之外,本领域的技术人员可以了解,可以通过突变向选自下组的核苷酸序列中引入改变,所述的核苷酸序列组由SEQ ID NO1,SEQ ID NO2,SEQ ID NO3,SEQ ID NO4,SEQ ID NO5或SEQ ID NO6组成或由SEQ ID NO7,SEQ ID NO8,SEQ ID NO9,SEQ ID NO10,SEQ ID NO11或SEQ ID NO12组成,由此造成α-淀粉酶蛋白的氨基酸序列发生改变但该蛋白的功能基本上不发生改变。
在本发明的另一个方面中,提供了经改进的α-淀粉酶。经改进的α-淀粉酶是至少一种生物学活性得以改进的蛋白。这种蛋白可通过沿全部或部分编码序列随机引入突变来获得,例如通过饱和诱变,所得的突变体可通过重组表达并筛选其生物活性。例如,现有技术中提供了测定淀粉酶活性的标准试验方法,由此易于筛选出经改进的蛋白。
在一个优选的实施方案中α-淀粉酶具有选自下组中氨基酸序列的氨基酸序列,所述的组由SEQ ID NO13,SEQ ID NO14,SEQ ID NO15,SEQ ID NO16,SEQ ID NO17或SEQ ID NO18组成。在另一个实施方案中α-淀粉酶与选自下组的氨基酸序列基本上同源,所述的组由SEQ ID NO13,SEQ ID NO14,SEQ ID NO15,SEQ ID NO16,SEQ ID NO17或SEQ ID NO18组成,且该酶保持了具有下述氨基酸序列的多肽的至少一种生物学活性,所述的氨基酸序列选自SEQID NO13,SEQ ID NO14,SEQ ID NO15,SEQ ID NO16,SEQ IDNO17或SEQ ID NO18,然而由于如上所述的天然变异或诱变导致氨基酸序列有所差异。
在又一个优选的实施方案中,α-淀粉酶具有由能与具有下述核苷酸序列的核酸优选在高度严紧杂交条件下杂交的分离的核酸片段编码的氨基酸序列,所述核苷酸序列选自SEQ ID NO1,SEQ ID NO2,SEQ ID NO3,SEQ ID NO4,SEQ ID NO5或SEQ ID NO6或选自SEQ ID NO7,SEQ ID NO8,SEQ ID NO9,SEQ ID NO10,SEQID NO11或SEQ ID NO12。
因此,本发明的α-淀粉酶是分离的蛋白,其包含与选自下组的氨基酸序列至少约40%,65%,70%,75%,80%,85%,90%,95%,96%,97%,98%,99%或更高同源的氨基酸序列,所述的组由SEQ ID NO13,SEQ ID NO14,SEQ ID NO15,SEQ ID NO16,SEQ ID NO17或SEQ ID NO18组成,上述的蛋白保留具有下述氨基酸序列的多肽的至少一种功能活性,所述的氨基酸序列选自SEQ ID NO13,SEQID NO14,SEQ ID NO15,SEQ ID NO16,SEQ ID NO17或SEQID NO18。
本发明蛋白的功能等同物还可通过例如筛选本发明蛋白的突变体例如截短突变体的组合文库的淀粉酶活性进行鉴定。在一个实施方案中,通过核酸水平上的组合诱变产生了多样化的变异体文库。多样化的变异体文库可这样产生,例如,将合成寡核苷酸的混合物进行酶连接入基因序列,由此潜在蛋白序列的简并组可作为单独的多肽表达,或作为一组更大的融合蛋白表达(例如噬菌体展示)。有多种方法可用于由简并的寡核苷酸序列制备本发明多肽潜在变异体的文库。合成简并的寡核苷酸的方法是本领域已知的(参见例如,Narang(1983)Tetrahedron 393;Itakura等(1984)Annu.Rev.Biochem.53323;Itakura等(1984)Science 1981056;Ike等(1983)Nucleic Acid Res.11477)。
此外,本发明多肽的编码序列的片段文库可用于制备多样化的多肽群,其可用于筛选随后的变异体待选物。例如,编码序列片段文库可通过下述方式制备控制在每分子仅出现约一次切口的条件下,用核酸酶处理感兴趣编码序列的双链PCR片段,使上述的双链DNA变性,再使DNA复性以形成可包含来自不同切口产物的有义/反义配对的双链DNA,用S1核酸酶处理来去除新形成双链中的单链部分,将所得的片段文库与表达载体连接。通过这种方法可制备表达文库,该文库编码感兴趣蛋白的不同大小的内部片段和N-末端片段。
有几种筛选通过截短产物点突变制备的组合文库基因产物和筛选cDNA文库以获得具有选定特性的基因产物的方法是本领域已知的。经得起高通量分析的用于筛选大基因文库的最广泛应用的技术典型地包括将基因文库克隆到可复制的表达载体中,用所得的载体文库转化合适的细胞,在下述条件下表达组合基因,所述条件指所需活性的检测有助于分离编码其产物待检测的基因的载体。循环整体诱变(Recursive ensemble mutagenesis(REM)),一种提高文库中功能性突变体频率的技术,可与筛选实验相结合用于鉴定本发明蛋白的变异体(Arkin and Yourvan(1992)Proc.Natl.Acad.Sci.USA 897811-7815;Delgrave等(1993)Protein Engineering 6(3)327-331)。
在给定的群体中可能存在DNA序列多态性,其可导致α-淀粉酶氨基酸序列发生改变,这对本领域的技术人员而言是显而易见的。这种遗传多态性可存在于不同群体的细胞中或由于天然等位基因变异而存在于一个群体中。等位基因变异体也包括功能等同物。
本发明的多核苷酸的片段也包括不编码功能性多肽的多核苷酸。这种多核苷酸可行使探针或在PCR反应中引物的功能。
本发明的核酸无论编码功能性多肽还是非-功能性多肽均可用作杂交探针或聚合酶链式反应(PCR)引物。本发明的不编码具有α-淀粉酶活性多肽的核酸分子的用途包括,特别是(1)从cDNA文库,如从除黑曲霉以外的其他生物体中分离编码α-淀粉酶的基因或其等位基因变异体;(2)对中期染色体铺展(spreads)进行原位杂交(例如FISH)以提供α-淀粉酶基因的精确染色体定位,参见Verma等,HumanChromosomesa Manual of Basic Techniques,Pergamon Press,NewYork(1988);(3)Northern印迹分析以检测α-淀粉酶mRNA在特定组织和/或细胞中的表达;和4)可用作诊断工具的探针和引物以分析在给定生物(如组织)样品中是否存在可与α-淀粉酶探针杂交的核酸。
获得α-淀粉酶基因或cDNA的功能等同物的方法也包含在本发明的范围内。这种方法需要获得标记探针,包括编码全部或部分具有下述氨基酸序列的序列的分离的核酸,所述氨基酸序列选自SEQ ID NO13,SEQ ID NO14,SEQ ID NO15,SEQ ID NO16,SEQ ID NO17或SEQ ID NO18或其变异体;在可使所述探针与文库中的核酸杂交的条件下,用标记的探针筛选核酸片段文库,由此形成核酸双链,和由任何标记双链中的核酸片段制备全长基因序列以获得与α-淀粉酶基因相关的基因。
在一个实施方案中本发明的核酸与SEQ ID NO1,SEQ ID NO2,SEQ ID NO3,SEQ ID NO4,SEQ ID NO5 SEQ ID NO6,SEQ IDNO7,SEQ ID NO8,SEQ ID NO9,SEQ ID NO10,SEQ ID NO11或SEQ ID NO12所示核酸序列或其互补序列有至少40%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或更高的同源性。
在另一个优选的实施方案中,本发明的多肽与SEQ ID NO13,SEQ ID NO14,SEQ ID NO15,SEQ ID NO16,SEQ ID NO17或SEQ ID NO18所示的氨基酸序列有至少40%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或更高的序列同源性。
宿主细胞在另一个实施方案中,本发明涉及细胞,例如包含本发明的核酸的经转化宿主细胞或重组宿主细胞。″经转化细胞”或”重组细胞″是指通过重组DNA技术已将本发明的核酸引入其中(或其祖先中)的细胞。包括原核细胞和真核细胞,例如细菌,真菌,酵母等,特别优选的细胞来自丝状真菌,特别是黑曲霉。
可选择宿主细胞,其以特定的所需的方式调节插入序列的表达或修饰和加工基因产物。这种蛋白产物的修饰(例如,糖基化)和加工(例如,切割)可使蛋白具有最佳功能。
不同的宿主细胞具有特有的和具体的机制对蛋白或基因产物进行翻译后加工和修饰。可选择分子生物学和/或微生物学领域技术人员所熟悉的合适的细胞系或宿主系统以确保对所表达的外源蛋白进行正确的和所需的修饰和加工。为此,具有适当加工初级转录物、对基因产物进行糖基化、磷酸化的细胞机制的真核宿主细胞均可使用。这种宿主细胞是本领域已知的。
宿主细胞还包括但不限于哺乳动物细胞系,如CHO,VERO,BHK,HeLa,COS,MDCK,293,3T3,WI38,和脉络丛细胞系。
如果需要,本发明的多肽也可由稳定转染的细胞系制备。许多适于稳定转染哺乳动物细胞的载体均是公众可得到的的,构建这种细胞系的方法也是公知的,例如参见Ausubel等(出处同上)。
抗体本发明进一步包括抗体,如单克隆抗体或多克隆抗体,其可与本发明的α-淀粉酶特异结合。
此处所用的术语″抗体″(Ab)或″单克隆抗体″(Mab)包括可与本发明的蛋白特异结合的完整分子和抗体片段(例如,Fab和F(ab′)2片段)。缺乏完整抗体Fc片段的Fab和F(ab′)2片段更迅速地从循环中清除,并较少有完整抗体的非-特异组织结合(Wahl等,J.Nucl.Med.24316-325(1983))。因此这些片段是优选的。
本发明的抗体可由多种方法中的任意方法制备,例如,可将表达本发明α-淀粉酶或其抗原片段的细胞施用于动物诱导其产生含多克隆抗体的血清。在优选的方法中,制备并纯化本发明的蛋白制剂使其基本上不含天然的污染物。然后将该制剂导入动物以产生比活性更高的多克隆抗血清。在最优选的方法中,本发明的抗体是单克隆抗体(或其α-淀粉酶-结合片段)。这种单克隆抗体可通过杂交瘤技术制备(Kohler等,Nature 256495(1975);Kohler等,Eur.J.ImmunoL 6511(1976);Hammerling等,InMonoclonal Antibodies and T-Cell Hybridomas,Elsevier,N.Y.,pp.563-681(1981))。一般而言,此种方法包括用本发明的蛋白或用表达本发明的蛋白的细胞免疫动物(优选小鼠)。取出经免疫小鼠的脾细胞使其与合适的骨髓瘤细胞系融合。任何合适的骨髓瘤细胞系均可应用于本发明;但优选使用亲本骨髓瘤细胞系(SP2O),其可由Rockville,Maryland美国典型培养物保藏中心获得。融合后将所得的杂交瘤细胞在HAT培养基中选择性培养,然后依照Wands等(Gastro-enterology 80225-232(1981))所述进行有限稀释来克隆。分析通过此种筛选所得的杂交瘤细胞系以鉴定分泌能与α-淀粉酶抗原结合的抗体的克隆。通常,所述多肽可与载体蛋白,如KLH偶联(如Ausubel等所述,出处同上),再与佐剂混合,然后注射到宿主哺乳动物中。
具体说来,可通过注射所感兴趣的多肽免疫多种宿主动物。合适的宿主动物的例子包括兔、小鼠、豚鼠和大鼠。有多种佐剂可用来增强免疫应答,根据宿主的种类,所用的佐剂包括但不限于弗氏佐剂(完全和不完全),矿物凝胶如氢氧化铝,表面活性物质如溶血卵磷脂、复合多元醇、聚阴离子、肽、油乳液、匙孔血蓝蛋白、二硝基酚、BCG(卡介苗)和小棒状杆菌(Corynebacterium parvum)。多克隆抗体是由免疫动物血清所得的异质抗体分子群。
这种抗体可以是任意类别免疫球蛋白,包括IgG,IgM,IgE,IgA,IgD,及其任意的亚类。产生本发明单克隆抗体的杂交瘤可在体内或体外培养。
产生后,可利用标准的技术,如Ausubel等出处同上所述,通过免疫测定,如Western印迹或免疫沉淀分析来检测多克隆或单克隆抗体对本发明的蛋白或其功能等同物的特异识别作用。特异性结合本发明蛋白或其功能等同物的抗体可用于本发明。例如,这种抗体可用于在致病性或非致病性曲霉菌菌株中(例如在曲霉菌抽提物中)通过免疫测定检测本发明的蛋白。
优选利用可能具有抗原性的本发明蛋白的片段(例如以带电残基频率高为标准)来生产本发明的抗体。例如,这种片段可由标准的PCR技术制备,然后将其克隆到pGEX表达载体中(Ausubel等,出处同上)。再在大肠杆菌中表达融合蛋白,依Ausubel等(出处同上)所述用谷胱甘肽琼脂糖亲和基质纯化。需要时可针对每一种蛋白制备几种(例如两或三种)融合体,将每种融合体注射至少两只兔。可通过系列注射生成抗血清,典型地包括至少3次加强注射。典型地,检测抗血清与本发明的重组α-淀粉酶或其功能等同物形成免疫沉淀的能力,以无关的蛋白作为免疫反应特异性的对照。
可选择地,产生单链抗体的技术(U.S.专利4,946,778和4,704,692)也适用于生产针对本发明的蛋白或其功能等同物的单链抗体。制备并筛选噬菌体展示文库的试剂盒是可商购的,如可购自Pharmacia。
此外,特别适用于制备和筛选抗体展示文库的方法和试剂的例子参见例如,美国专利号5,223,409;PCT公开号WO 92/18619;PCT公开号WO 91/17271;PCT公开号WO 20791;PCT公开号WO92/20791;PCT公开号WO 92/15679;PCT公开号WO 93/01288;PCT公开号WO 92/01047;PCT公开号WO 92/09690;PCT公开号WO 90/02809;Fuchs等(1991)BiolTechnology 91370-1372;Hay等(1992)Hum.Antibod.Hybridomas 381-85;Huse等(1989)Science 246;1275-1281;Griffiths等(1993)EMBO J.12725-734。
特异性结合本发明的蛋白或其功能等同物的单克隆和多克隆抗体可用于,例如检测编码本发明的蛋白或其功能等同物的基因在例如另一种曲霉菌菌株中的表达。例如本发明的蛋白易于通过常规的免疫测定从曲霉菌细胞或其抽提物中检测出来。合适的测定的例子包括但不限于Western印迹,ELISAs,放射免疫则定等。
″特异性结合″是指抗体识别并结合特定的抗原,例如本发明多肽的蛋白,但基本上不识别和结合样品中的其他无关分子。
抗体可通过例如亲和色谱法纯化,其中多肽抗原固定于树脂上。
针对本发明多肽的抗体(例如,单克隆抗体)可用于通过标准方法分离所述的多肽,所述方法如亲和色谱法或免疫沉淀法。而且,这种抗体可用于检测蛋白(例如在细胞溶解物或细胞悬液中)以评估多肽表达的丰度和表达方式。所述的抗体也可用于诊断用途,监测细胞或组织中的蛋白水平,作为临床检测方法的一部分,例如确定给定治疗方案的效力,或用于曲霉菌病的诊断。
可将抗体与可检测的物质相偶联以使检测易于进行。可检测的物质的例子包括多种酶,辅基,荧光物质,发光物质,生物发光物质和放射性物质。适合的酶的例子包括辣根过氧化物酶,碱性磷酸酶,β-半乳糖苷酶,或乙酰胆碱酯酶;适当的荧光物质的例子包括伞形酮,荧光素,异硫氰酸荧光素,罗丹明,二氯三嗪基胺荧光素,丹磺酰氯或藻红蛋白;发光材料的例子包括氨基苯二酰一肼;生物发光物质的例子包括萤光素酶,萤光素,及水母发光蛋白,适当的放射性物质的例子包括125I,131I,35S或3H。
抗原性肽所包含的优选表位是定位于蛋白表面的区域,例如亲水性的区域。本发明蛋白的疏水性地区(plots)可用于鉴定亲水区域。
本发明蛋白的抗原性肽包含选自下述氨基酸序列的至少7(优选10,15,20,或30)个连续氨基酸残基,并包括所述蛋白的一种表位,以使所产生的针对上述肽的抗体与该蛋白形成特异性免疫复合物,所述的氨基酸序列选自SEQ ID NO13,SEQ ID NO14,SEQ ID NO15,SEQ ID NO16,SEQ ID NO17或SEQ ID NO18。
包含在所述抗原肽中的优选表位是定位于本发明蛋白表面上的区域,例如亲水区域、疏水区域、α区域、β区域、螺旋区域、转角区域和柔性区域。
免疫测定可利用本领域已知的任何方法定性或定量地确定生物样品中本发明的多肽。基于抗体的技术对于分析生物样品中的特异多肽水平具有特别的优势。
这些方法中由一级抗体(多克隆或单克隆)提供特异识别,二级检测系统可利用荧光,酶或其他偶联的二级抗体。结果获得免疫复合物。
因此,本发明提供一种诊断特定的生物是否受曲霉菌感染的方法,该方法包括下述步骤从所述怀疑受曲霉菌感染的生物中分离生物样品,
将上述生物样品与本发明的抗体反应,检测是否形成了免疫复合物。
也可以提取组织,例如利用尿素和中性去污剂,将蛋白释放出来用于Western-印迹或点/槽(slot)实验。这种技术也可以应用于体液。
其他用于检测本发明蛋白的基于抗体的方法包括,免疫测定如酶联免疫吸附测定(ELISA)和放射免疫测定(RIA)。例如,针对本发明蛋白的特异单克隆抗体可用作免疫吸附剂和酶标探针用于检测和定量本发明的蛋白。样品中存在的特异蛋白的量可参照标准制剂中的量通过线性回归计算机算法计算出来。在另一种ELISA实验中,两种不同的特异性单克隆抗体可用于检测生物液体中的本发明蛋白。在该实验中,一种抗体用作免疫吸附剂而另一种用作酶标探针。
上述的技术基本上可以作为″一步″或″两步″实验进行。所谓″一步″实验包括将本发明的蛋白与固定的抗体接触,不洗,再将混合物与标记的抗体接触。所谓″两步″实验是在将混合物与标记抗体接触前还有洗涤的步骤。其他适宜的常规方法也可以应用。通常希望将实验体系中的一个组分固定在支持物上,从而使体系中的其他组分与该组分接触并易于从样品中去除。
合适的酶标记物包括,例如氧化酶组的标记,其通过与底物反应催化产生过氧化氢。氧化酶标记的活性可通过测定由酶标抗体/底物反应形成的过氧化氢浓度来测定。
除了酶之外,其他合适的标记物包括放射性同位素,如碘(125I,121I),碳(14C),硫(35S),氚(3H),铟(112In)和锝(99mTc),和荧光标记物,比如荧光素和罗丹明,以及生物素。
被检测化合物与本发明的蛋白的特异结合可通过例如在体外将本发明多肽的蛋白可逆或不可逆地固定到底物,例如96-孔聚苯乙烯微滴定板的孔表面上来检测。固定多肽和其他小分子的方法是本领域已知的。例如可用本发明的蛋白包被微滴定板,即将溶液中的多肽(典型地,浓度为0.05-1mg/ml,体积1-100μl)添加到每孔中,在室温到37℃下孵育该微滴定板0.1到36小时。将多余的溶液从板中摇出从而去除未与滴定板结合的多肽,然后用水或缓冲液清洗滴定板(一次或重复)。典型地,所述的多肽包含在水或缓冲液中。再用不含结合多肽的缓冲液清洗滴定板。为封闭板上的游离蛋白结合位点,用与结合多肽无关的蛋白封闭滴定板。例如,300μl浓度为2mg/ml在Tris-HCl中的牛血清白蛋白(BSA)是合适的。适合的底物包括包含确定的交联化学的底物(例如,塑料底物,如聚苯乙烯、苯乙烯或聚丙烯底物,来源于Corning Costar公司(Cambridge,MA),例如)。需要时,珠形颗粒例如珠形琼脂糖颗粒或珠形sepharose颗粒可用作底物。
待测化合物与本发明多肽的结合可通过任意一种本领域已知的方法检测。例如特异抗体可用于免疫测定。需要时,可将抗体进行标记(例如,用荧光物质或放射性同位素)并直接检测(参见,例如West和McMahon,J.Cell Biol.74264,1977)。另外也可以用第二抗体进行检测(例如与抗-AN97抗体的Fc部分结合的标记抗体)。在另外的检测方法中,本发明的蛋白经过标记(例如用放射性同位素、荧光团、发色团等),然后检测标记物。在另一种方法中,本发明的蛋白与可光学检测的蛋白,如绿荧光蛋白(其可在UV灯下检测)形成融合蛋白。在另一种方法中,本发明多肽的蛋白与具有可检测酶活性的酶,如辣根过氧化物酶,碱性磷酸酶,α-半乳糖苷酶或葡萄糖氧化酶共价连接或融合。所有这些酶的编码基因均已被克隆且是本领域技术人员所易于获得的。需要时,所述的融合蛋白可包括抗原,此种抗原可通过常规的方法利用多克隆抗体或单克隆抗体检测及测定。合适的抗原包括酶(例如如辣根过氧化物酶,碱性磷酸酶,α-半乳糖苷酶)和非-酶多肽(例如血清蛋白如BSA和球蛋白,和乳蛋白质如酪蛋白)。
表位,抗原和免疫原另一方面本发明涉及包含本发明多肽的表位携带部分的肽或多肽。这种多肽部分的表位是本发明多肽的免疫原性或抗原性表位。″免疫原性表位″被定义为蛋白的一部分,当整体蛋白是免疫原时,这一部分可引发抗体应答。据认为这些免疫原性表位被限定于所述分子上的少数位点。另一方面,可与抗体结合的蛋白分子区域被定义为″抗原性表位″。蛋白的免疫原性表位的数目通常少于抗原性表位的数目,参见如Geysen,H.M.等,Proc.Natl.Acad.Sci.USA 813998-4002(1984)。
关于筛选携带抗原性表位的肽或多肽(即包含蛋白分子中可与抗体结合的区域),本领域已知模拟蛋白序列一部分的相对短的合成肽通常能够引发可与部分被模拟的蛋白反应的抗血清,参见例如Sutcliffe,J.G.等,Science 219660-666(1984)。能引发蛋白反应性血清的肽通常以蛋白的一级序列表示并可以一套简单的化学规则描述其特征,既不限制于完整蛋白的优势免疫区域(即,免疫原性表位)也不限制于氨基或羧基末端。极端疏水和小于等于6个氨基酸残基的肽通常对诱导可与被模拟蛋白结合的抗体方面无效;更长的可溶性的肽,特别是那些含脯氨酸残基的肽,通常是有效的。Sutcliffe等,出处同上661页。例如根据这些教导设计出的20个肽中的18个含8-39个残基,覆盖流感病毒血细胞凝集素HAI多肽链的75%,诱导出可与HA1蛋白或完整病毒反应的抗体;12/12来源于MuLV聚合酶的肽,及18/18来源于狂犬病糖蛋白的肽诱导出可沉淀相应的蛋白的抗体。
本发明的携带抗原性表位的肽和多肽由此可用于诱导抗体产生,包括单克隆抗体,这些抗体可与本发明的多肽特异结合。因此,通过用携带抗原表位的肽免疫的供体的脾细胞融合产生的高比例杂交瘤通常分泌可与天然蛋白反应的抗体。Sutcliffe等,出处同上,663页。由携带抗原性表位的肽或多肽产生的抗体可用于检测被模拟的蛋白,针对不同肽的抗体可用于追踪经历翻译后加工的蛋白前体的不同区域的命运。肽和抗肽抗体可用于多种针对被模拟蛋白的定性或定量实验,例如竞争实验,这是由于在免疫沉淀实验中已表明即使是短肽(例如,约9个氨基酸)也可以结合并替代长肽,参见Wilson,I.A.等,Cell 37767-778在第777页(1984)。本发明的抗肽抗体也可用于纯化被模拟的蛋白,例如利用本领域已知的方法进行吸附层析。
根据上述教导所设计的本发明的携带抗原性表位的肽和多肽,优选包含本发明多肽的氨基酸序列中所含的至少7个,更优选至少9个,最优选约15至约30个氨基酸的序列。但包含本发明多肽氨基酸序列更大部分的肽或多肽,包含约30至约50个氨基酸或任意长度直至包含本发明多肽的全长氨基酸序列,也被认为是本发明的携带表位的肽或多肽,也可用于诱导可与被模拟蛋白反应的抗体。优选选择携带表位的肽的氨基酸序列以提供在含水溶剂中的相当大溶解度(即所述的序列包括相对亲水的残基,而避免高度疏水的残基);含脯氨酸残基的序列是特别优选的。
本发明的携带表位的肽和多肽可通过任何常规制备肽或多肽的方法包括重组方法利用本发明核酸分子来制备。例如短的携带表位的氨基酸序列可与更长的多肽融合,将后者作为重组制备和纯化以及制备抗肽抗体的免疫过程中的载体。
携带表位的肽也可以利用已知的化学合成方法合成。例如Houghten描述了合成大量肽的简单方法,如10-20mg 248种不同的代表HAI多肽节段的单个氨基酸变异体的13个残基的肽,这些肽在少于4周时间内制备并表征出来(通过ELISA-类型的结合研究)Houghten,R.A.,Proc.Natl.Acad.Sci.USA 825131-5135(1985)。这种″同时多种肽合成(SMPS)″方法在授予Houghten等的美国专利号4,631,211(1986)中有进一步的描述。在该方法中,用于不同肽固相合成的单独的树脂包含在独立的溶剂可透性小袋中,使固相合成方法中的许多相同的重复步骤得到最佳地应用。
完全人工操作可使500-1000或更多的合成同时进行。Houghten等,出处同上,5134页。
可利用本领域已知的方法以本发明的携带表位的肽或多肽诱导抗体。参见例如Sutcliffe等,出处同上;Wilson等,出处同上;Chow,M.等,Proc.Natl.Acad.Sci.USA 82910-914;和Bittle,F.J.等,J.Gen.Virol.662347-2354(1985)。
通常可用游离的肽免疫动物;但抗肽抗体滴度可通过将所述的肽偶联到大分子载体上得以加强,如匙孔血蓝蛋白(KLH)或破伤风类毒素。例如,含半胱氨酸的肽可通过下述接头与载体偶联,所述的接头如马来酰亚氨基苯甲酰-N-琥珀酰亚胺酯(MBS),其他的肽可用更常用的连接试剂如戊二醛与载体相连。
可用游离的或与载体相偶联的肽免疫动物,如兔、大鼠和小鼠,例如通过腹膜内和/或皮内注射含约100μg肽或载体蛋白和弗氏佐剂的乳剂。有可能需要几次加强注射,例如间隔约两周,以提供可被检测的有用滴度的抗肽抗体,例如,由利用吸附于固体表面的游离肽的ELISA实验进行检测。被免疫动物血清中抗肽抗体的滴度可通过选择抗肽抗体来增加,如通过吸附于固体支持物上的肽,用本领域已知的方法洗脱所选择的抗体。
本发明的携带免疫原性表位的肽,即,当整个蛋白是免疫原时可诱发抗体应答的蛋白部分,利用本领域已知的方法鉴定。例如Geysen等,1984,出处同上,公开了一种在固相支持物上同时快速合成数百个纯度足以在酶联免疫吸附测定中反应的肽的方法。在无需将它们从支持物上去除的情况下,易于检测到所合成的肽与抗体之间的相互反应。以这种方式,带有所需蛋白免疫原性表位的肽可由本领域的普通技术人员通过常规的方法鉴定出来。例如Geysen等以7个氨基酸的分辨率(resolution)通过合成覆盖口蹄疫病毒外被蛋白全部213个氨基酸序列的全部208个可能的六肽重叠组,定位了该蛋白中免疫学上重要的表位。此后,合成了全部20个氨基酸均在表位中的每个位置被依次置换的肽的完全替代组,确定了赋予与抗体反应的特异性的特定氨基酸。因此,利用上述的方法可以常规制备出本发明的携带表位的肽的肽类似物。授予Geysen的美国专利4,708,781(1987)进一步描述了这种鉴定携带所需蛋白的免疫原性表位的肽的方法。
此外,在授予Geysen的美国专利5,194,392(1990)中描述了检测或确定单体(氨基酸或其他化合物)序列的一般方法,所述单体序列是互补于感兴趣的抗体的特定互补位(抗原结合位点)的表位(即″模拟表位(mimotope)″)的拓扑等同物。更普遍地,授予Geysen的美国专利4,433,092(1989)描述了一种检测或确定单体序列的方法,所述的单体序列是互补于感兴趣的特定受体的配基结合位点的配基拓扑等同物。类似地,授予Houghten,R.A.等的美国专利5,480,971(1996)有关过烷基化(Peralkylated)寡肽混合物,其公开了线性C1-C7-烷基过烷基化寡肽,以及上述寡肽的组和文库,以及应用这些寡肽组和文库确定优先地结合于感兴趣的受体分子的过烷基化寡肽的序列的方法。因此,本发明的携带表位的肽的非肽类似物也可以利用上述的方法常规地制备。
α-淀粉酶在工业生产中的用途本发明还涉及本发明的蛋白在选择数目的工业和药物生产中的用途。尽管在这些生产中获得了长期经验,本发明的淀粉酶与目前所应用的淀粉酶相比具有多种显著的优势。根据特定的用途,这些优势包括例如以下方面低生产成本,对底物的特异性更高,抗原性降低,少有不需要的副活性,在适当的微生物中进行生产时具有高产率,更适宜的pH及温度范围,终产品的口味、食品等级以及kosher方面更出色。
本发明的淀粉酶的一个重要的方面在于其覆盖了适合于多种用途的全部最佳pH和温度范围。例如许多大规模生产得益于其相对高的生产温度,如50℃或更高来控制微生物的感染。本发明的几种α-淀粉酶符合这一要求,但同时它们不是那么热稳定的,可通过额外的加热处理使其灭活。后一个特性使生产所得的终产物中没有残留的酶活性。类似地,许多饲料和食品产品具有微酸性的pH,因此在这种生产中优选具有酸性或近中性的最佳pH的淀粉酶。本发明的α-淀粉酶也符合这一要求。
序列表<110>DSM NV<120>新的淀粉酶及其用途<130>20438WO<160>18<170>PatentIn version 3.1<210>1<211>3001<212>DNA<213>黑曲霉<400>1ggttataatt caaaattcaa cttccacctt tgtttcaccg gcggccacgg cattcctgca 60tgactaacgt tctgtaaatg gacccgataa cacccagcac gttgcagcag agaaggtact 120ctctcacacg cactgctctt tatagttgcc gagacggccg ccgaggagaa aaccgccggc 180ctgtggccac tattcgctgg aaggaaccct gccagtcgaa cacacccgcc cgtgatcgcc 240aggggccgat ggatttcccc ccgcatcctt gtcggttcat gagtgaagac tttaaatccc 300atctagctga cggtcgggta catcaataac tggcagccta gtttccaaga cacggagaag 360catgtaatcg ctatttatag aatgctggga tcggacccgt cgaatggtct tccgatggga 420agtgacaact cacattgtca tgttggcctt actcaatcca acgggatctg acctgctttg 480gctaacctag tataaatcag catgtctctc ctttgataca tcggatcgtt cctcaaatat 540agttatatct tcgaaaaatt gacaagaagg atgacaatct ttctgtttct ggccattttc 600gtggctacag ctctggcagc cacgcctgca gaatggcgct cccagtcgat atatttcctg 660ctcaccgatc gctttgcgcg aacggataat tctaccactg cttcttgtga cttgagcgct 720cgggttagtc acagcatgtt ctagaatctc caattgattc gctgacagat ctagcaatat 780tgcggtggat cctggcaggg catcatcaat caggtcggtc cgtccatcgt tgcagcacta 840tctacatcaa cgtttgtttg gcaaattaac atccattagc tggactatat tcaaggaatg 900ggctttacag cgatctggat cacacccgta actgcacaga tcccccaaga tactggttac 960ggacaggcat atcacggata ctggcagcag gacgcgtgag atgctacctc tatcgcccgg1020atgaatgtat atccttctta ccatgcagac agttatgccc tgaactccca ttatggtacg1080gcagacgatc tcaaagctct ggcttcagct cttcactcac ggggcatgta tctcatggtg1140
gacgttgttg ccaatcacat ggtatgttct tagcctccca cgggacctta gctttatatc1200tgacagcgat agggccacaa tggtacgggg agctctgtgg actacagtgt ttataggcca1260tttaattcgc aaaagtactt tcacaacctc tgttggatct ctgattacaa taaccagaca1320aacgttgaag actgctggct aggcgataac accgttgcct tgccggatct tgatactacc1380agtacggagg tgaagaatat gtggtatgac tgggtcgagt ctctcgtctc taactactcc1440ggtaatccta cctttacttc gctattttct gcctcttatg agacaaagac taacaaatat1500caagtcgacg gcctccgcgt agacacagtc aagaacgtac agaagaactt ctggcccggc1560tacaacaatg cttcaggcgt gtactgtatt ggagaagtct tcgatgggga cgcctcatac1620acctgtcctt atcaggaaga cttggacgga gtccttaatt accccatgta agccctacat1680ttaaccccat tgaatgcttg ccaacgactt gcaataggta ctatccactc ctccgggctt1740tcgaatccac caacggcagt atcagcgacc tctataacat gatcaacacc gtgaaatcca1800cctgcagaga ttctacgctt ctagggacct tcgtcgaaaa ccacgataac ccacgctttg1860ccaagtaaga atatcctctc cgagttcacc attacaaaca caagagctca cctcagaagc1920tacacaagcg acatgtccct agccaaaaat gccgcaacat tcactatcct ggctgacggc1980attcccatca tatacgccgg tcaggaacag cactatagcg gcggtaatga cccctacaac2040cgcgaagcga cctggctttc aggctacaag accaccagcg agctctacac ccatatcgcc2100gcatcgaaca agattcgcac ccacgctata aaacaggata ccggatatct cacctacaaa2160gtaatcttca ttcgagtcca tgtgtggtac aatctatctg actagaacct attctagaac2220taccccatct accaagacac ctcgaccctt gccatgcgca aaggctacaa tggcacccaa2280actatcacgg tcctttctaa ccttggcgcc tcggggtcct catacacact ctccctccca2340ggaacaggct acacagccgg ccaaaagatt actgaaatct atacctgcac gaatctaaca2400gtcaactcaa atggctcggt gccagtaccc atgaagagcg ggttaccgcg gatcctctat2460cctgcagata agttggttaa tggaagctca ttttgcagtt agttccctgc ctatatgttt2520caataagccg tatttgcatg cgcgtccatc gcattgattc tttatggatt gatcaactga2580tacattcgca caggctctgc gatcactgtt ttcaaggatg caggaggagg cgtgttgttc2640tttagctaca ctgtgtaagt gtatcagatc atatcatggc cactagacga tgacccctgt2700gatcgtgatc cagatgctga cttcaatttg tagaattttc gctcaggtgc ttattgctat2760aatgacgtga ttaggatgtc tcagatgaca gtatatatta ttaggtgacg tgatgattct2820atgtgtaatg gattcttcaa gatcatttta tattattagt atccacagta ttcatttgcc2880
tgcaaagtaa gtatggataa aatcactacc accgacgtag tagttgtacc tagtccttag2940tgtctcaaag ccacagtcac tacaacctca cgaaacgacg gagtaaactt atttctattg3000a3001<210>2<211>2511<212>DNA<213>黑曲霉<400>2catgaacgct ttcccagccg aaatgtggga agttaatttg ccttgtccac ttcgccctcc 60agcgcagccc tgccctcacg acaatcagtc aatctcccgt gacaatccca ggggatcttc 120gtgttctaac gctgctaccc gttctcgaat gttcgggtga actggagtac tagagtagat 180taccatcgag cgttacaaat ttagatggcg tctttatttt tggtccgcgt tgagggtcgt 240tgaaagtgat ggatcagggc ttcgggcacg cgatgcgaac gagggtgggg gagagactac 300ctatttatgg tacctccggc ttctaccggc cttgtctgca gccccccggt ctggcgctct 360tatctctctt gctaagttgc tatagctatc gggggtccgc cccccctgaa tcgcgttgcc 420ttgacttgtc attctttctt ttccccgtta ttgcaacggg aacagcgcac ccggcctcaa 480acatcatgct cagcggcccg tttggctgaa tcgcgtgaaa ttgaaacgct taaaacacat 540tcgttagagt aagctgttgc ttgtcataat tcattcggtc acccaagccc acccacggga 600agcagaacct ccacaagggg gcacagaggg ttgatcgagg gtagtactgc caatgatgtt 660tcgaaaatcc gcttccctcc tgggccaacg gctcatggcc gtttgtctcc tgtgctggtg 720cgtttcgcta gcgaccgccg caagcacaga agaatggaag acgcgatcca tctaccagac 780gatgacggat cggtttgccc tcaccaacgg ttcgacgacc gcaccatgca atactacggt 840agccaactac tgtggcgggt cttggcaggg gacgatcgat aagctggact acatccaagg 900catggggttc gatgcgatca tgatctctcc cgtaattaaa aacattgcgg ggcgatctaa 960ggacggtgag gcctaccatg gatactggcc tctggatcta tacgagatca attctcattt1020cggaacccgg gaggaactgt tgaagctgag cgaggagatc cacgcacgcg gcatgtactt1080gctgctggac gtcgtcatca ataatatggc ttacatgacg gacggcgagg atcctgcgac1140
gaccattgac tacaatgttt tccctcagtt caatggatct tcatacttcc acccctactg1200tcttattacg aactggaata actatacgga cgcgcagtgg tgtcagactg gtgacaatta1260tactgcactc ccagatctgt acacagaaca caccgcggtg cagaacatct taatggactg1320gagtaaatcg gtcatcagca attactccgt cgacgggcta cgaatcgacg ctgccaagtc1380cctcactccc agctttctgc ctacatatgc gagtaccgtg ggcggattca tgaccggcga1440agtcatggat tcgaacgcca ccaacgtgtg caaatatcag acggattacc tgccaagtct1500tccaaactac cccctctatt actccatgat cacggccttc ctcaacggcg agcctgcgac1560cttgctcgag gaaatcgcga cgatcaatga tctttgccct gatacgttcg caatggtcaa1620cttcatcgaa gatcaagacg ttgaccgatg ggcctacatg aatgacgaca tcatgctagc1680taaaactgca ctgaccttca tgatgctcta cgacggtatt cccttggtct accagggtct1740ggagcaggcc attgcctatt ccaaccgagc ggccttgtgg ttgacagatt tcgacaccaa1800tgcgacgctt tataaacaca tcaagaaact caatgccatc cgcaaacatg ccattaacct1860tgattccagc tacatcagtt cgaaaacata tcccatctat caaggaggta gcgagttggc1920tttctggaag ggcaacaatg gacgccaagt catcatggtt ttatctacgg cgggctcgaa1980tggttcagct tatactctga cactacccgt aagctatggg gctagtgagg tggtcacgga2040agtgctgaac tgcgtcaatt atacggtcaa cacttacagt caattggtcg tggacatgga2100taagggcgaa cctcgggtct tctttcccgc ttcgatgatg ccggggagcg ggctgtgtgg2160ctacaatact tctaatgtga cgtattctga gctgagactt gctgctgtgg gatcttcgtc2220gtctgctggt agccactctg tcataccgtc tgcttttgct tcgcttttca tggcgatagt2280tgcatttttg gcattccgga tataagttca tattttttct actcagtttt ataccagcaa2340ataaaacgat gtcctatgaa tatacacatt tcaaaagtgg agacaaaatt atatctttat2400atccctagca cctccctttc cgtatccttt cctgcaataa agacctattc agcattggga2460gcagaattac gaagcacagt ctcctcagtt cgcatacccg cccacctcca a 2511<210>3<211>2501<212>DNA<213>黑曲霉
<400>3ccccagcatt ccacttcttc tcgcttcccc tcttctctct cctctccctc tcctctcctc 60tcctttccct tcccttccct tccttcctcc tcactcattc tttcgctctc gtcacatcga 120ccaatgcatc cgtcactgaa gtgaccccct cttcctgggc tgttcccttg ccattcattt 180ttttctttgg atctgaccat tgccattctt tctctacaat ctggtcccac ttctttcgtt 240cactctttca tttcgtgcct agcccgtatc cttcctttta gcgtaaccgg ctatctccca 300gcattcgaca gtcaccttat cgtatctcca agtcgggccc cgcaattgct cggcaggcac 360atgtacgcaa cccttgatca ttaagataat tccaatctcc cagtgactgt agccatggtc 420tcaatgtcgg ccctgcggca cgggcttggg gtcctctatc ttgctagctg gctggggtcg 480tcgctggctg ccagcaccga gcaatggaag tcccggtcaa tctatcagac catgacggat 540cggttcgcgc gcactgatgg ctcaaccacc tccccctgca acaccacgga gggtctgtac 600tgtggtggta cctggcgcgg catgatcaac catctggatt acatccaggg gatgggcttt 660gatgccgtca tgatctcccc tatcatcgag aacgtcgaag gtcgcgtgga gtacggagaa 720gcctatcacg gctattggcc cgtggatctg tactccctca actcgcactt tggaacccac 780caggatctac tggacctgag tgatgccctg catgctcgcg acatgtatct gatgatggac 840acagtcatca acaacatggc ctacatcacc aatggctccg accccgccac ccacatcgac 900tactcaaccc tgaccccctt caatagctcg tcttactacc atccctactg taagatcacc 960gactggaata acttcaccaa tgcccagctg tgccaaaccg gtgacaacat cgtggccttg1020cccgatctgt ataccgagca tgccgaggtg caagaaaccc tgagcaactg ggccaaggaa1080gtcatctcca cctattccat cgacggcctc cgcatcgatg ccgcaaaaca tgtgaacccc1140ggcttcctga agaatttcgg cgatgcgctt gatatcttca tgaccggcga agtgctgcag1200caagaggtca gcacaatctg cgattatcag aacaactaca tcggcagtct cccgaattac1260cccgtctact acgccatgtt gaaggccttt accttgggca acaccagcgc cctggccact1320caggtccagt cgatgaagaa ttcctgtaat gatgtgaccg ccttgtcgtc attctccgaa1380aaccacgatg tcgcacgatt tgccagcatg acccatgaca tggctgtatg aactctgctt1440gactttacag acccctttcc tagctaacat tgtccctact agctcgcgaa gaatattctc1500acattcactc ttctcttcga cggtgttccc atgatctatc aaggtcaaga gcagcatctc1560gacggccctg gcagtccgga aaaccgagaa gcgatatggc tctctgagta caacaccgac1620gccgagctct acaagttgat cggcaagttg aacgccatcc ggaagcacgc ctaccgactc1680
gacaatcact accccgatgt cgagacgtac cccatcttcg aaggtggcag tgaactggga1740ttccgcaagg gaatcgaagg tcgacaggtg gtcatgcttc tgtccacgca aggcacgaac1800agcagcgctt acaacctctc gatgccggtg agtttcacgg gtggcacagt agtgaccgag1860attctgaact gcgtcaacta cacggtcaac acccagagcg aactcgtggt tccgatggat1920aaaggagagc cgcgcgtgtt cttcccggcg gatctgatgc ccggcagtgg gctgtgcgga1980cttcctgtcg cgaatgtcac ctatgctgcc ttgaggacgc agggtgcagc ggcggcggag2040gctgccttgt cgctaggtat caagactgat gcagcttcta gtgctttgct ttctctgggg2100ctgtctgtgg tggcgggtct gattgtgggg atgtggtaat atgctgatag ctacagatgg2160gttgagatat attatcatgt ttcagtgttc tttgtatgta tttgcagtaa cgataccctt2220acctagtata ttgtatatat tcacttcgct atatccacta ctactcgcag atactagccg2280catctcgctt tattccacac tagttactag cacttcagca ctaagcaata aacagaacga2340agacaaatta ctagtccagt atatatataa atagagatca cctgtaaatt cttcagaaaa2400cccaaacggg tacctgcatc caacagctgt tgacgatcat ggctggctga tcctctggag2460gcaaatccgt tgggcctcgg tagctttccg aggaaaccgc c2501<210>4<211>3080<212>DNA<213>黑曲霉<400>4catctcgctt tattccacac tagttactag cacttcagca ctaagcaata aacagaacga 60agacaaatta ctagtccagt atatatataa atagagatca cctgtaaatt cttcagaaaa 120cccaaacggg tacctgcatc caacagctgt tgacgatcat ggctggctga tcctctggag 180gcaaatccgt tgggcctcgg tagctttccg aggaaaccgc ccgagctaaa aatactcgct 240catcagccag acaggcccac tttaaggacc cattgaaaat tgaaatgaag tcatgcacac 300cgtgttaact agctaactag ctagttcttc ttagtgtcaa gacagcagct attctaacgt 360tcttccgtgc ttacaccaca gcccagctcc gtcgctgcat tcgactcttc accttccatc 420catcatccat ccattctaca tggacacaga cagtaaacct agctaatccc tcctccgcac 480cgcagtaaaa aaatcctcac ctcccgaacc accaacgacc tacaaacata acccaagaaa 540
aaaagaatac aagcaaaatg ttcagtttcc tcccctgctt caaaactcgc cgacaacgca 600ccaaatccca aactcaatcc caaaagcaaa tagagggtta gccaaacacc cccaactacc 660cataccaagt caattcaatt caaatcatag taacaaattc aacctcccca atagaaaaag 720ccaacgccat agaatccctc ccctcatggc actcccccac ggaaaacacc ctcctatttc 780aagccttcga atggcacgtc cccgcaaccc ccaacaccgc ggacaagcgc agccactggc 840gccggctcca gcatgcctta ccagctatcc actccctcgg tgtaaccagc atctggatac 900cgcctggatg caagggcatg gacacaaatg gaaatgggta tgatatctac gatttatatg 960atctaggcga attcgaccag aaaggagcag tgcgaacgaa atggggcacg cgcggagaat1020tagaggatct tgttcgagat gcaaatgctc tgggcgtagg tgtattatgg gatgcggtgt1080tgaatcataa ggctggggcg gatagcgtgg agaggttcga gggtgtgagg gttgatgatg1140atcgtatata cccctttccc atctctccgt tcttctatgt atagtgtgta tattgacaaa1200tgcttcacag gacgagatat cgaagatggt aatccccaac aaatctccgg ctggacgtcc1260ttcaccttcc ccggccgcgg caccacatac agcccccttc aataccactg gcagcacttc1320agcggcgtcg actgggacga cgcccaacaa cgcaaagcaa tctacaagat cctcgaccct1380tcccgccccg acaagaactg ggcccaggac gtcggcacag acgagaacgg caactatgac1440tacctgatgt tcgcggacct ggacttctca cacccggagg tccgggagga tgtactgcgc1500tgggggaagt ggattatgtc tgtgttgccg ttgagcggaa tgcggttaga tgcggcgaag1560catttctcga cggcatttca gagggacttt attgattgtg tgcggcagga ggccggggac1620aggaaggtat ttgtgattgg ggagtattgg agtggggagt taagggcgct gcttaggtat1680ctggaggaga tggagtatcg ggtggcggcg gtggatgtgc cgctggtaga gaggttctcg1740aggttgtcga gggtgaagag ggcggatttg aggggagtgt tgagggggac gttggtggag1800agcaggccgg ggaatgcgtt ggtgagttta tcccagtgat ccaattcggg ggtggtgagg1860ctgatgtgtg tgtggtgtag acattcgtta cgaatcatga tacggtgagt gaaagccctt1920gtgaagtgaa ggtatatgga tgagtgctga atgatatcac aagcaaccgg gacaaatgct1980cgaggtgagt tgttaacttt atcatgtgtc tgaggatgag caacgagcta acatacaaca2040gaccatcgtc gagccctcct tcaaacccct agcctacgcc ctaatcctcc tccgccaagg2100aggccatcca tgtgtcttct acggcgacct ctacggcacc tgcgacggcg accacccgcc2160aactcccgcc tgcgagggcc aacttccgaa tctgatgcgt gcccgcaagc tgtacgccta2220cggtgagcag gaggactact tcgaccagcc caactgtatt ggtaagtcaa gccctatcca2280
gtctgcgaca tagtctgata aatgagaagg attcatccgc tacggcaacg ccgcccaccc2340ctccggactg gcctgcgtca tgagcaacgg cggaccagcc acgaagcgca tgtacgtggg2400tcggaaacat gccggcgaga agtggacgga tctgctgcag cgaggcggtg atcacccgtc2460tgtcacggtg attgatgaaa tggggtacgg ggagtttccg gttcagagta tgagggtgag2520tgtctgggtg gatagtgcgg cagatggccg agagggtgtc ggggcagaat tgtacgtcta2580taccctattc cacttattgc tcttggtagt cgtgggggtg gatgtttaaa actgatccag2640gggatgatga tgatgctaat attggaagtt tagtgacgtc gatatctacg gcattcaggc2700actataacta acccacccgg tacttactca ttattgagaa aataatggtg tccatatata2760tctctaagac acgatgtata ttaatacaat tcacaatgta actatttccc agactagttt2820tactatagta agacaataca acaatactac agagtaataa tcaatgtatc cacacaaact2880agtctactcc atctattcta caactaactc caagacacac aatcacacac agtaagacac2940aatctcaccc aaaaataatc cctccattca tccaagcgag cgagaaaccc aaaacccgaa3000agctaaaaga aaagaagaaa aagattctgg accctcttta cccaatccag taacccattc3060ggtgctgccc gacactggta3080<210>5<211>3010<212>DNA<213>黑曲霉<400>5aaataaccat tccatcctca ccatcaagtg acgaaacctg ccatggccgc caagccgtgc 60tgcccactga ttggtgcagt ttctcctttc ggtcaacggt aagccgacgg agaacttctg 120cttggttcat aacgatttgt gcggtttcat cccctcaggc atcaacattt tatcctcgga 180attggtgtct agcgttgcga cgcgattgat gcttgaccta catacttaga ccctagacca 240gtatacgtgg tggcatctgc aaggaacgct ctagaaatca taggagaacc tcctagggat 300atgttttgcg cccggaaggc acagcattca gccccatcta ctatttaaag tatcaacaca 360ctaaaacagg aggctttagt ggctgttttt ctgatcgacc atcatacctt aaatcatacc 420agacagctat caccaatatg acgtgttttg cagtatatac atttgataca tctaagacct 480
gaaccacggt ggaggctctc tttttcatca ccgaatcaat ctttctcagc ttcacactcg 540aaataggata cttctccttc cttttcaccc ttgttgatac cgtttctgaa agtagaagta 600cggcattttc tccatgttat ctttcctcct atggtgccat ccaaagaaga ggaaggagag 660acaactatgg aagcagattg aaggttagcc tccgtaatca tcaaggtgca ttttattgca 720agttgaatcc ccgcttacgt gtccaccaac agaagaagct gagcacttgg accagcttcc 780atcatgggat gctcccgaca acactttaat gctgcaagcc tttgaatggc atgtgccagc 840tgaccaaggt cactggcgtc gtcttcacca ggccttacca aacttcaagg cgattggggt 900agacaacata tggatcccgc ccgggtgtaa agctatgaat ccatctggta acggatatga 960tatttacgat ttgtatgact tgggagaatt cgagcaaaag gggtctcgag ctactaaatg1020gggtaccaaa gaggagctcc agtccttggt agctgcagcc caagatttcg gtataggtat1080ttactgggac gctgtcctca atcacaaggc gggagcagat tacgcagagc gctttcaagc1140tgtcagggtt gacccacagg gtatgccatg gccttattcg actagtttcg ggtgcacctg1200ttaacttgga attgtctaga gcgtaatatg aaaatcgccc ctgcagagga aattgaaggc1260tgggtgggat tcaacttctc tgggcgtggc aaccactata gttcgatgaa gtacaacaaa1320aaccacttca gcggtatcga ctgggaccag tcgcgtcaaa aatgcggagt ctacaagatc1380caaggacatg aatgggcgaa cgacgtcgcc aatgagaacg gaaattacga ctatctcatg1440ttcgccaact tggactactc caacgcagaa gtacgacgcg atgttctgaa atgggccgag1500tggctcaatg ctcaattgcc tctaagcggc atgaggttgg atgcggtcaa acattactcg1560gctggttttc agaaagagct tattgatcat cttcgaacta ttgctgggcc agactatttc1620atagtgggcg agtactggaa aggcgagacc aagccgttag ttgactacct gaagcagatg1680gactacaagc tatcattgtt cgattccgct ctggttgggc ggttctcaag catttcacag1740acaccagggg cggatcttcg caacattttc tataatacat tggtccaatt gtacccagat1800cattctgtcg taagttgatt gtcattttgg tgagatccct tactgaccac taaaagactt1860tcgttgcaaa ccatgatact gtaggtgcaa tatgcccttt ggcctcattc tactaacata1920gatccaaagc aaccaggtca atccctcgaa gtacgcacac cgcccacttt gattttacag1980atctaacaga tgttcaggcg ccagtaacat cattcttcaa acccctcgcg tacgccctta2040tccttctccg tgaccaaggg caaccatgca tattctacgg agacctttac ggcctccaag2100ccgatgtcaa agatccaatg acaccgtctt gcaggggcaa gctgtccatc ctcacccgag2160ctcgaaagct ctacgcatat ggcctgcaac gagattattt tgacaagccg aactgcatcg2220
gttagtgcct gctttcgtta tcctctaccg cacactgaca ggagtaggtt ttgtccgcta2280tggtaaccgt cggcatccct ctggtcttgc atgcgtgatg agcaatgcgg gtccgtcgag2340gaagcggatg tatgttggtc gacgacacgc caagcaaaca tggaccgata tcctgcagtg2400gtgtgatcag actgttgtca ttgatgccaa gggatatgga gagtttccgg ttagtgcgat2460gagcgtgagt gtatgggtga actccgaggc tgaggggaga gatagcctct cacatcattt2520gtatgtccct gctcacagtc ttagtacgga tgatttgctg acgagtgctg aaattagtga2580tgagaacata tacaaactag cttaatcgcc ttgggtatct gtgatgacta ctagacaatc2640cccaaagaaa cataatacac gatcatctat acaacaacct ctctaaccaa ccaatcaaac2700caacaacggc gtatcaaagc acccaaaccc cttgaccaca ctcatctcat ccacatccgc2760aaacttcgtc tttaacgacc agcccacagt ttcatttctc aaaatctccc ccttcttcca2820aatacacagc ccaaacaccc ccacttccga aatcacatcc gattcctcca ccccttcccg2880cgacatcagc acattcccca caacaggcga cctaatcctc tccatcaaca catacctacc2940ccattcggat tccgaactca ttcccaacag aaaccccggg atatcctccc cgtagatatt3000atgccccccg 3010<210>6<211>3001<212>DNA<213>黑曲霉<400>6tctgttggtt cggggtccag aagtaccaat acccaattat tcccacttta cccaatggtc 60gaataataca caatacccat tacacaattc ccgatgccga tgtcacgtaa gtttccatac 120ggtccggata catcggtatc atcttcgctg aagtgttgtt cactggtcgg tatcagcctt 180cttgccctga acagacacaa aggatgtatg tgtccgcttc gtatatgaac atgctcaaca 240ggaggttacg caggtcataa ccatcaagac attttttctc acctctttcc agctaataat 300cccaccattg aactactctc cttgccttct ttcatctgcg catgcaaacg ccaccaacca 360tggacgacgg gtggtggatc atctcgttgc tggtggtaac tctgggaatc cccacggtta 420atgcggcttc cagagaccaa tggatcggtc gctctatcta tcaaatcgtg accgatcgct 480
ttgctcgatc ggataactca accaccgctg cttgtgatgc agcactagga aactactgcg 540gaggctcttt ccagggcatc atcaataagc tggactacat ccaggagctc gggtttgatg 600cggtaggttt accaccatca tcctgcctct cgctctctgc cactctttct catacctgaa 660acaccagata tggatctctc ccgcacaaag ccaaatttcc gcccgaacag cagatctctc 720aggtatggca ctttcaaaat cttcacaaac catctgcaac tctgtacatt gttatataca 780cgatatacta tgtagcttgg taggtaagaa attcaacatg ttaacggttc atagcatacc 840atggatattg gcccaatgat ctgtattcca tcaactctca ttttggcact cccaaggagc 900tggaagcctt gtcctctgcc ctgcacgatc gtggcatggt gagtcgctct gccattttcc 960ctaaagatga cactgaccgc gcaaaaccca gtacttgatg cttgacatcg tggttggtga1020tatggcctgg gcgggaaatc acagcaccgt cgattacagc aactttaatc ctttcaatga1080tcagaagttt ttccatgatt tcaagctcct ctccagtgac cccacaaatg aaacttgtgt1140tctggatgta agtctgtatt gtgaatcatg acccgtggga ttttgctaac cccatatgaa1200gtgctggatg ggagacaccg tcgtatcact tcccgatctg cgaaatgaag accaacaagt1260tcagaatatt cttggtacct ggatttcggg gttggtttcg aactactcaa gtaagacttc1320ttccttggcc gttatggaat attgattgac ctgtttctgt tttgtagttg acggactgcg1380tattgacagc gtcttaaata tcgccccgga cttcttctcc aacttcacca agtcatcagg1440ggttttcact gtcggtgaag gtgccacggc cgatgcggct gatgtttgcc ctctgcagcc1500aagtttaaat gggcttttga attatccatt gtaagtaccg catcgtggtg agtaaagtca1560gtcgtgttga ctttctcagg tactatattc ttaccgacgc cttcaacacg accaacggga1620acctgagcac cattaccgag tccataagct acaccaaagg acagtgcgag gtagggcatg1680ccttcgaatt ggattataag ggcaaactaa tcatatacag gatgtcttgg ctctggggac1740gtttactgca aaccaggatg ttccgcgctt cggttcatac acgtcggata tttcggtaag1800ttcagtcggt ggtcctatct tggtactgaa caatgtttga ctttattgct tgtgagcagc1860tggcgcgcaa tatcctgacc agcagtatgc tgacggacgg catccccatc cgtatgttcc1920gatccccgcc tcccccatag taagcaagat tcctcagaca ccactgataa tcaaaataca1980gtctattacg gcgaggagca gcatttgaca ggatcctaca atcctgtcaa ccgtgaggct2040ctgtggctga ccaactactc gatgcgctcg acctccctcc ccaccctcgt ccaatccctg2100aaccgccttc gatcgtatgc tagcggggac ggtgagcagt acacgcaaaa gtcgcaatct2160gggagcgatt acctctcgta cctgtcagca cccatttaca attctacgca cattctggcc2220
acgcgcaagg ggtttgcggg caatcagatc gtgagtgtcg tatccaatct gggagccaag2280ccagccagca aagccaccac gaaaatcacg ttgggctcag acgagactgg attccaatcc2340aagcagaatg tgaccgagat cttatcgtgc aagacgtatg tcacggattc cagcgggaat2400ctggcagtgg atctgagctc ggacgggggt ccgcgcgtgt actatcccac ggacagcctg2460aaggacagca ctgatatctg tggtgatcag accaaatcgg cgaccccgag tagctccgca2520gcctcgtccg cgagcttgac ccagtccaag ggttcagaga cctgtttgtt tggggtgccg2580ttggggataa gcacattggt ggtcacagtt gcgatggcca cgtcctacgt gttctagtct2640ccttgagcct ctaccccttc tgtttgtcgc ctgtctttcc ctgtttcgca ttacccctat2700gattattgtt tgctcataac gctcttttga atgttttgaa actgtggctt tacttgaaac2760ccgataccac ccctctggct gcactgatac attactaagt atagaatgtg gcgtcttgtc2820tcttacgagt caccctagca tcacggtaaa ataaatgtgt tgtttccgtc tgagtctctt2880gaaatctttt gtagcacggg ggaaagaaaa ttgtcagggt ctccttctgg cacggatggc2940atagacgaag cagtatacag ggaggtaaat tcgttcgggt ttcccgactg ttacgggctt3000t3001<210>7<211>1485<212>DNA<213>黑曲霉<400>7atgacaatct ttctgtttct ggccattttc gtggctacag ctctggcagc cacgcctgca 60gaatggcgct cccagtcgat atatttcctg ctcaccgatc gctttgcgcg aacggataat 120tctaccactg cttcttgtga cttgagcgct cggcaatatt gcggtggatc ctggcagggc 180atcatcaatc agctggacta tattcaagga atgggcttta cagcgatctg gatcacaccc 240gtaactgcac agatccccca agatactggt tacggacagg catatcacgg atactggcag 300caggacgctt atgccctgaa ctcccattat ggtacggcag acgatctcaa agctctggct 360tcagctcttc actcacgggg catgtatctc atggtggacg ttgttgccaa tcacatgggc 420cacaatggta cggggagctc tgtggactac agtgtttata ggccatttaa ttcgcaaaag 480tactttcaca acctctgttg gatctctgat tacaataacc agacaaacgt tgaagactgc 540tggctaggcg ataacaccgt tgccttgccg gatcttgata ctaccagtac ggaggtgaag 600aatatgtggt atgactgggt cgagtctctc gtctctaact actccgtcga cggcctccgc 660
gtagacacag tcaagaacgt acagaagaac ttctggcccg gctacaacaa tgcttcaggc 720gtgtactgta ttggagaagt cttcgatggg gacgcctcat acacctgtcc ttatcaggaa 780gacttggacg gagtccttaa ttaccccatg tactatccac tcctccgggc tttcgaatcc 840accaacggca gtatcagcga cctctataac atgatcaaca ccgtgaaatc cacctgcaga 900gattctacgc ttctagggac cttcgtcgaa aaccacgata acccacgctt tgccaaaagc 960tacacaagcg acatgtccct agccaaaaat gccgcaacat tcactatcct ggctgacggc1020attcccatca tatacgccgg tcaggaacag cactatagcg gcggtaatga cccctacaac1080cgcgaagcga cctggctttc aggctacaag accaccagcg agctctacac ccatatcgcc1140gcatcgaaca agattcgcac ccacgctata aaacaggata ccggatatct cacctacaaa1200aactacccca tctaccaaga cacctcgacc cttgccatgc gcaaaggcta caatggcacc1260caaactatca cggtcctttc taaccttggc gcctcggggt cctcatacac actctccctc1320ccaggaacag gctacacagc cggccaaaag attactgaaa tctatacctg cacgaatcta1380acagtcaact caaatggctc ggtgccagta cccatgaaga gcgggttacc gcggatcctc1440tatcctgcag ataagttggt taatggaagc tcattttgca gttag1485<210>8<211>1650<212>DNA<213>黑曲霉<400>8atgtttcgaa aatccgcttc cctcctgggc caacggctca tggccgtttg tctcctgtgc 60tggtgcgttt cgctagcgac cgccgcaagc acagaagaat ggaagacgcg atccatctac 120cagacgatga cggatcggtt tgccctcacc aacggttcga cgaccgcacc atgcaatact 180acggtagcca actactgtgg cgggtcttgg caggggacga tcgataagct ggactacatc 240caaggcatgg ggttcgatgc gatcatgatc tctcccgtaa ttaaaaacat tgcggggcga 300tctaaggacg gtgaggccta ccatggatac tggcctctgg atctatacga gatcaattct 360catttcggaa cccgggagga actgttgaag ctgagcgagg agatccacgc acgcggcatg 420tacttgctgc tggacgtcgt catcaataat atggcttaca tgacggacgg cgaggatcct 480
gcgacgacca ttgactacaa tgttttccct cagttcaatg gatcttcata cttccacccc 540tactgtctta ttacgaactg gaataactat acggacgcgc agtggtgtca gactggtgac 600aattatactg cactcccaga tctgtacaca gaacacaccg cggtgcagaa catcttaatg 660gactggagta aatcggtcat cagcaattac tccgtcgacg ggctacgaat cgacgctgcc 720aagtccctca ctcccagctt tctgcctaca tatgcgagta ccgtgggcgg attcatgacc 780ggcgaagtca tggattcgaa cgccaccaac gtgtgcaaat atcagacgga ttacctgcca 840agtcttccaa actaccccct ctattactcc atgatcacgg ccttcctcaa cggcgagcct 900gcgaccttgc tcgaggaaat cgcgacgatc aatgatcttt gccctgatac gttcgcaatg 960gtcaacttca tcgaagatca agacgttgac cgatgggcct acatgaatga cgacatcatg1020ctagctaaaa ctgcactgac cttcatgatg ctctacgacg gtattccctt ggtctaccag1080ggtctggagc aggccattgc ctattccaac cgagcggcct tgtggttgac agatttcgac1140accaatgcga cgctttataa acacatcaag aaactcaatg ccatccgcaa acatgccatt1200aaccttgatt ccagctacat cagttcgaaa acatatccca tctatcaagg aggtagcgag1260ttggctttct ggaagggcaa caatggacgc caagtcatca tggttttatc tacggcgggc1320tcgaatggtt cagcttatac tctgacacta cccgtaagct atggggctag tgaggtggtc1380acggaagtgc tgaactgcgt caattatacg gtcaacactt acagtcaatt ggtcgtggac1440atggataagg gcgaacctcg ggtcttcttt cccgcttcga tgatgccggg gagcgggctg1500tgtggctaca atacttctaa tgtgacgtat tctgagctga gacttgctgc tgtgggatct1560tcgtcgtctg ctggtagcca ctctgtcata ccgtctgctt ttgcttcgct tttcatggcg1620atagttgcat ttttggcatt ccggatataa 1650<210>9<211>1668<212>DNA<213>黑曲霉<400>9atggtctcaa tgtcggccct gcggcacggg cttggggtcc tctatcttgc tagctggctg 60gggtcgtcgc tggctgccag caccgagcaa tggaagtccc ggtcaatcta tcagaccatg 120acggatcggt tcgcgcgcac tgatggctca accacctccc cctgcaacac cacggagggt 180
ctgtactgtg gtggtacctg gcgcggcatg atcaaccatc tggattacat ccaggggatg 240ggctttgatg ccgtcatgat ctcccctatc atcgagaacg tcgaaggtcg cgtggagtac 300ggagaagcct atcacggcta ttggcccgtg gatctgtact ccctcaactc gcactttgga 360acccaccagg atctactgga cctgagtgat gccctgcatg ctcgcgacat gtatctgatg 420atggacacag tcatcaacaa catggcctac atcaccaatg gctccgaccc cgccacccac 480atcgactact caaccctgac ccccttcaat agctcgtctt actaccatcc ctactgtaag 540atcaccgact ggaataactt caccaatgcc cagctgtgcc aaaccggtga caacatcgtg 600gccttgcccg atctgtatac cgagcatgcc gaggtgcaag aaaccctgag caactgggcc 660aaggaagtca tctccaccta ttccatcgac ggcctccgca tcgatgccgc aaaacatgtg 720aaccccggct tcctgaagaa tttcggcgat gcgcttgata tcttcatgac cggcgaagtg 780ctgcagcaag aggtcagcac aatctgcgat tatcagaaca actacatcgg cagtctcccg 840aattaccccg tctactacgc catgttgaag gcctttacct tgggcaacac cagcgccctg 900gccactcagg tccagtcgat gaagaattcc tgtaatgatg tgaccgcctt gtcgtcattc 960tccgaaaacc acgatgtcgc acgatttgcc agcatgaccc atgacatggc tctcgcgaag1020aatattctca cattcactct tctcttcgac ggtgttccca tgatctatca aggtcaagag1080cagcatctcg acggccctgg cagtccggaa aaccgagaag cgatatggct ctctgagtac1140aacaccgacg ccgagctcta caagttgatc ggcaagttga acgccatccg gaagcacgcc1200taccgactcg acaatcacta ccccgatgtc gagacgtacc ccatcttcga aggtggcagt1260gaactgggat tccgcaaggg aatcgaaggt cgacaggtgg tcatgcttct gtccacgcaa1320ggcacgaaca gcagcgctta caacctctcg atgccggtga gtttcacggg tggcacagta1380gtgaccgaga ttctgaactg cgtcaactac acggtcaaca cccagagcga actcgtggtt1440ccgatggata aaggagagcc gcgcgtgttc ttcccggcgg atctgatgcc cggcagtggg1500ctgtgcggac ttcctgtcgc gaatgtcacc tatgctgcct tgaggacgca gggtgcagcg1560gcggcggagg ctgccttgtc gctaggtatc aagactgatg cagcttctag tgctttgctt1620tctctggggc tgtctgtggt ggcgggtctg attgtgggga tgtggtaa 1668<210>10<211>1629<212>DNA
<213>黑曲霉<400>10atgttcagtt tcctcccctg cttcaaaact cgccgacaac gcaccaaatc ccaaactcaa 60tcccaaaagc aaatagagga aaaagccaac gccatagaat ccctcccctc atggcactcc 120cccacggaaa acaccctcct atttcaagcc ttcgaatggc acgtccccgc aacccccaac 180accgcggaca agcgcagcca ctggcgccgg ctccagcatg ccttaccagc tatccactcc 240ctcggtgtaa ccagcatctg gataccgcct ggatgcaagg gcatggacac aaatggaaat 300gggtatgata tctacgattt atatgatcta ggcgaattcg accagaaagg agcagtgcga 360acgaaatggg gcacgcgcgg agaattagag gatcttgttc gagatgcaaa tgctctgggc 420gtaggtgtat tatgggatgc ggtgttgaat cataaggctg gggcggatag cgtggagagg 480ttcgagggac gagatatcga agatggtaat ccccaacaaa tctccggctg gacgtccttc 540accttccccg gccgcggcac cacatacagc ccccttcaat accactggca gcacttcagc 600ggcgtcgact gggacgacgc ccaacaacgc aaagcaatct acaagatcct cgacccttcc 660cgccccgaca agaactgggc ccaggacgtc ggcacagacg agaacggcaa ctatgactac 720ctgatgttcg cggacctgga cttctcacac ccggaggtcc gggaggatgt actgcgctgg 780gggaagtgga ttatgtctgt gttgccgttg agcggaatgc ggttagatgc ggcgaagcat 840ttctcgacgg catttcagag ggactttatt gattgtgtgc ggcaggaggc cggggacagg 900aaggtatctg gaggagatgg agtatcgggt ggcggcggtg gatgtgccgc tggtagagag 960gttctcgagg ttgtcgaggg tgaagagggc ggatttgagg ggagtgttga gggggacgtt1020ggtggagagc aggccgggga atgcgttggt gagtttatcc cagtgatcca attcgggggt1080ggtgaggctg atcaaccggg acaaatgctc gagaccatcg tcgagccctc cttcaaaccc1140ctagcctacg ccctaatcct cctccgccaa ggaggccatc catgtgtctt ctacggcgac1200ctctacggca cctgcgacgg cgaccacccg ccaactcccg cctgcgaggg ccaacttccg1260aatctgatgc gtgcccgcaa gctgtacgcc tacggtgagc aggaggacta cttcgaccag1320cccaactgta ttggattcat ccgctacggc aacgccgccc acccctccgg actggcctgc1380gtcatgagca acggcggacc agccacgaag cgcatgtacg tgggtcggaa acatgccggc1440gagaagtgga cggatctgct gcagcgaggc ggtgatcacc cgtctgtcac ggtgattgat1500gaaatggggt acggggagtt tccggttcag agtatgaggg tgagtgtctg ggtggatagt1560
gcggcagatg gccgagaggg tgtcggggca gaatttgacg tcgatatcta cggcattcag1620gcactataa<210>11<211>1695<212>DNA<213>黑曲霉<400>11atgttatctt tcctcctatg gtgccatcca aagaagagga aggagagaca actatggaag 60cagattgaag aagaagctga gcacttggac cagcttccat catgggatgc tcccgacaac 120actttaatgc tgcaagcctt tgaatggcat gtgccagctg accaaggtca ctggcgtcgt 180cttcaccagg ccttaccaaa cttcaaggcg attggggtag acaacatatg gatcccgccc 240gggtgtaaag ctatgaatcc atctggtaac ggatatgata tttacgattt gtatgacttg 300ggagaattcg agcaaaaggg gtctcgagct actaaatggg gtaccaaaga ggagctccag 360tccttggtag ctgcagccca agatttcggt ataggtattt actgggacgc tgtcctcaat 420cacaaggcgg gagcagatta cgcagagcgc tttcaagctg tcagggttga cccacaggag 480cgtaatatga aaatcgcccc tgcagaggaa attgaaggct gggtgggatt caacttctct 540gggcgtggca accactatag ttcgatgaag tacaacaaaa accacttcag cggtatcgac 600tgggaccagt cgcgtcaaaa atgcggagtc tacaagatcc aaggacatga atgggcgaac 660gacgtcgcca atgagaacgg aaattacgac tatctcatgt tcgccaactt ggactactcc 720aacgcagaag tacgacgcga tgttctgaaa tgggccgagt ggctcaatgc tcaattgcct 780ctaagcggca tgaggttgga tgcggtcaaa cattactcgg ctggttttca gaaagagctt 840attgatcatc ttcgaactat tgctgggcca gactatttca tagtgggcga gtactggaaa 900ggcgagacca agccgttagt tgactacctg aagcagatgg actacaagct atcattgttc 960gattccgctc tggttgggcg gttctcaagc atttcacaga caccaggggc ggatcttcgc1020aacattttct ataatacatt ggtccaattg tacccagatc attctgtcgt gcaatatgcc1080ctttggcctc attctactaa catagatcca aagcaaccag gtcaatccct cgaagcgcca1140gtaacatcat tcttcaaacc cctcgcgtac gcccttatcc ttctccgtga ccaagggcaa1200
ccatgcatat tctacggaga cctttacggc ctccaagccg atgtcaaaga tccaatgaca1260ccgtcttgca ggggcaagct gtccatcctc acccgagctc gaaagctcta cgcatatggc1320ctgcaacgag attattttga caagccgaac tgcatcggtt ttgtccgcta tggtaaccgt1380cggcatccct ctggtcttgc atgcgtgatg agcaatgcgg gtccgtcgag gaagcggatg1440tatgttggtc gacgacacgc caagcaaaca tggaccgata tcctgcagtg gtgtgatcag1500actgttgtca ttgatgccaa gggatatgga gagtttccgg ttagtgcgat gagcgtgagt1560gtatgggtga actccgaggc tgaggggaga gatagcctct cacatcattt gtatgtccct1620gctcacagtc ttagtacgga tgatttgctg acgagtgctg aaattagtga tgagaacata1680tacaaactag cttaa 1695<210>12<211>1704<212>DNA<213>黑曲霉<400>12atggacgacg ggtggtggat catctcgttg ctggtggtaa ctctgggaat ccccacggtt 60aatgcggctt ccagagacca atggatcggt cgctctatct atcaaatcgt gaccgatcgc 120tttgctcgat cggataactc aaccaccgct gcttgtgatg cagcactagg aaactactgc 180ggaggctctt tccagggcat catcaataag ctggactaca tccaggagct cgggtttgat 240gcgatatgga tctctcccgc acaaagccaa atttccgccc gaacagcaga tctctcagca 300taccatggat attggcccaa tgatctgtat tccatcaact ctcattttgg cactcccaag 360gagctggaag ccttgtcctc tgccctgcac gatcgtggca tgtacttgat gcttgacatc 420gtggttggtg atatggcctg ggcgggaaat cacagcaccg tcgattacag caactttaat 480cctttcaatg atcagaagtt tttccatgat ttcaagctcc tctccagtga ccccacaaat 540gaaacttgtg ttctggattg ctggatggga gacaccgtcg tatcacttcc cgatctgcga 600aatgaagacc aacaagttca gaatattctt ggtacctgga tttcggggtt ggtttcgaac 660tactcaattg acggactgcg tattgacagc gtcttaaata tcgccccgga cttcttctcc 720aacttcacca agtcatcagg ggttttcact gtcggtgaag gtgccacggc cgatgcggct 780gatgtttgcc ctctgcagcc aagtttaaat gggcttttga attatccatt gtactatatt 840
cttaccgacg ccttcaacac gaccaacggg aacctgagca ccattaccga gtccataagc 900tacaccaaag gacagtgcga ggatgtcttg gctctgggga cgtttactgc aaaccaggat 960gttccgcgct tcggttcata cacgtcggat atttcgctgg cgcgcaatat cctgaccagc1020agtatgctga cggacggcat ccccatcctc tattacggcg aggagcagca tttgacagga1080tcctacaatc ctgtcaaccg tgaggctctg tggctgacca actactcgat gcgctcgacc1140tccctcccca ccctcgtcca atccctgaac cgccttcgat cgtatgctag cggggacggt1200gagcagtaca cgcaaaagtc gcaatctggg agcgattacc tctcgtacct gtcagcaccc1260atttacaatt ctacgcacat tctggccacg cgcaaggggt ttgcgggcaa tcagatcgtg1320agtgtcgtat ccaatctggg agccaagcca gccagcaaag ccaccacgaa aatcacgttg1380ggctcagacg agactggatt ccaatccaag cagaatgtga ccgagatctt atcgtgcaag1440acgtatgtca cggattccag cgggaatctg gcagtggatc tgagctcgga cgggggtccg1500cgcgtgtact atcccacgga cagcctgaag gacagcactg atatctgtgg tgatcagacc1560aaatcggcga ccccgagtag ctccgcagcc tcgtccgcga gcttgaccca gtccaagggt1620tcagagacct gtttgtttgg ggtgccgttg gggataagca cattggtggt cacagttgcg1680atggccacgt cctacgtgtt ctag 1704<210>13<211>494<212>PRT<213>黑曲霉<400>13Met Thr Ile Phe Leu Phe Leu Ala Ile Phe Val Ala Thr Ala Leu Ala1 5 10 15Ala Thr Pro Ala Glu Trp Arg Ser Gln Ser Ile Tyr Phe Leu Leu Thr20 25 30Asp Arg Phe Ala Arg Thr Asp Asn Ser Thr Thr Ala Ser Cys Asp Leu35 40 45Ser Ala Arg Gln Tyr Cys Gly Gly Ser Trp Gln Gly Ile Ile Asn Gln50 55 60Leu Asp Tyr Ile Gln Gly Met Gly Phe Thr Ala Ile Trp Ile Thr Pro65 70 75 80
Val Thr Ala Gln Ile Pro Gln Asp Thr Gly Tyr Gly Gln Ala Tyr His85 90 95Gly Tyr Trp Gln Gln Asp Ala Tyr Ala Leu Asn Ser His Tyr Gly Thr100 105 110Ala Asp Asp Leu Lys Ala Leu Ala Ser Ala Leu His Ser Arg Gly Met115 120 125Tyr Leu Met Val Asp Val Val Ala Asn His Met Gly His Asn Gly Thr130 135 140Gly Ser Ser Val Asp Tyr Ser Val Tyr Arg Pro Phe Asn Ser Gln Lys145 150 155 160Tyr Phe His Asn Leu Cys Trp Ile Ser Asp Tyr Asn Asn Gln Thr Asn165 170 175Val Glu Asp Cys Trp Leu Gly Asp Asn Thr Val Ala Leu Pro Asp Leu180 185 190Asp Thr Thr Ser Thr Glu Val Lys Asn Met Trp Tyr Asp Trp Val Glu195 200 205Ser Leu Val Ser Asn Tyr Ser Val Asp Gly Leu Arg Val Asp Thr Val210 215 220Lys Asn Val Gln Lys Asn Phe Trp Pro Gly Tyr Asn Asn Ala Ser Gly225 230 235 240Val Tyr Cys Ile Gly Glu Val Phe Asp Gly Asp Ala Ser Tyr Thr Cys245 250 255Pro Tyr Gln Glu Asp Leu Asp Gly Val Leu Asn Tyr Pro Met Tyr Tyr260 265 270Pro Leu Leu Arg Ala Phe Glu Ser Thr Asn Gly Ser Ile Ser Asp Leu275 280 285Tyr Asn Met Ile Asn Thr Val Lys Ser Thr Cys Arg Asp Ser Thr Leu290 295 300
Leu Gly Thr Phe Val Glu Asn His Asp Asn Pro Arg Phe Ala Lys Ser305 310 315 320Tyr Thr Ser Asp Met Ser Leu Ala Lys Asn Ala Ala Thr Phe Thr Ile325 330 335Leu Ala Asp Gly Ile Pro Ile Ile Tyr Ala Gly Gln Glu Gln His Tyr340 345 350Ser Gly Gly Asn Asp Pro Tyr Asn Arg Glu Ala Thr Trp Leu Ser Gly355 360 365Tyr Lys Thr Thr Ser Glu Leu Tyr Thr His Ile Ala Ala Ser Asn Lys370 375 380Ile Arg Thr His Ala Ile Lys Gln Asp Thr Gly Tyr Leu Thr Tyr Lys385 390 395 400Asn Tyr Pro Ile Tyr Gln Asp Thr Ser Thr Leu Ala Met Arg Lys Gly405 410 415Tyr Asn Gly Thr Gln Thr Ile Thr Val Leu Ser Asn Leu Gly Ala Ser420 425 430Gly Ser Ser Tyr Thr Leu Ser Leu Pro Gly Thr Gly Tyr Thr Ala Gly435 440 445Gln Lys Ile Thr Glu Ile Tyr Thr Cys Thr Asn Leu Thr Val Asn Ser450 455 460Asn Gly Ser Val Pro Val Pro Met Lys Ser Gly Leu Pro Arg Ile Leu465 470 475 480Tyr Pro Ala Asp Lys Leu Val Asn Gly Ser Ser Phe Cys Ser485 490<210>14<211>549<212>PRT<213>黑曲霉
<400>14Met Phe Arg Lys Ser Ala Ser Leu Leu Gly Gln Arg Leu Met Ala Val1 5 10 15Cys Leu Leu Cys Trp Cys Val Ser Leu Ala Thr Ala Ala Ser Thr Glu20 25 30Glu Trp Lys Thr Arg Ser Ile Tyr Gln Thr Met Thr Asp Arg Phe Ala35 40 45Leu Thr Asn Gly Ser Thr Thr Ala Pro Cys Asn Thr Thr Val Ala Asn50 55 60Tyr Cys Gly Gly Ser Trp Gln Gly Thr Ile Asp Lys Leu Asp Tyr Ile65 70 75 80Gln Gly Met Gly Phe Asp Ala Ile Met Ile Ser Pro Val Ile Lys Asn85 90 95Ile Ala Gly Arg Ser Lys Asp Gly Glu Ala Tyr His Gly Tyr Trp Pro100 105 110Leu Asp Leu Tyr Glu Ile Asn Ser His Phe Gly Thr Arg Glu Glu Leu115 120 125Leu Lys Leu Ser Glu Glu Ile His Ala Arg Gly Met Tyr Leu Leu Leu130 135 140Asp Val Val Ile Asn Asn Met Ala Tyr Met Thr Asp Gly Glu Asp Pro145 150 155 160Ala Thr Thr Ile Asp Tyr Asn Val Phe Pro Gln Phe Asn Gly Ser Ser165 170 175Tyr Phe His Pro Tyr Cys Leu Ile Thr Asn Trp Asn Asn Tyr Thr Asp180 185 190Ala Gln Trp Cys Gln Thr Gly Asp Asn Tyr Thr Ala Leu Pro Asp Leu195 200 205Tyr Thr Glu His Thr Ala Val Gln Asn Ile Leu Met Asp Trp Ser Lys
210 215 220Ser Val Ile Ser Asn Tyr Ser Val Asp Gly Leu Arg Ile Asp Ala Ala225 230 235 240Lys Ser Leu Thr Pro Ser Phe Leu Pro Thr Tyr Ala Ser Thr Val Gly245 250 255Gly Phe Met Thr Gly Glu Val Met Asp Ser Asn Ala Thr Asn Val Cys260 265 270Lys Tyr Gln Thr Asp Tyr Leu Pro Ser Leu Pro Asn Tyr Pro Leu Tyr275 280 285Tyr Ser Met Ile Thr Ala Phe Leu Asn Gly Glu Pro Ala Thr Leu Leu290 295 300Glu Glu Ile Ala Thr Ile Asn Asp Leu Cys Pro Asp Thr Phe Ala Met305 310 315 320Val Asn Phe Ile Glu Asp Gln Asp Val Asp Arg Trp Ala Tyr Met Asn325 330 335Asp Asp Ile Met Leu Ala Lys Thr Ala Leu Thr Phe Met Met Leu Tyr340 345 350Asp Gly Ile Pro Leu Val Tyr Gln Gly Leu Glu Gln Ala Ile Ala Tyr355 360 365Ser Asn Arg Ala Ala Leu Trp Leu Thr Asp Phe Asp Thr Asn Ala Thr370 375 380Leu Tyr Lys His Ile Lys Lys Leu Asn Ala Ile Arg Lys His Ala Ile385 390 395 400Asn Leu Asp Ser Ser Tyr Ile Ser Ser Lys Thr Tyr Pro Ile Tyr Gln405 410 415Gly Gly Ser Glu Leu Ala Phe Trp Lys Gly Asn Asn Gly Arg Gln Val420 425 430Ile Met Val Leu Ser Thr Ala Gly Ser Asn Gly Ser Ala Tyr Thr Leu435 440 445
Thr Leu Pro Val Ser Tyr Gly Ala Ser Glu Val Val Thr Glu Val Leu450 455 460Asn Cys Val Asn Tyr Thr Val Asn Thr Tyr Ser Gln Leu Val Val Asp465 470 475 480Met Asp Lys Gly Glu Pro Arg Val Phe Phe Pro Ala Ser Met Met Pro485 490 495Gly Ser Gly Leu Cys Gly Tyr Asn Thr Ser Asn Val Thr Tyr Ser Glu500 505 510Leu Arg Leu Ala Ala Val Gly Ser Ser Ser Ser Ala Gly Ser His Ser515 520 525Val Ile Pro Ser Ala Phe Ala Ser Leu Phe Met Ala Ile Val Ala Phe530 535 540Leu Ala Phe Arg Ile545<210>15<211>555<212>PRT<213>黑曲霉<400>15Met Val Ser Met Ser Ala Leu Arg His Gly Leu Gly Val Leu Tyr Leu1 5 10 15Ala Ser Trp Leu Gly Ser Ser Leu Ala Ala Ser Thr Glu Gln Trp Lys20 25 30Ser Arg Ser Ile Tyr Gln Thr Met Thr Asp Arg Phe Ala Arg Thr Asp35 40 45Gly Ser Thr Thr Ser Pro Cys Asn Thr Thr Glu Gly Leu Tyr Cys Gly50 55 60
Gly Thr Trp Arg Gly Met Ile Asn His Leu Asp Tyr Ile Gln Gly Met65 70 75 80Gly Phe Asp Ala Val Met Ile Ser Pro Ile Ile Glu Asn Val Glu Gly85 90 95Arg Val Glu Tyr Gly Glu Ala Tyr His Gly Tyr Trp Pro Val Asp Leu100 105 110Tyr Ser Leu Asn Ser His Phe Gly Thr His Gln Asp Leu Leu Asp Leu115 120 125Ser Asp Ala Leu His Ala Arg Asp Met Tyr Leu Met Met Asp Thr Val130 135 140Ile Asn Asn Met Ala Tyr Ile Thr Asn Gly Ser Asp Pro Ala Thr His145 150 155 160Ile Asp Tyr Ser Thr Leu Thr Pro Phe Asn Ser Ser Ser Tyr Tyr His165 170 175Pro Tyr Cys Lys Ile Thr Asp Trp Asn Asn Phe Thr Asn Ala Gln Leu180 185 190Cys Gln Thr Gly Asp Asn Ile Val Ala Leu Pro Asp Leu Tyr Thr Glu195 200 205His Ala Glu Val Gln Glu Thr Leu Ser Asn Trp Ala Lys Glu Val Ile210 215 220Ser Thr Tyr Ser Ile Asp Gly Leu Arg Ile Asp Ala Ala Lys His Val225 230 235 240Asn Pro Gly Phe Leu Lys Asn Phe Gly Asp Ala Leu Asp Ile Phe Met245 250 255Thr Gly Glu Val Leu Gln Gln Glu Val Ser Thr Ile Cys Asp Tyr Gln260 265 270Asn Asn Tyr Ile Gly Ser Leu Pro Asn Tyr Pro Val Tyr Tyr Ala Met275 280 285
Leu Lys Ala Phe Thr Leu Gly Asn Thr Ser Ala Leu Ala Thr Gln Val290 295 300Gln Ser Met Lys Asn Ser Cys Asn Asp Val Thr Ala Leu Ser Ser Phe305 310 315 320Ser Glu Asn His Asp Val Ala Arg Phe Ala Ser Met Thr His Asp Met325 330 335Ala Leu Ala Lys Asn Ile Leu Thr Phe Thr Leu Leu Phe Asp Gly Val340 345 350Pro Met Ile Tyr Gln Gly Gln Glu Gln His Leu Asp Gly Pro Gly Ser355 360 365Pro Glu Asn Arg Glu Ala Ile Trp Leu Ser Glu Tyr Asn Thr Asp Ala370 375 380Glu Leu Tyr Lys Leu Ile Gly Lys Leu Asn Ala Ile Arg Lys His Ala385 390 395 400Tyr Arg Leu Asp Asn His Tyr Pro Asp Val Glu Thr Tyr Pro Ile Phe405 410 415Glu Gly Gly Ser Glu Leu Gly Phe Arg Lys Gly Ile Glu Gly Arg Gln420 425 430Val Val Met Leu Leu Ser Thr Gln Gly Thr Asn Ser Ser Ala Tyr Asn435 440 445Leu Ser Met Pro Val Ser Phe Thr Gly Gly Thr Val Val Thr Glu Ile450 455 460Leu Asn Cys Val Asn Tyr Thr Val Asn Thr Gln Ser Glu Leu Val Val465 470 475 480Pro Met Asp Lys Gly Glu Pro Arg Val Phe Phe Pro Ala Asp Leu Met485 490 495Pro Gly Ser Gly Leu Cys Gly Leu Pro Val Ala Asn Val Thr Tyr Ala500 505 510Ala Leu Arg Thr Gln Gly Ala Ala Ala Ala Glu Ala Ala Leu Ser Leu
515 520 525Gly Ile Lys Thr Asp Ala Ala Ser Ser Ala Leu Leu Ser Leu Gly Leu530 535 540Ser Val Val Ala Gly Leu Ile Val Gly Met Trp545 550 555<210>16<211>542<212>PRT<213>黑曲霉<400>16Met Phe Ser Phe Leu Pro Cys Phe Lys Thr Arg Arg Gln Arg Thr Lys1 5 10 15Ser Gln Thr Gln Ser Gln Lys Gln Ile Glu Glu Lys Ala Asn Ala Ile20 25 30Glu Ser Leu Pro Ser Trp His Ser Pro Thr Glu Asn Thr Leu Leu Phe35 40 45Gln Ala Phe Glu Trp His Val Pro Ala Thr Pro Asn Thr Ala Asp Lys50 55 60Arg Ser His Trp Arg Arg Leu Gln His Ala Leu Pro Ala Ile His Ser65 70 75 80Leu Gly Val Thr Ser Ile Trp Ile Pro Pro Gly Cys Lys Gly Met Asp85 90 95Thr Asn Gly Asn Gly Tyr Asp Ile Tyr Asp Leu Tyr Asp Leu Gly alu100 105 110Phe Asp Gln Lys Gly Ala Val Arg Thr Lys Trp Gly Thr Arg Gly Glu115 120 125Leu Glu Asp Leu Val Arg Asp Ala Asn Ala Leu Gly Val Gly Val Leu130 135 140
Trp Asp Ala Val Leu Asn His Lys Ala Gly Ala Asp Ser Val Glu Arg145 150 155 160Phe Glu Gly Arg Asp Ile Glu Asp Gly Asn Pro Gln Gln Ile Ser Gly165 170 175Trp Thr Ser Phe Thr Phe Pro Gly Arg Gly Thr Thr Tyr Ser Pro Leu180 185 190Gln Tyr His Trp Gln His Phe Ser Gly Val Asp Trp Asp Asp Ala Gln195 200 205Gln Arg Lys Ala Ile Tyr Lys Ile Leu Asp Pro Ser Arg Pro Asp Lys210 215 220Asn Trp Ala Gln Asp Val Gly Thr Asp Glu Asn Gly Asn Tyr Asp Tyr225 230 235 240Leu Met Phe Ala Asp Leu Asp Phe Ser His Pro Glu Val Arg Glu Asp245 250 255Val Leu Arg Trp Gly Lys Trp Ile Met Ser Val Leu Pro Leu Ser Gly260 265 270Met Arg Leu Asp Ala Ala Lys His Phe Ser Thr Ala Phe Gln Arg Asp275 280 285Phe Ile Asp Cys Val Arg Gln Glu Ala Gly Asp Arg Lys Val Ser Gly290 295 300Gly Asp Gly Val Ser Gly Gly Gly Gly Gly Cys Ala Ala Gly Arg Glu305 310 315 320Val Leu Glu Val Val Glu Gly Glu Glu Gly Gly Phe Glu Gly Ser Val325 330 335Glu Gly Asp Val Gly Gly Glu Gln Ala Gly Glu Cys Val Gly Glu Phe340 345 350Ile Pro Val Ile Gln Phe Gly Gly Gly Glu Ala Asp Gln Pro Gly Gln355 360 365
Met Leu Glu Thr Ile Val Glu Pro Ser Phe Lys Pro Leu Ala Tyr Ala370 375 380Leu Ile Leu Leu Arg Gln Gly Gly His Pro Cys Val Phe Tyr Gly Asp385 390 395 400Leu Tyr Gly Thr Cys Asp Gly Asp His Pro Pro Thr Pro Ala Cys Glu405 410 415Gly Gln Leu Pro Asn Leu Met Arg Ala Arg Lys Leu Tyr Ala Tyr Gly420 425 430Glu Gln Glu Asp Tyr Phe Asp Gln Pro Asn Cys Ile Gly Phe Ile Arg435 440 445Tyr Gly Asn Ala Ala His Pro Ser Gly Leu Ala Cys Val Met Ser Asn450 455 460Gly Gly Pro Ala Thr Lys Arg Met Tyr Val Gly Arg Lys His Ala Gly465 470 475 480Glu Lys Trp Thr Asp Leu Leu Gln Arg Gly Gly Asp His Pro Ser Val485 490 495Thr Val Ile Asp Glu Met Gly Tyr Gly Glu Phe Pro Val Gln Ser Met500 505 510Arg Val Ser Val Trp Val Asp Ser Ala Ala Asp Gly Arg Glu Gly Val515 520 525Gly Ala Glu Phe Asp Val Asp Ile Tyr Gly Ile Gln Ala Leu530535 540<210>17<211>564<212>PRT<213>黑曲霉<400>17
Met Leu Ser Phe Leu Leu Trp Cys His Pro Lys Lys Arg Lys Glu Arg1 5 10 15Gln Leu Trp Lys Gln Ile Glu Glu Glu Ala Glu His Leu Asp Gln Leu20 25 30Pro Ser Trp Asp Ala Pro Asp Asn Thr Leu Met Leu Gln Ala Phe Glu35 40 45Trp His Val Pro Ala Asp Gln Gly His Trp Arg Arg Leu His Gln Ala50 55 60Leu Pro Asn Phe Lys Ala Ile Gly Val Asp Asn Ile Trp Ile Pro Pro65 70 75 80Gly Cys Lys Ala Met Asn Pro Ser Gly Asn Gly Tyr Asp Ile Tyr Asp85 90 95Leu Tyr Asp Leu Gly Glu Phe Glu Gln Lys Gly Ser Arg Ala Thr Lys100 105 110Trp Gly Thr Lys Glu Glu Leu Gln Ser Leu Val Ala Ala Ala Gln Asp115 120 125Phe Gly Ile Gly Ile Tyr Trp Asp Ala Val Leu Asn His Lys Ala Gly130 135 140Ala Asp Tyr Ala Glu Arg Phe Gln Ala Val Arg Val Asp Pro Gln Gln145 150 155 160Arg Asn Met Lys Ile Ala Pro Ala Glu Glu Ile Glu Gly Trp Val Gly165 170 175Phe Asn Phe Ser Gly Arg Gly Asn His Tyr Ser Ser Met Lys Tyr Asn180 185 190Lys Asn His Phe Ser Gly Ile Asp Trp Asp Gln Ser Arg Gln Lys Cys195 200 205Gly Val Tyr Lys Ile Gln Gly His Glu Trp Ala Asn Asp Val Ala Asn210 215 220Glu Asn Gly Asn Tyr Asp Tyr Leu Met Phe Ala Asn Leu Asp Tyr Ser
225 230 235 240Asn Ala Glu Val Arg Arg Asp Val Leu Lys Trp Ala Glu Trp Leu Asn245 250 255Ala Gln Leu Pro Leu Ser Gly Met Arg Leu Asp Ala Val Lys His Tyr260 265 270Ser Ala Gly Phe Gln Lys Glu Leu Ile Asp His Leu Arg Thr Ile Ala275 280 285Gly Pro Asp Tyr Phe Ile Val Gly Glu Tyr Trp Lys Gly Glu Thr Lys290 295 300Pro Leu Val Asp Tyr Leu Lys Gln Met Asp Tyr Lys Leu Ser Leu Phe305 310 315 320Asp Ser Ala Leu Val Gly Arg Phe Ser Ser Ile Ser Gln Thr Pro Gly325 330 335Ala Asp Leu Arg Asn Ile Phe Tyr Asn Thr Leu Val Gln Leu Tyr Pro340 345 350Asp His Ser Val Val Gln Tyr Ala Leu Trp Pro His Ser Thr Asn Ile355 360 365Asp Pro Lys Gln Pro Gly Gln Ser Leu Glu Ala Pro Val Thr Ser Phe370 375 380Phe Lys Pro Leu Ala Tyr Ala Leu Ile Leu Leu Arg Asp Gln Gly Gln385 390 395 400Pro Cys Ile Phe Tyr Gly Asp Leu Tyr Gly Leu Gln Ala Asp Val Lys405 410 415Asp Pro Met Thr Pro Ser Cys Arg Gly Lys Leu Ser Ile Leu Thr Arg420 425 430Ala Arg Lys Leu Tyr Ala Tyr Gly Leu Gln Arg Asp Tyr Phe Asp Lys435 440 445Pro Asn Cys Ile Gly Phe Val Arg Tyr Gly Asn Arg Arg His Pro Ser450 455 460
Gly Leu Ala Cys Val Met Ser Asn Ala Gly Pro Ser Arg Lys Arg Met465 470 475 480Tyr Val Gly Arg Arg His Ala Lys Gln Thr Trp Thr Asp Ile Leu Gln485 490 495Trp Cys Asp Gln Thr Val Val Ile Asp Ala Lys Gly Tyr Gly Glu Phe500 505 510Pro Val Ser Ala Met Ser Val Ser Val Trp Val Asn Ser Glu Ala Glu515 520 525Gly Arg Asp Ser Leu Ser His His Leu Tyr Val Pro Ala His Ser Leu530 535 540Ser Thr Asp Asp Leu Leu Thr Ser Ala Glu Ile Ser Asp Glu Asn Ile545 550 555 560Tyr Lys Leu Ala<210>18<211>567<212>PRT<213>黑曲霉<400>18Met Asp Asp Gly Trp Trp Ile Ile Ser Leu Leu Val Val Thr Leu Gly1 5 10 15Ile Pro Thr Val Asn Ala Ala Ser Arg Asp Gln Trp Ile Gly Arg Ser20 25 30Ile Tyr Gln Ile Val Thr Asp Arg Phe Ala Arg Ser Asp Asn Ser Thr35 40 45Thr Ala Ala Cys Asp Ala Ala Leu Gly Asn Tyr Cys Gly Gly Ser Phe50 55 60
Gln Gly Ile Ile Asn Lys Leu Asp Tyr Ile Gln Glu Leu Gly Phe Asp65 70 75 80Ala Ile Trp Ile Ser Pro Ala Gln Ser Gln Ile Ser Ala Arg Thr Ala85 90 95Asp Leu Ser Ala Tyr His Gly Tyr Trp Pro Asn Asp Leu Tyr Ser Ile100 105 110Asn Ser His Phe Gly Thr Pro Lys Glu Leu Glu Ala Leu Ser Ser Ala115 120 125Leu His Asp Arg Gly Met Tyr Leu Met Leu Asp Ile Val Val Gly Asp130 135 140Met Ala Trp Ala Gly Asn His Ser Thr Val Asp Tyr Ser Asn Phe Asn145 150 155 160Pro Phe Asn Asp Gln Lys Phe Phe His Asp Phe Lys Leu Leu Ser Ser165 170 175Asp Pro Thr Asn Glu Thr Cys Val Leu Asp Cys Trp Met Gly Asp Thr180 185 190Val Val Ser Leu Pro Asp Leu Arg Asn Glu Asp Gln Gln Val Gln Asn195 200 205Ile Leu Gly Thr Trp Ile Ser Gly Leu Val Ser Asn Tyr Ser Ile Asp210 215 220Gly Leu Arg Ile Asp Ser Val Leu Asn Ile Ala Pro Asp Phe Phe Ser225 230 235 240Asn Phe Thr Lys Ser Ser Gly Val Phe Thr Val Gly Glu Gly Ala Thr245 250 255Ala Asp Ala Ala Asp Val Cys Pro Leu Gln Pro Ser Leu Asn Gly Leu260 265 270Leu Asn Tyr Pro Leu Tyr Tyr Ile Leu Thr Asp Ala Phe Asn Thr Thr275 280 285Asn Gly Asn Leu Ser Thr Ile Thr Glu Ser Ile Ser Tyr Thr Lys Gly
290 295 300Gln Cys Glu Asp Val Leu Ala Leu Gly Thr Phe Thr Ala Asn Gln Asp305 310 315 320Val Pro Arg Phe Gly Ser Tyr Thr Ser Asp Ile Ser Leu Ala Arg Asn325 330 335Ile Leu Thr Ser Ser Met Leu Thr Asp Gly Ile Pro Ile Leu Tyr Tyr340 345 350Gly Glu Glu Gln His Leu Thr Gly Ser Tyr Asn Pro Val Asn Arg Glu355 360 365Ala Leu Trp Leu Thr Asn Tyr Ser Met Arg Ser Thr Ser Leu Pro Thr370 375 380Leu Val Gln Ser Leu Asn Arg Leu Arg Ser Tyr Ala Ser Gly Asp Gly385 390 395 400Glu Gln Tyr Thr Gln Lys Ser Gln Ser Gly Ser Asp Tyr Leu Ser Tyr405 410 415Leu Ser Ala Pro Ile Tyr Asn Ser Thr His Ile Leu Ala Thr Arg Lys420 425 430Gly Phe Ala Gly Asn Gln Ile Val Ser Val Val Ser Asn Leu Gly Ala435 440 445Lys Pro Ala Ser Lys Ala Thr Thr Lys Ile Thr Leu Gly Ser Asp Glu450 455 460Thr Gly Phe Gln Ser Lys Gln Asn Val Thr Glu Ile Leu Ser Cys Lys465 470 475 480Thr Tyr Val Thr Asp Ser Ser Gly Asn Leu Ala Val Asp Leu Ser Ser485 490 495Asp Gly Gly Pro Arg Val Tyr Tyr Pro Thr Asp Ser Leu Lys Asp Ser500 505 510Thr Asp Ile Cys Gly Asp Gln Thr Lys Ser Ala Thr Pro Ser Ser Ser515 520 525
Ala Ala Ser Ser Ala Ser Leu Thr Gln Ser Lys Gly Ser Glu Thr Cys530 535 540Leu Phe Gly Val Pro Leu Gly Ile Ser Thr Leu Val Val Thr Val Ala545 550 555 560Met Ala Thr Ser Tyr Val Phe
权利要求
1)一种分离的多核苷酸,其可与选自下组的多核苷酸杂交,所述的组由SEQ ID NO1,SEQ ID NO2,SEQ ID NO3,SEQ ID NO4,SEQ ID NO5或SEQ ID NO6组成,或由SEQ ID NO7,SEQID NO8,SEQ ID NO9,SEQ ID NO10,SEQ ID NO11或SEQ IDNO12组成。
2)如权利要求1所述的分离的多核苷酸,其可在高度严格条件下与选自下组的多核苷酸杂交,所述的组由SEQ ID NO1,SEQ IDNO2,SEQ ID NO3,SEQ ID NO4,SEQ ID NO5或SEQ ID NO6组成,或由SEQ ID NO7,SEQ ID NO8,SEQ ID NO9,SEQ IDNO10,SEQ ID NO11或SEQ ID NO12组成。
3)如权利要求1或2所述的分离的多核苷酸,其可由丝状真菌获得。
4)如权利要求3所述的分离的多核苷酸,其可由黑曲霉(A.niger)获得。
5)一种分离的多核苷酸,其编码包含下述氨基酸序列的多肽,所述的氨基酸序列选自SEQ ID NO13,SEQ ID NO14,SEQ ID NO15,SEQ ID NO16,SEQ ID NO17或SEQ ID NO18或它们的功能等同物。
6)一种分离的多核苷酸,其编码具有下述氨基酸序列的多肽的至少一个功能性结构域,所述的氨基酸序列选自SEQ ID NO13,SEQID NO14,S EQ ID NO15,SEQ ID NO16,SEQ ID NO17或SEQID NO18或它们的功能等同物。
7)一种分离的多核苷酸,其包含下述的核苷酸序列,所述的核苷酸序列选自SEQ ID NO1,SEQ ID NO2,SEQ ID NO3,SEQ IDNO4,SEQ ID NO5或SEQ ID NO6,或选自SEQ ID NO7,SEQID NO8,SEQ ID NO9,SEQ ID NO10,SEQ ID NO11或SEQ IDNO12,或它们的功能等同物。
8)一种分离的多核苷酸序列,该多核苷酸序列选自SEQ ID NO1,SEQ ID NO2,SEQ ID NO3,SEQ ID NO4,SEQ ID NO5或SEQID NO6,或选自SEQ ID NO7,SEQ ID NO8,SEQ ID NO9,SEQID NO10,SEQ ID NO11或SEQ ID NO12。
9)一种包含如权利要求1-8中所述多核苷酸序列的载体。
10)如权利要求9所述的载体,其中如权利要求1-8所述的多核苷酸序列与适于所述多核苷酸序列在合适的宿主细胞中表达的调节序列可操作地连接。
11)如权利要求10所述的载体,其中所述合适的宿主细胞是丝状真菌。
12)生产如权利要求1-8所述多核苷酸或如权利要求9-11所述载体的方法,该方法包括下述步骤培养用所述多核苷酸或所述载体转化的宿主细胞;和从所述宿主细胞中分离所述的多核苷酸或所述的载体。
13)一种具有下述氨基酸序列的分离的多肽,所述的氨基酸序列选自SEQ ID NO13,SEQ ID NO14,SEQ ID NO15,SEQ ID NO16,SEQ ID NO17或SEQ ID NO18或它们的功能等同物。
14)如权利要求15所述的分离的多肽,其可由黑曲霉获得。
15)一种分离的多肽,其可由如权利要求1-8所述的多核苷酸或如权利要求9-11所述的载体在合适的宿主细胞如黑曲霉中表达所得。
16)重组淀粉酶,其包含如权利要求13-15所述任意多肽的功能性结构域。
17)生产如权利要求13-16所述多肽的方法,该方法包括下述步骤用如权利要求1-8所述的分离的多核苷酸或如权利要求9-11所述的载体转化合适的宿主细胞;在可使所述多核苷酸表达的条件下培养所述细胞;和可选择地从上述细胞或培养基中纯化所编码的多肽。
18)一种重组宿主细胞,其包含如权利要求1-8所述的多核苷酸或如权利要求9-11所述的载体。
19)表达如权利要求13-16所述多肽的重组宿主细胞。
20)经纯化的抗体,其可与如权利要求13-16所述的多肽反应。
21)融合蛋白,其包含如权利要求13-16所述多肽序列。
22)如权利要求1-8所述的分离的多核苷酸,或如权利要求9-11所述的载体,或如权利要求13-15所述的分离的多肽,或如权利要求16或21所述的重组蛋白在烘焙生产中的用途。
全文摘要
本发明涉及新鉴定的多核苷酸序列,该多核苷酸序列包含编码从黑曲霉(Aspergillus niger)中分离的新淀粉酶的基因。本发明包括新基因的全长核苷酸序列,包含新淀粉酶全长编码序列的cDNA序列,以及全长功能蛋白的氨基酸序列及其功能等同物。本发明还涉及这些酶在工业生产中的应用方法和真菌感染诊断方法。本发明还包括用本发明的多核苷酸转化的细胞,和其中本发明的淀粉酶经遗传修饰使其活性和/或表达水平得以提高或降低的细胞。
文档编号C07K19/00GK1543505SQ02816038
公开日2004年11月3日 申请日期2002年8月2日 优先权日2001年8月16日
发明者D·梅尔, A·斯托克, C·瓦格纳, U·福尔克斯, K·阿尔伯曼, S·霍普, D 梅尔, 怂, 衲, 锌 申请人:Dsmip资产有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1