酵母中生产古细菌蛋白酶的方法

文档序号：511392阅读：384来源：国知局

酵母中生产古细菌蛋白酶的方法
【专利摘要】本发明涉及在酵母中生产蛋白酶的方法，其包括：提供包括至少一个多核苷酸表达构建体的酵母宿主细胞，该多核苷酸表达构建体编码与第二多肽翻译融合的由该宿主细胞分泌的第一多肽，其中该第二多肽是具有与SEQ?ID?NO:2类似的成熟氨基酸序列的蛋白酶；相应的酵母宿主细胞和表达构建体。
【专利说明】酵母中生产古细菌蛋白酶的方法
[0001]对序列表的引用
[0002]本申请包含计算机可读形式的序列表。该计算机可读形式并入本文以作参考。
【技术领域】
[0003]本发明涉及通过表达融合蛋白在酵母中微生物生产蛋白酶多肽。下面例举的生产为源自古细菌激烈火球菌(Pyrococcus furiosus)的蛋白酶。
【背景技术】
[0004]目前以多种方式工业化生产蛋白或多肽，所有这些均涉及生产蛋白的微生物的培养。优化工业蛋白产量的数种方法在本领域中是熟知的并且正被常规地利用，诸如操纵生长培养基、改造微生物例如通过影响期望蛋白的编码基因的表达的对遗传元件如启动子和信号序列等的突变、变异，以及操纵基因本身，以便例如增强蛋白稳定性或活性。
[0005]先前已描述了融合蛋白作为生产其他方式难以获得的蛋白的一种方式，一个实例可以是活性人抗体(Goshorn, S.C.等人，Cancer Research, 1993, Vol.53 (9)pp.2123-2127)或在芽孢杆菌属宿主中生产工业酶(W000/75344)。

【发明内容】

[0006]来自极端微生物的酶常常具有工业应用感兴趣的性质，例如，非常高的热稳定性。然而，它们可能难以以工业相关的量并以活性形式生产。
[0007]本发明人发现，来源于古细菌激烈火球菌的蛋白酶难以在面包酵母(baker’ syeast)、酿酒酵母(Saccharomyces cerevisiae)中表达,即使是从设计用于在酵母中和分泌信号(该分泌信号通常在酵母中良好运作)一起表达的合成基因中表达时也是如此(参见实施例1)。
[0008]然而，令人惊奇地发现，当古细菌蛋白酶与三个不同的异源真菌分泌的载体蛋白之中任一者翻译融合而表达时，蛋白酶可以以其成熟和活性形式由酿酒酵母生产和分泌(参见实施例2)。
[0009]因此，在第一方面，本发明涉及在酵母中生产蛋白酶的方法，包括:
[0010](a)提供包括至少一个多核苷酸表达构建体的酵母宿主细胞,该多核苷酸表达构建体编码与第二多肽翻译融合的由该宿主细胞分泌的第一多肽，其中该第二多肽选自:
[0011]⑴其成熟部分与SEQ ID NO: 2的成熟多肽；优选与SEQ ID NO: 2的位置[1-412](包含两端)具有至少60 %，例如至少65 %、至少70 %、至少75 %、至少80 %、至少85 %、至少90 %、至少91%、至少92 %、至少93 %、至少94 %、至少95 %、至少96 %、至少97 %、至少98%、至少99%、或100%氨基酸序列同一性的蛋白酶；
[0012](ii)其成熟部分由与SEQ ID NO:1的成熟多肽编码序列；优选与SEQ ID NO:1的位置[397-1632](包含两端)具有至少 60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96 %、至少97 %、至少98 %、至少99 %、或100 % DNA序列同一性的多核苷酸所编码的蛋白酶；
[0013](iii)其成熟部分由在低等严格条件、中等严格条件、中高等严格条件、高等严格条件或极高等严格条件下与SEQ ID NO:1的成熟多肽编码序列；优选与SEQ ID NO:1的位置[397-1632](包含两端)；或两者中任一者的全长互补物杂交的多核苷酸所编码的蛋白酶；
[0014](iv) SEQ ID NO: 2的成熟多肽、优选SEQ ID NO: 2的位置[1-412](包含两端)的变体，其包括在一个或多个位置上的取代、缺失和/或插入；和
[0015](V)⑴、(ii)、(iii)或(iv)多肽的具有蛋白酶活性的片段，
[0016](b)在有益于该第一多肽的表达和分泌的条件下培养宿主细胞，由此分泌翻译融合多肽并生产成熟蛋白酶；和
[0017](C)任选地，回收蛋白酶。
[0018]在第二方面，本发明涉及如第一方面的步骤(a)中所限定的酵母宿主细胞。
[0019]在最后一个方面，本发明涉及如第一方面的步骤(a)中所限定的多核苷酸表达构建体。
【具体实施方式】
[0020]
[0021]cDNA:术语“cDNA”是指可以通过逆转录由从真核或原核细胞得到的成熟的、已剪接的mRNA分子制备而来的DNA分子。cDNA缺少可存在于对应基因组DNA中的内含子序列。最初的初级RNA转录物是mRNA的前体，其在呈现为成熟的、已剪接的mRNA之前，通过一系列包括剪接在内的步骤进行加工。
[0022]编码序列:术语“编码序列”是指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界通常由开放阅读框决定，开放阅读框以起始密码子如ATG、GTG或TTG开始并以终止密码子如TAA、TAG或TGA结束。编码序列可以是基因组DNA、cDNA、合成的DNA或其组合。
[0023]控制序列:术语“控制序列”是指对于编码本发明成熟多肽的多核苷酸的表达为必需的核酸序列。各个控制序列对于编码多肽的多核苷酸可以是内生的(native)(即，来自相同基因)或外来的(foreign)(即，来自不同基因)，或者对于彼此是内生或外来的。这些控制序列包括但不限于，前导序列、多腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最小程度地，控制序列包括启动子以及转录和翻译终止信号。出于引入特定的限制性酶切位点以促进控制序列与编码多肽的多核苷酸的编码区连接的目的，控制序列可设有接头(linker)。
[0024]表达:术语“表达”包括多肽生产中所涉及的任何步骤，包括但不限于:转录、转录后修饰、翻译、翻译后修饰以及分泌。
[0025]表达载体:术语“表达载体”是指包括编码多肽的多核苷酸、并与用于其表达的控制序列可操作地连接的线性或环状DNA分子。
[0026]宿主细胞:术语“宿主细胞”是指对于用包含本发明多核苷酸的核酸构建体或表达载体进行的转化、转染、转导等是易感的(susceptible)任何细胞类型。术语“宿主细胞”包括由于在复制过程中发生突变而与亲本细胞不同的亲本细胞的任何后代。[0027]分离的:术语“分离的”是指处于非天然出现的形式或环境中的物质。分离的物质的非限制性实例包括:(I)任何非天然出现的物质；(2)包括但不限于任何酶、变体、核酸、蛋白、肽或辅助因子的任何物质，其至少部分地从与其天然相关的一种或多种或所有天然出现的成分中移出；(3)相对于天然出现的物质有人工修饰的任何物质；或者(4)通过增加物质相对于与其天然相关的其他组分的含量(例如，多个拷贝的物质编码基因；使用比与编码物质的基因天然相关的启动子更强的启动子)而修饰的任意物质。分离的物质可以存在于发酵液样本中。
[0028]成熟多肽:术语“成熟多肽”是指在翻译和任何翻译后修饰(例如N端加工、C端截短、糖基化、磷酸化等)之后处于其最终形式的多肽。一方面，成熟多肽是SEQ ID NO:2的氨基酸I~412。
[0029]成熟多肽编码序列:术语“成熟多肽编码序列”是指编码具有酶活性的成熟多肽的多核苷酸。一方面，成熟多肽编码序列是SEQ ID NO:1的核苷酸397~1632。
[0030]片段:术语“片段”意指从成熟多肽的氨基和/或羧基端缺失一个或多个(例如，若干个)氨基酸的多肽；其中该片段保留了其活性，例如保持了其衍生来源全长多肽的蛋白酶活性的蛋白酶片段。
[0031]极高等严格条件:术语“极高等严格条件”是指对于长度为至少100个核苷酸的探针，在42°C下在5X SSPE、0.3% SDS、200y g/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交并杂交，遵循标准Southern印迹过程进行12~24个小时。载体材料最终使用2XSSC.0.2% SDS在70°C下清洗三次，每次15分钟。
[0032]高等严格条件:术语“高等严格条件”是指对于长度为至少100个核苷酸的探针，在42°C下在5XSSPE、0.3% SDS、200 μ g/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交并杂交，遵循标准Southern印迹过程进行12~24个小时。载体材料最终使用2X SSC、0.2% SDS在65°C下清洗三次，每次15分钟。
[0033]中高等严格条件:术语“中高等严格条件”是指对于长度为至少100个核苷酸的探针，在42°C下在5X SSPE、0.3% SDS、200y g/ml剪切并变性的鲑鱼精子DNA和35%甲酰胺中预杂交并杂交，遵循标准Southern印迹过程进行12~24个小时。载体材料最终使用2XSSC.0.2% SDS在60°C下清洗三次，每次15分钟。
[0034]中等严格条件:术语“中等严格条件”是指对于长度为至少100个核苷酸的探针，在42°C下在5XSSPE、0.3% SDS、200 μ g/ml剪切并变性的鲑鱼精子DNA和35%甲酰胺中预杂交并杂交，遵循标准Southern印迹过程进行12~24个小时。载体材料最终使用2 X SSC、0.2% SDS在55°C下清洗三次，每次15分钟。
[0035]低等严格条件:术语“低等严格条件”是指对于长度为至少100个核苷酸的探针，在42°C下在5XSSPE、0.3% SDS、200 μ g/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交并杂交，遵循标准Southern印迹过程进行12~24个小时。载体材料最终使用2 X SSC、0.2% SDS在50°C下清洗三次，每次15分钟。
[0036]极低等严格条件:术语“极低等严格条件”是指对于长度为至少100个核苷酸的探针，在42°C下在5X SSPE、0.3% SDS、200y g/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交并杂交，遵循标准Southern印迹过程进行12~24个小时。载体材料最终使用2XSSC.0.2% SDS在45°C下清洗三次，每次15分钟。[0037]核酸构建体:术语“核酸构建体”是指从天然存在的基因中分离的、或以自然中不会另外出现的方式被修饰成包含核酸片段的、或合成的单链或双链的核酸分子，其包含一个或多个控制序列。
[0038]可操作地连接:术语“可操作地连接”是指如下的构造，其中控制序列相对于多核苷酸的编码序列安置在合适位置处，从而控制序列引导编码序列的表达。
[0039]序列同一性:两个氨基酸序列之间或者两个核苷酸序列之间的相关性通过参数“序列同一性”来描述。出于本发明的目的，使用在EMBOSS软件包(EMBOSS: The EuropeanMolecular Biology Open Software Suite (欧洲分子生物学开放软件包)，Rice 等人，2000, Trends Genet.16:276-277)(优选5.0.0版本或更新)的Needle程序中执行的Needleman-Wunsch 算法(Needleman and Wunsch, 1970，J.Mol.Biol.48:443-453)来确定两个氨基酸序列之间的序列同一性。使用的可选参数:空位开放罚分为10，空位扩展罚分为0.5，以及EBL0SUM62 (BL0SUM62的EMBOSS版本)替代矩阵。标记为“最长同一性”(使用-nobrief选项获得)的Needle输出用作百分比同一'I"生，计算如下:
[0040](相同残基X100)/(比对长度-比对中的空位总数)
[0041]出于本发明的目的，使用在EMBOSS软件包(EMB0SS:The European MolecularBiology Open Software Suite (欧洲分子生物学开放软件包)，Rice等人，2000,同上)(优选5.0.0版本或更新)的Needle程序中执行的Needleman-Wunsch算法(Needleman andWunsch，1970，同上)来确定两个脱氧核糖核苷酸序列之间的序列同一性。使用的可选参数:空位开放罚分为10，空位扩展罚分为0.5，以及EDNAFULL(NCBI NUC4.4的EMBOSS版本)替代矩阵。标记为“最长同一性”(使用-nobrief选项获得)的Needle输出用作百分比同一'I"生，计算如下:
[0042](相同脱氧核苷酸X100)/(比对长度-比对中的空位总数)
[0043]子序列:术语“子序列”是指从成熟多肽编码序列的5’和/或3’端缺失一个或多个(例如，若干个)核苷酸的多核苷酸；其中子序列编码保留了其活性的片段。
[0044]变体:术语“变体”是指在一个或多个(例如，若干个)位置上包含改变(即替换、插入和/或缺失)的具有酶活性的多肽。替换是指用不同的氨基酸取代占据某位置的氨基酸；缺失是指去除占据某位置的氨基酸；而插入是指将氨基酸添加至并紧邻占据某位置的氨基酸。
[0045]
【发明内容】

[0046]牛产方法
[0047]本发明的第一方面涉及在酵母中生产蛋白酶的方法，包括:
[0048](a)提供包括至少一个多核苷酸表达构建体的酵母宿主细胞,该多核苷酸表达构建体编码与第二多肽翻译融合的由该宿主细胞分泌的第一多肽，其中该第二多肽选自:
[0049]⑴其成熟部分与SEQ ID NO: 2的成熟多肽；优选与SEQ ID NO: 2的位置[1-412](包含两端)具有至少60 %，例如至少65 %、至少70 %、至少75 %、至少80 %、至少85 %、至少90 %、至少91%、至少92 %、至少93 %、至少94 %、至少95 %、至少96 %、至少97 %、至少98%、至少99%、或100%氨基酸序列同一性的蛋白酶；
[0050](ii)其成熟部分由与SEQ ID NO:1的成熟多肽编码序列；优选与SEQ ID NO:1的位置[397-1632](包含两端)具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100% DNA序列同一性的多核苷酸所编码的蛋白酶；
[0051](iii)其成熟部分由在低等严格条件、中等严格条件、中高等严格条件、高等严格条件或极高等严格条件下与SEQ ID NO:1的成熟多肽编码序列；优选与SEQ ID NO:1的位置[397-1632](包含两端)；或两者中任一者的全长互补物杂交的多核苷酸所编码的蛋白酶；
[0052](iv) SEQ ID NO: 2的成熟多肽、优选SEQ ID NO: 2的位置[1-412](包含两端)的变体，其包括在一个或多个位置上的取代、缺失和/或插入；和
[0053](V)⑴、(ii)、(iii)或(iv)多肽的具有蛋白酶活性的片段，
[0054](b)在有益于该第一多肽的表达和分泌的条件下培养宿主细胞，由此分泌翻译融合多肽并生产成熟蛋白酶；和
[0055](C)任选地，回收蛋白酶。
[0056]使用本领域已知的方法在适合于生产多肽的营养介质中培养宿主细胞。例如，可通过在合适的介质中并在允许多肽表达和/或分离的条件下进行摇瓶培养、或在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续发酵、分批发酵、分批补料发酵或固态发酵)来培养细胞。使用本领域已知的步骤在包含碳源和氮源以及无机盐的合适营养介质中进行培养。合适的介质可从商业供应商获得或可以根据公开的组成来制备(例如，在美国典型培养物保藏中心的目录中)。如果多肽被分泌到营养介质中，则可以直接从介质回收多肽。如果多肽未被分泌出去，则可以从细胞裂解物中进行回收。
[0057]可以使用领域内已知的特定用于蛋白酶多肽的方法来检测蛋白酶多肽。这些检测方法包括但不局限于特异性抗体的使用、酶产物的形成、或酶底物的消失。例如，酶的测定可用来判定多肽的活性。
[0058]可使用本领域已知的方法来回收多肽。例如，可通过常规的步骤从营养介质回收多肽，该步骤包括但不局限于收集、离心、过滤、萃取、喷雾干燥、蒸发或沉淀。
[0059]可通过本领域已知的多种方法提纯多肽来获得基本纯的多肽，该方法包括但不局限于层析法(例如，离子交换、亲和性、疏水性、层析聚焦、和尺寸排阻)、电泳法(例如，制备式等电聚焦)、差别溶解法(例如，硫酸铵沉淀)、SDS-PAGE、或萃取(参见例如，ProteinPurification, Janson 和 Ryden,编者,VCH Publishers, New York, 1989)。
[0060]在可替代的方面，不回收多肽，而是使用表达多肽的本发明的宿主细胞作为多肽的来源。
[0061]变体
[0062]本发明的第一方面还涉及在一个或多个(例如，若干个)位置包含替换、缺失和/或插入的SEQ ID N0:2的成熟多肽的变体。在实施方式中，引入SEQ ID N0:2的成熟多肽中的氨基酸替换、缺失和/或插入的数量不超过10个，如1、2、3、4、5、6、7、8或9个。氨基酸变化可以是性质轻微的，即不显著影响蛋白折叠和/或活性的保守的氨基酸替换或插入；小的缺失，通常为I~30个氨基酸；小的氨基端或羧基端延伸，如氨基端的甲硫氨酸残基；多至20~25个残基的小接头肽；或通过改变净电荷或其它功能而促进纯化的小的延伸，如多组氨酸序列(poly-histidine tract)、抗原表位或结合结构域。[0063]保守替换的实例在碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸(苯丙氨酸、色氨酸和酪氨酸)以及小的氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)的组内。通常不改变特异活性的氨基酸替换是领域内已知的，并在例如 H.Neurath and R.L.Hill, 1979, In, The Proteins, Academic Press, New York 中记载。常见的替换为，Ala/Ser、Val/Ile、Asp/Glu、Thr/Se;r、Ala/Gly、Ala/Th;r、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu 和 Asp/Gly。
[0064]或者，氨基酸变化的性质为多肽的物化性质被改变。例如，氨基酸变化可改进多肽的热稳定性、改变底物特异性、改变最适PH等。
[0065]可根据领域内已知的步骤来鉴定多肽中的基本氨基酸，例如定点诱变或丙氨酸扫描诱变(Cunningham and Wells, 1989，Science244:1081-1085)。在后述的技术中，在分子的每个残基中引入单个丙氨酸突变，并对所得的突变分子测试活性，以鉴定对于分子活性为关键性的氨基酸残基。还参见，Hilton等人，1996，J.Biol.Chem.271:4699-4708。酶或其它生物学相互作用的活性部位也可以通过对结构的物理分析来确定，如通过以下这些技术:如核磁共振、结晶学、电子衍射或光亲和标记，结合对推定接触位点氨基酸的突变来加以测定。参见例如 deVos 等人，1992，Science255:306-312 ；Smith 等人，1992，J.Mol.Biol.224:899-904 ；fflodaver 等人，1992, FEBS Lett.309:59-64。还可从与相关的多肽进行比对来推断基本氨基酸的身份(identity)。
[0066]可以使用已知的突变、重组和/或改组方法，接着进行相关的筛选步骤(例如Reidhaar-Olson and Sauer, 1988，Science241:53-57 ；Bowie and Sauer, 1989, Proc.Natl.Acad.Sc1.USA86:2152-2156 ；W095/17413 ;或冊95/22625中所公开的)来做出并测试单个或多个氨基酸替换、缺失和/或插入。其它可用的方法包括易错PCR、噬菌体展示(例如，Lowman等人，1991, Biochemistry30:10832-10837 ;美国专利第5，223，409号；W092/06204)以及定位诱变(Derbyshire 等人,1986, Gene46:145 ；Ner 等人,1988, DNA7:127)。
[0067]突变/改组方法可与高通量的自动化筛选方法结合来检测由宿主细胞表达的克隆的突变多肽的活性(Ness等人，1999，Nature Biotechnologyl7:893-896)。可使用领域内的标准方法从宿主细胞中回收编码活性多肽的突变DNA分子，并快速测序。这些方法使得可以快速确定多肽中单个氨基酸残基的重要性。
[0068]翻译融合
[0069]我们在【背景技术】部分中提到，据报道在芽孢杆菌中成功地生产了与高度表达和分泌的天然蛋白果胶酸裂解酶翻译融合的难以表达的酶，该果胶酸裂解酶在其C端处融合到酶以便让天然蛋白作为载体或牵引器(tractor) (W000/75344)。
[0070]类似地，将本发明的蛋白酶多肽表达为融合多肽，其中分泌的多肽融合至本发明蛋白酶的N端。
[0071]通过将编码另一多肽的多核苷酸融合到编码本发明蛋白酶的多核苷酸来制备融合多肽。制备融合多肽的技术为本领域已知，且包括连接编码多肽的编码序列使得它们在阅读框内并且融合多肽的表达在同一启动子和终止子的控制下。
[0072]在融合多肽之间包含小肽接头(linker)可能是有利的，以便物理上允许它们正确地折叠并使该融合多肽在其分泌后容易甚至可能是自发地切割，以释放本发明的蛋白酶。
[0073]如果融合多肽在分泌后不自行成熟以释放成熟蛋白酶，那么它可以进一步设计以在翻译融合的两个多肽之间包含特异性解蛋白切割位点。一旦分泌融合蛋白，该位点随后被切割以释放两个多肽。切割位点的例子包括但不限于，在 Martin 等人，2003，J.1nd.Microbiol.Biotechnol.3:568-576 ;Svetina 等人，2000，J.Biotechnol.76:245-251 ;Rasmussen_Wilson 等人，1997，Appl.Environ.Microbiol.63:3488-3493 ；ffard 等人,1995, Biotechnologyl3:498-503 ；以及 Contreras等人，1991，Biotechnology9:378-381 ;Eaton 等人，1986，Biochemistry25:505-512 ;Collins-Racie 等人,1995, Biotechnologyl3:982-987 ；Carter 等人,1989, Proteins:Structure, Function, and Genetics6:240-248 ；以及 Stevens, 2003，Drug DiscoveryWorld4:35-48中公开的位点。
[0074]在优选实施方式中，该至少一个多核苷酸表达构建体进一步包括编码与第一多肽和第二多肽翻译融合且位于它们之间的连接肽的第三多核苷酸；优选地，该第三多核苷酸编码连接肽；优选地，该连接肽包含2~200个氨基酸；优选3~100个氨基酸，例如4~50或5~25个氨基酸；最优选地，该连接肽包含与SEQ ID NO: 11具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列同一性的氨基酸序列。
[0075]在优选实施方式中，翻译融合的第一多肽是全长的或C端截短的天然或异源的酶；优选为水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶，例如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β -半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶(mutanase)、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、木聚糖酶、或木糖苷酶。
[0076]在优选实施方式中，如下面举例说明，翻译融合的第一多肽是全长的或C端截短的天然或异源的葡糖淀粉酶；优选为选自以下的全长的或C端截短的天然或异源的葡糖淀粉酶多肽:
[0077](a)与SEQ ID NO:6的成熟多肽具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列同一性的多肽；
[0078](b)由在低等严格条件、中等严格条件、中高等严格条件、高等严格条件或极高等严格条件下与(i)SEQ ID NO: 5的成熟多肽cDNA编码序列，(ii)于2009年11月23日保藏于德意志微生物和细胞培养物保藏中心(DSMZ)且分配登录号为DSM23123的大肠杆菌菌株中的质粒AMGl中所插入的AMG基因，或(iii) (i)或(ii)的全长互补物杂交的多核苷酸所编码的多肽；和
[0079](c)由与SEQ ID NO:5的成熟多肽编码序列或与于2009年11月23日保藏于德意志微生物和细胞培养物保藏中心(DSMZ)且分配登录号为DSM23123的大肠杆菌菌株中的质粒AMGl中所插入的AMG基因的成熟多肽编码序列具有至少60%，例如至少65%、至少70 %、至少75 %、至少80 %、至少85 %、至少90 %、至少91%、至少92 %、至少93 %、至少94 %、至少95 %、至少96 %、至少97 %、至少98 %、至少99 %、或100 %序列同一性的多核苷
酸编码的多肽。
[0080]在另一个优选实施方式中，如下面举例说明，该翻译融合的第一多肽是全长的或C端截短的天然或异源的植酸酶；优选为选自以下的全长的或C端截短的天然或异源的植酸酶多肽:
[0081](a)与SEQ ID NO:8的成熟多肽具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列同一性的多肽；
[0082](b)由在低等严格条件、中等严格条件、中高等严格条件、高等严格条件或极高等严格条件下与(i)SEQ ID NO:7的成熟多肽cDNA编码序列或其全长互补物杂交的多核苷酸所编码的多肽；和
[0083](C)由与SEQ ID NO:7的成熟多肽编码序列具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94 %、至少95 %、至少96 %、至少97 %、至少98 %、至少99 %、或100 %序列同一性的多核苷
酸所编码的多肽。
[0084]在另一个优选实施方式中，如下面举例说明，该翻译融合的第一多肽是全长的或C端截短的天然或异源的α -淀粉酶；优选为选自以下的全长的或C端截短的天然或异源的α-淀粉酶多肽:
[0085](a)与SEQ ID NO: 10的成熟多肽具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列同一性的多肽；
[0086](b)由在低等严格条件、中等严格条件、中高等严格条件、高等严格条件或极高等严格条件下与(i)SEQ ID NO: 9的成熟多肽cDNA编码序列或其全长互补物杂交的多核苷酸所编码的多肽；和
[0087](C)由与SEQ ID N0:9的成熟多肽编码序列具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94 %、至少95 %、至少96 %、至少97 %、至少98 %、至少99 %、或100 %序列同一性的多核苷
酸所编码的多肽。
[0088]具有蛋白酶活性的多肽的来源
[0089]本发明的具有蛋白酶活性的多肽可从任何属的微生物获得。出于本发明的目的，本文中与给定来源关联使用的术语“获自”应指，由多核苷酸编码的多肽是由该来源或其中插入有该来源的多核苷酸的株系产生的。一方面，获自给定来源的多肽是分泌到细胞外的。
[0090]蛋白酶多肽可以是古细菌多肽。例如，该多肽可以是热球菌(Thermococci)纲,诸如来自热球菌(Thermococcales)目，来自热球菌(Thermococcaceae)科或者甚至来自火球菌(Pyrococcus)属。在一个方面,蛋白酶多肽可以是激烈火球菌多肽。
[0091]应当理解的是，就前文所述的物种而言，本发明涵盖了完全和不完全的状态，以及其它分类学上的等同物，例如无性型，不管它们已知的种名是什么。本领域技术人员可以很容易地识别出合适的等同物的身份。[0092]公众可以在若干保藏机构容易地获取这些物种的株系，这样的机构诸如美国典型培养物保藏中心(American Type Culture Collection, ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH,DSMZ)、荷兰菌种保藏中心(Centraalbureau Voor Schimmelcultures, CBS)和农业研究机构专利培养物保藏中心北区研究中心(Agricultural Research Service Patent CultureCollection, Northern Regional Research Center, NRRL)。
[0093]可以使用上述探针从其它来源，包括从自然界(例如，土壤、堆肥、水等)分离的微生物或者从天然材料(例如，土壤、堆肥、水等)直接获得的DNA样本鉴定和获得这些多肽。用于直接从天然生境(habitat)分离微生物和DNA的技术是本领域内公知的。随后可通过相似地筛选另一微生物的基因组DNA或cDNA文库或者混合的DNA样品来获得编码多肽的多核苷酸。在用探针检测到编码多肽的多核苷酸后，就能够通过使用本领域普通技术人员熟知的技术分离或克隆多核苷酸(参见,例如，Sambrook等人，1989，同上)。
[0094]多核苷酸
[0095]本发明还涉及分离的多核苷酸，其编码如本文所述的本发明的蛋白酶多肽。
[0096]用于分离或克隆多核苷酸的技术是本领域内已知的，并且包括从基因组DNA或cDNA分离，或它们的组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共有结构特征的克隆DNA片段，从而实现从基因组DNA克隆多核苷酸。参见，例如，Innis 等人，1990,PCR:A Guide to Methods and Application, Academic Press,纽约。可以使用其它核酸扩增方法诸如连接酶链式反应(LCR)、连接活化转录(ligationactivated transcription) (LAT)和基于多核苷酸的扩增(NASBA)。可从火球菌属菌株或相关有机体克隆多核苷酸，并且因此可以是例如该多核苷酸的多肽编码区的等位变体或种变体(species variant)。
[0097]修饰编码本发明多肽的多核苷酸对于合成与所述多肽基本上相似的多肽可能是必需的。术语与多肽“基本上相似”是指多肽的非天然存在的形式。这些多肽可以以一些工程化的方式而不同于从其天然来源分离的多肽，例如，比活性、热稳定性、最适PH等方面不同的变体。可以在作为SEQ ID NO:1的位置397~1632中的成熟多肽编码序列存在的多核苷酸例如其子序列的基础上，和/或通过引入如下核苷酸取代来构建变体:所述取代不导致多肽氨基酸序列的改变，但是符合意欲用来产生酶的宿主有机体的密码子用法；或者通过引入如下核苷酸取代来构建变体:所述取代可产生不同的氨基酸序列。关于核苷酸取代的概述，参见，例如，Ford 等人，1991,Protein Expression and Purification〗:95-107。
[0098]核酸构律体
[0099]本发明的第三方面涉及如第一方面的步骤(a)中所定义的多核苷酸表达构建体。
[0100]本发明还涉及包括与一个或多个控制序列可操作地连接的本发明多核苷酸的核酸构建体，上述控制序列在与该控制序列相容的条件下引导编码序列在合适的宿主细胞中的表达。
[0101]可以通过多种方式操纵多核苷酸，以提供多肽的表达。依赖于表达载体，在将多核苷酸插入到载体之前对其进行操纵可以是合意的或必需的。使用重组DNA方法修饰多核苷酸的技术是本领域公知的。
[0102]控制序列可以是启动子，其是由宿主细胞识别用于编码本发明多肽的多核苷酸的表达的多核苷酸。启动子含有介导多肽表达的转录控制序列。启动子可以是任何在宿主细胞中表现出转录活性的多核苷酸，包括突变的、截短的天然的或异源的、以及杂合的启动子，并且可以从与宿主细胞同源或异源的编码细胞外或细胞内多肽的基因获得。
[0103]在酵母宿主中，可用的启动子获自酿酒酵母(Saccharomyces cerevisiae)烯醇化酶(EN0-1)、酿酒酵母半乳糖激酶(GALl)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1，ADH2/GAP)、酿酒酵母磷酸丙糖异构酶(TPI)、酿酒酵母金属硫蛋白(CUPl)和酿酒酵母3-磷酸甘油酸激酶的基因。其它可用于酵母宿主细胞的启动子由Romanos等人，1992，Yeast8:423-488 描述。
[0104]控制序列也可以是转录终止子，其被宿主细胞识别以终止转录。终止子与编码多肽的多核苷酸的3’端可操作地连接。在宿主细胞中起作用的任何终止子均可用于本发明。
[0105]用于酵母宿主细胞的优选终止子获自酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYCl)和酿酒酵母甘油醛-3-磷酸脱氢酶的基因。其他可用于酵母宿主细胞的终止子在Romanos等，1992 (同上)中有过描述。
[0106]控制序列也可以是在启动子下游和基因的编码序列上游的增加基因表达的mRNA稳定序列(mRNA stabilizer)区域。
[0107]合适的mRNA稳定序列区域的实例获自苏云金芽孢杆菌cryIIIA基因(W094/25612)和枯草芽孢杆菌SP82基因(Hue等人，1995，Journal ofBacteriologyl77:3465-3471)。
[0108]控制序列也可以是前导序列，即对由宿主细胞翻译较为重要的mRNA非翻译区。前导序列可操作地连接到编码多肽的多核苷酸的5’端。任何在宿主细胞中起作用的前导序列均可以使用。
[0109]用于酵母宿主细胞的合适前导序列得自酿酒酵母烯醇化酶(EN0-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)的基因。
[0110]控制序列也可以是多腺苷酸化序列，即可操作地连接至多核苷酸的3’端的序列，在转录时其被宿主细胞识别为向转录mRNA添加多腺苷酸残基的信号。在宿主细胞中起作用的任何多腺苷酸化序列均可以使用。
[0111]用于酵母宿主细胞的有用多腺苷酸化序列记载于Guo and Sherman, 1995, Mol.Cellular Biol.15:5983-5990。
[0112]控制序列也可以是编码与多肽N端连接的信号肽并引导多肽进入细胞分泌通路的信号肽编码区。多核苷酸的编码序列的5’端可以固有地包含在翻译阅读框中与编码多肽的编码序列片段自然连接的信号肽编码序列。或者，编码序列的5’端可以包含对于编码序列为外来的信号肽编码序列。在编码序列不天然包含信号肽编码序列时，外来信号肽编码序列可能是需要的。或者，为增强多肽的分泌，外来信号肽编码序列可以简单地取代天然信号肽编码序列。然而，任何引导所表达的多肽进入宿主细胞的分泌通路的信号肽编码序列均可以使用。
[0113]用于酵母宿主细胞的可用信号肽得自酿酒酵母α因子和酿酒酵母转化酶的基因。其他可用的信号肽编码序列记载于Romanos等人，1992，同上。
[0114]控制序列也可以是编码位于多肽N端的前肽的前肽编码序列。得到的多肽称为酶原或多肽原(或在一些情况下为酵素原)。多肽原一般是失活的且可以通过从多肽原到前肽的催化或自催化切割而转化为活性多肽。前肽编码序列可以得自枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽抱杆菌中性蛋白酶(nprT)、嗜热毁丝菌(Myceliophthora thermophila)漆酶(W095/33836)、米黑根毛霉天冬氨酸蛋白酶和酿酒酵母α因子的基因。
[0115]在信号肽序列和前肽序列均存在时，前肽序列紧邻多肽的N端且信号肽序列紧邻前肽序列的N端。
[0116]也可能需要添加调控多肽相对于宿主细胞生长的表达的调控序列。调控系统的实例是响应于化学或物理刺激引起基因表达的开启和关闭的那些，包括调控化合物的存在。
[0117]调控序列的其他实例是使得基因扩增的那些。在真核系统中，调控序列包括在甲氨蝶呤的存在下扩增的二氢叶酸还原酶基因、以及在重金属的存在下扩增的金属硫蛋白基因。在这些情况下，编码多肽的多核苷酸将可操作地与调控序列连接。
[0118]表汰载体
[0119]本发明还涉及包含本发明多核苷酸、启动子以及转录和翻译终止信号的重组表达载体。各种核苷酸和控制序列可以连接在一起，以产生可以包含一个或多个便利限制性位点的重组表达载体，该限制性位点使得可以在位点插入或替换编码多肽的多核苷酸。或者，可以通过插入多核苷酸或包含多核苷酸的核酸构建体到合适的表达载体中来表达多核苷酸。在构建表达载体的过程中，编码序列位于载体中，从而编码序列与合适的表达用控制序列可操作地连接。
[0120]重组表达载体可以是任何可以方便地进行重组DNA程序并可引起多核苷酸表达的载体(例如，质粒或病毒)。载体的选择通常取决于载体与载体将要导入的宿主细胞的相容性。载体可以是线性或闭合的环状质粒。
[0121]载体可以是自主复制型载体，即作为染色体外实体而存在且其复制独立于染色体复制的载体，例如，质粒、染色体外元件、微型染色体或人工染色体。载体可以包含确保自我复制的任何元件(means)。或者，载体可以是，在导入宿主细胞时整合到基因组中并与其整合的染色体一起复制的载体。此外，可以使用单个载体或质粒，或使用共同包含将要导入宿主细胞基因组中的总DNA的两个或更多个载体或质粒，或使用转座子。
[0122]载体优选包含一个或多个允许方便地选择转化细胞、转染细胞、转导细胞等细胞的选择性标记物。选择性标记物是如下的基因，其产物提供对生物灭杀剂的抗性或病毒抗性、重金属抗性、相对于营养缺陷型的原养型等。用于酵母宿主细胞的合适标记物包括但不限于 ADE2、HIS3、LEU2、LYS2、MET3、TRPl 和 URA3。
[0123]优选载体包含有使得载体整合到宿主细胞的基因组中或使载体在细胞中独立于基因组而自主复制的元件。
[0124]对于整合入宿主细胞基因组，载体可以依赖于编码多肽的多核苷酸序列或经同源重组或非同源重组整合入基因组的载体的任何其他元件。或者，载体可以含有用于引导经由同源重组在染色体的精确位置整合入宿主细胞基因组的其他多核苷酸。为增加在精确位置整合的可能性，整合元件应当包含足量的核酸，例如100~10,000个碱基对、400~10，000个碱基对、以及800~10，000个碱基对，其与相应的靶序列具有高度的序列同一性，以增强同源重组的可能性。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。此外，整合元件可以是非编码的多核苷酸或编码的多核苷酸。另一方面，载体可以通过非同源重组而整合到宿主细胞的基因组中。
[0125]对于自主复制，载体还可以包含使载体能在被考虑的宿主细胞中自主复制的复制起点。复制起点可以是在细胞中起作用的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”是指使质粒或载体能在体内复制的多核苷酸。
[0126]用在酵母宿主细胞中的复制起点的实例是2微米复制起点ARS1，ARS4，ARSl与CEN3的组合，以及ARS4与CEN6的组合。
[0127]多于一个拷贝的本发明多核苷酸可以插入到宿主细胞中，以增加多肽产生。多核苷酸拷贝数的增加可以通过将至少一个额外拷贝的序列整合入宿主细胞基因组中而得到；或者通过包含可扩增选择标记物基因与多核苷酸而获得，这样，可以通过在合适选择剂的存在下培养细胞来选择含有扩增拷贝的选择标记物基因的细胞，由此选择含有额外拷贝的多核苷酸的细胞。
[0128]用来连接上述元件以构建本发明的重组表达载体的步骤为本领域技术人员所熟知(参见，例如，Sambrook等人，1989,同上)。
[0129]宿丰细朐
[0130]本发明的第二方面涉及如第一方面的步骤(a)中所定义的酵母宿主细胞。
[0131]优选地，该第二方面的酵母宿主细胞包含至少一个本发明的表达多核苷酸构建体，其中蛋白酶编码基因与一个或多个指导本发明融合多肽产生的控制序列可操作地连接。将包含多核苷酸的构建体或载体导入到宿主细胞中，从而使构建体或载体保持为染色体整合子或作为前述的自我复制染色体外载体。术语“宿主细胞”包括因复制过程中发生的突变而与亲本细胞不同的亲本细胞的任何后代。
[0132]宿主细胞是酵母细胞。本文所用的术语“酵母”包括产子囊酵母(内孢霉目)、产担子酵母和属于半知菌的酵母(芽孢纲)。由于酵母的分类在未来可能会变化，出于本发明的目的，酵母应当如 Biology and Activities of Yeast (Skinner, Passmore, andDavenport, editors, Soc.App.Bacteriol.Symposium Series N0.9, 1980)中记载般进行定义。
[0133]酵母宿主细胞可以是假丝酵母属(Candida)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或耶氏酵母属(Yarrowia)细胞，例如乳酸克鲁维酵母(Kluyveromyces Iactis)、卡氏酵母(Saccharomyces carlsbergensis)、酿酒酵母、糖化酵母(Saccharomyces diastaticus)、Saccharomyces douglasi1、克鲁弗酵母(Saccharomyces kluyveri)、 Saccharomyces norbensis、 Saccharomyces oviformis 或角军脂耶氏酵母(Yarrowia lipolytica)细胞。
[0134]真菌细胞可以通过涉及原生质体形成、原生质体转化和细胞壁再生的方法以本身已知的方式进行转化。酵母可以使用由Becker and Guarente, In Abelson, J.N.andSimon, Μ.1., editors, Guide to Yeast Genetics andMolecular Biology, Methods in Enzymology, Volumel94, ppl82-187, Academic Press, Inc., New York ;Ito 等 A , 1983, J.Bacteriol.153:163 ；以及 Hinnen 等人,1978, Proc.Natl.Acad.Sc1.USA75:1920 记载的方法转化。
[0135]实施例[0136]材料和方法
[0137]菌株:
[0138]酿酒酵母YNG318:MATa Dp印4 [cir+] ura3_52，leu2_D2，his4_539 记载于 J.Biol.Chem.272(15)，9720-9727，1997 中。
[0139]大肠杆菌DH12S (购自Gibco BRL公司)用于酵母质粒拯救。
[0140]质粒:
[0141]所有酵母表达载体是TPI启动子控制下的酿酒酵母和大肠杆菌穿梭载体，构建自W0200192502 中描述的 pJC039。
[0142]基因:
[0143]古细菌激烈火球菌的丝氨酸蛋白酶基因的合成型式示于SEQ ID NO:1。所编码的成熟氨基酸序列示于SEQ ID NO: 2 (GeneSeqP:AAW2412)，其中前23个氨基酸构成分泌信号肽，接着的109个氨基酸为N端前肽且最终的110个氨基酸为C端前肽；两个前肽均在成熟时从表达多肽切割而成为其活性形式。
[0144]编码来自特异腐质霉(Humicola insolens)的信号序列的多核苷酸序列示于SEQID NO:3 中，信号肽示于 SEQ ID NO:4(GeneSeqP:AEE85970)中。
[0145]使用pGEM-T 载体系统(Promega Corporation, Madison, WI, USA)将来自草酸青霉菌(Penicillium oxalicum)的葡糖淀粉酶基因克隆到pGEM_T载体(PromegaCorporation, Madi son, WI, US)中，以产生质粒AMGl。通过测序验证插入质粒AMGl的AMG基因序列。葡糖淀粉酶基因的相应cDNA序列示于SEQ ID NO:5且所编码酶的氨基酸示于SEQ ID N0:6 中。
[0146]来自隔孢伏革菌(Peniophora lycii) CBS686.96的植酸酶基因编码具有GeneSeqP:AAW62858氨基酸序列的植酸酶；相应的野生型cDNA序列示于SEQ ID N0:7，而氨基酸序列示于SEQ ID N0:8。
[0147]编码来自黑曲霉(Aspergillus niger)的酸性α -淀粉酶的cDNA示于SEQ IDNO:9，编码的氨基酸序列示于 SEQ ID N0:10(UNIPR0T:P56271) ?
[0148]最初分离自罗耳阿太菌(Athelia rolfsii)的接头区示于SEQ ID NO: 11,编码的氨基酸序列示于SEQ ID NO: 12。
[0149]培养基和基质:
[0150]-YPD:20g/L葡萄糖，20g/L蛋白胨和10g/L酵母提取物。
[0151 ] -10 X基础溶液:66.8g/l酵母氮碱w/o氨基酸(DIFCO)、100g/l琥珀酸盐和60g/I NaOH。
[0152]-SC-葡萄糖(或SC-培养基):100ml/120 %葡萄糖(即，2 %的终浓度=2g/100ml)，4ml/15% 苏氨酸，10ml/ll% 色氨酸，25ml/120% 酪蛋白氨基酸和 lOOml/llOX基础溶液。使用0.20微米孔径的过滤器对该溶液进行灭菌。将琼脂和H20(约761ml) —起高压灭菌，并将单独灭菌的SC-葡萄糖溶液加至琼脂溶液中。
[0153]-PEG/LiAc溶液:50ml40% PEG4000 (高压灭菌)和lml5M醋酸锂(高压灭菌)。
[0154]-YPD:细菌蛋白胨(Bacto P印tone) 20g/l，酵母提取物 10g/l，20%葡萄糖 100mL/L.[0155]-玉米醇溶蛋白(zein)琼脂板:20mM醋酸钠缓冲液(pH6)中，0.05_0.1 %的玉米醇溶蛋白(Sigma)和2%琼脂。
[0156]DNA 操纵:
[0157]除非另有说明，否则使用如Sambrook等人(1989)Molecular cloning:Alaboratory manual, Cold Spring Harbor lab.Cold Spring Harbor, NY ；Ausubel,F.M.等人(编)"Current protocols in Molecular Biology", John Wiley 和 Sons, 1995 ;Harwood, C.R.和Cutting，S.M.(编)中描述的分子生物学的标准方法进行DNA操纵和转化。
[0158]酵母转化:
[0159]为转化酵母利用了体内重组机制，如果载体序列和PCR片段具有相同侧翼区域的话，通过该机制酵母有可能在体内重组载体序列和PCR片段以创建表达载体。
[0160]通过混合0.5微升的载体(HindII1-XbaI消化)和I微升的PCR片段来制备DNA混合物。在冰上解冻酿酒酵母YNG318感受态细胞。在12ml聚丙烯管中将100微升的细胞与DNA混合物和10微升的载体DNA混合。加入0.6ml PEG/LiAc溶液并轻轻混合，然后在30°C和200rpm下温育30分钟。此后在42°C (热休克)下温育30分钟，再将其转移到eppendorf管并离心5秒。除去上清液，并溶于3ml的YPD。然后在将其倾倒于SC-葡萄糖平板之前，将细胞悬浮液在200rpm和30°C下温育45分钟。
[0161]PCR 反应:
[0162]除非另有说明，否则PCR反应按照如下进行。包含48.5微升水，0.5微升的IOOpmol/ 微升引物，0.5 微升模板 DNA 和 2 珠的 PuReTaq Ready-To-Go? PCR 珠(GEHealthcare)的PCR反应在下列条件下进行:
[0163]
【权利要求】
1.一种在酵母中生产蛋白酶的方法，包括: (a)提供包括至少一个多核苷酸表达构建体的酵母宿主细胞，所述多核苷酸表达构建体编码与第二多肽翻译融合的由所述宿主细胞分泌的第一多肽，其中所述第二多肽选自: ⑴其成熟部分与SEQ ID NO:2的成熟多肽；优选与SEQ ID NO:2的位置[1-412]具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%氨基酸序列同一性的蛋白酶； (ii)其成熟部分由与SEQID NO:1的成熟多肽编码序列；优选与SEQ ID NO:1的位置[397-1632]具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100% DNA序列同一性的多核苷酸所编码的蛋白酶； (iii)其成熟部分由在低等严格条件、中等严格条件、中高等严格条件、高等严格条件或极高等严格条件下与SEQ ID NO:1的成熟多肽编码序列；优选与SEQ ID NO:1的位置[397-1632];或两者中任一者的全长互补物杂交的多核苷酸所编码的蛋白酶； (iv)SEQ ID NO:2的成熟多肽、优选SEQ ID NO:2的位置[1-412]的变体，其包括在一个或多个位置上的取代、缺失和/或插入；和 (V) (i)、(ii)、(iii)或(iv)多肽的具有蛋白酶活性的片段， (b)在有益于所述第一多肽的表达和分泌的条件下培养所述宿主细胞，由此分泌翻译融合多肽并生产成熟蛋白酶；和 (C)任选地，回收蛋白酶。
2.根据权利要求1所述的方法，其中所述酵母是酵母属，优选为酿酒酵母(Saccharomyces cerevisiae)。
3.根据权利要求1或2所述的方法，其中，所述第一多肽是全长的或C端截短的天然或异源的酶；优选为水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶，例如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β -葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、木聚糖酶、或木糖苷酶。
4.根据权利要求3所述的方法，其中所述第一多肽是全长的或C端截短的天然或异源的葡糖淀粉酶；优选为选自以下的全长的或C端截短的天然或异源的葡糖淀粉酶多肽: (a)与SEQID NO:6的成熟多肽具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96 %、至少97 %、至少98 %、至少99 %、或100 %序列同一性的多肽； (b)由在低等严格条件、中等严格条件、中高等严格条件、高等严格条件或极高等严格条件下与(i)SEQ ID N0:5的成熟多肽cDNA编码序列，(ii)于2009年11月23日保藏于德意志微生物和细胞培养物保藏中心(DSMZ)且分配登录号为DSM23123的大肠杆菌菌株中的质粒AMGl中所插入的AMG基因，或(iii) (i)或(ii)的全长互补物杂交的多核苷酸所编码的多肽；和(C)由与SEQ ID NO:5的成熟多肽编码序列或与于2009年11月23日保藏于德意志微生物和细胞培养物保藏中心(DSMZ)且分配登录号为DSM23123的大肠杆菌菌株中的质粒AMGl中所插入的AMG基因的成熟多肽编码序列具有至少60%，例如至少65%、至少70%、至少75 %、至少80 %、至少85 %、至少90 %、至少91%、至少92 %、至少93 %、至少94 %、至少95 %、至少96 %、至少97 %、至少98 %、至少99 %、或100 %序列同一性的多核苷酸编码的多肽。
5.根据权利要求3所述的方法，其中所述第一多肽是全长的或C端截短的天然或异源的植酸酶；优选为选自以下的全长的或C端截短的天然或异源的植酸酶多肽: (a)与SEQID NO:8的成熟多肽具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96 %、至少97 %、至少98 %、至少99 %、或100 %序列同一性的多肽； (b)由在低等严格条件、中等严格条件、中高等严格条件、高等严格条件或极高等严格条件下与(i)SEQ ID NO: 7的成熟多肽cDNA编码序列或其全长互补物杂交的多核苷酸所编码的多肽；和 (c)由与SEQID NO:7的成熟多肽编码序列具有至少60%，例如至少65%、至少70%、至少75 %、至少80 %、至少85 %、至少90 %、至少91%、至少92 %、至少93 %、至少94 %、至少95 %、至少96 %、至少97 %、至少98 %、至少99 %、或100 %序列同一性的多核苷酸所编码的多肽。
6.根据权利要求3所述的方法，其中所述第一多肽是全长的或C端截短的天然或异源的α -淀粉酶；优选为选自以下的全长的或C端截短的天然或异源的α-淀粉酶多肽: (a)与SEQID N0:10的成熟多肽具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96 %、至少97 %、至少98 %、至少99 %、或100 %序列同一性的多肽； (b)由在低等严格条件、中等严格条件、中高等严格条件、高等严格条件或极高等严格条件下与(i)SEQ ID NO: 9的成熟多肽cDNA编码序列或其全长互补物杂交的多核苷酸所编码的多肽；和 (c)由与SEQID NO:9的成熟多肽编码序列具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95 %、至少96 %、至少97 %、至少98 %、至少99 %、或100 %序列同一性的多核苷酸所编码的多肽。
7.根据任一前述权利要求所述的方法，其中所述至少一个多核苷酸表达构建体进一步包括编码与所述第一多肽和所述第二多肽翻译融合且位于它们之间的连接肽的第三多核苷酸。
8.根据权利要求7所述的方法，其中所述第三多核苷酸编码连接肽；优选地，所述连接肽包含2~200个氨基酸；优选3~100个氨基酸，例如4~50或5~25个氨基酸；最优选地，所述连接肽包含与SEQ ID NO: 11具有至少70 %、至少75 %、至少80 %、至少85 %、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列同一性的氨基酸序列。
9.一种酵母宿主细胞，其包括至少一个编码与第二多肽翻译融合的由所述宿主细胞分泌的第一多肽的多核苷酸表达构建体，其中所述第二多肽选自: (i)其成熟部分与SEQ ID N0:2的成熟多肽具有至少60%，例如至少65%、至少70%、至少75 %、至少80 %、至少85 %、至少90 %、至少91 %、至少92 %、至少93 %、至少94 %、至少95%、至少96%、至少97%、至少98%、至少99%、或100%氨基酸序列同一性的蛋白酶； (ii)其成熟部分由与SEQID ΝΟ:1的成熟多肽编码序列具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100% DNA序列同一性的多核苷酸所编码的蛋白酶； (iii)其成熟部分由在低等严格条件、中等严格条件、中高等严格条件、高等严格条件或极高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补物杂交的多核苷酸所编码的蛋白酶； (iv)SEQ ID NO: 2的成熟多肽的变体蛋白酶，其包括在一个或多个位置上的取代、缺失和/或插入；和 (V) (i)、(ii)、(iii)或(iv)多肽的具有蛋白酶活性的片段。
10.根据权利要求9所述的酵母宿主细胞，其是酵母属，优选为酿酒酵母。
11.根据权利要求9或10所述的酵母宿主细胞，其中，所述第一多肽是全长的或C端截短的天然或异源的酶；优选为水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶，例如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、木聚糖酶、或木糖苷酶。
12.根据权利要求11所述的酵母宿主细胞，其中所述第一多肽是全长的或C端截短的天然或异源的葡糖淀粉酶；优选为选自以下的全长的或C端截短的天然或异源的葡糖淀粉酶多肽: (a)与SEQ ID NO:6的成熟多肽具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96 %、至少97 %、至少98 %、至少99 %、或100 %序列同一性的多肽； (b)由在低等严格条件、中等严格条件、中高等严格条件、高等严格条件或极高等严格条件下与(i)SEQ ID NO: 5的成熟多肽cDNA编码序列，(ii)于2009年11月23日保藏于德意志微生物和细胞培养物保藏中心(DSMZ)且分配登录号为DSM23123的大肠杆菌菌株中的质粒AMGl中所插入的AMG基因，或(iii) (i)或(ii)的全长互补物杂交的多核苷酸所编码的多肽；和 (c)由与SEQID NO:5的成熟多肽编码序列或与于2009年11月23日保藏于德意志微生物和细胞培养物保藏中心(DSMZ)且分配登录号为DSM23123的大肠杆菌菌株中的质粒AMGl中所插入的AMG基因的成熟多肽编码序列具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95 %、至少96 %、至少97 %、至少98 %、至少99 %、或100 %序列同一性的多核苷酸编码的多肽。
13.根据权利要求11所述的酵母宿主细胞，其中所述第一多肽是全长的或C端截短的天然或异源的植酸酶；优选为选自以下的全长的或C端截短的天然或异源的植酸酶多肽: (a)与SEQID NO:8的成熟多肽具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列同一性的多肽； (b)由在低等严格条件、中等严格条件、中高等严格条件、高等严格条件或极高等严格条件下与(i)SEQ ID NO:7的成熟多肽cDNA编码序列或其全长互补物杂交的多核苷酸所编码的多肽；和 (c)由与SEQID NO:7的成熟多肽编码序列具有至少60%，例如至少65%、至少70%、至少75 %、至少80 %、至少85 %、至少90 %、至少91 %、至少92 %、至少93 %、至少94 %、至少95 %、至少96 %、至少97 %、至少98 %、至少99 %、或100 %序列同一性的多核苷酸所编码的多肽。
14.根据权利要求11所述的酵母宿主细胞，其中所述第一多肽是全长的或C端截短的天然或异源的α-淀粉酶；优选为选自以下的全长的或C端截短的天然或异源的α-淀粉酶多肽: (a)与SEQID N0:10的成熟多肽具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96 %、至少97 %、至少98 %、至少99 %、或100 %序列同一性的多肽； (b)由在低等严格条件、中等严格条件、中高等严格条件、高等严格条件或极高等严格条件下与(i)SEQ ID NO:9的成熟多肽cDNA编码序列或其全长互补物杂交的多核苷酸所编码的多肽；和 (c)由与SEQID NO:9的成熟多肽编码序列具有至少60%，例如至少65%、至少70%、至少75 %、至少80 %、至少85 %、至少90 %、至少91%、至少92 %、至少93 %、至少94%、至少95%、至少96%、至少 97%、至少98%、至少99%、或100%序列同一性的多核苷酸所编码的多肽。
15.根据任一前述权利要求所述的酵母宿主细胞，其中所述至少一个多核苷酸表达构建体进一步包括编码与所述第一多肽和所述第二多肽翻译融合且位于它们之间的连接肽的第三多核苷酸。
16.根据权利要求15所述的酵母宿主细胞，其中所述第三多核苷酸编码连接肽；优选地，所述连接肽包含2~200个氨基酸；优选3~100个氨基酸，例如4~50或5~25个氨基酸；最优选地，所述连接肽包含与SEQ IDNO=Il具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列同一性的氨基酸序列。
17.一种多核苷酸表达构建体，其编码与第二多肽翻译融合的由宿主细胞分泌的第一多肽，其中所述第二多肽选自: (i)其成熟部分与SEQID N0:2的成熟多肽具有至少60%，例如至少65%、至少70%、至少75 %、至少80 %、至少85 %、至少90 %、至少91 %、至少92 %、至少93 %、至少94 %、至少95%、至少96%、至少97%、至少98%、至少99%、或100%氨基酸序列同一性的蛋白酶； (ii)其成熟部分由与SEQID N0:1的成熟多肽编码序列具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100% DNA序列同一性的多核苷酸所编码的蛋白酶； (iii)其成熟部分由在低等严格条件、中等严格条件、中高等严格条件、高等严格条件或极高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补物杂交的多核苷酸所编码的蛋白酶； (iv)SEQ ID NO: 2的成熟多肽的变体蛋白酶，其包括在一个或多个位置上的取代、缺失和/或插入；和 (V) (i)、(ii)、(iii)或(iv)多肽的具有蛋白酶活性的片段。
18.根据权利要求17所述的多核苷酸表达构建体，其中，所述第一多肽是全长的或C端截短的天然或异源的酶；优选为水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶，例如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β -葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、木聚糖酶、或木糖苷酶。
19.根据权利要求18所述的多核苷酸表达构建体，其中所述第一多肽是全长的或C端截短的天然或异源的葡糖淀粉酶；优选为选自以下的全长的或C端截短的天然或异源的葡糖淀粉酶多肽: (a)与SEQID NO:6的成熟多肽具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列同一性的多肽； (b)由在低等严格条件、中等严格条件、中高等严格条件、高等严格条件或极高等严格条件下与(i)SEQ ID NO: 5的成熟多肽cDNA编码序列，(ii)于2009年11月23日保藏于德意志微生物和细胞培养物保藏中心(DSMZ)且分配登录号为DSM23123的大肠杆菌菌株中的质粒AMGl中所插入的AMG基因，或(iii) (i)或(ii)的全长互补物杂交的多核苷酸所编码的多肽；和 (c)由与SEQID NO:5的成熟多肽编码序列或与于2009年11月23日保藏于德意志微生物和细胞培养物保藏中心(DSMZ)且分配登录号为DSM23123的大肠杆菌菌株中的质粒AMGl中所插入的AMG基因的成熟多肽编码序列具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95 %、至少96 %、至少97 %、至少98 %、至少99 %、或100 %序列同一性的多核苷酸编码的多肽。
20.根据权利要求18所述的多核苷酸表达构建体，其中所述第一多肽是全长的或C端截短的天然或异源的植酸酶；优选为选自以下的全长的或C端截短的天然或异源的植酸酶多肽: (a)与SEQ ID NO:8的成熟多肽具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列同一性的多肽；(b)由在低等严格条件、中等严格条件、中高等严格条件、高等严格条件或极高等严格条件下与(i)SEQ ID NO: 7的成熟多肽cDNA编码序列或其全长互补物杂交的多核苷酸所编码的多肽；和 (c)由与SEQID NO:7的成熟多肽编码序列具有至少60%，例如至少65%、至少70%、至少75 %、至少80 %、至少85 %、至少90 %、至少91%、至少92 %、至少93 %、至少94 %、至少95 %、至少96 %、至少97 %、至少98 %、至少99 %、或100 %序列同一性的多核苷酸所编码的多肽。
21.根据权利要求18所述的多核苷酸表达构建体，其中所述第一多肽是全长的或C端截短的天然或异源的α -淀粉酶；优选为选自以下的全长的或C端截短的天然或异源的α-淀粉酶多肽: (a)与SEQID N0:10的成熟多肽具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列同一性的多肽； (b)由在低等严格条件、中等严格条件、中高等严格条件、高等严格条件或极高等严格条件下与(i)SEQ ID NO: 9的成熟多肽cDNA编码序列或其全长互补物杂交的多核苷酸所编码的多肽；和 (c)由与SEQID NO:9的成熟多肽编码序列具有至少60%，例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95 %、至少96 %、至少97 %、至少98 %、至少99 %、或100 %序列同一性的多核苷酸所编码的多肽。
22.根据任一前述权利要求所述的多核苷酸表达构建体,其中所述至少一个多核苷酸表达构建体进一步包括编码与所述第一多肽和所述第二多肽翻译融合且位于它们之间的连接肽的第三多核苷酸。
23.根据权利要求22所述的多核苷酸表达构建体，其中所述第三多核苷酸编码连接肽；优选地，所述连接肽包含2~200个氨基酸；优选3~100个氨基酸,例如4~50或5~25个氨基酸；最优选地，所述连接肽包含与SEQ ID NO: 11具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列同一性的氨基酸序列。
【文档编号】C12N9/52GK103930544SQ201280054844
【公开日】2014年7月16日申请日期:2012年11月5日优先权日:2011年11月8日
【发明者】松井知子申请人:诺维信公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：松井知子
技术所有人：诺维信公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.食品功能因子基因工程菌种的构建、智能高通量进化筛选 2.发酵工艺优化
2、马老师：1.酶工程与生物催化 2.酿造技术与风味分析 3.生物质资源综合利用
3、林老师：1.酿造微生物育种及关键酿造工艺开发 2. 真菌基因功能及调控网络解析 3.精细化学品、蛋白真菌细胞底盘开发
4、张老师：1.发酵食品安全：危害物相关基因的筛选，危害物产生菌的快速检测，危害物的预警和发酵过程控制 2.真菌次级代谢与调控 3.酿造酒相关研究
5、郭老师：1.现代酿造技术与食品安全 2. 酵母生物学 3.生物基化学品与合成生物学
如您是高校老师，可以点此联系我们加入专家库。