内含肽修饰酶及其制备和工业用途的制作方法

文档序号:3571052阅读:399来源:国知局
专利名称:内含肽修饰酶及其制备和工业用途的制作方法
技术领域
本发明涉及对蛋白活性进行控制。
背景技术
许多蛋白都具有有用的特性,但在特定情况下,蛋白也会变得难以利用。例如,水解酶具有重要的工业和农业应用,但它们在一些表达宿主内的表达和产生可能又与不需要的表型效果相关。细胞壁降解酶,包括纤维素酶、木聚糖酶、木质素酶、酯酶、过氧化物酶及其它水解酶,在植物内表达时常常会与植物的生长、生理学表现和农艺表现上的不利影响相关。木聚糖酶是能催化¢-1, 4-木聚糖的水解的酶¢-1, 4-木聚糖是植物细胞壁内所含的半纤维素中的直链多糖成分。纤维素酶是能催化纤维素、各种聚合度的纤维素种类和纤维二糖内所含的以3-1,4-D-糖苷键连接的葡萄糖聚合物发生内部水解或端部水解的酶。基于上述活性,木聚糖酶或纤维素酶在植物内的表达可能导致非期望的的植物成分的降解。一些酶也可能由于其水解活性而在微生物宿主内低表达。

发明内容
一方面,本发明涉及一种分离蛋白,该分离蛋白具有与选自由SEQIDNOS: 2373-2686和3315-3322所组成的组中的序列具有至少90%的同一性的氨基酸序列。一方面,本发明涉及一种分离核酸,该分离核酸的核苷酸序列编码与选自由SEQID NOS:2373-2686和3315-3322所组成的组中的序列具有至少90%的同一性的氨基酸序列。一方面,本发明涉及一种含有分离核酸的转基因植物,所述分离核酸的核苷酸序列编码与选自由SEQ ID NOS:2373-2686和3315-3322所组成的组中的序列具有至少90%的同一性的氨基酸序列。一方面,本发明涉及一种分离核酸,该分离核酸的核苷酸序列在中严格度条件下与选自由SEQ ID NOS:2687-3000和3323-3330所组成的组中的序列杂交。一方面,本发明涉及一种含有分离核酸的转基因植物,所述分离核酸的核苷酸序列在中严格度条件下与选自由SEQ ID NOS:2687-3000和3323-3330所组成的组中的序列杂交。
一方面,本发明涉及一种分离的氨基酸序列,该分离的氨基酸序列所含的连续氨基酸序列与蛋白中的6个、10-50个、10-100个、10-150个、10-300个、10-400个、10-500个,或10至全部的连续氨基酸残基具有至少90%的同一性,所述蛋白具有SEQ IDNOS:2373-2686和3315-322中的任意的序列。所述蛋白具有内含肽序列、酶序列、上游内含肽-外显肽接头和下游内含肽-外显肽接头。具有SEQ ID N0S:3315-3322中的一个的序列的蛋白含有至少一种有关SEQ ID NO:2518的氨基酸改变。所述分离的氨基酸序列含有上游内含肽-外显肽接头、下游内含肽-外显肽接头中的至少一种,或至少一种有关SEQID N0:2518的氨基酸改变中的一种或多种。一方面,本发明涉及一种抗体,该抗体识别分离的氨基酸序列上的抗原表位,该分离的氨基酸序列所含的连续氨基酸序列与蛋白中的6个、10-50个、10-100个、10-150个、10-300个、10-400个、10-500个,或10至全部的连续氨基酸残基具有至少90%的同一性,所述蛋白具有SEQ ID N0S:2373-2686和3315-322中的任意的序列。所述蛋白具有 内含肽序列、酶序列、上游内含肽-外显肽接头和下游内含肽-外显肽接头。具有SEQ IDN0S:3315-3322中的一个的序列的蛋白含有至少一种有关SEQ ID NO:2518的氨基酸改变。所述分离的氨基酸序列含有上游内含肽-外显肽接头、下游内含肽-外显肽接头中的至少一种,或至少一种有关SEQ ID N0:2518的氨基酸改变中的一种或多种。一方面,本发明涉及一种分离的核酸,该核酸的序列编码连续氨基酸序列,该连续氨基酸序列与蛋白中的6个、10-50个、10-100个、10-150个、10-300个、10-400个、10-500个,或10至全部的连续氨基酸残基具有至少90%的同一性,所述蛋白具有SEQ IDNOS:2373-2686和3315-322中的任意的序列。所述蛋白具有内含肽序列、酶序列、上游内含肽-外显肽接头和下游内含肽-外显肽接头。具有SEQ ID N0S:3315-3322中的一个的序列的蛋白含有至少一种有关SEQ ID NO:2518的氨基酸改变。所述分离的氨基酸序列含有上游内含肽-外显肽接头、下游内含肽-外显肽接头中的至少一种,或至少一种有关SEQID N0:2518氨基酸改变中的一种或多种。


结合附图阅读将能更好地理解下文中对优选实施方式进行的具体描述。出于阐释本发明的目的,附图所示为本发明优选的实施方式。但是,应当理解的是,本发明不限于所展示的精确安排和手段。图中图I显示了在远离蛋白活性位点处的内含肽插入位点。菱形表示插入位点,方形表不未插入内含肽的其它C/S/T位点。图2A显示了一种植物表达载体,将其命名为pAG2005 (SEQ ID N0:1)。图2B 显示了更详细的 pAG2005 (SEQ ID NO: I)。图3A-3L显示了针对Tth内含肽修饰的P77853的蛋白质印迹数据,其中,内含肽插入在P77853酶中的丝氨酸158处(S158)或苏氨酸134 (T134)处。在部分图3A至图3L中,遮住了部分蛋白质印迹来突出特定的泳道组。泳道上方示出了针对各个样品的琼脂平板表型。所述琼脂平板表型用“SW”代表转化表型(switcher phenotype), TSP代表温敏转化剪接表型(temperature sensitive switcher splicer phenotype), P 代表许可表型(permissive phenotype)。每幅图3A至图3L中的NIC代表内含肽修饰蛋白中的N-外显肽、内含肽和C-外显肽;NC代表含有N-外显肽和C-外显肽的剪接蛋白。图3A显示了反映P77853-Tth-S 158-2蛋白(SEQ ID NO: 1672)的蛋白质印迹,该蛋白在37°C (系列2,左泳道)或55°C (系列2,右泳道)下进行了 4小时的预热处理。同时该图还显示了含有空载体对照(VCT)蛋白和野生型P77853蛋白(P77)的泳道,以相同的方式对这两种蛋白进行预热处理。图3B显示了反映P77853-Tth-S158-4蛋白(SEQ ID NO: 1673)的蛋白质印迹,该蛋白在37°C (系列4,左泳道)或55°C (系列4,右泳道)下进行了 4小时的预热处理。同时该图还显示了含有空载体对照(VCT)蛋白和野生型P77853蛋白(P77)的泳道,以相同的方式对这两种蛋白进行预热处理。图3C 显示了反映 P77853-Tth-S 158-7 蛋白(SEQ ID NO: 1674)的蛋白质印迹, 该蛋白在37°C (系列7,左泳道)或55°C (系列7,中泳道)下进行了 4小时的预热处理,并在70°C (系列7,右泳道)下进行了 I小时的预热处理。同时该图还显示了含有空载体对照(VCT)蛋白和野生型P77853蛋白(P77)的泳道。图3D显示了反映P77853-Tth-S158-19蛋白(SEQ ID NO: 1675)的蛋白质印迹,该蛋白在37°C (系列19,左泳道)或55°C (系列19,中泳道)下进行了 4小时的预热处理,并在70°C (系列19,左泳道)下进行了 I小时的预热处理。同时该图还显示了含有空载体对照(VCT)蛋白和野生型P77853蛋白(P77)的泳道。图3E 显示了反映 P77853-Tth-S 158-20 蛋白(SEQ ID NO: 1676)的蛋白质印迹,该蛋白在37°C (系列20,左泳道)或55°C (系列20,中泳道)下进行了 4小时的预热处理,并在70°C (系列20,右泳道)下进行了 I小时的预热处理。同时该图还显示了含有空载体对照(VCT)蛋白和野生型P77853蛋白(P77)的泳道。图3F显示了反映P77853-Tth-S158-21蛋白(SEQ ID NO: 1677)的蛋白质印迹,该蛋白在37°C (系列21,左泳道)或70°C (系列21,右泳道)下进行了 I小时的预热处理。同时该图还显示了含有空载体对照(VCT)蛋白和野生型P77853蛋白(P77)的泳道,以相同的方式对这两种蛋白进行预热处理。图3G显示了反映P77853-Tth-S158-25蛋白(SEQ ID NO: 1678)的蛋白质印迹,该蛋白在37°C (系列25,左泳道)或70°C (系列25,右泳道)下进行了 I小时的预热处理。同时该图还显示了含有空载体对照(VCT)蛋白和野生型P77853蛋白(P77)的泳道,以相同的方式对这两种蛋白进行预热处理。图3H显示了反映P77853-Tth-S158-38蛋白(SEQ ID NO: 1679)的蛋白质印迹,该蛋白在37°C (系列38,左泳道)或55°C (系列38,右泳道)下进行了 4小时的预热处理。同时该图还显示了含有空载体对照(VCT)蛋白和野生型P77853蛋白(P77)的泳道,以相同的方式对这两种蛋白进行预热处理。图31显示了反映P77853-Tth-S158-39蛋白(SEQ ID NO: 1680)的蛋白质印迹,该蛋白在37°C (系列39,左泳道)或55°C (系列39,中泳道)下进行了 4小时的预热处理,并在70°C (系列39,右泳道)下进行了 I小时的预热处理。同时该图还显示了含有空载体对照(VCT)蛋白和野生型P77853蛋白(P77)的泳道。图3J显示了反映P77853-Tth-S158-42蛋白(SEQ ID NO: 1681)的蛋白质印迹,该蛋白在37°C (系列42,左泳道)或55°C (系列42,中泳道)下进行了 4小时的预热处理,并在70°C (系列42,右泳道)下进行了 I小时的预热处理。同时该图还显示了含有空载体对照蛋白和野生型P77853蛋白(P77)的泳道。图3 K 显示了反映 P77853-Tth-S158-138 蛋白(SEQ ID NO: 1691)的蛋白质印迹,该蛋白在37°C (系列42,左泳道)或59°C (左泳道数起第二条)下进行了 4小时的预热处理。同时该图还显示了含有空载体对照蛋白和野生型P77853蛋白(P77853)的泳道。图3L 显示了反映 P77853-Tth-T134-1 蛋白(SEQ ID NO: 1629)(系列 I)、P77853-Tth-T134-2 蛋白(SEQ ID NO:1630)(系列 2)、P77853_Tth-T134_3 蛋白(SEQ ID NO: 1631)(系列 3)、P77853_Tth-T134_9 蛋白(SEQ ID NO: 1632)(系列 9)、P77853-Tth-T134-91 蛋白(SEQ ID NO: 1644)(系列 91)、P77853_Tth-T134_48 蛋白(SEQID NO: 1638)(系列 48)、P77853-Tth-T134-80 蛋白(SEQ ID NO: 1640)(系列 80)和P77853-Tth-T134-95蛋白(SEQ ID NO: 1645)(系列95)的蛋白质印迹,这些蛋白在37°C(前述每个系列的左泳道)和70°C (前述每个系列的游泳道)下进行了 I小时的预热处理。同时该图还显示了含有空载体对照(VCT)蛋白和野生型P77853蛋白(P77)的泳道,以相同的方式对这两种蛋白进行预热处理。将各个蛋白表型列于其对应的泳道上方。图4A-4C显示了针对S158Tth内含肽修饰的P77853木聚糖酶突变体的蛋白质印迹分析。图4A显示了针对S158-19Tth内含肽修饰的P77853木聚糖酶(SEQ IDN0:1675)的蛋白质印迹分析。将蛋白样品在59°C下进行不同时间的培养(0小时、I小时、2小时、3小时、4小时和6小时)。空载体(V)和野生型P77853对照样品按分子量梯度显示在最右侧。灰色标出的中间区域遮盖了含有其它样品的泳道。图4B显示了针对S158-30-103Tth内含肽修饰的P77853木聚糖酶(SEQIDNO: 1701)的蛋白质印迹分析。如图所示,将蛋白样品在37°C、50°C、59°C和65°C下进行不同时间的培养(I小时、2小时、3小时、4小时和6小时)。空载体(V)和野生型P77853对照样
品按分子量梯度显示在最右侧。图4C显示了针对T134-100-101Tth内含肽修饰的P77853木聚糖酶(SEQIDNO: 1711)的蛋白质印迹分析。如图所示,将蛋白样品在37°C、50°C、59°C和65°C下进行不同时间的培养(I小时、2小时、4小时、6小时和17小时)。空载体(V)和野生型P77853对照
样品按分子量梯度显示在最右侧。图5显示了在酵母细胞中表达和分泌内含肽修饰蛋白,例如来源于解纤维热酸菌(Acidothermus cellulolyticus)的内切葡聚糖酶的质粒载体;。图6显示了对能表达P07981 (在里氏木霉(Trichoderma reesei)中的内切葡聚糖酶EG-1)、P54583或白蛋白(作为阴性对照)的毕赤酵母株(Pichia)进行的活性分析。图7显示了对酿酒酵母(S. cerevisiae)中P54583的分泌进行的平板分析。图8显示了 P54583在不同pH水平及不同温度下的活性。图9显示了 P54583在不同时间点及不同温度下的活性。图10 显示了 P54583 的 PNP-C 分析。图11显示了用微晶纤维素对P54583进行的提纯。图12显示了野生型P54583的蛋白质印迹检测。图13显示了 P54583中的候选内含肽插入点。
图14显示了对内含肽修饰的内切葡聚糖酶进行编码的基因的装配策略(assembly strategy)。图15显示了针对内含肽修饰的内切葡聚糖酶在不同温度处理下作出反应行为的评分。图16显示了针对内含肽修饰的内切葡聚糖酶的活性分析。图17显示了针对多种内含肽修饰的P54583蛋白的蛋白质印迹分析。图18A-C 显不了产生诱变处理文库(mutangenized libraries)的易错 PCR(errorprone PCR) 图19显示了缺陷内含肽(crippled intein)对P54583酶活性的影响。
图20显示了在不同温度的预温育下的酶活性恢复。图21显示了 P54583在不同温度下进行预温育后的酶活性恢复,该P54583携带有位于S237位点的微小内含肽。图22显示了预温育时间和内含肽修饰的内切葡聚糖酶的活化。每个系列(1、2、3和4)中从左至右连续的条形代表进行了 0小时、2小时、4小时、6小时和10小时预温育。图23显示了针对内含肽修饰的内切葡聚糖酶文库的高通量内切葡聚糖酶分析结果。图24显示了经诱变处理后的内含肽修饰的内切葡聚糖酶文库筛选。图25显示了对经诱变处理后的内含肽修饰的内切葡聚糖酶文库中的候选者进行的重复活性分析。图26显示了内含肽修饰的内切葡聚糖酶的热诱导酶活性,该内含肽修饰的内切葡聚糖酶携带有位于Tth内含肽中R51位点的突变。图27显示了内切葡聚糖酶的系统树。图28显示了表达和分泌内含肽修饰蛋白的质粒载体;例如,酵母中表达和分泌来源于白蚁的内切葡聚糖酶的质粒载体。图29显示了表达空表达载体(empty expression vector)、编码NtEG的表达载体、编码不含天然信号肽(native signal peptide)的NtEG突变体的表达载体的酵母。图30显示了 NtEG及不含天然信号肽的NtEG突变体在一定范围的温度下的内切葡聚糖酶活性。图31显示了不含天然信号肽的NtEG突变体和P54583在一定范围的pH下的内切葡聚糖酶活性。图32显示了不含天然信号肽的NtEG突变体在具有或不具有组氨酸标签情况下的内切葡聚糖酶活性。图33显示了能编码内含肽修饰的NtEG内切葡聚糖酶的基因的装配策略。图34显示了酵母细胞酶活性的时间进程,该酵母细胞能对内含肽修饰的白蚁酶切葡聚糖酶进行表达。图35显示了入ZAP.A II载体中的表达盒。图36A-D显示了 pH为6. 5时,对实施例15中内含肽修饰的P77853进行的T134和S158插入位点的转化检测(switching assay)。将系列的内含肽插入P77853的S 158位点(图36A-B)和T143位点(图36C-D)。将高温和低温下的活性相对于野生型P77853绘制成图(图36A和C)。将高温活性对诱导倍数(高温活性/低温活性)也绘制成图(图36B和D)。内含肽因其宿主的嗜热性而发生分解。纵向的短划线代表10%的低温野生型活性。横向短划线代表40%的高温野生型活性。图37A-D显示了 pH为7. 5时,对实施例15中内含肽修饰的P77853进行的T134和S 158插入位点的转化检测。将系列的内含肽插入P77853的S158位点(图37A-B)和T143位点(图37C-D)。将高温和低温下的活性与野生型P77853进行比较绘制成图(图37A和C)。将高温活性对诱导倍数(高温活性/低温活性)也绘制成图(图37B和D)。内含肽因其宿主的嗜热性而发生分解。纵向短划线代表10%的低温野生型活性。横向短划线代表40%的高温野生型活性。图38A-D显示了实施例15中的最高活性候选者。将系列的内含肽插入P77853的S158位点(图38A和C)和T143位点(图39B和D)。将前20个最高活性候选者在pH为6. 5 (图38A和BMP pH为7. 5 (图38C和D)下,进行高温热处理(每个样品的右侧条形)和低温热处理(每个样品的左侧条形)后的活性与野生型和空载体进行比较绘制成图。活性轴上2到4之间的短划线代表40%的高温野生型活性。活性轴2下方的短划线代表10%的低温野生型活性。图39A-D显示了实施例15中的不同转化类(switching classes)的实例。图39A和C显示了针对P77853的S 158内含肽插入的数据,图39B和D显示了针对P77853的T134内含肽插入的DNA。图39A和B对应的是在pH为6. 5时进行的热处理。图39C和D对应的是在pH为7. 5时进行的热处理。活性轴上2到4之间的短划线代表40%的高温野生型活性。活性轴2下方的短划线代表10%的低温野生型活性。图40显示了对实施例15中最佳表现候选者(AS-146、AS-2、AS-79、AS-83)的再评价,以及它们与低表现者(AS-8)、阳性对照(P77853)和空白载体对照(pBS)的比较。活性轴上I上方的短划线代表40%的高温野生型活性。活性轴上0. 5下方的短划线代表10%的低温野生型活性。图41 显示了 P77853 在 S158 插入位点(AS-2、AS-79、AS-83 和 AS-146)以及 T134插入位点(AT-2、AT-83、AT-149、AT-154)的最佳表现候选者的蛋白质印迹。pBS为空载体对照,P77为阳性对照(P77853)。每个样品的左侧和右侧条形分别代表来自相同裂解液的低温等份(37°C /4小时)和加热等份(60°C /4小时)。箭头代表内含肽修饰的P77853前体,NC标记了成熟蛋白的位点。图42A和B显示了基于耐热性的活性和转化的差别。针对来自嗜热/超嗜热生物(每个样品标签的右侧条形表示)的内含肽和来自嗜常温/UNK生物(每个样品标签的左侧条形表示),将高温下具有高活性的候选者分数(图42A)与高于2X转化的候选者分数(图42B)进行比较。图43A和B显示了基于内含肽长度的活性和转化的差别。针对长度〈240个氨基酸的内含肽(每个样品的左侧条形表示)和长度>240个氨基酸的内含肽(每个样品的右侧条形表示),将高温下具有高活性的候选者分数(图43A)与高于2X转化的候选者分数(图43B)进行比较。图44A-D显示了在最高命中率(top hits)之间的序列相似度。图44A和C显示了针对P77853的S158内含肽插入的序列相似度,图44B和D显示了针对P77853的T134内含肽插入的序列相似度。图44A和B显示了在pH为6. 5时进行热处理的序列相似度。图44C和D显示了“最高命中率”(定义为>40重量%活性,或>30重量%活性且>2X转化)和“无命中”(余下序列)在PH为7. 5进行热处理的序列相似度。图44A-D反映了同时是最高命中率(每个样品的两个样品标签的左侧条形为“相似的最闻命中率”)或无命中(每个样品的两个样品标签中右侧条形为“相似的无命中”)的相似序列(E值<le-20)的分数。
具体实施例方式除非另有说明,本文使用的技术和科技术语具有本发明所属领域技术人员公知的意义。本文实施方式中的方法可以与本领域技术人员已知的其它筛选和应用方法进行替换或结合。“至少一种”短语之后跟随有一种或多种项目清单,例如“A、B或C”,表示A、B或C中的任意一个或它们的任意组合。本文中使用的“外显肽”指的是内含肽修饰蛋白中不属于内含肽的部分。本文中使用的“氨基末端外显肽(amino terminal extein)”、“N_末端外显肽”或“N-外显肽”具有相同的意思,指的是位于内含肽N-末端残基之前的外显肽。在装配的内含肽修饰蛋白中,将氨基末端外显肽、N-末端外显肽或N-外显肽的羧基端融合到内含肽的氨基端上。本文使用的“羧基末端外显肽”、“C-末端外显肽”或“C-外显肽”具有相同的意思,指的是位于内含肽C-末端残基之后的外显肽。在装配的内含肽修饰蛋白中,将羧基末端外显肽、C-末端外显肽或C-外显肽的氨基端融合到内含肽的羧基端上。本文使用的“靶蛋白”是其中插入了内含肽的蛋白,或者是将要插入内含肽的候选者。插入内含肽之前,可以根据将要进行插入的位点将靶蛋白的各个部分称为外显肽、氨基末端外显肽或羧基末端外显肽。“靶蛋白”可以是酶,因此术语“靶酶”表示这样的“靶蛋白”:该靶蛋白是一种酶。本文使用的“许可型”或“P”指的是这样的内含肽修饰其中,内含肽修饰蛋白在插入内含肽后保持了功能,或者将内含肽从蛋白质中切开或剪接出来后,剩下了具有功能的外显肽或连接蛋白。本文中使用的“非许可型”或“NP”指的是这样的内含肽修饰,其中,内含肽修饰蛋白在插入内含肽后具有减弱了的功能。本文使用的“热敏”指的是这样的内含肽修饰其中,内含肽修饰蛋白在暴露在一定温度或一定范围的温度下时具有更强的功能,或者将内含肽从蛋白质中剪接出来后,剩下了在暴露在一定温度或一定范围的温度下时具有更强的功能的外显肽或连接蛋白。本文中使用的“转化”指的是内含肽修饰蛋白响应物理或化学条件的改变而发生的活性变化。能产生“转化”或“转化子(switcher)”内含肽修饰蛋白的内含肽修饰在条件发生改变前是非许可型,在条件发生改变后成为许可型。转化可以在存在内含肽、内含肽从外显肽上切开、或内含肽发生切开且外显肽发生连接时产生。本文中的“热敏转化剪接”或“TSP”指的是这样的内含肽修饰蛋白其中,内含肽对诱导温度或诱导温度范围作出应答发生剪接。所述内含肽修饰蛋白可以在暴露于非诱导温度或诱导温度范围之外的温度之前时是非许可型,当暴露在于诱导温度或诱导温度范围之后为许可型。
本文中使用的“分离核酸”、“分离多核苷酸”、“分离寡核苷酸”、“分离DNA”或“分离RNA”指的是从产生它们的生物中,或者从经常与其有关的天然存在的基因组、地点、或分子中分离出来的,或者通过合成工艺制得的核酸、多核苷酸、寡核苷酸、DNA或RNA。本文中使用的“分离蛋白”、“分离多肽”、“分离寡肽”或“分离肽”指的是从产生它们的生物中,或者从经常与其有关的天然存在的地点或分子中分离出来的,或者通过合成工艺制得的蛋白、多肽、寡肽或肽。本文中使用的“变体”指的是保持了与原始序列相同或基本相似的生物活性的分子。所述变体可以是来自相同或不同的物种,或者是基于天然分子或优先分子(priormolecule)合成的序列。本文中提到的核酸、核苷酸序列、蛋白质或氨基酸序列可以是分离的、提纯的、化学合成的、或通过重组DNA技术制得。上述方法均为本领域所公知。
本文中使用的“可操作地连接”指的是两个或更多个生物分子或部分的一个或更多个生物分子中在彼此相关的结构中的关系,使所述生物分子的正常功能得以发挥。涉及核苷酸序列时,“可操作地连接”指的是两个或更多个核酸序列通过酶的连接作用或其它方式在彼此相关的结构中的关系,使所述序列的正常功能得以发挥。例如,如果编码前序列或分泌前导区的核苷酸序列能表达为参与多肽分泌的前蛋白,则该核苷酸序列是可操作地连接到多肽的核苷酸序列中的;如果启动子或增强子能影响编码序列的转录,则该启动子或增强子是可操作地连接到所述编码序列上的;如果核糖体结合位点的位置有利于翻译编码序列,则该核糖体结合位点可操作地连接到所述编码序列上。提供了具有可控活性的分离蛋白、能编码所述分离蛋白的分离核酸、测定内含肽插入位点的方法以及控制蛋白活性的方法。可以将所述蛋白或核酸提供在植物、微生物和其它生物内。通过控制作用,可以将一种或更多中蛋白或核酸用于燃料、纤维、生面、化学制品、糖类、织物、浆料、纸张、人类食物或动物饲料的制造。优选地,表达宿主的一种或多种的生长、生理或其它性能特征不会轻易受到所述蛋白或核酸的干扰。待受控蛋白可以是一种酶,也可以是任意种类的蛋白,包括非酶、结构蛋白或激素。使用内含肽是一种控制蛋白活性的方法,这种控制允许内含肽修饰蛋白以预定义的活性水平进行表达。内含肽是能够自切割和自连接的多肽。将同时具备自切割和自连接的属性总称为“自剪接”或“剪接”。内含肽从蛋白中切割出来,并对其所切割的蛋白序列(外显肽)的连接作用进行介导,从而对该蛋白进行剪接。内含肽可以插入蛋白序列内部或与蛋白末端融合。蛋白中的内含肽插入物可以通过这种方式来对蛋白进行控制产生的蛋白在内含肽存在时具有一种活性,当内含肽被切割或剪接后该蛋白具有另一种活性。在某些情况下,通过不同诱导条件中的一种或多种能对内含肽剪接反应进行控制。当通常情况下对宿主有害的活性被降低后,内含肽就可以保护表达宿主不受到蛋白对生长、生理学或产量造成的不利影响。对蛋白进行表达后,可以通过使被修饰的蛋白暴露在能诱发内含肽剪接的反应条件中来改变蛋白活性。剪接后产生的蛋白可能具有更强的活性。在一种实施方式中,内含肽修饰在低温下是非许可型而在较高温度下是许可型,因此内含肽修饰蛋白会在温度从低温向较高温度变化时发生转化。但是,在一些实施方式中,经过切割和/或连接的酶具有较低的活性。能编码内含肽修饰蛋白的核酸可以是在植物中进行表达的最佳密码子。可以用本发明实施方式的内含肽进行修饰的靶蛋白包括但不限于细胞壁降解酶、木素纤维素降解酶、木聚糖酶和纤维素酶。本文公开的全部蛋白都可以作为进行内含肽修饰的靶蛋白。可以用选自由Mth内含肽、Psp-Pol内含肽、微小Psp-Pol (mPsp-Pol)内含肽、RecA内含肽、Tac内含肽、Tag内含肽、Tth内含肽、微小Tth内含肽,或它们的衍生物所组成的组中的内含肽对靶蛋白进行修饰。Mth内含肽、Psp-Pol内含肽、微小Psp-Pol内含肽、RecA内含肽、Tac内含肽、Tag内含肽、Tth内含肽和微小Tth (mTth)内含肽可以分别含有SEQ ID N0S:2、3、4-87、88、89、9 0、91和92-103所示的序列。但内含肽也可以有其它来源,或者是被修饰的天然内含肽形式。提供了分离的内含肽修饰的木聚糖酶。发生内含肽切割或内含肽剪接之前和之后的内含肽修饰的木聚糖酶的实施方式具有不同的活性。在一种实施方式中,通过将内含肽修饰的木聚糖酶暴露在诱导条件下来诱发内含肽的切割或剪接。所述诱导条件可以是提高温度,但不仅限于此。提高的温度可以是但不限于50-70°C的范围,包括50°C和70°C的温度,或者是在上述范围内任意两个整数温度之间的子区间。所提高的温度可以大于或等于在25-70°C内以整数递增的温度。所提高的温度可以大于或等于50°C、55°C、59. 9°C、60°C、65°C或70°C。编码内含肽修饰的木聚糖酶的核酸是优选但非必要的为在植物中进行表达而进行了密码子优化的。在一种实施方式中,可以使内含肽修饰的木聚糖酶在转基因植物中进行表达。提供了分离的内含肽修饰的纤维素酶。发生内含肽切割或内含肽剪接之前和之后的内含肽修饰的纤维素酶的实施方式具有不同的活性。在一种实施方式中,通过将内含肽修饰的纤维素酶暴露在诱导条件下来诱发内含肽的切割或剪接。所述诱导条件可以是提高温度,但不仅限于此。提高的温度可以是但不限于50-70°C的范围,包括50°C和70°C的温度,或者是在上述范围内任意两个整数温度之间的子区间。所提高的温度可以大于或等于在25-70°C内以整数递增的温度。所提高的温度可以大于或等于45°C、50°C、55°C、60 V、62°C或65°C。编码内含肽修饰的纤维素酶的核酸是优选但非必要的为在植物中进行表达而进行了密码子优化的。在一种实施方式中,可以使内含肽修饰的纤维素酶在转基因植物中进行表达。可以作为祀蛋白的木聚糖酶包括但不限于来自嗜热网球菌(Dictyoglomusthermophilum)的3-1,4-木聚糖酶2298(登录号为?77853,5£0 ID NO: 104)、来自热纤梭菌(Clostridium thermocellum)的内-1,4-P -木聚糖酶(登录号为 P51584, SEQ ID NO: 105)、来自芽孢杆菌(Bacillus sp. ) NG-27的碱性耐热内木聚糖酶前体(登录号为030700,SEQID NO: 106),来自疏棉状嗜热丝孢菌(Thermomyces Ianuginosus)的内-1,4-0 -木聚糖酶(登录号为 043097, SEQ ID NO: 107)和来自幾堆梭菌(Clostridium stercorarium)的耐热胞外木聚糖酶(celloxylanase)(登录号为P40942,SEQ ID NO: 108)。可以用一种或多种不同的内含肽对木聚糖酶进行修饰,包括但不限于选自由Mth内含肽、Psp-Pol内含肽、微小Psp-Pol内含肽、RecA内含肽、Tac内含肽、Tag内含肽、Tth内含肽、微小Tth内含肽或它们的衍生物所组成的组中的至少一种。在一种实施方式中,所述Mth内含肽、Psp-Pol内含肽、微小Psp-Pol内含肽、RecA内含肽、Tac内含肽、Tag内含肽、Tth内含肽、或微小Tth内含肽的分别具有SEQ ID N0S:2、3、4-87、88、89、90、91、或92-103所示的序列。可以在木聚糖酶内多个候选位点中的一个或多个位点上插入一个或多个内含肽。
可以作为靶蛋白的纤维素酶包括但不限于热纤梭菌celK (Clostridiumthermocellum celK)纤维素酶(登录号为 068438 (SEQ ID NO: 109))、揭色热单胞菌 celB(Thermomonospora fusca celB)纤维素酶(登录号为 P26222 (SEQ ID NO: 110))、来自角军纤维热酸菌(Acidothermus cellulolyticus)的Acel内切葡聚糖酶El (登录号为P54583(SEQ ID NO: 111))以及高山象白蚁(Nasutitermes takasagoensis) NtEG 纤维素酶(登录号为077044 (SEQID N0:112))。可以用一种或更多种不同的内含肽对纤维素酶进行修饰,所述内含肽包括但不限于选自由Mth内含肽、Psp-Pol内含肽、微小Psp-Pol内含肽、RecA内含肽、Tac内含肽、Tag内含肽、Tth内含肽、微小Tth内含肽或它们的衍生物所组成的组中的至少一种。在一种实施方式中,所述Mth内含肽、Psp-Pol内含肽、微小Psp-Pol内含肽、RecA内含肽、Tac内含肽、Tag内含肽、Tth内含肽、或微小Tth内含肽的分别具有SEQID N0S:2、3、4-87、88、89、90、91、或92-103所示的序列。可以在纤维素酶内多个候选位点中的一个或多个位点上插入一个或多个内含肽。 可以通过标准分子生物学技术制备内含肽修饰蛋白,然后进行筛选。可以使内含肽、靶蛋白或内含肽修饰蛋白发生突变,然后进行筛选。可用的筛选系统包括、噬菌体、酵母或其它允许蛋白产生和/或能测试该蛋白的物理和/或功能特性的表达系统。可以将候选者从内含肽修饰蛋白或突变内含肽修饰蛋白群中分离出来,并进一步进行分析。进一步进行的分析可以包括DNA测序、功能分析法、结构分析、酶活性分析和监测活性、结构发生的变化,或者对诱导条件作出应答而发生的剪接。诱导条件可以包括将内含肽修饰蛋白暴露在变化的物理或化学条件发生中,例如但不限于温度、pH、剪接抑制剂的浓度、配体浓度、光、盐条件和压力方面的改变。可以通过对天然内含肽或突变内含肽进行的筛选来测定诱导条件。此外,也可以从能适应所期待的诱导条件下生活的生物中获得内含肽。例如,可以从嗜冷菌(psychrophile)、中温菌或嗜热菌(例如,骑行纳古菌(Nanoarchaeum equitans)、深海火球菌(Pyrococcus abyssi)或火球菌(Pyrococcus sp.))中分离出温度诱导型内含肽;可以从嗜酸菌、嗜碱菌或嗜中性菌(例如,火球菌、结核分枝杆菌(Mycobacterium tuberculosis)、酿酒酵母(Saccharomycescerevisiae))中分离出pH诱导型内含肽;同时可以从嗜盐菌中分离出盐诱导型内含肽。还对化学诱导或化学抑制的内含肽进行了确认。作为化学诱导或化学抑制的内含肽的非限制性实例,从酿酒酵母中分离出来的液泡ATP酶亚基(VMA)内含肽通过暴露在DTT、NH2OH或半胱氨酸中而发生了诱导性的切割;存在Zn2+的时候,从分枝杆菌(Mycobacterium)中分离出来的内含肽和从酵母菌属(Saccharomyces)中分离出来的其它内含肽呈现出受抑制的剪接。可以通过撤去抑制条件来对受抑制的内含肽进行诱导。可以使天然内含肽发生突变并对其进行筛选,以测定在期望诱导条件下可诱导的内含肽中是否产生了突变。可以在内含肽修饰蛋白中提供上述任意来源的内含肽。可以通过实验测定内含肽的插入位点。为了测定插入位点是否允许进行内含肽剪接,可以使用本领域已知的方法构造和克隆内含肽-蛋白融合基因、使该内含肽修饰蛋白得到表达,并测试内含肽修饰蛋白自发地或在诱导条件下发生剪接的能力。为了避免将任何额外的氨基酸引入蛋白中,并可能由此使蛋白功能或活性发生改变的情况,可以将蛋白质中存在的天然半胱氨酸、丝氨酸和苏氨酸筛选为潜在的内含肽插入位点。插入后,可以在以改变蛋白功能为目的的内含肽切割和/或连接之前和之后对蛋白进行测试。通过在新接头位点弓I入半胱氨酸、丝氨酸或苏氨酸可以将内含肽插入到蛋白中任意位置。可以通过对蛋白内的氨基酸进行取代反应或者通过插入半胱氨酸、丝氨酸或苏氨酸来引入半胱氨酸、丝氨酸或苏氨酸。在新接头位点处插入内含肽时,该内含肽的羧基端将与羧基外显肽氨基端的第一氨基酸发生融合。如果引入的半胱氨酸、丝氨酸或苏氨酸在蛋白内的位置能促进内含肽的插入,那么在随后的剪接反应中将该氨基酸留在所述蛋白内。剪接反应后留在成熟蛋白中的引入氨基酸可能对蛋白的功能或活性产生干扰,因此人们需要对经这种剪接反应后得到含有引入氨基酸的所有蛋白的功能和活性进行证实。本领域已知通过功能分析法来对所有已被赋予了功能的蛋白的功能进行测定。鉴于许多蛋白中含有多个半胱氨酸、丝氨酸和苏氨酸,因此希望对那些经测试能进行内含肽剪接的插入位点进行等级排序,或者甚至对这些插入位点的数量进行限制。可以用三个特点来预测内含肽插入位点是A)支持向量机(support vector machine,SVM)所描述的局部序列,B)插入位点到活性位点残基的距离,以及C)插入位点与局部二级结构的·邻近程度(例如,在a-螺旋结构或¢-片状结构端部处或附近)。在一种实施方式中,使用局部序列和到活性位点的距离来缩小推荐插入位点的选择范围,而二级结构元件信息则能用于对相似的插入位点进行优选。A)局部序列可使用SVM法来对内含肽插入位点进行预测或评价。可以由已知的天然内含肽插入位点装配成合适的已知内含肽插入位点训练组(训练组)。可以在Perler,F.B. (2002),InBase, The Intein Database (内含妝数据库),Nuc. Acids Res. 30:383-384 中记载的NEB inbase数据库中找到用于该目的的已知内含肽插入位点序列,通过引用该文献全部记载而将其整体与本文结合。优选地,训练组内含肽插入位点具有SEQ ID N0S: 1233-1512的序列。用于上述目的的蛋白序列的一种来源是NCBI数据库,也可以使用其它的来源。含有对应于SEQ ID N0S: 1233-1512训练组内含肽插入位点的内含肽的蛋白分别具有SEQID NOS:393-672序列。基于内含肽序列(SEQ ID N0S: 113-392)和含内含肽的蛋白序列(SEQ ID N0S:393-672),可以将各个含内含肽的蛋白的外显肽序列从每个内含肽序列中分离出来。SEQ ID NOS:393-672蛋白序列中的N-外显肽分别以SEQ ID NOS:673-952表示,而SEQID NOS:393-672蛋白序列中的C-外显肽分别以SEQ ID N0S:953_1232表示。为了SVM序列预测的生成,对N-外显肽及C-外显肽中的含有插入位点X和环绕X的序列的盒(cassette)进行测定。优选地,被分析的序列包括环绕X的_3号到+2号(总计6个氨基酸,编号为-3、_2、-1、0、1、2)的氨基酸盒(NNNXNN序列中,X为0号氨基酸)。下面以NNNXNN盒作为SVM模型进行描述。如果采用了 NNNXNN以外的盒,则根据本文的描述可以显然得知需要对SVM进行修改。用下面的等式将盒换算成向量V :V=[位点_3位点_2位点—位点。位点+1位点+2]其中,位点I=IiaaiALA BaiARGmaaiTRP aajTYR]如果位点i存在氨基酸型N时,aaiN=l ;否则,N=O0这将6个氨基酸的盒序列换算成1X120的向量。将用于含有内含肽的SEQ ID N0S:393-672蛋白的插入位点盒分别提供在SEQ ID NOS: 1233-1512中。将这一组插入位点盒的向量用作真阳性对照组来训练SVM。在每个具有真阳性的蛋白中,同时还从N-外显肽序列和C-外显肽序列中选择3个在X (0)处具有半胱氨酸、苏氨酸和丝氨酸(本文中称为“C/T/S”)但不含内含肽插入无的随机NNNXNN盒(优选来自序列SEQ ID N0S:673_1232)作为真阴性。然后对来自外显肽序列的真阴性组进行编译。被选择的真阴性可以来自与真阳性插入位点相同的蛋白,并在X处具有与真阳性相同的残基类型。在整套内含肽插入位点序列上对用来预测内含肽插入位点的总SVM进行训练,同时除去全部相同的序列。这可以通过执行多种不同方法或程序中的任何一种来进行。一种可以用来预测内含肽插入位点的SVM程序为SVM_light V6. 02 (2008年8月14日),该程序可商购自Thorsten Joachims Weichgut LLC, Ithaca,NY,通过引用其全部内容将其与本文结合。同时参见Thorsten Joachims的“产生大量SVM学习实践”(Making Iarge-Scale
SVM Learning Practical)。在Kernel 法中进行了改进-支持向量学习,B. Scholkopf■和
C. Burges和A. Smola (编译),MIT-出版社,1999,通过引用其全部内容将其与本文结合。简而言之,SVM_light V6. 02是上述提到的Joachims 1999出版物(该出版物解释了与大量问题有关的较大训练组的困难)的支持向量机训练法的实践。通过以高效方式选择工作组变量,将算法构建在在解决上述问题的分解策略的基础上。通过SVM_light V6. 02采用了线性核(linear kernel)和设定至I的成本因素,从而使阳性组和阴性组中的差错具有同等重要性。为了测试该方法的正确性,可以选择较小组的插入位点盒按照下面的方法进行训练和测试1)随机选择m组具有单一序列的真阳性训练组插入位点(在一种实施方式中,m为1-250,所述序列选自SEQ ID N0S: 1233-1512) ;2)针对每个真阳性插入位点,从同一个含内含肽蛋白(在一种实施方式中,SEQ ID N0S:673-1232)中与所述真阳性插入位点有关的外显肽中随机选择三个对应的真阴性盒,其中,真阴性插入位点具有相同的中心氨基酸X但不含有内含肽插入物,和3)可以将步骤I)组内未被选择的余下其它单一序列选为测试组(例如,SEQ ID N0S: 1233-1512中余下的序列)。接着,采用与进行总量预测的相同方法来对支持向量进行训练,然后用这些支持向量对测试组进行评分,所述支持向量包括已知插入位点盒一以正值表示,和选自在0位具有半胱氨酸、苏氨酸或丝氨酸的外显肽(SEQ IDN0S:673-1232)的全部其它非插入位点盒——以负值表示。然后将对每个蛋白的大量位点进行的评分进行比较,并根据其分值将插入位点进行分级。为了得到用于比较的基度(metric),可以为每个内含肽插入位点指定一个数值,该数值是通过将SVM评分低于插入位点(L)的位点数量除以测试组中全部位点数量减去I((Nn)之后计算得到的比值,或表示为L/Nn。结果为I的基度意味着插入位点的数量大于全部其它位点的数量,而结果为0的基度则意味着插入位点的数量小于全部其它位点的数量。可以将上述过程在各个不同大小的训练组中重复进行25次,其中,每次过程都是基于SEQ ID N0S: 1233-1512中的插入位点盒进行的随机选择之上,而相应的真阴性插入位点对应地选自待训练和测试的SEQ ID N0S:673-1232中。下表I显示了使用上述训练和测试程序的针对已知内含肽插入位点的基度。表I中针对已知内含肽插入位点的平均基度以及各个不同大小训练组的标准偏差是建立在优选实施方式的基础上的,该优选实施方式包括选自SEQ ID N0S:673-1512的训练和测试组序列。对于大小为25个或更多的训练组来说,内含肽插入位点的平均值为0. 75个基度。由此具有150个插入位点盒的训练组的P值大约为10_1(1显示出统计学上的显著性。基于局部序列的特征,可以通过SVM对任意靶蛋白的潜在内含肽插入物位点进行筛选,进而对能用来调整靶蛋白活性的插入位点进行预测。在一种实施方式中,选择等级为0. 75或更高的候选插入位点作为插入内含肽的位点。表I
权利要求
1.一种分离蛋白,该分离蛋白具有与选自由SEQ ID NOS :2373-2686和3315-3322所组成的组中的序列具有至少90%的同一性的氨基酸序列。
2.根据权利要求I所述的分离蛋白,其中,所述氨基酸序列与选自由SEQIDNOS:2373-2686和3315-3322所组成的组中的序列具有至少95%的同一性。
3.根据权利要求I所述的分离蛋白,其中,所述氨基酸序列为选自由SEQIDN :2373-2686和3315-3322所组成的组中的一个序列。
4.一种分离核酸,该分离核酸具有编码氨基酸序列的核苷酸序列,所述氨基酸序列与选自由SEQ ID N0S:2373-2686和3315-3322所组成的组中的序列具有至少90%的同一性。
5.根据权利要求4所述的分离核酸,其中,所述氨基酸序列与选自由SEQIDN< OS:2373-2686和3315-3322所组成的组中的序列具有至少95%的同一性。
6.根据权利要求4所述的分离核酸,其中,所述氨基酸序列为选自由SEQIDNOS:2373-2686和3315-3322所组成的组中的一个序列。
7.—种转基因植物,该转基因植物含有权利要求4所述的分离核酸。
8.根据权利要求7所述的转基因植物,其中,所述分离核酸还含有表达构建体。
9.根据权利要求8所述的转基因植物,其中,所述表达构建体具有SEQIDNO: I所示的序列。
10.一种分离核酸,该分离核酸具有在中严格度条件下与选自由SEQ IDNOS:2687-3000和3323-3330所组成的组中的序列杂交的核苷酸序列。
11.根据权利要求10所述的分离核酸,其中,所述核苷酸序列在高严格度条件下与选自由SEQ ID NOS:2687-3000和3323-3330所组成的组中的序列杂交。
12.—种转基因植物,该转基因植物含有权利要求10所述的分离核酸。
13.根据权利要求12所述的转基因植物,其中,所述分离核酸还含有表达构建体。
14.根据权利要求13所述的转基因植物,其中,所述表达构建体具有SEQID NO: I所示的序列。
15.一种分离的氨基酸序列,该分离的氨基酸序列含有与蛋白中的6个、10-50个、10-100个、10-150个、10-300个、10-400个、10-500个,或10至全部的连续氨基酸残基具有至少90%的同一性的连续氨基酸序列,所述蛋白具有SEQ ID NOS :2373-2686和3315-3322中的任意的序列;其中,所述蛋白具有内含肽序列、酶序列、上游内含肽-外显肽接头和下游内含肽-外显肽接头,并且其中,具有SEQ ID N0S:3315-3322中的一个的序列的蛋白具有至少一种有关SEQ ID N0:2518的氨基酸改变; 所述分离的氨基酸序列含有上游内含肽-外显肽接头、下游内含肽-外显肽接头中的至少一种,或至少一种有关SEQ ID N0:2518的氨基酸改变中的一种或多种。
16.根据权利要求15所述的分离的氨基酸序列,其中,所述连续氨基酸序列与蛋白中的 6 个、10-50 个、10-100 个、10-150 个、10-300 个、10-400 个、10-500 个,或 10 至全部的连续氨基酸残基具有100%的同一性,所述蛋白具有SEQ ID NOS:2373-2686和3315-3322中的一个的序列。
17.一种抗体,该抗体识别权利要求15所述的分离的氨基酸序列上的抗原表位。
18.一种分离的核酸,该核酸具有编码连续氨基酸序列的序列,所述连续氨基酸序列与蛋白中的 6 个、10-50 个、10-100 个、10-150 个、10-300 个、10-400 个、10-500 个,或 10 至全部的连续氨基酸残基具有至少90%的同一性,所述蛋白具有SEQ ID NOS:2373-2686和3315-3322中的一个的序列;其中,所述蛋白具有内含肽序列、酶序列、上游内含肽_外显肽接头和下游内含肽-外显肽接头,并且其中,具有SEQ ID N0S:3315-3322中的一个的序列的蛋白具有至少一种有关SEQ ID NO:2518的氨基酸改变; 所述分离的氨基酸序列含有上游内含肽-外显肽接头、下游内含肽-外显肽接头中的至少一种,或至少一种有关SEQ ID N0:2518的氨基酸改变中的一种或多种。
19.根据权利要求18所述的分离核酸,其中,所述氨基酸序列与蛋白中的6个、10-50个、10-100个、10-150个、10-300个、10-400个、10-500个,或10至全部的连续氨基酸残基具有至少95%的同一性,所述蛋白具有SEQ ID NOS:2373-2686和3315-3322中的一个的序列。
20.根据权利要求18所述的分离核酸,其中,所述氨基酸序列与蛋白中的6个、10-50个、10-100个、10-150个、10-300个、10-400个、10-500个,或10-522个连续氨基酸残基具有100%的同一性,所述蛋白具有SEQ IDNOS:2373-2686和3315-3322中的一个的序列。
全文摘要
提供了一种预测内含肽在蛋白中的插入位点的方法,所述内含肽插入位点能够产生转化表型。该方法包括对蛋白内多个C/T/S位点进行识别,从多个C/T/S位点中选择由支持向量机评定为0.75或更高的,位于蛋白活性位点10埃范围内的,且在环-β-片状接头或环-α-螺旋接头处或附近的位点。还提供了控制蛋白活性的方法,以及含有具有受控活性的蛋白的宿主。同时,提供了内含肽修饰蛋白以及含有内含肽修饰蛋白的植物。
文档编号C07K14/415GK102712682SQ201080060602
公开日2012年10月3日 申请日期2010年11月5日 优先权日2009年11月6日
发明者B·沈, G·拉扎尔, H·德拉维加, J·阿普加, P·莱萨德, R·M·莱布 申请人:谷万达公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1