本发明涉及一种具有结合活性但缺乏水解活性或具有降低的水解活性的新型内切蛋白酶、其突变体,以及在研究和分出o-连接糖蛋白的方法中的用途。
背景技术:
近来,糖基化对生物学功能的影响已引起越来越多的关注,特别是在o-连接的聚糖方面。然而,尽管已经恢复对这些重要的蛋白质修饰的兴趣,但仍缺乏有效研究聚糖和糖蛋白的工具。
已经开发有对从天然蛋白中去除o-连接的聚糖和对聚糖测序都非常有用的几种外切糖苷酶和内切糖苷酶。这两种方法均可单独使用,以减少糖蛋白的异质性,从而有助于在质谱中分析蛋白质及其片段化的肽。还可以通过对受水解影响的功能进行下游分析来实施对聚糖的生物学效应的更有效的分析。然而,这样的工具例如在方便o-连接的糖蛋白的鉴定、糖基化位点的确定和o-连接的糖肽的纯化上不是有效的。
1991/1992年报道了首个o-糖蛋白特异性内切蛋白酶,o-糖蛋白特异性内切蛋白酶与o-聚糖结合并主要水解接近聚糖的r-n键(abdullahetal.,jbacteriol173,5597–5603(1991);abdullahetal.,infectimmun60,56–62(1992))。然而,该酶在医学和生物技术中的用途是有限的,因为该酶仅对包含唾液酸的o-聚糖(大部分但远非所有o-连接的聚糖)具有特异性,并且要求特定的氨基酸,从而通常导致水解水平低,因此需要更好的用于研究o连接的糖蛋白的工具。
技术实现要素:
本发明人已经鉴定、纯化和表征了来自嗜粘蛋白艾克曼菌(akkermansiamuciniphila)的新型多肽,在本文中被称为ls。该多肽充当内切蛋白酶,该内切蛋白酶特别地切割/水解在o-连接的聚糖的n末端且与o-连接的聚糖接近的氨基酸键,而不显示出对特定氨基酸序列的任何特异性或限制。
本发明人还修饰了ls的序列,并鉴定了能够结合o-连接的聚糖但缺乏水解糖蛋白能力或具有降低的水解糖蛋白能力的突变体。这些突变体可用于选择性去除、富集或纯化游离的o-聚糖、o-糖肽和/或o-糖蛋白。
因此,在本发明的第一方面,提供一种对o-糖基化蛋白具有特异性内切蛋白酶活性的多肽,该多肽包含:
(a)seqidno:1的氨基酸序列;
(b)与seqidno:1的氨基酸序列至少85%一致的氨基酸序列;或
(c)这样的氨基酸序列:该氨基酸序列为seqidno:1的序列的片段或与seqidno:1的氨基酸序列85%一致的氨基酸序列的片段。
本发明还提供一种水解o-糖蛋白的方法,其中该方法包括使包含该蛋白质的样品与本发明的多肽接触,并且任选地还包括对水解产物的检测或分析。
另外,提供一种评估蛋白质的糖基化状态的方法,该方法包括使包含该蛋白质的样品与本发明的多肽接触,以及检测和/或分析产生的产物,任选地,其中使用切割产物存在或不存在来确定样品中o-糖蛋白的存在/不存在,和/或其中进行所述分析以鉴定o-糖链的类型和/或o-糖链与o-糖蛋白的连接位置。
在本发明的第二方面,提供一种能够与o-聚糖、o-糖肽和/或o-糖蛋白结合并且对o-糖基化蛋白缺乏特异性内切蛋白酶活性或具有降低的特异性内切蛋白酶活性的多肽,该多肽包含:
(a)seqidno:5的氨基酸序列;
(b)与seqidno:5或seqidno:20的氨基酸序列至少85%一致的氨基酸序列;或
(c)这样的氨基酸序列:该氨基酸序列为seqidno:5或seqidno:20的序列的片段或与seqidno:5或seqidno:20的氨基酸序列85%一致的氨基酸序列的片段。
本发明还提供一种与o-聚糖、o-糖肽和/或o-糖蛋白结合的方法,其中该方法包括使包含o-聚糖、o-糖肽和/或o-糖蛋白的样品与本发明的多肽接触,以及任选地确定是否已结合o-聚糖、o-糖肽或o-糖蛋白和/或从所得混合物中使o-聚糖与任何连接的糖蛋白、o-糖肽或o-糖蛋白分离。
另外,提供一种用于评估蛋白质的糖基化状态的方法,该方法包括使包含蛋白质的样品与本发明的多肽接触,以及确定蛋白质是否与所述多肽结合。
还提供了一种用于检测样品中o-糖肽和/或o-糖蛋白的方法,其中该方法包括:
(a)使所述样品与本发明的多肽接触,从而使得在本发明的多肽与o-连接的糖肽和/或o-糖蛋白之间形成复合物(o-连接的糖肽/蛋白质-多肽复合物);
(b)任选地从接触的样品中分离出所述多肽;和
(c)确定分离的多肽是否与o-连接的糖肽或糖蛋白结合,从而确定样品中存在或不存在o-连接的糖肽或糖蛋白。
附图说明
图1:ls的表达和纯化。ls在pet21(a)+载体中表达为具有c末端his-tag的融合蛋白。转化进bl21(de3)star后,表达了四个单独的克隆,并在hisgravityflow柱上纯化至均一。基于纯化样品中蛋白质的总量以及基于sds-page的纯度,所研究的所有四个克隆均同样表达良好。
图2:ls特异性作用于含有o-聚糖的蛋白质-图中显示了通过sds-page分析的产物。ls与igg或iga孵育导致iga特异性降解,但对igg(赫赛汀/曲妥珠单抗)没有明显的活性。所有孵育均在37℃下在pbs中进行。在这些条件下,添加唾液酸酶(am0707)不是ls的活性所需的。
图3:最佳酶促条件。ls在很宽的ph范围内有活性(a),能很好地耐受nacl(b),但对edta高度敏感(c,d),并且被zn2+部分抑制(d)。所有实验(ph测定除外)均在pbs中在37℃下过夜进行。为了确定优化ph,将酶在20mmtris-hcl(ph6.8-8.8)或50mm乙酸(ph5.6)中孵育。
图4:聚糖组成调节ls的活性。(a)在用ls水解30分钟之前依次去除特定聚糖导致在唾液酸化蛋白中的活性非常低,在去唾液酸化蛋白中的活性高,而在除去半乳糖的样品中则没有活性。(s)唾液酸酶,(sg)唾液酸酶和半乳糖苷酶,(ls)ls。(b)长时间孵育(过夜)经完全糖基化的糖蛋白(enbrel)或经唾液酸酶处理的糖蛋白(enbrel(s))导致两个样品中完全水解。enbrel在本文中也可称为依那西普(etanercept)。(c)用唾液酸酶(“唾液酸酶”)、o-糖苷酶/唾液酸酶(“o-糖”)或pngasef(“n-糖”)预处理依那西普的tnfα结合部分(tnfαr),以分别除去唾液酸、o-聚糖和n-聚糖。将ls添加到样品中,并在分析前继续过夜孵育。ls在除了用o-糖苷酶处理的那些样品之外的所有样品中外均具有活性。
图5:搜索结果显示ls水解了o-聚糖的糖蛋白n末端。对用ls水解成片段且随后用o-糖苷酶处理去糖基化的对依那西普进行质谱分析(lc/ms和ms/ms)。根据m/z值和ms/ms数据,将鉴定出的肽(白色和阴影框)拟合到依那西普序列上,y'和b'离子标被记为小灰色框。所有灰色和阴影框(例如肽)直接以o-聚糖所连接的t或s开始。前面的氨基酸变化(p、s、h、t、g),并且似乎可能不影响水解。(a)使用偏倚方法(biasedapproach),特别是搜索由s/t肽酶生成的肽,进行分析。(b)使用无偏方法(unbiasedapproach)进行分析。
图6:灭活的ls特异性结合o-连接的糖蛋白。使金属蛋白酶活性位点突变以除去催化能力,同时不影响底物亲和力或相互作用。具体而言,这是通过将e换为a来完成的,从而创建克隆“lsmut”(也称为lse206a)。(a)虽然在唾液酸酶存在下ls能够水解enbrel,但失活的lsmut在测试条件下不能水解enbrel。sds-page证实活性丧失。(b)尽管失去了水解活性,但lsmut仍然能够与o-糖蛋白结合。在具有固定lse206a的旋转柱上验证了特异性结合,证明对o-连接的糖蛋白具有特异性亲和力。通过将lsmut固定在琼脂糖凝胶(sepharose)上,我们能够对iga进行亲和纯化。缺乏o-聚糖的赫赛汀(曲妥珠单抗)以及o-糖苷酶处理的iga不与柱子结合,但可以在流过液(ft)中检测到。neur=神经氨酸酶/唾液酸酶0707。
图7:α2-3键合的唾液酸限制了ls的效率。使用enbrel作为糖蛋白底物,将ls与一系列不同的唾液酸酶同时孵育30分钟至20小时,显示在存在α2-3特异性唾液酸酶1757或混合液(0707+1757)的情况下效率更高,而广谱唾液酸酶0707并不是ls的似乎完全的活性所必需的,因此表明α2-6(和α2-8)键与ls活性无关。
图8:ls活性的示意图。ls优先结合连接至o-连接的galnac的末端半乳糖,导致连接有聚糖的丝氨酸或苏氨酸的n末端水解。唾液酸的存在会降低ls的效率,但不会抑制ls。在n-连接的聚糖上不能观察到活性。
图9:促红细胞生成素用ls、用于去除n-聚糖的pngasef、用于去除唾液酸的唾液酸酶以及与用于去除o-聚糖的o-糖苷酶的不同组合切割的实验结果。通过sds-page、rplc和esi质谱来分析反应产物。(a)sds-page分析的结果:泳道1=用pngasef和唾液酸酶处理的epo;泳道2=用pngasef和唾液酸酶+ls处理的epo;泳道3=用pngasef+ls处理的epo;泳道4=用pngasef、唾液酸酶、o-糖苷酶然后用ls处理的epo;泳道5=酶对照。条带x=未切割的epo;条带y=ls消化的epo的n末端片段;条带z=ls消化的epo的c末端片段。泳道2和3显示在唾液酸已被去除的情况下以及在它们完好的情况下,ls切割epo。泳道2–3显示ls也切割epo,其中n-聚糖被pngasef去除。泳道4显示,ls没有切割epo,其中o-聚糖已被去除。(b)uv色谱图显示了用pngasef和唾液酸酶+ls处理的epo的rplc分离结果。如图所示,鉴定出两个主峰。峰1是被ls消化的epo的c末端片段;峰2是被ls消化的epo的n末端片段;(c,d)显示了质谱分析的结果。图c显示了具有仍然与(目前是n末端的)丝氨酸连接的o聚糖的epo的c末端片段的质量(正方形=glcnac,圆圈=半乳糖)。质量差异是由于样品中某些部分的o-聚糖的降解(损失末端半乳糖)的差异而引起的,这很可能是ms仪器中的电离能引起的。图d显示了缺少聚糖的epo的n末端片段,加上仍连接有聚糖的未消化的epo。
图10:显示lse206a保留一定活性而lsh205a/e206a(也可以称为lshe206aa)完全失活的实验结果。针对包含依那西普的tnfα结合部分(tnfar2;在本文中也称为tnfar)和依那西普本身(etanercept)的去唾液酸化o糖基化底物,评估了ls突变体lse206a(a)和lsh205a/e206a(b)对比野生型ls酶的活性。将不同浓度的ls突变体添加到1mg底物(1:1至15:1,酶:底物),在pbs中在37℃下孵育过夜,然后在sds-page上分析。
a)泳道1:仅去唾液酸化底物;泳道2:仅ls,泳道3:0.5μglse206a,泳道4:5μglse206a,泳道5:tnfar2+ls(比例为1:1),泳道6:tnfar2+lse206a(比例为1:1)。
b)泳道1:仅去唾液酸化底物;泳道2:lsh205a/e206a+依那西普(比例为15:1),泳道3:lsh205a/e206a+依那西普(比例为5:1),泳道4:lsh205a/e206a+依那西普(比例为1:1),泳道5:ls+依那西普(比例为1:1),泳道6:lsh205a/e206a。
图11:显示固定在树脂上的lsh205a/e206a与含有o-聚糖的蛋白质特异性结合的实验结果。图中显示了在每种情况下对起始/装载材料、流过液(ft)和洗脱液(e)的sds-page分析:(a)包含bsa(牛血清白蛋白)、依那西普、iga和igg的样品,该样品是天然的或用如所示的唾液酸酶混合物+/-o-糖苷酶预处理的;(b)包括o-糖基化蛋白(tnfαr和apoe)、n-糖基化蛋白(阿柏西普(aflibercept)、agp(α-1-酸糖蛋白)、iggfc(igg的fc结构域)和非糖基化蛋白(bsa)的混合物的样品用唾液酸酶混合物预处理。(c)包括n-糖基化蛋白(西妥昔单抗、阿柏西普、agp)和非糖基化蛋白(bsa、碳酸酐酶)和混合物的样品用唾液酸酶混合物预处理。
图12:显示固定的lsh205a/e206a具有结合o-糖蛋白的浓度依赖性能力的实验结果。去唾液酸化依那西普(50-250μg;100μl在pbs中)添加到50μlpbs平衡的具有不同的lsh205a/e206a固定条件(5-15mg/ml)的lsh205a/e206a树脂中。在室温下通过颠倒旋转使蛋白质与树脂结合2小时。将树脂用pbs(350μl)洗涤3次,然后通过添加8m尿素(50μl,5分钟孵育;重复两次)洗脱。为了研究尿素和盐酸胍(ghcl)在结合中的作用,将其与50μg去唾液酸化依那西普一起包含在结合缓冲液中,但处理方法相同。(a)所有样品在sds-page上分离,并使用geldocez和imagelab软件通过光密度测定法确定条带强度。所示的百分比表示与对照相比的条带强度。(b),将根据条带强度确定的蛋白质结合能力相对固定的lsh205a/e206a的量作图。
图13:显示lsh205a/e206a可以对约3mg依那西普/ml树脂进行亲和纯化的实验结果。去唾液酸化依那西普(10-200μg;在pbs中为100μl)添加到50μlpbs平衡的lsh205a/e206a树脂中。在室温下通过颠倒旋转使蛋白质与树脂结合2小时。将树脂用pbs(350μl)洗涤3次,然后通过添加8m尿素(50μl,5分钟孵育;重复两次)洗脱。所有样品在sds-page上分离,并使用geldocez和imagelab软件通过光密度测定法确定条带强度。所示的百分比表示与对照相比的条带强度。
图14:显示lsh205a/e206a-底物的相互作用对高离子强度和缓冲液体积/类型的差异不敏感且可在较宽的ph范围内工作的实验结果。(a)所示的去唾液酸化依那西普(50μg;在pbs中为100μl)与以不同浓度添加的nacl;(b)如所示的去唾液酸化依那西普(50μg;在pbs中为100-300μl);(c)来自去唾液酸化依那西普(50μg)和bsa(50μg)的样品在不同缓冲液中不同的ph下的流过液;(d)来自c样品的洗脱液。
图15:显示变性或添加去污剂洗脱与lsh205a/e206a结合的o-糖蛋白的实验结果。去唾液酸化依那西普(50μg;在pbs中为100μl)添加到50μlpbs平衡的lsh205a/e206a树脂中。在室温下通过颠倒旋转使蛋白质与树脂结合2小时。将树脂用pbs(350μl)洗涤3次,然后通过添加1m至8m尿素或1.25%至10%sds(50μl,5分钟孵育;重复两次)洗脱。所有样品在sds-page上分离以用于分析。
图16a:使用ls酶促洗脱lsh205a/e206a结合的o-糖蛋白的实验结果。去唾液酸化阿巴西普(10μg;在pbs中为100μl)和依那西普(50μg;在pbs中为100μl)添加到50μlpbs平衡的lsh205a/e206a树脂中。在室温下通过颠倒旋转使蛋白质与树脂结合2小时。将树脂用结合缓冲液(350μl)洗涤3次,然后添加在总体积为100μlpbs中的50个单位的ls。将样品在摇动(450rpm)下于37℃下再孵育6至24小时。通过离心(1000g,1分钟)收集ls释放的o糖蛋白/糖肽,然后通过添加8m尿素(50μl,5分钟孵育;重复两次)最后洗脱柱子。所有样品在sds-page上分离以用于分析。
图16b:用ls洗脱的依那西普的质谱分析(lc/ms和ms/ms)结果。鉴定出的肽(图16b.1)与依那西普在ls消化中产生的肽(图16b.2)一致。根据m/z值和ms/ms数据,将鉴定出的肽(白色方框)拟合到依那西普的序列上,y'和b'离子标记为小灰方框。所有白框(例如肽)直接从与o-聚糖连接的t或s处开始。
图17:表明o-糖基化血清蛋白的亲和纯化和富集的结果。(a)去唾液酸化血清(20μl;在pbs中为100μl)添加到50μlpbs平衡的lsh205a/e206a树脂中。在室温下通过颠倒旋转使蛋白质与树脂结合2小时。将树脂用结合缓冲液(350μl)洗涤3次,然后通过添加8m尿素洗脱。(b)为了研究聚糖对相互作用的影响,将样品用唾液酸酶混合物+/-o-糖苷酶预处理。如上所述进行下游纯化。(c)将血清(40μl)与pbs(高达100μl)和唾液酸酶混合物(50-500个单位)混合,并添加到pbs平衡的柱子,在室温下孵育2小时并颠倒旋转,此后如上所述洗涤并洗脱样品。所有样品在sds-page上分离以用于分析。
图18:显示来自人血清中的o-糖蛋白富集的结果。将在pbs中稀释2.5倍至100μl的人血清涂在旋转柱中的50μlpbs平衡的lsh205a/e206a树脂。添加50-500个单位的唾液酸酶混合物并在室温下在树脂上共孵育2小时。收集流过液,并用pbs洗涤树脂5至10次。结合的蛋白在8m尿素中洗脱,然后通过添加5mmdtt并在37℃下孵育60分钟来变性和还原。将还原的半胱氨酸在室温下和黑暗中用15mm碘乙酰胺烷基化30分钟。在旋转脱盐柱上使样品进行缓冲液交换至50mmtrisph8.0中。将胰蛋白酶(2.5μg)添加到溶液中,并在37℃下消化过夜。使用rp-lcms/ms在c18柱上以0.1%fa的mq溶液:0.1%fa的95%acn的梯度溶液以45℃及0.2ml/分钟的流量分离并分析肽。检测在esi-q-tof上进行。数据转换为mgf格式文件,并在swissprot数据库中进行搜索(a)鉴定出的肽来自标注为o-糖基化蛋白或非o-糖基化蛋白的蛋白。仅包括具有>6个匹配肽且mascot得分>200的蛋白。(b)不同的洗涤步骤导致所鉴定出的肽的变化,以及o-糖基化蛋白与非o-糖基化蛋白的比例改变(c)sia=唾液酸酶处理的;siapre=唾液酸酶预处理的。
图19:显示固定的双突变体也与较短的o-糖肽结合的实验结果。a显示了与o-糖基化肽(糖基果蝇肽(glycodrosocin;gd))和几种非糖基化肽(h2686、h4062、h8390和胰岛素氧化的β链(iob))的制备的混合物结合的lc/ms分析代表性结果。b显示了iga的示意图,展示胰蛋白酶消化将产生单个o-糖基化的肽。c显示了与iga的胰蛋白酶消化物结合的lc/ms分析的代表性结果。
图20:显示固定的双突变体比其他可商购的o-糖蛋白结合基质有优势。a显示了代表性的sds-page凝胶,比较了在与所示的不同的固定的凝集素或ls双突变体孵育后,流过液(ft)或洗脱液(e)中的依那西普或去唾液酸化依那西普(依那西普(s))的存在。b显示相对于1.5μg直接加样底物阳性对照的凝胶光密度分析。
序列的简要说明
seqidno:1是具有o-糖蛋白特异性内切蛋白酶活性的多肽的氨基酸序列。
seqidno:2是具有o-糖蛋白特异性内切蛋白酶活性的本发明示例性多肽的氨基酸序列。相对于seqidno:1,seqidno:2在n末端包括另外的甲硫氨酸,并且在c末端包括接头+his6标签。由该序列组成的多肽在本文中可以称为ls。
seqidno:3是编码具有seqidno:2的序列的多肽的核苷酸序列。
seqidno:4是具有o-糖蛋白特异性内切蛋白酶活性的自嗜粘蛋白艾克曼菌分出的多肽的野生型氨基酸序列。相对于seqidno:1,seqidno:4包括n末端的信号基序。
seqidno:5是能够与o-聚糖结合但缺乏o-糖蛋白特异性内切蛋白酶活性或具有降低的o-糖蛋白特异性内切蛋白酶活性的多肽的氨基酸序列。
seqidno:6是能够与o-聚糖结合但缺乏o-糖蛋白特异性内切蛋白酶活性或具有降低的o-糖蛋白特异性内切蛋白酶活性的本发明示例性多肽的氨基酸序列。相对于seqidno:5,seqidno:6包括另外的n末端甲硫氨酸和c末端接头+his6标签。由该序列组成的多肽在本文中可以称为lse206a。
seqidno:7是编码具有seqidno:6的序列的多肽的核苷酸序列。
seqidno:8是具有o-糖蛋白特异性内切蛋白酶活性的本发明示例性多肽的金属蛋白酶结构域基序。
seqidno:9是自嗜粘蛋白艾克曼菌分出的唾液酸酶am1757的野生型氨基酸序列。seqidno:9包括n末端的信号基序。
seqidno:10是唾液酸酶am1757的野生型氨基酸序列,相对于seqidno:9缺少n末端的信号基序。
seqidno:11是示例性唾液酸酶am1757的氨基酸序列。相对于seqidno:10,seqidno:11包括另外的n末端甲硫氨酸和c末端接头+his6标签。
seqidno:12是自嗜粘蛋白艾克曼菌分出的唾液酸酶am0707的野生型氨基酸序列。seqidno:12包括n末端的信号基序。
seqidno:13是唾液酸酶am0707的野生型氨基酸序列,相对于seqidno:12在n末端缺少信号基序。
seqidno:14是示例性唾液酸酶am0707的氨基酸序列。相对于seqidno:13,seqidno:14包括另外的n末端甲硫氨酸和c末端接头+his6标签。
seqidno:15是自口腔链球菌(s.oralis)分出的o-糖苷酶的氨基酸序列。
seqidno:16和17是引物序列。
seqidno:18显示了epo的氨基酸序列。
seqidno:20是能够与o-聚糖结合但缺乏o-糖蛋白特异性内切蛋白酶活性或具有降低的o-糖蛋白特异性内切蛋白酶活性的多肽的氨基酸序列。
seqidno:21是能够与o-聚糖结合但缺乏o-糖蛋白特异性内切蛋白酶活性或具有降低的o-糖蛋白特异性内切蛋白酶活性的本发明示例性多肽的氨基酸序列。相对于seqidno:20,seqidno:21包括另外的n末端甲硫氨酸和c末端接头+his6标签。由该序列组成的多肽在本文中可以称为lshe206aa或lsh205a/e206a。
seqidno:22是编码具有seqidno:21的序列的多肽的核苷酸序列。
seqidno:23、24和25是被破坏的金属蛋白酶结构域基序的序列,各自来自能够与o-聚糖结合但缺乏o-糖蛋白特异性内切蛋白酶活性或具有降低的o-糖蛋白特异性内切蛋白酶活性的本发明的多肽。
seqidno:26、27和28是各自具有o-糖蛋白特异性内切蛋白酶活性的多肽的氨基酸序列。
seqidno:29、30和31是具有o-糖蛋白特异性内切蛋白酶活性的示例性多肽的氨基酸序列。相对于seqidno:26、27和28,seqidno:29、30和31各自包括另外的n末端甲硫氨酸和c末端接头+his6标签。
seqidno:32、33和34分别是自铜绿假单胞菌(pseudomonasaeruginosa)pao1、多形拟杆菌(bacteroidesthetaiotaomicron)vpi-5482和产气荚膜梭菌(clostridiumperfringens)分出的具有o-糖蛋白特异性内切蛋白酶活性的多肽的野生型氨基酸序列。分别地,相对于seqidno:26、27和28,各自包含n末端的信号基序。
seqidno:35、36和37是各自能够与o-聚糖结合但缺乏o-糖蛋白特异性内切蛋白酶活性或具有降低的o-糖蛋白特异性内切蛋白酶活性的多肽的氨基酸序列。
seqidno:38、39和40是各自能够与o-聚糖结合但缺乏o-糖蛋白特异性内切蛋白酶活性或具有降低的o-糖蛋白特异性内切蛋白酶活性的本发明示例性多肽的氨基酸序列。分别地,相对于seqidno:35、36和37,seqidno:38、39和40各自包括另外的n末端甲硫氨酸和c末端接头+his6标签。
seqidno:41至43是o-糖蛋白特异性内切蛋白酶的代表性金属蛋白酶基序的氨基酸序列。
seqidno:44至46是能够与o-聚糖结合但缺乏o-糖蛋白特异性内切蛋白酶活性或o-糖蛋白特异性内切蛋白酶活性降低的多肽的代表性破坏性金属蛋白酶基序的氨基酸序列。
seqidno:47是糖基果蝇肽的氨基酸序列。t残基上有o-糖基化位点。
seqidno:48至50是未被o-糖基化的肽的氨基酸序列。
具体实施方式
应当理解,所公开的产品和方法的不同应用可以适合于本领域的特定需求。还应理解,本文所用的术语仅出于描述本发明的特定实施方式的目的,而并非旨在进行限制。本文引用的所有出版物、专利和专利申请,无论是上文还是下文中的,均通过引用全文并入本文。
除非文中另外明确指出,如在本说明书和所附权利要求书中所使用的,单数形式“一个/一种(a/an)”和“该(the)”包括复数个指示物。因此,例如,提及“多肽(apolypeptide)”包括“多个多肽(polypeptides)”等。
一般的多肽特征
“多肽”在本文以最广泛的意义使用,是指两个或更多个亚基氨基酸、氨基酸类似物或其他拟肽的化合物。因此,术语“多肽”包括短肽序列以及更长的多肽和蛋白质。术语“蛋白质”、“肽”和“多肽”可以互换使用。如本文所用,术语“氨基酸”是指天然和/或非天然或合成的氨基酸,包括d或l旋光异构体,以及氨基酸类似物和拟肽。
多肽可以通过合适的方法产生,包括重组或合成方法。例如,多肽可以使用本领域已知的标准技术直接合成,例如fmoc固相化学、boc固相化学或通过溶液相肽合成。可供选择地,可以通过用编码所述多肽的核酸分子或载体转化细胞,通常转化细菌细胞来产生多肽。下文描述了并且在实施例中举例说明了通过在细菌宿主细胞中表达来产生多肽的方法。本发明提供了编码本发明多肽的核酸分子和载体。本发明还提供了包含这种核酸或载体的宿主细胞。编码本文公开的多肽的示例性多核苷酸分子以seqidno:3和7提供。这些序列中的每一条在5”端包括n末端甲硫氨酸(atg)的密码子,并且在3端在终止密码子(taa)之前包括gly-ser-gly接头和6xhis标签的密码子,可以任选不包括所述gsgle接头和6xhis标签的密码子。下文将更详细地讨论另外的甲硫氨酸和标签的任性包含。
术语“核酸分子”和“多核苷酸”在本文可互换使用,并且是指任何长度的核苷酸(无论是脱氧核糖核苷酸还是核糖核苷酸)的聚合形式或其类似物。多核苷酸的非限制性实例包括基因、基因片段、信使rna(mrna)、cdna、重组多核苷酸、质粒、载体、任何序列的分离的dna、任何序列的分离的rna、核酸探针和引物。本发明的多核苷酸编码本发明的多肽,并且可以以分离的或基本上分离的形式提供。基本上分离是指可以从任何周围介质中基本上但不完全分离多肽。可以将多核苷酸与不会干扰其预期用途的运载体或稀释剂混合,并且仍然被认为是基本上分离的。“编码”所选多肽的核酸序列是这样一种核酸分子,所述核酸分子在受适当调控序列控制时,在活体内转录(对于dna而言)并翻译(对于mrna而言)成多肽,例如在表达载体中。编码序列的边界由5'(氨基)末端的起始密码子和3'(羧基)末端的翻译终止密码子确定。出于本发明的目的,这样的核酸序列可以包括但不限于来自病毒的cdna、原核或真核mrna、来自病毒的基因组序列、或原核dna或rna,甚至合成的dna序列。转录终止序列可以位于编码序列的3'处。
多核苷酸可以根据本领域众所周知的方法来合成,如例如sambrooketal.(1989,分子克隆-实验指南(molecularcloning-alaboratorymanual);冷泉港出版社)中所描述。本发明的核酸分子可以以表达盒的形式提供,所述表达盒包括可操作地连接至插入序列的控制序列,从而允许本发明的多肽在活体内(例如,在原核或真核表达系统中)表达。这些表达盒又通常在载体(例如质粒或重组病毒载体)内提供。可以将这样的表达盒直接给药至宿主对象。可供选择地,可以将包含本发明的多核苷酸的载体给药至宿主对象。优选地,使用遗传载体进行多核苷酸制备和/或给药。合适的载体可以是能够携带足量的遗传信息并允许表达本发明的多肽的任何载体。
因此,本发明包括包含这样的多核苷酸序列的表达载体。这样的表达载体在分子生物学领域中是常规构建的,并且例如可以涉及使用质粒dna和适当的起始子、启动子、增强子和其他元件,例如,为了允许表达本发明的肽而可能是必要的并且以正确的取向定位的聚腺苷酸化信号。其他合适的载体对本领域技术人员来说将是显而易见的。作为在这方面的进一步的实例,我们参考sambrooketal.。
本发明还包括已经修饰以表达本发明的多肽的细胞。这样的细胞通常包括原核细胞,例如细菌细胞,例如大肠杆菌。可以使用常规方法培养这样的细胞以产生本发明的多肽。
多肽可以衍生化或经修饰以有助于该多肽的产生、分离或纯化。例如,在通过细菌宿主细胞中的重组表达来产生本发明的多肽的情况下,该多肽的序列可以在n末端包含另外的甲硫氨酸(m)残基以改善表达。作为另一个实例,本发明的多肽可以通过添加能够直接且特异性地与分开手段结合的配体来衍生化或进行修饰。可供选择地,多肽可以通过添加结合对中的一个成员来衍生化或进行修饰,并且分开手段包括通过添加结合对中的其他成员而衍生化或进行修饰的试剂。可以使用任何合适的结合对。在用于本发明的多肽通过添加结合对中的一个成员而衍生化或进行修饰的优选实施方式中,该多肽优选是组氨酸标记的或生物素标记的。通常,在基因水平上包括组氨酸或生物素标签的氨基酸编码序列,并且该多肽在大肠杆菌中进行重组表达。组氨酸或生物素标签通常存在于多肽的任一端,优选地在c末端。组氨酸或生物素标签可以与多肽直接连接或通过任何合适的接头序列(例如3、4或5个甘氨酸残基或甘氨酸和丝氨酸残基的混合物)间接连接。组氨酸标签通常由六个组氨酸残基组成,尽管组氨酸标签可以比这更长,通常多达7、8、9、10或20个氨基酸,或更短,例如5、4、3、2或1个氨基酸。
多肽可以以基本上分离的或纯化的形式提供。也就是说,从存在于表达多肽的细胞的细胞提取物中的其他大部分成分中分离的。将理解的是,基本上纯化是指多肽被纯化至至少50%、60%、70%、80%或优选至少90%同质性。纯度水平可通过任何合适的方法进行评估,但通常涉及样品的sds-page分析,然后进行考马斯蓝检测。多肽可以与不会干扰多肽预期目的的运载体、稀释剂或防腐剂混合,并且仍被为是基本上分离的或纯化的。在多肽提供于具有另外的活性成分例如另一种多肽的组合物中的情况下,则将每种所述多肽分别纯化至高水平的同质性,然后以适当的比例混合以用于各自的预期目的。例如,可以将两种多肽各自纯化至至少90%的同质性,然后以1:1的比例组合。
多肽(或其混合物)可以以适于在使用前在水溶液中重构的冻干形式提供。冻干的组合物具有改善的稳定性,使得能够更长久地储存多肽。本文提供了一种制备冻干形式的多肽(或其混合物)的方法,所述方法包括在合适的缓冲液(例如tris-缓冲盐水(tbs))中冷冻干燥所述多肽(或混合物)。多肽在冷冻干燥之前通常是基本上纯化的。还提供了冻干形式的所得多肽(或混合物)。还提供了一种制备多肽(或混合物)的溶液的方法,该方法包括提供冻干形式的多肽(或混合物)并用合适的运载体或稀释剂(例如水)重构。
多肽可以使用本领域已知的方法固定,例如dattasetal.,enzymeimmobilization:anoverviewontechniquesandsupportmaterials,3biotech,3(1):1-9(2013)中所述。例如,可以通过吸附、共价结合、亲和力固定或包封来固定多肽。可用作支持物的材料包括但不限于,例如天然支持物(例如琼脂糖(agarose)、胶原、明胶、纤维素、果胶、琼脂糖凝胶)、无机材料(例如陶瓷、二氧化硅、玻璃、活性炭或木炭)或合成聚合物。例如,多肽可以固定在任选地作为树脂提供的琼脂糖凝胶、或琼脂糖上。
具有内切蛋白酶活性的多肽
具有内切蛋白酶活性的多肽的功能特征
在一种实施方式中,本发明涉及一种对o-糖基化蛋白具有特异性内切蛋白酶活性的多肽。换句话说,该多肽具有o-糖蛋白特异性内切蛋白酶活性。该多肽切割任何o-连接的糖蛋白,优选任何o-连接的人糖蛋白。o-连接的糖蛋白的实例包括包含免疫球蛋白的全部或部分的或由免疫球蛋白的全部或部分组成的任何蛋白质,包括全长抗体、fc片段和fc融合蛋白,特别是iga、igd和igg3同种型的那些。o-连接糖蛋白的另一个实例是依那西普,依那西普具有许多o-糖基化位点,是人tnfα受体2的配体结合域与igg1的fc部分连接的融合蛋白。o-连接糖蛋白的其他实例包括促红细胞生成素(epo)、tnfα受体、胎球蛋白和纤溶酶原。
底物糖蛋白的水解(即切割)通常以高特异性发生在o-糖基化丝氨酸或苏氨酸的n末端和紧密接近o-糖基化丝氨酸或苏氨酸的肽键处,并且是o-聚糖依赖性的。本发明的多肽优选能够切割这种与底物糖蛋白中的每个o-糖基化位点紧密接近的肽键。该反应优选不显示任何氨基酸特异性或限制性,并且特别地,不需要任何特定的氨基酸存在于o-糖基化的丝氨酸或苏氨酸的n末端。当使用标准质谱参数评估时,通常观察到切割位点在与每个o-糖基化残基的n末端紧邻的肽键处。
给定多肽的内切蛋白酶活性和特异性可以通过合适的测定手段来确定。例如,可以将标准的o-糖蛋白底物(例如iga分子或促红细胞生成素(epo))与测试多肽一起孵育。然后可以通过sds-page和/或质谱来分析起始材料和反应产物,以确定切割产物(如果有的话)的存在,并且如果需要还可以进一步表征那些产物。未o-糖基化的糖蛋白底物(例如igg1分子)可以用作阴性对照。可以将结果与在底物与本发明的示例性多肽(例如由seqidno:2的氨基酸序列组成的多肽)接触时在相同测定中获得的结果进行比较。一个单位的seqidno:2的多肽定义为根据sds-page的监测,与一个单位唾液酸酶混合物组合在20mmtris缓冲液(ph6.8)中37℃下过夜消化大约90%的1μg促红细胞生成素(epo)所需的量(优选的唾液酸酶混合物在下文中进一步描述)。测试多肽优选在以相同的量存在时达到相似的活性水平。示例性测定也在实施例中进行描述。
具有内切蛋白酶活性的多肽的结构特征
本部分列出了根据该实施方式的多肽的结构特征,除了在前一部分中概述的功能特征外,这些结构特征也适用。
多肽的长度通常至少为150、200、250、275、280、290、300、310、320、330、340、350或360个氨基酸。多肽的长度通常不大于400、395、390、385、380、375、370或365个氨基酸。应当理解,以上列出的任何下限可以与以上列出的任何上限组合以提供多肽长度的范围。例如,该多肽的长度可以为150至400个氨基酸,或长度为280至380个氨基酸。多肽的长度优选为340至380个氨基酸,多肽的长度最优选为360至375个氨基酸。
多肽的一级结构(氨基酸序列)基于嗜粘蛋白艾克曼菌的amuc1119基因所编码的多肽的一级结构。该多肽的完整序列示于seqidno:4,该序列包括第1至24位上的信号基序。去除了信号基序的序列示于seqidno:1。
本发明的多肽可以包含seqidno:1的序列、基本上由seqidno:1的序列组成或由seqidno:1的序列组成。
可供选择地,本发明的多肽可以包含以下、基本上由以下组成或由以下组成:与seqidno:1的氨基酸序列至少50%一致的seqidno:1的氨基酸序列的变体。变体序列可以与seqidno:1的氨基酸序列至少60%、至少70%、至少80%、至少、85%、至少90%、至少95%、至少98%或至少99%一致。一致性水平优选为至少85%或更高。相对于seqidno:1的序列的一致性可以在seqidno:1所示的序列的至少100、至少200、至少300或至少350或更多个连续氨基酸的区域上测量,或更优选在seqidno:1的全长上测量。变体的长度通常比参考序列长或短不超过50个氨基酸,并且优选具有与参考序列大约(或完全)相同的长度。
可以使用任何合适的算法来计算氨基酸一致性。例如,pileup和blast算法可用于计算一致性或将序列对齐(例如识别等效序列或相应序列(通常在其默认设置上)),如在altschuls.f.(1993)jmolevol36:290-300;altschul,s,fetal(1990)jmolbiol215:403-10中所描述。进行blast分析的软件可通过美国国家生物技术信息中心(nationalcenterforbiotechnologyinformation;http://www.ncbi.nlm.nih.gov/)公开获得。该算法涉及首先通过在与数据库序列中相同长度的字比对时在匹配或满足一些正值阈值得分t的查询序列中鉴定长度为w的短字来鉴定高评分序列对(hsp)。t被称为邻近字得分阈值(altschuletal,同上)。这些最初的邻近字命中充当启动搜索以查找包含它们的hsp的种子。字命中沿着每个序列在两个方向上延伸,直到可以增加累积比对得分为止。在以下情况下,停止在每个方向上的字命中扩展:累积比对得分从其最大实现值下降了数量x;由于一个或多个负得分残基比对的累积,累积得分变为零或更低;或到达任一序列的末尾。blast算法参数w、t和x确定比对的灵敏度和速度。blast程序使用默认值字长(w)为11,blosum62评分矩阵(请参见henikoffandhenikoff(1992)proc.natl.acad.sci.usa89:10915-10919)比对(b)为50,期望(e)为10,m=5,n=4,以及对两条链的比较。
blast算法对两个序列之间的相似性进行统计分析。参见例如karlinandaltschul(1993)proc.natl.acad.sci.usa90:5873-5787。blast算法提供的一种相似性度量是最小总和概率(p(n)),最小总和概率(p(n))提供偶然会发生两个多核苷酸或氨基酸序列匹配的概率的指示。例如,如果第一序列与第二序列相比的最小总和概率小于约1,优选小于约0.1,更优选小于约0.01,并且最优选小于约0.001,则认为该序列与另一个序列相似。可供选择地,uwgcg软件包提供bestfit程序,该程序可用于计算一致性(例如以其默认设置使用)(devereuxetal(1984)nucleicacidsresearch12,387-395)。
本发明的多肽的序列可以包含相对于seqidno:1氨基酸序列进行了修饰(例如氨基酸添加、缺失或取代)的seqidno:1序列的变体。除非另有说明,修饰优选是保守氨基酸取代。保守取代用具有相似化学结构、相似化学性质或相似侧链体积的其他氨基酸来替代氨基酸。所引入的氨基酸可以具有与它们所替代的氨基酸相似的极性、亲水性、疏水性、碱性、酸性、中性或电荷。可供选择地,保守取代可以引入另一种芳族或脂族氨基酸替代现有的芳族或脂族氨基酸。保守的氨基酸变化是本领域熟知的,并且可以根据以下表a1中定义的20种主要氨基酸的性质进行选择。在氨基酸具有相似的极性的情况下,可以通过参考表a2中氨基酸侧链的亲水性等级来确定。本发明的多肽序列可以包含seqidno:1的氨基酸序列进行了多达10、20、30、40、50或60个保守取代的变体。
表a1-氨基酸的化学性质
表a2-亲水等级
本发明的多肽的氨基酸序列可以包含如上所述的seqidno:1的氨基酸序列的变体。然而,seqidno:1的氨基酸序列中的某些残基优选保留在所述变体序列内。例如,所述变体序列通常保留已知内切蛋白酶活性所需的某些残基。因此,优选将seqidno:1的第182位(与seqidno:4的第206位对应)的谷氨酸保留在本发明多肽的氨基酸序列中。该残基被认为是在活性部位进行电子转移所需的。因此,本发明的多肽通常包括seqidno:1的氨基酸序列的变体,所述变体在所述变体序列的与seqidno:1的第182位对应的位置处具有谷氨酸(e)。类似地,seqidno:1的第181位(与seqidno:4的第205位对应)上的组氨酸优选保留在本发明多肽的氨基酸序列中。该残基被认为是与锌离子辅因子结合所需的。
所述谷氨酸和所述组氨酸残基通常都包含在具有基序hebbh的金属蛋白酶结构域中,其中b是不带电荷的氨基酸,例如氨基酸a、c、f、g、i、l、m、n、p、q、s、t、v或w。这样的结构域的优选实例有序列helgh(seqidno:41),该序列与seqidno:1的第181至185位对应(与seqidno:4的第205至209位对应)。从而,本发明的多肽通常包含seqidno:1的氨基酸序列的变体,该变体在与seqidno:1的第181至185位对应的位置处包含基序hebbh(例如heigh(seqidno:42)或helgh,优选helgh)。本发明的多肽通常包含位于金属蛋白酶结构域c末端的o-聚糖特异性结合域。
基序hebbh可在具有基序abxhebbhbc的较大的金属蛋白酶结构域内受损,其中a是氨基酸v、t或g,b是不带电荷的氨基酸,例如氨基酸a、c、f、g、i、l、m、n、p、q、s、t、v或w,x是任何氨基酸,c是疏水性氨基酸,例如a、c、f、i、l、m、p、v、w或y。这样的结构域的优选实例具有序列gmahelghgl(seqidno:8),该序列与seqidno:1的第178至187位对应(seqidno:4的第202至211位)。其它实例包括gvahelghnf(seqidno:43)。因此,本发明的多肽优选包含seqidno:1的氨基酸序列的变体,该变体包含在与seqidno:1的第178至187位对应的位置处的基序abxhebbhbc(例如gmahelghgl或gvahelghnf,优选gmahelghgl)。本发明的多肽通常包含位于金属蛋白酶结构域c末端的o-聚糖特异性结合域。
可供选择地,本发明的多肽可包含以下,基本上由以下组成或由以下组成:seqidno:1的较短片段或其如上所述的变体。所述片段可以描述为保留o-糖蛋白特异性内切蛋白酶活性的seqidno:1的截短形式。这样的片段比seqidno:1短,并且长度通常为至少100、150或200个氨基酸。所述片段通常包括在与seqidno:1的第178至187位对应的位置处的金属蛋白酶结构域和位于金属蛋白酶结构域的c末端的o-聚糖特异性结合域,该金属蛋白酶结构域包括与seqidno:1的第182位对应的位置处的谷氨酸残基(e)和与seqidno:1的第181位对应的位置处的组氨酸残基(h)。
包含seqidno:1的本发明的任何多肽或其变体或其任一片段可任选地在n末端包括另外的甲硫氨酸和在c末端包括组氨酸或其他标签。这样的另外的序列可有助于表达和/或纯化。组氨酸标签优选由六个组氨酸残基组成。组氨酸标签优选通过通常是短氨基酸序列(例如3至5个氨基酸)的接头连接至c末端。接头通常主要由甘氨酸和丝氨酸残基组成,并且可以优选地包括序列gsg。例如,gsg和gsgle是合适的接头。
因此,总之,本发明的多肽是一种具有o-糖蛋白特异性内切蛋白酶活性的多肽,所述多肽包含:
(a)seqidno:1的氨基酸序列;
(b)与seqidno:1的氨基酸序列至少85%一致的氨基酸序列;或
(c)这样的氨基酸序列:所述氨基酸序列为seqidno:1的序列的片段或与seqidno:1的氨基酸序列85%一致的氨基酸的片段;
任选地,其中所述多肽在n末端包括另外的甲硫氨酸和/或在c末端包括组氨酸标签,该标签可以通过接头与c末端连接。
本发明的示例性多肽的序列以seqidno:2提供。该多肽可以包含seqidno:2的氨基酸序列或由seqidno:2的氨基酸序列组成。编码该多肽的示例性多核苷酸序列示于seqidno:3。
具有o-糖蛋白特异性内切蛋白酶活性的可供选择的多肽已在铜绿假单胞菌pao1、多形拟杆菌vpi-5482和产气荚膜梭菌中鉴定出来(参见noachetal;pnas2017,pe679-688和支持附录,特别是用于克隆、蛋白表达和纯化的材料和方法(materialsandmethodsforcloning,proteinexpressionandpurification)中描述的三种肽酶)。这些多肽的全长序列以seqidno:32、33和34提供。这些序列中的每种都包括如上所述的具有基序hebbh的金属蛋白酶结构域。产气荚膜梭菌序列也具有如上所述的具有基序abxhebbhbc的较长的金属蛋白酶结构域。这些序列中的每种可以任选地进行修饰,以去除可能存在的任何信号序列或酶原序列和/或包括在n末端的另外的甲硫氨酸和/或包括在c末端的组氨酸或其他标签。这样的另外的序列可以帮助表达(例如在大肠杆菌中)和/或纯化。去除信号和其他未成熟序列的相应序列以seqidno:26、27和28提供。针对在大肠杆菌中表达和随后纯化(通过在n末端包括另外的甲硫氨酸和/或在c末端包括组氨酸标签)而优化的这些序列的版本以seqidno:29、30和31提供。在本文所述的具有o-糖蛋白特异性内切蛋白酶活性的本发明多肽的使用方法中,本发明的多肽可以任选地被这些多肽之一替代。因此,用于这样的方法的优选多肽包含seqidno:26至31中的任一种,基本上由seqidno:26至31中的任一种组成或由seqidno:26至31中的任一种组成。
利用多肽内切蛋白酶活性的方法
本发明还提供了一种水解o-糖蛋白的方法,其中所述方法包括使所述蛋白的样品与具有o-糖蛋白特异性内切蛋白酶活性的本发明的多肽接触,并且任选地还包括检测水解产物。
本发明还可以包括一种用于评估蛋白质的糖基化状态的方法,该方法包括使所述样品与具有o-糖蛋白特异性内切蛋白酶活性的本发明的多肽接触和分析所产生的产物。切割产物的存在表明所述样品中的蛋白质是o-糖基化的,因此该方法也可用于检测o-糖蛋白。可以任选地进一步分析切割产物以鉴定聚糖链及其与蛋白质的连接位置。
在这样的方法中,在适于多肽与样品中的任何蛋白质相互作用并且适于发生水解/切割反应(内切蛋白酶活性)的条件下,使样品与本发明的多肽接触。合适的条件包括与本发明的多肽孵育至少20分钟、30分钟、40分钟、50分钟、60分钟、70分钟、80分钟、90分钟或120分钟、3小时、5小时、10小时或过夜。孵育优选在室温下进行,更优选在约20℃、25℃、30℃、35℃、40℃或45℃下,最优选在约37℃下进行。上述方法可以在任何合适的ph下进行。合适的ph值包括例如约3.0、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9或9.5的ph。本发明多肽的活性的优选ph在5.6至6.8的范围内。该方法可以在任何合适的缓冲液中进行,例如tris缓冲盐水(tbs)或磷酸盐缓冲盐水(pbs)。本发明的多肽与样品的蛋白质含量(酶:底物)的近似比例可以是1:1、2:1、4:1、6:1、10:1、15:1、20:1、1:2、1:4或1:6、1:10、1:15、1:20、1:40、1:100、1:200或1:400。优选的比例是1:20。如果需要更短的反应时间,或者如果o-糖蛋白大量唾液酸化,则较高的酶与底物的比例可能是有益的。可供选择地,如下文中更详细地讨论的,可以使用较早或同时的唾液酸酶孵育步骤来降低唾液酸含量。底物通常以0.1mg/ml至10mg/ml,优选为约0.1mg/ml至2mg/ml的浓度存在。
可以通过任何合适的分析方法来评估所产生产物的检测或分析,所述分析方法例如但不限于质谱、hplc、亲和色谱、凝胶电泳、sds-page、elisa、凝集素印迹、光谱测定、毛细管电泳和其他标准的实验室蛋白质分析技术。
上述任何方法中的样品可以是取自患者,优选人类患者的样品。获得的结果可以用于诊断目的,例如用以检测涉及o-连接的糖基化的癌症的存在。这样的用途可以涉及将从患者样品获得的结果与使用从健康对照获得的样品得到的结果进行比较。
在本发明的任何方法中,该多肽可以与另一种酶(例如蛋白酶或糖苷酶)组合使用。另外的蛋白酶或糖苷酶通常将进一步消化底物蛋白,这可增强本发明的多肽的活性和/或允许更容易或更详细地分析产物。
例如,本发明人已经确定,如果首先修饰底物蛋白的o-聚糖以去除唾液酸,则本发明的多肽表现出改善的内切蛋白酶活性。因此,在本发明的优选方法中,使样品与试剂接触以去除唾液酸。所述试剂优选可以是唾液酸酶或这样的酶的混合物,所述唾液酸酶或这样的酶的混合物可以存在于合适的缓冲液例如tbs或pbs中。缓冲液优选包含低浓度的nacl,通常最高至300mm、250mm、200mm或150mm。nacl浓度优选为约150mm,例如125mm至175mm。唾液酸酶(或神经氨酸酶)催化末端唾液酸从糖蛋白上的复杂碳水化合物中被切割,并显示出高度的特异性。这些酶靶向o-糖蛋白中常见的三个独特的唾液酸键,即α2-3、α2-6和α2-8键。适用于所述方法的唾液酸酶包括靶向所有α2-3、α2-6或α2-8键的广谱唾液酸酶,以及通常仅靶向一种类型的键的窄谱唾液酸酶。α2-3键是人类糖蛋白中最常见的键,因此,如果使用窄谱唾液酸酶,则该窄谱唾液酸酶优选靶向该键。合适的唾液酸酶可以包括病毒或哺乳动物唾液酸酶,但是优选是自细菌分出的唾液酸酶,所述细菌包括但不限于产气荚膜梭菌,产脲节杆菌(arthrobacterureafaciens),肺炎链球菌(streptococcuspneumoniae),霍乱弧菌(vibriocholera)和嗜粘蛋白艾克曼菌的菌株。
优选的窄谱唾液酸酶是从嗜粘蛋白艾克曼菌分出的am1757。am1757对α2-3键具有特异性活性。am1757的野生型序列以seqidno:9提供,seqidno:9包括信号序列。缺少信号序列的am1757的野生型序列以seqidno:10提供。可以任选地修饰这些序列,以在n末端包括另外的甲硫氨酸和/或在c末端包括组氨酸或其他标签。这样的另外的序列可以帮助表达(例如在大肠杆菌中)和/或纯化。组氨酸标签优选由六个组氨酸残基组成。组氨酸标签优选通过通常是短氨基酸序列(例如3至5个氨基酸)的接头连接至c末端。接头通常主要由甘氨酸和丝氨酸残基组成,并且可以优选地包括序列gsg。例如,gsg和gsgle是合适的接头。在n末端具有另外的甲硫氨酸且在c末端具有gsgle接头和his6标签的示例性的am1757序列以seqidno:11提供。本发明中任何对am1757的提及都可以表示seqidno:9、10或11中的任一种,但优选地是指包含seqidno:10的氨基酸序列或由seqidno:10的氨基酸序列组成的多肽。最优选地是由seqidno:11的氨基酸序列组成的多肽。
优选的广谱唾液酸酶是从嗜粘蛋白艾克曼菌分出的am0707。am0707对α2-3、α2-6和α2-8键具有活性。am0707的野生型序列以seqidno:12提供,seqidno:12包括信号序列。缺少信号序列的am0707的野生型序列以seqidno:13提供。可以任选地修饰这些序列,以在n末端包括另外的甲硫氨酸和/或在c末端包括组氨酸或其他标签。这样的另外的序列可以帮助表达和/或纯化。组氨酸标签优选由六个组氨酸残基组成。组氨酸标签优选通过通常是短氨基酸序列(例如3至5个氨基酸)的接头连接至c末端。接头通常主要由甘氨酸和丝氨酸残基组成,并且可以优选地包括序列gsg。例如,gsg和gsgle是合适的接头。在n末端具有另外的甲硫氨酸且在c末端具有gsgle接头和his6标签的示例性的am0707序列以seqidno:14提供。本发明中任何对am0707的提及都可以表示seqidno:12、13或14中的任一种,但优选地是指包含seqidno:13的氨基酸序列或由seqidno:13组成的多肽。最优选地,是由seqidno:14的氨基酸序列组成的多肽。
能够水解所有唾液酸键的优选的唾液酸酶混合物包含从嗜粘蛋白艾克曼菌分出的am1757和am0707。am1757和am0707的比例通常为1:1。特别优选的混合物可以包含由seqidno:11的氨基酸序列组成的多肽和由seqidno:14的氨基酸序列组成的多肽。
本发明的方法可优选包括在适合唾液酸酶活性的条件下,在本发明的多肽之前或与本发明的多肽同时,将样品与am1757或与am1757和am0707的混合物一起孵育。本发明还提供了包含本发明的多肽以及am1757或am1757和am0707的混合物的组合物(冻干或溶液形式)。这样的组合物可以优选在ph可约为7.6的tris缓冲盐水中冻干。在这样的组合物中,am1757和am0707将优选彼此以1:1的比例存在,并且总唾液酸酶含量(am1757+am0707)相对于本发明的多肽也以1:1的比例存在。例如,如果组合物包含2000个单位的本发明的多肽,则该组合物还将包含2000个单位的唾液酸酶,其中所述2000个单位的唾液酸酶包含1000个单位的am1757和1000个单位的am0707。一个单位唾液酸酶混合物通常是当在20mmtrisph6.8中在37℃下孵育2小时时,根据sds-page所监测的,从大约90%的1μg糖蛋白(胎球蛋白)中水解唾液酸所需的量。一个单位的本发明的多肽通常是当在20mmtris缓冲液(ph6.8)中孵育时,根据sds-page所监测的,与一个单位唾液酸酶混合物在37℃下过夜消化大约90%的1μg促红细胞生成素(epo)所需的量。
本发明还提供了一种试剂盒,该试剂盒在单独的容器中包含来自am1757或am1757和am0707的混合物的本发明的多肽,以及关于不同酶的组合使用的说明。
作为另一个实例,在本文所述的任何方法中,在将样品与本发明的多肽接触之前、同时或之后,可以将样品与n-糖苷酶一起孵育,以从靶蛋白去除n-聚糖。示例性的n-糖苷酶是pngasef。当样品包括免疫球蛋白时,可以使用的其他n-糖苷酶是endos(参见wo2008071418的seqidno:1)或endos2(可以称为endos49,参见wo2013037824的seqidno:1)。这些酶中的每一种均从igg1的asn-297去除n-连接的糖蛋白。在特别的实施方式中,除了本发明的多肽之外,样品还可以与n-糖苷酶和唾液酸酶(或其混合物)接触。在这样的方法中,可以在同时添加n-糖苷酶和本发明的多肽之前首先应用唾液酸酶(或混合物)。这种方法特别适合于随后的o-糖基化位点的评估,通常通过分离产物(例如使用rplc)和对不同的级分的后续分析(例如使用质谱)来实现。
作为另一个实例,在本文所述的任何方法中,在将样品与本发明的多肽接触之前、同时或之后,可以将样品与蛋白酶一起孵育以进一步消化靶蛋白。合适的一般蛋白酶包括胰蛋白酶、胰凝乳蛋白酶、lys-c、asp-n、glu-c、arg-c或类似的内切蛋白酶、或牙龈卟啉单胞菌(porphyromonasgingivalis)的arg-牙龈蛋白酶(rgpb)。
如果样品包括免疫球蛋白,则可以使用免疫球蛋白蛋白酶,例如speb(参见wo2015040125中的序列),化脓性链球菌(s.pyogenes)的免疫球蛋白g降解酶(ides-参见wo2015040125的序列),马链球菌兽疫亚种的免疫球蛋白g降解酶(idez),牙龈卟啉单胞菌的lys-牙龈蛋白酶(kgp)和无乳链球菌(s.agalactiae)的免疫球蛋白g降解酶(igde无乳-参见pct/ep2017/052463的seqidno:3)。在本发明的方法中使用这些蛋白酶的任何组合可有助于例如使用质谱(自中向下(middledown)法)确定单克隆抗体及其亚基上的o-糖基化位点。
作为另一个实例,在本文描述的任何方法中,在使样品与本发明的多肽接触之后,可以将样品与o-糖苷酶一起孵育。例如,为了简化对产生的产物的分析,在通过任何合适的方法进一步分析之前,通过o-糖苷酶使产物进行消化以除去o-聚糖。合适的o-糖苷酶可从以下细菌获得:粪肠球菌(enterococcusfaecalis)、口腔链球菌(streptococcusoralis)、两歧双歧杆菌(bifidobacteriumbifidum),优选粪肠球菌或口腔链球菌,最优选口腔链球菌。来自口腔链球菌的示例性o-糖苷酶的序列以seqidno:15提供。
与o-糖蛋白结合但缺乏内切蛋白酶活性或具有降低的内切蛋白酶活性的多肽
缺乏内切蛋白酶活性的多肽的功能特征
在一种实施方式中,本发明涉及一种在保持结合o-聚糖的能力的同时缺乏内切蛋白酶活性或具有降低的内切蛋白酶活性的多肽。换句话说,该多肽可以被描述为不显著水解连接有所述聚糖的糖蛋白的o-聚糖特异性结合剂。
o-糖蛋白内切蛋白酶活性可以使用任何合适的方法来确定,但是通常可以采用与上文针对具有这样的活性的本发明多肽所述相同的测定法。与o-糖蛋白底物一起孵育后,不存在切割产物将表明测试多肽中缺乏活性。包含seqidno:1的氨基酸序列的多肽对相同底物的切割可以用作阳性对照。可以通过与相同对照比较来确定测试多肽的活性的降低。本发明的多肽通常具有相对于包含seqidno:1的氨基酸序列的多肽的活性降低的o-糖蛋白内切蛋白酶活性。与seqidno:1氨基酸序列的多肽的活性相比,本发明的多肽通常具有小于95%、90%、85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%或5%的o-糖蛋白内切蛋白酶活性。
多肽与o-聚糖或o-糖蛋白结合的能力也可以通过任何合适的方法来评估。一种这样的方法涉及将测试多肽固定在例如旋转柱中的琼脂糖凝胶上,然后与含有o-糖蛋白和/或o-聚糖的样品一起孵育。如果测试多肽具有o-聚糖和/或o-糖蛋白结合能力,则可检测到o-糖蛋白和/或o-聚糖结合到色谱柱或在随后的洗脱液中。优选地,该多肽能够结合可被包含seqidno:1的氨基酸序列的多肽水解的所有o-糖蛋白。
在实施例中描述了该类型的示例性测定。
缺乏内切蛋白酶活性的多肽的结构特征
本部分列出了根据该实施方式的多肽的结构特征,除了在前面部分中概述的功能特征外,这些结构特征也适用。除了通过一个或多个氨基酸的添加、缺失或取代来修饰氨基酸序列使得所述活性降低或消除之外,根据本发明该实施方式的多肽可具有与具有内切蛋白酶活性的多肽相同的上述结构特征。通常,根据本发明该实施方式的多肽将不包括完整的金属蛋白酶基序hebbh或abxhebbhbc。所述基序可以通过添加、缺失或取代而被破坏,优选通过至少一个氨基酸取代而被破坏。优选地,取代涉及用可供选择的氨基酸取代所述基序中的谷氨酸(e)残基和/或替代与较短的基序的第1位(较长的基序的第4位)对应的位置中的组氨酸(h)残基和/或替代与较短的基序的第5位(较长的基序的第8位)对应的位置中的组氨酸(h)残基。优选地,三种所述取代中的一种或两种或全部是非保守的。e残基的取代应减少或消除电子转移。h残基中任一个的取代应减少或消除锌离子辅因子结合。因此,e残基优选被非极性或不带电荷的氨基酸取代,例如a、c、f、g、i、l、m、n、p、q、s、t、v或w,但是大多数优选被丙氨酸(a)或甘氨酸(g)取代。h残基可各自独立地被任何非h氨基酸取代,但是非极性氨基酸(例如a和g)仍然是优选的。
因此,本发明的多肽可以包含seqidno:1的氨基酸序列、基本上由seqidno:1的氨基酸序列组成或由seqidno:1的氨基酸序列组成,在seqidno:1的氨基酸序列中,金属蛋白酶基序hebbh或abxhebbhbc优选通过用可供选择的氨基酸替代在与seqidno:1的182位对应的位置处的谷氨酸残基和/或替代在与seqidno:1的181位对应的位置处的位置处的组氨酸残基和/或用可供选择的氨基酸替代在seqidno:1的185位对应的位置处的组氨酸残基而被破坏。换句话说,该多肽可被描述为不包含金属蛋白酶基序hebbh,并且优选包含所述基序的破坏形式,使得:
(a)第一位的h被可供选择的氨基酸替代,所述可供选择的氨基酸优选a或g;和/或
(b)第二位的e被不带电荷的氨基酸替代,所述不带电荷的氨基酸任选地为a、c、f、g、i、l、m、n、p、q、s、t、v或w,优选为a或g;和/或
(c)第五位的h被可供选择的氨基酸,优选a或g替代,
其中所述基序中的b是不带电荷的氨基酸,任选地为a、c、f、g、i、l、m、n、p、q、s、t、v或w。
因此,所述多肽可以描述为包含基序xbbbx,其中:
(a)x优选为除h以外的任何氨基酸,并且优选为a或g;和/或
(b)b是不带电荷的氨基酸,任选地为a、c、f、g、i、l、m、n、p、q、s、t、v或w,优选a或g;
任选地,其中所述基序存在于所述多肽中与seqidno:1的第181至185位相对应的位置。
因此,所述多肽可以包含破坏的金属蛋白酶基序,例如具有以下序列中的任何一个:halgh(seqidno:44)、aelgh(seqidno:45)或最优选aalgh(seqidno:46)。包含这种类型的对seqidno:1的特异性改变的序列示于seqidno:5和seqidno:20。换句话说,因此,本发明该实施方式的多肽可以包含seqidno:5或seqidno:20的氨基酸序列、基本上由seqidno:5或seqidno:20的氨基酸序列组成或由seqidno:5或seqidno:20的氨基酸序列组成。
所述多肽可替代地被描述为包含基序abxxbbbxbc,其中:
(a)a为氨基酸v、t或g;
(b)b是不带电荷的氨基酸,任选地为a、c、f、g、i、l、m、n、p、q、s、t、v或w,优选a或g;
(c)x是任何氨基酸,除了基序的第4位和/或第8位的氨基酸优选不是n,并且优选是a或g;和
(d)c为疏水性氨基酸,任选地为a、c、f、i、l、m、p、v、w或y;任选地,其中所述基序存在于所述多肽中在与seqidno:1的第178至187位对应的位置处。
因此,所述多肽可以包含破坏的金属蛋白酶基序,例如具有以下序列中的任一种:gmahalghgl(seqidno:23),gmaaelghgl(seqidno:24)或最优选gmaaalghgl(seqidno:25)。包含这种类型的对seqidno:1的特异性改变的序列示于seqidno:5和seqidno:20。因此,换句话说,本发明该实施方式的多肽可以包含seqidno:5或seqidno:20的氨基酸序列、基本上由seqidno:5或seqidno:20的氨基酸序列组成或由seqidno:5或seqidno:20的氨基酸序列组成。
可供选择地,本发明的多肽可以包含以下、基本上由以下组成或由以下组成:与seqidno:5的氨基酸序列至少50%一致的seqidno:5或seqidno:20的氨基酸序列的变体,条件是在与seqidno:1的第182位对应的位置处不引入谷氨酸残基和/或在与seqidno:1的第181位对应的位置处不引入组氨酸残基和/或在与seqidno:1的第185位对应的位置处不引入组氨酸残基。
变体序列可以与seqidno:5的序列至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%一致。一致性水平优选为至少85%或更高。相对于seqidno:5或seqidno:20的序列的一致性可以在seqidno:5或seqidno:20所示的序列的至少100、至少200、至少300或至少350或更多个连续氨基酸的区域上测量,或更优选在seqidno:5或seqidno:20的全长上测量。本发明的多肽的序列可以包含seqidno:5或seqidno:20的进行了多达10、20、30、40、50或60个保守取代的氨基酸序列的变体。序列一致性的确定以及对保守和非保守取代的解释在与具有内切蛋白酶活性的多肽有关的部分中提供,并且在此同样适用。
可供选择地,本发明的多肽可以包含以下、基本上由以下组成或由以下组成:seqidno:5或seqidno:20的较短片段或其如上所述的变体。所述片段可以描述为seqidno:5或seqidno:20的保留o-糖蛋白结合活性的截短形式。这样的片段比seqidno:1短,并且长度通常为至少100、150或200个氨基酸。
包含seqidno:5或seqidno:20或其变体或其任一片段的本发明的任何多肽可任选地在n末端包括另外的甲硫氨酸和在c末端包括组氨酸或其他标签。这样的另外的序列可有助于表达和/或纯化。组氨酸标签优选由六个组氨酸残基组成。组氨酸标签优选通过通常是短氨基酸序列(例如3至5个氨基酸)的接头连接至c末端。接头通常主要由甘氨酸和丝氨酸残基组成,并且可以优选地包括序列gsg。例如,gsg和gsgle是合适的接头。
因此,总而言之,本发明的多肽是具有o-糖蛋白结合活性但缺乏o-糖蛋白特异性内切蛋白酶活性或具有降低的o-糖蛋白特异性内切蛋白酶活性的多肽,该多肽包括:
(a)seqidno:5或seqidno:20的氨基酸序列;
(b)与seqidno:5或seqidno:20的氨基酸序列至少85%一致的氨基酸序列;
(c)这样的氨基酸序列:所述氨基酸序列为seqidno:5或seqidno:20的序列的片段或与seqidno:5或seqidno:20的氨基酸序列85%一致的氨基酸的片段;
任选地,其中所述多肽在n末端包括另外的甲硫氨酸和/或在c末端包括组氨酸标签,该标签可以通过接头与c末端连接。
本发明的示例性多肽的序列以seqidno:6提供。该多肽可以包含seqidno:6的氨基酸序列或由seqidno:6的氨基酸序列组成。编码该多肽的示例性多核苷酸序列示于seqidno:7。本发明的另一个示例性多肽的序列以seqidno:21提供。该多肽可以包含seqidno:21的氨基酸序列或由seqidno:21的氨基酸序列组成。编码该多肽的示例性多核苷酸序列示于seqidno:22。
所述多肽优选以固定形式提供,例如在琼脂糖或琼脂糖凝胶上,任选地以树脂形式提供。
具有o-糖蛋白结合活性但缺乏o-糖蛋白特异性内切蛋白酶活性或具有降低的o-糖蛋白特异性内切蛋白酶活性的本发明的另外的多肽可以通过破坏包含金属蛋白酶结构域基序hebbh或abxhebbhbc的具有o-糖蛋白特异性内切蛋白酶活性的任何其他多肽中的金属蛋白酶结构域基序hebbh或abxhebbhbc来产生。在本文所述的缺乏o-糖蛋白特异性内切蛋白酶活性或具有降低的o-糖蛋白特异性内切蛋白酶活性的本发明多肽的使用方法中,对本发明多肽的提及包括这样的多肽。优选如上所述地实现对所述基序的破坏,使得:
(a)第一位的h被可供选择的氨基酸替代,所述可供选择的氨基酸优选a或g;和/或
(b)第二位的e被不带电荷的氨基酸替代,所述不带电荷的氨基酸任选地为a、c、f、g、i、l、m、n、p、q、s、t、v或w,优选为a或g;和/或
(c)第五位的h被可供选择的氨基酸,优选a或g替代,
其中所述基序中的b是不带电荷的氨基酸,任选地是a、c、f、g、i、l、m、n、p、q、s、t、v或w。
因此,所述多肽可以描述为包含基序xbbbx,其中:
(a)x优选为除h以外的任何氨基酸,并且优选为a或g;和/或
(b)b是不带电荷的氨基酸,任选地为a、c、f、g、i、l、m、n、p、q、s、t、v或w,优选a或g;
上文描述了具有o-糖蛋白特异性内切蛋白酶活性并可能以这种方式被破坏的其他多肽,这些多肽已在铜绿假单胞菌pao1、多形拟杆菌vpi-5482和产气荚膜梭菌中被鉴定出(参见noachetal;pnas2017,pe679-688和支持附录,特别是用于克隆、蛋白表达和纯化的材料和方法(materialsandmethodsforcloning,proteinexpressionandpurification)中描述的三种肽酶)。这些多肽的全长序列以seqidno:32、33和34提供。相应的成熟序列(例如,去除信号和其他序列)以seqidno:26、27和28提供。针对在大肠杆菌中表达和随后纯化(通过在n末端包括另外的甲硫氨酸和/或在c末端包括组氨酸标签)而优化的这些序列的变体以seqidno:29、30和31提供。因此,seqidno:26至34中每个都包含具有基序hebbh的金属蛋白酶结构域以产生本发明的另外的多肽,所述基序hebbh可以被破坏以产生如上所述的基序xbbbx。hebbh基序已被如此破坏的seqidno:26、27和28的变体以seqidno:35、36和37提供。针对在大肠杆菌中表达和随后纯化(通过在n末端包括另外的甲硫氨酸和/或在c末端包括组氨酸标签)而优化的这些序列的变体以seqidno:38、39和40提供。缺乏o-糖蛋白特异性内切蛋白酶活性或具有降低的o-糖蛋白特异性内切蛋白酶活性的本发明的多肽可包含以下,基本上由以下组成或由以下组成:seqidno:35、36、37、38、39或40中的任一种。
使用缺少内切蛋白酶活性或具有降低的内切蛋白酶活性的ls突变体的方法
本发明还提供了与o-聚糖结合的方法,其中该方法包括使包含o-聚糖的样品与本发明的能够与o-聚糖结合并且缺乏o-糖基化蛋白特异性内切蛋白酶活性或具有降低的o-糖基化蛋白特异性内切蛋白酶活性的多肽接触。该方法任选地进一步包括确定是否已经结合o-聚糖和/或从所得混合物中分离出o-聚糖和任何连接的糖蛋白。
本发明还可以包括一种用于评估蛋白质的糖基化状态的方法,该方法包括使所述样品与本发明的能够与o-聚糖结合并且缺乏o-糖基化蛋白特异性内切蛋白酶活性或具有降低的o-糖基化蛋白特异性内切蛋白酶活性的多肽接触,以及确定蛋白质是否与所述多肽结合。
本发明还可以包括用于检测样品中的o-连接的糖蛋白的方法,其中该方法包括使所述样品与本发明的能够与o-聚糖结合并且缺乏o-糖基化蛋白特异性内切蛋白酶活性或具有降低的o-糖基化蛋白特异性内切蛋白酶活性的多肽接触,从而允许形成o-连接的糖蛋白-多肽复合物。该方法可以任选地包括从接触的样品中分离所述多肽,以及确定分离的多肽是否与o-连接的糖蛋白结合,从而确定样品中o-连接的糖蛋白存在或不存在。该方法还可用于从包含o-聚糖或o-连接的糖蛋白的样品中分出o-聚糖或o-连接的糖蛋白。
在这样的方法中,在适于使多肽与样品中的任何o-聚糖或蛋白质相互作用并发生结合的条件下,使样品与本发明的多肽接触。合适的条件包括与本发明的多肽孵育至少20分钟、30分钟、40分钟、50分钟、60分钟、70分钟、80分钟、90分钟或120分钟、3小时、5小时、10小时或过夜,通常伴随混合,例如颠倒混合。孵育优选在室温下进行,更优选在约20℃、25℃、30℃、35℃、40℃或45℃下,最优选在约37℃下进行。上述方法可以在任何合适的ph下实施。合适的ph值包括例如约3.0、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9或9.5的ph。对于本发明多肽的活性,优选ph为5.6至6.8。该方法可以在任何合适的缓冲液中进行,例如tris缓冲盐水(tbs)或磷酸盐缓冲盐水(pbs)。本发明的多肽与样品的蛋白质含量的近似比例可以是1:1、2:1、4:1、6:1、10:1、15:1、20:1、1:2、1:4或1:6、1:10、1:15、1:20、1:40、1:100、1:200或1:400(wt:wt)。优选的比例是1:1(wt:wt)。如果需要更短的反应时间,或者如果o-糖蛋白大量唾液酸化,则较高的多肽与底物的比例可能是有益的。可供选择地,如下文中更详细地讨论的,可以使用较早或同时的唾液酸酶孵育步骤来降低唾液酸含量。底物的浓度通常为约0.01mg/ml至10mg/ml,优选为约0.1mg/ml至10mg/ml、约0.01mg/ml至2mg/ml或约0.1mg/ml至2mg/ml。
可以通过任何合适的分析方法来评估样品的检测或分析以确定是否已经结合o-聚糖或o-连接的糖蛋白,所述分析方法例如但不限于质谱、hplc、亲和色谱、凝胶电泳、sds-page、elisa、凝集素印迹、光谱测定、毛细管电泳和其他标准的实验室蛋白质分析技术。例如,可以分析多肽的分子量。与未结合o-聚糖或o-连接的糖蛋白的多肽相比,与o-聚糖或o-连接的糖蛋白结合的本发明的多肽将具有更高的分子量。
结合的o-聚糖或o-连接的糖蛋白和本发明的多肽的分离可以通过任何合适的分离手段实施。例如,分离手段可包括磁性纳米颗粒群。这些可以使用磁场分离,优选高梯度磁场分离来从样品中分离。试剂或分离手段的实例是能够结合本发明多肽的磁性颗粒群。例如,在用组氨酸标签使多肽衍生化的情况下,磁性颗粒在其表面上包含带有镍、铜或锌离子的螯合基团。可供选择地,在用生物素标签使多肽衍生化的情况下,磁性颗粒在其表面上包含链霉亲和素。
分离手段还可以包括固定有本发明的多肽的固体支持物。固体支持物的实例包括在先前部分中描述的那些,并且可以包括琼脂糖或琼脂糖凝胶树脂、交联的琼脂糖珠粒或类似物。支持物可以用作亲和色谱柱中的基质。可供选择地,固体支持物可包含可直接吸附本发明的多肽的合适的基于二氧化硅的材料或聚苯乙烯、或塑料容器,例如微量滴定板或等同物。
替代的分离手段包括包含可以通过本领域标准方法产生的对本发明的多肽的具有特异性的抗体的试剂。在这种意义上的抗体包括单克隆抗体、多克隆抗体、单链抗体、嵌合抗体、cdr移植抗体或人源化抗体。该抗体可以是完整的免疫球蛋白分子或其片段,例如fab、f(ab')2或fv片段。如果存在一种以上的抗体,则这些抗体优选具有不同的非重叠决定簇,使得这些抗体优选可以同时结合本发明的多肽。抗体可以结合到固体支持物上,或者可以标记或缀合到另一个化学基团或分子上,以帮助抗体分离或分出。例如,典型的化学基团包括荧光标记(例如荧光素(fitc)或藻红蛋白(pe))或标签(例如生物素)。
其他合适的分离手段包括通过使来自接触的样品的多肽与合适的洗脱缓冲液接触以从(通常是固定的)多肽洗脱蛋白质。洗脱缓冲液的选择可能取决于蛋白质的酸敏感性。优选的洗脱缓冲液可包含高摩尔浓度的尿素(通常至少5m、6m、7m或最优选至少8m)或高浓度的去污剂(通常至少约1%,5%或10%)。合适的去污剂包括nonidetp40、tritonx-100、tween20、chaps、脱氧胆酸钠和rapigestsf表面活性剂,但是十二烷基硫酸钠(sds)是优选的。高摩尔尿素比去污剂更优选,因为下游程序更可能对去污剂的存在是敏感的。
另一种优选的洗脱缓冲液包含本发明的具有o-糖蛋白内切蛋白酶活性的多肽,例如seqidno:1的多肽。该多肽在o-聚糖处的切割将释放结合的o-糖蛋白,从而消除对基于尿素或去污剂的洗脱液的需求。
实施例中证明了从本发明的固定的多肽洗脱o-糖蛋白的优选方法。
上述任何方法中的样品可以是取自患者(优选人类患者)的样品。获得的结果可以用于诊断目的,例如用于检测涉及o-连接的糖基化的癌症的存在。这样的用途可以涉及将获得自患者样品的结果与使用自健康对照获得的样品得到的结果进行比较。
在本发明的任何方法中,该多肽可以与另一种酶(例如蛋白酶或糖苷酶)组合使用。另外的蛋白酶或糖苷酶通常将进一步消化底物蛋白质或聚糖,这可以使得对产物进行更容易或更详细的分析。
例如,本发明的多肽可以与试剂结合使用以去除唾液酸。所述试剂可以优选是唾液酸酶或以上部分中所述的这些酶的混合物。本发明还提供了包含本发明的多肽和am1757或am1757和am0707的混合物的组合物(冻干或溶液形式)。本发明还提供一种试剂盒,该试剂盒在分离的容器中包含来自am1757或am1757和am0707的混合物的本发明的多肽,以及关于不同酶组合使用的说明。
作为另一个实例,在本文所述的任何方法中,在将样品与本发明的多肽接触之前、同时或之后,可以将样品与n-糖苷酶一起孵育,以从靶蛋白去除n-聚糖。示例性的n-糖苷酶是pngasef。当样品包括免疫球蛋白时可以使用的其他n-糖苷酶是endos(参见wo2008071418的seqidno:1)或endos2(可以称为endos49-参见wo2013037824的seqidno:1)。这些酶中的每一种均从igg1的asn-297去除n-连接的糖蛋白。除了本发明的多肽之外,样品还可以与n-糖苷酶和唾液酸酶(或其混合物)接触。在这样的方法中,可以在同时添加n-糖苷酶和本发明的多肽之前首先应用唾液酸酶(或混合物)。
作为另一个实例,在本文所述的任何方法中,在将样品与本发明的多肽接触之前、同时或之后,可以将样品与蛋白酶一起孵育以进一步消化靶蛋白。合适的一般蛋白酶包括胰蛋白酶、胰凝乳蛋白酶、lys-c、asp-n、glu-c、arg-c或类似的内切蛋白酶、或牙龈卟啉单胞菌的arg-牙龈蛋白酶(rgpb)。
如果样品包括免疫球蛋白,则可以使用免疫球蛋白蛋白酶,例如speb(参见wo2015040125中的序列),化脓性链球菌(s.pyogenes)的免疫球蛋白g降解酶(ides-参见wo2015040125的序列),马链球菌兽疫亚种的免疫球蛋白g降解酶(idez),牙龈卟啉单胞菌的lys-牙龈蛋白酶(kgp)和无乳链球菌(s.agalactiae)的免疫球蛋白g降解酶(igde无乳-参见pct/ep2017/052463的seqidno:3)。在本发明的方法中使用这些蛋白酶的任何组合可有助于例如使用质谱来分析底物蛋白质或聚糖。
作为另一个实例,在本文描述的任何方法中,在通过任何合适的方法进一步分析之前,可以将分出的o-连接的糖蛋白与o-糖苷酶一起孵育以去除o-聚糖。合适的o-糖苷酶可从以下细菌获得:粪肠球菌、口腔链球菌、或两歧双歧杆菌,优选粪肠球菌或口腔链球菌,最优选口腔链球菌。来自口腔链球菌的示例性o-糖苷酶的序列以seqidno:15提供。
以下实施例说明了本发明:
实施例1
材料和方法
ls的诱变
使用引物e206a_fwd5’-atggcgcacgcgctgggccacg-3’和5’-gccaccgtaccatttcgtc-3’(rev),根据制造商的说明(退火温度68℃,延伸3分钟),使用q5(neb)进行定点诱变;因此,将来自嗜粘蛋白艾克曼菌的amuc1119基因中的谷氨酸变为丙氨酸,从而产生突变体amuc1119e206a(lse206a)。将构建体转化到dh5α大肠杆菌中,分离并使用测序(gatcbiotech)来验证。
ls和lse206a的重组表达
将来自嗜粘蛋白艾克曼菌atccbaa-835的基因amuc1119和突变体amuc1119e206a(amuc1119-ls;amuc1119e206a-lse206a)针对在大肠杆菌(dna2.0)中表达进行优化,并克隆到具有作为融合蛋白的一部分的c末端6xhis标签的表达载体中。
将经密码子优化的基因转化到bl21(de3)star细胞中。在lb中在37℃下在180rpm下常规地培养大肠杆菌。在质粒存在下,添加50μg/ml卡那霉素。过夜孵育后,将培养物以1:20稀释在新鲜的lb(kana)中,并使培养物生长至od620约为0.7至0.8,之后通过添加1mmiptg诱导重组蛋白表达,并且表达持续6小时,然后收集细胞并冷冻。将冷冻的细胞解冻并溶解在his结合缓冲液中(20mmnapph7.4、500mmnacl,20mm咪唑)中,进行超声处理以释放细胞内蛋白质。通过离心去除细胞碎片。在镍柱上对无菌的过滤的上清液进行亲和纯化,并在pd-25柱上重新缓冲至20mmtris-hclph8.0中。使用nanodrop确定蛋白质的浓度,并通过sds-page估算纯度。
使用蛋白质底物进行活性评估
将tnfαr与ls以2:1的比例混合,并在37℃下孵育15至60分钟,然后在4%至20%novex梯度sds-page上分离蛋白质。研究了nacl(0至1m)、二价阳离子、edta和ph对ls活性的影响,并使用geldocez(biorad)通过光密度分析法测量了生成的水解片段的差异。
活性的时间和剂量依赖性
将tnfαr(0.5μg)与不同剂量的ls在pbs中于37℃孵育15或60分钟,然后在4%-20%novex梯度sds-page上分离蛋白质。使用生成的片段的强度(光密度测定)确定有效孵育条件的最佳剂量和时间。
底物特异性
ls与各种n-连接和o-连接的底物在37℃下以2:1的比例(底物:酶)孵育过夜。ls与epo(0.3mg/ml)以50:1的比例(底物:酶)孵育。将蛋白质分离,并在4%至20%novex梯度sds-page凝胶上进行分析。
lse206a的固定
将lse206a重悬于偶联缓冲液(0.2mnahco3,0.5mnaclph8.3)中,并浓缩至20mg/ml。根据制造商的说明,准备了nhs活化的琼脂糖4fastflow(gehealthcare)以进行偶联(例如,在偶联缓冲液中进行hcl洗涤和平衡)。lse206a通过用琼脂糖在4℃下过夜孵育而固定,缓慢摇动以保持恒定混合。通过添加0.1mtrisph8.5封闭琼脂糖,用0.1mtrisph8.5/0.1mnaac,0.5mnaclph5.0重复洗涤3次,并保存在etoh中直至使用。
lse206a的结合亲和力
pbs平衡的具有50μl固定的lse206a的旋转柱与10μg糖蛋白一起孵育,所述糖蛋白用唾液酸混合物(am0707:am1757)或用唾液酸和口腔链球菌内-α-n-乙酰半乳糖苷酶(例如o-糖苷酶)的组合进行了预处理。将样品在37℃下孵育2小时,此后用pbs(10体积;100g,30s)洗涤色谱柱,并用0.1m甘氨酸ph3.0洗脱。在sds-page上分析级分。
质谱分析
依那西普
结果
ls是推定的金属蛋白酶
基于序列和结构域的相似性,ls与几种金属蛋白酶具有同源性,包含推定的活性位点序列gmahelghgl,从而与一般的金属蛋白酶序列abxhebbhbc(a=v/t,b=不带电荷的,c=疏水性的)共有相似性。组氨酸通常参与底物结合和zn2+亲和,而谷氨酸与组氨酸一起介导电子转移,从而介导水解作用。为了能够进一步表征该酶,我们构建了lse206a突变体,该突变体能够结合底物,但是通过将e改变为a而缺乏水解能力或具有降低的水解能力。进一步修饰(例如,将h改变为a)对于完全失活可能是必需的。两种构建体均表达良好,并且容易地基于其his标签使用亲和色谱法进行纯化(图1)。
ls特异性水解带有o-聚糖的糖蛋白
为了研究ls的底物特异性,将蛋白酶与多种蛋白质一起孵育。如图2所示,将ls与iga和赫赛汀(曲妥珠单抗)一起孵育。ls仅能作用于具有o-连接的聚糖的蛋白质,例如iga。尽管末端唾液酸的存在似乎部分地抑制ls的活性,但唾液酸的存在并不是水解的先决条件(图4)。
ls可以在多种条件下作用于o-连接的糖蛋白
实施sds-page凝胶的光密度分析,以评估ls的酶促性质。ls在大多数条件下是有活性的,优选略酸性的ph值和低nacl浓度(图3a-b)。尽管mg2+和ca2+离子均积极影响ls的水解活性,但zn2+的存在显著降低了该活性,而edta则完全消除该活性(图3c-d)。
o-连接的半乳糖苷酶残基对ls的活性至关重要
尽管在不存在末端唾液酸的情况下具有增加的活性,但是o-聚糖中其他碳水化合物对ls活性的重要性还没有被完全理解。尽管在不存在末端唾液酸的情况下ls的活性显著增加,但是去除半乳糖完全抑制了ls的活性(图4a)。此外,如过夜孵育后的完全水解所证明,ls对唾液酸化蛋白的活性较低不是由于在唾液酸存在下不能使键水解(图4b)。ls的活性完全依赖于o-聚糖,因为去除n-聚糖不影响ls的水解(图4c)。
o-连接的聚糖引导ls的切割位点
已经证明了o-聚糖对于活性至关重要,我们接下来试图研究ls的特定切割位点。使用质谱,我们能够证明ls水解o-糖基化的ser/thr及其n末端氨基酸之间的氨基键,无论氨基酸的类型如何(例如似乎不能抑制脯氨酸水解)(图5)。
依那西普因其o-连接的聚糖丰度高而用作模型蛋白,将依那西普用ls处理,此后用o-糖苷酶进行后续处理以便于质谱分析。将质谱分析产生的m/z值与ms/ms数据相结合,拟合至依那西普。所有鉴定出的肽具有n末端丝氨酸或苏氨酸,这与ls仅切割o-聚糖的n末端一致(图5)。该分析以定向搜索(在参数中定义s/t水解;图5a)和无偏方法(图5b)鉴定了肽。
ls的水解失活变体特异性结合含o-聚糖的蛋白质
由于ls结合o聚糖并特异性水解紧邻聚糖(例如,紧邻ser/thr)的氨基酸键的能力,我们假设ls的e206a突变体将缺乏水解活性,但保留结合能力。这样的工具对于以下以及其他将是有价值的:a)鉴定o-连接的糖蛋白,b)用于去除或用于研究的o-连接的糖肽的亲和纯化,以及c)对o-聚糖进行亲和纯化。
图6a显示突变体ls不具有任何可检测的水解活性。尽管在唾液酸酶存在下ls能够水解依那西普,但lsmut不能水解依那西普,这证实了在测试条件下遗传改变确实使o-糖基蛋白酶失活。
将lse206a固定在琼脂糖凝胶上,并添加到旋转柱上,以便于处理。重要的是,lse206a与不同底物的结合与ls的水解活性完全相关(图6b)。lse206a(标记为lsmut)显示出对o连接的糖蛋白的特异性亲和力。通过将lsmut固定在琼脂糖凝胶上,我们能够对iga进行亲和纯化。然而,由于亲和力强,我们无法洗脱蛋白质。缺乏o-聚糖以及o-糖苷酶处理的iga的赫赛汀(曲妥珠单抗)没有结合到色谱柱上,但可以在流过液(ft)中检测到。
2-3唾液酸键对于去除ls的全部活性是重要的
我们最近确定,内切蛋白酶活性依赖于特定的唾液酸键,从而为了完整的作用,必须去除2-3和2-6连接的唾液酸。为了确定特定唾液酸键对ls活性的单独作用,我们将enbrel与不同的唾液酸酶和ls组合一起孵育了30分钟至20小时。对ls水解来说,去除2-3键似乎是足够的(图7)。
ls切割促红细胞生成素(epo)
将epo用pngasef、唾液酸酶(smix,包含am0707和am1757)和/或o-糖苷酶处理,并与ls一起孵育。
然后通过sds-page和考马斯蓝染色以及rplc和质谱来分析所得产物。sds-page的结果示于图9a,该图显示了当唾液酸被去除和当它们完好时,ls均会切割epo。此外,ls还消化了已用pngasef去除n-聚糖的epo,从而证实ls活性不受n-聚糖去除的影响。然而,当用o-糖苷酶去除o-聚糖时,ls不切割epo,这表明ls切割蛋白需要o-聚糖。以10:1、5:1和2:1(底物:酶)的比例观察到了等效的结果(数据未显示)。
与pngasef、smix和ls孵育后的样品混合物通过反相液相色谱来进行分离,并通过esi质谱进行分析以鉴定酶促处理后的反应产物。
图9b显示了来自rplc的uv色谱图。如所预期的,假设epo仅具有一个建议的o-聚糖位置(参见下文的seqidno:14的预测位置),则色谱图显示与由ls切割产生的2个片段对应的2个峰。
通过ms对这些片段进行了进一步分析(参见图9c和d),并鉴定如下:
saaplrtitadtfrklfrvysnflrgklklytgeacrtgd(质量=4900.5868da–与序列c末端至切割位点对应,因此包括仍连接至n末端丝氨酸的o-聚糖);和apprlicdsrvlerylleakeaedittgcaehcsldenitvpdtkvdfyawkrmevgqqavevwqglallseavlrgqallvnssqpweplqlhvdkavsglrslttllralgaqkeaisppdaa(质量=13714.1199da,与序列n末端至切割点对应)。
因此,结合使用pngasef、唾液酸酶混合物和ls允许分出和精确鉴定epo中带有o-聚糖的丝氨酸。这种类型的方法可适用于任何o-糖蛋白,并允许快速识别o-聚糖连接位置。
实施例2
介绍
实施例1中描述的lse206a突变体掺入了ls的活性位点的定点突变(abxhebbhbc至abxhabbhbc),从而去除了酶促切割的电子转移能力。如以下进一步解释的,在进一步的压力测试上,发现尽管这种改变相对于野生型序列降低了o-糖基蛋白酶的活性,但是并未完全消除该活性。因此,本发明人已经开发并表征了在酶促切割中掺入了另外的取代基的另一种突变体。具体而言,将对辅因子锌离子的取向重要的his残基替代为ala。所得的双突变体被称为h205a/e206a(abxhebbhbc变为abxaabbhbc)。
2.1双突变体的产生
相对于嗜粘蛋白艾克曼菌的amuc1119基因,将使用标准方案(例如如实施例1中的标准方案)进行的定点诱变用于将组氨酸和谷氨酸改变为丙氨酸,以产生双突变体amuc1119h205a/e206a(lsh205a/e206a)。如实施例1中所述,将构建体转化到大肠杆菌中,分出和使用测序进行验证。如实施例1中所述在大肠杆菌中进行表达。表达的蛋白质的序列以seqidno:21提供。
2.2双突变体的表征
2.2.1双突变体使ls的活性完全失活
如实施例1所示,鉴于单突变体lse206a无法在2小时内水解o-糖蛋白,因此单突变体lse206a被认为是失活的。然而,在压力测试中,发现o-糖基蛋白酶的活性没有完全被消除,而只是降低了,因为在更高的酶:o-糖蛋白比例和更长孵育时间下观察到了一些活性。
lse206a:去唾液酸化的o-糖蛋白以1:1(wt:wt)的比例孵育24小时会导致底物的显著水解,尽管程度不如野生型ls(图10a)。相比之下,双突变lsh205a/e206a在过夜孵育后,甚至在酶:o-糖蛋白的比例为15:1(wt:wt)时也没有产生任何水解迹象(图10b),表明该酶在添加第二种突变时是完全失活的。
2.2.2双突变体特异性结合o-糖蛋白
为了评估与不同蛋白的结合,固定的lsh205a/e206a(50μl树脂)(使用与实施例1相同的方案制备)在pbs中平衡,此后以0.5mg/ml的浓度添加50μg不同的蛋白样品,在室温下颠倒旋转孵育2小时。流过液通过离心(200g,1分钟)来收集,树脂用350μlpbs洗涤3次。结合的蛋白质通过与50μl8m尿素孵育5分钟,相继两次,然后离心(1000g,1分钟)来洗脱。所有样品均以相同体积上样。通过sds-page评估起始/上样材料、流过液和洗脱液。
在第一个实验中(参见图11a),用唾液酸酶混合物(am0707:am1757)或唾液酸酶混合物与口腔链球菌内-α-n-乙酰半乳糖苷酶(例如o-糖苷酶)的组合预处理糖基化蛋白或非糖基化蛋白,然后与树脂一起孵育、洗涤并洗脱。根据制造商的说明,对样品进行预处理(唾液酸酶混合物+/-o-糖苷酶)。在不存在唾液酸的情况下,仅具有o-聚糖的蛋白质与树脂结合,并具有增加的亲和力。如用o-糖苷酶处理后缺乏相互作用所表明,o-聚糖的存在对于任何结合都是必不可少的。
在第二个实验中(参见图11b),将n-糖基化蛋白、o-糖基化蛋白和非糖基化蛋白的混合物与ls双突变体树脂一起孵育。仅o-糖基化蛋白(tnfαr和apoe)与基质结合,并用8m尿素洗脱。n-糖基化(阿柏西普、agp(α-1-酸糖蛋白)、igg的fc结构域(iggfc))和非糖基化(bsa)未结合至ls双突变体树脂,并在流过液中被发现。因此,当该样品包含n-糖基化蛋白、o-糖基化蛋白和非糖基化蛋白的混合物时,双突变体树脂仅与o糖基化蛋白特异性结合。
在第三个实验中(参见图11c),n-糖基化和非糖基化蛋白的混合物与ls双突变体树脂一起孵育。即使在不存在可能与o-糖蛋白竞争的情况下,也没有非特异性结合(均不存在)。在洗脱液中未发现蛋白质。因此,双突变体树脂不与缺乏o-聚糖的蛋白质结合。
2.2.3双突变体可以固定在不同浓度的树脂上以增强容量
为了研究提高固定的双突变体树脂结合更多o-糖基化蛋白的能力,在固定到树脂上的过程中使用了不同浓度的双突变体(5mg/ml至15mg/ml)。代表性凝胶示于图12a。所示的%是相对于阳性对照的结合水平,并通过凝胶的光密度分析来确定。结果显示在图12b的图表中。当在固定过程中使用较高浓度的双突变体时,观察到容量随较高的o-糖蛋白结合能力而呈剂量依赖性增加。使用15mg/ml的固定的双突变体继续进行进一步的实验。另外,即使在存在1m尿素和1mghcl的情况下,也维持高度的o-糖蛋白结合,即便1m尿素和1mghcl显著降低了结合效率。
2.2.4双突变体的亲和纯化能力为约3mg糖蛋白/ml树脂
为了专门研究双突变体树脂对o-糖蛋白的亲和纯化能力,以及样品浓度对该能力的影响,向树脂中添加了不同量和不同浓度的去唾液酸化依那西普。单个柱子(包含50μl双突变体树脂)具有结合约150μgo-糖蛋白的容量(即3mgo-糖蛋白/ml树脂)。图13显示了代表性的凝胶。
2.2.5o-糖蛋白与双突变体的结合不受离子强度或缓冲液体积/类型的显著影响,并且在宽ph范围内起作用
在室温下,在一系列不同条件下,通过颠倒旋转,使样品蛋白与双突变体树脂结合2小时,以测试离子强度、缓冲液体积/类型和ph对树脂的结合能力的影响。在每种情况下,然后将树脂用其各自的结合缓冲液(350μl)洗涤三次,然后通过添加8m尿素洗脱(50μl,孵育5分钟;重复2次)。然后通过sds-page分析所有样品。
在第一个实验中(参见图14a),为了研究在具有不同离子强度的缓冲液中相互作用的稳定性,样品由去唾液酸化依那西普组成,该样品与双突变体树脂在0至4mnacl中孵育,以及用相应的nacl浓度执行所有洗涤步骤。添加nacl不会显著影响去唾液酸化依那西普的结合。
在第二个实验中(参见图14b),样品由一系列不同体积的pbs中的去唾液酸化依那西普组成。洗涤步骤使用pbs。底物体积在100μl至300μl之间变化不会显著影响效率。
在第三个实验中(参见图14c和d),样品由不同ph(ph4至9)下的不同缓冲液(100mm乙酸钠、50mm磷酸钠和50mmtris)中的去唾液酸化依那西普和bsa组成。洗涤步骤使用匹配的缓冲液。发现ph6-8作用最佳,而ph4完全不起作用,ph9的效率略低于ph8。不包含任何o-聚糖的bsa在任何结合条件下均不与树脂结合。
2.2.6尿素和sds可以洗脱亲和结合的o-糖蛋白
基于双突变体与其o-糖蛋白底物之间的高亲和力,本发明人研究了不基于离子强度从树脂上洗脱结合蛋白的不同方法。尿素呈剂量依赖性洗脱,使用8m尿素时洗脱接近100%(图15a)。高浓度的sds(例如5%-10%)也洗脱了大多数的结合蛋白(图15b)。然而,由于许多下游应用对去污剂的存在敏感,因此使用高水平尿素对于结合蛋白/肽的非酶促释放可能是更具实用性的。
2.2.7野生型ls可用于洗脱结合双突变体的o-糖蛋白
本发明人推测,向结合双突变体的蛋白中添加ls可以导致蛋白释放,因此不必须为洗脱而添加尿素。阿巴西普和依那西普均可在6小时内被ls水解并从双突变体树脂上洗脱下来,但在24h后洗脱略微更完全(图16a)。此后添加尿素表明非常少的o-糖蛋白保持附着在亲和基质上,这表明ls洗脱策略是高效的。
对ls洗脱的依那西普也进行质谱分析(lc/ms和ms/ms)。鉴定出的肽(图16b.1)与依那西普的ls消化过程中产生的肽(图16b.2)一致。下表显示了该实验的其他ms数据:
2.2.8双突变体可用于对来自复杂样品中的o-糖蛋白进行亲和纯化
作为对该系统不仅可以在简化的系统中而且可以在复杂的培养基中充当o-糖基化蛋白的一般亲和基质的观点的证明,本发明人研究了双突变体从人血清中纯化o-糖蛋白的能力。人血清主要由非糖基化(bsa)和n-糖基化(igg)蛋白质组成,而总血清蛋白质组中只有一小部分是o-糖基化的。
向50μl固定的双突变体树脂柱施加20μl唾液酸酶处理的血清(约1.2mg蛋白质),使得去除几乎所有的非糖基化蛋白和n-糖基化蛋白,而洗脱几种选定的蛋白质(图17a)。通过添加更高量的经过或未经过唾液酸酶和o-糖苷酶预处理的血清(例如2.5mg蛋白),证明了相互作用取决于o-聚糖以及末端唾液酸的去除(图17b)。此外,得出结论,与未经唾液酸酶处理的样品相比,唾液酸酶的预处理显著增加了结合的o-糖蛋白的量。添加50u唾液酸酶混合物(am0707:am1757)足以改善亲和纯化的o-糖蛋白的量(图17c)。
通过质谱分析,可以将绝大多数亲和纯化的血清蛋白标注为o-糖基化蛋白(参见图18a,以及下表中的粗体斜体字的名称)。相对于非o-糖蛋白肽,已鉴定的o-糖蛋白肽的数量可能会受到洗涤步骤中不同严格性的影响,无论是在鉴定出的肽的总数方面(图18b),还是在o-糖蛋白肽对比非o糖蛋白肽的比例上(图18c)。因此清楚的是,亲和树脂在o-糖蛋白的特异性和选择性亲和纯化和富集的能力方面是高效的。下表显示了该实验的其他ms数据。
2.2.9固定的双突变体还与较短的o-糖肽结合
为了证明ls双突变体对o-糖肽的特异性,进行了一系列实验。在第一个实验中,将o-糖基化肽(糖基果蝇肽(gd)=在苏氨酸上具有核心1o-聚糖的gkprpysprptshprpirv(seqidno:47))和几种非糖基化肽(h2686、h4062h8390和胰岛素氧化β链(iob))的混合物与ls双突变体树脂一起孵育。(h2686=yiygsfk(seqidno:48),h4062=kklvffa(seqidno:49),h8390=flplilgklvkgll(seqidno:50))。
在室温下通过颠倒旋转使肽混合物与50μl固定的双突变体树脂结合2小时。用结合缓冲液(300μl)洗涤树脂五次,然后添加8m尿素洗脱。用lc/ms分析加样液、流过液和洗脱液中的肽。在rp-lcc18柱上(advancebiopeptidemap2.1x1002.7μm,来自agilent)进行分离,并用esi-q-tofbrukerimpactii检测。结果示于图19a。糖基果蝇肽是混合物中唯一包含o-galnacgal的肽,主要存在于洗脱级分中,而非糖基化肽则存在于流过级分中。
在第二个实验中,研究了ls双突变体能否从胰蛋白酶蛋白质消化物(例如不同类型的肽混合物)中富集o-糖基化肽。
选择iga作为消化的靶标。根据iga中的胰蛋白酶位点和已报道的o-糖基化位点,胰蛋白酶消化应仅产生与iga第89至126位对应的单个o-糖基化肽(请参见图19b中的示意图)。
为了产生胰蛋白酶消化物,将iga与尿素混合至6m,与dtt混合至5mm,然后在37℃下孵育1小时。将iam添加至15mm,然后在黑暗中在室温下孵育30分钟。然后将样品在zebaspin7000k色谱柱上缓冲液交换至ph8.0的50mmtris中。然后以1:20的比例添加胰蛋白酶,接着在37℃下孵育过夜。添加胰蛋白酶抑制剂1mg/mg,然后在室温下孵育20分钟。将唾液酸酶混合物和nacl添加到所得的胰蛋白酶消化物中。在室温下通过颠倒旋转使混合物与树脂结合2小时。将树脂用pbs缓冲液(300μl)洗涤10次,然后通过添加8m尿素(50μl,2分钟,重复2次)来洗脱。
使用rp-lcmsms在c18色谱柱(advancebiopeptideplus2.1x150mm2.7μm,来自agilenttechnologies)上,在0.1%fa的mq溶液:0.1%fa的95%can梯度溶液中,在45℃下,以0.2ml/分钟的流速分离和分析加样液、流过液和洗脱液中的肽。在esi-q-tofbrukerimpactii仪器上进行检测。结果示于图19c。o-糖基化肽89-126在洗脱液中显著富集,鉴定出完整的特异性o-糖肽89-126。
2.2.10固定的双突变体优于其他o-糖蛋白结合基质
本发明人评估了双突变体对比其他可商购的o-糖蛋白结合基质(特别是凝集素花生凝集素(pna)和野豌豆凝集素(vva))对o-糖蛋白的亲和纯化能力。使用依那西普和去唾液酸化依那西普用作模型底物。
向50μl体积的在各自的缓冲液(总共100μl)中平衡的不同的固定的凝集素或ls双突变体树脂添加50μg在pbs(pna和ls双突变体)或凝集素结合缓冲液(vva)中的底物。(凝集素结合缓冲液是20mmtris-hclph7.4,150mmnacl,mgcl2,cacl2,zncl2和mncl2各1mm)。在室温下,使底物与树脂通过颠倒混合相互作用2小时。未结合的蛋白质分别用pbs或凝集素结合缓冲液洗掉(100g,1分钟;3x)。通过离心(1000g,1分钟)干燥树脂。根据生产商通过添加8m尿素(对于pna和ls双突变体树脂)或vva洗脱缓冲液(针对vva树脂)洗脱结合蛋白(50μl,5分钟处理然后1000g离心1分钟;2x),将流过液(ft)和洗脱液(e)在sds-page上分析。将1.5μg底物添加到每种凝胶(例如3μl)中作为阳性对照,并且进行光密度分析,从而相对于假设为100%效率的1.5μg负载底物,评估树脂的效率。依那西普和去唾液酸化依那西普(etanercepts)的代表性凝胶示于图20a。密度分析的结果示于图20b。lsh205a/e206a双突变体在纯化去唾液酸化底物的效率上至少与性能最佳的商业凝集素一样好。
序列
seqidno:1
evtvpdalkdrialkktarqlnivyflgsdtepvpdyerrlselllylqqfygkemqrhgygarsfgldikspgrvniieykaknpaahypyengggwkaaqeldeffkahpdrkksqhtliimptwndekngpdnpggvpfygmgrncfaldypafdikhlgqktregrlltkwyggmahelghglnlphnhqtasdgkkygtalmgsgnytfgtsptfltpascalldacevfsvtpsqqfyegkpevevgdvaisfkgdqilvsgnykspqtvkalnvyiqdppyavnqdydavsfsrrlgkksgkfsmkidkkeleglnnnefrislmfilanglhmqkhftfhwdalqdyrdgsks
seqidno:2
mevtvpdalkdrialkktarqlnivyflgsdtepvpdyerrlselllylqqfygkemqrhgygarsfgldikspgrvniieykaknpaahypyengggwkaaqeldeffkahpdrkksqhtliimptwndekngpdnpggvpfygmgrncfaldypafdikhlgqktregrlltkwyggmahelghglnlphnhqtasdgkkygtalmgsgnytfgtsptfltpascalldacevfsvtpsqqfyegkpevevgdvaisfkgdqilvsgnykspqtvkalnvyiqdppyavnqdydavsfsrrlgkksgkfsmkidkkeleglnnnefrislmfilanglhmqkhftfhwdalqdyrdgsksgsghhhhhh
seqidno:3
atggaagtcactgtgccggacgccctgaaagatcgcatcgcgctgaagaaaaccgctcgtcagctgaatatcgtctacttcctgggttctgataccgaaccggttccggactacgagcgccgtctgagcgagctgctgttgtatctgcagcaattctatggtaaagaaatgcagcgccatggctatggcgcacgcagctttggtctggacattaagtcaccgggtcgtgtgaacattatcgagtacaaagcgaagaacccggcagcgcattacccgtatgagaatggtggcggctggaaagctgcacaagaactggacgaatttttcaaggcccatccagaccgcaagaaaagccagcacaccctgatcatcatgcctacctggaatgatgagaaaaatggtcctgacaatccgggtggcgttccgttctatggtatgggtcgtaattgttttgcgttggactacccggcgtttgatatcaagcacctgggtcagaaaacgcgtgagggtcgtctgctgacgaaatggtacggtggcatggcgcacgaactgggccacggcctgaatctgccgcacaatcaccagaccgcgagcgatggcaagaaatatggcaccgccctgatgggtagcggcaactacacgttcggtaccagcccgacgttcctgaccccggcgagctgtgcgctgctggatgcctgcgaagtgttcagcgttaccccgagccaacagttttatgagggtaagccagaagtcgaggttggtgatgttgcaatttccttcaagggtgatcaaatcttggtcagcggtaactacaagagcccgcaaaccgtgaaagctctgaacgtttacattcaggatccgccgtacgccgtgaaccaagactacgatgcagtgagctttagccgtcgtctgggcaaaaagtccggtaagtttagcatgaagattgacaaaaaagaactggaaggcctgaataacaacgaattccgtatttccttgatgttcattctggcaaacggcttacacatgcagaagcactttacgtttcactgggatgcgctgcaagactaccgtgacggtagcaaatctggttcgggtcatcatcaccaccatcactga
seqidno:4
mlkrllsaffslfflgaasgtsfaevtvpdalkdrialkktarqlnivyflgsdtepvpdyerrlselllylqqfygkemqrhgygarsfgldikspgrvniieykaknpaahypyengggwkaaqeldeffkahpdrkksqhtliimptwndekngpdnpggvpfygmgrncfaldypafdikhlgqktregrlltkwyggmahelghglnlphnhqtasdgkkygtalmgsgnytfgtsptfltpascalldacevfsvtpsqqfyegkpevevgdvaisfkgdqilvsgnykspqtvkalnvyiqdppyavnqdydavsfsrrlgkksgkfsmkidkkeleglnnnefrislmfilanglhmqkhftfhwdalqdyrdgsks(信号序列加有下划线)
seqidno:5
evtvpdalkdrialkktarqlnivyflgsdtepvpdyerrlselllylqqfygkemqrhgygarsfgldikspgrvniieykaknpaahypyengggwkaaqeldeffkahpdrkksqhtliimptwndekngpdnpggvpfygmgrncfaldypafdikhlgqktregrlltkwyggmahalghglnlphnhqtasdgkkygtalmgsgnytfgtsptfltpascalldacevfsvtpsqqfyegkpevevgdvaisfkgdqilvsgnykspqtvkalnvyiqdppyavnqdydavsfsrrlgkksgkfsmkidkkeleglnnnefrislmfilanglhmqkhftfhwdalqdyrdgsks
seqidno:6
mevtvpdalkdrialkktarqlnivyflgsdtepvpdyerrlselllylqqfygkemqrhgygarsfgldikspgrvniieykaknpaahypyengggwkaaqeldeffkahpdrkksqhtliimptwndekngpdnpggvpfygmgrncfaldypafdikhlgqktregrlltkwyggmahalghglnlphnhqtasdgkkygtalmgsgnytfgtsptfltpascalldacevfsvtpsqqfyegkpevevgdvaisfkgdqilvsgnykspqtvkalnvyiqdppyavnqdydavsfsrrlgkksgkfsmkidkkeleglnnnefrislmfilanglhmqkhftfhwdalqdyrdgsksgsghhhhhh
seqidno:7
atggaagtcactgtgccggacgccctgaaagatcgcatcgcgctgaagaaaaccgctcgtcagctgaatatcgtctacttcctgggttctgataccgaaccggttccggactacgagcgccgtctgagcgagctgctgttgtatctgcagcaattctatggtaaagaaatgcagcgccatggctatggcgcacgcagctttggtctggacattaagtcaccgggtcgtgtgaacattatcgagtacaaagcgaagaacccggcagcgcattacccgtatgagaatggtggcggctggaaagctgcacaagaactggacgaatttttcaaggcccatccagaccgcaagaaaagccagcacaccctgatcatcatgcctacctggaatgatgagaaaaatggtcctgacaatccgggtggcgttccgttctatggtatgggtcgtaattgttttgcgttggactacccggcgtttgatatcaagcacctgggtcagaaaacgcgtgagggtcgtctgctgacgaaatggtacggtggcatggcgcacgcgctgggccacggcctgaatctgccgcacaatcaccagaccgcgagcgatggcaagaaatatggcaccgccctgatgggtagcggcaactacacgttcggtaccagcccgacgttcctgaccccggcgagctgtgcgctgctggatgcctgcgaagtgttcagcgttaccccgagccaacagttttatgagggtaagccagaagtcgaggttggtgatgttgcaatttccttcaagggtgatcaaatcttggtcagcggtaactacaagagcccgcaaaccgtgaaagctctgaacgtttacattcaggatccgccgtacgccgtgaaccaagactacgatgcagtgagctttagccgtcgtctgggcaaaaagtccggtaagtttagcatgaagattgacaaaaaagaactggaaggcctgaataacaacgaattccgtatttccttgatgttcattctggcaaacggcttacacatgcagaagcactttacgtttcactgggatgcgctgcaagactaccgtgacggtagcaaatctggttcgggtcatcatcaccaccatcactga
seqidno:8
gmahelghgl(金属蛋白酶基序)
seqidno:9
mknllfalltgsfcccyaqqkaapvpepevvatppadagrglirvdsreirhysgtrkepdylvsrdngktwemkaapagyppnyggipkespaivrnpltrefirvqpiggfvflsrggldgkwlavtndgkleedwkdpekrknlkklggimrtpvfvnkgrrvivpfhnmgggtkfhisddggltwhvsrngvtsprhearpphqgvrwfnnaveatvlemkdgtlwalartsqdqawqafskdygetwskpepsrffgtltmntlgrlddgtivslwtntmalpenatagngtwedvftnrdshhiamsgdegktwygfreiildehrnhpgyatldgpedrgkhqsemvqldknrilislgqhknhrrlvivdrrwvgaktratqtgkdldsqwtihtyipqkkghcsynrkpsaelvqdpsggtkkvlqikrlddpelvneksnvdyrnggatwnfpngttglvkfrfrvvdgeqaddsglqvsltdrlfnacdsttkdyalftfpirlkpaphlllgmkkvpftpgawheisllwqggqavvsldgkkagtlkmankspngasyihfistgsqpdagilldtvnarvk(信号序列加有下划线)
seqidno:10
qqkaapvpepevvatppadagrglirvdsreirhysgtrkepdylvsrdngktwemkaapagyppnyggipkespaivrnpltrefirvqpiggfvflsrggldgkwlavtndgkleedwkdpekrknlkklggimrtpvfvnkgrrvivpfhnmgggtkfhisddggltwhvsrngvtsprhearpphqgvrwfnnaveatvlemkdgtlwalartsqdqawqafskdygetwskpepsrffgtltmntlgrlddgtivslwtntmalpenatagngtwedvftnrdshhiamsgdegktwygfreiildehrnhpgyatldgpedrgkhqsemvqldknrilislgqhknhrrlvivdrrwvgaktratqtgkdldsqwtihtyipqkkghcsynrkpsaelvqdpsggtkkvlqikrlddpelvneksnvdyrnggatwnfpngttglvkfrfrvvdgeqaddsglqvsltdrlfnacdsttkdyalftfpirlkpaphlllgmkkvpftpgawheisllwqggqavvsldgkkagtlkmankspngasyihfistgsqpdagilldtvnarvk
seqidno:11
mqqkaapvpepevvatppadagrglirvdsreirhysgtrkepdylvsrdngktwemkaapagyppnyggipkespaivrnpltrefirvqpiggfvflsrggldgkwlavtndgkleedwkdpekrknlkklggimrtpvfvnkgrrvivpfhnmgggtkfhisddggltwhvsrngvtsprhearpphqgvrwfnnaveatvlemkdgtlwalartsqdqawqafskdygetwskpepsrffgtltmntlgrlddgtivslwtntmalpenatagngtwedvftnrdshhiamsgdegktwygfreiildehrnhpgyatldgpedrgkhqsemvqldknrilislgqhknhrrlvivdrrwvgaktratqtgkdldsqwtihtyipqkkghcsynrkpsaelvqdpsggtkkvlqikrlddpelvneksnvdyrnggatwnfpngttglvkfrfrvvdgeqaddsglqvsltdrlfnacdsttkdyalftfpirlkpaphlllgmkkvpftpgawheisllwqggqavvsldgkkagtlkmankspngasyihfistgsqpdagilldtvnarvkgsglehhhhhh
seqidno:12
mtwllcgrgkwnkvkrmmnsvfkclmsavcavalpafgqeektgfptdravtvfsagegnpyasiripallsigkgqllafaegrykntdqgendiimsvsknggktwsrpraiakahgatfnnpcpvydaktrtvtvvfqrypagvkerqpnipdgwddekcirnfmiqsrnggsswtkpqeitkttkrpsgvdimasgpnagtqlksgahkgrlvipmnegpfgkwvisciysddggkswklgqptanmkgmvnetsiaetdnggvvmvarhwgagncrriawsqdggetwgqvedapelfcdstqnslmtyslsdqpayggksrilfsgpsagrrikgqvamsydngktwpvkkllgeggfaysslamvepgivgvlyeenqehikklkfvpitmewltdgedtglapgkkapvlk(信号序列加有下划线)
seqidno:13
qeektgfptdravtvfsagegnpyasiripallsigkgqllafaegrykntdqgendiimsvsknggktwsrpraiakahgatfnnpcpvydaktrtvtvvfqrypagvkerqpnipdgwddekcirnfmiqsrnggsswtkpqeitkttkrpsgvdimasgpnagtqlksgahkgrlvipmnegpfgkwvisciysddggkswklgqptanmkgmvnetsiaetdnggvvmvarhwgagncrriawsqdggetwgqvedapelfcdstqnslmtyslsdqpayggksrilfsgpsagrrikgqvamsydngktwpvkkllgeggfaysslamvepgivgvlyeenqehikklkfvpitmewltdgedtglapgkkapvlk
seqidno:14
mqeektgfptdravtvfsagegnpyasiripallsigkgqllafaegrykntdqgendiimsvsknggktwsrpraiakahgatfnnpcpvydaktrtvtvvfqrypagvkerqpnipdgwddekcirnfmiqsrnggsswtkpqeitkttkrpsgvdimasgpnagtqlksgahkgrlvipmnegpfgkwvisciysddggkswklgqptanmkgmvnetsiaetdnggvvmvarhwgagncrriawsqdggetwgqvedapelfcdstqnslmtyslsdqpayggksrilfsgpsagrrikgqvamsydngktwpvkkllgeggfaysslamvepgivgvlyeenqehikklkfvpitmewltdgedtglapgkkapvlkgsglehhhhhh
seqidno:15–来自口腔链球菌的o-糖苷键
mdkrffekrckfsirkftlgvasvmigatffaaspvladqarvgstdnlpseladldkkasdeghdfdkeaaaqnpgsaettegpqteeellaqekeksekpsnlpkeledklekaedngrevdkdqlaqdtgklvpedvakttngelnygatvkiktpsgegsgivvakdlvltvshnfikdsqegnirkvvdndqgdgdiysisypglpdvkfskkdiihwdregylkgfkndlalvrlrtvlentpvevtkkpvvkkigdklhvfgypegklnpivnttvdfaepygegvqgigyqggkpgasgggifdtegklvgvhqngvvgkrsggilfspaqlkwiqdhmqgissvkpadleekekpaeekpkedkpaaakpetpkavtpewqtvankeqqgtvtireekgvrynqlsstaqndndgkpalfekqgltvdangnatvdltfkddsekgksrfgvflkfkdtknnvfvgydqggwfweyktpgnstwykgnrvaapepgsvnrlsitlksdgqlnasnndvnlfdtvtlpgavnenlknekkillkagtysndrtvvsvktdnqegvkaddtpaqketgpavddskvtydtiqskvlkavidqafprvkeytlnghtlpgqvqqfnqvfinnhritpevtykkinettaeylmklrddahlinaemtvrlqvvdnqlhfdvtkivnhnqvtpgqkidderkllstisflgnalvsvssdqagakfdgatmsnnthvsgddhidvtnpmkdlakgymygfvstdklaagvwsnsqnsygggsndwtrltayketvgnanyvgihssewqwekaykgivfpeytkelpsakvvitedanadnkvdwqdgaiayrsimnnpqgwekvkditayriamnfgsqaqnpflmtldgikkinlhtdglgqgvllkgygseghdsghlnyadigkriggvedfktliekakkygahlgihvnasetypeskyfnenilrknpdgsysygwnwldqginidaaydlahgrlarwedlkkklgegldfiyvdvwgngqsgdngawathvlakeinkqgwrfaiewghggeydstfqhwaadltyggytnkginsaitrfirnhqkdswvgdyrsyggaanypllggysmkdfegwqgrsdyngyvtnlfahdvmtkyfqhftvskwengtpvtmtdngstykwtpemkvelvdaagnkvvvtrksndvnspqyrertvtlngrviqdgsayltpwnwdangkklptekekmyyfntqagattwtlpsdwanskvylykltdqgkteeqeltvtdgkitldllanqpyvlyrskqtnpemswsegmhiydqgfnsgtlkhwtisgdaskaeivksqganemlriqgnkskvsltqkltglkpntkyavyvgvdnrsnakasitvntgekevttytnkslalnyikayahnnrrenatvddtsyfqnmyaffttgsdvsnvtltlsreagdeatyfdeirtfennssmygdkhdtgqgtfkqdfenvaqgifpfvvggvegvednrthlsekhdpytqrgwngkkvddviegnwslktnglvsrrnlvyqtipqnfrfeagktyrvtfeyeagsdntyafvvgkgefqsgrrgtqasnlemhelpntwtdskkakkvtflvtgaetgdtwvgiystgnasntrgdaggnanfrgyndfmmdnlqieeitltgkmltenalknylptvamtnytkesmdalkeavfnlsqadddisveearaeiakiealknalvqkktalvaedfesldapaqpgeglenafdgnvsslwhtswnggdvgkpatmvlkepteitglryvprasdsngnlrdvklvvtdesgkehtfnvtdwpnnnkpkdidfgktikakkivltgtktygdggdkyqsaaeliftrpqvaetpldlsgyeaalakaqkltdkdnqeevasvqasmkyatdnhlltermvayfadylnqlkdsatkpdaptsskgeeqppvldvpefkggvnateaavhevpefkggvnavqalvhelpeykgganavlaaanevpeykgganavealvnekpaytgvlatagdqaaptvekpeypltpspvadtktpgakdeeklpatgehssevalflasvsialsaavlatkrkeegsglehhhhhh
seqidno:16-e206a_正向引物
atggcgcacgcgctgggccacg
seqidno:17–e206a_反向引物
gccaccgtaccatttcgtc
seqidno:18–epo
apprlicdsrvlerylleakeaedittgcaehcsldenitvpdtkvdfyawkrmevgqqavevwqglallseavlrgqallvnssqpweplqlhvdkavsglrslttllralgaqkeaisppdaasaaplrtitadtfrklfrvysnflrgklklytgeacrtgdr
(注意:预测的带有丝氨酸的o-聚糖加有下划线;c末端精氨酸在表达过程中通常是截短的)
seqidno:20
evtvpdalkdrialkktarqlnivyflgsdtepvpdyerrlselllylqqfygkemqrhgygarsfgldikspgrvniieykaknpaahypyengggwkaaqeldeffkahpdrkksqhtliimptwndekngpdnpggvpfygmgrncfaldypafdikhlgqktregrlltkwyggmaaalghglnlphnhqtasdgkkygtalmgsgnytfgtsptfltpascalldacevfsvtpsqqfyegkpevevgdvaisfkgdqilvsgnykspqtvkalnvyiqdppyavnqdydavsfsrrlgkksgkfsmkidkkeleglnnnefrislmfilanglhmqkhftfhwdalqdyrdgsks
seqidno:21
mevtvpdalkdrialkktarqlnivyflgsdtepvpdyerrlselllylqqfygkemqrhgygarsfgldikspgrvniieykaknpaahypyengggwkaaqeldeffkahpdrkksqhtliimptwndekngpdnpggvpfygmgrncfaldypafdikhlgqktregrlltkwyggmaaalghglnlphnhqtasdgkkygtalmgsgnytfgtsptfltpascalldacevfsvtpsqqfyegkpevevgdvaisfkgdqilvsgnykspqtvkalnvyiqdppyavnqdydavsfsrrlgkksgkfsmkidkkeleglnnnefrislmfilanglhmqkhftfhwdalqdyrdgsksgsghhhhhh
seqidno:22
atggaagtcactgtgccggacgccctgaaagatcgcatcgcgctgaagaaaaccgctcgtcagctgaatatcgtctacttcctgggttctgataccgaaccggttccggactacgagcgccgtctgagcgagctgctgttgtatctgcagcaattctatggtaaagaaatgcagcgccatggctatggcgcacgcagctttggtctggacattaagtcaccgggtcgtgtgaacattatcgagtacaaagcgaagaacccggcagcgcattacccgtatgagaatggtggcggctggaaagctgcacaagaactggacgaatttttcaaggcccatccagaccgcaagaaaagccagcacaccctgatcatcatgcctacctggaatgatgagaaaaatggtcctgacaatccgggtggcgttccgttctatggtatgggtcgtaattgttttgcgttggactacccggcgtttgatatcaagcacctgggtcagaaaacgcgtgagggtcgtctgctgacgaaatggtacggtggcatggcggccgcgctgggccacggcctgaatctgccgcacaatcaccagaccgcgagcgatggcaagaaatatggcaccgccctgatgggtagcggcaactacacgttcggtaccagcccgacgttcctgaccccggcgagctgtgcgctgctggatgcctgcgaagtgttcagcgttaccccgagccaacagttttatgagggtaagccagaagtcgaggttggtgatgttgcaatttccttcaagggtgatcaaatcttggtcagcggtaactacaagagcccgcaaaccgtgaaagctctgaacgtttacattcaggatccgccgtacgccgtgaaccaagactacgatgcagtgagctttagccgtcgtctgggcaaaaagtccggtaagtttagcatgaagattgacaaaaaagaactggaaggcctgaataacaacgaattccgtatttccttgatgttcattctggcaaacggcttacacatgcagaagcactttacgtttcactgggatgcgctgcaagactaccgtgacggtagcaaatctggttcgggtcatcatcaccaccatcactga
seqidno:23
gmahalghgl(被破坏的金属蛋白酶基序)
seqidno:24
gmaaelghgl(被破坏的金属蛋白酶基序)
seqidno:25
gmaaalghgl(被破坏的金属蛋白酶基序)
seqid26
铜绿假单胞菌pao1(去除了信号序列的天然序列)
atqeeildaalvsgdssqltdshlvalrlqqqverirqtrtqlldglyqnlsqaydpgaasmwvlpanpdntlpfligdkgrvlaslsleaggrglaygtnvltqlsgtnaahapllkravqwlvngdpgaatakdfkvsvvgvdktaalnglksaglqpadaacnaltdascastskllvlgngasaaslsatvrarlqaglpilfvhtngwnqsstgqqilaglglqegpyggnywdkdrvpssrtrtrsvelggaygqdpalvqqivdgswrtdydwskctsyvgrttcddvpglsdfskrvdvlkgaldaynqkaqnlfalpgttslrlwllwadavrqnirypmdkaadtarfqetfvadaivgyvreagaaqkelgsyagqrqqsmpvsgseetltltlpsaqgftaigrmaapgkrlsiriedagqaslavglntqrigstrlwntrqydrprflkspdiklqanqsvalvspyggllqlvysgatpgqtvtvkvtgaasqpfldiqpgedssqaiadfiqaldadkadwleirsgsvevhakvekvrgsidkdyggdvqrfirelnevfiddaytlagfaipnqaktpaiqqecaargwdcdsetlhklpgtqhinvdqyaqcgggcsgnpydqtwglnprgwgeshelghnlqvnrlkvyggrsgeisnqifplhkdwrvlrefgqnlddtrvnyrnaynlivagraeadplagvykrlwedpgtyalngermafytqwvhywadlkndplqgwdiwtllylhqrqvdksdwdankaalgygtyaqrpgnsgdasstdgndnlllglswltqrdqrptfalwgirtsaaaqaqvaaygfaeqpaffyannrtneystvklldmsqgspawpfp
金属蛋白酶基序加有下划线。
seqid27
多形拟杆菌vpi-5482(去除了信号序列的天然序列)
dkwekefrirsyepysniaewadklmtkkysdldnptgisvkagddiivlvgdtygqnismqciwetgteykqtassgdvymlnpgvnkltmkgegqlfvmynteltsntakpikihiplgsgtvngffdlkehktdekyaellkksthkyfcirgekimfyfhrnklleyvpnnilsaihlwdnivgwqqelmgiddvrpsqvnnhlfaispegsymwasdyqigfvytylgnillednvmaaednawgpaheighvhqaainwasstessnnlfsnfiiyklgkyksrgnglgsvataryangqawynmgdathqnedtethmrmnwqlwiyyhrceyktdfwqtlfklmrevnmtegedpgkkqlefakmaskaanqnltdffemwgffepvnttieqygtykyyvsdamireakeymaqfpapkhafqyiedrkksefpsndyrysavgdvgyytqfkenqkitkaitaelagrkvsiqngdeavafelrendengkllyfstfttfeipssilmvnaklyavqadgkrill
金属蛋白酶基序加有下划线。
seqidno:28
产气荚膜梭菌(去除了信号序列的天然序列)
vlelemrgdsiseakkrkvwnfqdwqitglsaragdkitvyvdvaegdptptllykqsltqhggatsfqlkpgkneitipeinyesngipkdviqggdlfftnyksdsqkrapkvriegaskypvfilgksdenevmkeleayvekikaepkttpnifavssnkslefvqatyaldwykknnktpkytaeqwdqyiadamgfwgfdnskdvnsdfnfrimpmvknlsggafmnagngvigirpgnqdailaankgwgvahelghnfdtggrtivevtnnmmplffeskyktktritdqniwenntypkvglddysnnelynkadsthlaqlaplwqlylydntfygkferqfrerdfgnknrediykswvvaasdameldlteffarhgirvddkvkedlakypkpdkkiyylndlamnykgdgftenakvsvstsgsngniklsfsvddenkdnilgyeirrdgkyvgftsndsfvdtksnldedgvyvvtpydrklntlnpievn
金属蛋白酶基序加有下划线。
sedidno:29
铜绿假单胞菌pao1(n末端met,c末端接头/标签)
matqeeildaalvsgdssqltdshlvalrlqqqverirqtrtqlldglyqnlsqaydpgaasmwvlpanpdntlpfligdkgrvlaslsleaggrglaygtnvltqlsgtnaahapllkravqwlvngdpgaatakdfkvsvvgvdktaalnglksaglqpadaacnaltdascastskllvlgngasaaslsatvrarlqaglpilfvhtngwnqsstgqqilaglglqegpyggnywdkdrvpssrtrtrsvelggaygqdpalvqqivdgswrtdydwskctsyvgrttcddvpglsdfskrvdvlkgaldaynqkaqnlfalpgttslrlwllwadavrqnirypmdkaadtarfqetfvadaivgyvreagaaqkelgsyagqrqqsmpvsgseetltltlpsaqgftaigrmaapgkrlsiriedagqaslavglntqrigstrlwntrqydrprflkspdiklqanqsvalvspyggllqlvysgatpgqtvtvkvtgaasqpfldiqpgedssqaiadfiqaldadkadwleirsgsvevhakvekvrgsidkdyggdvqrfirelnevfiddaytlagfaipnqaktpaiqqecaargwdcdsetlhklpgtqhinvdqyaqcgggcsgnpydqtwglnprgwgeshelghnlqvnrlkvyggrsgeisnqifplhkdwrvlrefgqnlddtrvnyrnaynlivagraeadplagvykrlwedpgtyalngermafytqwvhywadlkndplqgwdiwtllylhqrqvdksdwdankaalgygtyaqrpgnsgdasstdgndnlllglswltqrdqrptfalwgirtsaaaqaqvaaygfaeqpaffyannrtneystvklldmsqgspawpfpgsghhhhhh
金属蛋白酶基序加有下划线。
seqidno:30
多形拟杆菌vpi-5482(n末端met,c末端接头/标签)
mdkwekefrirsyepysniaewadklmtkkysdldnptgisvkagddiivlvgdtygqnismqciwetgteykqtassgdvymlnpgvnkltmkgegqlfvmynteltsntakpikihiplgsgtvngffdlkehktdekyaellkksthkyfcirgekimfyfhrnklleyvpnnilsaihlwdnivgwqqelmgiddvrpsqvnnhlfaispegsymwasdyqigfvytylgnillednvmaaednawgpaheighvhqaainwasstessnnlfsnfiiyklgkyksrgnglgsvataryangqawynmgdathqnedtethmrmnwqlwiyyhrceyktdfwqtlfklmrevnmtegedpgkkqlefakmaskaanqnltdffemwgffepvnttieqygtykyyvsdamireakeymaqfpapkhafqyiedrkksefpsndyrysavgdvgyytqfkenqkitkaitaelagrkvsiqngdeavafelrendengkllyfstfttfeipssilmvnaklyavqadgkrillgsghhhhhh
金属蛋白酶基序加有下划线。
seqidno:31
产气荚膜梭菌(n末端met,c末端接头/标签)
mvlelemrgdsiseakkrkvwnfqdwqitglsaragdkitvyvdvaegdptptllykqsltqhggatsfqlkpgkneitipeinyesngipkdviqggdlfftnyksdsqkrapkvriegaskypvfilgksdenevmkeleayvekikaepkttpnifavssnkslefvqatyaldwykknnktpkytaeqwdqyiadamgfwgfdnskdvnsdfnfrimpmvknlsggafmnagngvigirpgnqdailaankgwgvahelghnfdtggrtivevtnnmmplffeskyktktritdqniwenntypkvglddysnnelynkadsthlaqlaplwqlylydntfygkferqfrerdfgnknrediykswvvaasdameldlteffarhgirvddkvkedlakypkpdkkiyylndlamnykgdgftenakvsvstsgsngniklsfsvddenkdnilgyeirrdgkyvgftsndsfvdtksnldedgvyvvtpydrklntlnpievngsghhhhhh
金属蛋白酶基序加有下划线。
seqidno:32铜绿假单胞菌pao1(包含信号序列的完整天然序列)
mslsttafpslqgenmsrspiprhrallagfclagalsaqaatqeeildaalvsgdssqltdshlvalrlqqqverirqtrtqlldglyqnlsqaydpgaasmwvlpanpdntlpfligdkgrvlaslsleaggrglaygtnvltqlsgtnaahapllkravqwlvngdpgaatakdfkvsvvgvdktaalnglksaglqpadaacnaltdascastskllvlgngasaaslsatvrarlqaglpilfvhtngwnqsstgqqilaglglqegpyggnywdkdrvpssrtrtrsvelggaygqdpalvqqivdgswrtdydwskctsyvgrttcddvpglsdfskrvdvlkgaldaynqkaqnlfalpgttslrlwllwadavrqnirypmdkaadtarfqetfvadaivgyvreagaaqkelgsyagqrqqsmpvsgseetltltlpsaqgftaigrmaapgkrlsiriedagqaslavglntqrigstrlwntrqydrprflkspdiklqanqsvalvspyggllqlvysgatpgqtvtvkvtgaasqpfldiqpgedssqaiadfiqaldadkadwleirsgsvevhakvekvrgsidkdyggdvqrfirelnevfiddaytlagfaipnqaktpaiqqecaargwdcdsetlhklpgtqhinvdqyaqcgggcsgnpydqtwglnprgwgeshelghnlqvnrlkvyggrsgeisnqifplhkdwrvlrefgqnlddtrvnyrnaynlivagraeadplagvykrlwedpgtyalngermafytqwvhywadlkndplqgwdiwtllylhqrqvdksdwdankaalgygtyaqrpgnsgdasstdgndnlllglswltqrdqrptfalwgirtsaaaqaqvaaygfaeqpaffyannrtneystvklldmsqgspawpfp
uniprot登录号:q9i5w4.1
金属蛋白酶基序加有下划线。
信号序列加粗且加有下划线。
seqidno:33
多形拟杆菌vpi-5482(包含信号序列和其他序列的完整天然序列)
mtikrfitnllalftlftvslackdteksiinssfsiseeyliqnldksstsvqipintsmelaqwsvsyeanwlqcskqktaaegtflritvnentgetkrtanikvtsttatytitvnqyakgevivegdikvtptggkasehqegqdientydgkfstdgaapfhtpwgqsakfpvtleyyfkgdteidyliyytrsgngnfgkvkvytttnpdrsdytlqgeydfkeqnapskvsfsegikatgikfevlsglgdfvscdemefyktntdktldkqlltvftditcteiknnvtneqiqalpdyfvriaeavrdntydkwekefrirsyepysniaewadklmtkkysdldnptgisvkagddiivlvgdtygqnismqciwetgteykqtassgdvymlnpgvnkltmkgegqlfvmynteltsntakpikihiplgsgtvngffdlkehktdekyaellkksthkyfcirgekimfyfhrnklleyvpnnilsaihlwdnivgwqqelmgiddvrpsqvnnhlfaispegsymwasdyqigfvytylgnillednvmaaednawgpaheighvhqaainwasstessnnlfsnfiiyklgkyksrgnglgsvataryangqawynmgdathqnedtethmrmnwqlwiyyhrceyktdfwqtlfklmrevnmtegedpgkkqlefakmaskaanqnltdffemwgffepvnttieqygtykyyvsdamireakeymaqfpapkhafqyiedrkksefpsndyrysavgdvgyytqfkenqkitkaitaelagrkvsiqngdeavafelrendengkllyfstfttfeipssilmvnaklyavqadgkrill
uniprot登录号:q89zx7.1
金属蛋白酶基序加有下划线。
信号序列加粗且加有下划线。
成熟蛋白质中去除的其他序列加粗且倾斜。
seqidno:34
产气荚膜梭菌(包含信号和其他序列的完整天然序列)
mnkrkiaaiilatmitnlsattidvlaqelntknnskvevshddeshqarvskfdlynsdkldaynqefqvsrsniksinnnggkynsstidkaidgnlethwetgkpndanftnevvvtfneitnidrivysarrdsargkgfakefeiyaslkdegddfnlvssgeytestrdlveikfnptdfkrlkfkfkkadqnwasaaefmfykedklnekfnglftdssmnkvseefntleklnafenelkdhpiydlykeglnnarailtetsenptkatlgqitynlnddynnqyrmpyknikaiknngrhyaaqniekaidndvntywetgtlnsssfnnevevefndlvtldrivygsrqsdlkgfaeevyiyasrtskgdtyklvatgaheatkglveakfeptefkrvkfkfkkskqnsatlnelmfykpdevyssipklftdgtmselseefnslekinafkekaknhplyndfnetielaeslisnprkedvlelemrgdsiseakkrkvwnfqdwqitglsaragdkitvyvdvaegdptptllykqsltqhggatsfqlkpgkneitipeinyesngipkdviqggdlfftnyksdsqkrapkvriegaskypvfilgksdenevmkeleayvekikaepkttpnifavssnkslefvqatyaldwykknnktpkytaeqwdqyiadamgfwgfdnskdvnsdfnfrimpmvknlsggafmnagngvigirpgnqdailaankgwgvahelghnfdtggrtivevtnnmmplffeskyktktritdqniwenntypkvglddysnnelynkadsthlaqlaplwqlylydntfygkferqfrerdfgnknrediykswvvaasdameldlteffarhgirvddkvkedlakypkpdkkiyylndlamnykgdgftenakvsvstsgsngniklsfsvddenkdnilgyeirrdgkyvgftsndsfvdtksnldedgvyvvtpydrklntlnpievnalqptlsvnpvitlalgeefneeeyivakdikgnslsesvkvkssnvntskvgeyevlysledskgneytktskvnvvsrkeymsdltpkqssngwgtvrkdksisggvigltrdgdfvdynkglglhsnaeyvydlegkdydyfesyvgvdkamssrpassvifkvlvdgeekfnsgvmrsttpqkyvkvdvknakelklivndagdgdssdhasfgdaklatlsskpiikgenlaysmdekvdlmkgitatdiedgnitskvqikssdfvegksgiftvvysvtdsdgltsecsrtiavtdketqlsdlnwksatigsgsvrkdravsgnqirllnednsvetfakgigthsyseivynsegydifdtwvgidrhvadkkvssvkfkvyvdgelkaetdvmridtpkkrlvvdvrnskeiklvvdvadngnnwdhadwadakfrnlaeydaselnkaieeakkldlnnyteessealknaiskgeeallskdketinsaleelnkemnslvkvdlnavinipdkyllksiqnqlnktgditlgdmyslttltlsgvedltglenaknletlnmdynevkdlrplsklkklntlnaqeqfiaagelkpsngkvigdskvynregknvaktirvvdkngntileqdakdeftintkdlssglygvhvlfedegfsgvmfylfnv
uniprot登录号:a0a0h2yn38.1
金属蛋白酶基序加有下划线。
信号序列加粗且加有下划线。
成熟蛋白质中去除的其他序列加粗且倾斜。
seqidno:35
铜绿假单胞菌pao1(去除信号序列的双突变体)
atqeeildaalvsgdssqltdshlvalrlqqqverirqtrtqlldglyqnlsqaydpgaasmwvlpanpdntlpfligdkgrvlaslsleaggrglaygtnvltqlsgtnaahapllkravqwlvngdpgaatakdfkvsvvgvdktaalnglksaglqpadaacnaltdascastskllvlgngasaaslsatvrarlqaglpilfvhtngwnqsstgqqilaglglqegpyggnywdkdrvpssrtrtrsvelggaygqdpalvqqivdgswrtdydwskctsyvgrttcddvpglsdfskrvdvlkgaldaynqkaqnlfalpgttslrlwllwadavrqnirypmdkaadtarfqetfvadaivgyvreagaaqkelgsyagqrqqsmpvsgseetltltlpsaqgftaigrmaapgkrlsiriedagqaslavglntqrigstrlwntrqydrprflkspdiklqanqsvalvspyggllqlvysgatpgqtvtvkvtgaasqpfldiqpgedssqaiadfiqaldadkadwleirsgsvevhakvekvrgsidkdyggdvqrfirelnevfiddaytlagfaipnqaktpaiqqecaargwdcdsetlhklpgtqhinvdqyaqcgggcsgnpydqtwglnprgwgesaalghnlqvnrlkvyggrsgeisnqifplhkdwrvlrefgqnlddtrvnyrnaynlivagraeadplagvykrlwedpgtyalngermafytqwvhywadlkndplqgwdiwtllylhqrqvdksdwdankaalgygtyaqrpgnsgdasstdgndnlllglswltqrdqrptfalwgirtsaaaqaqvaaygfaeqpaffyannrtneystvklldmsqgspawpfp
被破坏的金属蛋白酶基序加有下划线
seqidno:36
多形拟杆菌vpi-5482(去除信号序列和其他未成熟序列的双突变体)
dkwekefrirsyepysniaewadklmtkkysdldnptgisvkagddiivlvgdtygqnismqciwetgteykqtassgdvymlnpgvnkltmkgegqlfvmynteltsntakpikihiplgsgtvngffdlkehktdekyaellkksthkyfcirgekimfyfhrnklleyvpnnilsaihlwdnivgwqqelmgiddvrpsqvnnhlfaispegsymwasdyqigfvytylgnillednvmaaednawgpaaaighvhqaainwasstessnnlfsnfiiyklgkyksrgnglgsvataryangqawynmgdathqnedtethmrmnwqlwiyyhrceyktdfwqtlfklmrevnmtegedpgkkqlefakmaskaanqnltdffemwgffepvnttieqygtykyyvsdamireakeymaqfpapkhafqyiedrkksefpsndyrysavgdvgyytqfkenqkitkaitaelagrkvsiqngdeavafelrendengkllyfstfttfeipssilmvnaklyavqadgkrill
被破坏的金属蛋白酶基序加有下划线
seqidno:37
产气荚膜梭菌(去除信号序列和其他未成熟序列的双突变体)
vlelemrgdsiseakkrkvwnfqdwqitglsaragdkitvyvdvaegdptptllykqsltqhggatsfqlkpgkneitipeinyesngipkdviqggdlfftnyksdsqkrapkvriegaskypvfilgksdenevmkeleayvekikaepkttpnifavssnkslefvqatyaldwykknnktpkytaeqwdqyiadamgfwgfdnskdvnsdfnfrimpmvknlsggafmnagngvigirpgnqdailaankgwgvaaalghnfdtggrtivevtnnmmplffeskyktktritdqniwenntypkvglddysnnelynkadsthlaqlaplwqlylydntfygkferqfrerdfgnknrediykswvvaasdameldlteffarhgirvddkvkedlakypkpdkkiyylndlamnykgdgftenakvsvstsgsngniklsfsvddenkdnilgyeirrdgkyvgftsndsfvdtksnldedgvyvvtpydrklntlnpievn
被破坏的金属蛋白酶基序加有下划线
seqidno:38
铜绿假单胞菌pao1(去除信号序列并且具有n末端met、c末端接头/标签的双突变体)
matqeeildaalvsgdssqltdshlvalrlqqqverirqtrtqlldglyqnlsqaydpgaasmwvlpanpdntlpfligdkgrvlaslsleaggrglaygtnvltqlsgtnaahapllkravqwlvngdpgaatakdfkvsvvgvdktaalnglksaglqpadaacnaltdascastskllvlgngasaaslsatvrarlqaglpilfvhtngwnqsstgqqilaglglqegpyggnywdkdrvpssrtrtrsvelggaygqdpalvqqivdgswrtdydwskctsyvgrttcddvpglsdfskrvdvlkgaldaynqkaqnlfalpgttslrlwllwadavrqnirypmdkaadtarfqetfvadaivgyvreagaaqkelgsyagqrqqsmpvsgseetltltlpsaqgftaigrmaapgkrlsiriedagqaslavglntqrigstrlwntrqydrprflkspdiklqanqsvalvspyggllqlvysgatpgqtvtvkvtgaasqpfldiqpgedssqaiadfiqaldadkadwleirsgsvevhakvekvrgsidkdyggdvqrfirelnevfiddaytlagfaipnqaktpaiqqecaargwdcdsetlhklpgtqhinvdqyaqcgggcsgnpydqtwglnprgwgesaalghnlqvnrlkvyggrsgeisnqifplhkdwrvlrefgqnlddtrvnyrnaynlivagraeadplagvykrlwedpgtyalngermafytqwvhywadlkndplqgwdiwtllylhqrqvdksdwdankaalgygtyaqrpgnsgdasstdgndnlllglswltqrdqrptfalwgirtsaaaqaqvaaygfaeqpaffyannrtneystvklldmsqgspawpfpgsghhhhhh
被破坏的金属蛋白酶基序加有下划线
seqidno:39
多形拟杆菌vpi-5482(去除信号序列和来自不成熟蛋白的其他序列并且具有n末端met、c末端接头/标签的双突变体)
mdkwekefrirsyepysniaewadklmtkkysdldnptgisvkagddiivlvgdtygqnismqciwetgteykqtassgdvymlnpgvnkltmkgegqlfvmynteltsntakpikihiplgsgtvngffdlkehktdekyaellkksthkyfcirgekimfyfhrnklleyvpnnilsaihlwdnivgwqqelmgiddvrpsqvnnhlfaispegsymwasdyqigfvytylgnillednvmaaednawgpaaaighvhqaainwasstessnnlfsnfiiyklgkyksrgnglgsvataryangqawynmgdathqnedtethmrmnwqlwiyyhrceyktdfwqtlfklmrevnmtegedpgkkqlefakmaskaanqnltdffemwgffepvnttieqygtykyyvsdamireakeymaqfpapkhafqyiedrkksefpsndyrysavgdvgyytqfkenqkitkaitaelagrkvsiqngdeavafelrendengkllyfstfttfeipssilmvnaklyavqadgkrillgsghhhhhh
被破坏的金属蛋白酶基序加有下划线
seqidno:40
产气荚膜梭菌(去除信号序列和来自不成熟蛋白的其他序列并且具有n末端met、c末端接头/标签的双突变体)
mvlelemrgdsiseakkrkvwnfqdwqitglsaragdkitvyvdvaegdptptllykqsltqhggatsfqlkpgkneitipeinyesngipkdviqggdlfftnyksdsqkrapkvriegaskypvfilgksdenevmkeleayvekikaepkttpnifavssnkslefvqatyaldwykknnktpkytaeqwdqyiadamgfwgfdnskdvnsdfnfrimpmvknlsggafmnagngvigirpgnqdailaankgwgvaaalghnfdtggrtivevtnnmmplffeskyktktritdqniwenntypkvglddysnnelynkadsthlaqlaplwqlylydntfygkferqfrerdfgnknrediykswvvaasdameldlteffarhgirvddkvkedlakypkpdkkiyylndlamnykgdgftenakvsvstsgsngniklsfsvddenkdnilgyeirrdgkyvgftsndsfvdtksnldedgvyvvtpydrklntlnpievngsghhhhhh
被破坏的金属蛋白酶基序加有下划线
seqidno:41
helgh(金属蛋白酶基序)
seqidno:42
heigh(金属蛋白酶基序)
seqidno:43
gvahelghnf(金属蛋白酶基序)
seqidno:44
halgh(被破坏的金属蛋白酶基序)
seqidno:45
aelgh(被破坏的金属蛋白酶基序)
seqidno:46
aalgh(被破坏的金属蛋白酶基序)
seqidno:47
gkprpysprptshprpirv(在t上具有o糖基化位点的糖基果蝇肽)
seqidno:48
yiygsfk(非o-糖基化肽)
seqidno:49
kklvffa(非o-糖基化肽)
seqidno:50
flplilgklvkgll(非o-糖基化肽)
序列表
<110>杰诺维斯公司
<120>用于o-糖蛋白的蛋白酶和结合多肽
<130>n410795wo
<150>gb1708471.6
<151>2017-05-26
<150>gb1708476.5
<151>2017-05-26
<150>gb1806655.5
<151>2018-04-24
<160>50
<170>patentinversion3.5
<210>1
<211>361
<212>prt
<213>akkermansiamuciniphila
<400>1
gluvalthrvalproaspalaleulysaspargilealaleulyslys
151015
thralaargglnleuasnilevaltyrpheleuglyseraspthrglu
202530
provalproasptyrgluargargleusergluleuleuleutyrleu
354045
glnglnphetyrglylysglumetglnarghisglytyrglyalaarg
505560
serpheglyleuaspilelysserproglyargvalasnileileglu
65707580
tyrlysalalysasnproalaalahistyrprotyrgluasnglygly
859095
glytrplysalaalaglngluleuaspgluphephelysalahispro
100105110
asparglyslysserglnhisthrleuileilemetprothrtrpasn
115120125
aspglulysasnglyproaspasnproglyglyvalprophetyrgly
130135140
metglyargasncysphealaleuasptyrproalapheaspilelys
145150155160
hisleuglyglnlysthrarggluglyargleuleuthrlystrptyr
165170175
glyglymetalahisgluleuglyhisglyleuasnleuprohisasn
180185190
hisglnthralaseraspglylyslystyrglythralaleumetgly
195200205
serglyasntyrthrpheglythrserprothrpheleuthrproala
210215220
sercysalaleuleuaspalacysgluvalpheservalthrproser
225230235240
glnglnphetyrgluglylysprogluvalgluvalglyaspvalala
245250255
ileserphelysglyaspglnileleuvalserglyasntyrlysser
260265270
proglnthrvallysalaleuasnvaltyrileglnaspproprotyr
275280285
alavalasnglnasptyraspalavalserpheserargargleugly
290295300
lyslysserglylysphesermetlysileasplyslysgluleuglu
305310315320
glyleuasnasnasnglupheargileserleumetpheileleuala
325330335
asnglyleuhismetglnlyshisphethrphehistrpaspalaleu
340345350
glnasptyrargaspglyserlysser
355360
<210>2
<211>371
<212>prt
<213>artificialsequence
<220>
<223>ls(nterminalmethionineandac-terminallinker+his6tag)
<400>2
metgluvalthrvalproaspalaleulysaspargilealaleulys
151015
lysthralaargglnleuasnilevaltyrpheleuglyseraspthr
202530
gluprovalproasptyrgluargargleusergluleuleuleutyr
354045
leuglnglnphetyrglylysglumetglnarghisglytyrglyala
505560
argserpheglyleuaspilelysserproglyargvalasnileile
65707580
glutyrlysalalysasnproalaalahistyrprotyrgluasngly
859095
glyglytrplysalaalaglngluleuaspgluphephelysalahis
100105110
proasparglyslysserglnhisthrleuileilemetprothrtrp
115120125
asnaspglulysasnglyproaspasnproglyglyvalprophetyr
130135140
glymetglyargasncysphealaleuasptyrproalapheaspile
145150155160
lyshisleuglyglnlysthrarggluglyargleuleuthrlystrp
165170175
tyrglyglymetalahisgluleuglyhisglyleuasnleuprohis
180185190
asnhisglnthralaseraspglylyslystyrglythralaleumet
195200205
glyserglyasntyrthrpheglythrserprothrpheleuthrpro
210215220
alasercysalaleuleuaspalacysgluvalpheservalthrpro
225230235240
serglnglnphetyrgluglylysprogluvalgluvalglyaspval
245250255
alaileserphelysglyaspglnileleuvalserglyasntyrlys
260265270
serproglnthrvallysalaleuasnvaltyrileglnasppropro
275280285
tyralavalasnglnasptyraspalavalserpheserargargleu
290295300
glylyslysserglylysphesermetlysileasplyslysgluleu
305310315320
gluglyleuasnasnasnglupheargileserleumetpheileleu
325330335
alaasnglyleuhismetglnlyshisphethrphehistrpaspala
340345350
leuglnasptyrargaspglyserlysserglyserglyhishishis
355360365
hishishis
370
<210>3
<211>1116
<212>dna
<213>artificialsequence
<220>
<223>nucleotidesequenceofls
<400>3
atggaagtcactgtgccggacgccctgaaagatcgcatcgcgctgaagaaaaccgctcgt60
cagctgaatatcgtctacttcctgggttctgataccgaaccggttccggactacgagcgc120
cgtctgagcgagctgctgttgtatctgcagcaattctatggtaaagaaatgcagcgccat180
ggctatggcgcacgcagctttggtctggacattaagtcaccgggtcgtgtgaacattatc240
gagtacaaagcgaagaacccggcagcgcattacccgtatgagaatggtggcggctggaaa300
gctgcacaagaactggacgaatttttcaaggcccatccagaccgcaagaaaagccagcac360
accctgatcatcatgcctacctggaatgatgagaaaaatggtcctgacaatccgggtggc420
gttccgttctatggtatgggtcgtaattgttttgcgttggactacccggcgtttgatatc480
aagcacctgggtcagaaaacgcgtgagggtcgtctgctgacgaaatggtacggtggcatg540
gcgcacgaactgggccacggcctgaatctgccgcacaatcaccagaccgcgagcgatggc600
aagaaatatggcaccgccctgatgggtagcggcaactacacgttcggtaccagcccgacg660
ttcctgaccccggcgagctgtgcgctgctggatgcctgcgaagtgttcagcgttaccccg720
agccaacagttttatgagggtaagccagaagtcgaggttggtgatgttgcaatttccttc780
aagggtgatcaaatcttggtcagcggtaactacaagagcccgcaaaccgtgaaagctctg840
aacgtttacattcaggatccgccgtacgccgtgaaccaagactacgatgcagtgagcttt900
agccgtcgtctgggcaaaaagtccggtaagtttagcatgaagattgacaaaaaagaactg960
gaaggcctgaataacaacgaattccgtatttccttgatgttcattctggcaaacggctta1020
cacatgcagaagcactttacgtttcactgggatgcgctgcaagactaccgtgacggtagc1080
aaatctggttcgggtcatcatcaccaccatcactga1116
<210>4
<211>385
<212>prt
<213>akkermansiamuciniphila
<400>4
metleulysargleuleuseralaphepheserleuphepheleugly
151015
alaalaserglythrserphealagluvalthrvalproaspalaleu
202530
lysaspargilealaleulyslysthralaargglnleuasnileval
354045
tyrpheleuglyseraspthrgluprovalproasptyrgluargarg
505560
leusergluleuleuleutyrleuglnglnphetyrglylysglumet
65707580
glnarghisglytyrglyalaargserpheglyleuaspilelysser
859095
proglyargvalasnileileglutyrlysalalysasnproalaala
100105110
histyrprotyrgluasnglyglyglytrplysalaalaglngluleu
115120125
aspgluphephelysalahisproasparglyslysserglnhisthr
130135140
leuileilemetprothrtrpasnaspglulysasnglyproaspasn
145150155160
proglyglyvalprophetyrglymetglyargasncysphealaleu
165170175
asptyrproalapheaspilelyshisleuglyglnlysthrargglu
180185190
glyargleuleuthrlystrptyrglyglymetalahisgluleugly
195200205
hisglyleuasnleuprohisasnhisglnthralaseraspglylys
210215220
lystyrglythralaleumetglyserglyasntyrthrpheglythr
225230235240
serprothrpheleuthrproalasercysalaleuleuaspalacys
245250255
gluvalpheservalthrproserglnglnphetyrgluglylyspro
260265270
gluvalgluvalglyaspvalalaileserphelysglyaspglnile
275280285
leuvalserglyasntyrlysserproglnthrvallysalaleuasn
290295300
valtyrileglnaspproprotyralavalasnglnasptyraspala
305310315320
valserpheserargargleuglylyslysserglylysphesermet
325330335
lysileasplyslysgluleugluglyleuasnasnasngluphearg
340345350
ileserleumetpheileleualaasnglyleuhismetglnlyshis
355360365
phethrphehistrpaspalaleuglnasptyrargaspglyserlys
370375380
ser
385
<210>5
<211>361
<212>prt
<213>artificialsequence
<220>
<223>polypeptidecapableofbindingtoo-glycansbutlacksorhas
reducedo-glycoprotein-specificendoproteaseactivity
<400>5
gluvalthrvalproaspalaleulysaspargilealaleulyslys
151015
thralaargglnleuasnilevaltyrpheleuglyseraspthrglu
202530
provalproasptyrgluargargleusergluleuleuleutyrleu
354045
glnglnphetyrglylysglumetglnarghisglytyrglyalaarg
505560
serpheglyleuaspilelysserproglyargvalasnileileglu
65707580
tyrlysalalysasnproalaalahistyrprotyrgluasnglygly
859095
glytrplysalaalaglngluleuaspgluphephelysalahispro
100105110
asparglyslysserglnhisthrleuileilemetprothrtrpasn
115120125
aspglulysasnglyproaspasnproglyglyvalprophetyrgly
130135140
metglyargasncysphealaleuasptyrproalapheaspilelys
145150155160
hisleuglyglnlysthrarggluglyargleuleuthrlystrptyr
165170175
glyglymetalahisalaleuglyhisglyleuasnleuprohisasn
180185190
hisglnthralaseraspglylyslystyrglythralaleumetgly
195200205
serglyasntyrthrpheglythrserprothrpheleuthrproala
210215220
sercysalaleuleuaspalacysgluvalpheservalthrproser
225230235240
glnglnphetyrgluglylysprogluvalgluvalglyaspvalala
245250255
ileserphelysglyaspglnileleuvalserglyasntyrlysser
260265270
proglnthrvallysalaleuasnvaltyrileglnaspproprotyr
275280285
alavalasnglnasptyraspalavalserpheserargargleugly
290295300
lyslysserglylysphesermetlysileasplyslysgluleuglu
305310315320
glyleuasnasnasnglupheargileserleumetpheileleuala
325330335
asnglyleuhismetglnlyshisphethrphehistrpaspalaleu
340345350
glnasptyrargaspglyserlysser
355360
<210>6
<211>371
<212>prt
<213>artificialsequence
<220>
<223>lse206a(n-terminalmethionineandac-terminallinker+his6
tag)
<400>6
metgluvalthrvalproaspalaleulysaspargilealaleulys
151015
lysthralaargglnleuasnilevaltyrpheleuglyseraspthr
202530
gluprovalproasptyrgluargargleusergluleuleuleutyr
354045
leuglnglnphetyrglylysglumetglnarghisglytyrglyala
505560
argserpheglyleuaspilelysserproglyargvalasnileile
65707580
glutyrlysalalysasnproalaalahistyrprotyrgluasngly
859095
glyglytrplysalaalaglngluleuaspgluphephelysalahis
100105110
proasparglyslysserglnhisthrleuileilemetprothrtrp
115120125
asnaspglulysasnglyproaspasnproglyglyvalprophetyr
130135140
glymetglyargasncysphealaleuasptyrproalapheaspile
145150155160
lyshisleuglyglnlysthrarggluglyargleuleuthrlystrp
165170175
tyrglyglymetalahisalaleuglyhisglyleuasnleuprohis
180185190
asnhisglnthralaseraspglylyslystyrglythralaleumet
195200205
glyserglyasntyrthrpheglythrserprothrpheleuthrpro
210215220
alasercysalaleuleuaspalacysgluvalpheservalthrpro
225230235240
serglnglnphetyrgluglylysprogluvalgluvalglyaspval
245250255
alaileserphelysglyaspglnileleuvalserglyasntyrlys
260265270
serproglnthrvallysalaleuasnvaltyrileglnasppropro
275280285
tyralavalasnglnasptyraspalavalserpheserargargleu
290295300
glylyslysserglylysphesermetlysileasplyslysgluleu
305310315320
gluglyleuasnasnasnglupheargileserleumetpheileleu
325330335
alaasnglyleuhismetglnlyshisphethrphehistrpaspala
340345350
leuglnasptyrargaspglyserlysserglyserglyhishishis
355360365
hishishis
370
<210>7
<211>1116
<212>dna
<213>artificialsequence
<220>
<223>nucleotidesequenceencodinglse206a
<400>7
atggaagtcactgtgccggacgccctgaaagatcgcatcgcgctgaagaaaaccgctcgt60
cagctgaatatcgtctacttcctgggttctgataccgaaccggttccggactacgagcgc120
cgtctgagcgagctgctgttgtatctgcagcaattctatggtaaagaaatgcagcgccat180
ggctatggcgcacgcagctttggtctggacattaagtcaccgggtcgtgtgaacattatc240
gagtacaaagcgaagaacccggcagcgcattacccgtatgagaatggtggcggctggaaa300
gctgcacaagaactggacgaatttttcaaggcccatccagaccgcaagaaaagccagcac360
accctgatcatcatgcctacctggaatgatgagaaaaatggtcctgacaatccgggtggc420
gttccgttctatggtatgggtcgtaattgttttgcgttggactacccggcgtttgatatc480
aagcacctgggtcagaaaacgcgtgagggtcgtctgctgacgaaatggtacggtggcatg540
gcgcacgcgctgggccacggcctgaatctgccgcacaatcaccagaccgcgagcgatggc600
aagaaatatggcaccgccctgatgggtagcggcaactacacgttcggtaccagcccgacg660
ttcctgaccccggcgagctgtgcgctgctggatgcctgcgaagtgttcagcgttaccccg720
agccaacagttttatgagggtaagccagaagtcgaggttggtgatgttgcaatttccttc780
aagggtgatcaaatcttggtcagcggtaactacaagagcccgcaaaccgtgaaagctctg840
aacgtttacattcaggatccgccgtacgccgtgaaccaagactacgatgcagtgagcttt900
agccgtcgtctgggcaaaaagtccggtaagtttagcatgaagattgacaaaaaagaactg960
gaaggcctgaataacaacgaattccgtatttccttgatgttcattctggcaaacggctta1020
cacatgcagaagcactttacgtttcactgggatgcgctgcaagactaccgtgacggtagc1080
aaatctggttcgggtcatcatcaccaccatcactga1116
<210>8
<211>10
<212>prt
<213>artificialsequence
<220>
<223>metalloproteasedomainmotif
<400>8
glymetalahisgluleuglyhisglyleu
1510
<210>9
<211>595
<212>prt
<213>akkermansiamuciniphila
<400>9
metlysasnleuleuphealaleuleuthrglyserphecyscyscys
151015
tyralaglnglnlysalaalaprovalprogluprogluvalvalala
202530
thrproproalaaspalaglyargglyleuileargvalaspserarg
354045
gluilearghistyrserglythrarglysgluproasptyrleuval
505560
serargaspasnglylysthrtrpglumetlysalaalaproalagly
65707580
tyrproproasntyrglyglyileprolysgluserproalaileval
859095
argasnproleuthrargglupheileargvalglnproileglygly
100105110
phevalpheleuserargglyglyleuaspglylystrpleualaval
115120125
thrasnaspglylysleuglugluasptrplysaspproglulysarg
130135140
lysasnleulyslysleuglyglyilemetargthrprovalpheval
145150155160
asnlysglyargargvalilevalprophehisasnmetglyglygly
165170175
thrlysphehisileseraspaspglyglyleuthrtrphisvalser
180185190
argasnglyvalthrserproarghisglualaargproprohisgln
195200205
glyvalargtrppheasnasnalavalglualathrvalleuglumet
210215220
lysaspglythrleutrpalaleualaargthrserglnaspglnala
225230235240
trpglnalapheserlysasptyrglygluthrtrpserlysproglu
245250255
proserargphepheglythrleuthrmetasnthrleuglyargleu
260265270
aspaspglythrilevalserleutrpthrasnthrmetalaleupro
275280285
gluasnalathralaglyasnglythrtrpgluaspvalphethrasn
290295300
argaspserhishisilealametserglyaspgluglylysthrtrp
305310315320
tyrglyphearggluileileleuaspgluhisargasnhisprogly
325330335
tyralathrleuaspglyprogluaspargglylyshisglnserglu
340345350
metvalglnleuasplysasnargileleuileserleuglyglnhis
355360365
lysasnhisargargleuvalilevalaspargargtrpvalglyala
370375380
lysthrargalathrglnthrglylysaspleuaspserglntrpthr
385390395400
ilehisthrtyrileproglnlyslysglyhiscyssertyrasnarg
405410415
lysproseralagluleuvalglnaspproserglyglythrlyslys
420425430
valleuglnilelysargleuaspaspprogluleuvalasnglulys
435440445
serasnvalasptyrargasnglyglyalathrtrpasnpheproasn
450455460
glythrthrglyleuvallyspheargpheargvalvalaspglyglu
465470475480
glnalaaspaspserglyleuglnvalserleuthraspargleuphe
485490495
asnalacysaspserthrthrlysasptyralaleuphethrphepro
500505510
ileargleulysproalaprohisleuleuleuglymetlyslysval
515520525
prophethrproglyalatrphisgluileserleuleutrpglngly
530535540
glyglnalavalvalserleuaspglylyslysalaglythrleulys
545550555560
metalaasnlysserproasnglyalasertyrilehispheileser
565570575
thrglyserglnproaspalaglyileleuleuaspthrvalasnala
580585590
argvallys
595
<210>10
<211>577
<212>prt
<213>akkermansiamuciniphila
<400>10
glnglnlysalaalaprovalprogluprogluvalvalalathrpro
151015
proalaaspalaglyargglyleuileargvalaspserarggluile
202530
arghistyrserglythrarglysgluproasptyrleuvalserarg
354045
aspasnglylysthrtrpglumetlysalaalaproalaglytyrpro
505560
proasntyrglyglyileprolysgluserproalailevalargasn
65707580
proleuthrargglupheileargvalglnproileglyglypheval
859095
pheleuserargglyglyleuaspglylystrpleualavalthrasn
100105110
aspglylysleuglugluasptrplysaspproglulysarglysasn
115120125
leulyslysleuglyglyilemetargthrprovalphevalasnlys
130135140
glyargargvalilevalprophehisasnmetglyglyglythrlys
145150155160
phehisileseraspaspglyglyleuthrtrphisvalserargasn
165170175
glyvalthrserproarghisglualaargproprohisglnglyval
180185190
argtrppheasnasnalavalglualathrvalleuglumetlysasp
195200205
glythrleutrpalaleualaargthrserglnaspglnalatrpgln
210215220
alapheserlysasptyrglygluthrtrpserlysprogluproser
225230235240
argphepheglythrleuthrmetasnthrleuglyargleuaspasp
245250255
glythrilevalserleutrpthrasnthrmetalaleuprogluasn
260265270
alathralaglyasnglythrtrpgluaspvalphethrasnargasp
275280285
serhishisilealametserglyaspgluglylysthrtrptyrgly
290295300
phearggluileileleuaspgluhisargasnhisproglytyrala
305310315320
thrleuaspglyprogluaspargglylyshisglnserglumetval
325330335
glnleuasplysasnargileleuileserleuglyglnhislysasn
340345350
hisargargleuvalilevalaspargargtrpvalglyalalysthr
355360365
argalathrglnthrglylysaspleuaspserglntrpthrilehis
370375380
thrtyrileproglnlyslysglyhiscyssertyrasnarglyspro
385390395400
seralagluleuvalglnaspproserglyglythrlyslysvalleu
405410415
glnilelysargleuaspaspprogluleuvalasnglulysserasn
420425430
valasptyrargasnglyglyalathrtrpasnpheproasnglythr
435440445
thrglyleuvallyspheargpheargvalvalaspglygluglnala
450455460
aspaspserglyleuglnvalserleuthraspargleupheasnala
465470475480
cysaspserthrthrlysasptyralaleuphethrpheproilearg
485490495
leulysproalaprohisleuleuleuglymetlyslysvalprophe
500505510
thrproglyalatrphisgluileserleuleutrpglnglyglygln
515520525
alavalvalserleuaspglylyslysalaglythrleulysmetala
530535540
asnlysserproasnglyalasertyrilehispheileserthrgly
545550555560
serglnproaspalaglyileleuleuaspthrvalasnalaargval
565570575
lys
<210>11
<211>589
<212>prt
<213>artificialsequence
<220>
<223>am1757(n-terminalmethionineandac-terminallinker+his6tag)
<400>11
metglnglnlysalaalaprovalprogluprogluvalvalalathr
151015
proproalaaspalaglyargglyleuileargvalaspserargglu
202530
ilearghistyrserglythrarglysgluproasptyrleuvalser
354045
argaspasnglylysthrtrpglumetlysalaalaproalaglytyr
505560
proproasntyrglyglyileprolysgluserproalailevalarg
65707580
asnproleuthrargglupheileargvalglnproileglyglyphe
859095
valpheleuserargglyglyleuaspglylystrpleualavalthr
100105110
asnaspglylysleuglugluasptrplysaspproglulysarglys
115120125
asnleulyslysleuglyglyilemetargthrprovalphevalasn
130135140
lysglyargargvalilevalprophehisasnmetglyglyglythr
145150155160
lysphehisileseraspaspglyglyleuthrtrphisvalserarg
165170175
asnglyvalthrserproarghisglualaargproprohisglngly
180185190
valargtrppheasnasnalavalglualathrvalleuglumetlys
195200205
aspglythrleutrpalaleualaargthrserglnaspglnalatrp
210215220
glnalapheserlysasptyrglygluthrtrpserlysproglupro
225230235240
serargphepheglythrleuthrmetasnthrleuglyargleuasp
245250255
aspglythrilevalserleutrpthrasnthrmetalaleuproglu
260265270
asnalathralaglyasnglythrtrpgluaspvalphethrasnarg
275280285
aspserhishisilealametserglyaspgluglylysthrtrptyr
290295300
glyphearggluileileleuaspgluhisargasnhisproglytyr
305310315320
alathrleuaspglyprogluaspargglylyshisglnserglumet
325330335
valglnleuasplysasnargileleuileserleuglyglnhislys
340345350
asnhisargargleuvalilevalaspargargtrpvalglyalalys
355360365
thrargalathrglnthrglylysaspleuaspserglntrpthrile
370375380
histhrtyrileproglnlyslysglyhiscyssertyrasnarglys
385390395400
proseralagluleuvalglnaspproserglyglythrlyslysval
405410415
leuglnilelysargleuaspaspprogluleuvalasnglulysser
420425430
asnvalasptyrargasnglyglyalathrtrpasnpheproasngly
435440445
thrthrglyleuvallyspheargpheargvalvalaspglyglugln
450455460
alaaspaspserglyleuglnvalserleuthraspargleupheasn
465470475480
alacysaspserthrthrlysasptyralaleuphethrpheproile
485490495
argleulysproalaprohisleuleuleuglymetlyslysvalpro
500505510
phethrproglyalatrphisgluileserleuleutrpglnglygly
515520525
glnalavalvalserleuaspglylyslysalaglythrleulysmet
530535540
alaasnlysserproasnglyalasertyrilehispheileserthr
545550555560
glyserglnproaspalaglyileleuleuaspthrvalasnalaarg
565570575
vallysglyserglyleugluhishishishishishis
580585
<210>12
<211>419
<212>prt
<213>akkermansiamuciniphila
<400>12
metthrtrpleuleucysglyargglylystrpasnlysvallysarg
151015
metmetasnservalphelyscysleumetseralavalcysalaval
202530
alaleuproalapheglyglngluglulysthrglypheprothrasp
354045
argalavalthrvalpheseralaglygluglyasnprotyralaser
505560
ileargileproalaleuleuserileglylysglyglnleuleuala
65707580
phealagluglyargtyrlysasnthraspglnglygluasnaspile
859095
ilemetservalserlysasnglyglylysthrtrpserargproarg
100105110
alailealalysalahisglyalathrpheasnasnprocysproval
115120125
tyraspalalysthrargthrvalthrvalvalpheglnargtyrpro
130135140
alaglyvallysgluargglnproasnileproaspglytrpaspasp
145150155160
glulyscysileargasnphemetileglnserargasnglyglyser
165170175
sertrpthrlysproglngluilethrlysthrthrlysargproser
180185190
glyvalaspilemetalaserglyproasnalaglythrglnleulys
195200205
serglyalahislysglyargleuvalileprometasngluglypro
210215220
pheglylystrpvalilesercysiletyrseraspaspglyglylys
225230235240
sertrplysleuglyglnprothralaasnmetlysglymetvalasn
245250255
gluthrserilealagluthraspasnglyglyvalvalmetvalala
260265270
arghistrpglyalaglyasncysargargilealatrpserglnasp
275280285
glyglygluthrtrpglyglnvalgluaspalaprogluleuphecys
290295300
aspserthrglnasnserleumetthrtyrserleuseraspglnpro
305310315320
alatyrglyglylysserargileleupheserglyproseralagly
325330335
argargilelysglyglnvalalametsertyraspasnglylysthr
340345350
trpprovallyslysleuleuglygluglyglyphealatyrserser
355360365
leualametvalgluproglyilevalglyvalleutyrglugluasn
370375380
glngluhisilelyslysleulysphevalproilethrmetglutrp
385390395400
leuthraspglygluaspthrglyleualaproglylyslysalapro
405410415
valleulys
<210>13
<211>381
<212>prt
<213>akkermansiamuciniphila
<400>13
glngluglulysthrglypheprothraspargalavalthrvalphe
151015
seralaglygluglyasnprotyralaserileargileproalaleu
202530
leuserileglylysglyglnleuleualaphealagluglyargtyr
354045
lysasnthraspglnglygluasnaspileilemetservalserlys
505560
asnglyglylysthrtrpserargproargalailealalysalahis
65707580
glyalathrpheasnasnprocysprovaltyraspalalysthrarg
859095
thrvalthrvalvalpheglnargtyrproalaglyvallysgluarg
100105110
glnproasnileproaspglytrpaspaspglulyscysileargasn
115120125
phemetileglnserargasnglyglysersertrpthrlysprogln
130135140
gluilethrlysthrthrlysargproserglyvalaspilemetala
145150155160
serglyproasnalaglythrglnleulysserglyalahislysgly
165170175
argleuvalileprometasngluglypropheglylystrpvalile
180185190
sercysiletyrseraspaspglyglylyssertrplysleuglygln
195200205
prothralaasnmetlysglymetvalasngluthrserilealaglu
210215220
thraspasnglyglyvalvalmetvalalaarghistrpglyalagly
225230235240
asncysargargilealatrpserglnaspglyglygluthrtrpgly
245250255
glnvalgluaspalaprogluleuphecysaspserthrglnasnser
260265270
leumetthrtyrserleuseraspglnproalatyrglyglylysser
275280285
argileleupheserglyproseralaglyargargilelysglygln
290295300
valalametsertyraspasnglylysthrtrpprovallyslysleu
305310315320
leuglygluglyglyphealatyrserserleualametvalglupro
325330335
glyilevalglyvalleutyrglugluasnglngluhisilelyslys
340345350
leulysphevalproilethrmetglutrpleuthraspglygluasp
355360365
thrglyleualaproglylyslysalaprovalleulys
370375380
<210>14
<211>393
<212>prt
<213>artificialsequence
<220>
<223>am0707(includingn-terminalmethionineandac-terminallinker+
his6tag)
<400>14
metglngluglulysthrglypheprothraspargalavalthrval
151015
pheseralaglygluglyasnprotyralaserileargileproala
202530
leuleuserileglylysglyglnleuleualaphealagluglyarg
354045
tyrlysasnthraspglnglygluasnaspileilemetservalser
505560
lysasnglyglylysthrtrpserargproargalailealalysala
65707580
hisglyalathrpheasnasnprocysprovaltyraspalalysthr
859095
argthrvalthrvalvalpheglnargtyrproalaglyvallysglu
100105110
argglnproasnileproaspglytrpaspaspglulyscysilearg
115120125
asnphemetileglnserargasnglyglysersertrpthrlyspro
130135140
glngluilethrlysthrthrlysargproserglyvalaspilemet
145150155160
alaserglyproasnalaglythrglnleulysserglyalahislys
165170175
glyargleuvalileprometasngluglypropheglylystrpval
180185190
ilesercysiletyrseraspaspglyglylyssertrplysleugly
195200205
glnprothralaasnmetlysglymetvalasngluthrserileala
210215220
gluthraspasnglyglyvalvalmetvalalaarghistrpglyala
225230235240
glyasncysargargilealatrpserglnaspglyglygluthrtrp
245250255
glyglnvalgluaspalaprogluleuphecysaspserthrglnasn
260265270
serleumetthrtyrserleuseraspglnproalatyrglyglylys
275280285
serargileleupheserglyproseralaglyargargilelysgly
290295300
glnvalalametsertyraspasnglylysthrtrpprovallyslys
305310315320
leuleuglygluglyglyphealatyrserserleualametvalglu
325330335
proglyilevalglyvalleutyrglugluasnglngluhisilelys
340345350
lysleulysphevalproilethrmetglutrpleuthraspglyglu
355360365
aspthrglyleualaproglylyslysalaprovalleulysglyser
370375380
glyleugluhishishishishishis
385390
<210>15
<211>2133
<212>prt
<213>streptococcusoralis
<400>15
metasplysargphepheglulysargcyslyspheserilearglys
151015
phethrleuglyvalalaservalmetileglyalathrphepheala
202530
alaserprovalleualaaspglnalaargvalglyserthraspasn
354045
leuprosergluleualaaspleuasplyslysalaseraspglugly
505560
hisasppheasplysglualaalaalaglnasnproglyseralaglu
65707580
thrthrgluglyproglnthrgluglugluleuleualaglnglulys
859095
glulysserglulysproserasnleuprolysgluleugluasplys
100105110
leuglulysalagluaspasnglyarggluvalasplysaspglnleu
115120125
alaglnaspthrglylysleuvalprogluaspvalalalysthrthr
130135140
asnglygluleuasntyrglyalathrvallysilelysthrproser
145150155160
glygluglyserglyilevalvalalalysaspleuvalleuthrval
165170175
serhisasnpheilelysaspserglngluglyasnilearglysval
180185190
valaspasnaspglnglyaspglyaspiletyrserilesertyrpro
195200205
glyleuproaspvallyspheserlyslysaspileilehistrpasp
210215220
arggluglytyrleulysglyphelysasnaspleualaleuvalarg
225230235240
leuargthrvalleugluasnthrprovalgluvalthrlyslyspro
245250255
valvallyslysileglyasplysleuhisvalpheglytyrproglu
260265270
glylysleuasnproilevalasnthrthrvalaspphealaglupro
275280285
tyrglygluglyvalglnglyileglytyrglnglyglylysprogly
290295300
alaserglyglyglyilepheaspthrgluglylysleuvalglyval
305310315320
hisglnasnglyvalvalglylysargserglyglyileleupheser
325330335
proalaglnleulystrpileglnasphismetglnglyileserser
340345350
vallysproalaaspleugluglulysglulysproalagluglulys
355360365
prolysgluasplysproalaalaalalysprogluthrprolysala
370375380
valthrproglutrpglnthrvalalaasnlysgluglnglnglythr
385390395400
valthrilearggluglulysglyvalargtyrasnglnleuserser
405410415
thralaglnasnaspasnaspglylysproalaleupheglulysgln
420425430
glyleuthrvalaspalaasnglyasnalathrvalaspleuthrphe
435440445
lysaspaspserglulysglylysserargpheglyvalpheleulys
450455460
phelysaspthrlysasnasnvalphevalglytyraspglnglygly
465470475480
trpphetrpglutyrlysthrproglyasnserthrtrptyrlysgly
485490495
asnargvalalaalaprogluproglyservalasnargleuserile
500505510
thrleulysseraspglyglnleuasnalaserasnasnaspvalasn
515520525
leupheaspthrvalthrleuproglyalavalasngluasnleulys
530535540
asnglulyslysileleuleulysalaglythrtyrserasnasparg
545550555560
thrvalvalservallysthraspasnglngluglyvallysalaasp
565570575
aspthrproalaglnlysgluthrglyproalavalaspaspserlys
580585590
valthrtyraspthrileglnserlysvalleulysalavalileasp
595600605
glnalapheproargvallysglutyrthrleuasnglyhisthrleu
610615620
proglyglnvalglnglnpheasnglnvalpheileasnasnhisarg
625630635640
ilethrprogluvalthrtyrlyslysileasngluthrthralaglu
645650655
tyrleumetlysleuargaspaspalahisleuileasnalaglumet
660665670
thrvalargleuglnvalvalaspasnglnleuhispheaspvalthr
675680685
lysilevalasnhisasnglnvalthrproglyglnlysileaspasp
690695700
gluarglysleuleuserthrileserpheleuglyasnalaleuval
705710715720
servalserseraspglnalaglyalalyspheaspglyalathrmet
725730735
serasnasnthrhisvalserglyaspasphisileaspvalthrasn
740745750
prometlysaspleualalysglytyrmettyrglyphevalserthr
755760765
asplysleualaalaglyvaltrpserasnserglnasnsertyrgly
770775780
glyglyserasnasptrpthrargleuthralatyrlysgluthrval
785790795800
glyasnalaasntyrvalglyilehisserserglutrpglntrpglu
805810815
lysalatyrlysglyilevalpheproglutyrthrlysgluleupro
820825830
seralalysvalvalilethrgluaspalaasnalaaspasnlysval
835840845
asptrpglnaspglyalailealatyrargserilemetasnasnpro
850855860
glnglytrpglulysvallysaspilethralatyrargilealamet
865870875880
asnpheglyserglnalaglnasnpropheleumetthrleuaspgly
885890895
ilelyslysileasnleuhisthraspglyleuglyglnglyvalleu
900905910
leulysglytyrglysergluglyhisaspserglyhisleuasntyr
915920925
alaaspileglylysargileglyglyvalgluaspphelysthrleu
930935940
ileglulysalalyslystyrglyalahisleuglyilehisvalasn
945950955960
alasergluthrtyrprogluserlystyrpheasngluasnileleu
965970975
arglysasnproaspglysertyrsertyrglytrpasntrpleuasp
980985990
glnglyileasnileaspalaalatyraspleualahisglyargleu
99510001005
alaargtrpgluaspleulyslyslysleuglygluglyleuasp
101010151020
pheiletyrvalaspvaltrpglyasnglyglnserglyaspasn
102510301035
glyalatrpalathrhisvalleualalysgluileasnlysgln
104010451050
glytrpargphealaileglutrpglyhisglyglyglutyrasp
105510601065
serthrpheglnhistrpalaalaaspleuthrtyrglyglytyr
107010751080
thrasnlysglyileasnseralailethrargpheileargasn
108510901095
hisglnlysaspsertrpvalglyasptyrargsertyrglygly
110011051110
alaalaasntyrproleuleuglyglytyrsermetlysaspphe
111511201125
gluglytrpglnglyargserasptyrasnglytyrvalthrasn
113011351140
leuphealahisaspvalmetthrlystyrpheglnhisphethr
114511501155
valserlystrpgluasnglythrprovalthrmetthraspasn
116011651170
glyserthrtyrlystrpthrproglumetlysvalgluleuval
117511801185
aspalaalaglyasnlysvalvalvalthrarglysserasnasp
119011951200
valasnserproglntyrarggluargthrvalthrleuasngly
120512101215
argvalileglnaspglyseralatyrleuthrprotrpasntrp
122012251230
aspalaasnglylyslysleuprothrglulysglulysmettyr
123512401245
tyrpheasnthrglnalaglyalathrthrtrpthrleuproser
125012551260
asptrpalaasnserlysvaltyrleutyrlysleuthraspgln
126512701275
glylysthrglugluglngluleuthrvalthraspglylysile
128012851290
thrleuaspleuleualaasnglnprotyrvalleutyrargser
129513001305
lysglnthrasnproglumetsertrpsergluglymethisile
131013151320
tyraspglnglypheasnserglythrleulyshistrpthrile
132513301335
serglyaspalaserlysalagluilevallysserglnglyala
134013451350
asnglumetleuargileglnglyasnlysserlysvalserleu
135513601365
thrglnlysleuthrglyleulysproasnthrlystyralaval
137013751380
tyrvalglyvalaspasnargserasnalalysalaserilethr
138513901395
valasnthrglyglulysgluvalthrthrtyrthrasnlysser
140014051410
leualaleuasntyrilelysalatyralahisasnasnargarg
141514201425
gluasnalathrvalaspaspthrsertyrpheglnasnmettyr
143014351440
alaphephethrthrglyseraspvalserasnvalthrleuthr
144514501455
leuserargglualaglyaspglualathrtyrpheaspgluile
146014651470
argthrphegluasnasnsersermettyrglyasplyshisasp
147514801485
thrglyglnglythrphelysglnaspphegluasnvalalagln
149014951500
glyilepheprophevalvalglyglyvalgluglyvalgluasp
150515101515
asnargthrhisleuserglulyshisaspprotyrthrglnarg
152015251530
glytrpasnglylyslysvalaspaspvalilegluglyasntrp
153515401545
serleulysthrasnglyleuvalserargargasnleuvaltyr
155015551560
glnthrileproglnasnpheargpheglualaglylysthrtyr
156515701575
argvalthrpheglutyrglualaglyseraspasnthrtyrala
158015851590
phevalvalglylysglyglupheglnserglyargargglythr
159516001605
glnalaserasnleuglumethisgluleuproasnthrtrpthr
161016151620
aspserlyslysalalyslysvalthrpheleuvalthrglyala
162516301635
gluthrglyaspthrtrpvalglyiletyrserthrglyasnala
164016451650
serasnthrargglyaspalaglyglyasnalaasnphearggly
165516601665
tyrasnaspphemetmetaspasnleuglnileglugluilethr
167016751680
leuthrglylysmetleuthrgluasnalaleulysasntyrleu
168516901695
prothrvalalametthrasntyrthrlysglusermetaspala
170017051710
leulysglualavalpheasnleuserglnalaaspaspaspile
171517201725
servalgluglualaargalagluilealalysileglualaleu
173017351740
lysasnalaleuvalglnlyslysthralaleuvalalagluasp
174517501755
phegluserleuaspalaproalaglnproglygluglyleuglu
176017651770
asnalapheaspglyasnvalserserleutrphisthrsertrp
177517801785
asnglyglyaspvalglylysproalathrmetvalleulysglu
179017951800
prothrgluilethrglyleuargtyrvalproargalaserasp
180518101815
serasnglyasnleuargaspvallysleuvalvalthraspglu
182018251830
serglylysgluhisthrpheasnvalthrasptrpproasnasn
183518401845
asnlysprolysaspileasppheglylysthrilelysalalys
185018551860
lysilevalleuthrglythrlysthrtyrglyaspglyglyasp
186518701875
lystyrglnseralaalagluleuilephethrargproglnval
188018851890
alagluthrproleuaspleuserglytyrglualaalaleuala
189519001905
lysalaglnlysleuthrasplysaspasnglnglugluvalala
191019151920
servalglnalasermetlystyralathraspasnhisleuleu
192519301935
thrgluargmetvalalatyrphealaasptyrleuasnglnleu
194019451950
lysaspseralathrlysproaspalaprothrserserlysgly
195519601965
glugluglnproprovalleuaspvalprogluphelysglygly
197019751980
valasnalathrglualaalavalhisgluvalprogluphelys
198519901995
glyglyvalasnalavalglnalaleuvalhisgluleuproglu
200020052010
tyrlysglyglyalaasnalavalleualaalaalaasngluval
201520202025
proglutyrlysglyglyalaasnalavalglualaleuvalasn
203020352040
glulysproalatyrthrglyvalleualathralaglyaspgln
204520502055
alaalaprothrvalglulysproglutyrproleuthrproser
206020652070
provalalaaspthrlysthrproglyalalysaspgluglulys
207520802085
leuproalathrglygluhissersergluvalalaleupheleu
209020952100
alaservalserilealaleuseralaalavalleualathrlys
210521102115
arglysglugluglyserglyleugluhishishishishishis
212021252130
<210>16
<211>22
<212>dna
<213>artificialsequence
<220>
<223>e206aforwardprimer
<400>16
atggcgcacgcgctgggccacg22
<210>17
<211>19
<212>dna
<213>artificialsequence
<220>
<223>e206areverseprimer
<400>17
gccaccgtaccatttcgtc19
<210>18
<211>166
<212>prt
<213>artificialsequence
<220>
<223>epo
<400>18
alaproproargleuilecysaspserargvalleugluargtyrleu
151015
leuglualalysglualagluaspilethrthrglycysalagluhis
202530
cysserleuaspgluasnilethrvalproaspthrlysvalaspphe
354045
tyralatrplysargmetgluvalglyglnglnalavalgluvaltrp
505560
glnglyleualaleuleuserglualavalleuargglyglnalaleu
65707580
leuvalasnserserglnprotrpgluproleuglnleuhisvalasp
859095
lysalavalserglyleuargserleuthrthrleuleuargalaleu
100105110
glyalaglnlysglualaileserproproaspalaalaseralaala
115120125
proleuargthrilethralaaspthrphearglysleupheargval
130135140
tyrserasnpheleuargglylysleulysleutyrthrglygluala
145150155160
cysargthrglyasparg
165
<210>19
<400>19
000
<210>20
<211>361
<212>prt
<213>artificialsequence
<220>
<223>polypeptidecapableofbindingtoo-glycansbutlacksorhas
reducedo-glycoprotein-specificendoproteaseactivity
<400>20
gluvalthrvalproaspalaleulysaspargilealaleulyslys
151015
thralaargglnleuasnilevaltyrpheleuglyseraspthrglu
202530
provalproasptyrgluargargleusergluleuleuleutyrleu
354045
glnglnphetyrglylysglumetglnarghisglytyrglyalaarg
505560
serpheglyleuaspilelysserproglyargvalasnileileglu
65707580
tyrlysalalysasnproalaalahistyrprotyrgluasnglygly
859095
glytrplysalaalaglngluleuaspgluphephelysalahispro
100105110
asparglyslysserglnhisthrleuileilemetprothrtrpasn
115120125
aspglulysasnglyproaspasnproglyglyvalprophetyrgly
130135140
metglyargasncysphealaleuasptyrproalapheaspilelys
145150155160
hisleuglyglnlysthrarggluglyargleuleuthrlystrptyr
165170175
glyglymetalaalaalaleuglyhisglyleuasnleuprohisasn
180185190
hisglnthralaseraspglylyslystyrglythralaleumetgly
195200205
serglyasntyrthrpheglythrserprothrpheleuthrproala
210215220
sercysalaleuleuaspalacysgluvalpheservalthrproser
225230235240
glnglnphetyrgluglylysprogluvalgluvalglyaspvalala
245250255
ileserphelysglyaspglnileleuvalserglyasntyrlysser
260265270
proglnthrvallysalaleuasnvaltyrileglnaspproprotyr
275280285
alavalasnglnasptyraspalavalserpheserargargleugly
290295300
lyslysserglylysphesermetlysileasplyslysgluleuglu
305310315320
glyleuasnasnasnglupheargileserleumetpheileleuala
325330335
asnglyleuhismetglnlyshisphethrphehistrpaspalaleu
340345350
glnasptyrargaspglyserlysser
355360
<210>21
<211>371
<212>prt
<213>artificialsequence
<220>
<223>lshe206aaorlsh205a/e206a(includingn-terminalmethionine
andc-terminallinker)
<400>21
metgluvalthrvalproaspalaleulysaspargilealaleulys
151015
lysthralaargglnleuasnilevaltyrpheleuglyseraspthr
202530
gluprovalproasptyrgluargargleusergluleuleuleutyr
354045
leuglnglnphetyrglylysglumetglnarghisglytyrglyala
505560
argserpheglyleuaspilelysserproglyargvalasnileile
65707580
glutyrlysalalysasnproalaalahistyrprotyrgluasngly
859095
glyglytrplysalaalaglngluleuaspgluphephelysalahis
100105110
proasparglyslysserglnhisthrleuileilemetprothrtrp
115120125
asnaspglulysasnglyproaspasnproglyglyvalprophetyr
130135140
glymetglyargasncysphealaleuasptyrproalapheaspile
145150155160
lyshisleuglyglnlysthrarggluglyargleuleuthrlystrp
165170175
tyrglyglymetalaalaalaleuglyhisglyleuasnleuprohis
180185190
asnhisglnthralaseraspglylyslystyrglythralaleumet
195200205
glyserglyasntyrthrpheglythrserprothrpheleuthrpro
210215220
alasercysalaleuleuaspalacysgluvalpheservalthrpro
225230235240
serglnglnphetyrgluglylysprogluvalgluvalglyaspval
245250255
alaileserphelysglyaspglnileleuvalserglyasntyrlys
260265270
serproglnthrvallysalaleuasnvaltyrileglnasppropro
275280285
tyralavalasnglnasptyraspalavalserpheserargargleu
290295300
glylyslysserglylysphesermetlysileasplyslysgluleu
305310315320
gluglyleuasnasnasnglupheargileserleumetpheileleu
325330335
alaasnglyleuhismetglnlyshisphethrphehistrpaspala
340345350
leuglnasptyrargaspglyserlysserglyserglyhishishis
355360365
hishishis
370
<210>22
<211>1116
<212>dna
<213>artificialsequence
<220>
<223>nucleotidesequenceencodinglshe206aaorlsh205a/e206a
<400>22
atggaagtcactgtgccggacgccctgaaagatcgcatcgcgctgaagaaaaccgctcgt60
cagctgaatatcgtctacttcctgggttctgataccgaaccggttccggactacgagcgc120
cgtctgagcgagctgctgttgtatctgcagcaattctatggtaaagaaatgcagcgccat180
ggctatggcgcacgcagctttggtctggacattaagtcaccgggtcgtgtgaacattatc240
gagtacaaagcgaagaacccggcagcgcattacccgtatgagaatggtggcggctggaaa300
gctgcacaagaactggacgaatttttcaaggcccatccagaccgcaagaaaagccagcac360
accctgatcatcatgcctacctggaatgatgagaaaaatggtcctgacaatccgggtggc420
gttccgttctatggtatgggtcgtaattgttttgcgttggactacccggcgtttgatatc480
aagcacctgggtcagaaaacgcgtgagggtcgtctgctgacgaaatggtacggtggcatg540
gcggccgcgctgggccacggcctgaatctgccgcacaatcaccagaccgcgagcgatggc600
aagaaatatggcaccgccctgatgggtagcggcaactacacgttcggtaccagcccgacg660
ttcctgaccccggcgagctgtgcgctgctggatgcctgcgaagtgttcagcgttaccccg720
agccaacagttttatgagggtaagccagaagtcgaggttggtgatgttgcaatttccttc780
aagggtgatcaaatcttggtcagcggtaactacaagagcccgcaaaccgtgaaagctctg840
aacgtttacattcaggatccgccgtacgccgtgaaccaagactacgatgcagtgagcttt900
agccgtcgtctgggcaaaaagtccggtaagtttagcatgaagattgacaaaaaagaactg960
gaaggcctgaataacaacgaattccgtatttccttgatgttcattctggcaaacggctta1020
cacatgcagaagcactttacgtttcactgggatgcgctgcaagactaccgtgacggtagc1080
aaatctggttcgggtcatcatcaccaccatcactga1116
<210>23
<211>10
<212>prt
<213>artificialsequence
<220>
<223>disruptedmetalloproteasemotif
<400>23
glymetalahisalaleuglyhisglyleu
1510
<210>24
<211>10
<212>prt
<213>artificialsequence
<220>
<223>disruptedmetalloproteasemotif
<400>24
glymetalaalagluleuglyhisglyleu
1510
<210>25
<211>10
<212>prt
<213>artificialsequence
<220>
<223>disruptedmetalloproteasemotif
<400>25
glymetalaalaalaleuglyhisglyleu
1510
<210>26
<211>882
<212>prt
<213>pseudomonasaeruginosa
<400>26
alathrglnglugluileleuaspalaalaleuvalserglyaspser
151015
serglnleuthraspserhisleuvalalaleuargleuglnglngln
202530
valgluargileargglnthrargthrglnleuleuaspglyleutyr
354045
glnasnleuserglnalatyraspproglyalaalasermettrpval
505560
leuproalaasnproaspasnthrleupropheleuileglyasplys
65707580
glyargvalleualaserleuserleuglualaglyglyargglyleu
859095
alatyrglythrasnvalleuthrglnleuserglythrasnalaala
100105110
hisalaproleuleulysargalavalglntrpleuvalasnglyasp
115120125
proglyalaalathralalysaspphelysvalservalvalglyval
130135140
asplysthralaalaleuasnglyleulysseralaglyleuglnpro
145150155160
alaaspalaalacysasnalaleuthraspalasercysalaserthr
165170175
serlysleuleuvalleuglyasnglyalaseralaalaserleuser
180185190
alathrvalargalaargleuglnalaglyleuproileleupheval
195200205
histhrasnglytrpasnglnserserthrglyglnglnileleuala
210215220
glyleuglyleuglngluglyprotyrglyglyasntyrtrpasplys
225230235240
aspargvalproserserargthrargthrargservalgluleugly
245250255
glyalatyrglyglnaspproalaleuvalglnglnilevalaspgly
260265270
sertrpargthrasptyrasptrpserlyscysthrsertyrvalgly
275280285
argthrthrcysaspaspvalproglyleuserasppheserlysarg
290295300
valaspvalleulysglyalaleuaspalatyrasnglnlysalagln
305310315320
asnleuphealaleuproglythrthrserleuargleutrpleuleu
325330335
trpalaaspalavalargglnasnileargtyrprometasplysala
340345350
alaaspthralaargpheglngluthrphevalalaaspalaileval
355360365
glytyrvalargglualaglyalaalaglnlysgluleuglysertyr
370375380
alaglyglnargglnglnsermetprovalserglyserglugluthr
385390395400
leuthrleuthrleuproseralaglnglyphethralaileglyarg
405410415
metalaalaproglylysargleuserileargilegluaspalagly
420425430
glnalaserleualavalglyleuasnthrglnargileglyserthr
435440445
argleutrpasnthrargglntyraspargproargpheleulysser
450455460
proaspilelysleuglnalaasnglnservalalaleuvalserpro
465470475480
tyrglyglyleuleuglnleuvaltyrserglyalathrproglygln
485490495
thrvalthrvallysvalthrglyalaalaserglnpropheleuasp
500505510
ileglnproglygluaspserserglnalailealaasppheilegln
515520525
alaleuaspalaasplysalaasptrpleugluileargserglyser
530535540
valgluvalhisalalysvalglulysvalargglyserileasplys
545550555560
asptyrglyglyaspvalglnargpheilearggluleuasngluval
565570575
pheileaspaspalatyrthrleualaglyphealaileproasngln
580585590
alalysthrproalaileglnglnglucysalaalaargglytrpasp
595600605
cysaspsergluthrleuhislysleuproglythrglnhisileasn
610615620
valaspglntyralaglncysglyglyglycysserglyasnprotyr
625630635640
aspglnthrtrpglyleuasnproargglytrpglygluserhisglu
645650655
leuglyhisasnleuglnvalasnargleulysvaltyrglyglyarg
660665670
serglygluileserasnglnilepheproleuhislysasptrparg
675680685
valleuargglupheglyglnasnleuaspaspthrargvalasntyr
690695700
argasnalatyrasnleuilevalalaglyargalaglualaasppro
705710715720
leualaglyvaltyrlysargleutrpgluaspproglythrtyrala
725730735
leuasnglygluargmetalaphetyrthrglntrpvalhistyrtrp
740745750
alaaspleulysasnaspproleuglnglytrpaspiletrpthrleu
755760765
leutyrleuhisglnargglnvalasplysserasptrpaspalaasn
770775780
lysalaalaleuglytyrglythrtyralaglnargproglyasnser
785790795800
glyaspalaserserthraspglyasnaspasnleuleuleuglyleu
805810815
sertrpleuthrglnargaspglnargprothrphealaleutrpgly
820825830
ileargthrseralaalaalaglnalaglnvalalaalatyrglyphe
835840845
alagluglnproalaphephetyralaasnasnargthrasnglutyr
850855860
serthrvallysleuleuaspmetserglnglyserproalatrppro
865870875880
phepro
<210>27
<211>536
<212>prt
<213>bacteroidesthetaiotaomicron
<400>27
asplystrpglulysglupheargileargsertyrgluprotyrser
151015
asnilealaglutrpalaasplysleumetthrlyslystyrserasp
202530
leuaspasnprothrglyileservallysalaglyaspaspileile
354045
valleuvalglyaspthrtyrglyglnasnilesermetglncysile
505560
trpgluthrglythrglutyrlysglnthralaserserglyaspval
65707580
tyrmetleuasnproglyvalasnlysleuthrmetlysglyglugly
859095
glnleuphevalmettyrasnthrgluleuthrserasnthralalys
100105110
proilelysilehisileproleuglyserglythrvalasnglyphe
115120125
pheaspleulysgluhislysthraspglulystyralagluleuleu
130135140
lyslysserthrhislystyrphecysileargglyglulysilemet
145150155160
phetyrphehisargasnlysleuleuglutyrvalproasnasnile
165170175
leuseralailehisleutrpaspasnilevalglytrpglnglnglu
180185190
leumetglyileaspaspvalargproserglnvalasnasnhisleu
195200205
phealaileserprogluglysertyrmettrpalaserasptyrgln
210215220
ileglyphevaltyrthrtyrleuglyasnileleuleugluaspasn
225230235240
valmetalaalagluaspasnalatrpglyproalahisgluilegly
245250255
hisvalhisglnalaalaileasntrpalaserserthrgluserser
260265270
asnasnleupheserasnpheileiletyrlysleuglylystyrlys
275280285
serargglyasnglyleuglyservalalathralaargtyralaasn
290295300
glyglnalatrptyrasnmetglyaspalathrhisglnasngluasp
305310315320
thrgluthrhismetargmetasntrpglnleutrpiletyrtyrhis
325330335
argcysglutyrlysthraspphetrpglnthrleuphelysleumet
340345350
arggluvalasnmetthrgluglygluaspproglylyslysglnleu
355360365
gluphealalysmetalaserlysalaalaasnglnasnleuthrasp
370375380
phepheglumettrpglyphephegluprovalasnthrthrileglu
385390395400
glntyrglythrtyrlystyrtyrvalseraspalametileargglu
405410415
alalysglutyrmetalaglnpheproalaprolyshisalaphegln
420425430
tyrilegluasparglyslysserglupheproserasnasptyrarg
435440445
tyrseralavalglyaspvalglytyrtyrthrglnphelysgluasn
450455460
glnlysilethrlysalailethralagluleualaglyarglysval
465470475480
serileglnasnglyaspglualavalalaphegluleuarggluasn
485490495
aspgluasnglylysleuleutyrpheserthrphethrthrpheglu
500505510
ileproserserileleumetvalasnalalysleutyralavalgln
515520525
alaaspglylysargileleuleu
530535
<210>28
<211>507
<212>prt
<213>clostridiumperfringens
<400>28
valleugluleuglumetargglyaspserileserglualalyslys
151015
arglysvaltrpasnpheglnasptrpglnilethrglyleuserala
202530
argalaglyasplysilethrvaltyrvalaspvalalagluglyasp
354045
prothrprothrleuleutyrlysglnserleuthrglnhisglygly
505560
alathrserpheglnleulysproglylysasngluilethrilepro
65707580
gluileasntyrgluserasnglyileprolysaspvalileglngly
859095
glyaspleuphephethrasntyrlysseraspserglnlysargala
100105110
prolysvalargilegluglyalaserlystyrprovalpheileleu
115120125
glylysseraspgluasngluvalmetlysgluleuglualatyrval
130135140
glulysilelysalagluprolysthrthrproasnilephealaval
145150155160
serserasnlysserleugluphevalglnalathrtyralaleuasp
165170175
trptyrlyslysasnasnlysthrprolystyrthralagluglntrp
180185190
aspglntyrilealaaspalametglyphetrpglypheaspasnser
195200205
lysaspvalasnserasppheasnpheargilemetprometvallys
210215220
asnleuserglyglyalaphemetasnalaglyasnglyvalilegly
225230235240
ileargproglyasnglnaspalaileleualaalaasnlysglytrp
245250255
glyvalalahisgluleuglyhisasnpheaspthrglyglyargthr
260265270
ilevalgluvalthrasnasnmetmetproleuphephegluserlys
275280285
tyrlysthrlysthrargilethraspglnasniletrpgluasnasn
290295300
thrtyrprolysvalglyleuaspasptyrserasnasngluleutyr
305310315320
asnlysalaaspserthrhisleualaglnleualaproleutrpgln
325330335
leutyrleutyraspasnthrphetyrglylysphegluargglnphe
340345350
arggluargasppheglyasnlysasnarggluaspiletyrlysser
355360365
trpvalvalalaalaseraspalametgluleuaspleuthrgluphe
370375380
phealaarghisglyileargvalaspasplysvallysgluaspleu
385390395400
alalystyrprolysproasplyslysiletyrtyrleuasnaspleu
405410415
alametasntyrlysglyaspglyphethrgluasnalalysvalser
420425430
valserthrserglyserasnglyasnilelysleuserpheserval
435440445
aspaspgluasnlysaspasnileleuglytyrgluileargargasp
450455460
glylystyrvalglyphethrserasnaspserphevalaspthrlys
465470475480
serasnleuaspgluaspglyvaltyrvalvalthrprotyrasparg
485490495
lysleuasnthrleuasnproilegluvalasn
500505
<210>29
<211>892
<212>prt
<213>artificialsequence
<220>
<223>polypeptidehavingo-glycoprotein-specificendoproteaseactivity
(includingn-terminalmethionineandac-terminallinker+his6
tag)
<400>29
metalathrglnglugluileleuaspalaalaleuvalserglyasp
151015
serserglnleuthraspserhisleuvalalaleuargleuglngln
202530
glnvalgluargileargglnthrargthrglnleuleuaspglyleu
354045
tyrglnasnleuserglnalatyraspproglyalaalasermettrp
505560
valleuproalaasnproaspasnthrleupropheleuileglyasp
65707580
lysglyargvalleualaserleuserleuglualaglyglyarggly
859095
leualatyrglythrasnvalleuthrglnleuserglythrasnala
100105110
alahisalaproleuleulysargalavalglntrpleuvalasngly
115120125
aspproglyalaalathralalysaspphelysvalservalvalgly
130135140
valasplysthralaalaleuasnglyleulysseralaglyleugln
145150155160
proalaaspalaalacysasnalaleuthraspalasercysalaser
165170175
thrserlysleuleuvalleuglyasnglyalaseralaalaserleu
180185190
seralathrvalargalaargleuglnalaglyleuproileleuphe
195200205
valhisthrasnglytrpasnglnserserthrglyglnglnileleu
210215220
alaglyleuglyleuglngluglyprotyrglyglyasntyrtrpasp
225230235240
lysaspargvalproserserargthrargthrargservalgluleu
245250255
glyglyalatyrglyglnaspproalaleuvalglnglnilevalasp
260265270
glysertrpargthrasptyrasptrpserlyscysthrsertyrval
275280285
glyargthrthrcysaspaspvalproglyleuserasppheserlys
290295300
argvalaspvalleulysglyalaleuaspalatyrasnglnlysala
305310315320
glnasnleuphealaleuproglythrthrserleuargleutrpleu
325330335
leutrpalaaspalavalargglnasnileargtyrprometasplys
340345350
alaalaaspthralaargpheglngluthrphevalalaaspalaile
355360365
valglytyrvalargglualaglyalaalaglnlysgluleuglyser
370375380
tyralaglyglnargglnglnsermetprovalserglysergluglu
385390395400
thrleuthrleuthrleuproseralaglnglyphethralailegly
405410415
argmetalaalaproglylysargleuserileargilegluaspala
420425430
glyglnalaserleualavalglyleuasnthrglnargileglyser
435440445
thrargleutrpasnthrargglntyraspargproargpheleulys
450455460
serproaspilelysleuglnalaasnglnservalalaleuvalser
465470475480
protyrglyglyleuleuglnleuvaltyrserglyalathrprogly
485490495
glnthrvalthrvallysvalthrglyalaalaserglnpropheleu
500505510
aspileglnproglygluaspserserglnalailealaasppheile
515520525
glnalaleuaspalaasplysalaasptrpleugluileargsergly
530535540
servalgluvalhisalalysvalglulysvalargglyserileasp
545550555560
lysasptyrglyglyaspvalglnargpheilearggluleuasnglu
565570575
valpheileaspaspalatyrthrleualaglyphealaileproasn
580585590
glnalalysthrproalaileglnglnglucysalaalaargglytrp
595600605
aspcysaspsergluthrleuhislysleuproglythrglnhisile
610615620
asnvalaspglntyralaglncysglyglyglycysserglyasnpro
625630635640
tyraspglnthrtrpglyleuasnproargglytrpglygluserhis
645650655
gluleuglyhisasnleuglnvalasnargleulysvaltyrglygly
660665670
argserglygluileserasnglnilepheproleuhislysasptrp
675680685
argvalleuargglupheglyglnasnleuaspaspthrargvalasn
690695700
tyrargasnalatyrasnleuilevalalaglyargalaglualaasp
705710715720
proleualaglyvaltyrlysargleutrpgluaspproglythrtyr
725730735
alaleuasnglygluargmetalaphetyrthrglntrpvalhistyr
740745750
trpalaaspleulysasnaspproleuglnglytrpaspiletrpthr
755760765
leuleutyrleuhisglnargglnvalasplysserasptrpaspala
770775780
asnlysalaalaleuglytyrglythrtyralaglnargproglyasn
785790795800
serglyaspalaserserthraspglyasnaspasnleuleuleugly
805810815
leusertrpleuthrglnargaspglnargprothrphealaleutrp
820825830
glyileargthrseralaalaalaglnalaglnvalalaalatyrgly
835840845
phealagluglnproalaphephetyralaasnasnargthrasnglu
850855860
tyrserthrvallysleuleuaspmetserglnglyserproalatrp
865870875880
propheproglyserglyhishishishishishis
885890
<210>30
<211>546
<212>prt
<213>artificialsequence
<220>
<223>polypeptidehavingo-glycoprotein-specificendoproteaseactivity
(includingn-terminalmethionineandac-terminallinker+his6
tag)
<400>30
metasplystrpglulysglupheargileargsertyrgluprotyr
151015
serasnilealaglutrpalaasplysleumetthrlyslystyrser
202530
aspleuaspasnprothrglyileservallysalaglyaspaspile
354045
ilevalleuvalglyaspthrtyrglyglnasnilesermetglncys
505560
iletrpgluthrglythrglutyrlysglnthralaserserglyasp
65707580
valtyrmetleuasnproglyvalasnlysleuthrmetlysglyglu
859095
glyglnleuphevalmettyrasnthrgluleuthrserasnthrala
100105110
lysproilelysilehisileproleuglyserglythrvalasngly
115120125
phepheaspleulysgluhislysthraspglulystyralagluleu
130135140
leulyslysserthrhislystyrphecysileargglyglulysile
145150155160
metphetyrphehisargasnlysleuleuglutyrvalproasnasn
165170175
ileleuseralailehisleutrpaspasnilevalglytrpglngln
180185190
gluleumetglyileaspaspvalargproserglnvalasnasnhis
195200205
leuphealaileserprogluglysertyrmettrpalaserasptyr
210215220
glnileglyphevaltyrthrtyrleuglyasnileleuleugluasp
225230235240
asnvalmetalaalagluaspasnalatrpglyproalahisgluile
245250255
glyhisvalhisglnalaalaileasntrpalaserserthrgluser
260265270
serasnasnleupheserasnpheileiletyrlysleuglylystyr
275280285
lysserargglyasnglyleuglyservalalathralaargtyrala
290295300
asnglyglnalatrptyrasnmetglyaspalathrhisglnasnglu
305310315320
aspthrgluthrhismetargmetasntrpglnleutrpiletyrtyr
325330335
hisargcysglutyrlysthraspphetrpglnthrleuphelysleu
340345350
metarggluvalasnmetthrgluglygluaspproglylyslysgln
355360365
leugluphealalysmetalaserlysalaalaasnglnasnleuthr
370375380
aspphepheglumettrpglyphephegluprovalasnthrthrile
385390395400
gluglntyrglythrtyrlystyrtyrvalseraspalametilearg
405410415
glualalysglutyrmetalaglnpheproalaprolyshisalaphe
420425430
glntyrilegluasparglyslysserglupheproserasnasptyr
435440445
argtyrseralavalglyaspvalglytyrtyrthrglnphelysglu
450455460
asnglnlysilethrlysalailethralagluleualaglyarglys
465470475480
valserileglnasnglyaspglualavalalaphegluleuargglu
485490495
asnaspgluasnglylysleuleutyrpheserthrphethrthrphe
500505510
gluileproserserileleumetvalasnalalysleutyralaval
515520525
glnalaaspglylysargileleuleuglyserglyhishishishis
530535540
hishis
545
<210>31
<211>517
<212>prt
<213>artificialsequence
<220>
<223>polypeptidehavingo-glycoprotein-specificendoproteaseactivity
(includingn-terminalmethionineandac-terminallinker+his6
tag)
<400>31
metvalleugluleuglumetargglyaspserileserglualalys
151015
lysarglysvaltrpasnpheglnasptrpglnilethrglyleuser
202530
alaargalaglyasplysilethrvaltyrvalaspvalalaglugly
354045
aspprothrprothrleuleutyrlysglnserleuthrglnhisgly
505560
glyalathrserpheglnleulysproglylysasngluilethrile
65707580
progluileasntyrgluserasnglyileprolysaspvalilegln
859095
glyglyaspleuphephethrasntyrlysseraspserglnlysarg
100105110
alaprolysvalargilegluglyalaserlystyrprovalpheile
115120125
leuglylysseraspgluasngluvalmetlysgluleuglualatyr
130135140
valglulysilelysalagluprolysthrthrproasnilepheala
145150155160
valserserasnlysserleugluphevalglnalathrtyralaleu
165170175
asptrptyrlyslysasnasnlysthrprolystyrthralaglugln
180185190
trpaspglntyrilealaaspalametglyphetrpglypheaspasn
195200205
serlysaspvalasnserasppheasnpheargilemetprometval
210215220
lysasnleuserglyglyalaphemetasnalaglyasnglyvalile
225230235240
glyileargproglyasnglnaspalaileleualaalaasnlysgly
245250255
trpglyvalalahisgluleuglyhisasnpheaspthrglyglyarg
260265270
thrilevalgluvalthrasnasnmetmetproleuphephegluser
275280285
lystyrlysthrlysthrargilethraspglnasniletrpgluasn
290295300
asnthrtyrprolysvalglyleuaspasptyrserasnasngluleu
305310315320
tyrasnlysalaaspserthrhisleualaglnleualaproleutrp
325330335
glnleutyrleutyraspasnthrphetyrglylysphegluarggln
340345350
phearggluargasppheglyasnlysasnarggluaspiletyrlys
355360365
sertrpvalvalalaalaseraspalametgluleuaspleuthrglu
370375380
phephealaarghisglyileargvalaspasplysvallysgluasp
385390395400
leualalystyrprolysproasplyslysiletyrtyrleuasnasp
405410415
leualametasntyrlysglyaspglyphethrgluasnalalysval
420425430
servalserthrserglyserasnglyasnilelysleuserpheser
435440445
valaspaspgluasnlysaspasnileleuglytyrgluileargarg
450455460
aspglylystyrvalglyphethrserasnaspserphevalaspthr
465470475480
lysserasnleuaspgluaspglyvaltyrvalvalthrprotyrasp
485490495
arglysleuasnthrleuasnproilegluvalasnglyserglyhis
500505510
hishishishishis
515
<210>32
<211>923
<212>prt
<213>pseudomonasaeruginosa
<400>32
metserleuserthrthralapheproserleuglnglygluasnmet
151015
serargserproileproarghisargalaleuleualaglyphecys
202530
leualaglyalaleuseralaglnalaalathrglnglugluileleu
354045
aspalaalaleuvalserglyaspserserglnleuthraspserhis
505560
leuvalalaleuargleuglnglnglnvalgluargileargglnthr
65707580
argthrglnleuleuaspglyleutyrglnasnleuserglnalatyr
859095
aspproglyalaalasermettrpvalleuproalaasnproaspasn
100105110
thrleupropheleuileglyasplysglyargvalleualaserleu
115120125
serleuglualaglyglyargglyleualatyrglythrasnvalleu
130135140
thrglnleuserglythrasnalaalahisalaproleuleulysarg
145150155160
alavalglntrpleuvalasnglyaspproglyalaalathralalys
165170175
aspphelysvalservalvalglyvalasplysthralaalaleuasn
180185190
glyleulysseralaglyleuglnproalaaspalaalacysasnala
195200205
leuthraspalasercysalaserthrserlysleuleuvalleugly
210215220
asnglyalaseralaalaserleuseralathrvalargalaargleu
225230235240
glnalaglyleuproileleuphevalhisthrasnglytrpasngln
245250255
serserthrglyglnglnileleualaglyleuglyleuglnglugly
260265270
protyrglyglyasntyrtrpasplysaspargvalproserserarg
275280285
thrargthrargservalgluleuglyglyalatyrglyglnasppro
290295300
alaleuvalglnglnilevalaspglysertrpargthrasptyrasp
305310315320
trpserlyscysthrsertyrvalglyargthrthrcysaspaspval
325330335
proglyleuserasppheserlysargvalaspvalleulysglyala
340345350
leuaspalatyrasnglnlysalaglnasnleuphealaleuprogly
355360365
thrthrserleuargleutrpleuleutrpalaaspalavalarggln
370375380
asnileargtyrprometasplysalaalaaspthralaargphegln
385390395400
gluthrphevalalaaspalailevalglytyrvalargglualagly
405410415
alaalaglnlysgluleuglysertyralaglyglnargglnglnser
420425430
metprovalserglyserglugluthrleuthrleuthrleuproser
435440445
alaglnglyphethralaileglyargmetalaalaproglylysarg
450455460
leuserileargilegluaspalaglyglnalaserleualavalgly
465470475480
leuasnthrglnargileglyserthrargleutrpasnthrarggln
485490495
tyraspargproargpheleulysserproaspilelysleuglnala
500505510
asnglnservalalaleuvalserprotyrglyglyleuleuglnleu
515520525
valtyrserglyalathrproglyglnthrvalthrvallysvalthr
530535540
glyalaalaserglnpropheleuaspileglnproglygluaspser
545550555560
serglnalailealaasppheileglnalaleuaspalaasplysala
565570575
asptrpleugluileargserglyservalgluvalhisalalysval
580585590
glulysvalargglyserileasplysasptyrglyglyaspvalgln
595600605
argpheilearggluleuasngluvalpheileaspaspalatyrthr
610615620
leualaglyphealaileproasnglnalalysthrproalailegln
625630635640
glnglucysalaalaargglytrpaspcysaspsergluthrleuhis
645650655
lysleuproglythrglnhisileasnvalaspglntyralaglncys
660665670
glyglyglycysserglyasnprotyraspglnthrtrpglyleuasn
675680685
proargglytrpglygluserhisgluleuglyhisasnleuglnval
690695700
asnargleulysvaltyrglyglyargserglygluileserasngln
705710715720
ilepheproleuhislysasptrpargvalleuargglupheglygln
725730735
asnleuaspaspthrargvalasntyrargasnalatyrasnleuile
740745750
valalaglyargalaglualaaspproleualaglyvaltyrlysarg
755760765
leutrpgluaspproglythrtyralaleuasnglygluargmetala
770775780
phetyrthrglntrpvalhistyrtrpalaaspleulysasnasppro
785790795800
leuglnglytrpaspiletrpthrleuleutyrleuhisglnarggln
805810815
valasplysserasptrpaspalaasnlysalaalaleuglytyrgly
820825830
thrtyralaglnargproglyasnserglyaspalaserserthrasp
835840845
glyasnaspasnleuleuleuglyleusertrpleuthrglnargasp
850855860
glnargprothrphealaleutrpglyileargthrseralaalaala
865870875880
glnalaglnvalalaalatyrglyphealagluglnproalaphephe
885890895
tyralaasnasnargthrasnglutyrserthrvallysleuleuasp
900905910
metserglnglyserproalatrpprophepro
915920
<210>33
<211>857
<212>prt
<213>bacteroidesthetaiotaomicron
<400>33
metthrilelysargpheilethrasnleuleualaleuphethrleu
151015
phethrvalserleualacyslysaspthrglulysserileileasn
202530
serserpheserilesergluglutyrleuileglnasnleuasplys
354045
serserthrservalglnileproileasnthrsermetgluleuala
505560
glntrpservalsertyrglualaasntrpleuglncysserlysgln
65707580
lysthralaalagluglythrpheleuargilethrvalasngluasn
859095
thrglygluthrlysargthralaasnilelysvalthrserthrthr
100105110
alathrtyrthrilethrvalasnglntyralalysglygluvalile
115120125
valgluglyaspilelysvalthrprothrglyglylysalaserglu
130135140
hisglngluglyglnaspilegluasnthrtyraspglylyspheser
145150155160
thraspglyalaalaprophehisthrprotrpglyglnseralalys
165170175
pheprovalthrleuglutyrtyrphelysglyaspthrgluileasp
180185190
tyrleuiletyrtyrthrargserglyasnglyasnpheglylysval
195200205
lysvaltyrthrthrthrasnproaspargserasptyrthrleugln
210215220
glyglutyraspphelysgluglnasnalaproserlysvalserphe
225230235240
sergluglyilelysalathrglyilelysphegluvalleusergly
245250255
leuglyaspphevalsercysaspglumetgluphetyrlysthrasn
260265270
thrasplysthrleuasplysglnleuleuthrvalphethraspile
275280285
thrcysthrgluilelysasnasnvalthrasngluglnileglnala
290295300
leuproasptyrphevalargilealaglualavalargaspasnthr
305310315320
tyrasplystrpglulysglupheargileargsertyrgluprotyr
325330335
serasnilealaglutrpalaasplysleumetthrlyslystyrser
340345350
aspleuaspasnprothrglyileservallysalaglyaspaspile
355360365
ilevalleuvalglyaspthrtyrglyglnasnilesermetglncys
370375380
iletrpgluthrglythrglutyrlysglnthralaserserglyasp
385390395400
valtyrmetleuasnproglyvalasnlysleuthrmetlysglyglu
405410415
glyglnleuphevalmettyrasnthrgluleuthrserasnthrala
420425430
lysproilelysilehisileproleuglyserglythrvalasngly
435440445
phepheaspleulysgluhislysthraspglulystyralagluleu
450455460
leulyslysserthrhislystyrphecysileargglyglulysile
465470475480
metphetyrphehisargasnlysleuleuglutyrvalproasnasn
485490495
ileleuseralailehisleutrpaspasnilevalglytrpglngln
500505510
gluleumetglyileaspaspvalargproserglnvalasnasnhis
515520525
leuphealaileserprogluglysertyrmettrpalaserasptyr
530535540
glnileglyphevaltyrthrtyrleuglyasnileleuleugluasp
545550555560
asnvalmetalaalagluaspasnalatrpglyproalahisgluile
565570575
glyhisvalhisglnalaalaileasntrpalaserserthrgluser
580585590
serasnasnleupheserasnpheileiletyrlysleuglylystyr
595600605
lysserargglyasnglyleuglyservalalathralaargtyrala
610615620
asnglyglnalatrptyrasnmetglyaspalathrhisglnasnglu
625630635640
aspthrgluthrhismetargmetasntrpglnleutrpiletyrtyr
645650655
hisargcysglutyrlysthraspphetrpglnthrleuphelysleu
660665670
metarggluvalasnmetthrgluglygluaspproglylyslysgln
675680685
leugluphealalysmetalaserlysalaalaasnglnasnleuthr
690695700
aspphepheglumettrpglyphephegluprovalasnthrthrile
705710715720
gluglntyrglythrtyrlystyrtyrvalseraspalametilearg
725730735
glualalysglutyrmetalaglnpheproalaprolyshisalaphe
740745750
glntyrilegluasparglyslysserglupheproserasnasptyr
755760765
argtyrseralavalglyaspvalglytyrtyrthrglnphelysglu
770775780
asnglnlysilethrlysalailethralagluleualaglyarglys
785790795800
valserileglnasnglyaspglualavalalaphegluleuargglu
805810815
asnaspgluasnglylysleuleutyrpheserthrphethrthrphe
820825830
gluileproserserileleumetvalasnalalysleutyralaval
835840845
glnalaaspglylysargileleuleu
850855
<210>34
<211>1687
<212>prt
<213>clostridiumperfringens
<400>34
metasnlysarglysilealaalaileileleualathrmetilethr
151015
asnleuseralathrthrileaspvalleualaglngluleuasnthr
202530
lysasnasnserlysvalgluvalserhisaspaspgluserhisgln
354045
alaargvalserlyspheaspleutyrasnserasplysleuaspala
505560
tyrasnglnglupheglnvalserargserasnilelysserileasn
65707580
asnasnglyglylystyrasnserserthrileasplysalaileasp
859095
glyasnleugluthrhistrpgluthrglylysproasnaspalaasn
100105110
phethrasngluvalvalvalthrpheasngluilethrasnileasp
115120125
argilevaltyrseralaargargaspseralaargglylysglyphe
130135140
alalysgluphegluiletyralaserleulysaspgluglyaspasp
145150155160
pheasnleuvalserserglyglutyrthrgluserthrargaspleu
165170175
valgluilelyspheasnprothraspphelysargleulysphelys
180185190
phelyslysalaaspglnasntrpalaseralaalagluphemetphe
195200205
tyrlysgluasplysleuasnglulyspheasnglyleuphethrasp
210215220
sersermetasnlysvalsergluglupheasnthrleuglulysleu
225230235240
asnalaphegluasngluleulysasphisproiletyraspleutyr
245250255
lysgluglyleuasnasnalaargalaileleuthrgluthrserglu
260265270
asnprothrlysalathrleuglyglnilethrtyrasnleuasnasp
275280285
asptyrasnasnglntyrargmetprotyrlysasnilelysalaile
290295300
lysasnasnglyarghistyralaalaglnasnileglulysalaile
305310315320
aspasnaspvalasnthrtyrtrpgluthrglythrleuasnserser
325330335
serpheasnasngluvalgluvalglupheasnaspleuvalthrleu
340345350
aspargilevaltyrglyserargglnseraspleulysglypheala
355360365
glugluvaltyriletyralaserargthrserlysglyaspthrtyr
370375380
lysleuvalalathrglyalahisglualathrlysglyleuvalglu
385390395400
alalysphegluprothrgluphelysargvallysphelysphelys
405410415
lysserlysglnasnseralathrleuasngluleumetphetyrlys
420425430
proaspgluvaltyrserserileprolysleuphethraspglythr
435440445
metsergluleusergluglupheasnserleuglulysileasnala
450455460
phelysglulysalalysasnhisproleutyrasnasppheasnglu
465470475480
thrilegluleualagluserleuileserasnproarglysgluasp
485490495
valleugluleuglumetargglyaspserileserglualalyslys
500505510
arglysvaltrpasnpheglnasptrpglnilethrglyleuserala
515520525
argalaglyasplysilethrvaltyrvalaspvalalagluglyasp
530535540
prothrprothrleuleutyrlysglnserleuthrglnhisglygly
545550555560
alathrserpheglnleulysproglylysasngluilethrilepro
565570575
gluileasntyrgluserasnglyileprolysaspvalileglngly
580585590
glyaspleuphephethrasntyrlysseraspserglnlysargala
595600605
prolysvalargilegluglyalaserlystyrprovalpheileleu
610615620
glylysseraspgluasngluvalmetlysgluleuglualatyrval
625630635640
glulysilelysalagluprolysthrthrproasnilephealaval
645650655
serserasnlysserleugluphevalglnalathrtyralaleuasp
660665670
trptyrlyslysasnasnlysthrprolystyrthralagluglntrp
675680685
aspglntyrilealaaspalametglyphetrpglypheaspasnser
690695700
lysaspvalasnserasppheasnpheargilemetprometvallys
705710715720
asnleuserglyglyalaphemetasnalaglyasnglyvalilegly
725730735
ileargproglyasnglnaspalaileleualaalaasnlysglytrp
740745750
glyvalalahisgluleuglyhisasnpheaspthrglyglyargthr
755760765
ilevalgluvalthrasnasnmetmetproleuphephegluserlys
770775780
tyrlysthrlysthrargilethraspglnasniletrpgluasnasn
785790795800
thrtyrprolysvalglyleuaspasptyrserasnasngluleutyr
805810815
asnlysalaaspserthrhisleualaglnleualaproleutrpgln
820825830
leutyrleutyraspasnthrphetyrglylysphegluargglnphe
835840845
arggluargasppheglyasnlysasnarggluaspiletyrlysser
850855860
trpvalvalalaalaseraspalametgluleuaspleuthrgluphe
865870875880
phealaarghisglyileargvalaspasplysvallysgluaspleu
885890895
alalystyrprolysproasplyslysiletyrtyrleuasnaspleu
900905910
alametasntyrlysglyaspglyphethrgluasnalalysvalser
915920925
valserthrserglyserasnglyasnilelysleuserpheserval
930935940
aspaspgluasnlysaspasnileleuglytyrgluileargargasp
945950955960
glylystyrvalglyphethrserasnaspserphevalaspthrlys
965970975
serasnleuaspgluaspglyvaltyrvalvalthrprotyrasparg
980985990
lysleuasnthrleuasnproilegluvalasnalaleuglnprothr
99510001005
leuservalasnprovalilethrleualaleuglyglugluphe
101010151020
asnglugluglutyrilevalalalysaspilelysglyasnser
102510301035
leusergluservallysvallysserserasnvalasnthrser
104010451050
lysvalglyglutyrgluvalleutyrserleugluaspserlys
105510601065
glyasnglutyrthrlysthrserlysvalasnvalvalserarg
107010751080
lysglutyrmetseraspleuthrprolysglnserserasngly
108510901095
trpglythrvalarglysasplysserileserglyglyvalile
110011051110
glyleuthrargaspglyaspphevalasptyrasnlysglyleu
111511201125
glyleuhisserasnalaglutyrvaltyraspleugluglylys
113011351140
asptyrasptyrpheglusertyrvalglyvalasplysalamet
114511501155
serserargproalaserservalilephelysvalleuvalasp
116011651170
glygluglulyspheasnserglyvalmetargserthrthrpro
117511801185
glnlystyrvallysvalaspvallysasnalalysgluleulys
119011951200
leuilevalasnaspalaglyaspglyaspserserasphisala
120512101215
serpheglyaspalalysleualathrleuserserlysproile
122012251230
ilelysglygluasnleualatyrsermetaspglulysvalasp
123512401245
leumetlysglyilethralathraspilegluaspglyasnile
125012551260
thrserlysvalglnilelysserseraspphevalgluglylys
126512701275
serglyilephethrvalvaltyrservalthraspseraspgly
128012851290
leuthrserglucysserargthrilealavalthrasplysglu
129513001305
thrglnleuseraspleuasntrplysseralathrileglyser
131013151320
glyservalarglysaspargalavalserglyasnglnilearg
132513301335
leuleuasngluaspasnservalgluthrphealalysglyile
134013451350
glythrhissertyrsergluilevaltyrasnsergluglytyr
135513601365
aspilepheaspthrtrpvalglyileasparghisvalalaasp
137013751380
lyslysvalserservallysphelysvaltyrvalaspglyglu
138513901395
leulysalagluthraspvalmetargileaspthrprolyslys
140014051410
argleuvalvalaspvalargasnserlysgluilelysleuval
141514201425
valaspvalalaaspasnglyasnasntrpasphisalaasptrp
143014351440
alaaspalalyspheargasnleualaglutyraspalaserglu
144514501455
leuasnlysalailegluglualalyslysleuaspleuasnasn
146014651470
tyrthrglugluserserglualaleulysasnalaileserlys
147514801485
glygluglualaleuleuserlysasplysgluthrileasnser
149014951500
alaleuglugluleuasnlysglumetasnserleuvallysval
150515101515
aspleuasnalavalileasnileproasplystyrleuleulys
152015251530
serileglnasnglnleuasnlysthrglyaspilethrleugly
153515401545
aspmettyrserleuthrthrleuthrleuserglyvalgluasp
155015551560
leuthrglyleugluasnalalysasnleugluthrleuasnmet
156515701575
asptyrasngluvallysaspleuargproleuserlysleulys
158015851590
lysleuasnthrleuasnalaglngluglnpheilealaalagly
159516001605
gluleulysproserasnglylysvalileglyaspserlysval
161016151620
tyrasnarggluglylysasnvalalalysthrileargvalval
162516301635
asplysasnglyasnthrileleugluglnaspalalysaspglu
164016451650
phethrileasnthrlysaspleuserserglyleutyrglyval
165516601665
hisvalleuphegluaspgluglypheserglyvalmetphetyr
167016751680
leupheasnval
1685
<210>35
<211>882
<212>prt
<213>artificialsequence
<220>
<223>polypeptidecapableofbindingtoo-glycansbutlackorhas
reducedo-glycoprotein-specificendoproteaseactivity-
pseudomonasaeruginosapao1(doublemutantwithremovedsignal
sequence)
<400>35
alathrglnglugluileleuaspalaalaleuvalserglyaspser
151015
serglnleuthraspserhisleuvalalaleuargleuglnglngln
202530
valgluargileargglnthrargthrglnleuleuaspglyleutyr
354045
glnasnleuserglnalatyraspproglyalaalasermettrpval
505560
leuproalaasnproaspasnthrleupropheleuileglyasplys
65707580
glyargvalleualaserleuserleuglualaglyglyargglyleu
859095
alatyrglythrasnvalleuthrglnleuserglythrasnalaala
100105110
hisalaproleuleulysargalavalglntrpleuvalasnglyasp
115120125
proglyalaalathralalysaspphelysvalservalvalglyval
130135140
asplysthralaalaleuasnglyleulysseralaglyleuglnpro
145150155160
alaaspalaalacysasnalaleuthraspalasercysalaserthr
165170175
serlysleuleuvalleuglyasnglyalaseralaalaserleuser
180185190
alathrvalargalaargleuglnalaglyleuproileleupheval
195200205
histhrasnglytrpasnglnserserthrglyglnglnileleuala
210215220
glyleuglyleuglngluglyprotyrglyglyasntyrtrpasplys
225230235240
aspargvalproserserargthrargthrargservalgluleugly
245250255
glyalatyrglyglnaspproalaleuvalglnglnilevalaspgly
260265270
sertrpargthrasptyrasptrpserlyscysthrsertyrvalgly
275280285
argthrthrcysaspaspvalproglyleuserasppheserlysarg
290295300
valaspvalleulysglyalaleuaspalatyrasnglnlysalagln
305310315320
asnleuphealaleuproglythrthrserleuargleutrpleuleu
325330335
trpalaaspalavalargglnasnileargtyrprometasplysala
340345350
alaaspthralaargpheglngluthrphevalalaaspalaileval
355360365
glytyrvalargglualaglyalaalaglnlysgluleuglysertyr
370375380
alaglyglnargglnglnsermetprovalserglyserglugluthr
385390395400
leuthrleuthrleuproseralaglnglyphethralaileglyarg
405410415
metalaalaproglylysargleuserileargilegluaspalagly
420425430
glnalaserleualavalglyleuasnthrglnargileglyserthr
435440445
argleutrpasnthrargglntyraspargproargpheleulysser
450455460
proaspilelysleuglnalaasnglnservalalaleuvalserpro
465470475480
tyrglyglyleuleuglnleuvaltyrserglyalathrproglygln
485490495
thrvalthrvallysvalthrglyalaalaserglnpropheleuasp
500505510
ileglnproglygluaspserserglnalailealaasppheilegln
515520525
alaleuaspalaasplysalaasptrpleugluileargserglyser
530535540
valgluvalhisalalysvalglulysvalargglyserileasplys
545550555560
asptyrglyglyaspvalglnargpheilearggluleuasngluval
565570575
pheileaspaspalatyrthrleualaglyphealaileproasngln
580585590
alalysthrproalaileglnglnglucysalaalaargglytrpasp
595600605
cysaspsergluthrleuhislysleuproglythrglnhisileasn
610615620
valaspglntyralaglncysglyglyglycysserglyasnprotyr
625630635640
aspglnthrtrpglyleuasnproargglytrpglygluseralaala
645650655
leuglyhisasnleuglnvalasnargleulysvaltyrglyglyarg
660665670
serglygluileserasnglnilepheproleuhislysasptrparg
675680685
valleuargglupheglyglnasnleuaspaspthrargvalasntyr
690695700
argasnalatyrasnleuilevalalaglyargalaglualaasppro
705710715720
leualaglyvaltyrlysargleutrpgluaspproglythrtyrala
725730735
leuasnglygluargmetalaphetyrthrglntrpvalhistyrtrp
740745750
alaaspleulysasnaspproleuglnglytrpaspiletrpthrleu
755760765
leutyrleuhisglnargglnvalasplysserasptrpaspalaasn
770775780
lysalaalaleuglytyrglythrtyralaglnargproglyasnser
785790795800
glyaspalaserserthraspglyasnaspasnleuleuleuglyleu
805810815
sertrpleuthrglnargaspglnargprothrphealaleutrpgly
820825830
ileargthrseralaalaalaglnalaglnvalalaalatyrglyphe
835840845
alagluglnproalaphephetyralaasnasnargthrasnglutyr
850855860
serthrvallysleuleuaspmetserglnglyserproalatrppro
865870875880
phepro
<210>36
<211>536
<212>prt
<213>artificialsequence
<220>
<223>polypeptidecapableofbindingtoo-glycansbutlackorhas
reducedo-glycoprotein-specificendoproteaseactivity-
bacteroidesthetaiotaomicronvpi-5482(doublemutantwithremoved
signalandotherimmaturesequences)
<400>36
asplystrpglulysglupheargileargsertyrgluprotyrser
151015
asnilealaglutrpalaasplysleumetthrlyslystyrserasp
202530
leuaspasnprothrglyileservallysalaglyaspaspileile
354045
valleuvalglyaspthrtyrglyglnasnilesermetglncysile
505560
trpgluthrglythrglutyrlysglnthralaserserglyaspval
65707580
tyrmetleuasnproglyvalasnlysleuthrmetlysglyglugly
859095
glnleuphevalmettyrasnthrgluleuthrserasnthralalys
100105110
proilelysilehisileproleuglyserglythrvalasnglyphe
115120125
pheaspleulysgluhislysthraspglulystyralagluleuleu
130135140
lyslysserthrhislystyrphecysileargglyglulysilemet
145150155160
phetyrphehisargasnlysleuleuglutyrvalproasnasnile
165170175
leuseralailehisleutrpaspasnilevalglytrpglnglnglu
180185190
leumetglyileaspaspvalargproserglnvalasnasnhisleu
195200205
phealaileserprogluglysertyrmettrpalaserasptyrgln
210215220
ileglyphevaltyrthrtyrleuglyasnileleuleugluaspasn
225230235240
valmetalaalagluaspasnalatrpglyproalaalaalailegly
245250255
hisvalhisglnalaalaileasntrpalaserserthrgluserser
260265270
asnasnleupheserasnpheileiletyrlysleuglylystyrlys
275280285
serargglyasnglyleuglyservalalathralaargtyralaasn
290295300
glyglnalatrptyrasnmetglyaspalathrhisglnasngluasp
305310315320
thrgluthrhismetargmetasntrpglnleutrpiletyrtyrhis
325330335
argcysglutyrlysthraspphetrpglnthrleuphelysleumet
340345350
arggluvalasnmetthrgluglygluaspproglylyslysglnleu
355360365
gluphealalysmetalaserlysalaalaasnglnasnleuthrasp
370375380
phepheglumettrpglyphephegluprovalasnthrthrileglu
385390395400
glntyrglythrtyrlystyrtyrvalseraspalametileargglu
405410415
alalysglutyrmetalaglnpheproalaprolyshisalaphegln
420425430
tyrilegluasparglyslysserglupheproserasnasptyrarg
435440445
tyrseralavalglyaspvalglytyrtyrthrglnphelysgluasn
450455460
glnlysilethrlysalailethralagluleualaglyarglysval
465470475480
serileglnasnglyaspglualavalalaphegluleuarggluasn
485490495
aspgluasnglylysleuleutyrpheserthrphethrthrpheglu
500505510
ileproserserileleumetvalasnalalysleutyralavalgln
515520525
alaaspglylysargileleuleu
530535
<210>37
<211>507
<212>prt
<213>artificialsequence
<220>
<223>polypeptidecapableofbindingtoo-glycansbutlackorhas
reducedo-glycoprotein-specificendoproteaseactivity-
clostridiumperfringens(doublemutantwithremovedsignaland
otherimmaturesequences)
<400>37
valleugluleuglumetargglyaspserileserglualalyslys
151015
arglysvaltrpasnpheglnasptrpglnilethrglyleuserala
202530
argalaglyasplysilethrvaltyrvalaspvalalagluglyasp
354045
prothrprothrleuleutyrlysglnserleuthrglnhisglygly
505560
alathrserpheglnleulysproglylysasngluilethrilepro
65707580
gluileasntyrgluserasnglyileprolysaspvalileglngly
859095
glyaspleuphephethrasntyrlysseraspserglnlysargala
100105110
prolysvalargilegluglyalaserlystyrprovalpheileleu
115120125
glylysseraspgluasngluvalmetlysgluleuglualatyrval
130135140
glulysilelysalagluprolysthrthrproasnilephealaval
145150155160
serserasnlysserleugluphevalglnalathrtyralaleuasp
165170175
trptyrlyslysasnasnlysthrprolystyrthralagluglntrp
180185190
aspglntyrilealaaspalametglyphetrpglypheaspasnser
195200205
lysaspvalasnserasppheasnpheargilemetprometvallys
210215220
asnleuserglyglyalaphemetasnalaglyasnglyvalilegly
225230235240
ileargproglyasnglnaspalaileleualaalaasnlysglytrp
245250255
glyvalalaalaalaleuglyhisasnpheaspthrglyglyargthr
260265270
ilevalgluvalthrasnasnmetmetproleuphephegluserlys
275280285
tyrlysthrlysthrargilethraspglnasniletrpgluasnasn
290295300
thrtyrprolysvalglyleuaspasptyrserasnasngluleutyr
305310315320
asnlysalaaspserthrhisleualaglnleualaproleutrpgln
325330335
leutyrleutyraspasnthrphetyrglylysphegluargglnphe
340345350
arggluargasppheglyasnlysasnarggluaspiletyrlysser
355360365
trpvalvalalaalaseraspalametgluleuaspleuthrgluphe
370375380
phealaarghisglyileargvalaspasplysvallysgluaspleu
385390395400
alalystyrprolysproasplyslysiletyrtyrleuasnaspleu
405410415
alametasntyrlysglyaspglyphethrgluasnalalysvalser
420425430
valserthrserglyserasnglyasnilelysleuserpheserval
435440445
aspaspgluasnlysaspasnileleuglytyrgluileargargasp
450455460
glylystyrvalglyphethrserasnaspserphevalaspthrlys
465470475480
serasnleuaspgluaspglyvaltyrvalvalthrprotyrasparg
485490495
lysleuasnthrleuasnproilegluvalasn
500505
<210>38
<211>892
<212>prt
<213>artificialsequence
<220>
<223>polypeptidecapableofbindingtoo-glycansbutlackorhas
reducedo-glycoprotein-specificendoproteaseactivity-
pseudomonasaeruginosapao1(doublemutantwithremovedsignal
sequence,withn-termmet,c-termlinker/tag)
<400>38
metalathrglnglugluileleuaspalaalaleuvalserglyasp
151015
serserglnleuthraspserhisleuvalalaleuargleuglngln
202530
glnvalgluargileargglnthrargthrglnleuleuaspglyleu
354045
tyrglnasnleuserglnalatyraspproglyalaalasermettrp
505560
valleuproalaasnproaspasnthrleupropheleuileglyasp
65707580
lysglyargvalleualaserleuserleuglualaglyglyarggly
859095
leualatyrglythrasnvalleuthrglnleuserglythrasnala
100105110
alahisalaproleuleulysargalavalglntrpleuvalasngly
115120125
aspproglyalaalathralalysaspphelysvalservalvalgly
130135140
valasplysthralaalaleuasnglyleulysseralaglyleugln
145150155160
proalaaspalaalacysasnalaleuthraspalasercysalaser
165170175
thrserlysleuleuvalleuglyasnglyalaseralaalaserleu
180185190
seralathrvalargalaargleuglnalaglyleuproileleuphe
195200205
valhisthrasnglytrpasnglnserserthrglyglnglnileleu
210215220
alaglyleuglyleuglngluglyprotyrglyglyasntyrtrpasp
225230235240
lysaspargvalproserserargthrargthrargservalgluleu
245250255
glyglyalatyrglyglnaspproalaleuvalglnglnilevalasp
260265270
glysertrpargthrasptyrasptrpserlyscysthrsertyrval
275280285
glyargthrthrcysaspaspvalproglyleuserasppheserlys
290295300
argvalaspvalleulysglyalaleuaspalatyrasnglnlysala
305310315320
glnasnleuphealaleuproglythrthrserleuargleutrpleu
325330335
leutrpalaaspalavalargglnasnileargtyrprometasplys
340345350
alaalaaspthralaargpheglngluthrphevalalaaspalaile
355360365
valglytyrvalargglualaglyalaalaglnlysgluleuglyser
370375380
tyralaglyglnargglnglnsermetprovalserglysergluglu
385390395400
thrleuthrleuthrleuproseralaglnglyphethralailegly
405410415
argmetalaalaproglylysargleuserileargilegluaspala
420425430
glyglnalaserleualavalglyleuasnthrglnargileglyser
435440445
thrargleutrpasnthrargglntyraspargproargpheleulys
450455460
serproaspilelysleuglnalaasnglnservalalaleuvalser
465470475480
protyrglyglyleuleuglnleuvaltyrserglyalathrprogly
485490495
glnthrvalthrvallysvalthrglyalaalaserglnpropheleu
500505510
aspileglnproglygluaspserserglnalailealaasppheile
515520525
glnalaleuaspalaasplysalaasptrpleugluileargsergly
530535540
servalgluvalhisalalysvalglulysvalargglyserileasp
545550555560
lysasptyrglyglyaspvalglnargpheilearggluleuasnglu
565570575
valpheileaspaspalatyrthrleualaglyphealaileproasn
580585590
glnalalysthrproalaileglnglnglucysalaalaargglytrp
595600605
aspcysaspsergluthrleuhislysleuproglythrglnhisile
610615620
asnvalaspglntyralaglncysglyglyglycysserglyasnpro
625630635640
tyraspglnthrtrpglyleuasnproargglytrpglygluserala
645650655
alaleuglyhisasnleuglnvalasnargleulysvaltyrglygly
660665670
argserglygluileserasnglnilepheproleuhislysasptrp
675680685
argvalleuargglupheglyglnasnleuaspaspthrargvalasn
690695700
tyrargasnalatyrasnleuilevalalaglyargalaglualaasp
705710715720
proleualaglyvaltyrlysargleutrpgluaspproglythrtyr
725730735
alaleuasnglygluargmetalaphetyrthrglntrpvalhistyr
740745750
trpalaaspleulysasnaspproleuglnglytrpaspiletrpthr
755760765
leuleutyrleuhisglnargglnvalasplysserasptrpaspala
770775780
asnlysalaalaleuglytyrglythrtyralaglnargproglyasn
785790795800
serglyaspalaserserthraspglyasnaspasnleuleuleugly
805810815
leusertrpleuthrglnargaspglnargprothrphealaleutrp
820825830
glyileargthrseralaalaalaglnalaglnvalalaalatyrgly
835840845
phealagluglnproalaphephetyralaasnasnargthrasnglu
850855860
tyrserthrvallysleuleuaspmetserglnglyserproalatrp
865870875880
propheproglyserglyhishishishishishis
885890
<210>39
<211>546
<212>prt
<213>artificialsequence
<220>
<223>polypeptidecapableofbindingtoo-glycansbutlackorhas
reducedo-glycoprotein-specificendoproteaseactivity-
bacteroidesthetaiotaomicronvpi-5482(doublemutantwithremoved
signalandothersequencesfromimmatureprotein,withn-term
<400>39
metasplystrpglulysglupheargileargsertyrgluprotyr
151015
serasnilealaglutrpalaasplysleumetthrlyslystyrser
202530
aspleuaspasnprothrglyileservallysalaglyaspaspile
354045
ilevalleuvalglyaspthrtyrglyglnasnilesermetglncys
505560
iletrpgluthrglythrglutyrlysglnthralaserserglyasp
65707580
valtyrmetleuasnproglyvalasnlysleuthrmetlysglyglu
859095
glyglnleuphevalmettyrasnthrgluleuthrserasnthrala
100105110
lysproilelysilehisileproleuglyserglythrvalasngly
115120125
phepheaspleulysgluhislysthraspglulystyralagluleu
130135140
leulyslysserthrhislystyrphecysileargglyglulysile
145150155160
metphetyrphehisargasnlysleuleuglutyrvalproasnasn
165170175
ileleuseralailehisleutrpaspasnilevalglytrpglngln
180185190
gluleumetglyileaspaspvalargproserglnvalasnasnhis
195200205
leuphealaileserprogluglysertyrmettrpalaserasptyr
210215220
glnileglyphevaltyrthrtyrleuglyasnileleuleugluasp
225230235240
asnvalmetalaalagluaspasnalatrpglyproalaalaalaile
245250255
glyhisvalhisglnalaalaileasntrpalaserserthrgluser
260265270
serasnasnleupheserasnpheileiletyrlysleuglylystyr
275280285
lysserargglyasnglyleuglyservalalathralaargtyrala
290295300
asnglyglnalatrptyrasnmetglyaspalathrhisglnasnglu
305310315320
aspthrgluthrhismetargmetasntrpglnleutrpiletyrtyr
325330335
hisargcysglutyrlysthraspphetrpglnthrleuphelysleu
340345350
metarggluvalasnmetthrgluglygluaspproglylyslysgln
355360365
leugluphealalysmetalaserlysalaalaasnglnasnleuthr
370375380
aspphepheglumettrpglyphephegluprovalasnthrthrile
385390395400
gluglntyrglythrtyrlystyrtyrvalseraspalametilearg
405410415
glualalysglutyrmetalaglnpheproalaprolyshisalaphe
420425430
glntyrilegluasparglyslysserglupheproserasnasptyr
435440445
argtyrseralavalglyaspvalglytyrtyrthrglnphelysglu
450455460
asnglnlysilethrlysalailethralagluleualaglyarglys
465470475480
valserileglnasnglyaspglualavalalaphegluleuargglu
485490495
asnaspgluasnglylysleuleutyrpheserthrphethrthrphe
500505510
gluileproserserileleumetvalasnalalysleutyralaval
515520525
glnalaaspglylysargileleuleuglyserglyhishishishis
530535540
hishis
545
<210>40
<211>517
<212>prt
<213>artificialsequence
<220>
<223>polypeptidecapableofbindingtoo-glycansbutlackorhas
reducedo-glycoprotein-specificendoproteaseactivity-
clostridiumperfringens(doublemutantwithremovedsignaland
othersequencesfromimmatureprotein,withn-termmet,c-term
<400>40
metvalleugluleuglumetargglyaspserileserglualalys
151015
lysarglysvaltrpasnpheglnasptrpglnilethrglyleuser
202530
alaargalaglyasplysilethrvaltyrvalaspvalalaglugly
354045
aspprothrprothrleuleutyrlysglnserleuthrglnhisgly
505560
glyalathrserpheglnleulysproglylysasngluilethrile
65707580
progluileasntyrgluserasnglyileprolysaspvalilegln
859095
glyglyaspleuphephethrasntyrlysseraspserglnlysarg
100105110
alaprolysvalargilegluglyalaserlystyrprovalpheile
115120125
leuglylysseraspgluasngluvalmetlysgluleuglualatyr
130135140
valglulysilelysalagluprolysthrthrproasnilepheala
145150155160
valserserasnlysserleugluphevalglnalathrtyralaleu
165170175
asptrptyrlyslysasnasnlysthrprolystyrthralaglugln
180185190
trpaspglntyrilealaaspalametglyphetrpglypheaspasn
195200205
serlysaspvalasnserasppheasnpheargilemetprometval
210215220
lysasnleuserglyglyalaphemetasnalaglyasnglyvalile
225230235240
glyileargproglyasnglnaspalaileleualaalaasnlysgly
245250255
trpglyvalalaalaalaleuglyhisasnpheaspthrglyglyarg
260265270
thrilevalgluvalthrasnasnmetmetproleuphephegluser
275280285
lystyrlysthrlysthrargilethraspglnasniletrpgluasn
290295300
asnthrtyrprolysvalglyleuaspasptyrserasnasngluleu
305310315320
tyrasnlysalaaspserthrhisleualaglnleualaproleutrp
325330335
glnleutyrleutyraspasnthrphetyrglylysphegluarggln
340345350
phearggluargasppheglyasnlysasnarggluaspiletyrlys
355360365
sertrpvalvalalaalaseraspalametgluleuaspleuthrglu
370375380
phephealaarghisglyileargvalaspasplysvallysgluasp
385390395400
leualalystyrprolysproasplyslysiletyrtyrleuasnasp
405410415
leualametasntyrlysglyaspglyphethrgluasnalalysval
420425430
servalserthrserglyserasnglyasnilelysleuserpheser
435440445
valaspaspgluasnlysaspasnileleuglytyrgluileargarg
450455460
aspglylystyrvalglyphethrserasnaspserphevalaspthr
465470475480
lysserasnleuaspgluaspglyvaltyrvalvalthrprotyrasp
485490495
arglysleuasnthrleuasnproilegluvalasnglyserglyhis
500505510
hishishishishis
515
<210>41
<211>5
<212>prt
<213>artificialsequence
<220>
<223>metalloproteasemotif
<400>41
hisgluleuglyhis
15
<210>42
<211>5
<212>prt
<213>artificialsequence
<220>
<223>metalloproteasemotif
<400>42
hisgluileglyhis
15
<210>43
<211>10
<212>prt
<213>artificialsequence
<220>
<223>metalloproteasemotif
<400>43
glyvalalahisgluleuglyhisasnphe
1510
<210>44
<211>5
<212>prt
<213>artificialsequence
<220>
<223>disruptedmetalloproteasemotif
<400>44
hisalaleuglyhis
15
<210>45
<211>5
<212>prt
<213>artificialsequence
<220>
<223>disruptedmetalloproteasemotif
<400>45
alagluleuglyhis
15
<210>46
<211>5
<212>prt
<213>artificialsequence
<220>
<223>disruptedmetalloproteasemotif
<400>46
alaalaleuglyhis
15
<210>47
<211>19
<212>prt
<213>artificialsequence
<220>
<223>glycodrosocinpeptidewitho-glysiteonthet
<400>47
glylysproargprotyrserproargprothrserhisproargpro
151015
ileargval
<210>48
<211>7
<212>prt
<213>artificialsequence
<220>
<223>non-o-glycosylatedpeptide
<400>48
tyriletyrglyserphelys
15
<210>49
<211>7
<212>prt
<213>artificialsequence
<220>
<223>non-o-glycosylatedpeptide
<400>49
lyslysleuvalphepheala
15
<210>50
<211>14
<212>prt
<213>artificialsequence
<220>
<223>non-o-glycosylatedpeptide
<400>50
pheleuproleuileleuglylysleuvallysglyleuleu
1510