用于O-糖蛋白的蛋白酶和结合多肽的制作方法

文档序号:20786713发布日期:2020-05-19 21:46阅读:32274来源:国知局
用于O-糖蛋白的蛋白酶和结合多肽的制作方法

本发明涉及一种具有结合活性但缺乏水解活性或具有降低的水解活性的新型内切蛋白酶、其突变体,以及在研究和分出o-连接糖蛋白的方法中的用途。



背景技术:

近来,糖基化对生物学功能的影响已引起越来越多的关注,特别是在o-连接的聚糖方面。然而,尽管已经恢复对这些重要的蛋白质修饰的兴趣,但仍缺乏有效研究聚糖和糖蛋白的工具。

已经开发有对从天然蛋白中去除o-连接的聚糖和对聚糖测序都非常有用的几种外切糖苷酶和内切糖苷酶。这两种方法均可单独使用,以减少糖蛋白的异质性,从而有助于在质谱中分析蛋白质及其片段化的肽。还可以通过对受水解影响的功能进行下游分析来实施对聚糖的生物学效应的更有效的分析。然而,这样的工具例如在方便o-连接的糖蛋白的鉴定、糖基化位点的确定和o-连接的糖肽的纯化上不是有效的。

1991/1992年报道了首个o-糖蛋白特异性内切蛋白酶,o-糖蛋白特异性内切蛋白酶与o-聚糖结合并主要水解接近聚糖的r-n键(abdullahetal.,jbacteriol173,5597–5603(1991);abdullahetal.,infectimmun60,56–62(1992))。然而,该酶在医学和生物技术中的用途是有限的,因为该酶仅对包含唾液酸的o-聚糖(大部分但远非所有o-连接的聚糖)具有特异性,并且要求特定的氨基酸,从而通常导致水解水平低,因此需要更好的用于研究o连接的糖蛋白的工具。



技术实现要素:

本发明人已经鉴定、纯化和表征了来自嗜粘蛋白艾克曼菌(akkermansiamuciniphila)的新型多肽,在本文中被称为ls。该多肽充当内切蛋白酶,该内切蛋白酶特别地切割/水解在o-连接的聚糖的n末端且与o-连接的聚糖接近的氨基酸键,而不显示出对特定氨基酸序列的任何特异性或限制。

本发明人还修饰了ls的序列,并鉴定了能够结合o-连接的聚糖但缺乏水解糖蛋白能力或具有降低的水解糖蛋白能力的突变体。这些突变体可用于选择性去除、富集或纯化游离的o-聚糖、o-糖肽和/或o-糖蛋白。

因此,在本发明的第一方面,提供一种对o-糖基化蛋白具有特异性内切蛋白酶活性的多肽,该多肽包含:

(a)seqidno:1的氨基酸序列;

(b)与seqidno:1的氨基酸序列至少85%一致的氨基酸序列;或

(c)这样的氨基酸序列:该氨基酸序列为seqidno:1的序列的片段或与seqidno:1的氨基酸序列85%一致的氨基酸序列的片段。

本发明还提供一种水解o-糖蛋白的方法,其中该方法包括使包含该蛋白质的样品与本发明的多肽接触,并且任选地还包括对水解产物的检测或分析。

另外,提供一种评估蛋白质的糖基化状态的方法,该方法包括使包含该蛋白质的样品与本发明的多肽接触,以及检测和/或分析产生的产物,任选地,其中使用切割产物存在或不存在来确定样品中o-糖蛋白的存在/不存在,和/或其中进行所述分析以鉴定o-糖链的类型和/或o-糖链与o-糖蛋白的连接位置。

在本发明的第二方面,提供一种能够与o-聚糖、o-糖肽和/或o-糖蛋白结合并且对o-糖基化蛋白缺乏特异性内切蛋白酶活性或具有降低的特异性内切蛋白酶活性的多肽,该多肽包含:

(a)seqidno:5的氨基酸序列;

(b)与seqidno:5或seqidno:20的氨基酸序列至少85%一致的氨基酸序列;或

(c)这样的氨基酸序列:该氨基酸序列为seqidno:5或seqidno:20的序列的片段或与seqidno:5或seqidno:20的氨基酸序列85%一致的氨基酸序列的片段。

本发明还提供一种与o-聚糖、o-糖肽和/或o-糖蛋白结合的方法,其中该方法包括使包含o-聚糖、o-糖肽和/或o-糖蛋白的样品与本发明的多肽接触,以及任选地确定是否已结合o-聚糖、o-糖肽或o-糖蛋白和/或从所得混合物中使o-聚糖与任何连接的糖蛋白、o-糖肽或o-糖蛋白分离。

另外,提供一种用于评估蛋白质的糖基化状态的方法,该方法包括使包含蛋白质的样品与本发明的多肽接触,以及确定蛋白质是否与所述多肽结合。

还提供了一种用于检测样品中o-糖肽和/或o-糖蛋白的方法,其中该方法包括:

(a)使所述样品与本发明的多肽接触,从而使得在本发明的多肽与o-连接的糖肽和/或o-糖蛋白之间形成复合物(o-连接的糖肽/蛋白质-多肽复合物);

(b)任选地从接触的样品中分离出所述多肽;和

(c)确定分离的多肽是否与o-连接的糖肽或糖蛋白结合,从而确定样品中存在或不存在o-连接的糖肽或糖蛋白。

附图说明

图1:ls的表达和纯化。ls在pet21(a)+载体中表达为具有c末端his-tag的融合蛋白。转化进bl21(de3)star后,表达了四个单独的克隆,并在hisgravityflow柱上纯化至均一。基于纯化样品中蛋白质的总量以及基于sds-page的纯度,所研究的所有四个克隆均同样表达良好。

图2:ls特异性作用于含有o-聚糖的蛋白质-图中显示了通过sds-page分析的产物。ls与igg或iga孵育导致iga特异性降解,但对igg(赫赛汀/曲妥珠单抗)没有明显的活性。所有孵育均在37℃下在pbs中进行。在这些条件下,添加唾液酸酶(am0707)不是ls的活性所需的。

图3:最佳酶促条件。ls在很宽的ph范围内有活性(a),能很好地耐受nacl(b),但对edta高度敏感(c,d),并且被zn2+部分抑制(d)。所有实验(ph测定除外)均在pbs中在37℃下过夜进行。为了确定优化ph,将酶在20mmtris-hcl(ph6.8-8.8)或50mm乙酸(ph5.6)中孵育。

图4:聚糖组成调节ls的活性。(a)在用ls水解30分钟之前依次去除特定聚糖导致在唾液酸化蛋白中的活性非常低,在去唾液酸化蛋白中的活性高,而在除去半乳糖的样品中则没有活性。(s)唾液酸酶,(sg)唾液酸酶和半乳糖苷酶,(ls)ls。(b)长时间孵育(过夜)经完全糖基化的糖蛋白(enbrel)或经唾液酸酶处理的糖蛋白(enbrel(s))导致两个样品中完全水解。enbrel在本文中也可称为依那西普(etanercept)。(c)用唾液酸酶(“唾液酸酶”)、o-糖苷酶/唾液酸酶(“o-糖”)或pngasef(“n-糖”)预处理依那西普的tnfα结合部分(tnfαr),以分别除去唾液酸、o-聚糖和n-聚糖。将ls添加到样品中,并在分析前继续过夜孵育。ls在除了用o-糖苷酶处理的那些样品之外的所有样品中外均具有活性。

图5:搜索结果显示ls水解了o-聚糖的糖蛋白n末端。对用ls水解成片段且随后用o-糖苷酶处理去糖基化的对依那西普进行质谱分析(lc/ms和ms/ms)。根据m/z值和ms/ms数据,将鉴定出的肽(白色和阴影框)拟合到依那西普序列上,y'和b'离子标被记为小灰色框。所有灰色和阴影框(例如肽)直接以o-聚糖所连接的t或s开始。前面的氨基酸变化(p、s、h、t、g),并且似乎可能不影响水解。(a)使用偏倚方法(biasedapproach),特别是搜索由s/t肽酶生成的肽,进行分析。(b)使用无偏方法(unbiasedapproach)进行分析。

图6:灭活的ls特异性结合o-连接的糖蛋白。使金属蛋白酶活性位点突变以除去催化能力,同时不影响底物亲和力或相互作用。具体而言,这是通过将e换为a来完成的,从而创建克隆“lsmut”(也称为lse206a)。(a)虽然在唾液酸酶存在下ls能够水解enbrel,但失活的lsmut在测试条件下不能水解enbrel。sds-page证实活性丧失。(b)尽管失去了水解活性,但lsmut仍然能够与o-糖蛋白结合。在具有固定lse206a的旋转柱上验证了特异性结合,证明对o-连接的糖蛋白具有特异性亲和力。通过将lsmut固定在琼脂糖凝胶(sepharose)上,我们能够对iga进行亲和纯化。缺乏o-聚糖的赫赛汀(曲妥珠单抗)以及o-糖苷酶处理的iga不与柱子结合,但可以在流过液(ft)中检测到。neur=神经氨酸酶/唾液酸酶0707。

图7:α2-3键合的唾液酸限制了ls的效率。使用enbrel作为糖蛋白底物,将ls与一系列不同的唾液酸酶同时孵育30分钟至20小时,显示在存在α2-3特异性唾液酸酶1757或混合液(0707+1757)的情况下效率更高,而广谱唾液酸酶0707并不是ls的似乎完全的活性所必需的,因此表明α2-6(和α2-8)键与ls活性无关。

图8:ls活性的示意图。ls优先结合连接至o-连接的galnac的末端半乳糖,导致连接有聚糖的丝氨酸或苏氨酸的n末端水解。唾液酸的存在会降低ls的效率,但不会抑制ls。在n-连接的聚糖上不能观察到活性。

图9:促红细胞生成素用ls、用于去除n-聚糖的pngasef、用于去除唾液酸的唾液酸酶以及与用于去除o-聚糖的o-糖苷酶的不同组合切割的实验结果。通过sds-page、rplc和esi质谱来分析反应产物。(a)sds-page分析的结果:泳道1=用pngasef和唾液酸酶处理的epo;泳道2=用pngasef和唾液酸酶+ls处理的epo;泳道3=用pngasef+ls处理的epo;泳道4=用pngasef、唾液酸酶、o-糖苷酶然后用ls处理的epo;泳道5=酶对照。条带x=未切割的epo;条带y=ls消化的epo的n末端片段;条带z=ls消化的epo的c末端片段。泳道2和3显示在唾液酸已被去除的情况下以及在它们完好的情况下,ls切割epo。泳道2–3显示ls也切割epo,其中n-聚糖被pngasef去除。泳道4显示,ls没有切割epo,其中o-聚糖已被去除。(b)uv色谱图显示了用pngasef和唾液酸酶+ls处理的epo的rplc分离结果。如图所示,鉴定出两个主峰。峰1是被ls消化的epo的c末端片段;峰2是被ls消化的epo的n末端片段;(c,d)显示了质谱分析的结果。图c显示了具有仍然与(目前是n末端的)丝氨酸连接的o聚糖的epo的c末端片段的质量(正方形=glcnac,圆圈=半乳糖)。质量差异是由于样品中某些部分的o-聚糖的降解(损失末端半乳糖)的差异而引起的,这很可能是ms仪器中的电离能引起的。图d显示了缺少聚糖的epo的n末端片段,加上仍连接有聚糖的未消化的epo。

图10:显示lse206a保留一定活性而lsh205a/e206a(也可以称为lshe206aa)完全失活的实验结果。针对包含依那西普的tnfα结合部分(tnfar2;在本文中也称为tnfar)和依那西普本身(etanercept)的去唾液酸化o糖基化底物,评估了ls突变体lse206a(a)和lsh205a/e206a(b)对比野生型ls酶的活性。将不同浓度的ls突变体添加到1mg底物(1:1至15:1,酶:底物),在pbs中在37℃下孵育过夜,然后在sds-page上分析。

a)泳道1:仅去唾液酸化底物;泳道2:仅ls,泳道3:0.5μglse206a,泳道4:5μglse206a,泳道5:tnfar2+ls(比例为1:1),泳道6:tnfar2+lse206a(比例为1:1)。

b)泳道1:仅去唾液酸化底物;泳道2:lsh205a/e206a+依那西普(比例为15:1),泳道3:lsh205a/e206a+依那西普(比例为5:1),泳道4:lsh205a/e206a+依那西普(比例为1:1),泳道5:ls+依那西普(比例为1:1),泳道6:lsh205a/e206a。

图11:显示固定在树脂上的lsh205a/e206a与含有o-聚糖的蛋白质特异性结合的实验结果。图中显示了在每种情况下对起始/装载材料、流过液(ft)和洗脱液(e)的sds-page分析:(a)包含bsa(牛血清白蛋白)、依那西普、iga和igg的样品,该样品是天然的或用如所示的唾液酸酶混合物+/-o-糖苷酶预处理的;(b)包括o-糖基化蛋白(tnfαr和apoe)、n-糖基化蛋白(阿柏西普(aflibercept)、agp(α-1-酸糖蛋白)、iggfc(igg的fc结构域)和非糖基化蛋白(bsa)的混合物的样品用唾液酸酶混合物预处理。(c)包括n-糖基化蛋白(西妥昔单抗、阿柏西普、agp)和非糖基化蛋白(bsa、碳酸酐酶)和混合物的样品用唾液酸酶混合物预处理。

图12:显示固定的lsh205a/e206a具有结合o-糖蛋白的浓度依赖性能力的实验结果。去唾液酸化依那西普(50-250μg;100μl在pbs中)添加到50μlpbs平衡的具有不同的lsh205a/e206a固定条件(5-15mg/ml)的lsh205a/e206a树脂中。在室温下通过颠倒旋转使蛋白质与树脂结合2小时。将树脂用pbs(350μl)洗涤3次,然后通过添加8m尿素(50μl,5分钟孵育;重复两次)洗脱。为了研究尿素和盐酸胍(ghcl)在结合中的作用,将其与50μg去唾液酸化依那西普一起包含在结合缓冲液中,但处理方法相同。(a)所有样品在sds-page上分离,并使用geldocez和imagelab软件通过光密度测定法确定条带强度。所示的百分比表示与对照相比的条带强度。(b),将根据条带强度确定的蛋白质结合能力相对固定的lsh205a/e206a的量作图。

图13:显示lsh205a/e206a可以对约3mg依那西普/ml树脂进行亲和纯化的实验结果。去唾液酸化依那西普(10-200μg;在pbs中为100μl)添加到50μlpbs平衡的lsh205a/e206a树脂中。在室温下通过颠倒旋转使蛋白质与树脂结合2小时。将树脂用pbs(350μl)洗涤3次,然后通过添加8m尿素(50μl,5分钟孵育;重复两次)洗脱。所有样品在sds-page上分离,并使用geldocez和imagelab软件通过光密度测定法确定条带强度。所示的百分比表示与对照相比的条带强度。

图14:显示lsh205a/e206a-底物的相互作用对高离子强度和缓冲液体积/类型的差异不敏感且可在较宽的ph范围内工作的实验结果。(a)所示的去唾液酸化依那西普(50μg;在pbs中为100μl)与以不同浓度添加的nacl;(b)如所示的去唾液酸化依那西普(50μg;在pbs中为100-300μl);(c)来自去唾液酸化依那西普(50μg)和bsa(50μg)的样品在不同缓冲液中不同的ph下的流过液;(d)来自c样品的洗脱液。

图15:显示变性或添加去污剂洗脱与lsh205a/e206a结合的o-糖蛋白的实验结果。去唾液酸化依那西普(50μg;在pbs中为100μl)添加到50μlpbs平衡的lsh205a/e206a树脂中。在室温下通过颠倒旋转使蛋白质与树脂结合2小时。将树脂用pbs(350μl)洗涤3次,然后通过添加1m至8m尿素或1.25%至10%sds(50μl,5分钟孵育;重复两次)洗脱。所有样品在sds-page上分离以用于分析。

图16a:使用ls酶促洗脱lsh205a/e206a结合的o-糖蛋白的实验结果。去唾液酸化阿巴西普(10μg;在pbs中为100μl)和依那西普(50μg;在pbs中为100μl)添加到50μlpbs平衡的lsh205a/e206a树脂中。在室温下通过颠倒旋转使蛋白质与树脂结合2小时。将树脂用结合缓冲液(350μl)洗涤3次,然后添加在总体积为100μlpbs中的50个单位的ls。将样品在摇动(450rpm)下于37℃下再孵育6至24小时。通过离心(1000g,1分钟)收集ls释放的o糖蛋白/糖肽,然后通过添加8m尿素(50μl,5分钟孵育;重复两次)最后洗脱柱子。所有样品在sds-page上分离以用于分析。

图16b:用ls洗脱的依那西普的质谱分析(lc/ms和ms/ms)结果。鉴定出的肽(图16b.1)与依那西普在ls消化中产生的肽(图16b.2)一致。根据m/z值和ms/ms数据,将鉴定出的肽(白色方框)拟合到依那西普的序列上,y'和b'离子标记为小灰方框。所有白框(例如肽)直接从与o-聚糖连接的t或s处开始。

图17:表明o-糖基化血清蛋白的亲和纯化和富集的结果。(a)去唾液酸化血清(20μl;在pbs中为100μl)添加到50μlpbs平衡的lsh205a/e206a树脂中。在室温下通过颠倒旋转使蛋白质与树脂结合2小时。将树脂用结合缓冲液(350μl)洗涤3次,然后通过添加8m尿素洗脱。(b)为了研究聚糖对相互作用的影响,将样品用唾液酸酶混合物+/-o-糖苷酶预处理。如上所述进行下游纯化。(c)将血清(40μl)与pbs(高达100μl)和唾液酸酶混合物(50-500个单位)混合,并添加到pbs平衡的柱子,在室温下孵育2小时并颠倒旋转,此后如上所述洗涤并洗脱样品。所有样品在sds-page上分离以用于分析。

图18:显示来自人血清中的o-糖蛋白富集的结果。将在pbs中稀释2.5倍至100μl的人血清涂在旋转柱中的50μlpbs平衡的lsh205a/e206a树脂。添加50-500个单位的唾液酸酶混合物并在室温下在树脂上共孵育2小时。收集流过液,并用pbs洗涤树脂5至10次。结合的蛋白在8m尿素中洗脱,然后通过添加5mmdtt并在37℃下孵育60分钟来变性和还原。将还原的半胱氨酸在室温下和黑暗中用15mm碘乙酰胺烷基化30分钟。在旋转脱盐柱上使样品进行缓冲液交换至50mmtrisph8.0中。将胰蛋白酶(2.5μg)添加到溶液中,并在37℃下消化过夜。使用rp-lcms/ms在c18柱上以0.1%fa的mq溶液:0.1%fa的95%acn的梯度溶液以45℃及0.2ml/分钟的流量分离并分析肽。检测在esi-q-tof上进行。数据转换为mgf格式文件,并在swissprot数据库中进行搜索(a)鉴定出的肽来自标注为o-糖基化蛋白或非o-糖基化蛋白的蛋白。仅包括具有>6个匹配肽且mascot得分>200的蛋白。(b)不同的洗涤步骤导致所鉴定出的肽的变化,以及o-糖基化蛋白与非o-糖基化蛋白的比例改变(c)sia=唾液酸酶处理的;siapre=唾液酸酶预处理的。

图19:显示固定的双突变体也与较短的o-糖肽结合的实验结果。a显示了与o-糖基化肽(糖基果蝇肽(glycodrosocin;gd))和几种非糖基化肽(h2686、h4062、h8390和胰岛素氧化的β链(iob))的制备的混合物结合的lc/ms分析代表性结果。b显示了iga的示意图,展示胰蛋白酶消化将产生单个o-糖基化的肽。c显示了与iga的胰蛋白酶消化物结合的lc/ms分析的代表性结果。

图20:显示固定的双突变体比其他可商购的o-糖蛋白结合基质有优势。a显示了代表性的sds-page凝胶,比较了在与所示的不同的固定的凝集素或ls双突变体孵育后,流过液(ft)或洗脱液(e)中的依那西普或去唾液酸化依那西普(依那西普(s))的存在。b显示相对于1.5μg直接加样底物阳性对照的凝胶光密度分析。

序列的简要说明

seqidno:1是具有o-糖蛋白特异性内切蛋白酶活性的多肽的氨基酸序列。

seqidno:2是具有o-糖蛋白特异性内切蛋白酶活性的本发明示例性多肽的氨基酸序列。相对于seqidno:1,seqidno:2在n末端包括另外的甲硫氨酸,并且在c末端包括接头+his6标签。由该序列组成的多肽在本文中可以称为ls。

seqidno:3是编码具有seqidno:2的序列的多肽的核苷酸序列。

seqidno:4是具有o-糖蛋白特异性内切蛋白酶活性的自嗜粘蛋白艾克曼菌分出的多肽的野生型氨基酸序列。相对于seqidno:1,seqidno:4包括n末端的信号基序。

seqidno:5是能够与o-聚糖结合但缺乏o-糖蛋白特异性内切蛋白酶活性或具有降低的o-糖蛋白特异性内切蛋白酶活性的多肽的氨基酸序列。

seqidno:6是能够与o-聚糖结合但缺乏o-糖蛋白特异性内切蛋白酶活性或具有降低的o-糖蛋白特异性内切蛋白酶活性的本发明示例性多肽的氨基酸序列。相对于seqidno:5,seqidno:6包括另外的n末端甲硫氨酸和c末端接头+his6标签。由该序列组成的多肽在本文中可以称为lse206a。

seqidno:7是编码具有seqidno:6的序列的多肽的核苷酸序列。

seqidno:8是具有o-糖蛋白特异性内切蛋白酶活性的本发明示例性多肽的金属蛋白酶结构域基序。

seqidno:9是自嗜粘蛋白艾克曼菌分出的唾液酸酶am1757的野生型氨基酸序列。seqidno:9包括n末端的信号基序。

seqidno:10是唾液酸酶am1757的野生型氨基酸序列,相对于seqidno:9缺少n末端的信号基序。

seqidno:11是示例性唾液酸酶am1757的氨基酸序列。相对于seqidno:10,seqidno:11包括另外的n末端甲硫氨酸和c末端接头+his6标签。

seqidno:12是自嗜粘蛋白艾克曼菌分出的唾液酸酶am0707的野生型氨基酸序列。seqidno:12包括n末端的信号基序。

seqidno:13是唾液酸酶am0707的野生型氨基酸序列,相对于seqidno:12在n末端缺少信号基序。

seqidno:14是示例性唾液酸酶am0707的氨基酸序列。相对于seqidno:13,seqidno:14包括另外的n末端甲硫氨酸和c末端接头+his6标签。

seqidno:15是自口腔链球菌(s.oralis)分出的o-糖苷酶的氨基酸序列。

seqidno:16和17是引物序列。

seqidno:18显示了epo的氨基酸序列。

seqidno:20是能够与o-聚糖结合但缺乏o-糖蛋白特异性内切蛋白酶活性或具有降低的o-糖蛋白特异性内切蛋白酶活性的多肽的氨基酸序列。

seqidno:21是能够与o-聚糖结合但缺乏o-糖蛋白特异性内切蛋白酶活性或具有降低的o-糖蛋白特异性内切蛋白酶活性的本发明示例性多肽的氨基酸序列。相对于seqidno:20,seqidno:21包括另外的n末端甲硫氨酸和c末端接头+his6标签。由该序列组成的多肽在本文中可以称为lshe206aa或lsh205a/e206a。

seqidno:22是编码具有seqidno:21的序列的多肽的核苷酸序列。

seqidno:23、24和25是被破坏的金属蛋白酶结构域基序的序列,各自来自能够与o-聚糖结合但缺乏o-糖蛋白特异性内切蛋白酶活性或具有降低的o-糖蛋白特异性内切蛋白酶活性的本发明的多肽。

seqidno:26、27和28是各自具有o-糖蛋白特异性内切蛋白酶活性的多肽的氨基酸序列。

seqidno:29、30和31是具有o-糖蛋白特异性内切蛋白酶活性的示例性多肽的氨基酸序列。相对于seqidno:26、27和28,seqidno:29、30和31各自包括另外的n末端甲硫氨酸和c末端接头+his6标签。

seqidno:32、33和34分别是自铜绿假单胞菌(pseudomonasaeruginosa)pao1、多形拟杆菌(bacteroidesthetaiotaomicron)vpi-5482和产气荚膜梭菌(clostridiumperfringens)分出的具有o-糖蛋白特异性内切蛋白酶活性的多肽的野生型氨基酸序列。分别地,相对于seqidno:26、27和28,各自包含n末端的信号基序。

seqidno:35、36和37是各自能够与o-聚糖结合但缺乏o-糖蛋白特异性内切蛋白酶活性或具有降低的o-糖蛋白特异性内切蛋白酶活性的多肽的氨基酸序列。

seqidno:38、39和40是各自能够与o-聚糖结合但缺乏o-糖蛋白特异性内切蛋白酶活性或具有降低的o-糖蛋白特异性内切蛋白酶活性的本发明示例性多肽的氨基酸序列。分别地,相对于seqidno:35、36和37,seqidno:38、39和40各自包括另外的n末端甲硫氨酸和c末端接头+his6标签。

seqidno:41至43是o-糖蛋白特异性内切蛋白酶的代表性金属蛋白酶基序的氨基酸序列。

seqidno:44至46是能够与o-聚糖结合但缺乏o-糖蛋白特异性内切蛋白酶活性或o-糖蛋白特异性内切蛋白酶活性降低的多肽的代表性破坏性金属蛋白酶基序的氨基酸序列。

seqidno:47是糖基果蝇肽的氨基酸序列。t残基上有o-糖基化位点。

seqidno:48至50是未被o-糖基化的肽的氨基酸序列。

具体实施方式

应当理解,所公开的产品和方法的不同应用可以适合于本领域的特定需求。还应理解,本文所用的术语仅出于描述本发明的特定实施方式的目的,而并非旨在进行限制。本文引用的所有出版物、专利和专利申请,无论是上文还是下文中的,均通过引用全文并入本文。

除非文中另外明确指出,如在本说明书和所附权利要求书中所使用的,单数形式“一个/一种(a/an)”和“该(the)”包括复数个指示物。因此,例如,提及“多肽(apolypeptide)”包括“多个多肽(polypeptides)”等。

一般的多肽特征

“多肽”在本文以最广泛的意义使用,是指两个或更多个亚基氨基酸、氨基酸类似物或其他拟肽的化合物。因此,术语“多肽”包括短肽序列以及更长的多肽和蛋白质。术语“蛋白质”、“肽”和“多肽”可以互换使用。如本文所用,术语“氨基酸”是指天然和/或非天然或合成的氨基酸,包括d或l旋光异构体,以及氨基酸类似物和拟肽。

多肽可以通过合适的方法产生,包括重组或合成方法。例如,多肽可以使用本领域已知的标准技术直接合成,例如fmoc固相化学、boc固相化学或通过溶液相肽合成。可供选择地,可以通过用编码所述多肽的核酸分子或载体转化细胞,通常转化细菌细胞来产生多肽。下文描述了并且在实施例中举例说明了通过在细菌宿主细胞中表达来产生多肽的方法。本发明提供了编码本发明多肽的核酸分子和载体。本发明还提供了包含这种核酸或载体的宿主细胞。编码本文公开的多肽的示例性多核苷酸分子以seqidno:3和7提供。这些序列中的每一条在5”端包括n末端甲硫氨酸(atg)的密码子,并且在3端在终止密码子(taa)之前包括gly-ser-gly接头和6xhis标签的密码子,可以任选不包括所述gsgle接头和6xhis标签的密码子。下文将更详细地讨论另外的甲硫氨酸和标签的任性包含。

术语“核酸分子”和“多核苷酸”在本文可互换使用,并且是指任何长度的核苷酸(无论是脱氧核糖核苷酸还是核糖核苷酸)的聚合形式或其类似物。多核苷酸的非限制性实例包括基因、基因片段、信使rna(mrna)、cdna、重组多核苷酸、质粒、载体、任何序列的分离的dna、任何序列的分离的rna、核酸探针和引物。本发明的多核苷酸编码本发明的多肽,并且可以以分离的或基本上分离的形式提供。基本上分离是指可以从任何周围介质中基本上但不完全分离多肽。可以将多核苷酸与不会干扰其预期用途的运载体或稀释剂混合,并且仍然被认为是基本上分离的。“编码”所选多肽的核酸序列是这样一种核酸分子,所述核酸分子在受适当调控序列控制时,在活体内转录(对于dna而言)并翻译(对于mrna而言)成多肽,例如在表达载体中。编码序列的边界由5'(氨基)末端的起始密码子和3'(羧基)末端的翻译终止密码子确定。出于本发明的目的,这样的核酸序列可以包括但不限于来自病毒的cdna、原核或真核mrna、来自病毒的基因组序列、或原核dna或rna,甚至合成的dna序列。转录终止序列可以位于编码序列的3'处。

多核苷酸可以根据本领域众所周知的方法来合成,如例如sambrooketal.(1989,分子克隆-实验指南(molecularcloning-alaboratorymanual);冷泉港出版社)中所描述。本发明的核酸分子可以以表达盒的形式提供,所述表达盒包括可操作地连接至插入序列的控制序列,从而允许本发明的多肽在活体内(例如,在原核或真核表达系统中)表达。这些表达盒又通常在载体(例如质粒或重组病毒载体)内提供。可以将这样的表达盒直接给药至宿主对象。可供选择地,可以将包含本发明的多核苷酸的载体给药至宿主对象。优选地,使用遗传载体进行多核苷酸制备和/或给药。合适的载体可以是能够携带足量的遗传信息并允许表达本发明的多肽的任何载体。

因此,本发明包括包含这样的多核苷酸序列的表达载体。这样的表达载体在分子生物学领域中是常规构建的,并且例如可以涉及使用质粒dna和适当的起始子、启动子、增强子和其他元件,例如,为了允许表达本发明的肽而可能是必要的并且以正确的取向定位的聚腺苷酸化信号。其他合适的载体对本领域技术人员来说将是显而易见的。作为在这方面的进一步的实例,我们参考sambrooketal.。

本发明还包括已经修饰以表达本发明的多肽的细胞。这样的细胞通常包括原核细胞,例如细菌细胞,例如大肠杆菌。可以使用常规方法培养这样的细胞以产生本发明的多肽。

多肽可以衍生化或经修饰以有助于该多肽的产生、分离或纯化。例如,在通过细菌宿主细胞中的重组表达来产生本发明的多肽的情况下,该多肽的序列可以在n末端包含另外的甲硫氨酸(m)残基以改善表达。作为另一个实例,本发明的多肽可以通过添加能够直接且特异性地与分开手段结合的配体来衍生化或进行修饰。可供选择地,多肽可以通过添加结合对中的一个成员来衍生化或进行修饰,并且分开手段包括通过添加结合对中的其他成员而衍生化或进行修饰的试剂。可以使用任何合适的结合对。在用于本发明的多肽通过添加结合对中的一个成员而衍生化或进行修饰的优选实施方式中,该多肽优选是组氨酸标记的或生物素标记的。通常,在基因水平上包括组氨酸或生物素标签的氨基酸编码序列,并且该多肽在大肠杆菌中进行重组表达。组氨酸或生物素标签通常存在于多肽的任一端,优选地在c末端。组氨酸或生物素标签可以与多肽直接连接或通过任何合适的接头序列(例如3、4或5个甘氨酸残基或甘氨酸和丝氨酸残基的混合物)间接连接。组氨酸标签通常由六个组氨酸残基组成,尽管组氨酸标签可以比这更长,通常多达7、8、9、10或20个氨基酸,或更短,例如5、4、3、2或1个氨基酸。

多肽可以以基本上分离的或纯化的形式提供。也就是说,从存在于表达多肽的细胞的细胞提取物中的其他大部分成分中分离的。将理解的是,基本上纯化是指多肽被纯化至至少50%、60%、70%、80%或优选至少90%同质性。纯度水平可通过任何合适的方法进行评估,但通常涉及样品的sds-page分析,然后进行考马斯蓝检测。多肽可以与不会干扰多肽预期目的的运载体、稀释剂或防腐剂混合,并且仍被为是基本上分离的或纯化的。在多肽提供于具有另外的活性成分例如另一种多肽的组合物中的情况下,则将每种所述多肽分别纯化至高水平的同质性,然后以适当的比例混合以用于各自的预期目的。例如,可以将两种多肽各自纯化至至少90%的同质性,然后以1:1的比例组合。

多肽(或其混合物)可以以适于在使用前在水溶液中重构的冻干形式提供。冻干的组合物具有改善的稳定性,使得能够更长久地储存多肽。本文提供了一种制备冻干形式的多肽(或其混合物)的方法,所述方法包括在合适的缓冲液(例如tris-缓冲盐水(tbs))中冷冻干燥所述多肽(或混合物)。多肽在冷冻干燥之前通常是基本上纯化的。还提供了冻干形式的所得多肽(或混合物)。还提供了一种制备多肽(或混合物)的溶液的方法,该方法包括提供冻干形式的多肽(或混合物)并用合适的运载体或稀释剂(例如水)重构。

多肽可以使用本领域已知的方法固定,例如dattasetal.,enzymeimmobilization:anoverviewontechniquesandsupportmaterials,3biotech,3(1):1-9(2013)中所述。例如,可以通过吸附、共价结合、亲和力固定或包封来固定多肽。可用作支持物的材料包括但不限于,例如天然支持物(例如琼脂糖(agarose)、胶原、明胶、纤维素、果胶、琼脂糖凝胶)、无机材料(例如陶瓷、二氧化硅、玻璃、活性炭或木炭)或合成聚合物。例如,多肽可以固定在任选地作为树脂提供的琼脂糖凝胶、或琼脂糖上。

具有内切蛋白酶活性的多肽

具有内切蛋白酶活性的多肽的功能特征

在一种实施方式中,本发明涉及一种对o-糖基化蛋白具有特异性内切蛋白酶活性的多肽。换句话说,该多肽具有o-糖蛋白特异性内切蛋白酶活性。该多肽切割任何o-连接的糖蛋白,优选任何o-连接的人糖蛋白。o-连接的糖蛋白的实例包括包含免疫球蛋白的全部或部分的或由免疫球蛋白的全部或部分组成的任何蛋白质,包括全长抗体、fc片段和fc融合蛋白,特别是iga、igd和igg3同种型的那些。o-连接糖蛋白的另一个实例是依那西普,依那西普具有许多o-糖基化位点,是人tnfα受体2的配体结合域与igg1的fc部分连接的融合蛋白。o-连接糖蛋白的其他实例包括促红细胞生成素(epo)、tnfα受体、胎球蛋白和纤溶酶原。

底物糖蛋白的水解(即切割)通常以高特异性发生在o-糖基化丝氨酸或苏氨酸的n末端和紧密接近o-糖基化丝氨酸或苏氨酸的肽键处,并且是o-聚糖依赖性的。本发明的多肽优选能够切割这种与底物糖蛋白中的每个o-糖基化位点紧密接近的肽键。该反应优选不显示任何氨基酸特异性或限制性,并且特别地,不需要任何特定的氨基酸存在于o-糖基化的丝氨酸或苏氨酸的n末端。当使用标准质谱参数评估时,通常观察到切割位点在与每个o-糖基化残基的n末端紧邻的肽键处。

给定多肽的内切蛋白酶活性和特异性可以通过合适的测定手段来确定。例如,可以将标准的o-糖蛋白底物(例如iga分子或促红细胞生成素(epo))与测试多肽一起孵育。然后可以通过sds-page和/或质谱来分析起始材料和反应产物,以确定切割产物(如果有的话)的存在,并且如果需要还可以进一步表征那些产物。未o-糖基化的糖蛋白底物(例如igg1分子)可以用作阴性对照。可以将结果与在底物与本发明的示例性多肽(例如由seqidno:2的氨基酸序列组成的多肽)接触时在相同测定中获得的结果进行比较。一个单位的seqidno:2的多肽定义为根据sds-page的监测,与一个单位唾液酸酶混合物组合在20mmtris缓冲液(ph6.8)中37℃下过夜消化大约90%的1μg促红细胞生成素(epo)所需的量(优选的唾液酸酶混合物在下文中进一步描述)。测试多肽优选在以相同的量存在时达到相似的活性水平。示例性测定也在实施例中进行描述。

具有内切蛋白酶活性的多肽的结构特征

本部分列出了根据该实施方式的多肽的结构特征,除了在前一部分中概述的功能特征外,这些结构特征也适用。

多肽的长度通常至少为150、200、250、275、280、290、300、310、320、330、340、350或360个氨基酸。多肽的长度通常不大于400、395、390、385、380、375、370或365个氨基酸。应当理解,以上列出的任何下限可以与以上列出的任何上限组合以提供多肽长度的范围。例如,该多肽的长度可以为150至400个氨基酸,或长度为280至380个氨基酸。多肽的长度优选为340至380个氨基酸,多肽的长度最优选为360至375个氨基酸。

多肽的一级结构(氨基酸序列)基于嗜粘蛋白艾克曼菌的amuc1119基因所编码的多肽的一级结构。该多肽的完整序列示于seqidno:4,该序列包括第1至24位上的信号基序。去除了信号基序的序列示于seqidno:1。

本发明的多肽可以包含seqidno:1的序列、基本上由seqidno:1的序列组成或由seqidno:1的序列组成。

可供选择地,本发明的多肽可以包含以下、基本上由以下组成或由以下组成:与seqidno:1的氨基酸序列至少50%一致的seqidno:1的氨基酸序列的变体。变体序列可以与seqidno:1的氨基酸序列至少60%、至少70%、至少80%、至少、85%、至少90%、至少95%、至少98%或至少99%一致。一致性水平优选为至少85%或更高。相对于seqidno:1的序列的一致性可以在seqidno:1所示的序列的至少100、至少200、至少300或至少350或更多个连续氨基酸的区域上测量,或更优选在seqidno:1的全长上测量。变体的长度通常比参考序列长或短不超过50个氨基酸,并且优选具有与参考序列大约(或完全)相同的长度。

可以使用任何合适的算法来计算氨基酸一致性。例如,pileup和blast算法可用于计算一致性或将序列对齐(例如识别等效序列或相应序列(通常在其默认设置上)),如在altschuls.f.(1993)jmolevol36:290-300;altschul,s,fetal(1990)jmolbiol215:403-10中所描述。进行blast分析的软件可通过美国国家生物技术信息中心(nationalcenterforbiotechnologyinformation;http://www.ncbi.nlm.nih.gov/)公开获得。该算法涉及首先通过在与数据库序列中相同长度的字比对时在匹配或满足一些正值阈值得分t的查询序列中鉴定长度为w的短字来鉴定高评分序列对(hsp)。t被称为邻近字得分阈值(altschuletal,同上)。这些最初的邻近字命中充当启动搜索以查找包含它们的hsp的种子。字命中沿着每个序列在两个方向上延伸,直到可以增加累积比对得分为止。在以下情况下,停止在每个方向上的字命中扩展:累积比对得分从其最大实现值下降了数量x;由于一个或多个负得分残基比对的累积,累积得分变为零或更低;或到达任一序列的末尾。blast算法参数w、t和x确定比对的灵敏度和速度。blast程序使用默认值字长(w)为11,blosum62评分矩阵(请参见henikoffandhenikoff(1992)proc.natl.acad.sci.usa89:10915-10919)比对(b)为50,期望(e)为10,m=5,n=4,以及对两条链的比较。

blast算法对两个序列之间的相似性进行统计分析。参见例如karlinandaltschul(1993)proc.natl.acad.sci.usa90:5873-5787。blast算法提供的一种相似性度量是最小总和概率(p(n)),最小总和概率(p(n))提供偶然会发生两个多核苷酸或氨基酸序列匹配的概率的指示。例如,如果第一序列与第二序列相比的最小总和概率小于约1,优选小于约0.1,更优选小于约0.01,并且最优选小于约0.001,则认为该序列与另一个序列相似。可供选择地,uwgcg软件包提供bestfit程序,该程序可用于计算一致性(例如以其默认设置使用)(devereuxetal(1984)nucleicacidsresearch12,387-395)。

本发明的多肽的序列可以包含相对于seqidno:1氨基酸序列进行了修饰(例如氨基酸添加、缺失或取代)的seqidno:1序列的变体。除非另有说明,修饰优选是保守氨基酸取代。保守取代用具有相似化学结构、相似化学性质或相似侧链体积的其他氨基酸来替代氨基酸。所引入的氨基酸可以具有与它们所替代的氨基酸相似的极性、亲水性、疏水性、碱性、酸性、中性或电荷。可供选择地,保守取代可以引入另一种芳族或脂族氨基酸替代现有的芳族或脂族氨基酸。保守的氨基酸变化是本领域熟知的,并且可以根据以下表a1中定义的20种主要氨基酸的性质进行选择。在氨基酸具有相似的极性的情况下,可以通过参考表a2中氨基酸侧链的亲水性等级来确定。本发明的多肽序列可以包含seqidno:1的氨基酸序列进行了多达10、20、30、40、50或60个保守取代的变体。

表a1-氨基酸的化学性质

表a2-亲水等级

本发明的多肽的氨基酸序列可以包含如上所述的seqidno:1的氨基酸序列的变体。然而,seqidno:1的氨基酸序列中的某些残基优选保留在所述变体序列内。例如,所述变体序列通常保留已知内切蛋白酶活性所需的某些残基。因此,优选将seqidno:1的第182位(与seqidno:4的第206位对应)的谷氨酸保留在本发明多肽的氨基酸序列中。该残基被认为是在活性部位进行电子转移所需的。因此,本发明的多肽通常包括seqidno:1的氨基酸序列的变体,所述变体在所述变体序列的与seqidno:1的第182位对应的位置处具有谷氨酸(e)。类似地,seqidno:1的第181位(与seqidno:4的第205位对应)上的组氨酸优选保留在本发明多肽的氨基酸序列中。该残基被认为是与锌离子辅因子结合所需的。

所述谷氨酸和所述组氨酸残基通常都包含在具有基序hebbh的金属蛋白酶结构域中,其中b是不带电荷的氨基酸,例如氨基酸a、c、f、g、i、l、m、n、p、q、s、t、v或w。这样的结构域的优选实例有序列helgh(seqidno:41),该序列与seqidno:1的第181至185位对应(与seqidno:4的第205至209位对应)。从而,本发明的多肽通常包含seqidno:1的氨基酸序列的变体,该变体在与seqidno:1的第181至185位对应的位置处包含基序hebbh(例如heigh(seqidno:42)或helgh,优选helgh)。本发明的多肽通常包含位于金属蛋白酶结构域c末端的o-聚糖特异性结合域。

基序hebbh可在具有基序abxhebbhbc的较大的金属蛋白酶结构域内受损,其中a是氨基酸v、t或g,b是不带电荷的氨基酸,例如氨基酸a、c、f、g、i、l、m、n、p、q、s、t、v或w,x是任何氨基酸,c是疏水性氨基酸,例如a、c、f、i、l、m、p、v、w或y。这样的结构域的优选实例具有序列gmahelghgl(seqidno:8),该序列与seqidno:1的第178至187位对应(seqidno:4的第202至211位)。其它实例包括gvahelghnf(seqidno:43)。因此,本发明的多肽优选包含seqidno:1的氨基酸序列的变体,该变体包含在与seqidno:1的第178至187位对应的位置处的基序abxhebbhbc(例如gmahelghgl或gvahelghnf,优选gmahelghgl)。本发明的多肽通常包含位于金属蛋白酶结构域c末端的o-聚糖特异性结合域。

可供选择地,本发明的多肽可包含以下,基本上由以下组成或由以下组成:seqidno:1的较短片段或其如上所述的变体。所述片段可以描述为保留o-糖蛋白特异性内切蛋白酶活性的seqidno:1的截短形式。这样的片段比seqidno:1短,并且长度通常为至少100、150或200个氨基酸。所述片段通常包括在与seqidno:1的第178至187位对应的位置处的金属蛋白酶结构域和位于金属蛋白酶结构域的c末端的o-聚糖特异性结合域,该金属蛋白酶结构域包括与seqidno:1的第182位对应的位置处的谷氨酸残基(e)和与seqidno:1的第181位对应的位置处的组氨酸残基(h)。

包含seqidno:1的本发明的任何多肽或其变体或其任一片段可任选地在n末端包括另外的甲硫氨酸和在c末端包括组氨酸或其他标签。这样的另外的序列可有助于表达和/或纯化。组氨酸标签优选由六个组氨酸残基组成。组氨酸标签优选通过通常是短氨基酸序列(例如3至5个氨基酸)的接头连接至c末端。接头通常主要由甘氨酸和丝氨酸残基组成,并且可以优选地包括序列gsg。例如,gsg和gsgle是合适的接头。

因此,总之,本发明的多肽是一种具有o-糖蛋白特异性内切蛋白酶活性的多肽,所述多肽包含:

(a)seqidno:1的氨基酸序列;

(b)与seqidno:1的氨基酸序列至少85%一致的氨基酸序列;或

(c)这样的氨基酸序列:所述氨基酸序列为seqidno:1的序列的片段或与seqidno:1的氨基酸序列85%一致的氨基酸的片段;

任选地,其中所述多肽在n末端包括另外的甲硫氨酸和/或在c末端包括组氨酸标签,该标签可以通过接头与c末端连接。

本发明的示例性多肽的序列以seqidno:2提供。该多肽可以包含seqidno:2的氨基酸序列或由seqidno:2的氨基酸序列组成。编码该多肽的示例性多核苷酸序列示于seqidno:3。

具有o-糖蛋白特异性内切蛋白酶活性的可供选择的多肽已在铜绿假单胞菌pao1、多形拟杆菌vpi-5482和产气荚膜梭菌中鉴定出来(参见noachetal;pnas2017,pe679-688和支持附录,特别是用于克隆、蛋白表达和纯化的材料和方法(materialsandmethodsforcloning,proteinexpressionandpurification)中描述的三种肽酶)。这些多肽的全长序列以seqidno:32、33和34提供。这些序列中的每种都包括如上所述的具有基序hebbh的金属蛋白酶结构域。产气荚膜梭菌序列也具有如上所述的具有基序abxhebbhbc的较长的金属蛋白酶结构域。这些序列中的每种可以任选地进行修饰,以去除可能存在的任何信号序列或酶原序列和/或包括在n末端的另外的甲硫氨酸和/或包括在c末端的组氨酸或其他标签。这样的另外的序列可以帮助表达(例如在大肠杆菌中)和/或纯化。去除信号和其他未成熟序列的相应序列以seqidno:26、27和28提供。针对在大肠杆菌中表达和随后纯化(通过在n末端包括另外的甲硫氨酸和/或在c末端包括组氨酸标签)而优化的这些序列的版本以seqidno:29、30和31提供。在本文所述的具有o-糖蛋白特异性内切蛋白酶活性的本发明多肽的使用方法中,本发明的多肽可以任选地被这些多肽之一替代。因此,用于这样的方法的优选多肽包含seqidno:26至31中的任一种,基本上由seqidno:26至31中的任一种组成或由seqidno:26至31中的任一种组成。

利用多肽内切蛋白酶活性的方法

本发明还提供了一种水解o-糖蛋白的方法,其中所述方法包括使所述蛋白的样品与具有o-糖蛋白特异性内切蛋白酶活性的本发明的多肽接触,并且任选地还包括检测水解产物。

本发明还可以包括一种用于评估蛋白质的糖基化状态的方法,该方法包括使所述样品与具有o-糖蛋白特异性内切蛋白酶活性的本发明的多肽接触和分析所产生的产物。切割产物的存在表明所述样品中的蛋白质是o-糖基化的,因此该方法也可用于检测o-糖蛋白。可以任选地进一步分析切割产物以鉴定聚糖链及其与蛋白质的连接位置。

在这样的方法中,在适于多肽与样品中的任何蛋白质相互作用并且适于发生水解/切割反应(内切蛋白酶活性)的条件下,使样品与本发明的多肽接触。合适的条件包括与本发明的多肽孵育至少20分钟、30分钟、40分钟、50分钟、60分钟、70分钟、80分钟、90分钟或120分钟、3小时、5小时、10小时或过夜。孵育优选在室温下进行,更优选在约20℃、25℃、30℃、35℃、40℃或45℃下,最优选在约37℃下进行。上述方法可以在任何合适的ph下进行。合适的ph值包括例如约3.0、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9或9.5的ph。本发明多肽的活性的优选ph在5.6至6.8的范围内。该方法可以在任何合适的缓冲液中进行,例如tris缓冲盐水(tbs)或磷酸盐缓冲盐水(pbs)。本发明的多肽与样品的蛋白质含量(酶:底物)的近似比例可以是1:1、2:1、4:1、6:1、10:1、15:1、20:1、1:2、1:4或1:6、1:10、1:15、1:20、1:40、1:100、1:200或1:400。优选的比例是1:20。如果需要更短的反应时间,或者如果o-糖蛋白大量唾液酸化,则较高的酶与底物的比例可能是有益的。可供选择地,如下文中更详细地讨论的,可以使用较早或同时的唾液酸酶孵育步骤来降低唾液酸含量。底物通常以0.1mg/ml至10mg/ml,优选为约0.1mg/ml至2mg/ml的浓度存在。

可以通过任何合适的分析方法来评估所产生产物的检测或分析,所述分析方法例如但不限于质谱、hplc、亲和色谱、凝胶电泳、sds-page、elisa、凝集素印迹、光谱测定、毛细管电泳和其他标准的实验室蛋白质分析技术。

上述任何方法中的样品可以是取自患者,优选人类患者的样品。获得的结果可以用于诊断目的,例如用以检测涉及o-连接的糖基化的癌症的存在。这样的用途可以涉及将从患者样品获得的结果与使用从健康对照获得的样品得到的结果进行比较。

在本发明的任何方法中,该多肽可以与另一种酶(例如蛋白酶或糖苷酶)组合使用。另外的蛋白酶或糖苷酶通常将进一步消化底物蛋白,这可增强本发明的多肽的活性和/或允许更容易或更详细地分析产物。

例如,本发明人已经确定,如果首先修饰底物蛋白的o-聚糖以去除唾液酸,则本发明的多肽表现出改善的内切蛋白酶活性。因此,在本发明的优选方法中,使样品与试剂接触以去除唾液酸。所述试剂优选可以是唾液酸酶或这样的酶的混合物,所述唾液酸酶或这样的酶的混合物可以存在于合适的缓冲液例如tbs或pbs中。缓冲液优选包含低浓度的nacl,通常最高至300mm、250mm、200mm或150mm。nacl浓度优选为约150mm,例如125mm至175mm。唾液酸酶(或神经氨酸酶)催化末端唾液酸从糖蛋白上的复杂碳水化合物中被切割,并显示出高度的特异性。这些酶靶向o-糖蛋白中常见的三个独特的唾液酸键,即α2-3、α2-6和α2-8键。适用于所述方法的唾液酸酶包括靶向所有α2-3、α2-6或α2-8键的广谱唾液酸酶,以及通常仅靶向一种类型的键的窄谱唾液酸酶。α2-3键是人类糖蛋白中最常见的键,因此,如果使用窄谱唾液酸酶,则该窄谱唾液酸酶优选靶向该键。合适的唾液酸酶可以包括病毒或哺乳动物唾液酸酶,但是优选是自细菌分出的唾液酸酶,所述细菌包括但不限于产气荚膜梭菌,产脲节杆菌(arthrobacterureafaciens),肺炎链球菌(streptococcuspneumoniae),霍乱弧菌(vibriocholera)和嗜粘蛋白艾克曼菌的菌株。

优选的窄谱唾液酸酶是从嗜粘蛋白艾克曼菌分出的am1757。am1757对α2-3键具有特异性活性。am1757的野生型序列以seqidno:9提供,seqidno:9包括信号序列。缺少信号序列的am1757的野生型序列以seqidno:10提供。可以任选地修饰这些序列,以在n末端包括另外的甲硫氨酸和/或在c末端包括组氨酸或其他标签。这样的另外的序列可以帮助表达(例如在大肠杆菌中)和/或纯化。组氨酸标签优选由六个组氨酸残基组成。组氨酸标签优选通过通常是短氨基酸序列(例如3至5个氨基酸)的接头连接至c末端。接头通常主要由甘氨酸和丝氨酸残基组成,并且可以优选地包括序列gsg。例如,gsg和gsgle是合适的接头。在n末端具有另外的甲硫氨酸且在c末端具有gsgle接头和his6标签的示例性的am1757序列以seqidno:11提供。本发明中任何对am1757的提及都可以表示seqidno:9、10或11中的任一种,但优选地是指包含seqidno:10的氨基酸序列或由seqidno:10的氨基酸序列组成的多肽。最优选地是由seqidno:11的氨基酸序列组成的多肽。

优选的广谱唾液酸酶是从嗜粘蛋白艾克曼菌分出的am0707。am0707对α2-3、α2-6和α2-8键具有活性。am0707的野生型序列以seqidno:12提供,seqidno:12包括信号序列。缺少信号序列的am0707的野生型序列以seqidno:13提供。可以任选地修饰这些序列,以在n末端包括另外的甲硫氨酸和/或在c末端包括组氨酸或其他标签。这样的另外的序列可以帮助表达和/或纯化。组氨酸标签优选由六个组氨酸残基组成。组氨酸标签优选通过通常是短氨基酸序列(例如3至5个氨基酸)的接头连接至c末端。接头通常主要由甘氨酸和丝氨酸残基组成,并且可以优选地包括序列gsg。例如,gsg和gsgle是合适的接头。在n末端具有另外的甲硫氨酸且在c末端具有gsgle接头和his6标签的示例性的am0707序列以seqidno:14提供。本发明中任何对am0707的提及都可以表示seqidno:12、13或14中的任一种,但优选地是指包含seqidno:13的氨基酸序列或由seqidno:13组成的多肽。最优选地,是由seqidno:14的氨基酸序列组成的多肽。

能够水解所有唾液酸键的优选的唾液酸酶混合物包含从嗜粘蛋白艾克曼菌分出的am1757和am0707。am1757和am0707的比例通常为1:1。特别优选的混合物可以包含由seqidno:11的氨基酸序列组成的多肽和由seqidno:14的氨基酸序列组成的多肽。

本发明的方法可优选包括在适合唾液酸酶活性的条件下,在本发明的多肽之前或与本发明的多肽同时,将样品与am1757或与am1757和am0707的混合物一起孵育。本发明还提供了包含本发明的多肽以及am1757或am1757和am0707的混合物的组合物(冻干或溶液形式)。这样的组合物可以优选在ph可约为7.6的tris缓冲盐水中冻干。在这样的组合物中,am1757和am0707将优选彼此以1:1的比例存在,并且总唾液酸酶含量(am1757+am0707)相对于本发明的多肽也以1:1的比例存在。例如,如果组合物包含2000个单位的本发明的多肽,则该组合物还将包含2000个单位的唾液酸酶,其中所述2000个单位的唾液酸酶包含1000个单位的am1757和1000个单位的am0707。一个单位唾液酸酶混合物通常是当在20mmtrisph6.8中在37℃下孵育2小时时,根据sds-page所监测的,从大约90%的1μg糖蛋白(胎球蛋白)中水解唾液酸所需的量。一个单位的本发明的多肽通常是当在20mmtris缓冲液(ph6.8)中孵育时,根据sds-page所监测的,与一个单位唾液酸酶混合物在37℃下过夜消化大约90%的1μg促红细胞生成素(epo)所需的量。

本发明还提供了一种试剂盒,该试剂盒在单独的容器中包含来自am1757或am1757和am0707的混合物的本发明的多肽,以及关于不同酶的组合使用的说明。

作为另一个实例,在本文所述的任何方法中,在将样品与本发明的多肽接触之前、同时或之后,可以将样品与n-糖苷酶一起孵育,以从靶蛋白去除n-聚糖。示例性的n-糖苷酶是pngasef。当样品包括免疫球蛋白时,可以使用的其他n-糖苷酶是endos(参见wo2008071418的seqidno:1)或endos2(可以称为endos49,参见wo2013037824的seqidno:1)。这些酶中的每一种均从igg1的asn-297去除n-连接的糖蛋白。在特别的实施方式中,除了本发明的多肽之外,样品还可以与n-糖苷酶和唾液酸酶(或其混合物)接触。在这样的方法中,可以在同时添加n-糖苷酶和本发明的多肽之前首先应用唾液酸酶(或混合物)。这种方法特别适合于随后的o-糖基化位点的评估,通常通过分离产物(例如使用rplc)和对不同的级分的后续分析(例如使用质谱)来实现。

作为另一个实例,在本文所述的任何方法中,在将样品与本发明的多肽接触之前、同时或之后,可以将样品与蛋白酶一起孵育以进一步消化靶蛋白。合适的一般蛋白酶包括胰蛋白酶、胰凝乳蛋白酶、lys-c、asp-n、glu-c、arg-c或类似的内切蛋白酶、或牙龈卟啉单胞菌(porphyromonasgingivalis)的arg-牙龈蛋白酶(rgpb)。

如果样品包括免疫球蛋白,则可以使用免疫球蛋白蛋白酶,例如speb(参见wo2015040125中的序列),化脓性链球菌(s.pyogenes)的免疫球蛋白g降解酶(ides-参见wo2015040125的序列),马链球菌兽疫亚种的免疫球蛋白g降解酶(idez),牙龈卟啉单胞菌的lys-牙龈蛋白酶(kgp)和无乳链球菌(s.agalactiae)的免疫球蛋白g降解酶(igde无乳-参见pct/ep2017/052463的seqidno:3)。在本发明的方法中使用这些蛋白酶的任何组合可有助于例如使用质谱(自中向下(middledown)法)确定单克隆抗体及其亚基上的o-糖基化位点。

作为另一个实例,在本文描述的任何方法中,在使样品与本发明的多肽接触之后,可以将样品与o-糖苷酶一起孵育。例如,为了简化对产生的产物的分析,在通过任何合适的方法进一步分析之前,通过o-糖苷酶使产物进行消化以除去o-聚糖。合适的o-糖苷酶可从以下细菌获得:粪肠球菌(enterococcusfaecalis)、口腔链球菌(streptococcusoralis)、两歧双歧杆菌(bifidobacteriumbifidum),优选粪肠球菌或口腔链球菌,最优选口腔链球菌。来自口腔链球菌的示例性o-糖苷酶的序列以seqidno:15提供。

与o-糖蛋白结合但缺乏内切蛋白酶活性或具有降低的内切蛋白酶活性的多肽

缺乏内切蛋白酶活性的多肽的功能特征

在一种实施方式中,本发明涉及一种在保持结合o-聚糖的能力的同时缺乏内切蛋白酶活性或具有降低的内切蛋白酶活性的多肽。换句话说,该多肽可以被描述为不显著水解连接有所述聚糖的糖蛋白的o-聚糖特异性结合剂。

o-糖蛋白内切蛋白酶活性可以使用任何合适的方法来确定,但是通常可以采用与上文针对具有这样的活性的本发明多肽所述相同的测定法。与o-糖蛋白底物一起孵育后,不存在切割产物将表明测试多肽中缺乏活性。包含seqidno:1的氨基酸序列的多肽对相同底物的切割可以用作阳性对照。可以通过与相同对照比较来确定测试多肽的活性的降低。本发明的多肽通常具有相对于包含seqidno:1的氨基酸序列的多肽的活性降低的o-糖蛋白内切蛋白酶活性。与seqidno:1氨基酸序列的多肽的活性相比,本发明的多肽通常具有小于95%、90%、85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%或5%的o-糖蛋白内切蛋白酶活性。

多肽与o-聚糖或o-糖蛋白结合的能力也可以通过任何合适的方法来评估。一种这样的方法涉及将测试多肽固定在例如旋转柱中的琼脂糖凝胶上,然后与含有o-糖蛋白和/或o-聚糖的样品一起孵育。如果测试多肽具有o-聚糖和/或o-糖蛋白结合能力,则可检测到o-糖蛋白和/或o-聚糖结合到色谱柱或在随后的洗脱液中。优选地,该多肽能够结合可被包含seqidno:1的氨基酸序列的多肽水解的所有o-糖蛋白。

在实施例中描述了该类型的示例性测定。

缺乏内切蛋白酶活性的多肽的结构特征

本部分列出了根据该实施方式的多肽的结构特征,除了在前面部分中概述的功能特征外,这些结构特征也适用。除了通过一个或多个氨基酸的添加、缺失或取代来修饰氨基酸序列使得所述活性降低或消除之外,根据本发明该实施方式的多肽可具有与具有内切蛋白酶活性的多肽相同的上述结构特征。通常,根据本发明该实施方式的多肽将不包括完整的金属蛋白酶基序hebbh或abxhebbhbc。所述基序可以通过添加、缺失或取代而被破坏,优选通过至少一个氨基酸取代而被破坏。优选地,取代涉及用可供选择的氨基酸取代所述基序中的谷氨酸(e)残基和/或替代与较短的基序的第1位(较长的基序的第4位)对应的位置中的组氨酸(h)残基和/或替代与较短的基序的第5位(较长的基序的第8位)对应的位置中的组氨酸(h)残基。优选地,三种所述取代中的一种或两种或全部是非保守的。e残基的取代应减少或消除电子转移。h残基中任一个的取代应减少或消除锌离子辅因子结合。因此,e残基优选被非极性或不带电荷的氨基酸取代,例如a、c、f、g、i、l、m、n、p、q、s、t、v或w,但是大多数优选被丙氨酸(a)或甘氨酸(g)取代。h残基可各自独立地被任何非h氨基酸取代,但是非极性氨基酸(例如a和g)仍然是优选的。

因此,本发明的多肽可以包含seqidno:1的氨基酸序列、基本上由seqidno:1的氨基酸序列组成或由seqidno:1的氨基酸序列组成,在seqidno:1的氨基酸序列中,金属蛋白酶基序hebbh或abxhebbhbc优选通过用可供选择的氨基酸替代在与seqidno:1的182位对应的位置处的谷氨酸残基和/或替代在与seqidno:1的181位对应的位置处的位置处的组氨酸残基和/或用可供选择的氨基酸替代在seqidno:1的185位对应的位置处的组氨酸残基而被破坏。换句话说,该多肽可被描述为不包含金属蛋白酶基序hebbh,并且优选包含所述基序的破坏形式,使得:

(a)第一位的h被可供选择的氨基酸替代,所述可供选择的氨基酸优选a或g;和/或

(b)第二位的e被不带电荷的氨基酸替代,所述不带电荷的氨基酸任选地为a、c、f、g、i、l、m、n、p、q、s、t、v或w,优选为a或g;和/或

(c)第五位的h被可供选择的氨基酸,优选a或g替代,

其中所述基序中的b是不带电荷的氨基酸,任选地为a、c、f、g、i、l、m、n、p、q、s、t、v或w。

因此,所述多肽可以描述为包含基序xbbbx,其中:

(a)x优选为除h以外的任何氨基酸,并且优选为a或g;和/或

(b)b是不带电荷的氨基酸,任选地为a、c、f、g、i、l、m、n、p、q、s、t、v或w,优选a或g;

任选地,其中所述基序存在于所述多肽中与seqidno:1的第181至185位相对应的位置。

因此,所述多肽可以包含破坏的金属蛋白酶基序,例如具有以下序列中的任何一个:halgh(seqidno:44)、aelgh(seqidno:45)或最优选aalgh(seqidno:46)。包含这种类型的对seqidno:1的特异性改变的序列示于seqidno:5和seqidno:20。换句话说,因此,本发明该实施方式的多肽可以包含seqidno:5或seqidno:20的氨基酸序列、基本上由seqidno:5或seqidno:20的氨基酸序列组成或由seqidno:5或seqidno:20的氨基酸序列组成。

所述多肽可替代地被描述为包含基序abxxbbbxbc,其中:

(a)a为氨基酸v、t或g;

(b)b是不带电荷的氨基酸,任选地为a、c、f、g、i、l、m、n、p、q、s、t、v或w,优选a或g;

(c)x是任何氨基酸,除了基序的第4位和/或第8位的氨基酸优选不是n,并且优选是a或g;和

(d)c为疏水性氨基酸,任选地为a、c、f、i、l、m、p、v、w或y;任选地,其中所述基序存在于所述多肽中在与seqidno:1的第178至187位对应的位置处。

因此,所述多肽可以包含破坏的金属蛋白酶基序,例如具有以下序列中的任一种:gmahalghgl(seqidno:23),gmaaelghgl(seqidno:24)或最优选gmaaalghgl(seqidno:25)。包含这种类型的对seqidno:1的特异性改变的序列示于seqidno:5和seqidno:20。因此,换句话说,本发明该实施方式的多肽可以包含seqidno:5或seqidno:20的氨基酸序列、基本上由seqidno:5或seqidno:20的氨基酸序列组成或由seqidno:5或seqidno:20的氨基酸序列组成。

可供选择地,本发明的多肽可以包含以下、基本上由以下组成或由以下组成:与seqidno:5的氨基酸序列至少50%一致的seqidno:5或seqidno:20的氨基酸序列的变体,条件是在与seqidno:1的第182位对应的位置处不引入谷氨酸残基和/或在与seqidno:1的第181位对应的位置处不引入组氨酸残基和/或在与seqidno:1的第185位对应的位置处不引入组氨酸残基。

变体序列可以与seqidno:5的序列至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%一致。一致性水平优选为至少85%或更高。相对于seqidno:5或seqidno:20的序列的一致性可以在seqidno:5或seqidno:20所示的序列的至少100、至少200、至少300或至少350或更多个连续氨基酸的区域上测量,或更优选在seqidno:5或seqidno:20的全长上测量。本发明的多肽的序列可以包含seqidno:5或seqidno:20的进行了多达10、20、30、40、50或60个保守取代的氨基酸序列的变体。序列一致性的确定以及对保守和非保守取代的解释在与具有内切蛋白酶活性的多肽有关的部分中提供,并且在此同样适用。

可供选择地,本发明的多肽可以包含以下、基本上由以下组成或由以下组成:seqidno:5或seqidno:20的较短片段或其如上所述的变体。所述片段可以描述为seqidno:5或seqidno:20的保留o-糖蛋白结合活性的截短形式。这样的片段比seqidno:1短,并且长度通常为至少100、150或200个氨基酸。

包含seqidno:5或seqidno:20或其变体或其任一片段的本发明的任何多肽可任选地在n末端包括另外的甲硫氨酸和在c末端包括组氨酸或其他标签。这样的另外的序列可有助于表达和/或纯化。组氨酸标签优选由六个组氨酸残基组成。组氨酸标签优选通过通常是短氨基酸序列(例如3至5个氨基酸)的接头连接至c末端。接头通常主要由甘氨酸和丝氨酸残基组成,并且可以优选地包括序列gsg。例如,gsg和gsgle是合适的接头。

因此,总而言之,本发明的多肽是具有o-糖蛋白结合活性但缺乏o-糖蛋白特异性内切蛋白酶活性或具有降低的o-糖蛋白特异性内切蛋白酶活性的多肽,该多肽包括:

(a)seqidno:5或seqidno:20的氨基酸序列;

(b)与seqidno:5或seqidno:20的氨基酸序列至少85%一致的氨基酸序列;

(c)这样的氨基酸序列:所述氨基酸序列为seqidno:5或seqidno:20的序列的片段或与seqidno:5或seqidno:20的氨基酸序列85%一致的氨基酸的片段;

任选地,其中所述多肽在n末端包括另外的甲硫氨酸和/或在c末端包括组氨酸标签,该标签可以通过接头与c末端连接。

本发明的示例性多肽的序列以seqidno:6提供。该多肽可以包含seqidno:6的氨基酸序列或由seqidno:6的氨基酸序列组成。编码该多肽的示例性多核苷酸序列示于seqidno:7。本发明的另一个示例性多肽的序列以seqidno:21提供。该多肽可以包含seqidno:21的氨基酸序列或由seqidno:21的氨基酸序列组成。编码该多肽的示例性多核苷酸序列示于seqidno:22。

所述多肽优选以固定形式提供,例如在琼脂糖或琼脂糖凝胶上,任选地以树脂形式提供。

具有o-糖蛋白结合活性但缺乏o-糖蛋白特异性内切蛋白酶活性或具有降低的o-糖蛋白特异性内切蛋白酶活性的本发明的另外的多肽可以通过破坏包含金属蛋白酶结构域基序hebbh或abxhebbhbc的具有o-糖蛋白特异性内切蛋白酶活性的任何其他多肽中的金属蛋白酶结构域基序hebbh或abxhebbhbc来产生。在本文所述的缺乏o-糖蛋白特异性内切蛋白酶活性或具有降低的o-糖蛋白特异性内切蛋白酶活性的本发明多肽的使用方法中,对本发明多肽的提及包括这样的多肽。优选如上所述地实现对所述基序的破坏,使得:

(a)第一位的h被可供选择的氨基酸替代,所述可供选择的氨基酸优选a或g;和/或

(b)第二位的e被不带电荷的氨基酸替代,所述不带电荷的氨基酸任选地为a、c、f、g、i、l、m、n、p、q、s、t、v或w,优选为a或g;和/或

(c)第五位的h被可供选择的氨基酸,优选a或g替代,

其中所述基序中的b是不带电荷的氨基酸,任选地是a、c、f、g、i、l、m、n、p、q、s、t、v或w。

因此,所述多肽可以描述为包含基序xbbbx,其中:

(a)x优选为除h以外的任何氨基酸,并且优选为a或g;和/或

(b)b是不带电荷的氨基酸,任选地为a、c、f、g、i、l、m、n、p、q、s、t、v或w,优选a或g;

上文描述了具有o-糖蛋白特异性内切蛋白酶活性并可能以这种方式被破坏的其他多肽,这些多肽已在铜绿假单胞菌pao1、多形拟杆菌vpi-5482和产气荚膜梭菌中被鉴定出(参见noachetal;pnas2017,pe679-688和支持附录,特别是用于克隆、蛋白表达和纯化的材料和方法(materialsandmethodsforcloning,proteinexpressionandpurification)中描述的三种肽酶)。这些多肽的全长序列以seqidno:32、33和34提供。相应的成熟序列(例如,去除信号和其他序列)以seqidno:26、27和28提供。针对在大肠杆菌中表达和随后纯化(通过在n末端包括另外的甲硫氨酸和/或在c末端包括组氨酸标签)而优化的这些序列的变体以seqidno:29、30和31提供。因此,seqidno:26至34中每个都包含具有基序hebbh的金属蛋白酶结构域以产生本发明的另外的多肽,所述基序hebbh可以被破坏以产生如上所述的基序xbbbx。hebbh基序已被如此破坏的seqidno:26、27和28的变体以seqidno:35、36和37提供。针对在大肠杆菌中表达和随后纯化(通过在n末端包括另外的甲硫氨酸和/或在c末端包括组氨酸标签)而优化的这些序列的变体以seqidno:38、39和40提供。缺乏o-糖蛋白特异性内切蛋白酶活性或具有降低的o-糖蛋白特异性内切蛋白酶活性的本发明的多肽可包含以下,基本上由以下组成或由以下组成:seqidno:35、36、37、38、39或40中的任一种。

使用缺少内切蛋白酶活性或具有降低的内切蛋白酶活性的ls突变体的方法

本发明还提供了与o-聚糖结合的方法,其中该方法包括使包含o-聚糖的样品与本发明的能够与o-聚糖结合并且缺乏o-糖基化蛋白特异性内切蛋白酶活性或具有降低的o-糖基化蛋白特异性内切蛋白酶活性的多肽接触。该方法任选地进一步包括确定是否已经结合o-聚糖和/或从所得混合物中分离出o-聚糖和任何连接的糖蛋白。

本发明还可以包括一种用于评估蛋白质的糖基化状态的方法,该方法包括使所述样品与本发明的能够与o-聚糖结合并且缺乏o-糖基化蛋白特异性内切蛋白酶活性或具有降低的o-糖基化蛋白特异性内切蛋白酶活性的多肽接触,以及确定蛋白质是否与所述多肽结合。

本发明还可以包括用于检测样品中的o-连接的糖蛋白的方法,其中该方法包括使所述样品与本发明的能够与o-聚糖结合并且缺乏o-糖基化蛋白特异性内切蛋白酶活性或具有降低的o-糖基化蛋白特异性内切蛋白酶活性的多肽接触,从而允许形成o-连接的糖蛋白-多肽复合物。该方法可以任选地包括从接触的样品中分离所述多肽,以及确定分离的多肽是否与o-连接的糖蛋白结合,从而确定样品中o-连接的糖蛋白存在或不存在。该方法还可用于从包含o-聚糖或o-连接的糖蛋白的样品中分出o-聚糖或o-连接的糖蛋白。

在这样的方法中,在适于使多肽与样品中的任何o-聚糖或蛋白质相互作用并发生结合的条件下,使样品与本发明的多肽接触。合适的条件包括与本发明的多肽孵育至少20分钟、30分钟、40分钟、50分钟、60分钟、70分钟、80分钟、90分钟或120分钟、3小时、5小时、10小时或过夜,通常伴随混合,例如颠倒混合。孵育优选在室温下进行,更优选在约20℃、25℃、30℃、35℃、40℃或45℃下,最优选在约37℃下进行。上述方法可以在任何合适的ph下实施。合适的ph值包括例如约3.0、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9或9.5的ph。对于本发明多肽的活性,优选ph为5.6至6.8。该方法可以在任何合适的缓冲液中进行,例如tris缓冲盐水(tbs)或磷酸盐缓冲盐水(pbs)。本发明的多肽与样品的蛋白质含量的近似比例可以是1:1、2:1、4:1、6:1、10:1、15:1、20:1、1:2、1:4或1:6、1:10、1:15、1:20、1:40、1:100、1:200或1:400(wt:wt)。优选的比例是1:1(wt:wt)。如果需要更短的反应时间,或者如果o-糖蛋白大量唾液酸化,则较高的多肽与底物的比例可能是有益的。可供选择地,如下文中更详细地讨论的,可以使用较早或同时的唾液酸酶孵育步骤来降低唾液酸含量。底物的浓度通常为约0.01mg/ml至10mg/ml,优选为约0.1mg/ml至10mg/ml、约0.01mg/ml至2mg/ml或约0.1mg/ml至2mg/ml。

可以通过任何合适的分析方法来评估样品的检测或分析以确定是否已经结合o-聚糖或o-连接的糖蛋白,所述分析方法例如但不限于质谱、hplc、亲和色谱、凝胶电泳、sds-page、elisa、凝集素印迹、光谱测定、毛细管电泳和其他标准的实验室蛋白质分析技术。例如,可以分析多肽的分子量。与未结合o-聚糖或o-连接的糖蛋白的多肽相比,与o-聚糖或o-连接的糖蛋白结合的本发明的多肽将具有更高的分子量。

结合的o-聚糖或o-连接的糖蛋白和本发明的多肽的分离可以通过任何合适的分离手段实施。例如,分离手段可包括磁性纳米颗粒群。这些可以使用磁场分离,优选高梯度磁场分离来从样品中分离。试剂或分离手段的实例是能够结合本发明多肽的磁性颗粒群。例如,在用组氨酸标签使多肽衍生化的情况下,磁性颗粒在其表面上包含带有镍、铜或锌离子的螯合基团。可供选择地,在用生物素标签使多肽衍生化的情况下,磁性颗粒在其表面上包含链霉亲和素。

分离手段还可以包括固定有本发明的多肽的固体支持物。固体支持物的实例包括在先前部分中描述的那些,并且可以包括琼脂糖或琼脂糖凝胶树脂、交联的琼脂糖珠粒或类似物。支持物可以用作亲和色谱柱中的基质。可供选择地,固体支持物可包含可直接吸附本发明的多肽的合适的基于二氧化硅的材料或聚苯乙烯、或塑料容器,例如微量滴定板或等同物。

替代的分离手段包括包含可以通过本领域标准方法产生的对本发明的多肽的具有特异性的抗体的试剂。在这种意义上的抗体包括单克隆抗体、多克隆抗体、单链抗体、嵌合抗体、cdr移植抗体或人源化抗体。该抗体可以是完整的免疫球蛋白分子或其片段,例如fab、f(ab')2或fv片段。如果存在一种以上的抗体,则这些抗体优选具有不同的非重叠决定簇,使得这些抗体优选可以同时结合本发明的多肽。抗体可以结合到固体支持物上,或者可以标记或缀合到另一个化学基团或分子上,以帮助抗体分离或分出。例如,典型的化学基团包括荧光标记(例如荧光素(fitc)或藻红蛋白(pe))或标签(例如生物素)。

其他合适的分离手段包括通过使来自接触的样品的多肽与合适的洗脱缓冲液接触以从(通常是固定的)多肽洗脱蛋白质。洗脱缓冲液的选择可能取决于蛋白质的酸敏感性。优选的洗脱缓冲液可包含高摩尔浓度的尿素(通常至少5m、6m、7m或最优选至少8m)或高浓度的去污剂(通常至少约1%,5%或10%)。合适的去污剂包括nonidetp40、tritonx-100、tween20、chaps、脱氧胆酸钠和rapigestsf表面活性剂,但是十二烷基硫酸钠(sds)是优选的。高摩尔尿素比去污剂更优选,因为下游程序更可能对去污剂的存在是敏感的。

另一种优选的洗脱缓冲液包含本发明的具有o-糖蛋白内切蛋白酶活性的多肽,例如seqidno:1的多肽。该多肽在o-聚糖处的切割将释放结合的o-糖蛋白,从而消除对基于尿素或去污剂的洗脱液的需求。

实施例中证明了从本发明的固定的多肽洗脱o-糖蛋白的优选方法。

上述任何方法中的样品可以是取自患者(优选人类患者)的样品。获得的结果可以用于诊断目的,例如用于检测涉及o-连接的糖基化的癌症的存在。这样的用途可以涉及将获得自患者样品的结果与使用自健康对照获得的样品得到的结果进行比较。

在本发明的任何方法中,该多肽可以与另一种酶(例如蛋白酶或糖苷酶)组合使用。另外的蛋白酶或糖苷酶通常将进一步消化底物蛋白质或聚糖,这可以使得对产物进行更容易或更详细的分析。

例如,本发明的多肽可以与试剂结合使用以去除唾液酸。所述试剂可以优选是唾液酸酶或以上部分中所述的这些酶的混合物。本发明还提供了包含本发明的多肽和am1757或am1757和am0707的混合物的组合物(冻干或溶液形式)。本发明还提供一种试剂盒,该试剂盒在分离的容器中包含来自am1757或am1757和am0707的混合物的本发明的多肽,以及关于不同酶组合使用的说明。

作为另一个实例,在本文所述的任何方法中,在将样品与本发明的多肽接触之前、同时或之后,可以将样品与n-糖苷酶一起孵育,以从靶蛋白去除n-聚糖。示例性的n-糖苷酶是pngasef。当样品包括免疫球蛋白时可以使用的其他n-糖苷酶是endos(参见wo2008071418的seqidno:1)或endos2(可以称为endos49-参见wo2013037824的seqidno:1)。这些酶中的每一种均从igg1的asn-297去除n-连接的糖蛋白。除了本发明的多肽之外,样品还可以与n-糖苷酶和唾液酸酶(或其混合物)接触。在这样的方法中,可以在同时添加n-糖苷酶和本发明的多肽之前首先应用唾液酸酶(或混合物)。

作为另一个实例,在本文所述的任何方法中,在将样品与本发明的多肽接触之前、同时或之后,可以将样品与蛋白酶一起孵育以进一步消化靶蛋白。合适的一般蛋白酶包括胰蛋白酶、胰凝乳蛋白酶、lys-c、asp-n、glu-c、arg-c或类似的内切蛋白酶、或牙龈卟啉单胞菌的arg-牙龈蛋白酶(rgpb)。

如果样品包括免疫球蛋白,则可以使用免疫球蛋白蛋白酶,例如speb(参见wo2015040125中的序列),化脓性链球菌(s.pyogenes)的免疫球蛋白g降解酶(ides-参见wo2015040125的序列),马链球菌兽疫亚种的免疫球蛋白g降解酶(idez),牙龈卟啉单胞菌的lys-牙龈蛋白酶(kgp)和无乳链球菌(s.agalactiae)的免疫球蛋白g降解酶(igde无乳-参见pct/ep2017/052463的seqidno:3)。在本发明的方法中使用这些蛋白酶的任何组合可有助于例如使用质谱来分析底物蛋白质或聚糖。

作为另一个实例,在本文描述的任何方法中,在通过任何合适的方法进一步分析之前,可以将分出的o-连接的糖蛋白与o-糖苷酶一起孵育以去除o-聚糖。合适的o-糖苷酶可从以下细菌获得:粪肠球菌、口腔链球菌、或两歧双歧杆菌,优选粪肠球菌或口腔链球菌,最优选口腔链球菌。来自口腔链球菌的示例性o-糖苷酶的序列以seqidno:15提供。

以下实施例说明了本发明:

实施例1

材料和方法

ls的诱变

使用引物e206a_fwd5’-atggcgcacgcgctgggccacg-3’和5’-gccaccgtaccatttcgtc-3’(rev),根据制造商的说明(退火温度68℃,延伸3分钟),使用q5(neb)进行定点诱变;因此,将来自嗜粘蛋白艾克曼菌的amuc1119基因中的谷氨酸变为丙氨酸,从而产生突变体amuc1119e206a(lse206a)。将构建体转化到dh5α大肠杆菌中,分离并使用测序(gatcbiotech)来验证。

ls和lse206a的重组表达

将来自嗜粘蛋白艾克曼菌atccbaa-835的基因amuc1119和突变体amuc1119e206a(amuc1119-ls;amuc1119e206a-lse206a)针对在大肠杆菌(dna2.0)中表达进行优化,并克隆到具有作为融合蛋白的一部分的c末端6xhis标签的表达载体中。

将经密码子优化的基因转化到bl21(de3)star细胞中。在lb中在37℃下在180rpm下常规地培养大肠杆菌。在质粒存在下,添加50μg/ml卡那霉素。过夜孵育后,将培养物以1:20稀释在新鲜的lb(kana)中,并使培养物生长至od620约为0.7至0.8,之后通过添加1mmiptg诱导重组蛋白表达,并且表达持续6小时,然后收集细胞并冷冻。将冷冻的细胞解冻并溶解在his结合缓冲液中(20mmnapph7.4、500mmnacl,20mm咪唑)中,进行超声处理以释放细胞内蛋白质。通过离心去除细胞碎片。在镍柱上对无菌的过滤的上清液进行亲和纯化,并在pd-25柱上重新缓冲至20mmtris-hclph8.0中。使用nanodrop确定蛋白质的浓度,并通过sds-page估算纯度。

使用蛋白质底物进行活性评估

将tnfαr与ls以2:1的比例混合,并在37℃下孵育15至60分钟,然后在4%至20%novex梯度sds-page上分离蛋白质。研究了nacl(0至1m)、二价阳离子、edta和ph对ls活性的影响,并使用geldocez(biorad)通过光密度分析法测量了生成的水解片段的差异。

活性的时间和剂量依赖性

将tnfαr(0.5μg)与不同剂量的ls在pbs中于37℃孵育15或60分钟,然后在4%-20%novex梯度sds-page上分离蛋白质。使用生成的片段的强度(光密度测定)确定有效孵育条件的最佳剂量和时间。

底物特异性

ls与各种n-连接和o-连接的底物在37℃下以2:1的比例(底物:酶)孵育过夜。ls与epo(0.3mg/ml)以50:1的比例(底物:酶)孵育。将蛋白质分离,并在4%至20%novex梯度sds-page凝胶上进行分析。

lse206a的固定

将lse206a重悬于偶联缓冲液(0.2mnahco3,0.5mnaclph8.3)中,并浓缩至20mg/ml。根据制造商的说明,准备了nhs活化的琼脂糖4fastflow(gehealthcare)以进行偶联(例如,在偶联缓冲液中进行hcl洗涤和平衡)。lse206a通过用琼脂糖在4℃下过夜孵育而固定,缓慢摇动以保持恒定混合。通过添加0.1mtrisph8.5封闭琼脂糖,用0.1mtrisph8.5/0.1mnaac,0.5mnaclph5.0重复洗涤3次,并保存在etoh中直至使用。

lse206a的结合亲和力

pbs平衡的具有50μl固定的lse206a的旋转柱与10μg糖蛋白一起孵育,所述糖蛋白用唾液酸混合物(am0707:am1757)或用唾液酸和口腔链球菌内-α-n-乙酰半乳糖苷酶(例如o-糖苷酶)的组合进行了预处理。将样品在37℃下孵育2小时,此后用pbs(10体积;100g,30s)洗涤色谱柱,并用0.1m甘氨酸ph3.0洗脱。在sds-page上分析级分。

质谱分析

依那西普是经临床批准的与tnfα结合的fc融合蛋白。依那西普含有几种o-聚糖。为了测试酶促切割特异性,将内切蛋白酶与依那西普一起在37℃下孵育过夜。为了简化质谱分析,使用唾液酸酶和o-糖苷酶(过夜,在pbs中,所有单种酶的比例为1:40)进行了第二轮酶促处理,以去除残留的o-聚糖。在通过c18反相液相色谱使肽分离之后,通过ms/ms分析产生的肽。

结果

ls是推定的金属蛋白酶

基于序列和结构域的相似性,ls与几种金属蛋白酶具有同源性,包含推定的活性位点序列gmahelghgl,从而与一般的金属蛋白酶序列abxhebbhbc(a=v/t,b=不带电荷的,c=疏水性的)共有相似性。组氨酸通常参与底物结合和zn2+亲和,而谷氨酸与组氨酸一起介导电子转移,从而介导水解作用。为了能够进一步表征该酶,我们构建了lse206a突变体,该突变体能够结合底物,但是通过将e改变为a而缺乏水解能力或具有降低的水解能力。进一步修饰(例如,将h改变为a)对于完全失活可能是必需的。两种构建体均表达良好,并且容易地基于其his标签使用亲和色谱法进行纯化(图1)。

ls特异性水解带有o-聚糖的糖蛋白

为了研究ls的底物特异性,将蛋白酶与多种蛋白质一起孵育。如图2所示,将ls与iga和赫赛汀(曲妥珠单抗)一起孵育。ls仅能作用于具有o-连接的聚糖的蛋白质,例如iga。尽管末端唾液酸的存在似乎部分地抑制ls的活性,但唾液酸的存在并不是水解的先决条件(图4)。

ls可以在多种条件下作用于o-连接的糖蛋白

实施sds-page凝胶的光密度分析,以评估ls的酶促性质。ls在大多数条件下是有活性的,优选略酸性的ph值和低nacl浓度(图3a-b)。尽管mg2+和ca2+离子均积极影响ls的水解活性,但zn2+的存在显著降低了该活性,而edta则完全消除该活性(图3c-d)。

o-连接的半乳糖苷酶残基对ls的活性至关重要

尽管在不存在末端唾液酸的情况下具有增加的活性,但是o-聚糖中其他碳水化合物对ls活性的重要性还没有被完全理解。尽管在不存在末端唾液酸的情况下ls的活性显著增加,但是去除半乳糖完全抑制了ls的活性(图4a)。此外,如过夜孵育后的完全水解所证明,ls对唾液酸化蛋白的活性较低不是由于在唾液酸存在下不能使键水解(图4b)。ls的活性完全依赖于o-聚糖,因为去除n-聚糖不影响ls的水解(图4c)。

o-连接的聚糖引导ls的切割位点

已经证明了o-聚糖对于活性至关重要,我们接下来试图研究ls的特定切割位点。使用质谱,我们能够证明ls水解o-糖基化的ser/thr及其n末端氨基酸之间的氨基键,无论氨基酸的类型如何(例如似乎不能抑制脯氨酸水解)(图5)。

依那西普因其o-连接的聚糖丰度高而用作模型蛋白,将依那西普用ls处理,此后用o-糖苷酶进行后续处理以便于质谱分析。将质谱分析产生的m/z值与ms/ms数据相结合,拟合至依那西普。所有鉴定出的肽具有n末端丝氨酸或苏氨酸,这与ls仅切割o-聚糖的n末端一致(图5)。该分析以定向搜索(在参数中定义s/t水解;图5a)和无偏方法(图5b)鉴定了肽。

ls的水解失活变体特异性结合含o-聚糖的蛋白质

由于ls结合o聚糖并特异性水解紧邻聚糖(例如,紧邻ser/thr)的氨基酸键的能力,我们假设ls的e206a突变体将缺乏水解活性,但保留结合能力。这样的工具对于以下以及其他将是有价值的:a)鉴定o-连接的糖蛋白,b)用于去除或用于研究的o-连接的糖肽的亲和纯化,以及c)对o-聚糖进行亲和纯化。

图6a显示突变体ls不具有任何可检测的水解活性。尽管在唾液酸酶存在下ls能够水解依那西普,但lsmut不能水解依那西普,这证实了在测试条件下遗传改变确实使o-糖基蛋白酶失活。

将lse206a固定在琼脂糖凝胶上,并添加到旋转柱上,以便于处理。重要的是,lse206a与不同底物的结合与ls的水解活性完全相关(图6b)。lse206a(标记为lsmut)显示出对o连接的糖蛋白的特异性亲和力。通过将lsmut固定在琼脂糖凝胶上,我们能够对iga进行亲和纯化。然而,由于亲和力强,我们无法洗脱蛋白质。缺乏o-聚糖以及o-糖苷酶处理的iga的赫赛汀(曲妥珠单抗)没有结合到色谱柱上,但可以在流过液(ft)中检测到。

2-3唾液酸键对于去除ls的全部活性是重要的

我们最近确定,内切蛋白酶活性依赖于特定的唾液酸键,从而为了完整的作用,必须去除2-3和2-6连接的唾液酸。为了确定特定唾液酸键对ls活性的单独作用,我们将enbrel与不同的唾液酸酶和ls组合一起孵育了30分钟至20小时。对ls水解来说,去除2-3键似乎是足够的(图7)。

ls切割促红细胞生成素(epo)

将epo用pngasef、唾液酸酶(smix,包含am0707和am1757)和/或o-糖苷酶处理,并与ls一起孵育。

然后通过sds-page和考马斯蓝染色以及rplc和质谱来分析所得产物。sds-page的结果示于图9a,该图显示了当唾液酸被去除和当它们完好时,ls均会切割epo。此外,ls还消化了已用pngasef去除n-聚糖的epo,从而证实ls活性不受n-聚糖去除的影响。然而,当用o-糖苷酶去除o-聚糖时,ls不切割epo,这表明ls切割蛋白需要o-聚糖。以10:1、5:1和2:1(底物:酶)的比例观察到了等效的结果(数据未显示)。

与pngasef、smix和ls孵育后的样品混合物通过反相液相色谱来进行分离,并通过esi质谱进行分析以鉴定酶促处理后的反应产物。

图9b显示了来自rplc的uv色谱图。如所预期的,假设epo仅具有一个建议的o-聚糖位置(参见下文的seqidno:14的预测位置),则色谱图显示与由ls切割产生的2个片段对应的2个峰。

通过ms对这些片段进行了进一步分析(参见图9c和d),并鉴定如下:

saaplrtitadtfrklfrvysnflrgklklytgeacrtgd(质量=4900.5868da–与序列c末端至切割位点对应,因此包括仍连接至n末端丝氨酸的o-聚糖);和apprlicdsrvlerylleakeaedittgcaehcsldenitvpdtkvdfyawkrmevgqqavevwqglallseavlrgqallvnssqpweplqlhvdkavsglrslttllralgaqkeaisppdaa(质量=13714.1199da,与序列n末端至切割点对应)。

因此,结合使用pngasef、唾液酸酶混合物和ls允许分出和精确鉴定epo中带有o-聚糖的丝氨酸。这种类型的方法可适用于任何o-糖蛋白,并允许快速识别o-聚糖连接位置。

实施例2

介绍

实施例1中描述的lse206a突变体掺入了ls的活性位点的定点突变(abxhebbhbc至abxhabbhbc),从而去除了酶促切割的电子转移能力。如以下进一步解释的,在进一步的压力测试上,发现尽管这种改变相对于野生型序列降低了o-糖基蛋白酶的活性,但是并未完全消除该活性。因此,本发明人已经开发并表征了在酶促切割中掺入了另外的取代基的另一种突变体。具体而言,将对辅因子锌离子的取向重要的his残基替代为ala。所得的双突变体被称为h205a/e206a(abxhebbhbc变为abxaabbhbc)。

2.1双突变体的产生

相对于嗜粘蛋白艾克曼菌的amuc1119基因,将使用标准方案(例如如实施例1中的标准方案)进行的定点诱变用于将组氨酸和谷氨酸改变为丙氨酸,以产生双突变体amuc1119h205a/e206a(lsh205a/e206a)。如实施例1中所述,将构建体转化到大肠杆菌中,分出和使用测序进行验证。如实施例1中所述在大肠杆菌中进行表达。表达的蛋白质的序列以seqidno:21提供。

2.2双突变体的表征

2.2.1双突变体使ls的活性完全失活

如实施例1所示,鉴于单突变体lse206a无法在2小时内水解o-糖蛋白,因此单突变体lse206a被认为是失活的。然而,在压力测试中,发现o-糖基蛋白酶的活性没有完全被消除,而只是降低了,因为在更高的酶:o-糖蛋白比例和更长孵育时间下观察到了一些活性。

lse206a:去唾液酸化的o-糖蛋白以1:1(wt:wt)的比例孵育24小时会导致底物的显著水解,尽管程度不如野生型ls(图10a)。相比之下,双突变lsh205a/e206a在过夜孵育后,甚至在酶:o-糖蛋白的比例为15:1(wt:wt)时也没有产生任何水解迹象(图10b),表明该酶在添加第二种突变时是完全失活的。

2.2.2双突变体特异性结合o-糖蛋白

为了评估与不同蛋白的结合,固定的lsh205a/e206a(50μl树脂)(使用与实施例1相同的方案制备)在pbs中平衡,此后以0.5mg/ml的浓度添加50μg不同的蛋白样品,在室温下颠倒旋转孵育2小时。流过液通过离心(200g,1分钟)来收集,树脂用350μlpbs洗涤3次。结合的蛋白质通过与50μl8m尿素孵育5分钟,相继两次,然后离心(1000g,1分钟)来洗脱。所有样品均以相同体积上样。通过sds-page评估起始/上样材料、流过液和洗脱液。

在第一个实验中(参见图11a),用唾液酸酶混合物(am0707:am1757)或唾液酸酶混合物与口腔链球菌内-α-n-乙酰半乳糖苷酶(例如o-糖苷酶)的组合预处理糖基化蛋白或非糖基化蛋白,然后与树脂一起孵育、洗涤并洗脱。根据制造商的说明,对样品进行预处理(唾液酸酶混合物+/-o-糖苷酶)。在不存在唾液酸的情况下,仅具有o-聚糖的蛋白质与树脂结合,并具有增加的亲和力。如用o-糖苷酶处理后缺乏相互作用所表明,o-聚糖的存在对于任何结合都是必不可少的。

在第二个实验中(参见图11b),将n-糖基化蛋白、o-糖基化蛋白和非糖基化蛋白的混合物与ls双突变体树脂一起孵育。仅o-糖基化蛋白(tnfαr和apoe)与基质结合,并用8m尿素洗脱。n-糖基化(阿柏西普、agp(α-1-酸糖蛋白)、igg的fc结构域(iggfc))和非糖基化(bsa)未结合至ls双突变体树脂,并在流过液中被发现。因此,当该样品包含n-糖基化蛋白、o-糖基化蛋白和非糖基化蛋白的混合物时,双突变体树脂仅与o糖基化蛋白特异性结合。

在第三个实验中(参见图11c),n-糖基化和非糖基化蛋白的混合物与ls双突变体树脂一起孵育。即使在不存在可能与o-糖蛋白竞争的情况下,也没有非特异性结合(均不存在)。在洗脱液中未发现蛋白质。因此,双突变体树脂不与缺乏o-聚糖的蛋白质结合。

2.2.3双突变体可以固定在不同浓度的树脂上以增强容量

为了研究提高固定的双突变体树脂结合更多o-糖基化蛋白的能力,在固定到树脂上的过程中使用了不同浓度的双突变体(5mg/ml至15mg/ml)。代表性凝胶示于图12a。所示的%是相对于阳性对照的结合水平,并通过凝胶的光密度分析来确定。结果显示在图12b的图表中。当在固定过程中使用较高浓度的双突变体时,观察到容量随较高的o-糖蛋白结合能力而呈剂量依赖性增加。使用15mg/ml的固定的双突变体继续进行进一步的实验。另外,即使在存在1m尿素和1mghcl的情况下,也维持高度的o-糖蛋白结合,即便1m尿素和1mghcl显著降低了结合效率。

2.2.4双突变体的亲和纯化能力为约3mg糖蛋白/ml树脂

为了专门研究双突变体树脂对o-糖蛋白的亲和纯化能力,以及样品浓度对该能力的影响,向树脂中添加了不同量和不同浓度的去唾液酸化依那西普。单个柱子(包含50μl双突变体树脂)具有结合约150μgo-糖蛋白的容量(即3mgo-糖蛋白/ml树脂)。图13显示了代表性的凝胶。

2.2.5o-糖蛋白与双突变体的结合不受离子强度或缓冲液体积/类型的显著影响,并且在宽ph范围内起作用

在室温下,在一系列不同条件下,通过颠倒旋转,使样品蛋白与双突变体树脂结合2小时,以测试离子强度、缓冲液体积/类型和ph对树脂的结合能力的影响。在每种情况下,然后将树脂用其各自的结合缓冲液(350μl)洗涤三次,然后通过添加8m尿素洗脱(50μl,孵育5分钟;重复2次)。然后通过sds-page分析所有样品。

在第一个实验中(参见图14a),为了研究在具有不同离子强度的缓冲液中相互作用的稳定性,样品由去唾液酸化依那西普组成,该样品与双突变体树脂在0至4mnacl中孵育,以及用相应的nacl浓度执行所有洗涤步骤。添加nacl不会显著影响去唾液酸化依那西普的结合。

在第二个实验中(参见图14b),样品由一系列不同体积的pbs中的去唾液酸化依那西普组成。洗涤步骤使用pbs。底物体积在100μl至300μl之间变化不会显著影响效率。

在第三个实验中(参见图14c和d),样品由不同ph(ph4至9)下的不同缓冲液(100mm乙酸钠、50mm磷酸钠和50mmtris)中的去唾液酸化依那西普和bsa组成。洗涤步骤使用匹配的缓冲液。发现ph6-8作用最佳,而ph4完全不起作用,ph9的效率略低于ph8。不包含任何o-聚糖的bsa在任何结合条件下均不与树脂结合。

2.2.6尿素和sds可以洗脱亲和结合的o-糖蛋白

基于双突变体与其o-糖蛋白底物之间的高亲和力,本发明人研究了不基于离子强度从树脂上洗脱结合蛋白的不同方法。尿素呈剂量依赖性洗脱,使用8m尿素时洗脱接近100%(图15a)。高浓度的sds(例如5%-10%)也洗脱了大多数的结合蛋白(图15b)。然而,由于许多下游应用对去污剂的存在敏感,因此使用高水平尿素对于结合蛋白/肽的非酶促释放可能是更具实用性的。

2.2.7野生型ls可用于洗脱结合双突变体的o-糖蛋白

本发明人推测,向结合双突变体的蛋白中添加ls可以导致蛋白释放,因此不必须为洗脱而添加尿素。阿巴西普和依那西普均可在6小时内被ls水解并从双突变体树脂上洗脱下来,但在24h后洗脱略微更完全(图16a)。此后添加尿素表明非常少的o-糖蛋白保持附着在亲和基质上,这表明ls洗脱策略是高效的。

对ls洗脱的依那西普也进行质谱分析(lc/ms和ms/ms)。鉴定出的肽(图16b.1)与依那西普的ls消化过程中产生的肽(图16b.2)一致。下表显示了该实验的其他ms数据:

2.2.8双突变体可用于对来自复杂样品中的o-糖蛋白进行亲和纯化

作为对该系统不仅可以在简化的系统中而且可以在复杂的培养基中充当o-糖基化蛋白的一般亲和基质的观点的证明,本发明人研究了双突变体从人血清中纯化o-糖蛋白的能力。人血清主要由非糖基化(bsa)和n-糖基化(igg)蛋白质组成,而总血清蛋白质组中只有一小部分是o-糖基化的。

向50μl固定的双突变体树脂柱施加20μl唾液酸酶处理的血清(约1.2mg蛋白质),使得去除几乎所有的非糖基化蛋白和n-糖基化蛋白,而洗脱几种选定的蛋白质(图17a)。通过添加更高量的经过或未经过唾液酸酶和o-糖苷酶预处理的血清(例如2.5mg蛋白),证明了相互作用取决于o-聚糖以及末端唾液酸的去除(图17b)。此外,得出结论,与未经唾液酸酶处理的样品相比,唾液酸酶的预处理显著增加了结合的o-糖蛋白的量。添加50u唾液酸酶混合物(am0707:am1757)足以改善亲和纯化的o-糖蛋白的量(图17c)。

通过质谱分析,可以将绝大多数亲和纯化的血清蛋白标注为o-糖基化蛋白(参见图18a,以及下表中的粗体斜体字的名称)。相对于非o-糖蛋白肽,已鉴定的o-糖蛋白肽的数量可能会受到洗涤步骤中不同严格性的影响,无论是在鉴定出的肽的总数方面(图18b),还是在o-糖蛋白肽对比非o糖蛋白肽的比例上(图18c)。因此清楚的是,亲和树脂在o-糖蛋白的特异性和选择性亲和纯化和富集的能力方面是高效的。下表显示了该实验的其他ms数据。

2.2.9固定的双突变体还与较短的o-糖肽结合

为了证明ls双突变体对o-糖肽的特异性,进行了一系列实验。在第一个实验中,将o-糖基化肽(糖基果蝇肽(gd)=在苏氨酸上具有核心1o-聚糖的gkprpysprptshprpirv(seqidno:47))和几种非糖基化肽(h2686、h4062h8390和胰岛素氧化β链(iob))的混合物与ls双突变体树脂一起孵育。(h2686=yiygsfk(seqidno:48),h4062=kklvffa(seqidno:49),h8390=flplilgklvkgll(seqidno:50))。

在室温下通过颠倒旋转使肽混合物与50μl固定的双突变体树脂结合2小时。用结合缓冲液(300μl)洗涤树脂五次,然后添加8m尿素洗脱。用lc/ms分析加样液、流过液和洗脱液中的肽。在rp-lcc18柱上(advancebiopeptidemap2.1x1002.7μm,来自agilent)进行分离,并用esi-q-tofbrukerimpactii检测。结果示于图19a。糖基果蝇肽是混合物中唯一包含o-galnacgal的肽,主要存在于洗脱级分中,而非糖基化肽则存在于流过级分中。

在第二个实验中,研究了ls双突变体能否从胰蛋白酶蛋白质消化物(例如不同类型的肽混合物)中富集o-糖基化肽。

选择iga作为消化的靶标。根据iga中的胰蛋白酶位点和已报道的o-糖基化位点,胰蛋白酶消化应仅产生与iga第89至126位对应的单个o-糖基化肽(请参见图19b中的示意图)。

为了产生胰蛋白酶消化物,将iga与尿素混合至6m,与dtt混合至5mm,然后在37℃下孵育1小时。将iam添加至15mm,然后在黑暗中在室温下孵育30分钟。然后将样品在zebaspin7000k色谱柱上缓冲液交换至ph8.0的50mmtris中。然后以1:20的比例添加胰蛋白酶,接着在37℃下孵育过夜。添加胰蛋白酶抑制剂1mg/mg,然后在室温下孵育20分钟。将唾液酸酶混合物和nacl添加到所得的胰蛋白酶消化物中。在室温下通过颠倒旋转使混合物与树脂结合2小时。将树脂用pbs缓冲液(300μl)洗涤10次,然后通过添加8m尿素(50μl,2分钟,重复2次)来洗脱。

使用rp-lcmsms在c18色谱柱(advancebiopeptideplus2.1x150mm2.7μm,来自agilenttechnologies)上,在0.1%fa的mq溶液:0.1%fa的95%can梯度溶液中,在45℃下,以0.2ml/分钟的流速分离和分析加样液、流过液和洗脱液中的肽。在esi-q-tofbrukerimpactii仪器上进行检测。结果示于图19c。o-糖基化肽89-126在洗脱液中显著富集,鉴定出完整的特异性o-糖肽89-126。

2.2.10固定的双突变体优于其他o-糖蛋白结合基质

本发明人评估了双突变体对比其他可商购的o-糖蛋白结合基质(特别是凝集素花生凝集素(pna)和野豌豆凝集素(vva))对o-糖蛋白的亲和纯化能力。使用依那西普和去唾液酸化依那西普用作模型底物。

向50μl体积的在各自的缓冲液(总共100μl)中平衡的不同的固定的凝集素或ls双突变体树脂添加50μg在pbs(pna和ls双突变体)或凝集素结合缓冲液(vva)中的底物。(凝集素结合缓冲液是20mmtris-hclph7.4,150mmnacl,mgcl2,cacl2,zncl2和mncl2各1mm)。在室温下,使底物与树脂通过颠倒混合相互作用2小时。未结合的蛋白质分别用pbs或凝集素结合缓冲液洗掉(100g,1分钟;3x)。通过离心(1000g,1分钟)干燥树脂。根据生产商通过添加8m尿素(对于pna和ls双突变体树脂)或vva洗脱缓冲液(针对vva树脂)洗脱结合蛋白(50μl,5分钟处理然后1000g离心1分钟;2x),将流过液(ft)和洗脱液(e)在sds-page上分析。将1.5μg底物添加到每种凝胶(例如3μl)中作为阳性对照,并且进行光密度分析,从而相对于假设为100%效率的1.5μg负载底物,评估树脂的效率。依那西普和去唾液酸化依那西普(etanercepts)的代表性凝胶示于图20a。密度分析的结果示于图20b。lsh205a/e206a双突变体在纯化去唾液酸化底物的效率上至少与性能最佳的商业凝集素一样好。

序列

seqidno:1

evtvpdalkdrialkktarqlnivyflgsdtepvpdyerrlselllylqqfygkemqrhgygarsfgldikspgrvniieykaknpaahypyengggwkaaqeldeffkahpdrkksqhtliimptwndekngpdnpggvpfygmgrncfaldypafdikhlgqktregrlltkwyggmahelghglnlphnhqtasdgkkygtalmgsgnytfgtsptfltpascalldacevfsvtpsqqfyegkpevevgdvaisfkgdqilvsgnykspqtvkalnvyiqdppyavnqdydavsfsrrlgkksgkfsmkidkkeleglnnnefrislmfilanglhmqkhftfhwdalqdyrdgsks

seqidno:2

mevtvpdalkdrialkktarqlnivyflgsdtepvpdyerrlselllylqqfygkemqrhgygarsfgldikspgrvniieykaknpaahypyengggwkaaqeldeffkahpdrkksqhtliimptwndekngpdnpggvpfygmgrncfaldypafdikhlgqktregrlltkwyggmahelghglnlphnhqtasdgkkygtalmgsgnytfgtsptfltpascalldacevfsvtpsqqfyegkpevevgdvaisfkgdqilvsgnykspqtvkalnvyiqdppyavnqdydavsfsrrlgkksgkfsmkidkkeleglnnnefrislmfilanglhmqkhftfhwdalqdyrdgsksgsghhhhhh

seqidno:3

atggaagtcactgtgccggacgccctgaaagatcgcatcgcgctgaagaaaaccgctcgtcagctgaatatcgtctacttcctgggttctgataccgaaccggttccggactacgagcgccgtctgagcgagctgctgttgtatctgcagcaattctatggtaaagaaatgcagcgccatggctatggcgcacgcagctttggtctggacattaagtcaccgggtcgtgtgaacattatcgagtacaaagcgaagaacccggcagcgcattacccgtatgagaatggtggcggctggaaagctgcacaagaactggacgaatttttcaaggcccatccagaccgcaagaaaagccagcacaccctgatcatcatgcctacctggaatgatgagaaaaatggtcctgacaatccgggtggcgttccgttctatggtatgggtcgtaattgttttgcgttggactacccggcgtttgatatcaagcacctgggtcagaaaacgcgtgagggtcgtctgctgacgaaatggtacggtggcatggcgcacgaactgggccacggcctgaatctgccgcacaatcaccagaccgcgagcgatggcaagaaatatggcaccgccctgatgggtagcggcaactacacgttcggtaccagcccgacgttcctgaccccggcgagctgtgcgctgctggatgcctgcgaagtgttcagcgttaccccgagccaacagttttatgagggtaagccagaagtcgaggttggtgatgttgcaatttccttcaagggtgatcaaatcttggtcagcggtaactacaagagcccgcaaaccgtgaaagctctgaacgtttacattcaggatccgccgtacgccgtgaaccaagactacgatgcagtgagctttagccgtcgtctgggcaaaaagtccggtaagtttagcatgaagattgacaaaaaagaactggaaggcctgaataacaacgaattccgtatttccttgatgttcattctggcaaacggcttacacatgcagaagcactttacgtttcactgggatgcgctgcaagactaccgtgacggtagcaaatctggttcgggtcatcatcaccaccatcactga

seqidno:4

mlkrllsaffslfflgaasgtsfaevtvpdalkdrialkktarqlnivyflgsdtepvpdyerrlselllylqqfygkemqrhgygarsfgldikspgrvniieykaknpaahypyengggwkaaqeldeffkahpdrkksqhtliimptwndekngpdnpggvpfygmgrncfaldypafdikhlgqktregrlltkwyggmahelghglnlphnhqtasdgkkygtalmgsgnytfgtsptfltpascalldacevfsvtpsqqfyegkpevevgdvaisfkgdqilvsgnykspqtvkalnvyiqdppyavnqdydavsfsrrlgkksgkfsmkidkkeleglnnnefrislmfilanglhmqkhftfhwdalqdyrdgsks(信号序列加有下划线)

seqidno:5

evtvpdalkdrialkktarqlnivyflgsdtepvpdyerrlselllylqqfygkemqrhgygarsfgldikspgrvniieykaknpaahypyengggwkaaqeldeffkahpdrkksqhtliimptwndekngpdnpggvpfygmgrncfaldypafdikhlgqktregrlltkwyggmahalghglnlphnhqtasdgkkygtalmgsgnytfgtsptfltpascalldacevfsvtpsqqfyegkpevevgdvaisfkgdqilvsgnykspqtvkalnvyiqdppyavnqdydavsfsrrlgkksgkfsmkidkkeleglnnnefrislmfilanglhmqkhftfhwdalqdyrdgsks

seqidno:6

mevtvpdalkdrialkktarqlnivyflgsdtepvpdyerrlselllylqqfygkemqrhgygarsfgldikspgrvniieykaknpaahypyengggwkaaqeldeffkahpdrkksqhtliimptwndekngpdnpggvpfygmgrncfaldypafdikhlgqktregrlltkwyggmahalghglnlphnhqtasdgkkygtalmgsgnytfgtsptfltpascalldacevfsvtpsqqfyegkpevevgdvaisfkgdqilvsgnykspqtvkalnvyiqdppyavnqdydavsfsrrlgkksgkfsmkidkkeleglnnnefrislmfilanglhmqkhftfhwdalqdyrdgsksgsghhhhhh

seqidno:7

atggaagtcactgtgccggacgccctgaaagatcgcatcgcgctgaagaaaaccgctcgtcagctgaatatcgtctacttcctgggttctgataccgaaccggttccggactacgagcgccgtctgagcgagctgctgttgtatctgcagcaattctatggtaaagaaatgcagcgccatggctatggcgcacgcagctttggtctggacattaagtcaccgggtcgtgtgaacattatcgagtacaaagcgaagaacccggcagcgcattacccgtatgagaatggtggcggctggaaagctgcacaagaactggacgaatttttcaaggcccatccagaccgcaagaaaagccagcacaccctgatcatcatgcctacctggaatgatgagaaaaatggtcctgacaatccgggtggcgttccgttctatggtatgggtcgtaattgttttgcgttggactacccggcgtttgatatcaagcacctgggtcagaaaacgcgtgagggtcgtctgctgacgaaatggtacggtggcatggcgcacgcgctgggccacggcctgaatctgccgcacaatcaccagaccgcgagcgatggcaagaaatatggcaccgccctgatgggtagcggcaactacacgttcggtaccagcccgacgttcctgaccccggcgagctgtgcgctgctggatgcctgcgaagtgttcagcgttaccccgagccaacagttttatgagggtaagccagaagtcgaggttggtgatgttgcaatttccttcaagggtgatcaaatcttggtcagcggtaactacaagagcccgcaaaccgtgaaagctctgaacgtttacattcaggatccgccgtacgccgtgaaccaagactacgatgcagtgagctttagccgtcgtctgggcaaaaagtccggtaagtttagcatgaagattgacaaaaaagaactggaaggcctgaataacaacgaattccgtatttccttgatgttcattctggcaaacggcttacacatgcagaagcactttacgtttcactgggatgcgctgcaagactaccgtgacggtagcaaatctggttcgggtcatcatcaccaccatcactga

seqidno:8

gmahelghgl(金属蛋白酶基序)

seqidno:9

mknllfalltgsfcccyaqqkaapvpepevvatppadagrglirvdsreirhysgtrkepdylvsrdngktwemkaapagyppnyggipkespaivrnpltrefirvqpiggfvflsrggldgkwlavtndgkleedwkdpekrknlkklggimrtpvfvnkgrrvivpfhnmgggtkfhisddggltwhvsrngvtsprhearpphqgvrwfnnaveatvlemkdgtlwalartsqdqawqafskdygetwskpepsrffgtltmntlgrlddgtivslwtntmalpenatagngtwedvftnrdshhiamsgdegktwygfreiildehrnhpgyatldgpedrgkhqsemvqldknrilislgqhknhrrlvivdrrwvgaktratqtgkdldsqwtihtyipqkkghcsynrkpsaelvqdpsggtkkvlqikrlddpelvneksnvdyrnggatwnfpngttglvkfrfrvvdgeqaddsglqvsltdrlfnacdsttkdyalftfpirlkpaphlllgmkkvpftpgawheisllwqggqavvsldgkkagtlkmankspngasyihfistgsqpdagilldtvnarvk(信号序列加有下划线)

seqidno:10

qqkaapvpepevvatppadagrglirvdsreirhysgtrkepdylvsrdngktwemkaapagyppnyggipkespaivrnpltrefirvqpiggfvflsrggldgkwlavtndgkleedwkdpekrknlkklggimrtpvfvnkgrrvivpfhnmgggtkfhisddggltwhvsrngvtsprhearpphqgvrwfnnaveatvlemkdgtlwalartsqdqawqafskdygetwskpepsrffgtltmntlgrlddgtivslwtntmalpenatagngtwedvftnrdshhiamsgdegktwygfreiildehrnhpgyatldgpedrgkhqsemvqldknrilislgqhknhrrlvivdrrwvgaktratqtgkdldsqwtihtyipqkkghcsynrkpsaelvqdpsggtkkvlqikrlddpelvneksnvdyrnggatwnfpngttglvkfrfrvvdgeqaddsglqvsltdrlfnacdsttkdyalftfpirlkpaphlllgmkkvpftpgawheisllwqggqavvsldgkkagtlkmankspngasyihfistgsqpdagilldtvnarvk

seqidno:11

mqqkaapvpepevvatppadagrglirvdsreirhysgtrkepdylvsrdngktwemkaapagyppnyggipkespaivrnpltrefirvqpiggfvflsrggldgkwlavtndgkleedwkdpekrknlkklggimrtpvfvnkgrrvivpfhnmgggtkfhisddggltwhvsrngvtsprhearpphqgvrwfnnaveatvlemkdgtlwalartsqdqawqafskdygetwskpepsrffgtltmntlgrlddgtivslwtntmalpenatagngtwedvftnrdshhiamsgdegktwygfreiildehrnhpgyatldgpedrgkhqsemvqldknrilislgqhknhrrlvivdrrwvgaktratqtgkdldsqwtihtyipqkkghcsynrkpsaelvqdpsggtkkvlqikrlddpelvneksnvdyrnggatwnfpngttglvkfrfrvvdgeqaddsglqvsltdrlfnacdsttkdyalftfpirlkpaphlllgmkkvpftpgawheisllwqggqavvsldgkkagtlkmankspngasyihfistgsqpdagilldtvnarvkgsglehhhhhh

seqidno:12

mtwllcgrgkwnkvkrmmnsvfkclmsavcavalpafgqeektgfptdravtvfsagegnpyasiripallsigkgqllafaegrykntdqgendiimsvsknggktwsrpraiakahgatfnnpcpvydaktrtvtvvfqrypagvkerqpnipdgwddekcirnfmiqsrnggsswtkpqeitkttkrpsgvdimasgpnagtqlksgahkgrlvipmnegpfgkwvisciysddggkswklgqptanmkgmvnetsiaetdnggvvmvarhwgagncrriawsqdggetwgqvedapelfcdstqnslmtyslsdqpayggksrilfsgpsagrrikgqvamsydngktwpvkkllgeggfaysslamvepgivgvlyeenqehikklkfvpitmewltdgedtglapgkkapvlk(信号序列加有下划线)

seqidno:13

qeektgfptdravtvfsagegnpyasiripallsigkgqllafaegrykntdqgendiimsvsknggktwsrpraiakahgatfnnpcpvydaktrtvtvvfqrypagvkerqpnipdgwddekcirnfmiqsrnggsswtkpqeitkttkrpsgvdimasgpnagtqlksgahkgrlvipmnegpfgkwvisciysddggkswklgqptanmkgmvnetsiaetdnggvvmvarhwgagncrriawsqdggetwgqvedapelfcdstqnslmtyslsdqpayggksrilfsgpsagrrikgqvamsydngktwpvkkllgeggfaysslamvepgivgvlyeenqehikklkfvpitmewltdgedtglapgkkapvlk

seqidno:14

mqeektgfptdravtvfsagegnpyasiripallsigkgqllafaegrykntdqgendiimsvsknggktwsrpraiakahgatfnnpcpvydaktrtvtvvfqrypagvkerqpnipdgwddekcirnfmiqsrnggsswtkpqeitkttkrpsgvdimasgpnagtqlksgahkgrlvipmnegpfgkwvisciysddggkswklgqptanmkgmvnetsiaetdnggvvmvarhwgagncrriawsqdggetwgqvedapelfcdstqnslmtyslsdqpayggksrilfsgpsagrrikgqvamsydngktwpvkkllgeggfaysslamvepgivgvlyeenqehikklkfvpitmewltdgedtglapgkkapvlkgsglehhhhhh

seqidno:15–来自口腔链球菌的o-糖苷键

mdkrffekrckfsirkftlgvasvmigatffaaspvladqarvgstdnlpseladldkkasdeghdfdkeaaaqnpgsaettegpqteeellaqekeksekpsnlpkeledklekaedngrevdkdqlaqdtgklvpedvakttngelnygatvkiktpsgegsgivvakdlvltvshnfikdsqegnirkvvdndqgdgdiysisypglpdvkfskkdiihwdregylkgfkndlalvrlrtvlentpvevtkkpvvkkigdklhvfgypegklnpivnttvdfaepygegvqgigyqggkpgasgggifdtegklvgvhqngvvgkrsggilfspaqlkwiqdhmqgissvkpadleekekpaeekpkedkpaaakpetpkavtpewqtvankeqqgtvtireekgvrynqlsstaqndndgkpalfekqgltvdangnatvdltfkddsekgksrfgvflkfkdtknnvfvgydqggwfweyktpgnstwykgnrvaapepgsvnrlsitlksdgqlnasnndvnlfdtvtlpgavnenlknekkillkagtysndrtvvsvktdnqegvkaddtpaqketgpavddskvtydtiqskvlkavidqafprvkeytlnghtlpgqvqqfnqvfinnhritpevtykkinettaeylmklrddahlinaemtvrlqvvdnqlhfdvtkivnhnqvtpgqkidderkllstisflgnalvsvssdqagakfdgatmsnnthvsgddhidvtnpmkdlakgymygfvstdklaagvwsnsqnsygggsndwtrltayketvgnanyvgihssewqwekaykgivfpeytkelpsakvvitedanadnkvdwqdgaiayrsimnnpqgwekvkditayriamnfgsqaqnpflmtldgikkinlhtdglgqgvllkgygseghdsghlnyadigkriggvedfktliekakkygahlgihvnasetypeskyfnenilrknpdgsysygwnwldqginidaaydlahgrlarwedlkkklgegldfiyvdvwgngqsgdngawathvlakeinkqgwrfaiewghggeydstfqhwaadltyggytnkginsaitrfirnhqkdswvgdyrsyggaanypllggysmkdfegwqgrsdyngyvtnlfahdvmtkyfqhftvskwengtpvtmtdngstykwtpemkvelvdaagnkvvvtrksndvnspqyrertvtlngrviqdgsayltpwnwdangkklptekekmyyfntqagattwtlpsdwanskvylykltdqgkteeqeltvtdgkitldllanqpyvlyrskqtnpemswsegmhiydqgfnsgtlkhwtisgdaskaeivksqganemlriqgnkskvsltqkltglkpntkyavyvgvdnrsnakasitvntgekevttytnkslalnyikayahnnrrenatvddtsyfqnmyaffttgsdvsnvtltlsreagdeatyfdeirtfennssmygdkhdtgqgtfkqdfenvaqgifpfvvggvegvednrthlsekhdpytqrgwngkkvddviegnwslktnglvsrrnlvyqtipqnfrfeagktyrvtfeyeagsdntyafvvgkgefqsgrrgtqasnlemhelpntwtdskkakkvtflvtgaetgdtwvgiystgnasntrgdaggnanfrgyndfmmdnlqieeitltgkmltenalknylptvamtnytkesmdalkeavfnlsqadddisveearaeiakiealknalvqkktalvaedfesldapaqpgeglenafdgnvsslwhtswnggdvgkpatmvlkepteitglryvprasdsngnlrdvklvvtdesgkehtfnvtdwpnnnkpkdidfgktikakkivltgtktygdggdkyqsaaeliftrpqvaetpldlsgyeaalakaqkltdkdnqeevasvqasmkyatdnhlltermvayfadylnqlkdsatkpdaptsskgeeqppvldvpefkggvnateaavhevpefkggvnavqalvhelpeykgganavlaaanevpeykgganavealvnekpaytgvlatagdqaaptvekpeypltpspvadtktpgakdeeklpatgehssevalflasvsialsaavlatkrkeegsglehhhhhh

seqidno:16-e206a_正向引物

atggcgcacgcgctgggccacg

seqidno:17–e206a_反向引物

gccaccgtaccatttcgtc

seqidno:18–epo

apprlicdsrvlerylleakeaedittgcaehcsldenitvpdtkvdfyawkrmevgqqavevwqglallseavlrgqallvnssqpweplqlhvdkavsglrslttllralgaqkeaisppdaasaaplrtitadtfrklfrvysnflrgklklytgeacrtgdr

(注意:预测的带有丝氨酸的o-聚糖加有下划线;c末端精氨酸在表达过程中通常是截短的)

seqidno:20

evtvpdalkdrialkktarqlnivyflgsdtepvpdyerrlselllylqqfygkemqrhgygarsfgldikspgrvniieykaknpaahypyengggwkaaqeldeffkahpdrkksqhtliimptwndekngpdnpggvpfygmgrncfaldypafdikhlgqktregrlltkwyggmaaalghglnlphnhqtasdgkkygtalmgsgnytfgtsptfltpascalldacevfsvtpsqqfyegkpevevgdvaisfkgdqilvsgnykspqtvkalnvyiqdppyavnqdydavsfsrrlgkksgkfsmkidkkeleglnnnefrislmfilanglhmqkhftfhwdalqdyrdgsks

seqidno:21

mevtvpdalkdrialkktarqlnivyflgsdtepvpdyerrlselllylqqfygkemqrhgygarsfgldikspgrvniieykaknpaahypyengggwkaaqeldeffkahpdrkksqhtliimptwndekngpdnpggvpfygmgrncfaldypafdikhlgqktregrlltkwyggmaaalghglnlphnhqtasdgkkygtalmgsgnytfgtsptfltpascalldacevfsvtpsqqfyegkpevevgdvaisfkgdqilvsgnykspqtvkalnvyiqdppyavnqdydavsfsrrlgkksgkfsmkidkkeleglnnnefrislmfilanglhmqkhftfhwdalqdyrdgsksgsghhhhhh

seqidno:22

atggaagtcactgtgccggacgccctgaaagatcgcatcgcgctgaagaaaaccgctcgtcagctgaatatcgtctacttcctgggttctgataccgaaccggttccggactacgagcgccgtctgagcgagctgctgttgtatctgcagcaattctatggtaaagaaatgcagcgccatggctatggcgcacgcagctttggtctggacattaagtcaccgggtcgtgtgaacattatcgagtacaaagcgaagaacccggcagcgcattacccgtatgagaatggtggcggctggaaagctgcacaagaactggacgaatttttcaaggcccatccagaccgcaagaaaagccagcacaccctgatcatcatgcctacctggaatgatgagaaaaatggtcctgacaatccgggtggcgttccgttctatggtatgggtcgtaattgttttgcgttggactacccggcgtttgatatcaagcacctgggtcagaaaacgcgtgagggtcgtctgctgacgaaatggtacggtggcatggcggccgcgctgggccacggcctgaatctgccgcacaatcaccagaccgcgagcgatggcaagaaatatggcaccgccctgatgggtagcggcaactacacgttcggtaccagcccgacgttcctgaccccggcgagctgtgcgctgctggatgcctgcgaagtgttcagcgttaccccgagccaacagttttatgagggtaagccagaagtcgaggttggtgatgttgcaatttccttcaagggtgatcaaatcttggtcagcggtaactacaagagcccgcaaaccgtgaaagctctgaacgtttacattcaggatccgccgtacgccgtgaaccaagactacgatgcagtgagctttagccgtcgtctgggcaaaaagtccggtaagtttagcatgaagattgacaaaaaagaactggaaggcctgaataacaacgaattccgtatttccttgatgttcattctggcaaacggcttacacatgcagaagcactttacgtttcactgggatgcgctgcaagactaccgtgacggtagcaaatctggttcgggtcatcatcaccaccatcactga

seqidno:23

gmahalghgl(被破坏的金属蛋白酶基序)

seqidno:24

gmaaelghgl(被破坏的金属蛋白酶基序)

seqidno:25

gmaaalghgl(被破坏的金属蛋白酶基序)

seqid26

铜绿假单胞菌pao1(去除了信号序列的天然序列)

atqeeildaalvsgdssqltdshlvalrlqqqverirqtrtqlldglyqnlsqaydpgaasmwvlpanpdntlpfligdkgrvlaslsleaggrglaygtnvltqlsgtnaahapllkravqwlvngdpgaatakdfkvsvvgvdktaalnglksaglqpadaacnaltdascastskllvlgngasaaslsatvrarlqaglpilfvhtngwnqsstgqqilaglglqegpyggnywdkdrvpssrtrtrsvelggaygqdpalvqqivdgswrtdydwskctsyvgrttcddvpglsdfskrvdvlkgaldaynqkaqnlfalpgttslrlwllwadavrqnirypmdkaadtarfqetfvadaivgyvreagaaqkelgsyagqrqqsmpvsgseetltltlpsaqgftaigrmaapgkrlsiriedagqaslavglntqrigstrlwntrqydrprflkspdiklqanqsvalvspyggllqlvysgatpgqtvtvkvtgaasqpfldiqpgedssqaiadfiqaldadkadwleirsgsvevhakvekvrgsidkdyggdvqrfirelnevfiddaytlagfaipnqaktpaiqqecaargwdcdsetlhklpgtqhinvdqyaqcgggcsgnpydqtwglnprgwgeshelghnlqvnrlkvyggrsgeisnqifplhkdwrvlrefgqnlddtrvnyrnaynlivagraeadplagvykrlwedpgtyalngermafytqwvhywadlkndplqgwdiwtllylhqrqvdksdwdankaalgygtyaqrpgnsgdasstdgndnlllglswltqrdqrptfalwgirtsaaaqaqvaaygfaeqpaffyannrtneystvklldmsqgspawpfp

金属蛋白酶基序加有下划线。

seqid27

多形拟杆菌vpi-5482(去除了信号序列的天然序列)

dkwekefrirsyepysniaewadklmtkkysdldnptgisvkagddiivlvgdtygqnismqciwetgteykqtassgdvymlnpgvnkltmkgegqlfvmynteltsntakpikihiplgsgtvngffdlkehktdekyaellkksthkyfcirgekimfyfhrnklleyvpnnilsaihlwdnivgwqqelmgiddvrpsqvnnhlfaispegsymwasdyqigfvytylgnillednvmaaednawgpaheighvhqaainwasstessnnlfsnfiiyklgkyksrgnglgsvataryangqawynmgdathqnedtethmrmnwqlwiyyhrceyktdfwqtlfklmrevnmtegedpgkkqlefakmaskaanqnltdffemwgffepvnttieqygtykyyvsdamireakeymaqfpapkhafqyiedrkksefpsndyrysavgdvgyytqfkenqkitkaitaelagrkvsiqngdeavafelrendengkllyfstfttfeipssilmvnaklyavqadgkrill

金属蛋白酶基序加有下划线。

seqidno:28

产气荚膜梭菌(去除了信号序列的天然序列)

vlelemrgdsiseakkrkvwnfqdwqitglsaragdkitvyvdvaegdptptllykqsltqhggatsfqlkpgkneitipeinyesngipkdviqggdlfftnyksdsqkrapkvriegaskypvfilgksdenevmkeleayvekikaepkttpnifavssnkslefvqatyaldwykknnktpkytaeqwdqyiadamgfwgfdnskdvnsdfnfrimpmvknlsggafmnagngvigirpgnqdailaankgwgvahelghnfdtggrtivevtnnmmplffeskyktktritdqniwenntypkvglddysnnelynkadsthlaqlaplwqlylydntfygkferqfrerdfgnknrediykswvvaasdameldlteffarhgirvddkvkedlakypkpdkkiyylndlamnykgdgftenakvsvstsgsngniklsfsvddenkdnilgyeirrdgkyvgftsndsfvdtksnldedgvyvvtpydrklntlnpievn

金属蛋白酶基序加有下划线。

sedidno:29

铜绿假单胞菌pao1(n末端met,c末端接头/标签)

matqeeildaalvsgdssqltdshlvalrlqqqverirqtrtqlldglyqnlsqaydpgaasmwvlpanpdntlpfligdkgrvlaslsleaggrglaygtnvltqlsgtnaahapllkravqwlvngdpgaatakdfkvsvvgvdktaalnglksaglqpadaacnaltdascastskllvlgngasaaslsatvrarlqaglpilfvhtngwnqsstgqqilaglglqegpyggnywdkdrvpssrtrtrsvelggaygqdpalvqqivdgswrtdydwskctsyvgrttcddvpglsdfskrvdvlkgaldaynqkaqnlfalpgttslrlwllwadavrqnirypmdkaadtarfqetfvadaivgyvreagaaqkelgsyagqrqqsmpvsgseetltltlpsaqgftaigrmaapgkrlsiriedagqaslavglntqrigstrlwntrqydrprflkspdiklqanqsvalvspyggllqlvysgatpgqtvtvkvtgaasqpfldiqpgedssqaiadfiqaldadkadwleirsgsvevhakvekvrgsidkdyggdvqrfirelnevfiddaytlagfaipnqaktpaiqqecaargwdcdsetlhklpgtqhinvdqyaqcgggcsgnpydqtwglnprgwgeshelghnlqvnrlkvyggrsgeisnqifplhkdwrvlrefgqnlddtrvnyrnaynlivagraeadplagvykrlwedpgtyalngermafytqwvhywadlkndplqgwdiwtllylhqrqvdksdwdankaalgygtyaqrpgnsgdasstdgndnlllglswltqrdqrptfalwgirtsaaaqaqvaaygfaeqpaffyannrtneystvklldmsqgspawpfpgsghhhhhh

金属蛋白酶基序加有下划线。

seqidno:30

多形拟杆菌vpi-5482(n末端met,c末端接头/标签)

mdkwekefrirsyepysniaewadklmtkkysdldnptgisvkagddiivlvgdtygqnismqciwetgteykqtassgdvymlnpgvnkltmkgegqlfvmynteltsntakpikihiplgsgtvngffdlkehktdekyaellkksthkyfcirgekimfyfhrnklleyvpnnilsaihlwdnivgwqqelmgiddvrpsqvnnhlfaispegsymwasdyqigfvytylgnillednvmaaednawgpaheighvhqaainwasstessnnlfsnfiiyklgkyksrgnglgsvataryangqawynmgdathqnedtethmrmnwqlwiyyhrceyktdfwqtlfklmrevnmtegedpgkkqlefakmaskaanqnltdffemwgffepvnttieqygtykyyvsdamireakeymaqfpapkhafqyiedrkksefpsndyrysavgdvgyytqfkenqkitkaitaelagrkvsiqngdeavafelrendengkllyfstfttfeipssilmvnaklyavqadgkrillgsghhhhhh

金属蛋白酶基序加有下划线。

seqidno:31

产气荚膜梭菌(n末端met,c末端接头/标签)

mvlelemrgdsiseakkrkvwnfqdwqitglsaragdkitvyvdvaegdptptllykqsltqhggatsfqlkpgkneitipeinyesngipkdviqggdlfftnyksdsqkrapkvriegaskypvfilgksdenevmkeleayvekikaepkttpnifavssnkslefvqatyaldwykknnktpkytaeqwdqyiadamgfwgfdnskdvnsdfnfrimpmvknlsggafmnagngvigirpgnqdailaankgwgvahelghnfdtggrtivevtnnmmplffeskyktktritdqniwenntypkvglddysnnelynkadsthlaqlaplwqlylydntfygkferqfrerdfgnknrediykswvvaasdameldlteffarhgirvddkvkedlakypkpdkkiyylndlamnykgdgftenakvsvstsgsngniklsfsvddenkdnilgyeirrdgkyvgftsndsfvdtksnldedgvyvvtpydrklntlnpievngsghhhhhh

金属蛋白酶基序加有下划线。

seqidno:32铜绿假单胞菌pao1(包含信号序列的完整天然序列)

mslsttafpslqgenmsrspiprhrallagfclagalsaqaatqeeildaalvsgdssqltdshlvalrlqqqverirqtrtqlldglyqnlsqaydpgaasmwvlpanpdntlpfligdkgrvlaslsleaggrglaygtnvltqlsgtnaahapllkravqwlvngdpgaatakdfkvsvvgvdktaalnglksaglqpadaacnaltdascastskllvlgngasaaslsatvrarlqaglpilfvhtngwnqsstgqqilaglglqegpyggnywdkdrvpssrtrtrsvelggaygqdpalvqqivdgswrtdydwskctsyvgrttcddvpglsdfskrvdvlkgaldaynqkaqnlfalpgttslrlwllwadavrqnirypmdkaadtarfqetfvadaivgyvreagaaqkelgsyagqrqqsmpvsgseetltltlpsaqgftaigrmaapgkrlsiriedagqaslavglntqrigstrlwntrqydrprflkspdiklqanqsvalvspyggllqlvysgatpgqtvtvkvtgaasqpfldiqpgedssqaiadfiqaldadkadwleirsgsvevhakvekvrgsidkdyggdvqrfirelnevfiddaytlagfaipnqaktpaiqqecaargwdcdsetlhklpgtqhinvdqyaqcgggcsgnpydqtwglnprgwgeshelghnlqvnrlkvyggrsgeisnqifplhkdwrvlrefgqnlddtrvnyrnaynlivagraeadplagvykrlwedpgtyalngermafytqwvhywadlkndplqgwdiwtllylhqrqvdksdwdankaalgygtyaqrpgnsgdasstdgndnlllglswltqrdqrptfalwgirtsaaaqaqvaaygfaeqpaffyannrtneystvklldmsqgspawpfp

uniprot登录号:q9i5w4.1

金属蛋白酶基序加有下划线。

信号序列加粗且加有下划线。

seqidno:33

多形拟杆菌vpi-5482(包含信号序列和其他序列的完整天然序列)

mtikrfitnllalftlftvslackdteksiinssfsiseeyliqnldksstsvqipintsmelaqwsvsyeanwlqcskqktaaegtflritvnentgetkrtanikvtsttatytitvnqyakgevivegdikvtptggkasehqegqdientydgkfstdgaapfhtpwgqsakfpvtleyyfkgdteidyliyytrsgngnfgkvkvytttnpdrsdytlqgeydfkeqnapskvsfsegikatgikfevlsglgdfvscdemefyktntdktldkqlltvftditcteiknnvtneqiqalpdyfvriaeavrdntydkwekefrirsyepysniaewadklmtkkysdldnptgisvkagddiivlvgdtygqnismqciwetgteykqtassgdvymlnpgvnkltmkgegqlfvmynteltsntakpikihiplgsgtvngffdlkehktdekyaellkksthkyfcirgekimfyfhrnklleyvpnnilsaihlwdnivgwqqelmgiddvrpsqvnnhlfaispegsymwasdyqigfvytylgnillednvmaaednawgpaheighvhqaainwasstessnnlfsnfiiyklgkyksrgnglgsvataryangqawynmgdathqnedtethmrmnwqlwiyyhrceyktdfwqtlfklmrevnmtegedpgkkqlefakmaskaanqnltdffemwgffepvnttieqygtykyyvsdamireakeymaqfpapkhafqyiedrkksefpsndyrysavgdvgyytqfkenqkitkaitaelagrkvsiqngdeavafelrendengkllyfstfttfeipssilmvnaklyavqadgkrill

uniprot登录号:q89zx7.1

金属蛋白酶基序加有下划线。

信号序列加粗且加有下划线。

成熟蛋白质中去除的其他序列加粗且倾斜。

seqidno:34

产气荚膜梭菌(包含信号和其他序列的完整天然序列)

mnkrkiaaiilatmitnlsattidvlaqelntknnskvevshddeshqarvskfdlynsdkldaynqefqvsrsniksinnnggkynsstidkaidgnlethwetgkpndanftnevvvtfneitnidrivysarrdsargkgfakefeiyaslkdegddfnlvssgeytestrdlveikfnptdfkrlkfkfkkadqnwasaaefmfykedklnekfnglftdssmnkvseefntleklnafenelkdhpiydlykeglnnarailtetsenptkatlgqitynlnddynnqyrmpyknikaiknngrhyaaqniekaidndvntywetgtlnsssfnnevevefndlvtldrivygsrqsdlkgfaeevyiyasrtskgdtyklvatgaheatkglveakfeptefkrvkfkfkkskqnsatlnelmfykpdevyssipklftdgtmselseefnslekinafkekaknhplyndfnetielaeslisnprkedvlelemrgdsiseakkrkvwnfqdwqitglsaragdkitvyvdvaegdptptllykqsltqhggatsfqlkpgkneitipeinyesngipkdviqggdlfftnyksdsqkrapkvriegaskypvfilgksdenevmkeleayvekikaepkttpnifavssnkslefvqatyaldwykknnktpkytaeqwdqyiadamgfwgfdnskdvnsdfnfrimpmvknlsggafmnagngvigirpgnqdailaankgwgvahelghnfdtggrtivevtnnmmplffeskyktktritdqniwenntypkvglddysnnelynkadsthlaqlaplwqlylydntfygkferqfrerdfgnknrediykswvvaasdameldlteffarhgirvddkvkedlakypkpdkkiyylndlamnykgdgftenakvsvstsgsngniklsfsvddenkdnilgyeirrdgkyvgftsndsfvdtksnldedgvyvvtpydrklntlnpievnalqptlsvnpvitlalgeefneeeyivakdikgnslsesvkvkssnvntskvgeyevlysledskgneytktskvnvvsrkeymsdltpkqssngwgtvrkdksisggvigltrdgdfvdynkglglhsnaeyvydlegkdydyfesyvgvdkamssrpassvifkvlvdgeekfnsgvmrsttpqkyvkvdvknakelklivndagdgdssdhasfgdaklatlsskpiikgenlaysmdekvdlmkgitatdiedgnitskvqikssdfvegksgiftvvysvtdsdgltsecsrtiavtdketqlsdlnwksatigsgsvrkdravsgnqirllnednsvetfakgigthsyseivynsegydifdtwvgidrhvadkkvssvkfkvyvdgelkaetdvmridtpkkrlvvdvrnskeiklvvdvadngnnwdhadwadakfrnlaeydaselnkaieeakkldlnnyteessealknaiskgeeallskdketinsaleelnkemnslvkvdlnavinipdkyllksiqnqlnktgditlgdmyslttltlsgvedltglenaknletlnmdynevkdlrplsklkklntlnaqeqfiaagelkpsngkvigdskvynregknvaktirvvdkngntileqdakdeftintkdlssglygvhvlfedegfsgvmfylfnv

uniprot登录号:a0a0h2yn38.1

金属蛋白酶基序加有下划线。

信号序列加粗且加有下划线。

成熟蛋白质中去除的其他序列加粗且倾斜。

seqidno:35

铜绿假单胞菌pao1(去除信号序列的双突变体)

atqeeildaalvsgdssqltdshlvalrlqqqverirqtrtqlldglyqnlsqaydpgaasmwvlpanpdntlpfligdkgrvlaslsleaggrglaygtnvltqlsgtnaahapllkravqwlvngdpgaatakdfkvsvvgvdktaalnglksaglqpadaacnaltdascastskllvlgngasaaslsatvrarlqaglpilfvhtngwnqsstgqqilaglglqegpyggnywdkdrvpssrtrtrsvelggaygqdpalvqqivdgswrtdydwskctsyvgrttcddvpglsdfskrvdvlkgaldaynqkaqnlfalpgttslrlwllwadavrqnirypmdkaadtarfqetfvadaivgyvreagaaqkelgsyagqrqqsmpvsgseetltltlpsaqgftaigrmaapgkrlsiriedagqaslavglntqrigstrlwntrqydrprflkspdiklqanqsvalvspyggllqlvysgatpgqtvtvkvtgaasqpfldiqpgedssqaiadfiqaldadkadwleirsgsvevhakvekvrgsidkdyggdvqrfirelnevfiddaytlagfaipnqaktpaiqqecaargwdcdsetlhklpgtqhinvdqyaqcgggcsgnpydqtwglnprgwgesaalghnlqvnrlkvyggrsgeisnqifplhkdwrvlrefgqnlddtrvnyrnaynlivagraeadplagvykrlwedpgtyalngermafytqwvhywadlkndplqgwdiwtllylhqrqvdksdwdankaalgygtyaqrpgnsgdasstdgndnlllglswltqrdqrptfalwgirtsaaaqaqvaaygfaeqpaffyannrtneystvklldmsqgspawpfp

被破坏的金属蛋白酶基序加有下划线

seqidno:36

多形拟杆菌vpi-5482(去除信号序列和其他未成熟序列的双突变体)

dkwekefrirsyepysniaewadklmtkkysdldnptgisvkagddiivlvgdtygqnismqciwetgteykqtassgdvymlnpgvnkltmkgegqlfvmynteltsntakpikihiplgsgtvngffdlkehktdekyaellkksthkyfcirgekimfyfhrnklleyvpnnilsaihlwdnivgwqqelmgiddvrpsqvnnhlfaispegsymwasdyqigfvytylgnillednvmaaednawgpaaaighvhqaainwasstessnnlfsnfiiyklgkyksrgnglgsvataryangqawynmgdathqnedtethmrmnwqlwiyyhrceyktdfwqtlfklmrevnmtegedpgkkqlefakmaskaanqnltdffemwgffepvnttieqygtykyyvsdamireakeymaqfpapkhafqyiedrkksefpsndyrysavgdvgyytqfkenqkitkaitaelagrkvsiqngdeavafelrendengkllyfstfttfeipssilmvnaklyavqadgkrill

被破坏的金属蛋白酶基序加有下划线

seqidno:37

产气荚膜梭菌(去除信号序列和其他未成熟序列的双突变体)

vlelemrgdsiseakkrkvwnfqdwqitglsaragdkitvyvdvaegdptptllykqsltqhggatsfqlkpgkneitipeinyesngipkdviqggdlfftnyksdsqkrapkvriegaskypvfilgksdenevmkeleayvekikaepkttpnifavssnkslefvqatyaldwykknnktpkytaeqwdqyiadamgfwgfdnskdvnsdfnfrimpmvknlsggafmnagngvigirpgnqdailaankgwgvaaalghnfdtggrtivevtnnmmplffeskyktktritdqniwenntypkvglddysnnelynkadsthlaqlaplwqlylydntfygkferqfrerdfgnknrediykswvvaasdameldlteffarhgirvddkvkedlakypkpdkkiyylndlamnykgdgftenakvsvstsgsngniklsfsvddenkdnilgyeirrdgkyvgftsndsfvdtksnldedgvyvvtpydrklntlnpievn

被破坏的金属蛋白酶基序加有下划线

seqidno:38

铜绿假单胞菌pao1(去除信号序列并且具有n末端met、c末端接头/标签的双突变体)

matqeeildaalvsgdssqltdshlvalrlqqqverirqtrtqlldglyqnlsqaydpgaasmwvlpanpdntlpfligdkgrvlaslsleaggrglaygtnvltqlsgtnaahapllkravqwlvngdpgaatakdfkvsvvgvdktaalnglksaglqpadaacnaltdascastskllvlgngasaaslsatvrarlqaglpilfvhtngwnqsstgqqilaglglqegpyggnywdkdrvpssrtrtrsvelggaygqdpalvqqivdgswrtdydwskctsyvgrttcddvpglsdfskrvdvlkgaldaynqkaqnlfalpgttslrlwllwadavrqnirypmdkaadtarfqetfvadaivgyvreagaaqkelgsyagqrqqsmpvsgseetltltlpsaqgftaigrmaapgkrlsiriedagqaslavglntqrigstrlwntrqydrprflkspdiklqanqsvalvspyggllqlvysgatpgqtvtvkvtgaasqpfldiqpgedssqaiadfiqaldadkadwleirsgsvevhakvekvrgsidkdyggdvqrfirelnevfiddaytlagfaipnqaktpaiqqecaargwdcdsetlhklpgtqhinvdqyaqcgggcsgnpydqtwglnprgwgesaalghnlqvnrlkvyggrsgeisnqifplhkdwrvlrefgqnlddtrvnyrnaynlivagraeadplagvykrlwedpgtyalngermafytqwvhywadlkndplqgwdiwtllylhqrqvdksdwdankaalgygtyaqrpgnsgdasstdgndnlllglswltqrdqrptfalwgirtsaaaqaqvaaygfaeqpaffyannrtneystvklldmsqgspawpfpgsghhhhhh

被破坏的金属蛋白酶基序加有下划线

seqidno:39

多形拟杆菌vpi-5482(去除信号序列和来自不成熟蛋白的其他序列并且具有n末端met、c末端接头/标签的双突变体)

mdkwekefrirsyepysniaewadklmtkkysdldnptgisvkagddiivlvgdtygqnismqciwetgteykqtassgdvymlnpgvnkltmkgegqlfvmynteltsntakpikihiplgsgtvngffdlkehktdekyaellkksthkyfcirgekimfyfhrnklleyvpnnilsaihlwdnivgwqqelmgiddvrpsqvnnhlfaispegsymwasdyqigfvytylgnillednvmaaednawgpaaaighvhqaainwasstessnnlfsnfiiyklgkyksrgnglgsvataryangqawynmgdathqnedtethmrmnwqlwiyyhrceyktdfwqtlfklmrevnmtegedpgkkqlefakmaskaanqnltdffemwgffepvnttieqygtykyyvsdamireakeymaqfpapkhafqyiedrkksefpsndyrysavgdvgyytqfkenqkitkaitaelagrkvsiqngdeavafelrendengkllyfstfttfeipssilmvnaklyavqadgkrillgsghhhhhh

被破坏的金属蛋白酶基序加有下划线

seqidno:40

产气荚膜梭菌(去除信号序列和来自不成熟蛋白的其他序列并且具有n末端met、c末端接头/标签的双突变体)

mvlelemrgdsiseakkrkvwnfqdwqitglsaragdkitvyvdvaegdptptllykqsltqhggatsfqlkpgkneitipeinyesngipkdviqggdlfftnyksdsqkrapkvriegaskypvfilgksdenevmkeleayvekikaepkttpnifavssnkslefvqatyaldwykknnktpkytaeqwdqyiadamgfwgfdnskdvnsdfnfrimpmvknlsggafmnagngvigirpgnqdailaankgwgvaaalghnfdtggrtivevtnnmmplffeskyktktritdqniwenntypkvglddysnnelynkadsthlaqlaplwqlylydntfygkferqfrerdfgnknrediykswvvaasdameldlteffarhgirvddkvkedlakypkpdkkiyylndlamnykgdgftenakvsvstsgsngniklsfsvddenkdnilgyeirrdgkyvgftsndsfvdtksnldedgvyvvtpydrklntlnpievngsghhhhhh

被破坏的金属蛋白酶基序加有下划线

seqidno:41

helgh(金属蛋白酶基序)

seqidno:42

heigh(金属蛋白酶基序)

seqidno:43

gvahelghnf(金属蛋白酶基序)

seqidno:44

halgh(被破坏的金属蛋白酶基序)

seqidno:45

aelgh(被破坏的金属蛋白酶基序)

seqidno:46

aalgh(被破坏的金属蛋白酶基序)

seqidno:47

gkprpysprptshprpirv(在t上具有o糖基化位点的糖基果蝇肽)

seqidno:48

yiygsfk(非o-糖基化肽)

seqidno:49

kklvffa(非o-糖基化肽)

seqidno:50

flplilgklvkgll(非o-糖基化肽)

序列表

<110>杰诺维斯公司

<120>用于o-糖蛋白的蛋白酶和结合多肽

<130>n410795wo

<150>gb1708471.6

<151>2017-05-26

<150>gb1708476.5

<151>2017-05-26

<150>gb1806655.5

<151>2018-04-24

<160>50

<170>patentinversion3.5

<210>1

<211>361

<212>prt

<213>akkermansiamuciniphila

<400>1

gluvalthrvalproaspalaleulysaspargilealaleulyslys

151015

thralaargglnleuasnilevaltyrpheleuglyseraspthrglu

202530

provalproasptyrgluargargleusergluleuleuleutyrleu

354045

glnglnphetyrglylysglumetglnarghisglytyrglyalaarg

505560

serpheglyleuaspilelysserproglyargvalasnileileglu

65707580

tyrlysalalysasnproalaalahistyrprotyrgluasnglygly

859095

glytrplysalaalaglngluleuaspgluphephelysalahispro

100105110

asparglyslysserglnhisthrleuileilemetprothrtrpasn

115120125

aspglulysasnglyproaspasnproglyglyvalprophetyrgly

130135140

metglyargasncysphealaleuasptyrproalapheaspilelys

145150155160

hisleuglyglnlysthrarggluglyargleuleuthrlystrptyr

165170175

glyglymetalahisgluleuglyhisglyleuasnleuprohisasn

180185190

hisglnthralaseraspglylyslystyrglythralaleumetgly

195200205

serglyasntyrthrpheglythrserprothrpheleuthrproala

210215220

sercysalaleuleuaspalacysgluvalpheservalthrproser

225230235240

glnglnphetyrgluglylysprogluvalgluvalglyaspvalala

245250255

ileserphelysglyaspglnileleuvalserglyasntyrlysser

260265270

proglnthrvallysalaleuasnvaltyrileglnaspproprotyr

275280285

alavalasnglnasptyraspalavalserpheserargargleugly

290295300

lyslysserglylysphesermetlysileasplyslysgluleuglu

305310315320

glyleuasnasnasnglupheargileserleumetpheileleuala

325330335

asnglyleuhismetglnlyshisphethrphehistrpaspalaleu

340345350

glnasptyrargaspglyserlysser

355360

<210>2

<211>371

<212>prt

<213>artificialsequence

<220>

<223>ls(nterminalmethionineandac-terminallinker+his6tag)

<400>2

metgluvalthrvalproaspalaleulysaspargilealaleulys

151015

lysthralaargglnleuasnilevaltyrpheleuglyseraspthr

202530

gluprovalproasptyrgluargargleusergluleuleuleutyr

354045

leuglnglnphetyrglylysglumetglnarghisglytyrglyala

505560

argserpheglyleuaspilelysserproglyargvalasnileile

65707580

glutyrlysalalysasnproalaalahistyrprotyrgluasngly

859095

glyglytrplysalaalaglngluleuaspgluphephelysalahis

100105110

proasparglyslysserglnhisthrleuileilemetprothrtrp

115120125

asnaspglulysasnglyproaspasnproglyglyvalprophetyr

130135140

glymetglyargasncysphealaleuasptyrproalapheaspile

145150155160

lyshisleuglyglnlysthrarggluglyargleuleuthrlystrp

165170175

tyrglyglymetalahisgluleuglyhisglyleuasnleuprohis

180185190

asnhisglnthralaseraspglylyslystyrglythralaleumet

195200205

glyserglyasntyrthrpheglythrserprothrpheleuthrpro

210215220

alasercysalaleuleuaspalacysgluvalpheservalthrpro

225230235240

serglnglnphetyrgluglylysprogluvalgluvalglyaspval

245250255

alaileserphelysglyaspglnileleuvalserglyasntyrlys

260265270

serproglnthrvallysalaleuasnvaltyrileglnasppropro

275280285

tyralavalasnglnasptyraspalavalserpheserargargleu

290295300

glylyslysserglylysphesermetlysileasplyslysgluleu

305310315320

gluglyleuasnasnasnglupheargileserleumetpheileleu

325330335

alaasnglyleuhismetglnlyshisphethrphehistrpaspala

340345350

leuglnasptyrargaspglyserlysserglyserglyhishishis

355360365

hishishis

370

<210>3

<211>1116

<212>dna

<213>artificialsequence

<220>

<223>nucleotidesequenceofls

<400>3

atggaagtcactgtgccggacgccctgaaagatcgcatcgcgctgaagaaaaccgctcgt60

cagctgaatatcgtctacttcctgggttctgataccgaaccggttccggactacgagcgc120

cgtctgagcgagctgctgttgtatctgcagcaattctatggtaaagaaatgcagcgccat180

ggctatggcgcacgcagctttggtctggacattaagtcaccgggtcgtgtgaacattatc240

gagtacaaagcgaagaacccggcagcgcattacccgtatgagaatggtggcggctggaaa300

gctgcacaagaactggacgaatttttcaaggcccatccagaccgcaagaaaagccagcac360

accctgatcatcatgcctacctggaatgatgagaaaaatggtcctgacaatccgggtggc420

gttccgttctatggtatgggtcgtaattgttttgcgttggactacccggcgtttgatatc480

aagcacctgggtcagaaaacgcgtgagggtcgtctgctgacgaaatggtacggtggcatg540

gcgcacgaactgggccacggcctgaatctgccgcacaatcaccagaccgcgagcgatggc600

aagaaatatggcaccgccctgatgggtagcggcaactacacgttcggtaccagcccgacg660

ttcctgaccccggcgagctgtgcgctgctggatgcctgcgaagtgttcagcgttaccccg720

agccaacagttttatgagggtaagccagaagtcgaggttggtgatgttgcaatttccttc780

aagggtgatcaaatcttggtcagcggtaactacaagagcccgcaaaccgtgaaagctctg840

aacgtttacattcaggatccgccgtacgccgtgaaccaagactacgatgcagtgagcttt900

agccgtcgtctgggcaaaaagtccggtaagtttagcatgaagattgacaaaaaagaactg960

gaaggcctgaataacaacgaattccgtatttccttgatgttcattctggcaaacggctta1020

cacatgcagaagcactttacgtttcactgggatgcgctgcaagactaccgtgacggtagc1080

aaatctggttcgggtcatcatcaccaccatcactga1116

<210>4

<211>385

<212>prt

<213>akkermansiamuciniphila

<400>4

metleulysargleuleuseralaphepheserleuphepheleugly

151015

alaalaserglythrserphealagluvalthrvalproaspalaleu

202530

lysaspargilealaleulyslysthralaargglnleuasnileval

354045

tyrpheleuglyseraspthrgluprovalproasptyrgluargarg

505560

leusergluleuleuleutyrleuglnglnphetyrglylysglumet

65707580

glnarghisglytyrglyalaargserpheglyleuaspilelysser

859095

proglyargvalasnileileglutyrlysalalysasnproalaala

100105110

histyrprotyrgluasnglyglyglytrplysalaalaglngluleu

115120125

aspgluphephelysalahisproasparglyslysserglnhisthr

130135140

leuileilemetprothrtrpasnaspglulysasnglyproaspasn

145150155160

proglyglyvalprophetyrglymetglyargasncysphealaleu

165170175

asptyrproalapheaspilelyshisleuglyglnlysthrargglu

180185190

glyargleuleuthrlystrptyrglyglymetalahisgluleugly

195200205

hisglyleuasnleuprohisasnhisglnthralaseraspglylys

210215220

lystyrglythralaleumetglyserglyasntyrthrpheglythr

225230235240

serprothrpheleuthrproalasercysalaleuleuaspalacys

245250255

gluvalpheservalthrproserglnglnphetyrgluglylyspro

260265270

gluvalgluvalglyaspvalalaileserphelysglyaspglnile

275280285

leuvalserglyasntyrlysserproglnthrvallysalaleuasn

290295300

valtyrileglnaspproprotyralavalasnglnasptyraspala

305310315320

valserpheserargargleuglylyslysserglylysphesermet

325330335

lysileasplyslysgluleugluglyleuasnasnasngluphearg

340345350

ileserleumetpheileleualaasnglyleuhismetglnlyshis

355360365

phethrphehistrpaspalaleuglnasptyrargaspglyserlys

370375380

ser

385

<210>5

<211>361

<212>prt

<213>artificialsequence

<220>

<223>polypeptidecapableofbindingtoo-glycansbutlacksorhas

reducedo-glycoprotein-specificendoproteaseactivity

<400>5

gluvalthrvalproaspalaleulysaspargilealaleulyslys

151015

thralaargglnleuasnilevaltyrpheleuglyseraspthrglu

202530

provalproasptyrgluargargleusergluleuleuleutyrleu

354045

glnglnphetyrglylysglumetglnarghisglytyrglyalaarg

505560

serpheglyleuaspilelysserproglyargvalasnileileglu

65707580

tyrlysalalysasnproalaalahistyrprotyrgluasnglygly

859095

glytrplysalaalaglngluleuaspgluphephelysalahispro

100105110

asparglyslysserglnhisthrleuileilemetprothrtrpasn

115120125

aspglulysasnglyproaspasnproglyglyvalprophetyrgly

130135140

metglyargasncysphealaleuasptyrproalapheaspilelys

145150155160

hisleuglyglnlysthrarggluglyargleuleuthrlystrptyr

165170175

glyglymetalahisalaleuglyhisglyleuasnleuprohisasn

180185190

hisglnthralaseraspglylyslystyrglythralaleumetgly

195200205

serglyasntyrthrpheglythrserprothrpheleuthrproala

210215220

sercysalaleuleuaspalacysgluvalpheservalthrproser

225230235240

glnglnphetyrgluglylysprogluvalgluvalglyaspvalala

245250255

ileserphelysglyaspglnileleuvalserglyasntyrlysser

260265270

proglnthrvallysalaleuasnvaltyrileglnaspproprotyr

275280285

alavalasnglnasptyraspalavalserpheserargargleugly

290295300

lyslysserglylysphesermetlysileasplyslysgluleuglu

305310315320

glyleuasnasnasnglupheargileserleumetpheileleuala

325330335

asnglyleuhismetglnlyshisphethrphehistrpaspalaleu

340345350

glnasptyrargaspglyserlysser

355360

<210>6

<211>371

<212>prt

<213>artificialsequence

<220>

<223>lse206a(n-terminalmethionineandac-terminallinker+his6

tag)

<400>6

metgluvalthrvalproaspalaleulysaspargilealaleulys

151015

lysthralaargglnleuasnilevaltyrpheleuglyseraspthr

202530

gluprovalproasptyrgluargargleusergluleuleuleutyr

354045

leuglnglnphetyrglylysglumetglnarghisglytyrglyala

505560

argserpheglyleuaspilelysserproglyargvalasnileile

65707580

glutyrlysalalysasnproalaalahistyrprotyrgluasngly

859095

glyglytrplysalaalaglngluleuaspgluphephelysalahis

100105110

proasparglyslysserglnhisthrleuileilemetprothrtrp

115120125

asnaspglulysasnglyproaspasnproglyglyvalprophetyr

130135140

glymetglyargasncysphealaleuasptyrproalapheaspile

145150155160

lyshisleuglyglnlysthrarggluglyargleuleuthrlystrp

165170175

tyrglyglymetalahisalaleuglyhisglyleuasnleuprohis

180185190

asnhisglnthralaseraspglylyslystyrglythralaleumet

195200205

glyserglyasntyrthrpheglythrserprothrpheleuthrpro

210215220

alasercysalaleuleuaspalacysgluvalpheservalthrpro

225230235240

serglnglnphetyrgluglylysprogluvalgluvalglyaspval

245250255

alaileserphelysglyaspglnileleuvalserglyasntyrlys

260265270

serproglnthrvallysalaleuasnvaltyrileglnasppropro

275280285

tyralavalasnglnasptyraspalavalserpheserargargleu

290295300

glylyslysserglylysphesermetlysileasplyslysgluleu

305310315320

gluglyleuasnasnasnglupheargileserleumetpheileleu

325330335

alaasnglyleuhismetglnlyshisphethrphehistrpaspala

340345350

leuglnasptyrargaspglyserlysserglyserglyhishishis

355360365

hishishis

370

<210>7

<211>1116

<212>dna

<213>artificialsequence

<220>

<223>nucleotidesequenceencodinglse206a

<400>7

atggaagtcactgtgccggacgccctgaaagatcgcatcgcgctgaagaaaaccgctcgt60

cagctgaatatcgtctacttcctgggttctgataccgaaccggttccggactacgagcgc120

cgtctgagcgagctgctgttgtatctgcagcaattctatggtaaagaaatgcagcgccat180

ggctatggcgcacgcagctttggtctggacattaagtcaccgggtcgtgtgaacattatc240

gagtacaaagcgaagaacccggcagcgcattacccgtatgagaatggtggcggctggaaa300

gctgcacaagaactggacgaatttttcaaggcccatccagaccgcaagaaaagccagcac360

accctgatcatcatgcctacctggaatgatgagaaaaatggtcctgacaatccgggtggc420

gttccgttctatggtatgggtcgtaattgttttgcgttggactacccggcgtttgatatc480

aagcacctgggtcagaaaacgcgtgagggtcgtctgctgacgaaatggtacggtggcatg540

gcgcacgcgctgggccacggcctgaatctgccgcacaatcaccagaccgcgagcgatggc600

aagaaatatggcaccgccctgatgggtagcggcaactacacgttcggtaccagcccgacg660

ttcctgaccccggcgagctgtgcgctgctggatgcctgcgaagtgttcagcgttaccccg720

agccaacagttttatgagggtaagccagaagtcgaggttggtgatgttgcaatttccttc780

aagggtgatcaaatcttggtcagcggtaactacaagagcccgcaaaccgtgaaagctctg840

aacgtttacattcaggatccgccgtacgccgtgaaccaagactacgatgcagtgagcttt900

agccgtcgtctgggcaaaaagtccggtaagtttagcatgaagattgacaaaaaagaactg960

gaaggcctgaataacaacgaattccgtatttccttgatgttcattctggcaaacggctta1020

cacatgcagaagcactttacgtttcactgggatgcgctgcaagactaccgtgacggtagc1080

aaatctggttcgggtcatcatcaccaccatcactga1116

<210>8

<211>10

<212>prt

<213>artificialsequence

<220>

<223>metalloproteasedomainmotif

<400>8

glymetalahisgluleuglyhisglyleu

1510

<210>9

<211>595

<212>prt

<213>akkermansiamuciniphila

<400>9

metlysasnleuleuphealaleuleuthrglyserphecyscyscys

151015

tyralaglnglnlysalaalaprovalprogluprogluvalvalala

202530

thrproproalaaspalaglyargglyleuileargvalaspserarg

354045

gluilearghistyrserglythrarglysgluproasptyrleuval

505560

serargaspasnglylysthrtrpglumetlysalaalaproalagly

65707580

tyrproproasntyrglyglyileprolysgluserproalaileval

859095

argasnproleuthrargglupheileargvalglnproileglygly

100105110

phevalpheleuserargglyglyleuaspglylystrpleualaval

115120125

thrasnaspglylysleuglugluasptrplysaspproglulysarg

130135140

lysasnleulyslysleuglyglyilemetargthrprovalpheval

145150155160

asnlysglyargargvalilevalprophehisasnmetglyglygly

165170175

thrlysphehisileseraspaspglyglyleuthrtrphisvalser

180185190

argasnglyvalthrserproarghisglualaargproprohisgln

195200205

glyvalargtrppheasnasnalavalglualathrvalleuglumet

210215220

lysaspglythrleutrpalaleualaargthrserglnaspglnala

225230235240

trpglnalapheserlysasptyrglygluthrtrpserlysproglu

245250255

proserargphepheglythrleuthrmetasnthrleuglyargleu

260265270

aspaspglythrilevalserleutrpthrasnthrmetalaleupro

275280285

gluasnalathralaglyasnglythrtrpgluaspvalphethrasn

290295300

argaspserhishisilealametserglyaspgluglylysthrtrp

305310315320

tyrglyphearggluileileleuaspgluhisargasnhisprogly

325330335

tyralathrleuaspglyprogluaspargglylyshisglnserglu

340345350

metvalglnleuasplysasnargileleuileserleuglyglnhis

355360365

lysasnhisargargleuvalilevalaspargargtrpvalglyala

370375380

lysthrargalathrglnthrglylysaspleuaspserglntrpthr

385390395400

ilehisthrtyrileproglnlyslysglyhiscyssertyrasnarg

405410415

lysproseralagluleuvalglnaspproserglyglythrlyslys

420425430

valleuglnilelysargleuaspaspprogluleuvalasnglulys

435440445

serasnvalasptyrargasnglyglyalathrtrpasnpheproasn

450455460

glythrthrglyleuvallyspheargpheargvalvalaspglyglu

465470475480

glnalaaspaspserglyleuglnvalserleuthraspargleuphe

485490495

asnalacysaspserthrthrlysasptyralaleuphethrphepro

500505510

ileargleulysproalaprohisleuleuleuglymetlyslysval

515520525

prophethrproglyalatrphisgluileserleuleutrpglngly

530535540

glyglnalavalvalserleuaspglylyslysalaglythrleulys

545550555560

metalaasnlysserproasnglyalasertyrilehispheileser

565570575

thrglyserglnproaspalaglyileleuleuaspthrvalasnala

580585590

argvallys

595

<210>10

<211>577

<212>prt

<213>akkermansiamuciniphila

<400>10

glnglnlysalaalaprovalprogluprogluvalvalalathrpro

151015

proalaaspalaglyargglyleuileargvalaspserarggluile

202530

arghistyrserglythrarglysgluproasptyrleuvalserarg

354045

aspasnglylysthrtrpglumetlysalaalaproalaglytyrpro

505560

proasntyrglyglyileprolysgluserproalailevalargasn

65707580

proleuthrargglupheileargvalglnproileglyglypheval

859095

pheleuserargglyglyleuaspglylystrpleualavalthrasn

100105110

aspglylysleuglugluasptrplysaspproglulysarglysasn

115120125

leulyslysleuglyglyilemetargthrprovalphevalasnlys

130135140

glyargargvalilevalprophehisasnmetglyglyglythrlys

145150155160

phehisileseraspaspglyglyleuthrtrphisvalserargasn

165170175

glyvalthrserproarghisglualaargproprohisglnglyval

180185190

argtrppheasnasnalavalglualathrvalleuglumetlysasp

195200205

glythrleutrpalaleualaargthrserglnaspglnalatrpgln

210215220

alapheserlysasptyrglygluthrtrpserlysprogluproser

225230235240

argphepheglythrleuthrmetasnthrleuglyargleuaspasp

245250255

glythrilevalserleutrpthrasnthrmetalaleuprogluasn

260265270

alathralaglyasnglythrtrpgluaspvalphethrasnargasp

275280285

serhishisilealametserglyaspgluglylysthrtrptyrgly

290295300

phearggluileileleuaspgluhisargasnhisproglytyrala

305310315320

thrleuaspglyprogluaspargglylyshisglnserglumetval

325330335

glnleuasplysasnargileleuileserleuglyglnhislysasn

340345350

hisargargleuvalilevalaspargargtrpvalglyalalysthr

355360365

argalathrglnthrglylysaspleuaspserglntrpthrilehis

370375380

thrtyrileproglnlyslysglyhiscyssertyrasnarglyspro

385390395400

seralagluleuvalglnaspproserglyglythrlyslysvalleu

405410415

glnilelysargleuaspaspprogluleuvalasnglulysserasn

420425430

valasptyrargasnglyglyalathrtrpasnpheproasnglythr

435440445

thrglyleuvallyspheargpheargvalvalaspglygluglnala

450455460

aspaspserglyleuglnvalserleuthraspargleupheasnala

465470475480

cysaspserthrthrlysasptyralaleuphethrpheproilearg

485490495

leulysproalaprohisleuleuleuglymetlyslysvalprophe

500505510

thrproglyalatrphisgluileserleuleutrpglnglyglygln

515520525

alavalvalserleuaspglylyslysalaglythrleulysmetala

530535540

asnlysserproasnglyalasertyrilehispheileserthrgly

545550555560

serglnproaspalaglyileleuleuaspthrvalasnalaargval

565570575

lys

<210>11

<211>589

<212>prt

<213>artificialsequence

<220>

<223>am1757(n-terminalmethionineandac-terminallinker+his6tag)

<400>11

metglnglnlysalaalaprovalprogluprogluvalvalalathr

151015

proproalaaspalaglyargglyleuileargvalaspserargglu

202530

ilearghistyrserglythrarglysgluproasptyrleuvalser

354045

argaspasnglylysthrtrpglumetlysalaalaproalaglytyr

505560

proproasntyrglyglyileprolysgluserproalailevalarg

65707580

asnproleuthrargglupheileargvalglnproileglyglyphe

859095

valpheleuserargglyglyleuaspglylystrpleualavalthr

100105110

asnaspglylysleuglugluasptrplysaspproglulysarglys

115120125

asnleulyslysleuglyglyilemetargthrprovalphevalasn

130135140

lysglyargargvalilevalprophehisasnmetglyglyglythr

145150155160

lysphehisileseraspaspglyglyleuthrtrphisvalserarg

165170175

asnglyvalthrserproarghisglualaargproprohisglngly

180185190

valargtrppheasnasnalavalglualathrvalleuglumetlys

195200205

aspglythrleutrpalaleualaargthrserglnaspglnalatrp

210215220

glnalapheserlysasptyrglygluthrtrpserlysproglupro

225230235240

serargphepheglythrleuthrmetasnthrleuglyargleuasp

245250255

aspglythrilevalserleutrpthrasnthrmetalaleuproglu

260265270

asnalathralaglyasnglythrtrpgluaspvalphethrasnarg

275280285

aspserhishisilealametserglyaspgluglylysthrtrptyr

290295300

glyphearggluileileleuaspgluhisargasnhisproglytyr

305310315320

alathrleuaspglyprogluaspargglylyshisglnserglumet

325330335

valglnleuasplysasnargileleuileserleuglyglnhislys

340345350

asnhisargargleuvalilevalaspargargtrpvalglyalalys

355360365

thrargalathrglnthrglylysaspleuaspserglntrpthrile

370375380

histhrtyrileproglnlyslysglyhiscyssertyrasnarglys

385390395400

proseralagluleuvalglnaspproserglyglythrlyslysval

405410415

leuglnilelysargleuaspaspprogluleuvalasnglulysser

420425430

asnvalasptyrargasnglyglyalathrtrpasnpheproasngly

435440445

thrthrglyleuvallyspheargpheargvalvalaspglyglugln

450455460

alaaspaspserglyleuglnvalserleuthraspargleupheasn

465470475480

alacysaspserthrthrlysasptyralaleuphethrpheproile

485490495

argleulysproalaprohisleuleuleuglymetlyslysvalpro

500505510

phethrproglyalatrphisgluileserleuleutrpglnglygly

515520525

glnalavalvalserleuaspglylyslysalaglythrleulysmet

530535540

alaasnlysserproasnglyalasertyrilehispheileserthr

545550555560

glyserglnproaspalaglyileleuleuaspthrvalasnalaarg

565570575

vallysglyserglyleugluhishishishishishis

580585

<210>12

<211>419

<212>prt

<213>akkermansiamuciniphila

<400>12

metthrtrpleuleucysglyargglylystrpasnlysvallysarg

151015

metmetasnservalphelyscysleumetseralavalcysalaval

202530

alaleuproalapheglyglngluglulysthrglypheprothrasp

354045

argalavalthrvalpheseralaglygluglyasnprotyralaser

505560

ileargileproalaleuleuserileglylysglyglnleuleuala

65707580

phealagluglyargtyrlysasnthraspglnglygluasnaspile

859095

ilemetservalserlysasnglyglylysthrtrpserargproarg

100105110

alailealalysalahisglyalathrpheasnasnprocysproval

115120125

tyraspalalysthrargthrvalthrvalvalpheglnargtyrpro

130135140

alaglyvallysgluargglnproasnileproaspglytrpaspasp

145150155160

glulyscysileargasnphemetileglnserargasnglyglyser

165170175

sertrpthrlysproglngluilethrlysthrthrlysargproser

180185190

glyvalaspilemetalaserglyproasnalaglythrglnleulys

195200205

serglyalahislysglyargleuvalileprometasngluglypro

210215220

pheglylystrpvalilesercysiletyrseraspaspglyglylys

225230235240

sertrplysleuglyglnprothralaasnmetlysglymetvalasn

245250255

gluthrserilealagluthraspasnglyglyvalvalmetvalala

260265270

arghistrpglyalaglyasncysargargilealatrpserglnasp

275280285

glyglygluthrtrpglyglnvalgluaspalaprogluleuphecys

290295300

aspserthrglnasnserleumetthrtyrserleuseraspglnpro

305310315320

alatyrglyglylysserargileleupheserglyproseralagly

325330335

argargilelysglyglnvalalametsertyraspasnglylysthr

340345350

trpprovallyslysleuleuglygluglyglyphealatyrserser

355360365

leualametvalgluproglyilevalglyvalleutyrglugluasn

370375380

glngluhisilelyslysleulysphevalproilethrmetglutrp

385390395400

leuthraspglygluaspthrglyleualaproglylyslysalapro

405410415

valleulys

<210>13

<211>381

<212>prt

<213>akkermansiamuciniphila

<400>13

glngluglulysthrglypheprothraspargalavalthrvalphe

151015

seralaglygluglyasnprotyralaserileargileproalaleu

202530

leuserileglylysglyglnleuleualaphealagluglyargtyr

354045

lysasnthraspglnglygluasnaspileilemetservalserlys

505560

asnglyglylysthrtrpserargproargalailealalysalahis

65707580

glyalathrpheasnasnprocysprovaltyraspalalysthrarg

859095

thrvalthrvalvalpheglnargtyrproalaglyvallysgluarg

100105110

glnproasnileproaspglytrpaspaspglulyscysileargasn

115120125

phemetileglnserargasnglyglysersertrpthrlysprogln

130135140

gluilethrlysthrthrlysargproserglyvalaspilemetala

145150155160

serglyproasnalaglythrglnleulysserglyalahislysgly

165170175

argleuvalileprometasngluglypropheglylystrpvalile

180185190

sercysiletyrseraspaspglyglylyssertrplysleuglygln

195200205

prothralaasnmetlysglymetvalasngluthrserilealaglu

210215220

thraspasnglyglyvalvalmetvalalaarghistrpglyalagly

225230235240

asncysargargilealatrpserglnaspglyglygluthrtrpgly

245250255

glnvalgluaspalaprogluleuphecysaspserthrglnasnser

260265270

leumetthrtyrserleuseraspglnproalatyrglyglylysser

275280285

argileleupheserglyproseralaglyargargilelysglygln

290295300

valalametsertyraspasnglylysthrtrpprovallyslysleu

305310315320

leuglygluglyglyphealatyrserserleualametvalglupro

325330335

glyilevalglyvalleutyrglugluasnglngluhisilelyslys

340345350

leulysphevalproilethrmetglutrpleuthraspglygluasp

355360365

thrglyleualaproglylyslysalaprovalleulys

370375380

<210>14

<211>393

<212>prt

<213>artificialsequence

<220>

<223>am0707(includingn-terminalmethionineandac-terminallinker+

his6tag)

<400>14

metglngluglulysthrglypheprothraspargalavalthrval

151015

pheseralaglygluglyasnprotyralaserileargileproala

202530

leuleuserileglylysglyglnleuleualaphealagluglyarg

354045

tyrlysasnthraspglnglygluasnaspileilemetservalser

505560

lysasnglyglylysthrtrpserargproargalailealalysala

65707580

hisglyalathrpheasnasnprocysprovaltyraspalalysthr

859095

argthrvalthrvalvalpheglnargtyrproalaglyvallysglu

100105110

argglnproasnileproaspglytrpaspaspglulyscysilearg

115120125

asnphemetileglnserargasnglyglysersertrpthrlyspro

130135140

glngluilethrlysthrthrlysargproserglyvalaspilemet

145150155160

alaserglyproasnalaglythrglnleulysserglyalahislys

165170175

glyargleuvalileprometasngluglypropheglylystrpval

180185190

ilesercysiletyrseraspaspglyglylyssertrplysleugly

195200205

glnprothralaasnmetlysglymetvalasngluthrserileala

210215220

gluthraspasnglyglyvalvalmetvalalaarghistrpglyala

225230235240

glyasncysargargilealatrpserglnaspglyglygluthrtrp

245250255

glyglnvalgluaspalaprogluleuphecysaspserthrglnasn

260265270

serleumetthrtyrserleuseraspglnproalatyrglyglylys

275280285

serargileleupheserglyproseralaglyargargilelysgly

290295300

glnvalalametsertyraspasnglylysthrtrpprovallyslys

305310315320

leuleuglygluglyglyphealatyrserserleualametvalglu

325330335

proglyilevalglyvalleutyrglugluasnglngluhisilelys

340345350

lysleulysphevalproilethrmetglutrpleuthraspglyglu

355360365

aspthrglyleualaproglylyslysalaprovalleulysglyser

370375380

glyleugluhishishishishishis

385390

<210>15

<211>2133

<212>prt

<213>streptococcusoralis

<400>15

metasplysargphepheglulysargcyslyspheserilearglys

151015

phethrleuglyvalalaservalmetileglyalathrphepheala

202530

alaserprovalleualaaspglnalaargvalglyserthraspasn

354045

leuprosergluleualaaspleuasplyslysalaseraspglugly

505560

hisasppheasplysglualaalaalaglnasnproglyseralaglu

65707580

thrthrgluglyproglnthrgluglugluleuleualaglnglulys

859095

glulysserglulysproserasnleuprolysgluleugluasplys

100105110

leuglulysalagluaspasnglyarggluvalasplysaspglnleu

115120125

alaglnaspthrglylysleuvalprogluaspvalalalysthrthr

130135140

asnglygluleuasntyrglyalathrvallysilelysthrproser

145150155160

glygluglyserglyilevalvalalalysaspleuvalleuthrval

165170175

serhisasnpheilelysaspserglngluglyasnilearglysval

180185190

valaspasnaspglnglyaspglyaspiletyrserilesertyrpro

195200205

glyleuproaspvallyspheserlyslysaspileilehistrpasp

210215220

arggluglytyrleulysglyphelysasnaspleualaleuvalarg

225230235240

leuargthrvalleugluasnthrprovalgluvalthrlyslyspro

245250255

valvallyslysileglyasplysleuhisvalpheglytyrproglu

260265270

glylysleuasnproilevalasnthrthrvalaspphealaglupro

275280285

tyrglygluglyvalglnglyileglytyrglnglyglylysprogly

290295300

alaserglyglyglyilepheaspthrgluglylysleuvalglyval

305310315320

hisglnasnglyvalvalglylysargserglyglyileleupheser

325330335

proalaglnleulystrpileglnasphismetglnglyileserser

340345350

vallysproalaaspleugluglulysglulysproalagluglulys

355360365

prolysgluasplysproalaalaalalysprogluthrprolysala

370375380

valthrproglutrpglnthrvalalaasnlysgluglnglnglythr

385390395400

valthrilearggluglulysglyvalargtyrasnglnleuserser

405410415

thralaglnasnaspasnaspglylysproalaleupheglulysgln

420425430

glyleuthrvalaspalaasnglyasnalathrvalaspleuthrphe

435440445

lysaspaspserglulysglylysserargpheglyvalpheleulys

450455460

phelysaspthrlysasnasnvalphevalglytyraspglnglygly

465470475480

trpphetrpglutyrlysthrproglyasnserthrtrptyrlysgly

485490495

asnargvalalaalaprogluproglyservalasnargleuserile

500505510

thrleulysseraspglyglnleuasnalaserasnasnaspvalasn

515520525

leupheaspthrvalthrleuproglyalavalasngluasnleulys

530535540

asnglulyslysileleuleulysalaglythrtyrserasnasparg

545550555560

thrvalvalservallysthraspasnglngluglyvallysalaasp

565570575

aspthrproalaglnlysgluthrglyproalavalaspaspserlys

580585590

valthrtyraspthrileglnserlysvalleulysalavalileasp

595600605

glnalapheproargvallysglutyrthrleuasnglyhisthrleu

610615620

proglyglnvalglnglnpheasnglnvalpheileasnasnhisarg

625630635640

ilethrprogluvalthrtyrlyslysileasngluthrthralaglu

645650655

tyrleumetlysleuargaspaspalahisleuileasnalaglumet

660665670

thrvalargleuglnvalvalaspasnglnleuhispheaspvalthr

675680685

lysilevalasnhisasnglnvalthrproglyglnlysileaspasp

690695700

gluarglysleuleuserthrileserpheleuglyasnalaleuval

705710715720

servalserseraspglnalaglyalalyspheaspglyalathrmet

725730735

serasnasnthrhisvalserglyaspasphisileaspvalthrasn

740745750

prometlysaspleualalysglytyrmettyrglyphevalserthr

755760765

asplysleualaalaglyvaltrpserasnserglnasnsertyrgly

770775780

glyglyserasnasptrpthrargleuthralatyrlysgluthrval

785790795800

glyasnalaasntyrvalglyilehisserserglutrpglntrpglu

805810815

lysalatyrlysglyilevalpheproglutyrthrlysgluleupro

820825830

seralalysvalvalilethrgluaspalaasnalaaspasnlysval

835840845

asptrpglnaspglyalailealatyrargserilemetasnasnpro

850855860

glnglytrpglulysvallysaspilethralatyrargilealamet

865870875880

asnpheglyserglnalaglnasnpropheleumetthrleuaspgly

885890895

ilelyslysileasnleuhisthraspglyleuglyglnglyvalleu

900905910

leulysglytyrglysergluglyhisaspserglyhisleuasntyr

915920925

alaaspileglylysargileglyglyvalgluaspphelysthrleu

930935940

ileglulysalalyslystyrglyalahisleuglyilehisvalasn

945950955960

alasergluthrtyrprogluserlystyrpheasngluasnileleu

965970975

arglysasnproaspglysertyrsertyrglytrpasntrpleuasp

980985990

glnglyileasnileaspalaalatyraspleualahisglyargleu

99510001005

alaargtrpgluaspleulyslyslysleuglygluglyleuasp

101010151020

pheiletyrvalaspvaltrpglyasnglyglnserglyaspasn

102510301035

glyalatrpalathrhisvalleualalysgluileasnlysgln

104010451050

glytrpargphealaileglutrpglyhisglyglyglutyrasp

105510601065

serthrpheglnhistrpalaalaaspleuthrtyrglyglytyr

107010751080

thrasnlysglyileasnseralailethrargpheileargasn

108510901095

hisglnlysaspsertrpvalglyasptyrargsertyrglygly

110011051110

alaalaasntyrproleuleuglyglytyrsermetlysaspphe

111511201125

gluglytrpglnglyargserasptyrasnglytyrvalthrasn

113011351140

leuphealahisaspvalmetthrlystyrpheglnhisphethr

114511501155

valserlystrpgluasnglythrprovalthrmetthraspasn

116011651170

glyserthrtyrlystrpthrproglumetlysvalgluleuval

117511801185

aspalaalaglyasnlysvalvalvalthrarglysserasnasp

119011951200

valasnserproglntyrarggluargthrvalthrleuasngly

120512101215

argvalileglnaspglyseralatyrleuthrprotrpasntrp

122012251230

aspalaasnglylyslysleuprothrglulysglulysmettyr

123512401245

tyrpheasnthrglnalaglyalathrthrtrpthrleuproser

125012551260

asptrpalaasnserlysvaltyrleutyrlysleuthraspgln

126512701275

glylysthrglugluglngluleuthrvalthraspglylysile

128012851290

thrleuaspleuleualaasnglnprotyrvalleutyrargser

129513001305

lysglnthrasnproglumetsertrpsergluglymethisile

131013151320

tyraspglnglypheasnserglythrleulyshistrpthrile

132513301335

serglyaspalaserlysalagluilevallysserglnglyala

134013451350

asnglumetleuargileglnglyasnlysserlysvalserleu

135513601365

thrglnlysleuthrglyleulysproasnthrlystyralaval

137013751380

tyrvalglyvalaspasnargserasnalalysalaserilethr

138513901395

valasnthrglyglulysgluvalthrthrtyrthrasnlysser

140014051410

leualaleuasntyrilelysalatyralahisasnasnargarg

141514201425

gluasnalathrvalaspaspthrsertyrpheglnasnmettyr

143014351440

alaphephethrthrglyseraspvalserasnvalthrleuthr

144514501455

leuserargglualaglyaspglualathrtyrpheaspgluile

146014651470

argthrphegluasnasnsersermettyrglyasplyshisasp

147514801485

thrglyglnglythrphelysglnaspphegluasnvalalagln

149014951500

glyilepheprophevalvalglyglyvalgluglyvalgluasp

150515101515

asnargthrhisleuserglulyshisaspprotyrthrglnarg

152015251530

glytrpasnglylyslysvalaspaspvalilegluglyasntrp

153515401545

serleulysthrasnglyleuvalserargargasnleuvaltyr

155015551560

glnthrileproglnasnpheargpheglualaglylysthrtyr

156515701575

argvalthrpheglutyrglualaglyseraspasnthrtyrala

158015851590

phevalvalglylysglyglupheglnserglyargargglythr

159516001605

glnalaserasnleuglumethisgluleuproasnthrtrpthr

161016151620

aspserlyslysalalyslysvalthrpheleuvalthrglyala

162516301635

gluthrglyaspthrtrpvalglyiletyrserthrglyasnala

164016451650

serasnthrargglyaspalaglyglyasnalaasnphearggly

165516601665

tyrasnaspphemetmetaspasnleuglnileglugluilethr

167016751680

leuthrglylysmetleuthrgluasnalaleulysasntyrleu

168516901695

prothrvalalametthrasntyrthrlysglusermetaspala

170017051710

leulysglualavalpheasnleuserglnalaaspaspaspile

171517201725

servalgluglualaargalagluilealalysileglualaleu

173017351740

lysasnalaleuvalglnlyslysthralaleuvalalagluasp

174517501755

phegluserleuaspalaproalaglnproglygluglyleuglu

176017651770

asnalapheaspglyasnvalserserleutrphisthrsertrp

177517801785

asnglyglyaspvalglylysproalathrmetvalleulysglu

179017951800

prothrgluilethrglyleuargtyrvalproargalaserasp

180518101815

serasnglyasnleuargaspvallysleuvalvalthraspglu

182018251830

serglylysgluhisthrpheasnvalthrasptrpproasnasn

183518401845

asnlysprolysaspileasppheglylysthrilelysalalys

185018551860

lysilevalleuthrglythrlysthrtyrglyaspglyglyasp

186518701875

lystyrglnseralaalagluleuilephethrargproglnval

188018851890

alagluthrproleuaspleuserglytyrglualaalaleuala

189519001905

lysalaglnlysleuthrasplysaspasnglnglugluvalala

191019151920

servalglnalasermetlystyralathraspasnhisleuleu

192519301935

thrgluargmetvalalatyrphealaasptyrleuasnglnleu

194019451950

lysaspseralathrlysproaspalaprothrserserlysgly

195519601965

glugluglnproprovalleuaspvalprogluphelysglygly

197019751980

valasnalathrglualaalavalhisgluvalprogluphelys

198519901995

glyglyvalasnalavalglnalaleuvalhisgluleuproglu

200020052010

tyrlysglyglyalaasnalavalleualaalaalaasngluval

201520202025

proglutyrlysglyglyalaasnalavalglualaleuvalasn

203020352040

glulysproalatyrthrglyvalleualathralaglyaspgln

204520502055

alaalaprothrvalglulysproglutyrproleuthrproser

206020652070

provalalaaspthrlysthrproglyalalysaspgluglulys

207520802085

leuproalathrglygluhissersergluvalalaleupheleu

209020952100

alaservalserilealaleuseralaalavalleualathrlys

210521102115

arglysglugluglyserglyleugluhishishishishishis

212021252130

<210>16

<211>22

<212>dna

<213>artificialsequence

<220>

<223>e206aforwardprimer

<400>16

atggcgcacgcgctgggccacg22

<210>17

<211>19

<212>dna

<213>artificialsequence

<220>

<223>e206areverseprimer

<400>17

gccaccgtaccatttcgtc19

<210>18

<211>166

<212>prt

<213>artificialsequence

<220>

<223>epo

<400>18

alaproproargleuilecysaspserargvalleugluargtyrleu

151015

leuglualalysglualagluaspilethrthrglycysalagluhis

202530

cysserleuaspgluasnilethrvalproaspthrlysvalaspphe

354045

tyralatrplysargmetgluvalglyglnglnalavalgluvaltrp

505560

glnglyleualaleuleuserglualavalleuargglyglnalaleu

65707580

leuvalasnserserglnprotrpgluproleuglnleuhisvalasp

859095

lysalavalserglyleuargserleuthrthrleuleuargalaleu

100105110

glyalaglnlysglualaileserproproaspalaalaseralaala

115120125

proleuargthrilethralaaspthrphearglysleupheargval

130135140

tyrserasnpheleuargglylysleulysleutyrthrglygluala

145150155160

cysargthrglyasparg

165

<210>19

<400>19

000

<210>20

<211>361

<212>prt

<213>artificialsequence

<220>

<223>polypeptidecapableofbindingtoo-glycansbutlacksorhas

reducedo-glycoprotein-specificendoproteaseactivity

<400>20

gluvalthrvalproaspalaleulysaspargilealaleulyslys

151015

thralaargglnleuasnilevaltyrpheleuglyseraspthrglu

202530

provalproasptyrgluargargleusergluleuleuleutyrleu

354045

glnglnphetyrglylysglumetglnarghisglytyrglyalaarg

505560

serpheglyleuaspilelysserproglyargvalasnileileglu

65707580

tyrlysalalysasnproalaalahistyrprotyrgluasnglygly

859095

glytrplysalaalaglngluleuaspgluphephelysalahispro

100105110

asparglyslysserglnhisthrleuileilemetprothrtrpasn

115120125

aspglulysasnglyproaspasnproglyglyvalprophetyrgly

130135140

metglyargasncysphealaleuasptyrproalapheaspilelys

145150155160

hisleuglyglnlysthrarggluglyargleuleuthrlystrptyr

165170175

glyglymetalaalaalaleuglyhisglyleuasnleuprohisasn

180185190

hisglnthralaseraspglylyslystyrglythralaleumetgly

195200205

serglyasntyrthrpheglythrserprothrpheleuthrproala

210215220

sercysalaleuleuaspalacysgluvalpheservalthrproser

225230235240

glnglnphetyrgluglylysprogluvalgluvalglyaspvalala

245250255

ileserphelysglyaspglnileleuvalserglyasntyrlysser

260265270

proglnthrvallysalaleuasnvaltyrileglnaspproprotyr

275280285

alavalasnglnasptyraspalavalserpheserargargleugly

290295300

lyslysserglylysphesermetlysileasplyslysgluleuglu

305310315320

glyleuasnasnasnglupheargileserleumetpheileleuala

325330335

asnglyleuhismetglnlyshisphethrphehistrpaspalaleu

340345350

glnasptyrargaspglyserlysser

355360

<210>21

<211>371

<212>prt

<213>artificialsequence

<220>

<223>lshe206aaorlsh205a/e206a(includingn-terminalmethionine

andc-terminallinker)

<400>21

metgluvalthrvalproaspalaleulysaspargilealaleulys

151015

lysthralaargglnleuasnilevaltyrpheleuglyseraspthr

202530

gluprovalproasptyrgluargargleusergluleuleuleutyr

354045

leuglnglnphetyrglylysglumetglnarghisglytyrglyala

505560

argserpheglyleuaspilelysserproglyargvalasnileile

65707580

glutyrlysalalysasnproalaalahistyrprotyrgluasngly

859095

glyglytrplysalaalaglngluleuaspgluphephelysalahis

100105110

proasparglyslysserglnhisthrleuileilemetprothrtrp

115120125

asnaspglulysasnglyproaspasnproglyglyvalprophetyr

130135140

glymetglyargasncysphealaleuasptyrproalapheaspile

145150155160

lyshisleuglyglnlysthrarggluglyargleuleuthrlystrp

165170175

tyrglyglymetalaalaalaleuglyhisglyleuasnleuprohis

180185190

asnhisglnthralaseraspglylyslystyrglythralaleumet

195200205

glyserglyasntyrthrpheglythrserprothrpheleuthrpro

210215220

alasercysalaleuleuaspalacysgluvalpheservalthrpro

225230235240

serglnglnphetyrgluglylysprogluvalgluvalglyaspval

245250255

alaileserphelysglyaspglnileleuvalserglyasntyrlys

260265270

serproglnthrvallysalaleuasnvaltyrileglnasppropro

275280285

tyralavalasnglnasptyraspalavalserpheserargargleu

290295300

glylyslysserglylysphesermetlysileasplyslysgluleu

305310315320

gluglyleuasnasnasnglupheargileserleumetpheileleu

325330335

alaasnglyleuhismetglnlyshisphethrphehistrpaspala

340345350

leuglnasptyrargaspglyserlysserglyserglyhishishis

355360365

hishishis

370

<210>22

<211>1116

<212>dna

<213>artificialsequence

<220>

<223>nucleotidesequenceencodinglshe206aaorlsh205a/e206a

<400>22

atggaagtcactgtgccggacgccctgaaagatcgcatcgcgctgaagaaaaccgctcgt60

cagctgaatatcgtctacttcctgggttctgataccgaaccggttccggactacgagcgc120

cgtctgagcgagctgctgttgtatctgcagcaattctatggtaaagaaatgcagcgccat180

ggctatggcgcacgcagctttggtctggacattaagtcaccgggtcgtgtgaacattatc240

gagtacaaagcgaagaacccggcagcgcattacccgtatgagaatggtggcggctggaaa300

gctgcacaagaactggacgaatttttcaaggcccatccagaccgcaagaaaagccagcac360

accctgatcatcatgcctacctggaatgatgagaaaaatggtcctgacaatccgggtggc420

gttccgttctatggtatgggtcgtaattgttttgcgttggactacccggcgtttgatatc480

aagcacctgggtcagaaaacgcgtgagggtcgtctgctgacgaaatggtacggtggcatg540

gcggccgcgctgggccacggcctgaatctgccgcacaatcaccagaccgcgagcgatggc600

aagaaatatggcaccgccctgatgggtagcggcaactacacgttcggtaccagcccgacg660

ttcctgaccccggcgagctgtgcgctgctggatgcctgcgaagtgttcagcgttaccccg720

agccaacagttttatgagggtaagccagaagtcgaggttggtgatgttgcaatttccttc780

aagggtgatcaaatcttggtcagcggtaactacaagagcccgcaaaccgtgaaagctctg840

aacgtttacattcaggatccgccgtacgccgtgaaccaagactacgatgcagtgagcttt900

agccgtcgtctgggcaaaaagtccggtaagtttagcatgaagattgacaaaaaagaactg960

gaaggcctgaataacaacgaattccgtatttccttgatgttcattctggcaaacggctta1020

cacatgcagaagcactttacgtttcactgggatgcgctgcaagactaccgtgacggtagc1080

aaatctggttcgggtcatcatcaccaccatcactga1116

<210>23

<211>10

<212>prt

<213>artificialsequence

<220>

<223>disruptedmetalloproteasemotif

<400>23

glymetalahisalaleuglyhisglyleu

1510

<210>24

<211>10

<212>prt

<213>artificialsequence

<220>

<223>disruptedmetalloproteasemotif

<400>24

glymetalaalagluleuglyhisglyleu

1510

<210>25

<211>10

<212>prt

<213>artificialsequence

<220>

<223>disruptedmetalloproteasemotif

<400>25

glymetalaalaalaleuglyhisglyleu

1510

<210>26

<211>882

<212>prt

<213>pseudomonasaeruginosa

<400>26

alathrglnglugluileleuaspalaalaleuvalserglyaspser

151015

serglnleuthraspserhisleuvalalaleuargleuglnglngln

202530

valgluargileargglnthrargthrglnleuleuaspglyleutyr

354045

glnasnleuserglnalatyraspproglyalaalasermettrpval

505560

leuproalaasnproaspasnthrleupropheleuileglyasplys

65707580

glyargvalleualaserleuserleuglualaglyglyargglyleu

859095

alatyrglythrasnvalleuthrglnleuserglythrasnalaala

100105110

hisalaproleuleulysargalavalglntrpleuvalasnglyasp

115120125

proglyalaalathralalysaspphelysvalservalvalglyval

130135140

asplysthralaalaleuasnglyleulysseralaglyleuglnpro

145150155160

alaaspalaalacysasnalaleuthraspalasercysalaserthr

165170175

serlysleuleuvalleuglyasnglyalaseralaalaserleuser

180185190

alathrvalargalaargleuglnalaglyleuproileleupheval

195200205

histhrasnglytrpasnglnserserthrglyglnglnileleuala

210215220

glyleuglyleuglngluglyprotyrglyglyasntyrtrpasplys

225230235240

aspargvalproserserargthrargthrargservalgluleugly

245250255

glyalatyrglyglnaspproalaleuvalglnglnilevalaspgly

260265270

sertrpargthrasptyrasptrpserlyscysthrsertyrvalgly

275280285

argthrthrcysaspaspvalproglyleuserasppheserlysarg

290295300

valaspvalleulysglyalaleuaspalatyrasnglnlysalagln

305310315320

asnleuphealaleuproglythrthrserleuargleutrpleuleu

325330335

trpalaaspalavalargglnasnileargtyrprometasplysala

340345350

alaaspthralaargpheglngluthrphevalalaaspalaileval

355360365

glytyrvalargglualaglyalaalaglnlysgluleuglysertyr

370375380

alaglyglnargglnglnsermetprovalserglyserglugluthr

385390395400

leuthrleuthrleuproseralaglnglyphethralaileglyarg

405410415

metalaalaproglylysargleuserileargilegluaspalagly

420425430

glnalaserleualavalglyleuasnthrglnargileglyserthr

435440445

argleutrpasnthrargglntyraspargproargpheleulysser

450455460

proaspilelysleuglnalaasnglnservalalaleuvalserpro

465470475480

tyrglyglyleuleuglnleuvaltyrserglyalathrproglygln

485490495

thrvalthrvallysvalthrglyalaalaserglnpropheleuasp

500505510

ileglnproglygluaspserserglnalailealaasppheilegln

515520525

alaleuaspalaasplysalaasptrpleugluileargserglyser

530535540

valgluvalhisalalysvalglulysvalargglyserileasplys

545550555560

asptyrglyglyaspvalglnargpheilearggluleuasngluval

565570575

pheileaspaspalatyrthrleualaglyphealaileproasngln

580585590

alalysthrproalaileglnglnglucysalaalaargglytrpasp

595600605

cysaspsergluthrleuhislysleuproglythrglnhisileasn

610615620

valaspglntyralaglncysglyglyglycysserglyasnprotyr

625630635640

aspglnthrtrpglyleuasnproargglytrpglygluserhisglu

645650655

leuglyhisasnleuglnvalasnargleulysvaltyrglyglyarg

660665670

serglygluileserasnglnilepheproleuhislysasptrparg

675680685

valleuargglupheglyglnasnleuaspaspthrargvalasntyr

690695700

argasnalatyrasnleuilevalalaglyargalaglualaasppro

705710715720

leualaglyvaltyrlysargleutrpgluaspproglythrtyrala

725730735

leuasnglygluargmetalaphetyrthrglntrpvalhistyrtrp

740745750

alaaspleulysasnaspproleuglnglytrpaspiletrpthrleu

755760765

leutyrleuhisglnargglnvalasplysserasptrpaspalaasn

770775780

lysalaalaleuglytyrglythrtyralaglnargproglyasnser

785790795800

glyaspalaserserthraspglyasnaspasnleuleuleuglyleu

805810815

sertrpleuthrglnargaspglnargprothrphealaleutrpgly

820825830

ileargthrseralaalaalaglnalaglnvalalaalatyrglyphe

835840845

alagluglnproalaphephetyralaasnasnargthrasnglutyr

850855860

serthrvallysleuleuaspmetserglnglyserproalatrppro

865870875880

phepro

<210>27

<211>536

<212>prt

<213>bacteroidesthetaiotaomicron

<400>27

asplystrpglulysglupheargileargsertyrgluprotyrser

151015

asnilealaglutrpalaasplysleumetthrlyslystyrserasp

202530

leuaspasnprothrglyileservallysalaglyaspaspileile

354045

valleuvalglyaspthrtyrglyglnasnilesermetglncysile

505560

trpgluthrglythrglutyrlysglnthralaserserglyaspval

65707580

tyrmetleuasnproglyvalasnlysleuthrmetlysglyglugly

859095

glnleuphevalmettyrasnthrgluleuthrserasnthralalys

100105110

proilelysilehisileproleuglyserglythrvalasnglyphe

115120125

pheaspleulysgluhislysthraspglulystyralagluleuleu

130135140

lyslysserthrhislystyrphecysileargglyglulysilemet

145150155160

phetyrphehisargasnlysleuleuglutyrvalproasnasnile

165170175

leuseralailehisleutrpaspasnilevalglytrpglnglnglu

180185190

leumetglyileaspaspvalargproserglnvalasnasnhisleu

195200205

phealaileserprogluglysertyrmettrpalaserasptyrgln

210215220

ileglyphevaltyrthrtyrleuglyasnileleuleugluaspasn

225230235240

valmetalaalagluaspasnalatrpglyproalahisgluilegly

245250255

hisvalhisglnalaalaileasntrpalaserserthrgluserser

260265270

asnasnleupheserasnpheileiletyrlysleuglylystyrlys

275280285

serargglyasnglyleuglyservalalathralaargtyralaasn

290295300

glyglnalatrptyrasnmetglyaspalathrhisglnasngluasp

305310315320

thrgluthrhismetargmetasntrpglnleutrpiletyrtyrhis

325330335

argcysglutyrlysthraspphetrpglnthrleuphelysleumet

340345350

arggluvalasnmetthrgluglygluaspproglylyslysglnleu

355360365

gluphealalysmetalaserlysalaalaasnglnasnleuthrasp

370375380

phepheglumettrpglyphephegluprovalasnthrthrileglu

385390395400

glntyrglythrtyrlystyrtyrvalseraspalametileargglu

405410415

alalysglutyrmetalaglnpheproalaprolyshisalaphegln

420425430

tyrilegluasparglyslysserglupheproserasnasptyrarg

435440445

tyrseralavalglyaspvalglytyrtyrthrglnphelysgluasn

450455460

glnlysilethrlysalailethralagluleualaglyarglysval

465470475480

serileglnasnglyaspglualavalalaphegluleuarggluasn

485490495

aspgluasnglylysleuleutyrpheserthrphethrthrpheglu

500505510

ileproserserileleumetvalasnalalysleutyralavalgln

515520525

alaaspglylysargileleuleu

530535

<210>28

<211>507

<212>prt

<213>clostridiumperfringens

<400>28

valleugluleuglumetargglyaspserileserglualalyslys

151015

arglysvaltrpasnpheglnasptrpglnilethrglyleuserala

202530

argalaglyasplysilethrvaltyrvalaspvalalagluglyasp

354045

prothrprothrleuleutyrlysglnserleuthrglnhisglygly

505560

alathrserpheglnleulysproglylysasngluilethrilepro

65707580

gluileasntyrgluserasnglyileprolysaspvalileglngly

859095

glyaspleuphephethrasntyrlysseraspserglnlysargala

100105110

prolysvalargilegluglyalaserlystyrprovalpheileleu

115120125

glylysseraspgluasngluvalmetlysgluleuglualatyrval

130135140

glulysilelysalagluprolysthrthrproasnilephealaval

145150155160

serserasnlysserleugluphevalglnalathrtyralaleuasp

165170175

trptyrlyslysasnasnlysthrprolystyrthralagluglntrp

180185190

aspglntyrilealaaspalametglyphetrpglypheaspasnser

195200205

lysaspvalasnserasppheasnpheargilemetprometvallys

210215220

asnleuserglyglyalaphemetasnalaglyasnglyvalilegly

225230235240

ileargproglyasnglnaspalaileleualaalaasnlysglytrp

245250255

glyvalalahisgluleuglyhisasnpheaspthrglyglyargthr

260265270

ilevalgluvalthrasnasnmetmetproleuphephegluserlys

275280285

tyrlysthrlysthrargilethraspglnasniletrpgluasnasn

290295300

thrtyrprolysvalglyleuaspasptyrserasnasngluleutyr

305310315320

asnlysalaaspserthrhisleualaglnleualaproleutrpgln

325330335

leutyrleutyraspasnthrphetyrglylysphegluargglnphe

340345350

arggluargasppheglyasnlysasnarggluaspiletyrlysser

355360365

trpvalvalalaalaseraspalametgluleuaspleuthrgluphe

370375380

phealaarghisglyileargvalaspasplysvallysgluaspleu

385390395400

alalystyrprolysproasplyslysiletyrtyrleuasnaspleu

405410415

alametasntyrlysglyaspglyphethrgluasnalalysvalser

420425430

valserthrserglyserasnglyasnilelysleuserpheserval

435440445

aspaspgluasnlysaspasnileleuglytyrgluileargargasp

450455460

glylystyrvalglyphethrserasnaspserphevalaspthrlys

465470475480

serasnleuaspgluaspglyvaltyrvalvalthrprotyrasparg

485490495

lysleuasnthrleuasnproilegluvalasn

500505

<210>29

<211>892

<212>prt

<213>artificialsequence

<220>

<223>polypeptidehavingo-glycoprotein-specificendoproteaseactivity

(includingn-terminalmethionineandac-terminallinker+his6

tag)

<400>29

metalathrglnglugluileleuaspalaalaleuvalserglyasp

151015

serserglnleuthraspserhisleuvalalaleuargleuglngln

202530

glnvalgluargileargglnthrargthrglnleuleuaspglyleu

354045

tyrglnasnleuserglnalatyraspproglyalaalasermettrp

505560

valleuproalaasnproaspasnthrleupropheleuileglyasp

65707580

lysglyargvalleualaserleuserleuglualaglyglyarggly

859095

leualatyrglythrasnvalleuthrglnleuserglythrasnala

100105110

alahisalaproleuleulysargalavalglntrpleuvalasngly

115120125

aspproglyalaalathralalysaspphelysvalservalvalgly

130135140

valasplysthralaalaleuasnglyleulysseralaglyleugln

145150155160

proalaaspalaalacysasnalaleuthraspalasercysalaser

165170175

thrserlysleuleuvalleuglyasnglyalaseralaalaserleu

180185190

seralathrvalargalaargleuglnalaglyleuproileleuphe

195200205

valhisthrasnglytrpasnglnserserthrglyglnglnileleu

210215220

alaglyleuglyleuglngluglyprotyrglyglyasntyrtrpasp

225230235240

lysaspargvalproserserargthrargthrargservalgluleu

245250255

glyglyalatyrglyglnaspproalaleuvalglnglnilevalasp

260265270

glysertrpargthrasptyrasptrpserlyscysthrsertyrval

275280285

glyargthrthrcysaspaspvalproglyleuserasppheserlys

290295300

argvalaspvalleulysglyalaleuaspalatyrasnglnlysala

305310315320

glnasnleuphealaleuproglythrthrserleuargleutrpleu

325330335

leutrpalaaspalavalargglnasnileargtyrprometasplys

340345350

alaalaaspthralaargpheglngluthrphevalalaaspalaile

355360365

valglytyrvalargglualaglyalaalaglnlysgluleuglyser

370375380

tyralaglyglnargglnglnsermetprovalserglysergluglu

385390395400

thrleuthrleuthrleuproseralaglnglyphethralailegly

405410415

argmetalaalaproglylysargleuserileargilegluaspala

420425430

glyglnalaserleualavalglyleuasnthrglnargileglyser

435440445

thrargleutrpasnthrargglntyraspargproargpheleulys

450455460

serproaspilelysleuglnalaasnglnservalalaleuvalser

465470475480

protyrglyglyleuleuglnleuvaltyrserglyalathrprogly

485490495

glnthrvalthrvallysvalthrglyalaalaserglnpropheleu

500505510

aspileglnproglygluaspserserglnalailealaasppheile

515520525

glnalaleuaspalaasplysalaasptrpleugluileargsergly

530535540

servalgluvalhisalalysvalglulysvalargglyserileasp

545550555560

lysasptyrglyglyaspvalglnargpheilearggluleuasnglu

565570575

valpheileaspaspalatyrthrleualaglyphealaileproasn

580585590

glnalalysthrproalaileglnglnglucysalaalaargglytrp

595600605

aspcysaspsergluthrleuhislysleuproglythrglnhisile

610615620

asnvalaspglntyralaglncysglyglyglycysserglyasnpro

625630635640

tyraspglnthrtrpglyleuasnproargglytrpglygluserhis

645650655

gluleuglyhisasnleuglnvalasnargleulysvaltyrglygly

660665670

argserglygluileserasnglnilepheproleuhislysasptrp

675680685

argvalleuargglupheglyglnasnleuaspaspthrargvalasn

690695700

tyrargasnalatyrasnleuilevalalaglyargalaglualaasp

705710715720

proleualaglyvaltyrlysargleutrpgluaspproglythrtyr

725730735

alaleuasnglygluargmetalaphetyrthrglntrpvalhistyr

740745750

trpalaaspleulysasnaspproleuglnglytrpaspiletrpthr

755760765

leuleutyrleuhisglnargglnvalasplysserasptrpaspala

770775780

asnlysalaalaleuglytyrglythrtyralaglnargproglyasn

785790795800

serglyaspalaserserthraspglyasnaspasnleuleuleugly

805810815

leusertrpleuthrglnargaspglnargprothrphealaleutrp

820825830

glyileargthrseralaalaalaglnalaglnvalalaalatyrgly

835840845

phealagluglnproalaphephetyralaasnasnargthrasnglu

850855860

tyrserthrvallysleuleuaspmetserglnglyserproalatrp

865870875880

propheproglyserglyhishishishishishis

885890

<210>30

<211>546

<212>prt

<213>artificialsequence

<220>

<223>polypeptidehavingo-glycoprotein-specificendoproteaseactivity

(includingn-terminalmethionineandac-terminallinker+his6

tag)

<400>30

metasplystrpglulysglupheargileargsertyrgluprotyr

151015

serasnilealaglutrpalaasplysleumetthrlyslystyrser

202530

aspleuaspasnprothrglyileservallysalaglyaspaspile

354045

ilevalleuvalglyaspthrtyrglyglnasnilesermetglncys

505560

iletrpgluthrglythrglutyrlysglnthralaserserglyasp

65707580

valtyrmetleuasnproglyvalasnlysleuthrmetlysglyglu

859095

glyglnleuphevalmettyrasnthrgluleuthrserasnthrala

100105110

lysproilelysilehisileproleuglyserglythrvalasngly

115120125

phepheaspleulysgluhislysthraspglulystyralagluleu

130135140

leulyslysserthrhislystyrphecysileargglyglulysile

145150155160

metphetyrphehisargasnlysleuleuglutyrvalproasnasn

165170175

ileleuseralailehisleutrpaspasnilevalglytrpglngln

180185190

gluleumetglyileaspaspvalargproserglnvalasnasnhis

195200205

leuphealaileserprogluglysertyrmettrpalaserasptyr

210215220

glnileglyphevaltyrthrtyrleuglyasnileleuleugluasp

225230235240

asnvalmetalaalagluaspasnalatrpglyproalahisgluile

245250255

glyhisvalhisglnalaalaileasntrpalaserserthrgluser

260265270

serasnasnleupheserasnpheileiletyrlysleuglylystyr

275280285

lysserargglyasnglyleuglyservalalathralaargtyrala

290295300

asnglyglnalatrptyrasnmetglyaspalathrhisglnasnglu

305310315320

aspthrgluthrhismetargmetasntrpglnleutrpiletyrtyr

325330335

hisargcysglutyrlysthraspphetrpglnthrleuphelysleu

340345350

metarggluvalasnmetthrgluglygluaspproglylyslysgln

355360365

leugluphealalysmetalaserlysalaalaasnglnasnleuthr

370375380

aspphepheglumettrpglyphephegluprovalasnthrthrile

385390395400

gluglntyrglythrtyrlystyrtyrvalseraspalametilearg

405410415

glualalysglutyrmetalaglnpheproalaprolyshisalaphe

420425430

glntyrilegluasparglyslysserglupheproserasnasptyr

435440445

argtyrseralavalglyaspvalglytyrtyrthrglnphelysglu

450455460

asnglnlysilethrlysalailethralagluleualaglyarglys

465470475480

valserileglnasnglyaspglualavalalaphegluleuargglu

485490495

asnaspgluasnglylysleuleutyrpheserthrphethrthrphe

500505510

gluileproserserileleumetvalasnalalysleutyralaval

515520525

glnalaaspglylysargileleuleuglyserglyhishishishis

530535540

hishis

545

<210>31

<211>517

<212>prt

<213>artificialsequence

<220>

<223>polypeptidehavingo-glycoprotein-specificendoproteaseactivity

(includingn-terminalmethionineandac-terminallinker+his6

tag)

<400>31

metvalleugluleuglumetargglyaspserileserglualalys

151015

lysarglysvaltrpasnpheglnasptrpglnilethrglyleuser

202530

alaargalaglyasplysilethrvaltyrvalaspvalalaglugly

354045

aspprothrprothrleuleutyrlysglnserleuthrglnhisgly

505560

glyalathrserpheglnleulysproglylysasngluilethrile

65707580

progluileasntyrgluserasnglyileprolysaspvalilegln

859095

glyglyaspleuphephethrasntyrlysseraspserglnlysarg

100105110

alaprolysvalargilegluglyalaserlystyrprovalpheile

115120125

leuglylysseraspgluasngluvalmetlysgluleuglualatyr

130135140

valglulysilelysalagluprolysthrthrproasnilepheala

145150155160

valserserasnlysserleugluphevalglnalathrtyralaleu

165170175

asptrptyrlyslysasnasnlysthrprolystyrthralaglugln

180185190

trpaspglntyrilealaaspalametglyphetrpglypheaspasn

195200205

serlysaspvalasnserasppheasnpheargilemetprometval

210215220

lysasnleuserglyglyalaphemetasnalaglyasnglyvalile

225230235240

glyileargproglyasnglnaspalaileleualaalaasnlysgly

245250255

trpglyvalalahisgluleuglyhisasnpheaspthrglyglyarg

260265270

thrilevalgluvalthrasnasnmetmetproleuphephegluser

275280285

lystyrlysthrlysthrargilethraspglnasniletrpgluasn

290295300

asnthrtyrprolysvalglyleuaspasptyrserasnasngluleu

305310315320

tyrasnlysalaaspserthrhisleualaglnleualaproleutrp

325330335

glnleutyrleutyraspasnthrphetyrglylysphegluarggln

340345350

phearggluargasppheglyasnlysasnarggluaspiletyrlys

355360365

sertrpvalvalalaalaseraspalametgluleuaspleuthrglu

370375380

phephealaarghisglyileargvalaspasplysvallysgluasp

385390395400

leualalystyrprolysproasplyslysiletyrtyrleuasnasp

405410415

leualametasntyrlysglyaspglyphethrgluasnalalysval

420425430

servalserthrserglyserasnglyasnilelysleuserpheser

435440445

valaspaspgluasnlysaspasnileleuglytyrgluileargarg

450455460

aspglylystyrvalglyphethrserasnaspserphevalaspthr

465470475480

lysserasnleuaspgluaspglyvaltyrvalvalthrprotyrasp

485490495

arglysleuasnthrleuasnproilegluvalasnglyserglyhis

500505510

hishishishishis

515

<210>32

<211>923

<212>prt

<213>pseudomonasaeruginosa

<400>32

metserleuserthrthralapheproserleuglnglygluasnmet

151015

serargserproileproarghisargalaleuleualaglyphecys

202530

leualaglyalaleuseralaglnalaalathrglnglugluileleu

354045

aspalaalaleuvalserglyaspserserglnleuthraspserhis

505560

leuvalalaleuargleuglnglnglnvalgluargileargglnthr

65707580

argthrglnleuleuaspglyleutyrglnasnleuserglnalatyr

859095

aspproglyalaalasermettrpvalleuproalaasnproaspasn

100105110

thrleupropheleuileglyasplysglyargvalleualaserleu

115120125

serleuglualaglyglyargglyleualatyrglythrasnvalleu

130135140

thrglnleuserglythrasnalaalahisalaproleuleulysarg

145150155160

alavalglntrpleuvalasnglyaspproglyalaalathralalys

165170175

aspphelysvalservalvalglyvalasplysthralaalaleuasn

180185190

glyleulysseralaglyleuglnproalaaspalaalacysasnala

195200205

leuthraspalasercysalaserthrserlysleuleuvalleugly

210215220

asnglyalaseralaalaserleuseralathrvalargalaargleu

225230235240

glnalaglyleuproileleuphevalhisthrasnglytrpasngln

245250255

serserthrglyglnglnileleualaglyleuglyleuglnglugly

260265270

protyrglyglyasntyrtrpasplysaspargvalproserserarg

275280285

thrargthrargservalgluleuglyglyalatyrglyglnasppro

290295300

alaleuvalglnglnilevalaspglysertrpargthrasptyrasp

305310315320

trpserlyscysthrsertyrvalglyargthrthrcysaspaspval

325330335

proglyleuserasppheserlysargvalaspvalleulysglyala

340345350

leuaspalatyrasnglnlysalaglnasnleuphealaleuprogly

355360365

thrthrserleuargleutrpleuleutrpalaaspalavalarggln

370375380

asnileargtyrprometasplysalaalaaspthralaargphegln

385390395400

gluthrphevalalaaspalailevalglytyrvalargglualagly

405410415

alaalaglnlysgluleuglysertyralaglyglnargglnglnser

420425430

metprovalserglyserglugluthrleuthrleuthrleuproser

435440445

alaglnglyphethralaileglyargmetalaalaproglylysarg

450455460

leuserileargilegluaspalaglyglnalaserleualavalgly

465470475480

leuasnthrglnargileglyserthrargleutrpasnthrarggln

485490495

tyraspargproargpheleulysserproaspilelysleuglnala

500505510

asnglnservalalaleuvalserprotyrglyglyleuleuglnleu

515520525

valtyrserglyalathrproglyglnthrvalthrvallysvalthr

530535540

glyalaalaserglnpropheleuaspileglnproglygluaspser

545550555560

serglnalailealaasppheileglnalaleuaspalaasplysala

565570575

asptrpleugluileargserglyservalgluvalhisalalysval

580585590

glulysvalargglyserileasplysasptyrglyglyaspvalgln

595600605

argpheilearggluleuasngluvalpheileaspaspalatyrthr

610615620

leualaglyphealaileproasnglnalalysthrproalailegln

625630635640

glnglucysalaalaargglytrpaspcysaspsergluthrleuhis

645650655

lysleuproglythrglnhisileasnvalaspglntyralaglncys

660665670

glyglyglycysserglyasnprotyraspglnthrtrpglyleuasn

675680685

proargglytrpglygluserhisgluleuglyhisasnleuglnval

690695700

asnargleulysvaltyrglyglyargserglygluileserasngln

705710715720

ilepheproleuhislysasptrpargvalleuargglupheglygln

725730735

asnleuaspaspthrargvalasntyrargasnalatyrasnleuile

740745750

valalaglyargalaglualaaspproleualaglyvaltyrlysarg

755760765

leutrpgluaspproglythrtyralaleuasnglygluargmetala

770775780

phetyrthrglntrpvalhistyrtrpalaaspleulysasnasppro

785790795800

leuglnglytrpaspiletrpthrleuleutyrleuhisglnarggln

805810815

valasplysserasptrpaspalaasnlysalaalaleuglytyrgly

820825830

thrtyralaglnargproglyasnserglyaspalaserserthrasp

835840845

glyasnaspasnleuleuleuglyleusertrpleuthrglnargasp

850855860

glnargprothrphealaleutrpglyileargthrseralaalaala

865870875880

glnalaglnvalalaalatyrglyphealagluglnproalaphephe

885890895

tyralaasnasnargthrasnglutyrserthrvallysleuleuasp

900905910

metserglnglyserproalatrpprophepro

915920

<210>33

<211>857

<212>prt

<213>bacteroidesthetaiotaomicron

<400>33

metthrilelysargpheilethrasnleuleualaleuphethrleu

151015

phethrvalserleualacyslysaspthrglulysserileileasn

202530

serserpheserilesergluglutyrleuileglnasnleuasplys

354045

serserthrservalglnileproileasnthrsermetgluleuala

505560

glntrpservalsertyrglualaasntrpleuglncysserlysgln

65707580

lysthralaalagluglythrpheleuargilethrvalasngluasn

859095

thrglygluthrlysargthralaasnilelysvalthrserthrthr

100105110

alathrtyrthrilethrvalasnglntyralalysglygluvalile

115120125

valgluglyaspilelysvalthrprothrglyglylysalaserglu

130135140

hisglngluglyglnaspilegluasnthrtyraspglylyspheser

145150155160

thraspglyalaalaprophehisthrprotrpglyglnseralalys

165170175

pheprovalthrleuglutyrtyrphelysglyaspthrgluileasp

180185190

tyrleuiletyrtyrthrargserglyasnglyasnpheglylysval

195200205

lysvaltyrthrthrthrasnproaspargserasptyrthrleugln

210215220

glyglutyraspphelysgluglnasnalaproserlysvalserphe

225230235240

sergluglyilelysalathrglyilelysphegluvalleusergly

245250255

leuglyaspphevalsercysaspglumetgluphetyrlysthrasn

260265270

thrasplysthrleuasplysglnleuleuthrvalphethraspile

275280285

thrcysthrgluilelysasnasnvalthrasngluglnileglnala

290295300

leuproasptyrphevalargilealaglualavalargaspasnthr

305310315320

tyrasplystrpglulysglupheargileargsertyrgluprotyr

325330335

serasnilealaglutrpalaasplysleumetthrlyslystyrser

340345350

aspleuaspasnprothrglyileservallysalaglyaspaspile

355360365

ilevalleuvalglyaspthrtyrglyglnasnilesermetglncys

370375380

iletrpgluthrglythrglutyrlysglnthralaserserglyasp

385390395400

valtyrmetleuasnproglyvalasnlysleuthrmetlysglyglu

405410415

glyglnleuphevalmettyrasnthrgluleuthrserasnthrala

420425430

lysproilelysilehisileproleuglyserglythrvalasngly

435440445

phepheaspleulysgluhislysthraspglulystyralagluleu

450455460

leulyslysserthrhislystyrphecysileargglyglulysile

465470475480

metphetyrphehisargasnlysleuleuglutyrvalproasnasn

485490495

ileleuseralailehisleutrpaspasnilevalglytrpglngln

500505510

gluleumetglyileaspaspvalargproserglnvalasnasnhis

515520525

leuphealaileserprogluglysertyrmettrpalaserasptyr

530535540

glnileglyphevaltyrthrtyrleuglyasnileleuleugluasp

545550555560

asnvalmetalaalagluaspasnalatrpglyproalahisgluile

565570575

glyhisvalhisglnalaalaileasntrpalaserserthrgluser

580585590

serasnasnleupheserasnpheileiletyrlysleuglylystyr

595600605

lysserargglyasnglyleuglyservalalathralaargtyrala

610615620

asnglyglnalatrptyrasnmetglyaspalathrhisglnasnglu

625630635640

aspthrgluthrhismetargmetasntrpglnleutrpiletyrtyr

645650655

hisargcysglutyrlysthraspphetrpglnthrleuphelysleu

660665670

metarggluvalasnmetthrgluglygluaspproglylyslysgln

675680685

leugluphealalysmetalaserlysalaalaasnglnasnleuthr

690695700

aspphepheglumettrpglyphephegluprovalasnthrthrile

705710715720

gluglntyrglythrtyrlystyrtyrvalseraspalametilearg

725730735

glualalysglutyrmetalaglnpheproalaprolyshisalaphe

740745750

glntyrilegluasparglyslysserglupheproserasnasptyr

755760765

argtyrseralavalglyaspvalglytyrtyrthrglnphelysglu

770775780

asnglnlysilethrlysalailethralagluleualaglyarglys

785790795800

valserileglnasnglyaspglualavalalaphegluleuargglu

805810815

asnaspgluasnglylysleuleutyrpheserthrphethrthrphe

820825830

gluileproserserileleumetvalasnalalysleutyralaval

835840845

glnalaaspglylysargileleuleu

850855

<210>34

<211>1687

<212>prt

<213>clostridiumperfringens

<400>34

metasnlysarglysilealaalaileileleualathrmetilethr

151015

asnleuseralathrthrileaspvalleualaglngluleuasnthr

202530

lysasnasnserlysvalgluvalserhisaspaspgluserhisgln

354045

alaargvalserlyspheaspleutyrasnserasplysleuaspala

505560

tyrasnglnglupheglnvalserargserasnilelysserileasn

65707580

asnasnglyglylystyrasnserserthrileasplysalaileasp

859095

glyasnleugluthrhistrpgluthrglylysproasnaspalaasn

100105110

phethrasngluvalvalvalthrpheasngluilethrasnileasp

115120125

argilevaltyrseralaargargaspseralaargglylysglyphe

130135140

alalysgluphegluiletyralaserleulysaspgluglyaspasp

145150155160

pheasnleuvalserserglyglutyrthrgluserthrargaspleu

165170175

valgluilelyspheasnprothraspphelysargleulysphelys

180185190

phelyslysalaaspglnasntrpalaseralaalagluphemetphe

195200205

tyrlysgluasplysleuasnglulyspheasnglyleuphethrasp

210215220

sersermetasnlysvalsergluglupheasnthrleuglulysleu

225230235240

asnalaphegluasngluleulysasphisproiletyraspleutyr

245250255

lysgluglyleuasnasnalaargalaileleuthrgluthrserglu

260265270

asnprothrlysalathrleuglyglnilethrtyrasnleuasnasp

275280285

asptyrasnasnglntyrargmetprotyrlysasnilelysalaile

290295300

lysasnasnglyarghistyralaalaglnasnileglulysalaile

305310315320

aspasnaspvalasnthrtyrtrpgluthrglythrleuasnserser

325330335

serpheasnasngluvalgluvalglupheasnaspleuvalthrleu

340345350

aspargilevaltyrglyserargglnseraspleulysglypheala

355360365

glugluvaltyriletyralaserargthrserlysglyaspthrtyr

370375380

lysleuvalalathrglyalahisglualathrlysglyleuvalglu

385390395400

alalysphegluprothrgluphelysargvallysphelysphelys

405410415

lysserlysglnasnseralathrleuasngluleumetphetyrlys

420425430

proaspgluvaltyrserserileprolysleuphethraspglythr

435440445

metsergluleusergluglupheasnserleuglulysileasnala

450455460

phelysglulysalalysasnhisproleutyrasnasppheasnglu

465470475480

thrilegluleualagluserleuileserasnproarglysgluasp

485490495

valleugluleuglumetargglyaspserileserglualalyslys

500505510

arglysvaltrpasnpheglnasptrpglnilethrglyleuserala

515520525

argalaglyasplysilethrvaltyrvalaspvalalagluglyasp

530535540

prothrprothrleuleutyrlysglnserleuthrglnhisglygly

545550555560

alathrserpheglnleulysproglylysasngluilethrilepro

565570575

gluileasntyrgluserasnglyileprolysaspvalileglngly

580585590

glyaspleuphephethrasntyrlysseraspserglnlysargala

595600605

prolysvalargilegluglyalaserlystyrprovalpheileleu

610615620

glylysseraspgluasngluvalmetlysgluleuglualatyrval

625630635640

glulysilelysalagluprolysthrthrproasnilephealaval

645650655

serserasnlysserleugluphevalglnalathrtyralaleuasp

660665670

trptyrlyslysasnasnlysthrprolystyrthralagluglntrp

675680685

aspglntyrilealaaspalametglyphetrpglypheaspasnser

690695700

lysaspvalasnserasppheasnpheargilemetprometvallys

705710715720

asnleuserglyglyalaphemetasnalaglyasnglyvalilegly

725730735

ileargproglyasnglnaspalaileleualaalaasnlysglytrp

740745750

glyvalalahisgluleuglyhisasnpheaspthrglyglyargthr

755760765

ilevalgluvalthrasnasnmetmetproleuphephegluserlys

770775780

tyrlysthrlysthrargilethraspglnasniletrpgluasnasn

785790795800

thrtyrprolysvalglyleuaspasptyrserasnasngluleutyr

805810815

asnlysalaaspserthrhisleualaglnleualaproleutrpgln

820825830

leutyrleutyraspasnthrphetyrglylysphegluargglnphe

835840845

arggluargasppheglyasnlysasnarggluaspiletyrlysser

850855860

trpvalvalalaalaseraspalametgluleuaspleuthrgluphe

865870875880

phealaarghisglyileargvalaspasplysvallysgluaspleu

885890895

alalystyrprolysproasplyslysiletyrtyrleuasnaspleu

900905910

alametasntyrlysglyaspglyphethrgluasnalalysvalser

915920925

valserthrserglyserasnglyasnilelysleuserpheserval

930935940

aspaspgluasnlysaspasnileleuglytyrgluileargargasp

945950955960

glylystyrvalglyphethrserasnaspserphevalaspthrlys

965970975

serasnleuaspgluaspglyvaltyrvalvalthrprotyrasparg

980985990

lysleuasnthrleuasnproilegluvalasnalaleuglnprothr

99510001005

leuservalasnprovalilethrleualaleuglyglugluphe

101010151020

asnglugluglutyrilevalalalysaspilelysglyasnser

102510301035

leusergluservallysvallysserserasnvalasnthrser

104010451050

lysvalglyglutyrgluvalleutyrserleugluaspserlys

105510601065

glyasnglutyrthrlysthrserlysvalasnvalvalserarg

107010751080

lysglutyrmetseraspleuthrprolysglnserserasngly

108510901095

trpglythrvalarglysasplysserileserglyglyvalile

110011051110

glyleuthrargaspglyaspphevalasptyrasnlysglyleu

111511201125

glyleuhisserasnalaglutyrvaltyraspleugluglylys

113011351140

asptyrasptyrpheglusertyrvalglyvalasplysalamet

114511501155

serserargproalaserservalilephelysvalleuvalasp

116011651170

glygluglulyspheasnserglyvalmetargserthrthrpro

117511801185

glnlystyrvallysvalaspvallysasnalalysgluleulys

119011951200

leuilevalasnaspalaglyaspglyaspserserasphisala

120512101215

serpheglyaspalalysleualathrleuserserlysproile

122012251230

ilelysglygluasnleualatyrsermetaspglulysvalasp

123512401245

leumetlysglyilethralathraspilegluaspglyasnile

125012551260

thrserlysvalglnilelysserseraspphevalgluglylys

126512701275

serglyilephethrvalvaltyrservalthraspseraspgly

128012851290

leuthrserglucysserargthrilealavalthrasplysglu

129513001305

thrglnleuseraspleuasntrplysseralathrileglyser

131013151320

glyservalarglysaspargalavalserglyasnglnilearg

132513301335

leuleuasngluaspasnservalgluthrphealalysglyile

134013451350

glythrhissertyrsergluilevaltyrasnsergluglytyr

135513601365

aspilepheaspthrtrpvalglyileasparghisvalalaasp

137013751380

lyslysvalserservallysphelysvaltyrvalaspglyglu

138513901395

leulysalagluthraspvalmetargileaspthrprolyslys

140014051410

argleuvalvalaspvalargasnserlysgluilelysleuval

141514201425

valaspvalalaaspasnglyasnasntrpasphisalaasptrp

143014351440

alaaspalalyspheargasnleualaglutyraspalaserglu

144514501455

leuasnlysalailegluglualalyslysleuaspleuasnasn

146014651470

tyrthrglugluserserglualaleulysasnalaileserlys

147514801485

glygluglualaleuleuserlysasplysgluthrileasnser

149014951500

alaleuglugluleuasnlysglumetasnserleuvallysval

150515101515

aspleuasnalavalileasnileproasplystyrleuleulys

152015251530

serileglnasnglnleuasnlysthrglyaspilethrleugly

153515401545

aspmettyrserleuthrthrleuthrleuserglyvalgluasp

155015551560

leuthrglyleugluasnalalysasnleugluthrleuasnmet

156515701575

asptyrasngluvallysaspleuargproleuserlysleulys

158015851590

lysleuasnthrleuasnalaglngluglnpheilealaalagly

159516001605

gluleulysproserasnglylysvalileglyaspserlysval

161016151620

tyrasnarggluglylysasnvalalalysthrileargvalval

162516301635

asplysasnglyasnthrileleugluglnaspalalysaspglu

164016451650

phethrileasnthrlysaspleuserserglyleutyrglyval

165516601665

hisvalleuphegluaspgluglypheserglyvalmetphetyr

167016751680

leupheasnval

1685

<210>35

<211>882

<212>prt

<213>artificialsequence

<220>

<223>polypeptidecapableofbindingtoo-glycansbutlackorhas

reducedo-glycoprotein-specificendoproteaseactivity-

pseudomonasaeruginosapao1(doublemutantwithremovedsignal

sequence)

<400>35

alathrglnglugluileleuaspalaalaleuvalserglyaspser

151015

serglnleuthraspserhisleuvalalaleuargleuglnglngln

202530

valgluargileargglnthrargthrglnleuleuaspglyleutyr

354045

glnasnleuserglnalatyraspproglyalaalasermettrpval

505560

leuproalaasnproaspasnthrleupropheleuileglyasplys

65707580

glyargvalleualaserleuserleuglualaglyglyargglyleu

859095

alatyrglythrasnvalleuthrglnleuserglythrasnalaala

100105110

hisalaproleuleulysargalavalglntrpleuvalasnglyasp

115120125

proglyalaalathralalysaspphelysvalservalvalglyval

130135140

asplysthralaalaleuasnglyleulysseralaglyleuglnpro

145150155160

alaaspalaalacysasnalaleuthraspalasercysalaserthr

165170175

serlysleuleuvalleuglyasnglyalaseralaalaserleuser

180185190

alathrvalargalaargleuglnalaglyleuproileleupheval

195200205

histhrasnglytrpasnglnserserthrglyglnglnileleuala

210215220

glyleuglyleuglngluglyprotyrglyglyasntyrtrpasplys

225230235240

aspargvalproserserargthrargthrargservalgluleugly

245250255

glyalatyrglyglnaspproalaleuvalglnglnilevalaspgly

260265270

sertrpargthrasptyrasptrpserlyscysthrsertyrvalgly

275280285

argthrthrcysaspaspvalproglyleuserasppheserlysarg

290295300

valaspvalleulysglyalaleuaspalatyrasnglnlysalagln

305310315320

asnleuphealaleuproglythrthrserleuargleutrpleuleu

325330335

trpalaaspalavalargglnasnileargtyrprometasplysala

340345350

alaaspthralaargpheglngluthrphevalalaaspalaileval

355360365

glytyrvalargglualaglyalaalaglnlysgluleuglysertyr

370375380

alaglyglnargglnglnsermetprovalserglyserglugluthr

385390395400

leuthrleuthrleuproseralaglnglyphethralaileglyarg

405410415

metalaalaproglylysargleuserileargilegluaspalagly

420425430

glnalaserleualavalglyleuasnthrglnargileglyserthr

435440445

argleutrpasnthrargglntyraspargproargpheleulysser

450455460

proaspilelysleuglnalaasnglnservalalaleuvalserpro

465470475480

tyrglyglyleuleuglnleuvaltyrserglyalathrproglygln

485490495

thrvalthrvallysvalthrglyalaalaserglnpropheleuasp

500505510

ileglnproglygluaspserserglnalailealaasppheilegln

515520525

alaleuaspalaasplysalaasptrpleugluileargserglyser

530535540

valgluvalhisalalysvalglulysvalargglyserileasplys

545550555560

asptyrglyglyaspvalglnargpheilearggluleuasngluval

565570575

pheileaspaspalatyrthrleualaglyphealaileproasngln

580585590

alalysthrproalaileglnglnglucysalaalaargglytrpasp

595600605

cysaspsergluthrleuhislysleuproglythrglnhisileasn

610615620

valaspglntyralaglncysglyglyglycysserglyasnprotyr

625630635640

aspglnthrtrpglyleuasnproargglytrpglygluseralaala

645650655

leuglyhisasnleuglnvalasnargleulysvaltyrglyglyarg

660665670

serglygluileserasnglnilepheproleuhislysasptrparg

675680685

valleuargglupheglyglnasnleuaspaspthrargvalasntyr

690695700

argasnalatyrasnleuilevalalaglyargalaglualaasppro

705710715720

leualaglyvaltyrlysargleutrpgluaspproglythrtyrala

725730735

leuasnglygluargmetalaphetyrthrglntrpvalhistyrtrp

740745750

alaaspleulysasnaspproleuglnglytrpaspiletrpthrleu

755760765

leutyrleuhisglnargglnvalasplysserasptrpaspalaasn

770775780

lysalaalaleuglytyrglythrtyralaglnargproglyasnser

785790795800

glyaspalaserserthraspglyasnaspasnleuleuleuglyleu

805810815

sertrpleuthrglnargaspglnargprothrphealaleutrpgly

820825830

ileargthrseralaalaalaglnalaglnvalalaalatyrglyphe

835840845

alagluglnproalaphephetyralaasnasnargthrasnglutyr

850855860

serthrvallysleuleuaspmetserglnglyserproalatrppro

865870875880

phepro

<210>36

<211>536

<212>prt

<213>artificialsequence

<220>

<223>polypeptidecapableofbindingtoo-glycansbutlackorhas

reducedo-glycoprotein-specificendoproteaseactivity-

bacteroidesthetaiotaomicronvpi-5482(doublemutantwithremoved

signalandotherimmaturesequences)

<400>36

asplystrpglulysglupheargileargsertyrgluprotyrser

151015

asnilealaglutrpalaasplysleumetthrlyslystyrserasp

202530

leuaspasnprothrglyileservallysalaglyaspaspileile

354045

valleuvalglyaspthrtyrglyglnasnilesermetglncysile

505560

trpgluthrglythrglutyrlysglnthralaserserglyaspval

65707580

tyrmetleuasnproglyvalasnlysleuthrmetlysglyglugly

859095

glnleuphevalmettyrasnthrgluleuthrserasnthralalys

100105110

proilelysilehisileproleuglyserglythrvalasnglyphe

115120125

pheaspleulysgluhislysthraspglulystyralagluleuleu

130135140

lyslysserthrhislystyrphecysileargglyglulysilemet

145150155160

phetyrphehisargasnlysleuleuglutyrvalproasnasnile

165170175

leuseralailehisleutrpaspasnilevalglytrpglnglnglu

180185190

leumetglyileaspaspvalargproserglnvalasnasnhisleu

195200205

phealaileserprogluglysertyrmettrpalaserasptyrgln

210215220

ileglyphevaltyrthrtyrleuglyasnileleuleugluaspasn

225230235240

valmetalaalagluaspasnalatrpglyproalaalaalailegly

245250255

hisvalhisglnalaalaileasntrpalaserserthrgluserser

260265270

asnasnleupheserasnpheileiletyrlysleuglylystyrlys

275280285

serargglyasnglyleuglyservalalathralaargtyralaasn

290295300

glyglnalatrptyrasnmetglyaspalathrhisglnasngluasp

305310315320

thrgluthrhismetargmetasntrpglnleutrpiletyrtyrhis

325330335

argcysglutyrlysthraspphetrpglnthrleuphelysleumet

340345350

arggluvalasnmetthrgluglygluaspproglylyslysglnleu

355360365

gluphealalysmetalaserlysalaalaasnglnasnleuthrasp

370375380

phepheglumettrpglyphephegluprovalasnthrthrileglu

385390395400

glntyrglythrtyrlystyrtyrvalseraspalametileargglu

405410415

alalysglutyrmetalaglnpheproalaprolyshisalaphegln

420425430

tyrilegluasparglyslysserglupheproserasnasptyrarg

435440445

tyrseralavalglyaspvalglytyrtyrthrglnphelysgluasn

450455460

glnlysilethrlysalailethralagluleualaglyarglysval

465470475480

serileglnasnglyaspglualavalalaphegluleuarggluasn

485490495

aspgluasnglylysleuleutyrpheserthrphethrthrpheglu

500505510

ileproserserileleumetvalasnalalysleutyralavalgln

515520525

alaaspglylysargileleuleu

530535

<210>37

<211>507

<212>prt

<213>artificialsequence

<220>

<223>polypeptidecapableofbindingtoo-glycansbutlackorhas

reducedo-glycoprotein-specificendoproteaseactivity-

clostridiumperfringens(doublemutantwithremovedsignaland

otherimmaturesequences)

<400>37

valleugluleuglumetargglyaspserileserglualalyslys

151015

arglysvaltrpasnpheglnasptrpglnilethrglyleuserala

202530

argalaglyasplysilethrvaltyrvalaspvalalagluglyasp

354045

prothrprothrleuleutyrlysglnserleuthrglnhisglygly

505560

alathrserpheglnleulysproglylysasngluilethrilepro

65707580

gluileasntyrgluserasnglyileprolysaspvalileglngly

859095

glyaspleuphephethrasntyrlysseraspserglnlysargala

100105110

prolysvalargilegluglyalaserlystyrprovalpheileleu

115120125

glylysseraspgluasngluvalmetlysgluleuglualatyrval

130135140

glulysilelysalagluprolysthrthrproasnilephealaval

145150155160

serserasnlysserleugluphevalglnalathrtyralaleuasp

165170175

trptyrlyslysasnasnlysthrprolystyrthralagluglntrp

180185190

aspglntyrilealaaspalametglyphetrpglypheaspasnser

195200205

lysaspvalasnserasppheasnpheargilemetprometvallys

210215220

asnleuserglyglyalaphemetasnalaglyasnglyvalilegly

225230235240

ileargproglyasnglnaspalaileleualaalaasnlysglytrp

245250255

glyvalalaalaalaleuglyhisasnpheaspthrglyglyargthr

260265270

ilevalgluvalthrasnasnmetmetproleuphephegluserlys

275280285

tyrlysthrlysthrargilethraspglnasniletrpgluasnasn

290295300

thrtyrprolysvalglyleuaspasptyrserasnasngluleutyr

305310315320

asnlysalaaspserthrhisleualaglnleualaproleutrpgln

325330335

leutyrleutyraspasnthrphetyrglylysphegluargglnphe

340345350

arggluargasppheglyasnlysasnarggluaspiletyrlysser

355360365

trpvalvalalaalaseraspalametgluleuaspleuthrgluphe

370375380

phealaarghisglyileargvalaspasplysvallysgluaspleu

385390395400

alalystyrprolysproasplyslysiletyrtyrleuasnaspleu

405410415

alametasntyrlysglyaspglyphethrgluasnalalysvalser

420425430

valserthrserglyserasnglyasnilelysleuserpheserval

435440445

aspaspgluasnlysaspasnileleuglytyrgluileargargasp

450455460

glylystyrvalglyphethrserasnaspserphevalaspthrlys

465470475480

serasnleuaspgluaspglyvaltyrvalvalthrprotyrasparg

485490495

lysleuasnthrleuasnproilegluvalasn

500505

<210>38

<211>892

<212>prt

<213>artificialsequence

<220>

<223>polypeptidecapableofbindingtoo-glycansbutlackorhas

reducedo-glycoprotein-specificendoproteaseactivity-

pseudomonasaeruginosapao1(doublemutantwithremovedsignal

sequence,withn-termmet,c-termlinker/tag)

<400>38

metalathrglnglugluileleuaspalaalaleuvalserglyasp

151015

serserglnleuthraspserhisleuvalalaleuargleuglngln

202530

glnvalgluargileargglnthrargthrglnleuleuaspglyleu

354045

tyrglnasnleuserglnalatyraspproglyalaalasermettrp

505560

valleuproalaasnproaspasnthrleupropheleuileglyasp

65707580

lysglyargvalleualaserleuserleuglualaglyglyarggly

859095

leualatyrglythrasnvalleuthrglnleuserglythrasnala

100105110

alahisalaproleuleulysargalavalglntrpleuvalasngly

115120125

aspproglyalaalathralalysaspphelysvalservalvalgly

130135140

valasplysthralaalaleuasnglyleulysseralaglyleugln

145150155160

proalaaspalaalacysasnalaleuthraspalasercysalaser

165170175

thrserlysleuleuvalleuglyasnglyalaseralaalaserleu

180185190

seralathrvalargalaargleuglnalaglyleuproileleuphe

195200205

valhisthrasnglytrpasnglnserserthrglyglnglnileleu

210215220

alaglyleuglyleuglngluglyprotyrglyglyasntyrtrpasp

225230235240

lysaspargvalproserserargthrargthrargservalgluleu

245250255

glyglyalatyrglyglnaspproalaleuvalglnglnilevalasp

260265270

glysertrpargthrasptyrasptrpserlyscysthrsertyrval

275280285

glyargthrthrcysaspaspvalproglyleuserasppheserlys

290295300

argvalaspvalleulysglyalaleuaspalatyrasnglnlysala

305310315320

glnasnleuphealaleuproglythrthrserleuargleutrpleu

325330335

leutrpalaaspalavalargglnasnileargtyrprometasplys

340345350

alaalaaspthralaargpheglngluthrphevalalaaspalaile

355360365

valglytyrvalargglualaglyalaalaglnlysgluleuglyser

370375380

tyralaglyglnargglnglnsermetprovalserglysergluglu

385390395400

thrleuthrleuthrleuproseralaglnglyphethralailegly

405410415

argmetalaalaproglylysargleuserileargilegluaspala

420425430

glyglnalaserleualavalglyleuasnthrglnargileglyser

435440445

thrargleutrpasnthrargglntyraspargproargpheleulys

450455460

serproaspilelysleuglnalaasnglnservalalaleuvalser

465470475480

protyrglyglyleuleuglnleuvaltyrserglyalathrprogly

485490495

glnthrvalthrvallysvalthrglyalaalaserglnpropheleu

500505510

aspileglnproglygluaspserserglnalailealaasppheile

515520525

glnalaleuaspalaasplysalaasptrpleugluileargsergly

530535540

servalgluvalhisalalysvalglulysvalargglyserileasp

545550555560

lysasptyrglyglyaspvalglnargpheilearggluleuasnglu

565570575

valpheileaspaspalatyrthrleualaglyphealaileproasn

580585590

glnalalysthrproalaileglnglnglucysalaalaargglytrp

595600605

aspcysaspsergluthrleuhislysleuproglythrglnhisile

610615620

asnvalaspglntyralaglncysglyglyglycysserglyasnpro

625630635640

tyraspglnthrtrpglyleuasnproargglytrpglygluserala

645650655

alaleuglyhisasnleuglnvalasnargleulysvaltyrglygly

660665670

argserglygluileserasnglnilepheproleuhislysasptrp

675680685

argvalleuargglupheglyglnasnleuaspaspthrargvalasn

690695700

tyrargasnalatyrasnleuilevalalaglyargalaglualaasp

705710715720

proleualaglyvaltyrlysargleutrpgluaspproglythrtyr

725730735

alaleuasnglygluargmetalaphetyrthrglntrpvalhistyr

740745750

trpalaaspleulysasnaspproleuglnglytrpaspiletrpthr

755760765

leuleutyrleuhisglnargglnvalasplysserasptrpaspala

770775780

asnlysalaalaleuglytyrglythrtyralaglnargproglyasn

785790795800

serglyaspalaserserthraspglyasnaspasnleuleuleugly

805810815

leusertrpleuthrglnargaspglnargprothrphealaleutrp

820825830

glyileargthrseralaalaalaglnalaglnvalalaalatyrgly

835840845

phealagluglnproalaphephetyralaasnasnargthrasnglu

850855860

tyrserthrvallysleuleuaspmetserglnglyserproalatrp

865870875880

propheproglyserglyhishishishishishis

885890

<210>39

<211>546

<212>prt

<213>artificialsequence

<220>

<223>polypeptidecapableofbindingtoo-glycansbutlackorhas

reducedo-glycoprotein-specificendoproteaseactivity-

bacteroidesthetaiotaomicronvpi-5482(doublemutantwithremoved

signalandothersequencesfromimmatureprotein,withn-term

<400>39

metasplystrpglulysglupheargileargsertyrgluprotyr

151015

serasnilealaglutrpalaasplysleumetthrlyslystyrser

202530

aspleuaspasnprothrglyileservallysalaglyaspaspile

354045

ilevalleuvalglyaspthrtyrglyglnasnilesermetglncys

505560

iletrpgluthrglythrglutyrlysglnthralaserserglyasp

65707580

valtyrmetleuasnproglyvalasnlysleuthrmetlysglyglu

859095

glyglnleuphevalmettyrasnthrgluleuthrserasnthrala

100105110

lysproilelysilehisileproleuglyserglythrvalasngly

115120125

phepheaspleulysgluhislysthraspglulystyralagluleu

130135140

leulyslysserthrhislystyrphecysileargglyglulysile

145150155160

metphetyrphehisargasnlysleuleuglutyrvalproasnasn

165170175

ileleuseralailehisleutrpaspasnilevalglytrpglngln

180185190

gluleumetglyileaspaspvalargproserglnvalasnasnhis

195200205

leuphealaileserprogluglysertyrmettrpalaserasptyr

210215220

glnileglyphevaltyrthrtyrleuglyasnileleuleugluasp

225230235240

asnvalmetalaalagluaspasnalatrpglyproalaalaalaile

245250255

glyhisvalhisglnalaalaileasntrpalaserserthrgluser

260265270

serasnasnleupheserasnpheileiletyrlysleuglylystyr

275280285

lysserargglyasnglyleuglyservalalathralaargtyrala

290295300

asnglyglnalatrptyrasnmetglyaspalathrhisglnasnglu

305310315320

aspthrgluthrhismetargmetasntrpglnleutrpiletyrtyr

325330335

hisargcysglutyrlysthraspphetrpglnthrleuphelysleu

340345350

metarggluvalasnmetthrgluglygluaspproglylyslysgln

355360365

leugluphealalysmetalaserlysalaalaasnglnasnleuthr

370375380

aspphepheglumettrpglyphephegluprovalasnthrthrile

385390395400

gluglntyrglythrtyrlystyrtyrvalseraspalametilearg

405410415

glualalysglutyrmetalaglnpheproalaprolyshisalaphe

420425430

glntyrilegluasparglyslysserglupheproserasnasptyr

435440445

argtyrseralavalglyaspvalglytyrtyrthrglnphelysglu

450455460

asnglnlysilethrlysalailethralagluleualaglyarglys

465470475480

valserileglnasnglyaspglualavalalaphegluleuargglu

485490495

asnaspgluasnglylysleuleutyrpheserthrphethrthrphe

500505510

gluileproserserileleumetvalasnalalysleutyralaval

515520525

glnalaaspglylysargileleuleuglyserglyhishishishis

530535540

hishis

545

<210>40

<211>517

<212>prt

<213>artificialsequence

<220>

<223>polypeptidecapableofbindingtoo-glycansbutlackorhas

reducedo-glycoprotein-specificendoproteaseactivity-

clostridiumperfringens(doublemutantwithremovedsignaland

othersequencesfromimmatureprotein,withn-termmet,c-term

<400>40

metvalleugluleuglumetargglyaspserileserglualalys

151015

lysarglysvaltrpasnpheglnasptrpglnilethrglyleuser

202530

alaargalaglyasplysilethrvaltyrvalaspvalalaglugly

354045

aspprothrprothrleuleutyrlysglnserleuthrglnhisgly

505560

glyalathrserpheglnleulysproglylysasngluilethrile

65707580

progluileasntyrgluserasnglyileprolysaspvalilegln

859095

glyglyaspleuphephethrasntyrlysseraspserglnlysarg

100105110

alaprolysvalargilegluglyalaserlystyrprovalpheile

115120125

leuglylysseraspgluasngluvalmetlysgluleuglualatyr

130135140

valglulysilelysalagluprolysthrthrproasnilepheala

145150155160

valserserasnlysserleugluphevalglnalathrtyralaleu

165170175

asptrptyrlyslysasnasnlysthrprolystyrthralaglugln

180185190

trpaspglntyrilealaaspalametglyphetrpglypheaspasn

195200205

serlysaspvalasnserasppheasnpheargilemetprometval

210215220

lysasnleuserglyglyalaphemetasnalaglyasnglyvalile

225230235240

glyileargproglyasnglnaspalaileleualaalaasnlysgly

245250255

trpglyvalalaalaalaleuglyhisasnpheaspthrglyglyarg

260265270

thrilevalgluvalthrasnasnmetmetproleuphephegluser

275280285

lystyrlysthrlysthrargilethraspglnasniletrpgluasn

290295300

asnthrtyrprolysvalglyleuaspasptyrserasnasngluleu

305310315320

tyrasnlysalaaspserthrhisleualaglnleualaproleutrp

325330335

glnleutyrleutyraspasnthrphetyrglylysphegluarggln

340345350

phearggluargasppheglyasnlysasnarggluaspiletyrlys

355360365

sertrpvalvalalaalaseraspalametgluleuaspleuthrglu

370375380

phephealaarghisglyileargvalaspasplysvallysgluasp

385390395400

leualalystyrprolysproasplyslysiletyrtyrleuasnasp

405410415

leualametasntyrlysglyaspglyphethrgluasnalalysval

420425430

servalserthrserglyserasnglyasnilelysleuserpheser

435440445

valaspaspgluasnlysaspasnileleuglytyrgluileargarg

450455460

aspglylystyrvalglyphethrserasnaspserphevalaspthr

465470475480

lysserasnleuaspgluaspglyvaltyrvalvalthrprotyrasp

485490495

arglysleuasnthrleuasnproilegluvalasnglyserglyhis

500505510

hishishishishis

515

<210>41

<211>5

<212>prt

<213>artificialsequence

<220>

<223>metalloproteasemotif

<400>41

hisgluleuglyhis

15

<210>42

<211>5

<212>prt

<213>artificialsequence

<220>

<223>metalloproteasemotif

<400>42

hisgluileglyhis

15

<210>43

<211>10

<212>prt

<213>artificialsequence

<220>

<223>metalloproteasemotif

<400>43

glyvalalahisgluleuglyhisasnphe

1510

<210>44

<211>5

<212>prt

<213>artificialsequence

<220>

<223>disruptedmetalloproteasemotif

<400>44

hisalaleuglyhis

15

<210>45

<211>5

<212>prt

<213>artificialsequence

<220>

<223>disruptedmetalloproteasemotif

<400>45

alagluleuglyhis

15

<210>46

<211>5

<212>prt

<213>artificialsequence

<220>

<223>disruptedmetalloproteasemotif

<400>46

alaalaleuglyhis

15

<210>47

<211>19

<212>prt

<213>artificialsequence

<220>

<223>glycodrosocinpeptidewitho-glysiteonthet

<400>47

glylysproargprotyrserproargprothrserhisproargpro

151015

ileargval

<210>48

<211>7

<212>prt

<213>artificialsequence

<220>

<223>non-o-glycosylatedpeptide

<400>48

tyriletyrglyserphelys

15

<210>49

<211>7

<212>prt

<213>artificialsequence

<220>

<223>non-o-glycosylatedpeptide

<400>49

lyslysleuvalphepheala

15

<210>50

<211>14

<212>prt

<213>artificialsequence

<220>

<223>non-o-glycosylatedpeptide

<400>50

pheleuproleuileleuglylysleuvallysglyleuleu

1510

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1