奈瑟球菌蛋白质的异源表达的制作方法

文档序号:1183598阅读:6577来源:国知局
专利名称:奈瑟球菌蛋白质的异源表达的制作方法
技术领域
本发明涉及蛋白质表达的领域。具体说,本发明涉及奈瑟球菌(如淋病奈瑟球菌 或较佳地为脑膜炎奈瑟球菌)的蛋白质的异源表达。
背景技术
国际专利申请 WO 99/24578、W099/36544、W099/57280 和 WO 00/22430 公开了脑膜 炎奈瑟球菌(Neisseria meningitidis)禾口淋病奈瑟球菌(Neisseriagonorrhoeae)的蛋白 质。这些蛋白质一般是以N-未端GST-融合体或C-未端His-标记融合体在大肠杆菌中表 达的(即异源表达),虽然也公开了其它表达系统(包括在天然的奈瑟球菌中的表达)。本发明的目的是提供这些蛋白质的异源表达的其它或改进方法。这些方法通常影 响表达的水平、纯化的简易程度、表达在细胞内定位和/或表达的蛋白质的免疫学特性。

发明内容
本文的命名本文参考在WO 99/24578、WO 99/36544和WO 99/57280中公开的2166个蛋白质 序列,并将它们编号为如下的SEQ# 除了这种的 SEQ#编号外,本文还使用了 WO 99/24578,WO 99/36544 和 W099/27280 中的命名约定(如 W099/24578 和 WO 99/36544 中用的 ‘0RF4,、‘0RF40,、‘0FR40-1,等;WO 99/57280 中用的 ‘m919,、‘g919,和 ‘a919,等)。在本文中将Tettelin 等[Science (2000) 287 1809-1815]中的从 ΝΜΒ0001 到 NMB2160 的 2160 个蛋白质称为 SEQ#2167_4326 [参见 WO 00/66791]。
本文采用的术语“本发明的蛋白质”指包含以下的蛋白质(a) SEQ#l-4326 中的一个序列;或(b)与SEQ#1_4326中的一个序列相同的序列;或(c)SEQ#l-4326中的一个序列的片段。(b)中的“序列相同性”的程度最好大于50% (如60%、70%、80%、90%、95%、 99%或更大)。其包括突变体和等位基因变体[如,参见WO 00/66741]。相同性宜用 Smith-Waterman同源性搜寻算法确定,如在MPSRCH程序(OxfordMolecular)中执行的,采 用参数“缺口罚分(gap open penalty) ”为 12,“缺口延伸罚分(gap extension penalty)” 为1进行缺口仿射搜索。通常,将两种蛋白质之间50%或更高的相同性视为功能等效的指示。(c)中的“片段”应包含SEQ#1_4326中一个序列的至少η个连续的氨基酸,且根据 具体的序列 η 为 7 或更高(如 8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100 或 更高)。较佳地,片段包含SEQ#l-4326中一个序列的表位。优选的片段是在WO 00/71574 和TO 01/04316中公开的那些。本发明优选的蛋白质是在脑膜炎奈瑟球菌血清群B中发现的。根据本发明使用的优选蛋白质是血清群B脑膜炎奈瑟球菌菌株2996或菌株 394/98 (新西兰菌株)。除非特别指出,本文所述的蛋白质是脑膜炎奈瑟球菌菌株2996的蛋 白质。但是,应该理解通常本发明并不受菌株的限制。参考具体的蛋白质(如‘287’、‘919’ 等)可以包括任何菌株的该蛋白质。非融合表达在异源表达的第一步骤中,没有使用融合配体,而是使用了天然前导肽(如果存 在)。这通常防止了来自融合配体的任何“干扰”,并可能改变异源宿主中的细胞定位和/或 翻译后的修饰和/或折叠。因此,本发明提供了一种异源表达本发明蛋白质的方法,在该方法中(a)没有使 用融合配体,并(b)使用了蛋白质的天然前导肽(如果存在)。该方法通常包括制备表达本发明蛋白质的载体的步骤,这样第一个表达的氨基酸 是该蛋白质的第一个氨基酸(甲硫氨酸),且最后一个表达的氨基酸是该蛋白质的最后一 个氨基酸(即,在天然STOP密码子前的密码子)。最好将该方法用于表达使用天然前导肽的如下蛋白质111、149、206、225_1、235、 247-1、274、283、286、292、401、406、502-1、503、519-1、525-1、552、556、557、570、576-1、 580、583、664、759、907、913、920-l、936-l、953、961、983、989、0rf4、0rf7-l、0rf9-l、0rf23、 0rf25、0rf37、Orf38, Orf40, 0rf40. 1、0rf40. 2、Orf72-1, Orf76-1, Orf85-2, Orf9 U 0rf97-l、Orfl 19、Orf 143. 1、NMBO109和NMB2050。本文蛋白质命名中所用的后缀“L”指用 天然前导肽按这种方式的表达。最好用该方法(不使用融合配体,且不含天然前导肽)表达的蛋白质包括008、 105、117-1、121-1、122-1、128-1、148、216、243、308、593、652、726、926、982、 0rf83-l 和 0rfl43-l。有利地,用这种方法来表达0RF25或0RF40,形成的蛋白质诱导的抗细菌抗体比 GST-或His融合体诱导得更好。
这种方法特别适用于表达脂蛋白。前导肽的替代在异源表达的第二步骤中,用不同蛋白质的天然前导肽替代本发明蛋白质的天然 前导肽。另外,最好不使用融合配体。在异源宿主中使用蛋白质自身的前导肽通常会将蛋 白质定位于其‘天然’细胞位置,有时异源宿主不能有效地识别该前导序列。在这种情况下, 则可改为使用已知能有效地驱动蛋白质靶向的前导肽。因此,本发明提供了一种异源表达本发明蛋白质的方法,其中(a)用不同蛋白质 的前导肽替代该蛋白质的前导肽,和任选地(b)不使用融合配体。该方法通常包括如下步骤获得编码本发明蛋白质的核酸;操作该核酸以除去编 码所述蛋白质前导肽的核苷酸,并引入编码不同蛋白质的前导肽的核苷酸。可以将得到的 核酸插入表达载体中,或作为表达载体的一部分。表达的蛋白质包含N-未端的替代前导 肽,其后为本发明减去前导肽的蛋白质。前导肽最好为本发明另一蛋白质(如SEQ#1_4326中的一种)的,但也可以是大肠 杆菌的蛋白质(如,OmpA前导肽)或胡萝卜软腐欧文氏菌(Erwiniacarotovora)的蛋白质 (如PelB前导肽)。特别有用的置换前导肽是0RF4的前导肽。该前导肽能指导大肠杆菌中的脂质化 (Iipidation)、改善细胞定位,且其特别适用于表达蛋白质287,919和AG287。961的前导 肽和N-未端区域也特别有用。另一种可用的置换前导肽是大肠杆菌OmpA的。该前导肽能指导在大肠杆菌中的 膜定位。其特别有利于ORFl的表达,形成的蛋白质比从其自身前导肽融合和表达的蛋白质 能诱导更好的抗细菌抗体。另一种可用的置换前导肽是MKKYLFSAA。它能直接分泌到培养基中,是非常短和有 活性。这种前导肽的使用不限于奈瑟球菌蛋白质的表达-可用它来指导任何蛋白质(尤其 是细菌蛋白质)的表达。前导肽的缺失在异源表达的第三步骤中,删除本发明蛋白质的天然前导肽。另外,不宜使用任何 融合配体。因此,本发明提供了一种异源表达本发明蛋白的方法,其中(a)删除蛋白质的前 导肽,和任选地(b)不使用任何融合配体。该方法通常还包括如下步骤获得编码本发明蛋白质的核酸;操作该核酸以除去 编码所述蛋白质前导肽的核苷酸。可以将得到的核酸插入表达载体中,或作为表达载体的 一部分。表达的蛋白质的第一氨基酸是成熟的天然蛋白质的第一氨基酸。该方法可以提高表达的水平。例如,对蛋白质919而言,删除前导肽时,大肠杆菌 中的表达水平高许多。没有前导肽时,表达的提高是由于定位的改变。该方法还优先用于919、0RF46、961、050-1、760和287的表达。基于区域的表达在异源表达的第四步骤中,该蛋白质以结构域表达。这可以与融合系统(如GST 或His-标记的融合)联合使用。因此,本发明提供了一种异源表达本发明蛋白质的方法,其中(a)删除蛋白质的至少一个结构域,和任选地(b)不使用融合配体。该方法通常还包括如下步骤获得编码本发明蛋白质的核酸;操作该核酸以除去 蛋白质中的至少一个结构域。可以将得到的核酸插入表达载体中,或作为表达载体的一部 分。不使用融合配体,表达的蛋白质的第一氨基酸是该蛋白质结构域的第一氨基酸。通常,用数据库中已知的序列将蛋白质排序,然后确定该蛋白质中显示彼此不同 的排序模式的区域,从而将该蛋白质分成概念上的结构域。最好将该方法用于表达蛋白质287。概念上可以将该蛋白质分成3个结构域,称为 A、B和C(见图5)。结构域B与IgA蛋白酶排序很接近,结构域C与运铁蛋白结合的蛋白质 排序很接近,而结构域A显示与数据库列不接近。W000/66741公开了 287的多聚体形式的 排序。一旦将蛋白质分区成结构域,就可将它们(a)单独表达(b)以蛋白质的缺失形式 表达(如蛋白质ABCD —ABD、ACD、BCD等)、或(c)重排表达(如蛋白质ABC — ACB、CAB 等)。这三种策略可与所需的融合配体联合。还将0RF46分为2个结构域-第一结构域(氨基酸1_433)(在品种和血清群之间 很好保守的)和第二结构域(氨基酸433-608)(非很好保守的)。最好删除第二结构域。 WO 00/66741公开了 0RF46的多聚体形式的排序。还将蛋白质564分成结构域(图8)如具有蛋白质961 (图12)和蛋白质502(MC58 蛋白质的氨基酸28-167)。杂交蛋白质在异源表达的第五步骤中,将本发明的2种或多种(如3、4、5、6或更多)蛋白质 表达为单杂交蛋白质。不宜使用非奈瑟球菌融合配体(如GST或聚-His)。这能提供2个优点。其一,该蛋白质自身可能不稳定或表达很弱,而加入合适的能 克服该问题的杂交配体就可协助该蛋白质。其二,简化工业生产-产生两种分开的-有用 的蛋白质只需要一次表达和纯化。因此,本发明提供了同时异源表达两种或多种本发明蛋白质的方法,其中所述的 两种或多种本发明的蛋白质是融合的(即,它们是以单多肽链翻译的)。该方法通常还包括如下步骤获得编码本发明第一种蛋白质的第一种核酸;制得 编码本发明第二种蛋白质的第二种核酸;连接第一和第二核酸。将得到的核酸插入表达载 体中,或作为表达载体的一部分。较佳地,本发明在杂交蛋白质中构成的蛋白质是来源于同一菌株的。可直接连接杂交体中的融合蛋白;或通过接头肽连接,如通过聚-甘氨酸接头 (即,Gn,其中n = 3、4、5、6、7、8、9、10或更高);或通过协助克隆的短肽序列连接。显然,不 宜将AG蛋白质连接于聚-甘氨酸接头的C-未端。融合的蛋白质可能缺少天然前导肽,或可能包含N-未端融合配体的前导肽序列。这种方法适用于表达蛋白质orfl,orf25, orf40, 0rf46/46. 1,orf83,233,287, 564,687,741,907,919,953,961 和 983。由式NH2-A-B-COOH在下表中以‘X,表示的42个杂交体是优选的 因此,优选的以杂交体表达的蛋白质是0RF46. 1,287,741,919,961和983。它们 可以全长形式或聚-甘氨酸缺失(AG)形式使用(如AG-287、AGTbp2、AG741、AG983 等),或以截短形式使用(如Δ 1-287、Δ 2-287等),或以结构域缺失的形式使用(如287Β、 287C、287BC、0RF461_433> ORF46433_608、0RF46、961c 等)。特别优选的是(a)含919和287的杂交蛋白;(b)含953和287的杂交蛋白;(c) 含287和0RF46. 1的杂交蛋白;(d)含ORFl和0RF46. 1的杂交蛋白;(e)含919和0RF46. 1 的杂交蛋白;(f)含0RF46. 1和919的杂交蛋白;(g)含0RF46. 1,287和919的杂交蛋白; (h)含919和519的杂交蛋白;和⑴含0RF97和225的杂交蛋白。图14显示了其它实施例。当使用287时,其优先位于杂交体的C-未端;如果在N-未端使用它,则优先使用 287的Δ G形式(如与0RF46. 1、919、953或961杂交的杂交体的N-未端)。当使用287时,其优先为菌株2996或菌株394/98的。当使用961时,其宜在N-端。可使用961的结构域形式。WO 99/66741公开了 0RF46、287、919和953的多聚体形式排序。本发明可以使用 这些多聚体形式中的任一形式。温度在异源表达的第六个步骤中,低温表达本发明的蛋白质。表达的奈瑟球菌蛋白(如919)可能对大肠杆菌有毒性,这可以通过在不显现蛋白 质毒性的温度时表达该蛋白来避免。因此,本发明提供了异源表达本发明蛋白质的方法,其中在不显现该蛋白质毒性 的温度时进行本发明蛋白质的表达。优选的温度为约30°C。这特别适用于919的表达。突变如上所述,表达的奈瑟球菌蛋白质对大肠杆菌可能有毒性的。通过突变该蛋白以降低或消除毒性来避免这种毒性。特别是,可以使用降低或消除毒性酶活性的突变,较佳地 使用定位诱变。因此在异源表达的第七个步骤中,表达的蛋白质是突变的,以减少或消除毒性。因此,本发明提供了异源表达本发明蛋白质的方法,其中蛋白质是突变的以降低 或消除毒性。较佳地,该方法适用于蛋白质907、919或922的表达。在907中的优选突变是 在Glu-117 (如Glu —Gly);在919中的优选突变是在Glu-255 (如Glu — Gly)和/或在 Glu-323 (如 Glu — Gly);在 922 中的优选突变是在 Glu-164 (如 Glu — Gly)、Ser-213 (如 Ser — Gly)和 / 或 Asn-348 (如 Asn — Gly)。其它载体在异源表达的第八个步骤中,用其它载体表达蛋白质。这可以改进表达收率,例 如,或使用已验证用于GMP的质粒。因此,本发明提供了一种异源表达本发明蛋白质的方法,其中使用其它载体。所述 的其它载体最好为PSM214,其无融合配体。可以包含或不包含无前导肽。这种方法特别适用于蛋白质953。用从PSM214表达的953天然前导肽对953的表 达和定位比从pET载体的好得多。也可将pSM214 与以下一起使用AG287、Δ 2-287, Δ 3-287, Δ 4-287,Orf46. 1, 961L,961,961(MC58),961c_L,919,953 禾Π ΔG287-0rf46. 1。其它适合的载体是pET_24b (Novagen ;用卡那霉素抗性),而且也不使用融合 配体。pET-24b 宜与以下一起使用AG287K,Δ 2-287K,Δ 3-287Κ,Δ4-287Κ,Orf46. 1, 0rf46A-K,961-K (MC58),961a_K,961b_K,961c_K,961c-L_K,961d-K, ΔG287-919-K, Δ G287-0rf46. 1_K 和 AG287_961_K。多聚体形式在异源表达的第九步中,表达或纯化蛋白质使其接受一种特定的多聚体形式。这种方法尤其适用于蛋白质953。953的一种特定的多聚体形式(单体形式)的 纯化使蛋白质比其它形式(二体形式)具有更大的杀菌活性。可将蛋白质287和919以二体的形式纯化。可将蛋白质961以180kDa寡聚形式(如四体)纯化。脂质化在异源表达的第十步中,将蛋白质以脂质化的蛋白质表达。因此,本发明提供了一种异源表达本发明蛋白质的方法,其中蛋白质是以脂化的 蛋白质表达的。这尤其适用于919、287、0RF4、406、576_1 和 0RF25 的表达。WO 00/66741 公开了 919、287和0RF4的多聚体形式。该方法通常包括使用合适的前导肽而不用N-未端融合配体。C-未端缺失在异源表达的第十一步中,使本发明蛋白质的C-未端突变。另外,不宜使用融合 配体。因此,本发明提供了异源表达本发明蛋白质的方法,其中(a)使该蛋白质的C-未端区域突变,并任选地(b)不使用融合配体。这种方法通常包括如下步骤获得编码本发明蛋白质的核酸;操作所述的核酸从 而使编码蛋白质C-未端部分的核苷酸突变。将得到的核酸插入表达载体中,或作为表达载 体的一部分。表达的蛋白质的第一氨基酸为成熟天然蛋白质的第一氨基酸。这种突变可以是取代、插入或较佳地为缺失。这种方法能增加表达水平,尤其是蛋白质730、0RF29和0RF46的表达水平。对蛋 白质730而言,可以删除约65-214氨基酸的C-未端区域;对0RF46而言,可以删除约175 氨基酸的C-未端区域;对0RF29而言,可以删除C-未端以留下约230-370N-未端氨基酸。前导肽突变在异源表达的第十二步中,使蛋白质的前导肽突变。这尤其适用于蛋白质919的 表达。因此,本发明提供了一种异源表达本发明蛋白质的方法,其中使蛋白质前导肽突变。这种方法通常包括如下步骤获得编码本发明蛋白质的核酸;并操作所述的核酸 使前导肽中的核苷酸突变。可将得到的核酸插入表达载体中,或作为表达载体的一部分。聚-甘氨酸缺失在异源表达的第十三步中,使野生型序列的聚-甘氨酸段突变。以此提高蛋白质 的表达。聚-甘氨酸段包括序列(Gly)n,其中η彡4(如5、6、7、8、9或更多)。让该段突变 以破坏或除去(Gly)n。这可以通过删除(如,CGGGGS —06665丄665丄65或05),通过替代 (如 CGGGGS — CGXGGS、CGXXGS — CGXGXS 等),和 / 或缺失(如 CGGGGS — CGGXGGS、CGXGGGS
寸J ο这种方法不局限于奈瑟球菌蛋白-其可用于任何蛋白质(尤其是细菌蛋白)以提 高异源表达。然而,对奈瑟球菌蛋白质而言,它特别适用于表达287、741、983和Tbp2。WO 00/66741公开了 287的多聚体形式的排序。因此,本发明提供了一种异源表达本发明蛋白质的方法,其中(a)使蛋白质中的 聚-甘氨酸段突变。这种方法通常包括如下步骤获得编码本发明蛋白质的核酸;和操作所述的核酸 使编码蛋白质序列中的聚-甘氨酸段的核苷酸突变。可将得到的核酸插入表达载体中,或 作为表达载体的一部分。相反,可用相反的方法(即引入聚-甘氨酸段)抑制或减少特定异源蛋白质的表 达。异源宿主虽然本发明蛋白质的表达可以在天然宿主(即天然表达蛋白质的生物)中发 生,但本发明用异源宿主。异源宿主可以是原核细胞或真核细胞。最好是大肠杆菌, 其它合适的宿主包括枯草杆菌、霍乱弧菌、伤寒沙门氏菌(Salmonellatyphi)、鼠伤寒 沙门氏菌(Salmonerma typhimurium)、脑膜炎奈瑟球菌、淋病奈瑟球菌、乳糖奈瑟球菌 (Neisseria lactamica)、灰色奈瑟球菌(Neisseriacinerea)lif (如结核分枝杆菌 (M. tuberculosis)、酵母等。
载体等如上所述的方法,本发明提供了(a)用于这些方法的核酸和载体;(b)含所述载体 的宿主细胞;(c)可用这些方法表达的或可表达的蛋白质;(d)包含这些蛋白质的组合物, 其可能适用于疫苗、或例如诊断剂或免疫原性组合物;(e)用作药物(如疫苗)或诊断剂的 组合物;(f)这些组合物用于生产(1)治疗或预防奈瑟球菌引起的感染的药物(2)检测奈 瑟球菌或由奈瑟球菌引起的抗体存在与否的诊断剂,和/或(3)能产生抗奈瑟球菌抗体的 药物;和(g)治疗患者的方法,其包括对该患者施用治疗有效量的这些组合物。序列本发明还提供了具有以下实施例中所列出的任何序列的蛋白质或核酸。本发明还 提供了具有与这些序列是序列相同性的的蛋白质和核酸。如上所述,“序列相同性”的程度 最好大于 50% (如 60%、70%、80%、90%、95%、99%或更高)。另外,本发明还提供了能与实施例中公开的核酸杂交的核酸,较佳地在“高度严 谨,,条件下(如在65°C,0. 1XSSC,0. 5% SDS溶液中)。本发明还提供了编码本发明蛋白质的核酸。还应理解,本发明提供了核酸,所述核酸含有与上述序列互补的序列(例如用于 反义或探测目的)。当然,本发明的核酸可以用多种方法制备(例如,化学合成、从基因组或cDNA文 库、或从生物体本身制得等),并可以是各种形式(例如单链、双链、载体、探针等)。此外,术语“核酸”包括DNA和RNA,以及它们的类似物,如含有修饰骨架的那些类 似物,还包括肽核酸(PNA)等。


图1和2显示用于以异源前导肽表达蛋白质的构建物。图3显示ORFl的表达数据,图4显示蛋白质961的类似数据。图5显示蛋白质287的结构域,图6和7显示结构域A中的缺失。图8显示蛋白质564的结构域。图9显示由919前导肽驱动的PhoC报道基因,图10显示用前导肽的突变体得到 的结果。图11显示蛋白质730的插入突变体(A :730_C1 ;B :730_C2)。图12显示蛋白质961的结构域。图13显示AG蛋白质的SDS-PAGE。点显示主要重组产物。图14显示本发明的26杂交蛋白。
具体实施例方式实施例1-919及其前导肽脑膜炎奈瑟球菌(血清群B,菌株2996)的蛋白质919具有如下序列1 MKKYLFRAAL YGIAAAILAA CQSKSIQTFP QPDTSVINGP DRPVGIPDPA51 GTTVGGGGAV YTVVPHLSLP HWAAQDFAKS LQSFRLGCAN LKNRQGffQDV101 CAQAFQTPVH SFQAKQFFER YFTPffQVAGN GSLAGTVTGY YEPVLKGDDR0135]151 RTAQARFPIY GIPDDFISVP LPAGLRSGKA LVRIRQTGKN SGTIDNTGGT
0136]201 HTADLSRFPI TARTTAIKGR FEGSRFLPYH TRNQINGGAL DGKAPILGYA
0137]251 EDPVELFFMH IQGSGRLKTP SGKYIRIGYA DKNEHPYVSI GRYMADKGYL
0138]301 KLGQTSMQGI KAYMRQNPQR LAEVLGQNPS YIFFRELAGS SNDGPVGALG
0139]351 TPLMGEYAGA VDRHYITLGA PLFVATAHPV TRKALNRLIM AQDTGSAIKG
0140]401 AVRVDYFffGY GDEAGELAGK QKTTGYVffQL LPNGMKPEYR P*
0141]在前导肽下加下划线。
0142]可以在WO 00/66741的图7和18中发现其它菌株的919序列。
0143]WO 99/57280的实施例2公开了在大肠杆菌中作为His-融合体的蛋白质919的表 达。该蛋白质是优良的外露表面免疫原。
0144]将另三种表达方法用于919
0145]1)919没有其前导肽(且没有成熟的N-未端半胱氨酸)且无任何融合配体(‘919
未标记的)_
0146]1 QSKSIQTFP QPDTSVINGP DRPVGIPDPA GTTVGGGGAV YTVVPHLSLP
0147]50 HWAAQDFAKS LQSFRLGCAN LKNRQGffQDV CAQAFQTPVH SFQAKQFFER
0148]100 YFTPffQVAGN GSLAGTVTGY YEPVLKGDDR RTAQARFPIY GIPDDFISVP
0149]150 LPAGLRSGKA LVRIRQTGKN SGTIDNTGGT HTADLSRFPI TARTTAIKGR
0150]200 FEGSRFLPYH TRNQINGGAL DGKAPILGYA EDPVELFFMH IQGSGRLKTP
0151]250 SGKYIRIGYA DKNEHPYVSI GRYMADKGYL KLGQTSMQGI KAYMRQNPQR
0152]300 LAEVLGQNPS YIFFRELAGS SNDGPVGALG TPLMGEYAGA VDRHYITLGA
0153]350 PLFVATAHPV TPKALNRLIM AQDTGSAIKG AVRVDYFffGY GDEAGELAGK
0154]400 QKTTGYVffQL LPNGMKPEYR P*
0155]通过设计从预定的前导序列的5'-端扩增引物下游除去前导肽和半胱氨酸。
0156]2)包含其前导肽但无任何融合配体的919 ( ‘919L');和
0157]3)包含 0RF4 的前导肽(MKTFFKTLSAAALALILAA)的 919( ‘9190rf4')。
0158]1 MKTFFKTLS AAALALILAA CQSKSIQTFP QPDTSVINGP DRPVGIPDPA
0159]50 GTTVGGGGAV YTVVPHLSLP HWAAQDFAKS LQSFRLGCAN LKNRQGffQDV
0160]100 CAQAFQTPVH SFQAKQFFER YFTPffQVAGN GSLAGTVTGY YEPVLKGDDR
0161]150 RTAQARFPIY GIPDDFISVP LPAGLRSGKA LVRIRQTGKN SGTIDNTGGT
0162]200 HTADLSRFPI TARTTAIKGR FEGSRFLPYH TRNQINGGAL DGKAPILGYA
0163]250 EDPVELFFMH IQGSGRLKTP SGKYIRIGYA DKNEHPYVSI GRYMADKGYL
0164]300 KLGQTSMQGI KSYMRQNPQR LAEVLGQNPS YIFFRELAGS SNDGPVGALG
0165]350 TPLMGEYAGA VDRHYITLGA PLFVATAHPV TRKALNRLIM AQDTGSAIKG
0166]400 AVRVDYFffGY GDEAGELAGK QKTTGYVffQL LPNGMKPEYR P*
0167]为了制备此构建物,编码0RF4前导肽的整个序列作为尾部包括于5'-引物(引 物919L或f4For)。用编码0RF4前导序列的序列中的双核苷酸改变产生NheI限制酶切位 点(无氨基酸改变),使不同的基因融合于0RF4前导肽序列。在所有的3'-端引物序列 中包括终止密码子。蛋白质的所有三种形式都被表达且可以纯化。
13
如所示的[3H]-棕榈酸标记的掺入,将‘919L'和‘9190rf4'表达产物脂化。919 ^new不掺入3H标记,且是在细胞内定位的。与919L相比,919Lorf4更易纯化。将其纯化并用于免疫接种小鼠。得到的血清在 FACS和ELISA测试以及杀菌试验中产生极佳的结果。该脂蛋白显示位于外膜。具有极佳的ELISA滴定度和高血清杀菌活性。FACS证明了其细胞表明的 定位。实施例2-919和表达温度于37°C,表达919L0rf4蛋白质的大肠杆菌的生长导致细菌裂解。为了克服这个问 题,重组细菌在30°C生长。防止了裂解,而不会制止表达。实施例3-907、919和922的突变假设蛋白质907、919和922是胞壁质水解酶和具体说是裂解性转糖基酶。胞壁质 裂解酶位于外膜,且参与肽聚糖的降解。因此测试纯化的蛋白质919*eiew、919Lorf4、919-HiS (即,包含C-未端His-标 记)和 922His 的胞壁质水解酶活性[Ursinus &Holt je (1994) J. Bact. 176 :338_343]。使 用两种不同的试验,一种用于确定不难溶性胞壁质小囊降解为可溶性胞壁肽的,另一种则 是测定聚(MUrNAC-GlCNAC)n> 3Q聚糖链的断裂。第一种试验使用由内消旋-2,6_ 二氨基-3,4,5-[3H]庚二酸放射标记的胞壁质 小囊作为底物。于37°C,在总体积为100μ 1 (包括IOmM Tris-马来酸盐(ρΗ 5. 5) UOmM MgC12,0. 2% v/v Triton X-100 和[3H]A2pm 标记的胞壁质小囊(约 IOOOOcpm))中培养酶 (总共3-10 μ g) 45分钟。将试验混合物置于冰上15分钟,在100 μ 11 % w/vN-乙酰基-N, N,N-三甲铵上15分钟,从IOOOOg离心15分钟沉淀物质。用液体闪烁计数测定上清液中 的放射活性。用大肠杆菌可溶性裂解性转糖基酶Slt70作为试验的阳性对照;阴性对照包 括不含酶的上述试验溶液。在第一个试验中,除919-His以外所有蛋白质都产生阳性结果。第二种试验监测聚(MurNAc-GlcNAc)聚糖链的水解。于37°C,在IOmMTris-马来 酸盐(ρΗ 5. 5) UOmM MgCl2 和 0. 2% v/v Triton X-100 中,将 N-乙酰基-D-I-[3H]葡糖胺 标记的纯化的链聚(MurNAc-GlcNAc)n>3(1与3 μ g 919L 一起培育。煮沸5分钟终止反应,加 Λ 10μ 1 20% ν/ν 磷酸将样品的 ρΗ 调节至约 3. 5。如 Harz 等[Anal. Biochem. (1990) 190 120-128]所述,在Nucleosil 300 C18柱上通过反相HPLC将底物与产物分开。在本试验中 将大肠杆菌裂解性转糖基酶Mlt A作为阳性对照。无酶进行的试验作为阴性对照。当用HPLC将无水双糖亚基从寡糖中分开时,用这种试验证明了 919L0rf4水解分 离的聚糖链的能力。选择蛋白质919Lorf4用于动力学分析。在试验缓冲液中添加的0. 2% v/vTriton X-100使919Lorf4的活性提高3. 7倍。Triton X-100的存在对919 ^hsw活性没有影响。 在范围为5. 0-8. 0的Tris-马来酸盐缓冲液中测定了 ρΗ对酶活性的影响。反应的最适ρΗ 为5. 5。在18°C到42°C的温度范围中,在37°C观察到最大活性。在终浓度为IOmM的各种 离子的存在下进行反应,以测定各种离子对胞壁质水解酶活性的影响。发现存在Mg2+时活 性最高,其刺激活性2. 1倍。Mn2+和Ca2+还刺激酶活性至类似程度,而添加Ni2+和EDTA没 有明显作用。相反,Fe2+和Zn2+显著抑制酶活性。
如Glauner [Anal. Biochem. (1988) 172 :451_464]所述,用反相 HPLC分析由消化未 标记的大肠杆菌胞壁质小囊得到的反应产物的结构。用由溶菌酶Cellosyl消化的胞壁质 小囊来校准和标定Hypersil ODS柱。主要的反应产物是1,6-脱水双糖四和三肽,表明1, 6_无水胞壁质酸(muraminic)分子内键的形成。这些结果从实验角度表明,919是胞壁质水解酶,尤其是裂解性转糖基酶家族的成 员。另外,922-His裂解胞壁质小囊的能力表明该蛋白质也是裂解性转糖基酶。这种活性可有助于解释919在大肠杆菌内表达时的毒性作用。为了消除酶促活性,使用合理的诱变。907、919和922显示对大肠杆菌的三种 膜_结合的、脂化的胞壁质裂解性转糖基酶的相当低的同源性919(441aa)与大肠杆菌 MLTA (P46885)为 27. 3%相同,超过 440aa 重叠;922(369aa)与大肠杆菌 MLTB (P41052)为 38. 7%相同,超过 310aa 重叠;和907-2 (207aa)与大肠杆菌 MLTC(P52066)为 26. 8%相同,超过 149aa 重叠。907-2还与大肠杆菌MLTD (P23913)和Slt70 (P03810)具有同源性,它是一种位于 周质间隙中的可溶性裂解性转糖基酶。在919、922和907-2之间没有测出明显的序列同源 性,且在相应的MLTA、MLTB和MLTC蛋白质之间的情况也同样如此。Slt70 ([IQTEA ; IQTEB ;Thunnissen 等(1995) Biochemistry 34 12729-12737]和 Slt35[lLTM ;1QUS ;IQUT ;van Asselt 等(1999) Structure Fold Des 7 1167-80] (40kDa MLTB的可溶形式)可有晶体结构。已鉴定了 Slt70和MLTB的催化残基一种(谷氨酸)。对Slt70而言,诱变研究表明即使用谷氨酰胺保守性地替代催化Glu505也会导致 酶活性的完全丧失。虽然Slt35与Slt70没有明显的序列相似性,但它们的催化区域却显 示出令人惊讶的相似性。MLTB中相应的催化残基是Glul62。另一个被认为在酶裂缝的正确折叠中起重要作用的残基是谷氨酸的保守良好的 甘氨酸(Gly)下游。最近,Terrak 等[Mol. Microbiol. (1999)34 :350_64]提出存在另一种 重要的残基,它是位于催化性谷氨酸约70-75残基下游的芳族氨基酸。进行Slt70与907-2的序列对比和MLTB与922的序列对比,以鉴定MenB抗原中 相应的催化性残基。催化区域的两个序列对比报道如下907~2/Slt70
90100110T120130140
907-2 .pep ERRRLLVNIQYESSRAGIOTOrVT^LIEVBSAFRgYAISGVOARiKiMOVMPPWKNYia
|丨 I 丨…Ilh I ITl TlIMI
slty—ecoli922/MLT
922,pep mltb^ecoli 从这些对比得出907-2中相应的催化谷氨酸盐是Glull7,而922中为Glul64。这 两种抗原都有下游甘氨酸(在酶裂缝(粗体)折叠中起结构作用),922在约70aa下游(粗 体)具有保守的芳族残基。对蛋白质919而言,对大肠杆菌的同源MLTA没有3D结构,且对可能的催化性残基 的了解为零。然而,通过与MLTA的序列对比,预计919中的三个氨基酸为催化残基919/MLTA



420ο
919. pepGDEAOEljAQKQKTTGYVWQLXjP
I III· II 丨 Il 1
mlta^ecoli.p GPEAQHRAOWYNHYGRVWVLKT 340350用符号▼显示三个可能的催化残基DGlu 225 (MLTA 中的 Asp),其后为三个保守性甘氨酸(Gly263、Gly265 和 Gly272) 和三个保守性芳族残基(位于约75-77残基下游)。这些下游残基以□显示。2)Glu323(在MLTA中保守的),其后为2个保守的甘氨酸(Gly347和Gly355)和 两个保守的芳族氨基酸(位于84-85残基下游)(Tyr406或Phe407)。用 显示这些下游残基。3)Asp362(替代预计的Glu),其后为一个甘氨酸(Gly369)和一个保守的芳族残基 (Trp428)。用ο显示这些下游残基。W000/66741中公开了 919的多聚体形式的排序。基于对催化残基的预测,已产生了 919的三种突变体和907的一种突变体,各包含 单个氨基取代。用基于PCR的SDM,以甘氨酸残基替代919蛋白质的255位和323位的谷 氨酸、362位的天冬氨酸和907蛋白质的117位的谷氨酸。为了达到该目的,设计了包含从 Glu或Asp变为Gly密码子的内部引物
16
有下划线的核苷酸密码是甘氨酸的,突变的核苷酸为小写字母。为了产生919-E255、919-E323 和 919-E362 突变体,用 20ng pET_L0rf4 DNA 作为 模板和以下的引物对进行PCR l)0rf4L 正向/919-E255 反向2)919_E255 正向/919L 反向3) Orf4L 正向 /919-E323 反向4)919_E323 正向/919L 反向5) Orf4L 正向 /919-D362 反向6)919_D362 正向/919L 反向用PCRl-2、3_4或5-6的产物作为模板和正向引物以及反向引物(“0rf4L正向” 和"919L反向”),进行第二轮PCR0对于突变体907-E117,用200ng 2996菌株的染色体DNA作为模板和以下的引物对 进行PCR 7)907L 正向/907-E117 反向8) 907-E117 正向 /907L 反向用PCR7和8的产物作为模板和寡‘‘907L正向”和‘‘907L反向”作为引物,进行第 二轮 PCR。用以下的标准方法加工包含各突变的PCR片段,用NdeI和XhoI限制酶消化并克 隆入pET-21b+载体中。用序列分析验证各突变的存在情况。类似地进行907中的Glul 17向Gly的突变,以及922中的残基Glul64、Ser213和 Asn348的突变。 919的E255G的突变体显示活性低降50 % ;E323G突变体显示活性降低70 % ;E362G 突变体显示活性没有降低。实施例4-多聚体形式将和953_His进行凝胶过滤以分析四级结构或制备性目的。 用 FPLC Superose 12(H/R 10/30)或 Superdex 75 凝胶过滤柱(Pharmacia)计算天然蛋白质的分子量。用于287、919和953层析的缓冲液分别是50mMTris-HCl (pH 8. 0)、20mM Bicine (pH 8. 5)和 50mM Bicine (pH 8. 0)。另外,各缓冲液包含150_200mM NaCl和10% ν/ν甘油。用适合的缓冲液透析蛋白 质并以200 μ 1体积施用。以0. 5-2. Oml/分钟的流速进行凝胶过滤,在280nm监测洗脱物。 收集组分,用SDS-PAGE分析。用蓝色葡聚糖2000和分子量标准核糖核酸酶A、胰凝乳蛋白 酶A卵清蛋白、白蛋白(Pharmacia)校准柱。由标准的Kav与log M^的校准曲线计算样品 的分子量。凝胶过滤之前,用凝血酶消化287-GST以切割GST组成成分。287,919和953_His的估计分子量分别为73kDa、47kDa和43kDa。这些结果表明 919是单体而287和953主要是天然二聚的。对953_His而言,在凝胶过滤的过程中观察到 两个高峰。主峰(80% )代表953的二聚形式,而次峰(20% )则为单体预计的大小。发现 953单体形式比二聚形式具有更大的杀菌活性。实施例5_pSM214 和 pET_24b 载体由pET载体和pSM214表达了包含天然前导肽而无融合配体的953蛋白质[Velati Bellini 等,(1991) J. Biotechnol. 18,177-192]。用大肠杆菌匪294-1菌株作为宿主,以全长基因将953序列克隆入pSM214中。为 了实现此目的,用如下引物通过PCR扩增953基因的整个DNA序列(从ATG到终止密码子)953L for/2 CCGGAATTCTTATGAAAAAAATCATCTTCGCCGC EcoRI953L rev/2 GCCCAAGCTTTTATTGTTTGGCTGCCTCGATT HindIII其分别包含EcoRI和HindIII限制酶切位点。用EcoRI和HindIII消化扩增的片 段,并将其与用这两种酶消化的PSM214载体接连。将连接的质粒转化入大肠杆菌MM294-1 细胞中(通过37°C,在冰上培育65分钟),并将细菌细胞涂布于包含20 μ g/ml氯霉素的LB 琼脂上。于37°C,在包含20 μ g/ml氯霉素的4ml LB肉汤中使重组菌落生长过夜;将细菌 细胞离心,提取质粒DNA,并用EcoRI和HindIII限制进行分析。为了分析重组集落表达蛋 白质的能力,将它们在包含20μ g/ml氯霉素的LB肉汤中培育,并使它们在37°C生长16小 时。离心细菌细胞,悬浮于PBS中。用SDS-PAGE和考马斯蓝染色分析蛋白质的表达。pSM214质粒的表达水平出人意料的高。用于将序列克隆入pSM-214载体中的寡(核苷酸)如下 如对953L所述,操作、克隆和表达这些序列。对pET-24载体而言,如以下对pET21所述,克隆这些序列并在pET_24中表达这些 蛋白质。pET2具有与pET-21相同的序列,但其具有卡那霉素抗性盒替代氨苄青霉素盒。用于将序列克隆入pET_24b中的寡核苷酸是 *将该引物用作所有287形式的反向引物。§与AG278K反向引物联用的正向引物。实施例6-0RF1及其前导肽预计脑膜炎奈瑟球菌(血清群B,菌株MC58)的ORFl是用作外膜或分泌的蛋白质。 其具有如下序列1MKTTDKRTTE THRKAPKTGR [RFSPAYLAI CLSFGILPQA WAGHTYFGIN
51YQYYRDFAENKGKFAVGAKDIEVYNKKGELVGKSMTKAPMIDFSVVSRNG
101VAALVGDQYIVSVAHNGGYNNVDFGAEGRNPDQHRFTYKIVKRNNYKAGT
151KGHPYG⑶YHMPRLHKFVTDAEPVEMTSYMDGRKYIDQNNYPDRVRIGAG
201RQYffRSDEDEPNNRESSYHIASAYSffLVGGNTFAQNGSGGGTVNLGSEKI
251KHSPYGFLPTGGSFGDSGSPMFIYDAQKQKWLINGVLQTGNPYIGKSNGF
301QLVRKDffFYDEIFAGDTHSVFYEPRQNGKYSFNDDNNGTGKINAKHEHNS
351LPNRLKTRTVQLFNVSLSETAREPVYHAAGGVNSYRPRLNNGENISFIDE
401GKGELILTSNINQGAGGLYFQGDFTVSPENNETffQGAGVHISEDSTVTffK
451VNGVANDRLSKIGKGTLHVQAKGENQGSISV⑶GTVILDQQADDKGKKQA
501FSEIGLVSGRGTVQLNADNQFNPDKLYFGFRGGRLDLNGHSLSFHRIQNT
551DEGAMIVNHNQDKESTVTITGNKDIATTGNNNSLDSKKEIAYNGffFGEKD
601TTKTNGRLNLVYQPAAEDRTLLLSGGTNLNGNITQTNGKLFFSGRPTPHA
651YNHLNDHWSQKEGIPRGEIVWDNDffINRTFKAENFQIKGGQAVVSRNVAK
701VKGDWHLSNHAQAVFGVAPHQSHTICTRSDWTGLTNCVEKTITDDKVIAS
751LTKTDISGNVDLADHAHLNLTGLATLNGNLSANGDTRYTVSHNATQNGNL
801SLVGNAQATFNQATLNGNTSASGNASFNLSDHAVQNGSLTLSGNAKANVS
851HSALNGNVSLADKAVFHFESSRFTGQISGGKDTALHLDKSEffTLPSGTEL
901GNLNLDNATITLNSAYRHDAAGAQTGSATDAPRRRSRRSRRSLLSVTPPT
951SVESRFNTLTVNGKLNGQGTFRFMSELFGYRSDKLKLAESSEGTYTLAVN
1001NTGNEPASLEQLTVVEGKDNKPLSENLNFTLQNEHVDAGAWRYQLIRKDG
1051EFRLHNPVKEQELSDKLGKAEAKKQAEKDNAQSLDALIAAGRDAVEKTES
1101VAEPARQAGGENVGIMQAEEEKKRVQADKDTALAKQREAETRPATTAFPR
1151ARRARRDLPQLQPQPQPQPQRDLISRYANSGLSEFSATLNSVFAVQDELD
1201RVFAEDRRNAVffTSGIRDTKHYRSQDFRAYRQQTDLRQIGMQKNLGSGRV
1251GILFSHNRTENTFDDGIGNSARLAHGAVFGQYGIDRFYIGISAGAGFSSG
1301SLSDGIGGKIRRRVLHYGIQARYRAGFGGFGIEPHIGATRYFVQKADYRY
1351ENVNIATPGLAFNRYRAGIKADYSFKPAQHISITPYLSLSYTDAASGKVR
1401TRVNTAVLAQDFGKTRSAEffGVNAEIKGFTLSLHAAAAKGPQLEAQHSAG
1451IKLGYRff *前导肽是加下划线的。W099/55873公开了 ORFl的多聚体形式。已将三种表达策略用于ORFl 1)使用 His 标记的 ORFl,按照 W099/24578 (ORFl-His);2)包含自身前导肽但无任何融合配体的ORFl ( ‘0RF1L');和3)包含大肠杆菌 OmpA 的前导肽(MKKTAIAIAVALAGFATVAQA)的 ORFl( iOrflLOmpA')MKKTAIAIAVALAGFATVAQAASAGHTYFGINYQYYRDFAENKGKFAVGAKDIEVYNKKGELVGKSMTK APMIDFSVVSRNGVAALV⑶QYIVSVAHNGGYNNVDFGAEGRNPDQHRFTYKIVKRNNYKAGTKGHPYGGDYHMPRL HKFVTDAEPVEMTSYMDGRKYIDQNNYPDRVRIGAGRQYWRSDEDEPNNRESSYHIASAYSWLVGGNTFAQNGSGGG TVNIGSEKIKHSPYGFLPTGGSF⑶SGSPMFIYDAQKQKWLINGVLQTGNPYIGKSNGFQLVRKDWFYDEIFA⑶TH SVFYEPRQNGKYSFNDDNNGTGKINAKHEHNSLPNRLKTRTVQLFNVSLSETAREPVYHAAGGVNSYRPRLNNGENI SFIDEGKGELILTSNINQGAGGLYFQ⑶FTVSPENNETWQGAGVHISEDSTVTWKVNGVANDRLSKIGKGTLHVQAK GENQGSISV⑶GTVILDQQADDKGKKQAFSEIGLVSGRGTVQLNADNQFNPDKLYFGFRGGRLKLNGHSLSFHRIQNTDEGAMIVNHNQDKESTVTITGNKDIATTGNNNSLDSKKEIAYNGWFGEKDTTKTNGRLNLVYQPAAEDRTLLLSGG TNLNGNITQTNGKLFFSGRPTPHAYNHLNDHWSQKEGIPRGEIVWDNDWINRTFKAENFQIKGGQAVVSRNVAKVKG DffHLSNHAQAVFGVAPHQSHTICTRSDffTGLTNCVEKTITDDKVIASLTKTDISGNVDLADHAHLNLTGLATLNGNL SANGDTRYTVSHNATQNGNLSLVGNAQATFNQATLNGNTSASGNASFNLSDHAVQNGSLTLSGNAKANVSHSALNGN VSLADKAVFHFESSRFTGQISGGKDTALHLKDSEWTLPSGTELGNLNLDNATITLNSAYRHDAAGAQTGSATDAPRR RSRRSRRSLLSVTPPTSVESRFNTLTVNGKLNGQGTFRFMSELFGYRSDKLKLAESSEGTYTLAVNNTGNEPASLEQ LTWEGKDNKPLSENLNFTLQNEHVDAGAffRYQLIRKDGEFRLHNPVKEQELSDKLGKAEAKKQAEKDNAQSLDALI AAGRDAVEKTESVAEPARQAGGENVGIMQAEEEKKRVQADKDTALAKQREAETRPATTAFPRARRARRDLPQLQPQP QPQPQRDLISRYANSGLSEFSATLNSVFAVQDELDRVFAEDRRNAVWTSGIRDTKHYRSQDFRAYRQQTDLRQIGMQ KNLGSGRVGILFSHNRTENTFDDGIGNSARLAHGAVFGQYGIDRFYIGISAGAGFSSGSLSDGIGGKIRRRVLHYGI QARYRAGFGGFGIEPHIGATRYFVQKADYRYENVNIATPGLAFNRYRAGIKADYSFKPAQHISITPYLSLSYTDAAS GKVRTRVNTAVLAQDFGKTRSAEWGVNAEIKGFTLSLHAAAAKGPQLEAQHSAGIKLGYRW*为了制备此构建物,用NheI和XhoI限制酶消化克隆pET91 ILOmpA (见如下),并纯 化相应于携带OmpA前导序列的载体的片段(pETLOmpA)。用寡核苷酸ORFl-正向和ORFl-反 向(分别包括NheI和XhoI限制性酶切位点)扩增编码成熟蛋白质的ORFl基因,用NheI 和XhoI消化并连接到纯化的pETOmpA片段(参见图1)。由NheI位点引入另一 AS 二肽。该蛋白质的所有三种形式都被表达。可纯化His-标记的蛋白质,并确证其为表面 外露的且可能分泌的(参见图3)。用这种蛋白质免疫接种小鼠,得到的血清在杀菌试验中 有极佳的结果。 将ORFlLOmpA作为完整膜纯化,并固定于内膜和外膜。出人意料地,针对 ORFlLOmpA产生的血清比那些针对His-标记的蛋白质产生的血清显示更好的ELISA和抗杀 菌特性。在其定位的地方将ORFIl作为外膜纯化。实施例7-蛋白质911及其前导肽脑膜炎奈瑟球菌(血清群B,菌株MC58)的蛋白质911具有如下序列1 MKKNILEFffV GLFVLIGAAA VAFLAFRVAG GAAFGGSDKT YAVYADF⑶I51 GGLKVNAPVK SAGVLVGRVG AIGLDPKSYQ ARVRLDLDGK YQFSSDVSAQ
101 ILTSGLLGEQ YIGLQQG⑶T ENLAA⑶TIS VTSSAMVLEN LIGKFMTSFA151 EKNADGGNAE KAAE *前导肽是加下划线的。将三种表达策略用于911 1)包含其自身前导肽但无任何融合配体的911 ( ‘911L');2)包含大肠杆菌OmpA的前导肽的911( ‘911L0mpA')。为了制备该构建物,在5'-引物中包括编码OmpA前导肽的完整序列作为尾(引 物91 IOmpA正向)。在编码OmpA前导肽的序列和编码预计的成熟蛋白质的911基因之间插 入NheI限制酶切位点(插入一个氨基酸,一个丝氨酸),使该构建物用于克隆不同的基因下 游OmpA前导肽序列。3)包含胡萝卜软腐欧文氏菌(Erwinia carotovora) PelB的前导肽 (MKYLLPTAAAGLLLAAQPAMA)的 911( ‘91ILpelB)。为了制备该构建物,将5'-端PCR引物设计为前导序列的下游,并包括NcoI限制 酶切位点,从而使911直接融合于PelB前导序列;3'-端引物包括终止密码子。所用的表 达载体是pET22b+ (Novagen),其携带编码PelB前导肽的序列。NcoI位点在PelB序列后引入另一甲硫氨酸。表达该蛋白质的所有三种形式。用911L的ELISA滴定度最高,919L0mpA也有良好 的结果。实施例8-0RF46
脑膜炎奈瑟球菌(血清群B,菌株2996)的完整0RF46蛋白质具有如下序列
1LGISRKISLILSILAVCLPMHAHASDLANDSFIRQVLDRQHFEPDGKYHL
51FGSRGELAERSGHIGLGKIQSHQLGNLMIQQAAIKGNIGYIVRFSDHGHE
101VHSPFDNHASHSDSDEAGSPVDGFSLYRIHWDGYEHHPADGYDGPQGGGY
151PAPKGARDIYSYDIKGVAQNIRLNLTDNRSTGQRLADRFHNAGSMLTQGV
201GDGFKRATRYSPELDRSGNAAEAFNGTADIVKNIIGAAGEIVGAGDAVQG
251ISEGSNIAVMHGLGLLSTENKMARINDLADMAQLKDYAAAAIRDffAVQNP
301NAAQGIEAVSNIFMAAIPIKGIGAVRGKYGLGGITAHPIKRSQMGAIALP
351KGKSAVSDNFADAAYAKYPSPYHSRNIRSNLEQRYGKENITSSTVPPSNG
401KNVKLADQRHPKTGVPFDGKGFPNFEKHVKYDTKLDIQELSGGGIPKAKP
451VSDAKPRffEVDRKLNKLTTREQVEKNVQEIRNGNKNSNFSQHAQLEREIN
501KLKSADEINFADGMGKFTDSMNDKAFSRLVKSVKENGFTNPVVEYVEING
551KAYIVRGNNRVFAAEYLGRIHELKFKKVDFPVPNTSffKNPTDVLNESGNV
601KRPRYRSK*前导肽是加下划线的。在W000/66741中发现有其它菌株的0RF46序列。已将三种表达策略用于0RF46 1)包含自身前导肽但无任何融合配体的0RF46( ‘0RF46-2L');2)不含自身前导肽且无任何融合配体的0RF46(‘0RF46_2'),通过从预计的前导 序列设计5'-端扩增引物下游除去前导肽
1SDLANDSFIRQVLDRQHFEPDGKYHLFGSRGELAERSGHIGLGKIQSHQL
51GNLMIQQAAIKGNIGYIVRFSDHGHEVHSPFDNHASHSDSDEAGSPVDGF
101SLYRIHWDGYEHHPADGYDGPQGGGYPAPKGARDIYSYDIKGVAQNIRLN
151LTDNRSTGQRLADRFHNAGSMLTQGVGDGFKRATRYSPELDRSGNAAEAF
201NGTADIVKNIIGAAGEIVGAGDAVQGISEGSNIAVMHGLGLLSTENKMAR
251INDLADMAQLKDYAAAAIRDWAVQNPNAAQGIEAVSNIFMAAIPIKGIGA
301VRGKYGLGGITAHPIKRSQMGAIALPKGKSAVSDNFADAAYAKYPSPYHS
351RNIRSNLEQRYGKENITSSTVPPSNGKNVKLADQRHPKTGVPFDGKGFPN
401FEKHVKYDTKLDIQELSGGGIPKAKPVSDAKPRffEVDRKLNKLTTREQVE
451KNVQEIRNGNKNSNFSQHAQLEREINKLKSADEINFADGMGKFTDSMNDK
501AFSRLVKSVKENGFTNP WEYVEINGKAYIVRGNNRVFAAEYLGRIHELK
551FKKVDFPVPNTSffKNPTDVLNESGNVKRPRYRSK *3)作为一种截短的蛋白质的0RF46,由前433氨基酸构成(‘0RF46. IL'),通过 设计PCR引物以扩增相应于aal-433的部分序列构建。在3'-端引物序列中包括终止密码子。对大肠杆菌,0RF46-2L以很低的水平表达。除去它的前导肽(0RF46-2)也不能解 决这个问题。然而,截短的0RF46. IL形式(前433个氨基酸,在血清群和品种中很好保守 的)能很好地表达,且在ELISA和杀菌试验中得到极佳的结果。也将0RF46. 1用作杂交蛋白的基础。将其与287、919和ORFl融合。通常杂交蛋 白是不溶的,但能得到一些良好的ELISA和杀菌(针对同源2996菌株)结果。 为了比较,构建0RF46. 1、287(作为GST融合或以AG287形式)的'三’杂交体, 针对各种菌株(包括同源2996菌株)与三种抗原的简单混合物测试。FCA用作佐剂 另外,杂交体显示相等的或更佳的免疫活性。针对各种异源菌株,将两种蛋白质(菌株2996)的杂交体与单种蛋白质进行比 较 杂交体再一次显示相等的或更佳的免疫活性。实施例9-蛋白质961脑膜炎奈瑟球菌(血清群B,菌株MC58)的完整961蛋白质具有如下序列1MSMKHFPAKV LTTAILATFCSGALAATSDDDVKKAATVAIVAAYNNGQEI
51NGFKAGETIY DIGEDGTITQKDATAADVEADDFKGLGLKKVVTNLTKTVN
101ENKQNVDAKV KAAESEIEKLTTKLADTDAALADTDAALDETTNALNKLGE
151NITTFAEETK TNIVKIDEKLEAVADTVDKHAEAFNDIADSLDETNTKADE
201AVKTANEAKQ TAEETKQNVDAKVKAAETAAGKAEAAAGTANTAADKAEAV
251AAKVTDIKAD IATNKADIAKNSARIDSLDKNVANLRKETRQGLAEQAALS
301GLFQPYNVGR FNVTAAVGGYKSESAVAIGTGFRFTENFAAKAGVAVGTSS
351GSSAAYHVGV NYEff *前导肽是加下划线的。对961的表达采用如下三种方法1)使用 GST 融合体的 961,按照 W099/57280( ‘GST961');2)包含其自身前导肽但无融合配体的961 ( ‘961L');和3)无自身前导肽且不含任何融合配体的961 ( '961* ^'),通过设计从预计的 前导序列的5'-端PCR引物下游除去前导肽。该蛋白质的所有三种形式都被表达。可以纯化GST-融合蛋白,其抗体表明961是 表面外露的(图4)。用该蛋白质免疫接种小鼠,得到的血清在杀菌试验中有极佳的结果。 也可纯化961L,它产生非常高的ELISA滴定度。蛋白质961似乎是为相变量。另外,在脑膜炎奈瑟球菌的所有菌株中都没有它。实施例10-蛋白质287脑膜炎奈瑟球菌(血清群B,菌株2996)的蛋白质287具有如下序列
1MFERSVIAMACIFALSACGGGGGGSPDVKSADTLSKPAAPVVAEKETEVK
51EDAPQAGSQGQGAPSTQGSQDMAAVSAENTGNGGAATTDKPKNEDEGPQN
101DMPQNSAESANQTGNNQPADSSDSAPASNPAPANGGSNFGRVDLANGVLI
151DGPSQNITLTHCK⑶SCNGDNLLDEEAPSKSEFENLNESERIEKYKKDGK
201SDKFTNLVATAVQANGTNKYVIIYKDKSASSSSARFRRSARSRRSLPAEM
251PLIPVNQADTLIVDGEAVSLTGHSGNIFAPEGNYRYLTYGAEKLPGGSYA
301LRVQGEPAKGEMLAGTAVYNGEVLHFHTENGRPYPTRGRFAAKVDFGSKS
351VDGIIDSGDDLHMGTQKFKAAIDGNGFKGTWTENGGGDVSGRFYGPAGEE
401VAGKYSYRPTDAEKGGFGVFAGKKEQD*
前导肽是加下划线显示的。
在TO00/66741的图5和15中可以发现其它菌株的287序列。 W099/57280的实施例9公开了在大肠杆菌中作为GST-融合蛋白的287的表达。 已使用许多其它方法在大肠杆菌中表达287,包括
1)作为His-标记的融合蛋白的287( ‘287-His');
2)包含其自身前导肽但无任何融合配体的287( ‘287L');
3)包含0RF4前导肽且无任何融合配体的287( ‘287L0rf4');和
4)不含其自身前导肽且无任何融合配体的287( '287* ^') 1 CGGGGGGSPD VKSADTLSKP AAPVVAEKET EVKEDAPQAG SQGQGAPSTQ 51 GSQDMAAVSA ENTGNGGAAT TDKPKNEDEG PQNDMPQNSA ESANQTGNNQ 101 PADSSDSAPA SNPAPANGGS NFGRVDLANG VLIDGPSQNI TLTHCKGDSC 151 NGDNLLDEEA PSKSEFENLN ESERIEKYKK DGKSDKFTNL VATAVQANGT 201 NKYVIIYKDK SASSSSARFR RSARSRRSLP AEMPLIPVNQ ADTLIVDGEA 251 VSLTGHSGNI FAPEGNYRYL TYGAEKLPGG SYALRVQGEP AKGEMLAGTA 301 VYNGEVLHFH TENGRPYPTR GRFAAKVDFG SKSVDGIIDS GDDLHMGTQK 351 FKAAIDGNGF KGTffTENGGG DVSGRFYGPA GEEVAGKYSY RPTDAEKGGF 401 GVFAGKKEQD * 所有这些蛋白质都被表达和纯化。 证明‘287L'和‘287L0rf4'是脂蛋白。
如图2所示,通过用NheI和XhoI消化919L0rf4构建‘287L0rf4'。在5'-端引 物(287L0rf正向)(融合于287编码序列)添加编码遗漏氨基酸的DNA序列(作为尾),恢 复完整的0RF4前导肽。用寡核苷酸287L0rf4正向和反向(分别包含NheI和XhoI位点) 扩增编码成熟蛋白质的287基因,用NheI和XhoI消化并连接于纯化的pET0rf4片段。实施例11-包含/不含天然前导肽的其它非融合蛋白质一种类似的方法适用于大肠杆菌表达W099/24578、W099/36544和W099/57280的
其它蛋白质。以下是未用融合配体表达的:008、105、117-1、121-1、122-1、128-1、148、216、243、 308、593、652、726、982和Orf 143-1。FACS表明蛋白质117-1是表面外露的,且产生高ELISA
以下是由天然前导肽但无融合配体表达的111、149、206、225-1、235、247-1、274、 283、286、292、401、406、502-1、503、519-1、525-1、552、556、557、570、576-1、580、583、664、 759、907、913、920-1、926、936-1、953、961、983、989、Orf4, Orf7-1, 0rf9_l、Orf23, Orf25, 0rf37、Orf38, Orf40, 0rf40. 1、Orf40. 2、Orf72-1, Orf76-1, Orf85-2, Orf9U 0rf97_l、 0rfll9、0rfl43. 1。这些蛋白质都有后缀‘L'。用或不用其前导肽表达His标记的蛋白质760。信号肽的缺失大大地增加了表达 水平。使用2M尿素(用于增溶)最易纯化该蛋白质。用其自身的信号肽能很好地表达His-标记的蛋白质264,且30kDa蛋白质得到阳 性Western印迹结果。所有蛋白质都成功地表达。验证了593、121-1、128-1、593、726 和 982 在细胞质中的定位。验证了920-lL、953L、0RF9-lL、0RF85-2L、0RF97-lL、570L、580L 和 664L 在周质中 的定位。验证了 0RF40L在外膜中的定位,和008和519-1L在内膜中的定位。验证了 0RF25L、0RF4L、406L、576-1L 都是在膜中定位的。发现蛋白质206不是脂蛋白。用其天然前导肽但无融合配体表达的0RF25和0RF40,以及未用其天然前导肽和 融合配体表达的蛋白质593,都产生良好的抗杀菌血清。令人惊讶地,未用融合配体而使用 其前导肽(即‘0RF25L'和‘0RF40L')表达的0RF25和0RF40形式比融合蛋白在杀菌试 验中产生更好的结果。将蛋白质920L和953L进行N-未端测序,结果分别为HRVWVETAH和 ATYKVDEYHANARFAF。此测序结果表明切除了预计的前导肽,且当与周质定位联合时表明当 由它们的天然前导肽表达时,大肠杆菌正确地加工和定位这些蛋白质。定位于内膜的蛋白质519. IL的N-未端序列是MEFFIILLA,表明未切除前导序列。 因此,它可作为未切割的前导序列和跨膜锚(以与淋病奈瑟球菌的PBPl的前导肽类似的方 式)[Ropp & Nicholas (1997) J. Bact. 179 2783-2787. ] 事实上,N-未端区域表现出强疏 水性,且由Tmpred.程序预计为跨膜的。实施例12-脂蛋白用Kraft等[J. Bact. (1998) 180 :3441_3447.]的方法验证重组脂蛋白中棕榈酸 盐的掺入。于37°C,在20ml LB/Amp (100 μ g/ml)的液体培养基中使携带感兴趣质粒的单 集落生长过夜。在5. Oml含有5 μ C/ml [3H]棕榈酸盐(Amersham)的新鲜培养基LB/Amp培 养基中,将培养物稀释至OD55tl为0. 1。当培养物的OD55tl达到0. 4-0. 8时,用IPTG(终浓度 为l.OmM)诱导重组脂蛋白1小时。用台式离心机以2700g离心15分钟收获细菌,用1.0ml 冷 PBS 洗涤 2 次。将细胞悬浮于 120 μ 1 20mMTris-HCl(pH 8.0)、ImM EDTAU. 0% w/v SDS 中,并煮沸10分钟裂解。以13000g离心10分钟后,收集上清液,加入1. 2ml冷丙酮沉淀 蛋白质,在_20°C静置1小时。以13000g离心10分钟沉淀蛋白质,重悬浮于20-50μ 1(以 培养物终0. D值校准负载量计算的)1. 0 % w/v SDS0将15 μ 1等份与5 μ 1 SDS-PAGE样 品缓冲液煮沸,用SDS-PAGE分析。电泳凝胶在10% ν/ν乙酸中固定1小时后,在扩增溶液
27(Amersham)中浸泡30分钟。加热真空干燥凝胶,_80°C暴露在Hyperfilm(Kodak)中过夜。在以下蛋白质中发现[3H]棕榈酸盐标记的掺入(表明脂化)0rf4L、0rf25L、 287L、287L0rf4、406L、576L、926L、919L 和 919L0rf4。实施例13-287中的结构域根据287中不同的结构域与隶属不同功能类别的蛋白质的同源性,如图5所示将 其分为3个“结构域”。第二个结构显示与IgA蛋白酶同源,第三结构域显示与结合转铁蛋 白的蛋白质同源。在脑膜炎奈瑟球菌之间这三个“结构域”各表现出不同程度的序列保守性_结构 域C为98%相同,结构域A为83%相同,而结构域B仅为71%相同。注意到菌株MC58中的蛋 白质287比菌株2996的长61个氨基酸。图7显示了这两个序列的序列对比,W000/66741 (图 5和15)公开了各种菌株的序列对比。将这三个结构域分别表达成C-未端His-标记的蛋白质。用以下构建物对MC58 和2996菌株进行处理287a-MC58(aal-202),287b_MC58(aa203_288),287c_MC58(aa311-488)。
287a-2996 (aal-139),287b_2996(aal40_225),287c_2996(aa250_427)。为了制备这些构建物,除去3' _端引物序列中的终止密码子序列。5'引物包 NheI限制酶切位点,3'引物包括作为尾部的Xhol,从而用NdeI-XhoI, NheI-XhoI或 NdeI-HindIII限制酶切位点指导将各扩增片段克隆入表达载体pET21b+中。所有六种构建物都可以表达,但287b_MC8需要变性和重折叠以增溶。以下描述了结构域A的缺失(‘A4287_His')。用菌株2996的各种结构域还获得了针对同源和异源MenB菌株以及MenA(F6124 菌株)和MenC(BZ133菌株)的免疫学数据(血清杀菌试验) 用菌株MC58的结构域获得以下结果
实施例14-287中的缺失与表达单一结构域一样,通过在第一结构域中的渐进缺失还表达了 287 (以C-未 端His-标记的蛋白质)。使用菌株2996的蛋白质287的四缺失突变体(图6)1) ‘287-His' ,d13氨基酸18-427构成(即缺失前导肽);
2) ‘Δ1287-His',由氨基酸 26-427 构成;
3) ‘A2287-His',由氨基酸I 70-427 构成;
4) ‘A3287-His',由氨基酸I 107-427构成;和
5) ‘A4287-His',由氨基酸I 140-427 构成(=287-bc)。
还为菌株MC58制备了 ‘ Δ4'蛋白质(‘ Δ4 287MC58-His
,aa203-488)。如上所述,用与287a/b/c相同的方法制备这些构建物。可以表达所有六种构建物,并可纯化蛋白质。然而287-His的表达很差。当除去C-未端His-标记物时,表达也很高。用缺失突变体也获得了针对同源(2996)和异源MenB菌株以及MenA (F6124菌株) 和MenC(BZ133菌株)的免疫学数据(血清杀菌试验) 用菌株MC58的序列观察到Δ4缺失的相同高的活性。同样显示极佳的表达特性, 因此突变体是免疫学相等的或更佳的。实施例15-聚甘氨酸缺失前实施例的‘Δ 1 287-His'构建物与287-His和'287未标记的'的不同仅在于 短的N-未端缺失(GGGGGGS)。然而使用一种以Nhe克隆位点中存在的密码子替代缺失的丝 氨酸的表达载体,缺失仅为(Gly)6。因此,该(Gly)6序列的缺失显示对蛋白质表达有明显影响。
将缺失多达GGGGGG的N-未端氨基酸的蛋白质称为‘ AG 287'。在菌株MC58中, 其序列(前导序列加下划线)为_ AG287
1MFKRSVIAMACIFALSACGGGGGGSPDVKSADTLSKPAAPVVSEKETEAK
51EDAPQAGSQGQGAPSAQGSQDMAAVSEENTGNGGAVTADNPKNEDEVAQN
101DMPQNAAGTDSSTPNHTPDP匪LAGNMENQATDAGESSQPANQPDMANAA
151DGMQ⑶DPSAGGQNAGNTAAQGANQAGNNQAAGSSDPIPASNPAPANGGS
201NFGRVDLANGVLIDGPSQNITLTHCKGDSCSGNNFLDEEVQLKSEFEKLS
251DADKISNYKKDGKNDKFVGLVADSVQMKGINQYIIFYKPKPTSFARFRRS
301ARSRRSLPAEMPLIPVNQADTLIVDGEAVSLTGHSGNIFAPEGNYRYLTY
351GAEKLPGGSYALRVQGEPAKGEMLAGAAVYNGEVLHFHTENGRPYPTRGR
401FAAKVDFGSKSVDGIIDSGDDLHMGTQKFKAAIDGNGFKGTffTENGSGDV
451SGKFYGPAGEEVAGKYSYRPTDAEKGGFGVFAGKKEQD*
与'287-His ‘或‘287*标i己相比,有或无His-标记的AG287(分别为
‘A287-His'和'AG287K')以非常好的水平表达。以基因变异性数据为基础,许多MenB菌株(尤其是菌株2996、MC58、1000和 BZ232)的AG287-His的变体在大肠杆菌中表达。结果也非常好。假设聚-Gly缺失可能是一种改进表达的常规策略。因此鉴定了含有类似 (Gly)n基序(接近N-未端,丝氨酸的下游)的其它MenB脂蛋白,称为Tbp2(NMB0460)、 741 (NMB1870)和 983 (NMB1969)TBP2_ Δ GTbp2
1MNNPLVNQAA MVLPVFALSACLGGGGSFDLDSVDTEAPRPAPKYQDVFSE
51KPQAQKDQGGYGFAMRLKRRNWYPQAKEDEVKLDESDffEATGLPDEPKEL
101PKRQKSVIEKVETDSDNNIYSSPYLKPSNHQNGNTGNGINQPKNQAKDYE
151NFKYVYSGffFYKGHKREFNLKVEPKSAKNGDDGYIFYHGKEPSRQLPSAG
201KITYKGVffHFATDTKKGQKFREIIQPSKSQGDRYSGFSGDDGEEYSNKNK
251STLTDGQEGYGFTSNLEVDFHNKKLTGKLIRNNANTDNNQATTTQYYSLE
301AQVTGNRFNGKATATDKPQQNSETKEHPFVSDSSSLSGGFFGPQGEELGF
351RFLSDDQKVAVVGSAKTKDKPANGNTAAASGGTDAAASNGAAGTSSENGK
401LTTVLDAVELKLGDKEVQKLDNFSNAAQLVVDGIMIPLLPEASESGNNQA
451NQGTNGGTAFTRKFDHTPESDKKDAQAGTQTNGAQTASNTAGDTMGKTKT
501YEVEVCCSNLNYLKYGMLTRKNSKSAMQAGESSSQADAKTEQVEQSMFLQ
551GERTDEKEIPSEQNIVYRGSWYGYIANDKSTSffSGNASNATSGNRAEFTV
601NFADKKITGTLTADNRQEATFTIDGNIKDNGFEGTAKTAESGFDLDQSNT
651TRTPKAYITDAKVQGGFYGPKAEELGGffFAYPGDKQTKNATNASGNSSAT
701VVFGAKRQQPVR*
741 AG741
1VNRTAFCCLSLTTALILTACSSGGGGVAADIGAGLADALTAPLDHKDKGL
51QSLTLDQSVR KNEKLKLAAQGAEKTYGNGDSLNTGKLKNDKVSRFDFIRQ
30
101IEVDGQLITLESGEFQVYKQSHSALTAFQTEQIQDSEHSG KMVAKRQFRI
151GDIAGEHTSFDKLPEGGRATYRGTAFGSDDAGGKLTYTID FAAKQGNGKI
201EHLKSPELNVDLAAADIKPDGKRHAVISGSVLYNQAEKGS YSLGIFGGKA
251QEVAGSAEVKTVNGIRHIGL AAKQ *
983_ AG983
1MRTTPTFPTKTFKPTAMALAVATTLSACLGGGGGGTSAPDFNAGGTGIGS
51NSRATTAKSAAVSYAGIKNEMCKDRSMLCAGRDDVAVTDRDAKINAPPPN
101LHTCDFPNPNDAYKNLINLKPAIEAGYTGRGVEVGIVDTGESVGSISFPE
151LYGRKEHGYNENYKNYTAYMRKEAPEDGGGKDIEASFDDEAVIETEAKPT
201DIRHVKEIGHIDLVSHIIGGRSVDGRPAGGIAPDATLHIMNTNDETKNEM
251MVAAIRNAffVKLGERGVRIVNNSFGTTSRAGTADLFQIANSEEQYRQALL
301DYSGGDKTDEGIRLMQQSDYGNLSYHIRNK匪LFIFSTGNDAQAQPNTYA
351LLPFYEKDAQKGIITVAGVDRSGEKFKREMYGEPGTEPLEYGSNHCGITA
401MWCLSAPYEASVRFTRTNPIQIAGTSFSAPIVTGTAALLLQKYPffHSNDN
451LRTTLLTTAQDIGAVGVDSKFGffGLLDAGKAMNGPASFPFGDFTADTKGT
501SDIAYSFPNDISGTGGLIKKGGSQLQLHGNNTYTGKTIIEGGSLVLYGNN
551KSDMRVETKGALIYNGAASGGSLNSDGIVYLADTDQSGANETVHIKGSLQ
601LDGKGTLYTRLGKLLKVDGTAIIGGKLYMSARGKGAGYLNSTGRRVPFLS
651AAKIGQDYSFFTNIETDGGLLASLDSVEKTAGSEGDTLSYYVRRGNAART
701ASAAAHSAPAGLKHAVEQGGSNLENLMVELDASESSATPETVETAAADRT
751DMPGIRPYGATFRAAAAVQHANAADGVRIFNSLAATVYADSTAAHADMQG
801RRLKAVSDGLDHNGTGLRVIAQTQQDGGTffEQGGVEGKMRGSTQTVGIAA
851KTGENTTAAATLGMGRSTffSENSANAKTDSISLFAGIRHDAGDIGYLKGL
901FSYGRYKNSISRSTGADEHAEGSVNGTLMQLGALGGVNVPFAATGDLTVE
951GGLRYDLLKQDAFAEKGSALGffSGNSLTEGTLVGLAGLKLSQPLSDKAVL
1001FATAGVERDLNGRDYTVTGGFTGATAATGKTGARNMPHTRLVAGLGADVE
1051FGNGffNGLARYSYAGSKQYGNHSGRVGVGYRF*
Tbp2和741基因本源于菌株MC58 ;983和287基因来源于菌株2996。
入pET载体中,并在大肠杆菌中表达而无编码它们前导肽的序列或以‘ Δ G形式'(都融合 于C-端His-标记)。在这每种情况中,发现相同的作用_在携带聚_甘氨酸段缺失的克隆 中很好表达,如果在表达的蛋白质中存在甘氨酸则表达很差或不表达
图13显示了蛋白质的SDS-PAGE。AG287和杂交体制备和纯化菌株MC58、1000和BZ232的AG287蛋白质。它们都产生高ELISA滴 定度,且血清杀菌滴定度> 8192。由pET-24b表达的Δ G287K在ELISA和血清杀菌试验中 的滴定度极佳。也可在pET-24b中表达AG287-0RF46. 1K。还将AG287直接融合于919、953、961和0RF46. 1的符合读框的上游的序列)
AG287-919
1ATGGCTAGCCCCGATGTTAAATCGGCGGACACGCTGTCAAAACCGGCCGC
51TCCTGTTGTTGCTGAAAAAGAGACAGAGGTAAAAGAAGATGCGCCACAGG
101CAGGTTCTCAAGGACAGGGCGCGCCATCCACACAAGGCAGCCAAGATATG
151GCGGCAGTTTCGGCAGAAAATACAGGCAATGGCGGTGCGGCAACAACGGA
201CAAACCCAAAAATGAAGACGAGGGACCGCAAAATGATATGCCGCAAAATT
251CCGCCGAATCCGCAAATCAAACAGGGAACAACCAACCCGCCGATTCTTCA
301GATTCCGCCCCCGCGTCAAACCCTGCACCTGCGAATGGCGGTAGCAATTT
351TGGAAGGGTTGATTTGGCTAATGGCGTTTTGATTGATGGGCCGTCGCAAA
401ATATAACGTTGACCCACTGTAAAGGCGATTCTTGTAATGGTGATAATTTA
451TTGGATGAAGAAGCACCGTCAAAATCAGAATTTGAAAATTTAAATGAGTC
501TGAACGAATTGAGAAATATAAGAAAGATGGGAAAAGCGATAAATTTACTA
551ATTTGGTTGCGACAGCAGTTCAAGCTAATGGAACTAACAAATATGTCATC
601ATTTATAAAGACAAGTCCGCTTCATCTTCATCTGCGCGATTCAGGCGTTC
651TGCACGGTCGAGGAGGTCGCTTCCTGCCGAGATGCCGCTAATCCCCGTCA
701ATCAGGCGGATACGCTGATTGTCGATGGGGAAGCGGTCAGCCTGACGGGG
751CATTCCGGCAATATCTTCGCGCCCGAAGGGAATTACCGGTATCTGACTTA
801CGGGGCGGAAAAATTGCCCGGCGGATCGTATGCCCTCCGTGTGCAAGGCG
851AACCGGCAAAAGGCGAAATGCTTGCTGGCACGGCCGTGTACAACGGCGAA
901GTGCTGCATTTTCATACGGAAAACGGCCGTCCGTACCCGACTAGAGGCAG
951GTTTGCCGCAAAAGTCGATTTCGGCAGCAAATCTGTGGACGGCATTATCG
1001ACAGCGGCGATGATTTGCATATGGGTACGCAAAAATTCAAAGCCGCCATC
1051GATGGAAACGGCTTTAAGGGGACTTGGACGGAAAATGGCGGCGGGGATGT
1101TTCCGGAAGGTTTTACGGCCCGGCCGGCGAGGAAGTGGCGGGAAAATACA
1151GCTATCGCCCGACAGATGCGGAAAAGGGCGGATTCGGCGTGTTTGCCGGC
1201AAAAAAGAGCAGGATGGATCCGGAGGAGGAGGATGCCAAAGCAAGAGCAT
1251CCAAACCTTTCCGCAACCCGACACATCCGTCATCAACGGCCCGGACCGGC
1301CGGTCGGCATCCCCGACCCCGCCGGAACGACGGTCGGCGGCGGCGGGGCC
1351GTCTATACCGTTGTACCGCACCTGTCCCTGCCCCACTGGGCGGCGCAGGA
1401TTTCGCCAAAAGCCTGCAATCCTTCCGCCTCGGCTGCGCCAATTTGAAAA
1451ACCGCCAAGGCTGGCAGGATGTGTGCGCCCAAGCCTTTCAAACCCCCGTC
1501CATTCCTTTCAGGCAAAACAGTTTTTTGAACGCTATTTCACGCCGTGGCA
1551GGTTGCAGGCAACGGAAGCCTTGCCGGTACGGTTACCGGCTATTACGAGC
1601CGGTGCTGAAGGGCGACGACAGGCGGACGGCACAAGCCCGCTTCCCGATT
1651TACGGTATTCCCGACGATTTTATCTCCGTCCCCCTGCCTGCCGGTTTGCG
1701GAGCGGAAAAGCCCTTGTCCGCATCAGGCAGACGGGAAAAAACAGCGGCA
1751CAATCGACAATACCGGCGGCACACATACCGCCGACCTCTCCCGATTCCCC
1801ATCACCGCGCGCACAACGGCAATCAAAGGCAGGTTTGAAGGAAGCCGCTT
1851CCTCCCCTACCACACGCGCAACCAAATCAACGGCGGCGCGCTTGACGGCA
1901AAGCCCCGATACTCGGTTACGCCGAAGACCCCGTCGAACTTTTTTTTATG
1951CACATCCAAGGCTCGGGCCGTCTGAAAACCCCGTCCGGCAAATACATCCG
2001CATCGGCTATGCCGACAAAAACGAACATCCCTACGTTTCCATCGGACGCT
2051ATATGGCGGACAAAGGCTACCTCAAGCTCGGGCAGACCTCGATGCAGGGC
2101ATCAAAGCCTATATGCGGCAAAATCCGCAACGCCTCGCCGAAGTTTTGGG
2151TCAAAACCCCAGCTATATCTTTTTCCGCGAGCTTGCCGGAAGCAGCAATG
2201ACGGTCCCGTCGGCGCACTGGGCACGCCGTTGATGGGGGAATATGCCGGC
2251GCAGTCGACCGGCACTACATTACCTTGGGCGCGCCCTTATTTGTCGCCAC
2301CGCCCATCCGGTTACCCGCAAAGCCCTCAACCGCCTGATTATGGCGCAGG
2351ATACCGGCAGCGCGATTAAAGGCGCGGTGCGCGTGGATTATTTTTGGGGA
2401TACGGCGACGAAGCCGGCGAACTTGCCGGCAAACAGAAAACCACGGGTTA
2451CGTCTGGCAGCTCCTACCCAACGGTATGAAGCCCGAATACCGCCCGTAAC
2501TCGAG
1MASPDVKSADTLSKPAAPVVAEKETEVKEDAPQAGSQGQGAPSTQGSQDM
51AAVSAENTGNGGAATTDKPKNEDEGPQNDMPQNSAESANQTGNNQPADSS
101DSAPASNPAPANGGSNFGRVDLANGVLIDGPSQNITLTHC腳SCNGDNL
151LDEEAPSKSEFENLNESERIEKYKKDGKSDKFTNLVATAVQANGTNKYVI 1251CGAATATCACGCCAACGCCCGTTTCGCCATCGACCATTTCAACACCAGCA
1301CCAACGTCGGCGGTTTTTACGGTCTGACCGGTTCCGTCGAGTTCGACCAA
1351GCAAAACGCGACGGTAAAATCGACATCACCATCCCCGTTGCCAACCTGCA
1401AAGCGGTTCGCAACACTTTACCGACCACCTGAAATCAGCCGACATCTTCG
1451ATGCCGCCCAATATCCGGACATCCGCTTTGTTTCCACCAAATTCAACTTC
1501AACGGCAAAAAACTGGTTTCCGTTGACGGCAACCTGACCATGCACGGCAA
1551AACCGCCCCCGTCAAACTCAAAGCCGAAAAATTCAACTGCTACCAAAGCC
1601CGATGGCGAAAACCGAAGTTTGCGGCGGCGACTTCAGCACCACCATCGAC
1651CGCACCAAATGGGGCGTGGACTACCTCGTTAACGTTGGTATGACCAAAAG
1701CGTCCGCATCGACATCCAAATCGAGGCAGCCAAACAATAACTCGAG
1MASPDVKSADTLSKPAAPVVAEKETEVKEDAPQAGSQGQGAPSTQGSQDM
51AAVSAENTGNGGAATTDKPKNEDEGPQNDMPQNSAESANQTGNNQPADSS
101DSAPASNPAPANGGSNFGRVDLANGVLIDGPSQNITLTHC腳SCNGDNL
151LDEEAPSKSEFENLNESERIEKYKKDGKSDKFTNLVATAVQANGTNKYVI
201IYKDKSASSSSARFRRSARSRRSLPAEMPLIPVNQADTLIVDGEAVSLTG
251HSGNIFAPEGNYRYLTYGAEKLPGGSYALRVQGEPAKGEMLAGTAVYNGE
301VLHFHTENGRPYPTRGRFAAKVDFGSKSVDGIIDSGDDLHMGTQKFKAAI
351DGNGFKGTffTENGGGDVSGRFYGPAGEEVAGKYSYRPTDAEKGGFGVFAG
401KKEQDGSGGGGATYKVDEYHANARFAIDHFNTSTNVGGFYGLTGSVEFDQ
451AKRDGKIDITIPVANLQSGSQHFTDHLKSADIFDAAQYPDIRFVSTKFNF
501NGKKLVSVDGNLTMHGKTAPVKLKAEKFNCYQSPMAKTEVCGGDFSTTID
551RTKffGVDYLVNVGMTKSVRIDIQIEAAKQ*
AG287-961
1ATGGCTAGCCCCGATGTTAAATCGGCGGACACGCTGTCAAAACCGGCCGC
51TCCTGTTGTTGCTGAAAAAGAGACAGAGGTAAAAGAAGATGCGCCACAGG
101CAGGTTCTCAAGGACAGGGCGCGCCATCCACACAAGGCAGCCAAGATATG
151GCGGCAGTTTCGGCAGAAAATACAGGCAATGGCGGTGCGGCAACAACGGA
201CAAACCCAAAAATGAAGACGAGGGACCGCAAAATGATATGCCGCAAAATT
251CCGCCGAATCCGCAAATCAAACAGGGAACAACCAACCCGCCGATTCTTCA
301GATTCCGCCCCCGCGTCAAACCCTGCACCTGCGAATGGCGGTAGCAATTT
351TGGAAGGGTTGATTTGGCTAATGGCGTTTTGATTGATGGGCCGTCGCAAA
401ATATAACGTTGACCCACTGTAAAGGCGATTCTTGTAATGGTGATAATTTA
451TGGAATGAAGAAGCACCGTCAAAATCAGAATTTGAAAATTTAAATGAGTC
501TGAACGAATTGAGAAATATAAGAAAGATGGGAAAAGCGATAAATTTACTA
551ATTTGGTTGCGACAGCCAGTCAAGCTAATGGAACTAACAAATATGTCATC
601ATTTATAAAGACAAGTCCGCTTCATCTTCATCTGCGCGATTCAGGCGTTC
651TGCACGGTCGAGGAGGTCGCTTCCTGCCGAGATGCCGCTAATCCCCGTCA
701ATCAGGCGGATACGCTGATTGTCGATGGGGAAGCGGTCAGCCTGACGGGG
751CATTCCGGCAATATCTTCGCGCCCGAAGGGAATTACCGGTATCTGACTTA0666]8010667]8510668]9010669]9510670]10010671]10510672]11010673]11510674]12010675]12510676]13010677]13510678]14010679]14510680]15010681]15510682]16010683]16510684]17010685]17510686]18010687]18510688]19010689]19510690]20010691]20510692]21010693]21510694]22010695]22510696]23010697]23510698]10699]510700]1010701]1510702]2010703]2510704]301
CGGGGCGGAA AACCGGCAAA GTGCTGCATT GTTTGCCGCA ACAGCGGCGA GATGGAAACG TTCCGGAAGG GCTATCGCCC AAAAAAGAGC TGTTAAAAAA AAGAAATCAA GACGGCACAA CGACTTTAAA CCGTCAATGA TCTGAAATAG
TGGGAGAAAA AAAATTGATG CGAAGCATTC CAGACGAAGC ACCAAACAAA CAAAGCCGAA AAGCTGTCGC AAAGATAATA AGAGTCTGAC AAAAATTGGA GATACTCGCC AACCCGCCAA CTTACAACGT TCCGAATCGG TGCCGCCAAA CCTACCATGT MASPDVKSAD AAVSAENTGN DSAPASNPAP LDEEAPSKSE IYKDKSASSS HSGNIFAPEG VLHFHTENGR
AAATTGCCCG AGGCGAAATG TTCATACGGA AAAGTCGATT TGATTTGCAT GVTTTAAGGG TTTTACGGCC GACAGATGCG AGGATGGATC GCTGCCACTG CGGTTTCAAA TTACCAAAAA GGTCTGGGTC AAACAAACAA AAAAGTTAAC
TATAACGACA AAAAATTAGA AACGATATCG CGTCAAAACC ACGTCGATGC GCTGCCGCTG TGCAAAAGTT TTGCTAAAAA AGCAAATTTG CACACGCTTG TGAACGGTTT GGCCTTGCAG GGGTCGGTTC CAGTCGCCAT GCAGGCGTGG CGGCGTCAAT TLSKPAAPVV GGAATTDKPK ANGGSNFGRV FENLNESERI SARFRRSARS NYRYLTYGAE PYPTRGRFAA
GCGGATCGTA CTTGCTGGCA AAACGGCCGT TCGGCAGCAA ATGGGTACGC GACTTGGACG CGGCCGGCGA GAAAAGGGCG CGGAGGAGGA TGGCCATTGC GCTGGAGAGA AGACGCAACT TGAAAAAAGT AACGTCGATG AACCAAGTTA
TTTGCTGAAG AGCCGTGGCT CCGATTCATT GCCAATGAAG CAAAGTAAAA GCACAGCTAA ACCGACATCA AGCAAACAGT TCAGAATTGA GCTTCTGCTG GGATAAAACA AACAAGCCGC AATGTAACGG CGGTACCGGC CAGTCGGCAC TACGAGTGGT AEKETEVKED NEDEGPQNDM DLANGVLIDG EKYKKDGKSD RRSLPAEMPL KLPGGSYALR KVDFGSKSVD
TGCCCTCCGT CGGCCGTGTA CCGTACCCGA ATCTGTGGAC AAAAATTCAA GAAAATGGCG GGAAGTGGCG GATTCGGCGT GGAGCCACAA TGCTGCCTAC CCATCTACGA GCAGCCGATG CGTGACTAAC CCAAAGTAAA GCAGACACTG
AGACTAAGAC
GATACCGTCG
GGATGAAACC
CCAAACAGAC
GCTGCAGAAA
TACTGCAGCC
AAGCTGATAT
GCCGACGTGT
TGGTCTGAAC
AAAAATCCAT
GTGTCAGACC
GCTCTCCGGT
CTGCAGTCGG
TTCCGCTTTA
TTCGTCCGGT
AACTCGAG
APQAGSQGQG
PQNSAESANQ
PSQNITLTHC
KFTNLVATAV
IPVNQADTLI
VQGEPAKGEM
GIIDSGDDLH
GTGCAAGGCG CAACGGCGAA CTAGAGGCAG GGCATTATCG AGCCGCCATC GCGGGGATGT GGAAAATACA GTTTGCCGGC ACGACGACGA AACAATGGCC CATTGATGAA TTGAAGCCGA CTGACCAAAA AGCTGCAGAA ATGCCGCTTT
AAATATCGTA ACAAGCATGC AACACTAAGG GGCCGAAGAA CTGCAGCAGG GACAAGGCCG CGCTACGAAC ACACCAGAGA GCTACTACCG TGCCGATCAC TGCGCAAAGA CTGTTCCAAC CGGCTACAAA CCGAAAACTT TCTTCCGCAG
APSTQGSQDM TGNNQPADSS 腳SCNGDNL QANGTNKYVI VDGEAVSLTG LAGTAVYNGE MGTQKFKAAI
AGCAGATACT GATGCCGCTC TGGATGCAAC CACCAACGCC TTGAATAAAT
351DGNGFKGTffTENGGGDVSGR
401KKEQDGSGGGGATNDDDVKK
451DGTITKKDATAADVEADDFK
501SEIEKLTTKLADTDAALADT
551KIDEKLEAVADTVDKHAEAF
601TKQNVDAKVKAAETAAGKAE
651KDNIAKKANSADVYTREESD
701DTRLNGLDKTVSDLRKETRQ
751SESAVAIGTGFRFTENFAAK
FYGPAGEEVAGKYSYRPTDAEKGGFGVFAGAATVAIAAAYNNGQEINGFKAGETIYDIDEGLGLKKVVTNLTKTVNENKQNVDAKVKAAEDAALDATTNALNKLGENITTFAEETKTNIVNDIADSLDETNTKADEAVKTANEAKQTAEEAAAGTANTAADKAEAVAAKVTDIKADIATNSKFVRIDGLNATTEKLDTRLASAEKSIADHGLAEQALLSGLFQPYNVGRFNVTAAVGGYKAGVAVGTSSGSSAAYHVGVNYEff* 将抗体针对杂交蛋白产生的杀菌效力(同源菌株)与针对919和0RF46. 1的组分 抗原(使用287-GST)的简单化合物产生的抗体相比 还获得了针对异源MenB菌株和血清型A和C的杀菌活性的数据 因此,在与AG287(在N-未端)的杂交蛋白质比简单的与AG287_0RF46. 1的混 合物在免疫学上更优良,针对异源菌株尤其有效。也可在pET-24b中表达AG287-0RF46. 1。用新西兰菌株394/98而非2996制备相同的杂交蛋白AG287NZ-9191 ATGGCTAGCC CCGATGTCAA GTCGGCGGAC ACGCTGTCAA AACCTGCCGC51 CCCTGTTGTT TCTGAAAAAG AGACAGAGGC AAAGGAAGAT GCGCCACAGG 2051CCTACCACACGCGCAACCAAATCAACGGCGGCGCGCTTGACGGCAAAGCC
2101CCGATACTCGGTTACGCCGAAGACCCCGTCGAACTTTTTTTTATGCACAT
2151CCAAGGCTCGGGCCGTCTGAAAACCCCGTCCGGCAAATACATCCGCATCG
2201GCTATGCCGACAAAAACGAACATCCCTACGTTTCCATCGGACGCTATATG
2251GCGGACAAAGGCTACCTCAAGCTCGGGCAGACCTCGATGCAGGGCATCAA
2301AGCCTATATGCGGCAAAATCCGCAACGCCTCGCCGAAGTTTTGGGTCAAA
2351ACCCCAGCTATATCTTTTTCCGCGAGCTTGCCGGAAGCAGCAATGACGGT
2401CCCGTCGGCGCACTGGGCACGCCGTTGATGGGGGAATATGCCGGCGCAGT
2451CGACCGGCACTACATTACCTTGGGCGCGCCCTTATTTGTCGCCACCGCCC
2501ATCCGGTTACCCGCAAAGCCCTCAACCGCCTGATTATGGCGCAGGATACC
2551GGCAGCGCGATTAAAGGCGCGGTGCGCGTGGATTATTTTTGGGGATACGG
2601CGACGAAGCCGGCGAACTTGCCGGCAAACAGAAAACCACGGGTTACGTCT
2651GGCAGCTCCTACCCAACGGTATGAAGCCCGAATACCGCCCGTAAAAGCTT
1MASPDVKSADTLSKPAAPVVSEKETEAKEDAPQAGSQGQGAPSAQGGQDM
51AAVSEENTGNGGAAATDKPKNEDEGAQNDMPQNAADTDSLTPNHTPAS匪
101PAGNMENQAPDAGESEQPANQPDMANTADGMQGDDPSAGGENAGNTAAQG
151TNQAENNQTAGSQNPASSTNPSATNSGGDFGRTNVGNSVVIDGPSQNITL
201THCK⑶SCSGNNFLDEEVQLKSEFEKLSDADKISNYKKDGKNDGKNDKFV
251GLVADSVQMKGINQYIIFYKPKPTSFARFRRSARSRRSLPAEMPLIPVNQ
301ADTLIVDGEAVSLTGHSGNIFAPEGNYRYLTYGAEKLPGGSYALRVQGEP
351SKGEMLAGTAVYNGEVLHFHTENGRPSPSRGRFAAKVDFGSKSVDGIIDS
401GDGLHMGTQKFKAAIDGNGFKGTffTENGGGDVSGKFYGPAGEEVAGKYSY
451RPTDAEKGGFGVFAGKKEQDGSGGGGCQSKSIQTFPQPDTSVINGPDRPV
501GIPDPAGTTVGGGGAVYTVVPHLSLPHWAAQDFAKSLQSFRLGCANLKNR
551QGffQDVCAQAFQTPVHSFQAKQFFERYFTPWQVAGNGSLAGTVTGYYEPV
601LK⑶DRRTAQARFPIYGIPDDFISVPLPAGLRSGKALVRIRQTGKNSGTI
651DNTGGTHTADLSRFPITARTTAIKGRFEGSRFLPYHTRNQINGGALDGKA
701PILGYAEDPVELFFMHIQGSGRLKTPSGKYIRIGYADKNEHPYVSIGRYM
751ADKGYLKLGQTSMQGIKAYMRQNPQRLAEVLGQNPSYIFFRELAGSSNDG
801PVGALGTPLMGEYAGAVDRHYITLGAPLFVATAHPVTRKALNRLIMAQDT
851GSAIKGAVRVDYFffGYGDEAGELAGKQKTTGYVffQLLPNGMKPEYRP*
AG287NZ-953
1ATGGCTAGCCCCGATGTCAAGTCGGCGGACACGCTGTCAAAACCTGCCGC
51CCCTGTTGTTTCTGAAAAAGAGACAGAGGCAAAGGAAGATGCGCCACAGG
101CAGGTTCTCAAGGACAGGGCGCGCCATCCGCACAAGGCGGTCAAGATATG
151GCGGCGGTTTCGGAAGAAAATACAGGCAATGGCGGTGCGGCAGCAACGGA
201CAAACCCAAAAATGAAGACGAGGGGGCGCAAAATGATATGCCGCAAAATG
251CCGCCGATACAGATAGTTTGACACCGAATCACACCCCGGCTTCGAATATG
301CCGGCCGGAAATATGGAAAACCAAGCACCGGATGCCGGGGAATCGGAGCA
1601TTAAAGGTCTGGGTCTGAAA
1651AATGAAAACAAACAAAACGT
1701AATAGAAAAGTTAACAACCA
1751ATACTGATGCCGCTCTGGAT
1801GAAAATATAACGACATTTGC
1851TGATGAAAAATTAGAAGCCG
1901CATTCAACGATATCGCCGAT
1951GAAGACGTCAAAACCGCCAA
2001ACAAAACGTCGATGCCAAAG
2051CCGAAGCTGCCGCTGGCACA
2101GTCGCTGCAAAAGTTACCGA
2151TAATATTGCTAAAAAAGCAA
2201CTGACAGCAAATTTGTCAGA
2251TTGGACACACGCTTGGCTTC
2301TCGCCTGAACGGTTTGGATA
2351GCCAAGGCCTTGCAGAACAA
2401AACGTGGGTCGGTTCAATGT
2451ATCGGCAGTCGCCATCGGTA
2501CCAAAGCAGGCGTGGCAGTC
2551CATGTCGGCGTCAATTACGA
1MASPDVKSADTLSKPAAPVV
51AAVSEENTGNGGAAATDKPK
101PAGNMENQAPDAGESEQPAN
151TNQAENNQTAGSQNPASSTN
201THCK⑶SCSGNNFLDEEVQL
251GLVADSVQMKGINQYIIFYK
301ADTLIVDGEAVSLTGHSGNI
351SKGEMLAGTAVYNGEVLHFH
401GDGLHMGTQKFKAAIDGNGF
451RPTDAEKGGFGVFAGKKEQD
501INGFKAGETIYDIDEDGTIT
551NENKQNVDAKVKAAESEIEK
601ENIITFAEETKTNIVKIDEK
651EAVKTANEAKQTAEETKQNV
701VAAKVTDIKADIATNKDNIA
751LDTRLASAEKSIADHDTRLN
801NVGRFNVTAAVGGYKSESAV
851HVGVNYEff *
AG983和杂交体
AAAGTCGTGA CTAACCTGAC CAAAACCGTC CGATGCCAAA GTAAAAGCTG CAGAATCTGA AGTTAGCAGA CACTGATGCC GCTTTAGCAG GCAACCACCA ACGCCTTGAA TAAATTGGGA TGAAGAGACT AAGACAAATA TCGTAAAAAT TGGCTGATAC CGTCGACAAG CATGCCGAAG TCATTGGATG AAACCAACAC TAAGGCAGAC TGAAGCCAAA CAGACGGCCG AAGAAACCAA TAAAAGCTGC AGAAACTGCA GCAGGCAAAG GCTAATACTG CAGCCGACAA GGCCGAAGCT CATCAAAGCT GATATCGCTA CGAACAAAGA ACAGTGCCGA CGTGTACACC AGAGAAGAGT ATTGATGGTC TGAACGCTAC TACCGAAAAA TGCTGAAAAA TCCATTGCCG ATCACGATAC AAACAGTGTC AGACCTGCGC AAAGAAACCC GCCGCGCTCT CCGGTCTGTT CCAACCTTAC AACGGCTGCA GTCGGCGGCT ACAAATCCGA CCGGCTTCCG CTTTACCGAA AACTTTGCCG GGCACTTCGT CCGGTTCTTC CGCAGCCTAC GTGGTAAAAG CTT
SEKETEAKED APQAGSQGQG APSAQGGQDM NEDEGAQNDM PQNAADTDSL TPNHTPAS匪 QPDMANTADG MQGDDPSAGG ENAGNTAAQG PSATNSGGDF GRTNVGNSVV IDGPSQNITL KSEFEKLSDA DKISNYKKDG KNDGKNDKFV PKPTSFARFR RSARSRRSLP AEMPLIPVNQ FAPEGNYRYL TYGAEKLPGG SYALRVQGEP TENGRPSPSR GRFAAKVDFG SKSVDGIIDS KGTffTENGGG DVSGKFYGPA GEEVAGKYSY GSGGGGATND DDVKKAATVA IAAAYNNGQE KKDATAADVE ADDFKDLGLK KVVTNLTKTV LTTKLADTDA ALADTDAALD ATTNALNKLG LEAVADTVDK HAEAFNDIAD SLDETNTKAD DAKVKAAETA AGKAEAAAGT ANTAADKAEA KKANSADVYT REESDSKFVR IDGLNATTEK GLDKTVSDLR KETRQGLAEQ AALSGLFQPY AIGTGFRFTE NFAAKAGVAV GTSSGSSAAY
测定了针对各种菌株(包括同源2996菌株)应答Δ G983 (His-融合体)产生的 杀菌滴定度 AG983还可以与0RF46. 1、741、961或961c (在其C-未端)杂交的杂交体表达A G983-0RF46. 11ATGACTTCTGCGCCCGACTTCAATGCAGGCGGTACCGGTATCGGCAGCAA
51CAGCAGAGCAACAACAGCGAAATCAGCAGCAGTATCTTACGCCGGTATCA
101AGAACGAAATGTGCAAAGACAGAAGCATGCTCTGTGCCGGTCGGGATGAC
151GTTGCGGTTACAGACAGGGATGCCAAAATCAATGCCCCCCCCCCGAATCT
201GCATACCGGAGACTTTCCAAACCCAAATGACGCATTCAAGAATTTGATCA
251ACCTCAAACCTGCAATTGAAGCAGGCTATACAGGACGCGGGGTAGAGGTA
301GGTATCGTCGACACAGGCGAATCCGTCGGCAGCATATCCTTTCCCGAACT
351GTATGGCAGAAAAGAACACGGCTATAACGAAAATTACAAAAACTATACGG
401CGTATATGCGGAAGGAAGCGCCTGAAGACGGAGGCGGTAAAGACATTGAA
451GCTTCTTTCGACGATGAGGCCGTTATAGAGACTGAAGCAAAGCCGACGGA
501TATCCGCCACGTAAAAGAAATCGGACACATCGATTTGGTCTCCCATATTA
551TTGGCGGGCGTTCCGTGGACGGCAGACCTGCAGGCGGTATTGCGCCCGAT
601GCGACGCTACACATAATGAATACGAATGATGAAACCAAGAACGAAATGAT
651GGTTGCAGCCATCCGCAATGCATGGGTCAAGCTGGGCGAACGTGGCGTGC
701GCATCGTCAATAACAGTTTTGGAACAACATCGAGGGCAGGCACTGCCGAC
751CTTTTCCAAATAGCCAATTCGGAGGAGCAGTACCGCCAAGCGTTGCTCGA
801CTATTCCGGCGGTGATAAAACAGACGAGGGTATCCGCCTGATGCAACAGA
851GCGATTACGGCAACCTGTCCTACCACATCCGTAATAAAAACATGCTTTTC
901ATCTTTTCGACAGGCAATGACGCACAAGCTCAGCCCAACACATATGCCCT
951ATTGCCATTTTATGAAAAAGACGCTCAAAAAGGCATTATCACAGTCGCAG
1001GCGTAGACCGCAGTGGAGAAAAGTTCAAACGGGAAATGTATGGAGAACCG
1051GGTACAGAACCGCTTGAGTATGGCTCCAACCATTGCGGAATTACTGCCAT
1101GTGGTGCCTGTCGGCACCCTATGAAGCAAGCGTCCGTTTCACCCGTACAA
1151ACCCGATTCAAATTGCCGGAACATCCTTTTCCGCACCCATCGTAACCGGC
1201ACGGCGGCTCTGCTGCTGCAGAAATACCCGTGGATGAGCAACGACAACCT
1251GCGTACCACGTTGCTGACGACGGCTCAGGACATCGGTGCAGTCGGCGTGG
1301ACAGCAAGTTCGGCTGGGGACTGCTGGATGCGGGTAAGGCCATGAACGGA
1351CCCGCGTCCTTTCCGTTCGGCGACTTTACCGCCGATACGAAAGGTACATC
1401CGATATTGCCTACTCCTTCCGTAACGACATTTCAGGCACGGGCGGCCTGA
1451TCAAAAAAGGCGGCAGCCAACTGCAACTGCACGGCAACAACACCTATACG
1501
1551
1601
1651
1701
1751
1801
1851
1901
1951
2001
2051
2101
2151
2201
2251
2301
2351
2401
2451
2501
2551
2601
2651
2701
2751
2801
2851
2901
2951
3001
3051
3101
3151
3201
3251
3301
3351
3401
GGCAAAACCA ATCGGATATG CATCCGGCGG GACCAATCCG GGACGGCAAA ACGGTACGGC GGGGCAGGCT CGCCAAAATC GCGGCCTGCT GGCGACACGC TTCGGCAGCG AGGGCGGCAG TCATCCGCAA TATGCCGGGC TACAGCATGC GCTACCGTCT CCGCCTGAAA GCGTCATCGC GTTGAAGGCA AACCGGCGAA CATGGAGCGA GCAGGCATAC CTCCTACGGA AACATGCGGA GGCGGTGTCA CGGTCTGCGC GTGCTTTGGG CTCGCGGGTC TCCAACGGCG CGGGCGGCTT AATATGCCGC CGGCAACGGC AGTACGGCAA GGTGGCGGAG GCAGGTTCTC TCGGCAGCAG AAAATACAAA TAAAGGAAAT TCCATTCCCC
TTATCGAAGG CGCGTCGAAA CAGCCTGAAC GCGCAAACGA GGTACGCTGT GATTATCGGC ATCTCAACAG GGGCAGGATT GGCTTCCCTC TGTCCTATTA GCACATTCCT CAATCTGGAA CACCCGAGAC ATCCGCCCCT GAATGCCGCC ATGCCGACAG GCCGTATCGG GCAAACCCAA AAATGCGCGG AATACGACAG AAACAGTGCA GGCACGATGC CGCTACAAAA AGGCAGCGTC ACGTTCCGTT TACGACCTGC CTGGAGCGGC TGAAGCTGTC GGCGTGGAAC TACCGGCGCG ACACCCGTCT TGGAACGGCT CCACAGCGGA GCACTGGATC GACCGTCAGC GGGGGAACTT GCCATCAGTT ATCGGCTACA CTTCGACAAC
CGGTTCGCTG CCAAAGGTGC AGCGACGGCA AACGGTACAC ACACACGTTT GGCAAGCTGT TACCGGACGA ATTCTTTCTT GACAGCGTCG TGTCCGTCGC CGCCCGCCGG AACCTGATGG GGTTGAAACT ACGGCGCAAC GACGGTGTAC TACCGCCGCC ACGGGTTGGA CAGGACGGTG CAGTACCCAA CAGCCGCCAC AATGCAAAAA GGGCGATATC ACAGCATCAG AACGGCACGC TGCCGCAACG TCAAACAGGA AACAGCCTCA GCAACCCTTG GCGACCTGAA ACTGCAGCAA GGTTGCCGGC TGGCACGTTA CGAGTCGGCG CTCAGATTTG ATTTCGAACC GCCGAGCGCA GGGCAACCTG TTGTCCGCTT CATGCCTCAC
GTGTTGTACG GCTGATTTAT TTGTCTATCT ATCAAAGGCA GGGCAAACTG ACATGTCGGC CGTGTTCCCT CACAAACATC AAAAAACAGC GGCAATGCGG TCTGAAACAC TCGAACTGGA GCGGCAGCCG TTTCCGCGCA GCATCTTCAA CATGCCGATA CCACAACGGC GAACGTGGGA ACCGTCGGCA ACTGGGCTTG CCAACAGCAT GGCTATCTCA CCGCAGCACC TGATGCAGCT GGAGATTTGA TGCATTCGCC CTGAAGGCAC AGCGATAAAG CGGACGCGAC CCGGCAAGAC CTGGGCGCGG CAGCTACGCC TAGGCTACCG GCAAACGATT CGACGGGAAA GCGGCCATAT ATGATTCAAC TTCCGATCAC ATTCCGATTC
GCAACAACAA AACGGGGCGG GGCAGATACC GTCTGCAGCT CTGAAAGTGG ACGCGGCAAG TCCTGAGTGC GAAACCGACG GGGCAGTGAA CACGGACTGC GCCGTAGAAC TGCCTCCGAA ACCGCACAGA GCGGCAGCCG CAGTCTCGCC TGCAGGGACG ACGGGTCTGC ACAGGGCGGT TTGCCGCGAA GGACGCAGCA TAGTCTGTTT AAGGCCTGTT GGTGCGGACG GGGCGCACTG CGGTCGAAGG GAAAAAGGCA GCTGGTCGGA CCGTCCTGTT TACACGGTAA GGGGGCACGC ATGTCGAATT GGTTCCAAAC GTTCCTCGAC CTTTTATCCG TACCACCTAT CGGATTGGGA AGGCGGCCAT GGGCACGAAG TGATGAAGCC0993]35010994]35510995]36010996]36510997]37010998]37510999]38011000]38511001]39011002]39511003]40011004]40511005]41011006]41511007]42011008]42511009]43011010]43511011]44011012]11013]511014]1011015]1511016]2011017]2511018]3011019]3511020]4011021]4511022]5011023]5511024]6011025]6511026]7011027]7511028]8011029]8511030]901
GGTAGTCCCG CGAACACCAT CCGCTCCCAA GCCCAAAATA GCTTGCCGAC GCGACGGATT GGCAATGCCG CATCGGCGCG TAAGCGAAGG ACCGAAAACA CAAAGACTAT ATGCCGCACA CCCATCAAAC CACGGCACAT AAGGGAAATC TACCCGTCCC TTACGGCAAA AAAATGTCAA GACGGTAAAG CGAGCACCAC MTSAPDFNAG 丨 VAVTDRDAKI ] GIVDTGESVG ! ASFDDEAVIE ‘ ATLHIMNTND ] LFQIANSEEQ ‘ IFSTGNDAQA ι GTEPLEYGSN ] TAALLLQKYP 1 PASFPFGDFT , GKTIIEGGSL ‘ DQSGANETVH GAGYLNSTGR GDTLSYYVRR 丨 SSATPETVET , ATVYADSTAA ] VEGKMRGSTQ ‘ AGIRHDAGDI ι GGVNVPFAAT 丨
i TTGACGGATT ’ CCCGCCGACG t AGGCGCGAGG t TCCGCCTCAA CGTTTCCACA ’ CAAACGCGCC i CCGAAGCCTT i GCAGGAGAAA i CTCAAACATT t AGATGGCGCG ’ GCCGCAGCAG t AGGCATAGAA GGATTGGAGC ’ CCTATCAAGC CGCCGTCAGC CTTACCATTC t GAAAACATCA t ACTGGCAGAC i GGTTTCCGAA CACCACCACC GTGIGSNSRA ‘ NAPPPNLHTG ] SISFPELYGR ] TEAKPTDIRH ‘ ETKNEMMVAA YRQALLDYSG 丨 QPNTYALLPF ‘ HCGITAMWCL ! WMSNDNLRTT ADTKGTSDIA ‘ VLYGNNKSDM IKGSLQLDGK 丨 RVPFLSAAKI 丨 GNAARTASAA , AAADRTIMPG HADMQGRRLK 」 TVGIAAKTGE ] GYLKGLFSYG ⑶LTVEGGLR ‘
’ TAGCCTTTAC i GCTATGACGG i GATATATACA t CCTGACCGAC t ATGCCGGTAG ACCCGATACA ’ CAACGGCACT t TTGTCGGCGC ’ GCTGTCATGC i CATCAACGAT i CCATCCGCGA t GCCGTCAGCA TGTTCGGGGA GGTCGCAGAT GACAATTTTG CCGAAATATC t CCTCCTCAAC CAACGCCACC t TTTTGAGAAG ACTGA TTAKSAAVSY , DFPNPNDAYK ] KEHGYNENYK ] VKEIGHIDLV ! IRNAffVKLGE GDKTDEGIRL 1 YEKDAQKGII ‘ SAPYEASVRF ‘ LLTTAQDIGA ‘ YSFRNDISGT 丨 RVETKGALIY ] GTLYTRLGKL GQDYSFFTNI ] AHSAPAGLKH 」 IRPYGATERA 」 AVSDSLDHNG ‘ NTTAAATLGM 丨 RYKNSISRST ι YDLLKQDAFA ]CGCATCCATT i GCCACAGGGC t GCTACGACAT AACCGCAGCA i TATGCTGACG t GCCCCGAGCT ’ GCAGATATCG AGGCGATGCC ACGGCTTGGG ’ TTGGCAGATA t TTGGGCAGTC t ATATCTTTAT t AAATACGGCT ’ GGGCGCGATC i CCGATGCGGC CGTTCAAACT CGTGCCGCCG CGAAGACAGG i CACGTGAAAT
AGIKNEMCKD NLINLKPAIE , NYTAYMRKEA ] SHIIGGRSVD ι RGVRIVNNSF 丨 MQQSDYDNLS ‘ TVAGVDRSGE ] TRTNPIQIAG ‘ VGVDSKFGffG GGLIKKGGSQ NGAASGGSLN ! LKVDGTAIIG ι ETDGGLLASL ] AVEQGGSNLE ] AAAVQHANAA ] TGLRVIAQTQ ι GRSTffSENSA ] GADRHARGSV ] EKGSALGffSG ]
’ GGGACGGATA GGCGGCTATC ’ AAAAGGCGTT t CCGGACAACG i CAAGGAGTAG ’ GGACAGATCG i TTAAAAACAT GTGCAGGGCA i TCTGCTTTCC t TGGCGCAACT CAAAACCCCA ’ GGCAGCCATC ’ TGGGCGGCAT GCATTGCCGA ATACGCCAAA ’ TGGAGCAGCG i TCAAACGGCA i CGTACCGTTT ’ ATGATACGCT
RSMLCAGRDD AGYTGRGVEV PEDGGGKDIE GRPAGGIAPD GTTSRAGTAD YHIRNK 匪 LF KFKREMYGEP TSFSAPIVTG LLDAGKAMNG LQLHGNNTYT SDGIVYLADT GKLYMSARGK DSVEKTAGSE NLMVELDASE DGVRIFNSLA QDGGTffEQGG NAKTDSISLF NGTLMQLGAL NSLTEGTLVG[103 1] 9 5 lLAGLKLSQPL SDKAVLFATA GVERDLNGRD YTVTGGFTGA TAATGKTGAR[1032] 100 l NMPHTPLVAG LGADVEFGND WNGLARYSYA GSKQYGNHSG RVGVGYRFLD[1033] 105 l GGGGTGSSDL ANDSFIRQVL DRQHFEPDGK YHLFGSRGEL AERSGHIGLG[1034] 110 l KIQSHQLGNL MIQQAAIKGN IGYIVRFSDH GHEVHSPFDN HASHSDSDEA[1035] l 15l GSPVDGFSLY R工HwDGYEHH PADGYDGPQG GGYPAPKGAR DIYSYDIKGV[1036] 120l AQNIRLNLTD NRSTGQRLAD RFHNAGSMLT QGVGDGFKRA/RYSPELDRS[1037] 125l GNAAEAFNG/ADIVKNIIGA AGEIVGAGDA VQGISEGSNI AVMHGLGLLS[1038] 130l TENKMARIND LADMAQLKDY AAAAIRDwAV QNPNAAQGIE AVSNIFMAA工[1039] 135l PIKGIGAVRG KYGLGGITAH PIKRSQMGAI ALPKGKSAVS DNFADAAYAK[1040] 140 l YPSPYHSRNI RSNLEQRYGK ENITSSTVPP SNGKNVRLAD QRHPKTGVPF[1041] 145 l DGKGFPNFEK HVKYDTLEHH HHHH*[1042] A G983—74l[1043] lATGACTTCTG CGCCCGACTT CAATGCAGGC GGTACCGGTA TCGGCAGCAA[1044] 5 lCAGCAGAGCA ACAACAGCGA AATCAGCAGC AGTATCTTAC GCCGGTATCA[1045] 1 0 l AGAACGAAAT GTGCAAAGAC AGAAGCATGC TCTGTGCCGG TCGGGATGAC[1046] l 5 l GTTGCGGTTA CAGACAGGGA TGCCAAAATC AATGCCCCCC CCCCGAATCT[1047] 20 l GCATACCGGA GACTTTCCAA ACCCAAATGA CGCATACAAG AATTTGATCA[1048] 2 5 l ACCTCAAACC TGCAATTGAA GCAGGCTATA CAGGACGCGG GGTAGAGGTA[1049] 30 l GGTATCGTCG ACACAGGCGA ATCCGTCGGC AGCATATCCT TTCCCGAACT[1050] 3 5 l GTATGGCAGA AAAGAACACG GCTATAACGA AAATTACAAA AACTATACGG[105 1] 40 l CGTATATGCG GAAGGAAGCG CCTGAAGACG GAGGCGGTAA AGACATTGAA[1052] 45 l GCTTCTTTCG ACGATGAGGC CGTTATAGAG ACTGAAGCAA AGCCGACGGA[1053] 50 l TATCCGCCAC GTAAAAGAAA TCGGACACAT CGATTTGGTC TCCCATATTA[1054] 5 5 l TTGGCGGGCG TTCCGTGGAC GGCAGACCTG CAGGCGGTAT TGCGCCCGAT[1055] 60 l GCGACGCTAC ACATAATGAA TACGAATGAT GAAACCAAGA ACGAAATGAT[1056] 65 l GGTTGCAGCC ATCCGCAATG CATGGGTCAA GCTGGGCGAA CGTGGCGTGC[1057] 70 l GCATGCTCAA TAACAGTTTT GGAACAACAT CGAGGGCAGG CACTGCCGAC[1058] 7 5 l CTTTTCCAAA TAGCCAATTC GGAGGAGCAG TACCGCCAAG CGTTGCTCGA[1059] 80 l CTATTCCGGC GGTGATAAAA CAGACGAGGG TATCCGCCTG ATGCAACAGA[1060] 8 5 l GCGATTACGG CAACCTGTCC TACCACATCC GTAATAAAAA CATGCTTTTC[1061] 90 l ATCTTTTCGA CAGGCAATGA CGCACAAGCT CAGCCCAACA CATATGCCCT[1062] 95 l ATTGCCATTT TATGAAAAAG ACGCTCAAAA AGGCATTATC ACACTCGCAG[1063] 100 l GCGTAGACCG CAGTGGAGAA AAGTTCAAAC GGGAAATGTA TGGAGAACCG[1064] 1 0 5 l GGTACAGAAC CGCTTGAGTA TGGCTCCAAC CATTGCGGAA TTACTGCCAT[1065] 110 l GTGGTGCCTG TCGGCACCCT ATGAAGCAAG CGTCCGTTTC ACCCGTACAA[1066] 11 5 l ACCCGATTCA AATTGCCGGA ACATCCTTTT CCGCACCCAT CGTAACCGGC[1067] l 20 l ACGGCGGCTC TGCTGCTGCA GAAATACCCG TGGATGAGCA ACGACAACCT[1068] l 25 l GCGTACCACG TTGCTGACGA CGGCTCAGGA CTTCGGTGCA GTCGGCGTGG[1069] l 30 l ACAGCAAGTT CGGCTGGGGA CTGCTGGATG CGGGTAAGGC CATGAACGGA[10701351CCCGCGTCCT TTCCGTTCGG CGACTTTACC GCCGATACGA AAGGTACATC[10711401CGATATTGCCTACTCCTTCCGTAACGACATTTCAGGCACGGGCGGCCTGA[10721451TCAAAAAAGGCGGCAGCCAACTGCAACTGCACGGCAACAACACCTATACG[10731501GGCAAAACCATTATCGAAGGCGGTTCGCTGGTGTTGTACGGCAACAACAA[10741551ATCGGATATGCGCGTCGAAACCAAAGGTGCGCTGATTTATAACGGGGCGG[10751601CATCCGGCCGCAGCCTGAACAGCGACGGCATTGTCTATCTGGCAGATACC[10761651GACCAATCCGGCGCAAACGAAACCGTACACATCAAAGGCAGTCTGCAGCT[10771701GGACGGCAAAGGTACGCTGTACACACGTTTGGGCAAACTGCTGAAAGTGG[10781751ACGGTACGGCGATTATCGGCGGCAAGCTGTACATGTCGGCACGCGGCAAG[10791801GGGGCAGGCTATCTCAACAGTACCGGACGACGTGTTCCCTTCCTGAGTGC[10801851CGCCAAAATCGGGCAGGATTATTCTTTCTTCACAAACATCGAAACCGACG[10811901GCGGCCTGCTGGCTTCCCTCGACAGCGTCGAAAAAACAGCGGGCAGTGAA[10821951GGCGACACGCTGTCCTATTATGTCCGTCGCGGCAATGCGGCACGGACTGC[10832001TTCGGCAGCGGCACATTCCGCGCCCGCCGGTCTGAAACACGCCGTAGAAC[10842051AGGGCGGCAGCAATCTGGAAAACCTGATGGTCGAACTGGATGCCTCCGAA[10852101TCATCCGCAACACCCGAGACGGTTGAAACTGCGGCAGCCGACCGCACAGA[10862151TATGCCGGGCATCCGCCCCTACGGCGCAACTTTCCGCGCAGCGGCAGCCG[10872201TACAGCATGCGAATGCCGCCGACGGTGTACGCATCTTCAACAGTCTCGCC[10882251GCTACCGTCTATGCCGACAGTACCGCCGCCCATGCCGATATGCAGGGACG[10892301CCGCCTGAAAGCCGTATCGGACGGGTTGGACCACAACGGCACGGGTCTGC[10902351GCGTCATCGCGCAAACCCAACAGGACGGTGGAACGTGGGAACAGGGCGGT[10912401GTTGAAGGCAAAATGCGCGGCAGTACCCAAACCGTCGGCATTGCCGCGAA[10922451AACCGGCGAAAATACGACAGCAGCCGCCACACTGGGCATGGGACGCAGCA[10932501CATGGAGCGAAAACAGTGCAAATGCAAAAACCGACAGCATTAGTCTGTTT[10942551GCAGGCATACGGCACGATGCGGGCGATATCGGCTATCTCAAAGGCCTGTT[10952601CTCCTACGGACGCTACAAAAACAGCATCAGCCGCAGCACCGGTGCGGACG[10962651AACATGCGGAAGGCAGCGTCAACGGCACGCTGATGCAGCTGGGCGCACTG[10972701GGCGGTGTCAACGTTCCGTTTGCCGCAACGGGAGATTTGACGGTCGAAGG[10982751CGGTCTGCGCTACGACCTGCTCAAACAGGATGCATTCGCCGAAAAAGGCA[10992801GTGCTTTGGGCTGGAGCGGCAACAGCCTCACTGAAGGCACGCTGGTCGGA[11002851CTCGCGGGTCTGAAGCTGTCGCAACCCTTGAGCGATAAAGCCGTCCTGTT[11012901TGCAACGGCGGGCGTGGAACGCGACCTGAACGGACGCGACTACACGGTAA[11022951CGGGCGGCTTTACCGGCGCGACTGCAGCAACCGGCAAGACGGGGGCACGC[11033001AATATGCCGCACACCCGTCTGGTTGCCGGCCTGGGCGCGGATGTCGAATT[11043051CGGCAACGGCTGGAACGGCTTGGCACGTTACAGCTACGCCGGTTCCAAAC[11053101AGTACGGCAACCACAGCGGACGAGTCGGCGTAGGCTACCGGTTCCTCGAG[11063151GGATCCGGAGGGGGTGGTGTCGCCGCCGACATCGGTGCGGGGCTTGCCGA[11073201TGCACTAACCGCACCGCTCGACCATAAAGACAAAGGTTTGCACTCTTTGA[11083251CGCTGGATCAGTCCGTCAGGAAAAACGAGAAACTGAAGCTGGCGGCACAA1109]33011110]33511111]34011112]34511113]35011114]35511115]36011116]36511117]37011118]37511119]38011120]38511121]39011122]11123]511124]1011125]1511126]2011127]2511128]3011129]3511130]4011131]4511132]5011133]5511134]6011135]6511136]7011137]7511138]8011139]8511140]9011141]9511142]10011143]10511144]11011145]11511146]12011147]1251
GGTGCGGAAA GAAGAACGAC ACGGGCAGCT AGCCATTCCG GCATTCCGGG CGGGCGAACA TATCGCGGGA CACCATAGAT AATCGCCAGA GGAAAACGCC GAAAGGCAGT CCGGCAGCGC GCCGCCAAGC MTSAPDFNAG VAVTDRDAKI GIVDTGESVG ASFDDEAVIE ATLHIMNTND LFQIANSEEQ IFSTGNDAQA GTEPLEYGSN TAALLLQKYP PASFPFGDFT GKTIIEGGSL DQSGANETVH GAGYLMSTGR GDTLSYYVRR SSATPETVET ATVYADSTAA VEGKMRGSTQ AGIRHDAGDI GGVNVPFAAT LAGLKLSQPL NMPHTRLVAG GSGGGGVAAD GAEKTYGNGD SHSALTAFQT YRGTAFGSDD GKRHAVISGS
AAACTTATGG AAGGTCAGCC CATTACCTTG CCTTAACCGC AAGATGGTTG TACATCTTTT CGGCGTTCGG TTCGCCGCCA ACTCAATGTC ATGCCGTCAT TACTCCCTCC GGAAGTGAAA AACTCGAGCA GTGIGSNSRA NAPPPNLHTG SISFPELYGR TEAKPTDIRH ETKNEMMVAA YRQALLDYSG QPNTYALLPF HCGITAMWCL WMSNDNLRTT ADTKGTSDIA VLYGNNKSDM IKGSLQLDGK RVPFLSAAKI GNAARTASAA AAADRTDMPG HADMQGRRLK TVGIAAKTGE GYLKGLFSYG GDLTVEGGLR SDKAVLFATA LGADVEFGNG IGAGLADALT SLNTGKLKND EQIQDSEHSG AGGKLTYTID VLYNQAEKGS
AAACGGTGAC GTTTCGACTT GAGAGTGGAG CTTTCAGACC CGAAACGCCA GACAAGCTTC TTCAGACGAT AGCAGGGAAA GACCTGGCCG CAGCGGTTCC GTATCTTTGG ACCGTAAACG CCACCACCAC TTAKSAAVSY DFPNPNDAYK KEHGYNENYK VKEIGHIDLV IRNAffVKLGE GDKTDEGIRL YEKDAQKGII SAPYEASVRF LLTTAQDIGA YSFRNDISGT RVETKGALIY GTLYTRLGKL GQDYSFFTNI AHSAPAGLKH IRPYGATFRA AVSDGLDHNG NTTAAATLGM RYKNSISRST YDLLKQDAFA GVERDLNGRD WNGLARYSYA APLDHKDKGL KVSRFDFIRQ KMVAKRQFRI FAAKQGNGKI YSLGIFGGKA
AGCCTCAATA
TATCCGCCAA
AGTTCCAAGT
GAGCAAATAC
GTTCAGAATC
CCGAAGGCGG
GCCGGCGGAA
CGGCAAAATC
CCGCCGATAT
GTCCTTTACA
CGGAAAAGCC
GCATACGCCA
CACCACTGA
AGIKNEMCKD
NLINLKPAIE
NYTAYMRKEA
SHIIGGRSVD
RGVRIVNNSF
MQQSDYGNLS
TVAGVDRSGE
TRTNPIQIAG
VGVDSKFGffG
GGLIKKGGSQ
NGAASGGSLN
LKVDGTAIIG
ETDGGLLASL
AVEQGGSNLE
AAAVQHANAA
TGLRVIAQTQ
GRSTffSENSA
GADRHAEGSV
EKGSALGffSG
YTVTGGFTGA
GSKQYGNHSG
QSLTLDQSVR
IEVDGQLITL
GDIAGEHTSF
EHLKSPELNV
QEVAGSAEVK
CGGGCAAATT ATCGAAGTGG ATACAAACAA AAGATTCGGA GGCGACATAG CAGGGCGACA AACTGACCTA GAACATTTGA CAAGCCGGAT ACCAAGCCGA CAGGAAGTTG TATCGGCCTT
RSMLCAGRDD AGYTGRGVEV PEDGGGKDIE GRPAGGIAPD GTTSRAGTAD YHIRNK 匪 LF KFKREMYGEP TSFSAPIVTG LLDAGKAMNG LQLHGNNTYT SDGIVYLADT GKLYMSARGK DSVEKTAGSE NLMVELDASE DGVRIFNSLA QDGGTffEQGG NAKTDSISLP NGTLMQLGAL NSLTEGTLVG TAATGKTGAR RVGVGYRFLE KNEKLKLAAQ ESGEFQVYKQ DKLPEGGRAT DLAAADIKPD TVNGIRHIGL1148]1301AAKQLEHHHHHH1149]AG983-9611150]1ATGACTTCTGCGCCCGACTTCAATGCAGGCGGTACCGGTATCGGCAGCAA1151]51CAGCAGAGCAACAACAGCGAAATCAGCAGCAGTATCTTACGCCGGTATCA1152]101AGAACGAAATGTGCAAAGACAGAAGCATGCTCTGTGCCGGTCGGGATGAC1153]151GTTGCGGTTACAGACAGGGATGCCAAAATCAATGCCCCCCCCCCGAATCT1154]201GCATACCGGAGACTTTCCAAACCCAAATGACGCATACAAGAATTTGATCA1155]251ACCTCAAACCTGCAATTGAAGCAGGCTATACAGGACGCGGGGTAGAGGTA1156]301GGTATCGTCGACACAGGCGAATCCGTCGGCAGCATATCCTTTCCCGAACT1157]351GTATGGCAGAAAAGAACACGGCTATAACGAAAATTACAAAAACTATACGG1158]401CGTATATGCGGAAGGAAGCGCCTGAAGACGGAGGCGGTAAAGACATTGAA1159]451GCTTCTTTCGACGATGAGGCCGTTATAGAGACTGAAGCAAAGCCGACGGA1160]501TATCCGCCACGTAAAAGAAATCGGACACATCGATTTGGTCTCCCATATTA1161]551TTGGCGGGCGTTCCGTGGACGGCAGACCTGCAGGCGGTATTGCGCCCGAT1162]601GCGACGCTACACATAATGAATACGAATGATGAAACCAAGAACGAAATGAT1163]651GGTTGCAGCCATCCGCAATGCATGGGTCAAGCTGGGCGAACGTGGCGTGC1164]701GCATCGTCAATAACAGTTTTGGAACAACATCGAGGGCAGGCACTGCCGAC1165]751CTTTTCCAAATAGCCAATTCGGAGGAGCAGTACCGCCAAGCGTTGCTCGA1166]801CTATTCCGGCGGTGATAAAACAGACGAGGGTATCCGCCTGATGCAACAGA1167]851GCGATTACGGCAACCTGTCCTACCACATCCGTAATAAAAACATGCTTTTC1168]901ATCTTTTCGACAGGCAATGACGCACAAGCTCAGCCCAACACATATGCCCT1169]951ATTGCCATTTTATGAAAAAGACGCTCAAAAAGGCATTATCACAGTCGCAG1170]1001GCGTAGACCGCAGTGGAGAAAAGTTCAAACGGGAAATGTATGGAGAACCG1171]1051GGTACAGAACCGCTTGAGTATGGCTCCAACCATTGCGGAATTACTGCCAT1172]1101GTGGTGCCTGTCGGCACCCTATGAAGCAAGCGTCCGTTTCACCCGTACAA1173]1151ACCCGATTCAAATTGCCGGAACATCCTTTTCCGCACCCATCGTAACCGGC1174]1201ACGGCGGCTCTGCTGCTGCAGAAATACCCGTGGATGAGCAACGACAACCT1175]1251GCGTACCACGTTGCTGACGACGGCTCAGGACATCGGTGCAGTCGGCGTGG1176]1301ACAGCAAGTTCGGCTGGGGACTGCTGGATGCGGGTAAGGCCATGAACGGA1177]1351CCCGCGTCCTTTCCGTTCGGCGACTTTACCGCCGATACGAAAGGTACATC1178]1401CGATATTGCCTACTCCTTCCGTAACGACATTTCAGGCACGGGCGGCCTGA1179]1451TCAAAAAAGGCGGCAGCCAACTGCAACTGCACGGCAACAACACCTATACG1180]1501GGCAAAACCATTATCGAAGGCGGTTCGCTGGTGTTGTACGGCAACAACAA1181]1551ATCGGATATGCGCGTCGAAACCAAAGGTGCGCTGATTTATAACGGGGCGG1182]1601CATCCGGCGGCAGCCTGAACAGCGACGGCATTGTCTATCTGGCAGATACC1183]1651GACCAATCCGGCGCAAACGAAACCGTACACATCAAAGGCAGTCTGCAGCT1184]1701GGACGGCAAAGGTACGCTGTACACACGTTTGGGCAAACTGCTGAAACTGG1185]1751ACGGTACGGCGATTATCGGCGGCAAGCTGTACATGTCGGCACGCGGCAAG1186]1801GGGGCAGGCTATCTCAACAGTACCGGACGACGTGTTCCCTTCCTGAGTGC
1226]38011227]38511228]39011229]39511230]40011231]40511232]41011233]41511234]42011235]42511236]43011237]11238]511239]1011240]1511241]2011242]2511243]3011244]3511245]4011246]4511247]5011248]5511249]6011250]6511251]7011252]7511253]8011254]8511255]9011256]9511257]10011258]10511259]11011260]11511261]12011262]12511263]13011264]1351
TGCCGCTGGC CAAAAGTTAC GCTAAAAAAG CAAATTTGTC CACGCTTGGC AACGGTTTGG CCTTGCAGAA GTCGGTTCAA GTCGCCATCG AGGCGTGGCA GCGTCAATTA MTSAPDFNAG VAVTDRDAKI GIVDTGESVG ASFDDEAVIE ATLHIMNTND LFQIANSEEQ IFSTGNDAQA GTEPLEYGSN TAALLLQKYP PASFPFGDFT GKTIIEGGSL DQSGANETVH GAGYLNSTGR GDTLSYYVRR SSATPETVET ATVYADSTAA VEGKMRGSTQ AGIRHDAGDI GGVNVPFAAT LAGLKLSQPL NMPHTRLVAG GGGGTGSATN TKKDATAADV KLTTKLADTD KLEAVADTVD VDAKVKAAET AKKANSADVY NGLDKTVSDL
ACAGCTAATA CGACATCAAA CAAACAGTGC AGAATTGATG TTCTGCTGAA ATAAAACAGT CAAGCCGCGC TGTAACGGCT GTACCGGCTT GTCGGCACTT CGAGTGGCTC GTGIGSNSRA NAPPPNLHTG SISFPELYGR TEAKPTDIRH ETKNEMMVAA YRQALLDYSG QPNTYALLPF HCGITAMWCL WMSNDNLRTT ADTKGTSDIA VLYGNNKSDM IKGSLQLDGK RVPFLSAAKI GNAARTASAA AAADRTDMPG HADMQGRRLK TVGIAAKTGE GYLKGLFSYG GDLTVEGGLR SDKAVLFATA LGADVEFGNG DDDVKKAATV EADDFKGLGL AALADTDAAL KHAEAFNDIA AAGKAEAAAG TREESDSKFV RKETRQGLAE
CTGCAGCCGA GCTGATATCG CGACGTGTAC GTCTGAACGC AAATCCATTG GTCAGACCTG TCTCCGGTCT GCAGTCGGCG CCGCTTTACC CGTCCGGTTC GAGCACCACC TTAKSAAVSY DFPNPNDAYK KEHGYNENYK VKEIGHIDLV IRNAffVKLGE GDKTDEGIRL YEKDAQKGII SAPYEASVRF LLTTAQDIGA YSFRNDISGT RVETKGALIY GTLYTRLGKL GQDYSFFTNI AHSAPAGLKH IRPYGATFRA AVSDGLDHNG NTTAAATLGM RYKNSISRST YDLLKQDAFA GVERDLNGRD WNGLARYSYA AIAAAYNNGQ KKVVTNLTKT DATTNALNKL DSLDETNTKA TANTAADKAE RIDGLNATTE QAALSGLFQP
51
CAAGGCCGAA CTACGAACAA ACCAGAGAAG TACTACCGAA CCGATCACGA CGCAAAGAAA GTTCCAACCT GCTACAAATC GAAAACTTTG TTCCGCAGCC ACCACCACCA AGIKNEMCKD NLINLKPAIE NYTAYMRKEA SHIIGGRSVD RGVRIVNNSF MQQSDYGNLS TVAGVDRSGE TRTNPIQIAG VGVDSKFGffG GGLIKKGGSQ NGAASGGSLN LKVDGTAIIG ETDGGLLASL AVEQGGSNLE AAAVQHANAA TGLRVIAQTQ GRSTffSENSA GADEHAEGSV EKGSALGffSG YTVTGGFTGA GSKQYGNHSG EINGFKAGET VNENKQNVDA GENITTFAEE DEAVKTANEA AVAAKVTDIK KLDTRLASAE YNVGRFNVTA
GCTGTCGCTG
AGATAATATT
AGTCTGACAG
AAATTGGACA
TACTCGCCTG
CCCGCCAAGG
TACAACGTGG
CGAATCGGCA
CCGCCAAAGC
TACATGTCG
CTGA
RSMLCAGRDD AGYTGRGVEV PEDGGGKDIE GRPAGGIAPD GTTSRAGTAD YHIRNK 匪 LF KFKREMYGEP TSFSAPIVTG LLDAGKAMNG LQLHGNNTYT SDGIVYLADT GKLYMSARGK DSVEKTAGSE NLMVELDASE DGVRIFNSLA QDGGTffEQGG NAKTDSISLF NGTLMQLGAL NSLTEGTLVG TAATGKTGAR RVGVGYRFLE IYDIDEDGTI KVKAAESEIE TKTNIVKIDE KQTAEETKQN ADIATNKDNI KSIADHDTRL AVGGYKSESA1265]1401VAIGTGFRFTENFAAKAGVAVGTSSGSSAAYHVGVNYEffLEHHHHHH*1266]AG983-961c1267]1ATGACTTCTGCGCCCGACTTCAATGCAGGCGGTACCGGTATCGGCAGCAA1268]51CAGCACAGCAACAACAGCGAAATCAGCAGCAGTATCTTACGCCGGTATCA1269]101AGAACGAAATGTGCAAAGACAGAAGCATGCTCTGTGCCGGTCGGGATGAC1270]151GTTGCGGTTACAGACAGGGATGCCAAAATCAATGCCCCCCCCCCGAATCT1271]201GCATACCGGAGACTTTCCAAACCCAAATGACGCATACAAGAATTTGATCA1272]251ACCTCAAACCTGCAATTGAAGCAGGCTATACAGGACGCGGGGTAGAGGTA1273]301GGTATCGTCGACACAGGCGAATCCGTCGGCAGCATATCCTTTCCCGAACT1274]351GTATGGCAGAAAAGAACACGGCTATAACGAAAATTACAAAAACTATACGG1275]401CGTATATGCGGAAGGAAGCGCCTGAAGACGGAGGCGGTAAAGACATTGAA1276]451GCTTCTTTCGACGATGAGGCCGTTATAGAGACTGAAGCAAAGCCGACGGA1277]501TATCCGCCACGTAAAAGAAATCGGACACATCGATTTGGTCTCCCATATTA1278]551TTGGCGGGCGTTCCGTGGACGGCAGACCTGCAGGCGGTATTGCGCCCGAT1279]601GCGACGCTACACATAATGAATACGAATGATGAAACCAAGAACGAAATGAT1280]651GGTTGCAGCCATCCGCAATGCATGGGTCAAGCTGGGCGAACGTGGCGTGC1281]701GCATCGTCAATAACAGTTTTGGAACAACATCGAGGGCAGGCACTGCCGAC1282]751CTTTTCCAAATAGCCAATTCGGAGGAGCAGTACCGCCAAGCGTTGCTCGA1283]801CTATTCCGGCGGTGATAAAACAGACGAGGGTATCCGCCTGATGCAACAGA1284]851GCGATTACGGCAACCTGTCCTACCACATCCGTAATAAAAACATGCTTTTC1285]901ATCTTTTCGACAGGCAATGACGCACAAGCTCAGCCCAACACATATGCCCT1286]951ATTGCCATTTTATGAAAAAGACGCTCAAAAAGGCATTATCACAGTCGCAG1287]1001GCGTAGACCGCAGTGGAGAAAAGTTCAAACGGGAAATGTATGGAGAACCG1288]1051GGTACAGAACCGCTTGAGTATGGCTCCAACCATTGCGGAATTACTGCCAT1289]1101GTGGTGCCTGTCGGCACCCTATGAAGCAAGCGTCCGTTTCACCCGTACAA1290]1151ACCCGATTCAAATTGCCGGAACATCCTTTTCCGCACCCATCGTAACCGGC1291]1201ACGGCGGCTCTGCTGCTGCAGAAATACCCGTGGATGAGCAACGACAACCT1292]1251GCGTACCACGTTGCTGACGACGGCTCAGGACATCGGTGCAGTCGGCGTGG1293]1301ACAGCAAGTTCGGCTGGGGACTGCTGGATGCGGGTAAGGCCATGAACGGA1294]1351CCCGCGTCCTTTCCGTTCGGCGACTTTACCGCCGATACGAAAGGTACATC1295]1401CGATATTGCCTACTCCTTCCGTAACGACATTTCAGGCACGGGCGGCCTGA1296]1451TCAAAAAAGGCGGCAGCCAACTGCAACTGCACGGCAACAACACCTATACG1297]1501GGCAAAACCATTATCGAAGGCGGTTCGCTGGTGTTGTACGGCAACAACAA1298]1551ATCGGATATGCGCGTCGAAACCAAAGGTGCGCTGATTTATAACGGGGCGG1299]1601CATCCGGCGGCAGCCTGAACAGCGACGGCATTGTCTATCTGGCAGATACC1300]1651GACCAATCCGGCGCAAACGAAACCGTACACATCAAAGGCAGTCTGCAGCT1301]1701GGACGGCAAAGGTACGCTGTACACACGTTTGGGCAAACTGCTGAAAGTGG1302]1751ACGGTACGGCGATTATCGGCGGCAAGCTGTACATGTCGGCACGCGGCAAG1303]1801GGGGCAGGCTATCTCAACAGTACCGGACGACGTGTTCCCTTCCTGAGTGC
521304]18511305]19011306]19511307]20011308]20511309]21011310]21511311]22011312]22511313]23011314]23511315]24011316]24511317]25011318]25511319]26011320]26511321]27011322]27511323]28011324]28511325]29011326]29511327]30011328]30511329]31011330]31511331]32011332]32511333]33011334]33511335]34011336]34511337]35011338]35511339]36011340]36511341]37011342]3751
CGCCAAAATC GCGGCCTGCT GGCGACACGC TTCGGCAGCG AGGGCGGCAG TCATCCGCAA TATGCCGGGC TACAGCATGC GCTACCGTCT CCGCCTGAAA GCGTCATCGC GTTGAAGGCA AACCGGCGAA CATGGAGCGA GCAGGCATAC CTCCTACGGA AACATGCGGA GGCGGTGTCA CGGTCTGCGC GTGCTTTGGG CTCGCGGGTC TGCAACGGCG CGGGCGGCTT AATATGCCGC CGGCAACGGC AGTACGGCAA GGTGGCGGAG TGCCACTGTG GTTTCAAAGC ACCAAAAAAG TCTGGGTCTG ACAAACAAAA AAGTTAACAA TGCCGCTCTG TAACGACATT AAATTAGAAG CGATATCGCC TCAAAACCGC GTCGATGCCA
GGGCAGGATT GGCTTCCCTC TGTCCTATTA GCACATTCCG CAATCTGGAA CACCCGAGAC ATCCGCCCCT GAATGCCGCC ATGCCGACAG GCCGTATCGG GCAAACCCAA AAATGCGCGG AATACGACAG AAACAGTGCA GGCACGATGC CGCTACAAAA AGGCAGCGTC ACGTTCCGTT TACGACCTGC CTGGAGCGGC TGAAGCTGTC GGCGTGGAAC TACCGGCGCG ACACCCGTCT TGGAACGGCT CCACAGCGGA GCACTGGATC GCCATTGCTG TGGAGAGACC ACGCAACTGC AAAAAAGTCG CGTCGATGCC CCAAGTTAGC GATGCAACCA TGCTGAAGAG CCGTGGCTGA GATTCATTGG CAATGAAGCC AAGTAAAAGC
ATTCTTTCTT GACAGCGTCG TGTCCGTCGC CGCCCGCCGG AACCTGATGG GGTTGAAACT ACGGCGCAAC GACGGTGTAC TACGCGCGCC ACGGGTTGGA CAGGACGGTG CAGTACCCAA CAGCCGCCAC AATGCAAAAA GGGCGATATC ACAGCATCAG AACGGCACGC TGCCGCAACG TCAAACAGGA AACAGCCTCA GCAACCCTTG GCGACCTGAA ACTGCAGCAA GGTTGCCGGC TGGCACGTTA CGAGTCGGCG CGCCACAAAC CTGCCTACAA ATCTACGACA AGCCGATGTT TGACTAACCT AAAGTAAAAG AGACACTGAT CCAACGCCTT ACTAAGACAA TACCGTCGAC ATGAAACCAA AAACAGACGG TGCAGAAACT
CACAAACATC AAAAAACAGC GGCAATGCGG TCTGAAACAC TCGAACTGGA GCGGCAGCCG TTTCCGCGCA GCATCTTCAA CATGCCGATA CCACAACGGC GAACGTGGGA ACCGTCGGCA ACTGGGCATG CCGACAGCAT GGCTATCTCA CCGCAGCACC TGATGCAGCT GGAGATTTGA TGCATTCGCC CTGAAGGCAC AGCGATAAAG CGGACGCGAC CCGGCAAGAC CTGGGCGCGG CAGCTACGCC TAGGCTACCG GACGACGATG CAATGGCCAA TTGATGAAGA GAAGCCGACG GACCAAAACC CTGCAGAATC GCCGCTTTAG GAATAAATTG ATATCGTAAA AAGCATGCCG CACTAAGGCA CCGAAGAAAC GCAGCAGGCA
GAAACCGACG GGGCAGTGAA CACGGACTGC GCCGTAGAAC TGCCTCCGAA ACCGCACAGA GCGGCAGCCG CAGTCTCGCC TGCAGGGACG ACGGGTCTGC ACAGGGCGGT TTGCCGCGAA GGACGCAGCA TAGTCTGTTT AAGGCCTGTT GGTGCGGACG GGGCGCACTG CGGTCGAAGG GAAAAAGGCA GCTGGTCGGA CCGTCCTGTT TACACGGTAA GGGGGCACGC ATGTCGAATT GGTTCCAAAC GTTCCTCGAG TTAAAAAAGC GAAATCAACG CGGCACAATT ACTTTAAAGG GTCAATGAAA TGAAATAGAA CAGATACTGA GGAGAAAATA AATTGATGAA AAGCATTCAA GACGAAGCCG CAAACAAAAC AAGCCGAAGC1343]3801TGCCGCTGGCACAGCTAATA1344]3851CAAAAGTTACCGACATCAAA1345]3901GCTAAAAAAGCAAACAGTGC1346]3951CAAATTTGTCAGAATTGATG1347]4001CACGCTTGGCTTCTGCTGAA1348]4051AACGGTTTGGATAAAACAGT1349]4101CCTTGCAGAACAAGCCGCGC1350]4151GTCTCGAGCACCACCACCAC1351]1MTSAPDFNAGGTGIGSNSRA1352]51VAVTDRDAKINAPPPNLHTG1353]101GIVDTGESVGSISFPELYGR1354]151ASFDDEAVIETEAKPTDIRH1355]201ATLHIMNTNDETKNEMMVAA1356]251LFQIANSEEQYRQALLDYSG1357]301IFSTGNDAQAQPNTYALLPF1358]351GTEPLEYGSNHCGITAMWCL1359]401TAALLLQKYPWMSNDNLRTT1360]451PASFPFGDFTADTKGTSDIA1361]501GKTIIEGGSLVLYGNNKSDM1362]551DQSGANETVHIKGSLQLDGK1363]601GAGYLNSTGRRVPFLSAAKI1364]651GDTLSYYVRRGNAARTASAA1365]701SSATPETVETAAADRTDMPG1366]751ATVYADSTAAHADMQGRRLK1367]801VEGKMRGSTQTVGIAAKTGE1368]851AGIRHDAGDIGYLKGLFSYG1369]901GGVNVPFAATGDLTVEGGLR1370]951LAGLKLSQPLSDKAVLFATA1371]1001NMPHTRLVAGLGADVEFGNG1372]1051GGGGTGSATNDDDVKKAATV1373]1101TKKDATAADVEADDFKGLGL1374]1151KLTTKLADTDAALADTDAAL1375]1201KLEAVADTVDKHAEAFNDIA1376]1251VDAKVKAAETAAGKAEAAAG1377]1301AKKANSADVYTREESDSKFV1378]1351NGLDKTVSDLRKETRQGLAE1379]AG741和杂交体1380]针对各种菌株(包括同源2996
菌滴定度
CTGCAGCCGACAAGGCCGAAGCTGTCGCTGGCTGATATCGCTACGAACAAAGATAATATTCGACGTGTACACCAGAGAAGAGTCTGACAGGTCTGAACGCTACTACCGAAAAATTGGACAAAATCCATTGCCGATCACGATACTCGCCTGGTCAGACCTGCGCAAAGAAACCCGCCAAGGTCTCCGGTCTGTTCCAACCTTACAACGTGGCACCACTGATTAKSAAVSYAGIKNEMCKDRSMLCAGRDDDFPNPNDAYKNLINLKPAIEAGYTGRGVEVKEHGYNENYKNYTAYMRKEAPEDGGGKDIEVKEIGHIDLVSHIIGGRSVDGRPAGGIAPDIRNAffVKLGERGVRIVNNSFGTTSRAGTADGDKTDEGIRLMQQSDYGNLSYHIRNK 匪 LFYEKDAQKGIITVAGVDRSGEKFKREMYGEPSAPYEASVRFTRTNPIQIAGTSFSAPIVTGLLTTAQDIGAVGVDSKFGffGLLDAGKAMNGYSFRNDISGTGGLIKKGGSQLQLHGNNTYTRVETKGALIYNGAASGGSLNSDGIVYLADTGTLYTRLGKLLKVDGTAIIGGKLYMSARGKGQDYSFFTNIETDGGLLASLDSVEKTAGSEAHSAPAGLKHAVEQGGSNLENLMVELDASEIRPYGATFRAAAAVQHANAADGVRIFNSLAAVSDGLDHNGTGLRVIAQTQQDGGTffEQGGNTTAAATLGMGRSTffSENSANAKTDSISLFRYKNSISRSTGADEHAEGSVNGTLMQLGALYDLLKQDAFAEKGSALGffSGNSLTEGTLVGGVERDLNGRDYTVTGGFTGATAATGKTGARWNGLARYSYAGSKQYGNHSGRVGVGYRFLEAIAAAYNNGQEINGFKAGETIYDIDEDGTIKKVVTNLTKTVNENKQNVDAKVKAAESEIEDATTNALNKLGENITTFAEETKTNIVKIDEDSLDETNTKADEAVKTANEAKQTAEETKQNTANTAADKAEAVAAKVTDIKADIATNKDNIRIDGLNATTEKLDTRLASAEKSIADHDTRLQAALSGLFQPYNVGLEHHHHHH*
株),测定由应答AG741(His_融合)产生的杀 可以看出,针对异源菌株MC58,由AG741引发的抗-杀菌滴定度特别高。还将AG741直接融合于蛋白质961、961c、983和0RF46. 1的符合读框的上游AG741-961
1385]1ATGGTCGCCGCCGACATCGGTGCGGGGCTTGCCGATGCACTAACCGCACC1386]51GCTCGACCATAAAGACAAAGGTTTGCAGTCTTTGACGCTGGATCAGTCCG1387]101TCAGGAAAAACGAGAAACTGAAGCTGGCGGCACAAGGTGCGGAAAAAACT1388]151TATGGAAACGGTGACAGCCTCAATACGGGCAAATTGAAGAACGACAAGGT1389]201CAGCCGTTTCGACTTTATCCGCCAAATCGAAGTGGACGGGCAGCTCATTA
1390]251CCTTGGAGAGTGGAGAGTTCCAAGTATACAAACAAAGCCATTCCGCCTTA1391]301ACCGCCTTTCAGACCGAGCAAATACAAGATTCGGAGCATTCCGGGAAGAT1392]351GGTTGCGAAACGCCAGTTCAGAATCGGCGACATAGCGGGCGAACATACAT1393]401CTTTTGACAAGCTTCCCGAAGGCGGCAGGGCGACATATCGCGGGACGGCG1394]451TTCGGTTCAGACGATGCCGGCGGAAAACTGACCTACACCATAGATTTCGC1395]501CGCCAAGCAGGGAAACGGCAAAATCGAACATTTGAAATCGCCAGAACTCA1396]551ATGTCGACCTGGCCGCCGCCGATATCAAGCCGGATGGAAAACGCCATGCC1397]601GTCATCAGCGGTTCCGTCCTTTACAACCAAGCCGAGAAAGGCAGTTACTC1398]651CCTCGGTATCTTTGGCGGAAAAGCCCAGGAAGTTGCCGGCAGCGCGGAAG1399]701TGAAAACCGTAAACGGCATACGCCATATCGGCCTTGCCGCCAAGCAACTC1400]751GAGGGTGGCGGAGGCACTGGATCCGCCACAAACGACGACGATCTTAAAAA1401]801AGCTGCCACTGTGGCCATTGCTGCTGCCTACAACAATGGCCAAGAAATCA1402]851ACGGTTTCAAAGCTGGAGAGACCATCTACGACATTGATAGAGACGGCACA1403]901ATTACCAAAAAAGACGCAACTGCAGCCGATGTTGAAGCCGACGACTTTAA1404]951AGGTCTGGGTCTGAAAAAAGTCGTGACTAACCTGACCAAAACCGTCAATG1405]1001AAAACAAACAAAACGTCGATGCCAAAGTAAAAGCTGCAGAATCTGAAATA1406]1051GAAAAGTTAACAACCAAGTTAGCAGACACTGATGCCGCTTTAGCAGATAC1407]1101TGATGCCGCTCTGGATGCAACCACCAACGCCTTGAATAAATTGGGAGAAA1408]1151ATATAACGACATTTGCTGAAGAGACTAAGACAAATATCGTAAAAATTGAT1409]1201GAAAAATTAGAAGCCGTGGCTGATACCGTCGACAAGCATGCCGAAGCATT1410]1251CAACGATATCGCCGATTCATTGGATGAAACCAACACTAAGGCAGACGAAG1411]1301CCGTCAAAACCGCCAATGAAGCCAAACAGACGGCCGAAGAAACCAAACAA1412]1351AACGTCGATGCCAAAGTAAAAGCTGCAGAAACTGCAGCAGGCAAAGCCGA1413]1401AGCTGCCGCTGGCACAGCTAATACTGCAGCCGACAAGGCCGAAGCTGTCG1414]1451CTGCAAAAGTTACCGACATCAAAGCTGATATCGCTACGAACAAAGATAAT1415]1501ATTGCTAAAAAAGCAAACAGTGCCGACGTGTACACCAGAGAAGAGTCTGA1416]1551CAGCAAATTTGTCAGAATTGATGGTCTGAACGCTACTACCGAAAAATTGG1417]1601
1418]1651
1419]1701
1420]1751
1421]1801
1422]1851
1423]1901
1424]1
1425]51
1426]101
1427]151
1428]201
1429]251
1430]301
1431]351
1432]401
1433]451
1434]501
1435]551
1436]601
1437]
1438]1
1439]51
1440]101
1441]151
1442]201
1443]251
1444]301
1445]351
1446]401
1447]451
1448]501
1449]551
1450]601
1451]651
1452]701
1453]751
1454]801
1455]851
ACACACGCTT CTGAACGGTT AGGCCTTGCA TGGGTCGGTT GCAGTCGCCA AGCAGGCGTG TCGGCGTCAA MVAADIGAGL YGNGDSLNTG TAFQTEQIQD FGSDDAGGKL VISGSVLYNQ EGGGGTGSAT ITKKDATAAD EKLTTKLADT EKLEAVADTV NVDAKVKAAE IAKKANSADV LNGLDKTVSD AVAIGTGFRF
ATGGTCGCCG GCTCGACCAT TCAGGAAAAA TATGGAAACG CAGCCGTTTC CCTTGGAGAG ACCGCCTTTC GGTTGCGAAA CTTTTGACAA TTCGGTTCAG CGCCAAGCAG ATGTCGACCT GTCATCAGCG CCTCGGTATC TGAAAACCGT GAGGGTGGCG AGCTGCCACT ACGGTTTCAA
GGCTTCTGCT TGGATAAAAC GAACAAGCCG CAATGTAACG TCGGTACCGG GCAGTCGGCA TTACGAGTGG ADALTAPLDH KLKNDKVSRF SEHSGKMVAK TYYIDFAAKQ AEKGSYSLGI NDDDVKKAAT VEADDFKGLG DAALADTDAA DKHAEAFNDI TAAGKAEAAA YTREESDSKF LRKETRQGLA TENFAAKAGV
CCGACATCGG AAAGACAAAG CGAGAAACTG GTGACAGCCT GACTTTATCC TGGAGAGTTC AGACCGAGCA CGCCAGTTCA GCTTCCCGAA ACGATGCCGG GGAAACGGCA GGCCGCCGCC GTTCCGTCCT TTTGGCGGAA AAACGGCATA GAGGCACTGG GTGGCCATTG AGCTGGAGAG
GAAAAATCCA AGTGTCAGAC CGCTCTCCGG GCTGCAGTCG CTTCCGCTTT CTTCGTCCGG CTCGAGCACC KDKGLQSLTL DFIRQIEVDG RQFRI⑶IAG GNGKIEHLKS FGGKAQEVAG VAIAAAYNNG LKKVVTNLTK LDATTNALNK ADSLDETNTK GTANTAADKA VRIDGLNATT EQAALSGLFQ AVGTSSGSSA
TGCGGGGCTT GTTTGCAGTC AAGCTGGCGG CAATACGGGC GCCAAATCGA CAAGTATACA AATACAAGAT GAATCGGCGA GGCGGCAGGG CGGAAAACTG AAATCGAACA GATATCAAGC TTACAACCAA AAGCCCAGGA CGCCATATCG ATCCGCCACA CTGCTGCCTA ACCATCTACG
TTGCCGATCA CTGCGCAAAG TCTGTTCCAA GCGGCTACAA ACCGAAAACT TTCTTCCGCA ACCACCACCA DQSVRKNEKL QLITLESGEF EHTSFDKLPE PELNVDLAAA SAEVKTVNGI QEINGFKAGE TVNENKQNVD LGENITTFAE ADEAVKTANE EAVAAKVTDI EKLDTRLASA PYNVGRFNVT AYHVGVNYEff
GCCGATGCAC TTTGACGCTG CACAAGGTGC AAATTGAAGA AGTGGACGGG AACAAAGCCA TCGGAGCATT CATAGCGGGC CGACATATCG ACCTACACCA TTTGAAATCG CGGATGGAAA GCCGAGAAAG AGTTGCCGGC GCCTTGCCGC AACGACGACG CAACAATGGC ACATTGATGA
CGATACTCGC
AAACCCGCCA
CCTTACAACG
ATCCGAATCG
TTGCCGCCAA
GCCTACCATG
CCACTGA
KLAAQGAEKT
QVYKQSHSAL
GGRATYRGTA
DIKPDGKRHA
RHIGLAAKQL
TIYDIDEDET
AKVKAAESEI
ETKTNIVKID
AKQTAEETKQ
KADIATNKDN
EKSIADHDTR
AAVGGYKSES
LEHHHHHH*
TAACCGCACC GATCAGTCCG GGAAAAAACT ACGACAAGGT CAGCTCATTA TTCCGCCTTA CCGGGAAGAT GAACATACAT CGGGACGGCG TAGATTTCGC CCAGAACTCA ACGCCATGCC GCAGTTACTC AGCGCGGAAG CAAGCAACTC ATGTTAAAAA CAAGAAATCA AGACGGCACA
AG741-961c
56[1456]901ATTACCAAAAAAGACGCAACTGCAGCCGATGTTGAAGCCGACGACTTTAA[1457]951AGGTCTGGGTCTGAAAAAAGTCGTGACTAACCTGACCAAAACCGTCAATG[1458]1001AAAACAAACAAAACGTCGATGCCAAAGTAAAAGCTGCAGAATCTGAAATA[1459]1051GAAAAGTTAACAACCAAGTTAGCAGACACTGATGCCGCTTTAGCAGATAC[1460]1101TGATGCCGCTCTGGATGCAACCACCAACGCCTTGAATAAATTGGGAGAAA[1461]1151ATATAACGACATTTGCTGAAGAGACTAAGACAAATATCGTAAAAATTGAT[1462]1201GAAAAATTAGAAGCCGTGGCTGATACCGTCGACAAGCATGCCGAAGCATT[1463]1251CAACGATATCGCCGATTCATTGGATGAAACCAACACTAAGGCAGACGAAG[1464]1301CCGTCAAAACCGCCAATGAAGCCAAACAGACGGCCGAAGAAACCAAACAA[1465]1351AACGTCGATGCCAAAGTAAAAGCTGCAGAAACTGCAGCAGGCAAAGCCGA[1466]1401AGCTGCCGCTGGCACAGCTAATACTGCAGCCGACAAGGCCGAAGCTGTCG[1467]1451CTGCAAAAGTTACCGACATCAAAGCTGATATCGCTACGAACAAAGATAAT[1468]1501ATTGCTAAAAAAGCAAACAGTGCCGACGTGTACACCAGAGAAGAGTCTGA[1469]1551CAGCAAATTTGTCAGAATTGATGGTCTGAACGCTACTACCGAAAAATTGG[1470]1601ACACACGCTTGGCTTCTGCTGAAAAATCCATTGCCGATCACGATACTCGC[1471]1651CTGAACGGTTTGGATAAAACAGTGTCAGACCTGCGCAAAGAAACCCGCCA[1472]1701AGGCCTTGCAGAACAAGCCGCGCTCTCCGGTCTGTTCCAACCTTACAACG[1473]1751TGGGTCTCGAGCACCACCACCACCACCACTGA[1474]1MVAADIGAGLADALTAPLDHKDKGLQSLTLDQSVRKNEKLKLAAQGAEKT[1475]51YGNGDSLNTGKLKNDKVSRFDFIRQIEVDGQLITLESGEFQVYKQSHSAL[1476]101TAFQTEQIQDSEHSGKMVAKRQFRI⑶IAGEHTSFDKLPEGGRATYRGTA[1477]151FGSDDAGGKLTYTIDFAAKQGNGKIEHLKSPELNVDLAAADIKPDGKRHA[1478]201VISGSVLYNQAEKGSYSLGIFGGKAQEVAGSAEVKTVNGIRHIGLAAKQL[1479]251EGGGGTGSATNDDDVKKAATVAIAAAYNNGQEINGFKAGETIYDIDEDGT[1480]301ITKKDATAADVEADDFKGLGLKKVVTNLTKTVNENKQNVDAKVKAAESEI[1481]351EKLTTKLADTDAALADTDAALDATTNALNKLGENITTFAEETKTNIVKID[1482]401EKLEAVADTVDKHAEAFNDIADSLDETNTKADEAVKTANEAKQTAEETKQ[1483]451NVDAKVKAAETAAGKAEAAAGTANTAADKAEAVAAKVTDIKADIATNKDN[1484]501IAKKANSADVYTREESDSKFVRIDGLNATTEKLDTRLASAEKSIADHDTR[1485]551LNGLDKTVSDLRKETRQGLAEQAALSGLFQPYNVGLEHHHHHH*[1486]AG741-983[1487]1ATGGTCGCCGCCGACATCGGTGCGGGGCTTGCCGATGCACTAACCGCACC[1488]51GCTCGACCATAAAGACAAAGGTTTGCAGTCTTTGACGCTGGATCAGTCCG[1489]101TCAGGAAAAACGAGAAACTGAAGCTGGCGGCACAAGGTGCGGAAAAAACT[1490]151TATGGAAACGGTGACAGCCTCAATACGGGCAAATTGAAGAACGACAAGGT[1491]201CAGCCGTTTCGACTTTATCCGCCAAATCGAAGTGGACGGGCAGCTCATTA[1492]251CCTTGGAGAGTGGAGAGTTCCAAGTATACAAACAAAGCCATTCCGCCTTA[1493]301ACCGCCTTTCAGACCGAGCAAATACAAGATTCGGAGCATTCCGGGAAGAT[1494]351GGTTGCGAAACGCCAGTTCAGAATCGGCGACATAGCGGGCGAACATACAT1495]4011496]4511497]5011498]5511499]6011500]6511501]7011502]7511503]8011504]8511505]9011506]9511507]10011508]10511509]11011510]11511511]12011512]12511513]13011514]13511515]14011516]14511517]15011518]15511519]16011520]16511521]17011522]17511523]18011524]18511525]19011526]19511527]20011528]20511529]21011530]21511531]22011532]22511533]2301
CTTTTGACAA TTCGGTTCAG CGCCAAGCAG ATGTCGACCT GTCATCAGCG CCTCGGTATC TGAAAACCGT GAGGGATCCG TACCGGTATC TATCTTACGC TGTGCCGGTC TGCCCCCCCC CATACAAGAA GGACGCGGGG CATATCCTTT ATTACAAAAA GGCGGTAAAG TGAAGCAAAG ATTTGGTCTC GGCGGTATTG AACCAAGAAC TGGGCGAACG AGGGCAGGCA CCGCCAAGCG TCCGCCTGAT AATAAAAACA GCCCAACACA GCATTATCAC GAAATGTATG TTGCGGAATT TCCGTTTGAC GCACCCATCG GATGAGCAAC TCGGTGCAGT GGTAAGGCCA CGATACGAAA CAGGCACGGG GGCAACAACA GTTGTACGGC
GCTTCCCGAA ACGATGCCGG GGAAACGGCA GGCCGCCGCC GTTCCGTCCT TTTGGCGGAA AAACGGCATA GCGGAGGCGG GGCAGCAACA CGGTATCAAG GGGATGACGT CCGAATCTGC TTTGATCAAC TAGAGGTAGG CCCGAACTGT CTATACGGCG ACATTGAAGC CCGACGGATA CCATATTATT CGCCCGATGC GAAATGATGG TGGCGTGCGC CTGCCGACCT TTGCTCGACT GCAACAGAGC TGCTTTTCAT TATGCCCTAT AGTCGCAGGC GAGAACCGGG ACTGCCATGT CCGTACAAAC TAACCGGCAC GACAACCTGC CGGCGTGGAC TGAACGGACC GGTACATCCG CGGCCTGATC CCTATACGGG AACAACAAAT
GGCGGCAGGG CGGAAAACTG AAATCGAACA GATATCAAGC TTACAACCAA AAGCCCAGGA CGCCATATCG CACTTCTGCG GCAGAGCAAC AACGAAATGT TGCGGTTACA ATACCGGAGA CTCAAACCTG TATCGTCGAC ATGGCAGAAA TATATGCGGA TTCTTTCGAC TCCGCCACGT GGCGGGCGTT GACGCTACAC TTGCAGCCAT ATCGTCAATA TTTCCAAATA ATTCCGGCGG GATTACGGCA CTTTTCGACA TGCCATTTTA GTAGACCGCA TACAGAACCG GGTGCCTGTC CCGATTCAAA GGCGGCTCTG GTACCACGTT AGCAAGTTCG CGCGTCCTTT ATATTGCCTA AAAAAAGGCG CAAAACCATT CGGATATGCG
CGACATATCG ACCTACACCA TTTGAAATCG CGGATGGAAA GCCGAGAAAG AGTTGCCGGC GCCTTGCCGC CCCGACTTCA AACAGCGAAA GCAAAGACAG GACAGGGATG CTTTCCAAAC CAATTGAAGC ACAGGCGAAT AGAACACGGC AGGAAGCGCC GATGAGGCCG AAAAGAAATC CCGTGGACGG ATAATGAATA CCGCAATGCA ACAGTTTTGG GCCAATTCGG TGATAAAACA ACCTGTCCTA GGCAATGACG TGAAAAAGAC GTGGAGAAAA CTTGAGTATG GGCACCCTAT TTGCCGGAAC CTGCTGCAGA GCTGACGACG GCTGGGGACT CCGTTCGGCG CTCCTTCCGT GCAGCCAACT ATCGAAGGCG CGTCGAAACC
CGGGACGGCG TAGATTTCGC CCAGAACTCA ACGCCATGCC GCAGTTACTC AGCGCGGAAG CAAGCAACTC ATGCAGGCGG TCAGCAGCAG AAGCATGCTC CCAAAATCAA CCAAATGACG AGGCTATACA CCGTCGGCAG TATAACGAAA TGAAGACGGA TTATAGAGAC GGACACATCG CAGACCTGCA CGAATGATGA TGGGTCAAGC AACAACATCG AGGAGCAGTA GACGAGGGTA CCACATCCGT CACAAGCTCA GCTCAAAAAG GTTCAAACGG GCTCCAACCA GAAGCAAGCG ATCCTTTTCC AATACCCGTG GCTCAGGACA GCTGGATGCG ACTTTACCGC AACGACATTT GCAACTGCAC GTTCGCTGGT AAAGGTGCGC1534]23511535]24011536]24511537]25011538]25511539]26011540]26511541]27011542]27511543]28011544]28511545]29011546]29511547]30011548]30511549]31011550]31511551]32011552]32511553]33011554]33511555]34011556]34511557]35011558]35511559]36011560]36511561]37011562]37511563]38011564]38511565]39011566]11567]511568]1011569]1511570]2011571]2511572]301
TGATTTATAA GTCTATCTGG CAAAGGCAGT GCAAACTGCT ATGTCGGCAC TGTTCCCTTC CAAACATCGA AAAACAGCGG CAATGCGGCA TGAAACACGC GAACTGGATG GGCAGCCGAC TCCGCGCAGC ATCTTCAACA TGCCGATATG ACAACGGCAC ACGTGGGAAC CGTCGGCATT TGGGCATGGG GACAGCATTA CTATCTCAAA GCAGCACCGG ATGCAGCTGG AGATTTGACG CATTCGCCGA GAAGGCACGC CGATAAAGCC GACGCGACTA GGCAAGACGG GGGCGCGGAT GCTACGCCGG GGCTACCGGT NVAADIGAGL YGNGDSLNTG TAFQTEQIQD FGSDDAGGKL VISGSVLYNQ EGSGGGGTSA CAGRDDVAVT
CGGGGCGGCA CAGATACCGA CTGCAGCTGG GAAAGTGGAC GCGGCAAGGG CTGAGTGCCG AACCGACGGC GCAGTGAAGG CGGACTGCTT CGTAGAACAG CCTCCGAATC CGCACAGATA GGCAGCCGTA GTCTCGCCGC CAGGGACGCC GGGTCTGCGC AGGGCGGTGT GCCGCGAAAA ACGCAGCACA GTCTGTTTGC GGCCTGTTCT TGCGGACGAA GCGCACTGGG GTCGAAGGCG AAAAGGCAGT TGGTCGGACT GTCCTGTTTG CACGGTAACG GGGCACGCAA GTCGAATTCG TTCCAAACAG TCCTCGAGCA ADALTAPLDH KLKNDKVSRF SEHSGKMVAK TYTIDFAAKQ AEKGSYSLGI PDFNAGGTGI DRDAKINAPP
TCCGGCGGCA CCAATCCGGC ACGGCAAAGG GGTACGGCGA GGCAGGCTAT CCAAAATCGG GGCCTGCTGG CGACACGCTG CGGCAGCGGC GGCGGCAGCA ATCCGCAACA TGCCGGGCAT CAGCATGCGA TACCGTCTAT GCCTGAAAGC GTCATCGCGC TGAAGGCAAA CCGGCGAAAA TGGAGCGAAA AGGCATACGG CCTACGGACG CATGCGGAAG CGGTGTCAAC GTCTGCGCTA GCTTTGGGCT CGCGGGTCTG CAACGGCGGG GGCGGCTTTA TATGCCGCAC GCAACGGCTG TACGGCAACC CCACCACCAC KDKGLQSLTL DFIRQIEVDG RQFRI⑶IAG GNGKIEHLKS FGGKAQEVAG GSNSRATTAK PNLHTGDFPN
GCCTGAACAG
GCAAACGAAA
TACGCTGTAC
TTATCGGCGG
CTCAACAGTA
GCAGGATTAT
CTTCCCTCGA
TCCTATTATG
ACATTCCGCG
ATCTGGAAAA
CCCGAGACGG
CCGCCCCTAC
ATGCCGCCGA
GCCGACAGTA
CGTATCGGAC
AAACCCAACA
ATGCGCGGCA
TACGACAGCA
ACAGTGCAAA
CACGATGCGG
CTACAAAAAC
GCAGCGTCAA
GTTCCGTTTG
CGACCTGCTC
GGAGCGGCAA
AAGCTGTCGC
CGTGGAACGC
CCGGCGCGAC
ACCCGTCTGG
GAACGGCTTG
ACAGCGGACG
CACCACTGA
DQSVRKNEKL
QLITLESGEF
EHTSFDKLPE
PELNVDLAAA
SAEVKTVNGI
SAAVSYAGIK
PNDAYKNLIN
CGACGGCATT CCGTACACAT ACACGTTTGG CAAGCTGTAC CCGGACGACG TCTTTCTTCA CAGCGTCGAA TCCGTCGCGG CCCGCCGGTC CCTGATGGTC TTGAAACTGC GGCGCAACTT CGGTGTACGC CCGCCGCCCA GGGTTGGACC GGACGGTGGA GTACCCAAAC GCCGCCACAC TGCAAAAACC GCGATATCGG AGCATCAGCC CGGCACGCTG CCGCAACGGG AAACAGGATC CAGCCTCACT AACCCTTGAG GACCTGAACG TGCAGCAACC TTGCCGGCCT GCACGTTACA AGTCGGCGTA
KLAAQGAEKT QVYKQSHSAL GGRATYRGTA DIKPDGKRHA RHIGLAAKQL NEMCKDRSML LKPAIGAGYT 通常用N-未端的297 (以AG的形式)观察到较好的杀菌滴定度。当融合于蛋白质961[NH2-AG287-961-COOH_上述可示序列]时,得到的的蛋白质 是不溶的且必须变性和复性以用于纯化。复性后,发现50%蛋白质仍不溶解。比较可溶性 和不溶性蛋白质,用可溶性蛋白质获得的杀菌滴定度好得多(FCA作为佐剂) 然而,用明矾佐剂替代可以改善难溶形式蛋白质的滴定度 实施例17-N-未端融合('杂交体')于287将蛋白质287以全长、含C-未端His-标记、或无其前导肽但而包含C-未端 His-标记表达的水平相当低。用N-未端GST-融合实现较好的表达。或者将GST用作N-未端融合配体,将287置于蛋白质919的C-未端 (‘919-287 ’)、蛋白质953的C-未端(‘卯3-287 ’)和蛋白质0RF46· 1的C-未端 (‘0RF46. 1-287')。在这两种情况中,除去前导肽,且杂交体是直接的符合读框的融合。为了产生953-287杂交体,设计各序列的前导肽的正向引物下游以除去这两种蛋 白质的前导肽;除去953反向引物中的终止密码子序列,但包含在287反向引物中。对953 基因而言,用于扩增的5'和3'引物分别包括NdeI和BamHI限制酶切位点,而对287基 因的扩增而言,5'和3'引物分别包括BamHI和XhoI限制酶切位点。在这种方法中,使用 NdeI-BamHI (用于克隆第一个基因)和随后的BamHI-XhoI (用于克隆第二基因)可以实现pET21b+中两个基因的顺序定向克隆。通过将编码287的成熟部分的序列克隆入pET21b+中的919-His克隆的3'端 的XhoI位点中,获得919-287杂交体。设计用于扩增287基因的引物,从而在PCR片段的 5'端引入SalI限制酶切位点,并在3'端引入XhoI位点。由于由SalI和XhoI限制酶产 生的粘性末端是相容的,可以将用SalI-XhoI消化的287PCR扩增产物插入由XhoI切割的 pET21b-919 克隆中。类似地获得0RF46. 1-287杂交体。将针对杂交蛋白产生的抗体的杀菌效力(同源菌株)与针对组分抗原的简单混合 物产生的抗体的杀菌效力相比较 还获得了 919-287和953-287针对异源MenB菌株和血清型A和C的杀菌活性数
据 还构建了 0RF46. 1和919的杂交体。最佳的结果(高四倍的滴定度)是用在N-未 端的919实现的。还测试了杂交体 919-519His、0RF97_225His 和 225_0RF97His。它们得到中等 ELISA滴定度和杀菌的抗体应答。实施例18-0RF4的前导肽如上所示,可以将0RF4的前导肽融合于其它蛋白质(如蛋白质287和919)的成 熟序列。其可以指导大肠杆菌中的脂质化。实施例19-564中的结构域蛋白质'564'非常大(2073aa),且其难以克隆并以完整形式表达。为了便于表 达,如图8所示(按MC58序列)将该蛋白质分为四个结构域
这些结构域显示出如下同源性 结构域A显示与其它细菌毒素同源
gb IAAG03431. 11AE004443-9可能血凝素[绿脓假单胞菌](38% )
gb|AAC31981. 1 (139897) HecA [菊果胶杆菌])
emb I CAA36409. 11 (X52156) 丝状血凝素[百日咳博德特氏菌](31 % )
gb|AAC79757. 11 (AF057695) 大量上清液蛋白质1 [杜氏嗜血菌](26% )
gb|AAA25657. 11 (M30186) HpmA 前体[奇异变形菌](29% )
结构域B显示为非同源的,且是对564特异性的。
结构域C显示为与以下同源
gbIAAF84995. 1|AE004032 gbIAAG05850. 1|AE004673 gb|AAF68414. 1AF237928 gb|AAC79757. 11(AF057695) pir S21010
结构域D显示与前体细菌
HA-样分泌的蛋白质[苛养木杆菌](33%) 假说蛋白质[铜绿假单胞菌](27% ) 推定的FHA[多杀巴斯德氏菌](23% ) 大量上清液蛋白质1 [杜氏嗜血菌](23% ) FHAB前体[百日咳博德特氏菌](20% ) ■素同源
gb IAAF84995. 11 AE004032_14 HA-样分泌的蛋白质[苛养木杆菌](29% ) 用MC58菌株序列,以GST-融合(未纯化)和his-标记的蛋白质形式获得564ab 良好的细胞内表达;该结构域-对还以脂蛋白形式表达,其表现出在外膜/上清液组分中有 中等表达。当以his-标记的产物(未纯化)表达时,b结构域显示中等细胞内表达,而以 GST-融合则表达良好。以GST-融合表达时C,结构域显示良好的细胞内表达,但是不溶的。以his标记的 产物(未纯化)表达时,d结构域显示中等细胞内表达。以GST-融合体表达时,cd蛋白质 结构域对表现中等细胞内表达(未纯化)。用c结构域和be对观察到良好的杀菌试验滴定度。实施例20-919前导肽在以上的实施例1中讨论了 919的20mer前导肽MKKYLFRAAL YGIAAAILAA如实施例1所示,该前导肽的缺失改进了异源表达(如用0RF4前导肽替代该前导 肽一样)。通过将编码序列融合于摩氏摩根氏菌(Morganella morganii)的PhoC报道基因 研究了 919 前导肽对表达的影响[Thaller 等,(1994)Microbiologyl40 :1341_1350]。将该 构建物克隆入NdeI和XhoI位点间的pET21-b质粒中(图9)1 MKKYLFRAAL YGIAAAILAA AIPAGNDATT KPDLYYLKNE QAIDSLKLLP51 PPPEVGSIQF LNDQAMYEKG RMLRNTERGK QAQADADLAA GGVATAFSGA101 FGYPITEKDS PELYKLLT匪 IEDA⑶LATR SAKEHYMRIR PFAFYGTETC
64[1701]151 NTKDQKKLST NGSYPSGHTS IGffATALVLA EVNPANQDAI LERGYQLGQS201 RVICGYHWQS DVDAARIVGS AAVATLHSDP AFQAQLAKAK QEFAQKSQK *该质粒的PhoC的表达水平比相同的但包含天然PhoC信号肽的构建物中发现的低 > 200倍。即使用大肠杆菌Plac启动子替代T7启动子后也得到相同的结果。这表明919 前导序列对表达的影响并非取决于所用的启动子。为了研究这些结果是否是由于919信号肽核苷酸序列(二级结构形式,对RNA酶 等敏感)的某些特性或存在该信号肽引起的蛋白质不稳定性导致的,产生了许多突变体。 所用的方法是通过克隆含简并密码子的合成接头替代919信号肽序列的核苷酸。用这种方 法获得含核苷酸和/或氨基酸取代的变体。使用两种不同的接头,设计919信号肽序列的两个不同区域中产生突变,即在第 一 19碱基对(Li)中和碱基20-36之间(Si)。Ll 5' T ATG AAa/g TAc/t c/tTN TTt/c a/cGC GCC GCC CTG TAC GGC ATC GCC GCCGCC ATC CTC GCC GCC GCG ATC CC 3'Sl 5' T ATG AAA AAA TAC CTA TTC CGa/g GCN GCN c/tTa/g TAC/t GGc/g ATC GCCGCC GCC ATC CTC GCC GCC GCG ATC CC 3'
1708]获得的-一些突变体的序列排序如下。1709]Ll变体1710]91-aATGAAGAAGTACCTTTTCAGCGCCGCC 1711]9Ll-eATGAAAAAATACTTTTTCCGCGCCGCC 1712]9Ll-dATGAAAAAATACTTTTTCCGCGCCGCC 1713]9Ll-fATGAAAAAATATCTCTTTAGCGCCGCCCTGTACGGCATCGCCGCCGCCATCCTCGCCGCC1714]919spATGAAAAAATACCTATTCCGCGCCGCCCTGTACGGCATCGCCGCCGCCATCCTCGCCGCC1715]9LlaMKKYLFSAA 1716]9LleMKKYFFRAA 1717]9LldMKKYFFRAA 1718]9LlfMKKYLFSAALYGIAAAILAA1719]919spMKKYLFRAALYGIAAAILAA (即,天然信号肽)1720]Sl突变体1721]9Sl-eATGAAAAAATACCTATTC..................ATCGCCGCCGCCATCCTCGCCGCC1722]9Sl-cATGAAAAAATACCTATTCCGAGCTGCCCAATACGGCATCGCCGCCGCCATCCTCGCCGCC1723]9Sl-bATGAAAAAATACCTATTCCGGGCCGCCCAATACGGCATCGCCGCCGCCATCCTCGCCGCC1724]9Sl-iATGAAAAAATACCTATTCCGGGCGGCTTTGTACGGGATCGCCGCCGCCATCCTCGCCGCC1725]919spATGAAAAAATACCTATTCCGCGCCGCCCTGTACGGCATCGCCGCCGCCATCCTCGCCGCC1726]9SleMKKYLF IAAAILAA1727]9SlcMKKYLFRAAQYGIAAAILAA1728]9SlbMKKYLFRAAQYGIAAAILAA1729]9SliMKKYLFRAALYGIAAAILAA1730]919spMKKYLFRAALYGIAAAILAA1731]如序列排序中所示,分析的的大部分突变体包含由宿主细胞出人意料地产生的符合读框的缺失。通过用从Ll和Sl突变的克隆制备的DNA转化大肠杆菌BL21(DE3)细胞进行突变 体的筛选。通过在包含100 μ g/ml氨苄青霉素、50yg/ml甲基绿、lmg/mlPDP (酚酞二磷酸) 的LB平板上划线,筛选高PhoC活性的单转化体。在该培养基上产生PhoC的细胞变成绿色 (图 10)。用pNPP作为PhoC活性的底物,在液体培养基中对这些突变体产生的PhoC进行的 定量分析。测定在液体培养基中生长0、30、90、180分钟的实变体的细胞提取物和上清液的 比活性为细胞提取物 上清液 —些突变体产生大量PhoC,尤其是突变体9Lla可以在培养基中分泌PhoC。这是 值得关注的,因为该变体的信号肽序列的长度仅为9个氨基酸。这是至今最短的信号肽。实施例21-Maf-相关蛋白质的C-端缺失MafB-相关蛋白质包括 703、0RF46 和 0RF29。MC58的730蛋白质具有如下序列1 VKPLRRLTNL LAACAVAAAA LIQPALAADL AQDPFITDNA QRQHYEPGGK51 YHLFGDPRGS VSDRTGKINV IQDYTHQMGN LLIQQANING TIGYHTRFSG101 HGHEEHAPFD NHAADSASEE KGNVDEGFTV YRLNWEGHEH HPADAYDGPK151 GGNYPKPTGA RDEYTYHVNG TARSIKLNPT DTRSIRQRIS DNYSNLGSNF201 SDRADEANRK MFEHNAKLDR WGNSMEFING VAAGALNPFI SAGEALGIGD[1747]251 ILYGTRYAID KAAMRNIAPL PAEGKFAVIG GLGSVAGFEK NTREAVDRffI301 QENPNAAETV EAVFNVAAAA KVAKLAKAAK PGKAAVS⑶F ADSYKKKLAL351 SDSARQLYQN AKYREALDIH YEDLIRRKTD GSSKFINGRE LDAVTNDALI401 QAKRTISAID KPKNFLNQKN RKQIKATIEA ANQQGKRAEF WFKYGVHSQV451 KSYIESKGGI VKTGLGD *前导肽是加下划线的。730显示与0RF46类似的特性(见以上实施例8)-与0rf46—样,730序列在MenB、MenA和淋球菌之间的保守性仅对N-未端部分 高(>80%)。C-未端(自 340)是高度趋异的。_其预计的二级结构包含跨越分子中心区域(aa. 227-247)的疏水片段。-大肠杆菌中全长基因的表达产生产量很低的蛋白质。从标记的或未标记的构建 物(除去信号肽序列)的表达对宿主细胞有毒性影响。换言之,细胞质中全长成熟蛋白质 的存在对宿主细胞是非常毒的,而当其转位至周质(由信号肽介导)对细胞生存力没有可 检测的影响。730的这种“细胞内毒性”特别高,因为只可用recA遗传背景(大肠杆菌菌 株用于克隆的HB 101;用于表达的HMS 174(DE3))以很低的频率得到用于表达无前导肽 的730的克隆。为了克服这种毒性,将实施例8中用于0RF46的类似方法用于730。得到四种C-未 端截短的形式,每种都被很好地表达。它们都是从His-标记的无前导肽730的细胞内表达 得到的。形式A由成熟蛋白质的N-未端疏水区域(aa. 28-226)构成。将其纯化性作为可 溶性His标记的产物,其具有比预计更高的分子量(MW)。形式B延伸至血清群之间保守的区域(aa. 28-340)的未端。将其纯化为不溶性 His标记的产物。在筛选能在菌株HMS174(DE3)中高水平表达730_His克隆的克隆后,获得命名为 Cl和C2的C-未端截短的形式。简言之,用含有编码全长成熟730蛋白质的His标记的序 列的pET21b质粒转化recA菌株HMS 174 (DE3)。低频率得到转化体,其显示出两种表型 大集落和非常小的集落。分析了若干大集落和小集落对730-His克隆的表达。只有大集落 的细胞超量表达抗730A抗体识别的蛋白质。但是,不同集落中超量表达的蛋白质的分子量 各不相同。对其中的两个克隆进行测序表明这两种情况中,在编码730的C未端区域的序 列中发生了大肠杆菌IS序列的整合。这两个整合在Cl中产生了与另一个密码子的符合读 框的融合,在C2中产生了与另外12个密码子的符合读框的融合(图11)。产生的730 “突 变体”形式具有如下的序列
1761]730-C1 (ISl插入引起的-图11A)1762]1MADLAQDPFI TDNAQRQHYE PGGKYHLFGDPRGSVSDRTGKINVIQDYTH1763]51QMGNLLIQQA NINGTIGYHT RFSGHGHEEHAPFDNHAADSASEEKGNVDE1764]101GFTVYRLNWE GHEHHPADAY DGPKGGNYPKPTGARDEYTYHVNGTARSIK1765]151LNPTDTRSIR QRISDNYSNL GSNFSDRADEANRKMFEHNAKLDRffGNSME1766]201FINGVAAGAL NPFISAGEAL GIGDILYGTRYAIDKAAMRNIAPLPAEGKF1767]251AVIGGLGSVA GFEKNTREAV DRffIQENPNAAETVEAVFNVAAAAKVAKLA[1768]301 KAAKPGKAAV S⑶FADSYKK KLALSDSARQ LYQNAKYREA LDIHYEDLIR351 RKTDGSSKFI NGREIDAVTN DALIQAR*由插入产生的其它氨基酸下加下划线。730_C2(IS5插入引起的-图11B)1 MADLAQDPFI TDNAQRQHYE PGGKYHLFGD PRGSVSDRTG KINVIQDYTH51 QMGNLLIQQA NINGTIGYHT RFSGHGHEEH APFDNHAADS ASEEKGNVDE101 GFTVYRLNWE GHEHHPADAY DGPKGGNYPK PTGARDEYTY HVNGTARSIK151 LNPTDTRSIR QRISDNYSNL GSNFSDRADE ANRKMFEHNA KLDRffGNSME201 FINGVAAGAL NPFISAGEAL GIGDILYGTR YAIDKAAMRN IAPLPAEGKF251 AVIGGLGSVA GFEKNTREAV DRffIQENPNA AETVEAVFNV AAAAKVAKLA301 KAAKPGKAAV S⑶FADSYKK KLALSDSARQ LYQNAKYREA LGKVRISGEI351 LLG *由插入产生的其它氨基酸下加下划线。总之,730-C1形式的细胞内表达产生大很高水平的量蛋白质,且对宿主细胞无毒, 而天然C-未端的存在则是有毒的。这些数据表明730的“细胞内毒性”与蛋白质的C-未 端65氨基酸相关。用有或无前导肽(氨基酸1-26 ;缺失得到胞质表达)和有或无His-标记的表达, 已进行了 0RF29到前231或368氨基酸的相等的截短。实施例22-961中的结构域如上实施例9所述,在大肠杆菌中最佳地表达961的GSt融合。为了改进表达,将 蛋白质分成结构域(图12)。以YadA(由耶尔森氏菌产生的粘附素,已证明其是位于细胞表面上的粘附素,其 形成产生表面凸起的低聚物[Hoiczyk等(2000) EMBO J 19 =5989-99])为基础,设计了 916 的结构域,它们为前导肽、头部结构域、卷曲-螺旋区域(茎部)和膜锚着点结构域。有或无前导肽表达这些结构域,且任选地融合于C-未端His-标记或N-未端GST。 用SDS-PAGE和Western印迹,从过夜(ο/η)培育或用IPTG诱导3小时后,分析表达961不
同结构域的大肠杆菌克隆用于表达的蛋白质的产生和定位。结果如下 这些结果在大肠杆菌中显示· 961-L是高度表达的且位于外膜上。用Western印迹分析已检测到2个特异性条带一条为 45kDa(预计的分子量),另一条为 180kDa,表明961-L可以形成低聚物。 另外,这些聚集体在过夜培养物(无IPTG诱导)中表达得更多。用该克隆的OMV制备物免 疫接种小鼠,并获得血清。用过夜培养物(主要为寡聚物形式)的血清是杀菌的;IPTG-诱 导的培养物(主要为单体)不是杀菌的。· 961 A1-L(在锚区域中部分缺失)是高度表达的,且位于外膜,但不形成低聚物;^geic-L(无锚区域)以可溶的形式产生,并被在上清液中输出。使用His-融合的ELISA和血清杀菌试验中的滴定度如下 用表达不同形式961 (961、961_L、961 A1-I^pgeic-L)的大肠杆菌克隆研究了 961 是否是粘附素(参见YadA)。用(a)人上皮细胞和(b)大肠杆菌克隆(过夜培育或IPTG诱 导3小时后),进行粘附试验。过夜培育的961-L(961 A1-L)和IPTG诱导的961c_L(在表 面上表达蛋白质的克隆)粘附于人上皮细胞。也将961c用于杂交蛋白(见上)。由于961和其结构域变体指导高效表达,它们 理想地适用于杂交蛋白的N-未端部分。实施例23-其它杂交体以下显示了本发明的其它杂交蛋白(同样参见图14)。当与单独蛋白质相比时,它 们是有利的
1798]0RF46.1-7411799]1ATGTCAGATTTGGCAAACGATTCTTTTATCCGGCAGGTTCTCGACCGTCA1800]51GCATTTCGAACCCGACGGGAAATACCACCTATTCGGCAGCAGGGGGGAAC1801]101TTGCCGAGCGCAGCGGCCATATCGGATTGGGAAAAATACAAAGCCATCAG1802]151TTGGGCAACCTGATGATTCAACAGGCGGCCATTAAAGGAAATATCGGCTA1803]201CATTGTCCGCTTTTCCGATCACGGGCACGAAGTCCATTCCCCCTTCGACA1804]251ACCATGCCTCACATTCCGATTCTGATGAAGCCGGTAGTCCCGTTGACGGA1805]301TTTAGCCTTTACCGCATCCATTGGGACGGATACGAACACCATCCCGCCGA1806]351CGGCTATGACGGGCCACAGGGCGGCGGCTATCCCGCTCCCAAAGGCGCGA1807]401GGGATATATACAGCTACGACATAAAAGGCGTTGCCCAAAATATCCGCCTC1808]451AACCTGACCGACAACCGCAGCACCGGACAACGGCTTGCCGACCGTTTCCA1809]501CAATGCCGGTAGTATGCTGACGCAAGGAGTAGGCGACGGATTCAAACGCG1810]551CCACCCGATACAGCCCCGAGCTGGACAGATCGGGCAATGCCGCCGAAGCC1811]601TTCAACGGCACTGCAGATATCGTTAAAAACATCATCGGCGCGGCAGGAGA1812]651AATTGTCGGCGCAGGCGATGCCGTGCAGGGCATAAGCGAAGGCTCAAACA
691813]7011814]7511815]8011816]8511817]9011818]9511819]10011820]10511821]11011822]11511823]12011824]12511825]13011826]13511827]14011828]14511829]15011830]15511831]16011832]16511833]17011834]17511835]18011836]18511837]19011838]19511839]20011840]11841]511842]1011843]1511844]2011845]2511846]3011847]3511848]4011849]4511850]5011851]551
TTGCTGTCAT ( CGCATCAACG , AGCCATCCGC ( AAGCCGTCAG 丨 GCTGTTCGGG ( GCGGTCGCAG , GCGACAATTT ‘ TCCCGAAATA ‘ CACCTCCTCA , ACCAACGCCA ι AATTTTGAGA , CGCCGCCGAC , ACCATAAAGA ι AAAAACGAGA , AAACGGTGAC , GTTTCGACTT ‘ GAGAGTGGAG , CTTTCAGACC ( CGAAACGCCA ( GACAAGCTTC TTCAGACGAT AGCAGGGAAA GACGTGGCCG CAGCGGTTCC GTATCTTTGG ACCGTAAACG CCACCACCAC MSDLANDSFI LGNLMIQQAA FSLYRIHWDG NLTDNRSTGQ FNGTADIVKN RINDLADMAQ AVRGKYGLGG SRNIRSNLEQ NFEKHVKYDT KNEKLKLAAQ ESGEFQVYKQ DKLPEGGRAT
GCACGGCTTG ( ATTTGGCAGA ' GATTGGGCAG ' CAATATCTTT , GAAAATACGG 丨 ATGGGCGCGA ' TGCCGATGCG ( TCCGTTCAAA ι ACCGTGCCGC ι CCCGAAGACA ( AGCACGTGAA , ATCGGTGCGG ( CAAAGGTTTG ι AACTGAAGCT ( AGCCTCAATA 丨 TATCCGCCAA , AGTTCCAAGT , GAGCAAATAC , GTTCAGAATC ( CCGAAGGCGG 'GCCGGCGGAA t CGGCAAAATC i CCGCCGATAT GTCCTTTACA i CGGAAAAGCC i GCATACGCCA CACCACTGA RQVLDRQHFE t IKGNIGYIVR i YEHHPADGYD ! RLADRFHNAG IIGAAGEIVG )LKDYAAAAIR i ITAHPIKRSQ )RYGKENITSS 'GSGGGGVAAD )GAEKTYGNGD ! SHSALTAFQT ’ YRGTAFGSDD
GGTCTGCTTT ι TATGGCGCAA 丨 TCCAAAACCC 丨 ATGGCAGCCA ‘ CTTGGGCGGC , TCGCATTGCC ι GCATACGCCA 」 CTTGGAGCAG ι CGTCAAACGG 丨 GGCGTACCGT ‘ ATATGATACG 丨 GGCTTGCCGA ‘ CAGTCTTTGA 丨 GGCGGCACAA 丨 CGGGCAAATT 丨 ATCGAAGTGG 」 ATACAAACAA , AAGATTCGGA 丨 GGCGACATAG ι i CAGGGCGACA t AACTGACCTA GAACATTTGA ’ CAAGCCGGAT t ACCAAGCCGA CAGGAAGTTG t TATCGGCCTT
;PDGKYHLFGS FSDHGHEVHS ι GPQGGGYPAP i SMLTQGVGDG i AGDAVQGISE DffAVQNPNAA ! MGAIALPKGK ;TVPPSNGKNV ι IGAGLADALT ι SLNTGKLKND ’ EQIQDSEHSG ι AGGKLTYTID
CCACCGAAAA 丨 CTCAAAGACT , CAATGCCGCA 丨 TCCCCATCAA , ATCACGGCAC , GAAAGGGAAA ‘ AATACCCGTC ι CGTTACGGCA , CAAAAATGTC , TTGACGGTAA , GGATCCGGAG ( TGCACTAACC ( CGCTGGATCA 丨 GGTGCGGAAA , GAAGAACGAC , ACGGGCAGCT 丨 AGCCATTCCG ι GCATTCCGGG , CGGGCGAACA ‘ t TATCGCGGGA t CACCATAGAT t AATCGCCAGA ’ GGAAAAGCGC t GAAAGGCAGT i CCGGCAGCGC ’ GCCGCCAAGC
;RGELAERSGH ;PFDNHASHSD ‘KGARDIYSYD
iFKRATRYSPE ;GSNIAVMHGL
tQGIEAVSNIF SAVSDNFADA
rKLADQRHPKT
’APLDHKDKGL
ιKVSRFDFIRQ
iKMVAKRQFRI
ιFAAKQGNGKI
CAAGATCGCG
ATGCCGCAGC
CAAGGCATAG
AGGGATTGGA
ATCCTATCAA
TCCGCCGTCA
CCCTTACCAT
AAGAAAACAT
AAACTGGCAG
AGGGTTTCCG
GGGGTGGTGT
GCACCGCTCG
CTCCATCAGG
AAACTTATGH
AAGGTCAGCC
CATTACCTTG
CCTTAACCGC
AAGATGGTTG
TACATCTTTT
t CGGCGTTCGG
’ TTCGCCGCCA
t ACTCAATGTCATGCCGTCAT
‘TACTCCCTCGGGAAGTGAAAAACTCGAGCA601DLAAADIKPDGKRHAVISGSVLYNQAEKGSYSLGIFGGKAQEVAGSAEVK[1853]651TVNGIRHIGLAAKQLEHHHHHH*[1854]0RF46.1-961[1855]1ATGTCAGATTTGGCAAACGATTCTTTTATCCGGCAGGTTCTCGACCGTCA[1856]51GCATTTCGAACCCGACGGGAAATACCACCTATTCGGCAGCAGGGGGGAAC[1857]101TTGCCGAGCGCAGCGGCCATATCGGATTGGGAAAAATACAAAGCCATCAG[1858]151TTGGGCAACCTGATGATTCAACAGGCGGCCATTAAAGGAAATATCGGCTA[1859]201CATTGTCCGCTTTTCCGATCACGGGCACGAAGTCCATTCCCCCTTCGACA[1860]251ACCATGCCTCACATTCCGATTCTGATGAAGCCGGTAGTCCCGTTGACGGA[1861]301TTTAGCCTTTACCGCATCCATTGGGACGGATACGAACACCATCCCGCCGA[1862]351CGGCTATGACGGGCCACAGGGCGGCGGCTATCCCGCTCCCAAAGGCGCGA[1863]401GGGATATATACAGCTACGACATAAAAGGCGTTGCCCAAAATATCCGCCTC[1864]451AACCTGACCGACAACCGCAGCACCGGACAACGGCTTGCCGACCGTTTCCA[1865]501CAATGCCGGTAGTATGCTGACGCAAGGAGTAGGCGACGGATTCAAACGCG[1866]551CCACCCGATACAGCCCCGAGCTGGACAGATCGGGCAATGCCGCCGAAGCC[1867]601TTCAACGGCACTGCAGATATCGTTAAAAACATCATCGGCGCGGCAGGAGA[1868]651AATTGTCGGCGCAGGCGATGCCGTGCAGGGCATAAGCGAAGGCTCAAACA[1869]701TTGCTGTCATGCACGGCTTGGGTCTGCTTTCCACCGAAAACAAGATGGCG[1870]751CGCATCAACGATTTGGCAGATATGGCGCAACTCAAAGACTATGCCGCAGC[1871]801AGCCATCCGCGATTGGGCAGTCCAAAACCCCAATGCCGCACAAGGCATAG[1872]851AAGCCGTCAGCAATATCTTTATGGCAGCCATCCCCATCAAAGGGATTGGA[1873]901GCTGTTCGGGGAAAATACGGCTTGGGCGGCATCACGGCACATCCTATCAA[1874]951GCGGTCGCAGATGGGCGCGATCGCATTGCCGAAAGGGAAATCCGCCGTCA[1875]1001GCGACAATTTTGCCGATGCGGCATACGCCAAATACCCGTCCCCTTACCAT[1876]1051TCCCGAAATATCCGTTCAAACTTGGAGCAGCGTTACGGCAAAGAAAACAT[1877]1101CACCTCCTCAACCGTGCCGCCGTCAAACGGCAAAAATGTCAAACTGGCAG[1878]1151ACCAACGCCACCCGAAGACAGGCGTACCGTTTGACGGTAAAGGGTTTCCG[1879]1201AATTTTGAGAAGCACGTGAAATATGATACGGGATCCGGAGGAGGAGGAGC[1880]1251CACAAACGACGACGATGTTAAAAAAGCTGCCACTGTGGCCATTGCTGCTG[1881]1301CCTACAACAATGGCCAAGAAATCAACGGTTTCAAAGCTGGAGAGACCATC[1882]1351TACGACATTGATGAAGACGGCACAATTACCAAAAAAGACGCAACTGCAGC[1883]1401CGATGTTGAAGCCGACGACTTTAAAGGTCTGGGTCTGAAAAAAGTCGTGA[1884]1451CTAACCTGACCAAAACCGTCAATGAAAACAAACAAAACGTCGATGCCAAA[1885]1501GTAAAAGCTGCAGAATCTGAAATAGAAAAGTTAACAACCAAGTTAGCAGA[1886]1551CACTGATGCCGCTTTAGCAGATACTGATGCCGCTCTGGATGCAACCACCA[1887]1601ACGCCTTGAATAAATTGGGAGAAAATATAACGACATTTGCTGAAGAGACT[1888]1651AAGACAAATATCGTAAAAATTGATGAAAAATTAGAAGCCGTGGCTGATAC[1889]1701CGTCGACAAGCATGCCGAAGCATTCAACGATATCGCCGATTCATTGGATG[1890]1751AAACCAACACTAAGGCAGACGAAGCCGTCAAAACCGCCAATGAAGCCAAA1891]1801CAGACGGCCG AAGAAACCAA ACAAAACGTC GATGCCAAAG TAAAAGCTGC1892]1851AGAAACTGCA GCAGGCAAAG CCGAAGCTGC CGCTGGCACA GCTAATACTG1893]1901CAGCCGACAA GGCCGAAGCT GTCGCTGCAA AAGTTACCGA CATCAAAGCT1894]1951GATATCGCTA CGAACAAAGA TAATATTGCT AAAAAAGCAA ACAGTGCCGA1895]2001CGTGTACACC AGAGAAGAGT CTGACAGCAA ATTTGTCAGA ATTGATGGTC1896]2051TGAACGCTACTACCGAAAAATTGGACACACGCTTGGCTTCTGCTGAAAAA1897]2101TCCATTGCCGATCACGATACTCGCCTGAACGGTTTGGATAAAACAGTGTC1898]2151AGACCTGCGCAAAGAAACCCGCCAAGGCCTTGCAGAACAAGCCGCGCTCT1899]2201CCGGTCTGTTCCAACCTTACAACGTGGGTCGGTTCAATGTAACGGCTGCA1900]2251GTCGGCGGCTACAAATCCGAATCGGCAGTCGCCATCGGTACCGGCTTCCG1901]2301CTTTACCGAAAACTTTGCCGCCAAAGCAGGCGTGGCAGTCGGCACTTCGT1902]2351CCGGTTCTTCCGCAGCCTACCATGTCGGCGTCAATTACGAGTGGCTCGAG1903]2401CACCACCACCACCACCACTGA1904]1MSDLANDSFIRQVLDRQHFEPDGKYHLFGSRGELAERSGHIGLGKIQSHQ1905]51LGNLMIQQAAIKGNIGYIVRFSDHGHEVHSPFDNHASHSDSDEAGSPVDG1906]101FSLYRIHWDGYEHHPADGYDGPQGGGYPAPKGARDIYSYDIKGVAQNIRL1907]151NLTDNRSTGQRLADRFHNAGSMLTQGVGDGFKRATRYSPELDRSGNAAEA1908]201FNGTADIVKNIIGAAGEIVGAGDAVQGISEGSNIAVMHGLGLLSTENKMA1909]251RINDLADMAQLKDYAAAAIRDffAVQNPNAAQGIEAVSNIFMAAIPIKGIG1910]301AVRGKYGLGGITAHPIKRSQMGAIALPKGKSAVSDNFADAAYAKYPSPYH1911]351SRNIRSNLEQRYGKENITSSTVPPSNGKNVKLADQRHPKTGVPFDGKGFP1912]401NFEKHVKYDTGSGGGGATNDDDVKKAATVAIAAAYNNGQEINGFKAGETI1913]451YDIDEDGTITKKDATAADVEADDFKGLGLKKVVTNLTKTVNENKQNVDAK1914]501VKAAESEIEKLTTKLADTDAALADTDAALDATTNALNKLGENITTFAEET1915]551KTNIVKIDEKLEAVADTVDKHAEAFNDIADSLDETNTKADEAVKTANEAK1916]601QTAEETKQNVDAKVKAAETAAGKAEAAAGTANTAADKAEAVAAKVTDIKA1917]651DIATNKDNIAKKANSADVYTREESDSKFVRIDGLNATTEKLDTRLASAEK1918]701SIADHDTRLNGLDKTVSDLRKETRQGLAEQAALSGLFQPYNVGRFNVTAA1919]751VGGYKSESAVAIGTGFRFTENFAAKAGVAVGTSSGSSAAYHVGVNYEffLE1920]801HHHHHH *1921]0RF46.l-961c1922]1ATGTCAGATTTGGCAAACGATTCTTTTATCCGGCAGGTTCTCGACCGTCA1923]51GCATTTCGAACCCGACGGGAAATACCACCTATTCGGCAGCAGGGGGGAAC1924]101TTGCCGAGCGCAGCGGCCATATCGGATTGGGAAAAATACAAAGCCATCAG1925]151TTGGGCAACCTGATGATTCAACAGGCGGCCATTAAAGGAAATATCGGCTA1926]201CATTGTCCGCTTTTCCGATCACGGGCACGAAGTCCATTCCCCCTTCGACA1927]251ACCATGCCTCACATTCCGATTCTGATGAAGCCGGTAGTCCCGTTGACGGA1928]301TTTAGCCTTTACCGCATCCATTGGGACGGATACGAACACCATCCCGCCGA1929]351CGGCTATGACGGGCCACAGGGCGGCGGCTATCCCGCTCCCAAAGGCGCGA
721930]401GGGATATATACAGCTACGACATAAAAGGCGTTGCCCAAAATATCCGCCTC1931]451AACCTGACCGACAACCGCAGCACCGGACAACGGCTTGCCGACCGTTTCCA1932]501CAATGCCGGTAGTATGCTGACGCAAGGAGTAGGCGACGGATTCAAACGCG1933]551CCACCCGATACAGCCCCGAGCTGGACAGATCGGGCAATGCCGCCGAAGCC1934]601TTCAACGGCACTGCAGATATCGTTAAAAACATCATCGGCGCGGCAGGAGA1935]651AATTGTCGGCGCAGGCGATGCCGTGCAGGGCATAAGCGAAGGCTCAAACA1936]701TTGCTGTCATGCACGGCTTGGGTCTGCTTTCCACCGAAAACAAGATGGCG1937]751CGCATCAACGATTTGGCAGATATGGCGCAACTCAAAGACTATGCCGCAGC1938]801AGCCATCCGCGATTGGGCAGTCCAAAACCCCAATGCCGCACAAGGCATAG1939]851AAGCCGTCAGCAATATCTTTATGGCAGCCATCCCCATCAAAGGGATTGGA1940]901GCTGTTCGGGGAAAATACGGCTTGGGCGGCATCACGGCACATCCTATCAA1941]951GCGGTCGCAGATGGGCGCGATCGCATTGCCGAAAGGGAAATCCGCCGTCA1942]1001GCGACAATTTTGCCGATGCGGCATACGCCAAATACCCGTCCCCTTACCAT1943]1051TCCCGAAATATCCGTTCAAACTTGGAGCAGCGTTACGGCAAAGAAAACAT1944]1101CACCTCCTCAACCGTGCCGCCGTCAAACGGCAAAAATGTCAAACTGGCAG1945]1151ACCAACGCCACCCGAAGACAGGCGTACCGTTTGACGGTAAAGGGTTTCCG1946]1201AATTTTGAGAAGCACGTGAAATATGATACGGGATCCGGAGGAGGAGGAGC1947]1251CACAAACGACGACGATGTTAAAAAAGCTGCCACTGTGGCCATTGCTGCTG1948]1301CCTACAACAATGGCCAAGAAATCAACGGTTTCAAAGCTGGAGAGACCATC1949]1351TACGACATTGATGAAGACGGCACAATTACCAAAAAAGACGCAACTGCAGC1950]1401CGATGTTGAAGCCGACGACTTTAAAGGTCTGGGTCTGAAAAAAGTCGTGA1951]1451CTAACCTGACCAAAACCGTCAATGAAAACAAACAAAACGTCGATGCCAAA1952]1501GTAAAAGCTGCAGAATCTGAAATAGAAAAGTTAACAACCAAGTTAGCAGA1953]1551CACTGATGCCGCTTTAGCAGATACTGATGCCGCTCTGGATGCAACCACCA1954]1601ACGCCTTGAATAAATTGGGAGAAAATATAACGACATTTGCTGAAGAGACT1955]1651AAGACAAATATCGTAAAAATTGATGAAAAATTAGAAGCCGTGGCTGATAC1956]1701CGTCGACAAGCATGCCGAAGCATTCAACGATATCGCCGATTCATTGGATG1957]1751AAACCAACACTAAGGCAGACGAAGCCGTCAAAACCGCCAATGAAGCCAAA1958]1801CAGACGGCCGAAGAAACCAAACAAAACGTCGATGCCAAAGTAAAAGCTGC1959]1851AGAAACTGCAGCAGGCAAAGCCGAAGCTGCCGCTGGCACAGCTAATACTG1960]1901CAGCCGACAAGGCCGAAGCTGTCGCTGCAAAAGTTACCGACATCAAAGCT1961]1951GATATCGCTACGAACAAAGATAATATTGCTAAAAAAGCAAACAGTGCCGA1962]2001CGTGTACACCAGAGAAGAGTCTGACAGCAAATTTGTCAGAATTGATGGTC1963]2051TGAACGCTACTACCGAAAAATTGGACACACGCTTGGCTTCTGCTGAAAAA1964]2101TCCATTGCCGATCACGATACTCGCCTGAACGGTTTGGATAAAACAGTGTC1965]2151AGACCTGCGCAAAGAAACCCGCCAAGGCCTTGCAGAACAAGCCGCGCTCT1966]2201CCGGTCTGTTCCAACCTTACAACGTGGGTCTCGAGCACCACCACCACCAC1967]2251CACTGA1968]1MSDLANDSFIRQVLDRQHFEPDGKYHLFGSRGELAERSGHIGLGKIQSHQ[1969]51LGNLMIQQAAIKGNIGYIVRFSDHGHEVHSPFDNHASHSDSDEAGSPVDG[1970]101FSLYRIHWDGYEHHPADGYDGPQGGGYPAPKGARDIYSYDIKGVAQNIRL[1971]151NLTDNRSTGQRLADRFHNAGSMLTQGVGDGFKRATRYSPELDRSGNAAEA[1972]201FNGTADIVKNIIGAAGEIVGAGDAVQGISEGSNIAVMHGLGLLSTENKMA[1973]251RINDLADMAQLKDYAAAAIRDffAVQNPNAAQGIEAVSNIFMAAIPIKGIG[1974]301AVRGKYGLGGITAHPIKRSQMGAIALPKGKSAVSDNFADAAYAKYPSPYH[1975]351SRNIRSNLEQRYGKENITSSTVPPSNGKNVKLADQRHPKTGVPFDGKGFP[1976]401NFEKHVKYDTGSGGGGATNDDDVKKAATVAIAAAYNNGQEINGFKAGETI[1977]451YDIDEDGTITKKDATAADVEADDFKGLGLKKVVTNLTKTVNENKQNVDAK[1978]501VKAAESEIEKLTTKLADTDAALADTDAALDATTNALNKLGENITTFAEET[1979]551KTNIVKIDEKLEAVADTVDKHAEAFNDIADSLDETNTKADEAVKTANEAK[1980]601QTAEETKQNVDAKVKAAETAAGKAEAAAGTANTAADKAEAVAAKVTDIKA[1981]651DIATNKDNIAKKANSADVYTREESDSKFVRIDGLNATTEKLDTRLASAEK[1982]701SIADHDTRLNGLDKTVSDLRKETRQGLAEQAALSGLFQPYNVGLEHHHHH[1983]751H*[1984]961-0RF46.1[1985]1ATGGCCACAAACGACGACGATGTTAAAAAAGCTGCCACTGTGGCCATTGC[1986]51TGCTGCCTACAACAATGGCCAAGAAATCAACGGTTTCAAAGCTGGAGAGA[1987]101CCATCTACGACATTGATGAAGACGGCACAATTACCAAAAAAGACGCAACT[1988]151GCAGCCGATGTTGAAGCCGACGACTTTAAAGGTCTGGGTCTGAAAAAAGT[1989]201CGTGACTAACCTGAC AAAACCGTCAATGAAAACAAACAAAACGTCGATG[1990]251CCAAAGTAAAAGCTGCAGAATCTGAAATAGAAAAGTTAACAACCAAGTTA[1991]301GCAGACACTGATGCCGCTTTAGCAGATACTGATGCCGCTCTGGATGCAAC[1992]351CACCAACGCCTTGAATAAATTGGGAGAAAATATAACGACATTTGCTGAAG[1993]401AGACTAAGACAAATATCGTAAAAATTGATGAAAAATTAGAAGCCGTGGCT[1994]451GATACCGTCGACAAGCATGCCGAAGCATTCAACGATATCGCCGATTCATT[1995]501GGATGAAACCAACACTAAGGCAGACGAAGCCGTCAAAACCGCCAATGAAG[1996]551CCAAACAGACGGCCGAAGAAACCAAACAAAACGTCGATGCCAAAGTAAAA[1997]601GCTGCAGAAACTGCAGCAGGCAAAGCCGAAGCTGCCGCTGGCACAGCTAA[1998]651TACTGCAGCCGACAAGGCCGAAGCTGTCGCTGCAAAAGTTACCGACATCA[1999]701AAGCTGATATCGCTACGAACAAAGATAATATTGCTAAAAAAGCAAACAGT[2000]751GCCGACGTGTACACCAGAGAAGAGTCTGACAGCAAATTTGTCAGAATTGA[2001]801TGGTCTGAACGCTACTACCGAAAAATTGGACACACGCTTGGCTTCTGCTG[2002]851AAAAATCCATTGCCGATCACGATACTCGCCTGAACGGTTTGGATAAAACA[2003]901GTGTCAGACCTGCGCAAAGAAACCCGCCAAGGCCTTGCAGAACAAGCCGC[2004]951GCTCTCCGGTCTGTTCCAACCTTACAACGTGGGTCGGTTCAATGTAACGG[2005]1001CTGCAGTCGGCGGCTACAAATCCGAATCGGCAGTCGCCATCGGTACCGGC[2006]1051TTCCGCTTTACCGAAAACTTTGCCGCCAAAGCAGGCGTGGCAGTCGGCAC[2007]1101TTCGTCCGGTTCTTCCGCAGCCTACCATGTCGGCGTCAATTACGAGTGGG[2008]1151GATCCGGAGGAGGAGGATCAGATTTGGCAAACGATTCTTTTATCCGGCAG[2009]1201GTTCTCGACCGTCAGCATTTCGAACCCGACGGGAAATACCACCTATTCGG[2010]1251CAGCAGGGGGGAACTTGCCGAGCGCAGCGGCCATATCGGATTGGGAAAAA[2011]1301TACAAAGCCATCAGTTGGGCAACCTGATGATTCAACAGGCGGCCATTAAA[2012]1351GGAAATATCGGCTACATTGTCCGCTTTTCCGATCACGGGCACGAAGTCCA[2013]1401TTCCCCCTTCGACAACCATGCCTCACATTCCGATTCTGATGAAGCCGGTA[2014]1451GTCCCGTTGACGGATTTAGCCTTTACCGCATCCATTGGGACGGATACGAA[2015]1501CACCATCCCGCCGACGGCTATGACGGGCCACAGGGCGGCGGCTATCCCGC[2016]1551TCCCAAAGGCGCGAGGGATATATACAGCTACGACATAAAAGGCGTTGCCC[2017]1601AAAATATCCGCCTCAACCTGACCGACAACCGCAGCACCGGACAACGGCTT[2018]1651GCCGACCGTTTCCACAATGCCGGTAGTATGCTGACGCAAGGAGTAGGCGA[2019]1701CGGATTCAAACGCGCCACCCGATACAGCCCCGAGCTGGACAGATCGGGCA[2020]1751ATGCCGCCGAAGCCTTCAACGGCACTGCAGATATCGTTAAAAACATCATC[2021]1801GGCGCGGCAGGAGAAATTGTCGGCGCAGGCGATGCCGTGCAGGGCATAAG[2022]1851CGAAGGCTCAAACATTGCTGTCATGCACGGCTTGGGTCTGCTTTGCACCG[2023]1901AAAACAAGATGGCGCGCATCAACGATTTGGCAGATATGGCGCAACTCAAA[2024]1951GACTATGCCGCAGCAGCCATCCGCGATTGGGCAGTCCAAAACCCCAATGC[2025]2001CGCACAAGGCATAGAAGCCGTCAGCAATATCTTTATGGCAGCCATCCCCA[2026]2051TCAAAGGGATTGGAGCTGTTCGGGGAAAATACGGCTTGGGCGGCATCACG[2027]2101GCACATCCTATCAAGCGGTCGCAGATGGGCGCGATCGCATTGCCGAAAGG[2028]2151GAAATCCGCCGTCAGCGACAATTTTGCCGATGCGGCATACGCCAAATACC[2029]2201CGTCCCCTTACCATTCCCGAAATATCCGTTCAAACTTGGAGCAGCGTTAC[2030]2251GGCAAAGAAAACATCACCTCCTCAACCGTGCCGCCGTCAAACGGCAAAAA[2031]2301TGTCAAACTGGCAGACCAACGCCACCCGAAGACAGGCGTACCGTTTGACG[2032]2351GTAAAGGGTTTCCGAATTTTGAGAAGCACGTGAAATATGATACGCTCGAG[2033]2401CACCACCACCACCACCACTGA1MATNDDDVKKAATVAIAAAYNNGQEINGFKAGETIYDIDEDGTITKKDAT[2035]51AADVEADDFKGLGLKKVVTNLTKTVNENKQNVDAKVKAAESEIEKLTTKL[2036]101ADTDAALADTDAALDATTNALNKLGENITTFAEETKTNIVKIDEKLEAVA[2037]151DTVDKHAEAFNDIADSLDETNTKADEAVKTANEAKQTAEETKQNVDAKVK[2038]201AAETAAGKAEAAAGTANTAADKAEAVAAKVTDIKADIATNKDNIAKKANS[2039]251ADVYTREESDSKFVRIDGLNATTEKLDTRLASAEKSIADHDTRLNGLDKT[2040]301VSDLRKETRQGLAEQAALSGLFQPYNVGRFNVTAAVGGYKSESAVAIGTG[2041]351FRFTENFAAKAGVAVGTSSGSSAAYHVGVNYEffGSGGGGSDLANDSFIRQ[2042]401VLDRQHFEPDGKYHLFGSRGELAERSGHIGLGKIQSHQLGNIiOQQAAIK[2043]451GNIGYIVRFSDHGHEVHSPFDNHASHSDSDEAGSPVDGFSLYRIHWDGYE[2044]501HHPADGYDGPQGGGYPAPKGARDIYSYDIKGVAQNIRLNLTDNRSTGQRL[2045]551ADRFHNAGSMLTQGVGDGFKRATRYSPELDRSGNAAEAFNGTADIVKNII[2046]601GAAGEIVGAGDAVQGISEGSNIAVMHGLGLLSTENKMARINDLADMAQLK
75[2047651DYAAAAIRDffAVQNPNAAQGIEAVSNIFMAAIPIKGIGAVRGKYGLGGIT[2048701AHPIKRSQMGAIALPKGKSAVSDNFADAAYAKYPSPYHSRNIRSNLEQRY[2049751GKENITSSTVPPSNGKNVKLADQRHPKTGVPFDGKGFPNFEKHVKYDTLE[2050801HHHHHH *[2051961-741[20521ATGGCCACAAACGACGACGATGTTAAAAAAGCTGCCACTGTGGCCATTGC[205351TGCTGCCTACAACAATGGCCAAGAAATCAACGGTTTCAAAGCTGGAGAGA[2054101CCATCTACGACATTGATGAAGACGGCACAATTACCAAAAAAGACGCAACT[2055151GCAGCCGATGTTGAAGCCGACGACTTTAAAGGTCTGGGTCTGAAAAAAGT[2056201CGTGACTAACCTGACCAAAACCGTCAATGAAAACAAACAAAACCTCGATG[2057251CCAAAGTAAAAGCTGCAGAATCTGAAATAGAAAAGTTAACAACCAAGTTA[2058301GCAGACACTGATGCCGCTTTAGCAGATACTGATGCCGCTCTGGATGCAAC[2059351CACCAACGCCTTGAATAAATTGGGAGAAAATATAACGACATTTGCTGAAG[2060401AGACTAAGACAAATATCGTAAAAATTGATGAAAAATTAGAAGCCGTGGCT[2061451GATACCGTCGACAAGCATGCCGAAGCATTCAACGATATCGCCGATTCATT[2062501GGATGAAACCAACACTAAGGCAGACGAAGCCGTCAAAACCGCCAATGAAC[2063551CCAAACAGACGGCCGAACAAACCAAACAAAACGTCGATGCCAAAGTAAAA[2064601GCTGCAGAAACTGCAGCAGGCAAAGCCGAAGCTGCCGCTGGCACAGCTAA[2065651TACTGCAGCCGACAAGGCCGAAGCTGTCGCTGCAAAAGTTACCGACATCA[2066701AAGCTGATATCGCTACGAACAAAGATAATATTGCTAAAAAAGCAAACAGT[2067751GCCCACGTGTACACCAGAGAAGAGTCTGACAGCAAATTTGTCAGAATTGA[2068801TGGTCTGAACGCTACTACCGAAAAATTGGACACACGCTTGGCTTCTGCTG[2069851AAAAATCCATTGCCGATCACGATACTCGCCTGAACGGTTTGGATAAAACA[2070901GTGTCAGACCTGCGCAAAGAAACCCGCCAAGGCCTTGCAGAACAAGCCGC[2071951GCTCTCCGGTCTGTTCCAACCTTACAACGTGGGTCGGTTCAATGTAACGG[20721001CTGCAGTCGGCGGCTACAAATCCGAATCGGCAGTCGCCATCGGTACCGGC[20731051TTCCGCTTTACCGAAAACTTTGCCGCCAAAGCAGGCGTGGCAGTCGGCAC[20741101TTCGTCCGGTTCTTCCGCAGCCTACCATGTCGGCGTCAATTACGAGTGGG[20751151GATCCGGAGGGGGTGGTGTCGCCGCCGACATCGGTGCGGGGCTTGCCGAT[20761201GCACTAACCGCACCGCTCGACCATAAAGACAAAGGTTTGCAGTCTTTGAC[20771251GCTGGATCAGTCCGTCAGGAAAAACGAGAAACTGAAGCTGGCGGCACAAG[20781301GTGCGGAAAAAACTTATGGAAACGGTGACAGCCTCAATACGGGCAAATTG[20791351AAGAACGACAAGGTCAGCCGTTTCGACTTTATCCGCCAAATCGAAGTGGA[20801401CGGGCAGCTCATTACCTTGGAGAGTGGAGAGTTCCAAGTATACAAACAAA[20811451GCCATTCCGCCTTAACCGCCTTTCAGACCGAGCAAATACAAGATTCGGAG[20821501CATTCCGGGAAGATGGTTGCGAAACGCCAGTTCAGAATCGGCGACATAGC[20831551GGGCGAACATACATCTTTTGACAAGCTTCCCGAAGGCGGCAGGGCGACAT[20841601ATCGCGGGACGGCGTTCGGTTCAGACGATGCCGGCGGAAAACTGACCTAC[20851651ACCATAGATTTCGCCGCCAAGCAGGGAAACGGCAAAATCGAACATTTGAA2086]1701
2087]1751
2088]1801
2089]1851
2090]1901
2091]1
2092]51
2093]101
2094]151
2095]201
2096]251
2097]301
2098]351
2099]401
2100]451
2101]501
2102]551
2103]601
2104]
2105]1
2106]51
2107]101
2108]151
2109]201
2110]251
2111]301
2112]351
2113]401
2114]451
2115]501
2116]551
2117]601
2118]651
2119]701
2120]751
2121]801
2122]851
2123]901
2124]951
ATCGCCAGAA GAAAACGCCA AAAGGCAGTT CGGCAGCGCG CCGCCAAGCA MATNDDDVKK AADVEADDFK ADTDAALADT DTVDKHAEAF AAETAAGKAE ADVYTREESD VSDLRKETRQ FRFTENFAAK ALTAPLDHKD KNDKVSRFDF HSGKMVAKRQ TIDFAAKQGN KGSYSLGIFG
ATGGCCACAA TGCTGCCTAC CCATCTACGA GCAGCCGATG CGTGACTAAC CCAAAGTAAA GCAGACACTG CACCAACGCC AGACTAAGAC GATACCGTCG GGATGAAACC CCAAACAGAC GCTGCAGAAA TACTGCAGCC AAGCTGATAT GCCGACGTGT TGGTCTGAAC AAAAATCCAT GTGTCAGACC GCTCTCCGGT
CTCAATGTCG TGCCGTCATC ACTCCCTCGG GAAGTGAAAA ACTCGAGCAC AATVAIAAAY GLGLKKVVTN DAALDATTNA NDIADSLDET AAAGTANTAA SKFVRIDGLN GLAEQAALSG AGVAVGTSSG KGLQSLTLDQ IRQIEVDGQL FRI⑶IAGEH GKIEHLKSPE GKAQEVAGSA
ACGACGACGA AACAATGGCC CATTGATGAA TTGAAGCCGA CTGACCAAAA AGCTGCAGAA ATGCCGCTTT TTGAATAAAT AAATATCGTA ACAAGCATGC AACACTAAGG GGCCGAAGAA CTGCAGCAGG GACAAGGCCG CGCTACGAAC ACACCAGAGA GCTACTACCG TGCCGATCAC TGCGCAAAGA CTGTTCCAAC
ACCTGGCCGC AGCGGTTCCG TATCTTTGGC CCGTAAACGG CACCACCACC NNGQEINGFK LTKTVNENKQ LNKLGENITT NTKADEAVKT DKAEAVAAKV ATTEKLDTRL LFQPYNVGRF SSAAYHVGVN SVRKNEKLKL ITLESGEFQV TSFDKLPEGG LNVDLAAADI EVKTVNGIRH
TGTTAAAAAA AAGAAATCAA GACGGCACAA CGACTTTAAA CCGTCAATGA TCTGAAATAG AGCAGATACT TGGGAGAAAA AAAATTGATG CGAAGCATTC CAGACGAAGC ACCAAACAAA CAAAGCCGAA AAGCTGTCGC AAAGATAATA AGAGTCTGAC AAAAATTGGA GATACTCGCC AACCCGCCAA CTTACAACGT
CGCCGATATC
TCCTTTACAA
GGAAAAGCCC
CATACGCCAT
ACCACTGA
AGETIYDIDE
NVDAKVKAAE
FAEETKTNIV
ANEAKQTAEE
TDIKADIATN
ASAEKSIADH
NVTAAVGGYK
YEffGSGGGGV
AAQGAEKTYG
YKQSHSALTA
RATYRGTAFG
KPDGKRHAVI
IGLAAKQLEH
GCTGCCACTG CGGTTTCAAA TTACCAAAAA GGTCTGGGTC AAACAAACAA AAAAGTTAAC GATGCCGCTC TATAACGACA AAAAATTAGA AACGATATCG CGTCAAAACC ACGTCGATGC GCTGCCGCTG TGCAAAAGTT TTGCTAAAAA AGCAAATTTG CACACGCTTG TGAACGGTTT GGCCTTGCAG GGGTCGGTTC
AAGCCGGATG CCAAGCCGAG AGGAAGTTGC ATCGGCCTTG
DGTITKKDAT SEIEKLTTKL KIDEKLEAVA TKQNVDAKVK KDNIAKKANS DTRLNGLDKT SESAVAIGTG AADIGAGLAD NGDSLNTGKL FQTEQIQDSE SDDAGGKLTY SGSVLYNQAE HHHHH *
TGGCCATTGC GCTGGAGAGA AGACGCAACT TGAAAAAAGT AACGTCGATG AACCAAGTTA TGGATGCAAC TTTGCTGAAG AGCCGTGGCT CCGATTCATT GCCAATGAAG CAAAGTAAAA GCACAGCTAA ACCGACATCA AGCAAACAGT TCAGAATTGA GCTTCTGCTG GGATAAAACA AACAAGCCGC AATGTAACGG
961-9832125]10012126]10512127]11012128]11512129]12012130]12512131]13012132]13512133]14012134]14512135]15012136]15512137]16012138]16512139]17012140]17512141]18012142]18512143]19012144]19512145]20012146]20512147]21012148]21512149]22012150]22512151]23012152]23512153]24012154]24512155]25012156]25512157]26012158]26512159]27012160]27512161]28012162]28512163]2901
CTGCAGTCGG TTCCGCTTTA TTCGTCCGGT GATCCGGCGG GGTATCGGCA TTACGCCGGT CCGGTCGGGA CCCCCCCCGA CAAGAATTTG GCGGGGTAGA TCCTTTCCCG CAAAAACTAT GTAAAGACAT GCAAAGCCGA GGTCTCCCAT GTATTGCGCC AAGAACGAAA CGAACGTGGC CAGGCACTGC CAAGCGTTGC CCTGATGCAA AAAACATGCT AACACATATG TATCACAGTC TGTATCCAGA GGAATTACTG TTTCACCCGT CCATCGTAAC AGCAACGACA TGCAGTCGGC AGGCCATGAA ACGAAAGGTA CACGGGCGGC ACAACACCTA TACGGCAACA TTATAACGGG ATCTGGCAGA GGCAGTCTGC ACTGCTGAAA
CGGCTACAAA CCGAAAACTT TCTTCCGCAG AGGCGGCACT GCAACAGCAG ATCAAGAACG TGACGTTGCG ATCTGCATAC ATCAACCTCA GGTAGGTATC AACTGTATGG ACGGCGTATA TGAAGCTTCT CGGATATCCG ATTATTGGCG CGATGCGACG TGATGGTTGC GTGCGCATCG CGACCTTTTC TCGACTATTC CAGAGCGATT TTTCATCTTT CCCTATTGCC GCAGGCGTAG ACCGGGTACA CCATGTGGTG ACAAACCCGA CGGCACGGCG ACCTGCGTAC GTGGACAGCA CGGACCCGCG CATCCGATAT CTGATCAAAA TACGGGCAAA ACAAATCGGA GCGGCATCCG TACCGACCAA AGCTGGACGG GTGGACGGTA
TCCGAATCGG TGCCGCCAAA CCTACCATGT TCTGCGCCCG AGCAACAACA AAATGTGCAA GTTACAGACA CGGAGACTTT AACCTGCAAT GTCGACACAG CAGAAAAGAA TGCGGAAGGA TTCGACGATG CCACGTAAAA GGCGTTCCGT CTACACATAA AGCCATCCGC TCAATAACAG CAAATAGCCA CGGCGGTGAT ACGGCAACCT TCGACAGGCA ATTTTATGAA ACCGCAGTGG GAACCGCTTG CCTGTCGGCA TTCAAATTGC GCTCTGCTGC CACGTTGCTG AGTTCGGCTG TCCTTTCCGT TGCCTACTCC AAGGCGGCAG ACCATTATCG TATGCGCGTC GCGGCAGCCT TCCGGCGCAA CAAAGGTACG CGGCGATTAT
CAGTCGCCAT GCAGGCGTGG CGGCGTCAAT ACTTCAATGC GCGAAATCAG AGACAGAAGC GGGATGCCAA CCAAACCCAA TGAAGCAGGC GCGAATCCGT CACGGCTATA AGCGCCTGAA AGGCCGTTAT GAAATCGGAC GGACGGCAGA TGAATACGAA AATGCATGGG TTTTGGAACA ATTCCCAGGA AAAACAGACG GTCCTACCAC ATGACGCACA AAAGACGCTC AGAAAAGTTC AGTATGGCTC CCCTATGAAG CGGAACATCC TGCAGAAATA ACGACGGCTC GGGACTGCTG TCGGCGACTT TTCCGTAACG CCAACTCGAA AAGGCGGTTC GAAACCAAAG GAACAGCGAC ACGAAACCGT CTGTACACAC CGGCGGCAAG
CGGTACCGGC CAGTCGGCAC TACGAGTGGG AGGCGGTACC CAGCAGTATC ATGCTGTGTG AATCAATGCC ATGACGCATA TATACAGGAC CGGCAGCATA ACGAAAATTA GACGGAGGCG AGAGACTGAA ACATCGATTT CCTGCAGGCG TGATGAAACC TCAAGCTGGG TCATCGAGGG GCAGTACCGC AGGGTATCCG ATCCGTAATA AGCTCAGCCC AAAAAGGCAT AAACGGGAAA CAACCATTGC CAAGCGTCCG TTTTCCGCAC CCCGTGGATG AGGACATCGG GATGCGGGTA TACCGCCGAT ACATTTCAGG CTGCACGGCA GCTGGTGTTG GTGCGCTGAT GGCATTGTCT ACACATCAAA GTTTGGGCAA CTGTACATGT
782164]29512165]30012166]30512167]31012168]31512169]32012170]32512171]33012172]33512173]34012174]34512175]35012176]35512177]36012178]36512179]37012180]37512181]38012182]38512183]39012184]39512185]40012186]40512187]41012188]41512189]42012190]42512191]43012192]12193]512194]1012195]1512196]2012197]2512198]3012199]3512200]4012201]4512202]501
CGGCACGCGG CCCTTCCTGA CATCGAAACC CAGCGGGCAG GCGGCACGGA ACACGCCGTA TGGATGCCTC GCCGACCGCA CGCAGCGGCA TCAACAGTCT GATATGCAGG CGGCACGGGT GGGAACAGGG GGCATTGCCG CATGGGACGC GCATTAGTCT CTCAAAGGCC CACCGGTGCG AGCTGGGCGC TTGACGGTCG CGCCGAAAAA GCACGCTGGT AAAGCCGTCC CGACTACACG AGACGGGGGC GCGGATGTCG CGCCGGTTCC ACCGGTTCCT MATNDDDVKK AADVEADDFK ADTDAALADT DTVDKHAEAF AAETAAGKAE ADVYTTEESD VSDLRKETRQ FRFTENFAAK GIGSNSRATT PPPNLHTGDF SFPELYGRKE
CAAGGGGGCA GTGCCGCCAA GACGGCGGCC TGAAGGCGAC CTGCTTCGGC GAACAGGGCG CGAATCATCC CAGATATGCC GCCGTACAGC CGCCGCTACC GACGCCGCCT CTGCGCGTCA CGGTGTTGAA CGAAAACCGG AGCACATGGA GTTTGCAGGC TGTTCTCCTA GACGAACATG ACTGGGCGGT AAGGCGGTCT GGCAGTGCTT CGGACTCGCG TGTTTGCAAC GTAACGGGCG ACGCAATATG AATTCGGCAA AAACAGTACG CGAGCACCAC AATVAIAAAY GLGLKKVVTN DAALDATTNA NDIADSLDET AAAGTANTAA SKFVRIDGLN GLAEQAALSG AGVAVGTSSG AKSAAVSYAG PNPNDAYKNL HGYNENYKNY
GGCTATCTCA AATCGGGCAG TGCTGGCTTC ACGCTGTCCT AGCGGCACAT GCAGCAATCT GCAACACCCG GGGCATCCGC ATGCGAATGC GTCTATGCCG GAAAGCCGTA TCGCGCAAAC GGCAAAATGC CGAAAATACG GCGAAAACAG ATACGGCACG CGGACGCTAC CGGAAGGCAG GTCAACGTTC GCGCTACGAC TGGGCTGGAG GGTCTGAAGC GGCGGGCGTG GCTTTACCGG CCGCACACCC CGGCTGGAAC GCAACCACAG CACCACCACC NNGQEINGFK LTKTVNENKQ LNKLGENITT NTKADEAVKT DKAEAVAAKV ATTEKLKTRL LFQPYNVGRF SSAAYHVGVN IKNEMCKDRS INLKPAIEAG TAYMRKEAPE
ACAGTACCGG
GATTATTCTT
CCTCGACAGC
ATTATGTCCG
TCCGCGCCCG
GGAAAACCTG
AGACGGTTGA
CCCTACGGCG
CGCCGACGGT
ACAGTACCGC
TCGGACGGGT
CCAACAGGAC
GCGGCAGTAC
ACAGCAGCCG
TGCAAATGCA
ATGCGGGCGA
AAAAACAGCA
CGTCAACGGC
CGTTTGCCGC
CTGCTCAAAC
CGGCAACAGC
TGTCGCAACC
GAACGCGACC
CGCGACTGCA
GTCTGGTTGC
GGCTTGGCAC
CGGACGAGTC
ACTGA
AGETIYDIDE
NVDAKVKAAE
FAEETKTNIV
ANEAKQTAEE
TDIKADIATN
ASAEKSIADH
NVTAAVGGYK
YEffGSGGGGT
MLCAGRDDVA
YTGRGVEVGI
DGGGKDIEAS
ACGACGTGTT TCTTCACAAA GTCGAAAAAA TCGCGGCAAT CCGGTCTGAA ATGGTGCAAC AACTGCGGCA CAACTTTCCG GTACGCATCT CGCCCATGCC TGGACCACAA GGTGGAACGT CCAAACCGTC CCACACTGGG AAAACCGACA TATCGGCTAT TCAGCCGCAG ACGCTGATGC AACGGGAGAT AGGATGCATT CTCACTGAAG CTTGAGCGAT TGAACGGACG GCAACCGGCA CGGCCTGGGC GTTACAGCTA GGCGTAGGCT
DGTITKKDAT SEIEKLTTKL KIDEKLEAVA TKQNVDAKVK KDNIAKKANS DTRLNGLDKT SESAVAIGTG SAPDFNAGGT VTDRDAKINA VDTGESVGSI FDDEAVIETE[2203]551AKPTDIRHVKEIGHIDLVSH[2204]601KNEMMVAAIRNAffVKLGERG[2205]651QALLDYSGGDKTDEGIRLMQ[2206]701NTYALLPFYEKDAQKGIITV[2207]751GITAMWCLSAPYEASVRFTR[2208]801SNDNLRTTLLTTAQDIGAVG[2209]851TKGTSDIAYSFRNDISGTGG[2210]901YGNNKSDMRVETKGALIYNG[2211]951GSLQLDGKGTLYTRLGKLLK[2212]1001PFLSAAKIGQDYSFFTNIET[2213]1051AARTASAAAHSAPAGLKHAV[2214]1101ADRTDMPGIRPYGATFRAAA[2215]1151DMQGRRLKAVSDGLDHNGTG[2216]1201GIAAKTGENTTAAATLGMGR[2217]1251LKGLFSYGRYKNSISRSTGA[2218]1301LTVEGGLRYDLLKQDAFAEK[2219]1351KAVLFATAGVERDLNGRDYT[2220]1401ADVEFGNGffNGLARYSYAGS[2221]961c--0RF46. 1[2222]1ATGGCCACAAACGACGACGA[2223]51TGCTGCCTACAACAATGGCC[2224]101CCATCTACGACATTGATGAA[2225]151GCAGCCGATGTTGAAGCCGA[2226]201CGTGACTAACCTGACCAAAA[2227]251CCAAAGTAAAAGCTGCAGAA[2228]301GCAGACACTGATGCCGCTTT[2229]351CACCAACGCCTTGAATAAAT[2230]401AGACTAAGACAAATATCGTA[2231]451GATACCGTCGACAAGCATGC[2232]501GGATGAAACCAACACTAAGG[2233]551CCAAACAGACGGCCGAAGAA[2234]601GCTGCAGAAACTGCAGCAGG[2235]651TACTGCAGCCGACAAGGCCG[2236]701AAGCTGATATCGCTACGAAC[2237]751GCCGACGTGTACACCAGAGA[2238]801TGGTCTGAACGCTACTACCG[2239]851AAAAATCCATTGCCGATCAC[2240]901GTGTCAGACCTGCGCAAAGA[2241]951GCTCTCCGGTCTGTTCCAAC
IIGGRSVDGRPAGGIAPDATLHIMNTNDETVRIVNNSFGTTSRAGTADLFQIANSEEQYRQSDYGNLSYHIRNK匪LFIFSTGNDAQAQPAGVDRSGEKFKREMYGEPGTEPLEYGSNHCTNPIQIAGTSFSAPIVTGTAALLLQKYPWMVDSKFGffGLLDAGKAMNGPASFPFGDFTADLIKKGGSQLQLHGNNTYTGKTIIEGGSLVLAASGGSLNSDGIVYLADTDQSGANETVHIKVDGTAIIGGKLYMSARGKGAGYLNSTGRRVDGGLLASLDSVEKTAGSEGDTLSYYVRRGNEQGGSNLENLMVELDASESSATPETVETAAAVQHANAADGVRIFNSLAATVYADSTAAHALRVIAQTQQDGGTffEQGGVEGKMRGSTQTVSTffSENSANAKTDSISLFAGIRHDAGDIGYDEHAEGSVNGTLMQLGALGGVNVPFAATGDGSALGffSGNSLTEGTLVGLAGLKLSQPLSDVTGGFTGATAATGKTGARNMPHTRLVAGLGKQYGNHSGRVGVGYRFLEHHHHHH *TGTTAAAAAAGCTGCCACTGTGGCCATTGCAAGAAATCAACGGTTTCAAAGCTGGAGAGAGACGGCACAATTACCAAAAAAGACGCAACTCGACTTTAAAGGTCTGGGTCTGAAAAAAGTCCGTCAATGAAAACAAACAAAACGTCGATGTCTGAAATAGAAAAGTTAACAACCAAGTTAAGCAGATACTGATGCCGCTCTGGATGCAACTGGGAGAAAATATAACGACATTTGCTGAAGAAAATTGATGAAAAATTAGAAGCCGTGGCTCGAAGCATTCAACGATATCGCCGATTCATTCAGACGAAGCCGTCAAAACCGCCAATGAAGACCAAACAAAACGTCGATGCCAAAGTAAAACAAAGCCGAAGCTGCCGCTGGCACAGCTAAAAGCTGTCGCTGCAAAAGTTACCGACATCAAAAGATAATATTGCTAAAAAAGCAAACAGTAGAGTCTGACAGCAAATTTGTCAGAATTGAAAAAATTGGACACACGCTTGGCTTCTGCTGGATACTCGCCTGAACGGTTTGGATAAAACAAACCCGCCAAGGCCTTGCAGAACAAGCCGCCTTACAACGTGGGTGGATCCGGAGGAGGAG[2242]1001GATCAGATTTGGCAAACGATTCTTTTATCCGGCAGGTTCTCGACCGTCAG[2243]1051CATTTCGAACCCGACGGGAAATACCACCTATTCGGCAGCAGGGGGGAACT[2244]1101TGCCGAGCGCAGCGGCCATATCGGATTGGGAAAAATACAAAGCCATCAGT[2245]1151TGGGCAACCTGATGATTCAACAGGCGGCCATTAAAGGAAATATCGGCTAC[2246]1201ATTGTCCGCTTTTCCGATCACGGGCACGAAGTCCATTCCCCCTTCGACAA[2247]1251CCATGCCTCACATTCCGATTCTGATGAAGCCGGTAGTCCCGTTGACGGAT[2248]1301TTAGCCTTTACCGCATCCATTGGGACGGATACGAACACCATCCCGCCGAC[2249]1351GGCTATGACGGGCCACAGGGCGGCGGCTATCCCGCTCCCAAAGGCGCGAG[2250]1401GGATATATACAGCTACGACATAAAAGGCGTTGCCCAAAATATCCGCCTCA[2251]1451ACCTGACCGACAACCGCAGCACCGGACAACGGCTTGCCGACCGTTTCCAC[2252]1501AATGCCGGTAGTATGCTGACGCAAGGAGTAGGCGACGGATTCAAACGCGC[2253]1551CACCCGATACAGCCCCGAGCTGGACAGATCGGGCAATGCCGCCGAAGCCT[2254]1601TCAACGGCACTGCAGATATCGTTAAAAACATCATCGGCGCGGCAGGAGAA[2255]1651ATTGTCGGCGCAGGCGATGCCGTGCAGGGCATAAGCGAAGGCTCAAACAT[2256]1701TGCTGTCATGCACGGCTTGGGTCTGCTTTCCACCGAAAACAAGATGGCGC[2257]1751GCATCAACGATTTGGCAGATATGGCGCAACTCAAAGACTATGCCGCAGCA[2258]1801GCCATCCGCGATTGGGCAGTCCAAAACCCCAATGCCGCACAAGGCATAGA[2259]1851AGCCGTCAGCAATATCTTTATGGCAGCCATCCCCATCAAAGGGATTGGAG[2260]1901CTGTTCGGGGAAAATACGGCTTGGGCGGCATCACGGCACATCCTATCAAG[2261]1951CGGTCGCAGATGGGCGCGATCGCATTGCCGAAAGGGAAATCCGCCGTCAG[2262]2001CGACAATTTTGCCGATGCGGCATACGCCAAATACCCGTCCCCTTACCATT[2263]2051CCCGAAATATCCGTTCAAACTTGGAGCAGCGTTACGGCAAAGAAAACATC[2264]2101ACCTCCTCAACCGTGCCGCCGTCAAACGGCAAAAATGTCAAACTGGCAGA[2265]2151CCAACGCCACCCGAAGACAGGCGTACCGTTTGACGGTAAAGGGTTTCCGA[2266]2201ATTTTGAGAAGCACGTGAAATATGATACGCTCGAGCACCACCACCACCAC[2267]2251CACTGA1MATNDDDVKKAATVAIAAAYNNGQEINGFKAGETIYDIDEDGTITKKDAT[2269]51AADVEADDFKGLGLKKVVTNLTKTVNENKQNVDAKVKAAESEIEKLTTKL[2270]101ADTDAALADTDAALDATTNALNKLGENITTFAEETKTNIVKIDEKLEAVA[2271]151DTVDKHAEAFNDIADSLDETNTKADEAVKTANEAKQTAEETKQNVDAKVK[2272]201AAETAAGKAEAAAGTANTAADKAEAVAAKVTDIKADIATNKDNIAKKANS[2273]251ADVYTREESDSKFVRIDGLNATTEKLDTRLASAEKSIADHDTRLNGLDFT[2274]301VSDLRKETRQGLAEQAALSGLFQPYNVGGSGGGGSDLANDSFIRQVLDRQ[2275]351HFEPDGKYHLFGSRGELAERSGHIGLGKIQSHQLGNLMIQQAAIKGNIGY[2276]401IVRFSDHGHEVHSPFDNHASHSDSDEAGSPVDGFSLYRIHWDGYEHHPAD[2277]451GYDGPQGGGYPAPKGARDIYSYDIKGVAQNIRLNLTDNRSTGQRLADRFH[2278]501NAGSMLTQGVGDGFKRATRYSPELDRSGNAAEAFNGTADIVKNIIGAAGE[2279]551IVGAGDAVQGISEGSNIAVMHGLGLLSTENKMARINDLADMAQLKDYAAA[2280]601AIRDffAVQNPNAAQGIEAVSNIFMAAIPIKGIGAVRGKYGLGGITAHPIK[2281651RSQMGAIALP KGKSAVSDNF ADAAYAKYPS PYHSRNIRSN LEQRYGKENI[2282701rSSTVPPSNG KNVKLADQRH PKTGVPFDGK GFPNFEKHVK YDTLEHHHHH[2283751 H*[2284961c-741[22851ATGGCCACAAACGACGACGATGTTAAAAAAGCTGCCACTGTGGCCATTGC[228651TGCTGCCTACAACAATGGCCAAGAAATCAACGGTTTCAAAGCTGGAGAGA[2287101CCATCTACGACATTGATGAAGACGGCACAATTACCAAAAAAGACGCAACT[2288151GCAGCCGATGTTGAAGCCGACGACTTTAAAGGTCTGGGTCTGAAAAAAGT[2289201CGTGACTAACCTGACCAAAACCGTCAATGAAAACAAACAAAACGTCGATG[2290251CCAAAGTAAAAGCTGCAGAATCTGAAATAGAAAAGTTAACAACCAAGTTA[2291301GCAGACACTGATGCCGCTTTAGCAGATACTGATGCCGCTCTGGATGCAAC[2292351CACCAACGCCTTGAATAAATTGGGAGAAAATATAACGACATTTGCTGAAG[2293401AGACTAAGACAAATATCGTAAAAATTGATGAAAAATTAGAAGCCGTGGCT[2294451GATACCGTCGACAAGCATGCCGAAGCATTCAACGATATCGCCGATTCATT[2295501GGATGAAACCAACACTAAGGCAGACGAAGCCGTCAAAACCGCCAATGAAG[2296551CCAAACAGACGGCCGAAGAAACCAAACAAAACGTCGATGCCAAAGTAAAA[2297601GCTGCAGAAACTGCAGCAGGCAAAGCCGAAGCTGCCGCTGGCACAGCTAA[2298651TACTGCAGCCGACAAGGCCGAAGCTGTCGCTGCAAAAGTTACCGACATCA[2299701AAGCTGATATCGCTACGAACAAAGATAATATTGCTAAAAAVAGCAAACAGT[2300751GCCGACGTGTACACCAGAGAAGAGTCTGACAGCAAATTTGTCAGAATTGA[2301801TGGTCTGAACGCTACTACCGAAAAATTGGACACACGCTTGGCTTCTGCTG[2302851AAAAATCCATTGCCGATCACGATACTCGCCTGAACGGTTTGGATAAAACA[2303901GTGTCAGACCTGCGCAAAGAAACCCGCCAAGGCCTTGCAGAACAAGCCGC[2304951GCTCTCCGGTCTGTTCCAACCTTACAACGTGGGTGGATCCGGAGGGGGTG[23051001GTGTCGCCGCCGACATCGGTGCGGGGCTTGCCGATGCACTAACCGCACCG[23061051CTCGACCATAAAGACAAAGGTTTGCAGTCTTTGACGCTGGATCAGTCCGT[23071101CAGGAAAAACGAGAAACTGAAGCTGGCGGCACAAGGTGCGGAAAAAACTT[23081151ATGGAAACGGTGACAGCCTCAATACGGGCAAATTGAAGAACGACAAGGTC[23091201AGCCGTTTCGACTTTATCCGCCAAATCGAAGTGGACGGGCAGCTCATTAC[23101251CTTGGAGAGTGGAGAGTTCCAAGTATACAAACAAAGCCATTCCGCCTTAA[23111301CCGCCTTTCAGACCGAGCAAATACAAGATTCGGAGCATTCCGGGAAGATG[23121351GTTGCGAAACGCCAGTTCAGAATCGGCGACATAGCGGGCGAACATACATC[23131401TTTTGACAAGCTTCCCGAAGGCGGCAGGGCGACATATCGCGGGACGGCGT[23141451TCGGTTCAGACGATGCCGGCGGAAAACTGACCTACACCATAGATTTCGCC[23151501GCCAAGCAGGGAAACGGCAAAATCGAACATTTGAAATCGCCAGAACTCAA[23161551TGTCGACCTGGCCGCCGCCGATATCAAGCCGGATGGAAAACGCCATGCCG[23171601TCATCAGCGGTTCCGTCCTTTACAACCAAGCCGAGAAAGGCAGTTACTCC[23181651CTCGGTATCTTTGGCGGAAAAGCCCAGGAAGTTGCCGGCAGCGCGGAAGT[23191701GAAAACCGTAAACGGCATACGCCATATCGGCCTTGCCGCAAGCAACTCG
78/107 页
82[2320]1751AGCACCACCACCACCACCAC[2321]1MATNDDDVKKAATVAIAAAY[2322]51AADVEADDFKGLGLKKVVTN[2323]101ADTDAALADTDAALDATTNA[2324]151DTVDKHAEAFNDIADSLDET[2325]201AAETAAGKAEAAAGTANTAA[2326]251ADVYTREESDSKFVRIDGLN[2327]301VSDLRKETRQGLAEQAALSG[2328]351LDHKDKGLQSLTLDQSVRKN[2329]401SRFDFIRQIEVDGQLITLES[2330]451VAKRQFRIGDIAGEHTSFDK[2331]501AKQGNGKIEHLKSPELNVDL[2332]551LGIFGGKAQEVAGSAEVKTV[2333]961c--983[2334]1ATGGCCACAAACGACGACGA[2335]51TGCTGCCTACAACAATGGCC[2336]101CCATCTACGACATTGATGAA[2337]151GCAGCCGATGTTGAAGCCGA[2338]201CGTGACTAACCTGACCAAAA[2339]251CCAAAGTAAAAGCTGCAGAA[2340]301GCAGACACTGATGCCGCTTT[2341]351CACCAACGCCTTGAATAAAT[2342]401AGACTAAGACAAATATCGTA[2343]451GATACCGTCGACAAGCATGC[2344]501GGATGAAACCAACACTAAGG[2345]551CCAAACAGACGGCCGAAGAA[2346]601GCTGCAGAAACTGCAGCAGG[2347]651TACTGCAGCCGACAAGGCCG[2348]701AAGCTGATATCGCTACGAAC[2349]751GCCGACGTGTACACCAGAGA[2350]801TGGTCTGAACGCTACTACCG[2351]851AAAAATCCATTGCCGATCAC[2352]901GTGTCAGACCTGCGCAAAGA[2353]951GCTCTCCGGTCTGTTCCAAC[2354]1001GCACTTCTGCGCCCGACTTC[2355]1051AGCAGAGCAACAACAGCGAA[2356]1101GAACGAAATGTGCAAAGACA[2357]1151TTGCGGTTACAGACAGGGAT[2358]1201CATACCGGAGACTTTCCAAA
TGA
NNGQEINGFK AGETIYDIDE DGTITKKDAT LTKTVNENKQ NVDAKVKAAE SEIEKLTTKL LNKLGENITT FAEETKTNIV KIDEKLEAVA NTKADEAVKT ANEAKQTAEE TKQNVDAKVK DKAEAVAAKV TDIKADIATN KDNIAKKANS ATTEKLDTRL ASAEKSIADH DTRLNGLDKT LFQPYNVGGS GGGGVAADIG AGLADALTAP EKLKLAAQGA EKTYGNGDSL NTGKLKNDKV GEFQVYKQSH SALTAFQTEQ IQDSEHSGKM LPEGGRATYR GTAFGSDDAG GKLTYTIDFA AAA IKPDGK RHAVISGSVL YNQAEKGSYS NGIRHIGLAA KQLEHHHHHH *
TGTTAAAAAA GCTGCCACTG TGGCCATTGC AAGAAATCAA CGGTTTCAAA GCTGGAGAGA GACGGCACAA TTACCAAAAA AGACGCAACT CGACTTTAAA GGTCTGGGTC TGAAAAAAGT CCGTCAATGA AAACAAACAA AACGTCGATG TCTGAAATAG AAAAGTTAAC AACCAAGTTA AGCAGATACT GATGCCGCTC TGGATGCAAC TGGGAGAAAA TATAACGACA TTTGCTGAAG AAAATTGATG AAAAATTAGA AGCCGTGGCT CGAAGCATTC AACGATATCG CCGATTCATT CAGACGAAGC CGTCAAAACC GCCAATGAAG ACCAAACAAA ACGTCGATGC CAAAGTAAAA CAAAGCCGAA GCTGCCGCTG GCACAGCTAA AAGCTGTCGC TGCAAAAGTT ACCGACATCA AAAGATAATA TTGCTAAAAA AGCAAACAGT AGAGTCTGAC AGCAAATTTG TCAGAATTGA AAAAATTGGA CACACGCTTG GCTTCTGCTG GATACTCGCC TGAACGGTTT GGATAAAACA AACCGCCCAA GGCCTTGCAG AACAAGCCGC CTTACAACGT GGGTGGATCC GGCGGAGGCG AATGCAGGCG GTACCGGTAT CGGCAGCAAC ATCAGCAGCA GTATCTTACG CCGGTATCAA GAAGCATGCT CTGTGCCGGT CGGGATGACG GCCAAAATCA ATGCCCCCCC CCCGAATCTG CCCAAATGAC GCATACAAGA ATTTGATCAA[23591251CCTCAAACCTGCAATTGAAGCAGGCTATACAGGACGCGGGGTAGAGGTAG[23601301GTATCGTCGACACAGGCGAATCCGTCGGCAGCATATCCTTTCCCGAACTG[23611351TATGGCAGAAAAGAACACGGCTATAACGAAAATTACAAAAACTATACGGC[23621401GTATATGCGGAAGGAAGCGCCTGAAGACGGAGGCGGTAAAGAGATTGAAG[23631451CTTCTTTCGACGATGAGGCCGTTATAGAGACTGAAGCAAAGCCGACGGAT[23641501ATCCGCCACGTAAAAGAAATCGGACACATCGATTTGGTCTCCCATATTAT[23651551TGGCGGGCGTTCCGTGGACGGCAGACCTGCAGGCGGTATTGCGCCCGATG[23661601CGACGCTACACATAATGAATACGAATGATGAAACCAAGAACGAAATGATG[23671651GTTGCAGCCATCCGCAATGCATGGGTCAAGCTGGGCGAACGTGGCGTGCG[23681701CATCGTCAATAACAGTTTTGGAACAACATCGAGGGCAGGCACTGCCGACC[23691751TTTTCCAAATAGCCAATTCGGAGGAGCAGTACCGCCAAGCGTTGCTCGAC[23701801TATTCCGGCGGTGATAAAACAGACGAGGGTATCCGCCTGATGCAACAGAG[23711851CGATTACGGCAACCTGTCCTACCACATCCGTAATAAAAACATGCTTTTCA[23721901TCTTTTCGACAGGCAATGACGCACAAGCTCAGCCCAACACATATGCCCTA[23731951TTGCCATTTTATGAAAAAGACGCTCAAAAAGGCATTATCACAGTCGCAGG[23742001CGTAGACCGCAGTGGAGAAAAGTTCAAACGGGAAATGTATGGAGAACCGG[23752051GTACAGAACCGCTTGAGTATGGCTCCAACCATTCGGGAATTACTGCCATG[23762101TGGTGCCTGTCGGCACCCTATGAAGCAAGCGTCCGTTTCACCCGTACAAA[23772151CCCGATTCAAATTGCCGGAACATCCTTTTCCGCACCCATCGTAACCGGCA[23782201CGGCGGCTCTGCTGCTGCAGAAATACCCGTGGATGAGCAACGACAACCTG[23792251CGTACCACGTTGCTGACGACGGCTCAGGACATCGGTGCAGTCGGCGTGGA[23802301CAGCAAGTTCGGCTGGGGACTGCTGGATGCGGGTAAGGCCATGAACGGAC[23812351CCGCGTCCTTTCCGTTCGGCGACTTTACCGCCGATACGAAAGGTACATCC[23822401GATATTGCCTACTCCTTCCGTAACGACATTTCAGGCACGGGCGGCCTGAT[23832451CAAAAAAGGCGGCAGCCAACTGCAACTGCACGGCAACAACACCTATACGG[23842501GCAAAACCATTATCGAAGGCGGTTCGCTGGTGTTGTACGGCAACAACAAA[23852551TCGGATATGCGCGTCGAAACCAAAGGTGCGCTGATTTATAACGGGGCGGC[23862601ATCCGGCGGCACGGTGAACAGCGACGGCATTGTCTATCTGGCAGATACCG[23872651ACCAATCCGGCGCAAACGAAACCGTACACATCAAAGGCAGTCTGCAGCTG[23882701GACGGCAAAGGTACGCTGTACACACTTTGCGGCAAACTGCTGAAAGTGGA[23892751CGGTACGGCGATTATCGGCGGCAAGCTGTACATGTCGGCACGCGGCAAGG[23902801GGGCAGGCTATCTCAACAGTACCGGACGACGTGTTCCCTTCCTGAGTGCC[23912851GCCAAAATCGGGCAGGATTATTCTTTCTTCACAAACATCGAAACCGACGG[23922901CGGCCTGCTGGCTTCCCTCGACAGCGTCGAAAAAACAGCGGGCAGTGAAG[23932951GCGACACGCTGTCCTATTATGTCCGTCGCGGCAATGCGGCACGGACTGCT[23943001TCGGCAGCGGCACATTCCGCGCCCGCCGGTCTGAAACACGCCGTAGAACA[23953051GGGCGGCAGCAATCTGGAAAACCTGATGGTCGAACTGGATGCCTCCGAAT[23963101CATCCGCAACACCCGAGACGGTTGAAACTGCGGCAGCCGACCGCACAGAT[23973151ATGCCGGGCATCCGCCCCTACGGCGCAACTTTCCGCGCAGCGGCAGCCGT
80/107 页
84 951AKIGQDYSFFTNIETDGGLLASLDSVEKTAGSE⑶TLSYYVRRGNAARTA[2438]1001SAAAHSAPAGLKHAVEQGGSNLENLMVELDASESSATPETVETAAADRTD[2439]1051MPGIRPYGATFRAAAAVQHANAADGVRIFNSLAATVYADSTAAHADMQGR[2440]1101RLKAVSDGLDHNGTGLRVIAQTQQDGGTffEQGGVEGKMRGSTQTVGIAAK[2441]1151TGENTTAAATLGMGRSTffSENSANAKTDSISLFAGIRHDAGDIGYLKGLF[2442]1201SYGRYKNSISRSTGADEHAEGSVNGTLMQLGALGGVNVPFAATGDLTVEG[2443]1251GLRYDLLKQDAFAEKGSALGWSGNSLTEGTLVGLAGLKLSQPLSDKAVLF[2444]1301ATAGVERDLNGRDYTVTGGFTGATAATGKTGARNMPHTRLVAGLGADVEF[2445]1351GNGffNGLARYSYAGSKQYGNHSGRVGVGYRFLEHHHHHH*[2446]961cL-0RF46. 1[2447]1ATGAAACACTTTCCATCCAAAGTACTGACCACAGCCATCCTTGCCACTTT[2448]51CTGTAGCGGCGCACTGGCAGCCACAAACGACGACGATGTTAAAAAAGCTG[2449]101CCACTGTGGCCATTGCTGCTGCCTACAACAATGGCCAAGAAATCAACGGT[2450]151TTCAAAGCTGGAGAGACCATCTACGACATTGATGAAGACGGCACAATTAC[2451]201CAAAAAAGACGCAACTGCAGCCGATGTTGAAGCCGACGACTTTAAAGGTC[2452]251TGGGTCTGAAAAAAGTCGTGACTAACCTGACCAAAACCGTCAATGAAAAC[2453]301AAACAAAACGTCGATGCCAAAGTAAAAGCTGCAGAATCTGAAATAGAAAA[2454]351GTTAACAACCAAGTTAGCAGACACTGATGCCGCTTTAGCAGATACTGATG[2455]401CCGCTCTGGATGCAACCACCAACGCCTTGAATAAATTGGGAGAAAATATA[2456]451ACGACATTTGCTGAAGAGACTAAGACAAATATCGTAAAAATTGATGAAAA[2457]501ATTAGAAGCCGTGGCTGATACCGTCGACAAGCATGCCGAAGCATTCAACG[2458]551ATATCGCCGATTCATTGGATGAAACCAACACTAAGGCAGACGAAGCCGTC[2459]601AAAACCGCCAATGAAGCCAAACAGACGGCCGAAGAAACCAAACAAAACGT[2460]651CGATGCCAAAGTAAAAGCTGCAGAAACTGCAGCAGGCAAAGCCGAAGCTG[2461]701CCGCTGGCACAGCTAATACTGCAGCCGACAAGGCCGAAGCTGTCGCTGCA[2462]751AAAGTTACCGACATCAAAGCTGATATCGCTACGAACAAAGATAATATTGC[2463]801TAAAAAAGCAAACAGTGCCGACGTGTACACCAGAGAAGAGTCTGACAGCA[2464]851AATTTGTCAGAATTGATGGTCTGAACGCTACTACCGAAAAATTGGACACA[2465]901CGCTTGGCTTCTGCTGAAAAATCCATTGCCGATCACGATACTCGCCTGAA[2466]951CGGTTTGGATAAAACAGTGTCAGACCTGCGCAAAGAAACCCGCCAAGGCC[2467]1001TTGCAGAACAAGCCGCGCTCTCCGGTCTGTTCCAACCTTACAACGTGGGT[2468]1051GGATCCGGAGGAGGAGGATCAGATTTGGCAAACGATTCTTTTATCCGGCA[2469]1101GGTTCTCGACCGTCAGCATTTCGAACCCGACGGGAAATACCACCTATTCG[2470]1151GCAGCAGGGGGGAACTTGCCGAGCGCAGCGGCCATATCGGATTGGGAAAA[2471]1201ATACAAAGCCATCAGTTGGGCAACCTGATGATTCAACAGGCGGCCATTAA[2472]1251AGGAAATATCGGCTACATTGTCCGCTTTTCCGATCACGGGCACGAAGTCC[2473]1301ATTCCCCCTTCGACAACCATGCCTCACATTCCGATTCTGATGAAGCCGGT[2474]1351AGTCCCGTTGACGGATTTAGCCTTTACCGCATCCATTGGGACGGATACGA[2475]1401ACACCATCCCGCCGACGGCTATGACGGGCCACAGGGCGGCGGCTATCCCG[24761451CTCCCAAAGGCGCGAGGGATATATACAGCTACGACATAAAAGGCGTTGCC[24771501CAAAATATCCGCCTCAACCTGACCGACAACCGCAGCACCGGACAACGGCT[24781551TGCCGACCGTTTCCACAATGCCGGTAGTATGCTGACGCAAGGAGTAGGCG[24791601ACGGATTCAAACGCGCCACCCGATACAGCCCCGAGCTGGACAGATCGGGC[24801651AATGCCGCCGAAGCCTTCAACGGCACTGCAGATATCGTTAAAAACATCAT[24811701CGGCGCGGCAGGAGAAATTGTCGGCGCAGGCGATGCCTGGCAGGGCATAA[24821751GCGAAGGCTCAAACATTGCTGTCATGCACGGCTTGGGTCTGCTTTCCACC[24831801GAAAACAAGATGGCGCGCATCAACGATTTGGCAGATATGGCGCAACTCAA[24841851AGACTATGCCGCAGCAGCCATCCGCGATTGGGCAGTCCAAAACCCCAATG[24851901CCGCACAAGGCATAGAAGCCGTCAGCAATATCTTTATGGCAGCCATCCCC[24861951ATCAAAGGGATTGGAGCTGTTCGGGGAAAATACGGCTTGGGCGGCATCAC[24872001GGCACATCCTATCAAGCGGTCGCAGATGGGCGCGATCGCATTGCCGAAAG[24882051GGAAATCCGCCGTCAGCGACAATTTTGCCGATGCGGCATACGCCAAATAC[24892101CCGTCCCCTTACCATTCCCGAAATATCCGTTCAAACTTGGAGCAGCGTTA[24902151CGGCAAAGAAAACATCACCTCCTCAACCGTGCCGCCGTCAAACGGCAAAA[24912201ATGTCAAACTGGCAGACCAACGCCACCCGAAGACAGGCGTACCGTTTGAC[24922251GGTAAAGGGTTTCCGAATTTTGAGAAGCACGTGAAATATGATACGTAACT[24932301CGAG[24941MKHFPSKVLTTAILATFCSGALAATNDDDVKKAATVAIAAAYNNGQEING[249551FKAGETIYDIDEDGTITKKDATAADVEADDFKGLGLKKVVTNLTKTVNEN[2496101KQNVDAKVKAAESEIEKLTTKLADTDAALADTDAALDATTNALNKLGENI[2497151TTFAEETKTNIVKIDEKLEAVADTVDKHAEAFNDIADSLDETNTKADEAV[2498201KTANEAKQTAEETKQNVDAKVKAAETAAGKAEAAAGTANTAADKAEAVAA[2499251KVTDIKADIATNKDNIAKKANSADVYTREESDSDFVRIDGLNATTEKLDT[2500301RLASAEKSIADHDTRLNGLDKTVSDLRKETRQGLAEQAALSGLFQPYNVG[2501351GSGGGGSDLANDSFIRQVLDRQHFEPDGKYHLFGSRGELAERSGHIGLGK[2502401IQSHQLGNLMIQQAAIKGNIGYIVRFSDHGHEVHSPFDNHASHSDSDEAG[2503451SPVDGFSLYRIHWDGYEHHPADGYDGPQGGGYPAPKGARDIYSYDIKGVA[2504501QNIRLNLTDNRSTGQRLADRFHNAGSMLTQGVGDGFKRATRYSPELDRSG[2505551NAAEAFNGTADIVKNIIGAAGEIVGAGDAVQGISEGSNIAVMHGLGLLST[2506601ENKMARINDLADMAQLKDYAAAAIRDffAVQNPNAAQGIEAVSNIFMAAIP[2507651IKGIGAVRGKYGLGGITAHPIKRSQMGAIALPKGKSAVSDNFADAAYAKY[2508701PSPYHSRNIRSNLEQRYGKENITSSTVPPSNGKNVKLADQRHPKTGVPFD[2509751GKGFPNFEKHVKYDT *[2510961cL-741[25111ATGAAACACTTTCCATCCAAAGTACTGACCACAGCCATCCTTGCCACTTT[251251CTGTAGCGGCGCACTGGCAGCCACAAACGACGACGATGTTAAAAAAGCTG[2513101CCACTGTGGCCATTGCTGCTGCCTACAACAATGGCCAAGAAATCAACGGT[2514151TTCAAAGCTGGAGAGACCATCTACGACATTGATGAAGACGGCACAATTAC[2515]201CAAAAAAGACGCAACTGCAGCCGATGTTGAAGCCGACGACTTTAAAGGTC[2516]251TGGGTCTGAAAAAAGTCGTGACTAACCTGACCAAAACCGTCAATGAAAAC[2517]301AAACAAAACGTCGATGCCAAAGTAAAAGCTGCAGAATCTGAAATAGAAAA[2518]351GTTAACAACCAAGTTAGCAGACACTGATGCCGCTTTAGCAGATACTGATG[2519]401CCGCTCTGGATGCAACCACCAACGCCTTGAATAAATTGGGAGAAAATATA[2520]451ACGACATTTGCTGAAGAGACTAAGACAAATATCGTAAAAATTGATGAAAA[2521]501ATTAGAAGCCGTGGCTGATACCGTCGACAAGCATGCCGAAGCATTCAACG[2522]551ATATCGCCGATTCATTGGATGAAACCAACACTAAGGCAGACGAAGCCGTC[2523]601AAAACCGCCAATGAAGCCAAACAGACGGCCGAAGAAACCAAACAAAACGT[2524]651CGATGCCAAAGTAAAAGCTGCAGAAACTGCAGCAGGCAAAGCCGAAGCTG[2525]701CCGCTGGCACAGCTAATACTGCAGCCGACAAGGCCGAAGCTGTCGCTGCA[2526]751AAAGTTACCGACATCAAAGCTGATATCGCTACGAACAAAGATAATATTGC[2527]801TAAAAAAGCAAACAGTGCCGACGTGTACACCAGAGAAGAGTCTGACAGCA[2528]851AATTTGTCAGAATTGATGGTCTGAACGCTACTACCGAAAAATTGGACACA[2529]901CGCTTGGCTTCTGCTGAAAAATCCATTGCCGATCACGATACTCGCCTGAA[2530]951CGGTTTGGATAAAACAGTGTCAGACCTGCGCAAAGAAACCCGCCAAGGCC[2531]1001TTGCAGAACAAGCCGCGCTCTCCGGTCTGTTCCAACCTTACAACGTGGGT[2532]1051GGATCCGGAGGGGGTGGTGTCGCCGCCGACATCGGTGCGGGGCTTGCCGA[2533]1101TGCACTAACCGCACCGCTCGACCATAAAGACAAAGGTTTGCAGTCTTTGA[2534]1151CGCTGGATCAGTCCGTCAGGAAAAACGAGAAACTGAAGCTGGCGGCACAA[2535]1201GGTGCGGAAAAAACTTATGGAAACGGTGACAGCCTCAATACGGGCAAATT[2536]1251GAAGAACGACAAGGTCAGCCGTTTCGACTTTATCCGCCAAATCGAAGTGG[2537]1301ACGGGCAGCTCATTACCTTGGAGAGTGGAGAGTTCCAAGTATACAAACAA[2538]1351AGCCATTCCGCCTTAACCGCCTTTCAGACCGAGCAAATACAAGATTCGGA[2539]1401GCATTCCGGGAAGATGGTTGCGAAACGCCAGTTCAGAATCGGCGACATAG[2540]1451CGGGCGAACATACATCTTTTGACAAGCTTCCCGAAGGCGGCAGGGCGACA[2541]1501TATCGCGGGACGGCGTTCGGTTCAGACGATGCCGGCGGAAAACTGACCTA[2542]1551CACCATAGATTTCGCCGCCAAGCAGGGAAACGGCAAAATCGAACATTTGA[2543]1601AATCGCCAGAACTCAATGTCGACCTGGCCGCCGCCGATATCAAGCCGGAT[2544]1651GGAAAACGCCATGCCGTCATCAGCGGTTCCGTCCTTTACAACCAAGCCGA[2545]1701GAAAGGCAGTTACTCCCTCGGTATCTTTGGCGGAAAAGCCCAGGAAGTTG[2546]1751CCGGCAGCGCGGAAGTGAAAACCGTAAACGGCATACGCCATATCGGCCTT[2547]1801GCCGCCAAGCAACTCGAGCACCACCACCACCACCACTGA[2548]1MKHFPSKVLTTAILATFCSGALAATNDDDVKKAATVAIAAAYNNGQEING[2549]51FKAGETIYDIDEDGTITKKDATAADVEADDFKGLGLKKVVTNLTKTVNEN[2550]101KQNVDAKVKAAESEIEKLTTKLADTDAALADTDAALDATTNALNKLGENI[2551]151TTFAEETKTNIVKIDEKLEAVADTVDKHAEAFNDIADSLDETNTKADEAV[2552]201KTANEAKQTAEETKQNVDAKVKAAETAAGKAEAAAGTANTAADKAEAVAA[2553]251KVTDIKADIATNKDNIAKKANSADVYTREESDSKFVRIDGLNATTEKLDT[2554301RLASAEKSIADHDTRLNGLDKTVSDLRKETRQGLAEQAALSGLFQPYNVG[2555351GSGGGGVAADIGAGLADALTAPLDHKDKGLQSLTLDQSVRKNEKLKLAAQ[2556401GAEKTYGNGDSLNTGKLKNDKVSRFDFIRQIEVDGQLITLESGEFQVYKQ[2557451SHSALTAFQTEQIQDSEHSGKMVAKRQFRIGDIAGEHTSFDKLPEGGRAT[2558501YRGTAFGSDDAGGKLTYTIDFAAKQGNGKIEHLKSPELNVDLAAADIKPD[2559551GKRHAVISGSVLYNQAEKGSYSLGIFGGKAQEVAGSAEVKTVNGIRHIGL[2560601AAKQLEHHHHHH*[2561961cL-983[25621ATGAAACACTTTCCATCCAAAGTACTGACCACAGCCATCCTTGCCACTTT[256351CTGTAGCGGCGCACTGGCAGCCACAAACGACGACGATGTTAAAAAAGCTG[2564101CCACTGTGGCCATTGCTGCTGCCTACAACAATGGCCAAGAAATCAACGGT[2565151TTCAAAGCTGGAGAGACCATCTACGACATTGATGAAGACGGCACAATTAC[2566201CAAAAAAGACGCAACTGCAGCCGATGTTGAAGCCGACGACTTTAAAGGTC[2567251TGGGTCTGAAAAAAGTCGTGACTAACCTGACCAAAACCGTCAATGAAAAC[2568301AAACAAAACGTCGATGCCAAAGTAAAAGCTGCAGAATCTGAAATAGAAAA[2569351GTTAACAACCAAGTTAGCAGACACTGATGCCGCTTTAGCAGATACTGATG[2570401CCGCTCTGGATGCAACCACCAACGCCTTGAATAAATTGGGAGAAAATATA[2571451ACGACATTTGCTGAAGAGACTAAGACAAATATCGTAAAAATTGATGAAAA[2572501ATTAGAAGCCGTGGCTGATACCGTCGACAAGCATGCCGAAGCATTCAACG[2573551ATATCGCCGATTCATTGGATGAAACCAACACTAAGGCAGACGAAGCCGTC[2574601AAAACCGCCAATGAAGCCAAACAGACGGCCGAAGAAACCAAACAAAACGT[2575651CGATGCCAAAGTAAAAGCTGCAGAAACTGCAGCAGGCAAAGCCGAAGCTG[2576701CCGCTGGCACAGCTAATACTGCAGCCGACAAGGCCGAAGCTGTCGCTGCA[2577751AAAGTTACCGACATCAAAGCTGATATCGCTACGAACAAAGATAATATTGC[2578801TAAAAAAGCAAACAGTGCCGACGTGTACACCAGAGAAGAGTCTGACAGCA[2579851AATTTGTCAGAATTGATGGTCTGAACGCTACTACCGAAAAATTGGACACA[2580901CGCTTGGCTTCTGCTGAAAAATCCATTGCCGATCACGATACTCGCCTGAA[2581951CGGTTTGGATAAAACAGTGTCAGACCTGCGCAAAGAAACCCGCCAAGGCC[25821001TTGCAGAACAAGCCGCGCTCTCCGGTCTGTTCCAACCTTACAACGTGGGT[25831051GGATCCGGCGGAGGCGGCACTTCTGCGCCCGACTTCAATGCAGGCGGTAC[25841101CGGTATCGGCAGCAACAGCAGAGCAACAACAGCGAAATCAGCAGCAGTAT[25851151CTTACGCCGGTATCAAGAACGAAATGTGCAAAGACAGAAGCATGCTCTGT[25861201GCCGGTCGGGATGACGTTGCGGTTACAGACAGGGATGCCAAAATCAATGC[25871251CCCCCCCCCGAATCTGCATACCGGAGACTTTCCAAACCCAAATGACGCAT[25881301ACAAGAATTTGATCAACCTCAAACCTGCAATTGAAGCAGGCTATACAGGA[25891351CGCGGGGTAGAGGTAGGTATCGTCGACACAGGCGAATCCGTCGGCAGCAT[25901401ATCCTTTCCCGAACTGTATGGCAGAAAAGAACACGGCTATAACGAAAATT[25911451ACAAAAACTATACGGCGTATATGCGGAAGGAAGCGCCTGAAGACGGAGGC[25921501GGTAAAGACATTGAAGCTTCTTTCGACGATGAGGCCGTTATAGAGACTGA
85/107 页
89[25931551AGCAAAGCCG ACGGATATCC GCCACGTAAA AGAAATCGGA CACATCGATT[25941601TGGTCTCCCA TATTATTGGC GGGCGTTCCG TGGACGGCAG ACCTGCAGGC[25951651GGTATTGCGC CCGATGCGAC GCTACACATA ATGAATACGA ATGATGAAAC[25961701CAAGAACGAA ATGATGGTTG CAGCCATCCG CAATGCATGG GTCAAGCTGG[25971751GCGAACGTGG CGTGCGCATC GTCAATAACA GTTTTGGAAC AACATCGAGG[25981801GCAGGCACTG CCGACCTTTT CCAAATAGCC AATTCGGAGG AGCAGTACCG[25991851CCAAGCGTTG CTCGACTATT CCGGCGGTGA TAAAACAGAC GAGGGTATCC[26001901GCCTGATGCA ACAGAGCGAT TACGGCAACC TGTCCTACCA CATCCGTAAT[26011951AAAAACATGC TTTTCATCTT TTCGACAGGC AATGACGCAC AAGCTCAGCC[26022001CAACACATAT GCCCTATTGC CATTTTATGA AAAAGACGCT CAAAAAGGCA[26032051TTATCACAGT CGCAGGCGTA GACCGCAGTG GAGAAAAGTT CAAACGGGAA[26042101ATGTATGGAGAACCGGGTACAGAACCGCTTGAGTATGGCTCCAACCATTG[26052151CGGAATTACTGCCATGTGGTGCCTGTCGGCACCCTATGAAGCAAGCGTCC[26062201GTTTCACCCGTACAAACCCGATTCAAATTGCCGGAACATCCTTTTCCGCA[26072251CCCATCGTAACCGGCACGGCGGCTCTGCTGCTGCAGAAATACCCGTGGAT[26082301GAGCAACGACAACCTGCGTACCACGTTGCTGACGACGGCTCAGGACATCG[26092351GTGCAGTCGGCGTGGACAGCAAGTTCGGCTGGGGACTGCTGGATGCGGGT[26102401AAGGCCATGAACGGACCCGCGTCCTTTCCGTTCGGCGACTTTACCGCCGA[26112451TACGAAAGGTACATCCGATATTGCCTACTCCTTCCGTAACGACATTTCAG[26122501GCACGGGCGGCCTGATCAAAAAAGGCGGCAGCCAACTGCAACTGCACGGC[26132551AACAACACCTATACGGGCAAAACCATTATCGAAGGCGGTTCGCTGGTGTT[26142601GTACGGCAACAACAAATCGGATATGCGCGTCGAAACCAAAGGTGCGCTGA[26152651TTTATAACGGGGCGGCATCCGGCGGCAGCCTGAACAGCGACGGCATTGTC[26162701TATCTGGCAGATACCGACCAATCCGGCGCAAACGAAACCGTACACATCAA[26172751AGGCAGTCTGCAGCTGGACGGCAAAGGTACGCTGTACACACGTTTGGGCA[26182801AACTGCTGAAAGTGGACGGTACGGCGATTATCGGCGGCAAGCTGTACATG[26192851TCGGCACGCGGCAAGGGGGCAGGCTATCTCAACAGTACCGGACGACGTGT[26202901TCCCTTCCTGAGTGCCGCCAAAATCGGGCAGGATTATTCTTTCTTCACAA[26212951ACATCGAAACCGACGGCGGCCTGCTGGCTTCCCTCGACAGCGTCGAAAAA[26223001ACAGCGGGCAGTGAAGGCGACACGCTGTCCTATTATGTCCGTCGCGGCAA[26233051TGCGGCACGGACTGCTTCGGCAGCGGCACATTCCGCGCCCGCCGGTCTGA[26243101AACACGCCGTAGAACAGGGCGGCAGCAATCTGGAAAACCTGATGGTCGAA[26253151CTGGATGCCTCCGAATCATCCGCAACACCCGAGACGGTTGAAACTGCGGC[26263201AGCCGACCGCACAGATATGCCGGGCATCCGCCCCTACGGCGCAACTTTCC[26273251GCGCAGCGGCAGCCGTACAGCATGCGAATGCCGCCGACAATGTACGCATC[26283301TTCAACAGTCTCGCCGCTACCGTCTATGCCGACAGTACCGCCGCCCATGC[26293351CGATATGCAGGGACGCCGCCTGAAAGCCGTATCGGACGGGTTGGACCACA[26303401ACGGCACGGGTCTGCGCGTCATCGCGCAAACCCAACAGGACGGTGGAACG[26313451TGGGAACAGGGCGGTGTTGAAGGCAAAATGCGCGGCAGTACCCAAACCGT[2632]3501CGGCATTGCCGCGAAAACCG[2633]3551GCATGGGACGCAGCACATGG[2634]3601AGCATTAGTCTGTTTGCAGG[2635]3651TCTCAAAGGCCTGTTCTCCT[2636]3701GCACCGGTGCGGACGAACAT[2637]3751CAGCTGGGCGCACTGGGCGG[2638]3801TTTGACGGTCGAAGGCGGTC[2639]3851TCGCCGAAAAAGGCAGTGCT[2640]3901GGCACGCTGGTCGGACTCGC[2641]3951TAAAGCCGTCCTGTTTGCAA[2642]4001GCGACTACACGGTAACGGGC[2643]4051AAGACGGGGGCACGCAATAT[2644]4101CGCGGATGTCGAATTCGGCA[2645]4151ACGCCGGTTCCAAACAGTAC[2646]4201TACCGGTTCTGACTCGAG[2647]1MKHFPSKVLTTAILATFCSG[2648]51FKAGETIYDIDEDGTITKKD[2649]101KQNVDAKVKAAESEIEKLTT[2650]151TTFAEETKTNIVKIDEKLEA[2651]201KTANEAKQTAEETLQMVDAL[2652]251KVTDIKADIATNKDNIAKKA[2653]301RLASAEKSIADHDTRLNGLD[2654]351GSGGGGTSAPDFNAGGTGIG[2655]401AGRDDVAVTDRDAKINAPPP[2656]451RGVEVGIVDTGESVGSISFP[2657]501GKDIEASFDDEAVIETEAKP[2658]551GIAPDATLHIMNTNDETKNE[2659]601AGTADLFQIANSEEQYRQAL[2660]651K匪LFIFSTGNDAQAQPNTY[2661]701MYGEPGTEPLEYGSNHCGIT[2662]751PIVTGTAALLLQKYPWMSND[2663]801KAMNGPASFPFGDFTADTKG[2664]851NNTYTGKTIIEGGSLVLYGN[2665]901YLADTDQSGANETVHIKGSL[2666]951SARGKGAGYLNSTGRRVPFL[2667]1001TAGSEGDTLSYYVRRGNAAR[2668]1051LDASESSATPETVETAAADR[2669]1101FNSLAATVYADSTAAJADMQ[2670]1151WEQGGVEGKM RGSTQTVG
GCGAAAATAC GACAGCAGCC GCCACACTGG AGCGAAAACA GTGCAAAGTC AAAAACCGAC CATACGGCAC GATGCGGGCG ATATCGGCTA ACGGACGCTA CAAAAACAGC ATCAGCCGCA GCGGAAGGCA GCGTCAACGG CACGCTGATG TGTCAACGTT CCGTTTGCCG CAACGGGAGA TGCGCTACGA CCTGCTCAAA CAGGATGCAT TTGGGCTGGA GCGGCAACAG CCTCACTGAA GGGTCTGAAG CTGTCGCAAC CCTTGAGCGA CGGCGGGCGT GGAACGCGAC CTGAACGGAC GGCTTTACCG GCGCGACTGC AGCAACCGGC GCCGCACACC CGTCTGGTTG CCGGCCTGGG ACGGCTGGAA CGGCTTGGCA CGTTACAGCT GGCAACCACA GCGGACGAGT CGGCGTAGGC
ALAATNDDDV KKAATVAIAA AYNNGQEING ATAADVEADD FKGLGLKKVV TNLTKTVNEN KLADTDAALA DTDAALDATT NALNKLGENI VADTVDKHAE AFNDIADSLD ETNTKADEAV VKAAETAAGK AEAAAGTANT AADKAEAVAA NSADVYTREE SDSKFVRIDG LNATTEKLDT KTVSDLRKET RQGLAEQAAL SGLFQPYNVG SNSRATTAKS AAVSYAGIKN EMCKDRSMLC NLHTCDFPNP NDAYKNLINL KPAIEAGYTG ELYGRKEHGY NENYKNYTAY MRKEAPEDGG TDIRHVKEIG HIDLVSHIIG GRSVDGRPAG MMVAAIRNAff VKLGERGVRI VNNSFGTTSR LDYSGGDKTD EGIRLMQQSD YGNLSYHIRN ALLPEYEKDA QKGIITVAGV DRSGEKFKRE AMWCLSAPYE ASVRFTRTNP IQIAGTSFSA NLRTTLLTTA QDIGAVGVDS KFGffGLLDAG TSDIAYSFRN DISGTGGLIK KGGSQLQLHG NKSDMRVETK GALIYNGAAS GGSLNSDGIV QLKGKGTLYT TLGKLLKVDG TAIIGGKLYM SAAKIGQDYS FFTNIETDGG LLASLDSVEK TASAAAHSAP AGLKHAVEQG GSNLENLMVE TDMPGIRPYG ATFRAAAAVQ HANAADGVRI GRRLKAVSDG LDHNGTGLRV IAQTQQDGGT A AKTGENTTAA ATLGMGRSTff SENSANAKTD[2671]1201 SISLFAGIRH DAGDIGYLKG LFSYGRYKNS ISRSTGADEH AEGSVNGTLM1251 QLGALGGVNV PFAATCDLTV EGGLRYDLLK QDAFAEKGSA LGffSGNSLTE1301 GTLVGLAGLK LSQPLSDKAV LFATAGVERD LNGRDYTVTG GFTGATAATG1351 KTGARNMPHT RLVAGLGADV EFGNGffNGLA RYSYAGSKQY GNHSGRVGVG1401 YRF*可以理解本发明仅以例子的方式进行描述,在本发明的范围和精神内还可进行改 变。例如,设想可以使用其它菌株的蛋白质[如,参见WO 00/66741,0RF4、0RF40、0RF46、 225、235、287、519、726、919 和 953 的多聚体序列]。实验详述FPLC蛋白质纯化下表总结了所用的FPLC蛋白质纯化 缓冲液包括20-120mM NaCl,5. Omg/ml CHAPS和 10% ν/ν甘油。将透析液以 13000g 离心20分钟,加样到单Q或单S FPLC离子交换树脂上。按照感兴趣蛋白质的pi和FPLC 方法手册[Pharmacia :FPLC离子交换和层析聚焦;理论和方法。Pharmacia Publication]选择缓冲液和离子交换树脂。用分步NaCl梯度法脱蛋白质。用SDS-PAGE分析纯化,并用 Bradford方法测定蛋白质浓度。‘方法'栏中的字母为以下含义FPLC-A 破碎细胞后从大肠杆菌可溶性组分中纯化克隆121. 1,128. 1、593、726、 982、周质蛋白质 920L 和杂交蛋白 919-287、953-287。于 37°C,在 20mlLB/Amp (100 μ g/ml) 液体培养基中,使携带感兴趣质粒的单集落生长过夜。用1. OL新鲜培养基以1 30稀释细 菌,并在30°C或37°C生长直到OD55tl到达0. 6-0. 8。以终浓度1. OmM的IPTG诱导重组蛋白质 的表达。培育3小时后,于4°C以8000离心15分钟收获细菌。必要时将细胞存储于-20°C。 随后的所有步骤都是在冰上或4°C进行的。对胞质蛋白质(121. 1,128. 1、593、726和982)和 周质蛋白质920L而言,将细菌重悬浮于25ml含完整蛋白酶抑制剂(Boehringer-Marmheim) 的PBS中。用Branson Sonifier 450通过超声处理裂解细胞。以8000g离心破碎的细胞 30分钟,以沉淀未破碎的细胞和包含体,并加入3. 9M (NH4) 2S04使上清液达到35 % ν/ν饱和。 以SOOOg沉积沉淀物30分钟。添加3. 9Μ (NH4)2SO4使上清液达到70% ν/ν饱和,如上所述 收集沉淀物。用SDS-PAGE鉴定含感兴趣蛋白质的沉淀物,并用适合的离子交换缓冲液(见 以下)透析6小时或过夜。按Evans等[Infect. Immun. (1974) 10 :1010_1017]的方法制备 表达953L大肠杆菌的周质组分,并用适合的离子交换缓冲液透析。根据感兴趣蛋白的pi 和FPLC方法手册[Pharmacia]的推荐选择缓冲液和离子交换树脂。缓冲液包括20mM NaCl 和10% (ν/ν)甘油。以13000g离心透析液20分钟,并加到单Q或单S FPLC离子交换树 脂上。根据感兴趣蛋白的Pl和FPLC方法手册[Pharmacia]的推荐选择缓冲液和离子交换 树脂。用分步或连续NaCl梯度从离子交换树脂洗脱蛋白质。用SDS-PAGE分析纯化,并用 Bradford方法测定蛋白质浓度。通过NH2-未端测序(见以下)验证周质蛋白质的前导肽 的切割。FPLC-B 从大肠杆菌的膜组分纯化这些蛋白质。37°C,在20ml LB/Amp (100 μ g/ml) 液液培养基中使携带感兴趣质粒的单集落生长过夜。用1. OL新鲜培养基以1 30稀释细 菌。克隆406. IL和919L0rf4在30°C生长,0rf25L和576. IL在37°C生长,直到OD550达到 0. 6-0. 8。对919L0rf4而言,生长必须在30°C,因为重组蛋白质在37°C的表达导致细胞的 裂解。以终浓度为l.OmM的IPTG诱导重组蛋白质的表达。培育3小时后,于4°C以SOOOg 离心15分钟收获细菌。必要时,将细胞存储于-20°C。随后的所有步骤都是在冰上或4°C 进行的。将细菌重悬浮于25ml含完整蛋白酶抑制剂(Boehringer-Marmheim)的PBS中,并 通过French Press以渗透性冲击2_3代裂解细菌。以5000g离心15分钟除去未破碎的细 胞,以IOOOOOg (Beckman Τ 50, 38000rpm)离心45分钟沉淀膜。用Dounce勻浆器将膜沉淀 物重悬浮于7.5ml 20mM Tris-HCl (pH 8. 0) U. OM NaCl和完整的蛋白酶抑制剂中。混合 悬浮液2-4小时,以IOOOOOg离心45分钟,并将沉淀物重悬浮于7. 5ml 20mM Tris-HCl (pH 8·0)、1·0Μ NaCl,5. Omg/ml CHAPSU0% (v/v)甘油和完整的蛋白酶抑制剂中。将此溶液混 合过夜,以IOOOOOg离心45分钟,用适当选择的缓冲液透析上清液6小时。对0rf25. L而 言,发现在CHAPS提取后得到的沉淀物包含重组蛋白质。无需进一步纯化,可将该组分用于 免疫接种小鼠。FPLC-C 与FPLC-A相同,但从用多粘菌素B渗透大肠杆菌后得到的可溶性组分进 行纯化,而不是在细胞破碎后进行的。[2686]FPLC-D 于37°C,使携带感兴趣质粒的单集落在20ml LB/Amp (100 μ g/ml)液态培 养基中生长过夜。用1. OL新鲜培养基以1 30稀释细菌,并在30°C生长直到OD55tl到达 0. 6-0. 8。以终浓度1. OmM的IPTG诱导重组蛋白质的表达。培育3小时后,于4°C以8000离 心15分钟收获细菌。必要时将细胞存储于-20°C。随后的所有步骤都是在冰上或4°C进行 的。将细胞重悬浮于20mM Bicine (pH8.0)、20mM NaCl,10% (ν/ν)甘油和完整蛋白酶抑制 剂(Boehringer-Mannheim)中,并用 Branson Sonifier 450 破碎细胞。以 8000g 离心超声 处理液30分钟,以沉积未破碎的细胞和包含体。通过添加3. 9M(NH4)2SO4,从饱和度为35% ν/ν到70% ν/ν之间的溶液中沉淀重组蛋白。以SOOOg沉积沉淀物30分钟,将其重悬浮于 20mM Bicine (pH 8. 5)、20mM NaCl,10% (ν/ν)甘油,并用该缓冲液透析6小时或过夜。以 13000g离心透析液20分钟,并加到FPLC树脂上。用分步NaCl梯度从该柱洗脱下蛋白质。 用SDS-PAGE分析纯化,并用Bradford方法测定蛋白质浓度。克隆策略和寡核苷酸设计用以脑膜炎奈瑟球菌B MC58的基因组序列为基础设计的寡核苷酸,通过PCR扩增 编码感兴趣抗原的基因。除非特别指出,通常将菌株2996的基因组DNA用作PCR反应的模 板,将扩增的片段克隆入表达载体pET2lb+(Novagen),从而以C-未端His标记的产物形式 表达该蛋白质,或将其克隆入pET-24b+(Novagen)以‘未标记的'形式(如AG287K)表达 该蛋白质。当蛋白质不用融合配体和用其自身前导肽(如果存在时)表达时,进行开放读框 (ATG到终止密码子)的扩增。当蛋白质以‘未标记的'的形式表达时,通过从预计的前导序列设计5' _端扩增 引物下游除去前导肽。用于PCR的引物的解链温度取决于整个引物中杂交核苷酸的数量和类型,并用以 下公式确定Tml = 4 (G+C) +2 (A+T)(除去尾部的)Tm2 = 64. 9+0. 41(% GC)-600/N(完整的引物)对整个寡聚物而言,所选寡核苷酸的解链温度通常为65-70°C,仅针对杂交区域, 解链温度为50_60°C。用Perkin Elmer 394 DNA/RNA合成仪合成寡核苷酸,将其从柱上洗脱到2. Oml NH4OH中,在56°C培育5小时以去保护。加入0. 3M乙酸钠和2体积的乙醇沉淀寡聚物。将 样品离心,将沉淀物重悬浮于水中。
*将该引物用作反向引物,将所有287的C未端融合于His-标记。§与287-His反向引物联用的正向引物。NB-所有PCR反应使用菌株2996,除非特别指出(如菌株MC58)。在所有以ATG起始不跟随唯一 NheI位点的构建物中,ATG密码子是用于克隆的 NdeI位点的一部分。在5'端用NheI作为克隆位点制备的构建物(如所有那些在N-未端 包含287的)另有两个融合于抗原的编码序列的密码子(GCTAGC)。染色体DNA模板的制备在100ml GC培养基中使脑膜炎奈瑟球菌菌株2996、MC58、394. 98、1000和 BZ232(及其它)生长至指数期,离心收获,并重悬浮于5ml缓冲液(20 % w/v蔗糖、50mM Tris-HCl、50mM EDTA、pH 8)中。在冰上培育10分钟后,加入IOml裂解液(50mM NaClU% 十二烷基肌氨酸钠(Na-Sarkosyl)、50 μ g/ml蛋白酶K)裂解细菌,悬浮液在37°C培育2小 时。进行2次苯酚提取(平衡至pH8)和一次CHCl3/异戊醇(24 1)提取。加入0. 3M乙 酸钠和2体积乙醇沉降DNA,并离心收集。用70% (ν/ν)乙醇洗涤沉淀物1次,并重溶解于 4. Oml TE 缓冲液(IOmM Tris-HClUmM EDTA, ρΗ 8.0)。读取 OD26。测定 DNA 浓度。PCR 扩增标准的PCR过程进行如下在40 μ M各寡核苷酸引物、400-800 μ M dNTP溶液、Ix PCR 缓冲液(包含 1. 5mM MgCl2)、2· 5 单位 TaqI DNA 聚合酶(用 Perkin-Elmer AmpliTaQ, Boerhingher Mannheim Expand 长模板)存在时,将 200ng 2996、MC581000、或 BZ232 菌株 的基因组DNA或IOng重组克隆的质粒DNA制备物用作模板。将整个混合物在95°C初步培育3分钟后,每份样品进行2-步的扩增用除去引物 (Tffll)的限制酶尾部的杂交温度进行前5轮。然后以按全长?聚物(Tm2)计算的杂交温度进 行30轮。根据要扩增的Orf的长度,在68°C或72°C进行的延伸时间各不相同。对Orf 1而 言,自3分钟开始的延伸时间每轮递增15秒。以在72°C 10分钟延伸步骤完成循环。将扩增的DNA直接加到琼脂糖凝胶上。按制造商说明,用Qiagen凝胶提取试 剂盒纯化相应于正确大小条带的DNA片段。[2718]PCR片段和克隆载体的消化用适合的限制酶消化相应于扩增片段的纯化DNA,从而克隆入pET_21b+、 pET22b+、或pET_24b+。用QIAquick PCR纯化试剂盒(按制造商的说明)纯化消化的片段, 用H2O或IOmM Tris (pH 8. 5)洗脱。用适合的限制酶消化质粒载体,加到1. 0%琼脂糖凝胶 上,用Qiagen AIQquick凝胶提取试剂盒纯化相应于消化的载体的条带。克隆将预先消化和纯化的、相应于各基因的片段连接到pET21b+、pET22b+或pET_24b+ 中。将在连接缓冲液(由制造商提供)中的T4DNA连接酶用于摩尔比为3 1的片段/载 体。通过在冰上培育连接酶反应溶液和细菌40分钟,然后在37°C培育3分钟,将重组 质粒转化入感受态大肠杆菌DH5或HBlOl中。然后添加800 μ 1 LB肉汤,并在37°C培育20分钟。在Eppendorf微型离心机中 以最高速度离心这些细胞,并重悬浮于约200 μ 1的上清液中,并涂布在到LB氨苄青霉素 (100mg/ml)琼脂上。在4. Oml LB肉汤+100 μ g/ml氨苄青霉素中培育随机选择的集落过夜,进行重组 集落的筛选。使细胞沉淀,并按制造商的说明用Qiagen QIAprep SpinMinipr印试剂盒提 取质粒DNA。用适合的限制酶消化约1 μ g的各微型制备物,将消化物加到1-1. 5%琼脂糖 凝胶(取决于预计的插入大小)与分子量标记(lkbDNA Ladder,GIBC0)平行。根据插入的 大小选择阳性克隆。表达各基因克隆入表达载体后,将重组质粒转化入适合表达重组蛋白的大肠杆菌菌 株中。如上所述,用Iyl各构建物转化大肠杆菌BL21-DE3。将单重组集落接种入2ml LB+Amp(100y g/ml)中,在 37°C培育过夜,然后在 IOOml 烧瓶中用 20ml LB+Amp (100 μ g/ml) 以1 30稀释,使OD6tltl在0. 1-0. 2之间。将烧瓶置于旋转式水浴摇床中于30°C或37°C培 育,直到0D600显示适合诱导表达的指数生长期(0. 4-0. 80D)。加入1. OmM IPTG诱导蛋白 质表达。在30°C或37°C培育3小时后,测定0D_并检测表达。用微型离心机离心1. Oml各 样品,将沉淀物重悬浮于PBS中,用SDS-PAGE和考马斯蓝染色分析。Gateway克隆和表达克隆GATE标记的序列,并用GATEWAY克隆方法(GIBC0-BRL)表达。重组克隆(CR) 是根据介节噬菌体整合入大肠杆菌基因组和从大肠杆菌基因组切除噬菌体的重组反应。整 合包括在位于细菌基因组attB位点中的噬菌体DNA的attP位点的重组(BP反应)和产生 侧翼于attL和attR位点的整合的噬菌体基因组。切除将attL和attR位点重组回attP 和attB位点(LR反应)。整合反应需要两种酶[噬菌体蛋白融合酶(Int)和细菌蛋白整 合宿主因子(IHF)] (BP克隆酶)。切除反应需要Int、IHF和其它噬菌体酶切除酶(Xis) (LR 克隆酶)。将25-bp细菌attB重组位点的人工衍生物(涉及Bl和B2)加到用于PCR反应 的引物的5'端,以扩增奈瑟球菌的0RF。用BP克隆酶,将得到的产物BP克隆入包含噬菌 体attP重组位点的互补衍生物的“供体载体”中。得到的“进入克隆”包含侧翼于attL位 点的衍生物(Li和L2)的0RF,用LR克隆酶将其亚克隆入包含attL-相容的attR位点的衍 生物的表达“目的载体”中。得到“表达克隆”,其中ORF侧翼于Bl和B2,且在读框内融合
107于GST或His N未端标记。用于GATEWAY表达的大肠杆菌菌株是BL21-SI。通过在含有盐(0. 3MNaCl)的培养 基中培育,诱导该菌株的细胞表达T7RNA聚合酶。要注意的是该系统产生N-未端His标记。膜蛋白的制备分离主要由内膜、外膜或全膜构成的组分,以获得由膜定位的前导序列表达的 重组蛋白。制备膜组分(富含重组蛋白)的方法是采用Filip等[J.Bact. (1973) 115 717-722]和 Davies 等人[J. Innunol. Meth. (1990) 143 :215_225]的方法。于 37°C,在 20ml LB/Amp(100yg/ml)液体培养基中使携带感兴趣质粒中的单集落生长过夜。用1. OL新鲜培 养基以1 30稀释细菌,让其在30°C或37°C生长直到OD55tl达到0.6-0. 8。用终浓度为LOmM 的IPTG诱导重组蛋白的表达。培育3小时后,在4°C以SOOOg离心15分钟收获细菌,并重 悬浮于 20ml 20mM Tris-HCl (pH 7.5)和完整的蛋白酶抑制剂(Boehringer-Mannheim)中。 随后的所有步骤都是在4°C或冰上进行的。用Branson Sonifier 450进行超声处理破碎细胞,并以5000g离心20分钟以 沉积未破碎的细胞和包含体。以50000g (Beckman Τ 50, 29000rpm)离心包含膜和细胞碎 片的上清液75分钟,用20mM Bis-Tris丙烷(pH 6. 5) U. OM NaCl,10% (ν/ν)甘油洗涤, 并以50000g再次离心75分钟。将沉淀物重悬浮于20mMTris-HCl (pH 7. 5) ,2. 0% (ν/ν) 十二烷基肌氨酸钠、完整的蛋白酶抑制剂(1. OmMEDTA终浓度),并培育20分钟以溶解内 膜。以5000g离心沉淀的细胞碎片10分钟,以75000g离心上清液75分钟(Beckman Τ 50, 33000rpm)。在上清液中发现蛋白质008L和519L,表明内膜的定位。对这些蛋白质,用内 膜和全膜组分(如上所述用NaCl洗涤)免疫接种小鼠。用20mM Tris-HCl (pH 7. 5)洗涤 从75000g沉淀物得到的外膜小泡,并以75000g离心75分钟或过夜。最后将OMV重悬浮于 500 μ 1 20mM Tris-HCl (pH 7. 5)、10% ν/ν 甘油中。Orf IL 和 0rf40L 都定位于且在外膜组 分中富含,将其用于免疫接种小鼠。用标准Bradford试验(Bio-Rad)计算蛋白质浓度,用 DC蛋白质试验(Bio-Rad)确定内膜组分的蛋白质浓度。用SDS-PAGE分析分离步骤中的各 种组分。His-标记的蛋白质的纯化从菌株2996和MC58中克隆了 287的各种形式。用C-未端His标记的融合体 进行构建,其包括成熟形式(aal8_427)、含缺失(Δ 1、Δ 2、Δ 3和Δ 4)的构建物和由B 或C结构域组成的克隆。对以His-融合体纯化的各克隆而言,划线接种单集落,并且在 37°C LB/Amp(100yg/ml)琼脂板上培育过夜。将从该平板上分离的集落接种到20ml LB/ Amp(100yg/ml)的液体培养基中,并在37°C振荡生长过夜。以1 30将过夜培养物稀释到 LOL LB/Amp (100 μ g/ml)液体培养基中,让其在最佳温度(30或37°C)生长,直到0055(1达 到0. 6-0. 8。添加IPTG(终浓度为1. OmM)诱导重组蛋白的表达,再培育培养物3小时。于 4°C,以8000g离心15分钟收获细菌。将细菌沉淀重物悬浮于7. 5ml⑴冷缓冲液A(300mM NaCl、50mM磷酸盐缓冲液、IOmM咪唑、pH 8. 0),用于可溶性蛋白质;或(ii)缓冲液B(10mM Tirs-HClUOOmM磷酸盐缓冲液,pH 8. 8和任选地8M尿素),用于不溶性蛋白质。以可溶形 式纯化的蛋白质包括 287-His、ΔΙ、Δ2、Δ3 和 A4287_His、Δ 4287MC58-His、287c_His 和 287cMC58-His。蛋白质 287bMC58_His 是不溶的并相应地纯化。用 Branson Sonifier 450,在冰上以40W、30秒超声处理破坏细胞4次,并于4°C以13000xg离心30分钟。对于不溶蛋 白质,将沉淀物重悬浮于2. Oml缓冲液C(6M盐酸胍、IOOmM磷酸盐缓冲液、IOmM Tris-HCl、 PH 7. 5),并用Doimce勻浆器处理10次。以13000g离心勻浆30分钟并保留上清液。将 可溶的和不溶制备物的上清液与150 μ 1 Ni2+-树脂(预先用缓冲液A或缓冲液B平衡) 混合,并在室温温和振荡培育30分钟。树脂是按制造商说明制备的Chelating Sepharose Fast Flow(Pharmcia)。于4°C,以700g离心分批制备物5分钟,弃去上清液。用IOml缓 冲液A或B洗涤树脂2次(分批)10分钟,重悬浮于1. Oml缓冲液A或B中,加到一次性柱 上。用⑴缓冲液A(4°C )或(ii)缓冲液B (室温)持续洗涤树脂,直到流出物的OD28tl达到 0.02-0.01。再用⑴冷缓冲液C(300mM NaCl、50mM磷酸盐缓冲液、20mM咪唑、pH 8.0)或 (ii)缓冲液D(10mM Tris-HCl、IOOmM磷酸盐缓冲液、pH 6. 3和任选地8M尿素)进一步洗 涤树脂,直到流出物的OD28tl达到0. 02-0. 01。加入700μ l(i)冷洗脱缓冲液A(300mM NaCl, 50mM磷酸盐缓冲液、250mM咪唑、pH 8.0)或(ii)洗脱缓冲液B(10mM Tris-HCl、IOOmM磷 酸盐缓冲液、PH 4.5和任选地8M尿素)洗脱His-融合蛋白,收集组分直到OD28tl显示获得 了所有重组蛋白。用SDS-PAGE分析20 μ 1量的各洗脱组分。用Bradford试验计算蛋白质 浓度。变性的His-融合蛋白的复性需要变性以稳定287bMC8,因此在免疫接种前需要进行复性步骤。将甘油加到上 述得到的变性组分中,使终浓度为10% ν/ν。用透析缓冲液1(10% ν/ν甘油,0. 5Μ精氨酸、 50mM磷酸盐缓冲液、5. OmM还原的谷胱甘肽、0.5mM氧化的谷胱甘肽、2. OM尿素,pH 8.8) 将蛋白质稀释至200yg/ml,用相同的缓冲液在4°C透析12-14小时。于4°C,用缓冲液 11(10% ν/ν甘油,0. 5Μ精氨酸、50mM磷酸盐缓冲液、5. OmM还原的谷胱甘肽、0. 5mM氧化的 谷胱甘肽、PH 8. 8)再进行透析12-14小时。用以下公式计算蛋白质的浓度蛋白质(mg/ml)= (1. 55XOD280)-(0. 76XOD260)氨基酸序列分析根据制造商的推荐,用配备在线乙内酰苯硫脲-氨基酸分析仪(System Gold)的 Beckman测序仪(LF 3000)进行蛋白质NH2-末端的自动测序分析。免疫接种在第0、21和35天,用抗原免疫接种Balb/C小鼠,在第49天分析血清。血清分析-ELISA将不包囊的MenB M7和包囊的菌株置于巧克力琼脂板上,在37 °C、5 % CO2中 培育过夜。用无菌Dracon刷从琼脂板上收集细菌菌落,并接种到含有0. 25 %葡萄糖的 Mueller-Hinton肉汤(Difco)中。每30分钟监测一次细菌的生长,随后测定0D62(1。让细菌 生长直到OD达到0. 4-0. 5。将培养物以4000rpm离心10分钟。弃去上清液,用PBS洗涤细 菌2次,重悬浮于含有0. 025%甲醛的PBS中,并在37°C培育1小时,然后在4°C搅拌培育过 夜。在96孔Greiner板的各孔中添加100 μ 1细菌细胞,并在4°C培育过夜。然后用PBT洗 涤缓冲液(0. 1 % Tween-20的PBS溶液)冲洗这些孔3次。在各孔中加入200 μ 1饱和缓冲 液(2. 7%聚乙烯吡咯烷酮10的水溶液),将这些平板在37°C培育2小时。用PBT冲洗这些 孔3次。在各孔中加入200 μ 1稀释的血清(稀释缓冲液1% BSA、0. 1% Tween-20,0. 1% NaN3的PBS溶液),将这些平板在37°C培育2小时。用PBT冲洗这些孔3次。在各孔中加
109入100 μ 1 HRP-缀合的兔抗-小鼠(Dako)血清(用稀释缓冲液以1 2000稀释),将这些 平板置于37°C培育90分钟。用PBT缓冲液洗涤这些孔3次。在各孔中加入100 μ 1 HRP的 底物缓冲液(25ml柠檬酸缓冲液pH 5,IOmg邻-苯二胺(phenildiamine)和10 μ 1 H2O2), 并将平板在室温中静置20分钟。在各孔中加入100 μ 1 12.5% H2SO4,随后测定0D49(1。计算 ELISA滴定度,即高于预先免疫血清稀释度的、0D490值为0. 4的血清稀释度。当0D490值 为0. 4的血清稀释度高于1 400时,将ELISA视为阳性。血清分析-FACS扫描细菌结合分析将不包囊的MenB M7菌株置于巧克力琼脂板上,在37°C、5% CO2中培育过夜。用无 菌Dracon刷从琼脂板上收集菌落,并接种到4支装有0.25%葡萄糖的8ml Mueller-Hinton 肉汤(Difco)试管中。每30分钟监测细菌的生长,然后测定0D62Q。让细菌生长直到OD达 到0. 35-0. 5。将培养物以4000rpm离心10分钟。弃去上清液,用封阻缓冲液(1 % BSA的 PBS溶液,0. 4% NaN3)重悬浮沉淀物,并以4000rpm离心5分钟。将细胞重悬浮于封阻缓 冲液,使OD620达到0. 05。在96孔Costar板的各孔中添加100 μ 1细菌细胞。在各孔中加 入ΙΟΟμΙ稀释的(1 IOOU 200,1 400)血清(以封阻缓冲液配制),并将这些平板 在4°C培育2小时。以4000rpm离心细胞5分钟,吸出上清液,在各孔中加入200 μ 1/孔封 阻缓冲液洗涤细胞。在各孔中加入ΙΟΟμΙ R-Phicoerytrin缀合的F(ab) 2山羊抗-小鼠 (以1 100稀释),将平板置于4°C培育1小时。以4000rpm离心5分钟以沉淀细胞,加 入200 μ 1/孔封阻缓冲液洗涤细胞。吸出上清液,细胞重悬浮于200 μ 1/孔PBS、0. 25%甲 醛。将样品转移到FACScan管中并读数。FACScan (Laser Power 15mff)的条件设为FL2开; FSC-H 阈值92 ;FSC PMT 电压E01 ;SSCPMT 474 ;Amp. Gains 6. 1 ;FL-2 PMT 586 ;补偿值 O0血清分析_杀菌试验于37°C、在5% CO2、在巧克力琼脂板(以冷冻原液起始)上培育脑膜炎奈瑟球菌 2996过夜。收集菌落,并将其接种到7ml含有0.25%葡萄糖的MueIler-Hinton肉汤中,使 OD620达到0. 05-0. 08。在37°C振荡培育约1. 5小时,直到OD620达到0. 23-0. 24。用50mM磷酸 盐缓冲液(ρΗ7· 2,含 IOmM MgCl2UOmM CaCl2 和 0. 5% (w/v)BSA(分析缓冲液))以 IO5CFU/ ml工作稀释度稀释细菌。最终反应混合物的总体积为50 μ 1,其中25 μ 1连续2倍稀释的 测试血清,12. 5 μ 1工作稀释度的细菌,12. 5 μ 1幼兔补体(终浓度25% )。对照包括用补体血清培育的细菌、用细菌培育并在56°C加热30分钟补充灭活的 免疫血清。在加入幼兔补体后,用斜置方法立即将10 μ 1对照置于MuelIer-Hinton琼脂板 上(0时间)。37°C旋转培育96孔板1小时。将每份样品的7 μ 1涂布在Mueller-Hinton琼 脂板上作为斑点,而用斜置方法将10 μ 1对照涂布在Mueller-Hinton琼脂板上(1时间)。 37°C培育琼脂板18小时,计算相应于0时间和1时间的菌落数量。血清分析-Western印迹法将纯化的蛋白质(500ng/泳道)、外膜小泡(5 μ g)和MenB菌株2996衍生的全细 胞提取物(25 μ g)加到12% SDS-聚丙烯酰胺凝胶上,并转移到硝基纤维素膜上。用转化缓 冲液(0. 3% Tris碱,1. 14%甘氨酸、20% (ν/ν)甲醇)在4°C、150mA进行转化2小时。于 4°C在饱和缓冲液(10%脱脂乳、0. 1% Triton X100的PBS溶液)中培育过夜使膜饱和。用 冲洗缓冲液(3%脱脂乳、0. 1 % Triton X100的PBS溶液)冲洗膜2次,并在37°C与用洗涤缓冲液以1 200稀释的小鼠血清一起培育2小时。冲洗膜2次,与1 2000稀释的辣根 过氧化物酶标记的抗_小鼠Ig —起培育90分钟。用0. Triton XlOO的PBS溶液冲洗 膜2次,用0pti-4CN底物试剂盒(Bio-Rad)显色。加入水终止反应。如下制备OMV :37°C,5% CO2,在5个GC板上让脑膜炎奈瑟球菌2996生长过夜,用 接种环收获,并重悬浮于IOml 20mM Tris-HCl pH 7. 5、2mM EDTA中。在56°C热灭活45分 钟,在冰上超声处理破碎细胞5分钟(50%负载循环(dutyCyCle)、50%输出,Branson超声 仪3mm微型针头)。以5000g离心10分钟除去未破碎的细胞,回收含有完整细胞包膜组分 的上清液,于4°C以50000g进一步离心过夜。将含有膜的沉淀物重悬浮于2%二烷基肌氨 酸、20mM Tris-HCl pH7. 5、2mM EDTA中,在室温培育20分钟以溶解内膜。以IOOOOg离心 上清液10分钟除去聚集体,以50000g进一步离心上清液3小时。用PBS冲洗含有外膜的 沉积物,并重悬浮于相同的缓冲液中。用BSA作为标准,由D. C. Bio-Rad蛋白分析(改进的 Lowry方法)测定蛋白质的浓度。如下制备全细胞提取物使脑膜炎奈瑟球菌在GC板上培育过夜,用接种环收获, 并重悬浮于Iml 20mM Tris-HCl中。在56°C热灭活30分钟。961结构域的研究细胞组分的制备用过夜培养物或在IPTG培育3小时后的细菌制备表达961不同 结构域的大肠杆菌克隆的全裂解物、周质、上清液和0MV。简单地说,获得周质,细菌悬浮于 蔗糖 25%和 Tris 50mM(pH 8)(含有 polimixine 100 μ g/ml)。1 小时后,室温以 13000rpm 离心细菌15分钟,收集上清液。用0.2 μ m过滤培养物上清液,在冰中用TCA 50%沉淀2小 时。离心(13000rp,30分钟)后,用乙醇70%漂洗沉淀物2次,并悬浮于PBS中。如上所 述,进行OMV制备。用针对GST-961的多克隆抗血清,在SDS-PAGE或Western印迹中分析 各细胞组分。粘附分析在补充有10%热灭活的PCS、15mM L-谷氨酰胺和抗生素的 DMEM(Gibco)中维持张氏(Chang)上皮细胞(Wong-Kilbourne衍生物,克隆l_5c_4,人结膜)。为了进行粘附分析,用PBS漂洗张氏上皮细胞的亚融合培养物,并用胰蛋白 酶-EDTA(Giboc)处理,从而从塑性支持体上释放它们。然后将细胞悬浮于PBS中,计数并 在PBS中稀释至5X IO5细胞/ml。沉淀过夜培育的或用IPTG诱导后的细菌,并用PBS通过以13000离心5分钟 洗涤2次。在室温、暗处,在Iml缓冲液(含有50mM NaHCO3和IOOmM NaClpH 8)中将 约2-3X108(cfu)与0. 5mg/ml FITC(Sigma) —起培育30分钟。洗涤FITC标记的细菌 2-3次,并以1-1. 5X 109/ml悬浮于PBS中。于37 °C,将200 μ 1此悬浮液(2-3X IO8)与 200 μ KlXlO5)上皮细胞一起培育30分钟。然后以2000rpm离心细胞5分钟,除去未粘附 的细胞,悬浮液200 μ 1 PBS中,转移到FACScan管中并读数。
11权利要求
一种异源表达本发明蛋白质的方法,其特征在于,所述的方法中(a)除去蛋白质中的至少一个结构域,和任选地(b)未使用融合配体。
2.如权利要求1所述的方法,其特征在于,所述的本发明的蛋白质是0RF46。
3.如权利要求2所述的方法,其特征在于,将所述的0RF46分成第一结构域(氨基酸 1-433)和第二结构域(氨基酸433-608)。
4.如权利要求2所述的方法,其特征在于,所述的本发明的蛋白质是564。
5.如权利要求4所述的方法,其特征在于,将所述的蛋白质564分成如图8所示的结构域。
6.如权利要求1所述的方法,其特征在于,所述的本发明的蛋白质是961。
7.如权利要求6所述的方法,其特征在于,将所述的蛋白质961分成如图12所示的结 构域。
8.如权利要求1所述的方法,其特征在于,所述的本发明的蛋白质是502,且所述的结 构域是氨基酸28-167 (按MC58序列编号)。
9.如权利要求1所述的方法,其特征在于,所述的本发明的蛋白质是287。
10.一种异源表达本发明蛋白质的方法,其特征在于,在所述的方法中(a)除去蛋白质 N-未端区域的一部分。
11.如权利要求9或10所述的方法,其特征在于,将所述的蛋白质287如图5所示分成 结构域A、B和C。
12.如权利要求11所述的方法,其特征在于,除去(i)所述的结构域A;(ii)所述的结 构域A和B ;或(iii)所述的结构域A和C。
13.如权利要求11所述的方法,其特征在于,除去所述的结构域A的(i)氨基酸1-17; ( )氨基酸1-25 ; (iii)氨基酸1-69 ;或(iv)氨基酸1-106。
14.一种异源表达本发明蛋白质的方法,其特征在于,所述的方法(a)未使用融合配 体,和(b)使用蛋白质的天然前导肽(如果存在)。
15.如权利要求14所述的方法,其特征在于,所述的本发明的蛋白质选自111、 149、206、225-1、235、247-1、274、283、286、292、401、406、502-1、503、519-1、525-1、552、 556、557、570、576-1、580、583、664、759、907、913、920-1、936-1、953、961、983、989、Orf4, 0rf7-l、0rf9-l、Orf23, Orf25, Orf37,0rf38、0rf40、0rf40. 1、0rf40. 2、0rf72-l、0rf76-l、 Orf85-2, Orf9U Orf97-1, 0rfll9、0rfl43. 1、NMBO109, NMB2050、008、105、117-1、121-1、 122-l、128-l、148、216、243、308、593、652、726、926、982、0rf83-l 和 Orf143-1
16.一种异源表达本发明蛋白质的方法,其特征在于,在所述的方法中(a)用不同蛋白 质的前导肽替代该蛋白质的前导肽,和任选地(b)未使用融合配体。
17.如权利要求16所述的方法,其特征在于,所述的不同蛋白质是961、0RF4、大肠杆菌 OmpA或胡萝卜软腐欧文氏菌PelB,或所述的前导肽是MKKYLFSAA。
18.如权利要求17所述的方法,其特征在于,所述的不同蛋白质是大肠杆菌OmpA,且本 发明的蛋白质是0RF1。
19.权利要求17所述的方法,其特征在于,所述的本发明蛋白质是911,所述的不同蛋 白质是胡萝卜软腐欧文氏菌PelB或大肠杆菌OmpA。
20.如权利要求17所述的方法,其特征在于,所述的不同蛋白质是0RF4,所述的本发明2的蛋白质是287。
21.一种异源表达本发明蛋白质的方法,其特征在于,在所述的方法中(a)除去所述的 蛋白质的前导肽,和任选地(b)未使用融合配体。
22.如权利要求21所述的方法,其特征在于,所述的本发明蛋白质是919。
23.一种异源表达本发明蛋白质的方法,其特征在于,在不显现所述的蛋白质毒性的温 度表达本发明的蛋白质。
24.如权利要求23所述的方法,其特征在于,在30°C表达所述的蛋白质919。
25.一种异源表达本发明蛋白质的方法,其特征在于,突变所述的蛋白质以降低或除去 毒性。
26.如权利要求25所述的方法,其特征在于,所述的本发明蛋白质是907、919或922。
27.如权利要求26所述的方法,其特征在于,在Glu-117突变907(如Glu — Gly)。
28.如权利要求26所述的方法,其特征在于,在Glu-255(如Glu — Gly)和/或 Glu-323 (如 Glu — Gly)突变 919。
29.如权利要求26所述的方法,其特征在于,在Glu-164(如Glu- — Gly)、Ser_213 (如 Ser — Gly)和 / 或 Asn-348 (如 Asn-Gly)突变 922。
30.一种异源表达本发明蛋白质的方法,其特征在于,在所述的方法中使用载体 PSM214 或载体 pET-24b。
31.如权利要求30所述的方法,其特征在于,所述的本发明蛋白质是953,载体是 PSM214。
32.—种异源表达本发明蛋白质的方法,其特征在于,表达或纯化所述的蛋白质使其为 特定的多聚体形式。
33.如权利要求32所述的方法,其特征在于,以单体形式表达和/或纯化蛋白质953。
34.如权利要求32所述的方法,其特征在于,以四聚体形式表达和/或纯化蛋白质961。
35.如权利要求32所述的方法,其特征在于,以二聚体形式表达和/或纯化蛋白质287。
36.如权利要求32所述的方法,其特征在于,以单体形式表达和/或纯化蛋白质919。
37.一种异源表达本发明蛋白质的方法,其特征在于,在所述的方法中将蛋白质以脂质 化的蛋白质表达。
38.如权利要求37所述的方法,其特征在于,所述的本发明蛋白质是919、287、0RF4、 406、576 或 0RF25。
39.一种异源表达本发明蛋白质的方法,其特征在于,在所述的方法中(a)突变蛋白质 的C-未端区域,和任选地(b)未使用融合配体。
40.如权利要求39所述的方法,其特征在于,所述的突变是替代、插入或缺失。
41.如权利要求40所述的方法,其特征在于,所述的本发明的蛋白质是730、0RF29或 0RF46。
42.一种异源表达本发明蛋白质的方法,其特征在于,在所述的方法中突变所述的蛋白 质的前导肽。
43.如权利要求42所述的方法,其特征在于,所述的本发明蛋白质是919。
44.一种异源表达蛋白质的方法,其特征在于,突变所述的蛋白质中的聚-甘氨酸段。
45.如权利要求44所述的方法,其特征在于,所述的蛋白质是本发明的蛋白质。
46.如权利要求45所述的方法,其特征在于,所述的本发明蛋白质是287、741、983或 Tbp2。
47.如权利要求46所述的方法,其特征在于,从287或983除去(Gly)6。
48.如权利要求46所述的方法,其特征在于,从Tbp2或741除去(Gly)4。
49.如权利要求47或48所述的方法,其特征在于,还除去所述的前导肽。
50.如上所述的任一方法,其特征在于,所述的异源表达是在大肠杆菌宿主中进行的。
51.由上述任一方法表达的蛋白质。
52.包含N-未端氨基酸序列MKKYLFSAA的异源蛋白质。
全文摘要
异源表达脑膜炎奈瑟球菌和淋病奈瑟球菌蛋白质的其它和改进的方法。这些方法通常影响表达的水平、纯化的简易性、细胞的定位和/或所表达的蛋白质的免疫特性。
文档编号A61K38/00GK101906413SQ20101016566
公开日2010年12月8日 申请日期2001年2月28日 优先权日2000年2月28日
发明者C·加莱蒂, M·B·阿科, M·M·朱利亚尼, M·皮扎, M·科曼杜西, V·马斯格阿尼 申请人:启龙有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1