不可分型的嗜血菌属的高分子量表面蛋白的制作方法

文档序号:3550104阅读:653来源:国知局
专利名称:不可分型的嗜血菌属的高分子量表面蛋白的制作方法
技术领域
本发明涉及不可分型的嗜血菌的高分子量蛋白。
本发明背景不可分型的流感嗜血菌(non-typeable Haemophilusinfluenzae)是无被膜的生物,是因其缺乏与抗已知流感嗜血菌被膜抗原的反应性而被定义的。
这种生物通常寄居在人的上呼吸道,并且通常引起多种常见的粘膜表面感染,如中耳炎、窦炎、结膜炎、慢性支气管炎和肺炎。对于儿童来说,中耳炎仍然是一个重要的健康问题,大部分儿童在3岁时已至少发生过一次耳炎,并有大约1/3的儿童已出现过3次或3次以上耳炎。通常有20-25%的急性中耳炎病例是由不可分型的流感嗜血菌引起的,而在有渗出液的慢性中耳炎中其占有更大的百分比。
这种感染发病的关键的第一步是呼吸道粘膜的建群。因此,介导粘连的细菌表面分子在作为可能的疫苗候选物方面特别有价值。
由于上述不可分型的生物没有多糖被膜,它们不受现有流感嗜血菌b型(Hib)疫苗的控制,所述疫苗是针对Hib细菌被膜多糖的。不过,所述不可分型的菌株确实可产生能引起细菌抗体的表面抗原。已证实主要外膜蛋白中的两种P2和P6是人血清杀菌活性的目标。不过,业已证实P2蛋白序列是可变的,尤其是在不可分型的嗜血菌属菌株中。因此,基于P2的疫苗不能保护所述生物的一切菌株。
BarenKamp等(儿科传染病杂志9:333-339,1990)早先已鉴定了一组不可分型的流感嗜血菌的高分子量(HMW)蛋白,这些蛋白似乎是存在于恢复期病人血清中的抗体的主要目标。对一系列中耳分离物进行检查揭示出在大多数菌株中存在一种或两种这样的蛋白。不过,在本发明之前,作为这些蛋白的纯分离物,其结构及其编码核苷酸序列是未知的。另外,这些蛋白的表面可及表位的性质也不清楚。
发明概述本发明人为了进一步鉴定所述高分子量(HMW)不可分型的嗜血菌属蛋白,已对来自一种原型不可分型的嗜血菌属菌株的编码两种免疫显性HMW蛋白(命名为HMW1和HMW2)的基因作了克隆、表达和测序,并且已对来自另一种不可分型的嗜血菌属菌株的编码另外两种免疫显性HMW蛋白(命名为HMW3和HMW4)的基因作了克隆、表达和测序。
因此,按照本发明的一个方面,提供了一种提取并纯化了的编码一种不可分型的嗜血菌属菌株的高分子量蛋白的核酸分子,特别是编码蛋白HMW1、HMW2、HMW3或HMW4的核酸分子,以及编码保持了其预防由不可分型的嗜血菌属菌株引起的疾病的免疫学能力的所述蛋白的一切变体或片段的核酸分子。
所述核酸分子可以具有

图1所示的DNA序列(序列1),并编码具有图2所示衍生氨基酸序列(序列2)的菌株12的HMW1。所述核酸分子可以具有图3所示的DNA序列(序列3),并编码具有图4所示衍生氨基酸序列(序列4)的菌株12的蛋白HMW2。所述核酸分子可以具有图8所示的DNA序列(序列7)并编码具有图10所示衍生氨基酸序列(序列9)的菌株5的HMW3。所述核酸分子可以具有图9所示的DNA序列(序列8),并编码具有图10所示衍生氨基酸序列(序列10)的菌株5的蛋白HMW4。
在本发明的另一方面,提供了一种提取并纯化了的编码一种不可分型的嗜血菌属菌株的高分子量蛋白的核酸分子,该核酸分子选自下列一组(a)图1、3、8和9(序列1,3,7和8)中任一个所示的DNA序列;(b)编码图2、4和10中任一个所示氨基酸序列(序列2、4、9和10)的DNA序列;和(c)能在严格条件下与(a)和(b)中任一序列杂交的DNA序列。
如(c)中所述的DNA序列可以是与DNA序列(a)或(b)有至少约90%的序列同一性的序列。
本发明人还发现,正确加工HMW蛋白要有额外的下游核酸序列的存在。因此,本发明的另一方面提供了一种分离并纯化了的基因簇,该基因簇包括编码一种不可分型的嗜血菌属菌株的高分子量蛋白的第一核苷酸序列以及完成完全由其结构基因编码的该第一核苷酸序列的一种基因产生表达的至少一个下游核苷酸序列。
所述基因簇可以包括一个编码高分子量蛋白HMW1或HMW2的DNA序列和两个下游辅助基因。该基因簇可以具有图6(序列5)或图7(序列6)所示的DNA序列。
另一方面,本发明包括一种适于转化一种宿主的载体,该载体含有本发明所提供的核酸分子,尤其是本发明所提供的基因簇。该载体可以是一种表达载体或质粒,它适于在异源或同源宿主中表达所编码的高分子量蛋白或其片段或类似物,并包括有效连接于所述核酸分子上的表达装置。该表达装置可以包括一个编码用于从所述宿主中分泌高分子量蛋白的前导序列的核酸部分。该表达装置可以包括一个编码一种脂化信号的核酸部分,用于从所述宿主中表达脂化形式的高分子量蛋白。举例来说,所述宿主可以选自大肠杆菌、芽胞杆菌属、嗜血菌属、真菌、酵母、杆状病毒和Semliki森林病毒表达系统。本发明还包括一种可由所述转化宿主产生的不可分型的嗜血菌属的高分子量蛋白或其片段或类似物。
另一方面,本发明提供了一种分离并且纯化了的不可分型的流感嗜血菌的高分子量蛋白,该蛋白是由本发明所提供的核酸分子编码。这种高分子量蛋白可以通过重组方法产生,以缺少不可分型的流感嗜血菌的非高分子量蛋白,或从天然来源获得。
上述蛋白的特征是具有至少一个外露的表位,该表位由单克隆抗体AD6(ATCC_____)识别。上述蛋白可以是由图1所示DNA序列(序列1)编码的HMW1,并具有图2所示的衍生氨基酸序列(序列2),其表观分子量为125kDa。所述蛋白可以是由图3所示DNA序列(序列3)编码的HMW2,并具有图4所示的衍生氨基酸序列(序列4),其表观分子量为120kDa。所述蛋白可以是由图8所示DNA序列(序列7)编码的HMW3,并具有图10所述的衍生氨基酸序列(序列9),其表观分子量为125kDa。所述蛋白可以是由图9所示DNA序列(序列8)编码的HMW4,并具有图10所示的衍生氨基酸序列(序列10),其表观分子量为123kDa。
本发明的再一方面提供了一种提取并纯化了的不可分型的流感嗜血菌的高分子量蛋白,该蛋白在抗原性方面与百日咳博德特氏菌(Borbetella Pertussis)的丝状血凝素表面蛋白,尤其是HMW1、HMW2、HMW3或HMW4相关。
所述不可分型的嗜血菌属的新的高分子量蛋白可以被用作载体分子,通过与一种抗原、半抗原或多糖连接诱发对该抗原、半抗原或多糖的免疫应答。所述多糖的一个例子是针对b型流感嗜血菌的保护性多糖。
在本发明的又一方面,提供了一种合成肽,该肽的氨基酸序列具有至少6个氨基酸,但不超过150个氨基酸,它对应于不可分型的流感嗜血菌的高分子量蛋白,尤其是HMW1、HMW2或HMW4的至少一个保护性表位。该表位可以是由单克隆抗体AD6(ATCC____)和10C5(ATCC___)中至少一个识别的表位。具体地讲,所述表位可以位于HMW1或HMW2蛋白羧基末端的75个氨基酸中,并由单克隆抗体AD6识别。
本发明还提供了一种免疫原性组合物,该组合物含有一种免疫有效量的活性成分,该活性成分可以是本发明所提供的新的高分子量蛋白或合成肽,可将其与一种可以药用的载体一起配伍。可将所述免疫原性组合物配制成疫苗,用于给宿主体内施用。
可将所述免疫原性组合物配制成微粒、胶囊、ISCOM或脂质体制剂。可将所述免疫原性组合物与靶分子组合使用,以便给药至其免疫系统或粘膜表面的特殊细胞。某些靶分子包括维生素B12和如在WO92/17167(Biotech Australia Pty.有限公司)中所披露的细菌毒素的片段,以及如在美国专利US5,194,254(Barber等)中所披露的单克隆抗体。本发明的免疫原性组合物(包括疫苗)还可以包括至少一种其它免疫原性或免疫刺激材料,该免疫刺激材料可以至少为一种佐剂。
适用于本发明的佐剂包括(但不限于)磷酸铝、氢氧化铝、QS21、QuilA、其衍生物和成分、ISCOM基质、磷酸钙、氢氧化钙、氢氧化锌、糖脂类似物、氨基酸的十八烷基酯、胞壁酰二肽pelyphosphazare、ISCOPRP、DC-chol、DDBA和一种脂蛋白及其它佐剂,以诱发Th1反应。在Commaught Laboratories Limited申请的申请日为1994年6月16日的待批美国专利申请No.08/261,194中披露了佐剂的有利组合。
在本发明的另一方面,提供了一种在宿主中产生免疫反应的方法,包括给所述宿主施用本文所提供的免疫有效量的免疫组合物。所述免疫反应可以是体液或细胞介导的免疫反应。可以赋予其防病性的宿主包括灵长类,其中包括人。
本发明还提供了一种产生对不可分型的流感嗜血菌的高分子量蛋白特异的抗体的方法,包括(a)给至少一只小鼠施用含有本发明所提供的高分子量蛋白或含有表位的肽,以产生至少一只免疫小鼠;(b)从所述至少一只免疫小鼠中移取B-淋巴细胞;(c)融合所述来自所述至少一个免疫小鼠的B-淋巴细胞和骨髓瘤细胞,从而产生杂交瘤;(d)克隆杂交瘤;(e)选择能抗高分子量蛋白抗体的克隆;(f)培养所述抗高分子量蛋白抗体生产克隆;以及随后(g)从所述培养物中提取抗高分子量蛋白抗体。
本发明的其它方面包括单克隆抗体AD6和单克隆抗体10C5。
在本发明的另一方面,提供了一种用于生产一种免疫原性组合物的方法,该方法包括给第一试验宿主施用本发明所提供的免疫原性组合物,测定在施用后诱发针对一种不可分型的流感嗜血菌的高分子量蛋白的特定免疫反应的数量和次数,还包括制备适于按照所测定的施用量和施用次数给第二种宿主施用形式的免疫原性组合物。所述第二种宿主可以是人。
本发明所提供的新的外被蛋白可用于检测针对不可分型的流感嗜血菌的高分子量蛋白的抗体的诊断方法和试剂盒中。另外,所述高分子量蛋白或其表位的特异单克隆抗体可用于检测所述高分子量蛋白存在的诊断方法和试剂盒中。
因此,本发明的再一方面提供了一种检测样品中能与流感嗜血菌的高分子量蛋白发生特异反应的抗体的存在的方法,该方法包括以下步骤(a)让所述样品与本发明提供的高分子量蛋白或含有表位的肽接触,以产生含有所述蛋白和存在于所述样品中的能与其特异反应的任何所述抗体的复合物;和
(b)测定所述复合物的产生。
在本发明的另一方面,提供了一种测定一种样品中流感嗜血菌的高分子量蛋白或含有表位的肽的存在的方法,该方法包括以下步骤(a)用本发明所提供的蛋白或肽免疫一种宿主,以产生对该蛋白或肽特异的抗体;(b)让所述样品与所述抗体接触,以产生含有存在于所述样品中的任何高分子量蛋白或含有表位的肽和所述特异抗体的复合物;和(c)测定所述复合物的产生。
本发明的另一方面提供了一种用于测定样品中与不可分型的流感嗜血菌的高分子量蛋白或含有表位的肽特异反应的抗体的存在的诊断试剂盒,包括(a)本发明所提供的高分子量蛋白或含有表位的肽;(b)用于使所述蛋白或肽与所述样品接触以产生复合物的装置,所产生的复合物含有所述蛋白或肽以及存在于所述样品中的所述任何抗体;和(c)用于测定所述复合物产生的装置。
本发明还提供了一种诊断试剂盒,用于测定样品中流感嗜血菌的高分子量蛋白或含有表位的肽的存在,包括(a)对本发明所提供的所述新的外被蛋白特异的抗体;(b)用于使所述抗体与所述样品接触以产生一种复合物的装置,所产生的复合物含有所述蛋白或肽和蛋白特异性抗体;和(c)用于测定所述复合物产生的装置。
在本申请中,术语“高分子量蛋白”用于表示流感嗜血菌的一类高分子量蛋白,一般其表观分子量为大约120至大约130kDa,并包括其氨基酸序列有差异的蛋白,在本申请中,如果第一种蛋白或肽在免疫学上与第二种蛋白或肽相关和/或具有相同的功能的话,则第一种蛋白或肽是第二种蛋白或肽的“功能类似物”。例如,功能类似物可以是所述蛋白的一个片段或其取代、添加或缺失突变型。本发明还涉及这样的功能类似物。
本发明的优点包括-一种通过重组方法生产的提取并纯化了的流感嗜血菌的外被高分子量蛋白,其中不含流感嗜血菌的非高分子量蛋白,或从天然资源中获取,以及编码所述蛋白的核酸分子;-高分子量蛋白特异的人单克隆抗体,它能识别上述蛋白中的保守表位;和-用于专门鉴定受流感嗜血菌感染的宿主的诊断试剂盒和免疫制剂。
附图的简单说明图1A-1G包括编码蛋白HMW1的DNA序列(序列1)。hmw1A开放读框从351位核苷酸延伸至4958位核苷酸;图2A和2B包含蛋白HMW1的衍生氨基酸序列(序列2);图3A-3G包含编码蛋白HMW2的基因的DNA序列(序列3)。hmw2A开放读框从382位核苷酸延伸至4782位核苷酸;图4A和4B包含HMW2的衍生氨基酸序列(序列4);图5A表示代表性重组噬菌体的限制图,它含有HMW1或HMW2结构基因,以及HMW1质粒亚克隆的限制图。画有影线的方框表示结构基因的位置。在所述重组噬菌体中,HMW1基因的转录从左至右进行,而HMW2基因的转录从右至左进行;图5B表示T7表达载体pT7-7的限制图。该载体含有T7RNA聚合酶启动子φ10,一个核糖体结合位点(rbs)和T7基因10蛋白的翻译起始位点,位于一个多克隆位点上游;图6A-6L含有hmw1基因的基因簇的DNA序列(序列5),包括351-4958位核苷酸(ORFa)(如图1所示),以及位于3′旁侧区的两个额外的下游基因,包括ORFh(5114-6748位核苷酸)和ORFc(7062-9011位核苷酸);图7A-7L含有hmw2基因的基因簇的DNA序列(序列6),包括792-5222位核苷酸(ORFa)(如图3所示),以及位于3′旁侧区的两个额外的下游基因,包括ORFsb(5375-7009位核苷酸)和ORFc(7249-9198位核苷酸);图8A和8B含有编码蛋白HMW3的基因的DNA序列(序列7);图9A和9B含有编码蛋白HMW4的基因的DNA序列(序列8);图10A-10L包括一个对蛋白HMW1(序列2)、HMW2(序列4)、HMW3(序列9)和HMW4(序列10)的衍生氨基酸序列进行比较的表;
图11表示含有HMW1或HMW2重组蛋白噬菌体裂解液的Western免疫印迹分析。用具有抗高分子量蛋白的大肠杆菌(E.coli)吸附的成体血清样品检测裂解液。箭头所指分别表示HMW1和HMW2裂解液中125和120kDa的免疫活性带;图12是由用质粒pT7-7(泳道1和2)、pHMW1-2(泳道3和4)、pHMW1-4(泳道5和6)或pHMW1-14(泳道7和8)转化的大肠杆菌制备的细胞超声处理物的Western免疫印迹分析。用一种具有抗高分子量蛋白的高滴度抗体的大肠杆菌吸附的成体血清样品检测所述超声处理物。标有U和I的泳道分别表示用IPTG诱导生产的样品之前和之后制备的超声处理物。箭头所指表示下文所述的感兴趣的蛋白带;图13是用分析的HMW1抗血清和纯化的百日咳博德特氏菌丝状血凝素所述ELISA分析的曲线图。Ab=抗体;图14是获自一组在流行病学上不相关的不可分型的流感嗜血菌菌株的细胞超声处理物的Western免疫印迹分析。用由HMW1-4重组蛋白制备的兔抗血清检测所述超声处理物。所述菌株的名称用每条线下面的数字表示;图15是获自一组在流行病学上不相关的不可分型的流感嗜血菌菌株的细胞超声处理物的Western免疫印迹分析。用单克隆抗体X3C检测所述超声处理物,X3C是一种鼠IgG抗体,它能识别百日咳博德特氏菌的丝状血凝素。所述菌株的名称由每条线下面的数字表示。
图16表示不可分型的流感嗜血菌菌株12衍生物的细胞超声处理物的免疫印迹分析。用由HMW-1重组蛋白制备的兔抗血清检测所述超声处理物。泳道1,野生型菌株;2,HMW2-突变型;3,HMW1-突变型;4,HMW1-HMW2-双重突变型;图17表示用不可分型的流感嗜血菌菌株12接种中耳7日后在PBS-免疫的对照动物(左图)和HMW1/HMW2-免疫的动物的中耳里的细菌数。数据是经过对数换算的,水平线仅表示每一组中感染动物的中耳液细菌数的平均值和标准差;图18是pGEMEX-hmw1重组质粒的示意图。限制酶有BBamHⅠ,E-EcoRⅠ,C-ClaⅠ,RV-EeoRⅤ,Bst-BstEⅡ和H-HindⅢ;
图19是pGEMEX-hmw1重组质粒的示意图。限制酶有E-EcoRⅠ,H-HindⅢ,Hc-HincⅡ,M-MluⅠ和X-XhoⅠ;图20是代表性不可分型的流感嗜血菌菌株在与单克隆抗体AD6一起培养接着再与同10-nm胶态金粒缀合的山羊抗小鼠IgG一起培养之后的免疫电镜照片。菌株有左上图-菌株12;右上图-菌株12突变型,缺乏高分子量蛋白的表达;左下图-菌株5;右下图-菌株15;图21是用Mab AD6和HMW1或HMW2重组蛋白进行的Western免疫印迹分析。左上图表示hmw1A或hmw2A结构基因片段,该基因以重组蛋白形式表达。泳道编号相当于所表示的片段;图22是用MAb10C5和HMW1或HMW2重组蛋白进行的Western免疫印迹分析。左上图表示hmw1A或hmw2A结构基因片段,该基因以重组蛋白形式表达。泳道编号相当于所表示的片段;和图23是用MAb AD6和一组不相关的不可分型的流感嗜血菌菌株作的Western免疫印迹分析,所述菌株可表达HMW1/HMW-2样蛋白。在Western印迹中,在分析之前由每个菌株的新生长的样品制备细胞超声处理物。
发明的一般说明分别在图1和3中示出的编码不可分型的流感嗜血菌菌株12的HMW1和HMW2蛋白的基因的DNA序列具有80%左右的相同性,这两个基因的前1259bp相同。其开放读框分别从351位氨基酸延伸至4958位氨基酸和从382位氨基酸延伸至4782位氨基酸。分别在图2和4中示出的两种HMW蛋白的衍生氨基酸序列具有70%左右的相同性。另外,其所编码的蛋白在抗原性方面与百日咳博德特氏菌的丝状血凝素表面蛋白相关。已发现针对百日咳博德特氏菌的丝状血凝素(FHA)制备的单克隆抗体能同时识别上述两种高分子量蛋白。这些资料表明,HMW和FHA蛋白可能起着类似的生物学作用。HMW1和HMW2的衍生氨基酸序列与FHA蛋白的氨基酸序列具有序列相似性。还证实了这些在抗原性方面相关的蛋白是由所述嗜血菌属的不可分型的菌株的大部分产生的。
所产生的抗由HMW1基因表达的蛋白的抗血清能同时识别HMW2蛋白和百日咳博德氏菌FHA。本发明包括一种提取并纯化了的不可分型的嗜血菌属的高分子量蛋白,这种蛋白在抗原性方面与百日咳博德特氏菌FHA相关,这种蛋白可获自天然资源或通过重组方法生产。
用标准方法制备一种已知不可分型的嗜血菌属噬菌体基因组文库,并用高滴度抗HMW′s的抗血清筛选表达高分子量蛋白的克隆。对若干强反应性DNA克隆进行噬斑纯化并亚克隆至T7表达质粒中。发现它们能表达两种高分子量蛋白HMW1和HMW2中的一种或另一种,其表观分子量分别为125和120kDa,分别由4.6kb和4.4kb的开放读框编码。
对能表达HMW1或HMW2的代表性克隆作进一步鉴定,并对有关基因进行分离、纯化和测序。在图1中示出了HMW1的DNA序列,并在图2中示出了相应的衍生氨基酸序列。类似地,在图3中示出了HMW2的DNA序列,并在图4中示出了相应的衍生氨基酸序列。对所分离的蛋白做的部分纯化和N-末端序列分析表明,所表达的蛋白是截短了的,因为其序列始于两种全长HMW1和HMW2基因产物的442号残基。
针对hmw1和hmw2基因所做的亚克隆研究表明,正确加工HMW蛋白,需要其它下游基因产物。业已发现,hmw1和hmw2基因的旁侧有两个分别被称为b和c的额外的下游开放读框(参见图6和7)。
bORFs的长度为1635bp,其在hmw1中从5114位核苷酸延伸至6748位核苷酸,而在hmw2中从5375位核苷酸延伸至7009位核苷酸,其衍生氨基酸序列有99%的相同性。所述衍生氨基酸序列与编码分泌和激活P.mirabilis和S.marcescens的溶血素所需蛋白的两个基因的衍生氨基酸序列具有相似性。
cORFs的长度为1950bp,其在hmw1中从7062位核苷酸延伸至9011位核苷酸,而在hmw2中从7249位核苷酸延伸至9198位核苷酸,其衍生氨基酸的相同性为96%。hmw1c是以一系列9bp的同向串联重复为前导。在质粒亚克隆中,hmw1b或cORF的中断会导致hmw1结构基因产物的缺陷型加工和分泌。
已用在下面的实施例中所披露的方法分离并纯化了以上两种高分子量蛋白HMW1和HMW2,已证实其能预防灰鼠的中耳炎,并起到粘附素的作用。上述结果表明了所述高分子量蛋白及流感嗜血菌的其它不可分型的菌株的结构上相关的蛋白在作为免疫原性组合物的成分方面的潜在用途,所述组合物可以预防诸如人类婴儿的敏感性宿主发生因不可分型的流感嗜血菌感染所致的疾病。
由于本发明所提供的蛋白是优良的交叉反应抗原,并存在于大多数不可分型的嗜血菌属菌株中,很显然,这种HMW蛋白可以成为一种通用的嗜血菌属疫苗的组成成分。事实上,所述蛋白不仅可以用作预防由不可分型的嗜血菌属菌株引起的耳炎、窦炎和支气管炎的保护性抗炎,而且还可以用作用于预防脑膜炎的缀合疫苗中保护性Hib多肽的载体。所述蛋白可还以作为来自其它生物的其它抗原、半抗原和多糖的载体,以诱导对这些抗原、半抗原和多糖的免疫性。
已阐明了编码一种不同的不可分型的嗜血菌属菌株(即菌株5)的两种高分子量蛋白(被称为HMW3和HMW4)的核苷酸序列,并示于图8和9(序列7和8)中。HMW3的表观分子量为125kDa,而HMW4的表观分子量为123kDa。这些高分子量蛋白在抗原性上与HMW1和HMW2蛋白相关,并与FHA相关。图10包括本发明所鉴定的4种高分子量蛋白的衍生氨基酸序列(HMW1,序列2;HMW2,序列4;HMW3,序列9;HMW4,序列10)的多种序列比较。通过这种比较可以看出,在比较的整个长度范围内都可以发现相同氨基酸序列的片段,其中,HMW3更接近HMW1,而HMW4更接近HMW2。这一信息充分地表明,来源于不同不可分型的嗜血菌属菌株的高分子量蛋白之间存在着明显的序列同源性。这一信息还提示,HMW3和HMW4蛋白会具有与HMW1和HMW2蛋白相同的免疫学特性,而来自其它不可分型的嗜血菌属菌株的HMW蛋白具有与HMW1和HMW2蛋白相同的免疫学特性。
另外,业已构建了HMW1或HMW2表达缺陷型或同时为这两种缺陷型的不可分型的流感嗜血菌菌株的突变型,并检测查与培养的人上皮细胞结合的能力。已在大肠杆菌中表达了hmw1和hmw2基因簇,并在体外检测其附着性。下文所述的这些实验的结果表明,HMW1和HMW2能介导连接,因此,它们是粘附素,而且这种功能即使在缺乏其它流感嗜血菌表面结构的情况下也存在。细菌表面蛋白作为粘附素的能力,提供了其作为保护性抗原的潜在作用的有力的体外证据。鉴于HMW3和HMW4蛋白之间以及HMW1和HMW2蛋白之间的明显的序列同源性,这些结果表明,HMW3和HMW4也很可能起着粘附素的作用,而不可分型的流感嗜血菌的其它菌株的其它HMW蛋白同样可能起着粘附素的作用。这种推测为以下实施例中所披露的结果所证实。
通过高分子量蛋白的提取和纯化,本发明人能够通过传统的表位作图测定所述蛋白的主要保护性表位,并合成相当于这些决定簇的肽以掺入全合成的或重组疫苗中。因此,本发明还包括一种合成肽,它具有至少6个和不超过150个的氨基酸,并且具有至少相当于一种不可分型的流感嗜血菌的高分子量蛋白的一个保护性表位的氨基酸序列。这些肽是有不同的长度,它们构成所述高分子量蛋白的各个部分,可将其直接用于或作为缀合物的一部分诱导对相应生物的免疫性,因此,构成了用于预防所述相应疾病的免疫原性组合物的活性成分。
具体地讲,本申请人已鉴定了所述高分子量蛋白的区域,这些区域经实验被证实为表面暴露的B-细胞表位,这些表位为所有的或至少是大量的不可分型的流感嗜血菌菌株所共有。本发明人所采用的方法是(a)制备一组能与所述高分子量蛋白反应的单克隆抗体;(b)用免疫电镜方法或其它合适的筛选技术就其与完整细菌的表面表位的反应性筛选上述单克隆抗体;(c)通过测定所述单克隆抗体与一组重组融合蛋白的反应性对能由所述单克隆抗体识别的表位进行作图;和(d)通过标准Western印迹分析测定所述单克隆抗体与异源不可分型的流感嗜血菌的反应性。
用上述方法,本发明人已鉴定了一种被称为AD6(ATCC___)的单克隆抗体,它能识别为所有表达HMW1和HMW2蛋白的不可分型的流感嗜血菌所共有的表面暴露的B-细胞表位。由该抗体所识别的所述表位被作图于HMW1和HMW2蛋白的羧基末端的75个氨基酸的序列上。其识别位于所述高分子量蛋白粘附蛋白上的共有的表面暴露的表位的能力表明,用它可以开发出以重组或合成肽为基础的疫苗,这种疫苗可以预防由大部分不可分型的流感嗜血菌引起的疾病。
本发明还提供了保留了其潜在的预防由不可分型的嗜血菌属菌株引起的疾病的免疫学能力的所述蛋白的一切变体或片段。所述变体可以通过所述基因的部分缺失或突变而建成,并表达修饰的基因以产生所述蛋白变体。
对本领域技术人员来说,显而易见的是,本发明的各种实施方案在细菌感染的接种、诊断、治疗,以及免疫制剂的生产诸领域中具有多种用途。
1.疫苗制备及应用适于作为疫苗的免疫原性组合物可以本发明所披露的流感嗜血菌高分子量蛋白、及其类似物和片段,以及含有所述蛋白表位的合成肽制备。所述免疫原性组合物可以诱发能产生抗体的免疫反应,所述抗体包括抗高分子量蛋白抗体以及调理或杀菌抗体。
包括疫苗在内的免疫原性组合物,可以制备成可注射的液体溶液或乳液。可将活性成分与可以与之匹配的可以药用的赋形剂混合。所述赋形剂可以包括水、盐水、葡萄糖、甘油、乙醇及其组合。所述免疫原性组合物和疫苗还可以含有佐剂物质,如湿润或乳化剂、pH缓冲剂、或佐剂,以加强其效果。免疫原性组合物和疫苗可以通过皮下或肌内注射以肠胃外方式施用。另外,按照本发明制备的免疫原性组合物可以能在粘膜表面引起免疫反应的方式制备和给药。因此,举例来说,可以通过鼻腔或口服(肠内)途径将所述免疫原性组合物给药至粘膜表面。另外,其它施用方式包括栓剂,但优选口服制剂。对于栓剂而言,可以包括粘合剂和载体,例如,聚亚烷基二醇或甘油三酯。口服制剂可以包括常用的赋形剂,例如,药用级糖精、纤维素和碳酸镁。所述组合物可以采用溶液、悬浮液、片剂、丸剂、胶囊、缓释制剂或粉剂形式,并含有大约1-95%的活性成分。所述免疫原性制剂和疫苗以与剂型匹配的方式施用,并以治疗有效的、预防的和免疫原性的量施用。给药量取决于受治对象,例如,包括个体的免疫系统合成抗体的能力,如果必要的话,产生细胞介导的免疫反应的能力。需要施用的活性成分的精确量取决于医师的判断。不过,合适的剂量范围可由本领域技术人员方便地决定,并且可以是微克级的HMW蛋白。最初的给药方案和加强剂量也是可变的,但可以包括最初的给药,接着是后继给药。其剂量也可以取决于给药途径,并可以随宿主的体型而变化。
本发明免疫原性组合物中活性成份的浓度一般大约为1-95%。仅含有一种病原体抗原性材料的疫苗是单价疫苗。含有几种病原性抗原性材料的疫苗是复合疫苗,这种疫苗也属于本发明。例如,这种复合疫苗含有源于各种病原体或源于同一病原体的各种菌株,或源于各种病原体的组合的材料。
如果所述抗原与佐剂同时施用,其免疫原性可明显提高,通常以用磷酸缓冲的盐溶液配制的0.05-0.1%的溶液形式使用。佐剂可以增强抗原的免疫原性,但其自身不必是免疫原。佐剂可以通过将所述抗原保持在给药部位附近而起作用,以产生局部效应,促进抗原向其免疫系统的细胞缓慢、持续的释放。佐剂还可以吸引免疫系统的细胞至抗原沉积点,并激发这些细胞,以诱发免疫反应。
很多年以来,免疫刺激剂或佐剂一直被用于改善宿主对诸如疫苗的免疫反应。诸如脂多糖的内源性佐剂通常是用作疫苗的灭活或减毒细菌的成分。外源性佐剂是免疫调节剂,这种免疫调节剂通常是非共价地与抗原连接的,并被制备成以增强宿主的免疫反应。因此,已鉴定了可增强对通过肠胃外方式输入的抗原的免疫反应的佐剂。不过,这些佐剂中的一些是毒性的,并能引起不希望的副作用,使其不适用于人和很多动物。事实上,只有氢氧化铝磷酸铝(一般统称为矾)常被用作人和兽用疫苗的佐剂。业已查明矾在加强抗体对白喉和破伤风类毒素的反应方面的效力,并已将HBsAg与矾配佐。尽管矾在某些场合的用途已经确立,但它具有局限性。例如,矾不能有效用于流感接种,并能不连续地诱发细胞介导的免疫反应。在小鼠中,由矾配佐的抗原引起的抗体主要是IgG1同种型,因此,小鼠不适于用某些疫苗制剂保护。
有多种外源性佐剂可引起对抗原的有效的免疫反应。这些佐剂包括与膜蛋白抗原配合的皂苷(免疫刺激复合物)、含有矿物油的Pluronic聚合物、溶于矿物油中的灭活的分枝杆菌、弗氏完全佐剂、细菌制品,如胞壁酰二肽(MDP)和脂多糖(LPS)、以及脂质A和脂质体。
为了有效诱导人体免疫反应(HIR)和细胞介导的免疫反应(CMI),通常将免疫源乳化在佐剂中。很多佐剂是有毒的,可诱发肉芽肿、急性和慢性发炎(弗氏完全佐剂,FCA)、细胞溶解(皂苷和Pluronic聚合物)和致热、关节炎和前眼色素层(LPS和MDP)。虽然FCA是一种良好的佐剂,并被广泛用于研究,但因为其毒性而不允许用于人或兽用疫苗中。
理想佐剂的理想特征包括(1)没有毒性;(2)激起长期免疫反应的能力;(3)生产上的简便性和长期贮存时的稳定性;
(4)如有必要,诱发对通过各种途径施用的抗原的CMI和HIR的能力;(5)与其它佐剂协同作用;(6)选择性地与抗原呈递细胞(APC)群相互作用的能力;(7)专门诱发适当的TH1或TH2细胞特异的免疫反应的能力;和(8)选择性地提高针对抗原的适当的抗体同种型水平(例如,IgA)的能力。
被收为本文的参考文献的美国专利US4,855,283披露了包括N-糖基酰胺、N-糖基脲和N-糖基氨甲酸酯的糖脂类似物,它们各自的糖残基上分别被一个氨基酸所取代,以作为免疫调节剂或佐剂。因此,Lockhoff等(美国专利US4,855,283,参考文献29)报道,N-糖脂类似物与诸如鞘糖脂和糖基甘油脂的天然糖脂具有结构相似性,它能够在单纯疱疹病毒疫苗和假性狂犬病病毒疫苗中诱发强的免疫反应。业已用长链烷基胺和脂肪酸合成了某些糖脂,这些糖脂通过其端基碳原子与糖直接连接,以模拟天然脂质残基的功能。
被收作本文参考的、授予Moloney的美国专利US4,258,028披露,十八基酪氨酸氢氯酸(OTH)在与破伤风类病毒和福尔马林灭活的Ⅰ、Ⅱ和Ⅲ型脊髓灰质炎病毒疫苗配合后起着佐剂的作用。另外,Nixon-George等(参考文献30)报道,与重组乙型肝炎表面抗原配合的芳族氨基酸的十八基酯可加强宿主对乙型肝炎病毒的免疫反应。
合成肽的脂化也被用于提高其免疫性。因此,Wiesmnller于1989年披露了一种与同一种三棕榈基-S-甘油基一半胱氨酰丝氨酰丝氨酸佐剂结合的口蹄疫病毒蛋白具有序列同源性的肽是源于革兰氏阴性细菌的脂蛋白的N-末端部分的合成类似物。另外,Deres等(1989)报导了用合成的脂肽疫苗在体内致敏病毒特异的细胞毒性T淋巴细胞,所述疫苗包括改性的合成肽,该合成肽由流感病毒核蛋白与脂肽、N-棕榈基-S-[2,3-双(棕榈氧基)-(2RS)-丙基-[R]-半胱氨酸(TPC)相连接。
2.免疫测定本发明的流感嗜血菌的高分子量蛋白可以用作免疫原,用于产生抗蛋白抗体,在免疫测定中用作抗原,所述免疫测定包括酶联免疫吸附测定(ELISA)、RIAs和其它非酶联抗体结合测定或本领域公知的用于检测抗体的方法。在ELISA测定中,将所述蛋白固定在选择的表面上,例如,能够结合蛋白的表面上,如聚苯乙烯微量滴定板的孔。在经过洗涤以除去未完全吸附的蛋白之后,诸如牛血清白蛋白(BSA)溶液的非特异蛋白可以结合在特定的表面上,已知所述溶液相对试样而言具有抗原中和作用。这样可以封闭所述固定表面上的非特异吸附位点,并由此减弱由于抗血清与所述表面的非特异结合而引起的本底。
然后让固定表面与诸如临床或生物学材料的样品接触,以能诱导免疫复合物(抗原/抗体)形成的方式检验。其中,可以包括用诸如BSA溶液、牛γ球蛋白(BGG)溶液和/或磷酸缓冲的盐溶液(PBS)/Tween的稀释剂稀释所述样品。然后在诸如大约25-37℃量级的温度下培养所述样品2-4小时。在培养之后,洗涤样品接触的表面,以除去非免疫复合材料。所述洗涤方法可以包括用诸如PBS/Tween或硼酸缓冲液的溶液洗涤。在产生试样与所述结合蛋白的特异免疫复合物并继洗涤之后,可以通过用对第一种抗体有特异性的第二种抗体处理测定免疫复合物生成的发生和生成量。如果试样是人源的,所述第二种抗体是对人免疫球蛋白(通常是IgG)具有特异性的抗体。为了提供测定方法,所述第二抗体可以具有相关的活性,如酶促活性,举例来说,它在与适当的生色底物培养后可以显示一种颜色。然后可以用可见光谱旋光分光计测量所产生的色度实现定量测定。
3.将序列用作杂交探针本发明的核苷酸序列包括编码不可分型的流感嗜血菌的特定菌株的高分子量蛋白的基因序列,目前可以鉴定并克隆源于任何类型的不可分型的嗜血菌属及其它不可分型的流感嗜血菌菌株的基因。
可以利用含有本发明基因的核苷酸序列的与不可分型的嗜血菌属的高分子量蛋白的其它基因的互补片段选择性地形成双链体能力。根据应用场合,可以采用各种杂交条件,以实现探针对所述其它基因的不同程度的选择性。对于高度选择性而言,采用较严格的条件以形成所述双链体,例如低盐和/或高温条件,如在大约50-70℃的温度下由0.02M-0.15M NaCl所提供的条件。对于某些场合而言,要求不太严格的杂交条件,如0.15-0.9M盐和大约20-55℃的温度。通过加入逐渐加大量的甲酰胺也可以使杂交条件变得更加严格,以使所述杂合的双链体去稳定。因此,特定的杂交条件可以方便地操作,而且通常是根据想要的结果进行选择的方法。一般,在有50%的甲酰胺的条件下常见的杂交温度为对于与靶片段的同源性为95-100%的探针来说为42℃,对于同源性为90-95%的探针来说为37℃,而对于同源性为85-90%的探针来说为32℃。
在一种临床诊断实施方案中,可将本发明基因的核酸序列用于与诸如标记的适当装置结合,以检测杂交。有多种本领域已知的合适的指示装置,包括放射性、酶促或其它配体,如能够产生一种检测信号的亲和素/生物素。在某些诊断实施方案中,可以采用诸如脲酶、碱性磷酸酶或过氧化物酶的酶标记物,而不采用放射性标记。在使用酶标记物的情况下,可以使用已知的比色底物,以产生肉眼可见的或通过分光光度法测定的装置,以鉴定与含有编码不可分型的嗜血菌属的高分子量蛋白的基因序列的样品。
本发明的核酸序列可以用作溶液杂交和采用固相方法的实施方案的杂交探针。在涉及固相方法的实施方案中,将获自诸如临床样品的样品的试验DNA(或RNA)吸附或以其它方式固定在选择的基质或表面上,所述临床样品包括渗出液、体液(例如,血清、羊膜液、中耳渗出液、痰、支气管洗出液)或者甚至为组织。然后用选择的探针对所述固定的单链核酸分子进行特异性杂交,所述探针包含本发明基因或其片段的核酸序列。所选择的条件取决于具体环境,所述环境基于所需要的具体参数,这些参数取决于诸如G+C含量、靶核酸的类型、核酸的来源、杂交探针的大小等之类的因素。在对杂交表面进行洗涤以除去非特异结合的探针分子之后,通过所述标记检测特定的杂交,甚至对其定量。与肽的选择一样,优选选择在不可分型的嗜血菌属之间为保守的核酸序列部分。所选择的探针的长度可以至少约为18bp,并可以在大约30bp-大约90bp的范围内。
4.高分子量蛋白基因的表达含有源于与宿主细胞相容的物种的复制子和控制序列的质粒载体可被用于在表达系统中表达编码不可分型的嗜血菌属的高分子量蛋白的基因。所述载体通常含有一个复制位点,以及能在转化的细胞中产生表型选择的标记序列。例如,可以用含有编码氨苄青霉素和四环素抗性的基因的pBR322转化大肠杆菌,并由此提供鉴定转化细胞的简便方法。pBR322质粒或其它微生物质粒或噬菌体必需同样含有或被修饰成含有启动子,该启动子可被宿主细胞用于表达其自身蛋白。
另外,含有与宿主相容的复制子和控制序列的噬菌体载体可以用作该宿主的转化载体。例如,存在于λGEMTM-11中的噬菌体可用于制备重组噬菌体载体,可将该载体用于转化诸如大肠杆菌LE392的宿主细胞。
启动子常被用于重组DNA构建,包括β-内酰胺酶(青霉素酶)和乳糖启动子系统(Chang等,1978:Itakura等,1977;Goeddel等,1979;Goeddel等,1980),以及诸如T7启动子系统的其它微生物启动子(美国专利US4,952,496)。有关启动子的核苷酸序列是已知的,使得本领域技术人员能将其与基因有效地连接在一起。所使用的特定启动子通常根据所期望的结果进行选择。适于表达编码所述高分子量蛋白、片段类似物或其变体的基因的宿主包括大肠杆菌、芽胞杆菌、嗜血菌属、真菌、酵母或采用杆状病毒表达系统。
按照本发明,优选通过重组方法制备所述高分子量蛋白,特别是因为从不可分型的嗜血菌的培养物中纯化的天然高分子量蛋白可以包括微量有毒材料或其它污染物。这一问题可以通过在异源系统中重组生产的蛋白而得以避免,可以减少纯化材料中的污染物的方式从宿主中提取所述蛋白。特别适合于此类表达的宿主包括革兰氏阳性细菌,这种细菌没有LPS,因此没有外毒素。所述宿主包括芽胞杆菌,而且可能特别适用于生产非致热高分子量蛋白、片段或其类似物。而且,重组生产方法可以生产HMW1、HMW2、HMW3或HMW4和源于其它不可分型的流感嗜血菌株的相应的HMW蛋白或其片段,这些蛋白彼此分离并缺乏不可分型的流感嗜血菌的非-HMW蛋白。生物学保存按照布达佩斯条约并在本申请之前,已将本发明所披露并涉及的某些能产生对按照本发明诸方面的流感嗜血菌的高分子量蛋白特异的能产生单克隆抗体的某些杂交瘤交由位于12301 Parklawn Drive,Rockville,Moryland,USA,20852的美国典型培养物保藏中心(ATCC)保存。所保存的杂交瘤样品在以本美国专利申请为基础的专利被授权后即可向公众提供。本文所披露并要求保护的本发明并本局限于所保存的杂交瘤的范围,因为所保存的实施方案只是用于说明本发明的,能产生与本申请披露的类似的或等同的抗体的一切等同的或类似的杂交瘤均属于本发明范围。保存物概览杂交瘤ATCC保存号保存日期AD610C5实施例以上说明对本发明做了一般性说明。通过参考以下的具体实施例可以更全面地理解本发明。这些实施例只是用于说明目的的,并不是要限定本发明的范围。形式的改变和等同物的取代根据环境需要或为了方便。不管本文中使用了特定的术语,但这些术语是用于说明的,而不是用于限定目的。
使用了分子遗传学、蛋白质生物化学和免疫学方法,但在本说明书中不做详细地说明,这些例子广泛披露了科学文献中,并处于本领域技术人员的力所能及的范围内。例1本实施例披露了编码HMW1和NMW2蛋白的DNA提取,所述蛋白的克隆和表达,编码HMW1和HMW2蛋白的DNA分子的测序和序列分析。
从患有急性中耳炎的儿童的中耳液中提取不可分型的流感嗜血菌菌株5和12的纯培养物。制备能提供编码蛋白HMW1和HMW2的基因的来自菌株12的染色体DNA,其做法是制备染色体DNA的Sau3A部分限制消化物,并在蔗糖梯度上分离级分。收集含有长度为9-20kbp的DNA片段的馏分,并通过连接到λEMBL3臂中制备文库。在体外包装连接混合物,并在大肠杆菌LE392的P2溶原菌中进行平板扩增。
为了进行质粒亚克隆研究,将来自一种代表性重组噬菌体中的DNA亚克隆到T7表达质粒pT7-7中,该质粒含有T7RNA聚合酶启动子φ10,核糖体结合位点和位于一个多克隆位点上游的T7基因白蛋白的翻译起始位点(见图5B)。
通过双脱氧法进行DNA序列分析,并对HMW1基因的双链和HMW2基因的单链进行测序。
进行Western免疫印迹分析,以鉴定由活性噬菌体克隆产生的重组蛋白(图11)。直接挑取生长在LE392中的噬菌体裂解液或噬斑,所述裂解液来自生长于YT平板上的LE392细胞丛,在电泳之前将其溶解在凝胶电泳样品缓冲液中。在7.5%或11%聚丙烯酰胺改性的Laemli凝胶上进行十二烷基硫酸钠聚丙烯酰胺凝胶电泳(SDS-PAGE)。将所述蛋白转移到硝酸纤维素片上,然后依次用含有抗所述高分子量蛋白的高滴度抗体的大肠杆菌吸附的人血清样品检测所述硝酸纤维素片,再用碱性磷酸酶缀合的山羊抗人免疫球蛋白G(IgG)第二抗体检测。来自健康成体的血清含有抗不可分型的流感嗜血菌的表面外露的高分子量蛋白的高滴度抗体。在由LE392细胞进行充分吸附之后,将上述血清之一用作筛选抗血清。
为了鉴定用重组质粒转化的大肠杆菌产生的重组蛋白,将感兴趣的质粒用于转化大肠杆菌BL21(DE3)/pLysS。在含有浓度为50μg氨苄青霉素/ml的L培养液中将转化的菌株生长至A600为0.5。然后加入IPTG至1mM。1小时后收集细胞,并制备细胞的超声处理物。通过双辛可宁酸方法测定所述样品的蛋白质浓度。将含有100μg总蛋白的细胞超声处理物溶于电泳样品缓冲液中,进行SDS-聚丙烯酰胺凝胶电泳,并转移到硝酸纤维素上。然后依次用大肠杆菌吸附的成体血清样品、再用碱性磷酸酶缀合的山羊抗人IgG第二抗体检查。
同样进行Western免疫印迹分析,以测定同源和异源不可分型的流感嗜血菌菌株表达的在抗原学上与由克隆的HMW1基因编码的蛋白(γHMW1)相关的高分子量蛋白。将细菌细胞的细胞处理物溶于电泳样品缓冲液中,并转移到硝酸纤维素上。依次用多克隆兔γHMW1抗血清和碱性磷酸酶缀合的山羊抗兔IgG第二抗体进行检测。
最后,进行Western免疫印迹分析,以测定不可分型的嗜血菌属菌株是否表达在抗原学上与百日咳博德特氏菌的丝状血凝素相关的蛋白。将能识别丝状血凝素的单克隆抗体X3C(一种鼠免疫球蛋白G(IgG)抗体)用于通过Western印迹检测细胞超声处理物。将一种碱性磷酸酶缀合的山羊抗小鼠IgG第二抗体用于检测。
为了制备重组蛋白抗血清,用pHMW1-4转化大肠杆菌,并按上述方法用IPTG诱导重组蛋白的表达。制备细菌细胞的细胞超声处理物,并通过在10,000×g下离心30分钟,将其分离成上清液和沉淀馏分。用所述沉淀馏分分离所述重组蛋白。用来自所述沉淀馏分的1mg蛋白对一只兔进行行为期两周的皮下接种,第一剂用弗氏完全佐剂给药,随后剂用弗氏不完全佐剂给药。在做过第4次注射之后将所述兔子放血。在用于Western印迹分析之前,用仅由克隆载体转化的宿主大肠杆菌菌株的超声处理物充分吸附所述抗血清。
为了评价HMW1和丝状血凝素之间的抗原决定子的共有性,在室温下以每孔60μl的量用溶于Dulbecco′s磷酸缓冲的盐溶液涂覆酶联免疫吸附测定(ELISA)平板(Costar,Cambridge,Mass.)2小时。在加入血清稀释液之前,用溶于Dulbecco′s磷酸缓冲的盐溶液中的10/4牛血清白蛋白封闭所述孔1小时。在用Dulbecco′s磷酸缓冲的盐溶液配制的0.1%Brij(Sigma,St.Louis,Mo.)中连续稀释γHMW1抗血清。洗涤,然后在室温下将该平板与过氧化物酶缀合的山羊抗兔IgG抗体(Bio-Rad)一起培养2小时,再在含有0.03%H2O2的0.1M柠檬酸钠缓冲液(pH 4.2)中与浓度为0.54mg/ml的2,2′-叠氮-双(3-乙基苄噻唑啉-6-磺酸)(Sigma)一起展开。在一台自动ELISA读数仪上读取吸收值。
以如下方法记录表达HMW1或HMW2的重组噬菌体。用含有高滴度的抗所述高分子量蛋白的抗体的大肠杆菌吸附的人血清样品筛选所述不可分型的流感嗜血菌菌株12基因组文库的表达高分子量蛋白的克隆。
随更弱的反应克隆一起鉴定了若干强的反应克隆。对20个强反应克隆进行噬斑纯化,并通过Western印迹检查重组蛋白的表达。所述每一个强的反应克隆表达被称为HMW1和HMW2的两种类型的高分子量蛋白中的一种。在所述HMW1和HMW2裂解液中的主要免疫活性蛋白带分别以125和120kDa的表观分子量移动。除了所述主带外,每种裂解液还含有较高分子量的次要蛋白带。在HMW2裂解液中观察到的分子量低于120kDa的蛋白带可以不规则地观察到,并推测其为蛋白水解的降解产物。在用相同的血清样品进行免疫学筛选时,仅用λEMBL3克隆载体感染的LE392裂解液是无反应的。因此,所观察到的活性不是由于交叉反应性大肠杆菌蛋白或λEMBL3-编码的蛋白。而且,所述重组蛋白不是简单地、非特异地结合免疫球蛋白,因为所述蛋白不与山羊抗人IgG缀合物单独反应、不与正常兔血清或来自若干健康婴幼儿的血清反应。
对表达HMW1或HMW2重组蛋白的典型克隆作进一步鉴定。两种类型噬菌体的限制图彼此不同,包括编码HMW1和HMW2结构基因的区域。图5A表示含有HMW1或HMW2结构基因的典型重组噬菌体的限制图。结构基因的位置用画影线的柱表示。
用T7表达质粒T7-7构建HMW1质粒亚克隆(图5A和5B)。同样构建HMW2质粒亚克隆,而后一种亚克隆的结果类似于在HMW1结构上观察到的结果。
HMW1结构基因的大致位置和转录方向最初是用质粒pHMW1(图5A)测定的。该质粒是通过将来自λHMW1的8.5kbBamHⅠ-SalⅠ片段插入BamHⅠ和SalⅠ裂解的pT7-7中而建成的。用能表达一种表观分子量为115kDa的免疫活性重组蛋白的pHMW1转化的大肠杆菌,可以用IPTG进行有效诱导。所述蛋白显著小于由其亲代噬菌体表达的125kDa的主要蛋白,表明其要么是以融合蛋白形式表达,要么在其羧基末端截短。
为了更精确地定位所述基因的3′末端,通过从pHMW1结构的3′末端逐渐缺失构建其它质粒。以如下方式构建质粒pHMW-1用PstⅠ消化pHMW1,分离所得到的8.8kb片段,并进行再连接。质粒pHMW1-2是这样构建的用HindⅢ消化pHMW1,分离所得到的7.5kb片段,并进行再连接。用质粒pHMW1并pHMW1-2转化的大肠杆菌也能表达一种表观分子量为115kDa的免疫活性重组蛋白。上述结果表明,所述结构基因的3′末端是HindⅢ位点的5′末端。图12表示在用IPTG显示之前和之后(分别为泳道3和4)由pHMW1-2转化的细胞的Western印迹结果。115kDa的重组蛋白用箭头指示。转化体也证实了较低表观分子量的交叉反应带,有可能代表部分降解产物。示出了比较结果和仅用pT7-7克隆载体转化的大肠杆菌的结果(图12,1和2泳道)。
为了更准确地定位所述基因的5′末端,构建了pHMW1-4和pHMW1-7质粒。质粒pHMW1-4是通过将来自λHMW1的5.1kbBamHⅠ-HindⅢ片段克隆到含有上游3.8kbEcoRⅠ-BamHⅠ片段的pT7-7衍生片段中而构建的。用pHMW1-4转化的大肠杆菌能表达一种表观分子量大约为160kDa的免疫活性蛋白(图12,泳道6)。尽管蛋白产量可由IPTG诱导,但这种转化体中的蛋白产量明显低于上述pHMW1-2转化体的蛋白产量。用NdeⅠ和SpeⅠ消化pHMW1-4,以构建质粒pHMW1-7。分离由上述双消化产生的9.0kb片段,补平末端,并再连接。用pHMW1-7转化的大肠杆菌也能表达一种表观分子量为160kDa的免疫活性蛋白,该蛋白的大小与由pHMW1-4转化体表达的蛋白相同。上述结果表明,HMW1结构基因的起始密码子是SpeⅠ位点的3′末端。DNA序列分析(如上所述)证实了这一结论。
如上所述,所述λHMW1噬菌体克隆表达一种125kDa的主要免疫活性带,而据信其含有全长基因的HMW1质粒克隆pHMW1-4,pHMW1-7能表达一种大致为160kDa的免疫活性蛋白。这种大小上的差异是令人困惑的。一种可能的解释是,在亚克隆的过程中丢失了正确加工HMW1基因产物所需要的另一个或几个基因。为了证实这种可能性,构建于质粒pHMW1-14。该结构是通过用NdeⅠ知MluⅠ消化pHMW1并插入以pHMW1-4分离到的7.6kbp的NdeⅠ-MluⅠ片段而产生的。这种结构可以含有全长HMW1基因以及存在于原始HMW1噬菌体中的HMW1基因的DNA3′末端。由该质粒转化的大肠杆菌可以表达表观分子量为125和160kDa的主要免疫活性蛋白,以及其它降解产物(图12,泳道7和8)。所述125和160kDa的带与在HMW1噬菌体裂解液中检测到的主要和次要免疫活性带相同。有趣的是,在非诱导条件下,pHMW1-14结构也能表达大量的蛋白,这种现象在以前的结构中未出现过。
125kDa和160kDa蛋白之间的关系仍然有一些不清楚。下面披露的序列分析揭示,HMW1基因预计编码一种159kDa的蛋白。据信160kDa蛋白是成熟的125kDa蛋白的前体形式,一种蛋白向另一种蛋白的转化取决了两个下游基因的产物。
对HMW1基因的序列分析(图1)揭示了一个4,608bp的开放读框(ORF),该开放读框始于位于第351位核苷酸的一个ATG密码子,止于位于第4959位核苷酸的一个TAG终止密码子。序列AGGAG的一个推定核糖体结合位点始于所述推定起始密码子上游10bp处。在所述ORF起初的250bp中存在5个其它的框内ATG密码子,但这些密码子无一以常见的核糖体结合位点为前导。所述ORF的5′-旁侧区含有一系列同向串联重复序列,以7bp的序列ATCTTC重复16次。这些串联重复序列止于所述推定起始密码子5′末端的100bp处。一个8bp的反向重复序列以存在一个依赖于ρ的转录终止子为特征,该终止子始于第4983位核苷酸,位于推测转录终止序列3′末端的25bp处。在三个开放读框的ORF的上游和下游存在多个终止密码子。由HMW1基因编码的蛋白的衍生氨基酸序列(图2)的分子量为159,000,能很好地吻合由HMW1-4和HMW1-7转化体表达的蛋白的表观分子量。该衍生氨基酸序列的氨基末端未表现典型的信号序列特征。用于制备pHMW1的BamHⅠ位点包括该核苷酸序列的第1743-1748号bp。预计所述BamHⅠ位点下游的ORF编码一种111kDa的蛋白,与预测的由pHMW1编码的115kDa的表观分子量十分吻合。
HMW2基因序列(图3)由一个4,431bp的ORF组成,始于核苷酸352的一个ATG密码子,止于4783位核苷酸的TAG终止密码子。HMW2基因的ORF的前1,259bp与HMW1基因的相同。随后其序列开始趋异,但总体上的相同性为80%。其例外是在HMW2序列的第93位核苷酸处有一个碱基的插入,HMW1和HMW2基因的5′旁侧区从其相应的起始密码子上游的310bp是相同的。因此,HMW2基因是以同一组串联重复为前导,并有相同的推定核糖体结合位点位于HMW1基因的5′末端。注意到一个推定的转录终止子与HMW1 ORF的3′末端相同,它始于4804位核苷酸。以上两个基因在长度上的差异主要是由HMW2序列中的一个186bp的间隙造成的,该间隙始于3839位核苷酸。由HMW2基因编码的蛋白的衍生氨基酸序列(图4)的表观分子量为155,000,而且与HMW1基因的衍生氨基酸序列的相同性为71%。
HMW1和HMW2基因的衍生氨基酸序列(图2和4)与百日咳博德特氏菌的丝状血凝素的衍生氨基酸序列具有序列相似性,所述丝状血凝素是该生物的一种表面相关蛋白。HMW1-丝状血凝素序列比较的起始和优化TFASTA等级分别为87和186,字长为2。用于比较的Z等级为45.8。HMW2-丝状血凝素序列比较的起始和优化TFASTA等级分别为68和196。后一比较的Z等级为48.7。所述起始和优化TFASTA等级的幅度和Z等级表明在HMW1和HMW2基因产物和丝状血凝素之间存在明显的相关性。在对HMW1、HMW2和丝状血凝素基因的衍生氨基酸序列进行排列比较时,在3种序列的氨基末端的相似性最明显。在预测的肽序列中的前22个氨基酸的12个是相同的。另外,所述序列中证实了一个共同的5氨基酸片段Asn-Pro-Asn-Gly-Ile,和在其前200个氨基酸中的几个较短的相同的序列。例2该例披露了丝状血凝素与HMW1蛋白之间的关系。
为了进一步查明所述HMW1-丝状血凝素关系,测定了用HMW1-4重组蛋白(γHMW1)制备的抗血清识别纯化的丝状血凝素的能力(图13)。由γHMW1抗血清验证的和丝状血凝素的ELISA反应性呈剂量决定形式。在该测定中,预免疫的兔血清具有最低的反应性。在Western印迹测定中也检验了γHMW抗血清,并在该系统中同样证实了与纯化的丝状血凝素的弱的、但是阳性的反应性。
为了鉴定相当于HMW1基因产物的天然嗜血菌属蛋白,并测定在抗原学上与HMW1克隆基因产物相关的蛋白在其它不可分型的流感嗜血菌菌株中的普遍程度,通过Western印迹用γHMW1抗血清对一组嗜血菌属菌株进行筛选。所述抗血清可以识别同源菌株12中的125和120kDa的蛋白带(图14)。所述蛋白带分别为HMW1和HMW2基因的推定成熟蛋白产物。在图14中,120kDa的蛋白带表现为一条带,其中,它在HMW2噬菌体裂解液中呈现为双带(图11)。
当用于筛选异源不可分型的流感嗜血菌菌株时,γHMW1抗血清能识别125个流行病学上不相关的菌株中75%的高分子量蛋白。一般,所述抗血清能与每种异源菌株的100-150kDa范围内的一或两条蛋白带反应,反应方式类似,但不同于在同源菌株中所观察到的(图14)。
单克隆抗体X3C是抗百日咳博德特氏菌的丝状血凝素蛋白的鼠IgG抗体。这种抗体能抑制百日咳博德特氏菌细胞与培养中的中国仓鼠卵细胞和Hela细胞的结合,并能抑制由纯化的丝状血凝素引起的红细胞的血凝作用。进行Western印迹分析,其中,用该单克隆抗体筛选上述用一组不可分型的流感嗜血菌(图14)。单克隆抗体X3C能识别不可分型的流感嗜血菌菌株12的高分子量蛋白,该蛋白能识别所述重组蛋白抗血清(图15)。另外,所述单克隆抗体能识别异源不可分型的流感嗜血菌菌株小组中的蛋白带,这些带与由重组蛋白抗血清识别的带相同,通过比较图14和15可以看出这一点。所述丝状血凝素单克隆抗体偶尔也会仅识别能由所述重组蛋白抗血清识别的两条带中的一条(例如,与图14和15中的菌株泳道18比较)。总体上看,单克隆抗体X3C所能识别的高分子量蛋白带与由γHMW1抗血清识别的蛋白带相同,所述抗血清占我们所收集的不可分型的流感嗜血菌菌株的35%。例3该实施例披露了HMW1和HMW2蛋白的粘附素特性。
构建HMW1、HMW2或这两种蛋白的表达缺陷型,以检验所述蛋白在细菌粘附中的作用。采用以下方法。用BamHⅠ消化pHMW1-14(参见例1,图5A),然后连接于从pUC4K中分离的1.3kbBamHⅠ片段的卡那霉素盒上。通过用XbaⅠ消化使所得到的质粒(pHMW1-17)线性化,并转入不可分型的流感嗜血菌菌株12中,随后筛选卡那霉素抗性菌落。对一系列此类菌落所做的Southern分析证实了两个转化体群,其中之一在HMW1结构基因中有一个插入,而另一个在HMW2结构基因中有一个插入。从上述两种类型的每一个中选择一个突变体做进一步分析。
用以下方法回收两种蛋白的表达缺陷突变型。缺失位于两个EcoRⅠ位点之间的2.1kb的DNA片段,然后将所述源于pUC4K的卡那霉素盒以1.3kbEcoRⅠ片段形式插入,所述2.1kb的DNA片段跨接HMW1结构基因的3′-部分和pHMW-15上的编码一种辅助加工蛋白的一个下游基因的5′-部分。通过用XbaⅠ消化将所得到的质粒(pHMW1-16)线性化,并将其转入菌株12中,然后再次选择卡那霉素抗性菌落。对上述菌落的典型样品所做的Southern分析表明,8例中有7例是同时插入HMW1和HMW2基因座。选择一个这样的突变型做进一步分析。
为了证实想要的表型,用抗重组HMW1蛋白的多克隆抗血清做Western印迹分析检验所述突变型菌株。其亲代菌株能表达125-kDHMW1和120kDHMW2蛋白(图16)。相反,HMW2-突变型不能表达120kD蛋白,而HMW1突变型不能表达125kD蛋白。而双突变型不能表达两种蛋白中的任一种。基于全细胞裂解液、外膜特性、和菌落形态学,其野生型菌株和突变型是彼此相同的。透射电镜检查证实了4种菌株中无一表达菌毛。
对野生型菌株12粘附Chang上皮细胞的能力进行了检验。在该试验中,将细菌接种到培养液中,并让其生长至密度大约为2×109cfu/ml。将大约2×107cfu接种到上皮细胞单层上,并以165×g对平板进行5分钟的轻微离心,以利于细菌与上皮表面的接触。在37℃下,在5%CO2中培养30分钟,然后用PBS漂洗单层5次,以除去未粘附的生物,并用溶于PBS中的胰蛋白酶-EDTA(0.05%胰蛋白酶,0.5%EDTA)处理,以将其从塑料支持物上释出。搅动孔的内含物,并将稀释液铺平板于固定培养基上,以产生每一单层的粘附细菌数。用每一单层的粘附cfu数除以接种的cfu数,计算出百分粘附性。
如下面的表1所示(表格在本说明书的最后示出),该菌株能相当有效地粘附,有将近90%的接种物结合于所述单层上。能表达HMW1但不能表达HMW2(HMW2-)的突变型也能相当有效地粘附,并且与野生型菌株的粘附性相当。相反,能表达HMW2,但不能表达HMW1(HMW1-)的菌株的结合力相对野生型下降15倍。双突变型(HMW1-/HMW2-)的粘附性还要进一步降低,大约比野生型低50倍,而比HMW1突变型低3倍。总起来看,上述结果表明,HMW1蛋白和HMW2蛋白可干扰与Chang上皮细胞的结合。有趣的是,与该细胞系的最佳结合似乎需要HMW1,但不是HMW2。例4该实施例说明了HMW3和HMW4蛋白的制备和表达,及其作为粘附素的作用。
使用质粒pHMW1-16和pHMW1-17(见例3),并按照类似于例3中所披露的用于菌株12的方法分离3种不可分型的嗜血菌株5突变性,其中的一个为卡那霉素基因插入hmw1一样基因座中(称之为hmw3),第二个为插入hmw2一样基因座中(称之为hmw4),第三个为同时插入以上两个基因座中。正如所预计的,Western免疫印迹分析证实了卡那霉素盒插入hmw1一样基因座中的突变型丧失了表达HMW3125-kD蛋白的能力,而在hmw2一样基因座中有插入的突变型不能表达HMW4123-kD蛋白。具有双重插入的突变型不能表达所述高分子量蛋白中的任一种。
如下面的表1所示,野生型菌株5表现出高水平的粘附性,每一单层有接近80%的接种物粘附。不能表达HMW2-样蛋白(即HMW4蛋白)的突变型的粘附性也很高。相反,不能表达HMW1-样蛋白(即HMW3蛋白)的突变型的粘附性比野生型降低大约5倍,而双突变型的结合力下降的更多(大约为25倍)。对吉姆萨染色的样品进行检查证实了以上观察(未示出)。因此,有关菌株5的蛋白HMW3和HMW4的结果与在菌株12上关于HMW1和HMW2蛋白的发现吻合。例5该实施例包括有关HMW1和HMW2蛋白的粘附素特性的其它资料。
为了HMW1和HMW2蛋白的粘附功能,并检验其它流感嗜血菌表面结构的HMW1和HMW2的独立的作物,分别用质粒pHMW1-14和pHMW2-21将hmw1和hmw2基因簇导入大肠杆菌DH5α中。作为对照,将克隆载体pT7-7同样转入大肠杆菌DH5α中。Western印迹分析表明,大肠杆菌DH5α含有表达一种125kDa蛋白的hmw1基因,而获得了hmw2基因的同一种菌株表达一种120kDa的蛋白。含有pT7-7的大肠杆菌DH5α不能与抗重组HMW1的抗血清反应。透射电镜检查在所有大肠杆菌菌株中均未发现菌毛或其它表面附着物。
对所述大肠杆菌菌株的粘附性进行定量,并与野生型不可分型的流感嗜血菌菌株12的粘附性进行比较。如下面的表2所示,仅含有载体的大肠杆菌DH5α的粘附性不足菌株12的10%。相反,具有hmw1基因簇的大肠杆菌DH5α的粘附性水平与菌株12的相当。能含有hmw2基因的大肠杆菌DH5α的粘附性大约比菌株12的结合力低6倍,但比仅有pT7-7的大肠杆菌DH5α的粘附性高20倍。上述结果表明,HMW1和HMW2蛋白可单独地介导与Chang结膜细胞结合。上述结果与在例3和4中报道的流感嗜血菌突变型的结果一致,还提供了进一步的证据,即对于Chang上皮细胞而言,HMW1是比HMW2更有效的粘附素。
用获得了pT7-7,pHMW1-14或pHMW2-21的大肠杆菌进行的实验证实了用DH5α衍生物获得的结果(见表2)。例6该实例说明了HMW1和HMW2蛋白从野生型不可分型的流感嗜血菌株中的共纯化。
按以下方法从不可分型的流感嗜血菌菌株中分离并纯化HMW1和HMW2。将来自冰冻母培养物的不可分型的嗜血菌属细菌划线到巧克力平板上,并在37℃下在含有5%CO2的培养箱中生长过夜。将巧克力平板上的生长物接种到补充了氯高铁血红素和NAD各10μg/ml的脑心浸液(BHI)的50ml起始培养物中。让所述起始培养物生长至光密度(O.D.-600nm)达0.6-0.8,然后将所述起始培养物中的细菌用于接种6个补充有BHI的500ml烧瓶,每瓶使用8-10ml。让细菌在500ml的烧瓶中再生长5-6小时,此时O.D.为1.5或更大。将培养物在10,000rpm下离心10分钟。
将细菌沉淀重新悬浮在含有0.5M NaCl、0.01M Na2EDTA、0.01M Tris、50μM1,10二氮杂菲,pH7.5的250ml萃取液中。不对所述细胞进行超声波处理或以其它方式破坏。将重新悬浮的细胞放在冰上,在0℃下放置60分钟。在4℃下以10,000rpm将重新悬浮的细胞离心10分钟,以除去大部分完整细胞和细胞碎片。收集上清液并在4℃下以100,000×g离心60分钟。再次收集上清液,并在4℃下用0.01M磷酸钠(pH 6.0)透析过夜。
在4℃下以10,000rpm离心所述样品10分钟,以除去在透析期间从溶液中预沉淀的不溶性碎片。将上清液加入10ml CM Sepharose柱中,该柱用0.01M磷酸钠(pH6)预平衡过。在加入该柱后,用0.01M磷酸钠洗涤该柱。用由0.01M磷酸钠配制的0-0.5M KCl梯度从所述柱上洗脱蛋白,并收集馏分用于凝胶检查。对于柱馏分进行考马斯胶凝,以确定含有高分子量蛋白的馏分。收集含有高分子量蛋白的馏分,并在制备中浓缩至1-3ml体积,以便加样至凝胶过滤柱中。
用磷酸缓冲的盐溶液平衡Sepharose CL-4B凝胶过滤柱。将浓缩的高分子量蛋白样品加至所述凝胶过滤柱中,并收集柱馏分。对所述柱馏分进行考马斯胶凝,以鉴定含有高分子量蛋白的馏分。收集含有高分子量蛋白的柱馏分。例7该实施例说明了特定HMW1和HMW2蛋白在免疫研究中的应用。
对按例6方法制备的共纯化HMW1和HMW2蛋白进行试验,以确定其是否能预防由同源菌株导致的中耳炎。
每隔3个月给1-2年龄、体重为350-500g的健康成体灰鼠皮下注射40μg溶于弗氏佐剂中的HMW1-HMW2蛋白混合物。给对照动物使用用弗氏佐剂配制的磷酸缓冲的盐溶液。在最后一次注射1个月之后,通过大泡内(intrabullar)接种300cfu的NTHI菌株12对所述动物进行刺激。
在5只对照动物中有5只出现了中耳感染,而在10只免疫的动物中有5只动物出现了感染。尽管在该实验中10只灰鼠里只有5只得到保护,但试验条件十分严格,要求将细菌直接注射到中耳间隙中,并在一个小的脓肿腔中增殖。由下面的进一步资料可以看出,可以实现对灰鼠的全面保护。
5只用HMW1/HMW2免疫的动物不会出现中耳炎,在通过耳镜检查进行检查时未出现中耳发炎的迹象,也没有出现可检测的中耳渗出液。
在5只被感染的HMW1/HMW2免疫的动物中,中耳感染的总的持续以培养阳性中耳液的持续性计与对照并无不同。不过,鼓膜的发炎程度主观上低于在HMW1/HMW2免疫的动物中的程度。当对从受感染的动物获得的中耳液样品进行定量细菌计数时,在HMW1/HMW2免疫的动物和PBS免疫的动物之间存在显著差异(图17)。在图17中示出了刺激7天之后来自动物的中耳液细菌数,该时间点与中耳液中的最大菌落数相关。为了进行统计比较,对所述数据进行对数转换。获自对照动物的数据示于左边,而获自高分子量蛋白免疫的动物的数据示于右边。两条水平线表示每一组中仅为受感染的动物的中耳液菌落数的相应的平均值和标准误。从该图可以看出,由HMW1/HMW2免疫的动物与PBS免疫的对照相比,具有明显较低的中耳液细菌数,几何平均值分别为7.4×106和1.3×105(p=0.02,Students′t-测试)。
在免疫之后,未感染和感染动物体内的血清抗体滴度相当。不过,免疫动物中的感染均与细菌导致的HMW蛋白表达的下调相关,这表明细菌选择与免疫压力相关。
尽管上述资料表明,在免疫之后的预防作用并不完全,这些资料表明了HMW粘附素蛋白是潜在的保护性抗原,该抗原可以构成一种多组分NTHI疫苗的组分之一。
另外,如下面的表3所示,在进行低剂量刺激时,在灰鼠模型中实现了完全保护。
在有矾的情况下,在第1、28和42天用20μg按例6所述方法制备的HMW1-HMW2混合物对5只一组的动物进行免疫。在第53天采集血样,以监测抗体反应。第56天,用大约10 cfu的流感嗜血菌菌株12攻击所述动物的左耳。在第4天检查耳部感染。第3组的4只动物预先用流感嗜血菌菌株12感染,并在第二次刺激之前彻底回收至少一个月。例8该实施例说明了提供仅相当于HMW1蛋白的一部分的合成肽。
有多种合成肽源于HMW1。然后产生抗上述肽的抗血清。已证实针对HMW1-P5的抗肽抗血清能识别HMW1。肽HMW1-P5覆盖HMW1的1453-1481位氨基酸,其序列为VDEVIEAKRILEKVKDLSDEEREALAKLG(序列11),相当于图10中的第1498-1576位碱基。
这一发现表明,所述DNA序列以及衍生的蛋白是以正确读框翻译的,而且所产生的源于所述序列的肽是免疫原性的。例9该实施例披露了针对不可分型的流感嗜血菌的高分子量蛋白的单克隆抗体的制备。
用标准方法制备单克隆抗体。简言之,通过腹膜内注射按例6所述方法从不可分型的嗜血菌属菌株5或12中纯化的高分子量蛋白对雌性BALB/C小鼠(4-6周龄)进行免疫。第一次注射的40-50μg蛋白是用弗氏完全佐剂给药的,第二剂是在第一次给药之后4-5周给药,是用磷酸缓冲的盐溶液给药。在第二次注射3天之后宰杀所述小鼠,并将脾淋巴细胞与SP2/0-Ag14浆细胞瘤细胞融合。
在融合2周之后,通过斑点印迹分析筛选高分子量蛋白特异性抗体的存在。通过浸泡20分钟的方法,将溶于TRIS-缓冲的盐溶液(TBS)中的浓度为10μg/ml的纯化高分子量蛋白用于敏化硝酸纤维素片(BioRad实验室,Richmond,CA)。在用TBS-3%明胶进行的封闭步骤之后,在室温下将所述硝酸纤维素与每一种杂交瘤上清液一起培养60分钟,所述上清液以1∶5的比例用TBS-0.1%Tween稀释,培养是用96孔Bio-Dot微量过滤装置(Bio-Rad)完成的。在洗涤之后,将所述硝酸纤维素片与碱性磷酸酶缀合的、亲和分离的山羊抗(小鼠IgG+IgM)抗体(Tago,Inc.,Burlingame,CA)一起培养1小时。再次洗涤,然后通过在含有氮蓝四唑(0.1mg/ml)和5-溴-4-氯-3-吲哚磷酸(BCIP)(0.05mg/ml)的碱性磷酸酶缓冲液(0.10M TRIS,0.10M NaCl,0.005M MgCl2)中培养所述硝酸纤维素片鉴定阳性上清液。
为了进行下述抗体同种型分型和免疫电镜研究,从杂交瘤上清液中纯化所述单克隆抗体。在该操作中所回收的抗体均为IgG型。为了纯化单克隆抗体,首先对所述杂交瘤上清液进行硫酸铵沉淀处理(终浓度50%,在0℃下进行)。培养过夜,然后通过离心回收所述沉淀,并重新溶于磷酸缓冲的盐溶液中。然后用0.01M磷酸钠缓冲液,pH6.0透析所述溶液过夜。次日将该样品加至用相同的磷酸缓冲液预平衡的DEAE-Sephacel柱中,随后用KCl梯度液洗脱蛋白。通过在考马斯凝胶上检查典型的轻、重蛋白链鉴定含有所述单克隆抗体的柱馏分。
用Ouchtelony法通过免疫扩散确定每一种单克隆抗体的同种型。用10ml由磷酸缓冲的盐溶液配制的1%DNA级琼脂糖(FMC Bioproducts,Rockland,ME)在玻璃片上制备免疫扩散平板。在琼脂糖固化之后,以环状形式在所述琼脂糖上打5mm的孔。对含有浓缩的单克隆抗体制剂的中央孔进行评价,而周围的孔含有山羊抗小鼠亚型特异抗体(Tago)。将所述平板放在湿润箱中在4℃下培养48小时,然后检查免疫沉淀的白色线。
通过Western印迹分析检查在上述斑点印迹分析中有反应的杂交瘤上清液,以证实与所述同源不可分型的嗜血菌属菌株的高分子量蛋白的反应性,并检查与异源菌株的类似蛋白的交叉反应性。将含有100μg总蛋白的不可分型的流感嗜血菌细胞的超声处理物溶于电泳样品缓冲液中,在7.5%丙烯酰胺凝胶上进行SDS-聚丙烯酰胺凝胶电泳,并用Genie电泳印迹装置(Idea Scieatific公司,Corvallis,OR)转移到硝酸纤维素上,转移是在24V电压下用45分钟完成的。转移之后,封闭所述硝酸纤维素片,然后依次用所述杂交瘤上清液、碱性磷酸酶缀合的山羊抗(小鼠IgG+IgM)第二抗体进行检测,最后通过与氮蓝四唑/BCIP溶液一起培养检测结合的抗体。用同一种分析方法检验所述单克隆抗体与在大肠杆菌中表达的重组融合蛋白的反应性(见下文)。
在预备免疫电镜检查时,让细菌在补充过的巧克力琼脂上生长过夜,并将几个菌落悬浮在含有1%白蛋白的磷酸缓冲的盐溶液中。然后将20μl一滴的该细菌悬浮液加至碳包衣的载网上,并培养2分钟。除去多余的流体,再将该样品与待分析的所述纯化的高分子量蛋白特异性单克隆抗体一起培养5分钟。除去多余的液体,并用磷酸缓冲的盐溶液洗涤,然后与同10-nm胶态金粒子缀合的抗小鼠IgG一起培养该样品。用磷酸缓冲的盐溶液进行最后的洗涤,然后用蒸馏水对该样品进行漂洗。用0.5%的乙酸双氧铀对细菌细胞进行染色。然后在一台Phillips201C电子显微镜上检查所述样品。
回收产生能在免疫印迹筛选分析中与不可分型的嗜血菌属菌株12的纯化HMW1和HMW2蛋白反应的单克隆抗体的14种不同的杂交瘤。如下文所述,在通过免疫电镜法筛选的上述单克隆抗体中,有两种被证实能结合原型菌株12的表面表位。这两种单克隆抗体被命名为AD6(ATCC___)和10C5(ATCC___),它们均为IgG1亚型。例10该实施例披露了不可分型的流感嗜血菌的高分子量蛋白的表面外露的B-细胞表位的鉴定。
为了对由所述单克隆抗体识别的表位作图,检查其与一组由pGEMEX重组质粒表达的重组融合蛋白的反应性。上述质粒是通过将hmw1a或hmw2A结构基因的各种片段克隆到T7表达载体pGEMEX-1和GEMEX-2(Promega公司,Madison,WI)中而构建成的。在图18和19中示出了表示被克隆到pGEMEX表达质粒上的源于hmw1和hmw2基因簇的片段的示意图。这些片段是这样插入的,以便在每一个接合位点产生符合该框的融合。这样,上述质粒编码重组融合蛋白,这些蛋白含有由画斜线的柱体表示的区域的pGEMEX-编码的T7基因10氨基酸和由这些附图中的黑色柱表示的区域的hmw1a或hmw2A编码的氨基酸。在每一个柱体的黑色和白色片段的接合处存在一个终止密码子。
选择hmw1A结构基因中的4个分立的位点作为hmw1插入片段的5′末端。对于每一个5′末端,通过利用常见的下游限制位点产生一系列渐小的插入片段。图18中所示的第一个重组质粒是这样构建的从pHMW1-14(例1,图5A)中提取一个含有完整的hmw1基因簇的4.9kbpBamHⅠ-HindⅢ片段,并将其插入BamHⅠ-HindⅢ消化的pGEMEX-1中。这一组里的第二个重组质粒是这样构建的用BstEⅡ-HindⅢ消化“亲代”质粒,回收6.8kbp的较大片段,用Klenow DNA聚合酶补平末端,并进行再连接。这一组里的第三个重组质粒是这样构建的用ClaⅠ-HindⅢ消化“亲代”质粒,回收较大的6.0kbp片段,补平末端,并进行再连接。下一组的4个hmw1重组质粒源于一个“亲代”质粒,该质粒是通过将一个来自hmw1基因的2.2kbp的EcoRⅠ片段连接到EcoRⅠ-消化的pGEMEX-2中而构建的。这一组里的其余3个重组质粒是用类似于上文所述技术分别消化下游的BstEⅡ、EcoRⅤ和ClaⅠ位点而构建的。所示的第3组的3个重组质粒源于一个“亲代”质粒,该质粒是这样构建的用BamHⅠ和ClaⅠ对上述第一个重组质粒(即含有4.9kbp的BamHⅠ-HindⅢ片段的质粒)进行双消化,补平末端,并进行再连接。这样可产生一种编码一种重组蛋白的结构,在其hmw1A基因的ClaⅠ位点上有一个符合读框的融合。第三组里的其余两个质粒是分别通过消化下游的BstⅡ和EcoRⅤ位点而构建的。最后,第四组的两个重组质粒源于一种“亲代”质粒,该质粒是这样构建的用HincⅡ和EcoRⅤ消化原始BamHⅠ-HindⅢ结构,然后进行再连接。这会产生一种编码一种重组蛋白的结构,在其hmw1A基因的EcoRⅤ位点上有一个符合读框的融合。第四组的其余质粒是通过消化下游BstEⅡ位点而建成的。
选择具有hmw2A结构基因的三个分立的位点作为hmw2A插入片段的5′末端。图19中所示的第一个重组质粒是这样构建的从pHMW2-21中提取一个含有完整的hmw2基因簇的6.0kbpEcQRⅠ-XhoⅠ片段,并将该片段插入EcoRⅠ-SalⅠ消化过的pGEMEX-1中。这一组里的第二个质粒是这样构建的消化接近hmw2A基因的3′末端的MluⅠ位点。第二组的两个hmw2重组质粒源于这样一种“亲代”质粒,该质粒是通过提取pHMW2-21中的2.3kb的HindⅢ片段并将其插入HindⅢ消化过的pGEMEX-2中而构建的。第二组里的其余质粒是通过消化下游MluⅠ位点而构建成的。最后,所示的最后一个质粒是这样构建的从hmw2基因簇中所示的位点上提取1.2kbp的HincⅡ-HindⅢ片段,并将其插入HincⅡ-HindⅢ消化的pGEMEX-1中。
将上述每一种质粒用于转化大肠杆菌菌株JM101。将所得到的转化体用于制备用于作图研究的重组融合蛋白。为了制备重组蛋白,让转化的大肠杆菌菌株在含有50μg氨苄青霉素/ml的L培养液中生长至A600为0.5。然后加入IPTG至1mM浓度,并在感染复数为10时加入含有T7RNA聚合酶基因的M13噬菌体。1小时后收获细胞,并制备细胞的超声处理物。测定所述样品的蛋白浓度,并将含有100μg总蛋白的细胞超声处理物溶于电泳样品缓冲液中,进行SDS-聚丙烯酰胺凝胶电泳,并在考马斯凝胶上检查,以测定重组融合蛋白的表达水平。一旦证实重组融合蛋白的高水平表达,即把该细胞超声处理外用于上文所述的Western印迹分析中。
图20示出的是电子显微照片,示Mab AD6与代表性的不可分型的流感嗜血菌菌株的表面结合。在该图的左上图中是不可分型的嗜血菌属菌株12,右上图片中是不再表达所述高分子量蛋白的菌株12的衍生物。如图所示,胶态金粒子附着在菌株12的表面,表明在其表明有结合的AD6抗体。相反,在不再表达所述高分子量蛋白的菌株12的表面不能见到金粒子。上述结果表明,单克隆抗体AD6识别菌株12的高分子量蛋白上的表面外露的表位。用单克隆抗体10C5进行类似的研究,证实其也结合于菌株12的高分子量HMW1和HMW2蛋白的表面可及表位。
已鉴定了两种表面结合单克隆抗体,并对每种单克隆抗体识别的表位进行作图。为了达到上述目的,采用含有hmw1a或hmw2A结构基因的各个部分的上述两组重组质粒(图18和19)。采用上述互补的质粒组,将由所述单克隆抗体识别的表位作图于极大的HMW1和HMW2蛋白的较小的区域上。
为了定位由Mab AD6识别的表位,检验了该单克隆抗体与很大一组重组融合蛋白的反应方式。图21是验证Mab AD6与5种重组融合蛋白(原先检验过的较大数目的相关的小组)的反应方式的Western印迹。通过分析Mab AD6与这一组蛋白的反应方式,人们可以将其所识别的表位作图于HMW1和HMW2蛋白的一段很短的片段上。下面将对该分析作一简单概述。为参照起见,在该图的上部标出了从被检查的重组蛋白形式表达的重组蛋白的hmw1AA或hmw2A结构基因的相关部分。如第一泳道所示,Mab AD6识别一个由片段1编码的表位,该片段包括hmw1A基因的远端1/4。当仅有构成片段2的基因部分表达时,反应性丧失。这一观察将AD6表位定位于HMW1蛋白的羧基末端的最后180个氨基酸中。Mab AD6还能识别由片段3编码的一个表位,该片段源于hmw2A结构基因。该片段相当大,它包括该基因的将近1/3。当片段4表达时反应性丧失。片段3和4的唯一差别是,在片段4的结构中,位于hmw2A结构基因的3′末端的最的225个碱基对缺失了。这一发现表明,所述AD6表位是由hmw2A基因的这一短的末端片段编码的。由于证实了Mab AD6与由片段5编码的重组蛋白的结合而对上述观点提供了有力的支持,所述片段5包括hmw2A结构基因的远端1/10。综上所述,以上资料表明AD6表位是HMW1和HMW2蛋白共有的,并将其定位于这两种蛋白的羧基末端的75个氨基酸处。
图22是验证Mab 10C5与在图21中检验的5种重组融合蛋白相同的蛋白的反应方式的Western印迹。如第1泳道所示,Mab 10C5能识别由片段5编码的一种表位。与Mab AD6不同,Mab 10C5还能识别由片段2编码的一种表位。与Mab AD6不同的还有,Mab 10C5不能识别由hmw2A衍生的重组融合蛋白中的任一种。因此,上述资料证实10C5表位为HMW1蛋白所特有,而且是由该图中的片段2编码的。该片段相当于由hmw1A结构基因的EcoRⅤ-BstEⅡ编码的一个155个氨基酸的片段。
在确定了由以上两个单克隆抗体识别的表位在HMW1和HMW2上的大致位置之后,接着测定这些表位与异源不可分型的嗜血菌属菌株的高分子量蛋白的同源程度。当在Western印迹分析中对细菌细胞超声处理物进行检查时,Mab AD6与发明人采集的125个以上的不可分型的流感嗜血菌株中的75%的高分子量蛋白上表达的表位有反应。事实上,该单克隆抗体能识别实际上所有不可分型的嗜血菌属菌株的高分子量蛋白上所表达的表位,这些菌株被我们事先鉴定为能表达HMW1/HMW2-样蛋白。图23是Western印迹的一例,表明Mab AD6与一组代表性的所述异源菌株的反应性。如图所示,所述单克隆抗体能识别上述每种菌株的100-150kDa范围内的一或两条带。为便于比较起见,第一泳道所示为原型菌株12,而所显现的两条带分别为代表HMW1和HMW2的上、下免疫活性带。
与在Mab AD6上所观察到的较宽的交叉反应性不同的是,Mab10C5在其识别异源菌株的高分子量蛋白的能力方面更为有效。Mab10C5能识别大约40%的能表达HMW1/HMW2一样蛋白的菌株的高分子量蛋白。与Mab AD6类似,Mab 10C5不能识别不能表达HMW1/HMW2-样蛋白的一切不可分型的嗜血菌菌株的蛋白。
以有限的方式检查了Mab AD6与异源菌株上的表面外露表位的反应性。图20中的下面两幅图片是电子显微照片,显示Mab AD6与不可分型的嗜血菌属菌株5和15的表面可及表位的反应性。如图所示,在所述每一种菌株的表面可见大量的胶态金粒子,证实了AD6表位的表面表达。尽管受到范围的局限,上述资料仍然表明AD6表位可能是大部分能表达HMW1/HMW2-样蛋白的大部分不可分型的流感嗜血菌的高分子量蛋白上的共有的表面可及表位。
说明书的总结总结本说明书,本发明提供了不可分型的嗜血菌属的高分子量蛋白,编码该蛋白的基因和混有该蛋白的疫苗。在本发明范围内作改进是可能的。表1由不可分型的流感嗜血菌引起的高分子量蛋白突变对与Chang上皮细胞粘附性的影响
*数字代表测量平均值(±平均值的标准误),取典型实验的3或4次重复的平均值。+菌株12衍生物的粘附性值是相对菌株12野生型的;菌株5衍生物的值是相对菌株5野生型的。表2获得了hmw1或hmw2基因簇的大肠杆菌DH5α和HB101的粘附性
*质粒pHMW1-14含有hmw1基因簇,而pHMW2-21含有hmw2基因簇;pT7-7是用于上述结构的克隆载体。+数字代表测量的平均值(±平均值的标准误),取典型实验的三次重复。表3在灰鼠模型中,HMW蛋白对不可分型的流感嗜血菌刺激的预防能力
<p>序列表(1)一般资料(ⅰ)申请人Barenkamp,Stephen J(ⅱ)发明名称不可分型的嗜血菌属的高分子量表面蛋白(ⅲ)序列数11(ⅳ)相关地址(A)收件人Shoemaker and Mattare,Ltd.
(B)街道2001 Jefferson Davis Hwy.,1203 Cryatal PlazaBldg.1(C)城市Arlington(D)州Virginia(E)国家U.S.A.
(F)邮编22202-0286(ⅴ)计算机可读形式(A)媒体类型软盘(B)计算机IBM PC兼容(C)操作系统PC-DOS/MS-DOS(D)软件PatentIn Release #1.0,Version #1.30(ⅵ)当前申请资料(A)申请号US08/617,697(B)申请日1996年4月1日(C)分类号(ⅶ)在先申请资料(A)申请号US08/302,832(B)申请日1994年10月5日(ⅶ)在先申请资料(A)申请号USPCT/US93/02166(B)申请日1993年3月16日(ⅷ)律师/代理人资料(A)姓名Berkstresser,Jerry W
(B)注册号22,651(C)文件/档案号1038-557(ⅹⅰ)电信资料(A)电话(703)415-0810(B)传真(703)415-0813(2)序列1资料(ⅰ)序列特征(A)长度5116bp(B)类型核酸(C)链型单(D)拓扑结构线性(ⅱ)分子类型DNA(基因组)(ⅹⅰ)序列描述序列1ACAGCGTTCT CTTAATACTA GTACAAACCC ACAATAAAAT ATGACAAACA ACAATTACAA60CACCTTTTTT GCAGTCTATA TGCAAATATT TTAAAAAATA GTATAAATCC GCCATATAAA 120ATGGTATAAT CTTTCATCTT TCATCTTTCA TCTTTCATCT TTCATCTTTC ATCTTTCATC 180TTTCATCTTT CATCTTTCAT CTTTCATCTT TCATCTTTCA TCTTTCATCT TTCATCTTTC 240ACATGCCCTG ATGAACCGAG GGAAGGGAGG GAGGGGCAAG AATGAAGAGG GAGCTGAACG 300AACGCAAATG ATAAAGTAAT TTAATTGTTC AACTAACCTT AGGAGAAAAT ATGAACAAGC 360TATATCGTCT CAAATTCAGC AAACGCCTGA ATGCTTTGGT TGCTGTGTCT GAATTGGCAC 420GGGGTTGTGA CCATTCCACA GAAAAAGGCA GCGAAAAACC TGCTCGCATG AAAGTGCGTC 480ACTTAGCGTT AAAGCCACTT TCCGCTATGT TACTATCTTT AGGTGTAACA TCTATTCCAC 540AATCTGTTTT AGCAAGCGGC TTACAAGGAA TGGATGTAGT ACACGGCACA GCCACTATGC 600AAGTAGATGG TAATAAAACC ATTATCCGCA ACAGTGTTGA CGATATCATT AATTGGAAAC 660AATTTAACAT CGACCAAAAT GAAATGGTGC AGTTTTTACA AGAAAACAAC AACTCCGCCG 720TATTCAACCG TGTTACATCT AACCAAATCT CCCAATTAAA AGGGATTTTA GATTCTAACG 780GACAAGTCTT TTTAATCAAC CCAAATGGTA TCACAATAGG TAAAGACGCA ATTATTAACA 840CTAATGGCTT TACGGCTTCT ACGCTAGACA TTTCTAACGA AAACATCAAG GCGCGTAATT 900TCACCTTCGA GCAAACCAAA GATAAAGCGC TCGCTGAAAT TGTGAATCAC GGTTTAATTA 960CTGTCGGTAA AGACGGCAGT GTAAATCTTA TTGGTGGCAA AGTGAAAAAC GAGGGTGTGA 1020TTAGCGTAAA TGGTGGCAGC ATTTCTTTAC TCGCAGGGCA AAAAATCACC ATCAGCGATA 1080TAATAAACCC AACCATTACT TACAGCATTG CCGCGCCTGA AAATGAAGCG GTCAATCTGG 1140GCGATATTTT TGCCAAAGGC GGTAACATTA ATGTCCGTGC TGCCACTATT CGAAACCAAG 1200GTAAACTTTC TGCTGATTCT GTAAGCAAAG ATAAAAGCGG CAATATTGTT CTTTCCGCCA 1260AAGAGGGTGA AGCGGAAATT GGCGGTGTAA TTTCCGCTCA AAATCAGCAA GCTAAAGGCG 1320GCAAGCTGAT GATTACAGGC GATAAAGTCA CATTAAAAAC AGGTGCAGTT ATCGACCTTT 1380CAGGTAAAGA AGGGGGAGAA ACTTACCTTG GCGGTGACGA GCGCGGCGAA GGTAAAAAGG 1440GCATTCAATT AGCAAAGAAA ACCTCTTTAG AAAAAGCCTC AACCATCAAT GTATCAGGCA 1500AAGAAAAAGG CGGACGCGCT ATTGTGTGGG GCGATATTGC GTTAATTGAC GGCAATATTA 1560ACGCTCAAGG TAGTGGTGAT ATCGCTAAAA CCGGTGGTTT TGTGGAGACG TCGGGGCATG 1620ATTTATTCAT CAAAGACAAT GCAATTGTTG ACGCCAAAGA GTGGTTGTTA GACCCGGATA 1680ATGTATCTAT TAATGCAGAA ACAGCAGGAC GCAGCAATAC TTCAGAAGAC GATGAATACA 1740CGGGATCCGG GAATAGTGCC AGCACCCCAA AACGAAACAA AGAAAAGACA ACATTAACAA 1800ACACAACTCT TGAGAGTATA CTAAAAAAAG GTACCTTTGT TAACATCACT GCTAATCAAC 1860GCATCTATGT CAATAGCTCC ATTAATTTAT CCAATGGCAG CTTAACTCTT TGGAGTGAGG 1920GTCGGAGCGG TGGCGGCGTT GAGATTAACA ACGATATTAC CACCGGTGAT GATACCAGAG 1980GTGCAAACTT AACAATTTAC TCAGGCGGCT GGGTTGATGT TCATAAAAAT ATCTCACTCG 2040GGGCGCAAGG TAACATAAAC ATTACAGCTA AACAAGATAT CGCCTTTGAG AAAGGAAGCA 2100ACCAAGTCAT TACAGGTCAA GGGACTATTA CCTCAGGCAA TCAAAAAGGT TTTAGATTTA 2160ATAATGTCTC TCTAAACGGC ACTGGCAGCG GACTGCAATT CACCACTAAA AGAACCAATA 2220AATACGCTAT CACAAATAAA TTTGAAGGGA CTTTAAATAT TTCAGGGAAA GTGAACATCT 2280CAATGGTTTT ACCTAAAAAT GAAAGTGGAT ATGATAAATT CAAAGGACGC ACTTACTGGA 2340ATTTAACCTC CTTAAATGTT TCCGAGAGTG GCGAGTTTAA CCTCACTATT GACTCCAGAG 2400GAAGCGATAG TGCAGGCACA CTTACCCAGC CTTATAATTT AAACGGTATA TCATTCAACA 2460AAGACACTAC CTTTAATGTT GAACGAAATG CAAGAGTCAA CTTTGACATC AAGGCACCAA 2520TAGGGATAAA TAAGTATTCT AGTTTGAATT ACGCATCATT TAATGGAAAC ATTTCAGTTT 2580CGGGAGGGGG GAGTGTTGAT TTCACACTTC TCGCCTCATC CTCTAACGTC CAAACCCCCG 2640GTGTAGTTAT AAATTCTAAA TACTTTAATG TTTCAACAGG GTCAAGTTTA AGATTTAAAA 2700CTTCAGGCTC AACAAAAACT GGCTTCTCAA TAGAGAAAGA TTTAACTTTA AATGCCACCG 2760GAGGCAACAT AACACTTTTG CAAGTTGAAG GCACCGATGG AATGATTGGT AAAGGCATTG 2820TAGCCAAAAA AAACATAACC TTTGAAGGAG GTAACATCAC CTTTGGCTCC AGGAAAGCCG 2880TAACAGAAAT CGAAGGCAAT GTTACTATCA ATAACAACGC TAACGTCACT CTTATCGGTT 2940CGGATTTTGA CAACCATCAA AAACCTTTAA CTATTAAAAA AGATGTCATC ATTAATAGCG 3000GCAACCTTAC CGCTGGAGGC AATATTGTCA ATATAGCCGG AAATCTTACC GTTGAAAGTA 3060ACGCTAATTT CAAAGCTATC ACAAATTTCA CTTTTAATGT AGGCGGCTTG TTTGACAACA 3120AAGGCAATTC AAATATTTCC ATTGCCAAAG GAGGGGCTCG CTTTAAAGAC ATTGATAATT 3180CCAAGAATTT AAGCATCACC ACCAACTCCA GCTCCACTTA CCGCACTATT ATAAGCGGCA 3240ATATAACCAA TAAAAACGGT GATTTAAATA TTACGAACGA AGGTAGTGAT ACTGAAATGC 3300AAATTGGCGG CGATGTCTCG CAAAAAGAAG GTAATCTCAC GATTTCTTCT GACAAAATCA 3360ATATTACCAA ACAGATAACA ATCAAGGGAG GTGTTGATGG GGAGAATTCC GATTCAGACG 3420CGACAAACAA TGCCAATCTA ACCATTAAAA CCAAAGAATT GAAATTAACG CAAGACCTAA 3480ATATTTCAGG TTTCAATAAA GCAGAGATTA CAGCTAAAGA TGGTAGTGAT TTAACTATTG 3540GTAACACCAA TAGTGCTGAT GGTACTAATG CCAAAAAAGT AACCTTTAAC CAGGTTAAAG 3600ATTCAAAAAT CTCTGCTGAC GGTCACAAGG TGACACTACA CAGCAAAGTG GAAACATCCG 3660GTAGTAATAA CAACACTGAA GATAGCAGTG ACAATAATGC CGGCTTAACT ATCGATGCAA 3720AAAATGTAAC AGTAAACAAC AATATTACTT CTCACAAAGC AGTGAGCATC TCTGCGACAA 3780GTGGAGAAAT TACCACTAAA ACAGGTACAA CCATTAACGC AACCACTGGT AACGTGGAGA 3840TAACCGCTCA AACAGGTAGT ATCCTAGGTG GAATTGAGTC CAGCTCTGGC TCTGTAACAC 3900TTACTGCAAC CGAGGGCGCT CTTGCTGTAA GCAATATTTC GGGCAACACC GTTACTGTTA 3960CTGCAAATAG CGGTGCATTA ACCACTTTGG CAGGCTCTAC AATTAAAGGA ACCGAGAGTG 4020TAACCACTTC AAGTCAATCA GGCGATATCG GCGGTACGGT TTCTGGTGGC ACAGTAGAGG 4080TTAAAGCAAC CGAAAGTTTA ACCACTCAAT CCAATTCAAA AATTAAAGCA ACAACAGGCG 4140AGGCTAACGT AACAAGTGCA ACAGGTACAA TTGGTGGTAC GATTTCCGGT AATACGGTAA 4200ATGTTACGGC AAACGCTGGC GATTTAACAG TTGGGAATGG CGCAGAAATT AATGCGACAG 4260AAGGAGCTGC AACCTTAACT ACATCATCGG GCAAATTAAC TACCGAAGCT AGTTCACACA 4320TTACTTCAGC CAAGGGTCAG GTAAATCTTT CAGCTCAGGA TGGTAGCGTT GCAGGAAGTA 4380TTAATGCCGC CAATGTGACA CTAAATACTA CAGGCACTTT AACTACCGTG AAGGGTTCAA 4440ACATTAATGC AACCAGCGGT ACCTTGGTTA TTAACGCAAA AGACGCTGAG CTAAATGGCG 4500CAGCATTGGG TAACCACACA GTGGTAAATG CAACCAACGC AAATGGCTCC GGCAGCGTAA 4560TCGCGACAAC CTCAAGCAGA GTGAACATCA CTGGGGATTT AATCACAATA AATGGATTAA 4620ATATCATTTC AAAAAACGGT ATAAACACCG TACTGTTAAA AGGCGTTAAA ATTGATGTGA 4680AATACATTCA ACCGGGTATA GCAAGCGTAG ATGAAGTAAT TGAAGCGAAA CGCATCCTTG 4740AGAAGGTAAA AGATTTATCT GATGAAGAAA GAGAAGCGTT AGCTAAACTT GGAGTAAGTG 4800CTGTACGTTT TATTGAGCCA AATAATACAA TTACAGTCGA TACACAAAAT GAATTTGCAA 4860CCAGACCATT AAGTCGAATA GTGATTTCTG AAGGCAGGGC GTGTTTCTCA AACAGTGATG 4920GCGCGACGGT GTGCGTTAAT ATCGCTGATA ACGGGCGGTA GCGGTCAGTA ATTGACAAGG 4980TAGATTTCAT CCTGCAATGA AGTCATTTTA CGTATTTATT ATTTACTGTG TGGGTTAAAG 5040TTCAGTACGG GCTTTACCCA TCTTGTAAAA AATTACGGAG AATACAATAA AGTATTTTTA 5100ACAGGTTATT ATTATG 5116(2)序列2资料(ⅰ)序列特征(A)长度1536个氨基酸(B)类型氨基酸
(C)链型单(D)拓扑结构线性(ⅱ)分子类型DNA(基因组)(ⅹⅰ)序列描述序列2Met Asn Lys Ile Tyr Arg Leu Lys Phe Ser Lys Arg Leu Asn Ala Leu1 5 10 15Val Ala Val Ser Glu Leu Ala Arg Gly Cys Asp His Sar Thr Glu Lys20 25 30Gly Ser Glu Lys Pro Ala Arg Met Lys Val Arg His Leu Ala Leu Lys35 40 45Pro Leu Ser Ala Met Leu Leu Ser Leu Gly Val Thr Ser Ile Pro Gln50 55 60Ser Val Leu Ala Ser Gly Leu Gln Gly Met Asp Val Val His Gly Thr65 70 75 80Ala Thr Met Gln Val Asp Gly Asn Lys Thr Ile Ile Arg Asn Ser Val85 90 95Asp Ala Ile Ile Asn Trp Lys Gln Phe Asn Ile Asp Gln Asn Glu Met100 105 110Val Gln Phe Leu Gln Glu Asn Asn Asn Ser Ala Val Phe Asn Arg Val115 120 125Thr Ser Asn Gln Ile Ser Gln Leu Lys Gly Ile Leu Asp Ser Asn Gly130 135 140Gln Val Phe Leu Ile Asn Pro Asn Gly Ile Thr Ile Gly Lys Asp Ala145 150 155 160Ile Ile Asn Thr Asn Gly Phe Thr Ala Ser Thr Leu Asp Ile Ser Asn165 170 175Glu Asn Ile Lys Ala Arg Asn Phe Thr Phe Glu Gln Thr Lys Asp Lys180 185 190Ala Leu Ala Glu Ile Val Asn His Gly Leu Ile Thr Val Gly Lys Asp195 200 205Gly Ser Val Asn Leu Ile Gly Gly Lys Val Lys Asn Glu Gly Val Ile210 215 220Ser Val Asn Gly Gly Ser Ile Ser Leu Leu Ala Gly Gln Lys Ile Thr225 230 235 240Ile Ser Asp Ile Ile Asn Pro Thr Ile Thr Tyr Ser Ile Ala Ala Pro245 250 255Glu Asn Glu Ala Val Asn Leu Gly Asp Ile Phe Ala Lys Gly Gly Asn260 265 270Ile Asn Val Arg Ala Ala Thr Ile Arg Asn Gln Gly Lys Leu Ser Ala275 280 285Asp Ser Val Ser Lys Asp Lys Ser Gly Asn Ile Val Leu Ser Ala Lys290 295 300Glu Gly Glu Ala Glu Ile Gly Gly Val Ile Ser Ala Gln Asn Gln Gln305 310 315 320Ala Lys Gly Gly Lys Leu Met Ile Thr Gly Asp Lys Val Thr Leu Lys325 330 335Thr Gly Ala Val Ile Asp Leu Ser Gly Lys Glu Gly Gly Glu Thr Tyr340 345 350Leu Gly Gly Asp Glu Arg Gly Glu Gly Lys Asn Gly Ile Gln Leu Ala355 360 365Lys Lys Thr Ser Leu Glu Lys Gly Ser Thr lle Asn Val Ser Gly Lys370 375 380Glu Lys Gly Gly Arg Ala Ile Val Tlp Gly Asp Ile Ala Leu Ile Asp385 390 395 400Gly Asn Ile Asn Ala Gln Gly Ser Gly Asp Ile Ala Lys Thr Gly Gly405 410 415Phe Val Glu Thr Ser Gly His Asp Leu Phe Ile Lys Asp Asn Ala Ile420 425 430Val Asp Ala Lys Glu Trp Leu Leu Asp Phe Asp Asn Val Ser Ile Asn435 440 445Ala Glu Thr Ala Gly Arg Ser Asn Thr Ser Glu Asp Asp Glu Tyr Thr450 455 460Gly Ser Gly Asn Ser Ala Ser Thr Pro Lys Arg Asn Lys Glu Lys Thr465 470 475 480Thr Leu Thr Asn Thr Thr Leu Glu Ser Ile Leu Lys Lys Gly Thr Phe485 490 49SVal Asn Ile Thr Ala Asn Gln Arg Ile Tyr Val Asn Ser Ser Ile Asn500 505 510Leu Ser Asn Gly Ser Leu Thr Leu Trp Ser Glu Gly Arg Ser Gly Gly515 520 525Gly Val Glu Ile Asn Asn Asp Ile Thr Thr Gly Asp Asp Thr Arg Gly530 535 540Ala Asn Leu Thr Ile Tyr Ser Gly Gly Trp Val Asp Val His Lys Asn545 550 555 560Ile Ser Leu Gly Ala Gln Gly Asn Ile Asn Ile Thr Ala Lys Gln Asp565 570 575Ile Ala Phe Glu Lys Gly Ser Asn Gln Val Ile Thr Gly Gln Gly Thr580 585 590Ile Thr Ser Gly Asn Gln Lys Gly Phe Arg Phe Asn Asn Val Ser Leu595 600 605Asn Gly Thr Gly Ser Gly Leu Gln Phe Thr Thr Lys Arg Thr Asn Lys610 615 620Tyr Ala Ile Thr Asn Lys Phe Glu Gly Thr Leu Asn Ile Ser Gly Lys625 630 635 640Val Asn Ile Ser Met Val Leu Pro Lys Asn Glu Ser Gly Tyr Asp Lys645 650 655Phe Lys Gly Arg Thr Tyr Trp Asn Leu Thr Ser Leu Asn Val Ser Glu660 665 670Ser Gly Glu Phe Asn Leu Thr Ile Asp Ser Arg Gly Ser Asp Ser Ala675 680 685Gly Thr Leu Thr Gln Pro Tyr Asn Leu Asn Gly Ile Ser Phe Asn Lys690 695 700Asp Thr Thr Phe Asn Val Glu Arg Asn Ala Arg Val Asn Phe Asp Ile705 710 715 720Lys Ala Pro Ile Gly Ile Asn Lys Tyr Ser Ser Leu Asn Tyr Ala Ser725 730 735Phe Asn Gly Asn Ile Ser Val Ser Gly Gly Gly Ser Val Asp Phe Thr740 745 750Leu Leu Ala Ser Ser Ser Asn Val Gln Thr Pro Gly Val Val Ile Asn755 760 765Ser Lys Tyr Phe Asn Val Ser Thr Gly Ser Ser Leu Arg Phe Lys Thr770 775 780Ser Gly Ser Thr Lys Thr Gly Phe Ser Ile Glu Lys Asp Leu Thr Leu785 790 795 800Asn Ala Thr Gly Gly Asn Ile Thr Leu Leu Gln Val Glu Gly Thr Asp805 810 815Gly Met Ile Gly Lys Gly Ile Val Ala Lys Lys Asn Ile Thr Phe Glu820 825 830Gly Gly Asn Ile Thr Phe Gly Ser Arg Lys Ala Val Thr Glu Ile Glu835 840 845Gly Asn Val Thr Ile Asn Asn Asn Ala Asn Val Thr Leu Ile Gly Ser850 855 860Asp Phe Asp Asn His Gln Lys Pro Leu Thr Ile Lys Lys Asp Val Ile865 870 875 880Ile Asn Ser Gly Asn Leu Thr Ala Gly Gly Asn Ile Val Asn Ile Ala885 890 895Gly Asn Leu Thr Val Glu Ser Asn Ala Asn Phe Lys Ala Ile Thr Asn900 905 910Phe Thr Phe Asn Val Gly Gly Leu Phe Asp Asn Lys Gly Asn Ser Asn915 920 925Ile Ser Ile Ala Lys Gly Gly Ala Arg Phe Lys Asp Ile Asp Asn Ser930 935 940Lys Asn Leu Ser Ile Thr Thr Asn Ser Ser Ser Thr Tyr Arg Thr Ile945 950 955 960Ile Ser Gly Asn Ile Thr Asn Lys Asn Gly Asp Leu Asn Ile Thr Asn965 970 975Glu Gly Ser Asp Thr Glu Met Gln Ile Gly Gly Asp Val Ser Gln Lys980 985 990Glu Gly Asn Leu Thr Ile Ser Ser Asp Lys Ile Asn Ile Thr Lys Gln995 10001005Ile Thr Ile Lys Ala Gly Val Asp Gly Glu Asn Ser Asp Ser Asp Ala101010151020Thr Asn Asn Ala Asn Leu Thr Ile Lys Thr Lys Glu Leu Lys Leu Thr1025103010351040Gln Asp Leu Asn Ile Ser Gly Phe Asn Lys Ala Glu Ile Thr Ala Lys104510501055Asp Gly Ser Asp Leu Thr Ile Gly Asn Thr Asn Ser Ala Asp Gly Thr106010651070Asn Ala Lys Lys Val Thr Phe Asn Gln Val Lys Asp Ser Lys Ile Ser107510801085Ala Asp Gly His Lys Val Thr Leu His Ser Lys Val Glu Thr Ser Gly109010951100Ser Asn Asn Asn Thr Glu Asp Ser Ser Asp Asn Asn Ala Gly Leu Thr1105111011151120Ile Asp Ala Lys Asn Val Thr Val Asn Asn Asn Ile Thr Ser His Lys112511301135Ala Val Ser Ile Ser Ala Thr Ser Gly Glu Ile Thr Thr Lys Thr Gly114011451150Thr Thr Ile Asn Ala Thr Thr Gly Asn Val Glu Ile Thr Ala Gln Thr115511601165Gly Ser Ile Leu Gly Gly Ile Glu Ser Ser Ser Gly Ser Val Thr Leu117011751180Thr Ala Thr Glu Gly Ala Leu Ala Val Ser Asn Ile Ser Gly Asn Thr1185119011951200Val Thr Val Thr Ala Asn Ser Gly Ala Leu Thr Thr Leu Ala Gly Ser120512101215Thr Ile Lys Gly Thr Glu Ser Val Thr Thr Ser Ser Gln Ser Gly Asp122012251230Ile Gly Gly Thr Ile Ser Gly Gly Thr Val Glu Val Lys Ala Thr Glu123512401245Ser Leu Thr Thr Gln Ser Asn Ser Lys Ile Lys Ala Thr Thr Gly Glu125012551260Ala Asn Val Thr Ser Ala Thr Gly Thr Ile Gly Gly Thr Ile Ser Gly1265127012751280Asn Thr Val Asn Val Thr Ala Asn Ala Gly Asp Leu Thr Val Gly Asn128512901295Gly Ala Glu Ile Asn Ala Thr Glu Gly Ala Ala Thr Leu Thr Thr Ser130013051310Ser Gly Lys Leu Thr Thr Glu Ala Ser Ser His Ile Thr Ser Ala Lys131513201325Gly Gln Val Asn Leu Ser Ala Gln Asp Gly Ser Val Ala Gly Ser Ile133013351340Asn Ala Ala Asn Val Thr Leu Asn Thr Thr Gly Thr Leu Thr Thr Val1345135013551360Lys Gly Ser Asn Ile Asn Ala Thr Ser Gly Thr Leu Val Ile Asn Ala136513701375Lys Asp Ala Glu Leu Asn Gly Ala Ala Leu Gly Asn His Thr Val Val138013851390ASh Ala Thr Asn Ala Asn Gly Ser Gly Ser Val Ile Ala Thr Thr Ser139514001405Ser Arg Val Asn Ile Thr Gly Asp Leu Ile Thr Ile Asn Gly Leu Asn141014151420Ile Ile Ser Lys Asn Gly Ile Asn Thr Val Leu Leu Lys Gly Val Lys1425143014351440Ile Asp Val Lys Tyr Ile Gln Pro Gly Ile Ala Ser Val Asp Glu Val144514501455Ile Glu Ala Lys Arg Ile Leu Glu Lys Val Lys Asp Leu Ser Asp Glu146014651470Glu Arg Glu Ala Leu Ala Lys Leu Gly Val Ser Ala Val Arg Phe Ile147514801485Glu Pro Asn Asn Thr Ile Thr Val Asp Thr Gln Asn Glu Phe Ala Thr149014951500Arg Pro Leu Ser Arg Ile Val Ile Ser Glu Gly Arg Ala Cys Phe Ser1505151015151520Asn Ser Asp Gly Ala Thr Val Cys Val Asn Ile Ala Asp Asn Gly Arg152515301535(2)序列3资料(ⅰ)序列特征(A)长度4937bp(B)类型核酸(C)链型单(D)拓扑结构线性(ⅱ)分子类型DNA(基因组)(ⅹⅰ)序列描述序列3TAAATATACA AGATAATAAA AATAAATCAA GATTTTTGTG ATGACAAACA ACAATTACAA 60CACTTTTTTT GCAGTCTATA TGCAAATATT TTAAAAAAAT AGTATAAATC CGCCATATAA 120AATGGTATAA TCTTTCATCT TTCATCTTTA ATCTTTCATC TTTCATCTTT CATCTTTCAT 180CTTTCATCTT TCATCTTTCA TCTTTCATCT TTCATCTTTC ATCTTTCATC TTTCATCTTT 240CACATGAAAT GATGAACCGA GGGAAGGGAG GGAGGGGCAA GAATGAAGAG GGAGCTGAAC 300GAACGCAAAT GATAAAGTAA TTTAATTGTT CAACTAACCT TAGGAGAAAA TATGAACAAG 360ATATATCGTC TCAAATTCAG CAAACGCCTG AATGCTTTGG TTGCTGTGTC TGAATTGGCA 420CGGGGTTGTG ACCATTCCAC AGAAAAAGGC TTCCGCTATG TTACTATCTT TAGGTGTAAC 480CACTTAGCGT TAAAGCCACT TTCCGCTATG TTACTATCTT TAGGTGTAAC ATCTATTCCA 540CAATCTGTTT TAGCAAGCGG CTTACAAGGA ATGGATGTAG TACACGGCAC AGCCACTATG 600CAAGTAGATG GTAATAAAAC CATTATCCGC AACAGTGTTG ACGCTATCAT TAATTGGAAA 660CAATTTAACA TCGACCAAAA TGAAATGGTG CAGTTTTTAC AAGAAAACAA CAACTCCGCC 720GTATTCAACC GTGTTACATC TAACCAAATC TCCCAATTAA AAGGGATTTT AGATTCTAAC 780GGACAAGTCT TTTTAATCAA CCCAAATGGT ATCACAATAG GTAAAGACGC AATTATTAAC 840ACTAATGGCT TTACGGCTTC TACGCTAGAC ATTTCTAACG AAAACATCAA GGCGCGTAAT 900TTCACCTTCG AGCAAACCAA AGATAAAGCG CTCGCTGAAA TTGTGAATCA CGGTTTAATT 960ACTGTCGGTA AAGACGGCAG TGTAAATCTT ATTGGTGGCA AAGTGAAAAA CGAGGGTGTG 1020ATTAGCGTAA ATGGTGGCAG CATTTCTTTA CTCGCAGGGC AAAAAATCAC CATCAGCGAT 1080ATAATAAACC CAACCATTAC TTACAGCATT GCCGCGCCTG AAAATGAAGC GGTCAATCTG 1140GGCGATATTT TTGCCAAAGG CGGTAACATT AATGTCCGTG CTGCCACTAT TCGAAACCAA 1200GGTAAACTTT CTGCTGATTC TGTAAGCAAA GATAAAAGCG GCAATATTGT TCTTTCCGCC 1260AAAGAGGGTG AAGCGGAAAT TGGCGGTGTA ATTTCCGCTC AAAATCAGCA AGCTAAAGGC 1320GGCAAGCTGA TGATTACAGG CGATAAAGTC ACATTAAAAA CAGGTGCAGT TATCGACCTT 1380TCAGGTAAAG AAGGGGGAGA AACTTACCTT GGCGGTGACG AGCGCGGCGA AGGTAAAAAC 1440GGCATTCAAT TAGCAAAGAA AACCTCTTTA GAAAAAGGCT CAACCATCAA TGTATCAGGC 1500AAAGAAAAAG GCGGACGCGC TATTGTGTGG GGCGATATTG CGTTAATTGA CGGCAATATT 1560AACGCTCAAG GTAGTGGGTG ATACGCTAAA ACCGGTGGTT TTGTGGAGAC ATCGGGGCAT 1620TATTTATCCA TTGACAGCAA TGCAATTGTT AAAACAAAAG AGTGGTTGCT AGACCCTGAT 1680GATGTAACAA TTGAAGCCGA AGACCCCCTT CGCAATAATA CCGGTATAAA TGATGAATTC 1740CCAACAGGCA CCGGTGAAGC AAGCGACCCT AAAAAAAATA GCGAACTCAA AACAACGCTA 1800ACCAATACAA CTATTTCAAA TTATCTGAAA AACGCCTGGA CAATGAATAT AACGGCATCA 1860AGAAAACTTA CCGTTAATAG CTCAATCAAC ATCGGAAGCA ACTCCCACTT AATTCTCCAT 1920AGTAAAGGTC AGCGTGGCGG AGGCGTTCAG ATTGATGGAG ATATTACTTC TAAAGGCGGA 1980AATTTAACCA TTTATTCTGG CGGATGGGTT GATGTTCATA AAAATATTAC GCTTGATCAG 2040GGTTTTTTAA ATATTACCGC CGCTTCCGTA GCTTTTGAAG GTGGAAATAA CAAAGCACGC 2100GACGCGGCAA ATGCTAAAAT TGTCGCCCAG GGCACTGTAA CCATTACAGG AGAGGGAAAA 2160GATTTCAGGG CTAACAACGT ATCTTTAAAC GGAACGGGTA AAGGTCTGAA TATCATTTCA 2220TCAGTGAATA ATTTAACCCA CAATCTTAGT GGCACAATTA ACATATCTGG GAATATAACA 2280ATTAACCAAA CTACGAGAAA GAACACCTCG TATTGGCAAA CCAGCCATGA TTCGCACTGG 2340AACGTCAGTG CTCTTAATCT AGAGACAGGC GCAAATTTTA CCTTTATTAA ATACATTTCA 2400AGCAATAGCA AAGGCTTAAC AACACAGTAT AGAAGCTCTG CAGGGGTGAA TTTTAACGGC 2460GTAAATGGCA ACATGTCATT CAATCTCAAA GAAGGAGCGA AAGTTAATTT CAAATTAAAA 2520CCAAACGAGA ACATGAACAC AAGCAAACCT TTACCAATTC GGTTTTTAGC CAATATCACA 2580GCCACTGGTG GGGGCTCTGT TTTTTTTGAT ATATATGCCA ACCATTCTGG CAGAGGGGCT 2640GAGTTAAAAA TGAGTGAAAT TAATATCTCT AACGGCGCTA ATTTTACCTT AAATTCCCAT 2700GTTCGCGGCG ATGACGCTTT TAAAATCAAC AAAGACTTAA CCATAAATGC AACCAATTCA 2760AATTTCAGCC TCAGACAGAC GAAAGATGAT TTTTATGACG GGTACGCACG CAATGCCATC 2820AATTCAACCT ACAACATATC CATTCTGGGC GGTAATGTCA CCCTTGGTGG ACAAAACTCA 2880AGCAGCAGCA TTACGGGGAA TATTACTATC GAGAAAGCAG CAAATGTTAC GCTAGAAGCC 2940AATAACGCCC CTAATCAGCA AAACATAAGG GATAGAGTTA TAAAACTTGG CAGCTTGCTC 3000GTTAATGGGA GTTTAAGTTT AACTGGCGAA AATGCAGATA TTAAAGGCAA TCTCACTATT 3060TCAGAAAGCG CCACTTTTAA AGGAAAGACT AGAGATACCC TAAATATCAC CGGCAATTTT 3120ACCAATAATG GCACTGCCGA AATTAATATA ACACAAGGAG TGGTAAAACT TGGCAATGTT 3180ACCAATGATG GTGATTTAAA CATTACCACT CACGCTAAAC GCAACCAAAG AAGCATCATC 3240GGCGGAGATA TAATCAACAA AAAAGGAAGC TTAAATATTA CAGACAGTAA TAATGATGCT 3300GAAATCCAAA TTGGCGGCAA TATCTCGCAA AAAGAAGGCA ACCTCACGAT TTCTTCCGAT 3360AAAATTAATA TCACCAAACA GATAACAATC AAAAAGGGTA TTGATGGAGA GGACTCTAGT 3420TCAGATGCGA CAAGTAATGC CAACCTAACT ATTAAAACCA AAGAATTGAA ATTGACAGAA 3480GACCTAAGTA TTTCAGGTTT CAATAAAGCA GAGATTACAG CCAAAGATGG TAGAGATTTA 3540ACTATTGGCA ACAGTAATGA CGGTAACAGC GGTGCCGAAG CCAAAACAGT AACTTTTAAC 3600AATGTTAAAG ATTCAAAAAT CTCTGCTGAC GGTCACAATG TGACACTAAA TAGCAAAGTG 3660AAAACATCTA GCAGCAATGG CGGACGTGAA AGCAATAGCG ACAACGATAC CGGCTTAACT 3720ATTACTGCAA AAAATGTAGA AGTAAACAAA GATATTACTT CTCTCAAAAC AGTAAATATC 3780ACCGCGTCGG AAAAGGTTAC CACCACAGCA GGCTCGACCA TTAACGCAAC AAATGGCAAA 3840GCAAGTATTA CAACCAAAAC AGGTGATATC AGCGGTACGA TTTCCGGTAA CACGGTAAGT 3900GTTAGCGCGA CTGGTGATTT AACCACTAAA TCCGGCTCAA AAATTGAAGC GAAATCGGGT 3960GAGGCTAATG TAACAAGTGC AACAGGTACA ATTGGCGGTA CAATTTCCGG TAATACGGTA 4020AATGTTACGG CAAACGCTGG CGATTTAACA GTTGGGAATG GCGCAGAAAT TAATGCGACA 4080GAAGGAGCTG CAACCTTAAC CGCAACAGGG AATACCTTGA CTACTGAAGC CGGTTCTAGC 4140ATCACTTCAA CTAAGGGTCA GGTAGACCTC TTGGCTCAGA ATGGTAGCAT CGCAGGAAGC 4200ATTAATGCTG CTAATGTGAC ATTAAATACT ACAGGCACCT TAACCACCGT GGCAGGCTCG 4260GATATTAAAG CAACCAGCGG CACCTTGGTT ATTAACGCAA AAGATGCTAA GCTAAATGGT 4320GATGCATCAG GTGATAGTAC AGAAGTGAAT GCAGTCAACG CAAGCGGCTC TGGTAGTGTG 4380ACTGCGGCAA CCTCAAGCAG TGTGAATATC ACTGGGGATT TAAACACAGT AAATGGGTTA 4440AATATCATTT CGAAAGATGG TAGAAACACT GTGCGCTTAA GAGGCAAGGA AATTGAGGTG 4500AAATATATCC AGCCAGGTGT AGCAAGTGTA GAAGAAGTAA TTGAAGCGAA ACGCGTCCTT 4560GAAAAAGTAA AAGATTTATC TGATGAAGAA AGAGAAACAT TAGCTAAACT TGGTGTAAGT 4620GCTGTACGTT TTGTTGAGCC AAATAATACA ATTACAGTCA ATACACAAAA TGAATTTACA 4680ACCAGACCGT CAAGTCAAGT GATAATTTCT GAAGGTAAGG CGTGTTTCTC AAGTGGTAAT 4740GGCGCACGAG TATGTACCAA TGTTGCTGAC GATGGACAGC CGTAGTCAGT AATTGACAAG 4800GTAGATTTCA TCCTGCAATG AAGTCATTTT ATTTTCGTAT TATTTACTGT GTGGGTTAAA 4860GTTCAGTACG GGCTTTACCC ATCTTGTAAA AAATTACGGA GAATACAATA AAGTATTTTT 4920AACAGGTTAT TATTATG 4937(2)序列4资料(ⅰ)序列特征(A)长度1477个氨基酸(B)类型氨基酸(C)链型单(D)拓扑结构线性(ⅹⅰ)序列描述序列4Met Asn Lys Ile Tyr Arg Leu Lys Phe Ser Lys Arg Leu Asn Ala Leu1 5 10 15Val Ala Val Ser Glu Leu Ala Arg Gly Cys Asp His Ser Thr Glu Lys20 25 30Gly Ser Glu Lys Pro Ala Arg Met Lys Val Arg His Leu Ala Leu Lys35 40 45Pro Leu Ser Ala Met Leu Leu Ser Leu Gly Val Thr Ser Ile Pro Gln50 55 60Ser Val Leu Ala Ser Gly Leu Gln Gly Met Asp Val Val His Gly Thr65 70 75 80Ala Thr Met Gln Val Asp Gly Asn Lys Thr Ile Ile Arg Asn Ser Val85 90 95Asp Ala Ile Ile Asn Trp Lys Gln Phe Asn Ile Asp Gln Asn Glu Met100 105 110Val Gln Phe Leu Gln Glu Asn Asn Asn Ser Ala Val Phe Asn Arg Val115 120 125Thr Ser Asn Gln Ile Ser Gln Leu Lys Gly Ile Leu Asp Ser Asn Gly130 135 140Gln Val Phe Leu Ile Asn Pro Asn Gly Ile Thr Ile Gly Lys Asp Ala145 150 155 160Ile Ile Asn Thr Asn Gly Phe Thr Ala Ser Thr Leu Asp Ile Ser Asn165 170 175Glu Asn Ile Lys Ala Arg Asn Phe Thr Phe Glu Gln Thr Lys Asp Lys180 185 190Ala Leu Ala Glu Ile Val Asn His Gly Leu Ile Thr Val Gly Lys Asp195 200 205Gly Ser Val Asn Leu Ile Gly Gly Lys Val Lys Asn Glu Gly Val Ile210 215 220Ser Val Asn Gly Gly Ser Ile Ser Leu Leu Ala Gly Gln Lys Ile Thr225 230 235 240Ile Ser Asp Ile Ile Asn Pro Thr Ile Thr Tyr Ser Ile Ala Ala Pro245 250 255Glu Asn Glu Ala Val Asn Leu Gly Asp Ile Phe Ala Lys Gly Gly Asn260 265 270Ile Asn Val Arg Ala Ala Thr Ile Arg Asn Gln Gly Lys Leu Ser Ala275 280 285Asp Ser Val Ser Lys Asp Lys Ser Gly Asn Ile Val Leu Ser Ala Lys290 295 300Glu Gly Glu Ala Glu Ile Gly Gly Val Ile Ser Ala Gln Asn Gln Gln305 310 315 320Ala Lys Gly Gly Lys Leu Met Ile Thr Gly Asp Lys Val Thr Leu Lys325 330 335Thr Gly Ala Val Ile Asp Leu Ser Gly Lys Glu Gly Gly Glu Thr Tyr340 345 350Leu Gly Gly Asp Glu Arg Gly Glu Gly Lys Asn Gly Ile Gln Leu Ala355 360 365Lys Lys Thr Ser Leu Glu Lys Gly Ser Thr Ile Asn Val Ser Gly Lys370 375 380Glu Lys Gly Gly Phe Ala Ile Val Trp Gly Asp Ile Ala Leu Ile Asp385 390 395 400Gly Asn Ile Asn Ala Gln Gly Ser Gly Asp Ile Ala Lys Thr Gly Gly405 410 415Phe Val Glu Thr Ser Gly His Asp Leu Phe Ile Lys Asp Asn Ala Ile420 425 430Val Asp Ala Lys Glu Trp Leu Leu Asp Phe Asp Asn Val Ser Ile Asn435 440 445Ala Glu Asp Pro Leu Phe Asn Asn Thr Gly Ile Asn Asp Glu Phe Pro450 455 460Thr Gly Thr Gly Glu Ala Ser Asp Pro Lys Lys Asn Ser Glu Leu Lys465 470 475 480Thr Thr Leu Thr Asn Thr Thr Ile Ser Asn Tyr Leu Lys Asn Ala Trp485 490 495Thr Met Asn Ile Thr Ala Ser Arg Lys Leu Thr Val Asn Ser Ser Ile500 505 510Asn Ile Gly Ser Asn Ser His Leu Ile Leu His Ser Lys Gly Gln Arg515 520 525Gly Gly Gly Val Gln Ile Asp Gly Asp Ile Thr Ser Lys Gly Gly Asn530 535 540Leu Thr Ile Tyr Ser Gly Gly Trp Val Asp Val His Lys Asn Ile Thr545 550 555 560Leu Asp Gln Gly Phe Leu Asn Ile Thr Ala Ala Ser Val Ala Phe Glu565 570 575Gly Gly Asn Asn Lys Ala Arg Asp Ala Ala Asn Ala Lye Ile Val Ala580 585 590Gln Gly Thr Val Thr Ile Thr Gly Glu Gly Lys Asp Phe Arg Ala Asn595 600 605Asn Val Ser Leu Asn Gly Thr Gly Lys Gly Leu Asn Ile Ile Ser Ser610 615 620Val Asn Asn Leu Thr His Asn Leu Ser Gly Thr Ile Asn Ile Ser Gly625 630 635 640Asn Ile Thr Ile Asn Gln Thr Thr Arg Lys Asn Thr Ser Tyr Trp Gln645 650 655Thr Ser His Asp Ser His Trp Asn Val Ser Ala Leu Asn Leu Glu Thr660 665 670Gly Ala Asn Phe Thr Phe Ile Lys Tyr Ile Ser Ser Asn Ser Lys Gly675 680 685Leu Thr Thr Gln Tyr Arg Ser Ser Ala Gly Val Asn Phe Asn Gly Val690 695 700Asn Gly Asn Met Ser Phe Asn Leu Lys Glu Gly Ala Lys Val Asn Phe705 710 715 720Lys Leu Lys Pro Asn Glu Asn Met Asn Thr Ser Lys Pro Leu Pro Ile725 730 735Arg Phe Leu Ala Asn Ile Thr Ala Thr Gly Gly Gly Ser Val Phe Phe740 745 750Asp Ile Tyr Ala Asn His Ser Gly Arg Gly Ala Glu Leu Lys Met Ser755 760 765Glu Ile Asn Ile Ser Asn Gly Ala Asn Phe Thr Leu Asn ser His Val770 775 780Arg Gly Asp Asp Ala Phe Lys Ile Asn Lys Asp Leu Thr Ile Asn Ala785 790 795 800Thr Asn Ser Asn Phe Ser Leu Arg Gln Thr Lys Asp Asp Phe Tyr Asp805 810 815Gly Tyr Ala Arg Asn Ala Ile Asn Ser Thr Tyr Asn Ile Ser Ile Leu820 825 830Gly Gly Asn Val Thr Leu Gly Gly Gln Asn Ser Ser Ser Ser Ile Thr835 840 845Gly Asn Ile Thr Ile Glu Lys Ala Ala Asn Val Thr Leu Glu Ala Asn850 855 860Asn Ala Pro Asn Gln Gln Asn Ile Arg Asp Arg Val Ile Lys Leu Gly865 870 875 880Ser Leu Leu Val Asn Gly Ser Leu Ser Leu Thr Gly Glu Asn Ala Asp885 890 895Ile Lys Gly Asn Leu Thr Ile Ser Glu Ser Ala Thr Phe Lys Gly Lys900 905 910Thr Arg Asp Thr Leu Asn Ile Thr Gly Asn Phe Thr Asn Asn Gly Thr915 920 925Ala Glu Ile Asn Ile Thr Gln Gly Val Val Lys Leu Gly Asn Val Thr930 935 940Asn Asp Gly Asp Leu Asn Ile Thr Thr His ALa Lys Arg Asn Gln Arg945 950 955 960Ser Ile Ile Gly Gly Asp Ile Ile Asn Lys Lys Gly Ser Leu Asn Ile965 970 975Thr Asp ser Asn Asn Asp Ala Glu Ile Gln Ile Gly Gly Asn Ile Ser980 985 990Gln Lys Glu Gly Asn Leu Thr Ile Ser Ser Asp Lys Ile Asn Ile Thr995 10001005Lys Gln Ile Thr Ile Lys Lys Gly Ile Asp Gly Glu Asp Ser Ser Ser101010151020Asp Ala Thr Ser Asn Ala Asn Leu Thr Ile Lys Thr Lys Glu Leu Lys1025103010351040Leu Thr Glu Asp Leu Ser Ile Ser Gly Phe Asn Lys Ala Glu Ile Thr104510501055Ale Lys Asp Gly Arg Asp Leu Thr Ile Gly Asn Ser Asn Asp Gly Asn106010651070Ser Gly Ala Glu Ala Lys Thr Val Thr Phe Asn Asn Val Lys Asp Ser107510801085Lys Ile Ser Ala Asp Gly His Asn Val Thr Leu Asn Ser Lys Val Lys109010951100Thr Ser Ser Ser Asn Gly Gly Arg Glu Ser Asn Ser Asp Asn Asp Thr1105111011151120Gly Leu Thr Ile Thr Ala Lys Asn Vel Glu Val Asn Lys Asp Ile Thr112511301135Ser Leu Lys Thr Val Asn Ile Thr Ala Ser Glu Lys Val Thr Thr Thr114011451150Ala Gly Ser Thr Ile Asn Ala Thr Asn Gly Lys Ala Ser Ile Thr Thr115511601165Lys Thr Gly Asp Ile Ser Gly Thr Ile Ser Gly Asn Thr Val Ser Val117011751180Ser Ala Thr Val Asp Leu Thr Thr Lys Ser Gly Ser Lys Ile Glu Ala1185119011951200Lys Ser Gly Glu Ala Asn Val Thr Ser Ala Thr Gly Thr Ile Gly Gly120512101215Thr Ile Ser Gly Asn Thr Val Asn Val Thr Ala Asn Ala Gly Asp Leu122012251230Thr Val Gly Asn Gly Ala Glu Ile Asn Ala Thr Glu Gly Ala Ala Thr123512401245Leu Thr Ala Thr Gly Asn Thr Leu Thr Thr Glu Ala Gly Ser Ser Ile125012551260Thr Ser Thr Lys Gly Gln Val Asp Leu Leu Ala Gln Asn Gly Ser Ile1265127012751280Ala Gly Ser Ile Asn Ala Ala Asn Val Thr Leu Asn Thr Thr Gly Thr128512901295Leu Thr Thr Val Ala Gly Ser Asp Ile Lys Ala Thr Ser Gly Thr Leu130013051310Val Ile Asn Ala Lys Asp Ala Lys Leu Asn Gly Asp Ala Ser Gly Asp131513201325Ser Thr Glu Val Asn Ala Val Asn Ala Ser Gly Ser Gly Ser Val Thr133013351340Ala Ala Thr Ser Ser Ser Val Asn Ile Thr Gly Asp Leu Asn Thr Val1345135013551360Asn Gly Leu Asn Ile Ile Ser Lys Asp Gly Arg Asn Thr Val Arg Leu136513701375Arg Gly Lys Glu Ile Glu Val Lys Tyr Ile Gln Pro Gly Val Ala Ser138013851390Val Glu Glu Val Ile Glu Ala Lys Arg Val Leu Glu Lys Val Lys Asp139514001405Leu Ser Asp Glu Glu Arg Glu Thr Leu Ala Lys Leu Gly Val Ser Ala141014151420Val Arg Phe Val Glu Pro Asn Asn Thr Ile Thr Val Asn Thr Gln Asn1425143014351440Glu Phe Thr Thr Arg Pro Ser Ser Gln Val Ile Ile Ser Glu Gly Lys144514501455Ala Cys Phe Ser Ser Gly Asn Gly Ala Arg Val Cys Thr Asn Val Ala146014651470Asp Asp Gly Gln Pro1475(2)序列5资料(ⅰ)序列特征(A)长度9171bp(B)类型核酸(C)链型单(D)拓扑结构线性(ⅱ)分子类型DNA(基因组)(ⅹⅰ)序列描述序列5ACAGCGTTCT CTTAATACTA GTACAAACCC ACAATAAAAT ATGACAAACA ACAATTACAA 60CACCTTTTTT GCAGTCTATA TGCAAATATT TTAAAAAATA GTATAAATCC GCCATATAAA120ATGGTATAAT CTTTCATCTT TCATCTTTCA TCTTTCATCT TTCATCTTTC ATCTTTCATC180TTTCATCTTT CATCTTTCAT CTTTCATCTT TCATCTTTCA TCTTTCATCT TTCATCTTTC240ACATGAAATG ATGAACCGAG GGAAGGGAGG GAGGGGCAAG AATGAAGAGG GAGCTGAACG300AACGCAAATG ATAAAGTAAT TTAATTGTTC AACTAACCTT AGGAGAAAAT AGGAACAAGA360TATATCGTCT CAAATTCAGC AAACGCCTGA ATGCTTTGGT TGCTGTGTCT GAATTGGCAC420GGGGTTGTGA CCATTCCACA GAAAAAGGCA GCGAAAAACC TGCTCGCATG AAAGTGCGTC480ACTTAGCGTT AAAGCCACTT TCCGCTATGT TACTATCTTT AGGTGTAACA TCTATTCCAC540AATCTGTTTT AGCAAGCGGC TTACAAGGAA TGGATGTAGT ACACGGCACA GCCACTATGC600AAGTAGATGG TAATAAAACC ATTATCCGCA ACAGTGTTGA CGCTATCATT AATTGGAAAC660AATTTAACAT CGACCAAAAT GAAATGGTGC AGTTTTTACA AGAAAACAAC AACTCCGCCG720TATTCAACCG TGTTACATCT AACCAAATCT CCCAATTAAA AGGGATTTTA GATTCTAACG780GACAAGTCTT TTTAATCAAC CCAAATGGTA TCACAATAGG TAAAGACGCA ATTATTAACA840CTAATGGCTT TACGGCTTCT ACGCTAGACA TTTCTAACGA AAACATCAAG GCGCGTAATT900TCACCTTCGA GCAAACCAAA GATAAAGCGC TCGCTGAAAT TGTGAATCAC GGTTTAATTA960CTGTCGGTAA AGACGGCAGT GTAAATCTTA TTGGTGGCAA AGTGAAAAAC GAGGGTGTGA 1020TTAGCGTAAA TGGTGGCAGC ATTTCTTTAC TCGCAGGGCA AAAAATCACC ATCAGCGATA 1080TAATAAACCC AACCATTACT TACAGCATTG CCGCGCCTGA AAATGAAGCG GTCAATCTGG 1140GCGATATTTT TGCCAAAGGC GGTAACATTA ATGTCCGTGC TGCCACTATT CGAAACCAAG 1200CTTTCCGCCA AAGAGGGTAA AGCGGAAATT GGCGGTGTAA TTTCCGCTCA AAATCAGCAA 1260GCTAAAGGCG GCAAGCTGAT GATTACAGGC GATAAAGTCA CATTAAAAAC AGGTGCAGTT 1320ATCGACCTTT CAGGTAAAGA AGGGGGAGAA ACTTACCTTG GCGGTGACGA GCGCGGCGAA 1380GGTAAAAACG GCATTCAATT AGCAAAGAAA ACCTCTTTAG AAAAAGGCTC AACCATCAAT 1440GTATCAGGCA AAGAAAAAGG CGGACGCGCT ATTGTGTGGG GCGATATTGC GTTAATTGAC 1500GGCAATATTA ACGCTCAAGG TAGTGGTGAT ATCGCTAAAA CCGGTGGTTT TGTGGAGACG 1560TCCGGGCATG ATTTATTCAT CAAAGACAAT GCAATTGTTG ACGCCAAAGA GTGGTTGTTA 1620GACCCGGATA ATGTATCTAT TAATGCAGAA ACAGCAGGAC GCAGCAATAC TTCAGAAGAC 1680GATGAATACA CGGGATCCGG GAATAGTGCC AGCACCCCAA AACGAAACAA AGAAAAGACA 1740ACATTAACAA ACACAACTCT TGAGAGTATA CTAAAAAAAG GTACCTTTGT TAACATCACT 1800GCTAATCAAC GCATCTATGT CAATAGCTCC ATTAATTTAT CCAATGGCAG CTTAACTCTT 1860TGGAGTGAGG GTCGGAGCGG TGGCGGCGTT GAGATTAACA ACGATATTAC CACCGGTGAT 1920GATACCAGAG GTGCAAACTT AACAATTTAC TCAGGCGGCT GGGTTGATGT TCATAAAAAT 1980ATCTCACTCG GGGCGCAAGG TAACATAAAC ATTACAGCTA AACAAGATAT CGCCTTTGAG 2040AAAGGAAGCA ACCAAGTCAT TACAGGTCAA GGGACTATTA CCTCAGGCAA TCAAAAAGGT 2100TTTAGATTTA ATAATGTCTC TCTAAACGGC ACTGGCAGCG GACTGCAATT CACCACTAAA 2160AGAACCAATA AATACGCTAT CACAAATAAA TTTGAAGGGA CTTTAAATAT TTCAGGGAAA 2220GTGAACATCT CAATGGTTTT ACCTAAAAAT GAAAGTGGAT ATGATAAATT CAAAGGACGC 2280ACTTACTGGA ATTTAACCTC GAAAGTGGAT ATGATAAATT CAAAGGACGC CCTCACTATT 2340GACTCCAGAG GAAGCGATAG TGCAGGCACA CTTACCCAGC CTTATAATTT AAACGGTATA 2400TCATTCAACA AAGACACTAC CTTTAATGTT GAACGAAATG CAAGAGTCAA GTTTGACATC 2460AAGGCACCAA TAGGGATAAA TAAGTATTCT AGTTTGAATT ACGCATCATT TAATGGAAAC 2520ATTTCAGTTT CGGGAGGGGG GAGTGTTGAT TTCACACTTC TCGCCTCATC CTCTAACGTC 2580CAAACCCCCG GTGTAGTTAT AAATTCTAAA TACTTTAATG TTTCAACAGG GTCAAGTTTA 2640AGATTTAAAA CTTCAGGCTC AACAAAAACT GGCTTCTCAA TAGA AAAGA TTTTAACTTA 2700AATGCCACCG GAGGCAACAT AACACTTTTG CAAGTTGAAG GCACCGATGG AATGATTGGT 2760AAAGGCATTG TAGCCAAAAA AAACATAACC TTTGAAGGAG GTAAGATGAG GTTTGGCTCC 2820AGGAAAGCCG TAACAGAAAT CGAAGGCAAT GTTACTATCA ATAACAACGC TAACGTCACT 2880CTTATCGGTT CGGATTTTGA CAACCATCAA AAACCTTTAA CTATTAAAAA AGATGTCATC 2940ATTAATAGCG GCAACCTTAC CGCTGGAGGC AATATTGTCA ATATAGCCGG AAATCTTACC 3000GTTGAAAGTA ACGCTAATTT CAAAGCTATC ACAAATTTCA CTTTTAATGT AGGCGGCTTG 3060TTTGACAACA AAGGCAATTC AAATATTTCC ATTGCCAAAG GAGGGGCTCG CTTTAAAGAC 3120ATTGATAATT CCAAGAATTT AAGCATCACC ACCAACTCCA GTTCCACTTA CCGCACTATT 3180ATAAGCGGCA ATATAACCAA TAAAAACGGT GATTTAAATA TTACGAACGA AGGTAGTGAT 3240ACTGAAATGC AAATTGGCGG CGATGTCTCG CAAAAAGAAG GTAATCTCAC GATTTCTTCT 3300GACAAAATCA ATATTACCAA ACAGATAACA ATCAAGGCAG GTGTTGATGG GGAGAATTCC 3360GATTCAGACG CGACAAACAA TGCCAATCTA ACCATTAAAA CCAAAGAATT GAAATTAACG 3420CAAGACCTAA ATATTTCAGG TTTCAATAAA GCAGAGATTA CAGCTAAAGA TGGTAGTGAT 3480TTAACTATTG GTAACACCAA TAGTGCTGAT GGTACTAATG CCAAAAAAGT AACCTTTAAC 3540CAGGTTAAAG ATTCAAAAAT CTCTGCTGAC GGTCACAAGG TGACACTACA CAGCAAAGTG 3600GAAACATCCG GTAGTAATAA CAACACTGAA GATAGCAGTG ACAATAATGC CGGCTTAACT 3660ATCGATGCAA AAAATGTAAC AGTAAACAAC AATATTACTT CTCACAAAGC AGTGAGCATC 3720TCTGCGACAA GTGGAGAAAT TACCACTAAA ACAGGTACAA CCATTAACGC AACCACTGGT 3780AACGTGGAGA TAACCGCTCA AACAGGTAGT ATCCTAGGTG GAATTGAGTC CAGCTCTGGC 3840TCTGTAACAC TTACTGCAAC CGAGGGCGCT CTTGCTGTAA GCAATATTTC GGGCAACACC 3900GTTACTGTTA CTGCAAATAG CGGTGCATTA ACCACTTTGG CAGGCTCTAC AATTAAAGGA 3960ACCGAGAGTG TAACCACTTC AAGTCAATCA GGCGATATCG GCGGTACGAT TTCTGGTGGC 4020ACAGTAGAGG TTAAAGCAAC CGAAAGTTTA ACCACTCAAT CCAATTCAAA AATTAAAGCA 4080ACAACAGGCG AGGCTAACGT AACAAGTGCA ACAGGTACAA TTGGTGGTAC GATTTCCGGT 4140AATACGGTAA ATGTTACGGC AAACGCTGGC GATTTAACAG TTGGGAATGG CGCAGAAATT 4200AATGCGACAG AAGGAGCTGC AACCTTAACT ACATCATCGG GCAAATTAAC TACCGAAGCT 4260AGTTCACACA TTACTTCAGC CAAGGGTCAG GTAAATCTTT CAGCTCAGGA TGGTAGCGTT 4320GCAGGAAGTA TTAATGCCGC CAATGTGACA CTAAATACTA CAGGCACTTT AACTACCGTG 4380AAGGGTTCAA ACATTAATGC AACCAGCGGT ACCTTGGTTA TTAACGCAAA AGACGCTGAG 4440CTAAATCGCG CAGCATTGGG TAACCACACA GTGGTAAATG CAACCAACGC AAATGGCTCC 4500GGCAGCGTAA TCGCGACAAC CTCAAGCAGA GTGAACATCA CTGGGGATTT AATCACAATA 4560AATGGATTAA ATATCATTTC AAAAAACGGT ATAAACACCG TACTGTTAAA AGGCGTTAAA 4620ATTGATGTGA AATACATTCA ACCGGGTATA GCAAGCGTAG ATGAAGTAAT TGAAGCGAAA 4680CGCATCCTTG AGAAGGTAAA AGATTTATCT GATGAAGAAA GAGAAGCGTT AGCTAAACTT 4740GGCGTAAGTG CTGTACGTTT TATTGAGCCA AATAATACAA TTACAGTCGA TACACAAAAT 4800GAATTTGCAA CCAGACCATT AAGTCGAATA GTGATTTCTG AAGGCAGGGC GTGTTTCTCA 4860AACAGTGATG GCGCGACGGT GTGCGTTAAT ATCGCTGATA ACGGGCGGTA GCGGTCAGTA 4920ATTGACAAGG TAGATTTCAT CCTGCAATGA AGTCATTTTA TTTTCGTATT ATTTACTGGT 4980TGGGTTAAAG TTCAGTACGG GCTTTACCCA TCTTGTAAAA AATTACGGAG AATACAATAA 5040AGTATTTTTA ACAGGTTATT ATTATGAAAA ATATAAAAAG CAGATTAAAA CTCAGTGCAA 5100TATCAGTATT GCTTGGCCTG GCTTCTTCAT CATTGTATGC AGAAGAAGCG TTTTTAGTAA 5160AAGGCTTTCA GTTATCTGGT GCACTTGAAA CTTTAAGTGA AGACGCCCAA CTGTCTGTAG 5220CAAAATCTTT ATCTAAATAC CAAGGCTCGC AAACTTTAAC AAACCTAAAA ACAGCACAGC 5280TTGAATTACA GGCTGTGCTA GATAAGATTG AGCCAAATAA GTTTGATGTG ATATTGCCAC 5340AACAAACCAT TACGGATGGC AATATTATGT TTGAGCTAGT CTCGAAATCA GCCGCAGAAA 5400GCCAAGTTTT TTATAAGGCG AGCCAGGGTT ATAGTGAAGA AAATATCGCT CGTAGCCTGC 5460CATCTTTGAA ACAAGGAAAA GTGTATGAAG ATGGTCGTCA GTGGTTCGAT TTGCGTGAAT 5520TCAATATGGC AAAAGAAAAT CCACTTAAAG TCACTCGCGT GCATTACGAG TTAAACCCTA 5580AAAACAAAAC CTCTGATTTG GTAGTTGCAG GTTTTTCGCC TTTTGGCAAA ACGCGTAGCT 5640TTGTTTCCTA TGATAATTTC GGCGCAAGGG AGTTTAACTA TCAACGTGTA AGTCTAGGTT 5700TTGTAAATGC CAATTTGACC GGACATGATG ATGTATTAAA TCTAAACGCA TTGACCAATG 5760TAAAAGCACC ATCAAAATCT TATGCGGTAG GCATAGGATA TACTTATCCG TTTTATGATA 5820AACACCAATC CTTAAGTCTT TATACCAGCA TGAGTTATGC TGATTCTAAT GATATCGACG 5880GCTTACCAAG TGCGATTAAT CGTAAATTAT CAAAAGGTCA ATCTATCTCT GCGAATCTGA 5940AATGGAGTTA TTATCTCCCG ACATTTAACC TTGGAATGGA AGACCAGTTT AAAATTAATT 6000TAGGCTACAA CTACCGCCAT ATTAATCAAA CATCCGAGTT AAACACCCTG GGTGCAACGA 6060AGAAAAAATT TGCAGTATCA GGCGTAAGTG CAGGCATTGA TGGACATATC CAATTTACCC 6120CTAAAACAAT CTTTAATATT GATTTAACTC ATCATTATTA CGCGAGTAAA TTACCAGGCT 6180CTTTTGGAAT GGAGCGCATT GGCGAAACAT TTAATCGCAG CTATCACATT AGCACAGCCA 6240GTTTAGGGTT GAGTCAAGAG TTTGCTCAAG GTTGGCATTT TAGCAGTCAA TTATCGGGTC 6300AGTTTACTCT ACAAGATATA AGTAGCATAG ATTTATTCTC TGTAACAGGT ACTTATGGCG 6360TCAGAGGCTT TAAATACGGC GGTGCAAGTG GTGAGCGCGG TCTTGTATGG CGTAATGAAT 6420TAAGTATGCC AAAATACACC CGCTTTCAAA TCAGCCCTTA TGCGTTTTAT GATGCAGGTC 6480AGTTCCGTTA TAATAGCGAA AATGCTAAAA CTTACGGCGA AGATATGCAC ACGGTATCCT 6540CTGCGGGTTT AGGCATTAAA ACCTCTCCTA CACAAAACTT AAGCTTAGAT GCTTTTGTTG 6600CTCGTCGCTT TGCAAATGCC AATAGTGACA ATTTGAATGG CAACAAAAAA CGCACAAGCT 6660CACCTACAAC CTTCTGGGGT AGATTAACAT TCAGTTTCTA ACCCTGAAAT TTAATCAACT 6720GGTAAGCGTT CCGCCTACCA GTTTATAACT ATATGCTTTA CCCGCCAATT TACAGTCTAT 6780ACGCAACCCT GTTTTCATCC TTATATATCA AACAAACTAA GCAAACCAAG CAAACCAAGC 6840AAACCAAGCA AACCAAGCAA ACCAAGCAAA CCAAGCAAAC CAAGCAAACC AAGCAAACCA 6900AGCAAACCAA GCAAACCAAG CAAACCAAGC AAACCAAGCA ATGCTAAAAA ACAATTTATA 6960TGATAAACTA AAACATACTC CATACCATGG CAATACAAGG GATTTAATAA TATGACAAAA 7020GAAAATTTAC AAAGTGTTCC ACAAAATACG ACCGCTTCAC TTGTAGAATC AAACAACGAC 7080CAAACTTCCC TGCAAATACT TAAACAACCA CCCAAACCCA ACCTATTACG CCTGGAACAA 7140CATGTCGCCA AAAAAGATTA TGAGCTTGCT TGCCGCGAAT TAATGGCGAT TTTGGAAAAA 7200ATGGACGCTA ATTTTGGAGG CGTTCACGAT ATTGAATTTG ACGCACCTGC TCAGCTGGCA 7260TATCTACCCG AAAAACTACT AATTCATTTT GCCACTCGTC TCGCTAATGC AATTACAACA 7320CTCTTTTCCG ACCCCGAATT GGCAATTTCC GAAGAAGGGG CATTAAAGAT GATTAGCCTG 7380CAACGCTGGT TGACGCTGAT TTTTGCCTCT TCCCCCTACG TTAACGCAGA CCATATTCTC 7440AATAAATATA ATATCAACCC AGATTCCGAA GGTGGCTTTC ATTTAGCAAC AGACAACTCT 7500TCTATTGCTA AATTCTGTAT TTTTTACTTA CCCGAATCCA ATGTCAATAT GAGTTTAGAT 7560GCGTTATGGG CAGGGAATCA ACAACTTTGT GCTTCATTGT GTTTTGCGTT GCAGTCTTCA 7620CGTTTTATTG GTACTGCATC TGCGTTTCAT AAAAGAGCGG TGGTTTTACA GTGGTTTCCT 7680AAAAAACTCG CCGAAATTGC TAATTTAGAT GAATTGCCTG CAAATATCCT TCATGATGTA 7740TATATGCACT GCAGTTATGA TTTAGCAAAA AACAAGCACG ATGTTAAGCG TCCATTAAAC 7800GAACTTGTCC GCAAGCATAT CCTCACGCAA GGATGGCAAG ACCGCTACCT TTACACCTTA 7860GGTAAAAAGG ACGGCAAACC TGTGATGATG GTACTGCTTG AACATTTTAA TTCGGGACAT 7920TCGATTTATC GCACGCATTC AACTTCAATG ATTGCTGCTC GAGAAAAATT CTATTTAGTC 7980GGCTTAGGCC ATGAGGGCGT TGATAACATA GGTCGAGAAG TGTTTGACGA GTTCTTTGAA 8040ATCAGTAGCA ATAATATAAT GGAGAGACTG TTTTTTATCC GTAAACAGTG CGAAACTTTC 8100CAACCCGCAG TGTTCTATAT GCCAAGCATT GGCATGGATA TTACCACGAT TTTTGTGAGC 8160AACACTCGGC TTGCCCCTAT TCAAGCTGTA GCCTTGGGTC ATCCTGCCAC TACGCATTCT 8220GAATTTATTG ATTATGTCAT CGTAGAAGAT GATTATGTGG GCAGTGAAGA TTGTTTTAGC 8280GAAACCCTTT TACGCTTACC CAAAGATGCC CTACCTTATG TACCATCTGC ACTCGCCCCA 8340CAAAAAGTGG ATTATGTACT CAGGGAAAAC CCTGAAGTAG TCAATATCGG TATTGCCGCT 8400ACCACAATGA AATTAAACCC TGAATTTTTG CTAACATTGC AAGAAATCAG AGATAAAGCT 8460AAAGTCAAAA TACATTTTCA TTTCGCACTT GGACAATCAA CAGGCTTGAC ACACCCTTAT 8520GTCAAATGGT TTATCGAAAG CTATTTAGGT GACGATGCCA CTGCACATCC CCACGCACCT 8580TATCACGATT ATCTGGCAAT ATTGCGTGAT TGCGATATGC TACTAAATCC GTTTCCTTTC 8640GGTAATACTA ACGGCATAAT TGATATGGTT ACATTAGGTT TAGTTGGTGT ATGCAAAACG 8700GGGGATGAAG TACATGAACA TATTGATGAA GGTCTGTTTA AACGCTTAGG ACTACCAGAA 8760TGGCTGATAG CCGACACACG AGAAACATAT ATTGAATGTG CTTTGCGTCT AGCAGAAAAC 8820CATCAAGAAC GCCTTGAACT CCGTCGTTAC ATCATAGAAA ACAACGGCTT ACAAAAGCTT 8880TTTACAGGCG ACCCTCGTCC ATTGGGCAAA ATACTGCTTA AGAAAACAAA TGAATGGAAG 8940CGGAAGCACT TGAGTAAAAA ATAACGGTTT TTTAAAGTAA AAGTGCGGTT AATTTTCAAA 9000GCGTTTTAAA AACCTCTCAA AAATCAACCG CACTTTTATC TTTATAACGC TCCCGCGCGC 9060TGACAGTTTA TCTCTTTCTT AAAATACCCA TAAAATTGTG GCAATAGTTG GGTAATCAAA 9120TTCAATTGTT GATACGGCAA ACTAAAGACG GCGCGTTCTT CGGCAGTCAT C 9171(2)序列6资料(ⅰ)序列特征(A)长度9323bp(B)类型核酸(C)链型单(D)拓扑结构线性(ⅱ)分子类型DNA(基因组)(ⅹⅰ)序列描述序列6CGCCACTTCA ATTTAGGATT GTTGAAATTC AACTAACCAA AAAGTGCGGT TAAAATCTGT 60GGAGAAAATA GGTTGTAGTG AAGAACGAGG TAATTGTTCA AAAGGATAAA GCTCTCTTAA 120TTGGGCATTG GTTGGCGTTT CTTTTTCGGT TAATAGTAAA TTATATTCTG GACGACTATG 180CAATCCACCA ACAACTTTAC CGTTGGTTTT AAGCGTTAAT GTAAGTTCTT GCTCTTCTTG 240GCGAATACGT AATCCCATTT TTTGTTTAGC AAGAAAATGA TCGGGATAAT CATAATAGGT 300GTTGCCCAAA AATAAATTTT GATGTTCTAA AATCATAAAT TTTGCAAGAT ATTGTGGCAA 360TTCAATACCT ATTTGTGGCG AAATCGCCAA TTTTAATTCA ATTTCTTGTA GCATAATATT 420TCCCACTCAA ATCAACTGGT TAAATATACA AGATAATAAA AATAAATCAA GATTTTTGTG 480ATGACAAACA ACAATTACAA CACTTTTTTT GCATTCTATA TGCAAGTATT TTAAAAAAAT 540AGTATAAATC CGCCATATAA AATGGTATAA TCTTTCATCT TTCATTTTTC ATCTTTCATC 600TTTCATCTTT CATCTTTCAT CTTTCATCTT TCATCTTTCA TCTTTCATCT TTCATCTTTC 660ATCTTTCATC TTTCATCTTT CACATGAAAT GATGAACCGA GGGAAGGGAG GGAGGGGCAA 720GAATGAAGAG GGAGCTGAAC GAACGCAAAT GATAAAGTAA TTTAATTGTT CAACTAACCT 780TAGGAGAAAA TATGAACAAG ATATATCGTC TCAAATTCAG CAAACGCCTG AATGGTTTGG 840TTGCTGTGTC TGAATTGGCA CGGGGTTGTG ACCATTCCAC AGAAAAAGGC AGCGAAAAAC 900CTGCTCGCAT GAAAGTGCGT CACTTAGCGT TAAAGCCACT TTCCGCTATG TTACTATCTT 960TAGGTGTAAC ATCTATTCCA CAATCTGTTT TAGCAAGCGG CAATTTAACA TCGACCAAAA 1020TGAAATGGTG CAGTTTTTAC AAGAAAACAA GTAATAAAAC CATTATCCGC AACAGTGTTG 1080ACGCTATCAT TAATTGGAAA CAATTTAACA TCGACCAAAA TGAAATGGTG CAGTTTTTAC 1140AAGAAAACAA CAACTCCGCC GTATTCAACC GTGTTACATC TAACCAAATC TCCCAATTAA 1200AAGGGATTTT AGATTCTAAC GGACAAGTCT TTTTAATCAA CCCAAATGGT ATCACAATAG 1260GTAAAGACGC AATTATTAAC ACTAATGGCT TTACGGCTTC TACGCTAGAC ATTTCTAACG 1320AAAACATCAA GGCGCGTAAT TTCACCTTCG AGCAAACCAA AGATAAAGCG CTCGCTGAAA 1380TTGTGAATCA CGGTTTAATT ACTGTCGGTA AAGACGGCAG TGTAAATCTT ATTGGTGGCA 1440AAGTGAAAAA CGAGGGTGTG ATTAGCGTAA ATGGTGGCAG CATTTCTTTA CTCGCAGGGC 1500AAAAAATCAC CATCAGCGAT ATAATAAACC CAACCATTAC TTACAGCATT GCCGCGCCTG 1560AAAATGAAGC GGTCAATCTG GGCGATATTT TTGCCAAAGG CGGTAACATT AATGTCCGTG 1620CTGCCACTAT TCGAAACCAA GGTAAACTTT CTGCTGATTC TGTAAGCAAA GATAAAAGCG 1680GCAATATTGT TCTTTCCGCC AAAGAGGGTG AAGCGGAAAT TGGCGGTGTA ATTTCCGCTC 1740AAAATCAGCA AGCTAAAGGC GGCAAGCTGA TGATAAAGTC CGATAAAGTC ACATTAAAAA 1800CAGGTGCAGT TATCGACCTT TCAGGTAAAG AAGGGGGAGA AACTTACCTT GGCGGTGACG 1860AGCGCGGCGA AGGTAAAAAC GGCATTCAAT TAGCAAAGAA AACCTCTTTA GAAAAAGGCT 1920CAACCATCAA TGTATCAGGC AAAGAAAAAG GCGGACGCGC TATTGTGTGG GGCGATATTG 1980CGTTAATTGA CGGCAATATT AACGCTCAAG GTAGTGGTGA TATCGCTAAA ACCGGTGGTT 2040TTGTGGAGAC ATCGGGGCAT TATTTATCCA TTGACAGCAA TGCAATTGTT AAAACAAAAG 2100AGTGGTTGCT AGACCCTGAT GATGTAACAA TTGAAGCCGA AGACCCCCTT CGCAATAATA 2160CCGGTATAAA TGATGAATTC CCAACAGGCA CCGGTGAAGC AAGCGACCCT AAAAAAAATA 2220GCGAACTCAA AACAACGCTA ACCAATACAA CTATTTCAAA TTATCTGAAA AACGCCTGGA 2280CAATGAATAT AACGGCATCA AGAAAACTTA CCGTTAATAG CTCAATCAAC ATCGGAAGCA 2340ACTCCCACTT AATTCTCCAT AGTAAAGGTC AGCGTGGCGG AGGCGTTCAG ATTGATGGAG 2400ATATTACTTC TAAAGGCGGA AATTTAACCA TTTATTCTGG CGGATGGGTT GATGTTCATA 2460AAAATATTAC GCTTGATCAG GGTTTTTTAA ATATTACCGC CGCTTCCGTA GCTTTTGAAG 2520GTGGAAATAA CAAAGCACGC GACGCGGCAA ATGCTAAAAT TGTCGCCCAG GGCAGTGTAA 2580CCATTACAAA AGAGGGAAAA GATTTCAGGG CTAACAACGT ATCTTTAAAC GGAACGGGTA 2640AAGGTCTGAA TATCATTTCA TCAGTCAATA ATTTAACCCA CAATCTTAGT GGCACAATTA 2700ACATATCTGG GAATATAACA ATTAACCAAA CTACGAGAAA GAACACCTCG TATTGGCAAA 2760CCAGCCATGA TTCGCACTGG AACGTCAGTG CTCTTAATCT AGAGACAGGC GCAAATTTTA 2820CCTTTATTAA ATACATTTCA AGCAATAGCA AAGGCTTAAC AACACAGTAT AGAAGCTCTG 2880CAGGGGTGAA TTTTAACGGC CTAAATGGCA ACATGTCATT CAATCTCAAA GAAGGAGCGA 2940AAGTTAATTT CAAATTAAAA CCAAACGAGA ACATGAACAC AAGCAAACCT TTACCAATTC 3000GGTTTTTAGC CAATATCACA GCCACTGGTG GGGGCTCTGT TTTTTTTGAT ATATATGCCA 3060ACCATTCTGG CAGAGGGGCT GAGTTAAAAA TGAGTGAAAT TAATATCTCT AACGGCGCTA 3120ATTTTACCTT AAATTCCCAT GTTCGCGGCG ATGACGCTTT TAAAATCAAC AAAGACTTAA 3180CCTTAAATGC AACCAATTCA AATTTCAGCC TCAGACAGAC GAAAGATGAT TTTTATGACG 3240GGTACGCACG CAATGCCATC AATTCAACCT ACAACATATC CATTCTGGGC GGTAATGTCA 3300CCCTTGGTGG ACAAAACTCA AGCAGCAGCA TTACGGGGAA TATTACTATC GAGAAAGCAG 3360CAAATGTTAC GCTAGAAGCC AATAACGCCC CTAATCAGCA AAACATAAGG GATAGAGTTA 3420TAAAACTTGG CAGCTTGCTC GTTAATGGGA GTTTAAGTTT AACTGGCGAA AATGCAGATA 3480TTAAAGGCAA TCTCACTATT TCAGAAAGCG CCACTTTTAA AGGAAAGACT AGAGATACCC 3540TAAATATCAC CGGCAATTTT ACCAATAATG GGACTGCCGA AATTAATATA ACACAAGGAG 3600TGGTAAAACT TGGCAATGTT ACCAATGATG GTGATTTAAA CATTACCACT CACCCTAAAC 3660GCAACCAAAG AAGCATCATC GGCGGAGATA TAATCAACAA AAAAGGAAGC TTAAATATTA 3720CAGACAGTAA TAATGATGCT GAAATCCAAA TTGGCGGCAA TATCTCGCAA AAAGAAGGCA 3780ACCTCACGAT TTCTTCCGAT AAAATTAATA TCACCAAACA GATAACAATC AAAAAGGGTA 3840TTGATGGAGA GGACTCTAGT TCAGATGCGA CAAGTAATGC CAACCTAACT ATTAAAACCA 3900AAGAATTGAA ATTGACAGAA GACCTAAGTA TTTCAGGTTT CAATAAAGCA GAGATTACAG 3960CCAAAGATGG TAGAGATTTA ACTATTGGCA ACAGTAATGA CGGTAACAGC GGTGCCGAAG 4020CCAAAACAGT AACTTTTAAC AATGTTAAAG ATTCAAAAAT CTCTGCTGAC GGTCACAATG 4080TGACACTAAA TAGCAAAGTG AAAACATCTA GCAGCAATGG CGGACGTGAA AGCAATAGCG 4140ACAACGATAC CGGCTTAACT ATTACTGCAA AAAATGTAGA AGTAAACAAA GATATTACTT 4200CTCTCAAAAC AGTAAATATC ACCGCGTCGG AAAAGGTTAC CACCACAGCA GGCTCGACCA 4260TTAACGCAAC AAATGGCAAA GCAAGTATTA CAACCAAAAC AGGTGATATC AGCGGTACGA 4320TTTCCGGTAA CACGGTAAGT GTTAGCGCGA CTGGTGATTT AACCACTAAA TCCGGCTCAA 4380AAATTGAAGC GAAATCGGGT GAGGCTAATG TAACAAGTGC AACAGGTACA ATTGGCGGTA 4440CAATTTCCGG TAATACGGTA AATGTTACGG CAAACGCTGG CGATTTAACA GTTGGGAATG 4500GCGCAGAAAT TAATGCGACA GAAGGAGCTG CAACCTTAAC CGCAACAGGG AATACCTTGA 4560CTACTGAAGC CGGTTCTAGC ATCACTTCAA CTAAGGGTCA GGTAGACCTC TTGGCTCAGA 4620ATGGTAGCAT CGCAGGAAGC ATTAATGCTG CTAATGTGAC ATTAAATACT ACAGGCACCT 4680TAACCACCGT GGCAGGCTCG GATATTAAAG CAACCAGCGG CACCTTGGTT ATTAACGCAA 4740AAGATGCTAA GCTAAATGGT GATGCATCAG GTGATAGTAC AGAAGTGAAT GCAGTCAACG 4800ACTGGGGATT TGGTAGTGTG ACTGCGGCAA CCTCAAGCAG TGTGAATATC ACTGGGGATT 4860TAAACACAGT AAATGGGTTA AATATCATTT CGAAAGATGG TAGAAACACT GTGCGCTTAA 4920GAGGCAAGGA AATTGAGGGG AAATATATCC AGCCAGGTGT AGCAAGTGTA GAAGAAGTAA 4980TTGAAGCGAA ACGCGTCCTT GAAAAAGTAA AAGATTTATC TGATGAAGAA AGAGAAACAT 5040TAGCTAAACT TGGTGTAAGT GCTGTACGTT TTGTTGAGCC AAATAATACA ATTACAGTCA 5100ATACACAAAA TGAATTTACA ACCAGACCGT CAAGTCAAGT GATAATTTCT GAAGGTAAGG 5160CGTGTTTCTC AAGTGGTAAT GGCGCACGAG TATGTACCAA TGTTGCTGAC GATGGACAGC 5220CGTAGTCAGT AATTGACAAG GTAGATTTCA TCCTGCAATG AAGTCATTTT ATTTTCGTAT 5280TATTTACTGT GTGGGTTAAA GTTCAGTACG GGCTTTACCC ATCTTGTAAA AAATTACGGA 5340GAATACAATA AAGTATTTTT AACAGGTTAT TATTATGAAA AATATAAAAA GCAGATTAAA 5400ACTCAGTGCA ATATCAGTAT TGCTTGGCCT GGCTTCTTCA TCATTGTATG CAGAAGAAGC 5460GTTTTTAGTA AAAGGCTTTC AGTTATCTGG TGCACTTGAA ACTTTAAGTG AAGACGCCCA 5520ACTGTCTGTA GCAAAATCTT TATCTAAATA CCAAGGCTCG CAAACTTTAA CAAACCTAAA 5580AACAGCACAG CTTGAATTAC AGGCTGTGCT AGATAAGATT GAGCCAAATA AATTTGATGT 5640GATATTGCCG CAACAAACCA TTACGGATGG CAATATCATG TTTGAGCTAG TCTCGAAATC 5700AGCCGCAGAA AGCCAAGTTT TTTATAAGGC GAGCCAGGGT TATAGTGAAG AAAATATCGC 5760TCGTAGCCTG CCATCTTTGA AACAAGGAAA AGTGTATGAA GATGGTCGTC AGTGGTTCGA 5820TTTGCGTGAA TTTAATATGG CAAAAGAAAA CCCGCTTAAG GTTACCCGTG TACATTACGA 5880ACTAAACCCT AAAAACAAAA CCTCTAATTT GATAATTGCG GGCTTCTCGC CTTTTGGTAA 5940AACGCGTAGC TTTATTTCTT ATGATAATTT CGGCGCGAGA GAGTTTAACT ACCAACGTGT 6000AAGCTTGGGT TTTGTTAATG CCAATTTAAC TGGTCATGAT GATGTGTTAA TTATACCAGT 6060ATGAGTTATG CTGATTCTAA TGATATCGAC GGCTTACCAA GTGCGATTAA TCGTAAATTA 6120TCAAAAGGTC AATCTATCTC TGCGAATCTG AAATGGAGTT ATTATCTCCC AACATTTAAC 6180CTTGGCATGG AAGACCAATT TAAAATTAAT TTAGGCTACA ACTACCGCCA TATTAATCAA 6240ACCTCCGCGT TAAATCGCTT GGGTGAAACG AAGAAAAAAT TTGCAGTATC AGGCGTAAGT 6300GCAGGCATTG ATGGACATAT CCAATTTACC CCTAAAACAA TCTTTAATAT TGATTTAACT 6360CATCATTATT ACGCGAGTAA ATTACCAGGC TCTTTTGGAA TGGAGCGCAT TGGCGAAACA 6420TTTAATCGCA GCTATCACAT TAGCACAGCC AGTTTAGGGT TGAGTCAAGA GTTTGCTCAA 6480GGTTGGCATT TTAGCAGTCA ATTATCAGGT CAATTTACTC TACAAGATAT TAGCAGTATA 6540GATTTATTCT CTGTAACAGG TACTTATGGC GTCAGAGGCT TTAAATACGG CGGTGCAAGT 6600GGTGAGCGCG GTCTTGTATG GCGTAATGAA TTAAGTATGC CAAAATACAC CCGCTTCCAA 6660ATCAGCCCTT ATGCGTTTTA TGATGCAGGT CAGTTCCGTT ATAATAGCGA AAATGCTAAA 6720ACTTACGGCG AAGATATGCA CACGGTATCC TCTGCGGGTT TAGGCATTAA AACCTCTCCT 6780ACACAAAACT TAAGCCTAGA TGCTTTTGTT GCTCGTCGCT TTGCAAATGC CAATAGTGAC 6840AATTTGAATG GCAACAAAAA ACGCACAAGC TCACCTACAA CCTTCTGGGG GAGATTAACA 6900TTCAGTTTCT AACCCTGAAA TTTAATCAAC TGGTAAGCGT TCCGCCTACC AGTTTATAAC 6960TATATGCTTT ACCCGCCAAT TTACAGTCTA TAGGCAACCC TGTTTTTACC CTTATATATC 7020AAATAAACAA GCTAAGCTGA GCTAAGCAAA CCAAGCAAAC TCAAGCAAGC CAAGTAATAC 7080TAAAAAAACA ATTTATATGA TAAACTAAAG TATACTCCAT GCCATGGCGA TACAAGGGAT 7140TTAATAATAT GACAAAAGAA AATTTGCAAA ACGCTCCTCA AGATGCGACC GCTTTACTTG 7200CGGAATTAAG CAACAATCAA ACTCCCCTGC GAATATTTAA ACAACCACGC AAGCCCAGCC 7260TATTACGCTT GGAACAACAT ATCGCAAAAA AAGATTATGA GTTTGCTTGT CGTGAATTAA 7320TGGTGATTCT GGAAAAAATG GACGCTAATT TTGGAGGCGT TCACGATATT GAATTTGACG 7380CACCCGCTCA GCTGGCATAT CTACCCGAAA AATTACTAAT TTATTTTGCC ACTCGTCTCG 7440CTAATGCAAT TACAACACTC TTTTCCGACC CCGAATTGGC AATTTCTGAA GAAGGGGCGT 7500TAAAGATGAT TAGCCTGCAA CGCTGGTTGA CGCTGATTTT TGCCTCTTCC CCCTACGTTA 7560ACGCAGACCA TATTCTCAAT AAATATAATA TCAACCCAGA TTCCGAAGGT GGCTTTCATT 7620TAGCAACAGA CAACTCTTCT ATTGCTAAAT TCTGTATTTT TTACTTACCC GAATCCAATG 7680TCAATATGAG TTTAGATGCG TTATGGGCAG GGAATCAACA ACTTTGTGCT TCATTGTGTT 7740TTGCGTTGCA GTCTTCACGT TTTATTGGTA CCGCATCTGC GTTTCATAAA AGAGCGGTGG 7800TTTTACAGTG GTTTCCTAAA AAACTCGCCG AAATTGCTAA TTTAGATGAA TTGCCTGCAA 7860ATATCCTTCA TGATGTATAT ATGCACTGCA GTTATGATTT AGCAAAAAAC AAGCACGATG 7920TTAAGCGTCC ATTAAACGAA CTTGTCCGCA AGCATATCCT CACGCAAGGA TGGCAAGACC 7980GCTACCTTTA CACCTTAGGT AAAAAGGACG GCAAACCTGT GATGATGGTA CTGCTTGAAC 8040ATTTTAATTC GGGACATTCG ATTTATCGTA CACATTCAAC TTCAATGATT GCTGCTCGAG 8100AAAAATTCTA TTTAGTCGGC TTAGGCCATG AGGGCGTTGA TAAAATAGGT CGAGAAGTGT 8160TTGACGAGTT CTTTGAAATC AGTAGCAATA ATATAATGGA GAGACTGTTT TTTATCCGTA 8220AACAGTGCGA AACTTTCCAA CCCGCAGTGT TCTATATGCC AAGCATTGGC ATGGATATTA 8280CCACGATTTT TGTGAGCAAC ACTCGGCTTG CCCCTATTCA AGCTGTAGCC CTGGGTCATC 8340CTGCCACTAC GCATTCTGAA TTTATTGATT ATGTCATCGT AGAAGATGAT TATGTGGGCA 8400GTGAAGATTG TTTCAGCGAA ACCCTTTTAC GCTTACCCAA AGATGCCCTA CCTTATGTAC 8460CTTCTGCACT CGCCCCACAA AAAGTGGATT ATGTACTCAG GGAAAACCCT GAAGTAGTCA 8520ATATCGGTAT TGCCGCTACC ACAATGAAAT TAAACCCTGA ATTTTTGCTA ACATTGCAAG 8580AAATCAGAGA TAAAGCTAAA GTCAAAATAC ATTTTCATTT CGCACTTGGA CAATCAACAG 8640GCTTGACACA CCCTTATGTC AAATGGTTTA TCGAAAGCTA TTTAGGTGAC GATGCCACTG 8700CACATCCCCA CGCACCTTAT CACGATTATC TGGCAATATT GCGTGATTGC GATATGCTAC 8760TAAATCCGTT TCCTTTCGGT AATACTAACG GCATAATTGA TATGGTTACA TTAGGTTTAG 8820TTGGTGTATG CAAAACGGGG GATGAAGTAC ATGAACATAT TGATGAAGGT CTGTTTAAAC 8880GCTTAGGACT ACCAGAATGG CTGATAGCCG ACACACGAGA AACATATATT GAATGTGCTT 8940TGCGTCTAGC AGAAAACCAT CAAGAACGCC TTGAACTCCG TCGTTACATC ATAGAAAACA 9000ACGGCTTACA AAAGCTTTTT ACAGGCGACC CTCGTCCATT GGGCAAAATA CTGCTTAAGA 9060AAACAAATGA ATGGAAGCGG AAGCACTTGA GTAAAAAATA ACGGTTTTTT AAAGTAAAAG 9120TGCGGTTAAT TTTCAAAGCG TTTTAAAAAC CTCTCAAAAA TCAACCGCAC TTTTATCTTT 9180ATAACGATCC CGCACGCTGA CAGTTTATCA GCCTCCCGCC ATAAAACTCC GCCTTTCATG 9240GCGGAGATTT TAGCCAAAAC TGGCAGAAAT TAAAGGCTAA AATCACCAAA TTGCACCACA 9300AAATCACCAA TACCCACAAA AAA 9323(2)序列7资料(ⅰ)序列特征(A)长度4794bp(B)类型核酸(C)链型单(D)拓扑结构线性
(ⅹⅰ)序列描述序列7ATGAACAAGA TATATCGTCT CAAATTCAGC AAACGCCTGA ATGCTTTGGT TGCTGTGTCT 60GAATTGACAC GGGGTTGTGA CCATTCCACA GAAAAAGGCA GTGAAAAACC TGTTCGTACG 120AAAGTACGCC ACTTGGCGTT AAAGCCACTT TCCGCTATAT TGCTATCTTT GGGCATGGCA 180TCCATTCCGC AATCTGTTTT AGCGAGCGGT TTACAGGGAA TGAGCGTCGT ACACGGTACA 240GCAACCATGC AAGTAGACGG CAATAAAACC ACTATCCGTA ATAGCGTCAA TGCTATCATC 300AATTGGAAAC AATTTAACAT TGACCAAAAT GAAATGGTGC AGTTTTTACA AGAAAGCAGG 360AACTCTGCCG TTTTCAACCG TGTTACATCT GACCAAATCT CCCAATTAAA AGGGATTTTA 420GATTCTAACG GACAAGTCTT TTTAATCAAC CCAAATGGTA TCACAATAGG TAAAGACGCA 480ATTATTAACA CTAATGGCTT TACTGCTTCT ACGCTAGACA TTTCTAACGA AAACATCAAG 540GCGCGTAATT TCACCCTTGA GCAAACCAAG GATAAAGCAC TCGCTGAAAT CGTGAATCAC 600GGTTTAATTA CCGTTGGTAA AGACGGTAGC GTAAACCTTA TTGGTGGCAA AGTGAAAAAC 660GAGGGCGTGA TTAGCGTAAA TGGCGGTAGT ATTTCTTTAC TTGCAGGGCA AAAAATCACC 720ATCAGCGATA TAATAAATCC AACCATCACT TACAGCATTG CTGCACCTGA AAACGAAGCG 780ATCAATCTGG GCGATATTTT TGCCAAAGGT GGTAACATTA ATGTCCGCGC TGCCACTATT 840CGCAATAAAG GTAAACTTTC TGCCGACTCT GTAAGCAAAG ATAAAAGTGG TAACATTGTT 900CTCTCTGCCA AAGAAGGTGA AGCGGAAATT GGCGGTGTAA TTTCCGCTCA AAATCAGCAA 960GCCAAAGGTG GTAAGTTGAT GATTACAGGC GATAAAGTTA CATTGAAAAC GGGTGCAGTT 1020ATCGACCTTT CGGGTAAAGA AGGGGGAGAA ACTTATCTTG GCGGTGACGA GCGTGGCGAA 1080GGTAAAAACG GCATTCAATT AGCAAAGAAA ACCACTTTAG AAAAAGGCTC AACAATTAAT 1140GTGTCAGGTA AAGAAAAAGG TGGGCGCGCT ATTGTATGGG GCGATATTGC GTTAATTGAC 1200GGCAATATTA ATGCCCAAGG TAAAGATATC GCTAAAACTG GTGGTTTTGT GGAGACGTCG 1260GGGCATTACT TATCCATTGA TGATAACGCA ATTGTTAAAA CAAAAGAATG GCTACTAGAC 1320CCAGAGAATG TGACTATTGA AGCTCCTTCC GCTTCTCGCG TCGAGCTGGG TGCCGATAGG 1380AATTCCCACT CGGCAGAGGT GATAAAAGTG ACCCTAAAAA AAAATAACAC CTCCTTGACA 1440ACACTAACCA ATACAACCAT TTCAAATCTT CTGAAAAGTG CCCACGTGGT GTTCATAACG 1500GCAAGGAGAA AACTTACCGT TAATAGCTCT ATCAGTATAG AAAGAGGCTC CCACTTAATT 1560CTCCACAGTG AAGGTCAGGG CGGTCAAGGT GTTCAGATTG ATAAAGATAT TACTTCTGAA 1620GGCGGAAATT TAACCATTTA TTCTGGCGGA TGGGTTGATG TTCATAAAAA TATTACGCTT 1680GGTAGCGGCT TTTTAAACAT CACAACTAAA GAAGGAGATA TCGCCTTCGA AGACAAGTCT 1740GGACGGAACA ACCTAACCAT TACAGCCCAA GGGACCATCA CCTCAGGTAA TAGTAACGGC 1800TTTAGATTTA ACAACGTCTC TCTAAACAGC CTTGGCGGAA AGCTGAGCTT TACTGACAGC 1860AGAGAGGACA GAGGTAGAAG AACTAAGGGT AATATCTCAA ACAAATTTGA CGGAACGTTA 1920AACATTTCCG GAACTGTAGA TATCTCAATG AAAGCACCCA AAGTCAGCTG GTTTTACAGA 1980GACAAAGGAC GCACCTACTG GAACGTAACC ACTTTAAATG TTACCTCGGG TAGTAAATTT 2040AACCTCTCCA TTGACAGCAC AGGAAGTGGC TCAACAGGTC CAAGCATACG CAATGCAGAA 2100TTAAATGGCA TAACATTTAA TAAAGCCACT TTTAATATCG CACAAGGCTC AACAGCTAAC 2160TTTAGCATCA AGGCATCAAT AATGCCCTTT AAGAGTAACG CTAACTACGC ATTATTTAAT 2220GAAGATATTT CAGTCTCAGG GGGGGGTAGC CTTAATTTCA AACTTAACGC CTCATCTAGC 2280AACATACAAA CCCCTGGCGT AATTATAAAA TCTCAAAACT TTAATGTCTC AGGAGGGTCA 2340ACTTTAAATC TCAAGGCTGA AGGTTCAACA GAAACCGCTT TTTCAATAGA AAATGATTTA 2400AACTTAAACG CCACCGGTGG CAATATAACA ATCAGACAAG TCGAGGGTAC CGATTCACGC 2460GTCAACAAAG GTGTCGCAGC CAAAAAAAAC ATAACTTTTA AAGGGGGTAA TATCACCTTC 2520GGCTCTCAAA AAGCCACAAC AGAAATCAAA GGCAATGTTA CCATCAATAA AAACACTAAC 2580GCTACTCTT1 GTGGTGCGAA TTTTGCCGAA AACAAATCGC CTTTAAATAT AGCAGGAAAT 2640GTTATTAATA ATGGCAACCT TACCACTGCC GGCTCCATTA TCAATATAGC CGGAAATCTT 2700ACTGTTTCAA AAGGCGCTAA CCTTCAAGCT ATAACAAATT ACACTTTTAA TGTAGCCGGC 2760TCATTTGACA ACAATGGCGC TTCAAACATT TCCATTGCCA GAGGAGGGGC TAAATTTAAA 2820GATATCAATA ACACCAGTAG CTTAAATATT ACCACCAACT CTGATACCAC TTACCGCACC 2880ATTATAAAAG GCAATATATC CAACAAATCA GGTGATTTGA ATATTATTGA TAAAAAAAGC 2940GACGCTGAAA TCCAAATTGG CGGCAATATC TCACAAAAAG AAGGCAATCT CACAATTTCT 3000TCTGATAAAG TAAATATTAC CAATCAGATA ACAATCAAAG CAGGCGTTGA AGGGGGGCGT 3060TCTGATTCAA GTGAGGCAGA AAATGCTAAC CTAACTATTC AAACCAAAGA GTTAAAATTG 3120GCAGGAGACC TAAATATTTC AGGCTTTAAT AAAGCAGAAA TTACAGCTAA AAATGGCAGT 3180GATTTAACTA TTGGCAATGC TAGCGGTGGT AATGCTGATG CTAAAAAAGT GACTTTTGAC 3240AAGGTTAAAG ATTCAAAAAT CTCGACTGAC GGTCACAATG TAACACTAAA TAGCGAAGTG 3300AAAACGTCTA ATGGTAGTAG CAATGCTGGT AATGATAACA GCACCGGTTT AACCATTTCC 3360GCAAAAGATG TAACGGTAAA CAATAACGTT ACCTCCCACA AGACAATAAA TATCTCTGCC 3420GCAGCAGGAA ATGTAACAAC CAAAGAAGGC ACAACTATCA ATGCAACCAC AGGCAGCGTG 3480GAAGTAACTG CTCAAAATGG TACAATTAAA GGCAACATTA CCTCGCAAAA TGTAACAGTG 3540ACAGCAACAG AAAATCTTGT TACCACAGAG AATGCTGTCA TTAATGCAAC CAGCGGCACA 3600GTAAACATTA GTACAAAAAC AGGGGATATT AAAGGTGGAA TTGAATCAAC TTCCGGTAAT 3660GTAAATATTA CAGCGAGCGG CAATACACTT AAGGTAAGTA ATATCACTGG TCAAGATGTA 3720ACAGTAACAG CGGATGCAGG AGCCTTGACA ACTACAGCAG GCTCAACCAT TAGTGCGACA 3780ACAGGCAATG CAAATATTAC AACCAAAACA GGTGATATCA ACGGTAAAGT TGAATCCAGC 3840TCCGGCTCTG TAACACTTGT TGCAACTGGA GCAACTCTTG CTGTAGGTAA TATTTCAGGT 3900AACACTGTTA CTATTACTGC GGATAGCGGT AAATTAACCT CCACAGTAGG TTCTACAATT 3960AATGGGACTA ATAGTGTAAC CACCTCAAGC CAATCAGGCG ATATTGAAGG TACAATTTCT 4020GGTAATACAG TAAATGTTAC AGCAAGCACT GGTGATTTAA CTATTGGAAA TAGTGCAAAA 4080GTTGAAGCGA AAAATGGAGC TGCAACCTTA ACTGCTGAAT CAGGCAAATT AACCACCCAA 4140ACAGGCTCTA GCATTACCTC AAGCAATGGT CAGACAACTC TTACAGCCAA GGATAGCAGT 4200ATCGCAGGAA ACATTAATGC TGCTAATGTG ACGTTAAATA CCACAGGCAC TTTAACTACT 4260ACAGGGGATT CAAAGATTAA CGCAACCAGT GGTACCTTAA CAATCAATGC AAAAGATGCC 4320AAATTAGATG GTGCTGCATC AGGTGACCGC ACAGTAGTAA ATGCAACTAA CGCAAGTGGC 4380TCTGGTAACG TGACTGCGAA AACCTCAAGC AGCGTGAATA TCACCGGGGA TTTAAACACA 4440ATAAATGGGT TAAATATCAT TTCGGAAAAT GGTAGAAACA CTGTGCGCTT AAGAGGCAAG 4500GAAATTGATG TGAAATATAT CCAACCAGGT GTAGCAAGCG TAGAAGAGGT AATTGAAGCG 4560AAACGCGTCC TTGAGAAGGT AAAAGATTTA TCTGATGAAG AAAGAGAAAC ACTAGCCAAA 4620CTTGGTGTAA GTGCTGTACG TTTCGTTGAG CCAAATAATG CCATTACGGT TAATACACAA 4680AACGAGTTTA CAACCAAACC ATCAAGTCAA GTGACAATTT CTGAAGGTAA GGCGTGTTTC 4740TCAAGTGGTA ATGGCGCACG AGTATGTACC AATGTTGCTG ACGATGGACA GCAG 4794(2)序列8资料(ⅰ)序列特征(A)长度4803bp(B)类型核酸(C)链型单(D)拓扑结构线性(ⅹⅰ)序列描述序列8ATGAACAAGA TATATCGTCT CAAATTCAGC AAACGCCTGA ATGCTTTGGT TGCTGTGTCT 60GAATTGACAC GGGGTTGTGA CCATTCCACA GAAAAAGGCA GTGAAAAACC TGTTCGTACG 120AAAGTACGCC ACTTGGCGTT AAAGCCACTT TCCGCTATAT TGCTATCTTT GGGCATGGCA 180TCCATTCCGC AATCTGTTTT AGCGAGCGGT TTACAGGGAA TGAGCGTCGT ACACGGTACA 240GCAACCATGC AAGTAGACGG CAATAAAACC ACTATCCGTA ATAGCGTCAA TGCTATCATC 300AATTGGAAAC AATTTAACAT TGACCAAAAT GAAATGGTGC AGTTTTTACA AGAAAGCAGC 360AACTCTGCCG TTTTCAACCG TGTTACATCT GACCAAATCT CCCAATTAAA AGGGATTTTA 420GATTCTAACG GACAAGTCTT TTTAATCAAC CCAAATGGTA TCACAATAGG TAAAGACGCA 480ATTATTAACA CTAATGGCTT TACTGCTTCT ACGCTAGACA TTTCTAACGA AAACATCAAG 540GCGCGTAATT TCACCCTTGA GCAAACCAAG GATAAAGCAC TCGCTGAAAT CGTGAATCAC 600GGTTTAATTA CCGTTGGTAA AGACGGTAGC GTAAACCTTA TTGGTGGCAA AGTGAAAAAC 660GAGGGCGTGA TTAGCGTAAA TGGCGGTAGT ATTTCTTTAC TTGCAGGGCA AAAAATCACC 720ATCAGCGATA TAATAAATCC AACCATCACT TACAGCATTG CTGCACCTGA AAACGAAGCG 780ATCAATCTGG GCGATATTTT TGCCAAAGGT GGTAACATTA ATGTCCGCGC TGCCACTATT 840CGCAATAAAG GTAAACTTTC TGCCGACTCT GTAAGCAAAG ATAAAAGTGG TAACATTGTT 900CTCTCTGCCA AAGAAGGTGA AGCGGAAATT GGCGGTGTAA TTTCCGCTCA AAATCAGCAA 960GCCAAAGGTG GTAAGTTGAT GATTACAGGT GATAAAGTCA CATTAAAAAC AGGTGCAGTT 1020ATCGACCTTT CAGGTAAAGA AGGGGGAGAG ACTTATCTTG GCGGTGATGA GCGTGGCGAA 1080GGTAAAAATG GTATTCAATT AGCGAAGAAA ACCTCTTTAG AAAAAGGCTC GACAATTAAT 1140GTATCAGGCA AAGAAAAAGG CGGGCGCGCT ATTGTATGGG GCGATATTGC ATTAATTAAT 1200GGTAACATTA ATGCTCAAGG TAGCGATATT GCTAAAACTG GCGGCTTTGT GGAAACATCA 1260GGACATGACT TATCCATTGG TGATGATGTG ATTGTTGACG CTAAAGAGTG GTTATTAGAC 1320CCAGATGATG TGTCCATTGA AACTCTTACA TCTGGACGCA ATAATACCGG CGAAAACCAA 1380GGATATACAA CAGGAGATGG GACTAAAGAG TCACCTAAAG GTAATAGTAT TTCTAAACCT 1440ACATTAACAA ACTCAACTCT TGAGCAAATC CTAAGAAGAG GTTCTTATGT TAATATCACT 1500GCTAATAATA GAATTTATGT TAATAGCTCC ATCAACTTAT CTAATGGCAG TTTAACACTT 1560CACACTAAAC GAGATGGAGT TAAAATTAAC GGTGATATTA CCTCAAACGA AAATGGTAAT 1620TTAACCATTA AAGCAGGCTC TTGGGTTGAT GTTCATAAAA ACATCACGCT TGGTACGGGT 1680TTTTTGAATA TTGTCGCTGG GGATTCTGTA GCTTTTGAGA GAGAGGGCGA TAAAGCACGT 1740AACGCAACAG ATGCTCAAAT TACCGCACAA GGGACGATAA CCGTCAATAA AGATGATAAA 1800CAATTTAGAT TCAATAATGT ATCTATTAAC GGGACGGGCA AGGGTTTAAA GTTTATTGCA 1860AATCAAAATA ATTTCACTCA TAAATTTGAT GGCGAAATTA ACATATCTGG AATAGTAACA 1920ATTAACCAAA CCACGAAAAA AGATGTTAAA TACTGGAATG CATCAAAAGA CTCTTACTGG 1980AATGTTTCTT CTCTTACTTT GAATACGGTG CAAAAATTTA CCTTTATAAA ATTCGTTGAT 2040AGCGGCTCAA ATTCCCAAGA TTTGAGGTCA TCACGTAGAA GTTTTGCAGG CGTACATTTT 2100AACGGCATCG GAGGCAAAAC AAACTTCAAC ATCGGAGCTA ACGCAAAAGC CTTATTTAAA 2160TTAAAACCAA ACGCCGCTAC AGACCCAAAA AAAGAATTAC CTATTACTTT TAACGCCAAC 2220ATTACAGCTA CCGGTAACAG TGATAGCTCT GTGATGTTTG ACATACACGC CAATCTTACC 2280TCTAGAGCTG CCGGCATAAA CATGGATTCA ATTAACATTA CCGGCGGGCT TGACTTTTCC 2340ATAACATCCC ATAATCGCAA TAGTAATGCT TTTGAAATCA AAAAAGACTT AACTATAAAT 2400GCAACTGGCT CGAATTTTAG TCTTAAGCAA ACGAAAGATT CTTTTTATAA TGAATACAGC 2460AAACACGCCA TTAACTCAAG TCATAATCTA ACCATTCTTG GCGGCAATGT CACTCTAGGT 2520GGGGAAAATT CAAGCAGTAG CATTACTGGC AATATCAATA TCACCAATAA AGCAAATGTT 2580ACATTACAAG CTGACACCAG CAACAGCAAC ACAGGCTTGA AGAAAAGAAC TCTAACTCTT 2640GGCAATATAT CTGTTGAGGG GAATTTAAGC CTAACTGGTG CAAATGCAAA CATTGTCGGC 2700AATCTTTCTA TTGCAGAAGA TTCCACATTT AAAGGAGAAG CCAGTGACAA CCTAAACATC 2760ACCGGCACCT TTACCAACAA CGGTACCGCC AACATTAATA TAAAACAAGG AGTGGTAAAA 2820CTCCAAGGCG ATATTATCAA TAAAGGTGGT TTAAATATCA CTACTAACGC CTCAGGCACT 2880CAAAAAACCA TTATTAACGG AAATATAACT AACGAAAAAG GCGACTTAAA CATCAAGAAT 2940ATTAAAGCCG ACGCCGAAAT CCAAATTGGC GGCAATATCT CACAAAAAGA AGGCAATCTC 3000ACAATTTCTT CTGATAAAGT AAATATTACC AATCAGATAA CAATCAAAGC AGGCGTTGAA 3060GGGGGGCGTT CTGATTCAAG TGAGGCAGAA AATGCTAACC TAACTATTCA AACCAAAGAG 3120TTAAAATTGG CAGGAGACCT AAATATTTCA GGCTTTAATA AAGCAGAAAT TACAGCTAAA 3180AATGGCAGTG ATTTAACTAT TGGCAATGCT AGCGGTGGTA ATGCTGATGC TAAAAAAGTG 3240ACTTTTGACA AGGTTAAAGA TTCAAAAATC TCGACTGACG GTCACAATGT AACACTAAAT 3300AGCGAAGTGA AAACGTCTAA TGGTAGTAGC AATGCTGGTA ATGATAACAG CACCGGTTTA 3360ACCATTTCCG CAAAAGATGT AACGGTAAAC AATAACGTTA CCTCCCACAA GACAATAAAT 3420ATCTCTGCCG CAGCAGGAAA TGTAACAACC AAAGAAGGCA CAACTATCAA TGCAACCACA 3480GGCAGCGTGG AAGTAACTGC TCAAAATGGT ACAATTAAAG GCTACATTAC CTCGCAAAAT 3540GTAACAGTGA CAGCAACAGA AAATCTTGTT ACCACAGAGA ATGCTGTCAT TAATGCAACC 3600AGCGGCACAG TAAACATTAG TACAAAAACA GGGGATATTA AAGGTGGAAT TGAATCAACT 3860TCCGGTAATG TAAATATTAC AGCGAGCGGC AATACACTTA AGGTAAGTAA TATCACTGGT 3720CAAGATGTAA CAGTAACAGC GGATGCAGGA GCCTTGACAA CTACAGCAGG CTCAACCATT 3780AGTGCGACAA CAGGCAATGC AAATATTACA ACCAAAACAG GTGATATCAA CGGTAAAGTT 3840GAATCCAGCT CCGGCTCTGT AACACTTGTT GCAACTGGAG CAACTCTTGC TGTAGGTAAT 3900ATTTCAGGTA ACACTGTTAC TATTACTGCG GATAGCGGTA AATTAACCTC CACAGTAGGT 3960TCTACAATTA ATGGGACTAA TAGTGTAACC ACCTCAAGCC AATCAGGCGA TATTGAAGGT 4020ACAATTTCTG GTAATACAGT AAATGTTACA GCAAGCACTG GTGATTTAAC TATTGGAAAT 4080AGTGCAAAAG TTGAAGCGAA AAATGGAGCT GCAACCTTAA CTGCTGAATC AGGCAAATTA 4140ACCACCCAAA CAGGCTCTAG CATTACCTCA AGCAATGGTC AGACAACTCT TACAGCCAAG 4200GATAGCAGTA TCGCAGGAAA CATTAATGCT GCTAATGTGA CGTTAAATAC CACAGGCACT 4260TTAACTACTA CAGGGGATTC AAAGATTAAC GCAACCAGTG GTACCTTAAC AATCAATGCA 4320AAAGATGCCA AATTAGATGG TGCTGCATCA GGTGACCGCA CAGTAGTAAA TGCAACTAAC 4380GCAAGTGGCT CTGGTAACGT GACTGCGAAA ACCTCAAGCA GCGTGAATAT CACCGGGGAT 4440TTAAACACAA TAAATGGGTT AAATATCATT TCGGAAAATG GTAGAAACAC TGTGCGCTTA 4500AGAGGCAAGG AAATTGATGT GAAATATATC CAACCAGGTG TAGCAAGCGT AGAAGAGGTA 4560ATTGAAGCGA AACGCGTCCT TGAGAAGGTA AAAGATTTAT CTGATGAAGA AAGAGAAACA 4620CTAGCCAAAC TTGGTGTAAG TGCTGTACGT TTCGTTGAGC CAAATAATGC CATTACGGTT 4680AATACACAAA ACGAGTTTAC AACCAAACCA TCAAGTCAAG TGACAATTTC TGAAGGTAAG 4740GCGTGTTTCT CAAGTGGTAA TGGCGCACGA GTATGTACCA ATGTTGCTGA CGATGGACAG 4800CAG4803(2)序列9资料(ⅰ)序列特征(A)长度1599个氨基酸(B)类型氨基酸(C)链型单(D)拓扑结构线性(ⅹⅰ)序列描述序列9Met Asn Lys Ile Tyr Arg Leu Lys Phe Ser Lys Arg Leu Asn Ala Leu1 5 10 15Val Ala Val Ser Glu Leu Thr Arg Gly Cys Asp His Ser Thr Glu Lys20 25 30Gly Ser Glu Lys Pro Val Arg Thr Lys Val Arg His Leu Ala Leu Lys35 40 45Pro Leu Ser Ala Ile Leu Leu Ser Leu Gly Met Ala Ser Ile Pro Gln50 55 60Ser Val Leu Ala Ser Gly Leu Gln Gly Met Ser Val Val His Gly Thr65 70 75 80Ala Thr Met Gln Val Asp Gly Asn Lys Thr Thr Ile Arg Asn Ser Val85 90 95Asn Ala Ile Ile Asn Trp Lys Gln Phe Asn Ile Asp Gln Asn Glu Met100 105 110Glu Gln Phe Leu Gln Glu Ser Ser Asn Ser Ala Val Phe Asn Arg Val115 120 125Thr Ser Asp Gln Ile Ser Gln Leu Lys Gly Ile Leu Asp Ser Asn Gly130 135 140Gln Val Phe Leu Tle Asn Pro Asn Gly Ile Thr Ile Gly Lys Asp Ala145 150 155 160Ile Ile Asn Thr Asn Gly Phe Thr Ala Ser Thr Leu Asp Ile Ser Asn165 170 175Glu Asn Ile Lys Ala Arg Asn Phe Thr Leu Glu Gln Thr Lys Asp Lys180 185 190Ala Leu Ala Glu Ile Val Asn His Gly Leu Ile Thr Val Gly Lys Asp195 200 205Gly Ser Val Asn Leu Ile Gly Gly Lys Val Lys Asn Glu Gly Val Ile210 215 220Ser Val Asn Gly Gly Ser Ile Ser Leu Leu Ala Gly Gln Lys Ile Thr225 230 235 240Ile Ser Asp Ile Ile Asn Pro Thr Ile Thr Tyr Ser Ile Ala Ala Pro245 250 255Glu Asn Glu Ala Ile Asn Leu Gly Asp Ile Phe Ala Lys Gly Gly Asn260 265 270Ile Asn Val Arg Ala Ala Thr Ile Arg Asn Lys Gly Lys Leu Ser Ala275 280 285Asp Ser Val Ser Lys Asp Lys Ser Gly Asn Ile Val Leu Ser Ala Lys290 295 300Glu Gly Glu Ala Glu Ile Gly Gly Val Ile Ser Ala Gln Asn Gln Gln305 310 315 320Ala Lys Gly Gly Lys Leu Met Ile Thr Gly Asp Lys Val Thr Leu Lys325 330 335Thr Gly Ala Val Ile Asp Leu Ser Gly Lys Glu Gly Gly Glu Thr Tyr340 345 350Leu Gly Gly Asp Glu Arg GIy Glu Gly Lys Asn Gly Ile Gln Leu Ala355 360 365Lys Lys Thr Thr Leu Glu Lys Gly Ser Thr Ile Asn Val Ser Gly Lys370 375 380Glu Lys Gly Gly Arg Ala Ile Val Trp Gly Asp Ile Ala Leu Ile Asp385 390 395 400Gly Asn Ile Asn Ala Gln Gly Lys Asp Ile Ala Lys Thr Gly Gly Phe405 410 415Val Glu Thr Ser Gly His Tyr Leu Ser Ile Asp Asp Asn Ala Ile Val420 425 430Lys Thr Lys Glu Trp Leu Leu Asp Pro Glu Asn Val Thr Ile Glu Ala435 440 445Pro Ser Ala Ser Arg Val Glu Leu Gly Ala Asp Arg Asn Ser His Ser450 455 460Ala Glu Val Ile Lys Val Thr Leu Lys Lys Asn Asn Thr Ser Leu Thr465 470 475 480Thr Leu Thr Asn Thr Thr Ile Ser Asn Leu Leu Lys Ser Ala His Val485 490 495Val Asn Ile Thr Ala Arg Arg Lys Leu Thr Val Asn Sar Ser Ile Ser500 505 510Ile Glu Arg Gly Ser His Leu Ile Leu His Ser Glu Gly Gln Gly Gly515 520 525Gln Gly Val Gln Ile Asp Lys Asp Ile Thr Ser Glu Gly Gly Asn Leu530 535 540Thr Ile Tyr Ser Gly Gly Trp Val Asp Val His Lys Asn Ile Thr Leu545 550 555 560Gly Ser Gly Phe Leu Asn Ile Thr Thr Lys Glu Gly Asp Ile Ala Phe565 570 575Glu Asp Lys Ser Gly Arg Asn Asn Leu Thr Ile Thr Ala Gln Gly Thr580 585 590Ile Thr Ser Gly Asn Ser Asn Gly Phe Arg Phe Asn Asn Val Ser Leu595 600 605Asn Ser Leu Gly Gly Lys Leu Ser Phe Thr Asp Ser Arg Glu Asp Arg610 615 620Gly Arg Arg Thr Lys Gly Asn Ile Ser Asn Lys Phe Asp Gly Thr Leu625 630 635 640Asn Ile Ser Gly Thr Val Asp Ile Ser Met Lys Ala Pro Lys Val Ser645 650 655Trp Phe Tyr Arg Asp Lys Gly Arg Thr Tyr Trp Asn Val Thr Thr Leu660 665 670Asn Val Thr Ser Gly Ser Lys Phe Asn Leu Ser Ile Asp Ser Thr Gly675 680 685Ser Gly Ser Thr Gly Pro Ser Ile Arg Asn Ala Glu Leu Asn Gly Ile690 695 700Thr Phe Asn Lys Ala Thr Phe Asn Ile Ala Gln Gly Ser Thr Ala Asn705 710 715 720Phe Ser Ile Lys Ala Ser Ile Met Pro Phe Lys Ser Asn Ala Asn Tyr725 730 735Ala Leu Phe Asn Glu Asp Ile Ser Val Ser Gly Gly Gly Ser Val Asn740 745 750Phe Lys Leu Asn Ala Ser Ser Ser Asn Ile Gln Thr Pro Gly Val Ile755 760 765Ile Lys Ser Gln Asn Phe Asn Val Ser Gly Gly Ser Thr Leu Asn Leu770 775 780Lys Ala Glu Gly Ser Thr Glu Thr Ala Phe Ser Ile Glu Asn Asp Leu785 790 795 800Asn Leu Asn Ala Thr Gly Gly Asn Ile Thr Ile Arg Gln Val Glu Gly805 810 815Thr Asp Ser Arg Val Asn Lys Gly Val Ala Ala Lys Lys Asn Ile Thr820 825 830Phe Lys Gly Gly Asn Ile Thr Phe Gly Ser Gln Lys Ala Thr Thr Glu835 840 845Ile Lys Gly Asn Val Thr Ile Asn Lys Asn Thr Asn Ala Thr Leu Arg850 855 860Gly Ala Asn Phe Ala Glu Asn Lys Ser Pro Leu Asn Ile Ala Gly Asn865 870 875 880Val Ile Asn Asn Gly Asn Leu Thr Thr Ala Gly Ser Ile Ile Asn Ile885 890 895Ala Gly Asn Leu Thr Val Ser Lys Gly Ala Asn Leu Gln Ala Ile Thr900 905 910Asn Tyr Thr Phe Asn Val Ala Gly Ser Phe Asp Asn Asn Gly Ala Ser915 920 925Asn Ile Ser Ile Ala Arg Gly Gly Ala Lys Phe Lys Asp Ile Asn Asn930 935 940Thr Ser Ser Leu Asn Ile Thr Thr Asn Ser Asp Thr Thr Tyr Arg Thr945 9S0 955 960Ile Ile Lys Gly Asn Ile Ser Asn Lys Ser Gly Asp Leu Asn Ile Ile965 970 975Asp Lys Lys Ser Asp Ala Glu Ile Gln Ile Gly Gly Asn Ile Ser Gln980 985 990Lys Glu Gly Asn Leu Thr Ile Ser Ser Asp Lys Val Asn Ile Thr Asn995 10001005Gln Ile Thr Ile Lys Ala Gly Val Glu Gly Gly Arg Ser Asp Ser Ser101010151020Glu Ala Glu Asn Ala Asn Leu Thr Ile Gln Thr Lys Glu Leu Lys Leu1025103010351040Ala Gly Asp Leu Asn Ile Ser Gly Phe Asn Lys Ala Glu Ile Thr Ala104510501055Lys Asn Gly Ser Asp Leu Thr Ile Gly Asn Ala Ser Gly Gly Asn Ala106010651070Asp Ala Lys Lys Val Thr Phe Asp Lys Val Lys Asp Ser Lys Ile Ser107510801085Thr Asp Gly His Asn Val Thr Leu Asn Ser Glu Val Lys Thr Ser Asn109010951100Gly Ser Ser Asn Ala Gly Asn Asp Asn Ser Thr Gly Leu Thr Ile Ser1105111011151120Ala Lys Asp Val Thr Val Asn Asn Asn Val Thr Ser His Lys Thr Ile112511301135Asn Ile Ser Ala Ala Ala Gly Asn Val Thr Thr Lys Glu Gly Thr Thr114011451150Ile Asn Ala Thr Thr Gly Ser Val Glu Val Thr Ala Gln Asn Gly Thr115511601165Ile Lys Gly Asn Ile Thr Ser Gln Asn Val Thr Val Thr Ala Thr Glu117011751180Asn Leu Val Thr Thr Glu Asn Ala Val Ile Asn Ala Thr Ser Gly Thr1185119011951200Val Asn Ile Ser Thr Lys Thr Gly Asp Ile Lys Gly Gly Ile Glu Ser120512101215Thr Ser Gly Asn Val Asn Ile Thr Ala Ser Gly Asn Thr Leu Lys Val122012251230Ser Asn Ile Thr Gly Gln Asp Val Thr Val Thr Ala Asp Ala Gly Ala123512401245Leu Thr Thr Thr Ala Gly Ser Thr Ile Ser Ala Thr Thr Gly Asn Ala125012551260Asn Ile Thr Thr Lys Thr Gly Asp Ile Asn Gly Lys Val Glu Ser Ser1265127012751280Ser Gly Ser Val Thr Leu Val Ala Thr Gly Ala Thr Leu Ala Val Gly128512901295Asn Ile Ser Gly Asn Thr Val Thr Ile Thr Ala Asp Ser Gly Lys Leu130013051310Thr Ser Thr Val Gly Ser Thr Ile Asn Gly Thr Asn Ser Val Thr Thr131513201325Ser Ser Gln Ser Gly Asp Ile Glu Gly Thr Ile Ser Gly Asn Thr Val133013351340Asn Val Thr Ala Ser Thr Gly Asp Leu Thr Ile Gly Asn Ser Ala Lys1345135013551360Val Glu Ala Lys Asn Gly Ala Ala Thr Leu Thr Ala Glu Ser Gly Lys136513701375Leu Thr Thr Gln Thr Gly Ser Ser Ile Thr Ser Ser Asn Gly Gln Thr138013851390Thr Leu Thr Ala Lys Asp Ser Ser Ile Ala G1y Asn Ile Asn Ala Ala139514001405Asn Val Thr Leu Asn Thr Thr Gly Thr Leu Thr Thr Thr Gly Asp Ser141014151420Lys Ile Asn Ala Thr Ser Gly Thr Leu Thr Ile Asn Ala Lys Asp Ala1425143014351440Lys Leu Asp Gly Ala Ala Ser Gly Asp Arg Thr Val Val Asn Ala Thr144514501455Asn Ala Ser Gly Ser Gly Asn Val Thr Ala Lys Thr Ser Ser Ser Val146014651470Asn Ile Thr Gly Asp Leu Asn Thr Ile Asn Gly Leu Asn Ile Ile Ser147514801485Glu Asn Gly Arg Asn Thr Val Arg Leu Arg Gly Lys Glu Ile Asp Val149014951500Lys Tyr Ile Gln Pro Gly Val Ala Ser Val Glu Glu Val Ile Glu Ala1505151015151520Lys Arg Val Leu Glu Lys Val Lys Asp Leu Ser Asp Glu Glu Arg Glu152515301535Thr Leu Ala Lys Leu Gly Val Ser Ala Val Arg Phe Val Glu Pro Asn154015451550Asn Ala Ile Thr Val Asn Thr Gln Asn Glu Phe Thr Thr Lys Pro Ser155515601565Ser Gln Val Thr Ile Ser Glu Gly Lys Ala Cys Phe Ser Ser Gly Asn157015751580Gly Ala Arg Val Cys Thr Asn Val Ala Asp Asp Gly Gln Gln Pro158515901595(2)序列10资料(ⅰ)序列特征(A)长度1600个氨基酸(B)类型氨基酸(C)链型单(D)拓扑结构线性(ⅹⅰ)序列描述序列10Met Asn Lys Ile Tyr Arg Leu Lys Phe Ser Lys Arg Leu Asn Ala Leu1 5 10 15Val Ala Val Ser Glu Leu Thr Arg Gly Cys Asp His Ser Thr Glu Lys20 25 30Gly Ser Glu Lys Pro Val Arg Thr Lys Val Arg His Leu Ala Leu Lys35 40 45Pro Leu Ser Ala Ile Leu Leu Ser Leu Gly Met Ala Ser Ile Pro Gln50 55 60Ser Val Leu Ala Ser Gly Leu Gln Gly Met Ser Val Val His Gly Thr65 70 75 80Ala Thr Met Gln Val Asp Gly Asn Lys Thr Thr Ile Arg Asn Ser Val85 90 95Asn Ala Ile Ile Asn Trp Lys Gln Phe Asn Ile Asp Gln Asn Glu Met100 105 110Glu Gln Phe Leu Gln Glu Ser Ser Asn Ser Ala Val Phe Asn Arg Val115 120 125Thr Ser Asp Gln Ile Ser Gln Leu Lys Gly Ile Leu Asp Ser Asn Gly130 135 140Gln Val Phe Leu Ile Asn Pro Asn Gly Ile Thr Ile Gly Lys Asp Ala145 150 155 160Ile Ile Asn Thr Asn Gly Phe Thr Ala Ser Thr Leu Asp Ile Ser Asn165 170 175Glu Asn Ile Lys Ala Arg Asn Phe Thr Leu Glu Gln Thr Lys Asp Lys180 185 190Ala Leu Ala Glu Ile Val Asn His Gly Leu Ile Thr Val Gly Lys Asp195 200 205Gly Ser Val Asn Leu Ile Gly Gly Lys Val Lys Asn Glu Gly Val Ile210 215 220Ser Val Asn Gly Gly Ser Ile Ser Leu Leu Ala Gly Gln Lys Ile Thr225 230 235 240Ile Ser Asp Ile Ile Asn Pro Thr Ile Thr Tyr Ser Ile Ala Ala Pro245 250 255Glu Asn Glu Ala Ile Asn leu Gly Asp Ile Phe Ala Lys Gly Gly Asn260 265 270Ile Asn Val Arg Ala Ala Thr Ile Arg Asn Lys Gly Lys Leu Ser Ala275 280 285Asp Ser Val Ser Lys Asp Lys Ser Gly Asn Ile Val Leu Ser Ala Lys290 295 300Glu Gly Glu Ala Glu Ile Gly Gly Val Ile Ser Ala Gln Asn Gln Gln305 310 315 320Ala Lys Gly Gly Lys Leu Met Ile Thr Gly Asp Lys Val Thr Leu Lys325 330 335Thr Gly Ala Val Ile Asp Leu Ser Gly Lys Glu Gly Gly Glu Thr Tyr340 345 350Leu Gly Gly Asp Glu Arg Gly Glu Gly Lys Asn Gly Ile Gln Leu Ala355 360 365Lys Lys Thr Thr Leu Glu Lys Gly Ser Thr Ile Asn Val Ser Gly Lys370 375 380Glu Lys Gly Gly Arg Ala Ile Val Trp Gly Asp Ile Ala Leu Ile Asp385 390 395 400Gly Asn Ile Asn Ala Gln Gly Ser Asp Ile Ala Lys Thr Gly Gly Phe405 410 415Val Glu Thr Ser Gly His Asp Leu Ser Ile Gly Asp Asp Val Ile Val420 425 430Asp Ala Lys Glu Trp Leu Leu Asp Pro Asp Asp Val Ser Ile Glu Thr435 440 445Leu Thr Ser Gly Arg Asn Asn Thr Gly Glu Asn Gln Gly Tyr Thr Thr450 455 460Gly Asp Gly Thr Lys Glu Ser Pro Lys Gly Asn Ser Ile Ser Lys Pro465 470 475 480Thr Leu Thr Asn Ser Thr Leu Glu Gln Ile Leu Arg Arg Gly Ser Tyr485 490 495Val Asn Ile Thr Ala Asn Asn Arg Ile Tyr Val Asn Ser Ser Ile Asn500 505 510Leu Ser Asn Gly Ser Leu Thr Leu His Thr Lys Arg Asp Gly Val Lys515 520 525Ile Asn Gly Asp Ile Thr Ser Asn Glu Asn Gly Asn Leu Thr Ile Lys530 535 540Ala Gly Ser Trp Val Asp Val His Lye Asn Ile Thr Leu Gly Thr Gly545 550 555 560Phe Leu Asn Ile Val Ala Gly Asp Ser Val Ala Phe Glu Arg Glu Gly565 570 575Asp Lys Ala Arg Asn Ala Thr Asp Ala Gln Ile Thr Ala Gln Gly Thr580 585 590Ile Thr Val Asn Lys Asp Asp Lys Gln Phe Arg Phe Asn Asn Val Ser595 600 605Leu Asn Gly Thr Gly Lys Gly Leu Lys Phe Ile Ala Asn Gln Asn Asn610 615 620Phe Thr His Lys Phe Asp Gly Glu Ile Asn Ile ser Gly Ile Val Thr625 630 635 640Ile Asn Gln Thr Thr Lys Lys Asp Val Lys Tyr Trp Asn Ala Ser Lys645 650 655Asp Ser Tyr Trp Asn Val Ser Ser Leu Thr Leu Asn Thr Val Gln Lys660 665 670Phe Thr Phe Ile Lys Phe Val Asp Ser Gly Ser Asn Gly Gln Asp Leu675 680 685Arg Ser Ser Arg Arg Ser Phe Ala Gly Val His Phe Asn Gly Ile Gly690 695 700Gly Lys Thr Asn Phe Asn Ile Gly Ala Asn Ala Lys Ala Leu Phe Lys705 710 715 720Leu Lys Pro Asn Ala Ala Thr Asp Pro Lys Lys Glu Leu Pro Ile Thr725 730 735Phe Asn Ala Asn Ile Thr Ala Thr Gly Asn Ser Asp Ser Ser Val Met740 745 750Phe Asp Ile His Ala Asn Leu Thr Ser Arg Ala Ala Gly Ile Asn Met755 760 765Asp Ser Ile Asn Ile Thr Gly Gly Leu Asp Phe Ser Ile Thr Ser His770 775 780Asn Arg Asn Ser Asn Ala Phe Glu Ile Lys Lys Asp Leu Thr Ile Asn785 790 795 800Ala Thr Gly Ser Asn Phe Ser Leu Lys GLn Thr Lys Asp Ser Phe Tyr805 810 815Asn Glu Tyr Ser Lys His Ala Ile Asn Ser Ser His Asn Leu Thr Ile820 825 830Leu Gly Gly Asn Val Thr Leu Gly Gly Glu Asn Ser Ser Ser Ser Ile835 840 845Thr Gly Asn Ile Asn Ile Thr Asn Lys Ala Asn Val Thr Leu Gln Ala850 855 860Asp Thr Ser Asn Ser Asn Thr Gly Leu Lys Lys Arg Thr Leu Thr Leu865 870 875 880Gly Asn Ile Ser Val Glu Gly Asn Leu Ser Leu Thr Gly Ala Asn Ala885 890 895Asn Ile Val Gly Asn Leu Ser Ile Ala Glu Asp Ser Thr Phe Lys Gly900 905 910Glu Ala Ser Asp Asn Leu Asn Ile Thr Gly Thr Phe Thr Asn Asn Gly915 920 925Thr Ala Asn Ile Asn Ile Lys Gly Val Val Lys Leu Gly Asp Ile Asn930 935 940Asn Lys Gly Gly Leu Asn Ile Thr Thr Asn Ala Ser Gly Thr Gln Lys945 950 955 960Thr Ile Ile Asn Gly Asn Ile Thr Asn Glu Lys Gly Asp Leu Asn Ile965 970 975Lys Asn Ile Lys Ala Asp Ala Glu Ile Gln Ile Gly Gly Asn Ile Ser980 985 990Gln Lys Glu Gly Asn Leu Thr Ile Ser Ser Asp Lys Val Asn Ile Thr995 10001005Asn Gln Ile Thr Ile Lys Ala Gly Val Glu Gly Gly Arg Ser Asp Ser101010151020Ser Glu Ala Glu Asn Ala Asn Leu Thr Ile Gln Thr Lys Glu Leu Lys1025103010351040Leu Ala Gly Asp Leu Asn Ile Ser Gly Phe Asn Lys Ala Glu Ile Thr104510501055Ala Lys Asn Gly Ser Asp Leu Thr Ile Gly Asn Ala Ser Gly Gly Asn106010651070Ala Asp Ala Lys Lys Val Thr Phe Asp Lys Val Lys Asp Ser Lys Ile107510801085Ser Thr Asp Gly His Asn Val Thr Leu Asn Ser Glu Val Lys Thr Ser109010951100Asn Gly Ser Ser Asn Ala Gly Asn Asp Asn Ser Thr Gly Leu Thr Ile1105111011151120Ser Ala Lys Asp Val Thr Val Asn Asn Asn Val Thr Ser His Lys Thr112511301135Ile Asn Ile Ser Ala Ala Ala Gly Asn Val Thr Thr Lys Glu Gly Thr114011451150Thr Ile Asn Ala Thr Thr Gly Ser Val Glu Val Thr Ala Gln Asn Gly115511601165Thr Ile Lys Gly Asn Ile Thr Ser Gln Asn Val Thr Val Thr Ala Thr117011751180Glu Asn Leu Val Thr Thr Glu Asn Ala Val Ile Asn Ala Thr Ser Gly1185119011951200Thr Val Asn Ile Ser Thr Lys Thr Gly Asp Ile Lys Gly Gly Ile Glu120512101215Ser Thr Ser Gly Asn Val Asn Ile Thr Ala Ser Gly Asn Thr Leu Lys122012251230Val Ser Asn Ile Thr Gly Gln Asp Val Thr VaI Thr Ala Asp Ala Gly123512401245Ala Leu Thr Thr Thr Ala Gly Ser Thr Ile Ser Ala Thr Thr Gly Asn125012551260Ala Asn Tle Thr Thr Lys Thr Gly Asp Ile Asn Gly Lys Val Glu Ser1265127012751280Ser Ser Gly Ser Val Thr Leu Val Ala Thr Gly Ala Thr Leu Ala Val128512901295Gly Asn Ile Ser Gly Asn Thr Val Thr Ile Thr Ala Asp Ser Gly Lys130013051310Leu Thr Ser Thr Val Gly Ser Thr Ile Asn Gly Thr Asn Ser Val Thr131513201325Thr Ser Ser Gln Ser Gly Asp Ile Glu Gly Thr Ile Ser Gly Asn Thr133013351340Val Asn Val Thr Ala Ser Thr Gly Asp Leu Thr Ile Gly Asn Ser Ala1345135013551360Lys Val Glu Ala Lys Asn Gly Ala Ala Thr Leu Thr Ala Glu Ser Gly136513701375Lys Leu Thr Thr Gln Thr Gly Ser Ser Ile Thr Ser Ser Asn Gly Gln138013851390Thr Thr Leu Thr Ala Lys Asp Ser Ser Ile Ala Gly Asn Ile Asn Ala139514001405Ala Asn Val Thr Leu Asn Thr Thr Gly Thr Leu Thr Thr Thr Gly Asp141014151420Ser Lys Ile Asn Ala Thr Ser Gly Thr Leu Thr Ile Asn Ala Lys Asp1425143014351440Ala Lys Leu Asp Gly Ala Ala Ser Gly Asp Arg Thr Val Val Asn Ala144514501455Thr Asn Ala Ser Gly Ser Gly Asn Val Thr Ala Lys Thr Ser Ser Ser146014651470Val Asn Ile Thr Gly Asp Leu Ash Thr Ile Asn Gly Leu Asn Ile Ile147514801485Ser Glu Asn Gly Arg Asn Thr Val Arg Leu Arg Gly Lys Glu Ile Asp149014951500Val Lys Tyr Ile Gln Pro Gly Val Ala Ser Val Glu Glu Val Ile Glu1505151015151520Ala Lys Arg Val Leu Glu Lys Val Lys Asp Leu Ser Asp Glu Glu Arg152515301535Glu Thr Leu Ala Lys Leu Gly Val Ser Ala Val Arg Phe Val Glu Pro154015451550Asn Asn Ala Ile Thr Val Asn Thr Gln Asn Glu Phe Thr Thr Lys Pro155515601565Ser Ser Gln Val Thr Ile Ser Glu Gly Lys Ala Cys Phe Ser Ser Gly157015751580Asn Gly Ala Arg Val Cys Thr Asn Val Ala Asp Asp Gly Gln Gln Pro1585159015951600(2)序列11资料(ⅰ)序列特征(A)长度29个氨基酸(B)类型氨基酸(C)链型单(D)拓扑结构线性(ⅹⅰ)序列描述序列11Val Asp Glu Val Ile Glu Ala Lys Arg Ile Leu Glu Lys Val Lys Asp1 5 10 15Leu Ser Asp Glu Glu Arg Glu Ala Leu Ala Lys Leu Gly20 2权利要求
1.一种分离并纯化的核酸分子,编码一种不可分型的嗜血菌属菌株的高分子量蛋白(HMW)HMW3或HMW4或保留了该蛋白的预防由不可分型的嗜血菌属菌株引起的疾病的免疫能力的该蛋白的变体或片段,所述核酸分子具有(a)图8所示的DNA序列(序列7),并且编码具有图10所示的衍生氨基酸序列(序列9)的蛋白HMW3,或(b)图9所示的DNA序列(序列8),并且编码具有图10所示氨基酸序列(序列10)的蛋白HMW4。
2.一种分离并纯化的核酸分子,编码一种不可分型的嗜血菌属菌株的高分子量蛋白(HMW),所述核酸分子选自由下列DNA序列构成的一组(a)如图8和9中任一个所示的DNA序列(序列7和8);(b)编码图10所示氨基酸序列(序列9和10)的DNA序列;或(c)编码一种不可分型的嗜血菌属菌株的高分子量蛋白的DNA序列,该序列能在严格的条件下与所述DNA序列(a)和(b)中的任一个杂交。
3.如权利要求2的核酸分子,其特征在于所述DNA序列(c)与DNA序列(a)或(b)至少具有大约90%的相同性。
4.一种用于转化一种宿主的载体,包括权利要求2所述的核酸分子。
5.一种分离并纯化的不可分型的嗜血菌属的高分子量(HMW)蛋白,或保留了该蛋白的预防由不可分型的嗜血菌属菌株引起的疾病免疫能力的该蛋白的任何变体或片段,其特征在于至少一个表面外露的B-细胞表位是由单克隆抗体AD6识别的。
6.如权利要求5的蛋白,它是由图1所示DNA序列(序列1)编码的HMW1,它具有图2所示的衍生氨基酸序列(序列2),而且,其表观分子量为125kDa。
7.如权利要求5的蛋白,它是由图3所示DNA序列(序列3)编码的HMW2,它具有图4所示的衍生氨基酸序列(序列4),而且,其表观分子量为120kDa。
8.如权利要求5的蛋白,它是由图8所示DNA序列(序列7)编码的HMW3,它具有图10所示的衍生氨基酸序列(序列9),并且,其表观分子量为125kDa。
9.如权利要求5的蛋白,它是由图9所示DNA序列(序列8)编码的HMW4,它具有图10所示的衍生氨基酸序列(序列10),并且,其表观分子量为123kDa。
10.一种缀合物,包括与一种抗原、半抗原或多糖连接的如权利要求5所述的蛋白,用于诱发对所述抗原、半抗原或多糖的免疫反应。
11.如权利要求10的缀合物,其特征在于所述多糖是一种针对b型流感嗜血菌(Haemophilus influenzae)的保护性多糖。
12.一种合成肽,具有一个包括至少6个氨基酸但又不超过150个氨基酸的氨基酸序列,该氨基酸序列对应于不可分型的流感嗜血菌的高分子量蛋白HMW1、HMW2、HMW3或HMW4的至少一个保护性表位,其特征在于所述表位是由单克隆抗体AD6和10C5中的至少一个识别的。
13.如权利要求12的肽,其特征在于所述表位位于HMW1或HMW2蛋白的羧基末端的75个氨基酸中。
全文摘要
披露了具有免疫原特性的不可分型的流感嗜血菌的高分子量表面蛋白,和编码这种蛋白的基团。具体地讲,已对编码两种免疫显性高分子量蛋白HMW1和HMW2的基因进行了克隆、表达和测序,同时,也对编码高分子量蛋白HMW3和HMW4的基因进行了克隆、表达和测序。
文档编号C07H21/04GK1222914SQ97195173
公开日1999年7月14日 申请日期1997年4月1日 优先权日1997年4月1日
发明者斯蒂芬·J·巴伦卡姆普 申请人:斯蒂芬·J·巴伦卡姆普
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1