用于结核病诊断的化合物和方法

文档序号:450190阅读:802来源:国知局
专利名称:用于结核病诊断的化合物和方法
技术领域
本发明总的来说涉及结核分枝杆菌感染的检测。更具体地说本发明涉及包含结核分枝杆菌抗原,或其部分或其它变体的多肽,以及这些多肽在结核分枝杆菌感染的血清学诊断上的用途。
背景技术
结核病是一种慢性传染病,一般由结核分枝杆菌感染引起。它在发展中国家是一种主要的疾病,在世界上发达地区也是一个日益严重的问题,每年有约8百万新病例和3百万人死亡。虽然感染可以在相当长一段时间内无症状,但是该疾病最常见地表现为急性肺炎,导致发热和非排痰性咳嗽。如果不进行治疗,则常常会出现严重的并发症并导致死亡。
虽然一般地可以采用多种抗生素控制结核病,但这样的治疗不足以阻止该疾病的传播。传染的个体可以是无症状的,但有时是传染性的。此外,虽然符合治疗方案是关键性的,但患者的行为难以监测。某些患者不完成治疗过程,这可以导致无效的治疗并产生药物抗性。
抑制结核病的传播需要有效的免疫接种和准确地早期诊断该疾病。当前,用活细菌接种是诱导保护性免疫最有效的方法。用于这一目的的最普通的分枝杆菌属是卡介苗(BCG)和牛型分枝杆菌的无毒菌株。然而,BCG的安全性和有效性上存在争议,并且一些国家(如,美国)不接种一般公众。诊断一般利用皮试进行,这牵涉到真皮内接触结核菌素PPD(纯化的蛋白质衍生物)。在注射之后48-72小时,抗原特异性T细胞反应在注射部位导致可测量的潜伏(incubation),这表明接触到分枝杆菌抗原。然而,这一实验的灵敏度和特异性一直存在问题,用BCG接种的个体与感染的个体不能区别。
虽然巨噬细胞已显示出作为结核分枝杆菌免疫性的主要的效应细胞,但T细胞是这种免疫性的主要的诱导物。T细胞在针对结核分枝杆菌感染的保护中的十分重要的作用由在爱滋病患者中结核分枝杆菌频繁发生说明,因为CD4 T细胞的耗竭与人免疫缺损病毒(HIV)感染相关。分枝杆菌属反应性CD4 T细胞已显示出是γ-干扰素(IFN-γ)的有力的生产者,后者依次已显示出在小鼠中触发巨噬细胞的抗分枝杆菌作用。尽管IFN-γ在人类中的作用还不太清楚,但研究已表明1,25-二羟基-维生素D3单独或与IFN-γ或肿瘤坏死因子-α一道激活人巨噬细胞以阻止结核分枝杆菌感染。此外,已知IFN-γ刺激人巨噬细胞产生1,25-二羟基-维生素D3。同样地,IL-12已显示出在刺激对结核分枝杆菌感染的抗性中起作用。有关结核分枝杆菌感染的免疫学参见Chan和Kaufmann,结核病病理,预防和治疗,Boom(编者),ASM出版社,华盛顿,DC,1994。
因此,本领域需要用于检测结核病的改进的诊断方法。本发明满足了这一需要并进一步提供了其它相关优点。
发明概要简言之,本发明提供了用于诊断结核病的组合物和方法。在一个方面,本发明提供了一些多肽,这些多肽包含可溶性结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的抗原性部分。在这一方面的一个实施方案中,所说的可溶性抗原具有一种以下N端序列(a)Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Cys-Asn-Tyr-Gly-Gln-Val-Val-Ala-Ala-Leu(SEQ ID No.115);(b)Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-Ser(SEQ ID No.116);(c)Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-Leu-Glu-Ala-Ala-Lys-Glu-Gly-Arg(SEQ ID No.117);(d)Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-Pro(SEQ ID No.118);(e)Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val(SEQ ID No.119);(f)Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro
(SEQ ID No.120);(g)Asp-Pro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Thr-Ala-Ala-Ser-Pro-Pro(SEQ ID No.121);(h)Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-Gly(SEQ ID No.122);(i)Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Leu-Thr-Ser-Leu-Leu-Asn-Ser-Leu-Ala-Asp-Pro-Asn-Val-Ser-Phe-Ala-Asn(SEQ ID No.123);和(j)Xaa-Asp-Ser-Glu-Lys-Ser-Ala-Thr-Ile-Lys-Val-Thr-Asp-Ala-Ser;(SEQ ID No.129)(k)Ala-Gly-Asp-Thr-Xaa-Ile-Tyr-Ile-Val-Gly-Asn-Leu-Thr-Ala-Asp;(SEQ ID No.130)或(l)Ala-Pro-Glu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-Ala-Gly;(SEQ ID No.131)其中Xaa可以是任何氨基酸。
在一个相关的方面,本发明提供了一些多肽,这些多肽包含结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的免疫原性部分,所说的抗原具有一种以下的N端序列(m)Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-Ile-Asn-Val-His-Leu-Val;(SEQ ID No.132)或(n)Asp-Pro-Pro-Asp-Pro-His-Gln-Xaa-Asp-Met-Thr-Lys-Gly-Tyr-Tyr-Pro-Gly-Gly-Arg-Arg-Xaa-Phe;(SEQ ID No.124),其中Xaa可以是任何氨基酸。
在另一个实施方案中,所说的抗原包含可溶性结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的抗原性部分,其中所说的抗原包含由选自下组的DNA序列编码的氨基酸序列SEQ ID No.1,2,4-10,13-25,52,94和96中所示的序列、这些序列的补体、以及在中等严格条件下与SEQ ID No.1,2,4-10,13-25,52,94和96中所示的序列杂交的DNA序列或它们的补体。
在一个相关的方面,所说的多肽包含结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的抗原性部分,其中所说的抗原包含由选自下组的DNA序列编码的氨基酸序列SEQ ID No.26-51中所示的序列、这些序列的补体、和在中等严格条件下与SEQ ID No.26-51中所示的序列杂交的DNA序列或它们的补体。
在一个相关的方面,本发明提供了编码上述多肽的DNA序列,包含这些DNA序列的重组表达载体和用这样的表达载体转化或转染的宿主细胞。
另一方面,本发明提供了包含第一与第二发明多肽或者是发明多肽与已知的结核分枝杆菌抗原的融合蛋白。
主题发明的另一方面提供了用于在病人中检测结核病的方法和诊断试剂盒,所说的方法包括(a)使生物样品与至少一种上述多肽接触;和(b)在样品中检测结合到所说多肽上的抗体的存在,由此在生物样品中检测结核分枝杆菌感染。合适的生物样品包括全血,痰、血清、血浆、唾液、脑脊液和尿。所说的诊断试剂盒包含一种或多种上述多肽以及检测试剂。
本发明也提供了用于检测结核分枝杆菌感染的方法,该方法包括(a)从患者中获得生物样品;(b)使所说的样品与聚合酶链反应中的第一和第二寡核苷酸引物接触,所说的第一和第二寡核苷酸引物包含编码上述多肽的DNA序列的至少约10个邻接的核苷酸;和(c)在样品中检测在第一和第二寡核苷酸引物存在下扩增的DNA序列。
在另一方面,本发明提供了用于在病人中检测结核分枝杆菌感染的方法,该方法包括(a)从患者中获得生物样品;(b)使样品与寡核苷酸探针接触,所说探针包含编码上述多肽的DNA序列的至少约15个邻接核苷酸;和(c)在样品中检测杂交到所说寡核苷酸探针上的DNA序列。
另一方面,本发明提供了结合到以上所述的多肽上的多克隆和单克隆抗体两者以及将它们用于检测结核分枝杆菌感染的方法。
参照下列详细描述和附图,本发明的这些和其他方面会很清楚。本文所公开的所有参考文献与它们单个并入作为参考一样,以它们的整体由本文一并参考。
附图和序列识别号的简要描述

图1A和B说明实施例1中描述的14Kd、20Kd和26Kd抗原对分别来源于第一和第二结核分枝杆菌免疫供体的T细胞的增殖和干扰素-γ产生的刺激作用。
图2说明与细菌溶解产物的反应性比较,两种代表性多肽与结核分枝杆菌感染的和未感染的个体的血清的反应性。
图3显示与38kD抗原的反应性比较,四种代表性多肽与结核分枝杆菌感染的和未感染的个体的血清的反应性。
图4显示重组38kD和TbRall抗原与结核分枝杆菌患者、PPD阳性供体和正常供体的血清的反应性。
图5显示抗原TbRa2A与38kD阴性血清的反应性。
图6显示SEQ ID No.60的抗原与结核分枝杆菌患者和正常供体的血清的反应性。SEQ ID No.1是TbRal的DNA序列。SEQ ID No.2是TbRal0的DNA序列。SEQ ID No.3是TbRal1的DNA序列。SEQ ID No.4是TbRal2的DNA序列。SEQ ID No.5是TbRal3的DNA序列。SEQ ID NO.6是TbRal6的DNA序列。SEQ ID NO.7是TbRal7的DNA序列。SEQ ID NO.8是TbRal8的DNA序列。SEQ ID NO.9是TbRal9的DNA序列。SEQ ID NO.10是TbRa24的DNA序列。SEQ ID NO.11是TbRa26的DNA序列。SEQ ID NO.12是TbRa28的DNA序列。SEQ ID NO.13是TbRa29的DNA序列。SEQ ID NO.14是TbRa2A的DNA序列。SEQ ID NO.15是TbRa3的DNA序列。SEQ ID NO.16是TbRa32的DNA序列。SEQ ID NO.17是TbRa35的DNA序列。SEQ ID NO.18是TbRa36的DNA序列。SEQ ID NO.19是TbRa4的DNA序列。SEQ ID NO.20是TbRa9的DNA序列。SEQ ID NO.21是TbRaB的DNA序列。SEQ ID NO.22是TbRaC的DNA序列。SEQ ID NO.23是TbRaD的DNA序列。SEQ ID NO.24是YYWCPG的DNA序列。SEQ ID NO.25是AAMK的DNA序列。SEQ ID NO.26是TbL-23的DNA序列。SEQ ID NO.27是TbL-24的DNA序列。SEQ ID NO.28是TbL-25的DNA序列。SEQ ID NO.29是TbL-28的DNA序列。SEQ ID NO.30是TbL-29的DNA序列。SEQ ID NO.31是TbH-5的DNA序列。SEQ ID NO.32是TbH-8的DNA序列。SEQ ID NO.33是TbH-9的DNA序列。SEQ ID NO.34是TbM-1的DNA序列。SEQ ID NO.35是TbM-3的DNA序列。SEQ ID NO.36是TbM-6的DNA序列。SEQ ID NO.37是TbM-7的DNA序列。SEQ nD No.38是TbM-9的DNA序列。SEQ ID NO.39是TbM-12的DNA序列。SEQ ID NO.40是TbM-13的DNA序列。SEQ ID NO.41是TbM-14的DNA序列。SEQ ID NO.42是TbM-15的DNA序列。SEQ ID NO.43是TbH-4的DNA序列。SEQ ID NO.44是TbH4-FWD的DNA序列。SEQ ID NO.45是TbH-12的DNA序列。SEQ ID NO.46是Tb38-1的DNA序列。SEQ ID NO.47是Tb38-4的DNA序列。SEQ ID NO.48是TbL-17的DNA序列。SEQ ID NO.49是TbL-20的DNA序列。SEQ ID NO.50是TbL-21的DNA序列。SEQ ID NO.51是TbH-16的DNA序列。SEQ ID NO.52是DPEP的DNA序列。SEQ ID NO.53是DPEP的推定的氨基酸序列。SEQ ID NO.54是DPV N-端抗原的蛋白质序列。SEQ ID NO.55是AVGS N-端抗原的蛋白质序列。SEQ ID NO.56是AAMK N-端抗原的蛋白质序列。SEQ ID NO.57是YYWC N-端抗原的蛋白质序列。SEQ ID NO.58是DIGS N-端抗原的蛋白质序列。SEQ ID NO.59是AEES N-端抗原的蛋白质序列。SEQ ID NO.60是DPEP N-端抗原的蛋白质序列。SEQ ID NO.61是APKT N-端抗原的蛋白质序列。SEQ ID NO.62是DPAS N-端抗原的蛋白质序列。SEQ ID NO.63是TbM-1肽的推定的氨基酸序列。SEQ ID NO.64是TbRal的推定的氨基酸序列。SEQ ID NO.65是TbRal0的推定的氨基酸序列。SEQ ID NO.66是TbRal1的推定的氨基酸序列。SEQ ID NO.67是TbRal2的推定的氨基酸序列。SEQ ID NO.68是TbRal3的推定的氨基酸序列。SEQ iD NO.69是TbRal6的推定的氨基酸序列。SEQ ID NO.70是TbRal7的推定的氨基酸序列。SEQ ID NO.71是TbRal8的推定的氨基酸序列。SEQ ID NO.72是TbRal9的推定的氨基酸序列。SEQ ID NO.73是TbRa24的推定的氨基酸序列。SEQ ID NO.74是TbRa26的推定的氨基酸序列。SEQ ID NO.75是TbRa28的推定的氨基酸序列。SEQ ID NO.76是TbRa29的推定的氨基酸序列。SEQ ID NO.77是TbRa2A的推定的氨基酸序列。SEQ ID NO.78是TbRa3的推定的氨基酸序列。SEQ ID NO.79是TbRa32的推定的氨基酸序列。SEQ ID NO.80是TbRa35的推定的氨基酸序列。SEQ ID NO.81是TbRa36的推定的氨基酸序列。SEQ ID NO.82是TbRa4的推定的氨基酸序列。SEQ ID NO.83是TbRa9的推定的氨基酸序列。SEQ ID NO.84是TbRaB的推定的氨基酸序列。SEQ ID NO.85是TbRaC的推定的氨基酸序列。SEQ ID NO.86是TbRaD的推定的氨基酸序列。SEQ ID NO.87是YYWCPG的推定的氨基酸序列。SEQ ID NO.88是TbAAMK的推定的氨基酸序列。SEQ ID NO.89是Tb38-1的推定的氨基酸序列。SEQ ID NO.90是TbH-4的推定的氨基酸序列。SEQ ID NO.91是TbH-8的推定的氨基酸序列。SEQ ID NO.92是TbH-9的推定的氨基酸序列。SEQ ID NO.93是TbH-12的推定的氨基酸序列。SEQ ID NO.94是DPAS的DNA序列。SEQ ID NO.95是DPAS的推定的氨基酸序列。SEQ ID NO.96是DPV的DNA序列。SEQ ID NO.97是DPV的推定的氨基酸序列。SEQ ID NO.98是ESAT-6的DNA序列。SEQ ID NO.99是ESAT-6的推定的氨基酸序列。SEQ ID NO.100是TbH-8-2的DNA序列。SEQ ID NO.101是TbH-9FL的DNA序列。SEQ ID NO.102是TbH-9FL的推定的氨基酸序列。SEQ ID NO.103是TbH-9-1的DNA序列。SEQ ID NO.104是TbH-9-1的推定的氨基酸序列。SEQ ID NO.105是TbH-9-4的DNA序列。SEQ ID NO.106是TbH-9-4的推定的氨基酸序列。SEQ ID NO.107是Tb38-1F2 IN的DNA序列。SEQ ID NO.108是Tb38-1F2 RP的DNA序列。SEQ ID NO.109是Tb37-FL的推定的氨基酸序列。SEQ ID NO.110是Tb38-IN的推定的氨基酸序列。SEQ ID NO.111是Tb38-1F3的DNA序列。SEQ ID NO.112是Tb38-1F3的推定的氨基酸序列。SEQ ID NO.113是Tb38-1F5的DNA序列。SEQ ID NO.114是Tb38-1F6的DNA序列。SEQ ID NO.115是DPV的推定的N-端氨基酸序列。SEQ ID NO.116是AVGS的推定的N-端氨基酸序列。SEQ ID NO.117是AAMK的推定的N-端氨基酸序列。SEQ ID NO.118是YYWC的推定的N-端氨基酸序列。SEQ ID NO.119是DIGS的推定的N-端氨基酸序列。SEQ ID NO.120是AAES的推定的N-端氨基酸序列。SEQ ID NO.121是DPEP的推定的N-端氨基酸序列。SEQ ID NO.122是APKT的推定的N-端氨基酸序列。SEQ ID NO.123是DPAS的推定的N-端氨基酸序列。SEQ ID NO.124是DPPD N-端抗原的蛋白质序列。SEQ ID NO.125-128是四种DPPD溴化氰片段的蛋白质序列。SEQ ID NO.129是XDS抗原的N-端蛋白质序列。SEQ ID NO.130是AGD抗原的N-端蛋白质序列。SEQ ID NO.131是APE抗原的N-端蛋白质序列。SEQ ID NO.132是XYI抗原的N-端蛋白质序列。
发明详述如上所述,本发明总的来说涉及诊断结核病的组合物和方法。本发明的组合物包含一些多肽,这些多肽包含结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的至少一种抗原性部分。在本发明的范围内的多肽包括,但不限于,可溶性结核分枝杆菌抗原。"可溶性结核分枝杆菌抗原"是存在于结核分枝杆菌培养物滤液中的结核分枝杆菌源的蛋白质。如本文所使用的,术语"多肽"包括任何长度的氨基酸链,包括全长蛋白质(即,抗原),其中的氨基酸残基由共价肽键连接。这样,包含上述一种抗原的抗原性部分的多肽可以是完全由抗原性部分组成的,或者可以含有附加序列。所说的附加序列可以是来源于天然结核分枝杆菌抗原或者可以是异源的,这样的序列可以是(但不需要是)抗原性的。
抗原的"抗原性部分"(可以是也可以不是可溶性的)是能够与从结核分枝杆菌感染个体获得的血清反应的部分(即,在本文描述的代表性ELISA测定中,用感染个体的血清产生的吸收读数至少在用未感染个体血清获得的吸收的三个标准偏差以上)。"结核分枝杆菌感染个体"是已由结核分枝杆菌感染的人(例如,具有直径至少0.5cm的对PPD的真皮内皮试反应)。感染个体可以显示出结核病的症状,或可以是无疾病症状的。通常可以单独或组合使用包含本文描述的一种或多种结核分枝杆菌抗原的至少一种抗原性部分的多肽,以在患者中检测结核病。
本发明的组合物与方法也包括上述多肽的变体。如本文所使用的"变体"是仅在保守取代和/或修饰上不同于天然抗原(以便所述多肽的抗原性特性得到保留)的多肽。通过采用本文描述的代表性方法修饰一种上述多肽序列并评价修饰的多肽的抗原性特性可以一般性地鉴别这样的变体。
"保守取代"是这样一种取代,其中一种氨基酸取代具有类似性质的另一种氨基酸,以便肽化学领域的技术人员可以期望多肽的二级结构与亲水性质实质上不变。一般来说,下组氨基酸代表保守取代(1)ala、pro、gly、glu、asp、gln、asn、ser、thr;(2)cys、ser、tyr、thr;(3)val、ile、leu、met、ala、phe;(4)lys、arg、his;和(5)phe、tyr、trp、his。
变体也可以(或选择性地)是由例如氨基酸缺失或者添加(对多肽抗原性特性,二级结构和亲水性质具有最小限度的影响)修饰的。例如,多肽可以连结到蛋白质N端的信号(或前导)序列上,后者共翻译或翻译后指导蛋白质的转移。所述多肽也可以连结到使多肽容易合成,纯化以及鉴定或增强多肽结合到固相支持物上的接头和其他序列(例如poly-His)上。例如,多肽可以连结到免疫球蛋白Fc区上。
在一个相关的方面,本文公开了组合多肽。"组合多肽"是包含至少一种上述抗原性部分和一种或多种附加抗原性结核分枝杆菌序列(其经由肽键连接到单一的氨基酸链上)的多肽。所述的序列可以直接连接(即没有间插氨基酸)或通过不明显降低组成多肽的抗原性特性的接头序列(例如,Gly-Cys-Gly)连接。
一般来说,结核分枝杆菌抗原,编码这种抗原的DNA序列,可以多种方法的任何一种制备。例如,可溶性抗原可以用本领域技术人员已知的方法,包括阴离子交换、反相层析从结核分枝杆菌培养物滤液分离。纯化的抗原可以就所需的性质进行评价,所述性质例如与从结核分枝杆菌感染个体获得的血清的反应能力。这样的筛选可以用本文描述的代表性方法完成。可以利用例如传统的Edman化学对抗原进行部分测序。参见Edman和Berg,欧洲生物化学杂志,80116-132,1967。
也可以用编码抗原的DNA序列(已插入到表达载体中并在合适的宿主中表达)重组产生抗原。可以通过用特异性抗可溶性结核分枝杆菌抗原产生的抗血清(例如兔)筛选合适的结核分枝杆菌表达文库来分离编码可溶性抗原的DNA分子。可以用从感染了结核分枝杆菌的病人获得的血清筛选合适的结核分枝杆菌基因组或者cDNA表达文库鉴别编码抗原(抗原可以是或者可以不是可溶性的)的DNA序列。这样的筛选一般可以利用本领域已知的技术完成,例如在Sambrook等,分子克隆实验室手册,冷泉港实验室,冷泉港,NY,1989中所描述的那些。
编码可溶性抗原的DNA序列也可以通过就与简并寡核苷酸(该寡核苷酸来源于分离的可溶性抗原的部分氨基酸序列)杂交的DNA序列筛选适当的结核分枝杆菌cDNA或基因组DNA文库来获得。可以如(例如)Sambrook等,分子克隆实验室手册,冷泉港实验室,冷泉港,NY(和该文引用的参考文献)中的描述设计和合成用于这种筛选的简并寡核苷酸序列,并且完成筛选。也可以使用聚合酶链反应(PCR),用本领域已知的方法用上述寡核苷酸,以从cDNA或基因组文库分离核酸探针。然后可以使用所分离的探针完成文库的筛选。
不论是什么制备方法,本文所描述的抗原是"抗原性的",更具体地说,所说的抗原具有与从结核分枝杆菌感染个体获得的血清反应的能力。可以采用例如本文描述的代表性的ELISA测定评价反应性,其中用感染个体的血清产生的吸收读数至少在用未感染个体血清获得的吸收的三个标准偏差以上被认为是阳性的。
也可以采用本领域已知的技术(例如在Paul,基础免疫学,第三版,Raven出版社,1993,pp.243-247和该文引用的参考文献中描述的那些技术)制备和鉴别结核分枝杆菌抗原的抗原性部分。这样的技术包括就抗原性特性筛选天然抗原的多肽部分。一般可以将本文所描述的代表性ELISA用于这些筛选。多肽的抗原性部分是这样的部分,其在这样的代表性测定中产生实质上类似由全长抗原产生的信号的这种测定中的信号。换句话说,在本文描述的模式ELISA中,结核分枝杆菌抗原的抗原性部分产生至少约20%,优选地约100%的由全长抗原所产生的信号。
结核分枝杆菌抗原的部分和其它变体可以用合成或者重组方法产生。利用本领域已知的技术,可以产生具有少于约100个氨基酸,一般少于约50个氨基酸的合成多肽。例如,这些多肽可以用任何通过商业途径可获得的固相技术合成,如Merrifield固相合成法,其中氨基酸依次添加到增长的氨基酸链上。参见Merrifield,美国化学会杂志,82149-2146,1963。用于多肽的自动合成的设备是可通过商业途径从供应商(如应用生物系统公司,Foster City,CA)获得的,并且可以按照制造厂商的说明操作。一般可以用标准的诱变技术(如寡核苷酸定点特异性诱变)制备天然抗原的变体。也可以用标准的技术除去DNA序列的片段,以便可以制备截短的多肽。
采用本领域技术人员熟知的各种技术,可以容易地从编码多肽的DNA序列制备包含天然抗原部分和/或变体的重组多肽。例如,将重组蛋白质分泌到培养基中的合适的宿主/载体系统的上清液可以首先采用市售的滤器浓缩。在浓缩之后,可以将浓缩液用于合适的纯化基质(如亲和性基质或离子交换树脂)上。最后,可以使用一个或多个反相HPLC步骤,以进一步纯化重组蛋白质。
本领域普通技术人员已知的各种表达载体的任何一种都可以用于表达本文所描述的重组多肽。表达可以在任何合适的宿主细胞中进行,所述的宿主细胞已用含有编码重组多肽的DNA分子的表达载体转化或转染过。合适的宿主细胞包括原核生物,酵母和高级真核细胞。优选地,使用的宿主细胞是大肠杆菌,酵母或哺乳动物细胞系,如COS或CHO。以这一方式表达的DNA序列可以编码天然存在的抗原,天然存在的抗原的部分,或者其其它变体。
一般来说,不论采用哪一种制备方法,本文所公开的多肽实质上以纯化的形式得以制备。优选地,所述多肽的纯度为至少大约80%,更优选地至少大约90%,最优选地至少大约99%。然而,就用于本文所公开的方法而言,这些实质上纯化的多肽可以是组合的。
在某些特定的实施方案中,主题发明公开了一些多肽,这些多肽包含可溶性结核分枝杆菌抗原(或这种抗原的变体)的至少一种抗原性部分,所说的抗原具有一种以下的N端序列(a)Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Cys-Asn-Tyr-Gly-Gln-Val-Val-Ala-Ala-Leu(SEQ ID No.115);(b)Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-Ser(SEQ ID No.116);(c)Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-Leu-Glu-Ala-Ala-Lys-Glu-Gly-Arg(SEQ ID No.117);(d)Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-Pro(SEQ ID No.118);(e)Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val(SEQ ID No.119);(f)Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro(SEQ ID No.120);(g)AspPro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Thr-Ala-Ala-Ser-Pro-Pro(SEQ ID No.121);(h)Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-Gly(SEQ ID No.122);(i)Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Leu-Thr-Ser-Leu-Leu-Asn-Ser-Leu-Ala-Asp-Pro-Asn-Val-Ser-Phe-Ala-Asn(SEQ ID No.123);和(j)Xaa-Asp-Ser-Glu-Lys-Ser-Ala-Thr-Ile-Lys-Val-Thr-Asp-Ala-Ser;(SEQ ID No.129)(k)Ala-Gly-Asp-Thr-Xaa-Ile-Tyr-Ile-Val-Gly-Asn-Leu-Thr-Ala-Asp;(SEQ ID No.130)或(l)Ala-Pro-Glu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-Ala-Gly;(SEQ ID No.131)其中Xaa可以是任何氨基酸,优选地是半胱氨酸残基。编码以上标记有(g)的抗原的DNA序列在SEQ ID No.52中给出,其推定的氨基酸序列在SEQID No.53中给出。编码以上标记有(a)的抗原的DNA序列在SEQ ID No.96中给出,其推定的氨基酸序列在SEQ ID No.97中给出。相应于以上抗原(d)的DNA序列在SEQ ID No.24中给出,相应于以上抗原(c)的DNA序列在SEQ ID No.25中给出,相应于以上抗原(I)的DNA序列在SEQ ID No.94中给出,其推定的氨基酸序列在SEQ ID No.95中给出。
在另一个特定的实施方案中,主题发明公开了一些多肽,这些多肽包含具有一种以下的N端序列的结核分枝杆菌抗原,或仅在保守取代和/或修饰上不同的该抗原的变体的至少一种免疫原性部分(m)Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-Ile-Asn-Val-His-Leu-Val;(SEQ ID No.132)或(n)Asp-Pro-Pro-Asp-Pro-His-Gln-Xaa-Asp-Met-Thr-Lys-Gly-Tyr-Tyr-Pro-Gly-Gly-Arg-Arg-Xaa-Phe;(SEQ ID No.124),其中Xaa可以是任何氨基酸,优选地是半胱氨酸残基在其它特定的实施方案中,主题发明公开了一些多肽,这些多肽包含可溶性的结核分枝杆菌抗原(或这种抗原的变体)的至少一种抗原性部分,所述抗原(或其变体)包含由以下序列编码的一种或多种氨基酸序列(a)SEQID No.1,2,4-10,13-25,52,94和96的DNA序列,(b)这些DNA序列的补体,或(c)实质上同源于(a)或(b)中的序列的DNA序列。
在其他特定的实施方案中,主题发明公开了一些多肽,这些多肽包含结核分枝杆菌抗原(或这种抗原的变体)的至少一种抗原性部分,所述抗原(或其变体)可以是也可以不是可溶性的,其包含由以下序列编码的一种或多种氨基酸序列(a)SEQ ID No.26-51的DNA序列,(b)这些DNA序列的补体,或(c)实质上同源于(a)或(b)中的序列的DNA序列。
在以上讨论的特定的实施方案中,结核分枝杆菌抗原包括由实质上同源于本文特别提出的一种或多种DNA序列的DNA序列编码的变体。本文使用的“实质上的同源性”指在中等严格条件下能够杂交的DNA序列。合适的中等严格条件包括在5X SSC,0.5%SDS,1.0mM EDTA(pH8.0)溶液中预洗涤;在50℃-65℃,5X SSC下杂交一夜,或者在杂交物种同源的情况下在45℃,5X SSC下杂交;接着在65℃下洗涤两次,每次以包含0.1%SDS的2X,0.5X和0.2X SSC洗涤20分钟。这样的杂交DNA序列也在本发明的范围内,由于密码简并,编码由杂交DNA序列编码的免疫原性多肽的核苷酸序列也是如此。
在一个相关的方面,本发明提供了一些融合蛋白以及这些融合蛋白的变体,所说的融合蛋白包含第一与第二发明多肽或者是本发明多肽与已知的结核分枝杆菌抗原的融合蛋白,所述抗原如以上描述的38kD抗原或ESAT-6(SEQ ID No.98和99)。本发明的融合蛋白也可以包含在所说的第一和第二多肽之间的接头肽。
利用已知的DNA重组技术将分离的编码第一和第二多肽的DNA序列装配到适当的表达载体中,由此来构建编码本发明的融合蛋白的DNA序列。将具有或不具有肽接头的编码第一多肽的DNA序列的3’末端连接到编码第二多肽的DNA序列的5’末端,以便这些序列的读框处于可以使两种DNA序列的mRNA翻译成保持第一和第二多肽两者的生物学活性的单一融合蛋白的状态。
肽接头序列可以用于通过足以保证各多肽折叠成其二级和四级结构的距离分离第一和第二多肽。采用本领域熟知的标准技术将这样一种肽接头序列掺入到融合蛋白中。可以基于下列因素选择合适的肽接头序列(1)它们采取柔性延伸构象的能力;(2)它们不采取二级结构(其可以与第一和第二多肽上的功能性表位相互作用)的能力;和(3)可以与多肽的功能性表位进行反应的疏水或带电残基的缺乏。优选的肽接头序列包括Gly、Asn’和Ser残基。其它接近中性的氨基酸,如Thr和Ala也可以用于接头序列。可以有利地用作接头序列的氨基酸序列包括在Maratea等,基因,4039-46,1985;Murphy等,美国科学院学报,838258-8562,1986;美国专利4,935,233和美国专利4,751,180中公开的那些。所说的接头序列长度可以从1到约50个氨基酸。当第一和第二多肽具有可以用来分离功能域和阻止空间位阻的非必需N端氨基酸区时,肽接头序列是不需要的。
另一方面,本发明提供了用于利用以上所描述的多肽来诊断结核病的方法。在这一方面,提供了通过单独或组合使用一种或多种以上多肽检测生物样品中结核分枝杆菌感染的方法。在采用多种多肽的实施方案中,可以包括本文特定描述的那些多肽之外的多肽,例如在Andersen和Hansen,感染免疫学,572481-2488,1989中描述的38kD抗原。本文所使用的"生物样品"是任何从患者所获得的含有抗体的样品。优选地样品是全血,痰,血清,血浆,唾液,脑脊液或者尿。更优选地样品是从患者或血液供体所获得的血清或者血浆样品。如以下的描述将所述多肽用于测定中,以确定样品中抗体的存在或不存在(相对于预定的切断(cut-off)值)。这样的抗体的存在表明对可以指示结核病的分枝杆菌抗原的早期致敏作用。
在使用多于一种多肽的实施方案中,所使用的多肽优选地是互补的(即一种组分多肽倾向于检测样品中不能由另一种组分多肽检测的感染)。一般可以采用各种多肽鉴别互补多肽,以分别评价从已知由结核分枝杆菌感染的一系列病人获得的血清样品。在用各多肽确定哪些样品为试验阳性(如下所述)后,可以制备能够检测大多数或所有待试样品中的感染的两种或多种多肽的组合体。这些多肽是互补性的。例如,肺结核-感染个体血清的约25-30%就针对任意单一蛋白质(如以上所论及的38kD抗原)的抗体而言是阴性的。因此,互补多肽可以与38kD抗原结合起来使用,以改进诊断试验的灵敏度。
有本领域技术人员已知的用一种或多种多肽检测样品中抗体的多种方式。参见,例如,Harlow和Lane,抗体实验室手册,冷泉港实验室,1988,该文献本文一并参考。在一个优选的实施方案中,所说的测定包括利用固定在固相支持物上的多肽结合和除去样品中的抗体。然后,结合的抗体可以用含有报道基团的检测试剂检测。合适的检测试剂包括结合到抗体/多肽复合物和游离多肽上的抗体,其是由报道基团标记的(例如,在半竞争性测定中)。此外,可以使用竞争性测定,其中结合到多肽上的抗体以报道基团标记,并且使得可以在将抗原与样品温育后结合到固定化的抗原上。样品组分抑制标记抗体对多肽结合的程度是样品与固定化多肽反应性的指示。
固相支持物可以是任何本领域普通技术人员已知的抗原可以连接于其上的固体物质。例如,固相支持物可以是微量滴定板中的试验孔或者硝化纤维素或者其它合适的膜。此外,支持物可以是小珠或圆盘,如玻璃,玻璃纤维,乳胶或者塑料材料,如聚苯乙烯或聚氯乙烯。支持物也可以是磁性颗粒或纤维光学传感器,例如,在美国专利5,359,681中公开的那些。
所述多肽可以用任何本领域普通技术人员已知的多种技术结合到固相支持物上,这些技术在专利和科学文献中有详细的描述。在本发明的上下文中,术语"结合"指非共价缔合(如吸附)和共价连接(可以是抗原和在支持物上的官能团的直接键合,或者可以是利用交联剂连接)。通过吸附到微量滴定板中的孔上或者膜上的结合是优选的。在这样的情况下,吸附可以通过将在合适的缓冲液中的多肽与固相支持物接触一段合适的时间完成。接触时间随着温度变化,但是一般在大约1小时和1天之间。一般来说,使塑料微量滴定板(如聚苯乙烯或聚氯乙烯)的孔与范围从约10ng到约1μg,优选地约100ng量的多肽接触足以结合充分量的抗原。
通过首先将支持物与双功能试剂反应一般可以完成多肽与固相支持物的共价连接,所述的双功能试剂与支持物和多肽上的官能团(如羟基或氨基基团)两者反应。例如,所述多肽可以结合到具有合适的聚合物的支持物上(采用苯醌涂布或经将醛基团与多肽上胺或活性氢缩合)(参见,例如,Pierce免疫技术目录和手册,1991,A12-A13)。
在某些实施方案中,所述的测定是酶联免疫吸附测定(ELISA)。这一测定可以通过首先使已固定化到固相支持物(一般是微量滴定板的孔)上的多肽抗原与样品接触,以便样品中的多肽的抗体可以结合到固定化的多肽上。然后从固定化的多肽上除去未结合的样品,并加入能够结合固定化的抗体-多肽复合物的检测试剂。然后,采用适合于特定检测试剂的方法测定保持结合到固相支持物上的检测试剂的量。
更具体地说,一旦多肽如上所述固定化在支持物上,则剩下的在支持物上的蛋白质结合部位就通常被阻断。任何本领域普通技术人员已知的合适的阻断剂,如牛血清白蛋白或吐温20TM(Sigma化学公司,St.Louis,MO),都可以使用。然后将固定化的多肽与样品一起温育,使抗体结合到抗原上。在温育之前,样品可以以合适的稀释剂稀释,所述稀释剂如磷酸盐缓冲盐水(PBS)。一般来说,适当的接触时间(即,温育时间)是对检测结核分枝杆菌感染样品中抗体存在的足够的那段时间。优选地,所说的接触时间足以完成至少95%的结合水平(结合的和未结合的抗体之间达到平衡)。本领域普通技术人员会认识到达到平衡所需的时间可以通过测定整个期限内出现结合水平容易地确定。在室温下,约30分钟的温育时间一般是足够的。
然后,可以通过用适当的缓冲液(如包含0.1%吐温20TM的PBS)洗涤固相支持物除去未结合的样品。接着检测试剂可以加入到固相支持物上。适当的检测试剂是结合到固定化的抗体-多肽复合物上并且可以用本领域已知的各种方法之任何一种检测的任何化合物。优选地,所述的检测试剂含有结合到报道基团上的结合剂(例如,蛋白质A、蛋白质G、免疫球蛋白、凝集素或者游离抗原)。优选的报道基团包括酶(如辣根过氧化物酶)、底物、辅因子、抑制剂、染料、放射性核素、发光基团、荧光基团和生物素。可以用本领域普通技术人员已知的标准的方法完成报道基团与结合剂的结合。结合到各种报道基团上的普通的结合剂也可以从多种商业来源(例如,Zymed Laboratories,旧金山,CA,和Pierce,Rockford,IL)购得。
然后,将检测试剂与固定化的抗体-多肽复合物一起温育足以检测结合抗体的一段时间。合适的一段时间一般从制造厂商的说明确定或通过测定在整个时间内出现的结合水平确定。接着除去未结合的检测试剂,并采用报道基团检测结合的检测试剂。用于检测报道基团的方法取决于报道基团的性质。对于放射性基团,闪烁计数或放射自显影法一般是适当的。光谱学方法可以用于检测染料,发光基团和荧光基团。连接到不同报道基团(一般是放射性或者荧光基团或酶)上的生物素可以利用抗生物素蛋白检测。酶报道基团一般可以通过添加底物(一般是一段特定的时间),然后进行反应产物的光谱或其它分析来检测。
为了确定样品中结核分枝杆菌抗体的存在或不存在,一般将从保持结合到固相支持物上的报道基团检测到的信号与相应于预定截止值的信号比较。在一个优选的实施方案中,当固定化的抗原与未感染的病人的样品一起温育时,所说的截止值是所获得的平均信号。一般来说,产生的信号在预定的截止值三个标准偏差之上的样品被认为是结核病阳性的。在另一个优选的实施方案中,按照Sackett等,临床流行病学一种临床医学的基础科学,Little Brown and Co.,1985,pp.106-107的方法采用接受体-操纵物(Receiver Operator)曲线确定截止值。简言之,在这一实施方案中,截止值可以从真阳性大鼠(即敏感性)和假阳性大鼠(100%-特异性)对的图(其相应于诊断试验结果的各种可能的截止值)确定。在最靠近左上角图上的截止值(即圈在最大区域内的值)是最精确的截止值,产生的信号高于由这一方法确定的截止值的样品被认为是阳性的。另外,所说的截止值可以沿图移向左边(以最小化假阳性率),或者右边(以最小化假阴性率)。一般来说,产生的信号高于由这一方法确定的截止值的样品被认为是结核病阳性的。
在相关的实施方案中,所说的测定以迅速过流或布条断裂强度试验方式完成,其中抗原固定化在膜(如硝化纤维素膜)上。在过流试验中,在样品通过膜时,样品内的抗体结合到固定化的多肽上。然后,当含有检测试剂的溶液流过膜时,检测试剂(例如,蛋白质A-胶态金)结合到抗体-多肽复合物上。然后可以按照以上的描述完成对结合的检测试剂的检测。在布条断裂强度试验方式中,将多肽结合于其上的膜的一端浸没在包含样品的溶液中。样品沿着膜迁移,穿过包含检测试剂的区域,到达固定化的多肽的区。在多肽上的检测试剂的浓度表明样品中抗结核分枝杆菌抗体的存在。典型地,在这一部位的检测试剂的浓度产生可以容易被观察的模式,如线状。缺乏这样一种模式表明阴性结果。一般来说,选择在膜上固定化的多肽的量,以便当生物样品含有足以在ELISA中产生阳性信号的抗体水平时(如以上所讨论的),产生清楚可见的模式。优选地,固定化在膜上的多肽的量的范围从约25ng到约1μg,更优选地从约50ng到约500ng。这样的试验典型地以十分小的量(例如1滴)的病人血清或血液进行。
当然,存在适合采用本发明的多肽的许多其它测定方案。以上描述仅仅是为了例举。
在另一方面,本发明提供了针对发明多肽的抗体。可以通过各种本领域普通技术人员已知的技术的任意一种制备抗体。参见,例如,Harlow和Lane,抗体实验室手册,冷泉港实验室,1988。在一种这样的技术中,包含抗原性多肽的免疫原起初注射进任何哺乳动物的各种品种(例如,小鼠,大鼠,兔,绵羊以及山羊)。在这一步骤中,本发明的多肽可以不经修饰作为免疫原。此外,特别是对相对比较短的多肽而言,如果多肽连接到载体蛋白(如牛血清白蛋白或匙孔血蓝蛋白)上,则可以激发高级免疫应答。将免疫原注射进动物宿主,优选地是按照掺入一种或多种加强免疫的预定方案注射,并且周期性地使动物放血。然后,对多肽特异性的多克隆抗体可以通过,例如使用连接到合适的固相支持物上的多肽的亲和层析从这样的抗血清纯化。
可以采用例如Kohler和Milstein,欧洲免疫学杂志,6511-519,1976的技术和其改进的技术制备兴趣抗原性多肽特异性的单克隆抗体。简言之,这些方法包括制备能够产生具有所需特异性(例如,与兴趣多肽的反应性)的抗体的无限增殖细胞系。这样的细胞系可以从例如脾细胞(由按照以上的描述免疫的动物获得的)产生。然后,通过例如与骨髓瘤细胞融合配偶体(优选地是与免疫的动物同系的一种)融合使脾细胞无限增殖化。可以使用各种融合技术。例如,可以将脾细胞和骨髓瘤细胞与非离子去污剂组合在一起几分钟,然后在选择培养基上低密度平板接种,所说的选择培养基支持杂交细胞生长,但不支持骨髓瘤细胞生长。一种优选的选择技术利用HAT(次黄嘌呤,氨基蝶呤,胸苷)选择。在足够的时间(通常约1至2周)之后,观察到杂交体集落。选择单一集落,并试验针对多肽的结合活性。具有高反应性和特异性的杂交瘤是优选的。
单克隆抗体可以从生长的杂交瘤集落上清液分离。此外,各种技术可以用来提高产率,如将杂交瘤细胞系注射进合适的脊椎动物宿主(如小鼠)的腹膜腔。然后可以从腹水液或血液收获单克隆抗体。可以用常规技术从抗体除去污染物,所述技术如层析,凝胶过滤,沉淀和抽提。本发明的多肽可以用于例如,亲和性层析步骤的纯化过程中。
采用类似于以上详细描述的测定法和本领域技术人员已知的其它技术,可以将抗体用于检测结核分枝杆菌抗原存在的诊断试验中,从而提供在病人中检测结核分枝杆菌感染的方法。
本发明的诊断试剂也可以包含编码一种或多种上述多肽的DNA序列,或一种或多种其部分。例如,包含主题DNA序列的至少10个邻接寡核苷酸的引物可以用于以聚合酶链反应(PCR)为基础的试验中。同样地,包含主题DNA序列的至少15个邻接寡核苷酸的探针可以用于与特定序列杂交。基于PCR试验和杂交试验的技术是本领域已知的。这样,引物或者探针可以用于检测生物样品中的结核分枝杆菌感染,所述样品优选地是痰,血液,血清,唾液,脑脊液或者尿。包含以上描述的寡核苷酸序列的DNA探针或引物可以单独使用,相互结合使用,或者与以前鉴别的序列(例如以上讨论的38kD抗原)结合使用。
以说明性的方式但不以限制性的方式给出下列实施例。实施例实施例1来源于结核分枝杆菌培养物滤液的多肽的纯化和特征确定这一例子说明从培养物滤液制备结核分枝杆菌可溶性多肽的方法。除非有其它方式注明,下列例子的所有百分比都是重量/体积百分比。
于37℃在无菌GAS培养基中培养结核分枝杆菌(H37Ra,ATCCNo.25177或H37Rv,ATCC No.25618)14天。然后经0.45μ滤器将培养基真空过滤(留下大批细胞)到无菌的2.5L瓶中。接着经0.2μ滤器将培养基过滤到无菌的4L瓶中。向培养物滤液中加入NaN3,使其浓度达0.04%。然后将瓶置于4℃的冷室中。
通过将滤液置于已高压灭菌的12L贮器中,并将滤液供入400mlAmicon搅拌池中浓缩培养物滤液,该搅拌池已以乙醇冲洗过,并且包含10,000kDa MWCO膜。使用氮气使压力保持在60psi。这一过程使12L体积减少到约50ml。
然后,采用8,000kDa MWCO纤维素酯膜将培养物滤液对0.1%碳酸氢铵透析,两次更换碳酸氢铵溶液。接着由通过商业途径可获得的BCA测定法(Pierce,Rockford,IL)测定蛋白质浓度。
然后将透析培养物滤液进行冻干,把多肽重悬于蒸馏水中。然后,将多肽对0.01mM 1,3双[三(羟甲基)-甲氨基]丙烷,pH7.5(Bis-Tris丙烷缓冲液)(阴离子交换层析的起始条件)透析。利用在POROS 146 II Q/M阴离子交换柱4.6mm×100mm(Perseptive BioSystems,Framingham,MA)上的凝胶预熔融(profusion)层析完成分级分离,所述交换柱已在0.01mMBis-Tris丙烷缓冲液(pH7.5)中平衡过。用在上述缓冲液系统中的0-0.5MNaCl梯度洗脱多肽。在220nm波长下监测柱洗脱液。
将从离子交换柱洗脱的多肽收集物对蒸馏水透析并冻干。将所形成的物质溶解到在水中的0.1%三氟乙酸(TFA)(pH1.9)中,并且在Delta-PakC18柱(Waters,Milford,MA,300埃孔径大小,5微米颗粒大小(3.9X150mm))上纯化该多肽。用从0到60%稀释缓冲液(在乙腈中的0.1%TFA)线性梯度液从柱中洗脱多肽。流速是0.75ml/分钟,在214nm监测HPLC洗脱液。收集包含洗脱的多肽的组分,使单个样品纯度最大。获得约200个纯化的多肽。
然后,就在PBMC制剂中诱导T细胞增殖的能力筛选纯化的多肽。将PBMC(来源于称为PPD皮试阳性的供体,并且其T细胞表现出应答PPD和粗的MTB可溶性蛋白质的增殖)在包含RPMI 1640(补充有10%收集的人血清和50μg/mL庆大霉素)的培养基中培养。双份以0.5至10μg/mL的浓度添加纯化的多肽。96-孔园底平板中以200μl体积培养6天后,从各孔除去50μl培养基,以测定IFN-γ水平,如以下所述。接着用1μCi/孔含氚胸苷脉冲平板另外的18小时,收获,并用气体闪烁计数器测定氚摄取。在两个重复中产生的增殖高于在单独的培养基中培养的细胞上观察到的增殖的3倍的组分被认为是阳性的。
用酶联免疫吸附测定(ELISA)测定IFN-γ。在室温下用在PBS中的针对人类IFN-γ(Chemicon)的小鼠单克隆抗体涂布ELISA平板4小时。然后在室温下用包含5%(WN)脱脂干奶的PBS阻断各孔。接着用PBS/0.2%TWEEN-20洗涤平板6次,将在ELISA平板上的以培养基1∶2稀释的样品在室温下过夜温育。再次洗涤平板,向各孔中添加以PBS/10%正常山羊血清1∶3000稀释的多克隆兔抗-人IFN-γ血清。然后在室温下温育平板两小时,洗涤,加入以PBS/5%脱脂干奶1∶2000稀释的辣根过氧化物酶-偶联的抗-兔IgG(Jackson Labs.)。在室温下进一步温育2小时后,洗涤平板,并加入TMB底物。20分钟后用1N硫酸终止反应。用570nm为参照波长,在450nm测定光密度。在两个重复中导致给出的OD高于在单独的培养基中培养的细胞的平均OD加3个标准偏差的组分被认为是阳性的。
为了测序,将多肽单个地干燥到BiobreneTM(Perkin Elmer/AppliedBioSystems Division,Foster City,CA)处理过的玻璃纤维滤器上。将具有多肽的滤器装到Perkin Elmer/APPlied BioSystems Division Procise 492蛋白质测序仪上。从氨基端测序多肽,并且用传统的Edman化学法。通过把PTH氨基酸衍生物的保留时间与适当的PTH衍生物标准比较,确定各多肽的氨基酸序列。
利用以上描述的方法,分离到具有下列N端序列的抗原(a)Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Xaa-Asn-Tyr-Gly-Gln-Val-Val-Ala-Ala-Leu(SEQ ID No.54);(b)Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-Ser(SEQ ID No.55);(c)Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-Leu-Gln-Ala-Ala-Lys-Glu-Gly-Arg(SEQ ID No.56);(d)Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-Pro(SEQ ID No.57);(e)Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val(SEQ ID No.58);(f)Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro(SEQ IDNo.59);(g)Asp-Pro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Ala-Ala-Ala-Ala-Pro-Pro-Ala(SEQ ID No.60);和(h)Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-Gly(SEQ ID No.61);其中Xaa可以是任何氨基酸。
除以上所描述的方法之外,通过使用微内径柱HPLC纯化步骤分离到另外的抗原。具体地说,在Aquapore C18柱(Perkin Elmer/AppliedBiosystems Division,Foster City,CA)上纯化包含以上描述的层析纯化步骤的抗原混合物的20μl组分,所说的柱具有7微米孔径大小,柱规格为1mmX100mm,在Perkin Elmer/Applied Biosystems Division 172 HPLC型中。以80μl/分钟的流速,用在水(0.05%TFA)中的乙腈(含0.05%TFA)的1%/分钟的线性梯度液从柱上洗脱各组分。在250nm下监测洗脱液。原组分被分离成4个主要的峰加其他小的组分,并且获得显示出具有12.054Kd分子量(由质谱测得)和具有以下N端序列的多肽(i)Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Gln-
Thr-Ser-Leu-Leu-Asn-Asn-Leu-Ala-Asp-Pro-Asp-Val-Ser-Phe-Ala-Asp(SEQ ID No.62)。采用以上所述的测定法,这一多肽显示出在PBMC制剂中诱导增殖和IFN-γ产生。
按照以下所述从结核分枝杆菌培养物滤液分离另外的可溶性抗原。结核分枝杆菌培养物滤液按照以上描述的方法制备。在pH5.5下对Bis-Tris丙烷缓冲液透析后,用在Poros QE柱4.6X100mm(Perseptive Biosystems)上的阴离子交换层析完成分级分离,所述柱在Bis-Tris丙烷缓冲液(pH5.5)中平衡过。以10ml/分钟的流速,用在上述缓冲系统中的线性0-1.5M NaCl梯度液洗脱多肽。在214nm下检测柱洗脱液。
收集从离子交换柱洗脱的组分,并采用Poros R2柱4.6X100mm(Perseptive Biosystems)进行反相层析。以5ml/分钟的流速,用0-100%乙腈(0.1%TFA)的线性梯度液从柱上洗脱多肽,在214nm监测洗脱液。
将包含洗脱的多肽的组分冷干,并重悬于80μl 0.1%TFA水溶液中,并再在Vydac C4柱4.6X150mm(Western Analytical,Temecula,CA)上,以2ml/分钟的流速,用0-100%乙腈(0.1%TFA)线性梯度液进行反相层析。在214nm监测洗脱液。
具有生物活性的组分被分离成一个主要的峰加其它小组分。这一峰的PVDF膜上的Western印迹揭示分子量为14Kd,20Kd和26Kd的三个主要带。确定了这些多肽分别具有下列N端序列(j)Xaa-Asp-Ser-Glu-Lys-Ser-Ala-Thr-Ile-Lys-Val-Thr-Asp-Ala-Ser;(SEQ ID No.129)(k)Ala-Gly-Asp-Thr-Xaa-Ile-Tyr-Ile-Val-Gly-Asn-Leu-Thr-Ala-Asp;(SEQ ID No.130)和(l)Ala-Pro-Glu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-Ala-Gly;(SEQ ID No.131),其中Xaa可以是任何氨基酸。采用以上所述的测定法,这些多肽显示出在PBMC制剂中诱导增殖和IFN-γ产生。图1A和B分别显示了使用第一和第二供体的PMBC制剂进行的这种测定的结果。
通过采用32P末端标记的简并寡核苷酸(相应于N端序列并含有结核分枝杆菌密码子偏倚)筛选结核分枝杆菌基因组文库获得编码以上指定为(a),(c),(d)和(g)的抗原的DNA序列。采用相应于以上抗原(a)的探针进行的筛选鉴别具有SEQ ID No.96所示的序列的克隆。由SEQ ID No.96编码的多肽在SEQ ID No.97中给出。采用相应于以上抗原(g)的探针进行的筛选鉴别具有SEQ ID No.52所示的序列的克隆。由SEQ ID No.52编码的多肽在SEQ ID No.53中给出。采用相应于以上抗原(d)的探针进行的筛选鉴别具有SEQ ID No.24所示的序列的克隆。采用相应于以上抗原(c)的探针进行的筛选鉴别具有SEQ ID No.25所示的序列的克隆。
采用DNA STAR系统,将以上氨基酸序列与基因库中的已知氨基酸序列比较。所检索的数据库含有大约173,000种蛋白质,并且是Swiss,PIR数据库以及翻译的蛋白质序列(版本87)的组合。对抗原(a)-(h)和(l),没有检测到与所说的氨基酸序列的明显的同源性。
发现抗原(i)的氨基酸序列同源于麻风分枝杆菌的序列。利用从GENBANK获得的序列从基因组DNA扩增全长麻风分枝杆菌序列。然后,将这一序列用于筛选结核分枝杆菌文库,获得全长拷贝的结核分枝杆菌的同系物(SEQ ID No.94)。
发现抗原(j)的氨基酸序列同源于从DNA序列翻译的已知结核分枝杆菌蛋白质。就发明者所知,这一蛋白质以前还没有显示出具有T-细胞刺激活性。发现抗原(k)的氨基酸序列与麻风分枝杆菌的序列相关。
在以上描述的增殖与IFN-γ测定中,利用三个PPD阳性供体,以上所提供的代表性抗原的结果在表1中给出表1PBMC增殖和IFN-γ测定的结果

在表1中,给出2和4之间的刺激指数(SI)的反应(与在单独的培养基培养的细胞比较)记录为+,在1μg或更低的浓度下的4-8或2-4的SI记录为++,大于8的SI记录为+++。发现序列(i)的抗原在增殖和IFN-γ测序两者中,对一种供体具有高的SI(+++),对两种其它供体具有较低的SI(++和+)。这些结果表明这些抗原有能力诱导增殖和/或干扰素-γ产生。
实施例2使用病人血清分离结核分枝杆菌抗原这一例子说明通过用结核分枝杆菌感染个体的血清筛选从结核分枝杆菌溶解产物分离抗原的方法。
将干燥的结核分枝杆菌H37Ra(Difco实验室)添加至2%NP40溶液中,此外,匀浆和超声处理三次。在13,000rpm下在微量离心管中离心所形成的悬浮液,将上清液通过0.2微米注射滤器。将滤液结合到Macro PrepDEAE小珠(BioRad,Hercules,CA)上。用20mM Tris(pH7.5)充分洗涤小珠,结合的蛋白质以1M NaCl洗脱。将NaCl洗脱液对10mMTris(pH7.5)透析一夜。在室温下用0.05mg/ml的DNase和RNase处理透析溶液30分钟,然后于室温在pH4.5下用0.5U/mg α-D-甘露糖苷酶处理。在返回到pH7.5后,在Bio Scale-Q-20柱(BioRad)上经FPLC分级分离该物质。将组分合并到九个池中,在Centriprep 10(Amicon,Beverley,MA)中浓缩,并且采用结核分枝杆菌感染病人的血清(其与本发明的其它抗原不发生免疫反应)就血清学活性经Western印迹筛选。
将反应性最强的组分在SDS-PAGE上进行分析,并转移到PVDF上。切下约85Kd的带,产生以下序列(m)Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-Ile-Asn-Val-His-Leu-Val;(SEQ ID No.132),其中Xaa可以是任何氨基酸。
这些序列与以上描述的基因库中的那些序列的比较揭示出与已知的序列没有明显的同源性。
实施例3
制备编码结核分枝杆菌抗原的DNA序列这一例子说明通过用从结核分枝杆菌感染病人获得的血清或者用抗结核分枝杆菌抗原产生的抗血清筛选结核分枝杆菌表达文库,制备编码结核分枝杆菌抗原的DNA序列的方法。A.用兔抗血清制备结核分枝杆菌可溶性抗原从结核分枝杆菌菌株H37Ra分离基因组DNA。随机剪切该DNA,并用于用Lambda ZAP表达系统(Stratagene,La Jolla,CA)构建表达文库。通过用结核分枝杆菌培养物的浓缩上清液免疫兔产生抗结核分枝杆菌菌株H37Ra,H37Rv和Erdman的分泌蛋白质的兔抗血清。具体地说,首先用200μg在含有100μg胞壁酰二肽的2ml总体积中的蛋白质抗原(Calbiochem,La Jolla,CA)和1ml弗氏不完全佐剂皮下免疫兔。四周后,用在弗氏不完全佐剂中的100μg抗原皮下加强免疫兔。最后,在四周后用50μg蛋白质抗原静脉内免疫兔。如Sambrook等,分子克隆实验室手册,冷泉港实验室,冷泉港,NY,1989中的描述将抗血清用于筛选表达文库。纯化表达免疫反应性抗原的噬菌体噬斑。噬斑的噬粒得到救援,结核分枝杆菌克隆的核苷酸序列被推定。
纯化了32个克隆。在这些克隆中,25个代表在结核分枝杆菌中以前没有鉴别过的序列。如Skeiky等,实验医学杂志,1811527-1537,1995中所述用IPTG诱导蛋白质,并经凝胶洗脱纯化。在这一筛选中鉴别的DNA分子的代表性部分序列在SEQ ID No.1-25中给出。相应的预言的氨基酸序列在SEQ ID No.64-88中给出。
基于采用以上所述的数据库将这些序列与基因库中的已知序列比较,发现下文中称为TbRA2A、TbRA16、TbRA18和TbRA29(SEQ ID No.77、69、71、76)的克隆显示出与以前在麻风分枝杆菌中而不是在结核分枝杆菌中鉴别的序列的某些同源性。TbRA11、TbRA26、TbRA28和TbDPEP(SEQ ID No.66、74、75、53)以前在结核分枝杆菌中已鉴定过。对TbRA1、TbRA3、TbRA4、TbRA9、TbRA10、TbRA13、TbRA17、TbRA19、TbRA29、TbRA32、TbRA36和重叠克隆TbRA35和TbRA12(分别为SEQ ID No.64、78、82、83、65、68、76、72、76、79、81、80、67)没有发现明显的同源性。克隆TbRa24与克隆TbRa29重叠。B.使用病人血清鉴别编码结核分枝杆菌抗原的DNA序列采用从患活动性结核病的患者获得的血清库筛选以上描述的基因组DNA文库和另外的H37Rv文库。为了制备H37Rv文库,分离结核分枝杆菌菌株H37Rv基因组的DNA,进行部分Sau3A消化,并用于采用LambdaZap表达系统(Stratagene,La JolIa,Ca)构建表达文库。将三种不同库的血清(各含有从患有活动性肺部或胸膜疾病的个体获得的血清)用于表达筛选。有关在ELISA和免疫印迹方式两者中与H37Ra溶解产物的相对反应性,这些库被指定为TbL、TbM和TbH(即,TbL=低反应性,TbM=中等反应性和TbH=高反应性)。也使用了来自活动性肺结核病的七个患者血清的四个库。所有血清缺乏与重组38kD结核分枝杆菌H37Ra磷酸盐-结合蛋白的增加的反应性。
所有库用大肠杆菌溶解产物预吸附,并用于如Sambrook等,分子克隆实验室手册,冷泉港实验室,冷泉港,NY,1989中所述筛选H37Ra和H37Rv表达文库。纯化表达免疫反应性抗原的噬菌体噬斑。噬斑的噬粒得到救援,结核分枝杆菌克隆的核苷酸序列被推定。
纯化了32个克隆。在这些克隆中,31个代表在人类结核分枝杆菌中以前没有鉴别过的序列。所鉴别的DNA分子的代表性序列在SEQ ID NO.26-51和100中给出。在这些克隆中,TbH-8和TbH-8-2(SEQ ID No.100)是相同克隆的非邻接DNA序列,TbH-4(SEQ ID No.43)和TbH-4-FWD(SEQ ID No.44)是相同克隆的非邻接序列。此后鉴别为Tb38-1、TbH-4、TbH-8、TbH-9、和TbH-12的抗原的氨基酸序列在SEQ ID NO.89-93中显示。利用以上确定的数据库将这些序列与基因库中的已知序列的比较揭示出,对TbH-4、TbH-8、TbH-9和TbM-3没有明显的同源性,虽然对TbH-9发现了弱的同源性。发现TbH-12同源于以前在副结核分枝杆菌(Acc.No.S28515)中鉴定的34kD抗原蛋白质。发现Tb38-1位于以前在牛型分枝杆菌(Acc.No.U34848)和结核分枝杆菌中鉴别的抗原ESAT-6开放读框上游34个碱基对(Sorensen等,感染免疫学,631710-1717,1995)。
将来源于Tb38-1和TbH-9(两者都是从H37Ra文库分离的)的探针用于鉴别H37Rv文库中的克隆。Tb38-1杂交到Tb38-1F2、Tb38-1F3、Tb38-1F5和Tb38-1F6(SEQ ID No.107、108、111、113和114)。SEQID No.107和108是来源于克隆Tb38-1F2的非邻接序列,推定了Tb38-IF2中的两个开放读框;一个相应于Tb37FL(SEQ ID No.109),第二个(部分序列)可以是Tb38-1的同系物,并称为Tb38-IN(SEQ ID No.110)。Tb38-1F3的推定的氨基酸序列在SEQ ID No.112中给出。,TbH-9探针鉴别了H37Rv文库中的三个克隆TDH-9-FL(SEQ ID No.101),其可以是TbH-9(R37Ra)的同系物;TbH-9-1(SEQ ID No.103)和TbH-9-4(SEQID No.105),所有这些都是TbH-9的高度相关序列。这三个克隆的推定的氨基酸序列在SEQ ID No.102、104和106中给出。
实施例4来源于结核菌素纯化蛋白质衍生物的多肽的纯化和特征确定按照以下所述从结核菌素纯化蛋白质衍生物(PPD)分离结核分枝杆菌多肽。
按进行某些修改的出版的方法(Seibert,F等,结核菌素纯化蛋白质衍生物。大量制备和分析标准。美国结核病评论449-25,1941)制备PPD。
于37℃下在摇瓶中用合成培养基培养结核分枝杆菌Rv菌株6周。然后将含有细菌生长物的瓶子用水蒸汽加热到100℃3小时。用0.22μ滤器无菌过滤培养物,采用3kD截止膜浓缩20倍。用50%硫酸铵溶液沉淀蛋白质一次,用25%硫酸铵溶液沉淀8次。通过反相液相层析(RP-HPLC)分级分离所形成的蛋白质(PPD),所说的层析采用在Biocad HPLC系统(Perseptive Biosystems,Framingham,MA)中的C18柱(7.8X300mM;Waters,Milford,MA)。用0-100%线性梯度缓冲液(在乙腈中的0.1%TFA)从柱中洗脱组分。流速是10ml/分钟,在214nm和280nm下监测洗脱液。
收集六个组分,干燥,悬浮在PBS中,并在结核分枝杆菌感染豚鼠中就诱导迟发型超敏(DTH)反应分别进行试验。发现一个组分诱导强的DTH反应,接着在微内径Vydac C18柱(Cat.No.218TP5115)上进一步经RP-HPLC分级分离,所说的柱在Perkin Elmer/Applied Biosystems Division172 HPLC型中。以5-100%线性梯度缓冲液(在乙腈中的0.05%TFA)洗脱各组分,流速为80μl/分钟。在215 nm监测洗脱液。收集八个组分,在结核分枝杆菌感染豚鼠中试验对DTH的诱导。发现一个组分诱导约16mm硬结的强DTH。其它组分不诱导可检测的DTH。将阳性组分进行SDS-PAGE凝胶电泳,发现其含有12kD分子量的一单一蛋白质带。
如以上的描述,用Perkin Elmer/Applied Biosystems Division Procise492蛋白质测序仪从氨基末端对这一多肽(此后称作DPPD)进行测序,发现其具有SEQ ID NO.124中显示的N端序列。这一序列与以上描述的基因库中的已知序列的比较揭示没有已知的同系物。分离到DPPD的四个溴化氰片段,发现其具有SEQ ID NO.125-128中显示的序列。
实施例5合成多肽的合成可以采用由HPTU(O-苯并三唑-N,N,N’,N’-四甲基脲鎓六氟磷酸盐)活化的FMOC化学在Millipore 9050肽合成仪上合成多肽。Gly-Cys-Gly序列可以连接到肽的氨基末端,以提供所述肽的缀合或标记方法。可以采用下列切割混合物从固相支持物上切割肽三氟乙酸∶乙烷二硫酚∶苯硫基甲烷∶水∶苯酚(40∶1∶2∶2∶3)。在切割两小时后,可以在冷的甲基-叔丁基醚中沉淀所说的肽。然后,肽沉淀可以溶解在含0.1%三氟乙酸(TFA)的水中,并且在经C18反相HPLC纯化之前冷干。在水(含0.1%TFA)中的0-60%乙腈(含0.1%TFA)梯度液可以用于洗脱肽。在纯组分的冷干后,可以采用电喷射质谱测定法和氨基酸分析确定肽的特征。
这一方法用来合成TbM-1肽,该肽含有一个半TbM-1序列的重复单位。TbM-1肽具有序列GCGDRSGGNLDQIRLRRDRSGGNL(SEQ IDNo.63)。
实施例6代表性抗原在结核病血清学诊断上的用途这一例子说明几个代表性抗原的诊断学特性。图1和2表示与细菌溶解产物和38kD抗原的反应性比较,代表性抗原与结核分枝杆菌感染和未感染个体血清的反应性。
测定在96-孔平板中完成,所述平板涂布有用碳酸盐涂布缓冲液(pH9.6)稀释成50μL的200ng抗原。在4℃将这些孔涂布过夜(或者在37℃2小时)。然后,除去平板内含物,用200μL PBS/1%BSA封阻各孔2小时。在封阻步骤后,以PBS/0.1%吐温20TM洗涤五次。向各孔中添加以PBS/0.1%吐温20TM/0.1%BSA 1∶100稀释的50μL血清并在室温下温育30分钟。然后用PBS/0.1%吐温20TM再洗涤平板五次。
接着用PBS/0.1%吐温20TM/0.1%BSA 1∶10000稀释酶缀合物(辣根过氧化物酶-蛋白质A,Zymed,San Francisco,CA),将50μL稀释的缀合物添加到各孔中,并在室温下温育30分钟。温育之后,用PBS/0.1%吐温20TM洗涤各孔五次。加入100μL四甲基联苯胺过氧化物酶(TMB)底物(Kirkegaard和Perry实验室,Gaithersburg,MD),不稀释,温育约15分钟。由添加100μL 1N硫酸到各孔中终止反应,用平板在450nm下读数。
图2显示了用实施例3的方法A以来源于结核分枝杆菌阳性和阴性患者的血清分离的两种重组抗原(TbRa3和TbRa9)的ELISA反应性。将这些抗原的反应性与从结核分枝杆菌菌株H37Ra(Difco,底特律,MI)分离的细菌溶解产物的反应性比较。在两种情况下,重组抗原区别阳性和阴性血清。基于从接受体-操纵物曲线获得的截止值,TbRa3检测87个阳性血清中的56个,TbRa9检测165个阳性血清中的111个。
图3说明采用实施例3的方法B分离的代表性抗原的ELISA反应性。将重组抗原TbH4,TbH12,Tb38-1和肽TbM-1(如在实施例4中所描述的)的反应性与Andersen和Hansen,感染免疫学,572481-2488,1989所描述的38kD抗原的反应性比较。使用试验的所有多肽再次区别阳性和阴性血清。基于从接受体-操纵物曲线获得的截止值,TbH4检测126个阳性血清中的67个,TbH12检测125个阳性血清中的50个,38-1检测101个阳性血清中的61个,TbM-1肽检测30个阳性血清中的25个。
也测定了四种抗原(TbRa3,TbRa9,TbH4和TbH12)与来源于结核分枝杆菌感染患者(在痰的酸快速染色((Smithwick和David,结核,52226,1971))中具有不同的反应性)组的血清的反应性,并与结核分枝杆菌溶解产物和38kD抗原的反应性比较。结果示于表2中。
表2抗原与结核分枝杆菌患者血清的反应性


基于从接受体-操纵物曲线获得的截止值,TbRa3检测27个阳性血清中的23个,TbRa9检测27个中的22个,TbH4检测27个中的18个,TbH12检测27个中的15个。如果组合使用,这四种抗原将具有27中的27个理论敏感性,表明这些抗原在结核分枝杆菌感染的血清学检测中相互补充。此外,几种重组抗原检测采用38kD抗原未被检测到的阳性血清,表明这些抗原可以与38kD抗原互补。
通过如以上描述的ELISA测定了重组抗原TbRall与结核分枝杆菌病人血清(显示出对38kD抗原阴性)以及与PPD阳性和正常供体血清的反应性。结果在图4中显示,这些结果表明,TbRal1(尽管用PPD阳性和正常供体血清为阴性)检测用38kD抗原为阴性的血清。在所试验的13个38kD阴性的血清中,9个用TbRal1为阳性,表明这一抗原可以与38kD抗原阴性血清亚组反应。相反,在38kD阳性血清组(此时TbRall是反应性的)中,TbRall的平均OD 450低于38kD抗原的。数据表明TbRall活性的存在和38kD阳性之间的反向关系。
在间接ELISA中试验抗原TbRa2A,其中首先在室温下使用1∶100稀释的50μL血清30分钟,接着用PBS吐温洗涤,并与1∶10,000稀释的生物素酰化的蛋白质A(Zymed,San Francisco,CA)一起温育30分钟。洗涤后,加入1∶10,000稀释的50μL抗生蛋白链菌素-辣根过氧化物酶(Zymed),将混合物温育30分钟。在洗涤之后,如以上描述用TMB底物进行测定。TbRa2A与来源于结核分枝杆菌患者和正常供体的血清的反应性示于表3中。TbRa2A与结核分枝杆菌患者之血清的反应性的平均值是0.444(具有0.309的标准偏差)。与正常供体之血清的反应性的平均值是0.109(具有0.029的标准偏差)。38kD阴性血清的试验(图5)也表明TbRa2A抗原能够检测这一类别的血清。
表3TbRa2A与来源于结核分枝杆菌患者的和来源于正常供体的血清的反应性


通过如以上描述的ELISA测定重组抗原(g)(SEQ ID No.60)与来源于结核分枝杆菌患者的和来源于正常供体的血清的反应性。图6显示了抗原(g)以四种结核分枝杆菌阳性血清(均是与38kD抗原反应性的)和与四种供体血清的滴定结果。所有四种阳性血清均是与抗原(g)反应性的。
从以上所述可以清楚看到,虽然为说明的目的,本文描述了本发明的特定的实施方案,但是可以进行各种修改而不背离本发明的精神和范围。
序列表(1)一般信息(i)申请人Corixa公司(ii)发明名称用于结核病诊断的化合物和方法(ii)序列数132个(iv)通讯地址(A)收信人SEED和BERRY LLP(B)街道6300哥伦比亚中心,第五大街701号(C)城市Seattle(D)州华盛顿(E)国家美国(F)ZIP98104-7092(v)计算机可读形式(A)介质类型软盘(B)计算机IBM PC兼容机(C)操作系统PC-DOS/MS-DOS(D)软件PatentIn Release#1.0,版本#1.30(vi)当前申请的数据(A)申请号(B)申请日1996-8-27(C)分类号(viii)律师/代理人信息(A)姓名Maki,David J.
(B)登记号31.392(C)证书号210121.417PC(ix)电讯信息(A)电话(206)622-4900(B)传真(206)682-6031(2)SEQ ID NO1的信息(i)序列特征(A)长度766个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO1CGAGGCACCG GTAGTTTGAA CCAAACGCAC AATCGACGGG CAAACGAACG GAAGAACACA 60ACCATGAAGA TGGTGAAATC GATCGCCGCA GGTCTGACCG CCGCGGCTGC AATCGGCGCC 120GCTGCGGCCG GTGTGACTTC GATCATGGCT GGCGGCCCGG TCGTATACCA GATGCAGCCG 180GTCGTCTTCG GCGCGCCACT GCCGTTGGAC CCGGCATCCG CCCCTGACGT CCCGACCGCC 240GCCCAGTTGA CCAGCCTGCT CAACAGCCTC GCCGATCCCA ACGTGTCGTT TGCGAACAAG 300GGCAGTCTGG TCGAGGGCGG CATCGGGGGC ACCGAGGCGC GCATCGCCGA CCACAAGCTG 360AAGAAGGCCG CCGAGCACGG GGATCTGCCG CTGTCGTTCA GCGTGACGAA CATCCAGCCG 420GCGGCCGCCG GTTCGGCCAC CGCCGACGTT TCCGTCTCGG GTCCGAAGCT CTCGTCGCCG 480GTCACGCAGA ACGTCACGTT CGTGAATCAA GGCGGCTGGA TGCTGTCACG CGCATCGGCG 540ATGGAGTTGC TGCAGGCCGC AGGGNAACTG ATTGGCGGGC CGGNTTCAGC CCGCTGTTCA 600GCTACGCCGC CCGCCTGGTG ACGCGTCCAT GTCGAACACT CGCGCGTGTA GCACGGTGCG 660GTNTGCGCAG GGNCGCACGC ACCGCCCGGT GCAAGCCGTC CTCGAGATAG GTGGTGNCTC 720GNCACCAGNG ANCACCCCCN NNTCGNCNNT TCTCGNTGNT GNATGA 766(2)SEQ ID NO2的信息(i)序列特征(A)长度752个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO2ATGCATCACC ATCACCATCA CGATGAAGTC ACGGTAGAGA CGACCTCCGT CTTCCGCGCA 60GACTTCCTCA GCGAGCTGGA CGCTCCTGCG CAAGCGGGTA CGGAGAGCGC GGTCTCCGGG 120GTGGAAGGGC TCCCGCCGGG CTCGGCGTTG CTGGTAGTCA AACGAGGCCC CAACGCCGGG 180TCCCGGTTCC TACTCGACCA AGCCATCACG TCGGCTGGTC GGCATCCCGA CAGCGACATA 240TTTCTCGACG ACGTGACCGT GAGCCGTCGC CATGCTGAAT TCCGGTTGGA AAACAACGAA 300TTCAATGTCG TCGATGTCGG GAGTCTCAAC GGCACCTACG TCAACCGCGA GCCCGTGGAT 360TCGGCGGTGC TGGCGAACGG CGACGAGGTC CAGATCGGCA AGCTCCGGTT GGTGTTCTTG 420ACCGGACCCA AGCAAGGCGA GGATGACGGG AGTACCGGGG GCCCGTGAGC GCACCCGATA 480GCCCCGCGCT GGCCGGGATG TCGATCGGGG CGGTCCTCCG ACCTGCTACG ACCGGATTTT 540CCCTGATGTC CACCATCTCC AAGATTCGAT TCTTGGGAGG CTTGAGGGTC NGGGTGACCC 600CCCCGCGGGC CTCATTCNGG GGTNTCGGCN GGTTTCACCC CNTACCNACT GCCNCCCGGN 660TTGCNAATTC NTTCTTCNCT GCCCNNAAAG GGACCNTTAN CTTGCCGCTN GAAANGGTNA 720TCCNGGGCCC NTCCTNGAAN CCCCNTCCCC CT 752(2)SEQ ID NO3的信息(i)序列特征(A)长度813个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO3CATATGCATC ACCATCACCA TCACACTTCT AACCGCCCAG CGCGTCGGGG GCGTCGAGCA 60CCACGCGACA CCGGGCCCGA TCGATCTGCT AGCTTGAGTC TGGTCAGGCA TCGTCGTCAG 120CAGCGCGATG CCCTATGTTT GTCGTCGACT CAGATATCGC GGCAATCCAA TCTCCCGCCT 180GCGGCCGGCG GTGCTGCAAA CTACTCCCGG AGGAATTTCG ACGTGCGCAT CAAGATCTTC 240ATGCTGGTCA CGGCTGTCGT TTTGCTCTGT TGTTCGGGTG TGGCCACGGC CGCGCCCAAG 300ACCTACTGCG AGGAGTTGAA AGGCACCGAT ACCGGCCAGG CGTGCCAGAT TCAAATGTCC 360GACCCGGCCT ACAACATCAA CATCAGCCTG CCCAGTTACT ACCCCGACCA GAAGTCGCTG 420GAAAATTACA TCGCCCAGAC GCGCGACAAG TTCCTCAGCG CGGCCACATC GTCCACTCCA 480CGCGAAGCCC CCTACGAATT GAATATCACC TCGGCCACAT ACCAGTCCGC GATACCGCCG 540CGTGGTACGC AGGCCGTGGT GCTCAMGGTC TACCACAACG CCGGCGGCAC GCACCCAACG 600ACCACGTACA AGGCCTTCGA TTGGGACCAG GCCTATCGCA AGCCAATCAC CTATGACACG 660CTGTGGCAGG CTGACACCGA TCCGCTGCCA GTCGTCTTCC CCATTGTTGC AAGGTGAACT 720GAGCAACGCA GACCGGGACA ACWGGTATCG ATAGCCGCCN AATGCCGGCT TGGAACCCNG 780TGAAATTATC ACAACTTCGC AGTCACNAAA NAA 813(2)SEQ ID NO4的信息(i)序列特征(A)长度447个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO4CGGTATGAAC ACGGCCGCGT CCGATAACTT CCAGCTGTCC CAGGGTGGGC AGGGATTCGC 60CATTCCGATC GGGCAGGCGA TGGCGATCGC GGGCCAGATC CGATCGGGTG GGGGGTCACC 120CACCGTTCAT ATCGGGCCTA CCGCCTTCCT CGGCTTGGGT GTTGTCGACA ACAACGGCAA 180CGGCGCACGA GTCCAACGCG TGGTCGGGAG CGCTCCGGCG GCAAGTCTCG GCATCTCCAC 240CGGCGACGTG ATCACCGCGG TCGACGGCGC TCCGATCAAC TCGGCCACCG CGATGGCGGA 300CGCGCTTAAC GGGCATCATC CCGGTGACGT CATCTCGGTG AACTGGCAAA CCAAGTCGGG 360CGGCACGCGT ACAGGGAACG TGACATTGGC CGAGGGACCC CCGGCCTGAT TTCGTCGYGG 420ATACCACCCG CCGGCCGGCC AATTGGA 447(2)SEQ ID NO5的信息(i)序列特征(A)长度604个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO5GTCCCACTGC GGTCGCCGAG TATGTCGCCC AGCAAATGTC TGGCAGCCGC CCAACGGAAT 60CCGGTGATCC GACGTCGCAG GTTGTCGAAC CCGCCGCCGC GGAAGTATCG GTCCATGCCT 120AGCCCGGCGA CGGCGAGCGC CGGAATGGCG CGAGTGAGGA GGCGGGCAAT TTGGCGGGGC 180CCGGCGACGG NGAGCGCCGG AATGGCGCGA GTGAGGAGGT GGNCAGTCAT GCCCAGNGTG 240ATCCAATCAA CCTGNATTCG GNCTGNGGGN CCATTTGACA ATCGAGGTAG TGAGCGCAAA 300TGAATGATGG AAAACGGGNG GNGACGTCCG NTGTTCTGGT GGTGNTAGGT GNCTGNCTGG 360NGTNGNGGNT ATCAGGATGT TCTTCGNCGA AANCTGATGN CGAGGAACAG GGTGTNCCCG 420NNANNCCNAN GGNGTCCNAN CCCNNNNTCC TCGNCGANAT CANANAGNCG NTTGATGNGA 480NAAAAGGGTG GANCAGNNNN AANTNGNGGN CCNAANAANC NNNANNGNNG NNAGNTNGNT 540NNNTNTTNNC ANNNNNNNTG NNGNNGNNCN NNNCAANCNN NTNNNNGNAA NNGGNTTNTT 600NAAT604(2)SEQ ID NO6的信息(i)序列特征(A)长度633个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO6TTGCANGTCG AACCACCTCA CTAAAGGGAA CAAAAGCTNG AGCTCCACCG CGGTGGCGGC 60CGCTCTAGAA CTAGTGKATM YYYCKGGCTG CAGSAATYCG GYACGAGCAT TAGGACAGTC 120TAACGGTCCT GTTACGGTGA TCGAATGACC GACGACATCC TGCTGATCGA CACCGACGAA 180CGGGTGCGAA CCCTCACCCT CAACCGGCCG CAGTCCCGYA ACGCGCTCTC GGCGGCGCTA 240CGGGATCGGT TTTTCGCGGY GTTGGYCGAC GCCGAGGYCG ACGACGACAT CGACGTCGTC 300ATCCTCACCG GYGCCGATCC GGTGTTCTGC GCCGGACTGG ACCTCAAGGT AGCTGGCCGG 360GCAGACCGCG CTGCCGGACA TCTCACCGCG GTGGGCGGCC ATGACCAAGC CGGTGATCGG 420CGCGATCAAC GGCGCCGCGG TCACCGGCGG GCTCGAACTG GCGCTGTACT GCGACATCCT 480GATCGCCTCC GAGCACGCCC GCTTCGNCGA CACCCACGCC CGGGTGGGGC TGCTGCCCAC 540CTGGGGACTC AGTGTGTGCT TGCCGCAAAA GGTCGGCATC GGNCTGGGCC GGTGGATGAG 600CCTGACCGGC GACTACCTGT CCGTGACCGA CGC 633(2)SEQ ID NO7的信息(i)序列特征(A)长度1362个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO7CGACGACGAC GGCGCCGGAG AGCGGGCGCG AACGGCGATC GACGCGGCCC TGGCCAGAGT 60CGGCACCACC CAGGAGGGAG TCGAATCATG AAATTTGTCA ACCATATTGA GCCCGTCGCG 120CCCCGCCGAG CCGGCGGCGC GGTCGCCGAG GTCTATGCCG AGGCCCGCCG CGAGTTCGGC 180CGGCTGCCCG AGCCGCTCGC CATGCTGTCC CCGGACGAGG GACTGCTCAC CGCCGGCTGG 240GCGACGTTGC GCGAGACACT GCTGGTGGGC CAGGTGCCGC GTGGCCGCAA GGAAGCCGTC 300GCCGCCGCCG TCGCGGCCAG CCTGCGCTGC CCCTGGTGCG TCGACGCACA CACCACCATG 360CTGTACGCGG CAGGCCAAAC CGACACCGCC GCGGCGATCT TGGCCGGCAC AGCACCTGCC 420GCCGGTGACC CGAACGCGCC GTATGTGGCG TGGGCGGCAG GAACCGGGAC ACCGGCGGGA 480CCGCCGGCAC CGTTCGGCCC GGATGTCGCC GCCGAATACC TGGGCACCGC GGTGCAATTC 540CACTTCATCG CACGCCTGGT CCTGGTGCTG CTGGACGAAA CCTTCCTGCC GGGGGGCCCG 600CGCGCCCAAC AGCTCATGCG CCGCGCCGGT GGACTGGTGT TCGCCCGCAA GGTGCGCGCG 660GAGCATCGGC CGGGCCGCTC CACCCGCCGG CTCGAGCCGC GAACGCTGCC CGACGATCTG 720GCATGGGCAA CACCGTCCGA GCCCATAGCA ACCGCGTTCG CCGCGCTCAG CCACCACCTG 780GACACCGCGC CGCACCTGCC GCCACCGACT CGTCAGGTGG TCAGGCGGGT CGTGGGGTCG 840TGGCACGGCG AGCCAATGCC GATGAGCAGT CGCTGGACGA ACGAGCACAC CGCCGAGCTG 900CCCGCCGACC TGCACGCGCC CACCCGTCTT GCCCTGCTGA CCGGCCTGGC CCCGCATCAG960GTGACCGACG ACGACGTCGC CGCGGCCCGA TCCCTGCTCG ACACCGATGC GGCGCTGGTT 1020GGCGCCCTGG CCTGGGCCGC CTTCACCGCC GCGCGGCGCA TCGGCACCTG GATCGGCGCC 1080GCCGCCGAGG GCCAGGTGTC GCGGCAAAAC CCGACTGGGT GAGTGTGCGC GCCCTGTCGG 1140TAGGGTGTCA TCGCTGGCCC GAGGGATCTC GCGGCGGCGA ACGGAGGTGG CGACACAGGT 1200GGAAGCTGCG CCCACTGGCT TGCGCCCCAA CGCCGTCGTG GGCGTTCGGT TGGCCGCACT 1260GGCCGATCAG GTCGGCGCCG GCCCTTGGCC GAAGGTCCAG CTCAACGTGC CGTCACCGAA 1320GGACCGGACG GTCACCGGGG GTCACCCTGC GCGCCCAAGG AA 1362(2)SEQ ID NO8的信息(i)序列特征(A)长度1458个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO8GCGACGACCC CGATATGCCG GGCACCGTAG CGAAAGCCGT CGCCGACGCA CTCGGGCGCG 60GTATCGCTCC CGTTGAGGAC ATTCAGGACT GCGTGGAGGC CCGGCTGGGG GAAGCCGGTC 120TGGATGACGT GGCCCGTGTT TACATCATCT ACCGGCAGCG GCGCGCCGAG CTGCGGACGG 180CTAAGGCCTT GCTCGGCGTG CGGGACGAGT TAAAGCTGAG CTTGGCGGCC GTGACGGTAC 240TGCGCGAGCG CTATCTGCTG CACGACGAGC AGGGCCGGCC GGCCGAGTCG ACCGGCGAGC 300TGATGGACCG ATCGGCGCGC TGTGTCGCGG CGGCCGAGGA CCAGTATGAG CCGGGCTCGT 360CGAGGCGGTG GGCCGAGCGG TTCGCCACGC TATTACGCAA CCTGGAATTC CTGCCGAATT 420CGCCCACGTT GATGAACTCT GGCACCGACC TGGGACTGCT CGCCGGCTGT TTTGTTCTGC 480CGATTGAGGA TTCGCTGCAA TCGATCTTTG CGACGCTGGG ACAGGCCGCC GAGCTGCAGC540GGGCTGGAGG CGGCACCGGA TATGCGTTCA GCCACCTGCG ACCCGCCGGG GATCGGGTGG600CCTCCACGGG CGGCACGGCC AGCGGACCGG TGTCGTTTCT ACGGCTGTAT GACAGTGCCG660CGGGTGTGGT CTCCATGGGC GGTCGCCGGC GTGGCGCCTG TATGGCTGTG CTTGATGTGT720CGCACCCGGA TATCTGTGAT TTCGTCACCG CCAAGGCCGA ATCCCCCAGC GAGCTCCCGC780ATTTCAACCT ATCGGTTGGT GTGACCGACG CGTTCCTGCG GGCCGTCGAA CGCAACGGCC840TACACCGGCT GGTCAATCCG CGAACCGGCA AGATCGTCGC GCGGATGCCC GCCGCCGAGC900TGTTCGACGC CATCTGCAAA GCCGCGCACG CCGGTGGCGA TCCCGGGCTG GTGTTTCTCG960ACACGATCAA TAGGGCAAAC CCGGTGCCGG GGAGAGGCCG CATCGAGGCG ACCAACCCGT 1020GCGGGGAGGT CCCACTGCTG CCTTACGAGT CATGTAATCT CGGCTCGATC AACCTCGCCC 1080GGATGCTCGC CGACGGTCGC GTCGACTGGG ACCGGCTCGA GGAGGTCGCC GGTGTGGCGG 1140TGCGGTTCCT TGATGACGTC ATCGATGTCA GCCGCTACCC CTTCCCCGAA CTGGGTGAGG 1200CGGCCCGCGC CACCCGCAAG ATCGGGCTGG GAGTCATGGG TTTGGCGGAA CTGCTTGCCG 1260CACTGGGTAT TCCGTACGAC AGTGAAGAAG CCGTGCGGTT AGCCACCCGG CTCATGCGTC 1320GCATACAGCA GGCGGCGCAC ACGGCATCGC GGAGGCTGGC CGAAGAGCGG GGCGCATTCC 1380CGGCGTTCAC CGATAGCCGG TTCGCGCGGT CGGGCCCGAG GCGCAACGCA CAGGTCACCT 1440CCGTCGCTCC GACGGGCA 1458(2)SEQ ID NO9的信息(i)序列特征(A)长度862个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO9ACGGTGTAAT CGTGCTGGAT CTGGAACCGC GTGGCCCGCT ACCTACCGAG ATCTACTGGC 60GGCGCAGGGG GCTGGCCCTG GGCATCGCGG TCGTCGTAGT CGGGATCGCG GTGGCCATCG 120TCATCGCCTT CGTCGACAGC AGCGCCGGTG CCAAACCGGT CAGCGCCGAC AAGCCGGCCT 180CCGCCCAGAG CCATCCGGGC TCGCCGGCAC CCCAAGCACC CCAGCCGGCC GGGCAAACCG 240AAGGTAACGC CGCCGCGGCC CCGCCGCAGG GCCAAAACCC CGAGACACCC ACGCCCACCG 300CCGCGGTGCA GCCGCCGCCG GTGCTCAAGG AAGGGGACGA TTGCCCCGAT TCGACGCTGG 360TGGTGGTCAC CAACATCGGC CTGGTGTCCT GTAAACGCGA CGTTGGGGCC GCGGTGTTGG 480CCGCCTACGT TTACTCGCTG GACAACAAGC GGTTGTGGTC CAACCTGGAC TGCGCGCCCT 540CGAATGAGAC GCTGGTCAAG ACGTTTTCCC CCGGTGAGCA GGTAACGACC GCGGTGACCT 600GGACCGGGAT GGGATCGGCG CCGCGCTGCC CATTGCCGCG GCCGGCGATC GGGCCGGGCA 660CCTACAATCT CGTGGTACAA CTGGGCAATC TGCGCTCGCT GCCGGTTCCG TTCATCCTGA 720ATCAGCCGCC GCCGCCGCCC GGGCCGGTAC CCGCTCCGGG TCCAGCGCAG GCGCCTCCGC 780CGGAGTCTCC CGCGCAAGGC GGATAATTAT TGATCGCTGA TGGTCGATTC CGCCAGCTGT 840GACAACCCCT CGCCTCGTGC CG 862(2)SEQ ID NO10的信息(i)序列特征(A)长度622个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO10TTGATCAGCA CCGGCAAGGC GTCACATGCC TCCCTGGGTG TGCAGGTGAC CAATGACAAA 60GACACCCCGG GCGCCAAGAT CGTCGAAGTA GTGGCCGGTG GTGCTGCCGC GAACGCTGGA 120GTGCCGAAGG GCGTCGTTGT CACCAAGGTC GACGACCGCC CGATCAACAG CGCGGACGCG 180TTGGTTGCCG CCGTGCGGTC CAAAGCGCCG GGCGCCACGG TGGCGCTAAC CTTTCAGGAT 240CCCTCGGGCG GTAGCCGCAC AGTGCAAGTC ACCCTCGGCA AGGCGGAGCA GTGATGAAGG 300TCGCCGCGCA GTGTTCAAAG CTCGGATATA CGGTGGCACC CATGGAACAG CGTGCGGAGT 360TGGTGGTTGG CCGGGCACTT GTCGTCGTCG TTGACGATCG CACGGCGCAC GGCGATGAAG 420ACCACAGCGG GCCGCTTGTC ACCGAGCTGC TCACCGAGGC CGGGTTTGTT GTCGACGGCG 480TGGTGGCGGT GTCGGCCGAC GAGGTCGAGA TCCGAAATGC GCTGAACACA GCGGTGATCG 540GCGGGGTGGA CCTGGTGGTG TCGGTCGGCG GGACCGGNGT GACGNCTCGC GATGTCACCC 600CGGAAGCCAC CCGNGACATT CT 622(2)SEQ ID NO11的信息(i)序列特征(A)长度1200个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO11GGCGCAGCGG TAAGCCTGTT GGCCGCCGGC ACACTGGTGT TGACAGCATG CGGCGGTGGC 60ACCAACAGCT CGTCGTCAGG CGCAGGCGGA ACGTCTGGGT CGGTGCACTG CGGCGGCAAG 120AAGGAGCTCC ACTCCAGCGG CTCGACCGCA CAAGAAAATG CCATGGAGCA GTTCGTCTAT 180GCCTACGTGC GATCGTGCCC GGGCTACACG TTGGACTACA ACGCCAACGG GTCCGGTGCC 240GGGGTGACCC AGTTTCTCAA CAACGAAACC GATTTCGCCG GCTCGGATGT CCCGTTGAAT 300CCGTCGACCG GTCAACCTGA CCGGTCGGCG GAGCGGTGCG GTTCCCCGGC ATGGGACCTG 360CCGACGGTGT TCGGCCCGAT CGCGATCACC TACAATATCA AGGGCGTGAG CACGCTGAAT 420CTTGACGGAC CCACTACCGC CAAGATTTTC AACGGCACCA TCACCGTGTG GAATGATCCA 480CAGATCCAAG CCCTCAACTC CGGCACCGAC CTGCCGCCAA CACCGATTAG CGTTATCTTC 540CGCAGCGACA AGTCCGGTAC GTCGGACAAC TTCCAGAAAT ACCTCGACGG TGTATCCAAC 600GGGGCGTGGG GCAAAGGCGC CAGCGAAACG TTCAGCGGGG GCGTCGGCGT CGGCGCCAGC 660GGGAACAACG GAACGTCGGC CCTACTGCAG ACGACCGACG GGTCGATCAC CTACAACGAG 720TGGTCGTTTG CGGTGGGTAA GCAGTTGAAC ATGGCCCAGA TCATCACGTC GGCGGGTCCG 780GATCCAGTGG CGATCACCAC CGAGTCGGTC GGTAAGACAA TCGCCGGGGC CAAGATCATG 840GGACAAGGCA ACGACCTGGT ATTGGACACG TCGTCGTTCT ACAGACCCAC CCAGCCTGGC 900TCTTACCCGA TCGTGCTGGC GACCTATGAG ATCGTCTGCT CGAAATACCC GGATGCGACG 960ACCGGTACTG CGGTAAGGGC GTTTATGCAA GCCGCGATTG GTCCAGGCCA AGAAGGCCTG 1020GACCAATACG GCTCCATTCC GTTGCCCAAA TCGTTCCAAG CAAAATTGGC GGCCGCGGTG 1080AATGCTATTT CTTGACCTAG TGAAGGGAAT TCGACGGTGA GCGATGCCGT TCCGCAGGTA 1140GGGTCGCAAT TTGGGCCGTA TCAGCTATTG CGGCTGCTGG GCCGAGGCGG GATGGGCGAG 1200(2)SEQ ID NO12的信息(i)序列特征(A)长度1155个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO12GCAAGCAGCT GCAGGTCGTG CTGTTCGACG AACTGGGCAT GCCGAAGACC AAACGCACCA 60AGACCGGCTA CACCACGGAT GCCGACGCGC TGCAGTCGTT GTTCGACAAG ACCGGGCATC 120CGTTTCTGCA ACATCTGCTC GCCCACCGCG ACGTCACCCG GCTCAAGGTC ACCGTCGACG 180GGTTGCTCCA AGCGGTGGCC GCCGACGGCC GCATCCACAC CACGTTCAAC CAGACGATCG 240CCGCGACCGG CCGGCTCTCC TCGACCGAAC CCAACCTGCA GAACATCCCG ATCCGCACCG 300ACGCGGGCCG GCGGATCCGG GACGCGTTCG TGGTCGGGGA CGGTTACGCC GAGTTGATGA 360CGGCCGACTA CAGCCAGATC GAGATGCGGA TCATGGGGCA CCTGTCCGGG GACGAGGGCC 420TCATCGAGGC GTTCAACACC GGGGAGGACC TGTATTCGTT CGTCGCGTCC CGGGTGTTCG 480GTGTGCCCAT CGACGAGGTC ACCGGCGAGT TGCGGCGCCG GGTCAAGGCG ATGTCCTACG 540GGCTGGTTTA CGGGTTGAGC GCCTACGGCC TGTCGCAGCA GTTGAAAATC TCCACCGAGG 600AAGCCAACGA GCAGATGGAC GCGTATTTCG CCCGATTCGG CGGGGTGCGC GACTACCTGC 660GCGCCGTAGT CGAGCGGGCC CGCAAGGACG GCTACACCTC GACGGTGCTG GGCCGTCGCC 720GCTACCTGCC CGAGCTGGAC AGCAGCAACC GTCAAGTGCG GGAGGCCGCC GAGCGGGCGG 780CGCTGAACGC GCCGATCCAG GGCAGCGCGG CCGACATCAT CAAGGTGGCC ATGATCCAGG 840TCGACAAGGC GCTCAACGAG GCACAGCTGG CGTCGCGCAT GCTGCTGCAG GTCCACGACG 900AGCTGCTGTT CGAAATCGCC CCCGGTGAAC GCGAGCGGGT CGAGGCCCTG GTGCGCGACA 960AGATGGGCGG CGCTTACCCG CTCGACGTCC CGCTGGAGGT GTCGGTGGGC TACGGCCGCA 1020GCTGGGACGC GGCGGCGCAC TGAGTGCCGA GCGTGCATCT GGGGCGGGAA TTCGGCGATT 1080TTTCCGCCCT GAGTTCACGC TCGGCGCAAT CGGGACCGAG TTTGTCCAGC GTGTACCCGT 1140CGAGTAGCCT CGTCA 1155(2)SEQ ID NO13的信息(i)序列特征(A)长度1771个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO13GAGCGCCGTC TGGTGTTTGA ACGGTTTTAC CGGTCGGCAT CGGCACGGGC GTTGCCGGGT 60TCGGGCCTCG GGTTGGCGAT CGTCAAACAG GTGGTGCTCA ACCACGGCGG ATTGCTGCGC 120ATCGAAGACA CCGACCCAGG CGGCCAGCCC CCTGGAACGT CGATTTACGT GCTGCTCCCC 180GGCCGTCGGA TGCCGATTCC GCAGCTTCCC GGTGCGACGG CTGGCGCTCG GAGCACGGAC 240ATCGAGAACT CTCGGGGTTC GGCGAACGTT ATCTCAGTGG AATCTCAGTC CACGCGCGCA 300ACCTAGTTGT GCAGTTACTG TTGAAAGCCA CACCCATGCC AGTCCACGCA TGGCCAAGTT 360GGCCCGAGTA GTGGGCCTAG TACAGGAAGA GCAACCTAGC GACATGACGA ATCACCCACG 420GTATTCGCCA CCGCCGCAGC AGCCGGGAAC CCCAGGTTAT GCTCAGGGGC AGCAGCAAAC 480GTACAGCCAG CAGTTCGACT GGCGTTACCC ACCGTCCCCG CCCCCGCAGC CAACCCAGTA 540CCGTCAACCC TACGAGGCGT TGGGTGGTAC CCGGCCGGGT CTGATACCTG GCGTGATTCC 600GACCATGACG CCCCCTCCTG GGATGGTTCG CCAACGCCCT CGTGCAGGCA TGTTGGCCAT 660CGGCGCGGTG ACGATAGCGG TGGTGTCCGC CGGCATCGGC GGCGCGGCCG CATCCCTGGT 720CGGGTTCAAC CGGGCACCCG CCGGCCCCAG CGGCGGCCCA GTGGCTGCCA GCGCGGCGCC 780AAGCATCCCC GCAGCAAACA TGCCGCCGGG GTCGGTCGAA CAGGTGGCGG CCAAGGTGGT 840GCCCAGTGTC GTCATGTTGG AAACCGATCT GGGCCGCCAG TCGGAGGAGG GCTCCGGCAT 900CATTCTGTCT GCCGAGGGGC TGATCTTGAC CAACAACCAC GTGATCGCGG CGGCCGCCAA 960GCCTCCCCTG GGCAGTCCGC CGCCGAAAAC GACGGTAACC TTCTCTGACG GGCGGACCGC 1020ACCCTTCACG GTGGTGGGGG CTGACCCCAC CAGTGATATC GCCGTCGTCC GTGTTCAGGG 1080CGTCTCCGGG CTCACCCCGA TCTCCCTGGG TTCCTCCTCG GACCTGAGGG TCGGTCAGCC 1140GGTGCTGGCG ATCGGGTCGC CGCTCGGTTT GGAGGGCACC GTGACCACGG GGATCGTCAG 1200CGCTCTCAAC CGTCCAGTGT CGACGACCGG CGAGGCCGGC AACCAGAACA CCGTGCTGGA 1260CGCCATTCAG ACCGACGCCG CGATCAACCC CGGTAACTCC GGGGGCGCGC TGGTGAACAT 1320GAACGCTCAA CTCGTCGGAG TCAACTCGGC CATTGCCACG CTGGGCGCGG ACTCAGCCGA 1380TGCGCAGAGC GGCTCGATCG GTCTCGGTTT TGCGATTCCA GTCGACCAGG CCAAGCGCAT 1440CGCCGACGAG TTGATCAGCA CCGGCAAGGC GTCACATGCC TCCCTGGGTG TGCAGGTGAC 1500CAATGACAAA GACACCCCGG GCGCCAAGAT CGTCGAAGTA GTGGCCGGTG GTGCTGCCGC 1560GAACGCTGGA GTGCCGAAGG GCGTCGTTGT CACCAAGGTC GACGACCGCC CGATCAACAG 1620CGCGGACGCG TTGGTTGCCG CCGTGCGGTC CAAAGCGCCG GGCGCCACGG TGGCGCTAAC 1680CTTTCAGGAT CCCTCGGGCG GTAGCCGCAC AGTGCAAGTC ACCCTCGGCA AGGCGGAGCA 1740GTGATGAAGG TCGCCGCGCA GTGTTCAAAG C 1771(2)SEQ ID NO14的信息(i)序列特征(A)长度1058个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO14CTCCACCGCG GTGGCGGCCG CTCTAGAACT AGTGGATCCC CCGGGCTGCA GGAATTCGGC 60ACGAGGATCC GACGTCGCAG GTTGTCGAAC CCGCCGCCGC GGAAGTATCG GTCCATGCCT 120AGCCCGGCGA CGGCGAGCGC CGGAATGGCG CGAGTGAGGA GGCGGGCAAT TTGGCGGGGC 180CCGGCGACGG CGAGCGCCGG AATGGCGCGA GTGAGGAGGC GGGCAGTCAT GCCCAGCGTG 240ATCCAATCAA CCTGCATTCG GCCTGCGGGC CCATTTGACA ATCGAGGTAG TGAGCGCAAA 300TGAATGATGG AAAACGGGCG GTGACGTCCG CTGTTCTGGT GGTGCTAGGT GCCTGCCTGG 360CGTTGTGGCT ATCAGGATGT TCTTCGCCGA AACCTGATGC CGAGGAACAG GGTGTTCCCG 420TGAGCCCGAC GGCGTCCGAC CCCGCGCTCC TCGCCGAGAT CAGGCAGTCG CTTGATGCGA 480CAAAAGGGTT GACCAGCGTG CACGTAGCGG TCCGAACAAC CGGGAAAGTC GACAGCTTGC 540TGGGTATTAC CAGTGCCGAT GTCGACGTCC GGGCCAATCC GCTCGCGGCA AAGGGCGTAT 600GCACCTACAA CGACGAGCAG GGTGTCCCGT TTCGGGTACA AGGCGACAAC ATCTCGGTGA 660AACTGTTCGA CGACTGGAGC AATCTCGGCT CGATTTCTGA ACTGTCAACT TCACGCGTGC 720TCGATCCTGC CGCTGGGGTG ACGCAGCTGC TGTCCGGTGT CACGAACCTC CAAGCGCAAG 780GTACCGAAGT GATAGACGGA ATTTCGACCA CCAAAATCAC CGGGACCATC CCCGCGAGCT 840CTGTCAAGAT GCTTGATCCT GGCGCCAAGA GTGCAAGGCC GGCGACCGTG TGGATTGCCC 900AGGACGGCTC GCACCACCTC GTCCGAGCGA GCATCGACCT CGGATCCGGG TCGATTCAGC 960TCACGCAGTC GAAATGGAAC GAACCCGTCA ACGTCGACTA GGCCGAAGTT GCGTCGACGC1020GTTGNTCGAA ACGCCCTTGT GAACGGTGTC AACGGNAC 1058(2)SEQ ID NO15的信息(i)序列特征(A)长度542个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO15GAATTCGGCA CGAGAGGTGA TCGACATCAT CGGGACCAGC CCCACATCCT GGGAACAGGC 60GGCGGCGGAG GCGGTCCAGC GGGCGCGGGA TAGCGTCGAT GACATCCGCG TCGCTCGGGT 120CATTGAGCAG GACATGGCCG TGGACAGCGC CGGCAAGATC ACCTACCGCA TCAAGCTCGA 180AGTGTCGTTC AAGATGAGGC CGGCGCAACC GCGCTAGCAC GGGCCGGCGA GCAAGACGCA 240AAATCGCACG GTTTGCGGTT GATTCGTGCG ATTTTGTGTC TGCTCGCCGA GGCCTACCAG 300GCGCGGCCCA GGTCCGCGTG CTGCCGTATC CAGGCGTGCA TCGCGATTCC GGCGGCCACG 360CCGGAGTTAA TGCTTCGCGT CGACCCGAAC TGGGCGATCC GCCGGNGAGC TGATCGATGA 420CCGTGGCCAG CCCGTCGATG CCCGAGTTGC CCGAGGAAAC GTGCTGCCAG GCCGGTAGGA 480AGCGTCCGTA GGCGGCGGTG CTGACCGGCT CTGCCTGCGC CCTCAGTGCG GCCAGCGAGC 540GG 542(2)SEQ ID NO16的信息(i)序列特征(A)长度913个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO16CGGTGCCGCC CGCGCCTCCG TTGCCCCCAT TGCCGCCGTC GCCGATCAGC TGCGCATCGC 60CACCATCACC GCCTTTGCCG CCGGCACCGC CGGTGGCGCC GGGGCCGCCG ATGCCACCGC 120TTGACCCTGG CCGCCGGCGC CGCCATTGCC ATACAGCACC CCGCCGGGGG CACCGTTACC 180GCCGTCGCCA CCGTCGCCGC CGCTGCCGTT TCAGGCCGGG GAGGCCGAAT GAACCGCCGC 240CAAGCCCGCC GCCGGCACCG TTGCCGCCTT TTCCGCCCGC CCCGCCGGCG CCGCCAATTG 300CCGAACAGCC AMGCACCGTT GCCGCCAGCC CCGCCGCCGT TAACGGCGCT GCCGGGCGCC 360GCCGCCGGAC CCGCCATTAC CGCCGTTCCC GTTCGGTGCC CCGCCGTTAC CGGCGCCGCC 420GTTTGCCGCC AATATTCGGC GGGCACCGCC AGACCCGCCG GGGCCACCAT TGCCGCCGGG 480CACCGAAACA ACAGCCCAAC GGTGCCGCCG GCCCCGCCGT TTGCCGCCAT CACCGGCCAT 540TCACCGCCAG CACCGCCGTT AATGTTTATG AACCCGGTAC CGCCAGCGCG GCCCCTATTG 600CCGGGCGCCG GAGNGCGTGC CCGCCGGCGC CGCCAACGCC CAAAAGCCCG GGGTTGCCAC 660CGGCCCCGCC GGACCCACCG GTCCCGCCGA TCCCCCCGTT GCCGCCGGTG CCGCCGCCAT 720TGGTGCTGCT GAAGCCGTTA GCGCCGGTTC CGCSGGTTCC GGCGGTGGCG CCNTGGCCGC 780CGGCCCCGCC GTTGCCGTAC AGCCACCCCC CGGTGGCGCC GTTGCCGCCA TTGCCGCCAT 840TGCCGCCGTT GCCGCCATTG CCGCCGTTCC CGCCGCCACC GCCGGNTTGG CCGCCGGCGC 900CGCCGGCGGC CGC913(2)SEQ ID NO17的信息(i)序列特征(A)长度1872个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO17GACTACGTTG GTGTAGAAAA ATCCTGCCGC CCGGACCCTT AAGGCTGGGA CAATTTCTGA 60TAGCTACCCC GACACAGGAG GTTACGGGAT GAGCAATTCG CGCCGCCGCT CACTCAGGTG120GTCATGGTTG CTGAGCGTGC TGGCTGCCGT CGGGCTGGGC CTGGCCACGG CGCCGGCCCA180GGCGGCCCCG CCGGCCTTGT CGCAGGACCG GTTCGCCGAC TTCCCCGCGC TGCCCCTCGA240CCCGTCCGCG ATGGTCGCCC AAGTGGCGCC ACAGGTGGTC AACATCAACA CCAAACTGGG300CTACAACAAC GCCGTGGGCG CCGGGACCGG CATCGTCATC GATCCCAACG GTGTCGTGCT360GACCAACAAC CACGTGATCG CGGGCGCCAC CGACATCAAT GCGTTCAGCG TCGGCTCCGG420CCAAACCTAC GGCGTCGATG TGGTCGGGTA TGACCGCACC CAGGATGTCG CGGTGCTGCA480GCTGCGCGGT GCCGGTGGCC TGCCGTCGGC GGCGATCGGT GGCGGCGTCG CGGTTGGTGA540GCCCGTCGTC GCGATGGGCA ACAGCGGTGG GCAGGGCGGA ACGCCCCGTG CGGTGCCTGG600CAGGGTGGTC GCGCTCGGCC AAACCGTGCA GGCGTCGGAT TCGCTGACCG GTGCCGAAGA660GACATTGAAC GGGTTGATCC AGTTCGATGC CGCAATCCAG CCCGGTGATT CGGGCGGGCC720CGTCGTCAAC GGCCTAGGAC AGGTGGTCGG TATGAACACG GCCGCGTCCG ATAACTTCCA780GCTGTCCCAG GGTGGGCAGG GATTCGCCAT TCCGATCGGG CAGGCGATGG CGATCGCGGG840CCAAATCCGA TCGGGTGGGG GGTCACCCAC CGTTCATATC GGGCCTACCG CCTTCCTCGG900CTTGGGTGTT GTCGACAACA ACGGCAACGG CGCACGAGTC CAACGCGTGG TCGGAAGCGC960TCCGGCGGCA AGTCTCGGCA TCTCCACCGG CGACGTGATC ACCGCGGTCG ACGGCGCTCC 1020GATCAACTCG GCCACCGCGA TGGCGGACGC GCTTAACGGG CATCATCCCG GTGACGTCAT 1080CTCGGTGAAC TGGCAAACCA AGTCGGGCGG CACGCGTACA GGGAACGTGA CATTGGCCGA 1140GGGACCCCCG GCCTGATTTG TCGCGGATAC CACCCGCCGG CCGGCCAATT GGATTGGCGC 1200CAGCCGTGAT TGCCGCGTGA GCCCCCGAGT TCCGTCTCCC GTGCGCGTGG CATTGTGGAA 1260GCAATGAACG AGGCAGAACA CAGCGTTGAG CACCCTCCCG TGCAGGGCAG TTACGTCGAA 1320GGCGGTGTGG TCGAGCATCC GGATGCCAAG GACTTCGGCA GCGCCGCCGC CCTGCCCGCC1380GATCCGACCT GGTTTAAGCA CGCCGTCTTC TACGAGGTGC TGGTCCGGGC GTTCTTCGAC1440GCCAGCGCGG ACGGTTCCGN CGATCTGCGT GGACTCATCG ATCGCCTCGA CTACCTGCAG1500TGGCTTGGCA TCGACTGCAT CTGTTGCCGC CGTTCCTACG ACTCACCGCT GCGCGACGGC1560GGTTACGACA TTCGCGACTT CTACAAGGTG CTGCCCGAAT TCGGCACCGT CGACGATTTC1620GTCGCCCTGG TCGACACCGC TCACCGGCGA GGTATCCGCA TCATCACCGA CCTGGTGATG1680AATCACACCT CGGAGTCGCA CCCCTGGTTT CAGGAGTCCC GCCGCGACCC AGACGGACCG1740TACGGTGACT ATTACGTGTG GAGCGACACC AGCGAGCGCT ACACCGACGC CCGGATCATC1800TTCGTCGACA CCGAAGAGTC GAACTGGTCA TTCGATCCTG TCCGCCGACA GTTNCTACTG1860GCACCGATTC TT1872(2)SEQ ID NO18的信息(i)序列特征(A)长度1482个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO18CTTCGCCGAA ACCTGATGCC GAGGAACAGG GTGTTCCCGT GAGCCCGACG GCGTCCGACC 60CCGCGCTCCT CGCCGAGATC AGGCAGTCGC TTGATGCGAC AAAAGGGTTG ACCAGCGTGC 120ACGTAGCGGT CCGAACAACC GGGAAAGTCG ACAGCTTGCT GGGTATTACC AGTGCCGATG 180TCGACGTCCG GGCCAATCCG CTCGCGGCAA AGGGCGTATG CACCTACAAC GACGAGCAGG 240GTGTCCCGTT TCGGGTACAA GGCGACAACA TCTCGGTGAA ACTGTTCGAC GACTGGAGCA 300ATCTCGGCTC GATTTCTGAA CTGTCAACTT CACGCGTGCT CGATCCTGCC GCTGGGGTGA 360CGCAGCTGCT GTCCGGTGTC ACGAACCTCC AAGCGCAAGG TACCGAAGTG ATAGACGGAA 420TTTCGACCAC CAAAATCACC GGGACCATCC CCGCGAGCTC TGTCAAGATG CTTGATCCTG 480GCGCCAAGAG TGCAAGGCCG GCGACCGTGT GGATTGCCCA GGACGGCTCG CACCACCTCG 540TCCGAGCGAG CATCGACCTC GGATCCGGGT CGATTCAGCT CACGCAGTCG AAATGGAACG 600AACCCGTCAA CGTCGACTAG GCCGAAGTTG CGTCGACGCG TTGCTCGAAA CGCCCTTGTG 660AACGGTGTCA ACGGCACCCG AAAACTGACC CCCTGACGGC ATCTGAAAAT TGACCCCCTA 720GACCGGGCGG TTGGTGGTTA TTCTTCGGTG GTTCCGGCTG GTGGGACGCG GCCGAGGTCG 780CGGTCTTTGA GCCGGTAGCT GTCGCCTTTG AGGGCGACGA CTTCAGCATG GTGGACGAGG 840CGGTCGATCA TGGCGGCAGC AACGACGTCG TCGCCGCCGA AAACCTCGCC CCACCGGCCG 900AAGGCCTTAT TGGACGTGAC GATCAAGCTG GCCCGCTCAT ACCGGGAGGA CACCAGCTGG 960AAGAAGAGGT TGGCGGCCTC GGGCTCAAAC GGAATGTAAC CGACTTCGTC AACCACCAGG1020AGCGGATAGC GGCCAAACCG GGTGAGTTCG GCGTAGATGC GCCCGGCGTG GTGAGCCTCG1080GCGAACCGTG CTACCCATTC GGCGGCGGTG GCGAACAGCA CCCGATGACC GGCCTGACAC1140GCGCGTATCG CCAGGCCGAC CGCAAGATGA GTCTTCCCGG TGCCAGGCGG GGCCCAAAAA 1200CACGACGTTA TCGCGGGCGG TGATGAAATC CAGGGTGCCC AGATGTGCGA TGGTGTCGCG 1260TTTGAGGCCA CGAGCATGCT CAAAGTCGAA CTCTTCCAAC GACTTCCGAA CCGGGAAGCG 1320GGCGGCGCGG ATGCGGCCCT CACCACCATG GGACTCCCGG GCTGACACTT CCCGCTGCAG 1380GCAGGCGGCC AGGTATTCTT CGTGGCTCCA GTTCTCGGCG CGGGCGCGAT CGGCCAGCCG 1440GGACACTGAC TCACGCAGGG TGGGAGCTTT CAATGCTCTT GT 1482(2)SEQ ID NO19的信息(i)序列特征(A)长度876个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO19GAATTCGGCA CGAGCCGGCG ATAGCTTCTG GGCCGCGGCC GACCAGATGG CTCGAGGGTT 60CGTGCTCGGG GCCACCGCCG GGCGCACCAC CCTGACCGGT GAGGGCCTGC AACACGCCGA 120CGGTCACTCG TTGCTGCTGG ACGCCACCAA CCCGGCGGTG GTTGCCTACG ACCCGGCCTT 180CGCCTACGAA ATCGGCTACA TCGNGGAAAG CGGACTGGCC AGGATGTGCG GGGAGAACCC 240GGAGAACATC TTCTTCTACA TCACCGTCTA CAACGAGCCG TACGTGCAGC CGCCGGAGCC 300GGAGAACTTC GATCCCGAGG GCGTGCTGGG GGGTATCTAC CGNTATCACG CGGCCACCGA 360GCAACGCACC AACAAGGNGC AGATCCTGGC CTCCGGGGTA GCGATGCCCG CGGCGCTGCG 420GGCAGCACAG ATGCTGGCCG CCGAGTGGGA TGTCGCCGCC GACGTGTGGT CGGTGACCAG 480TTGGGGCGAG CTAAACCGCG ACGGGGTGGT CATCGAGACC GAGAAGCTCC GCCACCCCGA 540TCGGCCGGCG GGCGTGCCCT ACGTGACGAG AGCGCTGGAG AATGCTCGGG GCCCGGTGAT 600CGCGGTGTCG GACTGGATGC GCGCGGTCCC CGAGCAGATC CGACCGTGGG TGCCGGGCAC 660ATACCTCACG TTGGGCACCG ACGGGTTCGG TTTTTCCGAC ACTCGGCCCG CCGGTCGTCG 720TTACTTCAAC ACCGACGCCG AATCCCAGGT TGGTCGCGGT TTTGGGAGGG GTTGGCCGGG 780TCGACGGGTG AATATCGACC CATTCGGTGC CGGTCGTGGG CCGCCCGCCC AGTTACCCGG 840ATTCGACGAA GGTGGGGGGT TGCGCCCGAN TAAGTT 876(2)SEQ ID NO20的信息(i)序列特征(A)长度1021个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO20ATCCCCCCGG GCTGCAGGAA TTCGGCACGA GAGACAAAAT TCCACGCGTT AATGCAGGAA 60CAGATTCATA ACGAATTCAC AGCGGCACAA CAATATGTCG CGATCGCGGT TTATTTCGAC 120AGCGAAGACC TGCCGCAGTT GGCGAAGCAT TTTTACAGCC AAGCGGTCGA GGAACGAAAC 180CATGCAATGA TGCTCGTGCA ACACCTGCTC GACCGCGACC TTCGTGTCGA AATTCCCGGC 240GTAGACACGG TGCGAAACCA GTTCGACAGA CCCCGCGAGG CACTGGCGCT GGCGCTCGAT 300CAGGAACGCA CAGTCACCGA CCAGGTCGGT CGGCTGACAG CGGTGGCCCG CGACGAGGGC 360GATTTCCTCG GCGAGCAGTT CATGCAGTGG TTCTTGCAGG AACAGATCGA AGAGGTGGCC 420TTGATGGCAA CCCTGGTGCG GGTTGCCGAT CGGGCCGGGG CCAACCTGTT CGAGCTAGAG 480AACTTCGTCG CACGTGAAGT GGATGTGGCG CCGGCCGCAT CAGGCGCCCC GCACGCTGCC 540GGGGGCCGCC TCTAGATCCC TGGGGGGGAT CAGCGAGTGG TCCCGTTCGC CCGCCCGTCT 600TCCAGCCAGG CCTTGGTGCG GCCGGGGTGG TGAGTACCAA TCCAGGCCAC CCCGACCTCC 660CGGNAAAAGT CGATGTCCTC GTACTCATCG ACGTTCCAGG AGTACACCGC CCGGCCCTGA 720GCTGCCGAGC GGTCAACGAG TTGCGGATAT TCCTTTAACG CAGGCAGTGA GGGTCCCACG 780GCGGTTGGCC CGACCGCCGT GGCCGCACTG CTGGTCAGGT ATCGGGGGGT CTTGGCGAGC 840AACAACGTCG GCAGGAGGGG TGGAGCCCGC CGGATCCGCA GACCGGGGGG GCGAAAACGA 900CATCAACACC GCACGGGATC GATCTGCGGA GGGGGGTGCG GGAATACCGA ACCGGTGTAG 960GAGCGCCAGC AGTTGTTTTT CCACCAGCGA AGCGTTTTCG GGTCATCGGN GGCNNTTAAG1020T 1021(2)SEQ ID NO21的信息(i)序列特征(A)长度321个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO21CGTGCCGACG AACGGAAGAA CACAACCATG AAGATGGTGA AATCGATCGC CGCAGGTCTG 60ACCGCCGCGG CTGCAATCGG CGCCGCTGCG GCCGGTGTGA CTTCGATCAT GGCTGGCGGN 120CCGGTCGTAT ACCAGATGCA GCCGGTCGTC TTCGGCGCGC CACTGCCGTT GGACCCGGNA 180TCCGCCCCTG ANGTCCCGAC CGCCGCCCAG TGGACCAGNC TGCTCAACAG NCTCGNCGAT 240CCCAACGTGT CGTTTGNGAA CAAGGGNAGT CTGGTCGAGG GNGGNATCGG NGGNANCGAG 300GGNGNGNATC GNCGANCACA A 321(2)SEQ ID NO22的信息(i)序列特征(A)长度373个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO22TCTTATCGGT TCCGGTTGGC GACGGGTTTT GGGNGCGGGT GGTTAACCCG CTCGGCCAGC 60CGATCGACGG GCGCGGAGAC GTCGACTCCG ATACTCGGCG CGCGCTGGAG CTCCAGGCGC 120CCTCGGTGGT GNACCGGCAA GGCGTGAAGG AGCCGTTGNA GACCGGGATC AAGGCGATTG 180ACGCGATGAC CCCGATCGGC CGCGGGCAGC GCCAGCTGAT CATCGGGGAC CGCAAGACCG 240GCAAAAACCG CCGTCTGTGT CGGACACCAT CCTCAAACCA GCGGGAAGAA CTGGGAGTCC 300GGTGGATCCC AAGAAGCAGG TGCGCTTGTG TATACGTTGG CCATCGGGCA AGAAGGGGAA 360CTTACCATCG CCG373(2)SEQ ID NO23的信息(i)序列特征(A)长度352个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO23GTGACGCCGT GATGGGATTC CTGGGCGGGG CCGGTCCGCT GGCGGTGGTG GATCAGCAAC 60TGGTTACCCG GGTGCCGCAA GGCTGGTCGT TTGCTCAGGC AGCCGCTGTG CCGGTGGTGT 120TCTTGACGGC CTGGTACGGG TTGGCCGATT TAGCCGAGAT CAAGGCGGGC GAATCGGTGC 180TGATCCATGC CGGTACCGGC GGTGTGGGCA TGGCGGCTGT GCAGCTGGCT CGCCAGTGGG240GCGTGGAGGT TTTCGTCACC GCCAGCCGTG GNAAGTGGGA CACGCTGCGC GCCATNGNGT300TTGACGACGA NCCATATCGG NGATTCCCNC ACATNCGAAG TTCCGANGGA GA352(2)SEQ ID NO24的信息(i)序列特征(A)长度726个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO24GAAATCCGCG TTCATTCCGT TCGACCAGCG GCTGGCGATA ATCGACGAAG TGATCAAGCC 60GCGGTTCGCG GCGCTCATGG GTCACAGCGA GTAATCAGCA AGTTCTCTGG TATATCGCAC 120CTAGCGTCCA GTTGCTTGCC AGATCGCTTT CGTACCGTCA TCGCATGTAC CGGTTCGCGT 180GCCGCACGCT CATGCTGGCG GCGTGCATCC TGGCCACGGG TGTGGCGGGT CTCGGGGTCG 240GCGCGCAGTC CGCAGCCCAA ACCGCGCCGG TGCCCGACTA CTACTGGTGC CCGGGGCAGC 300CTTTCGACCC CGCATGGGGG CCCAACTGGG ATCCCTACAC CTGCCATGAC GACTTCCACC 360GCGACAGCGA CGGCCCCGAC CACAGCCGCG ACTACCCCGG ACCCATCCTC GAAGGTCCCG 420TGCTTGACGA TCCCGGTGCT GCGCCGCCGC CCCCGGCTGC CGGTGGCGGC GCATAGCGCT 480CGTTGACCGG GCCGCATCAG CGAATACGCG TATAAACCCG GGCGTGCCCC CGGCAAGCTA 540CGACCCCCGG CGGGGCAGAT TTACGCTCCC GTGCCGATGG ATCGCGCCGT CCGATGACAG 600AAAATAGGCG ACGGTTTTGG CAACCGCTTG GAGGACGCTT GAAGGGAACC TGTCATGAAC 660GGCGACAGCG CCTCCACCAT CGACATCGAC AAGGTTGTTA CCCGCACACC CGTTCGCCGG 720ATCGTG 726(2)SEQ ID NO25的信息(i)序列特征(A)长度580个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO25CGCGACGACG ACGAACGTCG GGCCCACCAC CGCCTATGCG TTGATGCAGG CGACCGGGAT 60GGTCGCCGAC CATATCCAAG CATGCTGGGT GCCCACTGAG CGACCTTTTG ACCAGCCGGG 120CTGCCCGATG GCGGCCCGGT GAAGTCATTG CGCCGGGGCT TGTGCACCTG ATGAACCCGA 180ATAGGGAACA ATAGGGGGGT GATTTGGCAG TTCAATGTCG GGTATGGCTG GAAATCCAAT 240GGCGGGGCAT GCTCGGCGCC GACCAGGCTC GCGCAGGCGG GCCAGCCCGA ATCTGGAGGG 300AGCACTCAAT GGCGGCGATG AAGCCCCGGA CCGGCGACGG TCCTTTGGAA GCAACTAAGG 360AGGGGCGCGG CATTGTGATG CGAGTACCAC TTGAGGGTGG CGGTCGCCTG GTCGTCGAGC 420TGACACCCGA CGAAGCCGCC GCACTGGGTG ACGAACTCAA AGGCGTTACT AGCTAAGACC 480AGCCCAACGG CGAATGGTCG GCGTTACGCG CACACCTTCC GGTAGATGTC CAGTGTCTGC 540TCGGCGATGT ATGCCCAGGA GAACTCTTGG ATACAGCGCT 580(2)SEQ ID NO26的信息(i)序列特征(A)长度160个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO26AACGGAGGCG CCGGGGGTTT TGGCGGGGCC GGGGCGGTCG GCGGCAACGG CGGGGCCGGC 60GGTACCGCCG GGTTGTTCGG TGTCGGCGGG GCCGGTGGGG CCGGAGGCAA CGGCATCGCC 120GGTGTCACGG GTACGTCGGC CAGCACACCG GGTGGATCCG 160(2)SEQ ID NO27的信息(i)序列特征(A)长度272个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO27GACACCGATA CGATGGTGAT GTACGCCAAC GTTGTCGACA CGCTCGAGGC GTTCACGATC 60CAGCGCACAC CCGACGGCGT GACCATCGGC GATGCGGCCC CGTTCGCGGA GGCGGCTGCC 120AAGGCGATGG GAATCGACAA GCTGCGGGTA ATTCATACCG GAATGGACCC CGTCGTCGCT 180GAACGCGAAC AGTGGGACGA CGGCAACAAC ACGTTGGCGT TGGCGCCCGG TGTCGTTGTC 240GCCTACGAGC GCAACGTACA GACCAACGCC CG 272(2)SEQ ID NO28的信息(i)序列特征(A)长度317个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO28GCAGCCGGTG GTTCTCGGAC TATCTGCGCA CGGTGACGCA GCGCGACGTG CGCGAGCTGA 60AGCGGATCGA GCAGACGGAT CGCCTGCCGC GGTTCATGCG CTACCTGGCC GCTATCACCG 120CGCAGGAGCT GAACGTGGCC GAAGCGGCGC GGGTCATCGG GGTCGACGCG GGGACGATCC 180GTTCGGATCT GGCGTGGTTC GAGACGGTCT ATCTGGTACA TCGCCTGCCC GCCTGGTCGC 240GGAATCTGAC CGCGAAGATC AAGAAGCGGT CAAAGATCCA CGTCGTCGAC AGTGGCTTCG 300CGGCCTGGTT GCGCGGG317(2)SEQ ID NO29的信息(i)序列特征(A)长度182个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO29GATCGTGGAG CTGTCGATGA ACAGCGTTGC CGGACGCGCG GCGGCCAGCA CGTCGGTGTA 60GCAGCGCCGG ACCACCTCGC CGGTGGGCAG CATGGTGATG ACCACGTCGG CCTCGGCCAC 120CGCTTCGGGC GCGCTACGAA ACACCGCGAC ACCGTGCGCG GCGGCGCCGG ACGCCGCCGT 180GG 182(2)SEQ ID NO30的信息(i)序列特征(A)长度308个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO30GATCGCGAAG TTTGGTGAGC AGGTGGTCGA CGCGAAAGTC TGGGCGCCTG CGAAGCGGGT 60CGGCGTTCAC GAGGCGAAGA CACGCCTGTC CGAGCTGCTG CGGCTCGTCT ACGGCGGGCA 120GAGGTTGAGA TTGCCCGCCG CGGCGAGCCG GTAGCAAAGC TTGTGCCGCT GCATCCTCAT 180GAGACTCGGC GGTTAGGCAT TGACCATGGC GTGTACCGCG TGCCCGACGA TTTGGACGCT 240CCGTTGTCAG ACGACGTGCT CGAACGCTTT CACCGGTGAA GCGCTACCTC ATCGACACCC 300ACGTTTGG 308(2)SEQ ID NO31的信息(i)序列特征(A)长度267个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO31CCGACGACGA GCAACTCACG TGGATGATGG TCGGCAGCGG CATTGAGGAC GGAGAGAATC 60CGGCCGAAGC TGCCGCGCGG CAAGTGCTCA TAGTGACCGG CCGTAGAGGG CTCCCCCGAT 120GGCACCGGAC TATTCTGGTG TGCCGCTGGC CGGTAAGAGC GGGTAAAAGA ATGTGAGGGG 180ACACGATGAG CAATCACACC TACCGAGTGA TCGAGATCGT CGGGACCTCG CCCGACGGCG 240TCGACGCGGC AATCCAGGGC GGTCTGG267(2)SEQ ID NO32的信息(i)序列特征(A)长度189个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEO ID NO32CTCGTGCCGA AAGAATGTGA GGGGACACGA TGAGCAATCA CACCTACCGA GTGATCGAGA 60TCGTCGGGAC CTCGCCCGAC GGCGTCGACG CGGCAATCCA GGGCGGTCTG GCCCGAGCTG 120CGCAGACCAT GCGCGCGCTG GACTGGTTCG AAGTACAGTC AATTCGAGGC CACCTGGTCG 180ACGGAGCGG 189(2)SEQ ID NO33的信息(i)序列特征(A)长度851个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO33CTGCAGGGTG GCGTGGATGA GCGTCACCGC GGGGCAGGCC GAGCTGACCG CCGCCCAGGT 60CCGGGTTGCT GCGGCGGCCT ACGAGACGGC GTATGGGCTG ACGGTGCCCC CGCCGGTGAT 120CGCCGAGAAC CGTGCTGAAC TGATGATTCT GATAGCGACC AACCTCTTGG GGCAAAACAC 180CCCGGCGATC GCGGTCAACG AGGCCGAATA CGGCGAGATG TGGGCCCAAG ACGCCGCCGC 240GATGTTTGGC TACGCCGCGG CGACGGCGAC GGCGACGGCG ACGTTGCTGC CGTTCGAGGA 300GGCGCCGGAG ATGACCAGCG CGGGTGGGCT CCTCGAGCAG GCCGCCGCGG TCGAGGAGGC 360CTCCGACACC GCCGCGGCGA ACCAGTTGAT GAACAATGTG CCCCAGGCGC TGAAACAGTT 420GGCCCAGCCC ACGCAGGGCA CCACGCCTTC TTCCAAGCTG GGTGGCCTGT GGAAGACGGT 480CTCGCCGCAT CGGTCGCCGA TCAGCAACAT GGTGTCGATG GCCAACAACC ACATGTCGAT 540GACCAACTCG GGTGTGTCGA TGACCAACAC CTTGAGCTCG ATGTTGAAGG GCTTTGCTCC 600GGCGGCGGCC GCCCAGGCCG TGCAAACCGC GGCGCAAAAC GGGGTCCGGG CGATGAGCTC 660GCTGGGCAGC TCGCTGGGTT CTTCGGGTCT GGGCGGTGGG GTGGCCGCCA ACTTGGGTCG 720GGCGGCCTCG GTACGGTATG GTCACCGGGA TGGCGGAAAA TATGCANAGT CTGGTCGGCG 780GAACGGTGGT CCGGCGTAAG GTTTACCCCC GTTTTCTGGA TGCGGTGAAC TTCGTCAACG 840GAAACAGTTA C 851(2)SEQ ID NO34的信息(i)序列特征(A)长度254个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO34GATCGATCGG GCGGAAATTT GGACCAGATT CGCCTCCGGC GATAACCCAA TCAATCGAAC 60CTAGATTTAT TCCGTCCAGG GGCCCGAGTA ATGGCTCGCA GGAGAGGAAC CTTACTGCTG 120CGGGCACCTG TCGTAGGTCC TCGATACGGC GGAAGGCGTC GACATTTTCC ACCGACACCC 180CCATCCAAAC GTTCGAGGGC CACTCCAGCT TGTGAGCGAG GCGACGCAGT CGCAGGCTGC 240GCTTGGTCAA GATC254(2)SEQ ID NO35的信息(i)序列特征(A)长度408个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO35CGGCACGAGG ATCCTGACCG AAGCGGCCGC CGCCAAGGCG AAGTCGCTGT TGGACCAGGA 60GGGACGGGAC GATCTGGCGC TGCGGATCGC GGTTCAGCCG GGGGGGTGCG CTGGATTGCG 120CTATAACCTT TTCTTCGACG ACCGGACGCT GGATGGTGAC CAAACCGCGG AGTTCGGTGG 180TGTCAGGTTG ATCGTGGACC GGATGAGCGC GCCGTATGTG GAAGGCGCGT CGATCGATTT 240CGTCGACACT ATTGAGAAGC AAGGNTTCAC CATCGACAAT CCCAACGCCA CCGGCTCCTG 300CGCGTGCGGG GATTCGTTCA ACTGATAAAA CGCTAGTACG ACCCCGCGGT GCGCAACACG 360TACGAGCACA CCAAGACCTG ACCGCGCTGG AAAAGCAACT GAGCGATG408(2)SEQ ID NO36的信息(i)序列特征(A)长度181个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO36GCGGTGTCGG CGGATCCGGC GGGTGGTTGA ACGGCAACGG CGGGGCCGGC GGGGCCGGCG 60GGACCGGCGC TAACGGTGGT GCCGGCGGCA ACGCCTGGTT GTTCGGGGCC GGCGGGTCCG 120GCGGNGCCGG CACCAATGGT GGNGTCGGCG GGTCCGGCGG ATTTGTCTAC GGCAACGGCG 180G 181(2)SEQ ID NO37的信息(i)序列特征(A)长度290个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO37GCGGTGTCGG CGGATCCGGC GGGTGGTTGA ACGGCAACGG CGGTGTCGGC GGCCGGGGCG 60GCGACGGCGT CTTTGCCGGT GCCGGCGGCC AGGGCGGCCT CGGTGGGCAG GGCGGCAATG 120GCGGCGGCTC CACCGGCGGC AACGGCGGTC TTGGCGGCGC GGGCGGTGGC GGAGGCAACG 180CCCCGGACGG CGGCTTCGGT GGCAACGGCG GTAAGGGTGG CCAGGGCGGN ATTGGCGGCG 240GCACTCAGAG CGCGACCGGC CTCGGNGGTG ACGGCGGTGA CGGCGGTGAC 290(2)SEQ ID NO38的信息(i)序列特征(A)长度34个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEO ID NO38GATCCAGTGG CATGGNGGGT GTCAGTGGAA GCAT34(2)SEQ ID NO39的信息(i)序列特征(A)长度155个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO39GATCGCTGCT CGTCCCCCCC TTGCCGCCGA CGCCACCGGT CCCACCGTTA CCGAACAAGC 60TGGCGTGGTC GCCAGCACCC CCGGCACCGC CGACGCCGGA GTCGAACAAT GGCACCGTCG 120TATCCCCACC ATTGCCGCCG GNCCCACCGG CACCG 155(2)SEQ ID NO40的信息(i)序列特征(A)长度53个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO40ATGGCGTTCA CGGGGCGCCG GGGACCGGGC AGCCCGGNGG GGCCGGGGGG TGG 53(2)SEQ ID NO41的信息(i)序列特征(A)长度132个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO41GATCCACCGC GGGTGCAGAC GGTGCCCGCG GCGCCACCCC GACCAGCGGC GGCAACGGCG 60GCACCGGCGG CAACGGCGCG AACGCCACCG TCGTCGGNGG GGCCGGCGGG GCCGGCGGCA 120AGGGCGGCAA CG 132(2)SEQ ID NO42的信息(i)序列特征(A)长度132个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO42GATCGGCGGC CGGNACGGNC GGGGACGGCG GCAAGGGCGG NAACGGGGGC GCCGNAGCCA 60CCNGCCAAGA ATCCTCCGNG TCCNCCAATG GCGCGAATGG CGGACAGGGC GGCAACGGCG120GCANCGGCGG CA132(2)SEQ ID NO43的信息(i)序列特征(A)长度702个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO43CGGCACGAGG ATCGGTACCC CGCGGCATCG GCAGCTGCCG ATTCGCCGGG TTTCCCCACC 60CGAGGAAAGC CGCTACCAGA TGGCGCTGCC GAAGTAGGGC GATCCGTTCG CGATGCCGGC120ATGAACGGGC GGCATCAAAT TAGTGCAGGA ACCTTTCAGT TTAGCGACGA TAATGGCTAT180AGCACTAAGG AGGATGATCC GATATGACGC AGTCGCAGAC CGTGACGGTG GATCAGCAAG240AGATTTTGAA CAGGGCCAAC GAGGTGGAGG CCCCGATGGC GGACCCACCG ACTGATGTCC300CCATCACACC GTGCGAACTC ACGGNGGNTA AAAACGCCGC CCAACAGNTG GTNTTGTCCG360CCGACAACAT GCGGGAATAC CTGGCGGCCG GTGCCAAAGA GCGGCAGCGT CTGGCGACCT420CGCTGCGCAA CGCGGCCAAG GNGTATGGCG AGGTTGATGA GGAGGCTGCG ACCGCGCTGG480ACAACGACGG CGAAGGAACT GTGCAGGCAG AATCGGCCGG GGCCGTCGGA GGGGACAGTT540CGGCCGAACT AACCGATACG CCGAGGGTGG CCACGGCCGG TGAACCCAAC TTCATGGATC600TCAAAGAAGC GGCAAGGAAG CTCGAAACGG GCGACCAAGG CGCATCGCTC GCGCACTGNG660GGGATGGGTG GAACACTTNC ACCCTGACGC TGCAAGGCGA CG702(2)SEQ ID NO44的信息(i)序列特征(A)长度298个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO44GAAGCCGCAG CGCTGTCGGG CGACGTGGCG GTCAAAGCGG CATCGCTCGG TGGCGGTGGA 60GGCGGCGGGG TGCCGTCGGC GCCGTTGGGA TCCGCGATCG GGGGCGCCGA ATCGGTGCGG 120CCCGCTGGCG CTGGTGACAT TGCCGGCTTA GGCCAGGGAA GGGCCGGCGG CGGCGCCGCG 180CTGGGCGGCG GTGGCATGGG AATGCCGATG GGTGCCGCGC ATCAGGGACA AGGGGGCGCC 240AAGTCCAAGG GTTCTCAGCA GGAAGACGAG GCGCTCTACA CCGAGGATCC TCGTGCCG298(2)SEQ ID NO45的信息(i)序列特征(A)长度1058个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO45CGGCACGAGG ATCGAATCGC GTCGCCGGGA GCACAGCGTC GCACTGCACC AGTGGAGGAG 60CCATGACCTA CTCGCCGGGT AACCCCGGAT ACCCGCAAGC GCAGCCCGCA GGCTCCTACG 120GAGGCGTCAC ACCCTCGTTC GCCCACGCCG ATGAGGGTGC GAGCAAGCTA CCGATGTACC 180TGAACATCGC GGTGGCAGTG CTCGGTCTGG CTGCGTACTT CGCCAGCTTC GGCCCAATGT 240TCACCCTCAG TACCGAACTC GGGGGGGGTG ATGGCGCAGT GTCCGGTGAC ACTGGGCTGC 300CGGTCGGGGT GGCTCTGCTG GCTGCGCTGC TTGCCGGGGT GGTTCTGGTG CCTAAGGCCA 360AGAGCCATGT GACGGTAGTT GCGGTGCTCG GGGTACTCGG CGTATTTCTG ATGGTCTCGG 420CGACGTTTAA CAAGCCCAGC GCCTATTCGA CCGGTTGGGC ATTGTGGGTT GTGTTGGCTT 480TCATCGTGTT CCAGGCGGTT GCGGCAGTCC TGGCGCTCTT GGTGGAGACC GGCGCTATCA 540CCGCGCCGGC GCCGCGGCCC AAGTTCGACC CGTATGGACA GTACGGGCGG TACGGGCAGT 600ACGGGCAGTA CGGGGTGCAG CCGGGTGGGT ACTACGGTCA GCAGGGTGCT CAGCAGGCCG 660CGGGACTGCA GTCGCCCGGC CCGCAGCAGT CTCCGCAGCC TCCCGGATAT GGGTCGCAGT 720ACGGCGGCTA TTCGTCCAGT CCGAGCCAAT CGGGCAGTGG ATACACTGCT CAGCCCCCGG 780CCCAGCCGCC GGCGCAGTCC GGGTCGCAAC AATCGCACCA GGGCCCATCC ACGCCACCTA 840CCGGCTTTCC GAGCTTCAGC CCACCACCAC CGGTCAGTGC CGGGACGGGG TCGCAGGCTG 900GTTCGGCTCC AGTCAACTAT TCAAACCCCA GCGGGGGCGA GCAGTCGTCG TCCCCCGGGG 960GGGCGCCGGT CTAACCGGGC GTTCCCGCGT CCGGTCGCGC GTGTGCGCGA AGAGTGAACA 1020GGGTGTCAGC AAGCGCGGAC GATCCTCGTG CCGAATTC 1058(2)SEQ ID NO46的信息(i)序列特征(A)长度327个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO46CGGCACGAGA GACCGATGCC GCTACCCTCG CGCAGGAGGC AGGTAATTTC GAGCGGATCT 60CCGGCGACCT GAAAACCCAG ATCGACCAGG TGGAGTCGAC GGCAGGTTCG TTGCAGGGCC 120AGTGGCGCGG CGCGGCGGGG ACGGCCGCCC AGGCCGCGGT GGTGCGCTTC CAAGAAGCAG 180CCAATAAGCA GAAGCAGGAA CTCGACGAGA TCTCGACGAA TATTCGTCAG GCCGGCGTCC 240AATACTCGAG GGCCGACGAG GAGCAGCAGC AGGCGCTGTC CTCGCAAATG GGCTTCTGAC 300CCGCTAATAC GAAAAGAAAC GGAGCAA327(2)SEQ ID NO47的信息(i)序列特征(A)长度170个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO47CGGTCGCGAT GATGGCGTTG TCGAACGTGA CCGATTCTGT ACCGCCGTCG TTGAGATCAA 60CCAACAACGT GTTGGCGTCG GCAAATGTGC CGNACCCGTG GATCTCGGTG ATCTTGTTCT 120TCTTCATCAG GAAGTGCACA CCGGCCACCC TGCCCTCGGN TACCTTTCGG 170(2)SEQ ID NO48的信息(i)序列特征(A)长度127个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO48GATCCGGCGG CACGGGGGGT GCCGGCGGCA GCACCGCTGG CGCTGGCGGC AACGGCGGGG 60CCGGGGGTGG CGGCGGAACC GGTGGGTTGC TCTTCGGCAA CGGCGGTGCC GGCGGGCACG 120GGGCCGT127(2)SEQ ID NO49的信息(i)序列特征(A)长度81个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO49CGGCGGCAAG GGCGGCACCG CCGGCAACGG GAGCGGCGCG GCCGGCGGCA ACGGCGGCAA60CGGCGGCTCC GGCCTCAACG G 81(2)SEQ ID NO50的信息(i)序列特征(A)长度149个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO50GATCAGGGCT GGCCGGCTCC GGCCAGAAGG GCGGTAACGG AGGAGCTGCC GGATTGTTTG60GCAACGGCGG GGCCGGNGGT GCCGGCGCGT CCAACCAAGC CGGTAACGGC GGNGCCGGCG 120GAAACGGTGG TGCCGGTGGG CTGATCTGG149(2)SEQ ID NO51的信息(i)序列特征(A)长度355个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述 SEQ ID NO51CGGCACGAGA TCACACCTAC CGAGTGATCG AGATCGTCGG GACCTCGCCC GACGGTGTCG60ACGCGGNAAT CCAGGGCGGT CTGGCCCGAG CTGCGCAGAC CATGCGCGCG CTGGACTGGT 120TCGAAGTACA GTCAATTCGA GGCCACCTGG TCGACGGAGC GGTCGCGCAC TTCCAGGTGA 180CTATGAAAGT CGGCTTCCGC CTGGAGGATT CCTGAACCTT CAAGCGCGGC CGATAACTGA 240GGTGCATCAT TAAGCGACTT TTCCAGAACA TCCTGACGCG CTCGAAACGC GGTTCAGCCG 300ACGGTGGCTC CGCCGAGGCG CTGCCTCCAA AATCCCTGCG ACAATTCGTC GGCGG 355(2)SEQ ID NO52的信息(i)序列特征(A)长度999个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO52ATGCATCACC ATCACCATCA CATGCATCAG GTGGACCCCA ACTTGACACG TCGCAAGGGA 60CGATTGGCGG CACTGGCTAT CGCGGCGATG GCCAGCGCCA GCCTGGTGAC CGTTGCGGTG 120CCCGCGACCG CCAACGCCGA TCCGGAGCCA GCGCCCCCGG TACCCACAAC GGCCGCCTCG 180CCGCCGTCGA CCGCTGCAGC GCCACCCGCA CCGGCGACAC CTGTTGCCCC CCCACCACCG 240GCCGCCGCCA ACACGCCGAA TGCCCAGCCG GGCGATCCCA ACGCAGCACC TCCGCCGGCC 300GACCCGAACG CACCGCCGCC ACCTGTCATT GCCCCAAACG CACCCCAACC TGTCCGGATC 360GACAACCCGG TTGGAGGATT CAGCTTCGCG CTGCCTGCTG GCTGGGTGGA GTCTGACGCC 420GCCCACTTCG ACTACGGTTC AGCACTCCTC AGCAAAACCA CCGGGGACCC GCCATTTCCC 480GGACAGCCGC CGCCGGTGGC CAATGACACC CGTATCGTGC TCGGCCGGCT AGACCAAAAG 540CTTTACGCCA GCGCCGAAGC CACCGACTCC AAGGCCGCGG CCCGGTTGGG CTCGGACATG 600GGTGAGTTCT ATATGCCCTA CCCGGGCACC CGGATCAACC AGGAAACCGT CTCGCTCGAC 660GCCAACGGGG TGTCTGGAAG CGCGTCGTAT TACGAAGTCA AGTTCAGCGA TCCGAGTAAG 720CCGAACGGCC AGATCTGGAC GGGCGTAATC GGCTCGCCCG CGGCGAACGC ACCGGACGCC 780GGGCCCCCTC AGCGCTGGTT TGTGGTATGG CTCGGGACCG CCAACAACCC GGTGGACAAG 840GGCGCGGCCA AGGCGCTGGC CGAATCGATC CGGCCTTTGG TCGCCCCGCC GCCGGCGCCG 900GCACCGGCTC CTGCAGAGCC CGCTCCGGCG CCGGCGCCGG CCGGGGAAGT CGCTCCTACC 960CCGACGACAC CGACACCGCA GCGGACCTTA CCGGCCTGA 999(2)SEQ ID NO53的信息(i)序列特征(A)长度332个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO53Met His His His His His His Met His Gln Val Asp Pro Asn Leu Thr1 5 10 15Arg Arg Lys Gly Arg Leu Ala Ala Leu Ala Ile Ala Ala Met Ala Ser20 25 30Ala Ser Leu Val Thr Val Ala Val Pro Ala Thr Ala Asn Ala Asp Pro35 40 45Glu Pro Ala Pro Pro Val Pro Thr Thr Ala Ala Ser Pro Pro Ser Thr50 55 60Ala Ala Ala Pro Pro Ala Pro Ala Thr Pro Val Ala Pro Pro Pro Pro65 70 75 80Ala Ala Ala Asn Thr Pro Asn Ala Gln Pro Gly Asp Pro Asn Ala Ala85 90 95Pro Pro Pro Ala Asp Pro Asn Ala Pro Pro Pro Pro Val Ile Ala Pro100 105 110Asn Ala Pro Gln Pro Val Arg Ile Asp Asn Pro Val Gly Gly Phe Ser115 120 125Phe Ala Leu Pro Ala Gly Trp Val Glu Ser Asp Ala Ala His Phe Asp130 135 140Tyr Gly Ser Ala Leu Leu Ser Lys Thr Thr Gly Asp Pro Pro Phe Pro145 150 155 160Gly Gln Pro Pro Pro Val Ala Asn Asp Thr Arg Ile Val Leu Gly Arg165 170 175Leu Asp Gln Lys Leu Tyr Ala Ser Ala Glu Ala Thr Asp Ser Lys Ala180 185 190Ala Ala Arg Leu Gly Ser Asp Met Gly Glu Phe Tyr Met Pro Tyr Pro195 200 205Gly Thr Arg Ile Asn Gln Glu Thr Val Ser Leu Asp Ala Asn Gly Val210 215 220Ser Gly Ser Ala Ser Tyr Tyr Glu Val Lys Phe Ser Asp Pro Ser Lys225 230 235 240Pro Asn Gly Gln Ile Trp Thr Gly Val Ile Gly Ser Pro Ala Ala Asn245 250 255Ala Pro Asp Ala Gly Pro Pro Gln Arg Trp Phe Val Val Trp Leu Gly260 265 270Thr Ala Asn Asn Pro Val Asp Lys Gly Ala Ala Lys Ala Leu Ala Glu275 280 285Ser Ile Arg Pro Leu Val Ala Pro Pro Pro Ala Pro Ala Pro Ala Pro290 295 300Ala Glu Pro Ala Pro Ala Pro Ala Pro Ala Gly Glu Val Ala Pro Thr305 310 315 320Pro Thr Thr Pro Thr Pro Gln Arg Thr Leu Pro Ala325 330(2)SEQ ID NO54的信息(i)序列特征(A)长度20个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO54Asp Pro Val Asp Ala Val Ile Asn Thr Thr Xaa Asn Tyr Gly Gln Val1 5 10 15Val Ala Ala Leu20(2)SEQ ID NO55的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO55Ala Val Glu Ser Gly Met Leu Ala Leu Gly Thr Pro Ala Pro Ser1 5 10 15(2)SEQ ID NO56的信息(i)序列特征
(A)长度19个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO56Ala Ala Met Lys Pro Arg Thr Gly Asp Gly Pro Leu Glu Ala Ala Lys1 5 10 15Glu Gly Arg(2)SEQ ID NO57的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO57Tyr Tyr Trp Cys Pro Gly Gln Pro Phe Asp Pro Ala Trp Gly Pro1 5 10 15(2)SEQ ID NO58的信息(i)序列特征(A)长度14个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO58Asp Ile Gly Ser Glu Ser Thr Glu Asp Gln Gln Xaa Ala Val1 5 10(2)SEQ ID NO59的信息
(i)序列特征(A)长度13个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO59Ala Glu Glu Ser Ile Ser Thr Xaa Glu Xaa Ile Val Pro1 5 10(2)SEQ ID NO60的信息(i)序列特征(A)长度17个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO60Asp Pro Glu Pro Ala Pro Pro Val Pro Thr Ala Ala Ala Ala Pro Pro1 5 10 15Ala(2)SEQ ID NO61的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO61Ala Pro Lys Thr Tyr Xaa Glu Glu Leu Lys Gly Thr Asp Thr Gly1 5 10 15(2)SEQ ID NO62的信息(i)序列特征(A)长度30个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO62Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln Gln Thr Ser1 5 10 15Leu Leu Asn Asn Leu Ala Asp Pro Asp Val Ser Phe Ala Asp20 25 30(2)SEQ ID NO63的信息(i)序列特征(A)长度24个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO63Gly Cys Gly Asp Arg Ser Gly Gly Asn Leu Asp Gln Ile Arg Leu Arg1 5 10 15Arg Asp Arg Ser Gly Gly Asn Leu20(2)SEQ ID NO64的信息(i)序列特征(A)长度187个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO64Thr Gly Ser Leu Asn Gln Thr His Asn Arg Arg Ala Asn Glu Arg Lys1 5 10 15Asn Thr Thr Met Lys Met Val Lys Ser Ile Ala Ala Gly Leu Thr Ala20 25 30Ala Ala Ala Ile Gly Ala Ala Ala Ala Gly Val Thr Ser Ile Met Ala35 40 45Gly Gly Pro Val Val Tyr Gln Met Gln Pro Val Val Phe Gly Ala Pro50 55 60Leu Pro Leu Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln65 70 75 80Leu Thr Ser Leu Leu Asn Ser Leu Ala Asp Pro Asn Val Ser Phe Ala85 90 95Asn Lys Gly Ser Leu Val Glu Gly Gly Ile Gly Gly Thr Glu Ala Arg100 105 110Ile Ala Asp His Lys Leu Lys Lys Ala Ala Glu His Gly Asp Leu Pro115 120125Leu Ser Phe Ser Val Thr Asn Ile Gln Pro Ala Ala Ala Gly Ser Ala130 135 140Thr Ala Asp Val Ser Val Ser Gly Pro Lys Leu Ser Ser Pro Val Thr145 150 155 160Gln Asn Val Thr Phe Val Asn Gln Gly Gly Trp Met Leu Ser Arg Ala165 170 175Ser Ala Met Glu Leu Leu Gln Ala Ala Gly Xaa180 185(2)SEQ ID NO65的信息(i)序列特征(A)长度148个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO65Asp Glu Val Thr Val Glu Thr Thr Ser Val Phe Arg Ala Asp Phe Leu1 5 10 15Ser Glu Leu Asp Ala Pro Ala Gln Ala Gly Thr Glu Ser Ala Val Ser20 25 30Gly Val Glu Gly Leu Pro Pro Gly Ser Ala Leu Leu Val Val Lys Arg35 40 45Gly Pro Asn Ala Gly Ser Arg Phe Leu Leu Asp Gln Ala Ile Thr Ser50 55 60Ala Gly Arg His Pro Asp Ser Asp Ile Phe Leu Asp Asp Val Thr Val65 70 75 80Ser Arg Arg His Ala Glu Phe Arg Leu Glu Asn Asn Glu Phe Asn Val85 90 95Val Asp Val Gly Ser Leu Asn Gly Thr Tyr Val Asn Arg Glu Pro Val100 105 110Asp Ser Ala Val Leu Ala Asn Gly Asp Glu Val Gln Ile Gly Lys Leu115 120 125Arg Leu Val Phe Leu Thr Gly Pro Lys Gln Gly Glu Asp Asp Gly Ser130 135 140Thr Gly Gly Pro145(2)SEQ ID NO66的信息(i)序列特征(A)长度230个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO66Thr Ser Asn Arg Pro Ala Arg Arg Gly Arg Arg Ala Pro Arg Asp Thr1 5 10 15Gly Pro Asp Arg Ser Ala Ser Leu Ser Leu Val Arg His Arg Arg Gln20 25 30Gln Arg Asp Ala Leu Cys Leu Ser Ser Thr Gln Ile Ser Arg Gln Ser35 40 45Asn Leu Pro Pro Ala Ala Gly Gly Ala Ala Asn Tyr Ser Arg Arg Asn50 55 60Phe Asp Val Arg Ile Lys Ile Phe Met Leu Val Thr Ala Val Val Leu65 70 75 80Leu Cys Cys Ser Gly Val Ala Thr Ala Ala Pro Lys Thr Tyr Cys Glu85 90 95Glu Leu Lys Gly Thr Asp Thr Gly Gln Ala Cys Gln Ile Gln Met Ser100 105 110Asp Pro Ala Tyr Asn Ile Asn Ile Ser Leu Pro Ser Tyr Tyr Pro Asp115 120 125Gln Lys Ser Leu Glu Asn Tyr Ile Ala Gln Thr Arg Asp Lys Phe Leu130 135 140Ser Ala Ala Thr Ser Ser Thr Pro Arg Glu Ala Pro Tyr Glu Leu Asn145 150 155 160Ile Thr Ser Ala Thr Tyr Gln Ser Ala Ile Pro Pro Arg Gly Thr Gln165 170 175Ala Val Val Leu Xaa Val Tyr His Asn Ala Gly Gly Thr His Pro Thr180 185 190Thr Thr Tyr Lys Ala Phe Asp Trp Asp Gln Ala Tyr Arg Lys Pro Ile195 200 205Thr Tyr Asp Thr Leu Trp Gln Ala Asp Thr Asp Pro Leu Pro Val Val210 215 220Phe Pro Ile Val Ala Arg225 230(2)SEQ ID NO67的信息(i)序列特征(A)长度132个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO67Thr Ala Ala Ser Asp Asn Phe Gln Leu Ser Gln Gly Gly Gln Gly Phe1 5 10 15Ala Ile Pro Ile Gly Gln Ala Met Ala Ile Ala Gly Gln Ile Arg Ser20 25 30Gly Gly Gly Ser Pro Thr Val His Ile Gly Pro Thr Ala Phe Leu Gly35 40 45Leu Gly Val Val Asp Asn Asn Gly Asn Gly Ala Arg Val Gln Arg Val50 55 60Val Gly Ser Ala Pro Ala Ala Ser Leu Gly Ile Ser Thr Gly Asp Val65 70 75 80Ile Thr Ala Val Asp Gly Ala Pro Ile Asn Ser Ala Thr Ala Met Ala85 90 95Asp Ala Leu Asn Gly His His Pro Gly Asp Val Ile Ser Val Asn Trp100 105 110Gln Thr Lys Ser Gly Gly Thr Arg Thr Gly Asn Val Thr Leu Ala Glu115 120 125Gly Pro Pro Ala130(2)SEQ ID NO68的信息(i)序列特征(A)长度100个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO68Val Pro Leu Arg Ser Pro Ser Met Ser Pro Ser Lys Cys Leu Ala Ala1 5 10 15Ala Gln Arg Asn Pro Val Ile Arg Arg Arg Arg Leu Ser Asn Pro Pro20 25 30Pro Arg Lys Tyr Arg Ser Met Pro Ser Pro Ala Thr Ala Ser Ala Gly35 40 45Met Ala Arg Val Arg Arg Arg Ala Ile Trp Arg Gly Pro Ala Thr Xaa50 55 60Ser Ala Gly Met Ala Arg Val Arg Arg Trp Xaa Val Met Pro Xaa Val65 70 75 80Ile Gln Ser Thr Xaa Ile Arg Xaa Xaa Gly Pro Phe Asp Asn Arg Gly85 90 95Ser Glu Arg Lys100(2)SEQ ID NO69的信息(i)序列特征(A)长度163个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO69Met Thr Asp Asp Ile Leu Leu Ile Asp Thr Asp Glu Arg Val Arg Thr1 5 10 15Leu Thr Leu Asn Arg Pro Gln Ser Arg Asn Ala Leu Ser Ala Ala Leu20 25 30Arg Asp Arg Phe Phe Ala Xaa Leu Xaa Asp Ala Glu Xaa Asp Asp Asp35 40 45Ile Asp Val Val Ile Leu Thr Gly Ala Asp Pro Val Phe Cys Ala Gly50 55 60Leu Asp Leu Lys Val Ala Gly Arg Ala Asp Arg Ala Ala Gly His Leu65 70 75 80Thr Ala Val Gly Gly His Asp Gln Ala Gly Asp Arg Arg Asp Gln Arg85 90 95Arg Arg Gly His Arg Arg Ala Arg Thr Gly Ala Val Leu Arg His Pro100 105 110Asp Arg Leu Arg Ala Arg Pro Leu Arg Arg His Pro Arg Pro Gly Gly115 120 125Ala Ala Ala His Leu Gly Thr Gln Cys Val Leu Ala Ala Lys Gly Arg130 135 140His Arg Xaa Gly Pro Val Asp Glu Pro Asp Arg Arg Leu Pro Val Arg145 150 155 160Asp Arg Arg(2)SEQ ID NO70的信息(i)序列特征(A)长度344个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO70Met Lys Phe Val Asn His Ile Glu Pro Val Ala Pro Arg Arg Ala Gly1 5 10 15Gly Ala Val Ala Glu Val Tyr Ala Glu Ala Arg Arg Glu Phe Gly Arg20 25 30Leu Pro Glu Pro Leu Ala Met Leu Ser Pro Asp Glu Gly Leu Leu Thr35 40 45Ala Gly Trp Ala Thr Leu Arg Glu Thr Leu Leu Val Gly Gln Val Pro50 55 60Arg Gly Arg Lys Glu Ala Val Ala Ala Ala Val Ala Ala Ser Leu Arg65 70 75 80Cys Pro Trp Cys Val Asp Ala His Thr Thr Met Leu Tyr Ala Ala Gly85 90 95Gln Thr Asp Thr Ala Ala Ala Ile Leu Ala Gly Thr Ala Pro Ala Ala100 105 110Gly Asp Pro Asn Ala Pro Tyr Val Ala Trp Ala Ala Gly Thr Gly Thr115 120 125Pro Ala Gly Pro Pro Ala Pro Phe Gly Pro Asp Val Ala Ala Glu Tyr130 135 140Leu Gly Thr Ala Val Gln Phe His Phe Ile Ala Arg Leu Val Leu Val145 150 155 160Leu Leu Asp Glu Thr Phe Leu Pro Gly Gly Pro Arg Ala Gln Gln Leu165 170 175Met Arg Arg Ala Gly Gly Leu Val Phe Ala Arg Lys Val Arg Ala Glu180 185 190His Arg Pro Gly Arg Ser Thr Arg Arg Leu Glu Pro Arg Thr Leu Pro195 200 205Asp Asp Leu Ala Trp Ala Thr Pro Ser Glu Pro Ile Ala Thr Ala Phe210 215 220Ala Ala Leu Ser His His Leu Asp Thr Ala Pro His Leu Pro Pro Pro225 230 235 240Thr Arg Gln Val Val Arg Arg Val Val Gly Ser Trp His Gly Glu Pro245 250 255Met Pro Met Ser Ser Arg Trp Thr Asn Glu His Thr Ala Glu Leu Pro260 265 270Ala Asp Leu His Ala Pro Thr Arg Leu Ala Leu Leu Thr Gly Leu Ala275 280 285Pro His Gln Val Thr Asp Asp Asp Val Ala Ala Ala Arg Ser Leu Leu290 295 300Asp Thr Asp Ala Ala Leu Val Gly Ala Leu Ala Trp Ala Ala Phe Thr305 310 315 320Ala Ala Arg Arg Ile Gly Thr Trp Ile Gly Ala Ala Ala Glu Gly Gln325 330 335Val Ser Arg Gln Asn Pro Thr Gly340(2)SEQ ID NO71的信息(i)序列特征(A)长度485个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO71Asp Asp Pro Asp Met Pro Gly Thr Val Ala Lys Ala Val Ala Asp Ala1 5 10 15Leu Gly Arg Gly Ile Ala Pro Val Glu Asp Ile Gln Asp Cys Val Glu20 25 30Ala Arg Leu Gly Glu Ala Gly Leu Asp Asp Val Ala Arg Val Tyr Ile35 40 45Ile Tyr Arg Gln Arg Arg Ala Glu Leu Arg Thr Ala Lys Ala Leu Leu50 55 60Gly Val Arg Asp Glu Leu Lys Leu Ser Leu Ala Ala Val Thr Val Leu65 70 75 80Arg Glu Arg Tyr Leu Leu His Asp Glu Gln Gly Arg Pro Ala Glu Ser85 90 95Thr Gly Glu Leu Met Asp Arg Ser Ala Arg Cys Val Ala Ala Ala Glu100 105 110Asp Gln Tyr Glu Pro Gly Ser Ser Arg Arg Trp Ala Glu Arg Phe Ala115 120 125Thr Leu Leu Arg Asn Leu Glu Phe Leu Pro Asn Ser Pro Thr Leu Met130 135 140Asn Ser Gly Thr Asp Leu Gly Leu Leu Ala Gly Cys Phe Val Leu Pro145 150 155 160Ile Glu Asp Ser Leu Gln Ser Ile Phe Ala Thr Leu Gly Gln Ala Ala165 170 175Glu Leu G Arg Ala Gly Gly Gly Thr Gly Tyr Ala Phe Ser His Leu180 185 190Arg Pro Ala Gly Asp Arg Val Ala Ser Thr Gly Gly Thr Ala Ser Gly195 200 205Pro Val Ser Phe Leu Arg Leu Tyr Asp Ser Ala Ala Gly Val Val Ser210 215 220Met Gly Gly Arg Arg Arg Gly Ala Cys Met Ala Val Leu Asp Val Ser225 230 235 240His Pro Asp Ile Cys Asp Phe Val Thr Ala Lys Ala Glu Ser Pro Ser245 250 255Glu Leu Pro His Phe Asn Leu Ser Val Gly Val Thr Asp Ala Phe Leu260 265 270Arg Ala Val Glu Arg Asn Gly Leu His Arg Leu Val Asn Pro Arg Thr275 280 285Gly Lys Ile Val Ala Arg Met Pro Ala Ala Glu Leu Phe Asp Ala Ile290 295 300Cys Lys Ala Ala His Ala Gly Gly Asp Pro Gly Leu Val Phe Leu Asp305 310 315 320Thr Ile Asn Arg Ala Asn Pro Val Pro Gly Arg Gly Arg Ile Glu Ala325 330 335Thr Asn Pro Cys Gly Glu Val Pro Leu Leu Pro Tyr Glu Ser Cys Asn340 345 350Leu Gly Ser Ile Asn Leu Ala Arg Met Leu Ala Asp Gly Arg Val Asp355 360 365Trp Asp Arg Leu Glu Glu Val Ala Gly Val Ala Val Arg Phe Leu Asp370 375 380Asp Val Ile Asp Val Ser Arg Tyr Pro Phe Pro Glu Leu Gly Glu Ala385 390 395 400Ala Arg Ala Thr Arg Lys Ile Gly Leu Gly Val Met Gly Leu Ala Glu405 410 415Leu Leu Ala Ala Leu Gly Ile Pro Tyr Asp Ser Glu Glu Ala Val Arg420 425 430Leu Ala Thr Arg Leu Met Arg Arg Ile Gln Gln Ala Ala His Thr Ala435 440 445Ser Arg Arg Leu Ala Glu Glu Arg Gly Ala Phe Pro Ala Phe Thr Asp450 455 460Ser Arg Phe Ala Arg Ser Gly Pro Arg Arg Asn Ala Gln Val Thr Ser465 470 475 480Val Ala Pro Thr Gly485(2)SEQ ID NO72的信息(i)序列特征(A)长度267个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO72Gly Val Ile Val Leu Asp Leu Glu Pro Arg Gly Pro Leu Pro Thr Glu1 5 10 15Ile Tyr Trp Arg Arg Arg Gly Leu Ala Leu Gly Ile Ala Val Val Val20 25 30Val Gly Ile Ala Val Ala Ile Val Ile Ala Phe Val Asp Ser Ser Ala35 40 45Gly Ala Lys Pro Val Ser Ala Asp Lys Pro Ala Ser Ala Gln Ser His50 55 60Pro Gly Ser Pro Ala Pro Gln Ala Pro Gln Pro Ala Gly Gln Thr Glu65 70 75 80Gly Asn Ala Ala Ala Ala Pro Pro Gln Gly Gln Asn Pro Glu Thr Pro85 90 95Thr Pro Thr Ala Ala Val Gln Pro Pro Pro Val Leu Lys Glu Gly Asp100 105 110Asp Cys Pro Asp Ser Thr Leu Ala Val Lys Gly Leu Thr Asn Ala Pro115 120 125Gln Tyr Tyr Val Gly Asp Gln Pro Lys Phe Thr Met Val Val Thr Asn130 135 140Ile Gly Leu Val Ser Cys Lys Arg Asp Val Gly Ala Ala Val Leu Ala145 150 155 160Ala Tyr Val Tyr Ser Leu Asp Asn Lys Arg Leu Trp Ser Asn Leu Asp165 170 175Cys Ala Pro Ser Asn Glu Thr Leu Val Lys Thr Phe Ser Pro Gly Glu180 185 190Gln Val Thr Thr Ala Val Thr Trp Thr Gly Met Gly Ser Ala Pro Arg195 200 205Cys Pro Leu Pro Arg Pro Ala Ile Gly Pro Gly Thr Tyr Asn Leu Val210 215 220Val Gln Leu Gly Asn Leu Arg Ser Leu Pro Val Pro Phe Ile Leu Asn225 230 235 240Gln Pro Pro Pro Pro Pro Gly Pro Val Pro Ala Pro Gly Pro Ala Gln245 250 255Ala Pro Pro Pro Glu Ser Pro Ala Gln Gly Gly260 265(2)SEQ ID NO73的信息(i)序列特征(A)长度97个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO73Leu Ile Ser Thr Gly Lys Ala Ser His Ala Ser Leu Gly Val Gln Val1 5 10 15Thr Asn Asp Lys Asp Thr Pro Gly Ala Lys Ile Val Glu Val Val Ala20 25 30Gly Gly Ala Ala Ala Asn Ala Gly Val Pro Lys Gly Val Val Val Thr35 40 45Lys Val Asp Asp Arg Pro Ile Asn Ser Ala Asp Ala Leu Val Ala Ala50 55 60Val Arg Ser Lys Ala Pro Gly Ala Thr Val Ala Leu Thr Phe Gln Asp65 70 75 80Pro Ser Gly Gly Ser Arg Thr Val Gln Val Thr Leu Gly Lys Ala Glu85 90 95Gln(2)SEQ ID NO74的信息(i)序列特征(A)长度364个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO74Gly Ala Ala Val Ser Leu Leu Ala Ala Gly Thr Leu Val Leu Thr Ala1 5 10 15Cys Gly Gly Gly Thr Asn Ser Ser Ser Ser Gly Ala Gly Gly Thr Ser20 25 30Gly Ser Val His Cys Gly Gly Lys Lys Glu Leu His Ser Ser Gly Ser35 40 45Thr Ala Gln Glu Asn Ala Met Glu Gln Phe Val Tyr Ala Tyr Val Arg50 55 60Ser Cys Pro Gly Tyr Thr Leu Asp Tyr Asn Ala Asn Gly Ser Gly Ala65 70 75 80Gly Val Thr Gln Phe Leu Asn Asn Glu Thr Asp Phe Ala Gly Ser Asp85 90 95Val Pro Leu Asn Pro Ser Thr Gly Gln Pro Asp Arg Ser Ala Glu Arg100 105 110Cys Gly Ser Pro Ala Trp Asp Leu Pro Thr Val Phe Gly Pro Ile Ala115 120 125Ile Thr Tyr Asn Ile Lys Gly Val Ser Thr Leu Asn Leu Asp Gly Pro130 135 140Thr Thr Ala Lys Ile Phe Asn Gly Thr Ile Thr Val Trp Asn Asp Pro145 150 155 160Gln Ile Gln Ala Leu Asn Ser Gly Thr Asp Leu Pro Pro Thr Pro Ile165 170 175Ser Val Ile Phe Arg Ser Asp Lys Ser Gly Thr Ser Asp Asn Phe Gln180 185 190Lys Tyr Leu Asp Gly Val Ser Asn Gly Ala Trp Gly Lys Gly Ala Ser195 200 205Glu Thr Phe Ser Gly Gly Val Gly Val Gly Ala Ser Gly Asn Asn Gly210 215 220Thr Ser Ala Leu Leu Gln Thr Thr Asp Gly Ser Ile Thr Tyr Asn Glu225 230 235 240Trp Ser Phe Ala Val Gly Lys Gln Leu Asn Met Ala Gln Ile Ile Thr245 250 255Ser Ala Gly Pro Asp Pro Val Ala Ile Thr Thr Glu Ser Val Gly Lys260 265 270Thr Ile Ala Gly Ala Lys Ile Met Gly Gln Gly Asn Asp Leu Val Leu275 280 285Asp Thr Ser Ser Phe Tyr Arg Pro Thr Gln Pro Gly Ser Tyr Pro Ile290 295 300Val Leu Ala Thr Tyr Glu Ile Val Cys Ser Lys Tyr Pro Asp Ala Thr305 310 315 320Thr Gly Thr Ala Val Arg Ala Phe Met Gln Ala Ala Ile Gly Pro Gly325 330 335Gln Glu Gly Leu Asp Gln Tyr Gly Ser Ile Pro Leu Pro Lys Ser Phe340 345 350Gln Ala Lys Leu Ala Ala Ala Val Asn Ala Ile Ser355 360(2)SEQ ID NO75的信息(i)序列特征(A)长度309个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述 SEQ ID NO75Gln Ala Ala Ala Gly Arg Ala Val Arg Arg Thr Gly His Ala Glu Asp1 5 10 15Gln Thr His Gln Asp Arg Leu His His Gly Cys Arg Arg Ala Ala Val20 25 30Val Val Arg Gln Asp Arg Ala Ser Val Ser Ala Thr Ser Ala Arg Pro35 40 45Pro Arg Arg His Pro Ala Gln Gly His Arg Arg Arg Val Ala Pro Ser50 55 60Gly Gly Arg Arg Arg Pro His Pro His His Val Gln Pro Asp Asp Arg65 70 75 80Arg Asp Arg Pro Ala Leu Leu Asp Arg Thr Gln Pro Ala Glu His Pro85 90 95Asp Pro His Arg Arg Gly Pro Ala Asp Pro Gly Arg Val Arg Gly Arg100 105 110Gly Arg Leu Arg Arg Val Asp Asp Gly Arg Leu Gln Pro Asp Arg Asp115 120 125Ala Asp His Gly Ala Pro Val Arg Gly Arg Gly Pro His Arg Gly Val130 135 140Gln His Arg Gly Gly Pro Val Phe Val Arg Arg Val Pro Gly Val Arg145 150 155 160Cys Ala His Arg Arg Gly His Arg Arg Val Ala Ala Pro Gly Gln Gly165 170 175Asp Val Leu Arg Ala Gly Leu Arg Val Glu Arg Leu Arg Pro Val Ala180 185 190Ala Val Glu Asn Leu His Arg Gly Ser Gln Arg Ala Asp Gly Arg Val195 200 205Phe Arg Pro Ile Arg Arg Gly Ala Arg Leu Pro Ala Arg Arg Ser Arg210 215 220Ala Gly Pro Gln Gly Arg Leu His Leu Asp Gly Ala Gly Pro Ser Pro225 230 235 240Leu Pro Ala Arg Ala Gly Gln Gln Gln Pro Ser Ser Ala Gly Gly Arg245 250 255Arg Ala Gly Gly Ala Glu Arg Ala Asp Pro Gly Gln Arg Gly Arg His260 265 270His Gln Gly Gly His Asp Pro Gly Arg Gln Gly Ala Gln Arg Gly Thr275 280 285Ala Gly Val Ala His Ala Ala Ala Gly Pro Arg Arg Ala Ala Val Arg290 295 300Asn Arg Pro Arg Arg305(2)SEQ ID NO76的信息(i)序列特征(A)长度580个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO76Ser Ala Val Trp Cys Leu Asn Gly Phe Thr Gly Arg His Arg His Gly1 5 10 15Arg Cys Arg Val Arg Ala Ser Gly Trp Arg Ser Ser Asn Arg Trp Cys20 25 30Ser Thr Thr Ala Asp Cys Cys Ala Ser Lys Thr Pro Thr Gln Ala Ala35 40 45Ser Pro Leu Glu Arg Arg Phe Thr Cys Cys Ser Pro Ala Val Gly Cys50 55 60Arg Phe Arg Ser Phe Pro Val Arg Arg Leu Ala Leu Gly Ala Arg Thr65 70 75 80Ser Arg Thr Leu Gly Val Arg Arg Thr Leu Ser Gln Trp Asn Leu Ser85 90 95Pro Arg Ala Gln Pro Ser Cys Ala Val Thr Val Glu Ser His Thr His100 105 110Ala Ser Pro Arg Met Ala Lys Leu Ala Arg Val Val Gly Leu Val Gln115 120 125Glu Glu Gln Pro Ser Asp Met Thr Asn His Pro Arg Tyr Ser Pro Pro130 135 140Pro Gln Gln Pro Gly Thr Pro Gly Tyr Ala Gln Gly Gln Gln Gln Thr145 150 155 160Tyr Ser Gln Gln Phe Asp Trp Arg Tyr Pro Pro Ser Pro Pro Pro Gln165 170 175Pro Thr Gln Tyr Arg Gln Pro Tyr Glu Ala Leu Gly Gly Thr Arg Pro180 185 190Gly Leu Ile Pro Gly Val Ile Pro Thr Met Thr Pro Pro Pro Gly Met195 200 205Val Arg Gln Arg Pro Arg Ala Gly Met Leu Ala Ile Gly Ala Val Thr210 215 220Ile Ala Val Val Ser Ala Gly Ile Gly Gly Ala Ala Ala Ser Leu Val225 230 235 240Gly Phe Asn Arg Ala Pro Ala Gly Pro Ser Gly Gly Pro Val Ala Ala245 250 255Ser Ala Ala Pro Ser Ile Pro Ala Ala Asn Met Pro Pro Gly Ser Val260 265 270Glu Gln Val Ala Ala Lys Val Val Pro Ser Val Val Met Leu Glu Thr275 280 285Asp Leu Gly Arg Gln Ser Glu Glu Gly Ser Gly Ile Ile Leu Ser Ala290 295 300Glu Gly Leu Ile Leu Thr Asn Asn His Val Ile Ala Ala Ala Ala Lys305 310 315 320Pro Pro Leu Gly Ser Pro Pro Pro Lys Thr Thr Val Thr Phe Ser Asp325 330 335Gly Arg Thr Ala Pro Phe Thr Val Val Gly Ala Asp Pro Thr Ser Asp340 345 350Ile Ala Val Val Arg Val Gln Gly Val Ser Gly Leu Thr Pro Ile Ser355 360 365Leu Gly Ser Ser Ser Asp Leu Arg Val Gly Gln Pro Val Leu Ala Ile370 375 380Gly Ser Pro Leu Gly Leu Glu Gly Thr Val Thr Thr Gly Ile Val Ser385 390 395 400Ala Leu Asn Arg Pro Val Ser Thr Thr Gly Glu Ala Gly Asn Gln Asn405 410 415Thr Val Leu Asp Ala Ile Gln Thr Asp Ala Ala Ile Asn Pro Gly Asn420 425 430Ser Gly Gly Ala Leu Val Asn Met Asn Ala Gln Leu Val Gly Val Asn435 440 445Ser Ala Ile Ala Thr Leu Gly Ala Asp Ser Ala Asp Ala Gln Ser Gly450 455 460Ser Ile Gly Leu Gly Phe Ala Ile Pro Val Asp Gln Ala Lys Arg Ile465 470 475 480Ala Asp Glu Leu Ile Ser Thr Gly Lys Ala Ser His Ala Ser Leu Gly485 490 495Val Gln Val Thr Asn Asp Lys Asp Thr Pro Gly Ala Lys Ile Val Glu500 505 510Val Val Ala Gly Gly Ala Ala Ala Asn Ala Gly Val Pro Lys Gly Val515 520 525Val Val Thr Lys Val Asp Asp Arg Pro Ile Asn Ser Ala Asp Ala Leu530 535 540Val Ala Ala Val Arg Ser Lys Ala Pro Gly Ala Thr Val Ala Leu Thr545 550 555 560Phe Gln Asp Pro Ser Gly Gly Ser Arg Thr Val Gln Val Thr Leu Gly565 570 575Lys Ala Glu Gln580(2)SEQ ID NO77的信息(i)序列特征(A)长度233个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO77Met Asn Asp Gly Lys Arg Ala Val Thr Ser Ala Val Leu Val Val Leu1 5 10 15Gly Ala Cys Leu Ala Leu Trp Leu Ser Gly Cys Ser Ser Pro Lys Pro20 25 30Asp Ala Glu Glu Gln Gly Val Pro Val Ser Pro Thr Ala Ser Asp Pro35 40 45Ala Leu Leu Ala Glu Ile Arg Gln Ser Leu Asp Ala Thr Lys Gly Leu50 55 60Thr Ser Val His Val Ala Val Arg Thr Thr Gly Lys Val Asp Ser Leu65 70 75 80Leu Gly Ile Thr Ser Ala Asp Val Asp Val Arg Ala Asn Pro Leu Ala85 90 95Ala Lys Gly Val Cys Thr Tyr Asn Asp Glu Gln Gly Val Pro Phe Arg100 105 110Val Gln Gly Asp Asn Ile Ser Val Lys Leu Phe Asp Asp Trp Ser Asn115 120 125Leu Gly Ser Ile Ser Glu Leu Ser Thr Ser Arg Val Leu Asp Pro Ala130 135 140Ala Gly Val Thr Gln Leu Leu Ser Gly Val Thr Asn Leu Gln Ala Gln145 150 155 160Gly Thr Glu Val Ile Asp Gly Ile Ser Thr Thr Lys Ile Thr Gly Thr165 170 175Ile Pro Ala Ser Ser Val Lys Met Leu Asp Pro Gly Ala Lys Ser Ala180 185 190Arg Pro Ala Thr Val Trp Ile Ala Gln Asp Gly Ser His His Leu Val195 200 205Arg Ala Ser Ile Asp Leu Gly Ser Gly Ser Ile Gln Leu Thr Gln Ser210 215 220Lys Trp Asn Glu Pro Val Asn Val Asp225 230(2)SEQ ID NO78的信息(i)序列特征(A)长度66个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO78Val Ile Asp Ile Ile Gly Thr Ser Pro Thr Ser Trp Glu Gln Ala Ala1 5 10 15Ala Glu Ala Val Gln Arg Ala Arg Asp Ser Val Asp Asp Ile Arg Val20 25 30Ala Arg Val Ile Glu Gln Asp Met Ala Val Asp Ser Ala Gly Lys Ile35 40 45Thr Tyr Arg Ile Lys Leu Glu Val Ser Phe Lys Met Arg Pro Ala Gln50 55 60Pro Arg65(2)SEQ ID NO79的信息(i)序列特征(A)长度69个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO79Val Pro Pro Ala Pro Pro Leu Pro Pro Leu Pro Pro Ser Pro Ile Ser1 5 10 15Cys Ala Ser Pro Pro Ser Pro Pro Leu Pro Pro Ala Pro Pro Val Ala20 25 30Pro Gly Pro Pro Met Pro Pro Leu Asp Pro Trp Pro Pro Ala Pro Pro35 40 45Leu Pro Tyr Ser Thr Pro Pro Gly Ala Pro Leu Pro Pro Ser Pro Pro50 55 60Ser Pro Pro Leu Pro65(2)SEQ ID NO80的信息(i)序列特征(A)长度355个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO80Met Ser Asn Ser Arg Arg Arg Ser Leu Arg Trp Ser Trp Leu Leu Ser1 5 10 15Val Leu Ala Ala Val Gly Leu Gly Leu Ala Thr Ala Pro Ala Gln Ala20 25 30Ala Pro Pro Ala Leu Ser Gln Asp Arg Phe Ala Asp Phe Pro Ala Leu35 40 45Pro Leu Asp Pro Ser Ala Met Val Ala Gln Val Ala Pro Gln Val Val50 55 60Asn Ile Asn Thr Lys Leu Gly Tyr Asn Asn Ala Val Gly Ala Gly Thr65 70 75 80Gly Ile Val Ile Asp Pro Asn Gly Val Val Leu Thr Asn Asn His Val85 90 95Ile Ala Gly Ala Thr Asp Ile Asn Ala Phe Ser Val Gly Ser Gly Gln100 105 110Thr Tyr Gly Val Asp Val Val Gly Tyr Asp Arg Thr Gln Asp Val Ala115 120 125Val Leu Gln Leu Arg Gly Ala Gly Gly Leu Pro Ser Ala Ala Ile Gly130 135 140Gly Gly Val Ala Val Gly Glu Pro Val Val Ala Met Gly Asn Ser Gly145 150 155 160Gly Gln Gly Gly Thr Pro Arg Ala Val Pro Gly Arg Val Val Ala Leu165 170 175Gly Gln Thr Val Gln Ala Ser Asp Ser Leu Thr Gly Ala Glu Glu Thr180 185 190Leu Asn Gly Leu Ile Gln Phe Asp Ala Ala Ile Gln Pro Gly Asp Ser195 200 205Gly Gly Pro Val Val Asn Gly Leu Gly Gln Val Val Gly Met Asn Thr210 215 220Ala Ala Ser Asp Asn Phe Gln Leu Ser Gln Gly Gly Gln Gly Phe Ala225 230 235 240Ile Pro Ile Gly Gln Ala Met Ala Ile Ala Gly Gln Ile Arg Ser Gly245 250 255Gly Gly Ser Pro Thr Val His Ile Gly Pro Thr Ala Phe Leu Gly Leu260 265 270Gly Val Val Asp Asn Asn Gly Asn Gly Ala Arg Val Gln Arg Val Val275 280 285Gly Ser Ala Pro Ala Ala Ser Leu Gly Ile Ser Thr Gly Asp Val Ile290 295 300Thr Ala Val Asp Gly Ala Pro Ile Asn Ser Ala Thr Ala Met Ala Asp305 310 315 320Ala Leu Asn Gly His His Pro Gly Asp Val Ile Ser Val Asn Trp Gln325 330 335Thr Lys Ser Gly Gly Thr Arg Thr Gly Asn Val Thr Leu Ala Glu Gly340 345 350Pro Pro Ala355(2)SEQ ID NO81的信息(i)序列特征(A)长度205个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO81Ser Pro Lys Pro Asp Ala Glu Glu Gln Gly Val Pro Val Ser Pro Thr1 5 10 15Ala Ser Asp Pro Ala Leu Leu Ala Glu Ile Arg Gln Ser Leu Asp Ala20 25 30Thr Lys Gly Leu Thr Ser Val His Val Ala Val Arg Thr Thr Gly Lys35 40 45Val Asp Ser Leu Leu Gly Ile Thr Ser Ala Asp Val Asp Val Arg Ala50 55 60Asn Pro Leu Ala Ala Lys Gly Val Cys Thr Tyr Asn Asp Glu Gln Gly65 70 75 80Val Pro Phe Arg Val Gln Gly Asp Asn Ile Ser Val Lys Leu Phe Asp85 90 95Asp Trp Ser Asn Leu Gly Ser Ile Ser Glu Leu Ser Thr Ser Arg Val100 105 110Leu Asp Pro Ala Ala Gly Val Thr Gln Leu Leu Ser Gly Val Thr Asn115 120 125Leu Gln Ala Gln Gly Thr Glu Val Ile Asp Gly Ile Ser Thr Thr Lys130 135 140Ile Thr Gly Thr Ile Pro Ala Ser Ser Val Lys Met Leu Asp Pro Gly145 150 155 160Ala Lys Ser Ala Arg Pro Ala Thr Val Trp Ile Ala Gln Asp Gly Ser165 170 175His His Leu Val Arg Ala Ser Ile Asp Leu Gly Ser Gly Ser Ile Gln180 185 190Leu Thr Gln Ser Lys Trp Asn Glu Pro Val Asn Val Asp195 200 205(2)SEQ ID NO82的信息(i)序列特征(A)长度286个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO82Gly Asp Ser Phe Trp Ala Ala Ala Asp Gln Met Ala Arg Gly Phe Val1 5 10 15Leu Gly Ala Thr Ala Gly Arg Thr Thr Leu Thr Gly Glu Gly Leu Gln20 25 30His Ala Asp Gly His Ser Leu Leu Leu Asp Ala Thr Asn Pro Ala Val35 40 45Val Ala Tyr Asp Pro Ala Phe Ala Tyr Glu Ile Gly Tyr Ile Xaa Glu50 55 60Ser Gly Leu Ala Arg Met Cys Gly Glu Asn Pro Glu Asn Ile Phe Phe65 70 75 80Tyr Ile Thr Val Tyr Asn Glu Pro Tyr Val Gln Pro Pro Glu Pro Glu85 90 95Asn Phe Asp Pro Glu Gly Val Leu Gly Gly Ile Tyr Arg Tyr His Ala100 105 110Ala Thr Glu Gln Arg Thr Asn Lys Xaa Gln Ile Leu Ala Ser Gly Val115 120 125Ala Met Pro Ala Ala Leu Arg Ala Ala Gln Met Leu Ala Ala Glu Trp130 135 140Asp Val Ala Ala Asp Val Trp Ser Val Thr Ser Trp Gly Glu Leu Asn145 150 155 160Arg Asp Gly Val Val Ile Glu Thr Glu Lys Leu Arg His Pro Asp Arg165 170 175Pro Ala Gly Val Pro Tyr Val Thr Arg Ala Leu Glu Asn Ala Arg Gly180 185 190Pro Val Ile Ala Val Ser Asp Trp Met Arg Ala Val Pro Glu Gln Ile195 200 205Arg Pro Trp Val Pro Gly Thr Tyr Leu Thr Leu Gly Thr Asp Gly Phe210 215 220Gly Phe Ser Asp Thr Arg Pro Ala Gly Arg Arg Tyr Phe Asn Thr Asp225 230 235 240Ala Glu Ser Gln Val Gly Arg Gly Phe Gly Arg Gly Trp Pro Gly Arg245 250 255Arg Val Asn Ile Asp Pro Phe Gly Ala Gly Arg Gly Pro Pro Ala Gln260 265 270Leu Pro Gly Phe Asp Glu Gly Gly Gly Leu Arg Pro Xaa Lys275 280 285(2)SEQ ID NO83的信息(i)序列特征(A)长度173个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO83Thr Lys Phe His Ala Leu Met Gln Glu Gln Ile His Asn Glu Phe Thr1 5 10 15Ala Ala Gln Gln Tyr Val Ala Ile Ala Val Tyr Phe Asp Ser Glu Asp20 25 30Leu Pro Gln Leu Ala Lys His Phe Tyr Ser Gln Ala Val Glu Glu Arg35 40 45Asn His Ala Met Met Leu Val Gln His Leu Leu Asp Arg Asp Leu Arg50 55 60Val Glu Ile Pro Gly Val Asp Thr Val Arg Asn Gln Phe Asp Arg Pro65 70 75 80Arg Glu Ala Leu Ala Leu Ala Leu Asp Gln Glu Arg Thr Val Thr Asp85 90 95Gln Val Gly Arg Leu Thr Ala Val Ala Arg Asp Glu Gly Asp Phe Leu100 105 110Gly Glu Gln Phe Met Gln Trp Phe Leu Gln Glu Gln Ile Glu Glu Val115 120 125Ala Leu Met Ala Thr Leu Val Arg Val Ala Asp Arg Ala Gly Ala Asn130 135 140Leu Phe Glu Leu Glu Asn Phe Val Ala Arg Glu Val Asp Val Ala Pro145 150 155 160Ala Ala Ser Gly Ala Pro His Ala Ala Gly Gly Arg Leu165 170(2)SEQ ID NO84的信息(i)序列特征(A)长度107个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO84Arg Ala Asp Glu Arg Lys Asn Thr Thr Met Lys Met Val Lys Ser Ile1 5 10 15Ala Ala Gly Leu Thr Ala Ala Ala Ala Ile Gly Ala Ala Ala Ala Gly20 25 30Val Thr Ser Ile Met Ala Gly Gly Pro Val Val Tyr Gln Met Gln Pro35 40 45Val Val Phe Gly Ala Pro Leu Pro Leu Asp Pro Xaa Ser Ala Pro Xaa50 55 60Val Pro Thr Ala Ala Gln Trp Thr Xaa Leu Leu Asn Xaa Leu Xaa Asp65 70 75 80Pro Asn Val Ser Phe Xaa Asn Lys Gly Ser Leu Val Glu Gly Gly Ile85 90 95Gly Gly Xaa Glu Gly Xaa Xaa Arg Arg Xaa Gln100 105(2)SEQ ID NO85的信息(i)序列特征(A)长度125个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO85Val Leu Ser Val Pro Val Gly Asp Gly Phe Trp Xaa Arg Val Val Asn1 5 10 15Pro Leu Gly Gln Pro Ile Asp Gly Arg Gly Asp Val Asp Ser Asp Thr20 25 30Arg Arg Ala Leu Glu Leu Gln Ala Pro Ser Val Val Xaa Arg Gln Gly35 40 45Val Lys Glu Pro Leu Xaa Thr Gly Ile Lys Ala Ile Asp Ala Met Thr50 55 60Pro Ile Gly Arg Gly Gln Arg Gln Leu Ile Ile Gly Asp Arg Lys Thr65 70 75 80Gly Lys Asn Arg Arg Leu Cys Arg Thr Pro Ser Ser Asn Gln Arg Glu85 90 95Glu Leu Gly Val Arg Trp Ile Pro Arg Ser Arg Cys Ala Cys Val Tyr100 105 110Val Gly His Arg Ala Arg Arg Gly Thr Tyr His Arg Arg115 120 125(2)SEQ ID NO86的信息(i)序列特征(A)长度117个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO86Cys Asp Ala Val Met Gly Phe Leu Gly Gly Ala Gly Pro Leu Ala Val1 5 10 15Val Asp Gln Gln Leu Val Thr Arg Val Pro Gln Gly Trp Ser Phe Ala20 25 30Gln Ala Ala Ala Val Pro Val Val Phe Leu Thr Ala Trp Tyr Gly Leu35 40 45Ala Asp Leu Ala Glu Ile Lys Ala Gly Glu Ser Val Leu Ile His Ala50 55 60Gly Thr Gly Gly Val Gly Met Ala Ala Val Gln Leu Ala Arg Gln Trp65 70 75 80Gly Val Glu Val Phe Val Thr Ala Ser Arg Gly Lys Trp Asp Thr Leu85 90 95Arg Ala Xaa Xaa Phe Asp Asp Xaa Pro Tyr Arg Xaa Phe Pro His Xaa100 105 110Arg Ser Ser Xaa Gly115(2)SEQ ID NO87的信息(i)序列特征(A)长度103个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO87Met Tyr Arg Phe Ala Cys Arg Thr Leu Met Leu Ala Ala Cys Ile Leu1 5 10 15Ala Thr Gly Val Ala Gly Leu Gly Val Gly Ala Gln Ser Ala Ala Gln20 25 30Thr Ala Pro Val Pro Asp Tyr Tyr Trp Cys Pro Gly Gln Pro Phe Asp35 40 45Pro Ala Trp Gly Pro Asn Trp Asp Pro Tyr Thr Cys His Asp Asp Phe50 55 60His Arg Asp Ser Asp Gly Pro Asp His Ser Arg Asp Tyr Pro Gly Pro65 70 75 80Ile Leu Glu Gly Pro Val Leu Asp Asp Pro Gly Ala Ala Pro Pro Pro85 90 95Pro Ala Ala Gly Gly Gly Ala100(2)SEQ ID NO88的信息(i)序列特征(A)长度88个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO88Val Gln Cys Arg Val Trp Leu Glu Ile Gln Trp Arg Gly Met Leu Gly1 5 10 15Ala Asp Gln Ala Arg Ala Gly Gly Pro Ala Arg Ile Trp Arg Glu His20 25 30Ser Met Ala Ala Met Lys Pro Arg Thr Gly Asp Gly Pro Leu Glu Ala35 40 45Thr Lys Glu Gly Arg Gly Ile Val Met Arg Val Pro Leu Glu Gly Gly50 55 60Gly Arg Leu Val Val Glu Leu Thr Pro Asp Glu Ala Ala Ala Leu Gly65 70 75 80Asp Glu Leu Lys Gly Val Thr Ser85(2)SEQ ID NO89的信息(i)序列特征(A)长度95个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO89Thr Asp Ala Ala Thr Leu Ala Gln Glu Ala Gly Asn Phe Glu Arg Ile1 5 10 15Ser Gly Asp Leu Lys Thr Gln Ile Asp Gln Val Glu Ser Thr Ala Gly20 25 30Ser Leu Gln Gly Gln Trp Arg Gly Ala Ala Gly Thr Ala Ala Gln Ala35 40 45Ala Val Val Arg Phe Gln Glu Ala Ala Asn Lys Gln Lys Gln Glu Leu50 55 60Asp Glu Ile Ser Thr Asn Ile Arg Gln Ala Gly Val Gln Tyr Ser Arg65 70 75 80Ala Asp Glu Glu Gln Gln Gln Ala Leu Ser Ser Gln Met Gly Phe85 90 95(2)SEQ ID NO90的信息(i)序列特征(A)长度166个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO90Met Thr Gln Ser Gln Thr Val Thr Val Asp Gln Gln Glu Ile Leu Asn1 5 10 15Arg Ala Asn Glu Val Glu Ala Pro Met Ala Asp Pro Pro Thr Asp Val20 25 30Pro Ile Thr Pro Cys Glu Leu Thr Xaa Xaa Lys Asn Ala Ala Gln Gln35 40 45Xaa Val Leu Ser Ala Asp Asn Met Arg Glu Tyr Leu Ala Ala Gly Ala50 55 60Lys Glu Arg Gln Arg Leu Ala Thr Ser Leu Arg Asn Ala Ala Lys Xaa65 70 75 80Tyr Gly Glu Val Asp Glu Glu Ala Ala Thr Ala Leu Asp Asn Asp Gly85 90 95Glu Gly Thr Val Gln Ala Glu Ser Ala Gly Ala Val Gly Gly Asp Ser100 105 110Ser Ala Glu Leu Thr Asp Thr Pro Arg Val Ala Thr Ala Gly Glu Pro115 120 125Asn Phe Met Asp Leu Lys Glu Ala Ala Arg Lys Leu Glu Thr Gly Asp130 135 140Gln Gly Ala Ser Leu Ala His Xaa Gly Asp Gly Trp Asn Thr Xaa Thr145 150 155 160Leu Thr Leu Gln Gly Asp165(2)SEQ ID NO91的信息(i)序列特征(A)长度5个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO91Arg Ala Glu Arg Met1 5(2)SEQ ID NO92的信息(i)序列特征(A)长度263个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO92Val Ala Trp Met Ser Val Thr Ala Gly Gln Ala Glu Leu Thr Ala Ala1 5 10 15Gln Val Arg Val Ala Ala Ala Ala Tyr Glu Thr Ala Tyr Gly Leu Thr20 25 30Val Pro Pro Pro Val Ile Ala Glu Asn Arg Ala Glu Leu Met Ile Leu35 40 45Ile Ala Thr Asn Leu Leu Gly Gln Asn Thr Pro Ala Ile Ala Val Asn50 55 60Glu Ala Glu Tyr Gly Glu Met Trp Ala Gln Asp Ala Ala Ala Met Phe65 70 75 80Gly Tyr Ala Ala Ala Thr Ala Thr Ala Thr Ala Thr Leu Leu Pro Phe85 90 95Glu Glu Ala Pro Glu Met Thr Ser Ala Gly Gly Leu Leu Glu Gln Ala100 105 110Ala Ala Val Glu Glu Ala Ser Asp Thr Ala Ala Ala Asn Gln Leu Met115 120 125Asn Asn Val Pro Gln Ala Leu Lys Gln Leu Ala Gln Pro Thr Gln Gly130 135 140Thr Thr Pro Ser Ser Lys Leu Gly Gly Leu Trp Lys Thr Val Ser Pro145 150 155 160His Arg Ser Pro Ile Ser Asn Met Val Ser Met Ala Asn Asn His Met165 170 175Ser Met Thr Asn Ser Gly Val Ser Met Thr Asn Thr Leu Ser Ser Met180 185190Leu Lys Gly Phe Ala Pro Ala Ala Ala Ala Gln Ala Val Gln Thr Ala195 200 205Ala Gln Asn Gly Val Arg Ala Met Ser Ser Leu Gly Ser Ser Leu Gly210 215 220Ser Ser Gly Leu Gly Gly Gly Val Ala Ala Asn Leu Gly Arg Ala Ala225 230 235 240Ser Val Arg Tyr Gly His Arg Asp Gly Gly Lys Tyr Ala Xaa Ser Gly245 250 255Arg Arg Asn Gly Gly Pro Ala260(2)SEQ ID NO93的信息(i)序列特征(A)长度303个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO93Met Thr Tyr Ser Pro Gly Asn Pro Gly Tyr Pro Gln Ala Gln Pro Ala1 5 10 15Gly Ser Tyr Gly Gly Val Thr Pro Ser Phe Ala His Ala Asp Glu Gly20 25 30Ala Ser Lys Leu Pro Met Tyr Leu Asn Ile Ala Val Ala Val Leu Gly35 40 45Leu Ala Ala Tyr Phe Ala Ser Phe Gly Pro Met Phe Thr Leu Ser Thr50 55 60Glu Leu Gly Gly Gly Asp Gly Ala Val Ser Gly Asp Thr Gly Leu Pro65 70 75 80Val Gly Val Ala Leu Leu Ala Ala Leu Leu Ala Gly Val Val Leu Val85 90 95Pro Lys Ala Lys Ser His Val Thr Val Val Ala Val Leu Gly Val Leu100 105 110Gly Val Phe Leu Met Val Ser Ala Thr Phe Asn Lys Pro Ser Ala Tyr115 120 125Ser Thr Gly Trp Ala Leu Trp Val Val Leu Ala Phe Ile Val Phe Gln130 135 140Ala Val Ala Ala Val Leu Ala Leu Leu Val Glu Thr Gly Ala Ile Thr145 150 155 160Ala Pro Ala Pro Arg Pro Lys Phe Asp Pro Tyr Gly Gln Tyr Gly Arg165 170 175Tyr Gly Gln Tyr Gly Gln Tyr Gly Val Gln Pro Gly Gly Tyr Tyr Gly180 185 190Gln Gln Gly Ala Gln Gln Ala Ala Gly Leu Gln Ser Pro Gly Pro Gln195 200 205Gln Ser Pro Gln Pro Pro Gly Tyr Gly Ser Gln Tyr Gly Gly Tyr Ser210 215 220Ser Ser Pro Ser Gln Ser Gly Ser Gly Tyr Thr Ala Gln Pro Pro Ala225 230 235 240Gln Pro Pro Ala Gln Ser Gly Ser Gln Gln Ser His Gln Gly Pro Ser245 250 255Thr Pro Pro Thr Gly Phe Pro Ser Phe Ser Pro Pro Pro Pro Val Ser260 265 270Ala Gly Thr Gly Ser Gln Ala Gly Ser Ala Pro Val Asn Tyr Ser Asn275 280 285Pro Ser Gly Gly Glu Gln Ser Ser Ser Pro Gly Gly Ala Pro Val290 295 300(2)SEQ ID NO94的信息(i)序列特征(A)长度168个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO94Met Lys Met Val Lys Ser Ile Ala Ala Gly Leu Thr Ala Ala Ala Ala1 5 10 15Ile Gly Ala Ala Ala Ala Gly Val Thr Ser Ile Met Ala Gly Gly Pro20 25 30Val Val Tyr Gln Met Gln Pro Val Val Phe Gly Ala Pro Leu Pro Leu35 40 45Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln Leu Thr Ser50 55 60Leu Leu Asn Ser Leu Ala Asp Pro Asn Val Ser Phe Ala Asn Lys Gly65 70 75 80Ser Leu Val Glu Gly Gly Ile Gly Gly Thr Glu Ala Arg Ile Ala Asp85 90 95His Lys Leu Lys Lys Ala Ala Glu His Gly Asp Leu Pro Leu Ser Phe100 105 110Ser Val Thr Asn Ile Gln Pro Ala Ala Ala Gly Ser Ala Thr Ala Asp115 120 125Val Ser Val Ser Gly Pro Lys Leu Ser Ser Pro Val Thr Gln Asn Val130 135 140Thr Phe Val Asn Gln Gly Gly Trp Met Leu Ser Arg Ala Ser Ala Met145 150 155 160Glu Leu Leu Gln Ala Ala Gly Asn165(2)SEQ ID NO95的信息(i)序列特征(A)长度332个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO95Met His His His His His His Met His Gln Val Asp Pro Asn Leu Thr1 5 10 15Arg Arg Lys Gly Arg Leu Ala Ala Leu Ala Ile Ala Ala Met Ala Ser20 25 30Ala Ser Leu Val Thr Val Ala Val Pro Ala Thr Ala Asn Ala Asp Pro35 40 45Glu Pro Ala Pro Pro Val Pro Thr Thr Ala Ala Ser Pro Pro Ser Thr50 55 60Ala Ala Ala Pro Pro Ala Pro Ala Thr Pro Val Ala Pro Pro Pro Pro65 70 75 80Ala Ala Ala Asn Thr Pro Asn Ala Gln Pro Gly Asp Pro Asn Ala Ala85 90 95Pro Pro Pro Ala Asp Pro Asn Ala Pro Pro Pro Pro Val Ile Ala Pro100 105 110Asn Ala Pro Gln Pro Val Arg Ile Asp Asn Pro Val Gly Gly Phe Ser115 120 125Phe Ala Leu Pro Ala Gly Trp Val Glu Ser Asp Ala Ala His Phe Asp130 135 140Tyr Gly Ser Ala Leu Leu Ser Lys Thr Thr Gly Asp Pro Pro Phe Pro145 150 155 160Gly Gln Pro Pro Pro Val Ala Asn Asp Thr Arg Ile Val Leu Gly Arg165 170 175Leu Asp Gln Lys Leu Tyr Ala Ser Ala Glu Ala Thr Asp Ser Lys Ala180 185 190Ala Ala Arg Leu Gly Ser Asp Met Gly Glu Phe Tyr Met Pro Tyr Pro195 200 205Gly Thr Arg Ile Asn Gln Glu Thr Val Ser Leu Asp Ala Asn Gly Val210 215 220Ser Gly Ser Ala Ser Tyr Tyr Glu Val Lys Phe Ser Asp Pro Ser Lys225 230 235 240Pro Asn Gly Gln Ile Trp Thr Gly Val Ile Gly Ser Pro Ala Ala Asn245 250 255Ala Pro Asp Ala Gly Pro Pro Gln Arg Trp Phe Val Val Trp Leu Gly260 265 270Thr Ala Asn Asn Pro Val Asp Lys Gly Ala Ala Lys Ala Leu Ala Glu275 280 285Ser Ile Arg Pro Leu Val Ala Pro Pro Pro Ala Pro Ala Pro Ala Pro290 295 300Ala Glu Pro Ala Pro Ala Pro Ala Pro Ala Gly Glu Val Ala Pro Thr305 310 315 320Pro Thr Thr Pro Thr Pro Gln Arg Thr Leu Pro Ala325 330(2)SEQ ID NO96的信息(i)序列特征(A)长度500个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO96CGTGGCAATG TCGTTGACCG TCGGGGCCGG GGTCGCCTCC GCAGATCCCG TGGACGCGGT 60CATTAACACC ACCTGCAATT ACGGGCAGGT AGTAGCTGCG CTCAACGCGA CGGATCCGGG 120GGCTGCCGCA CAGTTCAACG CCTCACCGGT GGCGCAGTCC TATTTGCGCA ATTTCCTCGC 180CGCACCGCCA CCTCAGCGCG CTGCCATGGC CGCGCAATTG CAAGCTGTGC CGGGGGCGGC 240ACAGTACATC GGCCTTGTCG AGTCGGTTGC CGGCTCCTGC AACAACTATT AAGCCCATGC 300GGGCCCCATC CCGCGACCCG GCATCGTCGC CGGGGCTAGG CCAGATTGCC CCGCTCCTCA 360ACGGGCCGCA TCCCGCGACC CGGCATCGTC GCCGGGGCTA GGCCAGATTG CCCCGCTCCT 420CAACGGGCCG CATCTCGTGC CGAATTCCTG CAGCCCGGGG GATCCACTAG TTCTAGAGCG 480GCCGCCACCG CGGTGGAGCT 500(2)SEQ ID NO97的信息(i)序列特征(A)长度96个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO97Val Ala Met Ser Leu Thr Val Gly Ala Gly Val Ala Ser Ala Asp Pro1 5 10 15Val Asp Ala Val Ile Asn Thr Thr Cys Asn Tyr Gly Gln Val Val Ala20 25 30Ala Leu Asn Ala Thr Asp Pro Gly Ala Ala Ala Gln Phe Asn Ala Ser35 40 45Pro Val Ala Gln Ser Tyr Leu Arg Asn Phe Leu Ala Ala Pro Pro Pro50 55 60Gln Arg Ala Ala Met Ala Ala Gln Leu Gln Ala Val Pro Gly Ala Ala65 70 75 80Gln Tyr Ile Gly Leu Val Glu Ser Val Ala Gly Ser Cys Asn Asn Tyr85 90 95(2)SEQ ID NO98的信息(i)序列特征(A)长度154个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO98ATGACAGAGC AGCAGTGGAA TTTCGCGGGT ATCGAGGCCG CGGCAAGCGC AATCCAGGGA 60AATGTCACGT CCATTCATTC CCTCCTTGAC GAGGGGAAGC AGTCCCTGAC CAAGCTCGCA120GCGGCCTGGG GCGGTAGCGG TTCGGAAGCG TACC 154(2)SEQ ID NO99的信息(i)序列特征(A)长度51个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO99Met Thr Glu Gln Gln Trp Asn Phe Ala Gly Ile Glu Ala Ala Ala Ser1 5 10 15Ala Ile Gln Gly Asn Val Thr Ser Ile His Ser Leu Leu Asp Glu Gly20 25 30Lys Gln Ser Leu Thr Lys Leu Ala Ala Ala Trp Gly Gly Ser Gly Ser35 40 45Glu Ala Tyr50(2)SEQ ID NO100的信息(i)序列特征(A)长度282个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO100CGGTCGCGCA CTTCCAGGTG ACTATGAAAG TCGGCTTCCG NCTGGAGGAT TCCTGAACCT60TCAAGCGCGG CCGATAACTG AGGTGCATCA TTAAGCGACT TTTCCAGAAC ATCCTGACGC 120GCTCGAAACG CGGCACAGCC GACGGTGGCT CCGNCGAGGC GCTGNCTCCA AAATCCCTGA 180GACAATTCGN CGGGGGCGCC TACAAGGAAG TCGGTGCTGA ATTCGNCGNG TATCTGGTCG 240ACCTGTGTGG TCTGNAGCCG GACGAAGCGG TGCTCGACGT CG 282(2)SEQ ID NO101的信息(i)序列特征(A)长度1565个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO101GTATGCGGCC ACTGAAGTCG CCAATGCGGC GGCGGCCAGC TAAGCCAGGA ACAGTCGGCA 60CGAGAAACCA CGAGAAATAG GGACACGTAA TGGTGGATTT CGGGGCGTTA CCACCGGAGA 120TCAACTCCGC GAGGATGTAC GCCGGCCCGG GTTCGGCCTC GCTGGTGGCC GCGGCTCAGA 180TGTGGGACAG CGTGGCGAGT GACCTGTTTT CGGCCGCGTC GGCGTTTCAG TCGGTGGTCT 240GGGGTCTGAC GGTGGGGTCG TGGATAGGTT CGTCGGCGGG TCTGATGGTG GCGGCGGCCT 300CGCCGTATGT GGCGTGGATG AGCGTCACCG CGGGGCAGGC CGAGCTGACC GCCGCCCAGG 360TCCGGGTTGC TGCGGCGGCC TACGAGACGG CGTATGGGCT GACGGTGCCC CCGCCGGTGA 420TCGCCGAGAA CCGTGCTGAA CTGATGATTC TGATAGCGAC CAACCTCTTG GGGCAAAACA 480CCCCGGCGAT CGCGGTCAAC GAGGCCGAAT ACGGCGAGAT GTGGGCCCAA GACGCCGCCG 540CGATGTTTGG CTACGCCGCG GCGACGGCGA CGGCGACGGC GACGTTGCTG CCGTTCGAGG 600AGGCGCCGGA GATGACCAGC GCGGGTGGGC TCCTCGAGCA GGCCGCCGCG GTCGAGGAGG 660CCTCCGACAC CGCCGCGGCG AACCAGTTGA TGAACAATGT GCCCCAGGCG CTGCAACAGC 720TGGCCCAGCC CACGCAGGGC ACCACGCCTT CTTCCAAGCT GGGTGGCCTG TGGAAGACGG 780TCTCGCCGCA TCGGTCGCCG ATCAGCAACA TGGTGTCAAT GGCCAACAAC CACATGTCAA 840TGACCAACTC GGGTGTGTCA ATGACCAACA CCTTGAGCTC GATGTTGAAG GGCTTTGCTC 900CGGCGGCGGC CGCCCAGGCC GTGCAAACCG CGGCGCAAAA CGGGGTCCGG GCGATGAGCT 960CGCTGGGCAG CTCGCTGGGT TCTTCGGGTC TGGGCGGTGG GGTGGCCGCC AACTTGGGTC 1020GGGCGGCCTC GGTCGGTTCG TTGTCGGTGC CGCAGGCCTG GGCCGCGGCC AACCAGGCAG 1080TCACCCCGGC GGCGCGGGCG CTGCCGCTGA CCAGCCTGAC CAGCGCCGCG GAAAGAGGGC 1140CCGGGCAGAT GCTGGGCGGG CTGCCGGTGG GGCAGATGGG CGCCAGGGCC GGTGGTGGGC 1200TCAGTGGTGT GCTGCGTGTT CCGCCGCGAC CCTATGTGAT GCCGCATTCT CCGGCGGCCG 1260GCTAGGAGAG GGGGCGCAGA CTGTCGTTAT TTGACCAGTG ATCGGCGGTC TCGGTGTTTC 1320CGCGGCCGGC TATGACAACA GTCAATGTGC ATGACAAGTT ACAGGTATTA GGTCCAGGTT 1380CAACAAGGAG ACAGGCAACA TGGCCTCACG TTTTATGACG GATCCGCACG CGATGCGGGA 1440CATGGCGGGC CGTTTTGAAG TGCACGCCCA GACGGTGGAG GACGAGGCTC GCCGGATGTG 1500GGCGTCCGCG CAAAACATTT CCGGTGCGGG CTGGAGTGGC ATGGCCGAGG CGACCTCGCT 1560AGACA1565(2)SEQ ID NO102的信息(i)序列特征(A)长度391个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO102Met Val Asp Phe Gly Ala Leu Pro Pro Glu Ile Asn Ser Ala Arg Met1 5 10 15Tyr Ala Gly Pro Gly Ser Ala Ser Leu Val Ala Ala Ala Gln Met Trp20 25 30Asp Ser Val Ala Ser Asp Leu Phe Ser Ala Ala Ser Ala Phe Gln Ser35 40 45Val Val Trp Gly Leu Thr Val Gly Ser Trp Ile Gly Ser Ser Ala Gly50 55 60Leu Met Val Ala Ala Ala Ser Pro Tyr Val Ala Trp Met Ser Val Thr65 70 75 80Ala Gly Gln Ala Glu Leu Thr Ala Ala Gln Val Arg Val Ala Ala Ala85 90 95Ala Tyr Glu Thr Ala Tyr Gly Leu Thr Val Pro Pro Pro Val Ile Ala100 105 110Glu Asn Arg Ala Glu Leu Met Ile Leu Ile Ala Thr Asn Leu Leu Gly115 120 125Gln Asn Thr Pro Ala Ile Ala Val Asn Glu Ala Glu Tyr Gly Glu Met130 135 140Trp Ala Gln Asp Ala Ala Ala Met Phe Gly Tyr Ala Ala Ala Thr Ala145 150 155 160Thr Ala Thr Ala Thr Leu Leu Pro Phe Glu Glu Ala Pro Glu Met Thr165 170 175Ser Ala Gly Gly Leu Leu Glu Gln Ala Ala Ala Val Glu Glu Ala Ser180 185 190Asp Thr Ala Ala Ala Asn Gln Leu Met Asn Asn Val Pro Gln Ala Leu195 200 205Gln Gln Leu Ala Gln Pro Thr Gln Gly Thr Thr Pro Ser Ser Lys Leu210 215 220Gly Gly Leu Trp Lys Thr Val Ser Pro His Arg Ser Pro Ile Ser Asn225 230 235 240Met Val Ser Met Ala Asn Asn His Met Ser Met Thr Asn Ser Gly Val245 250 255Ser Met Thr Asn Thr Leu Ser Ser Met Leu Lys Gly Phe Ala Pro Ala260 265 270Ala Ala Ala Gln Ala Val Gln Thr Ala Ala Gln Asn Gly Val Arg Ala275 280 285Met Ser Ser Leu Gly Ser Ser Leu Gly Ser Ser Gly Leu Gly Gly Gly290 295 300Val Ala Ala Asn Leu Gly Arg Ala Ala Ser Val Gly Ser Leu Ser Val305 310 315 320Pro Gln Ala Trp Ala Ala Ala Asn Gln Ala Val Thr Pro Ala Ala Arg325 330 335Ala Leu Pro Leu Thr Ser Leu Thr Ser Ala Ala Glu Arg Gly Pro Gly340 345 350Gln Met Leu Gly Gly Leu Pro Val Gly Gln Met Gly Ala Arg Ala Gly355 360 365Gly Gly Leu Ser Gly Val Leu Arg Val Pro Pro Arg Pro Tyr Val Met370 375 380Pro His Ser Pro Ala Ala Gly385 390(2)SEQ ID NO103的信息(i)序列特征(A)长度259个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO103ACCAACACCT TGCACTCNAT GTTGAAGGGC TTAGCTCCGG CGGCGGCTCA GGCCGTGGAA 60ACCGCGGCGG AAAACGGGGT CTGGGCAATG AGCTCGCTGG GCAGCCAGCT GGGTTCGTCG 120CTGGGTTCTT CGGGTCTGGG CGCTGGGGTG GCCGCCAACT TGGGTCGGGC GGCCTCGGTC 180GGTTCGTTGT CGGTGCCGCC AGCATGGGCC GCGGCCAACC AGGCGGTCAC CCCGGCGGCG 240CGGGCGCTGC CGCTGACCA 259(2)SEQ ID NO104的信息(i)序列特征(A)长度86个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO104Thr Asn Thr Leu His Ser Met Leu Lys Gly Leu Ala Pro Ala Ala Ala1 5 10 15Gln Ala Val Glu Thr Ala Ala Glu Asn Gly Val Trp Ala Met Ser Ser20 25 30Leu Gly Ser Gln Leu Gly Ser Ser Leu Gly Ser Ser Gly Leu Gly Ala35 40 45Gly Val Ala Ala Asn Leu Gly Arg Ala Ala Ser Val Gly Ser Leu Ser50 55 60Val Pro Pro Ala Trp Ala Ala Ala Asn Gln Ala Val Thr Pro Ala Ala65 70 75 80Arg Ala Leu Pro Leu Thr85(2)SEQ ID NO105的信息(i)序列特征(A)长度1109个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEO ID NO105TACTTGAGAG AATTTGACCT GTTGCCGACG TTGTTTGCTG TCCATCATTG GTGCTAGTTA 60TGGCCGAGCG GAAGGATTAT CGAAGTGGTG GACTTCGGGG CGTTACCACC GGAGATCAAC 120TCCGCGAGGA TGTACGCCGG CCCGGGTTCG GCCTCGCTGG TGGCCGCCGC GAAGATGTGG 180GACAGCGTGG CGAGTGACCT GTTTTCGGCC GCGTCGGCGT TTCAGTCGGT GGTCTGGGGT 240CTGACGACGG GATCGTGGAT AGGTTCGTCG GCGGGTCTGA TGGTGGCGGC GGCCTCGCCG 300TATGTGGCGT GGATGAGCGT CACCGCGGGG CAGGCCGAGC TGACCGCCGC CCAGGTCCGG 360GTTGCTGCGG CGGCCTACGA GACGGCGTAT GGGCTGACGG TGCCCCCGCC GGTGATCGCC 420GAGAACCGTG CTGAACTGAT GATTCTGATA GCGACCAACC TCTTGGGGCA AAACACCCCG 480GCGATCGCGG TCAACGAGGC CGAATACGGG GAGATGTGGG CCCAAGACGC CGCCGCGATG 540TTTGGCTACG CCGCCACGGC GGCGACGGCG ACCGAGGCGT TGCTGCCGTT CGAGGACGCC 600CCACTGATCA CCAACCCCGG CGGGCTCCTT GAGCAGGCCG TCGCGGTCGA GGAGGCCATC 660GACACCGCCG CGGCGAACCA GTTGATGAAC AATGTGCCCC AAGCGCTGCA ACAACTGGCC 720CAGCCCACGA AAAGCATCTG GCCGTTCGAC CAACTGAGTG AACTCTGGAA AGCCATCTCG 780CCGCATCTGT CGCCGCTCAG CAACATCGTG TCGATGCTCA ACAACCACGT GTCGATGACC 840AACTCGGGTG TGTCAATGGC CAGCACCTTG CACTCAATGT TGAAGGGCTT TGCTCCGGCG 900GCGGCTCAGG CCGTGGAAAC CGCGGCGCAA AACGGGGTCC AGGCGATGAG CTCGCTGGGC 960AGCCAGCTGG GTTCGTCGCT GGGTTCTTCG GGTCTGGGCG CTGGGGTGGC CGCCAACTTG 1020GGTCGGGCGG CCTCGGTCGG TTCGTTGTCG GTGCCGCAGG CCTGGGCCGC GGCCAACCAG 1080GCGGTCACCC CGGCGGCGCG GGCGCTGCC 1109(2)SEQ ID NO106的信息(i)序列特征(A)长度341个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO106Val Val Asp Phe Gly Ala Leu Pro Pro Glu Ile Asn Ser Ala Arg Met1 5 10 15Tyr Ala Gly Pro Gly Ser Ala Ser Leu Val Ala Ala Ala Lys Met Trp20 25 30Asp Ser Val Ala Ser Asp Leu Phe Ser Ala Ala Ser Ala Phe Gln Ser35 40 45Val Val Trp Gly Leu Thr Thr Gly Ser Trp Ile Gly Ser Ser Ala Gly50 55 60Leu Met Val Ala Ala Ala Ser Pro Tyr Val Ala Trp Met Ser Val Thr65 70 75 80Ala Gly Gln Ala Glu Leu Thr Ala Ala Gln Val Arg Val Ala Ala Ala85 90 95Ala Tyr Glu Thr Ala Tyr Gly Leu Thr Val Pro Pro Pro Val Ile Ala100 105 110Glu Asn Arg Ala Glu Leu Met Ile Leu Ile Ala Thr Asn Leu Leu Gly115 120 125Gln Asn Thr Pro Ala Ile Ala Val Asn Glu Ala Glu Tyr Gly Glu Met130 135 140Trp Ala Gln Asp Ala Ala Ala Met Phe Gly Tyr Ala Ala Thr Ala Ala145 150 155 160Thr Ala Thr Glu Ala Leu Leu Pro Phe Glu Asp Ala Pro Leu Ile Thr165 170 175Asn Pro Gly Gly Leu Leu Glu Gln Ala Val Ala Val Glu Glu Ala Ile180 185 190Asp Thr Ala Ala Ala Asn Gln Leu Met Asn Asn Val Pro Gln Ala Leu195 200 205Gln Gln Leu Ala Gln Pro Thr Lys Ser Ile Trp Pro Phe Asp Gln Leu210 215 220Ser Glu Leu Trp Lys Ala Ile Ser Pro His Leu Ser Pro Leu Ser Asn225 230 235 240Ile Val Ser Met Leu Asn Asn His Val Ser Met Thr Asn Ser Gly Val245 250 255Ser Met Ala Ser Thr Leu His Ser Met Leu Lys Gly Phe Ala Pro Ala260 265 270Ala Ala Gln Ala Val Glu Thr Ala Ala Gln Asn Gly Val Gln Ala Met275 280 285Ser Ser Leu Gly Ser Gln Leu Gly Ser Ser Leu Gly Ser Ser Gly Leu290 295 300Gly Ala Gly Val Ala Ala Asn Leu Gly Arg Ala Ala Ser Val Gly Ser305 310 315 320Leu Ser Val Pro Gln Ala Trp Ala Ala Ala Asn Gln Ala Val Thr Pro325 330 335Ala Ala Arg Ala Leu340(2)SEQ ID NO107的信息(i)序列特征(A)长度1256个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO107CATCGGAGGG AGTGATCACC ATGCTGTGGC ACGCAATGCC ACCGGAGNTA AATACCGCAC 60GGCTGATGGC CGGCGCGGGT CCGGCTCCAA TGCTTGCGGC GGCCGCGGGA TGGCAGACGC 120TTTCGGCGGC TCTGGACGCT CAGGCCGTCG AGTTGACCGC GCGCCTGAAC TCTCTGGGAG 180AAGCCTGGAC TGGAGGTGGC AGCGACAAGG CGCTTGCGGC TGCAACGCCG ATGGTGGTCT 240GGCTACAAAC CGCGTCAACA CAGGCCAAGA CCCGTGCGAT GCAGGCGACG GCGCAAGCCG 300CGGCATACAC CCAGGCCATG GCCACGACGC CGTCGCTGCC GGAGATCGCC GCCAACCACA 360TCACCCAGGC CGTCCTTACG GCCACCAACT TCTTCGGTAT CAACACGATC CCGATCGCGT 420TGACCGAGAT GGATTATTTC ATCCGTATGT GGAACCAGGC AGCCCTGGCA ATGGAGGTCT 480ACCAGGCCGA GACCGCGGTT AACACGCTTT TCGAGAAGCT CGAGCCGATG GCGTCGATCC 540TTGATCCCGG CGCGAGCCAG AGCACGACGA ACCCGATCTT CGGAATGCCC TCCCCTGGCA 600GCTCAACACC GGTTGGCCAG TTGCCGCCGG CGGCTACCCA GACCCTCGGC CAACTGGGTG 660AGATGAGCGG CCCGATGCAG CAGCTGACCC AGCCGCTGCA GCAGGTGACG TCGTTGTTCA 720GCCAGGTGGG CGGCACCGGC GGCGGCAACC CAGCCGACGA GGAAGCCGCG CAGATGGGCC 780TGCTCGGCAC CAGTCCGCTG TCGAACCATC CGCTGGCTGG TGGATCAGGC CCCAGCGCGG 840GCGCGGGCCT GCTGCGCGCG GAGTCGCTAC CTGGCGCAGG TGGGTCGTTG ACCCGCACGC 900CGCTGATGTC TCAGCTGATC GAAAAGCCGG TTGCCCCCTC GGTGATGCCG GCGGCTGCTG 960CCGGATCGTC GGCGACGGGT GGCGCCGCTC CGGTGGGTGC GGGAGCGATG GGCCAGGGTG1020CGCAATCCGG CGGCTCCACC AGGCCGGGTC TGGTCGCGCC GGCACCGCTC GCGCAGGAGC1080GTGAAGAAGA CGACGAGGAC GACTGGGACG AAGAGGACGA CTGGTGAGCT CCCGTAATGA1140CAACAGACTT CCCGGCCACC CGGGCCGGAA GACTTGCCAA CATTTTGGCG AGGAAGGTAA1200AGAGAGAAAG TAGTCCAGCA TGGCAGAGAT GAAGACCGAT GCCGCTACCC TCGCGC1256(2)SEQ ID NO108的信息(i)序列特征(A)长度432个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO108CTAGTGGATG GGACCATGGC CATTTTCTGC AGTCTCACTG CCTTCTGTGT TGACATTTTG 60GCACGCCGGC GGAAACGAAG CACTGGGGTC GAAGAACGGC TGCGCTGCCA TATCGTCCGG 120AGCTTCCATA CCTTCGTGCG GCCGGAAGAG CTTGTCGTAG TCGGCCGCCA TGACAACCTC 180TCAGAGTGCG CTCAAACGTA TAAACACGAG AAAGGGCGAG ACCGACGGAA GGTCGAACTC 240GCCCGATCCC GTGTTTCGCT ATTCTACGCG AACTCGGCGT TGCCCTATGC GAACATCCCA 300GTGACGTTGC CTTCGGTCGA AGCCATTGCC TGACCGGCTT CGCTGATCGT CCGCGCCAGG 360TTCTGCAGCG CGTTGTTCAG CTCGGTAGCC GTGGCGTCCC ATTTTTGCTG GACACCCTGG 420TACGCCTCCG AA 432(2)SEQ ID NO109的信息(i)序列特征(A)长度368个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO109Met Leu Trp His Ala Met Pro Pro Glu Xaa Asn Thr Ala Arg Leu Met1 5 10 15Ala Gly Ala Gly Pro Ala Pro Met Leu Ala Ala Ala Ala Gly Trp Gln20 25 30Thr Leu Ser Ala Ala Leu Asp Ala Gln Ala Val Glu Leu Thr Ala Arg35 40 45Leu Asn Ser Leu Gly Glu Ala Trp Thr Gly Gly Gly Ser Asp Lys Ala50 55 60Leu Ala Ala Ala Thr Pro Met Val Val Trp Leu Gln Thr Ala Ser Thr65 70 75 80Gln Ala Lys Thr Arg Ala Met Gln Ala Thr Ala Gln Ala Ala Ala Tyr85 90 95Thr Gln Ala Met Ala Thr Thr Pro Ser Leu Pro Glu Ile Ala Ala Asn100 105 110His Ile Thr Gln Ala Val Leu Thr Ala Thr Asn Phe Phe Gly Ile Asn115 120 125Thr Ile Pro Ile Ala Leu Thr Glu Met Asp Tyr Phe Ile Arg Met Trp130 135 140Asn Gln Ala Ala Leu Ala Met Glu Val Tyr Gln Ala Glu Thr Ala Val145 150 155 160Asn Thr Leu Phe Glu Lys Leu Glu Pro Met Ala Ser Ile Leu Asp Pro165 170 175Gly Ala Ser Gln Ser Thr Thr Asn Pro Ile Phe Gly Met Pro Ser Pro180 185 190Gly Ser Ser Thr Pro Val Gly Gln Leu Pro Pro Ala Ala Thr Gln Thr195 200 205Leu Gly Gln Leu Gly Glu Met Ser Gly Pro Met Gln Gln Leu Thr Gln210 215 220Pro Leu Gln Gln Val Thr Ser Leu Phe Ser Gln Val Gly Gly Thr Gly225 230 235 240Gly Gly Asn Pro Ala Asp Glu Glu Ala Ala Gln Met Gly Leu Leu Gly245 250 255Thr Ser Pro Leu Ser Asn His Pro Leu Ala Gly Gly Ser Gly Pro Ser260 265 270Ala Gly Ala Gly Leu Leu Arg Ala Glu Ser Leu Pro Gly Ala Gly Gly275 280 285Ser Leu Thr Arg Thr Pro Leu Met Ser Gln Leu Ile Glu Lys Pro Val290 295 300Ala Pro Ser Val Met Pro Ala Ala Ala Ala Gly Ser Ser Ala Thr Gly305 310 315 320Gly Ala Ala Pro Val Gly Ala Gly Ala Met Gly Gln Gly Ala Gln Ser325 330 335Gly Gly Ser Thr Arg Pro Gly Leu Val Ala Pro Ala Pro Leu Ala Gln340 345 350Glu Arg Glu Glu Asp Asp Glu Asp Asp Trp Asp Glu Glu Asp Asp Trp355 360 365(2)SEQ ID NO110的信息(i)序列特征(A)长度12个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO110
Met Ala Glu Met Lys Thr Asp Ala Ala Thr Leu Ala1 5 10(2)SEQ ID NO111的信息(i)序列特征(A)长度396个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO111GATCTCCGGC GACCTGAAAA CCCAGATCGA CCAGGTGGAG TCGACGGCAG GTTCGTTGCA 60GGGCCAGTGG CGCGGCGCGG CGGGGACGGC CGCCCAGGCC GCGGTGGTGC GCTTCCAAGA 120AGCAGCCAAT AAGCAGAAGC AGGAACTCGA CGAGATCTCG ACGAATATTC GTCAGGCCGG 180CGTCCAATAC TCGAGGGCCG ACGAGGAGCA GCAGCAGGCG CTGTCCTCGC AAATGGGCTT 240CTGACCCGCT AATACGAAAA GAAACGGAGC AAAAACATGA CAGAGCAGCA GTGGAATTTC 300GCGGGTATCG AGGCCGCGGC AAGCGCAATC CAGGGAAATG TCACGTCCAT TCATTCCCTC 360CTTGACGAGG GGAAGCAGTC CCTGACCAAG CTCGCA 396(2)SEQ ID NO112的信息(i)序列特征(A)长度80个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO112Ile Ser Gly Asp Leu Lys Thr Gln Ile Asp Gln Val Glu Ser Thr Ala1 5 10 15Gly Ser Leu Gln Gly Gln Trp Arg Gly Ala Ala Gly Thr Ala Ala Gln20 25 30Ala Ala Val Val Arg Phe Gln Glu Ala Ala Asn Lys Gln Lys Gln Glu35 40 45Leu Asp Glu Ile Ser Thr Asn Ile Arg Gln Ala Gly Val Gln Tyr Ser50 55 60Arg Ala Asp Glu Glu Gln Gln Gln Ala Leu Ser Ser Gln Met Gly Phe65 70 75 80(2)SEQ ID NO113的信息(i)序列特征(A)长度387个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO113GTGGATCCCG ATCCCGTGTT TCGCTATTCT ACGCGAACTC GGCGTTGCCC TATGCGAACA 60TCCCAGTGAC GTTGCCTTCG GTCGAAGCCA TTGCCTGACC GGCTTCGCTG ATCGTCCGCG 120CCAGGTTCTG CAGCGCGTTG TTCAGCTCGG TAGCCGTGGC GTCCCATTTT TGCTGGACAC 180CCTGGTACGC CTCCGAACCG CTACCGCCCC AGGCCGCTGC GAGCTTGGTC AGGGACTGCT 240TCCCCTCGTC AAGGAGGGAA TGAATGGACG TGACATTTCC CTGGATTGCG CTTGCCGCGG 300CCTCGATACC CGCGAAATTC CACTGCTGCT CTGTCATGTT TTTGCTCCGT TTCTTTTCGT 360ATTAGCGGGT CAGAAGCCCA TTTGCGA 387(2)SEQ ID NO114的信息(i)序列特征(A)长度272个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO114CGGCACGAGG ATCTCGGTTG GCCCAACGGC GCTGGCGAGG GCTCCGTTCC GGGGGCGAGC 60TGCGCGCCGG ATGCTTCCTC TGCCCGCAGC CGCGCCTGGA TGGATGGACC AGTTGCTACC 120TTCCCGACGT TTCGTTCGGT GTCTGTGCGA TAGCGGTGAC CCCGGCGCGC ACGTCGGGAG 180TGTTGGGGGG CAGGCCGGGT CGGTGGTTCG GCCGGGGACG CAGACGGTCT GGACGGAACG 240GGCGGGGGTT CGCCGATTGG CATCTTTGCC CA 272(2)SEQ ID NO115的信息(i)序列特征(A)长度20个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO115Asp Pro Val Asp Ala Val Ile Asn Thr Thr Cys Asn Tyr Gly Gln Val1 5 10 15Val Ala Ala Leu20(2)SEQ ID NO116的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型
(xi)序列描述SEQ ID NO116Ala Val Glu Ser Gly Met Leu Ala Leu Gly Thr Pro Ala Pro Ser1 5 10 15(2)SEQ ID NO117的信息(i)序列特征(A)长度19个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO117Ala Ala Met Lys Pro Arg Thr Gly Asp Gly Pro Leu Glu Ala Ala Lys1 5 10 15Glu Gly Arg(2)SEQ ID NO118的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO118Tyr Tyr Trp Cys Pro Gly Gln Pro Phe Asp Pro Ala Trp Gly Pro1 5 10 15(2)SEQ ID NO119的信息(i)序列特征(A)长度14个氨基酸(B)类型氨基酸(C)链型
(D)拓扑结构线型(xi)序列描述SEQ ID NO119Asp Ile Gly Ser Glu Ser Thr Glu Asp Gln Gln Xaa Ala Val1 5 10(2)SEQ ID NO120的信息(i)序列特征(A)长度13个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO120Ala Glu Glu Ser Ile Ser Thr Xaa Glu Xaa Ile Val Pro1 5 10(2)SEQ ID NO121的信息(i)序列特征(A)长度17个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO121Asp Pro Glu Pro Ala Pro Pro Val Pro Thr Thr Ala Ala Ser Pro Pro1 5 10 15Ser(2)SEQ ID NO122的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸
(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO122Ala Pro Lys Thr Tyr Xaa Glu Glu Leu Lys Gly Thr Asp Thr Gly1 5 10 15(2)SEQ ID NO123的信息(i)序列特征(A)长度30个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO123Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln Leu Thr Ser1 5 10 15Leu Leu Asn Ser Leu Ala Asp Pro Asn Val Ser Phe Ala Asn20 25 30(2)SEQ ID NO124的信息(i)序列特征(A)长度22个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO124Asp Pro Pro Asp Pro His Gln Xaa Asp Met Thr Lys Gly Tyr Tyr Pro1 5 10 15Gly Gly Arg Arg Xaa Phe20(2)SEQ ID NO125的信息(i)序列特征(A)长度7个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO125Asp Pro Gly Tyr Thr Pro Gly1 5(2)SEQ ID NO126的信息(i)序列特征(A)长度10个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(ix)特征(D)其它信息/注=“第二残基可以是Pro或者Thr”(xi)序列描述SEQ ID NO126Xaa Xaa Gly Phe Thr Gly Pro Gln Phe Tyr1 5 10(2)SEQ ID NO127的信息(i)序列特征(A)长度9个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(ix)特征(D)其它信息/注=“第三残基可以是Gln或者Leu”
(xi)序列描述SEQ ID NO127Xaa Pro Xaa Val Thr Ala Tyr Ala Gly1 5(2)SEQ ID NO128的信息(i)序列特征(A)长度9个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO128Xaa Xaa Xaa Glu Lys Pro Phe Leu Arg1 5(2)SEQ ID NO129的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO129Xaa Asp Ser Glu Lys Ser Ala Thr Ile Lys Val Thr Asp Ala Ser1 5 10 15(2)SEQ ID NO130的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型
(xi)序列描述SEQ ID NO130Ala Gly Asp Thr Xaa Ile Tyr Ile Val Gly Asn Leu Thr Ala Asp1 5 10 15(2)SEQ ID NO131的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO131Ala Pro Glu Ser Gly Ala Gly Leu Gly Gly Thr Val Gln Ala Gly1 5 10 15(2)SEQ ID NO132的信息(i)序列特征(A)长度21个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO132Xaa Tyr Ile Ala Tyr Xaa Thr Thr Ala Gly Ile Val Pro Gly Lys Ile1 5 10 15Asn Val His Leu Val20
权利要求
1.一种多肽,该多肽包含可溶性结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的抗原性部分,其中所说的抗原具有选自下组的N端序列(a)Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Cys-Asn-Tyr-Gly-Gln-Val-Val-Ala-Ala-Leu(SEQ ID No.115);(b)Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-Ser(SEQ ID No.116);(c)Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-Leu-Glu-Ala-Ala-Lys-Glu-Gly-Arg(SEQ ID No.117);(d)Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-Pro(SEQ ID No.118);(e)Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val(SEQ ID No.119);(f)Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro(SEQ ID No.120);(g)Asp-Pro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Thr-Ala-Ala-Ser-Pro-Ser(SEQ ID No.121);(h)Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-Gly(SEQ ID No.122);(i)Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Leu-Thr-Ser-Leu-Leu-Asn-Ser-Leu-Ala-Asp-Pro-Asn-Val-Ser-Phe-Ala-Asn(SEQ ID No.123);和(j)Ala-Pro-Glu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Tbr-Val-Gln-Ala-Gly;(SEQ ID No.131)其中Xaa可以是任何氨基酸。
2.一种多肽,该多肽包含结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的免疫原性部分,其中所说的抗原具有选自下组的N端序列(a)Asp-Pro-Pro-Asp-Pro-His-Gln-Xaa-Asp-Met-Thr-Lys-Gly-Tyr-Tyr-Pro-Gly-Gly-Arg-Arg-Xaa-Phe;(SEQ ID No.124)和(b)Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-Ile-Asn-Val-His-Leu-Val;(SEQ ID No.132),其中Xaa可以是任何氨基酸。
3.一种多肽,该多肽包含可溶性结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的抗原性部分,其中所说的抗原包含由选自下组的DNA序列编码的氨基酸序列SEQ ID No.1,2,4-10,13-25,52,94和96中所示的序列、这些序列的补体、以及在中等严格条件下与SEQ ID No.1,2,4-10,13-25,52,94和96中所示的序列杂交的DNA序列或它们的补体。
4.一种多肽,该多肽包含结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的抗原性部分,其中所说的抗原包含由选自下组的DNA序列编码的氨基酸序列SEQ ID No.26-51中所示的序列、这些序列的补体、和在中等严格条件下与SEQ ID No.26-51中所示的序列杂交的DNA序列或它们的补体。
5.一种DNA分子,该分子包含编码按照权利要求1-4之任一的多肽的核苷酸序列。
6.一种重组表达载体,该载体包含按照权利要求5的DNA分子。
7.一种宿主细胞,该宿主细胞由按照权利要求6的表达载体转化过。
8.权利要求7的宿主细胞,其中所说的宿主细胞选自大肠杆菌、酵母和哺乳动物细胞。
9.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括(a)使生物样品与按照权利要求1-4之任一的一种或多种多肽接触;和(b)在样品中检测结合到至少一种所说多肽上的抗体的存在,由此检测生物样品中的结核分枝杆菌感染。
10.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括(a)使生物样品与具有选自由SEQ ID No.129和130给出的序列的N端序列的多肽接触;和(b)在样品中检测结合到至少一种所说多肽上的抗体的存在,由此检测生物样品中的结核分枝杆菌感染。
11.一种用于在生物样品中检测结核分枝杆菌感染的方法,该方法包括(a)使生物样品与由选自下组的DNA序列编码的一种或多种多肽接触SEQ ID No.3,11和12的序列、这些序列的补体、以及与SEQ ID No.3,11和12所示的序列杂交的DNA序列;和(b)在样品中检测结合到至少一种所说多肽上的抗体的存在,由此检测生物样品中的结核分枝杆菌感染。
12.权利要求9-11之任一的方法,其中步骤(a)还包括使生物样品与38kD结核分枝杆菌抗原接触,并且步骤(b)还包括在样品中检测结合到38kD结核分枝杆菌抗原上的抗体的存在。
13.权利要求9-11之任一的方法,其中所说的多肽是结合到固相支持物上的。
14.权利要求13的方法,其中所说的固相支持物包含硝化纤维素、乳胶或塑料材料。
15.权利要求9-11之任一的方法,其中所说的生物样品选自全血、血清、血浆、唾液、脑脊液和尿。
16.权利要求15的方法,其中所说的生物样品是全血或血清。
17.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括(a)使所说的样品与聚合酶链反应中的第一和第二寡核苷酸引物接触,所说的第一和第二寡核苷酸引物包含按照权利要求5的DNA分子的至少约10个邻接的核苷酸;和(b)在样品中检测在第一和第二寡核苷酸引物存在下扩增的DNA序列,由此检测结核分枝杆菌感染。
18.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括(a)使所说的样品与聚合酶链反应中的第一和第二寡核苷酸引物接触,所说的第一和第二寡核苷酸引物包含选自SEQ ID No.3,11和12的DNA序列的至少约10个邻接的核苷酸;和(b)在样品中检测在第一和第二寡核苷酸引物存在下扩增的DNA序列,由此检测结核分枝杆菌感染。
19.权利要求17或18的方法,其中所说的生物样品选自全血、痰、血清、血浆、唾液、脑脊液和尿。
20.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括(a)使样品与一种或多种寡核苷酸探针接触,所说探针包含按照权利要求5的DNA分子的至少约15个邻接核苷酸;和(b)在样品中检测杂交到所说寡核苷酸探针上的DNA序列,由此检测结核分枝杆菌感染。
21.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括(a)使样品与一种或多种寡核苷酸探针接触,所说探针包含选自SEQID No.3,11和12的DNA序列的至少约15个邻接核苷酸;和(b)在样品中检测杂交到所说寡核苷酸探针上的DNA序列,由此检测结核分枝杆菌感染。
22.权利要求20或21的方法,其中所说的生物样品选自全血,痰、血清、血浆、唾液、脑脊液和尿。
23.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括(a)使所说的生物样品与能够结合到按照权利要求1-4之任一的多肽上的结合剂接触;和(b)在样品中检测结合到结合剂上的蛋白质或多肽,由此检测生物样品中的结核分枝杆菌感染。
24.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括(a)使所说的生物样品与能够结合到多肽上的结合剂接触,所说的多肽具有由SEQ ID No.129和130给出的序列的N端序列;和(b)在样品中检测结合到结合剂上的蛋白质或多肽,由此检测生物样品中的结核分枝杆菌感染。
25.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括(a)使所说的生物样品与能够结合到多肽上的结合剂接触,所说的多肽由选自下组的DNA序列编码SEQ ID No.3,11和12的序列、这些序列的补体、以及与SEQ ID No.3,11和12所示的序列杂交的DNA序列;和(b)在样品中检测结合到结合剂上的蛋白质或多肽,由此检测生物样品中的结核分枝杆菌感染。
26.权利要求23-25之任一的方法,其中所说的结合剂是单克隆抗体。
27.权利要求23-25之任一的方法,其中所说的结合剂是多克隆抗体。
28.一种诊断试剂盒,该试剂盒包含(a)一种或多种按照权利要求1-4之任一的多肽;和(b)一种检测试剂。
29.一种诊断试剂盒,该试剂盒包含(a)一种或多种具有选自由SEQ ID No.129和130给出的序列的N端序列的多肽;和(b)一种检测试剂。
30.一种诊断试剂盒,该试剂盒包含(a)一种或多种由选自下组的DNA序列SEQ ID No.3,11和12的序列、这些序列的补体、以及与SEQ ID No.3,11和12所示的序列杂交的DNA序列编码的多肽;和(b)一种检测试剂。
31.权利要求28-30之任一的试剂盒,其中所说的多肽是固定化在固相支持物上的。
32.权利要求31的试剂盒,其中所说的固相支持物包含硝化纤维素、乳胶或塑料材料。
33.权利要求28-30之任一的试剂盒,其中所说的检测试剂包含结合到结合剂上的报道基团。
34.权利要求33的试剂盒,其中所说的结合剂选自抗-免疫球蛋白、蛋白质G,蛋白质A和凝集素。
35.权利要求33的试剂盒,其中所说的报道基团选自放射性同位素、荧光基团、发光基团、酶、生物素以及染料颗粒。
36.一种诊断试剂盒,该试剂盒包含第一聚合酶链反应引物与第二聚合酶链反应引物,所说的第一和第二引物包含按照权利要求5的DNA分子的至少约10个邻接的核苷酸。
37.一种诊断试剂盒,该试剂盒包含第一聚合酶链反应引物与第二聚合酶链反应引物,所说的第一和第二引物包含选自SEQ ID No.3,11和12的DNA序列的至少约10个邻接的核苷酸。
38.一种诊断试剂盒,该试剂盒包含至少一种寡核苷酸探针,所说寡核苷酸探针包含按照权利要求5的DNA分子的至少约15个邻接核苷酸。
39.一种诊断试剂盒,该试剂盒包含至少一种寡核苷酸探针,所说寡核苷酸探针包含选自SEQ ID No.3,11和12的DNA序列的至少约15个邻接核苷酸。
40.一种单克隆抗体,该抗体结合到按照权利要求1-4之任一的多肽上。
41.一种多克隆抗体,该抗体结合到按照权利要求1-4之任一的多肽上。
42.一种融合蛋白,该融合蛋白包含按照权利要求1-4之任一的两种或多种多肽。
43.一种融合蛋白,该融合蛋白包含按照权利要求1-4之任一的一种或多种多肽以及ESAT-6(SEQ ID No.99)。
44.一种融合蛋白,该融合蛋白包含具有由SEQ ID No.129和130给出的序列的N端序列的多肽。
全文摘要
本发明公开了用于诊断结核病的化合物和方法。所提供的化合物包括多肽以及编码这些多肽的DNA,所说的多肽含有一种或多种结核分枝杆菌分泌或非分泌蛋白质的至少一种抗原性部分。含有这些多肽或DNA序列和合适的检测试剂的诊断试剂盒可以用于在患者和生物样品中检测结核分枝杆菌感染。本发明也提供了抗这些多肽的抗体。
文档编号C12N15/09GK1200146SQ96197467
公开日1998年11月25日 申请日期1996年8月30日 优先权日1995年9月1日
发明者S·G·里德, Y·A·W·斯克凯, D·C·笛勒隆, A·卡穆普斯-尼托, R·胡格藤, T·H·威德维克, D·R·特瓦德茨克 申请人:科里克萨有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1