用于免疫治疗和诊断结核病的化合物和方法

文档序号：450196阅读：912来源：国知局

专利名称：用于免疫治疗和诊断结核病的化合物和方法
技术领域：
本发明总的来说涉及检测、治疗和预防结核分枝杆菌感染的方法。更具体地说本发明涉及包含结核分枝杆菌抗原，或其部分或变体的多肽，以及这些多肽在针对结核分枝杆菌感染的诊断和免疫接种上的用途。
背景技术：
结核病是一种慢性传染病，一般由结核分枝杆菌感染引起。它在发展中国家是一种主要的疾病，在世界上发达地区也是一个日益严重的问题，每年有约8百万新病例和3百万人死亡。虽然感染可以在相当长一段时间内无症状，但是该疾病最常见地表现为急性肺炎，导致发热和非排痰性咳嗽。如果不进行治疗，则常常会出现严重的并发症并导致死亡。
虽然一般地可以采用多种抗生素控制结核病，但这样的治疗不足以阻止该疾病的传播。传染的个体可以是无症状的，但有时是传染性的。此外，虽然符合治疗方案是关键性的，但患者的行为难以监测。某些患者不完成治疗过程，这可以导致无效的治疗并产生药物抗性。
抑制结核病的传播需要有效的免疫接种和准确地早期诊断该疾病。当前，用活细菌接种是诱导保护性免疫最有效的方法。用于这一目的的最普通的分枝杆菌属是卡介苗(BCG)和牛型分枝杆菌的无毒菌株。然而，BCG的安全性和有效性上存在争议，并且一些国家(如，美国)不接种一般公众。诊断一般利用皮试进行，这牵涉到真皮内接触结核菌素PPD(纯化的蛋白质衍生物)。在注射之后48-72小时，抗原特异性T-细胞反应在注射部位导致可测量的潜伏(incubation)，这表明接触到分枝杆菌抗原。然而，这一实验的灵敏度和特异性一直存在问题，用BCG接种的个体与感染的个体不能区别。
虽然巨噬细胞已显示出作为结核分枝杆菌免疫性的主要的效应细胞，但T-细胞是这种免疫性的主要的诱导物。T-细胞在针对结核分枝杆菌感染的保护中的十分重要的作用由在爱滋病患者中结核分枝杆菌频繁发生说明，因为CD4 T-细胞的耗竭与人免疫缺损病毒(HIV)感染相关。分枝杆菌属反应性CD4 T-细胞已显示出是γ-干扰素(IFN-γ)的有力的生产者，后者依次已显示出在小鼠中触发巨噬细胞的抗分枝杆菌作用。尽管IFN-γ在人类中的作用还不太清楚，但研究已表明1，25-二羟基-维生素D3单独或与IFN-γ或肿瘤坏死因子-α一道激活人巨噬细胞以阻止结核分枝杆菌感染。此外，已知IFN-γ刺激人巨噬细胞产生1，25-二羟基-维生素D3。同样地，IL-12已显示出在刺激对结核分枝杆菌感染的抗性中起作用。有关结核分枝杆菌感染的免疫学参见Chan和Kaufmann，结核病病理，预防和治疗，Boom(编者)，ASM出版社，华盛顿，DC，1994。
因此，本领域需要用于预防、治疗和检测结核病的改进的疫苗和方法。本发明满足了这一需要并进一步提供了其它相关优点。
发明概要简言之，本发明提供了用于预防和诊断结核病的化合物和方法。在一个方面，本发明提供了一些多肽，这些多肽包含可溶性结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的免疫原性部分。在这一方面的一个实施方案中，所说的可溶性抗原具有一种以下N端序列(a)Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Cys-Asn-Tyr-Gly-Gln-Val-Val-Ala-Ala-Leu；(SEQ ID NO.120)(b)Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-Ser(SEQ ID NO.121)(c)Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-Leu-Glu-Ala-Ala-Lys-Glu-Gly-Arg；(SEQ ID NO.122)(d)Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-Pro；(SEQ ID NO.123)(e)Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val；(SEQ ID NO.124)(f)Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro；(SEQ ID NO.125)(g)Asp-Pro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Thr-Ala-Ala-Ser-Pro-Pro-Ser；(SEQ ID NO.126)(h)Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-Gly；(SEQ ID NO.127)(i)Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Leu-Thr-Ser-Leu-Leu-Asn-Ser-Leu-Ala-Asp-Pro-Asn-Val-Ser-Phe-Ala-Asn；(SEQ ID NO.128)和(j)Xaa-Asp-Ser-Glu-Lys-Ser-Ala-Thr-Ile-Lys-Val-Thr-Asp-Ala-Ser；(SEQ ID NO.134)(k)Ala-Gly-Asp-Thr-Xaa-Ile-Tyr-Ile-Val-Gly-Asn-Leu-Thr-Ala-Asp；(SEQ ID NO.135)或(1)Ala-Pro-Glu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-Ala-Gly；(SEQ ID NO.136)其中Xaa可以是任何氨基酸。
在一个相关的方面，本发明提供了一些多肽，这些多肽包含结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的免疫原性部分，所说的抗原具有一种以下的N端序列(m)Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-Ile-Asn-Val-His-Leu-Val；(SEQ ID NO.137)或(n)Asp-Pro-Pro-Asp-Pro-His-Gln-Xaa-Asp-Met-Thr-Lys-Gly-Tyr-Tyr-Pro-Gly-Gly-Arg-Arg-Xaa-Phe；(SEQ ID NO.129)，其中Xaa可以是任何氨基酸。
在另一个实施方案中，所说的抗原包含可溶性结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的免疫原性部分，其中所说的抗原包含由选自下组的DNA序列编码的氨基酸序列SEQ ID NO.1，2，4-10，13-25，52，99和101中所示的序列、这些序列的补体、以及在中等严格条件下与SEQ ID NO.1，2，4-10，13-25，52，99和101中所示的序列杂交的DNA序列或它们的补体。
在一个相关的方面，所说的多肽包含结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的免疫原性部分，其中所说的抗原包含由选自下组的DNA序列编码的氨基酸序列SEQ ID NO.26-51中所示的序列、这些序列的补体、和在中等严格条件下与SEQ ID NO.26-51中所示的序列杂交的DNA序列或它们的补体。
在一个相关的方面，本发明提供了编码上述多肽的DNA序列，包含这些DNA序列的表达载体和用这样的表达载体转化或转染的宿主细胞。
另一方面，本发明提供了包含第一与第二发明多肽或者是发明多肽与已知的结核分枝杆菌抗原的融合蛋白。
在其它方面，本发明提供了药物组合物，这些组合物包含一种或多种上述多肽或者编码这些多肽的DNA分子与生理学上可接受的载体。本发明也提供了包含一种或多种以上描述的多肽和非特异性免疫反应增强剂(enhancer)的疫苗，以及包含一种或多种编码这些多肽的DNA序列和非特异性免疫反应增强剂的疫苗。
在另一方面，本发明提供了在患者中诱导保护性免疫的方法，该方法包括向患者施用有效量的一种或多种上述多肽。
在本发明的另一方面，本发明提供了用于在患者中检测结核病的方法和诊断试剂盒。所说的方法包括使患者的皮肤细胞与一种或多种以上的多肽接触，并检测在病人皮肤上的免疫反应。所说的诊断试剂盒包含一种或多种以上的多肽以及足以把所说的多肽与患者皮肤细胞接触的装置。
参照下列详细描述和附图，本发明的这些和其他方面会很清楚。本文所公开的所有参考文献与它们单个并入作为参考一样，以它们的整体由本文一并参考。
附图和序列识别号的简要描述

图1A和B说明实施例1中描述的14Kd、20Kd和26Kd抗原对分别来源于第一和第二结核分枝杆菌免疫供体的T-细胞的增殖和干扰素-γ产生的刺激作用。
图2说明两种代表性多肽TbRa3和TbRa9对来源于结核分枝杆菌免疫个体的T-细胞的增殖和干状素-γ产生的刺激作用。
SEQ ID NO.1是TbRa1的DNA序列。SEQ ID NO.2是TbRa10的DNA序列。SEQ ID NO.3是TbRa11的DNA序列。SEQ ID NO.4是TbRa12的DNA序列。SEQ ID NO.5是TbRa13的DNA序列。SEQ ID NO.6是TbRa16的DNA序列。SEQ ID NO.7是TbRa17的DNA序列。SEQ ID NO.8是TbRa18的DNA序列。SEQ ID NO.9是TbRa19的DNA序列。SEQ ID NO.10是TbRa24的DNA序列。SEQ ID NO.11是TbRa26的DNA序列。SEQ ID NO.12是TbRa28的DNA序列。SEQ ID NO.13是TbRa29的DNA序列。SEQ ID NO.14是TbRa2A的DNA序列。SEQ ID NO.15是TbRa3的DNA序列。SEQ ID NO.16是TbRa32的DNA序列。SEQ ID NO.17是TbRa35的DNA序列。SEQ ID NO.18是TbRa36的DNA序列。SEQ ID NO.19是TbRa4的DNA序列。SEQ ID NO.20是TbRa9的DNA序列。SEQ ID NO.21是TbRaB的DNA序列。SEQ ID NO.22是TbRaC的DNA序列。SEQ ID NO.23是TbRaD的DNA序列。SEQ ID NO.24是YYWCPG的DNA序列。SEQ ID NO.25是AAMK的DNA序列。SEQ ID NO.26是TbL-23的DNA序列。SEQ ID NO.27是TbL-24的DNA序列。SEQ ID NO.28是TbL-25的DNA序列。SEQ ID NO.29是TbL-28的DNA序列。SEQ ID NO.30是TbL-29的DNA序列。SEQ ID NO.31是TbH-5的DNA序列。SEQ ID NO.32是TbH-8的DNA序列。SEQ ID NO.33是TbH-9的DNA序列。SEQ ID NO.34是TbM-1的DNA序列。SEQ ID NO.35是TbM-3的DNA序列。SEQ ID NO.36是TbM-6的DNA序列。SEQ ID NO.37是TbM-7的DNA序列。SEQ nD No.38是TbM-9的DNA序列。SEQ ID NO.39是TbM-12的DNA序列。SEQ ID NO.40是TbM-13的DNA序列。SEQ ID NO.41是TbM-14的DNA序列。SEQ ID NO.42是TbM-15的DNA序列。SEQ ID NO.43是TbH-4的DNA序列。SEQ ID NO.44是TbH-4-FWD的DNA序列。SEQ ID NO.45是TbH-12的DNA序列。SEQ ID NO.46是Tb38-1的DNA序列。SEQ ID NO.47是Tb38-4的DNA序列。SEQ ID NO.48是TbL-17的DNA序列。SEQ ID NO.49是TbL-20的DNA序列。SEQ ID NO.50是TbL-21的DNA序列。SEQ ID NO.51是TbH-16的DNA序列。SEQ ID NO.52是DPEP的DNA序列。SEQ ID NO.53是DPEP的推定的氨基酸序列。SEQ ID NO.54是DPV N-端抗原的蛋白质序列。SEQ ID NO.55是AVGS N-端抗原的蛋白质序列。SEQ ID NO.56是AAMK N-端抗原的蛋白质序列。SEQ ID NO.57是YYWC N-端抗原的蛋白质序列。SEQ ID NO.58是DIGS N-端抗原的蛋白质序列。SEQ ID NO.59是AEES N-端抗原的蛋白质序列。SEQ ID NO.60是DPEP N-端抗原的蛋白质序列。SEQ ID NO.61是APKT N-端抗原的蛋白质序列。SEQ ID NO.62是DPAS N-端抗原的蛋白质序列。SEQ ID NO.63是TbRa1的推定的氨基酸序列。SEQ ID NO.64是TbRa10的推定的氨基酸序列。SEQ ID NO.65是TbRa11的推定的氨基酸序列。SEQ ID NO.66是TbRa12的推定的氨基酸序列。SPQ ID NO.67是TbRa13的推定的氨基酸序列。SEQ iD NO.68是TbRa16的推定的氨基酸序列。SEQ ID NO.79是TbRa17的推定的氨基酸序列。SEQ ID NO.70是TbRa18的推定的氨基酸序列。SEQ ID NO.71是TbRa19的推定的氨基酸序列。SEQ ID NO.72是TbRa24的推定的氨基酸序列。SEQ ID NO.73是TbRa26的推定的氨基酸序列。SEQ ID NO.74是TbRa28的推定的氨基酸序列。SEQ ID NO.75是TbRa29的推定的氨基酸序列。SEQ ID NO.76是TbRa2A的推定的氨基酸序列。SEQ ID NO.77是TbRa3的推定的氨基酸序列。SEQ ID NO.78是TbRa32的推定的氨基酸序列。SEQ ID NO.79是TbRa35的推定的氨基酸序列。SEQ ID NO.80是TbRa36的推定的氨基酸序列。SEQ ID NO.81是TbRa4的推定的氨基酸序列。SEQ ID NO.82是TbRa9的推定的氨基酸序列。SEQ ID NO.83是TbRaB的推定的氨基酸序列。SEQ ID NO.84是TbRaC的推定的氨基酸序列。SEQ ID NO.85是TbRaD的推定的氨基酸序列。SEQ ID NO.86是YYWCPG的推定的氨基酸序列。SEQ ID NO.87是TbAAMK的推定的氨基酸序列。SEQ ID NO.88是Tb38-1的推定的氨基酸序列。SEQ ID NO.89是TbH-4的推定的氨基酸序列。SEQ ID NO.90是TbH-8的推定的氨基酸序列。SEQ ID NO.91是TbH-9的推定的氨基酸序列。SEQ ID NO.92是TbH-12的推定的氨基酸序列。SEQ ID NO.93是Tb38-1肽1的氨基酸序列。SEQ ID NO.94是Tb38-1肽2的氨基酸序列。SEQ ID NO.95是Tb38-1肽3的氨基酸序列。SEQ ID NO.96是Tb38-1肽4的氨基酸序列。SEQ ID NO.97是Tb38-1肽5的氨基酸序列。SEQ ID NO.98是Tb38-1肽6的氨基酸序列。SEQ ID NO.99是DPAS的DNA序列。SEQ ID NO.100是DPAS的推定的氨基酸序列。SEQ ID NO.101是DPV的DNA序列。SEQ ID NO.102是DPV的推定的氨基酸序列。SEQ ID NO.103是ESAT-6的DNA序列。SEQ ID NO.104是ESAT-6的推定的氨基酸序列。SEQ ID NO.105是TbH-8-2的DNA序列。SEQ ID NO.106是TbH-9FL的DNA序列。SEQ ID NO.107是TbH-9FL的推定的氨基酸序列。SEQ ID NO.108是TbH-9-1的DNA序列。SEQ ID NO.109是TbH-9-1的推定的氨基酸序列。SEQ ID NO.110是TbH-9-4的DNA序列。SEQ ID NO.111是TbH-9-4的推定的氨基酸序列。SEQ ID NO.112是Tb38-1F2 IN的DNA序列。SEQ ID NO.113是Tb38-1F2 RP的DNA序列。SEQ ID NO.114是Tb37-FL的推定的氨基酸序列。SEQ ID NO.115是Tb38-IN的推定的氨基酸序列。SEQ ID NO.116是Tb38-1F3的DNA序列。SEQ ID NO.117是Tb38-1F3的推定的氨基酸序列。SEQ ID NO.118是Tb38-1F5的DNA序列。SEQ ID NO.119是Tb38-1F6的DNA序列。SEQ ID NO.120是DPV的推定的N-端氨基酸序列。SEQ ID NO.121是AVGS的推定的N-端氨基酸序列。
SEQ ID NO.122是AAMK的推定的N-端氨基酸序列。
SEQ ID NO.123是YYWC的推定的N-端氨基酸序列。
SEQ ID NO.124是DIGS的推定的N-端氨基酸序列。
SEQ ID NO.125是AAES的推定的N-端氨基酸序列。
SEQ ID NO.126是DPEP的推定的N-端氨基酸序列。
SEQ ID NO.127是APKT的推定的N-端氨基酸序列。
SEQ ID NO.128是DPAS的推定的N-端氨基酸序列。
SEQ ID NO.129是DPPD N-端抗原的蛋白质序列。
SEQ ID NO.130-133是四种DPPD溴化氰片段的蛋白质序列。
SEQ ID NO.134是XDS抗原的N-端蛋白质序列。
SEQ ID NO.135是AGD抗原的N-端蛋白质序列。
SEQ ID NO.136是APE抗原的N-端蛋白质序列。
SEQ ID NO.137是XYI抗原的N-端蛋白质序列。发明详述如上所述，本发明总的来说涉及预防、治疗和诊断结核病的组合物和方法。本发明的组合物包含一些多肽，这些多肽包含结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的至少一种免疫原性部分。在本发明的范围内的多肽包括，但不限于，可溶性结核分枝杆菌抗原。″可溶性结核分枝杆菌抗原″是存在于结核分枝杆菌培养物滤液中的结核分枝杆菌源的蛋白质。如本文所使用的，术语″多肽″包括任何长度的氨基酸链，包括全长蛋白质(即，抗原)，其中的氨基酸残基由共价肽键连接。这样，包含上述一种抗原的免疫原性部分的多肽可以是完全由免疫原性部分组成的，或者可以含有附加序列。所说的附加序列可以是来源于天然结核分枝杆菌抗原或者可以是异源的，这样的序列可以是(但不需要是)免疫原性的。
本文使用的″免疫原性″指在患者(例如人)和/或生物样品中激发免疫反应(例如，细胞免疫)的能力。具体地说，免疫原性的抗原(或这种抗原的免疫原性部分或其它变体)能够在生物样品中刺激细胞增殖、白介素-12产生和/或γ-干扰素产生，所说的生物样品包含一种或多种选自T-细胞、NK细胞、B细胞和巨噬细胞的细胞，这些细胞来源于结核分枝杆菌感染个体。包含一种或多种结核分枝杆菌抗原的至少一种免疫原性部分的多肽一般来说可以用于在患者中检测结核病和诱导针对结核病的保护性免疫。
本发明的组合物与方法也包括上述多肽的变体。如本文所使用的″变体″是仅在保守取代和/或修饰上不同于天然抗原(以便所述多肽诱导免疫反应的能力得到保留)的多肽。通过采用本文描述的代表性方法修饰一种上述多肽序列并评价修饰的多肽的免疫原性特性可以一般性地鉴别这样的变体。
″保守取代″是这样一种取代，其中一种氨基酸取代具有类似性质的另一种氨基酸，以便肽化学领域的技术人员可以期望多肽的二级结构与亲水性质实质上不变。一般来说，下组氨基酸代表保守取代(1)ala、pro、gly、glu、asp、gln、asn、ser、thr；(2)cys、ser、tyr、thr；(3)val、ile、leu、met、ala、phe；(4)lys、arg、his；和(5)phe、tyr、trp、his。
变体也可以(或选择性地)是由例如氨基酸缺失或者添加(对多肽免疫原性性质，二级结构和亲水性质具有最小限度的影响)修饰的。例如，多肽可以连接到蛋白质N端的信号(或前导)序列上，后者共翻译或翻译后指导蛋白质的转移。所述多肽也可以连结到使多肽容易合成，纯化以及鉴定或增强多肽结合到固相支持体上的接头和其他序列(例如poly-His)上。例如，多肽可以连结到免疫球蛋白Fc区上。
在一个相关的方面，本文公开了组合多肽。″组合多肽″是包含至少一种上述免疫原性部分和一种或多种附加免疫原性结核分枝杆菌序列(其经由肽键连接到单一的氨基酸链上)的多肽。所述的序列可以直接连接(即没有间插氨基酸)或通过不明显降低组成多肽的免疫原性特性的接头序列(例如，Gly-Cys-Gly)连接。
一般来说，结核分枝杆菌抗原，编码这种抗原的DNA序列，可以以多种方法的任何一种制备。例如，可溶性抗原可以用本领域技术人员已知的方法从结核分枝杆菌培养物滤液分离，包括阴离子交换、反相层析。可以采用例如本文描述的代表性方法就激发免疫反应(例如细胞免疫反应)评价纯化的抗原。可以利用例如传统的Edman化学之类的技术对免疫原性抗原进行部分测序。参见Edman和Berg，欧洲生物化学杂志，80116-132，1967。
也可以用编码抗原的DNA序列(已插入到表达载体中并在合适的宿主中表达)重组产生免疫原性抗原。可以通过用特异性抗可溶性结核分枝杆菌抗原产生的抗血清(例如兔)筛选合适的结核分枝杆菌表达文库来分离编码可溶性抗原的DNA分子。可以用从感染了结核分枝杆菌的病人获得的血清筛选合适的结核分枝杆菌基因组或者cDNA表达文库鉴别编码抗原(抗原可以是或者可以不是可溶性的)的DNA序列。这样的筛选一般可以利用本领域技术人员熟知的技术完成，例如在Sambrook等，分子克隆实验室手册，冷泉港实验室，冷泉港，NY，1989中所描述的那些。
编码可溶性抗原的DNA序列也可以通过就与简并寡核苷酸(该寡核苷酸来源于分离的可溶性抗原的部分氨基酸序列)杂交的DNA序列筛选适当的结核分枝杆菌cDNA或基因组DNA文库来获得。可以如(例如)Sambrook等，分子克隆实验室手册，冷泉港实验室，冷泉港，NY(和该文引用的参考文献)中的描述设计和合成用于这种筛选的简并寡核苷酸序列，并且完成筛选。也可以使用聚合酶链反应(PCR)，用本领域已知的方法用上述寡核苷酸，以从cDNA或基因组文库分离核酸探针。然后可以使用所分离的探针完成文库的筛选。
此外，可以直接采用外周血单核细胞(PBMCs)或T-细胞系或来源于结核分枝杆菌免疫个体的克隆筛选来源于结核分枝杆菌的基因组或cDNA文库。一般来说，用于这种筛选的PBMCs和/或T-细胞可以如以下的描述制备。直接文库筛选一般可以这样进行，即测定表达的重组蛋白质库在来源于结核分枝杆菌免疫个体T-细胞中诱导增殖和/或干扰素-γ产生的能力。此外，如下所述，可以基于抗体反应性首先选择潜在的T-细胞抗原。
不论是什么制备方法，本文描述的抗原(和其免疫原性部分)(其可以是也可以不是可溶性的)具有诱导免疫原性反应的能力。更具体地说，所说的抗原具有在来源于结核分枝杆菌免疫个体T-细胞、NK细胞，B细胞和/或巨噬细胞中诱导增殖和/或细胞因子产生(即干扰素-γ和/或白介素-12产生)的能力。当然，用于评价对抗原的免疫原性反应的细胞类型的选择取决于所需的反应。例如，利用包含B细胞和/或巨噬细胞的制剂最容易评价白介素-12的产生。结核分枝杆菌免疫个体被认为是这样的个体，其被认为借助于发动对结核分枝杆菌的有效的T-细胞反应对结核病的发生具有抗性(即基本上没有疾病症状)。这样的个体可以基于强阳性(即大于约10mM直径硬结)结核病蛋白质(PPD)真皮内皮肤试验反应和缺乏结核病的任何征兆或症状来鉴别。来源于结核分枝杆菌免疫个体的T-细胞、NK细胞、B细胞和巨噬细胞可以用本领域普通技术人员已知的方法制备。例如，PBMCs(即，外周血单核细胞)制剂不需进一步分离组分细胞就可以使用。PBMCs一般可以采用例如通过FicollTM(Winthrop实验室，NY)的密度离心制备。用于本文描述的测定中的T-细胞也可以直接从PBMCs纯化。此外，可以使用抗分枝杆菌蛋白质反应性的富T-细胞系或者对单个分枝杆菌蛋白质反应性的T-细胞克隆。这样的T-细胞克隆可以通过，例如，将来源于结核分枝杆菌免疫个体的PBMCs与分枝杆菌蛋白质一起温育2-4周生成。这使得可以仅仅扩增分枝杆菌蛋白质-特异性T-细胞，导致产生由这样的细胞单独组成的系。然后，采用本领域普通技术人员已知的方法，这些细胞可被克隆和用个体蛋白质试验，以更精确地限定个体T-细胞特异性。一般来说，这样一些抗原被认为是免疫原性的，其在采用来源于结核分枝杆菌免疫个体的T-细胞、NK细胞，B细胞和/或巨噬细胞进行的增殖和/或细胞因子产生(即干扰素-γ和/或白介素-12的产生)测定中试验为阳性。这样的测定可以采用例如以下所描述的代表性方法完成。这些抗原的免疫原性部分可以用类似的测定来鉴别，并且可以存在于本文所描述的多肽内。
多肽(例如，免疫原性抗原，或其部分或其它变体)诱导细胞增殖的能力通过使细胞(例如，T-细胞和/或NK细胞)与所说的多肽接触并测定所说细胞的增殖评价。一般来说，足以评价约105个细胞的多肽的量在约10ng/mL到约100μg/mL的范围内，优选地是约10μg/mL。多肽与细胞的温育典型地在37℃下进行约六天。在与多肽一起温育后，就增殖性反应测定细胞，这可以通过本领域普通技术人员已知的方法来评价，例如将细胞露置在放射性标记胸苷的脉冲下，并测定标记对细胞DNA的掺入。一般来说，导致产生在基底(即，对没有多肽时培养的细胞所观察到的增殖)之上的增殖至少增加3倍的多肽被认为能够诱导增殖。
多肽刺激细胞中干扰素-γ和/或白介素-12产生的能力可以通过使细胞与所说的多肽接触并测量由细胞产生的干扰素-γ或白介素-12的水平来评价。一般来说，足以评价约105个细胞的多肽的量在约10ng/mL到约100μg/mL的范围内，优选地是约10μg/mL。多肽可以(但是不必)固定化在固相支持体上，如小珠或可被生物降解的微球体，如在美国专利4,897,268和5,075,109中所描述的那些。多肽与细胞的温育典型地在37℃下进行约六天。在与多肽一起温育后，就干扰素-γ和/或白介素-12(或者它们的一个或多个亚单位)测定细胞，这可以通过本领域普通技术人员已知的方法来评价，例如酶联免疫吸附测定(ELISA)或者在IL-12 P70亚单位的情况下的生物测定(例如测量T-细胞增殖的测定)。一般来说，导致产生每mL培养上清液(每mL包含104-105个T-细胞)至少50pg干扰素-γ的多肽被认为能够刺激干扰素-γ的产生。刺激每105个巨噬细胞或B细胞(或每3×105个PBMC)产生10pg/mL IL-12 P70亚单位和/或至少100pg/mL IL-12 P40亚单位的多肽被认为能够刺激IL-12的产生。
一般来说，免疫原性抗原是这样一些抗原，其刺激来源于至少约25％的结核分枝杆菌免疫个体的T-细胞、NK细胞、B细胞和/或巨噬细胞的增殖和/或细胞因子产生(即，干扰素-γ和/或白介素-12产生)。在这些免疫原性抗原中，具有较好治疗性质的多肽可以基于在上述测定中的反应程度和基于观察到其反应的个体的百分比来辨别。此外，基于较好治疗性质的抗原将不在体外刺激来源于约25％以上的非结核分枝杆菌免疫个体的细胞的增殖和/或细胞因子产生，从而消除非特异性(由于结核分枝杆菌-反应性细胞)的反应。在高百分比的来源于结核分枝杆菌免疫个体的T-细胞、NK细胞、B细胞和/或巨噬细胞制剂中诱导反应的那些抗原(其它个体的细胞制剂中具有低的发生率)具有较好的治疗性质。
具有较好治疗性质的抗原也可以基于它们(当作为疫苗施用时)在实验动物中降低结核分枝杆菌感染的严重程度的能力来鉴别。用于实验动物上的合适的疫苗制剂在以下详细描述。效能可以基于实验感染后抗原提供至少约50％的细菌数降低和/或至少约40％的死亡率降低的能力来确定。合适的实验动物包括小鼠、豚鼠和灵长类。
具有较好诊断性质的抗原一般可以基于在具有活动性结核病之个体上进行的真皮内皮肤试验中，而不是在未被结核分枝杆菌感染之个体上进行的试验中激发反应的能力来鉴别。皮肤试验一般也可以按以下进行，至少5mm的硬结反应被认为是阳性的。
也可以采用本领域已知的技术(例如在Paul，基础免疫学，第三版，Raven出版社，1993，pp.243-247和该文引用的参考文献中描述的那些技术)制备和鉴别本文描述的抗原的免疫原性部分。这样的技术包括就免疫原性特性筛选天然抗原的多肽部分。一般可以将本文所描述的代表性增殖和细胞因子产生测定用于这些筛选。多肽的免疫原性部分是这样的部分，其在这样的代表性测定中产生实质上类似由全长抗原产生的免疫反应(例如，增殖、干扰素-γ产生和/或白介素-12产生)。换句话说，在本文描述的模式增殖测定中，抗原的免疫原性部分产生至少约20％，优选地约100％的由全长抗原所诱导的增殖。在本文描述的模式测定中，免疫原性部分也可以或者可替性地刺激至少约20％，优选地约100％的由全长抗原所诱导的干扰素-γ和/或白介素-12产生。
结核分枝杆菌抗原的部分和其它变体可以用合成或者重组方法产生。利用本领域普通技术人员已知的技术，可以产生具有少于约100个氨基酸，一般少于约50个氨基酸的合成多肽。例如，这些多肽可以用任何通过商业途径可获得的固相技术合成，如Merrifield固相合成法，其中氨基酸依次添加到增长的氨基酸链上。参见Merrifield，美国化学会杂志，82149-2146，1963。用于多肽的自动合成的设备是可通过商业途径从供应商(如应用生物系统公司，Foster City，CA)获得的，并且可以按照制造厂商的说明操作。一般可以用标准的诱变技术(如寡核苷酸定点特异性诱变)制备天然抗原的变体。也可以用标准的技术除去DNA序列的片段，以便可以制各截短的多肽。
采用本领域技术人员熟知的各种技术，可以容易地从编码多肽的DNA序列制备包含天然抗原部分和/或变体的重组多肽。例如，将重组蛋白质分泌到培养基中合适的宿主/载体系统的上清液可以首先采用市售的滤器浓缩。在浓缩之后，可以将浓缩液用于合适的纯化基质(如亲和性基质或离子交换树脂)上。最后，可以使用一个或多个反相HPLC步骤，以进一步纯化重组蛋白质。
本领域普通技术人员已知的各种表达载体的任何一种都可以用于表达本文所描述的重组多肽。表达可以在任何合适的宿主细胞中进行，所述的宿主细胞已用含有编码重组多肽的DNA分子的表达载体转化或转染过。合适的宿主细胞包括原核生物，酵母和高级真核细胞。优选地，使用的宿主细胞是大肠杆菌，酵母或哺乳动物细胞系，如COS或CHO。以这一方式表达的DNA序列可以编码天然存在的抗原，天然存在的抗原的部分，或者其其它变体。
一般来说，不论采用哪一种制备方法，本文所公开的多肽实质上以纯化的形式得以制备。优选地，所述多肽的纯度为至少大约80％，更优选地至少大约90％，最优选地至少大约99％。在以下详细描述的某些优选的实施方案中，将基本上纯化的多肽掺入到药物组合物中或者疫苗中，以用于一种或多种本文公开的方法中。
在某些特定的实施方案中，主题发明公开了一些多肽，这些多肽包含可溶性结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的其变体的至少一种免疫原性部分，所说的抗原具有一种以下的N端序列(a)Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Cys-Asn-Tyr-Gly-Gln-Val-Val-Ala-Ala-Leu；(SEQ ID NO.120)(b)Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-Ser(SEQ ID NO.121)(c)Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-Leu-Glu-Ala-Ala-Lys-Glu-Gly-Arg；(SEQ ID NO.122)(d)Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-Pro；(SEQ ID NO.123)(e)Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val；(SEQ ID NO.124)(f)Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro；(SEQ ID NO.125)(g)AspPro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Thr-Ala-Ala-Ser-Pro-Pro-Ser；(SEQ ID NO.126)(h)Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-Gly；(SEQ ID NO.127)(i)Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Leu-Thr-Ser-Leu-Leu-Asn-Ser-Leu-Ala-Asp-Pro-Asn-Val-Ser-Phe-Ala-Asn；(SEQ ID NO.128)和(j)Xaa-Asp-Ser-Glu-Lys-Ser-Ala-Thr-Ile-Lys-Val-Thr-Asp-Ala-Ser；(SEQ ID NO.134)(k)Ala-Gly-Asp-Thr-Xaa-Ile-Tyr-Ile-Val-Gly-Asn-Leu-Thr-Ala-Asp；(SEQ ID NO.135)或(l)Ala-Pro-Glu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-Ala-Gly；(SEQ ID NO.136)其中Xaa可以是任何氨基酸，优选地是半胱氨酸残基。编码以上标记有(g)的抗原的DNA序列在SEQ ID NO.52中给出，由SEQ ID NO.52编码的多肽在SEQ ID NO.53中给出。编码以上标记有(a)的抗原的DNA序列在SEQ IDNO.101中给出，其推定的氨基酸序列在SEQ ID NO.102中给出。相应于以上抗原(d)的DNA序列在SEQ ID NO.24中给出，相应于以上抗原(c)的DNA序列在SEQ ID NO.25中给出，相应于以上抗原(I)的DNA序列在SEQ IDNO.99中给出，其推定的氨基酸序列在SEQ ID NO.100中给出。
在另一个特定的实施方案中，主题发明公开了一些多肽，这些多肽包含具有一种以下的N端序列的结核分枝杆菌抗原，或仅在保守取代和/或修饰上不同的该抗原的变体的至少一种免疫原性部分(m)Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-Ile-Asn-Val-His-Leu-Val；(SEQ ID NO.137)或(n)Asp-Pro-Pro-Asp-Pro-His-Gln-Xaa-Asp-Met-Thr-Lys-Gly-Tyr-Tyr-Pro-Gly-Gly-Arg-Arg-Xaa-Phe；(SEQ ID NO.129)，其中Xaa可以是任何氨基酸，优选地是半胱氨酸残基。
在其它特定的实施方案中，主题发明公开了一些多肽，这些多肽包含可溶性的结核分枝杆菌抗原(或这种抗原的变体)的至少一种免疫原性部分，所述抗原(或其变体)包含由以下序列编码的一种或多种氨基酸序列(a)SEQ ID NO.1，2，4-10，13-25和52的DNA序列，(b)这些DNA序列的补体，或(c)实质上同源于(a)或(b)中的序列的DNA序列。
在其他特定的实施方案中，主题发明公开了一些多肽，这些多肽包含结核分枝杆菌抗原(或这种抗原的变体)的至少一种免疫原性部分，所述抗原(或其变体)可以是也可以不是可溶性的，其包含由以下序列编码的一种或多种氨基酸序列(a)SEQ ID NO.26-51的DNA序列，(b)这些DNA序列的补体，或(c)实质上同源于(a)或(b)中的序列的DNA序列。
在以上讨论的特定的实施方案中，结核分枝杆菌抗原包括由实质上同源于本文特别提出的一种或多种DNA序列的DNA序列编码的变体。本文使用的实质上的同源性指在中等严格条件下能够杂交的DNA序列。合适的中等严格条件包括在5X SSC，0.5％SDS，1.0 mM EDTA(pH 8.0)溶液中预洗涤；在50℃-65℃，5X SSC下杂交一夜，或者在杂交物种同源的情况下在45℃，5X SSC下杂交；接着在65℃下洗涤两次，每次以包含0.1％SDS的2X，0.5X和0.2X SSC洗涤20分钟。这样的杂交DNA序列也在本发明的范围内，由于密码简并，编码由杂交DNA序列编码的免疫原性多肽的核苷酸序列也是如此。
在一个相关的方面，本发明提供了一些融合蛋白以及这些融合蛋白的变体，所说的融合蛋白包含第一与第二发明多肽或者是本发明多肽与已知的结核分枝杆菌抗原的融合蛋白，所述抗原如以上描述的38kD抗原或ESAT-6(SEQ ID NO.98和99)。本发明的融合蛋白也可以包含在所说的第一和第二多肽之间的接头肽。
利用已知的DNA重组技术将分离的编码第一和第二多肽的DNA序列装配到适当的表达载体中，由此来构建编码本发明的融合蛋白的DNA序列。将具有或不具有肽接头的编码第一多肽的DNA序列的3′末端连接到编码第二多肽的DNA序列的5′末端，以便这些序列的读框处于可以使两种DNA序列的mRNA翻译成保持第一和第二多肽两者的生物学活性的单一融合蛋白的状态。
肽接头序列可以用于通过足以保证各多肽折叠成其二级和四级结构的距离分离第一和第二多肽。采用本领域熟知的标准技术将这样一种肽接头序列掺入到融合蛋白中。可以基于下列因素选择合适的肽接头序列(1)它们采取柔性延伸构象的能力；(2)它们不采取二级结构(其可以与第一和第二多肽上的功能性表位相互作用)的能力；和(3)可以与多肽的功能性表位进行反应的疏水或带电残基的缺乏。优选的肽接头序列包括Gly、Asn和Ser残基。其它接近中性的氨基酸，如Thr和Ala也可以用于接头序列。可以有利地用作接头序列的氨基酸序列包括在Maratea等，基因，4039-46，1985；Murphy等，美国科学院学报，838258-8562，1986；美国专利4,935,233和美国专利4,751,180中公开的那些。所说的接头序列长度可以从1到约50个氨基酸。当第一和第二多肽具有可以用来分离功能域和阻止空间位阻的非必需N端氨基酸区时，肽接头序列是不需要的。
将连接的DNA序列可操作地连接到合适的转录或翻译调节元件上。在DNA的表达中起作用的调节元件仅被定位在编码第一多肽的DNA序列的5′。同样地，结束翻译所需的终止密码子和转录终止信号仅存在于编码第二多肽的DNA序列的3′。
另一方面，本发明提供了利用一种或多种以上的多肽或融合蛋白(或者编码这些多肽的DNA分子)在患者中诱导针对结核病的保护性免疫的方法。如本文所使用的，″患者″指任何温血动物，优选地是人。患者可以是有疾病痛苦的，或者可以是无可检测的疾病和/或感染的。换句话说，保护性免疫可被诱导来预防或治疗结核病。
在这一方面，所说的多肽、融合蛋白或DNA分子一般地存在于药物组合物和/或疫苗内。药物组合物可以包含一种或多种多肽，每种多肽可以含有一种或多种以上的序列(或其变体)以及生理学上可接受的载体。疫苗可以包含一种或多种以上的多肽和一种非特异性免疫反应增强剂，如佐剂或者脂质体(多肽掺入其中)。这样的药物组合物和疫苗也可以含有其它结核分枝杆菌抗原(掺入组合的多肽中或者存在于独立的多肽内)。
此外，疫苗可以含有编码一种或多种以上描述的多肽的DNA序列，以便多肽在原位产生。在这样的疫苗中，所说的DNA可以存在于任何本领域普通技术人员已知的各种送递系统内，包括核酸表达系统，细菌和病毒的表达系统。合适的核酸表达系统含有在患者中表达所必需的DNA序列(例如合适的启动子和终止信号)。细菌送递系统涉及施用在其细胞表面上表达多肽的免疫原性部分的细菌(如Bacillus-Calmette-Guerrin)。在一个优选的实施方案中，可以利用病毒表达系统(例如，疫苗或其它痘病毒，逆转录病毒，或腺病毒)引入所说的DNA，这可以包括利用非致病的(缺损的)复制感受态病毒。将DNA掺入到这样的表达系统中的技术是本领域普通技术人员已知的。DNA也可以是″裸″的，如在Ulmer等，科学2591745-1749，1993中描述的和在Cohen，科学2591691-1692，1993中所综述的。裸DNA的摄取可以通过把DNA涂布在可被生物降解的小珠(其被有效地运输至细胞中)上来增加。
在相关的方面，以上描述的DNA疫苗可以与本发明的多肽和已知的结核分枝杆菌抗原(如以上描述的38kD抗原)同时施用或依次施用。例如，编码本发明的多肽的DNA(以上描述的″裸″的或送递系统中的)的施用可以在施用抗原之后进行，以便提高疫苗的保护性免疫作用。
施用的路线和频率以及剂量将随不同的个体变化，并且可以相似于当前所使用的利用BCG的免疫的那些。一般来说，所说的药物组合物和疫苗可以由注射(例如，皮内，肌内，静脉内或皮下)，鼻内(例如，吸入)或口头施用。1到3剂可以施用1-36周期限。优选地，施用3剂，间隔为3-4个月，此后，可以周期性地给予加强免疫接种。可替的方案对个体患者可能是合适的。合适的剂量是，当如上所述施用时，能够在免疫过的患者中产生免疫反应，在至少1-2年内保护患者不受结核分枝杆菌感染的多肽或DNA的量。一般来说，在药剂中存在的多肽的量(或者由药剂中DNA原位产生的量)在每kg宿主约1pg到约100mg的范围内，典型地在约10pg到约1mg的范围内，优选地在约100pg至约1μg的范围内。合适的剂量将随患者的情况而变化，但典型地在约0.1mL到约5mL之间。
虽然本领域普通技术人员已知的任何合适的载体都可以用于本发明的药物组合物中，但载体的类型将随施用方式变化。对于肠胃外施用(如皮下注射)，载体优选地包括水，盐水，醇，脂肪，蜡或缓冲液。对于口服施用，可以使用任何上述载体或固相载体，如甘露糖醇，乳糖，淀粉，硬脂酸镁，糖精钠，滑石，纤维素，葡萄糖，蔗糖，和碳酸镁。可被生物降解的微球体(例如polylactic galactide)也可以用作本发明的药物组合物的载体。合适的可被生物降解的微球体在例如美国专利4,897,268和5,075,109中公开。
各种佐剂中的任何一种都可以用于本发明的疫苗中，以非特异性地增强免疫反应。大多数佐剂含有用来保护抗原使之免受迅速分解代谢的物质(如氢氧化铝或矿物油)和免疫反应的非特异性刺激物(如脂质A，Bortadellapertussis或结核分枝杆菌)。合适的佐剂是市售的，例如，弗氏不完全佐剂和弗氏完全佐剂(Difco实验室)和Merck佐剂65(Merck and Company，Inc.，Rahway，NJ.)。其它合适的佐剂包括明矾，可被生物降解的微球体，单磷酰脂A和quil A。
在另一方面，本发明提供了利用一种或多种以上描述的多肽采用皮试诊断结核病的方法。如本文所使用的，″皮试″是直接在患者上进行的任何试验，其中，在真皮内注射一种或多种以上描述的多肽后，测定迟发型超敏反应(DTH)(例如膨胀，变红或皮炎)。这样的注射可以用任何足以使多肽与患者皮肤细胞接触的合适装置完成，如结核菌素注射器或1mL注射器。优选地，在注射之后至少48小时，更优选地在48-72小时后测定反应。
DTH反应是细胞介导的免疫反应，其在以前已接触过试验抗原(即，所使用多肽或其变体的免疫原性部分)的患者中较强。采用标尺可视觉测量该反应。一般来说，直径大于约0.5cm，优选地大于约1.0cm的反应是阳性反应，指示结核病感染，其可以也可以不表明活动性疾病。
就用于皮试而言，本发明的多肽优选地配制成含有多肽和以上描述的生理学上可接受的载体的药物组合物。这样的组合物典型地含有一种或多种以上的多肽。其含量在每0.1mL体积约1μg到约100μg，优选地约10μg到约50μg的范围内。优选地，用于这样的药物组合物中的载体是具有适当的防腐剂(如苯酚和/或吐温80TM)的盐水溶液。
在一个优选的实施方案中，用于皮试的多肽是具有足够大小的，以便其在反应期间保持在注射部位。一般来说，至少9个氨基酸的多肽在长度上是足够的。优选地是所述多肽在几小时内被巨噬细胞裂解，以使得可以传递至T-细胞。这样的多肽可以含有一种或多种上述序列和/或其它免疫原性或非免疫原性序列的重复序列。
以说明性的方式但不以限制性的方式给出下列实施例。实施例实施例1来源于结核分枝杆菌培养物滤液的多肽的纯化和特征确定这一例子说明从培养物滤液制备结核分枝杆菌可溶性多肽的方法。除非有其它方式注明，下列例子的所有百分比都是重量/体积百分比。
于37℃在无菌GAS培养基中培养结核分枝杆菌(H37Ra，ATCCNo.25177或H37Rv，ATCC No.25618)14天。然后经0.45μ滤器将培养基真空过滤(留下大批细胞)到无菌的2.5L瓶中。接着经0.2μ滤器将培养基过滤到无菌的4L瓶中。向培养物滤液中加入NaN3，使其浓度达0.04％。然后将瓶置于4℃的冷室中。
通过将滤液置于已高压灭菌的12L贮器中，并将滤液供入400ml Amicon搅拌池中浓缩培养物滤液，该搅拌池已以乙醇冲洗过，并且被包含10,000kDa MWCO膜。使用氮气使压力保持在60psi。这一过程使12L体积减少到约50ml。
然后，采用8,000kDa MWCO纤维素酯膜将培养物滤液对0.1％碳酸氢铵透析，两次更换碳酸氢铵溶液。接着由通过商业途径可获得的BCA测定法(Pierce，Rockford，IL)测定蛋白质浓度。
然后将透析培养物滤液进行冻干，把多肽重悬于蒸馏水中。然后，将多肽对0.01mM 1，3双[三(羟甲基)-甲氨基]丙烷，pH7.5(Bis-Tris丙烷缓冲液)(阴离子交换层析的起始条件)透析。利用在POROS 146 II Q/M阴离子交换柱4.6mm×100mm(Perseptive BioSystems，Framingham，MA)上的凝胶预熔融(profusion)层析完成分级分离，所述交换柱已在0.01mMBis-Tris丙烷缓冲液(pH7.5)中平衡过。用在上述缓冲液系统中的0-0.5MNaCl梯度洗脱多肽。在220nm波长下监测柱洗脱液。
将从离子交换柱洗脱的多肽收集物对蒸馏水透析并冻干。将所形成的物质溶解到在水中的0.1％三氟乙酸(TFA)(pH1.9)中，并且在Delta-Pak C18柱(waters，Milford，MA，300埃孔径大小，5微米颗粒大小(3.9×150mm))上纯化该多肽。用从0到60％稀释缓冲液(在乙腈中的0.1％TFA)线性梯度液从柱中洗脱多肽。流速是0.75ml/分钟，在214nm监测HPLC洗脱液。收集包含洗脱的多肽的组分，使单个样品纯度最大。获得约200个纯化的多肽。
然后，就在PBMC制剂中诱导T-细胞增殖的能力筛选纯化的多肽。将PBMC(来源于称为PPD皮试阳性的供体，并且其T-细胞表现出应答PPD和粗的MTB可溶性蛋白质的增殖)在包含RPMI1640(补充有10％收集的人血清和50μg/mL庆大霉素)的培养基中培养。双份以0.5至10μg/mL的浓度添加纯化的多肽。96-孔园底平板中以200μl体积培养6天后，从各孔除去50μl培养基，以测定IFN-γ水平，如以下所述。接着用1μCi/孔含氚胸苷脉冲平板另外的18小时，收获，并用气体闪烁计数器测定氚摄取。在两个重复中产生的增殖高于在单独的培养基中培养的细胞上观察到的增殖的3倍的组分被认为是阳性的。
用酶联免疫吸附测定(ELISA)测定IFN-γ。在室温下用在PBS中的针对人IFN-γ(PharMingen，San Diego，CA)的小鼠单克隆抗体涂布ELISA平板4小时。然后在室温下用包含5％(WN)脱脂干奶的PBS阻断各孔。接着用PBS/0.2％TWEEN-20洗涤平板6次，将在ELISA平板上的以培养基1∶2稀释的样品在室温下过夜温育。再次洗涤平板，向各孔中添加以PBS/10％正常山羊血清1∶3000稀释的多克隆兔抗-人IFN-γ血清。然后在室温下温育平板两小时，洗涤，加入以PBS/5％脱脂干奶1∶2000稀释的辣根过氧化物酶-偶联的抗-兔IgG(西格玛化学公司，圣路易斯，MO)。在室温下进一步温育2小时后，洗涤平板，并加入TMB底物。20分钟后用1N硫酸终止反应。用570nm为参照波长，在450nm测定光密度。在两个重复中导致给出的OD高于在单独的培养基中培养的细胞的平均OD加3个标准偏差的组分被认为是阳性的。
为了测序，将多肽单个地干燥到Biobrene(Perkin Elmer/AppliedBioSystems Division，Foster City，CA)处理过的玻璃纤维滤器上。将具有多肽的滤器装到Perkin Elmer/Applied BioSystems Division Procise492蛋白质测序仪上。从氨基端测序多肽，并且用传统的Edman化学法。通过把PTH氨基酸衍生物的保留时间与适当的PTH衍生物标准比较，确定各多肽的氨基酸序列。
利用以上描述的方法，分离到具有下列N端序列的抗原(a)Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Xaa-Asn-Tyr-Gly-Gln-Val-Val-Ala-Ala-Leu；(SEQ ID NO.54)(b)Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-Ser；(SEQ ID NO.55)(c)Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-Leu-Gln-Ala-Ala-Lys-Glu-Gly-Arg；(SEQ ID NO.56)(d)Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-Pro；(SEQ ID NO.57)(e)Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val；(SEQ ID NO.58)(f)Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro；(SEQ ID No.59)(g)Asp-Pro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Ala-Ala-Ala-Ala-Pro-Pro-Ala；(SEQ ID NO. 60)和(h)Ala-Pro-Lys-Thr-Tyr-Xaa-Giu-Giu-Leu-Lys-Gly-Thr-Asp-Thr-Gly；(SEQ ID NO.61)其中Xaa可以是任何氨基酸。
除以上所描述的方法之外，通过使用微内径柱HPLC纯化步骤分离到另外的抗原。具体地说，在Aquapore C18柱(Perkin Elmer/AppliedBiosystems Division，Foster City，CA)上纯化包含以上描述的层析纯化步骤的抗原混合物的20μl组分，所说的柱具有7微米孔径大小，柱规格为1mm×100mm，在Perkin Elmer/Applied Biosystems Division 172 HPLC型中。以80μl/分钟的流速，用在水(0.05％TFA)中的乙腈(含0.05％TFA)的1％/分钟的线性梯度液从柱上洗脱各组分。在250nm下监测洗脱液。原组分被分离成4个主要的峰加其他小的组分，并且获得显示出具有12.054Kd分子量(由质谱测得)和具有以下N端序列的多肽(i)Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Gln-Thr-Ser-Leu-Leu-Asn-Asn-Leu-Ala-Asp-Pro-Asp-Val-Ser-Phe-Ala-Asp (SEQ ID NO.62)。采用以上所述的测定法，这一多肽显示出在PBMC制剂中诱导增殖和IFN-γ产生。
按照以下所述从结核分枝杆菌培养物滤液分离另外的可溶性抗原。结核分枝杆菌培养物滤液按照以上描述的方法制备。在pH5.5下对Bis-Tris丙烷缓冲液透析后，用在Poros QE柱4.6×100mm(Perseptive Biosystems)上的阴离子交换层析完成分级分离，所述柱在Bis-Tris丙烷缓冲液(pH5.5)中平衡过。以10ml/分钟的流速，用在上述缓冲系统中的线性0-1.5M NaCl梯度液洗脱多肽。在214nm下检测柱洗脱液。
收集从离子交换柱洗脱的组分，并采用Poros R2柱4.6×100mm(Perseptive Biosystems)进行反相层析。以5ml/分钟的流速，用0-100％乙腈(0.1％TFA)的线性梯度液从柱上洗脱多肽，在214nm监测洗脱液。
将包含洗脱的多肽的组分冷干，并重悬于80μl 0.1％TFA水溶液中，并再在Vydac C4柱4.6×150mm(Western Analytical，Temecula，CA)上，以2ml/分钟的流速，用0-100％乙腈(0.1％TFA)线性梯度液进行反相层析。在214nm监测洗脱液。
具有生物活性的组分被分离成一个主要的峰加其它小组分。这一峰的PVDF膜上的Western印迹揭示分子量为14Kd，20Kd和26Kd的三个主要带。确定了这些多肽分别具有下列N端序列(j)Xaa-Asp-Ser-Glu-Lys-Ser-Ala-Thr-Ile-Lys-Val-Thr-Asp-Ala-Ser；(SEQ ID NO.134)(k)Ala-Gly-Asp-Thr-Xaa-Ile-Tyr-Ile-Val-Gly-Asn-Leu-Thr-Ala-Asp；(SEQ ID NO.135)和(l)Ala-Pro-Glu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-Ala-Gly；(SEQ ID NO.136)，其中Xaa可以是任何氨基酸。采用以上所述的测定法，这些多肽显示出在PBMC制剂中诱导增殖和IFN-γ产生。图1A和B分别显示了使用第一和第二供体的PMBC制剂进行的这种测定的结果。
通过采用32P末端标记的简并寡核苷酸(相应于N端序列并含有结核分枝杆菌密码子偏倚)筛选结核分枝杆菌基因组文库获得编码以上指定为(a)，(c)，(d)和(g)的抗原的DNA序列。采用相应于以上抗原(a)的探针进行的筛选鉴别具有SEQ ID NO.101所示的序列的克隆。由SEQ ID NO.101编码的多肽在SEQ ID NO.102中给出。采用相应于以上抗原(g)的探针进行的筛选鉴别具有SEQ ID NO.52所示的序列的克隆。由SEQ ID NO.52编码的多肽在SEQ ID NO.53中给出。采用相应于以上抗原(d)的探针进行的筛选鉴别具有SEQ ID NO.24所示的序列的克隆。采用相应于以上抗原(c)的探针进行的筛选鉴别具有SEQ ID NO.25所示的序列的克隆。
采用DNA STAR系统，将以上氨基酸序列与基因库中的已知氨基酸序列比较。所检索的数据库含有大约173,000种蛋白质，并且是Swiss，PIR数据库以及翻译的蛋白质序列(版本87)的组合。对抗原(a)-(h)和(l)，没有检测到与所说的氨基酸序列的明显的同源性。
发现抗原(i)的氨基酸序列同源于麻风分枝杆菌的序列。利用从GENBANK获得的序列从基因组DNA扩增全长麻风分枝杆菌序列。然后，将这一序列用于筛选以下实施例2中描述的结核分枝杆菌文库，获得全长拷贝的结核分枝杆菌的同系物(SEQ ID NO.99)。
发现抗原(j)的氨基酸序列同源于从DNA序列翻译的已知结核分枝杆菌蛋白质。就发明者所知，这一蛋白质以前还没有显示出具有T-细胞刺激活性。发现抗原(k)的氨基酸序列与麻风分枝杆菌的序列相关。
在以上描述的增殖与IFN-γ测定中，利用三个PPD阳性供体，以上所提供的代表性抗原的结果在表1中给出表1PBMC增殖和IFN-γ测定的结果

在表1中，给出2和4之间的刺激指数(SI)的反应(与在单独的培养基培养的细胞比较)记录为+，在1μg或更低的浓度下的4-8或2-4的SI记录为++，大于8的SI记录为+++。发现序列(i)的抗原在增殖和IFN-γ测定两者中，对一种供体具有高的SI(+++)，对两种其它供体具有较低的SI(++和+)。这些结果表明这些抗原有能力诱导增殖和/或干扰素-γ产生。
实施例2
使用病人血清分离结核分枝杆菌抗原这一例子说明通过用结核分枝杆菌感染个体的血清筛选从结核分枝杆菌溶解产物分离抗原的方法。
将干燥的结核分枝杆菌H37Ra(Difco实验室)添加至2％NP40溶液中，此外，匀浆和超声处理三次。在13,000rpm下在微量离心管中离心所形成的悬浮液，将上清液通过0.2微米注射滤器。将滤液结合到Macro PrepDEAE小珠(BioRad，Hercules，CA)上。用20mM Tris(pH7.5)充分洗涤小珠，结合的蛋白质以1M NaCl洗脱。将NaCl洗脱液对10mMTris(pH7.5)透析一夜。在室温下用0.05mg/ml的DNase和RNase处理透析溶液30分钟，然后于室温在pH4.5下用0.5U/mg α-D-甘露糖苷酶处理。在返回到pH7.5后，在Bio Scale-Q-20柱(BioRad)上经FPLC分级分离该物质。将组分合并到九个池中，在Centriprep 10(Amicon，Beverley，MA)中浓缩，并且采用结核分枝杆菌感染病人的血清(其与本发明的其它抗原不发生免疫反应)就血清学活性经Western印迹筛选。
将反应性最强的组分在SDS-PAGE上进行分析，并转移到PVDF上。切下约85Kd的带，产生以下序列(m)Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-Ile-Asn-Val-His-Leu-Val；(SEQ ID NO.137)，其中Xaa可以是任何氨基酸。
这些序列与以上描述的基因库中的那些序列的比较揭示出与已知的序列没有明显的同源性。
实施例3制备编码结核分枝杆菌抗原的DNA序列这一例子说明通过用从结核分枝杆菌感染病人获得的血清或者用抗结核分枝杆菌抗原产生的抗血清筛选结核分枝杆菌表达文库，制备编码结核分枝杆菌抗原的DNA序列的方法。A.用兔抗血清制备结核分枝杆菌可溶性抗原从结核分枝杆菌菌株H37Ra分离基因组DNA。随机剪切该DNA，并用于用Lambda ZAP表达系统(Stratagene，La Jolla，CA)构建表达文库。通过用结核分技杆菌培养物的浓缩上清液免疫兔产生抗结核分枝杆菌菌株H37Ra，H37Rv和Erdman的分泌蛋白质的兔抗血清。具体地说，首先用200μg在含有100μg胞壁酰二肽的2ml总体积中的蛋白质抗原(Calbiochem，La Jolla，CA)和1ml弗氏不完全佐剂皮下免疫兔。四周后，用在弗氏不完全佐剂中的100μg抗原皮下加强免疫兔。最后，在四周后用50μg蛋白质抗原静脉内免疫兔。如Sambrook等，分子克隆实验室手册，冷泉港实验室，冷泉港，NY，1989中的描述将抗血清用于筛选表达文库。纯化表达免疫反应性抗原的噬菌体噬斑。噬斑的噬粒得到救援，结核分枝杆菌克隆的核苷酸序列被推定。
纯化了32个克隆。在这些克隆中，25个代表在结核分枝杆菌中以前没有鉴别过的序列。表达重组抗原，纯化的抗原用于实施例1描述的免疫学分析中。如Skeiky等，实验医学杂志，1811527-1537，1995中所述用IPTG诱导蛋白质，并经凝胶洗脱纯化。在这一筛选中鉴别的DNA分子的代表性部分序列在SEQ ID NO.1-25中给出。相应的预言的氨基酸序列在SEQ ID NO.63-87中给出。
基于采用以上所述的数据库将这些序列与基因库中的已知序列比较，发现下文中称为TbRA2A、TbRA16、TbRA18和TbRA29(SEQ ID NO.76、68、70、75)的克隆显示出与以前在麻风分枝杆菌中而不是在结核分枝杆菌中鉴别的序列的某些同源性。TbRA11、TbRA26、TbRA28和TbDPEP(SEQID NO.65、73、74、53)以前在结核分枝杆菌中已鉴定过。对TbRA1、TbRA3、TbRA4、TbRA9、TbRA10、TbRA13、TbRA17、TbRA19、TbRA29、TbRA32、TbRA36和重叠克隆TbRA35和TbRA12(分别为SEQ ID NO.63、77、81、82、64、67、69、71、75、78、80、79、66)没有发现明显的同源性。克隆TbRa24与克隆TbRa29重叠。
采用来源于几种不同的结核分枝杆菌免疫患者的T-细胞制剂，在代表性的重组抗原上进行的PBMC增殖和干扰素-γ测定的结果分别示于表2和3中。
表2PBMC增殖对代表性可溶性抗原的结果

nt＝未试验表3PBMC的干扰素-γ产生对代表性可溶性抗原的结果

在表2和3中，给出1.2和2(与在单独的培养基中培养的细胞比较)之间的刺激指数(SI)的反应记录为±，2-4的SI记录为+，在1μg或更低的浓度下的4-8或2-4的SI记录为++，大于8的SI记录为+++。此外，对两种以上的抗原，浓度对增殖和干扰素-γ产生的影响示于附图中。对增殖和干扰素-γ产生两者而言，TbRa3记录为++，TbRa9记录为+。
这些结果说明，这些可溶性抗原可以在来源于结核分枝杆菌免疫个体的T-细胞中诱导增殖和/或干扰素-γ产生。B.使用病人血清鉴别编码结核分枝杆菌抗原的DNA序列采用从患活动性结核病的患者获得的血清库筛选以上描述的基因组DNA文库和另外的H37Rv文库。为了制备H37Rv文库，分离结核分枝杆菌菌株H37Rv基因组的DNA，进行部分Sau3A消化，并用于采用Lambda Zap表达系统(Stratagene，La JolIa，Ca)构建表达文库。将三种不同库的血清(各含有从患有活动性肺部或胸膜疾病的个体获得的血清)用于表达筛选。有关在ELISA和免疫印迹方式两者中与H37Ra溶解产物的相对反应性，这些库被指定为TbL、TbM和TbH(即，TbL＝低反应性，TbN＝中等反应性和TbH＝高反应性)。也使用了来自活动性肺结核病的七个患者血清的四个库。所有血清缺乏与重组38kD结核分枝杆菌H37Ra磷酸盐-结合蛋白的增加的反应性。
所有库用大肠杆菌溶解产物预吸附，并用于如Sambrook等，分子克隆实验室手册，冷泉港实验室，冷泉港，NY，1989中所述筛选H37Ra和H37Rv表达文库。纯化表达免疫反应性抗原的噬菌体噬斑。噬斑的噬粒得到救援，结核分枝杆菌克隆的核苷酸序列被推定。
纯化了32个克隆。在这些克隆中，31个代表在人结核分枝杆菌中以前没有鉴别过的序列。所鉴别的DNA分子的代表性序列在SEQ ID NO.26-51和105中给出。在这些克隆中，TbH-8和TbH-8-2(SEQ ID NO.105)是相同克隆的非邻接DNA序列，TbH-4(SEQ ID NO.43)和TbH-4-FWD(SEQ IDNO.44)是相同克隆的非邻接序列。此后鉴别为Tb38-1、TbH-4、TbH-8、TbH-9、和TbH-12的抗原的氨基酸序列在SEQ ID NO.88-92中显示。利用以上确定的数据库将这些序列与基因库中的已知序列的比较揭示出，对TbH-4、TbH-8、TbH-9和TbM-3没有明显的同源性，虽然对TbH-9发现了弱的同源性。发现TbH-12同源于以前在副结核分枝杆菌(Acc.S28515)中鉴定的34kD抗原蛋白质。发现Tb38-1位于以前在牛型分枝杆菌(Acc.No.U34848)和结核分枝杆菌中鉴别的抗原ESAT-6开放读框上游34个碱基对(Sorensen等，感染免疫学，631710-1717，1995)。
将来源于Tb38-1和TbH-9(两者都是从H37Ra文库分离的)的探针用于鉴别H37RV文库中的克隆。Tb38-1杂交到Tb38-IF2、Tb38-1F3、Tb38-1F5和Tb38-1F6(SEQ ID NO.112、113、116、118和119)。SEQ ID NO.112和113是来源于克隆Tb38-1F2的非邻接序列，推定了Tb38-IF2中的两个开放读框；一个相应于Tb37FL(SEQ ID NO.114)，第二个(部分序列)可以是Tb38-1的同系物，并称为Tb38-IN(SEQ ID NO.115)。Tb38-1F3的推定的氨基酸序列在SEQ ID NO.117中给出。TbH-9探针鉴别了H37Rv文库中的三个克隆TDH-9-FL(SEQ ID NO.106)，其可以是TbH-9(R37Ra)的同系物；TbH-9-1(SEQ ID NO.108)和TbH-9-4(SEQ ID NO.110)，所有这些都是TbH-9的高度相关序列。这三个克隆的推定的氨基酸序列在SEQ IDNO.107、109和111中给出。
在Tb38-1，ESAT-6和其它代表性重组抗原上进行的T-细胞测定的结果分别示于以下表4A、B和5中。
表4APBMC增殖对代表性抗原的结果

表4BPBMC的干扰素-γ产生对代表性抗原的结果

表5T-细胞反应对代表性抗原的总结

这些结果说明，本发明的结核分枝杆菌抗原和ESAT-6两者都可以在来源于结核分枝杆菌免疫个体的T-细胞中诱导增殖和/或干扰素-γ产生。就发明人所知，ESAT-6以前没有显示出刺激人免疫反应。
采用实施例4所述的方法构建了覆盖抗原Tb38-1的氨基酸序列的一组六个重叠肽。这些肽序列(此后称为pep1-6)分别在SEQ ID NO.93-98中显示。采用这些肽进行的T-细胞测定的结果示于表6和7中。这些结果证实，在Tb38-1内的存在和帮助定位T-细胞表位能够在来源于结核分枝杆菌免疫个体的T-细胞中诱导增殖和干扰素-γ产生。
表6PBMC增殖对TB38-1肽的结果

<p>表7PBMC的干扰素-γ产生对TB38-1肽的结果

实施例4来源于结核菌素纯化蛋白质衍生物的多肽的纯化和特征确定按照以下所述从结核菌素纯化蛋白质衍生物(PPD)分离结核分枝杆菌多肽。
按进行某些修改的出版的方法(Seibert，F等，结核菌素纯化蛋白质衍生物。大量制备和分析标准。美国结核病评论449-25，1941)制备PPD。
于37℃下在摇瓶中用合成培养基培养结核分枝杆菌Rv菌株6周。然后将含有细菌生长物的瓶子用水蒸汽加热到100℃3小时。用O.22μ滤器无菌过滤培养物，采用3kD切断膜浓缩20倍。用50％硫酸铵溶液沉淀蛋白质一次，用25％硫酸铵溶液沉淀8次。通过反相液相层析(RP-HPLC)分级分离所形成的蛋白质(PPD)，所说的层析采用在Biocad HPLC系统(Perseptive Biosystems，Framingham，MA)中的C18柱(7.8×300nM；Waters，Milford，MA)。用0-100％线性梯度缓冲液(在乙腈中的0.1％TFA)从柱中洗脱组分。流速是10ml/分钟，在214nm和280nm下监测洗脱液。
收集六个组分，干燥，悬浮在PBS中，并在结核分枝杆菌感染豚鼠中就诱导迟发型超敏(DTH)反应分别进行试验。发现一个组分诱导强的DTH反应，接着在微内径Vydac C18柱(Cat.No.218TP5115)上进一步经RP-HPLC分级分离，所说的柱在Perkin Elmer/Applied Biosystems Division 172HPLC型中。以5-100％线性梯度缓冲液(在乙腈中的0.05％TFA)洗脱各组分，流速为80μl/分钟。在215nm监测洗脱液。收集八个组分，在结核分枝杆菌感染豚鼠中试验对DTH的诱导。发现一个组分诱导约16mm硬结的强DTH。其它组分不诱导可检测的DTH。将阳性组分进行SDS-PAGE凝胶电泳，发现其含有12kD分子量的一单一蛋白质带。
如以上的描述，用Perkin Elmer/Applied Biosystems DivisionProcise492蛋白质测序仪从氨基末端对这一多肽(此后称作DPPD)进行测序，发现其具有SEQ ID NO.129中显示的N端序列。这一序列与以上描述的基因库中的已知序列的比较揭示没有已知的同系物。分离到DPPD的四个溴化氰片段，发现其具有SEQ ID NO.130-133中显示的序列。
如实施例1的描述测定抗原DPPD刺激人PBMC增殖和产生IFN-γ的能力。如表8所示，发现DPPD刺激增殖和激发大量IFN-γ的产生；高于由市售的PPD所激发的。
表8增殖和干扰素-γ测定对DPPD的结果

实施例5合成多肽的合成可以采用由HPTU(O-苯并三唑-N，N，N′，N′-四甲基脲鎓(uronium)六氟磷酸盐)活化的FMOC化学在Millipore9050肽合成仪上合成多肽。Gly-Cys-Gly序列可以连接到肽的氨基末端，以提供所述肽的缀合或标记方法。可以采用下列切割混合物从固相支持体上切割肽三氟乙酸∶乙烷二硫酚∶苯硫基甲烷∶水∶苯酚(40∶1∶2∶2∶3)。在切割两小时后，可以在冷的甲基-叔丁基醚中沉淀所说的肽。然后，肽沉淀可以溶解在含0.1％三氟乙酸(TFA)的水中，并且在经C18反相HPLC纯化之前冷干。在水(含0.1％TFA)中的0-60％乙腈(含0.1％TFA)梯度液可以用于洗脱肽。在纯组分的冷干后，可以采用电喷射质谱测定法和氨基酸分析确定肽的特征。
从以上所述可以清楚看到，虽然为说明的目的，本文描述了本发明的特定的实施方案，但是可以进行各种修改而不背离本发明的精神和范围。
序列表(1)一般信息(i)申请人Corixa公司(ii)发明名称用于免疫治疗和诊断结核病的化合物和方法(ii)序列数137个(iv)通讯地址(A)收信人SEED和BERRY LLP(B)街道6300哥伦比亚中心，第五大街701号(C)城市Seattle(D)州华盛顿(E)国家美国(F)ZIP98104-7092(v)计算机可读形式(A)介质类型软盘(B)计算机IBM PC兼容机(C)操作系统PC-DOS/MS-DOS(D)软件PatentIn Release#1.0，版本#1.30(vi)当前申请的数据(A)申请号(B)申请日1996-8-27(C)分类号(viii)律师/代理人信息(A)姓名Maki，David J.
(B)登记号31.392(C)证书号210121.417PC(ix)电讯信息(A)电话(206)622-4900(B)传真(206)682-6031(2)SEQ ID NO1的信息(i)序列特征(A)长度766个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO1CGAGGCACCG GTAGTTTGAA CCAAACGCAC AATCGACGGG CAAACGAACG GAAGAACACA 60ACCATGAAGA TGGTGAAATC GATCGCCGCA GGTCTGACCG CCGCGGCTGC AATCGGCGCC 120GCTGCGGCCG GTGTGACTTC GATCATGGCT GGCGGCCCGG TCGTATACCA GATGCAGCCG 180GTCGTCTTCG GCGCGCCACT GCCGTTGGAC CCGGCATCCG CCCCTGACGT CCCGACCGCC 240GCCCAGTTGA CCAGCCTGCT CAACAGCCTC GCCGATCCCA ACGTGTCGTT TGCGAACAAG 300GGCAGTCTGG TCGAGGGCGG CATCGGGGGC ACCGAGGCGC GCATCGCCGA CCACAAGCTG 360AAGAAGGCCG CCGAGCACGG GGATCTGCCG CTGTCGTTCA GCGTGACGAA CATCCAGCCG 420GCGGCCGCCG GTTCGGCCAC CGCCGACGTT TCCGTCTCGG GTCCGAAGCT CTCGTCGCCG 480GTCACGCAGA ACGTCACGTT CGTGAATCAA GGCGGCTGGA TGCTGTCACG CGCATCGGCG 540ATGGAGTTGC TGCAGGCCGC AGGGNAACTG ATTGGCGGGC CGGNTTCAGC CCGCTGTTCA 600GCTACGCCGC CCGCCTGGTG ACGCGTCCAT GTCGAACACT CGCGCGTGTA GCACGGTGCG 660GTNTGCGCAG GGNCGCACGC ACCGCCCGGT GCAAGCCGTC CTCGAGATAG GTGGTGNCTC 720GNCACCAGNG ANCACCCCCN NNTCGNCNNT TCTCGNTGNT GNATGA 766(2)SEQ ID NO2的信息(i)序列特征(A)长度752个碱基对(B)类型核酸
(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO2ATGCATCACC ATCACCATCA CGATGAAGTC ACGGTAGAGA CGACCTCCGT CTTCCGCGCA 60GACTTCCTCA GCGAGCTGGA CGCTCCTGCG CAAGCGGGTA CGGAGAGCGC GGTCTCCGGG 120GTGGAAGGGC TCCCGCCGGG CTCGGCGTTG CTGGTAGTCA AACGAGGCCC CAACGCCGGG 180TCCCGGTTCC TACTCGACCA AGCCATCACG TCGGCTGGTC GGCATCCCGA CAGCGACATA 240TTTCTCGACG ACGTGACCGT GAGCCGTCGC CATGCTGAAT TCCGGTTGGA AAACAACGAA 300TTCAATGTCG TCGATGTCGG GAGTCTCAAC GGCACCTACG TCAACCGCGA GCCCGTGGAT 360TCGGCGGTGC TGGCGAACGG CGACGAGGTC CAGATCGGCA AGCTCCGGTT GGTGTTCTTG 420ACCGGACCCA AGCAAGGCGA GGATGACGGG AGTACCGGGG GCCCGTGAGC GCACCCGATA 480GCCCCGCGCT GGCCGGGATG TCGATCGGGG CGGTCCTCCG ACCTGCTACG ACCGGATTTT 540CCCTGATGTC CACCATCTCC AAGATTCGAT TCTTGGGAGG CTTGAGGGTC NGGGTGACCC 600CCCCGCGGGC CTCATTCNGG GGTNTCGGCN GGTTTCACCC CNTACCNACT GCCNCCCGGN 660TTGCNAATTC NTTCTTCNCT GCCCNNAAAG GGACCNTTAN CTTGCCGCTN GAAANGGTNA 720TCCNGGGCCC NTCCTNGAAN CCCCNTCCCC CT752(2)SEQ ID NO3的信息(i)序列特征(A)长度813个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO3CATATGCATC ACCATCACCA TCACACTTCT AACCGCCCAG CGCGTCGGGG GCGTCGAGCA 60CCACGCGACA CCGGGCCCGA TCGATCTGCT AGCTTGAGTC TGGTCAGGCA TCGTCGTCAG 120CAGCGCGATG CCCTATGTTT GTCGTCGACT CAGATATCGC GGCAATCCAA TCTCCCGCCT 180GCGGCCGGCG GTGCTGCAAA CTACTCCCGG AGGAATTTCG ACGTGCGCAT CAAGATCTTC 240ATGCTGGTCA CGGCTGTCGT TTTGCTCTGT TGTTCGGGTG TGGCCACGGC CGCGCCCAAG 300ACCTACTGCG AGGAGTTGAA AGGCACCGAT ACCGGCCAGG CGTGCCAGAT TCAAATGTCC 360GACCCGGCCT ACAACATCAA CATCAGCCTG CCCAGTTACT ACCCCGACCA GAAGTCGCTG 420GAAAATTACA TCGCCCAGAC GCGCGACAAG TTCCTCAGCG CGGCCACATC GTCCACTCCA 480CGCGAAGCCC CCTACGAATT GAATATCACC TCGGCCACAT ACCAGTCCGC GATACCGCCG 540CGTGGTACGC AGGCCGTGGT GCTCAMGGTC TACCACAACG CCGGCGGCAC GCACCCAACG 600ACCACGTACA AGGCCTTCGA TTGGGACCAG GCCTATCGCA AGCCAATCAC CTATGACACG 660CTGTGGCAGG CTGACACCGA TCCGCTGCCA GTCGTCTTCC CCATTGTTGC AAGGTGAACT 720GAGCAACGCA GACCGGGACA ACWGGTATCG ATAGCCGCCN AATGCCGGCT TGGAACCCNG 780TGAAATTATC ACAACTTCGC AGTCACNAAA NAA 813(2)SEQ ID NO4的信息(i)序列特征(A)长度447个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO4CGGTATGAAC ACGGCCGCGT CCGATAACTT CCAGCTGTCC CAGGGTGGGC AGGGATTCGC 60CATTCCGATC GGGCAGGCGA TGGCGATCGC GGGCCAGATC CGATCGGGTG GGGGGTCACC 120CACCGTTCAT ATCGGGCCTA CCGCCTTCCT CGGCTTGGGT GTTGTCGACA ACAACGGCAA 180CGGCGCACGA GTCCAACGCG TGGTCGGGAG CGCTCCGGCG GCAAGTCTCG GCATCTCCAC 240CGGCGACGTG ATCACCGCGG TCGACGGCGC TCCGATCAAC TCGGCCACCG CGATGGCGGA 300CGCGCTTAAC GGGCATCATC CCGGTGACGT CATCTCGGTG AACTGGCAAA CCAAGTCGGG 360CGGCACGCGT ACAGGGAACG TGACATTGGC CGAGGGACCC CCGGCCTGAT TTCGTCGYGG 420ATACCACCCG CCGGCCGGCC AATTGGA 447(2)SEQ ID NO5的信息(i)序列特征(A)长度604个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO5GTCCCACTGC GGTCGCCGAG TATGTCGCCC AGCAAATGTC TGGCAGCCGC CCAACGGAAT 60CCGGTGATCC GACGTCGCAG GTTGTCGAAC CCGCCGCCGC GGAAGTATCG GTCCATGCCT 120AGCCCGGCGA CGGCGAGCGC CGGAATGGCG CGAGTGAGGA GGCGGGCAAT TTGGCGGGGC 180CCGGCGACGG NGAGCGCCGG AATGGCGCGA GTGAGGAGGT GGNCAGTCAT GCCCAGNGTG 240ATCCAATCAA CCTGNATTCG GNCTGNGGGN CCATTTGACA ATCGAGGTAG TGAGCGCAAA 300TGAATGATGG AAAACGGGNG GNGACGTCCG NTGTTCTGGT GGTGNTAGGT GNCTGNCTGG 360NGTNGNGGNT ATCAGGATGT TCTTCGNCGA AANCTGATGN CGAGGAACAG GGTGTNCCCG 420NNANNCCNAN GGNGTCCNAN CCCNNNNTCC TCGNCGANAT CANANAGNCG NTTGATGNGA 480NAAAAGGGTG GANCAGNNNN AANTNGNGGN CCNAANAANC NNNANNGNNG NNAGNTNGNT 540NNNTNTTNNC ANNNNNNNTG NNGNNGNNCN NNNCAANCNN NTNNNNGNAA NNGGNTTNTT 600NAAT 604(2)SEQ ID NO6的信息(i)序列特征(A)长度633个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO6TTGCANGTCG AACCACCTCA CTAAAGGGAA CAAAAGCTNG AGCTCCACCG CGGTGGCGGC 60CGCTCTAGAA CTAGTGKATM YYYCKGGCTG CAGSAATYCG GYACGAGCAT TAGGACAGTC 120TAACGGTCCT GTTACGGTGA TCGAATGACC GACGACATCC TGCTGATCGA CACCGACGAA 180CGGGTGCGAA CCCTCACCCT CAACCGGCCG CAGTCCCGYA ACGCGCTCTC GGCGGCGCTA 240CGGGATCGGT TTTTCGCGGY GTTGGYCGAC GCCGAGGYCG ACGACGACAT CGACGTCGTC 300ATCCTCACCG GYGCCGATCC GGTGTTCTGC GCCGGACTGG ACCTCAAGGT AGCTGGCCGG 360GCAGACCGCG CTGCCGGACA TCTCACCGCG GTGGGCGGCC ATGACCAAGC CGGTGATCGG 420CGCGATCAAC GGCGCCGCGG TCACCGGCGG GCTCGAACTG GCGCTGTACT GCGACATCCT 480GATCGCCTCC GAGCACGCCC GCTTCGNCGA CACCCACGCC CGGGTGGGGC TGCTGCCCAC 540CTGGGGACTC AGTGTGTGCT TGCCGCAAAA GGTCGGCATC GGNCTGGGCC GGTGGATGAG 600CCTGACCGGC GACTACCTGT CCGTGACCGA CGC 633(2)SEQ ID NO7的信息(i)序列特征(A)长度1362个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO7CGACGACGAC GGCGCCGGAG AGCGGGCGCG AACGGCGATC GACGCGGCCC TGGCCAGAGT 60CGGCACCACC CAGGAGGGAG TCGAATCATG AAATTTGTCA ACCATATTGA GCCCGTCGCG 120CCCCGCCGAG CCGGCGGCGC GGTCGCCGAG GTCTATGCCG AGGCCCGCCG CGAGTTCGGC 180CGGCTGCCCG AGCCGCTCGC CATGCTGTCC CCGGACGAGG GACTGCTCAC CGCCGGCTGG 240GCGACGTTGC GCGAGACACT GCTGGTGGGC CAGGTGCCGC GTGGCCGCAA GGAAGCCGTC 300GCCGCCGCCG TCGCGGCCAG CCTGCGCTGC CCCTGGTGCG TCGACGCACA CACCACCATG 360CTGTACGCGG CAGGCCAAAC CGACACCGCC GCGGCGATCT TGGCCGGCAC AGCACCTGCC 420GCCGGTGACC CGAACGCGCC GTATGTGGCG TGGGCGGCAG GAACCGGGAC ACCGGCGGGA 480CCGCCGGCAC CGTTCGGCCC GGATGTCGCC GCCGAATACC TGGGCACCGC GGTGCAATTC 540CACTTCATCG CACGCCTGGT CCTGGTGCTG CTGGACGAAA CCTTCCTGCC GGGGGGCCCG 600CGCGCCCAAC AGCTCATGCG CCGCGCCGGT GGACTGGTGT TCGCCCGCAA GGTGCGCGCG 660GAGCATCGGC CGGGCCGCTC CACCCGCCGG CTCGAGCCGC GAACGCTGCC CGACGATCTG 720GCATGGGCAA CACCGTCCGA GCCCATAGCA ACCGCGTTCG CCGCGCTCAG CCACCACCTG 780GACACCGCGC CGCACCTGCC GCCACCGACT CGTCAGGTGG TCAGGCGGGT CGTGGGGTCG 840TGGCACGGCG AGCCAATGCC GATGAGCAGT CGCTGGACGA ACGAGCACAC CGCCGAGCTG 900CCCGCCGACC TGCACGCGCC CACCCGTCTT GCCCTGCTGA CCGGCCTGGC CCCGCATCAG 960GTGACCGACG ACGACGTCGC CGCGGCCCGA TCCCTGCTCG ACACCGATGC GGCGCTGGTT 1020GGCGCCCTGG CCTGGGCCGC CTTCACCGCC GCGCGGCGCA TCGGCACCTG GATCGGCGCC 1080GCCGCCGAGG GCCAGGTGTC GCGGCAAAAC CCGACTGGGT GAGTGTGCGC GCCCTGTCGG 1140TAGGGTGTCA TCGCTGGCCC GAGGGATCTC GCGGCGGCGA ACGGAGGTGG CGACACAGGT 1200GGAAGCTGCG CCCACTGGCT TGCGCCCCAA CGCCGTCGTG GGCGTTCGGT TGGCCGCACT 1260GGCCGATCAG GTCGGCGCCG GCCCTTGGCC GAAGGTCCAG CTCAACGTGC CGTCACCGAA 1320GGACCGGACG GTCACCGGGG GTCACCCTGC GCGCCCAAGG AA 1362(2)SEQ ID NO8的信息(i)序列特征(A)长度1458个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO8GCGACGACCC CGATATGCCG GGCACCGTAG CGAAAGCCGT CGCCGACGCA CTCGGGCGCG 60GTATCGCTCC CGTTGAGGAC ATTCAGGACT GCGTGGAGGC CCGGCTGGGG GAAGCCGGTC 120TGGATGACGT GGCCCGTGTT TACATCATCT ACCGGCAGCG GCGCGCCGAG CTGCGGACGG 180CTAAGGCCTT GCTCGGCGTG CGGGACGAGT TAAAGCTGAG CTTGGCGGCC GTGACGGTAC 240TGCGCGAGCG CTATCTGCTG CACGACGAGC AGGGCCGGCC GGCCGAGTCG ACCGGCGAGC 300TGATGGACCG ATCGGCGCGC TGTGTCGCGG CGGCCGAGGA CCAGTATGAG CCGGGCTCGT 360CGAGGCGGTG GGCCGAGCGG TTCGCCACGC TATTACGCAA CCTGGAATTC CTGCCGAATT 420CGCCCACGTT GATGAACTCT GGCACCGACC TGGGACTGCT CGCCGGCTGT TTTGTTCTGC 480CGATTGAGGA TTCGCTGCAA TCGATCTTTG CGACGCTGGG ACAGGCCGCC GAGCTGCAGC 540GGGCTGGAGG CGGCACCGGA TATGCGTTCA GCCACCTGCG ACCCGCCGGG GATCGGGTGG 600CCTCCACGGG CGGCACGGCC AGCGGACCGG TGTCGTTTCT ACGGCTGTAT GACAGTGCCG 660CGGGTGTGGT CTCCATGGGC GGTCGCCGGC GTGGCGCCTG TATGGCTGTG CTTGATGTGT 720CGCACCCGGA TATCTGTGAT TTCGTCACCG CCAAGGCCGA ATCCCCCAGC GAGCTCCCGC 780ATTTCAACCT ATCGGTTGGT GTGACCGACG CGTTCCTGCG GGCCGTCGAA CGCAACGGCC 840TACACCGGCT GGTCAATCCG CGAACCGGCA AGATCGTCGC GCGGATGCCC GCCGCCGAGC 900TGTTCGACGC CATCTGCAAA GCCGCGCACG CCGGTGGCGA TCCCGGGCTG GTGTTTCTCG 960ACACGATCAA TAGGGCAAAC CCGGTGCCGG GGAGAGGCCG CATCGAGGCG ACCAACCCGT 1020GCGGGGAGGT CCCACTGCTG CCTTACGAGT CATGTAATCT CGGCTCGATC AACCTCGCCC 1080GGATGCTCGC CGACGGTCGC GTCGACTGGG ACCGGCTCGA GGAGGTCGCC GGTGTGGCGG 1140TGCGGTTCCT TGATGACGTC ATCGATGTCA GCCGCTACCC CTTCCCCGAA CTGGGTGAGG 1200CGGCCCGCGC CACCCGCAAG ATCGGGCTGG GAGTCATGGG TTTGGCGGAA CTGCTTGCCG 1260CACTGGGTAT TCCGTACGAC AGTGAAGAAG CCGTGCGGTT AGCCACCCGG CTCATGCGTC 1320GCATACAGCA GGCGGCGCAC ACGGCATCGC GGAGGCTGGC GGAAGAGCGG GGCGCATTCC 1380CGGCGTTCAC CGATAGCCGG TTCGCGCGGT CGGGCCCGAG GCGCAACGCA CAGGTCACCT 1440CCGTCGCTCC GACGGGCA1458(2)SEQ ID NO9的信息(i)序列特征(A)长度862个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO9ACGGTGTAAT CGTGCTGGAT CTGGAACCGC GTGGCCCGCT ACCTACCGAG ATCTACTGGC 60GGCGCAGGGG GCTGGCCCTG GGCATCGCGG TCGTCGTAGT CGGGATCGCG GTGGCCATCG 120TCATCGCCTT CGTCGACAGC AGCGCCGGTG CCAAACCGGT CAGCGCCGAC AAGCCGGCCT 180CCGCCCAGAG CCATCCGGGC TCGCCGGCAC CCCAAGCACC CCAGCCGGCC GGGCAAACCG 240AAGGTAACGC CGCCGCGGCC CCGCCGCAGG GCCAAAACCC CGAGACACCC ACGCCCACCG 300CCGCGGTGCA GCCGCCGCCG GTGCTCAAGG AAGGGGACGA TTGCCCCGAT TCGACGCTGG 360CCGTCAAAGG TTTGACCAAC GCGCCGCAGT ACTACGTCGG CGACCAGCCG AAGTTCACCA 420TGGTGGTCAC CAACATCGGC CTGGTGTCCT GTAAACGCGA CGTTGGGGCC GCGGTGTTGG 480CCGCCTACGT TTACTCGCTG GACAACAAGC GGTTGTGGTC CAACCTGGAC TGCGCGCCCT 540CGAATGAGAC GCTGGTCAAG ACGTTTTCCC CCGGTGAGCA GGTAACGACC GCGGTGACCT 600GGACCGGGAT GGGATCGGCG CCGCGCTGCC CATTGCCGCG GCCGGCGATC GGGCCGGGCA 660CCTACAATCT CGTGGTACAA CTGGGCAATC TGCGCTCGCT GCCGGTTCCG TTCATCCTGA 720ATCAGCCGCC GCCGCCGCCC GGGCCGGTAC CCGCTCCGGG TCCAGCGCAG GCGCCTCCGC 780CGGAGTCTCC CGCGCAAGGC GGATAATTAT TGATCGCTGA TGGTCGATTC CGCCAGCTGT 840GACAACCCCT CGCCTCGTGC CG 862(2)SEQ ID NO10的信息(i)序列特征(A)长度622个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO10TTGATCAGCA CCGGCAAGGC GTCACATGCC TCCCTGGGTG TGCAGGTGAC CAATGACAAA 60GACACCCCGG GCGCCAAGAT CGTCGAAGTA GTGGCCGGTG GTGCTGCCGC GAACGCTGGA 120GTGCCGAAGG GCGTCGTTGT CACCAAGGTC GACGACCGCC CGATCAACAG CGCGGACGCG 180TTGGTTGCCG CCGTGCGGTC CAAAGCGCCG GGCGCCACGG TGGCGCTAAC CTTTCAGGAT 240CCCTCGGGCG GTAGCCGCAC AGTGCAAGTC ACCCTCGGCA AGGCGGAGCA GTGATGAAGG 300TCGCCGCGCA GTGTTCAAAG CTCGGATATA CGGTGGCACC CATGGAACAG CGTGCGGAGT 360TGGTGGTTGG CCGGGCACTT GTCGTCGTCG TTGACGATCG CACGGCGCAC GGCGATGAAG 420ACCACAGCGG GCCGCTTGTC ACCGAGCTGC TCACCGAGGC CGGGTTTGTT GTCGACGGCG 480TGGTGGCGGT GTCGGCCGAC GAGGTCGAGA TCCGAAATGC GCTGAACACA GCGGTGATCG 540GCGGGGTGGA CCTGGTGGTG TCGGTCGGCG GGACCGGNGT GACGNCTCGC GATGTCACCC 600CGGAAGCCAC CCGNGACATT CT 622(2)SEQ ID NO11的信息(i)序列特征(A)长度1200个碱基对(B)类型核酸(C)链型单链
(D)拓扑结构线型(xi)序列描述SEQ ID NO11GGCGCAGCGG TAAGCCTGTT GGCCGCCGGC ACACTGGTGT TGACAGCATG CGGCGGTGGC60ACCAACAGCT CGTCGTCAGG CGCAGGCGGA ACGTCTGGGT CGGTGCACTG CGGCGGCAAG 120AAGGAGCTCC ACTCCAGCGG CTCGACCGCA CAAGAAAATG CCATGGAGCA GTTCGTCTAT 180GCCTACGTGC GATCGTGCCC GGGCTACACG TTGGACTACA ACGCCAACGG GTCCGGTGCC 240GGGGTGACCC AGTTTCTCAA CAACGAAACC GATTTCGCCG GCTCGGATGT CCCGTTGAAT 300CCGTCGACCG GTCAACCTGA CCGGTCGGCG GAGCGGTGCG GTTCCCCGGC ATGGGACCTG 360CCGACGGTGT TCGGCCCGAT CGCGATCACC TACAATATCA AGGGCGTGAG CACGCTGAAT 420CTTGACGGAC CCACTACCGC CAAGATTTTC AACGGCACCA TCACCGTGTG GAATGATCCA 480CAGATCCAAG CCCTCAACTC CGGCACCGAC CTGCCGCCAA CACCGATTAG CGTTATCTTC 540CGCAGCGACA AGTCCGGTAC GTCGGACAAC TTCCAGAAAT ACCTCGACGG TGTATCCAAC 600GGGGCGTGGG GCAAAGGCGC CAGCGAAACG TTCAGCGGGG GCGTCGGCGT CGGCGCCAGC 660GGGAACAACG GAACGTCGGC CCTACTGCAG ACGACCGACG GGTCGATCAC CTACAACGAG 720TGGTCGTTTG CGGTGGGTAA GCAGTTGAAC ATGGCCCAGA TCATCACGTC GGCGGGTCCG 780GATCCAGTGG CGATCACCAC CGAGTCGGTC GGTAAGACAA TCGCCGGGGC CAAGATCATG 840GGACAAGGCA ACGACCTGGT ATTGGACACG TCGTCGTTCT ACAGACCCAC CCAGCCTGGC 900TCTTACCCGA TCGTGCTGGC GACCTATGAG ATCGTCTGCT CGAAATACCC GGATGCGACG 960ACCGGTACTG CGGTAAGGGC GTTTATGCAA GCCGCGATTG GTCCAGGCCA AGAAGGCCTG 1020GACCAATACG GCTCCATTCC GTTGCCCAAA TCGTTCCAAG CAAAATTGGC GGCCGCGGTG 1080AATGCTATTT CTTGACCTAG TGAAGGGAAT TCGACGGTGA GCGATGCCGT TCCGCAGGTA 1140GGGTCGCAAT TTGGGCCGTA TCAGCTATTG CGGCTGCTGG GCCGAGGCGG GATGGGCGAG 1200(2)SEQ ID NO12的信息(i)序列特征(A)长度1155个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO12GCAAGCAGCT GCAGGTCGTG CTGTTCGACG AACTGGGCAT GCCGAAGACC AAACGCACCA 60AGACCGGCTA CACCACGGAT GCCGACGCGC TGCAGTCGTT GTTCGACAAG ACCGGGCATC120CGTTTCTGCA ACATCTGCTC GCCCACCGCG ACGTCACCCG GCTCAAGGTC ACCGTCGACG180GGTTGCTCCA AGCGGTGGCC GCCGACGGCC GCATCCACAC CACGTTCAAC CAGACGATCG240CCGCGACCGG CCGGCTCTCC TCGACCGAAC CCAACCTGCA GAACATCCCG ATCCGCACCG300ACGCGGGCCG GCGGATCCGG GACGCGT(CG TGGTCGGGGA CGGTTACGCC GAGTTGATGA360CGGCCGACTA CAGCCAGATC GAGATGCGGA TCATGGGGCA CCTGTCCGGG GACGAGGGCC420TCATCGAGGC GTTCAACACC GGGGAGGACC TGTATTCGTT CGTCGCGTCC CGGGTGTTCG480GTGTGCCCAT CGACGAGGTC ACCGGCGAGT TGCGGCGCCG GGTCAAGGCG ATGTCCTACG540GGCTGGTTTA CGGGTTGAGC GCCTACGGCC TGTCGCAGCA GTTGAAAATC TCCACCGAGG600AAGCCAACGA GCAGATGGAC GCGTATTTCG CCCGATTCGG CGGGGTGCGC GACTACCTGC660GCGCCGTAGT CGAGCGGGCC CGCAAGGACG GCTACACCTC GACGGTGCTG GGCCGTCGCC720GCTACCTGCC CGAGCTGGAC AGCAGCAACC GTCAAGTGCG GGAGGCCGCC GAGCGGGCGG780CGCTGAACGC GCCGATCCAG GGCAGCGCGG CCGACATCAT CAAGGTGGCC ATGATCCAGG840TCGACAAGGC GCTCAACGAG GCACAGCTGG CGTCGCGCAT GCTGCTGCAG GTCCACGACG900AGCTGCTGTT CGAAATCGCC CCCGGTGAAC GCGAGCGGGT CGAGGCCCTG GTGCGCGACA960AGATGGGCGG CGCTTACCCG CTCGACGTCC CGCTGGAGGT GTCGGTGGGC TACGGCCGCA 1020GCTGGGACGC GGCGGCGCAC TGAGTGCCGA GCGTGCATCT GGGGCGGGAA TTCGGCGATT 1080TTTCCGCCCT GAGTTCACGC TCGGCGCAAT CGGGACCGAG TTTGTCCAGC GTGTACCCGT 1140CGAGTAGCCT CGTCA 1155(2)SEQ ID NO13的信息(i)序列特征(A)长度1771个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO13GAGCGCCGTC TGGTGTTTGA ACGGTTTTAC CGGTCGGCAT CGGCACGGGC GTTTGCCGGGT 60TCGGGCCTCG GGTTGGCGAT CGTCAAACAG GTGGTGCTCA ACCACGGCGG ATTGCTGCGC 120ATCGAAGACA CCGACCCAGG CGGCCAGCCC CCTGGAACGT CGATTTACGT GCTGCTCCCC 180GGCCGTCGGA TGCCGATTCC GCAGCTTCCC GGTGCGACGG CTGGCGCTCG GAGCACGGAC 240ATCGAGAACT CTCGGGGTTC GGCGAACGTT ATCTCAGTGG AATCTCAGTC CACGCGCGCA 300ACCTAGTTGT GCAGTTACTG TTGAAAGCCA CACCCATGCC AGTCCACGCA TGGCCAAGTT 360GGCCCGAGTA GTGGGCCTAG TACAGGAAGA GCAACCTAGC GACATGACGA ATCACCCACG 420GTATTCGCCA CCGCCGCAGC AGCCGGGAAC CCCAGGTTAT GCTCAGGGGC AGCAGCAAAC 480GTACAGCCAG CAGTTCGACT GGCGTTACCC ACCGTCCCCG CCCCCGCAGC CAACCCAGTA 540CCGTCAACCC TACGAGGCGT TGGGTGGTAC CCGGCCGGGT CTGATACCTG GCGTGATTCC 600GACCATGACG CCCCCTCCTG GGATGGTTCG CCAACGCCCT CGTGCAGGCA TGTTGGCCAT 660CGGCGCGGTG ACGATAGCGG TGGTGTCCGC CGGCATCGGC GGCGCGGCCG CATCCCTGGT 720CGGGTTCAAC CGGGCACCCG CCGGCCCCAG CGGCGGCCCA GTGGCTGCCA GCGCGGCGCC 780AAGCATCCCC GCAGCAAACA TGCCGCCGGG GTCGGTCGAA CAGGTGGCGG CCAAGGTGGT 840GCCCAGTGTC GTCATGTTGG AAACCGATCT GGGCCGCCAG TCGGAGGAGG GCTCCGGCAT 900CATTCTGTCT GCCGAGGGGC TGATCTTGAC CAACAACCAC GTGATCGCGG CGGCCGCCAA 960GCCTCCCCTG GGCAGTCCGC CGCCGAAAAC GACGGTAACC TTCTCTGACG GGCGGACCGC 1020ACCCTTCACG GTGGTGGGGG CTGACCCCAC CAGTGATATC GCCGTCGTCC GTGTTCAGGG 1080CGTCTCCGGG CTCACCCCGA TCTCCCTGGG TTCCTCCTCG GACCTGAGGG TCGGTCAGCC 1140GGTGCTGGCG ATCGGGTCGC CGCTCGGTTT GGAGGGCACC GTGACCACGG GGATCGTCAG 1200CGCTCTCAAC CGTCCAGTGT CGACGACCGG CGAGGCCGGC AACCAGAACA CCGTGCTGGA 1260CGCCATTCAG ACCGACGCCG CGATCAACCC CGGTAACTCC GGGGGCGCGC TGGTGAACAT 1320GAACGCTCAA CTCGTCGGAG TCAACTCGGC CATTGCCACG CTGGGCGCGG ACTCAGCCGA 1380TGCGCAGAGC GGCTCGATCG GTCTCGGTTT TGCGATTCCA GTCGACCAGG CCAAGCGCAT 1440CGCCGACGAG TTGATCAGCA CCGGCAAGGC GTCACATGCC TCCCTGGGTG TGCAGGTGAC 1500CAATGACAAA GACACCCCGG GCGCCAAGAT CGTCGAAGTA GTGGCCGGTG GTGCTGCCGC 1560GAACGCTGGA GTGCCGAAGG GCGTCGTTGT CACCAAGGTC GACGACCGCC CGATCAACAG 1620CGCGGACGCG TTGGTTGCCG CCGTGCGGTC CAAAGCGCCG GGCGCCACGG TGGCGCTAAC 1680CTTTCAGGAT CCCTCGGGCG GTAGCCGCAC AGTGCAAGTC ACCCTCGGCA AGGCGGAGCA 1740GTGATGAAGG TCGCCGCGCA GTGTTCAAAG C1771(2)SEQ ID NO14的信息(i)序列特征(A)长度1058个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO14CTCCACCGCG GTGGCGGCCG CTCTAGAACT AGTGGATCCC CCGGGCTGCA GGAATTCGGC 60ACGAGGATCC GACGTCGCAG GTTGTCGAAC CCGCCGCCGC GGAAGTATCG GTCCATGCCT 120AGCCCGGCGA CGGCGAGCGC CGGAATGGCG CGAGTGAGGA GGCGGGCAAT TTGGCGGGGC 180CCGGCGACGG CGAGCGCCGG AATGGCGCGA GTGAGGAGGC GGGCAGTCAT GCCCAGCGTG 240ATCCAATCAA CCTGCATTCG GCCTGCGGGC CCATTTGACA ATCGAGGTAG TGAGCGCAAA 300TGAATGATGG AAAACGGGCG GTGACGTCCG CTGTTCTGGT GGTGCTAGGT GCCTGCCTGG 360CGTTGTGGCT ATCAGGATGT TCTTCGCCGA AACCTGATGC CGAGGAACAG GGTGTTCCCG 420TGAGCCCGAC GGCGTCCGAC CCCGCGCTCC TCGCCGAGAT CAGGCAGTCG CTTGATGCGA 480CAAAAGGGTT GACCAGCGTG CACGTAGCGG TCCGAACAAC CGGGAAAGTC GACAGCTTGC 540TGGGTATTAC CAGTGCCGAT GTCGACGTCC GGGCCAATCC GCTCGCGGCA AAGGGCGTAT 600GCACCTACAA CGACGAGCAG GGTGTCCCGT TTCGGGTACA AGGCGACAAC ATCTCGGTGA 660AACTGTTCGA CGACTGGAGC AATCTCGGCT CGATTTCTGA ACTGTCAACT TCACGCGTGC 720TCGATCCTGC CGCTGGGGTG ACGCAGCTGC TGTCCGGTGT CACGAACCTC CAAGCGCAAG 780GTACCGAAGT GATAGACGGA ATTTCGACCA CCAAAATCAC CGGGACCATC CCCGCGAGCT 840CTGTCAAGAT GCTTGATCCT GGCGCCAAGA GTGCAAGGCC GGCGACCGTG TGGATTGCCC 900AGGACGGCTC GCACCACCTC GTCCGAGCGA GCATCGACCT CGGATCCGGG TCGATTCAGC 960TCACGCAGTC GAAATGGAAC GAACCCGTCA ACGTCGACTA GGCCGAAGTT GCGTCGACGC 1020GTTGNTCGAA ACGCCCTTGT GAACGGTGTC AACGGNAC 1058(2)SEQ ID NO15的信息(i)序列特征(A)长度542个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO15GAATTCGGCA CGAGAGGTGA TCGACATCAT CGGGACCAGC CCCACATCCT GGGAACAGGC 60GGCGGCGGAG GCGGTCCAGC GGGCGCGGGA TAGCGTCGAT GACATCCGCG TCGCTCGGGT 120CATTGAGCAG GACATGGCCG TGGACAGCGC CGGCAAGATC ACCTACCGCA TCAAGCTCGA 180AGTGTCGTTC AAGATGAGGC CGGCGCAACC GCGCTAGCAC GGGCCGGCGA GCAAGACGCA 240AAATCGCACG GTTTGCGGTT GATTCGTGCG ATTTTGTGTC TGCTCGCCGA GGCCTACCAG 300GCGCGGCCCA GGTCCGCGTG CTGCCGTATC CAGGCGTGCA TCGCGATTCC GGCGGCCACG 360CCGGAGTTAA TGCTTCGCGT CGACCCGAAC TGGGCGATCC GCCGGNGAGC TGATCGATGA 420CCGTGGCCAG CCCGTCGATG CCCGAGTTGC CCGAGGAAAC GTGCTGCCAG GCCGGTAGGA 480AGCGTCCGTA GGCGGCGGTG CTGACCGGCT CTGCCTGCGC CCTCAGTGCG GCCAGCGAGC 540GG 542(2)SEQ ID NO16的信息(i)序列特征(A)长度913个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO16CGGTGCCGCC CGCGCCTCCG TTGCCCCCAT TGCCGCCGTC GCCGATCAGC TGCGCATCGC 60CACCATCACC GCCTTTGCCG CCGGCACCGC CGGTGGCGCC GGGGCCGCCG ATGCCACCGC 120TTGACCCTGG CCGCCGGCGC CGCCATTGCC ATACAGCACC CCGCCGGGGG CACCGTTACC 180GCCGTCGCCA CCGTCGCCGC CGCTGCCGTT TCAGGCCGGG GAGGCCGAAT GAACCGCCGC 240CAAGCCCGCC GCCGGCACCG TTGCCGCCTT TTCCGCCCGC CCCGCCGGCG CCGCCAATTG 300CCGAACAGCC AMGCACCGTT CCGCCAGCC CCGCCGCCGT TAACGGCGCT GCCGGGCGCC 360GCCGCCGGAC CCGCCATTAC CGCCGTTCCC GTTCGGTGCC CCGCCGTTAC CGGCGCCGCC 420GTTTGCCGCC AATATTCGGC GGGCACCGCC AGACCCGCCG GGGCCACCAT TGCCGCCGGG 480CACCGAAACA ACAGCCCAAC GGTGCCGCCG GCCCCGCCGT TTGCCGCCAT CACCGGCCAT 540TCACCGCCAG CACCGCCGTT AATGTTTATG AACCCGGTAC CGCCAGCGCG GCCCCTATTG 600CCGGGCGCCG GAGNGCGTGC CCGCCGGCGC CGCCAACGCC CAAAAGCCCG GGGTTGCCAC 660CGGCCCCGCC GGACCCACCG GTCCCGCCGA TCCCCCCGTT GCCGCCGGTG CCGCCGCCAT 720TGGTGCTGCT GAAGCCGTTA GCGCCGGTTC CGCSGGTTCC GGCGGTGGCG CCNTGGCCGC 780CGGCCCCGCC GTTGCCGTAC AGCCACCCCC CGGTGGCGCC GTTGCCGCCA TTGCCGCCAT 840TGCCGCCGTT GCCGCCATTG CCGCCGTTCC CGCCGCCACC GCCGGNTTGG CCGCCGGCGC 900CGCCGGCGGC CGC 913(2)SEQ ID NO17的信息(i)序列特征(A)长度1872个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO17GACTACGTTG GTGTAGAAAA ATCCTGCCGC CCGGACCCTT AAGGCTGGGA CAA1TTCTGA 60TAGCTACCCC GACACAGGAG GTTACGGGAT GAGCAATTCG CGCCGCCGCT CACTCAGGTG 120GTCATGGTTG CTGAGCGTGC TGGCTGCCGT CGGGCTGGGC CTGGCCACGG CGCCGGCCCA 180GGCGGCCCCG CCGGCCTTGT CGCAGGACCG GTTCGCCGAC TTCCCCGCGC TGCCCCTCGA 240CCCGTCCGCG ATGGTCGCCC AAGTGGCGCC ACAGGTGGTC AACATCAACA CCAAACTGGG 300CTACAACAAC GCCGTGGGCG CCGGGACCGG CATCGTCATC GATCCCAACG GTGTCGTGCT 360GACCAACAAC CACGTGATCG CGGGCGCCAC CGACATCAAT GCGTTCAGCG TCGGCTCCGG 420CCAAACCTAC GGCGTCGATG TGGTCGGGTA TGACCGCACC CAGGATGTCG CGGTGCTGCA 480GCTGCGCGGT GCCGGTGGCC TGCCGTCGGC GGCGATCGGT GGCGGCGTCG CGGTTGGTGA 540GCCCGTCGTC GCGATGGGCA ACAGCGGTGG GCAGGGCGGA ACGCCCCGTG CGGTGCCTGG 600CAGGGTGGTC GCGCTCGGCC AAACCGTGCA GGCGTCGGAT TCGCTGACCG GTGCCGAAGA 660GACATTGAAC GGGTTGATCC AGTTCGATGC CGCAATCCAG CCCGGTGATT CGGGCGGGCC 720CGTCGTCAAC GGCCTAGGAC AGGTGGTCGG TATGAACACG GCCGCGTCCG ATAACTTCCA 780GCTGTCCCAG GGTGGGCAGG GATTCGCCAT TCCGATCGGG CAGGCGATGG CGATCGCGGG 840CCAAATCCGA TCGGGTGGGG GGTCACCCAC CGTTCATATC GGGCCTACCG CCTTCCTCGG 900CTTGGGTGTT GTCGACAACA ACGGCAACGG CGCACGAGTC CAACGCGTGG TCGGAAGCGC 960TCCGGCGGCA AGTCTCGGCA TCTCCACCGG CGACGTGATC ACCGCGGTCG ACGGCGCTCC 1020GATCAACTCG GCCACCGCGA TGGCGGACGC GCTTAACGGG CATCATCCCG GTGACGTCAT 1080CTCGGTGAAC TGGCAAACCA AGTCGGGCGG CACGCGTACA GGGAACGTGA CATTGGCCGA 1140GGGACCCCCG GCCTGATTTG TCGCGGATAC CACCCGCCGG CCGGCCAATT GGATTGGCGC 1200CAGCCGTGAT TGCCGCGTGA GCCCCCGAGT TCCGTCTCCC GTGCGCGTGG CATTGTGGAA 1260GCAATGAACG AGGCAGAACA CAGCGTTGAG CACCCTCCCG TGCAGGGCAG TTACGTCGAA 1320GGCGGTGTGG TCGAGCATCC GGATGCCAAG GACTTCGGCA GCGCCGCCGC CCTGCCCGCC 1380GATCCGACCT GGTTTAAGCA CGCCGTCTTC TACGAGGTGC TGGTCCGGGC GTTCTTCGAC 1440GCCAGCGCGG ACGGTTCCGN CGATCTGCGT GGACTCATCG ATCGCCTCGA CTACCTGCAG 1500TGGCTTGGCA TCGACTGCAT CTGTTGCCGC CGTTCCTACG ACTCACCGCT GCGCGACGGC 1560GGTTACGACA TTCGCGACTT CTACAAGGTG CTGCCCGAAT TCGGCACCGT CGACGATTTC 1620GTCGCCCTGG TCGACACCGC TCACCGGCGA GGTATCCGCA TCATCACCGA CCTGGTGATG 1680AATCACACCT CGGAGTCGCA CCCCTGGTTT CAGGAGTCCC GCCGCGACCC AGACGGACCG 1740TACGGTGACT ATTACGTGTG GAGCGACACC AGCGAGCGCT ACACCGACGC CCGGATCATC 1800TTCGTCGACA CCGAAGAGTC GAACTGGTCA TTCGATCCTG TCCGCCGACA GTTNCTACTG 1860GCACCGATTC TT 1872(2)SEQ ID NO18的信息(i)序列特征(A)长度1482个碱基对(B)类型核酸(C)链型单链
(D)拓扑结构线型(xi)序列描述SEQ ID NO18CTTCGCCGAA ACCTGATGCC GAGGAACAGG GTGTTCCCGT GAGCCCGACG GCGTCCGACC 60CCGCGCTCCT CGCCGAGATC AGGCAGTCGC TTGATGCGAC AAAAGGGTTG ACCAGCGTGC 120ACGTAGCGGT CCGAACAACC GGGAAAGTCG ACAGCTTGCT GGGTATTACC AGTGCCGATG 180TCGACGTCCG GGCCAATCCG CTCGCGGCAA AGGGCGTATG CACCTACAAC GACGAGCAGG 240GTGTCCCGTT TCGGGTACAA GGCGACAACA TCTCGGTGAA ACTGTTCGAC GACTGGAGCA 300ATCTCGGCTC GATTTCTGAA CTGTCAACTT CACGCGTGCT CGATCCTGCC GCTGGGGTGA 360CGCAGCTGCT GTCCGGTGTC ACGAACCTCC AAGCGCAAGG TACCGAAGTG ATAGACGGAA 420TTTCGACCAC CAAAATCACC GGGACCATCC CCGCGAGCTC TGTCAAGATG CTTGATCCTG 480GCGCCAAGAG TGCAAGGCCG GCGACCGTGT GGATTGCCCA GGACGGCTCG CACCACCTCG 540TCCGAGCGAG CATCGACCTC GGATCCGGGT CGATTCAGCT CACGCAGTCG AAATGGAACG 600AACCCGTCAA CGTCGACTAG GCCGAAGTTG CGTCGACGCG TTGCTCGAAA CGCCCTTGTG 660AACGGTGTCA ACGGCACCCG AAAACTGACC CCCTGACGGC ATCTGAAAAT TGACCCCCTA 720GACCGGGCGG TTGGTGGTTA TTCTTCGGTG GTTCCGGCTG GTGGGACGCG GCCGAGGTCG 780CGGTCTTTGA GCCGGTAGCT GTCGCCTTTG AGGGCGACGA CTTCAGCATG GTGGACGAGG 840CGGTCGATCA TGGCGGCAGC AACGACGTCG TCGCCGCCGA AAACCTCGCC CCACCGGCCG 900AAGGCCTTAT TGGACGTGAC GATCAAGCTG GCCCGCTCAT ACCGGGAGGA CACCAGCTGG 960AAGAAGAGGT TGGCGGCCTC GGGCTCAAAC GGAATGTAAC CGACTTCGTC AACCACCAGG 1020AGCGGATAGC GGCCAAACCG GGTGAGTTCG GCGTAGATGC GCCCGGCGTG GTGAGCCTCG 1080GCGAACCGTG CTACCCATTC GGCGGCGGTG GCGAACAGCA CCCGATGACC GGCCTGACAC 1140GCGCGTATCG CCAGGCCGAC CGCAAGATGA GTCTTCCCGG TGCCAGGCGG GGCCCAAAAA 1200CACGACGTTA TCGCGGGCGG TGATGAAATC CAGGGTGCCC AGATGTGCGA TGGTGTCGCG 1260TTTGAGGCCA CGAGCATGCT CAAAGTCGAA CTCTTCCAAC GACTTCCGAA CCGGGAAGCG 1320GGCGGCGCGG ATGCGGCCCT CACCACCATG GGACTCCCGG GCTGACACTT CCCGCTGCAG 1380GCAGGCGGCC AGGTATTCTT CGTGGCTCCA GTTCTCGGCG CGGGCGCGAT CGGCCAGCCG 1440GGACACTGAC TCACGCAGGG TGGGAGCTTT CAATGCTCTT GT 1482(2)SEQ ID NO19的信息(i)序列特征(A)长度876个碱基对(B)类型核酸
(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO19GAATTCGGCA CGAGCCGGCG ATAGCTTCTG GGCCGCGGCC GACCAGATGG CTCGAGGGTT 60CGTGCTCGGG GCCACCGCCG GGCGCACCAC CCTGACCGGT GAGGGCCTGC AACACGCCGA 120CGGTCACTCG TTGCTGCTGG ACGCCACCAA CCCGGCGGTG GTTGCCTACG ACCCGGCCTT 180CGCCTACGAA ATCGGCTACA TCGNGGAAAG CGGACTGGCC AGGATGTGCG GGGAGAACCC 240GGAGAACATC TTCTTCTACA TCACCGTCTA CAACGAGCCG TACGTGCAGC CGCCGGAGCC 300GGAGAACTTC GATCCCGAGG GCGTGCTGGG GGGTATCTAC CGNTATCACG CGGCCACCGA 360GCAACGCACC AACAAGGNGC AGATCCTGGC CTCCGGGGTA GCGATGCCCG CGGCGCTGCG 420GGCAGCACAG ATGCTGGCCG CCGAGTGGGA TGTCGCCGCC GACGTGTGGT CGGTGACCAG 480TTGGGGCGAG CTAAACCGCG ACGGGGTGGT CATCGAGACC GAGAAGCTCC GCCACCCCGA 540TCGGCCGGCG GGCGTGCCCT ACGTGACGAG AGCGCTGGAG AATGCTCGGG GCCCGGTGAT 600CGCGGTGTCG GACTGGATGC GCGCGGTCCC CGAGCAGATC CGACCGTGGG TGCCGGGCAC 660ATACCTCACG TTGGGCACCG ACGGGTTCGG TTTTTCCGAC ACTCGGCCCG CCGGTCGTCG 720TTACTTCAAC ACCGACGCCG AATCCCAGGT TGGTCGCGGT TTTGGGAGGG GTTGGCCGGG 780TCGACGGGTG AATATCGACC CATTCGGTGC CGGTCGTGGG CCGCCCGCCC AGTTACCCGG 840ATTCGACGAA GGTGGGGGGT TGCGCCCGAN TAAGTT876(2)SEQ TD NO20的信息(i)序列特征(A)长度1021个碱基对(B)类型核酸
(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO20ATCCCCCCGG GCTGCAGGAA TTCGGCACGA GAGACAAAAT TCCACGCGTT AATGCAGGAA60CAGATTCATA ACGAATTCAC AGCGGCACAA CAATATGTCG CGATCGCGGT TTATTTCGAC 120AGCGAAGACC TGCCGCAGTT GGCGAAGCAT TTTTACAGCC AAGCGGTCGA GGAACGAAAC 180CATGCAATGA TGCTCGTGCA ACACCTGCTC GACCGCGACC TTCGTGTCGA AATTCCCGGC 240GTAGACACGG TGCGAAACCA GTTCGACAGA CCCCGCGAGG CACTGGCGCT GGCGCTCGAT 300CAGGAACGCA CAGTCACCGA CCAGGTCGGT CGGCTGACAG CGGTGGCCCG CGACGAGGGC 360GATTTCCTCG GCGAGCAGTT CATGCAGTGG TTCTTGCAGG AACAGATCGA AGAGGTGGCC 420TTGATGGCAA CCCTGGTGCG GGTTGCCGAT CGGGCCGGGG CCAACCTGTT CGAGCTAGAG 480AACTTCGTCG CACGTGAAGT GGATGTGGCG CCGGCCGCAT CAGGCGCCCC GCACGCTGCC 540GGGGGCCGCC TCTAGATCCC TGGGGGGGAT CAGCGAGTGG TCCCGTTCGC CCGCCCGTCT 600TCCAGCCAGG CCTTGGTGCG GCCGGGGTGG TGAGTACCAA TCCAGGCCAC CCCGACCTCC 660CGGNAAAAGT CGATGTCCTC GTACTCATCG ACGTTCCAGG AGTACACCGC CCGGCCCTGA 720GCTGCCGAGC GGTCAACGAG TTGCGGATAT TCCTTTAACG CAGGCAGTGA GGGTCCCACG 780GCGGTTGGCC CGACCGCCGT GGCCGCACTG CTGGTCAGGT ATCGGGGGGT CTTGGCGAGC 840AACAACGTCG GCAGGAGGGG TGGAGCCCGC CGGATCCGCA GACCGGGGGG GCGAAAACGA 900CATCAACACC GCACGGGATC GATCTGCGGA GGGGGGTGCG GGAATACCGA ACCGGTGTAG 960GAGCGCCAGC AGTTGTTTTT CCACCAGCGA AGCGTTTTCG GGTCATCGGN GGCNNTTAAG 1020T 1021(2)SEQ ID NO21的信息(i)序列特征(A)长度321个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO21CGTGCCGACG AACGGAAGAA CACAACCATG AAGATGGTGA AATCGATCGC CGCAGGTCTG 60ACCGCCGCGG CTGCAATCGG CGCCGCTGCG GCCGGTGTGA CTTCGATCAT GGCTGGCGGN 120CCGGTCGTAT ACCAGATGCA GCCGGTCGTC TTCGGCGCGC CACTGCCGTT GGACCCGGNA 180TCCGCCCCTG ANGTCCCGAC CGCCGCCCAG TGGACCAGNC TGCTCAACAG NCTCGNCGAT 240CCCAACGTGT CGTTTGNGAA CAAGGGNAGT CTGGTCGAGG GNGGNATCGG NGGNANCGAG 300GGNGNGNATC GNCGANCACA A321(2)SEQ ID NO22的信息(i)序列特征(A)长度373个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO22TCTTATCGGT TCCGGTTGGC GACGGGTTTT GGGNGCGGGT GGTTAACCCG CTCGGCCAGC 60CGATCGACGG GCGCGGAGAC GTCGACTCCG ATACTCGGCG CGCGCTGGAG CTCCAGGCGC 120CCTCGGTGGT GNACCGGCAA GGCGTGAAGG AGCCGTTGNA GACCGGGATC AAGGCGATTG 180ACGCGATGAC CCCGATCGGC CGCGGGCAGC GCCAGCTGAT CATCGGGGAC CGCAAGACCG 240GCAAAAACCG CCGTCTGTGT CGGACACCAT CCTCAAACCA GCGGGAAGAA CTGGGAGTCC 300GGTGGATCCC AAGAAGCAGG TGCGCTTGTG TATACGTTGG CCATCGGGCA AGAAGGGGAA 360CTTACCATCG CCG 373(2)SEQ ID NO23的信息(i)序列特征(A)长度352个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO23GTGACGCCGT GATGGGATTC CTGGGCGGGG CCGGTCCGCT GGCGGTGGTG GATCAGCAAC 60TGGTTACCCG GGTGCCGCAA GGCTGGTCGT TTGCTCAGGC AGCCGCTGTG CCGGTGGTGT 120TCTTGACGGC CTGGTACGGG TTGGCCGATT TAGCCGAGAT CAAGGCGGGC GAATCGGTGC 180TGATCCATGC CGGTACCGGC GGTGTGGGCA TGGCGGCTGT GCAGCTGGCT CGCCAGTGGG 240GCGTGGAGGT TTTCGTCACC GCCAGCCGTG GNAAGTGGGA CACGCTGCGC GCCATNGNGT 300TTGACGACGA NCCATATCGG NGATTCCCNC ACATNCGAAG TTCCGANGGA GA 352(2)SEQ ID NO24的信息(i)序列特征(A)长度726个碱基对(B)类型核酸
(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO24GAAATCCGCG TTCATTCCGT TCGACCAGCG GCTGGCGATA ATCGACGAAG TGATCAAGCC 60GCGGTTCGCG GCGCTCATGG GTCACAGCGA GTAATCAGCA AGTTCTCTGG TATATCGCAC 120CTAGCGTCCA GTTGCTTGCC AGATCGCTTT CGTACCGTCA TCGCATGTAC CGGTTCGCGT 180GCCGCACGCT CATGCTGGCG GCGTGCATCC TGGCCACGGG TGTGGCGGGT CTCGGGGTCG 240GCGCGCAGTC CGCAGCCCAA ACCGCGCCGG TGCCCGACTA CTACTGGTGC CCGGGGCAGC 300CTTTCGACCC CGCATGGGGG CCCAACTGGG ATCCCTACAC CTGCCATGAC GACTTCCACC 360GCGACAGCGA CGGCCCCGAC CACAGCCGCG ACTACCCCGG ACCCATCCTC GAAGGTCCCG 420TGCTTGACGA TCCCGGTGCT GCGCCGCCGC CCCCGGCTGC CGGTGGCGGC GCATAGCGCT 480CGTTGACCGG GCCGCATCAG CGAATACGCG TATAAACCCG GGCGTGCCCC CGGCAAGCTA 540CGACCCCCGG CGGGGCAGAT TTACGCTCCC GTGCCGATGG ATCGCGCCGT CCGATGACAG 600AAAATAGGCG ACGGTTTTGG CAACCGCTTG GAGGACGCTT GAAGGGAACC TGTCATGAAC 660GGCGACAGCG CCTCCACCAT CGACATCGAC AAGGTTGTTA CCCGCACACC CGTTCGCCGG 720ATCGTG 726(2)SEQ ID NO25的信息(i)序列特征(A)长度580个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO25CGCGACGACG ACGAACGTCG GGCCCACCAC CGCCTATGCG TTGATGCAGG CGACCGGGAT 60GGTCGCCGAC CATATCCAAG CATGCTGGGT GCCCACTGAG CGACCTTTTG ACCAGCCGGG 120CTGCCCGATG GCGGCCCGGT GAAGTCATTG CGCCGGGGCT TGTGCACCTG ATGAACCCGA 180ATAGGGAACA ATAGGGGGGT GATTTGGCAG TTCAATGTCG GGTATGGCTG GAAATCCAAT 240GGCGGGGCAT GCTCGGCGCC GACCAGGCTC GCGCAGGCGG GCCAGCCCGA ATCTGGAGGG 300AGCACTCAAT GGCGGCGATG AAGCCCCGGA CCGGCGACGG TCCTTTGGAA GCAACTAAGG 360AGGGGCGCGG CATTGTGATG CGAGTACCAC TTGAGGGTGG CGGTCGCCTG GTCGTCGAGC 420TGACACCCGA CGAAGCCGCC GCACTGGGTG ACGAACTCAA AGGCGTTACT AGCTAAGACC 480AGCCCAACGG CGAATGGTCG GCGTTACGCG CACACCTTCC GGTAGATGTC CAGTGTCTGC 540TCGGCGATGT ATGCCCAGGA GAACTCTTGG ATACAGCGCT580(2)SEQ ID NO26的信息(i)序列特征(A)长度160个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO26AACGGAGGCG CCGGGGGTTT TGGCGGGGCC GGGGCGGTCG GCGGCAACGG CGGGGCCGGC 60GGTACCGCCG GGTTGTTCGG TGTCGGCGGG GCCGGTGGGG CCGGAGGCAA CGGCATCGCC 120GGTGTCACGG GTACGTCGGC CAGCACACCG GGTGGATCCG160(2)SEQ ID NO27的信息(i)序列特征(A)长度272个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO27GACACCGATA CGATGGTGAT GTACGCCAAC GTTGTCGACA CGCTCGAGGC GTTCACGATC 60CAGCGCACAC CCGACGGCGT GACCATCGGC GATGCGGCCC CGTTCGCGGA GGCGGCTGCC 120AAGGCGATGG GAATCGACAA GCTGCGGGTA ATTCATACCG GAATGGACCC CGTCGTCGCT 180GAACGCGAAC AGTGGGACGA CGGCAACAAC ACGTTGGCGT TGGCGCCCGG TGTCGTTGTC 240GCCTACGAGC GCAACGTACA GACCAACGCC CG272(2)SEQ ID NO28的信息(i)序列特征(A)长度 317个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO28GCAGCCGGTG GTTCTCGGAC TATCTGCGCA CGGTGACGCA GCGCGACGTG CGCGAGCTGA 60AGCGGATCGA GCAGACGGAT CGCCTGCCGC GGTTCATGCG CTACCTGGCC GCTATCACCG 120CGCAGGAGCT GAACGTGGCC GAAGCGGCGC GGGTCATCGG GGTCGACGCG GGGACGATCC 180GTTCGGATCT GGCGTGGTTC GAGACGGTCT ATCTGGTACA TCGCCTGCCC GCCTGGTCGC 240GGAATCTGAC CGCGAAGATC AAGAAGCGGT CAAAGATCCA CGTCGTCGAC AGTGGCTTCG 300CGGCCTGGTT GCGCGGG317(2)SEQ ID NO29的信息(i)序列特征(A)长度182个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO29GATCGTGGAG CTGTCGATGA ACAGCGTTGC CGGACGCGCG GCGGCCAGCA CGTCGGTGTA 60GCAGCGCCGG ACCACCTCGC CGGTGGGCAG CATGGTGATG ACCACGTCGG CCTCGGCCAC 120CGCTTCGGGC GCGCTACGAA ACACCGCGAC ACCGTGCGCG GCGGCGCCGG ACGCCGCCGT 180GG 182(2)SEQ ID NO30的信息(i)序列特征(A)长度308个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO30GATCGCGAAG TTTGGTGAGC AGGTGGTCGA CGCGAAAGTC TGGGCGCCTG CGAAGCGGGT 60CGGCGTTCAC GAGGCGAAGA CACGCCTGTC CGAGCTGCTG CGGCTCGTCT ACGGCGGGCA 120GAGGTTGAGA TTGCCCGCCG CGGCGAGCCG GTAGCAAAGC TTGTGCCGCT GCATCCTCAT 180GAGACTCGGC GGTTAGGCAT TGACCATGGC GTGTACCGCG TGCCCGACGA TTTGGACGCT 240CCGTTGTCAG ACGACGTGCT CGAACGCTTT CACCGGTGAA GCGCTACCTC ATCGACACCC 300ACGTTTGG 308(2)SEQ ID NO31的信息(i)序列特征(A)长度267个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO31CCGACGACGA GCAACTCACG TGGATGATGG TCGGCAGCGG CATTGAGGAC GGAGAGAATC 60CGGCCGAAGC TGCCGCGCGG CAAGTGCTCA TAGTGACCGG CCGTAGAGGG CTCCCCCGAT 120GGCACCGGAC TATTCTGGTG TGCCGCTGGC CGGTAAGAGC GGGTAAAAGA ATGTGAGGGG 180ACACGATGAG CAATCACACC TACCGAGTGA TCGAGATCGT CGGGACCTCG CCCGACGGCG 240TCGACGCGGC AATCCAGGGC GGTCTGG 267(2)SEQ ID NO32的信息(i)序列特征(A)长度189个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO32CTCGTGCCGA AAGAATGTGA GGGGACACGA TGAGCAATCA CACCTACCGA GTGATCGAGA 60TCGTCGGGAC CTCGCCCGAC GGCGTCGACG CGGCAATCCA GGGCGGTCTG GCCCGAGCTG 120CGCAGACCAT GCGCGCGCTG GACTGGTTCG AAGTACAGTC AATTCGAGGC CACCTGGTCG 180ACGGAGCGG 189(2)SEQ ID NO33的信息(i)序列特征(A)长度851个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO33CTGCAGGGTG GCGTGGATGA GCGTCACCGC GGGGCAGGCC GAGCTGACCG CCGCCCAGGT 60CCGGGTTGCT GCGGCGGCCT ACGAGACGGC GTATGGGCTG ACGGTGCCCC CGCCGGTGAT 120CGGCGAGAAC CGTGCTGAAC TGATGATTCT GATAGCGACC AACCTCTTGG GGCAAAACAC 180CCCGGCGATC GCGGTCAACG AGGCCGAATA CGGCGAGATG TGGGCCCAAG ACGCCGCCGC 240GATGTTTGGC TACGCCGCGG CGACGGCGAC GGCGACGGCG ACGTTGCTGC CGTTCGAGGA 300GGCGCCGGAG ATGACCAGCG CGGGTGGGCT CCTCGAGCAG GCCGCCGCGG TCGAGGAGGC 360CTCCGACACC GCCGCGGCGA ACCAGTTGAT GAACAATGTG CCCCAGGCGC TGAAACAGTT 420GGCCCAGCCC ACGCAGGGCA CCACGCCTTC TTCCAAGCTG GGTGGCCTGT GGAAGACGGT 480CTCGCCGCAT CGGTCGCCGA TCAGCAACAT GGTGTCGATG GCCAACAACC ACATGTCGAT 540GACCAACTCG GGTGTGTCGA TGACCAACAC CTTGAGCTCG ATGTTGAAGG GCTTTGCTCC 600GGCGGCGGCC GCCCAGGCCG TGCAAACCGC GGCGCAAAAC GGGGTCCGGG CGATGAGCTC 660GCTGGGCAGC TCGCTGGGTT CTTCGGGTCT GGGCGGTGGG GTGGCCGCCA ACTTGGGTCG 720GGCGGCCTCG GTACGGTATG GTCACCGGGA TGGCGGAAAA TATGCANAGT CTGGTCGGCG 780GAACGGTGGT CCGGCGTAAG GTTTACCCCC GTTTTCTGGA TGCGGTGAAC TTCGTCAACG 840GAAACAGTTA C 851(2)SEQ ID NO34的信息(i)序列特征(A)长度254个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO34GATCGATCGG GCGGAAATTT GGACCAGATT CGCCTCCGGC GATAACCCAA TCAATCGAAC 60CTAGATTTAT TCCGTCCAGG GGCCCGAGTA ATGGCTCGCA GGAGAGGAAC CTTACTGCTG 120CGGGCACCTG TCGTAGGTCC TCGATACGGC GGAAGGCGTC GACATTTTCC ACCGACACCC 180CCATCCAAAC GTTCGAGGGC CACTCCAGCT TGTGAGCGAG GCGACGCAGT CGCAGGCTGC 240GCTTGGTCAA GATC254(2)SEQ ID NO35的信息(i)序列特征(A)长度408个碱基对(B)类型核酸(C)链型单链
(D)拓扑结构线型(xi)序列描述SEQ ID NO35CGGCACGAGG ATCCTGACCG AAGCGGCCGC CGCCAAGGCG AAGTCGCTGT TGGACCAGGA 60GGGACGGGAC GATCTGGCGC TGCGGATCGC GGTTCAGCCG GGGGGGTGCG CTGGATTGCG 120CTATAACCTT TTCTTCGACG ACCGGACGCT GGATGGTGAC CAAACCGCGG AGTTCGGTGG 180TGTCAGGTTG ATCGTGGACC GGATGAGCGC GCCGTATGTG GAAGGCGCGT CGATCGATTT 240CGTCGACACT ATTGAGAAGC AAGGNTTCAC CATCGACAAT CCCAACGCCA CCGGCTCCTG 300CGCGTGCGGG GATTCGTTCA ACTGATAAAA CGCTAGTACG ACCCCGCGGT GCGCAACACG 360TACGAGCACA CCAAGACCTG ACCGCGCTGG AAAAGCAACT GAGCGATG 408(2)SEQ ID NO36的信息(i)序列特征(A)长度181个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO36GCGGTGTCGG CGGATCCGGC GGGTGGTTGA ACGGCAACGG CGGGGCCGGC GGGGCCGGCG 60GGACCGGCGC TAACGGTGGT GCCGGCGGCA ACGCCTGGTT GTTCGGGGCC GGCGGGTCCG 120GCGGNGCCGG CACCAATGGT GGNGTCGGCG GGTCCGGCGG ATTTGTCTAC GGCAACGGCG 180G 181(2)SEQ ID NO37的信息(i)序列特征(A)长度290个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO37GCGGTGTCGG CGGATCCGGC GGGTGGTTGA ACGGCAACGG CGGTGTCGGC GGCCGGGGCG 60GCGACGGCGT CTTTGCCGGT GCCGGCGGCC AGGGCGGCCT CGGTGGGCAG GGCGGCAATG 120GCGGCGGCTC CACCGGCGGC AACGGCGGTC TTGGCGGCGC GGGCGGTGGC CGAGGCAACG 180CCCCGGACGG CGGCTTCGGT GGCAACGGCG GTAAGGGTGG CCAGGGCGGN ATTGGCGGCG 240GCACTCAGAG CGCGACCGGC CTCGGNGGTG ACGGCGGTGA CGGCGGTGAC 290(2)SEQ ID NO38的信息(i)序列特征(A)长度34个减基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO38GATCCAGTGG CATGGNGGGT GTCAGTGGAA GCAT 34(2)SEQ ID NO39的信息(i)序列特征(A)长度155个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO39GATCGCTGCT CGTCCCCCCC TTGCCGCCGA CGCCACCGGT CCCACCGTTA CCGAACAAGC 60TGGCGTGGTC GCCAGCACCC CCGGCACCGC CGACGCCGGA GTCGAACAAT GGCACCGTCG 120TATCCCCACC ATTGCCGCCG GNCCCACCGG CACCG 155(2)SEQ ID NO40的信息(i)序列特征(A)长度53个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO40ATGGCGTTCA CGGGGCGCCG GGGACCGGGC AGCCCGGNGG GGCCGGGGGG TGG 53(2)SEQ ID NO41的信息(i)序列特征(A)长度132个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO41GATCCACCGC GGGTGCAGAC GGTGCCCGCG GCGCCACCCC GACCAGCGGC GGCAACGGCG 60GCACCGGCGG CAACGGCGCG AACGCCACCG TCGTCGGNGG GGCCGGCGGG GCCGGCGGCA 120AGGGCGGCAA CG 132(2)SEQ ID NO42的信息(i)序列特征(A)长度132个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO42GATCGGCGGC CGGNACGGNC GGGGACGGCG GCAAGGGCGG NAACGGGGGC GCCGNAGCCA 60CCNGCCAAGA ATCCTCCGNG TCCNCCAATG GCGCGAATGG CGGACAGGGC GGCAACGGCG 120GCANCGGCGG CA 132(2)SEQ ID NO43的信息(i)序列特征(A)长度702个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO43CGGCACGAGG ATCGGTACCC CGCGGCATCG GCAGCTGCCG ATTCGCCGGG TTTCCCCACC 60CGAGGAAAGC CGCTACCAGA TGGCGCTGCC GAAGTAGGGC GATCCGTTCG CGATGCCGGC 120ATGAACGGGC GGCATCAAAT TAGTGCAGGA ACCTTTCAGT TTAGCGACGA TAATGGCTAT 180AGCACTAAGG AGGATGATCC GATATGACGC AGTCGCAGAC CGTGACGGTG GATCAGCAAG 240AGATTTTGAA CAGGGCCAAC GAGGTGGAGG CCCCGATGGC GGACCCACCG ACTGATGTCC 300CCATCACACC GTGCGAACTC ACGGNGGNTA AAAACGCCGC CCAACAGNTG GTNTTGTCCG 360CCGACAACAT GCGGGAATAC CTGGCGGCCG GTGCCAAAGA GCGGCAGCGT CTGGCGACCT 420CGCTGCGCAA CGCGGCCAAG GNGTATGGCG AGGTTGATGA GGAGGCTGCG ACCGCGCTGG 480ACAACGACGG CGAAGGAACT GTGCAGGCAG AATCGGCCGG GGCCGTCGGA GGGGACAGTT 540CGGCCGAACT AACCGATACG CCGAGGGTGG CCACGGCCGG TGAACCCAAC TTCATGGATC 600TCAAAGAAGC GGCAAGGAAG CTCGAAACGG GCGACCAAGG CGCATCGCTC GCGCACTGNG 660GGGATGGGTG GAACACTTNC ACCCTGACGC TGCAAGGCGA CG 702(2)SEQ ID NO44的信息(i)序列特征(A)长度298个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO44GAAGCCGCAG CGCTGTCGGG CGACGTGGCG GTCAAAGCGG CATCGCTCGG TGGCGGTGGA 60GGCGGCGGGG TGCCGTCGGC GCCGTTGGGA TCCGCGATCG GGGGCGCCGA ATCGGTGCGG 120CCCGCTGGCG CTGGTGACAT TGCCGGCTTA GGCCAGGGAA GGGCCGGCGG CGGCGCCGCG 180CTGGGCGGCG GTGGCATGGG AATGCCGATG GGTGCCGCGC ATCAGGGACA AGGGGGCGCC 240AAGTCCAAGG GTTCTCAGCA GGAAGACGAG GCGCTCTACA CCGAGGATCC TCGTGCCG298(2)SEQ ID NO45的信息(i)序列特征(A)长度1058个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO45CGGCACGAGG ATCGAATCGC GTCGCCGGGA GCACAGCGTC GCACTGCACC AGTGGAGGAG60CCATGACCTA CTCGCCGGGT AACCCCGGAT ACCCGCAAGC GCAGCCCGCA GGCTCCTACG 120GAGGCGTCAC ACCCTCGTTC GCCCACGCCG ATGAGGGTGC GAGCAAGCTA CCGATGTACC 180TGAACATCGC GGTGGCAGTG CTCGGTCTGG CTGCGTACTT CGCCAGCTTC GGCCCAATGT 240TCACCCTCAG TACCGAACTC GGGGGGGGTG ATGGCGCAGT GTCCGGTGAC ACTGGGCTGC 300CGGTCGGGGT GGCTCTGCTG GCTGCGCTGC TTGCCGGGGT GGTTCTGGTG CCTAAGGCCA 360AGAGCCATGT GACGGTAGTT GCGGTGCTCG GGGTACTCGG CGTATTTCTG ATGGTCTCGG 420CGACGTTTAA CAAGCCCAGC GCCTATTCGA CCGGTTGGGC ATTGTGGGTT GTGTTGGCTT 480TCATCGTGTT CCAGGCGGTT GCGGCAGTCC TGGCGCTCTT GGTGGAGACC GGCGCTATCA 540CCGCGCCGGC GCCGCGGCCC AAGTTCGACC CGTATGGACA GTACGGGCGG TACGGGCAGT 600ACGGGCAGTA CGGGGTGCAG CCGGGTGGGT ACTACGGTCA GCAGGGTGCT CAGCAGGCCG 660CGGGACTGCA GTCGCCCGGC CCGCAGCAGT CTCCGCAGCC TCCCGGATAT GGGTCGCAGT 720ACGGCGGCTA TTCGTCCAGT CCGAGCCAAT CGGGCAGTGG ATACACTGCT CAGCCCCCGG 780CCCAGCCGCC GGCGCAGTCC GGGTCGCAAC AATCGCACCA GGGCCCATCC ACGCCACCTA 840CCGGCTTTCC GAGCTTCAGC CCACCACCAC CGGTCAGTGC CGGGACGGGG TCGCAGGCTG 900GTTCGGCTCC AGTCAACTAT TCAAACCCCA GCGGGGGCGA GCAGTCGTCG TCCCCCGGGG 960GGGCGCCGGT CTAACCGGGC GTTCCCGCGT CCGGTCGCGC GTGTGCGCGA AGAGTGAACA 1020GGGTGTCAGC AAGCGCGGAC GATCCTCGTG CCGAATTC 1058(2)SEQ ID NO46的信息(i)序列特征(A)长度327个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO46CGGCACGAGA GACCGATGCC GCTACCCTCG CGCAGGAGGC AGGTAATTTC GAGCGGATCT 60CCGGCGACCT GAAAACCCAG ATCGACCAGG TGGAGTCGAC GGCAGGTTCG TTGCAGGGCC 120AGTGGCGCGG CGCGGCGGGG ACGGCCGCCC AGGCCGCGGT GGTGCGCTTC CAAGAAGCAG 180CCAATAAGCA GAAGCAGGAA CTCGACGAGA TCTCGACGAA TATTCGTCAG GCCGGCGTCC 240AATACTCGAG GGCCGACGAG GAGCAGCAGC AGGCGCTGTC CTCGCAAATG GGCTTCTGAC 300CCGCTAATAC GAAAAGAAAC GGAGCAA 327(2)SEQ ID NO47的信息(i)序列特征(A)长度170个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO47CGGTCGCGAT GATGGCGTTG TCGAACGTGA CCGATTCTGT ACCGCCGTCG TTGAGATCAA 60CCAACAACGT GTTGGCGTCG GCAAATGTGC CGNACCCGTG GATCTCGGTG ATCTTGTTCT 120TCTTCATCAG GAAGTGCACA CCGGCCACCC TGCCCTCGGN TACCTTTCGG 170(2)SEQ ID NO48的信息(i)序列特征(A)长度127个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO48GATCCGGCGG CACGGGGGGT GCCGGCGGCA GCACCGCTGG CGCTGGCGGC AACGGCGGGG 60CCGGGGGTGG CGGCGGAACC GGTGGGTTGC TCTTCGGCAA CGGCGGTGCC GGCGGGCACG 120GGGCCGT127(2)SEQ ID NO49的信息(i)序列特征(A)长度 81个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO49CGGCGGCAAG GGCGGCACCG CCGGCAACGG GAGCGGCGCG GCCGGCGGCA ACGGCGGCAA 60CGGCGGCTCC GGCCTCAACG G 81(2)SEQ ID NO50的信息(i)序列特征(A)长度149个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO50GATCAGGGCT GGCCGGCTCC GGCCAGAAGG GCGGTAACGG AGGAGCTGCC GGATTGTTTG 60GCAACGGCGG GGCCGGNGGT GCCGGCGCGT CCAACCAAGC CGGTAACGGC GGNGCCGGCG 120GAAACGGTGG TGCCGGTGGG CTGATCTGG149(2)SEQ ID NO51的信息(i)序列特征(A)长度355个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO51CGGCACGAGA TCACACCTAC CGAGTGATCG AGATCGTCGG GACCTCGCCC GACGGTGTCG 60ACGCGGNAAT CCAGGGCGGT CTGGCCCGAG CTGCGCAGAC CATGCGCGCG CTGGACTGGT 120TCGAAGTACA GTCAATTCGA GGCCACCTGG TCGACGGAGC GGTCGCGCAC TTCCAGGTGA 180CTATGAAAGT CGGCTTCCGC CTGGAGGATT CCTGAACCTT CAAGCGCGGC CGATAACTGA 240GGTGCATCAT TAAGCGACTT TTCCAGAACA TCCTGACGCG CTCGAAACGC GGTTCAGCCG 300ACGGTGGCTC CGCCGAGGCG CTGCCTCCAA AATCCCTGCG ACAATTCGTC GGCGG 355(2)SEQ ID NO52的信息(i)序列特征(A)长度999个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO52ATGCATCACC ATCACCATCA CATGCATCAG GTGGACCCCA ACTTGACACG TCGCAAGGGA 60CGATTGGCGG CACTGGCTAT CGCGGCGATG GCCAGCGCCA GCCTGGTGAC CGTTGCGGTG 120CCCGCGACCG CCAACGCCGA TCCGGAGCCA GCGCCCCCGG TACCCACAAC GGCCGCCTCG 180CCGCCGTCGA CCGCTGCAGC GCCACCCGCA CCGGCGACAC CTGTTGCCCC CCCACCACCG 240GCCGCCGCCA ACACGCCGAA TGCCCAGCCG GGCGATCCCA ACGCAGCACC TCCGCCGGCC 300GACCCGAACG CACCGCCGCC ACCTGTCATT GCCCCAAACG CACCCCAACC TGTCCGGATC 360GACAACCCGG TTGGAGGATT CAGCTTCGCG CTGCCTGCTG GCTGGGTGGA GTCTGACGCC 420GCCCACTTCG ACTACGGTTC AGCACTCCTC AGCAAAACCA CCGGGGACCC GCCATTTCCC 480GGACAGCCGC CGCCGGTGGC CAATGACACC CGTATCGTGC TCGGCCGGCT AGACCAAAAG 540CTTTACGCCA GCGCCGAAGC CACCGACTCC AAGGCCGCGG CCCGGTTGGG CTCGGACATG 600GGTGAGTTCT ATATGCCCTA CCCGGGCACC CGGATCAACC AGGAAACCGT CTCGCTCGAC 660GCCAACGGGG TGTCTGGAAG CGCGTCGTAT TACGAAGTCA AGTTCAGCGA TCCGAGTAAG 720CCGAACGGCC AGATCTGGAC GGGCGTAATC GGCTCGCCCG CGGCGAACGC ACCGGACGCC 780GGGCCCCCTC AGCGCTGGTT TGTGGTATGG CTCGGGACCG CCAACAACCC GGTGGACAAG 840GGCGCGGCCA AGGCGCTGGC CGAATCGATC CGGCCTTTGG TCGCCCCGCC GCCGGCGCCG 900GCACCGGCTC CTGCAGAGCC CGCTCCGGCG CCGGCGCCGG CCGGGGAAGT CGCTCCTACC 960CCGACGACAC CGACACCGCA GCGGACCTTA CCGGCCTGA 999(2)SEQ ID NO53的信息(i)序列特征
(A)长度332个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO53Met His His His His His His Met His Gln Val Asp Pro Asn Leu Thr1 5 10 15Arg Arg Lys Gly Arg Leu Ala Ala Leu Ala Ile Ala Ala Met Ala Ser20 25 30Ala Ser Leu Val Thr Val Ala Val Pro Ala Thr Ala Asn Ala Asp Pro35 40 45Glu Pro Ala Pro Pro Val Pro Thr Thr Ala Ala Ser Pro Pro Ser Thr50 55 60Ala Ala Ala Pro Pro Ala Pro Ala Thr Pro Val Ala Pro Pro Pro Pro65 70 75 80Ala Ala Ala Asn Thr Pro Asn Ala Gln Pro Gly Asp Pro Ash Ala Ala85 90 95Pro Pro Pro Ala Asp Pro Asn Ala Pro Pro Pro Pro Val Ile Ala Pro100 105 110Asn Ala Pro Gln Pro Val Arg Ile Asp Asn Pro Val Gly Gly Phe Ser115 120 125Phe Ala Leu Pro Ala Gly Trp Val Glu Ser Asp Ala Ala His Phe Asp130 135 140Tyr Gly Ser Ala Leu Leu Ser Lys Thr Thr Gly Asp Pro Pro Phe Pro145 150 155 160Gly Gln Pro Pro Pro Val Ala Asn Asp Thr Arg Ile Val Leu Gly Arg165 170 175Leu Asp Gln Lys Leu Tyr Ala Ser Ala Glu Ala Thr Asp Ser Lys Ala180 185 190Ala Ala Arg Leu Gly Ser Asp Met Gly Glu Phe Tyr Met Pro Tyr Pro195 200 205Gly Thr Arg Ile Asn Gln Glu Thr Val Ser Leu Asp Ala Asn Gly Val210 215 220Ser Gly Ser Ala Ser Tyr Tyr Glu Val Lys Phe Ser Asp Pro Ser Lys225 230 235 240Pro Asn Gly Gln Ile Trp Thr Gly Val Ile Gly Ser Pro Ala Ala Asn245 250 255Ala Pro Asp Ala Gly Pro Pro Gln Arg Trp Phe Val Val Trp Leu Gly260 265 270Thr Ala Asn Asn Pro Val Asp Lys Gly Ala Ala Lys Ala Leu Ala Glu275 280 285Ser Ile Arg Pro Leu Val Ala Pro Pro Pro Ala Pro Ala Pro Ala Pro290 295 300Ala Glu Pro Ala Pro Ala Pro Ala Pro Ala Gly Glu Val Ala Pro Thr305 310 315 320Pro Thr Thr Pro Thr Pro Gln Arg Thr Leu Pro Ala325 330(2)SEQ ID NO54的信息(i)序列特征(A)长度20个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO54Asp Pro Val Asp Ala Val Ile Asn Thr Thr Xaa Asn Tyr Gly Gln Val1 5 10 15Val Ala Ala Leu20(2)SEQ ID NO55的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO55Ala Val Glu Ser Gly Met Leu Ala Leu Gly Thr Pro Ala Pro Ser1 5 10 15(2)SEQ ID NO56的信息(i)序列特征:
(A)长度19个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO56Ala Ala Met Lys Pro Arg Thr Gly Asp Gly Pro Leu Glu Ala Ala Lys1 5 10 15Glu Gly Arg(2)SEQ ID NO57的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO57Tyr Tyr Trp Cys Pro Gly Gln Pro Phe Asp Pro Ala Trp Gly Pro1 5 10 15(2)SEQ ID NO58的信息(i)序列特征(A)长度14个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO58Asp Ile Gly Ser Glu Ser Thr Glu Asp Gln Gln Xaa Ala Val1 5 10(2)SEQ ID NO59的信息(i)序列特征(A)长度13个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO59Ala Glu Glu Ser Ile Ser Thr Xaa Glu Xaa Ile Val Pro1 5 10(2)SEQ ID NO60的信息(i)序列特征(A)长度17个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO60Asp Pro Glu Pro Ala Pro Pro Val Pro Thr Ala Ala Ala Ala Pro Pro1 5 10 15Ala(2)SEQ ID NO61的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO61Ala Pro Lys Thr Tyr Xaa Glu Glu Leu Lys Gly Thr Asp Thr Gly1 5 10 15(2)SEQ ID NO62的信息(i)序列特征(A)长度30个氨基酸(B)类型氨基酸
(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO62Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln Gln Thr Ser1 5 10 15Leu Leu Asn Asn Leu Ala Asp Pro Asp Val Ser Phe Ala Asp20 25 30(2)SEQ ID NO63的信息(i)序列特征(A)长度187个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO63Thr Gly Ser Leu Asn Gln Thr His Asn Arg Arg Ala Asn Glu Arg Lys1 5 10 15Asn Thr Thr Met Lys Met Val Lys Ser Ile Ala Ala Gly Leu Thr Ala20 25 30Ala Ala Ala Ile Gly Ala Ala Ala Ala Gly Val Thr Ser Ile Met Ala35 40 45Gly Gly Pro Val Val Tyr Gln Met Gln Pro Val Val Phe Gly Ala Pro50 55 60Leu Pro Leu Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln65 70 75 80Leu Thr Ser Leu Leu Asn Ser Leu Ala Asp Pro Asn Val Ser Phe Ala85 90 95Asn Lys Gly Ser Leu Val Glu Gly Gly Ile Gly Gly Thr Glu Ala Arg100 105 110Ile Ala Asp His Lys Leu Lys Lys Ala Ala Glu His Gly Asp Leu Pro115 120 125Leu Ser Phe Ser Val Thr Asn Ile Gln Pro Ala Ala Ala Gly Ser Ala130 135 140Thr Ala Asp Val Ser Val Ser Gly Pro Lys Leu Ser Ser Pro Val Thr145 150 155 160Gln Asn Val Thr Phe Val Asn Gln Gly Gly Trp Met Leu Ser Arg Ala165 170 175Ser Ala Met Glu Leu Leu Gln Ala Ala Gly Xaa180 185(2)SEQ ID NO64的信息(i)序列特征(A)长度148个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO64Asp Glu Val Thr Val Glu Thr Thr Ser Val Phe Arg Ala Asp Phe Leu1 5 10 15Ser Glu Leu Asp Ala Pro Ala Gln Ala Gly Thr Glu Ser Ala Val Ser20 25 30Gly Val Glu Gly Leu Pro Pro Gly Ser Ala Leu Leu Val Val Lys Arg35 40 45Gly Pro Asn Ala Gly Ser Arg Phe Leu Leu Asp Gln Ala Ile Thr Ser50 55 60Ala Gly Arg His Pro Asp Ser Asp Ile Phe Leu Asp Asp Val Thr Val65 70 75 80Ser Arg Arg His Ala Glu Phe Arg Leu Glu Asn Asn Glu Phe Asn Val85 90 95Val Asp Val Gly Ser Leu Asn Gly Thr Tyr Val Asn Arg Glu Pro Val100 105 110Asp Ser Ala Val Leu Ala Asn Gly Asp Glu Val Gln Ile Gly Lys Leu115 120 125Arg Leu Val Phe Leu Thr Gly Pro Lys Gln Gly Glu Asp Asp Gly Ser130 135 140Thr Gly Gly Pro145(2)SEQ ID NO65的信息(i)序列特征(A)长度230个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO65Thr Ser Asn Arg Pro Ala Arg Arg Gly Arg Arg Ala Pro Arg Asp Thr1 5 10 15Gly Pro Asp Arg Ser Ala Ser Leu Ser Leu Val Arg His Arg Arg Gln20 25 30Gln Arg Asp Ala Leu Cys Leu Ser Ser Thr Gln Ile Ser Arg Gln Ser35 40 45Asn Leu Pro Pro Ala Ala Gly Gly Ala Ala Asn Tyr Ser Arg Arg Asn50 55 60Phe Asp Val Arg Ile Lys Ile Phe Met Leu Val Thr Ala Val Val Leu65 70 75 80Leu Cys Cys Ser Gly Val Ala Thr Ala Ala Pro Lys Thr Tyr Cys Glu85 90 95Glu Leu Lys Gly Thr Asp Thr Gly Gln Ala Cys Gln Ile Gln Met Ser100 105 110Asp Pro Ala Tyr Asn Ile Asn Ile Ser Leu Pro Ser Tyr Tyr Pro Asp115 120 125Gln Lys Ser Leu Glu Asn Tyr Ile Ala Gln Thr Arg Asp Lys Phe Leu130 135 140Ser Ala Ala Thr Ser Ser Thr Pro Arg Glu Ala Pro Tyr Glu Leu Asn145 150 155 160Ile Thr Ser Ala Thr Tyr Gln Ser Ala Ile Pro Pro Arg Gly Thr Gln165 170 175Ala Val Val Leu Xaa Val Tyr His Asn Ala Gly Gly Thr His Pro Thr180 185 190Thr Thr Tyr Lys Ala Phe Asp Trp Asp Gln Ala Tyr Arg Lys Pro Ile195 200 205Thr Tyr Asp Thr Leu Trp Gln Ala Asp Thr Asp Pro Leu Pro Val Val210 215 220Phe Pro Ile Val Ala Arg225 230(2)SEQ ID NO66的信息(i)序列特征(A)长度132个氨基酸
(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO66Thr Ala Ala Ser Asp Asn Phe Gln Leu Ser Gln Gly Gly Gln Gly Phe1 5 10 15Ala Ile Pro Ile Gly Gln Ala Met Ala Ile Ala Gly Gln Ile Arg Ser20 25 30Gly Gly Gly Ser Pro Thr Val His Ile Gly Pro Thr Ala Phe Leu Gly35 40 45Leu Gly Val Val Asp Asn Asn Gly Asn Gly Ala Arg Val Gln Arg Val50 55 60Val Gly Ser Ala Pro Ala Ala Ser Leu Gly Ile Ser Thr Gly Asp Val65 70 75 80Ile Thr Ala Val Asp Gly Ala Pro Ile Asn Ser Ala Thr Ala Met Ala85 90 95Asp Ala Leu Asn Gly His His Pro Gly Asp Val Ile Ser Val Asn Trp100 105 110Gln Thr Lys Ser Gly Gly Thr Arg Thr Gly Asn Val Thr Leu Ala Glu115 120 125Gly Pro Pro Ala130(2)SEQ ID NO67的信息(i)序列特征(A)长度100个氨基酸(B)类型氨基酸
(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO67Val Pro Leu Arg Ser Pro Ser Met Ser Pro Ser Lys Cys Leu Ala Ala1 5 10 15Ala Gln Arg Asn Pro Val Ile Arg Arg Arg Arg Leu Ser Asn Pro Pro20 25 30Pro Arg Lys Tyr Arg Ser Met Pro Ser Pro Ala Thr Ala Ser Ala Gly35 40 45Met Ala Arg Val Arg Arg Arg Ala Ile Trp Arg Gly Pro Ala Thr Xaa50 55 60Ser Ala Gly Met Ala Arg Val Arg Arg Trp Xaa Val Met Pro Xaa Val65 70 75 80Ile Gln Ser Thr Xaa Ile Arg Xaa Xaa Gly Pro Phe Asp Asn Arg Gly85 90 95Ser Glu Arg Lys100(2)SEQ ID NO68的信息(i)序列特征(A)长度163个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO68Met Thr Asp Asp Ile Leu Leu Ile Asp Thr Asp Glu Arg Val Arg Thr1 5 10 15Leu Thr Leu Asn Arg Pro Gln Ser Arg Asn Ala Leu Ser Ala Ala Leu20 25 30Arg Asp Arg Phe Phe Ala Xaa Leu Xaa Asp Ala Glu Xaa Asp Asp Asp35 40 45Ile Asp Val Val Ile Leu Thr Gly Ala Asp Pro Val Phe Cys Ala Gly50 55 60Leu Asp Leu Lys Val Ala Gly Arg Ala Asp Arg Ala Ala Gly His Leu65 70 75 80Thr Ala Val Gly Gly His Asp Gln Ala Gly Asp Arg Arg Asp Gln Arg85 90 95Arg Arg Gly His Arg Arg Ala Arg Thr Gly Ala Val Leu Arg His Pro100 105 110Asp Arg Leu Arg Ala Arg Pro Leu Arg Arg His Pro Arg Pro Gly Gly115 120 125Ala Ala Ala His Leu Gly Thr Gln Cys Val Leu Ala Ala Lys Gly Arg130 135 140His Arg Xaa Gly Pro Val Asp Glu Pro Asp Arg Arg Leu Pro Val Arg145 150 155 160Asp Arg Arg(2)SEQ ID NO69的信息(i)序列特征(A)长度344个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO69Met Lys Phe Val Asn His Ile Glu Pro Val Ala Pro Arg Arg Ala Gly1 5 10 15Gly Ala Val Ala Glu Val Tyr Ala Glu Ala Arg Arg Glu Phe Gly Arg20 25 30Leu Pro Glu Pro Leu Ala Met Leu Ser Pro Asp Glu Gly Leu Leu Thr35 40 45Ala Gly Trp Ala Thr Leu Arg Glu Thr Leu Leu Val Gly Gln Val Pro50 55 60Arg Gly Arg Lys Glu Ala Val Ala Ala Ala Val Ala Ala Ser Leu Arg65 70 75 80Cys Pro Trp Cys Val Asp Ala His Thr Thr Met Leu Tyr Ala Ala Gly85 90 95Gln Thr Asp Thr Ala Ala Ala Ile Leu Ala Gly Thr Ala Pro Ala Ala100 105 110Gly Asp Pro Asn Ala Pro Tyr Val Ala Trp Ala Ala Gly Thr Gly Thr115 120 125Pro Ala Gly Pro Pro Ala Pro Phe Gly Pro Asp Val Ala Ala Glu Tyr130 135 140Leu Gly Thr Ala Val Gln Phe His Phe Ile Ala Arg Leu Val Leu Val145 150 155 160Leu Leu Asp Glu Thr Phe Leu Pro Gly Gly Pro Arg Ala Gln Gln Leu165 170 175Met Arg Arg Ala Gly Gly Leu Val Phe Ala Arg Lys Val Arg Ala Glu180 185 190His Arg Pro Gly Arg Ser Thr Arg Arg Leu Glu Pro Arg Thr Leu Pro195 200 205Asp Asp Leu Ala Trp Ala Thr Pro Ser Glu Pro Ile Ala Thr Ala Phe210 215 220Ala Ala Leu Ser His His Leu Asp Thr Ala Pro His Leu Pro Pro Pro225 230 235 240Thr Arg Gln Val Val Arg Arg Val Val Gly Ser Trp His Gly Glu Pro245 250 255Met Pro Met Ser Ser Arg Trp Thr Asn Glu His Thr Ala Glu Leu Pro260 265 270Ala Asp Leu His Ala Pro Thr Arg Leu Ala Leu Leu Thr Gly Leu Ala275 280 285Pro His Gln Val Thr Asp Asp Asp Val Ala Ala Ala Arg Ser Leu Leu290 295 300Asp Thr Asp Ala Ala Leu Val Gly Ala Leu Ala Trp Ala Ala Phe Thr305 310 315 320Ala Ala Arg Arg Ile Gly Thr Trp Ile Gly Ala Ala Ala Glu Gly Gln325 330 335Val Ser Arg Gln Asn Pro Thr Gly340(2)SEQ ID NO70的信息(i)序列特征(A)长度485个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO70Asp Asp Pro Asp Met Pro Gly Thr Val Ala Lys Ala Val Ala Asp Ala1 5 10 15Leu Gly Arg Gly Ile Ala Pro Val Glu Asp Ile Gln Asp Cys Val Glu20 25 30Ala Arg Leu Gly Glu Ala Gly Leu Asp Asp Val Ala Arg Val Tyr Ile35 40 45Ile Tyr Arg Gln Arg Arg Ala Glu Leu Arg Thr Ala Lys Ala Leu Leu50 55 60Gly Val Arg Asp Glu Leu Lys Leu Ser Leu Ala Ala Val Thr Val Leu65 70 75 80Arg Glu Arg Tyr Leu Leu His Asp Glu Gln Gly Arg Pro Ala Glu Ser85 90 95Thr Gly Glu Leu Met Asp Arg Ser Ala Arg Cys Val Ala Ala Ala Glu100 105 110Asp Gln Tyr Glu Pro Gly Ser Ser Arg Arg Trp Ala Glu Arg Phe Ala115 120 125Thr Leu Leu Arg Asn Leu Glu Phe Leu Pro Asn Ser Pro Thr Leu Met130 135 140Asn Ser Gly Thr Asp Leu Gly Leu Leu Ala Gly Cys Phe Val Leu Pro145 150 155 160Ile Glu Asp Ser Leu Gln Ser Ile Phe Ala Thr Leu Gly Gln Ala Ala165 170 175Glu Leu Gln Arg Ala Gly Gly Gly Thr Gly Tyr Ala Phe Ser His Leu180 185 190Arg Pro Ala Gly Asp Arg Val Ala Ser Thr Gly Gly Thr Ala Ser Gly195 200 205Pro Val Ser Phe Leu Arg Leu Tyr Asp Ser Ala Ala Gly Val Val Ser210 215 220Met Gly Gly Arg Arg Arg Gly Ala Cys Met Ala Val Leu Asp Val Ser225 230 235 240His Pro Asp Ile Cys Asp Phe Val Thr Ala Lys Ala Glu Ser Pro Ser245 250 255Glu Leu Pro His Phe Asn Leu Ser Val Gly Val Thr Asp Ala Phe Leu260 265270Arg Ala Val Glu Arg Asn Gly Leu His Arg Leu Val Asn Pro Arg Thr275 280 285Gly Lys Ile Val Ala Arg Met Pro Ala Ala Glu Leu Phe Asp Ala Ile290 295 300Cys Lys Ala Ala His Ala Gly Gly Asp Pro Gly Leu Val Phe Leu Asp305 310 315 320Thr Ile Asn Arg Ala Asn Pro Val Pro Gly Arg Gly Arg Ile Glu Ala325 330 335Thr Asn Pro Cys Gly Glu Val Pro Leu Leu Pro Tyr Glu Ser Cys Asn340 345 350Leu Gly Ser Ile Asn Leu Ala Arg Met Leu Ala Asp Gly Arg Val Asp355 360 365Trp Asp Arg Leu Glu Glu Val Ala Gly Val Ala Val Arg Phe Leu Asp370 375 380Asp Val Ile Asp Val Ser Arg Tyr Pro Phe Pro Glu Leu Gly Glu Ala385 390 395 400Ala Arg Ala Thr Arg Lys Ile Gly Leu Gly Val Met Gly Leu Ala Glu405 410 415Leu Leu Ala Ala Leu Gly Ile Pro Tyr Asp Ser Glu Glu Ala Val Arg420 425 430Leu Ala Thr Arg Leu Met Arg Arg Ile Gln Gln Ala Ala His Thr Ala435 440 445Ser Arg Arg Leu Ala Glu Glu Arg Gly Ala Phe Pro Ala Phe Thr Asp450 455 460Ser Arg Phe Ala Arg Ser Gly Pro Arg Arg Asn Ala Gln Val Thr Ser465 470 475 480Val Ala Pro Thr Gly485(2)SEQ ID NO71的信息(i)序列特征(A)长度267个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO71Gly Val Ile Val Leu Asp Leu Glu Pro Arg Gly Pro Leu Pro Thr Glu1 5 10 15Ile Tyr Trp Arg Arg Arg Gly Leu Ala Leu Gly Ile Ala Val Val Val20 25 30Val Gly Ile Ala Val Ala Ile Val Ile Ala Phe Val Asp Ser Ser Ala35 40 45Gly Ala Lys Pro Val Ser Ala Asp Lys Pro Ala Ser Ala Gln Ser His50 55 60Pro Gly Ser Pro Ala Pro Gln Ala Pro Gln Pro Ala Gly Gln Thr Glu65 70 75 80Gly Asn Ala Ala Ala Ala Pro Pro Gln Gly Gln Asn Pro Glu Thr Pro85 90 95Thr Pro Thr Ala Ala Val Gln Pro Pro Pro Val Leu Lys Glu Gly Asp100 105 110Asp Cys Pro Asp Ser Thr Leu Ala Val Lys Gly Leu Thr Asn Ala Pro115 120 125Gln Tyr Tyr Val Gly Asp Gln Pro Lys Phe Thr Met Val Val Thr Asn
130 135 140Ile Gly Leu Val Ser Cys Lys Arg Asp Val Gly Ala Ala Val Leu Ala145 150 155 160Ala Tyr Val Tyr Ser Leu Asp Asn Lys Arg Leu Trp Ser Asn Leu Asp165 170 175Cys Ala Pro Ser Asn Glu Thr Leu Val Lys Thr Phe Ser Pro Gly Glu180 185 190Gln Val Thr Thr Ala Val Thr Trp Thr Gly Met Gly Ser Ala Pro Arg195 200 205Cys Pro Leu Pro Arg Pro Ala Ile Gly Pro Gly Thr Tyr Asn Leu Val210 215 220Val Gln Leu Gly Asn Leu Arg Ser Leu Pro Val Pro Phe Ile Leu Asn225 230 235 240Gln Pro Pro Pro Pro Pro Gly Pro Val Pro Ala Pro Gly Pro Ala Gln245 250 255Ala Pro Pro Pro Glu Ser Pro Ala Gln Gly Gly260 265(2)SEQ ID NO72的信息(i)序列特征(A)长度97个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO72Leu Ile Ser Thr Gly Lys Ala Ser His Ala Ser Leu Gly Val Gln Val1 5 10 15Thr Asn Asp Lys Asp Thr Pro Gly Ala Lys Ile Val Glu Val Val Ala20 25 30Gly Gly Ala Ala Ala Asn Ala Gly Val Pro Lys Gly Val Val Val Thr35 40 45Lys Val Asp Asp Arg Pro Ile Asn Ser Ala Asp Ala Leu Val Ala Ala50 55 60Val Arg Ser Lys Ala Pro Gly Ala Thr Val Ala Leu Thr Phe Gln Asp65 70 75 80Pro Ser Gly Gly Ser Arg Thr Val Gln Val Thr Leu Gly Lys Ala Glu85 90 95Gln(2)SEQ ID NO73的信息(i)序列特征(A)长度364个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO73Gly Ala Ala Val Ser Leu Leu Ala Ala Gly Thr Leu Val Leu Thr Ala1 5 10 15Cys Gly Gly Gly Thr Asn Ser Ser Ser Ser Gly Ala Gly Gly Thr Ser20 25 30Gly Ser Val His Cys Gly Gly Lys Lys Glu Leu His Ser Ser Gly Ser35 40 45Thr Ala Gln Glu Asn Ala Met Glu Gln Phe Val Tyr Ala Tyr Val Arg50 55 60Ser Cys Pro Gly Tyr Thr Leu Asp Tyr Asn Ala Asn Gly Ser Gly Ala65 70 75 80Gly Val Thr Gln Phe Leu Asn Asn Glu Thr Asp Phe Ala Gly Ser Asp85 90 95Val Pro Leu Asn Pro Ser Thr Gly Gln Pro Asp Arg Ser Ala Glu Arg100 105 110Cys Gly Ser Pro Ala Trp Asp Leu Pro Thr Val Phe Gly Pro Ile Ala115 120 125Ile Thr Tyr Asn Ile Lys Gly Val Ser Thr Leu Asn Leu Asp Gly Pro130 135 140Thr Thr Ala Lys Ile Phe Asn Gly Thr Ile Thr Val Trp Asn Asp Pro145 150 155 160Gln Ile Gln Ala Leu Asn Ser Gly Thr Asp Leu Pro Pro Thr Pro Ile165 170 175Ser Val Ile Phe Arg Ser Asp Lys Ser Gly Thr Ser Asp Asn Phe Gln180 185 190Lys Tyr Leu Asp Gly Val Ser Asn Gly Ala Trp Gly Lys Gly Ala Ser195 200 205Glu Thr Phe Ser Gly Gly Val Gly Val Gly Ala Ser Gly Asn Asn Gly210 215 220Thr Ser Ala Leu Leu Gln Thr Thr Asp Gly Ser Ile Thr Tyr Ash Glu225 230 235 240Trp Ser Phe Ala Val Gly Lys Gln Leu Asn Met Ala Gln Ile Ile Thr245 250 255Ser Ala Gly Pro Asp Pro Val Ala Ile Thr Thr Glu Ser Val Gly Lys260 265 270Thr Ile Ala Gly Ala Lys Ile Met Gly Gln Gly Asn Asp Leu Val Leu275 280 285Asp Thr Ser Ser Phe Tyr Arg Pro Thr Gln Pro Gly Ser Tyr Pro Ile290 295 300Val Leu Ala Thr Tyr Glu Ile Val Cys Ser Lys Tyr Pro Asp Ala Thr305 310 315 320Thr Gly Thr Ala Val Arg Ala Phe Met Gln Ala Ala Ile Gly Pro Gly325 330 335Gln Glu Gly Leu Asp Gln Tyr Gly Ser Ile Pro Leu Pro Lys Ser Phe340 345 350Gln Ala Lys Leu Ala Ala Ala Val Asn Ala Ile Ser355 360(2)SEQ ID NO74的信息(i)序列特征(A)长度309个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO74Gln Ala Ala Ala Gly Arg Ala Val Arg Arg Thr Gly His Ala Glu Asp1 5 10 15Gln Thr His Gln Asp Arg Leu His His Gly Cys Arg Arg Ala Ala Val20 25 30Val Val Arg Gln Asp Arg Ala Ser Val Ser Ala Thr Ser Ala Arg Pro35 40 45Pro Arg Arg His Pro Ala Gln Gly His Arg Arg Arg Val Ala Pro Ser50 55 60Gly Gly Arg Arg Arg Pro His Pro His His Val Gln Pro Asp Asp Arg65 70 75 80Arg Asp Arg Pro Ala Leu Leu Asp Arg Thr Gln Pro Ala Glu His Pro85 90 95Asp Pro His Arg Arg Gly Pro Ala Asp Pro Gly Arg Val Arg Gly Arg100105 110Gly Arg Leu Arg Arg Val Asp Asp Gly Arg Leu Gln Pro Asp Arg Asp115 120 125Ala Asp His Gly Ala Pro Val Arg Gly Arg Gly Pro His Arg Gly Val130 135 140Gln His Arg Gly Gly Pro Val Phe Val Arg Arg Val Pro Gly Val Arg145 150 155 160Cys Ala His Arg Arg Gly His Arg Arg Val Ala Ala Pro Gly Gln Gly165 170 175Asp Val Leu Arg Ala Gly Leu Arg Val Glu Arg Leu Arg Pro Val Ala180 185 190Ala Val Glu Asn Leu His Arg Gly Ser Gln Arg Ala Asp Gly Arg Val195 200 205Phe Arg Pro Ile Arg Arg Gly Ala Arg Leu Pro Ala Arg Arg Ser Arg210 215 220Ala Gly Pro Gln Gly Arg Leu His Leu Asp Gly Ala Gly Pro Ser Pro225 230 235 240Leu Pro Ala Arg Ala Gly Gln Gln Gln Pro Ser Ser Ala Gly Gly Arg245 250 255Arg Ala Gly Gly Ala Glu Arg Ala Asp Pro Gly Gln Arg Gly Arg His260 265 270His Gln Gly Gly His Asp Pro Gly Arg Gln Gly Ala Gln Arg Gly Thr275 280 285Ala Gly Val Ala His Ala Ala Ala Gly Pro Arg Arg Ala Ala Val Arg290 295 300Asn Arg Pro Arg Arg305(2)SEQ ID NO75的信息(i)序列特征(A)长度580个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO75Ser Ala Val Trp Cys Leu Asn Gly Phe Thr Gly Arg His Arg His Gly1 5 10 15Arg Cys Arg Val Arg Ala Ser Gly Trp Arg Ser Ser Asn Arg Trp Cys20 25 30Ser Thr Thr Ala Asp Cys Cys Ala Ser Lys Thr Pro Thr Gln Ala Ala35 40 45Ser Pro Leu Glu Arg Arg Phe Thr Cys Cys Ser Pro Ala Val Gly Cys50 55 60Arg Phe Arg Ser Phe Pro Val Arg Arg Leu Ala Leu Gly Ala Arg Thr65 70 75 80Ser Arg Thr Leu Gly Val Arg Arg Thr Leu Ser Gln Trp Asn Leu Ser85 90 95Pro Arg Ala Gln Pro Ser Cys Ala Val Thr Val Glu Ser His Thr His100 105 110Ala Ser Pro Arg Met Ala Lys Leu Ala Arg Val Val Gly Leu Val Gln115 120 125Glu Glu Gln Pro Ser Asp Met Thr Asn His Pro Arg Tyr Ser Pro Pro130 135 140Pro Gln Gln Pro Gly Thr Pro Gly Tyr Ala Gln Gly Gln Gln Gln Thr145 150 155 160Tyr Ser Gln Gln Phe Asp Trp Arg Tyr Pro Pro Ser Pro Pro Pro Gln165 170 175Pro Thr Gln Tyr Arg Gln Pro Tyr Glu Ala Leu Gly Gly Thr Arg Pro180 185 190Gly Leu Ile Pro Gly Val Ile Pro Thr Met Thr Pro Pro Pro Gly Met195 200 205Val Arg Gln Arg Pro Arg Ala Gly Met Leu Ala Ile Gly Ala Val Thr210 215 220Ile Ala Val Val Ser Ala Gly Ile Gly Gly Ala Ala Ala Ser Leu Val225 230 235 240Gly Phe Asn Arg Ala Pro Ala Gly Pro Ser Gly Gly Pro Val Ala Ala245 250 255Ser Ala Ala Pro Ser Ile Pro Ala Ala Asn Met Pro Pro Gly Ser Val260 265 270Glu Gln Val Ala Ala Lys Val Val Pro Ser Val Val Met Leu Glu Thr275 280 285Asp Leu Gly Arg Gln Ser Glu Glu Gly Ser Gly Ile Ile Leu Ser Ala290 295 300Glu Gly Leu Ile Leu Thr Asn Asn His Val Ile Ala Ala Ala Ala Lys305 310 315 320Pro Pro Leu Gly Ser Pro Pro Pro Lys Thr Thr Val Thr Phe Ser Asp325 330 335Gly Arg Thr Ala Pro Phe Thr Val Val Gly Ala Asp Pro Thr Ser Asp340 345 350Ile Ala Val Val Arg Val Gln Gly Val Ser Gly Leu Thr Pro Ile Ser355 360 365Leu Gly Ser Ser Ser Asp Leu Arg Val Gly Gln Pro Val Leu Ala Ile370 375 380Gly Ser Pro Leu Gly Leu Glu Gly Thr Val Thr Thr Gly Ile Val Ser385 390 395 400Ala Leu Asn Arg Pro Val Ser Thr Thr Gly Glu Ala Gly Asn Gln Asn405 410 415Thr Val Leu Asp Ala Ile Gln Thr Asp Ala Ala Ile Asn Pro Gly Asn420 425 430Ser Gly Gly Ala Leu Val Asn Met Asn Ala Gln Leu Val Gly Val Asn435 440 445Ser Ala Ile Ala Thr Leu Gly Ala Asp Ser Ala Asp Ala Gln Ser Gly450 455 460Ser Ile Gly Leu Gly Phe Ala Ile Pro Val Asp Gln Ala Lys Arg Ile465 470 475 480Ala Asp Glu Leu Ile Ser Thr Gly Lys Ala Ser His Ala Ser Leu Gly485 490 495Val Gln Val Thr Asn Asp Lys Asp Thr Pro Gly Ala Lys Ile Val Glu500 505 510Val Val Ala Gly Gly Ala Ala Ala Asn Ala Gly Val Pro Lys Gly Val515 520 525Val Val Thr Lys Val Asp Asp Arg Pro Ile Asn Ser Ala Asp Ala Leu530 535 540Val Ala Ala Val Arg Ser Lys Ala Pro Gly Ala Thr Val Ala Leu Thr545 550 555 560Phe Gln Asp Pro Ser Gly Gly Ser Arg Thr Val Gln Val Thr Leu Gly565 570 575Lys Ala Glu Gln580(2)SEQ ID NO76的信息(i)序列特征(A)长度233个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO76Met Asn Asp Gly Lys Arg Ala Val Thr Ser Ala Val Leu Val Val Leu1 5 10 15Gly Ala Cys Leu Ala Leu Trp Leu Ser Gly Cys Ser Ser Pro Lys Pro20 25 30Asp Ala Glu Glu Gln Gly Val Pro Val Ser Pro Thr Ala Ser Asp Pro35 40 45Ala Leu Leu Ala Glu Ile Arg Gln Ser Leu Asp Ala Thr Lys Gly Leu50 55 60Thr Ser Val His Val Ala Val Arg Thr Thr Gly Lys Val Asp Ser Leu65 70 75 80Leu Gly Ile Thr Ser Ala Asp Val Asp Val Arg Ala Asn Pro Leu Ala85 90 95Ala Lys Gly Val Cys Thr Tyr Asn Asp Glu Gln Gly Val Pro Phe Arg100 105 110Val Gln Gly Asp Asn Ile Ser Val Lys Leu Phe Asp Asp Trp Ser Asn115 120 125Leu Gly Ser Ile Ser Glu Leu Ser Thr Ser Arg Val Leu Asp Pro Ala130 135 140Ala Gly Val Thr Gln Leu Leu Ser Gly Val Thr Asn Leu Gln Ala Gln145 150 155 160Gly Thr Glu Val Ile Asp Gly Ile Ser Thr Thr Lys Ile Thr Gly Thr165 170 175Ile Pro Ala Ser Ser Val Lys Met Leu Asp Pro Gly Ala Lys Ser Ala180 185 190Arg Pro Ala Thr Val Trp Ile Ala Gln Asp Gly Ser His His Leu Val195 200 205Arg Ala Ser Ile Asp Leu Gly Ser Gly Ser Ile Gln Leu Thr Gln Ser210 215 220Lys Trp Asn Glu Pro Val Asn Val Asp225 230(2)SEQ ID NO77的信息(i)序列特征(A)长度66个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO77Val Ile Asp Ile Ile Gly Thr Ser Pro Thr Ser Trp Glu Gln Ala Ala1 5 10 15Ala Glu Ala Val Gln Arg Ala Arg Asp Ser Val Asp Asp Ile Arg Val20 25 30Ala Arg Val Ile Glu Gln Asp Met Ala Val Asp Ser Ala Gly Lys Ile35 40 45Thr Tyr Arg Ile Lys Leu Glu Val Ser Phe Lys Met Arg Pro Ala Gln50 55 60Pro Arg65(2)SEQ ID NO78的信息(i)序列特征(A)长度69个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO78Val Pro Pro Ala Pro Pro Leu Pro Pro Leu Pro Pro Ser Pro Ile Ser1 5 10 15Cys Ala Ser Pro Pro Ser Pro Pro Leu Pro Pro Ala Pro Pro Val Ala20 25 30Pro Gly Pro Pro Met Pro Pro Leu Asp Pro Trp Pro Pro Ala Pro Pro35 40 45Leu Pro Tyr Ser Thr Pro Pro Gly Ala Pro Leu Pro Pro Ser Pro Pro50 55 60Ser Pro Pro Leu Pro65(2)SEQ ID NO79的信息(i)序列特征(A)长度355个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO79Met Ser Asn Ser Arg Arg Arg Ser Leu Arg Trp Ser Trp Leu Leu SerI 5 10 15Val Leu Ala Ala Val Gly Leu Gly Leu Ala Thr Ala Pro Ala Gln Ala20 25 30Ala Pro Pro Ala Leu Ser Gln Asp Arg Phe Ala Asp Phe Pro Ala Leu35 40 45Pro Leu Asp Pro Ser Ala Met Val Ala Gln Val Ala Pro Gln Val Val50 55 60Asn Ile Asn Thr Lys Leu Gly Tyr Asn Asn Ala Val Gly Ala Gly Thr65 70 75 80Gly Ile Val Ile Asp Pro Asn Gly Val Val Leu Thr Ash Asn His Val85 90 95Ile Ala Gly Ala Thr Asp Ile Asn Ala Phe Ser Val Gly Ser Gly Gln100 105 110Thr Tyr Gly Val Asp Val Val Gly Tyr Asp Arg Thr Gln Asp Val Ala115 120 125Val Leu Gln Leu Arg Gly Ala Gly Gly Leu Pro Ser Ala Ala Ile Gly130 135 140Gly Gly Val Ala Val Gly Glu Pro Val Val Ala Met Gly Asn Ser Gly145 150 155 160Gly Gln Gly Gly Thr Pro Arg Ala Val Pro Gly Arg Val Val Ala Leu165 170 175Gly Gln Thr Val Gln Ala Ser Asp Ser Leu Thr Gly Ala Glu Glu Thr180 185 190Leu Asn Gly Leu Ile Gln Phe Asp Ala Ala Ile Gln Pro Gly Asp Ser195 200 205Gly Gly Pro Val Val Asn Gly Leu Gly Gln Val Val Gly Met Asn Thr210 215 220Ala Ala Ser Asp Asn Phe Gln Leu Ser Gln Gly Gly Gln Gly Phe Ala225 230 235 240Ile Pro Ile Gly Gln Ala Met Ala Ile Ala Gly Gln Ile Arg Ser Gly245 250 255Gly Gly Ser Pro Thr Val His Ile Gly Pro Thr Ala Phe Leu Gly Leu260 265 270Gly Val Val Asp Asn Asn Gly Asn Gly Ala Arg Val Gln Arg Val Val275 280 285Gly Ser Ala Pro Ala Ala Ser Leu Gly Ile Ser Thr Gly Asp Val Ile290 295 300Thr Ala Val Asp Gly Ala Pro Ile Asn Ser Ala Thr Ala Met Ala Asp305 310 315 320Ala Leu Asn Gly His His Pro Gly Asp Val Ile Ser Val Asn Trp Gln325 330 335Thr Lys Ser Gly Gly Thr Arg Thr Gly Asn Val Thr Leu Ala Glu Gly340 345 350Pro Pro Ala355(2)SEQ ID NO80的信息(i)序列特征(A)长度205个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO80Ser Pro Lys Pro Asp Ala Glu Glu Gln Gly Val Pro Val Ser Pro Thr1 5 10 15Ala Ser Asp Pro Ala Leu Leu Ala Glu Ile Arg Gln Ser Leu Asp Ala20 25 30Thr Lys Gly Leu Thr Ser Val His Val Ala Val Arg Thr Thr Gly Lys35 40 45Val Asp Ser Leu Leu Gly Ile Thr Ser Ala Asp Val Asp Val Arg Ala50 55 60Asn Pro Leu Ala Ala Lys Gly Val Cys Thr Tyr Asn Asp Glu Gln Gly65 70 75 80Val Pro Phe Arg Val Gln Gly Asp Asn Ile Ser Val Lys Leu Phe Asp85 90 95Asp Trp Ser Asn Leu Gly Ser Ile Ser Glu Leu Ser Thr Ser Arg Val100 105 110Leu Asp Pro Ala Ala Gly Val Thr Gln Leu Leu Ser Gly Val Thr Asn115 120 125Leu Gln Ala Gln Gly Thr Glu Val Ile Asp Gly Ile Ser Thr Thr Lys130 135 140Ile Thr Gly Thr Ile Pro Ala Ser Ser Val Lys Met Leu Asp Pro Gly145 150 155 160Ala Lys Ser Ala Arg Pro Ala Thr Val Trp Ile Ala Gln Asp Gly Ser165 170 175His His Leu Val Arg Ala Ser Ile Asp Leu Gly Ser Gly Ser Ile Gln180 185 190Leu Thr Gln Ser Lys Trp Asn Glu Pro Val Asn Val Asp195 200 205(2)SEQ ID NO81的信息(i)序列特征(A)长度286个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO81Gly Asp Ser Phe Trp Ala Ala Ala Asp Gln Met Ala Arg Gly Phe Val1 5 10 15Leu Gly Ala Thr Ala Gly Arg Thr Thr Leu Thr Gly Glu Gly Leu Gln20 25 30His Ala Asp Gly His Ser Leu Leu Leu Asp Ala Thr Asn Pro Ala Val35 40 45Val Ala Tyr Asp Pro Ala Phe Ala Tyr Glu Ile Gly Tyr Ile Xaa Glu50 55 60Ser Gly Leu Ala Arg Met Cys Gly Glu Asn Pro Glu Asn Ile Phe Phe65 70 75 80Tyr Ile Thr Val Tyr Asn Glu Pro Tyr Val Gln Pro Pro Glu Pro Glu85 90 95Asn Phe Asp Pro Glu Gly Val Leu Gly Gly Ile Tyr Arg Tyr His Ala100 105 110Ala Thr Glu Gln Arg Thr Asn Lys Xaa Gln Ile Leu Ala Ser Gly Val115120 125Ala Met Pro Ala Ala Leu Arg Ala Ala Gln Met Leu Ala Ala Glu Trp130 135 140Asp Val Ala Ala Asp Val Trp Ser Val Thr Ser Trp Gly Glu Leu Asn145 150 155 160Arg Asp Gly Val Val Ile Glu Thr Glu Lys Leu Arg His Pro Asp Arg165 170 175Pro Ala Gly Val Pro Tyr Val Thr Arg Ala Leu Glu Asn Ala Arg Gly180 185 190Pro Val Ile Ala Val Ser Asp Trp Met Arg Ala Val Pro Glu Gln Ile195 200 205Arg Pro Trp Val Pro Gly Thr Tyr Leu Thr Leu Gly Thr Asp Gly Phe210 215 220Gly Phe Ser Asp Thr Arg Pro Ala Gly Arg Arg Tyr Phe Asn Thr Asp225 230 235 240Ala Glu Ser Gln Val Gly Arg Gly Phe Gly Arg Gly Trp Pro Gly Arg245 250 255Arg Val Asn Ile Asp Pro Phe Gly Ala Gly Arg Gly Pro Pro Ala Gln260 265 270Leu Pro Gly Phe Asp Glu Gly Gly Gly Leu Arg Pro Xaa Lys275 280 285(2)SEQ ID NO82的信息(i)序列特征(A)长度173个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO82Thr Lys Phe His Ala Leu Met Gln Glu Gln Ile His Asn Glu Phe Thr1 5 10 15Ala Ala Gln Gln Tyr Val Ala Ile Ala Val Tyr Phe Asp Ser Glu Asp20 25 30Leu Pro Gln Leu Ala Lys His Phe Tyr Ser Gln Ala Val Glu Glu Arg35 40 45Asn His Ala Met Met Leu Val Gln His Leu Leu Asp Arg Asp Leu Arg50 55 60Val Glu Ile Pro Gly Val Asp Thr Val Arg Asn Gln Phe Asp Arg Pro65 70 75 80Arg Glu Ala Leu Ala Leu Ala Leu Asp Gln Glu Arg Thr Val Thr Asp85 90 95Gln Val Gly Arg Leu Thr Ala Val Ala Arg Asp Glu Gly Asp Phe Leu100 105 110Gly Glu Gln Phe Met Gln Trp Phe Leu Gln Glu Gln Ile Glu Glu Val115 120 125Ala Leu Met Ala Thr Leu Val Arg Val Ala Asp Arg Ala Gly Ala Asn130 135 140Leu Phe Glu Leu Glu Asn Phe Val Ala Arg Glu Val Asp Val Ala Pro145 150 155 160Ala Ala Ser Gly Ala Pro His Ala Ala Gly Gly Arg Leu165 170(2)SEQ ID NO83的信息(i)序列特征(A)长度107个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO83Arg Ala Asp Glu Arg Lys Asn Thr Thr Met Lys Met Val Lys Ser Ile1 5 10 15Ala Ala Gly Leu Thr Ala Ala Ala Ala Ile Gly Ala Ala Ala Ala Gly20 25 30Val Thr Ser Ile Met Ala Gly Gly Pro Val Val Tyr Gln Met Gln Pro35 40 45Val Val Phe Gly Ala Pro Leu Pro Leu Asp Pro Xaa Ser Ala Pro Xaa50 55 60Val Pro Thr Ala Ala Gln Trp Thr Xaa Leu Leu Asn Xaa Leu Xaa Asp65 70 75 80Pro Asn Val Ser Phe Xaa Asn Lys Gly Ser Leu Val Glu Gly Gly Ile85 90 95Gly Gly Xaa Glu Gly Xaa Xaa Arg Arg Xaa Gln100 105(2)SEQ ID NO84的信息(i)序列特征(A)长度125个氨基酸(B)类型氨基酸
(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO84Val Leu Ser Val Pro Val Gly Asp Gly Phe Trp Xaa Arg Val Val Asn1 5 10 15Pro Leu Gly Gln Pro Ile Asp Gly Arg Gly Asp Val Asp Ser Asp Thr20 25 30Arg Arg Ala Leu Glu Leu Gln Ala Pro Ser Val Val Xaa Arg Gln Gly35 40 45Val Lys Glu Pro Leu Xaa Thr Gly Ile Lys Ala Ile Asp Ala Met Thr50 55 60Pro Ile Gly Arg Gly Gln Arg Gln Leu Ile Ile Gly Asp Arg Lys Thr65 70 75 80Gly Lys Asn Arg Arg Leu Cys Arg Thr Pro Ser Ser Asn Gln Arg Glu85 90 95Glu Leu Gly Val Arg Trp Ile Pro Arg Ser Arg Cys Ala Cys Val Tyr100 105 110Val Gly His Arg Ala Arg Arg Gly Thr Tyr His Arg Arg115 120 125(2)SEQ ID NO85的信息(i)序列特征(A)长度117个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO85Cys Asp Ala Val Met Gly Phe Leu Gly Gly Ala Gly Pro Leu Ala Val1 5 10 15Val Asp Gln Gln Leu Val Thr Arg Val Pro Gln Gly Trp Ser Phe Ala20 25 30Gln Ala Ala Ala Val Pro Val Val Phe Leu Thr Ala Trp Tyr Gly Leu35 40 45Ala Asp Leu Ala Glu Ile Lys Ala Gly Glu Ser Val Leu Ile His Ala50 55 60Gly Thr Gly Gly Val Gly Met Ala Ala Val Gln Leu Ala Arg Gln Trp65 70 75 80Gly Val Glu Val Phe Val Thr Ala Ser Arg Gly Lys Trp Asp Thr Leu85 90 95Arg Ala Xaa Xaa Phe Asp Asp Xaa Pro Tyr Arg Xaa Phe Pro His Xaa100 105 110Arg Ser Ser Xaa Gly115(2)SEQ ID NO86的信息(i)序列特征(A)长度103个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO86Met Tyr Arg Phe Ala Cys Arg Thr Leu Met Leu Ala Ala Cys Ile Leu1 5 10 15Ala Thr Gly Val Ala Gly Leu Gly Val Gly Ala Gln Ser Ala Ala Gln20 25 30Thr Ala Pro Val Pro Asp Tyr Tyr Trp Cys Pro Gly Gln Pro Phe Asp35 40 45Pro Ala Trp Gly Pro Asn Trp Asp Pro Tyr Thr Cys His Asp Asp Phe50 55 60His Arg Asp Ser Asp Gly Pro Asp His Ser Arg Asp Tyr Pro Gly Pro65 70 75 80Ile Leu Glu Gly Pro Val Leu Asp Asp Pro Gly Ala Ala Pro Pro Pro85 90 95Pro Ala Ala Gly Gly Gly Alal00(2)SEQ ID NO87的信息(i)序列特征(A)长度88个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO87Val Gln Cys Arg Val Trp Leu Glu Ile Gln Trp Arg Gly Met Leu Gly1 5 10 15Ala Asp Gln Ala Arg Ala Gly Gly Pro Ala Arg Ile Trp Arg Glu His20 25 30Ser Met Ala Ala Met Lys Pro Arg Thr Gly Asp Gly Pro Leu Glu Ala35 40 45Thr Lys Glu Gly Arg Gly Ile Val Met Arg Val Pro Leu Glu Gly Gly50 55 60Gly Arg Leu Val Val Glu Leu Thr Pro Asp Glu Ala Ala Ala Leu Gly65 70 75 80Asp Glu Leu Lys Gly Val Thr Ser85(2)SEQ ID NO88的信息(i)序列特征(A)长度95个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO88Thr Asp Ala Ala Thr Leu Ala Gln Glu Ala Gly Asn Phe Glu Arg Ile1 5 10 15Ser Gly Asp Leu Lys Thr Gln Ile Asp Gln Val Glu Ser Thr Ala Gly20 25 30Ser Leu Gln Gly Gln Trp Arg Gly Ala Ala Gly Thr Ala Ala Gln Ala35 40 45Ala Val Val Arg Phe Gln Glu Ala Ala Asn Lys Gln Lys Gln Glu Leu50 55 60Asp Glu Ile Ser Thr Asn Ile Arg Gln Ala Gly Val Gln Tyr Ser Arg65 70 75 80Ala Asp Glu Glu Gln Gln Gln Ala Leu Ser Ser Gln Met Gly Phe85 90 95(2)SEQ ID NO89的信息(i)序列特征(A)长度166个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO89Met Thr Gln Ser Gln Thr Val Thr Val Asp Gln Gln Glu Ile Leu Asn1 5 10 15Arg Ala Asn Glu Val Glu Ala Pro Met Ala Asp Pro Pro Thr Asp Val20 25 30Pro Ile Thr Pro Cys Glu Leu Thr Xaa Xaa Lys Asn Ala Ala Gln Gln35 40 45Xaa Val Leu Ser Ala Asp Asn Met Arg Glu Tyr Leu Ala Ala Gly Ala50 55 60Lys Glu Arg Gln Arg Leu Ala Thr Ser Leu Arg Asn Ala Ala Lys Xaa65 70 75 80Tyr Gly Glu Val Asp Glu Glu Ala Ala Thr Ala Leu Asp Asn Asp Gly85 90 95Glu Gly Thr Val Gln Ala Glu Ser Ala Gly Ala Val Gly Gly Asp Ser100 105 110Ser Ala Glu Leu Thr Asp Thr Pro Arg Val Ala Thr Ala Gly Glu Pro115 120 125Asn Phe Met Asp Leu Lys Glu Ala Ala Arg Lys Leu Glu Thr Gly Asp130 135 140Gln Gly Ala Ser Leu Ala His Xaa Gly Asp Gly Trp Asn Thr Xaa Thr145 150 155 160Leu Thr Leu Gln Gly Asp165(2)SEQ ID NO90的信息(i)序列特征(A)长度5个氨基酸
(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO90Arg Ala Glu Arg Met1 5(2)SEQ ID NO91的信息(i)序列特征(A)长度263个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO91Val Ala Trp Met Ser Val Thr Ala Gly Gln Ala Glu Leu Thr Ala Ala1 5 10 15Gln Val Arg Val Ala Ala Ala Ala Tyr Glu Thr Ala Tyr Gly Leu Thr20 25 30Val Pro Pro Pro Val Ile Ala Glu Asn Arg Ala Glu Leu Met Ile Leu35 40 45Ile Ala Thr Asn Leu Leu Gly Gln Asn Thr Pro Ala Ile Ala Val Asn50 55 60Glu Ala Glu Tyr Gly Glu Met Trp Ala Gln Asp Ala Ala Ala Met Phe65 70 75 80Gly Tyr Ala Ala Ala Thr Ala Thr Ala Thr Ala Thr Leu Leu Pro Phe85 90 95Glu Glu Ala Pro Glu Met Thr Ser Ala Gly Gly Leu Leu Glu Gln Ala100 105 110Ala Ala Val Glu Glu Ala Ser Asp Thr Ala Ala Ala Asn Gln Leu Met115 120 125Asn Asn Val Pro Gln Ala Leu Lys Gln Leu Ala Gln Pro Thr Gln Gly130 135 140Thr Thr Pro Ser Ser Lys Leu Gly Gly Leu Trp Lys Thr Val Ser Pro145 150 155 160His Arg Ser Pro Ile Ser Asn Met Val Ser Met Ala Asn Asn His Met165 170 175Ser Met Thr Asn Ser Gly Val Ser Met Thr Asn Thr Leu Ser Ser Met180 185 190Leu Lys Gly Phe Ala Pro Ala Ala Ala Ala Gln Ala Val Gln Thr Ala195 200 205Ala Gln Asn Gly Val Arg Ala Met Ser Ser Leu Gly Ser Ser Leu Gly210 215 220Ser Ser Gly Leu Gly Gly Gly Val Ala Ala Asn Leu Gly Arg Ala Ala225 230 235 240Ser Val Arg Tyr Gly His Arg Asp Gly Gly Lys Tyr Ala Xaa Ser Gly245 250 255Arg Arg Asn Gly Gly Pro Ala260(2)SEQ ID NO92的信息(i)序列特征(A)长度303个氨基酸(B)类型氨基酸(C)链型单链
(D)拓扑结构线型(xi)序列描述SEQ ID NO92Met Thr Tyr Ser Pro Gly Asn Pro Gly Tyr Pro Gln Ala Gln Pro Ala1 5 10 15Gly Ser Tyr Gly Gly Val Thr Pro Ser Phe Ala His Ala Asp Glu Gly20 25 30Ala Ser Lys Leu Pro Met Tyr Leu Asn Ile Ala Val Ala Val Leu Gly35 40 45Leu Ala Ala Tyr Phe Ala Ser Phe Gly Pro Met Phe Thr Leu Ser Thr50 55 60Glu Leu Gly Gly Gly Asp Gly Ala Val Ser Gly Asp Thr Gly Leu Pro65 70 75 80Val Gly Val Ala Leu Leu Ala Ala Leu Leu Ala Gly Val Val Leu Val85 90 95Pro Lys Ala Lys Ser His Val Thr Val Val Ala Val Leu Gly Val Leu100 105 110Gly Val Phe Leu Met Val Ser Ala Thr Phe Asn Lys Pro Ser Ala Tyr115 120 125Ser Thr Gly Trp Ala Leu Trp Val Val Leu Ala Phe Ile Val Phe Gln130 135 140Ala Val Ala Ala Val Leu Ala Leu Leu Val Glu Thr Gly Ala Ile Thr145 150 155 160Ala Pro Ala Pro Arg Pro Lys Phe Asp Pro Tyr Gly Gln Tyr Gly Arg165 170 175Tyr Gly Gln Tyr Gly Gln Tyr Gly Val Gln Pro Gly Gly Tyr Tyr Gly180 185 190Gln Gln Gly Ala Gln Gln Ala Ala Gly Leu Gln Ser Pro Gly Pro Gln195 200 205Gln Ser Pro Gln Pro Pro Gly Tyr Gly Ser Gln Tyr Gly Gly Tyr Ser210 215 220Ser Ser Pro Ser Gln Ser Gly Ser Gly Tyr Thr Ala Gln Pro Pro Ala225 230 235 240Gln Pro Pro Ala Gln Ser Gly Ser Gln Gln Ser His Gln Gly Pro Ser245 250 255Thr Pro Pro Thr Gly Phe Pro Ser Phe Ser Pro Pro Pro Pro Val Ser260 265 270Ala Gly Thr Gly Ser Gln Ala Gly Ser Ala Pro Val Asn Tyr Ser Asn275 280 285Pro Ser Gly Gly Glu Gln Ser Ser Ser Pro Gly Gly Ala Pro Val290 295 300(2)SEQ ID NO93的信息(i)序列特征(A)长度28个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO93Gly Cys Gly Glu Thr Asp Ala Ala Thr Leu Ala Gln Glu Ala Gly Asn1 5 10 15Phe Glu Arg Ile Ser Gly Asp Leu Lys Thr Gln Ile20 25(2)SEQ ID NO94的信息(i)序列特征
(A)长度16个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO94Asp Gln Val Glu Ser Thr Ala Gly Ser Leu Gln Gly Gln Trp Arg Gly1 5 10 15(2)SEQ ID NO95的信息(i)序列特征(A)长度27个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO95Gly Cys Gly Ser Thr Ala Gly Ser Leu Gln Gly Gln Trp Arg Gly Ala1 5 10 15Ala Gly Thr Ala Ala Gln Ala Ala Val Val Arg20 25(2)SEQ ID NO96的信息(i)序列特征(A)长度27个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO96Gly Cys Gly Gly Thr Ala Ala Gln Ala Ala Val Val Arg Phe Gln Glu1 5 10 15Ala Ala Asn Lys Gln Lys Gln Glu Leu Asp Glu20 25(2)SEQ ID NO97的信息(i)序列特征(A)长度27个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO97Gly Cys Gly Ala Asn Lys Gln Lys Gln Glu Leu Asp Glu Ile Ser Thr1 5 10 15Asn Ile Arg Gln Ala Gly Val Gln Tyr Ser Arg20 25(2)SEQ ID NO98的信息(i)序列特征(A)长度28个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO98Gly Cys Gly Ile Arg Gln Ala Gly Val Gln Tyr Ser Arg Ala Asp Glu1 5 10 15Glu Gln Gln Gln Ala Leu Ser Ser Gln Met Gly Phe20 25(2)SEQ ID NO99的信息(i)序列特征(A)长度507个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO99ATGAAGATGG TGAAATCGAT CGCCGCAGGT CTGACCGCCG CGGCTGCAAT CGGCGCCGCT 60GCGGCCGGTG TGACTTCGAT CATGGCTGGC GGCCCGGTCG TATACCAGAT GCAGCCGGTC 120GTCTTCGGCG CGCCACTGCC GTTGGACCCG GCATCCGCCC CTGACGTCCC GACCGCCGCC 180CAGTTGACCA GCCTGCTCAA CAGCCTCGCC GATCCCAACG TGTCGTTTGC GAACAAGGGC 240AGTCTGGTCG AGGGCGGCAT CGGGGGCACC GAGGCGCGCA TCGCCGACCA CAAGCTGAAG 300AAGGCCGCCG AGCACGGGGA TCTGCCGCTG TCGTTCAGCG TGACGAACAT CCAGCCGGCG 360GCCGCCGGTT CGGCCACCGC CGACGTTTCC GTCTCGGGTC CGAAGCTCTC GTCGCCGGTC 420ACGCAGAACG TCACGTTCGT GAATCAAGGC GGCTGGATGC TGTCACGCGC ATCGGCGATG 480GAGTTGCTGC AGGCCGCAGG GAACTGA 507(2)SEQ ID NOl00的信息(i)序列特征(A)长度168个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO100Met Lys Met Val Lys Ser Ile Ala Ala Gly Leu Thr Ala Ala Ala Ala1 5 10 15Ile Gly Ala Ala Ala Ala Gly Val Thr Ser Ile Met Ala Gly Gly Pro20 25 30Val Val Tyr Gln Met Gln Pro Val Val Phe Gly Ala Pro Leu Pro Leu35 40 45Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln Leu Thr Ser50 55 60Leu Leu Ash Ser Leu Ala Asp Pro Asn Val Ser Phe Ala Asn Lys Gly65 70 75 80Ser Leu Val Glu Gly Gly Ile Gly Gly Thr Glu Ala Arg Ile Ala Asp85 90 95His Lys Leu Lys Lys Ala Ala Glu His Gly Asp Leu Pro Leu Ser Phe100 105 110Ser Val Thr Asn Ile Gln Pro Ala Ala Ala Gly Ser Ala Thr Ala Asp115 120 125Val Ser Val Ser Gly Pro Lys Leu Ser Ser Pro Val Thr Gln Asn Val130 135 140Thr Phe Val Asn Gln Gly Gly Trp Met Leu Ser Arg Ala Ser Ala Met145 150 155 160Glu Leu Leu Gln Ala Ala Gly Asn165(2)SEQ ID NO101的信息(i)序列特征(A)长度500个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO101CGTGGCAATG TCGTTGACCG TCGGGGCCGG GGTCGCCTCC GCAGATCCCG TGGACGCGGT 60CATTAACACC ACCTGCAATT ACGGGCAGGT AGTAGCTGCG CTCAACGCGA CGGATCCGGG 120GGCTGCCGCA CAGTTCAACG CCTCACCGGT GGCGCAGTCC TATTTGCGCA ATTTCCTCGC 180CGCACCGCCA CCTCAGCGCG CTGCCATGGC CGCGCAATTG CAAGCTGTGC CGGGGGCGGC 240ACAGTACATC GGCCrTGTCG AGTCGGTTGC CGGCTCCTGC AACAACTATT AAGCCCATGC 300GGGCCCCATC CCGCGACCCG GCATCGTCGC CGGGGCTAGG CCAGATTGCC CCGCTCCTCA 360ACGGGCCGCA TCCCGCGACC CGGCATCGTC GCCGGGGCTA GGCCAGATTG CCCCGCTCCT 420CAACGGGCCG CATCTCGTGC CGAATTCCTG CAGCCCGGGG GATCCACTAG TTCTAGAGCG 480GCCGCCACCG CGGTGGAGCT 500(2)SEQ ID NO102的信息(i)序列特征(A)长度96个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO102Val Ala Met Ser Leu Thr Val Gly Ala Gly Val Ala Ser Ala Asp Pro1 5 10 15Val Asp Ala Val Ile Asn Thr Thr Cys Asn Tyr Gly Gln Val Val Ala20 25 30Ala Leu Asn Ala Thr Asp Pro Gly Ala Ala Ala Gln Phe Asn Ala Ser35 40 45Pro Val Ala Gln Ser Tyr Leu Arg Asn Phe Leu Ala Ala Pro Pro Pro50 55 60Gln Arg Ala Ala Met Ala Ala Gln Leu Gln Ala Val Pro Gly Ala Ala65 70 75 80Gln Tyr Ile Gly Leu Val Glu Ser Val Ala Gly Ser Cys Asn Asn Tyr85 90 95(2)SEQ ID NO103的信息(i)序列特征(A)长度154个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO103ATGACAGAGC AGCAGTGGAA TTTCGCGGGT ATCGAGGCCG CGGCAAGCGC AATCCAGGGA 60AATGTCACGT CCATTCATTC CCTCCTTGAC GAGGGGAAGC AGTCCCTGAC CAAGCTCGCA 120GCGGCCTGGG GCGGTAGCGG TTCGGAAGCG TACC 154(2)SEQ ID NO104的信息(i)序列特征(A)长度51个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO104Met Thr Glu Gln Gln Trp Asn Phe Ala Gly Ile Glu Ala Ala Ala Ser1 5 10 15Ala Ile Gln Gly Asn Val Thr Ser Ile His Ser Leu Leu Asp Glu Gly20 25 30Lys Gln Ser Leu Thr Lys Leu Ala Ala Ala Trp Gly Gly Ser Gly Ser35 40 45Glu Ala Tyr50(2)SEQ ID NO105的信息(i)序列特征(A)长度282个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO105CGGTCGCGCA CTTCCAGGTG ACTATGAAAG TCGGCTTCCG NCTGGAGGAT TCCTGAACCT 60TCAAGCGCGG CCGATAACTG AGGTGCATCA TTAAGCGACT TTTCCAGAAC ATCCTGACGC 120GCTCGAAACG CGGCACAGCC GACGGTGGCT CCGNCGAGGC GCTGNCTCCA AAATCCCTGA 180GACAATTCGN CGGGGGCGCC TACAAGGAAG TCGGTGCTGA ATTCGNCGNG TATCTGGTCG 240ACCTGTGTGG TCTGNAGCCG GACGAAGCGG TGCTCGACGT CG 282(2)SEQ ID NO106的信息(i)序列特征(A)长度1565个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO106GTATGCGGCC ACTGAAGTCG CCAATGCGGC GGCGGCCAGC TAAGCCAGGA ACAGTCGGCA60CGAGAAACCA CGAGAAATAG GGACACGTAA TGGTGGATTT CGGGGCGTTA CCACCGGAGA 120TCAACTCCGC GAGGATGTAC GCCGGCCCGG GTTCGGCCTC GCTGGTGGCC GCGGCTCAGA 180TGTGGGACAG CGTGGCGAGT GACCTGTTTT CGGCCGCGTC GGCGTTTCAG TCGGTGGTCT 240GGGGTCTGAC GGTGGGGTCG TGGATAGGTT CGTCGGCGGG TCTGATGGTG GCGGCGGCCT 300CGCCGTATGT GGCGTGGATG AGCGTCACCG CGGGGCAGGC CGAGCTGACC GCCGCCCAGG 360TCCGGGTTGC TGCGGCGGCC TACGAGACGG CGTATGGGCT GACGGTGCCC CCGCCGGTGA 420TCGCCGAGAA CCGTGCTGAA CTGATGATTC TGATAGCGAC CAACCTCTTG GGGCAAAACA 480CCCCGGCGAT CGCGGTCAAC GAGGCCGAAT ACGGCGAGAT GTGGGCCCAA GACGCCGCCG 540CGATGTTTGG CTACGCCGCG GCGACGGCGA CGGCGACGGC GACGTTGCTG CCGTTCGAGG 600AGGCGCCGGA GATGACCAGC GCGGGTGGGC TCCTCGAGCA GGCCGCCGCG GTCGAGGAGG 660CCTCCGACAC CGCCGCGGCG AACCAGTTGA TGAACAATGT GCCCCAGGCG CTGCAACAGC 720TGGCCCAGCC CACGCAGGGC ACCACGCCTT CTTCCAAGCT GGGTGGCCTG TGGAAGACGG 780TCTCGCCGCA TCGGTCGCCG ATCAGCAACA TGGTGTCAAT GGCCAACAAC CACATGTCAA 840TGACCAACTC GGGTGTGTCA ATGACCAACA CCTTGAGCTC GATGTTGAAG GGCTTTGCTC 900CGGCGGCGGC CGCCCAGGCC GTGCAAACCG CGGCGCAAAA CGGGGTCCGG GCGATGAGCT 960CGCTGGGCAG CTCGCTGGGT TCTTCGGGTC TGGGCGGTGG GGTGGCCGCC AACTTGGGTC 1020GGGCGGCCTC GGTCGGTTCG TTGTCGGTGC CGCAGGCCTG GGCCGCGGCC AACCAGGCAG 1080TCACCCCGGC GGCGCGGGCG CTGCCGCTGA CCAGCCTGAC CAGCGCCGCG GAAAGAGGGC 1140CCGGGCAGAT GCTGGGCGGG CTGCCGGTGG GGCAGATGGG CGCCAGGGCC GGTGGTGGGC 1200TCAGTGGTGT GCTGCGTGTT CCGCCGCGAC CCTATGTGAT GCCGCATTCT CCGGCGGCCG 1260GCTAGGAGAG GGGGCGCAGA CTGTCGTTAT TTGACCAGTG ATCGGCGGTC TCGGTGTTTC 1320CGCGGCCGGC TATGACAACA GTCAATGTGC ATGACAAGTT ACAGGTATTA GGTCCAGGTT 1380CAACAAGGAG ACAGGCAACA TGGCCTCACG TTTTATGACG GATCCGCACG CGATGCGGGA 1440CATGGCGGGC CGTTTTGAAG TGCACGCCCA GACGGTGGAG GACGAGGCTC GCCGGATGTG 1500GGCGTCCGCG CAAAACATTT CCGGTGCGGG CTGGAGTGGC ATGGCCGAGG CGACCTCGCT 1560AGACA 1565(2)SEQ ID NO107的信息(i)序列特征(A)长度391个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO107Met Val Asp Phe Gly Ala Leu Pro Pro Glu Ile Asn Ser Ala Arg Met1 5 10 15Tyr Ala Gly Pro Gly Ser Ala Ser Leu Val Ala Ala Ala Gln Met Trp20 25 30Asp Ser Val Ala Ser Asp Leu Phe Ser Ala Ala Ser Ala Phe Gln Ser35 40 45Val Val Trp Gly Leu Thr Val Gly Ser Trp Ile Gly Ser Ser Ala Gly50 55 60Leu Met Val Ala Ala Ala Ser Pro Tyr Val Ala Trp Met Ser Val Thr65 70 75 80Ala Gly Gln Ala Glu Leu Thr Ala Ala Gln Val Arg Val Ala Ala Ala85 90 95Ala Tyr Glu Thr Ala Tyr Gly Leu Thr Val Pro Pro Pro Val Ile Ala100 105 110Glu Asn Arg Ala Glu Leu Met Ile Leu Ile Ala Thr Asn Leu Leu Gly115 120 125Gln Asn Thr Pro Ala Ile Ala Val Asn Glu Ala Glu Tyr Gly Glu Met130 135 140Trp Ala Gln Asp Ala Ala Ala Met Phe Gly Tyr Ala Ala Ala Thr Ala145 150 155 160Thr Ala Thr Ala Thr Leu Leu Pro Phe Glu Glu Ala Pro Glu Met Thr165 170 175Ser Ala Gly Gly Leu Leu Glu Gln Ala Ala Ala Val Glu Glu Ala Ser180 185 190Asp Thr Ala Ala Ala Asn Gln Leu Met Asn Asn Val Pro Gln Ala Leu195 200 205Gln Gln Leu Ala Gln Pro Thr Gln Gly Thr Thr Pro Ser Ser Lys Leu210 215 220Gly Gly Leu Trp Lys Thr Val Ser Pro His Arg Ser Pro Ile Ser Asn225 230 235 240Met Val Ser Met Ala Asn Asn His Met Ser Met Thr Asn Ser Gly Val245 250 255Ser Met Thr Asn Thr Leu Ser Ser Met Leu Lys Gly Phe Ala Pro Ala260 265 270Ala Ala Ala Gln Ala Val Gln Thr Ala Ala Gln Asn Gly Val Arg Ala275 280 285Met Ser Ser Leu Gly Ser Ser Leu Gly Ser Ser Gly Leu Gly Gly Gly290 295 300Val Ala Ala Asn Leu Gly Arg Ala Ala Ser Val Gly Ser Leu Ser Val305 310 315 320Pro Gln Ala Trp Ala Ala Ala Asn Gln Ala Val Thr Pro Ala Ala Arg325 330 335Ala Leu Pro Leu Thr Ser Leu Thr Ser Ala Ala Glu Arg Gly Pro Gly340 345 350Gln Met Leu Gly Gly Leu Pro Val Gly Gln Met Gly Ala Arg Ala Gly355 360 365Gly Gly Leu Ser Gly Val Leu Arg Val Pro Pro Arg Pro Tyr Val Met370 375 380Pro His Ser Pro Ala Ala Gly385 390(2)SEQ ID NO108的信息(i)序列特征(A)长度259个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO108ACCAACACCT TGCACTCNAT GTTGAAGGGC TTAGCTCCGG CGGCGGCTCA GGCCGTGGAA 60ACCGCGGCGG AAAACGGGGT CTGGGCAATG AGCTCGCTGG GCAGCCAGCT GGGTTCGTCG 120CTGGGTTCTT CGGGTCTGGG CGCTGGGGTG GCCGCCAACT TGGGTCGGGC GGCCTCGGTC 180GGTTCGTTGT CGGTGCCGCC AGCATGGGCC GCGGCCAACC AGGCGGTCAC CCCGGCGGCG 240CGGGCGCTGC CGCTGACCA 259(2)SEQ ID NO109的信息(i)序列特征(A)长度86个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO109Thr Asn Thr Leu His Ser Met Leu Lys Gly Leu Ala Pro Ala Ala Ala1 5 10 15Gln Ala Val Glu Thr Ala Ala Glu Asn Gly Val Trp Ala Met Ser Ser20 25 30Leu Gly Ser Gln Leu Gly Ser Ser Leu Gly Ser Ser Gly Leu Gly Ala35 40 45Gly Val Ala Ala Asn Leu Gly Arg Ala Ala Ser Val Gly Ser Leu Ser50 55 60Val Pro Pro Ala Trp Ala Ala Ala Asn Gln Ala Val Thr Pro Ala Ala65 70 75 80Arg Ala Leu Pro Leu Thr85(2)SEQ ID NO110的信息(i)序列特征(A)长度1109个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO110TACTTGAGAG AATTTGACCT GTTGCCGACG TTGTTTGCTG TCCATCATTG GTGCTAGTTA60TGGCCGAGCG GAAGGATTAT CGAAGTGGTG GACTTCGGGG CGTTACCACC GGAGATCAAC 120TCCGCGAGGA TGTACGCCGG CCCGGGTTCG GCCTCGCTGG TGGCCGCCGC GAAGATGTGG 180GACAGCGTGG CGAGTGACCT GTTTTCGGCC GCGTCGGCGT TTCAGTCGGT GGTCTGGGGT 240CTGACGACGG GATCGTGGAT AGGTTCGTCG GCGGGTCTGA TGGTGGCGGC GGCCTCGCCG 300TATGTGGCGT GGATGAGCGT CACCGCGGGG CAGGCCGAGC TGACCGCCGC CCAGGTCCGG 360GTTGCTGCGG CGGCCTACGA GACGGCGTAT GGGCTGACGG TGCCCCCGCC GGTGATCGCC 420GAGAACCGTG CTGAACTGAT GATTCTGATA GCGACCAACC TCTTGGGGCA AAACACCCCG 480GCGATCGCGG TCAACGAGGC CGAATACGGG GAGATGTGGG CCCAAGACGC CGCCGCGATG 540TTTGGCTACG CCGCCACGGC GGCGACGGCG ACCGAGGCGT TGCTGCCGTT CGAGGACGCC 600CCACTGATCA CCAACCCCGG CGGGCTCCTT GAGCAGGCCG TCGCGGTCGA GGAGGCCATC 660GACACCGCCG CGGCGAACCA GTTGATGAAC AATGTGCCCC AAGCGCTGCA ACAACTGGCC 720CAGCCCACGA AAAGCATCTG GCCGTTCGAC CAACTGAGTG AACTCTGGAA AGCCATCTCG 780CCGCATCTGT CGCCGCTCAG CAACATCGTG TCGATGCTCA ACAACCACGT GTCGATGACC 840AACTCGGGTG TGTCAATGGC CAGCACCTTG CACTCAATGT TGAAGGGCTT TGCTCCGGCG 900GCGGCTCAGG CCGTGGAAAC CGCGGCGCAA AACGGGGTCC AGGCGATGAG CTCGCTGGGC 960AGCCAGCTGG GTTCGTCGCT GGGTTCTTCG GGTCTGGGCG CTGGGGTGGC CGCCAACTTG 1020GGTCGGGCGG CCTCGGTCGG TTCGTTGTCG GTGCCGCAGG CCTGGGCCGC GGCCAACCAG 1080GCGGTCACCC CGGCGGCGCG GGCGCTGCC1109(2)SEQ ID NO111的信息(i)序列特征(A)长度341个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO111Val Val Asp Phe Gly Ala Leu Pro Pro Glu Ile Asn Ser Ala Arg Met1 5 10 15Tyr Ala Gly Pro Gly Ser Ala Ser Leu Val Ala Ala Ala Lys Met Trp20 25 30Asp Ser Val Ala Ser Asp Leu Phe Ser Ala Ala Ser Ala Phe Gln Ser35 40 45Val Val Trp Gly Leu Thr Thr Gly Ser Trp Ile Gly Ser Ser Ala Gly50 55 60Leu Met Val Ala Ala Ala Ser Pro Tyr Val Ala Trp Met Ser Val Thr65 70 75 80Ala Gly Gln Ala Glu Leu Thr Ala Ala Gln Val Arg Val Ala Ala Ala85 90 95Ala Tyr Glu Thr Ala Tyr Gly Leu Thr Val Pro Pro Pro Val Ile Ala100 105 110Glu Asn Arg Ala Glu Leu Met Ile Leu Ile Ala Thr Asn Leu Leu Gly115 120 125Gln Asn Thr Pro Ala Ile Ala Val Asn Glu Ala Glu Tyr Gly Glu Met130 135 140Trp Ala Gln Asp Ala Ala Ala Met Phe Gly Tyr Ala Ala Thr Ala Ala145 150 155 160Thr Ala Thr Glu Ala Leu Leu Pro Phe Glu Asp Ala Pro Leu Ile Thr165 170 175Asn Pro Gly Gly Leu Leu Glu Gln Ala Val Ala Val Glu Glu Ala Ile180 185 190Asp Thr Ala Ala Ala Asn Gln Leu Met Asn Asn Val Pro Gln Ala Leu195 200 205Gln Gln Leu Ala Gln Pro Thr Lys Ser Ile Trp Pro Phe Asp Gln Leu210 215 220Ser Glu Leu Trp Lys Ala Ile Ser Pro His Leu Ser Pro Leu Ser Asn225 230 235 240Ile Val Ser Met Leu Asn Asn His Val Ser Met Thr Asn Ser Gly Val245 250 255Ser Met Ala Ser Thr Leu His Ser Met Leu Lys Gly Phe Ala Pro Ala260 265 270Ala Ala Gln Ala Val Glu Thr Ala Ala Gln Asn Gly Val Gln Ala Met275 280 285Ser Ser Leu Gly Ser Gln Leu Gly Ser Ser Leu Gly Ser Ser Gly Leu290 295 300Gly Ala Gly Val Ala Ala Asn Leu Gly Arg Ala Ala Ser Val Gly Ser305 310 315 320Leu Ser Val Pro Gln Ala Trp Ala Ala Ala Asn Gln Ala Val Thr Pro325 330 335Ala Ala Arg Ala Leu340(2)SEQ ID NO112的信息(i)序列特征(A)长度1256个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO112CATCGGAGGG AGTGATCACC ATGCTGTGGC ACGCAATGCC ACCGGAGNTA AATACCGCAC60GGCTGATGGC CGGCGCGGGT CCGGCTCCAA TGCTTGCGGC GGCCGCGGGA TGGCAGACGC 120TTTCGGCGGC TCTGGACGCT CAGGCCGTCG AGTTGACCGC GCGCCTGAAC TCTCTGGGAG 180AAGCCTGGAC TGGAGGTGGC AGCGACAAGG CGCTTGCGGC TGCAACGCCG ATGGTGGTCT 240GGCTACAAAC CGCGTCAACA CAGGCCAAGA CCCGTGCGAT GCAGGCGACG GCGCAAGCCG 300CGGCATACAC CCAGGCCATG GCCACGACGC CGTCGCTGCC GGAGATCGCC GCCAACCACA 360TCACCCAGGC CGTCCTTACG GCCACCAACT TCTTCGGTAT CAACACGATC CCGATCGCGT 420TGACCGAGAT GGATTATTTC ATCCGTATGT GGAACCAGGC AGCCCTGGCA ATGGAGGTCT 480ACCAGGCCGA GACCGCGGTT AACACGCTTT TCGAGAAGCT CGAGCCGATG GCGTCGATCC 540TTGATCCCGG CGCGAGCCAG AGCACGACGA ACCCGATCTT CGGAATGCCC TCCCCTGGCA 600GCTCAACACC GGTTGGCCAG TTGCCGCCGG CGGCTACCCA GACCCTCGGC CAACTGGGTG 660AGATGAGCGG CCCGATGCAG CAGCTGACCC AGCCGCTGCA GCAGGTGACG TCGTTGTTCA 720GCCAGGTGGG CGGCACCGGC GGCGGCAACC CAGCCGACGA GGAAGCCGCG CAGATGGGCC 780TGCTCGGCAC CAGTCCGCTG TCGAACCATC CGCTGGCTGG TGGATCAGGC CCCAGCGCGG 840GCGCGGGCCT GCTGCGCGCG GAGTCGCTAC CTGGCGCAGG TGGGTCGTTG ACCCGCACGC 900CGCTGATGTC TCAGCTGATC GAAAAGCCGG TTGCCCCCTC GGTGATGCCG GCGGCTGCTG 960CCGGATCGTC GGCGACGGGT GGCGCCGCTC CGGTGGGTGC GGGAGCGATG GGCCAGGGTG 1020CGCAATCCGG CGGCTCCACC AGGCCGGGTC TGGTCGCGCC GGCACCGCTC GCGCAGGAGC 1080GTGAAGAAGA CGACGAGGAC GACTGGGACG AAGAGGACGA CTGGTGAGCT CCCGTAATGA 1140CAACAGACTT CCCGGCCACC CGGGCCGGAA GACTTGCCAA CATTTTGGCG AGGAAGGTAA 1200AGAGAGAAAG TAGTCCAGCA TGGCAGAGAT GAAGACCGAT GCCGCTACCC TCGCGC 1256(2)SEQ ID NO113的信息(i)序列特征(A)长度432个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO113CTAGTGGATG GGACCATGGC CATTTTCTGC AGTCTCACTG CCTTCTGTGT TGACATTTTG 60GCACGCCGGC GGAAACGAAG CACTGGGGTC GAAGAACGGC TGCGCTGCCA TATCGTCCGG 120AGCTTCCATA CCTTCGTGCG GCCGGAAGAG CTTGTCGTAG TCGGCCGCCA TGACAACCTC 180TCAGAGTGCG CTCAAACGTA TAAACACGAG AAAGGGCGAG ACCGACGGAA GGTCGAACTC 240GCCCGATCCC GTGTTTCGCT ATTCTACGCG AACTCGGCGT TGCCCTATGC GAACATCCCA 300GTGACGTTGC CTTCGGTCGA AGCCATTGCC TGACCGGCTT CGCTGATCGT CCGCGCCAGG 360TTCTGCAGCG CGTTGTTCAG CTCGGTAGCC GTGGCGTCCC ATTTTTGCTG GACACCCTGG 420TACGCCTCCG AA 432(2)SEQ ID NO114的信息(i)序列特征(A)长度368个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO114Met Leu Trp His Ala Met Pro Pro Glu Xaa Asn Thr Ala Arg Leu Met1 5 10 15Ala Gly Ala Gly Pro Ala Pro Met Leu Ala Ala Ala Ala Gly Trp Gln20 25 30Thr Leu Ser Ala Ala Leu Asp Ala Gln Ala Val Glu Leu Thr Ala Arg35 40 45Leu Asn Ser Leu Gly Glu Ala Trp Thr Gly Gly Gly Ser Asp Lys Ala50 55 60Leu Ala Ala Ala Thr Pro Met Val Val Trp Leu Gln Thr Ala Ser Thr65 70 75 80Gln Ala Lys Thr Arg Ala Met Gln Ala Thr Ala Gln Ala Ala Ala Tyr85 90 95Thr Gln Ala Met Ala Thr Thr Pro Ser Leu Pro Glu Ile Ala Ala Asn100105 110His Ile Thr Gln Ala Val Leu Thr Ala Thr Asn Phe Phe Gly Ile Asn115 120 125Thr Ile Pro Ile Ala Leu Thr Glu Met Asp Tyr Phe Ile Arg Met Trp130 135 140Asn Gln Ala Ala Leu Ala Met Glu Val Tyr Gln Ala Glu Thr Ala Val145 150 155 160Asn Thr Leu Phe Glu Lys Leu Glu Pro Met Ala Ser Ile Leu Asp Pro165 170 175Gly Ala Ser Gln Ser Thr Thr Asn Pro Ile Phe Gly Met Pro Ser Pro180185 190Gly Ser Ser Thr Pro Val Gly Gln Leu Pro Pro Ala Ala Thr Gln Thr195 200 205Leu Gly Gln Leu Gly Glu Met Ser Gly Pro Met Gln Gln Leu Thr Gln210 215 220Pro Leu Gln Gln Val Thr Ser Leu Phe Ser Gln Val Gly Gly Thr Gly225 230 235 240Gly Gly Asn Pro Ala Asp Glu Glu Ala Ala Gln Met Gly Leu Leu Gly245 250 255Thr Ser Pro Leu Ser Asn His Pro Leu Ala Gly Gly Ser Gly Pro Ser260 265 270Ala Gly Ala Gly Leu Leu Arg Ala Glu Ser Leu Pro Gly Ala Gly Gly275 280 285Ser Leu Thr Arg Thr Pro Leu Met Ser Gln Leu Ile Glu Lys Pro Val290 295 300Ala Pro Ser Val Met Pro Ala Ala Ala Ala Gly Ser Ser Ala Thr Gly305 310 315 320Gly Ala Ala Pro Val Gly Ala Gly Ala Met Gly Gln Gly Ala Gln Ser325 330 335Gly Gly Ser Thr Arg Pro Gly Leu Val Ala Pro Ala Pro Leu Ala Gln340 345 350Glu Arg Glu Glu Asp Asp Glu Asp Asp Trp Asp Glu Glu Asp Asp Trp355 360 365(2)SEQ ID NO115的信息(i)序列特征(A)长度12个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO115Met Ala Glu Met Lys Thr Asp Ala Ala Thr Leu Ala1 5 10(2)SEQ ID NO116的信息(i)序列特征(A)长度396个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO116GATCTCCGGC GACCTGAAAA CCCAGATCGA CCAGGTGGAG TCGACGGCAG GTTCGTTGCA 60GGGCCAGTGG CGCGGCGCGG CGGGGACGGC CGCCCAGGCC GCGGTGGTGC GCTTCCAAGA 120AGCAGCCAAT AAGCAGAAGC AGGAACTCGA CGAGATCTCG ACGAATATTC GTCAGGCCGG 180CGTCCAATAC TCGAGGGCCG ACGAGGAGCA GCAGCAGGCG CTGTCCTCGC AAATGGGCTT 240CTGACCCGCT AATACGAAAA GAAACGGAGC AAAAACATGA CAGAGCAGCA GTGGAATTTC 300GCGGGTATCG AGGCCGCGGC AAGCGCAATC CAGGGAAATG TCACGTCCAT TCATTCCCTC 360CTTGACGAGG GGAAGCAGTC CCTGACCAAG CTCGCA396(2)SEQ ID NO117的信息(i)序列特征(A)长度80个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO117Ile Ser Gly Asp Leu Lys Thr Gln Ile Asp Gln Val Glu Ser Thr Ala1 5 10 15Gly Ser Leu Gln Gly Gln Trp Arg Gly Ala Ala Gly Thr Ala Ala Gln20 25 30Ala Ala Val Val Arg Phe Gln Glu Ala Ala Asn Lys Gln Lys Gln Glu35 40 45Leu Asp Glu Ile Ser Thr Asn Ile Arg Gln Ala Gly Val Gln Tyr Ser50 55 60Arg Ala Asp Glu Glu Gln Gln Gln Ala Leu Ser Ser Gln Met Gly Phe65 70 75 80(2)SEQ ID NO118的信息(i)序列特征(A)长度387个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO118GTGGATCCCG ATCCCGTGTT TCGCTATTCT ACGCGAACTC GGCGTTGCCC TATGCGAACA 60TCCCAGTGAC GTTGCCTTCG GTCGAAGCCA TTGCCTGACC GGCTTCGCTG ATCGTCCGCG 120CCAGGTTCTG CAGCGCGTTG TTCAGCTCGG TAGCCGTGGC GTCCCATTTT TGCTGGACAC 180CCTGGTACGC CTCCGAACCG CTACCGCCCC AGGCCGCTGC GAGCTTGGTC AGGGACTGCT 240TCCCCTCGTC AAGGAGGGAA TGAATGGACG TGACATTTCC CTGGATTGCG CTTGCCGCGG 300CCTCGATACC CGCGAAATTC CACTGCTGCT CTGTCATGTT TTTGCTCCGT TTCTTTTCGT 360ATTAGCGGGT CAGAAGCCCA TTTGCGA 387(2)SEQ ID NO119的信息(i)序列特征(A)长度272个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO119CGGCACGAGG ATCTCGGTTG GCCCAACGGC GCTGGCGAGG GCTCCGTTCC GGGGGCGAGC 60TGCGCGCCGG ATGCTTCCTC TGCCCGCAGC CGCGCCTGGA TGGATGGACC AGTTGCTACC 120TTCCCGACGT TTCGTTCGGT GTCTGTGCGA TAGCGGTGAC CCCGGCGCGC ACGTCGGGAG 180TGTTGGGGGG CAGGCCGGGT CGGTGGTTCG GCCGGGGACG CAGACGGTCT GGACGGAACG 240GGCGGGGGTT CGCCGATTGG CATCTTTGCC CA272(2)SEQ ID NO120的信息(i)序列特征(A)长度 20个氨基酸
(B)类型氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO120Asp Pro Val Asp Ala Val Ile Asn Thr Thr Cys Asn Tyr Gly Gln Val1 5 10 15Val Ala Ala Leu20(2)SEQ ID NO121的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO121Ala Val Glu Ser Gly Met Leu Ala Leu Gly Thr Pro Ala Pro Ser1 5 10 15(2)SEQ ID NO122的信息(i)序列特征(A)长度19个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO122Ala Ala Met Lys Pro Arg Thr Gly Asp Gly Pro Leu Glu Ala Ala Lys1 5 10 15Glu Gly Arg(2)SEQ ID NO123的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO123Tyr Tyr Trp Cys Pro Gly Gln Pro Phe Asp Pro Ala Trp Gly Pro1 5 10 15(2)SEQ ID NO124的信息(i)序列特征(A)长度14个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO124Asp Ile Gly Ser Glu Ser Thr Glu Asp Gln Gln Xaa Ala Val1 5 10(2)SEQ ID NO125的信息(i)序列特征(A)长度13个氨基酸(B)类型氨基酸(C)链型
(D)拓扑结构线型(xi)序列描述SEQ ID NO125Ala Glu Glu Ser Ile Ser Thr Xaa Glu Xaa Ile Val Pro1 5 10(2)SEQ ID NO126的信息(i)序列特征(A)长度17个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO126Asp Pro Glu Pro Ala Pro Pro Val Pro Thr Thr Ala Ala Ser Pro Pro1 5 10 15Ser(2)SEQ ID NO127的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO127Ala Pro Lys Thr Tyr Xaa Glu Glu Leu Lys Gly Thr Asp Thr Gly1 5 10 15(2)SEQ ID NO128的信息(i)序列特征(A)长度30个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO128Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln Leu Thr Ser1 5 10 15Leu Leu Asn Ser Leu Ala Asp Pro Asn Val Ser Phe Ala Asn20 25 30(2)SEQ ID NO129的信息(i)序列特征(A)长度22个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO129Asp Pro Pro Asp Pro His Gln Xaa Asp Met Thr Lys Gly Tyr Tyr Pro1 5 10 15Gly Gly Arg Arg Xaa Phe20(2)SEQ ID NO130的信息(i)序列特征(A)长度7个氨基酸(B)类型氨基酸(C)链型
(D)拓扑结构线型(xi)序列描述SEQ ID NO130Asp Pro Gly Tyr Thr Pro Gly1 5(2)SEQ ID NO131的信息(i)序列特征(A)长度10个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(ix)特征(D)其它信息/注＝第二残基可以是Pro或者Thr(xi)序列描述SEQ ID NO131Xaa Xaa Gly Phe Thr Gly Pro Gln Phe Tyr1 5 10(2)SEQ ID NO132的信息(i)序列特征(A)长度9个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(ix)特征(D)其它信息/注＝第三残基可以是Gln或者Leu(xi)序列描述SEQ ID NO132Xaa Pro Xaa Val Thr Ala Tyr Ala Gly1 5(2)SEQ ID NO133的信息(i)序列特征(A)长度9个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO133Xaa Xaa Xaa Glu Lys Pro Phe Leu Arg1 5(2)SEQ ID NO134的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO134Xaa Asp Ser Glu Lys Ser Ala Thr Ile Lys Val Thr Asp Ala Ser1 5 10 15(2)SEQ ID NO135的信息(i)序列特征(A)长度个氨基酸(B)类型15氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO135Ala Gly Asp Thr Xaa Ile Tyr Ile Val Gly Asn Leu Thr Ala Asp1 5 10 15(2)SEQ ID NO136的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO136Ala Pro Glu Ser Gly Ala Gly Leu Gly Gly Thr Val Gln Ala Gly1 5 10 15(2)SEQ ID NO137的信息(i)序列特征(A)长度21个氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线型(xi)序列描述SEQ ID NO137Xaa Tyr Ile Ala Tyr Xaa Thr Thr Ala Gly Ile Val Pro Gly Lys Ile1 5 10 15Asn Val His Leu Val20
权利要求
1.一种多肽，该多肽包含可溶性结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的免疫原性部分，其中所说的抗原具有选自下组的N端序列(a)Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Cys-Asn-Tyr-Gly-Gln-Val-Val-Ala-Ala-Leu；(SEQ ID NO.120)(b)Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-Ser(SEQ ID NO.121)(c)Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-Leu-Glu-Ala-Ala-Lys-Glu-Gly-Arg；(SEQ ID NO.122)(d)Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-Pro；(SEQ ID NO.123)(e)Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val；(SEQ ID NO.124)(f)Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro；(SEQ ID NO.125)(g)Asp-Pro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Thr-Ala-Ala-Ser-Pro-Pro-Ser；(SEQ ID NO.126)(h)Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-Gly；(SEQ ID NO.127)(i)Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Leu-Thr-Ser-Leu-Leu-Asn-Ser-Leu-Ala-Asp-Pro-Asn-Val-Ser-Phe-Ala-Asn；(SEQ ID NO.128)和(j)Ala-Pro-Glu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-Ala-Gly；(SEQ ID NO.136)其中Xaa可以是任何氨基酸。
2.一种多肽，该多肽包含结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的免疫原性部分，其中所说的抗原具有选自下组的N端序列(a)Asp-Pro-Pro-Asp-Pro-His-Gln-Xaa-Asp-Met-Thr-Lys-Gly-Tyr-Tyr-Pro-Gly-Gly-Arg-Arg-Xaa-Phe；(SEQ ID NO.129)；和(b)Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-Ile-Asn-Val-His-Leu-Val；(SEQ ID NO.137)，其中Xaa可以是任何氨基酸。
3.一种多肽，该多肽包含可溶性结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的免疫原性部分，其中所说的抗原包含由选自下组的DNA序列编码的氨基酸序列SEQ ID NO.1，2，4-10，13-25，52，99和101中所示的序列、这些序列的补体、以及在中等严格条件下与SEQ ID NO.1，2，4-10，13-25，52，99和101中所示的序列杂交的DNA序列或它们的补体。
4.一种多肽，该多肽包含结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的免疫原性部分，其中所说的抗原包含由选自下组的DNA序列编码的氨基酸序列SEQ ID NO.26-51中所示的序列、这些序列的补体、和在中等严格条件下与SEQ ID NO.26-51中所示的序列杂交的DNA序列或它们的补体。
5.一种DNA分子，该分子包含编码按照权利要求1-4之任一的多肽的核苷酸序列。
6.一种表达载体，该载体包含按照权利要求5的DNA分子。
7.一种宿主细胞，该宿主细胞由按照权利要求6的表达载体转化过。
8.权利要求7的宿主细胞，其中所说的宿主细胞选自大肠杆菌、酵母和哺乳动物细胞。
9.一种药物组合物，该组合物包含一种或多种按照权利要求1-4的多肽和生理学上可接受的载体。
10.一种药物组合物，该组合物包含一种或多种按照权利要求5的DNA分子和生理学上可接受的载体。
11.一种药物组合物，该组合物包含一种或多种SEQ ID NO3，11和12中所列举的DNA序列和生理学上可接受的载体。
12.一种疫苗，该疫苗包含一种或多种按照权利要求1-4之任一的多肽和一种非特异性免疫反应增强剂。
13.一种疫苗，该疫苗包含具有选自由SEQ ID NO.134和135所示的序列组成的组的N端序列的多肽；和一种非特异性免疫反应增强剂。
14.一种疫苗，该疫苗包含由选自下组的DNA序列编码的一种或多种多肽SEQ ID NO.3，11和12的序列、这些序列的补体、以及与SEQ ID NO.3，11和12所示的序列杂交的DNA序列；和一种非特异性免疫反应增强剂。
15.权利要求12-14的疫苗，其中所说的非特异性免疫反应增强剂是佐剂。
16.一种疫苗，该疫苗包含一种或多种按照权利要求5的DNA分子和一种非特异性免疫反应增强剂。
17.一种疫苗，该疫苗包含一种或多种SEQ ID NO.3，11和12所示的DNA序列和一种非异性免疫反应增强剂。
18.按照权利要求16或17的疫苗，其中所说的非特异性免疫反应增强剂是佐剂。
19.一种在患者中诱导保护性免疫的方法，该方法包括对患者施用按照权利要求9-11之任一的药物组合物。
20.一种在患者中诱导保护性免疫的方法，该方法包括对患者施用按照权利要求12-18之任一的疫苗。
21.一种融合蛋白，该融合蛋白包含两种或多种按照权利要求1-4之任一的多肽。
22.一种融合蛋白，该融合蛋白包含一种或多种按照权利要求1-4之任一的多肽和ESAT-6。
23.一种药物组合物，该组合物包含按照权利要求21或22的融合蛋白和生理学上可接受的载体。
24.一种疫苗，该疫苗包含按照权利要求21或22的融合蛋白和一种非特异性免疫反应增强剂。
25.权利要求24的疫苗，其中所说的非特异性免疫反应增强剂是佐剂。
26.一种在患者中诱导保护性免疫的方法，该方法包括对患者施用按照权利要求23的药物组合物。
27.一种在患者中诱导保护性免疫的方法，该方法包括对患者施用按照权利要求24或25的疫苗。
28.一种用于在患者中检测结核病的方法，该方法包括(a)使患者的皮肤细胞与一种或多种按照权利要求1-4之任一的多肽接触；和(b)检测在患者皮肤上的免疫反应，由此在患者中检测结核病。
29.一种用于在患者中检测结核病的方法，该方法包括(a)使患者的皮肤细胞与具有选自由SEQ ID NO.134和135所示的序列组成的组的N端序列的多肽接触；和(b)检测在患者皮肤上的免疫反应，由此在患者中检测结核病。
30.一种用于在患者中检测结核病的方法，该方法包括(a)使患者的皮肤细胞与由选自下组的DNA序列编码的一种或多种多肽接触SEQ ID NO.3，11和12的序列、这些序列的补体、以及与SEQ IDNO.3，11和12所示的序列杂交的DNA序列；和(b)检测在患者皮肤上的免疫反应，由此在患者中检测结核病。
31.权利要求28-30之任一的方法，其中所说的免疫反应是硬结。
32.一种诊断试剂盒，该试剂盒包含(a)按照权利要求1-4之任一的多肽；和(b)足以把所说的多肽与患者的皮肤细胞接触的装置。
33.一种诊断试剂盒，该试剂盒包含(a)具有选自由SEQ ID NO.134和135所示的序列组成的组的N端序列的多肽；和(b)足以把所说的多肽与患者的皮肤细胞接触的装置。
34.一种诊断试剂盒，该试剂盒包含(a)由选自下组的DNA序列编码的一种或多种多肽SEQ ID NO.3，11和12的序列、这些序列的补体、以及与SEQ ID NO.3，11和12所示的序列杂交的DNA序列；和(b)足以把所说的多肽与患者的皮肤细胞接触的装置。
全文摘要
本文公开了用于诱导针对结核病的保护性免疫的化合物和方法。所提供的化合物包括多肽以及编码这些多肽的DNA分子,所说的多肽含有一种或多种结核分枝杆菌蛋白质的至少一种免疫原性部分。这些化合物可以配制成供抗结核分枝杆菌感染之免疫的疫苗和/或药物组合物,或者可以用于诊断结核病。
文档编号C12N15/09GK1200147SQ96197639
公开日1998年11月25日申请日期1996年8月30日优先权日1995年9月1日
发明者S·G·里德, Y·A·W·斯基凯, D·C·狄隆, A·坎泊斯-尼托, R·豪格顿, T·H·维德维克, D·R·特瓦德泽克申请人:科里克萨有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：S·G·里德、Y·A·W·斯基凯、D·C·狄隆、A·坎泊斯-尼托、R·豪格顿、T·H·维德维克、D·R·特瓦德泽克
技术所有人：科里克萨有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.食品功能因子基因工程菌种的构建、智能高通量进化筛选 2.发酵工艺优化
2、马老师：1.酶工程与生物催化 2.酿造技术与风味分析 3.生物质资源综合利用
3、林老师：1.酿造微生物育种及关键酿造工艺开发 2. 真菌基因功能及调控网络解析 3.精细化学品、蛋白真菌细胞底盘开发
4、张老师：1.发酵食品安全：危害物相关基因的筛选，危害物产生菌的快速检测，危害物的预警和发酵过程控制 2.真菌次级代谢与调控 3.酿造酒相关研究
5、郭老师：1.现代酿造技术与食品安全 2. 酵母生物学 3.生物基化学品与合成生物学
如您是高校老师，可以点此联系我们加入专家库。