免疫治疗和诊断结核病的化合物和方法

文档序号：451053阅读：1096来源：国知局

专利名称：免疫治疗和诊断结核病的化合物和方法
技术领域：
本发明一般涉及检测，治疗和预防结核分枝杆菌(Mycobacteriumtuberculosis)感染。本发明更特别地涉及包含结核分枝杆菌抗原，或者其部分或其其它变体的多肽，以及这样的多肽对结核分枝杆菌感染进行诊断和接种疫苗的用途。
背景技术：
结核病是慢性感染病，其一般是由结核分枝杆菌感染引起的。其是发展中国家的一种主要的疾病，而且在世界的发展地区出现越来越多的问题，每年大约8百万新的病例和3百万死亡。尽管感染可能在相当一段时间是无症状的，但是该疾病最通常表现为肺部急性炎症，导致发烧和干咳。如果不加以治疗，一般导致严重的并发症和死亡。
尽管结核病一般可以使用扩大的抗生素治疗来控制，但是这样的治疗不足以防止疾病的蔓延。感染的个体可能是无症状的，但是在一定时间是接触传染的。另外，尽管治疗方案的顺应性是严格的，但是患者的行为是难以监控的。一些患者不完成治疗期，这导致没有效果的治疗和产生抗药性。
抑制结核病的蔓延需要有效的疫苗接种和疾病的准确，早期的诊断。最近，用活细菌接种是诱导保护性免疫的最有效的方法。用于该目的的最普通的分枝杆菌是芽孢杆菌Calmette-Guerin(BCG)，一种牛分枝杆菌(Mycobacterium bovis)的减毒株。但是BCG的安全性和效力是争论之话题，而且在一些国家，例如在美国，一般公众不接种。诊断一般用皮试完成，其涉及真皮内暴露给结核菌素PPD(蛋白质纯化的衍生物)。注射后48-72小时在注射点抗原特异性T细胞应答产生可测的硬结，其表明暴露在分枝杆菌抗原之下。但是该试验的问题是敏感性和特异性，并且接种BCG的个体不能和感染的个体区分开来。
巨噬细胞表现出作为结核分枝杆菌免疫的主要效应子而起作用，而T细胞是这样的免疫的主要的诱导物。T细胞在抗结核分枝杆菌感染的保护中的主要作用通过由于与人免疫缺陷病毒(HIV)感染相关的CD4 T细胞的缺失而在AIDS患者中频繁发生结核分枝杆菌来说明。分枝杆菌-反应性CD4 T细胞表现出是γ-干扰素(IFN-γ)的潜在的生产者，而后者接着表现出在小鼠内触发巨噬细胞的抗分枝杆菌作用。尽管IFN-γ在人体内的作用尚不十分清楚，但是研究表明1，25-二羟基-维生素D3，单独地或者与IFN-γ或者α-肿瘤坏死因子组合，激活人巨噬细胞抑制结核分枝杆菌感染。此外，已知IFN-γ刺激人巨噬细胞产生1，25-二羟基-维生素D3。类似地，IL-12表现出在刺激对结核分枝杆菌感染的抗性中起作用。关于结核分枝杆菌感染免疫学的综述参见Chan和Kaufmann，结核病发病机理，保护和治疗Tuberculosis；Pathogenesis，Protect and Control，Bloom(编著)，ASM出版，华盛顿，DC，1994。
因此，本领域存在对于改进的疫苗和预防，治疗和诊断结核病的方法的需要。本发明满足了这些需要，并且进一步提供了其它相关的优点发明概述简要地说，本发明提供用于预防和诊断结核病的化合物和方法。一方面，提供的多肽包含可溶性结核分枝杆菌抗原或者这样的抗原的变体的免疫原性部分，所述抗原的变体只是在保守性替换和/或修饰上不同。在该方面的实施方案中，该可溶性抗原具有下面N-末端序列之(a)Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Cys-Asn-Tyr-Gly-Gln-Val-Val-Ala-Ala-Leu；(SEQ ID No.120)(b)Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-Ser；(SEQ ID No.121)(c)Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-Leu-Glu-Ala-Ala-Lys-Glu-Gly-Arg；(SEQ ID No.122)(d)Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-Pro；(SEQ ID No.123)
(e)Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val；(SEQ ID No.124)(f)Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro；(SEQ IDNo.125)(g)Asp-Pro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Thr-Ala-Ala-Ser-Pro-Pro-Ser；(SEQ ID No.126)(h)Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-Gly；(SEQ ID No.127)(i)Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Leu-Thr-Ser-Leu-Leu-Asn-Ser-Leu-Ala-Asp-Pro-Asn-Val-Ser-Phe-Ala-Asn；(SEQ ID No.128)(j)Xaa-Asp-Ser-Glu-Lys-Ser-Ala-Thr-Ile-Lys-Val-Thr-Asp-Ala-Ser；(SEQ ID No.134)(k)Ala-Gly-Asp-Thr-Xaa-Ile-Tyr-Ile-Val-Gly-Asn-Leu-Thr-Ala-Asp；(SEQ ID No.135)或(l)Ala-Pro-Glu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-Ala-Gly；(SEQ ID No.136)其中Xaa可以是任何氨基酸。
在相关的方面，提供的多肽包含结核分枝杆菌抗原或者这样的抗原的变体的免疫原性部分，所述抗原的变体只是在保守性替换和/或修饰上不同。抗原具有下面N-末端序列之一(m) Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-Ile-Asn-Val-His-Leu-Val；(SEQ ID No.137)或(n) Asp-Pro-Pro-Asp-Pro-His-Gln-Xaa-Asp-Met-Thr-Lys-Gly-Tyr-Tyr-Pro-Gly-Gly-Arg-Arg-Xaa-Phe；(SEQ ID No.129)其中Xaa可以是任何氨基酸。
在另一个实施方案中，该可溶性结核分枝杆菌抗原包含选自SEQID Nos.1，2，4-10，13-25，52，99和101列出的序列，所述序列的互补序列和在中等严格条件下与SEQ ID Nos.1，2，4-10，13-25，52，99和101列出的序列或其互补序列杂交的DNA序列的DNA序列编码的氨基酸序列。
在相关的方面，该多肽包含结核分枝杆菌抗原或者这样的抗原的变体的免疫原性部分，所述抗原的变体只是在保守性替换和/或修饰上不同，其中抗原包含选自SEQ ID Nos.26-51，138，139，163-183和201列出的序列，所述序列的互补序列和在中等严格条件下与SEQ ID Nos.26-51，138，139，163-183和201列出的序列或其互补序列杂交的DNA序列的DNA序列编码的氨基酸序列。
在相关的方面，也提供了编码上述多肽的DNA序列，包含这些DNA序列的表达载体和用这样的表达载体转化或转染的宿主细胞。
另一方面，本发明提供融合的蛋白质，其包含第一和第二本发明多肽，或者本发明多肽和已知的结核分枝杆菌抗原。
在其它方面，本发明提供含有一种或多种上述多肽，或者编码这样的多肽的DNA分子，和药学可接受载体的药物组合物。本发明还提供包含一种或多种如上所述多肽和非特异性免疫应答增强剂的疫苗，以及含有一种或多种编码这样的多肽的DNA序列和非特异性免疫应答增强剂的疫苗。
在又一方面，提供诱导患者保护性免疫的方法，包括给予患者有效量的一种或多种上述多肽。
在本发明又一方面，提供检查患者结核病的方法和诊断盒。该方法包括用一种或多种上述多肽接触患者的皮细胞，并且检查患者皮肤上的免疫反应。诊断盒包括一种或多种上述多肽和足以使多肽接触患者的皮细胞的设备。
另外方面中，提供检查患者结核病的方法，该方法包括用选自SEQID Nos.3，11，12，140，141，156-160，189-193，199，200和203的序列，所述序列的互补序列，和与SEQ ID Nos.3，11，12，140，141，156-160，189-193，199，200和203列出的序列杂交的DNA序列编码的一种或多种多肽接触患者皮细胞；并且检查患者皮肤上的免疫反应。也提供了在这样的方法中使用的诊断盒。
参照下面的详细描述和附图，本发明的这些和其它方面将变得显而易见。这里所公开的全部参考其全部引作参考，好象其各自引作参考一样。
附图和序列鉴定的简要说明

图1A和B详细说明实施例1描述的14Kd，20Kd和26Kd抗原分别对来自第一和第二结核分枝杆菌免疫供者的T细胞的增殖和干扰素-γ产生的刺激作用。
图2详细说明两种代表性多肽TbRa3和TbRa9对来自结核分枝杆菌免疫个体的T细胞中的增殖和干扰素-γ产生的刺激作用。
图3A-D详细说明结核分枝杆菌裂解物(泳道2)，结核分枝杆菌分泌蛋白(泳道3)，重组体Tb38-1(泳道4)，重组体TbH-9(泳道5)和重组体85b(泳道5)分别抗分泌性结核分枝杆菌蛋白，已知的结核分枝杆菌抗原85b和本发明抗原Tb38-1和TbH-9抗血清反应性。
图4A详细说明分泌性结核分枝杆菌蛋白，重组体TbH-9和对照抗原TbRa11对TbH-9-特异性T细胞克隆增殖的刺激作用。
图4B详细说明分泌性结核分枝杆菌蛋白，PPD和重组体TbH-9对TbH-9-特异性T细胞克隆中干扰素-γ产生的刺激作用。
图5A和B详细说明融合蛋白TbH9-Tb38-1对TbH-9-特异性T细胞中增殖和干扰素-γ产生的刺激作用。
图6A和B详细说明融合蛋白TbH9-Tb38-1对Tb38-1-特异性T细胞增殖和干扰素-γ产生的刺激作用。
图7A和B详细说明融合蛋白TbH9-Tb38-1对先前表现出对TbH-9和Tb38-1两者应答的T细胞增殖和干扰素-γ产生的刺激作用图8A和B详细说明代表性多肽XP-1，RDIF6，RDIF8，RDIF10和RDIF11对来自第一结核分枝杆菌免疫个体的T细胞增殖和干扰素-γ产生的刺激作用。
图9A和B详细说明代表性多肽XP-1，RDIF6，RDIF8，RDIF10和RDIF11对来自第二结核分枝杆菌免疫个体的T细胞增殖和干扰素-γ产生的刺激作用。
SEQ.ID NO.1是TbRa1的DNA序列。
SEQ.ID NO.2是TbRa10的DNA序列。
SEQ.ID NO.3是TbRa11的DNA序列。
SEQ.ID NO.4是TbRa12的DNA序列。
SEQ.ID NO.5是TbRa13的DNA序列。
SEQ.ID NO.6是TbRa16的DNA序列。
SEQ.ID NO.7是TbRa17的DNA序列。
SEQ.ID NO.8是TbRa18的DNA序列。
SEQ.ID NO.9是TbRa19的DNA序列。
SEQ.ID NO.10是TbRa24的DNA序列。
SEQ.ID NO.11是TbRa26的DNA序列。
SEQ.ID NO.12是TbRa28的DNA序列。
SEQ.ID NO.13是TbRa29的DNA序列。
SEQ.ID NO.14是TbRa2A的DNA序列。
SEQ.ID NO.15是TbRa3的DNA序列。
SEQ.ID NO.16是TbRa32的DNA序列。
SEQ.ID NO.17是TbRa35的DNA序列。
SEQ.ID NO.18是TbRa36的DNA序列。
SEQ.ID NO.19是TbRa4的DNA序列。
SEQ.ID NO.20是TbRa9的DNA序列。
SEQ.ID NO.21是TbRaB的DNA序列。
SEQ.ID NO.22是TbRaC的DNA序列。
SEQ.ID NO.23是TbRaD的DNA序列。
SEQ.ID NO.24是YYWCPG的DNA序列。
SEQ.ID NO.25是AAMK的DNA序列。
SEQ.ID NO.26是TbL-23的DNA序列。
SEQ.ID NO.27是TbL-24的DNA序列。
SEQ.ID NO.28是TbL-25的DNA序列。SEQ.ID NO.29是TbL-28的DNA序列。SEQ.ID NO.30是TbL-29的DNA序列。SEQ.ID NO.31是TbH-5的DNA序列。SEQ.ID NO.32是TbH-8的DNA序列。SEQ.ID NO.33是TbH-9的DNA序列。SEQ.ID NO.34是TbM-1的DNA序列。SEQ.ID NO.35是TbM-3的DNA序列。SEQ.ID NO.36是TbM-6的DNA序列。SEQ.ID NO.37是TbM-7的DNA序列。SEQ.ID NO.38是TbM-9的DNA序列。SEQ.ID NO.39是TbM-12的DNA序列。SEQ.ID NO.40是TbM-13的DNA序列。SEQ.ID NO.41是TbM-14的DNA序列。SEQ.ID NO.42是TbM-15的DNA序列。SEQ.ID NO.43是TbH-4的DNA序列。SEQ.ID NO.44是TbH-4-FWD的DNA序列。SEQ.ID NO.45是TbH-12的DNA序列。SEQ.ID NO.46是Tb38-1的DNA序列。SEQ.ID NO.47是Tb38-4的DNA序列。SEQ.ID NO.48是TbL-17的DNA序列。SEQ.ID NO.49是TbL-20的DNA序列。SEQ.ID NO.50是TbL-21的DNA序列。SEQ.ID NO.51是TbH-16的DNA序列。SEQ.ID NO.52是DPEP的DNA序列。SEQ.ID NO.53是DPEP的推导的氨基酸序列。SEQ.ID NO.54是DPV N-末端抗原的蛋白质序列。SEQ.ID NO.55是AVGS N-末端抗原的蛋白质序列。SEQ.ID NO.56是AAMK N-末端抗原的蛋白质序列。SEQ.ID NO.57是YYWC N-末端抗原的蛋白质序列。SEQ.ID NO.58是DIGS N-末端抗原的蛋白质序列。SEQ.ID NO.59是AEES N-末端抗原的蛋白质序列。SEQ.ID NO.60是DPEP N-末端抗原的蛋白质序列。SEQ.ID NO.61是APKT N-末端抗原的蛋白质序列。SEQ.ID NO.62是DPAS N-末端抗原的蛋白质序列。SEQ.ID NO.63是TbRa1的推导的氨基酸序列。SEQ.ID NO.64是TbRa10的推导的氨基酸序列。SEQ.ID NO.65是TbRa11的推导的氨基酸序列。SEQ.ID NO.66是TbRa12的推导的氨基酸序列。SEQ.ID NO.67是TbRa13的推导的氨基酸序列。SEQ.ID NO.68是TbRa16的推导的氨基酸序列。SEQ.ID NO.69是TbRa17的推导的氨基酸序列。SEQ.ID NO.70是TbRa18的推导的氨基酸序列。SEQ.ID NO.71是TbRa19的推导的氨基酸序列。SEQ.ID NO.72是TbRa24的推导的氨基酸序列。SEQ.ID NO.73是TbRa26的推导的氨基酸序列。SEQ.ID NO.74是TbRa28的推导的氨基酸序列。SEQ.ID NO.75是TbRa29的推导的氨基酸序列。SEQ.ID NO.76是TbRa2A的推导的氨基酸序列。SEQ.ID NO.77是TbRa3的推导的氨基酸序列。SEQ.ID NO.78是TbRa32的推导的氨基酸序列。SEQ.ID NO.79是TbRa35的推导的氨基酸序列。SEQ.ID NO.80是TbRa36的推导的氨基酸序列。SEQ.ID NO.81是TbRa4的推导的氨基酸序列。SEQ.ID NO.82是TbRa9的推导的氨基酸序列。SEQ.ID NO.83是TbRaB的推导的氨基酸序列。SEQ.ID NO.84是TbRaC的推导的氨基酸序列。SEQ.ID NO.85是TbRaD的推导的氨基酸序列。SEQ.ID NO.86是YYWCPG的推导的氨基酸序列。SEQ.ID NO.87是TbAAMK的DNA序列。SEQ.ID NO.88是Tb38-1的推导的氨基酸序列。SEQ.ID NO.89是TbH-4的推导的氨基酸序列。SEQ.ID NO.90是TbH-8的推导的氨基酸序列。SEQ.ID NO.91是TbH-9的推导的氨基酸序列。SEQ.ID NO.92是TbH-12的推导的氨基酸序列。SEQ.ID NO.93是Tb38-1肽1的氨基酸序列。SEQ.ID NO.94是Tb38-1肽2的氨基酸序列。SEQ.ID NO.95是Tb38-1肽3的氨基酸序列。SEQ.ID NO.96是Tb38-1肽4的氨基酸序列。SEQ.ID NO.97是Tb38-1肽5的氨基酸序列。SEQ.ID NO.98是Tb38-1肽6的氨基酸序列。SEQ.ID NO.99是DPAS的DNA序列。SEQ.ID NO.100是DPAS的推导的氨基酸序列。SEQ.ID NO.101是DPV的DNA序列。SEQ.ID NO.102是DPV的推导的氨基酸序列。SEQ.ID NO.103是ESAT-6的DNA序列。SEQ.ID NO.104是ESAT-6的推导的氨基酸序列。SEQ.ID NO.105是TbH-8-2的DNA序列。SEQ.ID NO.106是TbH-9FL的DNA序列。SEQ.ID NO.107是TbH-9FL的推导的氨基酸序列。SEQ.ID NO.108是TbH-9-1的DNA序列。SEQ.ID NO.109是TbH-9-1的推导的氨基酸序列。SEQ.ID NO.110是TbH-9-4的DNA序列。SEQ.ID NO.111是TbH-9-4的推导的氨基酸序列。SEQ.ID NO.112是Tb38-1F2IN的DNA序列。SEQ.ID NO.113是Tb38-2F2RP的DNA序列。SEQ.ID NO.114是Tb37-FL的推导的氨基酸序列。SEQ.ID NO.115是Tb38-IN的推导的氨基酸序列。SEQ.ID NO.116是Tb38-1F3的DNA序列。SEQ.ID NO.117是Tb38-1F3的推导的氨基酸序列。SEQ.ID NO.118是Tb38-1F5的DNA序列。SEQ.ID NO.119是Tb38-1F6的DNA序列。SEQ.ID NO.120是DPV的推导的N-末端氨基酸序列。SEQ.ID NO.121是AVGS的推导的N-末端氨基酸序列。SEQ.ID NO.122是AAMK的推导的N-末端氨基酸序列。SEQ.ID NO.123是YYWC的推导的N-末端氨基酸序列。SEQ.ID NO.124是DIGS的推导的N-末端氨基酸序列。
SEQ.ID NO.125是AEES的推导的N-末端氨基酸序列。
SEQ.ID NO.126是DPEP的推导的N-末端氨基酸序列。
SEQ.ID NO.127是APKT的推导的N-末端氨基酸序列。
SEQ.ID NO.128是DPAD的推导的氨基酸序列。
SEQ.ID NO.129是DPPD N-末端抗原的蛋白质序列。
SEQ.ID NO.130-133是四个DPPD溴化氰片段的蛋白质序列。
SEQ.ID NO.134是XDS抗原的N-末端蛋白质序列。
SEQ.ID NO.135是AGD抗原的N-末端蛋白质序列。
SEQ.ID NO.136是APE抗原的N-末端蛋白质序列。
SEQ.ID NO.137是XYI抗原的N-末端蛋白质序列SEQ.ID NO.138是TbH-29的DNA序列。
SEQ.ID NO.139是TbH-30的DNA序列。
SEQ.ID NO.140是TbH-32的DNA序列。
SEQ.ID NO.141是TbH-33的DNA序列。
SEQ.ID NO.142是TbH-29的预示的氨基酸序列。
SEQ.ID NO.143是TbH-30的预示的氨基酸序列。
SEQ.ID NO.144是TbH-32的预示的氨基酸序列。
SEQ.ID NO.145是TbH-33的预示的氨基酸序列。
SEQ.ID NO.146-151是制备包含TbRa3，38kD和Tb38-1的融合蛋白中使用的PCR引物。
SEQ.ID NO.152是包含TbRa3，38kD和Tb38-1的融合蛋白的DNA序列SEQ.ID NO.153是包含TbRa3，38kD和Tb38-1的融合蛋白的氨基酸序列。
SEQ.ID NO.154是结核分枝杆菌抗原38kD的DNA序列。
SEQ.ID NO.155是结核分枝杆菌抗原38kD的氨基酸序列。
SEQ.ID NO.156是XP14的DNA序列。
SEQ.ID NO.157是XP24的DNA序列。
SEQ.ID NO.158是XP31的DNA序列。
SEQ.ID NO.159是XP32的5′DNA序列。
SEQ.ID NO.160是XP32的3′DNA序列。
SEQ.ID NO.161是XP14的预示的氨基酸序列。
SEQ.ID NO.162是XP14的反向互补序列编码的预示的氨基酸序列。
SEQ.ID NO.163是XP27的DNA序列。
SEQ.ID NO.164是XP36的DNA序列。
SEQ.ID NO.165是XP4的5′DNA序列。
SEQ.ID NO.166是XP5的5′DNA序列。
SEQ.ID NO.167是XP17的5′DNA序列。
SEQ.ID NO.168是XP30的5′DNA序列。
SEQ.ID NO.169是XP2的5′DNA序列。
SEQ.ID NO.170是XP2的3′DNA序列。
SEQ.ID NO.171是XP3的5′DNA序列。
SEQ.ID NO.172是XP3的3′DNA序列。
SEQ.ID NO.173是XP6的5′DNA序列。
SEQ.ID NO.174是XP6的3′DNA序列。
SEQ.ID NO.175是XP18的5′DNA序列。
SEQ.ID NO.176是XP18的3′DNA序列。
SEQ.ID NO.177是XP19的5′DNA序列。
SEQ.ID NO.178是XP19的3′DNA序列。
SEQ.ID NO.179是XP22的5′DNA序列。
SEQ.ID NO.180是XP22的3′DNA序列。
SEQ.ID NO.181是XP25的5′DNA序列。
SEQ.ID NO.182是XP25的3′DNA序列。
SEQ.ID NO.183是TbH4-XP1的全长DNA序列。
SEQ.ID NO.184是TbH4-XP1的预示的氨基酸序列。
SEQ.ID NO.185是TbH4-XP1的反向互补序列编码的预示的氨基酸序列。
SEQ.ID NO.186是XP36编码的第一预示的氨基酸序列。
SEQ.ID NO.187是XP36编码的第二预示的氨基酸序列。
SEQ.ID NO.188是XP36的反向互补序列编码的预示的氨基酸序列。
SEQ.ID NO.189是RDIF2的DNA序列。
SEQ.ID NO.190是RDIF5的DNA序列。
SEQ.ID NO.191是RDIF8的DNA序列。
SEQ.ID NO.192是RDIF10的DNA序列。
SEQ.ID NO.193是RDIF11的DNA序列。
SEQ.ID NO.194是RDIF2的预示的氨基酸序列。
SEQ.ID NO.195是RDIF5的预示的氨基酸序列。
SEQ.ID NO.196是RDIF8的预示的氨基酸序列。
SEQ.ID NO.197是RDIF10的预示的氨基酸序列。
SEQ.ID NO.198是RDIF11的预示的氨基酸序列。
SEQ.ID NO.199是RDIF12的5′DNA序列。
SEQ.ID NO.200是RDIF12的3′DNA序列。
SEQ.ID NO.201是RDIF7的DNA序列。
SEQ.ID NO.202是RDIF7的预示的氨基酸序列。
SEQ.ID NO.203是DIF2-1的DNA序列。
SEQ.ID NO.204是DIF2-1的预示的氨基酸序列。
SEQ.ID NO.205-212是制备包含TbRa3，38kD，Tb38-1和DPEP的融合蛋白(下文称之为TbF-2)中使用的PCR引物。
SEQ.ID NO.213是融合蛋白TbF-2的DNA序列。
SEQ.ID NO.214是融合蛋白TbF-2的氨基酸序列。
发明的详细说明如上所述，本发明一般涉及预防，治疗和诊断结核病的组合物和方法。本发明组合物含有至少包含一种结核分枝杆菌抗原，或者只是保守性替换和/或修饰不同的这样的抗原的变体的免疫原性部分的多肽。本发明范围内的多肽包括但不限于免疫原性可溶性结核分枝杆菌抗原。“可溶性结核分枝杆菌抗原”是结核分枝杆菌培养物滤液中存在的结核分枝杆菌源的蛋白质。如这里所使用的，术语“多肽”包括其中氨基酸残基通过共价肽键连接的任何长度的氨基酸链，包括全长蛋白质(即抗原)。因此，包含上述抗原之一的免疫原性部分的多肽可以全部由免疫原性部分组成，或者可以包含另外的序列。另外的序列可以来自天然结核分枝杆菌抗原或者可以是异源的，并且这样的序列可以(但是不必须)是免疫原性的。
这里所使用的“免疫原性”指在患者，例如人，和/或在生物样品中诱发免疫应答(例如细胞的)的能力。特别地，是免疫原性的抗原(和这样的抗原的免疫原性部分或其它变体)能在含有一种或多种选自T细胞，NK细胞，B细胞和巨噬细胞的细胞的生物样品中刺激细胞增殖，白细胞介素-12产生和/或干扰素-γ产生，其中细胞来自结核分枝杆菌免疫的个体。至少包含一种或多种结核分枝杆菌抗原的免疫原性部分的多肽一般可以用来检查结核病或者诱发患者抗结核病的保护性免疫性。
本发明组合物和方法还涉及上述多肽的变体。“变体”，如在这里所使用的，是只是保守性替换和/或修饰不同于天然抗原，使得保留多肽诱发免疫应答的能力的多肽。这样的变体一般可以通过修饰上述多肽之一，并且使用例如这里所描述的代表性方法评价修饰的多肽的免疫原性来鉴定。
“保守性替换”是其中氨基酸被另一种具有相似性质的氨基酸替换，使得肽化学领域技术人员能预测多肽的二级结构和亲水性基本上没有变化的替换。一般情况下，下面组的氨基酸代表保守性变化(1)ala，pro，gly，glu，asp，gln，asn，scr，thr；(2)cys，ser，tyr，thr；(3)val，ile，leu，met，ala，phe；(4)lys，arg，his；和(5)phe，tyr，trp，his。
变体也可以(或者)通过例如对多肽的免疫原性，二级结构和亲水性具有极小影响的氨基酸的缺失或加入而修饰。例如，多肽与共翻译或翻译后指导蛋白质转移的蛋白质N-末端的信号(或前导)序列偶联。多肽还可以偶联于易于多肽(例如多-His)的合成，纯化或鉴定，或者增强多肽与固体载体结合的接头或其它序列。例如，多肽可以与免疫球蛋白Fc区偶联。
在相关的方面，公开了组合多肽。“组合多肽”是包含至少一种通过肽键接头一条氨基酸链上的上述免疫原性部分和一种或多种另外的免疫原性结核分枝杆菌序列的多肽。序列可以直接连接(即没有间插氨基酸)或者可以通过不明显减小组成多肽的免疫原性的接头序列(例如Gly-Cys-Gly)连接。
一般情况下，结核分枝杆菌抗原，编码该抗原的DNA序列可以用各种各样的方法制备。例如可溶性抗原可以通过本领域技术人员公知的方法从结核分枝杆菌培养物滤液中分离，包括阴离子-交换和反相色谱。然后用例如这里所描述的代表性方法对纯化的抗原评价其诱出适当的免疫应答(例如细胞的)的能力。然后可以用例如常规的Edman化学技术对免疫原性抗原部分测序。参见Edman和Bcrg，欧洲生物化学杂志(Eur.J.Biochem.)80116-132，1967。
免疫原性抗原也可以用插入到表达载体中并且在适当的宿主中表达的编码该抗原的DNA序列重组产生。编码可溶性抗原的DNA分子可以通过用特异性抗可溶性结核分枝杆菌抗原的抗血清(例如兔)筛选适当的结核分枝杆菌表达文库来分离。编码可能是可溶的或者可能不是可溶的抗原的DNA序列可以通过用从感染结核分枝杆菌的患者获得的血清筛选适当的结核分枝杆菌基因组或者cDNA表达文库来鉴别。这样的筛选一般可以用本领域技术人员公知的技术进行，例如描述于Sambrook等，分子克隆实验室手册，冷泉港实验室，冷泉港，NY，1989的那些方法。
编码可溶性抗原的DNA序列也可以通过对适当的结核分枝杆菌cDNA或基因组DNA文库筛选与来自分离的可溶性抗原的部分氨基酸序列的简并寡核苷酸杂交的DNA序列而获得。可以设计和合成在这样的筛选中使用的简并寡核苷酸序列，筛选可以根据(例如)Sambrook等，分子克隆实验室手册，冷泉港实验室，冷泉港，NY，1989(和其中的引用参考)的描述进行。也可以使用聚合酶链反应(PCR)，使用本领域公知方法中的上述寡核苷酸，来从cDNA或基因组文库分离核酸探针，然后可以用分离的探针进行文库筛选。
或者，可以直接用得自一名或多名结核分枝杆菌免疫个体的外周血单核细胞(PBMCs)或T细胞系或克隆筛选来自结核分枝杆菌的基因组或cDNA文库。一般情况下，在这样的筛选中使用的PBMCs和/或T细胞可以根据下面的描述制备。直接的文库筛选一般可以通过对表达的重组蛋白质的集合液测定在来自结核分枝杆菌免疫个体的T细胞中诱发增殖和/或干扰素-γ产生的能力来进行。或者，如上所述，潜在的T细胞抗原可以以抗体反应性为基础首次筛选。
不考虑制备方法，这里所描述的抗原(和其免疫原性部分)(其可能是可溶的或者可能不是可溶的)具有诱发免疫原性应答的能力。更具体地，抗原具有诱发来自结核分枝杆菌免疫个体的T细胞，NK细胞，B细胞和/或巨噬细胞中的增殖和/或细胞因子产生(例如干扰素-γ和/或白细胞介素-12产生)的能力。对于用于评价对抗原的免疫原性应答的细胞类型的选择当然取决于期望的反应。例如，用含有B细胞和/或巨噬细胞的制剂最适于评价白细胞介素-12产生。结核分枝杆菌免疫个体是认为由于具有安置好的对结核分枝杆菌(即基本上没有疾病症状)的有效的T细胞应答而建立对结核病有抗性的人。这样的个体可以根据对结核病蛋白质(PPD)的强阳性(例如大于大约10mm直径硬结)皮内皮试反应和没有任何结核病信号或症状为基础来鉴定。来自结核分枝杆菌免疫个体的T细胞，NK细胞，B细胞和巨噬细胞可以用本领域技术人员公知的方法制备。例如PBMCs(即外周血单核细胞)的制备物可以不用进一步分离组成细胞就可使用。PBMCs一般可以例如使用通过FicollTM(Winthrop Laboratories，NY)的密度离心来制备。这里所描述的测试中使用的T细胞也可以直接从PBMCs纯化。或者，可以使用对分枝杆菌蛋白质有反应性的富集的T细胞系或者对个体分枝杆菌蛋白质有反应性的T细胞克隆。这样的T细胞克隆可以通过例如将来自结核分枝杆菌免疫个体的PBMCs和分枝杆菌蛋白质培养2-4星期而产生。这使得只有分枝杆菌蛋白质特异性T细胞扩展，产生只有这样的细胞组成的细胞系。然后可以用本领域技术人员公知的方法克隆这些细胞并用个体蛋白质试验，以更精确地定义个体T细胞特异性。一般情况下，用来自结核分枝杆菌免疫个体的T细胞，NK细胞，B细胞和/或巨噬细胞进行的对增殖和/或细胞因子产生(即干扰素-γ和/或白细胞介素-12产生)的试验中测试阳性的抗原被认为是免疫原性的。这样的测试可以例如用下面描述的代表性方法来进行。这样的抗原的免疫原性部分可以用相似的测试鉴定，并且可以存在于这里所描述的多肽中。
多肽(例如免疫原性抗原或其部分，或其其它变体)诱导细胞增殖的能力通过用多肽接触细胞(例如T细胞和/或NK细胞)并且测定细胞的增殖来评价。一般情况下，足以评价大约105个细胞的多肽的量范围是大约10ng/mL至大约100μg/mL，优选是大约10μg/mL。多肽与细胞的温育一般在37℃下进行大约6天。与多肽温育后，对细胞测试增殖反应，这可以通过本领域技术人员公知的方法来评价，例如将细胞暴露给放射标记的胸苷的脉冲并且测定标记进入细胞DNA的掺入。一般情况下，产生增殖至少比背景(即对于没有多肽的细胞培养所发现的增殖)增加三倍的多肽被认为能诱导增殖。
多肽刺激细胞中干扰素-γ和/或白细胞介素-12产生的能力通过用多肽接触细胞并且测定细胞的干扰素-γ和/或白细胞介素-12产生的水平来评价。一般情况下，足以评价大约105个细胞的多肽的量范围是大约10ng/mL至大约100μg/mL，优选是大约10μg/mL。多肽可以，但不是必须，固定在固体载体上，所述载体是例如小球或者生物可降解微球体，例如美国专利Nos.4897268和5075109中描述的那些。多肽与细胞的温育一般在37℃下进行大约6天。与多肽温育后，对细胞分析干扰素-γ和/或白细胞介素-12(或者其一种或多种亚单位)，这可以通过本领域技术人员公知的方法，例如酶联免疫吸附测定(ELISA)，或者在IL-12P70亚单位情况下，例如测定T细胞增殖的试验生物测试来评价。一般情况下，导致每毫升培养上清液产生至少50pg干扰素-γ(每毫升含有104-105个T细胞)的多肽被认为能刺激干扰素-γ的产生。对于每105巨噬细胞或B细胞(或者每3×105PBMC)刺激产生至少10pg/mL IL-12P70亚单位，和/或至少100pg/mL IL-12P70亚单位的多肽被认为能刺激IL-12的产生。
一般情况下，免疫原性抗原是刺激来自至少大约25％结核分枝杆菌免疫个体的T细胞，NK细胞，B细胞和/或巨噬细胞中增殖和/或细胞因子产生(即干扰素-γ和/或白细胞介素-12产生)的那些抗原。这些免疫原性抗原中，具有优越治疗性能的多肽可以以上述测试中反应的大小为基础和以发现反应的个体的百分比为基础加以区分。另外，具有优越治疗性能的抗原体外不刺激来自多于大约25％的没有结核分枝杆菌免疫的个体的细胞中的增殖和/或细胞因子产生，从而消除了对于结核分枝杆菌应答性细胞不是特异性的应答。在来自结核分枝杆菌免疫个体的高百分比T细胞，NK细胞，B细胞和/或巨噬细胞制剂中诱导应答(带有来自其它个体的制剂中的少量应答)的那些抗原具有优越治疗性能。
具有优越治疗性能的抗原也可以以其在试验动物中，当作为疫苗给予时，减小结核分枝杆菌感染的严重程度的能力为基础来鉴定。对试验动物使用的合适的疫苗制剂在下面详细描述。可以以试验感染后提供至少大约50％细菌数目的减少和/或至少大约40％死亡率的降低的抗原能力为基础测定效力。合适的试验动物包括小鼠，豚鼠和灵长类。
具有优越治疗性能的抗原一般可以以对患有活性结核病的个体进行的皮内皮试中具有，在对没有感染结核分枝杆菌的个体进行的试验中不具有诱发反应的能力为基础来鉴定。皮试一般可以根据下文所述进行，至少5mm硬结的反应认为是阳性的。
这里所描述的抗原的免疫原性部分可以用已知的方法制备和鉴定，例如总结于Paul，基础免疫学(Fundamental Immunology)，第三版，Raven出版，1993，pp.243-247和其中引用的参考文献中的那些技术。这样的技术包括对天然抗原的多肽部分筛选免疫原性性质。这里所描述的代表性增殖和细胞因子产生测定一般可以在这些筛选中使用。多肽的免疫原性部分是在这样的代表性测试中产生基本上类似于全长抗原产生的免疫应答的免疫应答(例如增殖，干扰素-γ和/或白细胞介素-12产生)的部分。换句话说，抗原的免疫原性部分可以产生至少大约20％，优选大约100％的在这里所描述的模型增殖试验中全长抗原诱导的增殖。免疫原性部分也可以，或者，刺激至少大约20％，优选大约100％的在这里所描述的模型试验中全长抗原诱导的干扰素-γ和/或白细胞介素-12产生。
结核分枝杆菌抗原的部分和其它变体可以通过合成或重组方法产生。具有少于大约100个氨基酸，并且一般少于大约50个氨基酸的合成的多肽可以用本领域技术人员公知的技术产生。例如这样的多肽可以用任何商业上可得的固相技术，例如其中氨基酸被顺序加入来产生增长的氨基酸链的Merrifield固相合成方法来合成。参见Merrifield，J.Am.Chem.Soc.852149-2146，1963。自动合成多肽的设备从供应商例如Applied BioSystems，Inc.，Foster City，CA可以购得，并且可以根据生产商的说明来操作。天然抗原的变体一般可以用标准诱变技术例如寡核苷酸指导的位点特异性诱变来制备。也可以用允许制备截短的多肽的标准技术去除DNA序列的片段。
包含天然抗原的部分和/或变体的重组多肽可以容易地用本领域技术人员公知的多种技术从编码该肽的DNA序列来制备。例如来自将重组蛋白分泌到培养基中的合适的宿主/载体系统的上清液可以首先用商业可得的过滤器浓缩。浓缩后，可以将浓缩液应用于合适的纯化基质，例如亲和基质或者离子交换树脂。最后，一个或多个反相HPLC步骤可以用来进一步纯化重组蛋白质。
可以使用本领域技术人员公知的任何各种各样的表达载体来表达本发明重组多肽。表达可以在用用包含编码重组多肽的DNA分子的表达载体转化或转染的任何合适的宿主细胞中实现。合适的宿主细胞包括原核细胞，酵母和较高级真核细胞。优选地，使用的宿主细胞是大肠杆菌，酵母或者哺乳动物细胞系例如COS或CHO。以该方法表达的DNA序列可以编码天然存在的抗原，天然存在抗原的部分或者其其它变体。
一般情况下，不考虑制备方法，这里所公开的多肽以基本上纯的方式制备。优选地，多肽至少大约80％纯，更优选至少大约90％纯和最优选至少大约99％纯。在下面所描述的一些优选的实施方案中，基本上纯的多肽掺入到在这里所公开的一种或多种方法中使用的药物组合物或疫苗中。
在一些具体的实施方案中，本发明公开了包含至少具有下面N-末端序列之一的可溶性结核分枝杆菌抗原，或者只有保守性替换和/或修饰不同的其变体的免疫原性部分的多肽(a) Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Cys-Asn-Tyr-Gly-Gln-Val-Val-Ala-Ala-Leu；(SEQ ID No.120)(b) Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-Ser；(SEQ ID No.121)(c) Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-Leu-Glu-Ala-Ala-Lys-Glu-Gly-Arg；(SEQ ID No.122)(d) Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-Pro；(SEQ ID No.123)(e) Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val；(SEQ ID No.124)(f) Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro；(SEQ IDNo.125)(g) Asp-Pro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Ala-Ala-Ala-Ser-Pro-Pro-Ser；(SEQ ID No.126)(h) Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-Gly；(SEQ ID No.127)(i) Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Leu-Thr-Ser-Leu-Leu-Asn-Ser-Leu-Ala-Asp-Pro-Asn-Val-Ser-Phe-Ala-Asn；(SEQ ID No.128)(j) Xaa-Asp-Ser-Glu-Lys-Ser-Ala-Thr-Ile-Lys-Val-Thr-Asp-Ala-Ser；(SEQ ID No.134)(k) Ala-Gly-Asp-Thr-Xaa-Ile-Tyr-Ile-Val-Gly-Asn-Leu-Thr-Ala-Asp；(SEQ ID No.135)or(l) Ala-Pro-Glu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-Ala-Gly；(SEQ ID No.136)其中Xaa可以是任何氨基酸，优选半胱氨酸残基。编码鉴定为上述(g)的抗原的DNA序列在SEQ ID No.52中提供，SEQ ID No.52编码的多肽在SEQ ID No.53中提供。编码鉴定为上述(a)的抗原的DNA序列在SEQ ID No.101中提供，其推导的氨基酸序列在SEQ ID No.102中提供。相应于上述抗原(d)的DNA序列在SEQ ID No.24中提供，相应于上述抗原(c)的DNA序列在SEQ ID No.25中提供和相应于上述抗原(i)的DNA序列在SEQ ID No.99中提供；其推导的氨基酸序列在SEQ IDNo.100中提供。
在进一步具体的实施方案中，本发明公开了包含至少具有下面N-末端序列之一的结核分枝杆菌抗原，或者只有保守性替换和/或修饰不同的其变体的免疫原性部分的多肽(m) Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-Ile-Asn-Val-His-Leu-Val；(SEQ ID No 137)or(n) Asp-Pro-Pro-Asp-Pro-His-Gln-Xaa-Asp-Met-Thr-Lys-Gly-Tyr-Tyr-Pro-Gly-Gly-Arg-Arg-Xaa-Phe；(SEQ ID No.129)其中Xaa可以是任何氨基酸，优选半胱氨酸残基。
在其它具体实施方案中，本发明公开了包含至少包括下面序列编码的一个或多个氨基酸序列的可溶性结核分枝杆菌抗原(或者这样的抗原的变体)的免疫原性部分的多肽(a)SEQ ID Nos.1，2，4-10，13-25和52的DNA序列；(b)这样的DNA序列的补体，或者(c)与(a)或(b)中的序列基本上同源的DNA序列。
在又一个具体实施方案中，本发明公开了包含至少包括下面序列编码的一个或多个氨基酸序列的可能是可溶性的或者可能是不可溶性的结核分枝杆菌抗原(或者这样的抗原的变体)的免疫原性部分的多肽(a)SEQ ID Nos.26-51，138，139，163-183和201的DNA序列；(b)这样的DNA序列的互补序列，或者(c)与(a)或(b)中的序列基本上同源的DNA序列。
在上面所讨论的具体的实施方案中，结核分枝杆菌抗原包括基本上与这里所具体引述的一个或多个DNA序列同源的DNA序列编码的变体。“基本上同源”，如在这里所使用的，指在中等严格条件下能杂交的DNA序列。合适的中等严格条件包括在5X SSC，0.5％SDS，1.0mMEDTA(pH8，0)溶液中预先冲洗；在50℃-65℃，5X SSC中杂交过夜，或者在杂交-物种(cross-species)同源情况下在45℃，0.5X SSC；接着每次用含有0.1％SDS的2X，0.5X和0.2X SSC在65℃冲洗20分钟，冲洗两次。这样的杂交DNA序列也在本发明范围内，这是由于编码简并性而编码杂交DNA序列编码的免疫原性多肽的核苷酸序列。
在相关的方面，本发明提供包含第一和第二本发明多肽或者本发明多肽和已知的结核分枝杆菌抗原的融合蛋白质以及这样的融合蛋白的变体，其中所述已知的结核分枝杆菌抗原是例如Andersen和Hansen，Infect.Immun.572481-2488，1989，中描述的38kD抗原，(基因库登记号No.M30046)或ESAT-6(SEQ ID Nos.103和104)。本发明融合蛋白也可以在第一和第二多肽之间包括接头肽。
编码本发明融合蛋白的DNA序列是用已知的重组DNA技术将编码第一和第二多肽的分开的DNA序列装配到合适的表达载体中来构建的。有或者没有肽接头情况下，编码第一多肽的DNA序列的3′末端连接于编码第二多肽的DNA序列的5′末端，使得序列的读框处于允许将两个DNA序列mRNA翻译成保留第一和第二多肽的生物活性的单一的融合蛋白的状态。
肽接头序列可以用来以与保证各个多肽折叠成其二级和三级结构的距离分开第一和第二多肽。这样的肽接头序列用本领域公知的标准技术插入到融合蛋白中。合适的肽接头序列可以以下面因素为基础来选择(1)其采用柔性伸展构象的能力；(2)其不能形成与第一和第二多肽上的功能表位相互作用的二级结构；和(3)没有可能与多肽功能表位反应的疏水的或带电荷的残基。优选的肽接头序列包含Gly，Asn和Ser残基。其它接近中性的氨基酸，例如Thr和Ala，也可以在接头序列中使用。可以有用地用作接头的氨基酸序列包括Maratea等，基因(Gene)4039-46，1985；Murphy等，美国国家科学院院刊(Pro.Natl.Acad.Sci.USA)838258-8262，1986；美国专利号4935233和美国专利号4751180中公开的那些序列。接头序列长度可以是大约1至大约50个氨基酸。当第一和第二多肽具有可以用来分开功能区和防止空间干扰的非基本N-末端氨基酸区时不需要这些肽序列。
连接的DNA序列可以操作连接于合适的转录或翻译调节元件。对DNA表达起作用的调节元件只位于编码第一多肽的DNA序列的5′末端。类似地终止翻译，并且转录终止信号所需终止密码子只是存在于编码第二多肽的DNA序列的3′末端。
另一方面，本发明提供用一种或多种上述多肽或融合蛋白(或者编码这样的多肽的DNA分子)来诱导患者抗结核病的保护免疫性的方法。如这里所使用的，“患者”指所有温血动物，优选人。患者可以是患病的，或者可以是没有可查出的疾病和/或感染。换句话说，可以诱发保护免疫性来预防或治疗结核病。
在该方面，多肽，融合蛋白或DNA分子一般存在于药物组合物和/或疫苗中。药物组合物可以含有一种或多种多肽，这些多肽各自可以包含一种或多种上述序列(或者其变体)，和生理可接受载体。疫苗可以含有一种或多种上述多肽和非特异性免疫应答增强剂，例如佐剂或脂质体(多肽掺入到其中)。这样的药物组合物和疫苗还可以含有其它结核分枝杆菌抗原，或者掺入到组合多肽中或者存在于分开的多肽中。
或者，疫苗可以含有编码如上所述的一种或多种多肽的DNA，使得原位产生多肽。在这样的疫苗中，DNA可以存在于本领域技术人员公知的任何各种各样的送递系统中，包括核酸表达系统，细菌和病毒表达系统。合适的核酸表达系统包含用于在患者中表达的必需的DNA序列(例如合适的启动子和终止信号)。细菌送递系统包括给予在其细胞表面表达多肽的免疫原性部分的细菌(例如Bacillus-Calmette-Guerrin)。在优选的实施方案中，可以用病毒表达系统(例如牛痘或其它痘病毒。反录病毒或腺病毒)引入DNA，其可以包括使用非病原性的(缺损的)，复制病毒。将DNA插入到这样的表达载体中的技术是本领域技术人员公知的。DNA可以是“裸露的”，如例如Ulmer等，科学2591745-1749，1993和Cohen，科学2591691-1692，1993综述中所描述的。通过将DNA包被到充分送递到细胞中的生物可降解珠上可以提高裸露的DNA的摄入。
在相关的方面，上面所描述的DNA疫苗可以与本发明多肽或者已知的结核分枝杆菌抗原例如上述38kD抗原同时给予或依次给予。例如，如上所述，或者“裸露”或者在送递系统中给予编码本发明多肽的DNA，可以之后给予抗原，为了增强疫苗保护性免疫效果。
给予途径和频率以及剂量可以随着个体与个体而不同，并且可以与常规在使用BCG的免疫接种中使用的那些平行使用。一般情况下，药物组合物和疫苗可以通过注射(例如皮内，肌内，静脉内或皮下)，鼻内(例如通过吸入)或者口服给予。可以以1至3剂给予1-36星期周期。优选地，给予3剂，以3-4个月的间隔，并且此后可以周期性给予加强接种。对于各患者改变方案是合适的。当如上所述给予时，合适的剂量是能在免疫的患者中产生足以保护患者至少1-2年不感染结核分枝杆菌的免疫应答的多肽或DNA的量。一般情况下，剂量中存在的多肽的量(或者剂量中通过DNA原位产生的的量)范围是每千克宿主大约1pg至大约100mg，一般是大约10pg至大约1mg，优选自大约100pg至大约1μg。合适的剂量规格将随着患者的体重而不同，但是一般范围是大约0.1mL至大约5mL。
尽管本发明药物组合物中可以使用本领域技术人员公知的任何合适的载体，但是载体类型将取决于给药方式而变化。对于肠胃外给药，例如皮下注射，载体优选含有水，盐水，醇，脂肪，蜡或者缓冲液。对于口服给药，可以使用任何上述载体或固体载体，例如甘露糖醇，乳糖，淀粉，硬脂酸镁，糖精钠，滑石，纤维素，葡萄糖，蔗糖和碳酸镁。生物可降解微球体(例如polylactic galactide)也可以用作本发明药物组合物的载体。合适的生物可降解微球体例如公开于美国专利号4897268和5075109。
本发明疫苗中可以使用任何各种各样的佐剂来非特异性增强免疫应答。大多数佐剂含有设计来保护抗原不快速分解代谢的物质，例如氢氧化铝或者矿物油，和免疫应答的非特异性刺激剂，例如脂质A，Bortadella pertussis，或结核分枝杆菌。合适的佐剂是商业上可购得的，例如弗氏不完全佐剂和弗氏完全佐剂(Difco Laboratories)和默克佐剂65(Merk and Company，Inc.，Rahway，NJ)。其它合适的佐剂包括明矾，生物可降解微球体，一磷酰基脂质A和quilA。
另一方面，本发明提供使用上述一种或多种多肽用皮试诊断结核病的方法。如这里所使用的，“皮试”是直接对患者进行的测试，其中皮内注射上述一种或多种多肽之后测定延迟型超敏性(DTH)反应(例如肿胀，变红或皮炎)。这样的注射可以使用足以使多肽与患者皮细胞接触的任何合适的装置例如结核菌素注射器或1mL注射器来实现。优选地，注射后48小时，更优选48-72小时，检查反应。
DTH反应是细胞介导的免疫应答，事先暴露给试验抗原(即使用的多肽的免疫原性部分，或者其变体)的患者，DTH反应较大。反应可以用尺子目测。一般情况下，直径大于大约0.5cm，优选直径大于大约1.0cm的反应是阳性反应，表明有结核病感染，其可以表现为活性的疾病或者不表现为活性疾病。
本发明多肽优选配制成皮试中使用的，含有上述多肽和生理可接受载体的药物组合物。这样的组合物一般在0.1mL体积中含有范围是大约1μg至大约100μg，优选大约10μg至大约50μg量的一种或多种上述多肽。优选地，在这样的药物组合物中使用的载体是有合适的防腐剂例如苯酚和/或Tween80TM的盐溶液。
在优选的实施方案中，皮试中使用的多肽有足够大小，使得在注射点滞留反应周期的时间。一般情况下，长度至少9个氨基酸的多肽是足够的。多肽还优选在注射的小时中被巨噬细胞分解以呈递给T-细胞。这样的多肽可以含有一些重复的一种或多种上述序列和/或其它免疫原性或非免疫原性序列。
通过详细说明提供下面的实施例，但是不是限制本发明。
实施例实施例1来自结核分枝杆菌培养物滤液的多肽的纯化和表征该实施例详细说明从培养物滤液制备结核分枝杆菌可溶性多肽。除非另有说明，下面的实施例中的所有百分比是重量体积比。
结核分枝杆菌(H37Ra，ATCC No.25177，或者H37Rv，ATCCNo.25618之一)在灭菌GAS培养基中在37℃下培养14天。然后通过0.45μ过滤器将培养基真空过滤(去除大块细胞)到灭菌2.5L瓶中。接着通过0.2μ过滤器将培养基过滤到灭菌4L瓶中，并且向培养滤液中加入NaN3至0.04％浓度。然后将瓶置于4℃冷室中。
通过将滤液置于高压灭菌的12L储存器中并且将滤液加入到用乙醇冲洗过并且包含10000kDa MWCO膜的400mL Amicon搅拌池中来浓缩培养滤液。使用氮气将压力保持在60psi。该过程将12L体积减少到大约50mL。
用8000kDa MWCO纤维素酯膜用两种不同的碳酸氢铵溶液，将培养滤液透析到0.1％碳酸氢铵中。然后通过商业上可得的BCA测试(Pierce，Rockford，IL)测定蛋白质浓度。
然后冻干透析的培养滤液，多肽重新悬浮于蒸馏水。多肽对0.01mM1，3-双[三(羟基甲基)-甲基氨基]丙烷，pH 7.5(Bis-Tris丙烷缓冲液)，阴离子交换色谱的初始条件，透析。在0.01mM Bis-Tris丙烷缓冲液pH7.5中平衡的POROS 146 II Q/M阴离子交换柱4.6mm×100mm(Perseptive BioSystems，Framingham，MA)上使用凝胶大量色谱进行分级分离。在上述缓冲系统中用线性0-0.5M NaCl梯度洗脱多肽。在波长220nm下监测柱洗脱液。
用蒸馏水透析从离子交换柱上洗脱出的多肽集合液并冻干。将得到的物质溶解于0.1％三氟乙酸(TFA)pH1.9水溶液中，并在Delta-PakC18柱子(Waters，Milford，MA)300埃孔度，5微米颗粒度(3.9×150mm)上纯化多肽。用线性梯度0-60％稀释缓冲液(0.1％TFA的乙腈溶液)从柱子上洗脱多肽。流速是0.75mL/分钟，并且在214nm监测HPLC洗脱液。收集含有洗脱出的多肽的级分，使各样品的纯度最大。得到大约200纯化的多肽。
然后对纯化的多肽筛选在PBMC制剂中诱导T-细胞增殖的能力。来自已知PPD皮试阳性并且其T-细胞表现出应答PPD而增殖的供者的PBMCs和来自MTB的粗可溶性蛋白质在含有补充有10％集合的人血清和50μg/mL庆大霉素的RPMI 1640培养基中培养。加入双份纯化的多肽，浓度0.5-10μg/mL。在96-孔圆底平板中200μL体积培养6天后，从每个孔中取出50μL培养基测定IFN-γ水平，如下所述。然后用1μ Ci/孔含氚胸苷对平板脉冲又18分钟，收获并且用气体闪烁计数器测定摄取的氚。导致两个重复样品中增殖比在单独培养基中培养的细胞所观察到的增殖大三倍的级分认为是阳性的。
IFN-γ用酶联免疫吸附测定(ELISA)测定。用PBS中抗人IFN-γ的小鼠单克隆抗体(Pharmingen，San Diego，CA)在室温下包被ELISA板4小时。然后室温下含有5％(W/V)脱脂奶粉的PBS将孔封闭1小时。然后将平板在PBS/0.2％TWEEN-20中冲洗6次，并且ELISA平板中在培养基中稀释1∶2的样品在室温下温育过夜。再次冲洗平板，并且向各孔中加入在PBS/10％正常山羊血清中稀释1∶3000倍的多克隆兔抗人IFN-γ血清。之后，平板在室温下温育2小时，冲洗，并且以在PBS/5％脱脂奶粉中稀释1∶2000倍加入辣根过氧化物酶-偶联的抗-兔IgG(SigmaChemical So.，St.Louis，MO)。室温下又温育2小时后冲洗平板并且加入TMB基质。20分钟后用1N硫酸终止反应。用570nm作为参照波长在450nm测定光密度。两个重复样品给出的OD比来自单独培养基培养的细胞的平均OD大两倍加3标准偏差的级分认为是阳性的。
对于测序，将多肽各个干燥置于BiobreneTM(Perkin Elmer/AppliedBioSystems Division，Foster City，CA)处理过的玻璃纤维过滤器。带有多肽的过滤器载到Perkin Elmer/Applied BioSystems Division Procise 492蛋白质测序仪上。用传统的埃德曼化学对多肽从氨基末端测序。通过比较PTH氨基酸衍生物的滞留时间与合适的PTH衍生物标准对每种多肽测定氨基酸序列。
用上述方法，分离了具有下面N-末端序列的抗原(a) Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Xaa-Asn-Tyr-Gly-Gln-Val-Val-Ala-Ala-Leu；(SEQ ID No.54)(b) Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-Ser；(SEQ ID No.55)(c) Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-Leu-Glu-Ala-Ala-Lys-Glu-Gly-Arg；(SEQ ID No.56)(d) Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-Pro；(SEQ ID No.57)(e) Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val；(SEQ ID No.58)(f) Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro；(SEQ IDNo.59)(g) Asp-Pro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Ala-Ala-Ala-Ala-Pro-Pro-Ala；(SEQ ID No. 60)和(h) Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-Gly；(SEQ ID No.61)其中Xaa可以是任何氨基酸。
除上述方法外，用微内径HPLC纯化步骤分离另外的抗原。具体地，20μL含有来自先前描述的色谱纯化步骤的抗原的混合物的级分在Perkin Elmer/Applied BioSystems Division Model 172 HPLC中，7微米孔度，柱子规格1mm×100mm的Aquapore C18柱子(PerkinElmer/Applied BioSystems Division，Foster City，CA)上纯化。用线性梯度的1％/分钟的乙腈(含有0.05％TFA)的水溶液(0.05％TFA)以80μL/分钟流速从柱子上洗脱级分。在250nm监测洗脱液。将源级分分为4个主要峰加其它较小组分，得到多肽，其表现出具有12.054Kd(通过质谱)分子量和下面的N-末端序列(i) Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Gln-Thr-Ser-Leu-Leu-Asn-Asn-Leu-Ala-Asp-Pro-Asp-Val-Ser-Phe-Ala-Asp(SEQ ID No.62).该多肽使用上述测试表现出在PBMC制剂中诱导增殖和IFN-γ产生。
另外的可溶性抗原如下所述从结核分枝杆菌培养滤液分离。如上所述制备结核分枝杆菌培养滤液。对Bis-Tris丙烷缓冲液，pH5.5透析后，用阴离子交换色谱在于Bis-Tris丙烷缓冲液，pH5.5中平衡过的PorosQE柱子4.6×100mm(Perseptive Biosystems)上进行分级分离。用上述缓冲系统中线性0-1.5M NaCl梯度以10mL/分钟的流速洗脱多肽。在214nm波长监测柱洗出液。
集合从离子交换柱洗脱出的级分，并且用Poros R2柱4.6×100mm(Perseptive Biosystems)进行反相色谱。用线性梯度0-100％乙腈(0.1％TFA)以5mL/分钟流速从柱子洗脱多肽。在214nm监测洗脱液。
冻干含有洗出的多肽的级分并重新悬浮于80μ含水的0.1％TFA中，进一步使在Vydac C4柱4.6×150mm(Western Analytical，Temecula，CA)用线性梯度0-100％乙腈(0.1％TFA)以2mL/分钟流速进行反相色谱。在214nm监测洗脱液。
具有生物活性的级分分成一个主峰加其它较小组分。该峰在PVDF膜上的蛋白质印迹给出3个主带，分子量是14Kd，20Kd和26Kd。测定这些多肽，它们分别具有下面的N-末端序列(j) Xaa-Asp-Ser-Glu-Lys-Ser-Ala-Thr-Ile-Lys-Val-Thr-Asp-Ala-Ser；(SEQ ID No.134)(k) Ala-Gly-Asp-Thr-Xaa-Ile-Tyr-Ile-Val-Gly-Asn-Leu-Thr-Ala-Asp；(SEQ ID No.135)和(l) Ala-Pro-Glu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-Ala-Gly；(SEQ ID No.136)，其中Xaa可以是任何氨基酸。
用上述测试，这些肽表现出在PBMC制剂中诱导增殖和IFN-γ产生。图1A和B分别给出用来自第一和第二供者的PBMC制剂的这样的测试结果。
通过32P端标记的相应于N-末端序列并且包含结核分枝杆菌密码子偏倚的简并的寡核苷酸筛选基因组结核分枝杆菌文库获得编码上文标示为(a)，(c)，(d)和(g)的抗原的DNA序列。筛选用具有SEQ IDNo.101提供的序列的克隆鉴定的相应于上述抗原(a)的探针进行。SEQID No.102提供了SEQ ID No.101编码的多肽。筛选用具有SEQ ID No.52提供的序列的克隆鉴定的相应于上述抗原(g)的探针进行。SEQ ID No.53提供了SEQ ID No.52编码的多肽。筛选用具有SEQ ID No.24提供的序列的克隆鉴定的相应于上述抗原(d)的探针进行，以及筛选用具有SEQID No.25提供的序列的克隆鉴定的相应于上述抗原(c)的探针进行用DNA STAR系统将上述氨基酸序列与基因库中已知的氨基酸序列相比较。检索的数据库包括173000种蛋白质并且是Swiss，PIR数据库和翻译的蛋白质序列的组合(87版)。没有检查出与抗原(a)-(h)和(l)的氨基酸序列明显同源性的。
发现抗原(i)的氨基酸序列与来自麻疯分枝杆菌(M.leprae)的序列同源。全长麻疯分枝杆菌用从GENEBANK得到的序列从基因组DNA扩增。然后用该序列筛选如下面实施例2所述的结核分枝杆菌文库，并且得到结核分枝杆菌同源物的全长拷贝(SEQ ID No.99)。
发现抗原(j)的氨基酸序列与从DNA序列翻译的已知的结核分枝杆菌蛋白质同源。据发明人所知，先前没有公开过该蛋白质具有T-细胞刺激活性。发现抗原(k)的氨基酸与来自麻疯分枝杆菌的序列相关。
在用3名PPD阳性供者的上述增殖和IFN-γ测试中，表1给出了上面提供的代表性抗原的结果
表1PBMC增殖和IFN-γ测试的结果

在表1中，给出2和4之间的刺激指数(SI)(与单独的培养基中培养的细胞相比)的应答分数为+，浓度是1μg或更小时SI是4-8或2-4分数为++，SI大于8分数为+++。在增殖和IFN-γ测试中，对于一名供者发现序列(i)的抗原具有高SI(+++)，而对于另两名供者给出较低SI(++和+)。这些结果表明这些抗原能诱导增殖和/或干扰素-γ产生。
实施例2用患者血清分离结核分枝杆菌抗原该实施例详细说明通过用来自结核分枝杆菌感染的个体的血清进行筛选来从结核分枝杆菌裂解液中分离抗原。
向2％NP40溶液中加入干燥的结核分枝杆菌H37a(DifcoLaboratories)，并且交替均化和超声三次。得到的悬浮液在微离心试管中以13000rpm离心并且使上清液通过0.2微米针筒式滤器。滤液与Macro Prep DEAE小球(BioRad，Hercules)结合。小球用20mM Tris pH7.5充分冲洗，并且用1M氯化钠洗脱结合的蛋白。用10mM Tris pH7.5将1M氯化钠洗脱液透析过夜。透析的溶液用0.05mg/mLDNase和RNase在室温下处理30分钟，然后用α-D-甘露糖苷酶，0.5U/mg，pH4.5在室温下处理透析的溶液。再回到pH7.5后材料经Bio Scale-Q-20柱子(BioRad)通过FPLC分级分离。级分分为9个集合，在Centriprep10(Amicon，Beverley，MA)中离心后用来自对本发明其它抗原没有免疫反应性的结核分枝杆菌感染的患者的血清集合液通过蛋白质印迹筛选血清学活性。
最具有反应性的级分进行SDS-PAGE。并且转移到PVDF。切下大约85Kd的带，得到下面的序列(m) Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-Ile-Asn-Val-His-Leu-Val；(SEQ ID No.137)，其中Xaa可以是任何氨基酸。
将该序列与如上所述的基因库中的序列相比较，表明与已知的序列没有明显的同源性。
通过用相应于SEQ ID NO137的标记的简并的寡核苷酸筛选基因组结核分枝杆菌Erdman菌株文库获得编码上文标示为(m)的DNA序列。经鉴定，该克隆具有SEQ ID NO203提供的DNA序列。发现该序列编码SEQ ID NO204提供的氨基酸序列。将这些序列与基因库的序列相比较表明与先前在结核分枝杆菌和牛分枝杆菌(M.bovis)。
实施例3编码结核分枝杆菌抗原的DNA序列的制备该实施例详细说明通过用从用结核分枝杆菌感染的患者获得的血清，或者用抗可溶性结核分枝杆菌抗原的抗血清筛选结核分枝杆菌表达文库来制备编码结核分枝杆菌抗原的DNA序列。A.用抗结核分枝杆菌上清液的兔抗血清制备结核分枝杆菌可溶性抗原从结核分枝杆菌菌株H37Ra分离基因组DNA。随机剪切DNA并用来构建使用λZAP表达系统(Stratagene，La Jolla，CA)D表达文库。通过用结核分枝杆菌培养基的浓缩上清液免疫兔而产生抗结核分枝杆菌菌株H37Ra，H37Rv和Erdman的分泌性蛋白的兔抗血清。具体地，用含有10μg胞壁酰二肽(Calbiochem，La Jolla，CA)和1mL弗氏不完全佐剂的共2mL体积中200μg蛋白抗原皮下第一次免疫兔。4星期后，用弗氏不完全佐剂中100μg抗原皮下加强免疫。最后，4星期后用50μg蛋白抗原静脉内免疫。如Sambrook等，分子克隆实验室手册，冷泉港实验室，冷泉港，NY，1989所述用抗血清筛选表达文库。纯化噬菌体噬菌斑表达免疫反应性抗原。从噬菌斑中回收噬菌粒并推断出结核分枝杆菌的核苷酸序列。
纯化32个克隆，25个代表先前没有在人结核分枝杆菌中鉴定的序列。表达重组抗原，并且在如实施例所述的免疫学分析中使用纯化的抗原。蛋白质通过IPTG诱导并通过凝胶洗脱纯化，如Skeiky等，J.Exp.Med.1811527-1537，1995所述。SEQ ID Nos1-25提供了在该筛选中鉴定的DNA分子的代表性序列。相应的预示的氨基酸序列在SEQ IDNos63-87中给出。
用上述数据库将这些序列与基因库中的已知的序列相比较，发现后文中指定为TbRA2A，TbRA16，TbRA18和TbRA29(SEQ ID Nos.76，68，70，75)的克隆表现出与先前在麻疯分枝杆菌中鉴定的但是没有在结核分枝杆菌中鉴定的序列的某种程度上的同源性。TbRA11，TbRA26，TbRA28和TbDPEP(SEQ ID Nos.65，73，74，53)先前在结核分枝杆菌中鉴定。对于TbRA1，TbRA3，TbRA4，TbRA9，TbRA10，TbRA13，TbRA17，TbRa19，TbRA29，TbRA32，TbRA36和重叠克隆TbRA35和TbRA12(SEQ ID Nos.63，77，81，82，64，67，69，71，75，78，80，79，66)没有发现显著的同源性。克隆TbRa24与TbRa29重叠。
使用来自几个不同的结核分枝杆菌免疫的患者的T-细胞制剂对代表性重组抗原进行的PBMC增殖和干扰素-γ测定的结果分别在表2和3中给出。
表2对代表性可溶性抗原的PBMC增殖的结果

＝not tested
表3对于代表性可溶性抗原的OBMC干扰素-γ产生的结果

在表2和3中给出1.2和2(与单独在培养基中培养的细胞相比)之间的刺激指数(SI)的应答评分为±，2-4的SI评分为+，1μg或更小的浓度时4-8或2-4的SI评分为++，大于8的SI评分为+++。另外，附图中说明了浓度对上述抗原中的两种的增殖和干扰素-γ产生的影响。对于增殖和干扰素-γ产生两者，TbRa3评分为++和TbRa9为+。
这些结果表明这些可溶性抗原可以在来自结核分枝杆菌免疫的个体的T-细胞中诱导增殖和/或干扰素-γ产生。B.用来自患有肺或胸膜结核病患者的血清鉴定编码结核分枝杆菌抗原的DNA序列用来自患有活性结核病的患者的血清的集合液筛选上述基因组DNA文库，和另外的H37Rv文库。为了制备H37Rv文库分离结核分枝杆菌菌株H37Rv基因组DNA，使部分Sau3A消化并用来用λZap表达载体系统(Stratagene，La Jolla，Ca)构建表达文库。表达筛选中使用三份不同的血清集合液，每份含有从三名患有活性肺或胸膜疾病的个体获得的血清。集合液标示为TbL，TbM和TbH，指在ELISA和免疫印迹甲酸盐中与H37Ra裂解液的相关反应性(即TbL＝低反应性，TbM＝中反应性和TbH＝高反应性)。也使用了来自患有活性肺结核的7名患者的第4个血清集合液。所有的血清没有与重组体38kD结核分枝杆菌H37Ra磷酸酶-结合蛋白质的提高的反应性。
所有的集合液用大肠杆菌预吸附，并且用来筛选H37Ra和H37Rv表达文库，如Sambrook等，分子克隆实验室手册.冷泉港实验室，冷泉港，NY，1989所述。纯化噬菌体噬菌斑表达免疫反应性抗原。从噬菌斑回收噬粒，并推导出结核分枝杆菌克隆的核苷酸序列。
纯化32个克隆，其中31个代表先前没有在人结核分枝杆菌中鉴定的序列。鉴定的DNA分子的代表性序列在SEQ ID Nos26-51和105中给出。其中TbH-8-2(SEQ ID No.105)是TbH-8的第二级克隆，TbH-4(SEQ ID No.43)和TbH-4-FWD(SEQ ID No.44)是来自相同克隆的不邻接序列。下文中鉴定为Tb38-1，TbH-4，TbH-8，TbH-9和TbH-12的抗原的氨基酸序列见SEQ ID Nos.88-92。使用上文鉴定的数据库将这些序列与基因库中的已知的序列相比较，表明与TbH-4，TbH-8，TbH-9和TbM-3没有明显的同源性，但是发现与TbH-9有弱的同源性。发现TbH-12是先前在M.paratuberculosis(Acc.No.S28515)鉴定的34kD抗原蛋白质是同系物。发现Tb38-1位于先前在牛分枝杆菌(Acc.No.U34848)和结核分枝杆菌中鉴定的抗原ESAT-6(Sorensen等，Infec.Immun.631710-1717，1995)的可读框的34碱基对上游。
用来自两者都是从H37Ra文库中分离的Tb38-1和TbH-9的探针鉴定H37Rv中的克隆。Tb38-1与Tb38-1F2，Tb38-1F3，Tb38-1F5和Tb38-1F6(SEQ ID Nos112，113，116，118和119)杂交。(SEQ IDNos112和113是来自克隆Tb38-1F2的不邻接序列) Tb38-1F2中推导出两个可读框；一个相应于Tb37FL(SEQ ID No.114)，第二个，部分序列，可能是Tb38-1的同源物，并且称为Tb38-IN(SEQ ID No.115)。Tb38-1F3推导的氨基酸序列在SEQ ID No.117给出。TbH-9探针鉴定H37Rv文库中三个克隆TbH-9-FL(SEQ ID No.106)，其可能是TbH-9的同源物(H37Ra)，TbH-9-1(SEQ ID No.108)，和TbH-9-4(SEQ ID No.110)，所有的都是与TbH-9高度相关的序列。这三个克隆的推导的氨基酸序列在(SEQ ID Nos107，109和111中给出。
如上所述，进一步筛选结核分枝杆菌基因组DNA文库，结果发现10个另外的反应性克隆，代表7个不同的基因。这些基因中的一个鉴定为上面讨论的38kD抗原，测定一个鉴定为先前表明在结核分枝杆菌中存在的14kD α-结晶热震扰蛋白质，测定第三种鉴定为上述抗原TbH-8。测定的剩下的5个克隆的DNA序列(下文称之为TbH-29，TbH-30，TbH-32和TbH-33)分别在SEQ ID NO138-141中提供，相应的预示的氨基酸序列分别在SEQ ID NO142-145中提供。这些抗原的DNA和氨基酸序列与上述基因库的那些相比较。对于TbH-29的5′末端(其包含反应性可读框)没有发现同源性，但是发现TbH-29的3′末端与结核分枝杆菌粘粒Y227相同。发现TbH-32和TbH-33分别与先前鉴定的结核分枝杆菌插入元件IS110和与结核分枝杆菌粘粒Y50相同。发现与TbH-30没有显著的同源性。
如上文Sambrook所述，用来自该附加的筛选的阳性噬菌粒感染大肠杆菌XL-1BlueMRF′。通过加入IPTG进行重组蛋白质的诱导。以双份使诱导的和没有诱导的裂解液流经SDS-PAGE并且转移到硝基纤维素滤器。滤器和与TbH具有反应性的人结核分枝杆菌血清(1∶200稀释度)和与lacZ的N-末端4Kd部分具有反应性的兔血清(1∶200或1∶250稀释度)反应。血清在室温下温育2小时。通过加入125I-标记的蛋白质A并且接着暴露给膜范围为16小时至11天不同的时间来测定结合的抗体。免疫印迹的结果总结在表4中。
表4人M.tb抗-lacZ抗原血清血清TbH-2945Kb 45KbTbH-30没有反应性29KbTbH-3212Kb 12KbTbH-3316Kb 16Kb重组人结核分枝杆菌抗原与人结核分枝杆菌血清和抗-lacZ血清两者的阳性反应表明人结核分枝杆菌血清的反应性指向融合蛋白质。抗原与抗-lacZ血清有反应性而与人结核分枝杆菌血清没有反应性可能是人结核分枝杆菌血清识别构象表位的结果，或者抗原-抗体结合动力学可能是如此，使得在免疫印迹中暴露2小时是不够的。
下面表5A，B和6分别给出对Tb38-1，ESAT-6和其它代表性重组抗原进行的T-细胞测试的结果
表5A代表性抗原的PBMC增殖的结果

<p>这些结果表明本发明结核分枝杆菌抗原和ESAT-6两者都诱导来自结核分枝杆菌免疫的个体的T-细胞中的增殖和/或干扰素-γ产生。据发明人所知，先前没有表明过ESAT-6刺激人免疫应答。
用实施例6描述的方法构建覆盖抗原Tb38-1的氨基酸序列的一系列6个重叠肽。这些肽的序列，下文称之为pep-6分别在SEQ IDNos.93-98中提供。使用这些肽的T-细胞测定的结果在表7和8中给出。这些结果证实该存在，并且帮助确定能诱导来自结核分枝杆菌免疫的个体的T-细胞中的增殖和/或干扰素-γ产生的Tb38-1中T-细胞表位的位置。
表7Tb38-1肽的PBMC增殖的结果

表8Tb38-1肽的干扰素-γ增殖的结果

进行研究测定抗原TbH-9和Tb38-1是否代表细胞蛋白质或者分泌到结核分枝杆菌培养基中。在第一项研究中，使用基本上与实施例3A描述的方法相同的方法产生兔血清抗(A)结核分枝杆菌分泌的蛋白质，(B)已知的分泌重组结核分枝杆菌抗原85b，(C)重组Tb38-1和(D)重组TbH-9。在固定在硝基纤维素膜上的变性凝胶上分离总的结核分枝杆菌裂解液，结核分枝杆菌培养基和重组抗原85b，TbH-9和Tb38-1的浓缩上清液，用上述兔血清探测双份印迹。
使用对照血清(I系列)和抗血清(II系列)抗分泌的蛋白质，重组体85b，重组体Tb38-1和重组体TbH-9的该分析的结果分别见图3A-D，其中泳道标示为1)分子量蛋白质标准；2)5μg结核分枝杆菌裂解液；3)5μg分泌的蛋白质；4)50ng重组体Tb38-1；5)50ng重组体TbH-9；和6)50ng重组体85b。用6个末端组氨酸残基人工改造重组体抗原，因此预期以比天然蛋白质大大约1kD的迁移率迁移。在图3D中，重组体TbH-9缺少全长42kD的大约10kD，因此裂解液泳道中免疫反应性天然TbH-9的大小有明显差别(箭头所示)。这些结果证明Tb38-1和TbH-9是分子内抗原并且不是结核分枝杆菌所活性分泌的。
通过测定TbH-9-特异性人T细胞克隆对重组体TbH-9，分泌性结核分枝杆菌蛋白质和PPD的反应性证明TbH-9是分子内抗原的发现。TbH-9-特异性T细胞克隆(标示为131 TbH-9)从健康PPD-阳性供者的PBMC产生。131 TbH-9对分泌的蛋白，重组体TbH-9和对照结核分枝杆菌抗原，TbRa11的增殖应答通过根据实施例1所述测定的氚化胸苷的摄入来测定。如图4A所示，克隆131TbH-9特异性应答于TbH-9，表明TbH-9不是结核分枝杆菌分泌性蛋白的主要成分。图4B说明从来自健康PPD-阳性供者的PBMC制备的第二TbH-9特异性T克隆(标示为PPD800-10)的IFN-γ的产生，接着用分泌性蛋白质，PPD或重组体TbH-9刺激T细胞克隆。这些结果进一步证实TbH-9不是结核分枝杆菌分泌的。C.用来自患有肺外结核病的患者的血清鉴定编码结核分枝杆菌抗原的DNA系列从结核分枝杆菌Erdman菌株分离基因组DNA，随机剪切，并用来用λZAP表达系统(Stratagene，La Jolla，CA)构建表达文库。如上文实施例3B所述，用从患有肺外结核病的个体获得的血清集合液筛选单独的文库，第二抗体是与碱性磷酸酶偶联的山羊抗人IgG+A+M(H+L)。
纯化出18个克隆。发现其中4个克隆(下文称之为XP14，XP24，XP31和XP32)与已知的系列具有一定的相似性。SEQ ID Nos156-158分别提供了XP14，XP24和XP31的测定的DNA序列，XP32的5′和3′DNA序列分别在SEQ ID Nos159和160提供。XP14预示的氨基酸序列在SEQ ID Nos161中提供。发现XP14的反向互补序列编码SEQ IDNos162中提供的氨基酸序列。
将剩余的14个克隆(后文称之为XP1-XP6，XP17-XP19，XP22，XP25，XP27，XP30和XP36)的序列与上述基因库中的序列相比较，表明除了发现与已知的结核分枝杆菌粘粒具有一定的同源性的XP2和XP6的3′末端外都没有同源性。SEQ ID Nos163和164分别提供了XP27和XP34的DNA序列，XP4，XP5，XP17和XP30的5′序列分别在SEQID Nos165-168中给出，XP2，XP3，XP6，XP18，XP19，XP22和XP25的5′和3′序列分别在SEQ ID Nos169和170；173和172；173和174；175和176；177和178；179和180；和181和182中给出。上文公开了发现XP1与TbH4的DNA序列重叠。SEQ ID No.183提供了TbH4-XP1的全长DNA序列。发现该DNA序列包含编码SEQ ID No.184所示氨基酸序列的可读框。发现TbH4-XP1的反向互补序列包含编码SEQ ID No.185所示氨基酸序列的可读框。发现XP36的DNA序列包含编码SEQ ID Nos.186和187所示氨基酸序列的两个可读框，反向互补序列包含编码SEQ ID No.188所示氨基酸序列的可读框。
根据实施例3B所述制备重组体XP2蛋白质，纯化时使用金属离子亲和层析柱。如图8A-B和9A-B详述，使用这里所描述的测定，发现重组体XP1刺激从结核分枝杆菌免疫供者分离的T细胞中细胞增殖和IFN-γ产生。D.用抗结核分枝杆菌分级分离的蛋白质的兔抗-血清制备结核分枝杆菌可溶性抗原根据上文实施例2所述制备结核分枝杆菌裂解液。通过HPLC将得到的材料分级分离，并且用来自表现出极小或者没有与本发明其它抗原的免疫反应性的结核分枝杆菌感染患者的血清集合液通过蛋白质印迹筛选级分的血清学活性。用实施例3A描述的方法产生抗最具有反应性的级分的兔-抗血清。用抗-血清来筛选如上所述制备的结核分枝杆菌Erdman菌株基因组DNA表达文库。纯化表达免疫反应性抗原的噬菌体噬菌斑。从噬斑中回收噬粒，并且测定结核分枝杆菌克隆的核苷酸序列。
纯化10个不同的克隆。其中，发现一个是如上所述的TbRa35，发现一个是先前鉴定的结核分枝杆菌抗原HSP60。剩余的8个克隆中，发现7个(后文称之为RDIF2，RDIF5，RDIF8，RDIF10，RDIF11和RDIF12)具有与先前鉴定的结核分枝杆菌序列一定的相似性。SEQ ID Nos189-193分别提供了RDIF2，RDIF5，RDIF8，RDIF10和RDIF11的测定的DNA序列，相应的预示的氨基酸序列分别在SEQ ID Nos194-198中提供。RDIF12的5′和3′DNA序列分别在SEQ ID Nos199和200中提供。RDIF7的测定的DNA序列和预示的氨基酸序列分别在SEQ ID Nos201和202中提供。分离了另外一个克隆，称之为RDIF6，但是发现与RDIF5相同。
如上所述制备重组体RDIF6，RDIF8，RDIF10和RDIF11。如图8A-B和9A-B所示，发现这些抗原刺激从结核分枝杆菌免疫供者分离的T细胞中细胞增殖和IFN-γ产生。
实施例4来自结核菌素纯化的蛋白质衍生物的多肽的纯化和表征如下从结核菌素纯化的蛋白质衍生物(PPD)分离结核分枝杆菌多肽。
根据所公开的制备带有一些修饰的PPD(Seibert，F.等，结核菌素纯化的蛋白质衍生物，大量标准物的制备和分析，美国结核病综述(TheAmerican Review of Tuberculosis)449-25，1941)。
结核分枝杆菌Rv菌株在滚瓶中合成培养基中在37℃下生长6星期。然后在水蒸气中将含有细菌生长的瓶加热到100℃保持3小时用0.22μ滤器无菌过滤培养基，液相用3kD截留膜浓缩20次。用50％硫酸铵溶液使蛋白质沉淀一次，用用25％硫酸铵溶液沉淀八次。得到的蛋白质(PPD)通过在 Biocad HPLC 系统(Perseptive Biosystems，Framingham，MA)中C18柱(7.8×300mM；Waters，Milford，MA)通过反相液相色谱(RP-HPLC)分级分离。用线性梯度0-100％缓冲液(0.1％TFA乙腈溶液)从柱子中洗脱出级分。流速是10mL/分钟，在214nm和280nm监测洗脱液。
收集6个级分，干燥，并且悬浮于PBS，并且分别在结核分枝杆菌感染的豚鼠中试验诱导延迟型超敏性(DTH)反应。发现一个级分诱导强的DTH反应，接着通过在Perkin Elmer/Applied Biosystems DivisionModel 172HPLC中微内径Vydac C18柱(Cat.No.218TP5115)上的RP-HPLC进一步分级分离。用线性梯度5-100％缓冲液(0.05％TFA乙腈溶液)洗脱出级分。流速是80μL/分钟，在215nm监测洗脱液。收集8个级分，并且测试结核分枝杆菌感染的豚鼠内DTH的诱导作用。发现1个级分诱导大约16mm硬化强的DTH。其它级分没有诱导可监测的DTH。使阳性级分进行SDS-PAGE凝胶电泳，发现包括大约12kD分子量的单一蛋白质泳带。
使用如上所述的Perkin Elmer/Applied Biosystems Division Procise492蛋白质测序仪从氨基末端对后文称之为DPPD的该多肽测序，发现具有SEQ ID No.129所示的N-末端序列。将该序列与上述基因库中的已知的序列相比较表明没有已知的同源性。分离出4个溴化氰片段，发现具有SEQ ID Nos.130-133所示的序列。
根据实施例1所述测定抗原DPPD刺激人PBMC增殖和产生IFN-γ的能力。如图9所示，发现DPPD刺激增殖和诱导大量IFN-γ的产生；比商售PPD诱导的要大。
表9对DPPD的增殖和干扰素-γ测定的结果

实施例5代表性抗原诊断结核病的用途该实施例详细说明皮试中几个代表性多肽诊断结核分枝杆菌感染的有效性。
对个体皮内注射含有0.1μg蛋白质(对于TbH-9和TbRa35)或0.1μg蛋白质(对于TbRa38-1)的100μLPBS或PBS加Tween 20TM。注射后5-7天间测定硬结，5mm或更大的硬结应答认为是阳性的。在试验的20名个体中，2名是PPD是阴性，18名是PPD阳性。在PPD阳性个体中，3名患有活性结核病，3名先前感染过结核病，9名是健康的。在第二项试验中，用如上所述PBS或PBS加Tween 20TM中0.1μg TbRa11对13名PPD阳性个体进行试验。两性研究的结果见表10。
表10用代表性抗原的DTH试验的结果

实施例6合成的多肽的合成在Millipore9050肽合成仪上用FMOC化学用HPTU(六氟磷酸O-苯并三唑-N，N，N′，N′-四甲基uronium)活化可以合成多肽。Gly-Cys-Gly序列可以与肽的氨基末端连接以提供肽的偶联或标记的方法。可以用下面的裂解混合物进行肽自固相载体上的裂解三氟乙酸∶乙二硫醇∶硫代茴香醚∶水∶苯酚(40∶1∶2∶2∶3)。裂解2小时后，在冷的甲基叔丁基醚中沉淀肽。然后将肽沉积物溶解于含有0.1％三氟乙酸(TFA)的水中，并且在通过C18反相HPLC纯化之前冻干。可以使用梯度水中(含有0.1％TFA)0％-60％乙腈(含有0.1％TFA)来洗脱肽。冻干纯级分后，可以使用电子喷射质谱和通过氨基酸分析来表征肽。
实施例7结核分枝杆菌融合蛋白质的纯化和表征如下制备包含TbRa3，38kD和Tb38-1的融合蛋白。
通过PCR修饰各DNA构建TbRa3，38kD和Tb38-1，以有利于TbRa3-38kD-Tb38-1的融合作用的表达和接下来的融合蛋白。分别使用引物PDM-64和PDM-65(SEQ ID NO146和147)，PDM-57和PDM-58(SEQ ID NO148和149)，和PDM-69和PDM-60(SEQ ID NO150和151)，用TbRa3，38kD和Tb38-1DNA进行PCR。在各种情况下使用10μL10X Pfu缓冲液，2μL 10mMdNTPs，2μL 10μM浓度的各PCR引物，81.5μL水，1.5μL 10X PfuDNA聚合酶(Stratagene，La Jola，CA)和1μL70ng/μL(TbRa3)或者50ng/μL(38kD和Tb38-1)的DNA进行DNA扩增。对于TbRa3，在94℃变性进行2分钟，接着40个周期的96℃15秒和72℃1分钟，和最后72℃4分钟。对于38kD，在96℃变性进行2分钟，接着40个周期的96℃30秒和68℃15秒和72℃3分钟，和最后72℃4分钟。对于Tb38-1，在94℃变性进行2分钟，接着10个周期的96℃30秒，68℃15秒和72℃1.5分钟，30个周期的96℃15秒，64℃15秒和72℃1.5分钟和最后72℃4分钟。
TbRa3PCR片段用NdeI和EcoRI消化，并且使用NdeI和EcoRI位点直接克隆到pT 7∧L2IL1载体。38kDPCR片段用Sse8387I消化，用T4 DNA聚合酶处理制备平端，并且然后用EcoRI消化直接克隆到Stul和EcoRI消化的pT 7∧L2Ra3-1载体。38-1PCR片段用Eco47III和EcoRI消化并且直接亚克隆到用相同的酶消化的pT 7∧L2Ra3/38kD-17。然后用NdeI和EcoRI位点将全部融合物转移到pET28b。通过DNA测序证实融合构建物。
表达构建转化到BLR pLys S E.coli(Novagen，Msdison，WI)，并且在LB肉汤中与卡那霉素(30μg/mL)和氯霉素(34μg/mL)生长过夜。用该培养物(12mL)接种500mL含有相同抗生素的2XYT，并且在0.44OD560用IPGT诱导至1.2mM终浓度。诱导后4小时，收获细菌，并且在20mM Tris(8.0)，100mM氯化钠，0.1％DOC，20μg/mL亮肽素，20mMPMSF中超声，之后于26000Xg离心。得到的吐弃块重新悬浮于8M脲，20mM Tris(8.0)，100mM氯化钠中，并且与结合脯氨酸的镍树脂(Invitrogen，Carlsbad，CA)结合。用上述缓冲液将柱子冲洗几次后用咪唑梯度(50mM，100mM，500mM咪唑加入到8M脲，20mMTris(8.0)，100mM氯化钠中)洗脱。然后含有所感兴趣的蛋白质的洗脱液对10mM Tris(8.0)透析。
得到的融合蛋白的DNA和氨基酸序列分别在SEQ ID NO152和153中提供。
没有铰合部的包含两个抗原TbH-9和Tb38-1的融合蛋白(下文称之为TbH-9-Tb38-1)用类似于上述相似方法制备。TbH-9-Tb38-1融合蛋白的DNA序列在SEQ ID NO156中提供。
应用上述实施例1中描述的方法测定PBMC制剂中融合蛋白TbH-9-Tb38-1诱导T细胞增殖和IFN-γ产生的能力。使用来自三名供者的PBMC一名事先表现出应答TbH-9而不应答Tb38-1(供者131)；一名表现出应答Tb38-1而不应答TbH-9(供者184)；一名表现出应答两种抗原(供者201)。这些研究的结果(图5-7，各自)证明融合蛋白中两种抗原的功能活性。
如下制备包含TbRa3，抗原38kD，Tb38-1和DPEP的融合蛋白。
基本上如上所述通过PCR修饰各DNA构建TbRa3，38kD，Tb38-1，并且克隆到载体中，引物PDM-69(SEQ ID NO150)和PDM-83(SEQ ID NO205)用来扩增Tb38-1A片段。Tb38-1A与Tb38-1的不同在于处于一个编码区的3′末端的DraI位点，所述编码区保持最后的氨基酸完整，同时产生读框中的钝的限制性酶切位点。然后用NdeI和EcoR1位点将TbRa3/38kD/Tb38-1A融合物转移到pET28b。
用引物PDM-84和PDM-85(分别是SEQ ID NO206和207)和1μL 50ng/μL DNA，用DPEP DNA进行PCR。在94℃变性进行2分钟，接着10个周期的96℃15秒，68℃15秒和72℃1.5分钟；30个周期的96℃15秒，64℃15秒和72℃1.5分钟和最后72℃4分钟。用EcoRI和Eco72I消化DPEP PCR片段，并且直接克隆到用DraI和EcoRI消化的pET28Ra3/38kD/38-1A构建。通过DNA测序证明该融合构建是正确的。如上所述制备重组蛋白。SEQ ID NO208和209种分别提供得到的融合蛋白(下文称之为TbF-2)的DNA和氨基酸序列。
用上述方法通过ELISA测定融合蛋白TbF-2与来自结核分枝杆菌感染的患者的血清的反应性。这些研究(表11)的结果证明所有4种抗原功能在融合蛋白中是独立的。
表11TbF-2融合重组体与TB和正常血清的反应性

>
本领域技术人员应该理解融合蛋白质中各抗原的顺序可以变化，并且预计有相当的活性，只要每一个表位功能仍然存在。另外，融合蛋白质构建中可以使用包含活性表位的蛋白质的截短形式。
由上述可以理解尽管本发明为了详细说明的目的描述了本发明的具体实施方案，但是不脱离本发明精神和范围可以进行各种各样的修饰。
序列表(1)一般信息(i)申请人Reed，Steven G.
Skeiky，Yasir A.W.
Dillon，Davin C.
Campos-Neto，AntonioHoughton，RaymondVedvick，Thomas S.
Twardzik，Daniel R.
Lodes，Michael J.
(ii)发明题目免疫治疗和诊断结核病的化合物和方法(iii)序列数214(iv)联系地址(A)住址SEED和BERRYLLP(B)街道6300 Columbia Center，701 Fifth Avenue(C)城市Seattle(D)州华盛顿(E)国家美国(F)邮编(ZIP)98104-7092(v)计算机可读形式(A)Floppy盘(B)计算机IBM PC兼容(C)操作系统PC-DOS/MS-DOS(D)软盘Patent In Release#1.0，Version #1.30(vi)当前申请数据(A)申请号(B)申请日01-10-1997(C)分类(viii)代理人/事务所信息(A)名称Maki，David J.
(B)登记号31392(C)参考/记录号210121.411C7(ix)电讯情报(A)电话(206)622-4900(B)电传(206)682-6031(2)SEQ ID NO1的信息(i)序列特征(A)长度766个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO1CGAGGCACCG GTAGTTTGAA CCAAACGCAC AATCGACGGG CAAACGAACG GAAGAACACA 60ACCATGAAGA TGGTGAAATC GATCGCCGCA GGTCTGACCG CCGCCGCTGC AATCGGCGCC 120GCTGCGGCCG GTGTGACTTC GATCATGGCT GGCGGCCCGG TCGTATACCA GATGCAGCCG 180GTCGTCTTCG GCGCGCCACT GCCGTTGGAC CCGGCATCCG CCCCTGACGT CCCGACCGCC 240GCCCAGTTGA CCAGCCTGCT CAACAGCCTC GCCGATCCCA ACGTGTCGTT TGCGAACAAG 300GGCAGTCTGG TCGAGGGCGG CATCGGGGGC ACCGAGGCGC GCATCGCCGA CCACAAGCTG 360AAGAAGGCCG CCGAGCACGG GGATCTGCCG CTGTCGTTCA GCGTGACGAA CATCCAGCCG 420GCGGCCGCCG GTTCGGCCAC CGCCGACGTT TCCGTCTCGG GTCCGAAGCT CTCGTCGCCG 480GTCACGCAGA ACGTCACGTT CGTGAATCAA GGCGGCTGGA TGCTGTCACG CGCATCGGCG 540ATGGAGTTGC TGCAGGCCGC AGGGNAACTG ATTGGCGGGC CGGNTTCAGC CCGCTGTTCA 600GCTACGCCGC CCGCCTGGTG ACGCGTCCAT GTCGAACACT CGCGCGTGTA GCACGGTGCG 660GTNTGCGCAG GGNCGCACGC ACCGCCCGGT GCAAGCCGTC CTCGAGATAG GTGGTGNCTC 720GNCACCAGNG ANCACCCCCN NNTCGNCNNT TCTCGNTGNT GNATGA 766(2)SEQ ID NO2的信息(i)序列特征(A)长度752个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO2ATGCATCACC ATCACCATCA CGATGAAGTC ACGGTAGAGA CGACCTCCGT CTTCCGCGCA 60GACTTCCTCA GCGAGCTGGA CGCTCCTGCG CAAGCGGGTA CGGAGAGCGC GGTCTCCGGG 120GTGGAAGGGC TCCCGCCGGG CTCGGCGTTG CTGGTAGTCA AACGAGGCCC CAACGCCGGG 180TCCCGGTTCC TACTCGACCA AGCCATCACG TCGGCTGGTC GGCATCCCGA CAGCGACATA 240TTTCTCGACG ACGTGACCGT GAGCCGTCGC CATGCTGAAT TCCGGTTGGA AAACAACGAA 300TTCAATGTCG TCGATGTCGG GAGTCTCAAC GGCACCTACG TCAACCGCGA GCCCGTGGAT 360TCGGCGGTGC TGGCGAACGG CGACGAGGTC CAGATCGGCA AGCTCCGGTT GGTGTTCTTG 420ACCGGACCCA AGCAAGGCGA GGATGACGGG AGTACCGGGG GCCCGTGAGC GCACCCGATA 480GCCCCGCGCT GGCCGGGATG TCGATCGGGG CGGTCCTCCG ACCTGCTACG ACCGGATTTT 540CCCTGATGTC CACCATCTCC AAGATTCGAT TCTTGGGAGG CTTGAGGGTC NGGGTGACCC 600CCCCGCGGGC CTCATTCNGG GGTNTCGGCN GGTTTCACCC CNTACCNACT GCCNCCCGGN 660TTGCNAATTC NTTCTTCNCT GCCCNNAAAG GGACCNTTAN CTTGCCGCTN GAAANGGTNA 720TCCNGGGCCC NTCCTNGAAN CCCCNTCCCC CT752(2)SEQ ID NO3的信息(i)序列特征(A)长度813个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO3CATATGCATC ACCATCACCA TCACACTTCT AACCGCCCAG CGCGTCGGGG GCGTCGAGCA 60CCACGCGACA CCGGGCCCGA TCGATCTGCT AGCTTGAGTC TGGTCAGGCA TCGTCGTCAG 120CAGCGCGATG CCCTATGTTT GTCGTCGACT CAGATATCGC GGCAATCCAA TCTCCCGCCT 180GCGGCCGGCG GTGCTGCAAA CTACTCCCGG AGGAATTTCG ACGTGCGCAT CAAGATCTTC 240ATGCTGGTCA CGGCTGTCGT TTTGCTCTGT TGTTCGGGTG TGGCCACGGC CGCGCCCAAG 300ACCTACTGCG AGGAGTTGAA AGGCACCGAT ACCGGCCAGG CGTGCCAGAT TCAAATGTCC 360GACCCGGCCT ACAACATCAA CATCAGCCTG CCCAGTTACT ACCCCGACCA GAAGTCGCTG 420GAAAATTACA TCGCCCAGAC GCGCGACAAG TTCCTCAGCG CGGCCACATC GTCCACTCCA 480CGCGAAGCCC CCTACGAATT GAATATCACC TCGGCCACAT ACCAGTCCGC GATACCGCCG 540CGTGGTACGC AGGCCGTGGT GCTCAMGGTC TACCACAACG CCGGCGGCAC GCACCCAACG 600ACCACGTACA AGGCCTTCGA TTGGGACCAG GCCTATCGCA AGCCAATCAC CTATGACACG 660CTGTGGCAGG CTGACACCGA TCCGCTGCCA GTCGTCTTCC CCATTGTTGC AAGGTGAACT 720GAGCAACGCA GACCGGGACA ACWGGTATCG ATAGCCGCCN AATGCCGGCT TGGAACCCNG 780TGAAATTATC ACAACTTCGC AGTCACNAAA NAA 813(2)SEQ ID NO4的信息(i)序列特征(A)长度447个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO4CGGTATGAAC ACGGCCGCGT CCGATAACTT CCAGCTGTCC CAGGGTGGGC AGGGATTCGC 60CATTCCGATC GGGCAGGCGA TGGCGATCGC GGGCCAGATC CGATCGGGTG GGGGGTCACC 120CACCGTTCAT ATCGGGCCTA CCGCCTTCCT CGGCTTGGGT GTTGTCGACA ACAACGGCAA 180CGGCGCACGA GTCCAACGCG TGGTCGGGAG CGCTCCGGCG GCAAGTCTCG GCATCTCCAC 240CGGCGACGTG ATCACCGCGG TCGACGGCGC TCCGATCAAC TCGGCCACCG CGATGGCGGA 300CGCGCTTAAC GGGCATCATC CCGGTGACGT CATCTCGGTG AACTGGCAAA CCAAGTCGGG 360CGGCACGCGT ACAGGGAACG TGACATTGGC CGAGGGACCC CCGGCCTGAT TTCGTCGYGG 420ATACCACCCG CCGGCCGGCC AATTGGA 447(2)SEQ ID NO5的信息(i)序列特征(A)长度604个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO5GTCCCACTGC GGTCGCCGAG TATGTCGCCC AGCAAATGTC TGGCAGCCGC CCAACGGAAT 60CCGGTGATCC GACGTCGCAG GTTGTCGAAC CCGCCGCCGC GGAAGTATCG GTCCATGCCT 120AGCCCGGCGA CGGCGAGCGC CGGAATGGCG CGAGTGAGGA GGCGGGCAAT TTGGCGGGGC 180CCGGCGACGG NGAGCGCCGG AATGGCGCGA GTGAGGAGGT GGNCAGTCAT GCCCAGNGTG 240ATCCAATCAA CCTGNATTCG GNCTGNGGGN CCATTTGACA ATCGAGGTAG TGAGCGCAAA 300TGAATGATGG AAAACGGGNG GNGACGTCCG NTGTTCTGGT GGTGNTAGGT GNCTGNCTGG 360NGTNGNGGNT ATCAGGATGT TCTTCGNCGA AANCTGATGN CGAGGAACAG GGTGTNCCCG 420NNANNCCNAN GGNGTCCNAN CCCNNNNTCC TCGNCGANAT CANANAGNCG NTTGATGNGA 480NAAAAGGGTG GANCAGNNNN AANTNGNGGN CCNAANAANC NNNANNGNNG NNAGNTNGNT 540NNNTNTTNNC ANNNNNNNTG NNGNNGNNCN NNNCAANCNN NTNNNNGNAA NNGGNTTNTT 600NAAT 604(2)SEQ ID NO6的信息(i)序列特征(A)长度633个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO6TTGCANGTCG AACCACCTCA CTAAAGGGAA CAAAAGCTNG AGCTCCACCG CGGTGGCGGC 60CGCTCTAGAA CTAGTGKATM YYYCKGGCTG CAGSAATYCG GYACGAGCAT TAGGACAGTC120TAACGGTCCT GTTACGGTGA TCGAATGACC GACGACATCC TGCTGATCGA CACCGACGAA180CGGGTGCGAA CCCTCACCCT CAACCGGCCG CAGTCCCGYA ACGCGCTCTC GGCGGCGCTA240CGGGATCGGT TTTTCGCGGY GTTGGYCGAC GCCGAGGYCG ACGACGACAT CGACGTCGTC300ATCCTCACCG GYGCCGATCC GGTGTTCTGC GCCGGACTGG ACCTCAAGGT AGCTGGCCGG360GCAGACCGCG CTGCCGGACA TCTCACCGCG GTGGGCGGCC ATGACCAAGC CGGTGATCGG420CGCGATCAAC GGCGCCGCGG TCACCGGCGG GCTCGAACTG GCGCTGTACT GCGACATCCT480GATCGCCTCC GAGCACGCCC GCTTCGNCGA CACCCACGCC CGGGTGGGGC TGCTGCCCAC540CTGGGGACTC AGTGTGTGCT TGCCGCAAAA GGTCGGCATC GGNCTGGGCC GGTGGATGAG600CCTGACCGGC GACTACCTCT CCGTGACCGA CGC 633(2)SEQ ID NO7的信息(i)序列特征(A)长度1362个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO7CGACGACGAC GGCGCCGGAG AGCGGGCGCG AACGGCGATC GACGCGGCCC TGGCCAGAGT 60CGGCACCACC CAGGAGGGAG TCGAATCATG AAATTTGTCA ACCATATTGA GCCCGTCGCG 120CCCCGCCGAG CCGGCGGCGC GGTCGCCGAG GTCTATGCCG AGGCCCGCCG CGAGTTCGGC 180CGGCTGCCCG AGCCGCTCGC CATGCTGTCC CCGGACGAGG GACTGCTCAC CGCCGGCTGG 240GCGACGTTGC GCGAGACACT GCTGGTGGGC CAGGTGCCGC GTGGCCGCAA GGAAGCCGTC 300GCCGCCGCCG TCGCGGCCAG CCTGCGCTGC CCCTGGTGCG TCGACGCACA CACCACCATG 360CTGTACGCGG CAGGCCAAAC CGACACCGCC GCGGCGATCT TGGCCGGCAC AGCACCTGCC 420GCCGGTGACC CGAACGCGCC GTATGTGGCG TGGGCGGCAG GAACCGGGAC ACCGGCGGGA 480CCGCCGGCAC CGTTCGGCCC GGATGTCGCC GCCGAATACC TGGGCACCGC GGTGCAATTC 540CACTTCATCG CACGCCTGGT CCTGGTGCTG CTGGACGAAA CCTTCCTGCC GGGGGGCCCG 600CGCGCCCAAC AGCTCATGCG CCGCGCCGGT GGACTGGTGT TCGCCCGCAA GGTGCGCGCG 660GAGCATCGGC CGGGCCGCTC CACCCGCCGG CTCGAGCCGC GAACGCTGCC CGACGATCTG 720GCATGGGCAA CACCGTCCGA GCCCATAGCA ACCGCGTTCG CCGCGCTCAG CCACCACCTG 780GACACCGCGC CGCACCTGCC GCCACCGACT CGTCAGGTGG TCAGGCGGGT CGTGGGGTCG 840TGGCACGGCG AGCCAATGCC GATGAGCAGT CGCTGGACGA ACGAGCACAC CGCCGAGCTG 900CCCGCCGACC TGCACGCGCC CACCCGTCTT GCCCTGCTGA CCGGCCTGGC CCCGCATCAG 960GTGACCGACG ACGACGTCGC CGCGGCCCGA TCCCTGCTCG ACACCGATGC GGCGCTGGTT1020GGCGCCCTGG CCTGGGCCGC CTTCACCGCC GCGCGGCGCA TCGGCACCTG GATCGGCGCC1080GCCGCCGAGG GCCAGGTGTC GCGGCAAAAC CCGACTGGGT GAGTGTGCGC GCCCTGTCGG1140TAGGGTGTCA TCGCTGGCCC GAGGGATCTC GCGGCGGCGA ACGGAGGTGG CGACACAGGT1200GGAAGCTGCG CCCACTGGCT TGCGCCCCAA CGCCGTCGTG GGCGTTCGGT TGGCCGCACT1260GGCCGATCAG GTCGGCGCCG GCCCTTGGCC GAAGGTCCAG CTCAACGTGC CGTCACCGAA1320GGACCGGACG GTCACCGGGG GTCACCCTGC GCGCCCAAGG AA 1362(2)SEQ ID NO8的信息(i)序列特征(A)长度1458个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO8GCGACGACCC CGATATGCCG GGCACCGTAG CGAAAGCCGT CGCCGACGCA CTCGGGCGCG 60GTATCGCTCC CGTTGAGGAC ATTCAGGACT GCGTGGAGGC CCGGCTGGGG GAAGCCGGTC 120TGGATGACGT GGCCCGTGTT TACATCATCT ACCGGCAGCG GCGCGCCGAG CTGCGGACGG 180CTAAGGCCTT GCTCGGCGTG CGGGACGAGT TAAAGCTGAG CTTGGCGGCC GTGACGGTAC 240TGCGCGAGCG CTATCTGCTG CACGACGAGC AGGGCCGGCC GGCCGAGTCG ACCGGCGAGC 300TGATGGACCG ATCGGCGCGC TGTGTCGCGG CGGCCGAGGA CCAGTATGAG CCGGGCTCGT 360CGAGGCGGTG GGCCGAGCGG TTCGCCACGC TATTACGCAA CCTGGAATTC CTGCCGAATT 420CGCCCACGTT GATGAACTCT GGCACCGACC TGGGACTGCT CGCCGGCTGT TTTGTTCTGC 480CGATTGAGGA TTCGCTGCAA TCGATCTTTG CGACGCTGGG ACAGGCCGCC GAGCTGCAGC 540GGGCTGGAGG CGGCACCGGA TATGCGTTCA GCCACCTGCG ACCCGCCGGG GATCGGGTGG 600CCTCCACGGG CGGCACGGCC AGCGGACCGG TGTCGTTTCT ACGGCTGTAT GACAGTGCCG 660CGGGTGTGGT CTCCATGGGC GGTCGCCGGC GTGGCGCCTG TATGGCTGTG CTTGATGTGT 720CGCACCCGGA TATCTGTGAT TTCGTCACCG CCAAGGCCGA ATCCCCCAGC GAGCTCCCGC 780ATTTCAACCT ATCGGTTGGT GTGACCGACG CGTTCCTGCG GGCCGTCGAA CGCAACGGCC 840TACACCGGCT GGTCAATCCG CGAACCGGCA AGATCGTCGC GCGGATGCCC GCCGCCGAGC 900TGTTCGACGC CATCTGCAAA GCCGCGCACG CCGGTGGCGA TCCCGGGCTG GTGTTTCTCG 960ACACGATCAA TAGGGCAAAC CCGGTGCCGG GGAGAGGCCG CATCGAGGCG ACCAACCCGT1020GCGGGGAGGT CCCACTGCTG CCTTACGAGT CATGTAATCT CGGCTCGATC AACCTCGCCC1080GGATGCTCGC CGACGGTCGC GTCGACTGGG ACCGGCTCGA GGAGGTCGCC GGTGTGGCGG1140TGCGGTTCCT TGATGACGTC ATCGATGTCA GCCGCTACCC CTTCCCCGAA CTGGGTGAGG1200CGGCCCGCGC CACCCGCAAG ATCGGGCTGG GAGTCATGGG TTTGGCGGAA CTGCTTGCCG1260CACTGGGTAT TCCGTACGAC AGTGAAGAAG CCGTGCGGTT AGCCACCCGG CTCATGCGTC1320GCATACAGCA GGCGGCGCAC ACGGCATCGC GGAGGCTGGC CGAAGAGCGG GGCGCATTCC1380CGGCGTTCAC CGATAGCCGG TTCGCGCGGT CGGGCCCGAG GCGCAACGCA CAGGTCACCT1440CCGTCGCTCC GACGGGCA 1458(2)SEQ ID NO9的信息(i)序列特征(A)长度862个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO9ACGGTGTAAT CGTGCTGGAT CTGGAACCGC GTGGCCCGCT ACCTACCGAG ATCTACTGGC 60GGCGCAGGGG GCTGGCCCTG GGCATCGCGG TCGTCGTAGT CGGGATCGCG GTGGCCATCG 120TCATCGCCTT CGTCGACAGC AGCGCCGGTG CCAAACCGGT CAGCGCCGAC AAGCCGGCCT 180CCGCCCAGAG CCATCCGGGC TCGCCGGCAC CCCAAGCACC CCAGCCGGCC GGGCAAACCG 240AAGGTAACGC CGCCGCGGCC CCGCCGCAGG GCCAAAACCC CGAGACACCC ACGCCCACCG 300CCGCGGTGCA GCCGCCGCCG GTGCTCAAGG AAGGGGACGA TTGCCCCGAT TCGACGCTGG 360CCGTCAAAGG TTTGACCAAC GCGCCGCAGT ACTACGTCGG CGACCAGCCG AAGTTCACCA 420TGGTGGTCAC CAACATCGGC CTGGTGTCCT GTAAACGCGA CGTTGGGGCC GCGGTGTTGG 480CCGCCTACGT TTACTCGCTG GACAACAAGC GGTTGTGGTC CAACCTGGAC TGCGCGCCCT 540CGAATGAGAC GCTGGTCAAG ACGTTTTCCC CCGGTGAGCA GGTAACGACC GCGGTGACCT 600GGACCGGGAT GGGATCGGCG CCGCGCTGCC CATTGCCGCG GCCGGCGATC GGGCCGGGCA 660CCTACAATCT CGTGGTACAA CTGGGCAATC TGCGCTCGCT GCCGGTTCCG TTCATCCTGA 720ATCAGCCGCC GCCGCCGCCC GGGCCGGTAC CCGCTCCGGG TCCAGCGCAG GCGCCTCCGC 780CGGAGTCTCC CGCGCAAGGC GGATAATTAT TGATCGCTGA TGGTCGATTC CGCCAGCTGT 840GACAACCCCT CGCCTCGTGC CG 862(2)SEQ ID NO10的信息(i)序列特征(A)长度622个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO10TTGATCAGCA CCGGCAAGGC GTCACATGCC TCCCTGGGTG TGCAGGTGAC CAATGACAAA 60GACACCCCGG GCGCCAAGAT CGTCGAACTA GTGGCCGGTG GTGCTGCCGC GAACGCTGGA 120GTGCCGAAGG GCGTCGTTGT CACCAAGGTC GACGACCGCC CGATCAACAG CGCGGACGCG 180TTGGTTGCCG CCGTGCGGTC CAAAGCGCCG GGCGCCACGG TGGCGCTAAC CTTTCAGGAT 240CCCTCGGGCG GTAGCCGCAC AGTGCAAGTC ACCCTCGGCA AGGCGGAGCA GTGATGAAGG 300TCGCCGCGCA GTGTTCAAAG CTCGGATATA CGGTGGCACC CATGGAACAG CGTGCGGAGT 360TGGTGGTTGG CCGGGCACTT GTCGTCGTCG TTGACGATCG CACGGCGCAC GGCGATGAAG 420ACCACAGCGG GCCGCTTGTC ACCGAGCTGC TCACCGAGGC CGGGTTTGTT GTCGACGGCG 480TGGTGGCGGT GTCGGCCGAC GAGGTCGAGA TCCGAAATGC GCTGAACACA GCGGTGATCG 540GCGGGGTGGA CCTGGTGGTG TCGGTCGGCG GGACCGGNGT GACGNCTCGC GATGTCACCC 600CGGAAGCCAC CCGNGACATT CT 622(2)SEQ ID NO11的信息(i)序列特征(A)长度1200个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO11GGCGCAGCGG TAAGCCTGTT GGCCGCCGGC ACACTGGTGT TGACAGCATG CGGCGGTGGC 60ACCAACAGCT CGTCGTCAGG CGCAGGCGGA ACGTCTGGGT CGGTGCACTG CGGCGGCAAG 120AAGGAGCTCC ACTCCAGCGG CTCGACCGCA CAAGAAAATG CCATGGAGCA GTTCGTCTAT 180GCCTACGTGC GATCGTGCCC GGGCTACACG TTGGACTACA ACGCCAACGG GTCCGGTGCC 240GGGGTGACCC AGTTTCTCAA CAACGAAACC GATTTCGCCG GCTCGGATGT CCCGTTGAAT 300CCGTCGACCG GTCAACCTGA CCGGTCGGCG GAGCGGTGCG GTTCCCCGGC ATGGGACCTG 360CCGACGGTGT TCGGCCCGAT CGCGATCACC TACAATATCA AGGGCGTGAG CACGCTGAAT 420CTTGACGGAC CCACTACCGC CAAGATTTTC AACGGCACCA TCACCGTGTG GAATGATCCA 480CAGATCCAAG CCCTCAACTC CGGCACCGAC CTGCCGCCAA CACCGATTAG CGTTATCTTC 540CGCAGCGACA AGTCCGGTAC GTCGGACAAC TTCCAGAAAT ACCTCGACGG TGTATCCAAC 600GGGGCGTGGG GCAAAGGCGC CAGCGAAACG TTCAGCGGGG GCGTCGGCGT CGGCGCCAGC 660GGGAACAACG GAACGTCGGC CCTACTGCAG ACGACCGACG GGTCGATCAC CTACAACGAG 720TGGTCGTTTG CGGTGGGTAA GCAGTTGAAC ATGGCCCAGA TCATCACGTC GGCGGGTCCG 780GATCCAGTGG CGATCACCAC CGAGTCGGTC GGTAAGACAA TCGCCGGGGC CAAGATCATG 840GGACAAGGCA ACGACCTGGT ATTGGACACG TCGTCGTTCT ACAGACCCAC CCAGCCTGGC 900TCTTACCCGA TCGTGCTGGC GACCTATGAG ATCGTCTGCT CGAAATACCC GGATGCGACG 960ACCGGTACTG CGGTAAGGGC GTTTATGCAA GCCGCGATTG GTCCAGGCCA AGAAGGCCTG1020GACCAATACG GCTCCATTCC GTTGCCCAAA TCGTTCCAAG CAAAATTGGC GGCCGCGGTG1080AATGCTATTT CTTGACCTAG TGAAGGGAAT TCGACGGTGA GCGATGCCGT TCCGCAGGTA1140GGGTCGCAAT TTGGGCCGTA TCAGCTATTG CGGCTGCTGG GCCGAGGCGG GATGGGCGAG1200(2)SEQ ID NO12的信息(i)序列特征(A)长度1155个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO12GCAAGCAGCT GCAGGTCGTG CTGTTCGACG AACTGGGCAT GCCGAAGACC AAACGCACCA 60AGACCGGCTA CACCACGGAT GCCGACGCGC TGCAGTCGTT GTTCGACAAG ACCGGGCATC 120CGTTTCTGCA ACATCTGCTC GCCCACCGCG ACGTCACCCG GCTCAAGGTC ACCGTCGACG 180GGTTGCTCCA AGCGGTGGCC GCCGACGGCC GCATCCACAC CACGTTCAAC CAGACGATCG 240CCGCGACCGG CCGGCTCTCC TCGACCGAAC CCAACCTGCA GAACATCCCG ATCCGCACCG 300ACGCGGGCCG GCGGATCCGG GACGCGTTCG TGGTCGGGGA CGGTTACGCC GAGTTGATGA 360CGGCCGACTA CAGCCAGATC GAGATGCGGA TCATGGGGCA CCTGTCCGGG GACGAGGGCC 420TCATCGAGGC GTTCAACACC GGGGAGGACC TGTATTCGTT CGTCGCGTCC CGGGTGTTCG 480GTGTGCCCAT CGACGAGGTC ACCGGCGAGT TGCGGCGCCG GGTCAAGGCG ATGTCCTACG 540GGCTGGTTTA CGGGTTGAGC GCCTACGGCC TGTCGCAGCA GTTGAAAATC TCCACCGAGG 600AAGCCAACGA GCAGATGGAC GCGTATTTCG CCCGATTCGG CGGGGTGCGC GACTACCTGC 660GCGCCGTAGT CGAGCGGGCC CGCAAGGACG GCTACACCTC GACGGTGCTG GGCCGTCGCC 720GCTACCTGCC CGAGCTGGAC AGCAGCAACC GTCAAGTGCG GGAGGCCGCC GAGCGGGCGG 780CGCTGAACGC GCCGATCCAG GGCAGCGCGG CCGACATCAT CAAGGTGGCC ATGATCCAGG 840TCGACAAGGC GCTCAACGAG GCACAGCTGG CGTCGCGCAT GCTGCTGCAG GTCCACGACG 900AGCTGCTGTT CGAAATCGCC CCCGGTGAAC GCGAGCGGGT CGAGGCCCTG GTGCGCGACA 960AGATGGGCGG CGCTTACCCG CTCGACGTCC CGCTGGAGGT GTCGGTGGGC TACGGCCGCA 1020GCTGGGACGC GGCGGCGCAC TGAGTGCCGA GCGTGCATCT GGGGCGGGAA TTCGGCGATT 1080TTTCCGCCCT GAGTTCACGC TCGGCGCAAT CGGGACCGAG TTTGTCCAGC GTGTACCCGT 1140CGAGTAGCCT CGTCA 1155(2)SEQ ID NO13的信息(i)序列特征(A)长度1771个碱基对
(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO13GAGCGCCGTC TGGTGTTTGA ACGGTTTTAC CGGTCGGCAT CGGCACGGGC GTTGCCGGGT 60TCGGGCCTCG GGTTGGCGAT CGTCAAACAG GTGGTGCTCA ACCACGGCGG ATTGCTGCGC 120ATCGAAGACA CCGACCCAGG CGGCCAGCCC CCTGGAACGT CGATTTACGT GCTGCTCCCC 180GGCCGTCGGA TGCCGATTCC GCAGCTTCCC GGTGCGACGG CTGGCGCTCC GAGCACGGAC 240ATCGAGAACT CTCGGGGTTC GGCGAACGTT ATCTCAGTGG AATCTCAGTC CACGCGCGCA 300ACCTAGTTGT GCAGTTACTG TTGAAAGCCA CACCCATGCC AGTCCACGCA TGGCCAAGTT 360GGCCCGAGTA GTGGGCCTAG TACAGGAAGA GCAACCTAGC GACATGACGA ATCACCCACG 420GTATTCGCCA CCGCCGCAGC AGCCGGGAAC CCCAGGTTAT GCTCAGGGGC AGCAGCAAAC 480GTACAGCCAG CAGTTCGACT GGCGTTACCC ACCGTCCCCG CCCCCGCAGC CAACCCAGTA 540CCGTCAACCC TACGAGGCGT TGGGTGGTAC CCGGCCGGGT CTGATACCTG GCGTGATTCC 600GACCATGACG CCCCCTCCTG GGATGGTTCG CCAACGCCCT CGTGCAGGCA TGTTGGCCAT 660CGGCGCGGTG ACGATAGCGG TGGTGTCCGC CGGCATCGGC GGCGCGGCCG CATCCCTGGT 720CGGGTTCAAC CGGGCACCCG CCGGCCCCAG CGGCGGCCCA GTGGCTGCCA GCGCGGCGCC 780AAGCATCCCC GCAGCAAACA TGCCGCCGGG GTCGGTCGAA CAGGTGGCGG CCAAGGTGGT 840GCCCAGTGTC GTCATGTTGG AAACCGATCT GGGCCGCCAG TCGGAGGAGG GCTCCGGCAT 900CATTCTGTCT GCCGAGGGGC TGATCTTGAC CAACAACCAC GTGATCGCGG CGGCCGCCAA 960GCCTCCCCTG GGCAGTCCGC CGCCGAAAAC GACGGTAACC TTCTCTGACG GGCGGACCGC1020ACCCTTCACG GTGGTGGGGG CTGACCCCAC CAGTGATATC GCCGTCGTCC GTGTTCAGGG1080CGTCTCCGGG CTCACCCCGA TCTCCCTGGG TTCCTCCTCG GACCTGAGGG TCGGTCAGCC1140GGTGCTGGCG ATCGGGTCGC CGCTCGGTTT GGAGGGCACC GTGACCACGG GGATCGTCAG1200CGCTCTCAAC CGTCCAGTGT CGACGACCGG CGAGGCCGGC AACCAGAACA CCGTGCTGGA1260CGCCATTCAG ACCGACGCCG CGATCAACCC CGGTAACTCC GGGGGCGCGC TGGTGAACAT1320GAACGCTCAA CTCGTCGGAG TCAACTCGGC CATTGCCACG CTGGGCGCGG ACTCAGCCGA1380TGCGCAGAGC GGCTCGATCG GTCTCGGTTT TGCGATTCCA GTCGACCAGG CCAAGCGCAT1440CGCCGACGAG TTGATCAGCA CCGGCAAGGC GTCACATGCC TCCCTGGGTG TGCAGGTGAC1500CAATGACAAA GACACCCCGG GCGCCAAGAT CGTCGAAGTA GTGGCCGGTG GTGCTGCCGC1560GAACGCTGGA GTGCCGAAGG GCGTCGTTGT CACCAAGGTC GACGACCGCC CGATCAACAG1620CGCGGACGCG TTGGTTGCCG CCGTGCGGTC CAAAGCGCCG GGCGCCACGG TGGCGCTAAC1680CTTTCAGGAT CCCTCGGGCG GTAGCCGCAC AGTGCAAGTC ACCCTCGGCA AGGCGGAGCA1740GTGATGAAGG TCGCCGCGCA GTGTTCAAAG C 1771(2)SEQ ID NO14的信息(i)序列特征(A)长度1058个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO14CTCCACCGCG GTGGCGGCCG CTCTAGAACT AGTGGATCCC CCGGGCTGCA GGAATTCGGC 60ACGAGGATCC GACGTCGCAG GTTGTCGAAC CCGCCGCCGC GGAAGTATCG GTCCATGCCT 120AGCCCGGCGA CGGCGAGCGC CGGAATGGCG CGAGTGAGGA GGCGGGCAAT TTGGCGGGGC 180CCGGCGACGG CGAGCGCCGG AATGGCGCGA GTGAGGAGGC GGGCAGTCAT GCCCAGCGTG 240ATCCAATCAA CCTGCATTCG GCCTGCGGGC CCATTTGACA ATCGAGGTAG TGAGCGCAAA 300TGAATGATGG AAAACGGGCG GTGACGTCCG CTGTTCTGGT GGTGCTAGGT GCCTGCCTGG 360CGTTGTGGCT ATCAGGATGT TCTTCGCCGA AACCTGATGC CGAGGAACAG GGTGTTCCCG 420TGAGCCCGAC GGCGTCCGAC CCCGCGCTCC TCGCCGAGAT CAGGCAGTCG CTTGATGCGA 480CAAAAGGGTT GACCAGCGTG CACGTAGCGG TCCGAACAAC CGGGAAAGTC GACAGCTTGC 540TGGGTATTAC CAGTGCCGAT GTCGACGTCC GGGCCAATCC GCTCGCGGCA AAGGGCGTAT 600GCACCTACAA CGACGAGCAC GGTGTCCCGT TTCGGGTACA AGGCGACAAC ATCTCGGTGA 660AACTGTTCGA CGACTGGAGC AATCTCGGCT CGATTTCTGA ACTGTCAACT TCACGCGTGC 720TCGATCCTGC CGCTGGGGTG ACGCAGCTGC TGTCCGGTGT CACGAACCTC CAAGCGCAAG 780GTACCGAAGT GATAGACGGA ATTTCGACCA CCAAAATCAC CGGGACCATC CCCGCGAGCT 840CTGTCAAGAT GCTTGATCCT GGCGCCAAGA GTGCAAGGCC GGCGACCGTG TGGATTGCCC 900AGGACGGCTC GCACCACCTC GTCCGAGCGA GCATCGACCT CGGATCCGGG TCGATTCAGC 960TCACGCAGTC GAAATGGAAC GAACCCGTCA ACGTCGACTA GGCCGAAGTT GCGTCGACGC1020GTTGNTCGAA ACGCCCTTGT GAACGGTGTC AACGGNAC1058(2)SEQ ID NO15的信息(i)序列特征(A)长度542个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO15GAATTCGGCA CGAGAGGTGA TCGACATCAT CGGGACCAGC CCCACATCCT GGGAACAGGC 60GGCGGCGGAG GCGGTCCAGC GGGCGCGGGA TAGCGTCGAT GACATCCGCG TCGCTCGGGT120CATTGAGCAG GACATGGCCG TGGACAGCGC CGGCAAGATC ACCTACCGCA TCAAGCTCGA 180AGTGTCGTTC AAGATGAGGC CGGCGCAACC GCGCTAGCAC GGGCCGGCGA GCAAGACGCA 240AAATCGCACG GTTTGCGGTT GATTCGTGCG ATTTTGTGTC TGCTCGCCGA GGCCTACCAG 300GCGCGGCCCA GGTCCGCGTG CTGCCGTATC CAGGCGTGCA TCGCGATTCC GGCGGCCACG 360CCGGAGTTAA TGCTTCGCGT CGACCCGAAC TGGGCGATCC GCCGGNGAGC TGATCGATGA 420CCGTGGCCAG CCCGTCGATG CCCGAGTTGC CCGAGGAAAC GTGCTGCCAG GCCGGTAGGA 480AGCGTCCGTA GGCGGCGGTG CTGACCGGCT CTGCCTGCGC CCTCAGTGCG GCCAGCGAGC 540GG542(2)SEQ ID NO16的信息(i)序列特征(A)长度913个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO16CGGTGCCGCC CGCGCCTCCG TTGCCCCCAT TGCCGCCGTC GCCGATCAGC TGCGCATCGC 60CACCATCACC GCCTTTGCCG CCGGCACCGC CGGTGGCGCC GGGGCCGCCG ATGCCACCGC 120TTGACCCTGG CCGCCGGCGC CGCCATTGCC ATACAGCACC CCGCCGGGGG CACCGTTACC 180GCCGTCGCCA CCGTCGCCGC CGCTGCCGTT TCAGGCCGGG GAGGCCGAAT GAACCGCCGC 240CAAGCCCGCC GCCGGCACCG TTGCCGCCTT TTCCGCCCGC CCCGCCGGCG CCGCCAATTG 300CCGAACAGCC AMGCACCGTT GCCGCCAGCC CCGCCGCCGT TAACGGCGCT GCCGGGCGCC 360GCCGCCGGAC CCGCCATTAC CGCCGTTCCC GTTCGGTGCC CCGCCGTTAC CGGCGCCGCC 420GTTTGCCGCC AATATTCGGC GGGCACCGCC AGACCCGCCG GGGCCACCAT TGCCGCCGGG 480CACCGAAACA ACAGCCCAAC GGTGCCGCCG GCCCCGCCGT TTGCCGCCAT CACCGGCCAT 540TCACCGCCAG CAGCGCCGTT AATGTTTATG AACCCGGTAC CGCCAGCGCG GCCCCTATTG 600CCGGGCGCCG GAGNGCGTGC CCGCCGGCGC CGCCAACGCC CAAAAGCCCG GGGTTGCCAC 660CGGCCCCGCC GGACCCACCG GTCCCGCCGA TCCCCCCGTT GCCGCCGGTG CCGCCGCCAT 720TGGTGCTGCT GAAGCCGTTA GCGCCGGTTC CGCSGGTTCC GGCGGTGGCG CCNTGGCCGC 780CGGCCCCGCC GTTGCCGTAC AGCCACCCCC CGGTGGCGCC CTTGCCGCCA TTGCCGCCAT 840TGCCGCCGTT GCCGCCATTG CCGCCGTTCC CGCCGCCACC GCCGGNTTGG CCGCCGGCGC 900CGCCGGCGGC CGC913(2)SEQ ID NO17的信息(i)序列特征(A)长度1872个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO17GACTACGTTG GTGTAGAAAA ATCCTGCCGC CCGGACCCTT AAGGCTGGGA CAATTTCTGA 60TAGCTACCCC GACACAGGAG GTTACGGGAT GAGCAATTCG CGCCGCCGCT CACTCAGGTG 120GTCATGGTTG CTGAGCGTGC TGGCTGCCGT CGGGCTGGGC CTGGCCACGG CGCCGGCCCA 180GGCGGCCCCG CCGGCCTTGT CGCAGGACCG GTTCGCCGAC TTCCCCGCGC TGCCCCTCGA 240CCCGTCCGCG ATGGTCGCCC AAGTGGCGCC ACAGGTGGTC AACATCAACA CCAAACTGGG 300CTACAACAAC GCCGTGGGCG CCGGGACCGG CATCGTCATC GATCCCAACG GTGTCGTGCT 360CACCAACAAC CACGTGATCG CGGGCGCCAC CGACATCAAT GCGTTCAGCG TCGGCTCCGG 420CCAAACCTAC GGCGTCGATG TGGTCGGGTA TGACCGCACC CAGGATGTCG CGGTGCTGCA 480GCTGCGCGGT GCCGGTGGCC TGCCGTCGGC GGCGATCGGT GGCGGCGTCG CGGTTGGTGA 540GCCCGTCGTC GCGATGGGCA ACAGCGGTGG GCAGGGCGGA ACGCCCCGTG CGGTGCCTGG 600CAGGGTGGTC GCGCTCGGCC AAACCGTGCA GGCGTCGGAT TCGCTGACCG GTGCCGAAGA 660GACATTGAAC GGGTTGATCC AGTTCGATGC CGCAATCCAG CCCGGTGATT CGGGCGGGCC 720CGTCGTCAAC GGCCTAGGAC AGGTGGTCGG TATGAACACG GCCGCGTCCG ATAACTTCCA 780GCTGTCCCAG GGTGGGCAGG GATTCGCCAT TCCGATCGGG CAGGCGATGG CGATCGCGGG 840CCAAATCCGA TCGGGTGGGG GGTCACCCAC CGTTCATATC GGGCCTACCG CCTTCCTCGG 900CTTGGGTGTT GTCGACAACA ACGGCAACGG CGCACGAGTC CAACGCGTGG TCGGAAGCGC 960TCCGGCGGCA AGTCTCGGCA TCTCCACCGG CGACGTGATC ACCGCGGTCG ACGGCGCTCC1020GATCAACTCG GCCACCGCGA TGGCGGACGC GCTTAACGGG CATCATCCCG GTGACGTCAT1080CTCGGTGAAC TGGCAAACCA AGTCGGGCGG CACGCGTACA GGGAACGTGA CATTGGCCGA1140GGGACCCCCG GCCTGATTTG TCGCGGATAC CACCCGCCGG CCGGCCAATT GGATTGGCGC1200CAGCCGTGAT TGCCGCGTGA GCCCCCGAGT TCCGTCTCCC GTGCGCGTGG CATTGTGGAA1260GCAATGAACG AGGCAGAACA CAGCGTTGAG CACCCTCCCG TGCAGGGCAG TTACGTCGAA1320GGCGGTGTGG TCGAGCATCC GGATGCCAAG GACTTCGGCA GCGCCGCCGC CCTGCCCGCC1380GATCCGACCT GGTTTAAGCA CGCCGTCTTC TACGAGGTGC TGGTCCGGGC GTTCTTCGAC1440GCCAGCGCGG ACGGTTCCGN CGATCTGCGT GGACTCATCG ATCGCCTCGA CTACCTGCAG1500TGGCTTGGCA TCGACTGCAT CTGTTGCCGC CGTTCCTACG ACTCACCGCT GCGCGACGGC1560GGTTACGACA TTCGCGACTT CTACAAGGTG CTGCCCGAAT TCGGCACCGT CGACGATTTC1620GTCGCCCTGG TCGACACCGC TCACCGGCGA GGTATCCGCA TCATCACCGA CCTGGTGATG1680AATCACACCT CGGAGTCGCA CCCCTGGTTT CAGGAGTCCC GCCGCGACCC AGACGGACCG1740TACGGTGACT ATTACGTGTG GAGCGACACC AGCGAGCGCT ACACCGACGC CCGGATCATC1800TTCGTCGACA CCGAAGAGTC GAACTGGTCA TTCGATCCTG TCCGCCGACA GTTNCTACTG1860GCACCGATTC TT1872(2)SEQ ID NO18的信息(i)序列特征(A)长度1482个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO18CTTCGCCGAA ACCTGATGCC GAGGAACAGG GTGTTCCCGT GAGCCCGACG GCGTCCGACC 60CCGCGCTCCT CGCCGAGATC AGGCAGTCGC TTGATGCGAC AAAAGGGTTG ACCAGCGTGC 120ACGTAGCGGT CCGAACAACC GGGAAAGTCG ACAGCTTGCT GGGTATTACC AGTGCCGATG 180TCGACGTCCG GGCCAATCCG CTCGCGGCAA AGGGCGTATG CACCTACAAC GACGAGCAGG 240GTGTCCCGTT TCGGGTACAA GGCGACAACA TCTCGGTGAA ACTGTTCGAC GACTGGAGCA 300ATCTCGGCTC GATTTCTGAA CTGTCAACTT CACGCGTGCT CGATCCTGCC GCTGGGGTGA 360CGCAGCTGCT GTCCGGTGTC ACGAACCTCC AAGCGCAAGG TACCGAAGTG ATAGACGGAA 420TTTCGACCAC CAAAATCACC GGGACCATCC CCGCGAGCTC TGTCAAGATG CTTGATCCTG 480GCGCCAAGAG TGCAAGGCCG GCGACCGTGT GGATTGCCCA GGACGGCTCG CACCACCTCG 540TCCGAGCGAG CATCGACCTC GGATCCGGGT CGATTCAGCT CACGCAGTCG AAATGGAACG 600AACCCGTCAA CGTCGACTAG GCCGAAGTTG CGTCGACGCG TTGCTCGAAA CGCCCTTGTG 660AACGGTGTCA ACGGCACCCG AAAACTGACC CCCTGACGGC ATCTGAAAAT TGACCCCCTA 720GACCGGGCGG TTGGTGGTTA TTCTTCGGTG GTTCCGGCTG GTGGGACGCG GCCGAGGTCG 780CGGTCTTTGA GCCGGTAGCT GTCGCCTTTG AGGGCGACGA CTTCAGCATG GTGGACGAGG 840CGGTCGATCA TGGCGGCAGC AACGACGTCG TCGCCGCCGA AAACCTCGCC CCACCGGCCG 900AAGGCCTTAT TGGACGTGAC GATCAAGCTG GCCCGCTCAT ACCGGGAGGA CACCAGCTGG 960AAGAAGAGGT TGGCGGCCTC GGGCTCAAAC GGAATGTAAC CGACTTCGTC AACCACCAGG1020AGCGGATAGC GGCCAAACCG GGTGAGTTCG GCGTAGATGC GCCCGGCGTG GTGAGCCTCG1080GCGAACCGTG CTACCCATTC GGCGGCGGTG GCGAACAGCA CCCGATGACC GGCCTGACAC1140GCGCGTATCG CCAGGCCGAC CGCAAGATGA GTCTTCCCGG TGCCAGGCGG GGCCCAAAAA1200CACGACGTTA TCGCGGGCGG TGATGAAATC CAGGGTGCCC AGATGTGCGA TGGTGTCGCG1260TTTGAGGCCA CGAGCATGCT CAAAGTCGAA CTCTTCCAAC GACTTCCGAA CCGGGAAGCG1320GGCGGCGCGG ATGCGGCCCT CACCACCATG GGACTCCCGG GCTGACACTT CCCGCTGCAG1380GCAGGCGGCC AGGTATTCTT CGTGGCTCCA GTTCTCGGCG CGGGCGCGAT CGGCCAGCCG1440GGACACTGAC TCACGCAGGG TGGGAGCTTT CAATGCTCTT GT 1482(2)SEQ ID NO19的信息(i)序列特征(A)长度876个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO19GAATTCGGCA CGAGCCGGCG ATAGCTTCTG GGCCGCGGCC GACCAGATGG CTCGAGGGTT 60CGTGCTCGGG GCCACCGCCG GGCGCACCAC CCTGACCGGT GAGGGCCTGC AACACGCCGA 120CGGTCACTCG TTGCTGCTGG ACGCCACCAA CCCGGCGGTG GTTGCCTACG ACCCGGCCTT 180CGCCTACGAA ATCGGCTACA TCGNGGAAAG CGGACTGGCC AGGATGTGCG GGGAGAACCC 240GGAGAACATC TTCTTCTACA TCACCGTCTA CAACGAGCCG TACGTGCAGC CGCCGGAGCC 300GGAGAACTTC GATCCCGAGG GCGTGCTGGG GGGTATCTAC CGNTATCACG CGGCCACCGA 360GCAACGCACC AACAAGGNGC AGATCCTGGC CTCCGGGGTA GCGATGCCCG CGGCGCTGCG 420GGCAGCACAG ATGCTGGCCG CCGAGTGGGA TGTCGCCGCC GACGTGTGGT CGGTGACCAG 480TTGGGGCGAG CTAAACCGCG ACGGGGTGGT CATCGAGACC GAGAAGCTCC GCCACCCCGA 540TCGGCCGGCG GGCGTGCCCT ACGTGACGAG AGCGCTGGAG AATGCTCGGG GCCCGGTGAT 600CGCGGTGTCG GACTGGATGC GCGCGGTCCC CGAGCAGATC CGACCGTGGG TGCCGGGCAC 660ATACCTCACG TTGGGCACCG ACGGGTTCGG TTTTTCCGAC ACTCGGCCCG CCGGTCGTCG 720TTACTTCAAC ACCCACGCCG AATCCCAGGT TGGTCGCGGT TTTGGGAGGG GTTGGCCGGG 780TCGACGGGTG AATATCCACC CATTCGGTGC CGGTCGTGGG CCGCCCGCCC AGTTACCCGG 840ATTCGACGAA GGTGGGGGGT TGCGCCCGAN TAAGTT 876(2)SEQ ID NO20的信息(i)序列特征(A)长度1021个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO20ATCCCCCCGG GCTGCAGGAA TTCGGCACGA GAGACAAAAT TCCACGCGTT AATGCAGGAA 60CAGATTCATA ACGAATTCAC AGCGGCACAA CAATATGTCG CGATCGCGGT TTATTTCGAC 120AGCGAAGACC TGCCGCAGTT GGCGAAGCAT TTTTACAGCC AAGCGGTCGA GGAACGAAAC 180CATGCAATGA TGCTCGTGCA ACACCTGCTC GACCGCGACC TTCGTGTCGA AATTCCCGGC 240GTAGACACGG TGCGAAACCA GTTCGACAGA CCCCGCGAGG CACTGGCGCT GGCGCTCGAT 300CAGGAACGCA CAGTCACCGA CCAGGTCGGT CGGCTGACAG CGGTGGCCCG CGACGAGGGC 360GATTTCCTCG GCGAGCAGTT CATGCAGTGG TTCTTGCAGG AACAGATCGA AGAGGTGGCC 420TTGATGGCAA CCCTGGTGCG GGTTGCCGAT CGGGCCGGGG CCAACCTGTT CGAGCTAGAG 480AACTTCGTCG CACGTGAAGT GGATGTGGCG CCGGCCGCAT CAGGCGCCCC GCACGCTGCC 540GGGGGCCGCC TCTAGATCCC TGGGGGGGAT CAGCGAGTGG TCCCGTTCGC CCGCCCGTCT 600TCCAGCCAGG CCTTGGTGCG GCCGGGGTGG TGAGTACCAA TCCAGGCCAC CCCGACCTCC 660CGGNAAAAGT CGATGTCCTC GTACTCATCG ACGTTCCAGG AGTACACCGC CCGGCCCTGA 720GCTGCCGAGC GGTCAACGAG TTGCGGATAT TCCTTTAACG CAGGCAGTGA GGGTCCCACG 780GCGGTTGGCC CGACCGCCGT GGCCGCACTG CTGGTCAGGT ATCGGGGGGT CTTGGCGAGC 840AACAACGTCG GCAGGAGGGG TGGAGCCCGC CGGATCCGCA GACCGGGGGG GCGAAAACGA 900CATCAACACC GCACGGGATC GATCTGCGGA GGGGGGTGCG GGAATACCGA ACCGGTGTAG 960GAGCGCCAGC AGTTGTTTTT CCACCAGCGA AGCGTTTTCG GGTCATCGGN GGCNNTTAAG 1020T 1021(2)SEQ ID NO21的信息(i)序列特征(A)长度321个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO21CGTGCCGACG AACGGAAGAA CACAACCATG AAGATGGTGA AATCGATCGC CGCAGGTCTG 60ACCGCCGCGG CTGCAATCGG CGCCGCTGCG GCCGGTGTGA CTTCGATCAT GGCTGGCGGN 120CCGGTCGTAT ACCAGATGCA GCCGGTCGTC TTCGGCGCGC CACTGCCGTT GGACCCGGNA 180TCCGCCCCTG ANGTCCCGAC CGCCGCCCAG TGGACCAGNC TGCTCAACAC NCTCGNCGAT 240CCCAACGTGT CGTTTGNGAA CAAGGGNAGT CTGGTCGAGG GNGGNATCGG NGGNANCGAG 300GGNGNGNATC GNCGANCACA A321(2)SEQ ID NO22的信息(i)序列特征(A)长度373个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO22TCTTATCGGT TCCGGTTGGC GACGGGTTTT GGGNGCGGGT GGTTAACCCG CTCGGCCAGC 60CGATCGACGG GCGCGGAGAC GTCGACTCCG ATACTCGGCG CGCGCTGGAG CTCCAGGCGC 120CCTCGGTGGT GNACCGGCAA GGCGTGAAGG AGCCGTTGNA GACCGGGATC AAGGCGATTG 180ACGCGATGAC CCCGATCGGC CGCGGGCAGC GCCAGCTGAT CATCGGGGAC CGCAAGACCG 240GCAAAAACCG CCGTCTGTGT CGGACACCAT CCTCAAACCA GCGGGAAGAA CTGGGAGTCC 300GGTGGATCCC AAGAAGCAGG TGCGCTTGTG TATACGTTGG CCATCGGGCA AGAAGGGGAA 360CTTACCATCG CCG373(2)SEQ ID NO23的信息(i)序列特征(A)长度352个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO23GTGACGCCGT GATGGGATTC CTGGGCGGGG CCGGTCCGCT GGCGGTGGTG GATCAGCAAC 60TGGTTACCCG GGTGCCGCAA GGCTGGTCGT TTGCTCAGGC AGCCGCTGTG CCGGTGGTGT120TCTTGACGGC CTGGTACGGG TTGGCCGATT TAGCCGAGAT CAAGGCGGGC GAATCGGTGC180TGATCCATGC CGGTACCGGC GGTGTGGGCA TGGCGGCTGT GCAGCTGGCT CGCCAGTGGG240GCGTGGAGGT TTTCGTCACC GCCAGCCGTG GNAAGTGGGA CACGCTGCGC GCCATNGNGT300TTGACGACGA NCCATATCGG NGATTCCCNC ACATNCGAAG TTCCGANGGA GA352(2)SEQ ID NO24的信息(i)序列特征(A)长度726个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO24GAAATCCGCG TTCATTCCGT TCGACCAGCG GCTGGCGATA ATCGACGAAG TGATCAAGCC 60GCGGTTCGCG GCGCTCATGG GTCACAGCGA GTAATCAGCA AGTTCTCTGG TATATCGCAC 120CTAGCGTCCA GTTGCTTGCC AGATCGCTTT CGTACCGTCA TCGCATGTAC CGGTTCGCGT 180GCCGCACGCT CATGCTGGCG GCGTGCATCC TGGCCACGGG TGTGGCGGGT CTCGGGGTCG 240GCGCGCAGTC CGCAGCCCAA ACCGCGCCGG TGCCCGACTA CTACTGGTGC CCGGGGCAGC 300CTTTCGACCC CGCATGGGGG CCCAACTGGG ATCCCTACAC CTGCCATGAC GACTTCCACC 360GCGACAGCGA CGGCCCCGAC CACAGCCGCG ACTACCCCGG ACCCATCCTC GAAGGTCCCG 420TGCTTGACGA TCCCGGTGCT GCGCCGCCGC CCCCGGCTGC CGGTGGCGGC GCATAGCGCT 480CGTTGACCGG GCCGCATCAG CGAATACGCG TATAAACCCG GGCGTGCCCC CGGCAAGCTA 540CGACCCCCGG CGGGCCAGAT TTACGCTCCC GTGCCGATGG ATCGCGCCGT CCGATGACAG 600AAAATAGGCG ACGGTTTTGG CAACCGCTTG GAGGACGCTT GAAGGGAACC TGTGATGAAC 660GGCGACAGCG CCTCCACCAT CGACATCGAC AAGGTTGTTA CCCGCACACC CGTTCGCCGG 720ATCGTG726(2)SEQ ID NO25的信息(i)序列特征(A)长度580个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO25CGCGACGACG ACGAACGTCG GGCCCACCAC CGCCTATGCG TTGATGCAGG CGACCGGGAT 60GGTCGCCGAC CATATCCAAG CATGCTGGGT GCCCACTGAG CGACCTTTTG ACCAGCCGGG 120CTGCCCGATG GCGGCCCGGT GAAGTCATTG CGCCGGGGCT TGTGCACCTG ATGAACCCGA 180ATAGGGAACA ATAGGGGGGT GATTTGGCAG TTCAATGTCG GGTATGGCTG GAAATCCAAT 240GGCGGGGCAT GCTCGGCGCC GACCAGGCTC GCGCAGGCGG GCCAGCCCGA ATCTGGAGGG 300AGCACTCAAT GGCGGCGATG AAGCCCCGGA CCGGCGACGG TCCTTTGGAA GCAACTAAGG 360AGGGGCGCGG CATTGTGATG CGAGTACCAC TTGAGGGTGG CGGTCGCCTG GTCGTCGAGC 420TGACACCCGA CGAAGCCGCC GCACTGGGTG ACGAACTCAA AGGCGTTACT AGCTAAGACC 480AGCCCAACGG CGAATGGTCG GCGTTACGCG CACACCTTCC GGTAGATGTC CAGTGTCTGC 540TCGGCGATGT ATGCCCAGGA GAACTCTTGG ATACAGCGCT 580(2)SEQ ID NO26的信息(i)序列特征(A)长度160个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO26AACGGAGGCG CCGGGGGTTT TGGCGGGGCC GGGGCGGTCG GCGGCAACGG CGGGGCCGGC 60GGTACCGCCG GGTTGTTCGG TGTCGGCGGG GCCGGTGGGG CCGGAGGCAA CGGCATCGCC 120GGTGTCACGG GTACGTCGGC CAGCACACCG GGTGGATCCG160(2)SEQ ID NO27的信息(i)序列特征(A)长度272个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO27GACACCGATA CGATGGTGAT GTACGCCAAC GTTGTCGACA CGCTCGAGGC GTTCACGATC 60CAGCGCACAC CCGACGGCGT GACCATCGGC GATGCGGCCC CGTTCGCGGA GGCGGCTGCC 120AAGGCGATGG GAATCGACAA GCTGCGGGTA ATTCATACCG GAATGGACCC CGTCGTCGCT 180GAACGCGAAC AGTGGGACGA CGGCAACAAC ACGTTGGCGT TGGCGCCCGG TGTCGTTGTC 240GCCTACGAGC GCAACGTACA GACCAACGCC CG272(2)SEQ ID NO28的信息(i)序列特征(A)长度317个碱基对(B)类型核酸(C)链数单链
(D)拓扑学线性(xi)序列描述SEQ ID NO28GCAGCCGGTG GTTCTCGGAC TATCTGCGCA CGGTGACGCA GCGCGACGTG CGCGAGCTGA 60AGCGGATCGA GCAGACGGAT CGCCTGCCGC GGTTCATGCG CTACCTGGCC GCTATCACCG 120CGCAGGAGCT GAACGTGGCC GAAGCGGCGC GGGTCATCGG GGTCGACGCG GGGACGATCC 180GTTCGGATCT GGCGTGGTTC GAGACGGTCT ATCTGGTACA TCGCCTGCCC GCCTGGTCGC 240GGAATCTGAC CGCGAAGATC AAGAAGCGGT CAAAGATCCA CGTCGTCGAC AGTGGCTTCG 300CGGCCTGGTT GCGCGGG317(2)SEQ ID NO29的信息(i)序列特征(A)长度182个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO29GATCGTGGAG CTGTCGATGA ACAGCGTTGC CGGACGCGCG GCGGCCAGCA CGTCGGTGTA 60GCAGCGCCGG ACCACCTCGC CGGTGGGCAG CATGGTGATG ACCACGTCGG CCTCGGCCAC 120CGCTTCGGGC GCGCTACGAA ACACCGCGAC ACCGTGCGCG GCGGCGCCGG ACGCCGCCGT 180GG182(2)SEQ ID NO30的信息(i)序列特征(A)长度308个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO30GATCGCGAAG TTTGGTGAGC AGGTGGTCGA CGCGAAAGTC TGGGCGCCTG CGAAGCGGGT60CGGCGTTCAC GAGGCGAAGA CACGCCTGTC CGAGCTGCTG CGGCTCGTCT ACGGCGGGCA 120GAGGTTGAGA TTGCCCGCCG CGGCGAGCCG GTAGCAAAGC TTGTGCCGCT GCATCCTCAT 180GAGACTCGGC GGTTAGGCAT TGACCATGGC GTGTACCGCG TGCCCGACGA TTTGGACGCT 240CCGTTGTCAG ACGACGTGCT CGAACGCTTT CACCGGTGAA GCGCTACCTC ATCGACACCC 300ACGTTTGG308(2)SEQ ID NO31的信息(i)序列特征(A)长度267个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO31CCGACGACGA GCAACTCACG TGGATGATGG TCGGCAGCGG CATTGAGGAC GGAGAGAATC 60CGGCCGAAGC TGCCGCGCGG CAAGTGCTCA TAGTGACCGG CCGTAGAGGG CTCCCCCGAT 120GGCACCGGAC TATTCTGGTG TGCCGCTGGC CGGTAAGAGC GGGTAAAAGA ATGTGAGGGG 180ACACGATGAG CAATCACACC TACCGAGTGA TCGAGATCGT CGGGACCTCG CCCGACGGCG 240TCGACGCGGC AATCCAGGGC GGTCTGG 267(2)SEQ ID NO32的信息(i)序列特征(A)长度1539个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO32CTCGTGCCGA AAGAATGTGA GGGGACACGA TGAGCAATCA CACCTACCGA GTGATCGAGA 60TCGTCGGGAC CTCGCCCGAC GGCGTCGACG CGGCAATCCA GGGCGGTCTG GCCCGAGCTG 120CGCAGACCAT GCGCGCGCTG GACTGGTTCG AAGTACAGTC AATTCGAGGC CACCTGGTCG 180ACGGAGCGGT CGCGCACTTC CAGGTGACTA TGAAAGTCGG CTTCCGCTGG AGGATTCCTG 240AACCTTCAAG CGCGGCCGAT AACTGAGGTG CATCATTAAG CGACTTTTCC AGAACATCCT 300GACGCGCTCG AAACGCGGTT CAGCCGACGG TGGCTCCGCC GAGGCGCTGC CTCCAAAATC 360CCTGCGACAA TTCGTCGGCG GCGCCTACAA GGAAGTCGGT GCTGAATTCG TCGGGTATCT 420GGTCGACCTG TGTGGGCTGC AGCCGGACGA AGCGGTGCTC GACGTCGGCT GCGGCTCGGG 480GCGGATGGCG TTGCCGCTCA CCGGCTATCT GAACAGCGAG GGACGCTACG CCGGCTTCGA 540TATCTCGCAG AAAGCCATCG CGTGGTGCCA GGAGCACATC ACCTCGGCGC ACCCCAACTT 600CCAGTTCGAG GTCTCCGACA TCTACAACTC GCTGTACAAC CCGAAAGGGA AATACCAGTC 660ACTAGACTTT CGCTTTCCAT ATCCGGATGC GTCGTTCGAT GTGGTGTTTC TTACCTCGGT 720GTTCACCCAC ATGTTTCCGC CGGACGTGGA GCACTATCTG GACGAGATCT CCCGCGTGCT 780GAAGCCCGGC GGACGATGCC TGTGCACGTA CTTCTTGCTC AATGACGAGT CGTTAGCCCA 840CATCGCGGAA GGAAAGAGTG CGCACAACTT CCAGCATGAG GGACCGGGTT ATCGGACAAT 900CCACAAGAAG CGGCCCGAAG AAGCAATCGG CTTGCCGGAG ACCTTCGTCA GGGATGTCTA 960TGGCAAGTTC GGCCTCGCCG TGCACGAACC ATTGCACTAC GGCTCATGCA GTGGCCGGGA1020ACCACGCCTA AGCTTCCAGG ACATCGTCAT CGCGACCAAA ACCGCGAGCT AGGTCGGCAT1080CCGGGAAGCA TCGCGACACC GTGGCGCCGA GCGCCGCTGC CGGCAGGCCG ATTAGGCGGG1140CAGATTAGCC CGCCGCGGCT CCCGGCTCCG AGTACGGCGC CCCGAATGGC GTCACCGGCT1200GGTAACCACG CTTGCGCGCC TGGGCGGCGG CCTGCCGGAT CAGGTGGTAG ATGCCGACAA1260AGCCTGCGTG ATCGGTCATC ACCAACGGTG ACAGCAGCCG GTTGTGCACC AGCGCGAACG1320CCACCCCGGT CTCCGGGTCT GTCCAGCCGA TCGAGCCGCC CAAGCCCACA TGACCAAACC1380CCGGCATCAC GTTGCCGATC GGCATACCGT GATAGCCAAG ATGAAAATTT AAGGGCACCA1440ATAGATTTCG ATCCGGCAGA ACTTGCCGTC GGTTGCGGGT CAGGCCCGTG ACCAGCTCCC1500GCGACAAGAA CCGTATGCCG TCGATCTCGC CTCGTGCCG 1539(2)SEQ ID NO33的信息(i)序列特征(A)长度851个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO33CTGCAGGGTG GCGTGGATGA GCGTCACCGC GGGGCAGGCC GAGCTGACCG CCGCCCAGGT 60CCGGGTTGCT GCGGCGGCCT ACGAGACGGC GTATGGGCTG ACGGTGCCCC CGCCGGTGAT 120CGCCGAGAAC CGTGCTGAAC TGATGATTCT GATAGCGACC AACCTCTTGG GGCAAAACAC 180CCCGGCGATC GCGGTCAACG AGGCCGAATA CGGCGAGATG TGGGCCCAAG ACGCCGCCGC 240GATGTTTGGC TACGCCGCGG CGACGGCGAC GGCGACGGCG ACGTTGCTGC CGTTCGAGGA 300GGCGCCGGAG ATGACCAGCG CGGGTGGGCT CCTCGAGCAG GCCGCCGCGG TCGAGGAGGC 360CTCCCACACC GCCGCGGCGA ACCAGTTGAT GAACAATGTG CCCCAGGCGC TGAAACAGTT 420GGCCCAGCCC ACGCAGGGCA CCACGCCTTC TTCCAAGCTG GGTGGCCTGT GGAAGACGGT 480CTCGCCGCAT CGGTCGCCGA TCAGCAACAT GGTGTCGATG GCCAACAACC ACATGTCGAT 540GACCAACTCG GGTGTGTCGA TGACCAACAC CTTGAGCTCG ATGTTGAAGG GCTTTGCTCC 600GGCGGCGGCC GCCCAGGCCG TGCAAACCGC GGCGCAAAAC GGGGTCCGGG CGATGAGCTC 660GCTGGGCAGC TCGCTGGGTT CTTCGGGTCT GGGCGGTGGG GTGGCCGCCA ACTTGGGTCG 720GGCGGCCTCG GTACGGTATG GTCACCGGGA TGGCGGAAAA TATGCANAGT CTGGTCGGCG 780GAACGGTGGT CCGGCGTAAG GTTTACCCCC GTTTTCTGGA TGCGGTGAAC TTCGTCAACG 840GAAACAGTTA C 851(2)SEQ ID NO34的信息(i)序列特征(A)长度254个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO34GATCGATCGG GCGGAAATTT GGACCAGATT CGCCTCCGGC GATAACCCAA TCAATCGAAC 60CTAGATTTAT TCCGTCCAGG GGCCCGAGTA ATGGCTCGCA GGAGAGGAAC CTTACTGCTG 120CGGGCACCTG TCGTAGGTCC TCGATACGGC GGAAGGCGTC GACATTTTCC ACCGACACCC 180CCATCCAAAC GTTCGAGGGC CACTCCAGCT TGTGAGCGAG GCGACGCAGT CGCAGGCTGC 240GCTTGGTCAA GATC 254(2)SEQ ID NO35的信息(i)序列特征(A)长度1227个碱基对(B)类型核酸(C)链数单链
(D)拓扑学线性(xi)序列描述SEQ ID NO35GATCCTGACC GAAGCGGCCG CCGCCAAGGC GAAGTCGCTG TTGGACCAGG AGGGACGGGA60CGATCTGGCG CTGCGGATCG CGGTTCAGCC GGGGGGGTGC GCTGGATTGC GCTATAACCT 120TTTCTTCGAC GACCGGACGC TGGATGGTGA CCAAACCGCG GAGTTCGGTG GTGTCAGGTT 180GATCGTGGAC CGGATGAGCG CGCCGTATGT GGAAGGCGCG TCGATCGATT TCGTCGACAC 240TATTGAGAAG CAAGGTTCAC CATCGACAAT CCCAACGCCA CCGGCTCCTG CGCGTGCGGG 300GATTCGTTCA ACTGATAAAA CGCTAGTACG ACCCCGCGGT GCCCAACACG TACGAGCACA 360CCAAGACCTG ACCGCGCTGG AAAAGCAACT GAGCGATGCC TTGCACCTGA CCGCGTGGCG 420GGCCGCCGGC GGCAGGTGTC ACCTGCATGG TGAACAGCAC CTGGGCCTGA TATTGCGACC 480AGTACACGAT TTTGTCGATC GAGGTCACTT CGACCTGGGA GAACTGCTTG CGGAACGCGT 540CGCTGCTCAG CTTGGCCAAG GCCTGATCGG AGCGCTTGTC GCGCACGCCG TCGTGGATAC 600CGCACAGCGC ATTGCGAACG ATGGTGTCCA CATCGCGGTT CTCCAGCGCG TTGAGGTATC 660CCTGAATCGC GGTTTTGGCC GGTCCCTCCG AGAATGTGCC TGCCGTGTTG GCTCCGTTGG 720TGCGGACCCC GTATATGATC GCCGCCGTCA TAGCCGACAC CAGCGCGAGG GCTACCACAA 780TGCCGATCAG CAGCCGCTTG TGCCGTCGCT TCGGGTAGGA CACCTGCGGC GGCACGCCGG 840GATATGCGGC GGGCGGCAGC GCCGCGTCGT CTGCCGGTCC CGGGGCGAAG GCCGGTTCGG 900CGGCGCCGAG GTCGTGGGGG TAGTCCAGGG CTTGGGGTTC GTGGGATGAG GGCTCGGGGT 960ACGGCGCCGG TCCGTTGGTG CCGACACCGG GGTTCGGCGA GTGGGGACCG GGCATTGTGG 1020TTCTCCTAGG GTGGTGGACG GGACCAGCTG CTAGGGCGAC AACCGCCCGT CGCGTCAGCC 1080GGCAGCATCG GCAATCAGGT GAGCTCCCTA GGCAGGCTAG CGCAACAGCT GCCGTCAGCT 1140CTCAACGCGA CGGGGCGGGC CGCGGCGCCG ATAATGTTGA AAGACTAGGC AACCTTAGGA 1200ACGAAGGACG GAGATTTTGT GACGATC 1227(2)SEQ ID NO36的信息(i)序列特征(A)长度181个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO36GCGGTGTCGG CGGATCCGGC GGGTGGTTGA ACGGCAACGG CGGGGCCGGC GGGGCCGGCG 60GGACCGGCGC TAACGGTGGT GCCGGCGGCA ACGCCTGGTT GTTCGGGGCC GGCGGGTCCG120GCGGNGCCGG CACCAATGGT GGNGTCGGCG GGTCCGGCGG ATTTGTCTAC GGCAACGGCG180G181(2)SEQ ID NO37的信息(i)序列特征(A)长度290个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO37GCGGTGTCGG CGGATCCGGC GGGTGGTTGA ACGGCAACGG CGGTGTCGGC GGCCGGGGCG 60GCGACGGCGT CTTTGCCGGT GCCGGCGGCC AGGGCGGCCT CGGTGGGCAG GGCGGCAATG120GCGGCGGCTC CACCGGCGGC AACGGCGGTC TTGGCGGCGC GGGCGGTGGC GGAGGCAACG180CCCCGGAGGG CGGCTTCGGT GGCAACGGCG GTAAGGGTGG CCAGGGCGGN ATTGGCGGCG240GCACTCAGAG CGCGACCGGC CTCGGNGGTG ACGGCGGTGA CGGCGGTGAC 290(2)SEQ ID NO38的信息(i)序列特征(A)长度34个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO38GATCCAGTGG CATGGNGGGT GTCAGTGGAA GCAT 34(2)SEQ ID NO39的信息
(i)序列特征(A)长度155个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO39GATCGCTGCT CGTCCCCCCC TTGCCGCCGA CGCCACCGGT CCCACCGTTA CCGAACAAGC60TGGCGTGGTC GCCAGCACCC CCGGCACCGC CGACGCCGGA GTCGAACAAT GGCACCGTCG 120TATCCCCACC ATTGCCGCCG GNCCCACCGG CACCG 155(2)SEQ ID NO40的信息(i)序列特征(A)长度53个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO40ATGGCGTTCA CGGGGCGCCG GGGACCGGGC AGCCCGGNGG GGCCGGGGGG TGG 53(2)SEQ ID NO41的信息(i)序列特征(A)长度132个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO41GATCCACCGC GGGTGCAGAC GGTGCCCGCG GCGCCACCCC GACCAGCGGC GGCAACGGCG60GCACCGGCGG CAACGGCGCG AACGCCACCG TCGTCGGNGG GGCCGGCGGG GCCGGCGGCA 120AGGGCGGCAA CG 132(2)SEQ ID NO42的信息(i)序列特征(A)长度132个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO42GATCGGCGGC CGGNACGGNC GGGGACGGCG GCAAGGGCGG NAACGGGGGC GCCGNAGCCA60CCNGCCAAGA ATCCTCCGNG TCCNCCAATG GCGCGAATGG CGGACAGGGC GGCAACGGCG 120GCANCGGCGG CA 132(2)SEQ ID NO43的信息(i)序列特征(A)长度702个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO43CGGCACGAGG ATCGGTACCC CGCGGCATCG GCAGCTGCCG ATTCGCCGGG TTTCCCCACC60CGAGGAAAGC CGCTACCAGA TGGCGCTGCC GAAGTAGGGC GATCCGTTCG CGATGCCGGC 120ATGAACGGGC GGCATCAAAT TAGTGCAGGA ACCTTTCAGT TTAGCGACGA TAATGGCTAT 180AGCACTAAGG AGGATGATCC GATATGACGC AGTCGCAGAC CGTGACGGTG GATCAGCAAG 240AGATTTTGAA CAGGGCCAAC GAGGTGGAGG CCCCGATGGC GGACCCACCG ACTGATGTCC 300CCATCACACC GTGCGAACTC ACGGNGGNTA AAAACGCCGC CCAACAGNTG GTNTTGTCCG 360CCGACAACAT GCGGGAATAC CTGGCGGCCG GTGCCAAAGA GCGGCAGCGT CTGGCGACCT 420CGCTGCGCAA CGCGGCCAAG GNGTATGGCG AGGTTGATGA GGAGGCTGCG ACCGCGCTGG 480ACAACGACGG CGAAGGAACT GTGCAGGCAG AATCGGCCGG GGCCGTCGGA GGGGACAGTT 540CGGCCGAACT AACCGATACG CCGAGGGTGG CCACGGCCGG TGAACCCAAC TTCATGGATC 600TCAAAGAAGC GGCAAGGAAG CTCGAAACGG GCGACCAAGG CGCATCGCTC GCGCACTGNG 660GGGATGGGTG GAACACTTNC ACCCTGACGC TGCAAGGCGA CG 702(2)SEQ ID NO44的信息(i)序列特征(A)长度298个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO44GAAGCCGCAG CGCTGTCGGG CGACGTGGCG CTCAAAGCGG CATCGCTCGG TGGCGGTGGA 60GGCGGCGGGG TGCCGTCGGC GCCGTTGGGA TCCGCGATCG GGGGCGCCGA ATCGGTGCGG120CCCGCTGGCG CTGGTGACAT TGCCGGCTTA GGCCAGGGAA GGGCCGGCGG CGGCGCCGCG180CTGGGCGGCG GTGGCATGGG AATGCCGATG GGTGCCGCGC ATCAGGGACA AGGGGGCGCC240AAGTCCAAGG GTTCTCAGCA GGAAGACGAG GCGCTCTACA CCGAGGATCC TCGTGCCG 298(2)SEQ ID NO45的信息(i)序列特征(A)长度1058个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO45CGGCACGAGG ATCGAATCGC GTCGCCGGGA GCACAGCGTC GCACTGCACC AGTGGAGGAG 60CCATGACCTA CTCGCCGGGT AACCCCGGAT ACCCGCAAGC GCAGCCCGCA GGCTCCTACG120GAGGCGTCAC ACCCTCGTTC GCCCACGCCG ATGAGGGTGC GAGCAAGCTA CCGATGTACC180TGAACATCGC GGTGGCAGTG CTCGGTCTGG CTGCGTACTT CGCCAGCTTC GGCCCAATGT240TCACCCTCAG TACCGAACTC GGGGGGGGTG ATGGCGCAGT GTCCGGTGAC ACTGGGCTGC300CGGTCGGGGT GGCTCTGCTG GCTGCGCTGC TTGCCGGGGT GGTTCTGGTG CCTAAGGCCA360AGAGCCATGT GACGGTAGTT GCGGTGCTCG GGGTACTCGG CGTATTTCTG ATGGTCTCGG420CGACGTTTAA CAAGCCCAGC GCCTATTCGA CCGGTTGGGC ATTGTGGGTT GTGTTGGCTT480TCATCGTGTT CCAGGCGGTT GCGGCAGTCC TGGCGCTCTT GGTGGAGACC GGCGCTATCA540CCGCGCCGGC GCCGCGGCCC AAGTTCGACC CGTATGGACA GTACGGGCGG TACGGGCAGT600ACGGGCAGTA CGGGGTGCAG CCGGGTGGGT ACTACGGTCA GCAGGGTGCT CAGCAGGCCG660CGGGACTGCA GTCGCCCGGC CCGCAGCAGT CTCCGCAGCC TCCCGGATAT GGGTCGCAGT720ACGGCGGCTA TTCGTCCAGT CCGAGCCAAT CGGGCAGTGG ATACACTGCT CAGCCCCCGG780CCCAGCCGCC GGCGCAGTCC GGGTCGCAAC AATCGCACCA GGGCCCATCC ACGCCACCTA840CCGGCTTTCC GAGCTTCAGC CCACCACCAC CGGTCAGTGC CGGGACGGGG TCGCAGGCTG900GTTCGGCTCC AGTCAACTAT TCAAACCCCA GCGGGGGCGA GCAGTCGTCG TCCCCCGGGG960GGGCGCCGGT CTAACCGGGC GTTCCCGCGT CCGGTCGCGC GTGTGCGCGA AGAGTGAACA 1020GGGTGTCAGC AAGCGCGGAC GATCCTCGTG CCGAATTC 1058(2)SEQ ID NO46的信息(i)序列特征(A)长度327个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO46CGGCACGAGA GACCGATGCC GCTACCCTCG CGCAGGAGGC AGGTAATTTC GAGCGGATCT 60CCGGCGACCT GAAAACCCAG ATCGACCAGG TGGAGTCGAC GGCAGGTTCG TTGCAGGGCC120AGTGGCGCGG CGCGGCGGGG ACGGCGGCCC AGGCCGCGGT GGTGCGCTTC CAAGAAGCAG180CCAATAAGCA GAAGCAGGAA CTCGACGAGA TCTCGACGAA TATTCGTCAG GCCGGCGTCC240AATACTCGAG GGCCGACGAG GAGCAGCAGC AGGCGCTGTC CTCGCAAATG GGCTTCTGAC300CCGCTAATAC GAAAAGAAAC GGAGCAA327(2)SEQ ID NO47的信息(i)序列特征(A)长度170个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO47CGGTCGCGAT GATGGCGTTG TCGAACGTGA CCGATTCTGT ACCGCCGTCG TTGAGATCAA 60CCAACAACGT GTTGGCGTCG GCAAATGTGC CGNACCCGTG GATCTCGGTG ATCTTGTTCT120TCTTCATCAG GAAGTGCACA CCGGCCACCC TGCCCTCGGN TACCTTTCGG 170(2)SEQ ID NO48的信息(i)序列特征(A)长度127个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO48GATCCGGCGG CACGGGGGGT GCCGGCGGCA GCACCGCTGG CGCTGGCGGC AACGGCGGGG 60CCGGGGGTGG CGGCGGAACC GGTGGGTTGC TCTTCGGCAA CGGCGGTGCC GGCGGGCACG120GGGCCGT 127(2)SEQ ID NO49的信息(i)序列特征(A)长度81个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO49CGGCGGCAAG GGCGGCACCG CCGGCAACGG GAGCGGCGCG GCCGGCGGCA ACGGCGGCAA 60CGGCGGCTCC GGCCTCAACG G 81(2)SEQ ID NO50的信息(i)序列特征(A)长度149个碱基对(B)类型核酸(C)链数单链
(D)拓扑学线性(xi)序列描述SEQ ID NO50GATCAGGGCT GGCCGGCTCC GGCCAGAAGG GCGGTAACGG AGGAGCTGCC GGATTGTTTG 60GCAACGGCGG GGCCGGNGGT GCCGGCGCGT CCAACCAAGC CGGTAACGGC GGNGCCGGCG120GAAACGGTGG TGCCGGTGGG CTGATCTGG 149(2)SEQ ID NO51的信息(i)序列特征(A)长度355个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO51CGGCACGAGA TCACACCTAC CGAGTGATCG AGATCGTCGG GACCTCGCCC GACGGTGTCG 60ACGCGGNAAT CCAGGGCGGT CTGCCCCGAG CTGCGCAGAC CATGCGCGCG CTGGACTGGT120TCGAAGTACA GTCAATTCGA GGCCACCTGG TCGACGGAGC GGTCGCGCAC TTCCAGGTGA180CTATGAAAGT CGGCTTCCGC CTGGAGGATT CCTGAACCTT CAAGCGCGGC CGATAACTGA240GGTGCATCAT TAAGCGACTT TTCCAGAACA TCCTGACGCG CTCGAAACGC GGTTCAGCCG300ACGGTGGCTC CGCCGAGGCG CTGCCTCCAA AATCCCTGCG ACAATTCGTC GGCGG 355(2)SEQ ID NO52的信息(i)序列特征(A)长度999个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO52ATGCATCACC ATCACCATCA CATGCATCAG GTGGACCCCA ACTTGACACG TCGCAAGGGA 60CGATTGGCGG CACTGGCTAT CGCGGCGATG GCCAGCGCCA GCCTGGTGAC CGTTGCGGTG120CCCGCGACCG CCAACGCCGA TCCGGAGCCA GCGCCCCCGG TACCCACAAC GGCCGCCTCG 180CCGCCGTCGA CCGCTGCAGC GCCACCCGCA CCGGCGACAC CTGTTGCCCC CCCACCACCG 240GCCGCCGCCA ACACGCCGAA TGCCCAGCCG GGCGATCCCA ACGCAGCACC TCCGCCGGCC 300GACCCGAACG CACCGCCGCC ACCTGTCATT GCCCCAAACG CACCCCAACC TGTCCGGATC 360GACAACCCGG TTGGAGGATT CAGCTTCGCG CTGCCTGCTG GCTGGGTGGA GTCTGACGCC 420GCCCACTTCG ACTACGGTTC AGCACTCCTC AGCAAAACCA CCGGGGACCC GCCATTTCCC 480GGACAGCCGC CGCCGGTGGC CAATGACACC CGTATCGTGC TCGGCCGGCT AGACCAAAAG 540CTTTACGCCA GCGCCGAAGC CACCGACTCC AAGGCCGCGG CCCGGTTGGG CTCGGACATG 600GGTGAGTTCT ATATGCCCTA CCCGGGCACC CGGATCAACC AGGAAACCGT CTCGCTCGAC 660GCCAACGGGG TGTCTGGAAG CGCGTCGTAT TACGAAGTCA AGTTCAGCGA TCCGAGTAAG 720CCGAACGGCC AGATCTGGAC GGGCGTAATC GGCTCGCCCG CGGCGAACGC ACCGGACGCC 780GGGCCCCCTC AGCGCTGGTT TGTGGTATGG CTCGGGACCG CCAACAACCC GGTGGACAAG 840GGCGCGGCCA ACGCGCTGGC CGAATCGATC CGGCCTTTGG TCGCCCCGCC GCCGGCGCCG 900GCACCGGCTC CTGCAGAGCC CGCTCCGGCG CCGGCGCCGG CCGGGGAAGT CGCTCCTACC 960CCGACGACAC CGACACCGCA GCGGACCTTA CCGGCCTGA999(2)SEQ ID NO53的信息(i)序列特征(A)长度332个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO53Met His His His His His His Met His Gln Val Asp Pro Asn Leu Thr1 510 15Arg Arg Lys Gly Arg Leu Ala Ala Leu Ala Ile Ala Ala Met Ala Ser20 25 30Ala Ser Leu Val Thr Val Ala Val Pro Ala Thr Ala Asn Ala Asp Pro35 40 45Glu Pro Ala Pro Pro Val Pro Thr Thr Ala Ala Ser Pro Pro Ser Thr50 55 60Ala Ala Ala Pro Pro Ala Pro Ala Thr Pro Val Ala Pro Pro Pro Pro65 70 75 80Ala Ala Ala Asn Thr Pro Asn Ala Gln Pro Gly Asp Pro Asn Ala Ala85 90 95Pro Pro Pro Ala Asp Pro Asn Ala Pro Pro Pro Pro Val Ile Ala Pro100 105 110Asn Ala Pro Gln Pro Val Arg Ile Asp Asn Pro Val Gly Gly Phe Ser115 120 125Phe Ala Leu Pro Ala Gly Trp Val Glu Ser Asp Ala Ala His Phe Asp130 135 140Tyr Gly Ser Ala Leu Leu Ser Lys Thr Thr Gly Asp Pro Pro Phe Pro145 150 155 160Gly Gln Pro Pro Pro Val Ala Asn Asp Thr Arg Ile Vel Leu Gly Arg165 170 175Leu Asp Gln Lys Leu Tyr Ala Ser Ala Glu Ala Thr Asp Ser Lys Ala180 185 190Ala Ala Arg Leu Gly Ser Asp Met Gly Glu Phe Tyr Met Pro Tyr Pro195 200 205Gly Thr Arg Ile Asn Gln Glu Thr Val Ser Leu Asp Ala Asn Gly Val210 215 220Ser Gly Ser Ala Ser Tyr Tyr Glu Val Lys Phe Ser Asp Pro Ser Lys225 230 235 240Pro Asn Gly Gln Ile Trp Thr Gly Val Ile Gly Ser Pro Ala Ala Asn245 250 255Ala Pro Asp Ala Gly Pro Pro Gln Arg Trp Phe Val Val Trp Leu Gly260 265 270Thr Ala Asn Asn Pro Val Asp Lys Gly Ala Ala Lys Ala Leu Ala Glu275 280 285Ser Ile Arg Pro Leu Val Ala Pro Pro Pro Ala Pro Ala Pro Ala Pro290 295 300Ala Glu Pro Ala Pro Ala Pro Ala Pro Ala Gly Glu Val Ala Pro Thr305 310 315 320Pro Thr Thr Pro Thr Pro Gln Arg Thr Leu Pro Ala325 330(2)SEQ ID NO54的信息(i)序列特征(A)长度20个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO54Asp Pro Val Asp Ala Val Ile Asn Thr Thr Xaa Asn Tyr Gly Gln Val1 5 10 15Val Ala Ala Leu20(2)SEQ ID NO55的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO55Ala Val Glu Ser Gly Met Leu Ala Leu Gly Thr Pro Ala Pro Ser1 5 10 15(2)SEQ ID NO56的信息(i)序列特征(A)长度19个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO56Ala Ala Met Lys Pro Arg Thr Gly Asp Gly Pro Leu Glu Ala Ala Lys1 5 10 15Glu Gly Arg(2)SEQ ID NO57的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO57Tyr Tyr Trp Cys Pro Gly Gln Pro Phe Asp Pro Ala Trp Gly Pro1 5 10 15(2)SEQ ID NO58的信息(i)序列特征(A)长度14个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO58Asp Ile Gly Ser Glu Ser Thr Glu Asp Gln Gln Xaa Ala Val1 5 10(2)SEQ ID NO59的信息(i)序列特征(A)长度13个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO59Ala Glu Glu Ser Ile Ser Thr Xaa Glu Xaa Ile Val Pro1 5 10(2)SEQ ID NO60的信息(i)序列特征(A)长度17个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO60Asp Pro Glu Pro Ala Pro Pro Val Pro Thr Ala Ala Ala Ala Pro Pro1 5 10 15Ala(2)SEQ ID NO61的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO61Ala Pro Lys Thr Tyr Xaa Glu Glu Leu Lys Gly Thr Asp Thr Gly1 5 10 15(2)SEQ ID NO62的信息(i)序列特征(A)长度30个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO62Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln Gln Thr Ser1 5 10 15Leu Leu Asn Asn Leu Ala Asp Pro Asp Val Ser Phe Ala Asp20 25 30(2)SEQ ID NO63的信息(i)序列特征(A)长度187个氨基酸(B)类型氨基酸
(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO63Thr Gly Ser Leu Asn Gln Thr His Asn Arg Arg Ala Asn Glu Arg Lys1 5 10 15Asn Thr Thr Met Lys Met Val Lys Ser Ile Ala Ala Gly Leu Thr Ala20 25 30Ala Ala Ala Ile Gly Ala Ala Ala Ala Gly Val Thr Ser Ile Met Ala35 40 45Gly Gly Pro Val Val Tyr Gln Met Gln Pro Val Val Phe Gly Ala Pro50 55 60Leu Pro Leu Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln65 70 75 80Leu Thr Ser Leu Leu Asn Ser Leu Ala Asp Pro Asn Val Ser Phe Ala85 90 95Asn Lys Gly Ser Leu Val Glu Gly Gly Ile Gly Gly Thr Glu Ala Arg100 105 110Ile Ala Asp His Lys Leu Lys Lys Ala Ala Glu His Gly Asp Leu Pro115 120 125Leu Ser Phe Ser Val Thr Asn Ile Gln Pro Ala Ala Ala Gly Ser Ala130 135 140Thr Ala Asp Val Ser Val Ser Gly Pro Lys Leu Ser Ser Pro Val Thr145 150 155 160Gln Asn Val Thr Phe Val Asn Gln Gly Gly Trp Met Leu Ser Arg Ala165 170 175Ser Ala Met Glu Leu Leu Gln Ala Ala Gly Xaa180 185(2)SEQ ID NO64的信息(i)序列特征(A)长度148个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO64Asp Glu Val Thr Val Glu Thr Thr Ser Val Phe Arg Ala Asp Phe Leu1 5 10 15Ser Glu Leu Asp Ala Pro Ala Gln Ala Gly Thr Glu Ser Ala Val Ser20 25 30Gly Val Glu Gly Leu Pro Pro Gly Ser Ala Leu Leu Val Val Lys Arg35 40 45Gly Pro Asn Ala Gly Ser Arg Phe Leu Leu Asp Gln Ala Ile Thr Ser50 55 60Ala Gly Arg His Pro Asp Ser Asp Ile Phe Leu Asp Asp Val Thr Val65 70 75 80Ser Arg Arg His Ala Glu Phe Arg Leu Glu Asn Asn Glu Phe Asn Val85 90 95Val Asp Val Gly Ser Leu Asn Gly Thr Tyr Val Asn Arg Glu Pro Val100 105 110Asp Ser Ala Val Leu Ala Asn Gly Asp Glu Val Gln Ile Gly Lys Leu115 120 125Arg Leu Val Phe Leu Thr Gly Pro Lys Gln Gly Glu Asp Asp Gly Ser130 135 140Thr Gly Gly Pro145(2)SEQ ID NO65的信息(i)序列特征(A)长度230个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO65Thr Ser Asn Arg Pro Ala Arg Arg Gly Arg Arg Ala Pro Arg Asp Thr1 5 10 15Gly Pro Asp Arg Ser Ala Ser Leu Ser Leu Val Arg His Arg Arg Gln20 25 30Gln Arg Asp Ala Leu Cys Leu Ser Ser Thr Gln Ile Ser Arg Gln Ser35 40 45Asn Leu Pro Pro Ala Ala Gly Gly Ala Ala Asn Tyr Ser Arg Arg Asn50 55 60Phe Asp Val Arg Ile Lys Ile Phe Met Leu Val Thr Ala Val Val Leu65 70 75 80Leu Cys Cys Ser Gly Val Ala Thr Ala Ala Pro Lys Thr Tyr Cys Glu85 90 95Glu Leu Lys Gly Thr Asp Thr Gly Gln Ala Cys Gln Ile Gln Met Ser100 105 110Asp Pro Ala Tyr Asn Ile Asn Ile Ser Leu Pro Ser Tyr Tyr Pro Asp115 120 125Gln Lys Ser Leu Glu Asn Tyr Ile Ala Gln Thr Arg Asp Lys Phe Leu130 135 140Ser Ala Ala Thr Ser Ser Thr Pro Arg Glu Ala Pro Tyr Glu Leu Asn145 150 155 160Ile Thr Ser Ala Thr Tyr Gln Ser Ala Ile Pro Pro Arg Gly Thr Gln165 170 175Ala Val Val Leu Xaa Val Tyr His Asn Ala Gly Gly Thr His Pro Thr180 185 190Thr Thr Tyr Lys Ala Phe Asp Trp Asp Gln Ala Tyr Arg Lys Pro Ile195 200 205Thr Tyr Asp Thr Leu Trp Gln Ala Asp Thr Asp Pro Leu Pro Val Val210 215 220Phe Pro Ile Val Ala Arg225 230(2)SEQ ID NO66的信息(i)序列特征(A)长度132个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO66Thr Ala Ala Ser Asp Asn Phe Gln Leu Ser Gln Gly Gly Gln Gly Phe1 5 10 15Ala Ile Pro Ile Gly Gln Ala Met Ala Ile Ala Gly Gln Ile Arg Ser20 25 30Gly Gly Gly Ser Pro Thr Val His Ile Gly Pro Thr Ala Phe Leu Gly35 40 45Leu Gly Val Val Asp Asn Asn Gly Asn Gly Ala Arg Val Gln Arg Val50 55 60Val Gly Ser Ala Pro Ala Ala Ser Leu Gly Ile Ser Thr Gly Asp Val65 70 75 80Ile Thr Ala Val Asp Gly Ala Pro Ile Asn Ser Ala Thr Ala Met Ala85 90 95Asp Ala Leu Asn Gly His His Pro Gly Asp Val Ile Ser Val Asn Trp100 105 110Gln Thr Lys Ser Gly Gly Thr Arg Thr Gly Asn Val Thr Leu Ala Glu115 120 125Gly Pro Pro Ala130(2)SEQ ID NO67的信息(i)序列特征(A)长度100个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO67Val Pro Leu Arg Ser Pro Ser Met Ser Pro Ser Lys Cys Leu Ala Ala1 5 10 15Ale Gln Arg Asn Pro Val Ile Arg Arg Arg Arg Leu Ser Asn Pro Pro20 25 30Pro Arg Lys Tyr Arg Ser Met Pro Ser Pro Ala Thr Ala Ser Ala Gly35 40 45Met Ala Arg Val Arg Arg Arg Ala Ile Trp Arg Gly Pro Ala Thr Xaa50 55 60Ser Ala Gly Met Ala Arg Val Arg Arg Trp Xaa Val Met Pro Xaa Val65 70 75 80Ile Gln Ser Thr Xaa Ile Arg Xaa Xaa Gly Pro Phe Asp Asn Arg Gly85 90 95Ser Glu Arg Lys100(2)SEQ ID NO68的信息(i)序列特征(A)长度163个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO68Met Thr Asp Asp Ile Leu Leu Ile Asp Thr Asp Glu Arg Val Arg Thr1 5 10 15Leu Thr Leu Asn Arg Pro Gln Ser Arg Asn Ala Leu Ser Ala Ala Leu20 25 30Arg Asp Arg Phe Phe Ala Xaa Leu Xaa Asp Ala Glu Xaa Asp Asp Asp35 40 45Ile Asp Val Val Ile Leu Thr Gly Ala Asp Pro Val Phe Cys Ala Gly50 55 60Leu Asp Leu Lys Val Ala Gly Arg Ala Asp Arg Ala Ala Gly His Leu65 70 75 80Thr Ala Val Gly Gly His Asp Gln Ala Gly Asp Arg Arg Asp Gln Arg85 90 95Arg Arg Gly His Arg Arg Ala Arg Thr Gly Ala Val Leu Arg His Pro100 105 110Asp Arg Leu Arg Ala Arg Pro Leu Arg Arg His Pro Arg Pro Gly Gly115 120 125Ala Ala Ala His Leu Gly Thr Gln Cys Val Leu Ala Ala Lys Gly Arg130 135 140His Arg Xaa Gly Pro Val Asp Glu Pro Asp Arg Arg Leu Pro Val Arg145 150 155 160Asp Arg Arg(2)SEQ ID NO69的信息(i)序列特征(A)长度344个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO69Met Lys Phe Val Asn His Ile Glu Pro Val Ala Pro Arg Arg Ala Gly1 5 10 15Gly Ala Val Ala Glu Val Tyr Ala Glu Ala Arg Arg Glu Phe Gly Arg20 25 30Leu Pro Glu Pro Leu Ala Met Leu Ser Pro Asp Glu Gly Leu Leu Thr35 40 45Ala Gly Trp Ala Thr Leu Arg Glu Thr Leu Leu Val Gly Gln Val Pro50 55 60Arg Gly Arg Lys Glu Ala Val Ala Ala Ala Val Ala Ala Ser Leu Arg65 70 75 80Cys Pro Trp Cys Va1 Asp Ala His Thr Thr Met Leu Tyr Ala Ala Gly85 90 95Gln Thr Asp Thr Ala Ala Ala Ile Leu Ala Gly Thr Ala Pro Ala Ala100 105 110Gly Asp Pro Asn Ala Pro Tyr Val Ala Trp Ala Ala Gly Thr Gly Thr115 120 125Pro Ala Gly Pro Pro Ala Pro Phe Gly Pro Asp Val Ala Ala Glu Tyr130 135 140Leu Gly Thr Ala Val Gln Phe His Phe Ile Ala Arg Leu Val Leu Val145 150 155 160Leu Leu Asp Glu Thr Phe Leu Pro Gly Gly Pro Arg Ala Gln Gln Leu165 170 175Met Arg Arg Ala Gly Gly Leu Val Phe Ala Arg Lys Val Arg Ala Glu180 185 190His Arg Pro Gly Arg Ser Thr Arg Arg Leu Glu Pro Arg Thr Leu Pro195 200 205Asp Asp Leu Ala Trp Ala Thr Pro Ser Glu Pro Ile Ala Thr Ala Phe210 215 220Ala Ala Leu Ser His His Leu Asp Thr Ala Pro His Leu Pro Pro Pro225 230 235 240Thr Arg Gln Val Val Arg Arg Val Val Gly Ser Trp His Gly Glu Pro245 250 255Met Pro Met Ser Ser Arg Trp Thr Asn Glu His Thr Ala Glu Leu Pro260 265 270Ala Asp Leu His Ala Pro Thr Arg Leu Ala Leu Leu Thr Gly Leu Ala275 280 285Pro His Gln Val Thr Asp Asp Asp Val Ala Ala Ala Arg Ser Leu Leu290 295 300Asp Thr Asp Ala Ala Leu Val Gly Ala Leu Ala Trp Ala Ala Phe Thr305 310 315 320Ala Ala Arg Arg Ile Gly Thr Trp Ile Gly Ala Ala Ala Glu Gly Gln325 330 335Val Ser Arg Gln Asn Pro Thr Gly340(2)SEQ ID NO70的信息(i)序列特征(A)长度485个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO70Asp Asp Pro Asp Met Pro Gly Thr Val Ala Lys Ala Val Ala Asp Ala1 5 10 15Leu Gly Arg Gly Ile Ala Pro Val Glu Asp Ile Gln Asp Cys Val Glu20 25 30Ala Arg Leu Gly Glu Ala Gly Leu Asp Asp Val Ala Arg Val Tyr Ile35 40 45Ile Tyr Arg Gln Arg Arg Ala Glu Leu Arg Thr Ala Lys Ala Leu Leu50 55 60Gly Val Arg Asp Glu Leu Lys Leu Ser Leu Ala Ala Val Thr Val Leu65 70 75 80Arg Glu Arg Tyr Leu Leu His Asp Glu Gln Gly Arg Pro Ala Glu Ser85 90 95Thr Gly Glu Leu Met Asp Arg Ser Ala Arg Cys Val Ala Ala Ala Glu100 105 110Asp Gln Tyr Glu Pro Gly Ser Ser Arg Arg Trp Ala Glu Arg Phe Ala115 120 125Thr Leu Leu Arg Asn Leu Glu Phe Leu Pro Asn Ser Pro Thr Leu Met130 135 140Asn Ser Gly Thr Asp Leu Gly Leu Leu Ala Gly Cys Phe Val Leu Pro145 150 155 160Ile Glu Asp Ser Leu Gln Ser Ile Phe Ala Thr Leu Gly Gln Ala Ala165 170 175Glu Leu Gln Arg Ala Gly Gly Gly Thr Gly Tyr Ala Phe Ser His Leu180 185 190Arg Pro Ala Gly Asp Arg Val Ala Ser Thr Gly Gly Thr Ala Ser Gly195 200 205Pro Val Ser Phe Leu Arg Leu Tyr Asp Ser Ala Ala Gly Val Val Ser210 215 220Met Gly Gly Arg Arg Arg Gly Ala Cys Met Ala Val Leu Asp Val Ser225 230 235 240His Pro Asp Ile Cys Asp Phe Val Thr Ala Lys Ala Glu Ser Pro Ser245 250 255Glu Leu Pro His Phe Asn Leu Ser Val Gly Val Thr Asp Ala Phe Leu260 265 270Arg Ala Val Glu Arg Asn Gly Leu His Arg Leu Val Asn Pro Arg Thr275 280 285Gly Lys Ile Val Ala Arg Met Pro Ala Ala Glu Leu Phe Asp Ala Ile290 295 300Cys Lys Ala Ala His Ala Gly Gly Asp Pro Gly Leu Val Phe Leu Asp305 310 315 320Thr Ile Asn Arg Ala Asn Pro Val Pro Gly Arg Gly Arg Ile Glu Ala325 330 335Thr Asn Pro Cys Gly Glu Val Pro Leu Leu Pro Tyr Glu Ser Cys Asn340 345 350Leu Gly Ser Ile Asn Leu Ala Arg Met Leu Ala Asp Gly Arg Val Asp355 360 365Trp Asp Arg Leu Glu Glu Val Ala Gly Val Ala Val Arg Phe Leu Asp370 375 380Asp Val Ile Asp Val Ser Arg Tyr Pro Phe Pro Glu Leu Gly Glu Ala385 390 395 400Ala Arg Ala Thr Arg Lys Ile Gly Leu Gly Val Met Gly Leu Ala Glu405 410 415Leu Leu Ala Ala Leu Gly Ile Pro Tyr Asp Ser Glu Glu Ala Val Arg420 425 430Leu Ala Thr Arg Leu Met Arg Arg Ile Gln Gln Ala Ala His Thr Ala435 440 445Ser Arg Arg Leu Ala Glu Glu Arg Gly Ala Phe Pro Ala Phe Thr Asp450 455 460Ser Arg Phe Ala Arg Ser Gly Pro Arg Arg Asn Ala Gln Val Thr Ser465 470 475 480Val Ala Pro Thr Gly485(2)SEQ ID NO71的信息(i)序列特征(A)长度267个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO71Gly Val Ile Val Leu Asp Leu Glu Pro Arg Gly Pro Leu Pro Thr Glu1 5 10 15Ile Tyr Trp Arg Arg Arg Gly Leu Ala Leu Gly Ile Ala Val Val Val20 25 30Val Gly Ile Ala Val Ala Ile Val Ile Ala Phe Val Asp Ser Ser Ala35 40 45Gly Ala Lys Pro Val Ser Ala Asp Lys Pro Ala Ser Ala Gln Ser His50 55 60Pro Gly Ser Pro Ala Pro Gln Ala Pro Gln Pro Ala Gly Gln Thr Glu65 70 75 80Gly Asn Ala Ala Ala Ala Pro Pro Gln Gly Gln Asn Pro Glu Thr Pro85 90 95Thr Pro Thr Ala Ala Val Gln Pro Pro Pro Val Leu Lys Glu Gly Asp100 105 110Asp Cys Pro Asp Ser Thr Leu Ala Val Lys Gly Leu Thr Asn Ala Pro115 120 125Gln Tyr Tyr Val Gly Asp Gln Pro Lys Phe Thr Met Val Val Thr Asn130 135 140Ile Gly Leu Val Ser Cys Lys Arg Asp Val Gly Ala Ala Val Leu Ala145 150 155 160Ala Tyr Val Tyr Ser Leu Asp Asn Lys Arg Leu Trp Ser Asn Leu Asp165 170 175Cys Ala Pro Ser Asn Glu Thr Leu Val Lys Thr Phe Ser Pro Gly Glu180 185 190Gln Val Thr Thr Ala Val Thr Trp Thr Gly Met Gly Ser Ala Pro Arg195 200 205Cys Pro Leu Pro Arg Pro Ala Ile Gly Pro Gly Thr Tyr Asn Leu Val210 215 220Val Gln Leu Gly Asn Leu Arg Ser Leu Pro Val Pro Phe Ile Leu Asn225 230 235 240Gln Pro Pro Pro Pro Pro Gly Pro Val Pro Ala Pro Gly Pro Ala Gln245 250 255Ala Pro Pro Pro Glu Ser Pro Ala Gln Gly Gly260 265(2)SEQ ID NO72的信息(i)序列特征(A)长度97个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO72Leu Ile Ser Thr Gly Lys Ala Ser His Ala Ser Leu Gly Val Gln Val1 5 10 15Thr Asn Asp Lys Asp Thr Pro Gly Ala Lys Ile Val Glu Val Val Ala20 25 30Gly Gly Ala Ala Ala Asn Ala Gly Val Pro Lys Gly Val Val Val Thr35 40 45Lys Val Asp Asp Arg Pro Ile Asn Ser Ala Asp Ala Leu Val Ala Ala50 55 60Val Arg Ser Lys Ala Pro Gly Ala Thr Val Ala Leu Thr Phe Gln Asp65 70 75 80Pro Ser Gly Gly Ser Arg Thr Val Gln Val Thr Leu Gly Lys Ala Glu85 90 95Gln(2)SEQ ID NO73的信息(i)序列特征(A)长度364个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO73Gly Ala Ala Val Ser Leu Leu Ala Ala Gly Thr Leu Val Leu Thr Ala1 5 10 15Cys Gly Gly Gly Thr Asn Ser Ser Ser Ser Gly Ala Gly Gly Thr Ser20 25 30Gly Ser Val His Cys Gly Gly Lys Lys Glu Leu His Ser Ser Gly Ser35 40 45Thr Ala Gln Glu Asn Ala Met Glu Gln Phe Val Tyr Ala Tyr Val Arg50 55 60Ser Cys Pro Gly Tyr Thr Leu Asp Tyr Asn Ala Asn Gly Ser Gly Ala65 70 75 80Gly Val Thr Gln Phe Leu Asn Asn Glu Thr Asp Phe Ala Gly Ser Asp85 90 95Val Pro Leu Asn Pro Ser Thr Gly Gln Pro Asp Arg Ser Ala Glu Arg100 105 110Cys Gly Ser Pro Ala Trp Asp Leu Pro Thr Val Phe Gly Pro Ile Ala115 120 125Ile Thr Tyr Asn Ile Lys Gly Val Ser Thr Leu Asn Leu Asp Gly Pro130 135 140Thr Thr Ala Lys Ile Phe Asn Gly Thr Ile Thr Val Trp Asn Asp Pro145 150 155 160Gln Ile Gln Ala Leu Asn Ser Gly Thr Asp Leu Pro Pro Thr Pro Ile165 170 175Ser Val Ile Phe Arg Ser Asp Lys Ser Gly Thr Ser Asp Asn Phe Gln180 185 190Lys Tyr Leu Asp Gly Val Ser Asn Gly Ala Trp Gly Lys Gly Ala Ser195 200 205Glu Thr Phe Ser Gly Gly Val Gly Val Gly Ala Ser Gly Asn Asn Gly210 215 220Thr Ser Ala Leu Leu Gln Thr Thr Asp Gly Ser Ile Thr Tyr Asn Glu225 230 235 240Trp Ser Phe Ala Val Gly Lys Gln Leu Asn Met Ala Gln Ile Ile Thr245 250 255Ser Ala Gly Pro Asp Pro Val Ala Ile Thr Thr Glu Ser Val Gly Lys260 265 270Thr Ile Ala Gly Ala Lys Ile Met Gly Gln Gly Asn Asp Leu Val Leu275 280 285Asp Thr Ser Ser Phe Tyr Arg Pro Thr Gln Pro Gly Ser Tyr Pro Ile290 295 300Val Leu Ala Thr Tyr Glu Ile Val Cys Ser Lys Tyr Pro Asp Ala Thr305 310 315 320Thr Gly Thr Ala Val Arg Ala Phs Met Gln Ala Ala Ile Gly Pro Gly325 330 335Gln Glu Gly Leu Asp Gln Tyr Gly Ser Ile Pro Leu Pro Lys Ser Phe340 345 350Gln Ala Lys Leu Ala Ala Ala Val Asn Ala Ile Ser355 360(2)SEQ ID NO74的信息(i)序列特征(A)长度309个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO74Gln Ala Ala Ala Gly Arg Ala Val Arg Arg Thr Gly His Ala Glu Asp1 5 10 15Gln Thr His Gln Asp Arg Leu His His Gly Cys Arg Arg Ala Ala Val20 25 30Val Val Arg Gln Asp Arg Ala Ser Val Ser Ala Thr Ser Ala Arg Pro35 40 45Pro Arg Arg His Pro Ala Gln Gly His Arg Arg Arg Val Ala Pro Ser50 55 60Gly Gly Arg Arg Arg Pro His Pro His His Val Gln Pro Asp Asp Arg65 70 75 80Arg Asp Arg Pro Ala Leu Leu Asp Arg Thr Gln Pro Ala Glu His Pro85 90 95Asp Pro His Arg Arg Gly Pro Ala Asp Pro Gly Arg Val Arg Gly Arg100 105 110Gly Arg Leu Arg Arg Val Asp Asp Gly Arg Leu Gln Pro Asp Arg Asp115 120 125Ala Asp His Gly Ala Pro Val Arg Gly Arg Gly Pro His Arg Gly Val130 135 140Gln His Arg Gly Gly Pro Val Phe Val Arg Arg Val Pro Gly Val Arg145 150 155 160Cys Ala His Arg Arg Gly His Arg Arg Val Ala Ala Pro Gly Gln Gly165 170 175Asp Val Leu Arg Ala Gly Leu Arg Val Glu Arg Leu Arg Pro Val Ala180 185 190Ala Val Glu Asn Leu His Arg Gly Ser Gln Arg Ala Asp Gly Arg Val195 200 205Phe Arg Pro Iie Arg Arg Gly Ala Arg Leu Pro Ala Arg Arg Ser Arg210 215 220Ala Gly Pro Gln Gly Arg Leu His Leu Asp Gly Ala Gly Pro Ser Pro225 230 235 240Leu Pro Ala Arg Ala Gly Gln Gln Gln Pro Ser Ser Ala Gly Gly Arg245 250 255Arg Ala Gly Gly Ala Glu Arg Ala Asp Pro Gly Gln Arg Gly Arg His260 265 270His Gln Gly Gly His Asp Pro Gly Arg Gln Gly Ala Gln Arg Gly Thr275 280 285Ala Gly Val Ala His Ala Ala Ala Gly Pro Arg Arg Ala Ala Val Arg290 295 300Asn Arg Pro Arg Arg305(2)SEQ ID NO75的信息(i)序列特征(A)长度580个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO75Ser Ala Val Trp Cys Leu Asn Gly Phe Thr Gly Arg His Arg His Gly1 5 10 15Arg Cys Arg Val Arg Ala Ser Gly Trp Arg Ser Ser Asn Arg Trp Cys20 25 30Ser Thr Thr Ala Asp Cys Cys Ala Ser Lys Thr Pro Thr Gln Ala Ala35 40 45Ser Pro Leu Glu Arg Arg Phe Thr Cys Cys Ser Pro Ala Val Gly Cys50 55 60Arg Phe Arg Ser Phe Pro Val Arg Arg Leu Ala Leu Gly Ala Arg Thr65 70 75 80Ser Arg Thr Leu Gly Val Arg Arg Thr Leu Ser Gln Trp Asn Leu Ser85 90 95Pro Arg Ala Gln Pro Ser Cys Ala Val Thr Val Glu Ser His Thr His100 105 110Ala Ser Pro Arg Mer Ala Lys Leu Ala Arg Val Val Gly Leu Val Gln115 120 125Glu Glu Gln Pro Ser Asp Met Thr Asn His Pro Arg Tyr Ser Pro Pro130 135 140Pro Gln Gln Pro Gly Thr Pro Gly Tyr Ala Gln Gly Gln Gln Gln Thr145 150 155 160Tyr Ser Gln Gln Phe Asp Trp Arg Tyr Pro Pro Ser Pro Pro Pro Gln165 170 175Pro Thr Gln Tyr Arg Gln Pro Tyr Glu Ala Leu Gly Gly Thr Arg Pro180 185 190Gly Leu Ile Pro Gly Val Ile Pro Thr Met Thr Pro Pro Pro Gly Met195 200 205Val Arg Gln Arg Pro Arg Ala Gly Met Leu Ala Ile Gly Ala Val Thr210 215 220Ile Ala Val Val Ser Ala Gly Ile Gly Gly Ala Ala Ala Ser Leu Val225 230 235 240Gly Phe Asn Arg Ala Pro Ala Gly Pro Ser Gly Gly Pro Val Ala Ala245 250 255Ser Ala Ala Pro Ser Ile Pro Ala Ala Asn Met Pro Pro Gly Ser Val260 265 270Glu Gln Val Ala Ala Lys Val Val Pro Ser Val Val Met Leu Glu Thr275 280 285Asp Leu Gly Arg Gln Ser Glu Glu Gly Ser Gly Ile Ile Leu Ser Ala290 295 300Glu Gly Leu Ile Leu Thr Asn Asn His Val Ile Ala Ala Ala Ala Lys305 310 315 320Pro Pro Leu Gly Ser Pro Pro Pro Lys Thr Thr Val Thr Phe Ser Asp
325 330 335Gly Arg Thr Ala Pro Phe Thr Val Val Gly Ala Asp Pro Thr Ser Asp340 345 350Ile Ala Val Val Arg Val Gln Gly Val Ser Gly Leu Thr Pro Ile Ser355 360 365Leu Gly Ser Ser Ser Asp Leu Arg Val Gly Gln Pro Val Leu Ala Ile370 375 380Gly Ser Pro Leu Gly Leu Glu Gly Thr Val Thr Thr Gly Ile Val Ser385 390 395 400Ala Leu Asn Arg Pro Val Ser Thr Thr Gly Glu Ala Gly Asn Gln Asn405 410 415Thr Val Leu Asp Ala Ile Gln Thr Asp Ala Ala Ile Asn Pro Gly Asn420 425 430Ser Gly Gly Ala Leu Val Asn Met Asn Ala Gln Leu Val Gly Val Asn435 440 445Ser Ala Ile Ala Thr Leu Gly Ala Asp Ser Ala Asp Ala Gln Ser Gly450 455 460Ser Ile Gly Leu Gly Phe Ala Ile Pro Val Asp Gln Ala Lys Arg Ile465 470 475 480Ala Asp Glu Leu Ile Ser Thr Gly Lys Ala Ser His Ala Ser Leu Gly485 490 495Val Gln Val Thr Asn Asp Lys Asp Thr Pro Gly Ala Lys Ile Val Glu500 505 510Val Val Ala Gly Gly Ala Ala Ala Asn Ala Gly Val Pro Lys Gly Val515 520 525Val Val Thr Lys Val Asp Asp Arg Pro Ile Asn Ser Ala Asp Ala Leu530 535 540Val Ala Ala Val Arg Ser Lys Ala Pro Gly Ala Thr Val Ala Leu Thr545 550 555 560Phe Gln Asp Pro Ser Gly Gly Ser Arg Thr Val Gln Val Thr Leu Gly565 570 575Lys Ala Glu Gln580(2)SEQ ID NO76的信息(i)序列特征(A)长度233个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO76Met Asn Asp Gly Lys Arg Ala Val Thr Ser Ala Val Leu Val Val Leu1 5 10 15Gly Ala Cys Leu Ala Leu Trp Leu Ser Gly Cys Ser Ser Pro Lys Pro20 25 30Asp Ala Glu Glu Gln Gly Val Pro Val Ser Pro Thr Ala Ser Asp Pro35 40 45Ala Leu Leu Ala Glu Ile Arg Gln Ser Leu Asp Ala Thr Lys Gly Leu50 55 60Thr Ser Val His Val Ala Val Arg Thr Thr Gly Lys Val Asp Ser Leu65 70 75 80Leu Gly Ile Thr Ser Ala Asp Val Asp Val Arg Ala Asn Pro Leu Ala85 90 95Ala Lys Gly Val Cys Thr Tyr Asn Asp Glu Gln Gly Val Pro Phe Arg100 105 110Val Gln Gly Asp Asn Ile Ser Val Lys Leu Phe Asp Asp Trp Ser Asn115 120 125Leu Gly Ser Ile Ser Glu Leu Ser Thr Ser Arg Val Leu Asp Pro Ala130 135 140Ala Gly Val Thr Gln Leu Leu Ser Gly Val Thr Asn Leu Gln Ala Gln145 150 155 160Gly Thr Glu Val Ile Asp Gly Ile Ser Thr Thr Lys Ile Thr Gly Thr165 170 175Ile Pro Ala Ser Ser Val Lys Met Leu Asp Pro Gly Ala Lys Ser Ala180 185 190Arg Pro Ala Thr Val Trp Ile Ala Gln Asp Gly Ser His His Leu Val195 200 205Arg Ala Ser Ile Asp Leu Gly Ser Gly Ser Ile Gln Leu Thr Gln Ser210 215 220Lys Trp Asn Glu Pro Val Asn Val Asp225 230(2)SEQ ID NO77的信息(i)序列特征(A)长度66个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO77Val Ile Asp Ile Ile Gly Thr Ser Pro Thr Ser Trp Glu Gln Ala Ala1 5 10 15Ala Glu Ala Val Gln Arg Ala Arg Asp Ser Val Asp Asp Ile Arg Val20 25 30Ala Arg Val Ile Glu Cln Asp Met Ala Val Asp Ser Ala Gly Lys Ile35 40 45Thr Tyr Arg Ile Lys Leu Glu Val Ser Phe Lys Met Arg Pro Ala Gln50 55 60Pro Arg65(2)SEQ ID NO78的信息(i)序列特征(A)长度69个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO78Val Pro Pro Ala Pro Pro Leu Pro Pro Leu Pro Pro Ser Pro Ile Ser1 5 10 15Cys Ala Ser Pro Pro Ser Pro Pro Leu Pro Pro Ala Pro Pro Val Ala20 25 30Pro Gly Pro Pro Met Pro Pro Leu Asp Pro Trp Pro Pro Ala Pro Pro35 40 45Leu Pro Tyr Ser Thr Pro Pro Gly Ala Pro Leu Pro Pro Ser Pro Pro50 55 60Ser Pro Pro Leu Pro65(2)SEQ ID NO79的信息(i)序列特征(A)长度355个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO79Met Ser Asn Ser Arg Arg Arg Ser Leu Arg Trp Ser Trp Leu Leu Ser1 5 10 15Val Leu Ala Ala Val Gly Leu Gly Leu Ala Thr Ala Pro Ala Gln Ala20 25 30Ala Pro Pro Ala Leu Ser Gln Asp Arg Phe Ala Asp Phe Pro Ala Leu35 40 45Pro Leu Asp Pro Ser Ala Met Val Ala Gln Val Ala Pro Gln Val Val50 55 60Asn Ile Asn Thr Lys Leu Gly Tyr Asn Asn Ala Val Gly Ala Gly Thr65 70 75 80Gly Ile Val Ile Asp Pro Asn Gly Val Val Leu Thr Asn Asn His Val85 90 95Ile Ala Gly Ala Thr Asp Ile Asn Ala Phe Ser Val Gly Ser Gly Gln100 105 110Thr Tyr Gly Val Asp Val Val Gly Tyr Asp Arg Thr Gln Asp Val Ala115 120 125Val Leu Gln Leu Arg Gly Ala Gly Gly Leu Pro Ser Ala Ala Ile Gly130 135 140Gly Gly Val Ala Val Gly Glu Pro Val Val Ala Met Gly Asn Ser Gly145 150 155 160Gly Gln Gly Gly Thr Pro Arg Ala Val Pro Gly Arg Val Val Ala Leu165 170 175Gly Gln Thr Val Gln Ala Ser Asp Ser Leu Thr Gly Ala Glu Glu Thr180 185 190Leu Asn Gly Leu Ile Gln Phe Asp Ala Ala Ile Gln Pro Gly Asp Ser195 200 205Gly Gly Pro Val Val Asn Gly Leu Gly Gln Val Val Gly Met Asn Thr210 215 220Ala Ala Ser Asp Asn Phe Gln Leu Ser Gln Gly Gly Gln Gly Phe Ala225 230 235 240Ile Pro Ile Gly Gln Ala Met Ala Ile Ala Gly Gln Ile Arg Ser Gly245 250 255Gly Gly Ser Pro Thr Val His Ile Gly Pro Thr Ala Phe Leu Gly Leu260 265 270Gly Val Val Asp Asn Asn Gly Asn Gly Ala Arg Val Gln Arg Val Val275 280 285Gly Ser Ala Pro Ala Ala Ser Leu Gly Ile Ser Thr Gly Asp Val Ile290 295 300Thr Ala Val Asp Gly Ala Pro Ile Asn Ser Ala Thr Ala Met Ala Asp305 310 315 320Ala Leu Asn Gly His His Pro Gly Asp Val Ile Ser Val Asn Trp Gln325 330 335Thr Lys Ser Gly Gly Thr Arg Thr Gly Asn Val Thr Leu Ala Glu Gly340 345 350Pro Pro Ala(2)SEQ ID NO80的信息(i)序列特征(A)长度205个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO80Ser Pro Lys Pro Asp Ala Glu Glu Gln Gly Val Pro Val Ser Pro Thr1 5 10 15Ala Ser Asp Pro Ala Leu Leu Ala Glu Ile Arg Gln Ser Leu Asp Ala20 25 30Thr Lys Gly Leu Thr Ser Val His Val Ala Val Arg Thr Thr Gly Lys35 40 45Val Asp Ser Leu Leu Gly Ile Thr Ser Ala Asp Val Asp Val Arg Ala50 55 60Asn Pro Leu Ala Ala Lys Gly Val Cys Thr Tyr Asn Asp Glu Gln Gly65 70 75 80Val Pro Phe Arg Val Gln Gly Asp Asn Ile Ser Val Lys Leu Phe Asp85 90 95Asp Trp Ser Asn Leu Gly Ser Ile Ser Glu Leu Ser Thr Ser Arg Val100 105 110Leu Asp Pro Ala Ala Gly Val Thr Gln Leu Leu Ser Gly Val Thr Asn115 120 125Leu Gln Ala Gln Gly Thr Glu Val Ile Asp Gly Ile Ser Thr Thr Lys130 135 140Ile Thr Gly Thr Ile Pro Ala Ser Ser Val Lys Met Leu Asp Pro Gly145 150 155 160Ala Lys Ser Ala Arg Pro Ala Thr Val Trp Ile Ala Gln Asp Gly Ser165 170 175His His Leu Val Arg Ala Ser Ile Asp Leu Gly Ser Gly Ser Ile Gln180 185 190Leu Thr Gln Ser Lys Trp Asn Glu Pro Val Asn Val Asp195 200 205(2)SEQ ID NO81的信息(i)序列特征(A)长度286个氨基酸(B)类型氨基酸
(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO81Gly Asp Ser Phe Trp Ala Ala Ala Asp Gln Met Ala Arg Gly Phe Val1 5 10 15Leu Gly Ala Thr Ala Gly Arg Thr Thr Ieu Thr Gly Glu Gly Leu Gln20 25 30His Ala Asp Gly His Ser Leu Leu Leu Asp Ala Thr Asn Pro Ala Val35 40 45Val Ala Tyr Asp Pro Ala Phe Ala Tyr Glu Ile Gly Tyr Ile Xaa Glu50 55 60Ser Gly Leu Ala Arg Met Cys Gly Glu Asn Pro Glu Asn Ile Phe Phe65 70 75 80Tyr Ile Thr Val Tyr Asn Glu Pro Tyr Val Gln Pro Pro Glu Pro Glu85 90 95Asn Phe Asp Pro Glu Gly Val Leu Gly Gly Ile Tyr Arg Tyr His Ala100 105 110Ala Thr Glu Gln Arg Thr Asn Lys Xaa Gln Ile Leu Ala Ser Gly Val115 120 125Ala Met Pro Ala Ala Leu Arg Ala Ala Gln Met Leu Ala Ala Glu Trp130 135 140Asp Val Ala Ala Asp Val Trp Ser Val Thr Ser Trp Gly Glu Leu Asn145 150 155 160Arg Asp Gly Val Val Ile Glu Thr Glu Lys Leu Arg His Pro Asp Arg165 170 175Pro Ala Gly Val Pro Tyr Val Thr Arg Ala Leu Glu Asn Ala Arg Gly180 185 190Pro Val Ile Ala Val Ser Asp Trp Met Arg Ala Val Pro Glu Gln Ile195 200 205Arg Pro Trp Val Pro Gly Thr Tyr Leu Thr Leu Gly Thr Asp Gly Phe210 215 220Gly Phe Ser Asp Thr Arg Pro Ala Gly Arg Arg Tyr Phe Asn Thr Asp225 230 235 240Ala Glu Ser Gln Val Gly Arg Gly Phe Gly Arg Gly Trp Pro Gly Arg245 250 255Arg Val Asn Ile Asp Pro Phe Gly Ala Gly Arg Gly Pro Pro Ala Gln260 265 270Leu Pro Gly Phe Asp Glu Gly Gly Gly Leu Arg Pro Xaa Lys275 280 285(2)SEQ ID NO82的信息
(i)序列特征(A)长度173个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO82Thr Lys Phe His Ala Leu Met Gln Glu Gln Ile His Asn Glu Phe Thr1 5 10 15Ala Ala Gln Gln Tyr Val Ala Ile Ala Val Tyr Phe Asp Ser Glu Asp20 25 30Leu Pro Gln Leu Ala Lys His Phe Tyr Ser Gln Ala Val Glu Glu Arg35 40 45Asn His Ala Met Met Leu Val Gln His Leu Leu Asp Arg Asp Leu Arg50 55 60Val Glu Ile Pro Gly Val Asp Thr Val Arg Asn Gln Phe Asp Arg Pro65 70 75 80Arg Glu Ala Leu Ala Leu Ala Leu Asp Gln Glu Arg Thr Val Thr Asp85 90 95Gln Val Gly Arg Leu Thr Ala Val Ala Arg Asp Glu Gly Asp Phe Leu100 105 110Gly Glu Gln Phe Met Gln Trp Phe Leu Gln Glu Gln Ile Glu Glu Val115 120 125Ala Leu Met Ala Thr Leu Val Arg Val Ala Asp Arg Ala Gly Ala Asn130 135 140Leu Phe Glu Leu Glu Asn Phe Val Ala Arg Glu Val Asp Val Ala Pro145 150 155 160Ala Ala Ser Gly Ala Pro His Ala Ala Gly Gly Arg Leu165 170(2)SEQ ID NO83的信息(i)序列特征(A)长度107个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO83Arg Ala Asp Glu Arg Lys Asn Thr Thr Met Lys Met Val Lys Ser Ile1 5 10 15Ala Ala Gly Leu Thr Ala Ala Ala Ala Ile Gly Ala Ala Ala Ala Gly20 25 30Val Thr Ser Ile Met Ala Gly Gly Pro Val Val Tyr Gln Met Gln Pro35 40 45Val Val Phe Gly Ala Pro Leu Pro Leu Asp Pro Xaa Ser Ala Pro Xaa50 55 60Val Pro Thr Ala Ala Gln Trp Thr Xaa Leu Leu Asn Xaa Leu Xaa Asp65 70 75 80Pro Asn Val Ser Phe Xaa Asn Lys Gly Ser Leu Val Clu Gly Gly Ile85 90 95Gly Gly Xaa Glu Gly Xaa Xaa Arg Arg Xaa Gln100 105(2)SEQ ID NO84的信息(i)序列特征(A)长度125个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO84Val Leu Ser Val Pro Val Gly Asp Gly Phe Trp Xaa Arg Val Val Asn1 5 10 15Pro Leu Gly Gln Pro Ile Asp Gly Arg Gly Asp Val Asp Ser Asp Thr20 25 30Arg Arg Ala Leu Glu Leu Gln Ala Pro Ser Val Val Xaa Arg Gln Gly35 40 45Val Lys Glu Pro Leu Xaa Thr Gly Ile Lys Ala Ile Asp Ala Met Thr50 55 60Pro Ile Gly Arg Gly Gln Arg Gln Leu Ile Ile Gly Asp Arg Lys Thr65 70 75 80Gly Lys Asn Arg Arg Leu Cys Arg Thr Pro Ser Ser Asn Gln Arg Glu85 90 95Glu Leu Gly Val Arg Trp Ile Pro Arg Ser Arg Cys Ala Cys Val Tyr100 105 110Val Gly His Arg Ala Arg Arg Gly Thr Tyr His Arg Arg115 120 125(2)SEQ ID NO85的信息(i)序列特征
(A)长度117个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO85Cys Asp Ala Val Met Gly Phe Leu Gly Gly Ala Gly Pro Leu Ala Val1 5 10 15Val Asp Gln Gln Leu Val Thr Arg Val Pro Gln Gly Trp Ser Phe Ala20 25 30Gln Ala Ala Ala Val Pro Val Val Phe Leu Thr Ala Trp Tyr Gly Leu35 40 45Ala Asp Leu Ala Glu Ile Lys Ala Gly Glu Ser Val Leu Ile His Ala50 55 60Gly Thr Gly Gly Val Gly Met Ala Ala Val Gln Leu Ala Arg Gln Trp65 70 75 80Gly Val Glu Val Phe Val Thr Ala Ser Arg Gly Lys Trp Asp Thr Leu85 90 95Arg Ala Xaa Xaa Phe Asp Asp Xaa Pro Tyr Arg Xaa Phe Pro His Xaa100 105 110Arg Ser Ser Xaa Gly115(2)SEQ ID NO86的信息(i)序列特征(A)长度103个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO86Met Tyr Arg Phe Ala Cys Arg Thr Leu Met Leu Ala Ala Cys Ile Leu1 5 10 15Ala Thr Gly Val Ala Gly Leu Gly Val Gly Ala Gln Ser Ala Ala Gln20 25 30Thr Ala Pro Val Pro Asp Tyr Tyr Trp Cys Pro Gly Gln Pro Phe Asp35 40 45Pro Ala Trp Gly Pro Asn Trp Asp Pro Tyr Thr Cys His Asp Asp Phe50 55 60lis Arg Asp Ser Asp Gly Pro Asp His Ser Arg Asp Tyr Pro Gly Pro65 70 75 80Ile Leu Glu Gly Pro Val Leu Asp Asp Pro Gly Ala Ala Pro Pro Pro85 90 95Pro Ala Ala Gly Gly Gly Ala100(2)SEQ ID NO87的信息(i)序列特征(A)长度88个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO87Val Gln Cys Arg Val Trp Leu Glu Ile Gln Trp Arg Gly Met Leu Gly1 5 10 15Ala Asp Gln Ala Arg Ala Gly Gly Pro Ala Arg Ile Trp Arg Glu His20 25 30Ser Met Ala Ala Met Lys Pro Arg Thr Gly Asp Gly Pro Leu Glu Ala35 40 45Thr Lys Glu Gly Arg Gly Ile Val Met Arg Val Pro Leu Glu Gly Gly50 55 60Gly Arg Leu Val Val Glu Leu Thr Pro Asp Glu Ala Ala Ala Leu Gly65 70 75 80Asp Glu Leu Lys Gly Val Thr Ser85(2)SEQ ID NO88的信息(i)序列特征(A)长度95个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO88Thr Asp Ala Ala Thr Leu Ala Gln Glu Ala Gly Asn Phe Glu Arg Ile1 5 10 15Ser Gly Asp Leu Lys Thr Gln Ile Asp Gln Val Glu Ser Thr Ala Gly20 25 30Ser Leu Gln Gly Gln Trp Arg Gly Ala Ala Gly Thr Ala Ala Gln Ala35 40 45Ala Val Val Arg Phe Gln Glu Ala Ala Asn Lys Gln Lys Gln Glu Leu50 55 60Asp Glu Ile Ser Thr Asn Ile Arg Gln Ala Gly Val Gln Tyr Ser Arg65 70 75 80Ala Asp Glu Glu Gln Gln Gln Ala Leu Ser Ser Gln Met Gly Phe85 90 95(2)SEQ ID NO89的信息(i)序列特征(A)长度166个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO89Met Thr Gln Ser Gln Thr Val Thr Val Asp Gln Gln Glu Ile Leu Asn1 5 10 15Arg Ala Asn Glu Val Glu Ala Pro Met Ala Asp Pro Pro Thr Asp Val20 25 30Pro Ile Thr Pro Cys Glu Leu Thr Xaa Xaa Lys Asn Ala Ala Gln Gln35 40 45Xaa Val Leu Ser Ala Asp Asn Met Arg Glu Tyr Leu Ala Ala Gly Ala50 55 60Lys Glu Arg Gln Arg Leu Ala Thr Ser Leu Arg Asn Ala Ala Lys Xaa65 70 75 80Tyr Gly Glu Val Asp Glu Glu Ala Ala Thr Ala Leu Asp Asn Asp Gly85 90 95Glu Gly Thr Val Gln Ala Glu Ser Ala Gly Ala Val Gly Gly Asp Ser100 105 110Ser Ala Glu Leu Thr Asp Thr Pro Arg Val Ala Thr Ala Cly Glu Pro115 120 125Asn Phe Met Asp Leu Lys Glu Ala Ala Arg Lys Leu Glu Thr Gly Asp130 135 140G1n Gly Ala Ser Leu Ala His Xaa Gly Asp Gly Trp Asn Thr Xaa Thr145 150 155 160Leu Thr Leu Gln Gly Asp165(2)SEQ ID NO90的信息(i)序列特征(A)长度5个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO90Arg Ala Glu Arg Met1 5(2)SEQ ID NO91的信息(i)序列特征(A)长度263个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO91Val Ala Trp Met Ser Val Thr Ala Gly Gln Ala Glu Leu Thr Ala Ala1 5 10 15Gln Val Arg Val Ala Ala Ala Ala Tyr Glu Thr Ala Tyr Gly Leu Thr20 25 30Val Pro Pro Pro Val Ile Ala Glu Asn Arg Ala Clu Leu Met Ile Leu35 40 45Ile Ala Thr Asn Leu Leu Gly Gln Asn Thr Pro Ala Ile Ala Val Asn50 55 60Glu Ala Glu Tyr Gly Glu Met Trp Ala Gln Asp Ala Ala Ala Met Phe65 70 75 80Gly Tyr Ala Ala Ala Thr Ala Thr Ala Thr Ala Thr Leu Leu Pro Phe85 90 95Glu Glu Ala Pro Glu Met Thr Ser Ala Gly Gly Leu Leu Glu Gln Ala100 105 110Ala Ala Val Glu Glu Ala Ser Asp Thr Ala Ala Ala Asn Gln Leu Met115 120 125Asn Asn Val Pro Gln Ala Leu Lys Gln Leu Ala Gln Pro Thr Gln Gly130 135 140Thr Thr Pro Ser Ser Lys Leu Gly Gly Leu Trp Lys Thr Val Ser Pro145 150 155 160His Arg Ser Pro Ile Ser Asn Met Val Ser Met Ala Asn Asn His Met165 170 175Ser Met Thr Asn Ser Gly Val Ser Met Thr Asn Thr Leu Ser Ser Met180 185 190Leu Lys Gly Phe Ala Pro Ala Ala Ala Ala Gln Ala Val Gln Thr Ala195 200 205Ala Gln Asn Gly Val Arg Ala Met Ser Ser Leu Gly Ser Ser Leu Gly210 215 220Ser Ser Gly Leu Gly Gly Gly Val Ala Ala Asn Leu Gly Arg Ala Ala225 230 235 240Ser Val Arg Tyr Gly His Arg Asp Gly Gly Lys Tyr Ala Xaa Ser Gly245 250 255Arg Arg Asn Gly Gly Pro Ala260(2)SEQ ID NO92的信息(i)序列特征(A)长度303个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO92Met Thr Tyr Ser Pro Gly Asn Pro Gly Tyr Pro Gln Ala Gln Pro Ala1 5 10 15Gly Ser Tyr Gly Gly Val Thr Pro Ser Phe Ala His Ala Asp Glu Gly20 25 30Ala Ser Lys Leu Pro Met Tyr Leu Asn Ile Ala Val Ala Val Leu Gly35 40 45Leu Ala Ala Tyr Phe Ala Ser Phe Gly Pro Met Phe Thr Leu Ser Thr50 55 60Glu Leu Gly Gly Gly Asp Gly Ala Val Ser Gly Asp Thr Gly Leu Pro65 70 75 80Val Gly Val Ala Leu Leu Ala Ala Leu Leu Ala Gly Val Val Leu Val85 90 95Pro Lys Ala Lys Ser His Val Thr Val Val Ala Val Leu Gly Val Leu100 105 110Gly Val Phe Leu Met Val Ser Ala Thr Phe Asn Lys Pro Ser Ala Tyr115 120 125Ser Thr Gly Trp Ala Leu Trp Val Val Leu Ala Phe Ile Val Phe Gln130 135 140Ala Val Ala Ala Val Leu Ala Leu Leu Val Glu Thr Gly Ala Ile Thr145 150 155 160Ala Pro Ala Pro Arg Pro Lys Phe Asp Pro Tyr Gly Gln Tyr Gly Arg165 170 175Tyr Gly Gln Tyr Gly Gln Tyr Gly Val Gln Pro Gly Gly Tyr Tyr Gly180 185 190Gln Gln Gly Ala Gln Gln Ala Ala Gly Leu Gln Ser Pro Gly Pro Gln195 200 205Gln Ser Pro Gln Pro Pro Gly Tyr Gly Ser Gln Tyr Gly Gly Tyr Ser210 215 220Ser Ser Pro Ser Gln Ser Gly Ser Gly Tyr Thr Ala Gln Pro Pro Ala225 230 235 240Gln Pro Pro Ala Gln Ser Gly Ser Gln Gln Ser His Gln Gly Pro Ser245 250 255Thr Pro Pro Thr Gly Phe Pro Ser Phe Ser Pro Pro Pro Pro Val Ser260 265 270Ala Gly Thr Gly Ser Gln Ala Gly Ser Ala Pro Val Asn Tyr Ser Asn275 280 285Pro Ser Gly Gly Glu Gln Ser Ser Ser Pro Gly Gly Ala Pro Val290 295 300(2)SEQ ID NO93的信息(i)序列特征(A)长度28个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO93Gly Cys Gly Glu Thr Asp Ala Ala Thr Leu Ala Gln Glu Ala Gly Asn1 5 10 15Phe Glu Arg Ile Ser Gly Asp Leu Lys Thr Gln Ile20 25(2)SEQ ID NO94的信息(i)序列特征(A)长度16个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO94Asp Gln Val Glu Ser Thr Ala Gly Ser Leu Gln Gly Gln Trp Arg Gly1 5 10 15(2)SEQ ID NO95的信息(i)序列特征(A)长度27个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO95Gly Cys Gly Ser Thr Ala Gly Ser Leu Gln Gly Gln Trp Arg Gly Ala1 5 10 15ALa Gly Thr Ala Ala Gln Ala Ala Val Val Arg20 25(2)SEQ ID NO96的信息(i)序列特征(A)长度27个氨基酸(B)类型氨基酸
(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO96Gly Cys Gly Gly Thr Ala Ala Gln Ala Ala Val Val Arg Phe Gln Glu1 5 10 15Ala Ala Ash Lys Gln Lys Gln Glu Leu Asp Glu20 25(2)SEQ ID NO97的信息(i)序列特征(A)长度27个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO97Gly Cys Gly Ala Asn Lys Gln Lys Gln Glu Leu Asp Glu Ile Ser Thr1 5 10 15Asn Ile Arg Gln Ala Gly Val Gln Tyr Ser Arg20 25(2)SEQ ID NO98的信息(i)序列特征(A)长度28个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO98Gly Cys Gly Ile Arg Gln Ala Gly Val Gln Tyr Ser Arg Ala Asp Glu1 5 10 15Glu Gln Gln Gln Ala Leu Ser Ser Gln Met Gly Phe20 25(2)SEQ ID NO99的信息(i)序列特征(A)长度507个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO99ATGAAGATGG TGAAATCGAT CGCCGCAGGT CTGACCGCCG CGGCTGCAAT CGGCGCCGCT 60GCGGCCGGTG TGACTTCGAT CATGGCTGGC GGCCCGGTCG TATACCAGAT GCAGCCGGTC120GTCTTCGGCG CGCCACTGCC GTTGGACCCG GCATCCGCCC CTGACGTCCC GACCGCCGCC180CAGTTGACCA GCCTGCTCAA CAGCCTCGCC GATCCCAACG TGTCGTTTGC GAACAAGGGC240AGTCTGGTCG AGGGCGGCAT CGGGGGCACC GAGGCGCGCA TCGCCGACCA CAAGCTGAAG300AAGGCCGCCG AGCACGGGGA TCTGCCGCTG TCGTTCAGCG TGACGAACAT CCAGCCGGCG360GCCGCCGGTT CGGCCACCGC CGACGTTTCC GTCTCGGGTC CGAAGCTCTC GTCGCCGGTC420ACGCAGAACG TCACGTTCGT GAATCAAGGC GGCTGGATGC TGTCACGCGC ATCGGCGATG480GAGTTGCTGC AGGCCGCAGG GAACTGA507(2)SEQ ID NO100的信息(i)序列特征(A)长度168个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO100Met Lys Met Val Lys Ser Ile Ala Ala Gly Leu Thr Ala Ala Ala Ala1 5 10 15Ile Gly Ala Ala Ala Ala Gly Val Thr Ser Ile Met Ala Gly Gly Pro20 25 30Val Val Tyr Gln Met Gln Pro Val Val Phe Gly Ala Pro Leu Pro Leu35 40 45Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln Leu Thr Ser50 55 60Leu Leu Asn Ser Leu Ala Asp Pro Asn Val Ser Phe Ala Asn Lys Gly65 70 75 80Ser Leu Val Glu Gly Gly Ile Gly Gly Thr Glu Ala Arg Ile Ala Asp85 90 95His Lys Leu Lys Lys Ala Ala Glu His Gly Asp Leu Pro Leu Ser Phe100 105 110Ser Val Thr Asn Ile Gln Pro Ala Ala Ala Gly Ser Ala Thr Ala Asp115 120 125Val Ser Val Ser Gly Pro Lys Leu Ser Ser Pro Val Thr Gln Asn Val130 135 140Thr Phe Val Asn Gln Gly Gly Trp Met Leu Ser Arg Ala Ser Ala Met145 150 155 160Glu Leu Leu Gln Ala Ala Gly Asn165(2)SEQ ID NO101的信息(i)序列特征(A)长度500个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO101CGTGGCAATG TCGTTGACCG TCGGGGCCGG GGTCGCCTCC GCAGATCCCG TGGACGCGGT 60CATTAACACC ACCTGCAATT ACGGGCAGGT AGTAGCTGCG CTCAACGCGA CGGATCCGGG 120GGCTGCCGCA CAGTTCAACG CCTCACCGGT GGCGCAGTCC TATTTGCGCA ATTTCCTCGC 180CGCACCGCCA CCTCAGCGCG CTGCCATGGC CGCGCAATTG CAAGCTGTGC CGGGGGCGGC 240ACAGTACATC GGCCTTGTCG AGTCGGTTGC CGGCTCCTGC AACAACTATT AAGCCCATGC 300GGGCCCCATC CCGCGACCCG GCATCGTCGC CGGGGCTAGG CCAGATTGCC CCGCTCCTCA 360ACGGGCCGCA TCCCGCGACC CGGCATCGTC GCCGGGGCTA GGCCAGATTG CCCCGCTCCT 420CAACGGGCCG CATCTCGTGC CGAATTCCTG CAGCCCGGGG GATCCACTAG TTCTAGAGCG 480GCCGCCACCG CGGTGGAGCT 500(2)SEQ ID NO102的信息(i)序列特征(A)长度96个氨基酸
(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO102Val Ala Met Ser Leu Thr Val Gly Ala Gly Val Ala Ser Ala Asp Pro1 5 10 15Val Asp Ala Val Ile Asn Thr Thr Cys Asn Tyr Gly Gln Val Val Ala20 25 30Ala Leu Asn Ala Thr Asp Pro Gly Ala Ala Ala Gln Phe Asn Ala Ser35 40 45Pro Val Ala Gln Ser Tyr Leu Arg Asn Phe Leu Ala Ala Pro Pro Pro50 55 60Gln Arg Ala Ala Met Ala Ala Gln Leu Gln Ala Val Pro Gly Ala Ala65 70 75 80Gln Tyr Ile Gly Leu Val Glu Ser Val Ala Gly Ser Cys Asn Asn Tyr85 90 95(2)SEQ ID NO103的信息(i)序列特征(A)长度154个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO103ATGACAGAGC AGCAGTGGAA TTTCGCGGGT ATCGAGGCCG CGGCAAGCGC AATCCAGGGA 60AATGTCACGT CCATTCATTC CCTCCTTGAC GAGGGGAAGC AGTCCCTGAC CAAGCTCGCA120GCGGCCTGGG GCGGTAGCGG TTCGGAAGCG TACC154(2)SEQ ID NO104的信息(i)序列特征(A)长度51个氨基酸(B)类型氨基酸(C)链数单链
(D)拓扑学线性(xi)序列描述SEQ ID N0104Met Thr Glu Gln Gln Trp Asn Phe Ala Gly Ile Glu Ala Ala Ala Ser1 5 10 15Ala Ile Gln Gly Asn Val Thr Ser Ile His Ser Leu Leu Asp Glu Gly20 25 30Lys Gln Ser Leu Thr Lys Leu Ala Ala Ala Trp Gly Gly Ser Gly Ser35 40 45Glu Ala Tyr50(2)SEQ ID NO105的信息(i)序列特征(A)长度282个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO105CGGTCGCGCA CTTCCAGGTG ACTATGAAAG TCGGCTTCCG NCTGGAGGAT TCCTGAACCT 60TCAAGCGCGG CCGATAACTG AGGTGCATCA TTAAGCGACT TTTCCAGAAC ATCCTGACGC 120GCTCGAAACG CGGCACAGCC GACGGTGGCT CCGNCGAGGC GCTGNCTCCA AAATCCCTGA 180GACAATTCGN CGGGGGCGCC TACAAGGAAG TCGGTGCTGA ATTCGNCGNG TATCTGGTCG 240ACCTGTGTGG TCTGNAGCCG GACGAAGCGG TGCTCGACGT CG282(2)SEQ ID NO106的信息(i)序列特征(A)长度3058个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO106GATCGTACCC GTGCGAGTGC TCGGGCCGTT TGAGGATGGA GTGCACGTGT CTTTCGTGAT 60GGCATACCCA GAGATGTTGG CGGCGGCGGC TGACACCCTG CAGAGCATCG GTGCTACCAC120TGTGGCTAGC AATGCCGCTG CGGCGGCCCC GACGACTGGG GTGGTGCCCC CCGCTGCCGA180TGAGGTGTCG GCGCTGACTG CGGCGCACTT CGCCGCACAT GCGGCGATGT ATCAGTCCGT 240GAGCGCTCGG GCTGCTGCGA TTCATGACCA GTTCGTGGCC ACCCTTGCCA GCAGCGCCAG 300CTCGTATGCG GCCACTGAAG TCGCCAATGC GGCGGCGGCC AGCTAAGCCA GGAACAGTCG 360GCACGAGAAA CCACGAGAAA TAGGGACACG TAATGGTGGA TTTCGGGGCG TTACCACCGG 420AGATCAACTC CGCGAGGATG TACGCCGGCC CGGGTTCGGC CTCGCTGGTG GCCGCGGCTC 480AGATGTGGGA CAGCGTGGCG AGTGACCTGT TTTCGGCCGC GTCGGCGTTT CAGTCGGTGG 540TCTGGGGTCT GACGGTGGGG TCGTGGATAG GTTCGTCGGC GGGTCTGATG GTGGCGGCGG 600CCTCGCCGTA TGTGGCGTGG ATGAGCGTCA CCGCGGGGCA GGCCGAGCTG ACCGCCGCCC 660AGGTCCGGGT TGCTGCGGCG GCCTACGAGA CGGCGTATGG GCTGACGGTG CCCCCGCCGG 720TGATCGCCGA GAACCGTGCT GAACTGATGA TTCTGATAGC GACCAACCTC TTGGGGCAAA 780ACACCCCGGC GATCGCGGTC AACGAGGCCG AATACGGCGA GATGTGGGCC CAAGACGCCG 840CCGCGATGTT TGGCTACGCC GCGGCGACGG CGACGGCGAC GGCGACGTTG CTGCCGTTCG 900AGGAGGCGCC GGAGATGACC AGCGCGGGTG GGCTCCTCGA GCAGGCCGCC GCGGTCGAGG 960AGGCCTCCGA CACCGCCGCG GCGAACCAGT TGATGAACAA TGTGCCCCAG GCGCTGCAAC1020AGCTGGCCCA GCCCACGCAG GGCACCACGC CTTCTTCCAA GCTGGGTGGC CTGTGGAAGA1080CGGTCTCGCC GCATCGGTCG CCGATCAGCA ACATGGTGTC GATGGCCAAC AACCACATGT1140CGATGACCAA CTCGGGTGTG TCGATGACCA ACACCTTGAG CTCGATGTTG AAGGGCTTTG1200CTCCGGCGGC GGCCGCCCAG GCCGTGCAAA CCGCGGCGCA AAACGGGGTC CGGGCGATGA1260GCTCGCTGGG CAGCTCGCTG GGTTCTTCGG GTCTGGGCGG TGGGGTGGCC GCCAACTTGG1320GTCGGGCGGC CTCGGTCGGT TCGTTGTCGG TGCCGCAGGC CTGGGCCGCG GCCAACCAGG1380CAGTCACCCC GGCGGCGCGG GCGCTGCCGC TGACCAGCCT GACCAGCGCC GCGGAAAGAG1440GGCCCGGGCA GATGCTGGGC GGGCTGCCGG TGGGGCAGAT GGGCGCCAGG GCCGGTGGTG1500GGCTCAGTGG TGTGCTGCGT GTTCCGCCGC GACCCTATGT GATGCCGCAT TCTCCGGCGG1560CCGGCTAGGA GAGGGGGCGC AGACTGTCGT TATTTGACCA GTGATCGGCG GTCTCGGTGT1620TTCCGCGGCC GGCTATGACA ACAGTCAATG TGCATGACAA GTTACAGGTA TTAGGTCCAG1680GTTCAACAAG GAGACAGGCA ACATGGCCTC ACGTTTTATG ACGGATCCGC ACGCGATGCG1740GGACATGGCG GGCCGTTTTG AGGTGCACGC CCAGACGGTG GAGGACGAGG CTCGCCGGAT1800GTGGGCGTCC GCGCAAAACA TTTCCGGTGC GGGCTGGAGT GGCATGGCCG AGGCGACCTC1860GCTAGACACC ATGGCCCAGA TGAATCAGGC GTTTCGCAAC ATCGTGAACA TGCTGCACGG1920GGTGCGTGAC GGGCTGGTTC GCGACGCCAA CAACTACGAG CAGCAAGAGC AGGCCTCCCA1980GCAGATCCTC AGCAGCTAAC GTCAGCCGCT GCAGCACAAT ACTTTTACAA GCGAAGGAGA2040ACAGGTTCGA TGACCATCAA CTATCAATTC GGGGATGTCG ACGCTCACGG CGCCATGATC 2100CGCGCTCAGG CCGGGTTGCT GGAGGCCGAG CATCAGGCCA TCATTCGTGA TGTGTTGACC 2160GCGAGTGACT TTTGGGGCGG CGCCGGTTCG GCGGCCTGCC AGGGGTTCAT TACCCAGTTG 2220GGCCGTAACT TCCAGGTGAT CTACGAGCAG GCCAACGCCC ACGGGCAGAA GGTGCAGGCT 2280GCCGGCAACA ACATGGCGCA AACCGACAGC GCCGTCGGCT CCAGCTGGGC CTGACACCAG 2340GCCAAGGCCA GGGACGTGGT GTACGAGTGA AGTTCCTCGC GTGATCCTTC GGGTGGCAGT 2400CTAAGTGGTC AGTGCTGGGG TGTTGGTGGT TTGCTGCTTG GCGGGTTCTT CGGTGCTGGT 2460CAGTGCTGCT CGGGCTCGGG TGAGGACCTC GAGGCCCAGG TAGCGCCGTC CTTCGATCCA 2520TTCGTCGTGT TGTTCGGCGA GGACGGCTCC GACGAGGCGG ATGATCGAGG CGCGGTCGGG 2580GAAGATGCCC ACGACGTCGG TTCGGCGTCG TACCTCTCGG TTGAGGCGTT CCTGGGGGTT 2640GTTGGACCAG ATTTGGCGCC AGATCTGCTT GGGGAAGGCG GTGAACGCCA GCAGGTCGGT 2700GCGGGCGGTG TCGAGGTGCT CGGCCACCGC GGGGAGTTTG TCGGTCAGAG CGTCGAGTAC 2760CCGATCATAT TGGGCAACAA CTGATTCGGC GTCGGGCTGG TCGTAGATGG AGTGCAGCAG 2820GGTGCGCACC CACGGCCAGG AGGGCTTCGG GGTGGCTGCC ATCAGATTGG CTGCGTAGTG 2880GGTTCTGCAG CGCTGCCAGG CCGCTGCGGG CAGGGTGGCG CCGATCGCGG CCACCAGGCC 2940GGCGTGGGCG TCGCTGGTGA CCAGCGCGAC CCCGGACAGG CCGCGGGCGA CCAGGTCGCG 3000GAAGAACGCC AGCCAGCCGG CCCCGTCCTC GGCGGAGGTG ACCTGGATGC CCAGGATC 3058(2)SEQ ID NO107的信息(i)序列特征(A)长度391个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO107Met Val Asp Phe Gly Ala Leu Pro Pro Glu Ile Asn Ser Ala Arg Met1 5 10 15Tyr Ala Gly Pro Gly Ser Ala Ser Leu Val Ala Ala Ala Gln Met Trp20 25 30Asp Ser Val Ala Ser Asp Leu Phe Ser Ala Ala Ser Ala Phe Gln Ser35 40 45Val Val Trp Gly Leu Thr Val Gly Ser Trp Ile Gly Ser Ser Ala Gly50 55 60Leu Met Val Ala Ala Ala Ser Pro Tyr Val Ala Trp Met Ser Val Thr65 70 75 80Ala Gly Gln Ala Glu Leu Thr Ala Ala Gln Val Arg Val Ala Ala Ala85 90 95Ala Tyr Glu Thr Ala Tyr Gly Leu Thr Val Pro Pro Pro Val Ile Ala100 105 1l0Glu Asn Arg Ala Glu Leu Met Ile Leu Ile Ala Thr Asn Leu Leu Gly115 120 125Gln Asn Thr Pro Ala Ile Ala Val Asn Glu Ala Glu Tyr Gly Glu Met130 135 140Trp Ala Gln Asp Ala Ala Ala Met Phe Gly Tyr Ala Ala Ala Thr Ala145 150 155 160Thr Ala Thr Ala Thr Leu Leu Pro Phe Glu Glu Ala Pro Glu Met Thr165 170 175Ser Ala Gly Gly Leu Leu Glu Gln Ala Ala Ala Val Glu Glu Ala Ser180 185 190Asp Thr Ala Ala Ala Asn Gln Leu Met Asn Asn Val Pro Gln Ala Leu195 200 205Gln Gln Leu Ala Gln Pro Thr Gln Gly Thr Thr Pro Ser Ser Lys Leu210 215 220Gly Gly Leu Trp Lys Thr Val Ser Pro His Arg Ser Pro Ile Ser Asn225 230 235 240Met Val Ser Met Ala Asn Asn His Met Ser Met Thr Asn Ser Gly Val245 250 255Ser Met Thr Asn Thr Leu Ser Ser Met Leu Lys Gly Phe Ala Pro Ala260 265 270Ala Ala Ala Gln Ala Val Gln Thr Ala Ala Gln Asn Gly Val Arg Ala275 280 285Met Ser Ser Leu Gly Ser Ser Leu Gly Ser Ser Gly Leu Gly Gly Gly290 295 300Val Ala Ala Asn Leu Gly Arg Ala Ala Ser Val Gly Ser Leu Ser Val305 310 315 320Pro Gln Ala Trp Ala Ala Ala Asn Gln Ala Val Thr Pro Ala Ala Arg325 330 335Ala Leu Pro Leu Thr Ser Leu Thr Ser Ala Ala Glu Arg Gly Pro Gly340 345 350Gln Met Leu Gly Gly Leu Pro Val Gly Gln Met Gly Ala Arg Ala Gly355 360 365Gly Gly Leu Ser Gly Val Leu Arg Val Pro Pro Arg Pro Tyr Val Met370 375 380Pro His Ser Pro Ala Ala Gly385 390(2)SEQ ID NO108的信息(i)序列特征(A)长度l725个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO108GACGTCAGCA CCCGCCGTGC AGGGCTGGAG CGTGGTCGGT TTTGATCTGC GGTCAAGGTG60ACGTCCCTCG GCGTGTCGCC GGCGTGGATG CAGACTCGAT GCCGCTCTTT AGTGCAACTA 120ATTTCGTTGA AGTGCCTGCG AGGTATAGGA CTTCACGATT GGTTAATGTA GCGTTCACCC 180CGTGTTGGGG TCGATTTGGC CGGACCAGTC GTCACCAACG CTTGGCGTGC GCGCCAGGCG 240GGCGATCAGA TCGCTTGACT ACCAATCAAT CTTGAGCTCC CGGGCCGATG CTCGGGCTAA 300ATGAGGAGGA GCACGCGTGT CTTTCACTGC GCAACCGGAG ATGTTGGCGG CCGCGGCTGG 360CGAACTTCGT TCCCTGGGGG CAACGCTGAA GGCTAGCAAT GCCGCCGCAG CCGTGCCGAC 420GACTGGGGTG GTGCCCCCGG CTGCCGACGA GGTGTCGCTG CTGCTTGCCA CACAATTCCG 480TACGCATGCG GCGACGTATC AGACGGCCAG CGCCAAGGCC GCGGTGATCC ATGAGCAGTT 540TGTGACCACG CTGGCCACCA GCGCTAGTTC ATATGCGGAC ACCGAGGCCG CCAACGCTGT 600GGTCACCGGC TAGCTGACCT GACGGTATTC GAGCGGAAGG ATTATCGAAG TGGTGGATTT 660CGGGGCGTTA CCACCGGAGA TCAACTCCGC GAGGATGTAC GCCGGCCCGG GTTCGGCCTC 720GCTGGTGGCC GCCGCGAAGA TGTGGGACAG CGTGGCGAGT GACCTGTTTT CGGCCGCGTC 780GGCGTTTCAG TCGGTGGTCT GGGGTCTGAC GGTGGGGTCG TGGATAGGTT CGTCGGCGGG 840TCTGATGGCG GCGGCGGCCT CGCCGTATGT GGCGTGGATG AGCGTCACCG CGGGGCAGGC 900CCAGCTGACC GCCGCCCAGG TCCGGGTTGC TGCGGCGGCC TACGAGACAG CGTATAGGCT 960GACGGTGCCC CCGCCGGTGA TCGCCGAGAA CCGTACCGAA CTGATGACGC TGACCGCGAC 1020CAACCTCTTG GGGCAAAACA CGCCGGCGAT CGAGGCCAAT CAGGCCGCAT ACAGCCAGAT 1080GTGGGGCCAA GACGCGGAGG CGATGTATGG CTACGCCGCC ACGGCGGCGA CGGCGACCGA 1140GGCGTTGCTG CCGTTCGAGG ACGCCCCACT GATCACCAAC CCCGGCGGGC TCCTTGAGCA 1200GGCCGTCGCG GTCGAGGAGG CCATCGACAC CGCCGCGGCG AACCAGTTGA TGAACAATGT 1260GCCCCAAGCG CTGCAACAGC TGGCCCAGCC AGCGCAGGGC GTCGTACCTT CTTCCAAGCT 1320GGGTGGGCTG TGGACGGCGG TCTCGCCGCA TCTGTCGCCG CTCAGCAACG TCAGTTCGAT 1380AGCCAACAAC CACATGTCGA TGATGGGCAC GGGTGTGTCG ATGACCAACA CCTTGCACTC 1440GATGTTGAAG GGCTTAGCTC CGGCGGCGGC TCAGGCCGTG GAAACCGCGG CGGAAAACGG 1500GGTCTGGGCG ATGAGCTCGC TGGGCAGCCA GCTGGGTTCG TCGCTGGGTT CTTCGGGTCT 1560GGGCGCTGGG GTGGCCGCCA ACTTGGGTCG GGCGGCCTCG GTCGGTTCGT TGTCGGTGCC 1620GCCAGCATGG GCCGCGGCCA ACCAGGCGGT CACCCCGGCG GCGCGGGCGC TGCCGCTGAC 1680CAGCCTGACC AGCGCCGCCC AAACCGCCCC CGGACACATG CTGGG 1725(2)SEQ ID NO109的信息(i)序列特征(A)长度359个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO109Val Val Asp Phe Gly Ala Leu Pro Pro Glu Ile Asn Ser Ala Arg Met1 5 10 15Tyr Ala Gly Pro Gly Ser Ala Ser Leu Val Ala Ala Ala Lys Met Trp20 25 30Asp Ser Val Ala Ser Asp Leu Phe Ser Ala Ala Ser Ala Phe Gln Ser35 40 45Val Val Trp Gly Leu Thr Val Gly Ser Trp Ile Gly Ser Ser Ala Gly50 55 60Leu Met Ala Ala Ala Ala Ser Pro Tyr Val Ala Trp Met Ser Val Thr65 70 75 80Ala Gly Gln Ala Gln Leu Thr Ala Ala Gln Val Arg Val Ala Ala Ala85 90 95Ala Tyr Glu Thr Ala Tyr Arg Leu Thr Val Pro Pro Pro Val Ile Ala100 105 110Glu Asn Arg Thr Glu Leu Met Thr Leu Thr Ala Thr Asn Leu Leu Gly115 120 125Gln Asn Thr Pro Ala Ile Glu Ala Asn Gln Ala Ala Tyr Ser Gln Met130 135 140Trp Gly Gln Asp Ala Glu Ala Met Tyr Gly Tyr Ala Ala Thr Ala Ala145 150 155 160Thr Ala Thr Glu Ala Leu Leu Pro Phe Glu Asp Ala Pro Leu Ile Thr165 170 175Asn Pro Gly Gly Leu Leu Glu Gln Ala Val Ala Val Glu Glu Ala Ile180 185 190Asp Thr Ala Ala Ala Asn Gln Leu Met Asn Asn Val Pro Gln Ala Leu195 200 205Gln Gln Leu Ala Gln Pro Ala Gln Gly Val Val Pro Ser Ser Lys Leu210 215 220Gly Gly Leu Trp Thr Ala Val Ser Pro His Leu Ser Pro Leu Ser Asn225 230 235 240Val Ser Ser Ile Ala Asn Asn His Met Ser Met Met Gly Thr Gly Val245 250 255Ser Met Thr Asn Thr Leu His Ser Met Leu Lys Gly Leu Ala Pro Ala260 265 270Ala Ala Gln Ala Val Glu Thr Ala Ala Glu Asn Gly Val Trp Ala Met275 280 285Ser Ser Leu Gly Ser Gln Leu Gly Ser Ser Leu Gly Ser Ser Gly Leu290 295 300Gly Ala Gly Val Ala Ala Asn Leu Gly Arg Ala Ala Ser Val Gly Ser305 310 315 320Leu Ser Val Pro Pro Ala Trp Ala Ala Ala Asn Gln Ala Val Thr Pro325 330 335Ala Ala Arg Ala Leu Pro Leu Thr Ser Leu Thr Ser Ala Ala Gln Thr340 345 350Ala Pro Gly His Met Leu Gly355(2)SEQ ID NO110的信息(i)序列特征(A)长度3027个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO110AGTTCAGTCG AGAATGATAC TGACGGGCTG TATCCACGAT GGCTGAGACA ACCGAACCAC 60CGTCGGACGC GGGGACATCG CAAGCCGACG CGATGGCGTT GGCCGCCGAA GCCGAAGCCG120CCGAAGCCGA AGCGCTGGCC GCCGCGGCGC GGGCCCGTGC CCGTGCCGCC CGGTTGAAGC180GTGAGGCGCT GGCGATGGCC CCAGCCGAGG ACGAGAACGT CCCCGAGGAT ATGCAGACTG240GGAAGACGCC GAAGACTATG ACGACTATGA CGACTATGAG GCCGCAGACC AGGAGGCCGC300ACGGTCGGCA TCCTGGCGAC GGCGGTTGCG GGTGCGGTTA CCAAGACTGT CCACGATTGC360CATGGCGGCC GCAGTCGTCA TCATCTGCGG CTTCACCGGG CTCAGCGGAT ACATTGTGTG420GCAACACCAT GAGGCCACCG AACGCCAGCA GCGCGCCGCG GCGTTCGCCG CCGGAGCCAA480GCAAGGTGTC ATCAACATGA CCTCGCTGGA CTTCAACAAG GCCAAAGAAG ACGTCGCGCG540TGTGATCGAC AGCTCCACCG GCGAATTCAG GGATGACTTC CAGCAGCGGG CAGCCGATTT 600CACCAAGGTT GTCGAACAGT CCAAAGTGGT CACCGAAGGC ACGGTGAACG CGACAGCCGT 660CGAATCCATG AACGAGCATT CCGCCGTGGT GCTCGTCGCG GCGACTTCAC GGGTCACCAA 720TTCCGCTGGG GCGAAAGACG AACCACGTGC GTGGCGGCTC AAAGTGACCG TGACCGAAGA 780GGGGGGACAG TACAAGATGT CGAAAGTTGA GTTCGTACCG TGACCGATGA CGTACGCGAC 840GTCAACACCG AAACCACTGA CGCCACCGAA GTCGCTGAGA TCGACTCAGC CGCAGGCGAA 900GCCGGTGATT CGGCGACCGA GGCATTTGAC ACCGACTCTG CAACGGAATC TACCGCGCAG 960AAGGGTCAGC GGCACCGTGA CCTGTGGCGA ATGCAGGTTA CCTTGAAACC CGTTCCGGTG1020ATTCTCATCC TGCTCATGTT GATCTCTGGG GGCGCGACGG GATGGCTATA CCTTGAGCAA1080TACGACCCGA TCAGCAGACG GACTCCGGCG CCGCCCGTGC TGCCGTCGCC GCGGCGTCTG1140ACGGGACAAT CGCGCTGTTG TGTATTCACC CGACACGTCG ACCAAGACTT CGCTACCGCC1200AGGTCGCACC TCGCCGGCGA TTTCCTGTCC TATACGACCA GTTCACGCAG CAGATCGTGG1260CTCCGGCGGC CAAACAGAAG TCACTGAAAA CCACCGCCAA GGTGGTGCGC GCGGCCGTGT1320CGGAGCTACA TCCGGATTCG GCCGTCGTTC TGGTTTTTGT CGACCAGAGC ACTACCAGTA1380AGGACAGCCC CAATCCGTCG ATGGCGGCCA GCAGCGTGAT GGTGACCCTA GCCAAGGTCG1440ACGGCAATTG GCTGATCACC AAGTTCACCC CGGTTTAGGT TGCCGTAGGC GGTCGCCAAG1500TCTGACGGGG GCGCGGGTGG CTGCTCGTGC GAGATACCGG CCGTTCTCCG GACAATCACG1560GCCCGACCTC AAACAGATCT CGGCCGCTGT CTAATCGGCC GGGTTATTTA AGATTAGTTG1620CCACTGTATT TACCTGATGT TCAGATTGTT CAGCTGGATT TAGCTTCGCG GCAGGGCGGC1680TGGTGCACTT TGCATCTGGG GTTGTGACTA CTTGAGAGAA TTTGACCTGT TGCCGACGTT1740GTTTGCTGTC CATCATTGGT GCTAGTTATG GCCGAGCGGA AGGATTATCG AAGTGGTGGA1800CTTCGGGGCG TTACCACCGG AGATCAACTC CGCGAGGATG TACGCCGGCC CGGGTTCGGC1860CTCGCTGGTG GCCGCCGCGA AGATGTGGGA CAGCGTGGCG AGTGACCTGT TTTCGGCCGC1920GTCGGCGTTT CAGTCGGTGG TCTGGGGTCT GACGACGGGA TCGTGGATAG GTTCGTCGGC1980GGGTCTGATG GTGGCGGCGG CCTCGCCGTA TGTGGCGTGG ATGAGCGTCA CCGCGGGGCA2040GGCCGAGCTG ACCGCCGCCC AGGTCCGGGT TGCTGCGGCG GCCTACGAGA CGGCGTATGG2100GCTGACGGTG CCCCCGCCGG TGATCGCCGA GAACCGTGCT GAACTGATGA TTCTGATAGC2160GACCAACCTC TTGGGGCAAA ACACCCCGGC GATCGCGGTC AACGAGGCCG AATACGGGGA2220GATGTGGGCC CAAGACGCCG CCGCGATGTT TGGCTACGCC GCCACGGCGG CGACGGCGAC2280CGAGGCGTTG CTGCCGTTCG AGGACGCCCC ACTGATCACC AACCCCGGCG GGCTCCTTGA2340GCAGGCCGTC GCGGTCGAGG AGGCCATCGA CACCGCCGCG GCGAACCAGT TGATGAACAA2400TGTGCCCCAA GCGCTGCAAC AACTGGCCCA GCCCACGAAA AGCATCTGGC CGTTCGACCA2460ACTGAGTGAA CTCTGGAAAG CCATCTCGCC GCATCTGTCG CCGCTCAGCA ACATCGTGTC2520GATGCTCAAC AACCACGTGT CGATGACCAA CTCGGGTGTG TCGATGGCCA GCACCTTGCA2580CTCAATGTTG AAGGGCTTTG CTCCGGCGGC GGCTCAGGCC GTGGAAACCG CGGCGCAAAA2640CGGGGTCCAG GCGATGAGCT CGCTGGGCAG CCAGCTGGGT TCGTCGCTGG GTTCTTCGGG2700TCTGGGCGCT GGGGTGGCCG CCAACTTGGG TCGGGCGGCC TCGGTCGGTT CGTTGTCGGT2760GCCGCAGGCC TGGGCCGCGG CCAACCAGGC GGTCACCCCG GCGGCGCGGG CGCTGCCGCT2820GACCAGCCTG ACCAGCGCCG CCCAAACCGC CCCCGGACAC ATGCTGGGCG GGCTACCGCT2880GGGGCAACTG ACCAATAGCG GCGGCGGGTT CGGCGGGGTT AGCAATGCGT TGCGGATGCC2940GCCGCGGGCG TACGTAATGC CCCGTGTGCC CGCCGCCGGG TAACGCCGAT CCGCACGCAA3000TGCGGGCCCT CTATGCGGGC AGCGATC3027(2)SEQ ID NO111的信息(i)序列特征(A)长度396个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO111Val Val Asp Phe Gly Ala Leu Pro Pro Glu Ile Asn Ser Ala Arg Met1 5 10 15Tyr Ala Gly Pro Gly Ser Ala Ser Leu Val Ala Ala Ala Lys Met Trp20 25 30Asp Ser Val Ala Ser Asp Leu Phe Ser Ala Ala Ser Ala Phe Gln Ser35 40 45Val Val Trp Gly Leu Thr Thr Gly Ser Trp Ile Gly Ser Ser Ala Gly50 55 60Leu Met Val Ala Ala Ala Ser Pro Tyr Val Ala Trp Met Ser Val Thr65 70 75 80Ala Gly Gln Ala Glu Leu Thr Ala Ala Gln Val Arg Val Ala Ala Ala85 90 95Ala Tyr Glu Thr Ala Tyr Gly Leu Thr Val Pro Pro Pro Val Ile Ala100 105 110Glu Asn Arg Ala Glu Leu Met Ile Leu Ile Ala Thr Asn Leu Leu Gly115 120 125Gln Asn Thr Pro Ala Ile Ala Val Asn Glu Ala Glu Tyr Gly Glu Met
130 135 140Trp Ala Gln Asp Ala Ala Ala Met Phe Gly Tyr Ala Ala Thr Ala Ala145 150 155 160Thr Ala Thr Glu Ala Leu Leu Pro Phe Glu Asp Ala Pro Leu Ile Thr165 170 175Asn Pro Gly Gly Leu Leu Glu Gln Ala Val Ala Val Glu Glu Ala Ile180 185 190Asp Thr Ala Ala Ala Asn Gln Leu Met Asn Asn Val Pro Gln Ala Leu195 200 205Gln Gln Leu Ala Gln Pro Thr Lys Ser Ile Trp Pro Phe Asp Gln Leu210 215 220Ser Glu Leu Trp Lys Ala Ile Ser Pro His Leu Ser Pro Leu Ser Asn225 230 235 240Ile Val Ser Met Leu Asn Asn His Val Ser Met Thr Asn Ser Gly Val245 250 255Ser Met Ala Ser Thr Leu His Ser Met Leu Lys Gly Phe Ala Pro Ala260 265 270Ala Ala Gln Ala Val Glu Thr Ala Ala Gln Asn Gly Val Gln Ala Met275 280 285Ser Ser Leu Gly Ser Gln Leu Gly Ser Ser Leu Gly Ser Ser Gly Leu290 295 300Gly Ala Gly Val Ala Ala Asn Leu Gly Arg Ala Ala Ser Val Gly Ser305 310 315 320Leu Ser Val Pro Gln Ala Trp Ala Ala Ala Asn Gln Ala Val Thr Pro325 330 335Ala Ala Arg Ala Leu Pro Leu Thr Ser Leu Thr Ser Ala Ala Gln Thr340 345 350Ala Pro Gly His Met Leu Gly Gly Leu Pro Leu Gly Gln Leu Thr Asn355 360 365Ser Gly Gly Gly Phe Gly Gly Val Ser Asn Ala Leu Arg Met Pro Pro370 375 380Arg Ala Tyr Val Met Pro Arg Val Pro Ala Ala Gly385 390 395(2)SEQ ID NO112的信息(i)序列特征(A)长度1616个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO112CATCGGAGGG AGTGATCACC ATGCTGTGGC ACGCAATGCC ACCGGAGTAA ATACCGCACG 60GCTGATGGCC GGCGCGGGTC CGGCTCCAAT GCTTGCGGCG GCCGCGGGAT GGCAGACGCT 120TTCGGCGGCT CTGGACGCTC AGGCCGTCGA GTTGACCGCG CGCCTGAACT CTCTGGGAGA 180AGCCTGGACT GGAGGTGGCA GCGACAAGGC GCTTGCGGCT GCAACGCCGA TGGTGGTCTG 240GCTACAAACC GCGTCAACAC AGGCCAAGAC CCGTGCGATG CAGGCGACGG CGCAAGCCGC 300GGCATACACC CAGGCCATGG CCACGACGCC GTCGCTGCCG GAGATCGCCG CCAACCACAT 360CACCCAGGCC GTCCTTACGG CCACCAACTT CTTCGGTATC AACACGATCC CGATCGCGTT 420GACCGAGATG GATTATTTCA TCCGTATGTG GAACCAGGCA GCCCTGGCAA TGGAGGTCTA 480CCAGGCCGAG ACCGCGGTTA ACACGCTTTT CGAGAAGCTC GAGCCGATGG CGTCGATCCT 540TGATCCCGGC GCGAGCCAGA GCACGACGAA CCCGATCTTC GGAATGCCCT CCCCTGGCAG 600CTCAACACCG GTTGGCCAGT TGCCGCCGGC GGCTACCCAG ACCCTCGGCC AACTGGGTGA 660GATGAGCGGC CCGATGCAGC AGCTGACCCA GCCGCTGCAG CAGGTGACGT CGTTGTTCAG 720CCAGGTGGGC GGCACCGGCG GCGGCAACCC AGCCGACGAG GAAGCCGCGC AGATGGGCCT 780GCTCGGCACC AGTCCGCTGT CGAACCATCC GCTGGCTGGT GGATCAGGCC CCAGCGCGGG 840CGCGGGCCTG CTGCGCGCGG AGTCGCTACC TGGCGCAGGT GGGTCGTTGA CCCGCACGCC 900GCTGATGTCT CAGCTGATCG AAAAGCCGGT TGCCCCCTCG GTGATGCCGG CGGCTGCTGC 960CGGATCGTCG GCGACGGGTG GCGCCGCTCC GGTGGGTGCG GGAGCGATGG GCCAGGGTGC1020GCAATCCGGC GGCTCCACCA GGCCGGGTCT GGTCGCGCCG GCACCGCTCG CGCAGGAGCG1080TGAAGAAGAC GACGAGGACG ACTGGGACGA AGAGGACGAC TGGTGAGCTC CCGTAATGAC1140AACAGACTTC CCGGCCACCC GGGCCGGAAG ACTTGCCAAC ATTTTGGCGA GGAAGGTAAA1200GAGAGAAAGT AGTCCAGCAT GGCAGAGATG AAGACCGATG CCGCTACCCT CGCGCAGGAG1260GCAGGTAATT TCGAGCGGAT CTCCGGCGAC CTGAAAACCC AGATCGACCA GGTGGAGTCG1320ACGGCAGGTT CGTTGCAGGG CCAGTGGCGC GGCGCGGCGG GGACGGCCGC CCAGGCCGCG1380GTGGTGCGCT TCCAAGAAGC AGCCAATAAG CAGAAGCAGG AACTCGACGA GATCTCGACG1440AATATTCGTC AGGCCGGCGT CCAATACTCG AGGGCCGACG AGGAGCAGCA GCAGGCGCTG1500TCCTCGCAAA TGGGCTTCTG ACCCGCTAAT ACGAAAAGAA ACGGAGCAAA AACATGACAG1560AGCAGCAGTG GAATTTCGCG GGTATCGAGG CCGCGGCAAG CGCAATCCAG GGAAAT1616(2)SEQ ID NO113的信息(i)序列特征(A)长度432个碱基对(B)类型核酸
(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO113CTAGTGGATG GGACCATGGC CATTTTCTGC AGTCTCACTG CCTTCTGTGT TGACATTTTG 60GCACGCCGGC GGAAACGAAG CACTGGGGTC GAAGAACGGC TGCGCTGCCA TATCGTCCGG 120AGCTTCCATA CCTTCGTGCG GCCGGAAGAG CTTGTCGTAG TCGGCCGCCA TGACAACCTC 180TCAGAGTGCG CTCAAACGTA TAAACACGAG AAAGGGCGAG ACCGACGGAA GGTCGAACTC 240GCCCGATCCC GTGTTTCGCT ATTCTACGCG AACTCGGCGT TGCCCTATGC GAACATCCCA 300GTGACGTTGC CTTCGGTCGA AGCCATTGCC TGACCGGCTT CGCTGATCGT CCGCGCCAGG 360TTCTGCAGCG CGTTGTTCAG CTCGGTAGCC GTGGCGTCCC ATTTTTGCTG GACACCCTGG 420TACGCCTCCG AA 432(2)SEQ ID NO114的信息(i)序列特征(A)长度368个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO114Met Leu Trp His Ala Met Pro Pro Glu Xaa Asn Thr Ala Arg Leu Met1 5 10 15Ala Gly Ala Gly Pro Ala Pro Met Leu Ala Ala Ala Ala Gly Trp Gln20 25 30Thr Leu Ser Ala Ala Leu Asp Ala Gln Ala Val Glu Leu Thr Ala Arg35 40 45Leu Asn Ser Leu Gly Glu Ala Trp Thr Gly Gly Gly Ser Asp Lys Ala50 55 60Leu Ala Ala Ala Thr Pro Met Val Val Trp Leu Gln Thr Ala Ser Thr65 70 75 80Gln Ala Lys Thr Arg Ala Met Gln Ala Thr Ala Gln Ala Ala Ala Tyr85 90 95Thr Gln Ala Met Ala Thr Thr Pro Ser Leu Pro Glu Ile Ala Ala Asn100 105 110His Ile Thr Gln Ala Val Leu Thr Ala Thr Asn Phe Phe Gly Ile Asn115 120 125Thr Ile Pro Ile Ala Leu Thr Glu Met Asp Tyr Phe Ile Arg Met Trp130 135 140Asn Gln Ala Ala Leu Ala Met Glu Val Tyr Gln Ala Glu Thr Ala Val145 150 155 160Asn Thr Leu Phe Glu Lys Leu Glu Pro Met Ala Ser Ile Leu Asp Pro165 170 175Gly Ala Ser Gln Ser Thr Thr Asn Pro Ile Phe Gly Met Pro Ser Pro180 185 190Gly Ser Ser Thr Pro Val Gly Gln Leu Pro Pro Ala Ala Thr Gln Thr195 200 205Leu Gly Gln Leu Gly Glu Met Ser Gly Pro Met Gln Gln Leu Thr Gln210 215 220Pro Leu Gln Gln Val Thr Ser Leu Phe Ser Gln Val Gly Gly Thr Gly225 230 235 240Gly Gly Asn Pro Ala Asp Glu Glu Ala Ala Gln Met Gly Leu Leu Gly245 250 255Thr Ser Pro Leu Ser Asn His Pro Leu Ala Gly Gly Ser Gly Pro Ser260 265 270Ala Gly Ala Gly Leu Leu Arg Ala Glu Ser Leu Pro Gly Ala Gly Gly275 280 285Ser Leu Thr Arg Thr Pro Leu Met Ser Gln Leu Ile Glu Lys Pro Val290 295 300Ala Pro Ser Val Met Pro Ala Ala Ala Ala Gly Ser Ser Ala Thr Gly305 310 315 320Gly Ala Ala Pro Val Gly Ala Gly Ala Met Gly Gln Gly Ala Gln Ser325 330 335Gly Gly Ser Thr Arg Pro Gly Leu Val Ala Pro Ala Pro Leu Ala Gln340 345 350Glu Arg Glu Glu Asp Asp Glu Asp Asp Trp Asp Glu Glu Asp Asp Trp355 360 365(2)SEQ ID NO115的信息(i)序列特征(A)长度100个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO115Met Ala Glu Met Lys Thr Asp Ala Ala Thr Leu Ala Gln Glu Ala Gly1 5 10 15Asn Phe Glu Arg Ile Ser Gly Asp Leu Lys Thr Gln Ile Asp Gln Val20 25 30Glu Ser Thr Ala Gly Ser Leu Gln Gly Gln Trp Arg Gly Ala Ala Gly35 40 45Thr Ala Ala Gln Ala Ala Val Val Arg Phe Gln Glu Ala Ala Asn Lys50 55 60Gln Lys Gln Glu Leu Asp Glu Ile Ser Thr Asn Ile Arg Gln Ala Gly65 70 75 80Val Gln Tyr Ser Arg Ala Asp Glu Glu Gln Gln Gln Ala Leu Ser Ser85 90 95Gln Met Gly Phe100(2)SEQ ID NO116的信息(i)序列特征(A)长度396个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO116GATCTCCGGC GACCTGAAAA CCCAGATCGA CCAGGTGGAG TCGACGGCAG GTTCGTTGCA 60GGGCCAGTGG CGCGGCGCGG CGGGGACGGC CGCCCAGGCC GCGGTGGTGC GCTTCCAAGA 120AGCAGCCAAT AAGCAGAAGC AGGAACTCGA CGAGATCTCG ACGAATATTC GTCAGGCCGG 180CGTCCAATAC TCGAGGGCCG ACGAGGAGCA GCAGCAGGCG CTGTCCTCGC AAATGGGCTT 240CTGACCCGCT AATACGAAAA GAAACGGAGC AAAAACATGA CAGAGCAGCA GTGGAATTTC 300GCGGGTATCG AGGCCGCGGC AAGCGCAATC CAGGGAAATG TCACGTCCAT TCATTCCCTC 360CTTGACGAGG GGAAGCAGTC CCTGACCAAG CTCGCA 396(2)SEQ ID NO117的信息(i)序列特征(A)长度80个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO117Ile Ser Gly Asp Leu Lys Thr Gln Ile Asp Gln Val Glu Ser Thr Ala1 5 10 15Gly Ser Leu Gln Gly Gln Trp Arg Gly Ala Ala Gly Thr Ala Ala Gln20 25 30Ala Ala Val Val Arg Phe Gln Glu Ala Ala Asn Lys Gln Lys Gln Glu35 40 45Leu Asp Glu Ile Ser Thr Asn Ile Arg Gln Ala Gly Val Gln Tyr Ser50 55 60Arg Ala Asp Glu Glu Gln Gln Gln Ala Leu Ser Ser Gln Met Gly Phe65 70 75 80(2)SEQ ID NO118的信息(i)序列特征(A)长度387个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO118GTGGATCCCG ATCCCGTGTT TCGCTATTCT ACGCGAACTC GGCGTTGCCC TATGCGAACA 60TCCCAGTGAC GTTGCCTTCG GTCGAAGCCA TTGCCTGACC GGCTTCGCTG ATCGTCCGCG 120CCAGGTTCTG CAGCGCGTTG TTCAGCTCGG TAGCCGTGGC GTCCCATTTT TGCTGGACAC 180CCTGGTACGC CTCCGAACCG CTACCGCCCC AGGCCGCTGC GAGCTTGGTC AGGGACTGCT 240TCCCCTCGTC AAGGAGGGAA TGAATGGACG TGACATTTCC CTGGATTGCG CTTGCCGCGG 300CCTCGATACC CGCGAAATTC CACTGCTGCT CTGTCATGTT TTTGCTCCGT TTCTTTTCGT 360ATTAGCGGGT CAGAAGCCCA TTTGCGA 387(2)SEQ ID NO119的信息(i)序列特征(A)长度272个碱基对(B)类型核酸(C)链数单链
(D)拓扑学线性(xi)序列描述SEQ ID NO119CGGCACGAGG ATCTCGGTTG GCCCAACGGC GCTGGCGAGG GCTCCGTTCC GGGGGCGAGC 60TGCGCGCCGG ATGCTTCCTC TGCCCGCAGC CGCGCCTGGA TGGATGGACC AGTTGCTACC120TTCCCGACGT TTCGTTCGGT GTCTGTGCGA TAGCGGTGAC CCCGGCGCGC ACGTCGGGAG180TGTTGGGGGG CAGGCCGGGT CGGTGGTTCG GCCGGGGACG CAGACGGTCT GGACGGAACG240GGCGGGGGTT CGCCGATTGG CATCTTTGCC CA 272(2)SEQ ID NO120的信息(i)序列特征(A)长度20个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO120Asp Pro Val Asp Ala Val Ile Asn Thr Thr Cys Asn Tyr Gly Gln Val1 5 10 15Val Ala Ala Leu20(2)SEQ ID NO121的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO121Ala Val Glu Ser Gly Met Leu Ala Leu Gly Thr Pro Ala Pro Ser1 5 10 15(2)SEQ ID NO122的信息(i)序列特征(A)长度19个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO122Ala Ala Met Lys Pro Arg Thr Gly Asp Gly Pro Leu Glu Ala Ala Lys1 5 10 15Glu Gly Arg(2)SEQ ID NO123的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO123Tyr Tyr Tro Cys Pro Gly Gln Pro Phe Asp Pro Ala Trp Gly Pro1 5 10 15(2)SEQ ID NO124的信息(i)序列特征(A)长度14个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO124Asp Ile Gly Ser Glu Ser Thr Glu Asp Gln Gln Xaa Ala Val1 5 10(2)SEQ ID NO125的信息(i)序列特征(A)长度13个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO125Ala Glu Glu Ser Ile Ser Thr Xaa Glu Xaa Ile Val Pro1 5 10(2)SEQ ID NO126的信息(i)序列特征(A)长度17个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO126Aso Pro Glu Pro Ala Pro Pro Val Pro Thr Thr Ala Ala Ser pro Pro1 5 10 15Ser(2)SEQ ID NO127的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO127Ala Pro Lys Thr Tyr Xaa Glu Glu Leu Lys Gly Thr Asp Thr Gly1 5 10 15(2)SEQ ID NO128的信息(i)序列特征(A)长度30个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO128Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln Leu Thr Ser1 5 10 15Leu Leu Asn Ser Leu Ala Asp Pro Asn Val Ser Phe Ala Asn20 25 30(2)SEQ ID NO129的信息(i)序列特征(A)长度22个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO129Asp Pro Pro Asp Pro His Gln Xaa Asp Met Thr Lys Gly Tyr Tyr Pro1 5 10 15Gly Gly Arg Arg Xaa Phe20(2)SEQ ID NO130的信息(i)序列特征(A)长度7个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO130Asp Pro Gly Tyr Thr Pro Gly1 5(2)SEQ ID NO131的信息(i)序列特征(A)长度10个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(ix)特征(D)其它信息/注＝＂第二个残基可以是Pro或Thr＂(xi)序列描述SEQ ID NO131Xaa Xaa Gly Phe Thr Gly Pro Gln Phe Tyr1 5 10(2)SEQ ID NO132的信息(i)序列特征(A)长度9个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(ix)特征(D)其它信息/注＝＂第二个残基可以是Gln或Leu＂(xi)序列描述SEQ ID NO132Xaa Pro Xaa Val Thr Ala Tyr Ala Gly1 5(2)SEQ ID NO133的信息
(i)序列特征(A)长度9个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO133Xaa Xaa Xaa Glu Lys Pro Phe Leu Arg1 5(2)SEQ ID NO134的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO134Xaa Asp Ser Glu Lys Ser Ala Thr Ile Lys Val Thr Asp Ala Ser1 5 10 15(2)SEQ ID NO135的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO135Ala Gly Asp Thr Xaa Ile Tyr Ile Val Gly Asn Leu Thr Ala Asp1 5 10 15(2)SEQ ID NO136的信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO136Ala Pro Glu Ser Gly Ala Gly Leu Gly Gly Thr Val Gln Ala Gly1 5 10 15(2)SEQ ID NO137的信息(i)序列特征(A)长度21个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO137Xaa Tyr Ile Ala Tyr Xaa Thr Thr Ala Gly Ile Val Pro Gly Lys Ile1 5 10 15Asn Val His Leu Val20(2)SEQ ID NO138的信息(i)序列特征(A)长度882个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO138GCAACGCTGT CGTGGCCTTT GCGGTGATCG GTTTCGCCTC GCTGGCGGTG GCGGTGGCGG 60TCACCATCCG ACCGACCGCG GCCTCAAAAC CGGTAGAGGG ACACCAAAAC GCCCAGCCAG 120GGAAGTTCAT GCCGTTGTTG CCGACGCAAC AGCAGGCGCC GGTCCCGCCG CCTCCGCCCG 180ATGATCCCAC CGCTGGATTC CAGGGCGGCA CCATTCCGGC TGTACAGAAC GTGGTGCCGC 240GGCCGGGTAC CTCACCCGGG GTGGGTGGGA CGCCGGCTTC GCCTGCGCCG GAAGCGCCGG 300CCGTGCCCGG TGTTGTGCCT GCCCCGGTGC CAATCCCGGT CCCGATCATC ATTCCCCCGT 360TCCCGGGTTG GCAGCCTGGA ATGCCGACCA TCCCCACCGC ACCGCCGACG ACGCCGGTGA 420CCACGTCGGC GACGACGCCG CCGACCACGC CGCCGACCAC GCCGGTGACC ACGCCGCCAA 480CGACGCCGCC GACCACGCCG GTGACCACGC CGCCAACGAC GCCGCCGACC ACGCCGGTGA 540CCACGCCACC AACGACCGTC GCCCCGACGA CCGTCGCCCC GACGACGGTC GCTCCGACCA 600CCGTCGCCCC GACCACGGTC GCTCCAGCCA CCGCCACGCC GACGACCGTC GCTCCGCAGC 660CGACGCAGCA GCCCACGCAA CAACCAACCC AACAGATGCC AACCCAGCAG CAGACCGTGG 720CCCCGCAGAC GGTGGCGCCG GCTCCGCAGC CGCCGTCCGG TGGCCGCAAC GGCAGCGGCG 780GGGGCGACTT ATTCGGCGGG TTCTGATCAC GGTCGCGGCT TCACTACGGT CGGAGGACAT 840GGCCGGTGAT GCGGTGACGG TGGTGCTGCC CTGTCTCAAC GA 882(2)SEQ ID NO139的信息(i)序列特征(A)长度815个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO139CCATCAACCA ACCGCTCGCG CCGCCCGCGC CGCCGGATCC GCCGTCGCCG CCACGCCCGC60CGGTGCCTCC GGTGCCCCCG TTGCCGCCGT CGCCGCCGTC GCCGCCGACC GGCTGGGTGC 120CTAGGGCGCT GTTACCGCCC TGGTTGGCGG GGACGCCGCC GGCACCACCG GTACCGCCGA 180TGGCGCCGTT GCCGCCGGCG GCACCGTTGC CACCGTTGCC ACCGTTGCCA CCGTTGCCGA 240CCAGCCACCC GCCGCGACCA CCGGCACCGC CGGCGCCGCC CGCACCGCCG GCGTGCCCGT 300TCGTGCCCGT ACCGCCGGCA CCGCCGTTGC CGCCGTCACC GCCGACGGAA CTACCGGCGG 360ACGCGGCCTG CCCGCCGGCG CCGCCCGCAC CGCCATTGGC ACCGCCGTCA CCGCCGGCTG 420GGAGTGCCGC GATTAGGGCA CTGACCGGCG CAACCAGCGC AAGTACTCTC GGTCACCGAG 480CACTTCCAGA CGACACCACA GCACGGGGTT GTCGGCGGAC TGGGTGAAAT GGCAGCCGAT 540AGCGGCTAGC TGTCGGCTGC GGTCAACCTC GATCATGATG TCGAGGTGAC CGTGACCGCG 600CCCCCCGAAG GAGGCGCTGA ACTCGGCGTT GAGCCGATCG GCGATCGGTT GGGGCAGTGC 660CCAGGCCAAT ACGGGGATAC CGGGTGTCNA AGCCGCCGCG AGCGCAGCTT CGGTTGCGCG 720ACNGTGGTCG GGGTGGCCTG TTACGCCGTT GTCNTCGAAC ACGAGTAGCA GGTCTGCTCC 780GGCGAGGGCA TCCACCACGC GTTGCGTCAG CTCGT 815(2)SEQ ID NO140的信息(i)序列特征(A)长度1152个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO140ACCAGCCGCC GGCTGAGGTC TCAGATCAGA GAGTCTCCGG ACTCACCGGG GCGGTTCAGC60CTTCTCCCAG AACAACTGCT GAAGATCCTC GCCCGCGAAA CAGGCGCTGA TTTGACGCTC 120TATGACCGGT TGAACGACGA GATCATCCGG CAGATTGATA TGGCACCGCT GGGCTAACAG 180GTGCGCAAGA TGGTGCAGCT GTATGTCTCG GACTCCGTGT CGCGGATCAG CTTTGCCGAC 240GGCCGGGTGA TCGTGTGGAG CGAGGAGCTC GGCGAGAGCC AGTATCCGAT CGAGACGCTG 300GACGGCATCA CGCTGTTTGG GCGGCCGACG ATGACAACGC CCTTCATCGT TGAGATGCTC 360AAGCGTGAGC GCGACATCCA GCTCTTCACG ACCGACGGCC ACTACCAGGG CCGGATCTCA 420ACACCCGACG TGTCATACGC GCCGCGGCTC CGTCAGCAAG TTCACCGCAC CGACGATCCT 480GCGTTCTGCC TGTCGTTAAG CAAGCGGATC GTGTCGAGGA AGATCCTGAA TCAGCAGGCC 540TTGATTCGGG CACACACGTC GGGGCAAGAC GTTGCTGAGA GCATCCGCAC GATGAAGCAC 600TCGCTGGCCT GGGTCGATCG ATCGGGCTCC CTGGCGGAGT TGAACGGGTT CGAGGGAAAT 660GCCGCAAAGG CATACTTCAC CGCGCTGGGG CATCTCGTCC CGCAGGAGTT CGCATTCCAG 720GGCCGCTCGA CTCGGCCGCC GTTGGACGCC TTCAACTCGA TGGTCAGCCT CGGCTATTCG 780CTGCTGTACA AGAACATCAT AGGGGCGATC GAGCGTCACA GCCTGAACGC GTATATCGGT 840TTCCTACACC AGGATTCACG AGGGCACGCA ACGTCTCGTG CCGAATTCGG CACGAGCTCC 900GCTGAAACCG CTGGCCGGCT GCTCAGTGCC CGTACGTAAT CCGCTGCGCC CAGGCCGGCC960CGCCGGCCGA ATACCAGCAG ATCGGACAGC GAATTGCCGC CCAGCCGGTT GGAGCCGTGC 1020ATACCGCCGG CACACTCACC GGCAGCGAAC AGGCCTGGCA CCGTGGCGGC GCCGGTGTCC 1080GCGTCTACTT CGACACCGCC CATCACGTAG TGACACGTCG GCCCGACTTC CATTGCCTGC 1140GTTCGGCACG AG 1152(2)SEQ ID NO141的信息(i)序列特征(A)长度655个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO141CTCGTGCCGA TTCGGCAGGG TGTACTTGCC GGTGGTGTAN GCCGCATGAG TGCCGACGAC 60CAGCAATGCG GCAACAGCAC GGATCCCGGT CAACGACGCC ACCCGGTCCA CGTGGGCGAT120CCGCTCGAGT CCGCCCTGGG CGGCTCTTTC CTTGGGCAGG GTCATCCGAC GTGTTTCCGC180CGTGGTTTGC CGCCATTATG CCGGCGCGCC GCGTCGGGCG GCCGGTATGG CCGAANGTCG240ATCAGCACAC CCGAGATACG GGTCTGTGCA AGCTTTTTGA GCGTCGCGCG GGGCAGCTTC300GCCGGCAATT CTACTAGCGA GAAGTCTGGC CCGATACGGA TCTGACCGAA GTCGCTGCGG360TGCAGCCCAC CCTCATTGGC GATGGCGCCG ACGATGGCGC CTGGACCGAT CTTGTGCCGC420TTGCCGACGG CGACGCGGTA GGTGGTCAAG TCCGGTCTAC GCTTGGGCCT TTGCGGACGG480TCCCGACGCT GGTCGCGGTT GCGCCGCGAA AGCGGCGGGT CGGGTGCCAT CAGGAATGCC540TCACCGCCGC GGCACTGCAC GGCCAGTGCC GCGGCGATGT CAGCCATCGG GACATCATGC600TCGCGTTCAT ACTCCTCGAC CAGTCGGCGG AACAGCTCGA TTCCCGGACC GCCCA 655(2)SEQ ID NO142的信息(i)序列特征(A)长度267个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性
(ii)分子类型肽(xi)序列描述SEQ ID NO142Asn Ala Val Val Ala Phe Ala Val Ile Gly Phe Ala Ser Leu Ala Val1 5 10 15Ala Val Ala Val Thr Ile Arg Pro Thr Ala Ala Ser Lys Pro Val Glu20 25 30Gly His Gln Asn Ala Gln Pro Gly Lys Phe Met Pro Leu Leu Pro Thr35 40 45Gln Gln Gln Ala Pro Val Pro Pro Pro Pro Pro Asp Asp Pro Thr Ala50 55 60Gly Phe Gln Gly Gly Thr Ile Pro Ala Val Gln Asn Val Val Pro Arg65 70 75 80Pro Gly Thr Ser Pro Gly Val Gly Gly Thr Pro Ala Ser Pro Ala Pro85 90 95Glu Ala Pro Ala Val Pro Gly Val Val Pro Ala Pro Val Pro Ile Pro100 105 110Val Pro Ile Ile Ile Pro Pro Phe Pro Gly Trp Gln Pro Gly Met Pro115 120 125Thr Ile Pro Thr Ala Pro Pro Thr Thr Pro Val Thr Thr Ser Ala Thr130 135 140Thr Pro Pro Thr Thr Pro Pro Thr Thr Pro Val Thr Thr Pro Pro Thr145 150 155 160Thr Pro Pro Thr Thr Pro Val Thr Thr Pro Pro Thr Thr Pro Pro Thr165 170 175Thr Pro Val Thr Thr Pro Pro Thr Thr Val Ala Pro Thr Thr Val Ala180 185 190Pro Thr Thr Val Ala Pro Thr Thr Val Ala Pro Thr Thr Val Ala Pro195 200 205Ala Thr Ala Thr Pro Thr Thr Val Ala Pro Gln Pro Thr Gln Gln Pro210 215 220Thr Gln Gln Pro Thr Gln Gln Met Pro Thr Gln Gln Gln Thr Val Ala225 230 235 240Pro Gln Thr Val Ala Pro Ala Pro Gln Pro Pro Ser Gly Gly Arg Asn245 250 255Gly Ser Gly Gly Gly Asp Leu Phe Gly Gly Phe260 265(2)SEQ ID NO143的信息(i)序列特征(A)长度174个氨基酸
(B)类型氨基酸(C)链数单链(D)拓扑学线性(ii)分子类型肽(xi)序列描述SEQ ID NO143Ile Asn Gln Pro Leu Ala Pro Pro Ala Pro Pro Asp Pro Pro Ser Pro1 5 10 15Pro Arg Pro Pro Val Pro Pro Val Pro Pro Leu Pro Pro Ser Pro Pro20 25 30Ser Pro Pro Thr Gly Trp Val Pro Arg Ala Leu Leu Pro Pro Trp Leu35 40 45Ala Gly Thr Pro Pro Ala Pro Pro Val Pro Pro Met Ala Pro Leu Pro50 55 60Pro Ala Ala Pro Leu Pro Pro Leu Pro Pro Leu Pro Pro Leu Pro Thr65 70 75 80Ser His Pro Pro Arg Pro Pro Ala Pro Pro Ala Pro Pro Ala Pro Pro85 90 95Ala Cys Pro Phe Val Pro Val Pro Pro Ala Pro Pro Leu Pro Pro Ser100 105 110Pro Pro Thr Glu Leu Pro Ala Asp Ala Ala Cys Pro Pro Ala Pro Pro115 120 125Ala Pro Pro Leu Ala Pro Pro Ser Pro Pro Ala Gly Ser Ala Ala Ile130 135 140Arg Ala Leu Thr Gly Ala Thr Ser Ala Ser Thr Leu Gly His Arg Ala145 150 155 160Leu Pro Asp Asp Thr Thr Ala Arg Gly Cys Arg Arg Thr Gly165 170(2)SEQ ID NO144的信息(i)序列特征(A)长度35个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(ii)分子类型肽(xi)序列描述SEQ ID NO144Gln Pro Pro Ala Glu Val Ser Asp Gln Arg Val Ser Gly Leu Thr Gly1 5 10 15Ala Val Gln Pro Ser Pro Arg Thr Thr Ala Glu Asp Pro Arg Pro Arg20 25 30Asn Arg Arg35(2)SEQ ID NO145的信息(i)序列特征(A)长度104个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(ii)分子类型肽(xi)序列描述SEQ ID NO145Arg Ala Asp Ser Ala Gly Cys Thr Cys Arg Trp Cys Xaa Pro His Glu1 5 10 15Cys Arg Arg Pro Ala Met Arg Gln Gln His Gly Ser Arg Ser Thr Thr20 25 30Pro Pro Gly Pro Arg Gly Arg Ser Ala Arg Val Arg Pro Gly Arg Leu35 40 45Phe Pro Trp Ala Gly Ser Ser Asp Val Phe Pro Pro Trp Phe Ala Ala50 55 60Ile Met Pro Ala Arg Arg Val Gly Arg Pro Val Trp Pro Xaa Val Asp65 70 75 80Gln His Thr Arg Asp Thr Gly Leu Cys Lys Leu Phe Glu Arg Arg Ala85 90 95Gly Gln Leu Arg Arg Gln Phe Tyr100(2)SEQ ID NO146的信息(i)序列特征(A)长度53个碱基对(B)类型核酸(C)链数单链
(D)拓扑学线性(ii)分子类型其它核酸(A)说明/desc＝＂PCR引物＂(vi)来源(A)微生物结核分枝杆菌(xi)序列描述SEQ ID NO146GGATCCATAT GGGCCATCAT CATCATCATC ACGTGATCGA CATCATCGGG ACC53(2)SEQ ID NO147的信息(i)序列特征(A)长度42个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(ii)分子类型其它核酸(A)说明/desc＝＂PCR引物＂(vi)来源(A)微生物结核分枝杆菌(xi)序列描述SEQ ID NO147CCTGAATTCA GGCCTCGGTT GCGCCGGCCT CATCTTGAAC GA42(2)SEQ ID NO148的信息(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(ii)分子类型其它核酸(A)说明/desc＝＂PCR引物＂(vi)来源(A)微生物结核分枝杆菌(xi)序列描述SEQ ID NO148GGATCCTGCA GGCTCGAAAC CACCGAGCGG T 31(2)SEQ ID NO149的信息(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(ii)分子类型其它核酸(A)说明/desc＝＂PCR引物＂(vi)来源(A)微生物结核分枝杆菌(xi)序列描述SEQ ID NO149CTCTGAATTC AGCGCTGGAA ATCGTCGCGA T 31(2)SEQ ID NO150的信息(i)序列特征(A)长度33个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(ii)分子类型其它核酸(A)说明/desc＝＂PCR引物＂(vi)来源(A)微生物结核分枝杆菌(xi)序列描述SEQ ID NO150GGATCCAGCG CTGAGATGAA GACCGATGCC GCT 33(2)SEQ ID NO151的信息(i)序列特征(A)长度33个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(ii)分子类型其它核酸(A)说明/desc＝＂PCR引物＂(vi)来源(A)微生物结核分枝杆菌(xi)序列描述SEQ ID NO151GAGAGAATTC TCAGAAGCCC ATTTGCGAGG ACA 33(2)SEQ ID NO152的信息(i)序列特征(A)长度1993个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(ii)分子类型DNA(基因组)(A)说明/desc＝＂PCR引物＂(vi)来源(A)微生物结核分枝杆菌(ix)特征(A)名称/关键词CDS(B)位置152..1273(xi)序列描述SEQ ID NO152TGTTCTTCGA CGGCAGGCTG GTGGAGGAAG GGCCCACCGA ACAGCTGTTC TCCTCGCCGA 60AGCATGCGGA AACCGCCCGA TACGTCGCCG GACTGTCGGG GGACGTCAAG GACGCCAAGC120GCGGAAATTG AAGAGCACAG AAAGGTATGG C GTG AAA ATT CGT TTG CAT ACG 172Val Lys Ile Arg Leu His Thr1 5CTG TTG GCC GTG TTG ACC GCT GCG CCG CTG CTG CTA GCA GCG GCG GGC 220Leu Leu Ala Val Leu Thr Ala Ala Pro Leu Leu Leu Ala Ala Ala Gly10 15 20TGT GGC TCG AAA CCA CCG AGC GGT TCG CCT GAA ACG GGC GCC GGC GCC 268Cys Gly Ser Lys Pro Pro Ser Gly Ser Pro Glu Thr Gly Ala Gly Ala25 30 35GGT ACT GTC GCG ACT ACC CCC GCG TCG TCG CCG GTG ACG TTG GCG GAG 316Gly Thr Val Ala Thr Thr Pro Ala Ser Ser Pro Val Thr Leu Ala Glu40 45 50 55ACC GGT AGC ACG CTG CTC TAC CCG CTG TTC AAC CTG TGG GGT CCG GCC 364Thr Gly Ser Thr Leu Leu Tyr Pro Leu Phe Asn Leu Trp Gly Pro Ala60 65 70TTT CAC GAG AGG TAT CCG AAC GTC ACG ATC ACC GCT CAG GGC ACC GGT 412Phe His Glu Arg Tyr Pro Asn Val Thr Ile Thr Ala Gln Gly Thr Gly75 80 85TCT GGT GCC GGG ATC GCG CAG GCC GCC GCC GGG ACG GTC AAC ATT GGG 460Ser Gly Ala Gly Ile Ala Gln Ala Ala Ala Gly Thr Val Asn Ile Gly90 95 100GCC TCC GAC GCC TAT CTG TCG GAA GGT GAT ATG GCC GCG CAC AAG GGG 508Ala Ser Asp Ala Tyr Leu Ser Glu Gly Asp Met Ala Ala His Lys Gly105 110 115CTG ATG AAC ATC GCG CTA GCC ATC TCC GCT CAG CAG GTC AAC TAC AAC 556Leu Met Asn Ile Ala Leu Ala Ile Ser Ala Gln Gln Val Asn Tyr Asn120 125 130 135CTG CCC GGA GTG AGC GAG CAC CTC AAG CTG AAC GGA AAA GTC CTG GCG 604Leu Pro Gly Val Ser Glu His Leu Lys Leu Asn Gly Lys Val Leu Ala140 145 150GCC ATG TAC CAG GGC ACC ATC AAA ACC TGG GAC GAC CCG CAG ATC GCT 652Ala Met Tyr Gln Gly Thr Ile Lys Thr Trp Asp Asp Pro Gln Ile Ala155 160 165GCG CTC AAC CCC GGC GTG AAC CTG CCC GGC ACC GCG GTA GTT CCG CTG 700Ala Leu Asn Pro Gly Val Asn Leu Pro Gly Thr Ala Val Val Pro Leu170 175 180CAC CGC TCC GAC GGG TCC GGT GAC ACC TTC TTG TTC ACC CAG TAC CTG 748His Arg Ser Asp Gly Ser Gly Asp Thr Phe Leu Phe Thr Gln Tyr Leu185 190 195TCC AAG CAA GAT CCC GAG GGC TGG GGC AAG TCG CCC GGC TTC GGC ACC 796Ser Lys Gln Asp Pro Glu Gly Trp Gly Lys Ser Pro Gly Phe Gly Thr200 205 210 215ACC GTC GAC TTC CCG GCG GTG CCG GGT GCG CTG GGT GAG AAC GGC AAC 844Thr Val Asp Phe Pro Ala Val Pro Gly Ala Leu Gly Glu Asn Gly Asn220 225 230GGC GGC ATG GTG ACC GGT TGC GCC GAG ACA CCG GGC TGC GTG GCC TAT 892Gly Gly Met Val Thr Gly Cys Ala Glu Thr Pro Gly Cys Val Ala Tyr235 240 245ATC GGC ATC AGC TTC CTC GAC CAG GCC AGT CAA CGG GGA CTC GGC GAG940Ile Gly Ile Ser Phe Leu Asp Gln Ala Ser Gln Arg Gly Leu Gly Glu250 255 260GCC CAA CTA GGC AAT AGC TCT GGC AAT TTC TTG TTG CCC GAC GCG CAA988Ala Gln Leu Gly Asn Ser Ser Gly Asn Phe Leu Leu Pro Asp Ala Gln265 270 275AGC ATT CAG GCC GCG GCG GCT GGC TTC GCA TCG AAA ACC CCG GCG AAC 1036Ser Ile Gln Ala Ala Ala Ala Gly Phe Ala Ser Lys Thr Pro Ala Asn280 285 290 295CAG GCG ATT TCG ATG ATC GAC GGG CCC GCC CCG GAC GGC TAC CCG ATC 1084Gln Ala Ile Ser Met Ile Asp Gly Pro Ala Pro Asp Gly Tyr Pro Ile300 305 310ATC AAC TAC GAG TAC GCC ATC GTC AAC AAC CGG CAA AAG GAC GCC GCC 1132Ile Asn Tyr Glu Tyr Ala Ile Val Asn Asn Arg Gln Lys Asp Ala Ala315 320 325ACC GCG CAG ACC TTG CAG GCA TTT CTG CAC TGG GCG ATC ACC GAC GGC 1180Thr Ala Gln Thr Leu Gln Ala Phe Leu His Trp Ala Ile Thr Asp Gly330 335 340AAC AAG GCC TCG TTC CTC GAC CAG GTT CAT TTC CAG CCG CTG CCG CCC 1228Asn Lys Ala Ser Phe Leu Asp Gln Val His Phe Gln Pro Leu Pro Pro345 350 355GCG GTG GTG AAG TTG TCT GAC GCG TTG ATC GCG ACG ATT TCC AGC 1273Ala Val Val Lys Leu Ser Asp Ala Leu Ile Ala Thr Ile Ser Ser360 365 370TAGCCTCGTT GACCACCACG CGACAGCAAC CTCCGTCGGG CCATCGGGCT GCTTTGCGGA 1333GCATGCTGGC CCGTGCCGGT GAAGTCGGCC GCGCTGGCCC GGCCATCCGG TGGTTGGGTG 1393GGATAGGTGC GGTGATCCCG CTGCTTGCGC TGGTCTTGGT GCTGGTGGTG CTGGTCATCG 1453AGGCGATGGG TGCGATCAGG CTCAACGGGT TGCATTTCTT CACCGCCACC GAATGGAATC 1513CAGGCAACAC CTACGGCGAA ACCGTTGTCA CCGACGCGTC GCCCATCCGG TCGGCGCCTA 1573CTACGGGGCG TTGCCGCTGA TCGTCGGGAC GCTGGCGACC TCGGCAATCG CCCTGATCAT 1633CGCGGTGCCG GTCTCTGTAG GAGCGGCGCT GGTGATCGTG GAACGGCTGC CGAAACGGTT 1693GGCCGAGGCT GTGGGAATAG TCCTGGAATT GCTCGCCGGA ATCCCCAGCG TGGTCGTCGG 1753TTTGTGGGGG GCAATGACGT TCGGGCCGTT CATCGCTCAT CACATCGCTC CGGTGATCGC 1813TCACAACGCT CCCGATGTGC CGGTGCTGAA CTACTTGCGC GGCGACCCGG GCAACGGGGA 1873GGGCATGTTG GTGTCCGGTC TGGTGTTGGC GGTGATGGTC GTTCCCATTA TCGCCACCAC 1933CACTCATGAC CTGTTCCGGC AGGTGCCGGT GTTGCCCCGG GAGGGCGCGA TCGGGAATTC 1993(2)SEQ ID NO153的信息(i)序列特征(A)长度374个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO153Val Lys Ile Arg Leu His Thr Leu Leu Ala Val Leu Thr Ala Ala Pro1 5 10 15Leu Leu Leu Ala Ala Ala Gly Cys Gly Ser Lys Pro Pro Ser Gly Ser20 25 30Pro Glu Thr Gly Ala Gly Ala Gly Thr Val Ala Thr Thr Pro Ala Ser35 40 45Ser Pro Val Thr Leu Ala Glu Thr Gly Ser Thr Leu Leu Tyr Pro Leu50 55 60Phe Asn Leu Trp Gly Pro Ala Phe His Glu Arg Tyr Pro Asn Val Thr65 70 75 80Ile Thr Ala Gln Gly Thr Gly Ser Gly Ala Gly Ile Ala Gln Ala Ala85 90 95Ala Gly Thr Val Asn Ile Gly Ala Ser Asp Ala Tyr Leu Ser Glu Gly100 105 110Asp Met Ala Ala His Lys Gly Leu Met Asn Ile Ala Leu Ala Ile Ser115 120 125Ala Gln Gln Val Asn Tyr Asn Leu Pro Gly Val Ser Glu His Leu Lys130 135 140Leu Asn Gly Lys Val Leu Ala Ala Met Tyr Gln Gly Thr Ile Lys Thr145 150 155 160Trp Asp Asp Pro Gln Ile Ala Ala Leu Asn Pro Gly Val Asn Leu Pro165 170 175Gly Thr Ala Val Val Pro Leu His Arg Ser Asp Gly Ser Gly Asp Thr180 185 190Phe Leu Phe Thr Gln Tyr Leu Ser Lys Gln Asp Pro Glu Gly Trp Gly195 200 205Lys Ser Pro Gly Phe Gly Thr Thr Val Asp Phe Pro Ala Val Pro Gly210 215 220Ala Leu Gly Glu Asn Gly Asn Gly Gly Met Val Thr Gly Cys Ala Glu225 230 235 240Thr Pro Gly Cys Val Ala Tyr Ile Gly Ile Ser Phe Leu Asp Gln Ala245 250 255Ser Gln Arg Gly Leu Gly Glu Ala Gln Leu Gly Asn Ser Ser Gly Asn260 265 270Phe Leu Leu Pro Asp Ala Gln Ser Ile Gln Ala Ala Ala Ala Gly Phe275 280 285Ala Ser Lys Thr Pro Ala Asn Gln Ala Ile Ser Met Ile Asp Gly Pro290 295 300Ala Pro Asp Gly Tyr Pro Ile Ile Asn Tyr Glu Tyr Ala Ile Val Asn305 310 315 320Asn Arg Gln Lys Asp Ala Ala Thr Ala Gln Thr Leu Gln Ala Phe Leu325 330 335His Trp Ala Ile Thr Asp Gly Asn Lys Ala Ser Phe Leu Asp Gln Val340 345 350His Phe Gln Pro Leu Pro Pro Ala Val Val Lys Leu Ser Asp Ala Leu355 360 365Ile Ala Thr Ile Ser Ser370(2)SEQ ID NO154的信息(i)序列特征(A)长度1993个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO154TGTTCTTCGA CGGCAGGCTG GTGGAGGAAG GGCCCACCGA ACAGCTGTTC TCCTCGCCGA 60AGCATGCGGA AACCGCCCGA TACGTCGCCG GACTGTCGGG GGACGTCAAG GACGCCAAGC 120GCGGAAATTG AAGAGCACAG AAAGGTATGG CGTGAAAATT CGTTTGCATA CGCTGTTGGC 180CGTGTTGACC GCTGCGCCGC TGCTGCTAGC AGCGGCGGGC TGTGGCTCGA AACCACCGAG 240CGGTTCGCCT GAAACGGGCG CCGGCGCCGG TACTGTCGCG ACTACCCCCG CGTCGTCGCC 300GGTGACGTTG GCGGAGACCG GTAGCACGCT GCTCTACCCG CTGTTCAACC TGTGGGGTCC 360GGCCTTTCAC GAGAGGTATC CGAACGTCAC GATCACCGCT CAGGGCACCG GTTCTGGTGC 420CGGGATCGCG CAGGCCGCCG CCGGGACGGT CAACATTGGG GCCTCCGACG CCTATCTGTC 480GGAAGGTGAT ATGGCCGCGC ACAAGGGGCT GATGAACATC GCGCTAGCCA TCTCCGCTCA 540GCAGGTCAAC TACAACCTGC CCGGAGTGAG CGAGCACCTC AAGCTGAACG GAAAAGTCCT 600GGCGGCCATG TACCAGGGCA CCATCAAAAC CTGGGACGAC CCGCAGATCG CTGCGCTCAA 660CCCCGGCGTG AACCTGCCCG GCACCGCGGT AGTTCCGCTG CACCGCTCCG ACGGGTCCGG 720TGACACCTTC TTGTTCACCC AGTACCTGTC CAAGCAAGAT CCCGAGGGCT GGGGCAAGTC 780GCCCGGCTTC GGCACCACCG TCGACTTCCC GGCGGTGCCG GGTGCGCTGG GTGAGAACGG 840CAACGGCGGC ATGGTGACCG GTTGCGCCGA GACACCGGGC TGCGTGGCCT ATATCGGCAT 900CAGCTTCCTC GACCAGGCCA GTCAACGGGG ACTCGGCGAG GCCCAACTAG GCAATAGCTC 960TGGCAATTTC TTGTTGCCCG ACGCGCAAAG CATTCAGGCC GCGGCGGCTG GCTTCGCATC1020GAAAACCCCG GCGAACCAGG CGATTTCGAT GATCGACGGG CCCGCCCCGG ACGGCTACCC1080GATCATCAAC TACGAGTACG CCATCGTCAA CAACCGGCAA AAGGACGCCG CCACCGCGCA1140GACCTTGCAG GCATTTCTGC ACTGGGCGAT CACCGACGGC AACAAGGCCT CGTTCCTCGA1200CCAGGTTCAT TTCCAGCCGC TGCCGCCCGC GGTGGTGAAG TTGTCTGACG CGTTGATCGC1260GACGATTTCC AGCTAGCCTC GTTGACCACC ACGCGACAGC AACCTCCGTC GGGCCATCGG1320GCTGCTTTGC GGAGCATGCT GGCCCGTGCC GGTGAAGTCG GCCGCGCTGG CCCGGCCATC1380CGGTGGTTGG GTGGGATAGG TGCGGTGATC CCGCTGCTTG CGCTGGTCTT GGTGCTGGTG1440GTGCTGGTCA TCGAGGCGAT GGGTGCGATC AGGCTCAACG GGTTGCATTT CTTCACCGCC1500ACCGAATGGA ATCCAGGCAA CACCTACGGC GAAACCGTTG TCACCGACGC GTCGCCCATC1560CGGTCGGCGC CTACTACGGG GCGTTGCCGC TGATCGTCGG GACGCTGGCG ACCTCGGCAA1620TCGCCCTGAT CATCGCGGTG CCGGTCTCTG TAGGAGCGGC GCTGGTGATC GTGGAACGGC1680TGCCGAAACG GTTGGCCGAG GCTGTGGGAA TAGTCCTGGA ATTGCTCGCC GGAATCCCCA1740GCGTGGTCGT CGGTTTGTGG GGGGCAATGA CGTTCGGGCC GTTCATCGCT CATCACATCG1800CTCCGGTGAT CGCTCACAAC GCTCCCGATG TGCCGGTGCT GAACTACTTG CGCGGCGACC1860CGGGCAACGG GGAGGGCATG TTGGTGTCCG GTCTGGTGTT GGCGGTGATG GTCGTTCCCA1920TTATCGCCAC CACCACTCAT GACCTGTTCC GGCAGGTGCC GGTGTTGCCC CGGGAGGGCG1980CGATCGGGAA TTC 1993(2)SEQ ID NO155的信息(i)序列特征(A)长度374个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO155Met Lys Ile Arg Leu His Thr Leu Leu Ala Val Leu Thr Ala Ala Pro1 5 10 15Leu Leu Leu Ala Ala Ala Gly Cys Gly Ser Lys Pro Pro Ser Gly Ser20 25 30Pro Glu Thr Gly Ala Gly Ala Gly Thr Val Ala Thr Thr Pro Ala Ser35 40 45Ser Pro Val Thr Leu Ala Glu Thr Gly Ser Thr Leu Leu Tyr Pro Leu50 55 60Phe Asn Leu Trp Gly Pro Ala Phe His Glu Arg Tyr Pro Asn Val Thr65 70 75 80Ile Thr Ala Gln Gly Thr Gly Ser Gly Ala Gly Ile Ala Gln Ala Ala85 90 95Ala Gly Thr Val Asn Ile Gly Ala Ser Asp Ala Tyr Leu Ser Glu Gly100 105 110Asp Met Ala Ala His Lys Gly Leu Met Asn Ile Ala Leu Ala Ile Ser115 120 125Ala Gln Gln Val Asn Tyr Asn Leu Pro Gly Val Ser Glu His Leu Lys130 135 140Leu Asn Gly Lys Val Leu Ala Ala Met Tyr Gln Gly Thr Ile Lys Thr145 150 155 160Trp Asp Asp Pro Gln Ile Ala Ala Leu Asn Pro Gly Val Asn Leu Pro165 170 175Gly Thr Ala Val Val Pro Leu His Arg Ser Asp Gly Ser Gly Asp Thr180 185 190Phe Leu Phe Thr Gln Tyr Leu Ser Lys Gln Asp Pro Glu Gly Trp Gly195 200 205Lys Ser Pro Gly Phe Gly Thr Thr Val Asp Phe Pro Ala Val Pro Gly210 215 220Ala Leu Gly Glu Asn Gly Asn Gly Gly Met Val Thr Gly Cys Ala Glu225 230 235 240Thr Pro Gly Cys Val Ala Tyr Ile Gly Ile Ser Phe Leu Asp Gln Ala245 250 255Ser Gln Arg Gly Leu Gly Glu Ala Gln Leu Gly Asn Ser Ser Gly Asn260 265 270Phe Leu Leu Pro Asp Ala Gln Ser Ile Gln Ala Ala Ala Ala Gly Phe275 280 285Ala Ser Lys Thr Pro Ala Asn Gln Ala Ile Ser Met Ile Asp Gly Pro290 295 300Ala Pro Asp Gly Tyr Pro Ile Ile Asn Tyr Glu Tyr Ala Ile Val Asn305 310 315 320Asn Arg Gln Lys Asp Ala Ala Thr Ala Gln Thr Leu Gln Ala Phe Leu325 330 335His Trp Ala Ile Thr Asp Gly Asn Lys Ala Ser Phe Leu Asp Gln Val340 345 350His Phe Gln Pro Leu Pro Pro Ala Val Val Lys Leu Ser Asp Ala Leu355 360 365Ile Ala Thr Ile Ser Ser370(2)SEQ ID NO156的信息(i)序列特征(A)长度1777个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO156GGTCTTGACC ACCACCTGGG TGTCGAAGTC GGTGCCCGGA TTGAAGTCCA GGTACTCGTG60GGTGGGGCGG GCGAAACAAT AGCGACAAGC ATGCGAGCAG CCGCGGTAGC CGTTGACGGT 120GTAGCGAAAC GGCAACGCGG CCGCGTTGGG CACCTTGTTC AGCGCTGATT TGCACAACAC 180CTCGTGGAAG GTGATGCCGT CGAATTGTGG CGCGCGAACG CTGCGGACCA GGCCGATCCG 240CTGCAACCCG GCAGCGCCCG TCGTCAACGG GCATCCCGTT CACCGCGACG GCTTGCCGGG 300CCCAACGCAT ACCATTATTC GAACAACCGT TCTATACTTT GTCAACGCTG GCCGCTACCG 360AGCGCCGCAC AGGATGTGAT ATGCCATCTC TGCCCGCACA GACAGGAGCC AGGCCTTATG 420ACAGCATTCG GCGTCGAGCC CTACGGGCAG CCGAAGTACC TAGAAATCGC CGGGAAGCGC 480ATGGCGTATA TCGACGAAGG CAAGGGTGAC GCCATCGTCT TTCAGCACGG CAACCCCACG 540TCGTCTTACT TGTGGCGCAA CATCATGCCG CACTTGGAAG GGCTGGGCCG GCTGGTGGCC 600TGCGATCTGA TCGGGATGGG CGCGTCGGAC AAGCTCAGCC CATCGGGACC CGACCGCTAT 660AGCTATGGCG AGCAACGAGA CTTTTTGTTC GCGCTCTGGG ATGCGCTCGA CCTCGGCGAC 720CACGTGGTAC TGGTGCTGCA CGACTGGGGC TCGGCGCTCG GCTTCGACTG GGCTAACCAG 780CATCGCGACC GAGTGCAGGG GATCGCGTTC ATGGAAGCGA TCGTCACCCC GATGACGTGG 840GCGGACTGGC CGCCGGCCGT GCGGGGTGTG TTCCAGGGTT TCCGATCGCC TCAAGGCGAG 900CCAATGGCGT TGGAGCACAA CATCTTTGTC GAACGGGTGC TGCCCGGGGC GATCCTGCGA 960CAGCTCAGCG ACGAGGAAAT GAACCACTAT CGGCGGCCAT TCGTGAACGG CGGCGAGGAC 1020CGTCGCCCCA CGTTGTCGTG GCCACGAAAC CTTCCAATCG ACGGTGAGCC CGCCGAGGTC 1080GTCGCGTTGG TCAACGAGTA CCGGAGCTGG CTCGAGGAAA CCGACATGCC GAAACTGTTC 1140ATCAACGCCG AGCCCGGCGC GATCATCACC GGCCGCATCC GTGACTATGT CAGGAGCTGG 1200CCCAACCAGA CCGAAATCAC AGTGCCCGGC GTGCATTTCG TTCAGGAGGA CAGCGATGGC 1260GTCGTATCGT GGGCGGGCGC TCGGCAGCAT CGGCGACCTG GGAGCGCTCT CATTTCACGA 1320GACCAAGAAT GTGATTTCCG GCGAAGGCGG CGCCCTGCTT GTCAACTCAT AAGACTTCCT1380GCTCCGGGCA GAGATTCTCA GGGAAAAGGG CACCAATCGC AGCCGCTTCC TTCGCAACGA1440GGTCGACAAA TATACGTGGC AGGACAAAGG TCTTCCTATT TGCCCAGCGA ATTAGTCGCT1500GCCTTTCTAT GGGCTCAGTT CGAGGAAGCC GAGCGGATCA CGCGTATCCG ATTGGACCTA1560TGGAACCGGT ATCATGAAAG CTTCGAATCA TTGGAACAGC GGGGGCTCCT GCGCCGTCCG1620ATCATCCCAC AGGGCTGCTC TCACAACGCC CACATGTACT ACGTGTTACT AGCGCCCAGC1680GCCGATCGGG AGGAGGTGCT GGCGCGTCTG ACGAGCGAAG GTATAGGCGC GGTCTTTCAT1740TACGTGCCGC TTCACGATTC GCCGGCCGGG CGTCGCT 1777(2)SEQ ID NO157的信息(i)序列特征(A)长度324个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO157GAGATTGAAT CGTACCGGTC TCCTTAGCGG CTCCGTCCCG TGAATGCCCA TATCACGCAC 60GGCCATGTTC TGGCTGTCGA CCTTCGCCCC ATGCCCGGAC GTTGGTAAAC CCAGGGTTTG 120ATCAGTAATT CCGGGGGACG GTTGCGGGAA GGCGGCCAGG ATGTGCGTGA GCCGCGGCGC 180CGCCGTCGCC CAGGCGACCG CTGGATGCTC AGCCCCGGTG CGGCGACGTA GCCAGCGTTT 240GGCGCGTGTC GTCCACAGTG GTACTCCGGT GACGACGCGG CGCGGTGCCT GGGTGAAGAC 300CGTGACCGAC GCCGCCGATT CAGA 324(2)SEQ ID NO158的信息(i)序列特征(A)长度1338个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO158GCGGTACCGC CGCGTTGCGC TGGCACGGGA CCTGTACGAC CTGAACCACT TCGCCTCGCG 60AACGATTGAC GAACCGCTCG TGCGGCGGCT GTGGGTGCTC AAGGTGTGGG GTGATGTCGT120CGATGACCGG CGCGGCACCC GGCCACTACG CGTCGAAGAC GTCCTCGCCG CCCGCAGCGA180GCACGACTTC CAGCCCGACT CGATCGGCGT GCTGACCCGT CCTGTCGCTA TGGCTGCCTG240GGAAGCTCGC GTTCGGAAGC GATTTGCGTT CCTCACTGAC CTCGACGCCG ACGAGCAGCG300GTGGGCCGCC TGCGACGAAC GGCACCGCCG CGAAGTGGAG AACGCGCTGG CGGTGCTGCG360GTCCTGATCA ACCTGCCGGC GATCGTGCCG TTCCGCTGGC ACGGTTGCGG CTGGACGCGG420CTGAATCGAC TAGATGAGAG CAGTTGGGCA CGAATCCGGC TGTGGTGGTG AGCAAGACAC480GAGTACTGTC ATCACTATTG GATGCACTGG ATGACCGGCC TGATTCAGCA GGACCAATGG540AACTGCCCGG GGCAAAACGT CTCGGAGATG ATCGGCGTCC CCTCGGAACC CTGCGGTGCT600GGCGTCATTC GGACATCGGT CCGGCTCGCG GGATCGTGGT GACGCCAGCG CTGAAGGAGT660GGAGCGCGGC GGTGCACGCG CTGCTGGACG GCCGGCAGAC GGTGCTGCTG CGTAAGGGCG720GGATCGGCGA GAAGCGCTTC GAGGTGGCGG CCCACGAGTT CTTGTTGTTC CCGACGGTCG780CGCACAGCCA CGCCGAGCGG GTTCGCCCCG AGCACCGCGA CCTGCTGGGC CCGGCGGCCG840CCGACAGCAC CGACGAGTGT GTGCTACTGC GGGCCGCAGC GAAAGTTGTT GCCGCACTGC900CGGTTAACCG GCCAGAGGGT CTGGACGCCA TCGAGGATCT GCACATCTGG ACCGCCGAGT960CGGTGCGCGC CGACCGGCTC GACTTTCGGC CCAAGCACAA ACTGGCCGTC TTGGTGGTCT 1020CGGCGATCCC GCTGGCCGAG CCGGTCCGGC TGGCGCGTAG GCCCGAGTAC GGCGGTTGCA 1080CCAGCTGGGT GCAGCTGCCG GTGACGCCGA CGTTGGCGGC GCCGGTGCAC GACGAGGCCG 1140CGCTGGCCGA GGTCGCCGCC CGGGTCCGCG AGGCCGTGGG TTGACTGGGC GGCATCGCTT 1200GGGTCTGAGC TGTACGCCCA GTCGGCGCTG CGAGTGATCT GCTGTCGGTT CGGTCCCTGC 1260TGGCGTCAAT TGACGGCGCG GGCAACAGCA GCATTGGCGG CGCCATCCTC CGCGCGGCCG 1320GGGCCCACCG CTACAACC 1338(2)SEQ ID NO159的信息(i)序列特征(A)长度321个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO159CCGGCGGCAC CGGCGGCACC GGCGGTACCG GCGGCAACGG CGCTGACGCC GCTGCTGTGG60TGGGCTTCGG CGCGAACGGC GACCCTGGCT TCGCTGGCGG CAAAGGCGGT AACGGCGGAA 120TAGGTGGGGC CGCGGTGACA GGCGGGGTCG CCGGCGACGG CGGCACCGGC GGCAAAGGTG 180GCACCGGCGG TGCCGGCGGC GCCGGCAACG ACGCCGGCAG CACCGGCAAT CCCGGCGGTA 240AGGGCGGCGA CGGCGGGATC GGCGGTGCCG GCGGGGCCGG CGGCGCGGCC GGCACCGGCA 300ACGGCGGCCA TGCCGGCAAC C 321(2)SEQ ID NO160的信息(i)序列特征(A)长度492个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO160GAAGACCCGG CCCCGCCATA TCGATCGGCT CGCCGACTAC TTTCGCCGAA CGTGCACGCG 60GCGGCGTCGG GCTGATCATC ACCGGTGGCT ACGCGCCCAA CCGCACCGGA TGGCTGCTGC 120CGTTCGCCTC CGAACTCGTC ACTTCGGCGC AAGCCCGACG GCACCGCCGA ATCACCAGGG 180CGGTCCACGA TTCGGGTGCA AAGATCCTGC TGCAAATCCT GCACGCCGGA CGCTACGCCT 240ACCACCCACT TGCGGTCAGC GCCTCGCCGA TCAAGGCGCC GATCACCCCG TTTCGTCCGC 300GAGCACTATC GGCTCGCGGG GTCGAAGCGA CCATCGCGGA TTTCGCCCGC TGCGCGCAGT 360TGGCCCGCGA TGCCGGCTAC GACGGCGTCG AAATCATGGG CAGCGAAGGG TATCTGCTCA 420ATCAGTTCCT GGCGCCGCGC ACCAACAAGC GCACCGACTC GTGGGGCGGC ACACCGGCCA 480ACCGTCGCCG GT 492(2)SEQ ID NO161的信息(i)序列特征(A)长度536个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO161Phe Ala Gln His Leu Val Glu Gly Asp Ala Val Glu Leu Trp Arg Ala1 5 10 15Asn Ala Ala Asp Gln Ala Asp Pro Leu Gln Pro Gly Ser Ala Arg Arg20 25 30Gln Arg Ala Sar Arg Ser Pro Arg Arg Leu Ala Gly Pro Asn Ala Tyr35 40 45His Tyr Ser Asn Asn Arg Ser Ile Leu Cys Gln Arg Trp Pro Leu Pro50 55 60Ser Ala Ala Gln Asp Val Ile Cys His Leu Cys Pro His Arg Gln Glu65 70 75 80Pro Gly Leu Met Thr Ala Phe Gly Val Glu Pro Tyr Gly Gln Pro Lys85 90 95Tyr Leu Glu Ile Ala Gly Lys Arg Met Ala Tyr Ile Asp Glu Gly Lys100 105 110Gly Asp Ala Ile Val Phe Gln His Gly Asn Pro Thr Ser Ser Tyr Leu115 120 125Trp Arg Asn Ile Met Pro His Leu Glu Gly Leu Gly Arg Leu Val Ala130 135 140Cys Asp Leu Ile Gly Met Gly Ala Ser Asp Lys Leu Ser Pro Ser Gly145 150 155 160Pro Asp Arg Tyr Ser Tyr Gly Glu Gln Arg Asp Phe Leu Phe Ala Leu165 170 175Trp Asp Ala Leu Asp Leu Gly Asp His Val Val Leu Val Leu His Asp180 185 190Trp Gly Ser Ala Leu Gly Phe Asp Trp Ala Asn Gln His Arg Asp Arg195 200 205Val Gln Gly Ile Ala Phe Met Glu Ala Ile Val Thr Pro Met Thr Trp210 215 220Ala Asp Trp Pro Pro Ala Val Arg Gly Val Phe Gln Gly Phe Arg Ser225 230 235 240Pro Gln Gly Glu Pro Met Ala Leu Glu His Asn Ile Phe Val Glu Arg245 250 255Val Leu Pro Gly Ala Ile Leu Arg Gln Leu Ser Asp Glu Glu Met Asn260 265 270His Tyr Arg Arg Pro Phe Val Asn Gly Gly Glu Asp Arg Arg Pro Thr275 280 285Leu Ser Trp Pro Arg Asn Leu Pro Ile Asp Gly Glu Pro Ala Glu Val290 295 300Val Ala Leu Val Asn Glu Tyr Arg Ser Trp Leu Glu Glu Thr Asp Met305 310 315 320Pro Lys Leu Phe Ile Asn Ala Glu Pro Gly Ala Ile Ile Thr Gly Arg325 330 335Ile Arg Asp Tyr Val Arg Ser Trp Pro Asn Gln Thr Glu Ile Thr Val340 345 350Pro Gly Val His Phe Val Gln Glu Asp Ser Asp Gly Val Val Ser Trp355 360 365Ala Gly Ala Arg Gln His Arg Arg Pro Gly Ser Ala Leu Ile Ser Arg370 375 380Asp Gln Glu Cys Asp Phe Arg Arg Arg Arg Arg Pro Ala Cys Gln Leu385 390 395 400Ile Arg Leu Pro Ala Pro Gly Arg Asp Ser Gln Gly Lys Gly His Gln405 410 415Ser Gln Pro Leu Pro Ser Gln Arg Gly Arg Gln Ile Tyr Val Ala Gly420 425 430Gln Arg Ser Ser Tyr Leu Pro Ser Glu Leu Val Ala Ala Phe Leu Trp435 440 445Ala Gln Phe Glu Glu Ala Glu Arg Ile Thr Arg Ile Arg Leu Asp Leu450 455 460Trp Asn Arg Tyr His Glu Ser Phe Glu Ser Leu Glu Gln Arg Gly Leu465 470 475 480Leu Arg Arg Pro Ile Ile Pro Gln Gly Cys Ser His Asn Ala His Met485 490 495Tyr Tyr Val Leu Leu Ala Pro Ser Ala Asp Arg Glu Glu Val Leu Ala500 505 510Arg Leu Thr Ser Glu Gly Ile Gly Ala Val Phe His Tyr Val Pro Leu515 520 525His Asp Ser Pro Ala Gly Arg Arg530 535(2)SEQ ID NO162的信息(i)序列特征(A)长度284个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO162Asn Glu Ser Ala Pro Arg Ser Pro Met Leu Pro Ser Ala Arg Pro Arg1 5 10 15Tyr Asp Ala Ile Ala Val Leu Leu Asn Glu Met His Ala Gly His Cys20 25 30Asp Phe Gly Leu Val Gly Pro Ala Pro Asp Ile Val Thr Asp Ala Ala35 40 45Gly Asp Asp Arg Ala Gly Leu Gly Val Asp Glu Gln Phe Arg His Val50 55 60Gly Phe Leu Glu Pro Ala Pro Val Leu Val Asp Gln Arg Asp Asp Leu65 70 75 80Gly Gly Leu Thr Val Asp Trp Lys Val Ser Trp Pro Arg Gln Arg Gly85 90 95Ala Thr Val Leu Ala Ala Val His Glu Trp Pro Pro Ile Val Val His100 105 110Phe Leu Val Ala Glu Leu Ser Gln Asp Arg Pro Gly Gln His Pro Phe115 120 125Asp Lys Asp Val Val Leu Gln Arg His Trp Leu Ala Leu Arg Arg Ser130 135 140Glu Thr Leu Glu His Thr Pro His Gly Arg Arg Pro Val Arg Pro Arg145 150 155 160His Arg Gly Asp Asp Arg Phe His Glu Arg Asp Pro Leu His Ser Val165 170 175Ala Met Leu Val Ser Pro Val Glu Ala Glu Arg Arg Ala Pro Val Val180 185 190Gln His Gln Tyr His Val Val Ala Glu Val Glu Arg Ile Pro Glu Arg195 200 205Glu Gln Lys Val Ser Leu Leu Ala Ile Ala Ile Ala Val Gly Ser Arg210 215 220Trp Ala Glu Leu Val Arg Arg Ala His Pro Asp Gln Ile Ala Gly His225 230 235 240Gln Pro Ala Gln Pro Phe Gln Val Arg His Asp Val Ala Pro Gln Val245 250 255Arg Arg Arg Gly Val Ala Val Leu Lys Asp Asp Gly Val Thr Leu Ala260 265 270Phe Val Asp Ile Arg His Ala Leu Pro Gly Asp Phe275 280(2)SEQ ID NO163的信息(i)序列特征(A)长度264个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO163ATGAACATGT CGTCGGTGGT GGGTCGCAAG GCCTTTGCGC GATTCGCCGG CTACTCCTCC 60GCCATGCACG CGATCGCCGG TTTCTCCGAT GCGTTGCGCC AAGACCTGCG GGGTAGCGGA 120ATCGCCGTCT CGGTGATCCA CCCGGCGCTG ACCCAGACAC CGCTGTTGGC CAACGTCGAC 180CCCGCCGACA TGCCGCCGCC GTTTCGCAGC CTCACGCCCA TTCCCGTTCA CTGGGTCGCG 240GCAGCGGTGC TTGACGGTGT GGCG264(2)SEQ ID NO164的信息(i)序列特征(A)长度1171个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO164TAGTCGGCGA CGATGACGTC GCGGTCCAGG CCGACCGCTT CAAGCACCAG CGCGACCACG60AAGCCGGTGC GATCCTTACC CGCGAAGCAG TGGGTGAGCA CCGGGCGTCC GGCGGCAAGC 120AGTGTGACGA CACGATGTAG CGCGCGCTGT GCTCCATTGC GCGTTGGGAA TTGGCGATAC 180TCGTCGGTCA TGTAGCGGGT GGCCGCGTCA TTTATCGACT GGCTGGATTC GCCGGACTCG 240CCGTTGGACC CGTCATTGGT TAGCAGCCTC TTGAATGCGG TTTCGTGCGG CGCTGAGTCG 300TCGGCGTCAT CATCGGCGAG GTCGGGGAAC GGCAGCAGGT GGACGTCGAT GCCGTCCGGA 360ACCCGTCCTG GACCGCGGCG GGCAACCTCC CGGGACGACC GCAGGTCGGC AACGTCGGTG 420ATCCCCAGCC GGCGCAGCGT TGCCCCTCGT GCCGAATTCG GCACGAGGCT GGCGAGCCAC 480CGGGCATCAC CAAGCAACGC TTGCCCAGTA CGGATCGTCA CTTCCGCATC CGGCAGACCA 540ATCTCCTCGC CGCCCATCGT CAGATCCCGC TCGTGCGTTG ACAAGAACGG CCGCAGATGT 600GCCAGCGGGT ATCGGAGATT GAACCGCGCA CGCAGTTCTT CAATCGCTGC GCGCTGCCGC 660ACTATTGGCA CTTTCCGGCG GTCGCGGTAT TCAGCAAGCA TGCGAGTCTC GACGAACTCG 720CCCCACGTAA CCCACGGCGT AGCTCCCGGC GTGACGCGGA GGATCGGCGG GTGATCTTTG 780CCGCCACGCT CGTAGCCGTT GATCCACCGC TTCGCGGTGC CGGCGGGGAG GCCGATCAGC 840TTATCGACCT CGGCGTATGC CGACGGCAAG CTGGGCGCGT TCGTCGAGGT CAAGAACTCC 900ACCATCGGCA CCGGCACCAA GGTGCCGCAC CTGACCTACG TCGGCGACGC CGACATCGGC 960GAGTACAGCA ACATCGGCGC CTCCAGCGTG TTCGTCAACT ACGACGGTAC GTCCAAACGG 1020CGCACCACCG TCGGTTCGCA CGTACGGACC GGGTCCGACA CCATGTTCGT GGCCCCAGTA 1080ACCATCGGCG ACGGCGCGTA TACCGGGGCC GGCACAGTGG TGCGGGAGGA TGTCCCGCCG 1140GGGGCGCTGG CAGTGTCGGC GGGTCCGCAA C 1171(2)SEQ ID NO165的信息(i)序列特征(A)长度227个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO165GCAAAGGCGG CACCGGCGGG GCCGGCATGA ACAGCCTCGA CCCGCTGCTA GCCGCCCAAG 60ACGGCGGCCA AGGCGGCACC GGCGGCACCG GCGGCAACGC CGGCGCCGGC GGCACCAGCT120TCACCCAAGG CGCCGACGGC AACGCCGGCA ACGGCGGTGA CGGCGGGGTC GGCGGCAACG180GCGGAAACGG CGGAAACGGC GCAGACAACA CCACCACCGC CGCCGCC 227(2)SEQ ID NO166的信息(i)序列特征(A)长度304个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO166CCTCGCCACC ATGGGCGGGC AGGGCGGTAG CGGTGGCGCC GGCTCTACCC CAGGCGCCAA 60GGGCGCCCAC GGCTTCACTC CAACCAGCGG CGGCGACGGC GGCGACGGCG GCAACGGCGG120CAACTCCCAA GTGGTCGGCG GCAACGGCGG CGACGGCGGC AATGGCGGCA ACGGCGGCAG180CGCCGGCACG GGCGGCAACG GCGGCCGCGG CGGCGACGGC GCGTTTGGTG GCATGAGTGC240CAACGCCACC AACCCTGGTG AAAACGGGCC AAACGGTAAC CCCGGCGGCA ACGGTGGCGC300CGGC 304(2)SEQ ID NO167的信息(i)序列特征(A)长度1439个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO167GTGGGACGCT GCCGAGGCTG TATAACAAGG ACAACATCGA CCAGCGCCGG CTCGGTGAGC 60TGATCGACCT ATTTAACAGT GCGCGCTTCA GCCGGCAGGG CGAGCACCGC GCCCGGGATC 120TGATGGGTGA GGTCTACGAA TACTTCCTCG GCAATTTCGC TCGCGCGGAA GGGAAGCGGG 180GTGGCGAGTT CTTTACCCCG CCCAGCGTGG TCAAGGTGAT CGTGGAGGTG CTGGAGCCGT 240CGAGTGGGCG GGTGTATGAC CCGTGCTGCG GTTCCGGAGG CATGTTTGTG CAGACCGAGA 300AGTTCATCTA CGAACACGAC GGCGATCCGA AGGATGTCTC GATCTATGGC CAGGAAAGCA 360TTGAGGAGAC CTGGCGGATG GCGAAGATGA ACCTCGCCAT CCACGGCATC GACAACAAGG 420GGCTCGGCGC CCGATGGAGT GATACCTTCG CCCGCGACCA GCACCCGGAC GTGCAGATGG 480ACTACGTGAT GGCCAATCCG CCGTTCAACA TCAAAGACTG GGCCCGCAAC GAGGAAGACC 540CACGCTGGCG CTTCGGTGTT CCGCCCGCCA ATAACGCCAA CTACGCATGG ATTCAGCACA 600TCCTGTACAA CTTGGCGCCG GGAGGTCGGG CGGGCGTGGT GATGGCCAAC GGGTCGATGT 660CGTCGAACTC CAACGGCAAG GGGGATATTC GCGCGCAAAT CGTGGAGGCG GATTTGGTTT 720CCTGCATGGT CGCGTTACCC ACCCAGCTGT TCCGCAGCAC CGGAATCCCG GTGTGCCTGT 780GGTTTTTCGC CAAAAACAAG GCGGCAGGTA AGCAAGGGTC TATCAACCGG TGCGGGCAGG 840TGCTGTTCAT CGACGCTCGT GAACTGGGCG ACCTAGTGGA CCGGGCCGAG CGGGCGCTGA 900CCAACGAGGA GATCGTCCGC ATCGGGGATA CCTTCCACGC GAGCACGACC ACCGGCAACG 960CCGGCTCCGG TGGTGCCGGC GGTAATGGGG GCACTGGCCT CAACGGCGCG GGCGGTGCTG1020GCGGGGCCGG CGGCAACGCG GGTGTCGCCG GCGTGTCCTT CGGCAACGCT GTGGGCGGCG1080ACGGCGGCAA CGGCGGCAAC GGCGGCCACG GCGGCGACGG CACGACGGGC GGCGCCGGCG1140GCAAGGGCGG CAACGGCAGC AGCGGTGCCG CCAGCGGCTC AGGCGTCGTC AACGTCACCG1200CCGGCCACGG CGGCAACGGC GGCAATGGCG GCAACGGCGG CAACGGCTCC GCGGGCGCCG1260GCGGCCAGGG CGGTGCCGGC GGCAGCGCCG GCAACGGCGG CCACGGCGGC GGTGCCACCG1320GCGGCGCCAG CGGCAAGGGC GGCAACGGCA CCAGCGGTGC CGCCAGCGGC TCAGGCGTCA1380TCAACGTCAC CGCCGGCCAC GGCGGCAACG GCGGCAATGG CCGCAACGGC GGCAACGGC 1439(2)SEQ ID NO168的信息(i)序列特征(A)长度329个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO168GGGCCGGCGG GGCCGGATTT TCTCGTGCCT TGATTGTCGC TGGGGATAAC GGCGGTGATG60GTGGTAACGG CGGGATGGGC GGGGCTGGCG GGGCTGGCGG CCCCGGCGGG GCCGGCGGCC 120TGATCAGCCT GCTGGGCGGC CAAGGCGCCG GCGGGGCCGG CGGGACCGGC GGGGCCGGCG 180GTGTTGGCGG TGACGGCGGG GCCGGCGGCC CCGGCAACCA GGCCTTCAAC GCAGGTGCCG 240GCGGGGCCGG CGGCCTGATC AGCCTGCTGG GCGGCCAAGG CGCCGGCGGG GCCGGCGGGA 300CCGGCGGGGC CGGCGGTGTT GGCGGTGAC 329(2)SEQ ID NO169的信息(i)序列特征(A)长度80个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO169GCAACGGTGG CAACGGCGGC ACCAGCACGA CCGTGGGGAT GGCCGGAGGT AACTGTGGTG60CCGCCGGGCT GATCGGCAAC80(2)SEQ ID NO170的信息(i)序列特征(A)长度392个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO170GGGCTGTGTC GCACTCACAC CGCCGCATTC GGCGACGTTG GCCGCCCAAT ATCCAGCTCA60AGGCCTACTA CTTACCGTCG GAGGACCGCC GCATCAAGGT GCGGGTCAGC GCCCAAGGAA 120TCAAGGTCAT CGACCGCGAC GGGCATCGAG GCCGTCGTCG CGCGGCTCGG GCAGGATCCG 180CCCCGGCGCA CTTCGCGCGC CAAGCGGGCT CATCGCTCCG AACGGCGGCG ATCCTGTGAG 240CACAACTGAT GGCGCGCAAC GAGATTCGTC CAATTGTCAA GCCGTGTTCG ACCGCAGGGA 300CCGGTTATAC GTATGTCAAC CTATGTCACT CGCAAGAACC GGCATAACGA TCCCGTGATC 360CGCCGACAGC CCACGAGTGC AAGACCGTTA CA 392(2)SEQ ID NO171的信息(i)序列特征(A)长度535个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO171ACCGGCGCCA CCGGCGGCAC CGGGTTCGCC GGTGGCGCCG GCGGGGCCGG CGGGCAGGGC 60GGTATCAGCG GTGCCGGCGG CACCAACGGC TCTGGTGGCG CTGGCGGCAC CGGCGGACAA 120GGCGGCGCCG GGGGCGCTGG CGGGGCCGGC GCCGATAACC CCACCGGCAT CGGCGGCGCC 180GGCGGCACCG GCGGCACCGG CGGAGCGGCC GGAGCCGGCG GGGCCGGTGG CGCCATCGGT 240ACCGGCGGCA CCGGCGGCGC GGTGGGCAGC GTCGGTAACG CCGGGATCGG CGGTACCGGC 300GGTACGGGTG GTGTCGGTGG TGCTGGTGGT GCAGGTGCGG CTGCGGCCGC TGGCAGCAGC 360GCTACCGGTG GCGCCGGGTT CGCCGGCGGC GCCGGCGGAG AAGGCGGACC GGGCGGCAAC 420AGCGGTGTGG GCGGCACCAA CGGCTCCGGC GGCGCCGGCG GTGCAGGCGG CAAGGGCGGC 480ACCGGAGGTG CCGGCGGGTC CGGCGCGGAC AACCCCACCG GTGCTGGTTT CGCCG 535(2)SEQ ID NO172的信息(i)序列特征(A)长度690个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO172CCGACGTCGC CGGGGCGATA CGGGGGTCAC CGACTACTAC ATCATCCGCA CCGAGAATCG 60GCCGCTGCTG CAACCGCTGC GGGCGGTGCC GGTCATCGGA GATCCGCTGG CCGACCTGAT 120CCAGCCGAAC CTGAAGGTGA TCGTCAACCT GGGCTACGGC GACCCGAACT ACGGCTACTC 180GACGAGCTAC GCCGATGTGC GAACGCCGTT CGGGCTGTGG CCGAACGTGC CGCCTCAGGT 240CATCGCCGAT GCCCTGGCCG CCGGAACACA AGAAGGCATC CTTGACTTCA CGGCCGACCT 300GCAGGCGCTG TCCGCGCAAC CGCTCACGCT CCCGCAGATC CAGCTGCCGC AACCCGCCGA 360TCTGGTGGCC GCGGTGGCCG CCGCACCGAC GCCGGCCGAG GTGGTGAACA CGCTCGCCAG 420GATCATCTCA ACCAACTACG CCGTCCTGCT GCCCACCGTG GACATCGCCC TCGCCTGGTC 480ACCACCCTGC CGCTGTACAC CACCCAACTG TTCGTCAGGC AACTCGCTGC GGGCAATCTG 540ATCAACGCGA TCGGCTATCC CCTGGCGGCC ACCGTAGGTT TAGGCACGAT CGATAGCGGG 600CGGCGTGGAA TTGCTCACCC TCCTCGCGGC GGCCTCGGAC ACCGTTCGAA ACATCGAGGG 660CCTCGTCACC TAACGGATTC CCGACGGCAT 690(2)SEQ ID NO173的信息(i)序列特征(A)长度407个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO173ACGGTGACGG CGGTACTGGC GGCGGCCACG GCGGCAACGG CGGGAATCCC GGGTGGCTCT 60TGGGCACAGC CGGGGGTGGC GGCAACGGTG GCGCCGGCAG CACCGGTACT GCAGGTGGCG120GCTCTGGGGG CACCGGCGGC GACGGCGGGA CCGGCGGGCG TGGCGGCCTG TTAATGGGCG180CCGGCGCCGG CGGGCACGGT GGCACTGGCG GCGCGGGCGG TGCCGGTGTC GACGGTGGCG240GCGCCGGCGG GGCCGGCGGG GCCGGCGGCA ACGGCGGCGC CGGGGGTCAA GCCGCCCTGC300TGTTCGGGCG CGGCGGCACC GGCGGAGCCG GCGGCTACGG CGGCGATGGC GGTGGCGGCG360GTGACGGCTT CGACGGCACG ATGGCCGGCC TGGGTGGTAC CGGTGGC 407(2)SEQ ID NO174的信息(i)序列特征(A)长度468个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO174GATCGGTCAG CGCATCGCCC TCGGCGGCAA GCGATTCCGC GGTCTCACCG AAGAACATCG 60TGCACGCGGC GGCGCGGACC AGCCCGCTGC GCTGCGGCGC GTCGAACGCC TCCAGCAGGC120ACAGCCAGTC CTTGGCGGCC TGCGAGGCGA ACACGTCGGT GTCACCGGTG TAGATCGCCG180GGATGCCCGC CTCCGCCAAC GCATTCCGGC ACGCCCGCGC GTCTTTGTGA TGCTCGACGA240TCACCGCGAT GTCTGCGGCC ACCACGGGCC GCCCGGCGAA GGTGGCCCCG CTGGCCAGTA300GCGCCGCGAC GTCGGCGGCC AGGTCGTCGG GGATGTGCCG GCGCAGCGCT CCGGCGCGAC360GCCCGAAAAA CGACCCCTCA CCCAGCTGGG TCCCGCTGGC ATATCCCTTG CCGTCCTGGG420CGATATTGGA CGCGCATGCC CCGACCGCGT ACAGGCCGGC CACCACCG 468(2)SEQ ID NO175的信息(i)序列特征(A)长度219个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO175GGTGGTAACG GCGGCCAGGG TGGCATCGGC GGCGCCGGCG AGAGAGGCGC CGACGGCGCC60GGCCCCAATG CTAACGGCGC AAACGGCGAG AACGGCGGTA GCGGTGGTAA CGGTGGCGAC 120GGCGGCGCCG GCGGCAATGG CGGCGCGGGC GGCAACGCGC AGGCGGCCGG GTACACCGAC 180GGCGCCACGG GCACCGGCGG CGACGGCGGC AACGGCGGC 219(2)SEQ ID NO176的信息(i)序列特征(A)长度494个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO176TAGCTCCGGC GAGGGCGGCA AGGGCGGCGA CGGTGGCCAC GGCGGTGACG GCGTCGGCGG60CAACAGTTCC GTCACCCAAG GCGGCAGCGG CGGTGGCGGC GGCGCCGGCG GCGCCGGCGG 120CAGCGGCTTT TTCGGCGGCA AGGGCGGCTT CGGCGGCGAC GGCGGTCAGG GCGGCCCCAA 180CGGCGGCGGT ACCGTCGGCA CCGTGGCCGG TGGCGGCGGC AACGGCGGTG TCGGCGGCCG 240GGGCGGCGAC GGCGTCTTTG CCGGTGCCGG CGGCCAGGGC GGCCTCGGTG GGCAGGGCGG 300CAATGGCGGC GGCTCCACCG GCGGCAACGG CGGCCTTGGC GGCGCGGGCG GTGGCGGAGG 360CAACGCCCCG GCTCGTGCCG AATCCGGGCT GACCATGGAC AGCGCGGCCA AGTTCGCTGC 420CATCGCATCA GGCGCGTACT GCCCCGAACA CCTGGAACAT CACCCGAGTT AGCGGGGCGC480ATTTCCTGAT CACC 494(2)SEQ ID NO177的信息(i)序列特征(A)长度220个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO177GGGCCGGTGG TGCCGCGGGC CAGCTCTTCA GCGCCGGAGG CGCGGCGGGT GCCGTTGGGG 60TTGGCGGCAC CGGCGGCCAG GGTGGGGCTG GCGGTGCCGG AGCGGCCGGC GCCGACGCCC120CCGCCAGCAC AGGTCTAACC GGTGGTACCG GGTTCGCTGG CGGGGCCCGC GGCGTCGGCG180GCCAGAGCGG CAACGCCATT GCCGGCGGCA TCAACGGCTC 220(2)SEQ ID NO178的信息(i)序列特征(A)长度388个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO178ATGGCGGCAA CGGGGGCCCC GGCGGTGCTG GCGGGGCCGG CGACTACAAT TTCCAACGGC 60GGGCAGGGTG GTGCCGGCGG CCAAGGCGGC CAAGGCGGCC TGGGCGGGGC AAGCACCACC120TGATCGGCCT AGCCGCACCC GGGAAAGCCG ATCCAACAGG CGACGATGCC GCCTTCCTTG180CCGCGTTGGA CCAGGCCGGC ATCACCTACG CTGACCCAGG CCACGCCATA ACGGCCGCCA240AGGCGATGTG TGGGCTGTGT GCTAACGGCG TAACAGGTCT ACAGCTGGTC GCGGACCTGC300GGGACTACAA TCCCGGGCTG ACCATGGACA GCGCGGCCAA GTTCGCTGCC ATCGCATCAG360GCGCGTACTG CCCCGAACAC CTGGAACA 388(2)SEQ ID NO179的信息(i)序列特征
(A)长度400个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO179GCAAAGGCGG CACCGGCGGG GCCGGCATGA ACAGCCTCGA CCCGCTGCTA GCCGCCCAAG60ACGGCGGCCA AGGCGGCACC GGCGGCACCG GCGGCAACGC CGGCGCCGGC GGCACCAGCT 120TCACCCAAGG CGCCGACGGC AACGCCGGCA ACGGCGGTGA CGGCGGGGTC GGCGGCAACG 180GCGGAAACGG CGGAAACGGC GCAGACAACA CCACCACCGC CGCCGCCGGC ACCACAGGCG 240GCGACGGCGG GGCCGGCGGG GCCGGCGGAA CCGGCGGAAC CGGCGGAGCC GCCGGCACCG 300GCACCGGCGG CCAACAAGGC AACGGCGGCA ACGGCGGCAC CGGCGGCAAA GGCGGCACCG 360GCGGCGACGG TGCACTCTCA GGCAGCACCG GTGGTGCCGG 400(2)SEQ ID NO180的信息(i)序列特征(A)长度538个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO180GGCAACGGCG GCAACGGCGG CATCGCCGGC ATTGGGCGGC AACGGCGTTC CGGGACGGGC 60AGCGGCAACG GCGGCCAACG GCGGCAGCGG CGGCAACGGC GGCAACGCCG GCATGGGCGG 120CAACAGCGGC ACCGGCAGCG GCGACGGCGG TGCCGGCGGG AACGGCGGCG CGGCGGGCAC 180GGGCGGCACC GGCGGCGACG GCGGCCTCAC CGGTACTGGC GGCACCGGCG GCAGCGGTGG 240CACCGGCGGT GACGGCGGTA ACGGCGGCAA CGGAGCAGAT AACACCGCAA ACATGACTGC 300GCAGGCGGGC GGTGACGGTG GCAACGGCGG CGACGGTGGC TTCGGCGGCG GGGCCGGGGC 360CGGCGGCGGT GGCTTGACCG CTGGCGCCAA CGGCACCGGC GGGCAAGGCG GCGCCGGCGG 420CGATGGCGGC AACGGGGCCA TCGGCGGCCA CGGCCCACTC ACTGACGACC CCGGCGGCAA 480CGGGGGCACC GGCGGCAACG GCGGCACCGG CGGCACCGGC GGCGCGGGCA TCGGCAGC538(2)SEQ ID NO181的信息(i)序列特征(A)长度239个碱基对
(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO181GGGCCGGTGG TGCCGCGGGC CAGCTCTTCA GCGCCGGAGG CGCGGCGGGT GCCGTTGGGG 60TTGGCGGCAC CGGCGGCCAG GGTGGGGCTG GCGGTGCCGG AGCGGCCGGC GCCGACGCCC120CCGCCAGCAC AGGTCTAACC GGTGGTACCG GGTTCGCTGG CGGGGCCGGC GGCGTCGGCG180GCCACGGCGG CAACGCCATT GCCGGCGGCA TCAACGGCTC CGGTGGTGCC GGCGGCACC 239(2)SEQ ID NO182的信息(i)序列特征(A)长度985个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO182AGCAGCGCTA CCGGTGGCGC CGGGTTCGCC GGCGGCGCCG GCGGAGAAGG CGGAGCGGGC 60GGCAACAGCG GTGTGGGCGG CACCAACGGC TCCGGCGGCG CCGGCGGTGC AGGGGGCAAG120GGCGGCACCG GAGGTGCCGG CGGGTCCGGC GCGGACAACC CCACCGGTGC TGGTTTCGCC180GGTGGCGCCG GCGGCACAGG TGGCGCGGCC GGCGCCGGCG GGGCCGGCGG GGCGACCGGT240ACCGGCGGCA CCGGCGGCGT TGTCGGCGCC ACCGGTAGTG CAGGCATCGG CGGGGCCGGC300GGCCGCGGCG GTGACGGCGG CGATGGGGCC AGCGGTCTCG GCCTGGGCCT CTCCGGCTTT360GACGGCGGCC AAGGCGGCCA AGGCGGGGCC GGCGGCAGCG CCGGCGCCGG CGGCATCAAC420GGGGCCGGCG GGGCCGGCGG CAACGGCGGC GACGGCGGGG ACGGCGCAAC CGGTGCCGCA480GGTCTCGGCG ACAACGGCGG GGTCGGCGGT GACGGTGGGG CCGGTGGCGC CGCCGGCAAC540GGCGGCAACG CGGGCGTCGG CCTGACAGCC AAGGCCGGCG ACGGCGGCGC CGCGGGCAAT600GGCGGCAACG GGGGCGCCGG CGGTGCTGGC GGGGCCGGCG ACAACAATTT CAACGGCGGC660CAGGGTGGTG CCGGCGGCCA AGGCGGCCAA GGCGGCTTGG GCGGGGCAAG CACCACCTGA720TCGGCCTAGC CGCACCCGGG AAAGCCGATC CAACAGGCGA CGATGCCGCC TTCCTTGCCG780CGTTGGACCA GGCCGGCATC ACCTACGCTG ACCCAGGCCA CGCCATAACG GCCGCCAAGG840CGATGTGTGG GCTGTGTGCT AACGGCGTAA CAGGTCTACA GCTGGTCGCG GACCTGCGGG900AATACAATCC CGGGCTGACC ATGGACAGCG CGGCCAAGTT CGCTGCCATC GCATCAGGCG960CGTACTGCCC CGAACACCTG GAACA 985(2)SEQ ID NO183的信息(i)序列特征(A)长度2138个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO183CGGCACGAGG ATCGGTACCC CGCGGCATCG GCAGCTGCCG ATTCGCCGGG TTTCCCCACC 60CGAGGAAAGC CGCTACCAGA TGGCGCTGCC GAAGTAGGGC GATCCGTTCG CGATGCCGGC 120ATGAACGGGC GGCATCAAAT TAGTGCAGGA ACCTTTCAGT TTAGCGACGA TAATGGCTAT 180AGCACTAAGG AGGATGATCC GATATGACGC AGTCGCAGAC CGTGACGGTG GATCAGCAAG 240AGATTTTGAA CAGGGCCAAC GAGGTGGAGG CCCCGATGGC GGACCCACCG ACTGATGTCC 300CCATCACACC GTGCGAACTC ACGGCGGCTA AAAACGCCGC CCAACAGCTG GTATTGTCCG 360CCGACAACAT GCGGGAATAC CTGGCGGCCG GTGCCAAAGA GCGGCAGCGT CTGGCGACCT 420CGCTGCGCAA CGCGGCCAAG GCGTATGGCG AGGTTGATGA GGAGGCTGCG ACCGCGCTGG 480ACAACGACGG CGAAGGAACT GTGCAGGCAG AATCGGCCGG GGCCGTCGGA GGGGACAGTT 540CGGCCGAACT AACCGATACG CCGAGGGTGG CCACGGCCGG TGAACCCAAC TTCATGGATC 600TCAAAGAAGC GGCAAGGAAG CTCGAAACGG GCGACCAAGG CGCATCGCTC GCGCACTTTG 660CGGATGGGTG GAACACTTTC AACCTGACGC TGCAAGGCGA CGTCAAGCGG TTCCGGGGGT 720TTGACAACTG GGAAGGCGAT GCGGCTACCG CTTGCGAGGC TTCGCTCGAT CAACAACGGC 780AATGGATACT CCACATGGCC AAATTGAGCG CTGCGATGGC CAAGCAGGCT CAATATGTCG 840CGCAGCTGCA CGTGTGGGCT AGGCGGGAAC ATCCGACTTA TGAAGACATA GTCGGGCTCG 900AACGGCTTTA CGCGGAAAAC CCTTCGGCCC GCGACCAAAT TCTCCCGGTG TACGCGGAGT 960ATCAGCAGAG GTCGGAGAAG GTGCTGACCG AATACAACAA CAAGGCAGCC CTGGAACCGG1020TAAACCCGCC GAAGCCTCCC CCCGCCATCA AGATCGACCC GCCCCCGCCT CCGCAAGAGC1080AGGGATTGAT CCCTGGCTTC CTGATGCCGC CGTCTGACGG CTCCGGTGTG ACTCCCGGTA1140CCGGGATGCC AGCCGCACCG ATGGTTCCGC CTACCGGATC GCCGGGTGGT GGCCTCCCGG1200CTGACACGGC GGCGCAGCTG ACGTCGGCTG GGCGGGAAGC CGCAGCGCTG TCGGGCGACG1260TGGCGGTCAA AGCGGCATCG CTCGGTGGCG GTGGAGGCGG CGGGGTGCCG TCGGCGCCGT1320TGGGATCCGC GATCGGGGGC GCCGAATCGG TGCGGCCCGC TGGCGCTGGT GACATTGCCG1380GCTTAGGCCA GGGAAGGGCC GGCGGCGGCG CCGCGCTGGG CGGCGGTGGC ATGGGAATGC1440CGATGGGTGC CGCGCATCAG GGACAAGGGG GCGCCAAGTC CAAGGGTTCT CAGCAGGAAG1500ACGAGGCGCT CTACACCGAG GATCGGGCAT GGACCGAGGC CGTCATTGGT AACCGTCGGC 1560GCCAGGACAG TAAGGAGTCG AAGTGAGCAT GGACGAATTG GACCCGCATG TCGCCCGGGC 1620GTTGACGCTG GCGGCGCGGT TTCAGTCGGC CCTAGACGGG ACGCTCAATC AGATGAACAA 1680CGGATCCTTC CGCGCCACCG ACGAAGCCGA GACCGTCGAA GTGACGATCA ATGGGCACCA 1740GTGGCTCACC CGCCTGCGCA TCGAAGATGG TTTGCTGAAG AAGCTGGGTG CCGAGGCGGT 1800GGCTCAGCGG GTCAACGAGG CGCTGCACAA TGCGCAGGCC GCGGCGTCCG CGTATAACGA 1860CGCGGCGGGC GAGCAGCTGA CCGCTGCGTT ATCGGCCATG TCCCGCGCGA TGAACGAAGG 1920AATGGCCTAA GCCCATTGTT GCGGTGGTAG CGACTACGCA CCGAATGAGC GCCGCAATGC 1980GGTCATTCAG CGCGCCCGAC ACGGCGTGAG TACGCATTGT CAATGTTTTG ACATGGATCG 2040GCCGGGTTCG GAGGGCGCCA TAGTCCTGGT CGCCAATATT GCCGCAGCTA GCTGGTCTTA 2100GGTTCGGTTA CGCTGGTTAA TTATGACGTC CGTTACCA 2138(2)SEQ ID NO184的信息(i)序列特征(A)长度460个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO184Met Thr Gln Ser Gln Thr Val Thr Val Asp Gln Gln Glu Ile Leu Asn1 5 10 15Arg Ala Asn Glu Val Glu Ala Pro Mat Ala Asp Pro Pro Thr Asp Val20 25 30Pro Ile Thr Pro Cys Glu Leu Thr Ala Ala Lys Asn Ala Ala Gln Gln35 40 45Leu Val Leu Ser Ala Asp Asn Met Arg Glu Tyr Leu Ala Ala Gly Ala50 55 60Lys Glu Arg Gln Arg Leu Ala Thr Ser Leu Arg Asn Ala Ala Lys Ala65 70 75 80Tyr Gly Glu Val Asp Glu Glu Ala Ala Thr Ala Leu Asp Asn Asp Gly85 90 95Glu Gly Thr Val Gln Ala Glu Ser Ala Gly Ala Val Gly Gly Asp Ser100 105 110Ser Ala Glu Leu Thr Asp Thr Pro Arg Val Ala Thr Ala Gly Glu Pro115 120 125Asn Phe Met Asp Leu Lys Glu Ala Ala Arg Lys Leu Glu Thr Gly Asp130 135 140Gln Gly Ala Ser Leu Ala His Phe Ala Asp Gly Trp Asn Thr Phe Asn145 150 155 160Leu Thr Leu Gln Gly Asp Val Lys Arg Phe Arg Gly Phe Asp Asn Trp165 170 175Glu Gly Asp Ala Ala Thr Ala Cys Glu Ala Ser Leu Asp Gln Gln Arg180 185 190Gln Trp Ile Leu His Met Ala Lys Leu Ser Ala Ala Met Ala Lys Gln195 200 205Ala Gln Tyr Val Ala Gln Leu His Val Trp Ala Arg Arg Glu His Pro210 215 220Thr Tyr Glu Asp Ile Val Gly Leu Glu Arg Leu Tyr Ala Glu Asn Pro225 230 235 240Ser Ala Arg Asp Gln Ile Leu Pro Val Tyr Ala Glu Tyr Gln Gln Arg245 250 255Ser Glu Lys Val Leu Thr Glu Tyr Asn Asn Lys Ala Ala Leu Glu Pro260 265 270Val Asn Pro Pro Lys Pro Pro Pro Ala Ile Lys Ile Asp Pro Pro Pro275 280 285Pro Pro Gln Glu Gln Gly Leu Ile Pro Gly Phe Leu Met Pro Pro Ser290 295 300Asp Gly Ser Gly Val Thr Pro Gly Thr Gly Met Pro Ala Ala Pro Met305 310 315 320Val Pro Pro Thr Gly Ser Pro Gly Gly Gly Leu Pro Ala Asp Thr Ala325 330 335Ala Gln Leu Thr Ser Ala Gly Arg Glu Ala Ala Ala Leu Ser Gly Asp340 345 350Val Ala Val Lys Ala Ala Ser Leu Gly Gly Gly Gly Gly Gly Gly Val355 360 365Pro Ser Ala Pro Leu Gly Ser Ala Ile Gly Gly Ala Glu Ser Val Arg370 375 380Pro Ala Gly Ala Gly Asp Ile Ala Gly Leu Gly Gln Gly Arg Ala Gly385 390 395 400Gly Gly Ala Ala Leu Gly Gly Gly Gly Met Gly Met Pro Met Gly Ala405 410 415Ala His Gln Gly Gln Gly Gly Ala Lys Ser Lys Gly Ser Gln Gln Glu420 425 430Asp Glu Ala Leu Tyr Thr Glu Asp Arg Ala Trp Thr Glu Ala Val Ile435 440 445Gly Asn Arg Arg Arg Gln Asp Ser Lys Glu Ser Lys450 455 460(2)INFORMATION FOR SEQ ID NO185(2)SEQ ID NO185的信息(i)序列特征(A)长度277个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO185Ala Gly Asn Val Thr Ser Ala Ser Gly Pro His Arg Phe Gly Ala Pro1 5 10 15Asp Arg Gly Ser Gln Arg Arg Arg Arg His Pro Ala Ala Ser Thr Ala20 25 30Thr Glu Arg Cys Arg Phe Asp Arg His Val Ala Arg Gln Arg Cys Gly35 40 45Phe Pro Pro Ser Arg Arg Gln Leu Arg Arg Arg Val Ser Arg Glu Ala50 55 60Thr Thr Arg Arg Ser Gly Arg Arg Asn His Arg Cys Gly Trp His Pro65 70 75 80Gly Thr Gly Ser His Thr Gly Ala Val Arg Arg Arg His Gln Glu Ala85 90 95Arg Asp Gln Ser Leu Leu Leu Arg Arg Arg Gly Arg Val Asp Leu Asp100 105 110Gly Gly Gly Arg Leu Arg Arg Val Tyr Arg Phe Gln Gly Cys Leu Val115 120 125Val Val Phe Gly Gln His Leu Leu Arg Pro Leu Leu Ile Leu Arg Val130 135 140His Arg Glu Asn Leu Val Ala Gly Arg Arg Val Phe Arg Val Lys Pro145 150 155 160Phe Glu Pro Asp Tyr Val Phe Ile Ser Arg Met Phe Pro Pro Ser Pro165 170 175His Val Gln Leu Arg Asp Ile Leu Ser Leu Leu Gly His Arg Ser Ala180 185 190Gln Phe Gly His Val Glu Tyr Pro Leu Pro Leu Leu Ile Glu Arg Ser195 200 205Leu Ala Ser Gly Ser Arg Ile Ala Phe Pro Val Val Lys Pro Pro Glu210 215 220Pro Leu Asp Val Ala Leu Gln Arg Gln Val Glu Ser Val Pro Pro Ile225 230 235 240Arg Lys Val Arg Glu Arg Cys Ala Leu Val Ala Arg Phe Glu Leu Pro245 250 255Cys Arg Phe Phe Glu Ile His Glu Val Gly Phe Thr Gly Arg Gly His
260265 270Pro Arg Arg Ile Gly275(2)SEQ ID NO186的信息(i)序列特征(A)长度192个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO186Arg Val Ala Ala Ser Phe Ile Asp Trp Leu Asp Ser Pro Asp Ser Pro1 5 10 15Leu Asp Pro Ser Leu Val Ser Ser Leu Leu Asn Ala Val Ser Cys Gly20 25 30Ala Glu Ser Ser Ala Ser Ser Ser Ala Arg Ser Gly Asn Gly Ser Arg35 40 45Trp Thr Ser Met Pro Ser Gly Thr Arg Pro Gly Pro Arg Arg Ala Thr50 55 60Ser Arg Asp Asp Arg Arg Ser Ala Thr Ser Val Ile Pro Ser Arg Arg65 70 75 80Ser Val Ala Pro Arg Ala Glu Phe Gly Thr Arg Leu Ala Ser His Arg85 90 95Ala Ser Pro Ser Asn Ala Cys Pro Val Arg Ile Val Thr Ser Ala Ser100 105 110Gly Arg Pro Ile Ser Ser Pro Pro Ile Val Arg Ser Arg Ser Cys Val115 120 125Asp Lys Asn Gly Arg Arg Cys Ala Ser Gly Tyr Arg Arg Leu Asn Arg130 135 140Ala Arg Ser Ser Ser Ile Ala Ala Arg Cys Arg Thr Ile Gly Thr Phe145 150 155 160Arg Arg Ser Arg Tyr Ser Ala Ser Met Arg Val Ser Thr Asn Ser Pro165 170 175His Val Thr His Gly Val Ala Pro Gly Val Thr Arg Arg Ile Gly Gly180 185 190(2)SEQ ID NO187的信息(i)序列特征(A)长度196个氨基酸(B)类型氨基酸
(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO187Gln Glu Arg Pro Gln Met Cys Gln Arg Val Ser Glu Ile Glu Pro Arg1 5 10 15Thr Gln Phe Phe Asn Arg Cys Ala Leu Pro His Tyr Trp His Phe Pro20 25 30Ala Val Ala Val Phe Ser Lys His Ala Ser Leu Asp Glu Leu Ala Pro35 40 45Arg Asn Pro Arg Arg Ser Ser Arg Arg Asp Ala Glu Asp Arg Arg Val50 55 60Ile Phe Ala Ala Thr Leu Val Ala Val Asp Pro Pro Leu Arg Gly Ala5 70 75 80Gly Gly Glu Ala Asp Gln Leu Ile Asp Leu Gly Val Cys Arg Arg Gln85 90 95Ala Gly Arg Val Arg Arg Gly Gln Glu Leu His His Arg His Arg His100 105 110Gln Gly Ala Ala Pro Asp Leu Arg Arg Arg Arg Arg His Arg Arg Val115 120 125Gln Gln His Arg Arg Leu Gln Arg Val Arg Gln Leu Arg Arg Tyr Val130 135 140Gln Thr Ala His His Arg Arg Phe Ala Arg Thr Asp Arg Val Arg His145 150 155 160His Val Arg Gly Pro Ser Asn His Arg Arg Arg Arg Val Tyr Arg Gly165 170 175Arg His Ser Gly Ala Gly Gly Cys Pro Ala Gly Gly Ala Gly Ser Val180 185 190Gly Gly Ser Ala195(2)SEQ ID NO188的信息(i)序列特征(A)长度311个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO188Val Arg Cys Gly Thr Leu Val Pro Val Pro Met Val Glu Phe Leu Thr15 10 15Ser Thr Asn Ala Pro Ser Leu Pro Ser Ala Tyr Ala Glu Val Asp Lys20 25 30Leu Ile Gly Leu Pro Ala Gly Thr Ala Lys Arg Trp Ile Asn Gly Tyr35 40 45Glu Arg Gly Gly Lys Asp His Pro Pro Ile Leu Arg Val Thr Pro Gly50 55 60Ala Thr Pro Trp Val Thr Trp Gly Glu Phe Val Glu Thr Arg Met Leu65 70 75 80Ala Glu Tyr Arg Asp Arg Arg Lys Val Pro Ile Val Arg Gln Arg Ala85 90 95Ala Ile Glu Glu Leu Arg Ala Arg Phe Asn Leu Arg Tyr Pro Leu Ala100 105 110His Leu Arg Pro Phe Leu Ser Thr His Glu Arg Asp Leu Thr Met Gly115 120 125Gly Glu Glu Ile Gly Leu Pro Asp Ala Glu Val Thr Ile Arg Thr Gly130 135 140Gln Ala Leu Leu Gly Asp Ala Arg Trp Leu Ala Ser Leu Val Pro Asn145 150 155 160Ser Ala Arg Gly Ala Thr Leu Arg Arg Leu Gly Ile Thr Asp Val Ala165 170 175Asp Leu Arg Ser Ser Arg Glu Val Ala Arg Arg Gly Pro Gly Arg Val180 185 190Pro Asp Gly Ile Asp Val His Leu Leu Pro Phe Pro Asp Leu Ala Asp195 200 205Asp Asp Ala Asp Asp Ser Ala Pro His Glu Thr Ala Phe Lys Arg Leu210 215 220Leu Thr Asn Asp Gly Ser Asn Gly Glu Ser Gly Glu Ser Ser Gln Ser225 230 235 240Ile Asn Asp Ala Ala Thr Arg Tyr Met Thr Asp Glu Tyr Arg Gln Phe245 250 255Pro Thr Arg Asn Gly Ala Gln Arg Ala Leu His Arg Val Val Thr Leu260 265 270Leu Ala Ala Gly Arg Pro Val Leu Thr His Cys Phe Ala Gly Lys Asp275 280 285Arg Thr Gly Phe Val Val Ala Leu Val Leu Glu Ala Val Gly Leu Asp290 295 300Arg Asp Val Ile Val Ala Asp305 310(2)SEQ ID NO189的信息(i)序列特征(A)长度2072个碱基对(B)类型核酸
(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO189CTCGTGCCGA TTCGGCACGA GCTGAGCAGC CCAAGGGGCC GTTCGGCGAA GTCATCGAGG 60CATTCGCCGA CGGGCTGGCC GGCAAGGGTA AGCAAATCAA CACCACGCTG AACAGCCTGT 120CGCAGGCGTT GAACGCCTTG AATGAGGGCC GCGGCGACTT CTTCGCGGTG GTACGCAGCC 180TGGCGCTATT CGTCAACGCG CTACATCAGG ACGACCAACA GTTCGTCGCG TTGAACAAGA 240ACCTTGCGGA GTTCACCGAC AGGTTGACCC ACTCCGATGC GGACCTGTCG AACGCCATCC 300AGCAATTCGA CAGCTTGCTC GCCGTCGCGC GCCCGTTCTT CGCCAAGAAC CGCGAGGTGC 360TGACGCATGA CGTCAATAAT CTCGCGACCG TGACCACCAC GTTGCTGCAG CCCGATCCGT 420TGGATGGGTT GGAGACCGTC CTGCACATCT TCCCGACGCT GGCGGCGAAC ATTAACCAGC 480TTTACCATCC GACACACGGT GGCGTGGTGT CGCTTTCCGC GTTCACGAAT TTCGCCAACC 540CGATGGAGTT CATCTGCAGC TCGATTCAGG CGGGTAGCCG GCTCGGTTAT CAAGAGTCGG 600CCGAACTCTG TGCGCAGTAT CTGGCGCCAG TCCTCGATGC GATCAAGTTC AACTACTTTC 660CGTTCGGCCT GAACGTGGCC AGCACCGCCT CGACACTGCC TAAAGAGATC GCGTACTCCG 720AGCCCCGCTT GCAGCCGCCC AACGGGTACA AGGACACCAC GGTGCCCGGC ATCTGGGTGC 780CGGATACGCC GTTGTCACAC CGCAACACGC AGCCCGGTTG GGTGGTGGCA CCCGGGATGC 840AAGGGGTTCA GGTGGGACCG ATCACGCAGG GTTTGCTGAC GCCGGAGTCC CTGGCCGAAC 900TCATGGGTGG TCCCGATATC GCCCCTCCGT CGTCAGGGCT GCAAACCCCG CCCGGACCCC 960CGAATGCGTA CGACGAGTAC CCCGTGCTGC CGCCGATCGG TTTACAGGCC CCACAGGTGC1020CGATACCACC GCCGCCTCCT GGGCCCGACG TAATCCCGGG TCCGGTGCCA CCGGTCTTGG1080CGGCGATCGT GTTCCCAAGA GATCGCCCGG CAGCGTCGGA AAACTTCGAC TACATGGGCC1140TCTTGTTGCT GTCGCCGGGC CTGGCGACCT TCCTGTTCGG GGTGTCATCT AGCCCCGCCC1200GTGGAACGAT GGCCGATCGG CACGTGTTGA TACCGGCGAT CACCGGCCTG GCGTTGATCG1260CGGCATTCGT CGCACATTCG TGGTACCGCA CAGAACATCC GCTCATAGAC ATGCGCTTGT1320TCCAGAACCG AGCGGTCGCG CAGGCCAACA TGACGATGAC GGTGCTCTCC CTCGGGCTGT1380TTGGCTCCTT CTTGCTGCTC CCGAGCTACC TCCAGCAAGT GTTGCACCAA TCACCGATGC1440AATCGGGGGT GCATATCATC CCACAGGGCC TCGGTGCCAT GCTGGCGATG CCGATCGCCG1500GAGCGATGAT GGACCGACGG GGACCGGCCA AGATCGTGCT GGTTGGGATC ATGCTGATCG1560CTGCGGGGTT GGGCACCTTC GCCTTTGGTG TCGCGCGGCA AGCGGACTAC TTACCCATTC1620TGCCGACCGG GCTGGCAATC ATGGGCATGG GCATGGGCTG CTCCATGATG CCACTGTCCG1680GGGCGGCAGT GCAGACCCTG GCCCCACATC AGATCGCTCG CGGTTCGACG CTGATCAGCG1740TCAACCAGCA GGTGGGCGGT TCGATAGGGA CCGCACTGAT GTCGGTGCTG CTCACCTACC1800AGTTCAATCA CAGCGAAATC ATCGCTACTG CAAAGAAAGT CGCACTGACC CCAGAGAGTG1860GCGCCGGGCG GGGGGCGGCG GTTGACCCTT CCTCGCTACC GCGCCAAACC AACTTCGCGG1920CCCAACTGCT GCATGACCTT TCGCACGCCT ACGCGGTGGT ATTCGTGATA GCGACCGCGC1980TAGTGGTCTC GACGCTGATC CCCGCGGCAT TCCTGCCGAA ACAGCAGGCT AGTCATCGAA2040GAGCACCGTT GCTATCCGCA TGACGTCTGC TT 2072(2)SEQ ID NO190的信息(i)序列特征(A)长度1923个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO190TCACCCCGGA GAAGTCGTTC GTCGACGACC TGGACATCGA CTCGCTGTCG ATGGTCGAGA 60TCGCCGTGCA GACCGAGGAC AAGTACGGCG TCAAGATCCC CGACGAGGAC CTCGCCGGTC 120TGCGTACCGT CGGTGACGTT GTCGCCTACA TCCAGAAGCT CGAGGAAGAA AACCCGGAGG 180CGGCTCAGGC GTTGCGCGCG AAGATTGAGT CGGAGAACCC CGATGCGGCA CGAGCAGATC 240GGTGCGTTTC ACCCACATCG CAAGCTCGAG ACGCCCGTCG TCCTCTTGCA CGCTCAGCCA 300GGTTGGCGTG TCGCCGCCTT CCAGCAAGTG TTCCCACCAC ACGAAGGGAC CCTCGCGAAA 360GGTGACTGAT CCGCGGACCA CATAGTCGAT GCCACCGTGG CTGACAATTG CGCCGGGTCC 420GAGTTGGCGG GGGCCGAATT GCGGCATTGC GTCGAAGGCC AGCGGATCCC GGCGCCCGCC 480CGGCGTGGCT GGTGTTTTGG GCCGCCGGAT GGCCACGACG AGAACGACGA TGGCGGCGAT 540GAACAGCGCC ACGGCAATCA CGACCAGCAG ATTTCCCACG CATACCCTCT CGTACCGCTG 600CGCCGCGGTT GGTCGATCGG TCGCATATCG ATGGCGCCGT TTAACGTAAC AGCTTTCGCG 660GGACCGGGGG TCACAACGGG CGAGTTGTCC GGCCGGGAAC CCGGCAGGTC TCGGCCGCGG 720TCACCCCAGC TCACTGGTGC ACCATCCGGG TGTCGGTGAG CGTGCAACTC AAACACACTC 780AACGGCAACG GTTTCTCAGG TCACCAGCTC AACCTCGACC CGCAATCGCT CGTACGTTTC 840GACCGCGCGC AGGTCGCGAG TCAGCAGCTT TGCGCCGGCA GCTTTCGCCG TGAAGCCGAC 900CAGGGCATCG TAGGTTGCGC CACCGGTGAC ATCGTGCTCG GCGAGGTGGT CGGTCAAGCC 960GCGATATGAG CAGGCATCCA GTGCCAGGTA GTTGCTGGAG GTGATGTCCG CCAAGTAGGC1020GTGGACGGCA ACAGGGGCAA TACGATGCGG CGGTGGTAGC CGGGTCAAGA CCGAATAGGT1080TTCCACAGCC GCGTGCGCGA TCAGATGGAC GCCACGGTTG AGCGCGCGCA CGGCGGCCTC1140GTGCCCTTCG TGCCAGGTCG CGAATCCGGC AACCAGCACG CTGGTGTCTG GTGCGATCAC 1200CGCCGTGTGC GATCGAGCGT TTCCCGAACG ATTTCGTCGG TCAACGGGGG CAGGGGACGT 1260TCTGGCCGTG CGACGAGAAC CGAGCCTTCC CGAACGAGTT CGACACCGGT CGGGGCCGGC 1320TCAATCTCGA TGCGCCCATC GCGCTCGGTG ATCTCCACCT GGTCGTTCCC GCGCAAGCCA 1380AGGCGCTCGC GAATCCGCTT GGGAATCACC AGACGTCCTG CGACATCGAT GGTTGTTCGC 1440ATGGTAGGAA ATTTACCATC GCACGTTCCA TAGGCGTGTC CTGCGCGGGA TGTCGGGACG 1500ATCCGCTAGC GTATCGAACG ATTGTTTCGG AAATGGCTGA GGGAGCGTGC GGTGCGGGTG 1560ATGGGTGTCG ATCCCGGGTT GACCCGATGC GGGCTGTCGC TCATCGAGAG TGGGCGTGGT 1620CGGCAGCTCA CCGCGCTGGA TGTCGACGTG GTGCGCACAC CGTCGGATGC GGCCTTGGCG 1680CAGCGCCTGT TGGCCATCAG CGATGCCGTC GAGCACTGGC TGGACACCCA TCATCCGGAG 1740GTGGTGGCTA TCGAACGGGT GTTCTCTCAG CTCAACGTGA CCACGGTGAT GGGCACCGCG 1800CAGGCCGGCG GCGTGATCGC CCTGGCGGCG GCCAAACGTG GTGTCGACGT GCATTTCCAT 1860ACCCCCAGCG AGGTCAAGGC GGCGGTCACT GGCAACGGTT CCGCAGACAA GGCTCAGGTC 1920ACC 1923(2)SEQ ID NO191的信息(i)序列特征(A)长度1055个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO191CTGGCGTGCC AGTGTCACCG GCGATATGAC GTCGGCATTC AATTTCGCGG CCCCGCCGGA 60CCCGTCGCCA CCCAATCTGG ACCACCCGGT CCGTCAATTG CCGAAGGTCG CCAAGTGCGT120GCCCAATGTG GTGCTGGGTT TCTTGAACGA AGGCCTGCCG TATCGGGTGC CCTACCCCCA180AACAACGCCA GTCCAGGAAT CCGGTCCCGC GCGGCCGATT CCCAGCGGCA TCTGCTAGCC240GGGGATGGTT CAGACGTAAC GGTTGGCTAG GTCGAAACCC GCGCCAGGGC CGCTGGACGG300GCTCATGGCA GCGAAATTAG AAAACCCGGG ATATTGTCCG CGGATTGTCA TACGATGCTG360AGTGCTTGGT GGTTCGTGTT TAGCCATTGA GTGTGGATGT GTTGAGACCC TGGCCTGGAA420GGGGACAACG TGCTTTTGCC TCTTGGTCCG CCTTTGCCGC CCGACGCGGT GGTGGCGAAA480CGGGCTGAGT CGGGAATGCT CGGCGGGTTG TCGGTTCCGC TCAGCTGGGG AGTGGCTGTG540CCACCCGATG ATTATGACCA CTGGGCGCCT GCGCCGGAGG ACGGCGCCGA TGTCGATGTC600CAGGCGGCCG AAGGGGCGGA CGCAGAGGCC GCGGCCATGG ACGAGTGGGA TGAGTGGCAG660GCGTGGAACG AGTGGGTGGC GGAGAACGCT GAACCCCGCT TTGAGGTGCC ACGGAGTAGC720AGCAGCGTGA TTCCGCATTC TCCGGCGGCC GGCTAGGAGA GGGGGCGCAG ACTGTCGTTA780TTTGACCAGT GATCGGCGGT CTCGGTGTTC CCGCGGCCGG CTATGACAAC AGTCAATGTG840CATGACAAGT TACAGGTATT AGGTCCAGGT TCAACAAGGA GACAGGCAAC ATGGCAACAC900GTTTTATGAC GGATCCGCAC GCGATGCGGG ACATGGCGGG CCGTTTTGAG GTGCACGCCC960AGACGGTGGA GGACGAGGCT CGCCGGATGT GGGCGTCCGC GCAAAACATC TCGGGNGCGG 1020GCTGGAGTGG CATGGCCGAG GCGACCTCGC TAGAC 1055(2)SEQ ID NO192的信息(i)序列特征(A)长度359个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO192CCGCCTCGTT GTTGGCATAC TCCGCCGCGG CCGCCTCGAC CGCACTGGCC GTGGCGTGTG 60TCCGGGCTGA CCACCGGGAT CGCCGAACCA TCCGAGATCA CCTCGCAATG ATCCACCTCG120CGCAGCTGGT CACCCAGCCA CCGGGCGGTG TGCGACAGCG CCTGCATCAC CTTGGTATAG180CCGTCGCGCC CCAGCCGCAG GAAGTTGTAG TACTGGCCCA CCACCTGGTT ACCGGGACGG240GAGAAGTTCA GGGTGAAGGT CGGCATGTCG CCGCCGAGGT AGTTGACCCG GAAAACCAGA300TCCTCCGGCA GGTGCTCGGG CCCGCGCCAC ACGACAAACC CGACGCCGGG ATAGGTCAG 359(2)SEQ ID NO193的信息(i)序列特征(A)长度350个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO193AACGGGCCCG TGGGCACCGC TCCTCTAAGG GCTCTCGTTG GTCGCATGAA GTGCTGGAAG 60GATGCATCTT GGCAGATTCC CGCCAGAGCA AAACAGCCGC TAGTCCTAGT CCGAGTCGCC120CGCAAAGTTC CTCGAATAAC TCCGTACCCG GAGCGCCAAA CCGGGTCTCC TTCGCTAAGC180TGCGCGAACC ACTTGAGGTT CCGGGACTCC TTGACGTCCA GACCGATTCG TTCGAGTGGC240TGATCGGTTC GCCGCGCTGG CGCGAATCCG CCGCCGAGCG GGGTGATGTC AACCCAGTGG300GTGGCCTGGA AGAGGTGCTC TACGAGCTGT CTCCGATCGA GGACTTCTCC 350(2)SEQ ID NO194的信息(i)序列特征(A)长度679个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO194Glu Gln Pro Lys Gly Pro Phe Gly Glu Val Ile Glu Ala Phe Ala Asp1 5 10 15Gly Leu Ala Gly Lys Gly Lys Gln Ile Asn Thr Thr Leu Asn Ser Leu20 25 30Ser Gln Ala Leu Asn Ala Leu Asn Glu Gly Arg Gly Asp Phe Phe Ala35 40 45Val Val Arg Ser Leu Ala Leu Phe Val Asn Ala Leu His Gln Asp Asp50 55 60Gln Gln Phe Val Ala Leu Asn Lys Asn Leu Ala Glu Phe Thr Asp Arg65 70 75 80Leu Thr His Ser Asp Ala Asp Leu Ser Asn Ala Ile Gln Gln Phe Asp85 90 95Ser Leu Leu Ala Val Ala Arg Pro Phe Phe Ala Lys Asn Arg Glu Val100 105 110Leu Thr His Asp Val Asn Asn Leu Ala Thr Val Thr Thr Thr Leu Leu115 120 125Gln Pro Asp Pro Leu Asp Gly Leu Glu Thr Val Leu His Ile Phe Pro130 135 140Thr Leu Ala Ala Asn Ile Asn Gln Leu Tyr His Pro Thr His Gly Gly145 150 155 160Val Val Ser Leu Ser Ala Phe Thr Asn Phe Ala Asn Pro Met Glu Phe165 170 175Ile Cys Ser Ser Ile Gln Ala Gly Ser Arg Leu Gly Tyr Gln Glu Ser180 185 190Ala Glu Leu Cys Ala Gln Tyr Leu Ala Pro Val Leu Asp Ala Ile Lys195 200 205Phe Asn Tyr Phe Pro Phe Gly Leu Asn Val Ala Ser Thr Ala Ser Thr210 215 220Leu Pro Lys Glu Ile Ala Tyr Ser Glu Pro Arg Leu Gln Pro Pro Asn225 230 235 240Gly Tyr Lys Asp Thr Thr Val Pro Gly Ile Trp Val Pro Asp Thr Pro245 250 255Leu Ser His Arg Asn Thr Gln Pro Gly Trp Val Val Ala Pro Gly Met260 265 270Gln Gly Val Gln Val Gly Pro Ile Thr Gln Gly Leu Leu Thr Pro Glu275 280 285Ser Leu Ala Glu Leu Met Gly Gly Pro Asp Ile Ala Pro Pro Ser Ser290 295 300Gly Leu Gln Thr Pro Pro Gly Pro Pro Asn Ala Tyr Asp Glu Tyr Pro305 310 315 320Val Leu Pro Pro Ile Gly Leu Gln Ala Pro Gln Val Pro Ile Pro Pro325 330 335Pro Pro Pro Gly Pro Asp Val Ile Pro Gly Pro Val Pro Pro Val Leu340 345 350Ala Ala Ile Val Phe Pro Arg Asp Arg Pro Ala Ala Ser Glu Asn Phe355 360 365Asp Tyr Met Gly Leu Leu Leu Leu Ser Pro Gly Leu Ala Thr Phe Leu370 375 380Phe Gly Val Ser Ser Ser Pro Ala Arg Gly Thr Met Ala Asp Arg His385 390 395 400Val Leu Ile Pro Ala Ile Thr Gly Leu Ala Leu Ile Ala Ala Phe Val405 410 415Ala His Ser Trp Tyr Arg Thr Glu His Pro Leu Ile Asp Met Arg Leu420 425 430Phe Gln Asn Arg Ala Val Ala Gln Ala Asn Met Thr Met Thr Val Leu435 440 445Ser Leu Gly Leu Phe Gly Ser Phe Leu Leu Leu Pro Ser Tyr Leu Gln450 455 460Gln Val Leu His Gln Ser Pro Met Gln Ser Gly Val His Ile Ile Pro465 470 475 480Gln Gly Leu Gly Ala Met Leu Ala Met Pro Ile Ala Gly Ala Met Met485 490 495Asp Arg Arg Gly Pro Ala Lys Ile Val Leu Val Gly Ile Met Leu Ile500 505 510Ala Ala Gly Leu Gly Thr Phe Ala Phe Gly Val Ala Arg GIn Ala Asp515 520 525Tyr Leu Pro Ile Leu Pro Thr Gly Leu Ala Ile Met Gly Met Gly Met530 535 540Gly Cys Ser Met Met Pro Leu Ser Gly Ala Ala Val Gln Thr Leu Ala545 550 555 560Pro His Gln Ile Ala Arg Gly Ser Thr Leu Ile Ser Val Asn Gln Gln565 570 575Val Gly Gly Ser Ile Gly Thr Ala Leu Met Ser Val Leu Leu Thr Tyr580 585 590Gln Phe Asn His Ser Glu Ile Ile Ala Thr Ala Lys Lys Val Ala Leu595 600 605Thr Pro Glu Ser Gly Ala Gly Arg Gly Ala Ala Val Asp Pro Ser Ser610 615 620Leu Pro Arg Gln Thr Asn Phe Ala Ala Gln Leu Leu His Asp Leu Ser625 630 635 640Hls Ala Tyr Ala Val Val Phe Val Ile Ala Thr Ala Leu Val Val Ser645 650 655Thr Leu Ile Pro Ala Ala Phe Leu Pro Lys Gln Gln Ala Ser His Arg660 665 670Arg Ala Pro Leu Leu Ser Ala675(2)SEQ ID NO195的信息(i)序列特征(A)长度120个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO195Thr Pro Glu Lys Ser Phe Val Asp Asp Leu Asp Ile Asp Ser Leu Ser1 5 10 15Met Val Glu Ile Ala Val Gln Thr Glu Asp Lys Tyr Gly Val Lys Ile20 25 30Pro Asp Glu Asp Leu Ala Gly Leu Arg Thr Val Gly Asp Val Val Ala35 40 45Tyr Ile Gln Lys Leu Glu Glu Glu Asn Pro Glu Ala Ala Gln Ala Leu50 55 60Arg Ala Lys Ile Glu Ser Glu Asn Pro Asp Ala Ala Arg Ala Asp Arg65 70 75 80Cys Val Ser Pro Thr Ser Gln Ala Arg Asp Ala Arg Arg Pro Leu Ala85 90 95Arg Ser Ala Arg Leu Ala Cys Arg Arg Leu Pro Ala Ser Val Pro Thr100 105 110Thr Arg Arg Asp Pro Arg Glu Arg115 120(2)SEQ ID NO196的信息(i)序列特征(A)长度89个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO196Leu Ala Cys Gln Cys His Arg Arg Tyr Asp Val Gly Ile Gln Phe Arg1 5 10 15Gly Pro Ala Gly Pro Val Ala Thr Gln Ser Gly Pro Pro Gly Pro Ser20 25 30Ile Ala Glu Gly Arg Gln Val Arg Ala Gln Cys Gly Ala Gly Phe Leu35 40 45Glu Arg Arg Pro Ala Val Ser Gly Ala Leu Pro Pro Asn Asn Ala Ser50 55 60Pro Gly Ile Arg Ser Arg Ala Ala Asp Ser Gln Arg His Leu Leu Ala65 70 75 80Gly Asp Gly Ser Asp Val Thr Val Gly85(2)SEQ ID NO197的信息(i)序列特征(A)长度119个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO197Ala Ser Leu Leu Ala Tyr Ser Ala Ala Ala Ala Ser Thr Ala Leu Ala1 5 10 15Val Ala Cys Val Arg Ala Asp His Arg Asp Arg Arg Thr Ile Arg Asp20 25 30His Leu Ala Met Ile His Leu Ala Gln Leu Val Thr Gln Pro Pro Gly35 40 45Gly Val Arg Gln Arg Leu His His Leu Gly Ile Ala Val Ala Pro Gln50 55 60Pro Gln Glu Val Val Val Leu Ala His His Leu Val Thr Gly Thr Gly65 70 75 80Glu Val Gln Gly Glu Gly Arg His Val Ala Ala Glu Val Val Asp Pro85 90 95Glu Asn Gln Ile Leu Arg Gln Val Leu Gly Pro Ala Pro His Asp Lys100 105 110Pro Asp Ala Gly Ile Gly Gln115(2)SEQ ID NO198的信息(i)序列特征(A)长度116个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO198Arg Ala Arg Gly His Arg Ser Ser Lys Gly Ser Arg Trp Ser His Glu1 5 10 15Val Leu Glu Gly Cys Ile Leu Ala Asp Ser Arg Gln Ser Lys Thr Ala20 25 30Ala Ser Pro Ser Pro Ser Arg Pro Gln Ser Ser Ser Asn Asn Ser Val35 40 45Pro Gly Ala Pro Asn Arg Val 5er Phe Ala Lys Leu Arg Glu Pro Leu50 55 60Glu Val Pro Gly Leu Leu Asp Val Gln Thr Asp Ser Phe Glu Trp Leu65 70 75 80Ile Gly Ser Pro Arg Trp Arg Glu Ser Ala Ala Glu Arg Gly Asp Val85 90 95Asn Pro Val Gly Gly Leu Glu Glu Val Leu Tyr Glu Leu Ser Pro Ile100 105 110Glu Asp Phe Ser115(2)SEQ ID NO199的信息(i)序列特征
(A)长度811个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO199TGCTACGCAG CAATCGCTTT GGTGACAGAT GTGGATGCCG GCGTCGCTGC TGGCGATGGC 60GTGAAAGCCG CCGACGTGTT CGCCGCATTC GGGGAGAACA TCGAACTGCT CAAAAGGCTG120GTGCGGGCCG CCATCGATCG GGTCGCCGAC GAGCGCACGT GCACGCACTG TCAACACCAC180GCCGGTGTTC CGTTGCCGTT CGAGCTGCCA TGAGGGTGCT GCTGACCGGC GCGGCCGGCT240TCATCGGGTC GCGCGTGGAT GCGGCGTTAC GGGCTGCGGG TCACGACGTG GTGGGCGTCG300ACGCGCTGCT GCCCGCCGCG CACGGGCCAA ACCCGGTGCT GCCACCGGGC TGCCAGCGGG360TCGACGTGCG CGACGCCAGC GCGCTGGCCC CGTTGTTGGC CGGTGTCGAT CTGGTGTGTC420ACCAGGCCGC CATGGTGGGT GCCGGCGTCA ACGCCGCCGA CGCACCCGCC TATGGCGGCC480ACAACGATTT CGCCACCACG GTGCTGCTGG CGCAGATGTT CGCCGCCGGG GTCCGCCGTT540TGGTGCTGGC GTCGTCGATG GTGGTTTACG GGCAGGGGCG CTATGACTGT CCCCAGCATG600GACCGGTCGA CCCGCTGCCG CGGCGGCGAG CCGACCTGGA CAATGGGGTC TTCGAGCACC660GTTGCCCGGG GTGCGGCGAG CCAGTCATCT GGCAATTGGT CGACGAAGAT GCCCCGTTGC720GCCCGCGCAG CCTGTACGCG GCAGCAAGAC CGCGCAGGAG CACTACGCGC TGGCGTGGTC780GGAAACGAAT GGCGGTTCCG TGGTGGCGTT G 811(2)SEQ ID NO200的信息(i)序列特征(A)长度966个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO200GTCCCGCGAT GTGGCCGAGC ATGACTTTCG GCAACACCGG CGTAGTAGTC GAAGATATCG 60GACTTTGTGG TCCCGGTGGC GGGATAGAGC ACCTGTCGGC GTTGGTCAGC GTCACCCGTT120GCTCGGACGC CGAACCCATG CTTTCAACGT AGCCTGTCGG TCACACAAGT CGCGAGCGTA180ACGTCACGGT CAAATATCGC GTGGAATTTC GCCGTGACGT TCCGCTCGCG GACAATCAAG240GCATACTCAC TTACATGCGA GCCATTTGGA CGGGTTCGAT CGCCTTCGGG CTGGTGAACG300TGCCGGTCAA GGTGTACAGC GCTACCGCAG ACCACGACAT CAGGTTCCAC CAGGTGCACG360CCAAGGACAA CGGACGCATC CGGTACAAGC GCGTCTGCGA GGCGTGTGGC GAGGTGGTCG 420ACTACCGCGA TCTTGCCCGG GCCTACGAGT CCGGCGACGG CCAAATGGTG GCGATCACCG 480ACGACGACAT CGCCAGCTTG CCTGAAGAAC GCAGCCGGGA GATCGAGGTG TTGGAGTTCG 540TCCCCGCCGC CGACGTGGAC CCGATGATGT TCGACCGCAG CTACTTTTTG GAGCCTGATT 600CGAAGTCGTC GAAATCGTAT GTGCTGCTGG CTAAGACACT CGCCGAGACC GACCGGATGG 660CGATCGTGGA TCGCCCCACC GGCCGTGAAT GCAGGAAAAA TAAGAGCCGC TATCCACAAT 720TCGGCGTCGA GCTCGGCTAC CACAAACGGT AGAACGATCG AGACATTCCC GAGCTGAAGT 780GCGGCGCTAT AGAAGCCGCT CTGCGCGATT ATCAAACGCA AAATACGCTT ACTCATGCCA 840TCGGCGCTGC TCACCCGATG CGACGTTTTT GCCACGCTCC ACCGCCTGCC GCGCGACCTC 900AAGTGGGCAT GCATCCCACC CGTTCCCGGA AACCGGTTCC GGCGGGTCGG CTCATCGCTT 960CATCCT966(2)SEQ ID NO201的信息(i)序列特征(A)长度2367个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO201CCGCACCGCC GGCAATACCG CCAGCGCCAC CGTTACCGCC GTTTGCGCCG TTGCCCCCGT 60TGCCGCCCGT CCCGCCGGCC CCGCCGATGG AGTTCTCATC GCCAAAAGTA CTGGCGTTGC 120CACCGGAGCC GCCGTTGCCG CCGTCACCGC CAGCCCCGCC GACTCCACCG GCCCCACCGA 180CTCCGCCGCT GCCACCGTTG CCGCCGTTGC CGATCAACAT GCCGCTGGCG CCACCCTTGC 240CACCCACGCC ACCGGCTCCG CCCACCCCGC CGACACCAAG CGAGCTGCCG CCGGAGCCAC 300CATCACCACC TACGCCACCG ACCGCCCAGA CACCAGCGAC CGGGTCTTCG TGAAACGTCG 360CGGTGCCACC ACCGCCGCCG TTACCGCCAA CCCCACCGGC AACGCCGGCG CCGCCATCCC 420CGCCGGCCCC GGCGTTGCCG CCGTTGCCGC CGTTGCCGAA CAACAACCCG CCGGCGCCGC 480CGTTGCCGCC CGCGCCGCCG GTCCCGCCGG CGCCGCCGAC GCCAAGGCCG CTGCCGCCCT 540TGCCGCCATC ACCACCCTTG CCGCCGACCA CATCGGGTTC TGCCTCGGGG TCTGGGCTGT 600CAAACCTCGC GATGCCAGCG TTGCCGCCGC TTCCCCCGGG CCCCCCCGTG GCGCCGTCAC 660CACCGATACC ACCCGCGCCA CCGGCGCCAC CGTTGCCGCC ATCACCGAAT AGCAACCCGC 720CGGCGCCACC ATTGCCGCCA GCTCCCCCTG CGCCACCGTC GGCGCCGGAG GCGGCACTGG 780CAGCCCCGTT ACCACCGAAA CCGCCGCTAC CACCGGTAGA GGTGGCAGTG GCGATGTGTA 840CGAAAGCGCC GCCTCCGGCG CCGCCGCTAC CACCCCCACT GCCGGCGGCT ACACCGTCGG 900ACCCGTTGCC ACCATCACCG CCAAAGGCGC TCGCAATGTC GCCCTGCGCG ACTCCGCCGT 960CGCCGCCGTT GCCGCCGCCG CCACCGGCAG CGGCGGTACC GCCGTCACCA CCGGCACCGC 1020CGGTGGCCTT GCCCGAGCCT GCCGTCGCGG TGGCACCGTC GCCGCCGGTG CCACCGGTCG 1080GCGTGCCGGC AGTGCCATGG CCGCCCGTGC CGCCGTCGCC GCCGGTTTGA TCACCGATGC 1140CGGACACATC TGCCGGGCTG TCCCCGGTGC TGGCCGCGGG GCCGGGCGTG GGATTGACCC 1200CGTTTGCCCC GGCGAGGCCG GCGCCGCCGG TACCACCGGC GCCGCCATGG CCGAACAGCC 1260CGGCGTTGCC GCCGTTACCG CCCGCACCCC CGATGCCTGC GGCCACGCTG GTGCCGCCGA 1320CACCGCCGTT GCCGCCGTTG CCCCACAACC ACCCCCCGTT CCCACCGGCA CCGCCGGCCG 1380CGCCGGTACC ACCGGCCCCG CCGTTGCCGC CGTTGCCGAT CAACCCGGCC GCGCCTCCGC 1440TGCCGCCGGT TTGACCGAAC CCGCCAGCCG CGCCGTTGCC ACCGTTGCCA AACAGCAACC 1500CGCCGGCCGC GCCAGGCTGC CCGGGTGCCG TCCCGTCGGC GCCGTTTCCG ATCAACGGGC 1560GCCCCAAAAG CGCCTCGGTG GGCGCATTCA CCGCACCCAG CAGACTCCGC TCAACAGCGG 1620CTTCAGTGCT GGCATACCGA CCCGCGGCCG CAGTCAACGC CTGCACAAAC TGCTCGTGAA 1680ACGCTGCCAC CTGTACGCTG AGCGCCTGAT ACTGCCGAGC ATGGGCCCCG AACAACCCCG 1740CAATCGCCGC CGACACTTCA TCGGCAGCCG CAGCCACCAC TTCCGTCGTC GGGATCGCCG 1800CGGCCGCATT AGCCGCGCTC ACCTGCGAAC CAATAGTCGA TAAATCCAAA GCCGCAGTTG 1860CCAGCAGCTG CGGCGTCGCG ATCACCAAGG ACACCTCGCA CCTCCGGATA CCCCATATCG 1920CCGCACCGTG TCCCCAGCGG CCACGTGACC TTTGGTCGCT GGCTGGCGGC CCTGACTATG 1980GCCGCGACGG CCCTCGTTCT GATTCGCCCC GGCGCGCAGC TTGTTGCGCG AGTTGAAGAC 2040GGGAGGACAG GCCGAGCTTG GTGTAGACGT GGGTCAAGTG GGAATGCACG GTCCGCGGCG 2100AGATGAATAG GCGGACGCCG ATCTCCTTGT TGCTGAGTCC CTCACCGACC AGTAGAGCCA 2160CCTCAAGCTC TGTCGGTGTC AACGCGCCCC AGCCACTTGT CGGGCGTTTC CGTGCACCGC 2220GGCCTCGTTG CGCGTACGCG ATCGCCTCAT CGATCGATAA CGCAGTTCCT TCGGCCCAGG 2280CATCGTCGAA CTCGCTGTCA CCCATGGATT TTCGAAGGGT GGCTAGCGAC GAGTTACAGC 2340CCGCCTGGTA GATCCCGAAG CGGACCG 2367(2)SEQ ID NO202的信息(i)序列特征(A)长度376个氨基酸(B)类型氨基酸(C)链数
(D)拓扑学线性(xi)序列描述SEQ ID NO202Gln Pro Ala Gly Ala Tnr Ile Ala Ala Ser Ser Pro Cys Ala Thr Val1 5 10 15Gly Ala Gly Gly Gly Thr Gly Ser Pro Val Thr Thr Glu Thr Ala Ala20 25 30Thr Thr Gly Arg Gly Gly Ser Gly Asp Val Tyr Glu Ser Ala Ala Ser35 40 45Gly Ala Ala Ala Thr Thr Pro Thr Ala Gly Gly Tyr Thr Val Gly Pro50 55 60Val Ala Thr Ile Thr Ala Lys Gly Ala Arg Asn Val Ala Leu Arg Asp65 70 75 80Ser Ala Val Ala Ala Val Ala Ala Ala Ala Thr Gly Ser Gly Gly Thr85 90 95Ala Val Thr Thr Gly Thr Ala Gly Gly Leu Ala Arg Ala Cys Arg Arg100 105 110Gly Gly Thr Val Ala Ala Gly Ala Thr Gly Arg Arg Ala Gly Ser Ala115 120 125Met Ala Ala Arg Ala Ala Val Ala Ala Gly Leu Ile Thr Asp Ala Gly130 135 140His Ile Cys Arg Ala Val Pro Gly Ala Gly Arg Gly Ala Gly Arg Gly145 150 155 160Ile Asp Pro Val Cys Pro Gly Glu Ala Gly Ala Ala Gly Thr Thr Gly165 170 175Ala Ala Met Ala Glu Gln Pro Gly Val Ala Ala Val Thr Ala Arg Thr180 185 190Pro Asp Ala Cys Gly His Ala Gly Ala Ala Asp Thr Ala Val Ala Ala195 200 205Val Ala Pro Gln Pro Pro Pro Val Pro Thr Gly Thr Ala Gly Arg Ala210 215 220Gly Thr Thr Gly Pro Ala Val Ala Ala Val Ala Asp Gln Pro Gly Arg225 230 235 240Ala Ser Ala Ala Ala Gly Leu Thr Glu Pro Ala Ser Arg Ala Val Ala245 250 255Thr Val Ala Lys Gln Gln Pro Ala Gly Arg Ala Arg Leu Pro Gly Cys260 265 270Arg Pro Val Gly Ala Val Ser Asp Gln Arg Ala Pro Gln Lys Arg Leu275 280 285Gly Gly Arg Ile His Arg Thr Gln Gln Thr Pro Leu Asn Ser Gly Phe290 295 300Ser Ala Gly Ile Pro Thr Arg Gly Arg Ser Gln Arg Leu His Lys Leu305 310 315 320Leu Val Lys Arg Cys His Leu Tyr Ala Glu Arg Leu Ile Leu Pro Ser325 330 335Met Gly Pro Glu Gln Pro Arg Asn Arg Arg Arg His Phe Ile Gly Ser340 345 350Arg Ser His His Phe Arg Arg Arg Asp Arg Arg Gly Arg Ile Ser Arg355 360 365Ala His Leu Arg Thr Asn Ser Arg370 375(2)SEQ ID NO203的信息(i)序列特征(A)长度2852个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO203GGCCAAAACG CCCCGGCGAT CGCGGCCACC GAGGCCGCCT ACGACCAGAT GTGGGCCCAG 60GACGTGGCGG CGATGTTTGG CTACCATGCC GGGGCTTCGG CGGCCGTCTC GGCGTTGACA 120CCGTTCGGCC AGGCGCTGCC GACCGTGGCG GGCGGCGGTG CGCTGGTCAG CGCGGCCGCG 180GCTCAGGTGA CCACGCGGGT CTTCCGCAAC CTGGGCTTGG CGAACGTCCG CGAGGGCAAC 240GTCCGCAACG GTAATGTCCG GAACTTCAAT CTCGGCTCGG CCAACATCGG CAACGGCAAC 300ATCGGCAGCG GCAACATCGG CAGCTCCAAC ATCGGGTTTG GCAACGTGGG TCCTGGGTTG 360ACCGCAGCGC TGAACAACAT CGGTTTCGGC AACACCGGCA GCAACAACAT CGGGTTTGGC 420AACACCGGCA GCAACAACAT CGGGTTCGGC AATACCGGAG ACGGCAACCG AGGTATCGGG 480CTCACGGGTA GCGGTTTGTT GGGGTTCGGC GGCCTGAACT CGGGCACCGG CAACATCGGT 540CTGTTCAACT CGGGCACCGG AAACGTCGGC ATCGGCAACT CGGGTACCGG GAACTGGGGC 600ATTGGCAACT CGGGCAACAG CTACAACACC GGTTTTGGCA ACTCCGGCGA CGCCAACACG 660GGCTTCTTCA ACTCCGGAAT AGCCAACACC GGCGTCGGCA ACGCCGGCAA CTACAACACC 720GGTAGCTACA ACCCGGGCAA CAGCAATACC GGCGGCTTCA ACATGGGCCA GTACAACACG 780GGCTACCTGA ACAGCGGCAA CTACAACACC GGCTTGGCAA ACTCCGGCAA TGTCAACACC 840GGCGCCTTCA TTACTGGCAA CTTCAACAAC GGCTTCTTGT GGCGCGGCGA CCACCAAGGC 900CTGATTTTCG GGAGCCCCGG CTTCTTCAAC TCGACCAGTG CGCCGTCGTC GGGATTCTTC 960AACAGCGGTG CCGGTAGCGC GTCCGGCTTC CTGAACTCCG GTGCCAACAA TTCTGGCTTC1020TTCAACTCTT CGTCGGGGGC CATCGGTAAC TCCGGCCTGG CAAACGCGGG CGTGCTGGTA1080TCGGGCGTGA TCAACTCGGG CAACACCGTA TCGGGTTTGT TCAACATGAG CCTGGTGGCC1140ATCACAACGC CGGCCTTGAT CTCGGGCTTC TTCAACACCG GAAGCAACAT GTCGGGATTT1200TTCGGTGGCC CACCGGTCTT CAATCTCGGC CTGGCAAACC GGGGCGTCGT GAACATTCTC1260GGCAACGCCA ACATCGGCAA TTACAACATT CTCGGCAGCG GAAACGTCGG TGACTTCAAC1320ATCCTTGGCA GCGGCAACCT CGGCAGCCAA AACATCTTGG GCAGCGGCAA CGTCGGCAGC1380TTCAATATCG GCAGTGGAAA CATCGGAGTA TTCAATGTCG GTTCCGGAAG CCTGGGAAAC1440TACAACATCG GATCCGGAAA CCTCGGGATC TACAACATCG GTTTTGGAAA CGTCGGCGAC1500TACAACGTCG GCTTCGGGAA CGCGGGCGAC TTCAACCAAG GCTTTGCCAA CACCGGCAAC1560AACAACATCG GGTTCGCCAA CACCGGCAAC AACAACATCG GCATCGGGCT GTCCGGCGAC1620AACCAGCAGG GCTTCAATAT TGCTAGCGGC TGGAACTCGG GCACCGGCAA CAGCGGCCTG1680TTCAATTCGG GCACCAATAA CGTTGGCATC TTCAACGCGG GCACCGGAAA CGTCGGCATC1740GCAAACTCGG GCACCGGGAA CTGGGGTATC GGGAACCCGG GTACCGACAA TACCGGCATC1800CTCAATGCTG GCAGCTACAA CACGGGCATC CTCAACGCCG GCGACTTCAA CACGGGCTTC1860TACAACACGG GCAGCTACAA CACCGGCGGC TTCAACGTCG GTAACACCAA CACCGGCAAC1920TTCAACGTGG GTGACACCAA TACCGGCAGC TATAACCCGG GTGACACCAA CACCGGCTTC1980TTCAATCCCG GCAACGTCAA TACCGGCGCT TTCGACACGG GCGACTTCAA CAATGGCTTC2040TTGGTGGCGG GCGATAACCA GGGCCAGATT GCCATCGATC TCTCGGTCAC CACTCCATTC2100ATCCCCATAA ACGAGCAGAT GGTCATTGAC GTACACAACG TAATGACCTT CGGCGGCAAC2160ATGATCACGG TCACCGAGGC CTCGACCGTT TTCCCCCAAA CCTTCTATCT GAGCGGTTTG2220TTCTTCTTCG GCCCGGTCAA TCTCAGCGCA TCCACGCTGA CCGTTCCGAC GATCACCCTC2280ACCATCGGCG GACCGACGGT GACCGTCCCC ATCAGCATTG TCGGTGCTCT GGAGAGCCGC2340ACGATTACCT TCCTCAAGAT CGATCCGGCG CCGGGCATCG GAAATTCGAC CACCAACCCC2400TCGTCCGGCT TCTTCAACTC GGGCACCGGT GGCACATCTG GCTTCCAAAA CGTCGGCGGC2460GGCAGTTCAG GCGTCTGGAA CAGTGGTTTG AGCAGCGCGA TAGGGAATTC GGGTTTCCAG2520AACCTCGGCT CGCTGCAGTC AGGCTGGGCG AACCTGGGCA ACTCCGTATC GGGCTTTTTC2580AACACCAGTA CGGTGAACCT CTCCACGCCG GCCAATGTCT CGGGCCTGAA CAACATCGGC2640ACCAACCTGT CCGGCGTGTT CCGCGGTCCG ACCGGGACGA TTTTCAACGC GGGCCTTGCC2700AACCTGGGCC AGTTGAACAT CGGCAGCGCC TCGTGCCGAA TTCGGCACGA GTTAGATACG2760GTTTCAACAA TCATATCCGC GTTTTGCGGC AGTGCATCAG ACGAATCGAA CCCGGGAAGC2820GTAAGCGAAT AAACCGAATG GCGGCCTGTC AT2852(2)SEQ ID NO204的信息(i)序列特征(A)长度943个氨基酸(B)类型氨基酸(C)链数(D)拓扑学线性(xi)序列描述SEQ ID NO204Gly Gln Asn Ala Pro Ala Ile Ala Ala Thr Glu Ala Ala Tyr Asp Gln1 5 10 15Met Trp Ala Gln Asp Val Ala Ala Met Phe Gly Tyr His Ala Gly Ala20 25 30Ser Ala Ala Val Ser Ala Leu Thr Pro Phe Gly Gln Ala Leu Pro Thr35 40 45Val Ala Gly Gly Gly Ala Leu Val Ser Ala Ala Ala Ala Gln Val Thr50 55 60Thr Arg Val Phe Arg Asn Leu Gly Leu Ala Asn Val Arg Glu Gly Asn65 70 75 80Val Arg Asn Gly Asn Val Arg Asn Phe Asn Leu Gly Ser Ala Asn Ile85 90 95Gly Asn Gly Asn Ile Gly Ser Gly Asn Ile Gly Ser Ser Asn Ile Gly100 105 110Phe Gly Asn Val Gly Pro Gly Leu Thr Ala Ala Leu Asn Asn Ile Gly115 120 125Phe Gly Asn Thr Gly Ser Asn Asn Ile Gly Phe Gly Asn Thr Gly Ser130 135 140Asn Asn Ile Gly Phe Gly Asn Thr Gly Asp Gly Asn Arg Gly Ile Gly145 150 155 160Leu Thr Gly Ser Gly Leu Leu Gly Phe Gly Gly Leu Asn Ser Gly Thr165 170 175Gly Asn Ile Gly Leu Phe Asn Ser Gly Thr Gly Asn Val Gly Ile Gly180 185 190Asn Ser Gly Thr Gly Asn Trp Gly Ile Gly Asn Ser Gly Asn Ser Tyr195 200 205Asn Thr Gly Phe Gly Asn Ser Gly Asp Ala Asn Thr Gly Phe Phe Asn210 215 220Ser Gly Ile Ala Asn Thr Gly Val Gly Asn Ala Gly Asn Tyr Asn Thr225 230 235 240Gly Ser Tyr Asn Pro Gly Asn Ser Asn Thr Gly Gly Phe Asn Met Gly
245 250 255Gln Tyr Asn Thr Gly Tyr Leu Asn Ser Gly Asn Tyr Asn Thr Gly Leu260 265 270Ala Asn Ser Gly Asn Val Asn Thr Gly Ala Phe Ile Thr Gly Asn Phe275 280 285Asn Asn Gly Phe Leu Trp Arg Gly Asp His Gln Gly Leu Ile Phe Gly290 295 300Ser Pro Gly Phe Phe Asn Ser Thr Ser Ala Pro Ser Ser Gly Phe Phe305 310 315 320Asn Ser Gly Ala Gly Ser Ala Ser Gly Phe Leu Asn Ser Gly Ala Asn325 330 335Asn Ser Gly Phe Phe Asn Ser Ser Ser Gly Ala Ile Gly Asn Ser Gly340 345 350Leu Ala Asn Ala Gly Val Leu Val Ser Gly Val Ile Asn Ser Gly Asn355 360 365Thr Val Ser Gly Leu Phe Asn Met Ser Leu Val Ala Ile Thr Thr Pro370 375 380Ala Leu Ile Ser Gly Phe Phe Asn Thr Gly Ser Asn Met Ser Gly Phe385 390 395 400Phe Gly Gly Pro Pro Val Phe Asn Leu Gly Leu Ala Asn Arg Gly Val405 410 415Val Asn Ile Leu Gly Asn Ala Asn Ile Gly Asn Tyr Asn Ile Leu Gly420 425 430Ser Gly Asn Val Gly Asp Phe Asn Ile Leu Gly Ser Gly Asn Leu Gly435 440 445Ser Gln Asn Ile Leu Gly Ser Gly Asn Val Gly Ser Phe Asn Ile Gly450 455 460Ser Gly Asn Ile Gly Val Phe Asn Val Gly Ser Gly Ser Leu Gly Asn465 470 475 480Tyr Asn Ile Gly Ser Gly Asn Leu Gly Ile Tyr Asn Ile Gly Phe Gly485 490 495Asn Val Gly Asp Tyr Asn Val Gly Phe Gly Asn Ala Gly Asp Phe Asn500 505 510Gln Gly Phe Ala Asn Thr Gly Asn Asn Asn Ile Gly Phe Ala Asn Thr515 520 525Gly Asn Asn Asn Ile Gly Ile Gly Leu Ser Gly Asp Asn Gln Gln Gly530 535 540Phe Asn Ile Ala Ser Gly Trp Asn Ser Gly Thr Gly Asn Ser Gly Leu545 550 555 560Phe Asn Ser Gly Thr Asn Asn Val Gly Ile Phe Asn Ala Gly Thr Gly565 570 575Asn Val Gly Ile Ala Asn Ser Gly Thr Gly Asn Trp Gly Ile Gly Asn580 585 590Pro Gly Thr Asp Asn Thr Gly Ile Leu Asn Ala Gly Ser Tyr Asn Thr595 600 605Gly Ile Leu Asn Ala Gly Asp Phe Asn Thr Gly Phe Tyr Asn Thr Gly610 615 620Ser Tyr Asn Thr Gly Gly Phe Asn Val Gly Asn Thr Asn Thr Gly Asn625 630 635 640Phe Asn Val Gly Asp Thr Asn Thr Gly Ser Tyr Asn Pro Gly Asp Thr645 650 655Asn Thr Gly Phe Phe Asn Pro Gly Asn Val Asn Thr Gly Ala Phe Asp660 665 670Thr Gly Asp Phe Asn Asn Gly Phe Leu Val Ala Gly Asp Asn Gln Gly675 680 685Gln Ile Ala Ile Asp Leu Ser Val Thr Thr Pro Phe Ile Pro Ile Asn690 695 700Glu Gln Met Val Ile Asp Val His Asn Val Met Thr Phe Gly Gly Asn705 710 715 720Met Ile Thr Val Thr Glu Ala Ser Thr Val Phe Pro Gln Thr Phe Tyr725 730 735Leu Ser Gly Leu Phe Phe Phe Gly Pro Val Asn Leu Ser Ala Ser Thr740 745 750Leu Thr Val Pro Thr lle Thr Leu Thr Ile Gly Gly Pro Thr Val Thr755 760 765Val Pro Ile Ser Ile Val Gly Ala Leu Glu Ser Arg Thr Ile Thr Phe770 775 780Leu Lys Ile Asp Pro Ala Pro Gly Ile Gly Asn Ser Thr Thr Asn Pro785 790 795 800Ser Ser Gly Phe Phe Asn Ser Gly Thr Gly Gly Thr Ser Gly Phe Gln805 810 815Asn Val Gly Gly Gly Ser Ser Gly Val Trp Asn Ser Gly Leu Ser Ser820 825 830Ala Ile Gly Asn Ser Gly Phe Gln Asn Leu Gly Ser Leu Gln Ser Gly835 840 845Trp Ala Asn Leu Gly Asn Ser Val Ser Gly Phe Phe Asn Thr Ser Thr850 855 860Val Asn Leu Ser Thr Pro Ala Asn Val Ser Gly Leu Asn Asn Ile Gly865 870 875 880Thr Asn Leu Ser Gly Val Phe Arg Gly Pro Thr Gly Thr Ile Phe Asn885 890 895Ala Gly Leu Ala Asn Leu Gly Gln Leu Asn Ile Gly Ser Ala Ser Cys900 905 910Arg Ile Arg His Glu Leu Asp Thr Val Ser Thr Ile Ile Ser Ala Phe915 920 925Cys Gly Ser Ala Ser Asp Glu Ser Asn Pro Gly Ser Val Ser Glu930 935 940(2)SEQ ID NO205的信息(i)序列特征(A)长度53个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO205GGATCCATAT GGGCCATCAT CATCATCATC ACGTGATCGA CATCATCGGG ACC53(2)SEQ ID NO206的信息(i)序列特征(A)长度42个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO206CCTGAATTCA GGCCTCGGTT GCGCCGGCCT CATCTTGAAC GA42(2)SEQ ID NO207的信息(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO207GGATCCTGCA GGCTCGAAAC CACCGAGCGG T31(2)SEQ ID NO208的信息(i)序列特征(A)长度31个碱基对(B)类型核酸
(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO208CTCTGAATTC AGCGCTGGAA ATCGTCGCGA T 31(2)SEQ ID NO209的信息(i)序列特征(A)长度33个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO209GGATCCAGCG CTGAGATGAA GACCGATGCC GCT33(2)SEQ ID NO210的信息(i)序列特征(A)长度38个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO210GGATATCTGC AGAATTCAGG TTTAAAGCCC ATTTGCGA 38(2)SEQ ID NO211的信息(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO211CCGCATGCGA GCCACGTGCC CACAACGGCC30(2)SEQ ID NO212的信息(i)序列特征(A)长度37个碱基对(B)类型核酸
(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO212CTTCATGGAATTCTCAGGCC GGTAAGGTCC GCTGCGG 37(2)SEQ ID NO213的信息(i)序列特征(A)长度7676个碱基对(B)类型核酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO213TGGCGAATGG GACGCGCCCT GTAGCGGCGC ATTAAGCGCG GCGGGTGTGG TGGTTACGCG 60CAGCGTGACC GCTACACTTG CCAGCGCCCT AGCGCCCGCT CCTTTCGCTT TCTTCCCTTC 120CTTTCTCGCC ACGTTCGCCG GCTTTCCCCG TCAAGCTCTA AATCGGGGGC TCCCTTTAGG 180GTTCCGATTT AGTGCTTTAC GGCACCTCGA CCCCAAAAAA CTTGATTAGG GTGATGGTTC 240ACGTAGTGGG CCATCGCCCT GATAGACGGT TTTTCGCCCT TTGACGTTGG AGTCCACGTT 300CTTTAATAGT GGACTCTTGT TCCAAACTGG AACAACACTC AACCCTATCT CGGTCTATTC 360TTTTGATTTA TAAGGGATTT TGCCGATTTC GGCCTATTGG TTAAAAAATG AGCTGATTTA 420ACAAAAATTT AACGCGAATT TTAACAAAAT ATTAACGTTT ACAATTTCAG GTGGCACTTT 480TCGGGGAAAT GTGCGCGGAA CCCCTATTTG TTTATTTTTC TAAATACATT CAAATATGTA 540TCCGCTCATG AATTAATTCT TAGAAAAACT CATCGAGCAT CAAATGAAAC TGCAATTTAT 600TCATATCAGG ATTATCAATA CCATATTTTT GAAAAAGCCG TTTCTGTAAT GAAGGAGAAA 660ACTCACCGAG GCAGTTCCAT AGGATGGCAA GATCCTGGTA TCGGTCTGCG ATTCCGACTC 720GTCCAACATC AATACAACCT ATTAATTTCC CCTCGTCAAA AATAAGGTTA TCAAGTGAGA 780AATCACCATG AGTGACGACT GAATCCGGTG AGAATGGCAA AAGTTTATGC ATTTCTTTCC 840AGACTTGTTC AACAGGCCAG CCATTACGCT CGTCATCAAA ATCACTCGCA TCAACCAAAC 900CGTTATTCAT TCGTGATTGC GCCTGAGCGA GACGAAATAC GCGATCGCTG TTAAAAGGAC 960AATTACAAAC AGGAATCGAA TGCAACCGGC GCAGGAACAC TGCCAGCGCA TCAACAATAT1020TTTCACCTGA ATCAGGATAT TCTTCTAATA CCTGGAATGC TGTTTTCCCG GGGATCGCAG1080TGGTGAGTAA CCATGCATCA TCAGGAGTAC GGATAAAATG CTTGATGGTC GGAAGAGGCA1140TAAATTCCGT CAGCCAGTTT AGTCTGACCA TCTCATCTGT AACATCATTG GCAACGCTAC1200CTTTGCCATG TTTCAGAAAC AACTCTGGCG CATCGGGCTT CCCATACAAT CGATAGATTG1260TCGCACCTGA TTGCCCGACA TTATCGCGAG CCCATTTATA CCCATATAAA TCAGCATCCA1320TGTTGGAATT TAATCGCGGC CTAGAGCAAG ACGTTTCCCG TTGAATATGG CTCATAACAC1380CCCTTGTATT ACTGTTTATG TAAGCAGACA GTTTTATTGT TCATGACCAA AATCCCTTAA1440CGTGAGTTTT CGTTCCACTG AGCGTCAGAC CCCGTAGAAA AGATCAAAGG ATCTTCTTGA1500GATCCTTTTT TTCTGCGCGT AATCTGCTGC TTGCAAACAA AAAAACCACC GCTACCAGCG1560GTGGTTTGTT TGCCGGATCA AGAGCTACCA ACTCTTTTTC CGAAGGTAAC TGGCTTCAGC1620AGAGCGCAGA TACCAAATAC TGTCCTTCTA GTGTAGCCGT AGTTAGGCCA CCACTTCAAG1680AACTCTGTAG CACCGCCTAC ATACCTCGCT CTGCTAATCC TGTTACCAGT GGCTGCTGCC1740AGTGGCGATA AGTCGTGTCT TACCGGGTTG GACTCAAGAC GATAGTTACC GGATAAGGCG1800CAGCGGTCGG GCTGAACGGG GGGTTCGTGC ACACAGCCCA GCTTGGAGCG AACGACCTAC1860ACCGAACTGA GATACCTACA GCGTGAGCTA TGAGAAAGCG CCACGCTTCC CGAAGGGAGA1920AAGGCGGACA GGTATCCGGT AAGCGGCAGG GTCGGAACAG GAGAGCGCAC GAGGGAGCTT1980CCAGGGGGAA ACGCCTGGTA TCTTTATAGT CCTGTCGGGT TTCGCCACCT CTGACTTGAG2040CGTCGATTTT TGTGATGCTC GTCAGGGGGG CGGAGCCTAT GGAAAAACGC CAGCAACGCG2100GCCTTTTTAC GGTTCCTGGC CTTTTGCTGG CCTTTTGCTC ACATGTTCTT TCCTGCGTTA2160TCCCCTGATT CTGTGGATAA CCGTATTACC GCCTTTGAGT GAGCTGATAC CGCTCGCCGC2220AGCCGAACGA CCGAGCGCAG CGAGTCAGTG AGCGAGGAAG CGGAAGAGCG CCTGATGCGG2280TATTTTCTCC TTACGCATCT GTGCGGTATT TCACACCGCA TATATGGTGC ACTCTCAGTA2340CAATCTGCTC TGATGCCGCA TAGTTAAGCC AGTATACACT CCGCTATCGC TACGTGACTG2400GGTCATGGCT GCGCCCCGAC ACCCGCCAAC ACCCGCTGAC GCGCCCTGAC GGGCTTGTCT2460GCTCCCGGCA TCCGCTTACA GACAAGCTGT GACCGTCTCC GGGAGCTGCA TGTGTCAGAG2520GTTTTCACCG TCATCACCGA AACGCGCGAG GCAGCTGCGG TAAAGCTCAT CAGCGTGGTC2580GTGAAGCGAT TCACAGATGT CTGCCTGTTC ATCCGCGTCC AGCTCGTTGA GTTTCTCCAG2640AAGCGTTAAT GTCTGGCTTC TGATAAAGCG GGCCATGTTA AGGGCGGTTT TTTCCTGTTT2700GGTCACTGAT GCCTCCGTGT AAGGGGGATT TCTGTTCATG GGGGTAATGA TACCGATGAA2760ACGAGAGAGG ATGCTCACGA TACGGGTTAC TGATGATGAA CATGCCCGGT TACTGGAACG2820TTGTGAGGGT AAACAACTGG CGGTATGGAT GCGGCGGGAC CAGAGAAAAA TCACTCAGGG2880TCAATGCCAG CGCTTCGTTA ATACAGATGT AGGTGTTCCA CAGGGTAGCC AGCAGCATCC2940TGCGATGCAG ATCCGGAACA TAATGGTGCA GGGCGCTGAC TTCCGCGTTT CCAGACTTTA3000CGAAACACGG AAACCGAAGA CCATTCATGT TGTTGCTCAG GTCGCAGACG TTTTGCAGCA3060GCAGTCGCTT CACGTTCGCT CGCGTATCGG TGATTCATTC TGCTAACCAG TAAGGCAACC3120CCGCCAGCCT AGCCGGGTCC TCAACGACAG GAGCACGATC ATGCGCACCC GTGGGGCCGC3180CATGCCGGCG ATAATGGCCT GCTTCTCGCC GAAACGTTTG GTGGCGGGAC CAGTGACGAA3240GGCTTGAGCG AGGGCGTGCA AGATTCCGAA TACCGCAAGC GACAGGCCGA TCATCGTCGC3300GCTCCAGCGA AAGCGGTCCT CGCCGAAAAT GACCCAGAGC GCTGCCGGCA CCTGTCCTAC3360GAGTTGCATG ATAAAGAAGA CAGTCATAAG TGCGGCGACG ATAGTCATGC CCCGCGCCCA3420CCGGAAGGAG CTGACTGGGT TGAAGGCTCT CAAGGGCATC GGTCGAGATC CCGGTGCCTA3480ATGAGTGAGC TAACTTACAT TAATTGCGTT GCGCTCACTG CCCGCTTTCC AGTCGGGAAA3540CCTGTCGTGC CAGCTGCATT AATGAATCGG CCAACGCGCG GGGAGAGGCG GTTTGCGTAT3600TGGGCGCCAG GGTGGTTTTT CTTTTCACCA GTGAGAGGGG CAACAGCTGA TTGCCCTTCA3660CCGCCTGGCC CTGAGAGAGT TGCAGCAAGC GGTCCACGCT GGTTTGCCCC AGCAGGCGAA3720AATCCTGTTT GATGGTGGTT AACGGCGGGA TATAACATGA GCTGTCTTCG GTATCGTCGT3780ATCCCACTAC CGAGATATCC GCACCAACGC GCAGCCCGGA CTCGGTAATG GCGCGCATTG3840CGCCCAGCGC CATCTGATCG TTGGCAACCA GCATCGCAGT GGGAACGATG CCCTCATTCA3900GCATTTGCAT GGTTTGTTGA AAACCGGACA TGGCACTCCA GTCGCCTTCC CGTTCCGCTA3960TCGGCTGAAT TTGATTGCGA GTGAGATATT TATGCCAGCC AGCCAGACGC AGACGCGCCG4020AGACAGAACT TAATGGGCCC GCTAACAGCG CGATTTGCTG GTGACCCAAT GCGACCAGAT4080GCTCCACGCC CAGTCGCGTA CCGTCTTCAT GGGAGAAAAT AATACTGTTG ATGGGTGTCT4140GGTCAGAGAC ATCAAGAAAT AACGCCGGAA CATTAGTGCA GGCAGCTTCC ACAGCAATGG4200CATCCTGGTC ATCCAGCGGA TAGTTAATGA TCAGCCCACT GACGCGTTGC GCGAGAAGAT4260TGTGCACCGC CGCTTTACAG GCTTCGACGC CGCTTCGTTC TACCATCGAC ACCACCACGC4320TGGCACCCAG TTGATCGGCG CGAGATTTAA TCGCCGCGAC AATTTGCGAC GGCGCGTGCA4380GGGCCAGACT GGAGGTGGCA ACGCCAATCA GCAACGACTG TTTGCCCGCC AGTTGTTGTG4440CCACGCGGTT GGGAATGTAA TTCAGCTCCG CCATCGCCGC TTCCACTTTT TCCCGCGTTT4500TCGCAGAAAC GTGGCTGGCC TGGTTCACCA CGCGGGAAAC GGTCTGATAA GAGACACCGG4560CATACTCTGC GACATCGTAT AACGTTACTG GTTTCACATT CACCACCCTG AATTGACTCT4620CTTCCGGGCG CTATCATGCC ATACCGCGAA AGGTTTTGCG CCATTCGATG GTGTCCGGGA4680TCTCGACGCT CTCCCTTATG CGACTCCTGC ATTAGGAAGC AGCCCAGTAG TAGGTTGAGG4740CCGTTGAGCA CCGCCGCCGC AAGGAATGGT GCATGCAAGG AGATGGCGCC CAACAGTCCC4800CCGGCCACGG GGCCTGCCAC CATACCCACG CCGAAACAAG CGCTCATGAG CCCGAAGTGG4860CGAGCCCGAT CTTCCCCATC GGTGATGTCG GCGATATAGG CGCCAGCAAC CGCACCTGTG 4920GCGCCGGTGA TGCCGGCCAC GATGCGTCCG GCGTAGAGGA TCGAGATCTC GATCCCGCGA 4980AATTAATACG ACTCACTATA GGGGAATTGT GAGCGGATAA CAATTCCCCT CTAGAAATAA 5040TTTTGTTTAA CTTTAAGAAG GAGATATACA TATGGGCCAT CATCATCATC ATCACGTGAT 5100CGACATCATC GGGACCAGCC CCACATCCTG GGAACAGGCG GCGGCGGAGG CGGTCCAGCG 5160GGCGCGGGAT AGCGTCGATG ACATCCGCGT CGCTCGGGTC ATTGAGCAGG ACATGGCCGT 5220GGACAGCGCC GGCAAGATCA CCTACCGCAT CAAGCTCGAA GTGTCGTTCA AGATGAGGCC 5280GGCGCAACCG AGGGGCTCGA AACCACCGAG CGGTTCGCCT GAAACGGGCG CCGGCGCCGG 5340TACTGTCGCG ACTACCCCCG CGTCGTCGCC GGTGACGTTG GCGGAGACCG GTAGCACGCT 5400GCTCTACCCG CTGTTCAACC TGTGGGGTCC GGCCTTTCAC GAGAGGTATC CGAACGTCAC 5460GATCACCGCT CAGGGCACCG GTTCTGGTGC CGGGATCGCG CAGGCCGCCG CCGGGACGGT 5520CAACATTGGG GCCTCCGACG CCTATCTGTC GGAAGGTGAT ATGGCCGCGC ACAAGGGGCT 5580GATGAACATC GCGCTAGCCA TCTCCGCTCA GCAGGTCAAC TACAACCTGC CCGGAGTGAG 5640CGAGCACCTC AAGCTGAACG GAAAAGTCCT GGCGGCCATG TACCAGGGCA CCATCAAAAC 5700CTGGGACGAC CCGCAGATCG CTGCGCTCAA CCCCGGCGTG AACCTGCCCG GCACCGCGGT 5760AGTTCCGCTG CACCGCTCCG ACGGGTCCGG TGACACCTTC TTGTTCACCC AGTACCTGTC 5820CAAGCAAGAT CCCGAGGGCT GGGGCAAGTC GCCCGGCTTC GGCACCACCG TCGACTTCCC 5880GGCGGTGCCG GGTGCGCTGG GTGAGAACGG CAACGGCGGC ATGGTGACCG GTTGCGCCGA 5940GACACCGGGC TGCGTGGCCT ATATCGGCAT CAGCTTCCTC GACCAGGCCA GTCAACGGGG 6000ACTCGGCGAG GCCCAACTAG GCAATAGCTC TGGCAATTTC TTGTTGCCCG ACGCGCAAAG 6060CATTCAGGCC GCGGCGGCTG GCTTCGCATC GAAAACCCCG GCGAACCAGG CGATTTCGAT 6120GATCGACGGG CCCGCCCCGG ACGGCTACCC GATCATCAAC TACGAGTACG CCATCGTCAA 6180CAACCGGCAA AAGGACGCCG CCACCGCGCA GACCTTGCAG GCATTTCTGC ACTGGGCGAT 6240CACCGACGGC AACAAGGCCT CGTTCCTCGA CCAGGTTCAT TTCCAGCCGC TGCCGCCCGC 6300GGTGGTGAAG TTGTCTGACG CGTTGATCGC GACGATTTCC AGCGCTGAGA TGAAGACCGA 6360TGCCGCTACC CTCGCGCAGG AGGCAGGTAA TTTCGAGCGG ATCTCCGGCG ACCTGAAAAC 6420CCAGATCGAC CAGGTGGAGT CGACGGCAGG TTCGTTGCAG GGCCAGTGGC GCGGCGCGGC 6480GGGGACGGCC GCCCAGGCCG CGGTGGTGCG CTTCCAAGAA GCAGCCAATA AGCAGAAGCA 6540GGAACTCGAC GAGATCTCGA CGAATATTCG TCAGGCCGGC GTCCAATACT CGAGGGCCGA 6600CGAGGAGCAG CAGCAGGCGC TGTCCTCGCA AATGGGCTTT GTGCCCACAA CGGCCGCCTC 6660GCCGCCGTCG ACCGCTGCAG CGCCACCCGC ACCGGCGACA CCTGTTGCCC CCCCACCACC 6720GGCCGCCGCC AACACGCCGA ATGCCCAGCC GGGCGATCCC AACGCAGCAC CTCCGCCGGC6780CGACCCGAAC GCACCGCCGC CACCTGTCAT TGCCCCAAAC GCACCCCAAC CTGTCCGGAT6840CGACAACCCG GTTGGAGGAT TCAGCTTCGC GCTGCCTGCT GGCTGGGTGG AGTCTGACGC6900CGCCCACTTC GACTACGGTT CAGCACTCCT CAGCAAAACC ACCGGGGACC CGCCATTTCC6960CGGACAGCCG CCGCCGGTGG CCAATGACAC CCGTATCGTG CTCGGCCGGC TAGACCAAAA7020GCTTTACGCC AGCGCCGAAG CCACCGACTC CAAGGCCGCG GCCCGGTTGG GCTCGGACAT7080GGGTGAGTTC TATATGCCCT ACCCGGGCAC CCGGATCAAC CAGGAAACCG TCTCGCTTGA7140CGCCAACGGG GTGTCTGGAA GCGCGTCGTA TTACGAAGTC AAGTTCAGCG ATCCGAGTAA7200GCCGAACGGC CAGATCTGGA CGGGCGTAAT CGGCTCGCCC GCGGCGAACG CACCGGACGC7260CGGGCCCCCT CAGCGCTGGT TTGTGGTATG GCTCGGGACC GCCAACAACC CGGTGGACAA7320GGGCGCGGCC AAGGCGCTGG CCGAATCGAT CCGGCCTTTG GTCGCCCCGC CGCCGGCGCC7380GGCACCGGCT CCTGCAGAGC CCGCTCCGGC GCCGGCGCCG GCCGGGGAAG TCGCTCCTAC7440CCCGACGACA CCGACACCGC AGCGGACCTT ACCGGCCTGA GAATTCTGCA GATATCCATC7500ACACTGGCGG CCGCTCGAGC ACCACCACCA CCACCACTGA GATCCGGCTG CTAACAAAGC7560CCGAAAGGAA GCTGAGTTGG CTGCTGCCAC CGCTGAGCAA TAACTAGCAT AACCCCTTGG7620GGCCTCTAAA CGGGTCTTGA GGGGTTTTTT GCTGAAAGGA GGAACTATAT CCGGAT7676(2)SEQ ID NO214的信息(i)序列特征(A)长度802个氨基酸(B)类型氨基酸(C)链数单链(D)拓扑学线性(xi)序列描述SEQ ID NO214Met Gly His His His His His His Val Ile Asp Ile Ile Gly Thr Ser1 5 10 15Pro Thr Ser Trp Glu Gln Ala Ala Ala Glu Ala Val Gln Arg Ala Arg20 25 30Asp Ser Val Asp Asp Ile Arg Val Ala Arg Val Ile Glu Gln Asp Met35 40 45Ala Val Asp Ser Ala Gly Lys Ile Thr Tyr Arg Ile Lys Leu Glu Val50 55 60Ser Phe Lys Met Arg Pro Ala Gln Pro Arg Gly Ser Lys Pro Pro Ser65 70 75 80Gly Ser Pro Glu Thr Gly Ala Gly Ala Gly Thr Val Ala Thr Thr Pro85 90 95Ala Ser Ser Pro Val Thr Leu Ala Glu Thr Gly Ser Thr Leu Leu Tyr100 105 110Pro Leu Phe Asn Leu Trp Gly Pro Ala Phe His Glu Arg Tyr Pro Asn115 120 125Val Thr Ile Thr Ala Gln Gly Thr Gly Ser Gly Ala Gly Ile Ala Gln130 135 140Ala Ala Ala Gly Thr Val Asn Ile Gly Ala Ser Asp Ala Tyr Leu Ser145 150 155 160Glu Gly Asp Met Ala Ala His Lys Gly Leu Met Asn Ile Ala Leu Ala165 170 175Ile Ser Ala Gln Gln Val Asn Tyr Asn Leu Pro Gly Val Ser Glu His180 185 190Leu Lys Leu Asn Gly Lys Val Leu Ala Ala Met Tyr Gln Gly Thr Ile195 200 205Lys Thr Trp Asp Asp Pro Gln Ile Ala Ala Leu Asn Pro Gly Val Asn210 215 220Leu Pro Gly Thr Ala Val Val Pro Leu His Arg Ser Asp Gly Ser Gly225 230 235 240Asp Thr Phe Leu Phe Thr Gln Tyr Leu Ser Lys Gln Asp Pro Glu Gly245 250 255Trp Gly Lys Ser Pro Gly Phe Gly Thr Thr Val Asp Phe Pro Ala Val260 265 270Pro Gly Ala Leu Gly Glu Asn Gly Asn Gly Gly Met Val Thr Gly Cys275 280 285Ala Glu Thr Pro Gly Cys Val Ala Tyr Ile Gly Ile Ser Phe Leu Asp290 295 300Gln Ala Ser Gln Arg Gly Leu Gly Glu Ala Gln Leu Gly Asn Ser Ser305 310 315 320Gly Asn Phe Leu Leu Pro Asp Ala Gln Ser Ile Gln Ala Ala Ala Ala325 330 335Gly Phe Ala Ser Lys Thr Pro Ala Asn Gln Ala Ile Ser Met Ile Asp340 345 350Gly Pro Ala Pro Asp Gly Tyr Pro Ile Ile Asn Tyr Glu Tyr Ala Ile355 360 365Val Asn Asn Arg Gln Lys Asp Ala Ala Thr Ala Gln Thr Leu Gln Ala370 375 380Phe Leu His Trp Ala Ile Thr Asp Gly Asn Lys Ala Ser Phe Leu Asp385 390 395 400Cln Val His Phe Gln Pro Leu Pro Pro Ala Val Val Lys Leu Ser Asp405 410 415Ala Leu Ile Ala Thr lle Ser Ser Ala Glu Met Lys Thr Asp Ala Ala420 425 430Thr Leu Ala Gln Glu Ala Gly Asn Phe Glu Arg Ile Ser Gly Asp Leu435 440 445Lys Thr Gln Ile Asp Gln Val Glu Ser Thr Ala Gly Ser Leu Gln Gly450 455 460Gln Trp Arg Gly Ala Ala Gly Thr Ala Ala Gln Ala Ala Val Val Arg465 470 475 480Phe Gln Glu Ala Ala Asn Lys Gln Lys Gln Glu Leu Asp Glu Ile Ser485 490 495Thr Asn Ile Arg Gln Ala Gly Val Gln Tyr Ser Arg Ala Asp Glu Glu500 505 510Gln Gln Gln Ala Leu Ser Ser Gln Met Gly Phe Val Pro Thr Thr Ala515 520 525Ala Ser Pro Pro Ser Thr Ala Ala Ala Pro Pro Ala Pro Ala Thr Pro530 535 540Val Ala Pro Pro Pro Pro Ala Ala Ala Asn Thr Pro Asn Ala Gln Pro545 550 555 560Gly Asp Pro Asn Ala Ala Pro Pro Pro Ala Asp Pro Asn Ala Pro Pro565 570 575Pro Pro Val Ile Ala Pro Asn Ala Pro Gln Pro Val Arg Ile Asp Asn580 585 590Pro Val Gly Gly Phe Ser Phe Ala Leu Pro Ala Gly Trp Val Glu Ser595 600 605Asp Ala Ala His Phe Asp Tyr Gly Ser Ala Leu Leu Ser Lys Thr Thr610 615 620Gly Asp Pro Pro Phe Pro Gly Gln Pro Pro Pro Val Ala Asn Asp Thr625 630 635 640Arg Ile Val Leu Gly Arg Leu Asp Gln Lys Leu Tyr Ala Ser Ala Glu645 650 655Ala Thr Asp Ser Lys Ala Ala Ala Arg Leu Gly Ser Asp Met Gly Glu660 665 670Phe Tyr Met Pro Tyr Pro Gly Thr Arg Ile Asn Gln Glu Thr Val Ser675 680 685Leu Asp Ala Asn Gly Val Ser Gly Ser Ala Ser Tyr Tyr Glu Val Lys690 695 700Phe Ser Asp Pro Ser Lys Pro Asn Gly Gln Ile Trp Thr Gly Val Ile705 710 715 720Gly Ser Pro Ala Ala Asn Ala Pro Asp Ala Gly Pro Pro Gln Arg Trp725 730 735Phe Val Val Trp Leu Gly Thr Ala Asn Asn Pro Val Asp Lys Gly Ala
740 745 750Ala Lys Ala Leu Ala Glu Ser Ile Arg Pro Leu Val Ala Pro Pro Pro755 760 765Ala Pro Ala Pro Ala Pro Ala Glu Pro Ala Pro Ala Pro Ala Pro Ala770 775 780Gly Glu Val Ala Pro Thr Pro Thr Thr Pro Thr Pro Gln Arg Thr Leu785 790 795 800Pro Ala
权利要求
1.包含可溶性结核分枝杆菌抗原或者只是在保守性替换和/或修饰上不同的这样的抗原的变体的免疫原性部分的多肽，其中所述抗原具有选自下面的N-末端序列(a) Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Cys-Asn-Tyr-Gly-Gln-Val-Val-Ala-Ala-Leu；(SEQ ID No.120)(b) Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-Ser；(SEQ ID No.121)(c) Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-Leu-Glu-Ala-Ala-Lys-Glu-Gly-Arg；(SEQ ID No.122)(d) Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-Pro；(SEQ ID No.123)(e) Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val；(SEQID No.124)(f) Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro；(SEQ ID No.125)(g) Asp-Pro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Thr-Ala-Ala-Ser-Pro-Pro-Ser；(SEQ ID No.126)(h) Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-Gly；(SEQ ID No.127)(i) Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Leu-Thr-Ser-Leu-Leu-Asn-Ser-Leu-Ala-Asp-Pro-Asn-Val-Ser-Phe-Ala-Asn；(SEQID No.128)和(j) Ala-Pro-Glu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-Ala-Gly；(SEQ ID No.136)其中Xaa可以是任何氨基酸。
2.包含结核分枝杆菌抗原或者只是在保守性替换和/或修饰上不同的这样的抗原的变体的免疫原性部分的多肽，其中所述抗原具有选自下面的N-末端序列(a)Asp-Pro-Pro-Asp-Pro-His-Gln-Xaa-Asp-Met-Thr-Lys-Gly-Tyr-Tyr-Pro-Gly-Gly-Arg-Arg-Xaa-Phe；(SEQ ID No.129)和(b)Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-Ile-Asn-Val-His-Leu-Val；(SEQ ID No.137)，其中Xaa可以是任何氨基酸。
3.包含可溶性结核分枝杆菌抗原或者只是在保守性替换和/或修饰上不同的所述抗原的变体的免疫原性部分的多肽，其中所述抗原包含选自SEQ ID Nos.1，2，4-10，13-25，52，99和101列出的序列，所述序列的互补序列和在中等严格条件下与SEQ ID Nos.1，2，4-10，13-25，52，99和101列出的序列杂交的DNA序列或其互补序列的DNA序列编码的氨基酸序列。
4.包含结核分枝杆菌抗原或者只是在保守性替换和/或修饰上不同的所述抗原的变体的免疫原性部分的多肽，其中所述抗原包含选自SEQID Nos.26-51，138，139，163-183和201列出的序列，所述序列的互补序列和在中等严格条件下与SEQ ID Nos.26-51，138，139，163-183和201列出的序列杂交的DNA序列或其互补序列的DNA序列编码的氨基酸序列。
5.包含编码权利要求1-4任一项的多肽的核苷酸序列的DNA分子。
6.包含权利要求5的DNA分子的表达载体。
7.用权利要求6的表达载体转化的宿主细胞。
8.权利要求7的宿主细胞，其中宿主细胞选自大肠杆菌，酵母和哺乳动物细胞。
9.含有一种或多种权利要求1-4任一项的多肽和生理可接受载体的药物组合物。
10.含有一种或多种权利要求5的DNA分子和生理可接受载体的药物组合物。
11.含有一种或多种SEQ ID Nos3，11，12，140和141的DNA序列；和生理可接受载体的药物组合物。
12.含有一种或多种权利要求1-4任一项的多肽和非特异性免疫应答增强剂(enhancer)的疫苗。
13.一种疫苗，其含有具有选自SEQ ID No.134和135列出的序列的N-末端序列的多肽；和非特异性免疫应答增强剂。
14.一种疫苗，其含有一种或多种选自SEQ ID Nos.3，11，12，140和141列出的序列，所述序列的互补序列和与SEQ ID Nos.3，11，12，140和141列出的序列杂交的DNA序列的DNA序列编码的多肽；和非特异性免疫应答增强剂。
15.权利要求12-14的疫苗，其中非特异性免疫应答增强剂是佐剂。
16.含有一种或多种权利要求5的DNA分子和非特异性免疫应答增强剂的疫苗。
17.含有一种或多种SEQ ID Nos3，11，12，140和141的DNA序列；和非特异性免疫应答增强剂的疫苗。
18.权利要求16或17的疫苗，其中非特异性免疫应答增强剂是佐剂。
19.权利要求9-11任一项的药物组合物，用于制备诱导患者保护性免疫性的药物。
20.权利要求12-18任一项的疫苗，用于制备诱导患者保护性免疫性的药物。
21.包含两种或多种权利要求1-4任一项的多肽的融合蛋白质。
22.包含一种或多种权利要求1-4任一项的多肽和ESAT-6的融合蛋白质。
23.包含一种或多种权利要求1-4任一项的多肽和结核分枝杆菌抗原38kD(SEQ ID NO155)的融合蛋白质。
24.含有权利要求21-23任一项的融合蛋白质和药学可接受载体的药物组合物。
25.含有权利要求21-23任一项的融合蛋白质和非特异性免疫应答增强剂的疫苗。
26.权利要求25的疫苗，其中非特异性免疫应答增强剂是佐剂。
27.权利要求24的药物组合物，用于制备诱导患者保护性免疫性的药物。
28.权利要求25或26的疫苗，用于制备诱导患者保护性免疫性的药物。
29.诊断患者结核病的方法，包括(a)用一种或多种权利要求1-4任一项的多肽接触患者的皮细胞；和(b)检查对患者皮肤的免疫应答，从而诊断患者结核病。
30.诊断患者结核病的方法，包括(a)用具有选自SEQ ID NO134和135所示序列的N-末端序列的多肽接触患者的皮细胞；和(b)检查对患者皮肤的免疫应答，从而诊断患者结核病。
31.诊断患者结核病的方法，包括(a)用选自SEQ ID Nos.3，11，12，140，141，156-160，189-193，199，200和203的序列，所述序列的互补序列和与SEQ ID Nos.3，11，12，140，141，156-160，189-193，199，200和203列出的序列杂交的DNA序列的DNA序列编码的一种或多种多肽接触患者的皮细胞；和(b)检查对患者皮肤的免疫应答，从而诊断患者结核病。
32.权利要求29-31任一项的方法，其中免疫应答是硬结。
33.诊断药盒，包括(a)权利要求1-4任一项的多肽；和(b)足以使所述多肽与患者皮细胞接触的装置。
34.诊断药盒，包括(a)具有选自SEQ ID NO134和135所示序列的N-末端序列的多肽；和(b)足以使所述多肽与患者皮细胞接触的装置。
35.诊断药盒，包括(a)选自SEQ ID Nos.3，11，12，140，141，156-160，189-193，199，200和203的序列，所述序列的互补序列和与SEQ ID Nos.3，11，12，140，141，156-160，189-193，199，200和203列出的序列杂交的DNA序列的DNA序列编码的多肽；和(b)足以使所述多肽与患者皮细胞接触的装置。
36.诊断药盒，包括(a)权利要求21-23任一项的融合蛋白质；和(b)足以使所述融合蛋白质与患者皮细胞接触的装置。
37.权利要求23的融合蛋白质，包含选自SEQ ID NO153和209所列序列的氨基酸序列。
全文摘要
本发明公开了诱导抗结核病的保护性免疫性的化合物和方法。提供的化合物包括包含一种或多种结核分枝杆菌蛋白质的至少一免疫原性部分的多肽和编码该多肽的DNA分子。这样的化合物可以配制成用于抗结核分枝杆菌感染的免疫接种的组合物,或者可以用于结核病的诊断。
文档编号C12N15/62GK1241212SQ9718050
公开日2000年1月12日申请日期1997年10月7日优先权日1997年10月7日公开号97180501.发明者S·G·雷德, Y·A·W·斯凯基, D·C·迪龙, A·卡姆波斯－内托, R·霍顿, T·S·维德维克, D·R·特瓦德兹克, M·J·罗德斯申请人:科里克萨公司被以下专利引用 (3),

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：S.G.雷德;Y.A.W.斯凯基;D.C.迪龙;A.卡姆波斯-内托;R.霍顿;T.S.维德维克;D.R.特瓦德兹克;M.J.罗德斯
技术所有人：科里克萨公司
我是此专利的发明人

上一篇：双尾菌增殖促进组合物及其用途的制作方法
上一篇：芽孢杆菌属细菌和杀虫蛋白质的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.食品功能因子基因工程菌种的构建、智能高通量进化筛选 2.发酵工艺优化
2、马老师：1.酶工程与生物催化 2.酿造技术与风味分析 3.生物质资源综合利用
3、林老师：1.酿造微生物育种及关键酿造工艺开发 2. 真菌基因功能及调控网络解析 3.精细化学品、蛋白真菌细胞底盘开发
4、张老师：1.发酵食品安全：危害物相关基因的筛选，危害物产生菌的快速检测，危害物的预警和发酵过程控制 2.真菌次级代谢与调控 3.酿造酒相关研究
5、郭老师：1.现代酿造技术与食品安全 2. 酵母生物学 3.生物基化学品与合成生物学
如您是高校老师，可以点此联系我们加入专家库。